Major Issues in Data Mining

The document discusses major issues in data mining, including methodologies, user interaction, efficiency, database diversity, and societal impacts. It emphasizes the need for interdisciplinary approaches, user-friendly interfaces, and efficient algorithms to handle large and complex data sets. Additionally, it addresses concerns regarding privacy and the integration of data mining functions into everyday systems for broader accessibility.

Uploaded by

delir51132

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

23 views1 page

Major Issues in Data Mining

Uploaded by

delir51132

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 1

Major Issues in Data Mining

Mining Methodology ,User Interaction, Efficiency and Scalability, Diversity

of Database Types,Data Mining and Society
1.Mining Methodology
Researchers have been developing new data mining methodologies.
This involves the investigation of
Mining various and new kinds of knowledge: Data mining covers a wide
spectrum of data analysis and knowledge discovery tasks. These tasks may
use the same database in different ways and require the development of
numerous data mining techniques
Mining knowledge in multidimensional space: When searching for
knowledge in large data sets, we can explore the data in multidimensional
space. That is we can search for interesting patterns among combinations of
dimensions (attributes ) at varying levels of abstraction. Such mining is
known as multidimensional data mining.
Data mining – an interdisciplinary effort: The power of data mining can be
enhanced by integrating new methods from multiple disciplines.
Boosting the power of discovery in a networked environment: Most data
objects reside in a linked or interconnected environment. Knowledge derived
in one set of objects can be used to boost the discovery of knowledge in a
“related” or semantically linked set of objects.
Handling uncertainty, noise, or incompleteness of data: Data often contain
noise, errors, exceptions, or uncertainty or are incomplete. Noise and errors
may confuse the data mining process, leading to the derivation of erroneous
patterns. Data cleaning, data preprocessing, outlier detection and removal,
and uncertainty reasoning are examples of techniques that need to be
integrated with data mining process.
Pattern evaluation and pattern- or constraint-guided mining: Techniques
are needed to assess the interestingness of discovered patterns based on
subjective measures. These estimate the value of patterns with respect to a
given user class, based on user beliefs or expectations.
2.User Interaction
The user plays an important role in the data mining process. Research areas
include how to interact with a data mining system, how to incorporate a
user’s back ground knowledge in mining, and how to visualize and
comprehend data mining results
Interactive mining: Data mining process should be highly interactive. Thus it
is important to build flexible user interfaces and an exploratory mining
environment facilitating the user’s interaction with the system.
Incorporation of background knowledge: background knowledge,
constraints, rules and other information regarding the domain under study
should be incorporated into the knowledge discovery process. Such
knowledge can be used for pattern evaluation as well as to guide the search
toward interesting patterns
Ad hoc data mining and data mining query language: High level data
mining query languages or other high-level flexible user interfaces will give
users the freedom to define ad hoc data mining tasks. This should facilitate
specification of the relevant sets of data for analysis, the domain knowledge,
the kind of knowledge to be mined etc. Optimization of the processing of
such flexible mining requests is another promising area of study
Presentation and visualization of data mining results: A data mining system
must adopt expressive knowledge representations, user friendly interfaces,
and visualization techniques so that the discovered knowledge can be easily
understood and directly usable by humans
3.Efficiency and scalability
Efficiency and scalability are always considered when comparing data
mining algorithms
Efficiency and scalability of data mining algorithms: Data mining
algorithms must be efficient and scalable in order to effectively extract
information from huge amounts of data in many data repositories. Efficiency,
scalability, performance, optimization, and the ability to execute in real time
are key criteria that drive the development of many data mining algorithms
Parallel, distributed, and incremental mining algorithms: Such algorithms
first partition the data into pieces. Each piece is processed, in parallel, by
searching for patterns. The parallel processes may interact with one another.
The patterns from each partition are eventually merged
Cloud computing and cluster computing: They use computers in a
distributed and collaborative way to tackle very large scale computational
tasks. It is also an active research area
4.Diversity of Database Types
The wide variety of database types brings challenges to data mining. This
include
Handling complex types of data: Diverse applications generate a wide
spectrum of new data types. Domain or application dedicated data mining
systems are being constructed for in-depth mining of specific kinds of data.
The construction of effective and efficient data mining tools for diverse
applications remains a challenging and active area of research.
Mining dynamic, networked, and global data repositories: Multiple sources
of data are connected by the Internet and various kinds of networks, forming
gigantic, distributed, and heterogeneous global information systems and
networks. Mining such gigantic, interconnected information networks may
help disclose many more patterns and knowledge in heterogeneous data sets
than those can be discovered from a small set of isolated data repositories.
5.Data Mining and Society
Social impacts of data mining: The improper disclosure or use of data and
potential violation of individual privacy and data protection rights are areas
of concern that need to be addressed.
Privacy preserving data mining: Data mining will help scientific discovery,
business management, economy recovery, and security protection. However
it poses the risk of disclosing an individual’s personal information. The
philosophy is to observe data sensitivity and preserve people’s privacy while
performing successful data mining.
Invisible Data mining: We cannot expect everyone in society to learn and
master data mining techniques. More and more systems should have data
mining functions built within so that people can perform data mining or use
data mining results without any knowledge of data mining algorithms.

Unit 5 DM
No ratings yet
Unit 5 DM
50 pages
Data Mining Issues
No ratings yet
Data Mining Issues
5 pages
Unit III
No ratings yet
Unit III
101 pages
Data Mining
No ratings yet
Data Mining
44 pages
DW and DM Notes
No ratings yet
DW and DM Notes
89 pages
1.data Mining Functionalities
No ratings yet
1.data Mining Functionalities
14 pages
Chapter 1. Introduction
No ratings yet
Chapter 1. Introduction
323 pages
FDS Chap 1
No ratings yet
FDS Chap 1
22 pages
DM Lesson3
No ratings yet
DM Lesson3
14 pages
Data Design Development
No ratings yet
Data Design Development
219 pages
WINSEM2024-25 MCSE615L TH VL2024250502897 2024-12-19 Reference-Material-I
No ratings yet
WINSEM2024-25 MCSE615L TH VL2024250502897 2024-12-19 Reference-Material-I
58 pages
A Conceptual Overview of Data Mining: B.N. Lakshmi., G.H. Raghunandhan
No ratings yet
A Conceptual Overview of Data Mining: B.N. Lakshmi., G.H. Raghunandhan
6 pages
Fundamentals of Data Science Unit 1
No ratings yet
Fundamentals of Data Science Unit 1
29 pages
Unit 1 DMW
No ratings yet
Unit 1 DMW
41 pages
Data Mining-1
No ratings yet
Data Mining-1
7 pages
Data Mining (Module-1)
No ratings yet
Data Mining (Module-1)
14 pages
DM Chapter 1
No ratings yet
DM Chapter 1
10 pages
Notes For DMDWH - Module1
No ratings yet
Notes For DMDWH - Module1
21 pages
Advanced Databases and Mining Unit 4
No ratings yet
Advanced Databases and Mining Unit 4
10 pages
Data Mining Task Primitives and Major Issues
No ratings yet
Data Mining Task Primitives and Major Issues
18 pages
KDD and Data Mining Explained
No ratings yet
KDD and Data Mining Explained
46 pages
Es 2646574663
No ratings yet
Es 2646574663
7 pages
F2 Database Questions and Answers
100% (2)
F2 Database Questions and Answers
9 pages
DWH Unit 3
No ratings yet
DWH Unit 3
7 pages
DM Notes
No ratings yet
DM Notes
26 pages
Data Mining
No ratings yet
Data Mining
26 pages
Data Mining-CH5
No ratings yet
Data Mining-CH5
49 pages
Data Mining Notes1
No ratings yet
Data Mining Notes1
56 pages
Data Mining Challenges Explained
No ratings yet
Data Mining Challenges Explained
4 pages
Unit-1 Notes Onl
No ratings yet
Unit-1 Notes Onl
25 pages
Data Mining - Digital Notes (Unit I To V)
No ratings yet
Data Mining - Digital Notes (Unit I To V)
85 pages
Chapter 1 - What Is Data Mining
No ratings yet
Chapter 1 - What Is Data Mining
8 pages
Data Mining Essentials for Analysts
No ratings yet
Data Mining Essentials for Analysts
73 pages
Trends in Data Mining
No ratings yet
Trends in Data Mining
9 pages
Unit 3 Data Mining
No ratings yet
Unit 3 Data Mining
21 pages
Major Issues in DM
No ratings yet
Major Issues in DM
5 pages
Week1 2
No ratings yet
Week1 2
24 pages
DWDMunit 2
No ratings yet
DWDMunit 2
27 pages
Data Mining: Key Issues and Tasks
No ratings yet
Data Mining: Key Issues and Tasks
5 pages
Data Mining
No ratings yet
Data Mining
11 pages
Data Engineer Interview Questions
No ratings yet
Data Engineer Interview Questions
7 pages
Ijcse 01768
No ratings yet
Ijcse 01768
4 pages
5 Major Issues 10 Feb 2021material I 10 Feb 2021 Mod1 Issues
No ratings yet
5 Major Issues 10 Feb 2021material I 10 Feb 2021 Mod1 Issues
5 pages
Topic 4 - Data Mining Tools and Technique
No ratings yet
Topic 4 - Data Mining Tools and Technique
22 pages
Unit 1
No ratings yet
Unit 1
7 pages
Data Mining & Warehousing Basics
No ratings yet
Data Mining & Warehousing Basics
30 pages
Laq 1
No ratings yet
Laq 1
2 pages
Unit - I
No ratings yet
Unit - I
22 pages
Data Mining Insights & Applications
No ratings yet
Data Mining Insights & Applications
9 pages
LLM-Driven Feature Engineering
No ratings yet
LLM-Driven Feature Engineering
17 pages
Nursing Informatics Quizzes (Lab)
100% (2)
Nursing Informatics Quizzes (Lab)
58 pages
Unit 3
No ratings yet
Unit 3
34 pages
Week 1-2
No ratings yet
Week 1-2
3 pages
Whats App
No ratings yet
Whats App
23 pages
Data Quality Lec 3
No ratings yet
Data Quality Lec 3
3 pages
Data Mining System and Applications A Re
No ratings yet
Data Mining System and Applications A Re
13 pages
Data Mining: Concepts and Techniques
No ratings yet
Data Mining: Concepts and Techniques
25 pages
Fujipress - JACIII 21 1 5
No ratings yet
Fujipress - JACIII 21 1 5
18 pages
NLP Final Mini Project
No ratings yet
NLP Final Mini Project
17 pages
Data Warehousing & Data Mining Syllabus Subject Code:56055 L:4 T/P/D:0 Credits:4 Int. Marks:25 Ext. Marks:75 Total Marks:100
No ratings yet
Data Warehousing & Data Mining Syllabus Subject Code:56055 L:4 T/P/D:0 Credits:4 Int. Marks:25 Ext. Marks:75 Total Marks:100
52 pages
18mca52c U1
No ratings yet
18mca52c U1
17 pages
Data Mining
No ratings yet
Data Mining
22 pages
Indexing Methods and Tools (Week-10)
No ratings yet
Indexing Methods and Tools (Week-10)
5 pages
AadhyaKaul RESUME G
No ratings yet
AadhyaKaul RESUME G
1 page
Impact of Emerging Technologies in Libraries Issues and Opportunities
No ratings yet
Impact of Emerging Technologies in Libraries Issues and Opportunities
8 pages
Data Mining Applications and Feature Scope Survey
No ratings yet
Data Mining Applications and Feature Scope Survey
5 pages
Data Mining Summaries PDF
No ratings yet
Data Mining Summaries PDF
22 pages
Data Mining
No ratings yet
Data Mining
27 pages
GG 184 Specification For The Use of Computer Aided Design-Web
No ratings yet
GG 184 Specification For The Use of Computer Aided Design-Web
75 pages
Database Connectivity Using PHP
No ratings yet
Database Connectivity Using PHP
5 pages
Knowledge Acquisition and Validation
No ratings yet
Knowledge Acquisition and Validation
79 pages
NIT Patna Resume 1
No ratings yet
NIT Patna Resume 1
1 page
Sahil Result
No ratings yet
Sahil Result
1 page
Tugas 2 Bhs Inggris
No ratings yet
Tugas 2 Bhs Inggris
7 pages
Buildeing Knowlwdge Base Through Deep Learning Relation Extraction
No ratings yet
Buildeing Knowlwdge Base Through Deep Learning Relation Extraction
7 pages
Question Bank DBM S
No ratings yet
Question Bank DBM S
8 pages
Vidya Sagar Resume
No ratings yet
Vidya Sagar Resume
1 page
Data Centric Computing
No ratings yet
Data Centric Computing
8 pages
Assignment
No ratings yet
Assignment
37 pages
DBDA EANDC QB Practical Machine Learning PDF
No ratings yet
DBDA EANDC QB Practical Machine Learning PDF
4 pages
Case Study
No ratings yet
Case Study
5 pages
DAV Practical 7
No ratings yet
DAV Practical 7
3 pages
Chapter 01-Database 3CS
No ratings yet
Chapter 01-Database 3CS
10 pages
Ganesh Ghongade R
No ratings yet
Ganesh Ghongade R
3 pages
Cns Sem
No ratings yet
Cns Sem
8 pages
Great Big Natural Language Processing Primer KDnuggets
No ratings yet
Great Big Natural Language Processing Primer KDnuggets
25 pages
Topic Segmentation For Textual Document Written in Arabic Language
No ratings yet
Topic Segmentation For Textual Document Written in Arabic Language
10 pages
Code Search & Conversion Tool
No ratings yet
Code Search & Conversion Tool
18 pages

Major Issues in Data Mining

Uploaded by

Major Issues in Data Mining

Uploaded by

Major Issues in Data Mining

Mining Methodology ,User Interaction, Efficiency and Scalability, Diversity

You might also like