0% found this document useful (0 votes)

24 views3 pages

Detailed 12 Data Mining Answers

Data mining is the extraction of meaningful patterns from large datasets using statistical and machine learning techniques, with applications in fraud detection and market analysis. Key concepts include interestingness, data preprocessing categories, and classifiers like Support Vector Machines. Additionally, topics such as lazy learning, regression, clustering methods, and text mining are discussed, highlighting their significance in analyzing and interpreting data.

Uploaded by

rojasebastian2004

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

24 views3 pages

Detailed 12 Data Mining Answers

Uploaded by

rojasebastian2004

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Detailed Answers on Data Mining

1. What do you mean by data mining?

Data mining is the process of extracting meaningful patterns, trends, and knowledge from large
datasets using techniques from statistics, machine learning, and databases. It helps in
decision-making and discovering hidden insights.

**Applications:**
- Fraud detection
- Market analysis
- Customer segmentation

2. What do you mean by interestingness?

Interestingness measures the significance and usefulness of patterns found in data mining. It is
evaluated using various metrics:
- **Support:** Frequency of occurrence of an itemset in the dataset.
- **Confidence:** Probability that a rule holds true.
- **Lift:** Measures how much more likely two items appear together than expected by chance.

3. Mention the 4 categories of data preprocessing.

1. **Data Cleaning:** Removing noise, handling missing values.
2. **Data Integration:** Merging data from multiple sources.
3. **Data Transformation:** Converting data into suitable formats (e.g., normalization).
4. **Data Reduction:** Reducing data size while preserving meaningful information (e.g., PCA).

4. What is technical metadata in a data warehouse?

Technical metadata provides information about the structure and properties of stored data:
- **Data types:** Integer, string, date.
- **Indexes:** Improve query performance.
- **Relationships:** Define connections between tables.
- **Data lineage:** Tracks data origin and transformations.

5. What do you mean by scalability of a classifier?

Scalability refers to a classifier's ability to handle increasing dataset sizes efficiently without
significant performance degradation. A scalable classifier:
- Maintains accuracy with large datasets.
- Uses optimized algorithms (e.g., SVM, decision trees, deep learning).

6. What is the objective of SVM?

Support Vector Machine (SVM) aims to find an optimal hyperplane that best separates different
classes in a dataset. The goal is to maximize the margin between the closest points (support
vectors) to improve classification accuracy.

7. What is lazy learning? Give an example.

Lazy learning defers model training until a query is made. Unlike eager learning, it stores training
data and performs computations at prediction time.

**Example:** k-Nearest Neighbors (k-NN) predicts labels based on the closest training examples.

8. What is regression?
Regression is a statistical method used to predict continuous values based on independent
variables.

**Example:** Predicting house prices based on square footage, location, and number of bedrooms.

9. What is a continuous ordinal variable? Give an example.

A continuous ordinal variable has ordered categories with meaningful numerical differences.

Example: Customer satisfaction rating on a scale from 1 to 10.

10. What do you mean by partitioning methods of clustering?

Partitioning methods divide a dataset into k clusters based on similarity. Examples:
- **k-Means:** Assigns data points to k clusters by minimizing intra-cluster variance.
- **k-Medoids:** Uses actual data points as cluster centers.

11. What do you mean by feature descriptor?

A feature descriptor captures essential characteristics of an object in pattern recognition and
computer vision.

**Example:** SIFT (Scale-Invariant Feature Transform) detects key image features for object
recognition.

12. What is text mining?

Text mining extracts meaningful insights from unstructured text data using Natural Language
Processing (NLP) techniques.

**Applications:**
- Sentiment analysis
- Spam detection
- Document classification

Machine Learning Bangalore City University 2024
No ratings yet
Machine Learning Bangalore City University 2024
5 pages
Replication Setup For DB2 Universal Database: A Step-By-Step Approach To "User-Copy" Replication
No ratings yet
Replication Setup For DB2 Universal Database: A Step-By-Step Approach To "User-Copy" Replication
13 pages
Data Miningng
No ratings yet
Data Miningng
8 pages
PDF For Ds
No ratings yet
PDF For Ds
7 pages
Machine Learning
No ratings yet
Machine Learning
2 pages
VIVA
No ratings yet
VIVA
5 pages
Short Answer
No ratings yet
Short Answer
19 pages
Data Science Tool Box Important Viva Question
No ratings yet
Data Science Tool Box Important Viva Question
14 pages
Data Science Interview Questions Answer
No ratings yet
Data Science Interview Questions Answer
17 pages
200 Data Science Interview Questions
No ratings yet
200 Data Science Interview Questions
16 pages
25 Important Data Science Interview Questions 1719736087
No ratings yet
25 Important Data Science Interview Questions 1719736087
15 pages
DS - Sample Questions (Practical)
No ratings yet
DS - Sample Questions (Practical)
8 pages
Machine Learning and Data Science ANSWER
No ratings yet
Machine Learning and Data Science ANSWER
9 pages
Data Science
No ratings yet
Data Science
28 pages
Short Notes On Data Mining & Warehousing
No ratings yet
Short Notes On Data Mining & Warehousing
43 pages
DS
No ratings yet
DS
7 pages
Unit No 3
No ratings yet
Unit No 3
10 pages
Data Mining - DM 1-5 Question Bank
No ratings yet
Data Mining - DM 1-5 Question Bank
10 pages
Full Detailed Data Mining Answer Key
No ratings yet
Full Detailed Data Mining Answer Key
4 pages
Data Science MCQs Sample Mid2xlsx 2024 11-29-23!19!54
No ratings yet
Data Science MCQs Sample Mid2xlsx 2024 11-29-23!19!54
8 pages
Top 30 AI ML Fresher QA
No ratings yet
Top 30 AI ML Fresher QA
3 pages
Machine Learning Qs
No ratings yet
Machine Learning Qs
10 pages
Data Science Techniques Overview
No ratings yet
Data Science Techniques Overview
1 page
ML Lab Viva Questions
No ratings yet
ML Lab Viva Questions
5 pages
Ds Revision 1
No ratings yet
Ds Revision 1
5 pages
Machine Learning Lab Viva QA
No ratings yet
Machine Learning Lab Viva QA
4 pages
Data Mining Insights for Analysts
No ratings yet
Data Mining Insights for Analysts
43 pages
Data Science Interview Qna
No ratings yet
Data Science Interview Qna
5 pages
DA (All CHP.)
No ratings yet
DA (All CHP.)
14 pages
Data Minig Anwers
No ratings yet
Data Minig Anwers
37 pages
Data Science Interview QnAs by CloudyML
No ratings yet
Data Science Interview QnAs by CloudyML
21 pages
PRCV Viva Notes
No ratings yet
PRCV Viva Notes
32 pages
Data Science QA
No ratings yet
Data Science QA
2 pages
Machine Learning Questions and Answers: Decision Tree
No ratings yet
Machine Learning Questions and Answers: Decision Tree
3 pages
Data Science Interview Questions
No ratings yet
Data Science Interview Questions
32 pages
Machine Learning Viva Questions
No ratings yet
Machine Learning Viva Questions
6 pages
Machine Learning One Mark Answers
No ratings yet
Machine Learning One Mark Answers
4 pages
2 Marks
No ratings yet
2 Marks
14 pages
Data Mining Answer Key
No ratings yet
Data Mining Answer Key
2 pages
Data Mining Question Bank 3,4,5
No ratings yet
Data Mining Question Bank 3,4,5
7 pages
Solved DM Questions
No ratings yet
Solved DM Questions
6 pages
Data Mining
No ratings yet
Data Mining
18 pages
ML DS Interview Quetions
No ratings yet
ML DS Interview Quetions
17 pages
100-Machine-Learning-Interview-Questions-and-Answers (Downloaded From Internet)
No ratings yet
100-Machine-Learning-Interview-Questions-and-Answers (Downloaded From Internet)
24 pages
DM Unit 1
No ratings yet
DM Unit 1
10 pages
1.what Is Data Cleaning in Rapidminer?
No ratings yet
1.what Is Data Cleaning in Rapidminer?
9 pages
Quiz 4 5 6
No ratings yet
Quiz 4 5 6
11 pages
Key Machine Learning Terminologies and Their Expla
No ratings yet
Key Machine Learning Terminologies and Their Expla
4 pages
Question Bank With 2 Marks
100% (1)
Question Bank With 2 Marks
21 pages
Data Mining University Answer
No ratings yet
Data Mining University Answer
10 pages
Data Mining BCA 10 Point Answers
No ratings yet
Data Mining BCA 10 Point Answers
3 pages
Machine Learning BCA QA Detailed
No ratings yet
Machine Learning BCA QA Detailed
3 pages
5 What Is Data-WPS Office
No ratings yet
5 What Is Data-WPS Office
19 pages
ML Unit 3
No ratings yet
ML Unit 3
10 pages
DMA QB Solved
No ratings yet
DMA QB Solved
42 pages
Interview AI
No ratings yet
Interview AI
4 pages
Long Answered Questions With Answer
No ratings yet
Long Answered Questions With Answer
6 pages
ML 2m Cie2
No ratings yet
ML 2m Cie2
4 pages
XML, Machine Learning
No ratings yet
XML, Machine Learning
10 pages
DMBI Viva
No ratings yet
DMBI Viva
18 pages
Maths
No ratings yet
Maths
51 pages
Computer
No ratings yet
Computer
49 pages
Affairs
No ratings yet
Affairs
9 pages
Most Detailed 4 Data Mining Answers
No ratings yet
Most Detailed 4 Data Mining Answers
3 pages
Data Mining Questions Modules
No ratings yet
Data Mining Questions Modules
3 pages
IMP
No ratings yet
IMP
1 page
Iwt Unit 5
No ratings yet
Iwt Unit 5
14 pages
IT - (X) - Practice Question Paper Final
No ratings yet
IT - (X) - Practice Question Paper Final
4 pages
Time Series Data and Their Characteristics
No ratings yet
Time Series Data and Their Characteristics
14 pages
Class Xii Information Practices PPT On Data Handling Using Pandas-I
No ratings yet
Class Xii Information Practices PPT On Data Handling Using Pandas-I
64 pages
SAP Datasphere Content Tutorial
No ratings yet
SAP Datasphere Content Tutorial
37 pages
Snowflake Stages and Data Loading
No ratings yet
Snowflake Stages and Data Loading
3 pages
Merak Dbtools Help: December, 2006
No ratings yet
Merak Dbtools Help: December, 2006
16 pages
Big Data Analytics - 7th Sem VTU 2018 Scheme - Class 3
No ratings yet
Big Data Analytics - 7th Sem VTU 2018 Scheme - Class 3
10 pages
Vijay Kanth - Azure Data Engineer
No ratings yet
Vijay Kanth - Azure Data Engineer
2 pages
Paper 6 - Schema-Based JSON Data Stores in Relational Databases
No ratings yet
Paper 6 - Schema-Based JSON Data Stores in Relational Databases
34 pages
Class 10 Notes
No ratings yet
Class 10 Notes
7 pages
CSE22144 Lecture Notes
No ratings yet
CSE22144 Lecture Notes
4 pages
Worksheet Topic DBMS 2025-26
No ratings yet
Worksheet Topic DBMS 2025-26
10 pages
PowerBuilder FAQ: DataWindow & SQL
No ratings yet
PowerBuilder FAQ: DataWindow & SQL
43 pages
Online Application Submission Guide
No ratings yet
Online Application Submission Guide
3 pages
DBMS Functions Solutions: Answers To Review Questions
67% (3)
DBMS Functions Solutions: Answers To Review Questions
4 pages
AMDP - Avoiding FOR ALL ENTRIES and Pushing Calculation To Database Layer - SAP Blogs
No ratings yet
AMDP - Avoiding FOR ALL ENTRIES and Pushing Calculation To Database Layer - SAP Blogs
11 pages
Spark Training - Java
No ratings yet
Spark Training - Java
8 pages
An Object-Oriented and Executable Sysml Framework For Rapid Model Development
No ratings yet
An Object-Oriented and Executable Sysml Framework For Rapid Model Development
10 pages
Apache Spark: Fast Big Data Processing
No ratings yet
Apache Spark: Fast Big Data Processing
4 pages
Bsis 102 Notes
No ratings yet
Bsis 102 Notes
76 pages
Sap Cpids For Ibp
No ratings yet
Sap Cpids For Ibp
154 pages
Introduction To Tibero 6 - 2020.02
No ratings yet
Introduction To Tibero 6 - 2020.02
15 pages
DDD - Assignment Brief - CSD 12
No ratings yet
DDD - Assignment Brief - CSD 12
12 pages
DBMS QB
No ratings yet
DBMS QB
16 pages
WT Unit-V (C23)
No ratings yet
WT Unit-V (C23)
22 pages
High Performance SQL Server Consistent Response For Mission Critical Applications 2nd Edition Benjamin Nevarez
100% (2)
High Performance SQL Server Consistent Response For Mission Critical Applications 2nd Edition Benjamin Nevarez
69 pages
XI Project
No ratings yet
XI Project
35 pages

Detailed 12 Data Mining Answers

Uploaded by

Detailed 12 Data Mining Answers

Uploaded by

Detailed Answers on Data Mining

1. What do you mean by data mining?

2. What do you mean by interestingness?

3. Mention the 4 categories of data preprocessing.

4. What is technical metadata in a data warehouse?

5. What do you mean by scalability of a classifier?

6. What is the objective of SVM?

7. What is lazy learning? Give an example.

9. What is a continuous ordinal variable? Give an example.

**Example:** Customer satisfaction rating on a scale from 1 to 10.

10. What do you mean by partitioning methods of clustering?

11. What do you mean by feature descriptor?

12. What is text mining?

You might also like

Example: Customer satisfaction rating on a scale from 1 to 10.