De Theory

Uploaded by

Srinivas Kanakala

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

22 views2 pages

De Theory

Uploaded by

Srinivas Kanakala

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

VNR VIGNANA JYOTHI INSTITUTE OF ENGINEERING AND TECHNOLOGY

B.Tech. VI Semester

(22PC1AM202) DATA ENGINEERING

TEACHING SCHEME EVALUATION SCHEME

L T/P C SE CA ELA SEE TOTAL
3 0 3 30 5 5 60 100

COURSE OBJECTIVES:
To explore data preprocessing techniques
To learn the techniques related to feature engineering
To exploit the statistics for data engineering
To explore the Hadoop environment and its framework activities
To understand, explore various databases for big data analytics

COURSE OUTCOMES: After completion of the course, the student should be able to
CO-1: Perform data preprocessing and apply the related techniques
CO-2: Demonstrate feature engineering techniques and handle the issues related to
high dimensionality
CO-3: Analyse the statistics required for data engineering
CO-4: Illustrate Hadoop and its framework activities to deal with the data process
analytics
CO-5: Work with databases for big data analytics

COURSE ARTICULATION MATRIX:

(Correlation of Course Outcomes with Program Outcomes and Program Specific Outcomes using
mapping levels 1 = Slight, 2 = Moderate and 3 = Substantial)
PROGRAM SPECIFIC
PROGRAM OUTCOMES (PO)
CO OUTCOMES (PSO)
PO-1 PO-2 PO-3 PO-4 PO-5 PO-6 PO-7 PO-8 PO-9 PO-10 PO-11 PO-12 PSO-1 PSO-2 PSO-3

CO-1 3 3 2 3 1 1 - - - - - 1 3 1 3
CO-2 3 3 2 2 2 1 - - - - - 1 3 1 3
CO-3 3 3 3 3 3 1 - - - - - 1 3 1 3
CO-4 3 3 3 3 3 1 - - - - - 1 3 1 3
CO-5 3 3 3 3 3 1 - - - - - 1 3 1 3

UNIT-I:
Data Pre-processing: Types of data, exploring structure of data: Exploring and Plotting
numerical data, categorical data and relationship between variables, data quality
and remediation, data pre-processing: Dimensionality reduction and feature
selection.

UNIT-II:
Feature Engineering: Feature, feature engineering, feature transformation: Feature
construction, Feature extraction, Feature subset selection: issues in high dimensional
data, key drivers of feature selection feature relevance and redundancy, measures
of feature relevance and redundancy, overall feature selection process, feature
selection approaches
UNIT-III:
Statistics for Data Engineering: Importance of statistical tools for handling data,
concept of probability- frequentist and Bayesian interpretation, review of probability
theory, random variables-discrete random variables, continuous random variables,
common discrete distributions-Bernoulli distributions, Binomial distribution, multinomial
and multinoulli distributions, Poisson distribution, common continuous distributions-
uniform distribution, Gaussian distribution, Laplace distribution. Multiple random
variables-Bivariate random variables, joint distribution functions, joint probability mass
functions, joint probability density functions, conditional distributions, covariance and
correlation, central limit theorem, Sampling distributions Sampling with replacement,
sampling without replacement, Mean and variance of sample, hypothesis testing,
Monte Carlo approximation.

UNIT-IV:
Types of Digital Data, Introduction to Big Data: Characteristics of Data, Evolution of Big
Data and Challenges with Big Data, Big Data, Terminologies used in Big Data
Environment.
Introduction to Hadoop: Features of Hadoop, Why Hadoop, RDBMS vs Hadoop,
Hadoop Overview, HDFS, Processing Data with Hadoop.

UNIT-V:
NoSQL: Basics of NoSQL - uses, Types of NoSQL databases, significance of NoSQL.
Advantages of NoSQL, SQL vs NoSQL.
MongoDB: uses and need of MongoDB, MongoDB Query Language: Insert, Save,
Update, Remove, Find methods, Dealing with NULL values, Count, Limit, Sort and Skip,
Arrays, Aggregate Functions and MapReduce Functions.

TEXT BOOKS:
1. Machine Learning, Saikat Dutt, Subramanian Chandramouli, Amit Kumar Das,
Pearson India
2. Big Data and Analytics, Seema Acharya, Subhasinin Chellappan, Wiley
3. Machine Learning, Tom M. Mitchell, McGraw-Hill Education

REFERENCES:
1. Introduction to Data Mining, Pang-Ning Tan, Vipin Kumar, Michael Steinbach,
Pearson
2. Hadoop: The Definitive Guide, Tom White, 3rd Reilly Media, 2012

BDA Syllabus - Sem VII - Mumbai University
No ratings yet
BDA Syllabus - Sem VII - Mumbai University
3 pages
Materi Kuliah - Agent Based Model I
100% (2)
Materi Kuliah - Agent Based Model I
21 pages
Big Data Question Bank
No ratings yet
Big Data Question Bank
5 pages
Understanding Cybercrime Tactics
80% (5)
Understanding Cybercrime Tactics
16 pages
Big Data Analytics
No ratings yet
Big Data Analytics
3 pages
Dsbda Syllabus
No ratings yet
Dsbda Syllabus
3 pages
Syllabus For ML and Data Visualization
No ratings yet
Syllabus For ML and Data Visualization
7 pages
Scope of Science Teaching
No ratings yet
Scope of Science Teaching
19 pages
Syllabus Fundamentals of Data Science
No ratings yet
Syllabus Fundamentals of Data Science
7 pages
AS & A Level Mathematics (9709) Paper 6: Topical Past Paper Questions Workbook
No ratings yet
AS & A Level Mathematics (9709) Paper 6: Topical Past Paper Questions Workbook
721 pages
Page 3
No ratings yet
Page 3
3 pages
Research Study On Customer Retention: Submitted To
No ratings yet
Research Study On Customer Retention: Submitted To
18 pages
OCS353 Syllabus
No ratings yet
OCS353 Syllabus
5 pages
Data Analytics Course Handout
No ratings yet
Data Analytics Course Handout
7 pages
Human Flourishing in Science and Technology
100% (3)
Human Flourishing in Science and Technology
36 pages
SEM VII BDA Syllabus Theory
No ratings yet
SEM VII BDA Syllabus Theory
4 pages
DM Course Hand-Out
No ratings yet
DM Course Hand-Out
10 pages
(Ebook PDF) Statistics For The Behavioral Sciences 5th Edition Complete Edition
100% (1)
(Ebook PDF) Statistics For The Behavioral Sciences 5th Edition Complete Edition
170 pages
Assignment 2
No ratings yet
Assignment 2
2 pages
Data Mining and Visualization
No ratings yet
Data Mining and Visualization
18 pages
Tesis DR Imam 2018 Siap Sidang Hasil Revisi
100% (2)
Tesis DR Imam 2018 Siap Sidang Hasil Revisi
207 pages
CCS334 Bda
No ratings yet
CCS334 Bda
19 pages
Foundation of Data Science Syllabus
No ratings yet
Foundation of Data Science Syllabus
4 pages
2024-25 CSE V Sem B Section DWDM Course Handout
No ratings yet
2024-25 CSE V Sem B Section DWDM Course Handout
6 pages
01ce0707 Data Mining and Information Retrieval
No ratings yet
01ce0707 Data Mining and Information Retrieval
3 pages
Data Science
No ratings yet
Data Science
9 pages
Data Science and Big Data Analytics
No ratings yet
Data Science and Big Data Analytics
2 pages
Syllabus 1
No ratings yet
Syllabus 1
13 pages
22cs702 Data Analytics Unit-2.Dcm
No ratings yet
22cs702 Data Analytics Unit-2.Dcm
73 pages
Page 2
No ratings yet
Page 2
2 pages
CCS334 Updated 05-05-2025
No ratings yet
CCS334 Updated 05-05-2025
19 pages
MDU B.Tech CSE 8th Sem Syllabus
No ratings yet
MDU B.Tech CSE 8th Sem Syllabus
7 pages
Data Science - Syllabus
No ratings yet
Data Science - Syllabus
14 pages
Syllabus 7th Sem Pages Deleted
No ratings yet
Syllabus 7th Sem Pages Deleted
3 pages
Additional MCQs Chap 1 MA
No ratings yet
Additional MCQs Chap 1 MA
4 pages
Outcome Based Education (OBE)
No ratings yet
Outcome Based Education (OBE)
10 pages
Mid Term RM
No ratings yet
Mid Term RM
2 pages
2-2 Syllabus Paper Artificial Intelligence & Data Science
No ratings yet
2-2 Syllabus Paper Artificial Intelligence & Data Science
5 pages
CCS334 BDA Syllabus
No ratings yet
CCS334 BDA Syllabus
5 pages
B.Tech Jntuh DWDM Course Description
No ratings yet
B.Tech Jntuh DWDM Course Description
6 pages
Statistics and Probability Lesson1
No ratings yet
Statistics and Probability Lesson1
9 pages
Big Data Analytics Comp Syllabus Sem7
No ratings yet
Big Data Analytics Comp Syllabus Sem7
4 pages
Institute of Actuaries of India: Subject CT3 - Probability & Mathematical Statistics
No ratings yet
Institute of Actuaries of India: Subject CT3 - Probability & Mathematical Statistics
14 pages
BDA Syllabus
No ratings yet
BDA Syllabus
4 pages
HTTP
No ratings yet
HTTP
9 pages
EAL-G12: Traceability of Measuring and Test Equipment To National Standards
No ratings yet
EAL-G12: Traceability of Measuring and Test Equipment To National Standards
16 pages
McDonaldMoon Ho2002 PDF
No ratings yet
McDonaldMoon Ho2002 PDF
19 pages
Machine Learning Course Overview
No ratings yet
Machine Learning Course Overview
7 pages
Data Science & Python Syllabus 2022-24
No ratings yet
Data Science & Python Syllabus 2022-24
9 pages
Inventions Not Patentable Under Section
No ratings yet
Inventions Not Patentable Under Section
11 pages
Curriculum Development in Physics Education
No ratings yet
Curriculum Development in Physics Education
17 pages
Statistics for Health Researchers
No ratings yet
Statistics for Health Researchers
4 pages
Cse2021 - Data Mining CH
No ratings yet
Cse2021 - Data Mining CH
13 pages
CSE 3002 Big Data Technologies - 7sem
No ratings yet
CSE 3002 Big Data Technologies - 7sem
19 pages
Data Science Honor Syllabus Sem-I
No ratings yet
Data Science Honor Syllabus Sem-I
5 pages
The Biology of Kunadalini
100% (2)
The Biology of Kunadalini
229 pages
Ocs353dsf Unit Wise Notes
100% (2)
Ocs353dsf Unit Wise Notes
121 pages
MCA1
No ratings yet
MCA1
9 pages
Magnetic Disk Management Guide
No ratings yet
Magnetic Disk Management Guide
11 pages
Writing Skills Assessment Quiz
No ratings yet
Writing Skills Assessment Quiz
4 pages
Experiment Pgno
No ratings yet
Experiment Pgno
50 pages
WGreen IT - 3CSE
No ratings yet
WGreen IT - 3CSE
14 pages
Reasoning
No ratings yet
Reasoning
17 pages
R22B.tech - CSECourseStructureSyllabus2 Part 6
No ratings yet
R22B.tech - CSECourseStructureSyllabus2 Part 6
21 pages
Expert Systems
No ratings yet
Expert Systems
30 pages
Unit 1 CH-B - CPU SCheduling
No ratings yet
Unit 1 CH-B - CPU SCheduling
19 pages
2016 - Journal of English Teaching As A Foreign Language - 5. DAVID B. MANALU - The English Teachers' Design of Lesson Plan Based On 2013 Curriculum
No ratings yet
2016 - Journal of English Teaching As A Foreign Language - 5. DAVID B. MANALU - The English Teachers' Design of Lesson Plan Based On 2013 Curriculum
10 pages
RIA MATRIX Final
No ratings yet
RIA MATRIX Final
5 pages
M.Sc Data Science Syllabus 2021
No ratings yet
M.Sc Data Science Syllabus 2021
34 pages
(Tcs 031) Data Mining and Warehousing: Unit-I
No ratings yet
(Tcs 031) Data Mining and Warehousing: Unit-I
5 pages
PPT1
No ratings yet
PPT1
31 pages
AIADS 7th Sem Syllabus Signed
No ratings yet
AIADS 7th Sem Syllabus Signed
19 pages
M.SC - II Sem - Curriculum and Syllabus.
No ratings yet
M.SC - II Sem - Curriculum and Syllabus.
10 pages
M.Tech CA DA 2022
No ratings yet
M.Tech CA DA 2022
48 pages
934 - Btech Cse Viii Sem
No ratings yet
934 - Btech Cse Viii Sem
17 pages
Edit Ds
No ratings yet
Edit Ds
37 pages
Ai Unit Ii
No ratings yet
Ai Unit Ii
36 pages
7th Sem Electives
No ratings yet
7th Sem Electives
7 pages
Unit - 1-Cyber Security
No ratings yet
Unit - 1-Cyber Security
23 pages
Unit 4
No ratings yet
Unit 4
36 pages
Research Methods in Mass Communication: Study Guide
No ratings yet
Research Methods in Mass Communication: Study Guide
70 pages
Unit-4 Deadlock
No ratings yet
Unit-4 Deadlock
22 pages
BE AIDS R 20 VII VIII Sem Syllabus - Compressed
No ratings yet
BE AIDS R 20 VII VIII Sem Syllabus - Compressed
55 pages
Activity 1 Scientific Investigation
No ratings yet
Activity 1 Scientific Investigation
2 pages
DATABASE DDL DML Commands
No ratings yet
DATABASE DDL DML Commands
24 pages
TOPICS
No ratings yet
TOPICS
31 pages
Unit VI International Conventions & Treaties
No ratings yet
Unit VI International Conventions & Treaties
50 pages
Cycle 2
No ratings yet
Cycle 2
68 pages
MR20 Vi-I Syllabus
No ratings yet
MR20 Vi-I Syllabus
22 pages
Unit-IV Trade Marks and Trade Secrets
No ratings yet
Unit-IV Trade Marks and Trade Secrets
45 pages
Artikel Jurnal
No ratings yet
Artikel Jurnal
11 pages
IPR Unit 3 Copyrights and Geographical Indications
No ratings yet
IPR Unit 3 Copyrights and Geographical Indications
50 pages
Unit - V Protection of ID & IC
No ratings yet
Unit - V Protection of ID & IC
38 pages
B.Tech CSE Data Science Syllabus
No ratings yet
B.Tech CSE Data Science Syllabus
24 pages
Call For Proposals
No ratings yet
Call For Proposals
33 pages
Email
No ratings yet
Email
64 pages
B.Tech CSE Data Science Syllabus
No ratings yet
B.Tech CSE Data Science Syllabus
43 pages
Research Needs Assessment of Teaching and Non - Teaching Personnel As Input To Research Development Plan
No ratings yet
Research Needs Assessment of Teaching and Non - Teaching Personnel As Input To Research Development Plan
6 pages
1676457507
No ratings yet
1676457507
113 pages
U1 Ides
No ratings yet
U1 Ides
63 pages
Mtech-Syllabus-Data Science - Sem1
No ratings yet
Mtech-Syllabus-Data Science - Sem1
25 pages
CS Unit 1
No ratings yet
CS Unit 1
109 pages
Scores of 30 Students of I - Benevolence in TLE Quiz
No ratings yet
Scores of 30 Students of I - Benevolence in TLE Quiz
4 pages
Per g28 Pub 2083 Touchstone AssessmentQPHTMLMode1 2083O24353 2083O24353S3D55546 17376907933442320 AP11101398 2083O24353S3D55546E1.html#
No ratings yet
Per g28 Pub 2083 Touchstone AssessmentQPHTMLMode1 2083O24353 2083O24353S3D55546 17376907933442320 AP11101398 2083O24353S3D55546E1.html#
35 pages
A New Method To Estimate Adult Age-at-Death Using The Acetabulum
No ratings yet
A New Method To Estimate Adult Age-at-Death Using The Acetabulum
13 pages
Essentials of Statistics For Business and Economics 8th Edition Anderson Solutions Manual Download
100% (6)
Essentials of Statistics For Business and Economics 8th Edition Anderson Solutions Manual Download
50 pages
STRUKTUR, JUDUL Dan ABSTRAK
No ratings yet
STRUKTUR, JUDUL Dan ABSTRAK
16 pages
Ai Unit - 1
No ratings yet
Ai Unit - 1
127 pages
Unit 1 Saddam
No ratings yet
Unit 1 Saddam
129 pages
TE Computer 2019 Course 22.06.2021-52-99
No ratings yet
TE Computer 2019 Course 22.06.2021-52-99
48 pages
IT - BE - R 22 - I VIII Syllabus 23.08.2024
No ratings yet
IT - BE - R 22 - I VIII Syllabus 23.08.2024
234 pages
Science 2012 Final Yes PDF
No ratings yet
Science 2012 Final Yes PDF
322 pages
Data Warehousing & Mining Course
No ratings yet
Data Warehousing & Mining Course
45 pages
Andriya-Seminar Repot (1) ..
No ratings yet
Andriya-Seminar Repot (1) ..
28 pages
Dev U2
No ratings yet
Dev U2
96 pages
IMO Grade II Exam Paper 2016
No ratings yet
IMO Grade II Exam Paper 2016
50 pages
Information Technology Engineering Syllabus Sem Viii Mumbai University
No ratings yet
Information Technology Engineering Syllabus Sem Viii Mumbai University
60 pages

De Theory

Uploaded by

De Theory

Uploaded by

VNR VIGNANA JYOTHI INSTITUTE OF ENGINEERING AND TECHNOLOGY

(22PC1AM202) DATA ENGINEERING

TEACHING SCHEME EVALUATION SCHEME

COURSE ARTICULATION MATRIX:

You might also like