Big Data & Hadoop Mastery Guide

BDA full syllabus

Uploaded by

prathamvaddepalli216

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

49 views2 pages

Big Data & Hadoop Mastery Guide

BDA full syllabus

Uploaded by

prathamvaddepalli216

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

Module Detailed Contents Hours

01 Introduction to Big Data & Hadoop 06

1.1 Introduction to Big Data, 1.2 Big Data characteristics, types of Big
Data, 1.3 Traditional vs. Big Data business approach, 1.4 Case Study
of Big Data Solutions. 1.5 Concept of Hadoop 1.6 Core Hadoop
Components; Hadoop Ecosystem
02 Hadoop HDFS and Map Reduce 10
2.1 Distributed File Systems: Physical Organization of Compute Nodes,
Large-Scale File-System Organization. 2.2 MapReduce: The Map
Tasks, Grouping by Key, The Reduce Tasks, Combiners, Details of
MapReduce Execution, Coping With Node Failures. 2.3 Algorithms
Using MapReduce: Matrix-Vector Multiplication by MapReduce,
Relational-Algebra Operations, Computing Selections by MapReduce,
Computing Projections by MapReduce, Union, Intersection, and
Difference by MapReduce 2.4 Hadoop Limitations s.
03 NoSQL 06
3.1 Introduction to NoSQL, NoSQL Business Drivers, 3.2 NoSQL Data
Architecture Patterns: Key-value stores, Graph stores, Column family
(Bigtable)stores, Document stores, Variations of NoSQL architectural
patterns, NoSQL Case Study 3.3 NoSQL solution for big data,
Understanding the types of big data problems; Analyzing big data with
a shared-nothing architecture; Choosing distribution models:
master-slave versus peer-to-peer; NoSQL systems to handle big data
problems.
peer-to-peer; Four ways that NoSQL systems handle big data problems
04 Mining Data Streams 12
4.1 The Stream Data Model: A Data-Stream-Management System,
Examples of Stream Sources, Stream Queries, Issues in Stream
Processing. 4.2 Sampling Data techniques in a Stream 4.3 Filtering
Streams: Bloom Filter with Analysis. 4.4 Counting Distinct Elements in
a Stream, Count-Distinct Problem, Flajolet-Martin Algorithm,
Combining Estimates, Space Requirements 4.5 Counting Frequent Items
in a Stream, Sampling Methods for Streams, Frequent Itemsets in
Decaying Windows. 4.6 Counting Ones in a Window: The Cost of Exact
Counts, The Datar-Gionis-Indyk-Motwani Algorithm, Query Answering
in the DGIM Algorithm, Decaying Windows.
05 Finding Similar Items and Clustering 08
5.1 Distance Measures: Definition of a Distance Measure, Euclidean
Distances, Jaccard Distance, Cosine Distance, Edit Distance, Hamming
Distance. 5.2 CURE Algorithm, Stream-Computing , A
Stream-Clustering Algorithm, Initializing & Merging Buckets,
Answering Queries.
06 Real-Time Big Data Models 10
6.1 PageRank Overview, Efficient computation of PageRank:
PageRank Iteration Using MapReduce, Use of Combiners to
Consolidate the Result Vector. 6.2 A Model for Recommendation
Systems,
Content-Based Recommendations, Collaborative Filtering. 6.3 Social
Networks as Graphs, Clustering of Social-Network Graphs, Direct
Discovery of Communities in a social graph.

Textbooks:
1 Anand Rajaraman and Jeff Ullman ―Mining of Massive Datasetsǁ, Cambridge
University Press,

2 Alex Holmes ―Hadoop in Practiceǁ, Manning Press, Dreamtech Press.

3 Dan Mcary and Ann Kelly ―Making Sense of NoSQLǁ – A guide for managers and the
rest of us, Manning Press.

References:
1 Bill Franks , ―Taming The Big Data Tidal Wave: Finding Opportunities In Huge
Data Streams With Advanced Analyticsǁ, Wiley

2 Chuck Lam, ―Hadoop in Actionǁ, Dreamtech Press

3 Jared Dean, ―Big Data, Data Mining, and Machine Learning: Value Creation for
Business Leaders and Practitionersǁ, Wiley India Private Limited, 2014.

4 Jiawei Han and Micheline Kamber, ―Data Mining: Concepts and Techniquesǁ,
Morgan Kaufmann Publishers, 3rd ed, 2010.

5 Lior Rokach and Oded Maimon, ―Data Mining and Knowledge Discovery
Handbookǁ, Springer, 2nd edition, 2010.

6 Ronen Feldman and James Sanger, ―The Text Mining Handbook: Advanced Approaches
in Analyzing Unstructured Dataǁ, Cambridge University Press, 2006.

7 Vojislav Kecman, ―Learning and Soft Computingǁ, MIT Press, 2010

Bda Sem 7 Book
No ratings yet
Bda Sem 7 Book
188 pages
SEM VII BDA Syllabus Theory
No ratings yet
SEM VII BDA Syllabus Theory
4 pages
BDA Syllabus - Sem VII - Mumbai University
No ratings yet
BDA Syllabus - Sem VII - Mumbai University
3 pages
Big Data Analytics Comp Syllabus Sem7
No ratings yet
Big Data Analytics Comp Syllabus Sem7
4 pages
BDA Techmax (Searchable)
No ratings yet
BDA Techmax (Searchable)
150 pages
L8 Big Data Management en
No ratings yet
L8 Big Data Management en
58 pages
Big Data Analytics for B.Tech Students
No ratings yet
Big Data Analytics for B.Tech Students
119 pages
Big Data Analytics Course Syllabus
No ratings yet
Big Data Analytics Course Syllabus
9 pages
Syllabus
No ratings yet
Syllabus
3 pages
Big Data Processing: Jiaul Paik
No ratings yet
Big Data Processing: Jiaul Paik
47 pages
Introduction of Subject
No ratings yet
Introduction of Subject
28 pages
21cs71BDA Question Bank
No ratings yet
21cs71BDA Question Bank
4 pages
Big Data Analytics
No ratings yet
Big Data Analytics
61 pages
Mca Big Data PDF Sem 3
No ratings yet
Mca Big Data PDF Sem 3
193 pages
Big Data Analytics for B.Tech Students
No ratings yet
Big Data Analytics for B.Tech Students
134 pages
Big Data Analytics Course
No ratings yet
Big Data Analytics Course
3 pages
Big Data & Hadoop Course Overview
No ratings yet
Big Data & Hadoop Course Overview
3 pages
B.Tech. CS - CE and CSE Syllabus 3rd Year 2024-25
No ratings yet
B.Tech. CS - CE and CSE Syllabus 3rd Year 2024-25
2 pages
Big Data Analytics - Sem 7 CVMU
No ratings yet
Big Data Analytics - Sem 7 CVMU
4 pages
Syllabus Sem 7
No ratings yet
Syllabus Sem 7
10 pages
Unit 1
No ratings yet
Unit 1
19 pages
Unit 1 J2 Big Data
No ratings yet
Unit 1 J2 Big Data
6 pages
Big Data Analytics
No ratings yet
Big Data Analytics
131 pages
Ashish Presentation Stage1 Modify LR
No ratings yet
Ashish Presentation Stage1 Modify LR
24 pages
Bda U2
No ratings yet
Bda U2
68 pages
1) Introduction To Big Data
No ratings yet
1) Introduction To Big Data
6 pages
Module - 1
No ratings yet
Module - 1
84 pages
Big Data Analytics For R-2017 by ArunPrasath S., Sriram Kumar K., Krishna Sankar P.
No ratings yet
Big Data Analytics For R-2017 by ArunPrasath S., Sriram Kumar K., Krishna Sankar P.
7 pages
Big Data Analytics Syllabus - 22UAI603C - 204 - 2025
No ratings yet
Big Data Analytics Syllabus - 22UAI603C - 204 - 2025
2 pages
Gujarat Technological University: Sr. No. Content Total Hrs % Weightage 1 13
No ratings yet
Gujarat Technological University: Sr. No. Content Total Hrs % Weightage 1 13
3 pages
Big Data Analytics
No ratings yet
Big Data Analytics
20 pages
Final Lesson Plan
No ratings yet
Final Lesson Plan
8 pages
MCAD2232 (PRESS) BIG DATA and Its Applications
No ratings yet
MCAD2232 (PRESS) BIG DATA and Its Applications
140 pages
Data Science and Big Data Analytics - Unit - 1
No ratings yet
Data Science and Big Data Analytics - Unit - 1
47 pages
Big Data Analytics Unit-1
No ratings yet
Big Data Analytics Unit-1
39 pages
Big Data Analytics for B.Tech Students
No ratings yet
Big Data Analytics for B.Tech Students
175 pages
Bda Unit 1
No ratings yet
Bda Unit 1
32 pages
IE494 - Big - Data - Processing - Course - File - Autumn24 - PMJ - PM Jat
No ratings yet
IE494 - Big - Data - Processing - Course - File - Autumn24 - PMJ - PM Jat
5 pages
Big Data Notes Pdf3
No ratings yet
Big Data Notes Pdf3
114 pages
Introduction To Big Data
No ratings yet
Introduction To Big Data
153 pages
Bda U1
No ratings yet
Bda U1
80 pages
Big Data and Analytics Syllabus 2021
No ratings yet
Big Data and Analytics Syllabus 2021
3 pages
Syllabus of Big Data Analysis - Proposed
No ratings yet
Syllabus of Big Data Analysis - Proposed
2 pages
Chapter 14
No ratings yet
Chapter 14
35 pages
BDA SEM-7 IMP by MK - 250216 - 041059
No ratings yet
BDA SEM-7 IMP by MK - 250216 - 041059
8 pages
BDH (1 5) ChatGPT
No ratings yet
BDH (1 5) ChatGPT
26 pages
No SQL Database in Bda
No ratings yet
No SQL Database in Bda
84 pages
Managing Big Data with Hadoop
No ratings yet
Managing Big Data with Hadoop
9 pages
Big Data SV Publication
No ratings yet
Big Data SV Publication
142 pages
Experiment No - 1 Bda
No ratings yet
Experiment No - 1 Bda
10 pages
CS8091 Big Data Analytics
No ratings yet
CS8091 Big Data Analytics
28 pages
CourseCurriculum (8) - 1
No ratings yet
CourseCurriculum (8) - 1
3 pages
BDA Important Questions
No ratings yet
BDA Important Questions
9 pages
TIE - 21CS71 SIMP With Key Answers
No ratings yet
TIE - 21CS71 SIMP With Key Answers
19 pages
DBM Book 2022 23
No ratings yet
DBM Book 2022 23
119 pages
Bda Assignment 4
No ratings yet
Bda Assignment 4
10 pages
Sample Etl Data
No ratings yet
Sample Etl Data
1 page
FitMentor Research Paper
No ratings yet
FitMentor Research Paper
4 pages
Bda A4
No ratings yet
Bda A4
10 pages
NLP Imps For End Sem
No ratings yet
NLP Imps For End Sem
2 pages
Dit 0305 Ooad Notes
100% (1)
Dit 0305 Ooad Notes
30 pages
GASTAT-700 Interface Protcol V1.06 - 180115
No ratings yet
GASTAT-700 Interface Protcol V1.06 - 180115
21 pages
VTU 18CSMP68 Mobile Application Development Lab Manual
No ratings yet
VTU 18CSMP68 Mobile Application Development Lab Manual
37 pages
PARAM Siddhi-AI System Manual Ver1.0
No ratings yet
PARAM Siddhi-AI System Manual Ver1.0
88 pages
Flip-Flop Logic & Instruction Codes
No ratings yet
Flip-Flop Logic & Instruction Codes
3 pages
Linear Equations
No ratings yet
Linear Equations
4 pages
Hands-On Exercise No. 4 Batch-10 Graphic Design Total Marks: 10 Due Date: 19/08/2021
No ratings yet
Hands-On Exercise No. 4 Batch-10 Graphic Design Total Marks: 10 Due Date: 19/08/2021
3 pages
Rao Sahab
No ratings yet
Rao Sahab
18 pages
Python Data Structures Q&A Bank
No ratings yet
Python Data Structures Q&A Bank
8 pages
Sample Questions Graduate Hiring
No ratings yet
Sample Questions Graduate Hiring
33 pages
HaggleRuleSet SidSacksonsOriginalV1.1
No ratings yet
HaggleRuleSet SidSacksonsOriginalV1.1
3 pages
Mini Monitor Module Installation Guide: Troubleshooting
No ratings yet
Mini Monitor Module Installation Guide: Troubleshooting
2 pages
SMTS File - 1 RS20200105 2020 05 19 14 - 26 - 04
No ratings yet
SMTS File - 1 RS20200105 2020 05 19 14 - 26 - 04
2 pages
Lung Cancer Detection Using CT Scan Images: Sciencedirect
No ratings yet
Lung Cancer Detection Using CT Scan Images: Sciencedirect
8 pages
PES MTech Brochure
No ratings yet
PES MTech Brochure
12 pages
IND AS 115: Revenue Recognition Guide
No ratings yet
IND AS 115: Revenue Recognition Guide
21 pages
Internal Trade (Korea) vs. International Trade
No ratings yet
Internal Trade (Korea) vs. International Trade
19 pages
People Central Hub Configuration Workbook
No ratings yet
People Central Hub Configuration Workbook
2,487 pages
Microfinance Empowers: Test Your Anti-Virus
No ratings yet
Microfinance Empowers: Test Your Anti-Virus
4 pages
P702CV
No ratings yet
P702CV
4 pages
Vetcare
No ratings yet
Vetcare
18 pages
Inventions Patent Inspired Portable Social Networking Site Vacuum Cleaner Solar Charger Versatile
No ratings yet
Inventions Patent Inspired Portable Social Networking Site Vacuum Cleaner Solar Charger Versatile
2 pages
Sureshppt
No ratings yet
Sureshppt
14 pages
Configure The Network For VxRail
No ratings yet
Configure The Network For VxRail
16 pages
Introduction To UX Design
No ratings yet
Introduction To UX Design
8 pages
PS.2024.C3.Corte1.Pruebas de Integracion.223204.GallegosBorraz
No ratings yet
PS.2024.C3.Corte1.Pruebas de Integracion.223204.GallegosBorraz
6 pages
Through A Gender Lens: An Empirical Study of Emoji Usage Over Large-Scale Android Users
No ratings yet
Through A Gender Lens: An Empirical Study of Emoji Usage Over Large-Scale Android Users
20 pages
Chords Dark Side of Moon
No ratings yet
Chords Dark Side of Moon
14 pages
OrionSX-Datasheet 083022
No ratings yet
OrionSX-Datasheet 083022
2 pages
Cisco Selftestengine 350-401 Sample Question 2022-Aug-30 by Louis 437q Vce
No ratings yet
Cisco Selftestengine 350-401 Sample Question 2022-Aug-30 by Louis 437q Vce
26 pages

Big Data & Hadoop Mastery Guide

Uploaded by

Big Data & Hadoop Mastery Guide

Uploaded by

Module Detailed Contents Hours

01 Introduction to Big Data & Hadoop 06

2 Alex Holmes ―Hadoop in Practiceǁ, Manning Press, Dreamtech Press.

2 Chuck Lam, ―Hadoop in Actionǁ, Dreamtech Press

7 Vojislav Kecman, ―Learning and Soft Computingǁ, MIT Press, 2010

You might also like