Big Data Framework

BDA syllabus

Uploaded by

lekha.cce

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

57 views3 pages

Big Data Framework

BDA syllabus

Uploaded by

lekha.cce

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 3

SEMESTER - I

24PBDPC1 BIG DATA L T P C

03 FRAMEWORKS 3 0 0 3
SDG NO. 4 AND
TECHNOLOGIES

OBJECTIVES:
 To understand the need of a framework to store and process the big
data.
 To have knowledge on the Big Data Technologies for processing the
Different types of Data.
 To understand the advanced frame work for faster accessing and
processing of Big Data.
 To integrate wide range of data processing and analysis tools.
UNIT I BIG DATA 9
Understanding Big Data: Concepts and terminology, Big Data
Characteristics, Different types of Data, Identifying Data Characteristics -
Need of big data frameworks -Big Data Architecture - Big Data Storage: File
system and Distributed FileSystem, NoSQL Databases, Sharding, Replication,
Sharding and Replication.

UNIT II HADOOP FRAMEWORK 9

Hadoop Architecture - Hadoop Distributed File System (HDFS) –YARN –
Hadoop I/O – Map Reduce:Developing a map-reduce application – Map-
reduce working procedure – Types and Formats - Features of Mapreduce:
sorting and joins- Pipelining MapReduce jobs.

UNIT III HADOOP TECHNOLOGIES : PIG 9

Introduction, Parallel processing using Pig, Pig Architecture, Grunt, Pig Data
Model-scalar and complex types. Pig Latin- Input and output, Relational
operators, User defined functions -Working with scripts - Hadoop
Operations.

UNIT IV HIVE AND SPARK 9

Introduction-Hive modules, Data types and file formats, Hive QL-Data
Definition and Data Manipulation-HiveQL queries, Hive QL views- reduce
query complexity. Hive scripts. Hive QL Indexes- Aggregate functions
Bucketing vs Partitioning. Overview of Spark – Hadoop Overview of Spark –
Hadoop vs. Spark – Cluster Design – Cluster Management – performance,
Application Programming interface (API): Spark Context, Resilient
Distributed Datasets, Creating RDD, RDD Operations, and Saving RDD - Lazy
Operation – Spark Jobs - Spark Programming in Scala, Python, R, Java.

UNIT V IMPALA 9
Introducing Cloudera Impala - Architecture of Impala - Components of the
Impala : The Impala Daemon, The Impala Statestore - The Impala Catalog
Service Query Processing Interfaces - Impala Shell Command Reference -
Impala Data Types - Creating and deleting databases and tables Inserting
and overwriting table data - Record Fetching and ordering - Grouping
records - Working of Impala with Hive.
TOTAL: 45 PERIODS
TEXT BOOKS:
1. Thomas Erl, Wajid Khattak, and Paul Buhler, Big Data Fundamentals:
Concepts, Drivers &Techniques, Pearson India Education Service Pvt. Ltd.,
First Edition, 2016.
2. Tom White, Hadoop: The Definitive Guide, O’Reilly Media, Inc., Fourth
Edition, 2015.
REFERENCES:
1. Alan Gates, Programming Pig Dataflow Scripting with Hadoop, O’Reilly
Media, Inc, 2011.
2. Jason Rutherglen, Dean Wampler, Edward Caprialo, Programming Hive,
O’ReillyMedia, Inc,2012
3. Mike Frampton, “Mastering Apache Spark”, Packt Publishing, 2015.
4. Getting Started with Impala,by John Russell, Publisher(s): O'Reilly Media,
Inc, September 2014

WEBREFERENCES:
1. https://www.bigdataframework.org/an-overview-of-the-big-data-
framework/
2. https://techreviewer.co/blog/the-most-popular-big-data-frameworks
3. https://www.javatpoint.com/java-big-data-frameworks
OUTCOMES:
Upon completion of the course, the student should be able to
1. Understand the need of new frame work to deal with huge amounts of
Data.
2. Demonstrate the Hadoop framework Hadoop Distributed File System and
MapReduce
3. Demonstrate the Pig architecture and evaluation of pig scripts.
4. Describe the Hive architecture and execute Hive queries on sample data
sets.
5. Demonstrate spark programming with different programming languages
and graph algorithms and execute Impala scripts

20IT503 - Big Data Analytics - Unit4
No ratings yet
20IT503 - Big Data Analytics - Unit4
73 pages
Adobe Photoshop CC 2021 v2251441 Crack With Activation Key
100% (3)
Adobe Photoshop CC 2021 v2251441 Crack With Activation Key
4 pages
CEMLI Process Description
No ratings yet
CEMLI Process Description
1 page
Hardware and Networking Level III COC Muching and Practicum Exam A B
86% (7)
Hardware and Networking Level III COC Muching and Practicum Exam A B
5 pages
Syllabus E63 2018 Fall PDF
No ratings yet
Syllabus E63 2018 Fall PDF
3 pages
BDA - Lecture 3
100% (1)
BDA - Lecture 3
17 pages
Syllabus E63 Spring2016-2
No ratings yet
Syllabus E63 Spring2016-2
3 pages
Big Data and Analytics Syllabus 2021
No ratings yet
Big Data and Analytics Syllabus 2021
3 pages
Big Data - 2 Marks-1
No ratings yet
Big Data - 2 Marks-1
1 page
Module 9: Processing Distributed Data With Apache Spark: WWW - Edureka.co/big-Data-And-Hadoop
No ratings yet
Module 9: Processing Distributed Data With Apache Spark: WWW - Edureka.co/big-Data-And-Hadoop
45 pages
IU Data Science Programs Overview
No ratings yet
IU Data Science Programs Overview
71 pages
Big Data Analytics
No ratings yet
Big Data Analytics
3 pages
IIT Kharagpur Data Science PDF
No ratings yet
IIT Kharagpur Data Science PDF
22 pages
Big Data Analytics Course Guide
No ratings yet
Big Data Analytics Course Guide
2 pages
Low Power J-Fet Quad Operational Amplifiers: TL064 TL064A - TL064B
No ratings yet
Low Power J-Fet Quad Operational Amplifiers: TL064 TL064A - TL064B
11 pages
CLB10503 Principles of Programming Assignment: Movie Ticket Booking Programme (Using C++ Coding)
67% (3)
CLB10503 Principles of Programming Assignment: Movie Ticket Booking Programme (Using C++ Coding)
17 pages
Big Data Syllabus For Theory and Lab
No ratings yet
Big Data Syllabus For Theory and Lab
4 pages
Apache Spark Engine
100% (1)
Apache Spark Engine
82 pages
ASRock - B85 Pro4
No ratings yet
ASRock - B85 Pro4
3 pages
Bigdata Syllabus
No ratings yet
Bigdata Syllabus
3 pages
Koe097big Data
No ratings yet
Koe097big Data
1 page
Windows7 PUFF21-Tutorial 2013 English
No ratings yet
Windows7 PUFF21-Tutorial 2013 English
121 pages
Op Amp Problems
No ratings yet
Op Amp Problems
4 pages
Axel Programacion
No ratings yet
Axel Programacion
118 pages
Embedded SPI Programming Guide
No ratings yet
Embedded SPI Programming Guide
2 pages
BDA - Unit-1
No ratings yet
BDA - Unit-1
24 pages
Data 6502 Integrada
0% (1)
Data 6502 Integrada
3 pages
Secr2043-202120221 Ci
No ratings yet
Secr2043-202120221 Ci
7 pages
Course Pack BDA
No ratings yet
Course Pack BDA
6 pages
FSCQ0765RT PDF
No ratings yet
FSCQ0765RT PDF
25 pages
Big Data
No ratings yet
Big Data
3 pages
Note Positivo Stilo - Xc3550 Xc3570 71r-s14ct6-t820 Schematic
100% (1)
Note Positivo Stilo - Xc3550 Xc3570 71r-s14ct6-t820 Schematic
35 pages
Mega Net Impress Catalog e
No ratings yet
Mega Net Impress Catalog e
2 pages
8085 Microprocessor Overview
No ratings yet
8085 Microprocessor Overview
3 pages
No SQL Database in Bda
No ratings yet
No SQL Database in Bda
84 pages
Model 5020 Combustible Gas Detection Module: Nova-5000 Detection & Control System
No ratings yet
Model 5020 Combustible Gas Detection Module: Nova-5000 Detection & Control System
2 pages
Fujitsu-Siemens Lifebook S6510, S6410 Manual For Vista - ENG PDF
No ratings yet
Fujitsu-Siemens Lifebook S6510, S6410 Manual For Vista - ENG PDF
66 pages
Big Data Analytics 0th Lecture
No ratings yet
Big Data Analytics 0th Lecture
19 pages
Computer History Timeline
No ratings yet
Computer History Timeline
43 pages
B2. Introduction To Big Data With Spark and Hadoop - Coursera
No ratings yet
B2. Introduction To Big Data With Spark and Hadoop - Coursera
12 pages
BigData Mining and Analytics
No ratings yet
BigData Mining and Analytics
2 pages
Big Data Computing Notes
No ratings yet
Big Data Computing Notes
17 pages
Big Data Technologies Course Outline
No ratings yet
Big Data Technologies Course Outline
2 pages
Big Data Hadoop & Spark Course Guide
No ratings yet
Big Data Hadoop & Spark Course Guide
29 pages
Doors - Super Easy Mode Script
No ratings yet
Doors - Super Easy Mode Script
6 pages
Big Data Analytics Course
No ratings yet
Big Data Analytics Course
2 pages
V Sem AIML
No ratings yet
V Sem AIML
12 pages
BE AIDS R 20 VII VIII Sem Syllabus - Compressed
No ratings yet
BE AIDS R 20 VII VIII Sem Syllabus - Compressed
55 pages
Big Data With Hadoop and Spark - 2023-25
No ratings yet
Big Data With Hadoop and Spark - 2023-25
4 pages
Big Data Analytics - Sem 7 CVMU
No ratings yet
Big Data Analytics - Sem 7 CVMU
4 pages
BD by Maaz
No ratings yet
BD by Maaz
19 pages
Big Data Engineer Course
No ratings yet
Big Data Engineer Course
31 pages
Introduction
No ratings yet
Introduction
32 pages
IV CSE Handbook
No ratings yet
IV CSE Handbook
29 pages
Big Data Analytics-Digital Notes
No ratings yet
Big Data Analytics-Digital Notes
86 pages
cs8080 Irt Local Author
No ratings yet
cs8080 Irt Local Author
168 pages
Unit III - IV
No ratings yet
Unit III - IV
122 pages
IS405 - Big Data (Eng.2023)
No ratings yet
IS405 - Big Data (Eng.2023)
12 pages
Mix Keynote 2
No ratings yet
Mix Keynote 2
10 pages
Big Data SV Publication
No ratings yet
Big Data SV Publication
142 pages
Big Data Lab Manual
No ratings yet
Big Data Lab Manual
36 pages
CA Chap5 Memory
No ratings yet
CA Chap5 Memory
64 pages
B.Tech. CS - CE and CSE Syllabus 3rd Year 2024-25
No ratings yet
B.Tech. CS - CE and CSE Syllabus 3rd Year 2024-25
2 pages
DLO 9.0 Overview - v2
No ratings yet
DLO 9.0 Overview - v2
17 pages
Big Data Analytics
No ratings yet
Big Data Analytics
20 pages
XML
No ratings yet
XML
36 pages
Big Data Analytics - Notes
No ratings yet
Big Data Analytics - Notes
13 pages
Bca Bigdata Fifth - Sem Approved Syllabus
No ratings yet
Bca Bigdata Fifth - Sem Approved Syllabus
23 pages
BIG Data Analytics 21CSH-471: Computer Science & Engineering
No ratings yet
BIG Data Analytics 21CSH-471: Computer Science & Engineering
24 pages
Unit 5
No ratings yet
Unit 5
4 pages
Chapter 7 - Software Quality Assurance
No ratings yet
Chapter 7 - Software Quality Assurance
36 pages
BigData Session1
No ratings yet
BigData Session1
14 pages
Gujarat Technological University: Sr. No. Content Total Hrs % Weightage 1 13
No ratings yet
Gujarat Technological University: Sr. No. Content Total Hrs % Weightage 1 13
3 pages
Unit 5
No ratings yet
Unit 5
14 pages
Maze Solving Robot Using Arduino
No ratings yet
Maze Solving Robot Using Arduino
22 pages
KommBox & KommSpot Flyer 2022 EN
No ratings yet
KommBox & KommSpot Flyer 2022 EN
4 pages
HDMI+LVDS 选型表
No ratings yet
HDMI+LVDS 选型表
2,346 pages
Bad601 Simp Q
No ratings yet
Bad601 Simp Q
4 pages
Module Handbook Bigdata
No ratings yet
Module Handbook Bigdata
3 pages
Foundation of Datascience
No ratings yet
Foundation of Datascience
2 pages
Big Data Analytics
No ratings yet
Big Data Analytics
61 pages
Plagiarism
No ratings yet
Plagiarism
3 pages
Machine Learning Techniques
No ratings yet
Machine Learning Techniques
3 pages
Skill Enhancement
No ratings yet
Skill Enhancement
4 pages
Research Methodology
No ratings yet
Research Methodology
6 pages
Unit 2 - WD
No ratings yet
Unit 2 - WD
39 pages
MCA - II Sem - Curriculum and Syllabus
No ratings yet
MCA - II Sem - Curriculum and Syllabus
15 pages
Important Big Data Questions AKTU
No ratings yet
Important Big Data Questions AKTU
3 pages
Grade 8 Computer Networks
No ratings yet
Grade 8 Computer Networks
9 pages
Asit Kumar Das - M5 SPARK
No ratings yet
Asit Kumar Das - M5 SPARK
24 pages
Big Data Syllabus
No ratings yet
Big Data Syllabus
1 page
Unit 1 BDA
No ratings yet
Unit 1 BDA
43 pages
GAME
No ratings yet
GAME
2 pages
Week 2
No ratings yet
Week 2
3 pages
Week 11
No ratings yet
Week 11
3 pages
BCA - 409 Syallabus
No ratings yet
BCA - 409 Syallabus
2 pages
DLMDSBDT01 04 Modern Big Data Processing Frameworks
No ratings yet
DLMDSBDT01 04 Modern Big Data Processing Frameworks
27 pages
BIG DATA Class 1 1741496163
No ratings yet
BIG DATA Class 1 1741496163
108 pages
Week 10
No ratings yet
Week 10
3 pages
Syllabus NM Infosys Big Data
No ratings yet
Syllabus NM Infosys Big Data
3 pages
Week 6
No ratings yet
Week 6
4 pages
Big Data
No ratings yet
Big Data
19 pages
Fix - (SPICE) Transient GMIN Stepping at Time 0.00156965 - Geeky Engineers
No ratings yet
Fix - (SPICE) Transient GMIN Stepping at Time 0.00156965 - Geeky Engineers
7 pages
Design and Optimization of Low-Power VLSI Circuits For IoT Devices
100% (1)
Design and Optimization of Low-Power VLSI Circuits For IoT Devices
7 pages
17cs17 - Vcs314 - Big Data Systems
No ratings yet
17cs17 - Vcs314 - Big Data Systems
5 pages

Big Data Framework

Uploaded by

Big Data Framework

Uploaded by

SEMESTER - I

24PBDPC1 BIG DATA L T P C

UNIT II HADOOP FRAMEWORK 9

UNIT III HADOOP TECHNOLOGIES : PIG 9

UNIT IV HIVE AND SPARK 9

You might also like