0% found this document useful (0 votes)

71 views3 pages

Introduction Big Data With Hadoop

This 3-day course introduces attendees to integrating Big Data components like Hadoop to create a Data Lake, selecting appropriate data stores, processing large datasets with Hadoop, querying data with Pig and Hive, and planning a Big Data strategy. The course is suitable for managers, programmers, architects and administrators across industries wanting a foundational overview. Attendees will learn concepts but not receive deep training in tools and techniques.

Uploaded by

lastviva

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

71 views3 pages

Introduction Big Data With Hadoop

Uploaded by

lastviva

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Introduction Big Data with Hadoop

Duration 3 days

You Will Learn How To:

 Integrate Big Data components to create an appropriate Data Lake
 Select the correct Big Data stores for disparate data sets
 Process large data sets using Hadoop to extract value
 Query large data sets in near real time with Pig and Hive
 Plan and implement a Big Data strategy for your organization

Who Should Attend :

As an introduction to Big Data training, this course is ideal for anyone, including managers,
programmers, architects and administrators, who wants a foundational overview of the key
components of Big Data and how they can be integrated to provide suitable solutions for their
organization. No programming experience is required. Programmers should be aware that the
exercises in this course are intended to give attendees high-level exposure to the capabilities of the
Big Data software tools and techniques, and not a deep dive.

Course Detail:
Introduction to Big Data
Defining Big Data

 The four dimensions of Big Data: volume, velocity, variety, veracity

 Introducing the Storage, MapReduce and Query Stack

Delivering business benefit from Big Data

 Establishing the business importance of Big Data

 Addressing the challenge of extracting useful data
 Integrating Big Data with traditional data

Storing Big Data

Analyzing your data characteristics

 Selecting data sources for analysis

 Eliminating redundant data
 Establishing the role of NoSQL

Overview of Big Data stores

 Data models: key value, graph, document, column–family

 Hadoop Distributed File System
 HBase
 Hive
 Cassandra
 Hypertable
 Amazon S3
 BigTable
 DynamoDB
 MongoDB
 Redis
 Riak
 Neo4J

Selecting Big Data stores

 Choosing the correct data stores based on your data characteristics

 Moving code to data
 Implementing polyglot data store solutions
 Aligning business goals to the appropriate data store

Processing Big Data

Integrating disparate data stores

 Mapping data to the programming framework

 Connecting and extracting data from storage
 Transforming data for processing
 Subdividing data in preparation for Hadoop MapReduce

Employing Hadoop MapReduce

 Creating the components of Hadoop MapReduce jobs

 Distributing data processing across server farms
 Executing Hadoop MapReduce jobs
 Monitoring the progress of job flows

The building blocks of Hadoop MapReduce

 Distinguishing Hadoop daemons

 Investigating the Hadoop Distributed File System
 Selecting appropriate execution modes: local, pseudo–distributed and fully distributed

Handling streaming data

 Comparing real–time processing models

 Leveraging Storm to extract live events
 Lightning–fast processing with Spark and Shark

Tools and Techniques to Analyze Big Data

Abstracting Hadoop MapReduce jobs with Pig

 Communicating with Hadoop in Pig Latin

 Executing commands using the Grunt Shell
 Streamlining high–level processing

Performing ad hoc Big Data querying with Hive

 Persisting data in the Hive MegaStore

 Performing queries with HiveQL
 Investigating Hive file formats

Creating business value from extracted data

 Mining data with Mahout

 Visualizing processed results with reporting tools
 Querying in real time with Impala

Developing a Big Data Strategy

Defining a Big Data strategy for your organization

 Establishing your Big Data needs

 Meeting business goals with timely data
 Evaluating commercial Big Data tools
 Managing organizational expectations

Enabling analytic innovation

 Focusing on business importance

 Framing the problem
 Selecting the correct tools
 Achieving timely results

Implementing a Big Data Solution

 Selecting suitable vendors and hosting options
 Balancing costs against business value
 Keeping ahead of the curve

Big Data Black Book PDF
15% (20)
Big Data Black Book PDF
2 pages
Big Data - Road Map
No ratings yet
Big Data - Road Map
22 pages
Data Bots Training Courses
100% (1)
Data Bots Training Courses
36 pages
BIG DATA Class 1 1741496163
No ratings yet
BIG DATA Class 1 1741496163
108 pages
BIG DATA ANALYTIS LAB File Shivam
No ratings yet
BIG DATA ANALYTIS LAB File Shivam
42 pages
Big Data Analytics
No ratings yet
Big Data Analytics
61 pages
17cs17 - Vcs314 - Big Data Systems
No ratings yet
17cs17 - Vcs314 - Big Data Systems
5 pages
BDA Syllabus - Sem VII - Mumbai University
No ratings yet
BDA Syllabus - Sem VII - Mumbai University
3 pages
Big Data Analytics for B.Tech Students
No ratings yet
Big Data Analytics for B.Tech Students
119 pages
Big Data Analytics Course Syllabus
No ratings yet
Big Data Analytics Course Syllabus
2 pages
MCAD2232 (PRESS) BIG DATA and Its Applications
No ratings yet
MCAD2232 (PRESS) BIG DATA and Its Applications
140 pages
Big Data Analytics
No ratings yet
Big Data Analytics
131 pages
Big Data Analytics-Digital Notes
No ratings yet
Big Data Analytics-Digital Notes
86 pages
Introduction of Subject
No ratings yet
Introduction of Subject
28 pages
Big Data Analytics
No ratings yet
Big Data Analytics
20 pages
Big Data Analytics Syllabus
No ratings yet
Big Data Analytics Syllabus
3 pages
Big Data Analytics for B.Tech Students
No ratings yet
Big Data Analytics for B.Tech Students
134 pages
Big Data Hadoop Complete Final Spaced
No ratings yet
Big Data Hadoop Complete Final Spaced
15 pages
Signals & Systems Solutions Guide
8% (12)
Signals & Systems Solutions Guide
2 pages
D Ed Cet Procedure
100% (2)
D Ed Cet Procedure
4 pages
No SQL Database in Bda
No ratings yet
No SQL Database in Bda
84 pages
Learn Well Technocraft: Hadoop/Big Data Syllabus
100% (1)
Learn Well Technocraft: Hadoop/Big Data Syllabus
12 pages
B.Tech. CS - CE and CSE Syllabus 3rd Year 2024-25
No ratings yet
B.Tech. CS - CE and CSE Syllabus 3rd Year 2024-25
2 pages
Big Data Analytics Overview
No ratings yet
Big Data Analytics Overview
17 pages
COT602-Big Data Analysis
No ratings yet
COT602-Big Data Analysis
2 pages
Experiment No - 1 Bda
No ratings yet
Experiment No - 1 Bda
10 pages
Koe097big Data
No ratings yet
Koe097big Data
1 page
CCS334 BDA Syllabus
No ratings yet
CCS334 BDA Syllabus
5 pages
Unit 1
No ratings yet
Unit 1
19 pages
Big Data Hadoop & Spark Curriculum
No ratings yet
Big Data Hadoop & Spark Curriculum
10 pages
113 Ce 74
No ratings yet
113 Ce 74
4 pages
Big Data Analytics - Sem 7 CVMU
No ratings yet
Big Data Analytics - Sem 7 CVMU
4 pages
Aspire Company Profile:, Aspire Exam Cracking KIT
100% (1)
Aspire Company Profile:, Aspire Exam Cracking KIT
17 pages
Syllabus
No ratings yet
Syllabus
3 pages
Hadoop Course Circulum
No ratings yet
Hadoop Course Circulum
2 pages
DE Python
No ratings yet
DE Python
11 pages
Big Data Analytics Course Guide
No ratings yet
Big Data Analytics Course Guide
2 pages
Instruction For AVIC F-Series In-Dash 2.008 Firmware Update
No ratings yet
Instruction For AVIC F-Series In-Dash 2.008 Firmware Update
4 pages
Big Data Hadoop - Course Curriculum - V1
No ratings yet
Big Data Hadoop - Course Curriculum - V1
7 pages
Big Data Certification for IT Pros
No ratings yet
Big Data Certification for IT Pros
22 pages
Big Data Hadoop Training Certification 7
No ratings yet
Big Data Hadoop Training Certification 7
40 pages
Syllabus of Big Data Analysis - Proposed
No ratings yet
Syllabus of Big Data Analysis - Proposed
2 pages
Specialised Programme On Big Data and Machine Learning - 8 Weeks
No ratings yet
Specialised Programme On Big Data and Machine Learning - 8 Weeks
6 pages
Big Data analyticsNEW SYLLABUS FRAMING
No ratings yet
Big Data analyticsNEW SYLLABUS FRAMING
3 pages
Big Data Analytics
No ratings yet
Big Data Analytics
3 pages
Training For Bigdata and Hadoop: #I Background and Introduction
No ratings yet
Training For Bigdata and Hadoop: #I Background and Introduction
9 pages
Big Data Analytics
No ratings yet
Big Data Analytics
3 pages
Big Data and Hadoop For Developers - Syllabus
No ratings yet
Big Data and Hadoop For Developers - Syllabus
6 pages
Bigdata Hadoop Spark - Python
No ratings yet
Bigdata Hadoop Spark - Python
8 pages
Gag PDF
No ratings yet
Gag PDF
15 pages
Big Data Hadoop Certification Training: About Intellipaat
No ratings yet
Big Data Hadoop Certification Training: About Intellipaat
13 pages
Hadoop Architect Brochure
No ratings yet
Hadoop Architect Brochure
13 pages
Big Data Data Analytics
No ratings yet
Big Data Data Analytics
5 pages
Mobile Based Lan Monitoring and Control PDF
No ratings yet
Mobile Based Lan Monitoring and Control PDF
4 pages
HIMCM National Outstanding
No ratings yet
HIMCM National Outstanding
66 pages
r18 - Big Data Analytics - Cse (DS)
0% (1)
r18 - Big Data Analytics - Cse (DS)
1 page
Big Data and Analytics Syllabus 2021
No ratings yet
Big Data and Analytics Syllabus 2021
3 pages
Hotel Administration and Management System (Synopsis)
No ratings yet
Hotel Administration and Management System (Synopsis)
8 pages
UCGUI Datasheet
No ratings yet
UCGUI Datasheet
2 pages
4.7.1 Bda-Mba
No ratings yet
4.7.1 Bda-Mba
2 pages
Hadoop Development Training in Bangalore
No ratings yet
Hadoop Development Training in Bangalore
5 pages
OrCAD-Allegro Hardware and Software Requirements 16-6 PDF
No ratings yet
OrCAD-Allegro Hardware and Software Requirements 16-6 PDF
1 page
Big Data Training in Chennai - Big Data Course in Chennai
No ratings yet
Big Data Training in Chennai - Big Data Course in Chennai
1 page
Big Data & Hadoop - Course Curriculum
No ratings yet
Big Data & Hadoop - Course Curriculum
6 pages
BCC52 PDF
0% (1)
BCC52 PDF
55 pages
Oracle R12 Install Guide for Linux
No ratings yet
Oracle R12 Install Guide for Linux
34 pages
Revision: Intro To Asp Web Application Development
No ratings yet
Revision: Intro To Asp Web Application Development
4 pages
11 EASY ROB Chapter 09
No ratings yet
11 EASY ROB Chapter 09
28 pages
Pacis OI 1296
No ratings yet
Pacis OI 1296
2 pages
Table of Contents
No ratings yet
Table of Contents
10 pages
Python PyQt GUI for Beginners
No ratings yet
Python PyQt GUI for Beginners
13 pages
"Report On Patch Antennas Issues": Assignment # 03
No ratings yet
"Report On Patch Antennas Issues": Assignment # 03
3 pages
CORDIC - Wikipedia, The Free Encyclopedia
No ratings yet
CORDIC - Wikipedia, The Free Encyclopedia
7 pages
Smart Stick For Blind Man: Nitish Sukhija, Shruti Taksali, Mohit Jain and Rahul Kumawat
No ratings yet
Smart Stick For Blind Man: Nitish Sukhija, Shruti Taksali, Mohit Jain and Rahul Kumawat
8 pages
JSF Bean Scope Selection Guide
No ratings yet
JSF Bean Scope Selection Guide
2 pages
Discrete-Time Fourier Analysis Discrete-Time Fourier Analysis
No ratings yet
Discrete-Time Fourier Analysis Discrete-Time Fourier Analysis
37 pages
ACM207H User Manual
No ratings yet
ACM207H User Manual
4 pages
SAP System Architecture Guide
100% (1)
SAP System Architecture Guide
31 pages
Nitte Meenakshi Institute of Technology: Department of Computer Science and Engineering
No ratings yet
Nitte Meenakshi Institute of Technology: Department of Computer Science and Engineering
5 pages
Online Food Order System Design
No ratings yet
Online Food Order System Design
20 pages
ACL Lab
No ratings yet
ACL Lab
30 pages
ER Diagram
No ratings yet
ER Diagram
39 pages
CS Students: Data Structures Course
No ratings yet
CS Students: Data Structures Course
28 pages
C++ Programming Essentials
No ratings yet
C++ Programming Essentials
241 pages

Introduction Big Data With Hadoop

Uploaded by

Introduction Big Data With Hadoop

Uploaded by

Introduction Big Data with Hadoop

You Will Learn How To:

Who Should Attend :

 The four dimensions of Big Data: volume, velocity, variety, veracity

Delivering business benefit from Big Data

 Establishing the business importance of Big Data

Storing Big Data

 Selecting data sources for analysis

Overview of Big Data stores

 Data models: key value, graph, document, column–family

Selecting Big Data stores

 Choosing the correct data stores based on your data characteristics

Processing Big Data

 Mapping data to the programming framework

Employing Hadoop MapReduce

 Creating the components of Hadoop MapReduce jobs

The building blocks of Hadoop MapReduce

 Distinguishing Hadoop daemons

Handling streaming data

 Comparing real–time processing models

Tools and Techniques to Analyze Big Data

 Communicating with Hadoop in Pig Latin

Performing ad hoc Big Data querying with Hive

 Persisting data in the Hive MegaStore

Creating business value from extracted data

 Mining data with Mahout

Developing a Big Data Strategy

 Establishing your Big Data needs

Enabling analytic innovation

 Focusing on business importance

Implementing a Big Data Solution

You might also like