0% found this document useful (0 votes)

6 views10 pages

Fundamentals of Data Science

Data science is an interdisciplinary field that integrates statistics, computer science, and domain knowledge to extract insights from data. It involves various processes such as data collection, cleaning, exploration, modeling, and communication, utilizing algorithms for classification and analysis. Key components include data engineering, modeling, evaluation, and visualization, with data scientists playing a crucial role in interpreting and communicating results.

Uploaded by

Nisha Gupta

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

6 views10 pages

Fundamentals of Data Science

Uploaded by

Nisha Gupta

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 10

Fundamentals of Data Science

Chapter 1: Definition of Data Science

Data science is an interdisciplinary field that combines statistics, computer science, domain

knowledge, and data analysis techniques to extract insights and knowledge from structured and

unstructured data.

It draws upon tools and techniques from mathematics, statistics, data engineering, machine

learning, visualization, and domain-specific knowledge to transform raw data into actionable

intelligence.
Fundamentals of Data Science

Chapter 2: Basic Terminology

Basic terminology in data science includes:

- Dataset: A collection of data.

- Feature: A variable or attribute used in analysis.

- Label: The target variable in supervised learning.

- Algorithm: A procedure or formula for solving a problem.

- Model: The representation produced by training an algorithm on data.

Fundamentals of Data Science

Chapter 3: Venn Diagram of Data Science

A common Venn diagram for data science illustrates the intersection of three fields:

1. Computer Science (Programming and Software Engineering)

2. Mathematics & Statistics (Inference and Data Analysis)

3. Domain Expertise (Subject Matter Knowledge)

The center of this intersection is data science.

Fundamentals of Data Science

Chapter 4: Types of Data

Types of Data:

1. Structured Data: Organized in rows and columns (e.g., SQL databases).

2. Unstructured Data: No pre-defined format (e.g., text, images, videos).

Quantitative vs Qualitative Data:

- Quantitative: Numerical, measurable data (e.g., height, weight).

- Qualitative: Descriptive data (e.g., gender, color, opinion).

Fundamentals of Data Science

Chapter 5: The Four Levels of Data

The Four Levels of Data:

1. Nominal: Categorical without order (e.g., gender, color).

2. Ordinal: Categorical with order (e.g., ratings, education level).

3. Interval: Numerical without a true zero (e.g., temperature in Celsius).

4. Ratio: Numerical with a true zero (e.g., height, weight).

Fundamentals of Data Science

Chapter 6: Five Steps of the Data Science Process

Five Steps of the Data Science Process:

1. Data Collection: Gathering data from various sources.

2. Data Cleaning: Fixing or removing incorrect, incomplete, or duplicate data.

3. Data Exploration: Understanding patterns and distributions.

4. Modeling: Applying algorithms to build predictive models.

5. Deployment and Communication: Sharing results and deploying models.

Fundamentals of Data Science

Chapter 7: Data Science Classification

Data science classification refers to the process of categorizing data points into predefined labels or

classes using supervised learning techniques such as:

- Logistic Regression

- Decision Trees

- Random Forests

- Support Vector Machines (SVM)

Fundamentals of Data Science

Chapter 8: Data Science Algorithms

Common data science algorithms include:

- Linear and Logistic Regression

- Decision Trees and Random Forests

- K-Nearest Neighbors (KNN)

- Support Vector Machines (SVM)

- Naive Bayes

- K-Means Clustering

- Principal Component Analysis (PCA)

Fundamentals of Data Science

Chapter 9: Components of Data Science

Components of Data Science:

- Data Engineering

- Data Preparation

- Modeling

- Evaluation

- Visualization

- Communication
Fundamentals of Data Science

Chapter 10: Role of a Data Scientist

Role of a Data Scientist:

- Gather and preprocess data

- Analyze and interpret complex data

- Develop models and algorithms

- Communicate results to stakeholders

- Collaborate with domain experts and software engineers

EDS Unit 1?
No ratings yet
EDS Unit 1?
15 pages
UNIT-I Detailed Notes
No ratings yet
UNIT-I Detailed Notes
3 pages
FDSNotes
No ratings yet
FDSNotes
12 pages
Data Science
No ratings yet
Data Science
5 pages
Aspiring Data Scientist Guide
No ratings yet
Aspiring Data Scientist Guide
7 pages
Learn Data Science Fundamentals (2025)
100% (1)
Learn Data Science Fundamentals (2025)
201 pages
Fundamentals of Data Science
No ratings yet
Fundamentals of Data Science
84 pages
Fundamentals of Data Science
No ratings yet
Fundamentals of Data Science
2 pages
Introduction To Data Science - 23CSH-283
100% (1)
Introduction To Data Science - 23CSH-283
48 pages
Data Science 1
100% (5)
Data Science 1
133 pages
Data Science Terminology
No ratings yet
Data Science Terminology
10 pages
DSS-first Lecture
No ratings yet
DSS-first Lecture
14 pages
Unit-1 - Introduction To Data Science
No ratings yet
Unit-1 - Introduction To Data Science
17 pages
Data Science Ppt1 Update
No ratings yet
Data Science Ppt1 Update
67 pages
Week 1 Data Science
No ratings yet
Week 1 Data Science
17 pages
Data Science Note
No ratings yet
Data Science Note
91 pages
Data Science Essentials for Beginners
No ratings yet
Data Science Essentials for Beginners
7 pages
Cs3352 Foundation of Data Science
No ratings yet
Cs3352 Foundation of Data Science
17 pages
Data-Science - Introduction
No ratings yet
Data-Science - Introduction
35 pages
Data Science Basics and History
100% (1)
Data Science Basics and History
51 pages
FDS - Lecture Notes - III AIML, CSM
No ratings yet
FDS - Lecture Notes - III AIML, CSM
101 pages
Introduction to Data Science Concepts
100% (1)
Introduction to Data Science Concepts
167 pages
Intro to Data Science Basics
No ratings yet
Intro to Data Science Basics
11 pages
Data Science Fundamentals Guide
No ratings yet
Data Science Fundamentals Guide
65 pages
Data Science for Professionals
No ratings yet
Data Science for Professionals
15 pages
Foundation of Data Science (BSC)
No ratings yet
Foundation of Data Science (BSC)
64 pages
Data Science
No ratings yet
Data Science
5 pages
IDS Complete Notes
No ratings yet
IDS Complete Notes
126 pages
Data Science - AD1102-1
No ratings yet
Data Science - AD1102-1
53 pages
Data Science A Beginner S Guide 1668243666
100% (1)
Data Science A Beginner S Guide 1668243666
26 pages
CH1 Introduction To Data Science BS
No ratings yet
CH1 Introduction To Data Science BS
69 pages
Intro to Data Science Tutorial
No ratings yet
Intro to Data Science Tutorial
9 pages
Foundation of Data Science (BSC) 1
No ratings yet
Foundation of Data Science (BSC) 1
64 pages
Data Science Overview Basic To Advance Guide
No ratings yet
Data Science Overview Basic To Advance Guide
27 pages
IDS Lecture 1.1.1
No ratings yet
IDS Lecture 1.1.1
13 pages
Data Science Unit 01
No ratings yet
Data Science Unit 01
19 pages
Statistics
No ratings yet
Statistics
7 pages
Intro To Data-Science Final
No ratings yet
Intro To Data-Science Final
3 pages
Fundamentals of Data Science Course
100% (3)
Fundamentals of Data Science Course
62 pages
DataScience Intro
No ratings yet
DataScience Intro
36 pages
Lecture Notes
No ratings yet
Lecture Notes
8 pages
Introduction to Data Science Course
No ratings yet
Introduction to Data Science Course
44 pages
Notes
No ratings yet
Notes
18 pages
Data Science
No ratings yet
Data Science
13 pages
Lec 1
No ratings yet
Lec 1
8 pages
Last Edited Emerging Technology
No ratings yet
Last Edited Emerging Technology
10 pages
FODS Unit-1
No ratings yet
FODS Unit-1
33 pages
Data Science Fundamentals Detailed Notes
No ratings yet
Data Science Fundamentals Detailed Notes
31 pages
Anshumoocs
No ratings yet
Anshumoocs
20 pages
Data Science
No ratings yet
Data Science
6 pages
Introduction To Data Science Ascii Detailed
No ratings yet
Introduction To Data Science Ascii Detailed
2 pages
Chapter 5
No ratings yet
Chapter 5
58 pages
Internship Report 2023-24 Data Science
100% (2)
Internship Report 2023-24 Data Science
23 pages
Applied Data Science
100% (1)
Applied Data Science
279 pages
Chapter 1
No ratings yet
Chapter 1
47 pages
Course Outline PDF
No ratings yet
Course Outline PDF
2 pages
Data Science Unit1
No ratings yet
Data Science Unit1
9 pages
Unit 1
No ratings yet
Unit 1
76 pages
Unit 4 Notes
No ratings yet
Unit 4 Notes
16 pages
CBN Unit1 Questions
No ratings yet
CBN Unit1 Questions
2 pages
Java Questions
No ratings yet
Java Questions
14 pages
Happy Teachers' Day!: Imagination
No ratings yet
Happy Teachers' Day!: Imagination
1 page
CS Gate 2014 Set 2
No ratings yet
CS Gate 2014 Set 2
23 pages
Data Analytics
No ratings yet
Data Analytics
42 pages
3 Months Schedule
No ratings yet
3 Months Schedule
12 pages
ISRO Computer Science Question Paper PDF
100% (1)
ISRO Computer Science Question Paper PDF
24 pages
Kit 601 L Unit 1 240219102731 858108ce
No ratings yet
Kit 601 L Unit 1 240219102731 858108ce
35 pages
Chd20-Modern Lifestyle and Physical Education (Pedidc)
No ratings yet
Chd20-Modern Lifestyle and Physical Education (Pedidc)
1 page
CHD20-Understanding Contemporary Social Issues (SOCIDC)
No ratings yet
CHD20-Understanding Contemporary Social Issues (SOCIDC)
1 page
NTA UGC NET Paper 1 December 2000
No ratings yet
NTA UGC NET Paper 1 December 2000
8 pages
Screenshot 2024-02-28 at 8.08.02 PM
No ratings yet
Screenshot 2024-02-28 at 8.08.02 PM
361 pages
01 Data Warehoudingand Ab Initio Concepts
100% (1)
01 Data Warehoudingand Ab Initio Concepts
76 pages
Pivot Like A Boss
No ratings yet
Pivot Like A Boss
18 pages
Subquery
No ratings yet
Subquery
4 pages
Date Dimension in SSAS Guide
No ratings yet
Date Dimension in SSAS Guide
7 pages
Lesson 1-Introduction To Reference Service
No ratings yet
Lesson 1-Introduction To Reference Service
19 pages
CV - Alekh Ved
No ratings yet
CV - Alekh Ved
5 pages
DBMS LAB Important Questions For UNIV LAB
No ratings yet
DBMS LAB Important Questions For UNIV LAB
6 pages
Dark Song by Christine Feehan PDF
0% (1)
Dark Song by Christine Feehan PDF
1 page
Idera Solution Brief Getting Started Guide For SQL Diagnostic Manager
No ratings yet
Idera Solution Brief Getting Started Guide For SQL Diagnostic Manager
22 pages
Restaurant Management System Development
No ratings yet
Restaurant Management System Development
9 pages
Sample Book Archiving Your SAP Data - SAP Press
No ratings yet
Sample Book Archiving Your SAP Data - SAP Press
40 pages
Literature Review Essentials
No ratings yet
Literature Review Essentials
14 pages
BI & Data Analytics Professionals
No ratings yet
BI & Data Analytics Professionals
3 pages
HND Computing U10 Website Design
No ratings yet
HND Computing U10 Website Design
1 page
Compal LS-B161P Power SW PDF
No ratings yet
Compal LS-B161P Power SW PDF
2 pages
DBMS-PK, SK, FK, ACID Properties
No ratings yet
DBMS-PK, SK, FK, ACID Properties
18 pages
IoT UNIT-4
No ratings yet
IoT UNIT-4
8 pages
SAP BODS Transformations Full QA
No ratings yet
SAP BODS Transformations Full QA
5 pages
JCR Reference Guide 2024
No ratings yet
JCR Reference Guide 2024
52 pages
0 Front Matter
No ratings yet
0 Front Matter
4 pages
Dimensional Modeling Primer: Kimball & Ross
No ratings yet
Dimensional Modeling Primer: Kimball & Ross
14 pages
Data vs Information: Practice Activities
100% (1)
Data vs Information: Practice Activities
2 pages
Infinite Volumes
No ratings yet
Infinite Volumes
11 pages
Vignesh Resume
No ratings yet
Vignesh Resume
1 page
Amazon Data Warehouse
No ratings yet
Amazon Data Warehouse
21 pages
INTRODUCTION Railway Reservation
No ratings yet
INTRODUCTION Railway Reservation
61 pages
4-3 Ambler - Ambler - UML - Persistence
No ratings yet
4-3 Ambler - Ambler - UML - Persistence
10 pages
CODR-OP-01 OP For Control of Documents & Records (IMS)
No ratings yet
CODR-OP-01 OP For Control of Documents & Records (IMS)
8 pages
U09a1 GRAPHICAL INFORMATION Hal Hagood
No ratings yet
U09a1 GRAPHICAL INFORMATION Hal Hagood
16 pages
Excel Unit 3 Advanced Filter and Conditional Formatting (Autosaved)
No ratings yet
Excel Unit 3 Advanced Filter and Conditional Formatting (Autosaved)
14 pages

Fundamentals of Data Science

Uploaded by

Fundamentals of Data Science

Uploaded by

Fundamentals of Data Science

Chapter 1: Definition of Data Science

Chapter 2: Basic Terminology

Basic terminology in data science includes:

- Dataset: A collection of data.

- Feature: A variable or attribute used in analysis.

- Label: The target variable in supervised learning.

- Algorithm: A procedure or formula for solving a problem.

- Model: The representation produced by training an algorithm on data.

Chapter 3: Venn Diagram of Data Science

1. Computer Science (Programming and Software Engineering)

2. Mathematics & Statistics (Inference and Data Analysis)

3. Domain Expertise (Subject Matter Knowledge)

The center of this intersection is data science.

Chapter 4: Types of Data

1. Structured Data: Organized in rows and columns (e.g., SQL databases).

2. Unstructured Data: No pre-defined format (e.g., text, images, videos).

Quantitative vs Qualitative Data:

- Quantitative: Numerical, measurable data (e.g., height, weight).

- Qualitative: Descriptive data (e.g., gender, color, opinion).

Chapter 5: The Four Levels of Data

The Four Levels of Data:

1. Nominal: Categorical without order (e.g., gender, color).

2. Ordinal: Categorical with order (e.g., ratings, education level).

3. Interval: Numerical without a true zero (e.g., temperature in Celsius).

4. Ratio: Numerical with a true zero (e.g., height, weight).

Chapter 6: Five Steps of the Data Science Process

Five Steps of the Data Science Process:

1. Data Collection: Gathering data from various sources.

2. Data Cleaning: Fixing or removing incorrect, incomplete, or duplicate data.

3. Data Exploration: Understanding patterns and distributions.

4. Modeling: Applying algorithms to build predictive models.

5. Deployment and Communication: Sharing results and deploying models.

Chapter 7: Data Science Classification

classes using supervised learning techniques such as:

- Support Vector Machines (SVM)

Chapter 8: Data Science Algorithms

Common data science algorithms include:

- Linear and Logistic Regression

- Decision Trees and Random Forests

- K-Nearest Neighbors (KNN)

- Support Vector Machines (SVM)

- Principal Component Analysis (PCA)

Chapter 9: Components of Data Science

Components of Data Science:

Chapter 10: Role of a Data Scientist

Role of a Data Scientist:

- Gather and preprocess data

- Analyze and interpret complex data

- Develop models and algorithms

- Communicate results to stakeholders

- Collaborate with domain experts and software engineers

You might also like