0% found this document useful (0 votes)

11 views5 pages

CAT1 Foundation of Data Science

This document outlines the examination structure for the B.E./B.Tech. Degree CAT-I Examination in March 2025 at the Peri Institute of Technology, detailing the subjects, marks distribution, and question types. It includes multiple-choice questions, short answer questions, and detailed essay questions related to data science concepts and practices. Additionally, it provides instructions for question paper preparation, including formatting and cognitive levels as per Bloom's taxonomy.

Uploaded by

nagarajduraivel

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

11 views5 pages

CAT1 Foundation of Data Science

Uploaded by

nagarajduraivel

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 5

A

Set. No.
PERI INSTITUTE OF TECHNOLOGY (AUTONOMOUS)
Mannivakkam, Chennai-48.
B.E./B.Tech. DEGREE CAT -I EXAMINATION MARCH 2025
DEPARTMENT OF CIVIL/CSE/EEE/ECE/MECH/IT/AI&DS/CSBS/AIML/CYS
Regulations 2024
Semester:
Date:
Subject Code:
Time: Three Hours
Subject Name:
Maximum Marks: 100
Answer all Questions
PART-A (16 x 1=16 Marks)
(Multiple Choice)
PART-A(16*1=16Marks)
CO CL
What is the first stage in a typical data science project lifecycle?
A) Modeling
1 B) Data Cleaning CO1
C) Problem Definition
D) Deployment
Which of the following is a NoSQL database?
A) MySQL
2 B) PostgreSQL CO1
C) MongoDB
D) SQLite
In data science, which role is primarily responsible for deploying
machine learning models into production?
A) Data Analyst
3 B) Business Analyst
CO1
C) Machine Learning Engineer
D) Database Administrator
What is the use of the SQL JOIN operation?
A) Deletes duplicate records
4 B) Merges data from two or more tables CO1
C) Updates a table structure
D) Adds indexes to a table
Which format is commonly used to store structured data in tabular
form?
5 A) .txt CO1
B) .json
C) .csv
D) .mp4
What is the purpose of data sampling in data science?
A) To increase the size of the dataset
6 B) To clean the data CO1
C) To reduce data volume while maintaining representativeness
D) To convert data into NoSQL
Which of the following is NOT a phase in the data science process?
A) Data Collection
7 B) Data Compilation CO2
C) Data Modeling
D) Deployment

Sub Code : Page 1 of 5

What is data cleaning primarily used for?
A) To generate new data
8 B) To remove errors and inconsistencies CO2
C) To transform data into audio format
D) To visualize data
What is the main purpose of Exploratory Data Analysis (EDA)?
A) To deploy a model
9 B) To clean the data CO2
C) To understand patterns and relationships in the data
D) To encode variables
Which of the following is a visualization tool used in EDA?
A) Naive Bayes
10 B) Box Plot CO2
C) Principal Component
D) Linear Regression
Which Python library is widely used for data visualization in EDA?
A) NumPy
11 B) TensorFlow CO2
C) Seaborn
D) Scikit-learn
In a dataset, skewness indicates:
A) The number of rows
12 B) The symmetry of the distribution CO3
C) The variance of the mean
D) The number of unique values
Which transformation technique is used to normalize data between 0
and 1?
13 A) One-Hot Encoding CO3
B) Standardization
C) Min-Max Scaling
D) Log Transformation
What does reshaping data involve in EDA?
A) Cleaning dirty data
14 B) Changing the structure of the dataset CO3
C) Visualizing trends
D) Removing null values
Which of the following is an example of a classical statistical method?
A) Decision Tree
15 B) Hypothesis Testing CO3
C) Deep Learning
D) Clustering
In EDA, what is the purpose of a heatmap?
A) To clean the data
16 B) To show correlation between variables CO3
C) To calculate averages
D) To convert data into audio
PART- B (12*2=24 Marks)
CO CL
17 Define data science CO1
18 List any two roles in a data science project. CO1

19 Mention any two stages in a data science project lifecycle. CO1

20 What is the difference between structured and unstructured data? CO1

21 Name any two file formats commonly used to store data. CO2
Sub Code : Page 2 of 5
22 Write any two SQL commands used to interact with relational databases. CO2

23 What is data cleaning? Mention one technique. CO2

24 What is NoSQL? Give one example of a NoSQL database. CO2

25 What is the purpose of exploratory data analysis (EDA)? CO3

26 List any two visual tools used in EDA. CO3

27 Differentiate between EDA and classical statistical analysis. CO3

28 Mention any two Python libraries used for EDA. CO3

PART- C (6*10=60 Marks)

Mark CO CL
s
Explain the data science process in detail. Describe each stage with
(a) suitable examples.
CO1

29 [OR]
Discuss the different roles involved in a data science project. How do
(b) they collaborate during a project lifecycle?
CO1
Describe the process of working with data from files and relational
(a) databases. Illustrate with examples using Python or SQL.
CO1

[OR]
30 Explain the process of choosing and evaluating machine learning
models. Discuss how different models such as K-means, Naïve Bayes,
(b) and Linear Regression are selected based on the nature of the
CO1
problem. Also, elaborate on how these models are validated..
What are the common data cleaning techniques used in data
(a) science? Explain how sampling helps in model validation.
CO2

31 [OR]
Compare and contrast structured databases (relational) with NoSQL
(b) databases. Discuss the types and use cases of NoSQL.
CO2
Write a detailed note on data management practices in a data
(a) science workflow. Why is managing data efficiently important?
CO2

32 [OR]
Define Exploratory Data Analysis (EDA). Explain its significance and
(b) how it differs from classical and Bayesian analysis.
CO2
Discuss various data visualization techniques used in EDA. Support
(a) your answer with examples and plots.
CO3

33 [OR]
Describe the steps involved in performing EDA using Python. Mention
(b) important libraries and functions.
CO3
Explain various data transformation techniques used in EDA, such as
(a) merging, reshaping, pivoting, and encoding. Provide code examples if CO3
possible.
[OR]
34
Discuss in detail the various model evaluation methods used for
clustering models. Explain the working of the K-means algorithm and
(b) compare it with other unsupervised methods. Also, discuss the CO3
differences between memorization methods and generalization
methods in machine learning..
Sub Code : Page 3 of 5
Instruction for Question paper preparation:
 All the questions to be in Book Antiqua with font size 12.
 Line spacing: 1.15
 Keep the images at the center and use high quality line diagrams only.
 CL – Cognitive level as per revised Blooms taxonomy.
R-Remember, U-Understand, Ap-Apply, An-Analyze, E-Evaluate, C-Create
 CO – Course Outcome.

Sub Code : Page 4 of 5

Sub Code : Page 5 of 5

SURT Service Manual - RMA - Rev3b
91% (11)
SURT Service Manual - RMA - Rev3b
43 pages
Dse Q B
No ratings yet
Dse Q B
13 pages
DS-IAE 1 QP Set 1-1
No ratings yet
DS-IAE 1 QP Set 1-1
2 pages
DS MCQ Semester Suggesstion
No ratings yet
DS MCQ Semester Suggesstion
26 pages
Data Analytics Course Handout
No ratings yet
Data Analytics Course Handout
7 pages
Data Warehousing&Data Mining AMTCSE0114
No ratings yet
Data Warehousing&Data Mining AMTCSE0114
3 pages
0.extracted Pages 20MCA201 From 2020 MCA S3 S4
No ratings yet
0.extracted Pages 20MCA201 From 2020 MCA S3 S4
18 pages
Data Science and ML-KTU
No ratings yet
Data Science and ML-KTU
11 pages
Data Mining and Data Warehousing 2023
No ratings yet
Data Mining and Data Warehousing 2023
2 pages
Model Question Paper With Effect From 2021 (CBCS Scheme) : Data Science and Visualization
No ratings yet
Model Question Paper With Effect From 2021 (CBCS Scheme) : Data Science and Visualization
29 pages
11 AI W6 - Data Literacy
No ratings yet
11 AI W6 - Data Literacy
2 pages
DSF Model Question
No ratings yet
DSF Model Question
2 pages
FDS Internal Exam QP 1 (Set 2)
No ratings yet
FDS Internal Exam QP 1 (Set 2)
2 pages
II CSE - A&B (96) DS-int 1 QP ANS-set1
No ratings yet
II CSE - A&B (96) DS-int 1 QP ANS-set1
7 pages
Big Data Analytics Syllabus
No ratings yet
Big Data Analytics Syllabus
9 pages
CS3502
No ratings yet
CS3502
5 pages
Question Bank With Answers
No ratings yet
Question Bank With Answers
103 pages
KIT 601 - DA PUE - Question Paper - Updated
No ratings yet
KIT 601 - DA PUE - Question Paper - Updated
2 pages
Data Science Naga QB
No ratings yet
Data Science Naga QB
23 pages
Model Exam Question Paper (Set1, Set2) Format
No ratings yet
Model Exam Question Paper (Set1, Set2) Format
5 pages
Data Science Exam Solution
No ratings yet
Data Science Exam Solution
12 pages
2023 May 18CSE396T
No ratings yet
2023 May 18CSE396T
2 pages
Syllabus Sem 6
No ratings yet
Syllabus Sem 6
6 pages
Data Processing SS 3 First Term 2022 - 2023 Examination
No ratings yet
Data Processing SS 3 First Term 2022 - 2023 Examination
3 pages
Cs3352 - Foundation of Data Science
No ratings yet
Cs3352 - Foundation of Data Science
56 pages
Data Analysis
No ratings yet
Data Analysis
8 pages
DSF Set A
No ratings yet
DSF Set A
2 pages
IIPU UnitTest CS 70MarksJune2025-1
No ratings yet
IIPU UnitTest CS 70MarksJune2025-1
3 pages
Perform Association Mining and Analyze Clusters Using Different Methods
No ratings yet
Perform Association Mining and Analyze Clusters Using Different Methods
90 pages
01.ad3491 Fdsa QB
No ratings yet
01.ad3491 Fdsa QB
16 pages
Set. No - 1 P18PECS031-Data Preparation and Analysis QP - PH.D.
No ratings yet
Set. No - 1 P18PECS031-Data Preparation and Analysis QP - PH.D.
22 pages
Edit Ds
No ratings yet
Edit Ds
37 pages
DSF Set B
No ratings yet
DSF Set B
2 pages
Syllabus 1
No ratings yet
Syllabus 1
13 pages
2ndtermexam Mathyr10
No ratings yet
2ndtermexam Mathyr10
7 pages
Question Bank For All 5 Units: Department of Computer Science and Engineering & Department of Information Technology
No ratings yet
Question Bank For All 5 Units: Department of Computer Science and Engineering & Department of Information Technology
14 pages
DSML Question Bank
No ratings yet
DSML Question Bank
31 pages
II CSE CS3352 FDS QB Unit1
No ratings yet
II CSE CS3352 FDS QB Unit1
4 pages
RMK Group Data Analytics Guide
No ratings yet
RMK Group Data Analytics Guide
150 pages
Foundations of Data Science
No ratings yet
Foundations of Data Science
139 pages
Data Science
No ratings yet
Data Science
10 pages
FDS QB
No ratings yet
FDS QB
21 pages
Data Science & Python Syllabus 2022-24
No ratings yet
Data Science & Python Syllabus 2022-24
9 pages
Dpa-Set - A
No ratings yet
Dpa-Set - A
29 pages
Data Science Model 1 Ques
No ratings yet
Data Science Model 1 Ques
2 pages
DataScience and Database Lab Syllabus
No ratings yet
DataScience and Database Lab Syllabus
5 pages
FODS Prevoius Paper
No ratings yet
FODS Prevoius Paper
4 pages
11 Chemistry
No ratings yet
11 Chemistry
10 pages
Assignment Questions II CSE B
No ratings yet
Assignment Questions II CSE B
1 page
TYCS - SEM6 - Data Science
No ratings yet
TYCS - SEM6 - Data Science
7 pages
2023 Dec18CSE396T
No ratings yet
2023 Dec18CSE396T
4 pages
Data Science Syllabus
No ratings yet
Data Science Syllabus
3 pages
DMV Lab Manual
No ratings yet
DMV Lab Manual
45 pages
Class Ix Ai Sample Paper Annual Examination
No ratings yet
Class Ix Ai Sample Paper Annual Examination
6 pages
Cd363ia - Dav Model QP
No ratings yet
Cd363ia - Dav Model QP
3 pages
Unit 3
No ratings yet
Unit 3
99 pages
DATA PROCESSING-ss1.... Ss3ce
No ratings yet
DATA PROCESSING-ss1.... Ss3ce
10 pages
Business Action Plan Template PDF
No ratings yet
Business Action Plan Template PDF
8 pages
Vacant Positions For Tamil Nadu, Tnega: 1. Enterprise Architect
No ratings yet
Vacant Positions For Tamil Nadu, Tnega: 1. Enterprise Architect
22 pages
25 Zero Investment Business Ideas
No ratings yet
25 Zero Investment Business Ideas
109 pages
Exam Data Prep for Centre Staff
No ratings yet
Exam Data Prep for Centre Staff
7 pages
Network Redundancy with STP
No ratings yet
Network Redundancy with STP
39 pages
Learning Guide: Tour Service Level III
No ratings yet
Learning Guide: Tour Service Level III
35 pages
Apache - Kafka Notes
No ratings yet
Apache - Kafka Notes
9 pages
The Handbook To Setting Up A Modern SSC
No ratings yet
The Handbook To Setting Up A Modern SSC
24 pages
S1 Ict End of Year
No ratings yet
S1 Ict End of Year
3 pages
PeopleSoft v9.2 Product Review
No ratings yet
PeopleSoft v9.2 Product Review
163 pages
Thrift Fashion-Website Development-SRS
No ratings yet
Thrift Fashion-Website Development-SRS
7 pages
User Manual Part 2 3260293
No ratings yet
User Manual Part 2 3260293
1 page
LoRa SDR Tool for Satellite IoT
No ratings yet
LoRa SDR Tool for Satellite IoT
6 pages
How To Clip Crop Apply Effect and Merge Video
No ratings yet
How To Clip Crop Apply Effect and Merge Video
7 pages
Huntington University High School Mathematics Competition Competition Information and Sample Problems
No ratings yet
Huntington University High School Mathematics Competition Competition Information and Sample Problems
5 pages
AI Engineer's Career Profile
No ratings yet
AI Engineer's Career Profile
5 pages
MCA 102 End Term 2024-2026
No ratings yet
MCA 102 End Term 2024-2026
2 pages
Intel WiFi Link 6200 622ANHMW Wireless N 300M Half MiniCard
No ratings yet
Intel WiFi Link 6200 622ANHMW Wireless N 300M Half MiniCard
5 pages
Mini Hi-Fi Component System: MHC-RV6/RV5
No ratings yet
Mini Hi-Fi Component System: MHC-RV6/RV5
44 pages
Sequential Circuits
No ratings yet
Sequential Circuits
19 pages
PCI Express Validation with IFV
No ratings yet
PCI Express Validation with IFV
12 pages
One Thing You Must Know Before Using EZ-FLASH OMEGA Definitive Edition
No ratings yet
One Thing You Must Know Before Using EZ-FLASH OMEGA Definitive Edition
14 pages
Local Media4517619182949719879
No ratings yet
Local Media4517619182949719879
14 pages
Backup and Recovery Policy
No ratings yet
Backup and Recovery Policy
10 pages
AD 01 Intro To System Analysis N Design
No ratings yet
AD 01 Intro To System Analysis N Design
40 pages
05 Programmer's Reference, With Instructions On How To Execute The Program
No ratings yet
05 Programmer's Reference, With Instructions On How To Execute The Program
43 pages
Carrier Objective: Linkedin
No ratings yet
Carrier Objective: Linkedin
3 pages
Session 1 and 2 Course Overview and Intro To R
No ratings yet
Session 1 and 2 Course Overview and Intro To R
147 pages
Computer Architecture & Related Topics: Ben Schrooten Shawn Borchardt, Eddie Willett Vandana Chopra
No ratings yet
Computer Architecture & Related Topics: Ben Schrooten Shawn Borchardt, Eddie Willett Vandana Chopra
88 pages

CAT1 Foundation of Data Science

Uploaded by

CAT1 Foundation of Data Science

Uploaded by

A

Sub Code : Page 1 of 5

19 Mention any two stages in a data science project lifecycle. CO1

20 What is the difference between structured and unstructured data? CO1

23 What is data cleaning? Mention one technique. CO2

24 What is NoSQL? Give one example of a NoSQL database. CO2

25 What is the purpose of exploratory data analysis (EDA)? CO3

26 List any two visual tools used in EDA. CO3

27 Differentiate between EDA and classical statistical analysis. CO3

28 Mention any two Python libraries used for EDA. CO3

PART- C (6*10=60 Marks)

Sub Code : Page 4 of 5

You might also like