ML - Assignment Advanced

A sample of advanced machine learning assignment.

Uploaded by

Jutt Sahib

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

13 views2 pages

ML - Assignment Advanced

A sample of advanced machine learning assignment.

Uploaded by

Jutt Sahib

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

Assignment: End-to-End Machine

Learning Pipeline
Objective
Apply everything you have learned so far to build a complete machine learning pipeline —
from raw data to model evaluation.

Dataset
Download the dataset from Kaggle. Don’t use any built-in library datasets, such as those
from scikit-learn or seaborn.

🔹 Assignment Tasks

1. Data Handling (NumPy & Pandas)

• Load dataset into a Pandas DataFrame.
• Perform initial checks.
• Handle missing values and duplicates.
• Convert categorical features into numerical form if needed.

2. Exploratory Data Analysis (EDA)

• Use NumPy & Pandas for basic statistics.
• Visualize data using:
- Matplotlib / Seaborn
- Plotly: at least one interactive plot (e.g., scatter or bar chart).

3. Feature Engineering
• Split dataset into features (X) and target (y).
• Normalize/scale data if necessary.
• Perform train-test split.

4. Model Training
• Train the following models:
• - KNN Classifier
• - Decision Tree Classifier
• - Random Forest Classifier
• Compare baseline results.
5. Feature Importance
• Extract and visualize feature importance from Random Forest.
• Discuss which features contribute most to predictions.

6. Hyperparameter Tuning
• Use RandomizedSearchCV to optimize hyperparameters:
• - KNN → n_neighbors, weights, metric
• - Decision Tree → max_depth, min_samples_split
• - Random Forest → n_estimators, max_depth, min_samples_split
• Compare default vs tuned models.

7. Model Evaluation
• Evaluate models using:
• - Accuracy
• - Precision, Recall, F1-score
• - Confusion Matrix
• Plot ROC Curve for the best-performing model.

8. Conclusion
• Which model performed best and why?
• Which features were most important?
• How did hyperparameter tuning improve results?

Deliverables
1. Jupyter Notebook with well-commented code and results.
2. Report (2–3 pages) summarizing:
- Dataset insights
- Visualization findings
- Model comparison table
- Key conclusions

Kaggle Course Notes
No ratings yet
Kaggle Course Notes
87 pages
Sentiment Analysis On Tweets
No ratings yet
Sentiment Analysis On Tweets
2 pages
AI Course Experiments Certificate
No ratings yet
AI Course Experiments Certificate
69 pages
ML Fat
No ratings yet
ML Fat
9 pages
New Chat: 1. Predicting Uber Ride Prices
No ratings yet
New Chat: 1. Predicting Uber Ride Prices
16 pages
Top Datasets for Data Science
100% (1)
Top Datasets for Data Science
9 pages
Machine Learning Project Guide
No ratings yet
Machine Learning Project Guide
9 pages
Advanced Feature Engineering and Data Preprocessing in Machine Learning
No ratings yet
Advanced Feature Engineering and Data Preprocessing in Machine Learning
7 pages
QB 1
No ratings yet
QB 1
11 pages
Machine Learning Data Prep Guide
No ratings yet
Machine Learning Data Prep Guide
17 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
22 pages
AIML 7 To 11
No ratings yet
AIML 7 To 11
7 pages
FIND-S Algorithm Implementation
No ratings yet
FIND-S Algorithm Implementation
51 pages
ML Pipeline
No ratings yet
ML Pipeline
6 pages
A3 Classification and Feature Engineering
No ratings yet
A3 Classification and Feature Engineering
2 pages
Module 4 - Supervised Learning - First ML Model
No ratings yet
Module 4 - Supervised Learning - First ML Model
23 pages
Jupyter Lab
No ratings yet
Jupyter Lab
42 pages
Tushar ML
No ratings yet
Tushar ML
52 pages
Capstone Project - Jaro-Prof. Babji
No ratings yet
Capstone Project - Jaro-Prof. Babji
5 pages
ML Theory
No ratings yet
ML Theory
5 pages
AttiqAhmadAfsar Lab 13
No ratings yet
AttiqAhmadAfsar Lab 13
5 pages
Final Report
No ratings yet
Final Report
17 pages
MlLabManualdocx 2024 09 04 22 02 58
No ratings yet
MlLabManualdocx 2024 09 04 22 02 58
19 pages
Rain Prediction Using Random Forest
No ratings yet
Rain Prediction Using Random Forest
30 pages
AI
No ratings yet
AI
16 pages
Final Assignment
No ratings yet
Final Assignment
2 pages
Python Essential Methods in Machine Learning
No ratings yet
Python Essential Methods in Machine Learning
6 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
23 pages
Mlfile
No ratings yet
Mlfile
33 pages
Practical Assignment. Applying Methods of Machine Learning With Example
No ratings yet
Practical Assignment. Applying Methods of Machine Learning With Example
2 pages
Practical Exam AI
No ratings yet
Practical Exam AI
3 pages
ML Manual
No ratings yet
ML Manual
24 pages
Assignment 2
No ratings yet
Assignment 2
3 pages
Predictive Maintenance for Wind Turbines
No ratings yet
Predictive Maintenance for Wind Turbines
5 pages
ML Lab-1
No ratings yet
ML Lab-1
32 pages
27 KrishParasShah
No ratings yet
27 KrishParasShah
17 pages
Assignment 7
No ratings yet
Assignment 7
3 pages
Machine Learning
No ratings yet
Machine Learning
16 pages
Machine Learning Project Guide
No ratings yet
Machine Learning Project Guide
3 pages
1data Preprocessing
No ratings yet
1data Preprocessing
4 pages
Car Mock - ML Ans
No ratings yet
Car Mock - ML Ans
6 pages
Module 5.pptx - 20250608 - 201231 - 0000
No ratings yet
Module 5.pptx - 20250608 - 201231 - 0000
43 pages
ML Viva Practice (Answers)
No ratings yet
ML Viva Practice (Answers)
4 pages
AML ML Practical List
No ratings yet
AML ML Practical List
10 pages
ML Index Nancy
No ratings yet
ML Index Nancy
3 pages
ML Presubmission Guidelines
No ratings yet
ML Presubmission Guidelines
2 pages
Lab Module 1 - End To End ML Project
No ratings yet
Lab Module 1 - End To End ML Project
2 pages
Index
No ratings yet
Index
2 pages
Pa Unit 4
No ratings yet
Pa Unit 4
5 pages
Important Questions
No ratings yet
Important Questions
4 pages
AI Course Help Guide
No ratings yet
AI Course Help Guide
3 pages
DA PRA WEEK 13 (Random Forest) - 054551
No ratings yet
DA PRA WEEK 13 (Random Forest) - 054551
12 pages
What Does This File Say - What Should I Do - I Have
No ratings yet
What Does This File Say - What Should I Do - I Have
14 pages
Fall 2022 - CS619 - 7670
No ratings yet
Fall 2022 - CS619 - 7670
22 pages
ChatGPT Code Interpreter Project Report
No ratings yet
ChatGPT Code Interpreter Project Report
2 pages
End-to-End Machine Learning Project Workflows
No ratings yet
End-to-End Machine Learning Project Workflows
5 pages
Assignment 2
No ratings yet
Assignment 2
3 pages
Python - Assignment Basics
No ratings yet
Python - Assignment Basics
2 pages
Hotel Resevation
No ratings yet
Hotel Resevation
1 page
Japan Travel Plan Itinerary
No ratings yet
Japan Travel Plan Itinerary
1 page
CP4252 Machine Learning Lab Manual
No ratings yet
CP4252 Machine Learning Lab Manual
26 pages

ML - Assignment Advanced

Uploaded by

ML - Assignment Advanced

Uploaded by

Assignment: End-to-End Machine

1. Data Handling (NumPy & Pandas)

2. Exploratory Data Analysis (EDA)

You might also like