Assignment 2

The assignment involves implementing Principal Component Analysis (PCA) and Linear Discriminant Analysis (LDA) for dimensionality reduction and feature extraction on a dataset. The results show that LDA outperforms PCA in classification accuracy, achieving 100% compared to PCA's 95.56%, highlighting LDA's effectiveness in maximizing class separability. The analysis concludes that while PCA is beneficial for unsupervised learning, LDA is preferable for supervised classification tasks.

Uploaded by

Yash Shirsat

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

8 views4 pages

Assignment 2

Uploaded by

Yash Shirsat

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 4

Assignment No: 2

Student Name: Satyajit Shinde

PRN No.: 12211701

Roll No: 41

Class: TY AI C

Problem Statement: Implement Principal Component Analysis (PCA) and

Linear Discriminant Analysis (LDA) for dimensionality reduction and feature
extraction in a given dataset. The objective is to compare their effectiveness
in improving classification performance while reducing computational
complexity. PCA will be used for unsupervised feature reduction by capturing
maximum variance, whereas LDA will be applied for supervised
dimensionality reduction by maximizing class separability. Evaluate their
impact on model performance using appropriate classification algorithms and
metrics such as accuracy, precision, and recall. Provide a detailed analysis of
how each technique transforms the dataset and affects the classification
results.

Code:

import numpy as np
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis as
LDA
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.datasets import load_iris
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, precision_score,
recall_score

# Load dataset
data = load_iris()
X = data.data # Features
y = data.target # Labels

# Standardize features
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
# Split dataset
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y,
test_size=0.3, random_state=42)

# Apply PCA
pca = PCA(n_components=2)
X_train_pca = pca.fit_transform(X_train)
X_test_pca = pca.transform(X_test)

# Apply LDA
lda = LDA(n_components=2)
X_train_lda = lda.fit_transform(X_train, y_train)
X_test_lda = lda.transform(X_test)

# Train KNN on PCA-reduced data

knn = KNeighborsClassifier(n_neighbors=5)
knn.fit(X_train_pca, y_train)
y_pred_pca = knn.predict(X_test_pca)

# Evaluate PCA results

accuracy_pca = accuracy_score(y_test, y_pred_pca)
precision_pca = precision_score(y_test, y_pred_pca, average='macro')
recall_pca = recall_score(y_test, y_pred_pca, average='macro')

# Train KNN on LDA-reduced data

knn.fit(X_train_lda, y_train)
y_pred_lda = knn.predict(X_test_lda)

# Evaluate LDA results

accuracy_lda = accuracy_score(y_test, y_pred_lda)
precision_lda = precision_score(y_test, y_pred_lda, average='macro')
recall_lda = recall_score(y_test, y_pred_lda, average='macro')

# Print results
print("PCA Results:")
print(f"Accuracy: {accuracy_pca:.4f}, Precision: {precision_pca:.4f},
Recall: {recall_pca:.4f}")

print("LDA Results:")
print(f"Accuracy: {accuracy_lda:.4f}, Precision: {precision_lda:.4f},
Recall: {recall_lda:.4f}")

# Plot PCA vs LDA projections

plt.figure(figsize=(12, 5))

# PCA Projection Plot

plt.subplot(1, 2, 1)
plt.scatter(X_train_pca[:, 0], X_train_pca[:, 1], c=y_train,
cmap='viridis', edgecolor='k')
plt.title("PCA: Data Projection")
plt.xlabel("Principal Component 1")
plt.ylabel("Principal Component 2")

# LDA Projection Plot

plt.subplot(1, 2, 2)
plt.scatter(X_train_lda[:, 0], X_train_lda[:, 1], c=y_train,
cmap='viridis', edgecolor='k')
plt.title("LDA: Data Projection")
plt.xlabel("LD 1")
plt.ylabel("LD 2")

plt.show()

Output:

Impact of PCA and LDA on Model Performance:

PCA and LDA are dimensionality reduction techniques with different goals—PCA captures maximum
variance without considering class labels, while LDA maximizes class separability. When applying
KNN to the transformed data, PCA achieved 95.56% accuracy, whereas LDA reached 100% accuracy,
showing that LDA is more effective for classification tasks. PCA's transformation may cause class
overlap, reducing classification performance, while LDA ensures well-separated clusters for better
accuracy. PCA is useful for unsupervised learning and feature reduction, but LDA is the better
choice for supervised classification tasks where class distinction is crucial.

Unit-2 Advanced Concepts of Modeling in AI - Question Answers
No ratings yet
Unit-2 Advanced Concepts of Modeling in AI - Question Answers
8 pages
UNIT-4 Machine Learning
No ratings yet
UNIT-4 Machine Learning
20 pages
PCA Quiz
No ratings yet
PCA Quiz
8 pages
Exp 15
No ratings yet
Exp 15
12 pages
Soft Computing Complete
No ratings yet
Soft Computing Complete
185 pages
A Recurrent Neural Network
No ratings yet
A Recurrent Neural Network
22 pages
j2020 A Survey of The Usages of Deep Learning For Natural Language Processing
No ratings yet
j2020 A Survey of The Usages of Deep Learning For Natural Language Processing
21 pages
Dimension Reductio - LDA
No ratings yet
Dimension Reductio - LDA
19 pages
ML Unit 2 CLS Notes
No ratings yet
ML Unit 2 CLS Notes
38 pages
Principal Component Analysis Python
No ratings yet
Principal Component Analysis Python
7 pages
Unit 3
No ratings yet
Unit 3
21 pages
Pprint ML
No ratings yet
Pprint ML
22 pages
Assignment 4
No ratings yet
Assignment 4
46 pages
Exp7
No ratings yet
Exp7
7 pages
Pca
No ratings yet
Pca
7 pages
Unit 5
No ratings yet
Unit 5
13 pages
Principal Component Analysis (PCA) and Linear Discriminant Analysis For Image Recognition
No ratings yet
Principal Component Analysis (PCA) and Linear Discriminant Analysis For Image Recognition
17 pages
Linear (PCA, LDA) and Manifolds
No ratings yet
Linear (PCA, LDA) and Manifolds
15 pages
Lecture W12ab
No ratings yet
Lecture W12ab
60 pages
It ML Unit 4 Notes Final
No ratings yet
It ML Unit 4 Notes Final
21 pages
PCALDAICA
No ratings yet
PCALDAICA
28 pages
ML 6
No ratings yet
ML 6
7 pages
Principal Component Analysis
No ratings yet
Principal Component Analysis
19 pages
Sanjey RS Lab
No ratings yet
Sanjey RS Lab
33 pages
ML Unit 3
No ratings yet
ML Unit 3
29 pages
Notes Chapter Neural Networks
No ratings yet
Notes Chapter Neural Networks
18 pages
AbhishekYadav Assignment 02
No ratings yet
AbhishekYadav Assignment 02
24 pages
Pca Lda Lobo
No ratings yet
Pca Lda Lobo
20 pages
کتاب نهم بارگزاری شده
No ratings yet
کتاب نهم بارگزاری شده
55 pages
Feature Engineering
No ratings yet
Feature Engineering
51 pages
Week 8 Notes - DM
No ratings yet
Week 8 Notes - DM
26 pages
Assignment 2 Documentation
No ratings yet
Assignment 2 Documentation
15 pages
CRT2 LDA Assignment
No ratings yet
CRT2 LDA Assignment
4 pages
Assignment 1
No ratings yet
Assignment 1
5 pages
Ann Assignmeent 1,2,3
No ratings yet
Ann Assignmeent 1,2,3
23 pages
Strangers
No ratings yet
Strangers
8 pages
Machine Learning (CSO851) - Lecture 03
No ratings yet
Machine Learning (CSO851) - Lecture 03
71 pages
Program - 3
No ratings yet
Program - 3
4 pages
21ITV103
No ratings yet
21ITV103
3 pages
028 ML Assignment
No ratings yet
028 ML Assignment
5 pages
PDSLab Manual EXP7
No ratings yet
PDSLab Manual EXP7
6 pages
Principal Component Analysis
No ratings yet
Principal Component Analysis
8 pages
PA
No ratings yet
PA
8 pages
A Comparative Study of Face Recognition Classification Algorithms
No ratings yet
A Comparative Study of Face Recognition Classification Algorithms
7 pages
14 Linear Discriminant Analysis 05-09-2024
No ratings yet
14 Linear Discriminant Analysis 05-09-2024
3 pages
Iris Dataset PCA Analysis Code
No ratings yet
Iris Dataset PCA Analysis Code
21 pages
Convolutional Neural Networks
No ratings yet
Convolutional Neural Networks
21 pages
PCA for Data Scientists
No ratings yet
PCA for Data Scientists
20 pages
Week6 - Colab
No ratings yet
Week6 - Colab
3 pages
PCA PDF 1646672241
No ratings yet
PCA PDF 1646672241
11 pages
Slip Clustering
No ratings yet
Slip Clustering
2 pages
B22EE010 Report
No ratings yet
B22EE010 Report
9 pages
Weekly Homework X
No ratings yet
Weekly Homework X
15 pages
Kinya Sharon - Ass2 - Machine Learning
No ratings yet
Kinya Sharon - Ass2 - Machine Learning
12 pages
Dimensionality Reduction in Python
No ratings yet
Dimensionality Reduction in Python
4 pages
7034 1713335587607 Dimensionality - Reduction - Ipynb Colaboratory
No ratings yet
7034 1713335587607 Dimensionality - Reduction - Ipynb Colaboratory
4 pages
Assignment 4
No ratings yet
Assignment 4
5 pages
PCA & LDA for Engineering Students
No ratings yet
PCA & LDA for Engineering Students
5 pages
ML LAB - Principal Component Analysis
No ratings yet
ML LAB - Principal Component Analysis
3 pages
ML
No ratings yet
ML
7 pages
K. J. Somaiya College of Engineering, Mumbai-77: Title: Implementation of Principal Component Analysis
No ratings yet
K. J. Somaiya College of Engineering, Mumbai-77: Title: Implementation of Principal Component Analysis
2 pages
LDA in Python: Machine Learning Lab
No ratings yet
LDA in Python: Machine Learning Lab
12 pages
11 Most Common Machine Learning Algorithms Explained in A Nutshell by Soner Yıldırım Towards Data Science
No ratings yet
11 Most Common Machine Learning Algorithms Explained in A Nutshell by Soner Yıldırım Towards Data Science
16 pages
07 Clustering
No ratings yet
07 Clustering
34 pages
Dimensionality Reduction Explained
No ratings yet
Dimensionality Reduction Explained
60 pages
Unit 5
No ratings yet
Unit 5
35 pages
Yash Shirsat: Introduction To Software Engineering
No ratings yet
Yash Shirsat: Introduction To Software Engineering
1 page
Fem2063 Data Analytics - May 2020 Lab Practice 5 (Week 6)
No ratings yet
Fem2063 Data Analytics - May 2020 Lab Practice 5 (Week 6)
8 pages
Mercedes-Benz Greener Manufacturing Ai
0% (1)
Mercedes-Benz Greener Manufacturing Ai
16 pages
Lecture 16 - 25.09.2024 - PCA, Unsupervised Learning-Clustring & Metrics
No ratings yet
Lecture 16 - 25.09.2024 - PCA, Unsupervised Learning-Clustring & Metrics
51 pages
Machine Learning Basics Guide
No ratings yet
Machine Learning Basics Guide
27 pages
UNIT5
No ratings yet
UNIT5
60 pages
Deep Learning Revision Guide
No ratings yet
Deep Learning Revision Guide
6 pages
Unit 3
No ratings yet
Unit 3
21 pages
Feature Extraction
No ratings yet
Feature Extraction
3 pages
Class8-9 DataPreprocessing DataReduction 30Sept-05Oct2020
No ratings yet
Class8-9 DataPreprocessing DataReduction 30Sept-05Oct2020
22 pages
NN Examples
No ratings yet
NN Examples
91 pages
Copy of Green Modern Futuristic Artificial Intelligence Presentation
No ratings yet
Copy of Green Modern Futuristic Artificial Intelligence Presentation
11 pages
fl6j5098ufDL ASS4 43
No ratings yet
fl6j5098ufDL ASS4 43
6 pages
ZH 2 X 0 K 42 Pmdocx
No ratings yet
ZH 2 X 0 K 42 Pmdocx
2 pages
Assignment 3
No ratings yet
Assignment 3
5 pages
LSTM Architecture Presentation
No ratings yet
LSTM Architecture Presentation
18 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
36 pages
Be Central
No ratings yet
Be Central
98 pages
Lecture 6
No ratings yet
Lecture 6
55 pages
Lecture 6 - Convolution Neural Network (CNN)
No ratings yet
Lecture 6 - Convolution Neural Network (CNN)
26 pages
GenAI Workshop Schedule
No ratings yet
GenAI Workshop Schedule
4 pages
Intrusion Detection via Decision Trees
No ratings yet
Intrusion Detection via Decision Trees
7 pages
Deepfake Video Detection System Using Deep Neural Networks
No ratings yet
Deepfake Video Detection System Using Deep Neural Networks
6 pages
Time Series Data Imputation - A Survey On Deep Learning Approaches
No ratings yet
Time Series Data Imputation - A Survey On Deep Learning Approaches
9 pages
Assignmnet 1 CSE441 16100199
No ratings yet
Assignmnet 1 CSE441 16100199
5 pages
Data Science Q&A - Latest Ed (2020) - 1 - 2
No ratings yet
Data Science Q&A - Latest Ed (2020) - 1 - 2
2 pages
CNNs vs RNNs: Key Differences & Uses
No ratings yet
CNNs vs RNNs: Key Differences & Uses
2 pages
LDA for Binary Classification
No ratings yet
LDA for Binary Classification
12 pages