0% found this document useful (0 votes)

9 views34 pages

Basic Supervised ML Algorithms

Basic supervised multi level language and its algorithms. It's use and its various functions

Uploaded by

kidsfuntoostv

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

9 views34 pages

Basic Supervised ML Algorithms

Basic supervised multi level language and its algorithms. It's use and its various functions

Uploaded by

kidsfuntoostv

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 34

Basic Supervised Machine

Learning Models
By Dr Shantanu Pathak
Tasks in Supervised Learning
• Classification
• Regression
Classification Task
Classification Task
• Predict a class / label using features/ columns

• Types of Classification in Supervised Learning

• Binary Classification
• Multi-Class Classification
Binary classification
• Only Two classes in output
• Positive class (Represented by 1)
• When test results are positive
• Ex In diabetes detection, when test results are positive, then person has diabetes
• Negative class (Represented by 0)
• When test results are negative
• So, in patient blood report, diabetes detected is positive class and no diabetes
detected is negative class

Ex. In an image Dog is present ?

• Dog present is positive class
• Dog absent is negative class
Multi Class Classification
• More than two classes in output

• Example:
• Predict Breathing problem using X-ray
• Normal
• Asthma
• Covid-19
Classification Models
• Basic Models
• Logistic Regression
• Naïve Bayes
• SVM
• K Nearest Neighbors
• Decision Tree
• Ensemble Learning
• Random Forest (Bagging)
• XG Boost (Boosting)
• Cat Boost (Boosting)
Logistic Regression
Logistic Regression ( logit classifier)
• Used for classification (binary and multi-class) ONLY
• Models linear relation between independent variables to predict a
binary or categorical output.
• Target is to have minimum loss, so it does find the right coefficients by
doing multiple iterations
• Output is in form of probability, between 0 to 1
• Output gives the probability that Y will be class 1
• t = b0 + b1X1 + b2X2 + …. bnXn
• Where b0 is intercept
• b1 to bn are coefficients just like linear regression
• Y = sigmoid(t) = 1 / ( 1 + e ^ (-t) )
• Sigmoid / logistic function converts the real valued t into value between 0 to 1
Logistic / Sigmoid Function
• S-Shaped curve
• Output(y) is always between 0 to 1
• Input(x) can be any value between
–inf to + inf
• Converts real valued input to binary
or in terms of probability

• By Qef (talk) - Created from scratch with gnuplot, Public Domain,

https://commons.wikimedia.org/w/index.php?curid=4310325
Logistic Regression (logit classifier)
•
Logistic Regression Parameters
• Solver = ‘saga’ , ‘liblinear’, ’lbfgs’
• According to Scikit Documentation: The SAGA solver is often the best choice.
• Penalty : l1 , l2, elasticnet
• The ‘liblinear’ solver supports both L1 and L2 regularization
• The Elastic-Net regularization is only supported by the ‘saga’ solver.
• 'saga' supports all penalties
• class_weight: balanced or in dictionary form
• l1_ratio : used when penalty is 'elasticnet'. It tells how much portion will be l1
penalty
• multi_class : Support for multi class classification problem.
• ‘multinominal’ : ‘saga’ solver supports this. It can model multiclass classification directly.
• ‘ovr’ : One vs rest strategy supported by ‘liblinear’ solver

• P(AB) = P(A) * P (B) .. A & B independent

• P(AB) = P(A) * P(B|A) = P(B)*P(A|B)

• When A & B are dependent
Naive Bayes
• Bayesian Model
▪ P(C | x) =

▪ P(C|x) -> Probability of given sample ‘x’ belonging to class ‘C’

▪ P(x) -> Probability of ‘x’ in complete sample space / training data
▪ P(C) -> Probability of ‘C’ in complete sample space / training data
▪ P(x|C) ->Probability of occurrence of ‘x’ when ‘C’ is given in training data
Naive Bayes
• Used for Binary Classification Task ONLY
• Assumption : Input consists of set of independent features / columns
• Bayesian Probabilistic Model is used
• Simple yet effective
• Highly scalable

• Application: Automatic medial case classification / diagnosis

Data : Example of Naive Bayes
Sr No Time(X1) Vehicle Type(X2) Accident(Target/
Y)
1 Early Morning Heavy Yes
2 Early Morning Light No
3 Early Morning Light Yes
4 Early Morning Heavy No
5 Early Morning Heavy Yes
6 Early Morning Heavy No
7 Evening Light Yes
8 Evening Light No
9 Evening Heavy No
10 Evening Heavy Yes
11 Day Time Heavy No
12 Day Time Heavy Yes
13 Day Time Light No
14 Night Light Yes
Probabilities : Example of Naive Bayes
• P(Accident) =0.5 P(No Accident) =0.5

• P(em)=6/14 P(day time)= 3/14

• P(ev)=4/14 P(night)=1/14

• P(light)=6/14 P(heavy)=8/14
Probabilities : Example of Naive Bayes
• P(daytime | Accident) = 1/7
• P(em | Accident) = 3/7
• P(ev | Accident) = 2/7
• P(n | Accident) =1/7

• P(Light | Accident) = 3/7

• P(Light | Accident = ‘No’) = ??

• P(Heavy | Accident = ‘No’) = ??
Example of Naive Bayes
• What is probability of an accident given that its early
morning?
P(Accident|em)=P(em|Accident)P(Accident)/ P(em)
= (3/7 * 7/14 ) /(6/14) = 3/6
P(Accident|DT) = P(DT|Accident)P(Acc)/P(DT)
= (1/7 * 7/14 ) / (3/14) = 1/3
P(Accident | (em,light)) = P(Acc|em) * P(Acc|light)
= 3/6 * 3/6 = 0.25
P(C | (x1,x2,x3 ... xn)) = P(C|x1) * P(C|x2) * ... *P(C|xn)
Types of Naïve Bayes
• Gaussian Naive Bayes
• For numeric data
• For large data
• Multi Nominal Naïve Bayes
• For categorical features like Text data
• Bernoulli's Naïve Bayes
• For Binary Variables

• Application of Naive Bayes / Bayesian Formula

• Incremental Learning
• Probabilistic Reasoning
Support Vector Machine
Support Vector Machines(SVM)
• Used ONLY for Binary Classification or Regression
• It can handle Linear / Non-Linear boundary
• Goal: Find the decision boundary between two classes with maximum
margin
• Margin is based on
Samples close to the
boundary. These
samples are called as
“Support Vectors”
Support Vector Machines(SVM)
• Margin
• Minimum distance between proposed
boundary and closest point(s) from each
class
• Which boundary to choose?
• Single dataset may have multiple
possible boundaries between two classes

• Boundary with maximum margin is most

beneficial

• Such boundary avoids misclassification,

even if there is some deviation in new
data from original data
Support Vector Machines(SVM)
• Binary Classification:
• Points which are on either side of the boundary are given to respective class
• For new point class is predicted by using which side of the boundary it is

• Regression
• Using decision boundary linear equation is formed
• This is transformed into probability using logistic function
• Output of logistic function ( probability) is used for regression
SVM Kernel Trick
• Transform the data by adding non-linear features
• ( x^2 , cos(x) , x^5, Convert points in form of polar coordinates.. etc)
• This enables to have linear boundary between classes
• Kernel does this transform efficiently ONLY once and not every
iteration
• RBF Kernel : Radial basis Function / Gaussian Kernel
• Considers similarity between points in the dataset
• Similarity is based on gamma and distance between points
SVM Parameters
• C: regularization parameter ( l2 penalty)
• Higher value less regularization / more misclassification is allowed
• Always positive
• kernel: ‘linear’ , ‘rbf’
• gamma : Kernel coefficient for ‘rbf’
• How much each support vector impacts
• Less value : more support vectors are selected
• slow
• High Value: less support vectors are selected
• Fast
• Needs fine tuning
K Nearest Neighbors
K Nearest Neighbors (KNN)
• Supervised or Un-supervised
• Works by creating Tree using data
• Tree gives closest points / neighbors
• K-Neighbors are used for doing predictions for any
new data
• K number is given by user
• In classification majority class of K neighbors is
taken
• In regression Mean of K neighbors is taken
Star : denotes new points
Class 1 : red color
• Used for classification (binary and multi-class) & Class 0 : blue color
Regression
New points class is predicted using majority class
• Used for Un-supervised learning to understand the in neighbors
distribution of data and distance between
neighbors
Regression Task
Regression Task
• Linear Regression
• Multiple Linear Regression
• Polynomial Regression
• LASSO
• RIDGE
Extra
• Solvers in Logistic regression
• https://stackoverflow.com/questions/38640109/logistic-regression-python-solvers-definitions
• https://scikit-learn.org/stable/modules/linear_model.html

Unit 5 - Machine Learning - WWW - Rgpvnotes.in
No ratings yet
Unit 5 - Machine Learning - WWW - Rgpvnotes.in
17 pages
Data Analyst Multiple Choice Questions
100% (1)
Data Analyst Multiple Choice Questions
24 pages
Cheatsheet Supervised Learning
100% (1)
Cheatsheet Supervised Learning
4 pages
DAC ML Tutorial Final Deck
No ratings yet
DAC ML Tutorial Final Deck
150 pages
Lesson 8 - Classification
No ratings yet
Lesson 8 - Classification
74 pages
UCS551 Chapter 6 - Classification
No ratings yet
UCS551 Chapter 6 - Classification
20 pages
ML Opt
No ratings yet
ML Opt
89 pages
Chapter 2
No ratings yet
Chapter 2
31 pages
Module - 4 - ECE3047 - Machine Learning
No ratings yet
Module - 4 - ECE3047 - Machine Learning
81 pages
14 Supervised Machine Learning
No ratings yet
14 Supervised Machine Learning
94 pages
Supervised Learning Cheatsheet
No ratings yet
Supervised Learning Cheatsheet
4 pages
Lecture - 2 & 3
No ratings yet
Lecture - 2 & 3
62 pages
AI & ML Classification Lecture
No ratings yet
AI & ML Classification Lecture
69 pages
ML - MU - Unit - 2 - Supervised Learning-Classification Techniques
No ratings yet
ML - MU - Unit - 2 - Supervised Learning-Classification Techniques
153 pages
Supervised Classification 3601
No ratings yet
Supervised Classification 3601
39 pages
Datamining Lect7knearst
No ratings yet
Datamining Lect7knearst
62 pages
Prosiding Seminar Edusainstech ISBN: 978-602-5614-35-4 Fmipa Unimus 2020
No ratings yet
Prosiding Seminar Edusainstech ISBN: 978-602-5614-35-4 Fmipa Unimus 2020
9 pages
MLT Unit 2 - Updated
No ratings yet
MLT Unit 2 - Updated
58 pages
Tutorial 7 Machine Learning Algorithms
No ratings yet
Tutorial 7 Machine Learning Algorithms
30 pages
Probability Distribution
No ratings yet
Probability Distribution
20 pages
Machine Learning Algorithms Laiki
No ratings yet
Machine Learning Algorithms Laiki
123 pages
20MEMECH Part 3 - Classification
No ratings yet
20MEMECH Part 3 - Classification
49 pages
Datamining Lect12
No ratings yet
Datamining Lect12
75 pages
MLT Unit-2
No ratings yet
MLT Unit-2
30 pages
6) BIOSTATISTICs
No ratings yet
6) BIOSTATISTICs
99 pages
Data Mining Lecture 10B: Classification
No ratings yet
Data Mining Lecture 10B: Classification
62 pages
Unit 3
No ratings yet
Unit 3
9 pages
Data Mining: Classification
No ratings yet
Data Mining: Classification
79 pages
Machine Learning
No ratings yet
Machine Learning
33 pages
Lecture3 Linear Classifiers
No ratings yet
Lecture3 Linear Classifiers
36 pages
Naive Bates Classifier
No ratings yet
Naive Bates Classifier
18 pages
04 - Linear-Classification-2024
No ratings yet
04 - Linear-Classification-2024
65 pages
Week 09 Lesson 1 Intro Machine Learning 1 To 32
No ratings yet
Week 09 Lesson 1 Intro Machine Learning 1 To 32
61 pages
Unit 6 Ai
No ratings yet
Unit 6 Ai
28 pages
Mod09-ppt2-ML in Image Classification
No ratings yet
Mod09-ppt2-ML in Image Classification
30 pages
Machine Learning Basics for Beginners
No ratings yet
Machine Learning Basics for Beginners
28 pages
Week 8. Supervised Learning. Classification
No ratings yet
Week 8. Supervised Learning. Classification
45 pages
08 CSE358 Intro To Machine Learning II
No ratings yet
08 CSE358 Intro To Machine Learning II
100 pages
QUESTIONS
No ratings yet
QUESTIONS
20 pages
Bayes' Theorem Explained
No ratings yet
Bayes' Theorem Explained
18 pages
Lesson 6.0 Supervised Learning With Naive Bayes Classifiers
No ratings yet
Lesson 6.0 Supervised Learning With Naive Bayes Classifiers
13 pages
Session 5
No ratings yet
Session 5
36 pages
ML Unit 2
No ratings yet
ML Unit 2
37 pages
Machine Learning: Classification & Naive Bayes
No ratings yet
Machine Learning: Classification & Naive Bayes
20 pages
Naive Bayes Classifier in Machine Learning
No ratings yet
Naive Bayes Classifier in Machine Learning
16 pages
Unit 3
No ratings yet
Unit 3
12 pages
ML Classification Trupesh Patel
No ratings yet
ML Classification Trupesh Patel
39 pages
Financial Machine Learning-Unit-1: Dr. J.Dhanalakshmi
No ratings yet
Financial Machine Learning-Unit-1: Dr. J.Dhanalakshmi
70 pages
Machine Learning UNIT-2: Logistic Regression
No ratings yet
Machine Learning UNIT-2: Logistic Regression
12 pages
AIML
No ratings yet
AIML
30 pages
Naive Bayes Classifiers - Parta
No ratings yet
Naive Bayes Classifiers - Parta
17 pages
DS ML CompleteSlides PDF
No ratings yet
DS ML CompleteSlides PDF
211 pages
Adversarial Attacks On AI
No ratings yet
Adversarial Attacks On AI
17 pages
Normal Distribution Analysis Guide
100% (1)
Normal Distribution Analysis Guide
33 pages
07 - Bayesian Learning
No ratings yet
07 - Bayesian Learning
55 pages
ML-Unit - 3 & 4
No ratings yet
ML-Unit - 3 & 4
33 pages
ML Models
No ratings yet
ML Models
21 pages
Elementary Statistics Picturing The World 6th Edition Larson Fast Access
No ratings yet
Elementary Statistics Picturing The World 6th Edition Larson Fast Access
313 pages
Binomial Probabilities
No ratings yet
Binomial Probabilities
4 pages
MlUnit 2
No ratings yet
MlUnit 2
11 pages
Unit-4-AIML 1
No ratings yet
Unit-4-AIML 1
19 pages
ML - Practical List
No ratings yet
ML - Practical List
3 pages
Lecture 11 Logistic
No ratings yet
Lecture 11 Logistic
19 pages
Lecture 5
No ratings yet
Lecture 5
64 pages
Welcome I III - V Chapter 1: The Certified Quality Engineer Exam 1
No ratings yet
Welcome I III - V Chapter 1: The Certified Quality Engineer Exam 1
3 pages
Summary Machine Learning
No ratings yet
Summary Machine Learning
6 pages
Supervised Learning Notes
No ratings yet
Supervised Learning Notes
7 pages
Bearing Prob
No ratings yet
Bearing Prob
18 pages
BUAN6359 - Unit4 Part2 Handout
No ratings yet
BUAN6359 - Unit4 Part2 Handout
18 pages
ARCH and GARCH Model
No ratings yet
ARCH and GARCH Model
29 pages
Ethics - of AI - ML For Your Help
No ratings yet
Ethics - of AI - ML For Your Help
17 pages
Minitab Demonstration For Randomized Block Design
100% (1)
Minitab Demonstration For Randomized Block Design
3 pages
Turner - Durbin-Watson Test Paper Sept 2019 Revised Version
No ratings yet
Turner - Durbin-Watson Test Paper Sept 2019 Revised Version
13 pages
Lesson 3 - T-Distribution (Module)
100% (1)
Lesson 3 - T-Distribution (Module)
26 pages
18mab204t - MCQ (I-V)
No ratings yet
18mab204t - MCQ (I-V)
15 pages
523-530 Jurnal Ministal Teguh Setiawan
No ratings yet
523-530 Jurnal Ministal Teguh Setiawan
8 pages
COSM Unit-5
No ratings yet
COSM Unit-5
8 pages
Supervised - Unsupervised - Learning - Realistic - View - Can Do Cannot Do
No ratings yet
Supervised - Unsupervised - Learning - Realistic - View - Can Do Cannot Do
13 pages
CS 601 Machine Learning Unit 5
No ratings yet
CS 601 Machine Learning Unit 5
18 pages
Structured Unstructured Data
No ratings yet
Structured Unstructured Data
9 pages
Strong Weak AI
No ratings yet
Strong Weak AI
6 pages
Econometric Theory: Module - Ii
No ratings yet
Econometric Theory: Module - Ii
8 pages
Mas 102
No ratings yet
Mas 102
5 pages
7 4 - Hypothesis-Testing
No ratings yet
7 4 - Hypothesis-Testing
4 pages
W12 Reading Quiz Probability and Confidence Intervals Math For The Real World PDF
No ratings yet
W12 Reading Quiz Probability and Confidence Intervals Math For The Real World PDF
5 pages
The Bass Model Unscrambling Regression Coefficients For P&Q
No ratings yet
The Bass Model Unscrambling Regression Coefficients For P&Q
4 pages
Advanced Statistics Project
17% (6)
Advanced Statistics Project
2 pages
Statistics and Data Analysis Guide
No ratings yet
Statistics and Data Analysis Guide
4 pages
Logistic Regression
No ratings yet
Logistic Regression
49 pages
Continuous Random Variables II
No ratings yet
Continuous Random Variables II
1 page
Long Test in Statistics and Probability
No ratings yet
Long Test in Statistics and Probability
2 pages
Mann Whitney Example
No ratings yet
Mann Whitney Example
30 pages

Basic Supervised ML Algorithms

Uploaded by

Basic Supervised ML Algorithms

Uploaded by

Basic Supervised Machine

• Types of Classification in Supervised Learning

Ex. In an image Dog is present ?

• By Qef (talk) - Created from scratch with gnuplot, Public Domain,

Further Reading: https://stackoverflow.com/questions/38640109/logistic-regression-python-solvers-definitions

• P(AB) = P(A) * P (B) .. A & B independent

• P(AB) = P(A) * P(B|A) = P(B)*P(A|B)

▪ P(C|x) -> Probability of given sample ‘x’ belonging to class ‘C’

• Application: Automatic medial case classification / diagnosis

• P(em)=6/14 P(day time)= 3/14

• P(Light | Accident) = 3/7

• P(Light | Accident = ‘No’) = ??

• Application of Naive Bayes / Bayesian Formula

• Boundary with maximum margin is most

• Such boundary avoids misclassification,

You might also like