0% found this document useful (0 votes)

30 views9 pages

Simple and Multiple Regression

Uploaded by

Vipin Gautam

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

30 views9 pages

Simple and Multiple Regression

Uploaded by

Vipin Gautam

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 9

In [1]:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

In [2]:
#Reading the dataset
#dataset = pd.read_csv("https://raw.githubusercontent.com/Satyajeet-IITDelhi/sales/main/SLRSales.csv")

In [3]:
#Reading the dataset
dataset = pd.read_csv("C:/NeuralNetwork/MRMSL861/SLRSales.csv")

In [4]:
dataset.head()

Out[4]: Sales Adv_Exp

0 43.6 13.9

1 38.0 12.0

2 30.1 9.3

3 35.3 9.7

4 46.4 12.3

In [5]:
#Model Building
#Simple Linear Regresion
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn import metrics

In [6]:
#Setting the value for X and Y
x = dataset[['Adv_Exp']]
y = dataset['Sales']
In [7]:
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.3, random_state = 100)

In [8]:
slr= LinearRegression()
slr.fit(x_train, y_train)

Out[8]: LinearRegression()

In [9]:
#Printing the model coefficients
print('Intercept: ', slr.intercept_)
print('Coefficient:', slr.coef_)

Intercept: 14.462716405605931
Coefficient: [2.08367683]

In [10]:
print('Regression Equation: Sales = 14.46 + 2.08 * Adv_Exp')

Regression Equation: Sales = 14.46 + 2.08 * Adv_Exp

In [11]:
import statsmodels.api as sm

In [12]:
#fit linear regression model
model = sm.OLS(y, x).fit()

In [13]:
#view model summary
print(model.summary())

OLS Regression Results

=======================================================================================
Dep. Variable: Sales R-squared (uncentered): 0.990
Model: OLS Adj. R-squared (uncentered): 0.990
Method: Least Squares F-statistic: 1140.
Date: Thu, 06 Jul 2023 Prob (F-statistic): 1.84e-12
Time: 16:19:36 Log-Likelihood: -32.310
No. Observations: 12 AIC: 66.62
Df Residuals: 11 BIC: 67.11
Df Model: 1
Covariance Type: nonrobust
==============================================================================
coef std err t P>|t| [0.025 0.975]
------------------------------------------------------------------------------
Adv_Exp 3.2395 0.096 33.762 0.000 3.028 3.451
==============================================================================
Omnibus: 0.341 Durbin-Watson: 2.699
Prob(Omnibus): 0.843 Jarque-Bera (JB): 0.445
Skew: 0.288 Prob(JB): 0.801
Kurtosis: 2.253 Cond. No. 1.00
==============================================================================

Notes:
[1] R² is computed without centering (uncentered) since the model does not contain a constant.
[2] Standard Errors assume that the covariance matrix of the errors is correctly specified.
C:\Users\Satyajeet\anaconda3\lib\site-packages\scipy\stats\_stats_py.py:1736: UserWarning: kurtosistest only valid for n>=20 ... c
ontinuing anyway, n=12
warnings.warn("kurtosistest only valid for n>=20 ... continuing "

Multiple Linear Regression (MLR)

In [14]:
#Importing the libraries
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

In [15]:
#Reading the dataset
dataset = pd.read_csv("https://raw.githubusercontent.com/Harshita0109/Sales-Prediction/master/advertising.csv")

In [16]:
dataset.head()

Out[16]: TV Radio Newspaper Sales

0 230.1 37.8 69.2 22.1

1 44.5 39.3 45.1 10.4

2 17.2 45.9 69.3 12.0

3 151.5 41.3 58.5 16.5

TV Radio Newspaper Sales

4 180.8 10.8 58.4 17.9

In [17]:
#Exploratory Data Analysis
#Distribution of the target variable
sns.distplot(dataset['Sales']);

C:\Users\Satyajeet\anaconda3\lib\site-packages\seaborn\distributions.py:2557: FutureWarning: `distplot` is a deprecated function a

In [18]:
#Exploratory Data Analysis
#Distribution of the Independent variable(IV)
sns.distplot(dataset['TV']);

C:\Users\Satyajeet\anaconda3\lib\site-packages\seaborn\distributions.py:2557: FutureWarning: `distplot` is a deprecated function a

nd will be removed in a future version. Please adapt your code to use either `displot` (a figure-level function with similar flexi
bility) or `histplot` (an axes-level function for histograms).
warnings.warn(msg, FutureWarning)
In [19]:
#Exploratory Data Analysis
#Distribution of the Independent variable(IV)
sns.distplot(dataset['Radio']);

C:\Users\Satyajeet\anaconda3\lib\site-packages\seaborn\distributions.py:2557: FutureWarning: `distplot` is a deprecated function a

nd will be removed in a future version. Please adapt your code to use either `displot` (a figure-level function with similar flexi
bility) or `histplot` (an axes-level function for histograms).
warnings.warn(msg, FutureWarning)
In [20]:
#Exploratory Data Analysis
#Distribution of the Independent variable(IV)
sns.distplot(dataset['Newspaper']);

C:\Users\Satyajeet\anaconda3\lib\site-packages\seaborn\distributions.py:2557: FutureWarning: `distplot` is a deprecated function a

In [21]:
#Heatmap
sns.heatmap(dataset.corr(), annot = True)
plt.show()
In [22]:
#Multiple Linear Regression(MLR)
#Equation: Sales = β0 + (β1 * TV) + (β2 * Radio) + (β3 * Newspaper)
#Setting the value for X and Y
x = dataset[['TV', 'Radio', 'Newspaper']]
y = dataset['Sales']

In [23]:
x_train, x_test, y_train, y_test= train_test_split(x, y, test_size= 0.3, random_state=100)

In [24]:
mlr= LinearRegression()
mlr.fit(x_train, y_train)

Out[24]: LinearRegression()

In [25]:
#Printing the model coefficients
print(mlr.intercept_)
# pair the feature names with the coefficients
list(zip(x, mlr.coef_))

4.334595861728431
Out[25]: [('TV', 0.053829108667250075),
('Radio', 0.11001224388558056),
('Newspaper', 0.006289950146130346)]
In [26]:
import statsmodels.api as sm

In [27]:
#fit linear regression model
model = sm.OLS(y, x).fit()

In [28]:
#view model summary
print(model.summary())

OLS Regression Results

=======================================================================================
Dep. Variable: Sales R-squared (uncentered): 0.977
Model: OLS Adj. R-squared (uncentered): 0.977
Method: Least Squares F-statistic: 2826.
Date: Thu, 06 Jul 2023 Prob (F-statistic): 1.35e-161
Time: 16:22:13 Log-Likelihood: -460.08
No. Observations: 200 AIC: 926.2
Df Residuals: 197 BIC: 936.1
Df Model: 3
Covariance Type: nonrobust
==============================================================================
coef std err t P>|t| [0.025 0.975]
------------------------------------------------------------------------------
TV 0.0671 0.002 42.078 0.000 0.064 0.070
Radio 0.1600 0.011 14.154 0.000 0.138 0.182
Newspaper 0.0284 0.008 3.545 0.000 0.013 0.044
==============================================================================
Omnibus: 0.114 Durbin-Watson: 1.949
Prob(Omnibus): 0.945 Jarque-Bera (JB): 0.025
Skew: 0.026 Prob(JB): 0.987
Kurtosis: 3.020 Cond. No. 12.6
==============================================================================

Notes:
[1] R² is computed without centering (uncentered) since the model does not contain a constant.
[2] Standard Errors assume that the covariance matrix of the errors is correctly specified.

In [ ]:
In [ ]:

Machine Learning Exercises in Python, Part 1: Curious Insight
No ratings yet
Machine Learning Exercises in Python, Part 1: Curious Insight
14 pages
Linear Regression
No ratings yet
Linear Regression
7 pages
Regression Anallysis Hands0n 1
100% (1)
Regression Anallysis Hands0n 1
3 pages
Linear Regression - Ipynb - Colab
No ratings yet
Linear Regression - Ipynb - Colab
4 pages
Regression Analysis Insights
No ratings yet
Regression Analysis Insights
11 pages
SAT and GPA Regression Analysis
100% (1)
SAT and GPA Regression Analysis
1 page
Pregunta 5
No ratings yet
Pregunta 5
2 pages
Regression
No ratings yet
Regression
4 pages
Assignment 2
No ratings yet
Assignment 2
5 pages
OLS Regression Analysis on INTRATE
No ratings yet
OLS Regression Analysis on INTRATE
8 pages
Regressao Linear Simples - Ipynb - Colaboratory
100% (1)
Regressao Linear Simples - Ipynb - Colaboratory
2 pages
Regression Analysis for Beginners
No ratings yet
Regression Analysis for Beginners
7 pages
ML Lab6.Ipynb - Colaboratory
100% (1)
ML Lab6.Ipynb - Colaboratory
5 pages
Week 2 MrSumanBera HandsOn
No ratings yet
Week 2 MrSumanBera HandsOn
9 pages
Assignment 1 Tuneer
No ratings yet
Assignment 1 Tuneer
5 pages
Bda Assign
No ratings yet
Bda Assign
15 pages
Data Analysis Report
No ratings yet
Data Analysis Report
16 pages
Regressao Linear Multipla - Ipynb - Colaboratory
No ratings yet
Regressao Linear Multipla - Ipynb - Colaboratory
2 pages
Simple Linear Regression
No ratings yet
Simple Linear Regression
5 pages
CE1 Sol
No ratings yet
CE1 Sol
7 pages
BA Soln
No ratings yet
BA Soln
9 pages
Lab Linear Regression
No ratings yet
Lab Linear Regression
21 pages
Chapter 2
No ratings yet
Chapter 2
39 pages
Arima Model
No ratings yet
Arima Model
6 pages
Zerox Ready
No ratings yet
Zerox Ready
21 pages
Model Summaries
No ratings yet
Model Summaries
1 page
ML - Lab-6.ipynb - Colab
No ratings yet
ML - Lab-6.ipynb - Colab
4 pages
Time Series Models 2 Pynb
No ratings yet
Time Series Models 2 Pynb
63 pages
Da 5
No ratings yet
Da 5
3 pages
Predicting Salary with Grade 10 Percentage
No ratings yet
Predicting Salary with Grade 10 Percentage
7 pages
Kata Pengantar Vano
No ratings yet
Kata Pengantar Vano
86 pages
Data Science for Beginners
No ratings yet
Data Science for Beginners
98 pages
Linear Regression Report
No ratings yet
Linear Regression Report
2 pages
Predictive Modelling Outputs
No ratings yet
Predictive Modelling Outputs
7 pages
Da Exp 07
No ratings yet
Da Exp 07
6 pages
7
No ratings yet
7
5 pages
Output - Group - Work - Project - 4652 - GWP1.ipynb - Colaboratory
No ratings yet
Output - Group - Work - Project - 4652 - GWP1.ipynb - Colaboratory
6 pages
Maxbox Starter149 Statistic Package Statsmodels
No ratings yet
Maxbox Starter149 Statistic Package Statsmodels
9 pages
Intro to Machine Learning Basics
No ratings yet
Intro to Machine Learning Basics
132 pages
19BCS2059 DL1
No ratings yet
19BCS2059 DL1
4 pages
ml1 PRG
No ratings yet
ml1 PRG
2 pages
5
No ratings yet
5
3 pages
5
No ratings yet
5
3 pages
PPP Models - GARCH & NARNN - Ipynb - Colaboratory
No ratings yet
PPP Models - GARCH & NARNN - Ipynb - Colaboratory
13 pages
Exp 4 - LM
No ratings yet
Exp 4 - LM
5 pages
Simpreg
No ratings yet
Simpreg
6 pages
MLR-handson - Jupyter Notebook
No ratings yet
MLR-handson - Jupyter Notebook
5 pages
OLSLinear Regquestion
No ratings yet
OLSLinear Regquestion
5 pages
Coding Activity 3.ipynb - Colaboratory
No ratings yet
Coding Activity 3.ipynb - Colaboratory
7 pages
PPP Models - ARIMA & NARNN - Ipynb - Colaboratory
No ratings yet
PPP Models - ARIMA & NARNN - Ipynb - Colaboratory
8 pages
Exp1c
No ratings yet
Exp1c
6 pages
A028 GLM-SC3
No ratings yet
A028 GLM-SC3
137 pages
Section 2
No ratings yet
Section 2
22 pages
How To Perform Simple Linear Regression in Python
No ratings yet
How To Perform Simple Linear Regression in Python
8 pages
Regression Prac 9
No ratings yet
Regression Prac 9
8 pages
Machine Learning
No ratings yet
Machine Learning
10 pages
Assignment: Topic - Testing For Violation of OLS Assumptions
No ratings yet
Assignment: Topic - Testing For Violation of OLS Assumptions
50 pages
Popularity Prediction On Twitter EE239AS Project 3
No ratings yet
Popularity Prediction On Twitter EE239AS Project 3
21 pages
Exercise 4: Simple and Multiple Linear Regression Analysis
No ratings yet
Exercise 4: Simple and Multiple Linear Regression Analysis
15 pages
Exp9 Time Series Analysis
No ratings yet
Exp9 Time Series Analysis
8 pages
Variational Method & Perturbation Theory
No ratings yet
Variational Method & Perturbation Theory
2 pages
Model Risk Forrest
No ratings yet
Model Risk Forrest
15 pages
Generating Symbolic World Models Via Test-Time Scaling of Large Language Models
No ratings yet
Generating Symbolic World Models Via Test-Time Scaling of Large Language Models
32 pages
Machine Learning
No ratings yet
Machine Learning
13 pages
Chepter # 5 Simple Regression and Correlation Exercise # 5 by Shahid Mehmood Simple Regression
No ratings yet
Chepter # 5 Simple Regression and Correlation Exercise # 5 by Shahid Mehmood Simple Regression
7 pages
Chapter 2 - Problem Solving by Searching - 1
No ratings yet
Chapter 2 - Problem Solving by Searching - 1
63 pages
500 Quadratic Equation Questions Worksheet
No ratings yet
500 Quadratic Equation Questions Worksheet
94 pages
Unit 3:group B Test 9-Klasse
No ratings yet
Unit 3:group B Test 9-Klasse
3 pages
Decs I Sem
No ratings yet
Decs I Sem
14 pages
Probability & Statistics Course Overview
No ratings yet
Probability & Statistics Course Overview
48 pages
Assignment 1 (
No ratings yet
Assignment 1 (
2 pages
Ai Project Cycle Class X
No ratings yet
Ai Project Cycle Class X
23 pages
OM-Chapter 5
No ratings yet
OM-Chapter 5
38 pages
Classical Dynamics & Thermodynamics
No ratings yet
Classical Dynamics & Thermodynamics
30 pages
Source Coding: Importance and Types
No ratings yet
Source Coding: Importance and Types
2 pages
Ak Mathematics Iii Unit 1
No ratings yet
Ak Mathematics Iii Unit 1
6 pages
FFT Analysis for MATLAB Users
No ratings yet
FFT Analysis for MATLAB Users
5 pages
Applied Machine Learning For Engineers: Artificial Neural Networks
0% (1)
Applied Machine Learning For Engineers: Artificial Neural Networks
6 pages
Algorithmic Trading: Pros and Cons
No ratings yet
Algorithmic Trading: Pros and Cons
4 pages
System IDentification Programs
No ratings yet
System IDentification Programs
19 pages
Mathematics
No ratings yet
Mathematics
2 pages
Kernel Smoothing & Regression Guide
No ratings yet
Kernel Smoothing & Regression Guide
5 pages
Design of Internal Model Controller For A Heat Exchanger System
No ratings yet
Design of Internal Model Controller For A Heat Exchanger System
5 pages
Cs 50
No ratings yet
Cs 50
5 pages
Question Bank With Answers AI
No ratings yet
Question Bank With Answers AI
5 pages
Bcrypt
No ratings yet
Bcrypt
4 pages
Fuzzy PID for Brushless DC Motors
No ratings yet
Fuzzy PID for Brushless DC Motors
35 pages
Solutions 3
No ratings yet
Solutions 3
4 pages
Chat Openai Com Share d1822345 3a2b 42c7 9060 79766097ae3b
No ratings yet
Chat Openai Com Share d1822345 3a2b 42c7 9060 79766097ae3b
14 pages

Simple and Multiple Regression

Uploaded by

Simple and Multiple Regression

Uploaded by

In [1]:

Out[4]: Sales Adv_Exp

Regression Equation: Sales = 14.46 + 2.08 * Adv_Exp

OLS Regression Results

Multiple Linear Regression (MLR)

Out[16]: TV Radio Newspaper Sales

0 230.1 37.8 69.2 22.1

1 44.5 39.3 45.1 10.4

2 17.2 45.9 69.3 12.0

3 151.5 41.3 58.5 16.5

4 180.8 10.8 58.4 17.9

C:\Users\Satyajeet\anaconda3\lib\site-packages\seaborn\distributions.py:2557: FutureWarning: `distplot` is a deprecated function a

C:\Users\Satyajeet\anaconda3\lib\site-packages\seaborn\distributions.py:2557: FutureWarning: `distplot` is a deprecated function a

C:\Users\Satyajeet\anaconda3\lib\site-packages\seaborn\distributions.py:2557: FutureWarning: `distplot` is a deprecated function a

C:\Users\Satyajeet\anaconda3\lib\site-packages\seaborn\distributions.py:2557: FutureWarning: `distplot` is a deprecated function a

OLS Regression Results

You might also like