0% found this document useful (0 votes)

25 views17 pages

Visualisation Basic

Uploaded by

adi9910119238

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

25 views17 pages

Visualisation Basic

Uploaded by

adi9910119238

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 17

Visualization

with Python
Suchitra dutta
• pip install matplotlib seaborn pandas

Step 1: Install Necessary

Libraries
• import pandas as pd
• import matplotlib.pyplot as plt
• import seaborn as sns

Step 2: Import Libraries

• You can load data from various sources like CSV, Excel,
databases, etc.
• # Load from a CSV file
• df =
pd.read_csv('C:\\Users\\dell\\OneDrive\\Desktop\\CE.csv'
)
• # Show first 5 rows
• print(df.head())

Step 3: Load Your Dataset

• Before visualization, understand your data.
• print(df.info()) # Data types and missing values
• print(df.describe()) # Summary statistics
• print(df.columns) # Column names

Step 4: Explore the Data

• # Drop missing values
• df = df.dropna()

• # Convert categorical to numerical (if needed)

• df['gender'] = df['gender'].map({'Male': 0, 'Female': 1})

Clean or Prepare the Data

(if needed)
• df = df.drop_duplicates()

• # Convert Data Types

• # Convert column to integer
• df['age'] = df['age'].astype(int)

• # Convert date column to datetime

• df['date'] = pd.to_datetime(df['date'])

Remove Duplicate Rows

• # Fill with mean (for numeric columns)
• df['age'] = df['age'].fillna(df['age'].mean())

• # Fill with median

• df['salary'] = df['salary'].fillna(df['salary'].median())

• # Fill with mode (for categorical columns)

• df['gender'] = df['gender'].fillna(df['gender'].mode()[0])

Fill Missing Values

• df.columns = df.columns.str.lower()

#Replace Specific Values

• df['gender'] = df['gender'].replace({'M': 'Male', 'F':
'Female'})

Lowercase Column
Names
Step 6: Choose the Right
Visualization Type
Goal Chart Type Library
Distribution of a variable Histogram, KDE seaborn

Compare categories Bar chart matplotlib/seaborn

Relationship between 2
Scatter plot seaborn
vars

Time series analysis Line chart matplotlib

Correlation matrix Heatmap seaborn

Proportion of a whole Pie chart matplotlib

• import seaborn as sns
• import matplotlib.pyplot as plt
• # Plot histogram of the 'age' column
• sns.histplot(df['age'], bins=5, kde=True, color='skyblue')
• # Add titles and labels
• plt.title("Age Distribution of Music Preferences")
• plt.xlabel("Age")
• plt.ylabel("Number of People")
• plt.grid(True)
• # Show the plot
• plt.show()

#bins=5 means the age range will be split into 5 equally spaced groups.
#KDE stands for Kernel Density Estimate.
• It draws a smooth curve over the histogram to show the probability density — essentially
the shape of the distribution.

Step 7: Create
Visualizations
• df['gender'].value_counts().plot(kind='bar')
• plt.title("Gender Distribution")
• plt.xlabel("Gender")
• plt.ylabel("Count")
• plt.show()

2. Bar Plot
• sns.scatterplot(x='age', y='gender', data=df)
• plt.title("Age vs Gender")
• plt.show()

3. Scatter Plot
• plt.plot(df['gender'], df['age'])
• plt.title("Gender vs Age")
• plt.xlabel(" Gender ")
• plt.ylabel(" Age ")
• plt.xticks(rotation=45)
• plt.show()
• 🔹 plt.xticks(rotation=45)
• This line rotates the x-axis labels by 45 degrees.

4. Line Plot
• import seaborn as sns
• import matplotlib.pyplot as plt
• # Select only numeric columns
• numeric_df = df.select_dtypes(include=['number'])
• # Compute correlation
• correlation = numeric_df.corr()
• # Create the heatmapsns.heatmap(correlation, annot=True,
cmap='Blues')
• plt.title("Correlation Heatmap (Numeric Features)")
• plt.show()

Correlation Heatmap
(Numeric Features)
annot Show numbers in each cell annot=True
cmap Set the color theme/style cmap='Blues'
• plt.savefig("my_plot.png", dpi=300)

Step 9: Save the Plots

• After plotting, look for:
• Trends or patterns
• Outliers or anomalies
• Correlations or dependencies

Step 10: Interpret and

Share Insights

Weekly Quiz 1 Machine Learning Great Learning PDF
100% (2)
Weekly Quiz 1 Machine Learning Great Learning PDF
7 pages
SOA Exam SRM - ASM Learning Flashcards
No ratings yet
SOA Exam SRM - ASM Learning Flashcards
26 pages
Experimental Design Insights
100% (3)
Experimental Design Insights
22 pages
HCO Oriented Core Procedures
100% (1)
HCO Oriented Core Procedures
27 pages
Anova
No ratings yet
Anova
56 pages
Data Scientist Masters Program Guide
No ratings yet
Data Scientist Masters Program Guide
30 pages
Askaripour - A Textbook Evaluation of New Version (2nd Edition) of Top Notch English Series PDF
No ratings yet
Askaripour - A Textbook Evaluation of New Version (2nd Edition) of Top Notch English Series PDF
30 pages
Data Analisis 2
No ratings yet
Data Analisis 2
13 pages
Topic 2. Visual Data Analysis in Python: Mlcourse - Ai (Https://mlcourse - Ai)
No ratings yet
Topic 2. Visual Data Analysis in Python: Mlcourse - Ai (Https://mlcourse - Ai)
25 pages
Reseach Module
No ratings yet
Reseach Module
131 pages
Lesson Objective/S Code/S Duration
No ratings yet
Lesson Objective/S Code/S Duration
17 pages
Lab 19 - Network Analysis
No ratings yet
Lab 19 - Network Analysis
36 pages
Python EDA Workshop with Olympics Data
No ratings yet
Python EDA Workshop with Olympics Data
12 pages
Unit2 Modified
No ratings yet
Unit2 Modified
42 pages
DSBDL Write Ups 8 To 10
No ratings yet
DSBDL Write Ups 8 To 10
7 pages
Data Mining by Worapoj Kreesuradej
No ratings yet
Data Mining by Worapoj Kreesuradej
43 pages
Statistical Analysis Techniques Guide
No ratings yet
Statistical Analysis Techniques Guide
19 pages
Course Syllabus Introduction To SPSS
No ratings yet
Course Syllabus Introduction To SPSS
2 pages
Data Visualization Techniques Guide
No ratings yet
Data Visualization Techniques Guide
48 pages
SAP Sales Apps Test Guide
No ratings yet
SAP Sales Apps Test Guide
35 pages
Final Thesis Cha 1&3 (New)
No ratings yet
Final Thesis Cha 1&3 (New)
14 pages
Laboratory Procedure Manual: Triglycrides Serum Hitachi 912
No ratings yet
Laboratory Procedure Manual: Triglycrides Serum Hitachi 912
17 pages
Marketing Research Design Guide
No ratings yet
Marketing Research Design Guide
49 pages
Data Visualization & Exploration Guide
No ratings yet
Data Visualization & Exploration Guide
24 pages
Data Visualization Part 2
No ratings yet
Data Visualization Part 2
18 pages
L5 6 DataViz
No ratings yet
L5 6 DataViz
79 pages
Visualization
No ratings yet
Visualization
28 pages
Lesson 1 - Data Visualisation
No ratings yet
Lesson 1 - Data Visualisation
35 pages
Programming 2 Lectures
No ratings yet
Programming 2 Lectures
41 pages
The Assumptions Underlying The Method of Least Squares (CLRM)
No ratings yet
The Assumptions Underlying The Method of Least Squares (CLRM)
11 pages
17 Ensemble Techniques Problem Statement
No ratings yet
17 Ensemble Techniques Problem Statement
28 pages
Update Chapter 4 Data Visualizations
No ratings yet
Update Chapter 4 Data Visualizations
19 pages
Pandas
No ratings yet
Pandas
7 pages
1.1 Univariate Analysis: 1.1.1 Categorical Data
No ratings yet
1.1 Univariate Analysis: 1.1.1 Categorical Data
10 pages
Data Visualization
No ratings yet
Data Visualization
31 pages
SCI 1020 - wk2
No ratings yet
SCI 1020 - wk2
4 pages
Data Visualization Lab: Experiment 1
No ratings yet
Data Visualization Lab: Experiment 1
8 pages
What Are The Evaluation Metrics in Machine Learning
No ratings yet
What Are The Evaluation Metrics in Machine Learning
3 pages
Unit 3 DV
No ratings yet
Unit 3 DV
12 pages
DSBDAL - Assignment No 9
No ratings yet
DSBDAL - Assignment No 9
12 pages
Lab Manual For Students
No ratings yet
Lab Manual For Students
38 pages
Sl-3 Assignment No.8
No ratings yet
Sl-3 Assignment No.8
21 pages
3334 Exam Cheat Sheet
No ratings yet
3334 Exam Cheat Sheet
26 pages
Aligned Automation - JD - Business Analyst
No ratings yet
Aligned Automation - JD - Business Analyst
2 pages
Experiment No 9
No ratings yet
Experiment No 9
13 pages
Pandas Complete + Visualisation Summary of IBM Visualization
No ratings yet
Pandas Complete + Visualisation Summary of IBM Visualization
21 pages
Data Analyst Career Guide
No ratings yet
Data Analyst Career Guide
9 pages
Advanced Plot Types With Seaborn
No ratings yet
Advanced Plot Types With Seaborn
4 pages
Summary: Introduction To Data Visualization Tools
No ratings yet
Summary: Introduction To Data Visualization Tools
13 pages
21L-1803 Data Visual Assignment#3
No ratings yet
21L-1803 Data Visual Assignment#3
26 pages
Seaborn
No ratings yet
Seaborn
7 pages
DWH KOE - 093 Tutorial and Assignment
No ratings yet
DWH KOE - 093 Tutorial and Assignment
16 pages
Description of Data Visualization Tools
No ratings yet
Description of Data Visualization Tools
15 pages
Training TBP Evaluation Fy11
No ratings yet
Training TBP Evaluation Fy11
3 pages
DMML Lab Report 02
No ratings yet
DMML Lab Report 02
11 pages
05 Pandas
No ratings yet
05 Pandas
12 pages
Aphical Representation
No ratings yet
Aphical Representation
8 pages
Module 6
No ratings yet
Module 6
11 pages
NumPy, Pandas, MatplotLib, Seaborn, ScikitLearn (SkLearn)
No ratings yet
NumPy, Pandas, MatplotLib, Seaborn, ScikitLearn (SkLearn)
14 pages
Sections Revision Part 2
No ratings yet
Sections Revision Part 2
7 pages
Data Visualization Using Python
No ratings yet
Data Visualization Using Python
3 pages
DMV Unit-4-1 PDF
No ratings yet
DMV Unit-4-1 PDF
10 pages
DVA Practical
No ratings yet
DVA Practical
19 pages
Ai&Ml Bail606 ML Lab Manual
No ratings yet
Ai&Ml Bail606 ML Lab Manual
50 pages
Unit 4 - Advanced Visualization Techniques-1 NM PYTHON
No ratings yet
Unit 4 - Advanced Visualization Techniques-1 NM PYTHON
13 pages
2 Program
No ratings yet
2 Program
8 pages
Data Visualisation
No ratings yet
Data Visualisation
6 pages
Advanced Plot Types With Seaborn
No ratings yet
Advanced Plot Types With Seaborn
8 pages
Lab 5 &6
No ratings yet
Lab 5 &6
6 pages
Ds Lab 4.ipynb - TARUN
No ratings yet
Ds Lab 4.ipynb - TARUN
6 pages
Chapter 3 - Research Methodology - Comprehensive Guide
100% (1)
Chapter 3 - Research Methodology - Comprehensive Guide
7 pages
Exploratory Data Analysis (EDA) in Python
No ratings yet
Exploratory Data Analysis (EDA) in Python
6 pages
Pandas 3-2
No ratings yet
Pandas 3-2
27 pages
Data Analysis CheatSheet
No ratings yet
Data Analysis CheatSheet
2 pages
Engineer-Process Metallurgy (Wire Rod VAG)
No ratings yet
Engineer-Process Metallurgy (Wire Rod VAG)
3 pages
Measures of Dispersion
No ratings yet
Measures of Dispersion
9 pages
Exploratory Data Analysis
No ratings yet
Exploratory Data Analysis
4 pages
Data Visualization UNIT II
No ratings yet
Data Visualization UNIT II
26 pages
Exp 12 and 15
No ratings yet
Exp 12 and 15
4 pages
Aim: Objective
No ratings yet
Aim: Objective
7 pages
Aphical Representation
No ratings yet
Aphical Representation
12 pages
MBA Seaborn 2
No ratings yet
MBA Seaborn 2
62 pages
Data Visualization
No ratings yet
Data Visualization
23 pages
One-Day Intensive Python Data Analysis and Visuali
No ratings yet
One-Day Intensive Python Data Analysis and Visuali
6 pages
@PowerBI - Ir - Data Visualization Cheat Sheet
No ratings yet
@PowerBI - Ir - Data Visualization Cheat Sheet
15 pages
Tung Wah College GEN3005 / GED3005 Big Data and Data Sciences
No ratings yet
Tung Wah College GEN3005 / GED3005 Big Data and Data Sciences
7 pages
DV 6
No ratings yet
DV 6
9 pages