0% found this document useful (0 votes)

285 views65 pages

Deep Learning Handson

This document provides an overview of deep learning and training a deep neural network (DNN) in Python. It discusses problem definition, training a DNN which involves data analysis, architecture engineering, optimization, and training. It also covers improving the DNN through analysis capabilities, data augmentation, and monitoring layers' training. Finally, it discusses open source packages for hardware, Python frameworks like Theano, and deep learning packages that can help estimate effort. The overall document is a high-level tutorial on deep learning concepts and hands-on training of DNNs in Python.

Uploaded by

Alan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

285 views65 pages

Deep Learning Handson

Uploaded by

Alan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 65

Hands-on

Deep Learning in Python

Imry Kissos
Deep Learning Meetup
TLV August 2015
Outline
● Problem Definition
● Training a DNN

● Improving the DNN

● Open Source Packages
● Summary
2
Problem Definition

Deep
Convolution
Network

1 http://danielnouri.org/notes/2014/12/17/using-convolutional-neural-nets-to-detect-facial-keypoints-tutorial/ 3
Tutorial
● Goal: Detect facial
landmarks on (normal)
face images
● Data set provided by
Dr. Yoshua Bengio
● Tutorial code available:
https://github.com/dnouri/kfkd-tutorial/blob/master/kfkd.py
4
Flow

Train Model Train Model Predict Points

General “Nose Tip” on Test Set

Train Model
“Mouth Corners”
5
Flow

Train Images Fit Trained

Train Points Net

6
Flow

Test Predict Predicted

Images Points

7
Python Deep Learning Framework
High Level

nolearn - Wrapper to Lasagne

Lasagne - Theano extension for Deep Learning

Theano - Define, optimize, and mathematical expressions

Efficient Cuda GPU for DNN Low Level

HW Supports: GPU & CPU

OS: Linux, OS X, Windows 8
Training a Deep Neural Network
1. Data Analysis
2. Architecture Engineering
3. Optimization
4. Training the DNN

9
Training a Deep Neural Network
1. Data Analysis
a. Exploration + Validation
b. Pre-Processing
c. Batch and Split
2. Architecture Engineering
3. Optimization
4. Training the DNN
10
Data Exploration + Validation 1

Data:
● 7K gray-scale images of detected faces
● 96x96 pixels per image
● 15 landmarks per image (?)

Data validation:
● Some Landmarks are missing

11
Pre-Processing

Data
Normalization

Shuffle train data

12
Batch
-
- t - train batch
⇐One Epoch’s data
- validation batch

- - test batch
train/valid/test splits are constant 13
Train / Validation Split

Classification - Train/Validation preserve classes proportion

14
Training a Deep Neural Network
1. Data Analysis
2. Architecture Engineering
a. Layers Definition
b. Layers Implementation
3. Optimization
4. Training

15
Architecture

Conv Pool Dense Output

16
Layers Definition

17
Activation Function 1

ReLU

18
Dense Layer

19
Dropout

20
Dropout

21
Training a Deep Neural Network
1. Data Analysis
2. Architecture Engineering
3. Optimization
a. Back Propagation
b. Objective
c. SGD
d. Updates
e. Convergence Tuning
4. Training the DNN 22
Back Propagation
Forward Path

Output
Conv Dense Points

23
Back Propagation
Forward Path

XY XY

Output Training
Conv Dense Points Points

24
Back Propagation
Backward Path

Conv Dense

25
Back Propagation
Update
For All Layers:

Conv Dense

26
Objective

27
S.G.D Updates the network after each batch

Karpathy - “Babysitting”: weights/updates ~1e3 28

Optimization - Updates

29
Alec Radford
Adjusting Learning Rate & Momentum

Linear in epoch

30
Convergence Tuning

stops according to validation loss

returns best weights

31
Training a Deep Neural Network
1. Data Analysis
2. Architecture Engineering
3. Optimization
4. Training the DNN
a. Fit
b. Fine Tune Pre-Trained
c. Learning Curves

32
Fit

Loop over train batchs

Forward+BackProp

Loop over validation batchs

Forward

33
Fine Tune Pre-Trained
fgd

change output layer

load pre-trained weight

fine tune specialist

34
Learning Curves
Loop over 6 Nets:

Epochs

35
Learning Curves Analysis
Net 1

Net 2
RMSE

RMSE
Epochs Epochs

Convergence Overfitting
Jittering 36
Part 1 Summary
Training a DNN:

37
Part 1 End
Break
Part 2
Beyond Training
Outline
● Problem Definition
● Motivation
● Training a DNN
● Improving the DNN
● Open Source Packages
● Summary

40
Beyond Training
1. Improving the DNN
a. Analysis Capabilities
b. Augmentation
c. Forward - Backward Path
d. Monitor Layers’ Training
2. Open Source Packages
3. Summary

41
Improving the DNN
Very tempting:
● >1M images
● >1M parameters
● Large gap: Theory ↔ Practice

⇒Brute force experiments?!

42
Analysis Capabilities
1. Theoretical explanation
a. Eg. dropout and augmentation decrease overfit
2. Empirical claims about a phenomena
a. Eg. normalization improves convergence
3. Numerical understanding
a. Eg. exploding / vanishing updates

43
Reduce Overfitting Net 1

Net 2

Solution:
Data Augmentation

Epochs

Overfitting
44
Data Augmentation

Horizontal Flip Perturbation

45
Advanced Augmentation

http://benanne.github.io/2015/03/17/plankton.html 46
Convergence Challenges
RMSE

Epochs Epochs
Normalization Data Error
Need to monitor forward + backward path
47
Forward - Backward Path
Forward

Backward:
Gradient w.r.t parameters

48
Monitor Layers’ Training
nolearn - visualize.py

49
Monitor Layers’ Training

X. Glorot ,Y. Bengio, Understanding the difficulty of training deep feedforward neural networks:
“Monitoring activation and gradients across layers and training
iterations is a powerful investigation tool”

Easy to monitor in Theano Framework

50
Weight Initialization matters (1)
Layer 1- Gradient are close to zero - vanishing gradients

51
Weight Initialization matters (2)
Network returns close to zero values for all inputs

52
Monitoring Activation
plateaus sometimes seen when training neural
networks

For most epochs the network returns close to zero output for all inputs

Objective plateaus sometimes can be explained by saturation 53

Monitoring weights/update ratio
3e-1

Max of Weights of Conv1: 2e-1

1e-1

0 Epoch

3e-3
Max of Updates of Conv1:
2e-3

1e-3

0 Epoch

http://cs231n.github.io/neural-networks-3/#baby 54
Beyond Training
1. Improving the DNN
2. Open Source Packages
a. Hardware and OS
b. Python Framework
c. Deep Learning Open Source Packages
d. Effort Estimation
3. Summary

55
Hardware and OS
● Amazon Cloud GPU:
AWS Lasagne GPU Setup
Spot ~ $0.0031 per GPU Instance Hour
● IBM Cloud GPU:
http://www-03.ibm.com/systems/platformcomputing/products/symphony/gpuharvesting.html
● Your Linux machine GPU:
pip install -r https://raw.githubusercontent.com/dnouri/kfkd-
tutorial/master/requirements.txt

● Window install

http://deeplearning.net/software/theano/install_windows.html#install-windows
56
Starting Tips
● Sanity Checks:
○ DNN Architecture : “Overfit a tiny subset of data” Karpathy
○ Check Regularization ↗ Loss ↗
● Use pre-trained VGG as a base line
● Start with ~3 conv layer with ~16 filter each - quickly iterate

57
Python

● Rich eco-system
● State-of-the-art
● Easy to port from prototype to production

Podcast : http://www.reversim.com/2015/10/277-scientific-python.html
58
Python Deep
Learning Framework

Keras ,pylearn2, OpenDeep, Lasagne - common base 59

Tips from Deep Learning Packages
Torch code organization Caffe’s separation
configuration ↔code

NeuralNet → YAML text format

defining experiment’s configuration

60
Deep Learning
Open Source Packages
Open source progress rapidly→ impossible to predict industry’s standard
Caffe for applications
Torch and Theano for research on Deep Learning itself
http://fastml.com/torch-vs-theano/

White Box Black Box

61
Disruptive Effort Estimation
Feature Eng Deep Learning

Still requires algorithmic expertise 62

Summary
● Dove into Training a DNN
● Presented Analysis Capabilities
● Reviewed Open Source Packages

63
References
Hinton Coursera Neuronal Network
https://www.coursera.org/course/neuralnets
Technion Deep Learning course
http://moodle.technion.ac.il/course/view.php?id=4128
Oxford Deep Learning course
https://www.youtube.com/playlist?list=PLE6Wd9FR--EfW8dtjAuPoTuPcqmOV53Fu
CS231n CNN for Visual Recognition
http://cs231n.github.io/
Deep Learning Book
http://www.iro.umontreal.ca/~bengioy/dlbook/
Montreal DL summer school
http://videolectures.net/deeplearning2015_montreal/

64
Questions?

Deep
Convolution
Regression
Network

McDonalds Success Strategy and Global Expansion T
No ratings yet
McDonalds Success Strategy and Global Expansion T
13 pages
Al3502 Deep Learning For Vision Lab Manuval
No ratings yet
Al3502 Deep Learning For Vision Lab Manuval
19 pages
Application For Extension of Time Task IV - FIRM B4
No ratings yet
Application For Extension of Time Task IV - FIRM B4
5 pages
Motion To Admit Supplemental Pleading
100% (7)
Motion To Admit Supplemental Pleading
2 pages
IHRLT Course Manual Fall 2025
No ratings yet
IHRLT Course Manual Fall 2025
38 pages
ML Notes MAKAUT 7th Sem
No ratings yet
ML Notes MAKAUT 7th Sem
31 pages
OCS353 Data Science Fundamentals LAB QUESTION SET
No ratings yet
OCS353 Data Science Fundamentals LAB QUESTION SET
2 pages
Destiny Control Manual For Swara Calendar App
100% (7)
Destiny Control Manual For Swara Calendar App
12 pages
Mini Project Phishing Website Detection Using ML
No ratings yet
Mini Project Phishing Website Detection Using ML
45 pages
Lecture 2.1.2activation Function
No ratings yet
Lecture 2.1.2activation Function
15 pages
Activation Functions - Ipynb - Colaboratory
No ratings yet
Activation Functions - Ipynb - Colaboratory
10 pages
Deep Learning With Keras - Quick Guide
No ratings yet
Deep Learning With Keras - Quick Guide
22 pages
Greedy-Layerwise in Deep Learning
No ratings yet
Greedy-Layerwise in Deep Learning
15 pages
Chap 11 12 - Practical Methodology and Applications - Heechul Lim
100% (1)
Chap 11 12 - Practical Methodology and Applications - Heechul Lim
60 pages
Gen Ai Mynotes
No ratings yet
Gen Ai Mynotes
12 pages
Glorious Things of Thee Are Spoken
No ratings yet
Glorious Things of Thee Are Spoken
1 page
Unit Iv - NNDL
No ratings yet
Unit Iv - NNDL
32 pages
Machine Learning
No ratings yet
Machine Learning
31 pages
MCAT Critical Analysis and Reasoning Skills Review New For MCAT 2015
No ratings yet
MCAT Critical Analysis and Reasoning Skills Review New For MCAT 2015
319 pages
(Reading Certificate) Egemen Türedi 16 Oct 2025
No ratings yet
(Reading Certificate) Egemen Türedi 16 Oct 2025
2 pages
Deep Learning Notes
No ratings yet
Deep Learning Notes
51 pages
Tamilnadu XTH English Model Question Paper With Answer Key 2020
No ratings yet
Tamilnadu XTH English Model Question Paper With Answer Key 2020
6 pages
Introduction To Feed Forward Neural Networks
No ratings yet
Introduction To Feed Forward Neural Networks
121 pages
ML QB With Answer
No ratings yet
ML QB With Answer
20 pages
DL14 Dragons of Triumph
100% (1)
DL14 Dragons of Triumph
102 pages
Deep Neural Network Training Guide
No ratings yet
Deep Neural Network Training Guide
55 pages
Millennial Marketing Guide
No ratings yet
Millennial Marketing Guide
2 pages
In The Mountains (Form 4)
50% (2)
In The Mountains (Form 4)
6 pages
Machine Learning Foundations - Overview
100% (1)
Machine Learning Foundations - Overview
24 pages
Wt&ds Sem-1 Sppu Slips
No ratings yet
Wt&ds Sem-1 Sppu Slips
30 pages
CNN Basics for AI Enthusiasts
No ratings yet
CNN Basics for AI Enthusiasts
29 pages
THP 12.01.2024 CPO 2023 Comprehension Part-2
No ratings yet
THP 12.01.2024 CPO 2023 Comprehension Part-2
4 pages
MNIST, IMDB, Reuters Neural Networks
100% (1)
MNIST, IMDB, Reuters Neural Networks
35 pages
DL Question Bank
No ratings yet
DL Question Bank
5 pages
Data Science Lab Guide
No ratings yet
Data Science Lab Guide
98 pages
Two Way and One Way Slab Design
No ratings yet
Two Way and One Way Slab Design
7 pages
Lesson 1 To 10-1
No ratings yet
Lesson 1 To 10-1
108 pages
Listening Forecast Tháng 2 Quan Trong 4
100% (2)
Listening Forecast Tháng 2 Quan Trong 4
77 pages
1 Amartya Sen
No ratings yet
1 Amartya Sen
5 pages
CCS355 Neural Networks and Deep Learning Lab
No ratings yet
CCS355 Neural Networks and Deep Learning Lab
43 pages
Data Science Laboratory Lab Manual: Prepared by Dr. R Obulakonda Reddy, Associate Professor
No ratings yet
Data Science Laboratory Lab Manual: Prepared by Dr. R Obulakonda Reddy, Associate Professor
35 pages
Sesión 1 - Fascículo
No ratings yet
Sesión 1 - Fascículo
12 pages
RT381-SP Rotary Temperature Transmitter (853-101) : Installation
No ratings yet
RT381-SP Rotary Temperature Transmitter (853-101) : Installation
2 pages
Key Concepts in Global Literature
No ratings yet
Key Concepts in Global Literature
7 pages
Keras
No ratings yet
Keras
7 pages
Python Data Science
No ratings yet
Python Data Science
25 pages
BWM100 Moc 15 1 e
No ratings yet
BWM100 Moc 15 1 e
201 pages
Spring Semester 2021-22 4 Sem, B Tech (Iit Jammu Curriculum) List of Institute Core (IC) and Credit Earning (CE) Courses and Their Slots
No ratings yet
Spring Semester 2021-22 4 Sem, B Tech (Iit Jammu Curriculum) List of Institute Core (IC) and Credit Earning (CE) Courses and Their Slots
7 pages
Phishing Detection Using Machine Learning and Deep Learning Techniques: A Review
No ratings yet
Phishing Detection Using Machine Learning and Deep Learning Techniques: A Review
9 pages
3 Pamatong V Comelec GR No 161872
100% (1)
3 Pamatong V Comelec GR No 161872
2 pages
Research Project-I Guidelines
No ratings yet
Research Project-I Guidelines
12 pages
Mathematics For Machine Learning-I
No ratings yet
Mathematics For Machine Learning-I
10 pages
Nonlinear Water Tank System Model
No ratings yet
Nonlinear Water Tank System Model
2 pages
Machine Learning Techniques Question Bank
No ratings yet
Machine Learning Techniques Question Bank
9 pages
Balance Sheet: Mar ' 14 Mar ' 13 Mar ' 12 Mar ' 11 Mar ' 10
No ratings yet
Balance Sheet: Mar ' 14 Mar ' 13 Mar ' 12 Mar ' 11 Mar ' 10
3 pages
Composition of Faecesm
No ratings yet
Composition of Faecesm
20 pages
Decision Theory
No ratings yet
Decision Theory
40 pages
Energies: Photovoltaic Cell Parameter Estimation Using Hybrid Particle Swarm Optimization and Simulated Annealing
No ratings yet
Energies: Photovoltaic Cell Parameter Estimation Using Hybrid Particle Swarm Optimization and Simulated Annealing
14 pages
Applied Sciences
No ratings yet
Applied Sciences
15 pages
Final
No ratings yet
Final
26 pages
Autoencoders & Keras Overview
No ratings yet
Autoencoders & Keras Overview
42 pages
Muhammad and the Rise of Islam
No ratings yet
Muhammad and the Rise of Islam
7 pages
HTML5 Cheat Sheet
No ratings yet
HTML5 Cheat Sheet
11 pages
HTML5 Cheat Sheet
No ratings yet
HTML5 Cheat Sheet
11 pages
Neural Networks for Advanced Learners
No ratings yet
Neural Networks for Advanced Learners
23 pages
SSH Lib
No ratings yet
SSH Lib
7 pages
Coreano PID Thesis
No ratings yet
Coreano PID Thesis
70 pages
AMY PHILBRICK, LLC v. S/V NIOBE Et Al - Document No. 8
No ratings yet
AMY PHILBRICK, LLC v. S/V NIOBE Et Al - Document No. 8
3 pages
Control Your Arduino From Your PC With The QT Gui
No ratings yet
Control Your Arduino From Your PC With The QT Gui
10 pages
MQWRD 01 01 93 D6P - B3a WS 1.1 en
No ratings yet
MQWRD 01 01 93 D6P - B3a WS 1.1 en
2 pages
Aiml Unit 4
No ratings yet
Aiml Unit 4
26 pages
Quitoy Feature
No ratings yet
Quitoy Feature
2 pages
81.phishing Detection System Through Hybrid Machine Learning Based On Url
No ratings yet
81.phishing Detection System Through Hybrid Machine Learning Based On Url
99 pages
Data Science Workshop
No ratings yet
Data Science Workshop
6 pages
AD3461 ML Lab Manual
No ratings yet
AD3461 ML Lab Manual
32 pages
Clustering & Association Algorithms 4
No ratings yet
Clustering & Association Algorithms 4
17 pages
Battlefleet Gothic 2010 Compendium: Powers of Chaos
100% (1)
Battlefleet Gothic 2010 Compendium: Powers of Chaos
23 pages
Dimensionality Reduction Lecture Slide
No ratings yet
Dimensionality Reduction Lecture Slide
27 pages
Notes - EDA-Unit1
No ratings yet
Notes - EDA-Unit1
34 pages
CNNs Explained for Tech Enthusiasts
No ratings yet
CNNs Explained for Tech Enthusiasts
24 pages
Recurrent Neural Networks
No ratings yet
Recurrent Neural Networks
18 pages
Soft Computing UNIT 3
No ratings yet
Soft Computing UNIT 3
10 pages
Recurrent Neural Networks
No ratings yet
Recurrent Neural Networks
25 pages
Dap M4
No ratings yet
Dap M4
18 pages
Unit V Big Data Analytics
No ratings yet
Unit V Big Data Analytics
47 pages
Twitter Sentiment Analysis Project
100% (1)
Twitter Sentiment Analysis Project
14 pages
Ramen Product Cost Analysis
No ratings yet
Ramen Product Cost Analysis
4 pages
Lecture Notes: Introduction To Data Science and Big Data
No ratings yet
Lecture Notes: Introduction To Data Science and Big Data
5 pages
Inflation's Impact on Daily Life
No ratings yet
Inflation's Impact on Daily Life
49 pages
Course File Format
No ratings yet
Course File Format
1 page
Deep Learning Notes by Pranjal
No ratings yet
Deep Learning Notes by Pranjal
46 pages
Tree Traversals (Inorder, Preorder and Postorder)
No ratings yet
Tree Traversals (Inorder, Preorder and Postorder)
4 pages
Natural Language Toolkit NLTK PDF
No ratings yet
Natural Language Toolkit NLTK PDF
23 pages
Chandigarh Group of Colleges College of Engineering Landran, Mohali
No ratings yet
Chandigarh Group of Colleges College of Engineering Landran, Mohali
47 pages
Neural Networks: A Beginner's Guide
No ratings yet
Neural Networks: A Beginner's Guide
23 pages
Pattern Recognition in AI
No ratings yet
Pattern Recognition in AI
3 pages
ML First Unit
No ratings yet
ML First Unit
70 pages
Cns Lessonplan
No ratings yet
Cns Lessonplan
2 pages
Deep Learning and CNNFYTGS5101-Guoyangxie
No ratings yet
Deep Learning and CNNFYTGS5101-Guoyangxie
42 pages

Deep Learning Handson

Uploaded by

Deep Learning Handson

Uploaded by

Hands-on

Deep Learning in Python

● Improving the DNN

Train Model Train Model Predict Points

Train Images Fit Trained

Test Predict Predicted

nolearn - Wrapper to Lasagne

Lasagne - Theano extension for Deep Learning

Theano - Define, optimize, and mathematical expressions

Efficient Cuda GPU for DNN Low Level

HW Supports: GPU & CPU

Shuffle train data

Classification - Train/Validation preserve classes proportion

Conv Pool Dense Output

Karpathy - “Babysitting”: weights/updates ~1e3 28

stops according to validation loss

returns best weights

Loop over train batchs

Loop over validation batchs

change output layer

load pre-trained weight

fine tune specialist

⇒Brute force experiments?!

Horizontal Flip Perturbation

Easy to monitor in Theano Framework

Objective plateaus sometimes can be explained by saturation 53

Max of Weights of Conv1: 2e-1

Keras ,pylearn2, OpenDeep, Lasagne - common base 59

NeuralNet → YAML text format

White Box Black Box

Still requires algorithmic expertise 62

You might also like