0% found this document useful (0 votes)

56 views43 pages

Lec01 - Intro To Computer Vision

This document provides an overview of the Spring 2016 CS543/ECE549 Computer Vision course at the University of Illinois. The course will cover early computer vision topics like image formation and processing, mid-level vision including grouping and fitting, multi-view geometry, recognition, and additional topics if time allows. The goal of computer vision is to extract meaning from pixels by interpreting various depth, shape, grouping, and other cues that reveal the structure of the visual world. While computer vision has achieved successes in areas like faces, age progression, digital puppetry, and reconstruction, it remains a challenging field due to factors such as viewpoint and illumination variation, scale changes, object deformation, occlusion, motion, and ambiguity.

Uploaded by

ikhsan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

56 views43 pages

Lec01 - Intro To Computer Vision

Uploaded by

ikhsan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 43

Spring 2016 CS543 / ECE549

Computer Vision

Course webpage URL: http://slazebni.cs.illinois.edu/spring16/

The goal of computer vision
• To extract “meaning” from pixels

What we see What a computer sees

Source: S. Narasimhan
The goal of computer vision
• To extract “meaning” from pixels

Humans are remarkably good at this…

Source: “80 million tiny images” by Torralba et al.

What kind of information can be
extracted from an image?
tree
roof tree

sky chimney

building
building
window
door

trashcan car car

person
Outdoor scene
ground City European
…

Semantic information Geometric information

Why study computer vision?
• Vision is useful
• Vision is interesting
• Vision is difficult
• Half of primate cerebral cortex is devoted to visual
processing
• Achieving human-level image understanding is probably
“AI-complete”
Successes of computer vision to date
“Simple” patterns
Faces
Face movies

I. Kemelmacher-Shlizerman, E. Shechtman, R. Garg and S. Seitz,

Exploring Photobios, SIGGRAPH 2011

YouTube Video
Automatic age progression

I. Kemelmacher-Shlizerman, S. Suwajanakorn, and S. Seitz, Illumination-

Aware Age Progression, CVPR 2014

YouTube Video
Digital puppetry

S. Suwajanakorn, S. Seitz, and I. Kemelmacher-Shlizerman, What Makes

Tom Hanks Look Like Tom Hanks, ICCV 2015

YouTube Video
Reconstruction: 3D from photo collections

Q. Shan, R. Adams, B. Curless, Y. Furukawa, and S. Seitz, The Visual

Turing Test for Scene Reconstruction, 3DV 2013

YouTube Video
Reconstruction: 4D from photo collections

R. Martin-Brualla, D. Gallup, and S. Seitz, Time-Lapse Mining from Internet

Photos, SIGGRAPH 2015

YouTube Video
Reconstruction: 4D from depth cameras

R. Newcombe, D. Fox, and S. Seitz, DynamicFusion:

Reconstruction and Tracking of Non-rigid Scenes in Real-Time,
CVPR 2015

YouTube Video
Recognition

• Computer Eyesight Gets a Lot More Accurate,

NY Times Bits blog, August 18, 2014
• Building A Deeper Understanding of Images,
Google Research Blog, September 5, 2014
• Baidu caught gaming recent supercomputer
performance test, Engadget, June 3, 2015
Self-driving cars

http://www.nytimes.com/2016/01/18/technology/driverless-
cars-limits-include-human-nature.html
Why is computer vision difficult?
Challenges: viewpoint variation
Challenges: illumination

image credit: J. Koenderink

Challenges: scale

slide credit: Fei-Fei, Fergus & Torralba

Challenges: deformation

Xu, Beihong 1943

slide credit: Fei-Fei, Fergus & Torralba

Challenges: object intra-class
variation

slide credit: Fei-Fei, Fergus & Torralba

Challenges: occlusion, clutter

Image source: National Geographic

Challenges: Motion
Challenges: ambiguity

slide credit: Fei-Fei, Fergus & Torralba

Challenges: ambiguity
• Many different 3D scenes could have given rise to a
particular 2D picture
Challenges or opportunities?
• Images are confusing, but they also reveal the structure of
the world through numerous cues
• Our job is to interpret the cues!
Depth cues: Linear perspective
Depth cues: Parallax
Shape cues: Texture gradient
Shape and lighting cues: Shading

Michelangelo 1475-1564 slide credit: Fei-Fei, Fergus & Torralba

Grouping cues: Similarity (color, texture,
proximity)
Grouping cues: “Common fate”

Image credit: Arthus-Bertrand (via F. Durand)

Origins of computer vision

L. G. Roberts, Machine Perception

of Three Dimensional Solids,
Ph.D. thesis, MIT Department of
Electrical Engineering, 1963.
Origins of computer vision

Source: Fei-Fei Li
Connections to other disciplines

Artificial Intelligence

Robotics Machine Learning

Computer Vision

Computer Graphics Cognitive science

Neuroscience

Image Processing
The computer vision industry
• Corporate sponsors of CVPR 2015:
Course overview
I. Early vision: Image formation and processing
II. Mid-level vision: Grouping and fitting
III. Multi-view geometry
IV. Recognition
V. Additional topics
I. Early vision
• Basic image formation and processing

* =
Linear filtering
Edge detection
Cameras and sensors
Light and color

Feature extraction, feature tracking

II. “Mid-level vision”
• Fitting and grouping

Fitting: Least squares Alignment

Hough transform
RANSAC
III. Multi-view geometry

Epipolar geometry Stereo

Structure from motion 3D Photography

IV. Recognition

Instance recognition, large-scale alignment Image classification

Object detection
Deep learning
V. Additional Topics (time permitting)

Segmentation Video

RGBD images Images and text

Sjg18-046 (03) - Guangri New Control
No ratings yet
Sjg18-046 (03) - Guangri New Control
53 pages
Computer Vision Presentation AI
No ratings yet
Computer Vision Presentation AI
16 pages
LectureNotes PDF
No ratings yet
LectureNotes PDF
212 pages
Hcu Dump
100% (3)
Hcu Dump
86 pages
Computer Vision
100% (1)
Computer Vision
48 pages
Computer Vision: Cse 576 Ali Farhadi
No ratings yet
Computer Vision: Cse 576 Ali Farhadi
90 pages
PARAM Siddhi-AI System Manual Ver1.0
No ratings yet
PARAM Siddhi-AI System Manual Ver1.0
88 pages
Lecture 1
100% (1)
Lecture 1
21 pages
Lec01 CT Intro
No ratings yet
Lec01 CT Intro
61 pages
Lec00 Intro For Web Highlighted
No ratings yet
Lec00 Intro For Web Highlighted
72 pages
Lecture 01 Introduction To Computer Vision PDF
No ratings yet
Lecture 01 Introduction To Computer Vision PDF
118 pages
Lec00 Intro For Web
No ratings yet
Lec00 Intro For Web
81 pages
Intro to Computer Vision Course
No ratings yet
Intro to Computer Vision Course
76 pages
To Operating: Systems
No ratings yet
To Operating: Systems
564 pages
1 Intro Visión Artificial
No ratings yet
1 Intro Visión Artificial
50 pages
Lecture 01 Introduction
No ratings yet
Lecture 01 Introduction
62 pages
Ilovepdf Merged Compressed
No ratings yet
Ilovepdf Merged Compressed
1,100 pages
1 Vision Lec 1
No ratings yet
1 Vision Lec 1
49 pages
Lecture1 - Introduction
No ratings yet
Lecture1 - Introduction
35 pages
Computer Vision: Linda Shapiro
No ratings yet
Computer Vision: Linda Shapiro
73 pages
Lec01 Intro
No ratings yet
Lec01 Intro
61 pages
Lect1 PDF
100% (1)
Lect1 PDF
45 pages
00CV Intro Full
No ratings yet
00CV Intro Full
58 pages
CS7.505: Computer Vision: Spring 2022
No ratings yet
CS7.505: Computer Vision: Spring 2022
46 pages
Computer Vision: Evolution and Promise
No ratings yet
Computer Vision: Evolution and Promise
5 pages
CV 01 Introduction
No ratings yet
CV 01 Introduction
14 pages
Computer Vision 2011
100% (1)
Computer Vision 2011
103 pages
Lecture AI 15 23052025 112103am
No ratings yet
Lecture AI 15 23052025 112103am
69 pages
1a. Introduction
No ratings yet
1a. Introduction
32 pages
Ch-3 Image AnalysisComputer Vision
No ratings yet
Ch-3 Image AnalysisComputer Vision
88 pages
CV - Lecture 1 - Iintroduction
No ratings yet
CV - Lecture 1 - Iintroduction
24 pages
1 Intro
No ratings yet
1 Intro
103 pages
Lecture 1 Intro
No ratings yet
Lecture 1 Intro
164 pages
Computer Vision ch1
No ratings yet
Computer Vision ch1
80 pages
Lecture 01
No ratings yet
Lecture 01
5 pages
01 - Introduction
No ratings yet
01 - Introduction
37 pages
What Is Computer Vision
No ratings yet
What Is Computer Vision
18 pages
Lec01 Intro
No ratings yet
Lec01 Intro
55 pages
CV #1 Course Introduction-1
No ratings yet
CV #1 Course Introduction-1
61 pages
Computer Vision for Tech Enthusiasts
No ratings yet
Computer Vision for Tech Enthusiasts
3 pages
PDF Joiner
No ratings yet
PDF Joiner
38 pages
Computer Vision Intorduction
No ratings yet
Computer Vision Intorduction
57 pages
Lecture1 1
No ratings yet
Lecture1 1
30 pages
Computer Vision Introduction
No ratings yet
Computer Vision Introduction
11 pages
Computer Vision Basics for Beginners
No ratings yet
Computer Vision Basics for Beginners
21 pages
Lecture 01 Introduction
No ratings yet
Lecture 01 Introduction
61 pages
Lec00 Intro Computervision
No ratings yet
Lec00 Intro Computervision
58 pages
Computer Vision Presentation Updated
No ratings yet
Computer Vision Presentation Updated
15 pages
CompVisNotes PDF
No ratings yet
CompVisNotes PDF
115 pages
CV Overview
No ratings yet
CV Overview
83 pages
ComputerVision Intro
No ratings yet
ComputerVision Intro
50 pages
Computer Vision 191110021029
No ratings yet
Computer Vision 191110021029
24 pages
Abhijith Vision
No ratings yet
Abhijith Vision
17 pages
What Is Computer Vision
No ratings yet
What Is Computer Vision
9 pages
P702CV
No ratings yet
P702CV
4 pages
Nlp4web Lecture 2 Text Classification
No ratings yet
Nlp4web Lecture 2 Text Classification
109 pages
Data Nasabah Bank Sampah: TAHUN 2022
No ratings yet
Data Nasabah Bank Sampah: TAHUN 2022
8 pages
Salesforce Developer Cheat Sheet
No ratings yet
Salesforce Developer Cheat Sheet
2 pages
Prerequisites: What Is Computer Vision? Vision For Measurement
No ratings yet
Prerequisites: What Is Computer Vision? Vision For Measurement
8 pages
Computer Vision
No ratings yet
Computer Vision
52 pages
Unit 1 Big Data
No ratings yet
Unit 1 Big Data
124 pages
SE CH04 Software Requirement Analysis
No ratings yet
SE CH04 Software Requirement Analysis
77 pages
Computer Vision PDF
No ratings yet
Computer Vision PDF
6 pages
Vlsi Interview Questions
0% (1)
Vlsi Interview Questions
10 pages
Lecture-4 Code of Conduct
No ratings yet
Lecture-4 Code of Conduct
35 pages
Computer Vision Assignment
No ratings yet
Computer Vision Assignment
10 pages
CV Module 1
No ratings yet
CV Module 1
166 pages
Introduction To Object Recognition: Slides Adapted From Fei-Fei Li, Rob Fergus, Antonio Torralba, and Others
No ratings yet
Introduction To Object Recognition: Slides Adapted From Fei-Fei Li, Rob Fergus, Antonio Torralba, and Others
60 pages
E-Wallet Adoption and Impact Study
No ratings yet
E-Wallet Adoption and Impact Study
30 pages
Symbol Table
No ratings yet
Symbol Table
24 pages
620-0216-001-NetPerformer Overview
No ratings yet
620-0216-001-NetPerformer Overview
38 pages
Accepted Manuscript International Journal of Information Technology & Decision Making
No ratings yet
Accepted Manuscript International Journal of Information Technology & Decision Making
36 pages
Informed Search Methods: Read Chapter 4 Use Text For More Examples: Work Them Out Yourself
No ratings yet
Informed Search Methods: Read Chapter 4 Use Text For More Examples: Work Them Out Yourself
32 pages
Panda 1
No ratings yet
Panda 1
18 pages
2 - Blockchain - Public-Key Cryptography
No ratings yet
2 - Blockchain - Public-Key Cryptography
22 pages
Fitness Course Enrolment Guide
No ratings yet
Fitness Course Enrolment Guide
16 pages
Pi RS485&CAN Module User Manual - V1.3
No ratings yet
Pi RS485&CAN Module User Manual - V1.3
27 pages
Week 4 Secure Information System
No ratings yet
Week 4 Secure Information System
19 pages
Elkhoukhi 2019
No ratings yet
Elkhoukhi 2019
13 pages
18cse390t U1 s1 Slo1 Content
No ratings yet
18cse390t U1 s1 Slo1 Content
15 pages
Text For Presentation
No ratings yet
Text For Presentation
5 pages
Sample Test ECDL CAD V1.5
No ratings yet
Sample Test ECDL CAD V1.5
6 pages
Debloat and Restore
No ratings yet
Debloat and Restore
6 pages
Design and Implementation of An Embedded Edge-Processing Water Quality Monitoring System For Underground Waters
No ratings yet
Design and Implementation of An Embedded Edge-Processing Water Quality Monitoring System For Underground Waters
4 pages
Strategic Decisions in Supply-Chain Intelligence Using Knowledge Management: An Analytic-Network-Process Framework
No ratings yet
Strategic Decisions in Supply-Chain Intelligence Using Knowledge Management: An Analytic-Network-Process Framework
8 pages
Anurag Resume
No ratings yet
Anurag Resume
3 pages
Practical 4
No ratings yet
Practical 4
3 pages
Collin College - Continuing Education: Course Syllabus
No ratings yet
Collin College - Continuing Education: Course Syllabus
4 pages
Certified Scrum Master (CSM) : Description
No ratings yet
Certified Scrum Master (CSM) : Description
1 page
Attendance
No ratings yet
Attendance
2 pages
Resuume
No ratings yet
Resuume
2 pages
M.Tech CS & CrS Admission Test Syllabus
No ratings yet
M.Tech CS & CrS Admission Test Syllabus
2 pages

Lec01 - Intro To Computer Vision

Uploaded by

Lec01 - Intro To Computer Vision

Uploaded by

Spring 2016 CS543 / ECE549

Course webpage URL: http://slazebni.cs.illinois.edu/spring16/

What we see What a computer sees

Humans are remarkably good at this…

Source: “80 million tiny images” by Torralba et al.

trashcan car car

Semantic information Geometric information

I. Kemelmacher-Shlizerman, E. Shechtman, R. Garg and S. Seitz,

I. Kemelmacher-Shlizerman, S. Suwajanakorn, and S. Seitz, Illumination-

S. Suwajanakorn, S. Seitz, and I. Kemelmacher-Shlizerman, What Makes

Q. Shan, R. Adams, B. Curless, Y. Furukawa, and S. Seitz, The Visual

R. Martin-Brualla, D. Gallup, and S. Seitz, Time-Lapse Mining from Internet

R. Newcombe, D. Fox, and S. Seitz, DynamicFusion:

• Computer Eyesight Gets a Lot More Accurate,

image credit: J. Koenderink

slide credit: Fei-Fei, Fergus & Torralba

Xu, Beihong 1943

slide credit: Fei-Fei, Fergus & Torralba

slide credit: Fei-Fei, Fergus & Torralba

Image source: National Geographic

slide credit: Fei-Fei, Fergus & Torralba

Michelangelo 1475-1564 slide credit: Fei-Fei, Fergus & Torralba

Image credit: Arthus-Bertrand (via F. Durand)

L. G. Roberts, Machine Perception

Robotics Machine Learning

Computer Graphics Cognitive science

Feature extraction, feature tracking

Fitting: Least squares Alignment

Epipolar geometry Stereo

Structure from motion 3D Photography

Instance recognition, large-scale alignment Image classification

RGBD images Images and text

You might also like