Universitat Autònoma de Barcelona
Clasificación de imágenes: ¿cómo reconocer el contenido de una imagen?

New year. Big goals. Bigger savings. Unlock a year of unlimited access to learning with Coursera Plus for $199. Save now.

Universitat Autònoma de Barcelona

Clasificación de imágenes: ¿cómo reconocer el contenido de una imagen?

Ernest Valveny
Jordi Gonzàlez Sabaté
Ramon Baldrich Caselles

Instructors: Ernest Valveny

15,906 already enrolled

Included with Coursera Plus

Gain insight into a topic and learn the fundamentals.
4.3

(79 reviews)

21 hours to complete
3 weeks at 7 hours a week
Flexible schedule
Learn at your own pace
96%
Most learners liked this course
Gain insight into a topic and learn the fundamentals.
4.3

(79 reviews)

21 hours to complete
3 weeks at 7 hours a week
Flexible schedule
Learn at your own pace
96%
Most learners liked this course

Details to know

Shareable certificate

Add to your LinkedIn profile

Assessments

15 assignments

Taught in Spanish

See how employees at top companies are mastering in-demand skills

Placeholder
Placeholder

Earn a career certificate

Add this credential to your LinkedIn profile, resume, or CV

Share it on social media and in your performance review

Placeholder

There are 6 modules in this course

En este primer módulo explicaremos los fundamentos de la clasificación de imágenes y presentaremos todos los pasos de un primer sistema de clasificación básico. Para ello, primero veremos algunos conceptos básicos sobre el procesamiento de una imagen que nos servirán para introducir un primer método para detectar y describir características locales (SIFT) en una imagen. Luego veremos cómo podemos agrupar estas características locales para representar toda la imagen y explicaremos un primer clasificador simple, k-NN. Finalmente comentaremos los aspectos básicos de la evaluación del rendimiento de un sistema de clasificación de imágenes.

What's included

7 videos12 readings3 assignments

En este módulo introduciremos Bag of Words como método de representación básico que utilizaremos mayoritariamente a lo largo de todo el curso. Explicaremos todos los detalles necesarios para construir la representación BoW de una imagen, incluyendo la construcción del vocabulario utilizando K-Means y cómo agregar la información de las características locales en la representación final en forma de histograma. En la segunda parte de la semana explicaremos Support Vector Machines (SVM) como método de clasificación, tanto los conceptos fundamentales como su formulación matemática y los detalles para entrenar y utilizar un clasificador basado en SVM. Finalmente, completaremos la explicación de la evaluación del rendimiento que introducimos en el módulo anterior.

What's included

7 videos4 readings3 assignments

En este módulo completaremos la explicación de métodos de extracción de características que iniciamos en la primera semana ofreciendo alternativas a la utilización de SIFT. En concreto veremos SURF como un nuevo método de detección y extracción más eficiente computacionalmente que SIFT. Para aumentar la capacidad descriptiva de las características analizaremos otras estrategias para la detección de características locales e introduciremos descriptores que nos permitan tener en cuenta la información del color en la imagen. Veremos también como podemos también mejorar la eficiencia computacional reduciendo la dimensión de los descriptores de carácterísticas locales.

What's included

6 videos3 readings1 assignment

En este módulo veremos cómo podemos combinar diferentes descriptores que aportan diferente tipo de información en el esquema de representación BoW. Explicaremos los diferentes niveles a los que se puede hacer esta combinación: a nivel de descriptores locales (early fusion), a nivel de construcción del vocabulario (intemediate fusion) o a nivel de clasificador (late fusion)

What's included

5 videos3 readings3 assignments

En este módulo abordaremos cómo podemos incorporar información espacial de los objetos de la imagen en la representación BoW. Para ello introduciremos el concepto de pirámide espacial y cómo se utiliza para modificar la representación básica del BoW de forma que tengamos en cuenta la localización en la imagen de cada característica local. Veremos también cómo podemos comparar imágenes que utilizan la pirámide espacial. Finalmente explicaremos una forma de aprender la configuración óptima de una pirámide espacial.

What's included

5 videos3 readings3 assignments

En este último módulo veremos algunas técnicas avanzadas que pueden ser extensiones o alternativas al BoW cuando nos enfrentamos a problemas de clasificación complejos por el tipo o el número de imágenes. En primer lugar veremos los GMM como un método alternativo para construir el vocabulario que nos servirá también para explicar Fisher Vector como otra posibilidad de agregar todas las características locales en una representación de toda la imagen. En el mismo sentido explicaremos también VLAD. Finalizaremos el curso con una breve introducción a las redes neuronales convolucionales (CNNs) que se están constituyendo como un esquema alternativo para la clasificación de imágenes, especialmente en problemas con muchas clases e imágenes.

What's included

7 videos1 reading2 assignments

Instructors

Ernest Valveny
Universitat Autònoma de Barcelona
2 Courses42,521 learners
Jordi Gonzàlez Sabaté
Universitat Autònoma de Barcelona
1 Course15,906 learners
Ramon Baldrich Caselles
Universitat Autònoma de Barcelona
1 Course15,906 learners

Offered by

Recommended if you're interested in Algorithms

Why people choose Coursera for their career

Felipe M.
Learner since 2018
"To be able to take courses at my own pace and rhythm has been an amazing experience. I can learn whenever it fits my schedule and mood."
Jennifer J.
Learner since 2020
"I directly applied the concepts and skills I learned from my courses to an exciting new project at work."
Larry W.
Learner since 2021
"When I need courses on topics that my university doesn't offer, Coursera is one of the best places to go."
Chaitanya A.
"Learning isn't just about being better at your job: it's so much more than that. Coursera allows me to learn without limits."

Learner reviews

4.3

79 reviews

  • 5 stars

    62.02%

  • 4 stars

    21.51%

  • 3 stars

    6.32%

  • 2 stars

    2.53%

  • 1 star

    7.59%

Showing 3 of 79

DM
4

Reviewed on Sep 25, 2016

SR
5

Reviewed on Jan 9, 2017

MS
5

Reviewed on Oct 22, 2021

New to Algorithms? Start here.

Placeholder

Open new doors with Coursera Plus

Unlimited access to 10,000+ world-class courses, hands-on projects, and job-ready certificate programs - all included in your subscription

Advance your career with an online degree

Earn a degree from world-class universities - 100% online

Join over 3,400 global companies that choose Coursera for Business

Upskill your employees to excel in the digital economy

Frequently asked questions