Plan de estudios Máster Oficial - Computer Vision
Competencias transversales
Conocimientos
Los graduados adquieren los siguientes conocimientos:
(a) Identificar los módulos y partes internas a distintos niveles en que debe descomponerse un problema de visión para su resolución. Estos conocimientos deberán adaptarse a 3 tipos de problemas que por su naturaleza requieren componentes y niveles diferentes y que clasificamos como:
- Problemas de Reconocimiento Visual que abarcan desde la detección y clasificación de objetos, hasta la segmentación semántica de la imagen. Pasando por la comparación de imágenes y la integración con el lenguaje natural.
- Problemas de Secuencias de Imágenes que van desde la segmentación de video y la estimación del movimiento hasta el reconocimiento de acciones. Pasando por el seguimiento de objetos.
- Problemas de Recuperación la información 3D de las escenas, que va desde la formulación matemática básica de la geometría proyectiva entra la escena, la cámara y la imagen, hasta la recuperación de la profundidad a partir de múltiples imágenes. Todo ello es estudiado tanto para cámaras calibradas como no-calibradas. Finalmente, se estudian las técnicas de procesamiento de nubes de puntos 3D.
(b) Saber proporcionar una modelización adecuada de los componentes de un sistema de visión y la correspondiente formulación matemática, así como, seleccionar los mejores algoritmos que pueden resolver estos componentes. Para que se puedan adquirir estos conocimientos se clasifican todas las técnicas básicas en 3 grandes familias que el estudiante aprende a discriminar para su aplicación:
- Técnicas de procesamiento de bajo nivel de imágenes. Inspiradas en el procesamiento en el sistema visual humano, permiten el preprocesamiento y mejora de las imágenes, la extracción de características y su agrupamiento como base para la construcción de descripciones del contenido de las imágenes.
- Técnicas de optimización e inferencia en imágenes. Asumiendo la interpretación de la imagen como una función o como un grafo definido sobre el dominio espacial de la imagen, las técnicas de cálculo variacional y las técnicas de modelos gráficos permiten extraer características y descriptores usando procesos de optimización.
- Técnicas de aprendizaje computacional para imágenes. Los descriptores de las imágenes se pueden construir a partir de ejemplos bajo un proceso de aprendizaje supervisado, este paradigma abre una larga familia de algoritmos clásicos y de algoritmos basados en redes neuronales profundas que se están imponiendo en la mayoría de aplicaciones.
(c) Reconocer las dimensiones no técnicas sobre los efectos que los sistemas de visión y su aplicación pueden tener sobre el entorno. La visión por computador como campo de especialización de la inteligencia artificial hereda todos los efectos e impacto que ésta plantea a las sociedades modernas, y que los estudiantes deben aprender a reconocer y asumir como parte de su formación.
(d) Saber construir un estado del arte y citar toda la bibliografía relacionada sobre un problema de visión. Esta competencia es relevante en este campo puesto que la evolución del campo es tan dinámica que hace que las técnicas y su aplicación cambien constantemente y requiere que el estudiante sea capaz de adaptarse a todo este cambio y su velocidad.
Así pues, los resultados del aprendizaje de todos estos conocimientos se resumen en los siguientes:
- Identificar todos los componentes necesarios que requerirá un sistema de visión para resolver un problema.
- Saber seleccionar los mejores algoritmos que puedan usarse en cada uno de los componentes que definidos para la resolución de un problema de visión.
- Saber proporcionar una modelización adecuada para la resolución de cualquier parte de un problema de visión.
- Reconocer las dimensiones éticas, económicas, legales, de género y mediambientales de la aplicación de los sistemas de visión.
- Saber construir un estado del arte sobre la resolución de un problema de visión.
Habilidades
Los graduados adquieren las siguientes habilidades:
- Aplicar las técnicas matemáticas que permiten solucionar un problema de visión y evaluar los resultados en todos sus componentes.
- Seleccionar las mejores herramientas software para codificar las técnicas que permitan solucionar un problema particular de visión.
- Construir los mejores conjuntos de datos que permitan entrenar arquitecturas que solucionarán un problema particular de visión.
- Estimar los efectos medioambientales o discriminatorios que se pueden derivar de los experimentos o de los datos usados en los sistemas desarrollados.
- Preparar un documento que describa en su totalidad los resultados del desarrollo de un proyecto de visión.
- Defender a través de una presentación oral los resultados del desarrollo de un proyecto de visión.
- Determinar el proceso de transferencia tecnológica más adecuado para la innovación en un proyecto de visión.
Que se clasifican en los siguientes tipos:
(a) Habilidades de resolución de problemas (S01,S04):
Los graduados deben ser capaces de aplicar las diferentes técnicas y los algoritmos seleccionados para la resolución de problemas específicos de visión. Desde la aplicación, el desarrollo y la evaluación adecuada en cada caso. Estas técnicas se pueden enmarcarse en 3 grupos diferentes:
- Técnicas basadas en el procesamiento de imágenes de bajo nivel que mejoren o preparan la imagen con técnicas de filtraje lineal y no lineal, para su posterior extracción de características y la derivación de descriptores.
- Técnicas basadas en optimización que requieren que el estudiante sepa aplicar métodos de optimización adecuados para la resolución del funcional que define la solución del problema.
- Técnicas de aprendizaje computacional, en este caso el estudiantes debe ser capaz de preparar los conjuntos de entrenamiento, validación y prueba para que cuando apliquen los algoritmos permitan generalizar y solucionar el problema correctamente.
Además de las técnicas de generales descritas, en este apartado se incluyen nuevas habilidades que se derivan de los nuevos problemas que ha planteado la definición de sistemas inteligentes que usan redes neuronales profundas y que se relacionan con dos efectos:
- El entrenamiento de estas redes genera consumos energéticos que pueden ser insostenibles.
- Los conjuntos de datos sobre los que se entrenan las arquitecturas pueden contener sesgos que pueden generar sistemas con comportamientos arbitrarios o discriminatorios.
Por tanto, los graduados deberán ser capaces de aplicar métodos que permitan calcular costes y sesgos para evitar estos efectos.
(b) Habilidades cognitivas y creativas (S02,S03,S07):
Los graduados deber ser capaces de seleccionar las mejores herramientas software en función del tipo de problema que se esté solucionando. Estas herramientas pueden provenir de diversas fuentes:
- Recopiladas y clasificadas en librerías estándares de los lenguajes de programación usados.
- Seleccionadas de entre los múltiples repositorios públicos asociados a publicaciones o grupos de investigación.
- Diseñadas y codificadas por ellos mismos en función de la especificidad que requiera el problema.
También deben ser capaces de crear y preparar los conjuntos de datos más adecuados que se requieran para el entrenamiento de las soluciones diseñadas para cada sistema de visión. Estos conjuntos de entrenamientos serán dependientes del tipo de problema, y en particular se desarrollarán habilidades para los tres principales tipos de sistemas:
- Problemas de recuperación de información 3D
- Problemas de reconocimiento visual
- Problemas sobre secuencias de imágenes
Finalmente, los estudiantes deberán ser capaces de determinar y aplicar el mejor proceso de transferencia tecnológica de los resultados de un proyecto de visión concreto. Para ello deberán identificar la mejor estrategia de innovación en función de las propiedades específicas como son:
- Posibilidad de ser patentado
- Propiedades del plan de negocio
- Oportunidades de financiación pública o privada
(c) Habilidades de comunicación (S05,S06):
Las habilidades de comunicación se centran esencialmente en dos tipos de comunicaciones:
- El documento escrito que utilice todos los recursos de escritura científica, argumentación, esquematización e ilustración para diseminar la información más relevante de los resultados.
- La presentación oral que utilice de manera adecuada todos los recursos de orales de la lengua y los medios audiovisuales que puedan dar soporte al mensaje.
Competencias
Las competencias en un contexto real del graduado son las siguientes:
- Diseñar todos los componentes de un sistema completo de visión por computador en cualquier contexto real que se pueda plantear.
- Planificar el desarrollo, la evaluación y la diseminación de una solución a un problema real de visión por computador.
- Predecir y resolver los problemas que se derivan del trabajo en equipo en diferentes situaciones.