Pla d'estudis Màster Oficial - Computer Vision
Coneixements
Els graduats adquireixen els coneixements següents:
(a) Identificar els mòduls i les parts internes a diferents nivells en què s'ha de descompondre un problema de visió per a la seva resolució. Aquests coneixements s'hauran d'adaptar a 3 tipus de problemes que per la seva naturalesa requereixen components i nivells diferents i que classifiquem com:
- Problemes de Reconeixement Visual que comprenen des de la detecció i classificació d'objectes fins a la segmentació semàntica de la imatge. Passant per la comparació d'imatges i integració amb el llenguatge natural.
- Problemes de seqüències d'imatges que van des de la segmentació de vídeo i l'estimació del moviment fins al reconeixement d'accions. Passant pel seguiment d'objectes.
- Problemes de Recuperació de la informació 3D de les escenes, que va des de la formulació matemàtica bàsica de la geometria projectiva entra l'escena, la càmera i la imatge, fins a la recuperació de la profunditat a partir de múltiples imatges. Tot això és estudiat tant per a càmeres calibrades com no-calibrades. Finalment, s'estudien les tècniques de processament de núvols de punts 3D.
(b) Saber proporcionar una modelització adequada dels components d'un sistema de visió i la corresponent formulació matemàtica, així com seleccionar els millors algorismes que poden resoldre aquests components. Perquè es puguin adquirir aquests coneixements es classifiquen totes les tècniques bàsiques en 3 grans famílies que l'estudiant aprèn a discriminar per aplicar-lo:
- Tècniques de processament de baix nivell d'imatges. Inspirades en el processament en el sistema visual humà, permeten el preprocessament i la millora de les imatges, l'extracció de característiques i el seu agrupament com a base per a la construcció de descripcions del contingut de les imatges.
- Tècniques d'optimització i d'inferència en imatges. Assumint la interpretació de la imatge com una funció o com un graf definit sobre el domini espacial de la imatge, les tècniques de càlcul variacional i les tècniques de models gràfics permeten extreure característiques i descriptors fent servir processos d'optimització.
- Tècniques d'aprenentatge computacional per a imatges. Els descriptors de les imatges es poden construir a partir d'exemples sota un procés d'aprenentatge supervisat, aquest paradigma obre una llarga família d'algorismes clàssics i d'algorismes basats en xarxes neuronals profundes que s'estan imposant a la majoria d'aplicacions.
(c) Reconèixer les dimensions no tècniques sobre els efectes que els sistemes de visió i la seva aplicació poden tindre sobre l'entorn. La visió per computador com a camp d'especialització de la intel·ligència artificial hereta tots els efectes i l'impacte que aquesta planteja a les societats modernes, i que els estudiants han d'aprendre a reconèixer i assumir com a part de la seva formació.
(d) Saber construir un estat de l'art i esmentar tota la bibliografia relacionada sobre un problema de visió. Aquesta competència és rellevant en aquest camp, ja que l'evolució del camp és tan dinàmica que fa que les tècniques i la seva aplicació canviïn constantment i requereix que l'estudiant sigui capaç d'adaptar-se a tot aquest canvi i velocitat.
Així, doncs, els resultats de l'aprenentatge de tots aquests coneixements es resumeixen en els següents:
- Saber seleccionar els millors algoritmes que es puguin fer servir en cadascun dels components definits per resoldre un problema de visió
- Saber proporcionar una modelització adequada per a la resolució de qualsevol part d’un problema de visió.
- Reconèixer les dimensions ètiques, econòmiques, legals, de gènere i mediambientals de l’aplicació dels sistemes de visió.
- Saber construir un estat de l’art sobre la resolució d’un problema de visió.
Habilitats
Els graduats adquireixen les habilitats següents:
- Aplicar les tècniques matemàtiques que permeten solucionar un problema de visió i avaluar els resultats en tots els seus components.
- Seleccionar les millors eines de programari per codificar les tècniques que permetin solucionar un problema particular de visió.
- Construir els millors conjunts de dades que permetin entrenar arquitectures que solucionaran un problema particular de visió.
- Estimar els efectes mediambientals o discriminatoris que es poden derivar dels experiments o de les dades usades en els sistemes desenvolupats.
- Preparar un document que descrigui totalment els resultats del desenvolupament d’un projecte de visió.
- Defensar a través d’una presentació oral els resultats del desenvolupament d’un projecte de visió.
- Determinar el procés de transferència tecnològica més adequat per a la innovació en un projecte de visió.
Que es classifiquen en els tipus següents:
(a) Habilitats de resolució de problemes (S01,S04):
Els graduats han de ser capaços d'aplicar les diferents tècniques i els algoritmes seleccionats per resoldre problemes específics de visió. Des de l'aplicació, el desenvolupament i l'avaluació adequada en cada cas. Aquestes tècniques es poden emmarcar en 3 grups diferents:
- Tècniques basades en el processament d'imatges de baix nivell que millorin o preparen la imatge amb tècniques de filtratge lineal i no lineal, per a la posterior extracció de característiques i la derivació de descriptors.
- Tècniques basades en optimització que requereixen que els estudiants sàpiguen aplicar mètodes d'optimització adequats per a la resolució del funcional que defineix la solució del problema.
- Tècniques d'aprenentatge computacional, en aquest cas els estudiants han de ser capaços de preparar els conjunts d'entrenament, validació i prova perquè quan apliquin els algorismes permetin generalitzar i solucionar el problema correctament.
A més de les tècniques de generals descrites, en aquest apartat s'inclouen noves habilitats que es deriven dels nous problemes que ha plantejat la definició de sistemes intel·ligents que usen xarxes neuronals profundes i que es relacionen amb dos efectes:
- L'entrenament d'aquestes xarxes genera consums energètics que poden ser insostenibles.
- Els conjunts de dades sobre les quals s'entrenen les arquitectures poden contenir biaixos que poden generar sistemes amb comportaments arbitraris o discriminatoris.
Per tant, els graduats han de ser capaços d'aplicar mètodes que permetin calcular costos i biaixos per evitar aquests efectes.
(b) Habilitats cognitives i creatives (S02,S03,S07):
Els graduats han de ser capaços de seleccionar les millors eines de programari en funció del tipus de problema que s'estigui solucionant. Aquestes eines poden provenir de diverses fonts:
- Recopilades i classificades en llibreries estàndards dels llenguatges de programació usats.
- Seleccionades entre els múltiples repositoris públics associats a publicacions o grups de recerca.
- Dissenyades i codificades per ells mateixos segons l'especificitat que requereixi el problema.
També han de ser capaços de crear i preparar els conjunts de dades més adients que es requereixin per a l'entrenament de les solucions dissenyades per a cada sistema de visió. Aquests conjunts d'entrenaments seran dependents del tipus de problema i, en particular, es desenvoluparan habilitats per als tres principals tipus de sistemes:
- Problemes de recuperació d'informació 3D
- Problemes de reconeixement visual
- Problemes sobre seqüències d'imatges.
Finalment, els estudiants han de ser capaços de determinar i aplicar el millor procés de transferència tecnològica dels resultats d'un projecte de visió concret. Per això, hauran d'identificar la millor estratègia d'innovació en funció de les propietats específiques com són:
- Possibilitat de ser patentat
- Propietats del pla de negoci
- Oportunitats de finançament públic o privat.
(c) Habilitats de comunicació (S05,S06):
Les habilitats de comunicació se centren essencialment en dos tipus de comunicacions:
- El document escrit que utilitzi tots els recursos d'escriptura científica, argumentació, esquematització i il·lustració per disseminar la informació més rellevant dels resultats.
- La presentació oral que faci ús de manera adequada tots els recursos orals de la llengua i els mitjans audiovisuals que puguin donar suport al missatge.
Competències
Les competències en un context real del graduat són les següents:
- Dissenyar tots els components d’un sistema complet de visió per computador en qualsevol context real que es pugui plantejar.
- Planificar el desenvolupament, l’avaluació i la disseminació d’una solució a un problema real de visió per computador.
- Predir i resoldre els problemes que es deriven del treball en equip en diferents situacions.