El processament de la imatge i la visió per computador són dues àrees que estan experimentant una enorme evolució dins de les ciències de la computació, en tot allò referent a noves aplicacions i nous mètodes. En aquest camp, la finalitat és dotar una màquina de la capacitat de percebre una imatge, processar-la i extreure informació per entendren el contingut i prendre decisions. Aquí és on la ciència de les dades pren un paper rellevant, ja que les imatges digitals són una col·lecció d'informació (dades) que representen el nostre entorn, i els mètodes d'anàlisi de dades, reconeixement de patrons i agrupació de dades són bàsics en els processos d'extracció d'informació i de presa de decisions. Mètodes d'extracció de característiques, machine learning, deep learning, compressió de dades, anàlisi de variància i components principals són eines bàsiques en làmbit de la visió per computador.
Les assignatures obligatòries del màster (MD005 i MD008)
Els objectius es centraran en:
Adquisició de coneixements del processament de la imatge, tècniques bàsiques de manipulació i extracció de característiques visuals.
Aplicació de diverses tècniques de machine learning i deep learning per a la resolució de problemes de visió per computador (classificació, detecció, segmentació, tracking)
TEMARI
1. Processament de la imatge I: Definició dimatge i processament bàsic de color i deformacions espacials. (Teoricopràctic) (1.5 hores)
2. Processament de la imatge II: Tècniques de filtratge, morfologia, segmentació, descriptors de baix nivell. (Teoricopràctic) (1.5 hores)
3. Processament de la imatge III: Extracció clàssica de descriptors visuals: Histogrames, HOG, LBP, Fourier, Wavelets, filtres. (Teoricopràctic) (1.5 hores)
4. Visió per computador I: Mètodes de classificació, detecció i segmentació (Machine Learning). (Teòrica) (1.5 hores)
5. Visió per computador II: Pràctica de machine learning: KNN, SVM, Random forest. (Pràctica) (1.5 hores)
6. Visió per computador III: Deep learning aplicat a detecció/classificació. (Teòrica) (1.5 hores)
7. Visió per computador IV: Pràctica de Deep Learning. (Pràctica) (1.5 hores)
8. Visió per computador V: Tècniques avançades de deep learning, transfer learning, generació dimatges. (Teoricopràctica) (1.5 hores)
Nota: els temes poden ajustar i/o modificar-se a criteri de la coordinació del màster.
La metodologia utilitzada combina classes magistrals, participació dels estudiants, realització dun exercici pràctic a classe i resolució dun repte o treball dinvestigació final. Per a l'estudiant, això implicarà treball en grup amb una presentació oral en classe i un treball individual escrit.
Aquesta assignatura s'avaluarà de manera continuada a partir de la resolució dun repte proposat a resoldre, o alternativament, un treball de recerca sobre solucions ja existents dun problema específic a làmbit científic, i una presentació final a classe.
Avaluació continua
Aquesta assignatura s'avaluarà de manera continuada a partir de la resolució dun repte proposat a resoldre, o alternativament, un treball de recerca sobre solucions ja existents dun problema específic a làmbit científic, i una presentació final a classe.
La nota final serà una ponderació de:
- Resolució repte (implementació) i/o presentació del treball dinvestigació: 80%
- Resolució de qüestionaris a classe : 20%
Convocatòria extraordinària
Es determinarà lexamen i/o treballs de convocatòria extraordinària des de la coordinació de lassignatura.
Normativa de còpies
Lassignatura es regeix per la normativa de còpies general de La Salle Campus BCN:
https://www.salleurl.edu/ca/normativa-de-copies
Les activitats formatives es consideraran que tenen la següent categoria:
Treball o repte: altament significativa
La bibliografia s'anirà detallant al llarg de l'assignatura.
Tot el material de classe (presentacions, exercicis, articles, documents, etcètera) es compartiran a la carpeta de l'assignatura de la Intranet de La Salle: eStudy.
La bibliografia complementària s'anirà detallant al llarg de l'assignatura.