Màster Universitari en Data Science La Salle Campus Barcelona URL

Màster Universitari en Data Science

Converteix-te en un expert en analitzar, estructurar, filtrar, visualitzar i posar en valor la producció de dades generades.

Processament del llenguatge natural

Descripció
L’objectiu de l’assignatura és aprendre a ser capaç d’analitzar dades de text que provinguin del llenguatge natural. Essent una temàtica extensa, es començarà per explicar com processar les dades de text, com codificar-les i com extreure característiques del text que ens permetin aplicar mètodes clàssics d'intel·ligència artificial. A continuació, s’explicaran models seqüencials i morfològics que permeten analitzar el llenguatge tant de forma individual com de forma conjunta, amb l’objectiu d’aprendre a fer classificacions i prediccions en base al llenguatge. Finalment, s’entrarà en el detall de la metodologia dels transformers, com funcionen i com es poden utilitzar per fer anàlisi de llenguatge.
Tipus assignatura
Optativa
Semestre
Segon
Crèdits
5.00
Coneixements previs

Les assignatures MD005 i MD008

Objectius

Els objectius es centraran en:
• Aprendre a processar dades de llenguatge en format text.
• Saber aplicar models clàssics d'intel·ligència artificial a les dades processades de text
• Entendre com funcionen els transformers i saber aplicar-los a les dades de text.

Continguts

TEMARI

1. Processament del text i Count Vectorizer
2. Word Embeddings
3. Models generatius: Hidden Markov Model
4. Models discriminatius: Perceptró estructurat
5. Xarxes neuronals recurrents aplicades a PNL
6. Transformers i ELMO
7. BERT
8. Pràctica final

Nota: els temes poden ajustar i/o modificar-se a criteri de la coordinació del màster.

Metodologia

La metodologia utilitzada combina classes magistrals, participació dels estudiants, realització d’un exercici pràctic a classe i resolució d’un repte o treball d’investigació final. Per a l'estudiant, això implicarà treball en grup amb una presentació oral en classe i un treball individual escrit.

Avaluació

Aquesta assignatura s'avaluarà de manera continuada a partir de la resolució d’un repte proposat a resoldre, o alternativament, un treball de recerca sobre solucions ja existents d’un problema específic a l’àmbit científic, i una presentació final a classe.

Criteris avaluació

Aquesta assignatura s'avaluarà de manera continuada a partir de la resolució d’un repte proposat a resoldre, o alternativament, un treball de recerca sobre solucions ja existents d’un problema específic a l’àmbit científic, i una presentació final a classe.
La nota final serà una ponderació de:
- Resolució repte (implementació) i/o presentación del treball d’investigació: 80%
- Participació a classe: 20%

Convocatòria extraordinària
Es determinarà l’examen i/o treballs de convocatòria extraordinària des de la coordinació de l’assignatura.

Normativa de còpies
L’assignatura es regeix per la normativa de còpies general de La Salle Campus BCN:
https://www.salleurl.edu/ca/normativa-de-copies
Les activitats formatives es consideraran que tenen la següent categoria:
• Treball o repte: altament significativa

Bibliografia bàsica

La bibliografia s'anirà detallant al llarg de l'assignatura.
Tot el material de classe (presentacions, exercicis, articles, documents, etcètera) es compartiran a la carpeta de l'assignatura de la Intranet de La Salle: eStudy.

Material complementari

La bibliografia complementària s'anirà detallant al llarg de l'assignatura.