El objetivo de la asignatura es ser capaz de analizar datos de texto que provengan del lenguaje natural. Siendo una temática muy extensa, se empezará por explicar cómo procesar los datos de texto, cómo codificarlas y cómo extraer características del texto que nos permitan aplicar métodos clásicos de inteligencia artificial. A continuación, se explicarán modelos secuenciales y morfológicos que permiten analizar el lenguaje tanto de forma individual como conjunta, con el objetivo de aprender a hacer clasificaciones y predicciones en base al lenguaje. Finalmente, se entrará en el detalle de la metodología de los transformers, cómo funcionan y cómo se pueden utilizar para hacer un análisis del lenguaje natural.
Asignaturas MD005 i MD008
Los objetivos se centrarán en:
Aprender a procesar datos de lenguaje natural en formato texto.
Saber aplicar modelos clásicos de inteligencia artificial a los datos procesados de texto.
Entender cómo funcionan los transformers y saber aplicarlos a los datos de texto.
TEMARIO
1. Procesamiento del texto y Count Vectorizer
2. Word Embeddings
3. Modelos generativos: Hidden Markov Model
4. Modelos discriminativos: Perceptrón estructurado
5. Redes neuronales recurrentes aplicadas a PNL
6. Transformers y ELMO
7. BERT
8. Práctica final
Nota: los temas pueden ajustarse y/o modificarse a criterio de la coordinación del máster.
La metodología utilizada combina clases magistrales, participación de los estudiantes, realización de un ejercicio práctico en clase y resolución de un reto o trabajo de investigación final. Para el alumno, esto implicará trabajo a realizar en grupo con una presentación oral en clase y un trabajo individual.
Esta asignatura se evaluará de manera continuada a partir de la resolución de un reto propuesto a resolver, o alternativamente, un trabajo de investigación sobre soluciones ya existentes de un problema específico en el ámbito científico, y una presentación final en clase.
Evaluación continua
Esta asignatura se evaluará de manera continuada a partir de la resolución de un reto propuesto a resolver, o alternativamente, un trabajo de investigación sobre soluciones ya existentes de un problema específico en el ámbito científico, y una presentación final en clase.
La nota final será una ponderación de:
- Resolución reto (implementación) y/o presentación del trabajo de investigación: 80%
- Participación en clase: 20%
Convocatoria extraordinaria
Se determinará el examen y/o trabajos de convocatoria extraordinaria desde la coordinación de la asignatura.
Normativa de copias
La asignatura se rige por la normativa de copias general de La Salle Campus BCN:
https://www.salleurl.edu/es/normativa-de-copias
Trabajo o reto: altamente significativa
La bibliografía se irá detallando a lo largo de la asignatura.
Todo el material de clase (presentaciones, ejercicios, artículos, documentos, etcétera) se compartirán en la carpeta de la asignatura de la Intranet de La Salle: eStudy.
La bibliografía complementaria se irá detallando a lo largo de la asignatura.