Máster Universitario en Data Science La Salle Campus Barcelona URL

Máster Universitario en Data Science

Conviértete en un experto en analizar, estructurar, filtrar, visualizar y poner en valor la producción de datos generados

Procesado del lenguaje natural

Descripción
El objetivo de la asignatura es ser capaz de analizar datos de texto que provengan del lenguaje natural. Siendo una temática muy extensa, se empezará por explicar cómo procesar los datos de texto, cómo codificarlas y cómo extraer características del texto que nos permitan aplicar métodos clásicos de inteligencia artificial. A continuación, se explicarán modelos secuenciales y morfológicos que permiten analizar el lenguaje tanto de forma individual como conjunta, con el objetivo de aprender a hacer clasificaciones y predicciones en base al lenguaje. Finalmente, se entrará en el detalle de la metodología de los transformers, cómo funcionan y cómo se pueden utilizar para hacer un análisis del lenguaje natural.
Tipo asignatura
Optativa
Semestre
Segundo
Créditos
5.00
Conocimientos previos

Asignaturas MD005 i MD008

Objetivos

Los objetivos se centrarán en:
• Aprender a procesar datos de lenguaje natural en formato texto.
• Saber aplicar modelos clásicos de inteligencia artificial a los datos procesados de texto.
• Entender cómo funcionan los transformers y saber aplicarlos a los datos de texto.

Contenidos

TEMARIO

1. Procesamiento del texto y Count Vectorizer
2. Word Embeddings
3. Modelos generativos: Hidden Markov Model
4. Modelos discriminativos: Perceptrón estructurado
5. Redes neuronales recurrentes aplicadas a PNL
6. Transformers y ELMO
7. BERT
8. Práctica final

Nota: los temas pueden ajustarse y/o modificarse a criterio de la coordinación del máster.

Metodología

La metodología utilizada combina clases magistrales, participación de los estudiantes, realización de un ejercicio práctico en clase y resolución de un reto o trabajo de investigación final. Para el alumno, esto implicará trabajo a realizar en grupo con una presentación oral en clase y un trabajo individual.

Evaluación

Esta asignatura se evaluará de manera continuada a partir de la resolución de un reto propuesto a resolver, o alternativamente, un trabajo de investigación sobre soluciones ya existentes de un problema específico en el ámbito científico, y una presentación final en clase.

Criterios evaluación

Evaluación continua
Esta asignatura se evaluará de manera continuada a partir de la resolución de un reto propuesto a resolver, o alternativamente, un trabajo de investigación sobre soluciones ya existentes de un problema específico en el ámbito científico, y una presentación final en clase.
La nota final será una ponderación de:
- Resolución reto (implementación) y/o presentación del trabajo de investigación: 80%
- Participación en clase: 20%

Convocatoria extraordinaria
Se determinará el examen y/o trabajos de convocatoria extraordinaria desde la coordinación de la asignatura.

Normativa de copias
La asignatura se rige por la normativa de copias general de La Salle Campus BCN:
https://www.salleurl.edu/es/normativa-de-copias
Las actividades formativas se considerarán que tienen la siguiente categoría:
• Trabajo o reto: altamente significativa

Bibliografía básica

La bibliografía se irá detallando a lo largo de la asignatura.
Todo el material de clase (presentaciones, ejercicios, artículos, documentos, etcétera) se compartirán en la carpeta de la asignatura de la Intranet de La Salle: eStudy.

Material complementario

La bibliografía complementaria se irá detallando a lo largo de la asignatura.