Máster Universitario en Data Science La Salle Campus Barcelona URL

Máster Universitario en Data Science

Conviértete en un experto en analizar, estructurar, filtrar, visualizar y poner en valor la producción de datos generados

Estructuras de datos y su almacenamiento

Descripción
Nos centraremos en los Sistemas Informacionales como la principal fuente de datos para nuestros desarrollos. Para ello habrá dos principales puntos de vista. El primero de ellos será un complemento a las infraestructuras físicas trabajadas en la asignatura MD002 – Infraestructuras de computación, pero centrándonos en la organización y transformación de la información en función del uso final que se requiera. El segundo de ellos será en el ciclo de vida del dato, desde su origen hasta la transformación de estos en información y por último y más importante, en valor. Todo con el objetivo de dotaros de una visión end-to-end de las distintas arquitecturas de datos que os podéis encontrar en el mercado empresarial a la hora de entender y explotar el ciclo informacional del dato. Este ciclo va desde los orígenes de la información (mundo operacional/transaccional) hasta los entornos de datos preparados para la explotación de los datos (DataLake, DWH o SANDBOX’s). Cuando hablamos de entornos de arquitecturas de datos, no solo nos referimos a arquitecturas físicas (HW), o a la definición lógica y tecnológica (herramientas) de estas, sino también a aquellas estructuras de datos que permiten la optimización y el gobierno de datos ya transformado en información.
Tipo asignatura
Primer - Obligatoria
Semestre
Primero
Curso
1
Créditos
5.00

Profesores Docentes

Conocimientos previos

Recomendable: Conocimientos medios en informática acerca de bases de datos relacionales, programación orientada a objetos y sistemas operativos (comunicación entre procesos y gestión de memoria).

Sería recomendable conocimientos en bases de datos y sistemas operativos.

Objetivos

Los objetivos se centrarán en:
• Conocer los conceptos clave y bases de los modelos de información necesarios para entender el papel de los perfiles existentes alrededor de un sistema de información y su explotación.
• Tener una visión lo más amplia posible de las distintas arquitecturas informacionales, tanto de las ya existentes y afianzadas en el mercado empresarial, como de las nuevas visiones disruptivas a partir de las nuevas tecnologías disponibles.
• Aprender a recoger, transformar y procesar la información en función de su origen, volumen, formato y periodicidad de análisis.
• Entender las distintas formas de Data Governance con el objetivo de comprender el aporte al día a día en el trabajo de un Data Scientist.

Contenidos

1. Conceptos clave y bases de modelos de información
1.1. Historia de las Bases de Datos
1.2. Figuras clave alrededor de los sistemas informacionales (Data Science, Data Analyst, Product Owner, etc.)
1.3. Roles de un Data Scientist e interacción con el resto
1.4. DBMS vs RDBMS (concepto de explotación de la información)
1.5. Teoría y ejemplos prácticos de Modelos Relacionales
1.6. Definición y concepto de ETL

2. Qué es la información y cómo le extraemos valor
2.1. Concepto de dato e información (del origen del dato hasta explotar información y conseguir valor)
2.2. ¿Business Intelligence y cómo se comprende con Data Science?
2.3. Big Data
2.3.1. ELT vs ETL
2.3.2. Concepto de arquitectura
2.4. Tipos de arquitecturas de datos
2.4.1. Lógica/Tecnológica/Física
2.4.2. Entornos de información (DEV, PRO, SandBox, …)
2.4.3. Conceptos DataLake, DWH, etc.
2.5. Arquitectura de Modelos de datos IA
2.5.1. Desarrollo
2.5.2. Validación y promoción a PRO (batch y online)
2.5.3. Monitorización

3. Explotar los distintos tipos de información
3.1. DB Estructuradas (repaso y ampliación de lo ya visto)
3.2. DB Semi-Estructuradas
3.3. DB No Estructuradas

4. Web Scraping cómo origen de datos
4.1. ¿Qué es Web Scraping?
4.2. Aspectos legales
4.3. Herramientas

5. Cloud Computing for Data Scientist

6. La importancia de la trazabilidad y fiabilidad de los datos (Data Governance)

Nota: los temas pueden ajustarse y/o modificarse a criterio de la coordinación del máster.

Metodología

La metodología utilizada combina clases magistrales, participación de los estudiantes, ejercicios y prácticas. Para el alumno, esto implicará tanto trabajos individuales como en grupo, así como ejercicios conceptuales, ejercicios escritos y presentaciones orales.

Evaluación

Esta asignatura se evaluará de manera continuada a partir de ejercicios, trabajos, prácticas y presentaciones en clase.

Criterios evaluación

Evaluación continua
Esta asignatura se evaluará de manera continuada a partir de ejercicios, trabajos, prácticas y presentaciones en clase.
La nota final será una ponderación de:
- Práctica sobre un sistema de información relacional: 30%
- Práctica sobre sistemas de datos no estructurados: 30%
- Trabajo final y presentación: 40%

Convocatoria extraordinaria
Se determinará el examen y/o trabajos de convocatoria extraordinaria desde la coordinación de la asignatura.

Normativa de copias
La asignatura se rige por la normativa de copias general de La Salle Campus BCN:
https://www.salleurl.edu/es/normativa-de-copias
Las actividades formativas se considerarán que tienen la siguiente categoría:
• Ejercicios: moderadamente significativa
• Proyecto: altamente significativa
• Evaluación Final: altamente significativa

Bibliografía básica

La bibliografía se irá detallando a lo largo de la asignatura:

• Apuntes de clase
• Documentación y artículos subidos a la Intranet (eStudy)

Material complementario

Todo el material de clase (presentaciones, ejercicios, artículos, documentos, etcétera) se compartirán en la carpeta de la asignatura de la Intranet de La Salle: eStudy.