Existe una relación directa entre lo bien que una organización gestiona sus recursos de datos y su rendimiento financiero. El objetivo de «Procesamiento y análisis de datos avanzados» es ayudarte a tomar buenas decisiones con datos.
Dos bloques generales:
· (a) gobernanza, gestión y seguridad de datos. Principios, definiciones y modelos que utilizar al gestionar el uso de los datos en las organizaciones. Tanto marco teórico como implementación práctica.
· (b) algoritmos y herramientas para analizar datos estructurados y no estructurados. Implementación práctica y teoría. Interpretación estadística de modelos de ML. Modelos fundacionales. Evaluación y riesgos de ML/FM.
Profesores Titulares
Profesores Docentes
Requisitos previos
· Bases de datos
· Herramientas de análisis de datos
· Programación
· Algoritmos y estructuras de datos
La asignatura sirve como una introducción práctica a:
1. Gestión de datos
2. Gobernanza de datos
3. Almacenamiento de datos (Data Warehousing)
4. Tuberías de datos (Data Pipelines)
5. Seguridad de datos
6. Regulación de datos
7. Aprendizaje automático práctico en el contexto del procesamiento de datos (gestión y gobernanza)
8. Uso práctico de Modelos Fundacionales en el contexto del procesamiento de datos
El procesamiento y análisis de datos avanzados comprende acciones y métodos aplicados a los datos que ayudan a describir hechos, detectar patrones, elaborar explicaciones y poner a prueba hipótesis. Esto incluye:
· Gobernanza de datos
· Análisis estadístico de datos
· Modelización
Interpretación de resultadoslado - Interpretación de resultados
La asignatura tiene un funcionamiento semanal con dos sesiones lectivas. Cada sesión es divide en dos partes: una primera parte es magistral en la que el profesor explica a los nuevos Contenidos y una segunda en la que a los alumnos trabajan en nuevos Ejercicios para consolidar la materia. Cada dos o tres sesiones se realizan actividades evaluativas individuales o en grupo mediante Pruebas escritas, Recogida de los Ejercicios realizados en casa, etc. En la siguiente tabla se ponen en relación los resultados de aprendizaje con el contenido impartido para alcanzarlos R1. Comprender el concepto de gobernanza de datos - Reconocer los activos de datos de los sistemas de información - Definiciones de gobierno de datos - Principios de orientación ISO para la gestión - Beneficios de un buen gobierno de los datos - ¿Cree que el gobierno de datos y los resultados empresariales están correlacionados? R2. Definir una correcta estrategia de datos alineada con la estrategia empresarial - Componentes del gobierno de datos - Componentes del plan de gestión de datos - Ciclo de vida de los datos - Examinar la relación entre la gestión de datos y el gobierno de datos R3. Definir una correcta estrategia de gobernanza de datos - Estrategia de gobierno de datos - Estrategia de datos en la era del Big Data - Plantilla de gobierno de datos R4. Comprender cómo proteger los datos - Seguridad de datos, conformidad y copias de seguridad y MIS2 - Recuperación en caso de catástrofe y continuidad de la actividad R5. Manipular y codificar algoritmos supervisados y no supervisados de aprendizaje automático: Código básico, ejemplos, script
Qué | Peso | Importancia | Nota |
Asistencia y participación | 20% | Media |
|
Número de clases asistidas menos 4 | 5% | Baja |
|
Tareas en el aula, la mejor de 6 | 8% | Baja |
|
Actitud y contribución | 7% | Media |
|
Proyecto en grupo | 20% | Media |
|
Presentación de mitad de curso | 20% | Alta | >4 para aprobar |
Proyecto capstone | 20% | Alta | >4 para aprobar |
Presentación | 10% | Media |
|
Informe | 10% | Alta |
|
Examen final | 20% | Alta | >4 para aprobar |
-
Recursos obligatorios / recomendados
Normas y gobernanza/seguridad
ISO/IEC 38500:2024 (gobernanza de TI; principios/modelo/marco). iso.org | webstore.iec.ch
Ladley, "Data Governance" (2ª ed., Academic Press, 2019). shop.elsevier.com
Eryurek et al., "Data Governance: The Definitive Guide" (O’Reilly, 2021). amazon.com
Fitzgerald, "CISO Compass" (Auerbach/CRC Press). taylorfrancis.com
Hyppönen, "If It’s Smart, It’s Vulnerable" (Wiley). wiley.com
Gestión de datos y plataformas (gratuitas / con prueba)
Microsoft Fabric (prueba de 60 días; laboratorios de Lakehouse). learn.microsoft.com
Databricks Free Edition (espacio de trabajo en la nube para Spark/Delta/MLflow). community.cloud.databricks.com
Snowflake (prueba de 30 días con créditos). signup.snowflake.com
Google BigQuery Sandbox (sin tarjeta; 10 GB de almacenamiento + 1 TB de consultas/mes gratis). docs.cloud.google.com/bigquery
Amazon Redshift (crédito de prueba sin servidor). aws.amazon.com/redshift
dbt Core (transformaciones de código abierto), Airbyte (EL/ELT de código abierto), DuckDB, PostgreSQL. docs.getdbt.com | docs.airbyte.com | duckdb.org | postgresql.org
Delta Lake (formato de tablas de lakehouse abierto). docs.delta.io
Aprendizaje automático y Modelos Fundacionales
scikit-learn (guía del usuario para ML clásico). scikit-learn.org
Hugging Face Transformers — pipeline API para inferencia rápida con MF. huggingface.co
Documentación de MLflow para seguimiento de experimentos y evaluación de GenAI. mlflow.org
-