Grado en Business Intelligence y Data Analytics

Conviértete en un experto en análisis de datos y toma de decisiones empresariales dentro de un ecosistema tecnológico, con excelentes oportunidades laborales

Análisis avanzado de datos

Descripción: 

Existe una relación directa entre lo bien que una organización gestiona sus recursos de datos y su rendimiento financiero. El objetivo de «Procesamiento y análisis de datos avanzados» es ayudarte a tomar buenas decisiones con datos.

Dos bloques generales:

·         (a) gobernanza, gestión y seguridad de datos. Principios, definiciones y modelos que utilizar al gestionar el uso de los datos en las organizaciones. Tanto marco teórico como implementación práctica.

·         (b) algoritmos y herramientas para analizar datos estructurados y no estructurados. Implementación práctica y teoría. Interpretación estadística de modelos de ML. Modelos fundacionales. Evaluación y riesgos de ML/FM.

Tipo asignatura
Tercer - Obligatoria
Semestre
Segundo
Curso
2
Créditos
6.00

Profesores Titulares

Profesores Docentes

Conocimientos previos: 

Requisitos previos


·         Bases de datos

·         Herramientas de análisis de datos

·         Programación

·         Algoritmos y estructuras de datos

Objetivos: 

La asignatura sirve como una introducción práctica a:

1.       Gestión de datos

2.       Gobernanza de datos

3.       Almacenamiento de datos (Data Warehousing)

4.       Tuberías de datos (Data Pipelines)

5.       Seguridad de datos

6.       Regulación de datos

7.       Aprendizaje automático práctico en el contexto del procesamiento de datos (gestión y gobernanza)

8.       Uso práctico de Modelos Fundacionales en el contexto del procesamiento de datos

Contenidos: 

El procesamiento y análisis de datos avanzados comprende acciones y métodos aplicados a los datos que ayudan a describir hechos, detectar patrones, elaborar explicaciones y poner a prueba hipótesis. Esto incluye:

·        Gobernanza de datos

·        Análisis estadístico de datos

·        Modelización

Interpretación de resultadoslado - Interpretación de resultados

Metodología: 

La asignatura tiene un funcionamiento semanal con dos sesiones lectivas. Cada sesión es divide en dos partes: una primera parte es magistral en la que el profesor explica a los nuevos Contenidos y una segunda en la que a los alumnos trabajan en nuevos Ejercicios para consolidar la materia. Cada dos o tres sesiones se realizan actividades evaluativas individuales o en grupo mediante Pruebas escritas, Recogida de los Ejercicios realizados en casa, etc. En la siguiente tabla se ponen en relación los resultados de aprendizaje con el contenido impartido para alcanzarlos R1. Comprender el concepto de gobernanza de datos - Reconocer los activos de datos de los sistemas de información - Definiciones de gobierno de datos - Principios de orientación ISO para la gestión - Beneficios de un buen gobierno de los datos - ¿Cree que el gobierno de datos y los resultados empresariales están correlacionados? R2. Definir una correcta estrategia de datos alineada con la estrategia empresarial - Componentes del gobierno de datos - Componentes del plan de gestión de datos - Ciclo de vida de los datos - Examinar la relación entre la gestión de datos y el gobierno de datos R3. Definir una correcta estrategia de gobernanza de datos - Estrategia de gobierno de datos - Estrategia de datos en la era del Big Data - Plantilla de gobierno de datos R4. Comprender cómo proteger los datos - Seguridad de datos, conformidad y copias de seguridad y MIS2 - Recuperación en caso de catástrofe y continuidad de la actividad R5. Manipular y codificar algoritmos supervisados y no supervisados de aprendizaje automático: Código básico, ejemplos, script

Evaluación: 

Qué

Peso

Importancia

Nota

Asistencia y participación

20%

Media

 

Número de clases asistidas menos 4

5%

Baja

 

Tareas en el aula, la mejor de 6

8%

Baja

 

Actitud y contribución

7%

Media

 

Proyecto en grupo

20%

Media

 

Presentación de mitad de curso

20%

Alta

>4 para aprobar

Proyecto capstone

20%

Alta

>4 para aprobar

Presentación

10%

Media

 

Informe

10%

Alta

 

Examen final

20%

Alta

>4 para aprobar

Criterios evaluación: 

-

Bibliografía básica: 

Recursos obligatorios / recomendados


Normas y gobernanza/seguridad

ISO/IEC 38500:2024 (gobernanza de TI; principios/modelo/marco). iso.org | webstore.iec.ch

Ladley, "Data Governance" (2ª ed., Academic Press, 2019). shop.elsevier.com

Eryurek et al., "Data Governance: The Definitive Guide" (O’Reilly, 2021). amazon.com

Fitzgerald, "CISO Compass" (Auerbach/CRC Press). taylorfrancis.com

Hyppönen, "If It’s Smart, It’s Vulnerable" (Wiley). wiley.com

Gestión de datos y plataformas (gratuitas / con prueba)

Microsoft Fabric (prueba de 60 días; laboratorios de Lakehouse). learn.microsoft.com

Databricks Free Edition (espacio de trabajo en la nube para Spark/Delta/MLflow). community.cloud.databricks.com

Snowflake (prueba de 30 días con créditos). signup.snowflake.com

Google BigQuery Sandbox (sin tarjeta; 10 GB de almacenamiento + 1 TB de consultas/mes gratis). docs.cloud.google.com/bigquery

Amazon Redshift (crédito de prueba sin servidor). aws.amazon.com/redshift

dbt Core (transformaciones de código abierto), Airbyte (EL/ELT de código abierto), DuckDB, PostgreSQL. docs.getdbt.com | docs.airbyte.com | duckdb.org | postgresql.org

Delta Lake (formato de tablas de lakehouse abierto). docs.delta.io

Aprendizaje automático y Modelos Fundacionales

scikit-learn (guía del usuario para ML clásico). scikit-learn.org

Hugging Face Transformers — pipeline API para inferencia rápida con MF. huggingface.co

Documentación de MLflow para seguimiento de experimentos y evaluación de GenAI. mlflow.org

Material complementario: 

-