Hi ha una relació directa entre com de bé una organització gestiona els seus recursos de dades i el seu rendiment financer. L’objectiu de «Processament i anàlisi de dades avançats» és ajudar-te a prendre bones decisions amb dades.
Dos blocs generals:
· (a) governança, gestió i seguretat de dades. Principis, definicions i models a utilitzar en gestionar l’ús de les dades a les organitzacions. Tant marc teòric com implementació pràctica.
· (b) algoritmes i eines per analitzar dades estructurades i no estructurades. Implementació pràctica i teoria. Interpretació estadística de models de ML. Models fundacionals. Avaluació i riscos de ML/FM.
Professors Titulars
Professors Docents
Requisits previs
· Bases de dades
· Eines d’anàlisi de dades
· Programació
· Algoritmes i estructures de dades
L’assignatura serveix com a introducció pràctica a:
· Gestió de dades
· Governança de dades
· Magatzem de dades (Data Warehousing)
· Canalitzacions de dades (Data Pipelines)
· Seguretat de dades
· Regulació de dades
· Aprenentatge automàtic pràctic en el context del processament de dades (gestió i governança)
· Ús pràctic de models fundacionals en el context del processament de dades
El processament i l’anàlisi de dades avançats comprenen accions i mètodes aplicats a les dades que ajuden a descriure fets, detectar patrons, elaborar explicacions i posar a prova hipòtesis. Això inclou:
- Governança de dades
- Anàlisi estadística de dades
- Modelització
- Interpretació de resultats
Pràctiques individuals freqüents i sprints en equip; dades reals; revisions «mostra què has construït».
Cada sessió comença amb una classe magistral i té una secció de treball pràctic, ja sigui individual o en grup. La majoria de sessions inclouen una tasca a classe. En algunes sessions s’assignen lectures, que es proven mitjançant diverses tasques a classe. El curs té un projecte final (capstone) en grup. La majoria de les tasques obligatòries consisteixen en entregues parcials que condueixen a aquest projecte final.
L’examen parcial i el final són individuals.
Què | Pes | Importància | Nota |
Assistència i participació | 20% | Mitjana |
|
Nombre de classes assistides menys 4 | 5% | Baixa |
|
Tasques a l’aula, la millor de 6 | 8% | Baixa |
|
Actitud i contribució | 7% | Mitjana |
|
Projecte en grup | 20% | Mitjana |
|
Presentació intermèdia | 20% | Alta | >4 per aprovar |
Projecte capstone | 20% | Alta | >4 per aprovar |
Presentació | 10% | Mitjana |
|
Informe | 10% | Alta |
|
Examen final | 20% | Alta | >4 per aprovar |
-
Normes i governança/seguretat
ISO/IEC 38500:2024 (governança de TI; principis/model/marc). iso.org | webstore.iec.ch
Ladley, "Data Governance" (2a ed., Academic Press, 2019). shop.elsevier.com
Eryurek et al., "Data Governance: The Definitive Guide" (O’Reilly, 2021). amazon.com
Fitzgerald, "CISO Compass" (Auerbach/CRC Press). taylorfrancis.com
Hyppönen, "If It’s Smart, It’s Vulnerable" (Wiley). wiley.com
Gestió de dades i plataformes (gratuïtes / amb prova)
Microsoft Fabric (prova de 60 dies; laboratoris de Lakehouse). learn.microsoft.com
Databricks Free Edition (espai de treball al núvol per a Spark/Delta/MLflow). community.cloud.databricks.com
Snowflake (prova de 30 dies amb crèdits). signup.snowflake.com
Google BigQuery Sandbox (sense targeta; 10 GB d’emmagatzematge + 1 TB de consultes/mes gratuït). docs.cloud.google.com/bigquery
Amazon Redshift (crèdit de prova sense servidor). aws.amazon.com/redshift
dbt Core (transformacions de codi obert), Airbyte (EL/ELT de codi obert), DuckDB, PostgreSQL. docs.getdbt.com | docs.airbyte.com | duckdb.org | postgresql.org
Delta Lake (format de taules de lakehouse obert). docs.delta.io
Aprenentatge automàtic i models fundacionals
scikit-learn (guia d’usuari per a ML clàssic). scikit-learn.org
Hugging Face Transformers — pipeline API per a inferència ràpida amb MF. huggingface.co
Documentació de MLflow per al seguiment d’experiments i l’avaluació de GenAI. mlflow.org
-