Descripció: 

Hi ha una relació directa entre com de bé una organització gestiona els seus recursos de dades i el seu rendiment financer. L’objectiu de «Processament i anàlisi de dades avançats» és ajudar-te a prendre bones decisions amb dades.

Dos blocs generals:

·         (a) governança, gestió i seguretat de dades. Principis, definicions i models a utilitzar en gestionar l’ús de les dades a les organitzacions. Tant marc teòric com implementació pràctica.

·         (b) algoritmes i eines per analitzar dades estructurades i no estructurades. Implementació pràctica i teoria. Interpretació estadística de models de ML. Models fundacionals. Avaluació i riscos de ML/FM.

Tipus assignatura
Tercer - Obligatoria
Semestre
Segon
Curs
2
Crèdits
6.00

Professors Titulars

Professors Docents

Coneixements previs: 

Requisits previs


·         Bases de dades

·         Eines d’anàlisi de dades

·         Programació

·         Algoritmes i estructures de dades

Objectius: 

L’assignatura serveix com a introducció pràctica a:

·         Gestió de dades

·         Governança de dades

·         Magatzem de dades (Data Warehousing)

·         Canalitzacions de dades (Data Pipelines)

·         Seguretat de dades

·         Regulació de dades

·         Aprenentatge automàtic pràctic en el context del processament de dades (gestió i governança)

·         Ús pràctic de models fundacionals en el context del processament de dades

Continguts: 


El processament i l’anàlisi de dades avançats comprenen accions i mètodes aplicats a les dades que ajuden a descriure fets, detectar patrons, elaborar explicacions i posar a prova hipòtesis. Això inclou:

  • Governança de dades
  • Anàlisi estadística de dades
  • Modelització
  • Interpretació de resultats

Metodologia: 

Pràctiques individuals freqüents i sprints en equip; dades reals; revisions «mostra què has construït».

Cada sessió comença amb una classe magistral i té una secció de treball pràctic, ja sigui individual o en grup. La majoria de sessions inclouen una tasca a classe. En algunes sessions s’assignen lectures, que es proven mitjançant diverses tasques a classe. El curs té un projecte final (capstone) en grup. La majoria de les tasques obligatòries consisteixen en entregues parcials que condueixen a aquest projecte final.

L’examen parcial i el final són individuals.

Avaluació: 







































































Què


Pes


Importància


Nota


Assistència i participació


20%


Mitjana


 


Nombre de classes assistides menys 4


5%


Baixa


 


Tasques a l’aula, la millor de 6


8%


Baixa


 


Actitud i contribució


7%


Mitjana


 


Projecte en grup


20%


Mitjana


 


Presentació intermèdia


20%


Alta


>4 per aprovar


Projecte capstone


20%


Alta


>4 per aprovar


Presentació


10%


Mitjana


 


Informe


10%


Alta


 


Examen final


20%


Alta


>4 per aprovar

Criteris avaluació: 

-

Bibliografia bàsica: 

Normes i governança/seguretat

ISO/IEC 38500:2024 (governança de TI; principis/model/marc). iso.org | webstore.iec.ch

Ladley, "Data Governance" (2a ed., Academic Press, 2019). shop.elsevier.com

Eryurek et al., "Data Governance: The Definitive Guide" (O’Reilly, 2021). amazon.com

Fitzgerald, "CISO Compass" (Auerbach/CRC Press). taylorfrancis.com

Hyppönen, "If It’s Smart, It’s Vulnerable" (Wiley). wiley.com

Gestió de dades i plataformes (gratuïtes / amb prova)

Microsoft Fabric (prova de 60 dies; laboratoris de Lakehouse). learn.microsoft.com

Databricks Free Edition (espai de treball al núvol per a Spark/Delta/MLflow). community.cloud.databricks.com

Snowflake (prova de 30 dies amb crèdits). signup.snowflake.com

Google BigQuery Sandbox (sense targeta; 10 GB d’emmagatzematge + 1 TB de consultes/mes gratuït). docs.cloud.google.com/bigquery

Amazon Redshift (crèdit de prova sense servidor). aws.amazon.com/redshift

dbt Core (transformacions de codi obert), Airbyte (EL/ELT de codi obert), DuckDB, PostgreSQL. docs.getdbt.com | docs.airbyte.com | duckdb.org | postgresql.org

Delta Lake (format de taules de lakehouse obert). docs.delta.io

Aprenentatge automàtic i models fundacionals

scikit-learn (guia d’usuari per a ML clàssic). scikit-learn.org

Hugging Face Transformers — pipeline API per a inferència ràpida amb MF. huggingface.co

Documentació de MLflow per al seguiment d’experiments i l’avaluació de GenAI. mlflow.org

Material complementari: 

-