Màster Universitari en Data Science La Salle Campus Barcelona URL

Màster Universitari en Data Science

Converteix-te en un expert en analitzar, estructurar, filtrar, visualitzar i posar en valor la producció de dades generades.

Estructures de dades i el seu emmagatzematge

Descripció
Ens centrarem en els Sistemes Informacionals com la principal font de dades per als nostres desenvolupaments. Per a això hi haurà dos principals punts de vista. El primer d'ells serà un complement a les infraestructures físiques treballades en l'assignatura MD002 – Infraestructures de computació, però centrant-nos en l'organització i transformació de la informació en funció de l'ús final que es requereixi. El segon d'ells serà en el cicle de vida de la dada, des del seu origen fins a la transformació d'aquests en informació i finalment i més important, en valor. Tot amb l'objectiu de dotar-vos d'una visió end-to-end de les diferents arquitectures de dades que us podeu trobar en el mercat empresarial a l'hora d'entendre i explotar el cicle informacional de la dada. Aquest cicle va des dels orígens de la informació (món operacional/transaccional) fins als entorns de dades preparades per a l'explotació de les dades (DataLake, DWH o SANDBOX’s). Quan parlem d’entorns d'arquitectures de dades, no sols ens referim a arquitectures físiques (HW), o a la definició lògica i tecnològica (eines) d'aquestes, sinó també a aquelles estructures de dades que permeten l'optimització i el govern de dades ja transformat en informació.
Tipus assignatura
Primer - Obligatoria
Semestre
Primer
Curs
1
Crèdits
5.00

Professors Docents

Coneixements previs

Recomanable: coneixements mitjans en informàtica sobre bases de dades relacionals, programació orientada a objectes i sistemes operatius (comunicació entre processos i gestió de memòria).

Seria recomanable coneixements en bases de dades i sistemes operatius.

Objectius

Els objectius es centraran en:
• Conèixer els conceptes clau i bases dels models d'informació necessaris per a entendre el paper dels perfils existents al voltant d'un sistema d'informació i la seva explotació.
• Tenir una visió el més àmplia possible de les diferents arquitectures informacionals, tant de les ja existents i afermades en el mercat empresarial, com de les noves visions disruptives a partir de les noves tecnologies disponibles.
• Aprendre a recollir, transformar i processar la informació en funció del seu origen, volum, format i periodicitat d'anàlisi.
• Entendre les diferents formes de Data Governance amb l'objectiu de comprendre l'aportació al dia a dia en el treball d'un Data Scientist.

Continguts

1. Conceptes clau i bases de models d’informació
1.1. Història de les Bases de Dades
1.2. Figures clau al voltant dels sistemes informacionals (Data Science, Data Analyst, Product Owner, etc.)
1.3. Rols d'un Data Scientist i interacció amb la resta
1.4. DBMS vs RDBMS (concepte d'explotació de la informació)
1.5. Teoria i exemples pràctics de Models Relacionals
1.6. Definició i concepte d'ETL

2. Què és la informació i com li extraiem valor
2.1. Concepte de dada i informació (de l'origen de la dada fins a explotar informació i aconseguir valor)
2.2. Business Intelligence i com es comprèn amb Data Science?
2.3. Big Data
2.3.1. ELT vs ETL
2.3.2. Concepte d'arquitectura
2.4. Tipus d'arquitectures de dades
2.4.1. Lògica/Tecnològica/Física
2.4.2. Entorns d'informació (DEV, PRO, SandBox, …)
2.4.3. Conceptes DataLake, DWH, etc.
2.5. Arquitectura de Models de dades IA
2.5.1. Desenvolupament
2.5.2. Validació i promoció a PRO (batch i online)
2.5.3. Monitorització

3. Explotar els diferents tipus d'informació
3.1. DB Estructurades (repàs i ampliació del ja vist)
3.2. DB Semi-Estructurades
3.3. DB No Estructurades

4. Web Scraping com a origen de dades
4.1. Què és Web Scraping?
4.2. Aspectes legals
4.3. Eines

5. Cloud Computing for Data Scientist

6. La importància de la traçabilitat i fiabilitat de les dades (Data Governance)

Nota: els temes poden ajustar i/o modificar-se a criteri de la coordinació del màster.

Metodologia

Lliçó magistral
Estudi i treball personal
Resolució de problemes o exercicis
Treballs en grup
Treballs pràctics

Avaluació

Aquesta assignatura s'avaluarà de manera continuada a partir d'exercicis, treballs, pràctiques i presentacions a classe.

Criteris avaluació

Avaluació continua
Aquesta assignatura s'avaluarà de manera continuada a partir d'exercicis, treballs, pràctiques i presentacions a classe. La nota final serà una ponderació de:
- Pràctica sobre un sistema d'informació relacional: 30%
- Pràctica sobre sistemes de dades no estructurades: 30%
- Treball final i presentació: 40%

Convocatòria extraordinària
Es determinarà l’examen i/o treballs de convocatòria extraordinària des de la coordinació de l’assignatura.

Normativa de còpies
L’assignatura es regeix per la normativa de còpies general de La Salle Campus BCN:
https://www.salleurl.edu/ca/normativa-de-copies
Les activitats formatives es consideraran que tenen la següent categoria:
• Exercicis: moderadament significativa
• Projecte: altament significativa
• Avaluació final: altament significativa

Bibliografia bàsica

La bibliografia s'anirà detallant al llarg de l'assignatura:

• Apunts de classe
• Documentació i articles que es penjaran a la Intranet (eStudy)

Material complementari

Tot el material de classe (presentacions, exercicis, articles, documents, etcètera) es compartiran a la carpeta de l'assignatura de la Intranet de La Salle: eStudy.