Aquest curs introdueix la mineria de dades, l'extracció d'informació útil i coneixement a partir de grans volums de dades, per millorar la presa de decisions empresarials. Aquest curs ofereix una introducció completa a les diferents tècniques i mètodes utilitzats en la mineria de dades. Els temes tractats inclouen el preprocessament de dades, l'exploració i visualització de dades, el modelatge i la predicció de dades. El curs també cobreix aplicacions del món real i estudis de casos a la indústria. L'objectiu d'aquest curs és proporcionar als estudiants una comprensió sòlida de les tècniques de mineria de dades i les seves aplicacions mitjançant Python, perquè puguin utilitzar-les per analitzar i extreure coneixements de dades en diversos camps.
Professors Titulars
Professors Docents
--
El curs de "Mineria de dades" (IN015) se centra en l'extracció d'informació útil i coneixement a partir de grans volums de dades per millorar la presa de decisions empresarials. Al llarg del semestre, explorareu el procés complet, incloent-hi el pre-processament de dades, l'exploració i visualització, així com el modelatge predictiu mitjançant models de regressió, models de classificació i models basats en arbres. En última instància, el curs us proporciona les habilitats pràctiques per aplicar aquestes tècniques mitjançant Python i les seves eines principals (com ara pandas i scikit-learn), permetent-vos analitzar grans conjunts de dades del món real, avaluar críticament els resultats per determinar-ne la fiabilitat i validesa, i comunicar i presentar les vostres troballes de manera eficaç.
Primera part del semestre:
- Introducció a la mineria de dades
- Pre-processament de dades
- Models de regressió
- Models de classificació
Segona part del semestre:
- Validació creuada
- Selecció de característiques
- Models basats en arbres
- Mineria de textos
Projecte
- Predicció de l'èxit de les startups mitjançant Twitter
La taula següent relaciona els resultats d'aprenentatge amb els continguts ensenyats per aconseguir-los:
RA | Temari | Continguts |
R1 | Comprensió dels conceptes i tècniques de mineria de dades | Introducció a la mineria de dades |
R2 | Capacitat per analitzar i interpretar grans conjunts de dades per extreure coneixements i patrons significatius | Pre-processament de dades Selecció de característiques Validació creuada |
R3 | Coneixement de les diferents eines i tecnologies utilitzades en la mineria de dades amb Python, com ara numpy, pandas, matplotlib, seaborn i scikit-learn | Models de regressió Models de classificació Models basats en arbres |
R4 | Capacitat per avaluar críticament els resultats de la mineria de dades i determinar-ne la fiabilitat i validesa | Projecte: Predicció de l'èxit de les startups mitjançant Twitter |
R5 | Capacitat per comunicar i presentar resultats de l'anàlisi de mineria de dades de manera eficaç | Projecte: Predicció de l'èxit de les startups mitjançant Twitter |
El sistema d'avaluació serà contínua combinant diverses activitats per facilitar l'assimilació dels coneixements per part de l'estudiant.
La taula següent mostra el percentatge d'avaluació de cada activitat en funció de la nota final:
R1, R2 | Deures | 20% |
R2, R3 | Examen parcial | 30% |
R4, R5 | Projecte | 20% |
R2, R3 | Examen final | 30% |
Els objectius de l'avaluació contínua són els següents:
- Aprenentatge progressiu de l'assignatura i avaluació de l'activitat
- Avaluació dels coneixements adquirits en els exàmens
- Practicar l'assignatura amb un projecte real
--
- Provost, F., Fawcett, T. (2013). Data Science for Business: What you need to know about data mining and data-analytic thinking, O’Really
- Mueller, A., Guido, S. (2016). Introduction to Machine Learning with Python, O’Really
--