Este curso proporciona una introducción a la minería de datos, la extracción de información útil y conocimiento de grandes volúmenes de datos, con el fin de mejorar la toma de decisiones empresariales. Este curso proporciona una introducción completa a las diversas técnicas y métodos utilizados en la minería de datos. Los temas cubiertos incluyen preprocesamiento de datos, exploración y visualización de datos, modelado y predicción de datos. El curso también cubre aplicaciones del mundo real y estudios de casos en la industria. El objetivo de este curso es proporcionar a los estudiantes una sólida comprensión de las técnicas de minería de datos y sus aplicaciones utilizando Python, para que puedan usarlas para analizar y extraer información de los datos en diversos campos.
Profesores Titulares
Profesores Docentes
--
El curso de "Minería de datos" (IN015) se centra en la extracción de información útil y conocimiento a partir de grandes volúmenes de datos con el fin de mejorar la toma de decisiones empresariales. A lo largo del semestre, explorará el proceso completo de la minería de datos, incluyendo el preprocesamiento de datos, la exploración y visualización, así como el modelado y predicción a través de modelos de regresión, modelos de clasificación y métodos basados en árboles. En última instancia, el curso le proporciona las habilidades prácticas para aplicar estas técnicas utilizando Python y sus herramientas principales (como pandas y scikit-learn), lo que le permitirá analizar grandes conjuntos de datos del mundo real, evaluar críticamente los resultados para determinar su fiabilidad y validez, y comunicar y presentar los hallazgos de manera efectiva.
Primera parte del semestre:
- Introducción a la minería de datos
- Preprocesamiento de datos
- Modelos de regresión
- Modelos de clasificación
Segunda parte del semestre
- Validación cruzada
- Selección de características
- Métodos basados en árboles
- Minería de textos
Proyecto
En la siguiente tabla se ponen en relación los resultados de aprendizaje con el contenido impartido para alcanzarlos.
| RA | Temario | Contenidos |
| R1 | Comprensión de los conceptos y técnicas de minería de datos | Introducción a la minería de datos |
| R2 | Capacidad para analizar e interpretar grandes conjuntos de datos para extraer información y patrones significativos | Preprocesamiento de datosValidación cruzadaSelección de características |
| R3 | Conocimiento de las diversas herramientas y tecnologías utilizadas en la minería de datos utilizando python, incluyendo numpy, pandas, matplotlib, seaborn y scikit-learn | Modelos de regresiónModelos de clasificaciónModelos basados en árboles |
| R4 | Capacidad para evaluar críticamente los resultados de la minería de datos y determinar su fiabilidad y validez | Proyecto: Predecir el éxito de las startups usando Twitter |
| R5 | Capacidad para comunicar y presentar los hallazgos del análisis de minería de datos de manera efectiva | Proyecto: Predecir el éxito de las startups usando Twitter |
El sistema de evaluación será continuo combinando varias actividades para facilitar la asimilación de conocimientos por parte del alumno.
La siguiente tabla muestra el porcentaje de evaluación de cada actividad sobre la nota final:
R1, R2 | Deberes | 20% |
R2, R3 | Examen Parcial | 30% |
R4, R5 | Proyecto | 20% |
R2, R3 | Examen Final | 30% |
--
- Mueller, A., Guido, S. (2016). Introduction to Machine Learning with Python, O'Really - James, G et al (2021). An Introduction to Statistical Learning, Springer - Provost, F., Fawcett, T. (2013). Data Science for Business: What you need to know about data mining and data-analytic thinking, O'Really - Matthes, E. (2015). Python Crash Course: A Hands-On, Project-Based Introduction to Programming, No Starch Press
- Provost, F., Fawcett, T. (2013). Data Science for Business: What you need to know about data mining and data-analytic thinking, O’Really
- Mueller, A., Guido, S. (2016). Introduction to Machine Learning with Python, O’Really