Grado en Business Intelligence y Data Analytics

Lidera la transformación de las empresas mediante el uso y el análisis de datos.

Minería de datos

Descripción
Este curso proporciona una introducción a la minería de datos, la extracción de información útil y conocimiento de grandes volúmenes de datos, con el fin de mejorar la toma de decisiones empresariales. Este curso proporciona una introducción completa a las diversas técnicas y métodos utilizados en la minería de datos. Los temas cubiertos incluyen preprocesamiento de datos, exploración y visualización de datos, modelado y predicción de datos. El curso también cubre aplicaciones del mundo real y estudios de casos en la industria. El objetivo de este curso es proporcionar a los estudiantes una sólida comprensión de las técnicas de minería de datos y sus aplicaciones utilizando Python, para que puedan usarlas para analizar y extraer información de los datos en diversos campos.
Tipo asignatura
Tercer - Obligatoria
Semestre
Segundo
Curso
2
Créditos
6.00

Profesores Titulares

Conocimientos previos
Objetivos

Los resultados de aprendizaje de esta asignatura son:
R1. Comprensión de los conceptos y técnicas de minería de datos.
R2. Capacidad para analizar e interpretar grandes conjuntos de datos para extraer información y patrones significativos.
R3. Conocimiento de las diversas herramientas y tecnologías utilizadas en la minería de datos utilizando python, incluyendo numpy, pandas, matplotlib, seaborn y scikit-learn.
R4. Capacidad para evaluar críticamente los resultados de la minería de datos y determinar su fiabilidad y validez.
R5. Capacidad para comunicar y presentar los hallazgos del análisis de minería de datos de manera efectiva.

Contenidos

Primera parte del semestre:
- Introducción a la minería de datos
- Preprocesamiento de datos
- Modelos de regresión
- Modelos de clasificación

Segunda parte del semestre
- Validación cruzada
- Selección de características
- Métodos basados en árboles
- Minería de textos

Proyecto: Predecir el éxito de las startups usando Twitter

Metodología

R1 - Comprensión de los conceptos y técnicas de minería de datos: Introducción a la minería de datos
R2 - Capacidad para analizar e interpretar grandes conjuntos de datos para extraer información y patrones significativos:
- Preprocesamiento de datos
- Validación cruzada
- Selección de características
R3 - Conocimiento de las diversas herramientas y tecnologías utilizadas en la minería de datos utilizando python, incluyendo numpy, pandas, matplotlib, seaborn y scikit-learn:
- Modelos de regresión
- Modelos de clasificación
- Modelos basados en árboles
R4 - Capacidad para evaluar críticamente los resultados de la minería de datos y determinar su fiabilidad y validez: Proyecto: Predecir el éxito de las startups usando Twitter
R5 - Capacidad para comunicar y presentar los hallazgos del análisis de minería de datos de manera efectiva: Proyecto: Predecir el éxito de las startups usando Twitter

Evaluación

El sistema de evaluación será contínuo combinando varias actividades para facilitar la asimilación de conocimientos por parte del alumno.
La siguiente tabla muestra el porcentaje de evaluación de cada actividad sobre la nota final:
R1, R2 - Deberes - 20%
R2, R3 - Examen parcial - 20%
R4, R5 - Proyecto - 30%
R2, R3 - Examen final - 30%

Los objetivos de la evaluación continua son los siguientes:
- Aprendizaje progresivo de la asignatura y evaluación de la actividad
- Evaluación de los conocimientos adquiridos en exámenes
- Practicar la asignatura con un proyecto real

Criterios evaluación
Bibliografía básica

- Mueller, A., Guido, S. (2016). Introduction to Machine Learning with Python, O'Really
- James, G et al (2021). An Introduction to Statistical Learning, Springer
- Provost, F., Fawcett, T. (2013). Data Science for Business: What you need to know about data mining and data-analytic thinking, O'Really
- Matthes, E. (2015). Python Crash Course: A Hands-On, Project-Based Introduction to Programming, No Starch Press

Material complementario