Grado en Ingeniería de Sistemas de Telecomunicación

Fórmate para trabajar como Ingeniero de Telecomunicación y desarrollarás tu carrera en un sector estratégico y en constante crecimiento

Minería de datos

Descripción
La asignatura realiza una introducción a la minería de datos. La minería de datos es la disciplina que estudia la extracción de información útil de bases de datos. Hoy en día, las técnicas de minería de datos se usan en muchas aplicaciones diversas, tales como la predicción de fraude en transacciones de tarjetas de crédito, la segmentación de clientes para estudios de marketing o el diagnóstico médico. En este sentido, la minería de datos abarca un campo multi-disciplinar y de gran interés práctico.
Tipo asignatura
Optativa
Semestre
Primero
Créditos
5.00

Profesores Titulares

Conocimientos previos

Para cursar la asignatura, se recomienda que el alumno tenga conocimientos de programación, en concreto, algún lenguaje orientado a objetos.

Objetivos

Al finalizar el curso, el alumno es capaz de:

- Diseñar e implementar un proceso de minería de datos para aplicaciones reales.
- Usar herramientas de data warehouse y OLAP para realizar un proceso de análisis de minería de datos.
- Evaluar los resultados de la minería de datos, analizarlo gráficamente y usar el conocimiento extraído de este análisis.
- Comunicar con expertos y no expertos la aplicación y uso de técnicas de minería de datos.
- Describir los algoritmos principales de minería de datos e implementarlos, adaptándolos a la aplicación requerida y mejorando, si es necesario, su rendimiento y eficiencia.

En resumen, el estudiante que termina la asignatura con éxito, es capaz de trabajar como analista de minería de datos, usando herramientas existentes en el mercado, así como desarrollar proyectos de minería de datos que impliquen el desarrollo del proyecto en todas sus fases.

Contenidos

1. Introducción a la Minería de Datos y KDD
2. DataWarehouse y tecnologías OLAP para la minería de datos.
3. Preproceso de los datos
4. Reglas de asociación
5. Clasificación y regresión
6. Clustering o agrupación
7. Evaluación, visualización y uso del conocimiento extraído
8. Minería de datos complejos (espacial, temporal, web mining)
9. Herramientas par la minería de datos: Pentaho, Weka, DBMiner.

Metodología

La asignatura se imparte según la metodología Problem Based Learning (PBL). Esta metodología fomenta el aprendizaje del alumno mediante la definición de un problema que el alumno debe resolver en equipo a lo largo de la asignatura. El estudiante no asiste a clases magistrales que anticipan el conocimiento sobre la materia, sino que el estudiante va construyendo este conocimiento mediante la solución guiada a un problema debidamente planteado.

Los beneficios de esta metodología son la consolidación del aprendizaje por parte de los alumnos y la mejor preparación para el mundo laboral, dado que el alumno tiene que trabajar en equipo y desarrollar competencias de gestión del proyecto, habilidades comunicativas, etc. En esta metodología, no hay una separación clara entre los conceptos de teoría y práctica; más bien, los dos conceptos se entrelazan continuamente. El estudiante desarrolla un proyecto para el cual necesita adquirir unos conocimientos de forma incremental.

La implementación concreta de la metodología PBL en la asignatura es la siguiente:

- Para cada gran tema de los expuestos anteriormente, se plantea un problema a resolver. Esto se aplica para los temas 2,3,4 y 5 del temario.

- El estudiante tiene que resolver el problema planteado en equipo. Para la resolución del problema dispondrá: de la ayuda y guía del profesor, y un conjunto de materiales disponibles (apuntes, libros, artículos). Muchos de estos materiales estarán seleccionados previamente por el profesor. Otros materiales podrán ser incorporados por el propio alumno, fomentando así que el estudiante adquiera habilidades de aprendizaje autónomo.

- No se realizarán clases magistrales al estilo tradicional, pero sí hay sesiones de soporte al desarrollos del proyecto que garantizan: 1) que el proyecto se realice de forma adecuada por cada equipo, 2) que no hay vacíos de conocimiento en los conceptos necesarios que tienen que adquirir los alumnos.

- Dependiendo del número de estudiantes en la clase, se dimensionarán los equipos y la complejidad del proyecto asignado a cada equipo.

- Es posible que por cada tema haya distintos problemas a resolver por cada equipo.

- Al finalizar cada proyecto, cada equipo presenta los resultados obtenidos y éstos son discutidos por el resto de compañeros de la clase.

Evaluación

La evaluación está adaptada a la metodología PBL. Se le asignará a cada alumno una nota del proyecto, que será el promedio de los mini-proyectos entregados a lo largo del curso. La nota de cada proyecto será la media ponderada entre la nota global del proyecto y la nota individual (que dependerá de su grado de participación en el desarrollo del proyecto). Al finalizar el curso, el estudiante se tendrá que presentar también a un examen final de los conocimientos generales de la materia.

La nota de los proyectos será un 70% de la nota final y la nota del examen un 30%. El promedio final tiene que ser igual o superior a 5 para poder aprobar la asignatura.

Los proyectos deben ser entregados en los plazos establecidos dado que todos ellos se presentan oralmente en clase. La presentación será de corta duración, pero será necesaria para facilitar: la compartición de los conocimientos adquiridos con el resto de equipos y para consolidar los conocimientos. A menudo, los proyectos estarán encadenados secuencialmente de forma que los resultados de un proyecto puedan ser usados o analizados en los temas posteriores.

En caso que el alumno no pueda entregar los proyectos asignados en el plazo establecido, habrá una convocatoria extraordinaria el junio/julio para optar a la nota máxima de 6. Para el buen funcionamiento del PBL se recomienda que cada equipo presente sus resultados durante el curso. De lo contrario, se hace muy difícil progresar adecuadamente.

Criterios evaluación

Consultar el apartado anterior.

Bibliografía básica

[1] Han Jiawei, Kamber Micheline, `Data Mining: Concepts and Techniques, Second Edition´, Morgan Kaufmann Publishers- Elsevier, 2006.
[2] J.Hernández Orallo, M.J.Ramírez, C. Ferri Ramírez, `Introducción a la Minería de Datos´, Pearson - Prentice Hall, 2004.
[3] Ian H. Witten, Eibe Frank, `Data Mining: Practical Machine Learning Tools and Techniques, Second Edition´, Morgan Kaufmann Publishers-Elsevier, 2005.
[4] Dorian Pyle, `Data Preparation for Data Mining´, Morgan Kaufmann Publishers, 1999.

Material complementario

Transparencias y artículos que estarán a disposición del estudiante en la intranet de la asignatura.