La asignatura abordará la evolución experimentada por las infraestructuras de computación durante los últimos 25 años. Para entender el relevante papel que juegan las infraestructuras en la aparición y consolidación de la ciencia de datos, nuestro viaje analizará el cambio de paradigma ocurrido. Hemos pasado de procesar cantidades de datos razonables usando personal computers a tener ingentes volúmenes de información en el cloud. Edge computing, máquinas virtuales, contenedores, orquestadores, tecnologías serverless, plataformas cloud, y muchos otros conceptos son los que todo científico de datos debe tener en su mochila para ser capaz de afrontar todo tipo de proyecto en el mundo de los datos.
Profesores Docentes
Recomendable: Conocimientos básicos en informática y programación aunque no se requiere ningún tipo de conocimiento avanzado de programación ya que los contenidos están muy pautados y con lenguaje de alto nivel.
Los objetivos se centrarán en:
Aportar un conocimiento de las herramientas y plataformas más usadas actualmente en los proyectos de datos.
Conocer y controlar sistemas de virtualización, orquestadores de contenedores y servicios en plataformas cloud.
Introducir el uso de Python como herramienta básica en el día a día del científico de datos.
Capítulo 1: Computación en el siglo XX
Paradigma clásico
Revolución computacional
Capítulo 2: Bienvenidos al siglo XXI
Virtualización, Hipervisores
Software Defined Concepts
IaaS, PaaS, SaaS
Capítulo 3: Contenedores, trending topic
Historia y evolución
Docker, Imágenes, Registro, Despliegue
Orquestadores: Swarm, Kubernetes, EKS...
Capítulo 4: Cloud Services & Tecnologías Serverless
AWS, GCP, DigitalOcean, Linode...
Descubrimiento de servicios
AWS Lambda como modelo Serverless
Capítulo 5: Introducción a Python 3
Enfoque práctico del uso del lenguaje
Uso de estructuras de datos básicas
Nota: los temas pueden ajustarse y/o modificarse a criterio de la coordinación del máster.
La metodología utilizada combina clases magistrales, participación de los estudiantes y el desarrollo de un proyecto. Para el alumno, esto implicará tanto trabajos individuales como en grupo, así como ejercicios conceptuales, ejercicios escritos y presentaciones orales.
Trabajos y/o pruebas escritas de respuesta abierta
Evaluación continuada
Esta asignatura se evaluará de manera continuada a partir de presentaciones orales, trabajos y/o ejercicios y la participación en clase. El 60% de la evaluación dependerá de: (i) la participación en clase (se recomienda la asistencia); (ii) la realización de un trabajo individual sobre el diseño e implementación de un proyecto de datos. El 40% restante dependerá de las presentaciones de los ejercicios colectivos que se detallarán al empezar las clases.
Convocatoria extraordinaria
Se determinará el examen y/o trabajos de convocatoria extraordinaria desde la coordinación de la asignatura.
Normativa de copias
La asignatura se rige por la normativa de copias general de La Salle Campus BCN:
<https://www.salleurl.edu/es/normativa-de-copias>
Las actividades formativas se considerarán que tienen la siguiente categoría:
Ejercicios: moderadamente significativa
Proyecto: altamente significativa
Evaluación Final: altamente significativa
Apuntes de clase
Documentción y artículos subidos a la Intranet (eStudy)
Links a videos técnicos
Todo el material de clase (presentaciones, ejercicios, artículos, documentos, etcétera) se compartirán en la carpeta de la asignatura de la Intranet de La Salle: eStudy.