Teaching Guides Query



Academic Year: 2019/20

533 - Master's Degree in Telecommunications Engineering

60949 - Management of Large-Scale Data


Teaching Plan Information

Academic Year:
2019/20
Subject:
60949 - Management of Large-Scale Data
Faculty / School:
110 - Escuela de Ingeniería y Arquitectura
Degree:
533 - Master's Degree in Telecommunications Engineering
ECTS:
6.0
Year:
2
Semester:
Second semester
Subject Type:
Optional
Module:
---

1. General information

2. Learning goals

3. Assessment (1st and 2nd call)

4. Methodology, learning tasks, syllabus and resources

4.1. Methodological overview

The methodology followed in this course is oriented towards achievement of the learning objectives. A wide range of teaching and learning tasks are implemented, such as

Classroom activities

  • Lectures. The teacher presents and explains the course contents with illustrative examples. 
  • Talks by experts. When possible, external experts to the university will expose or explain some contents.
  • Seminars. Period of instruction based on oral or written contributions by the students.
  • Problem-based learning. Educative approach where students tackle real problems in small groups under the supervision of a teacher.
  • Practice sessions. Any practical or collaborative activity in class.
  • Lab sessions. Activities developed in special spaces with specialized equipment (labs, computer labs).
  • Tutorials. Time for students to review and discuss materials and topics presented in class with the teacher.
  • Assessment. A set of written/oral tests, lab assignments, projects, other assignments, etc., used to evaluate the progress of students.

Autonomous work

  • Assignments. Preparation of seminars, readings, research, assignments or written reports, etc., to be presented or submitted to the professor in lectures and practice sessions.
  • Autonomous work and study. Study of contents related to the lectures and practice sessions: it includes any study activity not considered previously (study for exams, work in the library, complementary readings, solve problems and exercises, etc.).
  • Complementary activities. Formative activities related to the course (exam preparation or assessment) like readings, seminars, conferences, videos, etc.

4.2. Learning tasks

The course (6 ECTS: 150 hours) includes the following learning tasks:

  • Teaching sessions (40 hours). Lectures, practice sessions, laboratory sessions, special talks, etc.
  • Project and assignments (80 hours)
  • Tutorials (5 hours)
  • Study (20 hours)
  • Assessment (5 hours)

4.3. Syllabus

The course will address the following topics:

  1. Introduction and motivation to the problem of large volumes of data (Big Data).
  2. Storage of large amounts of data
    • Data warehouses. Star schema design.
    • NoSQL databases.
  3. Management of large amounts of data
    • Data distribution.
    • Information integration considering heterogeneous data sources.
    • Use of knowledge representation techniques (ontologies) to represent data sources and their access and integration.
    • Parallel processing techniques: MapReduce (Hadoop).
    • Data Stream Management Systems.
    • Other techniques: mobile agents.
  4. Interaction with large amounts of data
    • Visualization techniques.
    • Design of appropriate user interfaces.
    • Usability.
  5. Analysis of large amounts of data
    1. Data mining.
    2. Sentiment analysis.
    3. Text mining.
  6. Use cases and applications
    • Data provided by sensors.
    • Unstructured data on the Web.
    • Recommendation Systems.
    • Analysis of blogs and social networks.
    • Smart cities.
    • Intelligent Transportation Systems.

4.4. Course planning and calendar

Further information concerning the timetable, classroom, office hours, assessment dates and other details regarding this course, will be provided on the first day of class or please refer to the EINA website.

 


Curso Académico: 2019/20

533 - Máster Universitario en Ingeniería de Telecomunicación

60949 - Manipulación y análisis de grandes volúmenes de datos


Información del Plan Docente

Año académico:
2019/20
Asignatura:
60949 - Manipulación y análisis de grandes volúmenes de datos
Centro académico:
110 - Escuela de Ingeniería y Arquitectura
Titulación:
533 - Máster Universitario en Ingeniería de Telecomunicación
Créditos:
6.0
Curso:
2
Periodo de impartición:
Segundo semestre
Clase de asignatura:
Optativa
Materia:
---

1. Información Básica

1.1. Objetivos de la asignatura

La asignatura y sus resultados previstos responden a los siguientes planteamientos y objetivos:

La asignatura estará centrada en la comprensión, el análisis y la evaluación de los siguientes contenidos:

  • Importancia de los datos y de su análisis en diferentes ámbitos de aplicación. Perspectiva del diseñador, usuario y analista.
  • Técnicas de interacción y visualización. Diseño centrado en el usuario. Evaluación de la usabilidad de aplicaciones y software. Aplicación al diseño de aplicaciones interactivas.
  • Modelos de almacenamiento y procesamiento de grandes volúmenes de datos.
  • Sistemas y metodologías para el análisis y manipulación de datos.

Con el desarrollo de la asignatura, y de conformidad con las competencias y resultados de aprendizaje esperados, se pretenden lograr los siguientes objetivos:

  • Que el alumno analice, dado un problema que implica grandes volúmenes de datos, los requisitos necesarios para su gestión (almacenamiento, transferencia, procesamiento, visualización e interacción).
  • Que el alumno desarrolle los elementos necesarios para integrar fuentes de datos heterogéneas, utilizando técnicas clásicas para la representación, tratamiento, análisis, visualización e interacción con repositorios de datos heterogéneos.
  • Que el alumno desarrolle una aplicación para un contexto dado, donde sea necesaria la gestión de grandes volúmenes de datos, y teniendo en cuenta criterios de escalabilidad, usabilidad y normativos.

1.2. Contexto y sentido de la asignatura en la titulación

En esta asignatura se realiza un recorrido por todos los aspectos que representan el reto introducido por los grandes volúmenes de datos, desde el diseño hasta la manipulación, procesado y análisis.

1.3. Recomendaciones para cursar la asignatura

El alumno que curse esta asignatura debería haber cursado asignaturas previas relacionadas con bases de datos y sistemas de información.

2. Competencias y resultados de aprendizaje

2.1. Competencias

Al superar la asignatura, el estudiante será más competente para...

CG11: Capacidad para saber comunicar (de forma oral y escrita) las conclusiones -y los conocimientos y razones últimas que las sustentan- a públicos especializados y no especializados de un modo claro y sin ambigüedades.

CG12: Poseer habilidades para el aprendizaje continuado, autodirigido y autónomo.

CE6: Capacidad para modelar, diseñar, implantar, gestionar, operar, administrar y mantener redes, servicios y contenidos.

2.2. Resultados de aprendizaje

El estudiante, para superar esta asignatura, deberá demostrar los siguientes resultados...

  1. Comprender y especificar los requisitos necesarios para la interacción, almacenamiento, transferencia y procesado de grandes volúmenes de datos.
  2. Conocer, comprender y aplicar las técnicas más comunes para la representación, tratamiento, análisis e interacción con repositorios de datos heterogéneos.
  3. Diseñar, desarrollar y evaluar una aplicación que facilite la elaboración y gestión de grandes volúmenes de datos, conforme a criterios de escalabilidad y normativa existente.

2.3. Importancia de los resultados de aprendizaje

El conjunto de los resultados de aprendizaje se puede resumir diciendo que el alumnado será capaz de diseñar soluciones para la gestión y el análisis de grandes volúmenes de datos en distintos escenarios, escogiendo entre las soluciones tecnológicas existentes de forma adecuada. Esto es de gran importancia hoy en día en el mundo laboral, ya que multitud de empresas privadas e instituciones públicas, así como otras entidades especializadas en ámbitos concretos, cuentan con grandes volúmenes de datos que necesitan gestionar. Términos como Big Data, Data Science, Data Analytics, Data Warehouses, Business Intelligence, y Data Mining, están cobrando especial importancia en los últimos años, dada la necesidad de profesionales en este ámbito.

3. Evaluación

3.1. Tipo de pruebas y su valor sobre la nota final y criterios de evaluación para cada prueba

El estudiante deberá demostrar que ha alcanzado los resultados de aprendizaje previstos mediante las siguientes actividades de evaluacion

  • Realización y presentación de trabajos. Estudio de un tema relacionado con la asignatura, elaboración de un informe sobre el mismo, y su presentación en clase. [20%]. Resultados de aprendizaje: 1, 2 y 3.
  • Proyecto. Un proyecto de grupo en el laboratorio, en el que se podrán en práctica los conocimientos y habilidades adquiridos en la asignatura. [50%]. Resultados de aprendizaje: 1, 2 y 3.
  • Prueba final escrita incluyendo preguntas de respuesta corta y de respuesta extensa. [30%]. Resultados de aprendizaje: 1, 2 y 3.

El estudiante que no opte por el procedimiento de evaluación descrito anteriormente, no supere dichas pruebas durante el periodo docente o que quisiera mejorar su calificación tendrá derecho a realizar una prueba global que será programada dentro del periodo de exámenes correspondiente a la primera o segunda convocatoria.

4. Metodología, actividades de aprendizaje, programa y recursos

4.1. Presentación metodológica general

El proceso de aprendizaje que se ha diseñado para esta asignatura se basa en lo siguiente:

Las actividades de enseñanza y aprendizaje presenciales se basan en:

  1. Clase presencial. Exposición de contenidos mediante presentación o explicación por parte de un profesor (posiblemente incluyendo demostraciones).
  2. Charlas de expertos. Cuando sea posible, se contará con la exposición de contenidos mediante presentación o explicación por parte de un experto externo a la Universidad.
  3. Seminario. Período de instrucción basado en contribuciones orales o escritas de los estudiantes.
  4. Aprendizaje basado en problemas. Enfoque educativo orientado al aprendizaje y a la instrucción en el que los alumnos abordan problemas reales en pequeños grupos y bajo la supervisión de un tutor
  5. Clases prácticas. Cualquier tipo de actividad de carácter práctico o colaborativo en el aula.
  6. Laboratorio. Actividades desarrolladas en espacios especiales con equipamiento especializado (laboratorio, aulas informáticas).
  7. Tutoría. Período de instrucción realizado por un tutor con el objetivo de revisar y discutir los materiales y temas presentados en las clases.
  8. Evaluación. Conjunto de pruebas escritas, orales, prácticas, proyectos, trabajos, etc. utilizados en la evaluación del progreso del estudiante

 Las actividades de enseñanza y aprendizaje no presenciales se basan en:

  1. Trabajos teóricos. Preparación de seminarios, lecturas, investigaciones, trabajos, memorias, etc. para exponer o entregar en las clases teóricas.
  2. Trabajos prácticos. Preparación de actividades para exponer o entregar en las clases prácticas.
  3. Estudio teórico. Estudio de contenidos relacionados con las "clases teóricas": incluye cualquier actividad de estudio que no se haya computado en el apartado anterior (estudiar exámenes, trabajo en biblioteca, lecturas complementarias, hacer problemas y ejercicios, etc.).
  4. Estudio práctico. Relacionado con las "clases prácticas".
  5. Actividades complementarias. Son tutorías no académicas y actividades formativas voluntarias relacionadas con la asignatura, pero no con la preparación de exámenes o con la calificación: lecturas, seminarios, jornadas, vídeos, etc.

4.2. Actividades de aprendizaje

El programa que se ofrece al estudiante para ayudarle a lograr los resultados previstos comprende las siguientes actividades...

  • Clases magistrales.
  • Resolución de problemas y casos.
  • Prácticas de laboratorio.

El programa que se ofrece al estudiante para ayudarle a lograr los resultados previstos comprende las siguientes actividades...

Trabajo del estudiante

 

La asignatura consta de 6 créditos ECTS que suponen una dedicación estimada por parte del alumno de 150 horas distribuidas del siguiente modo: 

  • Actividades presenciales: 40 h (Clase magistral, Resolución de problemas y casos, Prácticas de laboratorio, Prácticas especiales)

  • Realización de trabajos de aplicación o investigación prácticos: 80 h
  • Tutela personalizada profesor-alumno: 5 h
  • Estudio de teoría: 20 h
  • Pruebas de evaluación: 5 h

4.3. Programa

  • Introducción y motivación al problema de los grandes volúmenes de datos (Big Data).
  • Almacenamiento de grandes volúmenes de datos:
    • Almacenes de datos (data warehouses). Diseño en estrella.
    • Bases de datos NoSQL.
  • Gestión de grandes volúmenes de datos:
    • Distribución de los datos.
    • Integración de información con fuentes de datos heterogéneas.
    • Uso de técnicas de representación del conocimiento (ontologías) para la representación de fuentes de datos y su acceso e integración.
    • Técnicas de procesamiento paralelo: MapReduce (Hadoop).
    • Sistemas de gestión de flujos de datos (data streams).
    • Otras técnicas: agentes móviles.
  • Interacción con grandes volúmenes de datos:
    • Técnicas de visualización.
    • Diseño de interfaces de usuario apropiados.
    • Usabilidad.
  • Análisis de grandes volúmenes de datos:
    • Minería de datos.
    • Análisis del sentimiento.
    • Minería de textos.
  • Casos de uso y aplicaciones, tales como:
    • Datos provenientes de sensores.
    • Datos no estructurados en la Web.
    • Sistemas de recomendación.
    • Análisis de blogs y redes sociales.
    • Ciudades inteligentes (smart cities).
    • Sistemas de Transporte Inteligentes.

4.4. Planificación de las actividades de aprendizaje y calendario de fechas clave

El calendario de clases, prácticas y exámenes, así como las fechas de entrega de trabajos de evaluación, se anunciará con suficiente antelación, de acuerdo con las sesiones y fechas establecidas por el centro.