About this Course
100% online

100% online

Start instantly and learn at your own schedule.
Flexible deadlines

Flexible deadlines

Reset deadlines in accordance to your schedule.
Intermediate Level

Intermediate Level

Hours to complete

Approx. 17 hours to complete

Suggested: 8 horas semana en promedio...
Available languages

Spanish

Subtitles: Spanish...
100% online

100% online

Start instantly and learn at your own schedule.
Flexible deadlines

Flexible deadlines

Reset deadlines in accordance to your schedule.
Intermediate Level

Intermediate Level

Hours to complete

Approx. 17 hours to complete

Suggested: 8 horas semana en promedio...
Available languages

Spanish

Subtitles: Spanish...

Syllabus - What you will learn from this course

Week
1
Hours to complete
1 hour to complete

INTRODUCCIÓN

...
Reading
1 video (Total 3 min), 8 readings
Reading8 readings
BIENVENIDA1m
Contenidos del curso (Temario)3m
Organización del curso y evaluación7m
Sobre el certificado2m
FAQs - Generales10m
FAQs - Cuestionarios y ejercicios2m
FAQs - Certificado10m
Links relacionados2m
Hours to complete
1 hour to complete

LA MÁQUINA VIRTUAL

A lo largo de estos cursos vamos a trabajar con un conjunto de herramientas contenidas en la máquina virtual Cloudera. En este apartado te explicamos cómo descargar e instalar dicha máquina virtual en tu ordenador. <br><br>La MV-Cloudera requiere disponer de un equipo con las siguientes características: (1) máquina de 64 bits, (2) mínimo 6G de memoria (recomendable 8G), y (3) 20G disponibles en disco. <br><br> <i><b>Ten en cuenta que bajar e instalar la máquina virtual te llevará tiempo dado el tamaño y complejidad de la misma</i></b>...
Reading
4 videos (Total 16 min), 4 readings
Video4 videos
Instalación de la máquina virtual - Import start4m
Instalación de la máquina virtual - Tips3m
Instalación de la máquina virtual - Pyspark setup4m
Reading4 readings
Link para la descarga de la MV_Cloudera20m
Instalación de la MV - Import start20m
Instalación de la MV - Tips10m
Instalación de la MV - Pyspark set up10m
Hours to complete
2 hours to complete

MÓDULO 1 - Introducción al ecosistema Apache Hadoop

En este módulo se van a introducir los conceptos básicos sobre el uso de Apache Hadoop y su utilización para plantear análisis de grandes conjuntos de datos. Se van a presentar las herramientas principales y la arquitectura del sistema.<br><br><i>Visualiza los vídeos, contesta el cuestionario tantas veces como quieras, realiza el ejercicio práctico sobre Hadoop y HDFS, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
7 videos (Total 55 min), 1 reading, 2 quizzes
Video7 videos
El ecosistema Hadoop11m
Modelo Map Reduce11m
HDFS: Hadoop Distributed File System7m
Arquitectura HDFS8m
YARN: Yet Another Resource Negotiator8m
HADOOP6m
Reading1 reading
LEEME10m
Quiz2 practice exercises
Cuestionario ecosistema Hadoop20m
Ejercicio práctico Hadoop y HDFS30m
Week
2
Hours to complete
2 hours to complete

MÓDULO 2 - Tecnologías SQL y NoSQL. Consistencia, fiabilidad y escalabilidad

En este módulo se introducen conceptos básicos sobre la naturaleza de los datos a tratar y de qué forma los sistemas NoSQL se diferencian de las bases de datos relacionales. Se presenta el teorema CAP y se muestra su importancia en el contexto de los sistemas distribuidos. Finalmente, se muestran una serie de sistemas junto con su uso en la industria actual. <br><br><i>Visualiza los vídeos, contesta el cuestionario tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
7 videos (Total 76 min), 1 quiz
Video7 videos
Tipos de datos8m
Tecnologías SQL y NoSQL12m
Consistencia, fiabilidad y escalabilidad7m
Tecnologías de BBDD NoSQL I11m
Tecnologías de BBDD NoSQL II22m
Introducción a BBDD analíticas y orientadas a grafos12m
Quiz1 practice exercise
Bases de datos NoSQL18m
Week
3
Hours to complete
2 hours to complete

MÓDULO 3 - Adquisición de datos

En este módulo se presentan los desafíos que hay que resolver a la hora de incorporar datos a los sistemas NoSQL y una breve introducción a las herramientas asociadas al ecosistema Hadoop más importantes. <br><br><i>Visualiza los vídeos, contesta el cuestionario tantas veces como quieras, realiza el ejercicio práctico sobre Apache Scoop, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
6 videos (Total 44 min), 1 reading, 2 quizzes
Video6 videos
Adquisición de datos13m
Apache Flume6m
Apache Sqoop6m
Apache Kafka7m
SQOOP7m
Reading1 reading
LEEME10m
Quiz2 practice exercises
Adquisición de datos18m
Ejercicio práctico Apache Sqoop20m
Week
4
Hours to complete
3 hours to complete

MÓDULO 4 - Herramientas para el análisis de datos industrial

En este módulo se presenta el análisis industrial de grandes volúmenes de datos y se introducen una serie de herramientas y sistemas de segunda generación dedicados a resolver necesidades específicas de la industria.<br><br><i>Visualiza los vídeos, contesta el cuestionario tantas veces como quieras, realiza los ejercicios prácticos sobre Apache Hive y Sparck, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
10 videos (Total 102 min), 1 reading, 3 quizzes
Video10 videos
Bases de datos analíticas10m
Business Intelligence14m
Apache Impala8m
Apache Hive11m
Apache Spark14m
Graph processing (I)11m
Graph processing (II)13m
HIVE6m
SPARK8m
Reading1 reading
LEEME10m
Quiz3 practice exercises
Bases de datos analíticas18m
Ejercicio Apache Hive6m
Ejercicio sesión básica con Apache Spark30m

Instructors

Avatar

Antonio Espinosa

Profesor Agregado Interino
Departamento de Arquitectura de Computadores y Sistemas Operativos
Avatar

Tomás Margalef

Catedrático
Dept. de Arquitectura de Computadores y Sistemas Operativos
Avatar

Andrés Cencerrado

Profesor
Área de Arquitectura y de Tecnología de Computadores

About Universitat Autònoma de Barcelona

The Universitat Autònoma de Barcelona (UAB) is a public university located in the metropolitan area of Barcelona. International in its outlook, it is fully consolidated within its local surroundings, and offers quality education in close association with research activity, the transfer of scientific, technological, cultural and educational knowledge, the promotion of its human potential and the responsible management of available resources. The UAB currently offers 81 degrees, 130 official Master Programmes and 183 UAB-specific Masters Degrees. In addition, it offers 174 lifelong learning programmes and 65 PhD Programmes, 27 of which have been distinguished through Quality Awards. The UAB has a total of over 3,500 teaching and research staff, over 2,000 administrative staff and over 40,000 students....

About the Big Data – Introducción al uso práctico de datos masivos Specialization

Este programa, de 4 cursos más un proyecto final, está pensado como una entrada al mundo de los datos masivos y su tratamiento. El primer curso tiene como objetivo mostrar al estudiante el impacto del Big Data en la sociedad actual, tanto en el mundo de los negocios como en el de la política y administraciones públicas, los medios de comunicación, y/o la investigación científica. A lo largo de los cursos 2, 3 y 4 se estudian la identificación, captura, pre-procesamiento, análisis y visualización de datos, desde un punto de vista “usuario”, y con una orientación práctica. Finalmente, el Capstone Project permite al estudiante utilizar en conjunto las herramientas y conceptos vistos en los cursos precedentes en un campo donde el concepto “Big Data” es innegable: el estudio de las galaxias. Al finalizar los cursos de esta especialización el estudiante será capaz de: 1. Entender el impacto del tratamiento de datos masivos en la sociedad actual 2. Entender y explicar la procedencia y características de los datos masivos. 3. Adquirir, preparar, almacenar, analizar, visualizar y manejar grandes conjuntos de datos 4. Extraer información de los datos 5. Trabajar dentro del ecosistema Hadoop 6. Contestar a una pregunta bien formulada en función de la información disponible (capstone project) Contamos con un conjunto maravilloso de profesores, con una gran experiencia en el tema, provenientes tanto de la universidad como de la empresa....
Big Data – Introducción al uso práctico de datos masivos

Frequently Asked Questions

  • Once you enroll for a Certificate, you’ll have access to all videos, quizzes, and programming assignments (if applicable). Peer review assignments can only be submitted and reviewed once your session has begun. If you choose to explore the course without purchasing, you may not be able to access certain assignments.

  • When you enroll in the course, you get access to all of the courses in the Specialization, and you earn a certificate when you complete the work. Your electronic Certificate will be added to your Accomplishments page - from there, you can print your Certificate or add it to your LinkedIn profile. If you only want to read and view the course content, you can audit the course for free.

More questions? Visit the Learner Help Center.