Curso de Spark y Kafka

Duración

60 horas / 6 semanas

Convocatoria

30 de Enero, 2019

Ver más convocatorias

El curso se basa principalmente en exponer y explicar cada una de las piezas de las que se compone el motor de Spark y Kafka con sus respectivas versiones en Streaming.

También se detallarán las diferentes API’S  tanto de SPARK (Python y  Scala), como de Kafka (Java).

Para terminar realizarán diferentes aplicaciones en near real time y como visualizarlas.

Propósito

El objetivo de este curso es que los alumnos conozcan la arquitectura de Kafka y Spark y su uso dentro del mundo Big Data.

 

Requisitos previos

El alumno debe tener experiencia profesional o académica programación y/o desarrollo de software, así como conocimientos básicos en administración de sistemas operativos (Unix )y bases de datos, y programación (Scala, Python y Java)

Perfil del alumnado

Los alumnos podrán acceder al Curso especializado en Spark y Spark Streaming y Kafka y Kafka Streaming y visualización siempre y cuando estén en posesión de una titulación universitaria, preferiblemente  perteneciente a los campos de la Informática, Telecomunicaciones, e incluso Estadísticos.

Salidas profesionales

Al finalizar el curso, el alumno será capaz de desarrollar diferentes aplicaciones tanto en Spark, como con Kafka y su integración dentro del mundo Big Data.

Objetivos

– El objetivo principal del curso es que a partir de la generación de información relevante de diferentes fuentes dentro de la empresa, y con el uso del catálogo de herramientas que nos proporciona el ecosistema Big Data, seamos capaces de gestionar y almacenar datos en diferentes formatos, con el objetivo de generar conocimiento para el negocio, a través de cualquier herramienta de visualización o de analítica.

– En este curso se pretende que los alumnos conozcan en profundidad las diferentes arquitecturas que existen en un entorno Big Data, así como el catálogo de herramientas para el procesamiento batch y online.

El curso de Spark y Kafka está relacionado con el Máster en Big Data y Business Intelligence

Curso de Spark y Kafka

Temario:

Tema 1:  APACHE SPARK

  • Introducción a Apache Spark. Spark vs MapReduce vs Tez
  • Introducción a Scala , Python.
  • Instalación, Configuración y Tunning de un cluster Spark Distribuido
  • Conceptos básicos, RDDs, transformaciones y acciones.
  • Desarrollo de aplicaciones con Spark. 

Tema 2: SPARK STREAMING

  • Dataframes
  • Diferencia entre RDD y Dataframes
  • Explorando datos con SQLContext
  • Introducción a Spark Streaming
  • Desarrollo de aplicaciones realtime con Spark Streaming

Tema 3: KAFKA (Plataforma distribuida de streaming)

  • Introducción a Kafka
  • Api’s
  • Configuración Cluster standalone, semi-distribuido y distribuido
  • Implementación. 

Tema 4:  VISUALIZACIÓN APLICACIONES REAL TIME

  •  Elasticsearch
  • Kibana
  • Realización aplicaciones real time, kafka, spark, elasticsearch y kibana

 

Metodología:

EADIC ofrece formación técnica online para ingenieros y arquitectos. Todos los cursos se imparten a través de nuestro campus virtual en un entorno cómodo y flexible al eliminar los desplazamientos y los horarios rígidos de la formación presencial. Cuenta además con diversas herramientas de comunicación que permiten estar en contacto con los profesores y los compañeros de edición, asegurando así una formación eficaz con un alto grado de aprovechamiento para el alumno. La documentación, que puede ser descargada desde el campus, se dispone debidamente desarrollada y acompañada de contenido adicional de interés ofrecido por los profesores. La evaluación del aprovechamiento del curso se realizará por pruebas teóricas y prácticas también en formato online.

En resumen: en EADIC no sólo hallarás un lugar donde mejorar tu formación, sino un punto de encuentro para profesionales de la ingeniería y la construcción donde poder intercambiar opiniones y conocimiento.

EADIC - Cursos y Master para Ingenieros y Arquitectos
EADIC Blog