El curso se basa principalmente en exponer y explicar cada una de las piezas que componen un ecosistema Big data a través de la segunda distribución más utilizada en las empresas (Hortonworks), así como el estudio y análisis de las diferentes estrategias de negocio enfocadas a los clientes como son el CRM y la integración de todos los de sus respectivos departamentos a través de un ERP.
Dirigido a:
Los alumnos podrán acceder siempre y cuando estén en posesión de una titulación universitaria, preferiblemente perteneciente a los campos de la Informática, Telecomunicaciones.
Objetivo General:
El objetivo principal de curso es que, a partir de la generación de información relevante de diferentes fuentes dentro de la empresa, y con el uso del catálogo de herramientas que nos proporciona el ecosistema Big Data, seamos capaces de gestionar y almacenar datos en diferentes formatos, con el objetivo de generar conocimiento para el negocio, a través de cualquier herramienta de visualización o de analítica.
Objetivos Específicos:
- Obtener conocimiento sobre la administración de un clúster Hadoop (HDFS, Namenode, Datanode) a través de la distribución de Hortonworks 2.6.x
- Identificar diferentes herramientas de ingestas al clúster (Flume, Kafka Sqoop)
- Conocer la base de datos NO SQL y herramientas de visualización
- Obtener conocimiento de herramientas para Securizar un entorno Big Data
- Aprende Como gestionar entornos cloud (AWS y Azure)
- Conocer las arquitecturas básicas de un CRM y ERP en las empresas
Salidas profesionales:
Al finalizar el curso, el alumno será capaz de desarrollar la profesión de Arquitecto, Administrador, Analista o Desarrollador en entornos Big Data, especialmente en el sector Banca y Aseguradoras.
Este curso está relacionado con uno de los Módulos del Máster en Big Data y Business Intelligence
Temario:
Tema 1: Capas de un ecosistema Big Data Parte 1
- Capa de Almacenamiento
- Capa de Ingesta
- Sqoop
- Flume
- Kafka
- Capa de Procesamiento
- MapReduce2
- Yarn
- Pig
- Hive – Hive LLAP – BIGSQL
- Spark 1.6 y 2.0 (RDD, DataFrames, Spark MLlib, Spark GraphX, SparkSQL)
- Spark Streaming
- Storm
- Capa de Seguridad y acceso a los datos
- Apache Ranger
- Apache Knox
- Apache Metron
- Linaje y Trazabilidad
- Capa de Backup
- Dataplane Service
- distcp
Tema 2: Capas de un ecosistema Big Data Parte 2
- Arquitectura de bases de datos NOSQL
- Motores de Búsqueda NOSQL
- Capa de Búsqueda e Indexación
- Capa de Visualización
Tema 3: Introducción a los sistemas de información
- Cuadro de Mando Integral
- Dashboards
- Query & Reporting
Tema 4: Arquitectura de un CRM, ERP
- CRM´S Orientados al cliente
- CRM´S Orientados al empleado