Duración: 24 Horas
Descripción: Spark es una plataforma de computación de código abierto para análisis y procesos avanzados, que tiene muchas ventajas sobre Hadoop. Desde el principio, Spark fue diseñado para soportar en memoria algoritmos iterativos que se pudiesen desarrollar sin escribir un conjunto de resultados cada vez que se procesaba un dato
Spark está ganando terreno a otros sistemas Big Data como Hadoop al realizar procesamiento en memoria distribuida para grandes volumenes de datos además de aportar un conjunto mayor de operaciones para manipularlos cómodamente, además de disponer de librerias para tratar los datos como en una base de datos relacioal con queries SQL y disponer de librerias de Machine Learning distribuidas
Modalidad: Presencial In Company u Online en Streaming
Perfil: Desarrolladores Scala, Python o Java que deseen desarrollar aplicaciones sobre Spark
Temario:
Capítulo 1: Introducción
Capítulo 2 - Introducción a Apache Spark
Capítulo 3: Spark- Conceptos básicos
Capítulo 4: Procesamiento de Datos con RDDs
Capítulo 5: Hadoop Distributed File System
Capítulo 6 : Arquitectura Spark
Capítulo 7: Programación Paralela
Capítulo 8: Cacheo y Persistencia de Datos
Capítulo 9: Aplicaciones con Spark
Capítulo 10: Spark Streaming