Curso Apache Spark en Madrid, Barcelona y Online

Duración: 24 Horas

Descripción: Spark es una plataforma de computación de código abierto para análisis y procesos avanzados, que tiene muchas ventajas sobre Hadoop. Desde el principio, Spark fue diseñado para soportar en memoria algoritmos iterativos que se pudiesen desarrollar sin escribir un conjunto de resultados cada vez que se procesaba un dato

Spark está ganando terreno a otros sistemas Big Data como Hadoop al realizar procesamiento en memoria distribuida para grandes volumenes de datos además de aportar un conjunto mayor de operaciones para manipularlos cómodamente, además de disponer de librerias para tratar los datos como en una base de datos relacioal con queries SQL y disponer de librerias de Machine Learning distribuidas

Modalidad: Presencial In Company u Online en Streaming

Perfil: Desarrolladores  Scala, Python o  Java que deseen desarrollar aplicaciones sobre Spark

Temario:

Capítulo 1: Introducción

Capítulo 2 - Introducción a Apache Spark

Capítulo 3: Spark- Conceptos básicos

Capítulo 4: Procesamiento de Datos con RDDs

Capítulo 5: Hadoop Distributed File System

Capítulo 6 : Arquitectura Spark

Capítulo 7: Programación Paralela

Capítulo 8: Cacheo y Persistencia de Datos

Capítulo 9: Aplicaciones con Spark

Capítulo 10: Spark Streaming