Duración: 25 Horas
Modalidad: Presencial In Company en empresas
Temario:
PARTE 1. Introducción a los ETL y Talend Open Studio 1. Introducción a los flujos ETL 2. Tipos de fuentes de datos 3. Transformaciones y estándares 4. Escalabilidad y Rendimiento 5. Tipos de componentes en un ETL 6. Productos Open Source 7. Productos Comerciales PARTE 2. Modelando los trabajos 1. Uso del Business Modeler 2. Manejo de documentos para el proyecto PARTE 3. Uso de Job Designer para generar el código 1. Pruebas con data sets PARTE 4. Componentes input/output 1. Manejo al acceso a ficheros XML, delimitados por caracteres, etc? 2. Acceso a Bases de Datos relacionales PARTE 5. Repositorio de Metadatos 1. Centralizar las conexiones 2. Centralizar los flujos de datos y esquemas PARTE 6. Transformaciones de Datos 1. Uso de los diferentes componentes en transformaciones 2. Parametrización y mapeo de datos usando tmap (join) 3. Perfilar los datos usando filtros 4. Generación de outputs diverso y manejo de excepciones PARTE 7. Funcionalidades de desarrollo 1. Definición de los entornos del proyecto (desarrollo, producción) 2. Inclusión de código java en los Jobs 3. Establecer el manejo de errores 4. Obtener estadísticas y logs de los trabajos PARTE 8. Debug y Deploy de trabajos 1. Generación de documentación técnica de los trabajos 2. Usando el Debug view 3. Generar jobs y proporcionarlos como servicios web PARTE 9. Talend Open Studio y los Data Warehouses 1. Modelo Kimball (de "estrella") de un data warehouse 2. Tablas de hechos y dimensiones 3. Carga inicial del warehouse 4. Cargas incrementales