Curso Open Talend Studio ETL

Duración: 25 Horas

Modalidad: Presencial In Company en empresas

Temario:

PARTE 1. Introducción a los ETL y Talend Open Studio
	1. Introducción a los flujos ETL
	2. Tipos de fuentes de datos
	3. Transformaciones y estándares
	4. Escalabilidad y Rendimiento
	5. Tipos de componentes en un ETL
	6. Productos Open Source
	7. Productos Comerciales

PARTE 2. Modelando los trabajos
	1. Uso del Business Modeler
	2. Manejo de documentos para el proyecto

PARTE 3. Uso de Job Designer para generar el código
	1. Pruebas con data sets

PARTE 4. Componentes input/output
	1. Manejo al acceso a ficheros XML, delimitados por caracteres, etc?
	2. Acceso a Bases de Datos relacionales

PARTE 5. Repositorio de Metadatos
	1. Centralizar las conexiones
	2. Centralizar los flujos de datos y esquemas

PARTE 6. Transformaciones de Datos
	1. Uso de los diferentes componentes en transformaciones
	2. Parametrización y mapeo de datos usando tmap (join)
	3. Perfilar los datos usando filtros
	4. Generación de outputs diverso y manejo de excepciones

PARTE 7. Funcionalidades de desarrollo
	1. Definición de los entornos del proyecto (desarrollo, producción)
	2. Inclusión de código java en los Jobs
	3. Establecer el manejo de errores
	4. Obtener estadísticas y logs de los trabajos

PARTE 8. Debug y Deploy de trabajos
	1. Generación de documentación técnica de los trabajos
	2. Usando el Debug view
	3. Generar jobs y proporcionarlos como servicios web

PARTE 9. Talend Open Studio y los Data Warehouses
	1. Modelo Kimball (de "estrella") de un data warehouse
	2. Tablas de hechos y dimensiones
	3. Carga inicial del warehouse
	4. Cargas incrementales