Accueil du site - Catalogue de formations - Formations UNIX & GNU / Linux - Formation Talend : intégration de données avec Talend Open Studio for Data Integration
Formation Talend Open Studio for Data Integration

Prochaine session :
- sur demande


Contact : 2i2L - Informatique Internet et Logiciels Libres. Tel. : 02 40 37 02 06 – Mobile : 06 07 38 14 18 – Courriel : formation chez 2i2l.fr


Résumé de la formation :

- Logiciels : Talend Open Studio for Data Integration
- Durée : trois (3) journées

- Objectifs : à l’issue du stage, les participants seront capables de développer des jobs Talend performants couvrant les principales problématiques de l’intégration de données : installer, configurer et prendre en main l’atelier TOS for data Integration - modéliser et concevoir des jobs exploitants des sources de données variées : fichier csv, flux XML, base de données - exploiter les composants multi-sources de TOS (tMap et tXMLMap) - concevoir un entrepôt de données et synchroniser son contenu à partir de données multi-sources - réaliser des transformations spécifiques à l’aide des composants tJava et tJavaRow - mettre au point les jobs en utilisant les traces et le debogueur de TOS - déployer des jobs dans un environnement de production.

- Pédagogie : les aspects théoriques sont mis en œuvre par le développement de jobs TOS ciblant des problématiques de migration de données, de qualification de données et de constitution d’un datawarehouse (entrepôt de données) ; 70 % du temps est consacré à la réalisation de ces jobs.


Liens web Talend :

- le site officiel de Talend - Éditeur de logiciel
- la société Talend sur Wikipedia


Programme

Introduction à la persistance objet
- la présentation de la problématique
- le mapping modèle Objet / modèle Relationnel : l’ « Impedance mismatch »
- les différentes solutions pour un support relationnel : JDBC, EJB entity, frameworks ORM
- la standardisation des ORM : l’origine de JPA

Présentation de Talend Open Studio for data integration
- l’intégration de données
- les principales solutions ETL
- le logiciel Talend Open Studio : installation, préférences utilisateur
- la documentation de référence
- la philosophie du logiciel et les principaux éléments de conception d’un job TOS : business model, composants prédéfinis, métadonnées, contexte,...

Modéliser le besoin, concevoir ses premiers jobs
- le Business Modeler : modéliser le métier, identifier les étapes de transformation, formaliser les flux de données
- le Job Designer : éditeur graphique des jobs, propriétés des composants, les principales connexions (main, lookup, reject, OnComponentOk)
- la configuration et l’utilisation de composants dédiés CSV et XML
- l’utilisation des composants de transformation simples (tJoin, TFilterRow, tFilterColumn,...)

Optimiser le développement des jobs
- configurer des connexions réutilisables à l’aide des métadonnées
- mettre à jour les métadonnées et les propager sur les jobs
- importer et exporter des méta-données
- paramétrer les jobs par des contextes et des groupes de contextes
- externaliser les variables de contextes en fichiers .properties et .ini
- créer et gérer ses propres variables : globalMap, tJava et tJavaRow
- générer des jeux de données pour des tests

Travailler avec des bases de données
- le panorama des bases de données supportées et leurs principaux composants
- les paramétrages des opérations sur les tables
- les métadonnées et contexte de connexion à un schéma de base de données
- le partage de connexions et la gestion des transactions
- la création des requêtes à l’aide de SQLBuilder

Travailler sur des données multi-sources
- présentation du composant tMap
- configuration des flux d’entrée, créations de jointures
- réalisation des transformations en utilisant des variables et des expressions
- qualification des données à l’aide de filtres
- génération des sorties multiples, prendre en compte les rejets

Compléments
- le lancement des jobs en ligne de commande
- l’organisation de leur exécution périodique
- l’exécution des jobs en mode debug,
- la génération des statistiques d’exécution
- les possibilités de "reporting" tJasperOutput