Formation Talend Open Studio for Data Integration
Résumé
Logiciels : Talend Open Studio for Data Integration
Durée : 21 heures
Objectifs :
Développer des jobs Talend performants couvrant les principales problématiques de l’intégration de données :
Installer, configurer et prendre en main l’atelier TOS for data Integration
Modéliser et concevoir des jobs exploitants des sources de données variées : fichier csv, flux XML, base de données
Exploiter les composants multi-sources de TOS (tMap et tXMLMap)
Concevoir un entrepôt de données et synchroniser son contenu à partir de données multi-sources
Réaliser des transformations spécifiques à l’aide des composants tJava et tJavaRow
Mettre au point les jobs en utilisant les traces et le debogueur de TOS
Déployer des jobs dans un environnement de production.
Public : Administrateurs systèmes.
Pré-requis : Avoir des besoins métier. Bonne maîtrise de l’infrastructure système.
Méthodes mobilisées : Alternance d’apports théoriques et d’exercices de mise en application pratique. Les aspects théoriques sont mis en œuvre par le développement de jobs TOS ciblant des problématiques de migration de données, de qualification de données et de constitution d’un datawarehouse (entrepôt de données) ; 70 % du temps est consacré à la réalisation de ces jobs.
Modalités et délais d’accès : Sur inscription préalable au minimum 1 semaine avant le début de la formation selon disponibilité du formateur.
Modalités d’évaluations : Une évaluation du niveau des stagiaires est réalisée avant l’entrée en formation par téléphone ou au moyen d’un questionnaire. Évaluation des acquis et de la satisfaction en fin de formation.
Accessibilité aux personnes en situation de handicap : Conformité du matériel et des locaux aux personnes à mobilité réduite. Nous informer si un stagiaire en situation de handicap demande une adaptation.
Taux de satisfaction 2i2l : 100% des stagiaires sont "satisfaits" ou "très satisfaits" à l’issue de leur formation.
Tarif : Nous consulter.
Présentation
Liens web Talend :
le site officiel de Talend - Éditeur de logiciel
la société Talend sur Wikipedia
Programme
Introduction à la persistance objet
la présentation de la problématique
le mapping modèle Objet / modèle Relationnel : l’ « Impedance mismatch »
les différentes solutions pour un support relationnel : JDBC, EJB entity, frameworks ORM
la standardisation des ORM : l’origine de JPA
Présentation de Talend Open Studio for data integration
l’intégration de données
les principales solutions ETL
le logiciel Talend Open Studio : installation, préférences utilisateur
la documentation de référence
la philosophie du logiciel et les principaux éléments de conception d’un job TOS : business model, composants prédéfinis, métadonnées, contexte,...
Modéliser le besoin, concevoir ses premiers jobs
le Business Modeler : modéliser le métier, identifier les étapes de transformation, formaliser les flux de données
le Job Designer : éditeur graphique des jobs, propriétés des composants, les principales connexions (main, lookup, reject, OnComponentOk)
la configuration et l’utilisation de composants dédiés CSV et XML
l’utilisation des composants de transformation simples (tJoin, TFilterRow, tFilterColumn,...)
Optimiser le développement des jobs
configurer des connexions réutilisables à l’aide des métadonnées
mettre à jour les métadonnées et les propager sur les jobs
importer et exporter des méta-données
paramétrer les jobs par des contextes et des groupes de contextes
externaliser les variables de contextes en fichiers .properties et .ini
créer et gérer ses propres variables : globalMap, tJava et tJavaRow
générer des jeux de données pour des tests
Travailler avec des bases de données
le panorama des bases de données supportées et leurs principaux composants
les paramétrages des opérations sur les tables
les métadonnées et contexte de connexion à un schéma de base de données
le partage de connexions et la gestion des transactions
la création des requêtes à l’aide de SQLBuilder
Travailler sur des données multi-sources
présentation du composant tMap
configuration des flux d’entrée, créations de jointures
réalisation des transformations en utilisant des variables et des expressions
qualification des données à l’aide de filtres
génération des sorties multiples, prendre en compte les rejets
Compléments
le lancement des jobs en ligne de commande
l’organisation de leur exécution périodique
l’exécution des jobs en mode debug,
la génération des statistiques d’exécution
les possibilités de "reporting" tJasperOutput