Formation Talend Open Studio for Data Integration
Résumé
Logiciel : Talend Open Studio for Data Integration
Durée : 21 heures
Objectifs :
Développer des jobs Talend performants couvrant les principales problématiques de l’intégration de données :
– Installer, configurer et prendre en main l’atelier TOS for data Integration
– Modéliser et concevoir des jobs exploitants des sources de données variées : fichier csv, flux XML, base de données
– Exploiter les composants multi-sources de TOS (tMap et tXMLMap)
– Concevoir un entrepôt de données et synchroniser son contenu à partir de données multi-sources
– Réaliser des transformations spécifiques à l’aide des composants tJava et tJavaRow
– Mettre au point les jobs en utilisant les traces et le debogueur de TOS
– Déployer des jobs dans un environnement de production.
Public : Administrateurs systèmes.
Pré-requis : Avoir des besoins métier. Bonne maîtrise de l’infrastructure système.
Méthodes mobilisées : Alternance d’apports théoriques et d’exercices de mise en application pratique. Les aspects théoriques sont mis en œuvre par le développement de jobs TOS ciblant des problématiques de migration de données, de qualification de données et de constitution d’un datawarehouse (entrepôt de données) ; 70 % du temps est consacré à la réalisation de ces jobs.
Modalités et délais d’accès : Sur inscription préalable au minimum 1 semaine avant le début de la formation selon disponibilité du formateur.
Modalités d’évaluations : Une évaluation du niveau des stagiaires est réalisée avant l’entrée en formation par téléphone ou au moyen d’un questionnaire. Évaluation des acquis et de la satisfaction en fin de formation.
Accessibilité aux personnes en situation de handicap ou présentant des difficultés d’apprentissage : nous pouvons proposer des solutions de compensation de nos prestations en adaptant les moyens pédagogiques, techniques et d’encadrement (les précisions).
Taux de satisfaction 2i2L : 96,34 % des stagiaires sont satisfaits à l’issue de leur formation.
Tarif : pour une demande de formation interne, nous consulter.
Présentation
Liens web Talend :
– le site officiel de Talend - Éditeur de logiciel
– la société Talend sur Wikipedia
Programme
Introduction à la persistance objet
– la présentation de la problématique
– le mapping modèle Objet / modèle Relationnel : l’ « Impedance mismatch »
– les différentes solutions pour un support relationnel : JDBC, EJB entity, frameworks ORM
– la standardisation des ORM : l’origine de JPA
Présentation de Talend Open Studio for data integration
– l’intégration de données
– les principales solutions ETL
– le logiciel Talend Open Studio : installation, préférences utilisateur
– la documentation de référence
– la philosophie du logiciel et les principaux éléments de conception d’un job TOS : business model, composants prédéfinis, métadonnées, contexte,...
Modéliser le besoin, concevoir ses premiers jobs
– le Business Modeler : modéliser le métier, identifier les étapes de transformation, formaliser les flux de données
– le Job Designer : éditeur graphique des jobs, propriétés des composants, les principales connexions (main, lookup, reject, OnComponentOk)
– la configuration et l’utilisation de composants dédiés CSV et XML
– l’utilisation des composants de transformation simples (tJoin, TFilterRow, tFilterColumn,...)
Optimiser le développement des jobs
– configurer des connexions réutilisables à l’aide des métadonnées
– mettre à jour les métadonnées et les propager sur les jobs
– importer et exporter des méta-données
– paramétrer les jobs par des contextes et des groupes de contextes
– externaliser les variables de contextes en fichiers .properties et .ini
– créer et gérer ses propres variables : globalMap, tJava et tJavaRow
– générer des jeux de données pour des tests
Travailler avec des bases de données
– le panorama des bases de données supportées et leurs principaux composants
– les paramétrages des opérations sur les tables
– les métadonnées et contexte de connexion à un schéma de base de données
– le partage de connexions et la gestion des transactions
– la création des requêtes à l’aide de SQLBuilder
Travailler sur des données multi-sources
– présentation du composant tMap
– configuration des flux d’entrée, créations de jointures
– réalisation des transformations en utilisant des variables et des expressions
– qualification des données à l’aide de filtres
– génération des sorties multiples, prendre en compte les rejets
Compléments
– le lancement des jobs en ligne de commande
– l’organisation de leur exécution périodique
– l’exécution des jobs en mode debug,
– la génération des statistiques d’exécution
– les possibilités de "reporting" tJasperOutput