Talend

Formation Talend : intégration de données avec Talend Open Studio for Data Integration Formation Talend Open Studio for Data Integration

Formation Talend Open Studio for Data Integration

Résumé

Logiciel : Talend Open Studio for Data Integration
Durée : 21 heures
Objectifs :
Développer des jobs Talend performants couvrant les principales problématiques de l’intégration de données :
 Installer, configurer et prendre en main l’atelier TOS for data Integration
 Modéliser et concevoir des jobs exploitants des sources de données variées : fichier csv, flux XML, base de données
 Exploiter les composants multi-sources de TOS (tMap et tXMLMap)
 Concevoir un entrepôt de données et synchroniser son contenu à partir de données multi-sources
 Réaliser des transformations spécifiques à l’aide des composants tJava et tJavaRow
 Mettre au point les jobs en utilisant les traces et le debogueur de TOS
 Déployer des jobs dans un environnement de production.
Public : Administrateurs systèmes.
Pré-requis : Avoir des besoins métier. Bonne maîtrise de l’infrastructure système.
Méthodes mobilisées : Alternance d’apports théoriques et d’exercices de mise en application pratique. Les aspects théoriques sont mis en œuvre par le développement de jobs TOS ciblant des problématiques de migration de données, de qualification de données et de constitution d’un datawarehouse (entrepôt de données) ; 70 % du temps est consacré à la réalisation de ces jobs.
Modalités et délais d’accès : Sur inscription préalable au minimum 1 semaine avant le début de la formation selon disponibilité du formateur.
Modalités d’évaluations : Une évaluation du niveau des stagiaires est réalisée avant l’entrée en formation par téléphone ou au moyen d’un questionnaire. Évaluation des acquis et de la satisfaction en fin de formation.
Accessibilité aux personnes en situation de handicap ou présentant des difficultés d’apprentissage : nous pouvons proposer des solutions de compensation de nos prestations en adaptant les moyens pédagogiques, techniques et d’encadrement (les précisions).
Taux de satisfaction 2i2L : 96,34 % des stagiaires sont satisfaits à l’issue de leur formation.
Tarif : pour une demande de formation interne, nous consulter.

Présentation

Liens web Talend :

 le site officiel de Talend - Éditeur de logiciel
 la société Talend sur Wikipedia

Programme

Introduction à la persistance objet
 la présentation de la problématique
 le mapping modèle Objet / modèle Relationnel : l’ « Impedance mismatch »
 les différentes solutions pour un support relationnel : JDBC, EJB entity, frameworks ORM
 la standardisation des ORM : l’origine de JPA

Présentation de Talend Open Studio for data integration
 l’intégration de données
 les principales solutions ETL
 le logiciel Talend Open Studio : installation, préférences utilisateur
 la documentation de référence
 la philosophie du logiciel et les principaux éléments de conception d’un job TOS : business model, composants prédéfinis, métadonnées, contexte,...

Modéliser le besoin, concevoir ses premiers jobs
 le Business Modeler : modéliser le métier, identifier les étapes de transformation, formaliser les flux de données
 le Job Designer : éditeur graphique des jobs, propriétés des composants, les principales connexions (main, lookup, reject, OnComponentOk)
 la configuration et l’utilisation de composants dédiés CSV et XML
 l’utilisation des composants de transformation simples (tJoin, TFilterRow, tFilterColumn,...)

Optimiser le développement des jobs
 configurer des connexions réutilisables à l’aide des métadonnées
 mettre à jour les métadonnées et les propager sur les jobs
 importer et exporter des méta-données
 paramétrer les jobs par des contextes et des groupes de contextes
 externaliser les variables de contextes en fichiers .properties et .ini
 créer et gérer ses propres variables : globalMap, tJava et tJavaRow
 générer des jeux de données pour des tests

Travailler avec des bases de données
 le panorama des bases de données supportées et leurs principaux composants
 les paramétrages des opérations sur les tables
 les métadonnées et contexte de connexion à un schéma de base de données
 le partage de connexions et la gestion des transactions
 la création des requêtes à l’aide de SQLBuilder

Travailler sur des données multi-sources
 présentation du composant tMap
 configuration des flux d’entrée, créations de jointures
 réalisation des transformations en utilisant des variables et des expressions
 qualification des données à l’aide de filtres
 génération des sorties multiples, prendre en compte les rejets

Compléments
 le lancement des jobs en ligne de commande
 l’organisation de leur exécution périodique
 l’exécution des jobs en mode debug,
 la génération des statistiques d’exécution
 les possibilités de "reporting" tJasperOutput