OpenRefine

OpenRefine : découvrir l’application de traitement de données Ouverture d’une table de données dans OpenRefine

Utilisons ce CSV pour notre tour de découverte de l’application OpenRefine.

OpenRefine-exercice-1-N2
exemple table de données avec erreurs

Ouvrir un jeu de données
- créer un projet : Parcourir, Suivant

Ouvrir une table de données


- constater un affichage de données
- choisir dans les paramètres de la partie basse : CSV / TSV / separator-based files, les données doivent être en colonnes

paramétrages de la table

Importer votre format de données
- savoir choisir le jeu de caractères : ISO8859-1 ou UTF8
- connaître le séparateur de colonnes : virgules, points-virgules, tabulations, espaces, autres
- préciser la ligne contenant les entêtes de colonnes
- conserver les lignes vides, ou pas

Lancer l’importation
- nommer le projet, en évitant les espaces vides dans le nom,
- cliquer sur Créer un projet

Création du projet

Découvrir les liens et boutons sur la première ligne
- Permalien est un lien vers le projet, si vous utilisez l’application en ligne, dans votre intranet
- ouvrir, un autre projet
- exporter le projet en cours

Découvrir l’interface de traitement
- onglet Facette / Filtre : pour les filtres
- onglet Défaire / Refaire : pour l’historique
- voir en : lignes ou entrées
- afficher : 5, 10, 25, 50 lignes
- première précédente x -x suivante ou dernière (ligne)

Historique des traitements

Lire les noms des colonnes de vos données
- lire le nombre total de lignes de votre importation
- Toutes pour la première colonne, celle-ci permet de marquer d’une étoile ou d’un drapeau, toutes les lignes que vous souhaitez pour le bon déroulement du traitement. Cette colonne comprend également une numérotation automatique de vos lignes.
- vos noms de colonnes, sont-ils bien normalisés ? Semblables ?

Connaître les principes
- vous avez toutes vos données dans une seule feuille
- toutes les lignes n’apparaissent pas forcément, ici 10 par défaut,
- une action peut être locale ou bien appliquée sur toute sa colonne
- une action peut être lancée par le bouton édit depuis une cellule ou bien par le sélecteur en forme de flèche vers le bas, en tête de colonne.

Découvrir les menus de traitements
- Facette ->
- Filtrer le texte
- Éditer les cellules ->
- Éditer la colonne ->
- Transposer ->
- Trier...
- Aperçu ->
- Réconcilier ->

Menus des colonnes

Ils sont tous identiques, pour toutes les colonnes, excepté pour la première colonne Toutes :
- Transformer
- Facette ->
- Éditer les lignes ->
- Éditer les colonnes ->
- Aperçu ->

Menu de la première colonne

Le menu de la première colonne permettant des actions plus génériques sur l’ensemble des lignes ou colonnes.