OpenRefine

LimeSurvey : utiliser OpenRefine pour le nettoyage des noms de villes OpenRefine pour le nettoyage des noms de communes de vos enquêtes.

Un point sur le nettoyage de données provenant de vos questionnaires ; lorsque vous utilisez des questions ouvertes, de type texte, en particulier ici pour les types texte court, pour demander le nom d’une commune.

Il existe une extension, développée par Denis Chenu, appelée cpVille, pour vous permettre de poser la question "commune" avec plus de précision, mais elle est peu connue et doit être installée comme extension.

Nous vous proposons donc ce point traitement sur cette question.


Poser la question d’une ville ou d’une commune

Pour reprendre depuis le début, lorsque vous demandez le nom d’une commune, vous utilisez une question de type texte et obtenez des réponses différentes, comme les exemples ci-dessous :

Pas trop d’erreur pour "Nantes", "nantes", "Nantes ", "nantes ", " Nantes" ou " nantes",... mais cela fait déjà quelques modalités différentes pour vos tableaux.

Pour les communes avec des noms plus longs ou compliqués, cela devient vraiment problématique. Par exemple, vous pouvez avoir pour la commune de Saint-Sébastien-sur-Loire :
- Saint Sébastien sur Loire
- Saint-Sebastien-sur-Loire
- Saint Sebastien sur Loire
- Saint-Sébastien-sur-Loire
- Saint-Sébastien-Sur-Loire
- St Sébastien sur Loire
- St-Sebastien-sur-Loire
- St Sébastien / Loire
- St Sebastien/Loire
- Saint Sébastien/Loire
- saint sébastien sur loire
- saint sebastien sur loire
- ...

C’est sans fin !

Nous vous proposons donc de régler ce souci en moins de 3 minutes. Pour cela nous vous présentons le logiciel OpenRefine.

- OpenRefine est un logiciel libre de nettoyage et de mise en forme de données [1].
- voici le lien vers le site officiel OpenRefine,
- et la page de téléchargement OpenRefine,
- OpenRefine est un logiciel libre et gratuit.
- Nous assurons des formations OpenRefine : nettoyer, corriger, réconcilier, enregistrer et préparer la diffusion des fichiers de données, génériques ou sur mesures.

La démarche de nettoyage se trouve expliquée dans cet article : OpenRefine : nettoyer les noms de communes d’une table de données.