« Je cherchais un outil plus simple qu’un ETL classique qui me permettrait de me concentrer sur le sens des données, leurs formats, d’apparier des ensembles de données facilement et apporterait une souplesse d’évolution. En quelque sorte un outil de pilotage de la donnée sur l’ensemble de son cycle de vie » Julien Glauzy, Administrateur de données à la Direction des Systèmes d’Information et de Télécommunications de la Métropole Grand Nancy.
Pour répondre aux demandes de ses agents, la Métropole Grand Nancy cherche à optimiser le partage des données. L’objectif : avoir une vue globale, mieux les connaitre, améliorer leur qualité, unifier les SI dont elles sont issues pour gagner en efficacité et qualité de service.
Quels étaient les enjeux de Grand Nancy ?
Quels sont les apports de Tale of Data ? Quelles ont été les raisons du choix ?
Points clés pour la Métropole du Grand Nancy
- Améliorer la qualité des données de référence – et faciliter le partage avec les métiers et les applications – pour répondre au mieux aux demandes en interne ; créer de nouveaux services à forte valeur ajoutée pour les collectivités qui composent la métropole ; - Définir un cadre de gestion des données, avec les chefs de projets et les référents métiers, afin de mieux les connaitre, d’en assurer la diffusion, la cohérence et la fiabilité comme par exemple, définir le cycle de vie des données à contrôler ; les principes de création, stockage, suppression, fiabilisation,… - Satisfaire aux exigences règlementaires du RGPD et au niveau de Sécurité Métropolitain des données électroniques ; - Construire un infocentre, avec une logique de recueil Big data, qui permet de fabriquer des indicateurs de pilotage stratégique au long cours.
Présentation de la Métropole du Grand Nancy
La métropole est un territoire de 256 000 habitants composé de 20 communes. Elle se situe dans la Région Grand Est, au cœur du sillon lorrain, réunit les villes et agglomérations de Thionville, Metz, Nancy et Épinal, pour un total de 1,4 million d’habitants. La Métropole Grand Nancy remplit de grandes missions en lien avec des axes stratégiques autour du développement économique ; des déplacements et transports , des universités et de la recherche ; des nouvelles technologies de l’information et de la communication ; de l’habitat et de la solidarité ; du développement du territoire, de la mobilité et de l’environnement ; des grands équipements culturels, sports et loisirs.
Les challenges du Grand Nancy
Le nombre de systèmes d’information différents – 20, soit 1 par commune et l’indépendance de celles-ci – implique d’avoir une stratégie décisionnelle spécifique. Le tout en satisfaisant aux exigences règlementaires en matière de protection des données, de sécurité, et d’archivage. « Je cherchais un outil plus simple qu’un ETL classique qui me permettrait de me concentrer sur le sens des données, leurs formats, d’apparier des ensembles de données facilement et apporterait une souplesse d’évolution. En quelque sorte un outil de pilotage de la donnée sur son cycle de vie » témoigne Julien Glauzy, Administrateur de données à la Direction des Systèmes d’Information et de Télécommunications de la Métropole Grand Nancy.
Pourquoi la Métropole du Grand Nancy a choisi Tale of Data ?
La solution s’impose immédiatement de par la puissance de ses fonctionnalités et sa souplesse qui permettent le traitement des données à des fins décisionnelles. « J’ai vu que l’on pouvait faire des « quick win » et répondre à des problématiques très anciennes parfois. L’outil permet très vite une approche exhaustive d’un jeu de données issu d’une base ou d’un fichier.
L’exploration et le formatage sont très rapides par rapport aux fonctions Excel ou à un ETL. De plus l’approche des données fait que l’on se concentre pleinement sur le format, le sens et les ensembles de données mais plus sur la technique, d’où un gain de temps » précise Julien Glauzy. L’interface du logiciel permet également de relire facilement un « flow » de données, un peu comme un livre ce qui permet de retrouver facilement ce que l’on a fait sur la donnée (transformation, formatage, mixage, …). « Là encore je gagne du temps et le partage de la démarche et des résultats est facilité » commente Julien Glauzy. Dans Tale of Data, la logique de référentiel existe – donc il est possible de faire des stratégies de jointure, de combinaison entre de nombreux référentiels, ce que l’on ne peut pas faire avec SQL. Travailler avec une logique de référentiels s’appelle le Data Mesh (maillage de données)*. Cela permet de passer d’une infrastructure de données centralisée (entrepôt de données, data lake) gérée par une seule équipe à une organisation distribuée de la donnée (logique de fournisseur / consommateur / référentiel) ce que fait Grand Nancy.
Quels en sont les bénéfices ?
Tale of Data permet de répondre rapidement aux demandes. « Il y a une logique - entre autres - de fournisseur de données et de consommateurs, et je dois donc délivrer le service demandé en faisant bon usage des données » témoigne Julien Glauzy.
L’un des bénéfices clés de la solution réside dans l’automatisation des process de liaison ou de rapprochement. « Plutôt que d’avoir des données dans le SI et faire un entrepôt de données qui correspond à un seul usage, on construit des référentiels par thème. Quand une demande arrive on combine les référentiels dont on a besoin à partir des référentiels prêts, déjà formatés. Cela va plus vite, c’est extrêmement souple » indique Julien Glauzy.
Au-delà des demandes ponctuelles et grâce à des données qu’il est possible de prélever dans différents référentiels – en s’assurant toujours de leur fraicheur et de leur conformité au RGPD - Julien Glauzy fournit au Centre de Services informatiques des indicateurs de pilotage stratégiques afin d’améliorer la qualité des services rendus.
Avec Tale of Data on atteint à minima 95% de connexions entre les données de référentiels différents, ce qui ne peut pas se faire avec des bases de données. Grâce à la puissance de l’IA, la solution détecte par exemple ce qui est un nom ou pas – reconnaissance à deux lettres près ou en full text - mais détecte aussi des milliers d’autres données comme des adresses, numéros de tél, numéros de SIREN, ….. Tale of Data permet de voir ce qu’il y a dans les champs et alerte sur ce qui n’est pas bien formaté. « Lorsque vous travaillez avec des millions de lignes, cela représente un gain de temps infini » témoigne Julien Glauzy.
« Au final, je recommande Tale of Data pour l’exploration de données, la sémantique, le formatage, la combinaison de données, l’IA. C’est cela qui est fabuleux, je ne le retrouve nulle part ailleurs, dans aucun ETL » conclut Julien Glauzy.
Pour découvrir plus en détail comment Tale of Data applique le concept de Data Mesh pour transformer la gestion des données et fournir des insights stratégiques, visitez notre page dédiée au "Data Mesh" ou consultez notre article approfondi sur le sujet "Le Data Mesh : une nouvelle approche pour l'organisation et l’exploitation des données".
* concept proposé par Zhamak Delghani en 2019