Gouvernance

Carrefour ouvre son « supermarché de la donnée » à ses métiers

Par Alain Clapaud, publié le 28 février 2024

L’enseigne Carrefour mise sur une nouvelle approche pour promouvoir les usages de la donnée en interne. Son idée ? Créer un supermarché de la data pour permettre à tous ses collaborateurs d’accéder simplement aux données du groupe et d’innover plus librement.

Dans la grande distribution sans doute plus que dans tout autre secteur, la donnée est un actif clé pour la connaissance client et l’efficacité opérationnelle de la supply chain. Dès 2015, Carrefour lançait le projet de data lake Phenix afin de constituer ce que le distributeur estime être la plus grosse base de données d’Europe. Celle-ci stocke 10 milliards de tickets de caisse portant sur les trois dernières années. Les transactions réalisées par les 80 millions de clients de l’enseigne et toutes les données logistiques du groupe y sont aussi conservées, soit 23 millions de mouvements de stock par jour, 85 millions de commandes par mois et 3 millions d’articles en stock. Ce data lake mondial consolide toutes les données issues des neuf pays où l’enseigne est présente en propre.

Le groupe a déployé plus d’une dizaine d’outils pour exploiter cette mine d’or, avec des outils analytiques et de dataviz comme Qlik, Looker, PowerBI, Tableau, Reeport et des outils plus spécialisés comme MicroStrategy, Tibco, Google Vertex AI. Une « analytics factory » a été constituée avec des data scientists, des data engineers et des data product managers pour créer les analyses, dashboards, et modèles d’IA réclamés par les métiers.

Évoluer vers une approche self service

Pour Sébastien Rozanes, global chief data analytics officer, data mesh et organisationnel du groupe Carrefour, cette approche n’était pas totalement satisfaisante : « Trop souvent chez Carrefour, les échanges entre les équipes portent sur “comment trouver les bonnes données, les bons rapports et les bons indicateurs de performance”. Ces discussions impliquent de multiples personnes dans la chaîne, de multiples terminologies métiers, et la connaissance des emplacements de la donnée, etc. Parfois, plusieurs semaines plus tard, on se rend compte que le dashboard existait déjà… »

De nombreux data domains accessibles dans le data supermarket de Carrefour sont liés aux activités en point de vente : produits, assortiments, pricing, promotions, gestion des opérations en magasins.

L’idée du responsable est alors de transformer le data lake en un supermarché de la donnée où chacun pourra trouver librement celle dont il a besoin sur une étagère, avec une description complète de ses attributs et avec la certitude que la donnée en question est fiable. « Notre objectif est de favoriser la réutilisation, d’éviter de refaire plusieurs fois les mêmes analyses et nous assurer d’avoir un ownership bien identifié de tous nos termes métiers à l’échelle de l’ensemble de l’organisation. »

En effet, si aller voir un expert de l’analytics factory semble le bon réflexe pour un utilisateur métier qui veut accéder à une donnée, une telle organisation des demandes provoque nécessairement un goulet d’étranglement et une insatisfaction des métiers. Le supermarché de la donnée se positionne comme un autre canal d’accès à la donnée pour les collaborateurs.

Le « data supermarket » propose les données portant sur 21 data domains couvrant toute l’activité du groupe. À côté des grands classiques que sont les RH, l’IT, la finance, les ventes, le juridique, les fournisseurs, beaucoup de domaines sont plus spécifiques à la grande distribution comme le client omnicanal, la supply chain, les produits, etc.

Pour déployer ces 21 domaines, Carrefour a fait le choix de les prioriser par la valeur : « La donnée n’est intégrée que si celle-ci trouve des cas d’usage. Il peut s’agir d’applications, de moteurs analytiques ou de tableaux de bord qui vont la consommer. C’est ainsi que nous allons remplir notre supermarché petit à petit. »
Outre des données et des KPI, les rayons de ce supermarché proposeront aussi des rapports prêts à consommer, des algorithmes pour les rendre plus faciles d’accès et plus largement réutilisés.

L’analogie avec le produit de supermarché va très loin puisque Carrefour est en train d’implémenter un « Nutriscore » de la donnée afin d’évaluer le niveau de qualité de chacune d’elle. « Nous calculons un indicateur spécifique à chaque donnée, par exemple le taux de complétion du champ, la qualité de la définition, la fraîcheur de l’information. »

Une approche data mesh qui responsabilise les métiers

En termes de gouvernance, Carrefour applique le modèle du data mesh. Chaque domaine a sa propre organisation, avec un owner et une équipe. « On sait à qui s’adresser si la donnée est mal définie ou si elle est mal remontée des systèmes, souligne Sébastien Rozanes. En tant que chief data officer, j’apporte l’infrastructure, les bonnes pratiques, mais la gestion est déléguée aux métiers. Les data stewards choisissent les données qui vont être mises à disposition, celles sur lesquelles ils vont travailler la qualité en priorité. Enfin, des directeurs exécutifs viennent prioriser les data products en fonction des projets inscrits dans leur roadmap métier ou digitale. »
À terme, entre 100 et 200 data owners seront nommés dans l’organisation afin de piloter ces données.

Sébastien Rozanes

Global chief data analytics officer, data mesh
et organisationnel chez Carrefour

« Notre infrastructure data est un actif incroyable, mais ce n’est pas suffisant. L’idée est de rendre la donnée disponible auprès de tous les utilisateurs métiers, et l’expérience de self service data aussi simple qu’une visite d’un supermarché. »

Les solutions de metadata management ayant été jugées beaucoup trop complexes, une interface intuitive a été développée pour accéder au catalogue de data products. Cette interface web s’appuie sur la solution Google Dataplex ainsi que sur une couche sémantique fournie par la solution LookML de Looker. « Nous avons développé un front-end accessible à tous pour que chacun puisse naviguer dans les données, afficher directement les règles mises en œuvre dans le calcul d’un chiffre d’affaires commercial TTC, par exemple. Tous les synonymes y sont indiqués, car nous avions souvent plusieurs façons différentes d’appeler une donnée. »

Le système livre aussi la liste de tous les dashboards où une donnée spécifique est intégrée. Pour autant, tous les utilisateurs n’ont pas accès à tout. Pour bénéficier d’une ressource, il faut adresser une demande et la justifier.

Le nombre de solutions d’analyse mises en oeuvre par Carrefour va être ramené de treize à deux seulement dans le cadre d’une initiative parallèle au data supermarket, baptisée « data for all ». Celle-ci va rationaliser les outils mis à disposition des utilisateurs et les limiter à Tableau, Looker Studio et Connected Sheet, le tableur de Google Workspace.

Au total, ce projet représentera deux ans de travail, divisé en trois vagues, avec à chaque fois de nouveaux domaines mis à disposition des utilisateurs. Ceux-ci sont prévenus sur le portail de la mise à disposition des nouveaux data products avec un ciblage des annonces par profil.

Pendant que le déploiement des 21 domaines bat son plein, Sébastien Rozanes songe déjà au futur. L’IA générative pourrait bien jouer un rôle dans cette démocratisation de l’accès aux données avec un chatbot qui pourra interagir avec l’utilisateur et interpréter ses demandes en langage naturel pour l’aiguiller vers la donnée la plus adaptée.


Le projet en Chiffres

21 domaines métiers, plus de 100 familles de données

10 milliards de tickets de caisse

23 millions de mouvements de stock par jour


L’entreprise Carrefour

Activité : Grande distribution
Effectif : 321 000 collaborateurs
CA (2022) : 90,81 Md€


À LIRE AUSSI :

À LIRE AUSSI :

Dans l'actualité

Verified by MonsterInsights