Il y a trois ans, le groupe énergétique s’est lancé dans un vaste projet technique et organisationnel en mettant en place une infrastructure mondiale de gestion des données. Objectif : rendre la data accessible pour la transformer en levier de performance économique.

Organisation très décentralisée présente dans 70 pays avec 25 Business Units (BU) régionales, Engie a réalisé, il y a trois ans environ, que ses données étaient sousexploitées. « Chaque BU avait des données qui restaient à son niveau, ce qui entraînait une double problématique : nous n’avions pas de leadership métier global et les données étaient très émiettées et cloisonnées dans les systèmes source locaux, explique Gérard Guinamand, group chief data officer d’Engie. Nous avons donc décidé en 2018 de mettre en place une gouvernance mondiale. »

Première étape, le groupe a cherché à décloisonner l’information, mais en respectant l’autonomie de ses BU. « La valeur des données d’un groupe ne se résume pas à la somme des valeurs des données de ses BU, estime Gérard Guinamand. Exemple, chacune d’entre elles pilotait ses propres parcs éoliens en 2018, mais ne partageait pas ses données avec une autre qui faisait exactement le même travail. Or, si nous voulions mettre en place une IA pour, par exemple, augmenter le rendement d’une éolienne, nous avions besoin de beaucoup de données pour non seulement accélérer l’entraînement d’un modèle, mais aussi le rendre plus efficace. Cela étant, pour des raisons culturelles, et peut-être même de méfiance, liées à notre organisation très décentralisée, nous pouvions difficilement imaginer un data lake dans lequel chaque BU viendrait copier ses données. C’est pourquoi nous avons adopté l’approche “commondatahub”. »

« La méfiance quand on ne sait pas à quoi vont servir les données partagées est un sujet fondamental à prendre en compte dans ce type de projet »

Ce « commondatahub » se concrétise par du stockage S3 sur AWS enrichi de services managés (Glue pour l’ingestion de données ou encore Sagemaker pour le machine learning).
Afin de respecter l’autonomie de chaque BU, Engie a ajouté une couche de gestion des droits et des accès, développée sur mesure. Chaque DSI de BU a ainsi la possibilité de définir quelles données il veut partager et avec qui, tout en offrant à l’organisation centrale de gouvernance de la donnée – mise en place dans le cadre de ce projet – une vue globale des jeux de données partagés. « Concrètement, notre vue consolidée était la somme de 25 data lakes plus ou moins interconnectés au bon vouloir des DSI de nos 25 BU. Grâce à cette architecture qui respecte l’indépendance de chacun, nous avons évité les écueils rencontrés par certaines entreprises, à savoir des entrepôts dormants qui ne servent à rien parce que personne ne les alimente. La méfiance quand on ne sait pas à quoi vont servir les données partagées est un sujet fondamental à prendre en compte dans le cadre de ce type de projet. »

Dans un second temps, Engie a cherché à instaurer une culture de « l’APIsation ». « Le premier volet de notre projet concernait uniquement le partage de la donnée brute, explique Gérard Guinamand. Avec les API, nous montons d’un niveau en demandant aux BU de faire l’effort de rendre accessibles les services qu’elles créent, qu’il s’agisse d’un jeu de données ou d’un modèle d’IA. Là encore, nous avons opté pour la liberté en leur laissant choisir la technologie de création des API. Le portail central, qui permet à la fois de gérer et de donner de la visibilité aux API, repose pour sa part sur Amplify d’Axway. »

Pour mener à bien cette stratégie « entreprise data driven », Engie a beaucoup investi en accompagnement et en formation pour sensibiliser ses BU à la culture du partage, expliquer l’intérêt des API aux métiers et faire monter en compétences ses équipes techniques.
En cours du projet, le groupe a aussi changé de mode de gouvernance afin d’aligner son organisation sur sa stratégie data. Il est ainsi passé de 25 BU héritées d’un découpage géographique à 4 BU globales orientées par métier. « Au lieu d’avoir 25 CDO propriétaires de leurs données locales, nous n’en avons plus que quatre, ce qui a considérablement simplifié notre travail en central », note Gérard Guinamand.

Engie a également créé une nouvelle entité de cinq personnes qui définit la stratégie du groupe. Son bras armé, une équipe d’une cinquantaine de personnes rattachées à la DSI, déploie et assure la maintenance des solutions. Ensemble, ces deux équipes contrôlent aussi les API proposées par les BU avant de les ajouter au portail. « À chaque nouvelle API, nous réalisons une vérification technique et métier très poussée, explique Gérard Guinamand. Nous contrôlons notamment la qualité du code, la sécurité, mais aussi le potentiel d’industrialisation : si le développement n’a qu’un intérêt local, elle n’est pas ajoutée au portail. Avec la nouvelle organisation, cet aspect est désormais du ressort des CDO de BU : ils s’assurent non seulement de la pertinence du partage des API, mais aussi de structurer la démarche pour couvrir tous les besoins de leur périmètre avec cette approche. »
Résultat, sur les 500 API créées par le groupe depuis trois ans, 107 étaient déjà intégrées au portail début 2021. Engie ambitionne d’atteindre les 200 en fin d’année et d’en ajouter 200 supplémentaires en 2022.

Très vigilant sur l’efficacité de sa stratégie, le groupe a mis en place des indicateurs de performance, ce qui lui permet de connaître très précisément la valeur business ou financière de chaque API. Typiquement, Engie a ramené à la semaine ou au mois sa capacité à mettre en œuvre des solutions, contre des années auparavant.

De la même façon, les données externes sont désormais achetées au niveau groupe avant d’être partagées via des API, la mutualisation des contrats ayant entraîné des économies significatives. « Cette architecture basée sur ces composants va aussi faciliter le partage de données avec des partenaires pour créer de nouveaux services », ajoute Gérard Guinamand.

Et de conclure : « Mesurer la valeur d’une API nécessite un important travail de “détricotage” du cas d’usage, mais c’est un travail essentiel pour s’assurer de l’efficacité d’une stratégie data. »

L’ENTREPRISE

ACTIVITÉ : Fournisseur électricité & gaz
EFFECTIF : +170 000 collaborateurs dans le monde
CA : 55,7 Md € (2020)

#PODCASTS

Vous voulez en savoir plus sur la thématique Data ? Découvrez le podcast Data DataXplained !

 

DataXplained, Le podcast qui décrypte pour vous tous les concepts autour de la data.

 

Vous vous demandez ce qu’est la Data Literacy ? Vous voulez comprendre la différence entre Data Warehouse et Data Lake ? Vous voudriez mieux capter ce qui se cache derrière l’Intelligence Active ?

 

C’est notre objectif avec DataXplained, le podcast qui répond chaque semaine à toutes vos questions autour de la data, et qui décrypte les dernières tendances pour faire de vous un vrai Data Expert, ceci en 10 mn chrono !