

@Work
Engie Digital industrialise sa production IA avec SageMaker
Par Marie Varandat, publié le 02 août 2021
L’entité dédiée à la transformation numérique d’Engie a développé deux plateformes distinctes de maintenance prédictive : Agathe pour les clients B2B, Robin Analytics pour les besoins internes. Grâce à l’adoption des services IA de SageMaker d’AWS, elle a automatisé sa production et devrait permettre à sa maison mère de réaliser plus de 800 000 euros d’économies par an.
Best Of 2021 : du 27 juillet au 31 août, IT for Business remet en avant certains des articles publiés depuis le début de l’année et qui ont connu une forte audience…
Cet article a été publié à l’origine le 13 avril 2021.
Premier producteur mondial indépendant d’électricité, Engie est présent dans 70 pays. Avec ses 150 000 collaborateurs, il s’affirme comme le premier fournisseur de services à l’énergie dans le monde. Au sein d’Engie, la structure Engie Digital a été créée en octobre 2016. Elle assure la transformation numérique du Groupe en proposant des solutions logicielles qui ont pour premier objectif d’accélérer la transition bas carbone. L’entité s’est notamment intéressée à la maintenance prédictive en faisant évoluer Agathe, une solution existante héritée d’Engie Axima et proposée aux clients B2B. Parallèlement, elle a aussi donné naissance à Robin Analytics, outil de maintenance prédictive destiné, cette fois-ci, à la gestion des équipements internes des centrales thermiques du Groupe, qui vient de remporter le premier prix du Asset Performance Awards décerné par la BEMAS, association spécialisée dans l’Asset Management et la maintenance des actifs physiques.
Composer avec l’héritage
Développée initialement par Engie Axima, Agathe a rejoint le portfolio d’Engie Digital en 2019. Orientée maintenance prédictive, la solution permet aux clients B2B du Groupe de mieux planifier et optimiser les cycles de maintenance des centrales de traitement d’air, des centrales frigorifiques ou encore des chaudières biomasse, salles blanches, etc. La solution repose sur le datalake d’Engie, enrichi d’une couche d’API, d’interfaces utilisateurs, d’un catalogue de données et autres pipeline d’ingestion d’informations provenant des différentes entités du Groupe mais aussi des capteurs situés sur les équipements des clients.
Baptisée CDH pour Common Data Hub, le datalake du groupe comporte un important volet de gestion de la sécurité des données avec des droits d’accès prédéfinis pour les clients et les datascientists internes. Ce CDH repose sur S3 pour le stockage et sur des services managés d’AWS, dont Glue pour la partie ETL qui gère les flux de données entrants et sortants. Lorsque qu’Engie Digital a récupéré Agathe, ce socle était exploité par une centaine de modèles de maintenance prédictive, tous développés à partir de librairies open source.
Découpler pour capitaliser sur l’existant
Afin de pouvoir capitaliser sur la richesse de cet existant pour continuer à faire évoluer Agathe mais aussi développer le nouveau projet Robin Analytics de maintenance prédictive destiné aux équipements internes du Groupe, Engie Digital a commencé par découpler les couches basses d’Agathe des modèles. « Nous avons regroupé tout ce qui avait trait à l’orchestration des modèles ML et les pipelines de données en provenance des clients dans une brique que nous avons baptisés PredictME pour Predictive Maintenance Engine, explique Mihir Sarkar, head of data d’Engie Digital. Forts de cette brique technologique au-dessus d’un datalake qui stocke un historique de données de plus de 10 années, nous pouvions l’enrichir de couches supplémentaires, qu’il s’agisse de nouvelles interfaces pour les utilisateurs, de nouveaux flux d’alimentation ou encore de nouveaux modèles de maintenance prédictive pour couvrir de nouveaux équipements ».
Dit autrement, afin de mutualiser le service et accélérer le développement, Engie Digital a récupéré et isolé les couches basses de son existant pour constituer un socle commun capable d’accueillir de nouveaux projets. Fort logiquement, la société a ensuite cherché à optimiser les couches supérieures en industrialisant la production de ses modèles. Avec un existant fonctionnant déjà sur AWS, elle s’est naturellement tournée vers Sagemaker, plateforme de services permettant de développer, entrainer et déployer des modèles IA sur le cloud d’Amazon.
Automatiser le déploiement de modèles
« En réalité, nous avons passé l’été 2019 à faire des POC afin de vérifier l’adéquation de SageMaker à nos besoins, précise Mihir Sarkar. Lorsque nous avons découplé l’existant pour donner naissance à PredictMe, nous avons franchi une première étape dans l’optimisation de notre production de modèles. Mais nous perdions encore beaucoup trop de temps en déploiement. Sagemaker prend en charge cette étape en organisant et automatisant la transition de l’algorithme sous Notebook au passage en production. Toutefois, Sagemaker a été conçu entre autre pour travailler avec des algorithmes de Deep Learning alors que nous utilisons des modèles Machine Learning traditionnels. Nous avons donc dû vérifier au cours de différents POC que SageMaker était compatible avec nos librairies existantes avant de le retenir comme moteur principal d’entrainement pour les modèles d’Agathe mais aussi pour tous nos autres services à venir ».
Une fois cette étape franchie, Engie Digitale a commencé à enrichir la bibliothèque de modèles d’Agathe à un rythme beaucoup plus soutenu tout en donnant naissance à Robin Analytics.
Des milliers de modèles entrainés simultanément
« Un des points forts de Sagemaker est d’offrir un niveau de sécurité très élevé avec des process d’entrainement parallélisés indépendants les uns des autres, poursuit Mihir Sarkar. C’est d’autant plus important que nous partageons une même infrastructure sur les deux projets. Nous devons donc pouvoir gérer les accès très finement. Dit autrement, nous pouvons nous permettre d’utiliser les mêmes bases pour différents modèles et lancer plusieurs déploiements en simultané, SageMaker garantissant l’étanchéité entre modèles en termes d’accès notamment ».
Résultat, là où Engie Digital mettait entre quelques jours à deux semaines pour déployer un modèle, il ne lui faut plus que 20 minutes avec SageMaker.
Autre avantage, la plateforme est proposée sous forme de service managé : la maintenance et les mises à jour sont assurées par AWS. « Nous n’avons plus à faire l’effort de maintenir ces couches basses, explique Mihir Sarkar. Nos datacientists peuvent ainsi se concentrer sur leur réelle valeur ajoutée, à savoir concevoir des modèles, plutôt que d’assurer la maintenance d’un socle et la programmation du déploiement. Là encore nous gagnons un temps précieux : d’une centaine de modèles sur Agathe, nous sommes passés à plusieurs milliers en un an ».
Ambitieuse, la roadmap d’Engie Digital prévoit un déploiement exponentiel sur les trois ans à venir avec un objectif de 1000 équipements couverts en 2024 sur Robin Analytics. « Sur Agathe, l’ambition est de connecter 8000 d’ici 2025, chacun disposant de plusieurs dizaines de modèles, souligne Mihir Sarkar. Sur Robin Analytics, les modèles sont un peu plus compliqués à mettre en place car les équipements comportent plus de capteurs. Les flux de données sont donc plus importants. Pour l’instant nous n’avons déployé qu’une dizaine de modèles ».
Plus de 800 000 euros d’économies par an
Confiante néanmoins sur sa capacité à tenir ses objectifs depuis la mise en place de cette nouvelle infrastructure, l’équipe de Mihir Sarkar a déjà procédé à une estimation des gains apportés par ses deux projets de maintenance prédictive.
En évitant les pertes de revenus à cause d’arrêts de production et autres pannes, les pénalités qui en découlent ou encore les couts liés à des remplacements de pièces trop fréquents, Engie Digital pourrait permettre à sa maison mère de faire 800 000 euros d’économies par an. « Typiquement, au lieu de faire une visite planifiée tous les trois mois pour changer un équipement sans savoir s’il est usé ou pas, nous estimons que nous pouvons gagner une visite sur 4. En évitant cette maintenance systématique tout en conservant un rendement optimal grâce à nos modèles, nous économisons entre 100 à 1000 € par équipement par an. Au passage, nos modèles profitent également aux constructeurs d’équipements car il arrive qu’ils nous permettent d’identifier des points de fragilité ou encore des axes d’amélioration que nous partageons bien entendu avec nos partenaires », conclut le responsable de la division data d’Engie Digital.