Sommaire : Nous présentons ici les résultats issus de l’article « System Condition Monitoring Based on a Standardized Latent Space and the Nataf Transform » publié dans IEEE Access Reliability Society Section en février 2024. Notre travail propose une approche de surveillance de l’état de santé adaptée aux systèmes d’ingénierie complexes aussi divers que des avions, des éoliennes et des usines de fabrication automatisée. L'exploitation et la maintenance optimales de ces systèmes nécessitent des stratégies de pointe qui se basent sur la surveillance continue de leur état de santé. Nous proposons l’analyse des données mesurées pour évaluer l’état de santé des systèmes. Notre approche combine l’intelligence artificielle (IA) et la transformation de Nataf (TN). Le modèle inclut un outil de visualisation pour une meilleure interprétabilité, un atout pour les systèmes critiques à haut risque. Nous avons démontré l’approche proposée sur deux études de cas réels : données de dégradation d’un moteur d’avion et d’exploitation d’une éolienne. Les conditions de dégradation ont pu être détectées plus rapidement qu’avec des méthodes fondées uniquement sur l’intelligence artificielle.
Mots clés : Systèmes complexes, surveillance de l’état de santé, approches basées sur les données, détection, intelligence artificielle, transformation de Nataf, autoencodeur variationnel.
Introduction
Quels sont les points communs entre un avion, une éolienne et une usine de fabrication automatisée? Ces systèmes d’ingénierie modernes sont très complexes et doivent répondre à des normes rigoureuses de fiabilité et de sécurité. Afin de s’assurer que ces systèmes remplissent leur mission pendant toute leur durée de vie, les opérateurs appliquent des stratégies d’exploitation et de maintenance de pointe fondées sur la surveillance de l’état de santé. Les systèmes modernes contiennent des dizaines, voire des centaines, de capteurs qui mesurent en continu des données décrivant leur état physique.
L’analyse des bases de données provenant des systèmes complexes représente un défi pour deux raisons principales. D’abord, ces systèmes multiphysiques sont hautement couplés. Prenons l’exemple d’une éolienne : son fonctionnement fait intervenir des variables mécaniques, thermiques et électriques, toutes influencées par la nature stochastique du vent et de l’environnement. Ensuite, le comportement de ces systèmes présente des non-linéarités et les relations entre les variables sont subtiles, difficiles à saisir par les méthodes analytiques classiques.
L’intelligence artificielle : une voie très prometteuse
Les modèles d’IA (en particulier les réseaux de neurones profonds) sont bien adaptés pour capturer des informations issues de descriptions complexes et de haute dimensionnalité d’un système. La surveillance de l’état de santé par l’IA est un domaine de recherche en plein essor. De nombreux articles sur ce type de surveillance proposent des solutions pour améliorer la fiabilité, la sécurité et la rentabilité des systèmes complexes. Toutefois, la nature « boîte noire » des modèles d’IA peut entraver leur adoption dans des applications à haut risque ou à coût élevé. Dans le cadre de notre recherche, nous avons conçu une approche d’IA qui intègre un outil de visualisation pour apporter de l’interprétabilité.
L’intelligence artificielle : quatre règles pour une implantation réussie
- Simplifier : Si un modèle plus simple peut résoudre le problème, optez pour cette solution. En effet, la modélisation par IA peut entraîner une complexité inutile et un gaspillage des ressources informatiques. La vérification de la pertinence de solutions plus simples est aussi l’occasion pour saisir les caractéristiques du système.
- "Garbage in, garbage out" (GIGO) : Parfois, les données dont on dispose sont tout simplement erronées. Dans ce cas, aucune modélisation, que ce soit basée sur l’IA ou non, ne pourra fournir une bonne description. Des données d’entrée de haute qualité sont essentielles. La préparation de la base de données doit inclure la validation et le prétraitement des données d’entrée. Ces étapes comprennent le nettoyage des données erronées, le traitement des lacunes ou des biais et la normalisation des valeurs quantitatives.
- Conception du modèle : Tenir compte des fonctions de perte pour l'entraînement et la validation afin de choisir une architecture et des hyperparamètres appropriés. Rechercher la convergence et un modèle qui généralise avec précision sur les ensembles de données d’entraînement et de validation. Éviter le surentraînement ou le sous-entraînement. Consulter des recommandations et des implémentations antérieures pour choisir judicieusement le modèle, les fonctions d'activation, la profondeur et la largeur des couches cachées et les hyperparamètres.
- Enfin : tester, tester, tester! L’ensemble de données à tester doit être soigneusement constitué. Il doit inclure les cas auxquels le modèle pourrait être confronté. Utiliser des métriques telles que la précision, le score F1, le rappel, et d’autres, pour évaluer le modèle. Revenir aux étapes antérieures si nécessaire.
Notre modèle d’IA pour une meilleure interprétabilité
Notre article présente une nouvelle méthode adaptée aux systèmes décrits par de multiples mesures. Nous supposons que des ensembles de données correspondant à différents états de santé peuvent être créés à l’aide d’une stratégie d’étiquetage appropriée.
Nous avons conçu une approche pour la surveillance de l’état de santé des systèmes en combinant un modèle d’IA, l’autoencodeur variationnel (VAE), et un outil conventionnel de la théorie de la fiabilité, la transformation isoprobabiliste de Nataf. Voici le fonctionnement :
- Autoencodeur variationnel : Le VAE capte des informations essentielles issues d’un espace de haute dimension représentant les multiples données mesurées. Pourquoi le VAE? Nous avons choisi ce modèle pour sa capacité à compresser des données complexes et de haute dimensionnalité dans un espace latent de dimension inférieure tout en préservant les caractéristiques essentielles. De plus, le VAE offre un outil de visualisation intégré, favorisant ainsi l’explicabilité du modèle. Néanmoins, la distribution dans l'espace latent change à chaque nouvel entraînement du modèle, en raison de la nature aléatoire de la définition du modèle VAE et de l'algorithme d'entraînement. C’est là que la transformation de Nataf entre en jeu.
- La transformation de Nataf : Cet outil projette le cluster
de l’état sain (dont la distribution est arbitraire) dans l’espace latent vers un cluster distribué selon la loi normale multivariée dans l’espace de Nataf (voir la figure 1). Avoir la même distribution pour la condition normale à travers différentes instances d'entraînement est un avantage considérable. Cette cohérence dans la distribution de l’état sain nous a permis de définir deux indices de santé complémentaires : IM et IN.
- IM est un détecteur de points aberrants. Il est sensible aux changements soudains et détecte les anomalies qui évoluent rapidement en dehors de la plage ±3σ de la distribution normale.
- IN est un détecteur de distributions de probabilités changeantes. Il surveille les changements graduels qui se manifestent par des modifications de la distribution elle-même.
Ces indices reflètent différents modes de dégradation, ce qui permet à la surveillance de l’état de santé de détecter les conditions anormales plus précocement.
Une fois correctement entraîné, le modèle utilise les données récentes pour évaluer l’état du système, c’est-à-dire déterminer si le système fonctionne en condition normale ou dégradée. Cette évaluation se fonde sur deux indices de santé complémentaires, IM (détection de points aberrants) et IN (détection de changement de distribution), comme le montre la figure 2.
Tests à partir d’études de cas réels
Nous avons testé notre méthode avec des données provenant de deux systèmes d'ingénierie : des moteurs d'avion et des éoliennes.
1. Moteurs d’avion. La base de données CMAPSS (Commercial Modular Aero-Propulsion System Simulation), créée par la NASA, décrit de nombreuses variables physiques de moteurs d’avion commerciaux pour des cas de dégradation progressive. Notre méthode a permis de détecter les défaillances plus tôt qu’une technique concurrente basée sur un VAE régressif.
2. Éoliennes. Nous avons utilisé les données quantitatives d’un parc éolien en Amérique du Nord provenant du système de contrôle et d’acquisition de données (SCADA). L’approche proposée a permis de détecter avec succès la surchauffe de composants critiques, comme le palier principal et le générateur.
Conclusion
La contribution originale de notre article a été de combiner le modèle VAE avec la transformation de Nataf, un outil conventionnel de la théorie de fiabilité. Pourquoi est-ce important? Bien que l’IA ait gagné en popularité, son implantation reste limitée en raison du manque d’interprétabilité. La combinaison VAE-Nataf intègre un outil de visualisation qui confère une meilleure interprétabilité dans l’approche de surveillance de l’état de santé proposée. Nous avons démontré notre méthode à travers des études de cas réels portant sur le fonctionnement de moteurs d’avion et d’éoliennes. Cette méthode peut être appliquée à d’autres systèmes complexes munis de nombreux capteurs. Et ensuite? Nous travaillons actuellement sur le diagnostic et le pronostic des éoliennes à l'aide de données mesurées, et d’autres résultats seront bientôt publiés. Si la recherche et la programmation pour un secteur énergétique durable vous intéressent, n’hésitez pas à contacter notre équipe.