DRUIDS
Apprentissage statistique de l’incertitude dans les systèmes dynamiques
© Billy Huynh | Unsplash
Axe Environnement
Mathématiques
∩ Géosciences
Aperçu
Comprendre le fonctionnement des modèles d’IA générative pour améliorer la représentation de l’incertitude dans les systèmes de prévision numérique du temps, en utilisant des outils mathématiques complémentaires comme l’analyse harmonique, le groupe de renormalisation, l’explicabilité en IA, l’analyse de sensibilité, et les algorithmes de l’assimilation de données et de la prévision d’ensemble.

Mots clefs
Apprentissage profond, assimilation de données, systèmes dynamiques, analyse harmonique, quantification d’incertitude, IA générative, explicabilité en IA, météorologie, prévision numérique du temps, prévison d’ensemble.
Coordination
- Bocquet Marc (CEREA, École nationale des ponts et chaussées, EdF R&D, Institut polytechnique de Paris)
- Gratton Serge (ENSEEIHT, ANITI, Université de Toulouse)
- Stéphane Mallat (École normale supérieure, Collège de France)
Financement
- 600 000 euros sur 48 mois (Projet scientifique lauréat de l’appel à projets 2024)
Résumé
Les outils d’apprentissage statistique profond ont récemment ouvert la voie à l’apprentissage de modèles de substitution de systèmes dynamiques complexes et en grande dimension, principalement à partir de leur observation, avec des applications spectaculaires aux fluides géophysiques et notamment aux prévisions météorologiques numériques. De plus, il est devenu possible de construire des représentations de l’incertitude associée à de tels systèmes dynamiques, qu’elle soit de nature épistémique ou aléatoire. Par exemple, les modèles de diffusion génératifs basés sur l’apprentissage profond permettent de construire des modèles substituts dynamiques stochastiques, avec des applications récentes remarquables à la prévision numérique du temps et à la prévision de la glace de mer. Un autre exemple est l’assimilation de données, un ensemble de méthodes indispensables pour la prévision des dynamiques chaotiques. Un système d’assimilation de données, qui combine un modèle d’évolution numérique et des observations de la dynamique, peut être considéré comme un système dynamique aléatoire en soi, et il a été récemment démontré qu’il pouvait également être appris grâce aux techniques de l’apprentissage profond. Dans les deux cas, modèles génératifs et assimilation de données apprise, et en dépit de leur succès en tant qu’outils, il reste toujours difficile de comprendre comment ces modèles substituts appris parviennent à évaluer l’incertitude sur le système dynamique, quelles informations sont extraites des entrées du réseau neuronal et comment elles sont représentées et traitées en interne. Pour comprendre et élucider la représentation de l’information dans ces modèles de substitution, les membres du projet scientifique DRUIDS ont récemment suggéré que soient utilisées des approches mathématiques comme les représentations harmoniques (ondelettes) ou de l’analyse de sensibilité.
Dans les deux cas, le projet scientifique DRUIDS vise à élucider et expliquer conceptuellement et mathématiquement comment ces modèles appris extraient, représentent et traitent l’information afin d’estimer l’incertitude, et sur la base de ces développements, améliorer et généraliser ces modèles substituts stochastiques en se concentrant sur leur représentation de l’incertitude. Cela devrait permettre de concevoir des modèles dynamiques stochastiques et des algorithmes d’assimilation de données novateurs, disruptifs, mais frugaux, notamment pour la prévision numérique en géosciences. Le projet DRUIDS rassemble des partenaires à la pointe de ces questions, avec une expertise en mathématiques appliquées (ENS, ANITI/IRIT) et en géosciences méthodologiques (ENPC, ANITI/Météo-France).
- Élucider le comportement des modèles d’IA générative (modèle de diffusion, flow-matching, interpolant stochastique) destinés à la prévision numérique du temps et les techniques d´assimilation de données associées.
- Comprendre qualitativement et quantitativement la représentation de l’incertitude dans ces modèles.
- Sur la base de cette nouvelle compréhension, améliorer et généraliser ces modèles génératifs dans le cadre de la prévision numérique du temps.
- Quantification d’incertitude
- IA générative : modèles de diffusion, flow-matching
- Analyse harmonique
- Groupe de renormalisation
- Explicabilité en apprentissage profond
- Analyse de sensibilité
- Systèmes dynamiques
- Prévision numérique du temps
- Prévision d’ensemble météorologique
- Réanalyses météorologiques ERA-5
- Construction de modèles d’IA générative précis mais frugaux pour la prévision numérique en géosciences
- Amélioration de ces modèles d’AI générative dans le cadre de la prévision numérique du temps, vers une représentation de l’incertitude et des risques climatiques plus fidèle.

© Tobias S. Finn, CEREA, École nationale des ponts et chaussées, EdF R&D, Institut Polytechnique de Paris

© Centre européen pour les prévisions météorologiques à moyen terme (ECMWF), https://charts.ecmwf.int/
Recrutements envisagés
- 1 doctorat (École normale supérieure)
- 1 post-doctorat (École nationale des ponts et chaussées)
- 1 post-doctorat (Université de Toulouse et Météo-France)
Plus de projets