Un modèle d’apprentissage profond peut exceller à reproduire le comportement passé d’un bassin versant, et pourtant décevoir dès qu’on lui demande de prévoir l’avenir dans des conditions réalistes. C’est l’un des enseignements d’un travail de recherche du LabCom aiQua, le laboratoire commun réunissant l’Université Gustave Eiffel et Aquasys, publié dans la revue Hydrology and Earth System Sciences (HESS). Conduite par Bob Saint-Fleur avec Eric Gaume, Florian Surmont, Nicolas Akil et Dominique Theriez, l’étude met à l’épreuve trois stratégies d’assimilation de données et révèle un écart frappant entre performance en simulation et robustesse en prévision opérationnelle.

Simuler n’est pas prévoir

La distinction paraît subtile, elle est en réalité fondamentale. Simuler un débit, c’est reproduire le comportement d’un hydrosystème à partir de données météorologiques déjà observées. Prévoir, c’est anticiper les débits à venir, à partir d’informations encore incertaines, au premier rang desquelles la météo des prochains jours.

Or la plupart des travaux qui célèbrent les performances des réseaux de neurones en hydrologie, et notamment des réseaux LSTM, portent sur la simulation. Ils négligent souvent des composantes pourtant essentielles à la prévision opérationnelle : l’assimilation de données, l’analyse de persistance, et l’évaluation probabiliste des incertitudes. C’est précisément l’angle mort que cette étude vient explorer.

L’assimilation de données, pierre angulaire de la prévision en temps réel

En hydrologie opérationnelle, on ne prévoit jamais à l’aveugle. À mesure que de nouvelles mesures de débit arrivent, on les réinjecte dans le modèle pour le recaler sur l’état réel du bassin et corriger sa trajectoire au fil de l’eau. C’est ce que l’on appelle l’assimilation de données. Elle est d’autant plus précieuse aux échéances courtes, là où le débit présent renseigne fortement sur le débit des heures et des jours qui suivent.

L’étude teste trois manières de procéder, toutes orchestrées par un perceptron multicouche (MLP), un réseau de neurones volontairement simple et économe en ressources. La première prévoit directement le débit à partir des observations passées. La deuxième enrichit cette prévision avec les sorties d’un modèle de référence, LSTM ou SAC-SMA. La troisième post-traite les erreurs du modèle de référence pour les corriger. L’ensemble est évalué sur le jeu de données CAMELS-US, qui couvre plusieurs centaines de bassins américains, à des échéances de 1, 3 et 7 jours.

Un classement qui s’inverse selon le cadre d’évaluation

C’est ici que les résultats deviennent instructifs. L’étude compare deux cadres. Dans le premier, on suppose une prévision météorologique parfaite, c’est-à-dire idéale. Dans le second, plus réaliste, les forçages météo sont fortement incertains et représentés par des ensembles climatologiques.

Sous l’hypothèse de météo parfaite, les stratégies d’assimilation tiennent leurs promesses : elles améliorent nettement les prévisions, en particulier à l’échéance d’un jour, et confirment au passage l’excellente tenue du LSTM en modélisation pluie-débit. Mais dès que l’incertitude météorologique entre en jeu, le classement bascule. Le LSTM perd son avantage et se trouve devancé par le simple MLP intégrant les débits observés.

L’explication tient à la fiabilité des prévisions d’ensemble. Les ensembles produits par le LSTM se révèlent trop resserrés : ils sous-estiment systématiquement l’incertitude réelle. Autrement dit, le modèle se montre insuffisamment réactif à l’information météorologique nouvelle, trop influencé par les régularités apprises sur le long terme. Cette caractéristique, qui fait sa force en simulation, devient un handicap en prévision d’ensemble.

Corriger les biais, une piste qui ne règle pas tout

L’étude n’en reste pas au constat. En analysant les erreurs passées d’un modèle pour les corriger, l’approche par post-traitement réduit ses écarts systématiques et rapproche les prévisions de la réalité observée. Elle supprime ainsi la tendance du modèle conceptuel SAC-SMA à surévaluer les débits. Sur le défaut de dispersion du LSTM, en revanche, la correction n’est que partielle. Le problème de fiabilité demeure pour partie.

L’enseignement dépasse le cas particulier de ces deux modèles. Il rappelle qu’un score de performance obtenu en simulation ne préjuge pas de la robustesse d’un modèle en conditions opérationnelles, et que la fiabilité de la dispersion des ensembles mérite d’être traitée comme un objectif de conception à part entière. Pour les basses eaux, l’étude suggère par ailleurs que l’assimilation conserve un intérêt sur des horizons plus longs, et que des modèles entraînés spécifiquement pour cette gamme de débits gagneraient en pertinence.

Ces résultats nourrissent directement la feuille de route du LabCom aiQua, qui explore l’apport de l’IA à l’hydrologie en gardant le souci de la sobriété des approches et de leur transposabilité opérationnelle. Le travail a été réalisé dans le cadre du projet AI_Eau, financé par l’Agence nationale de la recherche au titre du programme France 2030, avec le concours du Centre de Calcul Intensif des Pays de la Loire.

L’article est disponible en accès libre dans Hydrology and Earth System Sciences : https://doi.org/10.5194/hess-30-3497-2026

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *