Les ensembles de données environnementales incomplets posent des défis importants pour le développement de modèles prédictifs précis, notamment en recherche hydrologique.
Cette étude aborde le problème des données manquantes en examinant les méthodologies d’imputation des lacunes pour les ensembles de données présentant une absence de données de 5 à 20 %, en se concentrant sur la rivière Mureș en Roumanie.
Grâce à une approche novatrice, nous avons appliqué diverses techniques d’imputation, notamment la méthode du ratio, le filtrage de Kalman et des algorithmes d’apprentissage automatique (XGBoost, Gradient Boosting, Random Forest et CatBoost), tout en développant une mesure d’auto-évaluation innovante permettant d’évaluer les performances d’imputation sans recourir à des données de référence externes.
Ces méthodes (XGBoost, Gradient Boosting, Random Forest et CatBoost) sont bien considérées comme des méthodes d’intelligence artificielle (IA), et plus précisément comme des techniques appartenant au champ du machine learning (apprentissage automatique).
Télécharger l’article : Experimental Comparative Study on Self Imputation Methods and Their Quality Assessment for Monthly River Flow Data with Gaps: Case Study to Mures River
Contact au LOTERR : ionel.haidu@univ-lorraine.fr