Utilisation du Machine Learning pour la cartographie de la répartition annuelle des espèces végétales sur le Sahel selon les facteurs environnementaux

La région du Sahel, une bande semi-aride située entre le désert du Sahara et la savane soudanienne, est soumise à des conditions environnementales extrêmes. Elle se caractérise par des précipitations irrégulières et souvent insuffisantes, entrainant des périodes de sècheresse récurrentes et une dégradation significative des sols. Ces conditions exacerbent les problèmes existants tels que l'insécurité alimentaire, la perte de biodiversité et la dégradation des terres, rendant la région particulièrement vulnérable aux changements climatiques. Or, la végétation sahélienne joue un rôle crucial dans la stabilisation des sols, la régulation du climat local et le soutien des moyens de subsistance des populations locales. Ainsi, prédire la répartition des espèces végétales dans une région aussi vaste et variée est essentiel. Pour répondre à cette problématique, notre étude vise à atteindre trois objectifs principaux. Notamment, prédire la répartition spatiale et temporelle des espèces végétales dominantes dans le Sahel, tester différents modèles de Machine Learning pour la spatialisation des données de présence des espèces végétales, et trouver le modèle de distribution adéquat pour chaque type de végétation (herbacées et arborées). Des cartes de distribution annuelles exploitables seront générées. Les données utilisées proviennent principalement de la base de données FLOTROP (Taugourdeau et al, 2019), contenant huit herbacées et deux arbres. Nous l'avons enrichie de variables environnementales telles que les précipitations, la température et le type de sol ainsi que l'indice de pluviométrie. Les techniques de modélisation incluent des méthodes de Machine Learning tels que les forêts aléatoires, MaxEnt, SVM, GLM, GAM et CNN, avec une validation des résultats à partir de données de l'herbier disponible au CIRAD. La méthodologie repose sur la collecte, le prétraitement et l'analyse de données environnementales et d'occurrence des espèces végétales pour modéliser leur distribution. Les résultats montrent que les forêts aléatoires (RF) sont particulièrement adaptées pour modéliser la distribution des herbacées, tandis que les réseaux de neurones convolutifs (CNN) sont plus performants pour les espèces arborées. Cependant, les deux modèles peuvent être utilisés pour les deux types d'espèces. Les modèles prédictifs ont permis de générer des cartes de distribution annuelles détaillées et exploitables, indiquant les zones où les conditions environnementales sont favorables ou défavorables à la présence des espèces. Ces cartes sont essentielles pour la gestion et la conservation des ressources végétales dans le Sahel.

Saved in:
Bibliographic Details
Main Author: Grimaj, Meryem
Format: thesis biblioteca
Language:fre
Published: IAV Hassan II
Online Access:http://agritrop.cirad.fr/610135/
http://agritrop.cirad.fr/610135/1/RapportGRIMAJMeryem.pdf
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:La région du Sahel, une bande semi-aride située entre le désert du Sahara et la savane soudanienne, est soumise à des conditions environnementales extrêmes. Elle se caractérise par des précipitations irrégulières et souvent insuffisantes, entrainant des périodes de sècheresse récurrentes et une dégradation significative des sols. Ces conditions exacerbent les problèmes existants tels que l'insécurité alimentaire, la perte de biodiversité et la dégradation des terres, rendant la région particulièrement vulnérable aux changements climatiques. Or, la végétation sahélienne joue un rôle crucial dans la stabilisation des sols, la régulation du climat local et le soutien des moyens de subsistance des populations locales. Ainsi, prédire la répartition des espèces végétales dans une région aussi vaste et variée est essentiel. Pour répondre à cette problématique, notre étude vise à atteindre trois objectifs principaux. Notamment, prédire la répartition spatiale et temporelle des espèces végétales dominantes dans le Sahel, tester différents modèles de Machine Learning pour la spatialisation des données de présence des espèces végétales, et trouver le modèle de distribution adéquat pour chaque type de végétation (herbacées et arborées). Des cartes de distribution annuelles exploitables seront générées. Les données utilisées proviennent principalement de la base de données FLOTROP (Taugourdeau et al, 2019), contenant huit herbacées et deux arbres. Nous l'avons enrichie de variables environnementales telles que les précipitations, la température et le type de sol ainsi que l'indice de pluviométrie. Les techniques de modélisation incluent des méthodes de Machine Learning tels que les forêts aléatoires, MaxEnt, SVM, GLM, GAM et CNN, avec une validation des résultats à partir de données de l'herbier disponible au CIRAD. La méthodologie repose sur la collecte, le prétraitement et l'analyse de données environnementales et d'occurrence des espèces végétales pour modéliser leur distribution. Les résultats montrent que les forêts aléatoires (RF) sont particulièrement adaptées pour modéliser la distribution des herbacées, tandis que les réseaux de neurones convolutifs (CNN) sont plus performants pour les espèces arborées. Cependant, les deux modèles peuvent être utilisés pour les deux types d'espèces. Les modèles prédictifs ont permis de générer des cartes de distribution annuelles détaillées et exploitables, indiquant les zones où les conditions environnementales sont favorables ou défavorables à la présence des espèces. Ces cartes sont essentielles pour la gestion et la conservation des ressources végétales dans le Sahel.