Ça sert vraiment à quelque chose la donnée ? - Les arbres au Sahel

Utiliser le big data et le Machine Learning pour cartographier les arbres en Afrique de l’Ouest

Date
20 juillet 2021
Temps de lecture
3 minutes
Rédacteur
Levin François
Editeur
Lang Apolline

🚧 Résumé du projet 

On sait les services écologiques (rafraîchissement, pollinisation, capture du CO2, amélioration des sols, lutte contre l’érosion) et économiques (amélioration de la productivité agricole, ressources…) que rendent les arbres. C’est particulièrement vrai dans les zones arides ou semi-arides, comme en Afrique de l’Ouest, avec le Sahara et la bande sahélienne. La potentielle aridification de cette zone est d’ailleurs un enjeu de réflexion internationale de longue date, et de crainte, comme en témoigne par exemple le projet de la grande muraille verte (Lire l’article du Monde à ce propos). 

Les arbres dans cette zone ne forment pas des forêts à proprement parler, mais poussent de manière isolée. Il est donc plus difficile que dans une forêt de surveiller et de comprendre l’évolution de leur nombre et les facteurs associés. C’est pourtant crucial pour comprendre les effets des évolutions environnementales, climatiques et des activités humaines dans la région.

Une équipe de chercheurs internationaux a donc développé une technique pour cartographier plus de 1,8 milliard d’arbres dans une zone de 1,3 millionde km2, ce qu’ils expliquent dans un article publié dans Nature l’an dernier (Lire l’article entier)

 

📡 Quelles données utilisées ? 

Les chercheurs et les chercheuses ont utilisé 50 000 images satellitaires, distribuées par la société américaine WorldView, à partir des images prises par différents satellites de la NASA (Landsat MSS, TM) et de l’agence spatiale européenne (SPOT et Sentinel). Il existe différentes bases de données disponibles : QuickBird, Geo-Eye 1, WorldView 2, WorldView 3

Schéma du satellite SPOT (Satellite pour l’observation de la Terre).

Un schéma de l’Airbus Earth observation constellation

 

🛠️ Quelles techniques utilisées ? 

À partir de ces images, des techniques d’intelligence artificielle, et plus spécifiquement d’apprentissage machine, ont été utilisées pour reconnaître la présence d’arbres sur les images. Les algorithmes d’apprentissage machine fonctionnent de la manière suivante : il s’agit tout d’abord de les entraîner avec des données qu’on a labellisées. C’est la phase d’apprentissage. Dans ce cas, les chercheurs ont manuellement identifié 90 000 arbres sur les images satellites. L’algorithme a été entraîné à reconnaître un arbre à partir de ces données identifiées.

Dans un second temps, l’algorithme produit des prédictions, c’est-à-dire des résultats sur des données que l’on n’a pas encore identifiées. Il s’agit ici de reconnaître l’ensemble des arbres sur l’ensemble des photos que l’on possède. L’algorithme a reconnu 1,3 milliard d’arbres et les chercheurs ont donc pu déterminer leur taille et leur position. 

 

🚰 Quels impacts ? 

Plusieurs résultats pour cette étude :

1- il y a beaucoup plus d’arbres que ce qui était estimé dans la région du Sahara et du Sahel du Nord : alors que l’on pensait que les arbres étaient en disparition dans cette région, l’étude a déterminé qu’il y en avait des centaines de millions. 

2- la présence de populations locales est plutôt favorable à la présence d’arbres : il y en a davantage là où les terres sont cultivées et gérées que lorsque ce n’est pas le cas. C’est un résultat important, puisqu’un certain nombre de projets de lutte contre l’aridification dans cette région ont été pensés avec le postulat inverse : les populations locales participeraient à la désertification par leurs pratiques d’exploitation économique du bois et d’utilisation des terres pour cultiver. Un certain nombre de polémiques entourent ainsi le projet de grande muraille verte, taxé parfois de colonialisme vert (lire un article sur ces controverses dans The New Humanitarian).

Cette base de données pourra permettre de suivre l’évolution de l’environnement dans la région et de mieux comprendre les facteurs qui agissent sur la présence d’arbres (gradient de précipitation, type de sol, facteur anthropique…). 

Elle alimentera également la modélisation globale des écosystèmes, notamment dans le cadre de la science du Système Terre, cette nouvelle manière d’approcher la planète comme un tout organique (lire un article à ce sujet sur Wikipedia).