3 minute read
Tous botanistes !
Auteurs
Prendre des décisions pour lutter contre le déclin mondial de la biodiversité suppose de disposer de données fiables et indiscutables. Mais comment collecter ces informations sur la multitude d’organismes vivants, animaux et végétaux, à l’échelle de la planète ? En impliquant la société civile !
Advertisement
L’idée est née il y a une vingtaine d’années et se traduit aujourd’hui par des plateformes de sciences participatives d’ampleur mondiale comme eBird, iNaturalist et celle que nous avons développée, Pl@ntNet. Elles mobilisent des millions de contributeurs qui recensent et photographient les organismes vivants. Au-delà de cette collecte de données, ces initiatives contribuent à reconnecter les gens avec la nature.
Un des ingrédients clés du succès de ces plateformes est la mise à disposition d’applications mobiles dotées d’intelligence artificielle. Pl@ntNet, en particulier, portée par un consortium de recherche français (Inria, Cirad, Inrae et IRD), a été pionnière pour l’identification des espèces végétales, dès 2013. Avec plusieurs centaines de milliers d’utilisateurs journaliers, elle recense aujourd’hui plus de 43 000 espèces de plantes à l’échelle mondiale.
PALLIER LE MANQUE D’EXPERTISE…
Concrètement, la difficulté ici est le manque d’expertise pour identifier les espèces (ou taxons) et leur associer un nom scientifique en latin sur la base de critères morphologiques précis et extrêmement variés comme la forme de la pointe des feuilles, le nombre et la couleur des pétales, la présence d’une pilosité particulière sur la tige… Ainsi, pour reconnaître une plante parmi des centaines de milliers d’espèces connues, les botanistes comptent sur leur mémoire, leur sens de l’observation et des « flores », ces ouvrages qui précisent les critères d’identification de chaque taxon en termes scientifiques. Cette expertise est difficile à acquérir, car les différences sont souvent très subtiles.
Pour apprendre à reconnaître toutes ces espèces selon leur variabilité morphologique, un algorithme d’intelligence artificielle requiert un apprentissage fondé sur un grand nombre d’images. Or, concernant la botanique, depuis des siècles, la caractérisation de nouvelles espèces repose sur des planches d’herbiers et des dessins. La photographie n’est devenue une pratique courante que très récemment. Peu d’images numériques sont donc disponibles, voire aucune pour plus de la moitié des espèces végétales ! La collecte de données d’apprentissage devient alors un enjeu tout aussi important que la conception des algorithmes.
… ET LE MANQUE DE DONNÉES
La diversité et le nombre de contributeurs des plateformes de sciences participatives ont pallié ce manque de données et permis le niveau actuel de performance et de couverture taxonomique des différentes applications. Ainsi, le modèle d’apprentissage utilisé dans Pl@ntNet est directement entraîné sur une partie des observations faites par les utilisateurs, mais seulement celles dont le degré de confiance est élevé, car validées par un nombre suffisant de personnes ou par des personnes suffisamment expertes.
Les observations et propositions de noms d’espèces d’un débutant avec Pl@ntNet ont donc peu de chances d’alimenter directement l’IA. Il doit d’abord gagner en crédibilité en contribuant avec des observations
> Scannez ce QR code pour télécharger l’application Pl@ntNet
c’est le nombre d’espèces de plantes recensées à l’échelle
mondiale par Pl@ntNet reconnues de bonne qualité par le plus grand nombre d’utilisateurs et en repérant des espèces que vous n’avez pas encore dans votre collection. Actuellement, près de 80 000 personnes alimentent directement l’IA de Pl@ntNet sans validation d’un autre utilisateur. Ce qui n’empêche pas les plus experts de corriger parfois quelques imprécisions. On qualifie d’ « apprentissage automatique coopératif » ce nouveau type de paradigme basé sur la mutualisation des connaissances de la communauté dans un seul outil partagé par tous.
Les observations des novices ne sont pas pour autant perdues, car l’IA peut en identifier une grande partie de façon autonome. Et si l’utilisateur a accepté que ses observations soient géolocalisées, elles rejoignent l’inventaire national du patrimoine naturel français (INPN) ou le système mondial d’information sur la biodiversité (GBIF). Grâce à ces données, les chercheurs de nombreuses disciplines développent des modèles, des cartes ou des indicateurs à destination des acteurs de la conservation. En retour, les contributeurs de Pl@ntNet ont accès aux publications scientifiques basées sur leurs données grâce au système de suivi du GBIF.
Dans quelques années, ces travaux permettront le développement d’outils grand public pour le suivi de la biodiversité. Les citoyens, les décideurs, les associations et les entreprises pourront par exemple déterminer très précisément les zones les plus riches en biodiversité ou les plus critiques de leur territoire afin de décider collectivement du meilleur chemin à suivre pour la préserver.
Pour en savoir +
• Le site de Pl@ntNet : https://plantnet.org/
• Le site de l’INPN : https://inpn.mnhn.fr/
• Le site du GBIF : https://www.gbif.org/
• Les articles fondés sur Pl@ntNet : https://bit.ly/Gbif-PlantNet