La grande compilation des SPAM (Statistiques Pour l’Agrologie Militante), chapitre 1
Philippe Stoop, sur LinkedIn*
/image%2F1635744%2F20260116%2Fob_ada9dc_capture-spam.png)
Il y a peu de temps, nous avons vu un bel exemple de paradoxe statistique, à propos d’une publication sur la relation entre interdiction des néonicotinoïdes et évolution des populations d’oiseaux : le modèle utilisé par les auteurs trouvait un effet significatif de l’imidaclopride, mais son intervalle de confiance était parfaitement compatible avec une absence d’effet [1]. Cela n’avait nullement empêché les auteurs d’affirmer que l’interdiction de cet insecticide en 2018 avait permis un timide début de reconstitution des populations d’oiseaux insectivores (bien que le même modèle ait donné des résultats aberrants sur d’autres indicateurs de toxicité des pesticides utilisés). On y voyait tout l’intérêt d’une famille de modèles statistiques complexes (ici, un General Additive Mixed Model) qui présentent un atout précieux pour l’écologie militante : ils produisent bien volontiers des résultats STATISTIQUEMENT SIGNIFICATIFS (le mot magique qui permet la publication dans une revue scientifique), même si leur intervalle de confiance montre que leur « significativité » est très relative. Ils permettent ainsi de sauver et de donner du sens à des jeux de données qui ne donneraient sans eux aucun résultat interprétable… ni répétable sur le terrain.
Cette période de fêtes, propices aux bêtisiers de fin d’année, est l’occasion de rappeler la contribution de ces modèles aux fondements théoriques et pratiques d’une nouvelle science que je propose de baptiser l’agrologie militante, dans le sens où elle est à l’agronomie ce que l’astrologie est à l’astronomie [2]. Un historien des sciences de l’INRAE parlait à ce propos d’« approches nouvelles de type holiste que l’on va pouvoir instrumenter par les nouveaux moyens informatiques… [qui sont] …une nouvelle manière de produire de la science, plus performante pour dialoguer avec la société et avec des objets complexes comme la question de l’environnement dans le champ des agrobiosciences » [3]. Dans cet article et les suivants, nous allons voir sur quelques exemples comment ces modèles statistiques ouvrent les champs du possible, pour l’interprétation de données qui auparavant résistaient avec obstination aux hypothèses des chercheurs agrologues.
Notre premier exemple est un vrai conte de Noël : comment un modèle statistique permet-il de transformer une citrouille de l’écologisme, promise à l’oubli malgré un travail de terrain acharné, en un carrosse resplendissant, digne d’une publication dans les meilleures revues ?
L’écologie est une discipline bien ingrate : vous avez monté un grand réseau de 150 sites de piégeage à l’échelle d’un pays, pour suivre l’évolution des populations d’arthropodes dans les prairies pendant 10 ans. Malheureusement, au début des comptages, le protocole de collecte n’est pas encore au point, et vos données sont entachées d’un écart-type énorme qui les rend inexploitables. Vous commencez à rectifier un peu le tir la 2ème année, mais ce n’est qu’à partir de la 3ème année que vous arrivez à stabiliser l’intervalle de confiance à un niveau acceptable (et encore, pas tous les ans). Et là, c’est le drame : sur toutes les années qui suivent, les populations d’arthropodes ne montrent pas la moindre évolution. La 6ème extinction a complètement épargné vos 150 sites !
/image%2F1635744%2F20260116%2Fob_a4ba0a_capture-spam-2.png)
Abondance (nombre d’individus) d’arthropodes dans les prairies allemandes (suivi sur 150 sites)
Il n’y a aucune différence significative entre les populations des années 2009 à 2017. L’année 2007 est peut-être significativement différente de toutes les autres, mais dans ce cas, cela signifierait que l’apocalypse des insectes s’est arrêtée brutalement en 2008. Avec de tels résultats, il va être difficile de trouver une revue pour publier le résultat de 10 ans de rude labeur. Et si vous y arrivez, vous risquez d’être accusé au mieux de sixièmeextinctionscepticisme [4], au pire d’être un lobbyiste de l’agrochimie. C’est d’autant plus injuste que, quelques mois avant la fin de votre expérimentation, un collègue travaillant dans le même pays que vous, avec un réseau de piégeage d’une qualité très inférieure au vôtre, a fait un buzz d’enfer en démontrant que les populations d’insectes volants auraient baissé (SIGNIFICATIVEMENT, bien sûr) de 76 % en 27 ans !
Mais ne désespérez pas ! La boîte à outils statistiques est pleine de ressources. Intégrez ces données de population dans un modèle linéaire mixte, avec le climat et quelques indicateurs sur la composition du paysage et des pratiques agricoles comme covariables, et vous trouvez enfin une chute significative de la population des arthropodes des prairies, avec un intervalle de confiance d’une minceur digne du tour de taille de Miss France.
/image%2F1635744%2F20260116%2Fob_f1d466_capture-spam-3.png)
Cerise sur le gâteau, avec un effondrement de 78 % en seulement 10 ans, vous battez à plate couture le record de votre collègue surmédiatisé, ce qui vous ouvre grand les portes d’une publication dans le Graal des revues scientifiques, Nature !
Dans cet exemple, le modèle a donc démontré une extinction régulière et inexorable des populations d’arthropodes, avec une faible incertitude. Ce Qu’il Fallait Démontrer, alors que les méthodes d’analyse statistique classiques ne donnaient pas du tout le bon résultat. Certes, il fallait publier rapidement, car ce modèle montrait aussi que les populations d’arthropodes devaient disparaître complètement d’ici 2023, ce qui pourrait maintenant se prêter à quelques sarcasmes faciles des éternels « marchands de doute » grassement financés par Monsatan, qui passent leur temps à dénigrer les avancées méthodologiques de l’agrologie :
/image%2F1635744%2F20260116%2Fob_982b20_capture-spam-4.png)
Mais, après tout, vous n’avez jamais dit que votre modèle était prédictif. Et personne ne vous demandera jamais de confirmer vos résultats plusieurs années après.
Dans cet exemple, la variabilité extrême des données d’une seule année a permis, grâce à un modèle judicieusement choisi, de générer une tendance régulière et significative sur les 9 années suivantes, qui n’en montraient aucune. Il faut d’ailleurs saluer ici l’ouverture d’esprit des reviewers de Nature, qui ont su récompenser la créativité statistique des auteurs, plutôt que de leur demander mesquinement ce que deviendrait leur modèle en retirant l’année 2007. Dans notre prochain post, nous verrons comment résoudre un problème symétrique : utiliser le seul secteur cohérent d’un nuage de points parfaitement informe, pour en tirer un modèle donnant à l’ensemble du nuage une tendance claire, et bien sûr… STATISTIQUEMENT SIGNIFICATIVE !
Seibold et al., 2019, https://doi.org/10.1038/s41586-019-1684-3
et pour une visite guidée : https://www.europeanscientist.com/fr/environnement/lextinction-de-75-des-insectes-comment-nait-une-legende-scientifique/
_________________
[3] L’agrologie en action : Chercheurs militants et BorderLines selon l’INRAE
[4] Nous proposons ce néologisme, car il est important de bien nommer les délits pour bien les combattre. En plus de sa clarté, ce mot aurait le mérite de battre (par 28 à 25) le record de longueur pour la langue française, détenu depuis trop longtemps par « anticonstitutionnellement ».
/image%2F1635744%2F20260116%2Fob_eb5c72_capture-philippe-stoop-2.jpg)
* Directeur Recherche & Innovation ITK - Membre de l'Académie d'Agriculture de France
/image%2F1635744%2F20150606%2Fob_b8319b_2015-06-06-les-champs-de-l-au-dela-tom.jpg)