La grande parade des SPAM (Statistiques Pour l’Agrologie Militante), chapitre 2
Philippe Stoop, sur LinkedIn*
/image%2F1635744%2F20260123%2Fob_84f11e_capture-stoop.png)
Avec cette nouvelle année qui commence, nous poursuivons notre anthologie des modèles statistiques qui permettent de trouver une tendance cohérente et statistiquement significative dans n’importe quel nuage de points, aussi informe soit-il. Après un premier exemple sur une série temporelle, où un modèle mixte additif généralisé permettait d’étaler sur une période de 10 ans un écart qui n’existait en fait que grâce à la dispersion des valeurs de la 1ère année par rapport à l’ensemble des autres, nous allons voir maintenant comment traiter le problème inverse : trouver une tendance linéaire (et bien sûr statistiquement significative) dans un nuage de points parfaitement patatoïde, grâce à une zone cohérente qui représente moins de 10 % de l’intervalle des valeurs couvertes.
L’écologie est décidément une discipline bien ingrate : vous (ou votre stagiaire) avez passé des heures à coller des puces RFID sur le thorax de 6847 abeilles, afin de suivre leurs entrées et sorties de leur ruche, et vérifier ainsi si la proximité de parcelles de colza traitées au thiametoxam (un insecticide néonicotinoïde) influe sur leur activité et sur leur mortalité. Bien sûr, il ne sera pas possible d’objectiver l’exposition au thiametoxam de toutes ces abeilles en mesurant la teneur de l’insecticide dans leur corps, puisque cela nécessiterait de les tuer. Vous avez donc mis au point une unité théorique d’exposition au champ, basée sur la surface des parcelles de colza traitées dans un rayon de 2 km autour de la ruche. Cet indicateur parait logique vu le rayon d’action moyen des abeilles butineuses, mais il faut tout de même vérifier si la pondération des surfaces en fonction de la distance à la ruche est correcte. Pour valider cet indicateur, vous sacrifiez donc 51 abeilles (3 pour chacune des 17 ruches suivies), pour vérifier si votre unité d’exposition est bien corrélée avec les résidus de thiametoxam trouvés sur elles. Et là, c’est de nouveau le drame : il n’y a aucune corrélation entre les deux variables :
/image%2F1635744%2F20260123%2Fob_2f96b8_capture-stoop-2.png)
D’autres chercheurs moins experts que vous en statistiques seraient restés bloqués là, à cause d’un indicateur d’exposition dont le coefficient de corrélation avec les mesures est proche du zéro absolu. Certes, on ne trouve aucune trace de thiametoxam quand l’indicateur est à inférieur à 8 (et donc qu’il n’y a aucune parcelle ou presque traitée à proximité de la ruche, mais c’est vraiment la moindre des choses. Par contre, quand il y a réellement un risque (donc des parcelles traitées à moins de 2 km), l’indicateur ne permet absolument pas de prédire à quelle quantité d’insecticide ont été exposées les abeilles, tout au moins d’après le maigre échantillon de données collectées.
Mais ne désespérez pas ! La boîte à outils statistiques est pleine de ressources. Intégrez ces données dans un « zero-inflated generalized linear mixed model » (modèle linéaire généralisé mixte avec excès de zéros). Vous obtenez cette fois une relation significative entre vos deux variables, avec un intervalle de confiance dont l’embonpoint reste acceptable (d’aucuns diraient qu’il n’est pas gros, juste un peu enrobé) :
/image%2F1635744%2F20260123%2Fob_f4466b_capture-stoop-3.png)
Bien entendu, une large part des points de mesure est en dehors de cet intervalle de confiance à 95 %, mais d'un point de vue statistique c'est tout-à-fait normal : il s'agit de l'intervalle de confiance de la tendance identifiée par le modèle, et non de la fourchette dans laquelle 95 % des données individuelles devraient se trouver. Grâce à votre maitrise de ces modèles complexes, vous vous retrouvez donc avec un indicateur d’exposition tamponné « statistiquement significatif », qui va vous permettre de démontrer qu’il y a bien un lien, tout aussi significatif, entre cet indicateur et la mortalité des abeilles (surtout si les parcelles traitées sont situées à proximité d’un foyer de loque, une maladie contagieuse des abeilles). Cela n’améliore en rien la corrélation de votre indicateur avec les données réelles de terrain, mais ça vous permet de passer le cap de la publication. Et comme, de toutes façons, plus jamais personne (à commencer par vous-même) n’utilisera de nouveau cet indicateur, il n’y a de risque d’être démenti par la suite.
On pourrait objecter que cette tentative de validation de l’indicateur d’exposition n’était qu’une étape mineure de l’étude entreprise. C’est vrai, mais ce résultat méritait d’être cité pour illustrer la capacité de ces modèles, si on les emploie bien, à donner des résultats statistiquement significatifs, mais complètement déconnectés de l’utilisation pratique que l’on peut faire des données. Et par ailleurs, cette publication est un florilège de techniques agrologiques mobilisées pour démontrer un effet néfaste des néonicotinoïdes, malgré le résultat majeur donné en une ligne dans le texte de l’article, et « oublié » dans le résumé : les auteurs n’ont observé aucune liaison entre la proximité de parcelles traitées au thiametoxam, et la population ou la production des ruches.
Henry et al, 2015, https://doi.org/10.1098/rspb.2015.2110
Et pour une visite guidée : Les nuisances virtuelles des néonicotinoïdes, épisode 2 : Le retour des abeilles à puce ! | ForumPhyto
Avec ce chapitre 2 de notre anthologie, nous avons vu deux façons différentes d’utiliser des modèles statistiques, afin de trouver des tendances significatives validant l’hypothèse des auteurs, à partir de jeux de données qui semblaient les contredire. Dans le 3ème chapitre, nous passerons au niveau supérieur : comment valider une hypothèse en utilisant la non-significativité d’un modèle statistique. Ce qui nous ramènera au lien entre néonicotinoïdes et oiseaux, et à la revue Nature, décidément en pointe dans l’extension du domaine de la lutte agrologique…
_______________
/image%2F1635744%2F20260123%2Fob_ae0920_capture-philippe-stoop-2.jpg)
* Directeur Recherche & Innovation ITK - Membre de l'Académie d'Agriculture de France
/image%2F1635744%2F20150606%2Fob_b8319b_2015-06-06-les-champs-de-l-au-dela-tom.jpg)