Mann, Whitney, G vimbi, et moi

Posté par Timothée le 4 May 2007 dans , , 3 commentaires

Je n’imaginais pas me retrouver un jour face à un « cas de conscience » provoqué par des statistiques. Pourtant, cet après-midi, il a fallu faire un choix entre les deux choses que nous chérissons le plus au monde, notre infaillible feeling et la non moins intouchable p-value

Pour mon travail de stage, j’ai étudié une population de 34 poissons de l’espèce Leuciscus cephalus (cyprinidae, L. 1758). Comme toute bonne population, elle se compose de mâles (n=15) et de femelles (n=19). Mâles et femelles sur lesquels nous avons pris plusieurs mesures.

Notre objectif est de trouver des relations entre ces mesures (il y a de la physiologie, de l’immunologie, et des parasites, mais je n’en dis pas plus pour le moment). Avant toute chose, et puisque la physiologie des mâles et des femelles est susceptible d’être différente, nous avons vérifié quelles variables parmi celles que nous étudions sont significativement dépendantes du sexe.

Pour ça, il existe le test U de Mann-Whitney (Mann et Whitney 1947). Avec un peu de Statistica, et environ 10 minutes de travail, nous avions une liste des variables qui dépendaient du sexe de l’individu.

Pour certaines d’entre elles, il n’y avait pas de grosse surprise. La longueur du corps, le poids, le rapport de la masse des gonades sur la masse du corps, et quelques autres, varient selon que le poisson est un mâle ou une femelle.

Par acquis de conscience, nous avons vérifié que les parasites présents chez Leuciscus cephalus (Moravec 1994, 2001) n’avaient pas fait de différence, et que le nombre d’individu de chaque espèce de parasite était identique d’un sexe à l’autre. Pour la majorité de nos parasites (des ectoparasites et des endoparasites), en effet, il n’y avait pas de différence. Pour la majorité ? Oui, car pour une espèce, il s’est produit quelque chose d’assez étrange.

Gyrodactylus vimbi, monogène d’environ un demi-millimètre de long, nous posait un problème. Il n’était pas distribué de manière uniforme chez les mâles et les femelles. A priori, il faudrait en tenir compte dans nos analyses. Sauf que…

Sauf que voilà, il y a deux ou trois choses à savoir. Pour commencer, G vimbi est un ectoparasite, c’est-à-dire qu’il vit fixé à l’extérieur de son hôte (il arrive qu’on en retrouve sur les branchies, ce qui fait de lui un méso-parasite, mais c’est relativement anecdotique). Plus précisément, son micro-habitat est constitué par les nageoires des poissons hôtes.

Notre travail sur le terrain demandait une manipulation importante des poissons (maintien pour la prise de sang, notamment), qui a exposé les nageoires, et donc les ectoparasites qu’elles pouvaient abriter. Il y a donc un biais possible ici.

Autre chose. Nous avons un peu creusé les données pour ce parasite, à commencer par la p-value retournée par le test U (ça nous a demandé 4 secondes chrono en main, mais introduire du suspense dans le récit d’une analyse statistique, croyez moi, ça n’a rien de facile). Elle est de 0,048, pour un seuil de décision de 0,05. Qu’est-ce que ça signifie ?

Quand on annonce qu’il « existe une différence statistiquement significative dans la distribution de tel facteur en fonction du sexe », en biologistes précautionneux, nous ajoutons « mais il existe un risque qu’on se plante ». Ce risque est de 5%, d’où notre seuil de décision de 0,05. Plus une p-value est faible, plus on est sûr que ce qu’on dit est vrai.

En l’occurrence, pour notre distribution sexe-dépendante de G vimbi, on est très proche de notre erreur maximale acceptée. Ça, plus le fait que notre méthode de manipulation puisse induire un biais, en éliminant une partie des parasites, et nous avons commencé à douter de la validité de notre résultat (ça, plus le fait que ça nous arrange bien, mais chut…).

Pour ne rien laisser au hasard, nous avons regardé comment notre parasite se répartissait dans la population. A vu de nez, sur 34 individus, nous avons identifié plus de 4000 parasites. Ca n’a rien de très étonnant en soi, dans la mesure ou les estimations de la proportion d’espèces parasites vont de 14,5% à 75% (Hudson et al. 2006), avec un consensus à plus de 50% (Windsor 1998), et qu’un seul individu hôte est souvent infecté par plusieurs parasites. Dans le cas de nos poissons, certes appartenant à l’espèce la plus parasitée en Europe de l’Est, on dénombre 46 espèces métazoaires parasites (Moravec 2001).

Mais, surprise, G vimbi représente un total de 21 parasites, pour 12 hôtes infectés. C’est très peu. Après avoir creusé un peu (et, avouons le, sorti un histogramme pour voir comment ils se répartissaient), il est apparu que le nombre maximal de G vimbi retrouvés sur un même hôte est de 4.

Sachant qu’il est très probable que nous en ayons décrochés pendant la manipulation, et vu la p-value, nous avons décidé de ne pas tenir compte de cette « différence ». Décision qui est intervenue après avoir examiné à la fois les éléments « formels », et ce que nous savions de notre travail.

Reste à formuler ça en termes « mémoire »…

PS qui n’a rien à voir. Le blog va entrer en « sporulation » pendant quelque temps. Ma base de données arrive à saturation (et pas moyen de chipoter sur la significativité du pourcentage avec mon hébergeur, cette fois, …), et les crédits pour acheter de l’espace supplémentaire manquent cruellement… Je vais faire un peu de nettoyage, sinon, je vais attendre d’épouser une riche héritière et de l’éliminer par la suite, ou de devenir thésard pour avoir un salaire décent (on ne sait jamais, les scientifiques pourraient acquérir un statut, de la reconnaissance, et…).

 

Références

 

Hudson, Dobson et Lafferty (2006) Is a Healthy Ecosystem One That Is Rich in Parasites? Trends Ecol Evol, 21 (7), 381-385.

Mann et Whitney (1947) On a Test of Whether One of Two Random Variables Is Stochastically Larger Than the Other. Annals of Mathematical Statistics, 18, 50-60.

Moravec (1994) Parasitic Nematodes of Freshwater Fishes of Europe. Academia Praha, Praha.

— (2001) Checklist of Metazoan Parasites of Fishes of the Czech Republic and the Slovak Republic (1873-2000). Academia Praha, Praha.

Windsor (1998) Controversies in Parasitology, Most of the Species on Earth Are Parasites. Int J Parasitol, 12 (1), 1939-1941.

 

 

Timothée is
| All posts by Timothée

3 commentaires

» Flux RSS des commentaires
  1. tres drole !
    (la derniere phrase)

    sinon, les sections “discussion”, ca sert a ca :-)

  2. Bonjour Thimotée, J’aimerai bien que tous les chercheurs, surtout ceux en épidémiologie aient votre conscience, ce qui conduit à la question qui tue: autant de conscience ferait-il de vous un “bon” chercheur ?

    Il en est ainsi de ces chercheurs à tendance “environmentaliste” très marquée qui arrivent à faire publier leur étude dans un journal peer reviewed et à faire la manchette de médias de masse, toujours friands de nouvelles sensationnalistes. Et que dit leur étude: que le DDT (réautorisé par l’OMS après plus de 25 ans d’interdiction pendant lesquels des dizaines de millions d’Africains sont morts dans un génocide silencieux faute de soin) serait responsable de la baisse de fertilité des hommes. Tout cela basé sur des test de régression avec un beta … de -0,0005 (source : http://www.foxnews.com/story/0,2933,267124,00.html )

    P.S. C’est bien dommage que vos billets, qui devraient être déclarés d’utilité publique, doivent subir une dormance forcée pour des questions bassement matérielles. Dépêchez-vous de vous trouver une rentière et revenez nous vite (je ne participe pas souvent mais je lis vos billets). Au fait, pour la riche héritière, préférez une blonde qui complètera très bien votre intelligence, selon la vieille maxime “les contraires s’attirent”.

  3. Bonjour,

    Sans vouloir mettre en doute tes compétences en statistiques, il ne me semble pas que tu fasses mention de corrections dans cette note.

    Multiplier les analyses sur une même population (en l’occurence, tes poissons) nécessite de faire une correction du seuil de significativité. En effet, chaque test ayant son propre seuil α (alpha : Erreur de Type I) en faisant plusieurs analyses sur le même ensemble de données, la probabilité de faire une erreur de type I > α. P. ex. : Si on fait 4 tests sur un même ensemble de données, la probabilité de faire une erreur de type I va être de : 1 – (1 – .05)^4 = 1 – .954 = 1 – .81 = .19

    Il est donc nécessaire de corriger le seuil de significativité avec une correction de Boole Bonferroni, par exemple.

    Il y a un article de presse qui illustre les dérives des statistiques mal appliquées dans The Economist : http://www.economist.com/science/displaystory.cfm?story_id=8733754.

    Bonne journée.

    Fabrice.

Commenter


Sitemap