Archive de la catégorie 'Tous les billets'

Test T de Student par permutations pour R

Posté par Timothée le 9 May 2008 | , ,

Mes tribulations mathématiques m’ont récemment poussé dans le monde assez fabuleux des tests par permutation, et je viens de consacrer une grosse demi heure à écrire pour R le test T de Student par permutations, pour m’affranchir de l’homogénéité des variances et de la normalité des données.

Vu que c’est du code qui peut servir, je le donne ici… Et éventuellement, ça permettra aux R-Guru qui traînent (j’espère) de vérifier que je ne me sois pas planté…

TTperm <- function(sample1,sample2,fac1='a',fac2='b',nperm=999){
require(car)
stu<-t.test(sample1,sample2)
stu.p<-stu$p.value
stu.t<-stu$statistic
stu.df<-stu$parameter
count <- 1
result.stu <- matrix(rep(0,3),1)
colnames(result.stu)=c("T statistic (Df)","Parametric p-value", "Permutations p-value")
for(i in 1:nperm){
NAMES<-c(rep(fac1,length(sample1)),rep(fac2,length(sample2)))
SAMPLE<-c(sample1,sample2)
PERMNAMES<-sample(NAMES)
MATR<-c(SAMPLE,PERMNAMES)
MATR<-matrix(MATR,nrow=2,byrow=T)
RS1<-RS2<-''
rownames(MATR)<-c('Value','Sample')
for(rnk in 1:length(PERMNAMES)){
if(MATR['Sample',rnk]==fac1){
RS1<-c(RS1,as.real(MATR['Value',rnk]))
}
if(MATR['Sample',rnk]==fac2){
RS2<-c(RS2,as.real(MATR['Value',rnk]))
}
}
RS1<-RS1[2:length(RS1)]
RS2<-RS2[2:length(RS2)]
stu.perm<-t.test(as.real(RS1),as.real(RS2))
stu.perm.p<-stu.perm$p.value
stu.perm.t<-stu.perm$statistic
if(abs(stu.perm.t) >= abs(stu.t)) {count <- count+1}
}
result.stu[1,1]=paste(round(stu.t,4),'(',round(stu.df,4),')',collapse='')
result.stu[1,2]=round(stu.p,6)
result.stu[1,3]=count/(nperm+1)
return(result.stu)
}

Pas de réponse pour l'instant

Trouvez l’auteur : innovation scientifique et exposition au blâme

Posté par Timothée le 4 May 2008 | , , ,

Trouvé par hasard alors que je traversai la moitié de la côté méditerranéenne pour aller rejoindre ma petite famille non loin de Marseille (on notera au passage l’usage quasi monomaniaque de la virgule)…

La science, qui ne fait que commencer, et qui n’a donc encore poussé les choses ni jusqu’à l’exhaustivité du détail ni jusqu’à la perfection de la forme, est dans une situation qui l’expose au blâme. Toutefois, si ce blâme était censé toucher son essence, il serait tout aussi injuste, qu’il est malvenu, par ailleurs, de refuser de reconnaître l’existence de ce développement. Cette opposition semble être le principal des noeuds sur lesquels la culture scientifique actuelle s’échine sans parvenir encore au degré de compréhension qu’il faudrait.

Autrement dit, quand une nouvelle niche scientifique se crée, elle se crée avec des outils imparfaits, des concepts nécessairement à affiner, des méthodes qui demande plus de raffinement. Débroussailler un terrain de la science qui a été laissé en friche, ça se fait les mains dans le cambouis, avec les moyens dont on dispose, les indicateurs qu’on pense être les bons, et ce n’est souvent pas de la science très présentable — au sens méthodologique, tout au moins.

Le phénomène de peer-review actuel, qui a remplacé la présentation des travaux devant les académies et sociétés qui assumait — sauf erreur de ma part — le même rôle à l’époque de l’auteur de cet extrait, se pose justement comme garant d’une science académique, dans les normes (d’une science normale). En permettant de publier les résultats conventionnels, obtenus avec les méthodes conventionnelles , mais en étant souvent un obstacle à la publication de choses nouvelles — prenons pour exemple la Red Queen Hypothesis proposée par Leigh Van Valen, qui est à ce jour l’article le plus cité en biologie évolutive, et probablement un des papiers les plus cités tout court, qui n’a jamais passé la barrière de la revue, et a fini publiée dans un journal (Evol Theor) créé pour l’occasion — ne fait parfois que blâmer une science qui commence.

La recherche de modèles alternatifs à la revue par les pairs — le minimum que l’on puisse faire pour le moment est sans doute de généraliser la revue non anonyme — doit notamment avoir comme objectif une plus grande clémence vis-à-vis de sciences en émergences. Non pas en permettant à chacun de publier ses délires métaphysiques sur le sens de l’évolution ou la création, mais en exposant au plus de regards possible des idées nouvelles, qui ouvrent des perspectives nouvelles, et en minimisant le temps nécessaire pour déclencher un débat autour de ces idées. Leur perfectionnement sera alors possible, dans la mesure ou l’ensemble de la communauté scientifique pourra y contribuer.

Pas de réponse pour l'instant

This is a public service announcement (whithout guitar)

Posté par Timothée le 30 April 2008 |

La vie d’un étudiant de master n’est pas toujours facile, et en ce moment, j’ai pas mal de travail. ne soyez pas trop déçus de ne pas avoir d’énormes quantités de lecture ici ces prochains jours — peut-être un billet sur le système de bourses de thèses en France, histoire de cracher ma bile, ou du réchauffage de journal club — avant probablement la semaine prochaine.

Sur ce, je me prépare a aller passer 1/4 de mes deux prochains jours dans des trains, loin de ma biblio, loin de Twitter, de mon labo, de mes poissons, loin de tout en fait.

En attendant, vous pouvez toujours rendre l’attente plus agréable à grands coups de Mick Jones (c’est plus dur qu’il n’y paraît de n’en choisir que trois…)

free music
free music
free music

Pas de réponse pour l'instant

Le spectre d’hôte des pathogènes est-il une information utile en santé publique?

Posté par Timothée le 23 April 2008 | , , ,

J’ai récemment parlé de travaux visant a déterminer les différents facteurs impliqués dans l’émergence d’un agent pathogène. Si mon dernier billet visait à comparer des différences dans la méthodologie, il est temps de passer à des choses plus biologiques, plus proches aussi — je l’avoue — de mes préoccupations quotidiennes. Au programme du billet d’aujourd’hui, donc, une réflexion sur l’importance de la connaissance du spectre d’hôte d’un pathogène quand on fait de la santé publique. On peut être tenté de se demander où cette question trouve son origine. La réponse est assez simple. Mais pour commencer, quelques concepts.

Spectre d’hôte, spécificité, et autres

Il existe différentes manières de définir la spécificité d’un parasite. Certains auteurs ont proposé de mesurer le nombre de tissus, de types cellulaires qu’un pathogène peut atteindre. D’autres — Lymbery en tête — pensent qu’il est tout aussi judicieux de s’intéresser au nombre d’espèces qu’un parasite peut atteindre. J’en profite pour une remarque; il est possible que j’utilise parasite et pathogène de manière assez identique. Question d’habitude. D’autres auteurs enfin ont considéré que si le nombre d’hôtes était important, il fallait aussi prendre en compte leur proximité phylogénétique.

Dans notre cas, nous allons nous contenter du nombre total d’hôtes, même si les autres points de vue sont tout aussi défendables, pour deux – discutables – raisons. D’une part, on va se concentrer sur les émergences, et plus précisément le passage de l’animal à l’homme; d’autre part, la majorité des études précédentes a retenu le spectre d’hôte comme information principale. La première raison peut être contredite en avançant que considérer la proximité phylogénétique est tout aussi pertinent (ce qui est vrai), et la seconde en rappelant que ce n’est pas parce que tous les imbéciles sont d’accord qu’ils ont raison (autrement dit, ce n’est pas parce que tout le monde fait la même chose que c’est une bonne façon de faire).

La tendance globale

Plusieurs études se sont intéressées aux tendances globales, partagées par les maladies émergentes. Plutôt que de maladies, je m’intéresse ici aux pathogènes, c’est-à-dire aux organismes qui provoquent les symptômes — pour faire simple. Le travail de Wollhouse & Gowtage-Sequeria dont je parlai dans mon précédent billet a clairement permis de constater que la “probabilité” qu’un pathogène soit responsable d’une émergence dépend… de son spectre d’hôte. Qu’est-ce à dire?

Mettons à part les virus. Nous y reviendrons dans la dernière partie de ce billet. Pour les autres organismes, on observe que ceux qui n’infestent que l’homme — des spécialistes, donc — sont les moins représentés parmi les pathogènes provoquant des émergences. Ceux ayant un spectre d’hôtes non-humains de 1 (un hôte non humain en plus de l’humain) sont plus représentés parmi les émergents, et ainsi de suite jusqu’aux organismes avec 3 hôtes non humains.

Comment l’interpréter? De manière simple, on constate que “plus on en a, plus on en a”, autrement dit, c’est ceux des pathogènes qui ont le plus d’hôte qui sont le plus susceptibles de passer rapidement chez l’homme. Et ceux qui, évolutivement, n’ont qu’un hôte, s’en satisfont tout à fait. Ce qui devrait nous mettre la puce à l’oreille : on dirait bien qu’on a certains pathogènes capables d’aller un peu partout, et d’autres qui sont plus limités…

Des explications biologiques?

Vous imaginez bien qu’on peut trouver des explications biologiques à cette constatation. La restriction d’habitat – le fait de ne pas pouvoir exploiter toutes les niches, ici tous les hôtes – est une problématique classique, et puisque dans ce cas ça m’arrange, je vais séparer les raisons en deux cas (traditionnellement, on parle de restriction par l’adaptation ou par la dispersion, ce que je vais m’empresser de ne pas faire ici).

Tout d’abord, une influence phylogénétique. Prenons le cas des virus, sur lesquels j’avais promis de revenir. J’ai dit que c’était les seuls à ne pas vouloir respecter la tendance globale, et à avoir tendance à émerger beaucoup quel que soit leur spectre d’hôtes non-humains. Pourquoi? Un virus entre dans une cellule en se fixant a un récepteur membranaire, dont certains sont très fortement conservés au cours de l’évolution (pas forcément en séquence, mais au moins au niveau de leurs formes, ce qui est tout aussi important). Et ce n’est pas une surprise si je vous dit que certains parasites sont très restreints à des taxons – groupes d’espèces apparentées — proches (question d’adaptation, je ne vais pas en noircir des pages).

Mais une influence biologique peut être invoquée. Des travaux ont montré que les parasites généralistes avaient une plus grande variabilité – on a des données génétiques et morphométriques — que les spécialistes. Grâce à cette caractéristique, ils sont éventuellement capables de se trouver plus à leur aise sur un nouvel hôte qu’un spécialiste très adapté à son hôte. D’autant plus que le nouvel hôte est proche; la vérification de cette idée n’est même pas forcément compliquée : il suffit de regarder, dans les pathogènes émergents avec aucun hôte humain, comment les hôtes se répartissent d’un point de vue phylogénétique (plus de grands signes, de rongeurs, d’ongulés,…). On doit sans doute pouvoir trancher entre écologie et phylogénie dans ce cas.

Allez, par cette – par nécessairement – habile pirouette, j’en reviens à la vision classique de la restriction d’habitat: par l’adaptation, ou pas la dispersion. Les deux situations évoquées plus haut tombent sous le coup de l’adaptation : on se transfère sur des hôtes qui ressemble à ce qu’on connaît, ou inversement, on est capable de se transférer si on a la capacité d’être variable.

Et la dispersion alors? Si on possède un nombre d’hôtes important, on est potentiellement fortement présent dans l’écosystème, et on a donc plus de chances qu’une de nos larves entre en contact avec un individu qui va lui convenir, et qui deviendra un nouvel hôte – attention, vision simpliste et idyllique de la chose. Mais là, de nouveaux mécanismes entrent en jeu, avec l’intervention de vecteurs, les effets de dilutions, et plein d’autres choses qui tendent à faire mal aux crânes non avertis…

Note : Pas mal de billets en “stade larvaire” ces temps-ci… A prévoir? Peut-être un peu de reconstitution d’histoire évolutive, ou alors de l’immunologie… Selon le temps dont je dispose…

Pas de réponse pour l'instant

Virus et bactéries : qui sont les plus émergents?

Posté par Timothée le 22 April 2008 | ,

En décembre 2005, Mark Woolhouse et Sonya Gowtage-Sequeria [1] publiaient un article qui cherchait a déterminer les facteurs impliqués dans l’émergence de pathogènes. En d’autres termes, pourquoi voit-on des maladies apparaître, ou passer de la faune sauvage à l’homme. Leurs résultats indiquaient que parmi les pathogènes émergents, 10% étaient des bactéries, et 37% des virus [2].

Plus récemment, un groupe mené par Kate Jones [3] publiait une étude assez similaire, dans ses objectifs et sa méthodologie. Pas dans ses résultats. Pour Jones et ses collaborateurs, 54.3% des pathogènes émergents sont des bactéries, et 25.4% seulement des virus.

D’où vient cette différence? Il s’agit simplement de s’entendre sur ce qu’est “un pathogène”… Pour Woolhouse & Gowtage-Sequeria, une bactérie = une espèce de bactérie. Kate Jones et son équipe ont décidé de se concentrer sur les souches : une souche résistante = un pathogène. A titre d’exemple, si vous avez trois outbreaks (apparition d’un pathogène) d’E. coli de souches différentes, Woolhouse & Gowtage-Sequeria comptent 1, Jones et son équipe comptent 3.

Une simple différence de la méthode de comptage entraîne au final un écart énorme dans les résultats, et rend la comparaison entre les deux études difficiles — sans compter le fait que la méthode de Jones n’avait que très peu été appliquée.

Alors, laquelle est “la meilleure”? Comparons le pour et le contre dans chaque cas. Pour W&GS, on se concentre sur les espèces, et leur étude est plus “globale” : on ne sait pas quelle espèce est la plus à même de donner des outbreaks à partir de souches diverses, par exemple. A l’inverse, l’équipe de Jones se base sur une réalité plus “biologique” : différentes souches donnent des outbreaks différents, et doivent donc être considérés séparément [4].

Tout comme les équipes de Lambin et Hudson s’étaient pris le bec sur des questions de dynamique des populations, la comparaison des travaux de W&GS et de l’équipe de Kate Jones nous rappelle que le résultat est une chose, mais que sans connaître le protocole par lequel on l’a obtenu, il n’est rien (ou si peu)…

Note : Et pour le prochain billet… nous verrons si connaître le spectre d’hôte des parasites et pathogènes est utile en santé publique…

Notes

  1. Woolhouse & Gowtage-Sequeria (2005) Host Range and Emerging and Reemerging Pathogens Emerg Inf Dis 11(12):1842–1847 []
  2. Des estimations précédentes donnaient l’intervalle 10–30% de bactéries, 30–44% de virus. []
  3. Jones et coll. (2008) Global trends in emerging infectious diseases Nature 451:990–994 []
  4. Cohen (2000) Changing patterns of infectious diseases Nature 406:762–767 []

Une réponse pour l'instant

« Prev - Next »

Sitemap