Pourquoi faut-il un bon échantillonnage pour reconstruire une phylogénie?

Posté par Timothée le 12 May 2008 | , , , , ,

Ne nous y trompons pas, je ne vais pas faire un billet long et exhaustif sur le sujet, ni même entrer trop dans les détails de comment on procède pour inférer une , c’est à dire les “liens de ressemblance”[1] entre les êtres vivants (et c’est bien dommage, mais je n’ai pas le temps… j’ai passé une demi heure à retrouver mon mac perdu sous 30cm de papiers qui jonchent mon bureau, ou presque). Je vais seulement illustrer par un petit exemple ce qui se passe quand on essaie de le faire à partir de trop peu d’espèces.

Je confesse que la préparation de ce billet ne m’a pas mangé trop de temps : j’ai ouvert mon fichier de séquences, j’en ai extrait 7, fait un arbre, et idem avec l’ensemble des séquences de mon petit genre à moi. Les séquences que j’ai pris sont celles du gène du 18S rRNA), parce que c’est le seul marqueur dont on dispose à l’heure actuelle — pour toutes les espèces, et c’est justement le point important de ce billet —, qu’il s’aligne bien entre espèces, tout en étant assez discriminant.

Pour information, les noms des espèces sont tronqués à 10 caractères, puisque le fichier de base est en format Phylip, qui impose cette restriction.

Quelques remarques avant de commencer : je n’avais pas le temps de me lancer dans une analyse très poussée, autrement dit, je n’ai pas bouffé du temps de calcul à déterminer le meilleur modèle, ni paramétré outre mesure PhyML[2], utilisé pour reconstruire les arbres[3]. Dès que j’aurais fini mon stage, je promet de consacrer un billet à expliquer comment j’aurais dû faire ces analyses dans les règles de l’art, en présentant en plus quelques outils bien libres, bien online, bien geeky.

Arbre avec 6 espèces et un extra-groupeLe vif du sujet, maintenant. Pour mon premier arbre, j’ai sélectionné de manière aléatoire ou presque (cliqué un peu au pif dans mes séquences) 6 espèces de Lamellodiscus, et l’extra-groupe (je reviendrai sur le billet sus-mentionné dans son rôle). D’un point de vue purement descriptif, on voit que deux groupes se forment (on laisse tranquille ‘D._aequans’, qui sert a enraciner l’arbre), comprenant chacun trois espèces. Les valeurs indiquées à la jonction de deux branches sont les valeurs de bootstrap. Plus elles sont proches de 1000, plus elles indiquent qu’on peut avoir confiance dans ce noeud. Par exemple, le noeud (L._knoeppf/L._ergensi), avec une valeur de 896 (89,6%) est relativement solide.

On va s’intéresser au groupe “du bas”, pour commencer, soit (L._elegans(L._drummon/F._echenei))[4]. On remarque que L._elegans est à la base de ce groupe, avec une valeur de soutien est 664 (ce qui est bien mais pas top, pourrait-on dire). Ce qui doit nous faire penser que L._elegans est “plus ancien” que ses deux comparses. Retenez bien cette information, c’est important pour la suite.

Dans le groupe du haut, maintenant, on voir que L._knoeppf et L._ergensi sont proches, et qu’a priori, au vu de la valeur de bootstrap, on peut avoir confiance en cette proximité.

Arbre completOn passe maintenant à l’arbre que j’ai patiemment reconstruit (ça reste assez passif comme méthode, l’algorithme de Guindon & Gascuel a fait le gros du travail), que vous pouvez voir à gauche de ce paragraphe. Si je n’avais pas été une parfaite feignasse — et que j’avais eu un peu plus de temps — j’aurais bien pu mettre les espèces du premier arbre en gras, mais vous pouvez toujours vous amuser à les chercher…

On va s’intéresser aux caractéristiques importantes de ce nouvel arbre, et surtout à la position de L._elegans. Et la surprise, au lieu d’être à la base de son groupe, il se retrouve en position terminale (4ème position en partant du haut). Comment est-ce possible? Facile, il a été victime de l’attraction des longues branches dans le premier arbre, et on a rompu cette attraction en ajoutant des taxons dans le second arbre[5]! Certains de reconstruction phylogénétique ont tendance à regrouper les espèces qui évoluent vite, partant du principe que plus on a accumulé de mutations, plus on a eu de temps pour le faire, ergo on va aller se brancher très près de la racine de l’arbre. Or, rien ne dit qu’on ne soit pas en train d’observer un taxon qui évolue rapidement, et qui dans le même temps que ses petits collègues, va accumuler 2, 3, 10 fois plus de mutations. Et pour le savoir, il est nécessaire de faire l’analyse en incorporant des taxons proches de celui qu’on suspecte avoir subi cette attraction.

Et de fait, dans notre cas, L._elegans n’est pas un taxon ‘ancestral’, mais bien un petit malin qui s’amuse a évoluer plus rapidement que ses petits camarades. Et la place de L._elegans en tant que racine du petit groupe contenant L._drummon/F._echenei est maintenant occupée par L._virgula[6].

De manière plus anecdotique, on remarque qu’entre L._ergensi et L/_knoeppf, qui étaient pourtant voisins dans l’arbre précédent, L._fratern est venu s’intercaler.

Que retenir de ce petit exemple?

D’une part, qu’une à laquelle il manque beaucoup de taxons est soumise à des artefacts de reconstruction, et donc n’a qu’une valeur toute relative.

D’autre part, que les valeurs de bootstrap ne signifient pas que le noeud est fiable : elles ne font que nous dire, qu’avec les données dont on dispose, ce noeud est robuste. Robustesse et fiabilité ne sont pas la même chose, et il faut y faire attention.

Tout ça pour dire qu’un travail de bon vieux naturaliste est nécessaire, pour caractériser au mieux la diversité des groupes qu’on étudie, mais qu’il faut aussi un travail important de séquençage, pour reconstruire des histoires évolutives les plus précises possibles. Ce que je m’empresse de retourner faire…

Notes

  1. A la différence de la “généalogie”, qui travaille sur les liens de parentés []
  2. J’ai utilisé la version locale, avec 1000 réplicats de bootstrap, une méthode qui permet de vérifier la “solidité” de l’arbre, ce qui a tendance a demander un temps de calcul assez important sur mon MacBook []
  3. Je m’en veux beaucoup, je pense que ça mérite amplement d’aller brûler en enfer pour plusieurs éternités tellement c’est un affront à ceux qui m’ont patiemment enseigné la []
  4. Furnestinia echeneis est un parasite d’un autre genre, mais qui d’un point de vue moléculaire appartient aux Lamellodiscus. Il a d’ailleurs été répertorié un peu vite comme Lamellodiscus echeneis par MarBEF. []
  5. C’est à ce moment la que j’avoue un léger dans mon échantillon de départ… Mais c’était pour le bien de ce billet! []
  6. Cet arbre n’est pas non plus totalement exhaustif, puisque je n’avais pas toutes les séquences de 18S dans mon fichier, et que je n’avais pas trop le temps d’aller chercher celles qui me manquaient sur GenBank []

Billets similaires

Pas de réponse pour l'instant

Le spectre d’hôte des pathogènes est-il une information utile en santé publique?

Posté par Timothée le 23 April 2008 | , , ,

J’ai récemment parlé de travaux visant a déterminer les différents facteurs impliqués dans l’émergence d’un agent pathogène. Si mon dernier billet visait à comparer des différences dans la méthodologie, il est temps de passer à des choses plus biologiques, plus proches aussi — je l’avoue — de mes préoccupations quotidiennes. Au programme du billet d’aujourd’hui, donc, une réflexion sur l’importance de la connaissance du spectre d’hôte d’un pathogène quand on fait de la santé publique. On peut être tenté de se demander où cette question trouve son origine. La réponse est assez simple. Mais pour commencer, quelques concepts.

Spectre d’hôte, spécificité, et autres

Il existe différentes manières de définir la spécificité d’un parasite. Certains auteurs ont proposé de mesurer le nombre de tissus, de types cellulaires qu’un pathogène peut atteindre. D’autres — Lymbery en tête — pensent qu’il est tout aussi judicieux de s’intéresser au nombre d’espèces qu’un parasite peut atteindre. J’en profite pour une remarque; il est possible que j’utilise parasite et pathogène de manière assez identique. Question d’habitude. D’autres auteurs enfin ont considéré que si le nombre d’hôtes était important, il fallait aussi prendre en compte leur proximité phylogénétique.

Dans notre cas, nous allons nous contenter du nombre total d’hôtes, même si les autres points de vue sont tout aussi défendables, pour deux – discutables – raisons. D’une part, on va se concentrer sur les émergences, et plus précisément le passage de l’animal à l’homme; d’autre part, la majorité des études précédentes a retenu le spectre d’hôte comme information principale. La première raison peut être contredite en avançant que considérer la proximité phylogénétique est tout aussi pertinent (ce qui est vrai), et la seconde en rappelant que ce n’est pas parce que tous les imbéciles sont d’accord qu’ils ont raison (autrement dit, ce n’est pas parce que tout le monde fait la même chose que c’est une bonne façon de faire).

La tendance globale

Plusieurs études se sont intéressées aux tendances globales, partagées par les . Plutôt que de maladies, je m’intéresse ici aux pathogènes, c’est-à-dire aux organismes qui provoquent les symptômes — pour faire simple. Le travail de Wollhouse & Gowtage-Sequeria dont je parlai dans mon précédent billet a clairement permis de constater que la “probabilité” qu’un pathogène soit responsable d’une émergence dépend… de son spectre d’hôte. Qu’est-ce à dire?

Mettons à part les virus. Nous y reviendrons dans la dernière partie de ce billet. Pour les autres organismes, on observe que ceux qui n’infestent que l’homme — des spécialistes, donc — sont les moins représentés parmi les pathogènes provoquant des émergences. Ceux ayant un spectre d’hôtes non-humains de 1 (un hôte non humain en plus de l’humain) sont plus représentés parmi les émergents, et ainsi de suite jusqu’aux organismes avec 3 hôtes non humains.

Comment l’interpréter? De manière simple, on constate que “plus on en a, plus on en a”, autrement dit, c’est ceux des pathogènes qui ont le plus d’hôte qui sont le plus susceptibles de passer rapidement chez l’homme. Et ceux qui, évolutivement, n’ont qu’un hôte, s’en satisfont tout à fait. Ce qui devrait nous mettre la puce à l’oreille : on dirait bien qu’on a certains pathogènes capables d’aller un peu partout, et d’autres qui sont plus limités…

Des explications biologiques?

Vous imaginez bien qu’on peut trouver des explications biologiques à cette constatation. La restriction d’habitat – le fait de ne pas pouvoir exploiter toutes les niches, ici tous les hôtes – est une problématique classique, et puisque dans ce cas ça m’arrange, je vais séparer les raisons en deux cas (traditionnellement, on parle de restriction par l’adaptation ou par la dispersion, ce que je vais m’empresser de ne pas faire ici).

Tout d’abord, une influence phylogénétique. Prenons le cas des virus, sur lesquels j’avais promis de revenir. J’ai dit que c’était les seuls à ne pas vouloir respecter la tendance globale, et à avoir tendance à émerger beaucoup quel que soit leur spectre d’hôtes non-humains. Pourquoi? Un virus entre dans une cellule en se fixant a un récepteur membranaire, dont certains sont très fortement conservés au cours de l’évolution (pas forcément en séquence, mais au moins au niveau de leurs formes, ce qui est tout aussi important). Et ce n’est pas une surprise si je vous dit que certains parasites sont très restreints à des taxons – groupes d’espèces apparentées — proches (question d’adaptation, je ne vais pas en noircir des pages).

Mais une influence biologique peut être invoquée. Des travaux ont montré que les parasites généralistes avaient une plus grande variabilité – on a des données génétiques et morphométriques — que les spécialistes. Grâce à cette caractéristique, ils sont éventuellement capables de se trouver plus à leur aise sur un nouvel hôte qu’un spécialiste très adapté à son hôte. D’autant plus que le nouvel hôte est proche; la vérification de cette idée n’est même pas forcément compliquée : il suffit de regarder, dans les pathogènes émergents avec aucun hôte humain, comment les hôtes se répartissent d’un point de vue phylogénétique (plus de grands signes, de rongeurs, d’ongulés,…). On doit sans doute pouvoir trancher entre écologie et dans ce cas.

Allez, par cette – par nécessairement – habile pirouette, j’en reviens à la vision classique de la restriction d’habitat: par l’adaptation, ou pas la dispersion. Les deux situations évoquées plus haut tombent sous le coup de l’adaptation : on se transfère sur des hôtes qui ressemble à ce qu’on connaît, ou inversement, on est capable de se transférer si on a la capacité d’être variable.

Et la dispersion alors? Si on possède un nombre d’hôtes important, on est potentiellement fortement présent dans l’écosystème, et on a donc plus de chances qu’une de nos larves entre en contact avec un individu qui va lui convenir, et qui deviendra un nouvel hôte – attention, vision simpliste et idyllique de la chose. Mais là, de nouveaux mécanismes entrent en jeu, avec l’intervention de vecteurs, les effets de dilutions, et plein d’autres choses qui tendent à faire mal aux crânes non avertis…

Note : Pas mal de billets en “stade larvaire” ces temps-ci… A prévoir? Peut-être un peu de reconstitution d’histoire évolutive, ou alors de l’immunologie… Selon le temps dont je dispose…

Billets similaires

Pas de réponse pour l'instant

From free-living to parasitism, and back? Le cas des aspidogastres.

Posté par Timothée le 27 March 2008 | , ,

L’un des groupes les plus riches en informations pour comprendre le passage de la vie libre au parasitisme est probablement les . Dans ce phylum, on trouve des organismes libres, des ectoparasites, des endoparasites, des parasites à cycle de vie direct, et d’autres à cycle de vie complexe.

La des , malheureusement, est encore assez floue. On trouve fréquemment des pavés de 40 pages dans les journaux de , qui essaient d’apporter une réponse définitive, sans succès. L’année dernière, un groupe dirigé par Tim Littlewood [1] a proposé une hypothèse intéressante : le parasitisme chez les a une origine commune.

Le parasitisme chez les plathlemynthes? Parlons-en. La plupart des taxons de comportent des parasites (tous ceux là sont appelés les Neodermata, enfin presque). A la base, on trouve les monogènes, ectoparasites à cycle direct, puis les cestodes et digènes, endoparasites à cycle complexe.

Les monogènes ont divergé plus tôt dans l’histoire évolutive des , ce qui fait dire a Littlewood et ses collègues que le parasitisme avec un cycle complexe est un bel état dérivé: les premiers neodermata étaient des ectoparasites de vertébrés, à cycle direct, puis le schéma s’est complexifié.

Le parasitisme implique, instinctivement, une perte d’informations : on confie une partie de son métabolisme à son hôte, on utilise des phénotypes étendus, tout ce genre de choses. Si il est à peu près compréhensible de passer de la vie libre au parasitisme, l’inverse est assez difficilement envisageable. Pour certains parasitologues, c’est même strictement impensable.

Sauf que dans ce cas, un taxon des Neodermata nous pose un sérieux problème. Les aspidogastres sont des trématodes “de base”, avec leurs deux ventouses, leur forme plate ou foliaire, etc… Et une partie d’entre eux sont parasites. Seulement, l’autre ne l’est pas. Si vous observez l’arbre ci-contre, vous devriez voir ou est le problème…

Les aspidogastres sont en plein dans les neodermata, et même en plein dans les trématodes, parasites s’il en est. Le rectangle bleu correspond à l’apparition supposée du parasitisme chez les (les turbellariés sont libres), et le rectangle rouge correspond au passage à l’état d’endoparasites à cycle complexe. Autrement dit, les aspidogastres comprennent des espèces libres, alors que leurs ancêtres sont tout ce qu’il y a de plus parasite…

Si il existe un exemple de réversion vers la vie libre, il est à chercher ici.

Seulement, des problèmes existent encore.

D’une part, ce qu’on appelle les trématodes n’est pas un groupe monophylétique. Mais ce n’est peut-être qu’un résultat artefactuel lié à la composition en bases fortement ée chez les schistosomes (et pour en rajouter, l’échantillonnage est é vers eux, qui sont d’importance médicale).

D’autre part, on dispose de peu de séquences (et d’encore moins de protéines) de , hormis ceux qui ont une importance médicale. Les “racines” de l’arbre sont donc très floues (la des turbellariés, par exemple, est un peu le “musée du groupe paraphylétique”).

Et surtout, surtout (j’insiste), l’hypothèse forte de ce modèle (apparition du parasitisme en une fois, avant les monogènes) est fortement mise à l’épreuve par une question simple : les monogènes sont-ils monophylétiques? Il est impossible de trouver des synapomorphies pour soutenir ce clade [2]. Aucune analyse moléculaire ne va dans le sens de la monophylie des monogènes. Et si on cherche à définir des groupes à l’intérieur des “monogènes”, on se heurte à un problème : la classification basée sur les critères au stade larvaire (Oligonchoinea et Polyonchoinea) n’est pas compatible avec celle établie aux stages adultes [3] (Monopisthocotylea et Polyopisthocotylea).

L’étude de Littlewod basée sur des données moléculaires (génome mitochondrial complet) a quelque peu éludé la question: ils n’ont utilisé que le génome du Polyopisthocotylea Microcotyle sebastis, faute d’avoir des génomes mitochondriaux de Monopisthocotylea (c’est maintenant chose faite, même si c’est avec le plus marginal des monopisthocotylea).

S’il advient que les monogènes ne sont pas monophylétiques (et, pire encore, que les monopisthocotylea et les polyopisthocotylea ne sont pas strictement sister-groups), l’hypothèse de l’origine commune du parasitisme risque de tomber à l’eau [4]. On se retrouve donc avec un super sujet de recherche à creuser… et potentiellement un exemple de réversion vers la vie libre. De quoi faire fantasmer pas mal de parasitologues branchés évolution (dont votre serviteur…).

Nota: Ceci est un résumé saupoudré de quelques références d’une discussion qui a eu lieu après que j’ai présenté le dit papier de Littlewood au dernier journal club de mon équipe…

Notes

  1. Park et coll. A common origin of complex life cycles in parasitic flatworms: evidence from the complete mitochondrial genome of Microcotyle sebastis (Monogenea: Platyhelminthes) BMC Evol Biol 7(1) []
  2. Justine Non-monophyly of the monogeneans? Int J Parasitol 28(10) []
  3. Celle que j’utilise personnellement, puisque je travaille sur des adultes, et qu’elle a fini progressivement par prendre le dessus… []
  4. Mais le fait que les hôtes définitifs de tous les neodermata soient des vertébrés me rend assez confiant dans cette hypothèse… []

Billets similaires

Pas de réponse pour l'instant

LUCA was a pirate!

Posté par Timothée le 2 March 2008 | , ,

Ce matin, j’ai traîné ma soeur au MNHN pour lui faire visiter visiter la grande galerie. Arrivé devant une représentation des trois domaines du vivant, je lui montre le point au centre, en lui disant qu’on se demande bien à quoi pouvait ressembler la bestiole qui était la.

Pour qu’elle comprenne, j’ai tenté l’approche Tu sais, c’est un peu comme notre arrière arrière arrière arrière grand père. Après un court instant de réflexion, elle me regarde, et comme si elle m’annonçait la chose la plus évidente du monde, me répond Ah oui, ben ça pourrait être un pirate alors!.

Billets similaires

4 réponses pour l'instant

Variations environnementales structurées par la phylogénie et changements globaux

Posté par Timothée le 1 February 2008 | , , ,

Quand on observe, et c’est mon cas, la manière dont certains traits varient sous une contrainte environnementale, mais qu’on l’observe dans plusieurs espèces diffèrentes, phylogénétiquement proches, il faut être capable — dans l’idéal — de déterminer quelle part de la variation est liée à la , à l’, et au mélange de ces deux contraintes.

Or, on a un cadre conceptuel pour le faire. Alors que l’analyse comparative classique contrôle pour la variation liée à la , il était intéressant de prendre en compte les facteurs liés à la fois à la (les contraintes passées) et à l’ (les contraintes actuelles). C’est ce que Desdevises et coll. ont fait en 2003 (et qu’ils avaient déjà fait en 2002), en proposant de nommer cette partie de la variation “conservatisme phylogénétique de la niche”.

Ce cadre conceptuel permet de séparer la variation d’une variable dépendante (ce qu’on mesure, pour faire simple) en quatre classes : (a) liée à l’écologie, (b) conservatisme phylogénétique de la niche, (c) liée à la , (d) non expliquée (il y en a toujours un peu…).

Ce concept a été renouvelé tout récemment (janvier 2008) et appliqué à la réponse des espèces au changement global, par Diniz-Filho & Bini. Comment ça fonctionne, en clair? Regardez attentivement le schéma suivant.

En lecteurs attentifs que vous êtes, vous aurez remarqué que Diniz-Filho & Bini ont attribué des “conséquences” à chaque partie du partitionnement, qui expliquent les patrons obtenis dans la richesse spécifique et la structure des communautés. Il faut bien comprendre qu’on parle ici en terme de traits (phénotypiques) et d’espèces, et qu’on conceptualise les interactions…

En (a), de manière assez évidente, on retrouve les réponses phénotypiques locales : les espèces sont capables de s’adapter à leur nouvel , et les traits phénotypiques se modifient en conséquence. C’est la partie qui est totalement indépendante de votre passé évolutif, et celle qui semblerait (en première lecture) offrir le plus de liberté. Il n’en est rien, la contrainte phylogénétique peut être très forte.

Si les espèces concernées réagissent selon (a), elles s’adaptent en acquérant un nouveau trait.

En (b), le scénario concerne la répartiton des espèces sur les niches : soit les espèces peuvent modifier leur milieu de vie en réponse au changement (en changer est une solution attirante), soit elles ne le peuvent pas. On note au passage les deux possibilités : absence de dispersion mais aussi absence des environnements ancestraux.

Si on passe par la voie (b), et que les espèces concernées peuvent se déplacer, elles maintiennent leur trait ancestral (il y a de l’inertie phylogénétique).

En (c), enfin, on s’intéresse à la partie purement phylogénétique du trait considéré, qui revient à s’intéresser aussi au cas (b) pour les espèces ne dispersant pas. Plus le trait a une valeur adaptative dans la population (trait fitness), plus il a de chances de se maintenir, et de ne pas convenir au nouvel (et l’espèce s’éteint, au moins localement). Autre possibilité, le trait ancestral peut se maintenir dans un sub-optimum (”on peut mieux faire, mais on va faire avec”).

Ce cadre conceptuel permet de lier les patrons observés en terme de richesse spécifique et de structure des communautés, et des traits phénotypiques, aux contraintes (a, b, c). En d’autres terme, on peut analyser (et pourquoi pas prévoir) des éléments d’écologie actuels à partir de la , qui représente le “passé évolutif” d’une espèce.

Un peu de lecture

Yves Desdevises, Serge Morand, Pierre Legendre (2002) and determinants of host specificity in the genus Lamellodiscus (Monogenea) Biological Journal of the Linnean Society 77(4) pp. 431–443 [Google Scholar] (application de la méthode)

Yves Desdevises, Pierre Legendre, Lamia Azouzi, Serge Morand (2003) Quantifying phylogenetically structured environmental variation. 57(11) pp. 2647–2652 [Google Scholar] (premier papier décrivant la méthode)

José AF Diniz-Filho & Luis M Bini (2008) Macroecology, global change and the shadow of forgotten ancestors Global Ecology & Biogeography 17(1) pp. 11–17 [Google Scholar] (application aux changements globaux)

Billets similaires

12 réponses pour l'instant

Next »