La morphométrie comme proxy pour la microévolution

Posté par Timothée le 14 July 2008 | , , ,

Ne vous laissez pas impressionner par le titre, vous allez voir qu’il n’y a rien de bien méchant dans ce billet. Posons nous plutôt une question toute simple. Imaginons qu’on veuille se pencher sur l’occurrence d’évènements de diversification (spéciation, etc) dans un groupe pour lequel il n’est pas forcément évident de faire de la (parce qu’on manque de marqueurs, de temps, d’argent, de protocoles rodés, ou de tout ça à la fois). Pour voir si ça vaut le coup de se lancer dans un travail moléculaire approfondi, il est intéressant d’avoir à notre disposition un proxy, autrement dit un moyen détourné, de voir si on observe des différences, qui révèleraient des évènements de diversification.

Le principe est assez simple. On veut montrer que dans une “espèce”, il existe plusieurs groupes bien distincts, qui pourraient éventuellement être le signe qu’une spéciation est en cours. Pour montrer ça, une des possibles est de mettre en évidence l’existence de différentes populations (par exemple, les infra-populations d’un parasite généraliste sur ses différents hôtes) au sein d’une espèce (on se place au niveau intra-spécifique, d’où la microévolution).

Comme toujours, le problème est de déterminer quel seuil de différence est à atteindre pour considérer qu’on fait partie de la même espèce, ou uniquement du même genre (et c’est vrai aussi au niveau moléculaire), mais on va dire que ça ne nous intéresse pas vraiment dans ce cas. Pourquoi? Parce qu’on cherche juste à voir si on observe ou non des “motifs”, en gros, si tout est bien homogène, ou si il existe des différences.

Et justement, la peut être une outil bien pratique pour ce type d’études. En gros, ça consiste à prendre plein de mesures (les mêmes!) sur plein d’individus, et à voir si des groupes se forment, ou pas. On dispose de “exploratoires” pour ça (ACP, entre autres), qui vont regrouper les individus similaires, et éloigner les autres (certaines forcent la formation de groupes, d’autres non). Par la suite, on peut tester la différence entre les groupes qu’on observe, pour déterminer si elle est significative.

L’avantage de la sur la simple morphologie (après tout, il serait aussi possible de dire “Oui mais regardez, cette petite pièce elle est un peu plus courbe, alors c’est que c’est différent!”) est qu’on passe d’une approche qualitative (et discrète : c’est courbe ou c’est pas courbe) a une approche quantitative (on peut mesurer des distances entre individus, et des moyennes pour les populations, etc). Autre avantage, une fois qu’on s’est mis d’accord sur les distances à relever, on met de côté le lié à l’observateur (”courbe”, c’est assez flou, et ça peut varier d’une personne à l’autre, alors que 2µm, c’est 2µm quoi qu’il arrive).

Ceci dit, il faut savoir quoi mesurer. Et il faut un organisme qui s’y prête. Essayez de faire de la sur une bactérie, vous allez voir comment vous allez rigoler. En revanche, sur des genres qui ont des organes un peu solides, bien visibles, et avec plein de landmarks caractéristiques (comme mes petits ), c’est tout de suite beaucoup plus facile.

On peut cependant faire quelques remarques contre cette approche. Pour commencer, elle pose une hypothèse (très) forte : on ne mesure que des individus adultes (avec un cycle de développement rapide, ça peut ne pas poser trop de problème, mais une petite vérification est quand même conseillée…). Et mesurer des organes c’est bien, mais savoir à quoi ils servent, c’est mieux. La aurait probablement plus d’impact si elle était couplée à une étude (au moins à des connaissances) fonctionnelle des pièces mesurées.

Et enfin, il y a des considérations “biologiques” qui interviennent. Si on observe une différence, qu’est-ce qui permet de trancher entre spéciation et plasticité phénotypique (le fait qu’une même génotype donne plusieurs phénotypes)? Les données moléculaires! Si on n’observe pas de différence, est-ce la preuve d’une absence de divergence entre les groupes? Ou est-ce que absence of evidence is not evidence of absence, comme le disait Sagan?

Pour résumer, cette approche peut être une bonne première approche, et peut même permettre de mettre en évidence des choses assez innatendues (mais j’en reparlerai plus tard). Ceci dit, elle prend toute sa puissance quand elle est couplée à un travail moléculaire.

Billets similaires

3 réponses pour l'instant

Pourquoi faut-il un bon échantillonnage pour reconstruire une phylogénie?

Posté par Timothée le 12 May 2008 | , , , , ,

Ne nous y trompons pas, je ne vais pas faire un billet long et exhaustif sur le sujet, ni même entrer trop dans les détails de comment on procède pour inférer une , c’est à dire les “liens de ressemblance”[1] entre les êtres vivants (et c’est bien dommage, mais je n’ai pas le temps… j’ai passé une demi heure à retrouver mon mac perdu sous 30cm de papiers qui jonchent mon bureau, ou presque). Je vais seulement illustrer par un petit exemple ce qui se passe quand on essaie de le faire à partir de trop peu d’espèces.

Je confesse que la préparation de ce billet ne m’a pas mangé trop de temps : j’ai ouvert mon fichier de séquences, j’en ai extrait 7, fait un arbre, et idem avec l’ensemble des séquences de mon petit genre à moi. Les séquences que j’ai pris sont celles du gène du 18S rRNA), parce que c’est le seul marqueur dont on dispose à l’heure actuelle — pour toutes les espèces, et c’est justement le point important de ce billet —, qu’il s’aligne bien entre espèces, tout en étant assez discriminant.

Pour information, les noms des espèces sont tronqués à 10 caractères, puisque le fichier de base est en format Phylip, qui impose cette restriction.

Quelques remarques avant de commencer : je n’avais pas le temps de me lancer dans une analyse très poussée, autrement dit, je n’ai pas bouffé du temps de calcul à déterminer le meilleur modèle, ni paramétré outre mesure PhyML[2], utilisé pour reconstruire les arbres[3]. Dès que j’aurais fini mon stage, je promet de consacrer un billet à expliquer comment j’aurais dû faire ces analyses dans les règles de l’art, en présentant en plus quelques outils bien libres, bien online, bien geeky.

Arbre avec 6 espèces et un extra-groupeLe vif du sujet, maintenant. Pour mon premier arbre, j’ai sélectionné de manière aléatoire ou presque (cliqué un peu au pif dans mes séquences) 6 espèces de Lamellodiscus, et l’extra-groupe (je reviendrai sur le billet sus-mentionné dans son rôle). D’un point de vue purement descriptif, on voit que deux groupes se forment (on laisse tranquille ‘D._aequans’, qui sert a enraciner l’arbre), comprenant chacun trois espèces. Les valeurs indiquées à la jonction de deux branches sont les valeurs de bootstrap. Plus elles sont proches de 1000, plus elles indiquent qu’on peut avoir confiance dans ce noeud. Par exemple, le noeud (L._knoeppf/L._ergensi), avec une valeur de 896 (89,6%) est relativement solide.

On va s’intéresser au groupe “du bas”, pour commencer, soit (L._elegans(L._drummon/F._echenei))[4]. On remarque que L._elegans est à la base de ce groupe, avec une valeur de soutien est 664 (ce qui est bien mais pas top, pourrait-on dire). Ce qui doit nous faire penser que L._elegans est “plus ancien” que ses deux comparses. Retenez bien cette information, c’est important pour la suite.

Dans le groupe du haut, maintenant, on voir que L._knoeppf et L._ergensi sont proches, et qu’a priori, au vu de la valeur de bootstrap, on peut avoir confiance en cette proximité.

Arbre completOn passe maintenant à l’arbre que j’ai patiemment reconstruit (ça reste assez passif comme méthode, l’algorithme de Guindon & Gascuel a fait le gros du travail), que vous pouvez voir à gauche de ce paragraphe. Si je n’avais pas été une parfaite feignasse — et que j’avais eu un peu plus de temps — j’aurais bien pu mettre les espèces du premier arbre en gras, mais vous pouvez toujours vous amuser à les chercher…

On va s’intéresser aux caractéristiques importantes de ce nouvel arbre, et surtout à la position de L._elegans. Et la surprise, au lieu d’être à la base de son groupe, il se retrouve en position terminale (4ème position en partant du haut). Comment est-ce possible? Facile, il a été victime de l’attraction des longues branches dans le premier arbre, et on a rompu cette attraction en ajoutant des taxons dans le second arbre[5]! Certains de reconstruction phylogénétique ont tendance à regrouper les espèces qui évoluent vite, partant du principe que plus on a accumulé de mutations, plus on a eu de temps pour le faire, ergo on va aller se brancher très près de la racine de l’arbre. Or, rien ne dit qu’on ne soit pas en train d’observer un taxon qui évolue rapidement, et qui dans le même temps que ses petits collègues, va accumuler 2, 3, 10 fois plus de mutations. Et pour le savoir, il est nécessaire de faire l’analyse en incorporant des taxons proches de celui qu’on suspecte avoir subi cette attraction.

Et de fait, dans notre cas, L._elegans n’est pas un taxon ‘ancestral’, mais bien un petit malin qui s’amuse a évoluer plus rapidement que ses petits camarades. Et la place de L._elegans en tant que racine du petit groupe contenant L._drummon/F._echenei est maintenant occupée par L._virgula[6].

De manière plus anecdotique, on remarque qu’entre L._ergensi et L/_knoeppf, qui étaient pourtant voisins dans l’arbre précédent, L._fratern est venu s’intercaler.

Que retenir de ce petit exemple?

D’une part, qu’une à laquelle il manque beaucoup de taxons est soumise à des artefacts de reconstruction, et donc n’a qu’une valeur toute relative.

D’autre part, que les valeurs de bootstrap ne signifient pas que le noeud est fiable : elles ne font que nous dire, qu’avec les données dont on dispose, ce noeud est robuste. Robustesse et fiabilité ne sont pas la même chose, et il faut y faire attention.

Tout ça pour dire qu’un travail de bon vieux naturaliste est nécessaire, pour caractériser au mieux la diversité des groupes qu’on étudie, mais qu’il faut aussi un travail important de séquençage, pour reconstruire des histoires évolutives les plus précises possibles. Ce que je m’empresse de retourner faire…

Notes

  1. A la différence de la “généalogie”, qui travaille sur les liens de parentés []
  2. J’ai utilisé la version locale, avec 1000 réplicats de bootstrap, une méthode qui permet de vérifier la “solidité” de l’arbre, ce qui a tendance a demander un temps de calcul assez important sur mon MacBook []
  3. Je m’en veux beaucoup, je pense que ça mérite amplement d’aller brûler en enfer pour plusieurs éternités tellement c’est un affront à ceux qui m’ont patiemment enseigné la []
  4. Furnestinia echeneis est un parasite d’un autre genre, mais qui d’un point de vue moléculaire appartient aux Lamellodiscus. Il a d’ailleurs été répertorié un peu vite comme Lamellodiscus echeneis par MarBEF. []
  5. C’est à ce moment la que j’avoue un léger dans mon échantillon de départ… Mais c’était pour le bien de ce billet! []
  6. Cet arbre n’est pas non plus totalement exhaustif, puisque je n’avais pas toutes les séquences de 18S dans mon fichier, et que je n’avais pas trop le temps d’aller chercher celles qui me manquaient sur GenBank []

Billets similaires

Pas de réponse pour l'instant

Variations environnementales structurées par la phylogénie et changements globaux

Posté par Timothée le 1 February 2008 | , , ,

Quand on observe, et c’est mon cas, la manière dont certains traits varient sous une contrainte environnementale, mais qu’on l’observe dans plusieurs espèces diffèrentes, phylogénétiquement proches, il faut être capable — dans l’idéal — de déterminer quelle part de la variation est liée à la , à l’, et au mélange de ces deux contraintes.

Or, on a un cadre conceptuel pour le faire. Alors que l’analyse comparative classique contrôle pour la variation liée à la , il était intéressant de prendre en compte les facteurs liés à la fois à la (les contraintes passées) et à l’ (les contraintes actuelles). C’est ce que Desdevises et coll. ont fait en 2003 (et qu’ils avaient déjà fait en 2002), en proposant de nommer cette partie de la variation “conservatisme phylogénétique de la niche”.

Ce cadre conceptuel permet de séparer la variation d’une variable dépendante (ce qu’on mesure, pour faire simple) en quatre classes : (a) liée à l’écologie, (b) conservatisme phylogénétique de la niche, (c) liée à la , (d) non expliquée (il y en a toujours un peu…).

Ce concept a été renouvelé tout récemment (janvier 2008) et appliqué à la réponse des espèces au changement global, par Diniz-Filho & Bini. Comment ça fonctionne, en clair? Regardez attentivement le schéma suivant.

En lecteurs attentifs que vous êtes, vous aurez remarqué que Diniz-Filho & Bini ont attribué des “conséquences” à chaque partie du partitionnement, qui expliquent les patrons obtenis dans la richesse spécifique et la structure des communautés. Il faut bien comprendre qu’on parle ici en terme de traits (phénotypiques) et d’espèces, et qu’on conceptualise les interactions…

En (a), de manière assez évidente, on retrouve les réponses phénotypiques locales : les espèces sont capables de s’adapter à leur nouvel , et les traits phénotypiques se modifient en conséquence. C’est la partie qui est totalement indépendante de votre passé évolutif, et celle qui semblerait (en première lecture) offrir le plus de liberté. Il n’en est rien, la contrainte phylogénétique peut être très forte.

Si les espèces concernées réagissent selon (a), elles s’adaptent en acquérant un nouveau trait.

En (b), le scénario concerne la répartiton des espèces sur les niches : soit les espèces peuvent modifier leur milieu de vie en réponse au changement (en changer est une solution attirante), soit elles ne le peuvent pas. On note au passage les deux possibilités : absence de dispersion mais aussi absence des environnements ancestraux.

Si on passe par la voie (b), et que les espèces concernées peuvent se déplacer, elles maintiennent leur trait ancestral (il y a de l’inertie phylogénétique).

En (c), enfin, on s’intéresse à la partie purement phylogénétique du trait considéré, qui revient à s’intéresser aussi au cas (b) pour les espèces ne dispersant pas. Plus le trait a une valeur adaptative dans la population (trait fitness), plus il a de chances de se maintenir, et de ne pas convenir au nouvel (et l’espèce s’éteint, au moins localement). Autre possibilité, le trait ancestral peut se maintenir dans un sub-optimum (”on peut mieux faire, mais on va faire avec”).

Ce cadre conceptuel permet de lier les patrons observés en terme de richesse spécifique et de structure des communautés, et des traits phénotypiques, aux contraintes (a, b, c). En d’autres terme, on peut analyser (et pourquoi pas prévoir) des éléments d’écologie actuels à partir de la , qui représente le “passé évolutif” d’une espèce.

Un peu de lecture

Yves Desdevises, Serge Morand, Pierre Legendre (2002) and determinants of host specificity in the genus Lamellodiscus (Monogenea) Biological Journal of the Linnean Society 77(4) pp. 431–443 [Google Scholar] (application de la méthode)

Yves Desdevises, Pierre Legendre, Lamia Azouzi, Serge Morand (2003) Quantifying phylogenetically structured environmental variation. 57(11) pp. 2647–2652 [Google Scholar] (premier papier décrivant la méthode)

José AF Diniz-Filho & Luis M Bini (2008) Macroecology, global change and the shadow of forgotten ancestors Global Ecology & Biogeography 17(1) pp. 11–17 [Google Scholar] (application aux changements globaux)

Billets similaires

12 réponses pour l'instant

Morphologie ou morphométrie?

Posté par Timothée le 26 January 2008 | ,

Une question qui revient souvent quand on me demande ce que je fais (et que je répond, pour abréger, de la ), c’est qu’est-ce que c’est la ?

La , c’est l’étude géométrique des organes. De la forme qu’ils ont, donc? Non, pas tout à fait. Etudier la forme, ça relève de la morphologie. Et ne mélangeons pas les torchons et les serviettes , ce n’est pas franchement la même chose.

La morphologie, ça consiste a regarder “simplement” la forme d’un organe. S’il est aplati, allongé, s’il présente des diverticules, ou que sais-je encore. On peut trouver des planches qui résument tout ça, on peut coder ces caractères dans une matrice, et faire pas mal de choses intéressantes avec.

Par exemple, dans la petite figure ci-jointes vous avez une description d’organes divers et variés (le même organe chez des espèces différentes).

Mais la alors? Globalement, ça part du même principe. On s’intéresse à la forme d’un organe. Mais au lieu de le décrire avec des “codes” (grand, petit, bosselé, tordu), on le mesure. Ou plus précisément, on prend une série de mesures dessus, mesures que toutes les personnes qui travaillent sur cet organe connaissent et respectent.

C’est ce qui est représenté sur la figure ci-jointe : on prend plein de mesures sur les organes qui nous intéressent, et à la fin, on a des résultats à peu près standard entre les équipes.

Se pose encore une question fondamentale : comment on prend ces mesures? On distingue deux , dont l’une a fini par prendre le dessus. La première, c’est l’approche par contours : on regarde le “profil” de l’organe qu’on étudie. Et c’est la méthode la moins utilisée. La deuxième est beaucoup plus répandue, il s’agit de l’approche par landmarks, ou points d’intérêt.

C’est ce qui est illustré sur la figure : on mesure la distance entre les points qui nous intéressent, et on reporte tout ça. Avantage? On peut s’affranchir des effets d’échelle, avec des subtilités mathématiques comme les coordonnées de Bookstein ou les distances procrustéennes, subtilités auxquelles il est évident que je ne comprend strictement rien (mais que, pour ma défense, je n’utilise pas).

Et la vous me posez la question qui tue : Pourquoi? C’est vrai quoi, t’es lourd, faut toujours que t’en fasse trop, ça te suffit pas de savoir la forme du truc?

Ben non. Parce que ces différences dont on parle, ces différences de forme, elles ne sont pas forcément flagrantes. Et surtout on ne peut pas faire de calcul dessus. De calcul de quoi? De distances bien sûr. Parce que des mathématiciens sont venus filer un sacré coup de main aux évolutionnistes, en regardant notre méthode et en nous disant : On peut calculer l’effort qu’il faut pour passer d’une forme à l’autre.

En gros, on peut savoir comment passer d’une forme à l’autre, quelle “énergie” ça demande, et vers quelles formes on peut partir ensuite.

Et puis surtout, si on se limite aux formes, on risque de louper des choses, des petites nuances, de légères variations, qui font qu’on est en fait en présence de morphotypes différents : on a des formes qui se ressemblent beaucoup, et d’après la fiche avec les morphologies, c’est la même chose; oui mais en fait, les distances sont très différentes, et on a “quelque chose d’autre” (je n’en dis pas plus).

Voilà, donc, la différence entre morphologie et . Vous pourrez passer pour quelqu’un de cultivé dans les cocktails. Ne me remerciez pas.

Billets similaires

Une réponse pour l'instant

Protocoles?

Posté par Timothée le 22 November 2007 | ,

J’ai souvent parlé, au cours de mes billets, de . C’est quoi, me demanderez vous, un ? Le truc qui explique comment manger les ferrero rocher chez l’ambassadeur? Presque. C’est ce que tout bon scientifique est sensé mettre au point scrupuleusement, penser, rédiger avec soin, et ne pas respecter du tout au moment de l’appliquer, en quelque sorte.

Science for Dummies?Un peu de praxis, pour commencer. La science, ça n’est pas que des caféinomanes échevelés avec des chemises à carreaux. Bon, soyons honnêtes, c’est un peu ça; j’en suis presque, sauf peut-être la chemise à carreaux. C’est aussi une approche qui repose sur un cycle assez simple que j’ai tenté de reproduire ici, en ajoutant justement les protocoles. On commence par se poser une question (en relation avec des précédents résultats), on définit sur quoi on va travailler pour la résoudre (ça c’est l’échantillon, le modèle, etc), et comment on va, dans la pratique, s’y prendre. C’est le . En réalité, et échantillon sont complètement imbriqués.

Et après avoir appliqué ce , on obtient des résultats, qui nous serviront à nous poser de nouvelles questions, enfin si notre demande de financement est acceptée et… je m’égare. Donc, le , c’est un guide par étape, un peu dans le même genre que pour programmer une machine à laver.

Dans la pratique, ça donne quelque chose comme:

  • Couler un gel d’agarose contenant des bactéries Micrococcus luteus sur une plaque de verre
  • Laisser polymériser
  • Percer des trous d’une contenance de 5µl à intervalle régulier
  • And so on

Et paf, à la fin, on a mesuré la concentration en lysozyme du mucus d’un poisson.

Mais comme vous l’aurez compris, un , ça ne tombe pas du ciel. La plupart du temps, on va emprunter celui des collègues en lisant la partie Matériels & méthodes des papiers sur le sujet. Il y a même des revues spécialisées dans les protocoles, comme Nature methods, ou des colloques qui y sont consacrés, auquel cas on se coltine les actes. Sauf que les autres équipes travaillent sur leur modèle, et que comble de malchance, ce n’est pas le notre. Il y a aussi des livres de référence pour chaque domaine, qui sont des compilations. Et encore une fois, ce n’est jamais le même modèle.

Alors quoi? On doit normaliser le . D’ailleurs, j’en profite pour glisser un mot à mes camarades étudiants : ne faites jamais partie du premier groupe pour un TP. Ja-mais. Et ça se fait comment, cette adaptation du à notre modèle?

Tout simplement en essayant diverses combinaisons. Avec les quelques lignes données plus haut, ce n’est pas flagrant, mais si on prend quelque chose comme

  • Laisser incuber overnight à 37,2°C en présence de X% de CO2 sous agitation avec N mL de solution A à 3M

Elles sont belles ces courbes, non? Je vous dirai plus tard de quoi il en retourne.On voit que les possibilités d’ajustement sont nombreuses. Mais nous sommes des gens persévérants, et on veut arriver à la case résultats de notre schéma précédent (la science est un genre de monopoly, sauf qu’il est plutôt rare de toucher les 20000€). Alors on fait des essais, et on compare les résultats de chaque combinaison de paramètres. Et on arrive au idéal pour notre modèle. Par exemple, sur l’exemple qui est donné, c’est la combinaison qui correspond à la courbe Bordeaux qui a été retenue, et avec laquelle les échantillons ont été analysés.

Et après? Déjà, on passe par la case résultats, et c’est bien. En plus, on fait une jolie partie Matériels et méthodes ou on décrit notre superbe . Comme ça, les gens pourront s’en inspirer pour leur modèle à eux. Ou alors, ils pourront regarder le et les données qu’il a généré, et se faire leur opinion. Ils pourront juger s’ils estiment qu’on a introduit un avec cette méthode. Et si ils trouvent notre idée vraiment géniale, ils auront de quoi le refaire chez eux (la réplicabilité) et c’est important.

J’ai quand même distingué et échantillonnage, et ça mérite un paragraphe. L’échantillonnage, c’est la collecte de “matériel biologique” (pour les biologistes au moins) sur lequel on appliquera le . Et ça suit une stratégie, pour éviter “l’effort d’échantillonnage”. Je l’ai distingué du , parce que pour moi (et ma formation de bon biologiste de base élevé au néon en labo de bio cell), = paillasse. Alors qu’échantillonnage, ça sonne plutôt “travail de terrain”. Et ça c’est cool.

Billets similaires

2 réponses pour l'instant

Next »