CRDP

Accueil > Les numéros > DocSciences 8 : Le numérique et les sciences du vivant

Évolution et phylogénie

En cette année 2009, bicentenaire de la naissance de Darwin, comprendre l’évolution des organismes vivants reste un enjeu majeur de la biologie. L’étude de la transmission de l’information génétique bénéficie des apports de la théorie de l’information.

Si la vie n’existait pas il y a quatre ou cinq milliards d’années, aujourd’hui elle est presque partout présente, des sources chaudes à plus de 100 °C jusqu’aux glaces éternelles (enfin presque éternelles !) et sous des formes qui vont de la cellule isolée d’une bactérie jusqu’au baobab ou à la baleine. L’information génétique est au cœur du processus évolutif. Une révolution technologique, commencée au début des années 1970, fournit des données de plus en plus riches sur sa structure, son rôle et son évolution. La gestion et l’exploration de ces données ont joué un rôle moteur dans le développement de la bio-informatique, devenue un partenaire indispensable de la biologie. Aujourd’hui, un des enjeux majeurs est de comprendre comment les organismes vivants ont évolué depuis leur ancêtre commun Luca (acronyme de last universal common ancestor).

JPEG - 266 ko
Collection de papillons (© MNHN/Service audiovisuel)
Il existe entre cinq et cinquante millions d’espèces différentes ! Cette incroyable diversité résulte de l’évolution du vivant pourtant issu d’un ancêtre commun. On retrouve son empreinte dans le code génétique qui est quasi universel

Tous les organismes vivants sont issus d’une même cellule ancestrale, à travers un processus évolutif qui associe variations contingentes et sélections. Cette histoire commune est partiellement visible chez les espèces actuelles, tant au niveau des phénotypes qu’au niveau moléculaire. La disponibilité de très nombreuses séquences génomiques et protéiques a ainsi permis de renouveler les études phylogénétiques et a stimulé la conception de méthodes informatiques de reconstruction de la phylogénie des espèces. La connaissance des relations de parenté entre espèces permet, réciproquement, de mener, de façon raisonnée, des analyses comparatives entre plusieurs organismes, et de combler des lacunes sur un organisme en réutilisant les connaissances disponibles sur d’autres organismes mieux connus ou plus faciles à étudier

LES BASES DE LA GÉNÉTIQUE

L’information génétique utilise quatre motifs chimiques, appelés « bases » et dénotés par les lettres A, C, G, T. Par exemple, chez l’homme, c’est plus de trois milliards de bases qui s’organisent en quarante six chromosomes* et constituent ainsi le génome. Les bases successives sont liées chimiquement pour constituer un polymère, le brin d’ADN. De plus, il existe des affinités particulières entre des bases : A s’apparie avec T et C avec G. Cette complémentarité permet aux chromosomes d’adopter une structure particulière dans laquelle deux brins sont appariés pour constituer la double hélice. Les deux brins complémentaires contiennent la même information. Cette redondance est centrale dans les processus de réplication de l’information et de contrôle de sa validité : chaque cellule d’un organisme contient un exemplaire du génome. Quand une cellule se divise, le génome doit être répliqué : les deux brins se séparent, de nouvelles bases viennent s’apparier à ces deux brins libres pour former deux nouveaux brins, complémentaires des brins initiaux. Ceci permet la constitution de deux nouvelles doubles hélices identiques à la première.

Un mammifère est constitué de plusieurs dizaines de billions (1 billion = 1012) de cellules (de l’ordre de 1014 chez l’homme). Toutes ces cellules proviennent par division cellulaire d’une seule cellule, l’œuf (ou zygote), et chacune d’entre elles a nécessité une réplication du génome. L’origine de l’information génétique portée par le zygote est plus complexe, sa provenance est en effet double puisqu’elle implique les deux parents (pour simplifier, nous ne parlerons pas ici des étranges sexualités des microbes). Chaque individu porte deux copies de l’information génétique, l’une venant de sa mère et l’autre de son père. Pour participer à la génération suivante, il fabrique des gamètes qui sont des cellules très particulières, les seules qui ne contiennent qu’une seule copie de l’information génétique. Cette copie unique est constituée d’un mélange, au hasard, de fragments provenant des deux copies de l’individu.

La fusion d’un gamète mâle et d’un gamète femelle reconstitue une cellule avec deux copies. Le décor est maintenant planté, l’information génétique est décrite, de même que sa propagation à l’ensemble des cellules d’un individu d’une part et aux descendants de cet individu d’autre part. La question majeure peut à présent être posée : comment cette information a-t-elle évolué et comment évolue-t-elle encore actuellement ?

L’ERREUR : UN DES MOTEURS DE L’ÉVOLUTION

Si la réplication de l’information pendant la production des gamètes était parfaite, cette information ne se modifierait pas et donc n’évoluerait pas. Si au contraire la réplication comportait de nombreuses erreurs, le texte perdrait son sens et l’organisme n’y survivrait pas. Entre ces deux extrêmes s’est construit, au cours des milliards d’années de l’évolution biologique, une situation intermédiaire dans laquelle l’existence d’erreurs, les mutations*, permet une diversité autorisant l’apparition d’informations favorables, le taux d’erreurs restant suffisamment bas pour que l’existence d’informations inadaptées ne constitue pas un fardeau trop lourd pour les populations.

JPEG - 67.8 ko
Charles Darwin (1809-1882) en 1881 (Heritage Images/Leemage)

Ce qui apparaît extraordinaire est que ce modèle correspond à celui proposé il y a cent cinquante ans par Charles Darwin, alors qu’il ne connaissait rien de la notion d’information génétique. Malgré les progrès considérables des connaissances en biologie depuis la parution de son livre L’Origine des espèces, tous les faits, observations, résultats expérimentaux récents s’intègrent parfaitement à la vision évolutive de Darwin.

Ce modèle définit deux étapes : la production des mutations qui conduit à une diversité génétique, puis l’évolution de la fréquence de ces mutations au cours des générations successives. La fréquence d’une mutation augmente si elle est transmise à de nombreux individus de la génération suivante. Ainsi, si une mutation augmente la probabilité de son porteur d’avoir de nombreux descendants, sa fréquence va croître. On dira que cette mutation est « favorable » et qu’elle est « sélectionnée positivement ». Elle pourra même se « fixer » dans la population en devenant présente dans tous les génomes de cette population. Si au contraire une mutation conduit à diminuer le nombre de descendants de ses porteurs, elle sera « défavorable », sa fréquence décroîtra jusqu’à son élimination. Il est aussi possible que la mutation n’ait aucun effet sur les capacités reproductives des individus qui la portent, on parle alors de « mutations neutres ».


Lexique

Chromosome : Le génome est composé de plusieurs fragments, les chromosomes. Chacun contient, au sein d’une structure protéique complexe, deux brins d’ADN, succession de quatre nucléotides distingués par leurs bases, appariés sous forme de double hélice.

Mutation : Une erreur dans la réplication de l’information génomique peut échapper aux processus de correction et être transmise à un descendant. On dit alors que ce descendant porte une mutation correspondant à la base entachée d’une erreur.

En savoir plus

Livres :

  • Darlu P., Tassy P., La Reconstruction phylogénétique. Concepts et Méthodes, Masson, 1993, en téléchargement sur :
    http://lis.snv.jussieu.fr/sfs/publications_sfs.shtml
  • Lecointre G., Le Guyader H., Classification phylogénétique du vivant, Belin, 2006.
  • Lecointre G. (ss dir.), Comprendre et enseigner la classification du vivant, coll. « Guide Belin de l’enseignement », Belin, 2008.
  • Le Guyader H., Classification et évolution, coll. « Le collège de la cité », Le Pommier, 2003.
  • Mayr E., AprèsDarwin. La biologie, une science pas comme les autres, coll. « Quai des sciences », Dunod, 2006.
  • Perrière G., Brochier C., Concepts et méthodes en phylogénie moléculaire, coll. « Iris », Springer, 2009.