Billets Non classé

Rien ne sert de sélectionner, il faut dériver à  point

On a trop tendance à  rapporter l’évolution au simple phénomène de sélection naturelle, à  tel point qu’on tombe souvent dans une dérive sélectionniste importante. Tout ce qu’on observe est interprété en termes d’avantages sélectifs : si vous êtes meilleurs que les autres, vous vous imposez.

On a trop tendance à  rapporter l’évolution au simple phénomène de sélection naturelle, à  tel point qu’on tombe souvent dans une dérive sélectionniste importante. Tout ce qu’on observe est interprété en termes d’avantages sélectifs : si vous êtes meilleurs que les autres, vous vous imposez.

En terme de variants d’un gène, ça se traduit par si vous conférez une fitness relative supérieure aux autres allèles, vous vous fixez. Parce que la sélection agit.

Seulement ce n’est pas aussi simple, et même si la sélection joue, elle n’est pas le seul mécanisme. Traditionnellement, on considère quatre grands mécanismes par lesquels l’évolution se fait : mutation (qui génère la diversité), sélection (qui travaille avec cette diversité), mutation (qui apporte aussi de la diversité, créée des hybrides, etc), et dérive.

La dérive est un phénomène qui va brouiller un peu les cartes. En effet, ce qu’on appelle dérive génétique n’est jamais qu’un échantillonnage, à  chaque période de reproduction, des allèles présents dans une population.

Imaginons une population dans laquelle on a quatre allèles (quatre variants d’un gène), que l’on nommera sobrement a, c, t, et g, avec chacun des fréquences relatives dans la population de départ. Disons, pour simplifier, qu’ils sont équiprobable.

Le phénomène de reproduction consiste à  tirer, de manière aléatoire ou presque, des allèles dans la population, pour en recréer une nouvelle. Dans un billet précédent, j’avais modélisé le fait que, même quand les probabilités de transmission de ces allèles sont parfaitement équiprobables, on finissait par avoir fixation d’un d’entre eux, qui dominait la population (et on avait même poussé la simulation jusqu’à  déterminer qu’il fallait environ 2N pas de temps pour y parvenir, ou N est la taille de la population de départ).

Si les allèles se transmettent “autant”, c’est à  dire avec la même probabilité, on considère que le marqueur est “neutre”, c’est à  dire non soumis à  sélection (si ce n’était pas le cas, un allèle serait favorisé, et se transmettrait “mieux” que les autres).

Ce que nous allons modéliser ici est justement le fait qu’un allèle soit “meilleur” dans la compétition que ses petits camarades. Autrement dit, la chance qu’il a de se transmettre est plus grande que les autres.

C’est le moment ou vous vous dites qu’il n’y a probablement rien à  modéliser, puisque si cet allèle se transmet mieux, alors il sera fixé plus ou moins rapidement, et basta. Oui mais voilà , si c’était aussi simple, ça se saurait.

Pour faire simple, j’ai repris le modèle utilisé dans le billet précédemment cité, en modifiant simplement le fait que chaque allèle se transmette de manière différente. Soit p cette probabilité de transmission, on notera (pour faire croire en utilisant fourbement les mathématiques qu’on fait des choses compliquées) :

P(Tr{\mid}a)=p

et

P(Tr\mid\bar{a})=\frac{1-p}{3}=q

Ce qui signifie que la probabilité de se transmettre sachant qu’on est a est de p, et que la probabilité q de se transmettre si on n’est pas a est d’un tiers de 1-p. On peut vérifier que p+3q=1 d’une part, et d’autre part que p>q si p>1/4.

Autrement dit, pour toute valeur de p supérieure à  0.25, notre allèle a sera avantagé, et il le sera d’autant plus que p-q est grand. En fait, si p est égal à  1, il ne faudra qu’une génération pour n’avoir que des allèles a dans la population.

Ce cadre étant posé, on va pouvoir commencer à  se pencher sur les détails de la simulation. Il faut garder en tête qu’on travaille sur des événements d’échantillonnages aléatoires : les mêmes histoires avec lesquelles on vous a bourré le mou au lycée, de boules rouges et bleues dans un sac, avec ou sans remise.

Autrement dit, la taille de notre échantillon n’est pas un élément négligeable. Pour bien faire les choses, on va commencer avec une population de grande taille (pas grande au sens ou en l’entend en génétique des populations, mais je n’ai pas envie d’investir trop de temps de calcul), soit un n d’environ 1000 individus. Pour bien faire, on va comparer deux situations : N(a) = 1 et F(a) = 0.25, soit un seul mutant a dans le premier cas, et l’équiprobabilité des allèles dans le second cas.

Pour vous donner une idée de ce que ça représente chez l’humain, le premier cas (fréquence de 1/1000) revient à  ce qu’une mutation apparaisse simultanément chez environ 6 millions de personnes.

Point non négligeable, on considère que la taille de notre population est fixée (sinon il faudrait faire des calculs légèrement plus complexes, avec à  la fois des effectifs et des gènes, et des termes de fitness, et de belles équations pas forcément compliquées, mais ça n’apporte pas grand chose de plus en terme de compréhension ” ça peut en revanche changer les résultats pour les mutants à  faible fréquence, mais ce sera l’objet d’un prochain billet).

Notre grande question du jour est la suivante : est-ce toujours le meilleur qui gagne? Si oui, à  l’issue de chaque simulation, on s’attend à  observer à  avec une fréquence de 1.

Pour commencer soft, nous fixerons p à  0.3, soit un avantage pas tellement conséquent (a gagne 5% de chances d’être transmis). Vous avez ci-dessous deux résultats de cette simulation (par défaut, j’ai mis l’allèle avantagé en rouge, et la diversité totale en vert) :

simul1cas1simul1cas2

Comme vous pouvez le voir, dans le premier cas, la sélection fait son oeuvre, et notre allèle a culmine rapidement à  une fréquence de 1. Dans le second en revanche, on observe que cet allèle est éliminé dès le départ, et que c’est un allèle non optimum qui finira par se fixer dans la population.

Et d’ailleurs, plus la population est de petite taille, plus il est facile de fixer un allèle très mauvais (avec une valeur sélective de 0.1 dans l’exemple suivant) :

fixationdeletere

Pour conclure, on voit que si la sélection est importante, il ne faut pas négliger le fait que la dérive joue aussi un grand rôle, et que ce rôle est d’autant plus grand que la population est faible (on en fera une représentation plus graphique dans un prochain billet).

Note : Billet pas poussé aussi loin que voulu pour cause de revanche du monde microbien/viral (angine, bronchite, et début de grippe ) sur ma personne, plus à  venir sur ce sujet.

À propos de l'auteur

Timothée