Introduction à la métagénomique

Featured

meh-ro10795
Le microbiote et la métagénomique sont les deux mots tendances de ces dernières années dans les laboratoires de microbiologies. Derrière eux se cacherait les réponses à de nombreuses maladies maladies comme le diabète, la maladie de Crohn et même l’autisme ou la schizophrénie.
Commençons donc par définir ces deux termes:
– Le microbiote est l’ensemble des micro-organismes (bactéries, virus, champignons, levures) vivants dans un environnement spécifique appelé microbiome. L’exemple typique est le microbiote intestinal. Votre intestin est composé de millions d’espèces bactériennes différentes formant une communauté écologique en symbiose avec votre organisme et nécessaire à son bon fonctionnement. Il joue entre autre un rôle de barrière vis-à-vis d’autres agents microbiens pathogènes. La destruction du microbiote intestinal par des antibiotiques est par exemple responsable des infections intestinales par Clostridium difficile.
Pour vous prouver l’importante du microbiome, retenez que le génome humain est composé d’environ 23 000 gènes. Le nombre de gènes retrouvés dans l’ensemble des micro-organismes du microbiome intestinal se compte en millions.
– La métagénomique est la méthode d’étude du microbiote. C’est une technique de séquençage et d’analyse de l’ADN contenu dans un milieu. A l’inverse de la génomique qui consiste à séquencer un unique génome, la métagénomique séquence les génomes de plusieurs individus d’espèces différentes dans un milieu donné. Une analyse typique de métagénomique vous donnera la composition d’un microbiome. C’est à dire quelles espèces sont présentes, leurs abondances et leurs diversités.
C’est en partie grâce à l’évolution majeure des technologies de séquençage haut débit et à la bioinformatique, que la métagénomique est aujourd’hui à notre portée.
Dans la suite de cet article, nous verrons uniquement la métagénomique bactérienne, plus particulièrement la métagénomique ciblé sur l’ARN 16S. Mais gardez bien en tête que les métagénomiques virales et mycotiques, bien que plus rares, existent aussi.

Stratégie en métagénomique

Il existe deux grandes stratégies de séquençage en métagénomique : la stratégie globale et la stratégie ciblée.
  • La métagénomique globale consiste à fragmenter tous les ADNs présents dans un échantillon en courts fragments et les séquencer à l’aide d’un séquenceur haut débit. D’où le nom de Shotgun sequencing. Les séquences (ou reads) obtenues sont ré-assemblées bioinformatiquement afin de reconstruire les génomes bactériens d’origine.
Stratégie globale : L’ensemble des ADNs présents dans un échantillon de microbiote sont séquencés.
  • La métagénomique ciblée n’est pas de la métagénomique à proprement parler, mais de la métagénétique. Cette stratégie consiste à séquencer un unique gène au lieu d’un génome complet. Cependant le terme de métagénomique étant plus régulièrement employé pour décrire cette stratégie, je continuerai ainsi. Ce gène doit être commun à plusieurs espèces tout en présentant des régions suffisamment variables afin de discriminer une espèce. En bactériologie, le gène utilisé est celui de l’ARN 16S. Il s’agit d’un gène présent uniquement chez les bactéries.
Stratégie ciblé : Seuls les ADNs du gène cible sont séquencés. En bactériologie, le gène cible est l’ARN 16S.
Chaque stratégie a son avantage. La métagénomique globale est plus précise dans le sens où elle séquence l’ensemble du génome d’une bactérie alors que la seconde ne s’intéresse qu’à un seul gène. Cette première stratégie permet par exemple de décrire le fonctionnement global du microbiote en séquençant l’ensemble des gènes présents.
La stratégie ciblée est quant à elle plus sélective. En effet, le gène de l’ARN 16S est présent uniquement chez les bactéries qui seules seront séquencées. La stratégie globale va séquencer tous les ADN présents dans le milieu sans discernement, qu’ils soient bactériens, viraux ou encore humains.
Enfin, les algorithmes de traitements des données issues d’un séquençage ciblé sont beaucoup plus simples que les assemblages de génomes nécessaires dans le séquençage global. Pour comprendre cette complexité, essayez de mélanger toutes les pièces de 200 puzzles différents et tentez de retrouver les modèles originaux. C’est la problématique de la métagénomique globale.
On ne s’intéressera ici qu’à la stratégie 16S, utilisée en bactériologie. C’est un bon point de départ pour commencer !

L’ ARN 16S

Vous connaissez les ribosomes ? Ces petits organelles dans la cellule formés de deux sous-unités permettant la traduction de l’ARN en protéine. Et bien chez la bactérie, et uniquement chez elle, la petite sous unité est formée de l’ARN 16S.
Structure secondaire de l’ARN 16S avec ses différentes boucles.
Il s’agit d’un ARN non codant composé d’environ 1500 nucléotides possédant des régions constantes et variables. Il suffit d’aligner la séquence d’ARN 16S de différentes espèces bactériennes pour s’en rendre compte. Comme vous pouvez le voir sur la figure ci-dessous, certaines régions sont constantes entre les bactéries alors que d’autres régions sont variables.
Similarités des séquences d’ARN 16S entre plusieurs bactéries. Sous le graphique figurent les différents couples d’amorces utilisables.
Les régions variables n’ont pas de rôle fonctionnel important et peuvent diverger au cours de l’évolution sous l’effet des mutations neutres.
C’est ce qui va nous permettre de discriminer les taxons bactériens au sein du microbiome. A chaque taxon correspondra une séquence particulière au niveau des régions variables. Il s’agit de la signature du taxon.
Les régions constantes vont permettre quant à elles de capturer l’ensemble des ARN 16S. Ces régions étant identiques chez toutes les bactéries, il est possible de construire des amorces comme pour une PCR afin de sélectionner la région d’intérêt.
En réalité, seule une partie de l’ARN 16S est séquencée car les séquenceurs haut débit ne peuvent pas séquencer d’un coup les 1500 nucléotides de l’ARN 16S (enfin… sauf le Pacbio). Le couple d’amorce V3-V5, que vous pouvez voir sur la figure 3, permet par exemple de séquencer une région de 500 nucléotides contenant 3 régions variables.

Assignent taxonomique

Une fois le séquençage réalisé, c’est au tour des bioinformaticiens de prendre le relais. Un fichier contenant l’ensemble des reads (séquences) est obtenu après séquençage. Après plusieurs étapes de filtrage et de nettoyage de ces données, il faut assigner à chaque séquence le nom de la bactérie. Pour cela, deux stratégies existent.
  • La stratégie close-reference consiste à comparer chaque séquence aux séquences présentes dans une base de donnéees avec un seuil en général de 97% de similarité. Greengene, Silva et RDP sont les bases de données d’ARN 16S les plus connues. Cette stratégie a le mérite d’être rapide mais son principal problème est d’ignorer les séquences absentes des bases de données. Pour palier à ce problème, la deuxième stratégie peut être utilisée.
Stratégie 1. Chaque séquence est recherchée dans une base de données et assignée à son taxon.
  • La stratégie appelée de novo, n’utilise pas de base données mais consiste à comparer les séquences entre elles puis les regrouper par similarité. Les clusters ainsi formés élisent une séquence consensus qui peut à son tour être annotée par une base de données ou rester comme telle définissant alors une espèce inconnue.
Stratégie 2. Les séquences sont comparées entre elles pour former des groupes similaires ou clusters.
Une fois l’assignation taxonomique réalisée, il suffit de compter le nombre d’espèces présentes dans chaque échantillon et de construire la table des OTUs.

La table des OTUs

Le point de départ de toutes analyses en métagénomique est la construction de la table des OTUs (operationnal taxonomic unit). La notion d’espèce est difficile avec les bactéries, on parle plutôt d’OTU pour définir un ensemble de bactéries similaires à plus de 97 %.
La table des OTUs est un tableau à double entrées contenant le nombre de séquences par OTU et par échantillon. On parle d’abondance. Ces abondances absolues sont normalisées afin de rendre les échantillons comparables. Plusieurs méthodes de normalisation existent, mais la plus courante est d’utiliser les pourcentages. Sur la figure ci-dessous, les échantillons 1 et 3 ont tous les deux une abondance absolue de 3 en bactéries rouges. En pourcentage, leurs abondances relatives deviennent 42,8 % et 75 % respectivement.
Tables des OTUs obtenues à partir de plusieurs échantillons

Analyse des données

Diversité Alpha

La diversité alpha est une mesure indiquant la diversité d’un échantillon unique.
Le nombre d’espèce est par exemple un indicateur d’alpha diversité.
B est plus diversifié que A car il contient deux fois plus d’espèces
Mais comme vous pouvez le voir dans la figure ci-dessous, Le nombre d’espèce n’est pas toujours adapté. C’est pour cette raison que d’autres indicateurs existent.
B contient plus d’espèce mais semble moins diversifié
L’indice de Shannon ou entropie de Shannon est un exemple d’alpha diversité répondant à ce problème. Cette indice reflète aussi bien le nombre d’espèce que leurs abondances. Sa formule est la suivante :
Indice de Shannon. Pour chaque espèce faire la somme des fréquences multiplié par le log des fréquences
La figure A précédente contient 13 espèces, dont 4 vertes, 5 rouges et 4 bleues. La diversité de shannon pour A est donc :
En faisant de même pour B, on retrouve alors une diversité plus faible de 0.72.
L’entropie de A est supérieur à celle de B
Les autres indicateurs répondent chacun à des problèmes différents. L’indice Chao1 estime le nombre d’espèce réel dans l’environnement à partir du nombre d’espèce dans l’échantillon. Il y a aussi l’indice de Simpson, de Fisher et l’indice ACE. Faite un tour sur ce site pour avoir plus des informations plus détaillées.
Le graphique ci-dessous montre les différences de diversité alpha du microbiote intestinal en fonction du régime alimentaire.
Diversité alpha du microbiote intestinal en fonction du régime alimentaire.
Source

Diversité Beta

La diversité bêta consiste à mesurer la diversité des espèces entre les échantillons. On procède le plus souvent à l’analyse multivariée de la matrice des OTUs en ayant recours aux méthodes d’ordinations comme l’analyse en composantes principales. Pour faire simple, imaginons que notre table des OTUs soit composée de 2 bactéries et 6 échantillons. La représentation sur un graphique serait facile en utilisant 2 axes (1 par bactérie). Chaque point de ce graphique serait un échantillon dont les coordonnées représentent l’abondance pour chaque bactérie. La figure de gauche ci-dessous illustre cet exemple. En colorant ces points sur une variable attachée aux échantillons, comme le site de prélèvement, on pourrait découvrir des groupes distincts, comme l’illustre la figure de droite.
Chaque point représente un échantillon réparti sur les deux axes en fonction de leurs abondances. Certains échantillons semblent associées entre eux.
Bien entendu, il y a plus de deux bactéries différentes dans un microbiome. Ce qui nécessite un nombre d’axe impossible à représenter graphiquement. Les méthodes d’ordination répondent à ce problème en projetant la variabilité de tous ces axes sur 2 axes pouvant être visualisés.
L’analyse en composantes principales (ACP) est un exemple d’ordination. Il en existe bien évidemment d’autres. La plus couramment utilisée en métagénomique est une jumelle de l’ACP, l’analyse en coordonnées principales (PCoA) que je ne détaillerai pas.
Une fois la représentation réalisée, on cherche alors des groupes de points et la variable explicative que l’on visualise à l’aide d’une couleur. Sur la figure ci-dessous, l’analyse de plusieurs échantillons provenant de différents sites anatomiques révèle les compositions propres à chaque site.
Analyse en composantes principales de différents échantillons microbiens provenant de différents sites anatomiques.
Source

Conclusion

La métagénomique est un sujet complexe en plein essor qui nécessite une connaissance précise des différentes techniques pour éviter tout écueil. De nombreux biais peuvent intervenir à toutes les étapes, tant du coté biologique que bioinformatique. D’ailleurs, l’assignation taxonomique que je décris dans cet article reste simple et naïve. D’autres méthodes plus complexes mais valables statistiquement sont préférables. Par exemple la méthode dite de « Minimum Entropy Decomposition » permet de classer les OTU en s’abstenant du seuil théorique des 97 %.
Enfin, si vous voulez approfondir la métagénomique, je vous invite très fortement à regarder les vidéos de Dan Knights (un dieu en métagénomique) disponibles sur YouTube!

Références

Remerciements

@Thibaud_GS
@Piplopp
@pausrrls
@Oodnadatta Continue reading

Des conséquences insoupçonnées du réchauffement climatique

Featured

phoca_hispida
L’augmentation de la teneur en CO2 atmosphérique et le réchauffement climatique rapide qui en découle, on en parle beaucoup, un peu partout… et on a bien en tête certaines conséquences auxquelles, il faut d’ores et déjà se préparer telles que… Read more → Continue reading

Sélection scientifique de la semaine (numéro 245)

– Il n’aura échappé à personne que l’information de la semaine était la victoire de Donald Trump à l’élection présidentielle américaine. Que cela signifie-t-il pour la science aux Etats-Unis ? Voici l’analyse de la revue britannique Nature, celle du Washington Post et … Continuer la lecture
Continue reading

La système immunitaire

  Dossier préparé et présenté par Irène au cours de l’épisode 262. Intro Imaginez-vous une douce nuit d’été, vous êtes allongé dans l’herbe d’un bel alpage, tout est calme et silencieux. Vous regardez le ciel. Vous regardez cette myriade d’étoiles dans ce ciel qui nous paraît si grand. Il nous paraît immense, calme, sans bruit […]
Continue reading

Sélection scientifique de la semaine (numéro 243)

– Le Groenland, ce « pays » qui fond. Une enquête-reportage au long cours d’Elizabeth Kolbert, du New Yorker. (en anglais) – Accord international pour bannir les hydrofluorocarbures (HFC), des gaz réfrigérants à l’effet de serre surpuissant. – Qu’est-ce qui a tué 10 000 grenouilles géantes … Continuer la lecture
Continue reading

Sélection scientifique de la semaine (numéro 231)

– Une nouvelle sorte d’antibiotique découverte… dans le nez ? (en anglais) – Aux Etats-Unis, les conventions républicaine et démocrate ont officiellement désigné les candidats pour l’élection présidentielle de novembre. Le moment de s’interroger sur les positions de Donald Trump … Continuer la lecture
Continue reading

Rétrovirus, Placenta et Créationnisme

Featured

Retrovirus2
Environ 8% de notre génome est d’origine rétroviral. Si la plupart de ces séquences d’origine virale appelées Rétrovirus Endogènes (ERVs), sont sans conséquences, certaines ont littéralement bouleversé l’évolution du vivant. C’est notamment aux rétrovirus que nous devons notre placenta. Mais comment les ERVs participent-il à l’élaboration de notre placenta? Et pourquoi revenir sur un énième […]

Rétrovirus, Placenta et Créationnisme

Comme vous le savez probablement déjà, environ 8% de notre génome est d’origine rétroviral, il s’agit des Rétrovirus Endogènes ou ERV (Endogenous Retrovirus). Si vous ignorez ce que sont les Rétrovirus Endogènes et quelles sont les origines de ces derniers je vous conseille la vidéo suivante.
 
Notez que dans le présente vidéo ils francisent également l’acronyme ERV (Endogenous Retrovirus) et le renomment RVE (Rétrovirus Endogène).

Bien et maintenant que vous savez ce qu’est un ERV (ou RVE) et accessoirement en quoi ils sont un formidable outil pour démontrer l’ascendance commune des différentes espèces, attaquons le vif du sujet, à savoir le rôle de certains ERV dans l’évolution de notre placenta.

Protéine virale et placenta

En effet une partie des rétrovirus endogènes acquis durant la longue évolution des mammifères ont été coopté pour l’élaboration du placenta. Certains ERVs contribuent ainsi à avoir une fonction immunosuppressive, fonction indispensable car sans elle le système immunitaire de la mère attaquerait l’embryon. Mais dans le présent article nous allons nous intéresser plus en détail à des ERVs qui permettent de synthétiser une protéine indispensable au placenta des mammifères que nous sommes, à savoir la Syncytine. La Syncytine dérive d’une protéine env, c’est-à-dire d’une protéine de l’enveloppe virale des rétrovirus. Les gènes viraux codant cette protéine se sont ainsi insérés chez les mammifères marsupiaux et euthériens qui ont ainsi acquis la capacité de synthétiser cette fameuse Syncytine [1]. Cette dernière permet aux cellules du placenta de fusionner entre elles (on parle d’activité fusogène) permettant l’établissement d’un syncytium, un tissu constitué de cellules à plusieurs noyaux (car issues de la fusion de plusieurs cellules) présent à l’interface materno-fœtale, et indispensable au bon fonctionnement du placenta de nombreux mammifères (dont celui des humains).
Diagramme 1. Diagramme d’une glycoprotéine d’enveloppe rétrovirale (a) Structure de la protéine d’enveloppe rétrovirale avec les sous-unités SU et TM, le peptide de fusion et le domaine immunosuppresseur. (ISD). (b) Les conséquences de l’interaction entre une protéine d’enveloppe rétrovirale et de son récepteur apparenté. (i) Cas d’une infection rétrovirale, le rétrovirus utilise sa glycoprotéine env pour engager une fusion membranaire avec la cellule cible et ainsi inséré son matériel génétique à l’intérieur de la cellule. (ii) Cas de fusion cellulaire, La cellule porteuse de la glycoprotéine d’origine virale (syncytine) entre en contact avec une autre cellule, la glycoprotéine permet là aussi une fusion des enveloppes et donc ici une fusion de deux cellules, et donc la formation d’un syncytium, cellule à deux voir plusieurs noyaux. (ii). (c) La fusion de cellules humaines et la formation de syncytia multi-nucléaires (processus similaire menant à la formation du syncytium) induite par transfection de cellules TE671 humaines par un vecteur d’expression syncytine-2. À vue de nez le scénario est donc simple, l’ensemble des mammifères ayant un placenta avec syncytium, dérive d’un ancêtre commun ayant acquis un ERV dont le gène env à par la suite été coopté pour l’élaboration des dits syncytium que nous connaissons. Sauf que l’histoire est en réalité bien plus complexe. Plus complexe car d’une part il existe au moins quatre grands types de placentas. Il y a le placenta du type hémochorial (comme chez les humains) avec un syncytium bien constitué et une forte activité fusogène, le placenta de type endotheliochorial, différent du précédent type mais présentant lui aussi une activité fusogène importante et un syncytium, le placenta synepitheliochorial, propre aux ruminant et présentant une activité fusogène réduite et enfin le placenta épithéliochorial dépourvu de syncytium (voir diagramme 2). Le deuxième point complexifiant l’évolution des placentas est que la distribution des quatre types de placenta susmentionnées au sein des grands clades des mammifères, ne correspond pas à l’apparentement phylogénétiques de ces derniers (voir diagramme 2). Mais les choses deviennent plus claires lorsque l’on analyses les ERVs codant la Syncytine.

De multiples ERVs

En 2013 une équipe de chercheurs français publie une étude des plus intéressantes sur les ERVs impliqués dans le développement du placenta chez les mammifères. [2] Les chercheurs mettent à jours non pas un mais de multiples ERVs impliqué dans la synthèse de Syncytine et donc dans le développement du placenta. Mais plus fort encore ils déterminent que les ERVs en question ne sont pas les mêmes dans tous les clades de mammifères. Par exemple un des ERV synthétisant la Syncytine chez les carnivore comme les chiens et les chats n’est pas du tout le même que ceux synthétisant la Syncytine chez les primates. Mieux souvent ces ERVs ont une origine relativement récente, par exemple les ERVs impliqués dans la synthèse de Syncitine chez les primates datent d’il y a moins de 50 millions d’années. Soit beaucoup plus tard que l’apparition des premiers mammifères placentaires.
Diagramme 2. Diagramme présentant la capture de plusieurs ERVs codant la syntycine au cours de l’évolution de grands clades de mammifères, ainsi que l’arbre phylogénétique de ces clades, et les différentes structures placentaires au sein de ces derniers. (a) Arbre phylogénétique de quatre clades majeurs d’Euthériens (I) Afrotheria, (II) Xenarthra, (III) Euarchontoglires et (IV) Laurasiatheria, nous avons également les clades de mammifères plus basaux que sont les marsupiaux et les monotrèmes. Les quatre types de développement placentaires sont représentés par des carrés de couleurs (chaque couleur correspond à une boîte de la même couleur encadrant chaque type de placenta à droite du présent diagramme). Les triangles violets placés sur l’arbre phylogénétique, représentent les événements d’acquisition des différents ERVs codant la Syncytine répertoriés par cette étude (d’autres ERVs similaires existent également au sein des lignées où ils ne sont pas mentionnés ici, mais ils n’ont simplement pas été répertoriés par la présente étude, rapelons qu’une autre étude fait état de pareils ERVs chez les marsupiaux [1]), chez les différents clades de mammifères. (b) Enfin toute à droite du présent diagramme nous avons quatre cadres contenant chacun un type de développement placentaire différent (rappel la couleur des cadres correspond aux couleurs des carrées à l’extrémité de l’arbre phylogénétique).

De Multiples infections rétrovirales.

À partir de là le scénario évolutif des mammifères s’éclaire davantage. Premièrement rappelons que l’acquisition du placenta remonte au lointain ancêtre commun des mammifères marsupiaux et euthériens (les monotrème demeurant ovipares). Cette acquisition originelle du placenta a peut-être (voir probablement ) été possible grâce a l’endogénéisation d’au moins un premier rétrovirus ancestral ayant permis l’acquisition d’une fonction immunosuppressive ayant rendu possible la tolérance de l’embryon et du fœtus par son hôte maternelle. Mais par la suite les rétrovirus continuèrent d’influer massivement l’évolution du placenta. Car alors que les mammifères se diversifiaient, ils continuèrent d’intégrer divers ERVs dont beaucoup furent cooptés pour leur Syncytine. Or l’impact des infections virales explique très probablement pourquoi le placenta est l’organe le plus variable parmi les mammifères (voir le diagramme 2 ainsi que l’étude de LAVIALLE et al 2013 [2]). En effet les divers placentas des diverses lignées de mammifères n’ont cessés d’évoluer au grès des diverses infections virales qui n’ont cessé de favoriser une forte divergence des diverses structures placentaires. Par ailleurs  un mammifère donnée même s’il possède déjà une activité fusogène lié à un ERV (appelons le ERV1), peut également au cours de son évolution acquérir un autre ERV (appelons le ERV2) synthétisant lui aussi de la Syncitine et étant lui aussi fusogène. Ce nouvelle ERV participant à son tour à une modification d‘un placenta avec fusion des cellules. La lignée de mammifère ainsi concerné coévoluant avec ses hôtes d’origine viral. Le truc c’est qu’au cours de l’évolution l’ERV1 peut donc devenir obsolète et perdre son activité (devenir un des multiples ERV fossiles) voir disparaitre, ne laissant plus que l’ERV2 en activité. [3] Nous pouvons illustrer ce scénario via le digramme suivant.
Diagramme 3. Prenons l’exemple d’une lignée de mammifères possédant déjà un ERV1 doté d’un gène codant la syncytine (A). Un jour un nouveau rétrovirus infecte les cellules germinales d’un membre de cette espèce (B), le rétrovirus va subir une endogénéisation et ainsi donner naissance à l’ERV2 (C) dont le gène env est lui-même devenu un gène permettant la synthèse de la Syncytine, les gène gag et pol ayant de l’ancêtre virale de l’ERV ayant été quant à eux désactivé. Suite à l’arrivée de l’ERV2, le gène de la Syncytine de l’ERV1 est désactivé par une mutation, si bien qu’au final la lignée de mammifère en question ne conserve que la Syncytine de l’ERV2, l’ERV1 étant devenu un ERV fossile sans fonction aucune (D).

C’est ainsi que de nouveaux ERVs coopté pour la synthèse de la Syncytine, mais aussi pour d’autres fonctions, n’auraient cessé d’envahir le génome des mammifères, les nouveaux venus remplaçant parfois les anciens. De plus les ERVs codant la Syncytine différent sensiblement les uns des autres, se logent dans différentes parties du génome et évoluent de manières différentes avec leurs hôtes, expliquant ainsi la forte diversification des placentas chez les mammifères (voir le précédent diagramme)

Puis arrivèrent les créationnistes

Ben oui nous avons ici une étude élucidant une part importante de l’évolution des mammifères, il fallait bien que les créationnistes y amènent leur grain de sel. À savoir ici la créationniste Anne Gauger qui nous explique que cette étude met à mal la théorie de l’évolution car remettrait en cause l’ascendance commune des mammifères, rien que cela! Son «raisonnement» est le suivant:
«Ce que nous avons à expliquer est la cooptation, indépendante, spécifique et unique à chaque groupe de Syncytines pour une fonction qui est essentielle pour le développement placentaire, une caractéristique commune à tous les groupes de mammifères. Six origines indépendantes pour le placenta! Il n’y a aucune preuve d’une grande Syncytine ancestrale partagée par tous les groupes qui a ensuite été remplacé par d’autres Syncytines, donc l’explication de l’ascendance commune du placenta chez les mammifères échoue.» Ann Gauger
À cela je réponds «Bullshit»! Bullshit car les auteurs de l’étude n’affirment pas que le placenta ancestrale avait dès le départ une Syncytine (objectivement rien n’est sûr de ce côté là). Bullshit car comme je l’ai précisé plus haut, l’étude en question explique pourquoi les ERVs synthétisant la Syncytine ne sont pas les mêmes au sein des différentes lignées de mammifères, à savoir la répétition des insertions rétrovirales et le remplacement d’anciens ERVs par de nouveaux et qu‘il n’est donc pas question dans cette étude de six origines indépendante du placenta. Bullshit aussi parce que l’étude à même la preuve de ce qu’elle affirme à ce titre je cite l’étude en question.
«Une conséquence de ce modèle est l’existence d’éléments attestant de Syncytines perdus chez les mammifères euthériens et c’est précisément ce qui fut trouvé dans une récente étude d’un autre gène de protéine d’enveloppe virale, qui appartient un provirus HERV-V, nommé envV, et qui est également exprimé dans le placenta humain, et dont le rôle putatif dans la formation du placenta humain reste à étudier, car il a été constaté que ce gène n’a pas d’activité fusogène. [67]. En fait, ce gène env est entré dans le génome des primates en concomitance avec le gène syncytine-2, qui est, âgé de plus de 45 Ma comme inféré de son présent rôle chez les primates. Fait intéressant, il a été montré récemment que le gène (le gène envV) est fusogène chez les cercopithécidés (Old World Monkeys), où il se comporte probablement encore comme une véritable syncytine, alors que son activité fusogène semble avoir été perdu chez les primates supérieurs (y compris chez les humains) ainsi que chez certains singes du Nouveau Monde [68].»  LAVIALLE Christian et al

Dit autrement nous avons ici l’exemple d’un ERV (le gène envV) qui a conservé son activité fusogène chez certaines espèces mais l’a perdu chez d’autres, ce qui confirme le modèle évolutif des ERVs des auteurs. Mais bien évidemment Ann Gauger passe très malhonnêtement sous silence ce passage clé de l’étude en question pour tenter de faire passer sa narration voulant que la multiplicité des ERVs chez les mammifères réfutent l’ascendance commune de ces derniers.

Mais pourquoi mentionner cette créationniste?

Ben oui était-ce vraiment nécessaire de mentionner une énième distorsion malhonnête venant de créationniste ? Je pense que cela est nécessaire car permettant de rappeler les ficelles d’une stratégie de propagande créationniste bien connue, à savoir la capacité à désinformé les gens en faisant croire que la position créationniste est scientifique. Une personne mal-informée pourrait penser que les créationnistes ont en fait la science de leur côté car citant des études qui apparemment démontrent la validité de leur position antiévolutionniste. Et souvent les créationnistes du «Discovery Institute» privilégient des études comme celles discutées dans le présent topic, à savoir des études qui traitent de sujet ma foi, déjà passablement complexes et qui ne sont pas forcément comprises par un profane non initié à ces thématiques. Dès lors il est toujours utile de démonter cette stratégie créationnistes particulièrement malhonnête et méprisable sur le plan intellectuelle puisque consistant à faire die à des études ce qu’elles ne disent pas via le «Quote Mining», le mensonge par omission et autre distorsions. Et bordel à titre personnelle je trouve particulièrement ignoble de distordre des études aussi fascinantes et riche d’enseignement pour faire passer un agenda idéologique moisi visant à abrutir les gens. Je ne comprendrais jamais comment ces personnes font pour ne pas avoir honte ça dépasse mon entendement.  Notes et Références: [1] Et oui les marsupiaux ont également deux types de placenta qui leur sont propre et ont également acquis des ERVs permettant la synthèse de Syncytine indépendamment de leurs cousins placentaires. CORNELISA Guillaume et al (2015), Retroviral envelope gene captures and syncytin exaptation for placentation in marsupials, Proceedings of the National Academy of Sciences [2] LAVIALLE Christian et al (2013), Paleovirology of ‘syncytins’, retroviral env genes exapted for a role in placentation, Philosophical Transactions of the Royal Society [3] Environ 85% des ERVs de notre génome sont en fait des ERVs fossiles dépourvus de séquences codantes et très probablement pour la plupart sans fonction aucune pour l’organisme, voir KATZOURAKIS Aris, RAMBAUT Andrew and PYBUS Olivier G (2005), The evolutionary dynamics of endogenous retroviruses ,TRENDS in Microbiology
Vidéo Bonus

Continue reading

Le dépistage prénatal non-invasif de la trisomie 21

Featured

Wallpapers Market
La trisomie 21 est un syndrome polymalformatif avec un retard mental, lié dans la majorité des cas à la présence d’un chromosome 21 surnuméraire. On a tous en mémoire l’image de l’acteur Pascal Duquenne atteint de ce syndrome et lauréat du prix d’interprétation au festival de Cannes pour le film le Huitème jour.
En France, le dépistage de la trisomie 21 est proposé à toutes les femmes enceintes au 1er trimestre de grossesse. Ce dépistage consiste à calculer un score en fonction de marqueurs sanguins (AFP, Papp-A, beta HCG) et des signes d’appel échographique comme la clarté nuccale. Si ce score dépasse un certain seuil, un diagnostic cytogénétique est proposé pour confirmer la trisomie. Il consiste à prélever des cellules fœtales par des techniques invasives comme l’amniocentèse et de dénombrer le nombre de chromosomes sur un caryotype comme illustré ci-dessous.
Caryotype présentant 3 chromosomes 21 au lieu de 2
Malheureusement ces gestes invasifs ne sont pas anodins. On estime entre 0.5% et 1% le risque de fausse couche lié à l’amniocentèse.
Cela peut sembler faible, mais le dépistage actuel souffre d’une très mauvaise spécificité. C’est à dire que beaucoup de femmes répondent positif au dépistage alors que leur fœtus est indemne. Par conséquence beaucoup trop d’amniocentèses sont réalisées inutilement avec le risque de fausse couche qui en découle.
Mais depuis l’avènement récent du séquençage haut débit, un nouveau test de dépistage beaucoup plus puissant en terme de sensibilité et de spécificité voit le jour. Il s’agit du DPNI pour Dépistage Prénatal Non Invasif. (Vous lirez souvent diagnostic , mais il s’agit pour l’heure de dépistage). Ce nouveau test consiste à quantifier sur une simple prise de sang un excès d’ADN fœtal circulant provenant du chromosome 21.

L’ADN fœtal circulant

Il y a des fragments d’ADN double brin qui circulent librement dans votre sang. En général ce sont les vôtres sauf si vous faites des expériences tordues dans votre laboratoire ou … si vous êtes enceinte. En effet chez les femmes enceintes environ 10% de ces fragments proviennent du fœtus. Plus précisément ces fragments proviennent de la lyse des cellules trophoblastiques, un composant du placenta ayant la même origine embryologique que le fœtus.
L’idée derrière le DPNI c’est quantifier un excès de l’ADN circulant provenant du chromosome 21 à l’aide des nouvelles technologies de séquençage haut débit.
La figure ci-dessous illustre la quantification d’ADN circulant chez une mère sans et avec fœtus trisomique. En mesurant une différence significative, il est possible de conclure à un excès de d’ADN circulant provenant du chromosome 21.
On considère que 90% de l’ADN circulant provient de la mère et 10% du foetus. L’excès du chromosome 21 chez le foetus est caractérisé par une différence significatif entre 2.1 et 2.0

Le Séquençage de nouvelle génération

Le NGS (Next Generation Sequencing) est une technologie récente permettant le séquençage de l’ADN de façon très rapide grâce à un haut niveau de parallèlisation. Sans entrer dans les détails (super site ici), les fragments d’ADN provenant du sang maternel, qu’on appellera reads à présent, sont séquencés puis alignés sur le génome de référence via des algorithmes de bioinformatique.
On obtient alors un fichier contenant la liste des reads associés à leurs positions sur le génome. C’est à dire qu’à chaque fragment séquencé, son chromosome lui est associé.
La figure ci-dessous résume les étapes du séquençage ainsi que les différents formats de fichier.
Les reads sont séquencés et sauvegardés dans un fichier fastQ. Les reads sont ensuite alignés sur le génome de référence hg19. En vert les reads provenant du foetus. En violet les reads maternels

Quantification et test statistique

Une trisomie 21 se caractérise par un excès de reads s’alignant sur le chromosome 21. Pour mesurer cet excès il nous faut des valeurs de référence obtenues chez des femmes enceintes témoins dont le fœtus est sain.
Avec un nombre suffisant de témoins, la moyenne et l’écart-type du nombre de reads par chromosome sont calculés.
Pour savoir si une patiente présente trop de reads, il suffit de rechercher une différence significative à l’aide d’un Z-score en comparant les données de la patiente et les valeurs de référence.
Le logiciel RapidR créé par le NHS utilise cette approche. Un exemple de résultats est présenté dans la figure suivante.
En ordonnée le Z-score, en abscisse les chromosomes. Sur ce graphique, la patiente présente un excès significatif en read s’alignant sur le chromosome 21
Un autre logiciel, Wisecondor approche différemment le problème et propose d’utiliser les autres chromosomes comme références au sein du même échantillon. C’est une approche plus complexe, mais peut se résumer ainsi.
Tout d’abord, le génome est segmenté en régions de 10 kilobases appelé bin. Le nombre de reads est comptabilisé par bin au lieu d’être comptabilisé par chromosome comme précédemment.
A partir des mesures chez les témoins sains, les bins du chromosome 21 sont associés aux autres bins du génome lorsqu’ils contiennent plus ou moins le même nombre de reads. La figure suivante est une représentation de ces associations.
Chaque chromosome est représenté avec leurs bins sur la circonférence du disque. Tous les bins du chromosome 21 sont associés aux bins des autres chromosomes. Ces relations sont utilisées comme référence témoins au sein du même échantillon.
Ce logiciel permet donc de mesurer l’excès de reads mappant le chromosome 21 en le comparant aux autres chromosomes. Cette technique à l’avantage de se passer des biais de mesure, car le séquençage de la référence et du patient sont réalisés en même temps.

Stratégie de dépistage

En Novembre 2015, la Haute autorité de santé a évalué positivement ce nouveau test de dépistage. La sensibilité et la spécificité avoisine les 100%.
Le risque de faux négatif est lié à l’absence d’ADN fœtal si le prélèvement est réalisé trop tôt. Un risque de faux positif est également possible dans les cas de mosaïcisme fœtal.
Aujourd’hui toutes les femmes enceintes, quel que soit leur âge, sont informées de la possibilité de recourir à ce test.
La stratégie actuelle est de proposer le dépistage standard. Si celui ci revient positif, au lieu de proposer directement un geste invasif, le DPNI est proposé. Si celui ci est à son tour positif, alors le geste invasif et le diagnostic cytogénétique est réalisé.
A l’heure actuelle les laboratoire Cerba et Biomnis proposent le DPNI. Mais depuis janvier 2016 certains centres hospitaliers proposent ce test qui n’est malheureusement pas encore remboursé et avoisine les 800€.

Référence

Remerciement

@Thibaud_GS Continue reading