L’évolution selon Wayward Pines

Featured

wayward-pines-la-boucle-est-bouclee-spoilers-abbies
Et si nous nous amusions à rationaliser scientifiquement un scénario de Science-Fiction issu d’une bonne série TV? Ce billet vous plonge dans le scénario évolutif dystopique de la série intitulée «Wayward Pines». Via un exercice de pensée, des explications ad hoc et d’une certaine dose d’imagination nous allons tenter de rendre crédible une version bien […]

La sélection cérébrale de la semaine (numéro 95)

Voici ma sélection des articles publiés la semaine du 16 au 23 mai 2016 dans le domaine des neurosciences. Une plongée dans le monde animal, avec une équipe de recherche qui a réussi à mettre au point une méthode afin d’étudier la perception des couleurs que peuvent avoir les animaux et notamment les oiseaux, peu étudiés jusqu’à présent. Qu’il se nomme Doliprane, Efferalgan ou Dafalgan, le paracétamol pourrait modifier les émotions en diminuant le sentiment d’empathie. Ce sont en tout cas, les résultats d’une étude qui restent … Continuer la lecture de La sélection cérébrale de la semaine (numéro 95)
Continue reading

Sélection scientifique de la semaine (numéro 221)

– Des chercheurs pensent avoir trouvé la trace de méga-tsunamis sur Mars. (en anglais) – Les astronomes et l’énigme du poème de Sappho : flash-back dans le ciel antique. – Jamais sur Terre depuis le début des relevés météorologiques un … Continuer la lecture
Continue reading

L’Eve mitochondriale et l’Adam Chromosome Y

Featured

vignette
Quelques précisions et références comme d’habitude : Sur le fait que le chromosome Y ne subit pas de recombinaison génétique…ça n’est pas tout à fait vrai ! Il existe de petites régions homologues entre les chromosomes X et Y et dans lesquelles une recombinaison peut avoir lieu. Ces régions dites « pseudo-autosomiques » ne concernent que quelques […]
Continue reading

Petite liste des catastrophes auxquelles vous avez pour le moment échappé

Il fut un temps, désormais un peu lointain, où, dirigeant le service Planète du Monde, je fréquentais tous les jours les réunions de rédaction pour y “vendre” des articles sur les problèmes que l’humanité posait à la biosphère – et donc, … Continuer la lecture
Continue reading

Petite liste des catastrophes auxquelles vous avez pour le moment échappé

Il fut un temps, désormais un peu lointain, où, dirigeant le service Planète du Monde, je fréquentais tous les jours les réunions de rédaction pour y « vendre » des articles sur les problèmes que l’humanité posait à la biosphère – et donc, … Continuer la lecture
Continue reading

Le génome en chiffre – part 1

Ça faisait longtemps que j’avais envie de faire une description numérique du génome. Vous savez ces chiffres repères qui nous permettent de faire des comparaisons et de répondre à des questions du genre : “Est-ce que cette montagne est grande ?” Si vous n’avez pas de référence, comme la taille du mont blanc, ça va être difficile de vous faire une idée…
Nous allons faire pareil sur le génome humain ! Et pour être sur qu’une organisation maçonnique n’a pas volontairement mis des faux chiffres sur internet, nous allons tout calculer par nous-même ! Ça sera l’occasion de faire un peu de bash et d’apprendre quelques commandes !

Télécharger le génome humain

Tout d’abord si vous n’avez pas le génome de référence, télécharger le depuis le goldenpath d’ucsc. C’est le fichier hg19.2bit qui fait 778M.
$ wget http://hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/hg19.2bit
Ce fichier est compressé. En fait chaque base est codée sur 2 bit au lieu de 8. On peut le convertir en fichier texte standard avec la commande twoBitToFa disponible également sur ucsc.
$ wget http://hgdownload.cse.ucsc.edu/admin/exe/linux.x86_64/twoBitToFa
$ chmod +x twoBitToFa 
$ ./twoBitToFa hg19.2bit hg19.fa
Vous voilà avec un fichier fasta, contenant les séquences de chaque chromosome humain… Chaque.. En fait, non! Ce fichier contient des chromosomes en double avec des séquences alternatives ainsi que le chromosome mitochondrial.
Tapez cette commande pour voir tous les noms des chromosomes du fichier hg19.fa.
$ cat hg19.fa|grep ">chr"
Nous allons plutôt créer un fichier avec uniquement les chromosomes nucléaires de 1 à 22 et les deux chromosomes sexuels X et Y. Il y a un outil faSomeRecords sur ucsc qui fait très bien le travail. Il prend en argument notre génome hg19.fa et un fichier avec la liste des chromosomes souhaités.
$ wget http://hgdownload.cse.ucsc.edu/admin/exe/linux.x86_64/faSomeRecords
$ chmod +x faSomeRecords
#Création d'une liste de chromosomes 
$ for i in {1..22}; do echo chr$i; done > chromosomes.list
$ echo chrX >> chromosomes.list 
$ echo chrY >> chromosomes.list 
$ ./faSomeRecords hg19.fa chromosomes.list hg19_clean.fa
Voilà, un fichier tout propre contenant uniquement les 24 chromosomes du génome humain.

Quel est la taille du génome humain ?

Il suffit de compter le nombre de bases! On supprime tous les retours à la ligne du fichier fasta et on compte avec la commande wc -c !
$ cat hg19_clean.fa|grep -v "chr." | tr --delete "n" | wc -c
$ 3095677412
3’095’677’412 c’est le nombre de nucléotides qu’il y a dans le fichier du génome humain. Retenez donc que le génome est constitué d’environ 3 milliards de paires de base.

Pourcentage en GC du génome humain ?

Pour ça, je vous propose d’utiliser un de mes outils préférés : bedtools ! Le couteau suisse du bioinformaticien. Il est en principe dans les dépôts d’ubuntu mais je vous conseille la dernière version depuis le site officiel :
$ wget https://github.com/arq5x/bedtools2/releases/download/v2.25.0/bedtools-2.25.0.tar.gz
$ tar -zxvf bedtools-2.25.0.tar.gz
$ cd bedtools2
$ make 
$ sudo make install
Pour connaître le pourcentage en base A,C,G,T on utilise bedtools nuc. Cette commande permet de compter les pourcentages en base A,C,G,T dans un fichier fasta à partir des régions chromosomiques définies dans un fichier bed. On va calculer ces pourcentages pour chaque chromosome.
Pour aller plus vite, on peut télécharger le fichier hg19.chrom.sizes. Celui-ci contient sur chaque ligne, le nom du chromosome et sa taille en base. On va s’en servir pour créer le fichier nécessaire à bedtools.
$ wget http://hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/hg19.chrom.sizes
$ cat hg19.chrom.sizes|grep -we "chr[0-9XY]*"|awk 'BEGIN{OFS="t"}{print $1,0,$2}' > hg19_clean.sizes.bed
Assurez-vous que la somme des tailles des chromosomes tombe bien sur les 3 milliards précédents.
$ cat hg19_clean.sizes.bed|cut -f3|paste -sd "+"|bc
Lancer alors la commande :
$ bedtools nuc -fi hg19_clean.fa -bed hg19_clean.sizes.bed > hg19.stat
Vous obtenez un fichier contenant pour chaque chromosome, le nombre de nucléotides A,T,C,G,N avec le pourcentage en AT et CG. N’hésiter pas à regarder l’aide de la commande.
Le pourcentage en GC du génome humain tourne autour de 37%. Avec comme extrêmes le chromosome 19 (48%) et le chromosome Y (25%).

Pourcentage en base A,C,G,T

Dans le fichier hg19.stat précédemment généré, on observe aussi le nombre de bases A,C,G,T. On faisant la somme, on obtient sur tout le génome :
  • 846093191 bases T soit 27.2%
  • 844862932 bases A soit 27.3%
  • 585012752 bases C soit 18.8%
  • 585358256 bases G soit 18.9%
Olaa.. Attendez c’est quoi ce truc ? Il y a quasiment autant de base A que de T, et autant de base C que de G. Détrompez-vous, si vous pensez que c’est la loi de Chargaff expliquant la complémentarité des brins. Car cette répartition est sur un seul brin d’ADN ! Pas de double brin dans l’histoire ! C’est comme si dans un livre de 3 milliards de lettre, il y avait autant de “s” que de “a”.
Bien sûr j’ai recherché, j’ai demandé, j’ai eu toutes les réponses inimaginables. En fait c’est ce qu’on appelle la seconde loi de Chargaff, beaucoup moins connu! Et je vous assure, je n’ai pas encore trouvé d’explication, si ce n’est celle-ci

Combien de gènes dans le génome humain ?

Dans le génome il y a des gènes constitués d’intron et d’exon. Et chaque gène définit plusieurs transcrits.
On peut télécharger refseq, une base de donnée contenant tous les gènes officiels ! Dans le fichier, ces colonnes vont nous intéresser par la suite.
  • colonne 3 : le chromosome
  • colonne 5 : le début du transcrit
  • colonne 6 : la fin du transcrit
  • colonne 7 : début du CDS
  • colonne 8 : fin du CDS
  • colonne 9 : le nombre d’exons
  • colonne 10: liste des débuts d’exons
  • colonne 11: liste des fins d’exons
  • colonne 13 : le nom du gène
Pour télécharger :
$ wget wget http://hgdownload.cse.ucsc.edu/goldenPath/hg19/database/refGene.txt.gz
Compter le nombre de gènes uniques :
$ zcat refGene.txt.gz|cut -f13|sort -u | wc -l
$ 27048
Votre Deuxième chiffre à retenir ! Environ 27000 gène constitue le génome humain !

Quel est le pourcentage d’exons ?

Dans le fichier refseq, colonne 10 et 11, nous avons tous les débuts et les fins des exons. J’ai juste fait la somme des différences entre fin d’exon et début d’exon sur tous les gènes uniques. Avec awk, ça se fait tout seul :
$ zcat refGene.txt.gz|sort -u -k 13,13|awk '{SUM=0;split($10,s,","); split($11,e,",");for(i=1;i<length(s);i++){SUM+=e[i] - s[i]};print SUM}'|paste -sd "+"|bc 
$ 72090466
On obtient 72090466, le nombre de bases dans les exons. En le divisant par la taille du génome, on se retrouve avec : 2.32 % du génome est constitué d’exon.

Quel est le pourcentage de bases codantes ?

Pour cela, j’ai crée un fichier bed qui contient la position de tous les exons. Et un second fichier contenant la position de toutes les cds. J’ai ensuite fait l’intersection avec bedtools.
$ zcat refGene.txt.gz|sort -u -k 13,13|awk 'BEGIN{OFS="t"}{SUM=0;split($10,s,","); split($11,e,",");for(i=1;i<length(s);i++){print $3,s[i],e[i]} }' > exons.bed

$ zcat refGene.txt.gz|sort -u -k 13,13|awk 'BEGIN{OFS="t"}{print $3,$7,$8 }' > cds.bed

$ bedtools intersect -a exons.bed -b cds.bed | awk '{print $3-$2}'|paste -sd "+" | bc
On obtient 35269084, le nombre de base codante. Ce qui fait 1.13 % du génome. 1% du génome est codant. Oui… C’est vraiment pas beaucoup !

Quel est le pourcentage d’intron ?

Même logique, j’ai fait les zones transcrites soustraites des exons. Ce qui nous donne les introns avec les UTR.
$ zcat refGene.txt.gz|sort -u -k 13,13|awk 'BEGIN{OFS="t"}{print $3,$5,$6 }' > transcrits.bed

$ bedtools substract -a transcrits.bed -b exons.bed | awk '{print $3-$2}'|paste -sd "+" | bc
On obtient 1184956505 bases dans les introns/UTRs soit 38.2 % du génome !
Il reste tout de même plus de 60% d’inconnu ! Dans un prochain article, on s’y attaque !

Combien de mutations me distinguent du génome de référence ?

On ne va pas prendre mon génome… Mais celui de James Watson co-découvreur de l’ADN avec Francis Crick et Rosalind Franklin. Son génome a été séquencé et distribué librement. Nous allons télécharger un fichier contenant uniquement les différences entre le génome de Watson et le génome de référence. C’est à dire un fichier contenant sur chaque ligne, la position et la base alternative.
$ wget http://hgdownload.cse.ucsc.edu/goldenpath/hg19/database/pgWatson.txt.gz
En comptant le nombre de ligne :
$ cat pgWatson.txt.gz | wc -l
On obtient 2059384 variants. Environs 2 millions de bases distinguent James Watson du génome de référence. En pourcentage, ça nous fait : 0.06 %

Combien de mutations je partage avec un autre individu ?

On va regarder les variants que partage Craig Venter et James Watson.
Même chose que précédemment, on récupère les données de Venter.
$ wget http://hgdownload.cse.ucsc.edu/goldenpath/hg19/database/pgVenter.txt.gz
Puis on transforme le fichier de Watson et Craig en fichier bed.
$ zcat pgVenter.txt.gz |cut -f2,3,4|sort > venter.bed
$ zcat pgWatson.txt.gz |cut -f2,3,4|sort > watson.bed
Puis on fait l’intersection :
$ bedtools intersect -a venter.bed -b watson.bed|wc -l
On trouve alors 1’192’314 de variants en commun entre Venter et Watson!

Conclusion

Nous allons nous arrêter là pour le moment, sinon on ne finira jamais ! Pour cette fois retenez ceci : Votre ADN est composé de 3 millards de paires bases. 1% constitue le génome codant pour 25 000 gènes. Et 1 million de variants vous distinguent d’un autre individu.
Dans le prochain article, nous allons poser d’autres questions beaucoup plus précises. Où se trouve les variations ? Qu’y a-t-il dans les 60% de l’ADN ? Quel sont les mutations les plus fréquente ? Et poser vos questions dans les commentaires, j’essaierai d’y répondre!

Remerciement

@ZaZo0o Continue reading

Sélection scientifique de la semaine (numéro 217)

– Le premier trimestre de 2016 a été le plus chaud jamais enregistré dans l’histoire de la météorologie. Chacun des trois premiers mois de l’année a battu un record. (en anglais) – Les ressorts psychologiques qui expliquent pourquoi on agit … Continuer la lecture
Continue reading

Sélection scientifique de la semaine (numéro 216)

– Un projet visionnaire et/ou un peu fou, nommé Starshot, pour envoyer des micro-sondes vers l’étoile Alpha du Centaure. Sera-ce le début du voyage interstellaire ? (en anglais) – La NASA reprend la main sur son télescope spatial Kepler, grand chasseur d’exoplanètes, … Continuer la lecture
Continue reading

De l’utilité de mourir de faim en protégeant un garde-manger

Featured

Svalbard
Ah, elle est pas mal celle-là! Et bien oui, c’est arrivé. Laissez-moi donc vous plonger dans l’ambiance festive de la Russie des années 1940…
Illustration: Tom Burns
 Les Nazis ont envahi la Russie et tiennent Leningrad en siège. Apparemment ils n’étaient pas pressés de partir, vu que le siège a duré… 872 jours. Comme quoi ca devait être vraiment chouette là-bas. Trêve de blaguerie… Pendant ce siège, 12 scientifiques, se sont constamment relayés pour monter la garde devant les sous-sols de l’ Institut d’Agriculture de l’Union. Qu’ y avait-il donc de spécial dans ce sous-sol?

 Je vous le donne en mille: La plus complète banque de graines, fruits, et racines du monde à l’époque. En d’autres termes, la plus grande réserve de diversité génétique agriculturelle au monde, collectée et rassemblée par le botaniste, généticien et géographe Nikolai Vavilov au cours de ses inombrables expéditions.
Vous vous souvenez de Pascal vous narrant les frasques de Lyssenko? Vavilov, c’est son exact opposé. Scientifique multidisciplinaire. Fan de Darwin. Connaît le monde comme sa poche (ok, presque). A rédigé un brillant traité sur les origines géographiques des plantes cultivées. A compris qu’avoir en stock un grand nombre variétés d’espèces cultivées venant de régions aux climats divers et variés, prêtes à être utilisées ou croisées, peut aider à booster la production alimentaire. Bref il voulait nourrir la Russie de manière sûre, efficace et durable, en développant et en utilisant la recherche en génétique. Et il avait pas mal de succès sur ce plan-là, seulement voilà, vous l’avez deviné, Staline ne pouvait pas encadrer un si odieux personnage et l’ a donc envoyé en prison. En fin de compte neuf des douze braves scientifiques-gardiens sont morts de faim pendant le siège. Vavilov est mort de faim en prison.
Ouch.

Quid de l’héritage de Vavilov?

Retour au présent. Les banques de graines sont maintenant largement reconnues comme étant la meilleure manière de rassombler, préserver, et redistribuer des variétés végétales perdues, en danger, ou prometteuses dans un contexte de changement climatique. Pourquoi la graine comme unité de conservation? C’est assez facile à deviner : laissez au fond de votre placard un pois chiche sec et une laitue, oubliez le tout et partez à Hawaii pendant un mois, et relevez le résultat au retour. Mon hypothèse est que le pois-chiche aura une meilleure gueule que la laitue. Oui, niveau préservation de matériel génétique et reserves nécessaires à la croissance, les graines sont championnes. Leurs propriétés chimiques et structurales les gardes viables pour des années. Et quand je dis des années: Il n’y a pas si longtemps des scientifiques israeliens ont fait germer une graine de palmier datier datée (haha) d’ il y a 2000 ans. Qui sait, peut-être que cette graine a été sucée et recrachée par Jésus en personne!
“Got it on with Jeez.”
Reprenons-nous. Puis, Prenons l’exemple du riz.
Le riz, c’est incroyable.
Le riz. 22 espèces dont 2 intensément cultivées. au sein desquelles on trouve plus de 140 000 variétés. Certaines poussent sous le niveau de la mer, d’ autres à 3000 mètres d’altitude, certaines ont les pieds dans l’eau (douce ou salée), d’autres sont incroyablement tolérantes à la sécheresse.
Tous en coeur: Merci la diversité génétique!
photo source: Lefigaro.fr

La conservation, pour tous les goûts, à toutes les échelles

Restons sur notre exemple du riz. Il existe une multitude de banque de grains de riz très locales dans les pays producteurs. En Inde par exemple, Debal Deb met l’ accent sur les anciennes variétés, la gratuité d’accès, et le fait que sa banque est vivante: il cultive toutes ses variétés (environ 900 variétés traditionnelles) pour assurer un stock constant de graines fraîches, accessibles à tous les cultivateurs de la région à conditions qu’ils lui ramènent une poignée de graines à la première récolte.
Au niveau national, toujours en Inde, Le National Seeds Corporation stocke aussi des milliers de types de grains de riz, avec un aspect recherche, dévelopement, et tests en laboratoire de nouvelles variétés. 

Et à l’échelle internationale, on a IRRI!
IRRI, le riz qui rit!
L’Institut international de recherche sur le riz (IRRI, apparemment il faut tout vous traduire bande d’ectoplasmes) a ses quartiers aux Phillipines et stocke des graines de quelques 121,595 variétés de riz. Des milliers ont été développées par IRRI. Donc sur tous les continents, chaque échelle spatiale de banque de graine stocke (en théorie) la majorité des graines conservées aux échelle plus locales, en plus d’autres variétés ou croisements uniques. C’est un peu comme un système de poupées russes.

Le stock ultime

Ce n’ est pas tout. Car à l’échelle supra-inter-extragalactique, nous avons…
(musique qui fait peur)
…l’antre du plus méchant des méchants magnanimes tortionnaires russes de tous les films de James Bond réunis!!!
Ah non pardon, c’ est le Global Seed Vault. Et c’est à Svalbard.
Passez quand vous voulez. Il y a un aéroport et un camping. Si si, en haut à gauche. Tout ce qu’ il faut pour des vacances inoubliables.
La Réserve mondiale de semences du Svalbard (Svalbard Seed Vault en anglais) est le niveau suprême de conservation, supposé assurer la survie de quelque 4.5 milliards de variétés contre toute catastrophe naturelle ou surnaturelle (tant qu’on y est)… ou humaine. C’est en fait juste un entrepôt, rien de tres exceptionnel, on peut en faire la visite virtuelle sur le site, vous verrez ca ressemble à la partie moche d’Ikea où on récupère ses Igberfrük et autres Mählahü en fin de visite. Loin de la mer et de toute activité sismique et humaine ce gros congélo souterrain est doublement protégé par -18°C de système électrique et -6°C (grand maximum) de permafrost. Le remplissage de l’entrepot en question a commencé avec une boite de grains de riz en 2008 et contient actuellement 864 309 variétés d’espèces végétales cultivées. Autrement dit il est plein au sixième. Mais alors attention, on n’y entre pas comme dans un moulin. Toutes les stocks du SSV sont des sauvegardes de sauvegardes de stocks d’autres banques de graines, en quelque sorte un sanctuaire de dernier recours en cas d’échec consécutif de toutes les mesures préalables en temps de crise grave. Comme dit mon Papa, “ceintures ET bretelles.”. Sachant cela, vous et moi nous disons que personne n’y puisera rien avant au moins… pfiou…. des centaines d’années! Peut-être même jamais! Et bien figurez vous que l’on a tenu 7 ans avant de tirer la première ultime sonnette d’alarme. Pas mal, 7 ans. La première rétribution a lieu en octobre 2015, alors que la guerre civile et internationale fait exploser de nombreuses villes syriennes et détruit du même coup les réserves de la banque de graines internationale d’Alep.
Popcorn
ça, c’ est vraiment de l’humour mal placé Joane.
38 073 graines de blé, lentilles, pois chiches et autres cultures de subsistance sont envoyées au Maroc et au Liban pour être “ressuscitées” après l’évènement… Matière à réflexion pour tous ceux qui pensaient que ce saugrenu projet Svalbard n’en valait pas ses 9 millions d’euros initiaux (le prix d’ un tronçon de 1.46 km d’autoroute française, soit dit en passant). Ceinture et bretelles, c’ est mon Papa qui l’a dit.

La conservation de la graine: où pousser?

Au niveau local, une conservation efficace passe par des réseaux solides et actif, partout dans le monde, d’échange de graines et des conservation ‘in vivo’ d’ un maximum de variétés cultivées… Beaucoup d’associations, coopératives, et gouvernements locaux sont sur le coup dans bien des pays, mais dans le contexte de mondialisation actuel on est loin du système parfait, et je vais arrêter ce paragraphe maintenant là tout de suite avant de commencer à écrire l’équivalent de 40 blogposts traitant de ce sujet politico-economico-social pour lequel je n’ai d’ailleurs pas assez de qualifications merci de votre compréhension.
Le mois dernier, la revue Nature publie un article révélant que la majorité des espèces sauvages apparentée aux espèces végétales domestiquées ne figurent pas au registre des banques de graines. Et le Global Seed Vault n’est plein qu’au sixième? On pourrait commencer par là. On a souvent observé que les variétés plus anciennes étaient plus résistantes aux pressions environnementales telles que les maladies ou les variations climatiques extrêmes. Cela sous-entend un bénéfice à garder ou réintroduire des gènes primitifs avantageux perdus pendent l’intense processus de sélection artificielle qu’ ont connu toutes les espèces végétales que l’on achète au quotidien. Finalement je vous vois venir gros comme une maison et donc je vais vous couper l’herbe sous le pied et poser la question moi-même: Et le rôle des OGMs dans tout ça? Après tout on n’a pas besoin de stocker des quantités monumentales de graines aux génomes différents si on peut les fabriquer soi-même…
Et bien pour le moment le Global Seed Vault n’accepte pas d’OGMs. Les OGMs ont peut-être un rôle à jouer dans le sauvetage de certaines espèces (comme le châtaigner d’Amérique) face à des perturbations de large échelle. Mais fabriquer des OGMs coûte cher, donne des résultats incertains, et pose tout un tas de problèmes de brevet et autre barrières à la diffusion…
La nature (et nous agri-ingénieurs) possède pour chaque espèce une richesse extraordinaire de variétés comestibles et fertiles entre elles, pourquoi ne pas s’en servir?
Continue reading