Outils moléculaire
Transcriptomique
Fablet
I. Introduction
La transcriptomique correspond à l’étude du transcriptome (ensemble des transcrits produits par un organisme
donné).
RNAsec, séquençage complet du transcriptome.
Quand on s’intéresse à des espèces non modèles (moustiques tigres) pour lesquelles on ne connait rien du génome,
une première approche est de séquencer le transcriptome, ce qui est transcrit correspond à ce qui est fonctionnel
dans le génome par rapport à tout le reste. Cette méthode est intéressante lorsque l’on est confronté à de gros
génomes, difficile à assembler et longs à séquencer.
Les transcriptomes sont très variables entre espèces mais également au sein des espèces, des tissus, au fil du
développement. Cette variation est supérieure à la variation observée au niveau génomique. Les gènes essentiels
ont des profils qui varient moins que les gènes avec des fonctions spécifiques. La structure du transcriptome est
soumise à la sélection naturelle et est en partie héritable : on commence à analyser le transcriptome comme ce
qu’on fait en génétique quantitative. Le profil d’expression est un trait quantitatif.
Les différences phénotypiques entre les espèces sont souvent associées à des changements d’expression des gènes.
La vitesse d’évolution du profil d’expression dépend des organes, des taxons, des chromosomes… La principale cause
de variation est le tissu, d’avantage que l’espèce.
II. Les ARN
ARN, Acide RiboNucléique, polymère de nucléotide (base azotée + ribose + groupe phosphate). Les différences avec
l’ADN :
- Uracile à la place de la thymine
- Ribose à la place d’un désoxyribose
Conséquences, ARN beaucoup plus instable que l’ADN du fait du groupement -OH supplémentaire. La différence
principale ADN/ARN est la structure spatiale. L’ADN est double brin en hélice alors que l’ARN est simple brin avec des
multiples structure en 3D). Il y a une assez grande diversité d’ARN produit dans une cellule mais possède tous les
propriétés énoncées.
Transcriptome, ensemble des ARN.
ARN :
- M : contient l’info pour la synthèse de protéine.
- R : constituants du ribosome, synthèse de protéine.
- T : synthèse de protéine.
- Sn : épissage.
- Sno : maturation des ARNr
- Lnc : régulation de la transcription.
- Pi, mi, si : petits ARN impliqués dans l’interférence ARN.
QCM :
Quels sont, à priori, les ARN d’intérêt écologique ? ARNm, ARNr, ARNT et tout les petits ARN. ARNm correspond aux
phénotypes observés donc d’intérêt écologique.
Quels sont les ARN le plus abondants dans la cellule ? ARNr (80% d’ARNr dans une cellule, ARNm seulement 5% de la
masse total d’ARN)
, III. Les mécanismes de la transcription (transcription)
1. Principe général
L’ARN polymérase réalise la transcription, elle ouvre la double hélice d’ADN et
synthétise de l’ARN. Le brin d’ADN ne reste pas aligné à la matrice ADN (ARN
sb) et la séquence de l’ARN est la séquence complémentaire du brin transcrit
(brin du dessous sur le schéma) : il a la même séquence que le brin codant (sur
le schéma, brin du dessus).
L’extrémité 5’ de l’ARN (notée +1) correspond au site de début de transcription
(TSS).
2. Les ARN polymérases
Elles catalysent la formation de liaisons phosphodiester entre les nucléotides. Elles utilisent des nucléosides
triphosphates (substrat =ATP, CTP, GTP, UTP). La transcription se fait dans le sens 5’ -> 3’ à partir d’une matrice, qui
est de l’ADN sb.
Elles n’ont pas besoin d’amorces. Les molécules d’ARN produites sont libérées sous forme sb.
Plusieurs copies ARN peuvent être synthétisées à partir du même gène relativement rapidement : chez les
eucaryotes, 20 nucléotides peuvent être incorporés par seconde (contre 50 pour les procaryotes). Le taux d’erreur
pour les ARN polymérases est donc élevé (10-4, beaucoup plus élevé que les ADN polymérase qui sont à 10-7). Une
erreur sur une molécule d’ARN est moins grave car si dans le pool de transcrit, une séquence correspond à une
protéine non fonctionnelle, le reste du pool du transcrit compensera cette erreur. L’ARN polymérase est capable
d’exciser le dernier nt incorporé et de le remplacer par une autre : on parle d’activité exonucléasique.
Il y a 4 polymérases différentes chez les eucaryotes. La polymérase procaryote possède une SU détachable, le facteur
sigma, étant la SU permettant la reconnaissance du promoteur. Chez les eucaryotes, les 3 polymérases ne
transcrivent pas les mêmes gènes :
- Les ARN pol I et III transcrivent les gènes produisant les ARNt, ARNr et petits ARN
- L’ARN pol II transcrit les gènes protéiques (production des ARNm). Du fait des différences entre les 3 pol,
on peut distinguer et isoler les ARNm (pol I) par rapport aux ARNt (pol I et III)
Chez les pol eucaryotes, la transcription ne peut être lancée que s’il y a des facteurs généraux de transcription (TFII
ou GTF), associés aux pol. TFIID possède une sous-unité TBP (TATA-binding protéine) impliquée dans la
reconnaissance du promoteur et dans le recrutement de l’ARN pol II.
3. La transcription chez les procaryotes
Le gène procaryote possède deux sites importants : la pribnow box en -10 et une autre boite en -35. Les promoteurs
sont définis par des régions très courtes, reconnues par le facteur sigma. Lorsque le facteur reconnait ces régions,
cela induit une torsion du brin d’ADN, ce qui va être reconnu par l’ARN polymérase procaryote. Elle va alors pouvoir
ouvrir le brin et lancer la transcription : après 10 nt incorporé, le facteur sigma se détache et va se fixer sur le
promoteur d’autres gènes, tandis que l’ARN pol continue sa transcription jusqu’au signal de terminaison (riche en
AT, formant une structure spatiale particulière en épingle à cheveux) à partir duquel elle se détache. L’ARN se
détache à son tour et la double hélice d’ADN se referme. L’ARN pol est disponible pour transcrire soit le même gène,
soit un autre gène.