ARTICLE
Auteur(s) : Benoît Arveiler
EA4137, Laboratoire de génétique humaine, Université
Victor-Segalen, Bordeaux 2
On appelle transcriptome l’ensemble des ARN produits par une
cellule ou un tissu. À la notion de transcriptome on associe des
éléments qualitatifs (quels gènes sont exprimés) et quantitatifs
(quel est le niveau d’expression de chacun des gènes).
Le transcriptome reflète l’activité des différents gènes dans
une cellule ou un tissu à un instant donné. Ainsi, les
transcriptomes des différentes structures du cerveau seront
différents car les gènes exprimés dans le cervelet, la substance
noire et l’hypothalamus, par exemple, sont différents.
De même, les gènes exprimés au sein d’un même organe diffèrent
selon les stades du développement de l’individu. Enfin, les niveaux
d’expression de certains gènes peuvent être différents entre un
état normal et un état pathologique.
Le génome humain contient environ 25 000 gènes.
Les gènes de classe I expriment les ARN ribosomaux, les gènes
de classe II expriment les ARN messagers, et les gènes de classe
III expriment les ARN de transfert et les petits ARN
nucléaires.
Les gènes de classe II (qui codent pour des protéines) sont
transcrits dans le noyau en ARN primaire (ou prémessager), puis
maturés en ARN messager qui est exporté vers le cytoplasme où il
est traduit en protéine au niveau des ribosomes (figure 1).
La transcription met en jeu l’ARN polymérase II qui reconnaît
la région promotrice du gène, ouvre la molécule d’ADN double brin,
et commence la transcription du gène, c’est-à-dire la synthèse
d’une molécule d’ARN en utilisant comme patron le brin antisens de
la molécule d’ADN. La molécule synthétisée est la copie du
brin sens du gène, encore appelé brin codant.
L’ARN primaire subit une maturation selon trois processus :
- ajout d’une méthylguanosine à l’extrémité 5’ de la molécule
(coiffe) ;
- ajout d’une queue de 30 à 200 adénosines (queue poly-A) à
l’extrémité 3’ ;
- épissage qui résulte en l’élimination des introns, qui sont non
codants ; ce mécanisme aboutit à la production d’une molécule d’ARN
messager qui ne comporte plus que les exons, soit les informations
nécessaires à la synthèse de la protéine.
Il est important de noter qu’un même gène peut produire
plusieurs ARN messagers différents, et ce essentiellement par deux
processus. Le premier est l’utilisation de promoteurs
différents (ou alternatifs) selon les tissus, donnant lieu à des
isoformes qui diffèrent par la présence ou l’absence du ou des
premiers exons du gène. Le second est l’épissage alternatif de
tel ou tel exon, qui produit parfois de multiples isoformes d’ARN
messager dans lesquelles différents exons peuvent être présents ou
absents. Ces deux processus constituent une forme de
régulation de l’expression génique en ce sens que les isoformes
protéiques ainsi produites peuvent avoir des fonctions partielles
ou différentes, par rapport à la protéine résultant de la
traduction de tous les exons.
L’analyse de l’expression des gènes peut être abordée de
plusieurs façons. L’analyse du ou des ARN messagers d’un gène
particulier est classiquement réalisée par transcription inverse
suivie d’une réaction de polymérisation en chaîne (PCR). Pour cela,
l’ARN du tissu dans lequel s’exprime le gène que l’on désire
étudier est purifié, soumis à l’action d’une transcriptase inverse
qui, en présence d’amorces et de nucléotides, va synthétiser un
premier brin d’ADN complémentaire de chacune des molécules d’ARN
messager présentes dans le tissu, puis synthétisera le second brin.
Ainsi est fabriqué ce que l’on appelle l’ADN complémentaire (ADNc)
de l’ARN (figure
2). L’ADNc du gène que l’on désire analyser peut ensuite
être amplifié par PCR afin d’analyser sa structure (présence de tel
ou tel exon) et sa séquence. L’ensemble de ce processus est appelé
reverse transcription PCR (RT-PCR). Une technique de PCR
quantitative peut être utilisée pour mesurer le niveau d’expression
du gène.
L’ensemble des ADNc synthétisés à partir d’un tissu donné peut
être cloné dans des plasmides bactériens afin de réaliser une
banque d’ADNc qui représente l’ensemble des transcrits de ce tissu.
Le séquençage des extrémités des clones ADNc a fourni des
étiquettes des séquences exprimées que l’on a appelées des EST
(expressed sequence tags) (figure 3) [1]. Chaque EST
représente entre 100 et 200 pb. L’analyse des EST produits à partir
de différents tissus et de différents stades du développement a
joué un rôle crucial dans la seconde moitié des années 1990 pour
commencer à déterminer le profil d’expression spatio-temporel de
l’ensemble des gènes humains. Ceci a constitué la première approche
pour l’analyse du transcriptome. Il s’agissait d’une approche
essentiellement qualitative.
Une approche quantitative du transcriptome a été rendue possible
par l’avènement de la technologie dite des puces à ADN (ou
micro-array). Il s’agit de surfaces solides (généralement des
lames de verre) sur lesquelles un grand nombre de sondes sont
fixées [2-4].
Pour l’analyse du transcriptome, les sondes peuvent être soit
des fragments d’ADNc, soit des oligonucléotides issus d’exons. Une
analyse globale du transcriptome sera réalisée avec une puce
portant des sondes représentant les 25 000 gènes humains.
Le principe de l’analyse repose sur l’hybridation entre
molécules complémentaires, c’est-à-dire, dans le cas de l’analyse
du transcriptome, entre, d’une part, les sondes déposées sur le
support et, d’autre part, les molécules d’ADNc synthétisées à
partir du matériel biologique à étudier qui ont été marquées avec
un fluorochrome (figure
4). L’ADNc testé (marqué ici avec la Cyanine 5) est
cohybridé avec un ADNc de référence (marqué ici avec la Cyanine 3).
Le niveau d’intensité de fluorescence est mesuré au niveau de
chaque sonde, permettant ainsi de quantifier le niveau d’expression
de chaque ARNm. Ceci permet de déterminer les gènes qui sont
éventuellement sous-exprimés ou surexprimés dans certaines
cellules. Classiquement, ces études sont réalisées pour comparer le
niveau d’expression des gènes entre un tissu pathologique et le
même tissu sain. Une autre application concerne la
pharmacogénomique, qui consiste à analyser les modulations
d’expression des gènes avant et après traitement par une drogue,
que ce soit dans des cellules en culture ou in vivo chez l’animal.
Les données obtenues sont ensuite analysées par traitement
mathématique et biostatistique visant par exemple à classer les
gènes par leur degré de ressemblance (gènes ayant la même fonction,
ou entrant dans la même voie métabolique, etc.).
L’analyse du transcriptome à l’aide de puces à ADN trouve des
applications en recherche fondamentale, mais pourra aussi, dans le
futur, constituer un outil pour le diagnostic ou le pronostic
(révélation de marqueurs particuliers) des maladies et pour
l’identification de cibles thérapeutiques. La mise en évidence
d’un gène dont la régulation de l’expression est au premier plan
dans le mécanisme physiopathologique peut conduire à
l’élaboration de stratégies moléculaires visant à moduler
l’expression de ce gène ou l’activité de la protéine pour laquelle
il code.
Références
1 Adams MD, Kelley JM, Gocayne JD, et al. Complementary DNA
sequencing: expressed sequence tags and human genome project.
Science 1991; 252 : 1651-6.
2 Schena M, Shalon D, Davis RW, Brown P. 0.
Quantitative Monitoring of Gene Expression Patterns with a
Complementary DNA Microarray. Science 1995 ; 270 :
467-70.
3 Schena M, Shalon D, Heller R, Chai A,
Brown PO, Davis RW. Parallel human genome analysis:
microarray-based expression monitoring of 1000 genes. Proc Natl
Acad Sci USA 1996 ; 93 : 10614-9.
4 Duggan DJ, Bittner M, Chen Y, Meltzer P,
Trent JM. Expression profiling using cDNA microarrays. Nature
Genetics 1999 ; 21 : 10-4.
|