ARTICLE
Auteur(s) : J
Robert
Inserm U916, Institut Bergonié, université de Bordeaux,
229, cours de l'Argonne, 33076 Bordeaux Cedex, France
Introduction
Dès la découverte des oncogènes, la recherche de mutations
capables d'expliquer les altérations fonctionnelles des cellules
cancéreuses s'est révélée fructueuse et, très rapidement, de
nombreuses mutations, délétions, réarrangements géniques ont été
découverts dans les tumeurs. Grâce à l'avènement des techniques de
séquençage à haut débit, la connaissance du génome tumoral a encore
considérablement progressé. Le génome constitutionnel, en
revanche, a intéressé plus tardivement les cancérologues, d'abord
au niveau de mutations rares conférant une prédisposition, mais
aussi au niveau de variations de séquences banales et
fréquentes (polymorphismes) au niveau de gènes qui ne
paraissent pas directement impliqués dans l'oncogenèse. Là encore,
les grands consortiums de réalisation de séquençages nous ont livré
des masses d'informations dont la majeure partie n'est
pas encore exploitée. Deux branches nouvelles de la biologie
sont nées de la connaissance des variations du génome humain, l'une
à l'interface avec l'épidémiologie, que l'on appelle couramment
l'épidémiologie moléculaire, l'autre à l'interface avec la
pharmacologie, la pharmacogénétique. Les oncologues ont
largement contribué à ces deux sciences.
Nous présenterons, dans une première partie, les bases de
l'organisation structurale et fonctionnelle du génome humain, en
insistant sur la diversité individuelle qu'on y rencontre et qui
sert de fondement à l'épidémiologie moléculaire comme à la
pharmacogénétique. Dans les autres parties, après un aperçu sur les
techniques usuelles d'identification des variations communes du
génome constitutionnel, nous présenterons à travers quelques
exemples, les relations existant entre la présence de ces
variations et le risque de cancer ou l'activité des agents
anticancéreux.
Organisation du génome humain
Nous reprendrons simplement, dans ce paragraphe, quelques données
essentielles sur le génome humain et ses variations individuelles,
destinées à comprendre la nature et le rôle fonctionnel des
polymorphismes. Plusieurs ouvrages détaillés peuvent être consultés
[1, 2].
Chromosomes et chromatine
Le génome humain est constitué de deux fois 3,2 milliards de
paires de nucléotides répartis en deux fois 23 chromosomes. Un
rappel de la structure des nucléotides et de l'ADN est donné (figure 1). Chaque
chromosome contient une seule molécule d'ADN sous une forme
compactée à l'extrême (figure 2).
Les chromosomes ne sont identifiables que pendant la mitose,
au cours de laquelle ils deviennent visibles au microscope. En
dehors de la mitose, cette compaction est moindre et les
chromosomes ne sont plus directement identifiables. Dans les
chromosomes, l'ADN est associé à de nombreuses protéines,
l'ensemble formant la chromatine. On distingue
l'hétérochromatine, très compacte, qui ne peut être le siège des
opérations de transcription, et l'euchromatine, plus relâchée, où
peuvent se dérouler ces opérations. La chromatine est
constituée de particules enchaînées linéairement, appelées
nucléosomes, empilés les uns sur les autres à la manière d'un
collier de perles. Chaque nucléosome est constitué d'une partie
centrale cylindrique protéique autour de laquelle s'enroule l'ADN
(figure 2).
Les protéines constitutives du nucléosome sont les histones,
protéines basiques interagissant avec l'ADN par des liaisons
ioniques. La partie centrale du nucléosome est un octamère
rassemblant deux copies des histones H2A, H2B, H3 et H4, l'histone
H1 servant aux interactions entre nucléosomes. Les histones
subissent de multiples modifications posttranscriptionnelles qui
modulent leur interaction avec l'ADN et participent à la régulation
de la transcription : méthylations, acétylations, phosphorylations
en particulier.
Séquences génomiques
Seule une partie des séquences d'ADN des chromosomes constitue les
gènes et, à l'intérieur de ceux-ci, seule une partie code pour la
synthèse de protéines. À proximité des séquences codantes des
gènes, de nombreuses séquences régulatrices de leur transcription
ont été identifiées. Il existe dans le génome, en dehors des
gènes, de nombreuses séquences non codantes, dont certaines sont
répétitives et dont la fonction n'est pas toujours connue.
Gènes
Les gènes contiennent l'information nécessaire à la synthèse des
protéines. Cette information est discontinue dans le génome
eucaryote, et les séquences informatives (codantes) appelées exons,
sont séparées par des séquences non informatives appelées introns
(figure 3).
La séquence protéique sera donc déterminée par la séquence
nucléotidique des seuls exons ; toutefois, le début du premier exon
et l'extrémité du dernier exon peuvent ne pas coder mais jouent un
rôle régulateur. Les jonctions entre exons et introns
possèdent de courtes séquences caractéristiques qui seront
reconnues par la machinerie assurant la maturation des ARN
messagers.
Les séquences régulatrices de la transcription des gènes sont
localisées particulièrement en amont du premier exon, dans une
région appelée promoteur. Ces séquences peuvent être reconnues
par des protéines spécifiques appelées facteurs de transcription.
D'autres séquences régulatrices, parfois distantes de plusieurs
milliers de bases, sont appelées enhancers ou silencers. On peut
les rencontrer aussi dans les introns ou en aval du dernier
exon.
Notons que tous les gènes ne codent pas pour des protéines, mais
pour des ARN particuliers qui ne seront pas traduits (ARN
ribosomiques, ARN de transfert, microARN, etc.).
Séquences structurales des chromosomes
Plusieurs sites chromosomiques contiennent des séquences
essentielles aux fonctions même des chromosomes : au niveau du
centromère, où se fait l'attachement du chromosome sur le fuseau
mitotique ; au niveau des télomères, des extrémités des chromosomes
qui doivent être protégées de l'attaque des exonucléases ; au
niveau des origines de réplication, dispersées le long des
chromosomes.
Séquences répétitives
Environ 50 % du génome est constitué de séquences qui sont
répétées, soit les unes à la suite des autres, en tandem, soit de
façon dispersée dans le génome. Elles sont de taille variable,
constituées de répétitions d'un motif unitaire plus ou moins
complexe. Selon la taille du motif et le nombre de
répétitions, on distingue :
- – les microsatellites (short tandem repeats ou STR),
comportant des séries de répétitions n'excédant pas le plus souvent
quelques dizaines, d'un motif court (en majorité d’un à cinq
nucléotides) que l'on rencontre en de nombreux points du génome. On
peut les rencontrer dans certains introns, en particulier des
répétitions des deux nucléotides C et A (CA repeats).
Le nombre de ces répétitions varie d'un individu à l'autre, ce
qui représente un polymorphisme pouvant être utilisé comme marqueur
génétique ;
- – les minisatellites, ayant des motifs de quelques
dizaines de nucléotides répétés jusqu'à quelques centaines de fois,
très polymorphes dans leur séquence et le nombre de répétitions et
qui sont également dispersées dans le génome ;
- – les satellites, pour lesquels le motif, qui peut
comporter jusqu'à quelques centaines de nucléotides, est répété un
très grand nombre de fois (de l'ordre de 500 000 à
1 000 000). Parmi les séquences dispersées, on distingue
:
- – les séquences SINE (short interspersed elements), qui
contiennent 100 à 300 nucléotides. L'une d'elles, la séquence Alu,
de 282 nucléotides, est rencontrée en moyenne toutes les 4 000
paires de bases, et près d'un million de copies sont donc
présentes dans le génome humain. Elles ne codent pour aucune
protéine et leur rôle est inconnu. Elles dériveraient d'un gène
codant pour l'ARN de la signal recognition particle dont les
transcrits se seraient réinsérés dans le génome ;
- – les séquences LINE (long interspersed elements), qui
contiennent 5 000 à 7 000 nucléotides. Elles dériveraient
de certains transcrits de l'ADN polymérase II ou d'une
rétrotanscriptase qui se seraient réinsérés dans le génome.
Il en existe environ 500 000 dans le génome humain,
souvent incomplètes. Leur insertion dans la séquence d'un gène peut
inactiver ce gène. Elles possèdent, à leurs extrémités, des
séquences LTR (long terminal repeat), à la manière des virus.
Éléments transposables
Les séquences SINE et LINE sont des séquences mobiles susceptibles
de se déplacer de manière aléatoire d'un site chromosomique à
l'autre ; ces séquences codent précisément pour les enzymes
capables de réaliser leur transposition soit directement
(transposons), soit après rétrotranscription (rétrotransposons).
Dans les cellules normales, ces gènes ne sont pas exprimés en
raison d'une méthylation importante de leurs promoteurs. Dans de
nombreux cancers, ces gènes sont réactivés, en liaison avec une
perte de cette méthylation, mais le mécanisme de la réactivation de
la transcription de ces séquences n'est pas compris ; il pourrait
être lié à l'instabilité génique caractéristique des cancers et a
été attribué à des agents génotoxiques, incluant les agents
anticancéreux. Par ailleurs, l'activité de transposition portée par
les protéines synthétisées amplifie de façon importante cette
l'instabilité génique et, selon le lieu de réinsertion des éléments
transposés, est susceptible d'inactiver des gènes suppresseurs
de tumeurs, voire d'activer des proto-oncogènes.
La réactivation de l'activité de rétrotransposition dans les
cancers s'accompagne d'un mauvais pronostic. L'inhibition de cette
activité in vitro provoque l'arrêt de la prolifération cellulaire
et une voie de recherche thérapeutique pourrait s'orienter vers
l'inhibition de la rétrotranscriptase codée par LINE1.
Principales altérations du génome
Un certain nombre de maladies, dont font partie les cancers, sont
liées à des altérations du génome. Certaines sont ponctuelles et ne
portent que sur un nucléotide : elles ne sont objectivables que
par séquençage. D'autres correspondent à des réarrangements
majeurs et peuvent parfois être décelées par cytogénétique. Par
ailleurs, des variations communes de la séquence des gènes sont
rencontrées tout au long du génome et sont responsables de
l'extrême diversité de l'espèce humaine : ce sont les
polymorphismes génétiques.
Altérations ponctuelles : mutations et polymorphismes
Des erreurs survenant au cours de la réplication ou induites par
des agents mutagènes peuvent conduire au remplacement d'un
nucléotide par un autre (mutation par substitution), à la perte
d'un nucléotide (délétion) ou à l'addition d'un nucléotide
(insertion). La protéine issue du gène muté peut porter en
conséquence une altération de structure pouvant conduire à une
réduction d'activité ou à la perte de sa fonctionnalité.
Ces mutations sont à l'origine des maladies héréditaires
congénitales, lorsqu'elles surviennent dans la lignée germinale, et
de cancers, lorsqu'elles surviennent dans une lignée somatique. On
distingue les mutations silencieuses (conservation de l'aminoacide
de la chaîne protéique), les mutations faux-sens (remplacement d'un
aminoacide par un autre) et les mutations non-sens qui conduisent à
une protéine tronquée (survenue d'un codon stop, altération d'un
site d'épissage). Insertions et délétions modifient le cadre de
lecture, donc la séquence de la protéine, et sont, par principe,
des mutations non-sens.
Outre ces altérations pathologiques rares mais délétères
existent de nombreuses variations individuelles de la séquence
génomique que l'on appelle polymorphismes génétiques. Leur
fréquence varie d'un gène à l'autre ; elle est plus élevée dans les
introns que dans les exons. Elles sont le support, la plupart du
temps, de variations phénotypiques mineures et expliquent les
différences individuelles, depuis la couleur des yeux ou la forme
du visage jusqu'à la prédisposition héréditaire à certaines
maladies ou la sensibilité à certains médicaments : à ce titre, les
polymorphismes génétiques intéressent le médecin ou le
pharmacologue. Notons que tous les polymorphismes ne sont pas de
simples substitutions d'un nucléotide par un autre (SNP, single
nucleotide polymorphism) : il existe des polymorphismes du nombre
de répétitions de séquences micro- ou minisatellitaires, comme
mentionné plus haut. Il existe également des variations du
nombre de copies de certains gènes (CNV, pour copy number
variations), que l'on peut considérer comme des polymorphismes et
qui peuvent jouer un rôle important dans le niveau d'expression des
gènes.
Mutations par substitution et SNP sont donc biochimiquement
identiques (remplacement d'un nucléotide par un autre) mais ont une
signification très différente : on utilisera le terme de mutation
pour les événements rares et délétères et le terme de polymorphisme
pour les événements fréquents (au moins 10 % de fréquence
allélique, soit 1 % de sujets homozygotes variants) et non
délétères. Comme pour les mutations, on distingue les
polymorphismes silencieux et les polymorphismes non synonymes, avec
remplacement d'un aminoacide par un autre au niveau de la protéine.
Il faut noter que les polymorphismes silencieux peuvent avoir
des conséquences fonctionnelles pour plusieurs raisons : la
fréquence d'utilisation des divers codons est variable, et la
population des ARN de transfert correspondants peut ne pas y être
adaptée ; la synthèse de la protéine peut s'en trouver ralentie, et
parfois son repliement sera défectueux. Par ailleurs, la structure
dans l'espace de l'ARN messager peut être différente en raison du
remplacement d'un nucléotide par un autre, et cela peut avoir des
conséquences sur la stabilité des ARN messagers et sur la vitesse
de la traduction en protéine, donc sur la quantité de protéine
exprimée.
Réarrangements du génome
Des anomalies de la méiose, plus rarement de la mitose, peuvent
conduire à des réarrangements importants du génome.
Les trisomies sont les réarrangements les plus fréquents, avec
des conséquences pathologiques majeures. Des délétions et des
insertions de segments chromosomiques surviennent lors de
phénomènes de recombinaison homologue ou de transposition.
La duplication de certains gènes peut survenir dans la lignée
germinale, au cours de la méiose, mais l'amplification, qui conduit
à la multiplication parfois considérable du nombre de copies d'un
gène, ne survient généralement que dans des lignées somatiques et
s'observe dans les cellules cancéreuses. Enfin, les translocations
chromosomiques, dues à une recombinaison inégale entre séquences
homologues dans deux chromosomes différents, s'observent également
dans les cancers, tout particulièrement les leucémies.
Méthodes d'étude des polymorphismes génétiques
Méthodes de génotypage classiques
Le séquençage du génome a permis la constitution de bases de
données recensant les SNP au fur et à mesure de leur
identification. Dans les bases publiques et privées, on compte
actuellement 10 à 15 millions de SNP identifiés. Toutefois,
ces bases de données n'indiquent pas toujours la fréquence de ces
variants, pas plus que les conséquences fonctionnelles des
variations. En outre, un certain nombre relève d'erreurs de
séquençage, et une remise à jour périodique des bases de données
est nécessaire.
La technologie de recherche des polymorphismes génétiques a fait
l'objet de plusieurs revues vers lesquelles nous renvoyons le
lecteur [3-6]. La recherche, dans une population donnée, d'un
polymorphisme déjà connu (génotypage) fait tout d'abord appel à une
PCR qui permettra d'amplifier le segment d'ADN où se trouve la
modification de séquence, à l'aide de deux amorces
oligonucléotidiques spécifiques, situées de part et d'autre du
polymorphisme. Les amplifiats pourront alors être étudiés
selon plusieurs techniques :
- – le séquençage pur et simple, technique de référence,
de moins en moins coûteuse et de plus en plus utilisée ;
- – la mise en évidence d'un site de restriction induit ou
supprimé par la variation de séquence que constitue le
polymorphisme. L'amplifiat, après digestion par une enzyme
appropriée, est soumis à électrophorèse sur gel d'agarose ou de
polyacrylamide. Le nombre de bandes d'ADN détectées et leur
longueur permettent de distinguer sans ambiguïté les homozygotes
communs, les hétérozygotes et les homozygotes variants. C'est une
technique rapide, efficace et extrêmement robuste ;
- – la mise en évidence d'une altération des propriétés
d'hybridation de l'amplifiat avec une sonde, due à la présence d'un
mismatch (hybridation spécifique d'allèle). On peut immobiliser la
sonde spécifique de l'allèle sur un support solide ; on réalise
ensuite une hybridation avec les amplifiats marqués (radioactivité,
fluorescence) et dénaturés. On peut, inversement, immobiliser les
produits de PCR et réaliser l'hybridation avec des sondes marquées.
Cette technique, qui connaît de nombreuses variantes, se prête bien
à l'automatisation et au traitement de grandes séries (SNP-arrays),
mais n'est pas exempte d'erreurs de génotypage ;
- – la recherche d'une altération de l'extension d'amorce.
C'est une technique robuste de discrimination allélique, car une
ADN polymérase, ne possédant pas d'activité 3’→5’ exonucléasique,
ne peut allonger un oligonucléotide que si celui-ci est
parfaitement complémentaire en 3’ de la séquence cible. Dans ce
cas, selon l'amorce discriminante utilisée, il y aura formation ou
non d'un produit d'amplification de l'ADN lors d'une PCR. Une
technique utilisant l'extension d'une amorce pour identifier chaque
nucléotide incorporé apparaît très résolutive et automatisable : le
pyroséquençage ;
- – la mesure du point de fusion par PCR en temps réel
(rt-PCR). Cette technique repose sur la détection et la
quantification d'un marqueur fluorescent au cours de la
réaction. Pour distinguer les allèles, on réalise une courbe
de fusion après avoir effectué la PCR. Le produit de PCR a
alors un Tm (température de fusion) différent selon qu'il s'agit
d'un allèle ou de l'autre ; la courbe dérivée permet de
différencier clairement les Tm. Le signal fluorescent est
proportionnel à la quantité de produits de PCR générés.
Les produits d'amplification peuvent être détectés selon deux
grands principes : par marquage non spécifique avec des agents se
liant à l'ADN double brin et par marquage spécifique à l'aide de
sondes fluorescentes.
La découverte de nouveaux polymorphismes dans un gène d'intérêt
encore peu ou insuffisamment étudié sur ce plan fait appel
essentiellement au séquençage de tout ou partie du gène,
éventuellement après PCR réalisée au niveau des exons et des
jonctions intron-exon qui sont les parties les plus « signifiantes
» du gène. Pour éviter la lourdeur du séquençage, plusieurs
techniques ont été développées :
- – la dHPLC (chromatographie liquide à haute performance
en conditions dénaturantes) permet de détecter, dans un fragment
obtenu par PCR, l'existence d'une variation allélique.
Les seuls fragments manifestant l'existence d'un polymorphisme
seront alors séquencés afin de localiser ce polymorphisme ;
- – le TILLING (targeting induced local lesions in
genomes) est une technique de criblage de SNPs inconnus et repose
sur l'utilisation d'une endonucléase Cel1, issue du céleri, qui
clive les hétérohybrides d'ADN au niveau d'un mésappariement.
Les échantillons amplifiés sont dénaturés par chauffage puis
renaturés pour générer des hétérohybrides entre les amplicons
variants et les amplicons sauvages. Les hétérohybrides sont
alors digérés par l'endonucléase Cel1 et les produits obtenus sont
visualisés par électrophorèse en gel dénaturant [7] ;
- – la PCR-SSCP (single strand conformation
polymorphisms). Dans cette option, une PCR est réalisée pour
amplifier la région d'intérêt. Le produit de PCR est ensuite
dénaturé et soumis à une électrophorèse en gel de polyacrylamide
non dénaturant [8]. Un changement ponctuel de séquence peut
entraîner un changement de la structure tertiaire de l'ADN ; il en
résulte alors une mobilité différente pour les
fragments portant les différents allèles. Ces mutations
sont détectées par l'apparition d'une nouvelle bande sur un
autoradiogramme (détection radioactive) ;
- – le SNP mining (brevet déposé par la société Nanogen,
San Diego, CA). Cette technique repose sur l'utilisation d'une
protéine mutS d’Escherichia coli, marquée par un fluorophore,
capable de détecter des mésappariements [9]. Les régions d'ADN
sauvage, amplifiées par PCR, sont immobilisées sur un support par
microélectronique. Après dénaturation des produits de PCR, les
échantillons à tester sont hybridés sur ces supports en présence de
la protéine mutS qui reconnaît tout mésappariement, témoignant que
l'échantillon testé présente une variation par rapport à l'ADN
sauvage. Le produit de PCR testé est alors séquencé pour
identifier le nouveau polymorphisme.
Enfin, la recherche du rôle fonctionnel des polymorphismes est
l'étape la plus délicate, car elle ne fait pas seulement appel à
des banques génomiques, mais à des banques tissulaires dont les
échantillons seront utilisés pour évaluer l'expression du gène ou
l'activité de l'enzyme. À défaut, des données plus globales peuvent
être obtenues sur l'individu entier, au niveau pharmacocinétique
(concentration plasmatique d'un métabolite par exemple) ou au
niveau pharmacodynamique (efficacité et toxicité).
La constitution de la population à étudier est certainement
l'étape la plus importante dans la recherche du rôle fonctionnel
d'un polymorphisme.
Génotypage à haut débit
Plusieurs sociétés comme Affymetrix et Illumina ont développé des
systèmes d'analyse à haut débit de SNP par multiplexage. Ces «
puces » permettent de génotyper en une seule fois des milliers de
SNP ; les dernières en date dépassent le million de SNP, couvrant
l'intégralité du génome. Leur utilisation n'est possible que dans
le cas de très grandes études portant sur des populations
importantes de sujets (plusieurs milliers ou dizaines de milliers
de sujets), car le risque de trouver des « faux positifs »
(associations apparaissant significatives, mais ne l'étant pas) est
extrêmement élevé.
Cette approche « génome entier » est dite non biaisée, car elle
ne part d'aucune hypothèse de travail concernant des associations
entre génotype et phénotype. Dans cette approche, la plupart des
SNP génotypés sont situés en dehors des régions codantes et même
régulatrices des gènes ; ce sont des tags (étiquettes), localisés
dans des introns ou des régions intergéniques, et dont le rôle
fonctionnel est inconnu. Il est souvent difficile, lorsqu'un
SNP a été reconnu comme associé à telle donnée clinique en
utilisant ce genre d'approche, de remonter du SNP au gène et du
gène à la fonction liant génotype et phénotype.
Enfin, les approches « génome entier » permettent la
reconstitution des haplotypes à partir des données fournies par le
génotypage de plusieurs SNP par gène. Ces haplotypes résultent
de l'existence d'un déséquilibre de liaison entre plusieurs SNP, dû
au fait qu'ils ne sont pas survenus de façon indépendante dans la
population. Il peut être particulièrement intéressant
d'identifier, plutôt que le SNP individuel, l'haplotype associé aux
données cliniques étudiées, car cela peut permettre d'identifier
plus rapidement la relation fonctionnelle génotype-phénotype et de
comparer, de façon pertinente, des ethnies différentes, qui peuvent
porter les mêmes variations au niveau SNP mais sur des haplotypes
distincts.
Une autre approche à haut débit consiste en la mise à
disposition de « puces » dédiées, c'est-à-dire dont les SNP à
génotyper ont été déterminés par l'utilisateur en fonction des
gènes auxquels il s'intéresse (approche « gène candidat » par
opposition à l'approche « génome entier »). Cette approche permet
ainsi le génotypage simultané de 48, 96, 384 ou quelques milliers
de SNPs. Elle requiert moins d'ADN d'une part, et elle peut être
appliquée, d'autre part, à des populations moins importantes, de
quelques centaines d'individus. Elle s'appuie au départ, comme le
génotypage « individuel » du paragraphe précédent, sur des
hypothèses mécanistiques concernant les associations possibles
entre un polymorphisme donné, localisé dans un gène identifié, et
la situation clinique considérée.
Épidémiologie moléculaire
Définitions
La première application découlant de la connaissance des
polymorphismes génétiques concerne la recherche d'associations
entre le risque de développer une maladie (un cancer) et la
présence d'un génotype donné. Il faut noter d'emblée que ces
recherches nécessitent l'étude d'une population ayant développé la
maladie et d'une population ne l'ayant pas développée servant de
témoin, afin de déterminer si l'association entre risque de cancer
et génotype est significative. Il faut bien évidemment que
population atteinte et population témoin soient, autant que faire
se peut, appariées sur l'âge, le sexe, le milieu
socioprofessionnel, les facteurs de risque connus, etc. Notons
également la différence importante qui existe entre les mutations
responsables d'une prédisposition aux cancers, comme les mutations
de BRCA1 ou BRCA2 et les SNP qui sont le reflet (mécanistique ou
non) d'une susceptibilité particulière aux cancers, avec un niveau
de risque nettement plus faible, souvent de l'ordre de 1,5 à 3.
Grâce aux progrès du génotypage à haut débit, cette branche de
l'épidémiologie s'est accélérée de façon impressionnante et de très
nombreuses publications paraissent régulièrement. Nous ne pourrons
ici que citer quelques exemples choisis dans la littérature et
illustrant les diverses approches développées et le type de réponse
qu'elles peuvent apporter.
Approche SNP-candidat
Dans ce type d'étude, le point de départ est un SNP ou quelques SNP
précis qui ont généralement fait l'objet d'études fonctionnelles
antérieures qui ont lié leur présence à une caractéristique
biologique particulière. Nous donnerons comme exemple celui de
l'association entre le polymorphisme Arg399Gln du gène de
réparation de l'ADN appelé XRCC1 dans un article datant de 2002
[10]. Il était connu que ce polymorphisme pouvait être associé
au risque de survenue de cancers de la peau en liaison avec
l'exposition solaire, mais les études disponibles étaient
contradictoires. Les auteurs ont génotypé, par une méthode
robuste (RFLP), 499 sujets ayant développé un cancer
basocellulaire, 246, un cancer spinocellulaire et 431 sujets
témoins. Le génotype variant Gln/Gln est associé à une
diminution globale du risque de cancers de la peau, avec des odds
ratio de 0,7 [0,4-1,0] et de 0,6 [0,3-0,9], mais qu'il est associé
également à une augmentation de ce risque chez les sujets
surexposés au soleil et développant régulièrement des brûlures de
la peau (odds ratio de 6,8 [2,4-19,2]).
Approche gène candidat
Dans ce type d'étude, les chercheurs partent d'un gène ou d'une
voie métabolique que l'on soupçonne d'être impliquée dans
l'oncogenèse d'un organe particulier. L'exemple choisi est celui
des gènes impliqués dans le métabolisme de la testostérone et leur
rôle possible dans les cancers de la prostate [11].
La population étudiée comprenait 221 cas et 205 témoins ; un
total de 15 SNP dans quatre gènes et les CNV de trois autres gènes
ont été recherchés. Une association significative a été observée
entre un polymorphisme du gène de la stéroïde 5α-réductase (qui
convertit la testostérone en 7-dihydrotestostérone) et le risque de
cancer de la prostate, avec un odds ratio de 1,8 [1,04-3,13].
Approche génome entier
Ces études utilisent les « puces » d'Affymetrix ou d'Illumina pour
le génotypage de plusieurs centaines de milliers de SNP sur des
effectifs considérables. Dans l'exemple retenu [12], paru en
octobre 2009 dans Nature Genetics avec une centaine de signataires,
ce sont, dans un premier temps, plus de 500 000 SNP qui ont
été génotypés chez 1 854 cas de cancer de la prostate et
1 894 sujets témoins. À partir des données obtenues, les
auteurs ont restreint le nombre de SNP à un peu plus de
40 000, et augmenté la population à 3 650 sujets malades et à
3 940 sujets témoins, puis à environ 15 000 individus dans
chaque groupe en regroupant des études distinctes.
Ils parviennent de la sorte à identifier des régions
chromosomiques associées à la susceptibilité au cancer de la
prostate avec une haute probabilité (p de l'ordre de
10–8 à 10–33). Une douzaine de gènes
candidats émergent ainsi de cette étude ; ils ne sont, à ce stade,
qu'impliqués de façon putative dans le cancer de la prostate, et le
retour à des études ciblant ces gènes est encore nécessaire.
Pharmacogénétique
Définitions
Il s'agit de la deuxième grande application médicale de la
connaissance des polymorphismes constitutionnels. Elle a pour
objectif de rechercher des liens entre des polymorphismes
génétiques et l'activité des médicaments, tant en ce qui concerne
leur efficacité que leur toxicité. Sur le plan pratique, de telles
études peuvent conduire à l'individualisation des prescriptions.
Ces études ne sont pas réalisables sur des populations aussi
importantes que celles destinées à l'épidémiologie moléculaire ;
elles portent au mieux sur quelques centaines de patients, parfois
moins de 100. La définition du phénotype est délicate et
certainement moins simple que dans les études épidémiologiques ; ce
phénotype peut être la réponse au traitement, la durée de survie
sans récidive ou sans progression, la durée de survie totale,
l'apparition de toxicités rédhibitoires, etc. La constitution
de populations témoins est souhaitable mais n'est pas
indispensable, car il est difficile d'identifier des groupes de
sujets atteints de la même maladie à des stades comparables, et
n'ayant pas reçu le même traitement que celui étudié.
De nombreux gènes impliqués dans la réponse aux agents
anticancéreux interviennent dans le transport et le métabolisme
général des xénobiotiques ou dans la réparation des lésions de
l'ADN. Ces phénomènes constituent des déterminants cruciaux de
l'efficacité et de la toxicité des agents qui endommagent l'ADN,
directement ou indirectement. Activation métabolique, détoxication
et réparation de l'ADN sont également impliquées dans l'activité
des agents cancérogènes et les polymorphismes des gènes
responsables constituent souvent un facteur de risque, parfois de
protection, de la cancérogenèse liée aux agents chimiques ou aux
radiations. Il paraît donc parfois difficile de faire la part
des choses entre l'aspect épidémiologique et l'aspect
pharmacologique ; les études cliniques de pharmacogénétique doivent
être rigoureuses si elles sont destinées à identifier des facteurs
de prédiction de réponse ou de toxicité des agents anticancéreux et
non de simples facteurs pronostiques indépendants du
traitement.
Dans le cadre de la thérapeutique, il serait souhaitable de
pouvoir disposer de modèles expérimentaux permettant de faire
l'économie des études exploratoires chez l'homme afin de
sélectionner des pistes intéressantes dont la validation serait
plus rapide. Il n'existe évidemment pas de modèles animaux des
polymorphismes humains ; il est envisageable, en revanche,
d'utiliser des collections de lignées cellulaires d'origine humaine
afin d'explorer les relations entre génotype et phénotype de
sensibilité aux agents anticancéreux. Deux types de modèles ont été
envisagés :
- – le modèle des lignées tumorales humaines du National
Cancer Institute, dont la chimiosensibilité à des milliers de
composés a été étudiée in vitro et dont le génotype peut être
déterminé par des approches de SNP candidats ou des approches
génome entier. Des relations génotype-phénotype ont été
établies, illustrées par la figure 4 [13, 14] ; cette
approche a été validée par plusieurs équipes et pourrait servir
de base pour mettre en place des essais cliniques orientés
;
- – le modèle des lignées lymphoblastoïdes humaines (non
tumorales) obtenues dans le cadre du projet HapMap qui vise à
recenser l'ensemble des polymorphismes génétiques humains.
Le génotype de ces lignées a été déterminé par des approches à
haut débit (plus de 500 000 SNP) et leur chimiosensibilité
peut être déterminée expérimentalement. Là encore, des relations
génotype-phénotype ont été établies [15] (figure 5) et méritent une
validation clinique.
Quelques polymorphismes intéressants
en oncopharmacologie
Sans faire l'inventaire de tous les polymorphismes identifiés parmi
les gènes intervenant dans le transport ou le métabolisme des
médicaments anticancéreux, on peut citer quelques exemples
importants dont l'utilisation en thérapeutique pourrait être
rapidement mise en œuvre. Des détails pourront être trouvés
dans les revues publiées sur le sujet [16-21]. Il est à noter
que les médicaments relevant des approches « ciblées » sont, tout
autant que les médicaments « classiques », sujets aux
polymorphismes des gènes de transport et de métabolisme. S'y
ajoutent les polymorphismes des gènes des protéines cibles comme
les récepteurs à activité tyrosine-kinase, encore mal systématisés.
Nous avons retenu quatre exemples.
Dihydropyrimidine déshydrogénase
C'est une enzyme de détoxication du 5-fluoro-uracile, médicament
utilisé entre autres dans le traitement des cancers digestifs et
des voies aérodigestives supérieures. Il était connu depuis
longtemps que son activité, principalement hépatique, conditionnait
le niveau des concentrations plasmatiques de 5-fluoro-uracile et
partant, son activité. Il était connu également que la
déficience complète de l'enzyme s'accompagnait d'une toxicité
létale de la molécule. Cette déficience est liée à l'existence de
polymorphismes ; 17 allèles différents, tous conduisant à une
activité réduite de l'enzyme, ont été identifiés. Un allèle
apparaît prépondérant : il s'agit d'une mutation au niveau d'une
zone d'épissage flanquant l'exon 14
(IVS14 + 1G > A) conduisant à une inactivité
complète de l'enzyme [22]. La fréquence de l'allèle est de 0,9
% et les hétérozygotes ont un risque de toxicité accru en raison
d'une quantité réduite d'enzyme. Il existe une méthode simple,
couplant PCR et RFLP, pour détecter cette mutation, et un criblage
des patients avant traitement par 5-fluoro-uracile est possible
mais ne s'est pas généralisé.
UDP-glucuronosyltransférase 1A1 (UGT1A1)
C'est une enzyme de phase II impliquée dans la détoxication de
composés endogènes comme la bilirubine et exogènes comme certains
médicaments, dont l'irinotécan, ou plus exactement le métabolite
actif de ce dernier, le SN-38. Il existe un variant, appelé
UGT1A1*28, au niveau du promoteur de l'enzyme. Concernant le nombre
de séquences TA dans la TATA box [23] : il est normalement de six,
mais est de sept de façon homozygote chez 15 à 20 % des sujets qui
sont dits porteurs du syndrome de Gilbert, caractérisé par une
diminution de l'activité de l'enzyme, entraînant une élévation de
la bilirubinémie non conjuguée (15 à 20 μM) et un risque de
toxicité accru de l'irinotécan. Le génotypage des sujets
devant recevoir ce médicament est possible en routine.
Protéines p53 et MDM2
Outre ses mutations bien connues, qui sont présentes dans de
nombreux cancers, la protéine p53 présente un polymorphisme de
fréquence allélique d'environ 25 %, variable selon les ethnies.
Ce polymorphisme résulte en un remplacement d'une arginine par
une proline sur le codon 72. Il a été montré que le variant
Arg72 est capable d'induire l'apoptose de façon plus
active que le variant Pro72 dans les cellules n'ayant
pas de mutation invalidante de p53. Cela serait dû à une différence
dans la capacité de la molécule à induire le relargage du
cytochrome c dans le cytoplasme [24]. Dans les modèles in vitro, la
réponse à des médicaments comme le cisplatine et la doxorubicine
est supérieure pour les cellules exprimant l'allèle
Arg72 que l'allèle Pro72 [25], et cela a été
confirmé chez des patients traités par cisplatine pour un cancer
des voies aérodigestives supérieures, avec une survie plus brève
chez les patients portant l'allèle Pro72 à l'état
homozygote lorsque la p53 ne présente pas de mutation invalidante,
le contraire étant observé lorsque p53 est mutée [26]. Dans une
étude sur les cancers du sein traités par tamoxifène en situation
adjuvante, il a été montré que les patientes ayant au moins un
allèle Pro72 avaient une survie sans récidive
significativement plus longue que celles n'en ayant aucun [27].
La protéine MDM2, qui entraîne p53 vers le protéasome, en
absence d'activation de cette dernière, porte également un
polymorphisme fonctionnel intronique (T309G) de fréquence allélique
voisine de 30 % [28]. Le gène variant aurait une affinité
supérieure pour l'activateur transcriptionnel Sp1, ce qui
génèrerait des concentrations plus élevées de protéine MDM2 et une
atténuation de la voie p53, susceptible d'avoir des conséquences
sur le risque de cancer et la sensibilité des tumeurs au
traitement.
Cytochromes P450 2D6 (CYP2D6)
Les cytochromes P450 constituent une famille d'acteurs fondamentaux
dans le métabolisme des médicaments. Certains, comme le CYP1A1,
jouent essentiellement un rôle d'activateurs d'agents cancérogènes,
alors que d'autres, comme le CYP3A4 ou le CYP2D6, jouent un rôle
majeur dans l'activation ou la détoxication des médicaments.
Il a été montré que CYP2D6 était responsable de
l'activation du tamoxifène en 4-hydroxytamoxifène et en
4-hydroxy-N-desméthyltamoxifène [29]. Environ 6 % des Caucasiens et
1 % des Asiatiques n'ont aucune activité enzymatique décelable, car
homozygotes pour des variations génétiques invalidant la protéine ;
un petit pourcentage, surtout caractérisé dans les populations
d'Afrique orientale, présente une activité très élevée
(métaboliseurs ultrarapides) due à la présence de copies
surnuméraires du gène, le reste des sujets étant des métaboliseurs
extensifs (génotype commun) ou intermédiaire (sujets hétérozygotes
pour l'une ou l'autre des mutations délétères).
L'effet du génotype 2D6 a été étudié chez des femmes traitées
pour un cancer du sein par tamoxifène en situation adjuvante. Une
étude a rapporté une diminution significative de la survie sans
progression chez les patients ayant un génotype homozygote pour la
variation CYP2D6*4, la plus fréquente chez les Caucasiens, par
rapport aux patientes ayant un génotype hétérozygote ou homozygote
commun [30]. Le polymorphisme pourrait expliquer la résistance
au tamoxifène que l'on observe lors de récidives très précoces
survenant sous traitement. Les inhibiteurs du CYP2D6, en
particulier des antidépresseurs, pourraient mimer cette situation
et compromettre l'efficacité des traitements [31]. Une étude
récente confirme le rôle des génotypes « métaboliseur lent » sur le
risque de rechute sous tamoxifène [32].
Conclusion
Ces quelques exemples, tirés de l'épidémiologie moléculaire et de
la pharmacogénétique, montrent à quel point la connaissance du
génome humain peut apporter de données importantes pour évaluer le
risque de cancer au niveau individuel et pour personnaliser
l'utilisation des médicaments anticancéreux. Il reste à mettre
en pratique ces données nouvelles ; il faut être conscient que,
pour évaluer de nouvelles attitudes thérapeutiques prenant en
compte les données génomiques, il sera nécessaire de développer une
méthodologie tout aussi rigoureuse que la méthodologie d'évaluation
des nouveaux médicaments : après avoir exploré la pertinence d'une
association de façon rétrospective, il faudra la valider en
situation prospective, puis en démontrer l'utilité clinique dans
une étude randomisée dédiée.Conflits d'intérêts :
aucun.
Références
1 Etienne J, Clauser E, Housset C, Roingeard P. Biochimie génétique
et biologie moléculaire, 9e édition, Paris : Masson,
2006, 294 p.
2 Brown TA. Génomes. Paris : Flammarion Médecine
Sciences, 2004.
3 Syvanen AC. Accessing genetic variation: genotyping
single nucleotide polymorphisms. Nat Rev Genet 2001 ; 2 :
930-42.
4 Kwok PY. Methods for genotyping single nucleotide
polymorphisms. Annu Rev Genomics Hum Genet 2001 ; 2 :
235-58.
5 Shi MM. Enabling large-scale pharmacogenetic studies by
high-throughput mutation detection and genotyping technologies.
Clin Chem 2001 ; 47 : 164-72.
6 Shi MM, Bleavins MR, de la Iglesia FA.
Technologies for detecting genetic polymorphisms in
pharmacogenomics. Mol Diagn 1999 ; 4 : 343-51.
7 Till BJ, Burtner C, Comai L, Henikoff S.
Mismatch cleavage by single-strand specific nucleases. Nucl Acid
Res 2004 ; 32 : 2632-41.
8 Orita M, Suzuki Y, Sekiya T, Hayashi K.
Rapid and sensitive detection of point mutations and DNA
polymorphisms using the polymerase chain reaction. Genomics
1989 ; 5 : 874-9.
9 Behrensdorf HA, Pignot M, Windhab N,
Kappel A. Rapid parallel mutation scanning of gene fragments
using a microelectronic protein-DNA chip format. Nucl Acid Res
2002 ; 30 : e64.
10 Nelson HH, Kelsey KT, Mott LA,
Karagas MR. The XRCC1 Arg399Gln polymorphism, sunburn, and
non-melanoma skin cancer: evidence of gene-environment interaction.
Cancer Res 2002 ; 62 : 152-5.
11 Setlur SR, Chen CX, Hossain RR, Ha JS,
Van Doren VE, Steuzel B, et al. Genetic variation of
genes involved in dihydrotestosterone metabolism and the risk of
prostate cancer. Cancer Epidemiol Biomarkers Prev 2010 ;
19 : 229-39.
12 Eeles RA, Kote-Jarai Z, Al Olama AA,
Giles GG, Guy M, Severi G, et al.
Identification of seven new prostate cancer susceptibility loci
through a genome-wide association study. Nat Genet 2009 ;
41 : 1116-21.
13 Le Morvan V, Bellott R, Moisan F,
Mathoulin-Pélissier S, Bonnet J, Robert J.
Relationships between genetic polymorphisms and anticancer drug
cytotoxicity « vis-à-vis » the NCI-60 panel. Pharmacogenomics
2006 ; 7 : 843-52.
14 Faur N, Araud L, Laroche-Clary A,
Kanno J, Toutain J, Yamori T, et al. The
association between the T309G polymorphism of the MDM2 gene and
sensitivity to anticancer drug is dependent on the p53 mutational
status in cellular models. Br J Cancer 2009 ; 101 :
350-6.
15 Huang RS, Duan S, Bleibel WK, Kistner EO,
Zhang W, Clark TA, et al. A genome-wide approach to
identify genetic variants that contribute to etoposide-induced
cytotoxicity. Proc Natl Acad Sci USA 2007 ; 104 :
9758-63.
16 Robert J, Le Morvan V, Smith D,
Pourquier P, Bonnet J. Predicting drug response and
toxicity based on gene polymorphisms. Crit Rev Oncol Hematol
2005 ; 54 : 171-96.
17 McLeod HL, Evans WE. Pharmacogenomics: unlocking
the human genome for better drug therapy. Annu Rev Pharmacol
Toxicol 2001 ; 41 : 101-21.
18 Boddy AV, Ratain MJ. Pharmacogenetics in cancer
etiology and chemotherapy. Clin Cancer Res 1997 ; 3 :
1025-30.
19 Loni L, Del Tacca M, Danesi R.
Pharmacogenetics of anticancer drugs in non-Hodgkin lymphomas. Br J
Cancer 2001 ; 85 : 1425-31.
20 Ensom MH, Chang TK, Patel P. Pharmacogenetics:
the therapeutic drug monitoring of the future? Clin Pharmacokinet
2001 ; 40 : 783-802.
21 Sekine I, Saijo N. Polymorphisms of metabolizing
enzymes and transporter proteins involved in the clearance of
anticancer agents. Ann Oncol 2001 ; 12 : 1515-25.
22 Van Kuilenburg AB, Meinsma R, Zoetekouw L, Van
Gennip AH. High prevalence of the IVS14 + 1G>A
mutation in the dihydropyrimidine dehydrogenase gene of patients
with severe 5-fluoro-uracil-associated toxicity. Pharmacogenetics
2002 ; 12 : 555-8.
23 Iyer L, Das S, Janisch L, Wen M,
Ramirez J, Karrison T, et al. UGT1A1*28 polymorphism
as a determinant of irinotecan disposition and toxicity.
Pharmacogenomics J 2002 ; 2 : 43-7.
24 Dumont P, Leu JI, Della Pietra 3rd AC,
George DL, Murphy M. The codon 72 polymorphic variants of
p53 have markedly different apoptotic potential. Nat Genet
2003 ; 33 : 357-65.
25 Sullivan A, Syed N, Gasco M,
Bergamaschi D, Trigiante G, Attard M, et al.
Polymorphism in wild-type p53 modulates response to chemotherapy in
vitro and in vivo. Oncogene 2004 ; 23 : 3328-37.
26 Bergamaschi D, Gasco M, Hiller L,
Sullivan A, Syed N, Trigiante G, et al. p53
polymorphism influences response in cancer chemotherapy via
modulation of p73-dependent apoptosis. Cancer Cell 2003 ;
3 : 387-402.
27 Wegman P, Stal O, Askmalm MS,
Nordenskjold B, Rutqvist LE, Wingren S. p53
polymorphic variants at codon 72 and the outcome of therapy in
randomized breast cancer patients. Pharmacogenet Genomics
2006 ; 16 : 347-51.
28 Bond GL, Hu W, Bond EE, Robins H,
Lutzker SG, Arva NC, et al. A single nucleotide
polymorphism in the MDM2 promoter attenuates the p53 tumor
suppressor pathway and accelerates tumor formation in humans. Cell
2004 ; 119 : 591-602.
29 Stearns V, Johnson MD, Rae JM, Morocho A,
Novielli A, Bhargava P, et al. Active tamoxifen
metabolite plasma concentrations after coadministration of
tamoxifen and the selective serotonin reuptake inhibitor
paroxetine. J Natl Cancer Inst 2003 ; 95 : 1758-64.
30 Goetz MP, Rae JM, Suman VJ, Safgren SL,
Ames MM, Visscher DW, et al. Pharmacogenetics of
tamoxifen biotransformation is associated with clinical outcomes of
efficacy and hot flashes. J Clin Oncol 2005 ; 23 :
9312-8.
31 Borges S, Desta Z, Li L, Skaar TC,
Ward BA, Nguyen A, et al. Quantitative effect of
CYP2D6 genotype and inhibitors on tamoxifen metabolism: implication
for optimization of breast cancer treatment. Clin Pharmacol Ther
2006 ; 80 : 61-74.
32 Schroth W, Antoniadou L, Fritz P,
Schwab M, Muerdter T, Zanger UM, et al. Breast
cancer treatment outcome with adjuvant tamoxifen relative to
patient CYP2D6 and CYP2C19 genotypes. J Clin Oncol 2007 ;
25 : 5187-93.
|