Home > Journals > Medicine > Bulletin du cancer > Full text
 
      Advanced search    Shopping cart    French version 
 
Latest books
Catalogue/Search
Collections
All journals
Medicine
Bulletin du Cancer
- Current issue
- Archives
- Subscribe
- Order an issue
- More information
Biology and research
Public health
Agronomy and biotech.
My account
Forgotten password?
Online account   activation
Subscribe
Licences IP
- Instructions for use
- Estimate request form
- Licence agreement
Order an issue
Pay-per-view articles
Newsletters
How can I publish?
Journals
Books
Help for advertisers
Foreign rights
Book sales agents



 

Texte intégral de l'article
 
  Printable version
  Version PDF

Gene polymorphisms


Bulletin du Cancer. Volume 97, Number 11, 1253-64, novembre 2010, Synthèse

DOI : 10.1684/bdc.2010.1203

Résumé   Summary  

Author(s) : J Robert , Inserm U916, Institut Bergonié, université de Bordeaux, 229, cours de l'Argonne, 33076 Bordeaux Cedex, France.

Summary : Cancers can be considered as gene diseases. A number of mechanisms leading to cancer have been identified through the discovery of structural alterations of genes called ‘oncogenes’ and ‘tumour suppressor genes’. Somatic and germinal mutations are rare but play a determinant role in the emergence of cancer, while common and frequent variations (polymorphisms) play a role in cancer susceptibility and in the effects of anticancer drugs (efficacy and toxicity). After a general overview on the structural and functional organisation of the human genome, we present here some of the techniques aimed at the identification of structural DNA variations. We present afterwards some examples of the role that play polymorphic constitutive variations of the genome in the occurrence of cancer (molecular epidemiology) and the activity of anticancer drugs (pharmacogenetics).

Keywords : DNA structure, genome, mutations, polymorphisms, molecular epidemiology, pharmacogenetics

Pictures

ARTICLE

Auteur(s) : J Robert

Inserm U916, Institut Bergonié, université de Bordeaux, 229, cours de l'Argonne, 33076 Bordeaux Cedex, France

Introduction

Dès la découverte des oncogènes, la recherche de mutations capables d'expliquer les altérations fonctionnelles des cellules cancéreuses s'est révélée fructueuse et, très rapidement, de nombreuses mutations, délétions, réarrangements géniques ont été découverts dans les tumeurs. Grâce à l'avènement des techniques de séquençage à haut débit, la connaissance du génome tumoral a encore considérablement progressé. Le génome constitutionnel, en revanche, a intéressé plus tardivement les cancérologues, d'abord au niveau de mutations rares conférant une prédisposition, mais aussi au niveau de variations de séquences banales et fréquentes (polymorphismes) au niveau de gènes qui ne paraissent pas directement impliqués dans l'oncogenèse. Là encore, les grands consortiums de réalisation de séquençages nous ont livré des masses d'informations dont la majeure partie n'est pas encore exploitée. Deux branches nouvelles de la biologie sont nées de la connaissance des variations du génome humain, l'une à l'interface avec l'épidémiologie, que l'on appelle couramment l'épidémiologie moléculaire, l'autre à l'interface avec la pharmacologie, la pharmacogénétique. Les oncologues ont largement contribué à ces deux sciences.

Nous présenterons, dans une première partie, les bases de l'organisation structurale et fonctionnelle du génome humain, en insistant sur la diversité individuelle qu'on y rencontre et qui sert de fondement à l'épidémiologie moléculaire comme à la pharmacogénétique. Dans les autres parties, après un aperçu sur les techniques usuelles d'identification des variations communes du génome constitutionnel, nous présenterons à travers quelques exemples, les relations existant entre la présence de ces variations et le risque de cancer ou l'activité des agents anticancéreux.

Organisation du génome humain

Nous reprendrons simplement, dans ce paragraphe, quelques données essentielles sur le génome humain et ses variations individuelles, destinées à comprendre la nature et le rôle fonctionnel des polymorphismes. Plusieurs ouvrages détaillés peuvent être consultés [1, 2].

Chromosomes et chromatine

Le génome humain est constitué de deux fois 3,2 milliards de paires de nucléotides répartis en deux fois 23 chromosomes. Un rappel de la structure des nucléotides et de l'ADN est donné (figure 1). Chaque chromosome contient une seule molécule d'ADN sous une forme compactée à l'extrême (figure 2). Les chromosomes ne sont identifiables que pendant la mitose, au cours de laquelle ils deviennent visibles au microscope. En dehors de la mitose, cette compaction est moindre et les chromosomes ne sont plus directement identifiables. Dans les chromosomes, l'ADN est associé à de nombreuses protéines, l'ensemble formant la chromatine. On distingue l'hétérochromatine, très compacte, qui ne peut être le siège des opérations de transcription, et l'euchromatine, plus relâchée, où peuvent se dérouler ces opérations. La chromatine est constituée de particules enchaînées linéairement, appelées nucléosomes, empilés les uns sur les autres à la manière d'un collier de perles. Chaque nucléosome est constitué d'une partie centrale cylindrique protéique autour de laquelle s'enroule l'ADN (figure 2).

Les protéines constitutives du nucléosome sont les histones, protéines basiques interagissant avec l'ADN par des liaisons ioniques. La partie centrale du nucléosome est un octamère rassemblant deux copies des histones H2A, H2B, H3 et H4, l'histone H1 servant aux interactions entre nucléosomes. Les histones subissent de multiples modifications posttranscriptionnelles qui modulent leur interaction avec l'ADN et participent à la régulation de la transcription : méthylations, acétylations, phosphorylations en particulier.

Séquences génomiques

Seule une partie des séquences d'ADN des chromosomes constitue les gènes et, à l'intérieur de ceux-ci, seule une partie code pour la synthèse de protéines. À proximité des séquences codantes des gènes, de nombreuses séquences régulatrices de leur transcription ont été identifiées. Il existe dans le génome, en dehors des gènes, de nombreuses séquences non codantes, dont certaines sont répétitives et dont la fonction n'est pas toujours connue.

Gènes

Les gènes contiennent l'information nécessaire à la synthèse des protéines. Cette information est discontinue dans le génome eucaryote, et les séquences informatives (codantes) appelées exons, sont séparées par des séquences non informatives appelées introns (figure 3). La séquence protéique sera donc déterminée par la séquence nucléotidique des seuls exons ; toutefois, le début du premier exon et l'extrémité du dernier exon peuvent ne pas coder mais jouent un rôle régulateur. Les jonctions entre exons et introns possèdent de courtes séquences caractéristiques qui seront reconnues par la machinerie assurant la maturation des ARN messagers.

Les séquences régulatrices de la transcription des gènes sont localisées particulièrement en amont du premier exon, dans une région appelée promoteur. Ces séquences peuvent être reconnues par des protéines spécifiques appelées facteurs de transcription. D'autres séquences régulatrices, parfois distantes de plusieurs milliers de bases, sont appelées enhancers ou silencers. On peut les rencontrer aussi dans les introns ou en aval du dernier exon.

Notons que tous les gènes ne codent pas pour des protéines, mais pour des ARN particuliers qui ne seront pas traduits (ARN ribosomiques, ARN de transfert, microARN, etc.).

Séquences structurales des chromosomes

Plusieurs sites chromosomiques contiennent des séquences essentielles aux fonctions même des chromosomes : au niveau du centromère, où se fait l'attachement du chromosome sur le fuseau mitotique ; au niveau des télomères, des extrémités des chromosomes qui doivent être protégées de l'attaque des exonucléases ; au niveau des origines de réplication, dispersées le long des chromosomes.

Séquences répétitives

Environ 50 % du génome est constitué de séquences qui sont répétées, soit les unes à la suite des autres, en tandem, soit de façon dispersée dans le génome. Elles sont de taille variable, constituées de répétitions d'un motif unitaire plus ou moins complexe. Selon la taille du motif et le nombre de répétitions, on distingue :
  • les microsatellites (short tandem repeats ou STR), comportant des séries de répétitions n'excédant pas le plus souvent quelques dizaines, d'un motif court (en majorité d’un à cinq nucléotides) que l'on rencontre en de nombreux points du génome. On peut les rencontrer dans certains introns, en particulier des répétitions des deux nucléotides C et A (CA repeats). Le nombre de ces répétitions varie d'un individu à l'autre, ce qui représente un polymorphisme pouvant être utilisé comme marqueur génétique ;
  • les minisatellites, ayant des motifs de quelques dizaines de nucléotides répétés jusqu'à quelques centaines de fois, très polymorphes dans leur séquence et le nombre de répétitions et qui sont également dispersées dans le génome ;
  • les satellites, pour lesquels le motif, qui peut comporter jusqu'à quelques centaines de nucléotides, est répété un très grand nombre de fois (de l'ordre de 500 000 à 1 000 000). Parmi les séquences dispersées, on distingue :
    • les séquences SINE (short interspersed elements), qui contiennent 100 à 300 nucléotides. L'une d'elles, la séquence Alu, de 282 nucléotides, est rencontrée en moyenne toutes les 4 000 paires de bases, et près d'un million de copies sont donc présentes dans le génome humain. Elles ne codent pour aucune protéine et leur rôle est inconnu. Elles dériveraient d'un gène codant pour l'ARN de la signal recognition particle dont les transcrits se seraient réinsérés dans le génome ;
    • les séquences LINE (long interspersed elements), qui contiennent 5 000 à 7 000 nucléotides. Elles dériveraient de certains transcrits de l'ADN polymérase II ou d'une rétrotanscriptase qui se seraient réinsérés dans le génome. Il en existe environ 500 000 dans le génome humain, souvent incomplètes. Leur insertion dans la séquence d'un gène peut inactiver ce gène. Elles possèdent, à leurs extrémités, des séquences LTR (long terminal repeat), à la manière des virus.

Éléments transposables

Les séquences SINE et LINE sont des séquences mobiles susceptibles de se déplacer de manière aléatoire d'un site chromosomique à l'autre ; ces séquences codent précisément pour les enzymes capables de réaliser leur transposition soit directement (transposons), soit après rétrotranscription (rétrotransposons). Dans les cellules normales, ces gènes ne sont pas exprimés en raison d'une méthylation importante de leurs promoteurs. Dans de nombreux cancers, ces gènes sont réactivés, en liaison avec une perte de cette méthylation, mais le mécanisme de la réactivation de la transcription de ces séquences n'est pas compris ; il pourrait être lié à l'instabilité génique caractéristique des cancers et a été attribué à des agents génotoxiques, incluant les agents anticancéreux. Par ailleurs, l'activité de transposition portée par les protéines synthétisées amplifie de façon importante cette l'instabilité génique et, selon le lieu de réinsertion des éléments transposés, est susceptible d'inactiver des gènes suppresseurs de tumeurs, voire d'activer des proto-oncogènes. La réactivation de l'activité de rétrotransposition dans les cancers s'accompagne d'un mauvais pronostic. L'inhibition de cette activité in vitro provoque l'arrêt de la prolifération cellulaire et une voie de recherche thérapeutique pourrait s'orienter vers l'inhibition de la rétrotranscriptase codée par LINE1.

Principales altérations du génome

Un certain nombre de maladies, dont font partie les cancers, sont liées à des altérations du génome. Certaines sont ponctuelles et ne portent que sur un nucléotide : elles ne sont objectivables que par séquençage. D'autres correspondent à des réarrangements majeurs et peuvent parfois être décelées par cytogénétique. Par ailleurs, des variations communes de la séquence des gènes sont rencontrées tout au long du génome et sont responsables de l'extrême diversité de l'espèce humaine : ce sont les polymorphismes génétiques.

Altérations ponctuelles : mutations et polymorphismes

Des erreurs survenant au cours de la réplication ou induites par des agents mutagènes peuvent conduire au remplacement d'un nucléotide par un autre (mutation par substitution), à la perte d'un nucléotide (délétion) ou à l'addition d'un nucléotide (insertion). La protéine issue du gène muté peut porter en conséquence une altération de structure pouvant conduire à une réduction d'activité ou à la perte de sa fonctionnalité. Ces mutations sont à l'origine des maladies héréditaires congénitales, lorsqu'elles surviennent dans la lignée germinale, et de cancers, lorsqu'elles surviennent dans une lignée somatique. On distingue les mutations silencieuses (conservation de l'aminoacide de la chaîne protéique), les mutations faux-sens (remplacement d'un aminoacide par un autre) et les mutations non-sens qui conduisent à une protéine tronquée (survenue d'un codon stop, altération d'un site d'épissage). Insertions et délétions modifient le cadre de lecture, donc la séquence de la protéine, et sont, par principe, des mutations non-sens.

Outre ces altérations pathologiques rares mais délétères existent de nombreuses variations individuelles de la séquence génomique que l'on appelle polymorphismes génétiques. Leur fréquence varie d'un gène à l'autre ; elle est plus élevée dans les introns que dans les exons. Elles sont le support, la plupart du temps, de variations phénotypiques mineures et expliquent les différences individuelles, depuis la couleur des yeux ou la forme du visage jusqu'à la prédisposition héréditaire à certaines maladies ou la sensibilité à certains médicaments : à ce titre, les polymorphismes génétiques intéressent le médecin ou le pharmacologue. Notons que tous les polymorphismes ne sont pas de simples substitutions d'un nucléotide par un autre (SNP, single nucleotide polymorphism) : il existe des polymorphismes du nombre de répétitions de séquences micro- ou minisatellitaires, comme mentionné plus haut. Il existe également des variations du nombre de copies de certains gènes (CNV, pour copy number variations), que l'on peut considérer comme des polymorphismes et qui peuvent jouer un rôle important dans le niveau d'expression des gènes.

Mutations par substitution et SNP sont donc biochimiquement identiques (remplacement d'un nucléotide par un autre) mais ont une signification très différente : on utilisera le terme de mutation pour les événements rares et délétères et le terme de polymorphisme pour les événements fréquents (au moins 10 % de fréquence allélique, soit 1 % de sujets homozygotes variants) et non délétères. Comme pour les mutations, on distingue les polymorphismes silencieux et les polymorphismes non synonymes, avec remplacement d'un aminoacide par un autre au niveau de la protéine. Il faut noter que les polymorphismes silencieux peuvent avoir des conséquences fonctionnelles pour plusieurs raisons : la fréquence d'utilisation des divers codons est variable, et la population des ARN de transfert correspondants peut ne pas y être adaptée ; la synthèse de la protéine peut s'en trouver ralentie, et parfois son repliement sera défectueux. Par ailleurs, la structure dans l'espace de l'ARN messager peut être différente en raison du remplacement d'un nucléotide par un autre, et cela peut avoir des conséquences sur la stabilité des ARN messagers et sur la vitesse de la traduction en protéine, donc sur la quantité de protéine exprimée.

Réarrangements du génome

Des anomalies de la méiose, plus rarement de la mitose, peuvent conduire à des réarrangements importants du génome. Les trisomies sont les réarrangements les plus fréquents, avec des conséquences pathologiques majeures. Des délétions et des insertions de segments chromosomiques surviennent lors de phénomènes de recombinaison homologue ou de transposition. La duplication de certains gènes peut survenir dans la lignée germinale, au cours de la méiose, mais l'amplification, qui conduit à la multiplication parfois considérable du nombre de copies d'un gène, ne survient généralement que dans des lignées somatiques et s'observe dans les cellules cancéreuses. Enfin, les translocations chromosomiques, dues à une recombinaison inégale entre séquences homologues dans deux chromosomes différents, s'observent également dans les cancers, tout particulièrement les leucémies.

Méthodes d'étude des polymorphismes génétiques

Méthodes de génotypage classiques

Le séquençage du génome a permis la constitution de bases de données recensant les SNP au fur et à mesure de leur identification. Dans les bases publiques et privées, on compte actuellement 10 à 15 millions de SNP identifiés. Toutefois, ces bases de données n'indiquent pas toujours la fréquence de ces variants, pas plus que les conséquences fonctionnelles des variations. En outre, un certain nombre relève d'erreurs de séquençage, et une remise à jour périodique des bases de données est nécessaire.

La technologie de recherche des polymorphismes génétiques a fait l'objet de plusieurs revues vers lesquelles nous renvoyons le lecteur [3-6]. La recherche, dans une population donnée, d'un polymorphisme déjà connu (génotypage) fait tout d'abord appel à une PCR qui permettra d'amplifier le segment d'ADN où se trouve la modification de séquence, à l'aide de deux amorces oligonucléotidiques spécifiques, situées de part et d'autre du polymorphisme. Les amplifiats pourront alors être étudiés selon plusieurs techniques :

  • le séquençage pur et simple, technique de référence, de moins en moins coûteuse et de plus en plus utilisée ;
  • la mise en évidence d'un site de restriction induit ou supprimé par la variation de séquence que constitue le polymorphisme. L'amplifiat, après digestion par une enzyme appropriée, est soumis à électrophorèse sur gel d'agarose ou de polyacrylamide. Le nombre de bandes d'ADN détectées et leur longueur permettent de distinguer sans ambiguïté les homozygotes communs, les hétérozygotes et les homozygotes variants. C'est une technique rapide, efficace et extrêmement robuste ;
  • la mise en évidence d'une altération des propriétés d'hybridation de l'amplifiat avec une sonde, due à la présence d'un mismatch (hybridation spécifique d'allèle). On peut immobiliser la sonde spécifique de l'allèle sur un support solide ; on réalise ensuite une hybridation avec les amplifiats marqués (radioactivité, fluorescence) et dénaturés. On peut, inversement, immobiliser les produits de PCR et réaliser l'hybridation avec des sondes marquées. Cette technique, qui connaît de nombreuses variantes, se prête bien à l'automatisation et au traitement de grandes séries (SNP-arrays), mais n'est pas exempte d'erreurs de génotypage ;
  • la recherche d'une altération de l'extension d'amorce. C'est une technique robuste de discrimination allélique, car une ADN polymérase, ne possédant pas d'activité 3’→5’ exonucléasique, ne peut allonger un oligonucléotide que si celui-ci est parfaitement complémentaire en 3’ de la séquence cible. Dans ce cas, selon l'amorce discriminante utilisée, il y aura formation ou non d'un produit d'amplification de l'ADN lors d'une PCR. Une technique utilisant l'extension d'une amorce pour identifier chaque nucléotide incorporé apparaît très résolutive et automatisable : le pyroséquençage ;
  • la mesure du point de fusion par PCR en temps réel (rt-PCR). Cette technique repose sur la détection et la quantification d'un marqueur fluorescent au cours de la réaction. Pour distinguer les allèles, on réalise une courbe de fusion après avoir effectué la PCR. Le produit de PCR a alors un Tm (température de fusion) différent selon qu'il s'agit d'un allèle ou de l'autre ; la courbe dérivée permet de différencier clairement les Tm. Le signal fluorescent est proportionnel à la quantité de produits de PCR générés. Les produits d'amplification peuvent être détectés selon deux grands principes : par marquage non spécifique avec des agents se liant à l'ADN double brin et par marquage spécifique à l'aide de sondes fluorescentes.

La découverte de nouveaux polymorphismes dans un gène d'intérêt encore peu ou insuffisamment étudié sur ce plan fait appel essentiellement au séquençage de tout ou partie du gène, éventuellement après PCR réalisée au niveau des exons et des jonctions intron-exon qui sont les parties les plus « signifiantes » du gène. Pour éviter la lourdeur du séquençage, plusieurs techniques ont été développées :

  • la dHPLC (chromatographie liquide à haute performance en conditions dénaturantes) permet de détecter, dans un fragment obtenu par PCR, l'existence d'une variation allélique. Les seuls fragments manifestant l'existence d'un polymorphisme seront alors séquencés afin de localiser ce polymorphisme ;
  • le TILLING (targeting induced local lesions in genomes) est une technique de criblage de SNPs inconnus et repose sur l'utilisation d'une endonucléase Cel1, issue du céleri, qui clive les hétérohybrides d'ADN au niveau d'un mésappariement. Les échantillons amplifiés sont dénaturés par chauffage puis renaturés pour générer des hétérohybrides entre les amplicons variants et les amplicons sauvages. Les hétérohybrides sont alors digérés par l'endonucléase Cel1 et les produits obtenus sont visualisés par électrophorèse en gel dénaturant [7] ;
  • la PCR-SSCP (single strand conformation polymorphisms). Dans cette option, une PCR est réalisée pour amplifier la région d'intérêt. Le produit de PCR est ensuite dénaturé et soumis à une électrophorèse en gel de polyacrylamide non dénaturant [8]. Un changement ponctuel de séquence peut entraîner un changement de la structure tertiaire de l'ADN ; il en résulte alors une mobilité différente pour les fragments portant les différents allèles. Ces mutations sont détectées par l'apparition d'une nouvelle bande sur un autoradiogramme (détection radioactive) ;
  • le SNP mining (brevet déposé par la société Nanogen, San Diego, CA). Cette technique repose sur l'utilisation d'une protéine mutS d’Escherichia coli, marquée par un fluorophore, capable de détecter des mésappariements [9]. Les régions d'ADN sauvage, amplifiées par PCR, sont immobilisées sur un support par microélectronique. Après dénaturation des produits de PCR, les échantillons à tester sont hybridés sur ces supports en présence de la protéine mutS qui reconnaît tout mésappariement, témoignant que l'échantillon testé présente une variation par rapport à l'ADN sauvage. Le produit de PCR testé est alors séquencé pour identifier le nouveau polymorphisme.

Enfin, la recherche du rôle fonctionnel des polymorphismes est l'étape la plus délicate, car elle ne fait pas seulement appel à des banques génomiques, mais à des banques tissulaires dont les échantillons seront utilisés pour évaluer l'expression du gène ou l'activité de l'enzyme. À défaut, des données plus globales peuvent être obtenues sur l'individu entier, au niveau pharmacocinétique (concentration plasmatique d'un métabolite par exemple) ou au niveau pharmacodynamique (efficacité et toxicité). La constitution de la population à étudier est certainement l'étape la plus importante dans la recherche du rôle fonctionnel d'un polymorphisme.

Génotypage à haut débit

Plusieurs sociétés comme Affymetrix et Illumina ont développé des systèmes d'analyse à haut débit de SNP par multiplexage. Ces « puces » permettent de génotyper en une seule fois des milliers de SNP ; les dernières en date dépassent le million de SNP, couvrant l'intégralité du génome. Leur utilisation n'est possible que dans le cas de très grandes études portant sur des populations importantes de sujets (plusieurs milliers ou dizaines de milliers de sujets), car le risque de trouver des « faux positifs » (associations apparaissant significatives, mais ne l'étant pas) est extrêmement élevé.

Cette approche « génome entier » est dite non biaisée, car elle ne part d'aucune hypothèse de travail concernant des associations entre génotype et phénotype. Dans cette approche, la plupart des SNP génotypés sont situés en dehors des régions codantes et même régulatrices des gènes ; ce sont des tags (étiquettes), localisés dans des introns ou des régions intergéniques, et dont le rôle fonctionnel est inconnu. Il est souvent difficile, lorsqu'un SNP a été reconnu comme associé à telle donnée clinique en utilisant ce genre d'approche, de remonter du SNP au gène et du gène à la fonction liant génotype et phénotype.

Enfin, les approches « génome entier » permettent la reconstitution des haplotypes à partir des données fournies par le génotypage de plusieurs SNP par gène. Ces haplotypes résultent de l'existence d'un déséquilibre de liaison entre plusieurs SNP, dû au fait qu'ils ne sont pas survenus de façon indépendante dans la population. Il peut être particulièrement intéressant d'identifier, plutôt que le SNP individuel, l'haplotype associé aux données cliniques étudiées, car cela peut permettre d'identifier plus rapidement la relation fonctionnelle génotype-phénotype et de comparer, de façon pertinente, des ethnies différentes, qui peuvent porter les mêmes variations au niveau SNP mais sur des haplotypes distincts.

Une autre approche à haut débit consiste en la mise à disposition de « puces » dédiées, c'est-à-dire dont les SNP à génotyper ont été déterminés par l'utilisateur en fonction des gènes auxquels il s'intéresse (approche « gène candidat » par opposition à l'approche « génome entier »). Cette approche permet ainsi le génotypage simultané de 48, 96, 384 ou quelques milliers de SNPs. Elle requiert moins d'ADN d'une part, et elle peut être appliquée, d'autre part, à des populations moins importantes, de quelques centaines d'individus. Elle s'appuie au départ, comme le génotypage « individuel » du paragraphe précédent, sur des hypothèses mécanistiques concernant les associations possibles entre un polymorphisme donné, localisé dans un gène identifié, et la situation clinique considérée.

Épidémiologie moléculaire

Définitions

La première application découlant de la connaissance des polymorphismes génétiques concerne la recherche d'associations entre le risque de développer une maladie (un cancer) et la présence d'un génotype donné. Il faut noter d'emblée que ces recherches nécessitent l'étude d'une population ayant développé la maladie et d'une population ne l'ayant pas développée servant de témoin, afin de déterminer si l'association entre risque de cancer et génotype est significative. Il faut bien évidemment que population atteinte et population témoin soient, autant que faire se peut, appariées sur l'âge, le sexe, le milieu socioprofessionnel, les facteurs de risque connus, etc. Notons également la différence importante qui existe entre les mutations responsables d'une prédisposition aux cancers, comme les mutations de BRCA1 ou BRCA2 et les SNP qui sont le reflet (mécanistique ou non) d'une susceptibilité particulière aux cancers, avec un niveau de risque nettement plus faible, souvent de l'ordre de 1,5 à 3. Grâce aux progrès du génotypage à haut débit, cette branche de l'épidémiologie s'est accélérée de façon impressionnante et de très nombreuses publications paraissent régulièrement. Nous ne pourrons ici que citer quelques exemples choisis dans la littérature et illustrant les diverses approches développées et le type de réponse qu'elles peuvent apporter.

Approche SNP-candidat

Dans ce type d'étude, le point de départ est un SNP ou quelques SNP précis qui ont généralement fait l'objet d'études fonctionnelles antérieures qui ont lié leur présence à une caractéristique biologique particulière. Nous donnerons comme exemple celui de l'association entre le polymorphisme Arg399Gln du gène de réparation de l'ADN appelé XRCC1 dans un article datant de 2002 [10]. Il était connu que ce polymorphisme pouvait être associé au risque de survenue de cancers de la peau en liaison avec l'exposition solaire, mais les études disponibles étaient contradictoires. Les auteurs ont génotypé, par une méthode robuste (RFLP), 499 sujets ayant développé un cancer basocellulaire, 246, un cancer spinocellulaire et 431 sujets témoins. Le génotype variant Gln/Gln est associé à une diminution globale du risque de cancers de la peau, avec des odds ratio de 0,7 [0,4-1,0] et de 0,6 [0,3-0,9], mais qu'il est associé également à une augmentation de ce risque chez les sujets surexposés au soleil et développant régulièrement des brûlures de la peau (odds ratio de 6,8 [2,4-19,2]).

Approche gène candidat

Dans ce type d'étude, les chercheurs partent d'un gène ou d'une voie métabolique que l'on soupçonne d'être impliquée dans l'oncogenèse d'un organe particulier. L'exemple choisi est celui des gènes impliqués dans le métabolisme de la testostérone et leur rôle possible dans les cancers de la prostate [11]. La population étudiée comprenait 221 cas et 205 témoins ; un total de 15 SNP dans quatre gènes et les CNV de trois autres gènes ont été recherchés. Une association significative a été observée entre un polymorphisme du gène de la stéroïde 5α-réductase (qui convertit la testostérone en 7-dihydrotestostérone) et le risque de cancer de la prostate, avec un odds ratio de 1,8 [1,04-3,13].

Approche génome entier

Ces études utilisent les « puces » d'Affymetrix ou d'Illumina pour le génotypage de plusieurs centaines de milliers de SNP sur des effectifs considérables. Dans l'exemple retenu [12], paru en octobre 2009 dans Nature Genetics avec une centaine de signataires, ce sont, dans un premier temps, plus de 500 000 SNP qui ont été génotypés chez 1 854 cas de cancer de la prostate et 1 894 sujets témoins. À partir des données obtenues, les auteurs ont restreint le nombre de SNP à un peu plus de 40 000, et augmenté la population à 3 650 sujets malades et à 3 940 sujets témoins, puis à environ 15 000 individus dans chaque groupe en regroupant des études distinctes. Ils parviennent de la sorte à identifier des régions chromosomiques associées à la susceptibilité au cancer de la prostate avec une haute probabilité (p de l'ordre de 10–8 à 10–33). Une douzaine de gènes candidats émergent ainsi de cette étude ; ils ne sont, à ce stade, qu'impliqués de façon putative dans le cancer de la prostate, et le retour à des études ciblant ces gènes est encore nécessaire.

Pharmacogénétique

Définitions

Il s'agit de la deuxième grande application médicale de la connaissance des polymorphismes constitutionnels. Elle a pour objectif de rechercher des liens entre des polymorphismes génétiques et l'activité des médicaments, tant en ce qui concerne leur efficacité que leur toxicité. Sur le plan pratique, de telles études peuvent conduire à l'individualisation des prescriptions. Ces études ne sont pas réalisables sur des populations aussi importantes que celles destinées à l'épidémiologie moléculaire ; elles portent au mieux sur quelques centaines de patients, parfois moins de 100. La définition du phénotype est délicate et certainement moins simple que dans les études épidémiologiques ; ce phénotype peut être la réponse au traitement, la durée de survie sans récidive ou sans progression, la durée de survie totale, l'apparition de toxicités rédhibitoires, etc. La constitution de populations témoins est souhaitable mais n'est pas indispensable, car il est difficile d'identifier des groupes de sujets atteints de la même maladie à des stades comparables, et n'ayant pas reçu le même traitement que celui étudié.

De nombreux gènes impliqués dans la réponse aux agents anticancéreux interviennent dans le transport et le métabolisme général des xénobiotiques ou dans la réparation des lésions de l'ADN. Ces phénomènes constituent des déterminants cruciaux de l'efficacité et de la toxicité des agents qui endommagent l'ADN, directement ou indirectement. Activation métabolique, détoxication et réparation de l'ADN sont également impliquées dans l'activité des agents cancérogènes et les polymorphismes des gènes responsables constituent souvent un facteur de risque, parfois de protection, de la cancérogenèse liée aux agents chimiques ou aux radiations. Il paraît donc parfois difficile de faire la part des choses entre l'aspect épidémiologique et l'aspect pharmacologique ; les études cliniques de pharmacogénétique doivent être rigoureuses si elles sont destinées à identifier des facteurs de prédiction de réponse ou de toxicité des agents anticancéreux et non de simples facteurs pronostiques indépendants du traitement.

Dans le cadre de la thérapeutique, il serait souhaitable de pouvoir disposer de modèles expérimentaux permettant de faire l'économie des études exploratoires chez l'homme afin de sélectionner des pistes intéressantes dont la validation serait plus rapide. Il n'existe évidemment pas de modèles animaux des polymorphismes humains ; il est envisageable, en revanche, d'utiliser des collections de lignées cellulaires d'origine humaine afin d'explorer les relations entre génotype et phénotype de sensibilité aux agents anticancéreux. Deux types de modèles ont été envisagés :

  • le modèle des lignées tumorales humaines du National Cancer Institute, dont la chimiosensibilité à des milliers de composés a été étudiée in vitro et dont le génotype peut être déterminé par des approches de SNP candidats ou des approches génome entier. Des relations génotype-phénotype ont été établies, illustrées par la figure 4 [13, 14] ; cette approche a été validée par plusieurs équipes et pourrait servir de base pour mettre en place des essais cliniques orientés ;
  • le modèle des lignées lymphoblastoïdes humaines (non tumorales) obtenues dans le cadre du projet HapMap qui vise à recenser l'ensemble des polymorphismes génétiques humains. Le génotype de ces lignées a été déterminé par des approches à haut débit (plus de 500 000 SNP) et leur chimiosensibilité peut être déterminée expérimentalement. Là encore, des relations génotype-phénotype ont été établies [15] (figure 5) et méritent une validation clinique.

Quelques polymorphismes intéressants en oncopharmacologie

Sans faire l'inventaire de tous les polymorphismes identifiés parmi les gènes intervenant dans le transport ou le métabolisme des médicaments anticancéreux, on peut citer quelques exemples importants dont l'utilisation en thérapeutique pourrait être rapidement mise en œuvre. Des détails pourront être trouvés dans les revues publiées sur le sujet [16-21]. Il est à noter que les médicaments relevant des approches « ciblées » sont, tout autant que les médicaments « classiques », sujets aux polymorphismes des gènes de transport et de métabolisme. S'y ajoutent les polymorphismes des gènes des protéines cibles comme les récepteurs à activité tyrosine-kinase, encore mal systématisés. Nous avons retenu quatre exemples.

Dihydropyrimidine déshydrogénase

C'est une enzyme de détoxication du 5-fluoro-uracile, médicament utilisé entre autres dans le traitement des cancers digestifs et des voies aérodigestives supérieures. Il était connu depuis longtemps que son activité, principalement hépatique, conditionnait le niveau des concentrations plasmatiques de 5-fluoro-uracile et partant, son activité. Il était connu également que la déficience complète de l'enzyme s'accompagnait d'une toxicité létale de la molécule. Cette déficience est liée à l'existence de polymorphismes ; 17 allèles différents, tous conduisant à une activité réduite de l'enzyme, ont été identifiés. Un allèle apparaît prépondérant : il s'agit d'une mutation au niveau d'une zone d'épissage flanquant l'exon 14 (IVS14 + 1G > A) conduisant à une inactivité complète de l'enzyme [22]. La fréquence de l'allèle est de 0,9 % et les hétérozygotes ont un risque de toxicité accru en raison d'une quantité réduite d'enzyme. Il existe une méthode simple, couplant PCR et RFLP, pour détecter cette mutation, et un criblage des patients avant traitement par 5-fluoro-uracile est possible mais ne s'est pas généralisé.

UDP-glucuronosyltransférase 1A1 (UGT1A1)

C'est une enzyme de phase II impliquée dans la détoxication de composés endogènes comme la bilirubine et exogènes comme certains médicaments, dont l'irinotécan, ou plus exactement le métabolite actif de ce dernier, le SN-38. Il existe un variant, appelé UGT1A1*28, au niveau du promoteur de l'enzyme. Concernant le nombre de séquences TA dans la TATA box [23] : il est normalement de six, mais est de sept de façon homozygote chez 15 à 20 % des sujets qui sont dits porteurs du syndrome de Gilbert, caractérisé par une diminution de l'activité de l'enzyme, entraînant une élévation de la bilirubinémie non conjuguée (15 à 20 μM) et un risque de toxicité accru de l'irinotécan. Le génotypage des sujets devant recevoir ce médicament est possible en routine.

Protéines p53 et MDM2

Outre ses mutations bien connues, qui sont présentes dans de nombreux cancers, la protéine p53 présente un polymorphisme de fréquence allélique d'environ 25 %, variable selon les ethnies. Ce polymorphisme résulte en un remplacement d'une arginine par une proline sur le codon 72. Il a été montré que le variant Arg72 est capable d'induire l'apoptose de façon plus active que le variant Pro72 dans les cellules n'ayant pas de mutation invalidante de p53. Cela serait dû à une différence dans la capacité de la molécule à induire le relargage du cytochrome c dans le cytoplasme [24]. Dans les modèles in vitro, la réponse à des médicaments comme le cisplatine et la doxorubicine est supérieure pour les cellules exprimant l'allèle Arg72 que l'allèle Pro72 [25], et cela a été confirmé chez des patients traités par cisplatine pour un cancer des voies aérodigestives supérieures, avec une survie plus brève chez les patients portant l'allèle Pro72 à l'état homozygote lorsque la p53 ne présente pas de mutation invalidante, le contraire étant observé lorsque p53 est mutée [26]. Dans une étude sur les cancers du sein traités par tamoxifène en situation adjuvante, il a été montré que les patientes ayant au moins un allèle Pro72 avaient une survie sans récidive significativement plus longue que celles n'en ayant aucun [27].

La protéine MDM2, qui entraîne p53 vers le protéasome, en absence d'activation de cette dernière, porte également un polymorphisme fonctionnel intronique (T309G) de fréquence allélique voisine de 30 % [28]. Le gène variant aurait une affinité supérieure pour l'activateur transcriptionnel Sp1, ce qui génèrerait des concentrations plus élevées de protéine MDM2 et une atténuation de la voie p53, susceptible d'avoir des conséquences sur le risque de cancer et la sensibilité des tumeurs au traitement.

Cytochromes P450 2D6 (CYP2D6)

Les cytochromes P450 constituent une famille d'acteurs fondamentaux dans le métabolisme des médicaments. Certains, comme le CYP1A1, jouent essentiellement un rôle d'activateurs d'agents cancérogènes, alors que d'autres, comme le CYP3A4 ou le CYP2D6, jouent un rôle majeur dans l'activation ou la détoxication des médicaments. Il a été montré que CYP2D6 était responsable de l'activation du tamoxifène en 4-hydroxytamoxifène et en 4-hydroxy-N-desméthyltamoxifène [29]. Environ 6 % des Caucasiens et 1 % des Asiatiques n'ont aucune activité enzymatique décelable, car homozygotes pour des variations génétiques invalidant la protéine ; un petit pourcentage, surtout caractérisé dans les populations d'Afrique orientale, présente une activité très élevée (métaboliseurs ultrarapides) due à la présence de copies surnuméraires du gène, le reste des sujets étant des métaboliseurs extensifs (génotype commun) ou intermédiaire (sujets hétérozygotes pour l'une ou l'autre des mutations délétères).

L'effet du génotype 2D6 a été étudié chez des femmes traitées pour un cancer du sein par tamoxifène en situation adjuvante. Une étude a rapporté une diminution significative de la survie sans progression chez les patients ayant un génotype homozygote pour la variation CYP2D6*4, la plus fréquente chez les Caucasiens, par rapport aux patientes ayant un génotype hétérozygote ou homozygote commun [30]. Le polymorphisme pourrait expliquer la résistance au tamoxifène que l'on observe lors de récidives très précoces survenant sous traitement. Les inhibiteurs du CYP2D6, en particulier des antidépresseurs, pourraient mimer cette situation et compromettre l'efficacité des traitements [31]. Une étude récente confirme le rôle des génotypes « métaboliseur lent » sur le risque de rechute sous tamoxifène [32].

Conclusion

Ces quelques exemples, tirés de l'épidémiologie moléculaire et de la pharmacogénétique, montrent à quel point la connaissance du génome humain peut apporter de données importantes pour évaluer le risque de cancer au niveau individuel et pour personnaliser l'utilisation des médicaments anticancéreux. Il reste à mettre en pratique ces données nouvelles ; il faut être conscient que, pour évaluer de nouvelles attitudes thérapeutiques prenant en compte les données génomiques, il sera nécessaire de développer une méthodologie tout aussi rigoureuse que la méthodologie d'évaluation des nouveaux médicaments : après avoir exploré la pertinence d'une association de façon rétrospective, il faudra la valider en situation prospective, puis en démontrer l'utilité clinique dans une étude randomisée dédiée.Conflits d'intérêts : aucun.

Références

1 Etienne J, Clauser E, Housset C, Roingeard P. Biochimie génétique et biologie moléculaire, 9e édition, Paris : Masson, 2006, 294 p.

2 Brown TA. Génomes. Paris : Flammarion Médecine Sciences, 2004.

3 Syvanen AC. Accessing genetic variation: genotyping single nucleotide polymorphisms. Nat Rev Genet 2001 ; 2 : 930-42.

4 Kwok PY. Methods for genotyping single nucleotide polymorphisms. Annu Rev Genomics Hum Genet 2001 ; 2 : 235-58.

5 Shi MM. Enabling large-scale pharmacogenetic studies by high-throughput mutation detection and genotyping technologies. Clin Chem 2001 ; 47 : 164-72.

6 Shi MM, Bleavins MR, de la Iglesia FA. Technologies for detecting genetic polymorphisms in pharmacogenomics. Mol Diagn 1999 ; 4 : 343-51.

7 Till BJ, Burtner C, Comai L, Henikoff S. Mismatch cleavage by single-strand specific nucleases. Nucl Acid Res 2004 ; 32 : 2632-41.

8 Orita M, Suzuki Y, Sekiya T, Hayashi K. Rapid and sensitive detection of point mutations and DNA polymorphisms using the polymerase chain reaction. Genomics 1989 ; 5 : 874-9.

9 Behrensdorf HA, Pignot M, Windhab N, Kappel A. Rapid parallel mutation scanning of gene fragments using a microelectronic protein-DNA chip format. Nucl Acid Res 2002 ; 30 : e64.

10 Nelson HH, Kelsey KT, Mott LA, Karagas MR. The XRCC1 Arg399Gln polymorphism, sunburn, and non-melanoma skin cancer: evidence of gene-environment interaction. Cancer Res 2002 ; 62 : 152-5.

11 Setlur SR, Chen CX, Hossain RR, Ha JS, Van Doren VE, Steuzel B, et al. Genetic variation of genes involved in dihydrotestosterone metabolism and the risk of prostate cancer. Cancer Epidemiol Biomarkers Prev 2010 ; 19 : 229-39.

12 Eeles RA, Kote-Jarai Z, Al Olama AA, Giles GG, Guy M, Severi G, et al. Identification of seven new prostate cancer susceptibility loci through a genome-wide association study. Nat Genet 2009 ; 41 : 1116-21.

13 Le Morvan V, Bellott R, Moisan F, Mathoulin-Pélissier S, Bonnet J, Robert J. Relationships between genetic polymorphisms and anticancer drug cytotoxicity « vis-à-vis » the NCI-60 panel. Pharmacogenomics 2006 ; 7 : 843-52.

14 Faur N, Araud L, Laroche-Clary A, Kanno J, Toutain J, Yamori T, et al. The association between the T309G polymorphism of the MDM2 gene and sensitivity to anticancer drug is dependent on the p53 mutational status in cellular models. Br J Cancer 2009 ; 101 : 350-6.

15 Huang RS, Duan S, Bleibel WK, Kistner EO, Zhang W, Clark TA, et al. A genome-wide approach to identify genetic variants that contribute to etoposide-induced cytotoxicity. Proc Natl Acad Sci USA 2007 ; 104 : 9758-63.

16 Robert J, Le Morvan V, Smith D, Pourquier P, Bonnet J. Predicting drug response and toxicity based on gene polymorphisms. Crit Rev Oncol Hematol 2005 ; 54 : 171-96.

17 McLeod HL, Evans WE. Pharmacogenomics: unlocking the human genome for better drug therapy. Annu Rev Pharmacol Toxicol 2001 ; 41 : 101-21.

18 Boddy AV, Ratain MJ. Pharmacogenetics in cancer etiology and chemotherapy. Clin Cancer Res 1997 ; 3 : 1025-30.

19 Loni L, Del Tacca M, Danesi R. Pharmacogenetics of anticancer drugs in non-Hodgkin lymphomas. Br J Cancer 2001 ; 85 : 1425-31.

20 Ensom MH, Chang TK, Patel P. Pharmacogenetics: the therapeutic drug monitoring of the future? Clin Pharmacokinet 2001 ; 40 : 783-802.

21 Sekine I, Saijo N. Polymorphisms of metabolizing enzymes and transporter proteins involved in the clearance of anticancer agents. Ann Oncol 2001 ; 12 : 1515-25.

22 Van Kuilenburg AB, Meinsma R, Zoetekouw L, Van Gennip AH. High prevalence of the IVS14 + 1G>A mutation in the dihydropyrimidine dehydrogenase gene of patients with severe 5-fluoro-uracil-associated toxicity. Pharmacogenetics 2002 ; 12 : 555-8.

23 Iyer L, Das S, Janisch L, Wen M, Ramirez J, Karrison T, et al. UGT1A1*28 polymorphism as a determinant of irinotecan disposition and toxicity. Pharmacogenomics J 2002 ; 2 : 43-7.

24 Dumont P, Leu JI, Della Pietra 3rd AC, George DL, Murphy M. The codon 72 polymorphic variants of p53 have markedly different apoptotic potential. Nat Genet 2003 ; 33 : 357-65.

25 Sullivan A, Syed N, Gasco M, Bergamaschi D, Trigiante G, Attard M, et al. Polymorphism in wild-type p53 modulates response to chemotherapy in vitro and in vivo. Oncogene 2004 ; 23 : 3328-37.

26 Bergamaschi D, Gasco M, Hiller L, Sullivan A, Syed N, Trigiante G, et al. p53 polymorphism influences response in cancer chemotherapy via modulation of p73-dependent apoptosis. Cancer Cell 2003 ; 3 : 387-402.

27 Wegman P, Stal O, Askmalm MS, Nordenskjold B, Rutqvist LE, Wingren S. p53 polymorphic variants at codon 72 and the outcome of therapy in randomized breast cancer patients. Pharmacogenet Genomics 2006 ; 16 : 347-51.

28 Bond GL, Hu W, Bond EE, Robins H, Lutzker SG, Arva NC, et al. A single nucleotide polymorphism in the MDM2 promoter attenuates the p53 tumor suppressor pathway and accelerates tumor formation in humans. Cell 2004 ; 119 : 591-602.

29 Stearns V, Johnson MD, Rae JM, Morocho A, Novielli A, Bhargava P, et al. Active tamoxifen metabolite plasma concentrations after coadministration of tamoxifen and the selective serotonin reuptake inhibitor paroxetine. J Natl Cancer Inst 2003 ; 95 : 1758-64.

30 Goetz MP, Rae JM, Suman VJ, Safgren SL, Ames MM, Visscher DW, et al. Pharmacogenetics of tamoxifen biotransformation is associated with clinical outcomes of efficacy and hot flashes. J Clin Oncol 2005 ; 23 : 9312-8.

31 Borges S, Desta Z, Li L, Skaar TC, Ward BA, Nguyen A, et al. Quantitative effect of CYP2D6 genotype and inhibitors on tamoxifen metabolism: implication for optimization of breast cancer treatment. Clin Pharmacol Ther 2006 ; 80 : 61-74.

32 Schroth W, Antoniadou L, Fritz P, Schwab M, Muerdter T, Zanger UM, et al. Breast cancer treatment outcome with adjuvant tamoxifen relative to patient CYP2D6 and CYP2C19 genotypes. J Clin Oncol 2007 ; 25 : 5187-93.


 

About us - Contact us - Conditions of use - Secure payment
Latest news - Conferences
Copyright © 2007 John Libbey Eurotext - All rights reserved
[ Legal information - Powered by Dolomède ]