ARTICLE
Les interactions protéine-protéine constituent des étapes
essentielles des processus cellulaires tels que réplication,
transcription, traduction, épissage, métabolisme intermédiaire,
contrôle du cycle cellulaire, transduction du signal et sécrétion.
Certaines de ces interactions sont évidentes quand les protéines
purifiées sont des sous-unités de complexes multiprotéiques
comme l'hémoglobine ou l'ARN polymérase ou des assemblages
plus complexes comme le ribosome ou les particules du splicéosome.
Mais un grand nombre d'interactions protéine-protéine
dans la cellule sont transitoires. Ainsi des modifications post-traductionnelles
impliquent l'interaction du substrat avec kinases, phosphatases, glycosyl
transférases, protéases... Des interactions protéine-protéine
participent aussi au recrutement des complexes transcriptionnels sur
les promoteurs et activateurs de la transcription des gènes,
au transport intracellulaire des protéines, à la formation
des structures sub-cellulaires... La mise en évidence des complexes
protéiques transitoires passe par l'identification des différents
partenaires impliqués. Beaucoup des interactions protéine-protéine
sont trop faibles pour permettre la purification directe des partenaires
interagissant dans des extraits cellulaires. Aussi des méthodes
physico-chimiques et génétiques ont-elles été
développées pour identifier et caractériser les
partenaires d'une association protéine-protéine en utilisant
un membre du complexe protéique comme appât.
Méthodes physico-chimiques
Chromatographie d'affinité
de protéines
- Le couplage d'une protéine d'intérêt à
une matrice comme la sépharose permet de réaliser des
chromatographies d'affinité pour sélectionner des protéines
ligands dans un extrait cellulaire (figure
1). Une condition essentielle pour réaliser une bonne
chromatographie d'affinité pour une protéine est d'avoir
cette protéine sous un haut degré de pureté sous
peine de détecter des protéines liées par un
contaminant de la préparation de protéine. De nombreux
systèmes de production de protéines de fusion ont été
développés. Le principe est de fusionner la protéine
d'intérêt à une protéine qui présente
de l'affinité pour une résine appropriée. Une
des protéines chimériques la plus couramment utilisée
contient la glutathion-S-transférase (GST) purifiable sur des
colonnes de glutathion-sépharose [1]. D'autres fusions contiennent
la protéine A de staphylococcus substrat des colonnes
d'immunoglobulines G, un peptide oligohistidine qui se fixe sur une
colonne de nickel (Ni++), la protéine liant le maltose
purifiée sur des colonnes d'amylose, la dihydrofolate réductase
purifiée sur des colonnes de méthotrexate...
- La nature du tampon d'élution détermine la spécificité
de la rétention des protéines sur la matrice. Beaucoup
de protéines sont exclues de telles colonnes d'affinité
ou facilement éliminées avec de basses concentrations
en sels. Les protéines retenues peuvent être éluées
par de hautes concentrations en sels (NaCl ou KCl 0,5 à 1M),
par des cofacteurs (ATP, GTP, Ca++) ou des détergents
(SDS, NP40, triton X100).
- Le matériel de départ pour une chromatographie d'affinité
peut être un extrait cellulaire total. Toutefois, si la localisation
subcellulaire de la protéine ligand est connue, l'utilisation
de compartiments cellulaires fractionnés permet un enrichissement
des partenaires recherchés. Le marquage préalable de
l'extrait protéique in vivo accroît la sensibilité
de la chromatographie d'affinité et permet d'ignorer les peptides
résultant de la protéolyse de la protéine d'intérêt
liée à la matrice. Le fractionnement subcellulaire permet
aussi de limiter les effets dénaturants de la dilution sur
la structure des protéines.
- Pour détecter efficacement des interactions par chromatographie
d'affinité, plusieurs points sont à considérer
:
- - La concentration de la protéine immobilisée sur
la matrice doit être très supérieure à
la constante de dissociation du complexe protéine d'intérêt-protéine
recherchée (KD). Si la concentration est trop basse,
la protéine d'intérêt ne retiendra pas assez de
son partenaire. Si la concentration est trop haute, la liaison peut
ne pas être spécifique en raison d'effets électrostatiques.
- - Réciproquement, la quantité d'extraits appliqués
sur la colonne est critique. Si peu d'extrait est appliqué
sur la colonne et si la protéine recherchée y est faiblement
représentée, la quantité retenue sera en dessous
du seuil de détection même si les extraits sont radioactifs.
Inversement, l'application de trop d'extraits sur la colonne peut
favoriser une compétition entre les ligands potentiels masquant
la rétention d'une protéine minoritaire.
- Avantages et inconvénients
La chromatographie d'affinité présente l'avantage de
tester de façon équivalente la liaison de toutes les protéines
d'un extrait cellulaire et de mettre en évidence des interactions
qui dépendent d'un complexe multiprotéique. Elle permet
aussi de déterminer les résidus ou les domaines de la
protéine critiques pour l'interaction protéine-protéine
en utilisant des fusions avec des formes mutées ou tronquées
de la protéine. Elle détecte des interactions protéine-protéine
caractérisées par un KD de 10- 5
à 10- 10 M. Elle s'est avérée fructueuse
pour détecter des interactions fonctionnelles aussi bien entre
des partenaires nucléaires à activité transcriptionnelle
[2-4] que des partenaires cytoplasmiques des voies de transduction [5-7].
Une interaction peut ne pas être détectée parce
que la structure native de la protéine n'est pas respectée
lors du couplage à la résine ou est modifiée par
la fusion ou simplement parce que la résine empêche l'interaction
des deux protéines. Aussi, déterminer au préalable
que la protéine de fusion couplée ou non à la résine
garde une activité fonctionnelle similaire à celle de
la protéine normale est-il un contrôle prudent.
De fausses interactions peuvent résulter de la présence
de la fusion dans la protéine d'intérêt, d'une interaction
indirecte (la protéine détectée n'interagit pas
directement avec la protéine d'intérêt mais se lie
par un facteur intermédiaire), d'une haute affinité entre
les protéines alors qu'elles ne se rencontrent pas dans la cellule.
D'autre part, les protéines de fusion produites dans les cellules
procaryotes ne sont pas modifiées. Or beaucoup d'interactions
protéine-protéine dépendent de maturations post-traductionnelles,
comme les phosphorylations sur l'un ou l'autre ou les deux partenaires.
Par exemple, le facteur de transcription E2F est reconnu de préférence
par la forme sous-phosphorylée de la protéine du rétinoblastome
pRb [8] et les domaines SH2 des protéines lient plus efficacement
les tyrosines phosphorylées que les tyrosines non phosphorylées
[9]. Ces protéines de fusion peuvent cependant être phosphorylées
in vitro par les kinases spécifiques des sites de phosphorylation
endogènes de la protéine. Une alternative est d'exprimer
ces protéines de fusion dans des cellules plus proches de l'espèce
dont est issue la protéine pour confirmer leur interaction in
vivo avec les protéines ligands [10].
Liaison
par affinité à un support solide ou far-western
Cette technique apparaît comme une réciproque de la chromatographie
d'affinité, les protéines étant d'abord fractionnées
par électrophorèse sur gel de polyacrylamide, transférées
sur une membrane de nitrocellulose ou de nylon puis identifiées
par leur capacité à lier la protéine d'intérêt.
Le procédé dérive de celui du Western blot qui
utilise des anticorps pour révéler une protéine
fixée sur une membrane.
Les protéines sont migrées sur des gels de polyacrylamide
en présence de détergents ioniques (SDS) et d'agents réducteurs
(bmercapto-éthanol, dithiothréitol) qui dénaturent
les protéines et séparent les sous-unités des complexes.
Aussi, un facteur déterminant pour détecter avec succès
une interaction protéine-protéine sur un support solide
est la renaturation de la protéine sur son support. Les agents
dénaturants sont déplacés lors de l'électro-transfert
ce qui restitue à beaucoup de protéines une activité
plus ou moins partielle. Cependant une meilleure renaturation de la
protéine est obtenue si la protéine est totalement dénaturée
sur le support par de l'urée 8M ou de l'hydrochlorure de guanidine
6M puis renaturée. Pour détecter des interactions dépendantes
d'un complexe protéique, la migration peut se faire sur des gels
non dénaturants, aux dépens de la résolution de
la technique.
Les protéines utilisées comme sonde sont généralement
des protéines de fusion identiques à celles utilisées
en chromatographie d'affinité. Elles peuvent être marquées
par un acide aminé radioactif, par iodination, par phosphorylation
ou révélée par un anticorps spécifique.
Elles peuvent être biotinylées et détectées
avec la phosphatase alcaline conjuguée à l'avidine ou
la streptavidine. Une alternative consiste à « tagger »
les protéines avec un peptide court lié à une de
leurs extrémités. Le « tag » peut être
un site de phosphorylation comme celui reconnu par la protéine
kinase dépendante de l'AMPc (HMK) qui permet le marquage de la
protéine en présence d'ATP g32. Le tag peut
ajouter aux protéines des épitopes comme l'épitope
de l'hémaglutinine du virus influenza, l'épitope FLAG
ou l'épitope de la protéine c-myc (9E10) révélés
par des anticorps spécifiques de l'épitope.
- Avantages et inconvénients
Des mélanges aussi complexes que des extraits cellulaires peuvent
être analysés directement ce qui peut s'avérer particulièrement
utile pour des protéines peu solubles comme les récepteurs
de surface cellulaire. Mais les interactions qui mettent en jeu plusieurs
sous-unités et se passent au sein d'un complexe ne pourront être
détectées à la différence de la chromatographie
d'affinité de protéines. Inversement, cette méthode
détermine au sein d'un complexe multimérique quelle sous-unité
interagit directement avec la protéine d'intérêt.
Bien que cette méthode puisse être utilisée à
des fins de purification d'un partenaire protéique [11], elle
apparaît plutôt comme une méthode de dépistage
de la capacité d'une protéine à interagir avec
d'autres protéines.
Co-immunoprécipitation
La co-immunoprécipitation est a priori une méthode
simple. L'anticorps est ajouté aux lysats cellulaires ou à
des fractions sub-cellulaires, le complexe antigène-anticorps
est lavé et les protéines liées au complexe antigène-anticorps
sont analysées. Elle peut être réalisée à
grande échelle et aboutir à la purification d'une protéine
liée à un complexe antigène-anticorps. L'anticorps
peut être polyclonal ou monoclonal, préparé contre
une protéine purifiée ou contre un peptide synthétique
couplé à un transporteur.
C'est ainsi que la protéine p190 effectrice du GAP (GTP-ase activating
protein) de Ras a été purifiée à partir
de tumeurs fibroblastiques dans le complexe immun formé par un
anticorps monoclonal dirigé contre GAP et lié à
des billes de protéine A-sépharose [12]. De même,
ont été purifiées la sous-unité p85 de la
PI3 kinase murine par immunoprécipition avec le récepteur
phosphorylé sur tyrosine du PDGF [13], l'oncogène mdm2
par immunoprécipitation avec p53 [14] et la p107 apparentée
à RB par immunoprécipitation avec la protéine E1A
de l'adénovirus [15].
- Avantages et inconvénients
- L'intérêt de la co-immunoprécipitation de protéines
dans leur contexte cellulaire est double. D'une part, les partenaires
potentiels de l'interaction sont dans des concentrations relatives
physiologiques évitant les interactions artefactuelles liées
à la présence de quantités massives de l'un des
partenaires. D'autre part, les interactions dépendantes de
la maturation post-translationnelle des protéines sont accessibles.
- Certains artefacts de la co-immunoprécipitation sont liés
à la nature des anticorps. En particulier si les anticorps
sont polyclonaux, ils doivent être prépurifiés
par affinité pour leur antigène afin d'éliminer
les anticorps contaminants du sérum. L'anticorps lui-même
peut reconnaître la protéine co-immunoprécipitée.
La co-immunoprécipitation doit donc se produire avec des anticorps
dérivés indépendamment et dirigés contre
différents sous-domaines de la protéine.
- Finalement, la co-immunoprécipitation in vivo reste
un exercice difficile en raison de la faible quantité d'antigène.
Bien sûr, les extraits cellulaires peuvent être supplémentés
par un excès d'antigène pour amorcer la formation des
complexes [16] et les complexes intracellulaires peuvent être
stabilisés par pontage covalent avant immunoprécipitation.
Mais ces altérations perturbent les conditions naturelles qui
font l'attrait de la co-immunoprécipitation in vivo.
Identification du partenaire
de la protéine
- Ces méthodes physico-chimiques permettent, dans un premier
temps, le repérage, par leur poids moléculaire apparent,
des protéines susceptibles de lier une protéine d'intérêt.
Elles aboutissent finalement à l'identification de ces protéines.
Dans la plus simple des éventualités, le poids moléculaire
de la protéine ligand est suffisamment évocateur de
celui d'un partenaire présumé de la protéine
d'intérêt pour que soient testés directement des
anticorps spécifiques de ce partenaire présumé.
- Dans le cas où la protéine ligand n'est pas directement
identifiable, les protéines sont préparées à
grande échelle à partir d'extraits cellulaires : quelques
chiffres indicatifs qui varient selon le poids moléculaire
de la protéine recherchée : 10 à 50 mg de protéines
peuvent être escomptés à partir de quelques grammes
de tissus (10 à 50 g) ou de quelques milliards de cellules
(1010 à 1011). Les protéines peuvent
être purifiées par électrotransfert sur nitrocellulose
et visualisées par coloration au rouge ponceau. Les bandes
excisées du filtre sont digérées par des endopeptidases
et les peptides résultants séparés par chromatographie
liquide en phase réverse à haute pression. Alternativement,
les protéines peuvent être protéolysées
directement dans le gel après coloration du gel au nitrate
d'argent ou à l'amido-black. Plus classiquement, les protéines
peuvent être purifiées à quasi-homogénéité
par chromatographies sélectives et successives dans différents
tampons d'élution. La séquence de certains peptides
pourra être déterminée sans ambiguïté.
Alors, deux solutions sont possibles :
- - La comparaison de la séquence peptidique avec les banques
de données montre une identité de séquence entre
le peptide et une protéine connue. Le partenaire est démasqué.
- - Le peptide est inconnu. À partir de la séquence
peptidique, des oligonucléotides de séquence dégénérée
peuvent être utilisés comme sonde pour cribler une banque
d'expression appropriée ou comme amorce pour amplifier par
PCR l'ADN complémentaire codant cette protéine.
Méthodes
génétiques
Différentes méthodes permettent de rechercher dans des
librairies d'expression des protéines ou des fragments de protéines
qui interagissent avec une protéine d'intérêt. Les
librairies sont principalement exprimées dans des bactéries
ou des levures. L'intérêt majeur de ces techniques par
rapport à l'approche physico-chimique est que les ADNc codant
les protéines identifiées sont immédiatement disponibles.
Ces méthodes se sont avérées performantes pour
caractériser nombre de domaines d'interaction protéine-protéine.
Toutefois, la détection d'une interaction hautement spécifique
entre deux protéines n'appartenant pas au même compartiment
sub-cellulaire apparaît comme un aléa incontournable des
méthodes génétiques.
Criblage de banques d'expression
de protéines
La protéine d'intérêt est utilisée comme
sonde pour cribler une banque d'expression protéique clonée
dans le bactériophage lgt11 ou des phages dérivés
(figure 2).
Les banques lgt11 utilisent classiquement un promoteur inductible par
l'isopropyl-b-D-thio-galactopyranoside (IPTG) pour exprimer des protéines
fusionnées à la b-galactosidase. Les protéines
exprimées dans les plages de lyse des bactériophages sont
transférées sur des filtres et incubées avec la
sonde protéique. Les procédés de marquage de la
protéine ont été décrits pour le «
far-western ». La protéine peut être biotinylée
et détectée avec de la streptavidine conjuguée
à la phosphatase alcaline. C'est ainsi que le facteur de transcription
CREB qui forme des hétérodimères avec Jun a été
cloné à partir d'une banque d'expression de fibroblastes
stimulés par le sérum par criblage avec le domaine de
liaison à l'ADN de Jun préalablement biotinylé
[17]. Les protéines peuvent être marquées à
l'iode125 et les complexes détectés par autoradiographie.
L'utilisation d'une protéine de fusion GST avec le domaine basique-hélice-boucle-hélice-leucine
zipper (bHLH-LZ) de la protéine c-Myc marquée à
l'iode125 pour cribler une banque de cellules pre-B a permis l'identification
de Max, une protéine qui contient aussi un domaine bHLH-LZ et
confère à c-Myc sa spécificité de liaison
à l'ADN [18]. Prolongeant cette démarche, l'utilisation
de Max comme sonde a permis d'identifier un autre membre de la famille
des protéines à bHLH-LZ : Mad qui régule négativement
l'activité des complexes Myc-Max [19]. La sonde protéique
peut être liée à un cofacteur in vitro ou
phosphorylée sur des sites de phosphorylation endogènes
de la protéine. Le criblage d'une librairie de cerveau humain
avec la région carboxy-terminale phosphorylée sur tyrosine
du récepteur de l'EGF a permis le clonage de toute la famille
des protéines GRB dont GRB1 [20]. Lorsque l'on présume
que l'interaction recherchée requiert la phosphorylation des
deux partenaires, les protéines de la banque peuvent être
phosphorylées sur le filtre par incubation avec des extraits
cellulaires exprimant des kinases activées avant d'être
criblées avec la sonde protéique phosphorylée par
de l'ATP g32. Cette stratégie a été
utilisée pour caractériser le site d'interaction du domaine
protéique PTB avec les tyrosines phosphorylées [21].
Une protéine de fusion contenant un épitope phosphorylable
comme le site HMK peut aussi être utilisée comme sonde.
Cette stratégie peut trouver des développements opportunistes
comme illustré par la recherche de nouveaux partenaires de Bad,
un membre de la famille des protéines Bcl2 impliquées
dans l'apoptose. La protéine Bad « taggée »
par un site de phosphorylation pour la HMK a été utilisée
pour cribler une banque lgt11 d'ADNc d'embryons de souris. Il s'est
avéré a posteriori que la protéine 14-3-3
identifiée interagissait avec Bad selon un processus dépendant
de la phosphorylation de la sérine 112 de Bad par la HMK [22].
L'éventail de protéines de fusion disponibles et la diversité
des systèmes de production de protéines (cellules procaryotes,
cellules d'insecte, traduction en réticulocytes...) offrent donc
un large choix de stratégies pour marquer une protéine
ou ses domaines. Toutefois, si un anticorps spécifique de la
protéine est disponible, l'anticorps permet la détection
directe des plages de lyse qui interagissent avec la protéine
antigénique. Ainsi, E2F a été identifié
dans une banque de cellules preB criblée avec la région
poche de la protéine RB puis couplée à un anticorps
anti-RB [23].
- Limites
- Le criblage de banques d'expression présente quelques limites
:
- - Les protéines exprimées dans la librairie doivent
se replier correctement et garder leur structure sur nitrocellulose.
Les protéines peuvent être renaturées par un cycle
de dénaturation-renaturation avec de l'hydrochlorure de guanidine
6M ou l'urée 8M.
- - Les conditions d'hybridation sont arbitraires et ne reflètent
pas les interactions dans le milieu cellulaire.
- - L'abondance relative des protéines exprimées dans
les plages de lyse ne tient compte ni du niveau d'expression ni de
la compartimentalisation dans la cellule.
La
méthode dite du double-hybride (2H)
- Les prémisses du double-hybride sont établies dans
les années 80 avec la description d'un transactivateur «
générique » qui se résumerait à la
juxtaposition d'un « domaine d'activation » qui recrute
la machinerie de polymérisation des ARN, et d'un domaine de
liaison à l'ADN qui reconnaît spécifiquement une
séquence d'ADN située dans les promoteurs stimulés
par ce transactivateur. Ce second domaine positionne ce que le premier
a recruté.
- Deux séries de données supplémentaires vont
permettre l'émergence du 2H. En première approximation,
un domaine d'activation est remplaçable par un autre. De même,
un domaine de liaison à l'ADN est remplaçable par un
autre, à condition de changer aussi sa séquence de reconnaissance
dans le promoteur à stimuler. Enfin, le domaine de liaison
à l'ADN (DLA) et le domaine d'activation (DA) ne doivent pas
nécessairement appartenir à la même chaîne
polypeptidique. Le double-hybride, qui a deux pères : Stanley
Fields and Roger Brent, est la généralisation de ces
principes [24, 25]. Ainsi, si un domaine de liaison à l'ADN
est fusionné à une protéine A et si le domaine
d'activation est fusionné à une protéine B, l'interaction
de DLA-A avec B-DA reconstitue un transactivateur fonctionnel. Si
l'expression d'un gène reporter est sous le contrôle
d'un promoteur contenant la séquence reconnue par le DLA de
la protéine chimère DLA-A, l'interaction avec B-DA sera
détectée par l'expression du reporter.
- C'est dans la levure S. cerevisiae que ce système
s'est épanoui et une de ses premières versions nécessite
trois composants :
- - une levure dans le génome de laquelle une cassette [promoteur
de GAL1-gène LacZ] est intégrée et qui,
par ailleurs, est mutée dans le gène GAL4 qui
sinon transactiverait le promoteur GAL1 ;
- - un plasmide pour l'expression d'une protéine A fusionnée
au DLA de Gal4 (Gal4DLA) ;
- - un autre plasmide pour l'expression d'une protéine B fusionnée
au DA de Gal4 (Gal4DA). L'interaction entre A et B permet l'expression
du gène LacZ (figure
3). Depuis cette première version, des gènes
de sélection variés ont été utilisés
comme reporter et de multiples variantes utilisent différents
DLA et différents DA.
- Le double-hybride s'est vu appliqué à deux types majeurs
de travaux.
- * L'étude d'un couple de protéines définies
permet de vérifier leur capacité à interagir.
Mais aussi, à partir d'un couple de protéines qui interagissent,
il est possible de chercher des mutants d'un des partenaires qui n'interagissent
plus [26], en particulier grâce à des systèmes
de sélection positive en cas de non-interaction [27]. Partant
de ces mutants de non-interaction, il est alors possible de chercher
des mutants de l'autre partenaire qui restaurent l'interaction. Si
ces suppresseurs sont spécifiques d'allèle, le niveau
de résolution de la méthode permet de définir
les résidus en contact dans l'interaction de départ.
- * Mais le champ principal d'applications du 2H a été
d'exprimer une protéine d'intérêt fusionnée
à un DLA et de cribler des banques d'ADNc clonés en
3' d'une région codant un DA dans un « plasmide double-hybride
». De telles banques expriment les protéines codées
par les ADNc, fusionnées à l'extrémité
carboxy-terminale du DA.
- Depuis sa description en 1989, le système du double-hybride
en levure a vu le nombre de ses utilisateurs croître de façon
vertigineuse. Deux domaines méritent d'être mentionnés.
- - Les GTPases sont des appâts de choix et il n'est pas certain
qu'il reste une GTPase qui n'ait pas été essayée
comme appât dans un crible double-hybride. La plus fameuse reste
probablement Ras pour laquelle le double-hybride a permis de définir
les protéines Raf mais aussi les RalGDS comme partenaires puis
comme effecteurs [28-30].
- - Les domaines intracellulaires de nombreuses protéines transmembranaires
ont été utilisés dans des cribles double-hybride.
Par exemple, l'application du double-hybride à la partie cytoplasmique
du récepteur au TNF a mis en évidence les maillons de
la cascade de signalisation menant de la stimulation de ces récepteurs
à la mort cellulaire [31, 32].
- Limites
- Une première limite découle du fait que la formation
du transactivateur DLA-A ::B-DA a lieu dans le noyau (grâce
à au moins un signal de localisation nucléaire dans
le DA). Or A et B peuvent ne jamais se rencontrer dans la cellule
si elles résident dans des compartiments cellulaires différents.
- Certaines modifications post-traductionnelles (phosphorylation,
glycosylation, etc.) nécessaires à une interaction peuvent
ne pas avoir lieu dans la levure. Mais des opportunités peuvent
se présenter : par exemple, les parties cytoplasmiques des
récepteurs à activité tyrosine kinase, dans le
système double-hybride, s'autophosphorylent sur des tyrosines,
probablement parce que dimérisés par les régions
de dimérisation des DLA, et sont donc accessibles aux interactions
avec les domaines SH2. Une solution peut résider dans le «
triple-hybride » où une troisième protéine,
apportant l'activité manquante, est exprimée [33].
- Une autre limite du double-hybride réside dans le fait que
la protéine appât peut transactiver par elle-même.
De plus, certaines protéines transactivent « par accident
» : elles ne sont pas des transactivateurs mais, par exemple,
tel domaine très acide est exposé et fait office de
DA.
- Devant l'impossibilité d'utiliser le double-hybride avec
certaines protéines transactivatrices, une stratégie
alternative qui déplace le 2H du noyau vers le cytoplasme a
été récemment décrite. L'observation de
départ est la suivante : à moins de surexpression massive,
les facteurs d'échange Sos de Ras doivent être transloqués
à la membrane plasmique pour être rapprochés de
leurs substrats, les protéines Ras. Chez la levure S. cerevisiae,
le gène CDC25 code un facteur d'échange de Ras. Dans
une souche cdc25 thermosensible, l'expression modérée
de la région « CDC25 » de Sos ne permet pas de supprimer
la thermosensibilité. Si cette région CDC25 est amenée
à la membrane (par exemple en lui fusionnant un motif de myristilation
ou de farnesylation), elle va activer Ras, supprimer la mutation cdc25ts
et permettre la croissance à température restrictive.
Ici, le double-hybride consiste en une protéine A fusionnée
à un signal de myristilation, et une protéine B fusionnée
au domaine CDC25 de Sos. Si A et B interagissent, un complexe [signal
de mirystilation-A::B- CDC25] est formé qui va se localiser
à la membrane : le domaine CDC25 va pouvoir activer Ras. La
mutation cdc25ts est alors supprimée : les levures pourront
être selectionnées par leur croissance à température
restrictive 37 °C [34].
- Une autre variante est basée sur le fait que la sous-unité
t138 du complexe TFIIIC contacte l'ADN en un site spécifique.
Si ce site est remplacé par des séquences de liaison
du DLA de Gal4 et si le DLA de Gal4 (acides aminés 1-147) est
fusionné à t138, la protéine TFIIIC est fontionnelle
et peut promouvoir le recrutement de TFIIIB et la transcription par
l'ARN PolIII. Si dans un tel contexte, une protéine A est fusionnée
à t138 et une protéine B est fusionnée au DLA
de Gal4, et si A et B interagissent, alors le complexe [t138-A::B-Gal4(1-147)]
est fonctionnel et TFIIIC fonctionne correctement. Ici un domaine
de type DA de Gal4 ne suffit pas à générer la
transcription à lui seul et ce système permettrait l'étude
des activateurs transcripionnels de l'ARNPolII [35].
Criblage
de banques présentées par des phages
Le système de « présentation sur phage » utilise
des banques de peptides synthétiques de séquence aléatoire
(4 à 15 acides aminés sont les tailles les plus courantes)
ou des banques de domaines peptidiques. Il a surtout permis l'identification
de ligands peptidiques.
Le principe consiste à cloner une banque plus ou moins dégénérée
d'oligonucléotides en 5' du gène de la protéine
pIII (ou plus rarement pVIII) d'un phage M13, entre le peptide signal
et la protéine structurale elle-même. pIII est orientée
dans le phage avec son extrémité C-terminale vers l'intérieur
et son extrémité N-terminale vers l'extérieur :
les peptides de la banque fusionnée sont ainsi présentés
à l'extérieur du phage (figure
4). Après passage dans E. coli, il est aisé
d'obtenir une suspension de phages d'une complexité de plus de
108 dans un faible volume (1-2 ml). Cette suspension est
passée sur un support solide (par exemple une résine ou
une surface plastique) sur lequel est immobilisée la protéine
d'intérêt. Les phages sélectionnés sont utilisés
pour ré-infecter E. coli et plusieurs cycles d'enrichissement
permettent d'isoler une population clonale d'un phage présentant
un motif d'interaction [36].
Cette stratégie a été améliorée
avec un système de phagémide dans lequel la fusion peptide-pIII
est apportée par un plasmide portant une origine de réplication
f1. Le système requiert un phage « helper » lui-même
désarmé. Les phages infectieux produits dans une telle
combinaison présentent un mélange de protéine III
sauvage (apportée par le « helper ») et de pIII chimérique.
- Avantages et inconvénients
- Cette technique présente plusieurs avantages :
- - sa vitesse d'exécution : tout le travail a lieu dans E.
coli qui se multiplie plus vite que la levure (technique du 2H),
- - elle ne nécessite pas des quantités importantes
de cellules (techniques physico-chimiques),
- - elle donne accès directement à la séquence
nucléique. Elle permet de rechercher les ligands de protéines
« natives », par exemple ceux de récepteurs dans
leur état glycosylé en utilisant des cellules entières
exprimant le dit récepteur comme « tamis à phages
».
- Le principal inconvénient vient du fait que la fusion entre
« la banque » et pIII a lieu entre le peptide signal et
la protéine structurale : s'il est facile de synthétiser
des oligonucléotides de taille définie qui seront en
phase en 5' et en 3', la constitution de banques, obligatoirement
initiées au hasard pour éviter les codons stop,
n'aura un rendement que de 1 sur 9. Il faudra donc cribler 9 fois
plus de phages. D'autre part, il y a probablement des limites supérieures
de taille et de conformation, avec un biais possible à l'encontre
de certains domaines qui pourraient soit ne pas être correctement
présentés soit empêcher la présentation
de la protéine pIII.
- Le problème des fusions N-terminales a été
partiellement résolu grâce à une astucieuse idée
de fusion C-terminale. Les peptides aléatoires sont fusionnés
à la région C-terminale du répresseur lactose
lacI de E. coli et exprimés à partir d'un plasmide
contenant la séquence de l'opérateur lactose capable
de lier le répresseur. Ainsi le peptide de fusion lie le plasmide
qui le code. Les bactéries sont lysées et les répresseurs
chimériques liés à l'ADN grâce à
leur forte affinité pour l'opérateur sont sélectionnés
par leur affinité pour la protéine d'intérêt
immobilisée sur colonne comme dans un système phagique
classique. Les ADN plasmidiques sélectionnés en même
temps que les peptides sont retournés dans E. coli pour
deux ou trois cycles d'enrichissement [37].
- Un exemple d'application de cette méthode fut la recherche
des motifs liant différentiellement divers domaines SH3, et
la détermination des consensus et des divergences au sein de
ces motifs [38]. Ce système a aussi permis d'identifier des
peptides qui lient et activent des récepteurs de cytokines
comme l'érythropoïétine et la thrombopoïétine
[39, 40]. Il est remarquable que ces peptides mimétiques des
hormones naturelles ne sont pas trouvés dans la séquence
primaire de ces hormones.
- Ce système a permis aussi l'expression/ présentation
de chaînes d'anticorps à la surface des phages, avec
la sélection possible d'un phage présentant un domaine
anticorps contre une protéine étudiée. L'expansion
de ce phage fournit une source quasi infinie d'anticorps (ou de pseudo-anticorps)
[41].
CONCLUSION
Un choix s'impose
Devant cet éventail de méthodes, laquelle choisir ? Y
a-t-il une rationalisation possible de ce choix en fonction du type
de protéine étudiée ? Le taux de succès
de chaque technique est quasi impossible à évaluer, les
résultats positifs étant les seuls publiés.
Quelques points pour
sortir de l'expectative
- * La disponibilité de l'extrait protéique de départ
peut être déterminante. Le seuil de détection
d'une protéine exprimée dans une cellule est plus bas
pour les techniques génétiques que pour les techniques
de chromatographies ou de co-immunoprécipitation. A priori
une protéine rare sera plus accessible dans une librairie hautement
représentative. Obtenir suffisamment de protéines pour
un microséquençage (50 à 100 picomoles de protéines)
demande de disposer au départ, de quelques de grammes de tissus
ou de cellules.
- * L'interaction de 2 protéines in vivo peut dépendre
de co-facteurs :
- - des petites molécules effectrices comme l'ATP ou le GTP
et des ions comme le Ca++,
- - des macromolécules comme l'ADN ou l'ARN qui affectent les
interactions protéine-protéine en formant des complexes
ternaires ou macromoléculaires. De tels complexes peuvent être
beaucoup plus stables que des complexes binaires et ne sont accessibles
que par la biochimie.
- * Évidemment, si une protéine est insoluble, les chromatographies
d'affinités sont à exclure.
- * Les techniques génétiques sont rapides, faciles
à mettre en oeuvre et peu dispendieuses. Partant d'un appât
exprimé à partir d'un plasmide double-hybride, il faut
de 15 jours à 3 mois pour cribler une banque et sortir du 2H.
De même pour le criblage d'une banque d'expression avec une
sonde protéique. Attrayante aussi est l'idée de «
boucler ». À partir d'une protéine donnée,
un partenaire est isolé. Cette dernière protéine
sert alors à chercher le partenaire du partenaire.
- * La rumeur dit que les facteurs de transcription se prêtent
peu au double-hybride (du moins jusqu'à ses deux dernières
variantes décrites dans le texte mais non éprouvées...).
Mais il est des contre-exemples à succès.
- Il n'y a donc pas d'arbre décisionnel simple et hors des
écueils évidents à contourner, il y va beaucoup
de ses « affinités » personnelles pour la génétique
ou la biochimie. Il est remarquable qu' un même problème
biologique a été abordé selon des techniques
différentes par des équipes différentes. Ainsi,
la recherche de néo-domaines SH3 a été effectuée
aussi bien par double-hybride que par criblage de banques d'expression
[42, 43], avec pour l'instant avantage à la seconde approche
en terme de nouvelles protéines identifées.
Le mot de la fin
Le but de l'étude des interactions protéine-protéine
est de comprendre les conséquences de cette interaction pour la
fonction de la cellule. Caractérisée dans un contexte expérimental,
la détection d'un lien entre deux protéines ne peut être
interprétée comme la démonstration d'une interaction
biologiquement significative. L'interaction doit être vérifiée
par les autres techniques physico-chimiques et génétiques
ainsi que dans des essais fonctionnels basés sur les activités
biologiques de chacun des partenaires. Ces protéines sont-elles
détectées dans le même compartiment cellulaire par
immunofluorescence ? Des interférences fonctionnelles existent-elles
entre ces partenaires potentiels ? Des mutants de ces protéines
affectent-ils ces processus ? Quelles sont les constantes d'association
et de dissociation qui régissent l'équilibre partenaires
libres <> partenaires complexés. La réponse
à de telles questions est nécessaire pour valider une interaction
protéine-protéine.
Il est donc bon de savoir que lorsque vous aurez identifié,
après bien des efforts, un ou des partenaires potentiels de votre
protéine favorite, le vrai travail quant à la réalité
fonctionnelle de l'interaction de votre protéine avec son ou
ses partenaires va commencer...
REFERENCES
1. Smith DB, Johnson KS. Single-step purification of polypeptides expressed
in Escherichia coli as fusions with glutathione S-transferase.
Gene 1988 ; 67 : 31-40.
2. Stringer K, Ingles CJ, Greenblatt J. Direct and selective binding
of an acidic transcriptional activation domain to the TATA-box factor
TFIID. Nature 1990 ; 345 : 783-6.
3. He Z, Brinton B, Greenblatt J, Hassell J, Ingles CJ. The transactivator
proteins VP16 and Gal4 bind to the replication factor A. Cell 1993
; 73 : 1223-32.
4. Hallier M, Tavitian A, Moreau-Gachelin F. The transcription factor
Spi-1/PU.1 binds RNA and interferes with the RNA-binding protein p54nrb.
J Biol Chem 1996 ; 271 : 11177-81.
5. Gout I, Dhand R, Hiles ID, Fry MJ, Panayotou G, Das P, Truong O, Totty
NF, Hsuan J, Booker GW, Campbell ID, Watefield MD. The GTPase dynamin
binds to and is activated by a subset of SH3 domains. Cell 1993
; 75 : 25-36.
6. Okabayashi Y, Sugimoto Y, Totty NF, Hsuan J, Kido Y, Sakaguchi K,
Gout I, Waterfield D, Kasuga M. Interaction of Shc with adaptor protein
adaptins. J Biol Chem 1996 ; 271 : 5265-9.
7. Matsui T, Amano M, Yamamoto T, Chihara K, Nakafuku M, Ito M, Nakano
T, Okawa K, Iwamatsu A, Kaibuchi K. Rho-associated kinase, a novel serine/threonine
kinase, as a putative target for the small GTP binding protein Rho. EMBO
J 1996 ; 15 : 2208-16.
8. Ludlow JW, Glendening CL, Livingston DM, DeCaprio JA. Specific enzymatic
dephosphorylation of the retinoblstoma protein. Mol Cell Biol 1993
; 13 : 367-72.
9. Felder S, Zhou M, Hu P, Urena J, Ullrich A, Chaudhuri M, Shoelson
SE, Schlessinger J. SH2 domains exhibit high-affinity binding to tyrosine-phosphorylated
peotides yet also exhibit rapid dissociation and exchange. Mol Cell
Biol 1993 ; 13 : 1449-55.
10. Cohen BD, Lowy DR, Schiller JT. The conserved C-trminal domain of
the bovine papillomavirus E5 oncoprotein can associate with an a-adaptin-like
molecule : a possible link between growth factor receptors and viral transformation.
Mol Cell Biol 1993 ; 13 : 6462-8.
11. Mayer BJ, Jackson PK, Baltimore D. The non catalytic src homology
region 2 segment of abl tyrosine kinase binds to tyrosine-phosphorylated
cellular proteins with high affinity. Proc Natl Acad Sci USA 1991
; 88 : 627-31.
12. Settleman J, Narasimhan V, Foster LC, Weinberg R. Molecular cloning
of cDNAs encoding the GAP-associated protein p190 : Implications for a
signaling pathway from Ras to the nucleus. Cell 1992 ; 69 : 539-49.
13. Escobedo JA, Navankasattusas S, Kavanaugh WM, Milfay D, Fried VA,
Williams LY. cDNA cloning of a novel 85Kd protein that has SH2 domains
and regulates binding of PI3-kinase to the PDGFb-receptor. Cell
1991 ; 65 : 75-82.
14. Momand J, Zambetti GP, Olson DC, George D, Levine A. The mdm2 oncogene
product forms a complex with the p53 protein and inhibits p53-mediated
transactivation. Cell 1992 ; 69 : 1237-45.
15. Ewen ME, Xing Y, Lawrence JB, Livingston DM. Molecular cloning, chromosomal
mapping and expression of the cDNA for p107, a retinoblastoma gene product-related
protein. Cell 1991 ; 66 : 1155-65.
16. Ewen M, Faha B, Harlow E, Livingston DM. Interaction of p107 with
cyclin A independent of complex formation with viral oncoproteins. Science
1992 ; 255 : 85-7.
17. Mac Gregor PF, Abate C, Curran T. Direct cloning of leucine zipper
proteins : Jun binds cooperatively to the CRE with CRE-BP1. Oncogene
1990 ; 5 : 451-8.
18. Blackwood EM, Eisenman RN. Max : a helix-loop-helix zipper protein
that forms a sequence-specific DNA-binding complex with Myc. Science
1991 ; 251 : 1211-7.
19. Ayer DE, Kretzner L, Eisenman RN. Mad : a heterodimeric partner for
Max that antagonizes Myc transcriptional activity. Cell 1993 ;
72 : 211-22.
20. Skolnik EY, Margolis B Mohammadi M, Lowenstein E, Fischer R, Repps
A, Ullrich A, Schlessinger J. Cloning of PI3 kinase-associated p85 utilizing
a novel method for expression/cloning of target proteins for receptor
tyrosine kinases. Cell 1991 ; 65 : 83-90.
21. Kavanaugh WM, Turck C, Williams LT. PTB domain binding to signaling
proteins through a sequence motif containing phosphotyrosine. Science
1996 ; 268 : 1177-9.
22. Zha J, Harada H, Yang E, Jockel J, Korsmeyer J. Serine phosphorylation
of death agonist BAD in response to survival factor results in binding
to 14-3-3 not BCL-XL. Cell 1996 ; 87 : 619-28.
23. Helin K, Lees JA, Vidal M, Dyson N, Harlow E Fattaey A. A cDNA encoding
a pRB-binding protein with properties of the transcription factor E2F.
Cell 1992 ; 70 : 337-50.
24. Fields S, Song O. A novel genetic system to detect protein-protein
interactions. Nature 1989 ; 340 : 245-6.
25. Gyuris J, Golemis E, Chertkov H, Brent R. Cdi1, a human G1-phase
and S-phase protein phosphatase that associates with cdk2. Cell
1993 ; 75 : 791-803.
26. White MA, Nicolette C, Minden A, Polverino A, Van Aelst L, Karin
M, Wigler MH. Multiple Ras functions can contribute to mammalain cell
transformation. Cell 1995 ; 80 : 533-41.
27. Vidal M, Brachmann RK, Fattaey A, Harlow E, Boeke JD. Reverse two-hybrid
and one-hybrid systems to detect dissociation of protein-protein and DNA-protein
interactions. Proc Natl Acad Sci USA 1996 ; 93 : 10315-20.
28. Vojtek AB, Hollenberg SM, Cooper JA. Mammalian Ras interacts directly
with the serine/threonine kinase Raf. Cell 1993 ; 74 : 205-14.
29. Spaargaren M, Bischoff JR. Identification of the guanine nucleotide
dissociation stimulator for Ral as a putative effector molecule of R-ras,
H-ras, K-ras and Rap. Proc Natl Acad Sci USA 1994 ; 91 : 12609-13.
30. White MA, Vale T, Camonis JH, Schaefer E, Wigler MH. A role for Ral
guanine nucleotide dissociation stimulator in mediating Ras-induced transformation.
J Biol Chem 1996 ; 271 : 16439-42.
31. Boldin MP, Varfolomeev EE, Pancer Z, Mett IL, Camonis JH, Wallach
D. A novel protein that interacts with the death domain of Fas/APO1 contains
a sequence motif related to the death domain. J Biol Chem 1995
; 270 : 7795-8.
32. Boldin MP, Goncharov TM, Goltsev YV, Wallach D. Involvement of MACH,
a novel MORT1/FADD-interacting protease, in Fas/APO-1- and TNF receptor-induced
cell death. Cell 1996 ; 85 : 803-15.
33. Tirode F, Malaguti C, Romero F, Attar R, Camonis J, Egly AJM. Conditionally
expressed third partner stabilizes or prevents the formation of a transcriptional
activator in a three-hybrid system. J Biol Chem 1997 ; 272 : 22995-9.
34. Aronheim A, Zandi E, Hennemann H, Elledge SJ, Karin M. Isolation
of an AP1 repressor by a novel method for detecting protein-protein interactions.
Mol Cell Biol 1997 ; 17 : 3094-102.
35. Marsolier MC, Prioleau MN, Sentenac A. A RNA polymerase III-based
two-hybrid system to study RNA polymerase II transcriptional regulators.
J Mol Biol 1997 ; 268 : 243-9.
36. Parmley SF, Smith GP. Antibody-selectable filamentous fd phage vectors
: affinity purification of target genes. Gene 1988 ; 73 : 305-18.
37. Cull MG, Miller JF, Schatz PJ. Screening for receptor ligands using
large libraries of peptides linked to the terminus of the Lac repressor.
Proc Natl Acad Sci USA 1992 ; 89 : 1865-9.
38. Sparks A, Rider J, Hoffman N, Fowlkes D, Quilliam L, Kay B. Distinct
ligand preferences of SH3 domains from Src, Yes, Abl, cortactin, p53BP2,
PLCg, Crk and Grb2. Proc Natl Acad Sci USA 1996 ; 93 : 1540-4.
39. Wrighton NC, Farrell FX, Chang R, Kashyap AK, Barbone FP, Mulcahy
LS, Johnson DL, Barrett RW, Jolliffe LK, Dower WJ. Small peptides as potent
mimetics of the protein hormone erythropoietin. Science 1996 ;
273 : 458-63.
40. Cwirla SE, Balasubramanian P, Duffin DJ, Wagstrom CR, Gates CM, Singer
SC, Davis AM, Tansik RL, Mattheakis LC, Boytos CM, Schatz PJ, Baccanari
DP, Wrighton NC, Barrett RW, Dower WJ. Peptide agonist of the thrombopoietin
receptor as potent as the natural cytokine. Science 1997 ; 276
: 1696-9.
41. Barbas CF, Lerner RA. Combinatorial immunoglobin libraries on the
surface of phage (Phabs) : rapid selection of antigen-specific Fabs. In
: Methods : a companion in methods in enzymology 1991 ;
2 : 119-24.
42. Leprince C, Romero F, Cussac D, Vayssière B, Berger R, Tavitian
A, Camonis J. A new member of the amphiphysine family connecting endocytosis
and signal transduction pathways. J Biol Chem 1997 ; 272 : 15101-5.
43. Sparks AB, Hoffman NG, McConnell SJ, Fowlkes DM, Kay BK. Cloning
of ligand targets : systematic isolation of SH3 domain-containing proteins.
Nature Biotechnology 1996 ; 14 : 741-4.
|