Texte intégral de l'article
 
  Version imprimable

Protéine cherche protéine : mode d'emploi


Hématologie. Volume 3, Numéro 6, 540-9, Novembre-Décembre 1997, ABC des stratégies de recherche


Résumé  

Auteur(s) : Jacques Camonis, Françoise Moreau-Gacheli, .

Résumé : Les interactions protéine-protéine constituent des étapes essentielles des processus cellulaires tels que réplication, transcription, traduction, épissage, métabolisme intermédiaire, contrôle du cycle cellulaire, transduction du signal et sécrétion. Certaines de ces interactions sont évidentes quand les protéines purifiées sont des sous-unités de complexes multiprotéiques comme l'hémoglobine ou l'ARN polymérase ou des assemblages plus complexes comme le ribosome ou les particules du splicéosome. Mais un grand nombre d'interactions protéine-protéine dans la cellule sont transitoires. Ainsi des modifications post-traductionnelles impliquent l'interaction du substrat avec kinases, phosphatases, glycosyl transférases, protéases... Des interactions protéine-protéine participent aussi au recrutement des complexes transcriptionnels sur les promoteurs et activateurs de la transcription des gènes, au transport intracellulaire des protéines, à la formation des structures sub-cellulaires... La mise en évidence des complexes protéiques transitoires passe par l'identification des différents partenaires impliqués. Beaucoup des interactions protéine-protéine sont trop faibles pour permettre la purification directe des partenaires interagissant dans des extraits cellulaires. Aussi des méthodes physico-chimiques et génétiques ont-elles été développées pour identifier et caractériser les partenaires d'une association protéine-protéine en utilisant un membre du complexe protéique comme appât.

Illustrations

ARTICLE

Les interactions protéine-protéine constituent des étapes essentielles des processus cellulaires tels que réplication, transcription, traduction, épissage, métabolisme intermédiaire, contrôle du cycle cellulaire, transduction du signal et sécrétion. Certaines de ces interactions sont évidentes quand les protéines purifiées sont des sous-unités de complexes multiprotéiques comme l'hémoglobine ou l'ARN polymérase ou des assemblages plus complexes comme le ribosome ou les particules du splicéosome. Mais un grand nombre d'interactions protéine-protéine dans la cellule sont transitoires. Ainsi des modifications post-traductionnelles impliquent l'interaction du substrat avec kinases, phosphatases, glycosyl transférases, protéases... Des interactions protéine-protéine participent aussi au recrutement des complexes transcriptionnels sur les promoteurs et activateurs de la transcription des gènes, au transport intracellulaire des protéines, à la formation des structures sub-cellulaires... La mise en évidence des complexes protéiques transitoires passe par l'identification des différents partenaires impliqués. Beaucoup des interactions protéine-protéine sont trop faibles pour permettre la purification directe des partenaires interagissant dans des extraits cellulaires. Aussi des méthodes physico-chimiques et génétiques ont-elles été développées pour identifier et caractériser les partenaires d'une association protéine-protéine en utilisant un membre du complexe protéique comme appât.

Méthodes physico-chimiques

Chromatographie d'affinité de protéines

Le couplage d'une protéine d'intérêt à une matrice comme la sépharose permet de réaliser des chromatographies d'affinité pour sélectionner des protéines ligands dans un extrait cellulaire (figure 1). Une condition essentielle pour réaliser une bonne chromatographie d'affinité pour une protéine est d'avoir cette protéine sous un haut degré de pureté sous peine de détecter des protéines liées par un contaminant de la préparation de protéine. De nombreux systèmes de production de protéines de fusion ont été développés. Le principe est de fusionner la protéine d'intérêt à une protéine qui présente de l'affinité pour une résine appropriée. Une des protéines chimériques la plus couramment utilisée contient la glutathion-S-transférase (GST) purifiable sur des colonnes de glutathion-sépharose [1]. D'autres fusions contiennent la protéine A de staphylococcus substrat des colonnes d'immunoglobulines G, un peptide oligohistidine qui se fixe sur une colonne de nickel (Ni++), la protéine liant le maltose purifiée sur des colonnes d'amylose, la dihydrofolate réductase purifiée sur des colonnes de méthotrexate...
La nature du tampon d'élution détermine la spécificité de la rétention des protéines sur la matrice. Beaucoup de protéines sont exclues de telles colonnes d'affinité ou facilement éliminées avec de basses concentrations en sels. Les protéines retenues peuvent être éluées par de hautes concentrations en sels (NaCl ou KCl 0,5 à 1M), par des cofacteurs (ATP, GTP, Ca++) ou des détergents (SDS, NP40, triton X100).
Le matériel de départ pour une chromatographie d'affinité peut être un extrait cellulaire total. Toutefois, si la localisation subcellulaire de la protéine ligand est connue, l'utilisation de compartiments cellulaires fractionnés permet un enrichissement des partenaires recherchés. Le marquage préalable de l'extrait protéique in vivo accroît la sensibilité de la chromatographie d'affinité et permet d'ignorer les peptides résultant de la protéolyse de la protéine d'intérêt liée à la matrice. Le fractionnement subcellulaire permet aussi de limiter les effets dénaturants de la dilution sur la structure des protéines.
Pour détecter efficacement des interactions par chromatographie d'affinité, plusieurs points sont à considérer :
- La concentration de la protéine immobilisée sur la matrice doit être très supérieure à la constante de dissociation du complexe protéine d'intérêt-protéine recherchée (KD). Si la concentration est trop basse, la protéine d'intérêt ne retiendra pas assez de son partenaire. Si la concentration est trop haute, la liaison peut ne pas être spécifique en raison d'effets électrostatiques.
- Réciproquement, la quantité d'extraits appliqués sur la colonne est critique. Si peu d'extrait est appliqué sur la colonne et si la protéine recherchée y est faiblement représentée, la quantité retenue sera en dessous du seuil de détection même si les extraits sont radioactifs. Inversement, l'application de trop d'extraits sur la colonne peut favoriser une compétition entre les ligands potentiels masquant la rétention d'une protéine minoritaire.

- Avantages et inconvénients

La chromatographie d'affinité présente l'avantage de tester de façon équivalente la liaison de toutes les protéines d'un extrait cellulaire et de mettre en évidence des interactions qui dépendent d'un complexe multiprotéique. Elle permet aussi de déterminer les résidus ou les domaines de la protéine critiques pour l'interaction protéine-protéine en utilisant des fusions avec des formes mutées ou tronquées de la protéine. Elle détecte des interactions protéine-protéine caractérisées par un KD de 10- 5 à 10- 10 M. Elle s'est avérée fructueuse pour détecter des interactions fonctionnelles aussi bien entre des partenaires nucléaires à activité transcriptionnelle [2-4] que des partenaires cytoplasmiques des voies de transduction [5-7].

Une interaction peut ne pas être détectée parce que la structure native de la protéine n'est pas respectée lors du couplage à la résine ou est modifiée par la fusion ou simplement parce que la résine empêche l'interaction des deux protéines. Aussi, déterminer au préalable que la protéine de fusion couplée ou non à la résine garde une activité fonctionnelle similaire à celle de la protéine normale est-il un contrôle prudent.

De fausses interactions peuvent résulter de la présence de la fusion dans la protéine d'intérêt, d'une interaction indirecte (la protéine détectée n'interagit pas directement avec la protéine d'intérêt mais se lie par un facteur intermédiaire), d'une haute affinité entre les protéines alors qu'elles ne se rencontrent pas dans la cellule.

D'autre part, les protéines de fusion produites dans les cellules procaryotes ne sont pas modifiées. Or beaucoup d'interactions protéine-protéine dépendent de maturations post-traductionnelles, comme les phosphorylations sur l'un ou l'autre ou les deux partenaires. Par exemple, le facteur de transcription E2F est reconnu de préférence par la forme sous-phosphorylée de la protéine du rétinoblastome pRb [8] et les domaines SH2 des protéines lient plus efficacement les tyrosines phosphorylées que les tyrosines non phosphorylées [9]. Ces protéines de fusion peuvent cependant être phosphorylées in vitro par les kinases spécifiques des sites de phosphorylation endogènes de la protéine. Une alternative est d'exprimer ces protéines de fusion dans des cellules plus proches de l'espèce dont est issue la protéine pour confirmer leur interaction in vivo avec les protéines ligands [10].

Liaison par affinité à un support solide ou far-western

Cette technique apparaît comme une réciproque de la chromatographie d'affinité, les protéines étant d'abord fractionnées par électrophorèse sur gel de polyacrylamide, transférées sur une membrane de nitrocellulose ou de nylon puis identifiées par leur capacité à lier la protéine d'intérêt. Le procédé dérive de celui du Western blot qui utilise des anticorps pour révéler une protéine fixée sur une membrane.

Les protéines sont migrées sur des gels de polyacrylamide en présence de détergents ioniques (SDS) et d'agents réducteurs (bmercapto-éthanol, dithiothréitol) qui dénaturent les protéines et séparent les sous-unités des complexes. Aussi, un facteur déterminant pour détecter avec succès une interaction protéine-protéine sur un support solide est la renaturation de la protéine sur son support. Les agents dénaturants sont déplacés lors de l'électro-transfert ce qui restitue à beaucoup de protéines une activité plus ou moins partielle. Cependant une meilleure renaturation de la protéine est obtenue si la protéine est totalement dénaturée sur le support par de l'urée 8M ou de l'hydrochlorure de guanidine 6M puis renaturée. Pour détecter des interactions dépendantes d'un complexe protéique, la migration peut se faire sur des gels non dénaturants, aux dépens de la résolution de la technique.

Les protéines utilisées comme sonde sont généralement des protéines de fusion identiques à celles utilisées en chromatographie d'affinité. Elles peuvent être marquées par un acide aminé radioactif, par iodination, par phosphorylation ou révélée par un anticorps spécifique. Elles peuvent être biotinylées et détectées avec la phosphatase alcaline conjuguée à l'avidine ou la streptavidine. Une alternative consiste à « tagger » les protéines avec un peptide court lié à une de leurs extrémités. Le « tag » peut être un site de phosphorylation comme celui reconnu par la protéine kinase dépendante de l'AMPc (HMK) qui permet le marquage de la protéine en présence d'ATP g32. Le tag peut ajouter aux protéines des épitopes comme l'épitope de l'hémaglutinine du virus influenza, l'épitope FLAG ou l'épitope de la protéine c-myc (9E10) révélés par des anticorps spécifiques de l'épitope.

- Avantages et inconvénients

Des mélanges aussi complexes que des extraits cellulaires peuvent être analysés directement ce qui peut s'avérer particulièrement utile pour des protéines peu solubles comme les récepteurs de surface cellulaire. Mais les interactions qui mettent en jeu plusieurs sous-unités et se passent au sein d'un complexe ne pourront être détectées à la différence de la chromatographie d'affinité de protéines. Inversement, cette méthode détermine au sein d'un complexe multimérique quelle sous-unité interagit directement avec la protéine d'intérêt.
Bien que cette méthode puisse être utilisée à des fins de purification d'un partenaire protéique [11], elle apparaît plutôt comme une méthode de dépistage de la capacité d'une protéine à interagir avec d'autres protéines.

Co-immunoprécipitation

La co-immunoprécipitation est a priori une méthode simple. L'anticorps est ajouté aux lysats cellulaires ou à des fractions sub-cellulaires, le complexe antigène-anticorps est lavé et les protéines liées au complexe antigène-anticorps sont analysées. Elle peut être réalisée à grande échelle et aboutir à la purification d'une protéine liée à un complexe antigène-anticorps. L'anticorps peut être polyclonal ou monoclonal, préparé contre une protéine purifiée ou contre un peptide synthétique couplé à un transporteur.
C'est ainsi que la protéine p190 effectrice du GAP (GTP-ase activating protein) de Ras a été purifiée à partir de tumeurs fibroblastiques dans le complexe immun formé par un anticorps monoclonal dirigé contre GAP et lié à des billes de protéine A-sépharose [12]. De même, ont été purifiées la sous-unité p85 de la PI3 kinase murine par immunoprécipition avec le récepteur phosphorylé sur tyrosine du PDGF [13], l'oncogène mdm2 par immunoprécipitation avec p53 [14] et la p107 apparentée à RB par immunoprécipitation avec la protéine E1A de l'adénovirus [15].

- Avantages et inconvénients

L'intérêt de la co-immunoprécipitation de protéines dans leur contexte cellulaire est double. D'une part, les partenaires potentiels de l'interaction sont dans des concentrations relatives physiologiques évitant les interactions artefactuelles liées à la présence de quantités massives de l'un des partenaires. D'autre part, les interactions dépendantes de la maturation post-translationnelle des protéines sont accessibles.
Certains artefacts de la co-immunoprécipitation sont liés à la nature des anticorps. En particulier si les anticorps sont polyclonaux, ils doivent être prépurifiés par affinité pour leur antigène afin d'éliminer les anticorps contaminants du sérum. L'anticorps lui-même peut reconnaître la protéine co-immunoprécipitée. La co-immunoprécipitation doit donc se produire avec des anticorps dérivés indépendamment et dirigés contre différents sous-domaines de la protéine.
Finalement, la co-immunoprécipitation in vivo reste un exercice difficile en raison de la faible quantité d'antigène. Bien sûr, les extraits cellulaires peuvent être supplémentés par un excès d'antigène pour amorcer la formation des complexes [16] et les complexes intracellulaires peuvent être stabilisés par pontage covalent avant immunoprécipitation. Mais ces altérations perturbent les conditions naturelles qui font l'attrait de la co-immunoprécipitation in vivo.

Identification du partenaire de la protéine

Ces méthodes physico-chimiques permettent, dans un premier temps, le repérage, par leur poids moléculaire apparent, des protéines susceptibles de lier une protéine d'intérêt. Elles aboutissent finalement à l'identification de ces protéines. Dans la plus simple des éventualités, le poids moléculaire de la protéine ligand est suffisamment évocateur de celui d'un partenaire présumé de la protéine d'intérêt pour que soient testés directement des anticorps spécifiques de ce partenaire présumé.
Dans le cas où la protéine ligand n'est pas directement identifiable, les protéines sont préparées à grande échelle à partir d'extraits cellulaires : quelques chiffres indicatifs qui varient selon le poids moléculaire de la protéine recherchée : 10 à 50 mg de protéines peuvent être escomptés à partir de quelques grammes de tissus (10 à 50 g) ou de quelques milliards de cellules (1010 à 1011). Les protéines peuvent être purifiées par électrotransfert sur nitrocellulose et visualisées par coloration au rouge ponceau. Les bandes excisées du filtre sont digérées par des endopeptidases et les peptides résultants séparés par chromatographie liquide en phase réverse à haute pression. Alternativement, les protéines peuvent être protéolysées directement dans le gel après coloration du gel au nitrate d'argent ou à l'amido-black. Plus classiquement, les protéines peuvent être purifiées à quasi-homogénéité par chromatographies sélectives et successives dans différents tampons d'élution. La séquence de certains peptides pourra être déterminée sans ambiguïté. Alors, deux solutions sont possibles :
- La comparaison de la séquence peptidique avec les banques de données montre une identité de séquence entre le peptide et une protéine connue. Le partenaire est démasqué.
- Le peptide est inconnu. À partir de la séquence peptidique, des oligonucléotides de séquence dégénérée peuvent être utilisés comme sonde pour cribler une banque d'expression appropriée ou comme amorce pour amplifier par PCR l'ADN complémentaire codant cette protéine.

Méthodes génétiques

Différentes méthodes permettent de rechercher dans des librairies d'expression des protéines ou des fragments de protéines qui interagissent avec une protéine d'intérêt. Les librairies sont principalement exprimées dans des bactéries ou des levures. L'intérêt majeur de ces techniques par rapport à l'approche physico-chimique est que les ADNc codant les protéines identifiées sont immédiatement disponibles. Ces méthodes se sont avérées performantes pour caractériser nombre de domaines d'interaction protéine-protéine. Toutefois, la détection d'une interaction hautement spécifique entre deux protéines n'appartenant pas au même compartiment sub-cellulaire apparaît comme un aléa incontournable des méthodes génétiques.

Criblage de banques d'expression de protéines

La protéine d'intérêt est utilisée comme sonde pour cribler une banque d'expression protéique clonée dans le bactériophage lgt11 ou des phages dérivés (figure 2).
Les banques lgt11 utilisent classiquement un promoteur inductible par l'isopropyl-b-D-thio-galactopyranoside (IPTG) pour exprimer des protéines fusionnées à la b-galactosidase. Les protéines exprimées dans les plages de lyse des bactériophages sont transférées sur des filtres et incubées avec la sonde protéique. Les procédés de marquage de la protéine ont été décrits pour le « far-western ». La protéine peut être biotinylée et détectée avec de la streptavidine conjuguée à la phosphatase alcaline. C'est ainsi que le facteur de transcription CREB qui forme des hétérodimères avec Jun a été cloné à partir d'une banque d'expression de fibroblastes stimulés par le sérum par criblage avec le domaine de liaison à l'ADN de Jun préalablement biotinylé [17]. Les protéines peuvent être marquées à l'iode125 et les complexes détectés par autoradiographie. L'utilisation d'une protéine de fusion GST avec le domaine basique-hélice-boucle-hélice-leucine zipper (bHLH-LZ) de la protéine c-Myc marquée à l'iode125 pour cribler une banque de cellules pre-B a permis l'identification de Max, une protéine qui contient aussi un domaine bHLH-LZ et confère à c-Myc sa spécificité de liaison à l'ADN [18]. Prolongeant cette démarche, l'utilisation de Max comme sonde a permis d'identifier un autre membre de la famille des protéines à bHLH-LZ : Mad qui régule négativement l'activité des complexes Myc-Max [19]. La sonde protéique peut être liée à un cofacteur in vitro ou phosphorylée sur des sites de phosphorylation endogènes de la protéine. Le criblage d'une librairie de cerveau humain avec la région carboxy-terminale phosphorylée sur tyrosine du récepteur de l'EGF a permis le clonage de toute la famille des protéines GRB dont GRB1 [20]. Lorsque l'on présume que l'interaction recherchée requiert la phosphorylation des deux partenaires, les protéines de la banque peuvent être phosphorylées sur le filtre par incubation avec des extraits cellulaires exprimant des kinases activées avant d'être criblées avec la sonde protéique phosphorylée par de l'ATP g32. Cette stratégie a été utilisée pour caractériser le site d'interaction du domaine protéique PTB avec les tyrosines phosphorylées [21].

Une protéine de fusion contenant un épitope phosphorylable comme le site HMK peut aussi être utilisée comme sonde. Cette stratégie peut trouver des développements opportunistes comme illustré par la recherche de nouveaux partenaires de Bad, un membre de la famille des protéines Bcl2 impliquées dans l'apoptose. La protéine Bad « taggée » par un site de phosphorylation pour la HMK a été utilisée pour cribler une banque lgt11 d'ADNc d'embryons de souris. Il s'est avéré a posteriori que la protéine 14-3-3 identifiée interagissait avec Bad selon un processus dépendant de la phosphorylation de la sérine 112 de Bad par la HMK [22].

L'éventail de protéines de fusion disponibles et la diversité des systèmes de production de protéines (cellules procaryotes, cellules d'insecte, traduction en réticulocytes...) offrent donc un large choix de stratégies pour marquer une protéine ou ses domaines. Toutefois, si un anticorps spécifique de la protéine est disponible, l'anticorps permet la détection directe des plages de lyse qui interagissent avec la protéine antigénique. Ainsi, E2F a été identifié dans une banque de cellules preB criblée avec la région poche de la protéine RB puis couplée à un anticorps anti-RB [23].

- Limites

Le criblage de banques d'expression présente quelques limites :
- Les protéines exprimées dans la librairie doivent se replier correctement et garder leur structure sur nitrocellulose. Les protéines peuvent être renaturées par un cycle de dénaturation-renaturation avec de l'hydrochlorure de guanidine 6M ou l'urée 8M.
- Les conditions d'hybridation sont arbitraires et ne reflètent pas les interactions dans le milieu cellulaire.
- L'abondance relative des protéines exprimées dans les plages de lyse ne tient compte ni du niveau d'expression ni de la compartimentalisation dans la cellule.

La méthode dite du double-hybride (2H)

Les prémisses du double-hybride sont établies dans les années 80 avec la description d'un transactivateur « générique » qui se résumerait à la juxtaposition d'un « domaine d'activation » qui recrute la machinerie de polymérisation des ARN, et d'un domaine de liaison à l'ADN qui reconnaît spécifiquement une séquence d'ADN située dans les promoteurs stimulés par ce transactivateur. Ce second domaine positionne ce que le premier a recruté.
Deux séries de données supplémentaires vont permettre l'émergence du 2H. En première approximation, un domaine d'activation est remplaçable par un autre. De même, un domaine de liaison à l'ADN est remplaçable par un autre, à condition de changer aussi sa séquence de reconnaissance dans le promoteur à stimuler. Enfin, le domaine de liaison à l'ADN (DLA) et le domaine d'activation (DA) ne doivent pas nécessairement appartenir à la même chaîne polypeptidique. Le double-hybride, qui a deux pères : Stanley Fields and Roger Brent, est la généralisation de ces principes [24, 25]. Ainsi, si un domaine de liaison à l'ADN est fusionné à une protéine A et si le domaine d'activation est fusionné à une protéine B, l'interaction de DLA-A avec B-DA reconstitue un transactivateur fonctionnel. Si l'expression d'un gène reporter est sous le contrôle d'un promoteur contenant la séquence reconnue par le DLA de la protéine chimère DLA-A, l'interaction avec B-DA sera détectée par l'expression du reporter.
C'est dans la levure S. cerevisiae que ce système s'est épanoui et une de ses premières versions nécessite trois composants :
- une levure dans le génome de laquelle une cassette [promoteur de GAL1-gène LacZ] est intégrée et qui, par ailleurs, est mutée dans le gène GAL4 qui sinon transactiverait le promoteur GAL1 ;
- un plasmide pour l'expression d'une protéine A fusionnée au DLA de Gal4 (Gal4DLA) ;
- un autre plasmide pour l'expression d'une protéine B fusionnée au DA de Gal4 (Gal4DA). L'interaction entre A et B permet l'expression du gène LacZ (figure 3). Depuis cette première version, des gènes de sélection variés ont été utilisés comme reporter et de multiples variantes utilisent différents DLA et différents DA.
Le double-hybride s'est vu appliqué à deux types majeurs de travaux.
* L'étude d'un couple de protéines définies permet de vérifier leur capacité à interagir. Mais aussi, à partir d'un couple de protéines qui interagissent, il est possible de chercher des mutants d'un des partenaires qui n'interagissent plus [26], en particulier grâce à des systèmes de sélection positive en cas de non-interaction [27]. Partant de ces mutants de non-interaction, il est alors possible de chercher des mutants de l'autre partenaire qui restaurent l'interaction. Si ces suppresseurs sont spécifiques d'allèle, le niveau de résolution de la méthode permet de définir les résidus en contact dans l'interaction de départ.
* Mais le champ principal d'applications du 2H a été d'exprimer une protéine d'intérêt fusionnée à un DLA et de cribler des banques d'ADNc clonés en 3' d'une région codant un DA dans un « plasmide double-hybride ». De telles banques expriment les protéines codées par les ADNc, fusionnées à l'extrémité carboxy-terminale du DA.
Depuis sa description en 1989, le système du double-hybride en levure a vu le nombre de ses utilisateurs croître de façon vertigineuse. Deux domaines méritent d'être mentionnés.
- Les GTPases sont des appâts de choix et il n'est pas certain qu'il reste une GTPase qui n'ait pas été essayée comme appât dans un crible double-hybride. La plus fameuse reste probablement Ras pour laquelle le double-hybride a permis de définir les protéines Raf mais aussi les RalGDS comme partenaires puis comme effecteurs [28-30].
- Les domaines intracellulaires de nombreuses protéines transmembranaires ont été utilisés dans des cribles double-hybride. Par exemple, l'application du double-hybride à la partie cytoplasmique du récepteur au TNF a mis en évidence les maillons de la cascade de signalisation menant de la stimulation de ces récepteurs à la mort cellulaire [31, 32].

- Limites

Une première limite découle du fait que la formation du transactivateur DLA-A ::B-DA a lieu dans le noyau (grâce à au moins un signal de localisation nucléaire dans le DA). Or A et B peuvent ne jamais se rencontrer dans la cellule si elles résident dans des compartiments cellulaires différents.
Certaines modifications post-traductionnelles (phosphorylation, glycosylation, etc.) nécessaires à une interaction peuvent ne pas avoir lieu dans la levure. Mais des opportunités peuvent se présenter : par exemple, les parties cytoplasmiques des récepteurs à activité tyrosine kinase, dans le système double-hybride, s'autophosphorylent sur des tyrosines, probablement parce que dimérisés par les régions de dimérisation des DLA, et sont donc accessibles aux interactions avec les domaines SH2. Une solution peut résider dans le « triple-hybride » où une troisième protéine, apportant l'activité manquante, est exprimée [33].
Une autre limite du double-hybride réside dans le fait que la protéine appât peut transactiver par elle-même. De plus, certaines protéines transactivent « par accident » : elles ne sont pas des transactivateurs mais, par exemple, tel domaine très acide est exposé et fait office de DA.
Devant l'impossibilité d'utiliser le double-hybride avec certaines protéines transactivatrices, une stratégie alternative qui déplace le 2H du noyau vers le cytoplasme a été récemment décrite. L'observation de départ est la suivante : à moins de surexpression massive, les facteurs d'échange Sos de Ras doivent être transloqués à la membrane plasmique pour être rapprochés de leurs substrats, les protéines Ras. Chez la levure S. cerevisiae, le gène CDC25 code un facteur d'échange de Ras. Dans une souche cdc25 thermosensible, l'expression modérée de la région « CDC25 » de Sos ne permet pas de supprimer la thermosensibilité. Si cette région CDC25 est amenée à la membrane (par exemple en lui fusionnant un motif de myristilation ou de farnesylation), elle va activer Ras, supprimer la mutation cdc25ts et permettre la croissance à température restrictive. Ici, le double-hybride consiste en une protéine A fusionnée à un signal de myristilation, et une protéine B fusionnée au domaine CDC25 de Sos. Si A et B interagissent, un complexe [signal de mirystilation-A::B- CDC25] est formé qui va se localiser à la membrane : le domaine CDC25 va pouvoir activer Ras. La mutation cdc25ts est alors supprimée : les levures pourront être selectionnées par leur croissance à température restrictive 37 °C [34].
Une autre variante est basée sur le fait que la sous-unité t138 du complexe TFIIIC contacte l'ADN en un site spécifique. Si ce site est remplacé par des séquences de liaison du DLA de Gal4 et si le DLA de Gal4 (acides aminés 1-147) est fusionné à t138, la protéine TFIIIC est fontionnelle et peut promouvoir le recrutement de TFIIIB et la transcription par l'ARN PolIII. Si dans un tel contexte, une protéine A est fusionnée à t138 et une protéine B est fusionnée au DLA de Gal4, et si A et B interagissent, alors le complexe [t138-A::B-Gal4(1-147)] est fonctionnel et TFIIIC fonctionne correctement. Ici un domaine de type DA de Gal4 ne suffit pas à générer la transcription à lui seul et ce système permettrait l'étude des activateurs transcripionnels de l'ARNPolII [35].

Criblage de banques présentées par des phages

Le système de « présentation sur phage » utilise des banques de peptides synthétiques de séquence aléatoire (4 à 15 acides aminés sont les tailles les plus courantes) ou des banques de domaines peptidiques. Il a surtout permis l'identification de ligands peptidiques.

Le principe consiste à cloner une banque plus ou moins dégénérée d'oligonucléotides en 5' du gène de la protéine pIII (ou plus rarement pVIII) d'un phage M13, entre le peptide signal et la protéine structurale elle-même. pIII est orientée dans le phage avec son extrémité C-terminale vers l'intérieur et son extrémité N-terminale vers l'extérieur : les peptides de la banque fusionnée sont ainsi présentés à l'extérieur du phage (figure 4). Après passage dans E. coli, il est aisé d'obtenir une suspension de phages d'une complexité de plus de 108 dans un faible volume (1-2 ml). Cette suspension est passée sur un support solide (par exemple une résine ou une surface plastique) sur lequel est immobilisée la protéine d'intérêt. Les phages sélectionnés sont utilisés pour ré-infecter E. coli et plusieurs cycles d'enrichissement permettent d'isoler une population clonale d'un phage présentant un motif d'interaction [36].

Cette stratégie a été améliorée avec un système de phagémide dans lequel la fusion peptide-pIII est apportée par un plasmide portant une origine de réplication f1. Le système requiert un phage « helper » lui-même désarmé. Les phages infectieux produits dans une telle combinaison présentent un mélange de protéine III sauvage (apportée par le « helper ») et de pIII chimérique.

- Avantages et inconvénients

Cette technique présente plusieurs avantages :
- sa vitesse d'exécution : tout le travail a lieu dans E. coli qui se multiplie plus vite que la levure (technique du 2H),
- elle ne nécessite pas des quantités importantes de cellules (techniques physico-chimiques),
- elle donne accès directement à la séquence nucléique. Elle permet de rechercher les ligands de protéines « natives », par exemple ceux de récepteurs dans leur état glycosylé en utilisant des cellules entières exprimant le dit récepteur comme « tamis à phages ».
Le principal inconvénient vient du fait que la fusion entre « la banque » et pIII a lieu entre le peptide signal et la protéine structurale : s'il est facile de synthétiser des oligonucléotides de taille définie qui seront en phase en 5' et en 3', la constitution de banques, obligatoirement initiées au hasard pour éviter les codons stop, n'aura un rendement que de 1 sur 9. Il faudra donc cribler 9 fois plus de phages. D'autre part, il y a probablement des limites supérieures de taille et de conformation, avec un biais possible à l'encontre de certains domaines qui pourraient soit ne pas être correctement présentés soit empêcher la présentation de la protéine pIII.
Le problème des fusions N-terminales a été partiellement résolu grâce à une astucieuse idée de fusion C-terminale. Les peptides aléatoires sont fusionnés à la région C-terminale du répresseur lactose lacI de E. coli et exprimés à partir d'un plasmide contenant la séquence de l'opérateur lactose capable de lier le répresseur. Ainsi le peptide de fusion lie le plasmide qui le code. Les bactéries sont lysées et les répresseurs chimériques liés à l'ADN grâce à leur forte affinité pour l'opérateur sont sélectionnés par leur affinité pour la protéine d'intérêt immobilisée sur colonne comme dans un système phagique classique. Les ADN plasmidiques sélectionnés en même temps que les peptides sont retournés dans E. coli pour deux ou trois cycles d'enrichissement [37].
Un exemple d'application de cette méthode fut la recherche des motifs liant différentiellement divers domaines SH3, et la détermination des consensus et des divergences au sein de ces motifs [38]. Ce système a aussi permis d'identifier des peptides qui lient et activent des récepteurs de cytokines comme l'érythropoïétine et la thrombopoïétine [39, 40]. Il est remarquable que ces peptides mimétiques des hormones naturelles ne sont pas trouvés dans la séquence primaire de ces hormones.
Ce système a permis aussi l'expression/ présentation de chaînes d'anticorps à la surface des phages, avec la sélection possible d'un phage présentant un domaine anticorps contre une protéine étudiée. L'expansion de ce phage fournit une source quasi infinie d'anticorps (ou de pseudo-anticorps) [41].

CONCLUSION

Un choix s'impose

Devant cet éventail de méthodes, laquelle choisir ? Y a-t-il une rationalisation possible de ce choix en fonction du type de protéine étudiée ? Le taux de succès de chaque technique est quasi impossible à évaluer, les résultats positifs étant les seuls publiés.

Quelques points pour sortir de l'expectative

* La disponibilité de l'extrait protéique de départ peut être déterminante. Le seuil de détection d'une protéine exprimée dans une cellule est plus bas pour les techniques génétiques que pour les techniques de chromatographies ou de co-immunoprécipitation. A priori une protéine rare sera plus accessible dans une librairie hautement représentative. Obtenir suffisamment de protéines pour un microséquençage (50 à 100 picomoles de protéines) demande de disposer au départ, de quelques de grammes de tissus ou de cellules.
* L'interaction de 2 protéines in vivo peut dépendre de co-facteurs :
- des petites molécules effectrices comme l'ATP ou le GTP et des ions comme le Ca++,
- des macromolécules comme l'ADN ou l'ARN qui affectent les interactions protéine-protéine en formant des complexes ternaires ou macromoléculaires. De tels complexes peuvent être beaucoup plus stables que des complexes binaires et ne sont accessibles que par la biochimie.
* Évidemment, si une protéine est insoluble, les chromatographies d'affinités sont à exclure.
* Les techniques génétiques sont rapides, faciles à mettre en oeuvre et peu dispendieuses. Partant d'un appât exprimé à partir d'un plasmide double-hybride, il faut de 15 jours à 3 mois pour cribler une banque et sortir du 2H. De même pour le criblage d'une banque d'expression avec une sonde protéique. Attrayante aussi est l'idée de « boucler ». À partir d'une protéine donnée, un partenaire est isolé. Cette dernière protéine sert alors à chercher le partenaire du partenaire.
* La rumeur dit que les facteurs de transcription se prêtent peu au double-hybride (du moins jusqu'à ses deux dernières variantes décrites dans le texte mais non éprouvées...). Mais il est des contre-exemples à succès.
Il n'y a donc pas d'arbre décisionnel simple et hors des écueils évidents à contourner, il y va beaucoup de ses « affinités » personnelles pour la génétique ou la biochimie. Il est remarquable qu' un même problème biologique a été abordé selon des techniques différentes par des équipes différentes. Ainsi, la recherche de néo-domaines SH3 a été effectuée aussi bien par double-hybride que par criblage de banques d'expression [42, 43], avec pour l'instant avantage à la seconde approche en terme de nouvelles protéines identifées.

Le mot de la fin

Le but de l'étude des interactions protéine-protéine est de comprendre les conséquences de cette interaction pour la fonction de la cellule. Caractérisée dans un contexte expérimental, la détection d'un lien entre deux protéines ne peut être interprétée comme la démonstration d'une interaction biologiquement significative. L'interaction doit être vérifiée par les autres techniques physico-chimiques et génétiques ainsi que dans des essais fonctionnels basés sur les activités biologiques de chacun des partenaires. Ces protéines sont-elles détectées dans le même compartiment cellulaire par immunofluorescence ? Des interférences fonctionnelles existent-elles entre ces partenaires potentiels ? Des mutants de ces protéines affectent-ils ces processus ? Quelles sont les constantes d'association et de dissociation qui régissent l'équilibre partenaires libres <–> partenaires complexés. La réponse à de telles questions est nécessaire pour valider une interaction protéine-protéine.

Il est donc bon de savoir que lorsque vous aurez identifié, après bien des efforts, un ou des partenaires potentiels de votre protéine favorite, le vrai travail quant à la réalité fonctionnelle de l'interaction de votre protéine avec son ou ses partenaires va commencer...

REFERENCES

1. Smith DB, Johnson KS. Single-step purification of polypeptides expressed in Escherichia coli as fusions with glutathione S-transferase. Gene 1988 ; 67 : 31-40.

2. Stringer K, Ingles CJ, Greenblatt J. Direct and selective binding of an acidic transcriptional activation domain to the TATA-box factor TFIID. Nature 1990 ; 345 : 783-6.

3. He Z, Brinton B, Greenblatt J, Hassell J, Ingles CJ. The transactivator proteins VP16 and Gal4 bind to the replication factor A. Cell 1993 ; 73 : 1223-32.

4. Hallier M, Tavitian A, Moreau-Gachelin F. The transcription factor Spi-1/PU.1 binds RNA and interferes with the RNA-binding protein p54nrb. J Biol Chem 1996 ; 271 : 11177-81.

5. Gout I, Dhand R, Hiles ID, Fry MJ, Panayotou G, Das P, Truong O, Totty NF, Hsuan J, Booker GW, Campbell ID, Watefield MD. The GTPase dynamin binds to and is activated by a subset of SH3 domains. Cell 1993 ; 75 : 25-36.

6. Okabayashi Y, Sugimoto Y, Totty NF, Hsuan J, Kido Y, Sakaguchi K, Gout I, Waterfield D, Kasuga M. Interaction of Shc with adaptor protein adaptins. J Biol Chem 1996 ; 271 : 5265-9.

7. Matsui T, Amano M, Yamamoto T, Chihara K, Nakafuku M, Ito M, Nakano T, Okawa K, Iwamatsu A, Kaibuchi K. Rho-associated kinase, a novel serine/threonine kinase, as a putative target for the small GTP binding protein Rho. EMBO J 1996 ; 15 : 2208-16.

8. Ludlow JW, Glendening CL, Livingston DM, DeCaprio JA. Specific enzymatic dephosphorylation of the retinoblstoma protein. Mol Cell Biol 1993 ; 13 : 367-72.

9. Felder S, Zhou M, Hu P, Urena J, Ullrich A, Chaudhuri M, Shoelson SE, Schlessinger J. SH2 domains exhibit high-affinity binding to tyrosine-phosphorylated peotides yet also exhibit rapid dissociation and exchange. Mol Cell Biol 1993 ; 13 : 1449-55.

10. Cohen BD, Lowy DR, Schiller JT. The conserved C-trminal domain of the bovine papillomavirus E5 oncoprotein can associate with an a-adaptin-like molecule : a possible link between growth factor receptors and viral transformation. Mol Cell Biol 1993 ; 13 : 6462-8.

11. Mayer BJ, Jackson PK, Baltimore D. The non catalytic src homology region 2 segment of abl tyrosine kinase binds to tyrosine-phosphorylated cellular proteins with high affinity. Proc Natl Acad Sci USA 1991 ; 88 : 627-31.

12. Settleman J, Narasimhan V, Foster LC, Weinberg R. Molecular cloning of cDNAs encoding the GAP-associated protein p190 : Implications for a signaling pathway from Ras to the nucleus. Cell 1992 ; 69 : 539-49.

13. Escobedo JA, Navankasattusas S, Kavanaugh WM, Milfay D, Fried VA, Williams LY. cDNA cloning of a novel 85Kd protein that has SH2 domains and regulates binding of PI3-kinase to the PDGFb-receptor. Cell 1991 ; 65 : 75-82.

14. Momand J, Zambetti GP, Olson DC, George D, Levine A. The mdm2 oncogene product forms a complex with the p53 protein and inhibits p53-mediated transactivation. Cell 1992 ; 69 : 1237-45.

15. Ewen ME, Xing Y, Lawrence JB, Livingston DM. Molecular cloning, chromosomal mapping and expression of the cDNA for p107, a retinoblastoma gene product-related protein. Cell 1991 ; 66 : 1155-65.

16. Ewen M, Faha B, Harlow E, Livingston DM. Interaction of p107 with cyclin A independent of complex formation with viral oncoproteins. Science 1992 ; 255 : 85-7.

17. Mac Gregor PF, Abate C, Curran T. Direct cloning of leucine zipper proteins : Jun binds cooperatively to the CRE with CRE-BP1. Oncogene 1990 ; 5 : 451-8.

18. Blackwood EM, Eisenman RN. Max : a helix-loop-helix zipper protein that forms a sequence-specific DNA-binding complex with Myc. Science 1991 ; 251 : 1211-7.

19. Ayer DE, Kretzner L, Eisenman RN. Mad : a heterodimeric partner for Max that antagonizes Myc transcriptional activity. Cell 1993 ; 72 : 211-22.

20. Skolnik EY, Margolis B Mohammadi M, Lowenstein E, Fischer R, Repps A, Ullrich A, Schlessinger J. Cloning of PI3 kinase-associated p85 utilizing a novel method for expression/cloning of target proteins for receptor tyrosine kinases. Cell 1991 ; 65 : 83-90.

21. Kavanaugh WM, Turck C, Williams LT. PTB domain binding to signaling proteins through a sequence motif containing phosphotyrosine. Science 1996 ; 268 : 1177-9.

22. Zha J, Harada H, Yang E, Jockel J, Korsmeyer J. Serine phosphorylation of death agonist BAD in response to survival factor results in binding to 14-3-3 not BCL-XL. Cell 1996 ; 87 : 619-28.

23. Helin K, Lees JA, Vidal M, Dyson N, Harlow E Fattaey A. A cDNA encoding a pRB-binding protein with properties of the transcription factor E2F. Cell 1992 ; 70 : 337-50.

24. Fields S, Song O. A novel genetic system to detect protein-protein interactions. Nature 1989 ; 340 : 245-6.

25. Gyuris J, Golemis E, Chertkov H, Brent R. Cdi1, a human G1-phase and S-phase protein phosphatase that associates with cdk2. Cell 1993 ; 75 : 791-803.

26. White MA, Nicolette C, Minden A, Polverino A, Van Aelst L, Karin M, Wigler MH. Multiple Ras functions can contribute to mammalain cell transformation. Cell 1995 ; 80 : 533-41.

27. Vidal M, Brachmann RK, Fattaey A, Harlow E, Boeke JD. Reverse two-hybrid and one-hybrid systems to detect dissociation of protein-protein and DNA-protein interactions. Proc Natl Acad Sci USA 1996 ; 93 : 10315-20.

28. Vojtek AB, Hollenberg SM, Cooper JA. Mammalian Ras interacts directly with the serine/threonine kinase Raf. Cell 1993 ; 74 : 205-14.

29. Spaargaren M, Bischoff JR. Identification of the guanine nucleotide dissociation stimulator for Ral as a putative effector molecule of R-ras, H-ras, K-ras and Rap. Proc Natl Acad Sci USA 1994 ; 91 : 12609-13.

30. White MA, Vale T, Camonis JH, Schaefer E, Wigler MH. A role for Ral guanine nucleotide dissociation stimulator in mediating Ras-induced transformation. J Biol Chem 1996 ; 271 : 16439-42.

31. Boldin MP, Varfolomeev EE, Pancer Z, Mett IL, Camonis JH, Wallach D. A novel protein that interacts with the death domain of Fas/APO1 contains a sequence motif related to the death domain. J Biol Chem 1995 ; 270 : 7795-8.

32. Boldin MP, Goncharov TM, Goltsev YV, Wallach D. Involvement of MACH, a novel MORT1/FADD-interacting protease, in Fas/APO-1- and TNF receptor-induced cell death. Cell 1996 ; 85 : 803-15.

33. Tirode F, Malaguti C, Romero F, Attar R, Camonis J, Egly AJM. Conditionally expressed third partner stabilizes or prevents the formation of a transcriptional activator in a three-hybrid system. J Biol Chem 1997 ; 272 : 22995-9.

34. Aronheim A, Zandi E, Hennemann H, Elledge SJ, Karin M. Isolation of an AP1 repressor by a novel method for detecting protein-protein interactions. Mol Cell Biol 1997 ; 17 : 3094-102.

35. Marsolier MC, Prioleau MN, Sentenac A. A RNA polymerase III-based two-hybrid system to study RNA polymerase II transcriptional regulators. J Mol Biol 1997 ; 268 : 243-9.

36. Parmley SF, Smith GP. Antibody-selectable filamentous fd phage vectors : affinity purification of target genes. Gene 1988 ; 73 : 305-18.

37. Cull MG, Miller JF, Schatz PJ. Screening for receptor ligands using large libraries of peptides linked to the terminus of the Lac repressor. Proc Natl Acad Sci USA 1992 ; 89 : 1865-9.

38. Sparks A, Rider J, Hoffman N, Fowlkes D, Quilliam L, Kay B. Distinct ligand preferences of SH3 domains from Src, Yes, Abl, cortactin, p53BP2, PLCg, Crk and Grb2. Proc Natl Acad Sci USA 1996 ; 93 : 1540-4.

39. Wrighton NC, Farrell FX, Chang R, Kashyap AK, Barbone FP, Mulcahy LS, Johnson DL, Barrett RW, Jolliffe LK, Dower WJ. Small peptides as potent mimetics of the protein hormone erythropoietin. Science 1996 ; 273 : 458-63.

40. Cwirla SE, Balasubramanian P, Duffin DJ, Wagstrom CR, Gates CM, Singer SC, Davis AM, Tansik RL, Mattheakis LC, Boytos CM, Schatz PJ, Baccanari DP, Wrighton NC, Barrett RW, Dower WJ. Peptide agonist of the thrombopoietin receptor as potent as the natural cytokine. Science 1997 ; 276 : 1696-9.

41. Barbas CF, Lerner RA. Combinatorial immunoglobin libraries on the surface of phage (Phabs) : rapid selection of antigen-specific Fabs. In : Methods : a companion in methods in enzymology 1991 ; 2 : 119-24.

42. Leprince C, Romero F, Cussac D, Vayssière B, Berger R, Tavitian A, Camonis J. A new member of the amphiphysine family connecting endocytosis and signal transduction pathways. J Biol Chem 1997 ; 272 : 15101-5.

43. Sparks AB, Hoffman NG, McConnell SJ, Fowlkes DM, Kay BK. Cloning of ligand targets : systematic isolation of SH3 domain-containing proteins. Nature Biotechnology 1996 ; 14 : 741-4.