CA2405124A1

CA2405124A1 - Gene codant pour l'erbin et utilisations diagnostiques et therapeutiques

Info

Publication number: CA2405124A1
Application number: CA002405124A
Authority: CA
Inventors: Daniel Birnbaum; Jean-Paul Borg; Ben Margolis
Original assignee: Individual
Current assignee: Institut National de la Sante et de la Recherche Medicale INSERM; University of Michigan
Priority date: 2000-04-07
Filing date: 2001-04-09
Publication date: 2001-10-18
Also published as: WO2001077323A1; FR2807437A1; JP2003530109A; US20040014055A1; FR2807437B1; EP1268790A1

Abstract

Cette invention concerne un nouveau gène, qui code pour une protéine désigné e Erbin (pour "Erbb2 Interacting protein"), qui interagit avec la partie intracellulaire des récepteurs ERBB2/HER-2, impliquée notamment dans le développement des cancers, les utilisations diagnostiques et thérapeutiques des nouvelles séquences nucléotidiques et d'acides aminés identifiées.</SDOA B>

Description

GENE CODANT POUR L'ERBIN, ET UTILISATIONS DIAGNOSTIQUES ET THERAPEUTIQUES
La présente invention a trait à un nouveau gène, qui code pour une protéine, désignée Erbin, qui interagit avec le récepteur ERBB2/HER-2.
ERBB2/HER-2 est un récepteur à activité tyrosine kinase de la famille des récepteurs à l'EGF impliqué dans les carcinomes (cancers épithéliaux) touchant de nombreux organes humains tels que le foie, le rein et le sein par exemple (Ross et al, 1999 ; Klapper et al, 2000). Cette implication est directement liée à l'activité enzymatique du récepteur (dite tyrosine kinase) et sa signalisation intracellulaire, comme de nombreuses études in vitro l'ont montré.
Le gène erbb2 est amplifié dans environ 30% des cancers du sein et constitue un facteur de mauvais pronostic en terme de survie du patient. Le fait que ce récepteur soit surexprimé sur les cellules tumorales et qu'il présente une activité
enzymatique exacerbée suscite un vif intérêt en thérapeutique humaine. Deux approches sont actuellement mises en oeuvre pour cibler ce récepteur et diminuer son effet tumorigène chez l'homme.
La première consiste à bloquer l'excès de ERBB2/HER-2 et donc la croissance des tumeurs grâce à une anticorps monoclonal appelé Herceptin~ ou Trastuzumab~ (commercialisé par GENENTECH) utilisé dans les cancers du sein. Mais ce médicament n'a été efficace que chez la moitié des femmes qui l'ont testé. La deuxième approche est l'utilisation d'inhibiteurs de I°activité
enzymatique du récepteur. Aucun médicament mettant à profit cette approche n'est mis sur le marché actuellement. II existe donc un besoin de disposer d'autres moyens susceptibles de moduler l'activité du récepteur et/ou son expression dans les tumeurs.
Les auteurs de la présente invention sont maintenant parvenus à
identifier de manière précise un nouveau gène qui code pour une protéine qui se fixe à la partie intracellulaire du récepteur, constitue un nouvel adaptateur spécifique de ERBB2, et est impliqué dans sa localisation sub-cellulaire.
Cette nouvelle protéine a été dénommée Erbin, pour "Erbb2 Interacting protein".

2 En annexe se trouve une liste de séquences, dans laquelle la séquence SEQ ID n° 1 représente le fragment d'ADNc du gène de l'Erbin chez l'homme correspondant au cadre de lecture ouvert (ORF). Cet ORF (nucléotides 324 à 4436 sur SEQ ID n° 1 ) code pour une protéine de 1371 acides aminés, dont la séquence est présentée SEQ ID n° 2.
Trois régions sont définies dans la protéine - région amino-terminale (résidus 1 à 501 ) contenant des motifs LRR ;
- région carboxy-terminale (résidus 1279 à 1371 ) comprenant le domaine PDZ ;
- région centrale (résidus 502 à 1278). C'est une région spécifique de l'Erbin, non conservée dans d'autres protéines, dont la fonction est de fixer d'autres protéines, à activité enzymatique (phosphatase, kinase...) ou sans activité enzymatique, impliquées dans la fonction de l'Erbin ou sa localisation. Ce fragment protéique ou les polypeptides comprenant ce fragment font également partie de l'invention. L'association peut être constitutive ou modulée par une modification post-traductionnelle de l'Erbin (phosphorylation....). Au regard de la séquence primaire de cette région, des domaines SH3 ou W1N de protéines cytosoliques peuvent se fixer sur les résidus 971 à 977, les résidus 1100 à
1105, les résidus 1115 à 1121. Ces fragments protéiques ou les peptides ou polypeptides comprenant ces fragments font également partie de l'invention.
La liste des séquences annexée comprend également un fragment d'ADNc du gène de l'Erbin chez la souris (SEQ ID n° 3) dont la partie codante (nucléotides 1 à 1485 de SEQ ID n° 3) code pour une protéine incomplète de 495 acides aminés, représentée par SEQ ID n° 4.
Cette séquence peptidique de souris est homologue à la séquence peptidique de l'Erbin humaine (plus de 80 % d'identité au niveau protéique et nucléotidique, entre le résidu 914 et le résidu 1371 de la séquence humaine SEQ
ID n° 2), à l'exception du peptide entre les résidus 296 et 334 de SEQ
ID n° 4 (correspondant aux nucléotides 889 à 1006 sur SEQ ID n° 3), spécifique de la séquence de souris. Ces fragments spécifiques murins font également partie de l'invention.

3 PCT/FRO1/01078 La séquence SEQ ID n° 5 comprend une séquence partielle génomique de l'Erbin de souris. Elle contient le premier exon de l'Erbin (nucléotides 2347 à 2535 sur SEQ ID n° 5, qui présentent une identité
de 94 avec la séquence humaine et codent pour les résidus 1 à 63 de l'Erbin de souris sur SEQ ID n° 4, identiques à 100 % à la séquence humaine). L'acide nucléique isolé comprenant une séquence comprenant les nucléotides 2347 à 2535 sur SEQ ID n° 5 fait également partie de l'invention.
La séquence SEQ ID n°6 est une séquence nucléotidique que l'on retrouve insérée entre les nucléotides 3956 et 3957 de l'Erbin humaine (SEQ ID
n° 1 ), en conservant son cadre de lecture ouverte, chez un variant.
Cette séquence SEQ ID n° 6 code pour le peptide SEQ ID n°
7, qui s'insère entre les acides aminés 1211 et 1212 de SEQ ID n° 2.
La séquence SEQ ID n° 8 est une sonde en 5' de la séquence humaine de l'Erbin (nucléotides 74 à 750 de SEQ ID n° 1), tandis que la séquence SEQ ID n° 9 est une sonde en 3' (nucléotides 4240 à 4600 de SEQ ID
n° 1 ).
Les séquences SEQ ID n° 10 à SEQ ID n° 20 sont des amorces utiles pour amplifier l'ADNc de l'Erbin humaine par PCR, selon le tableau suivant:
SEQ ID n correspondance de nuclotides sur SEQ
ID n 1 La squence SEQ ID n 21 reprsente les neuf derniers acides amins carboxy-terminaux de ERBB2.

4 La présente invention a donc pour objet un acide nucléique isolé, comprenant la séquence SEQ ID n° 1, n° 3 ou n° 5. II est entendu que sont également comprises les séquences homologues, définies comme i) des séquences similaires à au moins 70 % de la séquence SEQ ID n° 1, n° 3 ou n° 5 ; ou ii) des séquences hybridant avec la séquence SEQ ID n° 1, n° 3 ou n° 5 ou sa séquence complémentaire, dans des conditions stringentes d'hybridation, ou iii) des séquences codant pour le polypeptide, dénommé Erbin, tel que défini précédemment.
De préférence, une séquence nucléotidique homologue selon l'invention est similaire à au moins 75 % des séquences SEQ ID n°1, n° 3 ou n°5, de préférence encore au moins 85 %, ou au moins 90 %.
De manière préférentielle, une telle séquence nucléotidique homologue hybride spécifiquement aux séquences complémentaires de la séquence SEQ ID n° 1, n° 3 ou n° 5 dans des conditions stringentes. Les paramètres définissant les conditions de stringence dépendent de la température à laquelle 50% des brins appariés se séparent (Tm).
Pour les séquences comprenant plus de 30 bases, Tm est définie par la relation : Tm=81,5+0,41 (%G+C)+16,6Log(concentration en cations) -0,63(%formamide) -(600/nombre de bases) (Sambrook et al., 1989).
Pour les séquences de longueur inférieure à 30 bases, Tm est définie par la relation : Tm= 4(G+C) + 2 (A+T).
Dans des conditions de stringence appropriées, auxquelles les séquences aspécifiques n'hybrident pas, la température d'hybridation peut être de préférence de 5 à 10°C en dessous de Tm, et les tampons d'hybridation utilisés sont de préférence des solutions de force ionique élevée telle qu'une solution 6xSSC par exemple.
Le terme "séquences similaires" employé plus haut se réfère à la ressemblance parfaite ou identité entre les nucléotides comparés mais aussi à
la ressemblance non parfaite que l'on qualifie de similitude. Cette recherche de similitudes dans les séquences nucléiques distingue par exemple les purines et les pyrimidines.

Une séquence nucléotidique homologue à l'ORF représentée à la SEQ ID n° 1, n° 3 ou n° 5 inclut donc toute séquence nucléotidique qui diffère de la séquence SEQ ID n° 1, n° 3 ou n° 5 par mutation, insertion, délétion ou substitution d'une ou plusieurs bases, ou par la dégénérescence du code génétique, pour autant qu'elle code pour un polypeptide présentant l'activité
biologique de l'Erbin, comme définie plus bas.
Parmi de telles séquences homologues, sont comprises les séquences des gènes de mammifères autres que l'homme, codant pour l'Erbin, de préférence d'un primate, d'un bovin, ovin ou porc, ou encore d'un rongeur, ainsi que les variants alléliques.
La présente invention a également pour objet un polypeptide isolé, dénommé Erbin, comprenant la séquence d'acides aminés SEQ ID n° 2 ou n° 4.
II est entendu que sont également comprises les séquences homologues, définies comme i) les séquences similaires à au moins 70% de la séquence SEQ ID
n°2oun°4;ou ü) les séquences codées par une séquence d'acide nucléique homologue telle que définie précédemment c'est-à-dire une séquence d'acide nucléique hybridant avec la séquence SEQ ID n° 2 ou n° 4 ou sa séquence complémentaire, dans des conditions stringentes d'hybridation.
Là encore, le terme "similaires" se réfère à la ressemblance parfaite ou identité entre les acides aminés comparés mais aussi à la ressemblance non parfaite que l'on qualifie de similitude. Cette recherche de similitudes dans une séquence polypeptidique prend en compte les substitutions conservatives qui sont des substitutions d'acides aminés de même classe, telles que des substitutions d'acides aminés aux chaînes latérales non chargées (tels que l'asparagine, la glutamine, la serine, la thréonine, et la tyrosine), d'acides aminés aux chaînes latérales basiques (tels que la lysine, l'arginine, et l'histidine), d'acides aminés aux chaînes latérales acides (tels que l'acide aspaitique et l'acide glutamique) ; d'acides aminés aux chaînes latérales apolaires (tels que la glycine, l'alanine, la valine, la leucine, l'isoleucine, la proline, la phénylalanine, la méthionine, le tryptophane, et la cystéine).

Plus généralement, par « séquence d'acides aminés homologue », on entend donc toute séquence d'acides aminés qui diffère de la séquence SEQ
ID n° 2 ou n° 4 par substitution, délétion et/ou insertion d'un acide aminé ou d'un nombre réduit d'acides aminés, notamment par substitution d'acides aminés naturels par des acides aminés non naturels ou pseudoacides aminés à des positions telles que ces modifications ne portent pas significativement atteinte à
l'activité biologique de l'Erbin.
De préférence, une telle séquence d'acides aminés homologue est similaire à au moins 85 % de la séquence SEQ ID n° 2 ou n° 4, de préférence au moins 95 %.
L'homologie est généralement déterminée en utilisant un logiciel d'analyse de séquence (par exemple, Sequence Analysis Software Package of the Genetics Computer Group, University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison, WI 53705). Des séquences d'acides aminés similaires sont alignées pour obtenir le maximum de degré d'homologie (i.e.
identité ou similitude, comme défini plus haut). A cette fin, il peut être nécessaire d'introduire de manière artificielle des espaces (« gaps ») dans la séquence.
Une fois l'alignement optimal réalisé, le degré d'homologie est établi par enregistrement de toutes les positions pour lesquelles les acides aminés des deux séquences comparées sont identiques, par rapport au nombre total de positions.
"L'activité biologique de l'Erbin" se réfère à sa capacité de fixation sur la partie intracellulaire du récepteur ERBB2/HER-2 et à sa capacité de cibler le récepteur vers l'épithélium basolatéral, où il peut participer à la transduction de signaux.
L'invention a également pour objet les variants de l'Erbin, tels que les deux variants suivants - variant désigné "1302", comprenant la séquence SEQ ID n° 1 avec une délétion des nucléotides 3957 à 4163, conservant le cadre de lecture ouverte. La protéine codée par ce variant a pour séquence la séquence SEQ ID
n° 2 délétée des résidus 1212 à 1280. Le polypeptide isolé comprenant la séquence des acides aminés 1212 à 1280 de SEQ ID n° 2 fait également partie de l'invention.

- variant désigné "1419", comprenant la séquence SEQ ID n° 1 avec une insertion entre les nucléotides 3956 et 3957 de cette séquence du fragment SEQ ID n° 6, qui code pour le peptide SEQ ID n° 7.
L'ensemble des références à la séquence nucléotidique SEQ ID n°
1 ou à la séquence d'acides aminés SEQ ID n° 2 dans la présente description s'étend à ces variants.
L'invention a également pour objet le peptide de séquence SEQ ID
n° 7 et l'acide nucléique qui code pour ce peptide, tel que l'acide nucléique de séquence SEQ ID n° 6.
Le polypeptide de la présente invention peut être synthétisé par toutes les méthodes bien connues de l'homme du métier. Le polypeptide de l'invention peut par exemple être synthétisé par les techniques de la chimie de synthèse, telles que la synthèse de type Merrifield qui est avantageuse pour des raisons de pureté, de spécificité antigénique, d'absence de produits secondaires non désirés et pour sa facilité de production.
Une protéine recombinante peut également étre produite par un procédé, dans lequel un vecteur contenant un acide nucléique comprenant la séquence SEQ ID n° 1 ou n° 3 ou une séquence homologue est transféré dans une cellule hôte qui est mise en culture dans des conditions permettant l'expression du polypeptide correspondant.
La protéine produite peut ensuite être récupérée et purifiée.
Les procédés de purification utilisés sont connus de l'homme du métier. Le polypeptide recombinant obtenu peut être purifié à partir de lysats et extraits cellulaires, du surnageant du milieu de culture, par des méthodes utilisées individuellement ou en combinaison, telles que le fractionnement, les méthodes de chromatographie, les techniques d'immunoaffinité à l'aide d'anticorps mono- ou polyclonaux spécifiques, etc.
La séquence d'acide nucléique d'intérêt, codant pour l'Erbin, peut étre insérée dans un vecteur d'expression, dans lequel elle est liée de manière opérante à des éléments permettant la régulation de son expression, tels que notamment des promoteurs, activateurs et/ou terminateurs de transcription.

Les signaux contrôlant l'expression des séquences nucléotidiques (promoteurs, activateurs, séquences de terminaison...) sont choisis en fonction de l'hôte cellulaire utilisé. A cet effet, les séquences nucléotidiques selon l'invention peuvent être insérées dans des vecteurs à réplication autonome au sein de l'hôte choisi, ou des vecteurs intégratifs de l'hôte choisi. De tels vecteurs seront préparés selon les méthodes couramment utilisées par l'homme du métier, et les clones en résultant peuvent être introduits dans un hôte approprié par des méthodes standard, telles que par exemple l'électroporation ou la précipitation au phosphate de calcium.
Les vecteurs de clonage et/ou d'expression tels que décrits ci-dessus, contenant une séquence nucléotidique définie selon l'invention font également partie de la présente invention.
L'invention vise en outre les cellules hôtes transfectées, de manière transitoire ou stable, par ces vecteurs d'expression. Ces cellules peuvent étre obtenues par l'introduction dans des cellules hôtes, procaryotes ou eucaryotes, d'une séquence nucléotidique insérée dans un vecteur tel que défini ci-dessus, puis la mise en culture desdites cellules dans des conditions permettant la réplication et/ou l'expression de la séquence nucléotidique transfectée.
Des exemples de cellules hôtes incluent notamment des cellules de mammifères, telles que les cellules COS-7, 293, MDCK, des cellules d'insectes telles que les cellules SF9, des bactéries telles que E. coli et des souches de levures telles que L40 et Y90.
Les séquences nucléotidiques de l'invention peuvent étre d'origine artificielle ou non. II peut s'agir de séquences d'ADN ou d'ARN, obtenues par criblage de banques de séquences au moyen de sondes élaborées sur la base de la séquence SEQ ID n° 1, n° 3, n° 5 ou 6. De telles banques peuvent étre préparées par des techniques classiques de biologie moléculaire, connues de l'homme de l'art.
La séquence nucléotidique selon l'invention peuvent également être préparées par synthèse chimique, ou encore par des méthodes mixtes incluant la modification chimique ou enzymatique de séquences obtenues par criblage des banques.

La séquence nucléotidique de l'invention permet la réalisation de sondes ou amorces, hybridant spécifiquement avec la séquence SEQ ID n°
1, n°
3, n° 5 ou 6 selon l'invention, ou son brin complémentaire. Les conditions d'hybridation appropriées correspondent aux conditions de température et de force ionique usuellement utilisées par l'homme du métier, de préférence dans des conditions stringentes telles que définies précédemment. Ces sondes peuvent étre utilisées comme outil de diagnostic in vitro pour la détection, par des expériences d'hybridation, notamment d'hybridation "in situ", de transcrits spécifiques du polypeptide de l'invention dans des échantillons biologiques ou pour la mise en évidence de synthèses aberrantes ou d'anomalies génétiques résultant d'un polymorphisme, de mutations ou d'un mauvais épissage.
Les acides nucléiques de l'invention utiles comme sondes comportent au minimum 15 nucléotides, préférentiellement au moins 20 nucléotides, préférentiellement encore au moins 100 nucléotides.
Les acides nucléiques utiles comme amorces comportent au minimum 15 nucléotides, de préférence au moins 18 nucléotides, et préférentiellement moins de 40 nucléotides.
Plus précisément, la présente invention a pour objet un acide nucléique ayant au moins 15 nucléotides, qui hybride spécifiquement avec l'une des séquences d'acide nucléique SEQ ID n° 1 ou son complémentaire, dans des conditions stringentes d'hybridation.
On peut par exemple utiliser comme sonde les acides nucléiques constitués des séquences SEQ ID n° 8 ou SEQ ID n° 9.
On peut également utiliser comme sondes les fragments d'acide nucléique allant des nucléotides 1 à 750 de SEQ ID n° 1 et les fragments d'acide nucléique allant des nucléotides 4240 à 6412 de SEQ ID n° 1.
On peut par ailleurs utiliser comme amorce, pour une amplification (par exemple par PCR), les acides nucléiques constitués des séquences SEQ ID
n°10àSEQIDn°20.
Préférentiellement, les sondes ou amorces de l'invention sont marquées, préalablement à leur utilisation. Pour cela, plusieurs techniques sont à
la portée de l'homme du métier comme par exemple le marquage fluorescent, radioactif, chimioluminescent ou enzymatique.

Les méthodes de diagnostic in vitro dans lesquelles ces oligonucléotides sont mis en oeuvre pour la détection de mutations ou de remaniements génomiques, au niveau du gène de l'Erbin, sont incluses dans la présente invention.
L'homme du métier connaît bien les méthodes standard pour analyser l'ADN contenu dans un échantillon biologique et pour diagnostiquer un désordre génétique. De nombreuses stratégies d'analyse génotypique sont disponibles (Antonarakis et al., 1989 ; Cooper et al., 1991 ).
De préférence, on peut utiliser la méthode DGGE (Electrophorèse sur gel de gradient dénaturant), la méthode SSCP (Polymorphisme de conformation simple brin) ou la méthode DHPLC (Chromatographie liquide haute performance dénaturante ; Kuklin et al., 1997 ; Huber et al., 1995) pour détecter une anomalie dans le gène de l'Erbin. De telles méthodes sont de préférence suivies par un séquençage direct. Le procédé de RT-PCR peut étre avantageusement mis en oeuvre pour détecter des anomalies dans le transcript de l'Erbin, car il permet de visualiser les conséquences d'une mutation d'épissage provoquant la perte d'un ou plusieurs exons au niveau du transcrit, ou un épissage aberrant dû à l'activation d'un site cryptique. Ce procédé est également de préférence suivi d'un séquençage direct. Les procédés plus récemment développés utilisant des puces à ADN peuvent également étre mis en oeuvre pour détecter une anomalie dans le gène de l'Erbin (Bellis et al., 1997).
Le clonage du gène de l'Erbin ainsi que l'identification de diverses mutations responsables du développement de tumeurs permettent d'envisager des diagnostics directs. La présente invention a donc pour objet l'utilisation d'au moins un acide nucléique tel que défini précédemment, pour la détection d'une anomalie dans le gène de l'Erbin, défini comme comprenant une séquence d'acide nucléique SEQ ID n° 1, n° 3, n° 5 ou n° 6 dans son transcrit.
L'invention a, par suite, pour objet un procédé de diagnostic in vitro d'une tumeur ou d'une prédisposition à développer une tumeur, comprenant les étapes consistant à
- mettre en présence un échantillon biologique contenant de l'ADN
ou de l'ARN avec des oligonucléotides spécifiques permettant l'amplification de tout ou partie du gène de l'Erbin ou de son transcrit, défini comme comprenant une séquence SEQ ID n° 1, n° 3, n° 5 ou n° 6 ;
- amplifier ledit ADN ou ARN ;
- détecter les produits d'amplification ;
- comparer les produits d'amplification obtenus à ceux obtenus avec un échantillon contrôle, et détecter de cette manière une éventuelle anomalie dans ledit gène de l'Erbin ou dans son transcrit, indicatrice d'une prédisposition à
développer une tumeur.
L'échantillon biologique en question peut notamment être du sang, ou un fragment tissulaire prélevé chez un patient.
L'expression de l'Erbin étant retrouvée sur des cellules cancéreuses, les méthodes d'évaluation de l'expression de cette protéine à
partir de prélèvements de tissus suspects chez des patients sont également particulièrement avantageuses dans des tests diagnostiques, en anatomopathologie.
Ces méthodes peuvent viser à détecter l'ARNm codant pour l'Erbin ou la protéine Erbin elle-même.
Selon le premier mode de réalisation, l'invention concerne une méthode de diagnostic in vitro d'une tumeur ou d'une prédisposition à
développer une tumeur, comprenant les étapes consistant à
- mettre en présence un échantillon biologique contenant de l'ARNm obtenu à partir d'un prélèvement de cellules suspectes chez un patient, avec des oligonucléotides spécifiques permettant l'amplification de tout ou partie du transcrit du gène de l'Erbin, défini comme comprenant une séquence SEQ ID
n°1,n°3,n°5oun°6;
- amplifier ledit transcrit ;
- détecter et quantifier les produits d'amplification ;
une modification du taux de transcrit de l'Erbin par rapport au contrôle normal étant indicatrice d'une tumeur ou d'une prédisposition à
développer une tumeur.
Selon un deuxième mode de réalisation, l'invention concerne une méthode in vitro pour la détection ou la mesure du taux d'expression de l'Erbin dans un prélèvement biologique, comprenant la mise en contact d'au moins un anticorps dirigé contre l'Erbin avec ledit prélèvement biologique dans des conditions permettant la formation éventuelle de complexes immunologiques spécifiques entre l'Erbin et le ou lesdits anticorps et la détection des complexes immunologiques spécifiques éventuellement formés.
L'invention concerne plus particulièrement la mise en oeuvre de la méthode ci-dessus pour le diagnostic in vitro d'une tumeur ou d'une prédisposition à développer une tumeur sur un échantillon biologique obtenu à
partir d'un prélèvement de cellules suspectes chez un patient.
La présence de la protéine Erbin ou du gène transcrit du gène en quantités différentes de la normale peut étre correlée à un pronostic plus ou moins grave, en terme d'agressivité de la tumeur par exemple.
L'invention a également pour objet des anticorps dirigés contre le polypeptide Erbin tel que défini précédemment, ou contre les fragments spécifiques de celle-ci, tels que le fragment défini entre les résidus 502 à
1278 de la séquence SEQ ID n° 2, ou de manière avantageuse contre le fragment défini entre les résidus 914 et 1371 de la séquence SEQ ID n° 2.
II peut s'agir d'anticorps poly- ou monoclonaux ou de leurs fragments, d'anticorps chimériques, notamment humanisés ou immunoconjugués.
Les anticorps polyclonaux peuvent étre obtenus à partir du sérum d'un animal immunisé contre un polypeptide selon les modes opératoires usuels.
Selon un mode de réalisation de l'invention, on peut utiliser comme antigène un fragment peptidique approprié, tel que défini plus haut, pouvant étre couplé par l'intermédiaire d'un résidu réactif à une protéine ou un autre peptide.
Des lapins sont immunisés avec l'équivalent de 1 mg de l'antigène peptidique selon la procédure décrite par Benoit et al. (1982). A des intervalles de quatre semaines, les animaux sont traités par des injections de 200 Ng d'antigène et saignés 10 à 14 jours plus tard. Après la troisième injection, l'anti-sérum est examiné pour déterminer sa capacité à se lier au peptide antigène radiomarqué
à
l'iode, préparé par la méthode chloramine-T et est ensuite purifié par une chromatographie sur colonne échangeuse d'ion carboxyméthyl cellulose (CMC).
Les molécules d'anticorps sont ensuite recueillies dans les mammifères et isolées jusqu'à la concentration souhaitée par les méthodes bien connues de l'homme de l'art, par exemple, en utilisant DEAE Sephadex pour obtenir la fraction IgG.
Afin d'augmenter la spécificité du sérum polyclonal, les anticorps peuvent étre purifiés par une chromatographie d'immuno-affinité en utilisant des polypeptides immunisant en phase solide. L'anticorps est mis en contact avec le polypeptide immunisant en phase solide pendant une durée suffisante de façon à
faire immuno-réagir le polypeptide avec la molécule d'anticorps afin de former un complexe immunologique en phase solide.
Les anticorps monoclonaux peuvent étre obtenus selon la méthode classique de culture d'hybridomes décrite par Kdhler et Milstein (1975).
Les anticorps ou fragments d'anticorps de l'invention peuvent être par exemple des anticorps chimériques, des anticorps humanisés, des fragments Fab et F(ab')2. Ils peuvent également se présenter sous forme d'immunoconjugués ou d'anticorps marqués.
Les anticorps de l'invention, en particulier les anticorps monoclonaux, peuvent notamment étre utilisés pour l'analyse par immunohistochimie de l'Erbin sur des coupes de tissus spécifiques, par exemple par immunofluorescence, marquage à l'or, immunoperoxydase...
Les anticorps ainsi produits peuvent être avantageusement mis en oeuvre dans toute situation où l'expression de l'Erbin doit être observée.
L'invention a plus généralement pour objet l'utilisation d'au moins un anticorps ainsi produit pour la détection ou la purification d'un polypeptide tel que défini précédemment dans un échantillon biologique.
L'invention a également pour objet un kit pour la mise en oeuvre de cette méthode comprenant au moins un anticorps spécifique de l'Erbin, éventuellement fixé
sur un support ;
- des moyens de révélation de la formation de complexes antigènes/anticorps spécifiques entre l'Erbin et ledit anticorps et/ou des moyens de quantification de ces complexes.
L'invention a également pour objet un procédé d'obtention d'animal non humain transgénique, de préférence une souris, dans lequel on invalide le gène de l'Erbin. L'animal susceptible d'étre obtenu par ce procédé fait également partie de l'invention. Un tel animal, désigné "knock-out" pour ce gène, est un modèle utile pour étudier la susceptibilité à développer des tumeurs candidats pour supprimer des tumeurs, ou au contraire évaluer la cytotoxicité de certaines molécules.
Le polypeptide de l'invention ou l'acide nucléique codant pour ce polypeptide sont utiles à titre de médicament, notamment pour le traitement des tumeurs, dans lesquelles on observe par exemple l'expression d'une Erbin modifiée, et pour le traitement desquelles on cherche à restaurer l'activité
de l'Erbin sauvage. il peut s'agir de tout type de tumeur, dont les carcinomes mais aussi les tumeurs touchant le cerveau.
L'invention a également pour objet une composition pharmaceutique comprenant un polypeptide tel que défini précédemment ou un acide nucléique codant pour ledit polypeptide, en association avec un véhicule pharmaceutiquement acceptable.
Les modes d'administration, les posologies et les formes galéniques des compositions pharmaceutiques selon l'invention, contenant au moins un polypeptide, peuvent être déterminées de manière usuelle par l'homme du métier, notamment selon les critères généralement pris en compte pour l'établissement d'un traitement thérapeutique adapté à un patient, comme par exemple l'âge ou le poids corporel du patient, la gravité de son état général, la tolérance au traitement, et les effets secondaires constatés, etc.
De manière générale, une quantité thérapeutiquement ou prophylactiquement efficace variant d'environ 0,1 pg à environ 1 mg peut être administrée à des adultes humains.
L'invention a également pour objet une composition pharmaceutique comprenant un acide nucléique tel que défini précédemment, codant pour l'Erbin et un véhicule pharmaceutiquement acceptable, ladite composition étant destinée à être utilisée en thérapie génique. L'acide nucléique de préférence inséré dans un vecteur généralement viral (tels que les adénovirus et les rétrovirus) peut être administré sous forme nue, exempt de tout véhicule favorisant le transfert à la cellule cible, tels que des liposomes anioniques, des lipides cationiques, des microparticules, par exemple des microparticules d'or, des agents de précipitation, par exemple du phosphate de calcium, ou tout autre agent facilitant la transfection. Dans ce cas, le polynucléotide peut être simplement dilué dans une solution physiologiquement acceptable, telle qu'une solution stérile ou une solution stérile tampon, en présence ou en l'absence d'un véhicule.
De manière alternative, un acide nucléique de l'invention peut être associé à des agents qui facilitent la transfection. II peut être, entre autres, (i) associé à un agent chimique qui modifie la perméabilité cellulaire tel que la bupivaca~ine ; (ü) encapsulé dans des liposomes, éventuellement en présence de substances supplémentaires facilitant la transfection ; ou (iii) associé à des lipides cationiques ou des microparticules de silice, d'or ou de tungstène.
Lorsque les constructions d'acide nucléique de l'invention recouvrent des microparticules, celles-ci peuvent être injectées par voie intradermique ou intraépidermique par la technique du canon à gènes, "gene gun" (W0 94/24263).
La quantité à utiliser comme médicament dépend notamment de la construction d'acide nucléique elle-même, de l'individu auquel cet acide nucléique est administré, du mode d'administration et du type de formulation, et de la pathologie. De manière générale, une quantité thérapeutiquement ou prophylactiquement efficace variant d'environ 0,1 Ng à environ 1 mg, de préférence d'environ 1 Ng à environ 800 Ng et, de manière préférentielle d'environ pg à environ 250 pg, peut être administrée à des adultes humains.
Les constructions d'acides nucléiques de l'invention peuvent être administrées par toute voie d'administration conventionnelle telle que notamment par voie parentérale. Le choix de la voie d'administration dépend en particulier de la formulation choisie. Une administration ciblée au site des tumeurs visées peut être particulièrement avantageuse.
L'invention a donc enfin pour objet une méthode de traitement thérapeutique, dans laquelle on administre à un patient nécessitant un tel traitement, une quantité efficace d'un polypeptide Erbin tel que défini précédemment ou un acide nucléique codant pour ce polypeptide, dans le cadre d'une thérapie génique.

Le patient visé est généralement un être humain, mais l'application peut également être étendue à tout mammifère le cas échéant.
Un autre aspect de l'invention concerne les tumeurs cancéreuses dans lesquelles le récepteur ERBB2/HER-2 est impliqué, une surexpression de ce récepteur étant dans ces cas souvent observée. Parmi ces tumeurs, on peut citer plus particulièrement les carcinomes (cancers épithéliaux) touchant par exemple le foie, le rein, le sein ou le colon.
Une stratégie peut être alors d'inhiber l'interaction entre l'Erbin et le récepteur pour le délocaliser.
Une autre stratégie consiste à bloquer l'expression de l'Erbin native, par exemple au moyen d'oligonucléotides anti-sens empêchant la transcription de l'ARN nu du gène de l'Erbin.
L'invention a donc en outre pour objet une méthode de criblage de telles molécules inhibant la liaison entre l'Erbin et le récepteur ERBB2, cette méthode comprenant la mise en contact d'une molécule à tester avec (i) un premier partenaire de liaison qui est le récepteur ERBB2/HER-2 ou un fragment de celui-ci qui se fixe à l'Erbin, et (ü) un deuxième partenaire de liaison qui est l'Erbin ou un fragment de celle-ci qui se fixe au récepteur, le(s)dit(s) premier et/ou deuxième partenaires) de liaison étant marqués) de manière à être détectés, et l'évaluation de l'inhibition de l'interaction entre lesdits partenaires de liaison par la molécule à tester.
Pour mettre en oeuvre ces tests de liaison compétitifs, par exemple du type ELISA ou IRMA, on peut donc utiliser un fragment du récepteur ERBB2/HER-2 qui se fixe à l'Erbin. Ce fragment comprend au minimum les neuf derniers acides aminés C-terminaux du récepteur, à savoir la séquence EYLGLDVPV représentée par SEQ ID n° 21. D'autre part, on peut utiliser l'Erbin recombinante ou un fragment de celle-ci, qui se fixe au récepteur, à savoir un fragment qui comprend le domaine PDZ de l'Erbin.
L'un ou l'autre de ces partenaires de liaison est marqué de manière détectable, les moyens de marquage des protéines étant bien connus de l'homme du métier. II peut s'agir d'un agent de marquage fluorescent qui se lie chimiquement aux protéines sans dénaturation pour former un fluorochrome colorant qui est un indicateur immunofluorescent utile. L'agent de marquage peut aussi être une enzyme, telle que la peroxydase (HRP) ou la glucose oxydase.
Des éléments radioactifs peuvent être également utilisés comme agents de marquage.
De manière préférentielle, on utilise une protéine (de préférence, l'Erbin) fusionnée ou couplée à une protéine de type biotine, glutathion-S-transferase, poly-histidine....
L'un ou l'autre des partenaires de liaison (de préférence, le récepteur) peut être immobilisé de manière avantageuse sur une phase solide (membrane, billes, plastique...).
L'interaction entre les partenaires de liaison est donc ainsi mise en évidence par un test enzymatique, de fluorescence, ou par autoradiographie, ...
Les molécules présentant une activité inhibitrice sélectionnées par cette méthode peuvent ensuite être soumises à un test de précipitation du récepteur ERBB2/HER-2 produit dans des cellules de mammifères. Le récepteur est précipité à partir d'un lysat cellulaire grâce à la protéine recombinante comprenant le domaine PDZ de l'Erbin et révélé par Western Blot ou par toute autre méthode suffisamment sensible.
Les molécules dont l'activité inhibitrice de l'interaction Erbin-récepteur est confirmée sont retenues pour être testées sur des cellules épithéliales polarisées, afin d'évaluer leur capacité à induire une délocalisation du récepteur.
Alternativement, un test triple-hybride dans la levure peut être mis en oeuvre à cette fin (Zhang J. et al, 1996).
Les molécules ainsi criblées représentent d'excellents candidats dans une stratégie de thérapie anticancéreuse consistant à inhiber l'interaction entre Erbin et ERBB2 dans les cellules tumorales, afin de délocaliser le récepteur et le rendre inactif.
A l'inverse, il peut être avantageux, dans le cas où un individu exprime une protéine Erbin altérée ou un récepteur ERBB2 muté, tels que l'interaction Erbin-récepteur est diminuée par rapport à un contrôle normal, de rechercher des activateurs de cette interaction.
A cette fin, est proposée une méthode de criblage de molécules activant la liaison entre l'Erbin et le récepteur ERBB2, qui peut étre aisément mise en oeuvre sur le modèle de la méthode de criblage d'inhibiteurs décrite plus haut ou par la technique du triple hybride.
L'invention a également pour objet un procédé d'identification des mutants de l'Erbin qui augmentent ou diminuent l'interaction entre cette protéine et ERBB2, dans lequel on effectue une mutation sur l'Erbin et on évalue l'effet de cette mutation sur l'interaction de celle-ci avec le récepteur ERBB2.
La mutagénèse peut étre ciblée ou réalisée au hasard selon les techniques connues de l'homme du métier. L'évaluation de l'effet de la mutation peut étre réalisée par un test de précipitation de ERBB2 ou de double hybride tel que décrit dans les exemples, ou encore au moyen d'une banque d'expression.
Dans cette dernière technique, le domaine PDZ muté est exprimé
au moyen de phages ou de bactéries étalés sur des boîtes de culture. Après transfert des protéines produites sur membrane de type nitrocellulose, le peptide de ERBB2 marqué par radioactivité, biotinylation ou autre méthode est incubé
avec la membrane. Les mutants qui abolissent l'interaction et ne fixent plus le peptide sont prélevés et la séquence nucléotidique est analysée pour connaître la mutation introduite.
L'invention a également pour objet les mutants de l'Erbin, qui augmentent ou diminuent l'interaction entre le domaine PDZ de cette protéine et ERBB2.
La mutation de l'histidine (position 1347) en leucine (mutant HL) ou la mutation des résidus leucine (position 1291 ) en méthionine et de la phénylalanine (position 1293) en isoleucine (mutant MI) provoquent en particulier une augmentation de l'interaction entre le domaine PDZ d'ERBIN et ERBB2.
La mutation de l'histidine (position 1347) en tyrosine et de la glycine (position 1348) en acide aspaitique (mutant YD) ou la mutation de la thréonine (position 1316) en asparagine et de l'arginine (position 1317) en sérine (mutant NS) provoquent par contre une diminution de l'interaction entre le domaine PDZ
d'ERBIN et ERBB2.

L'invention a également pour objet un procédé d'identification de mutants du récepteur ERBB2, qui inhibent ou qui augmentent l'interaction avec l'Erbin, dans lequel on effectue une mutation du récepteur ERBB2 et on évalue l'effet de cette mutation sur l'interaction de ce récepteur avec l'Erbin. La séquence du récepteur ERBB2 humain est accessible par exemple sur la base de données EMBL (numéro d'accès X03363).
Un test double hybride dans la levure peut être particulièrement approprié à cette fin.
Des mutations ont ainsi été introduites dans les 9 derniers acides aminés carboxy-terminaux de ERBB2 (peptide EYLGLDVPV) (SEQ ID n° 21 ).
Le changement de l'un des acides aminés soulignés dans le peptide, par exemple, en alanine, inhibe l'interaction avec le domaine PDZ de ERBIN.
Les mutants de ERBB2 susceptibles d'étre identifiés par ce procédé
font également partie de l'invention.
Les auteurs de la présente invention ont plus particulièrement déterminé que les mutants de ERBB2 mutés sur les positions 5 (L) et 6 (D) de SEQ ID n° 21 sont incapables de lier l'Erbin, mais restent capables de lier d'autres domaines PDZ d'autres protéines, telles que PICK1.
Ces mutants sont en particulier utiles pour discriminer des molécules inhibitrices de l'interaction du domaine PDZ de l'Erbin dans des procédés de criblage.
Ces mutants de l'Erbin ou du récepteur ERBB2 peuvent être utilisés dans des tests de criblage d'autres composés inhibant ou activant l'interaction entre l'Erbin et le récepteur ERBB2. Ils peuvent également étre mis à profit dans le cadre d'une thérapie, par administration de ces formes mutées ou des acides nucléiques codant pour ces formes mutées.
En particulier, les formes activatrices de l'interaction Erbin-ERBB2 peuvent étre mises à profit comme médicament utile chez un individu qui exprime une protéine Erbin altérée ou un récepteur ERBB2 muté, et chez lequel l'interaction Erbin-récepteur est diminuée par rapport à un contrôle normal.
A l'inverse, les formes inhibitrices de l'interaction Erbin-ERBB2 peuvent être utiles comme médicament dans le cas par exemple d'une surexpression du récepteur.

WO 01/77323 PCT/FROl/01078 LEGENDE DES FIGURES
- La figure 1 représente un Western Blot montrant l'interaction spécifique du domaine PDZ de l'Erbin avec ERBB2 mais pas avec EGF-R. Les protéines liées transférées sur nitrocellulose ont été révélées par des anticorps anti-ERBB2 et anti-EGF-R. Un dixième du lysat a été déposé sur le gel (lysat total TL). La GST seule ou le domaine GST-X11 a PDZ (X11 ) ont été utilisés comme contrôle. Les polypeptides GST-Erbin utilisés sont : GST-Erbin (914-1371 ) piste 1, GST-Erbin (914-1240) piste 2 et domaine PDZ de la GST-Erbin piste 3.
- La fi u~ représente un transfert sur une membrane de nitrocellulose d'un gel SDS-PAGE dans lequel a été déposée une protéine de fusion formée des 9 derniers acides aminés des récepteurs apparentés à EGF-R
fusionnés à la protéine GST. Le domaine PDZ de la GST-Erbin soluble marqué
au 32P ou les protéines de fusion GST-LIN-7 ont été utilisés pour sonder la membrane. Après incubation, les membranes ont été lavées et les protéines liées ont été révélées par autoradiographie.
- La fi u~re 3 représente un Western Blot de lysats totaux de différents tissus murins et lignées cellulaires soumis à une électrophorèse sur SDS-PAGE, transfert sur nitrocellulose et mise en contact avec un anticorps anti-Erbin purifié. L'Erbin est une protéine de 180 kD indiquée par les flèches.
EXEMPLES

Clonage de l'Erbin, un gène codant pour une protéine à
domaine PDZ interagissant avec le récepteur ERBB2.
Les récepteurs ERBB reçoivent leurs ligands, venant du stroma, sur l'épithélium basolatéral où ils sont localisés (Klapper et al, 2000).
L'analyse de la séquence peptidique carboxy-terminale des récepteurs ERBB a révélé que le récepteur ERBB2 contenait un site de liaison à un domaine PDZ conservé entre les humains, les souris, les cailles et les chiens (Songyang et al, 1997).
Les auteurs de l'invention ont alors criblé une banque d'ADNc de rein de souris en utilisant le système à deux hybrides avec les 9 derniers acides aminés de ERBB2 fusionnés avec le domaine de liaison à l'ADN de GAL4 ("GAL-B D").
Procédure à deux hybrides Les neuf derniers acides aminés de ERBB2 ont été fusionnés à la sous-unité GAL4-BD en utilisant le vecteur pc97 qui porte LEU2. Une banque d'ADNc de rein embryonnaire de souris amorcée avec une séquence oligo-dT, clonée dans un vecteur pc86 qui porte le marqueur Trp1 comme marqueur de sélection a été criblée en utilisant l'appât GAL4-BD-ERBB2 et la souche de levure Y190 suivant le protocole au lithium-acétate. Approximativement, 106 transformants TRP+LE(J+ ont été sélectionnés sur des plaques d'agar contenant un milieu déficient en tryptophane, leucine et histidine lors du criblage primaire et contenant 10 mM de 3-aminotriazole (3AT). L'activité (3-galactosidase a été
testée en transférant les levures sur filtres lors du criblage secondaire.
Après récupération, l'ADN des clones sélectionnés a été
retransformé dans une levure Y190 contenant GAL4-BD-ERBB2 ou GAL4-BD
fusionné à des peptides contrôles.
De manière alternative, les 15 derniers acides aminés de ERBB2, de ERRB2 muté (mutant VA : mutant chez lequel le résidu valine de l'extrémité
C-terminale de ERBB2, résidu crucial pour l'interaction au domaine PDZ, a été
muté en alanine) et de ERBB4 ont été fusionnés à la protéine LexA en utilisant le vecteur pBTM116 qui porte Trp1. Le domaine PDZ de l'Erbin a été fusionné à la région GAL4-AD codé par le vecteur pACT2 qui porte Leu. Des interactions ont été réalisées dans la souche de levure de L40.
Procédures relatives aux protéines Les cellules ont été lavées deux fois avec une solution de tampon phosphate PBS froid et lysées dans un tampon de lyse (50 mM HEPES pH 7,5, % glycérol, 150 mM NaCI, 1 % Triton X-100, 1,5 mM MgCl2, 1 mM EGTA) complémenté avec 1 mM de PMSF (fluorure de phénylméthylsulfonyle), 10 Ng/ml d'aprotinine et 10 pg/ml de leupeptine. De l'orthovanadate de sodium à 200 NM
de concentration finale a été ajouté au tampon de lyse lorsque les cellules ont été
stimulées avec de l'EGF. Après centrifugation à 16,000 g pendant 20 minutes, la teneur en protéine du lysat était normalisée en utilisant le kit de dosage protéique de Bio-Rad. Pour l'immunoprécipitation, les lysats ont été incubés avec des anticorps une nuit à 4°C. De la protéine A-agarose a été ajoutée et les complexes immuns liés aux billes ont été récupérés après une heure, lavés trois fois dans du tampon HNTG (50 mM HEPES pH 7,5, 10 % glycérol, 150 mM NaCI, 0,1 Triton X-100), bouillis dans du tampon d'essai 1X et séparés par SDS-PAGE. Le transfert et l'immunoblot sur nitrocellulose en utilisant la méthode de chimioluminescence à l'aide des anticorps HRP anti-lapin ou HRP anti-souris ont été réalisés comme décrit par Borg et al, 1996. Pour les essais dits de "Far Western", la membrane a été incubée deux heures à température ambiante avec des protéines de fusion GST solubles marquées avec la protéine kinase A et du a2PYATP dilué dans du TBS-lait écrémé à 5 %, 1 mM DTT (106 cpm/ml). Après rinçage dans du tampon TBS- 0,1 % Triton X-100 et du tampon TBS, la GST liée était révélée par autoradiographie. La transfection cellulaire, la production de GST et les dosages de liaison du GST ont été réalisés comme décrit précédemment (Borg et al, 1996).
Les lysats fractionnés ont été préparés comme suit : les cellules ont été lysées dans du tampon hypotonique (10 mM Tris-CI [pH 7,4], 0,2 mM MgCl2, mM KCI) complémentées avec 1 mM de PMSF, 10 Ng/ml d'aprotonine et 10 Nglml de leupeptine. La lyse a été complétée par 20 passages dans un homogénéisateur à froid (piston B). Du saccharose a été ajouté à l'homogénat, dénommé fraction cytoplasmique. Le culot a été resuspendu dans une volume de tampon de lyse (tel que décrit ci-dessus) équivalent au volume de fraction cytoplasmique. Après 30 minutes sur la glace, les débris insolubles ont été
enlevés par centrifugation à 16 000 g pendant 30 minutes à 4°C. Le supernageant résultant a été dénommé fraction membranaire.

Résultats Les auteurs de l'invention ont ainsi isolé un clone d'ADNc partiel codant pour les 457 derniers acides aminés d'une nouvelle protéine désignée Erbin pour "ERBB2 Interacting protein". Le clone tiré de la banque de rein de GAL-4-BD-ERBB2 contient les résidus 914 à 1371 de l'Erbin murine et est appelé
Erbin (914-1371 ). Les protéines de fusion avec GST sont produites en utilisant les séquences peptidiques de l'Erbin (914-1371 ), Erbin (914-1240) et Erbin (1240-1371 ). La protéine de fusion GST-Erbin (1240-1371 ) sera désignée dans le texte comme le domaine PDZ de GST-Erbin.
La souche de levure Y190 cotransformée par des vecteurs codant pour l'appât fusionné à Lex A et la proie fusionnée à GAL4-BD a été ensemencée sur du milieu Trp-Leu-His contenant 10 mM de 3AT. Dans le tableau suivant, les signes + signifient croissance sur le milieu sélectif (-His) et activité ~-galactosidase positive.
pACT-Erbin 914-1371 1240-1371 LexA ~igal -His ~igal -His ERBB2 + + + +

ERBB2.VA

Aucune interaction n'est observée avec ERBB2 mutée sur le résidu valine C-terminal. Le domaine PDZ trouvé à l'extrémité C-terminale de l'Erbin est suffisant pour se lier à ERBB2.
Aucune liaison n'a été observée avec EPHB2, MUSK, PDGFRa et PDGFR~i. Les protéines GST-Erbin (914-1371 ) et GST-Erbin PDZ se lient à la chimère EGF-R/ERBB2 (HER 1/2), mais pas à EGF-R, dans des essais "pull-down" de précipitation de protéines (fi ure 1 ). Les domaines GST-DLG, LIN-2 et X11a ne se lient pas à HER 1/2. La liaison directe du domaine PDZ de l'Erbin aux extrémités carboxy-terminales des récepteurs ERBB a été évaluée par essai "Far Western". Le domaine PDZ de l'Erbin radiomarqué se lie au peptide ERBB2 mais pas au peptide EGF-R, ERBB3 et ERBB4 et ne se lie que faiblement au peptide LET-23 (fi ure 2). Le domaine PDZ de LIN-7 se lie seulement à LET-23.
Le domaine PDZ de l'Erbin présente une forte identité avec le domaine PDZ de DENSIN-180 (71 %) et une identité de 35 % avec les domaines PDZ de classe I
(Songyang et al, 1997 ; Fanning et al, 1998) trouvée dans les protéines LIN-7 et PSD-95 selon l'alignement des séquences. La substitution d'un motif His-Gly présent dans l'hélice aB de l'Erbin en un motif Tyr-Asp présent dans le domaine PDZ de classe III de NOS inhibe l'interaction avec ERBB2. Ces résultats montrent que le domaine PDZ de l'Erbin interagit spécifiquement et directement avec ERBB2.
Un ADNc de pleine longueur codant pour l'Erbin humaine a été
cloné par RT-PCR à partir de Daudi, une lignée cellulaire de lymphocytes B
humains, en utilisant le kit MARATHON, selon les recommandations du fabricant (Clontech). Un cadre de lecture ouverte précédé de codons stop dans les trois cadres code pour une protéine de 1371 acides aminés. L'Erbin contient 16 motifs LRR dans son extrémité amino-terminale (résidus 48-416) et un seul domaine PDZ C-terminal. Une large région intermédiaire de 863 acides aminés entre les domaines LRR et PDZ contient des extensions riches en proline qui peuvent représenter des sites de liaison ou des domaines SH3 et W1N.

Caractérisation de l'Erbin, membre d'une nouvelle famille PDZ
Une sonde de l'Erbin humaine spécifique a permis de détecter un transcrit de 7,2 kb dans la plupart des tissus humains et murins testés. Cette analyse a été réalisée par Northern Blot à l'aide de la technique "Multiple Tissues" de Clontech, à partir de 2 Ng d'ARNm poly(A)+ isolé à partir de divers tissus humains. Des anticorps spécifiques contre l'Erbin ont été préparés.
Préparation des anticorps L'anticorps monoclonal anti-Mc 9E10 (Oncogene Research Products, Cambridge, MA) a été utilisé pour l'immunoprécipitation et l'immunoblot. Des anticorps monoclonaux de lapins anti-ERBB2 et anti-EGF-R

ont été obtenus par injection des peptides à des lapins. L'anticorps monoclonal 408 anti-EGF-R a été utilisé pour l'immunoprécipitation. L'anticorps monoclonal anti-EGF-R (clone LA22) de Upstate Biotechnology (UBI) a été utilisé pour l'immunofluorescence. Les anticorps polyclonaux anti-SHC et monoclonal 4610 mAb (anti-PY) ont été obtenus chez UBI. Des IgG de chèvre anti-lapin et anti-souris couplées à une peroxydase de raifort ont été achetées auprès du Laboratoire Jackson et Dako, respectivement. Un anticorps polyclonal de lapin anti-Erbin a été produit en injectant une protéine de fusion GST-Erbin (914-1371 ).
L'anticorps anti-Erbin a été en outre purifié par affinité avec une Erbin marquée par l'histidine (914-1371 ) lié à des billes d'agarose et de nickel (Qiagen).
Ces anticorps spécifiques contre l'Erbin ont détecté une protéine de 180 kD sous la forme d'un doublet dans le cerveau, le foie, le rein, la rate, les intestins et les muscles squelettiques ainsi que dans les lignées cellulaires épithéliales Caco-2 et MDCK (figure 3). L'expression de l'ADNc de l'Erbin de pleine longueur dans les cellules COS a permis la production d'une protéine de taille similaire à la protéine détectée par l'anticorps en question dans les tissus et les extraits cellulaires.
Culture cellulaire Les cellules COS-1 et MDCK sont cultivées dans du milieu DMEM
(milieu de Eagle modifié par Dulbecco) contenant 100 Uiml de pénicilline et Ngiml de sulfate de streptomycine, complémenté avec du sérum de veau fcetal à
10 % (FCS). Les cellules Caco-2 ont été maintenues dans du milieu DMEM
complémenté avec 20 % de FCS et 1 % d'acides aminés non essentiels. Toutes les transfections cellulaires ont été réalisées en utilisant un réactif Fugene selon les recommandations du fabricant (Boehringer Mannheim).
L'homologie structurelle entre Erbin, DENSIN-180, VARTUL, KAA0147 et F26D11.11 ont conduit les auteurs de l'invention à considérer ces protéines comme des membres d'une nouvelle famille PDZ désignée LAP pour "LRR and PDZ domain proteins".

EXEMPLE3:
Interaction de l'Erbin avec un récepteur activé HER1/2 L'interaction in vivo entre l'Erbin et le récepteur ERBB2 a été testée par co-immunoprécipitation dans des cellules COS.
1 ) HER 1/2 a été coexprimé de manière transitoire avec les polypeptides Erbin, SAP97 ou PSD-95 fusionnés à l'épitoge myc dans des cellules COS-1. Après une lyse, HER 1/2 été immunoprécipité avec l'anticorps anti-EGF-R (clone 408) et les protéines liées ont été révélées par des anticorps anti-myc et anti-ERBB2, respectivement. Seule l'Erbin était associée à HER
1/2.
2) HER 1/2 et EGF-R ont été coexprimés transitoirement avec l'Erbin dans les cellules COS-1. Après traitement à l'EGF, les cellules ont été
lysées et une fraction aliquote d'un extrait protéique a été déposé sur SDS-PAGE, soumis à une électrophorèse et transféré sur une membrane de nitrocellulose. Une quantité égale d'Erbin et de récepteur a été trouvée dans les lysats. Les récepteurs ont été immunoprécipités avec un anticorps anti-EGF-R, les protéines liées ont été soumises à un Western Blot et révélées avec des anticorps anti-Erbin et anti-récepteur. Seul HER 1/2 interagissait avec l'Erbin.
Comme contrôle, la protéine p52 SHC a été imunoprécipitée de manière croissante avec HER 1/2 et EGF-R après stimulation par EGF.
3) HER 1/2 et EGF-R ont été exprimés transitoirement dans les cellules COS-1. Après 5 minutes de stimulation avec du milieu ne contenant pas de facteurs de croissance ou contenant 200 ng/ml d'EGF, les cellules ont été
lysées, et des essais GST "pull down" de précipitation de protéines ont été
réalisés en utilisant les domaines GST-SHC PTB ou GST-ERBIN PDZ fixés sur des billes d'agarose. Les protéines précipitées ont été révélées par une analyse en Western Blot en utilisant un anticorps anti-PY (panneaux supérieurs). Après déshybridation des anticorps, les membranes ont été révélées avec des anticorps anti-ERBB2 et anti-EGF-R respectivement (anti-RTK). Tandis que seuls les récepteurs phosphorylés se liaient au domaine SHC PTB, HER 1/2 non phosphorylé interagissait avec le domaine de PDZ de l'Erbin.
4) HER 1/2 contenant une mutation de la valine carboxy-terminale (mutant VA) ou un HER 1/2 "kinase-dead", c'est-à-dire dépourvu d'activité

catalytique (mutant KA) ont été exprimés dans des cellules COS-1 et l'interaction avec les protéines de fusion avec GST a été testée comme décrit précédemment.
La mutation VA dans HER 1/2 n'a pas affectée la phosphorylation sur résidus tyrosine au récepteur tandis que le mutant KA n'était pas phosphorylé sur tyrosines. Comme attendu, le mutant HER 1/2 KA ne s'est pas lié au domaine SHC PTB (figure 3d). D'un autre côté, le domaine PDZ de l'Erbin précipite de manière efficace HER 1/2 KA mais par HER 1/2 VA. Pris dans leur ensemble, ces résultats montrent que le domaine PDZ de l'Erbin interagit seulement avec le récepteur HER 1/2 non activé.
Les auteurs de l'invention se sont donc demandé si les protéines se comportaient de manière identique in vivo, en coexprimant de l'Erbin marquée par myc avec HER 1/2 dans les cellules COS. II a été trouvé que le pool de HER
1/2 associé avec l'Erbin n'était pas phosphorylé au site de la tyrosine après stimulation d'EGF. En revanche, les protéines SHC interagissaient avec le récepteur phosphorylé. L'Erbin est un substrat pour la kinase ERBB2 et aucune phosphorylation de l'Erbin n'a été trouvée lors de l'expression du récepteur HER
1/2 KA. Ces données montrent que l'Erbin interagit avec HER 1/2 non phosphorylé sur la tyrosine et identifient l'Erbin comme un substrat de la kinase ERBB2. Comme un site de liaison SHC PTB a été trouvé à l'extrémité C-terminale de ERBB2, deux résidus en amont du site de liaison au domaine PDZ
(Borg et al, 1978), le recrutement des protéines SHC à ce site, après stimulation par EGF, pourrait empécher la fixation du domaine PDZ de l'Erbin. La phosphorylation de la tyrosine en elle-méme n'est pas suffisante pour altérer l'interaction du domaine HER 1/2 PDZ puisque le peptide phosphorylé au niveau de la tyrosine inhibe cette interaction aussi efficacement qu'un peptide non phosphorylé. L'interaction du domaine PDZ est donc susceptible d'étre inhibé
par compétition avec des modules protéiques de la machinerie de la signalisation.

La localisation basolatérale de ERBB2 dans les cellules épithéliales est dépendante du site d'interaction avec l'Erbin Afin d'étudier plus finement la localisation sub-cellulaire de ERBB2 et de l'Erbin, les auteurs de l'invention ont utilisé la lignée Caco-2, lignée cellulaire de carcinome de colon humain, exprimant les deux protéines à la fois.
Le fractionnement des cellules Caco-2 a montré que l'Erbin était principalement présente dans la fraction membranaire tandis que les protéines SHC étaient prédominantes dans la fraction cytolosique. Une immunocoloration a alors été réalisée sur les cellules Caco-2 polarisées avec un anticorps anti-Erbin purifié. Pour cela, les cellules Caco-2 ont été ensemencées sur des lamelles de verre, fixées, perméabilisées et colorées avec les anticorps primaires indiqués, puis soumises à une coloration avec les anticorps secondaires conjugués à
différents fluorochromes selon le protocole ci-après.
Immunolocalisation ef marquage des sun'aces cellulaires Pour les procédures d'immunocoloration, les cellules MDCK ont été
cultivées sur les lamelles de verre pendant trois jours après confluence et étaient marquées comme décrit dans Le Bivic et al, 1989 avec un anticorps monoclonal contre EGF-R et un anticorps polyclonal contre gp114 (marqueur apical des cellules MDCK) (Le Bivic et al, 1990). Les cellules Caco-2 ont été cultivées sur des lamelles de verre pendant 10 jours après confluence pour assurer une différenciation complète puis ont été soumises au même traitement que les cellules MDCK. L'anticorps contre Ag525 (marqueur basolatéral des cellules intestinales humaines) a été décrit précédemment (Le Bivic et al, 1988). Des sections congelées (0,5 à 1 pm) de colon humain ont été obtenues comme décrit précédemment (Le Bivic et al, 1988).
Pour la biotinylation des surfaces cellulaires, les cellules cultivées sur des filtres pendant trois jours après confluence ont été marquées une nuit avec du "35S-promix ready vue" de Amersham (18,5 MBq/ml) sur la face basolatérale. Les cellules ont été marquées avec Sulfo-NHS-LC-biotin (Pierce) pendant une chasse de 90 minutes dans du milieu normal soit sur la face apicale soit sur la face basolatérale et EGF-R ou les chimères ont été
immunoprécipitées avec de la streptavidine comme décrit dans Le Bivic et al, 1989. Les échantillons ont été analysés par SDS-PAGE et visualisés par fluorographie. Les autoradiogrammes ont été quantifiés en utilisant Intelligent Quantifier de Biolmage (Ann Arbor, MI).
L'Erbin a été trouvée sur la face basolatérale de la membrane plasmique de Caco-2 puisque la co-localisation a été obtenue par co-coloration avec l'anticorps monoclonal 525, marqueur spécifique de l'épithélium basolatéral.
En outre, ERBB2 était également basolatéral et colocalisait avec l'Erbin. La coloration de section de colon humain avec l'anticorps anti-Erbin a confirmé la localisation basolatérale de la protéine dans ses tissus.
Les auteurs de l'invention ont ensuite produit des cellules MDCK
exprimant de manière stable EGF-R, HER 1/2 et HER 1/2.VA. MDCK exprimait de faibles niveaux de récepteurs EGF-R et ERBB2 endogènes contrairement aux populations cellulaires transfectées avec les construits, qui permettaient une expression de EGF-R et HER 1/2 (sauvage et mutant).
Des expériences d'immunofluorescence ont été menées avec LA22, qui est un anticorps monoclonal anti-EGF-R humain spécifique. EGF-R et HER
1/2 étaient localisés sur la face basolatérale tandis que la mutation de HER

(HER 1/2.VA) empêchait la localisation basolatérale de HER 1/2. La biotinylation de la surface cellulaire a été réalisée sur les faces apicales et basolatérales des transfectants MDCK et les quantités de récepteurs ont été quantifiées par autoradiographie. Tandis que EGF-R et HER 1/2 étaient localisés à 82 % du côté
basolatéral, le mutant HER 1/2.VA était seulement à 52 % basolatéral. Ainsi, l'élimination du site d'interaction de l'Erbin a conduit à une dépolarisation de ERBB2 dans les cellules épithéliales.
EXEMPLE 5 : Production d'une souris "knock-out"
La stratégie consiste à éliminer le premier exon du gène Erbin codant pour les 63 premiers acides aminés de l'Erbin et de le remplacer par une cassette codant pour le gène de résistance de la néomycine. La disparition du codon d'initiation de la traduction et des 62 acides aminés suivants provoque une perte d'expression de la protéine de l'Erbin fonctionnelle.

Le vecteur de recombinaison homologue de type pPNT3 substitue des séquences du gène Erbin (exon 1 ) par une cassette de gène de résistance pour la néomycine. II comprend - le gène de résistance à la néomycine (néon) muni de deux promoteurs reconnus dans les cellules eucaryotes et procaryotes.
- La cassette PGK-TK est constituée du promoteur minimal de la phosphoglycérate kinase (PGK) et de séquences codantes de la thymidine kinase du virus Herpes simplex. Le promoteur de la PGK est normalement activé
dans les cellules ES et permet d'effectuer une sélection négative au cours de la sélection des clones recombinants. Cette cassette est placée en 5' des régions d'homologie de l'Erbin. Le vecteur de recombinaison est construit à partir de 6 kb de séquence génomique de l'Erbin : 1.5 kb en amont du 1 er exon (bras 5') et 4.5 kb (bras 3') en aval du 1e~ exon. Le vecteur de recombinaison final présente les séquences d'ADN suivantes en enfilade : 5' Cassette PGK-TK---- bras 5' erbin----gène néon----bras 3' erbin 3'. Après linéarisation du vecteur de recombinaison, celui-ci est transféré par électroporation dans des cellules ES 129 (cellules souches embryonnaires) et les cellules transfectées sont sélectionnées par addition de généticine dans le milieu de culture, en suivant le protocole décrit dans " Gene targeting : a practical approach ", Editions A.L. Joyner 1993 IRL
Press. Afin de mettre en évidence les clones dont le génome comporte l'événement de recombinaison homologue, une contre-sélection au ganciclovir est utilisée. Les clones sont vérifiés selon le protocole proposé dans " Gene targeting : a practical approach ", Editions A.L. Joyner 1993 IRL Press, par PCR
et Southern blot, et Fiore et al., Int.J.Dev.Biol. 41 : 639-642 (1997).
Les clones sélectionnés sont injectés dans des blastocystes de souris C57BL/6 prélevés à 3,5 jours de gestation. Les blastocystes sont réimplantés dans des souris SWISS pseudo-gestantes de 2,5 jours. La mise en évidence des chimères se fait par la couleur de leur pelage (noir et marron pour les chimères). Les mâles chimériques sont croisés avec des femelles C57BU6 et les queues de nouveau-nés agouti sont prélevés et leur génotype analysé par southern blot pour détecter l'allèle recombiné. Le croisement de souris hétérozygotes entre elles permet d'obtenir les mutants homozygotes pour la mutation (génération F2) (vérification par southern blot).

EXEMPLE 6 : Mutagénèse du domaine PDZ de l'Erbin Des mutations ponctuelles effectuées dans le domaine PDZ de l'Erbin ont des effets inverses sur l'interaction avec ERBB2/HER2.
Pour montrer l'effet de ces mutations, on peut notamment mettre en oeuvre les deux techniques suivantes : précipitation de ERBB2 par des protéines de fusion recombinantes et système à double hybride chez la levure.
Des protéines de fusion recombinantes GST-PDZ ERBIN sauvages ou mutées fixées à une matrice solide sont incubées avec un lysat cellulaire contenant ERBB2/HER2. Après deux heures, les billes sont lavées et les complexes résolus par SDS-PAGE. Après transfert, ERBB2 est révélé par un anticorps spécifique (western blot).
Pour le système à double hybride chez la levure, l'appât est constitué de LEXA-BD fusionné au peptide ERBB2. La proie est constituée de GAL4-AD fusionné au domaine PDZ de ERBIN sauvage ou muté.
Ces deux tests ont donné des résultats identiques : les mutants PDZ YD (de l'histidine 1347 en tyrosine et de la glycine (position 1348) en acide aspaitique) et NS (de la thréonine 1316 en asparagine et de l'arginine (position 1317) en sérine) présentent moins d'affinité pour le récepteur ERBB2 et les mutants HL (de l'histidine (position 1347) en leucine) et MI (de la leucine 1291 en méthionine et de la phénylalanine (position 1293) en isoleucine) présentent plus d'affinité pour ERBB2.

RÉFÉRENCES BIBLIOGRAPHIQUES
- Antonarakis S.E., Diagnosis of genetic disorders at the DNA level.
N Engl J. Med. 320:153-163 (1989).
- Bellis et al., medecine/sciences, 13:1317-24, (1997).
- Benoit et al., PNAS USA, 79, 917-921 (1982).
- Borg et al (1996), The Phosphotyrosine Interaction Domains of X11 and FE65 bind to distinct sites on the YENPTY motif of amyloid precursor protein. Molecular and Cellular 8iology 16: 6229-6241 - Borg et al, (1998), Function of PTB domains. Curr. Top. Microbiol.
Immunol. 228: 23-38 - Borg et al, (1998), Identification of an evolutionarily conserved heterotrimeric protein complex involved in protein targeting. J.8iol.Chem.
273(48): 31633-31636 - Cooper et al., Diagnosis of genetic disease using recombinant DNA, 3'd Édition, Hum Genet., 87:519-560 (1991 ).
- Fanning, A.S. & Anderson, J.M. PDZ domains and the formation of protein networks at the plasma membrane. Curr. Top. Microbiol. Immunol. 228:
209-233 (1998).
- Huber, C.G. et al., Rapid and accurate sizing of DNA fragments by ion-pair chromatography on alkylated nonporous poly(styrenedivinylbenzene) particles. Anal. Chem. 67, 578-585 (1995).
Klapper et al (2000), Biochemical and clinicat implications of the ErbB/HER signaling network of growth factor receptors. Adv Cancer Res 77: 25-79.
- K~hler et Milstein, Nature, 256, 495-497, (1975).
- Kuklin, A. et al., Detection of single-nucleotide polymorphisms with the WAVET"" DNA fragment analysis system. Genetic Testing 1, 201-206 (1997/98).

- Le Bivic et al (1988) Characterization of a glycoprotein expressed on the basolateral membrane of human intestinal epithelial cells and cultured colonic cell lines. Eur J Cell Biol 46: 113-120.
- Le Bivic et al (1989) Vectorial targeting of apical and basolateral plasma membrane proteins in a human adenocarcinoma epithelial cell line. Proc Natl Acad Sci U S A 86: 9313-9317.
- Le Bivic et al (1990) Vectorial targeting of an endogenous apical membrane sialoglycoprotein and uvomorulin in MDCK cells. J Cell Biol 110:
1533-1539.
- Ross et al, (1999), HER-2ineu (c-erb-B2) gene and protein in breast cancer, Am. J. Clin. Pathol. 992:S53-67 - Sambrook et al., Molecular cloning, a laboratory manual Spring Harbor Laboratory Press, 9.54-62 (1989) - Songyang et al (1997) Recognition of unique carboxyl-terminal motifs by distinct PDZ domains. Science 275: 73-77.
- Zhang et al, (1996) A yeast three-hybrid-method to clone ternary protein complex components, Analytical Biochemistry, 242, 68-72.

LISTE DE SEQUENCES
<110> INSERM
<120> Gène codant pour l'Erbin, protéine qui interagit avec le récepteur ERBB2/HER-2, et utilisations diagnostiques et thérapeutiques <130> BFF 00/0117 <140>
<141>
<160> 23 <170> PatentIn Ver. 2.1 <210> 1 <211> 6412 <212> ADN
<213> Homo sapiens <220>
<221> CDS
<222> (324)..(4436) <400> 1 aaagatcttt tttttttttt tttctttttt tttcggcgga gatcctcgtt ggggctggga 60 aactcctgca aaactcgaga ccaggaagcc agcccgcacc ccaaccccca ccaaagccac 120 ctactcttct tctgtgggag gccagtccac atccgctctc acccgagaga gatattcagc 180 tggatccaaa gtgactgatg aagggaagga aatcatgtca agcgaagcct tgaaaaagct 240 gccctgagac ggtgtcccgc cgaaagaatg ttggctcaat taagaaacat cagggagata 300 aattcaaccc agtgtgtcta aaa atg act aca aaa cga agt ttg ttt gtg cgg 353 Met Thr Thr Lys Arg Ser Leu Phe Val Arg ttg gta cca tgt cgc tgt cta cga ggg gaa gag gag act gtc act act 401 Leu Val Pro Cys Arg Cys Leu Arg Gly Glu Glu Glu Thr Val Thr Thr ctt gat tat tct cat tgc agc tta gaa caa gtt ccg aaa gag att ttt 449 Leu Asp Tyr Ser His Cys Ser Leu Glu Gln Val Pro Lys Glu Ile Phe act ttt gaa aaa acc ttg gag gaa ctc tat tta gat gct aat cag att 497 Thr Phe Glu Lys Thr Leu Glu Glu Leu Tyr Leu Asp Ala Asn Gln Ile gaa gag ctt cca aag caa ctt ttt aac tgt cag tct tta cac aag ctg 545 Glu Glu Leu Pro Lys Gln Leu Phe Asn Cys Gln Ser Leu His Lys Leu agt ttg cca gac aat gat tta aca acg tta cca gca tcc att gca aac 593 Ser Leu Pro Asp Asn Asp Leu Thr Thr Leu Pro Ala Ser Ile Ala Asn ctt att aat ctc agg gaa ctg gat gtc agc aag aat gga ata cag gag 641 Leu Ile Asn Leu Arg Glu Leu Asp Val Ser Lys Asn Gly Ile Gln Glu ttt cca gaa aat ata aaa aat tgt aaa gtt ttg aca att gtg gag gcc 689 Phe Pro Glu Asn Ile Lys Asn Cys Lys Val Leu Thr Ile Val Glu Ala agt gta aac cct att tcc aag ctc cct gat gga ttt tct cag ctg tta 737 Ser Val Asn Pro Ile Ser Lys Leu Pro Asp Gly Phe Ser Gln Leu Leu aac cta acc cag ttg tat ctg aat gat gct ttt ctt gag ttc ttg cca 785 Asn Leu Thr Gln Leu Tyr Leu Asn Asp Ala Phe Leu Glu Phe Leu Pro gca aat ttt ggc aga tta act aaa ctc caa ata tta gag ctt aga gaa 833 Ala Asn Phe Gly Arg Leu Thr Lys Leu Gln Ile Leu Glu Leu Arg Glu aac cag tta aaa atg ttg cct aaa act atg aat aga ctg acc cag ctg 881 Asn Gln Leu Lys Met Leu Pro Lys Thr Met Asn Arg Leu Thr Gln Leu gaa aga ttg gat ttg gga agt aac gaa ttc acg gaa gtg cct gaa gta 929 Glu Arg Leu Asp Leu Gly Ser Asn Glu Phe Thr Glu Val Pro Glu Val ctt gag caa cta agt gga ttg aaa gag ttt tgg atg gat gct aat aga 977 Leu Glu Gln Leu Ser Gly Leu Lys Glu Phe Trp Met Asp Ala Asn Arg ctg act ttt att cca ggg ttt att ggt agt ttg aaa cag ctc aca tat ï025 Leu Thr Phe Ile Pro Gly Phe Ile Gly Ser Leu Lys Gln Leu Thr Tyr ttg gat gtt tct aaa aat aat att gaa atg gtt gaa gaa gga att tca 1073 Leu Asp Val Ser Lys Asn Asn Ile Glu Met Val Glu Glu Gly Ile Ser aca tgt gaa aac ctt caa gac ctc cta tta tca agc aat tca ctt cag 1121 Thr Cys Glu Asn Leu Gln Asp Leu Leu Leu Ser Ser Asn Ser Leu Gln cag ctt cct gag act att ggt tcg ttg aag aat ata aca acg ctt aaa 1169 Gln Leu Pro Glu Thr Ile Gly Ser Leu Lys Asn Ile Thr Thr Leu Lys ata gat gaa aac cag tta atg tat ctg cca gac tct ata gga ggg tta 1217 Ile Asp Glu Asn Gln Leu Met Tyr Leu Pro Asp Ser Ile Gly Gly Leu ata tca gta gaa gaa ctg gat tgt agt ttc aat gag gtt gaa gct ttg 1265 Ile Ser Val Glu Glu Leu Asp Cys Ser Phe Asn Glu Val Glu Ala Leu cct tca tct att ggg cag ctt act aac tta aga act ttt gct gct gat 1313 Pro Ser Ser Ile Gly Gln Leu Thr Asn Leu Arg Thr Phe Ala Ala Asp cat aat tac tta cag cag ttg ccc cca gag att gga agc tgg aaa aat 1361 His Asn Tyr Leu Gln Gln Leu Pro Pro Glu Ile Gly Ser Trp Lys Asn ata act gtg ctg ttt ctc cat tcc aat aaa ctt gag aca ctt cca gag 1409 Ile Thr Val Leu Phe Leu His Ser Asn Lys Leu Glu Thr Leu Pro Glu gaa atg ggt gat atg caa aaa tta aaa gtc att aat tta agt gat aat 1457 Glu Met Gly Asp Met Gln Lys Leu Lys Val Ile Asn Leu Ser Asp Asn aga tta aag aat tta ccc ttt agc ttt aca aag cta cag caa ttg aca 1505 Arg Leu Lys Asn Leu Pro Phe Ser Phe Thr Lys Leu Gln Gln Leu Thr gct atg tgg ctc tca gat aat cag tcc aaa ccc ctg ata cct ctt caa 1553 Ala Met Trp Leu Ser Asp Asn Gln Ser Lys Pro Leu Ile Pro Leu Gln aaa gaa act gat tca gag acc cag aaa atg gtg ctt acc aac tac atg 1601 Lys Glu Thr Asp Ser Glu Thr Gln Lys Met Val Leu Thr Asn Tyr Met ttc cct caa cag cca agg act gag gat gtt atg ttt ata tca gat aat 1649 Phe Pro Gln Gln Pro Arg Thr Glu Asp Val Met Phe Ile Ser Asp Asn gaa agt ttt aac cct tca ttg tgg gag gaa cag agg aaa cag cgg gct 1697 Glu Ser Phe Asn Pro Ser Leu Trp Glu Glu Gln Arg Lys Gln Arg Ala caa gtt gca ttt gaa tgt gat gaa gac aaa gat gaa agg gag gca cct 1745 Gln Val Ala Phe Glu Cys Asp Glu Asp Lys Asp Glu Arg Glu Ala Pro ccc agg gag gga aat tta aaa aga tat cca aca cca tac cca gat gag 1793 Pro Arg Glu Gly Asn Leu Lys Arg Tyr Pro Thr Pro Tyr Pro Asp Glu ctt aag aat atg gtc aaa act gtt caa acc att gta cat aga tta aaa 1841 Leu Lys Asn Met Val Lys Thr Val Gln Thr Ile Val His Arg Leu Lys gat gaa gag acc aat gaa gac tca gga aga gat ttg aaa cca cat gaa 1889 Asp Glu Glu Thr Asn Glu Asp Ser Gly Arg Asp Leu Lys Pro His Glu gat caa caa gat ata aat aaa gat gtg ggt gtg aag acc tca gaa agt 1937 Asp Gln Gln Asp Ile Asn Lys Asp Val Gly Val Lys Thr Ser Glu Ser act act aca gta aaa agc aaa gtt gat gaa aga gaa aaa tat atg ata 1985 Thr Thr Thr Val Lys Ser Lys Val Asp Glu Arg Glu Lys Tyr Met Ile gga aac tct gta cag aag atc agt gaa cct gaa gct gag att agt cct 2033 Gly Asn Ser Val Gln Lys Ile Ser Glu Pro Glu Ala Glu Ile Ser Pro ggg agt tta cca gtg act gca aat atg aaa gcc tct gag aac ttg aag 2081 Gly Ser Leu Pro Val Thr Ala Asn Met Lys Ala Ser Glu Asn Leu Lys cat att gtt aac cat gat gat gtt ttt gag gaa tct gaa gaa ctt tct 2129 His Ile Val Asn His Asp Asp Val Phe Glu Glu Ser Glu Glu Leu Ser tct gat gaa gag atg aaa atg gcg gag atg cga cca cca tta att gaa 2177 Ser Asp Glu Glu Met Lys Met Ala Glu Met Arg Pro Pro Leu Ile Glu acc tct att aac cag cca aaa gtc gta gca ctt agt aat aac aaa aaa 2225 Thr Ser Ile Asn Gln Pro Lys Val Val Ala Leu Ser Asn Asn Lys Lys gat gat aca aag gaa aca gat tct tta tca gat gaa gtt aca cac aat 2273 Asp Asp Thr Lys Glu Thr Asp Ser Leu Ser Asp Glu Val Thr His Asn agc aat cag aat aac agc aat tgt tct tct cca tct cgg atg tct gat 2321 Ser Asn Gln Asn Asn Ser Asn Cys Ser Ser Pro Ser Arg Met Ser Asp tca gtt tct ctt aat act gat agt agt caa gac acc tca ctc tgc tct 2369 Ser Val Ser Leu Asn Thr Asp Ser Ser Gln Asp Thr Ser Leu Cys Ser cca gtg aaa caa act cat att gat att aat tcc aaa atc agg caa gaa 2417 Pro Val Lys Gln Thr His Ile Asp Ile Asn Ser Lys Ile Arg Gln Glu gat gaa aat ttt aac agc ctt tta caa aat gga gat att tta aac agt 2465 Asp Glu Asn Phe Asn Ser Leu Leu Gln Asn Gly Asp Ile Leu Asn Ser tca aca gag gaa aag ttc aaa gct cat gat aaa aaa gat ttt aac tta 2513 Ser Thr Glu Glu Lys Phe Lys Ala His Asp Lys Lys Asp Phe Asn Leu cct gaa tat gat ttg aat gtt gaa gag cga tta gtt cta att gag aaa 2561 Pro Glu Tyr Asp Leu Asn Val Glu Glu Arg Leu Val Leu Ile Glu Lys agt gtt gac tca aca gcc aca gct gat gac act cac aaa tta gat cat 2609 Ser Val Asp Ser Thr Ala Thr Ala Asp Asp Thr His Lys Leu Asp His atc aat atg aat ctt aat aaa ctt ata act aat gat aca ttt caa cca 2657 Ile Asn Met Asn Leu Asn Lys Leu Ile Thr Asn Asp Thr Phe Gln Pro gag atc atg gaa aga tca aaa aca cag gat att gtg ctt gga aca agc 2705 Glu Ile Met Glu Arg Ser Lys Thr Gln Asp Ile Val Leu Gly Thr Ser ttt tta agc att aat tct aaa gag gaa act gag cac ttg gaa aat gga 2753 Phe Leu Ser Ile Asn Ser Lys Glu Glu Thr Glu His Leu Glu Asn Gly aac aag tat cct aat ttg gaa tcc gta aat aag gta aat gga cat tct 2801 Asn Lys Tyr Pro Asn Leu Glu Ser Val Asn Lys Val Asn Gly His Ser gag gaa act tcc cag tct cct aat agg act gaa cca cat gac agt gat 2849 Glu Glu Thr Ser Gln Ser Pro Asn Arg Thr Glu Pro His Asp Ser Asp tgt tct gtt gac tta ggt att tcc aaa agc act gaa gat ctc tcc cct 2897 Cys Ser Val Asp Leu Gly Ile Ser Lys Ser Thr Glu Asp Leu Ser Pro cag aaa agt ggt cca gtt gga tct gtt gtg aaa tct cat agc ata act 2945 Gln Lys Ser Gly Pro Val Gly Ser Val Val Lys Ser His Ser Ile Thr aat atg gag att gga ggg cta aaa atc tat gat att ctt agt gat aat 2993 Asn Met Glu Ile Gly Gly Leu Lys Ile Tyr Asp Ile Leu Ser Asp Asn gga cct cag cag cca agt aca acc gtt aaa atc aca tct gct gtt gat 3041 Gly Pro Gln Gln Pro Ser Thr Thr Val Lys Ile Thr Ser Ala Val Asp gga aaa aat ata gtc agg agc aag tct gcc aca ctg ttg tat gat caa 3089 Gly Lys Asn Ile Val Arg Ser Lys Ser Ala Thr Leu Leu Tyr Asp Gln cca ttg cag gta ttt act ggt tct tcc tca tct tct gat tta ata tca 3137 Pro Leu Gln Val Phe Thr Gly Ser Ser Ser Ser Ser Asp Leu Ile Ser gga aca aag gca att ttc aag ttt gat tca aat cat aat ccc gaa gag 3185 Gly Thr Lys Ala Ile Phe Lys Phe Asp Ser Asn His Asn Pro Glu Glu cca aat ata ata aga ggc ccc aca agt ggc cca caa tct gca cct caa 3233 Pro Asn Ile Ile Arg Gly Pro Thr Ser Gly Pro Gln Ser Ala Pro Gln ata tat ggt cct cca cag tat aat atc caa tac agt agc agt gct gca 3281 Ile Tyr Gly Pro Pro Gln Tyr Asn Ile Gln Tyr Ser Ser Ser Ala Ala gtc aaa gac act ttg tgg cac tcc aaa caa aat ccc caa ata gac cat 3329 Val Lys Asp Thr Leu Trp His Ser Lys Gln Asn Pro Gln Ile Asp His gcc agt ttt cct cct cag ctc ctt cct aga tca gag agc aca gaa aat 3377 Ala Ser Phe Pro Pro Gln Leu Leu Pro Arg Ser Glu Ser Thr Glu Asn caa agt tat gct aaa cat tct gcc aat atg aat ttc tct aat cat aac 3425 Gln Ser Tyr Ala Lys His Ser Ala Asn Met Asn Phe Ser Asn His Asn aat gtt cga gct aat act gca tac cat tta cat cag aga ctt ggc cca 3473 Asn Val Arg Ala Asn Thr Ala Tyr His Leu His Gln Arg Leu Gly Pro gca aga cat ggg gaa atg tgg gcc atc tca cca aac gac cga ctt att 3521 Ala Arg His Gly Glu Met Trp Ala Ile Ser Pro Asn Asp Arg Leu Ile cct gca gta act cga agt aca atc cag cga caa agt agt gtg tcc tcc 3569 Pro Ala Val Thr Arg Ser Thr Ile Gln Arg Gln Ser Ser Val Ser Ser aca gcc tct gta aat ctt ggt gat cca ggc tct aca agg cgg gct cag 3617 Thr Ala Ser Val Asn Leu Gly Asp Pro Gly Ser Thr Arg Arg Ala Gln att cct gaa gga gat tat tta tca tac aga gag ttc cac tca gcg gga 3665 Ile Pro Glu Gly Asp Tyr Leu Ser Tyr Arg Glu Phe His Ser Ala Gly aga act cct cca atg atg cca gga tca cag aga ccc ctt tct gca cga 3713 Arg Thr Pro Pro Met Met Pro Gly Ser Gln Arg Pro Leu Ser Ala Arg aca tac agc ata gat ggt cca aat gca tca aga cct cag agt gct cga 3761 Thr Tyr Ser Ile Asp Gly Pro Asn Ala Ser Arg Pro Gln Ser Ala Arg ccc tct att aat gaa ata cca gag aga act atg tca gtt agt gat ttc 3809 Pro Ser Ile Asn Glu Ile Pro Glu Arg Thr Met Ser Val Ser Asp Phe aat tat tca cgg act agt cct tca aaa aga cca aat gca agg gtt ggt 3857 Asn Tyr Ser Arg Thr Ser Pro Ser Lys Arg Pro Asn Ala Arg Val Gly tct gag cat tct tta tta gat cct cca gga aaa agt aaa gtt cct cgt 3905 Ser Glu His Ser Leu Leu Asp Pro Pro Gly Lys Ser Lys Val Pro Arg gac tgg aga gaa caa gta ctt cga cat att gaa gcc aaa aag tta gaa 3953 Asp Trp Arg Glu Gln Val Leu Arg His Ile Glu Ala Lys Lys Leu Glu 1195 1200 1205 . 1210 aag atg cct ttg agt aat gga cag atg ggc cag cct ctc agg cct cag 4001 Lys Met Pro Leu Ser Asn Gly Gln Met Gly Gln Pro Leu Arg Pro Gln gca aat tat agt caa ata cat cac ccc cct cag gca tct gtg gca agg 4049 Ala Asn Tyr Ser Gln Ile His His Pro Pro Gln Ala Ser Val Ala Arg cat ccc tct aga gaa caa cta att gat tac ttg atg ctg aaa gtg gcc 4097 His Pro Ser Arg Glu Gln Leu Ile Asp Tyr Leu Met Leu Lys Val Ala cac cag cct cca tat aca cag ccc cat tgt tct cct aga caa ggc cat 4145 His Gln Pro Pro Tyr Thr Gln Pro His Cys Ser Pro Arg Gln Gly His gaa ctg gca aaa caa gag att cga gtg agg gtt gaa aag gat cca gaa 4193 Glu Leu Ala Lys Gln Glu Ile Arg Val Arg Val Glu Lys Asp Pro Glu cttggattt agcata tcaggtggt gtcggg ggtagaggaaac ccattc 4241 LeuGlyPhe SerIle SerGlyGly ValGly GlyArgGlyAsn ProPhe agacctgat gatgat ggtatattt gtaaca agggtacaacct gaagga 4289 ArgProAsp AspAsp GlyIlePhe ValThr ArgValGlnPro GluGly ccagcatca aaatta ctgcagcca ggtgat aaaattattcag gctaat 4337 ProAlaSer LysLeu LeuGlnPro GlyAsp LysIleIleGln AlaAsn ggctacagt tttata aatattgaa catgga caagcagtgtcc ttgcta 4385 GlyTyrSer PheIle AsnIleGlu HisGly GlnAlaValSer LeuLeu aaaactttc cagaat acagttgaa ctcatc attgtacgagaa gtttcc 4433 LysThrPhe GlnAsn ThrValGlu LeuIle IleValArgGlu ValSer tcataagcactgt ttattggaag 4486 ggacaaaaaa agcggggaag acagcaagat Ser atacttacag gggaaattaa tattttgact atttttatat ataaagaaga actcaaaaaa 4546 ttatgttcaa atttgtacat taatgaaata atggataaag gagactgttg aattcatacc 4606 atataaaact tgttaggttt ttaaacatag caatcaaggc tacaaaaaca aacctgtgtt 4666 gtttttgtat agattgtagg tttatttttg gatttcatat acatgactga actgtgtgca 4726 aggcaatagt tagccttgat tttagcccag agacagatgg cagagctatc tctctcatag 4786 cttttatgcc cttattttta ttcaactggt attaatgttt ttctcctgaa actacttttt 4846 ttgatgtggg caagagattt gaagtgttgg cttttgctat gtgcatattg aattgaagag 4906 tgagtaggtg aaggtggtgc tggtgggttc actttccaag gccagactaa aacagttatt 4966 ttctataaaa atctggaagc aaagaatggg gatggggaga gctacgtggt agtatgtttt 5026 tattaggaga ataatgcaat aaaatatgta atgtcttttt tataaagcaa aaaagacaat 5086 aattgcattt atgagctcgg caggatctgt tcttgtcata gccattgact atacatttgc 5146 tactggtgat tcagttttta attttttagt cacaggaaat ttttaactct actgtagatg 5206 catgtccatg cattttctgt gttatggaaa tccactgatt tttttttttt tttcaaatgg 5266 tggtacttgc aatctgtttt ataattagtg ctccatttaa atctaattta taatttttat 5326 tttaagcagc aaatgaaaca aaaatggcca gttttaagat tgtgttgcct gtaacacaaa 5386 atgttacgaa ggtttaggaa agcctctttg atttttgttt ggccttgcat tggcccttgg 5446 taaagtaaaa ggaaacagta cacttggagc taggaaacca aagcaagctt tgtgaaactg 5506 gcacagtgat agagaattgc tgtggagagt tatagagcaa agggatgggt ccttgaggcc 5566 tgccagtgtg taaaggtgtt caaataaagg gctgtttcta caggtaacat taaatgtgaa 5626 ctcaacactt ccagagtctt taaagggttt ctatgtgtat cagtgtaata gtgttttacc 5686 accaactgcc tttctttgtt cctagttact gtaacaaata tttgatgata gaggtttatt 5746 aattttgttt atccagacca ttaattttat ttgtttttgt ctatgtaatc aaataaaatt 5806 tgagtaacat gtaatggtaa ggattaatgc atggttattt ggaccagaaa aaagtgccat 5866 agaagaccaa taactgttta gttgaggcta gtctggaacc tttcattaga gcaatatttg 5926 gttattgcac ttcattttta tttactaaga aatgcaattt gggaattttt aatctgttat 5986 gctttgttta tcaaccttga ttttaattaa gacttttata agactagctt aaaacaccaa 6046 ccaacattat ttttgcaaaa gtgagttgga ctcactttcc attcttgcta gtcagagtaa 6106 gtaggcagca cttttaaaaa tatgtgaact caaatattgc acttctttca agatgttatc 6166 aattggttat tgtactgtat agttttaata attttgattg aaacccttta acaactcttt 6226 gtaaatttta actcatttta gttgattttc agtactattt acataggaat tgatttttat 6286 ggatatagta gaagaaatgt gctgtatttt gataaaattc acttattgta tgtgtgttgt 6346 aatctaaaaa aaaaaagaat gacaaacagc ttctttaaga caaaaaaaaa aaaaaaaaaa 6406 aaatat 6412 <210>

<211> 371 <212>
PRT

<213> sapiens Homo <400>

Met ThrLys ArgSerLeu PheValArg LeuValPro CysArg Cys Thr Leu GlyGlu GluGluThr ValThrThr LeuAspTyr SerHis Cys Arg Ser GluGln ValProLys GluIlePhe ThrPheGlu LysThr Leu Leu Glu LeuTyr LeuAspAla AsnGlnIle GluGluLeu ProLys Gln Glu Leu AsnCys GlnSerLeu HisLysLeu SerLeuPro AspAsn Asp Phe Leu ThrLeu ProAlaSer IleAlaAsn LeuIleAsn LeuArg Glu Thr Leu ValSer LysAsnGly IleGlnGlu PheProGlu AsnIle Lys Asp Asn LysVal LeuThrIle ValGluAla SerValAsn ProIle Ser Cys Lys Leu Pro Asp Gly Phe Ser Gln Leu Leu Asn Leu Thr Gln Leu Tyr Leu Asn Asp Ala Phe Leu Glu Phe Leu Pro Ala Asn Phe Gly Arg Leu Thr Lys Leu Gln Ile Leu Glu Leu Arg Glu Asn Gln Leu Lys Met Leu Pro Lys Thr Met Asn Arg Leu Thr Gln Leu Glu Arg Leu Asp Leu Gly Ser Asn Glu Phe Thr Glu Val Pro Glu Val Leu Glu Gln Leu Ser Gly Leu Lys Glu Phe Trp Met Asp Ala Asn Arg Leu Thr Phe Ile Pro Gly Phe Ile Gly Ser Leu Lys Gln Leu Thr Tyr Leu Asp Val Ser Lys Asn Asn Ile Glu Met Val Glu Glu Gly Ile Ser Thr Cys Glu Asn Leu Gln Asp Leu Leu Leu Ser Ser Asn Ser Leu Gln Gln Leu Pro Glu Thr Ile Gly Ser Leu Lys Asn Ile Thr Thr Leu Lys Ile Asp Glu Asn Gln Leu Met Tyr Leu Pro Asp Ser Ile Gly Gly Leu Ile Ser Val Glu Glu Leu Asp Cys Ser Phe Asn Glu Val Glu Ala Leu Pro Ser Ser Ile Gly Gln Leu Thr Asn Leu Arg Thr Phe Ala Ala Asp His Asn Tyr Leu Gln Gln Leu Pro Pro Glu Ile Gly Ser Trp Lys Asn Ile Thr Val Leu Phe Leu His Ser Asn Lys Leu Glu Thr Leu Pro Glu Glu Met Gly Asp Met Gln Lys Leu Lys Val Ile Asn Leu Ser Asp Asn Arg Leu Lys Asn Leu Pro Phe Ser Phe Thr Lys Leu Gln Gln Leu Thr Ala Met Trp Leu Ser Asp Asn Gln Ser Lys Pro Leu Ile Pro Leu Gln Lys Glu Thr Asp Ser Glu Thr Gln Lys Met Val Leu Thr Asn Tyr Met Phe Pro Gln Gln Pro Arg Thr Glu Asp Val Met Phe Ile Ser Asp Asn Glu Ser Phe Asn Pro Ser Leu Trp Glu Glu Gln Arg Lys Gln Arg Ala Gln Val Ala Phe Glu Cys Asp Glu Asp Lys Asp Glu Arg Glu Ala Pro Pro Arg Glu Gly Asn Leu Lys Arg Tyr Pro Thr Pro Tyr Pro Asp Glu Leu Lys Asn Met Val Lys Thr Val Gln Thr Ile Val His Arg Leu Lys Asp Glu Glu Thr Asn Glu Asp Ser Gly Arg Asp Leu Lys Pro His Glu Asp Gln Gln Asp Ile Asn Lys Asp Val Gly Val Lys Thr Ser Glu Ser Thr Thr Thr Val Lys Ser Lys Val Asp Glu Arg Glu Lys Tyr Met Ile Gly Asn Ser Val Gln Lys Ile Ser Glu Pro Glu Ala Glu Ile Ser Pro Gly Ser Leu Pro Val Thr Ala Asn Met Lys Ala Ser Glu Asn Leu Lys His Ile Val Asn His Asp Asp Val Phe Glu Glu Ser Glu Glu Leu Ser Ser Asp Glu Glu Met Lys Met Ala Glu Met Arg Pro Pro Leu Ile Glu Thr Ser Ile Asn Gln Pro Lys Val Val Ala Leu Ser Asn Asn Lys Lys Asp Asp Thr Lys Glu Thr Asp Ser Leu Ser Asp Glu Val Thr His Asn Ser Asn Gln Asn Asn Ser Asn Cys Ser Ser Pro Ser Arg Met Ser Asp Ser Val Ser Leu Asn Thr Asp Ser Ser Gln Asp Thr Ser Leu Cys Ser Pro Val Lys Gln Thr His Ile Asp Ile Asn Ser Lys Ile Arg Gln Glu Asp Glu Asn Phe Asn Ser Leu Leu Gln Asn Gly Asp Ile Leu Asn Ser Ser Thr Glu Glu Lys Phe Lys Ala His Asp Lys Lys Asp Phe Asn Leu Pro Glu Tyr Asp Leu Asn Val Glu Glu Arg Leu Val Leu Ile Glu Lys Ser Val Asp Ser Thr Ala Thr Ala Asp Asp Thr His Lys Leu Asp His Ile Asn Met Asn Leu Asn Lys Leu Ile Thr Asn Asp Thr Phe Gln Pro Glu Ile Met Glu Arg Ser Lys Thr Gln Asp Ile Val Leu Gly Thr Ser Phe Leu Ser Ile Asn Ser Lys Glu Glu Thr Glu His Leu Glu Asn Gly Asn Lys Tyr Pro Asn Leu Glu Ser Val Asn Lys Val Asn Gly His Ser Glu Glu Thr Ser Gln Ser Pro Asn Arg Thr Glu Pro His Asp Ser Asp Cys Ser Val Asp Leu Gly Ile Ser Lys Ser Thr Glu Asp Leu Ser Pro Gln Lys Ser Gly Pro Val Gly Ser Val Val Lys Ser His Ser Ile Thr Asn Met Glu Ile Gly Gly Leu Lys Ile Tyr Asp Ile Leu Ser Asp Asn Gly Pro Gln Gln Pro Ser Thr Thr Val Lys Ile Thr Ser Ala Val Asp Gly Lys Asn Ile Val Arg Ser Lys Ser Ala Thr Leu Leu Tyr Asp Gln Pro Leu Gln Val Phe Thr Gly Ser Ser Ser Ser Ser Asp Leu Ile Ser Gly Thr Lys Ala Ile Phe Lys Phe Asp Ser Asn His Asn Pro Glu Glu Pro Asn Ile Ile Arg Gly Pro Thr Ser Gly Pro Gln Ser Ala Pro Gln Ile Tyr Gly Pro Pro Gln Tyr Asn Ile Gln Tyr Ser Ser Ser Ala Ala Val Lys Asp Thr Leu Trp His Ser Lys Gln Asn Pro Gln Ile Asp His Ala Ser Phe Pro Pro Gln Leu Leu Pro Arg Ser Glu Ser Thr Glu Asn Gln Ser Tyr Ala Lys His Ser Ala Asn Met Asn Phe Ser Asn His Asn Asn Val Arg Ala Asn Thr Ala Tyr His Leu His Gln Arg Leu Gly Pro Ala Arg His Gly Glu Met Trp Ala Ile Ser Pro Asn Asp Arg Leu Ile Pro Ala Val Thr Arg Ser Thr Ile Gln Arg Gln Ser Ser Val Ser Ser Thr Ala Ser Val Asn Leu Gly Asp Pro Gly Ser Thr Arg Arg Ala Gln Ile Pro Glu Gly Asp Tyr Leu Ser Tyr Arg Glu Phe His Ser Ala Gly Arg Thr Pro Pro Met Met Pro Gly Ser Gln Arg Pro Leu Ser Ala Arg Thr Tyr Ser Ile Asp Gly Pro Asn Ala Ser Arg Pro G1n Ser Ala Arg Pro Ser Ile Asn Glu Ile Pro Glu Arg Thr Met Ser Val Ser Asp Phe Asn Tyr Ser Arg Thr Ser Pro Ser Lys Arg Pro Asn Ala Arg Val Gly Ser Glu His Ser Leu Leu Asp Pro Pro Gly Lys Ser Lys Val Pro Arg Asp Trp Arg Glu Gln Val Leu Arg His Ile Glu Ala Lys Lys Leu Glu Lys Met Pro Leu Ser Asn Gly Gln Met Gly Gln Pro Leu Arg Pro Gln Ala Asn Tyr Ser Gln Ile His His Pro Pro Gln Ala Ser Val Ala Arg His Pro Ser Arg Glu Gln Leu Ile Asp Tyr Leu Met Leu Lys Val Ala His Gln Pro Pro Tyr Thr Gln Pro His Cys Ser Pro Arg Gln Gly His Glu Leu Ala Lys Gln Glu Ile Arg Val Arg Val Glu Lys Asp Pro Glu Leu Gly Phe Ser Ile Ser Gly Gly Val Gly Gly Arg Gly Asn Pro Phe Arg Pro Asp Asp Asp Gly Ile Phe Val Thr Arg Val Gln Pro Glu Gly Pro Ala Ser Lys Leu Leu Gln Pro Gly Asp Lys Ile Ile Gln Ala Asn Gly Tyr Ser Phe Ile Asn Ile Glu His Gly Gln Ala Val Ser Leu Leu Lys Thr Phe Gln Asn Thr Val Glu Leu Ile Ile Val Arg Glu Val Ser Ser <210> 3 <211> 1647 <212> ADN

<213> Mus musculus <220>
<221> CDS
<222> (1)..(1485) <400> 3 gcg tcc ggc aag tct gcc aca ctg ctg tat gat cag ccc ctg cag gtg 48 Ala Ser Gly Lys Ser Ala Thr Leu Leu Tyr Asp Gln Pro Leu Gln Val ttc act gct gcc tcc tca tct tct gag tta ctg tca ggt aca aag gca 96 Phe Thr Ala Ala Ser Ser Ser Ser Glu Leu Leu Ser Gly Thr Lys Ala gtt ttc aag ttt gat tca aat cac aac cct gaa gag cca gat ata ata 144 Val Phe Lys Phe Asp Ser Asn His Asn Pro Glu Glu Pro Asp Ile Ile aga gct gcc aca gta tct ggc cca cag tct aca cct cac ctg tat ggt 192 Arg Ala Ala Thr Val Ser Gly Pro Gln Ser Thr Pro His Leu Tyr Gly ccc cca caa tat aat gtc cag tac agt ggc agt gct aca gtg aaa gac 240 Pro Pro Gln Tyr Asn Val Gln Tyr Ser Gly Ser Ala Thr Val Lys Asp acc ttg tgg cac cct aaa cag aat cca caa ata gat cct gtc agt ttt 288 Thr Leu Trp His Pro Lys Gln Asn Pro Gln Ile Asp Pro Val Ser Phe cct cct cag cgc ctt cca aga tct gag agt gca gaa aat cac agt tat 336 Pro Pro Gln Arg Leu Pro Arg Ser Glu Ser Ala Glu Asn His Ser Tyr 100 105 ï10 gca aag cat tct gcc aac atg aat ttc tct aac cat aac aat gtt aga 384 Ala Lys His Ser Ala Asn Met Asn Phe Ser Asn His Asn Asn Val Arg gcc aat act gga tac cac tta caa cag aga ctt gcc cca gcc agg cat 432 Ala Asn Thr Gly Tyr His Leu Gln Gln Arg Leu Ala Pro Ala Arg His gga gaa atg tgg gct atc tcc ccg aat gac cga cta gtg cca gca gtc 480 Gly Glu Met Trp Ala Ile Ser Pro Asn Asp Arg Leu Val Pro Ala Val act cgg act act att cag aga cag agt agc gtg tct tca acg gct tct 528 Thr Arg Thr Thr Ile Gln Arg Gln Ser Ser Val Ser Ser Thr Ala Ser gta aat ctc ggt gac ccc aca agg cgt act gaa gga gat tac tta tcg 576 Val Asn Leu Gly Asp Pro Thr Arg Arg Thr Glu Gly Asp Tyr Leu Ser tac aga gag tta cat tca atg gga aga act cca gtc atg tca gga tca 624 Tyr Arg Glu Leu His Ser Met Gly Arg Thr Pro Val Met Ser Gly Ser cag aga cct ctt tct gca cga gcg tac agc atc gat ggc cca aat aca 672 Gln Arg Pro Leu Ser Ala Arg Ala Tyr Ser Ile Asp Gly Pro Asn Thr tcc agg cct cag agt gcc cgt ccc tct att aat gaa ata cca gag aga 720 Ser Arg Pro Gln Ser Ala Arg Pro Ser Ile Asn Glu Ile Pro Glu Arg act atg tca gtt agt gat ttc aat tac tca cgg act agt cct tca aaa 768 Thr Met Ser Val Ser Asp Phe Asn Tyr Ser Arg Thr Ser Pro Ser Lys aga cca aat aca agg gtc ggg tct gaa cat tct ctg tta gat cct cca 816 Arg Pro Asn Thr Arg Val Gly Ser Glu His Ser Leu Leu Asp Pro Pro gga aaa agc aag gtt cct cat gac tgg cgg gaa caa gta cta cga cac 864 Gly Lys Ser Lys Val Pro His Asp Trp Arg Glu Gln Val Leu Arg His att gag gcc aaa aag tta gaa aag cat ccg cag aca tcc agt cca gga 912 Ile Glu Ala Lys Lys Leu Glu Lys His Pro Gln Thr Ser Ser Pro Gly gag tgt tgc caa gat gat aga ttc atg tca gaa gag cag aac cac cca 960 Glu Cys Cys Gln Asp Asp Arg Phe Met Ser Glu Glu Gln Asn His Pro tca ggt gca ctt agt cac aga ggt ctt cca gac agc ctg atg aaa atg 1008 Ser Gly Ala Leu Ser His Arg Gly Leu Pro Asp Ser Leu Met Lys Met cct ttg agt aat gga caa atg ggc cag cct ctc agg cct cag gca cat 1056 Pro Leu Ser Asn Gly Gln Met Gly Gln Pro Leu Arg Pro Gln Ala His tat agt caa acc cat cac ccc cct cag gca tct gtg gca agg cat ccc 1104 Tyr Ser Gln Thr His His Pro Pro Gln Ala Ser Val Ala Arg His Pro tct aga gaa caa cta att gat tat ttg atg ctg aaa gtg gcc cac cag 1152 Ser Arg Glu Gln Leu Ile Asp Tyr Leu Met Leu Lys Val Ala His Gln cct cca tat aca cat ccc cat tgt tct cct aga caa ggc cat gaa ctg 1200 Pro Pro Tyr Thr His Pro His Cys Ser Pro Arg Gln Gly His Glu Leu gca aag caa gag att cga gta aga gta gaa aag gat cca gaa ctt gga 1248 Ala Lys Gln Glu Ile Arg Val Arg Val Glu Lys Asp Pro Glu Leu Gly ttt agc ata tca gga ggt gtc ggc ggc aga gga aac cct ttc aga cct 1296 Phe Ser Ile Ser Gly Gly Val Gly Gly Arg Gly Asn Pro Phe Arg Pro gat gat gat ggt ata ttt gta aca agg gta caa cct gaa gga cca gca 1344 Asp Asp Asp Gly Ile Phe Val Thr Arg Val Gln Pro Glu Gly Pro Ala tca aaa tta cta cag cca gga gat aaa att att cag gct aat ggc tac 1392 Ser Lys Leu Leu Gln Pro Gly Asp Lys Ile Ile Gln Ala Asn Gly Tyr agt ttt atc aac att gaa cat ggg caa gcg gtg tcc ttg tta aaa act 1440 Ser Phe Ile Asn Ile Glu His Gly Gln Ala Val Ser Leu Leu Lys Thr ttc cat aat gca gta gat ctc atc att gta cga gaa gtt tct tca 1485 Phe His Asn Ala Val Asp Leu Ile Ile Val Arg Glu Val Ser Ser taagcactat agacaaaaac aatgggggaa gatagcaaga tttatggaag acacttgcaa 1545 gggaaatgac tattttgctt atttttatat ataaagaaga actcaactgt tggtttgaaa 1605 cttgtacatt actgaaataa tggaccttgt ggttagaggg aa 1647 <210> 4 <211> 495 <212> PRT
<213> Mus musculus <400> 4 Ala Ser Gly Lys Ser Ala Thr Leu Leu Tyr Asp Gln Pro Leu Gln Val Phe Thr Ala Ala Ser Ser Ser Ser Glu Leu Leu Ser Gly Thr Lys Ala Val Phe Lys Phe Asp Ser Asn His Asn Pro Glu Glu Pro Asp Ile Ile Arg Ala Ala Thr Val Ser Giy Pro Gl~ Ser Thr Pro His Leu Tyr Gly Pro Pro Gln Tyr Asn Val Gln Tyr Ser Gly Ser Ala Thr Val Lys Asp Thr Leu Trp His Pro Lys Gln Asn Pro Gln Ile Asp Pro Val Ser Phe Pro Pro Gln Arg Leu Pro Arg Ser Glu Ser Ala Glu Asn His Ser Tyr Ala Lys His Ser Ala Asn Met Asn Phe Ser Asn His Asn Asn Val Arg Ala Asn Thr Gly Tyr His Leu Gln Gln Arg Leu Ala Pro Ala Arg His Gly Glu Met Trp Ala Ile Ser Pro Asn Asp Arg Leu Val Pro Ala Val Thr Arg Thr Thr Ile Gln Arg Gln Ser Ser Val Ser Ser Thr Ala Ser Val Asn Leu Gly Asp Pro Thr Arg Arg Thr Glu Gly Asp Tyr Leu Ser Tyr Arg Glu Leu His Ser Met Gly Arg Thr Pro Val Met Ser Gly Ser Gln Arg Pro Leu Ser Ala Arg Ala Tyr Ser Ile Asp Gly Pro Asn Thr Ser Arg Pro Gln Ser Ala Arg Pro Ser Ile Asn Glu Ile Pro Glu Arg Thr Met Ser Val Ser Asp Phe Asn Tyr Ser Arg Thr Ser Pro Ser Lys Arg Pro Asn Thr Arg Val Gly Ser Glu His Ser Leu Leu Asp Pro Pro Gly Lys Ser Lys Val Pro His Asp Trp Arg Glu Gln Val Leu Arg His Ile Glu Ala Lys Lys Leu Glu Lys His Pro Gln Thr Ser Ser Pro Gly Glu Cys Cys Gln Asp Asp Arg Phe Met Ser Glu Glu Gln Asn His Pro Ser Gly Ala Leu Ser His Arg Gly Leu Pro Asp Ser Leu Met Lys Met Pro Leu Ser Asn Gly Gln Met Gly Gln Pro Leu Arg Pro Gln Ala His Tyr Ser Gln Thr His His Pro Pro Gln Ala Ser Val Ala Arg His Pro Ser Arg Glu Gln Len Ile Asp Tyr Leu Met Leu Lys Val Ala His Gln Pro Pro Tyr Thr His Pro His Cys Ser Pro Arg Gln Gly His Glu Leu Ala Lys Gln Glu Ile Arg Val Arg Val Glu Lys Asp Pro Glu Leu Gly Phe Ser Ile Ser Gly Gly Val Gly Gly Arg Gly Asn Pro Phe Arg Pro Asp Asp Asp Gly Ile Phe Val Thr Arg Val Gln Pro Glu Gly Pro Ala Ser Lys Leu Leu Gln Pro Gly Asp Lys Ile Ile Gln Ala Asn Gly Tyr Ser Phe Ile Asn Ile Glu His Gly Gln Ala Val Ser Leu Leu Lys Thr Phe His Asn Ala Val Asp Leu Ile Ile Val Arg Glu Val Ser Ser <210> 5 <211> 3996 <212> ADN
<213> Mus musculus <400> 5 gcggccgcgg taggatcagg cttgtagtcc taacttccga ggctgaggca ggaggctcac 60 ttgcctccag gaggccagcc gaggctacat gagaccttgt ctcaaacaaa caaacaaaca 120 aacaaacaga gtaagtaaag aaaaatctga atttagtctg acatttgaat tactcttttt 180 gtagcctttg tccacaaaag ttttgagtgt gcatgctatg tggcttccta gaacaaatca 240 catatttaat actccttttc tctattaatt gtcctgttat aattttgtat ccatttgctc 300 tgtgaagaca aattattaga aactttcaat ttttcaatat catatccaaa atacagtgtc 360 tttcagatta catacattag gtaataacat cccataccat tcattatatt tctaaatcta 420 gaatggtttc tgggaaatgc attttttaaa aagccatatc atccaggttc ttatacaccg 480 tcactgaaca cttatttgtt cagacgtgtt tgttaatgta tggtatgtga gaatcgtagt 540 ttgaatcact gaagtaattc tatgcaattg aactttctat aatgatggga atattatgta 600 atgtttgagc cactttggta tccttagtag ggaataagga aatgacattt taaattttat 660 ttgatttaac cttaatatta agcatgtata tctactggct accataccgg acatcaggta 720 gcaggttatc ttattagtat acaacgataa gcttaatccc tttttatcag ttacattcct 780 tattgaatga attgtttatt cctggtggta aaatgtgcat ttttataaac attaagtttt 840 tataaacaca aagttttcct ctaaaatctt tatctagaaa taagcataca aaaaaagaga 900 atagaattct tactctgtgt gtgtgatcgg attctaaccc aggacaagcc atacatggtc 960 atgttgtcat tgcctcagat gaaaacatcg ggtgtttcac ttactagatt tttaaaaaat 1020 ctttaaatag tgtataaata gacctattga tactaggttt tgaggatcta gttcaaatgt 1080 atattatatg ctttttcaaa aatctgtttt atgagtctgt gtagttctaa aaaagcaact 1140 cttaagtacc atgttaaaga tctttatttt tgactgttgt ttgtagttaa gaaaatctgg 1200 ttctctatgg aagcagtagg atattctcta aaaaattgta atgaagataa agaaaatatt 1260 tataaacatt atccaaagag ctacagcata gtgcctgatg attgagtaaa gtcagtgtag 1320 aaacagttgt actgggttgg ctgaagtatc gttaagtggg aagcagagcc tttagtgcca 1380 cattgtatcc tgaggtaagg aaaaaccaat gttggttgta tacactttac ttaaacattc 1440 gcattttgtt cataaatgat tattctttta agtaattaga gtatttaaag tattgccttg 1500 ctgatttttt gttactttct tatattttat gcctgaggtc ttactgattt aactctggct 1560 taatgctgtt taaaagtatt gtttctgtac ctaaggcaag aattatattc atgtacaaag 1620 aattactaac caattggtga tcattctcat tttcttaagt aatttcactg ctagtttact 1680 cttagcctag ttagaattta tacacaactt cttaataaaa ctggccttgt gaatttttat 1740 taattcaaag ttggctttct ctccctgtta actgagagac tgtattttaa gtgagtttat 1800 gcatatataa tcttaaacaa cttagaacct ataagctagt attagattaa aacaaaatta 1860 tacttggagt agatgggact tttcatgtag gagaatcata agaaagttaa atgtggttga 1920 tctctgatga acggttgaga agacctgaaa atgtctgcac agtcatttcc tattcagaaa 1980 tgcacagtca ggttcttgac taagagacag aactcttagt tggaaattag aggaaaacct 2040 tttactgttt ttaacagcta agcagacttc acaacgcatg gttttataaa aacgtaggag 2100 tattttgttt tgtgttgtat tcttggattg ttttgtaaag taccagagag cctgagttta 2160 atttgaagtc cagtagactg tcaactgttg atattaatag gctcagttgg gtgtatgtgg 2220 tggtggaggt attgtttgtc tgtggcatgt ggaattgtgc tgtatggacg gtcatttgtt 2280 ggaaaagttg ttgttatatt atatgcattc tgatttgttt ttatgttcat gctgcagcat 2340 ttaaaaatga ctacaaaacg aagtttgttt gtgcggttgg taccatgtcg ctgtctacga 2400 ggagaagagg agacagtcac tactctagat tattctcatt gcagcttgga acaagttccc 2460 aaagagattt tcacctttga aaaaacttta gaggagctct atttagatgc taatcagatt 2520 gaagagcttc caaaggtatg ttaatactat caagaattat attaggtaat gtctatgcat 2580 agcagtttat attcttatat tgttgtatat atgtgttcct gtttattggt ttagtcttac 2640 tgtaagcaca attcaaaatg atgtagaact ttgttcaagt tgtttaagta cttgtgtgga 2700 taattgaatt ttatttttac ttataacaat taaaatagat aatcagtata tatgacttct 2760 ggaaccatta gatttaacca gactaagaaa agtgaactct tactgtaatt tctataagca 2820 ctttatatgc attgctaaca ttgttacttc cattgctaca gcttttatgg ttctgtaact 2880 tcttagaggt gggattctgc tgttttccat tttgtatgga attgatttgg agacagtgca 2940 tctctgaagt ctagtaacaa ctggtagggg acagattgct gctgtgacgt tctttctcag 3000 attgccactg tgtttattat tgttatttta gtaagctctt ttttctctta tctgtgtttg 3060 ttttcctgtg tatgaaaagg ttgcagtagc tttaaattgt ttattacagt ctgtatccct 3120 ctgaatggca gacagggtct taccttgtag actagactgt cctcaactct cagagatctg 3180 cctgcccttg ctttccaagg ctgtggttga aggtgtacac caccttgctc tttgaagctg 3240 taaatggaga cttgaaattg atggcttaaa aaacaagtta gactttggca tggtggtacc 3300 taaatgagaa agatttctag ttcaaggcca gtctgaccta cacagtgggt tctgtcatgg 3360 cctggatcat atatataatc agaccttggt ttcaaaacct cctgaccatg gtcacgaatg 3420 aacaatttaa tatgcattac cagaattctg aaaaataaac tgtaatttgg actatgagat 3480 ttagacgaca aaattataga atacttagaa tttctgatga aaaagaaatc gtgtaaatgt 3540 gcagtgtgta ggataaacta aaaaactgtt tatctgaaat tcacatttaa ttgggtgtct 3600 cgtaattaat ccagcaaccc taactgaaat gtaacaggta atatatcttg ttgcatatag 3660 actttattta atgaaatagt tgttttcaat atttatgttt gtgaacattc tgaatgacag 3720 tattcaaaag catttgaaag ccactgctgt cctaggtaat gaagttttac aaaactttat 3780 tgagacagga tctcactttg tgatctagac aaacttcaaa cttcattgca atcctcctgc 3840 ctcagcttcc cagatctggg gattataggc tgagccacta tgcctggttt attcttaata 3900 atgtggagaa gtctagaact tttctatttg tgcacagtaa aggtcttcag tttaacatgg 3960 atttgtgaat cacacctgat gcctgcgatt gtagtg 3996 <210> 6 <211> 144 <212> ADN
<213> Homo sapiens <400> 6 agcatgctgt caaggtcctt taattccaat tttactactg taagcagttt tcactgtggc 60 agctctaggg atctgcatgg cagccagggc agtcttgcct tgagtgttgc agacagaaga 120 ggttctggtg ggcacatttt tcga 144 <210> 7 <211> 48 <212> PRT
<213> Homo sapiens <400> 7 Ser Met Leu Ser Arg Ser Phe Asn Ser Asn Phe Thr Thr Val Ser Ser Phe His Cys Gly Ser Ser Arg Asp Leu His Gly Ser Gln Gly Ser Leu Ala Leu Ser Val Ala Asp Arg Arg Gly Ser Gly Gly His Ile Phe Arg <210> 8 <211> 676 <212> ADN
<213> Homo sapiens <400> 8 ctcgagacca ggaagccagc ccgcacccca acccccacca aagccaccta ctcttcttct 60 gtgggaggcc agtccacatc cgctctcacc cgagagagat attcagctgg atccaaagtg 120 actgatgaag ggaaggaaat catgtcaagc gaagccttga aaaagctgcc ctgagacggt 180 gtcccgccga aagaatgttg gctcaattaa gaaacatcag ggagataaat tcaacccagt 240 gtgtctaaaa atgactacaa aacgaagttt gtttgtgcgg ttggtaccat gtcgctgtct 300 acgaggggaa gaggagactg tcactactct tgattattct cattgcagct tagaacaagt 360 tccgaaagag atttttactt ttgaaaaaac cttggaggaa ctctatttag atgctaatca 420 gattgaagag cttccaaagc aactttttaa ctgtcagtct ttacacaagc tgagtttgcc 480 agacaatgat ttaacaacgt taccagcatc cattgcaaac cttattaatc tcagggaact 540 ggatgtcagc aagaatggaa tacaggagtt tccagaaaat ataaaaaatt gtaaagtttt 600 gacaattgtg gaggccagtg taaaccctat ttccaagctc cctgatggat tttctcagct 660 gttaaaccta acccag 676 <210> 9 <211> 366 <212> ADN
<213> Homo sapiens <400> 9 ccattcagac ctgatgatga tggtatattt gtaacaaggg tacaacctga aggaccagca 60 tcaaaattac tgcagccagg tgataaaatt attcaggcta atggctacag ttttataaat 120 attgaacatg gacaagcagt gtccttgcta aaaactttcc agaatacagt tgaactcatc 180 attgtacgag aagtttcctc ataagcactg tggacaaaaa aagcggggaa gacagcaaga 240 tttattggaa gatacttaca ggggaaatta atattttgac tatttttata tataaagaag 300 aactcaaaaa attatgttca aatttgtaca ttaatgaaat aatggataaa ggagactgtt 360 gaattc 366 <210> 10 <211> 31 <212> ADN
<213> Homo sapiens <400> 10 gggaggccag tccacatccg ctctcacccg a 31 <210> 11 <211> 32 <212> ADN
<213> Homo sapiens <400> 11 attcagctgg atccaaagtg actgatgaag gg 32 <210> 12 <211> 20 <212> ADN
<213> Homo sapiens <400> 12 actacaaaac gaagtttgtg 20 <210> 13 <211> 22 <212> ADN
<213> Homo sapiens <400> 13 gtttcctcag aatgtccatt ta 22 <210> 14 <211> 29 <212> ADN
<213> Homo sapiens <400> 14 atgtggttca gtcctattag gagactggg 29 <210> 15 <211> 30 <212> ADN
<213> Homo sapiens <400> 15 cagatccaac tggaccactt ttctgagggg 30 <210> 16 <211> 44 <212> ADN
<213> Homo sapiens <400> 16 cagcagatgt gattttaacg gttgtacttg gctgctgagg tcca 44 <210> 17 <211> 31 <212> ADN
<213> Homo sapiens <400> 17 gaggccccac aagtggccca caatctgcac c 31 <210> 18 <2i1> 33 <212> ADN
<213> Homo sapiens <400> 18 cctcctcagc tccttcctag atcagagagc aca 33 <210> 19 <211> 29 <212> ADN
<213> Homo sapiens <400> 19 cttccaataa atcttgctgt cttccccgc 29 <210> 20 <211> 29 <212> ADN
<213> Homo sapiens <400> 20 atagtcaaaa tattaatttc ccctgtaag 29 <210> 21 <211> 9 <212> PRT
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle : extrémité C-terminale de ERBB2/HER2 <400> 21 Glu Tyr Leu Gly Leu Asp Val Pro Val

Claims

REVENDICATIONS

1. Polypeptide isolé, dénommé Erbin, comprenant une séquence d'acides aminés choisie parmi SEQ ID n o 2 ou n o 4, la séquence SEQ ID n o 2 délétée des résidus 1212 à 1280, ou la séquence SEQ ID n o 2 avec une insertion entre les acides aminés 1211 et 1212 du fragment de séquence SEQ ID n o 7.

2. Acide nucléique isolé, comprenant une séquence nucléotidique codant pour un polypeptide selon la revendication 1.

3. Acide nucléique selon la revendication 2 comprenant la séquence choisie parmi SEQ ID n o 1, SEQ ID n o 3, la séquence SEQ ID n o 1 avec un délétion des nucléotides 3957 à 4163, ou la séquence SEQ ID n o 1 avec une insertion entre les nucléotides 3956 et 3957 du fragment de séquence SEQ ID n o 6.

4. Acide nucléique isolé comprenant une séquence d'acide nucléique isolé choisie parmi la séquence SEQ ID n o 5, ou la séquence comprenant les nucléotides 2347 à 2535 sur SEQ ID n o 5.

5. Polypeptide isolé, comprenant une séquence choisie parmi:
a) - les résidus 1 à 501 de SEQ ID n o 2 ;
- les résidus 296 à 334 de SEQ ID n o 4 ;
b) la séquence SEQ ID n o 7 ;
c) - la séquence SEQ ID n o 2 avec une mutation de l'histidine 1347 en leucine ;
- la séquence SEQ ID n o 2 avec une mutation de la leucine 1291 en méthionine et de la phénylalanine 1293 en isoleucine ;
- la séquence SEQ ID n o 2 avec une mutation de l'histidine 1347 en tyrosine et de la glycine 1348 en acide aspartique ; et - la séquence SEQ ID n o 2 avec une mutation de la thréonine 1316 en asparagine et de l'arginine 1317 en sérine.

6. Polypeptide isolé, consistant en une séquence choisie parmi:
- les résidus 1279 à 1371 de SEQ ID n° 2;
- les résidus 502 à 1278 de SEQ ID n° 2;
- les résidus 914 à 1371 de SEQ ID n° 2; et - les résidus 1212 à 1280 de SEQ ID n° 2.

7. Acide nucléique isolé comprenant une séquence nucléotidique codant pour le polypeptide de la revendication 5 ou 6.

8. Vecteur de clonage et/ou d'expression contenant un acide nucléique selon l'une quelconque des revendications 2, 3, 4 ou 7.

9. Cellule hôte transfectée par un vecteur selon la revendication 8.

10. Utilisation d'un acide nucléique selon l'une des revendications 2, 3, 4 ou 7 pour l'obtention de sondes ou d'amorces ayant au moins 15 nucléotides, qui hybrident spécifiquement avec la séquence d'acide nucléique des revendications 2, 3, 4 ou 7 ou son complémentaire, dans des conditions stringentes d'hybridation.

11. Sonde nucléique dont la séquence est choisie parmi la séquence SEQ ID n° 8 ou SEQ ID n° 9.

12. Amorce nucléique dont la séquence est choisie parmi la séquence SEQ ID n° 10 à SEQ ID n° 20.

13. Procédé de production d'un polypeptide recombinant, dans laquelle un vecteur contenant un acide nucléique selon la revendication 2, 3, 4 ou 7 est transféré dans une cellule hôte, qui est mise en culture dans des conditions permettant l'expression du polypeptide selon la revendication 1 ou 5, ou d'un polypeptide codé par une séquence d'acide nucléique telle que définie à la revendication 4.

14. Procédé de diagnostic in vitro d'une tumeur ou d'une prédisposition à développer une tumeur, comprenant les étapes consistant à
a1) mettre en présence un échantillon biologique contenant de l'ADN ou de l'ARN avec des oligonucléotides spécifiques permettant l'amplification de tout ou partie du gène de l'Erbin ou de son transcrit, comprenant une séquence telle que définie à l'une des revendications 2, 3, 4 ou 7 ;
b1) amplifier ledit ADN ou ARN ;
c1) détecter les produits d'amplification ;
d1) comparer les produits d'amplification obtenus à ceux obtenus avec un échantillon contrôle, et détecter de cette manière une éventuelle anomalie dans ledit gène de l'Erbin ou dans son transcrit, indicatrice d'une prédisposition à
développer une tumeur, ou a2) mettre en présence un échantillon biologique contenant de l'ARNm obtenu à partir d'un prélèvement de cellules suspectes chez un patient, avec des oligonucléotides spécifiques permettant l'amplification de tout ou partie du transcrit du gène de l'Erbin, comprenant une séquence telle que définie à la revendication 2, 3, 4 ou 6 ;
b2) amplifier ledit transcrit ;
c2) détecter et quantifier les produits d'amplification ;
une modification du taux de transcrit de l'erbin par rapport au contrôle normal étant indicatrice d'une tumeur ou d'une prédisposition à développer une tumeur.

15. Anticorps dirigé contre le polypeptide tel que défini dans la revendication 1, 5 ou 6.

16. Utilisation d'au moins un anticorps selon la revendication 15 pour la détection ou la purification d'un polypeptide tel que défini dans la revendication 1 ou 5 dans un échantillon biologique.

17. Méthode de diagnostic in vitro d'une tumeur ou d'une prédisposition à développer une tumeur, comprenant la mise en contact d'au moins un anticorps dirigé contre le polypeptide tel que défini dans la revendication 1, 5 ou 6 avec un prélèvement biologique obtenu à partir d'un prélévement de cellules suspectes chez un patient, dans des conditions permettant la formation éventuelle de complexes immunologiques spécifiques entre le polypeptide tel que défini dans la revendication 1, 5 ou 6 et le ou lesdits anticorps et la détection et/ou la quantification des complexes immunologiques spécifiques éventuellement formés.

18. Kit comprenant:
- au moins un anticorps selon la revendication 15, éventuellement fixé sur un support;
- des moyens de révélation de la formation de complexes antigènes/anticorps spécifiques entre le polypeptide de la revendication 1, 5 ou 6 et ledit anticorps et/ou des moyens de quantification de ces complexes.

19. Composition pharmaceutique comprenant un acide nucléique selon l'une des revendications 2, 3, 4 ou 7, un acide nucléique anti-sens de l'acide nucléique selon l'une des revendications 2, 3, 4 ou 7, ou un polypeptide selon la revendication 1, 5 ou 6, en association avec un véhicule pharmaceutiquement acceptable.

20. Utilisation d'un acide nucléique selon la revendication 2, 3, 4 ou 7 ou d'un polypeptide selon la revendication 1, 5 ou 6, pour la fabrication d'un médicament destiné au traitement des tumeurs.

21. Procédé d'obtention d'un animal transgénique non humain dans lequel on invalide le gène codant pour le polypeptide tel que défini à la revendication 1.

22. Animal transgénique non humain susceptible d'être obtenu par le procédé de la revendication 21.

23. Méthode de criblage de molécules inhibant ou activant la liaison entre le polypeptide de la revendication 1 et le récepteur ERBB2, comprenant - la mise en contact d'une molécule à tester avec (i) un premier partenaire de liaison qui est le récepteur ERBB2/HER-2 ou un fragment de celui-ci capable de fixer le polypeptide de la revendication 1, et (ii) un deuxième partenaires de liaison qui est le polypeptide de la revendication 1 ou un fragment de celui-ci capable de fixer le récepteur ERBB2/HER-2, le(s)dit(s) premier et/ou deuxième partenaires) de liaison étant au besoin marqué(s) de manière à être détectés, - l'évaluation de 1'inhibition ou de l'activation de l'interaction entre lesdits partenaires de liaison par fa molécule à tester.

24. Procédé d'identification de mutants du polypeptide de la revendication 1 ou de mutants de ERBB2/HER2 qui augmentent ou diminuent l'interaction entre cette protéine et le récepteur ERBB2/HER2, dans lequel - soit on effectue une mutation sur le polypeptide de la revendication 1, 5 ou 6 et on évalue l'effet de cette mutation sur l'interaction dudit polypeptide avec le récepteur ERBB2/HER2 ;
- soit on effectue une mutation sur le récepteur ERBB2/HER2 et on évalue l'effet de cette mutation sur l'interaction dudit récepteur avec le polypeptide de la revendication 1, 5 ou 6.