脑信号蛋白6A促进髓鞘形成和少突胶质细胞分化的用途
技术领域
本发明涉及神经生物学、神经学和药理学。更具体的,其涉及通过施用脑信号蛋白6A(“Sema6A”)多肽而治疗涉及中枢神经系统髓鞘形成的疾病的方法。
背景技术
很多神经系统疾病与脱髓鞘和髓鞘形成障碍有关,包括多发性硬化(MS)、进行性多灶性白质脑病(PML)、脑脊髓炎(EPL)、脑桥中央髓鞘溶解症(central pontine myelolysis,CPM)、沃勒变性以及一些遗传性疾病,如肾上腺脑白质营养不良、亚历山大病和佩-梅病(Pelizaeus Merzbacher disease,PMZ)。这些疾病当中,MS是分布最广的,在世界范围内影响到大约250万人。
MS通常以累及神经的复发-缓解模式(relapsing-remittingpattern)开始,其随后随着神经损伤加重而发展到慢性期。MS与慢性病变局部的髓鞘、少突胶质细胞和轴突遭到破坏有关。MS中观察到的脱髓鞘并不总是永久性的,并且有记载在该疾病早期出现有髓鞘再生。中枢神经系统(“CNS”)神经元的髓鞘再生需要少突胶质细胞。
多种疾病-调节性治疗可用于MS,包括使用皮质类固醇和免疫调节剂(如干扰素β)。此外,由于少突胶质细胞和髓鞘形成在MS中的核心作用,已在努力开发增加少突胶质细胞数量或加强髓鞘形成的治疗方法。参见,如,Cohen等,美国专利第5,574,009号;Chang等,N.Engl.J.Med, 346:165-73(2002)。然而,仍然迫切需要设计用于MS的其他治疗方法。
脑信号蛋白被认为是控制轴突导向和细胞迁移的分泌型或膜结合蛋白。Kerjan等,Nat.Neursci.8(11):1516-1524(2005)。很多跨膜脑信号蛋白在发育中的CNS中表达,但是对它们在体内的功能了解甚少。文献同上。脑信号蛋白类型6(Class 6semaphorin)包括四类蛋白质:Sema6A-Sema6D,它们同无脊椎动物跨膜脑信号蛋白密切相关。Fiore和Puschel.Front.Biosci.8:2484-2499(2003)。所有脑信号蛋白在细胞外部分的N-端都具有脑信号蛋白(Sema)结构域和丛蛋白-脑信号蛋白-整联蛋白(PSI)结构域(发现于丛蛋白、脑信号蛋白和整联蛋白)。
丛蛋白是一个分布于多种动物物种中的分子的家族(丛蛋白家族)。Murakami等,Dev.Dynam.220:246-258(2001)。丛蛋白分为四个亚家族,即:丛蛋白-A、-B、-C和-D。文献同上。在小鼠和人类,已经分离出丛蛋白-A亚家族的四个成员(丛蛋白-A1、-A2、-A3和-A4)。参见Kameyama等,Biochem.Biophys.Res.Commun.226:396-402(1996);Kameyama等,Biochem.Biophys.Res.Commun.226:524-529(1996);Maestrini等,Proc.Natl.Acad.Sci.USA 93:674-678(1996);Tamagnone等,Cell 99:71-80(1999)以及Suto等,Mech.Dev.120:385-396(2003)。丛蛋白-A亚家族的胞外域具有一段大约为500个的氨基酸(aa)残基,其表现出与sema结构域(脑信号蛋白所共有)显著的同源性。Murakami等,Develop.Dyn.220:246-258(2001)。已知A-型丛蛋白和脑信号蛋白类型6相互作用。Toyofuku等,Genes Develop.18:435-447(2004)。例如,Suto等表明丛蛋白-A4是Sema6A的直接受体。J. Neurosci.25(14):3628-3637(2005)。
发明内容
发明概述
本发明基于这样一种发现,即:脑信号蛋白6A(Sema6A)在少突胶质细胞中表达,并调节少突胶质细胞的分化、存活和/或轴突的髓鞘形成。此外,某些Sema6A多肽促进少突胶质细胞的存活、增殖和/或分化,以及促进神经元的髓鞘形成。基于这些发现,本发明大致涉及通过施用Sema6A多肽来治疗脱髓鞘和/或髓鞘形成障碍相关疾患(如,多发性硬化)的方法。
在某些实施方式中,本发明包括促进少突胶质细胞的增殖、分化或存活的方法,其包括使用有效量的含有分离的Sema6A多肽的组合物接触少突胶质细胞。在其它实施方式中,本发明包括促进少突胶质细胞-介导的神经元髓鞘形成的方法,其包括使用有效量的含有Sema6A多肽的组合物接触神经元和少突胶质细胞的混合物。
本发明涉及在哺乳动物中促进少突胶质细胞的增殖、分化或存活的方法,或在哺乳动物中促进神经元髓鞘形成的方法,其包括向有此需求的哺乳动物施用有效量的含有Sema6A多肽的组合物。
还包括在哺乳动物中治疗髓鞘形成障碍或脱髓鞘相关的、或少突胶质细胞死亡或缺少分化相关的疾病、病症或损伤的方法,其包括向有此需求的哺乳动物施用治疗有效量的含有Sema6A多肽的组合物。
还包括在哺乳动物中治疗涉及髓鞘破坏的疾病、病症或损伤的方法,其包括施用治疗有效量的含有Sema6A多肽的组合物。
还包括本文描述的本发明的方法,其中所述Sema6A多肽与丛蛋白-A2多肽或丛蛋白-A4多肽结合。在其它实施方式中,所述Sema6A多肽是分离的。
本发明的进一步实施方式包括通过体内基因治疗方法来治疗涉及少突胶质细胞或髓鞘破坏的疾病、病症或损伤的方法,其包括在疾病、病症或损伤位点或者在疾病、病症或损伤位点附近,向哺乳动物施用含有编码Sema6A多肽的核苷酸序列的载体,以使所述哺乳动物中所述Sema6A多肽由核苷酸序列表达,其表达的量足以促进损伤位点或损伤位点附近经由神经元的轴突延伸(extension)。在某些实施方式中,本发明包括在哺乳动物中促进少突胶质细胞增殖、分化或存活,或促进神经元髓鞘形成的方法,其包括向有此需求的哺乳动物施用有效量的含有多聚核苷酸的组合物,所述多聚核苷酸编码Sema6A多肽。
此外,本发明包括在哺乳动物中治疗髓鞘形成障碍或脱髓鞘相关的、或少突胶质细胞死亡或缺少分化相关的疾病、病症或损伤的方法,其包括向有此需求的哺乳动物施用治疗有效量的含有多聚核苷酸的组合物,所述多聚核苷酸编码Sema6A多肽。本发明还包括在哺乳动物中治疗涉及髓鞘破坏的疾病、病症或损伤的方法,其包括施用治疗有效量的含有多聚核苷酸的组合物,所述多聚核苷酸编码Sema6A多肽。在某些实施方式中,本发明的Sema6A多肽与丛蛋白-A2多肽或丛蛋白-A4多肽结合。本发明方法中所用的多聚核苷酸可为分离的。
在某些实施方式中,所述载体是病毒载体,其选自由腺病毒载体、甲病毒载体、肠道病毒载体、瘟病毒载体、慢病毒载体、杆状病毒载体、疱疹病毒载体、Epstein-Barr病毒载体、乳多空病毒载体、痘病毒载体、痘苗病毒载体以及单纯疱疹病毒载体组成的组。
在一些实施方式中,所述疾病、病症、损伤或疾患选自由以下组成的组:多发性硬化(MS)、进行性多灶性白质脑病(PML)、脑脊髓炎(EPL)、脑桥中央髓鞘溶解症(CPM)、肾上腺脑白质营养不良、亚历山大病、佩-梅病(PMZ)、球样细胞脑白质病(克拉伯氏病,Krabbe’s disease)、沃勒变性、视神经炎、横贯性脊髓炎、肌萎缩侧索硬化(ALS)、亨廷顿病、阿尔茨海默病、帕金森病、脊髓损伤、创伤性脑损伤、辐射后损伤、化疗后神经系统并发症、中风、急性缺血性视神经病变、维生素E缺乏、孤立性维生素E缺乏综合征(isolated vitamin E deficiency syndrome)、AR、巴-科综合征(Bassen-Kornzweig syndrome)、胼胝体脱髓鞘性脑病综合征(Marchiafava-Bignami syndrome)、异染性脑白质营养不良、三叉神经痛和贝尔麻痹。在一些实施方式中,培养的宿主细胞来源于待治疗的哺乳动物。
某些Sema6A多肽包括但不限于缺少跨膜结构域和细胞质结构域的Sema6A多肽片段、变体、或其衍生物。Sema6A多肽包括这样的多肽,即所述多肽含有(i)信号序列、(ii)sema结构域、(iii)PSI结构域、(iv)细胞外结构域、(v)跨膜结构域、(vi)细胞质结构域和(vii)所述结构域中两种或更多种的组合。在一些实施方式中,Sema6A多肽缺少信号序列、sema结构域、PSI结构域、跨膜结构域、细胞质结构域、或所述结构域中两种或更多种的组合。在一些实施方式中,所述Sema6A多肽包括Sema结构域,并且缺少信号序列、PSI序列、跨膜结构域和细胞质结构域。在一些实施方式中,所述Sema6A多肽包括SEQ ID NO:2的氨基酸残基1-649。
在一些实施方式中,通过快速推注(bolus injection)或慢速输注(chronic infusion)施用所述Sema6A多肽。在一些实施方式中,将所述Sema6A多肽直接施用至中枢神经系统中。在一些实施方式中,将所述Sema6A多肽直接施用至MS的慢性病变处。
在一些实施方式中,所述Sema6A多肽是包含非Sema6A部分的融合多肽。在一些实施方式中,所述非Sema6A部分选自由抗体Ig部分、血清白蛋白部分、靶向部分、报道分子部分和便于纯化的部分组成的组。在一些实施方式中,所述抗体Ig部分是铰链和Fc部分。
在一些实施方式中,本发明的所述多肽轭合至聚合物上。在一些实施方式中,所述聚合物选自由聚亚烷基二醇、糖聚合物和多肽组成的组。在一些实施方式中,所述聚亚烷基二醇是聚乙二醇(PEG)。在一些实施方式中,本发明的所述多肽轭合至1、2、3或4个聚合物。在一些实施方式中,所述聚合物的总分子量从5,000Da至100,000Da。
附图简述
图1是人类Sema6A多肽亚型(isoform)(即:亚型A-D)间的序列比较。
图2是小鼠Sema6A多肽亚型(即:亚型1-3)间的序列比较。
图3:小鼠神经系统中的Sema6A表达。通过原位杂交分析P15小鼠神经系统中的Sema6A表达。大多数表达Sema6A的细胞发现于白质当中。白质中的Sema6A表达细胞是少突胶质细胞。
图4A-4C:在P16,于前连合(AC)中表达髓鞘蛋白脂质蛋白(PLP)的Sema6A+/-(A)或Sema6A-/-(B)少突胶质细胞的免疫染色分析。(C)-在不同阶段(即:P16、P30和P45),在AC中对PLP表达细胞的定量。
图5A-5D:(A)-Sema6A-/-少突胶质细胞的体外成熟。48小时后测量少突胶质细胞的分形维数(FD)。左侧棒是Sema6A-/-少突胶质细胞的FD,右侧棒是Sema6A+/-少突胶质细胞的FD。(B)-在48小时处用抗-O4抗体进行免疫染色并通过相差显微镜检查观察的Sema6A-/-少突胶质细胞。(C):24小时和48小时处Sema6A-/-少突胶质细胞的体外成熟。左侧棒是24小时的,右侧棒是48小时的。(D):在48小时处用抗-O4抗体进行免疫染色并通过相差显微镜检查观察的Sema6A+/-少突胶质细胞。
图6A-6C:以各种剂量添加有Sema6A-Fc的背根神经节细胞(DRG)和少突胶质细胞的共培养物中的髓鞘形成,(A)阴性对照;(B)0.1μg/ml和(C)0.3μg/ml。通过用抗MBP抗体的免疫染色来显示髓鞘形成的程度。
图7:用双环己酮草酰二腙(cuprizone)处理小鼠,并检查脱髓鞘和髓鞘再生期间Sema6A的表达。测定不同阶段(即:3-6周)Sema6A表达细胞的数目。
图8:(A)-(B)以×1放大倍数(A)和×1放大倍数(B)在人类MS病变组织和非病变组织中使用Sema6A核糖核酸探针进行的原位杂交;(C)以×10放大倍数,使用人类Sema6A抗体进行的人类MS病变组织的免疫染色。
图9A-D:(A)在丛蛋白-A2+/+(野生型)、丛蛋白-A2蛋白无效敲除(丛蛋白-A2-/-)小鼠以及在脑信号蛋白结构域中带有单氨基酸取代(A396E)的丛蛋白-A2突变体(NMF454)中,丛蛋白-A2多肽表达的Western印记分析;(B)丛蛋白-A2、丛蛋白-A4、丛蛋白-A1和丛蛋白-A3的序列比对以鉴定丙氨酸(396);(C)Sema6A和COS细胞中表达的野生型丛蛋白-A2蛋白的结合分析;以及(D)Sema6A和COS细胞中表达的突变丛蛋白-A2A396E的结合分析。
发明详述
定义
除非另有指明,否则本文所用的所有技术术语和科技术语具有和本发明所属领域普通技术人员所普遍理解的相同意义。当遇冲突时,以本申请所包含的所述定义为准。除非上下文另有要求,否则单数术语应当包括复数,并且复数术语应当包括单数。出于任何目的,本文提及的所有出版物、专利和其他参考文献通过引用以其整体并入本文,就如同各个单独的出版物或专利申请具体并且单独的通过引用并入本文。
尽管与本文所述的方法和材料相似或等同的方法和材料可用于本发明的实践或测试,但合适的方法和材料如下所述。所述材料、方法和实例仅是说明性的,并非意图限制本发明。根据详述以及权利要求书,本发明的其他特征和优势将是明显的。
为了进一步解释本发明,提供如下术语和定义。
应当注意,术语“一个(a)”或“一个(an)”实体,是指一个或多个这种实体;例如,“一个多肽”应理解为代表一个或多个多肽。同样地,术语“一个(a)”(或“一个(an)”)、“一个或多个”以及“至少一个”本文中可以相互替换使用。
贯穿本说明书和权利要求书,词语“包括(comprise)”或其变化形式如“包括(comprises)”或“包括(comprising)”表示包含所列举的任何整体或整体的组,但是不排除任何其他整体或整体的组。
贯穿本说明书和权利要求书,术语“由...组成(consists of)”及其变化形式如“由...组成(consist of)”或“由...组成(consistingof)”表示包含所列举的任何整体或整体的组,但是没有其它的整体或整体的组可加入到所述具体方法、结构或组合物中。
贯穿本说明书和权利要求书,术语“主要由...组成(consistsessentially of)”及其变化形式如“主要由...组成(consist essentiallyof)”或“主要由...组成(consisting essentially of)”表示包含所列举的任何整体或整体的组,并且任选地包含不实质性改变具体方法、结构或组合物的基本或新型特征的任何所列举的整体或整体组。
如本文所用,“抗体”是指完整的免疫球蛋白、或其抗原结合片段。本发明的抗体可以是任何同种型或类(如M、D、G、E和A)或任何亚类(如G1-1、A1-2),并且可具有kappa(κ)或lambda(λ)轻链。
如本文所用,“Fc”是指免疫球蛋白重链的部分,其包括一个或多个重链恒定区结构域CH1、CH2和CH3。例如,通过木瓜蛋白酶消化可获得的抗体重链恒定区的部分。
如本文所用,“人源化抗体”是指在抗体中至少一部分非人类序列替换为人类的序列的抗体。如何制备人源化抗体的实例可见于美国专利第6,054,297号、第5,886,152号和第5,877,293号。
如本文所用,“嵌合抗体”是指包含一个或多个来自第一种抗体的区域,并且包含一个或多个来自至少一种其他抗体的区域的抗体。所述第一种抗体和所述其他抗体可以来自相同或不同的物种。
如本文所用,“治疗有效量”是指这样一种量,即:在必要的剂量和时间周期下,有效获得期望的治疗效果。治疗效果可以是,如减轻症状、延长存活、改善运动性(mobility)等。治疗效果不必是“治愈”。
如本文所用,“预防有效量”是指这样一种量,即:在必要的剂量和时间周期下,有效获得期望的预防效果。典型情况下,由于预防剂量在受治疗者中的使用先于疾病或者处于疾病早期,所以预防有效量将少于治疗有效量。
如本文所用,“多聚核苷酸”可以包含全长cDNA序列的核苷酸序列(包括5′和3′未翻译序列、编码序列)以及核酸序列的片段、表位、结构域和变体。多聚核苷酸可主要由任何多聚核糖核苷酸或多聚脱氧核糖核苷酸组成,其可以是未修饰的RNA或DNA,或修饰的RNA或DNA。例如,多聚核苷酸可以由单-和双-链DNA、DNA(单-和双-链区域的混合物)、单-和双-链RNA、RNA(单-和双-链区域的混合物)、包括DNA和RNA的杂交分子(可以是单-链、或更具代表性地双-链、或单-和双-链区域的混合物)组成。此外,所述多聚核苷酸可主要由三-链区域组成,其包括RNA或DNA或既含有RNA也有DNA。多聚核苷酸也可以包含一个或多个修饰碱基、或出于稳定性或其他目的而修饰的DNA或RNA骨架。“修饰”碱基包括,例如,三苯甲基化碱基和罕见碱基(如肌苷)。可以对DNA和RNA进行多种修饰;因此,“多聚核苷酸”包括化学、酶、或代谢修饰的形式。
本发明中,多肽可主要由彼此通过肽键或修饰的肽键(即肽电子等排体)连接的氨基酸组成,并且可以含有20个基因编码的氨基酸以外的氨基酸(如非天然存在的氨基酸)。可以通过天然过程(如翻译后加工)、或本领域公知的化学修饰技术来修饰本发明的所述多肽。这些修饰在基础教科书和更具体的专著当中,以及大量研究文献中均有详细描述。可以在多肽中的任何位置发生修饰,包括肽骨架、氨基酸侧链以及氨基或羧基端。应当理解,在给定多肽的多个位点中以相同或不同程度可出现相同类型的修饰。而且,给定多肽可含有很多类型的修饰。多肽可以是分支的(如泛素化造成的),其可以是有或没有分支的环形。环形、分支以及带分支的环形多肽可是翻译后天然加工的结果或由合成方法制备。修饰包括乙酰化、酰化、ADP-核糖化、酰胺化、黄素的共价连接、血红素部分的共价连接、核苷酸或核苷酸衍生物的共价连接、脂质或脂质衍生物的共价连接、磷脂酰肌醇(phosphotidylinositol)的共价连接、交联、环化、形成二硫键、去甲基化、形成共价交联、形成半胱氨酸、形成焦谷氨酸、甲酰化、γ-羧化、糖基化、形成GPI锚、羟基化、碘化、甲基化、豆蔻酰化、氧化、聚乙二醇化、蛋白水解加工、磷酸化、异戊烯化、消旋化、硒化(selenoylation)、硫酸化、转移-RNA介导的蛋白质中氨基酸的添加(如精氨酰化)和泛素化。(参见,如,Proteins-Structure And Molecular Properties(蛋白质-结构和分子特性),第二版,T.E.Creighton,W.H.Freeman and Company,NewYork(1993);Posttranslational Covalent Modification of Proteins(蛋白质的翻译后共价修饰),B.C.Johnson编辑,Academic Press,NewYork,第1-12页(1983);Seifter等,Meth Enzymol 182:626-646(1990);Rattan等,Ann NYAcadSci 663:48-62(1992)。)
当术语“片段”、“变体”、“衍生物”和“类似物”是指本发明的Sema6A多肽时,其包括如下任何多肽,所述多肽保留有至少部分免疫原性(即:诱导抗sema6A免疫应答的能力),或保留有任何Sema6A天然存在的功能(如结合任一丛蛋白-A亚家族多肽即:丛蛋白-A1、丛蛋白-A2、丛蛋白-A3或丛蛋白-A4的能力)。天然存在的Sema6A功能的实例是其结合丛蛋白-A2或丛蛋白-A4多肽的能力。Sema6A多肽如本文所述可包括片段、变体或衍生分子,但不限于此,只要Sema6A多肽仍保留免疫原性或任何天然存在的功能。本发明的Sema6A多肽可包括Sema6A蛋白水解片段、缺失片段,以及尤其是当递送至动物时更易到达作用位点的片段。多肽片段还包括任何包括天然多肽抗原性表位或免疫原性表位(包括线性以及三维表位)的多肽部分。本发明的Sema6A多肽可包括变化的Sema6A区(包括上述片段)、以及具有因氨基酸取代、缺失或插入而改变的氨基酸序列的多肽。变体可以是天然存在的,如等位变体。通过“等位变体”来表示占据有机体染色体上特定基因座的预期的基因变化形式。Genes II(基因II),Lewin,B.编辑,John Wiley&Sons,New York(1985)。可使用本领域公知的诱变技术生产非天然存在的变体。Sema6A多肽可包括保守的或不保守的氨基酸取代、缺失或添加。本发明的Sema6A多肽还可包括衍生分子。例如,本发明的Sema6A多肽可包括这种Sema6A区域,即已经改变用来展现天然多肽中所未发现的额外特征。实例包括融合蛋白和蛋白质轭合物。
本发明中,“多肽片段”或“蛋白质片段”是指Sema6A多肽的短氨基酸序列。蛋白质或多肽片段可以是“独立的(free-standing)”,或包含于更大的多肽中(在其中,所述片段形成区域的部分)。本发明多肽片段的代表性实例包括,例如,包含约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约30个氨基酸、约40个氨基酸、约50个氨基酸、约60个氨基酸、约70个氨基酸、约80个氨基酸、约90个氨基酸以及约100个氨基酸的片段。
如本文所用,术语“连接的”、“融合的”或“融合”可相互替换使用。这些术语是指通过无论什么方式(包括化学共轭或重组方式)将两个或更多个(two more)元件或组件连接起来。“框-内融合”是指以维持原始ORF的正确阅读框的方式将两个或更多个开放阅读框(ORF)连接起来形成连续的更长ORF。因此,获得的重组融合蛋白是单个蛋白质,其包含两个或更多个原始ORF编码的多肽相对应的区段(其中在天然环境中,所述区段通常不是如此连接的)。尽管因此使得阅读框贯穿于所述融合区段是连续的,但仍可通过例如框内连接体(linker)序列将区段物理地或空间地分开。
当涉及多肽的情况下,“线性序列”或“序列”是指氨基酸按照氨基端到羧基端的方向在多肽中的顺序,其中序列中彼此毗邻的残基在多肽一级结构中是连续的。
本文所用术语“表达”是指基因生产生化物质(如,RNA或多肽)的过程。所述过程包括基因在细胞内功能存在的任何现象,包括但不限于基因敲除以及瞬时表达和稳定表达。其包括但不限于所述基因转录成信使RNA(mRNA)、转移RNA(tRNA)、小发夹RNA(shRNA)、小干扰RNA(siRNA)或任何其他RNA产物,以及将这些mRNA翻译成多肽。如果最终期望的产物是生化物质,则表达包括创造所述生化物质和任何前体。
“受治疗者”或“个体”或“动物”或“患者”或“哺乳动物”是指期望对其进行诊断、预后或治疗的任何受治疗者,尤其是哺乳动物受治疗者。哺乳动物受治疗者包括但不仅限于人类、家畜、农场动物、动物园的动物、运动用动物(sport animal)、宠物(如狗、猫、豚鼠、兔、大鼠、小鼠、马、牛、奶牛);灵长类动物(如猿、猴、猩猩和黑猩猩);犬科动物(如狗和狼);猫科动物(如猫、狮、虎);马科动物(如马、驴和斑马);熊、食用动物(如牛、猪和羊)、有蹄类动物(如鹿和长颈鹿);啮齿动物(如小鼠、大鼠、仓鼠和豚鼠)等。在某些实施方式中,所述哺乳动物是人类受治疗者。
Sema6A
本发明基于这样一种发现,即:Sema6A多肽通过促进少突胶质细胞的存活、增殖和/或分化来增加少突胶质细胞的数目。此外,本发明人已经发现Sema6A多肽促进神经元的髓鞘形成。
已知天然存在的人类Sema6A多肽表达于发育中的脑、肾、肺和肝。在人类成体组织(如皮肤(树突细胞))中以及高度再生性胎盘组织中也检测到Sema6A。所述人类Sema6A基因由20个外显子(包括2个未翻译的外显子)组成,覆盖5号染色体上大约60kb的基因组序列。
全长人类Sema6A多肽由信号序列、细胞外结构域、跨膜结构域和细胞质结构域组成。所述细胞外结构域包括sema结构域和丛蛋白-脑信号蛋白-整联蛋白(PSI)结构域。取决于变体,全长人类Sema6A多肽的长度从约971个氨基酸至1049个氨基酸不等。参见图1。小鼠Sema6A存在相似的变体。参见图2。
有报道1030aa的多肽序列为人类Sema6A多肽序列,并且在Genbank中具有登录号为NP-065847。本文将所述人类Sema6A多肽序列指定为亚型A和SEQ ID NO:2。SEQ ID NO:1是编码SEQ IDNO:2的核苷酸序列。有报道1047aa的多肽序列为人类Sema6A多肽变体的序列,并且在Genbank中具有登录号为EAW48937。本文将所述1047aa的多肽指定为亚型B和SEQ ID NO:4。SEQ ID NO:3是编码SEQ ID NO:4的核苷酸序列。报道了具有971个aa的人类Sema6A多肽的另一种变体,其在Genbank中登录号为EAW48935。本文将所述971aa的多肽指定为亚型C和SEQ ID NO:6。有报道975个aa的多肽序列为人类Sema6A多肽变体,并且在Genbank中具有登录号为EAW48934。本文将所述975aa的多肽序列指定为亚型D和SEQ ID NO:8。人类Sema6A变体包括但不限于亚型A的Sema6A多肽(其从氨基酸1001后缺失,获得具有1000个氨基酸的多肽)。Nakayama等,Genome Res.12(11):1773-1784(2002);Strausberg等,Proc.Natl.Acad. Sci.U.S.A.99(26):16899-16903(2002)。也已知其它Sema6A变体,例如,Prislei等,Mol Cancer Ther.7(1):233-241(2007)中。
对于小鼠Sema6A多肽序列及其变体也有报道。1031aa的小鼠Sema6A多肽在UniProtKB/Swiss-Prot门户具有登录号为O35464。本文将所述多肽指定为亚型1和SEQ ID NO:10。编码SEQ ID NO:10的核苷酸序列指定为SEQ ID NO:9。有报道另一种1005aa的多肽序列为小鼠Sema6A多肽序列,其在Genbank中具有登录号为AF288666。将所述多肽序列指定为亚型2和SEQ ID NO:12。本文将编码SEQ ID NO:12的核苷酸序列指定为SEQ ID NO:11。有报道另一种小鼠Sema6A多肽变体的序列在UniProtKB/Swiss-Prot门户的登录号为O35464。本文将所述多肽序列指定为亚型3和SEQID NO:14。将编码SEQ ID NO:14的核苷酸序列指定为SEQ ID NO:13。小鼠Sema6A的变体包括但不限于具有如下突变的多肽:A172V、L201P、N337D、S585N、Q685R、TK703-704SE、P735S、Q766E、I856T、或KSPNHGVNLVENLDSLPPKVPQREAS863-888ESSPYVLKQFSEAFNRQGIILSVAVE。
在其它动物中已知的Sema6A多肽包括但不限于黑猩猩、狗和斑马鱼。有黑猩猩Sema6A多肽的变体,如Genbank登录号XP_001150634、XP_001150901、XP_001150706、XP_001151177、XP_001151109、XP_001151041、XP_001150971和XP_517889。狗Sema6A多肽变体的非限定性实例是Genbank登录号XP_538552、XP_859002、XP_858964、XP_858921、XP_858886和XP_858843。在其它动物中也可以找到Sema6A多肽及其变体。
将Sema6A功能结构域的指定定义如下:
表1.人类Sema6A结构域的实例。
结构域 |
Sema6A(亚型A)1030aa |
Sema6A(亚型B)1047aa |
Sema6A(亚型C)971aa |
Sema6A(亚型D)975aa |
信号序列 |
1-18 |
1-18 |
1-18 |
1-18 |
Sema结构域 |
56-472 |
56-472 |
56-418 |
56-472 |
PSI结构域 |
514-551 |
514-551 |
456-492 |
514-551 |
跨膜 |
650-670 |
667-687 |
591-611 |
595-615 |
细胞质 |
671-1030 |
688-1047 |
612-971 |
616-975 |
表2.小鼠Sema6A结构域的实例。
结构域 |
Sema6A(亚型1)1031aa |
Sema6A(亚型2)1005aa |
Sema6A(亚型3)976aa |
信号序列 |
1-18 |
1-18 |
1-18 |
Sema结构域 |
56-474 |
56-448 |
56-474 |
PSI结构域 |
514-547 |
488-521 |
514-547 |
跨膜 |
650-670 |
624-644 |
595-615 |
细胞质 |
671-1031 |
645-1005 |
616-976 |
正如本领域技术人员理解的,上面所列的结构域的起始和终止残基可以不同,这取决于所用的计算机建模程序或所用的确定结构域的方法。同样,Sema6A的各种功能结构域可能与前面所定义的不同。例如,人类Sema6A多肽亚型A(即:SEQ ID NO:2)的功能结构域可以变化如下:
表3.SEQ ID NO:2中功能结构域的序列变化。
|
信号序列 |
Sema结构域 |
PSI结构域 |
跨膜结构域 |
细胞质结构域 |
低复杂度区域 |
SMART |
1-18 |
56-487 |
514-569 |
648-670 |
671-1030 |
937-952 |
PROSITE |
n/a |
24-512 |
n/a |
n/a |
n/a |
n/a |
pFam |
n/a |
56-491 |
514-565 |
n/a |
n/a |
n/a |
UniPort/Swiss Port |
1-18 |
24-512 |
n/a |
650-670 |
671-1030 |
n/a |
NCBI(NP065847) |
n/a |
56-472 |
514-551 |
n/a |
n/a |
n/a |
Klostermann等 |
5-20 |
42-564 |
n/a |
648-671 |
671-1030 |
n/a |
基于SEQ ID NO:2中的序列变化,本领域技术人员可以识别SEQ ID NO:4、6和8中的序列变化。
SEQ ID NO:10(即:小鼠Sema6A多肽序列的亚型1)中功能结构域的序列可以变化如下:
表4.SEQ ID NO:10中功能结构域的序列变化。
|
信号序列 |
Sema结构域 |
PSI结构域 |
跨膜结构域 |
细胞质结构域 |
低复杂度区域 |
SMART |
1-18 |
56-487 |
514-569 |
648-670 |
671-1031 |
937-951 |
PROSITE |
n/a |
24-512 |
n/a |
n/a |
n/a |
n/a |
pFam |
n/a |
56-491 |
514-569 |
n/a |
n/a |
n/a |
UniProtKB/Swiss Prot |
1-18 |
24-512 |
n/a |
650-670 |
671-1031 |
n/a |
NCBI (NP061214) |
n/a |
56-474 |
514-547 |
n/a |
n/a |
n/a |
此外,SEQ ID NO:12或14中的序列变化、或小鼠或其他动物中的任何其他变体可以基于表2-4得以轻易识别。
丛蛋白-A2
已知丛蛋白-A2多肽和Sema6A多肽结合。Suto等,Neuron 53:535(2007)。全长人类丛蛋白-A2多肽(SEQ ID NO:15)由信号序列、细胞外结构域、跨膜结构域和细胞质结构域组成。所述细胞外结构域包括sema结构域和四个IPT/TIG结构域(即IPT/TIG 1-4)。所述sema结构域是SEQ ID NO:15的氨基酸50-523。IPT/TIG结构域1-4分别是SEQ ID NO:15的氨基酸873-967、967-1053、1056-1155和1158-1251。本领域技术人员应当理解,上面所列的结构域的起始和终止残基可以不同,这取决于所用的计算机建模程序或所用的确定结构域的方法。
全长人类丛蛋白-A2多肽的序列可以变化。丛蛋白-A2多肽变体的一个实例具有1894aa的序列,其在Genbank中具有登录号为NP 079455。并且,本领域已知来自其他动物的丛蛋白-A2序列。例如,本领域已知并报道的小鼠丛蛋白-A2多肽为Genbank中的NP_032908、AAH68155、EDL12938、EDL12937和NP_786926。
丛蛋白-A4
丛蛋白-A4也被认为是Sema6A多肽的受体。Suto等,Neuron 53:535(2007)。全长人类丛蛋白-A4多肽(SEQ ID NO:16)由信号序列、细胞外结构域、跨膜结构域和细胞质结构域组成。所述细胞外结构域包括sema结构域和三个PSI结构域(即:PSI1-3)和四个IPT/TIG结构域(即IPT/TIG 1-4)。所述sema结构域是SEQ ID NO:16的氨基酸24-507。PSI结构域1-3分别是SEQ ID NO:16的氨基酸509-559、655-702和803-856。丛蛋白-A4多肽的IPT/TIG结构域1-4分别是SEQ ID NO:16的氨基酸858-952、954-1037、1040-1139和1142-1230。本领域技术人员应当理解,上面所列的结构域的起始和终止残基可以不同,这取决于所用的计算机建模程序或所用的确定结构域的方法。
全长人类丛蛋白-A4多肽的序列可以变化。例如,报道Genbank中的EAW83796、NP_001099013、EAW83795、AAH28744和EAL24077为丛蛋白-A4的多个变体。此外,还报道了来自其他动物的丛蛋白-A4序列。例如,已知小鼠丛蛋白-A4多肽是Genbank中的NP_786926、BAC56599、EDL13705和EDL13704。
本发明的一些实施方式提供全长或成熟的Sema6A多肽或可溶性Sema6A多肽。具体来说,本发明的可溶性Sema6A多肽包括全长或成熟Sema6A多肽的片段、变体或其衍生物。上述表1-4描述了Sema6A多肽的各种功能结构域。本发明的可溶性Sema6A多肽通常包括多肽的部分或全部细胞外结构域。可溶性Sema6A多肽通常缺少跨膜结构域和/或细胞质结构域。本领域技术人员应当理解,所述Sema6A的整个细胞外结构域在细胞外结构域多肽的C-端或N-端可以包括额外的氨基酸或更少的氨基酸,并可以含有内部缺失。
用于本发明方法的人类Sema6A多肽包括但不限于这样一种Sema6A多肽,其包括、主要由或由和参考氨基酸序列至少60%、70%、80%、85%、90%、95%、99%或100%相同的氨基酸序列组成,其中所述参考氨基酸序列选自由以下组成的组:SEQ ID NO:2的氨基酸56至417;SEQ ID NO:2的氨基酸a至417;SEQ ID NO:2的氨基酸b至417;SEQ ID NO:2的氨基酸1至417;SEQ ID NO:2的氨基酸56至c;SEQ ID NO:2的氨基酸a至c;SEQ ID NO:2的氨基酸b至c;SEQ ID NO:2的氨基酸1至c;SEQ ID NO:6的氨基酸56至c′;SEQ ID NO:6的氨基酸a至c′;SEQ ID NO:6的氨基酸b至c′;SEQ ID NO:6的氨基酸1至c′;SEQ ID NO:2的氨基酸56至d;SEQ ID NO:2的氨基酸a至d;SEQ ID NO:2的氨基酸b至d;SEQ ID NO:2的氨基酸1至d;SEQ ID NO:6的氨基酸56至d′;SEQ ID NO:6的氨基酸a至d′;SEQ ID NO:6的氨基酸b至d′;SEQ ID NO:6的氨基酸1至d′;SEQ ID NO:2的氨基酸56至e;SEQ ID NO:2的氨基酸a至e;SEQ ID NO:2的氨基酸b至e;SEQID NO:2的氨基酸1至e;SEQ ID NO:6的氨基酸56至e′;SEQ IDNO:6的氨基酸a至e′;SEQ ID NO:6的氨基酸b至e′;SEQ ID NO:6的氨基酸1至e′;SEQ ID NO:8的氨基酸56至e″;SEQ ID NO:8的氨基酸a至e″;SEQ ID NO:8的氨基酸b至e″;SEQ ID NO:8的氨基酸1至e″;SEQ ID NO:4的氨基酸56至e″′;SEQ ID NO:4的氨基酸a至e″′;SEQ ID NO:6的氨基酸b至e″′;SEQ ID NO:8的氨基酸1至e″′;SEQ ID NO:2的氨基酸56至f;SEQ ID NO:2的氨基酸a至f;SEQ ID NO:2的氨基酸b至f;SEQ ID NO:2的氨基酸1至f;SEQ ID NO:6的氨基酸56至f;SEQ ID NO:6的氨基酸a至f;SEQ ID NO:6的氨基酸b至f;SEQ ID NO:6的氨基酸1至f;SEQ ID NO:8的氨基酸56至f″;SEQ ID NO:8的氨基酸a至f″;SEQ ID NO:8的氨基酸b至f″;SEQ ID NO:8的氨基酸1至f″;SEQ ID NO:4的氨基酸56至f″′;SEQ ID NO:4的氨基酸a至f″′;SEQ ID NO:4的氨基酸b至f″′;SEQ ID NO:4的氨基酸1至f″′以及所述氨基酸序列中两种或更多种的组合;其中a是24至56之间的任意整数、b是19至21之间的任意整数、c是472至512之间的任意整数、c′是418至453之间的任意整数、d是514至569之间的任意整数、d′是455至510之间的任意整数、e是570至650之间的任意整数、e′是511至591之间的任意整数、e″是570至595之间的任意整数以及e″′是570至667之间的任意整数、f是647至671之间的任意整数、f是588至612之间的任意整数、f″是592至616之间的任意整数以及f″是664至688之间的任意整数。在某些实施方式中,用于本发明方法的所述Sema6A多肽与丛蛋白-A2或丛蛋白-A4多肽结合。
在某些实施方式中,用于本发明方法的人类Sema6A多肽包括这样一种Sema6A多肽,其包括、主要由或由和参考氨基酸序列至少60%、70%、80%、85%、90%、95%、99%或100%相同的氨基酸序列组成,其中所述参考氨基酸序列选自由以下组成的组:SEQID NO:8的氨基酸1至975;SEQ ID NO:2的氨基酸19至417;SEQID NO:2的氨基酸19至472;SEQ ID NO:2的氨基酸19至551;SEQID NO:6的氨基酸19至492;SEQ ID NO:2的氨基酸19至647;SEQID NO:6的氨基酸19至588;SEQ ID NO:8的氨基酸19至592;SEQID NO:4的氨基酸19至664;SEQ ID NO:2的氨基酸56至472;SEQ ID NO:2的氨基酸56至551;SEQ ID NO:6的氨基酸56至492;SEQ ID NO:2的氨基酸56至647;SEQ ID NO:6的氨基酸56至588;SEQ ID NO:8的氨基酸56至592;SEQ ID NO:4的氨基酸56至664;SEQ ID NO:2的氨基酸1至649;[来自R&D的人类Sema6A-Fc]SEQID NO:6的氨基酸1至590;SEQ ID NO:8的氨基酸1至594;SEQID NO:4的氨基酸1至666;SEQ ID NO:2的氨基酸18至703;SEQID NO:6的氨基酸18至644;SEQ ID NO:8的氨基酸18至648;SEQID NO:4的氨基酸18至720;SEQ ID NO:2的氨基酸1至648;SEQID NO:6的氨基酸1至589;SEQ ID NO:8的氨基酸1至593;SEQ1D NO:4的氨基酸1至665以及所述氨基酸序列中两种或更多种的组合。在其它实施方式中,所述Sema6A多肽与丛蛋白-A2或丛蛋白-A4多肽结合。
在另一个实施方式中,用于本发明方法的人类Sema6A多肽包括这样一种Sema6A多肽,其包括、主要由或由和参考氨基酸序列至少60%、70%、80%、85%、90%、95%、99%或100%相同的氨基酸序列组成,其中所述参考氨基酸序列选自由以下组成的组:SEQID NO:2的氨基酸56至417;SEQ ID NO:2的氨基酸55至417;SEQ ID NO:2的氨基酸54至417;SEQ ID NO:2的氨基酸53至417;SEQ ID NO:2的氨基酸52至417;SEQ ID NO:2的氨基酸51至417;SEQ ID NO:2的氨基酸50至417;SEQ ID NO:2的氨基酸49至417;SEQ ID NO:2的氨基酸48至417;SEQ ID NO:2的氨基酸47至417;SEQ ID NO:2的氨基酸46至417;SEQ ID NO:2的氨基酸45至417;SEQ ID NO:2的氨基酸44至417;SEQ ID NO:2的氨基酸43至417;SEQ ID NO:2的氨基酸42至417;SEQ ID NO:2的氨基酸41至417;SEQ ID NO:2的氨基酸40至417;SEQ ID NO:2的氨基酸39至417;SEQ ID NO:2的氨基酸38至417;SEQ ID NO:2的氨基酸37至417;SEQ ID NO:2的氨基酸36至417;SEQ ID NO:2的氨基酸35至417;SEQ ID NO:2的氨基酸34至417;SEQ ID NO:2的氨基酸33至417;SEQ ID NO:2的氨基酸32至417;SEQ ID NO:2的氨基酸31至417;SEQ ID NO:2的氨基酸30至417;SEQ ID NO:2的氨基酸29至417;SEQ ID NO:2的氨基酸28至417;SEQ ID NO:2的氨基酸27至417;SEQ ID NO:2的氨基酸26至417;SEQ ID NO:2的氨基酸25至417;SEQ ID NO:2的氨基酸24至417;SEQ ID NO:2的氨基酸23至417;SEQ ID NO:2的氨基酸22至417;SEQ ID NO:2的氨基酸21至417;SEQ ID NO:2的氨基酸20至417;SEQ ID NO:2的氨基酸19至417;SEQ ID NO:2的氨基酸18至417;SEQ ID NO:2的氨基酸17至417;SEQ ID NO:2的氨基酸16至417;SEQ ID NO:2的氨基酸15至417;SEQ ID NO:2的氨基酸14至417;SEQ ID NO:2的氨基酸13至417;SEQ ID NO:2的氨基酸12至417;SEQ ID NO:2的氨基酸11至417;SEQ ID NO:2的氨基酸10至417;SEQ ID NO:2的氨基酸9至417;SEQ ID NO:2的氨基酸8至417;SEQ ID NO:2的氨基酸7至417;SEQ ID NO:2的氨基酸6至417;SEQ ID NO:2的氨基酸5至417;SEQ ID NO:2的氨基酸4至417;SEQ ID NO:2的氨基酸3至417;SEQ ID NO:2的氨基酸2至417;SEQ ID NO:2的氨基酸1至417;以及所述氨基酸序列中两种或更多种的组合,其中所述Sema6A多肽与丛蛋白-A2多肽结合。
进一步的实施方式包括用于本发明方法的人类Sema6A多肽,该人类Sema6A多肽包括这样一种Sema6A多肽,其包括、主要由或由和参考氨基酸序列至少60%、70%、80%、85%、90%、95%、99%或100%相同的氨基酸序列组成,其中所述参考氨基酸序列选自由以下组成的组:SEQ ID NO:2的氨基酸40至472;SEQ ID NO:2的氨基酸41至472;SEQ ID NO:2的氨基酸42至472;SEQ ID NO:2的氨基酸43至472;SEQ ID NO:2的氨基酸44至472;SEQ ID NO:2的氨基酸45至472;SEQ ID NO:2的氨基酸46至472;SEQ ID NO:2的氨基酸47至472;SEQ ID NO:2的氨基酸48至472;SEQ ID NO:2的氨基酸49至472;SEQ ID NO:2的氨基酸50至472;SEQ ID NO:2的氨基酸51至472;SEQ ID NO:2的氨基酸52至472;SEQ ID NO:2的氨基酸53至472;SEQ ID NO:2的氨基酸54至472;SEQ ID NO:2的氨基酸55至472;SEQ ID NO:2的氨基酸56至472;SEQ ID NO:2的氨基酸57至472;SEQ ID NO:2的氨基酸58至472;SEQ ID NO:2的氨基酸59至472;SEQ ID NO:2的氨基酸60至472;SEQ ID NO:2的氨基酸56至465;SEQ ID NO:2的氨基酸56至466;SEQ ID NO:2的氨基酸56至467;SEQ ID NO:2的氨基酸56至468;SEQ ID NO:2的氨基酸56至469;SEQ ID NO:2的氨基酸56至470;SEQ ID NO:2的氨基酸56至471;SEQ ID NO:2的氨基酸56至472;SEQ ID NO:2的氨基酸56至473;SEQ ID NO:2的氨基酸56至474;SEQ ID NO:2的氨基酸56至475;SEQ ID NO:2的氨基酸56至476;SEQ ID NO:2的氨基酸56至477;SEQ ID NO:2的氨基酸56至478;SEQ ID NO:2的氨基酸56至479;SEQ ID NO:2的氨基酸56至480;以及所述氨基酸序列中两种或更多种的组合。
进一步的实施方式包括用于本发明方法的人类Sema6A多肽,该人类Sema6A多肽包括这样一种Sema6A多肽,其包括、主要由或由和参考氨基酸序列至少60%、70%、80%、85%、90%、95%、99%或100%相同的氨基酸序列组成,其中所述参考氨基酸序列选自由以下组成的组:SEQ ID NO:2的氨基酸1至551;SEQ ID NO:2的氨基酸1至552;SEQ ID NO:2的氨基酸1至553;SEQ ID NO:2的氨基酸1至554;SEQ ID NO:2的氨基酸1至555;SEQ ID NO:2的氨基酸1至556;SEQ ID NO:2的氨基酸1至557;SEQ ID NO:2的氨基酸1至558;SEQ ID NO:2的氨基酸1至559;SEQ ID NO:2的氨基酸1至560;SEQ ID NO:2的氨基酸1至561;SEQ ID NO:2的氨基酸1至562;SEQ ID NO:2的氨基酸1至563;SEQ ID NO:2的氨基酸1至564;SEQ ID NO:2的氨基酸1至565;SEQ ID NO:2的氨基酸1至566;SEQ ID NO:2的氨基酸1至567;SEQ ID NO:2的氨基酸1至568;SEQ ID NO:2的氨基酸1至569;SEQ ID NO:2的氨基酸1至570;SEQ ID NO:2的氨基酸1至571;SEQ ID NO:2的氨基酸1至571;SEQ ID NO:2的氨基酸1至572;SEQ ID NO:2的氨基酸1至573;SEQ ID NO:2的氨基酸1至574;SEQ ID NO:2的氨基酸1至575;SEQ ID NO:2的氨基酸1至576;SEQ ID NO:2的氨基酸1至577;SEQ ID NO:2的氨基酸1至578;SEQ ID NO:2的氨基酸1至579;SEQ ID NO:2的氨基酸1至580;SEQ ID NO:2的氨基酸1至581;SEQ ID NO:2的氨基酸1至582;SEQ ID NO:2的氨基酸1至583;SEQ ID NO:2的氨基酸1至584;SEQ ID NO:2的氨基酸1至585;SEQ ID NO:2的氨基酸1至586;SEQ ID NO:2的氨基酸1至587;SEQ ID NO:2的氨基酸1至588;SEQ ID NO:2的氨基酸1至589;SEQ ID NO:2的氨基酸1至590;SEQ ID NO:2的氨基酸1至591;SEQ ID NO:2的氨基酸1至592;SEQ ID NO:2的氨基酸1至593;SEQ ID NO:2的氨基酸1至594;SEQ ID NO:2的氨基酸1至596;SEQ ID NO:2的氨基酸1至597;SEQ ID NO:2的氨基酸1至598;SEQ ID NO:2的氨基酸1至599;SEQ ID NO:2的氨基酸1至600;以及所述氨基酸序列中两种或更多种的组合。
在其他实施方式中,用于本发明方法的人类Sema6A多肽包括这样一种Sema6A多肽,其包括、主要由或由和参考氨基酸序列至少60%、70%、80%、85%、90%、95%、99%或100%相同的氨基酸序列组成,其中所述参考氨基酸序列选自由以下组成的组:SEQID NO:2的氨基酸1至649;SEQ ID NO:2的氨基酸2至649;SEQ1D NO:2的-649的氨基酸3至649;SEQ ID NO:2的氨基酸4至649;SEQ ID NO:2的氨基酸5至649;SEQ ID NO:2的氨基酸6至649;SEQ ID NO:2的氨基酸7至649;SEQ ID NO:2的氨基酸8至649;SEQ ID NO:2的氨基酸9至649;SEQ ID NO:2的氨基酸10至649;SEQ ID NO:2的氨基酸11至649;SEQ ID NO:2的氨基酸12至649;SEQ ID NO:2的氨基酸13至649;SEQ ID NO:2的氨基酸14至649;SEQ ID NO:2的氨基酸15至649;SEQ ID NO:2的氨基酸16至649;SEQ ID NO:2的氨基酸17至649;SEQ ID NO:2的氨基酸18至649;SEQ ID NO:2的氨基酸19至649;SEQ ID NO:2的氨基酸20至649;SEQ ID NO:2的氨基酸21至649;SEQ ID NO:2的氨基酸22至649;SEQ ID NO:2的氨基酸23至649;SEQ ID NO:2的氨基酸24至649;SEQ ID NO:2的氨基酸25至649;SEQ ID NO:2的氨基酸26至649;以及所述氨基酸序列中两种或更多种的组合。
本发明的方法还包括这样一种Sema6A多肽,其包括、主要由或由和参考氨基酸序列至少60%、70%、80%、85%、90%、95%、99%或100%相同的氨基酸序列组成,其中所述参考氨基酸序列选自由以下组成的组:SEQ ID NO:2的氨基酸1至640;SEQ ID NO:2的氨基酸1至641;SEQ ID NO:2的氨基酸1至642;SEQ ID NO:2的氨基酸1至643;SEQ ID NO:2的氨基酸1至644;SEQ ID NO:2的氨基酸1至645;SEQ ID NO:2的氨基酸1至646;SEQ ID NO:2的氨基酸1至647;SEQ ID NO:2的氨基酸1至648;SEQ ID NO:2的氨基酸1至649;SEQ ID NO:2的氨基酸1至650;SEQ ID NO:2的氨基酸1至651;SEQ ID NO:2的氨基酸1至652;SEQ ID NO:2的氨基酸1至653;SEQ ID NO:2的氨基酸1至654;SEQ ID NO:2的氨基酸1至655;SEQ ID NO:2的氨基酸1至656;SEQ ID NO:2的氨基酸1至657;SEQ ID NO:2的氨基酸1至658;SEQ ID NO:2的氨基酸1至659;SEQ ID NO:2的氨基酸1至660;SEQ ID NO:2的氨基酸1至661;SEQ ID NO:2的氨基酸1至662;SEQ ID NO:2的氨基酸1至663;SEQ ID NO:2的氨基酸1至664;SEQ ID NO:2的氨基酸1至665;SEQ ID NO:2的氨基酸1至666;SEQ ID NO:2的氨基酸1至667;SEQ ID NO:2的氨基酸1至668;SEQ ID NO:2的氨基酸1至669;SEQ ID NO:2的氨基酸1至670;以及所述氨基酸序列中两种或更多种的组合。
本发明的方法还包括这样一种Sema6A多肽,其包括、主要由或由和参考氨基酸序列至少60%、70%、80%、85%、90%、95%、99%或100%相同的氨基酸序列组成,其中所述参考氨基酸序列选自由以下组成的组:SEQ ID NO:4的氨基酸1至570;SEQ ID NO:4的氨基酸1至571;SEQ ID NO:4的氨基酸1至572;SEQ ID NO:4的氨基酸1至573;SEQ ID NO:4的氨基酸1至574;SEQ ID NO:4的氨基酸1至575;SEQ ID NO:4的氨基酸1至576;SEQ ID NO:4的氨基酸1至577;SEQ ID NO:4的氨基酸1至578;SEQ ID NO:4的氨基酸1至579;SEQ ID NO:4的氨基酸1至580;SEQ ID NO:4的氨基酸1至581;SEQ ID NO:4的氨基酸1至582;SEQ ID NO:4的氨基酸1至583;SEQ ID NO:4的氨基酸1至584;SEQ ID NO:4的氨基酸1至585;SEQ ID NO:4的氨基酸1至586;SEQ ID NO:4的氨基酸1至587;SEQ ID NO:4的氨基酸1至588;SEQ ID NO:4的氨基酸1至589;SEQ ID NO:4的氨基酸1至590;以及所述氨基酸序列中两种或更多种的组合。
本发明的方法还包括这样一种Sema6A多肽,其包括、主要由或由和参考氨基酸序列至少60%、70%、80%、85%、90%、95%、99%或100%相同的氨基酸序列组成,其中所述参考氨基酸序列选自由以下组成的组:SEQ ID NO:4的氨基酸1至630;SEQ ID NO:4的氨基酸1至631;SEQ ID NO:4的氨基酸1至632;SEQ ID NO:4的氨基酸1至633;SEQ ID NO:4的氨基酸1至634;SEQ ID NO:4的氨基酸1至635;SEQ ID NO:4的氨基酸1至636;SEQ ID NO:4的氨基酸1至637;SEQ ID NO:4的氨基酸1至638;SEQ ID NO:4的氨基酸1至639;SEQ ID NO:4的氨基酸1至640;SEQ ID NO:4的氨基酸1至641;SEQ ID NO:4的氨基酸1至642;SEQ ID NO:4的氨基酸1至643;SEQ ID NO:4的氨基酸1至644;SEQ ID NO:4的氨基酸1至645;SEQ ID NO:4的氨基酸1至646;SEQ ID NO:4的氨基酸1至647;SEQ ID NO:4的氨基酸1至648;SEQ ID NO:4的氨基酸1至649;SEQ ID NO:4的氨基酸1至650;SEQ ID NO:4的氨基酸1至651;SEQ ID NO:4的氨基酸1至652;SEQ ID NO:4的氨基酸1至653;SEQ ID NO:4的氨基酸1至654;SEQ ID NO:4的氨基酸1至655;SEQ ID NO:4的氨基酸1至656;SEQ ID NO:4的氨基酸1至657;SEQ ID NO:4的氨基酸1至658;SEQ ID NO:4的氨基酸1至659;SEQ ID NO:4的氨基酸1至660;SEQ ID NO:4的氨基酸1至661;SEQ ID NO:4的氨基酸1至662;SEQ ID NO:4的氨基酸1至663;SEQ ID NO:4的氨基酸1至664;SEQ ID NO:4的氨基酸1至665;SEQ ID NO:4的氨基酸1至666;以及所述氨基酸序列中两种或更多种的组合。
本发明的方法还包括这样一种Sema6A多肽,其包括、主要由或由和参考氨基酸序列至少60%、70%、80%、85%、90%、95%、99%或100%相同的氨基酸序列组成,其中所述参考氨基酸序列选自由以下组成的组:选自SEQ ID NO:6的氨基酸45至492;SEQ IDNO:6的氨基酸46至492;SEQ ID NO:6的氨基酸47至492;SEQID NO:6的氨基酸48至492;SEQ ID NO:6的氨基酸49至492;SEQ ID NO:6的氨基酸50至492;SEQ ID NO:6的氨基酸51至492;SEQ ID NO:6的氨基酸52至492;SEQ ID NO:6的氨基酸53至492;SEQ ID NO:6的氨基酸54至492;SEQ ID NO:6的氨基酸55至492;SEQ ID NO:6的氨基酸56至492;SEQ ID NO:6的氨基酸57至492;SEQ ID NO:6的氨基酸58至492;SEQ ID NO:6的氨基酸59至492;SEQ ID NO:6的氨基酸60至492;SEQ ID NO:6的氨基酸61至492;SEQ ID NO:6的氨基酸56至485;SEQ ID NO:6的氨基酸56至486;SEQ ID NO:6的氨基酸56至487;SEQ ID NO:6的氨基酸56至488;SEQ ID NO:6的氨基酸56至489;SEQ ID NO:6的氨基酸56至490;SEQ ID NO:6的氨基酸56至491;SEQ ID NO:6的氨基酸56至492;SEQ ID NO:6的氨基酸56至493;SEQ ID NO:6的氨基酸56至494;SEQ ID NO:6的氨基酸56至495;SEQ ID NO:6的氨基酸56至496;SEQ ID NO:6的氨基酸56至497;SEQ ID NO:6的氨基酸56至498;SEQ ID NO:6的氨基酸56至599;以及所述氨基酸序列中两种或更多种的组合。
本发明的方法还包括这样一种Sema6A多肽,其包括、主要由或由和参考氨基酸序列至少60%、70%、80%、85%、90%、95%、99%或100%相同的氨基酸序列组成,其中所述参考氨基酸序列选自由以下组成的组:SEQ ID NO:6的氨基酸1至580;SEQ ID NO:6的氨基酸1至581;SEQ ID NO:6的氨基酸1至583;SEQ ID NO:6的氨基酸1至584;SEQ ID NO:6的氨基酸1至585;SEQ ID NO:6的氨基酸1至586;SEQ ID NO:6的氨基酸1至587;SEQ ID NO:6的氨基酸1至588;SEQ ID NO:6的氨基酸1至589;SEQ ID NO:6的氨基酸1至590;SEQ ID NO:6的氨基酸1至591;SEQ ID NO:6的氨基酸1至592;SEQ ID NO:6的氨基酸1至593;SEQ ID NO:6的氨基酸1至594;SEQ ID NO:6的氨基酸1至595;SEQ ID NO:6的氨基酸1至596;SEQ ID NO:6的氨基酸1至597;SEQ ID NO:6的氨基酸1至598;SEQ ID NO:6的氨基酸1至599;SEQ ID NO:6的氨基酸1至600;SEQ ID NO:6的氨基酸2至590;SEQ ID NO:6的氨基酸3至590;SEQ ID NO:6的氨基酸4至590;SEQ ID NO:6的氨基酸5至590;SEQ ID NO:6的氨基酸6至590;SEQ ID NO:6的氨基酸7至590;SEQ ID NO:6的氨基酸8至590;SEQ ID NO:6的氨基酸9至590;SEQ ID NO:6的氨基酸10至590;SEQ ID NO:6的氨基酸11至590;SEQ ID NO:6的氨基酸12至590;SEQ ID NO:6的氨基酸13至590;SEQ ID NO:6的氨基酸14至590;SEQ ID NO:6的氨基酸15至590;SEQ ID NO:6的氨基酸16至590;SEQ ID NO:6的氨基酸17至590;SEQ ID NO:6的氨基酸18至590;SEQ ID NO:6的氨基酸19至590;以及所述氨基酸序列中两种或更多种的组合。
本发明的方法还包括这样一种Sema6A多肽,其包括、主要由或由和参考氨基酸序列至少60%、70%、80%、85%、90%、95%、99%或100%相同的氨基酸序列组成,其中所述参考氨基酸序列选自由以下组成的组:SEQ ID NO:8的氨基酸56至580;SEQ ID NO:8的氨基酸56至581;SEQ ID NO:8的氨基酸56至583;SEQ ID NO:8的氨基酸56至584;SEQ ID NO:8的氨基酸56至585;SEQ ID NO:8的氨基酸56至586;SEQ ID NO:8的氨基酸56至587;SEQ ID NO:8的氨基酸56至588;SEQ ID NO:8的氨基酸56至589;SEQ ID NO:8的氨基酸56至590;SEQ ID NO:8的氨基酸56至591;SEQ ID NO:8的氨基酸56至592;SEQ ID NO:8的氨基酸56至593;SEQ ID NO:8的氨基酸56至594;SEQ ID NO:8的氨基酸56至595;SEQ ID NO:8的氨基酸56至596;SEQ ID NO:8的氨基酸56至597;SEQ ID NO:8的氨基酸56至598;SEQ ID NO:8的氨基酸56至599;SEQ ID NO:8的氨基酸56至600;SEQ ID NO:8的氨基酸56至601;SEQ ID NO:8的氨基酸56至602;SEQ ID NO:8的氨基酸56至603;SEQ ID NO:8的氨基酸56至604;SEQ ID NO:8的氨基酸56至605;SEQ ID NO:8的氨基酸45至595;SEQ ID NO:8的氨基酸46至595;SEQ ID NO:8的氨基酸47至595;SEQ ID NO:8的氨基酸48至595;SEQ ID NO:8的氨基酸49至595;SEQ ID NO:8的氨基酸50至595;SEQ ID NO:8的氨基酸51至595;SEQ ID NO:8的氨基酸52至595;SEQ ID NO:8的氨基酸53至595;SEQ ID NO:8的氨基酸54至595;SEQ ID NO:8的氨基酸55至595;以及所述氨基酸序列中两种或更多种的组合。
本发明的方法还包括这样一种Sema6A多肽,其包括、主要由或由和参考氨基酸序列至少60%、70%、80%、85%、90%、95%、99%或100%相同的氨基酸序列组成,其中所述参考氨基酸序列选自由以下组成的组:SEQ ID NO:8的氨基酸1至580;SEQ ID NO:8的氨基酸1至581;SEQ ID NO:8的氨基酸1至583;SEQ ID NO:8的氨基酸1至584;SEQ ID NO:8的氨基酸1至585;SEQ ID NO:8的氨基酸1至586;SEQ ID NO:8的氨基酸1至587;SEQ ID NO:8的氨基酸1至588;SEQ ID NO:8的氨基酸1至589;SEQ ID NO:8的氨基酸1至590;SEQ ID NO:8的氨基酸1至591;SEQ ID NO:8的氨基酸1至592;SEQ ID NO:8的氨基酸1至593;SEQ ID NO:8的氨基酸1至594;SEQ ID NO:8的氨基酸1至595;SEQ ID NO:8的氨基酸1至596;SEQ ID NO:8的氨基酸1至597;SEQ ID NO:8的氨基酸1至598;SEQ ID NO:8的氨基酸1至599;SEQ ID NO:8的氨基酸1至600;SEQ ID NO:8的氨基酸1至601;SEQ ID NO:8的氨基酸1至602;SEQ ID NO:8的氨基酸1至603;SEQ ID NO:8的氨基酸1至604;SEQ ID NO:8的氨基酸1至605;SEQ ID NO:8的氨基酸2至595;SEQ ID NO:8的氨基酸3至595;SEQ ID NO:8的氨基酸4至595;SEQ ID NO:8的氨基酸5至595;SEQ ID NO:8的氨基酸6至595;SEQ ID NO:8的氨基酸7至595;SEQ ID NO:8的氨基酸8至595;SEQ ID NO:8的氨基酸9至595;SEQ ID NO:8的氨基酸10至595;SEQ ID NO:8的氨基酸11至595;SEQ ID NO:8的氨基酸12至595;SEQ ID NO:8的氨基酸13至595;SEQ ID NO:8的氨基酸14至595;SEQ ID NO:8的氨基酸15至595;SEQ ID NO:8的氨基酸16至595;SEQ ID NO:8的氨基酸17至595;SEQ ID NO:8的氨基酸18至595;SEQ ID NO:8的氨基酸19至595;以及所述氨基酸序列中两种或更多种的组合。
在某些实施方式中,本发明的所述Sema6A多肽结合至丛蛋白-A亚家族多肽。例如,所述Sema6A多肽和丛蛋白-A1多肽、丛蛋白-A2多肽、丛蛋白-A3多肽或丛蛋白-A4多肽结合。在其它实施方式中,所述Sema6A多肽可为分离的。
通过“参考氨基酸序列”来表示,所述的具体序列没有引入任何氨基酸取代。本领域技术人员应当理解,如果没有取代,本发明的所述“分离的多肽”包括和参考氨基酸序列相同的氨基酸序列。
本文描述的Sema6A多肽可以具有各种变化,如取代、插入或缺失。在所述多肽中可以被取代的示例性氨基酸包括具有碱性侧链(如赖氨酸、精氨酸、组氨酸)、酸性侧链(如天冬氨酸、谷氨酸)、不带电荷的极性侧链(如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(如,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、-分支侧链(例如,苏氨酸、缬氨酸、异亮氨酸)和芳香侧链(如酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。
也可以预期和本文所述的多肽和参考多肽有至少70%、75%、80%、85%、90%或95%相同的相应Sema6A多肽片段。
如本领域所公知的,通过将一条多肽的氨基酸序列和第二条多肽的序列进行比较来确定两条多肽之间的“序列同一性”。当本文讨论时,任何具体多肽和另一条多肽是否至少有约70%、75%、80%、85%、90%、95%、99%或100%相同,都可以使用本领域公知的方法和计算机程序/软件来确定,例如但不限于BESTFIT程序(Wisconsin序列分析软件包,针对Unix的版本8,GeneticsComputer Group(遗传学计算机集团),University Research Park(大学研究园),575Science Drive,Madison,WI 53711)。BESTFIT采用Smith和Waterman的局部同源算法,参见Advances in AppliedMathematics 2:482-489(1981),来寻找两条序列间的最佳同源区段。当使用BESTFIT或任何其他序列比对程序来确定特定序列是否和根据本发明的参考序列例如,有95%相同时,自然地设定参数从而计算出相对于参考多肽序列全长的同一性百分比,并且允许同源性缺口达参考序列中氨基酸总数的5%。
在本发明的方法中,可以将本发明的Sema6A多肽或多肽片段以预先形成的多肽直接施用。如本文别处讨论的,Sema6A多肽也可以作为被细胞吸收并在细胞中表达的多聚核苷酸来施用。例如,Sema6A编码多聚核苷酸可以作为病毒载体来施用。
使用Sema6A多肽的治疗方法
本发明的一个实施方式提供用于在患有髓鞘形成障碍或脱髓鞘相关的疾病、病症或损伤(如多发性硬化)的动物中治疗这种疾病的方法,所述方法包括、主要由、或由向所述动物施用有效量的Sema6A多肽或其片段、可溶性Sema6A多肽或其变体、衍生物或类似物组成。
此外,本发明涉及一种在哺乳动物中促进神经元髓鞘形成的方法,其包括、主要由或由施用治疗有效量的Sema6A多肽或其片段、可溶性Sema6A多肽或其变体、衍生物或类似物组成。
本发明的另外实施方式提供在患有少突胶质细胞死亡或缺少分化相关的疾病、病症或损伤(如多发性硬化、佩-梅病或球样细胞脑白质病(克拉伯氏病))的动物中治疗这种疾病的方法,所述方法包括、主要由、或由向所述动物施用有效量的Sema6A多肽或其片段、可溶性Sema6A多肽和其变体、衍生物或类似物组成。
本发明的另一方面包括在哺乳动物中促进少突胶质细胞增殖、分化和存活的方法,其包括、主要由、或由施用治疗有效量的Sema6A多肽或其片段、可溶性Sema6A多肽和其变体、衍生物或类似物组成。
本发明涉及用于促进少突胶质细胞增殖、分化或存活的方法,其包括用有效量的含有Sema6A多肽的组合物接触少突胶质细胞。本发明还涉及用于促进少突胶质细胞-介导的神经元髓鞘形成的方法,其包括用有效量的含有分离的Sema6A多肽的组合物接触神经元和少突胶质细胞的混合物。
本文公开的治疗方法中待用的Sema6A多肽可以经制备并用作诱导、促进、激活或刺激Sema6A通过少突胶质细胞调节神经元髓鞘形成的能力的治疗剂。此外,本文公开的治疗方法中待用的所述Sema6A多肽可以经制备并用作诱导、促进、激活或刺激Sema6A调节少突胶质细胞分化、增殖和存活的能力的治疗剂。
本发明的其他实施方式包括诱导少突胶质细胞增殖或存活来治疗涉及少突胶质细胞或髓鞘破坏的疾病、病症或损伤的方法,其包括以足以降低轴突延伸抑制并促进髓鞘形成的量在疾病、病症或损伤位点或附近向哺乳动物施用。
在另一个实施方式中,本发明涉及用于在哺乳动物中促进少突胶质细胞增殖、分化或存活的方法,其包括向有此需求的哺乳动物施用有效量的含有分离的多聚核苷酸的组合物,所述的多聚核苷酸编码本文公开的Sema6A多肽;或涉及用于在哺乳动物中促进神经元髓鞘形成的方法,其包括向有此需求的哺乳动物施用有效量的含有分离的多聚核苷酸的组合物,其中所述的多聚核苷酸编码本文公开的Sema6A多肽。
本发明还包括用于在哺乳动物中治疗髓鞘破坏或髓鞘形成障碍或脱髓鞘相关的疾病、病症或损伤、或少突胶质细胞死亡或缺少分化相关的疾病、病症或损伤的方法,其包括向有此需求的哺乳动物施用治疗有效量的含有分离的多聚核苷酸的组合物,所述的多聚核苷酸编码Sema6A多肽。
在本发明的方法中,可以通过向患者直接施用Sema6A多肽来施用Sema6A多肽。可选择地,可以通过产生特定Sema6A多肽的表达载体来施用所述Sema6A多肽。在本发明某些实施方式中,Sema6A多肽施用于包括如下的治疗方法中:(1)用表达Sema6A多肽的核酸(如载体)转化或转染可植入的宿主细胞;和(2)在疾病、病症或损伤位点将所转化的宿主细胞植入哺乳动物。例如,所转化的宿主细胞可植入于MS慢性病变位点处。在本发明的一些实施方式中,所述可植入的宿主细胞从哺乳动物中取出,经过用编码Sema6A多肽的分离的核酸短时培养、转化或转染,并植回其所取自的同一哺乳动物中。所述细胞可以,但并不需要从其植入的相同位点处取出。这种实施方式有时被称为离体(ex vivo)基因治疗,其可以在有限的一段时间内提供定位在作用位点的所述Sema6A多肽的持续供应。
可以通过本发明的方法得到治疗或改善的疾病或病症包括涉及哺乳动物神经元髓鞘形成障碍或脱髓鞘的疾病、病症或损伤。尤其是,其中神经元周围的髓鞘缺失、不完整、未正确形成或恶化的疾病和病症。这种疾病包括但不限于多发性硬化(MS)(包括复发-缓解型、继发进展型和原发进展型MS);进行性多灶性白质脑病(PML)、脑脊髓炎(EPL)、脑桥中央髓鞘溶解症(CPM)、肾上腺脑白质营养不良、亚历山大病、佩-梅病(PMZ)、球样细胞脑白质病(克拉伯氏病)、沃勒变性、视神经炎、横贯性脊髓炎。
可以通过本发明的方法得到治疗或改善的疾病或病症包括神经退行性疾病或病症。这种疾病包括但不限于肌萎缩侧索硬化、亨廷顿病、阿尔茨海默病和帕金森病。
可以通过本发明的方法得到治疗或改善的其他疾病、病症或损伤的实例包括但不限于脊髓损伤、慢性脊髓病或神经根病(rediculopathy)、创伤性脑损伤、运动神经元疾病、轴突剪切(axonalshearing)、挫伤、瘫痪、辐射后损伤或化疗的其他神经系统并发症、中风、大的腔隙、中度至大的血管闭塞、脑白质疏松症(leukoariaosis)、急性缺血性视神经病变、维生素E缺乏(孤立性维生素E缺乏综合征、AR、巴-科综合征)、维生素B12、B6(吡哆醇-糙皮病)、维生素B1、叶酸、烟酸缺乏、胼胝体脱髓鞘性脑病综合征、异染性脑白质营养不良、三叉神经痛、贝尔麻痹或需要轴突再生、髓鞘再生(remylination)或少突胶质细胞存活或分化/增殖的任何神经损伤。
融合蛋白和轭合多肽
本发明的一些实施方式涉及使用融合至异源多肽部分的Sema6A多肽来形成融合蛋白。这种融合蛋白可用于实现多种目的,如延长血清半衰期、改善生物利用度、体内靶向特定器官或组织类型、改善重组表达效率、改善宿主细胞分泌、简化纯化以及更高的亲和力。所述异源部分可以是惰性的或生物活性的,这取决于要达到的目的。并且,可以选择将其稳定融合至本发明所述的Sema6A多肽部分或者是在体外或体内可切除的。实现这些其他目的的异源部分在本领域是公知的。
作为表达融合蛋白的可选方法,所选择的异源部分可以预先形成并化学轭合至本发明的Sema6A多肽部分。在大多数情况下,无论是融合还是轭合至所述Sema6A多肽部分,所选择的异源部分作用相似。因此,在如下异源氨基酸序列的讨论中,除非另有指明,应当理解,所述异源序列可以以融合蛋白的形式或者作为轭合至多肽或其他组合物的化学轭合物(包括共价或非共价轭合)而连接所述Sema6A多肽部分。例如,可以将Sema6A多肽重组融合或轭合至检测分析中用作标记物的分子和效应分子(如异源多肽、药物、放射性核素或毒素)。参见,如PCT公布WO 92/08495;WO91/14438;WO 89/12624;美国专利第5,314,995号;以及EP 396,387。
用于本文公开的治疗方法中的Sema6A多肽包括修饰的衍生物,即:通过共价连接任何类型的分子,以使共价连接不阻止所述Sema6A多肽抑制Sema6A的生物功能。例如,但不限于,本发明的所述Sema6A多肽可以通过进行例如糖基化、乙酰化、聚乙二醇化、phosphylation、磷酸化、酰胺化、以公知的保护/封闭基团衍生化、蛋白水解切割、连接至细胞配体或其他蛋白质等而得以修饰。可以通过公知技术(包括但不限于特定的化学切割、乙酰化、甲酰化、衣霉素的代谢合成等)进行任何多种化学修饰。此外,衍生物可包含一个或多个非经典氨基酸。
用于本文公开的治疗方法中的Sema6A多肽可以主要由彼此通过肽键或修饰肽键(即肽电子等排体)连接的氨基酸组成,并且可以含有除了20个基因编码的氨基酸以外的氨基酸。可以通过天然过程(如翻译后加工)、或通过本领域公知的化学修饰技术来修饰Sema6A多肽。这些修饰在基础教科书和更具体的专著当中,以及大量研究文献中均有详细描述。可以在Sema6A多肽中的任何位置发生修饰,包括肽骨架、氨基酸侧链以及氨基或羧基端、或在例如碳水化合物的部分。应当理解,在给定Sema6A多肽的多个位点中以相同或不同程度可出现相同类型的修饰。而且,给定Sema6A多肽可含有很多类型的修饰。Sema6A多肽可以是分支的(如泛素化造成的),其可以是有或没有分支的环形。环形、分支以及带分支的环形Sema6A多肽可是翻译后天然加工的结果或合成方法造成。修饰包括乙酰化、酰化、ADP-核糖化、酰胺化、黄素的共价连接、血红素部分的共价连接、核苷酸或核苷酸衍生物的共价连接、脂质或脂质衍生物的共价连接、磷脂酰肌醇的共价连接、交联、环化、形成二硫键、去甲基化、形成共价交联、形成半胱氨酸、形成焦谷氨酸、甲酰化、γ-羧化、糖基化、形成GPI锚、羟基化、碘化、甲基化、豆蔻酰化、氧化、聚乙二醇化、蛋白水解加工、磷酸化、异戊二烯化、消旋化、硒化、硫酸化、转移-RNA介导的蛋白质中氨基酸的添加(如精氨酰化)和泛素化。(参见,如,Proteins-StructureAnd Molecular Properties(蛋白质结构和分子特性),T.E.Creighton,W.H.Freeman and Company,New York第二版(1993);Posttranslational Covalent Modification of Proteins(蛋白质的翻译后共价修饰),B.C.Johnson编辑,Academic Press,New York,第1-12页(1983);Seifter等,Meth Enzymol 182:626-646(1990);Rattan等,Ann NYAcad Sci 663:48-62(1992)。)
本发明还提供融合蛋白,其包括、主要由、或由Sema6A多肽融合蛋白组成。在某些实施方式中,所述Sema6A融合多肽结合丛蛋白-A2或丛蛋白-A4。在本发明某些实施方式中,Sema6A多肽,如包括Sema结构域和PSI结构域或整个细胞外结构域(对应于SEDID NO:2的氨基酸1至649)的Sema6A多肽融合至异源多肽部分从而形成Sema6A融合多肽。
药理活性多肽可表现出快速的体内清除,必需在体内使用大剂量来达到治疗有效浓度。此外,小于约60kDa的多肽有经受肾小球过滤的潜在可能,有时会导致肾毒性。多肽片段的融合或轭合可以用来减少或避免这种肾毒性风险。用于增加治疗性多肽的体内稳定性(即血清半衰期)的各种异源氨基酸序列(即多肽部分或“载体”)是公知的。
由于其半衰期长、体内分布广泛、缺少酶或免疫功能,本质上全长人类血清白蛋白(HSA)或HSA片段通常用作异源部分。通过应用方法和材料,如在Yeh等,Proc.Natl.Acad.Sci.USA89:1904-08(1992)和Syed等,Blood 89:3243-52(1997)中教导的那些,HSA可用于形成Sema6A融合多肽,其中所述Sema6A融合多肽通过Sema6A部分表现药理活性并表现出显著增强的体内稳定性,如提高10-倍至100-倍。HSA的C-端可以融合至Sema6A部分的N-端。由于HSA是天然分泌的蛋白质,因此当所述融合蛋白在真核(如哺乳动物)表达系统中产生时,可以利用HSA信号序列以获得使Sema6A融合蛋白分泌到细胞培养基中。
信号序列是编码氨基酸序列的多聚核苷酸,其中所述氨基酸序列启动蛋白质穿过内质网膜的运输。用于构建免疫融合蛋白(immunofusion)的信号序列包括抗体轻链信号序列(如抗体14.18)(Gillies等,J.Immunol. Meth.125:191-202(1989))、以及抗体重链信号序列(如MOPC141抗体重链信号序列)(Sakano等,Nature286:5774(1980))。可选择地,可以使用其他信号序列。参见,如Watson,Nucl.Acids Res.12:5145(1984)。信号肽通常在内质网腔中被信号肽酶所裂解。这导致含有Fc区和Sema6A部分的免疫融合蛋白(immunofusin)的分泌。
在一些实施方式中,DNA序列可编码在分泌盒和Sema6A多肽之间的蛋白水解切割位点。这种切割位点可以提供例如编码的融合蛋白的蛋白水解切割,从而分离Fc结构域和靶蛋白。可用的蛋白水解切割位点包括蛋白水解酶(如胰蛋白酶、血纤维蛋白溶酶、凝血酶、Xa因子或肠激酶K)所识别的氨基酸序列。
分泌盒可以并入可复制的表达载体。可用的载体包括线性核酸、质粒、噬菌粒、粘粒及类似物。一种示例性的表达载体是pdC,其中免疫融合蛋白DNA的转录置于人类巨细胞病毒增强子和启动子的控制下。参见,如Lo等,Biochim.Biophys.Acta 1088:712(1991)和Lo等,Protein Engineering 11:495-500(1998)。合适的宿主细胞可用编码Sema6A多肽的DNA转化或转染,并用于表达和分泌所述Sema6A多肽。通常所用的宿主细胞包括永生杂交瘤细胞、骨髓瘤细胞、293细胞、中国仓鼠卵巢(CHO)细胞、Hela细胞和COS细胞。
在一个实施方式中,将Sema6A多肽融合至铰链和Fc区,即Ig重链恒定区的C-端部分。Sema6A-Fc融合蛋白的潜在优势包括可溶性、体内稳定性和多价性(如,二聚化)。所用的Fc区可以是IgA、IgD或IgG的Fc区(铰链-CH2-CH3)。可选择地,其可以是IgE或IgM的Fc区(铰链-CH2-CH3-CH4)。通常使用IgG的Fc区,如IgG1的Fc区或IgG4的Fc区。在一个实施方式中,将起始于木瓜蛋白酶切割位点(化学上界定了IgG的Fc,即:残基216,根据Kabat系统将重链恒定区的第一个残基作为114)正上游的铰链区、或其他免疫球蛋白的类似位点的序列用于融合。融合所发生的精确位点并不重要;为了优化分子的生物活性、分泌或结合特征,具体的位点是公知的并且是可以选择的。用于构建和表达Fc融合蛋白编码DNA的材料和方法在本领域是公知的并且可以用于获得Sema6A融合蛋白而不需要过度的实验。本发明的一些实施方式中采用了如在Capon等,美国专利第5,428,130和5,565,335号中所描述的那些融合蛋白。
十分完整的、野生型Fc区将显示效应子功能,这在本发明方法所用的Fc融合蛋白中可能是不必要且不希望的。因此,在构建分泌盒时通常会从Fc区缺失某些结合位点。例如,由于和轻链的共表达是不必要的,因此从IgE的Fc区CH2结构域中缺失重链结合蛋白Bip的结合位点(Hendershot 等,Immunol.Today 8:111-14(1987)),从而该位点不干扰免疫融合蛋白的有效分泌。跨膜结构域序列,如IgM中存在的那些,通常也被缺失。
最常用的是IgG1的Fc区。可选择地,在分泌盒中可以使用免疫球蛋白γ其他亚类(γ-2、γ-3和γ-4)的Fc区。免疫球蛋白γ-1的IgG1Fc区通常用于分泌盒中,并包括至少部分铰链区、CH2区和CH3区。在一些实施方式中,免疫球蛋白γ-1的Fc区是缺失了CH2的Fc,其包括部分铰链区和CH3区,但没有CH2区。Gillies等,Hum. Antibod. Hybridomas 1:47(1990)已描述了缺失了CH2的Fc。在一些实施方式中,使用了IgA、IgD、IgE或IgM之一的Fc区。
可以以若干不同构型来构建Sema6A-Fc融合蛋白。在一个构型中,Sema6A部分的C-端直接融合至Fc铰链部分的N-端。在一个稍有不同的构型中,短的多肽(如2-10个氨基酸)在Sema6A部分的N-端和Fc部分的C-端之间并入到融合蛋白中。这种连接体提供了构象柔性,在一些环境下其可改善生物活性。如果铰链区的充足部分保留在Fc部分中,则Sema6A-Fc的融合将二聚化,从而形成二价分子。单体Fc融合蛋白的同源群将产生单特异性的二价二聚体。各自具有不同特异性的两种单体Fc融合蛋白的混合物将产生双特异性二价二聚体。
含有相应氨基-反应基团和硫醇-反应基团的多种交联剂(cross-linker)中的任意一种,可用来将Sema6A多肽连接至血清白蛋白或其他异源多肽。合适的交联剂的实例包括插入硫醇-反应性马来酰亚胺的胺反应交联剂,如SMCC、AMAS、BMPS、MBS、EMCS、SMPB、SMPH、KMUS和GMBS。其他合适的交联剂如SBAP、SIA、SIAB插入硫醇-反应性卤乙酸酯基团。为使用氢硫基的反应提供保护的或未保护的硫醇以产生可还原的键合的交联剂包括SPDP、SMPT、SATA和SATP。这种试剂可商业获得(如PierceChemicals)。
轭合并非必须涉及Sema6A多肽的N-端或血清白蛋白上的硫醇部分。例如,可以使用遗传工程技术来获得Sema6A-白蛋白融合蛋白,其中所述Sema6A部分在其N-端、C-端或两端融合至血清白蛋白的基因。
Sema6A多肽可以融合至异源肽从而便于所述Sema6A部分的纯化或鉴定。例如,可以将组氨酸标签融合至Sema6A多肽,从而便于使用商业上可获得的色谱介质进行纯化。
在本发明的一些实施方式中,使用Sema6A融合构建体在细菌中增强Sema6A部分的产生。在这种构建体中,使用高水平正常表达和/或分泌的细菌蛋白作为Sema6A多肽N-端的融合配偶体。参见,如Smith等,Gene 67:31(1988);Hopp等,Biotechnology 6:1204(1988);La Vallie等,Biotechnology 11:187(1993)。
通过在合适的融合配偶体的氨基和羧基端融合Sema6A部分,可以获得Sema6A多肽的二价或四价形式。例如,Sema6A部分可以融合至Ig部分的氨基和羧基端来产生含有两个Sema6A部分的二价单体多肽。两个这种单体通过Ig部分二聚化时,获得Sema6A蛋白的四价形式。这种多价形式可以用于实现增强对靶的结合亲和力。也可以通过串联放置Sema6A部分形成多联体(concatamer)来获得Sema6A的多价形式,其可单独使用或融合至融合配偶体(如Ig或HSA)来使用。
在某些实施方式中,用于本发明方法的Sema6A多肽还包括靶向部分。靶向部分包括蛋白质或肽,其指导向身体特定部分的定位,例如,定位至脑或其区室。在某些实施方式中,用于本发明方法的Sema6A多肽连接至或融合至脑靶向部分。所述脑靶向部分是共价连接的(如,直接地、翻译融合或通过直接的或通过间隔区分子的化学键合(可为任选地可裂解的))或非共价连接的(如,通过可逆的相互作用,如抗生物素蛋白、生物素、蛋白A、IgG等)。在其他实施方式中,用于本发明方法的所述Sema6A多肽连接至一个或多个脑靶向部分。在其它实施方式中,所述脑靶向部分连接至多个用于本发明方法的Sema6A多肽。
和Sema6A多肽相缔合的脑靶向部分增强这种Sema6A多肽的脑递送。已经描述了多种当融合至蛋白质或治疗剂时,递送所述蛋白质或治疗剂通过血脑屏障(BBB)的多肽。非限定性实例包括单结构域抗体FC5(Abulrob等,J. Neurochem.95,1201-1214(2005));mAB 83-14,一种针对人类胰岛素受体的单克隆抗体(Pardridge等,Pharmacol.Res.12,807-816(1995));结合人类转铁蛋白受体(hTfR)的B2、B6和B8肽(Xia等,J. Virol.74,11359-11366(2000));针对转铁蛋白受体的OX26单克隆抗体(Pardridge等,J.Pharmacol.Exp.Ther.259,66-70(1991))和美国专利第6,306,365号的SEQ ID NO:1-18。上述参考文献的内容通过引用将其整体并入本文。
通过本领域已完善建立的多种方法,来确定增强的Sema6A组合物的脑递送。例如,向动物施用连接至脑靶向部分的放射活性标记的Sema6A多肽;确定脑定位;和同等放射活性标记的但没有与脑靶向部分缔合的Sema6A多肽的定位相比较。上述参考文献中描述有确定增强靶向的其他方法。
轭合的聚合物(除了多肽)
本发明的一些实施方式涉及Sema6A多肽,其中一个或多个聚合物轭合(共价连接)至所述Sema6A多肽。适于这种轭合的聚合物的实例包括多肽(之前讨论的)、糖聚合物和聚亚烷基二醇链。典型地,但不必需地,出于一个或多个如下目的:改善溶解度、稳定性或生物利用度,将聚合物轭合至所述Sema6A多肽。
通常用于轭合至Sema6A多肽的聚合物类型是聚亚烷基二醇。聚乙二醇(PEG)是最常用的。和单独的Sema6A多肽相比,可以将PEG部分(如1、2、3、4或5个PEG聚合物)轭合至各Sema6A多肽来延长血清半衰期。PEG部分是非-抗原性的且基本上生物惰性的。用于实践本发明的PEG部分可以是分支的或不分支的。
连接至所述Sema6A多肽的PEG部分的数目,以及各PEG链的分子量可以不同。通常,聚合物的分子量越高,连接至多肽的聚合物链越少。通常,连接至所述Sema6A多肽的总聚合物质量从20kDa至40kDa。因此,如果连接了一条聚合物链,该链的分子量通常是20-40kDa。如果连接了两条链,各链的分子量通常是10-20kDa。如果连接了三条链,分子量通常是7-14kDa。
聚合物,如PEG,可以通过多肽上任何合适的暴露的反应基团连接至所述Sema6A多肽。所述暴露的反应基团可以是,如内部赖氨酸残基的N-端氨基或氨基、或两者都是。活化的聚合物可以在所述Sema6A多肽上任意自由氨基处发生反应和共价连接。所述Sema6A多肽的自由羧基、适当活化的羰基、羟基、胍基、咪唑、氧化的碳水化合物部分和巯基(如果可用的话)也可用作聚合物连接的反应基团。
在轭合反应中,典型情况下使用约1.0至约10摩尔活化的聚合物每摩尔多肽,这取决于多肽的浓度。通常,所选的比例代表了将反应最大化并将副反应(通常是非特异性的)最小化间的平衡,所述副反应可以削弱所述Sema6A多肽的期望药理学活性。优选地,保留Sema6A多肽生物活性的至少50%(正如本文描述的或本领域公知的任何分析中所证明的),最优选保留几乎100%。
可以使用常规化学将聚合物轭合至所述Sema6A多肽。例如,聚亚烷基二醇部分可以偶联至所述Sema6A多肽的赖氨酸氨基。可以用N-羟基琥珀酰亚胺(NHS)活性酯(如PEG琥珀酰亚胺基琥珀酸酯(SS-PEG)和琥珀酰亚胺基丙酸酯(SPA-PEG))进行对赖氨酸侧链的连接。合适的聚亚烷基二醇部分包括,如羧甲基-NHS和正亮氨酸-NHS、SC。这些试剂可商业获得。其他的胺-反应PEG连接体可以取代琥珀酰亚胺基部分。这些包括,如异硫氰酸酯、硝基苯碳酸酯(PNP)、环氧化合物、苯并三唑碳酸酯、SC-PEG、三氟乙基磺酸酯(tresylate)、醛、环氧化物、羰基咪唑和PNP碳酸酯。通常优化条件使反应选择性和程度最大化。这种反应条件的优化在本领域普通技术人员能力范围内。
可以通过本领域公知的任何PEG化反应进行PEG化。参见,如Focus on Growth Factors 3:4-10(1992)以及欧洲专利申请EP 0154 316和EP 0 401 384。可以使用反应性聚乙二醇分子(或类似的反应性水溶性聚合物)通过酰化反应或烷基化反应进行PEG化。
通过酰化的PEG化通常涉及与聚乙二醇活性酯衍生物反应。任何反应性PEG分子可以用于PEG化。常常使用的活化的PEG酯是酯化至N-羟基琥珀酰亚胺(NHS)的PEG。如本文所用,“酰化”包括但不限于如下治疗性蛋白质和水溶性聚合物(如PEG)间键合的类型:酰胺、氨基甲酸酯、聚氨酯及类似类型。参见,如Bioconjugate Chem.5:133-140,1994。通常选择避免温度、溶剂和pH条件破坏或使Sema6A多肽失活的反应参数。
通常,连接的键合是酰胺,并且典型地所得产物中至少95%是单-、二-或三-PEG化的。然而,可以形成具有更高程度PEG化的一些种类,其量取决于所用的特定反应条件。任选地,通过常规纯化方法从混合物中分离纯化的PEG化种类,尤其是未反应的种类,所述纯化方法包括,如透析、盐析、超滤、离子交换色谱、凝胶过滤色谱、疏水交换层析和电泳)。
通过烷基化的PEG化通常涉及在还原剂存在条件下使PEG末端的醛衍生物和Sema6A多肽反应。此外,可以操纵反应条件,使得有利于PEG化基本上只发生在Sema6A多肽的N-端氨基,即单-PEG化蛋白质。无论在单-PEG化还是多-PEG化的情况下,所述PEG基团典型地通过-CH2-NH-基团连接至蛋白质。尤其要提及-CH2-基团,该键合类型称为“烷基”键合。
通过还原性烷基化的衍生化来产生N-端靶向的单-PEG化产物,其利用了可用于衍生化的不同类型伯氨基(赖氨酸相对于N-端)的差别反应性。反应在这样一种pH下进行,即所述pH允许利用赖氨酸残基-氨基和蛋白质N-端氨基之间的pKa差异。通过这种选择性衍生化,使含有反应基团(如醛)的水溶性聚合物对蛋白质的连接得到控制:和聚合物的轭合主要发生在蛋白质的N-端,并且没有发生显著的其他反应基团(如赖氨酸侧链氨基)的修饰。
用于酰化和烷基化方法的聚合物分子选自水溶性聚合物。选定的聚合物典型地经修饰而具有单个反应基团,如用于酰化的活性酯或用于烷基化的醛,从而,如为本发明方法所提供的,聚合程度可得到控制。示例性的反应性PEG醛是聚乙二醇丙醛(其是水稳定性的)或其单C1-C10的烷氧基或芳氧基衍生物(参见,如Harris等,美国专利第5,252,714号)。聚合物可以是分支的或不分支的。对于酰化反应,选定的所述聚合物典型地具有单个反应性酯基。对于还原性烷基化,选定的所述聚合物典型地具有单个反应性醛基。通常,水溶性聚合物将不选自天然存在的糖基残基,因为哺乳动物重组表达系统通常更加方便地产生这些糖基残基。
制备PEG化Sema6A多肽的方法通常包括步骤:(a)在分子变成连接至一个或多个PEG基团的条件下,将Sema6A多肽和聚乙二醇(如PEG的反应性酯或醛衍生物)反应,和(b)获得反应产物。通常,酰化反应的最优反应条件将基于公知参数和期望的结果来确定,具体情况具体分析。例如,更高的PEG对蛋白质的比例,通常导致更高的聚-PEG化产物百分比。
还原性烷基化来生产基本同源的单-聚合物/Sema6A多肽的群体,通常包括步骤:(a)在还原性烷基化条件下,在适于多肽N-端氨基的pen-nit选择性修饰的pH下,将Sema6A蛋白或多肽和反应性PEG分子反应;和(b)获得反应产物。
对于基本同源的单-聚合物/Sema6A多肽的群体,还原性烷基化反应条件是那些允许水溶性聚合物部分选择性连接至多肽N-端的条件。这种反应条件通常提供赖氨酸侧链氨基和N-端氨基之间的pKa差异。对于本发明的目的,pH通常在3-9范围内,典型地3-6。
Sema6A多肽可以包括标签,如蛋白水解后可随即释放的部分。因此,赖氨酸部分可以通过首先和His-标签反应,然后再释放His标签得以选择性修饰,其中所述His-标签使用低分子量连接体(如Traut试剂(Pierce),其既和赖氨酸反应也和N-端反应)进行修饰。然后多肽将含有自由的SH基团,其中SH基团可以用含硫醇-反应首基(如马来酰亚胺基团、乙烯砜基团、卤乙酸酯基团、或自由或保护的SH)的PEG得以选择性修饰。
可以用任何建立PEG连接特异性位点的连接体替换Traut试剂。例如,可以用SPDP、SMPT、SATA或SATP(Pierce)替换Traut试剂。相似的可以使蛋白质和胺-反应连接体反应,并且使所得产物和含有自由SH的PEG反应,其中所述胺-反应连接体插入马来酰亚胺(例如SMCC、AMAS、BMPS、MBS、EMCS、SMPB、SMPH、KMUS或GMBS)、卤乙酸酯基团(SBAP、SIA、SIAB)或乙烯砜基团。
在一些实施方式中,所述聚亚烷基二醇部分偶联至所述Sema6A多肽的半胱氨酸基团。可以使用如马来酰亚胺基团、乙烯砜基团、卤乙酸酯基团或硫醇基团实现偶联。
任选地,所述Sema6A多肽通过不稳定键轭合至聚乙二醇部分。所述不稳定键可以在如生化水解、蛋白水解或氢硫基切割中被切割。例如,所述键可以在体内(生理)条件被切割。
反应可以通过任何合适的用于使生物活性材料和惰性聚合物反应的方法发生,如果反应基团在N-端的氨基的话,通常在约pH5-8,如pH 5、6、7或8。通常过程涉及制备活化的聚合物,随后使蛋白质和活化的聚合物反应以生产适于制剂的蛋白质。
载体
含有Sema6A多肽编码核酸的载体也可用于本发明的方法。载体和表达控制序列(可操作连接至这种核酸)的选择取决于期望的功能特性(如,蛋白质表达)和待转化的宿主细胞。
用于调节可操作连接的编码序列的表达的表达控制元件在本领域是公知的。实例包括但不限于诱导型启动子、组成型启动子、分泌信号和其他调节元件。当使用诱导型启动子时,它是可控的,例如,通过宿主细胞基质中的营养状况变化、或温度变化来控制。
载体可以包括原核复制子,即:具有在细菌宿主细胞中指导自主复制和维持染色体外重组DNA分子的能力的DNA序列。这种复制子在本领域是公知的。此外,包括原核复制子的载体也可包括这样的基因,其表达赋予可检测的标志物(如药物抗性)。细菌药物抗性基因的实例是那些赋予氨苄青霉素或四环素抗性的基因。
包括原核复制子的载体也可包括在细菌宿主细胞中指导编码基因序列表达的原核或噬菌体启动子。典型情况下在质粒载体中提供和细菌宿主相容的启动子序列,其中所述质粒载体含有用于插入待表达的DNA区段的方便限制性位点。这种质粒载体的实例是pUC8、pUC9、pBR322和pBR329(BioRad)、pPL和pKK223(Pharmacia)。任何合适的原核宿主可用来表达编码本发明方法中所用的蛋白质的重组DNA分子。
出于本发明的目的,可以使用多种表达载体系统。例如,一类是利用了来源于动物病毒的DNA元件的载体,所述动物病毒如牛乳头瘤病毒、多瘤病毒、腺病毒、痘苗病毒、杆状病毒、逆转录病毒(RSV、MMTV或MOMLV)或SV40病毒。其他载体涉及具有内部核糖体结合位点多顺反子系统的使用。此外,可通过引入允许选择转染的宿主细胞的一个或多个标志物来选择在其染色体中具有整合DNA的细胞。所述标志物可向营养缺陷型宿主提供原养、杀生物剂(如抗生素)抗性或重金属(如铜)抗性。所述可选择的标志物基因既可以直接连接至待表达的DNA序列、也可以通过共转化引入至同一细胞。新霉素磷酸转移酶(neo)基因是可选择的标志物基因的一个实例(Southern等,J.Mol.Anal.Genet.1:327-341(1982))。也可能需要其他元件用于mRNA的最优合成。这些元件可包括信号序列、剪接信号以及转录启动子、增强子和终止信号。
在一个实施方式中,可以使用Biogen IDEC,Inc.一个具有专利权的表达载体,其称为NEOSPLA(美国专利6,159,730)。该载体包含巨细胞病毒的启动子/增强子、小鼠珠蛋白的主要启动子、SV40复制起点、牛生长激素的聚腺苷酸化序列、新霉素磷酸转移酶的外显子1和外显子2、二氢叶酸还原酶基因和前导序列。已发现该载体在CHO细胞中转染后导致非常高水平的表达,随后在含有G418的培养基中进行选择和氨甲蝶呤扩增。当然,任何能够在真核细胞中引发表达的表达载体可用于本发明。合适的载体的实例包括,但不限于,质粒pcDNA3、pHCMV/Zeo、pCR3.1、pEF1/His、pIND/GS、pRc/HCMV2、pSV40/Zeo2、pTRACER-HCMV、pUB6/V5-His、pVAX1和pZeoSV2(来自Invitrogen,San Diego,CA)以及质粒pCI(来自Promega,Madison,WI)。其他真核细胞表达载体在本领域是公知的并且可商业获得。典型地,这种载体包含方便的限制性位点用于插入期望的DNA区段。示例性载体包括pSVL和pKSV-10(Pharmacia)、pBPV-1、pm12d(InternationalBiotechnologies)、pTDT1(ATCC 31255)、逆转录病毒表达载体pMIG和pLL3.7、腺病毒穿梭载体pDC315和AAV载体。其他示例性载体系统在如美国专利6,413,777中有公开。
通常,筛选表达适当高水平多肽的大量转化细胞是常规实验,可通过例如机器人系统进行。
用于哺乳动物宿主细胞表达的常用调节序列包括在哺乳动物细胞中指导蛋白高水平表达的病毒元件,如衍生自逆转录病毒LTR、巨细胞病毒(CMV)(如CMV启动子/增强子)、猿猴病毒40(SV40)(如SV40启动子/增强子)、腺病毒(如腺病毒主要晚期启动子(AdmlP))、多瘤病毒的启动子和增强子以及强哺乳动物启动子(如天然免疫球蛋白和肌动蛋白启动子)。病毒调节元件的其他描述及其序列参见,如Stinski,美国专利第5,168,062号;Bell,美国专利第4,510,245号以及Schaffner,美国专利第4,968,615号。
重组表达载体可携带在宿主细胞中调节载体复制(如复制起点)的序列以及可选择的标志物基因。所述可选择的标志物基因便于选择引入了载体的宿主细胞(参见,如Axel,美国专利第4,399,216;4,634,665和5,179,017号)。例如,典型地,可选择的标志物基因在载体所引入的宿主细胞中赋予药物如G418、潮霉素和氨甲蝶呤的抗性。常用的可选择的标志物基因包括二氢叶酸还原酶(DHFR)基因(用于氨甲蝶呤选择/扩增的dhfr-宿主细胞)和neo基因(用于G418选择)。
编码Sema6A多肽的载体可以用于转化合适的宿主细胞。转化可以通过任何合适的方法。向哺乳动物细胞引入外源DNA的方法是本领域公知的,其包括葡聚糖-介导的转染、磷酸钙沉淀、聚凝胺(polybrene)-介导的转染、原生质体融合、电穿孔、脂质体中包裹多聚核苷酸以及向细胞核中直接显微注射DNA。此外,核酸分子可通过病毒载体引入哺乳动物细胞。
宿主细胞的转化可以通过适于所用载体和宿主细胞的常规方法来实现。对于原核宿主细胞的转化,可以使用电穿孔和盐处理方法(Cohen等,Proc.Natl.Acad.Sci.USA 69:2110-14(1972))。对于脊椎动物细胞的转化,可以使用电穿孔、阳离子脂质或盐处理方法。参见,如Graham等,Virology 52:456-467(1973);Wigler等,Proc.Natl.Acad.Sci.USA 76:1373-76(1979)。
用于蛋白质表达的宿主细胞系可以是哺乳动物来源的;相信本领域技术人员有能力优先确定最适合期望基因产物在其中表达的具体宿主细胞系。示例性宿主细胞系包括但不限于NSO、SP2细胞、幼仓鼠肾(BHK)细胞、猴肾细胞(COS)、人类肝细胞癌细胞(如Hep G2)、A549细胞DG44和DUXB 11(中国仓鼠卵巢细胞系,DHFR-)、HELA(人类宫颈癌)、CVI(猴肾细胞系)、COS(带有SV40T抗原的CVI衍生物)、R1610(中国仓鼠成纤维细胞)、BALBC/3T3(小鼠成纤维细胞)、HAK(仓鼠肾细胞系)、SP2/O(小鼠骨髓瘤)、P3x63-Ag3.653(小鼠骨髓瘤)、BFA-1c1BPT(牛内皮细胞)、RAJI(人类淋巴细胞)和293(人类肾)。宿主细胞系通常可以从商业服务、美国组织培养物保藏中心或公开文献获得。
可以使用公知技术增强来自生产细胞系的多肽的表达。例如,谷氨酰胺合成酶(GS)系统通常用于在特定条件下增强表达。参见,如,欧洲专利第0216846、0256055和0323997号以及欧洲专利申请第89303964.4号。
宿主细胞
用于表达本发明方法中使用的Sema6A多肽的宿主细胞可以是原核的或真核的。示例性真核宿主细胞包括,但不限于,酵母和哺乳动物细胞,如中国仓鼠卵巢(CHO)细胞(ATCC登录号CCL61)、NIH瑞士小鼠胚胎细胞NIH-3T3(ATCC登录号CRL1658)和幼仓鼠肾细胞(BHK)。其他有用的真核宿主细胞包括昆虫细胞和植物细胞。示例性原核宿主细胞是大肠杆菌(E.coli)和链霉菌属(Streptomyces)。
基因治疗
可在哺乳动物(如人类患者)体内产生Sema6A多肽,使用基因治疗方法来治疗神经系统疾病、病症或损伤,其中促进少突胶质细胞的存活、增殖和/或分化、或促进神经元的髓鞘形成将是有治疗益处的。这涉及施用可操作连接至合适表达控制序列的合适的Sema6A多肽-编码核酸。通常,这些序列并入到病毒载体中。用于这种基因治疗的合适病毒载体包括腺病毒载体、甲病毒载体、肠道病毒载体、瘟病毒载体、慢病毒载体、杆状病毒载体、疱疹病毒载体、Epstein-Barr病毒载体、乳多空病毒载体、痘病毒载体、痘苗病毒载体、腺相关病毒载体以及单纯疱疹病毒载体。所述病毒载体可以是复制-缺陷型病毒载体。通常使用在E1基因或E3基因中有缺失的腺病毒载体。当使用腺病毒载体时,所述载体通常没有可选择的标志物基因。
药物组合物
本发明方法中所用的Sema6A多肽可以配制成用于施用至哺乳动物(包括人类)的药物组合物。本发明方法中所用的药物组合物包括药物可接受载体,包括如离子交换剂、氧化铝、硬脂酸铝、卵磷脂、血清蛋白(如人类血清白蛋白)、缓冲物质(如磷酸盐)、甘氨酸、山梨酸、山梨酸钾、饱和植物脂肪酸的部分甘油酯混合物、水、盐或电解质(如鱼精蛋白硫酸盐、磷酸氢二钠、磷酸氢钾、氯化钠、锌盐)、胶态二氧化硅、三硅酸镁、聚乙烯吡咯烷酮、基于纤维素的物质、聚乙二醇、羧甲基纤维素钠、聚丙烯酸酯、蜡、聚乙烯-聚氧丙烯-嵌段聚合物、聚乙二醇和羊毛脂。
用于本发明方法的组合物可以通过任何合适的方法施用,如肠胃外、心室内、口服、通过吸入喷雾、局部、直肠、鼻、口腔、阴道或通过植入的贮库(reservoir)。如本文所用术语“肠胃外”包括皮下、静脉内、肌肉内、关节内、滑膜内、胸骨内、鞘内、肝内、病变内和颅内注射或输注技术。如前面所述,用于本发明方法的Sema6A多肽在神经系统内发挥作用来促进少突胶质细胞的存活、增殖和分化以及神经元的髓鞘形成。因此,在本发明的方法中,所述Sema6A多肽以这样一种方式施用,即它们穿过血脑屏障。这种穿过可以是Sema6A多肽分子本身固有的物理化学性质、药物制剂中的其他组分、或使用机械装置(如针、插管或手术器械)突破血脑屏障而导致的。当Sema6A多肽是一种天生不穿过血脑屏障的分子时,如通过融合至有利于穿过的部分、合适的施用途径如鞘内或颅内,来直接用于MS的慢性病变中。当Sema6A多肽是一种天生可以穿过血脑屏障的分子时,施用途径可以通过下述各种途径中的一种或多种。
用于本发明方法的无菌的可注射形式组合物可以是水性或油性悬浮液。可以根据本领域公知的技术,使用合适的分散剂或润湿剂以及悬浮剂来配制这种悬浮液。无菌的可注射制剂也可以是肠胃外可接受的无毒稀释剂或溶剂中无菌可注射的溶液或悬浮液,例如,作为1,3-丁二醇中的悬浮液。在可接受的媒介物和溶剂当中可用的是水、林格溶液和等渗氯化钠溶液。此外,无菌的、不挥发性油常规用作溶剂或悬浮介质。为此目的,任何可用的温和的不挥发性油包括合成的单-或双-甘油酯。脂肪酸(如油酸)及其甘油酯衍生物可用于可注射的制剂,因为它们是天然的药物可接受的油,如橄榄油或蓖麻油,尤其是它们的聚氧乙基化的形式。这些油溶液或悬浮液也可包含长链醇类稀释剂或分散剂,如羧甲基纤维素或类似的分散剂,其常用于配制药物可接受的剂型(包括乳剂和悬浮液)。其他常用表面活性剂,如吐温、司盘和其他乳化剂或生物利用度增强剂(其常用于药物可接受固体、液体或其他剂型的生产),也可以用于配制目的。
肠胃外的制剂可以是单次快速推注剂量、输注或负荷快速推注剂量,随后是维持剂量。这些组合物可以特定的固定或可变间隔来施用,如一天一次、或基于“根据需要”来施用。
用于本发明方法的某些药物组合物可以以可接受的剂型口服施用,其包括,如胶囊、片剂、水悬浮液或溶液。某些药物组合物也可通过鼻气溶胶或吸入剂施用。这种组合物可以制备成盐水中的溶液,通过使用苯甲醇或其他合适的防腐剂、促吸收剂来提高生物利用度,和/或使用其他常规增溶或分散剂。
结合载体材料来生产单个剂型的Sema6A多肽的量可以变化,这取决于所治疗的宿主、所用多肽的类型以及具体施用方式。所述组合物可以作为单剂量、多剂量或在规定时间段内以输注来施用。也可以调整剂量方案来提供最优的期望响应(如治疗或预防响应)。
本发明的方法使用“治疗有效量”或“预防有效量”的Sema6A多肽。这种治疗或预防有效量可以根据因素(如个体的疾病状态、年龄、性别和体重)而变化。治疗或预防有效量也是这样一种量,即治疗有益作用超过任何毒性或有害作用。
针对任何具体患者的特定剂量和治疗方案将取决于多种因素,包括所用的特定Sema6A多肽、患者年龄、体重、一般健康状况、性别和饮食、以及施用时间、排泄速率、药物联合、以及治疗的特定疾病严重程度。医护人员对这些因素的判断在本领域技术人员能力范围内。所述量也取决于待治疗的个体患者、施用途径、制剂类型、所用化合物的特性、疾病严重程度以及期望的效果。所用的量可以通过本领域公知的药理和药代动力学原理来确定。
在本发明方法中,所述Sema6A多肽通常直接施用至神经系统、脑室内或鞘内,如MS的慢性病变中。根据本发明方法施用的组合物可以这样配制,从而每天施用的剂量为0.001-10mg Sema6A多肽/kg体重。在本发明的一些实施方式中,剂量是每天0.01-1.0mg/kg体重。在一些实施方式中,剂量是每天0.001-0.5mg/kg体重。在某些实施方式中,剂量是每天5mg/kg-100mg/kg体重。在本发明的其他实施方式中,剂量是每天50mg/kg-500mg/kg体重。本发明还包括每天100mg/kg-1g/kg体重的剂量。本发明方法中所用剂量的非限定性实例选自由以下剂量组成的组:每天0.5、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、60、70、80、90、100、150、200、250、300、400、500、600、700、800、900或1000mg/kg体重。用于本发明的剂量可以是每天1g/kg-5g/kg体重。上述范围中的中间剂量也意为在本发明的范围内。可以向受治疗者每天、隔天、每周或根据经验分析确定的任何其他时间表施用这种剂量。示例性治疗需要在长时期内多剂量施用,例如,至少6个月。其他示例性治疗方案需要每隔一周一次或每月一次或每3至6个月一次施用。示例性剂量时间表包括,但不限于,连续数天1-10mg/kg或15mg/kg、隔天30mg/kg或每周60mg/kg。
在某些实施方式中,可以用编码Sema6A多肽的核酸分子治疗受治疗者。核酸剂量范围为每位患者约10ng至1g、100ng至100mg、1g至10mg、或30-300g DNA。用于传染性病毒载体的剂量范围为每剂量10-100或更多个病毒粒子不等。
补充活性化合物也可并入用于本发明方法的组合物中。例如,Sema6A多肽或融合蛋白可以和一种或多种其他治疗剂共配制和/或共施用。
本发明包括任何合适的将Sema6A多肽递送至选定靶组织的方法,包括水溶液的快速推注或控-释系统的植入。使用控-释植入物可减少对重复注射的需求。
用于本发明方法的Sema6A多肽可以直接输注至脑中。用于化合物直接脑输注的各种植入物是公知的,并且向患有神经病症的人类患者递送治疗性化合物时是有效的。这些包括用泵向脑中慢速输注、立体定向地植入、临时性间质导管、永久性颅内导管植入物和手术植入可生物降解的植入物。参见,如Gill等,如上;Scharfen等,“High Activity Iodine-125 Interstitial Implant For Gliomas(高活性碘-125间质植入神经胶质瘤),”Int.J.Radiation Oncology Biol.Phys.24(4):583-591(1992);Gaspar等,“Permanent 125I Implants forRecurrent Malignant Gliomas(对复发性恶性神经胶质瘤的永久性125I植入物),”Int.J.Radiation Oncology Biol.Phys.43(5):977-982(1999);第66章,第577-580页,Bellezza等,“Stereotactic InterstitialBrachytherapy(立体定向间质近距离放射疗法),”在Gildenberg等,Textbook of Stereotactic and Functional Neurosurgery(立体定向和功能性神经外科教科书),McGraw-Hill(1998);以及Brem等,“TheSafety of Interstitial Chemotherapy with B CNU-Loaded PolymerFollowed by Radiation Therapy in the Treatment of Newly DiagnosedMalignant Gliomas:Phase I Trial(负载BCNU的聚合物化疗和随后放疗在治疗新近诊断的恶性神经胶质瘤中的安全性:I期试验),”J.Neuro-Oncology 26:111-23(1995)。
所述组合物也可包括分散于可生物相容的载体材料(作为所述化合物合适的递送或支持系统)中的Sema6A多肽。持续释放载体合适的实例包括有形制品形式的半透性聚合物基质(如栓剂或胶囊)。可植入或微胶囊持续释放基质包括聚乳酸(美国专利第3,773,319号;EP 58,481)、L-谷氨酸和γ-乙基-L-谷氨酸的共聚物(Sidman等,Biopolymers 22:547-56(1985));聚(2-羟乙基-甲基丙烯酸酯)、乙烯-乙酸乙烯酯(Langer等,J.Biomed.Mater.Res.15:167-277(1981);Langer,Chem.Tech.12:98-105(1982))或聚-D-(-)-3羟基丁酸(EP 133,988)。
在本发明的一些实施方式中,通过直接输注至脑的合适区域内施用Sema6A多肽。参见,如Gill等,“Direct brain infusion of glial cellline-derived neurotrophic factor in Parkinson disease(帕金森病中直接脑输注胶质细胞系衍生的神经营养因子),”Nature Med. 9:589-95(2003)。可选技术是可用的,并用于施用根据本发明的Sema6A多肽。例如,使用Riechert-Mundinger单元和ZD(Zamorano-Dujovny)多用途定位单元实现导管或植入物的立体定位安置。造影-增强计算机断层(CT)扫描、注射120ml欧乃派克、350mg碘/ml、2mm层面厚度可以允许三维多平面治疗计划(three-dimensionalmultiplanar treatment planning)(STP,Fischer,Freiburg,Germany)。为了达到清晰的目标确认,该设备允许在磁共振成像研究、合并CT以及MRI目标信息的基础上进行计划。
出于此目的可以使用经改进的用于配合GE CT扫描仪(通用电气公司,Milwaukee,WI)使用的Leksell立体定位系统(DownsSurgical,Inc.,Decatur,GA)以及Brown-Roberts-Wells(BRW)立体定位系统(Radionics,Burlingto,MA)。因此,在植入的当天早上,可以将BRW立体定位框的环状基座圈(annular base ring)连接至患者的头颅。用夹固至基板上的石墨棒定位器框贯穿(though)所述区域(靶组织),以3mm间隔可以获得连续的CT截面。可以在VAX 11/780型计算机(Digital Equipment Corporation,Maynard,Mass)上运行计算机化处理计划程序,利用石墨棒图像的CT坐标来绘制CT空间和BRW空间之间的图。
治疗本文所述脱髓鞘或髓鞘形成病症的方法,在用于人类之前,为了期望的治疗或预防活性,通常在体外进行测试,然后在可接受的动物模型进行体内测试。合适的动物模型,包括转基因动物,是本领域普通技术人员公知的。例如,本文描述了说明Sema6A多肽分化和存活作用的体外分析。如实施例中所描述的,可以在体外测试Sema6A多肽对轴突髓鞘形成或少突胶质细胞分化的作用。最终,可以通过创造表达所述Sema6A多肽的转基因小鼠、或通过在模型中向小鼠或大鼠施用所述Sema6A多肽进行体内测试。
神经退行性疾病的诊断或监测
本发明的一些实施方式涉及用于在受治疗者中诊断或监测神经疾病或疾患的方法,其通过(a)从待诊断或监测的受治疗者中获得试样,如组织或生物液体样品(如血液或CSF)、(b)测量Sema6A多肽在试样中的水平以及(c)将Sema6A多肽的水平与参考试样比较。
通过术语“诊断”来表示鉴定个体患有特定的疾病或疾患。通过术语“监测”来表示对给定条件或现象进行持久和/或定期检查。在一个实施方式中,用于监测神经退行性疾病的方法包括在神经退行性疾病的治疗期间,以一定间隔在若干时间点处获得生物液体样品作为患者监测的部分。在另一个实施方式中,用于监测神经退行性疾病的方法包括在MS治疗期间,以一定间隔在若干时间点处获得生物液体样品作为患者监测的部分。
在一个实施方式中,待诊断或监测的疾病或疾患是多发性硬化(MS)。在其他实施方式中,疾病或疾患可选自由以下组成的组:进行性多灶性白质脑病(PML)、脑脊髓炎(EPL)、脑桥中央髓鞘溶解症(CPM)、肾上腺脑白质营养不良、亚历山大病、佩-梅病(PMZ)、球样细胞脑白质病(克拉伯氏病)、沃勒变性、视神经炎、横贯性脊髓炎、肌萎缩侧索硬化(ALS)、亨廷顿病、阿尔茨海默病、帕金森病、脊髓损伤、创伤性脑损伤、辐射后损伤、化疗的神经系统并发症、中风、急性缺血性视神经病变、维生素E缺乏、孤立性维生素E缺乏综合征、AR、巴-科综合征、胼胝体脱髓鞘性脑病综合征、异染性脑白质营养不良、三叉神经痛和贝尔麻痹。
生物液体样品包括,但不限于,血液、尿和脑脊液(CSF)。获得生物液体样品的方法包括,但不限于,组织活检、静脉穿刺、尿收集和脊椎穿刺。在一个实施方式中,所述生物液体样品是CSF或血液。
组织包括,但不限于,上皮组织、肌肉组织、结缔组织或神经组织。在一个实施方式中,所述组织是上皮组织,如皮肤组织的一部分。在另一个实施方式中,将从组织或生物液体(如CSF或血液)中收集的树突细胞用于检测Sema6A的表达。
所述生物液体样品从受治疗者获得。在一些实施方式中,所述受治疗者是脊椎动物。脊椎动物包括但不限于人类、小鼠、大鼠、绵羊、山羊、猪、牛、马、爬行动物、鱼、两栖动物以及禽类、爬行动物和鱼的卵。在一个实施方式中,所述受治疗者是人类。在另一个实施方式中,所述受治疗者是患有或怀疑患有神经疾病的人类,其中所述神经疾病选自由以下组成的列表:MS、进行性多灶性白质脑病(PML)、脑脊髓炎(EPL)、脑桥中央髓鞘溶解症(CPM)、肾上腺脑白质营养不良、亚历山大病、佩-梅病(PMZ)、球样细胞脑白质病(克拉伯氏病)、沃勒变性、视神经炎、横贯性脊髓炎、肌萎缩侧索硬化(ALS)、亨廷顿病、阿尔茨海默病、帕金森病、脊髓损伤、创伤性脑损伤、辐射后损伤、化疗的神经系统并发症、中风、急性缺血性视神经病变、维生素E缺乏、孤立性维生素E缺乏综合征、AR、巴-科综合征、胼胝体脱髓鞘性脑病综合征、异染性脑白质营养不良、三叉神经痛和贝尔麻痹。在一个具体的实施方式中,所述受治疗者是MS患者,其近期患至少一种选自由以下组成的组的疾患:麻木、无力、视力缺损、失去平衡、眩晕、尿急(urinarybladder urgency)、疲劳和抑郁。如本文所用,“近期”可以是3、5、7、10、14或21天内。
试样中Sema6A表达的水平可以指示疾病的状态,如疾病或疾患的严重程度、受治疗者患所述疾病的倾向、受治疗者的预后、或治疗对疾病的疗效。
本发明还提供在从受治疗者获得的试样中检测Sema6A多肽存在的方法。可以使用任何用于检测蛋白质或mRNA的本领域公知方法。这种方法包括,但不限于,考马斯亮蓝染色、免疫扩散、免疫电泳、免疫化学方法、结合剂-配体(binder-ligand)分析、免疫组织化学技术、凝集和补体分析。[Basic and Clinical Immunology(基础和临床免疫学),217-262,Sites和Terr编辑,Appleton&Lange,Norwalk,CT(1991),其通过引用并入本文]。检测Sema6A mRNA的方法是本领域公知的。Tuan Rocky,Recombinant Protein Protocols:Detection and Isolation(Methods in Molecular Biology)(Mthods inMolecular Biology)(重组蛋白的实验方案:检测和分离(分子生物学方法))(第1版.Humana Press,PA 1997)。这种方法的非限定性实例是Northern印记、核酸酶保护分析、原位杂交或RT-PCR。
多种竞争性和非竞争性蛋白质结合免疫分析是本领域公知的。用于这种分析的抗体可以是未标记的,例如用于凝集测试,或是标记的,广泛用于各种类型分析方法。可用标记物包括放射性核素、酶、荧光剂、化学发光剂、酶底物或辅因子、酶抑制剂、颗粒、染料及类似物,用于放射免疫分析(RIA)、酶免疫分析(如酶联免疫吸附分析(ELISA))、荧光免疫分析、Western印记分析及类似分析。
在受治疗者中诊断或监测神经疾病时,Sema6A多肽在试样中的水平可以和Sema6A多肽在参考试样中的水平比较。合适的参考试样可以包括,但不限于,来自于神经正常的个体的组织或生物液体样品。在一个实施方式中,所述参考试样来自未患有神经退行性疾病的受治疗者。在另一个实施方式中,所述参考试样来自于未患有MS的受治疗者。此外,受治疗者产生的已知蛋白质可以作为内部标准或对照,如白蛋白(如果从血清或总蛋白进行测量的话)。
诊断试剂盒
本发明还考虑了诊断试剂盒。这些试剂盒允许检测、诊断或监测神经退行性疾病。当个体(他/她)接受疾病进展和/或疾病治疗作用的监测时,这些诊断试剂盒采用的单测试方法将减少在个体中诊断神经退行性疾病所需的时间,和/或减少在患者生物液体样品中检测差异表达蛋白质所需的时间。
本发明的一个实施方式涉及,使用特异性结合本文所述Sema6A多肽的抗体或抗原结合片段以及可检测的标记物,在患者中检测、诊断或监测神经退行性疾病的诊断试剂盒。在另一个实施方式中,本发明涉及,使用特异性结合Sema6A多肽的抗体或抗原结合片段以及可检测的标记物,在患者中检测、诊断或监测MS的诊断试剂盒。
在一些实施方式中,用对检测有用的酶对抗体进行标记,如辣根过氧化物酶、-半乳糖苷酶、荧光素酶、碱性磷酸酶、葡萄糖氧化酶及类似物。在经可检测的酶标记的实施方式中,通过加入其他试剂来检测抗体,其中酶利用所述试剂产生可检测的反应产物。例如,辣根过氧化物酶与过氧化氢和二氨基联苯胺。也可用生物素来标记抗体,并通过间接测量抗生物素蛋白或链霉亲和素的结合来检测。也可用预定的多肽表位来标记抗体,所述表位被第二报道分子识别(如,亮氨酸拉链对序列、第二抗体结合位点、金属结合结构域、表位标签)。
本发明所考虑的试剂盒意图在脊椎动物中检测、诊断或监测神经退行性疾病,所述脊椎动物包括但不限于,人类、小鼠、大鼠、绵羊、山羊、猪、牛、马、爬行动物、鱼、两栖动物以及禽类、爬行动物和鱼的卵。
本发明的诊断试剂盒包括进行期望的根据本发明的免疫分析所需的必要试剂中的一些或全部。所述诊断试剂盒可以以商业包装形式出现,作为一个或多个容纳必要试剂的容器的组合。这种试剂盒可包括本发明的抗体,并联合一些常规试剂盒组分。常规试剂盒组分对于本领域技术人员是很明显的,并且在很多出版物中公开,包括,例如Harlow和Lane;Antibodies A Laboratory Manual(抗体的实验室手册),Cold Spring Harbor Laboratory Press,Cold SpringHarbor,N.Y.1988),通过引用将其整体并入本文。常规试剂盒组分可包括这种项目,例如微量滴定板、维持分析混合物pH的缓冲剂(如,但不限于,Tris、HEPES、磷酸盐、碳酸盐等)、轭合的第二抗体(如过氧化物酶轭合的抗-小鼠IgG(或任何抗-第一抗体所来自的动物的IgG))、稳定剂、杀生物剂、惰性蛋白质(如牛血清白蛋白或类似物)以及其他标准试剂。
本发明的诊断试剂盒也可包括适于家用以及诊所、医生诊室或实验室用的试剂盒。家庭测试试剂盒的实例可以在例如US5,602,040中找到,其通过引用并入本文。
如本文所用术语“检测”,当涉及在患者中检测蛋白质存在时,意图包括确定蛋白质的量或在患者中表达一定量蛋白质的能力、根据疾病的可能后果以及痊愈前景方面对预后评价、一段时间内监测蛋白质水平作为疾患状态的量度以及监测蛋白质水平来为患者(如,患有神经退行性疾病的患者)确定优选治疗方案。
实施例
实施例1
Sema6A参与少突胶质细胞的生物学
少突胶质细胞的成熟通过几个发育阶段,由少突胶质细胞祖细胞(其表达NG2),分化成前-成髓鞘(pre-myelinating)少突胶质细胞(其表达O1和O4)并最终分化成为成熟的成髓鞘少突胶质细胞(其表达O1、O4、髓鞘碱性蛋白(MBP)和抗-蛋白脂质蛋白(PLP))。因此,通过监测NG2、O1、O4、MBP和PLP标志物的存在与否,有可能确定给定细胞的发育阶段并评价Sema6A多肽在少突胶质细胞生物学中的作用。少突胶质细胞转录因子-2(Olig-2)也被认为表达于少突胶质细胞谱系中,因此用作检测少突胶质细胞的标志物。参见Yokoo等,Amer.J. of Path.164:1717-1725(2004)(少突胶质细胞生物学的综述参见,如Baumann和Pham-Dinh,Physiol.Rev.81:871-927(2001);Bras等,Int.J. Dev.Biol.49:209-220(2005)。
抗O4和MBP的单克隆抗体来自Chemicon。抗PLP)的单克隆抗体(克隆AA3,1∶10)由Pr.C.Luberzki惠赠。Yamamura等,J.Neurochem.57(5):1671-80(1991)。抗星形胶质细胞前体细胞(APC)的单克隆抗体来自VWR国际(Fontenay Sous Bois,France)。抗CNPase(环核苷酸-3’-磷酸水解酶)抗体来自Sigma。抗NG2(AB5320)的抗体来自Chemicon。抗人类Sema6A的抗体来自R&DSystems(Minneapolis,MN)。抗Na2+和paranodine的抗体来自Sigma。抗-myc抗体(9E10,1:100)来自Santa Cruz Biotechnology(SC-40)。
Sema6A mRNA在少突胶质细胞中表达
在P1和P15小鼠的新鲜冷冻脑(矢状切面)或脊髓(冠状面)中通过原位杂交分析Sema6A mRNA的表达。通过吸入异氟烷foren(Abbott)麻醉瑞士小鼠((Janvier,Le Genest Saint Isle,France),并去头。立即在异戊烷(-50℃)中冷冻脑和视神经,杂交前在-80℃中保存。组织切片在4%PFA中后固定10分钟,在PBS pH7.4中冲洗,用蛋白酶K处理3-5分钟(10μg/ml;Invitrogen,Carlsbad,CA),在4%PFA中后固定5分钟,在PBS中冲洗,乙酰化,用1%Triton X-100的PBS洗涤。在杂交缓冲液(50%甲酰胺、5×SSC、1×Denhardt′s、250μg/ml酵母tRNA和500μg/ml鲱鱼精子,pH 7.4)中,室温下将切片孵育2小时,然后将组织切片和洋地黄毒苷(digoxigenin)-标记的Sema6A核糖核酸探针(0.5ng/μl)在72℃下杂交过夜。杂交后,切片在2×SSC中72℃下漂洗2小时,并在室温下在含有10%正常山羊血清(NGS)的0.1M Tris,pH 7.5,0.15M NaCl(B1)中封闭1小时。封闭后,在室温下,将切片和碱性磷酸酶(1∶5000;Roche Diagnostics)轭合的抗-洋地黄毒苷抗体在含有1%NGS的B1中孵育过夜。再次冲洗后,用氯化硝基四氮唑蓝(NBT)(337.5μg/ml)和5-溴-4-氯-3-吲哚基磷酸酯(BCIP)(175μg/ml)(Roche Diagnostics)检测碱性磷酸酶活性。将切片装载到Mowiol(Calbiochem/Merck,Carlstadt,Germany)中。如图3所示,出生后发育期间Sema6A mRNA通过少突胶质细胞在P15小鼠的CNS白质中广泛表达。
Sema6A蛋白在少突胶质细胞中表达
通过Sema6A和PLP、Sema6A和APC(少突胶质细胞标志物)以及Sema6A和CNPase(少突胶质细胞和施旺细胞标志物)的双重免疫染色证实,Sema6A蛋白在P15小鼠脑切片(来自4%PFA固定的脑)的少突胶质细胞中表达。在室温(RT)下在含有0.2%明胶(Prolabo,Fontenay-sous-Bois,France)和0.25%Triton X-100(PBS-G-T)的PBS中封闭切片1小时,然后在RT下用第一抗体(即抗-小鼠Sema6A抗体、抗-PLP抗体、抗-APC抗体和抗-CNPase抗体)孵育过夜。然后在室温下用4%PFA将培养物固定10分钟,漂洗,然后在含有10%NGS和0.2%Triton-X100的PBS缓冲液中饱和并透化30分钟。在含有10%NGS和0.1%Triton X-100的PBS中将第二抗体(即:针对Sema6A的CY3-轭合的抗体,以及针对PLP、APC和CNPase的FITC-轭合的抗体)稀释1小时,冲洗后,在RT下和第二抗体孵育1小时。漂洗后,将培养物装载在Mowiol(Calbiochem/Merck,Carlstadt,Germany)中。
双重免疫染色显示所有Sema6A表达细胞也在白质中表达APC、CNPase或PLP(数据未显示)。然而,有些表达PLP、APC和CNPase的细胞不表达Sema6A。因此Sema6A蛋白似乎在少突胶质细胞谱系的细胞亚群或者处于成熟特定精确阶段的少突胶质细胞中表达。所以,Sema6A联合少突胶质细胞标志物PLP、APC或CNPase而获得的共-免疫标记证实了在体内通过少突胶质细胞的Sema6A表达。
在相同的P15脑切片(小脑、皮层)上,少突胶质细胞特异性蛋白(如PLP)的免疫染色,结合Sema6A原位杂交。除了将蛋白酶K消化(10μg/ml)缩短至2分钟以外,如上所示进行标准的原位杂交。用Sema6A核糖核酸探针进行原位杂交后,在PBS-T中漂洗切片,RT下在PBS-G-T中封闭1小时,在RT下用抗-PLP抗体(克隆AA3)孵育过夜,然后在生物素化的兔抗-大鼠抗体(1∶200;Dako,Glostrup,Denmark)和HRP-轭合的链霉亲和素(1∶400;Amersham)中孵育。用二氨基联苯胺反应(棕色沉淀)对切片进行显影。所有表达Sema6A转录物的细胞呈现紫色,并且也包围有棕色沉淀,这表明PLP的表达(数据未显示)。
Sema6A蛋白的表达是发育调节的
还利用上述抗-小鼠Sema6A和抗-APC抗体通过双重免疫染色分析Sema6A和APC在P15、P30和P45小鼠前脑冠状面上的表达。在不同年龄中均观察到强烈的APC表达,但是在P15观察到APC/Sema6A共-标记最大的细胞,其中65%的少突胶质细胞(APC+细胞)表达Sema6A(数据未显示)。在P30中,在白质中也表达Sema6A的APC阳性细胞的比例降低至14%,在P45中降低至8%(数据未显示)。这显示Sema6A的表达在髓鞘形成峰期间是发育调节的,于P15处达到最大值。
实施例2
少突胶质细胞分化各阶段的Sema6A表达
在纯化的少突胶质细胞培养物中也显示体外Sema6A的表达。切除P0至P5小鼠的皮层半球,并转移至由添加有10%小牛血清的DMEM组成的培养基中。在培养基中,通过穿过70μm目的尼龙筛来分离组织。将细胞悬浮液涂布(dispensed)到包被有聚鸟氨酸的直径100mm的塑料组织培养皿上。通过轻轻吹吸(syringing)细胞层上方的培养基而使少突胶质细胞前体细胞选择性分离。随后将取出的细胞在12个小时期间内在未包被的塑料培养皿上经受两次连续的预涂板(preplating),以使余留的星形细胞和小神经胶质细胞附着。将未附着以及松弛附着的细胞(少突胶质细胞)在60mm塑料培养皿上传代培养。用抗-小鼠Sema6A抗体和抗-NG2(少突胶质细胞祖细胞的标志物)或抗-O4(从前-少突胶质细胞阶段表达的少突胶质细胞谱系的标志物)以及抗-MBP抗体(成熟少突胶质细胞的标志物)对培养物染色。将CY3轭合的抗体用作第二抗体来显示Sema6A的表达,以及FITC-轭合的抗体用于显示NG2、O4和MBP的表达。体外24小时后,不同类型的细胞表达NG2:具有显著未分化形态学的一些细胞仅仅是FITC-标记的(NG2+),因此对于Sema6A是阴性的,其他更加分化的细胞(更多的突起(process))在细胞体中表达NG2和低水平Sema6A,但在细胞突起中不表达(数据未显示)。体外48小时后,O4-阳性细胞高度表达Sema6A(数据未显示)。体外72小时后,MBP-阳性细胞高度表达Sema6A(数据未显示)。这显示在分化的(O4和MBP+)少突胶质细胞中更加高度表达Sema6A(如在体内观察到的)。
实施例3
Sema6A-敲除小鼠表现出髓鞘化的轴突减少
为了产生Sema6A-敲除小鼠,将由内部核糖体进入位点(IRES)所间隔的、编码CD4跨膜结构域--半乳糖苷酶-新霉素磷酸转移酶(TM--geo)和人类胎盘碱性磷酸酶(PLAP)的盒插入至Sema6A的第17个内含子中,如Leighton等,Nature,410:174-179中所述。将Sema6A蛋白余留的N-端部分直至氨基酸623(因此缺少跨膜和细胞质结构域)融合至-半乳糖苷酶,并保留在内质网中。
为了分析髓鞘形成的延迟,研究了Sema6A-缺陷型小鼠的郎飞氏结。郎飞氏结表达多种已经证明的在该结具有特征性表达和功能的蛋白质。将针对参与郎飞氏结形成的蛋白质(如paranodin)产生的抗体用于检测蛋白质的表达。结是高度组织化的结构,在待髓鞘化的轴突和少突胶质细胞间紧密相互作用。由于蛋白质在结上的特征性表达,可以观察不同区域:通过Na2+电压门控通道来观察结的中央区,以及paranodin来观察结的中央区周围的两个结构域,称为paranodin/Na2+通道簇。在P16小鼠视神经中,使用抗-Na2+通道和paranodin的抗体通过免疫组织化学观察Na2+通道和paranodin的表达(数据未显示)。免疫组织化学显示Sema6A-缺陷型小鼠中paranodin/Na2+通道簇的数目显著降低(-40.54%;n=3)(数据未显示)。该结果表明P16Sema6A-缺陷型小鼠具有比野生型更少的髓鞘化的轴突。
Sema6A-敲除小鼠在少突胶质细胞中表现出降低的PLP表达
为了确定少突胶质细胞的分化或增殖在Sema6A-缺陷型小鼠中是否正常,通过非放射性原位杂交标记三种主要轴突束——前连合(AC)、胼胝体(CC)和视神经(ON),并对PLP表达细胞的数目定量。分析了三个年龄组P16、P30和P45(每组3只动物)的AC和CC,以及P16组的ON。没有在任何年龄组的CC中观察到PLP表达的显著变化(数据未显示)。然而,和野生型同窝出生的仔畜相比,在Sema-/-小鼠的AC中P16组的PLP表达细胞的数目降低(-43%)(图4)。在P16中的这种降低用PLP表达细胞数目的较大降低(-60%)来解释,但是还伴有AC表面30%的降低。这种降低在P30组的AC中较不显著(-20%),并且如图4所示在成体中回到正常水平。同样地,PLP在P16视神经中表达也显示相似的降低(-26%)(数据未显示)。然而,在AC中,在属于少突胶质细胞谱系的少突胶质细胞转录因子2(Olig2)表达细胞的数目上没有观察到显著变化(数据未显示)。这些结果表明Sema6A在体内少突胶质细胞分化、或其迁移和移至(colonize)轴突束的能力方面的可能作用。
Sema6A-缺陷型少突胶质细胞表现出延迟的分化
从Sema6A-/-新生小鼠中纯化少突胶质细胞,并通过Bernard等,J.Neurosc.Res.65:439-445,2001中所述方法分析其分化的能力。简要而言,在磷酸盐缓冲盐水中解剖P0-P10小鼠或大鼠的完整脑半球,并转移至主要由补充有青霉素(50个单位/ml)、链霉素(50μg/ml)(Invitrogen 15140)、小牛血清(10%)(Gibco16030074)、5ng/ml PDGFBB(Sigma P3201)和5ng/ml bFGF(SigmaF0291)的DMEM(Invitrogen 31966047)组成的培养基中。在培养基中,通过将组织穿过70μm目的尼龙(BD Biosciences)筛来进行分离。将细胞悬浮液涂布到包被有聚鸟氨酸(Sigma P3655)的直径100mm的塑料组织培养皿上。在水饱和的培养箱(平衡有95%空气-5%CO2)中37℃下孵育培养物。接种4天后更换培养基,此后每周更换两次。8-10天后,通过轻轻吹吸细胞层上方的培养基使少突胶质细胞前体细胞选择性分离。随后将取出的细胞在12个小时期间内在未包被的塑料培养皿上经受两次连续的预涂板,以使余留的星形细胞和小神经胶质细胞附着。将未附着以及松弛附着的细胞在包被有聚鸟苷酸的60mm塑料培养皿上、在化学成分明确的培养基中传代培养,其中化学成分明确的培养基含有0.5%胎牛血清(FCS)、10μM胰岛素、100μg/ml转铁蛋白、0.5μg/ml白蛋白、2μM孕酮、100μM腐胺、40ng/ml三碘甲腺原氨酸、40ng/ml L-甲状腺素、40nM d-生物素和100nM氢化可的松。不存在添加的有丝分裂原时,10天之后这些传代培养物产生含有超过90%Gal-C阳性细胞的几乎同源的细胞群。参见Besnard等,Int.J.Dev.Neurosci.7(4):401-409,1989。为了将这些细胞维持在少突胶质细胞祖细胞(OPC)阶段,并防止在产生突起前成熟前分化,将PDGFAA(10ng/ml)(大鼠)或PDGFBB(10ng/ml)和bFGF(对于大鼠10ng/ml,而对于小鼠20ng/ml)添加到培养基中。回收(withdrawal)有丝分裂原后,在24-72小时内发生OPC分化。Bogler等,Proc.Natl.Acad.Sci. U.S.A. 87(16):6368-6372,1990;Durand等,EMBO J. 16(2):306-317,1997。将购自R&D system的Sema6A-Fc蛋白也加入到化学成分明确的培养基中。
可以通过培养的少突胶质细胞的形态学复杂度测量少突胶质细胞的成熟阶段,如测量细胞的分形维数(FD)。文献同上。图5显示,体外24小时和48小时后,来自Sema6A+/-和Sema6A-/-小鼠的纯化的少突胶质细胞(通过相差观察的或用抗-O4抗体标记的)的FD定量。这显示尽管绝大多数Sema6A+/-少突胶质细胞在48小时后具有1.25的FD,但是大多数Sema6A-/-少突胶质细胞仅具有1.05-1.15的FD(n=3)(图5A)。体外24小时后Sema6A+/-和Sema6A-/-少突胶质细胞的FD和48小时后Sema6A-/-少突胶质细胞的FD相似(数据未显示)。这些结果说明少突胶质细胞的分化在Sema6A-/-小鼠中延迟了。
培养72小时后,用抗-O4抗体(分化中的少突胶质细胞的标志物)和抗-MBP抗体(已分化的少突胶质细胞的标志物)对少突胶质细胞免疫染色来测量少突胶质细胞的分化。作为第二抗体,使用针对O4的FITC-轭合的抗体和针对MBP的CY3-轭合的抗体。在显微镜下,随机选取视野来分析。72小时后,和野生型的相比,O4+/MBP+细胞在Sema6A-/-中的数目降低40.09%(数据未显示)。体外数据支持这样一种结论,即少突胶质细胞的分化在缺少Sema6A的少突胶质细胞中延迟了。
实施例4
Sema6A-Fc促进体外髓鞘形成
Sema6A在髓鞘形成中的作用通过使用Sema6A-Fc处理背根神经节(DRG)神经元和少突胶质细胞的共培养物,以及通过免疫组织化学和western印记测试髓鞘形成而在体外得以检查。对于这些研究,有必要首先产生DRG神经元和少突胶质细胞的原代培养物。
将Sprague Dawley大鼠E14-E17胚胎的背根神经节涂布在包被有聚-L-赖氨酸(100μg/ml)的盖玻片上。它们在补充有B27(Invitrogen 17504)的Neurobasal(神经基础)培养基(Invitrogen21103049)中生长2周。为了除去增殖中的神经胶质细胞,用氟脱氧尿苷(20μM)冲击(pulse)培养物两次,持续1周。按实施例3中所述的制备少突胶质细胞。
对于共培养研究,在有或没有100-300ng/ml Sema6A-Fc(R&Dsystems,1146-S6-025)时,将少突胶质细胞加入到DRG神经元的悬滴培养物中。每3天更换培养基(补充有B27和100ng/ml NGF的Neurobasal培养基),并将新鲜Sema6A-Fc加入到细胞中。为了鉴定髓鞘形成中的变化,用抗-MBP抗体标记3周龄的培养物,并进行SDS-PAGE,随后进行western印记分析。
图6显示Sema6A-Fc蛋白的添加以剂量依赖性的形式增加髓鞘形成,从阴性对照至0.1μg/ml以及从0.1μg/ml至0.3μg/ml。Western印记还显示通过加入Sema6A-Fc(即0.1μg/ml至0.3μg/ml),MBP的表达得以增加(数据未显示)。因此,这些数据表明Sema6A多肽可以促进或诱导髓鞘形成。
实施例5
Sema6A-Fc参与体内髓鞘再生
暴露于双环己酮草酰二腙(一种铜螯合剂)用作一种实验模型,其中在小鼠脑大面积区域内可以可重复地诱导严重的脱髓鞘。参见Matsushima等,Brain Pathol.11(1),107-116,2001。在饮食中用0.2%双环己酮草酰二腙喂八周龄的小鼠,持续6周,这导致成熟的少突胶质细胞通过凋亡而死亡。细胞死亡后紧随着小神经胶质细胞募集和髓鞘吞噬。在双环己酮草酰二腙处理终点,或甚至在持续的双环己酮草酰二腙暴露之后,少突胶质细胞前体细胞开始增殖并侵入脱髓鞘化区域。如果结束双环己酮草酰二腙处理,数周后发生几乎完全的髓鞘再生。使用双环己酮草酰二腙模型,可以分析脱髓鞘和髓鞘再生期间的Sema6A表达。双环己酮草酰二腙暴露和随后的终止之后,在双环己酮草酰二腙-处理的小鼠胼胝体中观察到Sema6A-表达少突胶质细胞的数目显著增加,其始于施用双环己酮草酰二腙3周后,在第4周时达到顶峰(+310%,n=3),随后在第6周时回到表达的基础水平(图7)。病变处的这些Sema6A表达细胞都呈olig-2阳性。为了表征该Sema6A-表达上调,在处死动物一周前,将BrdU注射到双环己酮草酰二腙-处理的动物中。一些Sema6A-表达少突胶质细胞是BrdU阳性的,这表明它们募集自在双环己酮草酰二腙诱导的脱髓鞘期间分化的祖细胞。
实施例6
Sema6A可能在实验性变态反应性脑脊髓炎(EAE)中发挥作用
为了诱导EAE,使用了基于小鼠髓鞘少突胶质细胞糖蛋白(MOG)序列35-55的20个氨基酸的肽。将开始EAE的当天作为实验的第一天,从第七天开始每日进行EAE的临床评价,根据如下原则针对疾病给小鼠评分:无疾病(0分);尾部张力(tail tone)降低(1分);后肢无力或部分瘫痪(2分);后肢完全瘫痪(3分);前和后肢瘫痪(4分);以及濒临死亡状态(5分)。这些评分反映脱髓鞘化疾病的进展。20个氨基酸的肽诱导EAE之后,Sema6A-/-小鼠比对照动物显现较少的行为缺陷。Sema6A-/-小鼠的平均分最大仅达到0.5分,而对照动物的平均分达到3.5分(数据未显示)。只有25%的Sema6A-/-小鼠显现出疾病的任何迹象(数据未显示)。这些实验表明Sema6A可在EAE诱导中以及或许更广泛地自身-免疫病理学(如多发性硬化)中发挥作用。
此外,对丛蛋白A4-/-小鼠测试EAE诱导。参见Yamamoto等,Int.Immunol.DOI:10.1093/intimm/dxn006(2008年1月)。尽管Sema6A-/-小鼠如上所述表现出EAE抗性,但丛蛋白A4-/-小鼠表现出对EAE诱导增强的敏感性。参见,同上。此外,在Sema6A-/-和丛蛋白A4-/-小鼠中均进行体外T细胞增殖分析。参见,同上。尽管丛蛋白A4-/-小鼠显示出显著增强的T细胞增殖,但Sema6A-/-小鼠在T细胞增殖上未显示出差异。参见,同上。这一信息表明Sema6A-/-小鼠中的EAE抗性可能不是由于Sema6A-/-小鼠中的免疫应答异常。
实施例7
Sema6A多肽在人类多发性硬化病变组织中表达
为了确定Sema6A的表达在人类MS病变组织和非病变组织中是否有差异,在人类MS组织(新皮层样品)中通过标准原位杂交和免疫染色测量Sema6A的表达。MS组织获自Salpêtrière医院的Fédération de Neurologie(神经病学联合会),75013巴黎。进行标准原位杂交。组织通过浸在4%多聚甲醛中固定,并包埋入石蜡中。对于原位杂交,组织切片首先在二甲苯(3×5分钟)中脱蜡,然后使切片连续通过递减梯度的乙醇(100%、80%、70%、50%)以及最终水和PBS来进行重新水化。组织切片在4%PFA中后固定10分钟,PBS pH 7.4冲洗,在37℃下用蛋白酶K处理15分钟(50μg/ml;Invitrogen,Carlsbad,CA),在4%PFA中后固定5分钟,PBS中冲洗,乙酰化,然后通过连续的乙醇浴(50%、70%、80%、100%)脱水。切片在68℃下于杂交缓冲液中孵育2小时,如实施例1所示的处理。切片在室温下于杂交缓冲液(50%甲酰胺、5×SSC、1×Denhardt′s、250μg/ml酵母tRNA和500μg/ml鲱鱼精子,pH 7.4)中孵育2小时,然后将组织切片和洋地黄毒苷-标记的Sema6A核糖核酸探针(0.5ng/μl)在72℃下杂交过夜。杂交后,切片在2×SSC中72℃下漂洗2小时,并在室温下在含有10%正常山羊血清(NGS)的0.1M Tris,pH 7.5,0.15M NaCl(B1)中封闭1小时。封闭后,在室温下,将切片和碱性磷酸酶(1:5000;Roche Diagnostics)轭合的抗-洋地黄毒苷抗体在含有1%NGS的B1中孵育过夜。再次冲洗后,用氯化硝基四氮唑蓝(NBT)(337.5μg/ml)和5-溴-4-氯-3-吲哚基磷酸酯(BCIP)(175μg/ml)(Roche Diagnostics)检测碱性磷酸酶活性。如图8A和8B所示,Sema6A mRNA广泛表达于人类MS病变组织中,但不在非病变组织中表达。
还进行MS病变组织和非病变组织的免疫染色来显示人类MS病变组织高度表达Sema6A。在室温(RT)下在含有0.2%明胶(Prolabo,Fontenay-sous-Bois,France)和0.25%Triton X-100的PBS(PBS-G-T)中封闭组织切片1小时,然后在RT下用来自R&Dsystems(Minneapolis,MN)的抗-人类Sema6A抗体孵育过夜。然后在室温下用稀释于PBS-G-T中的CY3-轭合的抗体(JacksonImmunoresearch)将切片孵育1小时。在PBS-G-T(3×10分钟)中漂洗后,将切片装载在Mowiol(Calbiochem/Merck,Carlstadt,Germany)中。如图8C所示,MS病变组织显示高水平的Sema6A表达,而非病变组织表现很少或没有Sema6A表达(图8A和8B)。
为了确定Sema6A表达作为生物标志物的可能用途,也在非MS患者的组织当中测量了Sema6A表达,Sema6A在非-MS患者中不表达(数据未显示)。众所周知血液细胞(如树突细胞)表达Sema6A。参见,Gautier等,Immunopath.Infect.Dis.168(2):453-465(2006)。树突细胞也被认为出现在脑脊液(CSF)中。参见Pashenkov等,Brain 124(3):480-492(2001)。
考虑到Sema6A在树突细胞上的表达以及MS病变组织和非病变组织间的差异Sema6A表达,从待测试MS疾病状态的人收集试样如组织(如皮肤组织)、或体液(如血液或CSF)。通过如ELISA测试试样的Sema6A表达。液体中存在特定水平时可指示可能的MS或患MS的可能性。在其他实施方式中,这种分析可用于测量具体的MS治疗的有效性。如果血清或CSF呈现Sema6A表达,则被抽取血清的人疑似有MS。可选择地,可以浓缩来自收集试样的树突细胞,然后试样中的Sema6A可以使用如ELISA测量。根据这种方法,Sema6A检测可用作事实上的或潜在的MS疾病的标志物。
实施例8
Sema6A多肽和丛蛋白-A2多肽相互作用
为了确定Sema6A多肽和丛蛋白-A2多肽间的相互作用,将重组Fc-二聚化的AP-标签Sema6A胞外结构域(细胞外结构域)(AP-Sema6Aect-Fc)加入到表达全长小鼠丛蛋白-A2多肽的小鼠成纤维细胞系细胞(L细胞)中,如Suto等,J.Neurosci.25:3628-3637(2005)中所述。为了制备重组Sema6A胞外结构域,将小鼠Sema6A的胞外结构域的相应序列(Sema6Aect;氨基酸18-648)进行扩增并插入到Aptag-4载体(由哈佛医学院的Dr.J.Flanagan惠赠,Boston,MA)(AP-Sema6Aect)中。参见Flanagan等,MethodsEnzymol327:17-35(2000)。为了将重组蛋白二聚化,将编码AP-Sema6Aect的片段插入到pEF-Fc(AP-Sema6Aect-Fc;AP-Sema6Bect-Fc;pEF-Fc表达载体由大阪大学的Dr.S.Nagata惠赠)中。利用Lipofectamine Plus(Invitrogen,Carlsbad,CA)用pEF-AP-Sema6Aect-Fc(pCAGGS表达载体由大阪大学的Dr.J.Miyazaki惠赠)转柒人类胚胎肾293T(HEK293T)细胞,并在含有10%胎牛血清(FBS)的DMEM中,在5%CO2中37℃下培养5-7天。收集培养物上清液并用0.22μm滤器过滤。
为了产生丛蛋白-A2表达L细胞,使编码全长小鼠丛蛋白-A2蛋白的cDNA侧翼带有小鼠Sema3A的信号序列,在N-端加入myc-标签(GGEQKLISEEDL:SEQ ID NO:17),然后连接至表达载体pCAGGS中。根据磷酸钙法(Chen和Okayama,Mol.Cell Biol.7:2745-2752,1987)用丛蛋白-A2表达载体和pST-neoB对L细胞共转染(Katoh等,Cell Struct.Funct.12:575-580,1987),并用GENETICIN(GIBCO)筛选。用DH10培养基培养L细胞。使用抗-myc抗体9E10通过免疫染色分离稳定表达丛蛋白-A2蛋白的细胞系。参见Evan等,Mol.Cell Biol.5:3610-3616,1985。
为了显示Sema6A对丛蛋白-A2的结合,用含有1%FBS和AP-Sema6Aect-Fc重组蛋白(培养上清液)、具有0.5mg/ml BSA、0.1%NaN3和20mM HEPES,pH 7.0(HBHA溶液)的250μlHBSS在冰上将稳定表达全长小鼠丛蛋白-A2蛋白的L-细胞孵育1小时,如Flanagan和Leder,Cell 63:185-194(1990)中所述。除去HBHA溶液之后,用补充有0.1%Triton X-100的250μl10mM Tris-HCl,pH 8.0处理细胞,从而溶解结合至细胞表面的重组蛋白。将细胞裂解物进行比色分析来测量AP活性,如Flanagan和Leder,Cell 63:185-194(1990)以及Flanagan等,Methods Enzymol327:17-35(2000)中所述。
显示Fc-二聚化的重组AP-标签Sema6A胞外结构域和丛蛋白-A2表达L细胞以高亲和力结合。Sema6A和丛蛋白-A2间相互作用的解离常数(Kd)值是3.21nM(数据未显示)。该Kd值同Sema6A和丛蛋白-A4间相互作用的Kd值具有可比性,即3.56nM),如Suto等,J.Neurosci.25:3628-3637(2005)中所述。
实施例9
丛蛋白-A2中的单突变可除去对Sema6A的结合
为了确定丛蛋白-A2/丛蛋白-A4对Sema6A的结合位点,对C57BL6/J突变小鼠(即NMF454)进行检测。NMF454小鼠(由Dr S.Ackerman惠赠,Jackson Labs,Bar Harbor,USA)是在C57BL6/J小鼠的隐性、基因组-范围N-乙基N-亚硝基脲(ENU)的诱变筛选中鉴别的。NML454突变小鼠的组织学分析揭示小脑细胞过多的分子层显现出同丛蛋白-A2和Sema6A无效小鼠的惊人相似,Renaud等,Nature Neuroscience,出版中(2008)。
为了确定NMF454突变是否发生在丛蛋白-A2或Sema6A基因中,进行了使用微卫星标志物的基因定位(gene mapping)。显示NMF454表型的F2后代(n=11)是从谱图交叉(C57BL6/J×BALB/cBy)通过F1子代互交产生的,然后对受影响的F2后代进行组织学鉴定。然后用分别同丛蛋白-A2和Sema6A基因紧密连锁的多态微卫星标志物D1Mit155和D18Mit178对F2后代确定基因型。没有发现同D18Mit178的连锁(X2=1.2;P>0.5)。然而,观察到了和D1Mit155的紧密连锁(X2=33.0;P<0.0001)。这一结果,结合表型分析,表明NMF454突变位于丛蛋白-A2基因(Plxna2)中。
为了确定突变的确切位置,在小脑和新皮层中进行丛蛋白-A2表达的western印记分析。western印记分析揭示一条约250kDa的带出现在NMF454纯合突变小鼠(n=2)、野生型和NMF454杂合对照(n=2)中,但是没有出现在规则丛蛋白-A2敲除系中,如图9A所示。这一数据表明ENU突变不造成无效等位基因或截短的丛蛋白-A2蛋白。为了进一步定位突变,从NMF454纯合突变体(n=3)以及野生型对照(n=2)的基因组DNA中对丛蛋白-A2基因(Plxna2)的所有外显子完全测序。这揭示1187位置的胞嘧啶被腺嘌呤的单核苷酸取代导致丙氨酸(396)被谷氨酸残基替换。此外,脊椎动物丛蛋白-A序列的比对揭示位于脑信号蛋白结构域的丙氨酸在Sema6A受体(即丛蛋白-A2和丛蛋白-A4蛋白)中是进化保守的(图9B)。然而,该比对显示丙氨酸(396)在丛蛋白-A 1和丛蛋白-A3中是不存在的,不认为丛蛋白-A1和丛蛋白-A3结合Sema6A(图9B)。参见Suto等,J.Neurosci.25:3628(2005);还参见Suto等,Neuron 53:535(2007)。
为了确定在NMF454纯合突变体中的丙氨酸(396)突变是否干扰丛蛋白-A2对Sema6A的结合,使用QuikChange II XL定位诱变试剂盒(Stratagene)进行定向诱变,将相同的胞嘧啶1187点突变(GCG变成GAG)引入丛蛋白-A2cDNA中。用于诱变的引物如下:
正向引物(SEQ ID NO:18):
5’-GCAGTGCACCAAGGAGCCTGTCCCAATCG-3’
反向引物(SEQ ID NO:19):
5’-CGATTGGGACAGGCTCCTTGGTGCACTGC-3’
对突变构建体(丛蛋白-A2A396E)进行完全测序,从而确认只有胞嘧啶1187被腺嘌呤替换。
然后在COS7细胞中表达这种丛蛋白-A2A396E cDNA,并使用和实施例8中所示的相同方法测试其结合Sema6A-AP的能力。参见Suto等,Neuron 53:5354(2007)。结合分析的结果显示Sema6A-AP和表达野生型丛蛋白-A2的COS7细胞结合非常强烈(图9C)。然而,Sema6A-AP根本不结合表达丛蛋白-A2A396E的细胞(图9D),尽管野生型和突变蛋白两者看上去表达水平相似。
序列表
<110>比奥根艾迪克MA公司
国家科学研究院
皮埃尔与玛丽居里大学
沙·米
弗雷德里克·伯纳德
阿莱恩·舍多塔尔
<120>促进髓鞘形成和少突胶质细胞分化的方法
<130>2159.127PC01/EJH/C-K
<140>待指定
<141>同此
<150>US 60/898,992
<151>2007-02-02
<160>19
<170>PatentIn 3.3版本
<210>1
<211>3862
<212>DNA
<213>人类
<400>1
ggcacgaggc tgcagccaac tccgctcccc gcgcactcgg ctgcccaggc gctcggaacc 60
cagcagcggc gctcctccgc ggtgccggtc gcccgcgatg cccgcttagc agcgtgtagc 120
agcggccagc atcaccacac ccgcggcacc gcgctgccgg ccgcagagcc gggccagagc 180
cttgcccccc tcccccagcc cccaccccgc cccccgccct gaaatgactt gttaatcggc 240
gcagacacca ccaaggggac tcaccgaagt ggaatccaag tggaatttgg atttggagaa 300
gagtttcttg aacatttacc ctcttccttg ttggttttct ttttcttttt cttctttttt 360
tttttggctt cttttttcct ctccccttct ccgctcgtca ttggagatga acacatcgcg 420
tttgcatccc agaaagtagt cgccgcgact atttccccca aagagacaag cacacatgta 480
ggaatgacaa aggcttgcga aggagagagc cgcagccgcg gcccggagag atcccctcga 540
taatggatta ctaaatggga tacacgctgt accagttcgc tccgagcccc ggccgcctgt 600
ccgtcgatgc accgaaaagg gtgaagtaga gaaataaagt ctccccgctg aactactatg 660
aggtcagaag ccttgctgct atatttcaca ctgctacact ttgctggggc tggtttccca 720
gaagattctg agccaatcag tatttcgcat ggcaactata caaaacagta tccggtgttt 780
gtgggccaca agccaggacg gaacaccaca cagaggcaca ggctggacat ccagatgatt 840
atgatcatga acggaaccct ctacattgct gctagggacc atatttatac tgttgatata 900
gacacatcac acacggaaga aatttattgt agcaaaaaac tgacatggaa atctagacag 960
gccgatgtag acacatgcag aatgaaggga aaacataagg atgagtgcca caactttatt 1020
aaagttcttc taaagaaaaa cgatgatgca ttgtttgtct gtggaactaa tgccttcaac 1080
ccttcctgca gaaactataa gatggataca ttggaaccat tcggggatga attcagcgga 1140
atggccagat gcccatatga tgccaaacat gccaacgttg cactgtttgc agatggaaaa 1200
ctatactcag ccacagtgac tgacttcctt gccattgacg cagtcattta ccggagtctt 1260
ggagaaagcc ctaccctgcg gaccgtcaag cacgattcaa aatggttgaa agaaccatac 1320
tttgttcaag ccgtggatta cggagattat atctacttct tcttcaggga aatagcagtg 1380
gagtataaca ccatgggaaa ggtagttttc ccaagagtgg ctcaggtttg taagaatgat 1440
atgggaggat ctcaaagagt cctggagaaa cagtggacgt cgttcctgaa ggcgcgcttg 1500
aactgctcag ttcctggaga ctctcatttt tatttcaaca ttctccaggc agttacagat 1560
gtgattcgta tcaacgggcg tgatgttgtc ctggcaacgt tttctacacc ttataacagc 1620
atccctgggt ctgcagtctg tgcctatgac atgcttgaca ttgccagtgt ttttactggg 1680
agattcaagg aacagaagtc tcctgattcc acctggacac cagttcctga tgaacgagtt 1740
cctaagccca ggccaggttg ctgtgctggc tcatcctcct tagaaagata tgcaacctcc 1800
aatgagttcc ctgatgatac cctgaacttc atcaagacgc acccgctcat ggatgaggca 1860
gtgccctcca tcttcaacag gccatggttc ctgagaacaa tggtcagata ccgccttacc 1920
aaaattgcag tggacacagc tgctgggcca tatcagaatc acactgtggt ttttctggga 1980
tcagagaagg gaatcatctt gaagtttttg gccagaatag gaaatagtgg ttttctaaat 2040
gacagccttt tcctggagga gatgagtgtt tacaactctg aaaaatgcag ctatgatgga 2100
gtcgaagaca aaaggatcat gggcatgcag ctggacagag caagcagctc tctgtatgtt 2160
gcgttctcta cctgtgtgat aaaggttccc cttggccggt gtgaacgaca tgggaagtgt 2220
aaaaaaacct gtattgcctc cagagaccca tattgtggat ggataaagga aggtggtgcc 2280
tgcagccatt tatcacccaa cagcagactg acttttgagc aggacataga gcgtggcaat 2340
acagatggtc tgggggactg tcacaattcc tttgtggcac tgaatgggca ttccagttcc 2400
ctcttgccca gcacaaccac atcagattcg acggctcaag aggggtatga gtctagggga 2460
ggaatgctgg actggaagca tctgcttgac tcacctgaca gcacagaccc tttgggggca 2520
gtgtcttccc ataatcacca agacaagaag ggagtgattc gggaaagtta cctcaaaggc 2580
cacgaccagc tggttcccgt caccctcttg gccattgcag tcatcctggc tttcgtcatg 2640
ggggccgtct tctcgggcat caccgtctac tgcgtctgtg atcatcggcg caaagacgtg 2700
gctgtggtgc agcgcaagga gaaggagctc acccactcgc gccggggctc catgagcagc 2760
gtcaccaagc tcagcggcct ctttggggac actcaatcca aagacccaaa gccggaggcc 2820
atcctcacgc cactcatgca caacggcaag ctcgccactc ccggcaacac ggccaagatg 2880
ctcattaaag cagaccagca ccacctggac ctgacggccc tccccacccc agagtcaacc 2940
ccaacgctgc agcagaagcg gaagcccagc cgcggcagcc gcgagtggga gaggaaccag 3000
aacctcatca atgcctgcac aaaggacatg ccccccatgg gctcccctgt gattcccacg 3060
gacctgcccc tgcgggcctc ccccagccac atccccagcg tggtggtcct gcccatcacg 3120
cagcagggct accagcatga gtacgtggac cagcccaaaa tgagcgaggt ggcccagatg 3180
gcgctggagg accaggccgc cacactggag tataagacca tcaaggaaca tctcagcagc 3240
aagagtccca accatggggt gaaccttgtg gagaacctgg acagcctgcc ccccaaagtt 3300
ccacagcggg aggcctccct gggtcccccg ggagcctccc tgtctcagac cggtctaagc 3360
aagcggctgg aaatgcacca ctcctcttcc tacggggttg actataagag gagctacccc 3420
acgaactcgc tcacgagaag ccaccaggcc accactctca aaagaaacaa cactaactcc 3480
tccaattcct ctcacctctc cagaaaccag agctttggca ggggagacaa cccgccgccc 3540
gccccgcaga gggtggactc catccaggtg cacagctccc agccatctgg ccaggccgtg 3600
actgtctcga ggcagcccag cctcaacgcc tacaactcac tgacaaggtc ggggctgaag 3660
cgtacgccct cgctaaagcc ggacgtaccc cccaaaccat cctttgctcc cctttccaca 3720
tccatgaagc ccaatgatgc gtgtacataa tcccaggggg agggggtcag gtgtcgaacc 3780
agcaggcaag gcgaggtgcc cgctcagctc agcaaggttc tcaactgcct cgagtaccca 3840
ccagaccaag aaggcctgcg gc 3862
<210>2
<211>1030
<212>PRT
<213>人类
<400>2
Met Arg Ser Glu Ala Leu Leu Leu Tyr Phe Thr Leu Leu His Phe Ala
1 5 10 15
Gly Ala Gly Phe Pro Glu Asp Ser Glu Pro Ile Ser Ile Ser His Gly
20 25 30
Asn Tyr Thr Lys Gln Tyr Pro Val Phe Val Gly His Lys Pro Gly Arg
35 40 45
Asn Thr Thr Gln Arg His Arg Leu Asp Ile Gln Met Ile Met Ile Met
50 55 60
Asn Gly Thr Leu Tyr Ile Ala Ala Arg Asp His Ile Tyr Thr Val Asp
65 70 75 80
Ile Asp Thr Ser His Thr Glu Glu Ile Tyr Cys Ser Lys Lys Leu Thr
85 90 95
Trp Lys Ser Arg Gln Ala Asp Val Asp Thr Cys Arg Met Lys Gly Lys
100 105 110
His Lys Asp Glu Cys His Asn Phe Ile Lys Val Leu Leu Lys Lys Asn
115 120 125
Asp Asp Ala Leu Phe Val Cys Gly Thr Asn Ala Phe Asn Pro Ser Cys
130 135 140
Arg Asn Tyr Lys Met Asp Thr Leu Glu Pro Phe Gly Asp Glu Phe Ser
145 150 155 160
Gly Met Ala Arg Cys Pro Tyr Asp Ala Lys His Ala Asn Val Ala Leu
165 170 175
Phe Ala Asp Gly Lys Leu Tyr Ser Ala Thr Val Thr Asp Phe Leu Ala
180 185 190
Ile Asp Ala Val Ile Tyr Arg Ser Leu Gly Glu Ser Pro Thr Leu Arg
195 200 205
Thr Val Lys His Asp Ser Lys Trp Leu Lys Glu Pro Tyr Phe Val Gln
210 215 220
Ala Val Asp Tyr Gly Asp Tyr Ile Tyr Phe Phe Phe Arg Glu Ile Ala
225 230 235 240
Val Glu Tyr Asn Thr Met Gly Lys Val Val Phe Pro Arg Val Ala Gln
245 250 255
Val Cys Lys Asn Asp Met Gly Gly Ser Gln Arg Val Leu Glu Lys Gln
260 265 270
Trp Thr Ser Phe Leu Lys Ala Arg Leu Asn Cys Ser Val Pro Gly Asp
275 280 285
Ser His Phe Tyr Phe Asn Ile Leu Gln Ala Val Thr Asp Val Ile Arg
290 295 300
Ile Asn Gly Arg Asp Val Val Leu Ala Thr Phe Ser Thr Pro Tyr Asn
305 310 315 320
Ser Ile Pro Gly Ser Ala Val Cys Ala Tyr Asp Met Leu Asp Ile Ala
325 330 335
Ser Val Phe Thr Gly Arg Phe Lys Glu Gln Lys Ser Pro Asp Ser Thr
340 345 350
Trp Thr Pro Val Pro Asp Glu Arg Val Pro Lys Pro Arg Pro Gly Cys
355 360 365
Cys Ala Gly Ser Ser Ser Leu Glu Arg Tyr Ala Thr Ser Asn Glu Phe
370 375 380
Pro Asp Asp Thr Leu Asn Phe Ile Lys Thr His Pro Leu Met Asp Glu
385 390 395 400
Ala Val Pro Ser Ile Phe Asn Arg Pro Trp Phe Leu Arg Thr Met Val
405 410 415
Arg Tyr Arg Leu Thr Lys Ile Ala Val Asp Thr Ala Ala Gly Pro Tyr
420 425 430
Gln Asn His Thr Val Val Phe Leu Gly Ser Glu Lys Gly Ile Ile Leu
435 440 445
Lys Phe Leu Ala Arg Ile Gly Asn Ser Gly Phe Leu Asn Asp Ser Leu
450 455 460
Phe Leu Glu Glu Met Ser Val Tyr Asn Ser Glu Lys Cys Ser Tyr Asp
465 470 475 480
Gly Val Glu Asp Lys Arg Ile Met Gly Met Gln Leu Asp Arg Ala Ser
485 490 495
Ser Ser Leu Tyr Val Ala Phe Ser Thr Cys Val Ile Lys Val Pro Leu
500 505 510
Gly Arg Cys Glu Arg His Gly Lys Cys Lys Lys Thr Cys Ile Ala Ser
515 520 525
Arg Asp Pro Tyr Cys Gly Trp Ile Lys Glu Gly Gly Ala Cys Ser His
530 535 540
Leu Ser Pro Asn Ser Arg Leu Thr Phe Glu Gln Asp Ile Glu Arg Gly
545 550 555 560
Asn Thr Asp Gly Leu Gly Asp Cys His Asn Ser Phe Val Ala Leu Asn
565 570 575
Gly His Ser Ser Ser Leu Leu Pro Ser Thr Thr Thr Ser Asp Ser Thr
580 585 590
Ala Gln Glu Gly Tyr Glu Ser Arg Gly Gly Met Leu Asp Trp Lys His
595 600 605
Leu Leu Asp Ser Pro Asp Ser Thr Asp Pro Leu Gly Ala Val Ser Ser
610 615 620
His Asn His Gln Asp Lys Lys Gly Val Ile Arg Glu Ser Tyr Leu Lys
625 630 635 640
Gly His Asp Gln Leu Val Pro Val Thr Leu Leu Ala Ile Ala Val Ile
645 650 655
Leu Ala Phe Val Met Gly Ala Val Phe Ser Gly Ile Thr Val Tyr Cys
660 665 670
Val Cys Asp His Arg Arg Lys Asp Val Ala Val Val Gln Arg Lys Glu
675 680 685
Lys Glu Leu Thr His Ser Arg Arg Gly Ser Met Ser Ser Val Thr Lys
690 695 700
Leu Ser Gly Leu Phe Gly Asp Thr Gln Ser Lys Asp Pro Lys Pro Glu
705 710 715 720
Ala Ile Leu Thr Pro Leu Met His Asn Gly Lys Leu Ala Thr Pro Gly
725 730 735
Asn Thr Ala Lys Met Leu Ile Lys Ala Asp Gln His His Leu Asp Leu
740 745 750
Thr Ala Leu Pro Thr Pro Glu Ser Thr Pro Thr Leu Gln Gln Lys Arg
755 760 765
Lys Pro Ser Arg Gly Ser Arg Glu Trp Glu Arg Asn Gln Asn Leu Ile
770 775 780
Asn Ala Cys Thr Lys Asp Met Pro Pro Met Gly Ser Pro Val Ile Pro
785 790 795 800
Thr Asp Leu Pro Leu Arg Ala Ser Pro Ser His Ile Pro Ser Val Val
805 810 815
Val Leu Pro Ile Thr Gln Gln Gly Tyr Gln His Glu Tyr Val Asp Gln
820 825 830
Pro Lys Met Ser Glu Val Ala Gln Met Ala Leu Glu Asp Gln Ala Ala
835 840 845
Thr Leu Glu Tyr Lys Thr Ile Lys Glu His Leu Ser Ser Lys Ser Pro
850 855 860
Asn His Gly Val Asn Leu Val Glu Asn Leu Asp Ser Leu Pro Pro Lys
865 870 875 880
Val Pro Gln Arg Glu Ala Ser Leu Gly Pro Pro Gly Ala Ser Leu Ser
885 890 895
Gln Thr Gly Leu Ser Lys Arg Leu Glu Met His His Ser Ser Ser Tyr
900 905 910
Gly Val Asp Tyr Lys Arg Ser Tyr Pro Thr Asn Ser Leu Thr Arg Ser
915 920 925
His Gln Ala Thr Thr Leu Lys Arg Asn Asn Thr Asn Ser Ser Asn Ser
930 935 940
Ser His Leu Ser Arg Ash Gln Ser Phe Gly Arg Gly Asp Asn Pro Pro
945 950 955 960
Pro Ala Pro Gln Arg Val Asp Ser Ile Gln Val His Ser Ser Gln Pro
965 970 975
Ser Gly Gln Ala Val Thr Val Ser Arg Gln Pro Ser Leu Asn Ala Tyr
980 985 990
Asn Ser Leu Thr Arg Ser Gly Leu Lys Arg Thr Pro Ser Leu Lys Pro
995 1000 1005
Asp Val Pro Pro Lys Pro Ser Phe Ala Pro Leu Ser Thr Ser Met
1010 1015 1020
Lys Pro Asn Asp Ala Cys Thr
1025 1030
<210>3
<211>4244
<212>DNA
<213>人类
<400>3
atcgcgtttg catcccagaa agtagtcgcc gcgactattt cccccaaaga gacaagcaca 60
catgtaggaa tgacaaaggc ttgcgaagga gagagcgcag cccgcggccc ggagagatcc 120
cctcgataat ggattactaa atgggataca cgctgtacca gttcgctccg agccccggcc 180
gcctgtccgt cgatgcaccg aaaagggtga agtagagaaa taaagtctcc ccgctgaact 240
actatgaggt cagaagcctt gctgctatat ttcacactgc tacactttgc tggggctggt 300
ttcccagaag attctgagcc aatcagtatt tcgcatggca actatacaaa acagtatccg 360
gtgtttgtgg gccacaagcc aggacggaac accacacaga ggcacaggct ggacatccag 420
atgattatga tcatgaacgg aaccctctac attgctgcta gggaccatat ttatactgtt 480
gatatagaca catcacacac ggaagaaatt tattgtagca aaaaactgac atggaaatct 540
agacaggccg atgtagacac atgcagaatg aagggaaaac ataaggatga gtgccacaac 600
tttattaaag ttcttctaaa gaaaaacgat gatgcattgt ttgtctgtgg aactaatgcc 660
ttcaaccctt cctgcagaaa ctataagatg gatacattgg aaccattcgg ggatgaattc 720
agcggaatgg ccagatgccc atatgatgcc aaacatgcca acgttgcact gtttgcagat 780
ggaaaactat actcagccac agtgactgac ttccttgcca ttgacgcagt catttaccgg 840
agtcttggag aaagccctac cctgcggacc gtcaagcacg attcaaaatg gttgaaagaa 900
ccatactttg ttcaagccgt ggattacgga gattatatct acttcttctt cagggaaata 960
gcagtggagt ataacaccat gggaaaggta gttttcccaa gagtggctca ggtttgtaag 1020
aatgatatgg gaggatctca aagagtcctg gagaaacagt ggacgtcgtt cctgaaggcg 1080
cgcttgaact gctcagttcc tggagactct catttttatt tcaacattct ccaggcagtt 1140
acagatgtga ttcgtatcaa cgggcgtgat gttgtcctgg caacgttttc tacaccttat 1200
aacagcatcc ctgggtctgc agtctgtgcc tatgacatgc ttgacattgc cagtgttttt 1260
actgggagat tcaaggaaca gaagtctcct gattccacct ggacaccagt tcctgatgaa 1320
cgagttccta agcccaggcc aggttgctgt gctggctcat cctccttaga aagatatgca 1380
acctccaatg agttccctga tgataccctg aacttcatca agacgcaccc gctcatggat 1440
gaggcagtgc cctccatctt caacaggcca tggttcctga gaacaatggt cagataccgc 1500
cttaccaaaa ttgcagtgga cacagctgct gggccatatc agaatcacac tgtggttttt 1560
ctgggatcag agaagggaat catcttgaag tttttggcca gaataggaaa tagtggtttt 1620
ctaaatgaca gccttttcct ggaggagatg agtgtttaca actctgaaaa atgcagctat 1680
gatggagtcg aagacaaaag gatcatgggc atgcagctgg acagagcaag cagctctctg 1740
tatgttgcgt tctctacctg tgtgataaag gttccccttg gccggtgtga acgacatggg 1800
aagtgtaaaa aaacctgtat tgcctccaga gacccatatt gtggatggat aaaggaaggt 1860
ggtgcctgca gccatttatc acccaacagc agactgactt ttgagcagga catagagcgt 1920
ggcaatacag atggtctggg ggactgtcac aattcctttg tggcactgaa tgacatttca 1980
actcctctac cagataatga aatgtcttac aacacagtgt atgggcattc cagttccctc 2040
ttgcccagca caaccacatc agattcgacg gctcaagagg ggtatgagtc taggggagga 2100
atgctggact ggaagcatct gcttgactca cctgacagca cagacccttt gggggcagtg 2160
tcttcccata atcaccaaga caagaaggga gtgattcggg aaagttacct caaaggccac 2220
gaccagctgg ttcccgtcac cctcttggcc attgcagtca tcctggcttt cgtcatgggg 2280
gccgtcttct cgggcatcac cgtctactgc gtctgtgatc atcggcgcaa agacgtggct 2340
gtggtgcagc gcaaggagaa ggagctcacc cactcgcgcc ggggctccat gagcagcgtc 2400
accaagctca gcggcctctt tggggacact caatccaaag acccaaagcc ggaggccatc 2460
ctcacgccac tcatgcacaa cggcaagctc gccactcccg gcaacacggc caagatgctc 2520
attaaagcag accagcacca cctggacctg acggccctcc ccaccccaga gtcaacccca 2580
acgctgcagc agaagcggaa gcccagccgc ggcagccgcg agtgggagag gaaccagaac 2640
ctcatcaatg cctgcacaaa ggacatgccc cccatgggct cccctgtgat tcccacggac 2700
ctgcccctgc gggcctcccc cagccacatc cccagcgtgg tggtcctgcc catcacgcag 2760
cagggctacc agcatgagta cgtggaccag cccaaaatga gcgaggtggc ccagatggcg 2820
ctggaggacc aggccgccac actggagtat aagaccatca aggaacatct cagcagcaag 2880
agtcccaacc atggggtgaa ccttgtggag aacctggaca gcctgccccc caaagttcca 2940
cagcgggagg cctccctggg tcccccggga gcctccctgt ctcagaccgg tctaagcaag 3000
cggctggaaa tgcaccactc ctcttcctac ggggttgact ataagaggag ctaccccacg 3060
aactcgctca cgagaagcca ccaggccacc actctcaaaa gaaacaacac taactcctcc 3120
aattcctctc acctctccag aaaccagagc tttggcaggg gagacaaccc gccgcccgcc 3180
ccgcagaggg tggactccat ccaggtgcac agctcccagc catctggcca ggccgtgact 3240
gtctcgaggc agcccagcct caacgcctac aactcactga caaggtcggg gctgaagcgt 3300
acgccctcgc taaagccgga cgtacccccc aaaccatcct ttgctcccct ttccacatcc 3360
atgaagccca atgatgcgtg tacataatcc cagggggagg gggtcaggtg tcgaaccagc 3420
aggcaaggcg aggtgcccgc tcagctcagc aaggttctca actgcctcga gtacccacca 3480
gaccaagaag gcctgcggca gagccgagga cgctgggtcc tcctctctgg gacacagggg 3540
tactcacgaa aactgggccg cgtggtttgg tgaaggtttg caacggcggg gactcacctt 3600
cattctcttc cttcactttc ccccacaccc tacaacaggt cggacccaca aaagacttca 3660
gttatcatca caaacatgag ccaaaagcac atacctaccc catcccccac ccccacacac 3720
acacacacat gcacacaaca catacacaca cacgcacaga ggtgaacaga aactgaaaca 3780
ttttgtccac aacttcacgg gacgtggcca gactgggttt gcgttccaac ctgcaaaaca 3840
caaatacatt ttttaaaatc aagaaaattt aaaaagacaa aaaaaaaaga attcattgat 3900
aattctaact cagactttaa caatggcaga agtttactat gcgcaaatac tgtgaaatgc 3960
ccgccagtgt tacagctttc tgttgcagca gataaatgcc atgttgggca actatgtcat 4020
agatttctgc tcctcctctc ttttaatgaa ataacgtgac cgttaacgca agtaactctt 4080
tatttattgt tcaccctttt tttccttaag gaaaggactc ttccaaatat catcctatga 4140
acagctcttc agaaagccca ttgaaagtta aactatttaa cgtgaaatcc attaactgga 4200
ataattgagt ttctttattt ttacaataaa ttcactgagt aaat 4244
<210>4
<211>1047
<212>PRT
<213>人类
<400>4
Met Arg Ser Glu Ala Leu Leu Leu Tyr Phe Thr Leu Leu His Phe Ala
1 5 10 15
Gly Ala Gly Phe Pro Glu Asp Ser Glu Pro Ile Ser Ile Ser His Gly
20 25 30
Asn Tyr Thr Lys Gln Tyr Pro Val Phe Val Gly His Lys Pro Gly Arg
35 40 45
Asn Thr Thr Gln Arg His Arg Leu Asp Ile Gln Met Ile Met Ile Met
50 55 60
Asn Gly Thr Leu Tyr Ile Ala Ala Arg Asp His Ile Tyr Thr Val Asp
65 70 75 80
Ile Asp Thr Ser His Thr Glu Glu Ile Tyr Cys Ser Lys Lys Leu Thr
85 90 95
Trp Lys Ser Arg Gln Ala Asp Val Asp Thr Cys Arg Met Lys Gly Lys
100 105 110
His Lys Asp Glu Cys His Asn Phe Ile Lys Val Leu Leu Lys Lys Asn
115 120 125
Asp Asp Ala Leu Phe Val Cys Gly Thr Asn Ala Phe Asn Pro Ser Cys
130 135 140
Arg Asn Tyr Lys Met Asp Thr Leu Glu Pro Phe Gly Asp Glu Phe Ser
145 150 155 160
Gly Met Ala Arg Cys Pro Tyr Asp Ala Lys His Ala Asn Val Ala Leu
165 170 175
Phe Ala Asp Gly Lys Leu Tyr Ser Ala Thr Val Thr Asp Phe Leu Ala
180 185 190
Ile Asp Ala Val Ile Tyr Arg Ser Leu Gly Glu Ser Pro Thr Leu Arg
195 200 205
Thr Val Lys His Asp Ser Lys Trp Leu Lys Glu Pro Tyr Phe Val Gln
210 215 220
Ala Val Asp Tyr Gly Asp Tyr Ile Tyr Phe Phe Phe Arg Glu Ile Ala
225 230 235 240
Val Glu Tyr Asn Thr Met Gly Lys Val Val Phe Pro Arg Val Ala Gln
245 250 255
Val Cys Lys Asn Asp Met Gly Gly Ser Gln Arg Val Leu Glu Lys Gln
260 265 270
Trp Thr Ser Phe Leu Lys Ala Arg Leu Asn Cys Ser Val Pro Gly Asp
275 280 285
Ser His Phe Tyr Phe Asn Ile Leu Gln Ala Val Thr Asp Val Ile Arg
290 295 300
Ile Asn Gly Arg Asp Val Val Leu Ala Thr Phe Ser Thr Pro Tyr Asn
305 310 315 320
Ser Ile Pro Gly Ser Ala Val Cys Ala Tyr Asp Met Leu Asp Ile Ala
325 330 335
Ser Val Phe Thr Gly Arg Phe Lys Glu Gln Lys Ser Pro Asp Ser Thr
340 345 350
Trp Thr Pro Val Pro Asp Glu Arg Val Pro Lys Pro Arg Pro Gly Cys
355 360 365
Cys Ala Gly Ser Ser Ser Leu Glu Arg Tyr Ala Thr Ser Asn Glu Phe
370 375 380
Pro Asp Asp Thr Leu Asn Phe Ile Lys Thr His Pro Leu Met Asp Glu
385 390 395 400
Ala Val Pro Ser Ile Phe Asn Arg Pro Trp Phe Leu Arg Thr Met Val
405 410 415
Arg Tyr Arg Leu Thr Lys Ile Ala Val Asp Thr Ala Ala Gly Pro Tyr
420 425 430
Gln Asn His Thr Val Val Phe Leu Gly Ser Glu Lys Gly Ile Ile Leu
435 440 445
Lys Phe Leu Ala Arg Ile Gly Asn Ser Gly Phe Leu Asn Asp Ser Leu
450 455 460
Phe Leu Glu Glu Met Ser Val Tyr Asn Ser Glu Lys Cys Ser Tyr Asp
465 470 475 480
Gly Val Glu Asp Lys Arg Ile Met Gly Met Gln Leu Asp Arg Ala Ser
485 490 495
Ser Ser Leu Tyr Val Ala Phe Ser Thr Cys Val Ile Lys Val Pro Leu
500 505 510
Gly Arg Cys Glu Arg His Gly Lys Cys Lys Lys Thr Cys Ile Ala Ser
515 520 525
Arg Asp Pro Tyr Cys Gly Trp Ile Lys Glu Gly Gly Ala Cys Ser His
530 535 540
Leu Ser Pro Asn Ser Arg Leu Thr Phe Glu Gln Asp Ile Glu Arg Gly
545 550 555 560
Asn Thr Asp Gly Leu Gly Asp Cys His Asn Ser Phe Val Ala Leu Asn
565 570 575
Asp Ile Ser Thr Pro Leu Pro Asp Asn Glu Met Ser Tyr Asn Thr Val
580 585 590
Tyr Gly His Ser Ser Ser Leu Leu Pro Ser Thr Thr Thr Ser Asp Ser
595 600 605
Thr Ala Gln Glu Gly Tyr Glu Ser Arg Gly Gly Met Leu Asp Trp Lys
610 615 620
His Leu Leu Asp Ser Pro Asp Ser Thr Asp Pro Leu Gly Ala Val Ser
625 630 635 640
Ser His Asn His Gln Asp Lys Lys Gly Val Ile Arg Glu Ser Tyr Leu
645 650 655
Lys Gly His Asp Gln Leu Val Pro Val Thr Leu Leu Ala Ile Ala Val
660 665 670
Ile Leu Ala Phe Val Met Gly Ala Val Phe Ser Gly Ile Thr Val Tyr
675 680 685
Cys Val Cys Asp His Arg Arg Lys Asp Val Ala Val Val Gln Arg Lys
690 695 700
Glu Lys Glu Leu Thr His Ser Arg Arg Gly Ser Met Ser Ser Val Thr
705 7l0 715 720
Lys Leu Ser Gly Leu Phe Gly Asp Thr Gln Ser Lys Asp Pro Lys Pro
725 730 735
Glu Ala Ile Leu Thr Pro Leu Met His Asn Gly Lys Leu Ala Thr Pro
740 745 750
Gly Asn Thr Ala Lys Met Leu Ile Lys Ala Asp Gln His His Leu Asp
755 760 765
Leu Thr Ala Leu Pro Thr Pro Glu Ser Thr Pro Thr Leu Gln Gln Lys
770 775 780
Arg Lys Pro Ser Arg Gly Ser Arg Glu Trp Glu Arg Asn Gln Asn Leu
785 790 795 800
Ile Asn Ala Cys Thr Lys Asp Met Pro Pro Met Gly Ser Pro Val Ile
805 810 815
Pro Thr Asp Leu Pro Leu Arg Ala Ser Pro Ser His Ile Pro Ser Val
820 825 830
Val Val Leu Pro Ile Thr Gln Gln Gly Tyr Gln His Glu Tyr Val Asp
835 840 845
Gln Pro Lys Met Ser Glu Val Ala Gln Met Ala Leu Glu Asp Gln Ala
850 855 860
Ala Thr Leu Glu Tyr Lys Thr Ile Lys Glu His Leu Ser Ser Lys Ser
865 870 875 880
Pro Asn Hi s Gly Val Asn Leu Val Glu Asn Leu Asp Ser Leu Pro Pro
885 890 895
Lys Val Pro Gln Arg Glu Ala Ser Leu Gly Pro Pro Gly Ala Ser Leu
900 905 910
Ser Gln Thr Gly Leu Ser Lys Arg Leu Glu Met His His Ser Ser Ser
915 920 925
Tyr Gly Val Asp Tyr Lys Arg Ser Tyr Pro Thr Asn Ser Leu Thr Arg
930 935 940
Ser His Gln Ala Thr Thr Leu Lys Arg Asn Asn Thr Asn Ser Ser Asn
945 950 955 960
Ser Ser His Leu Ser Arg Asn Gln Ser Phe Gly Arg Gly Asp Asn Pro
965 970 975
Pro Pro Ala Pro Gln Arg Val Asp Ser Ile Gln Val His Ser Ser Gln
980 985 990
Pro Ser Gly Gln Ala Val Thr Val Ser Arg Gln Pro Ser Leu Asn Ala
995 1000 1005
Tyr Asn Ser Leu Thr Arg Ser Gly Leu Lys Arg Thr Pro Ser Leu
1010 1015 1020
Lys Pro Asp Val Pro Pro Lys Pro Ser Phe Ala Pro Leu Ser Thr
1025 1030 1035
Ser Met Lys Pro Asn Asp Ala Cys Thr
1040 1045
<210>5
<400>5
000
<210>6
<211>971
<212>PRT
<213>人类
<400>6
Met Arg Ser Glu Ala Leu Leu Leu Tyr Phe Thr Leu Leu His Phe Ala
1 5 10 15
Gly Ala Gly Phe Pro Glu Asp Ser Glu Pro Ile Ser Ile Ser His Gly
20 25 30
Asn Tyr Thr Lys Gln Tyr Pro Val Phe Val Gly His Lys Pro Gly Arg
35 40 45
Asn Thr Thr Gln Arg His Arg Leu Asp Ile Gln Met Ile Met Ile Met
50 55 60
Asn Gly Thr Leu Tyr Ile Ala Ala Arg Asp His Ile Tyr Thr Val Asp
65 70 75 80
Ile Asp Thr Ser His Thr Glu Glu Ile Tyr Cys Ser Lys Lys Leu Thr
85 90 95
Trp Lys Ser Arg Gln Ala Asp Val Asp Thr Cys Arg Met Lys Gly Lys
100 105 110
His Lys Asp Glu Cys His Asn Phe Ile Lys Val Leu Leu Lys Lys Asn
115 120 125
Asp Asp Ala Leu Phe Val Cys Gly Thr Asn Ala Phe Asn Pro Ser Cys
130 135 140
Arg Asn Tyr Lys Met Asp Thr Leu Glu Pro Phe Gly Asp Glu Phe Ser
145 150 155 160
Gly Met Ala Arg Cys Pro Tyr Asp Ala Lys His Ala Asn Val Ala Leu
165 170 175
Phe Ala Asp Gly Lys Leu Tyr Ser Ala Thr Val Thr Asp Phe Leu Ala
180 185 190
Ile Asp Ala Val Ile Tyr Arg Ser Leu Gly Glu Ser Pro Thr Leu Arg
195 200 205
Thr Val Lys His Asp Ser Lys Trp Leu Lys Glu Pro Tyr Phe Val Gln
210 215 220
Ala Val Asp Tyr Gly Asp Tyr Ile Tyr Phe Phe Phe Arg Glu Ile Ala
225 230 235 240
Val Glu Tyr Asn Thr Met Gly Lys Val Val Phe Pro Arg Val Ala Gln
245 250 255
Val Cys Lys Asn Asp Met Gly Gly Ser Gln Arg Val Leu Glu Lys Gln
260 265 270
Trp Thr Ser Phe Leu Lys Ala Arg Leu Asn Cys Ser Val Pro Gly Asp
275 280 285
Ser His Phe Tyr Phe Asn Ile Leu Gln Ala Val Thr Asp Val Ile Arg
290 295 300
Ile Asn Gly Arg Asp Val Val Leu Ala Thr Phe Ser Thr Pro Tyr Asn
305 310 315 320
Ser Ile Pro Gly Ser Ala Val Cys Ala Tyr Asp Met Leu Asp Ile Ala
325 330 335
Ser Val Phe Thr Gly Arg Phe Lys Glu Gln Lys Ser Pro Asp Ser Thr
340 345 350
Trp Thr Pro Val Pro Asp Glu Arg Val Pro Lys Pro Arg Pro Gly Cys
355 360 365
Cys Ala Gly Ser Ser Ser Leu Glu Arg Tyr Ala Thr Ser Asn Glu Phe
370 375 380
Pro Asp Asp Thr Leu Asn Phe Ile Lys Thr His Pro Leu Met Asp Glu
385 390 395 400
Ala Val Pro Ser Ile Phe Asn Arg Pro Trp Phe Leu Arg Thr Met Val
405 410 415
Arg Cys Ser Tyr Asp Gly Val Glu Asp Lys Arg Ile Met Gly Met Gln
420 425 430
Leu Asp Arg Ala Ser Ser Ser Leu Tyr Val Ala Phe Ser Thr Cys Val
435 440 445
Ile Lys Val Pro Leu Gly Arg Cys Glu Arg His Gly Lys Cys Lys Lys
450 455 460
Thr Cys Ile Ala Ser Arg Asp Pro Tyr Cys Gly Trp Ile Lys Glu Gly
465 470 475 480
Gly Ala Cys Ser His Leu Ser Pro Asn Ser Arg Leu Thr Phe Glu Gln
485 490 495
Asp Ile Glu Arg Gly Asn Thr Asp Gly Leu Gly Asp Cys His Asn Ser
500 505 510
Phe Val Ala Leu Asn Gly His Ser Ser Ser Leu Leu Pro Ser Thr Thr
515 520 525
Thr Ser Asp Ser Thr Ala Gln Glu Gly Tyr Glu Ser Arg Gly Gly Met
530 535 540
Leu Asp Trp Lys His Leu Leu Asp Ser Pro Asp Ser Thr Asp Pro Leu
545 550 555 560
Gly Ala Val Ser Ser His Asn His Gln Asp Lys Lys Gly Val Ile Arg
565 570 575
Glu Ser Tyr Leu Lys Gly His Asp Gln Leu Val Pro Val Thr Leu Leu
580 585 590
Ala Ile Ala Val Ile Leu Ala Phe Val Met Gly Ala Val Phe Ser Gly
595 600 605
Ile Thr Val Tyr Cys Val Cys Asp His Arg Arg Lys Asp Val Ala Val
610 615 620
Val Gln Arg Lys Glu Lys Glu Leu Thr His Ser Arg Arg Gly Ser Met
625 630 635 640
Ser Ser Val Thr Lys Leu Ser Gly Leu Phe Gly Asp Thr Gln Ser Lys
645 650 655
Asp Pro Lys Pro Glu Ala Ile Leu Thr Pro Leu Met His Asn Gly Lys
660 665 670
Leu Ala Thr Pro Gly Asn Thr Ala Lys Met Leu Ile Lys Ala Asp Gln
675 680 685
His His Leu Asp Leu Thr Ala Leu Pro Thr Pro Glu Ser Thr Pro Thr
690 695 700
Leu Gln Gln Lys Arg Lys Pro Ser Arg Gly Ser Arg Glu Trp Glu Arg
705 710 715 720
Asn Gln Asn Leu Ile Asn Ala Cys Thr Lys Asp Met Pro Pro Met Gly
725 730 735
Ser Pro Val Ile Pro Thr Asp Leu Pro Leu Arg Ala Ser Pro Ser His
740 745 750
Ile Pro Ser Val Val Val Leu Pro Ile Thr Gln Gln Gly Tyr Gln His
755 760 765
Glu Tyr Val Asp Gln Pro Lys Met Ser Glu Val Ala Gln Met Ala Leu
770 775 780
Glu Asp Gln Ala Ala Thr Leu Glu Tyr Lys Thr Ile Lys Glu His Leu
785 790 795 800
Ser Ser Lys Ser Pro Asn His Gly Val Asn Leu Val Glu Asn Leu Asp
805 810 815
Ser Leu Pro Pro Lys Val Pro Gln Arg Glu Ala Ser Leu Gly Pro Pro
820 825 830
Gly Ala Ser Leu Ser Gln Thr Gly Leu Ser Lys Arg Leu Glu Met His
835 840 845
His Ser Ser Ser Tyr Gly Val Asp Tyr Lys Arg Ser Tyr Pro Thr Asn
850 855 860
Ser Leu Thr Arg Ser His Gln Ala Thr Thr Leu Lys Arg Asn Asn Thr
865 870 875 880
Asn Ser Ser Asn Ser Ser His Leu Ser Arg Asn Gln Ser Phe Gly Arg
885 890 895
Gly Asp Asn Pro Pro Pro Ala Pro Gln Arg Val Asp Ser Ile Gln Val
900 905 910
His Ser Ser Gln Pro Ser Gly Gln Ala Val Thr Val Ser Arg Gln Pro
915 920 925
Ser Leu Asn Ala Tyr Asn Ser Leu Thr Arg Ser Gly Leu Lys Arg Thr
930 935 940
Pro Ser Leu Lys Pro Asp Val Pro Pro Lys Pro Ser Phe Ala Pro Leu
945 950 955 960
Ser Thr Ser Met Lys Pro Asn Asp Ala Cys Thr
965 970
<210>7
<400>7
000
<210>8
<211>975
<212>PRT
<213>人类
<400>8
Met Arg Ser Glu Ala Leu Leu Leu Tyr Phe Thr Leu Leu His Phe Ala
1 5 10 15
Gly Ala Gly Phe Pro Glu Asp Ser Glu Pro Ile Ser Ile Ser His Gly
20 25 30
Asn Tyr Thr Lys Gln Tyr Pro Val Phe Val Gly His Lys Pro Gly Arg
35 40 45
Asn Thr Thr Gln Arg His Arg Leu Asp Ile Gln Met Ile Met Ile Met
50 55 60
Asn Gly Thr Leu Tyr Ile Ala Ala Arg Asp His Ile Tyr Thr Val Asp
65 70 75 80
Ile Asp Thr Ser His Thr Glu Glu Ile Tyr Cys Ser Lys Lys Leu Thr
85 90 95
Trp Lys Ser Arg Gln Ala Asp Val Asp Thr Cys Arg Met Lys Gly Lys
100 105 110
His Lys Asp Glu Cys Hi s Asn Phe Ile Lys Val Leu Leu Lys Lys Asn
115 120 125
Asp Asp Ala Leu Phe Val Cys Gly Thr Asn Ala Phe Asn Pro Ser Cys
130 135 140
Arg Asn Tyr Lys Met Asp Thr Leu Glu Pro Phe Gly Asp Glu Phe Ser
145 150 155 160
Gly Met Ala Arg Cys Pro Tyr Asp Ala Lys His Ala Asn Val Ala Leu
165 170 175
Phe Ala Asp Gly Lys Leu Tyr Ser Ala Thr Val Thr Asp Phe Leu Ala
180 185 190
Ile Asp Ala Val Ile Tyr Arg Ser Leu Gly Glu Ser Pro Thr Leu Arg
195 200 205
Thr Val Lys His Asp Ser Lys Trp Leu Lys Glu Pro Tyr Phe Val Gln
210 215 220
Ala Val Asp Tyr Gly Asp Tyr Ile Tyr Phe Phe Phe Arg Glu Ile Ala
225 230 235 240
Val Glu Tyr Asn Thr Met Gly Lys Val Val Phe Pro Arg Val Ala Gln
245 250 255
Val Cys Lys Asn Asp Met Gly Gly Ser Gln Arg Val Leu Glu Lys Gln
260 265 270
Trp Thr Ser Phe Leu Lys Ala Arg Leu Asn Cys Ser Val Pro Gly Asp
275 280 285
Ser His Phe Tyr Phe Asn Ile Leu Gln Ala Val Thr Asp Val Ile Arg
290 295 300
Ile Asn Gly Arg Asp Val Val Leu Ala Thr Phe Ser Thr Pro Tyr Asn
305 310 315 320
Ser Ile Pro Gly Ser Ala Val Cys Ala Tyr Asp Met Leu Asp Ile Ala
325 330 335
Ser Val Phe Thr Gly Arg Phe Lys Glu Gln Lys Ser Pro Asp Ser Thr
340 345 350
Trp Thr Pro Val Pro Asp Glu Arg Val Pro Lys Pro Arg Pro Gly Cys
355 360 365
Cys Ala Gly Ser Ser Ser Leu Glu Arg Tyr Ala Thr Ser Asn Glu Phe
370 375 380
Pro Asp Asp Thr Leu Asn Phe Ile Lys Thr His Pro Leu Met Asp Glu
385 390 395 400
Ala Val Pro Ser Ile Phe Asn Arg Pro Trp Phe Leu Arg Thr Met Val
405 410 415
Arg Tyr Arg Leu Thr Lys Ile Ala Val Asp Thr Ala Ala Gly Pro Tyr
420 425 430
Gln Asn His Thr Val Val Phe Leu Gly Ser Glu Lys Gly Ile Ile Leu
435 440 445
Lys Phe Leu Ala Arg Ile Gly Asn Ser Gly Phe Leu Asn Asp Ser Leu
450 455 460
Phe Leu Glu Glu Met Ser Val Tyr Asn Ser Glu Lys Cys Ser Tyr Asp
465 470 475 480
Gly Val Glu Asp Lys Arg Ile Met Gly Met Gln Leu Asp Arg Ala Ser
485 490 495
Ser Ser Leu Tyr Val Ala Phe Ser Thr Cys Val Ile Lys Val Pro Leu
500 505 510
Gly Arg Cys Glu Arg His Gly Lys Cys Lys Lys Thr Cys Ile Ala Ser
515 520 525
Arg Asp Pro Tyr Cys Gly Trp Ile Lys Glu Gly Gly Ala Cys Ser His
530 535 540
Leu Ser Pro Asn Ser Arg Leu Thr Phe Glu Gln Asp Ile Glu Arg Gly
545 550 555 560
Asn Thr Asp Gly Leu Gly Asp Cys His Asn Ser Phe Val Ala Leu Asn
565 570 575
Gly Val Ile Arg Glu Ser Tyr Leu Lys Gly His Asp Gln Leu Val Pro
580 585 590
Val Thr Leu Leu Ala Ile Ala Val Ile Leu Ala Phe Val Met Gly Ala
595 600 605
Val Phe Ser Gly Ile Thr Val Tyr Cys Val Cys Asp His Arg Arg Lys
610 615 620
Asp Val Ala Val Val Gln Arg Lys Glu Lys Glu Leu Thr His Ser Arg
625 630 635 640
Arg Gly Ser Met Ser Ser Val Thr Lys Leu Ser Gly Leu Phe Gly Asp
645 650 655
Thr Gln Ser Lys Asp Pro Lys Pro Glu Ala Ile Leu Thr Pro Leu Met
660 665 670
His Asn Gly Lys Leu Ala Thr Pro Gly Asn Thr Ala Lys Met Leu Ile
675 680 685
Lys Ala Asp Gln His His Leu Asp Leu Thr Ala Leu Pro Thr Pro Glu
690 695 700
Ser Thr Pro Thr Leu Gln Gln Lys Arg Lys Pro Ser Arg Gly Ser Arg
705 710 715 720
Glu Trp Glu Arg Asn Gln Asn Leu Ile Asn Ala Cys Thr Lys Asp Met
725 730 735
Pro Pro Met Gly Ser Pro Val Ile Pro Thr Asp Leu Pro Leu Arg Ala
740 745 750
Ser Pro Ser His Ile Pro Ser Val Val Val Leu Pro Ile Thr Gln Gln
755 760 765
Gly Tyr Gln His Glu Tyr Val Asp Gln Pro Lys Met Ser Glu Val Ala
770 775 780
Gln Met Ala Leu Glu Asp Gln Ala Ala Thr Leu Glu Tyr Lys Thr Ile
785 790 795 800
Lys Glu His Leu Ser Ser Lys Ser Pro Asn His Gly Val Asn Leu Val
805 810 815
Glu Asn Leu Asp Ser Leu Pro Pro Lys Val Pro Gln Arg Glu Ala Ser
820 825 830
Leu Gly Pro Pro Gly Ala Ser Leu Ser Gln Thr Gly Leu Ser Lys Arg
835 840 845
Leu Glu Met His His Ser Ser Ser Tyr Gly Val Asp Tyr Lys Arg Ser
850 855 860
Tyr Pro Thr Asn Ser Leu Thr Arg Ser His Gln Ala Thr Thr Leu Lys
865 870 875 880
Arg Asn Asn Thr Asn Ser Ser Asn Ser Ser His Leu Ser Arg Asn Gln
885 890 895
Ser Phe Gly Arg Gly Asp Asn Pro Pro Pro Ala Pro Gln Arg Val Asp
900 905 910
Ser Ile Gln Val His Ser Ser Gln Pro Ser Gly Gln Ala Val Thr Val
915 920 925
Ser Arg Gln Pro Ser Leu Asn Ala Tyr Asn Ser Leu Thr Arg Ser Gly
930 935 940
Leu Lys Arg Thr Pro Ser Leu Lys Pro Asp Val Pro Pro Lys Pro Ser
945 950 955 960
Phe Ala Pro Leu Ser Thr Ser Met Lys Pro Asn Asp Ala Cys Thr
965 970 975
<210>9
<211>6901
<212>DNA
<213>小鼠
<400>9
actcggctgc ctaggcgctc gggacgcagc acaggcgctt ttccgcggtg ccgattgccc 60
gagatgcccg cctaggagcg tgcggccgcg gccagcgtcg ccacacccgg gacactgcac 120
tcggggttgc agagccggcc agagccctgc acctctgcct caacccccca caccgccccc 180
cgccctgaaa tgactagtta atgggcgctg gcaccgccga ggggactcag aagtgaatcc 240
aagtggaatt tggatttgga aaaagagttt cttgagcatt taccctggtc ctcgctggtt 300
ttcttctttt ttctgttttt tccctttttt ctttttcttt tttcagttat tttattttac 360
tttttatttt tattttttat ttttggtctt cctctcacct cctcttctgt cattggagat 420
gaacacagct cgcttgcatc ccagaaagta atcgccgtga ctgttgcccc caaagagaca 480
agcacacatg taggaatgac aaaggcttgc gaaggaaaga gcgcagctca aggcccagag 540
agatcttctc gataatggat tactaaatgg gatactcgcc gtgtcagtcc gctccgagcc 600
gcggccgcct gcccgtcgat gcaccgaaaa gggtgaagta gagaagcaag tccccccgct 660
gaacctacta tgcggccagc agccttactg ctgtgtctca cactgctaca ctgcgctggg 720
gctggtttcc cagaagattc cgagccaatc agtatttcgc atggcaacta tacaaaacag 780
tatccggtgt ttgtgggcca caagccagga cggaacacca cgcagaggca caggctggac 840
atccagatga tcatgatcat gaacagaacc ctctacgttg ctgctcgaga ccatatttat 900
actgttgata tagacacatc ccacacagaa gaaatttact gtagcaaaaa actgacatgg 960
aaatctagac aggctgacgt agacacatgc aggatgaagg ggaaacataa ggatgaatgt 1020
cacaacttca ttaaagttct tctcaagaag aatgatgata cgctgtttgt ctgtggaacc 1080
aatgccttca acccttcctg cagaaactac agggtcgata ccttggaaac ttttggggat 1140
gaatttagcg gaatggccag atgcccttat gatgccaaac atgccaacat cgctctgttt 1200
gcagatggaa aactctactc ggctacagtg actgactttc tggccattga tgcagtcatt 1260
tacaggagcc tcggagacag ccctaccctc aggactgtca agcatgattc aaagtggttg 1320
aaagagccgt actttgtcca agccgtggat tatggggact atatctactt cttcttcaga 1380
gaaattgcag tagaatacaa cactatgggg aaggttgttt tccctagggt ggctcaggtc 1440
tgtaagaatg acatgggagg gtctcagaga gtcctggaga agcagtggac atctttcctg 1500
aaggctcgcc tgaactgctc ggtgcctgga gactctcatt tttatttcaa tatactccag 1560
gcagttacag atgtgattcg cattaatggc cgtgatgttg tcttggcaac cttttccaca 1620
ccttataaca gcatcccagg ttctgcagtc tgtgcctatg acatgcttga cattgctaat 1680
gttttcactg ggaggttcaa ggaacagaaa tcacctgact ctacctggac acccgttcca 1740
gacgaacgag tccctaagcc caggccaggc tgttgtgctg gatcatcctc tttagaaaaa 1800
tatgcaacct ccaatgagtt tcccgatgat accctgaact tcattaagac gcatccactc 1860
atggacgagg cagtgccttc catcatcaac agaccttggt tcctgagaac aatggtcaga 1920
taccgcctga ccaaaattgc agtagacaac gctgccgggc catatcagaa tcacactgtg 1980
gttttcctgg gatcagaaaa gggaatcatc ctgaagttct tggccaggat aggaagcagt 2040
ggtttcctaa atggcagcct tttcctggag gagatgaatg tttacaaccc agaaaagtgc 2100
agctatgatg gtgtagaaga caaaaggatc atgggcatgc agctcgacag agcgagtggc 2160
tcactctatg ttgcattctc tacttgtgtg atcaaggtgc ctcttggccg ctgtgagcga 2220
catgggaagt gtaaaaaaac ctgcatcgcc tccagagacc cgtattgtgg gtgggtaagg 2280
gaaagtggtt cctgtgccca tctgtcaccc cttagcagac tgacatttga gcaggacatt 2340
gagcgtggca atacggacgg cctaggagac tgtcacaatt ccttcgtggc actgaatggg 2400
cacgccagtt ccctctatcc cagcaccact acgtcagatt cggcatcccg agacgggtat 2460
gagtctaggg gaggcatgct ggactggaac gacctgctcg aggcacctgg cagcacagac 2520
cctttggggg cagtgtcctc tcataaccac caggacaaga agggagtgat tcgggaaagt 2580
tacctcaaaa gcaacgacca gcttgttcct gtcaccctcc tggccattgc agtcattctg 2640
gcttttgtca tgggggccgt cttctcgggc atcatcgtgt attgtgtgtg cgatcaccgg 2700
cgcaaagacg tggcagtagt gcagcgcaag gagaaagagc tcactcactc gcgtcgggga 2760
tctatgagca gtgtcaccaa gctcagtggc ctctttgggg acacccagtc caaggaccca 2820
aagcctgagg ccatcctcac accactcatg cacaacggca agctggccac gcctagcaac 2880
accgccaaga tgctcatcaa ggctgaccag catcacctag acctcaccgc cctgcccacc 2940
ccagagtcca ccccgacact gcagcagaaa cggaaaccca accgcggcag tcgcgagtgg 3000
gagaggaacc agaacatcat caatgcctgc accaaggaca tgcctcccat gggttcccct 3060
gtgattccca cggacctgcc cctccgggcc tccccaagcc acatccccag cgtggtggtc 3120
ctgcccatca cgcagcaggg ctaccagcac gagtacgtag atcagcccaa aatgagcgag 3180
gtggtggctc agatggcact ggaggaccag gctgccaccc tggagtataa gaccatcaaa 3240
gagcacctga gtagcaagag tcccaaccat ggggtgaacc ttgtggagaa cctggacagc 3300
ctgcccccta aagttccaca gcgcgaggcc tccctaggtc ccccgggaac ctcactgtca 3360
cagaccggcc tgagcaagag gctggagatg caacactcct cctcctatgg gctcgaatat 3420
aagaggagct accccacgaa ctcgctcaca agaagccacc agaccaccac tctcaaaaga 3480
aacaatacta actcctccaa ttcctcccac ctctccagga accagagctt tggccgggga 3540
gacaacccac cccccgcccc gcagcgggtg gactctatcc aggtgcacag ctcccagccc 3600
tctggccagg ccgtgactgt ttcgaggcag cccagcctca atgcctacaa ctcactgacg 3660
aggtcggggc tgaagcgcac cccctcgcta aagccagatg taccccccaa accttccttt 3720
gctccccttt ccacatccat gaagcccaat gatgcatgta cataatccca ggggttgggg 3780
ggccaggagt tgaagcatcc gatgaggcga ggcacccacc cagctgagca aggtctccat 3840
tgcctcgagt atccacccga ccaagatggc cctggaggag ctgaggacgc tgggtcctcc 3900
tccctgggac atagggatac tcttcaaaat tgggccgtgt ggtctggtga aggtttagca 3960
atccacctct gcgttctctt ccttcacatc cacgtcatac agcaggtcgg actcacgaaa 4020
gacttcagta tcatcacaaa catgagccaa aagcacatct ccaccccatc ctcacatgaa 4080
cacaggccac agtcacattc gtgcactaca tacacataca cacacacaca cacacacaca 4140
cacaccatac cacaccacac cacaccacac cacaccacac cacaccacat cacaccacac 4200
cacacacgca atggtaaacg acaaccacat tttgtccctg actatacagg acgttaccaa 4260
acttggctaa gcatcagaaa ctttaaaaca cacacacaca cacaaccatt ttttttttaa 4320
aaaaaatcat gaaaattaaa aaaaaataat aaaggattca ttgataattc taactcagac 4380
tttaacaatg gcagaagttt actatgcgca gatactgtga aatgcccacc agtgttacag 4440
ctttgttata gcaggtaaat gccatgttgg gcaacgatgt catagatttc tgctcctctt 4500
cgcttttaat gaataacgtg accgttaacg caagtaactc ttatttattg tccacccctt 4560
ttctttttcc tcaaggaaaa gactcttcca aatgccacca catgaacagc tctgcggaag 4620
cccgtggaaa gttaaactat ttaacgtgaa atccattaac tggaataatt gagtttcttt 4680
atttttacaa taaattcact gagtaaataa tttggagctg gaattctgag ctttgtgttt 4740
ggactatcgg atcagtagct aaaggacagt gctaggaagg aatatttatt taaatctagt 4800
taatttgtca gttgggtttc tcgccaagag gaaaaaaaaa tgtttaaaaa tccttccaga 4860
gtctaacttc cagccaggac agaaatgttt agaatggtgc ctaagcccca ttgccgtaaa 4920
catggctttg tctgaggacc ccaccatcag gaaggcatta gcttgtgaaa cctgccccta 4980
ccccctaccc ccgatccccg acccccacca tctcatttca ccttgcatgt gagacagcaa 5040
aacaaagatc cacaaactgt gtgaactaat taatatgctg gctgctacct tgcataaatt 5100
aatgatttga tcacacgggt gtttcatgag gttacatctg tgaatagcct gttttccaca 5160
tgtaaatttg tgccttacac tctgagttgt atacacttgt aaactgtcgt tatgatcaac 5220
tttcttttcc tacttgaaat aaaggcagat atttatttaa accctgccct ccattcagcc 5280
ctctggaaga ctggagacaa gcaaatggaa cagacacggt agcgatggtt gtaatgctga 5340
aggctgggtg atacccttca gttctccctg ccttcccttg tgccaacgcc agccaccctt 5400
tggccatgct gcagagcatg gacctccagt gttgtgggtg gaaaaaaccc ctttccctta 5460
tattcccaga tcatttcaat ttggtgacat cttcctgagc cagccgagaa aggactgtgt 5520
tcactgactg gagaatcttg ctgcggtggt tagggaggca actgggaggc gtctccgagc 5580
tgtgccttca gcacacccag gcgatacaca gagaatcaac cagaaaatag accaggcagg 5640
ctggtccctg ctgtgattaa tgggtacccc aaagtacaaa ctaacgacaa tggatgctga 5700
aaaatccatt tctggggcaa aagtattttt ttgtttattt gtttctgttt tttttttttt 5760
aattctttta tctgtttgtt gtttgtagag ggttgggagg ggtagtgtgt ggttttgttt 5820
tttgcttttt ttgtttttcc cctcccttgg ttttcatttg ctaaagcaca cagaaggcac 5880
ctttgtttac tctatcatga acaaaagaat tgtctgcaca ctgtaatccg tgagcactgt 5940
ttccatataa acagtttatt tggtggtctc ttggtctctt ttctttttcc agtttgatct 6000
aggttttgtt ttgtctttaa aataaaacaa caataataat aataataaaa ctttcagaaa 6060
aaaaaagatt ggcaagaaca aattcgaatt ggttatttaa aatttctatg ttgcacccgc 6120
cgtccgagca gtcctgcaga gcccacggtg tacagccgag aacaggtgta tagccctttg 6180
ttccaagact tgcctcggac cagctagact gttgtttgag atacataaga tatcactggt 6240
tttgttttgc tctttagagg agtcattgtt catggtctgt aaccattgca ccctgaagcc 6300
agaaaggctt ttctagaaac agatggtgtc ttctctattt ccttttcttc acaaatacaa 6360
aaatgaaaag gaaggtgcct gtcagccacc ccataccctc tcctcccttt tgactcccaa 6420
gagtattacc ccaacctcat gcccatgtta atgggcatca ttgcctcagt tgtgttacgg 6480
agacccatgt caaaacccac attcctacac cccacacccc gctcctttcg gtgtcccaca 6540
tgtattgagc tggtcttctg cttttccctg tccctctccc tttctgccct gaccttgcat 6600
tcgggggtag ggaggagatt gcccatgaac ctgagcgtgc cttcgctttc caccctggct 6660
agacagtgtc gatgcaacaa acgcagactt acattggttg taaagttgta aaaatattgt 6720
gatgtcacca attttccttc cgtctccaca catcctaaca tctgattcac agtttaatgt 6780
atgtagttta aaagaaaagg agagagagga tgaaaaagaa agggggaaga gcggaaaaat 6840
caagggatat ggctctatta cttaagagta ataaaatcag actgttctac gttaaaaaaa 6900
a 6901
<210>10
<211>1031
<212>PRT
<213>小鼠
<400>10
Met Arg Pro Ala Ala Leu Leu Leu Cys Leu Thr Leu Leu His Cys Ala
1 5 10 15
Gly Ala Gly Phe Pro Glu Asp Ser Glu Pro Ile Ser Ile Ser His Gly
20 25 30
Asn Tyr Thr Lys Gln Tyr Pro Val Phe Val Gly His Lys Pro Gly Arg
35 40 45
Asn Thr Thr Gln Arg His Arg Leu Asp Ile Gln Met Ile Met Ile Met
50 55 60
Asn Arg Thr Leu Tyr Val Ala Ala Arg Asp His Ile Tyr Thr Val Asp
65 70 75 80
Ile Asp Thr Ser His Thr Glu Glu Ile Tyr Cys Ser Lys Lys Leu Thr
85 90 95
Trp Lys Ser Arg Gln Ala Asp Val Asp Thr Cys Arg Met Lys Gly Lys
100 105 110
His Lys Asp Glu Cys His Asn Phe Ile Lys Val Leu Leu Lys Lys Asn
115 120 125
Asp Asp Thr Leu Phe Val Cys Gly Thr Asn Ala Phe Asn Pro Ser Cys
130 135 140
Arg Asn Tyr Arg Val Asp Thr Leu Glu Thr Phe Gly Asp Glu Phe Ser
145 150 155 160
Gly Met Ala Arg Cys Pro Tyr Asp Ala Lys His Ala Asn Ile Ala Leu
165 170 175
Phe Ala Asp Gly Lys Leu Tyr Ser Ala Thr Val Thr Asp Phe Leu Ala
180 185 190
Ile Asp Ala Val Ile Tyr Arg Ser Leu Gly Asp Ser Pro Thr Leu Arg
195 200 205
Thr Val Lys His Asp Ser Lys Trp Leu Lys Glu Pro Tyr Phe Val Gln
210 215 220
Ala Val Asp Tyr Gly Asp Tyr Ile Tyr Phe Phe Phe Arg Glu Ile Ala
225 230 235 240
Val Glu Tyr Asn Thr Met Gly Lys Val Val Phe Pro Arg Val Ala Gln
245 250 255
Val Cys Lys Asn Asp Met Gly Gly Ser Gln Arg Val Leu Glu Lys Gln
260 265 270
Trp Thr Ser Phe Leu Lys Ala Arg Leu Asn Cys Ser Val Pro Gly Asp
275 280 285
Ser His Phe Tyr Phe Asn Ile Leu Gln Ala Val Thr Asp Val Ile Arg
290 295 300
Ile Asn Gly Arg Asp Val Val Leu Ala Thr Phe Ser Thr Pro Tyr Asn
305 310 315 320
Ser Ile Pro Gly Ser Ala Val Cys Ala Tyr Asp Met Leu Asp Ile Ala
325 330 335
Asn Val Phe Thr Gly Arg Phe Lys Glu Gln Lys Ser Pro Asp Ser Thr
340 345 350
Trp Thr Pro Val Pro Asp Glu Arg Val Pro Lys Pro Arg Pro Gly Cys
355 360 365
Cys Ala Gly Ser Ser Ser Leu Glu Lys Tyr Ala Thr Ser Asn Glu Phe
370 375 380
Pro Asp Asp Thr Leu Asn Phe Ile Lys Thr His Pro Leu Met Asp Glu
385 390 395 400
Ala Val Pro Ser Ile Ile Asn Arg Pro Trp Phe Leu Arg Thr Met Val
405 410 415
Arg Tyr Arg Leu Thr Lys Ile Ala Val Asp Asn Ala Ala Gly Pro Tyr
420 425 430
Gln Asn His Thr Val Val Phe Leu Gly Ser Glu Lys Gly Ile Ile Leu
435 440 445
Lys Phe Leu Ala Arg Ile Gly Ser Ser Gly Phe Leu Asn Gly Ser Leu
450 455 460
Phe Leu Glu Glu Met Asn Val Tyr Asn Pro Glu Lys Cys Ser Tyr Asp
465 470 475 480
Gly Val Glu Asp Lys Arg Ile Met Gly Met Gln Leu Asp Arg Ala Ser
485 490 495
Gly Ser Leu Tyr Val Ala Phe Ser Thr Cys Val Ile Lys Val Pro Leu
500 505 510
Gly Arg Cys Glu Arg His Gly Lys Cys Lys Lys Thr Cys Ile Ala Ser
515 520 525
Arg Asp Pro Tyr Cys Gly Trp Val Arg Glu Ser Gly Ser Cys Ala His
530 535 540
Leu Ser Pro Leu Ser Arg Leu Thr Phe Glu Gln Asp Ile Glu Arg Gly
545 550 555 560
Asn Thr Asp Gly Leu Gly Asp Cys His Asn Ser Phe Val Ala Leu Asn
565 570 575
Gly His Ala Ser Ser Leu Tyr Pro Ser Thr Thr Thr Ser Asp Ser Ala
580 585 590
Ser Arg Asp Gly Tyr Glu Ser Arg Gly Gly Met Leu Asp Trp Asn Asp
595 600 605
Leu Leu Glu Ala Pro Gly Ser Thr Asp Pro Leu Gly Ala Val Ser Ser
610 615 620
His Asn His Gln Asp Lys Lys Gly Val Ile Arg Glu Ser Tyr Leu Lys
625 630 635 640
Ser Asn Asp Gln Leu Val Pro Val Thr Leu Leu Ala Ile Ala Val Ile
645 650 655
Leu Ala Phe Val Met Gly Ala Val Phe Ser Gly Ile Ile Val Tyr Cys
660 665 670
Val Cys Asp His Arg Arg Lys Asp Val Ala Val Val Gln Arg Lys Glu
675 680 685
Lys Glu Leu Thr His Ser Arg Arg Gly Ser Met Ser Ser Val Thr Lys
690 695 700
Leu Ser Gly Leu Phe Gly Asp Thr Gln Ser Lys Asp Pro Lys Pro Glu
705 710 715 720
Ala Ile Leu Thr Pro Leu Met His Asn Gly Lys Leu Ala Thr Pro Ser
725 730 735
Asn Thr Ala Lys Met Leu Ile Lys Ala Asp Gln His His Leu Asp Leu
740 745 750
Thr Ala Leu Pro Thr Pro Glu Ser Thr Pro Thr Leu Gln Gln Lys Arg
755 760 765
Lys Pro Asn Arg Gly Ser Arg Glu Trp Glu Arg Asn Gln Asn Ile Ile
770 775 780
Asn Ala Cys Thr Lys Asp Met Pro Pro Met Gly Ser Pro Val Ile Pro
785 790 795 800
Thr Asp Leu Pro Leu Arg Ala Ser Pro Ser His Ile Pro Ser Val Val
805 810 815
Val Leu Pro Ile Thr Gln Gln Gly Tyr Gln His Glu Tyr Val Asp Gln
820 825 830
Pro Lys Met Ser Glu Val Val Ala Gln Met Ala Leu Glu Asp Gln Ala
835 840 845
Ala Thr Leu Glu Tyr Lys Thr Ile Lys Glu His Leu Ser Ser Lys Ser
850 855 860
Pro Asn His Gly Val Asn Leu Val Glu Asn Leu Asp Ser Leu Pro Pro
865 870 875 880
Lys Val Pro Gln Arg Glu Ala Ser Leu Gly Pro Pro Gly Thr Ser Leu
885 890 895
Ser Gln Thr Gly Leu Ser Lys Arg Leu Glu Met Gln His Ser Ser Ser
900 905 910
Tyr Gly Leu Glu Tyr Lys Arg Ser Tyr Pro Thr Asn Ser Leu Thr Arg
915 920 925
Ser His Gln Thr Thr Thr Leu Lys Arg Asn Asn Thr Asn Ser Ser Asn
930 935 940
Ser Ser His Leu Ser Arg Asn Gln Ser Phe Gly Arg Gly Asp Asn Pro
945 950 955 960
Pro Pro Ala Pro Gln Arg Val Asp Ser Ile Gln Val His Ser Ser Gln
965 970 975
Pro Ser Gly Gln Ala Val Thr Val Ser Arg Gln Pro Ser Leu Asn Ala
980 985 990
Tyr Asn Ser Leu Thr Arg Ser Gly Leu Lys Arg Thr Pro Ser Leu Lys
995 1000 1005
Pro Asp Val Pro Pro Lys Pro Ser Phe Ala Pro Leu Ser Thr Ser
1010 1015 1020
Met Lys Pro Asn Asp Ala Cys Thr
1025 1030
<210>11
<211>3018
<212>DNA
<213>小鼠
<400>11
atgcggccag cagccttact gctgtgtctc acactgctac actgcgccgg ggcgggtttc 60
ccagaagatt ccgagccaat cagtatttcg catggcaact atacaaaaca gtatccggtg 120
tttgtgggcc acaagccagg acggaacacc acgcagaggc acaggctgga catccagatg 180
atcatgatca tgaacagaac cctctacgtt gctgctcgag accatattta tactgttgat 240
atagacacat cccacacaga agaaatttac tgtagcaaaa aactgacatg gaaatctaga 300
caggctgacg tagacacatg caggatgaag gggaaacata aggatgaatg tcacaacttc 360
attaaagttc ttctcaagaa gaatgatgat acgctgtttg tctgtggaac caatgccttc 420
aacccttcct gcagaaacta cagggtcgat accttggaaa cttttgggga tgaatttagc 480
ggaatggcca gatgccctta tgatgccaaa catgtcaaca tcgctctgtt tgcagatgga 540
aaactctact cggctacagt gactgacttt ctggccattg atgcggtcat ttacaggagc 600
cccggagaca gccctaccct caggactgtc aagcatgatt caaagtggtt gaaagagccg 660
tactttgtcc aagccgtgga ttatggggac tatatctact tcttcttcag agaaattgca 720
gtagaataca acactatggg aaaggttgtt ttccctaggg tggctcaggt ctgtaagaat 780
gacatgggag ggtctcagag agtcctggag aagcagtgga catctttcct gaaggctcgc 840
ctgaactgct cggtgcctgg agactctcat ttttatttca atatactcca ggcagttaca 900
gatgtgattc gcattaatgg ccgtgatgtt gtcttggcaa ccttttccac accttataac 960
agcatcccag gttctgcagt ctgtgcctat gacatgcttg acattgctga tgttttcact 1020
gggaggttca aggaacagaa atcacctgac tctacctgga cacccgttcc agacgaacga 1080
gtccctaagc ccaggccagg ctgttgtgct ggatcatcct ctttagaaaa atatgcaacc 1140
tccaatgagt ttcccgatga taccctgaac ttcattaaga cgcatccact catggacgag 1200
gcagtgcctt ccatcatcaa cagaccttgg ttcctgagaa caatggtcag ataccgcctg 1260
accaaaattg cagtagacaa cgctgccggg ccatatcaga atcacactgt ggttttcctg 1320
gaggagatga atgtttacaa cccagaaaag tgcagctatg atggtgtaga agacaaaagg 1380
atcatgggca tgcagctcga cagagcgagt ggctcactct atgttgcatt ctctacttgt 1440
gtgatcaagg tgcctcttgg ccgctgtgag cgacatggga agtgtaaaaa aacctgcatc 1500
gcctccagag acccgtattg tgggtgggta agggaaagtg gttcctgtgc ccatctgtca 1560
ccccttagca gactgacatt tgagcaggac attgagcgtg gcaatacgga cggcctagga 1620
gactgtcaca attccttcgt ggcactgaat gggcacgcca gttccctcta tcccaacacc 1680
actacgtcag attcggcatc ccgagacggg tatgagtcta ggggaggcat gctggactgg 1740
aacgacctgc tcgaggcacc tggcagcaca gaccctttgg gggcagtgtc ctctcataac 1800
caccaggaca agaagggagt gattcgggaa agttacctca aaagcaacga ccagcttgtt 1860
cctgtcaccc tcctggccat tgcagtcatt ctggcttttg tcatgggggc cgtcttctcg 1920
ggcatcatcg tgtattgtgt gtgcgatcac cggcgcaaag acgtggeagt agtgcggcgc 1980
aaggagaaag agctcactca ctcgcgtcgg ggatctatga gcagtgtctc cgagctcagt 2040
ggcctctttg gggacaccca gtccaaggac ccaaagcctg aggccatcct cacaccactc 2100
atgcacaacg gcaagctggc cacgtctagc aacaccgcca agatgctcat caaggctgac 2160
cagcatcacc tagacctcac cgccctgccc accccagagt ccaccccgac actgcagcag 2220
aaacggaaac ccaaccgcgg cagtcgcgag tgggagagga accagaacat catcaatgcc 2280
tgcaccaagg acatgcctcc catgggttcc cctgtgattc ccacggacct gcccctccgg 2340
gcctccccaa gccacatccc cagcgtggtg gtcctgccca tcacgcagca gggctaccag 2400
cacgagtacg tagatcagcc caaaatgagc gaggtggtgg ctcagatggc actggaggac 2460
caggctgcca ccctggagta taagaccacc aaagagcacc tgagtagtaa gagtcccaac 2520
catggggtga accttgtgga gaacctggac agcctgcccc ctaaagttcc acagcgcgag 2580
gcctccctag gtcccccggg aacctcactg tcacagaccg gcctgagcaa gaggctggag 2640
atgcaacact cctcctccta tgggctcgaa tataagagga gctaccccac gaactcgctc 2700
acaagaagcc accagaccac cactctcaaa agaaacaata ctaactcctc caattcctcc 2760
cacctctcca ggaaccagag ctttggccgg ggagacaacc caccccccgc cccgcagcgg 2820
gtggactcta tccaggtgca cagctcccag ccctctggcc aggccgtgac tgtttcgagg 2880
cagcccagcc tcaatgccta caactcactg acgaggtcgg ggctgaagcg caccccctcg 2940
ctaaagcctg atgtaccccc caaaccttcc tttgctcccc tttccacatc catgaagccc 3000
aatgatgcgt gtacataa 3018
<210>12
<211>1005
<212>PRT
<213>小鼠
<400>12
Met Arg Pro Ala Ala Leu Leu Leu Cys Leu Thr Leu Leu His Cys Ala
1 5 10 15
Gly Ala Gly Phe Pro Glu Asp Ser Glu Pro Ile Ser Ile Ser His Gly
20 25 30
Asn Tyr Thr Lys Gln Tyr Pro Val Phe Val Gly Hi s Lys Pro Gly Arg
35 40 45
Asn Thr Thr Gln Arg His Arg Leu Asp Ile Gln Met Ile Met Ile Met
50 55 60
Asn Arg Thr Leu Tyr Val Ala Ala Arg Asp His Ile Tyr Thr Val Asp
65 70 75 80
Ile Asp Thr Ser His Thr Glu Glu Ile Tyr Cys Ser Lys Lys Leu Thr
85 90 95
Trp Lys Ser Arg Gln Ala Asp Val Asp Thr Cys Arg Met Lys Gly Lys
100 105 110
His Lys Asp Glu Cys His Asn Phe Ile Lys Val Leu Leu Lys Lys Asn
115 120 125
Asp Asp Thr Leu Phe Val Cys Gly Thr Asn Ala Phe Asn Pro Ser Cys
130 135 140
Arg Asn Tyr Arg Val Asp Thr Leu Glu Thr Phe Gly Asp Glu Phe Ser
145 150 155 160
Gly Met Ala Arg Cys Pro Tyr Asp Ala Lys His Val Asn Ile Ala Leu
165 170 175
Phe Ala Asp Gly Lys Leu Tyr Ser Ala Thr Val Thr Asp Phe Leu Ala
180 185 190
Ile Asp Ala Val Ile Tyr Arg Ser Pro Gly Asp Ser Pro Thr Leu Arg
195 20 205
Thr Val Lys His Asp Ser Lys Trp Leu Lys Glu Pro Tyr Phe Val Gln
210 215 220
Ala Val Asp Tyr Gly Asp Tyr Ile Tyr Phe Phe Phe Arg Glu Ile Ala
225 230 235 240
Val Glu Tyr Asn Thr Met Gly Lys Val Val Phe Pro Arg Val Ala Gln
245 250 255
Val Cys Lys Asn Asp Met Gly Gly Ser Gln Arg Val Leu Glu Lys Gln
260 265 270
Trp Thr Ser Phe Leu Lys Ala Arg Leu Asn Cys Ser Val Pro Gly Asp
275 280 285
Ser His Phe Tyr Phe Asn Ile Leu Gln Ala Val Thr Asp Val Ile Arg
290 295 300
Ile Asn Gly Arg Asp Val Val Leu Ala Thr Phe Ser Thr Pro Tyr Asn
305 310 315 320
Ser Ile Pro Gly Ser Ala Val Cys Ala Tyr Asp Met Leu Asp Ile Ala
325 330 335
Asp Val Phe Thr Gly Arg Phe Lys Glu Gln Lys Ser Pro Asp Ser Thr
340 345 350
Trp Thr Pro Val Pro Asp Glu Arg Val Pro Lys Pro Arg Pro Gly Cys
355 360 365
Cys Ala Gly Ser Ser Ser Leu Glu Lys Tyr Ala Thr Ser Asn Glu Phe
370 375 380
Pro Asp Asp Thr Leu Asn Phe Ile Lys Thr His Pro Leu Met Asp Glu
385 390 395 400
Ala Val Pro Ser Ile Ile Asn Arg Pro Trp Phe Leu Arg Thr Met Val
405 410 415
Arg Tyr Arg Leu Thr Lys Ile Ala Val Asp Asn Ala Ala Gly Pro Tyr
420 425 430
Gln Asn His Thr Val Val Phe Leu Glu Glu Met Asn Val Tyr Asn Pro
435 440 445
Glu Lys Cys Ser Tyr Asp Gly Val Glu Asp Lys Arg Ile Met Gly Met
450 455 460
Gln Leu Asp Arg Ala Ser Gly Ser Leu Tyr Val Ala Phe Ser Thr Cys
465 470 475 480
Val Ile Lys Val Pro Leu Gly Arg Cys Glu Arg His Gly Lys Cys Lys
485 490 495
Lys Thr Cys Ile Ala Ser Arg Asp Pro Tyr Cys Gly Trp Val Arg Glu
500 505 510
Ser Gly Ser Cys Ala His Leu Ser Pro Leu Ser Arg Leu Thr Phe Glu
515 520 525
Gln Asp Ile Glu Arg Gly Asn Thr Asp Gly Leu Gly Asp Cys His Asn
530 535 540
Ser Phe Val Ala Leu Asn Gly His Ala Ser Ser Leu Tyr Pro Asn Thr
545 550 555 560
Thr Thr Ser Asp Ser Ala Ser Arg Asp Gly Tyr Glu Ser Arg Gly Gly
565 570 575
Met Leu Asp Trp Asn Asp Leu Leu Glu Ala Pro Gly Ser Thr Asp Pro
580 585 590
Leu Gly Ala Val Ser Ser His Asn His Gln Asp Lys Lys Gly Val Ile
595 600 605
Arg Glu Ser Tyr Leu Lys Ser Asn Asp Gln Leu Val Pro Val Thr Leu
610 615 620
Leu Ala Ile Ala Val Ile Leu Ala Phe Val Met Gly Ala Val Phe Ser
625 630 635 640
Gl yIle Ile Val Tyr Cys Val Cys Asp His Arg Arg Lys Asp Val Ala
645 650 655
Val Val Arg Arg Lys Glu Lys Glu Leu Thr His Ser Arg Arg Gly Ser
660 665 670
Met Ser Ser Val Ser Glu Leu Ser Gly Leu Phe Gly Asp Thr Gln Ser
675 680 685
Lys Asp Pro Lys Pro Glu Ala Ile Leu Thr Pro Leu Met His Asn Gly
690 695 700
Lys Leu Ala Thr Ser Ser Asn Thr Ala Lys Met Leu Ile Lys Ala Asp
705 710 715 720
Gln His His Leu Asp Leu Thr Ala Leu Pro Thr Pro Glu Ser Thr Pro
725 730 735
Thr Leu Gln Gln Lys Arg Lys Pro Asn Arg Gly Ser Arg Glu Trp Glu
740 745 750
Arg Asn Gln Asn Ile Ile Asn Ala Cys Thr Lys Asp Met Pro Pro Met
755 760 765
Gly Ser Pro Val Ile Pro Thr Asp Leu Pro Leu Arg Ala Ser Pro Ser
770 775 780
His Ile Pro Ser Val Val Val Leu Pro Ile Thr Gln Gln Gly Tyr Gln
785 790 795 800
His Glu Tyr Val Asp Gln Pro Lys Met Ser Glu Val Val Ala Gln Met
805 810 815
Ala Leu Glu Asp Gln Ala Ala Thr Leu Glu Tyr Lys Thr Thr Lys Glu
820 825 830
His Leu Ser Ser Lys Ser Pro Asn His Gly Val Asn Leu Val Glu Asn
835 840 845
Leu Asp Ser Leu Pro Pro Lys Val Pro Gln Arg Glu Ala Ser Leu Gly
850 855 860
Pro Pro Gly Thr Ser Leu Ser Gln Thr Gly Leu Ser Lys Arg Leu Glu
865 870 875 880
Met Gln His Ser Ser Ser Tyr Gly Leu Glu Tyr Lys Arg Ser Tyr Pro
885 890 895
Thr Asn Ser Leu Thr Arg Ser His Gln Thr Thr Thr Leu Lys Arg Asn
900 905 910
Asn Thr Asn Ser Ser Asn Ser Ser His Leu Ser Arg Asn Gln Ser Phe
915 920 925
Gly Arg Gly Asp Asn Pro Pro Pro Ala Pro Gln Arg Val Asp Ser Ile
930 935 940
Gln Val His Ser Ser Gln Pro Ser Gly Gln Ala Val Thr Val Ser Arg
945 950 955 960
Gln Pro Ser Leu Asn Ala Tyr Asn Ser Leu Thr Arg Ser Gly Leu Lys
965 970 975
Arg Thr Pro Ser Leu Lys Pro Asp Val Pro Pro Lys Pro Ser Phe Ala
980 985 990
Pro Leu Ser Thr Ser Met Lys Pro Asn Asp Ala Cys Thr
995 1000 1005
<210>13
<211>4139
<212>DNA
<213>小鼠
<400>13
acacagctcg cttgcatccc agaaagtaat cgccgtgact gttgccccca aagagacaag 60
cacacatgta ggaatgacaa aggcttgcga aggaaagagc gcagctcaag gcccagagag 120
atcttctcga taatggatta ctaaatggga tactcgccgt gtcagtccgc tccgagccgc 180
ggccgcctgc ccgtcgatgc accgaaaagg gtgaagtaga gaagcaagtc cccccgctga 240
acctactatg cggccagcag ccttactgct gtgtctcaca ctgctacact gcgctggggc 300
tggtttccca gaagattccg agccaatcag tatttcgcat ggcaactata caaaacagta 360
tccggtgttt gtgggccaca agccaggacg gaacaccacg cagaggcaca ggctggacat 420
ccagatgatc atgatcatga acagaaccct ctacgttgct gctcgagacc atatttatac 480
tgttgatata gacacatccc acacagaaga aatttactgt agcaaaaaac tgacatggaa 540
atctagacag gctgacgtag acacatgcag gatgaagggg aaacataagg atgaatgtca 600
caacttcatt aaagttcttc tcaagaagaa tgatgatacg ctgtttgtct gtggaaccaa 660
tgccttcaac ccttcctgca gaaactacag ggtcgatacc ttggaaactt ttggggatga 720
atttagcgga atggccagat gcccttatga tgccaaacat gccaacatcg ctctgtttgc 780
agatggaaaa ctctactcgg ctacagtgac tgactttctg gccattgatg cagtcattta 840
caggagcctc ggagacagcc ctaccctcag gactgtcaag catgattcaa agtggttgaa 900
agagccgtac tttgtccaag ccgtggatta tggggactat atctacttct tcttcagaga 960
aattgcagta gaatacaaca ctatggggaa ggttgttttc cctagggtgg ctcaggtctg 1020
taagaatgac atgggagggt ctcagagagt cctggagaag cagtggacat ctttcctgaa 1080
ggctcgcctg aactgctcgg tgcctggaga ctctcatttt tatttcaata tactccaggc 1140
agttacagat gtgattcgca ttaatggccg tgatgttgtc ttggcaacct tttccacacc 1200
ttataacagc atcccaggtt ctgcagtctg tgcctatgac atgcttgaca ttgctaatgt 1260
tttcactggg aggttcaagg aacagaaatc acctgactct acctggacac ccgttccaga 1320
cgaacgagtc cctaagccca ggccaggctg ttgtgctgga tcatcctctt tagaaaaata 1380
tgcaacctcc aatgagtttc ccgatgatac cctgaacttc attaagacgc atccactcat 1440
ggacgaggca gtgccttcca tcatcaacag accttggttc ctgagaacaa tggtcagata 1500
ccgcctgacc aaaattgcag tagacaacgc tgccgggcca tatcagaatc acactgtggt 1560
tttcctggga tcagaaaagg gaatcatcct gaagttcttg gccaggatag gaagcagtgg 1620
tttcctaaat ggcagccttt tcctggagga gatgaatgtt tacaacccag aaaagtgcag 1680
ctatgatggt gtagaagaca aaaggatcat gggcatgcag ctcgacagag cgagtggctc 1740
actctatgtt gcattctcta cttgtgtgat caaggtgcct cttggccgct gtgagcgaca 1800
tgggaagtgt aaaaaaacct gcatcgcctc cagagacccg tattgtgggt gggtaaggga 1860
aagtggttcc tgtgcccatc tgtcacccct tagcagactg acatttgagc aggacattga 1920
gcgtggcaat acggacggcc taggagactg tcacaattcc ttcgtggcac tgaatggagt 1980
gattcgggaa agttacctca aaagcaacga ccagcttgtt cctgtcaccc tcctggccat 2040
tgcagtcatt ctggcttttg tcatgggggc cgtcttctcg ggcatcatcg tgtattgtgt 2100
gtgcgatcac cggcgcaaag acgtggcagt agtgcagcgc aaggagaaag agctcactca 2160
ctcgcgtcgg ggatctatga gcagtgtcac caagctcagt ggcctctttg gggacaccca 2220
gtccaaggac ccaaagcctg aggccatcct cacaccactc atgcacaacg gcaagctggc 2280
cacgcctagc aacaccgcca agatgctcat caaggctgac cagcatcacc tagacctcac 2340
cgccctgccc accccagagt ccaccccgac actgcagcag aaacggaaac ccaaccgcgg 2400
cagtcgcgag tgggagagga accagaacat catcaatgcc tgcaccaagg acatgcctcc 2460
catgggttcc cctgtgattc ccacggacct gcccctccgg gcctccccaa gccacatccc 2520
cagcgtggtg gtcctgccca tcacgcagca gggctaccag cacgagtacg tagatcagcc 2580
caaaatgagc gaggtggtgg ctcagatggc actggaggac caggctgcca ccctggagta 2640
taagaccatc aaagagcacc tgagtagcaa gagtcccaac catggggtga accttgtgga 2700
gaacctggac agcctgcccc ctaaagttcc acagcgcgag gcctccctag gtcccccggg 2760
aacctcactg tcacaaaccg gcctgagcaa gaggctggag atgcaacact cctcctccta 2820
tgggctcgaa tataagagga gctaccccac gaactcgctc acaagaagcc accagaccac 2880
cactctcaaa agaaacaata ctaactcctc caattcctcc cacctctcca ggaaccagag 2940
ctttggccgg ggagacaacc caccccccgc cccgcagcgg gtggactcta tccaggtgca 3000
cagctcccag ccctctggcc aggccgtgac tgtttcgagg cagcccagcc tcaatgccta 3060
caactcactg acgaggtcgg ggctgaagcg caccccctcg ctaaagccag atgtaccccc 3120
caaaccttcc tttgctcccc tttccacatc catgaagccc aatgatgcat gtacataatc 3180
ccaggggttg gggggccagg agttgaagca tccgatgagg cgaggcaccc acccagctga 3240
gcaaggtctc cattgcctcg agtatccacc cgaccaagat ggccctggag gagctgagga 3300
cgctgggtcc tcctccctgg gacataggga tactcttcaa aattgggccg tgtggtctgg 3360
tgaaggttta gcaatccacc tctgcgttct cttccttcac atccacgtca tacagcaggt 3420
cggactcacg aaagacttca gtatcatcac aaacatgagc caaaagcaca tctccacccc 3480
atcctcacat gaacacaggc cacagtcaca ttcgtgcact acatacacat acacacacac 3540
acacacacac acacacacca taccacacca caccacacca caccacacca caccacacca 3600
catcacacca caccacacac gcaatggtaa acgacaacca cattttgtcc ctgactatac 3660
aggacgttac caaacttggc taagcatcag aaactttaaa acacacacac acacacaacc 3720
attttttttt ttaaaaaaaa tcatgaaaat taaaaaaaaa taataaagga ttcattgata 3780
attctaactc agactttaac aatggcagaa gtttactatg cgcagatact gtgaaatgcc 3840
caccagtgtt acagctttgt tatagcaggt aaatgccatg ttgggcaacg atgtcataga 3900
tttctgctcc tcttcgcttt taatgaataa cgtgaccgtt aacgcaagta actcttattt 3960
attgtccacc ccttttcttt ttcctcaagg aaaagactct tccaaatgcc accacatgaa 4020
cagctctgcg gaagcccgtg gaaagttaaa ctatttaacg tgaaatccat taactggaat 4080
aattgagttt ctttattttt acaataaatt cactgagtaa ataaaaaaaa aaaaaaaaa 4139
<210>14
<211>976
<212>PRT
<213>小鼠
<400>14
Met Arg Pro Ala Ala Leu Leu Leu Cys Leu Thr Leu Leu His Cys Ala
1 5 10 15
Gly Ala Gly Phe Pro Glu Asp Ser Glu Pro Ile Ser Ile Ser His Gly
20 25 30
Asn Tyr Thr Lys Gln Tyr Pro Val Phe Val Gly His Lys Pro Gly Arg
35 40 45
Asn Thr Thr Gln Arg His Arg Leu Asp Ile Gln Met Ile Met Ile Met
50 55 60
Asn Arg Thr Leu Tyr Val Ala Ala Arg Asp His Ile Tyr Thr Val Asp
65 70 75 80
Ile Asp Thr Ser His Thr Glu Glu Ile Tyr Cys Ser Lys Lys Leu Thr
85 90 95
Trp Lys Ser Arg Gln Ala Asp Val Asp Thr Cys Arg Met Lys Gly Lys
100 105 110
His Lys Asp Glu Cys His Asn Phe Ile Lys Val Leu Leu Lys Lys Asn
115 120 125
Asp Asp Thr Leu Phe Val Cys Gly Thr Asn Ala Phe Asn Pro Ser Cys
130 135 140
Arg Asn Tyr Arg Val Asp Thr Leu Glu Thr Phe Gly Asp Glu Phe Ser
145 150 155 160
Gly Met Ala Arg Cys Pro Tyr Asp Ala Lys His Ala Asn Ile Ala Leu
165 170 175
Phe Ala Asp Gly Lys Leu Tyr Ser Ala Thr Val Thr Asp Phe Leu Ala
180 185 190
Ile Asp Ala Val Ile Tyr Arg Ser Leu Gly Asp Ser Pro Thr Leu Arg
195 200 205
Thr Val Lys His Asp Ser Lys Trp Leu Lys Glu Pro Tyr Phe Val Gln
210 215 220
Ala Val Asp Tyr Gly Asp Tyr Ile Tyr Phe Phe Phe Arg Glu Ile Ala
225 230 235 240
Val Glu Tyr Asn Thr Met Gly Lys Val Val Phe Pro Arg Val Ala Gln
245 250 255
Val Cys Lys Asn Asp Met Gly Gly Ser Gln Arg Val Leu Glu Lys Gln
260 265 270
Trp Thr Ser Phe Leu Lys Ala Arg Leu Asn Cys Ser Val Pro Gly Asp
275 280 285
Ser His Phe Tyr Phe Asn Ile Leu Gln Ala Val Thr Asp Val Ile Arg
290 295 300
Ile Asn Gly Arg Asp Val Val Leu Ala Thr Phe Ser Thr Pro Tyr Asn
305 310 315 320
Ser Ile Pro Gly Ser Ala Val Cys Ala Tyr Asp Met Leu Asp Ile Ala
325 330 335
Asn Val Phe Thr Gly Arg Phe Lys Glu Gln Lys Ser Pro Asp Ser Thr
340 345 350
Trp Thr Pro Val Pro Asp Glu Arg Val Pro Lys Pro Arg Pro Gly Cys
355 360 365
Cys Ala Gly Ser Ser Ser Leu Glu Lys Tyr Ala Thr Ser Asn Glu Phe
370 375 380
Pro Asp Asp Thr Leu Asn Phe Ile Lys Thr His Pro Leu Met Asp Glu
385 390 395 400
Ala Val Pro Ser Ile Ile Asn Arg Pro Trp Phe Leu Arg Thr Met Val
405 410 415
Arg Tyr Arg Leu Thr Lys Ile Ala Val Asp Asn Ala Ala Gly Pro Tyr
420 425 430
Gln Asn His Thr Val Val Phe Leu Gly Ser Glu Lys Gly Ile Ile Leu
435 440 445
Lys Phe Leu Ala Arg Ile Gly Ser Ser Gly Phe Leu Asn Gly Ser Leu
450 455 460
Phe Leu Glu Glu Met Asn Val Tyr Asn Pro Glu Lys Cys Ser Tyr Asp
465 470 475 480
Gly Val Glu Asp Lys Arg Ile Met Gly Met Gln Leu Asp Arg Ala Ser
485 490 495
Gly Ser Leu Tyr Val Ala Phe Ser Thr Cys Val Ile Lys Val Pro Leu
500 505 510
Gly Arg Cys Glu Arg His Gly Lys Cys Lys Lys Thr Cys Ile Ala Ser
515 520 525
Arg Asp Pro Tyr Cys Gly Trp Val Arg Glu Ser Gly Ser Cys Ala His
530 535 540
Leu Ser Pro Leu Ser Arg Leu Thr Phe Glu Gln Asp Ile Glu Arg Gly
545 550 555 560
Asn Thr Asp Gly Leu Gly Asp Cys His Asn Ser Phe Val Ala Leu Asn
565 570 575
Gly Val Ile Arg Glu Ser Tyr Leu Lys Ser Asn Asp Gln Leu Val Pro
580 585 590
Val Thr Leu Leu Ala Ile Ala Val Ile Leu Ala Phe Val Met Gly Ala
595 600 605
Val Phe Ser Gly Ile Ile Val Tyr Cys Val Cys Asp His Arg Arg Lys
610 615 620
Asp Val Ala Val Val Gln Arg Lys Glu Lys Glu Leu Thr His Ser Arg
625 630 635 640
Arg Gly Ser Met Ser Ser Val Thr Lys Leu Ser Gly Leu Phe Gly Asp
645 650 655
Thr Gln Ser Lys Asp Pro Lys Pro Glu Ala Ile Leu Thr Pro Leu Met
660 665 670
His Asn Gly Lys Leu Ala Thr Pro Ser Asn Thr Ala Lys Met Leu Ile
675 680 685
Lys Ala Asp Gln His His Leu Asp Leu Thr Ala Leu Pro Thr Pro Glu
690 695 700
Ser Thr Pro Thr Leu Gln Gln Lys Arg Lys Pro Asn Arg Gly Ser Arg
705 710 715 720
Glu Trp Glu Arg Asn Gln Asn Ile Ile Asn Ala Cys Thr Lys Asp Met
725 730 735
Pro Pro Met Gly Ser Pro Val Ile Pro Thr Asp Leu Pro Leu Arg Ala
740 745 750
Ser Pro Ser His Ile Pro Ser Val Val Val Leu Pro Ile Thr Gln Gln
755 760 765
Gly Tyr Gln His Glu Tyr Val Asp Gln Pro Lys Met Ser Glu Val Val
770 775 780
Ala Gln Met Ala Leu Glu Asp Gln Ala Ala Thr Leu Glu Tyr Lys Thr
785 790 795 800
Ile Lys Glu His Leu Ser Ser Lys Ser Pro Asn His Gly Val Asn Leu
805 810 815
Val Glu Asn Leu Asp Ser Leu Pro Pro Lys Val Pro Gln Arg Glu Ala
820 825 830
Ser Leu Gly Pro Pro Gly Thr Ser Leu Ser Gln Thr Gly Leu Ser Lys
835 840 845
Arg Leu Glu Met Gln His Ser Ser Ser Tyr Gly Leu Glu Tyr Lys Arg
850 855 860
Ser Tyr Pro Thr Asn Ser Leu Thr Arg Ser His Gln Thr Thr Thr Leu
865 870 875 880
Lys Arg Asn Asn Thr Asn Ser Ser Asn Ser Ser His Leu Ser Arg Asn
885 890 895
Gln Ser Phe Gly Arg Gly Asp Asn Pro Pro Pro Ala Pro Gln Arg Val
900 905 910
Asp Ser Ile Gln Val His Ser Ser Gln Pro Ser Gly Gln Ala Val Thr
915 920 925
Val Ser Arg Gln Pro Ser Leu Asn Ala Tyr Asn Ser Leu Thr Arg Ser
930 935 940
Gly Leu Lys Arg Thr Pro Ser Leu Lys Pro Asp Val Pro Pro Lys Pro
945 950 955 960
Ser Phe Ala Pro Leu Ser Thr Ser Met Lys Pro Asn Asp Ala Cys Thr
965 970 975
<210>15
<211>1909
<212>PRT
<213>人类
<400>15
Met Ser Thr His Arg Ser Arg Leu Leu Thr Ala Ala Pro Leu Ser Met
1 5 10 15
Glu Gln Arg Arg Pro Trp Pro Arg Ala Leu Glu Val Asp Ser Arg Ser
20 25 30
Val Val Leu Leu Ser Val Val Trp Val Leu Leu Ala Pro Pro Ala Ala
35 40 45
Gly Met Pro Gln Phe Ser Thr Phe His Ser Glu Asn Arg Asp Trp Thr
50 55 60
Phe Asn His Leu Thr Val His Gln Gly Thr Gly Ala Val Tyr Val Gly
65 70 75 80
Ala Ile Asn Arg Val Tyr Lys Leu Thr Gly Asn Leu Thr Ile Gln Val
85 90 95
Ala His Lys Thr Gly Pro Glu Glu Asp Asn Lys Ser Cys Tyr Pro Pro
100 105 110
Leu Ile Val Gln Pro Cys Ser Glu Val Leu Thr Leu Thr Asn Asn Val
115 120 125
Asn Lys Leu Leu Ile Ile Asp Tyr Ser Glu Asn Arg Leu Leu Ala Cys
130 135 140
Gly Ser Leu Tyr Gln Gly Val Cys Lys Leu Leu Arg Leu Asp Asp Leu
145 150 155 160
Phe Ile Leu Val Glu Pro Ser His Lys Lys Glu His Tyr Leu Ser Ser
165 170 175
Val Asn Lys Thr Gly Thr Met Tyr Gly Val Ile Val Arg Ser Glu Gly
180 185 190
Glu Asp Gly Lys Leu Phe Ile Gly Thr Ala Val Asp Gly Lys Gln Asp
195 200 205
Tyr Phe Pro Thr Leu Ser Ser Arg Lys Leu Pro Arg Asp Pro Glu Ser
210 215 220
Ser Ala Met Leu Asp Tyr Glu Leu His Ser Asp Phe Val Ser Ser Leu
225 230 235 240
Ile Lys Ile Pro Ser Asp Thr Leu Ala Leu Val Ser His Phe Asp Ile
245 250 255
Phe Tyr Ile Tyr Gly Phe Ala Ser Gly Gly Phe Val Tyr Phe Leu Thr
260 265 270
Val Gln Pro Glu Thr Pro Glu Gly Val Ala Ile Asn Ser Ala Gly Asp
275 280 285
Leu Phe Tyr Thr Ser Arg Ile Val Arg Leu Cys Lys Asp Asp Pro Lys
290 295 300
Phe His Ser Tyr Val Ser Leu Pro Phe Gly Cys Thr Arg Ala Gly Val
305 310 315 320
Glu Tyr Arg Leu Leu Gln Ala Ala Tyr Leu Ala Lys Pro Gly Asp Ser
325 330 335
Leu Ala Gln Ala Phe Asn Ile Thr Ser Gln Asp Asp Val Leu Phe Ala
340 345 350
Ile Phe Ser Lys Gly Gln Lys Gln Tyr His His Pro Pro Asp Asp Ser
355 360 365
Ala Leu Cys Ala Phe Pro Ile Arg Ala Ile Asn Leu Gln Ile Lys Gly
370 375 380
Arg Leu Gln Ser Cys Tyr Gln Gly Glu Gly Asn Leu Glu Leu Asn Trp
385 390 395 400
Leu Leu Gly Lys Asp Val Gln Cys Thr Lys Ala Pro Val Pro Ile Asp
405 410 415
Asp Asn Phe Cys Gly Leu Asp Ile Asn Gln Pro Leu Gly Gly Ser Thr
420 425 430
Pro Val Glu Gly Leu Thr Leu Tyr Thr Thr Ser Arg Asp Arg Met Thr
435 440 445
Ser Val Ala Ser Tyr Val Tyr Asn Gly Tyr Ser Val Val Phe Val Gly
450 455 460
Thr Lys Ser Gly Lys Leu Lys Lys Ile Arg Ala Asp Gly Pro Pro His
465 470 475 480
Gly Gly Val Gln Tyr Glu Met Val Ser Val Leu Lys Asp Gly Ser Pro
485 490 495
Ile Leu Arg Asp Met Ala Phe Ser Ile Asp Gln Arg Tyr Leu Tyr Val
500 505 510
Met Ser Glu Arg Gln Val Thr Arg Val Pro Val Glu Ser Cys Glu Gln
515 520 525
Tyr Thr Thr Cys Gly Glu Cys Leu Ser Ser Gly Asp Pro His Cys Gly
530 535 540
Trp Cys Ala Leu His Asn Met Cys Ser Arg Arg Asp Lys Cys Gln Gln
545 550 555 560
Ala Trp Glu Pro Asn Arg Phe Ala Ala Ser Ile Ser Gln Cys Val Ser
565 570 575
Leu Ala Val His Pro Ser Ser Ile Ser Val Ser Glu His Ser Arg Leu
580 585 590
Leu Ser Leu Val Val Ser Asp Ala Pro Asp Leu Ser Ala Gly Ile Ala
595 600 605
Cys Ala Phe Gly Asn Leu Thr Glu Val Glu Gly Gln Val Ser Gly Ser
610 615 620
Gln Val Ile Cys Ile Ser Pro Gly Pro Lys Asp Val Pro Val Ile Pro
625 630 635 640
Leu Asp Gln Asp Trp Phe Gly Leu Glu Leu Gln Leu Arg Ser Lys Glu
645 650 655
Thr Gly Lys Ile Phe Val Ser Thr Glu Phe Lys Phe Tyr Asn Cys Ser
660 665 670
Ala His Gln Leu Cys Leu Ser Cys Val Asn Ser Ala Phe Arg Cys His
675 680 685
Trp Cys Lys Tyr Arg Asn Leu Cys Thr His Asp Pro Thr Thr Cys Ser
690 695 700
Phe Gln Glu Gly Arg Ile Asn Ile Ser Glu Asp Cys Pro Gln Leu Val
705 710 715 720
Pro Thr Glu Glu Ile Leu Ile Pro Val Gly Glu Val Lys Pro Ile Thr
725 730 735
Leu Lys Ala Arg Asn Leu Pro Gln Pro Gln Ser Gly Gln Arg Gly Tyr
740 745 750
Glu Cys Val Leu Asn Ile Gln Gly Ala Ile His Arg Val Pro Ala Leu
755 760 765
Arg Phe Asn Ser Ser Ser Val Gln Cys Gln Asn Ser Ser Tyr Gln Tyr
770 775 780
Asp Gly Met Asp Ile Ser Asn Leu Ala Val Asp Phe Ala Val Val Trp
785 790 795 800
Asn Gly Asn Phe Ile Ile Asp Asn Pro Gln Asp Leu Lys Val His Leu
805 810 815
Tyr Lys Cys Ala Ala Gln Arg Glu Ser Cys Gly Leu Cys Leu Lys Ala
820 825 830
Asp Arg Lys Phe Glu Cys Gly Trp Cys Ser Gly Glu Arg Arg Cys Thr
835 840 845
Leu His Gln His Cys Thr Ser Pro Ser Ser Pro Trp Leu Asp Trp Ser
850 855 860
Ser His Asn Val Lys Cys Ser Asn Pro Gln Ile Thr Glu Ile Leu Thr
865 870 875 880
Val Ser Gly Pro Pro Glu Gly Gly Thr Arg Val Thr Ile His Gly Val
885 890 895
Asn Leu Gly Leu Asp Phe Ser Glu Ile Ala His His Val Gln Val Ala
900 905 910
Gly Val Pro Cys Thr Pro Leu Pro Gly Glu Tyr Ile Ile Ala Glu Gln
915 920 925
Ile Val Cys Glu Met Gly His Ala Leu Val Gly Thr Thr Ser Gly Pro
930 935 940
Val Arg Leu Cys Ile Gly Glu Cys Lys Pro Glu Phe Met Thr Lys Ser
945 950 955 960
His Gln Gln Tyr Thr Phe Val Asn Pro Ser Val Leu Ser Leu Asn Pro
965 970 975
Ile Arg Gly Pro Glu Ser Gly Gly Thr Met Val Thr Ile Thr Gly His
980 985 990
Tyr Leu Gly Ala Gly Ser Ser Val Ala Val Tyr Leu Gly Asn Gln Thr
995 1000 1005
Cys Glu Phe Tyr Gly Arg Ser Met Ser Glu Ile Val Cys Val Ser
1010 1015 1020
Pro Pro Ser Ser Asn Gly Leu Gly Pro Val Pro Val Ser Val Ser
1025 1030 1035
Val Asp Arg Ala His Val Asp Ser Asn Leu Gln Phe Glu Tyr Ile
1040 104 51050
Asp Asp Pro Arg Val Gln Arg Ile Glu Pro Glu Trp Ser Ile Ala
1055 1060 1065
Ser Gly His Thr Pro Leu Thr Ile Thr Gly Phe Asn Leu Asp Val
1070 1075 1080
Ile Gln Glu Pro Arg Ile Arg Val Lys Phe Asn Gly Lys Glu Ser
1085 1090 1095
Val Asn Val Cys Lys Val Val Asn Thr Thr Thr Leu Thr Cys Leu
1100 1105 1110
Ala Pro Ser Leu Thr Thr Asp Tyr Arg Pro Gly Leu Asp Thr Val
1115 1120 1125
Glu Arg Pro Asp Glu Phe Gly Phe Val Phe Asn Asn Val Gln Ser
1130 1135 1140
Leu Leu Ile Tyr Asn Asp Thr Lys Phe Ile Tyr Tyr Pro Asn Pro
1145 1150 1155
Thr Phe Glu Leu Leu Ser Pro Thr Gly Val Leu Asp Gln Lys Pro
1160 1165 1170
Gly Ser Pro Ile Ile Leu Lys Gly Lys Asn Leu Cys Pro Pro Ala
1175 1180 1185
Ser Gly Gly Ala Lys Leu Asn Tyr Thr Val Leu Ile Gly Glu Thr
1190 1195 1200
Pro Cys Ala Val Thr Val Ser Glu Thr Gln Leu Leu Cys Glu Pro
1205 1210 1215
Pro Asn Leu Thr Gly Gln His Lys Val Met Val His Val Gly Gly
1220 1225 1230
Met Val Phe Ser Pro Gly Ser Val Ser Val Ile Ser Asp Ser Leu
1235 1240 1245
Leu Thr Leu Pro Ala Ile Val Ser Ile Ala Ala Gly Gly Ser Leu
1250 1255 1260
Leu Leu Ile Ile Val Ile Ile Val Leu Ile Ala Tyr Lys Arg Lys
1265 1270 1275
Ser Arg Glu Asn Asp Leu Thr Leu Lys Arg Leu Gln Met Gln Met
1280 1285 1290
Asp Asn Leu Glu Ser Arg Val Ala Leu Glu Cys Lys Glu Ala Phe
1295 1300 1305
Ala Glu Leu Gln Thr Asp Ile Asn Glu Leu Thr Ser Asp Leu Asp
1310 1315 1320
Arg Ser Gly Ile Pro Tyr Leu Asp Tyr Arg Thr Tyr Ala Met Arg
1325 1330 1335
Val Leu Phe Pro Gly Ile Glu Asp His Pro Val Leu Arg Glu Leu
1340 1345 1350
Glu Val Gln Gly Asn Gly Gln Gln His Val Glu Lys Ala Leu Lys
1355 1360 1365
Leu Phe Ala Gln Leu Ile Asn Asn Lys Val Phe Leu Leu Thr Phe
1370 1375 1380
Ile Arg Thr Leu Glu Leu Gln Arg Ser Phe Ser Met Arg Asp Arg
1385 1390 1395
Gly Asn Val Ala Ser Leu Ile Met Thr Gly Leu Gln Gly Arg Leu
1400 1405 1410
Glu Tyr Ala Thr Asp Val Leu Lys Gln Leu Leu Ser Asp Leu Ile
1415 1420 1425
Asp Lys Asn Leu Glu Asn Lys Asn His Pro Lys Leu Leu Leu Arg
1430 1435 1440
Arg Thr Glu Ser Val Ala Glu Lys Met Leu Thr Asn Trp Phe Ala
1445 1450 1455
Phe Leu Leu His Lys Phe Leu Lys Glu Cys Ala Gly Glu Pro Leu
1460 1465 1470
Phe Met Leu Tyr Cys Ala Ile Lys Gln Gln Met Glu Lys Gly Pro
1475 1480 1485
Ile Asp Ala Ile Thr Gly Glu Ala Arg Tyr Ser Leu Ser Glu Asp
1490 1495 1500
Lys Leu Ile Arg Gln Gln Ile Glu Tyr Lys Thr Leu Ile Leu Asn
1505 1510 1515
Cys Val Asn Pro Asp Asn Glu Asn Ser Pro Glu Ile Pro Val Lys
1520 1525 1530
Val Leu Asn Cys Asp Thr Ile Thr Gln Val Lys Glu Lys Ile Leu
1535 1540 1545
Asp Ala Val Tyr Lys Asn Val Pro Tyr Ser Gln Arg Pro Arg Ala
1550 1555 1560
Val Asp Met Asp Leu Glu Trp Arg Gln Gly Arg Ile Ala Arg Val
1565 1570 1575
Val Leu Gln Asp Glu Asp Ile Thr Thr Lys Ile Glu Gly Asp Trp
1580 1585 1590
Lys Arg Leu Asn Thr Leu Met His Tyr Gln Val Ser Asp Arg Ser
1595 1600 1605
Val Val Ala Leu Val Pro Lys Gln Thr Ser Ser Tyr Asn Ile Pro
1610 1615 1620
Ala Ser Ala Ser Ile Ser Arg Thr Ser Ile Ser Arg Tyr Asp Ser
1625 1630 1635
Ser Phe Arg Tyr Thr Gly Ser Pro Asp Ser Leu Arg Ser Arg Ala
1640 1645 1650
Pro Met Ile Thr Pro Asp Leu Glu Ser Gly Val Lys Val Trp His
1655 1660 1665
Leu Val Lys Asn His Asp His Gly Asp Gln Lys Glu Gly Asp Arg
1670 1675 1680
Gly Ser Lys Met Val Ser Glu Ile Tyr Leu Thr Arg Leu Leu Ala
1685 1690 1695
Thr Lys Gly Thr Leu Gln Lys Phe Val Asp Asp Leu Phe Glu Thr
1700 1705 1710
Leu Phe Ser Thr Val His Arg Gly Ser Ala Leu Pro Leu Ala Ile
1715 1720 1725
Lys Tyr Met Phe Asp Phe Leu Asp Glu Gln Ala Asp Arg His Ser
1730 1735 1740
Ile His Asp Thr Asp Val Arg His Thr Trp Lys Ser Asn Cys Leu
1745 1750 1755
Pro Leu Arg Phe Trp Val Asn Val Ile Lys Asn Pro Gln Phe Val
1760 1765 1770
Phe Asp Ile His Lys Gly Ser Ile Thr Asp Ala Cys Leu Ser Val
1775 1780 1785
Val Ala Gln Thr Phe Met Asp Ser Cys Ser Thr Ser Glu His Arg
1790 1795 1800
Leu Gly Lys Asp Ser Pro Ser Asn Lys Leu Leu Tyr Ala Lys Asp
1805 1810 1815
Ile Pro Ser Tyr Lys Ser Trp Val Glu Arg Tyr Tyr Ala Asp Ile
1820 1825 1830
Ala Lys Leu Pro Ala Ile Ser Asp Gln Asp Met Asn Ala Tyr Leu
1835 1840 1845
Ala Glu Gln Ser Arg Leu His Ala Val Glu Phe Asn Met Leu Ser
1850 1855 1860
Ala Leu Asn Glu Ile Tyr Ser Tyr Val Ser Lys Tyr Ser Glu Glu
1865 1870 1875
Leu Ile Gly Ala Leu Glu Gln Asp Glu Gln Ala Arg Arg Gln Arg
1880 1885 1890
Leu Ala Tyr Lys Val Glu Gln Leu Ile Asn Ala Met Ser Ile Glu
1895 1900 1905
Ser
<210>16
<211>1894
<212>PRT
<213>人类
<400>16
Met Lys Ala Met Pro Trp Asn Trp Thr Cys Leu Leu Ser His Leu Leu
1 5 10 15
Met Val Gly Met Gly Ser Ser Thr Leu Leu Thr Arg Gln Pro Ala Pro
20 25 30
Leu Ser Gln Lys Gln Arg Ser Phe Val Thr Phe Arg Gly Glu Pro Ala
35 40 45
Glu Gly Phe Asn His Leu Val Val Asp Glu Arg Thr Gly His Ile Tyr
50 55 60
Leu Gl y Ala Val Asn ArgIle Tyr Lys Leu Ser Ser Asp Leu Lys Val
65 70 75 80
Leu Val Thr His Glu Thr Gly Pro Asp Glu Asp Asn Pro Lys Cys Tyr
85 90 95
Pro Pro Arg Ile Val Gln Thr Cys Asn Glu Pro Leu Thr Thr Thr Asn
100 105 110
Asn Val Asn Lys Met Leu Leu Ile Asp Tyr Lys Glu Asn Arg Leu Ile
115 120 125
Ala Cys Gly Ser Leu Tyr Gln Gly Ile Cys Lys Leu Leu Arg Leu Glu
130 135 140
Asp Leu Phe Lys Leu Gly Glu Pro Tyr His Lys Lys Glu His Tyr Leu
145 150 155 160
Ser Gly Val Asn Glu Ser Gly Ser Val Phe Gly Val Ile Val Ser Tyr
165 170 175
Ser Asn Leu Asp Asp Lys Leu Phe Ile Ala Thr Ala Val Asp Gly Lys
180 185 190
Pro Glu Tyr Phe Pro Thr Ile Ser Ser Arg Lys Leu Thr Lys Asn Ser
195 200 205
Glu Ala Asp Gly Met Phe Ala Tyr Val Phe His Asp Glu Phe Val Ala
210 215 220
Ser Met Ile Lys Ile Pro Ser Asp Thr Phe Thr Ile Ile Pro Asp Phe
225 230 235 240
Asp Ile Tyr Tyr Val Tyr Gly Phe Ser Ser Gly Asn Phe Val Tyr Phe
245 250 255
Leu Thr Leu Gln Pro Glu Met Val Ser Pro Pro Gly Ser Thr Thr Lys
260 265 270
Glu Gln Val Tyr Thr Ser Lys Leu Val Arg Leu Cys Lys Glu Asp Thr
275 280 285
Ala Phe Asn Ser Tyr Val Glu Val Pro Ile Gly Cys Glu Arg Ser Gly
290 295 300
Val Glu Tyr Arg Leu Leu Gln Ala Ala Tyr Leu Ser Lys Ala Gly Ala
305 310 315 320
Val Leu Gly Arg Thr Leu Gly Val His Pro Asp Asp Asp Leu Leu Phe
325 330 335
Thr Val Phe Ser Lys Gly Gln Lys Arg Lys Met Lys Ser Leu Asp Glu
340 345 350
Ser Ala Leu Cys Ile Phe Ile Leu Lys Gln Ile Asn Asp Arg Ile Lys
355 360 365
Glu Arg Leu Gln Ser Cys Tyr Arg Gly Glu Gly Thr Leu Asp Leu Ala
370 375 380
Trp Leu Lys Val Lys Asp Ile Pro Cys Ser Ser Ala Leu Leu Thr Ile
385 390 395 400
Asp Asp Asn Phe Cys Gly Leu Asp Met Asn Ala Pro Leu Gly Val Ser
405 410 415
Asp Met Val Arg Gly Ile Pro Val Phe Thr Glu Asp Arg Asp Arg Met
420 425 430
Thr Ser Val Ile Ala Tyr Val Tyr Lys Asn His Ser Leu Ala Phe Val
435 440 445
Gly Thr Lys Ser Gly Lys Leu Lys Lys Ile Arg Val Asp Gly Pro Arg
450 455 460
Gly Asn Ala Leu Gln Tyr Glu Thr Val Gln Val Val Asp Pro Gly Pro
465 470 475 480
Val Leu Arg Asp Met Ala Phe Ser Lys Asp His Glu Gln Leu Tyr Ile
485 490 495
Met Ser Glu Arg Gln Leu Thr Arg Val Pro Val Glu Ser Cys Gly Gln
500 505 510
Tyr Gln Ser Cys Gly Glu Cys Leu Gly Ser Gly Asp Pro His Cys Gly
515 520 525
Trp Cys Val Leu His Asn Thr Cys Thr Arg Lys Glu Arg Cys Glu Arg
530 535 540
Ser Lys Glu Pro Arg Arg Phe Ala Ser Glu Met Lys Gln Cys Val Arg
545 550 555 560
Leu Thr Val His Pro Asn Asn Ile Ser Val Ser Gln Tyr Asn Val Leu
565 570 575
Leu Val Leu Glu Thr Tyr Asn Val Pro Glu Leu Ser Ala Gly Val Asn
580 585 590
Cys Thr Phe Glu Asp Leu Ser Glu Met Asp Gly Leu Val Val Gly Asn
595 600 605
Gln Ile Gln Cys Tyr Ser Pro Ala Ala Lys Glu Val Pro Arg Ile Ile
610 615 620
Thr Glu Asn Gly Asp His His Val Val Gln Leu Gln Leu Lys Ser Lys
625 630 635 640
Glu Thr Gly Met Thr Phe Ala Ser Thr Ser Phe Val Phe Tyr Asn Cys
645 650 655
Ser Val His Asn Ser Cys Leu Ser Cys Val Glu Ser Pro Tyr Arg Cys
660 665 670
His Trp Cys Lys Tyr Arg His Val Cys Thr His Asp Pro Lys Thr Cys
675 680 685
Ser Phe Gln Glu Gly Arg Val Lys Leu Pro Glu Asp Cys Pro Gln Leu
690 695 700
Leu Arg Val Asp Lys Ile Leu Val Pro Val Glu Val Ile Lys Pro Ile
705 710 715 720
Thr Leu Lys Ala Lys Asn Leu Pro Gln Pro Gln Ser Gly Gln Arg Gly
725 730 735
Tyr Glu Cys Ile Leu Asn Ile Gln Gly Ser Glu Gln Arg Val Pro Ala
740 745 750
Leu Arg Phe Asn Ser Ser Ser Val Gln Cys Gln Asn Thr Ser Tyr Ser
755 760 765
Tyr Glu Gly Met Glu Ile Asn Asn Leu Pro Val Glu Leu Thr Val Val
770 775 780
Trp Asn Gly His Phe Asn Ile Asp Asn Pro Ala Gln Asn Lys Val His
785 790 795 800
Leu Tyr Lys Cys Gly Ala Met Arg Glu Ser Cys Gly Leu Cys Leu Lys
805 810 815
Ala Asp Pro Asp Phe Ala Cys Gly Trp Cys Gln Gly Pro Gly Gln Cys
820 825 830
Thr Leu Arg Gln His Cys Pro Ala Gln Glu Ser Gln Trp Leu Glu Leu
835 840 845
Ser Gly Ala Lys Ser Lys Cys Thr Asn Pro Arg Ile Thr Glu Ile Ile
850 855 860
Pro Val Thr Gly Pro Arg Glu Gly Gly Thr Lys Val Thr Ile Arg Gly
865 870 875 880
Glu Asn Leu Gly Leu Glu Phe Arg Asp Ile Ala Ser His Val Lys Val
885 890 895
Ala Gly Val Glu Cys Ser Pro Leu Val Asp Gly Tyr Ile Pro Ala Glu
900 905 910
Gln Ile Val Cys Glu Met Gly Glu Ala Lys Pro Ser Gln His Ala Gly
915 920 925
Phe Val Glu Ile Cys Val Ala Val Cys Arg Pro Glu Phe Met Ala Arg
930 935 940
Ser Ser Gln Leu Tyr Tyr Phe Met Thr Leu Thr Leu Ser Asp Leu Lys
945 950 955 960
Pro Ser Arg Gly Pro Met Ser Gly Gly Thr Gln Val Thr Ile Thr Gly
965 970 975
Thr Asn Leu Asn Ala Gly Ser Asn Val Val Val Met Phe Gly Lys Gln
980 985 990
Pro Cys Leu Phe His Arg Arg Ser Pro Ser Tyr Ile Val Cys Asn Thr
995 1000 1005
Thr Ser Ser Asp Glu Val Leu Glu Met Lys Val Ser Val Gln Val
1010 1015 1020
Asp Arg Ala Lys Ile His Gln Asp Leu Val Phe Gln Tyr Val Glu
1025 1030 1035
Asp Pro Thr Ile Val Arg Ile Glu Pro Glu Trp Ser Ile Val Ser
1040 1045 1050
Gly Asn Thr Pro Ile Ala Val Trp Gly Thr His Leu Asp Leu Ile
1055 1060 1065
Gln Asn Pro Gln Ile Arg Ala Lys His Gly Gly Lys Glu His Ile
1070 1075 1080
Asn Ile Cys Glu Val Leu Asn Ala Thr Glu Met Thr Cys Gln Ala
1085 1090 1095
Pro Ala Leu Ala Leu Gly Pro Asp His Gln Ser Asp Leu Thr Glu
1100 1105 1110
Arg Pro Glu Glu Phe Gly Phe Ile Leu Asp Asn Val Gln Ser Leu
1115 1120 1125
Leu Ile Leu Asn Lys Thr Asn Phe Thr Tyr Tyr Pro Asn Pro Val
1130 1135 1140
Phe Glu Ala Phe Gly Pro Ser Gly Ile Leu Glu Leu Lys Pro Gly
1145 1150 1155
Thr Pro Ile Ile Leu Lys Gly Lys Asn Leu Ile Pro Pro Val Ala
1160 1165 1170
Gly Gly Asn Val Lys Leu Asn Tyr Thr Val Leu Val Gly Glu Lys
1175 1180 1185
Pro Cys Thr Val Thr Val Ser Asp Val Gln Leu Leu Cys Glu Ser
1190 1195 1200
Pro Asn Leu Ile Gly Arg His Lys Val Met Ala Arg Val Gly Gly
1205 1210 1215
Met Glu Tyr Ser Pro Gly Met Val Tyr Ile Ala Pro Asp Ser Pro
1220 1225 1230
Leu Ser Leu Pro Ala Ile Val Ser Ile Ala Val Ala Gly Gly Leu
1235 1240 1245
Leu Ile Ile Phe Ile Val Ala Val Leu Ile Ala Tyr Lys Arg Lys
1250 1255 1260
Ser Arg Glu Ser Asp Leu Thr Leu Lys Arg Leu Gln Met Gln Met
1265 1270 1275
Asp Asn Leu Glu Ser Arg Val Ala Leu Glu Cys Lys Glu Ala Phe
1280 1285 1290
Ala Glu Leu Gln Thr Asp Ile His Glu Leu Thr Ser Asp Leu Asp
1295 1300 1305
Gly Ala Gly Ile Pro Phe Leu Asp Tyr Arg Thr Tyr Thr Met Arg
1310 1315 1320
Val Leu Phe Pro Gly Ile Glu Asp His Pro Val Leu Arg Asp Leu
1325 1330 1335
Glu Val Pro Gly Tyr Arg Gln Glu Arg Val Glu Lys Gly Leu Lys
1340 1345 1350
Leu Phe Ala Gln Leu Ile Asn Asn Lys Val Phe Leu Leu Ser Phe
1355 1360 1365
Ile Arg Thr Leu Glu Ser Gln Arg Ser Phe Ser Met Arg Asp Arg
1370 1375 1380
Gly Asn Val Ala Ser Leu Ile Met Thr Val Leu Gln Ser Lys Leu
1385 1390 1395
Glu Tyr Ala Thr Asp Val Leu Lys Gln Leu Leu Ala Asp Leu Ile
1400 1405 1410
Asp Lys Asn Leu Glu Ser Lys Asn His Pro Lys Leu Leu Leu Arg
1415 1420 1425
Arg Thr Glu Ser Val Ala Glu Lys Met Leu Thr Asn Trp Phe Thr
1430 1435 1440
Phe Leu Leu Tyr Lys Phe Leu Lys Glu Cys Ala Gly Glu Pro Leu
1445 1450 1455
Phe Ser Leu Phe Cys Ala Ile Lys Gln Gln Met Glu Lys Gly Pro
1460 1465 1470
Ile Asp Ala Ile Thr Gly Glu Ala Arg Tyr Ser Leu Ser Glu Asp
1475 1480 1485
Lys Leu Ile Arg Gln Gln Ile Asp Tyr Lys Thr Leu Val Leu Ser
1490 1495 1500
Cys Val Ser Pro Asp Asn Ala Asn Ser Pro Glu Val Pro Val Lys
1505 1510 1515
Ile Leu Asn Cys Asp Thr Ile Thr Gln Val Lys Glu Lys Ile Leu
1520 1525 1530
Asp Ala Ile Phe Lys Asn Val Pro Cys Ser His Arg Pro Lys Ala
1535 1540 1545
Ala Asp Met Asp Leu Glu Trp Arg Gln Gly Ser Gly Ala Arg Met
1550 1555 1560
Ile Leu Gln Asp Glu Asp Ile Thr Thr Lys Ile Glu Asn Asp Trp
1565 1570 1575
Lys Arg Leu Asn Thr Leu Ala His Tyr Gln Val Pro Asp Gly Ser
1580 1585 1590
Val Val Ala Leu Val Ser Lys Gln Val Thr Ala Tyr Asn Ala Val
1595 1600 1605
Asn Asn Ser Thr Val Ser Arg Thr Ser Ala Ser Lys Tyr Glu Asn
1610 1615 1620
Met Ile Arg Tyr Thr Gly Ser Pro Asp Ser Leu Arg Ser Arg Thr
1625 1630 1635
Pro Met Ile Thr Pro Asp Leu Glu Ser Gly Val Lys Met Trp His
1640 1645 1650
Leu Val Lys Asn His Glu His Gly Asp Gln Lys Glu Gly Asp Arg
1655 1660 1665
Gly Ser Lys Met Val Ser Glu Ile Tyr Leu Thr Arg Leu Leu Ala
1670 1675 1680
Thr Lys Gly Thr Leu Gln Lys Phe Val Asp Asp Leu Phe Glu Thr
1685 1690 1695
Ile Phe Ser Thr Ala His Arg Gly Ser Ala Leu Pro Leu Ala Ile
1700 1705 1710
Lys Tyr Met Phe Asp Phe Leu Asp Glu Gln Ala Asp Lys His Gly
1715 1720 1725
Ile His Asp Pro His Val Arg His Thr Trp Lys Ser Asn Cys Leu
1730 1735 1740
Pro Leu Arg Phe Trp Val Asn Met Ile Lys Asn Pro Gln Phe Val
1745 1750 1755
Phe Asp Ile His Lys Asn Ser Ile Thr Asp Ala Cys Leu Ser Val
1760 1765 1770
Val Ala Gln Thr Phe Met Asp Ser Cys Ser Thr Ser Glu His Arg
1775 1780 1785
Leu Gly Lys Asp Ser Pro Ser Asn Lys Leu Leu Tyr Ala Lys Asp
1790 1795 1800
Ile Pro Ser Tyr Lys Asn Trp Val Glu Arg Tyr Tyr Ser Asp Ile
1805 1810 1815
Gly Lys Met Pro Ala Ile Ser Asp Gln Asp Met Asn Ala Tyr Leu
1820 1825 1830
Ala Glu Gln Ser Arg Met His Met Asn Glu Phe Asn Thr Met Ser
1835 1840 1845
Ala Leu Ser Glu Ile Phe Ser Tyr Val Gly Lys Tyr Ser Glu Glu
1850 1855 1860
Ile Leu Gly Pro Leu Asp His Asp Asp Gln Cys Gly Lys Gln Lys
1865 1870 1875
Leu Ala Tyr Lys Leu Glu Gln Val Ile Thr Leu Met Ser Leu Asp
1880 1885 1890
Ser
<210>17
<211>12
<212>PRT
<213>人工序列
<220>
<223>Myc tag
<400>17
Gly Gly Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu
1 5 10
<210>18
<211>29
<212>DNA
<213>人工序列
<220>
<223>正向引物
<400>18
gcagtgcacc aaggagcctg tcccaatcg
<210>19
<211>29
<212>DNA
<213>人工序列
<220>
<223>反向引物
<400>19
cgattgggac aggctccttg gtgcactgc 29