在植物中优化聚糖生成
发明领域
本发明涉及用于优化含有N-聚糖的糖蛋白的细胞或生物体,特别是植物的聚糖生成方法,从而得到一种糖蛋白,其具有高甘露糖型的N-聚糖,杂合型或优选复合型的N-聚糖,包括但不限于双触角N-聚糖,并在N-聚糖的至少一个臂上含有半乳糖残基,不含有(或者减少)木糖和海藻糖残基。本发明还涉及得到的所述糖蛋白和特别是含有该蛋白的植物宿主系统。
发明背景
N-联聚糖(N-Linked glycans)是连接到糖蛋白的天冬酰胺残基上的特定寡糖结构,能够显著地影响蛋白质的性质,进而影响生物体的特性。植物蛋白具有N-联聚糖,但是极其不同于哺乳动物,它们所影响的生物学过程几乎是未知的。
N-联聚糖的生物生成起始于脂联寡糖成分(Glc3Man9GlcNAc2-)的合成,该成分全部被转移给内质网(ER)中的新生多肽链。通过内质网和顺式高尔基体区室中的一系列外切糖苷酶的修剪(trimming),形成所谓的“高甘露糖”型聚糖(由Man9GlcNAc2变成Man5GlcNAc2)。随后,由GnTI将第一个GlcNAc转移到Man5GlcNAc2,接着通过甘露糖苷酶II(ManII)修剪来形成GlcNAcMan3GlcNAc2,开始形成复合型聚糖。当在一些其他的糖基转移酶的作用下,通过分泌路径在高尔基体中由GnTII将第二个GlcNAc残基以及其他单糖残基转移到GlcNAcMan3GlcNAc2上,继续复合型聚糖的生物合成。
植物和哺乳动物在复合聚糖形成方面是不同的(见附图1,比较植物和哺乳动物中的糖蛋白的糖基化路径)。在植物中,复合型聚糖的特征在于存在连接到Man-3的β(1,2)-木糖残基和/或连接到GlcNAc-1的α(1,3)-海藻糖残基,不具有连接到GlcNAc-l的α(1,6)-海藻糖残基。编码相应的木糖基(XylT)和海藻糖基(FucT)转移酶的基因已经被分离[Strasser等,“拟南芥β1,2-木糖基转移酶cDNA的分子克隆和功能性表达”,FEBS Lett.472:105(2000);Leiter等,“从绿豆中纯化、cDNA克隆和表达GDP-L-Fuc:Asn联GlcNAcα1,3-海藻糖转移酶”,生物学化学杂志(J.Biol.Chem.)274:21830(1999)]。植物不能生成β(1,4)-半乳糖基转移酶和α(2,6)唾液酸转移酶,结果植物聚糖缺乏常见于哺乳动物聚糖的β(1,4)-半乳糖和末端的α(2,6)NeuAc残基。
最终的聚糖结构不仅仅由存在的参与聚糖生物合成和转运的酶来决定,还在更大的范围内由各种酶促反应的特定顺序来确定。在后一种情况中,是受这些酶在整个内质网和高尔基中的分散隔离和相对位置来控制,这是通过转移酶的决定因子相互作用和亚高尔基体区室无转移酶的特定特征调节的。许多采用杂合分子的研究已经证明一些糖基转移酶的跨膜结构域在其亚高尔基分类中起主要作用,包括β(1,4)-半乳糖基转移酶的跨膜结构域[Grabenhorst等,生物学化学杂志(J.Biol.Chem.)274:36107(1999);Colley,K.,糖生物学(Glycobiology)7:1(1997);Munro,S.,细胞生物学趋势(Trends Cell Biol.)8:11(1998);Gleeson,P.A.,组织化学细胞生物学(Histochem.Cell Biol.)109:517(1998)]。
虽然植物和哺乳动物在相对较早以前就分化了,N联糖基化似乎至少部分地保守。这由聚糖结构虽然不同但是类似以及哺乳动物的GlcNAcTI基因染色体(complement)不具有GlcNAcTI活性的拟南芥的突变体证实,反之亦然。聚糖结构的差异具有重要作用。例如,已知木糖和α(1,3)-海藻糖抗原决定簇具有极高的免疫原性,并且在某些情况下可能引起过敏,这在用植物生产治疗性糖蛋白时带来了问题。而且,在许多敏感症患者的血液血清中含有直接抵抗这些抗原决定簇的IgE,而且50%的非敏感症血液供体在其血清中含有特异于核心-木糖的抗体,而25%含有特异于核心-α1,3-海藻糖的抗体(Bardor等,2002,在版,糖生物学(Glycobiology))(2002年12月17日预先Access出版),这使得这些个体冒险采用由植物制备的含有海藻糖和/或木糖的重组蛋白处理。此外,由于有证据表明这些糖特异的IgE与致敏反应无关,在血清中指示IgE的这种糖会在使用植物提取物的体外试验中引起假阳性反应。总之,使用植物生产的糖蛋白的治疗失败可能是由于加速清除具有木糖和/或海藻糖的重组糖蛋白。
因此,需要更好地控制植物中的糖基化,特别是用于治疗用途的糖蛋白的糖基化。
定义
为了方便本发明的理解,在本说明书中采用多种术语定义如下。
术语“载体”是指任何遗传元件,例如质粒、噬菌体、转位子、粘粒、染色体、逆转录病毒、病毒子、或类似遗传元件,当与恰当调控元件结合时,其能够复制,并将基因序列转移到细胞内和/或在细胞之间转移。因此,该术语包括克隆载体和表达载体,以及病毒载体。
在此所用术语“表达载体”是指重组DNA分子,其含有期望的编码序列—例如下文更加详细描述的杂合酶的编码序列—和在特定宿主细胞或生物体中表达可操作连接的编码序列所必需的适宜核酸序列。原核细胞中表达所必需的核酸序列通常包括启动子、操作子(可选择的)和核糖体结合位点,常常还有其他序列。已知真核细胞利用启动子、增强子、终止子和聚腺苷酰化信号。这不是将本发明限制在特定的表达载体或具有特定元件的表达载体。
当用于涉及细胞时,术语“转基因的”是指含有转基因的细胞,或者其基因组已经通过导入转基因被改变。当用于涉及、组织或植物时,术语“转基因的”分别是指包含转基因的细胞、组织或植物,其中该组织的一个或多个细胞含有转基因(例如编码本发明的杂合酶的基因),或基因组通过引入转基因而被改变的植物。转基因细胞、组织和植物可以通过一些方法制备,包括将包含核酸(通常DNA)的“转基因”导入目标细胞中或者通过人为介入将转基因整合到目标细胞的染色体中,例如通过本文描述的方法。
在此所用术语“转基因”是指任何核酸序列,其通过试验操作被导入到细胞的基因组中。转基因可以是“内源DNA序列”或“异源DNA序列”(即“外源DNA”)。术语“内源DNA序列”是指天然存在于其被导入的细胞的核苷酸序列,只要该核苷酸序列不含有相对于天然序列的修饰(例如点突变、存在选择性标记基因或其他类似修饰)。术语“异源DNA序列”是指被连接到或者被加工来连接到一条核酸序列上的核苷酸序列,自然条件下该核苷酸不与该核酸序列连接或者在不同位点上连接。异源DNA对于其所导入的细胞来说不是内源的,而是得自其他细胞。异源DNA还包括具有某些修饰的内源DNA序列。虽然不是必要地,但是一般地,异源DNA在细胞中被表达,编码该细胞通常不能生产的RNA和蛋白质。异源DNA的例子包括报道基因、转录和翻译调控序列、选择性标记蛋白(如赋予药物抗性的蛋白)、或其他类似元件。
术语“外源基因”是指通过试验操作被导入细胞基因组的任何核酸(如基因序列),包括存在于该细胞中的基因序列,只要被导入的基因序列具有相对于天然序列的某些修饰(例如点突变、存在选择性标记基因或其他类似修饰)。
术语“融合蛋白”是指其中至少一部分来自第一种蛋白质和另一部分来自第二种蛋白质的蛋白质。术语“杂合酶”是指一种功能性酶的融合蛋白,其中至少一部分是来自第一种类和另一部分来自第二种类。本发明的优选杂合酶是功能性糖基转移酶(或其部分),其中至少一部分来自植物和另一部分来自哺乳动物(如人类)。
术语“导入细胞”或“导入宿主细胞”涉及核酸(如载体)时,是包括本领域所谓的“转化”或“转染”或“转导”。细胞的转化是稳定的或瞬时的—和本发明提供在一定条件下导入载体,一方面可以稳定表达,另一方面仅仅是瞬时表达。术语“瞬时转化”或“瞬时地被转化”是指将一个或多个转基因导入细胞中,而不将转基因整合导宿主细胞的基因组中。瞬时转化可以例如通过酶联免疫吸收分析(ELISA)来检测,检测是否存在由一种或多种转基因编码的多肽。可替代地,瞬时转化可以通过检测由转基因(如抗体基因)编码的蛋白质的活性(如抗体的抗原结合)来检测。术语“瞬时转化”是指瞬时并入一种或多种转基因的细胞。相反,术语“稳定转化”或“稳定地被转化”是指将一种或多种转基因导入或整合到细胞的基因组中。细胞的稳定转化可以通过细胞的基因组DNA与能够结合到一种或多种转基因的核酸序列的Southern印迹杂交来检测。可替代地,细胞的稳定转化还通过细胞基因组DNA的聚合酶链式反应(PCR)来扩增转基因序列来检测。术语“稳定转化”是指稳定地将一个或多个转基因整合到基因组DNA的细胞。因此,稳定转化区别于瞬时转化,其中稳定转化的基因组DNA含有一种或多种转基因,瞬时转化的基因组DNA不含有转基因。
术语“宿主细胞”包括哺乳动物细胞(如人B细胞克隆、中国仓鼠卵巢细胞、肝细胞)和非哺乳动物细胞(如昆虫细胞、细菌细胞、植物细胞)。在一个实施方案中,宿主细胞是哺乳动物细胞,并且导入表达本发明的杂合蛋白(如TmGnTII-GalT)的载体抑制(或至少降低)所述哺乳动物细胞中的海藻糖基化(fucosylation)。
术语“目标核苷酸序列”是指任何核苷酸序列,对于本领域技术人员来说,由于任何原因(如赋予提高质量、用于制备治疗性蛋白质),其处理被认为是期望的。这种核苷酸序列包括但不限于结构基因的编码序列(如报道基因,选择标记基因、致癌基因、抗体基因、药物抗性基因、生长因子和其他类似基因),和不编码mRNA或蛋白产物的非编码调控序列(如启动子序列、聚腺苷酸序列、终止子序列、增强子序列、和其他类似序列)。本发明提供表达由目标核苷酸序列编码的异源蛋白的宿主细胞以及一种或多种杂合酶。
当用于涉及核酸时,如在“分离的核酸序列”中,术语“分离的”是指被鉴定和从一种或多种其他成分中被分离的核酸序列(如从含有该核酸的细胞中分离,或者从至少一种杂质核酸中分离,或者从一种或多种蛋白、一种或多种脂肪中分离),在天然来源中核酸通常与这些成分结合在一起。分离的核酸是以不同于其在自然界中见到的形式或装配(setting)存在的核酸。相反,未被分离的核酸是如以天然存在的状态被发现的DNA和RNA的核酸。例如,在接近于邻近基因的宿主细胞染色体上发现特定的DNA序列(如基因);RNA序列,如编码特定蛋白质的特定mRNA被发现在细胞中与大量编码许多蛋白质的其他mRNA混合在一起。但是,包含SEQ ID NO:1的分离核酸序列包括,作为例子,通常含有SEQ ID N0:1的细胞中这种核酸序列,其中核酸序列在区别于天然细胞的染色体的或染色体外的位置上,或者被不同天然存在的核酸序列侧面连接。分离的核酸序列可能以单链或双链形式存在。当分离的核酸序列被用于表达蛋白质时,该核酸序列将最小地至少含有有义链或编码链的一部分(即该核酸序列可以是单链的)。可替代地,可以同时含有有义链和反义链(即该核酸序列是双链的)。
此处所用术语“纯化的”是指核酸或者氨基酸序列分子,从其天然环境中被取出,被分离或被分开。因此“分离的核酸序列”是被纯化的核酸序列。“基本上纯化的”分子至少60%,优选至少70%和更加优选的至少90%没有该分子天然地结合的其他成分。本发明提供纯化的(包括基本上纯化的)和未纯化的杂合酶(将在下文中更详细描述)。
在此所用术语“互补的”或“互补性”被用于指根据碱基配对原则是相关的核苷酸序列。例如,序列5’-AGT-3’与序列5’-ACT-3’互补。互补性可以是“部分的”或“全部的”。“部分”互补性是其中一个或多个核苷酸碱基按照碱基配对原则是不匹配的。两条核酸之间的“全部的”或者“完全的”互补性是其中每个核酸碱基依据碱基配对原则与另一个碱基匹配。两条核酸链之间的互补程度显著地影响核酸链之间的杂交效率和强度。
在此所用的核酸序列的“互补物”是指核酸与核酸序列的核酸具有全部互补性的核苷酸序列。例如,本发明提供SEQ ID NO:1,3,5,9,27,28,29,30,31,32,33,34,35,37,38,40,41和43的互补物。
当用于涉及核酸时,术语“同源性”是指互补程度。可能是部分同源性(即部分同一性)或完全同源性(即完全同一性)。部分互补的序列是至少部分地抑制完全互补的序列杂交到目标核酸的序列,参照采用功能术语“基本上同源的”。可以在低严紧性条件下进行杂交分析(Southern或Northern印迹、溶液杂交等)来检测对完全互补序列与目标序列杂交的抑制。在低严紧条件下,基本上同源的序列或探针(即能够杂交到另一条目标寡核苷酸的寡核苷酸)将竞争和抑制完全同源的序列结合(即杂交)到目标上。这并不是说低严紧条件是可以进行非特异性结合的条件;低严紧条件要求两条序列相互结合是特异性的(即选择性的)互作。可以采用甚至不具有部分互补性(如小于约30%的同一性)的第二条目标序列来检测是否存在非特异性的结合;没有非特异性结合时,探针不会杂交到第二条非互补的目标链上。
当被用于涉及双链核酸序列如cDNA或基因组克隆时,术语“基本上同源的”是指在上文描述的低严紧条件下能够杂交到双链核酸的一条或两条链上的任何探针。
当被用于涉及单链核酸序列时,术语“基本上同源的”是指在上文描述的低严紧条件下能够杂交到单链核酸序列上的任何探针。
在此所用术语“杂交”包括“通过碱基配对将核酸的一条链结合到互补的链上的任何过程”[Coombs J(1994)生物工艺学词典(Dictionary of Biotechnology),Stockton出版社,纽约]。杂交和杂交强度(即核酸之间的结合强度)受核酸之间的互补程度、涉及的条件的严紧度、形成的杂合体的Tm、核酸中的G∶C比等因素的影响。
此处所用术语“Tm”用于指“解链温度”。解链温度是大量双链核酸分子半数分离成单链时的温度。计算核酸的Tm的方程在本领域是熟知的。如标准参考文献中指出。当核酸在1M NaCl的水溶液中时,Tm的简单估计值可以通过方程Tm=81.5+0.41(%G+C)计算[见如,Anderson和Young,定量滤过杂交:核酸杂交(Nucleic Acid Hybridization)(1985)]。其他的参考文献包括更加精确的计算,将结构特征以及序列特征考虑在内来计算Tm。
用于涉及核酸杂交时,低严紧条件包含的条件等价于当采用长度约100到约1000个核苷酸的DNA探针时,在68℃下在由5X SSPE(盐、磷酸钠、EDTA)(43.8g/l NaCl、6.9g/l NaH2PO4·H2O和1.85g/l EDTA(乙二胺四乙酸),用NaOH调节pH为7.4),0.1%SDS(十二烷基硫酸钠),5X Denhardt试剂[每500ml的50XDenhardt中含有:5gFicoll(Type400,Pharmacia),5gBSA(牛血清白蛋白)(Fraction V;Sigma)]和100μg/ml变性的鲑鱼精子DNA组成的溶液中结合或杂交,接着室温下在包含0.2X-2.0X SSPE和0.1%SDS的溶液中洗涤。
用于涉及核酸杂交时,高严紧条件包含的条件等价于当采用长度约100到约1000个核苷酸的DNA探针时,在68℃下在由5X SSPE,5X Denhardt试剂和100μg/ml变性的鲑鱼精子DNA组成的溶液中结合或杂交,接着在68℃下在包含0.2X-2.0X SSPE和0.1%SDS的溶液中洗涤。
当用于涉及与目标杂交条件相关的杂交条件时,术语“等价于”是指杂交条件和目标杂交条件引起具有相同范围的百分同源性的核酸序列的杂交。例如,目标杂交条件引起第一条核酸序列与另一条与第一条核酸序列具有50%-70%同源性的核酸序列的杂交,那么,如果另一种杂交条件也引起第一条核酸序列与另一条与第一条核酸序列具有50%-70%同源性的序列杂交,这种杂交条件被认为等价于目标杂交条件。
当用于涉及核酸杂交时,本领域技术人员知晓许多等价条件可被用于构成低的或高的严紧条件;考虑如探针的长度和性质(DNA、RNA,碱基组成)和靶点的性质(DNA、RNA,碱基组成,存在于溶液中或者是固定的)以及盐和其他成分浓度(如是否存在甲酰胺、硫酸葡聚糖、聚乙二醇)等因素,而且可以改变杂交溶液来产生区别、但等价于上面所列的条件的低严紧的或高严紧的杂交条件。
在此所用的术语“启动子”、“启动子元件”或“启动子序列”是指DNA序列,当被连接到目标核苷酸序列时,能够控制目标核苷酸序列转录为mRNA。虽然不是必须的,但是启动子通常位于目标核苷酸序列的5’端(即上游),该目标核苷酸序列转录成mRNA,启动子控制和提供用于起始转录的RNA聚合酶和其他转录因子的特异性结合位点。
启动子可以是组织特异性的或细胞特异性的。当应用于启动子时,术语“组织特异性的”是指启动子能够指导目标核苷酸序列选择性地表达到特定组织类型(如花瓣),而同一目标核苷酸序列在不同组织类型中(如根)相对地不表达。启动子的组织特异性可以被评价,如通过将报道基因可操作地连接到启动子序列上来产生报道构建体,将该报道构建体导入植物的基因组中,使得该报道构建体被整合到所得到的转基因植物的每个组织中,在转基因植物的不同组织中检测报道基因的表达(如检测mRNA、蛋白质、或由报道基因编码的蛋白质的活性)。在一个或多个组织中检测到比其他组织中报道基因的表达水平更高的报道基因的表达水平,表明启动子对于检测到较高表达水平的组织来说是特异的。术语“细胞类型特异的”应用于启动子是指启动子能够指导目标核苷酸序列在特定类型细胞中选择性地表达,而同一目标核苷酸序列在相同组织的不同类型的细胞中相对地不表达。术语“细胞类型特异的”应用于启动子还指启动子能够促进目标核苷酸序列在单一组织的某个区中选择性地表达。启动子的细胞特异性可以采用本领域熟知的方法来评价,如免疫组织化学染色。简而言之,组织切片被包埋在石蜡中,石蜡切片与特异于目标核苷酸序列所编码的多肽产物的第一抗体反应,该多肽的表达受启动子调控。特异于第一抗体的标记(如过氧化物酶偶联)第二抗体与组织切片结合,并且通过显微镜检测特异性结合(如用抗生物素蛋白/生物素)。
启动子可以是组成型的或调控型的。当术语“组成型的”用于涉及启动子时是指缺乏刺激(如热休克、化学药品、光照或类似刺激)时,启动子能够指导被可操作连接的核酸序列的转录。典型地,组成型启动子能够在几乎任何细胞和任何组织中指导转基因的表达。相反,“调控型的”启动子是在存在刺激(如热休克、化学药品、光照或类似刺激)时能够指导可操作地连接的核酸序列的一定水平的转录,其不同于缺乏刺激时的可操作地连接的核酸序列的转录水平。
术语用细菌“感染”(infecting)和“感染”(infection)是指目标生物样本在一定条件下与细菌共培养,使得包含在细菌内的核酸序列被导入目标生物样本的一个或多个细胞中。
术语“农杆菌”是指土壤中产生的、革兰氏阴性的、杆状的致植物病细菌,其引起冠瘿病。术语“农杆菌”包括但不限于根癌农杆菌(通常在被感染的植物中引起冠瘿病)和毛根农杆菌(其在被感染的宿主植物中引起发根疾病)。用农杆菌感染植物细胞通常导致被感染的细胞生成冠瘿碱(如胭脂碱、农杆碱、章鱼碱)。因此,导致生成胭脂碱的农杆菌菌株(如菌株LBA4301、C58、A208)称作为“胭脂碱型”农杆菌;导致生成农杆碱的农杆菌菌株(如菌株LBA4404、Ach5、B6)称作为“农杆碱型”农杆菌;导致生成章鱼碱的农杆菌菌株(如菌株EHA105、EHA101、A281)称作为“章鱼碱型”农杆菌。
术语“轰击”(bombarding)、“轰击”(bombardment)和“基因枪轰击”(biolistic bombardment)是指加速粒子轰击目标生物样本(如细胞、组织、植物的部分如叶子或完整的植物)的方法,来实现创伤目标生物样本的细胞的细胞膜/或使粒子进入目标生物样本。基因枪轰击的方法在本领域是已知的(如美国专利5,584,807和5,141,131,这两篇专利的内容在此引入作为参考),并且可以购买得到(如氦气生成微发射加速器(PDS-1000/He)(BioRad)。
当术语“微创”(microwounding)用于涉及植物组织时是指在该组织中引入细微的创伤。微创可以通过例如本文描述的粒子轰击来实现。本发明特别地提供采用微创来引入核酸的方案。
在此所用的术语“生物体”是指所用的生物体,并且特别是含有具有N-联聚糖的糖蛋白的生物体。
在此所用的术语“植物”是指充分地分化为存在于植物发育的任何阶段的一种结构的大量植物细胞。这种结构包括但不限于果实、芽、茎、根、叶、种子、花瓣或类似结构。术语“植物组织”包括分化的和未分化的植物组织,包括但不限于根、芽、叶、花粉、种子、瘤组织和各种类型培养细胞(如单细胞、原生质体、胚胎、愈伤组织、原始球茎样体和其他类型的细胞)。植物组织可能是in pLanta的、器官培养、组织培养或细胞培养中的。类似地,“植物细胞”可以是培养中的细胞或是植物的一部分。
糖基转移酶是催化决定细胞寡糖结构的加工反应的酶,包括糖蛋白上的寡糖。在此所用“糖基转移酶”是指包括甘露糖苷酶,既便这些酶修饰聚糖而不“转移”单糖。糖基转移酶具有II型膜定位的特性。每种糖基转移酶由氨基末端细胞质尾区(以下由一串专门用“X”标记氨基酸组成用于说明目的—而不是表示该区的实际大小)、信号锚定结构域(以下由一串用“H”标记的氨基酸组成表示疏水—而不是说明该结构域的实际大小,也不表示该结构域仅由疏水氨基酸组成)其跨过细胞膜(在此称作“跨膜结构域”)、接着是腔茎(以下用由一串专门用“S”标记的氨基酸组成表示—不是表示该区的实际大小)或柄区、和羧基末端的催化结构域(以下用一串专门用“C”标记的氨基组成表示—不是表示该结构域的实际大小:
NH2-
XXXXXXHHHHHHHHSSSSSSSSCCCCCCCC
总的来说,胞质尾区-跨膜-茎或“CTS”(已经在上述示意图中用下划线标注来说明)(或其部分)可以被用于本发明提供的实施方案中,其中催化结构域与来自其他分子的相应催化结构域(或这种区/结构域的部分)调换或“交换”来生成杂合蛋白。
例如,在一个优选实施方案中,本发明提供编码杂合酶的核酸(以及含有这种核酸的载体、含有这种载体的宿主细胞和杂合酶本身),所述杂合酶至少包含第一个糖基转移酶(如植物糖基转移酶)的CTS区的一部分[如,胞质尾区(“C”)、跨膜结构域(“T”)、胞质尾区以及跨膜结构域(“CT”)、跨膜结构域以及茎(“TS”)、或者完整的CTS区],和至少第二个糖基转移酶(如哺乳动物糖基转移酶)的催化区的一部分。为了建立这种实施方案,整个CTS区(或其部分)的编码序列从编码哺乳动物糖基转移酶的核酸中被删除,用植物糖基转移酶的完整CTS区(或其部分)的编码序列取代。另一方面,不同的方法可以被用于建立这种实施方案;例如,整个催化结构域(或其部分)的编码序列从植物糖基转移酶的编码序列中删除,并且用哺乳动物糖基转移酶的完整催化结构域(或其部分)的编码序列取代。在这种情况下,得到的杂合酶具有植物糖基转移酶的氨基末端胞质尾区,其连接到以野生型植物酶的一般形式连接在植物糖基转移酶的茎干区的植物糖基转移酶跨膜结构域上—但是茎干区将被连接到哺乳动物糖基转移酶的催化结构域(或其部分)上。
无意将本发明仅限于上面描述的两种方法。包括该方法中的其他改变。例如,为了生成编码杂合酶的核酸,所述杂合酶包含至少植物糖基转移酶的跨膜区的一部分和至少哺乳动物糖基转移酶催化区的一部分,可能采用小于CTS区的整个编码序列(如仅植物糖基转移酶的跨膜结构域,或完整的胞质尾区以及全部或部分跨膜结构域,或完整的胞质尾区以及整个跨膜结构域以及茎干区的部分)。可以删除哺乳动物的整个胞质尾区的编码序列以及跨膜结构域的编码序列(或其部分)—接着用相应的植物糖基转移酶的胞质尾区和跨膜结构域(或其部分)的编码序列取代。在这种情况下,得到的杂合酶具有连接到植物糖基转移酶跨膜结构域(或其部分)的哺乳动物糖基转移酶的茎干区,其接着被连接到植物糖基转移酶的氨基末端的胞质尾区上,而茎干区被连接到哺乳动物糖基转移酶的催化结构域上(即四个区/结构域中的两个是植物来源的,而另外两个是哺乳动物来源的)。
在另一个实施方案中,本发明提供编码杂合酶的核酸(以及载体、含有该载体的宿主细胞、含有该宿主细胞的植物或植物部分),所述杂合酶包含至少植物糖基转移酶的氨基末端的胞质尾区的一部分和至少哺乳动物糖基转移酶的催化区的一部分。在该实施方案中,由核酸编码的杂合酶可能含有或不含有其他植物序列(如跨膜结构域或其部分、茎干区或其部分)。例如,为了建立该实施方案,整个胞质尾区(或其部分)的编码序列被从编码哺乳动物糖基转移酶的核酸中删除,并且用植物糖基转移酶的整个胞质尾区结构域(或其部分)的编码序列取代。在这种情况下,得到的杂合酶具有连接到哺乳动物糖基转移酶跨膜结构域的植物糖基转移酶的氨基末端的胞质尾区(或其部分),其接着被连接到哺乳动物糖基转移酶的茎干区上,该茎干区被连接到哺乳动物的催化结构域上。另一方面,采用不同的方法来建立该实施方案;例如,整个催化结构域(或其部分)的编码序列从植物糖基转移酶的编码序列中删除,并且用哺乳动物糖基转移酶的整个催化结构域(或其部分)的编码序列取代。在这种情况下,得到的杂合酶以野生型植物酶的方式,植物糖基转移酶的氨基末端的胞质尾区被连接到植物糖基转移酶的跨膜结构域,跨膜结构域连接到植物糖基转移酶的茎干区,但是茎干区将被连接到哺乳动物糖基转移酶的催化结构域(或其部分)。
在上述讨论中,采用用语“或其部分”特别指在特定情况下可以使用小于完整的区/结构域(如可以使用一个片段)。例如,糖基转移酶的胞质尾区长度范围在5-50个氨基酸,更典型的是15-30个氨基酸,这取决于特定的转移酶。胞质尾区的“一部分”在此定义为不少于四个氨基酸,并且可以达到比该区/结构域全长少一个氨基酸。期望部分的功能在某种意义上类似于全长的区/结构域—但不必起到相同程度的功能。例如,在一定程度上,全长胞质尾区作为高尔基滞留区或内质网滞留信号,期望在上述实施方案中采用的部分还作为高尔基或内质网滞留区,虽然可能不如全长区一样有效。
类似地,跨膜结构域的长度典型地为15-25个氨基酸,主要由疏水氨基酸组成。跨膜结构域的一部分在此定义为不少于10个氨基酸,可以达到用比全长的区/结构域少一个氨基酸(对于特定转移酶)的长度。期望部分功能在某种意义上类似于全长的区/结构域—但不必起到相同程度的功能。例如,在一定程度上,全长跨膜区作为高尔基滞留区或内质网滞留信号,期望在上述实施方案中采用的部分还作为高尔基或内质网保留区,虽然可能不如全长区一样有效。本发明特别提供保守性取代来生成野生型跨膜结构域或其部分的变体。例如,本发明提供用一个或多个不同的氨基酸,优选还是疏水性氨基酸,来取代一个或多个疏水性氨基酸(在上述方案中表示为“H”)。
催化结构域的一部分可以比该结构域的全长少一个氨基酸。虽然,催化结构域来自β1,4-半乳糖基转移酶,优选该部分包括最小残基345-365,一般认为其参与产生寡糖受体结合位点的构象(优选该部分最小包括这个区,并且两侧有5-10个氨基酸以保证正确的构象)。
本发明还提供合成的CTS区和其部分。CTS的“一部分”必须至少包括一个(可以包括一个以上)完整的结构域(如完整的跨膜结构域),但小于整个CTS区。
重要的是,使用术语“CTS区”或“跨膜结构域”并不是说仅包括野生型的序列。事实上,本发明不限于天然的糖基转移酶和参与糖基化的酶,还包括采用具有相同或相似功能的合成酶。在一个实施方案中,野生型结构域被改变(如通过缺失、插入、取代等)。
最后,当涉及特定杂合体(如″TmXyl-)时使用指示“Tm”,包括完整的跨膜/CTS结构域(改变或未改变野生型序列)以及部分(改变或未改变野生型序列)。
发明概述
本发明提供编码杂合酶(或“融合蛋白”)的核酸(DNA或RNA)、含有这种核酸的载体、含有这种载体的表达杂合酶的宿主细胞(包括但不限于植物组织和整个植物中的细胞),和分离的杂合酶本身。在一个实施方案中,所述杂合酶(或“融合蛋白”)的表达导致糖基化的改变,例如,但不限于糖成分如木糖、海藻糖、LewisA/B/X或其他糖结构的下降,妨碍期望的糖型的沉积。在一个实施方案中,本发明提供编码杂合酶的核酸,所述杂合酶包含糖基转移酶(包括但不限于植物糖基转移酶)的CTS区(或其部分)和非植物糖基转移酶(如哺乳动物、鱼、两栖类、真菌)的糖基转移酶的催化区(或其部分)。优选地,当被表达时CTS区(或其部分)被(直接或间接地)可操作结合地连接到所述催化区(或其部分)。连接优选是共价的,而结合是可操作的,其中催化区具有催化功能(即使所述催化功能相对于野生型酶降低了)。连接的方式是使得不插入氨基酸或其他区/结构域。另一方面,进行连接使得在两者之间插入氨基酸(或其他化学基团)和/或其他区/结构域。当然,用于制备编码上述杂合酶的核酸的核酸可以由酶促从天然序列(如基因组DNA、cDNA等)获得或者可选择地采用参比序列(如电子的或硬拷贝的序列)作为向导合成。
在一个特定的实施方案中,本发明提供编码杂合酶的核酸,所述杂合酶包括植物糖基转移酶的跨膜区(如至少一个跨膜区和可选择地CTS区的多个区)和非植物(如哺乳动物)糖基转移酶的催化区(或其部分)。此外,优选当被表达时,这些区域被可操作结合地(直接或间接)连接。在还有一个实施方案中,本发明提供编码杂合酶的核酸,所述杂合酶包括植物糖基转移酶的跨膜结构域(或其部分)和哺乳动物糖基转移酶的催化区(或其部分)。另外,优选当被表达时,这些区域以可操作结合被(直接或间接地)连接。
无意将本发明限定于特定的转移酶。在一个实施方案中,植物糖基转移酶是木糖基转移酶。在另一个实施方案中,植物糖基转移酶是N-乙酰葡糖胺基转移酶(N-acetylglucosaminyltransferase)。在另一个实施方案中,植物糖基转移酶是海藻糖基转移酶。在一个优选实施方案中,哺乳动物糖基转移酶是人半乳糖基转移酶(如由SEQ ID NO:1编码的人β1,4-半乳糖基转移酶,其中编码跨膜结构域的核苷酸被删除和取代)。
无意将本发明限制于使用植物来源的糖基转移酶CTS结构域和人糖基转移酶催化结构域,而是反之亦然,采用糖基转移酶的任何CTS-结构域与至少另一种糖基转移酶的催化片段结合。事实上,在一个实施方案中,本发明广泛地包括编码杂合酶的核酸,所述杂合酶包含第一个糖基转移酶的跨膜区和第二个糖基转移酶的催化区。优选地,所述第一个和第二个糖基转移酶是来自不同种类(可以来自不同属或甚至来自不同的门)。在一个实施方案中,所述第一个糖基转移酶包含植物糖基转移酶。在另一个实施方案中,所述植物糖基转移酶是木糖基转移酶。在还有一个实施方案中,所述植物糖基转移酶是海藻糖基转移酶。在一个优选实施方案中,所述第二个糖基转移酶包含哺乳动物糖基转移酶。在一个特别优选的实施方案中,所述糖基转移酶是人半乳糖基转移酶。
无意将本发明限制在第一和第二个糖基转移酶分别是植物的和非植物的情况。在一个实施方案中,所述第一个糖基转移酶包含第一个哺乳动物糖基转移酶和所述第二个糖基转移酶包含第二个哺乳动物糖基转移酶。在优选实施方案中,所述第一个哺乳动物糖基转移酶是非人类的糖基转移酶,所述第二个哺乳动物的糖基转移酶是人糖基转移酶。
无意将本发明限制在载体类型。在一个实施方案中,本发明提供包含编码上述杂合酶的核酸的表达载体。
也无意将本发明限制于宿主细胞的类型。各种原核的和真核的宿主细胞可以购买到,用于表达蛋白。在一个实施方案中,本发明提供含有包含编码上述杂合酶的核酸的载体的宿主细胞(含有或不含有其他载体或其他编码其他杂合酶或糖基转移酶的核酸)。在一个优选实施方案中,宿主细胞是植物细胞。在特别优选的实施方案中,本发明提供一种包含这种宿主细胞的植物。
无意将本发明限制在使宿主细胞表达本发明的杂合酶的方法。在一个实施方案中,本发明提供一种方法:包含:a)提供:i)一种宿主细胞(如植物细胞,或者是培养的或是植物组织的部分或甚至是完整生长植物的部分),和ii)一种包含编码杂合酶的核酸的表达载体,所述杂合酶包含至少植物糖基转移酶的CTS区的一部分(如跨膜结构域)和至少哺乳动物糖基转移酶的催化区的一部分;和b)在一定条件下,将所述表达载体导入所述植物细胞中,使得所述杂合酶被表达。此外,无意将本发明限定于特定的转移酶。在一个实施方案中,用于上述方法中的植物糖基转移酶是木糖基转移酶。在另一个实施方案中,植物糖基转移酶是N-乙酰葡糖胺基转移酶。在另一个实施方案中,植物糖基转移酶是海藻糖基转移酶。在一个优选实施方案中,被用于实施方法的哺乳动物糖基转移酶是人半乳糖基转移酶(如由SEQ ID NO:1编码的人β1,4-半乳糖基转移酶,其中编码跨膜结构域的核苷酸被删除和取代)(或简而言之,其中SEQ ID NO:1中编码催化结构域或其部分的核苷酸被取出并连接到编码植物糖基转移酶的CTS区或其部分的核苷酸上)。
无意将本发明限制在用上述杂合酶控制异源蛋白的糖基化的特定方案中。在一个实施方案中,本发明提供一种方法,包含:a)提供:i)一种宿主细胞(如植物细胞),ii)包含编码杂合酶的核酸的第一种表达载体,所述杂合酶包含至少第一个(如植物)糖基转移酶的CTS区的一部分(如至少跨膜结构域)和至少第二个(如哺乳动物)糖基转移酶的催化区的一部分;和iii)包含编码异源糖蛋白(或其部分)的核酸的第二个表达载体;和b)在一定条件下,将所述第一个和第二个表达载体导入所述植物细胞中,使得所述杂合酶和所述异源蛋白被表达。可选择地,采用具有编码杂合酶(或多种杂合酶)和异源糖蛋白的核酸的单一载体。无论采用何种方法,在一个实施方案中,本发明包括分离异源蛋白以及被分离的蛋白本身作为一种组合物的额外步骤(c)。
另一方面,本发明还包括将不同载体导入不同植物细胞(无论是培养中的细胞、植物组织的部分、或甚至是完整生长植物的部分)。在一个实施方案中,本发明提供一种方法,包括:a)提供:i)包含第一种表达载体的第一种植物,所述第一个载体包含编码杂合酶(或编码两种或两种以上杂合酶)的核酸,所述杂合酶包含至少植物糖基转移酶的CTS区的一部分(如约N-末端的前40-60个氨基酸)和至少哺乳动物糖基转移酶的催化区的一部分,和ii)包含第二个表达载体的第二种植物,所述第二个载体包含编码异源蛋白(或其部分)的核酸;和杂交所述第一种植物和第二种植物来制备表达所述杂合酶和所述异源蛋白的子代。当然,这种子代可以被分离、生长和分析是否存在各种(或两种)蛋白。事实上,异源蛋白(典型地首先被纯化,基本上不含有植物细胞物质)可被治疗性地(如施用给人或动物,无论通过口服、静脉内、经皮肤或者其他施用路径)用于治疗或预防疾病。
无意将本发明限制在特定的异源蛋白。在一个实施方案中,提供任何对宿主细胞(或生物体)来说不是内源的肽或蛋白。在一个实施方案中,异源蛋白是抗体或抗体片段。在特别优选实施方案中,抗体是在植物中高产量地表达的人抗体或“人源化的”抗体。“人源化的”抗体通常从非人抗体(如啮齿类抗体)中制备,将非人类的抗体的超变区(也称作CDRs)取出,并将它们“移植”到人的构架中。整个操作可以是人工的(假设序列是已知的),可以从共同的人的构架的数据库中选择构架。多数情况下,除非架构序列被修饰或CDRs被修饰,否则制备过程中会损失亲合性。实际上,当CDRs被系统地突变(例如,通过随机化操作)和试验时,可以反映亲合性升高。
本发明上下文中的异源蛋白是特别有用的,在一个实施方案中,本发明的杂合酶可用于改变内源性蛋白的糖基化,即通常由宿主细胞或生物体表达的蛋白。
本发明特别包括植物本身。在一个实施方案中,本发明提供包含第一个和第二个表达载体的植物,所述第一个载体包含编码杂合酶的核酸,所述杂合酶包含至少植物糖基转移酶的CTS区的一部分(如胞质尾区以及至少跨膜结构域的一部分)和至少哺乳动物糖基转移酶的催化区的一部分,所述第二个表达载体包含编码异源蛋白(或其部分)的核酸。在一个优选实施方案中,通过与本发明的杂合酶(或多种杂合酶)一起表达,异源蛋白与在缺乏杂合酶(或多种杂合酶)的植物中异源蛋白的表达相比,表现为α1,3-海藻糖基化下降(10%-99%)(甚至无海藻糖基化)。在一个优选实施方案中,通过与本发明的杂合酶(或多种杂合酶)一起表达,异源蛋白与在缺乏杂合酶(或多种杂合酶)的植物中异源蛋白的表达相比,表现为木糖基化下降(10%-99%)(甚至无木糖基化)。在一个优选实施方案中,通过与本发明的杂合酶(或多种杂合酶)一起表达,异源蛋白与在缺乏杂合酶(或多种杂合酶)的植物中异源蛋白的表达相比,表现为海藻糖和木糖都下降。
无意将本发明限制在实现降低海藻糖和/或木糖的特定理论中。关于植物中的亚高尔基分类机制知道得极少。由于哺乳动物特异的β(1,4)-半乳糖基转移酶(GaIT)产生通常未见于植物中的聚糖结构,其已经被用作最佳第一标记来研究这种表型(见下文实施例)。表达半乳糖基转移酶的植物的聚糖结构已经与来自表达嵌合半乳糖基转移酶的植物的聚糖结构比较,其CTS结构域换成了植物木糖基转移酶的CTS结构域(或其部分)。观察到的聚糖结构的变化表明半乳糖基转移酶在哺乳动物中局限在植物高尔基的亚区室。不将本发明限制于任何特定机制,植物和哺乳动物的分类机制在某种程度上显然是保守的,植物不识别的糖基转移酶被运载到高尔基中的特定类似位置上。该位置在内源性木糖基、海藻糖基和GlcNAcTII(GnTII)转移酶的位置之后。
这些表达再定位的GalT变体的植物中的N-聚糖含有极少的木糖和海藻糖,这种发现也是具有生物技术相关性的。对于用于在哺乳动物如人中的治疗用途的糖蛋白,本发明的一些实施方案中的方法提供用于在植物中控制糖蛋白的N联糖基化的方法和组合物,使得可以得到一种糖蛋白,其基本上不含有木糖和海藻糖,而含有至少一个双触角N-聚糖(但不限于双触角,还包括三触角等)和在N-聚糖的至少一个臂上的(至少一个)半乳糖残基。因此,无意将本发明限制在双触角N-聚糖,而是包括平分的双触角N-聚糖、三触角N-聚糖等。此外,本发明不限于复合型的N-聚糖,还包括杂合型的N-聚糖以及其他类型的N-聚糖。本发明包括这种生成的糖蛋白。此外,本发明的方法和组合物可以被应用于植物和非植物系统,其中除了木糖、海藻糖之外,LewisA/B/X类型的N-聚糖修饰物(β1-3-GalT、α1-4-FucT等)或其他糖类干扰期望的糖型的沉积。
在一个实施方案中,本发明提供通过调节参与高尔基体中聚糖生物合成的酶的定位来控制植物的N联糖基化。特别地,本发明的实施方案是在植物宿主体系中制备糖蛋白的方法,包括:(a)阻止(或抑制)在所述糖蛋白的聚糖核心中增加木糖和海藻糖和(b)在所述臂上添加一个,优选两个半乳糖残基。该糖蛋白具有双触角聚糖,在至少一个臂上含有至少一个半乳糖残基,不含有(或降低)木糖和海藻糖。
通过将编码杂合酶的核酸导入到所述植物宿主系统中,可以减少或甚至阻止向所述异源糖蛋白中添加木糖和海藻糖,该杂合酶包含一种蛋白特别是一种酶如植物木糖基转移酶的CTS区(或其部分)和通常不存在于植物的半乳糖基转移酶或者其中跨膜部分被去除而插入内质网滞留信号的被修饰的半乳糖基转移酶的催化区(或其部分),其中所述蛋白质或酶早期在所述植物宿主系统中的植物细胞的高尔基体中起作用,而不是作为所述半乳糖基转移酶。优选半乳糖基转移酶是哺乳动物半乳糖基转移酶,特别是人半乳糖基转移酶。在最特别的实施方案中,所述半乳糖基转移酶是人β1,4-半乳糖基转移酶(GalT)。在一个优选的实施方案中,所述木糖基转移酶是β1,2-木糖基转移酶。用于替换哺乳动物糖基转移酶(如半乳糖基转移酶)的CTS区或CTS片段的是早期在高尔基体中起作用而不是作为半乳糖基转移酶的酶之一,包括但不限于导致含有不期望的木糖和海藻糖残基的聚糖的显著降低的XylT、FucT、GnTI、GnTII、GnTIII、GnTIV、GnTV、GnTVI、ManI、ManII和ManIII(见附图2)。此外,半乳糖基化增加而聚糖多样性降低。虽然不限于任何特定的机制,既不含有木糖也不含有海藻糖的半乳糖基化的聚糖增加被认为主要是由于GalGNMan5、GNMan5或GaIGNMan4沉积。此外,半乳糖基化仅在一个聚糖臂上发生。显然,高尔基中早期的半乳糖基化抑制由甘露糖酶II(ManII)将所述糖型修饰为的GaIGNMan3。还抑制由GlcNAcTII(GnTII)增加第二个GlcNAc。
因此,在一个实施方案中,包括获得期望的双臂被半乳糖基化而基本上不含有木糖和海藻糖的糖蛋白的其他步骤。因此,在一个实施方案中,如上指出的本发明的方法还包含增加半乳糖残基到所述糖蛋白的臂上(见附图3)。在本发明的一个实施方案中,半乳糖残基被加到两个臂上,采取往所述植物宿主系统中导入(a)编码包含GnTI的CTS区(或片段,如包括跨膜结构域的片段)和GnTII的活性结构域(或其部分)的第一个杂合酶的核酸序列;(b)编码包含GnTI的CTS区(或片段,如包括跨膜结构域的片段)和ManII的活性结构域的第二个杂合酶的核酸序列;和(c)编码包含XylT的CTS区(或片段,如包括跨膜结构域的片段)和人半乳糖基转移酶(TmXyl-GaIT)的活性结构域(或其部分)的第三个杂合酶的核酸序列。在本发明的另一个实施方案中,半乳糖残基被增加到双臂上,通过往所述植物宿主系统中导入(a)编码包含ManI的CTS区(或片段,如包括跨膜结构域的片段)和GnTI的活性结构域(或其部分)的第一个杂合酶的核酸序列;b)编码包含ManI的CTS区(或片段,如包括跨膜结构域的片段)和GnTII的活性结构域(或其部分)的第二个杂合酶的核酸序列;(c)编码包含ManI的CTS区(或片段,如包括跨膜结构域的片段)和ManII的活性结构域(或其部分)的第三个杂合酶的核酸序列和(d)编码包含XylT的CTS区(或片段,如包括跨膜结构域的片段)和人半乳糖基转移酶(TmXyl-GalT)的活性结构域(或其部分)的第四个杂合酶的核酸序列。
无意将本发明限制于特定的杂合酶的组合或者应用在单个细胞、植物组织或植物中的这种杂合酶的数量中。在一个优选实施方案中,本发明包括表达TmXyl-GaIT和TmGnTI-GnTII及TmGnTI-ManII的宿主细胞。在本发明的一个实施方案中,半乳糖残基被增加到所述臂,通过往所述植物宿主系统中导入(a)编码包含一种蛋白特别是一种酶包括但不限于N-乙酰葡糖胺基转移酶I(GnTI)的CTS区(或其片段)和甘露糖苷酶II(ManII)的催化区(或其部分)的第一个杂合酶的核酸序列,其中所述酶早期在所述植物宿主系统中的植物细胞的高尔基体中起作用,而不是作为甘露糖苷酶II或者其中跨膜部分被删除而插入内质网滞留信号的被修饰的甘露糖苷酶II和(b)编码包含包括但不限于N-乙酰葡糖胺基转移酶I(GnTI)的CTS区(或片段,如包括跨膜结构域的片段)和N-乙酰葡糖胺基转移酶II(GnTII)的催化区(或其部分)的第二个杂合酶的核酸序列,其中所述酶早期在所述植物宿主系统中的植物细胞的高尔基体中起作用,而不是作为N-乙酰葡糖胺基转移酶II(GnTII)或者其中跨膜部分被删除而插入内质网滞留信号的被修饰的N-乙酰葡糖胺基转移酶II(GnTII)。编码N-乙酰葡糖胺基转移酶或甘露糖苷酶或所述跨膜片段的序列来自植物或来自真核的非植物生物体(如哺乳动物)。
还有在另一个优选实施方案中,本发明包括表达TmXyl-GaIT和TmGnTI-GnTI及TmGnTI-ManII和TmGnTI-GnTII的宿主细胞。在本发明的另一个实施方案中,半乳糖残基被添加到所述臂,通过往所述植物宿主系统中导入(a)编码包含一种蛋白特别是一种酶包括但不限于甘露糖苷酶I(ManI)的CTS区(或其片段,如包括跨膜结构域的片段)和N-乙酰葡糖胺基转移酶I(GnTI)的催化区(或其部分)的第一个杂合酶的核酸序列,其中所述酶早期在所述植物宿主系统中的植物细胞的高尔基体中起作用,而不是作为N-乙酰葡糖胺基转移酶I(GnTI)或者其中跨膜部分被删除而插入内质网滞留信号的被修饰的N-乙酰葡糖胺基转移酶I(GnTI)和(b)编码包含包括一种酶但不限于甘露糖苷酶I(ManI)的CTS区(或片段,如包括跨膜结构域的片段)和甘露糖苷酶II(ManII)的催化区(或其部分)的第二个杂合酶的核酸序列,其中所述酶早期在所述植物宿主系统中的植物细胞的高尔基体中起作用,而不是作为甘露糖苷酶II(ManII)或者其中跨膜部分被删除而插入内质网滞留信号的被修饰的甘露糖苷酶II(ManII)和(c)编码包含包括一种酶但不限于甘露糖苷酶I(ManI)的CTS区(或片段,如包括跨膜结构域的片段)和N-乙酰葡糖胺基转移酶II(GnTII)的催化区(或其部分)的第三个杂合酶的核酸序列,其中所述酶早期在所述植物宿主系统中的植物细胞的高尔基体中起作用,而不是作为N-乙酰葡糖胺基转移酶II(GnTII)或者其中跨膜部分被删除而插入内质网滞留信号的被修饰的N-乙酰葡糖胺基转移酶II(GnTII)。编码N-乙酰葡糖胺基转移酶或甘露糖苷酶或所述跨膜片段的序列来自植物或来自真核的非植物生物体(如哺乳动物)。
还有在另一个优选实施方案中,本发明包括表达TmXyl-GaIT及ManIII的宿主细胞。在本发明的另一个实施方案中,半乳糖残基被增加到所述臂上,通过往所述植物宿主体系中导入(a)编码甘露糖苷酶III(ManIII的核酸序列,野生型基因序列但不限于:以及具有内质网滞留信号的ManIII;具有早期(顺式)高尔基体糖基转移酶(GnTI、ManI、GnTIII)的跨膜片段的ManIII。这些编码甘露糖苷酶III的序列来源于昆虫,优选来自草地夜蛾(Spodoptera fiugiperda)或黑腹果蝇(Drosophilamelanogaster)(不限于此)、人或来自其他生物体。
在还有另一个优选实施方案中,本发明包括表达TmXyl-GalT和ManIII及TmGnTI-GnTII的宿主细胞。在还有另一个优选实施方案中,本发明包括表达TmXyl-GalT和ManIII及TmManI-GnTI及TmManI-GnTII的宿主细胞。
在一个实施方案中,本发明的方法可选择地包含,往所述植物宿主体系中导入哺乳动物N-乙酰葡糖胺基转移酶(GnTIII),优选为人GnTIII或包含哺乳动物GnTIII的催化部分,和一种蛋白质的跨膜部分的杂合蛋白,所述蛋白质位于真核细胞的ER或高尔基体的早期区室中。例如,在一个实施方案中,包括杂合酶TmXyl-GnTIII(以及编码这种杂合酶的核酸,含有这种核酸的载体,含有这种载体的宿主细胞和含有这种宿主细胞的植物或植物部分)。在另一个实施方案中,包括杂合酶TmFuc-GnTIII(以及编码这种杂合酶的核酸,含有这种核酸的载体,含有这种载体的宿主细胞和含有这种宿主细胞的植物或植物部分)。本发明特别地包括表达这种杂合酶(含有或不含有其他的杂合酶或其他糖基转移酶)的宿主细胞。
本发明还提供所述杂合酶或被修饰的酶,编码所述杂合酶的核酸序列,包含所制核酸序列的载体和获得所述杂合酶的方法。此外,本发明提供包含异源糖蛋白的植物宿主系统,该糖蛋白优选具有复合型双触角聚糖并至少在一个臂上含有至少一个半乳糖残基,不含木糖和海藻糖。“异源糖蛋白”是来源于一个非植物宿主系统的种类的糖蛋白。糖蛋白包括但不限于抗体、激素、生长因子和生长因子受体和抗原。
实际上,本发明特别可用于控制异源糖蛋白的糖基化,如抗体或抗体片段(单链抗体,Fab片段、Fab2片段、Fv片段等)。为了控制抗体的糖基化,编码本发明的杂合酶的基因构建体(如TmXyl-GaIT基因构建体)被导入到表达一种抗体(如单克隆抗体)或抗体片段的转基因植物中。另一方面,编码抗体(或抗体片段)的基因通过转化表达TmXyl-GaIT基因构建体来被导入。在还有一个实施方案中,含有TmXyl-GaIT表达盒的双元载体与含有在单一T-DNA上包含单克隆抗体的轻链和重链序列的表达盒的植物双元载体或者与含有在各个T-DNA上分别包含单克隆抗体的轻链和重链序列的表达盒的植物双元载体被共转化到植物中。在一个实施方案中,本发明特别地包括将表达抗体的植物与本发明的表达杂合型糖基转移酶的植物杂交。
“宿主系统”包括但不限于含有具有N-聚糖的糖蛋白的任何生物体。
“植物宿主系统”包括但不限于植物或其部分,其包括但不限于植物细胞、植物器官/或植物组织。植物可以是单子叶植物(monocot),是一种开花植物,其种胚具有一片子叶(cotyledon)或子叶(seed leaf),包括但不限于百合、禾本科植物、玉米(Zea mays)、水稻、谷物包括燕麦、小麦和大麦,兰花、鹫尾、洋葱和棕榈。可选择地,植物可以是双子叶植物(dicot),其包括但不限于烟草(Nicotiana)、番茄、马铃薯、豆类(如紫花苜蓿和大豆)、玫瑰、雏菊(daises)、仙人掌、紫罗兰和浮萍。植物也可以是一种苔藓,包括但不限于Physcomitrellapaterls。
本发明还提供获得所述植物系统的方法。该方法包含将表达异源糖蛋白的植物与包含杂合酶(a)、(b)和(c)的植物杂交,杂合酶(a)包含通常不存在于植物中的半乳糖基转移酶的催化区(或其部分)和一种蛋白质的CTS区(或其片段,如包括跨膜结构域的片段),其中所述蛋白质早期在所述植物宿主系统的植物细胞的高尔基体中起作用而不是作为半乳糖基转移酶或其中其跨膜部分已经被删除而插入内质网滞留信号的被修饰的半乳糖基转移酶;杂合酶(b)包含一种蛋白质特别是一种酶包括但不限于N-乙酰葡糖胺基转移酶I(GnTI)的CTS区(或其片段,如包括跨膜结构域的片段)和甘露糖苷酶II(ManII)的催化区(或其部分),其中所述酶早期在所述植物宿主系统的植物细胞的高尔基体中起作用而不是作为甘露糖苷酶II或其中其跨膜部分已经被删除而插入内质网滞留信号的被修饰的甘露糖苷酶II和杂合酶(c)至少包含一种酶包括但不限于N-乙酰葡糖胺基转移酶I(GnTI)的糖基转移酶的跨膜区(如N末端的前40-60个氨基酸)和N-乙酰葡糖胺基转移酶II的催化区,其中所述酶早期在所述植物宿主系统的植物细胞的高尔基体中起作用而不是作为N-乙酰葡糖胺基转移酶II(GnTII)或其中其跨膜部分已经被删除而插入内质网滞留信号的被修饰的N-乙酰葡糖胺基转移酶II(GnTII),从所述杂交中收获子代并筛选期望的子代植物,其表达所述异源糖蛋白。
本发明还提供构成植物宿主系统的所述植物或其部分。所述植物宿主系统还包含哺乳动物GnTIII酶或者包含哺乳动物GnTIII的催化部分和一种蛋白质的跨膜部分的杂合蛋白,所述蛋白质位于真核细胞的ER或高尔基体的早期区室中。
此外,本发明还提供植物宿主体系来制备期望的糖蛋白或其功能性片段的用途。本发明还提供获得期望糖蛋白或其功能性片段的方法,包含培养按照本发明的细胞直到所述植物已经达到收获阶段,例如生长足以有利收获的生物量,然后采用本领域已知的已有方法收获所述植物,用本领域已知的已有的技术分级所述植物材料,至少部分地从所述被分级的植物材料中分离所述糖蛋白。
此外,获得包含所述异源糖蛋白的所述植物宿主细胞体系还可以通过往植物宿主细胞体系或其部分中导入(a)编码包含通常不存在于植物中的半乳糖基转移酶的催化区和至少一种蛋白质的跨膜区(或CTS的更多部分)的杂合酶的核酸序列,所述蛋白质早期在所述植物宿主系统的植物细胞的高尔基体中起作用而不是作为半乳糖基转移酶或其中跨膜部分已经被删除而插入内质网滞留信号的被修饰的半乳糖基转移酶;(b)编码包含至少一种蛋白质特别是一种酶包括但不限于N-乙酰葡糖胺基转移酶I(GnTI)的跨膜区(如果需要可以是CTS区的更多部分)和甘露糖苷酶II(ManII)的催化区的第一个杂合酶的核酸序列,其中所述酶早期在所述植物宿主系统的植物细胞的高尔基体中起作用而不是作为甘露糖苷酶II或其中跨膜部分已经被删除而插入内质网滞留信号的被修饰的甘露糖苷酶II和(c)编码包含至少一种蛋白质特别是一种酶包括但不限于N-乙酰葡糖胺基转移酶I(GnTI)的跨膜区(如果需要可以是CTS区的大部分)和N-乙酰葡糖胺基转移酶II(GnTII)的催化区的第二个杂合酶的核酸序列,其中所述酶早期在所述植物宿主系统的植物细胞的高尔基体中起作用而不是作为N-乙酰葡糖胺基转移酶II(GnTII)或其中跨膜部分已经被删除而插入内质网滞留信号的被修饰的N-乙酰葡糖胺基转移酶II(GnTII),和分离表达所述异源糖蛋白(或其部分)的植物或其部分。在一个实施方案中,包含所用核酸序列的载体被导入所述植物宿主系统中。在另一个实施方案中,每种核酸序列被插入各个载体中,并且这些载体被导入所述植物宿主系统中。在另一个实施方案中,两个或多个核酸序列的组合被插入到各个载体中,然后这些载体通过再转化或共转化或杂交被结合到所述植物宿主系统中。
本发明还提供使用本发明的这种植物来源的糖蛋白或其功能性片段来制备组合物,特别是药物组合物的用途,例如用抗体、激素、疫苗抗原、酶等处理患者。还提供这种包含糖蛋白或其功能性片段的药物组合物。
最后,可以预期上述的方法可以用于降低表达一种或多种本发明的杂合酶的植物中的聚糖的总体差异性(与野生型植物或仅用哺乳动物GaIT简单转化的植物比较)。
附图说明
附图1比较植物和哺乳动物中的糖蛋白的糖基化路径。
附图2显示用木糖基转移酶置换半乳糖基转移酶的CTS片段的效果。
附图3表示再定位甘露糖苷酶II和GlcNAcTII的其他影响。
附图4的上面组表示含有编码聚糖被修饰的酶的基因的T-DNA构建体,其有效生成不含有免疫原性的木糖和海藻糖的半乳糖基化的聚糖,下边组表示具有抗体轻链和重链基因的T-DNA构建体。
附图5表示人半乳糖基转移酶(人B1,4-半乳糖基转移酶-GaIT)的核酸序列(SEQ ID NO:1)。
附图6表示附图5的核酸序列以及相应的氨基酸序列(SEQ ID NO:2)。
附图7表示来自人半乳糖基转移酶的野生型氨基酸序列(SEQ ID NO:2)的示意性的突变序列(SEQ ID NO:59),其中丝氨酸从胞质尾区被去除,而重复基序G-I-Y。当然这种变化仅仅是阐明本发明的保护范围内的多种可能的变化。例如,在一个实施方案中,本发明包括突变序列,其中仅进行(一次或多次)删除(如胞质尾区或茎干结构域中的删除)—没有插入或重复。类似地,在一个实施方案中,本发明包括突变序列,其中仅进行(一次或多次)插入或置换(如在跨膜结构域)—没有删除。
附图8表示编码包含人半乳糖基转移酶(人B1,4-半乳糖基转移酶-GaIT)的杂合酶的核酸序列(SEQ ID NO:3)。大写字母是拟南芥的β1,2-木糖基转移酶的mRNA的核苷酸(数据库登录:EMBL:ATH277603,所用的TmXyl片段包括这个数据库的序列的核苷酸135-297)。
附图9表示附图8的核酸序列以及相应的氨基酸序列(SEQ ID NO:4)。
附图10表示由附图8中的核酸编码的杂合酶的氨基酸序列(SEQ ID NO:4)。
附图11表示人糖基转移酶GnTIII的核酸序列(SEQ ID NO:5)(以及编码myc-标记的其他序列)(原始登录号(primary accession number)Q09327 GNT3 HUMAN)。
附图12表示附图11的核酸序列以及相应的氨基酸序列(SEQ ID NO:6)。
附图13表示人GnTIII的氨基酸序列(SEQ ID NO:6)(以及myc抗原决定簇标记的其他氨基酸序列SEQ ID NO:7)。
附图14表示编码本发明的杂合酶的一个实施方案的核酸序列(SEQ ID NO:9),所述杂合酶包含植物木糖基转移酶(TmXyl-)的跨膜结构域和人GnTIII(TmXyl-GnTIII)(以及编码myc-标记的其他序列)的催化结构域(以及其他区域)。
附图15表示附图14的核酸序列以及相应的氨基酸序列(SEQ ID NO:10)。
附图16表示由附图14的核酸序列编码的杂合酶的氨基酸序列(SEQ ID NO:10)(以及myc抗原决定簇标记SEQ ID NO:7的其他序列)。
附图17表示编码杂合酶TmXyl-GaIT和TmGnTI-GnTII及TmGnTI-ManII的表达盒的完整核酸序列(SEQ ID NO:27)。
附图18表示编码杂合酶TmGnTI-ManII的表达盒的完整核酸序列(SEQ IDNO:28)(具有SEQ ID NO:39所示RbcSl启动子序列)。
附图19表示编码杂合酶TmGnTI-ManII的核酸序列(SEQ ID NO:29)。
附图20表示编码杂合酶TmGnTI-GnTII的核酸序列(SEQ ID NO:30)。
附图21表示编码杂合酶TmGnTI-GnTII的核酸序列(SEQ ID NO:31),其中跨膜片段(被消化的TmGntI)具有SEQ ID NO:32所示核酸序列。
附图22A表示编码跨膜结构域片段(TmGnTI)的一个实施方案的核酸序列(SEQ ID NO:32)。附图22B表示编码跨膜结构域片段(TmManI)的另一个实施方案的核酸序列(SEQ ID NO:33)。
附图23表示本发明的三个表达盒的实施方案的完整核酸序列(SEQ IDNO:34)。
附图24表示杂合基因表达盒(TmManI-GnTI)的核酸序列(SEQ ID NO:35)。
附图25表示组蛋白3.1启动子的核酸序列(SEQ ID NO:36)。
附图26表示杂合基因融合(TmManI-TmGnTI)的核酸序列(SEQ ID NO:37)。
附图27表示杂合基因融合TmManI-ManII的核酸序列(SEQ ID NO:38)(具有SEQ ID NO:39所示RbcSl启动子序列)。
附图28表示RbcSl启动子的核酸序列(SEQ ID NO:39)。
附图29表示杂合基因TmManI-ManII的核酸序列(SEQ ID NO:40),其中显示编码跨膜区片段的核酸序列(SEQ ID NO:33)。
附图30表示杂合基因TmManI-GnTII的核酸序列(SEQ ID NO:41)。
附图31表示Lhca启动子的核酸序列(SEQ ID NO:42)。
附图32表示杂合基因TmManI-GnTII的核酸序列(SEQ ID NO:43),其中显示编码跨膜片段的核酸序列(SEQ ID NO:33)。
附图33表示所用终止子序列(见下文)的核酸序列(SEQ ID NO:44)。
附图34是与对照植物比较,检测本发明的植物总蛋白糖基化的蛋白质印迹。
附图35用RCA对杂交植物的子代F1进行血凝素印迹,所述子代按照本发明的一个实施方案制备。
附图36是蛋白质印迹。组A是用抗IgG抗体分析,组B用抗HRP的抗体分析,组C用特异性抗Xyl抗体片段分析。组D是用特异性抗海藻糖抗体片段分析。组E用血凝素RCA分析。
附图37表示杂合基因的核酸序列(SEQ ID NO:49,其中昆虫甘露糖苷酶III的氨基末端CTS区用小鼠信号肽取代,并且添加羧基末端的内质网滞留信号(KDEL)。
附图38表示附图37的核酸序列的相应氨基酸序列(SEQ ID NO:50)。
附图39表示杂合基因的核酸序列(SEQ ID NO:51),其中人β1,4-半乳糖基转移酶(GalT)基因的氨基末端的CTS区用小鼠信号肽取代,并且添加羧基末端的内质网滞留信号(KDEL)。
附图40表示附图39的核酸序列的相应氨基酸序列(SEQ ID NO:52)。
附图41表示杂合基因的核酸序列(SEQ ID NO:53),其中拟南芥GnTI基因的氨基末端的CTS区用小鼠信号肽取代,并且添加羧基末端的内质网滞留信号(KDEL)。
附图42表示附图41的核酸序列的相应氨基酸序列(SEQ ID NO:54)。
附图43表示杂合基因的核酸序列(SEQ ID NO:55),其中拟南芥GnTII基因的氨基末端的CTS区用小鼠信号肽取代,并且添加羧基末端的内质网滞留信号(KDEL)。
附图44表示附图43的核酸序列的相应氨基酸序列(SEQ ID NO:56)。
附图45表示杂合酶的核酸序列(SEQ ID NO:57),其中人β1,4-半乳糖基转移酶(GalT)基因的氨基末端的CTS区用人的GnTI基因的CTS区取代。
附图46表示附图45的核酸序列的相应氨基酸序列(SEQ ID NO:58)。
附图47是酶如何定位于高尔基体的示意图。
附图48是转移酶的区域“交换”如何引起再定位的非限制性的假定示意图。
发明详述
杂合酶
采用本领域已知的各种重组DNA操作,如多聚酶链式反应或筛选表达文库来删除具有相同结构特征的克隆DNA片段,可以获得编码各种糖基化酶如甘露糖苷酶、GicNAcTs、半乳糖基转移酶的核酸序列。参见,如Innis等,1990,PCR:方法和应用指南(A Guide to Methods and Application),学院出版社,纽约。可以采用其他核酸扩增操作如连接酶链式反应(LCR),连接激活转录(LAT)和核酸序列扩增(NASBA)或远程PCR。
一旦生成DNA片段,通过各种方式实现确定具有期望基因的特定DNA片段。例如,可以得到一定含量的基因的部分或其特定RNA或其片段,并被纯化和标记,可以通过核酸杂交到标记探针来筛选生成的DNA片段[Benton和Davis,科学196:180(1977);Grunstein和Hogness,美国国家科学院汇编72:3961(1975)]。此外,可以通过基于表达产物的物理、化学或免疫特性的分析来检测基因的存在。例如,选择杂交筛选恰当mRNA的cDNA克隆或DNA克隆,其制备一种蛋白质,具有与目标蛋白已知的相似或相同的电泳迁移率、等电聚焦活性、蛋白水解消化图谱或抗原特性。
可如下获得编码包含第一个酶的跨膜部分和第二个酶的催化部分的杂合酶的核酸序列。编码跨膜部分的序列从第二个酶中去除,使得核酸序列包含编码第二个酶的C末端部分的序列,包括催化部位。编码第一个酶的跨膜部分的序列通过PCR被分离或得到,连接到编码包含第二个酶的C末端部分的序列的序列上。
被修饰的酶
去除编码跨膜片段的序列,用甲硫氨酸密码子(起始翻译)取代,和在半乳糖基转移酶的最后一个密码子和终止密码子之间插入编码ER滞留信号的核酸序列,如编码KDEL的序列(氨基酸残基序列:赖氨酸-天冬氨酸-亮氨酸)[Rothman,细胞50:521(1987)],获得编码蛋白质特别是酶的核酸序列,如滞留在ER中的半乳糖基转移酶、甘露糖苷酶和N-乙酰葡胺基转移酶。
使用其结构域和部分
如上指出,词语“至少一部分”或“其片段”是指蛋白或肽保持其性质和天然功能所必需的最小氨基酸序列。例如,酶的功能是指其酶促或催化作用,在高尔基体中锚定一种蛋白质的能力,或作为一种信号肽。因此,词语“至少跨膜结构域的一部分”或“跨膜结构域的一个片段”分别指较大跨膜结构域的最小氨基酸片段,其仍然保留至少一部分天然的跨膜功能(例如,功能虽然降低了,但是明显的)。作为另一个例子,词语“至少催化区的一部分”或“催化区的一个片段”分别指较大催化结构域的最小氨基酸片段,其仍然至少保留部分的天然催化功能(例如,既便有所降低,但是存在)。如在此所讨论,本领域的技术人员将知晓一种蛋白质或肽保持至少一些天然蛋白质或肽功能的最小氨基酸片段。
根据所转移的糖类型,糖基转移酶典型地分成两个家族(半乳糖基转移酶,唾液酸转移酶等)。根据氨基酸相似性和立体化学的反应过程,糖基转移酶可以被分为至少27个和可能多达47个家族[Campbell等,生物化学杂志(Biochem.J.)326:929-939(1997),生物化学杂志(Biochem.J.)329:719(1998)]。至今被克隆的大多数糖基转移酶是II型跨膜蛋白质(即在胞质中具有NH2末端和在高尔基体的内腔具有COOH末端的单一的跨膜结构域)。无论将它们如何分类,所有糖基转移酶具有某些共同的结构特征:短的NH2-末端胞质尾区,16-20个氨基酸信号锚或跨膜结构域,和扩展的茎干区,后面接着大的COOH-末端催化结构域。胞质尾似乎参与一些类型的糖基转移酶特异地定位于高尔基体[Milland等,生物学化学杂志(J.Biol.Chem.)277:10374-10378]。信号锚定结构域可以作为不可裂解的信号肽和作为跨膜区,指导糖基转移酶的催化结构域进入高尔基体的内腔。
在本发明的一个实施方案中,由Nicotiana benthamiana(烟草)乙酰葡糖胺基转移酶I的N-末端的77个氨基酸定义的部分被包含,用于杂合酶,由于该部分被发现足以在植物高尔基体中指向和保持报道蛋白[Essl等,FEBSLett453:169-173(1999)]。在烟草中,由假定的胞质的、跨膜的和茎干结构域构成的各种融合蛋白的亚细胞定位表明,仅胞质—跨膜结构域就足以保持β1,2-木糖基转移酶滞留在高尔基体中,而不需要任何腔序列的帮助[Dirnberger等,植物分子生物学(Plant Mol.Biol.)50:273-281(2002)]。因此,如上指出,本发明的一些实施方案采用仅包括胞质—跨膜结构域(或其部分)的CTS区部分,而未使用CTS区的茎干区。但是,一些类型糖基转移酶滞留高尔基体时主要依赖于其跨膜结构域,其他类型需要其跨膜区和该区的一端或两端的侧翼序列[Colley,糖生物学(Glycobiology)7:1-13(1997)]。例如,包含氨基酸1-32的N末端肽似乎是足以将β1,6N-乙酰葡糖胺基转移酶定位在高尔基体中的最小靶向信号。该肽组成这种酶的胞质结构域和跨膜结构域[Zerfaoui等,糖生物学(Glycobiology)12:15-24]。
大量特定糖基转移酶结构域的氨基酸序列的信息是可以获得的。例如,由GenBank登录号AAM17731提供的哺乳动物半乳糖基转移酶的氨基酸序列具有分别包括残基19-147和残基148-397的“茎”结构域和“催化”结构域[美国专利6,416,988,在此引入作为参考]和在一些实施方案中,本发明特别地包括将这些部分用于杂合酶。GenBank登录号AAC91156提供的大鼠肝脏唾液酸转移酶的氨基酸序列具有9个氨基酸的NH2末端胞质尾区、17个氨基酸的信号锚定结构域,和包括暴露的茎区的腔结构域,接着是41kDa的催化结构域[Hudgin等,加拿大生物化学杂志(Can.J.Biochem.)49:829-837(1971);美国专利5,032,519和5,776,772,在此引入作为参考]。已知的人和小鼠β1,3-半乳糖基转移酶具有催化结构域,其具有8个保守区[Kolbinger等,生物学化学杂志(J.Biol.Chem.)273:433-440(1998);Hennet等,生物学化学杂志(J.Biol.Chem.)273:58-65(1998);美国专利5,955,282,在此引入作为参考]。例如,由GenBank登录号NM020026提供的小鼠UDP-半乳糖:β-N-乙酰氨基葡萄糖β1,3-半乳糖基转移酶-I的氨基酸序列具有如下催化区:从残基78-83的区1;从残基93-102的区2;从残基116-119的区3;从残基147-158的区4;从172-183的区5;从残基203-206的区6;从残基236-246的区7;和从残基264-275的区8.[Hennet等,同上文]-所有这些区都被包含在本发明的一些实施方案中,作为上面讨论的杂合酶的有用部分。
先前在已知的糖基转移酶的cDNA克隆之间的比较表明,酶之间序列的同源性极低[Paulson等,生物化学杂志(J.Biol.Chem.)264:17615-618(1989)],最新进展使得可能推导出特异性不同的糖基转移酶中的保守结构域[Kapitonov等,糖生物学(Glycobiology)9:961-978(1999)]。例如,通过采用由所得到的完整基因组序列提供的序列数据,已经确定各种生物体的大量糖基转移酶的核酸和氨基酸序列,如现代人(人类)、Caehorhabditis elegans(土壤线虫)、拟南芥(thale cress,芥菜)和Oryza sativa(水稻)。
作为广泛研究的结果,已经推导出各种糖基转移酶家族的一致结合位点的共同氨基酸序列。例如,唾液酸转移酶具有唾液酸基序(sialyl motif),其似乎参与共同底物CMP-硅酸的识别[Paulson等,生物学化学杂志(J.Biol.Chem.),264:17615-17618(1989);Datta等,生物学化学杂志(J.Biol.Chem.),270:1497-1500(1995);Katsutoshi,糖科学糖技术趋势(Trends Glycosci.Glycotech.)8:195-215(1996)]。Galα1-3半乳糖基转移酶中的六肽RDKKND和GIcNAcβ1-4半乳糖基转移酶中的RDKKNE被认为是UDP-Gal的结合位点[(Joziasse等,生物学化学杂志(J.Biol.Chem.),260:4941-4951(1985),生物学化学杂志(J.Biol.Chem.),264:14290-14297(1989);Joziasse,糖生物学(Glycobiology),2:271-277(1992))。
由两个天门冬氨酸残基构成小的高保守性基序(DXD),通常被亲水区包围,已经在大量不同真核生物转移酶中被确定,包括α-1,3-甘露糖基转移酶,β-1,4-半乳糖基转移酶,α-1,3-半乳糖基转移酶,葡糖醛酸基转移酶,海藻糖基转移酶,糖原引物(glycogenins)等[Wiggins等,美国国家科学院汇编(Proc.Natl.Acad.Sci.U.S.A.)95:7945-7950(1998)]。突变试验表明这个基序是酶促活性所必需的[Busch等,生物学化学杂志(J.Biol.Chem.)273:19566-19572(1998);Wang等,生物学化学杂志(J.Biol.Chem.)277:18568-18573(2002)]。多重肽对比表明一些对应于假定催化区的基序在所有β3-半乳糖基转移酶家族的成员中是保守的,也就是II型跨膜结构域,保守性DxD基序,N-糖基化位点和五个保守性胱氨酸[Gromova等,分子致癌性(Mol.Carcinog.)32:61-72(2001)]。
通过BLAST检索和多重对比,发现E-X7-E基序在滞留糖基转移酶的四个家族的成员中是高度保守的。[Cid等,生物学化学杂志(J.Biol.Chem.)275:33614-33621(2000)]。O-连接乙酰葡糖胺基转移酶(GIcNAc)将一个P-N-乙酰氨基葡萄糖成分添加到特定丝氨酸或苏氨酸羟基上。BLAST分析、相同的二级结构预测和折叠识别研究表明,第二个Rossmann结构域中的保守基序对应UDP-GicNAc供体-结合位点[Wrabl等,分子生物学杂志(J.Mol.Biol.)314:365-374(2001)]。迄今确定的β1,3-糖基转移酶共有一些保守区和保守半胱氨酸残基,都位于假定的催化区。定点突变鼠β3GatT-I基因(登录号为AF029790)表明,保守性残基W101和W162参与UDP-半乳糖供体的结合,残基W315参与N-乙酰氨基葡萄糖β-p-硝基酚受体结合,包括E264的结构域似乎参与这两种底物的结合[Malissard等,欧洲生物化学杂志(Eur.J.Biochem.)269:233-239(2002)]。
在植物宿主系统中表达目标蛋白
按照本发明的一些实施方案,编码杂合或改进的酶或其他异源蛋白质如异源糖蛋白的核酸被插入到合适的表达载体中,即包含插入的编码序列的转录和翻译所需元件的载体,或者为RNA病毒载体的情况下,复制和翻译的必需元件,以及选择性标记。这些包括但不限于启动子区,信号序列,5’不翻译序列,起始密码子(取决于结构基因是否携带一个),和转录和翻译终止序列。获得这些载体的方法在本领域是已知的(参见WO 01/29242作为综述)。
适合于植物中的表达的启动子序列在现有技术中被描述,如WO 91/198696。包括非组成型启动子或组成型启动子,如胭脂碱合成酶和章鱼碱合成酶启动子、花椰菜花叶病毒(CaMV)19S、35S启动子和玄参花叶病毒(FMV)35启动子(见美国专利5,352,605和6,051,753,都在此引入作为参考)。所用的启动子可以是组织特异性启动子,如靶向胚乳、糊粉层、胚胎、果皮、茎、叶、块茎、根等。
信号序列使蛋白质被恰当地加工和转移。信号来源于植物或者是非植物信号序列。信号肽指引初生多肽到内质网,随后多肽在此进行翻译后的修饰。信号肽可由本领域技术人员常规地确定。信号肽通常具有三联结构,在N末端具有正电荷氨基酸,接着是疏水区,然后在低疏水性区内具有裂解位点。
转录末端通常在转录起始调控区的相反端。其可能与转录起始区相关,来自不同基因,被选择用来增强表达。一个例子是来自农杆菌Ti质粒的NOS终止子和水稻α-淀粉酶终止子。还可以添加聚腺苷酸尾。例子包括但不限于农杆菌章鱼碱合成酶信号[Gielen等,EMBO J.3:835-846(1984)]或相同种类的胭脂碱合成酶[Depicker等,分子应用遗传学(Mol.Appl.Genet.)l:561-573(1982)]。
可以包括增强子来提高和/或最大化异源蛋白质的转录。这些包括但不限于肽排出信号序列、密码子选择、内含子、聚腺苷酰化和转录终止位点(见WO01/29242)。
标记优选包括原核生物的选择性标记。这种标记包括抗生素抗性如氨卡青霉素、四环素、卡那霉素和奇霉素。特别的例子包括但不限于编码链霉素抗性的链霉素磷酸转移酶(spt)基因、编码卡那霉素或遗传抗性的新霉素磷酸转移酶(nptII)基因、编码潮霉素抗性的潮霉素磷酸转移酶(hpt)基因。
采用本领域已知的方法(参见WO 01/29242和WO 01/31045),将所构建的载体导入植物宿主系统中。载体被改进为介导植物转化质粒,含有与根癌农杆菌载体同源的区域、来自根癌农杆菌的T-DNA边界区。可选择地,用于本发明的方法的载体可以是农杆菌载体。导入载体的方法包括但不限于微注射,用具有核酸的小颗粒速度弹道穿透,核酸在小珠或颗粒的基质中或者在表面,以及电穿孔。载体被导入植物细胞、组织或器官中。在一个特别的实施方案中,一旦确定存在异源基因,可用本领域的已知方法再生植物。可以采用本领域已知的方法筛选期望的蛋白,优选采用筛选分析,其中以产生可检测的信号的方式来检测生物学活性位点。该信号可以直接或间接产生。这种分析的例子包括ELISA或放射免疫分析。
瞬时表达
本发明特别包括上述杂合酶的稳定表达和瞬时表达。用于转化大量各种高等植物种类来瞬时表达表达盒的技术是已知的[见如Weising等,Ann.Rev.Genet.22:421-477(1988)]。不同系统的变量包括被转化的核酸类型(DNA、RNA、质粒、病毒)、被转化的组织类型、导入转基因的方法和转化条件。例如可以采用从电转化、PEG poration、粒子轰击、硅纤维呈递、植物细胞原生质体或胚愈伤组织或其他植物组织微注射,或者农杆菌介导转化等范围内的技术[Hiei等,植物杂志(Plant J.)6:271-282(1994)],将核酸构建体直接导入植物细胞中。由于转化效率是变化的,常常采用内参(如35S-Luc)来规格化转化效率。
用于瞬时分析的表达构建体包括质粒和病毒载体。可以用作载体的各种植物病毒在本领域是已知的,包括花椰菜花叶病毒(CaMV)、双粒病毒组、雀麦草花叶病毒和烟草花叶病毒。
适合于瞬时表达的植物组织包括培养的细胞,或者是完整的或者作为原生质体(其中细胞被去除)、培养的组织、培养的植物和植物组织如叶子。
一些瞬时表达的方法采用通过电转化或聚乙二醇介导将基因转化到植物细胞原生质体中。这些方法需要制备和培养植物原生质体,包括在原生质体上形成穿孔,核酸通过该孔被转化到原生质体的内部。
示例性的电转化技术在Fromm等,美国国家科学院(Proc.Natl.Acad.Sci.)82:5824(1985)中被描述。采用聚乙二醇穿透的DNA构建体导入在Paszkowski等,EMBO J.3:2717-2722(1984)中被描述。烟草原生质体的PEG-介导转化在Lyck等,(1997)植物界(Planta)202:117-125和Scharf等,(1998)分子细胞生物学(Mol Cell Biol)18:2240-2251,和Kirschner等,(2000)植物杂志(The PlantJ)24(3):397-411中被描述,包括原生质体的分离、纯化和转化的步骤。这些方法已经被用于例如确定由外部刺激激活的启动子中的顺式作用元件,Abel和Theologis(1994),植物杂志(Plant J)5:421-427;Hattori等,(1992)遗传发育(Genes Dev)6:609-618;Sablowski等,(1994)EMBO J 13:128-137;和Solano等,(1995)EMBO J 14:1773-1784),以及其他的基因表达研究(美国专利6,376,747,在此引入作为参考)。
弹道转化技术在Klein等,(1987)自然(Nature)327:70-73中被描述。弹道瞬时转化用于悬浮细胞或植物器官。例如,其已经被开发用于烟草叶子,Godon等,(1993)Biochimie 75(7):591-595。其还用于研究植物启动子,(Baum等,(1997)植物杂志(Plant J)12:463-469;Stromvik等,(1999)植物分子生物学(PlantMol Biol)41(2):217-31,Tuerck和Fromm(1994)植物细胞(Plant Cell)6:1655-1663;和美国专利5,847,102,在此引入作为参考),和用于表征转录因子(Goff等,(1990)EMBO J 9:2517-2522;Gubler等,(1999)植物杂志(Plant J)17:1-9;和Sainz等,(1997)植物细胞(Plant Cell)9:611-625)。
另一种方法可以原位可视化基因的瞬时表达,例如洋葱表皮剥落,其中可以观察到GFP在各种细胞腔室内表达(Scott等,(1999)生物技术(Biotechniques)26(6):1128-1132。
还可以通过直接注射将核酸导入植物中。瞬时基因表达可以通过将DNA注射到植物的繁殖器官中来实现(见如,Pena等,(1987)自然,325:274),如将DNA转化到花粉中(见如Zhou等,(1983)酶学中的方法(Methods inEnzymology),10l:433;D.Hess(1987)Intern Rev.Cytol.,107:367;Luo等,(1988)植物分子生物学报道(Plant Mol.Biol.Reporter),6:165。DNA还可以直接注射到未成熟的胚胎的细胞中(见如,Neuhaus等,(1987)Theor.Appl.Genet:75:30;和Benbrook等,(1986)Proceedings Bio Expo 1986,Butterworth,Stoneham,Mass,27-54)。
农杆菌介导的转化可以应用于双子叶植物和单子叶植物。用于禾本科植物如水稻和玉米的农杆菌介导的转化的最佳方法和载体已经被描述(见如,Heath等,(1997)分子植物微生物互作(Mol.Plant-Microbe Interact.)10:221-227;Hiei等,(1994)植物杂志(Plant J.)6:271-282和Ishida等,(1996)自然生物技术(Nat.Biotech.)14:745-750)。玉米转化的效率受到各种因素的影响,包括感染的组织的类型和阶段、农杆菌浓度、组织培养液、Ti载体和玉米基因型。
另一种有效的基本转化操作包括结合粒子轰击创伤,接着用农杆菌呈递DNA(见如,Bidney等,(1992)植物分子生物学(Plant Mol.Biol.)18:301-313)。完整的分生转化和断裂分生转化也是已知的(美国专利6,300,545在此引入作为参考)。
利用农杆菌的其他方法包括农杆菌感染法和农杆菌渗入。通过将病毒基因组插入T-DNA,农杆菌可用于介导植物的病毒感染(见如,美国专利6,300,545在此引入作为参考)。在将T-DNA转入植物细胞后,成功病毒感染要求病毒基因组从T-DNA上切除(转移)。这种用于将病毒导入植物宿主的农杆菌介导方法被称作农杆菌感染(见,如,Grimsley,“农杆菌感染”,325-342,分子生物学中的方法(Methods in Molecular Biology),第44卷:农杆菌操作,Gartland和Davey编辑,Humana Press,Inc.,Totowa,新泽西州;Grisley(1990)Physiol.Plant.79:147-153)。
用于在植物中表达外源基因的植物病毒基因载体的发展提供了一种方法,在短时间内产生高水平的基因表达。适宜的表达复制子包括来自具有双链DNA基因组的病毒的双链DNA或者复制介质。被切除的病毒DNA可以独立地或者与翻译中添加因子一起作为复制子和复制介质。病毒DNA编码或不编码感染性的病毒颗粒,还可以具有插入、删除、取代、重排或其他修饰。病毒DNA含有异源DNA,可以是任何非病毒的或来自不同病毒的DNA。例如,异源DNA可以包含目标蛋白或RNA的表达盒。
具有农杆菌A28l和A348的病毒基因的超级双元载体可以用于单子叶植物的高效转化。但是,既便不采用高效的载体,已经证明T-DNA能有效地转化玉米,虽然不形成细胞瘤,但是产生由农杆菌诱导的病毒的系统性感染(Grimsley等,(1989)Mol.Gen.Genet.217:309-316)。这是由于含有病毒基因组的T-DNA的整合不要求病毒增殖,切除的病毒基因组作为独立的复制子。
另一种农杆菌介导的瞬时病毒分析基于农杆菌介导转化in planta的烟草叶片(Yang等,(2000)植物学杂志(The Plant J)22(6):543-551)。这种方法采用含有质粒构建体的农杆菌侵入烟草叶片中,称作为农杆菌侵入;已经被用于体内分析在2-3天内的启动子和转录因子的表达。也可以原位检测外部刺激,如病原体感染和环境应激对启动子活性的影响。
实施例1
采用先前描述的基于亲缘种选择操作的PCR[Bakker等,BBRC 261:829(1999)],从cDNA文库中分离编码β1,2-木糖基转移酶的拟南芥cDNA。用从兔抗辣根过氧化酶抗血清中纯化的木糖特异性抗体免疫染色被转化的CHO细胞,确定木糖基转移酶活性。用引物:
XylTpvuF:ATACTCGAGTTAACAATGAGTAAACGGAATC(SEQ ID NO:45)和
XylTpvuR:TTCTCGATCGCCGATTGGTTATTC(SEQ ID NO:46)
扩增含有木糖基转移酶的N末端部分的DNA片段,在起始密码子的前面引入XhoI和HpaI限制性位点,而在相反末端引入PvuI。用引物
GalTpvuF:GCCGCCGCGATCGGGCAGTCCTCC(SEQ ID NO:47)和
GalTrev:AACGGATCCACGCTAGCTCGGTGTCCCGAT(SEQ ID NO:48)
扩增人β1,4半乳糖基转移酶(登录号x55415,Aoki 1992)的C末端片段,然后引入PvuI和BamHI位点。将XhoI/PvuI和PvuI/BamHI的消化的PCR片段连接到用XhoI/BamHI消化的pBluescriptSK+上并测序。得到的开放阅读框编码融合蛋白,其含有与人β1,4半乳糖基转移酶的69-398氨基酸融合的拟南芥β1,2-木糖基转移酶的前54个氨基酸,称作为TmXyl-GalT。用HpaI/BamHI,将该片段克隆到植物表达载体中,位于CaMV35S启动子和Nos终止子之间。如天然的人β1,4半乳糖基转移酶[Bakker等,美国国家科学院汇编(Proc.Nat.Acad.Sci.USA)98:2899(2001)]一样,该克隆被导入烟草(samsun NN)中。
如描述[Bakker等,美国国家科学院汇编(Proc.Nat.Acad.Sci.USA)98:2899(2001)],进行转基因植物蛋白质的提取和蛋白质印迹。根据血凝素RCA的反应,通过MALDI-TOF[Elbers等,植物生理学(Plant Physiology)126:1314(2001)],选择表达TmXylGalT的转基因植物用于进一步分析聚糖,并与从表达天然β1,4半乳糖基转移酶的植物中分离的聚糖比较,以及与野生型植物的聚糖比较。表1中给出MALDI-TOF质谱的相对峰值区。也就是说,表1是对照烟草(“Tobacco”)、表达人β1,4-半乳糖基转移酶的转基因烟草(“GalT”),以及CTS区用β-1,2-木糖基转移酶的CTS区取代的表达β-1.4-糖基转移酶的转基因烟草植物(“TmXyl-GaIT”)的内源性糖蛋白的N聚糖的质谱(MALDI-TOF)分析结果的比较。
表1 | | | | | |
m/z | |
类型 |
烟草 |
GalT |
TmXyl-GaIT |
| | | | | |
933 | |
M3 | |
3 |
7 |
1065 | |
XM3 |
10 |
16 |
3 |
1079 | |
FM3 | | |
4 |
1095 | |
M4 | | |
9 |
1211 | |
FXM3 |
41 |
27 | |
1257 | |
M5 |
4 |
5 |
23 |
1268 | |
GNXM3 | |
4 | |
1298 | |
GalGNM3 | | |
6 |
1298 | |
GNM4 | | |
1414 | |
GNFXM3 |
27 |
13 |
5 |
1419 | |
M6 |
7 |
8 |
10 |
1460 | |
GalGNM4 | | |
11 |
1460 | |
GNM5 | | |
1485 | |
GN2FM3 | |
4 | |
1576 | |
GalGNFXM3 | |
5 | |
1576 | |
GNFXM4 | | |
1581 | |
M7 |
3 | |
4 |
1606 | |
GNXM5 | | |
3 |
1606 | |
GalGNFM4 | | |
1617 | |
GN2FXM3 |
8 |
9 | |
1622 | |
GalGNM5 | | |
9 |
1622 | |
GNM6 | | |
1743 | |
M8 | |
2 |
3 |
1768 | |
GalGNFM5 | | |
3 |
1768 | |
GNFM6 | | |
1779 | |
GalGN2FXM3 | |
2 | |
1905 | |
M9 | | |
1 |
1941 | |
Gal2GN2FXM3 | |
2 | |
| | | | | |
| |
总计 |
100 |
100 |
101 |
这些数据表明:
1.在TmXylGalT植物中,聚糖的木糖基化和海藻糖基化显著地降低:与14%野生型植物相比,82%聚糖不携带木糖或海藻糖。
2.半乳糖苷化从GaIT植物的9%增加到TmXylGalT植物的32%。
实施例2
根据生物素标记RCA(Vector Laboratories,伯林盖姆,加利福尼亚)的血凝素印迹,筛选表达所述TmXyl-GaIT基因的转基因植物(TmXyl-GaIT-12植物)(如上)。用抗HRP(辣根过氧化酶)多克隆抗体(已知具有高抗木糖和抗海藻糖的反应性),比较MGR48转基因植物(对照)、表达未被修饰的人β1,4-半乳糖基转移酶基因的被选择的转基因植物和TmXyl-GalT-12植物的蛋白质提取物中含有的木糖和海藻糖,结果表明木糖和海藻糖减少(附图34“抗辣根”)。采用抗HRP的抗木糖片段和抗海藻糖片段的蛋白质印迹(每种都在适宜的配体上通过亲合层析制备)表明,与对照植物相比,尤其降低了木糖(附图34:“抗-Fuc”和“抗-Xyl”)。
实施例3
TmXyl-GaIT-12植物与来自单一T-DNA整合事件的表达单克隆抗体MGR48的转基因植物(MGR48-31)杂交,首先通过选择不能由卡那霉素抗性标记和抗体产物分离的子代植物来纯合(MGR48-31-4)。用MGR48-31-4的花粉给去雄的TmXyl-GaIT-12植物授粉。相反,用TmXyl-GalT-12植物的花粉给去雄的MGR48-31-4植物授粉。通过蛋白质印迹,分析大量的F1植物是否存在MGR48,并采用RCA通过血凝素印迹分析内源性糖蛋白的半乳糖基化(附图35)。选择一种表达MGR48并具有内源性糖蛋白的半乳糖基化的植物,用于进一步分析。该植物称作为XGM8.
种植TmXyl-GalT-12( )×MGR48-31-4( )的种子,采用先前描述的常规技术,通过蛋白质印迹分析子代植物(XGM)的抗体产量和用生物素标记的RCA120(Vector Labs.,伯林盖姆,加利福尼亚)通过血凝素印迹分析半乳糖基化。所有植物如预期表达单克隆抗体MGR48,并且如RCA120的血凝素印迹所示,大部分植物还具有半乳糖基化的聚糖。个别表达抗体MGR48并具有半乳糖基化的N-聚糖的植物被选择用于进一步分析(XGM8)(TmXyl-GaIT-12×MGR48-31-4子代植物8)。如先前描述,从该植物中纯化到单克隆重组MGR48抗体,用于MALDI-TOF的N-聚糖分析。
简而言之,在最佳条件下,将XGM8植物种植在温室里来生产抗体[Elbers等,植物生理学(Plant Physiology)126:1314(2001)]。进行转基因植物XGM8叶片的蛋白质提取,如所述[Bakker等,美国国家科学院汇编(Proc.Nat.Acad.Sci.USA)98:2899(2001)],用G蛋白层析纯化单克隆抗体。纯化的单克隆抗体的N-聚糖的MALDI-TOF被描述(Elbers等,2001,同上文)。如所述的采用牛睾丸β-半乳糖通过酶测序来确定聚糖上是否存在半乳糖(Bakker等,2001,同上文;表2)。表2(下文)是对TmXyl-GaIT-12植物与生产rec-mAb(MGR48)的植物的F1杂合子的内源性糖蛋白(“Xyl-GaIT Endo”)的N-聚糖和通过蛋白G层析从所述F1杂合子纯化的rec-mAB的N-聚糖的质谱分析(MALDI-TOF)的结构的比较。
表2 | | |
Xyl-GaIT Endo |
Xyl-GaIT IgG |
m/z | |
类型 | | |
| | | | |
933 | |
M3 |
6 |
4 |
1065 | |
XM3 |
2 |
2 |
1079 | |
FM3 |
2 |
3 |
1095 | |
M4 |
5 |
5 |
1136 | |
GNM3 |
1 |
2 |
1211 | |
FXM3 |
6 |
3 |
1241 | |
FM4 |
3 |
2 |
1257 | |
M5 |
17 |
12 |
1268 | |
GNXM3 |
1 |
2 |
1282 | |
GNFM3 |
2 |
3 |
1298 | |
GalGNM3 |
3 |
4 |
1403 | |
FM5 |
4 |
3 |
1414 | |
GNFXM3 |
2 |
4 |
1419 | |
M6 |
5 |
4 |
1430 | |
GNXM4 |
2 |
2 |
1430 | |
GalGNXM3 |
1444 | |
GNFM4 |
1 |
3 |
1444 | |
GalGNFM3 |
1460 | |
GalGNM4 |
8 |
10 |
1460 | |
GNM5 |
1471 | |
GN2XM3 |
1 | |
1485 | |
GN2FM3 |
1 |
1 |
1501 | |
GalGN2M3 |
1 |
1 |
1576 | |
GalGNFXM3 |
2 |
3 |
1576 | |
GNFXM4 |
1581 | |
M7 |
2 |
2 |
1593 | |
GalGNXM4 |
1 |
2 |
1593 | |
GNXM5 |
1606 | |
GNXM5 |
3 |
4 |
1606 | |
GalGNFM4 |
1617 | |
GN2FXM3 |
2 |
1 |
1622 | |
GalGNM5 |
6 |
6 |
1622 | |
GNM6 |
1647 | |
GalGN2FM3 |
1 |
1 |
1663 | |
Gal2GN2M3 |
1 |
1 |
1738 | |
GNFXM5 |
1 |
2 |
1738 | |
GalGNFXM4 |
1743 | |
M8 |
1 |
2 |
1754 | |
GalGNXM5 |
1 |
2 |
1768 | |
GalGNFM5 |
2 |
3 |
1768 | |
GNFM6 |
1784 | |
GNM7 |
1 |
1 |
1784 | |
GalGNM6 |
1809 | |
Gal2GN2FM3 |
2 |
1 |
1900 | |
GNFXM6 |
1 | |
1900 | |
GalGNFXM5 | |
1905 | |
M9 |
1 |
1 |
| | | | |
| |
总计 |
101 |
102 |
这些数据表明:
1.在F1杂合子中,聚糖的木糖基化和海藻糖基化显著下降,内源性糖蛋白的43%聚糖不含木糖和海藻糖,而野生型烟草植物仅为14%。
2.这种F1杂合子的纯化mAb的聚糖的木糖和海藻糖降低了47%,而野生型烟草为14%,见附图36组B-D。
3.F1杂合子的内源性糖蛋白的半乳糖基化从Ga1T植物的9%增加到F1TmXyl-GaIT X MGR48植物的37%。见附图35。
4.从所述F1中纯化的rec-mAb的半乳糖基化升高(见附图36组A);即46%具有半乳糖。见附图36组E。
但是应当指出,所观察到的数量(MALDI-TOF)并不必然地反映体内所述糖型的分子比例。基于MALDI-TOF的量化可能是过低估计或过高估计,取决于所试验的特定糖型。此外,由于Gal和Man之间不存在分子量的差异,一些峰不能被清楚地被标注,除非在半乳糖苷酶处理前后特定分子的相对高度具有显著差别。
实施例4
通过检测来自杂交瘤、转基因烟草和TmXyl-GaIT转基因烟草中的MGR48IgG抗体,可以直接比较木糖、海藻糖和半乳糖的含量。如上所述,TmXyl-GaIT-12植物与表达MGR48IgG的烟草植物(MGR48烟草)杂交,产生具有MGR48 TmXyl-GaIT的F1杂合子。F1植物被选择用于提取和纯化MGR48IgG。采用G蛋白层析(Elbers等,2001.植物生理学(Plant Physiology)126:1314-1322)分离和纯化来自所述植物(烟草和TmXyl-GaIT)的抗体。将300ng的各种杂交瘤MGR48和植物来源的重组MGR48加载到预制的12%SDS-PAGE凝胶上(BioRad),进行电泳。各个泳道的内容物如下:泳道1,杂交瘤MGR48;泳道2,从普通转基因烟草植物中纯化的重组MGR48;泳道3,从TmXyl-GaIT转基因植物中纯化的重组MGR48。在SDS-PAGE之后,用CAPS缓冲液将蛋白质转移到硝化纤维上。斑点与A,抗小鼠IgG;B,多克隆兔抗-HRP(抗木糖/α1,3-海藻糖);C,抗木糖;D,抗(α1,3-)海藻糖抗体;和E,生物素化RCA一起温育。在与HRP标记的绵羊抗小鼠(组A)或山羊抗兔(组B-D)抗体和HRP-标记的链霉抗生物素(E)温育后,在Lumi图像仪中用Lumi光进行检测。
组A表明,在所有泳道中加载了几乎相同含量的MGR48IgG。L是指MGR48IgG轻链,H是指MGR48IgG的重链。组B表示MGR48抗体重链在泳道2(烟草)中如期望的与抗HRP激烈反应,而来自杂交瘤的MGR48的重链(泳道1)不反应(如预期)。来源杂交瘤的抗体不含有木糖和α1,3-海藻糖残基。特别地,来自TmXyl-GaIT烟草植物的MGR48抗体也不反应,表明来自这种植物的抗体的重链的N-聚糖上的木糖和海藻糖的含量显著降低(约90%或更多)。这得到组C(抗木糖)和D(抗海藻糖)表示的试验的证实。组E表明杂交瘤的MGR48抗体的重链(泳道1)具有半乳糖基化的N-聚糖,而烟草来源的MGR48(泳道2)没有,两个结果都是预期的。由于存在表达杂合酶的构建体,来自TmXyl-GalT植物MGR48重链(泳道3)也具有半乳糖基化的N-聚糖。
这些数据与从先前所示采用从类似植物(烟草和TmXyl-GaIT-12植物)提取的总蛋白的类似试验得到的数据一致,说明由TmXyl-GaIT基因的表达而引入烟草的新特性可以被稳定地传递给子代和重组单克隆抗体。
实施例5
用β-半乳糖苷酶处理来进一步表征上述F1杂合子。表3是在用β-半乳糖苷酶处理聚糖前后,用G蛋白层析从TmXyl-GaIT和MGR48植物的F1杂合子纯化的rec-mAbs的N-聚糖的质谱分析(MALDI-TOF)结果的比较。
表3 | | |
Xyl-GaIT IgG- |
Xyl-GaIT IgG+β-半乳糖苷酶 |
m/z | |
类型 |
| | | | |
933 | |
M3 |
4 |
4 |
1065 | |
XM3 |
2 |
2 |
1079 | |
FM3 |
3 |
3 |
1095 | |
M4 |
5 |
4 |
1136 | |
GNM3 |
2 |
3 |
1211 | |
FXM3 |
3 |
4 |
1241 | |
FM4 |
2 |
2 |
1257 | |
M5 |
12 |
13 |
1268 | |
GNXM3 |
2 |
3 |
1282 | |
GNFM3 |
3 |
3 |
1298 | |
GalGNM3 |
4 |
4 |
1403 | |
FM5 |
3 |
2 |
1414 | |
GNFXM3 |
4 |
5 |
1419 | |
M6 |
4 |
3 |
1430 | |
GNXM4 |
2 |
2 |
1430 | |
GalGNXM3 |
1444 | |
GNFM4 |
3 |
3 |
1444 | |
GalGNFM3 |
1460 | |
GalGNM4 |
10 |
14 |
1460 | |
GNM5 | |
1471 | |
GN2XM3 | |
1 |
1485 | |
GN2FM3 |
1 |
1 |
1501 | |
GalGN2M3 |
1 | |
1576 | |
GalGNFXM3 |
3 |
3 |
1576 | |
GNFXM4 |
1581 | |
M7 |
2 |
2 |
1593 | |
GalGNXM3 |
2 |
2 |
1593 | |
GNXM5 |
1606 | |
GNXM5 |
4 |
6 |
1606 | |
GalGNFM4 |
1617 | |
GN2FXM3 |
1 |
1 |
1622 | |
GalGNM5 |
6 |
1 |
1622 | |
GNM6 |
1647 | |
GalGN2FM3 |
1 | |
1663 | |
Gal2GN2M3 |
1 | |
1738 | |
GNFXM5 |
2 |
2 |
1738 | |
GalGNFXM4 |
1743 | |
M8 |
2 |
2 |
1754 | |
GalGNXM5 |
2 |
1 |
1768 | |
GalGNFM5 |
3 |
1 |
1768 | |
GNFM6 |
1784 | |
GNM7 |
1 |
1 |
1784 | |
GalGNM6 |
1809 | |
Gal2GN2FM3 |
1 | |
1900 | |
GNFXM6 | |
1 |
1900 | |
GalGNFXM5 | |
1905 | |
M9 |
1 |
1 |
| | | | |
| |
总计 |
102 |
100 |
这些数据表明:
1.来自F1杂合子的Rec-mAb含有半乳糖,这可以从在β-牛乳糖处理后所观察的特定糖型(含半乳糖)的减少和不含有半乳糖的糖型的增加推导出。观察到m/z 1622从6%降低到1%,同时m/z 1460从10%升高到14%,这是由于从GalGNM5去除半乳糖而加上了GNM5所致。m/z 1768(3%降低到1%)和相应的m/z 1606峰(从4%增加到6%)情况也如此。见附图36组E。
2.类似地,大量的峰是由于牛乳糖处理使含有半乳糖的聚糖减少导致的,特别是m/z 1501,1647和1663,说明存在半乳糖。
实施例6
在另一个实施方案中,昆虫甘露糖苷酶III基因(登录号:AF005034;错误地标注为甘露糖苷酶II基因!)的氨基末端的CTS区用进入内质网的小鼠信号肽编码序列取代(见附图37)。编码完全活性的信号肽的信号肽序列通常存在于IgG序列的氨基末端,先前已经在植物和其他生物体中成功地被使用。而且,编码所谓的内质网滞留序列(KDEL)的人工序列被添加到编码ER滞留的催化片段的基因部分的羧基末端。因此,由该基因序列编码的杂合型甘露糖苷酶III优选沉积在内质网中。
实施例7
在另一个实施方案中,人β-1,4半乳糖基转移酶(GalT)基因(登录号A52551)的氨基末端CTS区用编码进入内质网的小鼠信号肽的编码序列取代(见附图39)。编码完全活性的信号肽的信号肽序列通常存在于IgG序列的氨基末端,已经在植物和其他生物体中成功地被使用。而且,编码所谓内质网滞留序列(KDEL)的合成序列被添加到编码ER滞留的催化片段的基因部分的羧基末端。由该基因序列编码的杂合β-1,4半乳糖基转移酶蛋白将优选地沉积在内质网中。
实施例8
在另一个实施方案中,拟南芥GnTI(登录号:AJ243198)的氨基末端的CTS区用编码进入内质网的小鼠信号肽编码序列取代(见附图41)。编码完全活性的信号肽的信号肽序列通常存在于IgG序列的氨基末端,已经在植物和其他生物体中成功使用。而且,编码所谓内质网滞留序列(KDEL)的人工序列被添加到编码ER滞留的催化片段的基因部分的羧基末端。由该基因序列编码的杂合GnTI蛋白将优选地沉积在内质网中。
实施例9
在另一个实施方案中,拟南芥GnTII(登录号:AJ249274)的氨基末端的CTS区用编码进入内质网的小鼠信号肽编码序列取代(见附图43)。编码完全活性的信号肽的信号肽序列通常存在于IgG序列的氨基末端,已经在植物和其他生物体中成功地使用。而且,编码所谓内质网滞留序列(KDEL)的人工序列被添加到编码ER滞留的催化片段的基因部分的羧基末端。由该基因序列编码的杂合GnTII蛋白将优选地沉积在内质网中。
实施例10
在另一个实施方案中,人β-1,4-半乳糖基转移酶(GalT)基因氨基末端的CTS区用人GnTI(TmhuGnTI-GaIT)的CTS区基因取代(见附图45)。
应当理解,本发明不限于任何特定机制。也不需要理解该机制来成功应用本发明的各种实施方案。但是,一般认为,高尔基体酶是连续分布的(附图47),植物糖基转移酶的跨膜结构域的交换引起重新定位(附图48)。
一般认为,本发明不限于在此描述的特定方法、操作、细胞系、载体和试剂,它们是可改变的。还应当理解,在此所用的术语仅是用于描述特定实施方案的目的,而不是限定本发明的保护范围。应当指出,在此和附加的权利要求中,除非文章中清楚指出,单数形式包括复数形式。除非另外定义,在此所用的所有科技术语具有本发明所属领域的普通技术人员通常理解的相同意义。
由于实施方案是用于阐明本发明的各个方面,在此描述和要求保护的发明不被限定在本文描述的特定实施例中。任何等价的实施方案被认为在本发明的保护范围内。实际上,除了本文给出和描述的内容,本发明的各种改进对于本领域技术人员来说根据先前描述的是显而易见的。这种改进也被认为落入附加权利要求的保护范围中。
本文引用的各种参考文献及其公开的内容全部被引入作为参考。
序列表
<110>国际植物研究所
<120>在植物中优化聚糖生成
<130>62861A-P033486W0
<150>US-60/365,735
<151>2002-03-19
<160>59
<170>PatentIn version 3.2
<210>1
<211>1197
<212>DNA
<213>类人
<400>1
atgaggcttc gggagccgct cctgagcggc agcgccgcga tgccaggcgc gtccctacag 60
cgggcctgcc gcctgctcgt ggccgtctgc gctctgcacc ttggcgtcac cctcgtttac 120
tacctggctg gccgcgacct gagccgcctg ccccaactgg tcggagtctc cacaccgctg 180
cagggcggct cgaacagtgc cgccgccatc gggcagtcct ccggggagct ccggaccgga 240
ggggcccggc cgccgcctcc tctaggcgcc tcctcccagc cgcgcccggg tggcgactcc 300
agcccagtcg tggattctgg ccctggcccc gctagcaact tgacctcggt cccagtgccc 360
cacaccaccg cactgtcgct gcccgcctgc cctgaggagt ccccgctgct tgtgggcccc 420
atgctgattg agtttaacat gcctgtggac ctggagctcg tggcaaagca gaacccaaat 480
gtgaagatgg gcggccgcta tgcccccagg gactgcgtct ctcctcacaa ggtggccatc 540
atcattccat tccgcaaccg gcaggagcac ctcaagtact ggctatatta tttgcaccca 600
gtcctgcagc gccagcagct ggactatggc atctatgtta tcaaccaggc gggagacact 660
atattcaatc gtgctaagct cctcaatgtt ggctttcaag aagccttgaa ggactatgac 720
tacacctgct ttgtgtttag tgacgtggac ctcattccaa tgaatgacca taatgcgtac 780
aggtgttttt cacagccacg gcacatttcc gttgcaatgg ataagtttgg attcagccta 840
ccttatgttc agtattttgg aggtgtctct gctctaagta aacaacagtt tctaaccatc 900
aatggatttc ctaataatta ttggggctgg ggaggagaag atgatgacat ttttaacaga 960
ttagttttta gaggcatgtc tatatctcgc ccaaatgctg tggtcgggag gtgtcgcatg 1020
atccgccact caagagacaa gaaaaatgaa cccaatcctc agaggtttga ccgaattgca 1080
cacacaaagg agacaatgct ctctgatggt ttgaactcac tcacctacca ggtgctggat 1140
gtacagagat acccattgta tacccaaatc acagtggaca tcgggacacc gagctag 1197
<210>2
<211>398
<212>PRT
<213>类人
<400>2
Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ser Ala Ala Met Pro Gly
1 5 10 15
Ala Ser Leu Gln Arg Ala Cys Arg Leu Leu Val Ala Val Cys Ala Leu
20 25 30
His Leu Gly Val Thr Leu Val Tyr Tyr Leu Ala Gly Arg Asp Leu Ser
35 40 45
Arg Leu Pro Gln Leu Val Gly Val Ser Thr Pro Leu Gln Gly Gly Ser
50 55 60
Asn Ser Ala Ala Ala Ile Gly Gln Ser Ser Gly Glu Leu Arg Thr Gly
65 70 75 80
Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg Pro
85 90 95
Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala Ser
100 105 110
Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu Pro
115 120 125
Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile Glu
130 135 140
Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro Asn
145 150 155 160
Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro His
165 170 175
Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu Lys
180 185 190
Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu Asp
195 200 205
Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr Ile Phe Asn Arg
210 215 220
Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp Tyr Asp
225 230 235 240
Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asn Asp
245 250 255
His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser Val Ala
260 265 270
Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln Tyr Phe Gly Gly
275 280 285
Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly Phe Pro
290 295 300
Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn Arg
305 310 315 320
Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Val Val Gly
325 330 335
Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu Pro Asn
340 345 350
Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met Leu Ser
355 360 365
Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln Arg Tyr
370 375 380
Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser
385 390 395
<210>3
<211>1152
<212>DNA
<213>杂合体
<400>3
atgagtaaac ggaatccgaa gattctgaag atttttctgt atatgttact tctcaactct 60
ctctttctca tcatctactt cgtttttcac tcatcgtcgt tttcaccgga gcagtcacag 120
cctcctcata tataccacgt ttcagtgaat aaccaatcgg cgatcgggca gtcctccggg 180
gagctccgga ccggaggggc ccggccgccg cctcctctag gcgcctcctc ccagccgcgc 240
ccgggtggcg actccagccc agtcgtggat tctggccctg gccccgctag caacttgacc 300
tcggtcccag tgccccacac caccgcactg tcgctgcccg cctgccctga ggagtccccg 360
ctgcttgtgg gccccatgct gattgagttt aacatgcctg tggacctgga gctcgtggca 420
aagcagaacc caaatgtgaa gatgggcggc cgctatgccc ccagggactg cgtctctcct 480
cacaaggtgg ccatcatcat tccattccgc aaccggcagg agcacctcaa gtactggcta 540
tattatttgc acccagtcct gcagcgccag cagctggact atggcatcta tgttatcaac 600
caggcgggag acactatatt caatcgtgct aagctcctca atgttggctt tcaagaagcc 660
ttgaaggact atgactacac ctgctttgtg tttagtgacg tggacctcat tccaatgaat 720
gaccataatg cgtacaggtg tttttcacag ccacggcaca tttccgttgc aatggataag 780
tttggattca gcctacctta tgttcagtat tttggaggtg tctctgctct aagtaaacaa 840
cagtttctaa ccatcaatgg atttcctaat aattattggg gctggggagg agaagatgat 900
gacattttta acagattagt ttttagaggc atgtctatat ctcgcccaaa tgctgtggtc 960
gggaggtgtc gcatgatccg ccactcaaga gacaagaaaa atgaacccaa tcctcagagg 1020
tttgaccgaa ttgcacacac aaaggagaca atgctctctg atggtttgaa ctcactcacc 1080
taccaggtgc tggatgtaca gagataccca ttgtataccc aaatcacagt ggacatcggg 1140
acaccgagct ag 1152
<210>4
<211>383
<212>PRT
<213>杂合体
<400>4
Met Ser Lys Arg Asn Pro Lys Ile Leu Lys Ile Phe Leu Tyr Met Leu
1 5 10 15
Leu Leu Asn Ser Leu Phe Leu Ile Ile Tyr Phe Val Phe His Ser Ser
20 25 30
Ser Phe Ser Pro Glu Gln Ser Gln Pro Pro His Ile Tyr His Val Ser
35 40 45
Val Asn Asn G1n Ser Ala Ile Gly Gln Ser Ser Gly Glu Leu Arg Thr
50 55 60
Gly Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg
65 70 75 80
Pro Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala
85 90 95
Ser Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu
100 105 110
Pro Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile
115 120 125
Glu Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro
130 135 140
Asn Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro
145 150 155 160
His Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu
165 170 175
Lys Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu
180 185 190
Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala3Gly Asp Thr Ile Phe Asn
195 200 205
Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp Tyr
210 215 220
Asp Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asn
225 230 235 240
Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser Val
245 250 255
Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val G1n Tyr Phe Gly
260 265 270
Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly Phe
275 280 285
Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn
290 295 300
Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Va1 Val
305 310 315 320
Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu Pro
325 330 335
Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met Leu
340 345 350
Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln Arg
355 360 365
Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser
370 375 380
<210>5
<211>1642
<212>DNA
<213>类人
<400>5
ccatggtgat gagacgctac aagctctttc tcatgttctg tatggccggc ctgtgcctca 60
tctccttcct gcacttcttc aagaccctgt cctatgtcac cttcccccga gaactggcct 120
ccctcagccc taacctggtg tccagctttt tctggaacaa tgccccggtc acgccccagg 180
ccagccccga gccaggaggc cctgacctgc tgcgtacccc actctactcc cactcgcccc 240
tgctgcagcc gctgccgccc agcaaggcgg ccgaggagct ccaccgggtg gacttggtgc 300
tgcccgagga caccaccgag tatttcgtgc gcaccaaggc cggcggcgtc tgcttcaaac 360
ccggcaccaa gatgctggag aggccgcccc cgggacggcc ggaggagaag cctgaggggg 420
ccaacggctc ctcggcccgg cggccacccc ggtacctcct gagcgcccgg gagcgcacgg 480
ggggccgagg cgcccggcgc aagtgggtgg agtgcgtgtg cctgcccggc tggcacggac 540
ccagctgcgg cgtgcccact gtggtgcagt actccaacct gcccaccaag gagcggctgg 600
tgcccaggga ggtgccgcgc cgcgtcatca acgccatcaa cgtcaaccac gagttcgacc 660
tgctggacgt gcgcttccac gagctgggcg acgtggtgga cgcctttgtg gtgtgcgagt 720
ccaacttcac ggcttatggg gagccgcggc cgctcaagtt ccgggagatg ctgaccaatg 780
gcaccttcga gtacatccgc cacaaggtgc tctatgtctt cctggaccac ttcccgcccg 840
gcggccggca ggacggctgg atcgccgacg actacctgcg caccttcctc acccaggacg 900
gcgtctcgcg gctgcgcaac ctgcggcccg acgacgtctt catcattgac gatgcggacg 960
agatcccggc ccgtgacggc gtccttttcc tcaagctcta cgatggctgg accgagccct 1020
tcgccttcca catgcgcaag tcgctctacg gcttcttctg gaagcagccg ggcaccctgg 1080
aggtggtgtc aggctgcacg gtggacatgc tgcaggcagt gtatgggctg gacggcatcc 1140
gcctgcgccg ccgccagtac tacaccatgc ccaacttcag acagtatgag aaccgcaccg 1200
gccacatcct ggtgcagtgg tcgctgggca gccccctgca cttcgccggc tggcactgct 1260
cctggtgctt cacgcccgag ggcatctact tcaagctcgt gtccgcccag aatggcgact 1320
tcccacgctg gggtgactac gaggacaagc gggacctgaa ctacatccgc ggcctgatcc 1380
gcaccggggg ctggttcgac ggcacgcagc aggagtaccc gcctgcagac cccagcgagc 1440
acatgtatgc gcccaagtac ctgctgaaga actacgaccg gttccactac ctgctggaca 1500
acccctacca ggagcccagg agcacggcgg cgggcgggtg gcgccacagg ggtcccgagg 1560
gaaggccgcc cgcccggggc aaactggacg aggcggaagt cgaacaaaaa ctcatctcag 1620
aagaggatct gaattaggat cc 1642
<210>6
<211>544
<212>PRT
<213>类人
<400>6
Met Val Met Arg Arg Tyr Lys Leu Phe Leu Met Phe Cys Met Ala Gly
1 5 10 15
Leu Cys Leu Ile Ser Phe Leu His Phe Phe Lys Thr Leu Ser Tyr Val
20 25 30
Thr Phe Pro Arg Glu Leu Ala Ser Leu Ser Pro Asn Leu Val Ser Ser
35 40 45
Phe Phe Trp Asn Asn Ala Pro Val Thr Pro Gln Ala Ser Pro Glu Pro
50 55 60
Gly Gly Pro Asp Leu Leu Arg Thr Pro Leu Tyr Ser His Ser Pro Leu
65 70 75 80
Leu Gln Pro Leu Pro Pro Ser Lys A1a Ala Glu Glu Leu His Arg Val
85 90 95
Asp Leu Val Leu Pro Glu Asp Thr Thr Glu Tyr Phe Val Arg Thr Lys
100 105 110
Ala Gly Gly Val Cys Phe Lys Pro Gly Thr Lys Met Leu Glu Arg Pro
115 120 125
Pro Pro Gly Arg Pro Glu Glu Lys Pro Glu Gly Ala Asn Gly Ser Ser
130 135 140
Ala Arg Arg Pro Pro Arg Tyr Leu Leu Ser Ala Arg Glu Arg Thr Gly
145 150 155 160
Gly Arg Gly Ala Arg Arg Lys Trp Val Glu Cys Val Cys Leu Pro Gly
165 170 175
Trp His Gly Pro Ser Cys Gly Val Pro Thr Val Val Gln Tyr Ser Asn
180 185 190
Leu Pro Thr Lys Glu Arg Leu Val Pro Arg Glu Val Pro Arg Arg Val
195 200 205
Ile Asn Ala Ile Asn Val Asn His Glu Phe Asp Leu Leu Asp Val Arg
210 215 220
Phe His Glu Leu Gly Asp Val Val Asp Ala Phe Val Val Cys Glu Ser
225 230 235 240
Asn Phe Thr Ala Tyr Gly Glu Pro Arg Pro Leu Lys Phe Arg Glu Met
245 250 255
Leu Thr Asn Gly Thr Phe Glu Tyr Ile Arg His Lys Val Leu Tyr Val
260 265 270
Phe Leu Asp His Phe Pro Pro Gly Gly Arg Gln Asp Gly Trp Ile Ala
275 280 285
Asp Asp Tyr Leu Arg Thr Phe Leu Thr Gln Asp Gly Val Ser Arg Leu
290 295 300
Arg Asn Leu Arg Pro Asp Asp Val Phe Ile Ile5Asp Asp Ala Asp Glu
305 310 315 320
Ile Pro Ala Arg Asp Gly Val Leu Phe Leu Lys Leu Tyr Asp Gly Trp
325 330 335
Thr Glu Pro Phe Ala Phe His Met Arg Lys Ser Leu Tyr Gly Phe Phe
340 345 350
Trp Lys Gln Pro Gly Thr Leu Glu Val Val Ser Gly Cys Thr Val Asp
355 360 365
Met Leu Gln Ala Val Tyr Gly Leu Asp Gly Ile Arg Leu Arg Arg Arg
370 375 380
Gln Tyr Tyr Thr Met Pro Asn Phe Arg Gln Tyr Glu Asn Arg Thr Gly
385 390 395 400
His Ile Leu Val Gln Trp Ser Leu Gly Ser Pro Leu His Phe Ala Gly
405 410 415
Trp His Cys Ser Trp Cys Phe Thr Pro Glu Gly Ile Tyr Phe Lys Leu
420 425 430
Val Ser Ala Gln Asn Gly Asp Phe Pro Arg Trp Gly Asp Tyr Glu Asp
435 440 445
Lys Arg Asp Leu Asn Tyr Ile Arg Gly Leu Ile Arg Thr Gly Gly Trp
450 455 460
Phe Asp Gly Thr Gln Gln Glu Tyr Pro Pro Ala Asp Pro Ser Glu His
465 470 475 480
Met Tyr Ala Pro Lys Tyr Leu Leu Lys Asn Tyr Asp Arg Phe His Tyr
485 490 495
Leu Leu Asp Asn Pro Tyr Gln Glu Pro Arg Ser Thr Ala Ala Gly Gly
500 505 510
Trp Arg His Arg Gly Pro Glu Gly Arg Pro Pro Ala Arg Gly Lys Leu
515 520 525
Asp Glu Ala Glu Val Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn
530 535 540
<210>7
<211>10
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>7
Glu Gln Lys Leu IIe Ser Glu Glu Asp Leu
1 5 10
<210>8
<211>31
<212>PRT
<213>类人
<400>8
Gln Glu Pro Arg Ser Thr Ala Ala Gly Gly Trp Arg His Arg Gly Pro
1 5 10 l5
Glu Gly Arg Pro Pro Ala Arg Gly Lys Leu Asp Glu Ala Glu Val
20 25 30
<210>9
<211>1614
<212>DNA
<213>杂合体
<400>9
catgagtaaa cggaatccga agattctgaa gatttttctg tatatgttac ttctcaactc 60
tctctttctc atcatctact tcgtttttca ctcatcgtcg ttttcaccgg agcagtcaca 120
gcctcctcat atataccacg tttcagtgaa taaccaatcg gcacatggag gccctgacct 180
gctgcgtacc ccactctact cccactcgcc cctgctgcag ccgctgccgc ccagcaaggc 240
ggccgaggag ctccaccggg tggacttggt gctgcccgag gacaccaccg agtatttcgt 300
gcgcaccaag gccggcggcg tctgcttcaa acccggcacc aagatgctgg agaggccgcc 360
cccgggacgg ccggaggaga agcctgaggg ggccaacggc tcctcggccc ggcggccacc 420
ccggtacctc ctgagcgccc gggagcgcac ggggggccga ggcgcccggc gcaagtgggt 480
ggagtgcgtg tgcctgcccg gctggcacgg acccagctgc ggcgtgccca ctgtggtgca 540
gtactccaac ctgcccacca aggagcggct ggtgcccagg gaggtgccgc gccgcgtcat 600
caacgccatc aacgtcaacc acgagttcga cctgctggac gtgcgcttcc acgagctggg 660
cgacgtggtg gacgcctttg tggtgtgcga gtccaacttc acggcttatg gggagccgcg 720
gccgctcaag ttccgggaga tgctgaccaa tggcaccttc gagtacatcc gccacaaggt 780
gctctatgtc ttcctggacc acttcccgcc cggcggccgg caggacggct ggatcgccga 840
cgactacctg cgcaccttcc tcacccagga cggcgtctcg cggctgcgca acctgcggcc 900
cgacgacgtc ttcatcattg acgatgcgga cgagatcccg gcccgtgacg gcgtcctttt 960
cctcaagctc tacgatggct ggaccgagcc cttcgccttc cacatgcgca agtcgctcta 1020
cggcttcttc tggaagcagc cgggcaccct ggaggtggtg tcaggctgca cggtggacat 1080
gctgcaggca gtgtatgggc tggacggcat ccgcctgcgc cgccgccagt actacaccat 1140
gcccaacttc agacagtatg agaaccgcac cggccacatc ctggtgcagt ggtcgctggg 1200
cagccccctg cacttcgccg gctggcactg ctcctggtgc ttcacgcccg agggcatcta 1260
cttcaagctc gtgtccgccc agaatggcga cttcccacgc tggggtgact acgaggacaa 1320
gcgggacctg aactacatcc gcggcctgat ccgcaccggg ggctggttcg acggcacgca 1380
gcaggagtac ccgcctgcag accccagcga gcacatgtat gcgcccaagt acctgctgaa 1440
gaactacgac cggttccact acctgctgga caacccctac caggagccca ggagcacggc 1500
ggcgggcggg tggcgccaca ggggtcccga gggaaggccg cccgcccggg gcaaactgga 1560
cgaggcggaa gtcgaacaaa aactcatctc agaagaggat ctgaattagg atcc 1614
<210>10
<211>535
<212>PRT
<213>杂合体
<400>10
Met Ser Lys Arg Asn Pro Lys Ile Leu Lys Ile Phe Leu Tyr Met Leu
1 5 10 15
Leu Leu Asn Ser Leu Phe Leu Ile Ile Tyr Phe Val Phe His Ser Ser
20 25 30
Ser Phe Ser Pro Glu Gln Ser Gln Pro Pro His Ile Tyr His Val Ser
35 40 45
Val Asn Asn Gln Ser Ala His Gly Gly Pro Asp Leu Leu Arg Thr Pro
50 55 60
Leu Tyr Ser His Ser Pro Leu Leu Gln Pro Leu Pro Pro Ser Lys Ala
65 7O 75 80
Ala Glu Glu Leu His Arg Val Asp Leu Val Leu Pro Glu Asp Thr Thr
85 90 95
Glu Tyr Phe Val Arg Thr Lys Ala Gly Gly Val Cys Phe Lys Pro Gly
100 105 110
Thr Lys Met Leu Glu Arg Pro Pro Pro Gly Arg Pro Glu Glu Lys Pro
115 120 125
Glu Gly Ala Asn Gly Ser Ser Ala Arg Arg Pro Pro Arg Tyr Leu Leu
130 135 140
Ser Ala Arg Glu Arg Thr Gly Gly Arg Gly Ala Arg Arg Lys Trp Val
145 150 155 160
Glu Cys Val Cys Leu Pro Gly Trp His Gly Pro Ser Cys Gly Val Pro
165 170 175
Thr Val Val Gln Tyr Ser Asn Leu Pro Thr Lys Glu Arg Leu Val Pro
180 185 190
Arg Glu Val Pro Arg Arg Val Ile Asn Ala Ile Asn Val Asn His Glu
195 200 205
Phe Asp Leu Leu Asp Val Arg Phe His Glu Leu Gly Asp Val Val Asp
210 215 220
Ala Phe Val Val Cys Glu Ser Asn Phe Thr Ala Tyr Gly Glu Pro Arg
225 230 235 240
Pro Leu Lys Phe Arg Glu Met Leu Thr Asn Gly Thr Phe Glu Tyr Ile
245 250 255
Arg His Lys Val Leu Tyr Val Phe Leu Asp His Phe Pro Pro Gly Gly
260 265 270
Arg Gln Asp Gly Trp Ile Ala Asp Asp Tyr Leu Arg Thr Phe Leu Thr
275 280 285
Gln Asp Gly Val Ser Arg Leu Arg Asn Leu Arg Pro Asp Asp Val Phe
290 295 300
Ile Ile Asp Asp Ala Asp Glu Ile Pro Ala Arg Asp Gly Val Leu Phe
305 310 315 320
Leu Lys Leu Tyr Asp Gly Trp Thr Glu Pro Phe Ala Phe His Met Arg
325 330 335
Lys Ser Leu Tyr Gly Phe Phe Trp Lys Gln Pro Gly Thr Leu Glu Val
340 345 350
Val Ser Gly Cys Thr Val Asp Met Leu Gln Ala Val Tyr Gly Leu Asp
355 360 365
Gly Ile Arg Leu Arg Arg Arg Gln Tyr Tyr Thr Met Pro Asn Phe Arg
370 375 380
Gln Tyr Glu Asn Arg Thr Gly His Ile Leu Val Gln Trp Ser Leu Gly
385 390 395 400
Ser Pro Leu His Phe Ala Gly Trp His Cys Ser Trp Cys Phe Thr Pro
405 410 415
Glu Gly Ile Tyr Phe Lys Leu Val Ser Ala Gln Asn Gly Asp Phe Pro
420 425 430
Arg Trp Gly Asp Tyr Glu Asp Lys Arg Asp Leu Asn Tyr Ile Arg Gly
435 440 445
Leu Ile Arg Thr Gly Gly Trp Phe Asp Gly Thr Gln Gln Glu Tyr Pro
450 455 460
Pro Ala Asp Pro Ser Glu His Met Tyr Ala Pro Lys Tyr Leu Leu Lys
465 470 475 480
Asn Tyr Asp Arg Phe His Tyr Leu Leu Asp Asn Pro Tyr Gln Glu Pro
485 490 495
Arg Ser Thr Ala Ala Gly Gly Trp Arg His Arg Gly Pro Glu Gly Arg
500 505 510
Pro Pro Ala Arg Gly Lys Leu Asp Glu Ala Glu Val Glu Gln Lys Leu
515 520 525
Ile Ser Glu Glu Asp Leu Asn
530 535
<210>11
<211>13
<212>DNA
<213>人工序列
<220>合成的
<223>
<400>11
aatacttcca ccc 13
<210>12
<211>34
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>12
ccacccgtta acaatgaagatgagacgcta caag 34
<210>13
<211>29
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>13
gggccatgga gatgagacgc tacaagctc 29
<210>14
<211>28
<212>DNA
<213>人工序列
<220>合成的
<223>
<400>14
ggatccaatg aagatgagac gctacaag 28
<210>15
<211>41
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>15
gggcccggga gatcctaatt cagatcctct tctgagatga g 41
<210>16
<211>35
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>16
cccggatcct aattcagatc ctcttctgag atgag 35
<210>17
<211>38
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>17
gggtctagat cctaattcag atcctcttct gagatgag 38
<210>18
<211>35
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>18
ccacccgtta acaatgagta aacggaatcc gaaga 35
<210>19
<211>35
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>19
gggccatggg taaacggaat ccgaagattc tgaag 35
<210>20
<211>34
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>20
cccggatcca tgagtaaacg gaatccgaag attc 34
<210>21
<211>29
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>21
gcgccccggg acgctagctc ggtgtcccg 29
<210>22
<211>25
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>22
cccggatcca cgctagctcg gtgtc 25
<210>23
<211>31
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>23
gggtctagat ccacgctagc tcggtgtccc g 31
<210>24
<211>39
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>24
ccacccgtta acaatgaggc ttcgggagcc gctcctgag 39
<210>25
<211>31
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>25
gggccatggg gcttcgggag ccgctcctga g 31
<210>26
<211>35
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>26
cccggatcca tgaggcttcg ggagccgctc ctgagll 35
<210>27
<211>7155
<212>DNA
<213>杂合体
<400>27
ggcgcgcctc gaggcgatcg cagatctaat ctaaccaatt acgatacgct ttgggtacac 60
ttgatttttg tttcagtggt tacatatatc ttgttttata tgctatcttt aaggatctgc 120
acaaagatta tttgttgatg ttcttgatgg ggctcagaag atttgatatg atacactcta 180
atctttagga gataccagcc aggattatat tcagtaagac aatcaaattt tacgtgttca 240
aactcgttat cttttcattc aaaggatgag ccagaatctt tatagaatga ttgcaatcga 300
gaatatgttc ggccgatatg cctttgttgg cttcaatatt ctacatatca cacaagaatc 360
gaccgtattg taccctcttt ccataaagga aaacacaata tgcagatgct tttttcccac 420
atgcagtaac atataggtat tcaaaaatgg ctaaaagaag ttggataaca aattgacaac 480
tatttccatt tctgttatat aaatttcaca acacacaaaa gcccgtaatc aagagtctgc 540
ccatgtacga aataacttct attatttggt attgggccta agcccagctc agagtacgtg 600
ggggtaccac atataggaag gtaacaaaat actgcaagat agccccataa cgtaccagcc 660
tctccttacc acgaagagat aagatataag acccaccctg ccacgtgtca catcgtcatg 720
gtggttaatg ataagggatt acatccttct atgtttgtgg acatgatgca tgtaatgtca 780
tgagccacag gatccaatgg ccacaggaac gtaagaatgt agatagattt gattttgtcc 840
gttagatagc aaacaacatt ataaaaggtg tgtatcaata ggaactaatt cactcattgg 900
attcatagaa gtccattcct cctaagtatc tagaaaccat ggcgaggatc tcgtgtgact 960
tgagatttct tctcatcccg gcagctttca tgttcatcta catccagatg aggcttttcc 1020
agacgcaatc acagtatgca gatcgcctca gttccgctat cgaatctgag aaccattgca 1080
ctagtcaaat gcgaggcctc atagatgaag ttagcatcaa acagtcgcgg attgttgccc 1140
tcgaagatat gaagaaccgc caggacgaag aacttgtgca gcttaaggat ctaatccaga 1200
cgtttgaaaa aaaaggaata gcaaaactca ctcaaggtgg agccatggat tccaattcag 1260
gcgccgtcgt tgatatcaca actaaagatc tatacgatag gattgagttt cttgatacag 1320
atggtggtcc atggaaacaa ggttggagag ttacgtataa agacgatgag tgggagaaag 1380
agaagctcaa aatcttcgtt gttcctcatt ctcataacga tcctggttgg aaattgactg 1440
tagaggagta ttatcagaga caatccagac atattcttga caccattgtt gagactttat 1500
ctaaggtatg acgaaagttt ttgcttttgg ttttaatatt ttaattctct cccatggtta l560
tcccgtgaac aatcttaaat gtcttaaaat tctcatgacg tcattaaact ctataaccaa 1620
acttctttgc tgggttctgt ttttttttag tttcgtgatg aaacagagtt ctagaagttc 1680
gttcttttgg aaaatttgaa gtctttggag ctaaagtttg tttttttatt actgggtttt 1740
gagattgaag gatagctaga atcttatttg tgtgggggtt tgttttgaat atgtttaata 1800
ggattcaaga agaaagttta tatgggagga gatgtcatat ctggagagat ggtggagaga 1860
cgcttcacct aataaacaag aagctttgac taaattggtt aaggatgggc agctagagat 1920
tgttggaggt ggctgggtta tgaatgatga ggctaattca cattattttg ccataattga 1980
acagatagca gagggtaata tgtggctgaa tgacacaatt ggggttattc ctaagaattc 2040
ttgggctata gatccctttg gctattcatc aaccatggct tatcttctcc ggcgtatggg 2100
ttttgaaaac atgcttattc aaaggactca ttacgagctc aagaaagacc ttgcccagca 2160
taagaatctt gaatatattt ggcgtcagag ctgggatgct atggaaacca cagatatctt 2220
tgttcatatg atgccgtttt attcatacga tatcccacac acttgtggac cagagcctgc 2280
aatttgctgt cagtttgatt tcgctcggat gcggggattt aagtatgaac tttgtccatg 2340
gggaaagcac ccagtggaga ccacactaga aaatgtgcag gagagggcat taaagcttct 2400
ggatcaatac aggaaaaaat ccactctata tcgaactaat acacttctta tacctcttgg 2460
agatgatttt aggtacatta gtatcgatga agccgaggct cagttccgta actaccagat 2520
gttgtttgat cacatcaact ctaatcctag tctaaacgca gaagcaaagt ttggtacttt 2580
ggaggattat ttcagaacag tccgagaaga agcagacaga gtgaattatt ctcgtcctgg 2640
tgaggttggc tctggtcagg ttgttggttt cccttctctg tcaggtgact tctttacata 2700
tgcagatagg caacaagact attggagtgg ttattatgtt tcaagacctt tcttcaaagc 2760
tgttgatcgt gtgctcgagc atacccttcg tggagctgag atcatgatgt catttctgct 2820
aggttattgc catcgaattc aatgtgagaa atttccaaca agttttacgt ataagttgac 2880
tgctgcaaga agaaatctgg ctcttttcca gcaccatgat ggggtaactg gaactgctaa 2940
ggattatgtg gtacaagatt acggcacccg gatgcatact tcattgcaag accttcagat 3000
ctttatgtct aaagcaatcg aagttcttct tgggatccgc cacgagaaag aaaaatctga 3060
tcaatcccca tcatttttcg aggcagagca aatgagatca aagtatgatg ctcggccagt 3120
tcacaagcca attgctgccc gggaaggaaa ttcgcacaca gttatactct tcaatccatc 3180
agaacagacg agagaggagg tggtgacggt tgttgttaac cgcgctgaaa tctcggtttt 3240
ggactcaaac tggacttgtg tccctagcca aatttctcct gaagtgcagc atgacgatac 3300
caaactattc accggcagac atcgccttta ctggaaagct tccatcccag ctcttggtct 3360
gagaacatat ttcattgcta atgggaatgt cgagtgtgag aaagctactc cgtctaaact 3420
caaatacgct tctgagtttg acccatttcc ttgtcctcct ccatattcct gctccaaact 3480
ggacaacgac gttactgaga tccgaaatga acatcagact cttgtgtttg atgtgaagaa 3540
cggatcactg cggaagatag tccatagaaa cggatcagag actgttgtgg gagaagagat 3600
aggtatgtac tctagtccag agagtggagc ttacctgttc aaaccagatg gtgaagctca 3660
gccaattgtt caacctgatg gacatgtagt cacctctgag ggtctgctgg ttcaagaagt 3720
cttctcttac cctaaaacca aatgggagaa atcacccctc tctcagaaaa ctcgtcttta 3780
cactggaggt aatacgcttc aggatcaagt ggtcgagata gaatatcatg ttgagcttct 3840
tggtaatgat tttgatgacc gggaattgat tgtccggtac aagactgatg ttgacaacaa 3900
gaaggtcttc tattcagatc tcaatggttt ccaaatgagc aggagagaaa cttatgataa 3960
gatccctctt caaggaaact actacccaat gccatctctc gcatttatcc aaggatccaa 4020
tggtcagaga ttctccgtgc actctcgtca atctctcggt gttgcaagcc tcaaagaggg 4080
ttggttggag attatgctgg acagacggtt ggttcgtgat gacggacggg gtctagggca 4140
aggtgtgatg gataaccgcg caatgaccgt ggtatttcac cttcttgcgg aatctaacat 4200
ttctcaagca gaccctgctt ccaacactaa cccgaggaac ccttcgcttc tctctcacct 4260
cataggtgct cacttaaact accccataaa cacattcatt gccaagaaac cgcaagacat 4320
atctgtgcgt gttccacaat acggttcctt tgctccttta gccaaaccgt taccatgtga 4380
cctccacatt gtaaatttca aggttcctcg tccatccaaa tactctcagc aattggaaga 4440
agacaagcca aggttcgctc ttatcctcaa tagacgagct tgggattcag cttattgcca 4500
taaaggaaga caagtaaact gcacaagcat ggctaatgaa ccagtaaact tttccgacat 4560
gttcaaagat cttgcagctt caaaggtaaa accaacttca ctgaatctct tgcaagaaga 4620
tatggagatt cttgggtacg atgaccaaga gctacctcga gatagttcac agccacggga 4680
aggacgtgtc tcgatctctc ccatggaaat acgagcttat aagcttgaac tgcgacctca 4740
caagtgaacc tgctgaagat ccgctagagt ccgcaaaaat caccagtctc tctctacaaa 4800
tctatctctc tctatttttc tccagaataa tgtgtgagta gttcccagat aagggaatta 4860
gggttcttat agggtttcgc tcatgtgttg agcatataag aaacccttag tatgtatttg 4920
tatttgtaaa atacttctat caataaaatt tctaatccta aaaccaaaat cccgcgcgcg 4980
cctcgaggcg atcgcagatc tcattatacc gttagaagca tagttaaaat ctaaagcttg 5040
tcgttaattc tagtcatttt acattgttgg gttctacatt attaatgaat tttctaatgc 5100
aaatacagaa tttaaatcaa aattgttgaa ttatgctaaa catgtaacat acgtatatct 5160
ccgccttgtg tgttgtatta acttgaagtt atcataagaa ccacaaatac actagtaaat 5220
ctatgagaag gcaggtggca acacaaacaa gagtatctaa gattttcatt tgtgactata 5280
ggaatataat atctcttatc tgatttaatg aatccacatg ttcacttctc atttgtccac 5340
aagatcacaa ctttatcttc aatattcaca acttgttata tccaccacaa tttcattctt 5400
ttcacttagc cccacaaaat actttgtccc cttatttgcc accttttgta tttaatttat 5460
tcttgtggag ctaagtgttc atattattct tcttctcaaa aaaacaaaaa caaaaaaaaa 5520
gagaagaaaa ccatggcgag gatctcgtgt gacttgagat ttcttctcat cccggcagct 5580
ttcatgttca tctacatcca gatgaggctt ttccagacgc aatcacagta tgcagatcgc 5640
ctcagttccg ctatcgaatc tgagaaccat tgcactagtc aaatgcgagg cctcatagat 5700
gaagttagca tcaaacagtc gcggattgtt gccctcgaag atatgaagaa ccgccaggac 5760
gaagaacttg tgcagcttaa ggatctaatc cagacgtttg aaaaaaaagg aatagcaaaa 5820
ctcactcaag gtggagccat ggctctaagg ttgcatagaa ggaaccattt ttcgcctaga 5880
aatacggatc tgttcccgga tttggcaaaa gatcgtgtgg ttatcgtctt gtatgtgcat 5940
aatcgggctc agtattttcg agtcacagtg gaaagtttgt cgaaggttaa aggtataagt 6000
gagacattgt tgattgttag tcatgatggt tactttgaag agatgaatag gattgtggag 6060
agtattaagt tttgtcaagt gaaacagatt ttctcgcctt attcgcctca tatatatcgt 6120
actagcttcc cgggtgtgac cctgaatgat tgtaagaaca agggtgatga ggcaaagggg 6180
cattgtgaag gtaatcctga tcagtatggg aatcatcggt ctccgaagat tgtatctttg 6240
aagcatcact ggtggtggat gatgaacact gtatgggatg ggttggaaga gactaaagga 6300
catgaggggc atatcctttt cattgaagaa gatcattttc tgtttcctaa tgcctatcgt 6360
aacatacaga ctcttacgag gctgaaaccc gcaaagtgtc ctgactgttt tgctgctaat 6420
ttagcaccgt ctgatgtgaa gtcaagagga gaagggcttg aaagtttggt tgcagagaga 6480
atgggaaatg ttgggtattc ttttaataga agtgtgtggg agaatattca tcagaaggca 6540
agagagtttt gtttctttga tgattacaac tgggatataa cgatgtgggc aacggttttc 6600
ccgtcgtttg gttccccggt gtacacattg cgagggccta ggactagtgc ggtacacttt 6660
ggaaaatgtg ggttgcatca aggtagagga gatgagggtg attgcatcga taatggggtc 6720
gtaaacatag aagttaagga aacagataaa gttgtgaaca taaaagaagg atggggagtt 6780
cgggtgtata agcatcaagc gggttataaa gccggtttcg aaggttgggg aggttggggc 6840
gatgataggg accgacattt atgtttggat tttgccacta tgtatcgtta cagcagtagc 6900
agtgcatctc catgaaacgg atccgctaga gtccgcaaaa atcaccagtc tctctctaca 6960
aatctatctc tctctatttt tctccagaat aatgtgtgag tagttcccag ataagggaat 7020
tagggttctt atagggtttc gctcatgtgt tgagcatata agaaaccctt agtatgtatt 7080
tgtatttgta aaatacttct atcaataaaa tttctaatcc taaaaccaaa atcccgcgag 7140
agacctctta attaa 7155
<210>28
<211>4993
<212>DNA
<213>杂合体
<400>28
ggcgcgcctc gaggcgatcg cagatctaat ctaaccaatt acgatacgct ttgggtacac 60
ttgatttttg tttcagtggt tacatatatc ttgttttata tgctatcttt aaggatctgc 120
acaaagatta tttgttgatg ttcttgatgg ggctcagaag atttgatatg atacactcta 180
atctttagga gataccagcc aggattatat tcagtaagac aatcaaattt tacgtgttca 240
aactcgttat cttttcattc aaaggatgag ccagaatctt tatagaatga ttgcaatcga 300
gaatatgttc ggccgatatg cctttgttgg cttcaatatt ctacatatca cacaagaatc 360
gaccgtattg taccctcttt ccataaagga aaacacaata tgcagatgct tttttcccac 420
atgcagtaac atataggtat tcaaaaatgg ctaaaagaag ttggataaca aattgacaac 480
tatttccatt tctgttatat aaatttcaca acacacaaaa gcccgtaatc aagagtctgc 540
ccatgtacga aataacttct attatttggt attgggccta agcccagctc agagtacgtg 600
ggggtaccac atataggaag gtaacaaaat actgcaagat agccccataa cgtaccagcc 660
tctccttacc acgaagagat aagatataag acccaccctg ccacgtgtca catcgtcatg 720
gtggttaatg ataagggatt acatccttct atgtttgtgg acatgatgca tgtaatgtca 780
tgagccacag gatccaatgg ccacaggaac gtaagaatgt agatagattt gattttgtcc 840
gttagatagc aaacaacatt ataaaaggtg tgtatcaata ggaactaatt cactcattgg 900
attcatagaa gtccattcct cctaagtatc tagaaaccat ggcgaggatc tcgtgtgact 960
tgagatttct tctcatcccg gcagctttca tgttcatcta catccagatg aggcttttcc 1020
agacgcaatc acagtatgca gatcgcctca gttccgctat cgaatctgag aaccattgca 1080
ctagtcaaat gcgaggcctc atagatgaag ttagcatcaa acagtcgcgg attgttgccc 1140
tcgaagatat gaagaaccgc caggacgaag aacttgtgca gcttaaggat ctaatccaga 1200
cgtttgaaaa aaaaggaata gcaaaactca ctcaaggtgg agccatggat tccaattcag 1260
gcgccgtcgt tgatatcaca actaaagatc tatacgatag gattgagttt cttgatacag 1320
atggtggtcc atggaaacaa ggttggagag ttacgtataa agacgatgag tgggagaaag 1380
agaagctcaa aatcttcgtt gttcctcatt ctcataacga tcctggttgg aaattgactg 1440
tagaggagta ttatcagaga caatccagac atattcttga caccattgtt gagactttat 1500
ctaaggtatg acgaaagttt ttgcttttgg ttttaatatt ttaattctct cccatggtta 1560
tcccgtgaac aatcttaaat gtcttaaaat tctcatgacg tcattaaact ctataaccaa 1620
acttctttgc tgggttctgt ttttttttag tttcgtgatg aaacagagtt ctagaagttc 1680
gttcttttgg aaaatttgaa gtctttggag ctaaagtttg tttttttatt actgggtttt 1740
gagattgaag gatagctaga atcttatttg tgtgggggtt tgttttgaat atgtttaata 1800
ggattcaaga agaaagttta tatgggagga gatgtcatat ctggagagat ggtggagaga 1860
cgcttcacct aataaacaag aagctttgac taaattggtt aaggatgggc agctagagat 1920
tgttggaggt ggctgggtta tgaatgatga ggctaattca cattattttg ccataattga 1980
acagatagca gagggtaata tgtggctgaa tgacacaatt ggggttattc ctaagaattc 2040
ttgggctata gatccctttg gctattcatc aaccatggct tatcttctcc ggcgtatggg 2100
ttttgaaaac atgcttattc aaaggactca ttacgagctc aagaaagacc ttgcccagca 2160
taagaatctt gaatatattt ggcgtcagag ctgggatgct atggaaacca cagatatctt 2220
tgttcatatg atgccgtttt attcatacga tatcccacac acttgtggac cagagcctgc 2280
aatttgctgt cagtttgatt tcgctcggat gcggggattt aagtatgaac tttgtccatg 2340
gggaaagcac ccagtggaga ccacactaga aaatgtgcag gagagggcat taaagcttct 2400
ggatcaatac aggaaaaaat ccactctata tcgaactaat acacttctta tacctcttgg 2460
agatgatttt aggtacatta gtatcgatga agccgaggct cagttccgta actaccagat 2520
gttgtttgat cacatcaact ctaatcctag tctaaacgca gaagcaaagt ttggtacttt 2580
ggaggattat ttcagaacag tccgagaaga agcagacaga gtgaattatt ctcgtcctgg 2640
tgaggttggc tctggtcagg ttgttggttt cccttctctg tcaggtgact tctttacata 2700
tgcagatagg caacaagact attggagtgg ttattatgtt tcaagacctt tcttcaaagc 2760
tgttgatcgt gtgctcgagc atacccttcg tggagctgag atcatgatgt catttctgct 2820
aggttattgc catcgaattc aatgtgagaa atttccaaca agttttacgt ataagttgac 2880
tgctgcaaga agaaatctgg ctcttttcca gcaccatgat ggggtaactg gaactgctaa 2940
ggattatgtg gtacaagatt acggcacccg gatgcatact tcattgcaag accttcagat 3000
ctttatgtct aaagcaatcg aagttcttct tgggatccgc cacgagaaag aaaaatctga 3060
tcaatcccca tcatttttcg aggcagagca aatgagatca aagtatgatg ctcggccagt 3120
tcacaagcca attgctgccc gggaaggaaa ttcgcacaca gttatactct tcaatccatc 3180
agaacagacg agagaggagg tggtgacggt tgttgttaac cgcgctgaaa tctcggtttt 3240
ggactcaaac tggacttgtg tccctagcca aatttctcct gaagtgcagc atgacgatac 3300
caaactattc accggcagac atcgccttta ctggaaagct tccatcccag ctcttggtct 3360
gagaacatat ttcattgcta atgggaatgt cgagtgtgag aaagctactc cgtctaaact 3420
caaatacgct tctgagtttg acccatttcc ttgtcctcct ccatattcct gctccaaact 3480
ggacaacgac gttactgaga tccgaaatga acatcagact cttgtgtttg atgtgaagaa 3540
cggatcactg cggaagatag tccatagaaa cggatcagag actgttgtgg gagaagagat 3600
aggtatgtac tctagtccag agagtggagc ttacctgttc aaaccagatg gtgaagctca 3660
gccaattgtt caacctgatg gacatgtagt cacctctgag ggtctgctgg ttcaagaagt 3720
cttctcttac cctaaaacca aatgggagaa atcacccctc tctcagaaaa ctcgtcttta 3780
cactggaggt aatacgcttc aggatcaagt ggtcgagata gaatatcatg ttgagcttct 3840
tggtaatgat tttgatgacc gggaattgat tgtccggtac aagactgatg ttgacaacaa 3900
gaaggtcttc tattcagatc tcaatggttt ccaaatgagc aggagagaaa cttatgataa 3960
gatccctctt caaggaaact actacccaat gccatctctc gcatttatcc aaggatccaa 4020
tggtcagaga ttctccgtgc actctcgtca atctctcggt gttgcaagcc tcaaagaggg 4080
ttggttggag attatgctgg acagacggtt ggttcgtgat gacggacggg gtctagggca 4140
aggtgtgatg gataaccgcg caatgaccgt ggtatttcac cttcttgcgg aatctaacat 4200
ttctcaagca gaccctgctt ccaacactaa cccgaggaac ccttcgcttc tctctcacct 4260
cataggtgct cacttaaact accccataaa cacattcatt gccaagaaac cgcaagacat 4320
atctgtgcgt gttccacaat acggttcctt tgctccttta gccaaaccgt taccatgtga 4380
cctccacatt gtaaatttca aggttcctcg tccatccaaa tactctcagc aattggaaga 4440
agacaagcca aggttcgctc ttatcctcaa tagacgagct tgggattcag cttattgcca 4500
taaaggaaga caagtaaact gcacaagcat ggctaatgaa ccagtaaact tttccgacat 4560
gttcaaagat cttgcagctt caaaggtaaa accaacttca ctgaatctct tgcaagaaga 4620
tatggagatt cttgggtacg atgaccaaga gctacctcga gatagttcac agccacggga 4680
aggacgtgtc tcgatctctc ccatggaaat acgagcttat aagcttgaac tgcgacctca 4740
caagtgaacc tgctgaagat ccgctagagt ccgcaaaaat caccagtctc tctctacaaa 4800
tctatctctc tctatttttc tccagaataa tgtgtgagta gttcccagat aagggaatta 4860
gggttcttat agggtttcgc tcatgtgttg agcatataag aaacccttag tatgtatttg 4920
tatttgtaaa atacttctat caataaaatt tctaatccta aaaccaaaat cccgcgagag 4980
acctcttaat taa 4993
<210>29
<211>3825
<212>DNA
<213>杂合体
<400>29
ccatggcgag gatctcgtgt gacttgagat ttcttctcat cccggcagct ttcatgttca 60
tctacatcca gatgaggctt ttccagacgc aatcacagta tgcagatcgc ctcagttccg 120
ctatcgaatc tgagaaccat tgcactagtc aaatgcgagg cctcatagat gaagttagca 180
tcaaacagtc gcggattgtt gccctcgaag atatgaagaa ccgccaggac gaagaacttg 240
tgcagcttaa ggatctaatc cagacgtttg aaaaaaaagg aatagcaaaa ctcactcaag 300
gtggagccat ggattccaat tcaggcgccg tcgttgatat cacaactaaa gatctatacg 360
ataggattga gtttcttgat acagatggtg gtccatggaa acaaggttgg agagttacgt 420
ataaagacga tgagtgggag aaagagaagc tcaaaatctt cgttgttcct cattctcata 480
acgatcctgg ttggaaattg actgtagagg agtattatca gagacaatcc agacatattc 540
ttgacaccat tgttgagact ttatctaagg tatgacgaaa gtttttgctt ttggttttaa 600
tattttaatt ctctcccatg gttatcccgt gaacaatctt aaatgtctta aaattctcat 660
gacgtcatta aactctataa ccaaacttct ttgctgggtt ctgttttttt ttagtttcgt 720
gatgaaacag agttctagaa gttcgttctt ttggaaaatt tgaagtcttt ggagctaaag 780
tttgtttttt tattactggg ttttgagatt gaaggatagc tagaatctta tttgtgtggg 840
ggtttgtttt gaatatgttt aataggattc aagaagaaag tttatatggg aggagatgtc 900
atatctggag agatggtgga gagacgcttc acctaataaa caagaagctt tgactaaatt 960
ggttaaggat gggcagctag agattgttgg aggtggctgg gttatgaatg atgaggctaa 1020
ttcacattat tttgccataa ttgaacagat agcagagggt aatatgtggc tgaatgacac 1080
aattggggtt attcctaaga attcttgggc tatagatccc tttggctatt catcaaccat 1140
ggcttatctt ctccggcgta tgggttttga aaacatgctt attcaaagga ctcattacga 1200
gctcaagaaa gaccttgccc agcataagaa tcttgaatat atttggcgtc agagctggga 1260
tgctatggaa accacagata tctttgttca tatgatgccg ttttattcat acgatatccc 1320
acacacttgt ggaccagagc ctgcaatttg ctgtcagttt gatttcgctc ggatgcgggg 1380
atttaagtat gaactttgtc catggggaaa gcacccagtg gagaccacac tagaaaatgt 1440
gcaggagagg gcattaaagc ttctggatca atacaggaaa aaatccactc tatatcgaac 1500
taatacactt cttatacctc ttggagatga ttttaggtac attagtatcg atgaagccga 1560
ggctcagttc cgtaactacc agatgttgtt tgatcacatc aactctaatc ctagtctaaa 1620
cgcagaagca aagtttggta ctttggagga ttatttcaga acagtccgag aagaagcaga 1680
cagagtgaat tattctcgtc ctggtgaggt tggctctggt caggttgttg gtttcccttc 1740
tctgtcaggt gacttcttta catatgcaga taggcaacaa gactattgga gtggttatta 1800
tgtttcaaga cctttcttca aagctgttga tcgtgtgctc gagcataccc ttcgtggagc 1860
tgagatcatg atgtcatttc tgctaggtta ttgccatcgaattcaatgtg agaaatttcc 1920
aacaagtttt acgtataagt tgactgctgc aagaagaaat ctggctcttt tccagcacca 1980
tgatggggta actggaactg ctaaggatta tgtggtacaa gattacggca cccggatgca 2040
tacttcattg caagaccttc agatctttat gtctaaagca atcgaagttc ttcttgggat 2100
ccgccacgag aaagaaaaat ctgatcaatc cccatcattt ttcgaggcag agcaaatgag 2160
atcaaagtat gatgctcggc cagttcacaa gccaattgct gcccgggaag gaaattcgca 2220
cacagttata ctcttcaatc catcagaaca gacgagagag gaggtggtga cggttgttgt 2280
taaccgcgct gaaatctcgg ttttggactc aaactggact tgtgtcccta gccaaatttc 2340
tcctgaagtg cagcatgacg ataccaaact attcaccggc agacatcgcc tttactggaa 2400
agcttccatc ccagctcttg gtctgagaac atatttcatt gctaatggga atgtcgagtg 2460
tgagaaagct actccgtcta aactcaaata cgcttctgag tttgacccat ttccttgtcc 2520
tcctccatat tcctgctcca aactggacaa cgacgttact gagatccgaa atgaacatca 2580
gactcttgtg tttgatgtga agaacggatc actgcggaag atagtccata gaaacggatc 2640
agagactgtt gtgggagaag agataggtat gtactctagt ccagagagtg gagcttacct 2700
gttcaaacca gatggtgaag ctcagccaat tgttcaacct gatggacatg tagtcacctc 2760
tgagggtctg ctggttcaag aagtcttctc ttaccctaaa accaaatggg agaaatcacc 2820
cctctctcag aaaactcgtc tttacactgg aggtaatacg cttcaggatc aagtggtcga 2880
gatagaatat catgttgagc ttcttggtaa tgattttgat gaccgggaat tgattgtccg 2940
gtacaagact gatgttgaca acaagaaggt cttctattca gatctcaatg gtttccaaat 3000
gagcaggaga gaaacttatg ataagatccc tcttcaagga aactactacc caatgccatc 3060
tctcgcattt atccaaggat ccaatggtca gagattctcc gtgcactctc gtcaatctct 3120
cggtgttgca agcctcaaag agggttggtt ggagattatg ctggacagac ggttggttcg 3180
tgatgacgga cggggtctag ggcaaggtgt gatggataac cgcgcaatga ccgtggtatt 3240
tcaccttctt gcggaatcta acatttctca agcagaccct gcttccaaca ctaacccgag 3300
gaacccttcg cttctctctc acctcatagg tgctcactta aactacccca taaacacatt 3360
cattgccaag aaaccgcaag acatatctgt gcgtgttcca caatacggtt cctttgctcc 3420
tttagccaaa ccgttaccat gtgacctcca cattgtaaat ttcaaggttc ctcgtccatc 3480
caaatactct cagcaattgg aagaagacaa gccaaggttc gctcttatcc tcaatagacg 3540
agcttgggat tcagcttatt gccataaagg aagacaagta aactgcacaa gcatggctaa 3600
tgaaccagta aacttttccg acatgttcaa agatcttgca gcttcaaagg taaaaccaac 3660
ttcactgaat ctcttgcaag aagatatgga gattcttggg tacgatgacc aagagctacc 3720
tcgagatagt tcacagccac gggaaggacg tgtctcgatc tctcccatgg aaatacgagc 3780
ttataagctt gaactgcgac ctcacaagtg aacctgctga agatc 3825
<210>30
<211>2181
<212>DNA
<213>杂合体
<400>30
ggcgcgcctc gaggcgatcg cagatctcat tataccgtta gaagcatagt taaaatctaa 60
agcttgtcgt taattctagt cattttacat tgttgggttc tacattatta atgaattttc 120
taatgcaaat acagaattta aatcaaaatt gttgaattat gctaaacatg taacatacgt 180
atatctccgc cttgtgtgtt gtattaactt gaagttatca taagaaccac aaatacacta 240
gtaaatctat gagaaggcag gtggcaacac aaacaagagt atctaagatt ttcatttgtg 300
actataggaa tataatatct cttatctgat ttaatgaatc cacatgttca cttctcattt 360
gtccacaaga tcacaacttt atcttcaata ttcacaactt gttatatcca ccacaatttc 420
attcttttca cttagcccca caaaatactt tgtcccctta tttgccacct tttgtattta 480
atttattctt gtggagctaa gtgttcatat tattcttctt ctcaaaaaaa caaaaacaaa 540
aaaaaagaga agaaaaccat ggcgaggatc tcgtgtgact tgagatttct tctcatcccg 600
gcagctttca tgttcatcta catccagatg aggcttttcc agacgcaatc acagtatgca 660
gatcgcctca gttccgctat cgaatctgag aaccattgca ctagtcaaat gcgaggcctc 720
atagatgaag ttagcatcaa acagtcgcgg attgttgccc tcgaagatat gaagaaccgc 780
caggacgaag aacttgtgca gcttaaggat ctaatccaga cgtttgaaaa aaaaggaata 840
gcaaaactca ctcaaggtgg agccatggct ctaaggttgc atagaaggaa ccatttttcg 900
cctagaaata cggatctgtt cccggatttg gcaaaagatc gtgtggttat cgtcttgtat 960
gtgcataatc gggctcagta ttttcgagtc acagtggaaa gtttgtcgaa ggttaaaggt 1020
ataagtgaga cattgttgat tgttagtcat gatggttact ttgaagagat gaataggatt l080
gtggagagta ttaagttttg tcaagtgaaa cagattttct cgccttattc gcctcatata 1140
tatcgtacta gcttcccggg tgtgaccctg aatgattgta agaacaaggg tgatgaggca 1200
aaggggcatt gtgaaggtaa tcctgatcag tatgggaatc atcggtctcc gaagattgta 1260
tctttgaagc atcactggtg gtggatgatg aacactgtat gggatgggtt ggaagagact 1320
aaaggacatg aggggcatat ccttttcatt gaagaagatc attttctgtt tcctaatgcc 1380
tatcgtaaca tacagactct tacgaggctg aaacccgcaa agtgtcctga ctgttttgct 14440
gctaatttag caccgtctga tgtgaagtca agaggagaag ggcttgaaag tttggttgca 1500
gagagaatgg gaaatgttgg gtattctttt aatagaagtg tgtgggagaa tattcatcag 1560
aaggcaagag agttttgttt ctttgatgat tacaactggg atataacgat gtgggcaacg 1620
gttttcccgt cgtttggttc cccggtgtac acattgcgag ggcctaggac tagtgcggta 1680
cactttggaa aatgtgggtt gcatcaaggt agaggagatg agggtgattg catcgataat 1740
ggggtcgtaa acatagaagt taaggaaaca gataaagttg tgaacataaa agaaggatgg 1800
ggagttcggg tgtataagca tcaagcgggt tataaagccg gtttcgaagg ttggggaggt 1860
tggggcgatg atagggaccg acatttatgt ttggattttg ccactatgta tcgttacagc 1920
agtagcagtg catctccatg aaacggatcc gctagagtcc gcaaaaatca ccagtctctc 1980
tctacaaatc tatctctctc tatttttctc cagaataatg tgtgagtagt tcccagataa 2040
gggaattagg gttcttatag ggtttcgctc atgtgttgag catataagaa acccttagta 2100
tgtatttgta tttgtaaaat acttctatca ataaaatttc taatcctaaa accaaaatcc 2160
cgcgagagac ctcttaatta a 2181
<210>31
<211>1394
<212>DNA
<213>杂合体
<400>31
ccatggcgag gatctcgtgt gacttgagat ttcttctcat cccggcagct ttcatgttca 60
tctacatca gatgaggctt ttccagacgc aatcacagta tgcagatcgc ctcagttccg 120
ctatcgaatc tgagaaccat tgcactagtc aaatgcgagg cctcatagat gaagttagca 180
tcaaacagtc gcggattgtt gccctcgaag atatgaagaa ccgccaggac gaagaacttg 240
tgcagcttaa ggatctaatc cagacgtttg aaaaaaaagg aatagcaaaa ctcactcaag 300
gtggagccat ggctctaagg ttgcatagaa ggaaccattt ttcgcctaga aatacggatc 360
tgttcccgga tttggcaaaa gatcgtgtgg ttatcgtctt gtatgtgcat aatcgggctc 420
agtattttcg agtcacagtg gaaagtttgt cgaaggttaa aggtataagt gagacattgt 480
tgattgttag tcatgatggt tactttgaag agatgaatag gattgtggag agtattaagt 540
tttgtcaagt gaaacagatt ttctcgcctt attcgcctca tatatatcgt actagcttcc 600
cgggtgtgac cctgaatgat tgtaagaaca agggtgatga ggcaaagggg cattgtgaag 660
gtaatcctga tcagtatggg aatcatcggt ctccgaagat tgtatctttg aagcatcact 720
ggtggtggat gatgaacact gtatgggatg ggttggaaga gactaaagga catgaggggc 780
atatcctttt cattgaagaa gatcattttc tgtttcctaa tgcctatcgt aacatacaga 840
ctcttacgag gctgaaaccc gcaaagtgtc ctgactgttt tgctgctaat ttagcaccgt 900
ctgatgtgaa gtcaagagga gaagggcttg aaagtttggt tgcagagaga atgggaaatg 960
ttgggtattc ttttaataga agtgtgtggg agaatattca tcagaaggca agagagtttt 1020
gtttctttga tgattacaac tgggatataa cgatgtgggc aacggttttc ccgtcgtttg 1080
gttccccggt gtacacattg cgagggccta ggactagtgc ggtacacttt ggaaaatgtg 1140
ggttgcatca aggtagagga gatgagggtg attgcatcga taatggggtc gtaaacacag 1200
aagttaagga aacagataaa gttgtgaaca taaaagaagg atggggagtt cgggtgtata 1260
agcatcaagc gggttataaa gccggtttcg aaggttgggg aggttggggc gatgataggg 1320
accgacattt atgtttggat tttgccacta tgtatcgtta cagcagtagc agtgcatctc 1380
catgaaacgg atcc 1394
<210>32
<211>312
<212>DNA
<213>拟南芥
<400>32
ccatggcgag gatctcgtgt gacttgagat ttcttctcat cccggcagct ttcatgttca 60
tctacatcca gatgaggctt ttccagacgc aatcacagta tgcagatcgc ctcagttccg 120
ctatcgaatc tgagaaccat tgcactagtc aaatgcgagg cctcatagat gaagttagca 180
tcaaacagtc gcggattgtt gccctcgaag atatgaagaa ccgccaggac gaagaacttg 240
tgcagcttaa ggatctaatc cagacgtttg aaaaaaaagg aatagcaaaa ctcactcaag 300
gtggǎgccat gg 312
<210>33
<211>276
<212>DNA
<213>Glycine max
<400>33
ccatggcgag agggagcaga tcagtgggta gcagcagcag caaatggagg tactgcaacc 60
cttcctatta cttgaagcgc ccaaagcgtc ttgctctgct cttcatcgtt ttcgtttgtg 120
tctctttcgt tttctgggac cgtcaaactc tcgtcagaga gcaccaggtt gaaatttctg 180
agctgcagaa agaagtgact gatttgaaaa atttggtgga tgatttaaat aacaaacaag 240
gtggtacctc tgggaaaact gacttgggga ccatgg 276
<210>34
<211>9240
<212>DNA
<213>杂合体
<400>34
ggcgcgcctc gaggcgatcg cagatccgat ataacaaaat ttgaatcgca cagatcgatc 60
tctttggaga ttctatacct agaaaatgga gacgattttc aaatctctgt aaaaattctg 120
gtttcttctt gacggaagaa gacgacgact ccaatatttc ggttagtact gaaccggaaa 180
gtttgactgg tgcaaccaat ttaatgtacc gtacgtaacg caccaatcgg attttgtatt 240
caatgggcct tatctgtgag cccattaatt gatgtgacgg cctaaactaa atccgaacgg 300
tttatttcag cgatccgcga cggtttgtat tcagccaata gcaatcaatt atgtagcagt 360
ggtgatcctc gtcaaaccag taaagctaga tctggaccgt tgaattggtg caagaaagca 420
catgttgtga tatttttacc cgtacgatta gaaaacttga gaaacacatt gataatcgat 480
aaaaaccgtc cgatcatata aatccgcttt accatcgttg cctataaatt aatatcaata 540
gccgtacacg cgtgaagact gacaatatta tctttttcga attcggagct caagtttgaa 600
attcggagaa gctagagagt tttctgataa ccatggcgag agggagcaga tcagtgggta 660
gcagcagcag caaatggagg tactgcaacc cttcctatta cttgaagcgc ccaaagcgtc 720
ttgctctgct cttcatcgtt ttcgtttgtg tctctttcgt tttctgggac cgtcaaactc 780
tcgtcagaga gcaccaggtt gaaatttctg agctgcagaa agaagtgact gatttgaaaa 840
atttggtgga tgatttaaat aacaaacaag gtggtacctc tgggaaaact gacttgggga 900
ccatgggaca gatgcctgtg gctgctgtag tggttatggc ctgcagtcgt gcagactatc 960
ttgaaaggac tgttaaatca gttttaacat atcaaactcc cgttgcttca aaatatcctc 1020
tatttatatc tcaggatgga tctgatcaag ctgtcaagag caagtcattg agctataatc 1080
aattaacata tatgcagcac ttggattttg aaccagtggt cactgaaagg cctggcgaac 1140
tgactgcgta ctacaagatt gcacgtcact acaagtgggc actggaccag ttgttttaca 1200
aacacaaatt tagtcgagtg attatactag aagatgatat ggaaattgct ccagacttct 1260
ttgattactt tgaggctgca gctagtctca tggataggga taaaaccatt atggctgctt 1320
catcatggaa tgataatgga cagaagcagt ttgtgcatga tccctatgcg ctataccgat 1380
cagatttttt tcctggcctt gggtggatgc tcaagagatc gacttgggat gagttatcac 1440
caaagtggcc aaaggcttac tgggatgatt ggctgagact aaaggaaaac cataaaggcc 1500
gccaattcat tcgaccggaa gtctgtagaa catacaattt tggtgaacat gggtctagtt 1560
tgggacagtt tttcagtcag tatctggaac ctataaagct aaacgatgtg acggttgact 1620
ggaaagcaaa ggacctggga tacctgacag agggaaacta taccaagtac ttttctggct 1680
tagtgagaca agcacgacca attcaaggtt ctgaccttgt cttaaaggct caaaacataa 1740
aggatgatgt tcgtatccgg tataaagacc aagtagagtt tgaacgcatt gcaggggaat 1800
ttggtatatt tgaagaatgg aaggatggtg tgcctcgaac agcatataaa ggagtagtgg 1860
tgtttcgaat ccagacaaca agacgtgtat tcctggttgg gccagattct gtaatgcagc 1920
ttggaattcg aaattcctga tgcggatccg ctagagtccg caaaaatcac cagtctctct 1980
ctacaaatct atctctctct atttttctcc agaataatgt gtgagtagtt cccagataag 2040
ggaattaggg ttcttatagg gtttcgctca tgtgttgagc atataagaaa cccttagtat 2100
gtatttgtat ttgtaaaata cttctatcaa taaaatttct aatcctaaaa ccaaaatccc 2160
gcgcctcgag gcgatcgcag atctaatcta accaattacg atacgctttg ggtacacttg 2220
atttttgttt cagtggttac atatatcttg ttttatatgc tatctttaag gatctgcaca 2280
aagattattt gttgatgttc ttgatggggc tcagaagatt tgatatgata cactctaatc 2340
tttaggagat accagccagg attatattca gtaagacaat caaattttac gtgttcaaac 2400
tcgttatctt ttcattcaaa ggatgagcca gaatctttat agaatgattg caatcgagaa 2460
tatgttcggc cgatatgcct ttgttggctt caatattcta catatcacac aagaatcgac 2520
cgtattgtac cctctttcca taaaggaaaa cacaatatgc agatgctttt ttcccacatg 2580
cagtaacata taggtattca aaaatggcta aaagaagttg gataacaaat tgacaactat 2640
ttccatttct gttatataaa tttcacaaca cacaaaagcc cgtaatcaag agtctgccca 2700
tgtacgaaat aacttctatt atttggtatt gggcctaagc ccagctcaga gtacgtgggg 2760
gtaccacata taggaaggta acaaaatact gcaagatagc cccataacgt accagcctct 2820
ccttaccacg aagagataag atataagacc caccctgcca cgtgtcacat cgtcatggtg 2880
gttaatgata agggattaca tccttctatg tttgtggaca tgatgcatgt aatgtcatga 2940
gccacaggat ccaatggcca caggaacgta agaatgtaga tagatttgat tttgtccgtt 3000
agatagcaaa caacattata aaaggtgtgt atcaatagga actaattcac tcattggatt 3060
catagaagtc cattcctcct aagtatctag aaaccatggc gagagggagc agatcagtgg 3120
gtagcagcag cagcaaatgg aggtactgca acccttccta ttacttgaag cgcccaaagc 3180
gtcttgctct gctcttcatc gttttcgttt gtgtctcttt cgttttctgg gaccgtcaaa 3240
ctctcgtcag agagcaccag gttgaaattt ctgagctgca gaaagaagtg actgatttga 3300
aaaatttggt ggatgattta aataacaaac aaggtggtac ctctgggaaa actgacttgg 3360
ggaccatgga ttccaattca ggcgccgtcg ttgatatcac aactaaagat ctatacgata 3420
ggattgagtt tcttgataca gatggtggtc catggaaaca aggttggaga gttacgtata 3480
aagacgatga gtgggagaaa gagaagctca aaatcttcgt tgttcctcat tctcataacg 3540
atcctggttg gaaattgact gtagaggagt attatcagag acaatccaga catattcttg 3600
acaccattgt tgagacttta tctaaggtat gacgaaagtt tttgcttttg gttttaatat 3660
tttaattctc tcccatggtt atcccgtgaa caatcttaaa tgtcttaaaa ttctcatgac 3720
gtcattaaac tctataacca aacttctttg ctgggttctg ttttttttta gtttcgtgat 3780
gaaacagagt tctagaagtt cgttcttttg gaaaatttga agtctttgga gctaaagttt 3840
gtttttttat tactgggttt tgagattgaa ggatagctag aatcttattt gtgtgggggt 3900
ttgttttgaa tatgtttaat aggattcaag aagaaagttt atatgggagg agatgtcata 3960
tctggagaga tggtggagag acgcttcacc taataaacaa gaagctttga ctaaattggt 4020
taaggatggg cagctagaga ttgttggagg tggctgggtt atgaatgatg aggctaattc 4080
acattatttt gccataattg aacagatagc agagggtaat atgtggctga atgacacaat 4140
tggggttatt cctaagaatt cttgggctat agatcccttt ggctattcat caaccatggc 4200
ttatcttctc cggcgtatgg gttttgaaaa catgcttatt caaaggactc attacgagct 4260
caagaaagac cttgcccagc ataagaatct tgaatatatt tggcgtcaga gctgggatgc 4320
tatggaaacc acagatatct ttgttcatat gatgccgttt tattcatacg atatcccaca 4380
cacttgtgga ccagagcctg caatttgctg tcagtttgat ttcgctcgga tgcggggatt 4440
taagtatgaa ctttgtccat ggggaaagca cccagtggag accacactag aaaatgtgca 4500
ggagagggca ttaaagcttc tggatcaata caggaaaaaa tccactctat atcgaactaa 4560
tacacttctt atacctcttg gagatgattt taggtacatt agtatcgatg aagccgaggc 4620
tcagttccgt aactaccaga tgttgtttga tcacatcaac tctaatccta gtctaaacgc 4680
agaagcaaag tttggtactt tggaggatta tttcagaaca gtccgagaag aagcagacag 4740
agtgaattat tctcgtcctg gtgaggttgg ctctggtcag gttgttggtt tcccttctct 4800
gtcaggtgac ttctttacat atgcagatag gcaacaagac tattggagtg gttattatgt 4860
ttcaagacct ttcttcaaag ctgttgatcg tgtgctcgag catacccttc gtggagctga 4920
gatcatgatg tcatttctgc taggttattg ccatcgaatt caatgtgaga aatttccaac 4980
aagttttacg tataagttga ctgctgcaag aagaaatctg gctcttttcc agcaccatga 5040
tggggtaact ggaactgcta aggattatgt ggtacaagat tacggcaccc ggatgcatac 5100
ttcattgcaa gaccttcaga tctttatgtc taaagcaatc gaagttcttc ttgggatccg 5160
ccacgagaaa gaaaaatctg atcaatcccc atcatttttc gaggcagagc aaatgagatc 5220
aaagtatgat gctcggccag ttcacaagcc aattgctgcc cgggaaggaa attcgcacac 5280
agttatactc ttcaatccat cagaacagac gagagaggag gtggtgacgg ttgttgttaa 5340
ccgcgctgaa atctcggttt tggactcaaa ctggacttgt gtccctagcc aaatttctcc 5400
tgaagtgcag catgacgata ccaaactatt caccggcaga catcgtcttt actggaaagc 5460
ttccatccca gctcttggtc tgagaacata tttcattgct aatgggaatg tcgagtgtga 5520
gaaagctact ccgtctaaac tcaaatacgc ttctgagttt gacccatttc cttgtcctcc 5580
tccatattcc tgctccaaac tggacaacga cgttactgag atccgaaatg aacatcagac 5640
tcttgtgttt gatgtgaaga acggatcact gcggaagata gtccatagaa acggatcaga 5700
gactgttgtg ggagaagaga taggtatgta ctctagtcca gagagtggag cttacctgtt 5760
caaaccagat ggtgaagctc agccaattgt tcaacctgat ggacatgtag tcacctctga 5820
gggtctgctg gttcaagaag tcttctctta ccctaaaacc aaatgggaga aatcacccct 5880
ctctcagaaa actcgtcttt acactggagg taatacgctt caggatcaag tggtcgagat 5940
agaatatcat gttgagcttc ttggtaatga ttttgatgac cgggaattga ttgtccggta 6000
caagactgat gttgacaaca agaaggtctt ctattcagat ctcaatggtt tccaaatgag 6060
caggagagaa acttatgata agatccctct tcaaggaaac tactacccaa tgccatctct 6120
cgcatttatc caaggatcca atggtcagag attctccgtg cactctcgtc aatctctcgg 6180
tgttgcaagc ctcaaagagg gttggttgga gattatgctg gacagacggt tggttcgtga 6240
tgacggacgg ggtctagggc aaggtgtgat ggataaccgc gcaatgaccg tggtattaaa 6300
ccttcttgcg gaatctaaca tttctcaagc agaccctgct tccaacacta acccgagaaa 6360
cccttcgctt ctctctcacc tcataggtgc tcacttaaac taccccataa acacattaat 6420
tgccaagaaa ccgcaagaca tatctgtgcg tgttccacaa tacggttcct ttgctccact 6480
agccaaaccg ttaccatgtg acctccacat tgtaaatttc aaggttcctc gtccatccaa 6540
atactctcag caattggaag aagacaagcc aaggttcgct cttatcctca atagacgagc 6600
ttgggattca gcttattgcc ataaaggaag acaagtaaac tgcacaagca tggctaatga 6660
accagtaaac ttttccgaca tgttcaaaga tcttgcagct tcaaaggtaa aaccaacttc 6720
actgaatctc ttgcaagaag atatggagat tcttgggtac gatgaccaag agctacctcg 6780
agatagttca cagccacggg aaggacgtgt ctcgatctct cccatggaaa tacgagctta 6840
taagcttgaa ctgcgacctc acaagtgaac ctgctgaaga tccgctagag tccgcaaaaa 6900
tcaccagtct ctctctacaa atctatttct ctctattttt ctccagaata atgtgtgagt 6960
agttcccaga taagggaatt agggttctta tagggtttcg ctcatgtgtt gagcatataa 7020
gaaaccctta gtatgtattt gtatttgtaa aatacttcta tcaataaaat ttctaatcct 7080
aaaaccaaaa tcccgcgcgc gcctcgaggc gatcgcagat ctcattatac cgttagaagc 7140
atagttaaaa tctaaagctt gtcgttaatt ctagtcattt tacattgttg ggttctacat 7200
tattaatgaa ttttctaatg caaatacaga atttaaatca aaattgttga attatgctaa 7260
acatgtaaca tacgtatatc tccgccttgt gtgttgtatt aacttgaagt tatcataaga 7320
accacaaata cactagtaaa tctatgagaa ggcaggtggc aacacaaaca agagtatcta 7380
agattttcat ttgtgactat aggaatataa tatctcttat ctgatttaat gaatccacat 7440
gttcacttct catttgtcca caagatcaca actttatctt caatattcac aacttgttat 7500
atccaccaca atttcattct tttcacttag ccccacaaaa tactttgtcc ccttatttgc 7560
caccttttgt atttaattta ttcttgtgga gctaagtgtt catattattc ttcttctcaa 7620
aaaaacaaaa acaaaaaaaa agagaagaaa accatggcga gagggagcag atcagtgggt 7680
agcagcagca gcaaatggag gtactgcaac ccttcctatt acttgaagcg cccaaagcgt 7740
cttgctctgc tcttcatcgt tttcgtttgt gtctctttcg ttttctggga ccgtcaaact 7800
ctcgtcagag agcaccaggt tgaaatttct gagctgcaga aagaagtgac tgatttgaaa 7860
aatttggtgg atgatttaaa taacaaacaa ggtggtacct ctgggaaaac tgacttgggg 7920
accatggctc taaggttgca tagaaggaac catttttcgc ctagaaatac ggatctgttc 7980
ccggatttgg caaaagatcg tgtggttatc gtcttgtatg tgcataatcg ggctcagtat 8040
tttcgagtca cagtggaaag tttgtcgaag gttaaaggta taagtgagac attgttgatt 8100
gttagtcatg atggttactt tgaagagatg aataggattg tggagagtat taagttttgt 8160
caagtgaaac agattttctc gccttattcg cctcatatat atcgtactag cttcccgggt 8220
gtgaccctga atgattgtaa gaacaagggt gatgaggcaa aggggcattg tgaaggtaat 8280
cctgatcagt atgggaatca tcggtctccg aagattgtat ctttgaagca tcactggtgg 8340
tggatgatga acactgtatg ggatgggttg gaagagacta aaggacatga ggggcatatc 8400
cttttcattg aagaagatca ttttctgttt cctaatgcct atcgtaacat acagactctt 8460
acgaggctga aacccgcaaa gtgtcctgac tgttttgctg ctaatttagc accgtctgat 8520
gtgaagtcaa gaggagaagg gcttgaaagt ttggttgcag agagaatggg aaatgttggg 8580
tattctttta atagaagtgt gtgggagaat attcatcaga aggcaagaga gttttgtttc 8640
tttgatgatt acaactggga tataacgatg tgggcaacgg ttttcccgtc gtttggttcc 8700
ccggtgtaca cattgcgagg gcctaggact agtgcggtac actttggaaa atgtgggttg 8760
catcaaggta gaggagatga gggtgattgc atcgataatg gggtcgtaaa catagaagtt 8820
aaggaaacag ataaagttgt gaacataaaa gaaggatggg gagttcgggt gtataagcat 8880
caagcgggtt ataaagccgg tttcgaaggt tggggaggtt ggggcgatga tagggaccga 8940
catttatgtt tggattttgc cactatgtat cgttacagca gtagcagtgc atctccatga 9000
aacggatccg ctagagtccg caaaaatcac cagtctctct ctacaaatct atctctctct 9060
atttttctcc agaataatgt gtgagtagtt cccagataag ggaattaggg ttcttatagg 9120
gtttcgctca tgtgttgagc atataagaaa cccttagtat gtatttgtat ttgtaaaata 9180
cttctatcaa taaaatttct aatcctaaaa ccaaaatccc gcgagagacc tcttaattaa 9240
<210>35
<211>2180
<212>DNA
<213>杂合体
<400>35
ggcgcgcctc gaggcgatcg cagatccgat ataacaaaat ttgaatcgca cagatcgatc 60
tctttggaga ttctatacct agaaaatgga gacgattttc aaatctctgt aaaaattctg 120
gtttcttctt gacggaagaa gacgacgact ccaatatttc ggttagtact gaaccggaaa 180
gtttgactgg tgcaaccaat ttaatgtacc gtacgtaacg caccaatcgg attttgtatt 240
caatgggcct tatctgtgag cccattaatt gatgtgacgg cctaaactaa atccgaacgg 300
tttatttcag cgatccgcga cggtttgtat tcagccaata gcaatcaatt atgtagcagt 360
ggtgatcctc gtcaaaccag taaagctaga tctggaccgt tgaattggtg caagaaagca 420
catgttgtga tatttttacc cgtacgatta gaaaacttga gaaacacatt gataatcgat 480
aaaaaccgtc cgatcatata aatccgcttt accatcgttg cctataaatt aatatcaata 540
gccgtacacg cgtgaagact gacaatatta tctttttcga attcggagct caagtttgaa 600
attcggagaa gctagagagt tttctgataa ccatggcgag agggagcaga tcagtgggta 660
gcagcagcag caaatggagg tactgcaacc cttcctatta cttgaagcgc ccaaagcgtc 720
ttgctctgct cttcatcgtt ttcgtttgtg tctctttcgt tttctgggac cgtcaaactc 780
tcgtcagaga gcaccaggtt gaaatttctg agctgcagaa agaagtgact gatttgaaaa 840
atttggtgga tgatttaaat aacaaacaag gtggtacctc tgggaaaact gacttgggga 900
ccatgggaca gatgcctgtg gctgctgtag tggttatggc ctgcagtcgt gcagactatc 960
ttgaaaggac tgttaaatca gttttaacat atcaaactcc cgttgcttca aaatatcctc 1020
tatttatatc tcaggatgga tctgatcaag ctgtcaagag caagtcattg agctataatc 1080
aattaacata tatgcagcac ttggattttg aaccagtggt cactgaaagg cctggcgaac 1140
tgactgcgta ctacaagatt gcacgtcact acaagtgggc actggaccag ttgttttaca 1200
aacacaaatt tagtcgagtg attatactag aagatgatat ggaaattgct ccagacttct 1260
ttgattactt tgaggctgca gctagtctca tggataggga taaaaccatt atggctgctt 1320
catcatggaa tgataatgga cagaagcagt ttgtgcatga tccctatgcg ctataccgat l380
cagatttttt tcctggcctt gggtggatgc tcaagagatc gacttgggat gagttatcac 1440
caaagtggcc aaaggcttac tgggatgatt ggctgagact aaaggaaaac cataaaggcc l500
gccaattcat tcgaccggaa gtctgtagaa catacaattt tggtgaacat gggtctagtt 1560
tgggacagtt tttcagtcag tatctggaac ctataaagct aaacgatgtg acggttgact 1620
ggaaagcaaa ggacctggga tacctgacag agggaaacta taccaagtac ttttctggct 1680
tagtgagaca agcacgacca attcaaggtt ctgaccttgt cttaaaggct caaaacataa 1740
aggatgatgt tcgtatccgg tataaagacc aagtagagtt tgaacgcatt gcaggggaat 1800
ttggtatatt tgaagaatgg aaggatggtg tgcctcgaac agcatataaa ggagtagtgg 1860
tgtttcgaat ccagacaaca agacgtgtat tcctggttgg gccagattct gtaatgcagc 1920
ttggaattcg aaattcctga tgcggatccg ctagagtccg caaaaatcac cagtctctct 1980
ctacaaatct atctctctct atttttctcc agaataatgt gtgagtagtt cccagataag 2040
ggaattaggg ttcttatagg gtttcgctca tgtgttgagc atataagaaa cccttagtat 2100
gtatttgtat ttgtaaaata cttctatcaa taaaatttct aatcctaaaa ccaaaatccc 2160
gcgagagacc tcttaattaa 2180
<210>36
<211>615
<212>DNA
<213>拟南芥
<400>36
ggatccgata taacaaaatt tgaatcgcac agatcgatct ctttggagat tctataccta 60
gaaaatggag acgattttca aatctctgta aaaattctgg tttcttcttg acggaagaag 120
acgacgactc caatatttcg gttagtactg aaccggaaag tttgactggt gcaaccaatt 180
taatgtaccg tacgtaacgc accaatcgga ttttgtattc aatgggcctt atctgtgagc 240
ccattaattg atgtgacggc ctaaactaaa tccgaacggt ttatttcagc gatccgcgac 300
ggtttgtatt cagccaatag caatcaatta tgtagcagtg gtgatcctcg tcaaaccagt 360
aaagctagat ctggaccgtt gaattggtgc aagaaagcac atgttgtgat atttttaccc 420
gtacgattag aaaacttgag aaacacattg ataatcgata aaaaccgtcc gatcatataa 480
atccgcttta ccatcgttgc ctataaatta atatcaatag ccgtacacgc gtgaagactg 540
acaatattat ctttttcgaa ttcggagctc aagtttgaaa ttcggagaag ctagagagtt 600
ttctgataac catgg 615
<210>37
<211>1319
<212>DNA
<213>杂合体
<400>37
ccatggcgag agggagcaga tcagtgggta gcagcagcag caaatggagg tactgcaacc 50
cttcctatta cttgaagcgc ccaaagcgtc ttgctctgct cttcatcgtt ttcgtttgtg 120
tctctttcgt tttctgggac cgtcaaactc tcgtcagaga gcaccaggtt gaaatttctg 180
agctgcagaa agaagtgact gatttgaaaa atttggtgga tgatttaaat aacaaacaag 240
gtggtacctc tgggaaaact gacttgggga ccatgggaca gatgcctgtg gctgctgtag 300
tggttatggc ctgcagtcgt gcagactatc ttgaaaggac tgttaaatca gttttaacat 360
atcaaactcc cgttgcttca aaatatcctc tatttatatc tcaggatgga tctgatcaag 420
ctgtcaagag caagtcattg agctataatc aattaacata tatgcagcac ttggattttg 480
aaccagtggt cactgaaagg cctggcgaac tgactgcgta ctacaagatt gcacgtcact 540
acaagtgggc actggaccag ttgttttaca aacacaaatt tagtcgagtg attatactag 600
aagatgatat ggaaattgct ccagacttct ttgattactt tgaggctgca gctagtctca 660
tggataggga taaaaccatt atggctgctt catcatggaa tgataatgga cagaagcagt 720
ttgtgcatga tccctatgcg ctataccgat cagatttttt tcctggcctt gggtggatgc 730
tcaagagatc gacttgggat gagttatcac caaagtggcc aaaggcttac tgggatgatt 840
ggctgagact aaaggaaaac cataaaggcc gccaattcat tcgaccggaa gtctgtagaa 900
catacaattt tggtgaacat gggtctagtt tgggacagtt tttcagtcag tatctggaac 960
ctataaagct aaacgatgtg acggttgact ggaaagcaaa ggacctggga tacctgacag 1020
agggaaacta taccaagtac ttttctggct tagtgagaca agcacgacca attcaaggtt 1080
ctgaccttgt cttaaaggct caaaacataa aggatgatgt tcgtatccgg tataaagacc 1140
aagtagagtt tgaacgcatt gcaggggaat ttggtatatt tgaagaatgg aaggatggtg 1200
tgcctcgaac agcatataaa ggagtagtgg tgtttcgaat ccagacaaca 3gacgtgtat 1260
tcctggttgg gccagattct gtaatgcagc ttggaattcg aaattcctga tgcggatcc 1319
<210>38
<211>4957
<212>DNA
<213>杂合体
<400>38
ggcgcgcctc gaggcgatcg cagatctaat ctaaccaatt acgatacgct ttgggtacac 60
ttgatttttg tttcagtggt tacatatatc ttgttttata tgctatcttt aaggatctgc 120
acaaagatta tttgttgatg ttcttgatgg ggctcagaag atttgatatg atacactcta 180
atctttagga gataccagcc aggattatat tcagtaagac aatcaaattt tacgtgttca 240
aactcgttat cttttcattc aaaggatgag ccagaatctt tatagaatga ttgcaatcga 300
gaatatgttc ggccgatatg cctttgttgg cttcaatatt ctacatatca cacaagaatc 360
gaccgtattg taccctcttt ccataaagga aaacacaata tgcagatgct tttttcccac 420
atgcagtaac atataggtat tcaaaaatgg ctaaaagaag ttggataaca aattgacaac 480
tatttccatt tctgttatat aaatttcaca acacacaaaa gcccgtaatc aagagtctgc 540
ccatgtacga aataacttct attatttggt attgggccta agcccagctc agagtacgtg 600
ggggtaccac atataggaag gtaacaaaat actgcaagat agccccataa cgtaccagcc 660
tctccttacc acgaagagat aagatataag acccaccctg ccacgtgtca catcgtcatg 720
gtggttaatg ataagggatt acatccttct atgtttgtgg acatgatgca tgtaatgtca 780
tgagccacag gatccaatgg ccacaggaac gtaagaatgt agatagattt gattttgtcc 840
gttagatagc aaacaacatt ataaaaggtg tgtatcaata ggaactaatt cactcattgg 900
attcatagaa gtccattcct cctaagtatc tagaaaccat ggcgagaggg agcagatcag 960
tgggtagcag cagcagcaaa tggaggtact gcaacccttc ctattacttg aagcgcccaa 1020
agcgtcttgc tctgctcttc atcgttttcg tttgtgtctc tttcgttttc tgggaccgtc 1080
aaactctcgt cagagagcac caggttgaaa tttctgagct gcagaaagaa gtgactgatt 1140
tgaaaaattt ggtggatgat ttaaataaca aacaaggtgg tacctctggg aaaactgact 1200
tggggaccat ggattccaat tcaggcgccg tcgttgatat cacaactaaa gatctatacg 1260
ataggattga gtttcttgat acagatggtg gtccatggaa acaaggttgg agagttacgt 1320
ataaagacga tgagtgggag aaagagaagc tcaaaatctt cgttgttcct cattctcata 1380
acgatcctgg ttggaaattg actgtagagg agtattatca gagacaatcc agacatattc 1440
ttgacaccat tgttgagact ttatctaagg tatgacgaaa gtttttgctt ttggttttaa 1500
tattttaatt ctctcccatg gttatcccgt gaacaatctt aaatgtctta aaattctcat 1560
gacgtcatta aactctataa ccaaacttct ttgctgggtt ctgttttttt ttagtttcgt 1620
gatgaaacag agttctagaa gttcgttctt ttggaaaatt tgaagtcttt ggagctaaag 1680
tttgtttttt tattactggg ttttgagatt gaaggatagc tagaatctta tttgtgtggg 1740
ggtttgtttt gaatatgttt aataggattc aagaagaaag tttatatggg aggagatgtc 1800
atatctggag agatggtgga gagacgcttc acctaataaa caagaagctt tgactaaatt 1860
ggttaaggat gggcagctag agattgttgg aggtggctgg gttatgaatg atgaggctaa 1920
ttcacattat tttgccataa ttgaacagat agcagagggt aatatgtggc tgaatgacac 1980
aattggggtt attcctaaga attcttgggc tatagatccc tttggctatt catcaaccat 2040
ggcttatctt ctccggcgta tgggttttga aaacatgctt attcaaagga ctcattacga 2100
gctcaagaaa gaccttgccc agcataagaa tcttgaatat atttggcgtc agagctggga 2160
tgctatggaa accacagata tctttgttca tatgatgccg ttttattcat acgatatccc 2220
acacacttgt ggaccagagc ctgcaatttg ctgtcagttt gatttcgctc ggatgcgggg 2280
atttaagtat gaactttgtc catggggaaa gcacccagtg gagaccacac tagaaaatgt 2340
gcaggagagg gcattaaagc ttctggatca atacaggaaa aaatccactc tatatcgaac 2400
taatacactt cttatacctc ttggagatga ttttaggtac attagtatcg atgaagccga 2460
ggctcagttc cgtaactacc agatgttgtt tgatcacatc aactctaatc ctagtctaaa 2520
cgcagaagca aagtttggta ctttggagga ttatttcaga acagtccgag aagaagcaga 2580
cagagtgaat tattctcgtc ctggtgaggt tggctctggt caggttgttg gtttcccttc 2640
tctgtcaggt gacttcttta catatgcaga taggcaacaa gactattgga gtggttatta 2700
tgtttcaaga cctttcttca aagctgttga tcgtgtgctc gagcataccc ttcgtggagc 2760
tgagatcatg atgtcatttc tgctaggtta ttgccatcga attcaatgtg agaaatttcc 2820
aacaagtttt acgtataagt tgactgctgc aagaagaaat ctggctcttt tccagcacca 2880
tgatggggta actggaactg ctaaggatta tgtggtacaa gattacggca cccggatgca 2940
tacttcattg caagaccttc agatctttat gtctaaagca atcgaagttc ttcttgggat 3000
ccgccacgag aaagaaaaat ctgatcaatc cccatcattt ttcgaggcag agcaaatgag 3060
atcaaagtat gatgctcggc cagttcacaa gccaattgct gcccgggaag gaaattcgca 3120
cacagttata ctcttcaatc catcagaaca gacgagagag gaggtggtga cggttgttgt 3180
taaccgcgct gaaatctcgg ttttggactc aaactggact tgtgtcccta gccaaatttc 3240
tcctgaagtg cagcatgacg ataccaaact attcaccggc agacatcgcc tttactggaa 3300
agcttccatc ccagctcttg gtctgagaac atatttcatt gctaatggga atgtcgagtg 3360
tgagaaagct actccgtcta aactcaaata cgcttctgag tttgacccat ttccttgtcc 3420
tcctccatat tcctgctcca aactggacaa cgacgttact gagatccgaa atgaacatca 3480
gactcttgtg tttgatgtga agaacggatc actgcggaag atagtccata gaaacggatc 3540
agagactgtt gtgggagaag agataggtat gtactctagt ccagagagtg gagcttacct 3600
gttcaaacca gatggtgaag ctcagccaat tgttcaacct gatggacatg tagtcacctc 3660
tgagggtctg ctggttcaag aagtcttctc ttaccctaaa accaaatggg agaaatcacc 3720
cctctctcag aaaactcgtc tttacactgg aggtaatacg cttcaggatc aagtggtcga 3780
gatagaatat catgttgagc ttcttggtaa tgattttgat gaccgggaat tgattgtccg 3840
gtacaagact gatgttgaca acaagaaggt cttctattca gatctcaatg gtttccaaat 3900
gagcaggaga gaaacttatg ataagatccc tcttcaagga aactactacc caatgccatc 3960
tctcgcattt atccaaggat ccaatggtca gagattctcc gtgcactctc gtcaatctct 4020
cggtgttgca agcctcaaag agggttggtt ggagattatg ctggacagac ggttggttcg 4080
tgatgacgga cggggtctag ggcaaggtgt gatggataac cgcgcaatga ccgtggtatt 4140
tcaccttctt gcggaatcta acatttctca agcagaccct gcttccaaca ctaacccgag 4200
gaacccttcg cttctctctc acctcatagg tgctcactta aactacccca taaacacatt 4260
cattgccaag aaaccgcaag acatatctgt gcgtgttcca caatacggtt cctttgctcc 4320
tttagccaaa ccgttaccat gtgacctcca cattgtaaat ttcaaggtta ctcgtccatc 4380
caaatactct cagcaattgg aagaagacaa gccaaggttc gctcttatcc tcaatagacg 4440
agcttgggat tcagcttatt gccataaagg aagacaagta aactgcacaa gcatggctaa 4500
tgaaccagta aacttttccg acatgttcaa agatcttgca gcttcaaagg taaaaccaac 4560
ttcactgaat ctcttgcaag aagatatgga gattcttggg tacgatgacc aagagctacc 4620
tcgagatagt tcacagccac gggaaggacg tgtctcgatc tctcccatgg aaatacgagc 4680
ttataagctt gaactgcgac ctcacaagtg aacctgctga agatccgcta gagtccgcaa 4740
aaatcaccag tctctctcta caaatctatc tctctctatt tttctccaga ataatgtgtg 4800
agtagttccc agataaggga attagggttc ttatagggtt tcgctcatgt gttgagcata 4860
taagaaaccc ttagtatgta tttgtatttg taaaatactt ctatcaataa aatttctaat 4920
cctaaaacca aaatcccgcg agagacctct taattaa 4957
<210>39
<211>921
<212>DNA
<213>Chrysanthemum x morifolium
<400>39
agatctaatc taaccaatta cgatacgctt tgggtacact tgatttttgt ttcagtggtt 60
acatatatct tgttttatat gctatcttta aggatctgca caaagattat ttgttgatgt 120
tcttgatggg gctcagaaga tttgatatga tacactctaa tctttaggag ataccagcca 180
ggattatatt cagtaagaca atcaaatttt acgtgttcaa actcgttatc ttttcattca 240
aaggatgagc cagaatcttt atagaatgat tgcaatcgag aatatgttcg gccgatatgc 300
ctttgttggc ttcaatattc tacatatcac acaagaatcg accgtattgt accctctttc 360
cataaaggaa aacacaatat gcagatgctt ttttcccaca tgcagtaaca tataggtatt 420
caaaaatggc taaaagaagt tggataacaa attgacaact atttccattt ctgttatata 480
aatttcacaa cacacaaaag cccgtaatca agagtctgcc catgtacgaa ataacttcta 540
ttatttggta ttgggcctaa gcccagctca gagtacgtgg gggtaccaca tataggaagg 600
taacaaaata ctgcaagata gccccataac gtaccagcct ctccttacca cgaagagata 660
agatataaga cccaccctgc cacgtgtcac atcgtcatgg tggttaatga taagggatta 720
catccttcta tgtttgtgga catgatgcat gtaatgtcat gagccacagg atccaatggc 780
cacaggaacg taagaatgta gatagatttg attttgtccg ttagatagca aacaacatta 840
taaaaggtgt gtatcaatag gaactaattc actcattgga ttcatagaag tccattcctc 900
ctaagtatct agaaaccatg g 921
<210>40
<211>3789
<212>DNA
<213>杂合体
<400>40
ccatggcgag agggagcaga tcagtgggta gcagcagcag caaatggagg tactgcaacc 60
cttcctatta cttgaagcgc ccaaagcgtc ttgctctgct cttcatcgtt ttcgtttgtg 120
tctctttcgt tttctgggac cgtcaaactc tcgtcagaga gcaccaggtt gaaatttctg 180
agctgcagaa agaagtgact gatttgaaaa atttggtgga tgatttaaat aacaaacaag 240
gtggtacctc tgggaaaact gacttgggga ccatggattc caattcaggc gccgtcgttg 300
atatcacaac taaagatcta tacgatagga ttgagtttct tgatacagat ggtggtccat 360
ggaaacaagg ttggagagtt acgtataaag acgatgagtg ggagaaagag aagctcaaaa 420
tcttcgttgt tcctcattct cataacgatc ctggttggaa attgactgta gaggagtatt 480
atcagagaca atccagacat attcttgaca ccattgttga gactttatct aaggtatgac 540
gaaagttttt gcttttggtt ttaatatttt aattctctcc catggttatc ccgtgaacaa 600
tcttaaatgt cttaaaattc tcatgacgtc attaaactct ataaccaaac ttctttgccg 660
ggttctgttt ttttttagtt tcgtgatgaa acagagttct agaagttcgt tcttttggaa 720
aatttgaagt ctttggagct aaagtttgtt tttttattac tgggttttga gattgaagga 780
tagctagaat cttatttgtg tgggggtttg ttttgaatat gtttaatagg attcaagaag 840
aaagtttata tgggaggaga tgtcatatct ggagagatgg tggagagacg cttcacctaa 900
taaacaagaa gctttgacta aattggttaa ggatgggcag ctagagattg ttggaggtgg 960
ctgggttatg aatgatgagg ctaattcaca ttattttgcc ataattgaac agatagcaga 1020
gggtaatatg tggctgaatg acacaattgg ggttattcct aagaattctt gggctataga 1080
tccctttggc tattcatcaa ccatggctta tcttctccgg cgtatgggtt ttgaaaacat 1140
gcttattcaa aggactcatt acgagctcaa gaaagacctt gcccagcata agaatcttga 1200
atatatttgg cgtcagagct gggatgctat ggaaaccaca gatatctttg ttcatatgat 1260
gccgttttat tcatacgata tcccacacac ttgtggacca gagcctgcaa tttgctgtca 1320
gtttgatttc gctcggatgc ggggatttaa gtatgaactt tgtccatggg gaaagcaccc 1380
agtggagacc acactagaaa atgtgcagga gagggcatta aagcttctgg atcaatacag 1440
gaaaaaatcc actctatatc gaactaatac acttcttata cctcttggag atgattttag 1500
gtacattagt atcgatgaag ccgaggctca gttccgtaac taccagatgt tgtttgatca l560
catcaactct aatcctagtc taaacgcaga agcaaagttt ggtactttgg aggattattt 1620
cagaacagtc cgagaagaag cagacagagt gaattattct cgtcctggtg aggttggctc 1680
tggtcaggtt gttggtttcc cttctctgtc aggtgacttc tttacatatg cagataggca 1740
acaagactat tggagtggtt attatgtttc aagacctttc ttcaaagctg ttgatcgtgt 1800
gctcgagcat acccttcgtg gagctgagat catgatgtca tttctgctag gttattgcca 1860
tcgaattcaa tgtgagaaat ttccaacaag ttttacgtat aagttgactg ctgcaagaag 1920
aaatctggct cttttccagc accatgatgg ggtaactgga actgctaagg attatgtggt 1980
acaagattac ggcacccgga tgcatacttc attgcaagac cttcagatct ttatgtctaa 2040
agcaatcgaa gttcttcttg ggatccgcca cgagaaagaa aaatctgatc aatccccatc 2100
atttttcgag gcagagcaaa tgagatcaaa gtatgatgct cggccagttc acaagccaat 2160
tgctgcccgg gaaggaaatt cgcacacagt tatactcttc aatccatcag aacagacgag 2220
agaggaggtg gtgacggttg ttgttaaccg cgctgaaatc tcggttttgg actcaaactg 2280
gacttgtgtc cctagccaaa tttctcctga agtgcagcat gacgatacca aactattcac 2340
cggcagacat cgcctttact ggaaagcttc catcccagct cttggtctga gaacatattt 2400
cattgctaat gggaatgtcg agtgtgagaa agctactccg tctaaactca aatacgcttc 2460
tgagtttgac ccatttcctt gtcctcctcc atattcctgc tccaaactgg acaacgacgt 2520
tactgagatc cgaaatgaac atcagactct tgtgtttgat gtgaagaacg gatcactgcg 2580
gaagatagtc catagaaacg gatcagagac tgttgtggga gaagagatag gtatgtactc 2640
tagtccagag agtggagctt acctgttcaa accagatggt gaagctcagc caattgttca 2700
acctgatgga catgtagtca cctctgaggg tctgctggtt caagaagtct tctcttaccc 2760
taaaaccaaa tgggagaaat cacccctctc tcagaaaact cgtctttaca ctggaggtaa 2820
tacgcttcag gatcaagtgg tcgagataga atatcatgtt gagcttcttg gtaatgattt 2880
tgatgaccgg gaattgattg tccggtacaa gactgatgtt gacaacaaga aggtcttcta 2940
ttcagatctc aatggtttcc aaatgagcag gagagaaact tatgataaga tccctcttca 3000
aggaaactac tacccaatgc catctctcgc atttatccaa ggatccaatg gtcagagatt 3060
ctccgtgcac tctcgtcaat ctctcggtgt tgcaagcctc aaagagggtt ggttggagat 3120
tatgctggac agacggttgg ttcgtgatga cggacggggt ctagggcaag gtgtgatgga 3180
taaccgcgca atgaccgtgg tatttcacct tcttgcggaa tctaacattt ctcaagcaga 3240
ccctgcttcc aacactaacc cgaggaaccc ttcgcttctc tctcacctca taggtgctca 3300
cttaaactac cccataaaca cattcattgc caagaaaccg caagacatat ctgtgcgtgt 3360
tccacaatac ggttcctttg ctcctttagc caaaccgtta ccatgtgacc tccacattgt 3420
aaatttcaag gttcctcgtc catccaaata ctctcagcaa ttggaagaag acaagccaag 3480
gttcgctctt atcctcaata gacgagcttg ggattcagct tattgccata aaggaagaca 3540
agtaaactgc acaagcatgg ctaatgaacc agtaaacttt tccgacatgt tcaaagatct 3600
tgcagcttca aaggtaaaac caacttcact gaatctcttg caagaagata tggagattct 3660
tgggtacgat gaccaagagc tacctcgaga tagttcacag ccacgggaag gacgtgtctc 3720
gatctctccc atggaaatac gagcttataa gcttgaactg cgacctcaca agtgaacctg 3780
ctgaagatc 3789
<210>41
<211>2145
<212>DNA
<213>杂合体
<400>41
ggcgcgcctc gaggcgatcg cagatctcat tataccgtta gaagcatagt taaaatctaa 60
agcttgtcgt taattctagt cattttacat tgttgggttc tacattatta atgaattttc 120
taatgcaaat acagaattta aatcaaaatt gttgaattat gctaaacatg taacatacgt 180
atatctccgc cttgtgtgtt gtattaactt gaagttatca taagaaccac aaatacacta 240
gtaaatctat gagaaggcag gtggcaacac aaacaagagt atctaagatt ttcatttgtg 300
actataggaa tataatatct cttatctgat ttaatgaatc cacatgttca cttctcattt 360
gtccacaaga tcacaacttt atcttcaata ttcacaactt gttatatcca ccacaatttc 420
attcttttca cttagcccca caaaatactt tgtcccctta tttgccacct tttgtattta 480
atttattctt gtggagctaa gtgttcatat tattcttctt ctcaaaaaaa caaaaacaaa 540
aaaaaagaga agaaaaccat ggcgagaggg agcagatcag tgggtagcag cagcagcaaa 600
tggaggtact gcaacccttc ctattacttg aagcgcccaa agcgtcttgc tctgctcttc 660
atcgttttcg tttgtgtctc tttcgttttc tgggaccgtc aaactctcgt cagagagcac 720
caggttgaaa tttctgagct gcagadagaa gtgactgatt tgaaaaattt ggtggatgat 780
ttaaataaca aacaaggtgg tacctctggg aaaactgact tggggaccat ggctctaagg 840
ttgcatagaa ggaaccattt ttcgcctaga aatacggatc tgttcccgga tttggcaaaa 900
gatcgtgtgg ttatcgtctt gtatgtgcat aatcgggctc agtattttcg agtcacagtg 960
gaaagtttgt cgaaggttaa aggtataagt gagacattgt tgattgttag tcatgatggt 1020
tactttgaag agatgaatag gattgtggag agtattaagt tttgtcaagt gaaacagatt 1080
ttctcgcctt attcgcctca tatatatcgt actagcttcc cgggtgtgac cctgaatgat 1140
tgtaagaaca agggtgatga ggcaaagggg cattgtgaag gtaatcctga tcagtatggg 1200
aatcatcggt ctccgaagat tgtatctttg aagcatcact ggtggtggat gatgaacact 1260
gtatgggatg ggttggaaga gactaaagga catgaggggc atatcctttt cattgaagaa 1320
gatcattttc tgtttcctaa tgcctatcgt aacatacaga ctcttacgag gctgaaaccc 1380
gcaaagtgtc ctgactgttt tgctgctaat ttagcaccgt ctgatgtgaa gtcaagagga 1440
gaagggcttg aaagtttggt tgcagagaga atgggaaatg ttgggtattc ttttaataga 1500
agtgtgtggg agaatattca tcagaaggca agagagtttt gtttctttga tgattacaac 1560
tgggatataa cgatgtgggc aacggttttc ccgtcgtttg gttccccggt gtacacattg 1620
cgagggccta ggactagtgc ggtacacttt ggaaaatgtg ggttgcatca aggtagagga 1680
gatgagggtg attgcatcga taatggggtc gtaaacatag aagttaagga aacagataaa 1740
gttgtgaaca taaaagaagg atggggagtt cgggtgtata agcatcaagc gggttataaa 1800
gccggtttcg aaggttgggg aggttggggc gatgataggg accgacattt atgtttggat 1860
tttgccacta tgtatcgtta cagcagtagc agtgcatctc catgaaacgg atccgctaga 1920
gtccgcaaaa atcaccagtc tctctctaca aatctatctc tctctatttt tctccagaat 1980
aatgtgtgag tagttcccag ataagggaat tagggttctt atagggtttc gctcatgtgt 2040
tgagcatata agaaaccctt agtatgtatt tgtatttgta aaatacttct atcaataaaa 2100
tttctaatcc taaaaccaaa atcccgcgag agacctctta attaa 2145
<210>42
<211>541
<212>DNA
<213>Solanum tuberosum
<400>42
agatctcatt ataccgttag aagcatagtt aaaatctaaa gcttgtcgtt aattctagtc 60
attttacatt gttgggttct acattattaa tgaattttct aatgcaaata cagaatttaa 120
atcaaaattg ttgaattatg ctaaacatgt aacatacgta tatctccgcc ttgtgtgttg 180
tattaacttg aagttatcat aagaaccaca aatacactag taaatctatg agaaggcagg 240
tggcaacaca aacaagagta tctaagattt tcatttgtga ctataggaat ataatatctc 300
ttatctgatt taatgaatcc acatgttcac ttctcatttg tccacaagat cacaacttta 360
tcttcaatat tcacaacttg ttatatccac cacaatttca ttcttttcac ttagccccac 420
aaaatacttt gtccccttat ttgccacctt ttgtatttaa tttattcttg tggagctaag 480
tgttcatatt attcttcttc tcaaaaaaac aaaaacaaaa aaaaagagaa gaaaaccatg 540
g 541
<210>43
<211>1358
<212>DNA
<213>杂合体
<400>43
ccatggcgag agggagcaga tcagtgggta gcagcagcag caaatggagg tactgcaacc 60
cttcctatta cttgaagcgc ccaaagcgtc ttgctctgct cttcatcgtt ttcgtttgtg 120
tctctttcgt tttctgggac cgtcaaactc tcgtcagaga gcaccaggtt gaaatttctg 180
agctgcagaa agaagtgact gatttgaaaa atttggtgga tgatttaaat aacaaacaag 240
gtggtacctc tgggaaaact gacttgggga ccatggctct aaggttgcat agaaggaacc 300
atttttcgcc tagaaatacg gatctgttcc cggatttggc aaaagatcgt gtggttatcg 360
tcttgtatgt gcataatcgg gctcagtatt ttcgagtcac agtggaaagt ttgtcgaagg 420
ttaaaggtat aagtgagaca ttgttgattg ttagtcatga tggttacttt gaagagatga 480
ataggattgt ggagagtatt aagttttgtc aagtgaaaca gattttctcg ccttattcgc 540
ctcatatata tcgtactagc ttcccgggtg tgaccctgaa tgattgtaag aacaagggtg 600
atgaggcaaa ggggcattgt gaaggtaatc ctgatcagta tgggaatcat cggtctccga 660
agattgtatc tttgaagcat cactggtggt ggatgatgaa cactgtatgg gatgggttgg 720
aagagactaa aggacatgag gggcatatcc ttttcattga agaagatcat tttctgtttc 780
ctaatgccta tcgtaacata cagactctta cgaggctgaa acccgcaaag tgtcctgact 840
gttttgctgc taatttagca ccgtctgatg tgaagtcaag aggagaaggg cttgaaagtt 900
tggttgcaga gagaatggga aatgttgggt attcttttaa tagaagtgtg tgggagaata 960
ttcatcagaa ggcaagagag ttttgtttct ttgatgatta caactgggat ataacgatgt 1020
gggcaacggt tttcccgtcg tttggttccc cggtgtacac attgcgaggg cctaggacta 1080
gtgcggtaca ctttggaaaa tgtgggttgc atcaaggtag aggagatgag ggtgattgca 1140
tcgataatgg ggtcgtaaac atagaagtta aggaaacaga taaagttgtg aacataaaag 1200
aaggatgggg agttcgggtg tataagcatc aagcgggtta taaagccggt ttcgaaggtt 1260
ggggaggttg gggcgatgat agggaccgac atttatgttt ggattttgcc actatgtatc 1320
gttacagcag tagcagtgca tctccatgaa acggatcc 1358
<210>44
<211>237
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>44
ggatccgcta gagtccgcaa aaatcaccag tctctctcta caaatctatc tctctctatt 60
tttctccaga ataatgtgtg agtagttccc agataaggga attagggttc ttatagggtt 120
tcgctcatgt gttgagcata taagaaaccc ttagtatgta tttgtatttg taaaatactt 180
ctatcaataa aatttctaat cctaaaacca aaatcccgcg agagacctct taattaa 237
<210>45
<211>31
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>45
atactcgagt taacaatgag taaacggaat c 31
<210>46
<211>24
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>46
ttctcgatcg ccgattggtt attc 24
<210>47
<211>24
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>47
gccgccgcga tcgggcagtc ctcc 24
<210>48
<211>30
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>48
aacggatcca cgctagctcg gtgtcccgat 30
<210>49
<211>3327
<212>DNA
<213>杂合体
<400>49
atgggcatca agatggagac acattctcag gtctttgtat acatgttgct gtggttgtct 60
ggtgtcgaca tgaagcactt caaatcttcc ctcactcaca ccgtcaagag ccgagacgag 120
ccaactccgg atcaatgccc tgcattgaag gaaagcgaag cggacatcga caccgtggcg 180
atatacccaa cttttgattt tcagccgagc tggttgcgta caaaggaatt ttgggacaag 240
tccttcgagg atcggtatga aagaattcat aacgacacta cacggcctag actgaaggta 300
atcgtggttc ctcactcaca caacgacccg ggatggctga agacgtttga acagtacttc 360
gagtggaaga ccaagaacat tatcaacaac atagtgaaca aactgcacca gtaccccaac 420
atgaccttca tttggaccga gatatcgttt ctgaatgcct ggtgggaaag gtcgcaccct 480
gtcaaacaaa aggcattgaa aaaacttatc aaagaaggtc gtctcgagat cacgacgggc 540
ggctgggtga tgccggacga agcctgcacg catatctatg cgctaattga ccagtttatt 600
gaaggacatc actgggtgaa aactaatctc ggcgtcatcc cgaagacagg atggtctatt 660
gaccccttcg gccacggggc cactgtgcct tacctgctag accagagcgg ccttgaggga 720
accattatac agagaatcca ttatgcgtgg aaacagtggc tggcggagcg acagattgag 780
gagttttact ggctggcgag ttgggctact acgaagccgt ccatgatagt gcacaatcag 840
ccgtttgata tttattcaat aaaaagcacg tgtggcccgc acccttcaat ttgtctcagt 900
ttcgacttca ggaagattcc cggcgaatat tctgaataca cagctaagca cgaagacatc 960
acggaacaca acttgcacag caaggcaaag actttgatag aggagtacga ccgtatcggg 1020
tccctgactc cacacaacgt ggtgctggtg ccgctcggag acgacttcag atacgagtac 1080
agcgtcgagt ttgatgccca atacgtcaat tatatgaaaa tgtttaacta catcaatgct 1140
cacaaggaaa tcttcaacgc tgacgtacag ttcggaactc ctctcgatta ctttaacgcc 1200
atgaaagaaa gacatcaaaa tatacccagc ttaaagggag atttcttcgt ttactccgat 1260
attttcagcg aaggtaaacc agcgtactgg tcaggttact acactactag accctaccaa 1320
aaaatcctcg cccgtcagtt cgaacaccaa ctgcgatcgg cagagatttt attcaccctt 1380
gtatcgaact acatcagaca gatgggtcgc caaggagagt tcggagcttc tgagaaaaag 1440
ttagaaaaat cttacgagca gcttatctat gctcgacgga acttgggtct gtttcaacat 1500
cacgatgcga ttactggaac atcaaagtcc agtgtgatgc aagattacgg aaccaaactg 1560
ttcacaagtc tgtatcactg catccgcctg caggaggccg cgctcaccac catcatgttg 1620
cctgaccagt cgttgcactc gcagagcatt atacaaagcg aggttgagtg ggaaacttac 1680
ggaaaaccgc ccaagaagct gcaagtgtcc ttcattgaca agaagaaagt tatacttttt 1740
aatccgttgg ctgagactcg aactgaagtg gtcacggtta gatccaacac gtccaacatc 1800
cgggtgtacg atacacacaa gaggaagcac gtcttgtatc agataatgcc cagcatcaca 1860
atccaagaca acggcaagag tatcgtaagc gacaccacgt tcgacataat gttcgtggcc 1920
accatcccgc ccctcacctc catctcgtac aagctgcagg agcacaccaa cacttcccac 1980
cactgcgtca ttttctgcaa caactgcgaa caataccaga aatccaatgt gttccaaatt 2040
aagaaaatga tgcctggtga catacaatta gaaaatgcag tgctaaaact tctcgttaat 2100
aggaacaccg gctttctgag acaagtctat agaaaggaca tccggaagag aactgtcgtt 2160
gacgtacaat tcggcgcata tcaaagtgcc caaagacatt ctggtgctta cctcttcatg 2220
cctcattacg actcacctga gaagaatgtt ctgcatccct acactaatca gaacaacatg 2280
caagatgata acataatcat agtgtccgga cctatttcta cggaaatcac gaccatgtac 2340
ttgcccttct tggtgcacac tattaggata tacaacgtgc cggacccggt actgtcgcgt 2400
gctattctat tagagaccga tgtagatttc gaggcgccac ctaagaacag agagactgag 2460
ttatttatga gattacagac tgatatacaa aacggtgaca ttcccgaatt ttacaccgat 2520
cagaacggat tccagtacca aaagagggtc aaagtgaata aactaggaat agaagctaat 2580
tactacccga tcactaccat ggcgtgcctg caagacgagg agacccggct cactctgctg 2640
acgaaccacg ctcaaggcgc tgctgcatac gaaccaggac gcttagaagt catgctcgat 2700
cgtcgaactc tttatgatga cttcagagga atcggtgaag gagtagtcga taacaaaccg 2760
acgactttcc agaactggat tttaattgaa tccatgccag gcgtgacgcg agccaagaga 2820
gacactagtg aaccaggttt caaatttgtt aatgaacgtc gttttggccc cggccagaag 2880
gaaagccctt accaagtacc gtcgcagact gcggactacc tgagcaggat gttcaattac 2940
ccggtgaacg tgtacctggt ggacactagc gaggttggcg agatcgaggt gaagccgtac 3000
cagtcgttcc tgcagagctt cccgcccggc atccacctgg tcaccctgcg caccatcacc 3060
gacgacgtgc tcgaactctt ccccagcaac gaaagctaca tggtactgca ccgaccagga 3120
tacagctgcg ctgtcggaga gaagccagtc gccaagtctc ccaagttttc g tccaaaacc 3180
aggttcaatg gtctgaacat tcagaacatc actgcagtca gcctgaccggcctgaagtca 3240
ctccgacctc tcacaggtct gagtgacatc cacctgaacg ctatggaggt aaaaacttac 3300
aagatcaggt ttaaggacga gctttaa 3327
<210>50
<211>1108
<212>PRT
<213>杂合体
<400>50
Met Gly Ile Lys Met Glu Thr His Ser Gln Val Phe Val Tyr Met Leu
1 5 10 15
Leu Trp Leu Ser Gly Val Asp Met Lys His Phe Lys Ser Ser Leu Thr
20 25 30
His Thr Val Lys Ser Arg Asp Glu Pro Thr Pro Asp Gln Cys Pro Ala
35 40 45
Leu Lys Glu Ser Glu Ala Asp Ile Asp Thr Val Ala Ile Tyr Pro Thr
50 55 60
Phe Asp Phe Gln Pro Ser Trp Leu Arg Thr Lys Glu Phe Trp Asp Lys
65 70 75 80
Ser Phe Glu Asp Arg Tyr Glu Arg Ile His Asn Asp Thr Thr Arg Pro
85 90 95
Arg Leu Lys Val Ile Val Val Pro His Ser His Asn Asp Pro Gly Trp
100 105 110
Leu Lys Thr Phe Glu Gln Tyr Phe Glu Trp Lys Thr Lys Asn Ile Ile
115 120 125
Asn Asn Ile Val Asn Lys Leu His Gln Tyr Pro Asn Met Thr Phe Ile
130 135 140
Trp Thr Glu Ile Ser Phe Leu Asn Ala Trp Trp Glu Arg Ser His Pro
145 150 155 160
Val Lys Gln Lys Ala Leu Lys Lys Leu Ile Lys Glu Gly Arg Leu Glu
165 170 175
Ile Thr Thr Gly Gly Trp Val Met Pro Asp Glu Ala Cys Thr His Ile
180 185 190
Tyr Ala Leu Ile Asp Gln Phe Ile Glu Gly His His Trp Val Lys Thr
195 200 205
Asn Leu Gly Val Ile Pro Lys Thr Gly Trp Ser Ile Asp Pro Phe Gly
210 215 220
His Gly Ala Thr Val Pro Tyr Leu Leu Asp Gln Ser Gly Leu Glu Gly
225 230 235 240
Thr Ile Ile Gln Arg Ile His Tyr Ala Trp Lys Gln Trp Leu Ala Glu
245 250 255
Arg Gln Ile Glu Glu Phe Tyr Trp Leu Ala Ser Tro Ala Thr Thr Lys
260 265 270
Pro Ser Met Ile Val His Asn Gln Pro Phe Asp Ile Tyr Ser Ile Lys
275 280 285
Ser Thr Cys Gly Pro His Pro Ser Ile Cys Leu Ser Phe Asp Phe Arg
290 295 300
Lys Ile Pro Gly Glu Tyr Ser Glu Tyr Thr Ala Lys His Glu Asp Ile
305 310 315 320
Thr Glu His Asn Leu His Ser Lys Ala Lys Thr Leu Ile Glu Glu Tyr
325 330 335
Asp Arg Ile Gly Ser Leu Thr Pro His Asn Val Val Leu Val Pro Leu
340 345 350
Gly Asp Asp Phe Arg Tyr Glu Tyr Ser Val Glu Phe Asp Ala Gln Tyr
355 360 365
Val Asn Tyr Met Lys Met Phe Asn Tyr Ile Asn Ala His Lys Glu Ile
370 375 380
Phe Asn Ala Asp Val Gln Phe Gly Thr Pro Leu Asp Tyr Phe Asn Ala
385 390 395 400
Met Lys Glu Arg His Gln Asn Ile Pro Ser Leu Lys Gly Asp Phe Phe
405 410 415
Val Tyr Ser Asp Ile Phe Ser Glu Gly Lys Pro Ala Tyr Trp Ser Gly
420 425 430
Tyr Tyr Thr Thr Arg Pro Tyr Gln Lys Ile Leu Ala Arg Gln Phe Glu
435 440 445
His Gln Leu Arg Ser Ala Glu Ile Leu Phe Thr Leu Val Ser Asn Tyr
450 455 460
Ile Arg Gln Met Gly Arg Gln Gly Glu Phe Gly Ala Ser Glu Lys Lys
465 470 475 480
Leu Glu Lys Ser Tyr Glu Gln Leu Ile Tyr Ala Arg Arg Asn Leu Gly
485 490 495
Leu Phe Gln His His Asp Ala Ile Thr Gly Thr Ser Lys Ser Ser Val
500 505 510
Met Gln Asp Tyr Gly Thr Lys Leu Phe Thr Ser Leu Tyr His Cys Ile
515 520 525
Arg Leu Gln Glu Ala Ala Leu Thr Thr Ile Met Leu Pro Asp Gln Ser
530 535 540
Leu His Ser Gln Ser Ile Ile Gln Ser Glu Val Glu Trp Glu Thr Tyr
545 550 555 560
Gly Lys Pro Pro Lys Lys Leu Gln Val Ser Phe Ile Asp Lys Lys Lys
565 570 575
Val Ile Leu Phe Asn Pro Leu Ala Glu Thr Arg Thr Glu Val Val Thr
580 585 590
Val Arg Ser Asn Thr Ser Asn Ile Arg Val Tyr Asp Thr His Lys Arg
595 600 605
Lys His Val Leu Tyr Gln Ile Met Pro Ser Ile Thr Ile Gln Asp Asn
610 615 620
Gly Lys Ser Ile Val Ser Asp Thr Thr Phe Asp Ile Met Phe Val Ala
625 630 635 640
Thr Ile Pro Pro Leu Thr Ser Ile Ser Tyr Lys Leu Gln Glu His Thr
645 650 655
Asn Thr Ser His His Cys Val Ile Phe Cys Asn Asn Cys Glu Gln Tyr
660 665 670
Gln Lys Ser Asn Val Phe Gln Ile Lys Lys Met Met Pro Gly Asp Ile
675 680 685
Gln Leu Glu Asn Ala Val Leu Lys Leu Leu Val Asn Arg Asn Thr Gly
690 695 700
Phe Leu Arg Gln Val Tyr Arg Lys Asp Ile Arg Lys Arg Thr Val Val
705 710 715 720
Asp Val Gln Phe Gly Ala Tyr Gln Ser Ala Gln Arg His Ser Gly Ala
725 730 735
Tyr Leu Phe Met Pro His Tyr Asp Ser Pro Glu Lys Asn Val Leu His
740 745 750
Pro Tyr Thr Asn Gln Asn Asn Met Gln Asp Asp Asn Ile Ile Ile Val
755 760 765
Ser Gly Pro Ile Ser Thr Glu Ile Thr Thr Met Tyr Leu Pro Phe Leu
770 775 780
Val His Thr Ile Arg Ile Tyr Asn Val Pro Asp Pro Val Leu Ser Arg
785 790 795 800
Ala Ile Leu Leu Glu Thr Asp Val Asp Phe Glu Ala Pro Pro Lys Asn
805 810 815
Arg Glu Thr Glu Leu Phe Met Arg Leu Gln Thr Asp Ile Gln Asn Gly
820 825 830
Asp Ile Pro Glu Phe Tyr Thr Asp Gln Asn Gly Phe Gln Tyr Gln Lys
835 840 845
Arg Val Lys Val Asn Lys Leu Gly Ile Glu Ala Asn Tyr Tyr Pro Ile
850 855 860
Thr Thr Met Ala Cys Leu Gln Asp Glu Glu Thr Arg Leu Thr Leu Leu
865 870 875 880
Thr Asn His Ala Gln Gly Ala Ala Ala Tyr Glu Pro Gly Arg Leu Glu
885 890 895
Val Met Leu Asp Arg Arg Thr Leu Tyr Asp Asp Phe Arg Gly Ile Gly
900 905 910
Glu Gly Val Val Asp Asn Lys Pro Thr Thr Phe Gln Asn Trp Ile Leu
915 920 925
Ile Glu Ser Met Pro Gly Val Thr Arg Ala Lys Arg Asp Thr Ser Glu
930 935 940
Pro Gly Phe Lys Phe Val Asn Glu Arg Arg Phe Gly Pro Gly Gln Lys
945 950 955 960
Glu Ser Pro Tyr Gln Val Pro Ser Gln Thr Ala Asp Tyr Leu Ser Arg
965 970 975
Met Phe Asn Tyr Pro Val Asn Val Tyr Leu Val Asp Thr Ser Glu Val
980 985 990
Gly Glu Ile Glu Val Lys Pro Tyr Gln Ser Phe Leu Gln Ser Phe Pro
995 1000 1005
Pro Gly Ile His Leu Val Thr Leu Arg Thr Ile Thr Asp Aso Val
1010 1015 1020
Leu Glu Leu Phe Pro Ser Asn Glu Ser Tyr Met Val Leu His Arg
1025 1030 1035
Pro Gly Tyr Ser Cys Ala Val Gly Glu Lys Pro Val Ala Lys Ser
1040 1045 1050
Pro Lys Phe Ser Ser Lys Thr Arg Phe Asn Gly Leu Asn Ile Gln
1055 1060 1065
Asn Ile Thr Ala Val Ser Leu Thr Gly Leu Lys Ser Leu Arg Pro
1070 1075 1080
Leu Thr Gly Leu Ser Asp Ile His Leu Asn Ala Met Glu Val Lys
1085 1090 1095
Thr Tyr Lys Ile Arg Phe Lys Asp Glu Leu
1100 1105
<210>51
<211>1068
<212>DNA
<213>杂合体
<400>51
atgggcatca agatggagac acattctcag gtctttgtat acatgttgct gtggttgtct 60
ggtgtcgaca tgcagtcctc cggggagctc cggaccggag gggcccggcc gccgcctcct 120
ctaggcgcct cctcccagcc gcgcccgggt ggcgactcca gcccagtcgt ggattctggc 180
cctggccccg ctagcaactt gacctcggtc ccagtgcccc acaccaccgc actgtcgctg 240
cccgcctgcc ctgaggagtc cccgctgctt gtgggcccca tgctgattga gtttaacatg 300
cctgtggacc tggagctcgt ggcaaagcag aacccaaatg tgaagatggg cggccgctat 360
gcccccaggg actgcgtctc tcctcacaag gtggccatca tcattccatt ccgcaaccgg 420
caggagcacc tcaagtactg gctatattat ttgcacccag tcctgcagcg ccagcagctg 480
gactatggca tctatgttat caaccaggcg ggagacacta tattcaatcg tgctaagctc 540
ctcaatgttg gctttcaaga agccttgaag gactatgact acacctgctt tgtgtttagt 600
gacgtggacc tcattccaat gaatgaccat aatgcgtaca ggtgtttttc acagccacgg 660
cacatttccg ttgcaatgga taagtttgga ttcagcctac cttatgttca gtattttgga 720
ggtgtctctg ctctaagtaa acaacagttt ctaaccatca atggatttcc taataattat 780
tggggctggg gaggagaaga tgatgacatt tttaacagat tagtttttag aggcatgtct 840
atatctcgcc caaatgctgt ggtcgggagg tgtcgcatga tccgccactc aagagacaag 900
aaaaatgaac ccaatcctca gaggtttgac cgaattgcac acacaaagga gacaatgctc 960
tctgatggtt tgaactcact cacctaccag gtgctggatg tacagagata cccattgtat 1020
acccaaatca cagtggacat cgggacaccg agcaaggacg agctttag 1068
<210>52
<211>355
<212>PRT
<213>杂合体
<400>52
Met Gly Ile Lys Met Glu Thr His Ser Gln Val Phe Val Lyr Met Leu
1 5 10 15
Leu Trp Leu Ser Gly Val Asp Met Gln Ser Ser Gly Glu Leu Arg Thr
20 25 30
Gly Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg
35 40 45
Pro Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala
50 55 60
Ser Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu
65 70 75 80
Pro Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile
85 90 95
Glu Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro
100 105 110
Asn Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro
115 120 125
His Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu
130 135 140
Lys Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu
145 150 155 160
Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr Ile Phe Asn
165 170 175
Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp Tyr
180 185 190
Asp Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asn
195 200 205
Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser Val
210 215 220
Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln Tyr Phe Gly
225 230 235 240
Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly Phe
245 250 255
Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn
260 265 270
Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Val Val
275 280 285
Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu Pro
290 295 300
Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met Leu
305 310 315 320
Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln Arg
325 330 335
Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser Lys
340 345 350
Asp Glu Leu
355
<210>53
<211>1119
<212>DNA
<213>杂合体
<400>53
atgggcatca agatggagac acattctcag gtctttgtat acatgttgct gtggttgtct 60
ggtgtcgaca tgggacagat gcctgtggct gctgtagtgg ttatggcctg cagtcgtgca 120
gactatcttg aaaggactgt taaatcagtt ttaacatatc aaactcccgt tgcttcaaaa 180
tatcctctat ttatatctca ggatggatct gatcaagctg tcaagagcaa gtcattgagc 240
tataatcaat taacatatat gcagcacttg gattttgaac cagtggtcac tgaaaggcct 300
ggcgaactga ctgcgtacta caagattgca cgtcactaca agtgggcact ggaccagttg 360
ttttacaaac acaaatttag tcgagtgatt atactagaag atgatatgga aattgctcca 420
gacttctttg attactttga ggctgcagct agtctcatgg atagggataa aaccattatg 480
gctgcttcat catggaatga taatggacag aagcagtttg tgcatgatcc ctatgcgcta 540
taccgatcag atttttttcc tggccttggg tggatgctca agagatcgac ttgggatgag 600
ttatcaccaa agtggccaaa ggcttactgg gatgattggc tgagactaaa ggaaaaccat 660
aaaggccgcc aattcattcg accggaagtc tgtagaacat acaattttgg tgaacatggg 720
tctagtttgg gacagttttt cagtcagtat ctggaaccta taaagctaaa cgatgtgacg 780
gttgactgga aagcaaagga cctgggatac ctgacagagg gaaactatac caagtacttt 840
tctggcttag tgagacaagc acgaccaatt caaggttctg accttgtctt aaaggctcaa 900
aacataaagg atgatgttcg tatccggtat aaagaccaag tagagtttga acgcattgca 960
ggggaatttg gtatatttga agaatggaag gatggtgtgc ctcgaacagc atataaagga 1020
gtagtggtgt ttcgaatcca gacaacaaga cgtgtattcc tggttgggcc agattctgta 1080
atgcagcttg gaattcgaaa ttccaaggac gagctttga 1119
<210>54
<211>372
<212>PRT
<213>杂合体
<400>54
Met Gly Ile Lys Met Glu Thr His Ser Gln Val Phe Val Tyr Met Leu
1 5 10 15
Leu Trp Leu Ser Gly Val Asp Met Gly Gln Met Pro Val Ala Ala Val
20 25 30
Val Val Met Ala Cys Ser Arg Ala Asp Tyr Leu Glu Arg Thr Val Lys
35 40 45
Ser Val Leu Thr Tyr Gln Thr Pro Val Ala Ser Lys Tyr Pro Leu Phe
50 55 60
Ile Ser Gln Asp Gly Ser Asp Gln Ala Val Lys Ser Lys Ser Leu Ser
65 70 75 80
Tyr Asn Gln Leu Thr Tyr Met Gln His Leu Asp Phe Glu Pro Val Val
85 90 95
Thr Glu Arg Pro Gly Glu Leu Thr Ala Tyr Tyr Lys Ile Ala Arg His
100 105 110
Tyr Lys Trp Ala Leu Asp Gln Leu Phe Tyr Lys His Lys Phe Ser Arg
115 120 125
Val Ile Ile Leu Glu Asp Asp Met Glu Ile Ala Pro Asp Phe Phe Asp
130 135 140
Tyr Phe Glu Ala Ala Ala Ser Leu Met Asp Arg Asp Lys Thr Ile Met
145 150 155 160
Ala Ala Ser Ser Trp Asn Asp Asn Gly G1n Lys Gln Phe Val His Asp
165 170 175
Pro Tyr Ala Leu Tyr Arg Ser Asp Phe Phe Pro Gly Leu Gly Trp Met
180 185 190
Leu Lys Arg Ser Thr Trp Asp Glu Leu Ser Pro Lys Trp Pro Lys Ala
195 200 205
Tyr Trp Asp Asp Trp Leu Arg Leu Lys Glu Asn His Lys Gly Arg Gln
210 215 220
Phe Ile Arg Pro Glu Val Cys Arg Thr Tyr Asn Phe Gly Glu His Gly
225 230 235 240
Ser Ser Leu Gly Gln Phe Phe Ser Gln Tyr Leu Glu Pro Ile Lys Leu
245 250 255
Asn Asp Val Thr Val Asp Trp Lys Ala Lys Asp Leu Gly Tyr Leu Thr
260 265 270
Glu Gly Asn Tyr Thr Lys Tyr Phe Ser Gly Leu Val Arg Gln Ala Arg
275 280 285
Pro Ile Gln Gly Ser Asp Leu Val Leu Lys Ala Gln Asn Ile Lys Asp
290 295 300
Asp Val Arg Ile Arg Tyr Lys Asp Gln Val Glu Phe Glu Arg Ile Ala
305 310 315 320
Gly Glu Phe Gly Ile Phe Glu Glu Trp Lys Asp Gly Val Pro Arg Thr
325 330 335
Ala Tyr Lys Gly Val Val Val Phe Arg Ile Gln Thr Thr Arg Arg Val
340 345 350
Phe Leu Val Gly Pro Asp Ser Val Met Gln Leu Gly Ile Arg Asn Ser
355 360 365
Lys Asp Glu Leu
370
<210>55
<211>1158
<212>DNA
<213>杂合体
<400>55
atgggcatca agatggagac acattctcag gtctttgtat acatgttgct gtggttgtct 60
ggtgtcgaca tggctctaag gttgcataga aggaaccatt tttcgcctag aaatacggat 120
ctgttcccgg atttggcaaa agatcgtgtg gttatcgtct tgtatgtgca taatcgggct 180
cagtattttc gagtcacagt ggaaagtttg tcgaaggtta aaggtataag tgagacattg 240
ttgattgtta gtcatgatgg ttactttgaa gagatgaata ggattgtgga gagtattaag 300
ttttgtcaag tgaaacagat tttctcgcct tattcgcctc atatatatcg tactagcttc 360
ccgggtgtga ccctgaatga ttgtaagaac aagggtgatg aggcaaaggg gcattgtgaa 420
ggtaatcctg atcagtatgg gaatcatcgg tctccgaaga ttgtatcttt gaagcatcac 480
tggtggtgga tgatgaacac tgtatgggat gggttggaag agactaaagg acatgagggg 540
catatccttt tcattgaaga agatcatttt ctgtttccta atgcctatcg taacatacag 600
actcttacga ggctgaaacc cgcaaagtgt cctgactgtt ttgctgctaa tttagcaccg 660
tctgatgtga agtcaagagg agaagggctt gaaagtttgg ttgcagagag aatgggaaat 720
gttgggtatt cttttaatag aagtgtgtgg gagaatattc atcagaaggc aagagagttt 780
tgtttctttg atgattacaa ctgggatata acgatgtggg caacggtttt cccgtcgttt 840
ggttccccgg tgtacacatt gcgagggcct aggactagtg cggtacactt tggaaaatgt 900
gggttgcatc aaggtagagg agatgagggt gattgcatcg ataatggggt cgtaaacata 960
gaagttaagg aaacagataa agttgtgaac ataaaagaag gatggggagt tcgggtgtat 1020
aagcatcaag cgggttataa agccggtttc gaaggttggg gaggttgggg cgatgatagg 1080
gaccgacatt tatgtttgga ttttgccact atgtatcgtt acagcagtag cagtgcatct 1140
ccaaaggacg agctttga 1158
<210>56
<211>385
<212>PRT
<213>杂合体
<400>56
Met Gly Ile Lys Met Glu Thr His Ser Gln Val Phe Val Tyr Met Leu
1 5 10 15
Leu Trp Leu Ser Gly Val Asp Met Ala Leu Arg Leu His Arg Arg Asn
20 25 30
His Phe Ser Pro Arg Asn Thr Asp Leu Phe Pro Asp Leu Ala Lys Asp
35 40 45
Arg Val Val Ile Val Leu Tyr Val His Asn Arg Ala Gln Tyr Phe Arg
50 55 60
Val Thr Val Glu Ser Leu Ser Lys Val Lys Gly Ile Ser Glu Thr Leu
65 70 75 80
Leu Ile Val Ser His Asp Gly Tyr Phe Glu Glu Met Asn Arg Ile Val
85 90 95
Glu Ser Ile Lys Phe Cys Gln Val Lys Gln Ile Phe Ser Pro Tyr Ser
100 105 110
Pro His Ile Tyr Arg Thr Ser Phe Pro Gly Val Thr Leu Asn Asp Cys
115 120 125
Lys Asn Lys Gly Asp Glu Ala Lys Gly His Cys Glu Gly Asn Pro Asp
130 135 140
Gln Tyr Gly Asn His Arg Ser Pro Lys Ile Val Ser Leu Lys His His
145 150 155 160
Trp Trp Trp Met Met Asn Thr Val Trp Asp Gly Leu Glu Glu Thr Lys
165 170 175
Gly His Glu Gly His Ile Leu Phe Ile Glu Glu Asp His Phe Leu Phe
180 185 190
Pro Asn Ala Tyr Arg Asn Ile Gln Thr Leu Thr Arg Leu Lys Pro Ala
195 200 205
Lys Cys Pro Asp Cys Phe Ala Ala Asn Leu Ala Pro Ser Asp Val Lys
210 215 220
Sar Arg Gly Glu Gly Leu Glu Ser Leu Val Ala Glu Arg Met Gly Asn
225 230 235 24D
Va1 Gly Tyr Ser Phe Asn Arg Ser Val Trp Glu Asn Ile His Gln Lys
245 250 255
Ala Arg Glu Phe Cys Phe Phe Asp Asp Tyr Asn Trp Asp Ile Thr Met
260 265 270
Trp Ala Thr Val Phe Pro Ser Phe Gly Ser Pro Val Tyr Thr Leu Arg
275 280 285
Gly Pro Arg Thr Ser Ala Val His Phe Gly Lys Cys Gly Leu His Gln
290 295 300
Gly Arg Gly Asp Glu Gly Asp Cys Ile Asp Asn Gly Val Val Asn Ile
305 310 315 320
Glu Val Lys Glu Thr Asp Lys Val Val Asn Ile Lys Glu Gly Trp Gly
325 330 335
Val Arg Val Tyr Lys His Gln Ala Gly Tyr Lys Ala Gly Phe Glu Gly
340 345 350
Trp Gly Gly Trp Gly Asp Asp Arg Asp Arg His Leu Cys Leu Asp Phe
355 360 365
Ala Thr Met Tyr Arg Tyr Ser Ser Ser Ser Ala Ser Pro Lys Asp Glu
370 375 380
Leu
385
<210>57
<211>1152
<212>DNA
<213>类人
<400>57
atgctgaaga agcagtctgc agggcttgtg ctgtggggcg ctatcctctt tgtggcctgg 60
aatgccctgc tgctcctctt cttctggacg cgcccagcac ctggcaggcc accctcagtc 120
agcgctctcg atggcgaccc cgccagcctc acccgggaag tcgacatgca gtcctccggg 160
gagctccgga ccggaggggc ccggccgccg cctcctctag gcgcctcctc ccagccgcgc 240
ccgggtggcg actccagccc agtcgtggat tctggccctg gccccgctag caacttgacc 300
tcggtcccag tgccccacac caccgcactg tcgctgcccg cctgccctga ggagtccccg 360
ctgcttgtgg gccccatgct gattgagttt aacatgcctg tggacctgga gctcgtggca 420
aagcagaacc caaatgtgaa gatgggcggc cgctatgccc ccagggactg cgtctctcct 480
cacaaggtgg ccatcatcat tccattccgc aaccggcagg agcacctcaa gtactggcta 540
tattatttgc acccagtcct gcagcgccag cagctggact atggcatcta tgttatcaac 600
caggcgggag acactatatt caatcgtgct aagctcctca atgttggctt tcaagaagcc 660
ttgaaggact atgactacac ctgctttgtg tttagtgacg tggacctcat tccaatgaat 720
gaccataatg cgtacaggtg tttttcacag ccacggcaca tttccgttgc aatggataag 780
tttggattca gcctacctta tgttcagtat tttggaggtg tctctgctct aagtaaacaa 840
cagtttctaa ccatcaatgg atttcctaat aattattggg gctggggagg agaagatgat 900
gacattttta acagattagt ttttagaggc atgtctatat ctcgcccaaa tgctgtggtc 960
gggaggtgtc gcatgatccg ccactcaaga gacaagaaaa atgaacccaa tcctcagagg 1020
tttgaccgaa ttgcacacac aaaggagaca atgctctctg atggtttgaa ctcactcacc 1080
taccaggtgc tggatgtaca gagataccca ttgtataccc aaatcacagt ggacatcggg 1140
acaccgagct ag 1152
<210>58
<211>383
<212>PRT
<213>类人
<400>58
Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Leu
1 5 10 15
Phe Val Ala Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Thr Arg Pro
20 25 30
Ala Pro Gly Arg Pro Pro Ser Val Ser Ala Leu Asp Gly Asp Pro Ala
35 40 45
Ser Leu Thr Arg Glu Val Asp Met Gln Ser Ser Gly Glu Leu Arg Thr
50 55 60
Gly Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg
65 70 75 80
Pro Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala
85 90 95
Ser Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu
100 105 110
Pro Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile
115 120 125
Glu Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro
130 135 140
Asn Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro
145 150 155 160
His Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu
165 170 175
Lys Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu
180 185 190
Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr Ile Phe Asn
195 200 205
Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp Tyr
210 215 220
Asp Tyr Thr Cys Phe Va1 Phe Ser Asp Val Asp Leu Ile Pro Met Asn
225 230 235 240
Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser Val
245 250 255
Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln Tyr Phe Gly
260 265 270
Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly Phe
275 280 285
Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn
290 295 300
Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Val Val
305 310 315 320
Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu Pro
325 330 335
Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met Leu
340 345 350
Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln Arg
355 360 365
Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser
370 375 380
<210>59
<211>400
<212>PRT
<213>类人
<400>59
Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ala Ala Met Pro Gly AIa
1 5 10 15
Ser Leu Gln Arg Ala Cys Arg Leu Leu Val Ala Val Cys Ala Leu His
20 25 30
Leu Gly Val Thr Leu Val Tyr Tyr Leu Ala Gly Arg Asp Leu Ser Arg
35 40 45
Leu Pro Gln Leu Val Gly Val Ser Thr Pro Leu Gln Gly Gly Ser Asn
50 55 60
Ser Ala Ala Ala Ile Gly Gln Ser Ser Gly Glu Leu Arg Thr Gly Gly
65 70 75 80
Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg Pro Gly
85 90 95
Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala Ser Asn
100 105 110
Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu Pro Ala
115 120 125
Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile Glu Phe
130 135 140
Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro Asn Val
145 150 155 160
Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro His Lys
165 170 175
Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu Lys Tyr
180 185 190
Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu Asp Tyr
195 200 205
Gly Ile Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr Ile Phe
210 215 220
Asn Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp
225 230 235 240
Tyr Asp Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met
245 250 255
Asn Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser
260 265 270
Val Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln Tyr Phe
275 280 285
Gly Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly
290 295 300
Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe
305 310 315 320
Asn Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Val
325 330 335
Val Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu
340 345 350
Pro Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met
355 360 365
Leu Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln
370 375 380
Arg Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser
385 390 395 400