CN1756844A

CN1756844A - 在植物中优化聚糖生成

Info

Publication number: CN1756844A
Application number: CNA038065479A
Authority: CN
Inventors: H·A·C·巴克; D·E·A·弗洛拉克; H·J·博斯; G·J·A·鲁文德尔
Original assignee: Plant Research International BV
Current assignee: Plant Research International BV
Priority date: 2002-03-19
Filing date: 2003-03-18
Publication date: 2006-04-05
Anticipated expiration: 2023-03-18
Also published as: KR20110079860A; US20100122365A1; KR101196023B1; EP1485486A2; EP1959018B1; EP2339004A1; JP2009232858A; CA2923247A1; EP1959018A1; US7601891B2; AU2003219418B2; JP2005535291A; CA2478297C; EP2339004B1; KR101060361B1; JP2014221077A; CA2799805A1; US20060253928A1; CA2799805C; AR039013A1

Abstract

本发明涉及优化生物体(特别是植物中)的聚糖生成方法，以获得具有复合型双触角聚糖的糖蛋白，并且在双臂上含有5半乳糖残基而不含有(或减少)木糖和海藻糖。本发明还涉及获得的所述糖蛋白和含有所述蛋白的宿主系统。

Description

在植物中优化聚糖生成

发明领域

本发明涉及用于优化含有N-聚糖的糖蛋白的细胞或生物体，特别是植物的聚糖生成方法，从而得到一种糖蛋白，其具有高甘露糖型的N-聚糖，杂合型或优选复合型的N-聚糖，包括但不限于双触角N-聚糖，并在N-聚糖的至少一个臂上含有半乳糖残基，不含有(或者减少)木糖和海藻糖残基。本发明还涉及得到的所述糖蛋白和特别是含有该蛋白的植物宿主系统。

发明背景

N-联聚糖(N-Linked glycans)是连接到糖蛋白的天冬酰胺残基上的特定寡糖结构，能够显著地影响蛋白质的性质，进而影响生物体的特性。植物蛋白具有N-联聚糖，但是极其不同于哺乳动物，它们所影响的生物学过程几乎是未知的。

N-联聚糖的生物生成起始于脂联寡糖成分(Glc3Man9GlcNAc2-)的合成，该成分全部被转移给内质网(ER)中的新生多肽链。通过内质网和顺式高尔基体区室中的一系列外切糖苷酶的修剪(trimming)，形成所谓的“高甘露糖”型聚糖(由Man9GlcNAc2变成Man5GlcNAc2)。随后，由GnTI将第一个GlcNAc转移到Man5GlcNAc2，接着通过甘露糖苷酶II(ManII)修剪来形成GlcNAcMan3GlcNAc2，开始形成复合型聚糖。当在一些其他的糖基转移酶的作用下，通过分泌路径在高尔基体中由GnTII将第二个GlcNAc残基以及其他单糖残基转移到GlcNAcMan3GlcNAc2上，继续复合型聚糖的生物合成。

植物和哺乳动物在复合聚糖形成方面是不同的(见附图1，比较植物和哺乳动物中的糖蛋白的糖基化路径)。在植物中，复合型聚糖的特征在于存在连接到Man-3的β(1，2)-木糖残基和/或连接到GlcNAc-1的α(1，3)-海藻糖残基，不具有连接到GlcNAc-l的α(1，6)-海藻糖残基。编码相应的木糖基(XylT)和海藻糖基(FucT)转移酶的基因已经被分离[Strasser等，“拟南芥β1，2-木糖基转移酶cDNA的分子克隆和功能性表达”，FEBS Lett.472：105(2000)；Leiter等，“从绿豆中纯化、cDNA克隆和表达GDP-L-Fuc：Asn联GlcNAcα1，3-海藻糖转移酶”，生物学化学杂志(J.Biol.Chem.)274：21830(1999)]。植物不能生成β(1，4)-半乳糖基转移酶和α(2，6)唾液酸转移酶，结果植物聚糖缺乏常见于哺乳动物聚糖的β(1，4)-半乳糖和末端的α(2，6)NeuAc残基。

最终的聚糖结构不仅仅由存在的参与聚糖生物合成和转运的酶来决定，还在更大的范围内由各种酶促反应的特定顺序来确定。在后一种情况中，是受这些酶在整个内质网和高尔基中的分散隔离和相对位置来控制，这是通过转移酶的决定因子相互作用和亚高尔基体区室无转移酶的特定特征调节的。许多采用杂合分子的研究已经证明一些糖基转移酶的跨膜结构域在其亚高尔基分类中起主要作用，包括β(1，4)-半乳糖基转移酶的跨膜结构域[Grabenhorst等，生物学化学杂志(J.Biol.Chem.)274：36107(1999)；Colley，K.，糖生物学(Glycobiology)7：1(1997)；Munro，S.，细胞生物学趋势(Trends Cell Biol.)8：11(1998)；Gleeson，P.A.，组织化学细胞生物学(Histochem.Cell Biol.)109：517(1998)]。

虽然植物和哺乳动物在相对较早以前就分化了，N联糖基化似乎至少部分地保守。这由聚糖结构虽然不同但是类似以及哺乳动物的GlcNAcTI基因染色体(complement)不具有GlcNAcTI活性的拟南芥的突变体证实，反之亦然。聚糖结构的差异具有重要作用。例如，已知木糖和α(1，3)-海藻糖抗原决定簇具有极高的免疫原性，并且在某些情况下可能引起过敏，这在用植物生产治疗性糖蛋白时带来了问题。而且，在许多敏感症患者的血液血清中含有直接抵抗这些抗原决定簇的IgE，而且50％的非敏感症血液供体在其血清中含有特异于核心-木糖的抗体，而25％含有特异于核心-α1，3-海藻糖的抗体(Bardor等，2002，在版，糖生物学(Glycobiology))(2002年12月17日预先Access出版)，这使得这些个体冒险采用由植物制备的含有海藻糖和/或木糖的重组蛋白处理。此外，由于有证据表明这些糖特异的IgE与致敏反应无关，在血清中指示IgE的这种糖会在使用植物提取物的体外试验中引起假阳性反应。总之，使用植物生产的糖蛋白的治疗失败可能是由于加速清除具有木糖和/或海藻糖的重组糖蛋白。

因此，需要更好地控制植物中的糖基化，特别是用于治疗用途的糖蛋白的糖基化。

定义

为了方便本发明的理解，在本说明书中采用多种术语定义如下。

术语“载体”是指任何遗传元件，例如质粒、噬菌体、转位子、粘粒、染色体、逆转录病毒、病毒子、或类似遗传元件，当与恰当调控元件结合时，其能够复制，并将基因序列转移到细胞内和/或在细胞之间转移。因此，该术语包括克隆载体和表达载体，以及病毒载体。

在此所用术语“表达载体”是指重组DNA分子，其含有期望的编码序列—例如下文更加详细描述的杂合酶的编码序列—和在特定宿主细胞或生物体中表达可操作连接的编码序列所必需的适宜核酸序列。原核细胞中表达所必需的核酸序列通常包括启动子、操作子(可选择的)和核糖体结合位点，常常还有其他序列。已知真核细胞利用启动子、增强子、终止子和聚腺苷酰化信号。这不是将本发明限制在特定的表达载体或具有特定元件的表达载体。

当用于涉及细胞时，术语“转基因的”是指含有转基因的细胞，或者其基因组已经通过导入转基因被改变。当用于涉及、组织或植物时，术语“转基因的”分别是指包含转基因的细胞、组织或植物，其中该组织的一个或多个细胞含有转基因(例如编码本发明的杂合酶的基因)，或基因组通过引入转基因而被改变的植物。转基因细胞、组织和植物可以通过一些方法制备，包括将包含核酸(通常DNA)的“转基因”导入目标细胞中或者通过人为介入将转基因整合到目标细胞的染色体中，例如通过本文描述的方法。

在此所用术语“转基因”是指任何核酸序列，其通过试验操作被导入到细胞的基因组中。转基因可以是“内源DNA序列”或“异源DNA序列”(即“外源DNA”)。术语“内源DNA序列”是指天然存在于其被导入的细胞的核苷酸序列，只要该核苷酸序列不含有相对于天然序列的修饰(例如点突变、存在选择性标记基因或其他类似修饰)。术语“异源DNA序列”是指被连接到或者被加工来连接到一条核酸序列上的核苷酸序列，自然条件下该核苷酸不与该核酸序列连接或者在不同位点上连接。异源DNA对于其所导入的细胞来说不是内源的，而是得自其他细胞。异源DNA还包括具有某些修饰的内源DNA序列。虽然不是必要地，但是一般地，异源DNA在细胞中被表达，编码该细胞通常不能生产的RNA和蛋白质。异源DNA的例子包括报道基因、转录和翻译调控序列、选择性标记蛋白(如赋予药物抗性的蛋白)、或其他类似元件。

术语“外源基因”是指通过试验操作被导入细胞基因组的任何核酸(如基因序列)，包括存在于该细胞中的基因序列，只要被导入的基因序列具有相对于天然序列的某些修饰(例如点突变、存在选择性标记基因或其他类似修饰)。

术语“融合蛋白”是指其中至少一部分来自第一种蛋白质和另一部分来自第二种蛋白质的蛋白质。术语“杂合酶”是指一种功能性酶的融合蛋白，其中至少一部分是来自第一种类和另一部分来自第二种类。本发明的优选杂合酶是功能性糖基转移酶(或其部分)，其中至少一部分来自植物和另一部分来自哺乳动物(如人类)。

术语“导入细胞”或“导入宿主细胞”涉及核酸(如载体)时，是包括本领域所谓的“转化”或“转染”或“转导”。细胞的转化是稳定的或瞬时的—和本发明提供在一定条件下导入载体，一方面可以稳定表达，另一方面仅仅是瞬时表达。术语“瞬时转化”或“瞬时地被转化”是指将一个或多个转基因导入细胞中，而不将转基因整合导宿主细胞的基因组中。瞬时转化可以例如通过酶联免疫吸收分析(ELISA)来检测，检测是否存在由一种或多种转基因编码的多肽。可替代地，瞬时转化可以通过检测由转基因(如抗体基因)编码的蛋白质的活性(如抗体的抗原结合)来检测。术语“瞬时转化”是指瞬时并入一种或多种转基因的细胞。相反，术语“稳定转化”或“稳定地被转化”是指将一种或多种转基因导入或整合到细胞的基因组中。细胞的稳定转化可以通过细胞的基因组DNA与能够结合到一种或多种转基因的核酸序列的Southern印迹杂交来检测。可替代地，细胞的稳定转化还通过细胞基因组DNA的聚合酶链式反应(PCR)来扩增转基因序列来检测。术语“稳定转化”是指稳定地将一个或多个转基因整合到基因组DNA的细胞。因此，稳定转化区别于瞬时转化，其中稳定转化的基因组DNA含有一种或多种转基因，瞬时转化的基因组DNA不含有转基因。

术语“宿主细胞”包括哺乳动物细胞(如人B细胞克隆、中国仓鼠卵巢细胞、肝细胞)和非哺乳动物细胞(如昆虫细胞、细菌细胞、植物细胞)。在一个实施方案中，宿主细胞是哺乳动物细胞，并且导入表达本发明的杂合蛋白(如TmGnTII-GalT)的载体抑制(或至少降低)所述哺乳动物细胞中的海藻糖基化(fucosylation)。

术语“目标核苷酸序列”是指任何核苷酸序列，对于本领域技术人员来说，由于任何原因(如赋予提高质量、用于制备治疗性蛋白质)，其处理被认为是期望的。这种核苷酸序列包括但不限于结构基因的编码序列(如报道基因，选择标记基因、致癌基因、抗体基因、药物抗性基因、生长因子和其他类似基因)，和不编码mRNA或蛋白产物的非编码调控序列(如启动子序列、聚腺苷酸序列、终止子序列、增强子序列、和其他类似序列)。本发明提供表达由目标核苷酸序列编码的异源蛋白的宿主细胞以及一种或多种杂合酶。

当用于涉及核酸时，如在“分离的核酸序列”中，术语“分离的”是指被鉴定和从一种或多种其他成分中被分离的核酸序列(如从含有该核酸的细胞中分离，或者从至少一种杂质核酸中分离，或者从一种或多种蛋白、一种或多种脂肪中分离)，在天然来源中核酸通常与这些成分结合在一起。分离的核酸是以不同于其在自然界中见到的形式或装配(setting)存在的核酸。相反，未被分离的核酸是如以天然存在的状态被发现的DNA和RNA的核酸。例如，在接近于邻近基因的宿主细胞染色体上发现特定的DNA序列(如基因)；RNA序列，如编码特定蛋白质的特定mRNA被发现在细胞中与大量编码许多蛋白质的其他mRNA混合在一起。但是，包含SEQ ID NO：1的分离核酸序列包括，作为例子，通常含有SEQ ID N0：1的细胞中这种核酸序列，其中核酸序列在区别于天然细胞的染色体的或染色体外的位置上，或者被不同天然存在的核酸序列侧面连接。分离的核酸序列可能以单链或双链形式存在。当分离的核酸序列被用于表达蛋白质时，该核酸序列将最小地至少含有有义链或编码链的一部分(即该核酸序列可以是单链的)。可替代地，可以同时含有有义链和反义链(即该核酸序列是双链的)。

此处所用术语“纯化的”是指核酸或者氨基酸序列分子，从其天然环境中被取出，被分离或被分开。因此“分离的核酸序列”是被纯化的核酸序列。“基本上纯化的”分子至少60％，优选至少70％和更加优选的至少90％没有该分子天然地结合的其他成分。本发明提供纯化的(包括基本上纯化的)和未纯化的杂合酶(将在下文中更详细描述)。

在此所用术语“互补的”或“互补性”被用于指根据碱基配对原则是相关的核苷酸序列。例如，序列5’-AGT-3’与序列5’-ACT-3’互补。互补性可以是“部分的”或“全部的”。“部分”互补性是其中一个或多个核苷酸碱基按照碱基配对原则是不匹配的。两条核酸之间的“全部的”或者“完全的”互补性是其中每个核酸碱基依据碱基配对原则与另一个碱基匹配。两条核酸链之间的互补程度显著地影响核酸链之间的杂交效率和强度。

在此所用的核酸序列的“互补物”是指核酸与核酸序列的核酸具有全部互补性的核苷酸序列。例如，本发明提供SEQ ID NO：1，3，5，9，27，28，29，30，31，32，33，34，35，37，38，40，41和43的互补物。

当用于涉及核酸时，术语“同源性”是指互补程度。可能是部分同源性(即部分同一性)或完全同源性(即完全同一性)。部分互补的序列是至少部分地抑制完全互补的序列杂交到目标核酸的序列，参照采用功能术语“基本上同源的”。可以在低严紧性条件下进行杂交分析(Southern或Northern印迹、溶液杂交等)来检测对完全互补序列与目标序列杂交的抑制。在低严紧条件下，基本上同源的序列或探针(即能够杂交到另一条目标寡核苷酸的寡核苷酸)将竞争和抑制完全同源的序列结合(即杂交)到目标上。这并不是说低严紧条件是可以进行非特异性结合的条件；低严紧条件要求两条序列相互结合是特异性的(即选择性的)互作。可以采用甚至不具有部分互补性(如小于约30％的同一性)的第二条目标序列来检测是否存在非特异性的结合；没有非特异性结合时，探针不会杂交到第二条非互补的目标链上。

当被用于涉及双链核酸序列如cDNA或基因组克隆时，术语“基本上同源的”是指在上文描述的低严紧条件下能够杂交到双链核酸的一条或两条链上的任何探针。

当被用于涉及单链核酸序列时，术语“基本上同源的”是指在上文描述的低严紧条件下能够杂交到单链核酸序列上的任何探针。

在此所用术语“杂交”包括“通过碱基配对将核酸的一条链结合到互补的链上的任何过程”[Coombs J(1994)生物工艺学词典(Dictionary of Biotechnology)，Stockton出版社，纽约]。杂交和杂交强度(即核酸之间的结合强度)受核酸之间的互补程度、涉及的条件的严紧度、形成的杂合体的T_m、核酸中的G∶C比等因素的影响。

此处所用术语“T_m”用于指“解链温度”。解链温度是大量双链核酸分子半数分离成单链时的温度。计算核酸的T_m的方程在本领域是熟知的。如标准参考文献中指出。当核酸在1M NaCl的水溶液中时，T_m的简单估计值可以通过方程T_m＝81.5+0.41(％G+C)计算[见如，Anderson和Young，定量滤过杂交：核酸杂交(Nucleic Acid Hybridization)(1985)]。其他的参考文献包括更加精确的计算，将结构特征以及序列特征考虑在内来计算T_m。

用于涉及核酸杂交时，低严紧条件包含的条件等价于当采用长度约100到约1000个核苷酸的DNA探针时，在68℃下在由5X SSPE(盐、磷酸钠、EDTA)(43.8g/l NaCl、6.9g/l NaH₂PO₄·H₂O和1.85g/l EDTA(乙二胺四乙酸)，用NaOH调节pH为7.4)，0.1％SDS(十二烷基硫酸钠)，5X Denhardt试剂[每500ml的50XDenhardt中含有：5gFicoll(Type400，Pharmacia)，5gBSA(牛血清白蛋白)(Fraction V；Sigma)]和100μg/ml变性的鲑鱼精子DNA组成的溶液中结合或杂交，接着室温下在包含0.2X-2.0X SSPE和0.1％SDS的溶液中洗涤。

用于涉及核酸杂交时，高严紧条件包含的条件等价于当采用长度约100到约1000个核苷酸的DNA探针时，在68℃下在由5X SSPE，5X Denhardt试剂和100μg/ml变性的鲑鱼精子DNA组成的溶液中结合或杂交，接着在68℃下在包含0.2X-2.0X SSPE和0.1％SDS的溶液中洗涤。

当用于涉及与目标杂交条件相关的杂交条件时，术语“等价于”是指杂交条件和目标杂交条件引起具有相同范围的百分同源性的核酸序列的杂交。例如，目标杂交条件引起第一条核酸序列与另一条与第一条核酸序列具有50％-70％同源性的核酸序列的杂交，那么，如果另一种杂交条件也引起第一条核酸序列与另一条与第一条核酸序列具有50％-70％同源性的序列杂交，这种杂交条件被认为等价于目标杂交条件。

当用于涉及核酸杂交时，本领域技术人员知晓许多等价条件可被用于构成低的或高的严紧条件；考虑如探针的长度和性质(DNA、RNA，碱基组成)和靶点的性质(DNA、RNA，碱基组成，存在于溶液中或者是固定的)以及盐和其他成分浓度(如是否存在甲酰胺、硫酸葡聚糖、聚乙二醇)等因素，而且可以改变杂交溶液来产生区别、但等价于上面所列的条件的低严紧的或高严紧的杂交条件。

在此所用的术语“启动子”、“启动子元件”或“启动子序列”是指DNA序列，当被连接到目标核苷酸序列时，能够控制目标核苷酸序列转录为mRNA。虽然不是必须的，但是启动子通常位于目标核苷酸序列的5’端(即上游)，该目标核苷酸序列转录成mRNA，启动子控制和提供用于起始转录的RNA聚合酶和其他转录因子的特异性结合位点。

启动子可以是组织特异性的或细胞特异性的。当应用于启动子时，术语“组织特异性的”是指启动子能够指导目标核苷酸序列选择性地表达到特定组织类型(如花瓣)，而同一目标核苷酸序列在不同组织类型中(如根)相对地不表达。启动子的组织特异性可以被评价，如通过将报道基因可操作地连接到启动子序列上来产生报道构建体，将该报道构建体导入植物的基因组中，使得该报道构建体被整合到所得到的转基因植物的每个组织中，在转基因植物的不同组织中检测报道基因的表达(如检测mRNA、蛋白质、或由报道基因编码的蛋白质的活性)。在一个或多个组织中检测到比其他组织中报道基因的表达水平更高的报道基因的表达水平，表明启动子对于检测到较高表达水平的组织来说是特异的。术语“细胞类型特异的”应用于启动子是指启动子能够指导目标核苷酸序列在特定类型细胞中选择性地表达，而同一目标核苷酸序列在相同组织的不同类型的细胞中相对地不表达。术语“细胞类型特异的”应用于启动子还指启动子能够促进目标核苷酸序列在单一组织的某个区中选择性地表达。启动子的细胞特异性可以采用本领域熟知的方法来评价，如免疫组织化学染色。简而言之，组织切片被包埋在石蜡中，石蜡切片与特异于目标核苷酸序列所编码的多肽产物的第一抗体反应，该多肽的表达受启动子调控。特异于第一抗体的标记(如过氧化物酶偶联)第二抗体与组织切片结合，并且通过显微镜检测特异性结合(如用抗生物素蛋白/生物素)。

启动子可以是组成型的或调控型的。当术语“组成型的”用于涉及启动子时是指缺乏刺激(如热休克、化学药品、光照或类似刺激)时，启动子能够指导被可操作连接的核酸序列的转录。典型地，组成型启动子能够在几乎任何细胞和任何组织中指导转基因的表达。相反，“调控型的”启动子是在存在刺激(如热休克、化学药品、光照或类似刺激)时能够指导可操作地连接的核酸序列的一定水平的转录，其不同于缺乏刺激时的可操作地连接的核酸序列的转录水平。

术语用细菌“感染”(infecting)和“感染”(infection)是指目标生物样本在一定条件下与细菌共培养，使得包含在细菌内的核酸序列被导入目标生物样本的一个或多个细胞中。

术语“农杆菌”是指土壤中产生的、革兰氏阴性的、杆状的致植物病细菌，其引起冠瘿病。术语“农杆菌”包括但不限于根癌农杆菌(通常在被感染的植物中引起冠瘿病)和毛根农杆菌(其在被感染的宿主植物中引起发根疾病)。用农杆菌感染植物细胞通常导致被感染的细胞生成冠瘿碱(如胭脂碱、农杆碱、章鱼碱)。因此，导致生成胭脂碱的农杆菌菌株(如菌株LBA4301、C58、A208)称作为“胭脂碱型”农杆菌；导致生成农杆碱的农杆菌菌株(如菌株LBA4404、Ach5、B6)称作为“农杆碱型”农杆菌；导致生成章鱼碱的农杆菌菌株(如菌株EHA105、EHA101、A281)称作为“章鱼碱型”农杆菌。

术语“轰击”(bombarding)、“轰击”(bombardment)和“基因枪轰击”(biolistic bombardment)是指加速粒子轰击目标生物样本(如细胞、组织、植物的部分如叶子或完整的植物)的方法，来实现创伤目标生物样本的细胞的细胞膜/或使粒子进入目标生物样本。基因枪轰击的方法在本领域是已知的(如美国专利5,584,807和5,141,131，这两篇专利的内容在此引入作为参考)，并且可以购买得到(如氦气生成微发射加速器(PDS-1000/He)(BioRad)。

当术语“微创”(microwounding)用于涉及植物组织时是指在该组织中引入细微的创伤。微创可以通过例如本文描述的粒子轰击来实现。本发明特别地提供采用微创来引入核酸的方案。

在此所用的术语“生物体”是指所用的生物体，并且特别是含有具有N-联聚糖的糖蛋白的生物体。

在此所用的术语“植物”是指充分地分化为存在于植物发育的任何阶段的一种结构的大量植物细胞。这种结构包括但不限于果实、芽、茎、根、叶、种子、花瓣或类似结构。术语“植物组织”包括分化的和未分化的植物组织，包括但不限于根、芽、叶、花粉、种子、瘤组织和各种类型培养细胞(如单细胞、原生质体、胚胎、愈伤组织、原始球茎样体和其他类型的细胞)。植物组织可能是in pLanta的、器官培养、组织培养或细胞培养中的。类似地，“植物细胞”可以是培养中的细胞或是植物的一部分。

糖基转移酶是催化决定细胞寡糖结构的加工反应的酶，包括糖蛋白上的寡糖。在此所用“糖基转移酶”是指包括甘露糖苷酶，既便这些酶修饰聚糖而不“转移”单糖。糖基转移酶具有II型膜定位的特性。每种糖基转移酶由氨基末端细胞质尾区(以下由一串专门用“X”标记氨基酸组成用于说明目的—而不是表示该区的实际大小)、信号锚定结构域(以下由一串用“H”标记的氨基酸组成表示疏水—而不是说明该结构域的实际大小，也不表示该结构域仅由疏水氨基酸组成)其跨过细胞膜(在此称作“跨膜结构域”)、接着是腔茎(以下用由一串专门用“S”标记的氨基酸组成表示—不是表示该区的实际大小)或柄区、和羧基末端的催化结构域(以下用一串专门用“C”标记的氨基组成表示—不是表示该结构域的实际大小：

NH₂- XXXXXXHHHHHHHHSSSSSSSSCCCCCCCC

总的来说，胞质尾区-跨膜-茎或“CTS”(已经在上述示意图中用下划线标注来说明)(或其部分)可以被用于本发明提供的实施方案中，其中催化结构域与来自其他分子的相应催化结构域(或这种区/结构域的部分)调换或“交换”来生成杂合蛋白。

例如，在一个优选实施方案中，本发明提供编码杂合酶的核酸(以及含有这种核酸的载体、含有这种载体的宿主细胞和杂合酶本身)，所述杂合酶至少包含第一个糖基转移酶(如植物糖基转移酶)的CTS区的一部分[如，胞质尾区(“C”)、跨膜结构域(“T”)、胞质尾区以及跨膜结构域(“CT”)、跨膜结构域以及茎(“TS”)、或者完整的CTS区]，和至少第二个糖基转移酶(如哺乳动物糖基转移酶)的催化区的一部分。为了建立这种实施方案，整个CTS区(或其部分)的编码序列从编码哺乳动物糖基转移酶的核酸中被删除，用植物糖基转移酶的完整CTS区(或其部分)的编码序列取代。另一方面，不同的方法可以被用于建立这种实施方案；例如，整个催化结构域(或其部分)的编码序列从植物糖基转移酶的编码序列中删除，并且用哺乳动物糖基转移酶的完整催化结构域(或其部分)的编码序列取代。在这种情况下，得到的杂合酶具有植物糖基转移酶的氨基末端胞质尾区，其连接到以野生型植物酶的一般形式连接在植物糖基转移酶的茎干区的植物糖基转移酶跨膜结构域上—但是茎干区将被连接到哺乳动物糖基转移酶的催化结构域(或其部分)上。

无意将本发明仅限于上面描述的两种方法。包括该方法中的其他改变。例如，为了生成编码杂合酶的核酸，所述杂合酶包含至少植物糖基转移酶的跨膜区的一部分和至少哺乳动物糖基转移酶催化区的一部分，可能采用小于CTS区的整个编码序列(如仅植物糖基转移酶的跨膜结构域，或完整的胞质尾区以及全部或部分跨膜结构域，或完整的胞质尾区以及整个跨膜结构域以及茎干区的部分)。可以删除哺乳动物的整个胞质尾区的编码序列以及跨膜结构域的编码序列(或其部分)—接着用相应的植物糖基转移酶的胞质尾区和跨膜结构域(或其部分)的编码序列取代。在这种情况下，得到的杂合酶具有连接到植物糖基转移酶跨膜结构域(或其部分)的哺乳动物糖基转移酶的茎干区，其接着被连接到植物糖基转移酶的氨基末端的胞质尾区上，而茎干区被连接到哺乳动物糖基转移酶的催化结构域上(即四个区/结构域中的两个是植物来源的，而另外两个是哺乳动物来源的)。

在另一个实施方案中，本发明提供编码杂合酶的核酸(以及载体、含有该载体的宿主细胞、含有该宿主细胞的植物或植物部分)，所述杂合酶包含至少植物糖基转移酶的氨基末端的胞质尾区的一部分和至少哺乳动物糖基转移酶的催化区的一部分。在该实施方案中，由核酸编码的杂合酶可能含有或不含有其他植物序列(如跨膜结构域或其部分、茎干区或其部分)。例如，为了建立该实施方案，整个胞质尾区(或其部分)的编码序列被从编码哺乳动物糖基转移酶的核酸中删除，并且用植物糖基转移酶的整个胞质尾区结构域(或其部分)的编码序列取代。在这种情况下，得到的杂合酶具有连接到哺乳动物糖基转移酶跨膜结构域的植物糖基转移酶的氨基末端的胞质尾区(或其部分)，其接着被连接到哺乳动物糖基转移酶的茎干区上，该茎干区被连接到哺乳动物的催化结构域上。另一方面，采用不同的方法来建立该实施方案；例如，整个催化结构域(或其部分)的编码序列从植物糖基转移酶的编码序列中删除，并且用哺乳动物糖基转移酶的整个催化结构域(或其部分)的编码序列取代。在这种情况下，得到的杂合酶以野生型植物酶的方式，植物糖基转移酶的氨基末端的胞质尾区被连接到植物糖基转移酶的跨膜结构域，跨膜结构域连接到植物糖基转移酶的茎干区，但是茎干区将被连接到哺乳动物糖基转移酶的催化结构域(或其部分)。

在上述讨论中，采用用语“或其部分”特别指在特定情况下可以使用小于完整的区/结构域(如可以使用一个片段)。例如，糖基转移酶的胞质尾区长度范围在5-50个氨基酸，更典型的是15-30个氨基酸，这取决于特定的转移酶。胞质尾区的“一部分”在此定义为不少于四个氨基酸，并且可以达到比该区/结构域全长少一个氨基酸。期望部分的功能在某种意义上类似于全长的区/结构域—但不必起到相同程度的功能。例如，在一定程度上，全长胞质尾区作为高尔基滞留区或内质网滞留信号，期望在上述实施方案中采用的部分还作为高尔基或内质网滞留区，虽然可能不如全长区一样有效。

类似地，跨膜结构域的长度典型地为15-25个氨基酸，主要由疏水氨基酸组成。跨膜结构域的一部分在此定义为不少于10个氨基酸，可以达到用比全长的区/结构域少一个氨基酸(对于特定转移酶)的长度。期望部分功能在某种意义上类似于全长的区/结构域—但不必起到相同程度的功能。例如，在一定程度上，全长跨膜区作为高尔基滞留区或内质网滞留信号，期望在上述实施方案中采用的部分还作为高尔基或内质网保留区，虽然可能不如全长区一样有效。本发明特别提供保守性取代来生成野生型跨膜结构域或其部分的变体。例如，本发明提供用一个或多个不同的氨基酸，优选还是疏水性氨基酸，来取代一个或多个疏水性氨基酸(在上述方案中表示为“H”)。

催化结构域的一部分可以比该结构域的全长少一个氨基酸。虽然，催化结构域来自β1，4-半乳糖基转移酶，优选该部分包括最小残基345-365，一般认为其参与产生寡糖受体结合位点的构象(优选该部分最小包括这个区，并且两侧有5-10个氨基酸以保证正确的构象)。

本发明还提供合成的CTS区和其部分。CTS的“一部分”必须至少包括一个(可以包括一个以上)完整的结构域(如完整的跨膜结构域)，但小于整个CTS区。

重要的是，使用术语“CTS区”或“跨膜结构域”并不是说仅包括野生型的序列。事实上，本发明不限于天然的糖基转移酶和参与糖基化的酶，还包括采用具有相同或相似功能的合成酶。在一个实施方案中，野生型结构域被改变(如通过缺失、插入、取代等)。

最后，当涉及特定杂合体(如″TmXyl-)时使用指示“Tm”，包括完整的跨膜/CTS结构域(改变或未改变野生型序列)以及部分(改变或未改变野生型序列)。

发明概述

本发明提供编码杂合酶(或“融合蛋白”)的核酸(DNA或RNA)、含有这种核酸的载体、含有这种载体的表达杂合酶的宿主细胞(包括但不限于植物组织和整个植物中的细胞)，和分离的杂合酶本身。在一个实施方案中，所述杂合酶(或“融合蛋白”)的表达导致糖基化的改变，例如，但不限于糖成分如木糖、海藻糖、Lewis^A/B/X或其他糖结构的下降，妨碍期望的糖型的沉积。在一个实施方案中，本发明提供编码杂合酶的核酸，所述杂合酶包含糖基转移酶(包括但不限于植物糖基转移酶)的CTS区(或其部分)和非植物糖基转移酶(如哺乳动物、鱼、两栖类、真菌)的糖基转移酶的催化区(或其部分)。优选地，当被表达时CTS区(或其部分)被(直接或间接地)可操作结合地连接到所述催化区(或其部分)。连接优选是共价的，而结合是可操作的，其中催化区具有催化功能(即使所述催化功能相对于野生型酶降低了)。连接的方式是使得不插入氨基酸或其他区/结构域。另一方面，进行连接使得在两者之间插入氨基酸(或其他化学基团)和/或其他区/结构域。当然，用于制备编码上述杂合酶的核酸的核酸可以由酶促从天然序列(如基因组DNA、cDNA等)获得或者可选择地采用参比序列(如电子的或硬拷贝的序列)作为向导合成。

在一个特定的实施方案中，本发明提供编码杂合酶的核酸，所述杂合酶包括植物糖基转移酶的跨膜区(如至少一个跨膜区和可选择地CTS区的多个区)和非植物(如哺乳动物)糖基转移酶的催化区(或其部分)。此外，优选当被表达时，这些区域被可操作结合地(直接或间接)连接。在还有一个实施方案中，本发明提供编码杂合酶的核酸，所述杂合酶包括植物糖基转移酶的跨膜结构域(或其部分)和哺乳动物糖基转移酶的催化区(或其部分)。另外，优选当被表达时，这些区域以可操作结合被(直接或间接地)连接。

无意将本发明限定于特定的转移酶。在一个实施方案中，植物糖基转移酶是木糖基转移酶。在另一个实施方案中，植物糖基转移酶是N-乙酰葡糖胺基转移酶(N-acetylglucosaminyltransferase)。在另一个实施方案中，植物糖基转移酶是海藻糖基转移酶。在一个优选实施方案中，哺乳动物糖基转移酶是人半乳糖基转移酶(如由SEQ ID NO：1编码的人β1，4-半乳糖基转移酶，其中编码跨膜结构域的核苷酸被删除和取代)。

无意将本发明限制于使用植物来源的糖基转移酶CTS结构域和人糖基转移酶催化结构域，而是反之亦然，采用糖基转移酶的任何CTS-结构域与至少另一种糖基转移酶的催化片段结合。事实上，在一个实施方案中，本发明广泛地包括编码杂合酶的核酸，所述杂合酶包含第一个糖基转移酶的跨膜区和第二个糖基转移酶的催化区。优选地，所述第一个和第二个糖基转移酶是来自不同种类(可以来自不同属或甚至来自不同的门)。在一个实施方案中，所述第一个糖基转移酶包含植物糖基转移酶。在另一个实施方案中，所述植物糖基转移酶是木糖基转移酶。在还有一个实施方案中，所述植物糖基转移酶是海藻糖基转移酶。在一个优选实施方案中，所述第二个糖基转移酶包含哺乳动物糖基转移酶。在一个特别优选的实施方案中，所述糖基转移酶是人半乳糖基转移酶。

无意将本发明限制在第一和第二个糖基转移酶分别是植物的和非植物的情况。在一个实施方案中，所述第一个糖基转移酶包含第一个哺乳动物糖基转移酶和所述第二个糖基转移酶包含第二个哺乳动物糖基转移酶。在优选实施方案中，所述第一个哺乳动物糖基转移酶是非人类的糖基转移酶，所述第二个哺乳动物的糖基转移酶是人糖基转移酶。

无意将本发明限制在载体类型。在一个实施方案中，本发明提供包含编码上述杂合酶的核酸的表达载体。

也无意将本发明限制于宿主细胞的类型。各种原核的和真核的宿主细胞可以购买到，用于表达蛋白。在一个实施方案中，本发明提供含有包含编码上述杂合酶的核酸的载体的宿主细胞(含有或不含有其他载体或其他编码其他杂合酶或糖基转移酶的核酸)。在一个优选实施方案中，宿主细胞是植物细胞。在特别优选的实施方案中，本发明提供一种包含这种宿主细胞的植物。

无意将本发明限制在使宿主细胞表达本发明的杂合酶的方法。在一个实施方案中，本发明提供一种方法：包含：a)提供：i)一种宿主细胞(如植物细胞，或者是培养的或是植物组织的部分或甚至是完整生长植物的部分)，和ii)一种包含编码杂合酶的核酸的表达载体，所述杂合酶包含至少植物糖基转移酶的CTS区的一部分(如跨膜结构域)和至少哺乳动物糖基转移酶的催化区的一部分；和b)在一定条件下，将所述表达载体导入所述植物细胞中，使得所述杂合酶被表达。此外，无意将本发明限定于特定的转移酶。在一个实施方案中，用于上述方法中的植物糖基转移酶是木糖基转移酶。在另一个实施方案中，植物糖基转移酶是N-乙酰葡糖胺基转移酶。在另一个实施方案中，植物糖基转移酶是海藻糖基转移酶。在一个优选实施方案中，被用于实施方法的哺乳动物糖基转移酶是人半乳糖基转移酶(如由SEQ ID NO：1编码的人β1，4-半乳糖基转移酶，其中编码跨膜结构域的核苷酸被删除和取代)(或简而言之，其中SEQ ID NO：1中编码催化结构域或其部分的核苷酸被取出并连接到编码植物糖基转移酶的CTS区或其部分的核苷酸上)。

无意将本发明限制在用上述杂合酶控制异源蛋白的糖基化的特定方案中。在一个实施方案中，本发明提供一种方法，包含：a)提供：i)一种宿主细胞(如植物细胞)，ii)包含编码杂合酶的核酸的第一种表达载体，所述杂合酶包含至少第一个(如植物)糖基转移酶的CTS区的一部分(如至少跨膜结构域)和至少第二个(如哺乳动物)糖基转移酶的催化区的一部分；和iii)包含编码异源糖蛋白(或其部分)的核酸的第二个表达载体；和b)在一定条件下，将所述第一个和第二个表达载体导入所述植物细胞中，使得所述杂合酶和所述异源蛋白被表达。可选择地，采用具有编码杂合酶(或多种杂合酶)和异源糖蛋白的核酸的单一载体。无论采用何种方法，在一个实施方案中，本发明包括分离异源蛋白以及被分离的蛋白本身作为一种组合物的额外步骤(c)。

另一方面，本发明还包括将不同载体导入不同植物细胞(无论是培养中的细胞、植物组织的部分、或甚至是完整生长植物的部分)。在一个实施方案中，本发明提供一种方法，包括：a)提供：i)包含第一种表达载体的第一种植物，所述第一个载体包含编码杂合酶(或编码两种或两种以上杂合酶)的核酸，所述杂合酶包含至少植物糖基转移酶的CTS区的一部分(如约N-末端的前40-60个氨基酸)和至少哺乳动物糖基转移酶的催化区的一部分，和ii)包含第二个表达载体的第二种植物，所述第二个载体包含编码异源蛋白(或其部分)的核酸；和杂交所述第一种植物和第二种植物来制备表达所述杂合酶和所述异源蛋白的子代。当然，这种子代可以被分离、生长和分析是否存在各种(或两种)蛋白。事实上，异源蛋白(典型地首先被纯化，基本上不含有植物细胞物质)可被治疗性地(如施用给人或动物，无论通过口服、静脉内、经皮肤或者其他施用路径)用于治疗或预防疾病。

无意将本发明限制在特定的异源蛋白。在一个实施方案中，提供任何对宿主细胞(或生物体)来说不是内源的肽或蛋白。在一个实施方案中，异源蛋白是抗体或抗体片段。在特别优选实施方案中，抗体是在植物中高产量地表达的人抗体或“人源化的”抗体。“人源化的”抗体通常从非人抗体(如啮齿类抗体)中制备，将非人类的抗体的超变区(也称作CDRs)取出，并将它们“移植”到人的构架中。整个操作可以是人工的(假设序列是已知的)，可以从共同的人的构架的数据库中选择构架。多数情况下，除非架构序列被修饰或CDRs被修饰，否则制备过程中会损失亲合性。实际上，当CDRs被系统地突变(例如，通过随机化操作)和试验时，可以反映亲合性升高。

本发明上下文中的异源蛋白是特别有用的，在一个实施方案中，本发明的杂合酶可用于改变内源性蛋白的糖基化，即通常由宿主细胞或生物体表达的蛋白。

本发明特别包括植物本身。在一个实施方案中，本发明提供包含第一个和第二个表达载体的植物，所述第一个载体包含编码杂合酶的核酸，所述杂合酶包含至少植物糖基转移酶的CTS区的一部分(如胞质尾区以及至少跨膜结构域的一部分)和至少哺乳动物糖基转移酶的催化区的一部分，所述第二个表达载体包含编码异源蛋白(或其部分)的核酸。在一个优选实施方案中，通过与本发明的杂合酶(或多种杂合酶)一起表达，异源蛋白与在缺乏杂合酶(或多种杂合酶)的植物中异源蛋白的表达相比，表现为α1，3-海藻糖基化下降(10％-99％)(甚至无海藻糖基化)。在一个优选实施方案中，通过与本发明的杂合酶(或多种杂合酶)一起表达，异源蛋白与在缺乏杂合酶(或多种杂合酶)的植物中异源蛋白的表达相比，表现为木糖基化下降(10％-99％)(甚至无木糖基化)。在一个优选实施方案中，通过与本发明的杂合酶(或多种杂合酶)一起表达，异源蛋白与在缺乏杂合酶(或多种杂合酶)的植物中异源蛋白的表达相比，表现为海藻糖和木糖都下降。

无意将本发明限制在实现降低海藻糖和/或木糖的特定理论中。关于植物中的亚高尔基分类机制知道得极少。由于哺乳动物特异的β(1，4)-半乳糖基转移酶(GaIT)产生通常未见于植物中的聚糖结构，其已经被用作最佳第一标记来研究这种表型(见下文实施例)。表达半乳糖基转移酶的植物的聚糖结构已经与来自表达嵌合半乳糖基转移酶的植物的聚糖结构比较，其CTS结构域换成了植物木糖基转移酶的CTS结构域(或其部分)。观察到的聚糖结构的变化表明半乳糖基转移酶在哺乳动物中局限在植物高尔基的亚区室。不将本发明限制于任何特定机制，植物和哺乳动物的分类机制在某种程度上显然是保守的，植物不识别的糖基转移酶被运载到高尔基中的特定类似位置上。该位置在内源性木糖基、海藻糖基和GlcNAcTII(GnTII)转移酶的位置之后。

这些表达再定位的GalT变体的植物中的N-聚糖含有极少的木糖和海藻糖，这种发现也是具有生物技术相关性的。对于用于在哺乳动物如人中的治疗用途的糖蛋白，本发明的一些实施方案中的方法提供用于在植物中控制糖蛋白的N联糖基化的方法和组合物，使得可以得到一种糖蛋白，其基本上不含有木糖和海藻糖，而含有至少一个双触角N-聚糖(但不限于双触角，还包括三触角等)和在N-聚糖的至少一个臂上的(至少一个)半乳糖残基。因此，无意将本发明限制在双触角N-聚糖，而是包括平分的双触角N-聚糖、三触角N-聚糖等。此外，本发明不限于复合型的N-聚糖，还包括杂合型的N-聚糖以及其他类型的N-聚糖。本发明包括这种生成的糖蛋白。此外，本发明的方法和组合物可以被应用于植物和非植物系统，其中除了木糖、海藻糖之外，Lewis^A/B/X类型的N-聚糖修饰物(β1-3-GalT、α1-4-FucT等)或其他糖类干扰期望的糖型的沉积。

在一个实施方案中，本发明提供通过调节参与高尔基体中聚糖生物合成的酶的定位来控制植物的N联糖基化。特别地，本发明的实施方案是在植物宿主体系中制备糖蛋白的方法，包括：(a)阻止(或抑制)在所述糖蛋白的聚糖核心中增加木糖和海藻糖和(b)在所述臂上添加一个，优选两个半乳糖残基。该糖蛋白具有双触角聚糖，在至少一个臂上含有至少一个半乳糖残基，不含有(或降低)木糖和海藻糖。

通过将编码杂合酶的核酸导入到所述植物宿主系统中，可以减少或甚至阻止向所述异源糖蛋白中添加木糖和海藻糖，该杂合酶包含一种蛋白特别是一种酶如植物木糖基转移酶的CTS区(或其部分)和通常不存在于植物的半乳糖基转移酶或者其中跨膜部分被去除而插入内质网滞留信号的被修饰的半乳糖基转移酶的催化区(或其部分)，其中所述蛋白质或酶早期在所述植物宿主系统中的植物细胞的高尔基体中起作用，而不是作为所述半乳糖基转移酶。优选半乳糖基转移酶是哺乳动物半乳糖基转移酶，特别是人半乳糖基转移酶。在最特别的实施方案中，所述半乳糖基转移酶是人β1，4-半乳糖基转移酶(GalT)。在一个优选的实施方案中，所述木糖基转移酶是β1，2-木糖基转移酶。用于替换哺乳动物糖基转移酶(如半乳糖基转移酶)的CTS区或CTS片段的是早期在高尔基体中起作用而不是作为半乳糖基转移酶的酶之一，包括但不限于导致含有不期望的木糖和海藻糖残基的聚糖的显著降低的XylT、FucT、GnTI、GnTII、GnTIII、GnTIV、GnTV、GnTVI、ManI、ManII和ManIII(见附图2)。此外，半乳糖基化增加而聚糖多样性降低。虽然不限于任何特定的机制，既不含有木糖也不含有海藻糖的半乳糖基化的聚糖增加被认为主要是由于GalGNMan5、GNMan5或GaIGNMan4沉积。此外，半乳糖基化仅在一个聚糖臂上发生。显然，高尔基中早期的半乳糖基化抑制由甘露糖酶II(ManII)将所述糖型修饰为的GaIGNMan3。还抑制由GlcNAcTII(GnTII)增加第二个GlcNAc。

因此，在一个实施方案中，包括获得期望的双臂被半乳糖基化而基本上不含有木糖和海藻糖的糖蛋白的其他步骤。因此，在一个实施方案中，如上指出的本发明的方法还包含增加半乳糖残基到所述糖蛋白的臂上(见附图3)。在本发明的一个实施方案中，半乳糖残基被加到两个臂上，采取往所述植物宿主系统中导入(a)编码包含GnTI的CTS区(或片段，如包括跨膜结构域的片段)和GnTII的活性结构域(或其部分)的第一个杂合酶的核酸序列；(b)编码包含GnTI的CTS区(或片段，如包括跨膜结构域的片段)和ManII的活性结构域的第二个杂合酶的核酸序列；和(c)编码包含XylT的CTS区(或片段，如包括跨膜结构域的片段)和人半乳糖基转移酶(TmXyl-GaIT)的活性结构域(或其部分)的第三个杂合酶的核酸序列。在本发明的另一个实施方案中，半乳糖残基被增加到双臂上，通过往所述植物宿主系统中导入(a)编码包含ManI的CTS区(或片段，如包括跨膜结构域的片段)和GnTI的活性结构域(或其部分)的第一个杂合酶的核酸序列；b)编码包含ManI的CTS区(或片段，如包括跨膜结构域的片段)和GnTII的活性结构域(或其部分)的第二个杂合酶的核酸序列；(c)编码包含ManI的CTS区(或片段，如包括跨膜结构域的片段)和ManII的活性结构域(或其部分)的第三个杂合酶的核酸序列和(d)编码包含XylT的CTS区(或片段，如包括跨膜结构域的片段)和人半乳糖基转移酶(TmXyl-GalT)的活性结构域(或其部分)的第四个杂合酶的核酸序列。

无意将本发明限制于特定的杂合酶的组合或者应用在单个细胞、植物组织或植物中的这种杂合酶的数量中。在一个优选实施方案中，本发明包括表达TmXyl-GaIT和TmGnTI-GnTII及TmGnTI-ManII的宿主细胞。在本发明的一个实施方案中，半乳糖残基被增加到所述臂，通过往所述植物宿主系统中导入(a)编码包含一种蛋白特别是一种酶包括但不限于N-乙酰葡糖胺基转移酶I(GnTI)的CTS区(或其片段)和甘露糖苷酶II(ManII)的催化区(或其部分)的第一个杂合酶的核酸序列，其中所述酶早期在所述植物宿主系统中的植物细胞的高尔基体中起作用，而不是作为甘露糖苷酶II或者其中跨膜部分被删除而插入内质网滞留信号的被修饰的甘露糖苷酶II和(b)编码包含包括但不限于N-乙酰葡糖胺基转移酶I(GnTI)的CTS区(或片段，如包括跨膜结构域的片段)和N-乙酰葡糖胺基转移酶II(GnTII)的催化区(或其部分)的第二个杂合酶的核酸序列，其中所述酶早期在所述植物宿主系统中的植物细胞的高尔基体中起作用，而不是作为N-乙酰葡糖胺基转移酶II(GnTII)或者其中跨膜部分被删除而插入内质网滞留信号的被修饰的N-乙酰葡糖胺基转移酶II(GnTII)。编码N-乙酰葡糖胺基转移酶或甘露糖苷酶或所述跨膜片段的序列来自植物或来自真核的非植物生物体(如哺乳动物)。

还有在另一个优选实施方案中，本发明包括表达TmXyl-GaIT和TmGnTI-GnTI及TmGnTI-ManII和TmGnTI-GnTII的宿主细胞。在本发明的另一个实施方案中，半乳糖残基被添加到所述臂，通过往所述植物宿主系统中导入(a)编码包含一种蛋白特别是一种酶包括但不限于甘露糖苷酶I(ManI)的CTS区(或其片段，如包括跨膜结构域的片段)和N-乙酰葡糖胺基转移酶I(GnTI)的催化区(或其部分)的第一个杂合酶的核酸序列，其中所述酶早期在所述植物宿主系统中的植物细胞的高尔基体中起作用，而不是作为N-乙酰葡糖胺基转移酶I(GnTI)或者其中跨膜部分被删除而插入内质网滞留信号的被修饰的N-乙酰葡糖胺基转移酶I(GnTI)和(b)编码包含包括一种酶但不限于甘露糖苷酶I(ManI)的CTS区(或片段，如包括跨膜结构域的片段)和甘露糖苷酶II(ManII)的催化区(或其部分)的第二个杂合酶的核酸序列，其中所述酶早期在所述植物宿主系统中的植物细胞的高尔基体中起作用，而不是作为甘露糖苷酶II(ManII)或者其中跨膜部分被删除而插入内质网滞留信号的被修饰的甘露糖苷酶II(ManII)和(c)编码包含包括一种酶但不限于甘露糖苷酶I(ManI)的CTS区(或片段，如包括跨膜结构域的片段)和N-乙酰葡糖胺基转移酶II(GnTII)的催化区(或其部分)的第三个杂合酶的核酸序列，其中所述酶早期在所述植物宿主系统中的植物细胞的高尔基体中起作用，而不是作为N-乙酰葡糖胺基转移酶II(GnTII)或者其中跨膜部分被删除而插入内质网滞留信号的被修饰的N-乙酰葡糖胺基转移酶II(GnTII)。编码N-乙酰葡糖胺基转移酶或甘露糖苷酶或所述跨膜片段的序列来自植物或来自真核的非植物生物体(如哺乳动物)。

还有在另一个优选实施方案中，本发明包括表达TmXyl-GaIT及ManIII的宿主细胞。在本发明的另一个实施方案中，半乳糖残基被增加到所述臂上，通过往所述植物宿主体系中导入(a)编码甘露糖苷酶III(ManIII的核酸序列，野生型基因序列但不限于：以及具有内质网滞留信号的ManIII；具有早期(顺式)高尔基体糖基转移酶(GnTI、ManI、GnTIII)的跨膜片段的ManIII。这些编码甘露糖苷酶III的序列来源于昆虫，优选来自草地夜蛾(Spodoptera fiugiperda)或黑腹果蝇(Drosophilamelanogaster)(不限于此)、人或来自其他生物体。

在还有另一个优选实施方案中，本发明包括表达TmXyl-GalT和ManIII及TmGnTI-GnTII的宿主细胞。在还有另一个优选实施方案中，本发明包括表达TmXyl-GalT和ManIII及TmManI-GnTI及TmManI-GnTII的宿主细胞。

在一个实施方案中，本发明的方法可选择地包含，往所述植物宿主体系中导入哺乳动物N-乙酰葡糖胺基转移酶(GnTIII)，优选为人GnTIII或包含哺乳动物GnTIII的催化部分，和一种蛋白质的跨膜部分的杂合蛋白，所述蛋白质位于真核细胞的ER或高尔基体的早期区室中。例如，在一个实施方案中，包括杂合酶TmXyl-GnTIII(以及编码这种杂合酶的核酸，含有这种核酸的载体，含有这种载体的宿主细胞和含有这种宿主细胞的植物或植物部分)。在另一个实施方案中，包括杂合酶TmFuc-GnTIII(以及编码这种杂合酶的核酸，含有这种核酸的载体，含有这种载体的宿主细胞和含有这种宿主细胞的植物或植物部分)。本发明特别地包括表达这种杂合酶(含有或不含有其他的杂合酶或其他糖基转移酶)的宿主细胞。

本发明还提供所述杂合酶或被修饰的酶，编码所述杂合酶的核酸序列，包含所制核酸序列的载体和获得所述杂合酶的方法。此外，本发明提供包含异源糖蛋白的植物宿主系统，该糖蛋白优选具有复合型双触角聚糖并至少在一个臂上含有至少一个半乳糖残基，不含木糖和海藻糖。“异源糖蛋白”是来源于一个非植物宿主系统的种类的糖蛋白。糖蛋白包括但不限于抗体、激素、生长因子和生长因子受体和抗原。

实际上，本发明特别可用于控制异源糖蛋白的糖基化，如抗体或抗体片段(单链抗体，Fab片段、Fab2片段、Fv片段等)。为了控制抗体的糖基化，编码本发明的杂合酶的基因构建体(如TmXyl-GaIT基因构建体)被导入到表达一种抗体(如单克隆抗体)或抗体片段的转基因植物中。另一方面，编码抗体(或抗体片段)的基因通过转化表达TmXyl-GaIT基因构建体来被导入。在还有一个实施方案中，含有TmXyl-GaIT表达盒的双元载体与含有在单一T-DNA上包含单克隆抗体的轻链和重链序列的表达盒的植物双元载体或者与含有在各个T-DNA上分别包含单克隆抗体的轻链和重链序列的表达盒的植物双元载体被共转化到植物中。在一个实施方案中，本发明特别地包括将表达抗体的植物与本发明的表达杂合型糖基转移酶的植物杂交。

“宿主系统”包括但不限于含有具有N-聚糖的糖蛋白的任何生物体。

“植物宿主系统”包括但不限于植物或其部分，其包括但不限于植物细胞、植物器官/或植物组织。植物可以是单子叶植物(monocot)，是一种开花植物，其种胚具有一片子叶(cotyledon)或子叶(seed leaf)，包括但不限于百合、禾本科植物、玉米(Zea mays)、水稻、谷物包括燕麦、小麦和大麦，兰花、鹫尾、洋葱和棕榈。可选择地，植物可以是双子叶植物(dicot)，其包括但不限于烟草(Nicotiana)、番茄、马铃薯、豆类(如紫花苜蓿和大豆)、玫瑰、雏菊(daises)、仙人掌、紫罗兰和浮萍。植物也可以是一种苔藓，包括但不限于Physcomitrellapaterls。

本发明还提供获得所述植物系统的方法。该方法包含将表达异源糖蛋白的植物与包含杂合酶(a)、(b)和(c)的植物杂交，杂合酶(a)包含通常不存在于植物中的半乳糖基转移酶的催化区(或其部分)和一种蛋白质的CTS区(或其片段，如包括跨膜结构域的片段)，其中所述蛋白质早期在所述植物宿主系统的植物细胞的高尔基体中起作用而不是作为半乳糖基转移酶或其中其跨膜部分已经被删除而插入内质网滞留信号的被修饰的半乳糖基转移酶；杂合酶(b)包含一种蛋白质特别是一种酶包括但不限于N-乙酰葡糖胺基转移酶I(GnTI)的CTS区(或其片段，如包括跨膜结构域的片段)和甘露糖苷酶II(ManII)的催化区(或其部分)，其中所述酶早期在所述植物宿主系统的植物细胞的高尔基体中起作用而不是作为甘露糖苷酶II或其中其跨膜部分已经被删除而插入内质网滞留信号的被修饰的甘露糖苷酶II和杂合酶(c)至少包含一种酶包括但不限于N-乙酰葡糖胺基转移酶I(GnTI)的糖基转移酶的跨膜区(如N末端的前40-60个氨基酸)和N-乙酰葡糖胺基转移酶II的催化区，其中所述酶早期在所述植物宿主系统的植物细胞的高尔基体中起作用而不是作为N-乙酰葡糖胺基转移酶II(GnTII)或其中其跨膜部分已经被删除而插入内质网滞留信号的被修饰的N-乙酰葡糖胺基转移酶II(GnTII)，从所述杂交中收获子代并筛选期望的子代植物，其表达所述异源糖蛋白。

本发明还提供构成植物宿主系统的所述植物或其部分。所述植物宿主系统还包含哺乳动物GnTIII酶或者包含哺乳动物GnTIII的催化部分和一种蛋白质的跨膜部分的杂合蛋白，所述蛋白质位于真核细胞的ER或高尔基体的早期区室中。

此外，本发明还提供植物宿主体系来制备期望的糖蛋白或其功能性片段的用途。本发明还提供获得期望糖蛋白或其功能性片段的方法，包含培养按照本发明的细胞直到所述植物已经达到收获阶段，例如生长足以有利收获的生物量，然后采用本领域已知的已有方法收获所述植物，用本领域已知的已有的技术分级所述植物材料，至少部分地从所述被分级的植物材料中分离所述糖蛋白。

此外，获得包含所述异源糖蛋白的所述植物宿主细胞体系还可以通过往植物宿主细胞体系或其部分中导入(a)编码包含通常不存在于植物中的半乳糖基转移酶的催化区和至少一种蛋白质的跨膜区(或CTS的更多部分)的杂合酶的核酸序列，所述蛋白质早期在所述植物宿主系统的植物细胞的高尔基体中起作用而不是作为半乳糖基转移酶或其中跨膜部分已经被删除而插入内质网滞留信号的被修饰的半乳糖基转移酶；(b)编码包含至少一种蛋白质特别是一种酶包括但不限于N-乙酰葡糖胺基转移酶I(GnTI)的跨膜区(如果需要可以是CTS区的更多部分)和甘露糖苷酶II(ManII)的催化区的第一个杂合酶的核酸序列，其中所述酶早期在所述植物宿主系统的植物细胞的高尔基体中起作用而不是作为甘露糖苷酶II或其中跨膜部分已经被删除而插入内质网滞留信号的被修饰的甘露糖苷酶II和(c)编码包含至少一种蛋白质特别是一种酶包括但不限于N-乙酰葡糖胺基转移酶I(GnTI)的跨膜区(如果需要可以是CTS区的大部分)和N-乙酰葡糖胺基转移酶II(GnTII)的催化区的第二个杂合酶的核酸序列，其中所述酶早期在所述植物宿主系统的植物细胞的高尔基体中起作用而不是作为N-乙酰葡糖胺基转移酶II(GnTII)或其中跨膜部分已经被删除而插入内质网滞留信号的被修饰的N-乙酰葡糖胺基转移酶II(GnTII)，和分离表达所述异源糖蛋白(或其部分)的植物或其部分。在一个实施方案中，包含所用核酸序列的载体被导入所述植物宿主系统中。在另一个实施方案中，每种核酸序列被插入各个载体中，并且这些载体被导入所述植物宿主系统中。在另一个实施方案中，两个或多个核酸序列的组合被插入到各个载体中，然后这些载体通过再转化或共转化或杂交被结合到所述植物宿主系统中。

本发明还提供使用本发明的这种植物来源的糖蛋白或其功能性片段来制备组合物，特别是药物组合物的用途，例如用抗体、激素、疫苗抗原、酶等处理患者。还提供这种包含糖蛋白或其功能性片段的药物组合物。

最后，可以预期上述的方法可以用于降低表达一种或多种本发明的杂合酶的植物中的聚糖的总体差异性(与野生型植物或仅用哺乳动物GaIT简单转化的植物比较)。

附图说明

附图1比较植物和哺乳动物中的糖蛋白的糖基化路径。

附图2显示用木糖基转移酶置换半乳糖基转移酶的CTS片段的效果。

附图3表示再定位甘露糖苷酶II和GlcNAcTII的其他影响。

附图4的上面组表示含有编码聚糖被修饰的酶的基因的T-DNA构建体，其有效生成不含有免疫原性的木糖和海藻糖的半乳糖基化的聚糖，下边组表示具有抗体轻链和重链基因的T-DNA构建体。

附图5表示人半乳糖基转移酶(人B1，4-半乳糖基转移酶-GaIT)的核酸序列(SEQ ID NO：1)。

附图6表示附图5的核酸序列以及相应的氨基酸序列(SEQ ID NO：2)。

附图7表示来自人半乳糖基转移酶的野生型氨基酸序列(SEQ ID NO：2)的示意性的突变序列(SEQ ID NO：59)，其中丝氨酸从胞质尾区被去除，而重复基序G-I-Y。当然这种变化仅仅是阐明本发明的保护范围内的多种可能的变化。例如，在一个实施方案中，本发明包括突变序列，其中仅进行(一次或多次)删除(如胞质尾区或茎干结构域中的删除)—没有插入或重复。类似地，在一个实施方案中，本发明包括突变序列，其中仅进行(一次或多次)插入或置换(如在跨膜结构域)—没有删除。

附图8表示编码包含人半乳糖基转移酶(人B1，4-半乳糖基转移酶-GaIT)的杂合酶的核酸序列(SEQ ID NO：3)。大写字母是拟南芥的β1，2-木糖基转移酶的mRNA的核苷酸(数据库登录：EMBL：ATH277603，所用的TmXyl片段包括这个数据库的序列的核苷酸135-297)。

附图9表示附图8的核酸序列以及相应的氨基酸序列(SEQ ID NO：4)。

附图10表示由附图8中的核酸编码的杂合酶的氨基酸序列(SEQ ID NO：4)。

附图11表示人糖基转移酶GnTIII的核酸序列(SEQ ID NO：5)(以及编码myc-标记的其他序列)(原始登录号(primary accession number)Q09327 GNT3 HUMAN)。

附图12表示附图11的核酸序列以及相应的氨基酸序列(SEQ ID NO：6)。

附图13表示人GnTIII的氨基酸序列(SEQ ID NO：6)(以及myc抗原决定簇标记的其他氨基酸序列SEQ ID NO：7)。

附图14表示编码本发明的杂合酶的一个实施方案的核酸序列(SEQ ID NO：9)，所述杂合酶包含植物木糖基转移酶(TmXyl-)的跨膜结构域和人GnTIII(TmXyl-GnTIII)(以及编码myc-标记的其他序列)的催化结构域(以及其他区域)。

附图15表示附图14的核酸序列以及相应的氨基酸序列(SEQ ID NO：10)。

附图16表示由附图14的核酸序列编码的杂合酶的氨基酸序列(SEQ ID NO：10)(以及myc抗原决定簇标记SEQ ID NO：7的其他序列)。

附图17表示编码杂合酶TmXyl-GaIT和TmGnTI-GnTII及TmGnTI-ManII的表达盒的完整核酸序列(SEQ ID NO：27)。

附图18表示编码杂合酶TmGnTI-ManII的表达盒的完整核酸序列(SEQ IDNO：28)(具有SEQ ID NO：39所示RbcSl启动子序列)。

附图19表示编码杂合酶TmGnTI-ManII的核酸序列(SEQ ID NO：29)。

附图20表示编码杂合酶TmGnTI-GnTII的核酸序列(SEQ ID NO：30)。

附图21表示编码杂合酶TmGnTI-GnTII的核酸序列(SEQ ID NO：31)，其中跨膜片段(被消化的TmGntI)具有SEQ ID NO：32所示核酸序列。

附图22A表示编码跨膜结构域片段(TmGnTI)的一个实施方案的核酸序列(SEQ ID NO：32)。附图22B表示编码跨膜结构域片段(TmManI)的另一个实施方案的核酸序列(SEQ ID NO：33)。

附图23表示本发明的三个表达盒的实施方案的完整核酸序列(SEQ IDNO：34)。

附图24表示杂合基因表达盒(TmManI-GnTI)的核酸序列(SEQ ID NO：35)。

附图25表示组蛋白3.1启动子的核酸序列(SEQ ID NO：36)。

附图26表示杂合基因融合(TmManI-TmGnTI)的核酸序列(SEQ ID NO：37)。

附图27表示杂合基因融合TmManI-ManII的核酸序列(SEQ ID NO：38)(具有SEQ ID NO：39所示RbcSl启动子序列)。

附图28表示RbcSl启动子的核酸序列(SEQ ID NO：39)。

附图29表示杂合基因TmManI-ManII的核酸序列(SEQ ID NO：40)，其中显示编码跨膜区片段的核酸序列(SEQ ID NO：33)。

附图30表示杂合基因TmManI-GnTII的核酸序列(SEQ ID NO：41)。

附图31表示Lhca启动子的核酸序列(SEQ ID NO：42)。

附图32表示杂合基因TmManI-GnTII的核酸序列(SEQ ID NO：43)，其中显示编码跨膜片段的核酸序列(SEQ ID NO：33)。

附图33表示所用终止子序列(见下文)的核酸序列(SEQ ID NO：44)。

附图34是与对照植物比较，检测本发明的植物总蛋白糖基化的蛋白质印迹。

附图35用RCA对杂交植物的子代F1进行血凝素印迹，所述子代按照本发明的一个实施方案制备。

附图36是蛋白质印迹。组A是用抗IgG抗体分析，组B用抗HRP的抗体分析，组C用特异性抗Xyl抗体片段分析。组D是用特异性抗海藻糖抗体片段分析。组E用血凝素RCA分析。

附图37表示杂合基因的核酸序列(SEQ ID NO：49，其中昆虫甘露糖苷酶III的氨基末端CTS区用小鼠信号肽取代，并且添加羧基末端的内质网滞留信号(KDEL)。

附图38表示附图37的核酸序列的相应氨基酸序列(SEQ ID NO：50)。

附图39表示杂合基因的核酸序列(SEQ ID NO：51)，其中人β1，4-半乳糖基转移酶(GalT)基因的氨基末端的CTS区用小鼠信号肽取代，并且添加羧基末端的内质网滞留信号(KDEL)。

附图40表示附图39的核酸序列的相应氨基酸序列(SEQ ID NO：52)。

附图41表示杂合基因的核酸序列(SEQ ID NO：53)，其中拟南芥GnTI基因的氨基末端的CTS区用小鼠信号肽取代，并且添加羧基末端的内质网滞留信号(KDEL)。

附图42表示附图41的核酸序列的相应氨基酸序列(SEQ ID NO：54)。

附图43表示杂合基因的核酸序列(SEQ ID NO：55)，其中拟南芥GnTII基因的氨基末端的CTS区用小鼠信号肽取代，并且添加羧基末端的内质网滞留信号(KDEL)。

附图44表示附图43的核酸序列的相应氨基酸序列(SEQ ID NO：56)。

附图45表示杂合酶的核酸序列(SEQ ID NO：57)，其中人β1，4-半乳糖基转移酶(GalT)基因的氨基末端的CTS区用人的GnTI基因的CTS区取代。

附图46表示附图45的核酸序列的相应氨基酸序列(SEQ ID NO：58)。

附图47是酶如何定位于高尔基体的示意图。

附图48是转移酶的区域“交换”如何引起再定位的非限制性的假定示意图。

发明详述

杂合酶

采用本领域已知的各种重组DNA操作，如多聚酶链式反应或筛选表达文库来删除具有相同结构特征的克隆DNA片段，可以获得编码各种糖基化酶如甘露糖苷酶、GicNAcTs、半乳糖基转移酶的核酸序列。参见，如Innis等，1990，PCR：方法和应用指南(A Guide to Methods and Application)，学院出版社，纽约。可以采用其他核酸扩增操作如连接酶链式反应(LCR)，连接激活转录(LAT)和核酸序列扩增(NASBA)或远程PCR。

一旦生成DNA片段，通过各种方式实现确定具有期望基因的特定DNA片段。例如，可以得到一定含量的基因的部分或其特定RNA或其片段，并被纯化和标记，可以通过核酸杂交到标记探针来筛选生成的DNA片段[Benton和Davis，科学196：180(1977)；Grunstein和Hogness，美国国家科学院汇编72：3961(1975)]。此外，可以通过基于表达产物的物理、化学或免疫特性的分析来检测基因的存在。例如，选择杂交筛选恰当mRNA的cDNA克隆或DNA克隆，其制备一种蛋白质，具有与目标蛋白已知的相似或相同的电泳迁移率、等电聚焦活性、蛋白水解消化图谱或抗原特性。

可如下获得编码包含第一个酶的跨膜部分和第二个酶的催化部分的杂合酶的核酸序列。编码跨膜部分的序列从第二个酶中去除，使得核酸序列包含编码第二个酶的C末端部分的序列，包括催化部位。编码第一个酶的跨膜部分的序列通过PCR被分离或得到，连接到编码包含第二个酶的C末端部分的序列的序列上。

被修饰的酶

去除编码跨膜片段的序列，用甲硫氨酸密码子(起始翻译)取代，和在半乳糖基转移酶的最后一个密码子和终止密码子之间插入编码ER滞留信号的核酸序列，如编码KDEL的序列(氨基酸残基序列：赖氨酸-天冬氨酸-亮氨酸)[Rothman，细胞50：521(1987)]，获得编码蛋白质特别是酶的核酸序列，如滞留在ER中的半乳糖基转移酶、甘露糖苷酶和N-乙酰葡胺基转移酶。

使用其结构域和部分

如上指出，词语“至少一部分”或“其片段”是指蛋白或肽保持其性质和天然功能所必需的最小氨基酸序列。例如，酶的功能是指其酶促或催化作用，在高尔基体中锚定一种蛋白质的能力，或作为一种信号肽。因此，词语“至少跨膜结构域的一部分”或“跨膜结构域的一个片段”分别指较大跨膜结构域的最小氨基酸片段，其仍然保留至少一部分天然的跨膜功能(例如，功能虽然降低了，但是明显的)。作为另一个例子，词语“至少催化区的一部分”或“催化区的一个片段”分别指较大催化结构域的最小氨基酸片段，其仍然至少保留部分的天然催化功能(例如，既便有所降低，但是存在)。如在此所讨论，本领域的技术人员将知晓一种蛋白质或肽保持至少一些天然蛋白质或肽功能的最小氨基酸片段。

根据所转移的糖类型，糖基转移酶典型地分成两个家族(半乳糖基转移酶，唾液酸转移酶等)。根据氨基酸相似性和立体化学的反应过程，糖基转移酶可以被分为至少27个和可能多达47个家族[Campbell等，生物化学杂志(Biochem.J.)326：929-939(1997)，生物化学杂志(Biochem.J.)329：719(1998)]。至今被克隆的大多数糖基转移酶是II型跨膜蛋白质(即在胞质中具有NH₂末端和在高尔基体的内腔具有COOH末端的单一的跨膜结构域)。无论将它们如何分类，所有糖基转移酶具有某些共同的结构特征：短的NH₂-末端胞质尾区，16-20个氨基酸信号锚或跨膜结构域，和扩展的茎干区，后面接着大的COOH-末端催化结构域。胞质尾似乎参与一些类型的糖基转移酶特异地定位于高尔基体[Milland等，生物学化学杂志(J.Biol.Chem.)277：10374-10378]。信号锚定结构域可以作为不可裂解的信号肽和作为跨膜区，指导糖基转移酶的催化结构域进入高尔基体的内腔。

在本发明的一个实施方案中，由Nicotiana benthamiana(烟草)乙酰葡糖胺基转移酶I的N-末端的77个氨基酸定义的部分被包含，用于杂合酶，由于该部分被发现足以在植物高尔基体中指向和保持报道蛋白[Essl等，FEBSLett453：169-173(1999)]。在烟草中，由假定的胞质的、跨膜的和茎干结构域构成的各种融合蛋白的亚细胞定位表明，仅胞质—跨膜结构域就足以保持β1，2-木糖基转移酶滞留在高尔基体中，而不需要任何腔序列的帮助[Dirnberger等，植物分子生物学(Plant Mol.Biol.)50：273-281(2002)]。因此，如上指出，本发明的一些实施方案采用仅包括胞质—跨膜结构域(或其部分)的CTS区部分，而未使用CTS区的茎干区。但是，一些类型糖基转移酶滞留高尔基体时主要依赖于其跨膜结构域，其他类型需要其跨膜区和该区的一端或两端的侧翼序列[Colley，糖生物学(Glycobiology)7：1-13(1997)]。例如，包含氨基酸1-32的N末端肽似乎是足以将β1，6N-乙酰葡糖胺基转移酶定位在高尔基体中的最小靶向信号。该肽组成这种酶的胞质结构域和跨膜结构域[Zerfaoui等，糖生物学(Glycobiology)12：15-24]。

大量特定糖基转移酶结构域的氨基酸序列的信息是可以获得的。例如，由GenBank登录号AAM17731提供的哺乳动物半乳糖基转移酶的氨基酸序列具有分别包括残基19-147和残基148-397的“茎”结构域和“催化”结构域[美国专利6,416,988，在此引入作为参考]和在一些实施方案中，本发明特别地包括将这些部分用于杂合酶。GenBank登录号AAC91156提供的大鼠肝脏唾液酸转移酶的氨基酸序列具有9个氨基酸的NH₂末端胞质尾区、17个氨基酸的信号锚定结构域，和包括暴露的茎区的腔结构域，接着是41kDa的催化结构域[Hudgin等，加拿大生物化学杂志(Can.J.Biochem.)49：829-837(1971)；美国专利5,032,519和5,776,772，在此引入作为参考]。已知的人和小鼠β1，3-半乳糖基转移酶具有催化结构域，其具有8个保守区[Kolbinger等，生物学化学杂志(J.Biol.Chem.)273：433-440(1998)；Hennet等，生物学化学杂志(J.Biol.Chem.)273：58-65(1998)；美国专利5,955,282，在此引入作为参考]。例如，由GenBank登录号NM020026提供的小鼠UDP-半乳糖：β-N-乙酰氨基葡萄糖β1，3-半乳糖基转移酶-I的氨基酸序列具有如下催化区：从残基78-83的区1；从残基93-102的区2；从残基116-119的区3；从残基147-158的区4；从172-183的区5；从残基203-206的区6；从残基236-246的区7；和从残基264-275的区8.[Hennet等，同上文]-所有这些区都被包含在本发明的一些实施方案中，作为上面讨论的杂合酶的有用部分。

先前在已知的糖基转移酶的cDNA克隆之间的比较表明，酶之间序列的同源性极低[Paulson等，生物化学杂志(J.Biol.Chem.)264：17615-618(1989)]，最新进展使得可能推导出特异性不同的糖基转移酶中的保守结构域[Kapitonov等，糖生物学(Glycobiology)9：961-978(1999)]。例如，通过采用由所得到的完整基因组序列提供的序列数据，已经确定各种生物体的大量糖基转移酶的核酸和氨基酸序列，如现代人(人类)、Caehorhabditis elegans(土壤线虫)、拟南芥(thale cress，芥菜)和Oryza sativa(水稻)。

作为广泛研究的结果，已经推导出各种糖基转移酶家族的一致结合位点的共同氨基酸序列。例如，唾液酸转移酶具有唾液酸基序(sialyl motif)，其似乎参与共同底物CMP-硅酸的识别[Paulson等，生物学化学杂志(J.Biol.Chem.)，264：17615-17618(1989)；Datta等，生物学化学杂志(J.Biol.Chem.)，270：1497-1500(1995)；Katsutoshi，糖科学糖技术趋势(Trends Glycosci.Glycotech.)8：195-215(1996)]。Galα1-3半乳糖基转移酶中的六肽RDKKND和GIcNAcβ1-4半乳糖基转移酶中的RDKKNE被认为是UDP-Gal的结合位点[(Joziasse等，生物学化学杂志(J.Biol.Chem.)，260：4941-4951(1985)，生物学化学杂志(J.Biol.Chem.)，264：14290-14297(1989)；Joziasse，糖生物学(Glycobiology)，2：271-277(1992))。

由两个天门冬氨酸残基构成小的高保守性基序(DXD)，通常被亲水区包围，已经在大量不同真核生物转移酶中被确定，包括α-1，3-甘露糖基转移酶，β-1，4-半乳糖基转移酶，α-1，3-半乳糖基转移酶，葡糖醛酸基转移酶，海藻糖基转移酶，糖原引物(glycogenins)等[Wiggins等，美国国家科学院汇编(Proc.Natl.Acad.Sci.U.S.A.)95：7945-7950(1998)]。突变试验表明这个基序是酶促活性所必需的[Busch等，生物学化学杂志(J.Biol.Chem.)273：19566-19572(1998)；Wang等，生物学化学杂志(J.Biol.Chem.)277：18568-18573(2002)]。多重肽对比表明一些对应于假定催化区的基序在所有β3-半乳糖基转移酶家族的成员中是保守的，也就是II型跨膜结构域，保守性DxD基序，N-糖基化位点和五个保守性胱氨酸[Gromova等，分子致癌性(Mol.Carcinog.)32：61-72(2001)]。

通过BLAST检索和多重对比，发现E-X₇-E基序在滞留糖基转移酶的四个家族的成员中是高度保守的。[Cid等，生物学化学杂志(J.Biol.Chem.)275：33614-33621(2000)]。O-连接乙酰葡糖胺基转移酶(GIcNAc)将一个P-N-乙酰氨基葡萄糖成分添加到特定丝氨酸或苏氨酸羟基上。BLAST分析、相同的二级结构预测和折叠识别研究表明，第二个Rossmann结构域中的保守基序对应UDP-GicNAc供体-结合位点[Wrabl等，分子生物学杂志(J.Mol.Biol.)314：365-374(2001)]。迄今确定的β1，3-糖基转移酶共有一些保守区和保守半胱氨酸残基，都位于假定的催化区。定点突变鼠β3GatT-I基因(登录号为AF029790)表明，保守性残基W101和W162参与UDP-半乳糖供体的结合，残基W315参与N-乙酰氨基葡萄糖β-p-硝基酚受体结合，包括E264的结构域似乎参与这两种底物的结合[Malissard等，欧洲生物化学杂志(Eur.J.Biochem.)269：233-239(2002)]。

在植物宿主系统中表达目标蛋白

按照本发明的一些实施方案，编码杂合或改进的酶或其他异源蛋白质如异源糖蛋白的核酸被插入到合适的表达载体中，即包含插入的编码序列的转录和翻译所需元件的载体，或者为RNA病毒载体的情况下，复制和翻译的必需元件，以及选择性标记。这些包括但不限于启动子区，信号序列，5’不翻译序列，起始密码子(取决于结构基因是否携带一个)，和转录和翻译终止序列。获得这些载体的方法在本领域是已知的(参见WO 01/29242作为综述)。

适合于植物中的表达的启动子序列在现有技术中被描述，如WO 91/198696。包括非组成型启动子或组成型启动子，如胭脂碱合成酶和章鱼碱合成酶启动子、花椰菜花叶病毒(CaMV)19S、35S启动子和玄参花叶病毒(FMV)35启动子(见美国专利5,352,605和6,051,753，都在此引入作为参考)。所用的启动子可以是组织特异性启动子，如靶向胚乳、糊粉层、胚胎、果皮、茎、叶、块茎、根等。

信号序列使蛋白质被恰当地加工和转移。信号来源于植物或者是非植物信号序列。信号肽指引初生多肽到内质网，随后多肽在此进行翻译后的修饰。信号肽可由本领域技术人员常规地确定。信号肽通常具有三联结构，在N末端具有正电荷氨基酸，接着是疏水区，然后在低疏水性区内具有裂解位点。

转录末端通常在转录起始调控区的相反端。其可能与转录起始区相关，来自不同基因，被选择用来增强表达。一个例子是来自农杆菌Ti质粒的NOS终止子和水稻α-淀粉酶终止子。还可以添加聚腺苷酸尾。例子包括但不限于农杆菌章鱼碱合成酶信号[Gielen等，EMBO J.3：835-846(1984)]或相同种类的胭脂碱合成酶[Depicker等，分子应用遗传学(Mol.Appl.Genet.)l：561-573(1982)]。

可以包括增强子来提高和/或最大化异源蛋白质的转录。这些包括但不限于肽排出信号序列、密码子选择、内含子、聚腺苷酰化和转录终止位点(见WO01/29242)。

标记优选包括原核生物的选择性标记。这种标记包括抗生素抗性如氨卡青霉素、四环素、卡那霉素和奇霉素。特别的例子包括但不限于编码链霉素抗性的链霉素磷酸转移酶(spt)基因、编码卡那霉素或遗传抗性的新霉素磷酸转移酶(nptII)基因、编码潮霉素抗性的潮霉素磷酸转移酶(hpt)基因。

采用本领域已知的方法(参见WO 01/29242和WO 01/31045)，将所构建的载体导入植物宿主系统中。载体被改进为介导植物转化质粒，含有与根癌农杆菌载体同源的区域、来自根癌农杆菌的T-DNA边界区。可选择地，用于本发明的方法的载体可以是农杆菌载体。导入载体的方法包括但不限于微注射，用具有核酸的小颗粒速度弹道穿透，核酸在小珠或颗粒的基质中或者在表面，以及电穿孔。载体被导入植物细胞、组织或器官中。在一个特别的实施方案中，一旦确定存在异源基因，可用本领域的已知方法再生植物。可以采用本领域已知的方法筛选期望的蛋白，优选采用筛选分析，其中以产生可检测的信号的方式来检测生物学活性位点。该信号可以直接或间接产生。这种分析的例子包括ELISA或放射免疫分析。

瞬时表达

本发明特别包括上述杂合酶的稳定表达和瞬时表达。用于转化大量各种高等植物种类来瞬时表达表达盒的技术是已知的[见如Weising等，Ann.Rev.Genet.22：421-477(1988)]。不同系统的变量包括被转化的核酸类型(DNA、RNA、质粒、病毒)、被转化的组织类型、导入转基因的方法和转化条件。例如可以采用从电转化、PEG poration、粒子轰击、硅纤维呈递、植物细胞原生质体或胚愈伤组织或其他植物组织微注射，或者农杆菌介导转化等范围内的技术[Hiei等，植物杂志(Plant J.)6：271-282(1994)]，将核酸构建体直接导入植物细胞中。由于转化效率是变化的，常常采用内参(如35S-Luc)来规格化转化效率。

用于瞬时分析的表达构建体包括质粒和病毒载体。可以用作载体的各种植物病毒在本领域是已知的，包括花椰菜花叶病毒(CaMV)、双粒病毒组、雀麦草花叶病毒和烟草花叶病毒。

适合于瞬时表达的植物组织包括培养的细胞，或者是完整的或者作为原生质体(其中细胞被去除)、培养的组织、培养的植物和植物组织如叶子。

一些瞬时表达的方法采用通过电转化或聚乙二醇介导将基因转化到植物细胞原生质体中。这些方法需要制备和培养植物原生质体，包括在原生质体上形成穿孔，核酸通过该孔被转化到原生质体的内部。

示例性的电转化技术在Fromm等，美国国家科学院(Proc.Natl.Acad.Sci.)82：5824(1985)中被描述。采用聚乙二醇穿透的DNA构建体导入在Paszkowski等，EMBO J.3：2717-2722(1984)中被描述。烟草原生质体的PEG-介导转化在Lyck等，(1997)植物界(Planta)202：117-125和Scharf等，(1998)分子细胞生物学(Mol Cell Biol)18：2240-2251，和Kirschner等，(2000)植物杂志(The PlantJ)24(3)：397-411中被描述，包括原生质体的分离、纯化和转化的步骤。这些方法已经被用于例如确定由外部刺激激活的启动子中的顺式作用元件，Abel和Theologis(1994)，植物杂志(Plant J)5：421-427；Hattori等，(1992)遗传发育(Genes Dev)6：609-618；Sablowski等，(1994)EMBO J 13：128-137；和Solano等，(1995)EMBO J 14：1773-1784)，以及其他的基因表达研究(美国专利6,376,747，在此引入作为参考)。

弹道转化技术在Klein等，(1987)自然(Nature)327：70-73中被描述。弹道瞬时转化用于悬浮细胞或植物器官。例如，其已经被开发用于烟草叶子，Godon等，(1993)Biochimie 75(7)：591-595。其还用于研究植物启动子，(Baum等，(1997)植物杂志(Plant J)12：463-469；Stromvik等，(1999)植物分子生物学(PlantMol Biol)41(2)：217-31，Tuerck和Fromm(1994)植物细胞(Plant Cell)6：1655-1663；和美国专利5,847,102，在此引入作为参考)，和用于表征转录因子(Goff等，(1990)EMBO J 9：2517-2522；Gubler等，(1999)植物杂志(Plant J)17：1-9；和Sainz等，(1997)植物细胞(Plant Cell)9：611-625)。

另一种方法可以原位可视化基因的瞬时表达，例如洋葱表皮剥落，其中可以观察到GFP在各种细胞腔室内表达(Scott等，(1999)生物技术(Biotechniques)26(6)：1128-1132。

还可以通过直接注射将核酸导入植物中。瞬时基因表达可以通过将DNA注射到植物的繁殖器官中来实现(见如，Pena等，(1987)自然，325：274)，如将DNA转化到花粉中(见如Zhou等，(1983)酶学中的方法(Methods inEnzymology)，10l：433；D.Hess(1987)Intern Rev.Cytol.，107：367；Luo等，(1988)植物分子生物学报道(Plant Mol.Biol.Reporter)，6：165。DNA还可以直接注射到未成熟的胚胎的细胞中(见如，Neuhaus等，(1987)Theor.Appl.Genet：75：30；和Benbrook等，(1986)Proceedings Bio Expo 1986，Butterworth，Stoneham，Mass，27-54)。

农杆菌介导的转化可以应用于双子叶植物和单子叶植物。用于禾本科植物如水稻和玉米的农杆菌介导的转化的最佳方法和载体已经被描述(见如，Heath等，(1997)分子植物微生物互作(Mol.Plant-Microbe Interact.)10：221-227；Hiei等，(1994)植物杂志(Plant J.)6：271-282和Ishida等，(1996)自然生物技术(Nat.Biotech.)14：745-750)。玉米转化的效率受到各种因素的影响，包括感染的组织的类型和阶段、农杆菌浓度、组织培养液、Ti载体和玉米基因型。

另一种有效的基本转化操作包括结合粒子轰击创伤，接着用农杆菌呈递DNA(见如，Bidney等，(1992)植物分子生物学(Plant Mol.Biol.)18：301-313)。完整的分生转化和断裂分生转化也是已知的(美国专利6,300,545在此引入作为参考)。

利用农杆菌的其他方法包括农杆菌感染法和农杆菌渗入。通过将病毒基因组插入T-DNA，农杆菌可用于介导植物的病毒感染(见如，美国专利6,300,545在此引入作为参考)。在将T-DNA转入植物细胞后，成功病毒感染要求病毒基因组从T-DNA上切除(转移)。这种用于将病毒导入植物宿主的农杆菌介导方法被称作农杆菌感染(见，如，Grimsley，“农杆菌感染”，325-342，分子生物学中的方法(Methods in Molecular Biology)，第44卷：农杆菌操作，Gartland和Davey编辑，Humana Press，Inc.，Totowa，新泽西州；Grisley(1990)Physiol.Plant.79：147-153)。

用于在植物中表达外源基因的植物病毒基因载体的发展提供了一种方法，在短时间内产生高水平的基因表达。适宜的表达复制子包括来自具有双链DNA基因组的病毒的双链DNA或者复制介质。被切除的病毒DNA可以独立地或者与翻译中添加因子一起作为复制子和复制介质。病毒DNA编码或不编码感染性的病毒颗粒，还可以具有插入、删除、取代、重排或其他修饰。病毒DNA含有异源DNA，可以是任何非病毒的或来自不同病毒的DNA。例如，异源DNA可以包含目标蛋白或RNA的表达盒。

具有农杆菌A28l和A348的病毒基因的超级双元载体可以用于单子叶植物的高效转化。但是，既便不采用高效的载体，已经证明T-DNA能有效地转化玉米，虽然不形成细胞瘤，但是产生由农杆菌诱导的病毒的系统性感染(Grimsley等，(1989)Mol.Gen.Genet.217：309-316)。这是由于含有病毒基因组的T-DNA的整合不要求病毒增殖，切除的病毒基因组作为独立的复制子。

另一种农杆菌介导的瞬时病毒分析基于农杆菌介导转化in planta的烟草叶片(Yang等，(2000)植物学杂志(The Plant J)22(6)：543-551)。这种方法采用含有质粒构建体的农杆菌侵入烟草叶片中，称作为农杆菌侵入；已经被用于体内分析在2-3天内的启动子和转录因子的表达。也可以原位检测外部刺激，如病原体感染和环境应激对启动子活性的影响。

实施例1

采用先前描述的基于亲缘种选择操作的PCR[Bakker等，BBRC 261：829(1999)]，从cDNA文库中分离编码β1，2-木糖基转移酶的拟南芥cDNA。用从兔抗辣根过氧化酶抗血清中纯化的木糖特异性抗体免疫染色被转化的CHO细胞，确定木糖基转移酶活性。用引物：

XylTpvuF：ATACTCGAGTTAACAATGAGTAAACGGAATC(SEQ ID NO：45)和

XylTpvuR：TTCTCGATCGCCGATTGGTTATTC(SEQ ID NO：46)

扩增含有木糖基转移酶的N末端部分的DNA片段，在起始密码子的前面引入XhoI和HpaI限制性位点，而在相反末端引入PvuI。用引物

GalTpvuF：GCCGCCGCGATCGGGCAGTCCTCC(SEQ ID NO：47)和

GalTrev：AACGGATCCACGCTAGCTCGGTGTCCCGAT(SEQ ID NO：48)

扩增人β1，4半乳糖基转移酶(登录号x55415，Aoki 1992)的C末端片段，然后引入PvuI和BamHI位点。将XhoI/PvuI和PvuI/BamHI的消化的PCR片段连接到用XhoI/BamHI消化的pBluescriptSK+上并测序。得到的开放阅读框编码融合蛋白，其含有与人β1，4半乳糖基转移酶的69-398氨基酸融合的拟南芥β1，2-木糖基转移酶的前54个氨基酸，称作为TmXyl-GalT。用HpaI/BamHI，将该片段克隆到植物表达载体中，位于CaMV35S启动子和Nos终止子之间。如天然的人β1，4半乳糖基转移酶[Bakker等，美国国家科学院汇编(Proc.Nat.Acad.Sci.USA)98：2899(2001)]一样，该克隆被导入烟草(samsun NN)中。

如描述[Bakker等，美国国家科学院汇编(Proc.Nat.Acad.Sci.USA)98：2899(2001)]，进行转基因植物蛋白质的提取和蛋白质印迹。根据血凝素RCA的反应，通过MALDI-TOF[Elbers等，植物生理学(Plant Physiology)126：1314(2001)]，选择表达TmXylGalT的转基因植物用于进一步分析聚糖，并与从表达天然β1，4半乳糖基转移酶的植物中分离的聚糖比较，以及与野生型植物的聚糖比较。表1中给出MALDI-TOF质谱的相对峰值区。也就是说，表1是对照烟草(“Tobacco”)、表达人β1，4-半乳糖基转移酶的转基因烟草(“GalT”)，以及CTS区用β-1，2-木糖基转移酶的CTS区取代的表达β-1.4-糖基转移酶的转基因烟草植物(“TmXyl-GaIT”)的内源性糖蛋白的N聚糖的质谱(MALDI-TOF)分析结果的比较。

表1
表1	m/z	类型	烟草	GalT	TmXyl-GaIT
	m/z	类型	烟草	GalT	TmXyl-GaIT

933	M3		3	7
933	M3		3	7	1065		XM3	10	16	3
1079	FM3			4	1065		XM3	10	16	3
1079	FM3			4	1095		M4			9
1211	FXM3	41	27		1095		M4			9
1211	FXM3	41	27		1257		M5	4	5	23
1268	GNXM3		4		1257		M5	4	5	23
1268	GNXM3		4		1298		GalGNM3			6
1298	GNM4				1298		GalGNM3
1298	GNM4			1414		GNFXM3	27	13	5
1419	M6	7	8	1414		GNFXM3	27	13	5	10
1419	M6	7	8	1460		GalGNM4			11	10
1460	GNM5			1460		GalGNM4
1460	GNM5			1485		GN2FM3		4
1576	GalGNFXM3		5	1485		GN2FM3		4
1576	GalGNFXM3			1576		GNFXM4
1581	M7	3		1576		GNFXM4				4
1581	M7	3	1606		GNXM5			3		4
1606	GalGNFM4		1606		GNXM5
1606	GalGNFM4		1617		GN2FXM3	8	9
1622	GalGNM5		1617		GN2FXM3	8	9		9
1622	GalGNM5		1622		GNM6
1743	M8		1622		GNM6			2		3
1743	M8		1768		GalGNFM5			2	3	3
1768	GNFM6		1768		GalGNFM5
1768	GNFM6		1779		GalGN2FXM3		2
1905	M9		1779		GalGN2FXM3		2		1
1905	M9		1941		Gal2GN2FXM3		2		1
			1941		Gal2GN2FXM3		2
					总计	100	100			101

这些数据表明：

1.在TmXylGalT植物中，聚糖的木糖基化和海藻糖基化显著地降低：与14％野生型植物相比，82％聚糖不携带木糖或海藻糖。

2.半乳糖苷化从GaIT植物的9％增加到TmXylGalT植物的32％。

实施例2

根据生物素标记RCA(Vector Laboratories，伯林盖姆，加利福尼亚)的血凝素印迹，筛选表达所述TmXyl-GaIT基因的转基因植物(TmXyl-GaIT-12植物)(如上)。用抗HRP(辣根过氧化酶)多克隆抗体(已知具有高抗木糖和抗海藻糖的反应性)，比较MGR48转基因植物(对照)、表达未被修饰的人β1，4-半乳糖基转移酶基因的被选择的转基因植物和TmXyl-GalT-12植物的蛋白质提取物中含有的木糖和海藻糖，结果表明木糖和海藻糖减少(附图34“抗辣根”)。采用抗HRP的抗木糖片段和抗海藻糖片段的蛋白质印迹(每种都在适宜的配体上通过亲合层析制备)表明，与对照植物相比，尤其降低了木糖(附图34：“抗-Fuc”和“抗-Xyl”)。

实施例3

TmXyl-GaIT-12植物与来自单一T-DNA整合事件的表达单克隆抗体MGR48的转基因植物(MGR48-31)杂交，首先通过选择不能由卡那霉素抗性标记和抗体产物分离的子代植物来纯合(MGR48-31-4)。用MGR48-31-4的花粉给去雄的TmXyl-GaIT-12植物授粉。相反，用TmXyl-GalT-12植物的花粉给去雄的MGR48-31-4植物授粉。通过蛋白质印迹，分析大量的F1植物是否存在MGR48，并采用RCA通过血凝素印迹分析内源性糖蛋白的半乳糖基化(附图35)。选择一种表达MGR48并具有内源性糖蛋白的半乳糖基化的植物，用于进一步分析。该植物称作为XGM8.

种植TmXyl-GalT-12( )×MGR48-31-4( )的种子，采用先前描述的常规技术，通过蛋白质印迹分析子代植物(XGM)的抗体产量和用生物素标记的RCA120(Vector Labs.，伯林盖姆，加利福尼亚)通过血凝素印迹分析半乳糖基化。所有植物如预期表达单克隆抗体MGR48，并且如RCA120的血凝素印迹所示，大部分植物还具有半乳糖基化的聚糖。个别表达抗体MGR48并具有半乳糖基化的N-聚糖的植物被选择用于进一步分析(XGM8)(TmXyl-GaIT-12×MGR48-31-4子代植物8)。如先前描述，从该植物中纯化到单克隆重组MGR48抗体，用于MALDI-TOF的N-聚糖分析。

简而言之，在最佳条件下，将XGM8植物种植在温室里来生产抗体[Elbers等，植物生理学(Plant Physiology)126：1314(2001)]。进行转基因植物XGM8叶片的蛋白质提取，如所述[Bakker等，美国国家科学院汇编(Proc.Nat.Acad.Sci.USA)98：2899(2001)]，用G蛋白层析纯化单克隆抗体。纯化的单克隆抗体的N-聚糖的MALDI-TOF被描述(Elbers等，2001，同上文)。如所述的采用牛睾丸β-半乳糖通过酶测序来确定聚糖上是否存在半乳糖(Bakker等，2001，同上文；表2)。表2(下文)是对TmXyl-GaIT-12植物与生产rec-mAb(MGR48)的植物的F1杂合子的内源性糖蛋白(“Xyl-GaIT Endo”)的N-聚糖和通过蛋白G层析从所述F1杂合子纯化的rec-mAB的N-聚糖的质谱分析(MALDI-TOF)的结构的比较。

表2	Xyl-GaIT Endo	Xyl-GaIT IgG
表2	Xyl-GaIT Endo	Xyl-GaIT IgG	m/z	类型
			m/z	类型

933	M3	6	4
933	M3	6	4	1065		XM3	2	2
1079	FM3	2	3	1065		XM3	2	2
1079	FM3	2	3	1095		M4	5	5
1136	GNM3	1	2	1095		M4	5	5
1136	GNM3	1	2	1211		FXM3	6	3
1241	FM4	3	2	1211		FXM3	6	3
1241	FM4	3	2	1257		M5	17	12
1268	GNXM3	1	2	1257		M5	17	12
1268	GNXM3	1	2	1282		GNFM3	2	3
1298	GalGNM3	3	4	1282		GNFM3	2	3
1298	GalGNM3	3	4	1403		FM5	4	3
1414	GNFXM3	2	4	1403		FM5	4	3
1414	GNFXM3	2	4	1419		M6	5	4
1430	GNXM4	2	2	1419		M6	5	4
1430	GNXM4			1430		GalGNXM3
1444	GNFM4			1430		GalGNXM3	1	3
1444	GNFM4	1444		GalGNFM3
1460	GalGNM4	1444		GalGNFM3	8	10
1460	GalGNM4	1460		GNM5
1471	GN2XM3	1460		GNM5			1
1471	GN2XM3	1485		GN2FM3	1	1	1
1501	GalGN2M3	1485		GN2FM3	1	1	1	1
1501	GalGN2M3	1576		GalGNFXM3	2	3	1	1
1576	GNFXM4	1576		GalGNFXM3
1576	GNFXM4	1581		M7			2	2
1593	GalGNXM4	1581		M7	1	2	2	2
1593	GalGNXM4	1593		GNXM5
1606	GNXM5	1593		GNXM5			3	4
1606	GNXM5	1606		GalGNFM4
1617	GN2FXM3	1606		GalGNFM4	2	1
1617	GN2FXM3	1622		GalGNM5	2	1	6	6
1622	GNM6	1622		GalGNM5
1622	GNM6	1647		GalGN2FM3	1	1
1663	Gal2GN2M3	1647		GalGN2FM3	1	1	1	1

1738	GNFXM5	1	2
1738	GNFXM5			1738		GalGNFXM4
1743	M8			1738		GalGNFXM4	1	2
1743	M8	1754		GalGNXM5	1	2	1	2
1768	GalGNFM5	1754		GalGNXM5	1	2	2	3
1768	GalGNFM5	1768		GNFM6
1784	GNM7	1768		GNFM6	1	1
1784	GNM7	1784		GalGNM6
1809	Gal2GN2FM3	1784		GalGNM6			2	1
1809	Gal2GN2FM3	1900		GNFXM6	1		2	1
1900	GalGNFXM5	1900		GNFXM6
1900	GalGNFXM5	1905		M9		1		1
		1905		M9		1		1
				总计		101		102

这些数据表明：

1.在F1杂合子中，聚糖的木糖基化和海藻糖基化显著下降，内源性糖蛋白的43％聚糖不含木糖和海藻糖，而野生型烟草植物仅为14％。

2.这种F1杂合子的纯化mAb的聚糖的木糖和海藻糖降低了47％，而野生型烟草为14％，见附图36组B-D。

3.F1杂合子的内源性糖蛋白的半乳糖基化从Ga1T植物的9％增加到F1TmXyl-GaIT X MGR48植物的37％。见附图35。

4.从所述F1中纯化的rec-mAb的半乳糖基化升高(见附图36组A)；即46％具有半乳糖。见附图36组E。

但是应当指出，所观察到的数量(MALDI-TOF)并不必然地反映体内所述糖型的分子比例。基于MALDI-TOF的量化可能是过低估计或过高估计，取决于所试验的特定糖型。此外，由于Gal和Man之间不存在分子量的差异，一些峰不能被清楚地被标注，除非在半乳糖苷酶处理前后特定分子的相对高度具有显著差别。

实施例4

通过检测来自杂交瘤、转基因烟草和TmXyl-GaIT转基因烟草中的MGR48IgG抗体，可以直接比较木糖、海藻糖和半乳糖的含量。如上所述，TmXyl-GaIT-12植物与表达MGR48IgG的烟草植物(MGR48烟草)杂交，产生具有MGR48 TmXyl-GaIT的F1杂合子。F1植物被选择用于提取和纯化MGR48IgG。采用G蛋白层析(Elbers等，2001.植物生理学(Plant Physiology)126：1314-1322)分离和纯化来自所述植物(烟草和TmXyl-GaIT)的抗体。将300ng的各种杂交瘤MGR48和植物来源的重组MGR48加载到预制的12％SDS-PAGE凝胶上(BioRad)，进行电泳。各个泳道的内容物如下：泳道1，杂交瘤MGR48；泳道2，从普通转基因烟草植物中纯化的重组MGR48；泳道3，从TmXyl-GaIT转基因植物中纯化的重组MGR48。在SDS-PAGE之后，用CAPS缓冲液将蛋白质转移到硝化纤维上。斑点与A，抗小鼠IgG；B，多克隆兔抗-HRP(抗木糖/α1，3-海藻糖)；C，抗木糖；D，抗(α1，3-)海藻糖抗体；和E，生物素化RCA一起温育。在与HRP标记的绵羊抗小鼠(组A)或山羊抗兔(组B-D)抗体和HRP-标记的链霉抗生物素(E)温育后，在Lumi图像仪中用Lumi光进行检测。

组A表明，在所有泳道中加载了几乎相同含量的MGR48IgG。L是指MGR48IgG轻链，H是指MGR48IgG的重链。组B表示MGR48抗体重链在泳道2(烟草)中如期望的与抗HRP激烈反应，而来自杂交瘤的MGR48的重链(泳道1)不反应(如预期)。来源杂交瘤的抗体不含有木糖和α1，3-海藻糖残基。特别地，来自TmXyl-GaIT烟草植物的MGR48抗体也不反应，表明来自这种植物的抗体的重链的N-聚糖上的木糖和海藻糖的含量显著降低(约90％或更多)。这得到组C(抗木糖)和D(抗海藻糖)表示的试验的证实。组E表明杂交瘤的MGR48抗体的重链(泳道1)具有半乳糖基化的N-聚糖，而烟草来源的MGR48(泳道2)没有，两个结果都是预期的。由于存在表达杂合酶的构建体，来自TmXyl-GalT植物MGR48重链(泳道3)也具有半乳糖基化的N-聚糖。

这些数据与从先前所示采用从类似植物(烟草和TmXyl-GaIT-12植物)提取的总蛋白的类似试验得到的数据一致，说明由TmXyl-GaIT基因的表达而引入烟草的新特性可以被稳定地传递给子代和重组单克隆抗体。

实施例5

用β-半乳糖苷酶处理来进一步表征上述F1杂合子。表3是在用β-半乳糖苷酶处理聚糖前后，用G蛋白层析从TmXyl-GaIT和MGR48植物的F1杂合子纯化的rec-mAbs的N-聚糖的质谱分析(MALDI-TOF)结果的比较。

表3		Xyl-GaIT IgG-	Xyl-GaIT IgG+β-半乳糖苷酶
表3				m/z		类型
				m/z		类型
		933		M3	4	4
1065	XM3	933		M3	4	4	2	2
1065	XM3	1079		FM3	3	3	2	2
1095	M4	1079		FM3	3	3	5	4
1095	M4	1136		GNM3	2	3	5	4
1211	FXM3	1136		GNM3	2	3	3	4
1211	FXM3	1241		FM4	2	2	3	4
1257	M5	1241		FM4	2	2	12	13
1257	M5	1268		GNXM3	2	3	12	13

1282	GNFM3	3	3
1282	GNFM3	3	3	1298		GalGNM3	4	4
1403	FM5	3	2	1298		GalGNM3	4	4
1403	FM5	3	2	1414		GNFXM3	4	5
1419	M6	4	3	1414		GNFXM3	4	5
1419	M6	4	3	1430		GNXM4	2	2
1430	GalGNXM3			1430		GNXM4
1430	GalGNXM3	1444		GNFM4	3	3
1444	GalGNFM3	1444		GNFM4
1444	GalGNFM3	1460		GalGNM4			10	14
1460	GNM5	1460		GalGNM4				14
1460	GNM5	1471		GN2XM3				1
1485	GN2FM3	1471		GN2XM3	1		1	1
1485	GN2FM3	1501		GalGN2M3	1	1	1
1576	GalGNFXM3	1501		GalGN2M3	3	1	3
1576	GalGNFXM3	1576		GNFXM4
1581	M7	1576		GNFXM4		2		2
1581	M7	1593		GalGNXM3	2	2	2	2
1593	GNXM5	1593		GalGNXM3
1593	GNXM5	1606		GNXM5		4		6
1606	GalGNFM4	1606		GNXM5
1606	GalGNFM4	1617		GN2FXM3	1		1
1622	GalGNM5	1617		GN2FXM3	1	6	1	1
1622	GalGNM5	1622		GNM6
1647	GalGN2FM3	1622		GNM6	1
1647	GalGN2FM3	1663		Gal2GN2M3	1	1
1738	GNFXM5	1663		Gal2GN2M3	2	1	2
1738	GNFXM5	1738		GalGNFXM4
1743	M8	1738		GalGNFXM4		2		2
1743	M8	1754		GalGNXM5	2	2	1	2
1768	GalGNFM5	1754		GalGNXM5	2	3	1	1
1768	GalGNFM5	1768		GNFM6
1784	GNM7	1768		GNFM6	1		1
1784	GNM7	1784		GalGNM6
1809	Gal2GN2FM3	1784		GalGNM6		1

1900	GNFXM6		1
1900	GNFXM6			1900	GalGNFXM5
1905	M9	1		1900	GalGNFXM5	1
1905	M9	1				1
	总计	102				100

这些数据表明：

1.来自F1杂合子的Rec-mAb含有半乳糖，这可以从在β-牛乳糖处理后所观察的特定糖型(含半乳糖)的减少和不含有半乳糖的糖型的增加推导出。观察到m/z 1622从6％降低到1％，同时m/z 1460从10％升高到14％，这是由于从GalGNM5去除半乳糖而加上了GNM5所致。m/z 1768(3％降低到1％)和相应的m/z 1606峰(从4％增加到6％)情况也如此。见附图36组E。

2.类似地，大量的峰是由于牛乳糖处理使含有半乳糖的聚糖减少导致的，特别是m/z 1501，1647和1663，说明存在半乳糖。

实施例6

在另一个实施方案中，昆虫甘露糖苷酶III基因(登录号：AF005034；错误地标注为甘露糖苷酶II基因！)的氨基末端的CTS区用进入内质网的小鼠信号肽编码序列取代(见附图37)。编码完全活性的信号肽的信号肽序列通常存在于IgG序列的氨基末端，先前已经在植物和其他生物体中成功地被使用。而且，编码所谓的内质网滞留序列(KDEL)的人工序列被添加到编码ER滞留的催化片段的基因部分的羧基末端。因此，由该基因序列编码的杂合型甘露糖苷酶III优选沉积在内质网中。

实施例7

在另一个实施方案中，人β-1，4半乳糖基转移酶(GalT)基因(登录号A52551)的氨基末端CTS区用编码进入内质网的小鼠信号肽的编码序列取代(见附图39)。编码完全活性的信号肽的信号肽序列通常存在于IgG序列的氨基末端，已经在植物和其他生物体中成功地被使用。而且，编码所谓内质网滞留序列(KDEL)的合成序列被添加到编码ER滞留的催化片段的基因部分的羧基末端。由该基因序列编码的杂合β-1，4半乳糖基转移酶蛋白将优选地沉积在内质网中。

实施例8

在另一个实施方案中，拟南芥GnTI(登录号：AJ243198)的氨基末端的CTS区用编码进入内质网的小鼠信号肽编码序列取代(见附图41)。编码完全活性的信号肽的信号肽序列通常存在于IgG序列的氨基末端，已经在植物和其他生物体中成功使用。而且，编码所谓内质网滞留序列(KDEL)的人工序列被添加到编码ER滞留的催化片段的基因部分的羧基末端。由该基因序列编码的杂合GnTI蛋白将优选地沉积在内质网中。

实施例9

在另一个实施方案中，拟南芥GnTII(登录号：AJ249274)的氨基末端的CTS区用编码进入内质网的小鼠信号肽编码序列取代(见附图43)。编码完全活性的信号肽的信号肽序列通常存在于IgG序列的氨基末端，已经在植物和其他生物体中成功地使用。而且，编码所谓内质网滞留序列(KDEL)的人工序列被添加到编码ER滞留的催化片段的基因部分的羧基末端。由该基因序列编码的杂合GnTII蛋白将优选地沉积在内质网中。

实施例10

在另一个实施方案中，人β-1，4-半乳糖基转移酶(GalT)基因氨基末端的CTS区用人GnTI(TmhuGnTI-GaIT)的CTS区基因取代(见附图45)。

应当理解，本发明不限于任何特定机制。也不需要理解该机制来成功应用本发明的各种实施方案。但是，一般认为，高尔基体酶是连续分布的(附图47)，植物糖基转移酶的跨膜结构域的交换引起重新定位(附图48)。

一般认为，本发明不限于在此描述的特定方法、操作、细胞系、载体和试剂，它们是可改变的。还应当理解，在此所用的术语仅是用于描述特定实施方案的目的，而不是限定本发明的保护范围。应当指出，在此和附加的权利要求中，除非文章中清楚指出，单数形式包括复数形式。除非另外定义，在此所用的所有科技术语具有本发明所属领域的普通技术人员通常理解的相同意义。

由于实施方案是用于阐明本发明的各个方面，在此描述和要求保护的发明不被限定在本文描述的特定实施例中。任何等价的实施方案被认为在本发明的保护范围内。实际上，除了本文给出和描述的内容，本发明的各种改进对于本领域技术人员来说根据先前描述的是显而易见的。这种改进也被认为落入附加权利要求的保护范围中。

本文引用的各种参考文献及其公开的内容全部被引入作为参考。

序列表

<110>国际植物研究所

<120>在植物中优化聚糖生成

<130>62861A-P033486W0

<150>US-60/365,735

<151>2002-03-19

<160>59

<170>PatentIn version 3.2

<210>1

<211>1197

<212>DNA

<213>类人

<400>1

atgaggcttc gggagccgct cctgagcggc agcgccgcga tgccaggcgc gtccctacag 60

cgggcctgcc gcctgctcgt ggccgtctgc gctctgcacc ttggcgtcac cctcgtttac 120

tacctggctg gccgcgacct gagccgcctg ccccaactgg tcggagtctc cacaccgctg 180

cagggcggct cgaacagtgc cgccgccatc gggcagtcct ccggggagct ccggaccgga 240

ggggcccggc cgccgcctcc tctaggcgcc tcctcccagc cgcgcccggg tggcgactcc 300

agcccagtcg tggattctgg ccctggcccc gctagcaact tgacctcggt cccagtgccc 360

cacaccaccg cactgtcgct gcccgcctgc cctgaggagt ccccgctgct tgtgggcccc 420

atgctgattg agtttaacat gcctgtggac ctggagctcg tggcaaagca gaacccaaat 480

gtgaagatgg gcggccgcta tgcccccagg gactgcgtct ctcctcacaa ggtggccatc 540

atcattccat tccgcaaccg gcaggagcac ctcaagtact ggctatatta tttgcaccca 600

gtcctgcagc gccagcagct ggactatggc atctatgtta tcaaccaggc gggagacact 660

atattcaatc gtgctaagct cctcaatgtt ggctttcaag aagccttgaa ggactatgac 720

tacacctgct ttgtgtttag tgacgtggac ctcattccaa tgaatgacca taatgcgtac 780

aggtgttttt cacagccacg gcacatttcc gttgcaatgg ataagtttgg attcagccta 840

ccttatgttc agtattttgg aggtgtctct gctctaagta aacaacagtt tctaaccatc 900

aatggatttc ctaataatta ttggggctgg ggaggagaag atgatgacat ttttaacaga 960

ttagttttta gaggcatgtc tatatctcgc ccaaatgctg tggtcgggag gtgtcgcatg 1020

atccgccact caagagacaa gaaaaatgaa cccaatcctc agaggtttga ccgaattgca 1080

cacacaaagg agacaatgct ctctgatggt ttgaactcac tcacctacca ggtgctggat 1140

gtacagagat acccattgta tacccaaatc acagtggaca tcgggacacc gagctag 1197

<210>2

<211>398

<212>PRT

<213>类人

<400>2

Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ser Ala Ala Met Pro Gly

1 5 10 15

Ala Ser Leu Gln Arg Ala Cys Arg Leu Leu Val Ala Val Cys Ala Leu

20 25 30

His Leu Gly Val Thr Leu Val Tyr Tyr Leu Ala Gly Arg Asp Leu Ser

35 40 45

Arg Leu Pro Gln Leu Val Gly Val Ser Thr Pro Leu Gln Gly Gly Ser

50 55 60

Asn Ser Ala Ala Ala Ile Gly Gln Ser Ser Gly Glu Leu Arg Thr Gly

65 70 75 80

Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg Pro

85 90 95

Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala Ser

100 105 110

Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu Pro

115 120 125

Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile Glu

130 135 140

Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro Asn

145 150 155 160

Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro His

165 170 175

Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu Lys

180 185 190

Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu Asp

195 200 205

Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr Ile Phe Asn Arg

210 215 220

Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp Tyr Asp

225 230 235 240

Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asn Asp

245 250 255

His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser Val Ala

260 265 270

Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln Tyr Phe Gly Gly

275 280 285

Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly Phe Pro

290 295 300

Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn Arg

305 310 315 320

Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Val Val Gly

325 330 335

Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu Pro Asn

340 345 350

Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met Leu Ser

355 360 365

Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln Arg Tyr

370 375 380

Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser

385 390 395

<210>3

<211>1152

<212>DNA

<213>杂合体

<400>3

atgagtaaac ggaatccgaa gattctgaag atttttctgt atatgttact tctcaactct 60

ctctttctca tcatctactt cgtttttcac tcatcgtcgt tttcaccgga gcagtcacag 120

cctcctcata tataccacgt ttcagtgaat aaccaatcgg cgatcgggca gtcctccggg 180

gagctccgga ccggaggggc ccggccgccg cctcctctag gcgcctcctc ccagccgcgc 240

ccgggtggcg actccagccc agtcgtggat tctggccctg gccccgctag caacttgacc 300

tcggtcccag tgccccacac caccgcactg tcgctgcccg cctgccctga ggagtccccg 360

ctgcttgtgg gccccatgct gattgagttt aacatgcctg tggacctgga gctcgtggca 420

aagcagaacc caaatgtgaa gatgggcggc cgctatgccc ccagggactg cgtctctcct 480

cacaaggtgg ccatcatcat tccattccgc aaccggcagg agcacctcaa gtactggcta 540

tattatttgc acccagtcct gcagcgccag cagctggact atggcatcta tgttatcaac 600

caggcgggag acactatatt caatcgtgct aagctcctca atgttggctt tcaagaagcc 660

ttgaaggact atgactacac ctgctttgtg tttagtgacg tggacctcat tccaatgaat 720

gaccataatg cgtacaggtg tttttcacag ccacggcaca tttccgttgc aatggataag 780

tttggattca gcctacctta tgttcagtat tttggaggtg tctctgctct aagtaaacaa 840

cagtttctaa ccatcaatgg atttcctaat aattattggg gctggggagg agaagatgat 900

gacattttta acagattagt ttttagaggc atgtctatat ctcgcccaaa tgctgtggtc 960

gggaggtgtc gcatgatccg ccactcaaga gacaagaaaa atgaacccaa tcctcagagg 1020

tttgaccgaa ttgcacacac aaaggagaca atgctctctg atggtttgaa ctcactcacc 1080

taccaggtgc tggatgtaca gagataccca ttgtataccc aaatcacagt ggacatcggg 1140

acaccgagct ag 1152

<210>4

<211>383

<212>PRT

<213>杂合体

<400>4

Met Ser Lys Arg Asn Pro Lys Ile Leu Lys Ile Phe Leu Tyr Met Leu

1 5 10 15

Leu Leu Asn Ser Leu Phe Leu Ile Ile Tyr Phe Val Phe His Ser Ser

20 25 30

Ser Phe Ser Pro Glu Gln Ser Gln Pro Pro His Ile Tyr His Val Ser

35 40 45

Val Asn Asn G1n Ser Ala Ile Gly Gln Ser Ser Gly Glu Leu Arg Thr

50 55 60

Gly Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg

65 70 75 80

Pro Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala

85 90 95

Ser Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu

100 105 110

Pro Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile

115 120 125

Glu Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro

130 135 140

Asn Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro

145 150 155 160

His Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu

165 170 175

Lys Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu

180 185 190

Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala3Gly Asp Thr Ile Phe Asn

195 200 205

Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp Tyr

210 215 220

Asp Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asn

225 230 235 240

Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser Val

245 250 255

Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val G1n Tyr Phe Gly

260 265 270

Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly Phe

275 280 285

Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn

290 295 300

Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Va1 Val

305 310 315 320

Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu Pro

325 330 335

Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met Leu

340 345 350

Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln Arg

355 360 365

Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser

370 375 380

<210>5

<211>1642

<212>DNA

<213>类人

<400>5

ccatggtgat gagacgctac aagctctttc tcatgttctg tatggccggc ctgtgcctca 60

tctccttcct gcacttcttc aagaccctgt cctatgtcac cttcccccga gaactggcct 120

ccctcagccc taacctggtg tccagctttt tctggaacaa tgccccggtc acgccccagg 180

ccagccccga gccaggaggc cctgacctgc tgcgtacccc actctactcc cactcgcccc 240

tgctgcagcc gctgccgccc agcaaggcgg ccgaggagct ccaccgggtg gacttggtgc 300

tgcccgagga caccaccgag tatttcgtgc gcaccaaggc cggcggcgtc tgcttcaaac 360

ccggcaccaa gatgctggag aggccgcccc cgggacggcc ggaggagaag cctgaggggg 420

ccaacggctc ctcggcccgg cggccacccc ggtacctcct gagcgcccgg gagcgcacgg 480

ggggccgagg cgcccggcgc aagtgggtgg agtgcgtgtg cctgcccggc tggcacggac 540

ccagctgcgg cgtgcccact gtggtgcagt actccaacct gcccaccaag gagcggctgg 600

tgcccaggga ggtgccgcgc cgcgtcatca acgccatcaa cgtcaaccac gagttcgacc 660

tgctggacgt gcgcttccac gagctgggcg acgtggtgga cgcctttgtg gtgtgcgagt 720

ccaacttcac ggcttatggg gagccgcggc cgctcaagtt ccgggagatg ctgaccaatg 780

gcaccttcga gtacatccgc cacaaggtgc tctatgtctt cctggaccac ttcccgcccg 840

gcggccggca ggacggctgg atcgccgacg actacctgcg caccttcctc acccaggacg 900

gcgtctcgcg gctgcgcaac ctgcggcccg acgacgtctt catcattgac gatgcggacg 960

agatcccggc ccgtgacggc gtccttttcc tcaagctcta cgatggctgg accgagccct 1020

tcgccttcca catgcgcaag tcgctctacg gcttcttctg gaagcagccg ggcaccctgg 1080

aggtggtgtc aggctgcacg gtggacatgc tgcaggcagt gtatgggctg gacggcatcc 1140

gcctgcgccg ccgccagtac tacaccatgc ccaacttcag acagtatgag aaccgcaccg 1200

gccacatcct ggtgcagtgg tcgctgggca gccccctgca cttcgccggc tggcactgct 1260

cctggtgctt cacgcccgag ggcatctact tcaagctcgt gtccgcccag aatggcgact 1320

tcccacgctg gggtgactac gaggacaagc gggacctgaa ctacatccgc ggcctgatcc 1380

gcaccggggg ctggttcgac ggcacgcagc aggagtaccc gcctgcagac cccagcgagc 1440

acatgtatgc gcccaagtac ctgctgaaga actacgaccg gttccactac ctgctggaca 1500

acccctacca ggagcccagg agcacggcgg cgggcgggtg gcgccacagg ggtcccgagg 1560

gaaggccgcc cgcccggggc aaactggacg aggcggaagt cgaacaaaaa ctcatctcag 1620

aagaggatct gaattaggat cc 1642

<210>6

<211>544

<212>PRT

<213>类人

<400>6

Met Val Met Arg Arg Tyr Lys Leu Phe Leu Met Phe Cys Met Ala Gly

1 5 10 15

Leu Cys Leu Ile Ser Phe Leu His Phe Phe Lys Thr Leu Ser Tyr Val

20 25 30

Thr Phe Pro Arg Glu Leu Ala Ser Leu Ser Pro Asn Leu Val Ser Ser

35 40 45

Phe Phe Trp Asn Asn Ala Pro Val Thr Pro Gln Ala Ser Pro Glu Pro

50 55 60

Gly Gly Pro Asp Leu Leu Arg Thr Pro Leu Tyr Ser His Ser Pro Leu

65 70 75 80

Leu Gln Pro Leu Pro Pro Ser Lys A1a Ala Glu Glu Leu His Arg Val

85 90 95

Asp Leu Val Leu Pro Glu Asp Thr Thr Glu Tyr Phe Val Arg Thr Lys

100 105 110

Ala Gly Gly Val Cys Phe Lys Pro Gly Thr Lys Met Leu Glu Arg Pro

115 120 125

Pro Pro Gly Arg Pro Glu Glu Lys Pro Glu Gly Ala Asn Gly Ser Ser

130 135 140

Ala Arg Arg Pro Pro Arg Tyr Leu Leu Ser Ala Arg Glu Arg Thr Gly

145 150 155 160

Gly Arg Gly Ala Arg Arg Lys Trp Val Glu Cys Val Cys Leu Pro Gly

165 170 175

Trp His Gly Pro Ser Cys Gly Val Pro Thr Val Val Gln Tyr Ser Asn

180 185 190

Leu Pro Thr Lys Glu Arg Leu Val Pro Arg Glu Val Pro Arg Arg Val

195 200 205

Ile Asn Ala Ile Asn Val Asn His Glu Phe Asp Leu Leu Asp Val Arg

210 215 220

Phe His Glu Leu Gly Asp Val Val Asp Ala Phe Val Val Cys Glu Ser

225 230 235 240

Asn Phe Thr Ala Tyr Gly Glu Pro Arg Pro Leu Lys Phe Arg Glu Met

245 250 255

Leu Thr Asn Gly Thr Phe Glu Tyr Ile Arg His Lys Val Leu Tyr Val

260 265 270

Phe Leu Asp His Phe Pro Pro Gly Gly Arg Gln Asp Gly Trp Ile Ala

275 280 285

Asp Asp Tyr Leu Arg Thr Phe Leu Thr Gln Asp Gly Val Ser Arg Leu

290 295 300

Arg Asn Leu Arg Pro Asp Asp Val Phe Ile Ile5Asp Asp Ala Asp Glu

305 310 315 320

Ile Pro Ala Arg Asp Gly Val Leu Phe Leu Lys Leu Tyr Asp Gly Trp

325 330 335

Thr Glu Pro Phe Ala Phe His Met Arg Lys Ser Leu Tyr Gly Phe Phe

340 345 350

Trp Lys Gln Pro Gly Thr Leu Glu Val Val Ser Gly Cys Thr Val Asp

355 360 365

Met Leu Gln Ala Val Tyr Gly Leu Asp Gly Ile Arg Leu Arg Arg Arg

370 375 380

Gln Tyr Tyr Thr Met Pro Asn Phe Arg Gln Tyr Glu Asn Arg Thr Gly

385 390 395 400

His Ile Leu Val Gln Trp Ser Leu Gly Ser Pro Leu His Phe Ala Gly

405 410 415

Trp His Cys Ser Trp Cys Phe Thr Pro Glu Gly Ile Tyr Phe Lys Leu

420 425 430

Val Ser Ala Gln Asn Gly Asp Phe Pro Arg Trp Gly Asp Tyr Glu Asp

435 440 445

Lys Arg Asp Leu Asn Tyr Ile Arg Gly Leu Ile Arg Thr Gly Gly Trp

450 455 460

Phe Asp Gly Thr Gln Gln Glu Tyr Pro Pro Ala Asp Pro Ser Glu His

465 470 475 480

Met Tyr Ala Pro Lys Tyr Leu Leu Lys Asn Tyr Asp Arg Phe His Tyr

485 490 495

Leu Leu Asp Asn Pro Tyr Gln Glu Pro Arg Ser Thr Ala Ala Gly Gly

500 505 510

Trp Arg His Arg Gly Pro Glu Gly Arg Pro Pro Ala Arg Gly Lys Leu

515 520 525

Asp Glu Ala Glu Val Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn

530 535 540

<210>7

<211>10

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>7

Glu Gln Lys Leu IIe Ser Glu Glu Asp Leu

1 5 10

<210>8

<211>31

<212>PRT

<213>类人

<400>8

Gln Glu Pro Arg Ser Thr Ala Ala Gly Gly Trp Arg His Arg Gly Pro

1 5 10 l5

Glu Gly Arg Pro Pro Ala Arg Gly Lys Leu Asp Glu Ala Glu Val

20 25 30

<210>9

<211>1614

<212>DNA

<213>杂合体

<400>9

catgagtaaa cggaatccga agattctgaa gatttttctg tatatgttac ttctcaactc 60

tctctttctc atcatctact tcgtttttca ctcatcgtcg ttttcaccgg agcagtcaca 120

gcctcctcat atataccacg tttcagtgaa taaccaatcg gcacatggag gccctgacct 180

gctgcgtacc ccactctact cccactcgcc cctgctgcag ccgctgccgc ccagcaaggc 240

ggccgaggag ctccaccggg tggacttggt gctgcccgag gacaccaccg agtatttcgt 300

gcgcaccaag gccggcggcg tctgcttcaa acccggcacc aagatgctgg agaggccgcc 360

cccgggacgg ccggaggaga agcctgaggg ggccaacggc tcctcggccc ggcggccacc 420

ccggtacctc ctgagcgccc gggagcgcac ggggggccga ggcgcccggc gcaagtgggt 480

ggagtgcgtg tgcctgcccg gctggcacgg acccagctgc ggcgtgccca ctgtggtgca 540

gtactccaac ctgcccacca aggagcggct ggtgcccagg gaggtgccgc gccgcgtcat 600

caacgccatc aacgtcaacc acgagttcga cctgctggac gtgcgcttcc acgagctggg 660

cgacgtggtg gacgcctttg tggtgtgcga gtccaacttc acggcttatg gggagccgcg 720

gccgctcaag ttccgggaga tgctgaccaa tggcaccttc gagtacatcc gccacaaggt 780

gctctatgtc ttcctggacc acttcccgcc cggcggccgg caggacggct ggatcgccga 840

cgactacctg cgcaccttcc tcacccagga cggcgtctcg cggctgcgca acctgcggcc 900

cgacgacgtc ttcatcattg acgatgcgga cgagatcccg gcccgtgacg gcgtcctttt 960

cctcaagctc tacgatggct ggaccgagcc cttcgccttc cacatgcgca agtcgctcta 1020

cggcttcttc tggaagcagc cgggcaccct ggaggtggtg tcaggctgca cggtggacat 1080

gctgcaggca gtgtatgggc tggacggcat ccgcctgcgc cgccgccagt actacaccat 1140

gcccaacttc agacagtatg agaaccgcac cggccacatc ctggtgcagt ggtcgctggg 1200

cagccccctg cacttcgccg gctggcactg ctcctggtgc ttcacgcccg agggcatcta 1260

cttcaagctc gtgtccgccc agaatggcga cttcccacgc tggggtgact acgaggacaa 1320

gcgggacctg aactacatcc gcggcctgat ccgcaccggg ggctggttcg acggcacgca 1380

gcaggagtac ccgcctgcag accccagcga gcacatgtat gcgcccaagt acctgctgaa 1440

gaactacgac cggttccact acctgctgga caacccctac caggagccca ggagcacggc 1500

ggcgggcggg tggcgccaca ggggtcccga gggaaggccg cccgcccggg gcaaactgga 1560

cgaggcggaa gtcgaacaaa aactcatctc agaagaggat ctgaattagg atcc 1614

<210>10

<211>535

<212>PRT

<213>杂合体

<400>10

Met Ser Lys Arg Asn Pro Lys Ile Leu Lys Ile Phe Leu Tyr Met Leu

1 5 10 15

Leu Leu Asn Ser Leu Phe Leu Ile Ile Tyr Phe Val Phe His Ser Ser

20 25 30

Ser Phe Ser Pro Glu Gln Ser Gln Pro Pro His Ile Tyr His Val Ser

35 40 45

Val Asn Asn Gln Ser Ala His Gly Gly Pro Asp Leu Leu Arg Thr Pro

50 55 60

Leu Tyr Ser His Ser Pro Leu Leu Gln Pro Leu Pro Pro Ser Lys Ala

65 7O 75 80

Ala Glu Glu Leu His Arg Val Asp Leu Val Leu Pro Glu Asp Thr Thr

85 90 95

Glu Tyr Phe Val Arg Thr Lys Ala Gly Gly Val Cys Phe Lys Pro Gly

100 105 110

Thr Lys Met Leu Glu Arg Pro Pro Pro Gly Arg Pro Glu Glu Lys Pro

115 120 125

Glu Gly Ala Asn Gly Ser Ser Ala Arg Arg Pro Pro Arg Tyr Leu Leu

130 135 140

Ser Ala Arg Glu Arg Thr Gly Gly Arg Gly Ala Arg Arg Lys Trp Val

145 150 155 160

Glu Cys Val Cys Leu Pro Gly Trp His Gly Pro Ser Cys Gly Val Pro

165 170 175

Thr Val Val Gln Tyr Ser Asn Leu Pro Thr Lys Glu Arg Leu Val Pro

180 185 190

Arg Glu Val Pro Arg Arg Val Ile Asn Ala Ile Asn Val Asn His Glu

195 200 205

Phe Asp Leu Leu Asp Val Arg Phe His Glu Leu Gly Asp Val Val Asp

210 215 220

Ala Phe Val Val Cys Glu Ser Asn Phe Thr Ala Tyr Gly Glu Pro Arg

225 230 235 240

Pro Leu Lys Phe Arg Glu Met Leu Thr Asn Gly Thr Phe Glu Tyr Ile

245 250 255

Arg His Lys Val Leu Tyr Val Phe Leu Asp His Phe Pro Pro Gly Gly

260 265 270

Arg Gln Asp Gly Trp Ile Ala Asp Asp Tyr Leu Arg Thr Phe Leu Thr

275 280 285

Gln Asp Gly Val Ser Arg Leu Arg Asn Leu Arg Pro Asp Asp Val Phe

290 295 300

Ile Ile Asp Asp Ala Asp Glu Ile Pro Ala Arg Asp Gly Val Leu Phe

305 310 315 320

Leu Lys Leu Tyr Asp Gly Trp Thr Glu Pro Phe Ala Phe His Met Arg

325 330 335

Lys Ser Leu Tyr Gly Phe Phe Trp Lys Gln Pro Gly Thr Leu Glu Val

340 345 350

Val Ser Gly Cys Thr Val Asp Met Leu Gln Ala Val Tyr Gly Leu Asp

355 360 365

Gly Ile Arg Leu Arg Arg Arg Gln Tyr Tyr Thr Met Pro Asn Phe Arg

370 375 380

Gln Tyr Glu Asn Arg Thr Gly His Ile Leu Val Gln Trp Ser Leu Gly

385 390 395 400

Ser Pro Leu His Phe Ala Gly Trp His Cys Ser Trp Cys Phe Thr Pro

405 410 415

Glu Gly Ile Tyr Phe Lys Leu Val Ser Ala Gln Asn Gly Asp Phe Pro

420 425 430

Arg Trp Gly Asp Tyr Glu Asp Lys Arg Asp Leu Asn Tyr Ile Arg Gly

435 440 445

Leu Ile Arg Thr Gly Gly Trp Phe Asp Gly Thr Gln Gln Glu Tyr Pro

450 455 460

Pro Ala Asp Pro Ser Glu His Met Tyr Ala Pro Lys Tyr Leu Leu Lys

465 470 475 480

Asn Tyr Asp Arg Phe His Tyr Leu Leu Asp Asn Pro Tyr Gln Glu Pro

485 490 495

Arg Ser Thr Ala Ala Gly Gly Trp Arg His Arg Gly Pro Glu Gly Arg

500 505 510

Pro Pro Ala Arg Gly Lys Leu Asp Glu Ala Glu Val Glu Gln Lys Leu

515 520 525

Ile Ser Glu Glu Asp Leu Asn

530 535

<210>11

<211>13

<212>DNA

<213>人工序列

<220>合成的

<223>

<400>11

aatacttcca ccc 13

<210>12

<211>34

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>12

ccacccgtta acaatgaagatgagacgcta caag 34

<210>13

<211>29

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>13

gggccatgga gatgagacgc tacaagctc 29

<210>14

<211>28

<212>DNA

<213>人工序列

<220>合成的

<223>

<400>14

ggatccaatg aagatgagac gctacaag 28

<210>15

<211>41

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>15

gggcccggga gatcctaatt cagatcctct tctgagatga g 41

<210>16

<211>35

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>16

cccggatcct aattcagatc ctcttctgag atgag 35

<210>17

<211>38

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>17

gggtctagat cctaattcag atcctcttct gagatgag 38

<210>18

<211>35

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>18

ccacccgtta acaatgagta aacggaatcc gaaga 35

<210>19

<211>35

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>19

gggccatggg taaacggaat ccgaagattc tgaag 35

<210>20

<211>34

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>20

cccggatcca tgagtaaacg gaatccgaag attc 34

<210>21

<211>29

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>21

gcgccccggg acgctagctc ggtgtcccg 29

<210>22

<211>25

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>22

cccggatcca cgctagctcg gtgtc 25

<210>23

<211>31

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>23

gggtctagat ccacgctagc tcggtgtccc g 31

<210>24

<211>39

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>24

ccacccgtta acaatgaggc ttcgggagcc gctcctgag 39

<210>25

<211>31

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>25

gggccatggg gcttcgggag ccgctcctga g 31

<210>26

<211>35

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>26

cccggatcca tgaggcttcg ggagccgctc ctgagll 35

<210>27

<211>7155

<212>DNA

<213>杂合体

<400>27

ggcgcgcctc gaggcgatcg cagatctaat ctaaccaatt acgatacgct ttgggtacac 60

ttgatttttg tttcagtggt tacatatatc ttgttttata tgctatcttt aaggatctgc 120

acaaagatta tttgttgatg ttcttgatgg ggctcagaag atttgatatg atacactcta 180

atctttagga gataccagcc aggattatat tcagtaagac aatcaaattt tacgtgttca 240

aactcgttat cttttcattc aaaggatgag ccagaatctt tatagaatga ttgcaatcga 300

gaatatgttc ggccgatatg cctttgttgg cttcaatatt ctacatatca cacaagaatc 360

gaccgtattg taccctcttt ccataaagga aaacacaata tgcagatgct tttttcccac 420

atgcagtaac atataggtat tcaaaaatgg ctaaaagaag ttggataaca aattgacaac 480

tatttccatt tctgttatat aaatttcaca acacacaaaa gcccgtaatc aagagtctgc 540

ccatgtacga aataacttct attatttggt attgggccta agcccagctc agagtacgtg 600

ggggtaccac atataggaag gtaacaaaat actgcaagat agccccataa cgtaccagcc 660

tctccttacc acgaagagat aagatataag acccaccctg ccacgtgtca catcgtcatg 720

gtggttaatg ataagggatt acatccttct atgtttgtgg acatgatgca tgtaatgtca 780

tgagccacag gatccaatgg ccacaggaac gtaagaatgt agatagattt gattttgtcc 840

gttagatagc aaacaacatt ataaaaggtg tgtatcaata ggaactaatt cactcattgg 900

attcatagaa gtccattcct cctaagtatc tagaaaccat ggcgaggatc tcgtgtgact 960

tgagatttct tctcatcccg gcagctttca tgttcatcta catccagatg aggcttttcc 1020

agacgcaatc acagtatgca gatcgcctca gttccgctat cgaatctgag aaccattgca 1080

ctagtcaaat gcgaggcctc atagatgaag ttagcatcaa acagtcgcgg attgttgccc 1140

tcgaagatat gaagaaccgc caggacgaag aacttgtgca gcttaaggat ctaatccaga 1200

cgtttgaaaa aaaaggaata gcaaaactca ctcaaggtgg agccatggat tccaattcag 1260

gcgccgtcgt tgatatcaca actaaagatc tatacgatag gattgagttt cttgatacag 1320

atggtggtcc atggaaacaa ggttggagag ttacgtataa agacgatgag tgggagaaag 1380

agaagctcaa aatcttcgtt gttcctcatt ctcataacga tcctggttgg aaattgactg 1440

tagaggagta ttatcagaga caatccagac atattcttga caccattgtt gagactttat 1500

ctaaggtatg acgaaagttt ttgcttttgg ttttaatatt ttaattctct cccatggtta l560

tcccgtgaac aatcttaaat gtcttaaaat tctcatgacg tcattaaact ctataaccaa 1620

acttctttgc tgggttctgt ttttttttag tttcgtgatg aaacagagtt ctagaagttc 1680

gttcttttgg aaaatttgaa gtctttggag ctaaagtttg tttttttatt actgggtttt 1740

gagattgaag gatagctaga atcttatttg tgtgggggtt tgttttgaat atgtttaata 1800

ggattcaaga agaaagttta tatgggagga gatgtcatat ctggagagat ggtggagaga 1860

cgcttcacct aataaacaag aagctttgac taaattggtt aaggatgggc agctagagat 1920

tgttggaggt ggctgggtta tgaatgatga ggctaattca cattattttg ccataattga 1980

acagatagca gagggtaata tgtggctgaa tgacacaatt ggggttattc ctaagaattc 2040

ttgggctata gatccctttg gctattcatc aaccatggct tatcttctcc ggcgtatggg 2100

ttttgaaaac atgcttattc aaaggactca ttacgagctc aagaaagacc ttgcccagca 2160

taagaatctt gaatatattt ggcgtcagag ctgggatgct atggaaacca cagatatctt 2220

tgttcatatg atgccgtttt attcatacga tatcccacac acttgtggac cagagcctgc 2280

aatttgctgt cagtttgatt tcgctcggat gcggggattt aagtatgaac tttgtccatg 2340

gggaaagcac ccagtggaga ccacactaga aaatgtgcag gagagggcat taaagcttct 2400

ggatcaatac aggaaaaaat ccactctata tcgaactaat acacttctta tacctcttgg 2460

agatgatttt aggtacatta gtatcgatga agccgaggct cagttccgta actaccagat 2520

gttgtttgat cacatcaact ctaatcctag tctaaacgca gaagcaaagt ttggtacttt 2580

ggaggattat ttcagaacag tccgagaaga agcagacaga gtgaattatt ctcgtcctgg 2640

tgaggttggc tctggtcagg ttgttggttt cccttctctg tcaggtgact tctttacata 2700

tgcagatagg caacaagact attggagtgg ttattatgtt tcaagacctt tcttcaaagc 2760

tgttgatcgt gtgctcgagc atacccttcg tggagctgag atcatgatgt catttctgct 2820

aggttattgc catcgaattc aatgtgagaa atttccaaca agttttacgt ataagttgac 2880

tgctgcaaga agaaatctgg ctcttttcca gcaccatgat ggggtaactg gaactgctaa 2940

ggattatgtg gtacaagatt acggcacccg gatgcatact tcattgcaag accttcagat 3000

ctttatgtct aaagcaatcg aagttcttct tgggatccgc cacgagaaag aaaaatctga 3060

tcaatcccca tcatttttcg aggcagagca aatgagatca aagtatgatg ctcggccagt 3120

tcacaagcca attgctgccc gggaaggaaa ttcgcacaca gttatactct tcaatccatc 3180

agaacagacg agagaggagg tggtgacggt tgttgttaac cgcgctgaaa tctcggtttt 3240

ggactcaaac tggacttgtg tccctagcca aatttctcct gaagtgcagc atgacgatac 3300

caaactattc accggcagac atcgccttta ctggaaagct tccatcccag ctcttggtct 3360

gagaacatat ttcattgcta atgggaatgt cgagtgtgag aaagctactc cgtctaaact 3420

caaatacgct tctgagtttg acccatttcc ttgtcctcct ccatattcct gctccaaact 3480

ggacaacgac gttactgaga tccgaaatga acatcagact cttgtgtttg atgtgaagaa 3540

cggatcactg cggaagatag tccatagaaa cggatcagag actgttgtgg gagaagagat 3600

aggtatgtac tctagtccag agagtggagc ttacctgttc aaaccagatg gtgaagctca 3660

gccaattgtt caacctgatg gacatgtagt cacctctgag ggtctgctgg ttcaagaagt 3720

cttctcttac cctaaaacca aatgggagaa atcacccctc tctcagaaaa ctcgtcttta 3780

cactggaggt aatacgcttc aggatcaagt ggtcgagata gaatatcatg ttgagcttct 3840

tggtaatgat tttgatgacc gggaattgat tgtccggtac aagactgatg ttgacaacaa 3900

gaaggtcttc tattcagatc tcaatggttt ccaaatgagc aggagagaaa cttatgataa 3960

gatccctctt caaggaaact actacccaat gccatctctc gcatttatcc aaggatccaa 4020

tggtcagaga ttctccgtgc actctcgtca atctctcggt gttgcaagcc tcaaagaggg 4080

ttggttggag attatgctgg acagacggtt ggttcgtgat gacggacggg gtctagggca 4140

aggtgtgatg gataaccgcg caatgaccgt ggtatttcac cttcttgcgg aatctaacat 4200

ttctcaagca gaccctgctt ccaacactaa cccgaggaac ccttcgcttc tctctcacct 4260

cataggtgct cacttaaact accccataaa cacattcatt gccaagaaac cgcaagacat 4320

atctgtgcgt gttccacaat acggttcctt tgctccttta gccaaaccgt taccatgtga 4380

cctccacatt gtaaatttca aggttcctcg tccatccaaa tactctcagc aattggaaga 4440

agacaagcca aggttcgctc ttatcctcaa tagacgagct tgggattcag cttattgcca 4500

taaaggaaga caagtaaact gcacaagcat ggctaatgaa ccagtaaact tttccgacat 4560

gttcaaagat cttgcagctt caaaggtaaa accaacttca ctgaatctct tgcaagaaga 4620

tatggagatt cttgggtacg atgaccaaga gctacctcga gatagttcac agccacggga 4680

aggacgtgtc tcgatctctc ccatggaaat acgagcttat aagcttgaac tgcgacctca 4740

caagtgaacc tgctgaagat ccgctagagt ccgcaaaaat caccagtctc tctctacaaa 4800

tctatctctc tctatttttc tccagaataa tgtgtgagta gttcccagat aagggaatta 4860

gggttcttat agggtttcgc tcatgtgttg agcatataag aaacccttag tatgtatttg 4920

tatttgtaaa atacttctat caataaaatt tctaatccta aaaccaaaat cccgcgcgcg 4980

cctcgaggcg atcgcagatc tcattatacc gttagaagca tagttaaaat ctaaagcttg 5040

tcgttaattc tagtcatttt acattgttgg gttctacatt attaatgaat tttctaatgc 5100

aaatacagaa tttaaatcaa aattgttgaa ttatgctaaa catgtaacat acgtatatct 5160

ccgccttgtg tgttgtatta acttgaagtt atcataagaa ccacaaatac actagtaaat 5220

ctatgagaag gcaggtggca acacaaacaa gagtatctaa gattttcatt tgtgactata 5280

ggaatataat atctcttatc tgatttaatg aatccacatg ttcacttctc atttgtccac 5340

aagatcacaa ctttatcttc aatattcaca acttgttata tccaccacaa tttcattctt 5400

ttcacttagc cccacaaaat actttgtccc cttatttgcc accttttgta tttaatttat 5460

tcttgtggag ctaagtgttc atattattct tcttctcaaa aaaacaaaaa caaaaaaaaa 5520

gagaagaaaa ccatggcgag gatctcgtgt gacttgagat ttcttctcat cccggcagct 5580

ttcatgttca tctacatcca gatgaggctt ttccagacgc aatcacagta tgcagatcgc 5640

ctcagttccg ctatcgaatc tgagaaccat tgcactagtc aaatgcgagg cctcatagat 5700

gaagttagca tcaaacagtc gcggattgtt gccctcgaag atatgaagaa ccgccaggac 5760

gaagaacttg tgcagcttaa ggatctaatc cagacgtttg aaaaaaaagg aatagcaaaa 5820

ctcactcaag gtggagccat ggctctaagg ttgcatagaa ggaaccattt ttcgcctaga 5880

aatacggatc tgttcccgga tttggcaaaa gatcgtgtgg ttatcgtctt gtatgtgcat 5940

aatcgggctc agtattttcg agtcacagtg gaaagtttgt cgaaggttaa aggtataagt 6000

gagacattgt tgattgttag tcatgatggt tactttgaag agatgaatag gattgtggag 6060

agtattaagt tttgtcaagt gaaacagatt ttctcgcctt attcgcctca tatatatcgt 6120

actagcttcc cgggtgtgac cctgaatgat tgtaagaaca agggtgatga ggcaaagggg 6180

cattgtgaag gtaatcctga tcagtatggg aatcatcggt ctccgaagat tgtatctttg 6240

aagcatcact ggtggtggat gatgaacact gtatgggatg ggttggaaga gactaaagga 6300

catgaggggc atatcctttt cattgaagaa gatcattttc tgtttcctaa tgcctatcgt 6360

aacatacaga ctcttacgag gctgaaaccc gcaaagtgtc ctgactgttt tgctgctaat 6420

ttagcaccgt ctgatgtgaa gtcaagagga gaagggcttg aaagtttggt tgcagagaga 6480

atgggaaatg ttgggtattc ttttaataga agtgtgtggg agaatattca tcagaaggca 6540

agagagtttt gtttctttga tgattacaac tgggatataa cgatgtgggc aacggttttc 6600

ccgtcgtttg gttccccggt gtacacattg cgagggccta ggactagtgc ggtacacttt 6660

ggaaaatgtg ggttgcatca aggtagagga gatgagggtg attgcatcga taatggggtc 6720

gtaaacatag aagttaagga aacagataaa gttgtgaaca taaaagaagg atggggagtt 6780

cgggtgtata agcatcaagc gggttataaa gccggtttcg aaggttgggg aggttggggc 6840

gatgataggg accgacattt atgtttggat tttgccacta tgtatcgtta cagcagtagc 6900

agtgcatctc catgaaacgg atccgctaga gtccgcaaaa atcaccagtc tctctctaca 6960

aatctatctc tctctatttt tctccagaat aatgtgtgag tagttcccag ataagggaat 7020

tagggttctt atagggtttc gctcatgtgt tgagcatata agaaaccctt agtatgtatt 7080

tgtatttgta aaatacttct atcaataaaa tttctaatcc taaaaccaaa atcccgcgag 7140

agacctctta attaa 7155

<210>28

<211>4993

<212>DNA

<213>杂合体

<400>28

ggcgcgcctc gaggcgatcg cagatctaat ctaaccaatt acgatacgct ttgggtacac 60

ttgatttttg tttcagtggt tacatatatc ttgttttata tgctatcttt aaggatctgc 120

acaaagatta tttgttgatg ttcttgatgg ggctcagaag atttgatatg atacactcta 180

atctttagga gataccagcc aggattatat tcagtaagac aatcaaattt tacgtgttca 240

aactcgttat cttttcattc aaaggatgag ccagaatctt tatagaatga ttgcaatcga 300

gaatatgttc ggccgatatg cctttgttgg cttcaatatt ctacatatca cacaagaatc 360

gaccgtattg taccctcttt ccataaagga aaacacaata tgcagatgct tttttcccac 420

atgcagtaac atataggtat tcaaaaatgg ctaaaagaag ttggataaca aattgacaac 480

tatttccatt tctgttatat aaatttcaca acacacaaaa gcccgtaatc aagagtctgc 540

ccatgtacga aataacttct attatttggt attgggccta agcccagctc agagtacgtg 600

ggggtaccac atataggaag gtaacaaaat actgcaagat agccccataa cgtaccagcc 660

tctccttacc acgaagagat aagatataag acccaccctg ccacgtgtca catcgtcatg 720

gtggttaatg ataagggatt acatccttct atgtttgtgg acatgatgca tgtaatgtca 780

tgagccacag gatccaatgg ccacaggaac gtaagaatgt agatagattt gattttgtcc 840

gttagatagc aaacaacatt ataaaaggtg tgtatcaata ggaactaatt cactcattgg 900

attcatagaa gtccattcct cctaagtatc tagaaaccat ggcgaggatc tcgtgtgact 960

tgagatttct tctcatcccg gcagctttca tgttcatcta catccagatg aggcttttcc 1020

agacgcaatc acagtatgca gatcgcctca gttccgctat cgaatctgag aaccattgca 1080

ctagtcaaat gcgaggcctc atagatgaag ttagcatcaa acagtcgcgg attgttgccc 1140

tcgaagatat gaagaaccgc caggacgaag aacttgtgca gcttaaggat ctaatccaga 1200

cgtttgaaaa aaaaggaata gcaaaactca ctcaaggtgg agccatggat tccaattcag 1260

gcgccgtcgt tgatatcaca actaaagatc tatacgatag gattgagttt cttgatacag 1320

atggtggtcc atggaaacaa ggttggagag ttacgtataa agacgatgag tgggagaaag 1380

agaagctcaa aatcttcgtt gttcctcatt ctcataacga tcctggttgg aaattgactg 1440

tagaggagta ttatcagaga caatccagac atattcttga caccattgtt gagactttat 1500

ctaaggtatg acgaaagttt ttgcttttgg ttttaatatt ttaattctct cccatggtta 1560

tcccgtgaac aatcttaaat gtcttaaaat tctcatgacg tcattaaact ctataaccaa 1620

acttctttgc tgggttctgt ttttttttag tttcgtgatg aaacagagtt ctagaagttc 1680

gttcttttgg aaaatttgaa gtctttggag ctaaagtttg tttttttatt actgggtttt 1740

gagattgaag gatagctaga atcttatttg tgtgggggtt tgttttgaat atgtttaata 1800

ggattcaaga agaaagttta tatgggagga gatgtcatat ctggagagat ggtggagaga 1860

cgcttcacct aataaacaag aagctttgac taaattggtt aaggatgggc agctagagat 1920

tgttggaggt ggctgggtta tgaatgatga ggctaattca cattattttg ccataattga 1980

acagatagca gagggtaata tgtggctgaa tgacacaatt ggggttattc ctaagaattc 2040

ttgggctata gatccctttg gctattcatc aaccatggct tatcttctcc ggcgtatggg 2100

ttttgaaaac atgcttattc aaaggactca ttacgagctc aagaaagacc ttgcccagca 2160

taagaatctt gaatatattt ggcgtcagag ctgggatgct atggaaacca cagatatctt 2220

tgttcatatg atgccgtttt attcatacga tatcccacac acttgtggac cagagcctgc 2280

aatttgctgt cagtttgatt tcgctcggat gcggggattt aagtatgaac tttgtccatg 2340

gggaaagcac ccagtggaga ccacactaga aaatgtgcag gagagggcat taaagcttct 2400

ggatcaatac aggaaaaaat ccactctata tcgaactaat acacttctta tacctcttgg 2460

agatgatttt aggtacatta gtatcgatga agccgaggct cagttccgta actaccagat 2520

gttgtttgat cacatcaact ctaatcctag tctaaacgca gaagcaaagt ttggtacttt 2580

ggaggattat ttcagaacag tccgagaaga agcagacaga gtgaattatt ctcgtcctgg 2640

tgaggttggc tctggtcagg ttgttggttt cccttctctg tcaggtgact tctttacata 2700

tgcagatagg caacaagact attggagtgg ttattatgtt tcaagacctt tcttcaaagc 2760

tgttgatcgt gtgctcgagc atacccttcg tggagctgag atcatgatgt catttctgct 2820

aggttattgc catcgaattc aatgtgagaa atttccaaca agttttacgt ataagttgac 2880

tgctgcaaga agaaatctgg ctcttttcca gcaccatgat ggggtaactg gaactgctaa 2940

ggattatgtg gtacaagatt acggcacccg gatgcatact tcattgcaag accttcagat 3000

ctttatgtct aaagcaatcg aagttcttct tgggatccgc cacgagaaag aaaaatctga 3060

tcaatcccca tcatttttcg aggcagagca aatgagatca aagtatgatg ctcggccagt 3120

tcacaagcca attgctgccc gggaaggaaa ttcgcacaca gttatactct tcaatccatc 3180

agaacagacg agagaggagg tggtgacggt tgttgttaac cgcgctgaaa tctcggtttt 3240

ggactcaaac tggacttgtg tccctagcca aatttctcct gaagtgcagc atgacgatac 3300

caaactattc accggcagac atcgccttta ctggaaagct tccatcccag ctcttggtct 3360

gagaacatat ttcattgcta atgggaatgt cgagtgtgag aaagctactc cgtctaaact 3420

caaatacgct tctgagtttg acccatttcc ttgtcctcct ccatattcct gctccaaact 3480

ggacaacgac gttactgaga tccgaaatga acatcagact cttgtgtttg atgtgaagaa 3540

cggatcactg cggaagatag tccatagaaa cggatcagag actgttgtgg gagaagagat 3600

aggtatgtac tctagtccag agagtggagc ttacctgttc aaaccagatg gtgaagctca 3660

gccaattgtt caacctgatg gacatgtagt cacctctgag ggtctgctgg ttcaagaagt 3720

cttctcttac cctaaaacca aatgggagaa atcacccctc tctcagaaaa ctcgtcttta 3780

cactggaggt aatacgcttc aggatcaagt ggtcgagata gaatatcatg ttgagcttct 3840

tggtaatgat tttgatgacc gggaattgat tgtccggtac aagactgatg ttgacaacaa 3900

gaaggtcttc tattcagatc tcaatggttt ccaaatgagc aggagagaaa cttatgataa 3960

gatccctctt caaggaaact actacccaat gccatctctc gcatttatcc aaggatccaa 4020

tggtcagaga ttctccgtgc actctcgtca atctctcggt gttgcaagcc tcaaagaggg 4080

ttggttggag attatgctgg acagacggtt ggttcgtgat gacggacggg gtctagggca 4140

aggtgtgatg gataaccgcg caatgaccgt ggtatttcac cttcttgcgg aatctaacat 4200

ttctcaagca gaccctgctt ccaacactaa cccgaggaac ccttcgcttc tctctcacct 4260

cataggtgct cacttaaact accccataaa cacattcatt gccaagaaac cgcaagacat 4320

atctgtgcgt gttccacaat acggttcctt tgctccttta gccaaaccgt taccatgtga 4380

cctccacatt gtaaatttca aggttcctcg tccatccaaa tactctcagc aattggaaga 4440

agacaagcca aggttcgctc ttatcctcaa tagacgagct tgggattcag cttattgcca 4500

taaaggaaga caagtaaact gcacaagcat ggctaatgaa ccagtaaact tttccgacat 4560

gttcaaagat cttgcagctt caaaggtaaa accaacttca ctgaatctct tgcaagaaga 4620

tatggagatt cttgggtacg atgaccaaga gctacctcga gatagttcac agccacggga 4680

aggacgtgtc tcgatctctc ccatggaaat acgagcttat aagcttgaac tgcgacctca 4740

caagtgaacc tgctgaagat ccgctagagt ccgcaaaaat caccagtctc tctctacaaa 4800

tctatctctc tctatttttc tccagaataa tgtgtgagta gttcccagat aagggaatta 4860

gggttcttat agggtttcgc tcatgtgttg agcatataag aaacccttag tatgtatttg 4920

tatttgtaaa atacttctat caataaaatt tctaatccta aaaccaaaat cccgcgagag 4980

acctcttaat taa 4993

<210>29

<211>3825

<212>DNA

<213>杂合体

<400>29

ccatggcgag gatctcgtgt gacttgagat ttcttctcat cccggcagct ttcatgttca 60

tctacatcca gatgaggctt ttccagacgc aatcacagta tgcagatcgc ctcagttccg 120

ctatcgaatc tgagaaccat tgcactagtc aaatgcgagg cctcatagat gaagttagca 180

tcaaacagtc gcggattgtt gccctcgaag atatgaagaa ccgccaggac gaagaacttg 240

tgcagcttaa ggatctaatc cagacgtttg aaaaaaaagg aatagcaaaa ctcactcaag 300

gtggagccat ggattccaat tcaggcgccg tcgttgatat cacaactaaa gatctatacg 360

ataggattga gtttcttgat acagatggtg gtccatggaa acaaggttgg agagttacgt 420

ataaagacga tgagtgggag aaagagaagc tcaaaatctt cgttgttcct cattctcata 480

acgatcctgg ttggaaattg actgtagagg agtattatca gagacaatcc agacatattc 540

ttgacaccat tgttgagact ttatctaagg tatgacgaaa gtttttgctt ttggttttaa 600

tattttaatt ctctcccatg gttatcccgt gaacaatctt aaatgtctta aaattctcat 660

gacgtcatta aactctataa ccaaacttct ttgctgggtt ctgttttttt ttagtttcgt 720

gatgaaacag agttctagaa gttcgttctt ttggaaaatt tgaagtcttt ggagctaaag 780

tttgtttttt tattactggg ttttgagatt gaaggatagc tagaatctta tttgtgtggg 840

ggtttgtttt gaatatgttt aataggattc aagaagaaag tttatatggg aggagatgtc 900

atatctggag agatggtgga gagacgcttc acctaataaa caagaagctt tgactaaatt 960

ggttaaggat gggcagctag agattgttgg aggtggctgg gttatgaatg atgaggctaa 1020

ttcacattat tttgccataa ttgaacagat agcagagggt aatatgtggc tgaatgacac 1080

aattggggtt attcctaaga attcttgggc tatagatccc tttggctatt catcaaccat 1140

ggcttatctt ctccggcgta tgggttttga aaacatgctt attcaaagga ctcattacga 1200

gctcaagaaa gaccttgccc agcataagaa tcttgaatat atttggcgtc agagctggga 1260

tgctatggaa accacagata tctttgttca tatgatgccg ttttattcat acgatatccc 1320

acacacttgt ggaccagagc ctgcaatttg ctgtcagttt gatttcgctc ggatgcgggg 1380

atttaagtat gaactttgtc catggggaaa gcacccagtg gagaccacac tagaaaatgt 1440

gcaggagagg gcattaaagc ttctggatca atacaggaaa aaatccactc tatatcgaac 1500

taatacactt cttatacctc ttggagatga ttttaggtac attagtatcg atgaagccga 1560

ggctcagttc cgtaactacc agatgttgtt tgatcacatc aactctaatc ctagtctaaa 1620

cgcagaagca aagtttggta ctttggagga ttatttcaga acagtccgag aagaagcaga 1680

cagagtgaat tattctcgtc ctggtgaggt tggctctggt caggttgttg gtttcccttc 1740

tctgtcaggt gacttcttta catatgcaga taggcaacaa gactattgga gtggttatta 1800

tgtttcaaga cctttcttca aagctgttga tcgtgtgctc gagcataccc ttcgtggagc 1860

tgagatcatg atgtcatttc tgctaggtta ttgccatcgaattcaatgtg agaaatttcc 1920

aacaagtttt acgtataagt tgactgctgc aagaagaaat ctggctcttt tccagcacca 1980

tgatggggta actggaactg ctaaggatta tgtggtacaa gattacggca cccggatgca 2040

tacttcattg caagaccttc agatctttat gtctaaagca atcgaagttc ttcttgggat 2100

ccgccacgag aaagaaaaat ctgatcaatc cccatcattt ttcgaggcag agcaaatgag 2160

atcaaagtat gatgctcggc cagttcacaa gccaattgct gcccgggaag gaaattcgca 2220

cacagttata ctcttcaatc catcagaaca gacgagagag gaggtggtga cggttgttgt 2280

taaccgcgct gaaatctcgg ttttggactc aaactggact tgtgtcccta gccaaatttc 2340

tcctgaagtg cagcatgacg ataccaaact attcaccggc agacatcgcc tttactggaa 2400

agcttccatc ccagctcttg gtctgagaac atatttcatt gctaatggga atgtcgagtg 2460

tgagaaagct actccgtcta aactcaaata cgcttctgag tttgacccat ttccttgtcc 2520

tcctccatat tcctgctcca aactggacaa cgacgttact gagatccgaa atgaacatca 2580

gactcttgtg tttgatgtga agaacggatc actgcggaag atagtccata gaaacggatc 2640

agagactgtt gtgggagaag agataggtat gtactctagt ccagagagtg gagcttacct 2700

gttcaaacca gatggtgaag ctcagccaat tgttcaacct gatggacatg tagtcacctc 2760

tgagggtctg ctggttcaag aagtcttctc ttaccctaaa accaaatggg agaaatcacc 2820

cctctctcag aaaactcgtc tttacactgg aggtaatacg cttcaggatc aagtggtcga 2880

gatagaatat catgttgagc ttcttggtaa tgattttgat gaccgggaat tgattgtccg 2940

gtacaagact gatgttgaca acaagaaggt cttctattca gatctcaatg gtttccaaat 3000

gagcaggaga gaaacttatg ataagatccc tcttcaagga aactactacc caatgccatc 3060

tctcgcattt atccaaggat ccaatggtca gagattctcc gtgcactctc gtcaatctct 3120

cggtgttgca agcctcaaag agggttggtt ggagattatg ctggacagac ggttggttcg 3180

tgatgacgga cggggtctag ggcaaggtgt gatggataac cgcgcaatga ccgtggtatt 3240

tcaccttctt gcggaatcta acatttctca agcagaccct gcttccaaca ctaacccgag 3300

gaacccttcg cttctctctc acctcatagg tgctcactta aactacccca taaacacatt 3360

cattgccaag aaaccgcaag acatatctgt gcgtgttcca caatacggtt cctttgctcc 3420

tttagccaaa ccgttaccat gtgacctcca cattgtaaat ttcaaggttc ctcgtccatc 3480

caaatactct cagcaattgg aagaagacaa gccaaggttc gctcttatcc tcaatagacg 3540

agcttgggat tcagcttatt gccataaagg aagacaagta aactgcacaa gcatggctaa 3600

tgaaccagta aacttttccg acatgttcaa agatcttgca gcttcaaagg taaaaccaac 3660

ttcactgaat ctcttgcaag aagatatgga gattcttggg tacgatgacc aagagctacc 3720

tcgagatagt tcacagccac gggaaggacg tgtctcgatc tctcccatgg aaatacgagc 3780

ttataagctt gaactgcgac ctcacaagtg aacctgctga agatc 3825

<210>30

<211>2181

<212>DNA

<213>杂合体

<400>30

ggcgcgcctc gaggcgatcg cagatctcat tataccgtta gaagcatagt taaaatctaa 60

agcttgtcgt taattctagt cattttacat tgttgggttc tacattatta atgaattttc 120

taatgcaaat acagaattta aatcaaaatt gttgaattat gctaaacatg taacatacgt 180

atatctccgc cttgtgtgtt gtattaactt gaagttatca taagaaccac aaatacacta 240

gtaaatctat gagaaggcag gtggcaacac aaacaagagt atctaagatt ttcatttgtg 300

actataggaa tataatatct cttatctgat ttaatgaatc cacatgttca cttctcattt 360

gtccacaaga tcacaacttt atcttcaata ttcacaactt gttatatcca ccacaatttc 420

attcttttca cttagcccca caaaatactt tgtcccctta tttgccacct tttgtattta 480

atttattctt gtggagctaa gtgttcatat tattcttctt ctcaaaaaaa caaaaacaaa 540

aaaaaagaga agaaaaccat ggcgaggatc tcgtgtgact tgagatttct tctcatcccg 600

gcagctttca tgttcatcta catccagatg aggcttttcc agacgcaatc acagtatgca 660

gatcgcctca gttccgctat cgaatctgag aaccattgca ctagtcaaat gcgaggcctc 720

atagatgaag ttagcatcaa acagtcgcgg attgttgccc tcgaagatat gaagaaccgc 780

caggacgaag aacttgtgca gcttaaggat ctaatccaga cgtttgaaaa aaaaggaata 840

gcaaaactca ctcaaggtgg agccatggct ctaaggttgc atagaaggaa ccatttttcg 900

cctagaaata cggatctgtt cccggatttg gcaaaagatc gtgtggttat cgtcttgtat 960

gtgcataatc gggctcagta ttttcgagtc acagtggaaa gtttgtcgaa ggttaaaggt 1020

ataagtgaga cattgttgat tgttagtcat gatggttact ttgaagagat gaataggatt l080

gtggagagta ttaagttttg tcaagtgaaa cagattttct cgccttattc gcctcatata 1140

tatcgtacta gcttcccggg tgtgaccctg aatgattgta agaacaaggg tgatgaggca 1200

aaggggcatt gtgaaggtaa tcctgatcag tatgggaatc atcggtctcc gaagattgta 1260

tctttgaagc atcactggtg gtggatgatg aacactgtat gggatgggtt ggaagagact 1320

aaaggacatg aggggcatat ccttttcatt gaagaagatc attttctgtt tcctaatgcc 1380

tatcgtaaca tacagactct tacgaggctg aaacccgcaa agtgtcctga ctgttttgct 14440

gctaatttag caccgtctga tgtgaagtca agaggagaag ggcttgaaag tttggttgca 1500

gagagaatgg gaaatgttgg gtattctttt aatagaagtg tgtgggagaa tattcatcag 1560

aaggcaagag agttttgttt ctttgatgat tacaactggg atataacgat gtgggcaacg 1620

gttttcccgt cgtttggttc cccggtgtac acattgcgag ggcctaggac tagtgcggta 1680

cactttggaa aatgtgggtt gcatcaaggt agaggagatg agggtgattg catcgataat 1740

ggggtcgtaa acatagaagt taaggaaaca gataaagttg tgaacataaa agaaggatgg 1800

ggagttcggg tgtataagca tcaagcgggt tataaagccg gtttcgaagg ttggggaggt 1860

tggggcgatg atagggaccg acatttatgt ttggattttg ccactatgta tcgttacagc 1920

agtagcagtg catctccatg aaacggatcc gctagagtcc gcaaaaatca ccagtctctc 1980

tctacaaatc tatctctctc tatttttctc cagaataatg tgtgagtagt tcccagataa 2040

gggaattagg gttcttatag ggtttcgctc atgtgttgag catataagaa acccttagta 2100

tgtatttgta tttgtaaaat acttctatca ataaaatttc taatcctaaa accaaaatcc 2160

cgcgagagac ctcttaatta a 2181

<210>31

<211>1394

<212>DNA

<213>杂合体

<400>31

ccatggcgag gatctcgtgt gacttgagat ttcttctcat cccggcagct ttcatgttca 60

tctacatca gatgaggctt ttccagacgc aatcacagta tgcagatcgc ctcagttccg 120

ctatcgaatc tgagaaccat tgcactagtc aaatgcgagg cctcatagat gaagttagca 180

tcaaacagtc gcggattgtt gccctcgaag atatgaagaa ccgccaggac gaagaacttg 240

tgcagcttaa ggatctaatc cagacgtttg aaaaaaaagg aatagcaaaa ctcactcaag 300

gtggagccat ggctctaagg ttgcatagaa ggaaccattt ttcgcctaga aatacggatc 360

tgttcccgga tttggcaaaa gatcgtgtgg ttatcgtctt gtatgtgcat aatcgggctc 420

agtattttcg agtcacagtg gaaagtttgt cgaaggttaa aggtataagt gagacattgt 480

tgattgttag tcatgatggt tactttgaag agatgaatag gattgtggag agtattaagt 540

tttgtcaagt gaaacagatt ttctcgcctt attcgcctca tatatatcgt actagcttcc 600

cgggtgtgac cctgaatgat tgtaagaaca agggtgatga ggcaaagggg cattgtgaag 660

gtaatcctga tcagtatggg aatcatcggt ctccgaagat tgtatctttg aagcatcact 720

ggtggtggat gatgaacact gtatgggatg ggttggaaga gactaaagga catgaggggc 780

atatcctttt cattgaagaa gatcattttc tgtttcctaa tgcctatcgt aacatacaga 840

ctcttacgag gctgaaaccc gcaaagtgtc ctgactgttt tgctgctaat ttagcaccgt 900

ctgatgtgaa gtcaagagga gaagggcttg aaagtttggt tgcagagaga atgggaaatg 960

ttgggtattc ttttaataga agtgtgtggg agaatattca tcagaaggca agagagtttt 1020

gtttctttga tgattacaac tgggatataa cgatgtgggc aacggttttc ccgtcgtttg 1080

gttccccggt gtacacattg cgagggccta ggactagtgc ggtacacttt ggaaaatgtg 1140

ggttgcatca aggtagagga gatgagggtg attgcatcga taatggggtc gtaaacacag 1200

aagttaagga aacagataaa gttgtgaaca taaaagaagg atggggagtt cgggtgtata 1260

agcatcaagc gggttataaa gccggtttcg aaggttgggg aggttggggc gatgataggg 1320

accgacattt atgtttggat tttgccacta tgtatcgtta cagcagtagc agtgcatctc 1380

catgaaacgg atcc 1394

<210>32

<211>312

<212>DNA

<213>拟南芥

<400>32

ccatggcgag gatctcgtgt gacttgagat ttcttctcat cccggcagct ttcatgttca 60

tctacatcca gatgaggctt ttccagacgc aatcacagta tgcagatcgc ctcagttccg 120

ctatcgaatc tgagaaccat tgcactagtc aaatgcgagg cctcatagat gaagttagca 180

tcaaacagtc gcggattgtt gccctcgaag atatgaagaa ccgccaggac gaagaacttg 240

tgcagcttaa ggatctaatc cagacgtttg aaaaaaaagg aatagcaaaa ctcactcaag 300

gtggǎgccat gg 312

<210>33

<211>276

<212>DNA

<213>Glycine max

<400>33

ccatggcgag agggagcaga tcagtgggta gcagcagcag caaatggagg tactgcaacc 60

cttcctatta cttgaagcgc ccaaagcgtc ttgctctgct cttcatcgtt ttcgtttgtg 120

tctctttcgt tttctgggac cgtcaaactc tcgtcagaga gcaccaggtt gaaatttctg 180

agctgcagaa agaagtgact gatttgaaaa atttggtgga tgatttaaat aacaaacaag 240

gtggtacctc tgggaaaact gacttgggga ccatgg 276

<210>34

<211>9240

<212>DNA

<213>杂合体

<400>34

ggcgcgcctc gaggcgatcg cagatccgat ataacaaaat ttgaatcgca cagatcgatc 60

tctttggaga ttctatacct agaaaatgga gacgattttc aaatctctgt aaaaattctg 120

gtttcttctt gacggaagaa gacgacgact ccaatatttc ggttagtact gaaccggaaa 180

gtttgactgg tgcaaccaat ttaatgtacc gtacgtaacg caccaatcgg attttgtatt 240

caatgggcct tatctgtgag cccattaatt gatgtgacgg cctaaactaa atccgaacgg 300

tttatttcag cgatccgcga cggtttgtat tcagccaata gcaatcaatt atgtagcagt 360

ggtgatcctc gtcaaaccag taaagctaga tctggaccgt tgaattggtg caagaaagca 420

catgttgtga tatttttacc cgtacgatta gaaaacttga gaaacacatt gataatcgat 480

aaaaaccgtc cgatcatata aatccgcttt accatcgttg cctataaatt aatatcaata 540

gccgtacacg cgtgaagact gacaatatta tctttttcga attcggagct caagtttgaa 600

attcggagaa gctagagagt tttctgataa ccatggcgag agggagcaga tcagtgggta 660

gcagcagcag caaatggagg tactgcaacc cttcctatta cttgaagcgc ccaaagcgtc 720

ttgctctgct cttcatcgtt ttcgtttgtg tctctttcgt tttctgggac cgtcaaactc 780

tcgtcagaga gcaccaggtt gaaatttctg agctgcagaa agaagtgact gatttgaaaa 840

atttggtgga tgatttaaat aacaaacaag gtggtacctc tgggaaaact gacttgggga 900

ccatgggaca gatgcctgtg gctgctgtag tggttatggc ctgcagtcgt gcagactatc 960

ttgaaaggac tgttaaatca gttttaacat atcaaactcc cgttgcttca aaatatcctc 1020

tatttatatc tcaggatgga tctgatcaag ctgtcaagag caagtcattg agctataatc 1080

aattaacata tatgcagcac ttggattttg aaccagtggt cactgaaagg cctggcgaac 1140

tgactgcgta ctacaagatt gcacgtcact acaagtgggc actggaccag ttgttttaca 1200

aacacaaatt tagtcgagtg attatactag aagatgatat ggaaattgct ccagacttct 1260

ttgattactt tgaggctgca gctagtctca tggataggga taaaaccatt atggctgctt 1320

catcatggaa tgataatgga cagaagcagt ttgtgcatga tccctatgcg ctataccgat 1380

cagatttttt tcctggcctt gggtggatgc tcaagagatc gacttgggat gagttatcac 1440

caaagtggcc aaaggcttac tgggatgatt ggctgagact aaaggaaaac cataaaggcc 1500

gccaattcat tcgaccggaa gtctgtagaa catacaattt tggtgaacat gggtctagtt 1560

tgggacagtt tttcagtcag tatctggaac ctataaagct aaacgatgtg acggttgact 1620

ggaaagcaaa ggacctggga tacctgacag agggaaacta taccaagtac ttttctggct 1680

tagtgagaca agcacgacca attcaaggtt ctgaccttgt cttaaaggct caaaacataa 1740

aggatgatgt tcgtatccgg tataaagacc aagtagagtt tgaacgcatt gcaggggaat 1800

ttggtatatt tgaagaatgg aaggatggtg tgcctcgaac agcatataaa ggagtagtgg 1860

tgtttcgaat ccagacaaca agacgtgtat tcctggttgg gccagattct gtaatgcagc 1920

ttggaattcg aaattcctga tgcggatccg ctagagtccg caaaaatcac cagtctctct 1980

ctacaaatct atctctctct atttttctcc agaataatgt gtgagtagtt cccagataag 2040

ggaattaggg ttcttatagg gtttcgctca tgtgttgagc atataagaaa cccttagtat 2100

gtatttgtat ttgtaaaata cttctatcaa taaaatttct aatcctaaaa ccaaaatccc 2160

gcgcctcgag gcgatcgcag atctaatcta accaattacg atacgctttg ggtacacttg 2220

atttttgttt cagtggttac atatatcttg ttttatatgc tatctttaag gatctgcaca 2280

aagattattt gttgatgttc ttgatggggc tcagaagatt tgatatgata cactctaatc 2340

tttaggagat accagccagg attatattca gtaagacaat caaattttac gtgttcaaac 2400

tcgttatctt ttcattcaaa ggatgagcca gaatctttat agaatgattg caatcgagaa 2460

tatgttcggc cgatatgcct ttgttggctt caatattcta catatcacac aagaatcgac 2520

cgtattgtac cctctttcca taaaggaaaa cacaatatgc agatgctttt ttcccacatg 2580

cagtaacata taggtattca aaaatggcta aaagaagttg gataacaaat tgacaactat 2640

ttccatttct gttatataaa tttcacaaca cacaaaagcc cgtaatcaag agtctgccca 2700

tgtacgaaat aacttctatt atttggtatt gggcctaagc ccagctcaga gtacgtgggg 2760

gtaccacata taggaaggta acaaaatact gcaagatagc cccataacgt accagcctct 2820

ccttaccacg aagagataag atataagacc caccctgcca cgtgtcacat cgtcatggtg 2880

gttaatgata agggattaca tccttctatg tttgtggaca tgatgcatgt aatgtcatga 2940

gccacaggat ccaatggcca caggaacgta agaatgtaga tagatttgat tttgtccgtt 3000

agatagcaaa caacattata aaaggtgtgt atcaatagga actaattcac tcattggatt 3060

catagaagtc cattcctcct aagtatctag aaaccatggc gagagggagc agatcagtgg 3120

gtagcagcag cagcaaatgg aggtactgca acccttccta ttacttgaag cgcccaaagc 3180

gtcttgctct gctcttcatc gttttcgttt gtgtctcttt cgttttctgg gaccgtcaaa 3240

ctctcgtcag agagcaccag gttgaaattt ctgagctgca gaaagaagtg actgatttga 3300

aaaatttggt ggatgattta aataacaaac aaggtggtac ctctgggaaa actgacttgg 3360

ggaccatgga ttccaattca ggcgccgtcg ttgatatcac aactaaagat ctatacgata 3420

ggattgagtt tcttgataca gatggtggtc catggaaaca aggttggaga gttacgtata 3480

aagacgatga gtgggagaaa gagaagctca aaatcttcgt tgttcctcat tctcataacg 3540

atcctggttg gaaattgact gtagaggagt attatcagag acaatccaga catattcttg 3600

acaccattgt tgagacttta tctaaggtat gacgaaagtt tttgcttttg gttttaatat 3660

tttaattctc tcccatggtt atcccgtgaa caatcttaaa tgtcttaaaa ttctcatgac 3720

gtcattaaac tctataacca aacttctttg ctgggttctg ttttttttta gtttcgtgat 3780

gaaacagagt tctagaagtt cgttcttttg gaaaatttga agtctttgga gctaaagttt 3840

gtttttttat tactgggttt tgagattgaa ggatagctag aatcttattt gtgtgggggt 3900

ttgttttgaa tatgtttaat aggattcaag aagaaagttt atatgggagg agatgtcata 3960

tctggagaga tggtggagag acgcttcacc taataaacaa gaagctttga ctaaattggt 4020

taaggatggg cagctagaga ttgttggagg tggctgggtt atgaatgatg aggctaattc 4080

acattatttt gccataattg aacagatagc agagggtaat atgtggctga atgacacaat 4140

tggggttatt cctaagaatt cttgggctat agatcccttt ggctattcat caaccatggc 4200

ttatcttctc cggcgtatgg gttttgaaaa catgcttatt caaaggactc attacgagct 4260

caagaaagac cttgcccagc ataagaatct tgaatatatt tggcgtcaga gctgggatgc 4320

tatggaaacc acagatatct ttgttcatat gatgccgttt tattcatacg atatcccaca 4380

cacttgtgga ccagagcctg caatttgctg tcagtttgat ttcgctcgga tgcggggatt 4440

taagtatgaa ctttgtccat ggggaaagca cccagtggag accacactag aaaatgtgca 4500

ggagagggca ttaaagcttc tggatcaata caggaaaaaa tccactctat atcgaactaa 4560

tacacttctt atacctcttg gagatgattt taggtacatt agtatcgatg aagccgaggc 4620

tcagttccgt aactaccaga tgttgtttga tcacatcaac tctaatccta gtctaaacgc 4680

agaagcaaag tttggtactt tggaggatta tttcagaaca gtccgagaag aagcagacag 4740

agtgaattat tctcgtcctg gtgaggttgg ctctggtcag gttgttggtt tcccttctct 4800

gtcaggtgac ttctttacat atgcagatag gcaacaagac tattggagtg gttattatgt 4860

ttcaagacct ttcttcaaag ctgttgatcg tgtgctcgag catacccttc gtggagctga 4920

gatcatgatg tcatttctgc taggttattg ccatcgaatt caatgtgaga aatttccaac 4980

aagttttacg tataagttga ctgctgcaag aagaaatctg gctcttttcc agcaccatga 5040

tggggtaact ggaactgcta aggattatgt ggtacaagat tacggcaccc ggatgcatac 5100

ttcattgcaa gaccttcaga tctttatgtc taaagcaatc gaagttcttc ttgggatccg 5160

ccacgagaaa gaaaaatctg atcaatcccc atcatttttc gaggcagagc aaatgagatc 5220

aaagtatgat gctcggccag ttcacaagcc aattgctgcc cgggaaggaa attcgcacac 5280

agttatactc ttcaatccat cagaacagac gagagaggag gtggtgacgg ttgttgttaa 5340

ccgcgctgaa atctcggttt tggactcaaa ctggacttgt gtccctagcc aaatttctcc 5400

tgaagtgcag catgacgata ccaaactatt caccggcaga catcgtcttt actggaaagc 5460

ttccatccca gctcttggtc tgagaacata tttcattgct aatgggaatg tcgagtgtga 5520

gaaagctact ccgtctaaac tcaaatacgc ttctgagttt gacccatttc cttgtcctcc 5580

tccatattcc tgctccaaac tggacaacga cgttactgag atccgaaatg aacatcagac 5640

tcttgtgttt gatgtgaaga acggatcact gcggaagata gtccatagaa acggatcaga 5700

gactgttgtg ggagaagaga taggtatgta ctctagtcca gagagtggag cttacctgtt 5760

caaaccagat ggtgaagctc agccaattgt tcaacctgat ggacatgtag tcacctctga 5820

gggtctgctg gttcaagaag tcttctctta ccctaaaacc aaatgggaga aatcacccct 5880

ctctcagaaa actcgtcttt acactggagg taatacgctt caggatcaag tggtcgagat 5940

agaatatcat gttgagcttc ttggtaatga ttttgatgac cgggaattga ttgtccggta 6000

caagactgat gttgacaaca agaaggtctt ctattcagat ctcaatggtt tccaaatgag 6060

caggagagaa acttatgata agatccctct tcaaggaaac tactacccaa tgccatctct 6120

cgcatttatc caaggatcca atggtcagag attctccgtg cactctcgtc aatctctcgg 6180

tgttgcaagc ctcaaagagg gttggttgga gattatgctg gacagacggt tggttcgtga 6240

tgacggacgg ggtctagggc aaggtgtgat ggataaccgc gcaatgaccg tggtattaaa 6300

ccttcttgcg gaatctaaca tttctcaagc agaccctgct tccaacacta acccgagaaa 6360

cccttcgctt ctctctcacc tcataggtgc tcacttaaac taccccataa acacattaat 6420

tgccaagaaa ccgcaagaca tatctgtgcg tgttccacaa tacggttcct ttgctccact 6480

agccaaaccg ttaccatgtg acctccacat tgtaaatttc aaggttcctc gtccatccaa 6540

atactctcag caattggaag aagacaagcc aaggttcgct cttatcctca atagacgagc 6600

ttgggattca gcttattgcc ataaaggaag acaagtaaac tgcacaagca tggctaatga 6660

accagtaaac ttttccgaca tgttcaaaga tcttgcagct tcaaaggtaa aaccaacttc 6720

actgaatctc ttgcaagaag atatggagat tcttgggtac gatgaccaag agctacctcg 6780

agatagttca cagccacggg aaggacgtgt ctcgatctct cccatggaaa tacgagctta 6840

taagcttgaa ctgcgacctc acaagtgaac ctgctgaaga tccgctagag tccgcaaaaa 6900

tcaccagtct ctctctacaa atctatttct ctctattttt ctccagaata atgtgtgagt 6960

agttcccaga taagggaatt agggttctta tagggtttcg ctcatgtgtt gagcatataa 7020

gaaaccctta gtatgtattt gtatttgtaa aatacttcta tcaataaaat ttctaatcct 7080

aaaaccaaaa tcccgcgcgc gcctcgaggc gatcgcagat ctcattatac cgttagaagc 7140

atagttaaaa tctaaagctt gtcgttaatt ctagtcattt tacattgttg ggttctacat 7200

tattaatgaa ttttctaatg caaatacaga atttaaatca aaattgttga attatgctaa 7260

acatgtaaca tacgtatatc tccgccttgt gtgttgtatt aacttgaagt tatcataaga 7320

accacaaata cactagtaaa tctatgagaa ggcaggtggc aacacaaaca agagtatcta 7380

agattttcat ttgtgactat aggaatataa tatctcttat ctgatttaat gaatccacat 7440

gttcacttct catttgtcca caagatcaca actttatctt caatattcac aacttgttat 7500

atccaccaca atttcattct tttcacttag ccccacaaaa tactttgtcc ccttatttgc 7560

caccttttgt atttaattta ttcttgtgga gctaagtgtt catattattc ttcttctcaa 7620

aaaaacaaaa acaaaaaaaa agagaagaaa accatggcga gagggagcag atcagtgggt 7680

agcagcagca gcaaatggag gtactgcaac ccttcctatt acttgaagcg cccaaagcgt 7740

cttgctctgc tcttcatcgt tttcgtttgt gtctctttcg ttttctggga ccgtcaaact 7800

ctcgtcagag agcaccaggt tgaaatttct gagctgcaga aagaagtgac tgatttgaaa 7860

aatttggtgg atgatttaaa taacaaacaa ggtggtacct ctgggaaaac tgacttgggg 7920

accatggctc taaggttgca tagaaggaac catttttcgc ctagaaatac ggatctgttc 7980

ccggatttgg caaaagatcg tgtggttatc gtcttgtatg tgcataatcg ggctcagtat 8040

tttcgagtca cagtggaaag tttgtcgaag gttaaaggta taagtgagac attgttgatt 8100

gttagtcatg atggttactt tgaagagatg aataggattg tggagagtat taagttttgt 8160

caagtgaaac agattttctc gccttattcg cctcatatat atcgtactag cttcccgggt 8220

gtgaccctga atgattgtaa gaacaagggt gatgaggcaa aggggcattg tgaaggtaat 8280

cctgatcagt atgggaatca tcggtctccg aagattgtat ctttgaagca tcactggtgg 8340

tggatgatga acactgtatg ggatgggttg gaagagacta aaggacatga ggggcatatc 8400

cttttcattg aagaagatca ttttctgttt cctaatgcct atcgtaacat acagactctt 8460

acgaggctga aacccgcaaa gtgtcctgac tgttttgctg ctaatttagc accgtctgat 8520

gtgaagtcaa gaggagaagg gcttgaaagt ttggttgcag agagaatggg aaatgttggg 8580

tattctttta atagaagtgt gtgggagaat attcatcaga aggcaagaga gttttgtttc 8640

tttgatgatt acaactggga tataacgatg tgggcaacgg ttttcccgtc gtttggttcc 8700

ccggtgtaca cattgcgagg gcctaggact agtgcggtac actttggaaa atgtgggttg 8760

catcaaggta gaggagatga gggtgattgc atcgataatg gggtcgtaaa catagaagtt 8820

aaggaaacag ataaagttgt gaacataaaa gaaggatggg gagttcgggt gtataagcat 8880

caagcgggtt ataaagccgg tttcgaaggt tggggaggtt ggggcgatga tagggaccga 8940

catttatgtt tggattttgc cactatgtat cgttacagca gtagcagtgc atctccatga 9000

aacggatccg ctagagtccg caaaaatcac cagtctctct ctacaaatct atctctctct 9060

atttttctcc agaataatgt gtgagtagtt cccagataag ggaattaggg ttcttatagg 9120

gtttcgctca tgtgttgagc atataagaaa cccttagtat gtatttgtat ttgtaaaata 9180

cttctatcaa taaaatttct aatcctaaaa ccaaaatccc gcgagagacc tcttaattaa 9240

<210>35

<211>2180

<212>DNA

<213>杂合体

<400>35

ggcgcgcctc gaggcgatcg cagatccgat ataacaaaat ttgaatcgca cagatcgatc 60

tctttggaga ttctatacct agaaaatgga gacgattttc aaatctctgt aaaaattctg 120

gtttcttctt gacggaagaa gacgacgact ccaatatttc ggttagtact gaaccggaaa 180

gtttgactgg tgcaaccaat ttaatgtacc gtacgtaacg caccaatcgg attttgtatt 240

caatgggcct tatctgtgag cccattaatt gatgtgacgg cctaaactaa atccgaacgg 300

tttatttcag cgatccgcga cggtttgtat tcagccaata gcaatcaatt atgtagcagt 360

ggtgatcctc gtcaaaccag taaagctaga tctggaccgt tgaattggtg caagaaagca 420

catgttgtga tatttttacc cgtacgatta gaaaacttga gaaacacatt gataatcgat 480

aaaaaccgtc cgatcatata aatccgcttt accatcgttg cctataaatt aatatcaata 540

gccgtacacg cgtgaagact gacaatatta tctttttcga attcggagct caagtttgaa 600

attcggagaa gctagagagt tttctgataa ccatggcgag agggagcaga tcagtgggta 660

gcagcagcag caaatggagg tactgcaacc cttcctatta cttgaagcgc ccaaagcgtc 720

ttgctctgct cttcatcgtt ttcgtttgtg tctctttcgt tttctgggac cgtcaaactc 780

tcgtcagaga gcaccaggtt gaaatttctg agctgcagaa agaagtgact gatttgaaaa 840

atttggtgga tgatttaaat aacaaacaag gtggtacctc tgggaaaact gacttgggga 900

ccatgggaca gatgcctgtg gctgctgtag tggttatggc ctgcagtcgt gcagactatc 960

ttgaaaggac tgttaaatca gttttaacat atcaaactcc cgttgcttca aaatatcctc 1020

tatttatatc tcaggatgga tctgatcaag ctgtcaagag caagtcattg agctataatc 1080

aattaacata tatgcagcac ttggattttg aaccagtggt cactgaaagg cctggcgaac 1140

tgactgcgta ctacaagatt gcacgtcact acaagtgggc actggaccag ttgttttaca 1200

aacacaaatt tagtcgagtg attatactag aagatgatat ggaaattgct ccagacttct 1260

ttgattactt tgaggctgca gctagtctca tggataggga taaaaccatt atggctgctt 1320

catcatggaa tgataatgga cagaagcagt ttgtgcatga tccctatgcg ctataccgat l380

cagatttttt tcctggcctt gggtggatgc tcaagagatc gacttgggat gagttatcac 1440

caaagtggcc aaaggcttac tgggatgatt ggctgagact aaaggaaaac cataaaggcc l500

gccaattcat tcgaccggaa gtctgtagaa catacaattt tggtgaacat gggtctagtt 1560

tgggacagtt tttcagtcag tatctggaac ctataaagct aaacgatgtg acggttgact 1620

ggaaagcaaa ggacctggga tacctgacag agggaaacta taccaagtac ttttctggct 1680

tagtgagaca agcacgacca attcaaggtt ctgaccttgt cttaaaggct caaaacataa 1740

aggatgatgt tcgtatccgg tataaagacc aagtagagtt tgaacgcatt gcaggggaat 1800

ttggtatatt tgaagaatgg aaggatggtg tgcctcgaac agcatataaa ggagtagtgg 1860

tgtttcgaat ccagacaaca agacgtgtat tcctggttgg gccagattct gtaatgcagc 1920

ttggaattcg aaattcctga tgcggatccg ctagagtccg caaaaatcac cagtctctct 1980

ctacaaatct atctctctct atttttctcc agaataatgt gtgagtagtt cccagataag 2040

ggaattaggg ttcttatagg gtttcgctca tgtgttgagc atataagaaa cccttagtat 2100

gtatttgtat ttgtaaaata cttctatcaa taaaatttct aatcctaaaa ccaaaatccc 2160

gcgagagacc tcttaattaa 2180

<210>36

<211>615

<212>DNA

<213>拟南芥

<400>36

ggatccgata taacaaaatt tgaatcgcac agatcgatct ctttggagat tctataccta 60

gaaaatggag acgattttca aatctctgta aaaattctgg tttcttcttg acggaagaag 120

acgacgactc caatatttcg gttagtactg aaccggaaag tttgactggt gcaaccaatt 180

taatgtaccg tacgtaacgc accaatcgga ttttgtattc aatgggcctt atctgtgagc 240

ccattaattg atgtgacggc ctaaactaaa tccgaacggt ttatttcagc gatccgcgac 300

ggtttgtatt cagccaatag caatcaatta tgtagcagtg gtgatcctcg tcaaaccagt 360

aaagctagat ctggaccgtt gaattggtgc aagaaagcac atgttgtgat atttttaccc 420

gtacgattag aaaacttgag aaacacattg ataatcgata aaaaccgtcc gatcatataa 480

atccgcttta ccatcgttgc ctataaatta atatcaatag ccgtacacgc gtgaagactg 540

acaatattat ctttttcgaa ttcggagctc aagtttgaaa ttcggagaag ctagagagtt 600

ttctgataac catgg 615

<210>37

<211>1319

<212>DNA

<213>杂合体

<400>37

ccatggcgag agggagcaga tcagtgggta gcagcagcag caaatggagg tactgcaacc 50

cttcctatta cttgaagcgc ccaaagcgtc ttgctctgct cttcatcgtt ttcgtttgtg 120

tctctttcgt tttctgggac cgtcaaactc tcgtcagaga gcaccaggtt gaaatttctg 180

agctgcagaa agaagtgact gatttgaaaa atttggtgga tgatttaaat aacaaacaag 240

gtggtacctc tgggaaaact gacttgggga ccatgggaca gatgcctgtg gctgctgtag 300

tggttatggc ctgcagtcgt gcagactatc ttgaaaggac tgttaaatca gttttaacat 360

atcaaactcc cgttgcttca aaatatcctc tatttatatc tcaggatgga tctgatcaag 420

ctgtcaagag caagtcattg agctataatc aattaacata tatgcagcac ttggattttg 480

aaccagtggt cactgaaagg cctggcgaac tgactgcgta ctacaagatt gcacgtcact 540

acaagtgggc actggaccag ttgttttaca aacacaaatt tagtcgagtg attatactag 600

aagatgatat ggaaattgct ccagacttct ttgattactt tgaggctgca gctagtctca 660

tggataggga taaaaccatt atggctgctt catcatggaa tgataatgga cagaagcagt 720

ttgtgcatga tccctatgcg ctataccgat cagatttttt tcctggcctt gggtggatgc 730

tcaagagatc gacttgggat gagttatcac caaagtggcc aaaggcttac tgggatgatt 840

ggctgagact aaaggaaaac cataaaggcc gccaattcat tcgaccggaa gtctgtagaa 900

catacaattt tggtgaacat gggtctagtt tgggacagtt tttcagtcag tatctggaac 960

ctataaagct aaacgatgtg acggttgact ggaaagcaaa ggacctggga tacctgacag 1020

agggaaacta taccaagtac ttttctggct tagtgagaca agcacgacca attcaaggtt 1080

ctgaccttgt cttaaaggct caaaacataa aggatgatgt tcgtatccgg tataaagacc 1140

aagtagagtt tgaacgcatt gcaggggaat ttggtatatt tgaagaatgg aaggatggtg 1200

tgcctcgaac agcatataaa ggagtagtgg tgtttcgaat ccagacaaca 3gacgtgtat 1260

tcctggttgg gccagattct gtaatgcagc ttggaattcg aaattcctga tgcggatcc 1319

<210>38

<211>4957

<212>DNA

<213>杂合体

<400>38

ggcgcgcctc gaggcgatcg cagatctaat ctaaccaatt acgatacgct ttgggtacac 60

ttgatttttg tttcagtggt tacatatatc ttgttttata tgctatcttt aaggatctgc 120

acaaagatta tttgttgatg ttcttgatgg ggctcagaag atttgatatg atacactcta 180

atctttagga gataccagcc aggattatat tcagtaagac aatcaaattt tacgtgttca 240

aactcgttat cttttcattc aaaggatgag ccagaatctt tatagaatga ttgcaatcga 300

gaatatgttc ggccgatatg cctttgttgg cttcaatatt ctacatatca cacaagaatc 360

gaccgtattg taccctcttt ccataaagga aaacacaata tgcagatgct tttttcccac 420

atgcagtaac atataggtat tcaaaaatgg ctaaaagaag ttggataaca aattgacaac 480

tatttccatt tctgttatat aaatttcaca acacacaaaa gcccgtaatc aagagtctgc 540

ccatgtacga aataacttct attatttggt attgggccta agcccagctc agagtacgtg 600

ggggtaccac atataggaag gtaacaaaat actgcaagat agccccataa cgtaccagcc 660

tctccttacc acgaagagat aagatataag acccaccctg ccacgtgtca catcgtcatg 720

gtggttaatg ataagggatt acatccttct atgtttgtgg acatgatgca tgtaatgtca 780

tgagccacag gatccaatgg ccacaggaac gtaagaatgt agatagattt gattttgtcc 840

gttagatagc aaacaacatt ataaaaggtg tgtatcaata ggaactaatt cactcattgg 900

attcatagaa gtccattcct cctaagtatc tagaaaccat ggcgagaggg agcagatcag 960

tgggtagcag cagcagcaaa tggaggtact gcaacccttc ctattacttg aagcgcccaa 1020

agcgtcttgc tctgctcttc atcgttttcg tttgtgtctc tttcgttttc tgggaccgtc 1080

aaactctcgt cagagagcac caggttgaaa tttctgagct gcagaaagaa gtgactgatt 1140

tgaaaaattt ggtggatgat ttaaataaca aacaaggtgg tacctctggg aaaactgact 1200

tggggaccat ggattccaat tcaggcgccg tcgttgatat cacaactaaa gatctatacg 1260

ataggattga gtttcttgat acagatggtg gtccatggaa acaaggttgg agagttacgt 1320

ataaagacga tgagtgggag aaagagaagc tcaaaatctt cgttgttcct cattctcata 1380

acgatcctgg ttggaaattg actgtagagg agtattatca gagacaatcc agacatattc 1440

ttgacaccat tgttgagact ttatctaagg tatgacgaaa gtttttgctt ttggttttaa 1500

tattttaatt ctctcccatg gttatcccgt gaacaatctt aaatgtctta aaattctcat 1560

gacgtcatta aactctataa ccaaacttct ttgctgggtt ctgttttttt ttagtttcgt 1620

gatgaaacag agttctagaa gttcgttctt ttggaaaatt tgaagtcttt ggagctaaag 1680

tttgtttttt tattactggg ttttgagatt gaaggatagc tagaatctta tttgtgtggg 1740

ggtttgtttt gaatatgttt aataggattc aagaagaaag tttatatggg aggagatgtc 1800

atatctggag agatggtgga gagacgcttc acctaataaa caagaagctt tgactaaatt 1860

ggttaaggat gggcagctag agattgttgg aggtggctgg gttatgaatg atgaggctaa 1920

ttcacattat tttgccataa ttgaacagat agcagagggt aatatgtggc tgaatgacac 1980

aattggggtt attcctaaga attcttgggc tatagatccc tttggctatt catcaaccat 2040

ggcttatctt ctccggcgta tgggttttga aaacatgctt attcaaagga ctcattacga 2100

gctcaagaaa gaccttgccc agcataagaa tcttgaatat atttggcgtc agagctggga 2160

tgctatggaa accacagata tctttgttca tatgatgccg ttttattcat acgatatccc 2220

acacacttgt ggaccagagc ctgcaatttg ctgtcagttt gatttcgctc ggatgcgggg 2280

atttaagtat gaactttgtc catggggaaa gcacccagtg gagaccacac tagaaaatgt 2340

gcaggagagg gcattaaagc ttctggatca atacaggaaa aaatccactc tatatcgaac 2400

taatacactt cttatacctc ttggagatga ttttaggtac attagtatcg atgaagccga 2460

ggctcagttc cgtaactacc agatgttgtt tgatcacatc aactctaatc ctagtctaaa 2520

cgcagaagca aagtttggta ctttggagga ttatttcaga acagtccgag aagaagcaga 2580

cagagtgaat tattctcgtc ctggtgaggt tggctctggt caggttgttg gtttcccttc 2640

tctgtcaggt gacttcttta catatgcaga taggcaacaa gactattgga gtggttatta 2700

tgtttcaaga cctttcttca aagctgttga tcgtgtgctc gagcataccc ttcgtggagc 2760

tgagatcatg atgtcatttc tgctaggtta ttgccatcga attcaatgtg agaaatttcc 2820

aacaagtttt acgtataagt tgactgctgc aagaagaaat ctggctcttt tccagcacca 2880

tgatggggta actggaactg ctaaggatta tgtggtacaa gattacggca cccggatgca 2940

tacttcattg caagaccttc agatctttat gtctaaagca atcgaagttc ttcttgggat 3000

ccgccacgag aaagaaaaat ctgatcaatc cccatcattt ttcgaggcag agcaaatgag 3060

atcaaagtat gatgctcggc cagttcacaa gccaattgct gcccgggaag gaaattcgca 3120

cacagttata ctcttcaatc catcagaaca gacgagagag gaggtggtga cggttgttgt 3180

taaccgcgct gaaatctcgg ttttggactc aaactggact tgtgtcccta gccaaatttc 3240

tcctgaagtg cagcatgacg ataccaaact attcaccggc agacatcgcc tttactggaa 3300

agcttccatc ccagctcttg gtctgagaac atatttcatt gctaatggga atgtcgagtg 3360

tgagaaagct actccgtcta aactcaaata cgcttctgag tttgacccat ttccttgtcc 3420

tcctccatat tcctgctcca aactggacaa cgacgttact gagatccgaa atgaacatca 3480

gactcttgtg tttgatgtga agaacggatc actgcggaag atagtccata gaaacggatc 3540

agagactgtt gtgggagaag agataggtat gtactctagt ccagagagtg gagcttacct 3600

gttcaaacca gatggtgaag ctcagccaat tgttcaacct gatggacatg tagtcacctc 3660

tgagggtctg ctggttcaag aagtcttctc ttaccctaaa accaaatggg agaaatcacc 3720

cctctctcag aaaactcgtc tttacactgg aggtaatacg cttcaggatc aagtggtcga 3780

gatagaatat catgttgagc ttcttggtaa tgattttgat gaccgggaat tgattgtccg 3840

gtacaagact gatgttgaca acaagaaggt cttctattca gatctcaatg gtttccaaat 3900

gagcaggaga gaaacttatg ataagatccc tcttcaagga aactactacc caatgccatc 3960

tctcgcattt atccaaggat ccaatggtca gagattctcc gtgcactctc gtcaatctct 4020

cggtgttgca agcctcaaag agggttggtt ggagattatg ctggacagac ggttggttcg 4080

tgatgacgga cggggtctag ggcaaggtgt gatggataac cgcgcaatga ccgtggtatt 4140

tcaccttctt gcggaatcta acatttctca agcagaccct gcttccaaca ctaacccgag 4200

gaacccttcg cttctctctc acctcatagg tgctcactta aactacccca taaacacatt 4260

cattgccaag aaaccgcaag acatatctgt gcgtgttcca caatacggtt cctttgctcc 4320

tttagccaaa ccgttaccat gtgacctcca cattgtaaat ttcaaggtta ctcgtccatc 4380

caaatactct cagcaattgg aagaagacaa gccaaggttc gctcttatcc tcaatagacg 4440

agcttgggat tcagcttatt gccataaagg aagacaagta aactgcacaa gcatggctaa 4500

tgaaccagta aacttttccg acatgttcaa agatcttgca gcttcaaagg taaaaccaac 4560

ttcactgaat ctcttgcaag aagatatgga gattcttggg tacgatgacc aagagctacc 4620

tcgagatagt tcacagccac gggaaggacg tgtctcgatc tctcccatgg aaatacgagc 4680

ttataagctt gaactgcgac ctcacaagtg aacctgctga agatccgcta gagtccgcaa 4740

aaatcaccag tctctctcta caaatctatc tctctctatt tttctccaga ataatgtgtg 4800

agtagttccc agataaggga attagggttc ttatagggtt tcgctcatgt gttgagcata 4860

taagaaaccc ttagtatgta tttgtatttg taaaatactt ctatcaataa aatttctaat 4920

cctaaaacca aaatcccgcg agagacctct taattaa 4957

<210>39

<211>921

<212>DNA

<213>Chrysanthemum x morifolium

<400>39

agatctaatc taaccaatta cgatacgctt tgggtacact tgatttttgt ttcagtggtt 60

acatatatct tgttttatat gctatcttta aggatctgca caaagattat ttgttgatgt 120

tcttgatggg gctcagaaga tttgatatga tacactctaa tctttaggag ataccagcca 180

ggattatatt cagtaagaca atcaaatttt acgtgttcaa actcgttatc ttttcattca 240

aaggatgagc cagaatcttt atagaatgat tgcaatcgag aatatgttcg gccgatatgc 300

ctttgttggc ttcaatattc tacatatcac acaagaatcg accgtattgt accctctttc 360

cataaaggaa aacacaatat gcagatgctt ttttcccaca tgcagtaaca tataggtatt 420

caaaaatggc taaaagaagt tggataacaa attgacaact atttccattt ctgttatata 480

aatttcacaa cacacaaaag cccgtaatca agagtctgcc catgtacgaa ataacttcta 540

ttatttggta ttgggcctaa gcccagctca gagtacgtgg gggtaccaca tataggaagg 600

taacaaaata ctgcaagata gccccataac gtaccagcct ctccttacca cgaagagata 660

agatataaga cccaccctgc cacgtgtcac atcgtcatgg tggttaatga taagggatta 720

catccttcta tgtttgtgga catgatgcat gtaatgtcat gagccacagg atccaatggc 780

cacaggaacg taagaatgta gatagatttg attttgtccg ttagatagca aacaacatta 840

taaaaggtgt gtatcaatag gaactaattc actcattgga ttcatagaag tccattcctc 900

ctaagtatct agaaaccatg g 921

<210>40

<211>3789

<212>DNA

<213>杂合体

<400>40

ccatggcgag agggagcaga tcagtgggta gcagcagcag caaatggagg tactgcaacc 60

cttcctatta cttgaagcgc ccaaagcgtc ttgctctgct cttcatcgtt ttcgtttgtg 120

tctctttcgt tttctgggac cgtcaaactc tcgtcagaga gcaccaggtt gaaatttctg 180

agctgcagaa agaagtgact gatttgaaaa atttggtgga tgatttaaat aacaaacaag 240

gtggtacctc tgggaaaact gacttgggga ccatggattc caattcaggc gccgtcgttg 300

atatcacaac taaagatcta tacgatagga ttgagtttct tgatacagat ggtggtccat 360

ggaaacaagg ttggagagtt acgtataaag acgatgagtg ggagaaagag aagctcaaaa 420

tcttcgttgt tcctcattct cataacgatc ctggttggaa attgactgta gaggagtatt 480

atcagagaca atccagacat attcttgaca ccattgttga gactttatct aaggtatgac 540

gaaagttttt gcttttggtt ttaatatttt aattctctcc catggttatc ccgtgaacaa 600

tcttaaatgt cttaaaattc tcatgacgtc attaaactct ataaccaaac ttctttgccg 660

ggttctgttt ttttttagtt tcgtgatgaa acagagttct agaagttcgt tcttttggaa 720

aatttgaagt ctttggagct aaagtttgtt tttttattac tgggttttga gattgaagga 780

tagctagaat cttatttgtg tgggggtttg ttttgaatat gtttaatagg attcaagaag 840

aaagtttata tgggaggaga tgtcatatct ggagagatgg tggagagacg cttcacctaa 900

taaacaagaa gctttgacta aattggttaa ggatgggcag ctagagattg ttggaggtgg 960

ctgggttatg aatgatgagg ctaattcaca ttattttgcc ataattgaac agatagcaga 1020

gggtaatatg tggctgaatg acacaattgg ggttattcct aagaattctt gggctataga 1080

tccctttggc tattcatcaa ccatggctta tcttctccgg cgtatgggtt ttgaaaacat 1140

gcttattcaa aggactcatt acgagctcaa gaaagacctt gcccagcata agaatcttga 1200

atatatttgg cgtcagagct gggatgctat ggaaaccaca gatatctttg ttcatatgat 1260

gccgttttat tcatacgata tcccacacac ttgtggacca gagcctgcaa tttgctgtca 1320

gtttgatttc gctcggatgc ggggatttaa gtatgaactt tgtccatggg gaaagcaccc 1380

agtggagacc acactagaaa atgtgcagga gagggcatta aagcttctgg atcaatacag 1440

gaaaaaatcc actctatatc gaactaatac acttcttata cctcttggag atgattttag 1500

gtacattagt atcgatgaag ccgaggctca gttccgtaac taccagatgt tgtttgatca l560

catcaactct aatcctagtc taaacgcaga agcaaagttt ggtactttgg aggattattt 1620

cagaacagtc cgagaagaag cagacagagt gaattattct cgtcctggtg aggttggctc 1680

tggtcaggtt gttggtttcc cttctctgtc aggtgacttc tttacatatg cagataggca 1740

acaagactat tggagtggtt attatgtttc aagacctttc ttcaaagctg ttgatcgtgt 1800

gctcgagcat acccttcgtg gagctgagat catgatgtca tttctgctag gttattgcca 1860

tcgaattcaa tgtgagaaat ttccaacaag ttttacgtat aagttgactg ctgcaagaag 1920

aaatctggct cttttccagc accatgatgg ggtaactgga actgctaagg attatgtggt 1980

acaagattac ggcacccgga tgcatacttc attgcaagac cttcagatct ttatgtctaa 2040

agcaatcgaa gttcttcttg ggatccgcca cgagaaagaa aaatctgatc aatccccatc 2100

atttttcgag gcagagcaaa tgagatcaaa gtatgatgct cggccagttc acaagccaat 2160

tgctgcccgg gaaggaaatt cgcacacagt tatactcttc aatccatcag aacagacgag 2220

agaggaggtg gtgacggttg ttgttaaccg cgctgaaatc tcggttttgg actcaaactg 2280

gacttgtgtc cctagccaaa tttctcctga agtgcagcat gacgatacca aactattcac 2340

cggcagacat cgcctttact ggaaagcttc catcccagct cttggtctga gaacatattt 2400

cattgctaat gggaatgtcg agtgtgagaa agctactccg tctaaactca aatacgcttc 2460

tgagtttgac ccatttcctt gtcctcctcc atattcctgc tccaaactgg acaacgacgt 2520

tactgagatc cgaaatgaac atcagactct tgtgtttgat gtgaagaacg gatcactgcg 2580

gaagatagtc catagaaacg gatcagagac tgttgtggga gaagagatag gtatgtactc 2640

tagtccagag agtggagctt acctgttcaa accagatggt gaagctcagc caattgttca 2700

acctgatgga catgtagtca cctctgaggg tctgctggtt caagaagtct tctcttaccc 2760

taaaaccaaa tgggagaaat cacccctctc tcagaaaact cgtctttaca ctggaggtaa 2820

tacgcttcag gatcaagtgg tcgagataga atatcatgtt gagcttcttg gtaatgattt 2880

tgatgaccgg gaattgattg tccggtacaa gactgatgtt gacaacaaga aggtcttcta 2940

ttcagatctc aatggtttcc aaatgagcag gagagaaact tatgataaga tccctcttca 3000

aggaaactac tacccaatgc catctctcgc atttatccaa ggatccaatg gtcagagatt 3060

ctccgtgcac tctcgtcaat ctctcggtgt tgcaagcctc aaagagggtt ggttggagat 3120

tatgctggac agacggttgg ttcgtgatga cggacggggt ctagggcaag gtgtgatgga 3180

taaccgcgca atgaccgtgg tatttcacct tcttgcggaa tctaacattt ctcaagcaga 3240

ccctgcttcc aacactaacc cgaggaaccc ttcgcttctc tctcacctca taggtgctca 3300

cttaaactac cccataaaca cattcattgc caagaaaccg caagacatat ctgtgcgtgt 3360

tccacaatac ggttcctttg ctcctttagc caaaccgtta ccatgtgacc tccacattgt 3420

aaatttcaag gttcctcgtc catccaaata ctctcagcaa ttggaagaag acaagccaag 3480

gttcgctctt atcctcaata gacgagcttg ggattcagct tattgccata aaggaagaca 3540

agtaaactgc acaagcatgg ctaatgaacc agtaaacttt tccgacatgt tcaaagatct 3600

tgcagcttca aaggtaaaac caacttcact gaatctcttg caagaagata tggagattct 3660

tgggtacgat gaccaagagc tacctcgaga tagttcacag ccacgggaag gacgtgtctc 3720

gatctctccc atggaaatac gagcttataa gcttgaactg cgacctcaca agtgaacctg 3780

ctgaagatc 3789

<210>41

<211>2145

<212>DNA

<213>杂合体

<400>41

ggcgcgcctc gaggcgatcg cagatctcat tataccgtta gaagcatagt taaaatctaa 60

agcttgtcgt taattctagt cattttacat tgttgggttc tacattatta atgaattttc 120

taatgcaaat acagaattta aatcaaaatt gttgaattat gctaaacatg taacatacgt 180

atatctccgc cttgtgtgtt gtattaactt gaagttatca taagaaccac aaatacacta 240

gtaaatctat gagaaggcag gtggcaacac aaacaagagt atctaagatt ttcatttgtg 300

actataggaa tataatatct cttatctgat ttaatgaatc cacatgttca cttctcattt 360

gtccacaaga tcacaacttt atcttcaata ttcacaactt gttatatcca ccacaatttc 420

attcttttca cttagcccca caaaatactt tgtcccctta tttgccacct tttgtattta 480

atttattctt gtggagctaa gtgttcatat tattcttctt ctcaaaaaaa caaaaacaaa 540

aaaaaagaga agaaaaccat ggcgagaggg agcagatcag tgggtagcag cagcagcaaa 600

tggaggtact gcaacccttc ctattacttg aagcgcccaa agcgtcttgc tctgctcttc 660

atcgttttcg tttgtgtctc tttcgttttc tgggaccgtc aaactctcgt cagagagcac 720

caggttgaaa tttctgagct gcagadagaa gtgactgatt tgaaaaattt ggtggatgat 780

ttaaataaca aacaaggtgg tacctctggg aaaactgact tggggaccat ggctctaagg 840

ttgcatagaa ggaaccattt ttcgcctaga aatacggatc tgttcccgga tttggcaaaa 900

gatcgtgtgg ttatcgtctt gtatgtgcat aatcgggctc agtattttcg agtcacagtg 960

gaaagtttgt cgaaggttaa aggtataagt gagacattgt tgattgttag tcatgatggt 1020

tactttgaag agatgaatag gattgtggag agtattaagt tttgtcaagt gaaacagatt 1080

ttctcgcctt attcgcctca tatatatcgt actagcttcc cgggtgtgac cctgaatgat 1140

tgtaagaaca agggtgatga ggcaaagggg cattgtgaag gtaatcctga tcagtatggg 1200

aatcatcggt ctccgaagat tgtatctttg aagcatcact ggtggtggat gatgaacact 1260

gtatgggatg ggttggaaga gactaaagga catgaggggc atatcctttt cattgaagaa 1320

gatcattttc tgtttcctaa tgcctatcgt aacatacaga ctcttacgag gctgaaaccc 1380

gcaaagtgtc ctgactgttt tgctgctaat ttagcaccgt ctgatgtgaa gtcaagagga 1440

gaagggcttg aaagtttggt tgcagagaga atgggaaatg ttgggtattc ttttaataga 1500

agtgtgtggg agaatattca tcagaaggca agagagtttt gtttctttga tgattacaac 1560

tgggatataa cgatgtgggc aacggttttc ccgtcgtttg gttccccggt gtacacattg 1620

cgagggccta ggactagtgc ggtacacttt ggaaaatgtg ggttgcatca aggtagagga 1680

gatgagggtg attgcatcga taatggggtc gtaaacatag aagttaagga aacagataaa 1740

gttgtgaaca taaaagaagg atggggagtt cgggtgtata agcatcaagc gggttataaa 1800

gccggtttcg aaggttgggg aggttggggc gatgataggg accgacattt atgtttggat 1860

tttgccacta tgtatcgtta cagcagtagc agtgcatctc catgaaacgg atccgctaga 1920

gtccgcaaaa atcaccagtc tctctctaca aatctatctc tctctatttt tctccagaat 1980

aatgtgtgag tagttcccag ataagggaat tagggttctt atagggtttc gctcatgtgt 2040

tgagcatata agaaaccctt agtatgtatt tgtatttgta aaatacttct atcaataaaa 2100

tttctaatcc taaaaccaaa atcccgcgag agacctctta attaa 2145

<210>42

<211>541

<212>DNA

<213>Solanum tuberosum

<400>42

agatctcatt ataccgttag aagcatagtt aaaatctaaa gcttgtcgtt aattctagtc 60

attttacatt gttgggttct acattattaa tgaattttct aatgcaaata cagaatttaa 120

atcaaaattg ttgaattatg ctaaacatgt aacatacgta tatctccgcc ttgtgtgttg 180

tattaacttg aagttatcat aagaaccaca aatacactag taaatctatg agaaggcagg 240

tggcaacaca aacaagagta tctaagattt tcatttgtga ctataggaat ataatatctc 300

ttatctgatt taatgaatcc acatgttcac ttctcatttg tccacaagat cacaacttta 360

tcttcaatat tcacaacttg ttatatccac cacaatttca ttcttttcac ttagccccac 420

aaaatacttt gtccccttat ttgccacctt ttgtatttaa tttattcttg tggagctaag 480

tgttcatatt attcttcttc tcaaaaaaac aaaaacaaaa aaaaagagaa gaaaaccatg 540

g 541

<210>43

<211>1358

<212>DNA

<213>杂合体

<400>43

ccatggcgag agggagcaga tcagtgggta gcagcagcag caaatggagg tactgcaacc 60

cttcctatta cttgaagcgc ccaaagcgtc ttgctctgct cttcatcgtt ttcgtttgtg 120

tctctttcgt tttctgggac cgtcaaactc tcgtcagaga gcaccaggtt gaaatttctg 180

agctgcagaa agaagtgact gatttgaaaa atttggtgga tgatttaaat aacaaacaag 240

gtggtacctc tgggaaaact gacttgggga ccatggctct aaggttgcat agaaggaacc 300

atttttcgcc tagaaatacg gatctgttcc cggatttggc aaaagatcgt gtggttatcg 360

tcttgtatgt gcataatcgg gctcagtatt ttcgagtcac agtggaaagt ttgtcgaagg 420

ttaaaggtat aagtgagaca ttgttgattg ttagtcatga tggttacttt gaagagatga 480

ataggattgt ggagagtatt aagttttgtc aagtgaaaca gattttctcg ccttattcgc 540

ctcatatata tcgtactagc ttcccgggtg tgaccctgaa tgattgtaag aacaagggtg 600

atgaggcaaa ggggcattgt gaaggtaatc ctgatcagta tgggaatcat cggtctccga 660

agattgtatc tttgaagcat cactggtggt ggatgatgaa cactgtatgg gatgggttgg 720

aagagactaa aggacatgag gggcatatcc ttttcattga agaagatcat tttctgtttc 780

ctaatgccta tcgtaacata cagactctta cgaggctgaa acccgcaaag tgtcctgact 840

gttttgctgc taatttagca ccgtctgatg tgaagtcaag aggagaaggg cttgaaagtt 900

tggttgcaga gagaatggga aatgttgggt attcttttaa tagaagtgtg tgggagaata 960

ttcatcagaa ggcaagagag ttttgtttct ttgatgatta caactgggat ataacgatgt 1020

gggcaacggt tttcccgtcg tttggttccc cggtgtacac attgcgaggg cctaggacta 1080

gtgcggtaca ctttggaaaa tgtgggttgc atcaaggtag aggagatgag ggtgattgca 1140

tcgataatgg ggtcgtaaac atagaagtta aggaaacaga taaagttgtg aacataaaag 1200

aaggatgggg agttcgggtg tataagcatc aagcgggtta taaagccggt ttcgaaggtt 1260

ggggaggttg gggcgatgat agggaccgac atttatgttt ggattttgcc actatgtatc 1320

gttacagcag tagcagtgca tctccatgaa acggatcc 1358

<210>44

<211>237

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>44

ggatccgcta gagtccgcaa aaatcaccag tctctctcta caaatctatc tctctctatt 60

tttctccaga ataatgtgtg agtagttccc agataaggga attagggttc ttatagggtt 120

tcgctcatgt gttgagcata taagaaaccc ttagtatgta tttgtatttg taaaatactt 180

ctatcaataa aatttctaat cctaaaacca aaatcccgcg agagacctct taattaa 237

<210>45

<211>31

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>45

atactcgagt taacaatgag taaacggaat c 31

<210>46

<211>24

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>46

ttctcgatcg ccgattggtt attc 24

<210>47

<211>24

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>47

gccgccgcga tcgggcagtc ctcc 24

<210>48

<211>30

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>48

aacggatcca cgctagctcg gtgtcccgat 30

<210>49

<211>3327

<212>DNA

<213>杂合体

<400>49

atgggcatca agatggagac acattctcag gtctttgtat acatgttgct gtggttgtct 60

ggtgtcgaca tgaagcactt caaatcttcc ctcactcaca ccgtcaagag ccgagacgag 120

ccaactccgg atcaatgccc tgcattgaag gaaagcgaag cggacatcga caccgtggcg 180

atatacccaa cttttgattt tcagccgagc tggttgcgta caaaggaatt ttgggacaag 240

tccttcgagg atcggtatga aagaattcat aacgacacta cacggcctag actgaaggta 300

atcgtggttc ctcactcaca caacgacccg ggatggctga agacgtttga acagtacttc 360

gagtggaaga ccaagaacat tatcaacaac atagtgaaca aactgcacca gtaccccaac 420

atgaccttca tttggaccga gatatcgttt ctgaatgcct ggtgggaaag gtcgcaccct 480

gtcaaacaaa aggcattgaa aaaacttatc aaagaaggtc gtctcgagat cacgacgggc 540

ggctgggtga tgccggacga agcctgcacg catatctatg cgctaattga ccagtttatt 600

gaaggacatc actgggtgaa aactaatctc ggcgtcatcc cgaagacagg atggtctatt 660

gaccccttcg gccacggggc cactgtgcct tacctgctag accagagcgg ccttgaggga 720

accattatac agagaatcca ttatgcgtgg aaacagtggc tggcggagcg acagattgag 780

gagttttact ggctggcgag ttgggctact acgaagccgt ccatgatagt gcacaatcag 840

ccgtttgata tttattcaat aaaaagcacg tgtggcccgc acccttcaat ttgtctcagt 900

ttcgacttca ggaagattcc cggcgaatat tctgaataca cagctaagca cgaagacatc 960

acggaacaca acttgcacag caaggcaaag actttgatag aggagtacga ccgtatcggg 1020

tccctgactc cacacaacgt ggtgctggtg ccgctcggag acgacttcag atacgagtac 1080

agcgtcgagt ttgatgccca atacgtcaat tatatgaaaa tgtttaacta catcaatgct 1140

cacaaggaaa tcttcaacgc tgacgtacag ttcggaactc ctctcgatta ctttaacgcc 1200

atgaaagaaa gacatcaaaa tatacccagc ttaaagggag atttcttcgt ttactccgat 1260

attttcagcg aaggtaaacc agcgtactgg tcaggttact acactactag accctaccaa 1320

aaaatcctcg cccgtcagtt cgaacaccaa ctgcgatcgg cagagatttt attcaccctt 1380

gtatcgaact acatcagaca gatgggtcgc caaggagagt tcggagcttc tgagaaaaag 1440

ttagaaaaat cttacgagca gcttatctat gctcgacgga acttgggtct gtttcaacat 1500

cacgatgcga ttactggaac atcaaagtcc agtgtgatgc aagattacgg aaccaaactg 1560

ttcacaagtc tgtatcactg catccgcctg caggaggccg cgctcaccac catcatgttg 1620

cctgaccagt cgttgcactc gcagagcatt atacaaagcg aggttgagtg ggaaacttac 1680

ggaaaaccgc ccaagaagct gcaagtgtcc ttcattgaca agaagaaagt tatacttttt 1740

aatccgttgg ctgagactcg aactgaagtg gtcacggtta gatccaacac gtccaacatc 1800

cgggtgtacg atacacacaa gaggaagcac gtcttgtatc agataatgcc cagcatcaca 1860

atccaagaca acggcaagag tatcgtaagc gacaccacgt tcgacataat gttcgtggcc 1920

accatcccgc ccctcacctc catctcgtac aagctgcagg agcacaccaa cacttcccac 1980

cactgcgtca ttttctgcaa caactgcgaa caataccaga aatccaatgt gttccaaatt 2040

aagaaaatga tgcctggtga catacaatta gaaaatgcag tgctaaaact tctcgttaat 2100

aggaacaccg gctttctgag acaagtctat agaaaggaca tccggaagag aactgtcgtt 2160

gacgtacaat tcggcgcata tcaaagtgcc caaagacatt ctggtgctta cctcttcatg 2220

cctcattacg actcacctga gaagaatgtt ctgcatccct acactaatca gaacaacatg 2280

caagatgata acataatcat agtgtccgga cctatttcta cggaaatcac gaccatgtac 2340

ttgcccttct tggtgcacac tattaggata tacaacgtgc cggacccggt actgtcgcgt 2400

gctattctat tagagaccga tgtagatttc gaggcgccac ctaagaacag agagactgag 2460

ttatttatga gattacagac tgatatacaa aacggtgaca ttcccgaatt ttacaccgat 2520

cagaacggat tccagtacca aaagagggtc aaagtgaata aactaggaat agaagctaat 2580

tactacccga tcactaccat ggcgtgcctg caagacgagg agacccggct cactctgctg 2640

acgaaccacg ctcaaggcgc tgctgcatac gaaccaggac gcttagaagt catgctcgat 2700

cgtcgaactc tttatgatga cttcagagga atcggtgaag gagtagtcga taacaaaccg 2760

acgactttcc agaactggat tttaattgaa tccatgccag gcgtgacgcg agccaagaga 2820

gacactagtg aaccaggttt caaatttgtt aatgaacgtc gttttggccc cggccagaag 2880

gaaagccctt accaagtacc gtcgcagact gcggactacc tgagcaggat gttcaattac 2940

ccggtgaacg tgtacctggt ggacactagc gaggttggcg agatcgaggt gaagccgtac 3000

cagtcgttcc tgcagagctt cccgcccggc atccacctgg tcaccctgcg caccatcacc 3060

gacgacgtgc tcgaactctt ccccagcaac gaaagctaca tggtactgca ccgaccagga 3120

tacagctgcg ctgtcggaga gaagccagtc gccaagtctc ccaagttttc g tccaaaacc 3180

aggttcaatg gtctgaacat tcagaacatc actgcagtca gcctgaccggcctgaagtca 3240

ctccgacctc tcacaggtct gagtgacatc cacctgaacg ctatggaggt aaaaacttac 3300

aagatcaggt ttaaggacga gctttaa 3327

<210>50

<211>1108

<212>PRT

<213>杂合体

<400>50

Met Gly Ile Lys Met Glu Thr His Ser Gln Val Phe Val Tyr Met Leu

1 5 10 15

Leu Trp Leu Ser Gly Val Asp Met Lys His Phe Lys Ser Ser Leu Thr

20 25 30

His Thr Val Lys Ser Arg Asp Glu Pro Thr Pro Asp Gln Cys Pro Ala

35 40 45

Leu Lys Glu Ser Glu Ala Asp Ile Asp Thr Val Ala Ile Tyr Pro Thr

50 55 60

Phe Asp Phe Gln Pro Ser Trp Leu Arg Thr Lys Glu Phe Trp Asp Lys

65 70 75 80

Ser Phe Glu Asp Arg Tyr Glu Arg Ile His Asn Asp Thr Thr Arg Pro

85 90 95

Arg Leu Lys Val Ile Val Val Pro His Ser His Asn Asp Pro Gly Trp

100 105 110

Leu Lys Thr Phe Glu Gln Tyr Phe Glu Trp Lys Thr Lys Asn Ile Ile

115 120 125

Asn Asn Ile Val Asn Lys Leu His Gln Tyr Pro Asn Met Thr Phe Ile

130 135 140

Trp Thr Glu Ile Ser Phe Leu Asn Ala Trp Trp Glu Arg Ser His Pro

145 150 155 160

Val Lys Gln Lys Ala Leu Lys Lys Leu Ile Lys Glu Gly Arg Leu Glu

165 170 175

Ile Thr Thr Gly Gly Trp Val Met Pro Asp Glu Ala Cys Thr His Ile

180 185 190

Tyr Ala Leu Ile Asp Gln Phe Ile Glu Gly His His Trp Val Lys Thr

195 200 205

Asn Leu Gly Val Ile Pro Lys Thr Gly Trp Ser Ile Asp Pro Phe Gly

210 215 220

His Gly Ala Thr Val Pro Tyr Leu Leu Asp Gln Ser Gly Leu Glu Gly

225 230 235 240

Thr Ile Ile Gln Arg Ile His Tyr Ala Trp Lys Gln Trp Leu Ala Glu

245 250 255

Arg Gln Ile Glu Glu Phe Tyr Trp Leu Ala Ser Tro Ala Thr Thr Lys

260 265 270

Pro Ser Met Ile Val His Asn Gln Pro Phe Asp Ile Tyr Ser Ile Lys

275 280 285

Ser Thr Cys Gly Pro His Pro Ser Ile Cys Leu Ser Phe Asp Phe Arg

290 295 300

Lys Ile Pro Gly Glu Tyr Ser Glu Tyr Thr Ala Lys His Glu Asp Ile

305 310 315 320

Thr Glu His Asn Leu His Ser Lys Ala Lys Thr Leu Ile Glu Glu Tyr

325 330 335

Asp Arg Ile Gly Ser Leu Thr Pro His Asn Val Val Leu Val Pro Leu

340 345 350

Gly Asp Asp Phe Arg Tyr Glu Tyr Ser Val Glu Phe Asp Ala Gln Tyr

355 360 365

Val Asn Tyr Met Lys Met Phe Asn Tyr Ile Asn Ala His Lys Glu Ile

370 375 380

Phe Asn Ala Asp Val Gln Phe Gly Thr Pro Leu Asp Tyr Phe Asn Ala

385 390 395 400

Met Lys Glu Arg His Gln Asn Ile Pro Ser Leu Lys Gly Asp Phe Phe

405 410 415

Val Tyr Ser Asp Ile Phe Ser Glu Gly Lys Pro Ala Tyr Trp Ser Gly

420 425 430

Tyr Tyr Thr Thr Arg Pro Tyr Gln Lys Ile Leu Ala Arg Gln Phe Glu

435 440 445

His Gln Leu Arg Ser Ala Glu Ile Leu Phe Thr Leu Val Ser Asn Tyr

450 455 460

Ile Arg Gln Met Gly Arg Gln Gly Glu Phe Gly Ala Ser Glu Lys Lys

465 470 475 480

Leu Glu Lys Ser Tyr Glu Gln Leu Ile Tyr Ala Arg Arg Asn Leu Gly

485 490 495

Leu Phe Gln His His Asp Ala Ile Thr Gly Thr Ser Lys Ser Ser Val

500 505 510

Met Gln Asp Tyr Gly Thr Lys Leu Phe Thr Ser Leu Tyr His Cys Ile

515 520 525

Arg Leu Gln Glu Ala Ala Leu Thr Thr Ile Met Leu Pro Asp Gln Ser

530 535 540

Leu His Ser Gln Ser Ile Ile Gln Ser Glu Val Glu Trp Glu Thr Tyr

545 550 555 560

Gly Lys Pro Pro Lys Lys Leu Gln Val Ser Phe Ile Asp Lys Lys Lys

565 570 575

Val Ile Leu Phe Asn Pro Leu Ala Glu Thr Arg Thr Glu Val Val Thr

580 585 590

Val Arg Ser Asn Thr Ser Asn Ile Arg Val Tyr Asp Thr His Lys Arg

595 600 605

Lys His Val Leu Tyr Gln Ile Met Pro Ser Ile Thr Ile Gln Asp Asn

610 615 620

Gly Lys Ser Ile Val Ser Asp Thr Thr Phe Asp Ile Met Phe Val Ala

625 630 635 640

Thr Ile Pro Pro Leu Thr Ser Ile Ser Tyr Lys Leu Gln Glu His Thr

645 650 655

Asn Thr Ser His His Cys Val Ile Phe Cys Asn Asn Cys Glu Gln Tyr

660 665 670

Gln Lys Ser Asn Val Phe Gln Ile Lys Lys Met Met Pro Gly Asp Ile

675 680 685

Gln Leu Glu Asn Ala Val Leu Lys Leu Leu Val Asn Arg Asn Thr Gly

690 695 700

Phe Leu Arg Gln Val Tyr Arg Lys Asp Ile Arg Lys Arg Thr Val Val

705 710 715 720

Asp Val Gln Phe Gly Ala Tyr Gln Ser Ala Gln Arg His Ser Gly Ala

725 730 735

Tyr Leu Phe Met Pro His Tyr Asp Ser Pro Glu Lys Asn Val Leu His

740 745 750

Pro Tyr Thr Asn Gln Asn Asn Met Gln Asp Asp Asn Ile Ile Ile Val

755 760 765

Ser Gly Pro Ile Ser Thr Glu Ile Thr Thr Met Tyr Leu Pro Phe Leu

770 775 780

Val His Thr Ile Arg Ile Tyr Asn Val Pro Asp Pro Val Leu Ser Arg

785 790 795 800

Ala Ile Leu Leu Glu Thr Asp Val Asp Phe Glu Ala Pro Pro Lys Asn

805 810 815

Arg Glu Thr Glu Leu Phe Met Arg Leu Gln Thr Asp Ile Gln Asn Gly

820 825 830

Asp Ile Pro Glu Phe Tyr Thr Asp Gln Asn Gly Phe Gln Tyr Gln Lys

835 840 845

Arg Val Lys Val Asn Lys Leu Gly Ile Glu Ala Asn Tyr Tyr Pro Ile

850 855 860

Thr Thr Met Ala Cys Leu Gln Asp Glu Glu Thr Arg Leu Thr Leu Leu

865 870 875 880

Thr Asn His Ala Gln Gly Ala Ala Ala Tyr Glu Pro Gly Arg Leu Glu

885 890 895

Val Met Leu Asp Arg Arg Thr Leu Tyr Asp Asp Phe Arg Gly Ile Gly

900 905 910

Glu Gly Val Val Asp Asn Lys Pro Thr Thr Phe Gln Asn Trp Ile Leu

915 920 925

Ile Glu Ser Met Pro Gly Val Thr Arg Ala Lys Arg Asp Thr Ser Glu

930 935 940

Pro Gly Phe Lys Phe Val Asn Glu Arg Arg Phe Gly Pro Gly Gln Lys

945 950 955 960

Glu Ser Pro Tyr Gln Val Pro Ser Gln Thr Ala Asp Tyr Leu Ser Arg

965 970 975

Met Phe Asn Tyr Pro Val Asn Val Tyr Leu Val Asp Thr Ser Glu Val

980 985 990

Gly Glu Ile Glu Val Lys Pro Tyr Gln Ser Phe Leu Gln Ser Phe Pro

995 1000 1005

Pro Gly Ile His Leu Val Thr Leu Arg Thr Ile Thr Asp Aso Val

1010 1015 1020

Leu Glu Leu Phe Pro Ser Asn Glu Ser Tyr Met Val Leu His Arg

1025 1030 1035

Pro Gly Tyr Ser Cys Ala Val Gly Glu Lys Pro Val Ala Lys Ser

1040 1045 1050

Pro Lys Phe Ser Ser Lys Thr Arg Phe Asn Gly Leu Asn Ile Gln

1055 1060 1065

Asn Ile Thr Ala Val Ser Leu Thr Gly Leu Lys Ser Leu Arg Pro

1070 1075 1080

Leu Thr Gly Leu Ser Asp Ile His Leu Asn Ala Met Glu Val Lys

1085 1090 1095

Thr Tyr Lys Ile Arg Phe Lys Asp Glu Leu

1100 1105

<210>51

<211>1068

<212>DNA

<213>杂合体

<400>51

atgggcatca agatggagac acattctcag gtctttgtat acatgttgct gtggttgtct 60

ggtgtcgaca tgcagtcctc cggggagctc cggaccggag gggcccggcc gccgcctcct 120

ctaggcgcct cctcccagcc gcgcccgggt ggcgactcca gcccagtcgt ggattctggc 180

cctggccccg ctagcaactt gacctcggtc ccagtgcccc acaccaccgc actgtcgctg 240

cccgcctgcc ctgaggagtc cccgctgctt gtgggcccca tgctgattga gtttaacatg 300

cctgtggacc tggagctcgt ggcaaagcag aacccaaatg tgaagatggg cggccgctat 360

gcccccaggg actgcgtctc tcctcacaag gtggccatca tcattccatt ccgcaaccgg 420

caggagcacc tcaagtactg gctatattat ttgcacccag tcctgcagcg ccagcagctg 480

gactatggca tctatgttat caaccaggcg ggagacacta tattcaatcg tgctaagctc 540

ctcaatgttg gctttcaaga agccttgaag gactatgact acacctgctt tgtgtttagt 600

gacgtggacc tcattccaat gaatgaccat aatgcgtaca ggtgtttttc acagccacgg 660

cacatttccg ttgcaatgga taagtttgga ttcagcctac cttatgttca gtattttgga 720

ggtgtctctg ctctaagtaa acaacagttt ctaaccatca atggatttcc taataattat 780

tggggctggg gaggagaaga tgatgacatt tttaacagat tagtttttag aggcatgtct 840

atatctcgcc caaatgctgt ggtcgggagg tgtcgcatga tccgccactc aagagacaag 900

aaaaatgaac ccaatcctca gaggtttgac cgaattgcac acacaaagga gacaatgctc 960

tctgatggtt tgaactcact cacctaccag gtgctggatg tacagagata cccattgtat 1020

acccaaatca cagtggacat cgggacaccg agcaaggacg agctttag 1068

<210>52

<211>355

<212>PRT

<213>杂合体

<400>52

Met Gly Ile Lys Met Glu Thr His Ser Gln Val Phe Val Lyr Met Leu

1 5 10 15

Leu Trp Leu Ser Gly Val Asp Met Gln Ser Ser Gly Glu Leu Arg Thr

20 25 30

Gly Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg

35 40 45

Pro Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala

50 55 60

Ser Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu

65 70 75 80

Pro Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile

85 90 95

Glu Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro

100 105 110

Asn Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro

115 120 125

His Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu

130 135 140

Lys Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu

145 150 155 160

Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr Ile Phe Asn

165 170 175

Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp Tyr

180 185 190

Asp Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asn

195 200 205

Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser Val

210 215 220

Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln Tyr Phe Gly

225 230 235 240

Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly Phe

245 250 255

Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn

260 265 270

Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Val Val

275 280 285

Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu Pro

290 295 300

Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met Leu

305 310 315 320

Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln Arg

325 330 335

Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser Lys

340 345 350

Asp Glu Leu

355

<210>53

<211>1119

<212>DNA

<213>杂合体

<400>53

atgggcatca agatggagac acattctcag gtctttgtat acatgttgct gtggttgtct 60

ggtgtcgaca tgggacagat gcctgtggct gctgtagtgg ttatggcctg cagtcgtgca 120

gactatcttg aaaggactgt taaatcagtt ttaacatatc aaactcccgt tgcttcaaaa 180

tatcctctat ttatatctca ggatggatct gatcaagctg tcaagagcaa gtcattgagc 240

tataatcaat taacatatat gcagcacttg gattttgaac cagtggtcac tgaaaggcct 300

ggcgaactga ctgcgtacta caagattgca cgtcactaca agtgggcact ggaccagttg 360

ttttacaaac acaaatttag tcgagtgatt atactagaag atgatatgga aattgctcca 420

gacttctttg attactttga ggctgcagct agtctcatgg atagggataa aaccattatg 480

gctgcttcat catggaatga taatggacag aagcagtttg tgcatgatcc ctatgcgcta 540

taccgatcag atttttttcc tggccttggg tggatgctca agagatcgac ttgggatgag 600

ttatcaccaa agtggccaaa ggcttactgg gatgattggc tgagactaaa ggaaaaccat 660

aaaggccgcc aattcattcg accggaagtc tgtagaacat acaattttgg tgaacatggg 720

tctagtttgg gacagttttt cagtcagtat ctggaaccta taaagctaaa cgatgtgacg 780

gttgactgga aagcaaagga cctgggatac ctgacagagg gaaactatac caagtacttt 840

tctggcttag tgagacaagc acgaccaatt caaggttctg accttgtctt aaaggctcaa 900

aacataaagg atgatgttcg tatccggtat aaagaccaag tagagtttga acgcattgca 960

ggggaatttg gtatatttga agaatggaag gatggtgtgc ctcgaacagc atataaagga 1020

gtagtggtgt ttcgaatcca gacaacaaga cgtgtattcc tggttgggcc agattctgta 1080

atgcagcttg gaattcgaaa ttccaaggac gagctttga 1119

<210>54

<211>372

<212>PRT

<213>杂合体

<400>54

Met Gly Ile Lys Met Glu Thr His Ser Gln Val Phe Val Tyr Met Leu

1 5 10 15

Leu Trp Leu Ser Gly Val Asp Met Gly Gln Met Pro Val Ala Ala Val

20 25 30

Val Val Met Ala Cys Ser Arg Ala Asp Tyr Leu Glu Arg Thr Val Lys

35 40 45

Ser Val Leu Thr Tyr Gln Thr Pro Val Ala Ser Lys Tyr Pro Leu Phe

50 55 60

Ile Ser Gln Asp Gly Ser Asp Gln Ala Val Lys Ser Lys Ser Leu Ser

65 70 75 80

Tyr Asn Gln Leu Thr Tyr Met Gln His Leu Asp Phe Glu Pro Val Val

85 90 95

Thr Glu Arg Pro Gly Glu Leu Thr Ala Tyr Tyr Lys Ile Ala Arg His

100 105 110

Tyr Lys Trp Ala Leu Asp Gln Leu Phe Tyr Lys His Lys Phe Ser Arg

115 120 125

Val Ile Ile Leu Glu Asp Asp Met Glu Ile Ala Pro Asp Phe Phe Asp

130 135 140

Tyr Phe Glu Ala Ala Ala Ser Leu Met Asp Arg Asp Lys Thr Ile Met

145 150 155 160

Ala Ala Ser Ser Trp Asn Asp Asn Gly G1n Lys Gln Phe Val His Asp

165 170 175

Pro Tyr Ala Leu Tyr Arg Ser Asp Phe Phe Pro Gly Leu Gly Trp Met

180 185 190

Leu Lys Arg Ser Thr Trp Asp Glu Leu Ser Pro Lys Trp Pro Lys Ala

195 200 205

Tyr Trp Asp Asp Trp Leu Arg Leu Lys Glu Asn His Lys Gly Arg Gln

210 215 220

Phe Ile Arg Pro Glu Val Cys Arg Thr Tyr Asn Phe Gly Glu His Gly

225 230 235 240

Ser Ser Leu Gly Gln Phe Phe Ser Gln Tyr Leu Glu Pro Ile Lys Leu

245 250 255

Asn Asp Val Thr Val Asp Trp Lys Ala Lys Asp Leu Gly Tyr Leu Thr

260 265 270

Glu Gly Asn Tyr Thr Lys Tyr Phe Ser Gly Leu Val Arg Gln Ala Arg

275 280 285

Pro Ile Gln Gly Ser Asp Leu Val Leu Lys Ala Gln Asn Ile Lys Asp

290 295 300

Asp Val Arg Ile Arg Tyr Lys Asp Gln Val Glu Phe Glu Arg Ile Ala

305 310 315 320

Gly Glu Phe Gly Ile Phe Glu Glu Trp Lys Asp Gly Val Pro Arg Thr

325 330 335

Ala Tyr Lys Gly Val Val Val Phe Arg Ile Gln Thr Thr Arg Arg Val

340 345 350

Phe Leu Val Gly Pro Asp Ser Val Met Gln Leu Gly Ile Arg Asn Ser

355 360 365

Lys Asp Glu Leu

370

<210>55

<211>1158

<212>DNA

<213>杂合体

<400>55

atgggcatca agatggagac acattctcag gtctttgtat acatgttgct gtggttgtct 60

ggtgtcgaca tggctctaag gttgcataga aggaaccatt tttcgcctag aaatacggat 120

ctgttcccgg atttggcaaa agatcgtgtg gttatcgtct tgtatgtgca taatcgggct 180

cagtattttc gagtcacagt ggaaagtttg tcgaaggtta aaggtataag tgagacattg 240

ttgattgtta gtcatgatgg ttactttgaa gagatgaata ggattgtgga gagtattaag 300

ttttgtcaag tgaaacagat tttctcgcct tattcgcctc atatatatcg tactagcttc 360

ccgggtgtga ccctgaatga ttgtaagaac aagggtgatg aggcaaaggg gcattgtgaa 420

ggtaatcctg atcagtatgg gaatcatcgg tctccgaaga ttgtatcttt gaagcatcac 480

tggtggtgga tgatgaacac tgtatgggat gggttggaag agactaaagg acatgagggg 540

catatccttt tcattgaaga agatcatttt ctgtttccta atgcctatcg taacatacag 600

actcttacga ggctgaaacc cgcaaagtgt cctgactgtt ttgctgctaa tttagcaccg 660

tctgatgtga agtcaagagg agaagggctt gaaagtttgg ttgcagagag aatgggaaat 720

gttgggtatt cttttaatag aagtgtgtgg gagaatattc atcagaaggc aagagagttt 780

tgtttctttg atgattacaa ctgggatata acgatgtggg caacggtttt cccgtcgttt 840

ggttccccgg tgtacacatt gcgagggcct aggactagtg cggtacactt tggaaaatgt 900

gggttgcatc aaggtagagg agatgagggt gattgcatcg ataatggggt cgtaaacata 960

gaagttaagg aaacagataa agttgtgaac ataaaagaag gatggggagt tcgggtgtat 1020

aagcatcaag cgggttataa agccggtttc gaaggttggg gaggttgggg cgatgatagg 1080

gaccgacatt tatgtttgga ttttgccact atgtatcgtt acagcagtag cagtgcatct 1140

ccaaaggacg agctttga 1158

<210>56

<211>385

<212>PRT

<213>杂合体

<400>56

Met Gly Ile Lys Met Glu Thr His Ser Gln Val Phe Val Tyr Met Leu

1 5 10 15

Leu Trp Leu Ser Gly Val Asp Met Ala Leu Arg Leu His Arg Arg Asn

20 25 30

His Phe Ser Pro Arg Asn Thr Asp Leu Phe Pro Asp Leu Ala Lys Asp

35 40 45

Arg Val Val Ile Val Leu Tyr Val His Asn Arg Ala Gln Tyr Phe Arg

50 55 60

Val Thr Val Glu Ser Leu Ser Lys Val Lys Gly Ile Ser Glu Thr Leu

65 70 75 80

Leu Ile Val Ser His Asp Gly Tyr Phe Glu Glu Met Asn Arg Ile Val

85 90 95

Glu Ser Ile Lys Phe Cys Gln Val Lys Gln Ile Phe Ser Pro Tyr Ser

100 105 110

Pro His Ile Tyr Arg Thr Ser Phe Pro Gly Val Thr Leu Asn Asp Cys

115 120 125

Lys Asn Lys Gly Asp Glu Ala Lys Gly His Cys Glu Gly Asn Pro Asp

130 135 140

Gln Tyr Gly Asn His Arg Ser Pro Lys Ile Val Ser Leu Lys His His

145 150 155 160

Trp Trp Trp Met Met Asn Thr Val Trp Asp Gly Leu Glu Glu Thr Lys

165 170 175

Gly His Glu Gly His Ile Leu Phe Ile Glu Glu Asp His Phe Leu Phe

180 185 190

Pro Asn Ala Tyr Arg Asn Ile Gln Thr Leu Thr Arg Leu Lys Pro Ala

195 200 205

Lys Cys Pro Asp Cys Phe Ala Ala Asn Leu Ala Pro Ser Asp Val Lys

210 215 220

Sar Arg Gly Glu Gly Leu Glu Ser Leu Val Ala Glu Arg Met Gly Asn

225 230 235 24D

Va1 Gly Tyr Ser Phe Asn Arg Ser Val Trp Glu Asn Ile His Gln Lys

245 250 255

Ala Arg Glu Phe Cys Phe Phe Asp Asp Tyr Asn Trp Asp Ile Thr Met

260 265 270

Trp Ala Thr Val Phe Pro Ser Phe Gly Ser Pro Val Tyr Thr Leu Arg

275 280 285

Gly Pro Arg Thr Ser Ala Val His Phe Gly Lys Cys Gly Leu His Gln

290 295 300

Gly Arg Gly Asp Glu Gly Asp Cys Ile Asp Asn Gly Val Val Asn Ile

305 310 315 320

Glu Val Lys Glu Thr Asp Lys Val Val Asn Ile Lys Glu Gly Trp Gly

325 330 335

Val Arg Val Tyr Lys His Gln Ala Gly Tyr Lys Ala Gly Phe Glu Gly

340 345 350

Trp Gly Gly Trp Gly Asp Asp Arg Asp Arg His Leu Cys Leu Asp Phe

355 360 365

Ala Thr Met Tyr Arg Tyr Ser Ser Ser Ser Ala Ser Pro Lys Asp Glu

370 375 380

Leu

385

<210>57

<211>1152

<212>DNA

<213>类人

<400>57

atgctgaaga agcagtctgc agggcttgtg ctgtggggcg ctatcctctt tgtggcctgg 60

aatgccctgc tgctcctctt cttctggacg cgcccagcac ctggcaggcc accctcagtc 120

agcgctctcg atggcgaccc cgccagcctc acccgggaag tcgacatgca gtcctccggg 160

gagctccgga ccggaggggc ccggccgccg cctcctctag gcgcctcctc ccagccgcgc 240

ccgggtggcg actccagccc agtcgtggat tctggccctg gccccgctag caacttgacc 300

tcggtcccag tgccccacac caccgcactg tcgctgcccg cctgccctga ggagtccccg 360

ctgcttgtgg gccccatgct gattgagttt aacatgcctg tggacctgga gctcgtggca 420

aagcagaacc caaatgtgaa gatgggcggc cgctatgccc ccagggactg cgtctctcct 480

cacaaggtgg ccatcatcat tccattccgc aaccggcagg agcacctcaa gtactggcta 540

tattatttgc acccagtcct gcagcgccag cagctggact atggcatcta tgttatcaac 600

caggcgggag acactatatt caatcgtgct aagctcctca atgttggctt tcaagaagcc 660

ttgaaggact atgactacac ctgctttgtg tttagtgacg tggacctcat tccaatgaat 720

gaccataatg cgtacaggtg tttttcacag ccacggcaca tttccgttgc aatggataag 780

tttggattca gcctacctta tgttcagtat tttggaggtg tctctgctct aagtaaacaa 840

cagtttctaa ccatcaatgg atttcctaat aattattggg gctggggagg agaagatgat 900

gacattttta acagattagt ttttagaggc atgtctatat ctcgcccaaa tgctgtggtc 960

gggaggtgtc gcatgatccg ccactcaaga gacaagaaaa atgaacccaa tcctcagagg 1020

tttgaccgaa ttgcacacac aaaggagaca atgctctctg atggtttgaa ctcactcacc 1080

taccaggtgc tggatgtaca gagataccca ttgtataccc aaatcacagt ggacatcggg 1140

acaccgagct ag 1152

<210>58

<211>383

<212>PRT

<213>类人

<400>58

Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Leu

1 5 10 15

Phe Val Ala Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Thr Arg Pro

20 25 30

Ala Pro Gly Arg Pro Pro Ser Val Ser Ala Leu Asp Gly Asp Pro Ala

35 40 45

Ser Leu Thr Arg Glu Val Asp Met Gln Ser Ser Gly Glu Leu Arg Thr

50 55 60

Gly Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg

65 70 75 80

Pro Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala

85 90 95

Ser Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu

100 105 110

Pro Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile

115 120 125

Glu Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro

130 135 140

Asn Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro

145 150 155 160

His Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu

165 170 175

Lys Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu

180 185 190

Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr Ile Phe Asn

195 200 205

Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp Tyr

210 215 220

Asp Tyr Thr Cys Phe Va1 Phe Ser Asp Val Asp Leu Ile Pro Met Asn

225 230 235 240

Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser Val

245 250 255

Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln Tyr Phe Gly

260 265 270

Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly Phe

275 280 285

Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn

290 295 300

Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Val Val

305 310 315 320

Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu Pro

325 330 335

Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met Leu

340 345 350

Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln Arg

355 360 365

Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser

370 375 380

<210>59

<211>400

<212>PRT

<213>类人

<400>59

Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ala Ala Met Pro Gly AIa

1 5 10 15

Ser Leu Gln Arg Ala Cys Arg Leu Leu Val Ala Val Cys Ala Leu His

20 25 30

Leu Gly Val Thr Leu Val Tyr Tyr Leu Ala Gly Arg Asp Leu Ser Arg

35 40 45

Leu Pro Gln Leu Val Gly Val Ser Thr Pro Leu Gln Gly Gly Ser Asn

50 55 60

Ser Ala Ala Ala Ile Gly Gln Ser Ser Gly Glu Leu Arg Thr Gly Gly

65 70 75 80

Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg Pro Gly

85 90 95

Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala Ser Asn

100 105 110

Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu Pro Ala

115 120 125

Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile Glu Phe

130 135 140

Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro Asn Val

145 150 155 160

Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro His Lys

165 170 175

Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu Lys Tyr

180 185 190

Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu Asp Tyr

195 200 205

Gly Ile Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr Ile Phe

210 215 220

Asn Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp

225 230 235 240

Tyr Asp Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met

245 250 255

Asn Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser

260 265 270

Val Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln Tyr Phe

275 280 285

Gly Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly

290 295 300

Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe

305 310 315 320

Asn Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Val

325 330 335

Val Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu

340 345 350

Pro Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met

355 360 365

Leu Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln

370 375 380

Arg Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser

385 390 395 400

Claims

1.编码杂合酶的核酸，所述杂合酶包含植物糖基转移酶的跨膜区和哺乳动物糖基转移酶的催化区。

2.权利要求1的核酸，其中所述植物糖基转移酶是木糖基转移酶。

3.权利要求1的核酸，其中所述植物糖基转移酶是N-乙酰葡糖胺基转移酶。

4.权利要求1的核酸，其中所述植物糖基转移酶是海藻糖基转移酶。

5.权利要求1的核酸，其中所述哺乳动物糖基转移酶是人半乳糖基转移酶。

6.权利要求5的核酸，其中所述人半乳糖基转移酶是由至少SEQ ID NO：1的核酸序列的一部分编码。

7.一种表达载体，包含权利要求1的核酸。

8.一种用权利要求7的载体转染的宿主细胞。

9.权利要求8的宿主细胞，其中所述宿主细胞是植物细胞。

10.一种细胞悬浮液，包含权利要求9的宿主细胞。

11.由权利要求9的植物细胞表达的杂合酶。

12.包含权利要求9的宿主细胞的植物。

13.编码一种杂合酶的核酸，所述杂合酶包含第一个糖基转移酶的跨膜区和第二个糖基转移酶的催化区。

14.权利要求13的核酸，其中所述第一个糖基转移酶包含植物糖基转移酶。

15.权利要求14的核酸，其中所述植物糖基转移酶是木糖基转移酶。

16.权利要求14的核酸，其中所述植物糖基转移酶是海藻糖基转移酶。

17.权利要求13的核酸，其中所述第二个糖基转移酶包含哺乳动物糖基转移酶。

18.权利要求17的核酸，其中所述哺乳动物糖基转移酶是人半乳糖基转移酶。

19.权利要求13的核酸，其中所述第一个糖基转移酶包含第一个哺乳动物糖基转移酶和所述第二个糖基转移酶包含第二个哺乳动物糖基转移酶。

20.权利要求19的核酸，其中所述第一个哺乳动物糖基转移酶是非人类糖基转移酶。

21.权利要求19的核酸，其中所述第二个哺乳动物糖基转移酶是人糖基转移酶。

22.一种方法，包含：

a)提供：i)一种植物细胞，和ii)一种包含编码杂合酶的核酸的表达载体，所述杂合酶包含植物糖基转移酶的跨膜区和哺乳动物糖基转移酶的催化区；和

b)在使得所述杂合酶被表达的条件下，将所述表达载体导入所述植物细胞。

23.权利要求22的方法，其中所述植物糖基转移酶是木糖基转移酶。

24.权利要求23的方法，其中所述植物糖基转移酶是N-乙酰葡糖胺基转移酶。

25.权利要求23的方法，其中所述植物糖基转移酶是海藻糖基转移酶。

26.权利要求22的方法，其中所述哺乳动物糖基转移酶是人半乳糖基转移酶。

27.权利要求26的方法，其中所述人半乳糖基转移酶是由至少SEQ ID NO：1的核酸序列的一部分编码。

28.一种方法，包含：

a)提供：i)一种植物细胞，和ii)包含编码杂合酶的核酸的第一种表达载体，所述杂合酶包含植物糖基转移酶的跨膜区和哺乳动物糖基转移酶的催化区；和iii)包含编码异源糖蛋白的核酸的第二个表达载体，和；

b)在使得所述杂合酶被表达的条件下，将所述第一和第二种载体导入所述植物细胞。

29.权利要求28的方法，其中所述异源蛋白是一种抗体或抗体片段。

30.一种方法，包含：

a)提供：i)包含第一种表达载体的第一种植物，所述第一个载体包含编码杂合酶的核酸，所述杂合酶包含至少植物糖基转移酶的跨膜区的一部分和至少哺乳动物糖基转移酶的催化区的一部分，和ii)包含第二个表达载体的第二种植物，所述第二个载体包含编码异源蛋白的核酸；和

b)杂交所述第一种植物和第二种植物来制备表达所述杂合酶和所述异源蛋白的子代。

31.一种植物，包含第一个和第二个表达载体，所述第一个载体包含编码杂合酶的核酸，所述杂合酶包含至少植物糖基转移酶的跨膜区的一部分和至少哺乳动物糖基转移酶的催化区的一部分，所述第二个载体包含编码异源蛋白的核酸。

32.权利要求31的植物，其中所述异源蛋白与异源蛋白在无所述杂合酶的植物中被表达相比，表现为海藻糖含量降低。

33.权利要求31的植物，其中异源蛋白与所述异源蛋白在无所述杂合酶的植物中的表达相比，表现为木糖含量降低。

34.权利要求31的植物，其中异源蛋白与所述异源蛋白在无所述杂合酶的植物中的表达相比，表现为海藻糖和木糖含量都降低。

35.权利要求31的植物，其中异源蛋白具有复合型双触角聚糖，并且至少一个臂上含有半乳糖残基。

36.编码杂合酶的核酸，所述杂合酶包含被修饰的哺乳动物糖基转移酶，其中跨膜部分被删除而插入内质网滞留信号。

37.编码杂合酶的核酸，所述杂合酶包含植物糖基转移酶的CTS区或其部分和哺乳动物糖基转移酶的催化区，其中所述CTS区来自N-乙酰葡糖胺基转移酶I(GnT I)，所述催化区来自甘露糖苷酶II(Man II)。

38.编码杂合酶的核酸，所述杂合酶包含植物糖基转移酶的CTS区或其部分和哺乳动物糖基转移酶的催化区，其中所述CTS区或其部分来自N-乙酰葡糖胺基转移酶I(GnT I)，所述催化区来自N-乙酰葡糖胺基转移酶II(GnT II)。

39.一种植物宿主系统，包含(a)编码甘露糖苷酶III糖基转移酶的核酸序列；(b)编码杂合酶的核酸序列，所述杂合酶包含植物糖基转移酶的CTS区或其部分和哺乳动物糖基转移酶的催化区。

40.一种方法，包含(a)往所述植物宿主系统中导入一个载体，其包含i)编码杂合酶的核酸序列，杂合酶包含通常不存在于植物的半乳糖基转移酶的催化区和一种蛋白的跨膜区，ii)编码包含N-乙酰葡糖胺基转移酶I(GnT I)的跨膜区和甘露糖苷酶II(Man II)的催化区的杂合酶的核酸序列，iii)编码包含N-乙酰葡糖胺基转移酶I(GnT I)的跨膜区和N-乙酰葡糖胺基转移酶II(GnT II)的催化区的杂合酶的核酸序列；和(b)分离表达所述核酸序列的植物或其部分。

41.一种方法，包含：

(a)提供i)一种宿主细胞，和ii)包含编码杂合酶的核酸的表达载体，所述杂合酶包含第一个糖基转移酶的跨膜区和第二个糖基转移酶的催化区；和

(b)在使得所述杂合酶被表达的条件下，将所述表达载体导入所述宿主系统中。

42.权利要求41的方法，其中所述第一个糖基转移酶包含植物糖基转移酶。

43.权利要求42的方法，其中所述植物糖基转移酶是木糖基转移酶。

44.权利要求42的方法，其中所述植物糖基转移酶是N-乙酰葡糖胺基转移酶。

45.权利要求42的方法，其中所述植物糖基转移酶是海藻糖基转移酶。

46.权利要求41的方法，其中所述第二个糖基转移酶包含哺乳动物糖基转移酶。

47.权利要求46的方法，其中所述哺乳动物糖基转移酶是人半乳糖基转移酶。

48.一种方法，包含：

(a)提供i)一种宿主细胞，和ii)包含编码杂合酶的核酸的第一种表达载体，所述杂合酶包含第一个糖基转移酶的跨膜区和第二个糖基转移酶的催化区；和iii)包含编码异源糖蛋白的核酸的第二个表达载体；和

(b)在使得所述杂合酶和异源蛋白被表达的条件下，将所述第一种和第二种表达载体导入所述宿主系统中，。

49.权利要求48的方法，其中所述异源蛋白是抗体或抗体片段。

50.权利要求48的方法，还包括步骤c)分离所述异源蛋白。

51.按照权利要求50的方法制备的分离的异源蛋白。

52.一种宿主细胞，包含第一种和第二种表达载体，所述第一个载体包含编码杂合酶的核酸，所述杂合酶包含至少第一个糖基转移酶的跨膜部分的一部分和至少第二个糖基转移酶的催化区的一部分，所述第二个载体包含编码异源蛋白的核酸。

53.从权利要求52的宿主细胞分离的异源蛋白。