Nothing Special   »   [go: up one dir, main page]

CN1756844A - 在植物中优化聚糖生成 - Google Patents

在植物中优化聚糖生成 Download PDF

Info

Publication number
CN1756844A
CN1756844A CNA038065479A CN03806547A CN1756844A CN 1756844 A CN1756844 A CN 1756844A CN A038065479 A CNA038065479 A CN A038065479A CN 03806547 A CN03806547 A CN 03806547A CN 1756844 A CN1756844 A CN 1756844A
Authority
CN
China
Prior art keywords
plant
glycosyltransferase
heterozyme
nucleic acid
mammals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA038065479A
Other languages
English (en)
Other versions
CN100532558C (zh
Inventor
H·A·C·巴克
D·E·A·弗洛拉克
H·J·博斯
G·J·A·鲁文德尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Plant Research International BV
Original Assignee
Plant Research International BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Plant Research International BV filed Critical Plant Research International BV
Publication of CN1756844A publication Critical patent/CN1756844A/zh
Application granted granted Critical
Publication of CN100532558C publication Critical patent/CN100532558C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8257Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8257Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
    • C12N15/8258Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon for the production of oral vaccines (antigens) or immunoglobulins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/10Immunoglobulins specific features characterized by their source of isolation or production
    • C07K2317/13Immunoglobulins specific features characterized by their source of isolation or production isolated from plants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/40Immunoglobulins specific features characterized by post-translational modification
    • C07K2317/41Glycosylation, sialylation, or fucosylation
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Cell Biology (AREA)
  • Immunology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及优化生物体(特别是植物中)的聚糖生成方法,以获得具有复合型双触角聚糖的糖蛋白,并且在双臂上含有5半乳糖残基而不含有(或减少)木糖和海藻糖。本发明还涉及获得的所述糖蛋白和含有所述蛋白的宿主系统。

Description

在植物中优化聚糖生成
发明领域
本发明涉及用于优化含有N-聚糖的糖蛋白的细胞或生物体,特别是植物的聚糖生成方法,从而得到一种糖蛋白,其具有高甘露糖型的N-聚糖,杂合型或优选复合型的N-聚糖,包括但不限于双触角N-聚糖,并在N-聚糖的至少一个臂上含有半乳糖残基,不含有(或者减少)木糖和海藻糖残基。本发明还涉及得到的所述糖蛋白和特别是含有该蛋白的植物宿主系统。
发明背景
N-联聚糖(N-Linked glycans)是连接到糖蛋白的天冬酰胺残基上的特定寡糖结构,能够显著地影响蛋白质的性质,进而影响生物体的特性。植物蛋白具有N-联聚糖,但是极其不同于哺乳动物,它们所影响的生物学过程几乎是未知的。
N-联聚糖的生物生成起始于脂联寡糖成分(Glc3Man9GlcNAc2-)的合成,该成分全部被转移给内质网(ER)中的新生多肽链。通过内质网和顺式高尔基体区室中的一系列外切糖苷酶的修剪(trimming),形成所谓的“高甘露糖”型聚糖(由Man9GlcNAc2变成Man5GlcNAc2)。随后,由GnTI将第一个GlcNAc转移到Man5GlcNAc2,接着通过甘露糖苷酶II(ManII)修剪来形成GlcNAcMan3GlcNAc2,开始形成复合型聚糖。当在一些其他的糖基转移酶的作用下,通过分泌路径在高尔基体中由GnTII将第二个GlcNAc残基以及其他单糖残基转移到GlcNAcMan3GlcNAc2上,继续复合型聚糖的生物合成。
植物和哺乳动物在复合聚糖形成方面是不同的(见附图1,比较植物和哺乳动物中的糖蛋白的糖基化路径)。在植物中,复合型聚糖的特征在于存在连接到Man-3的β(1,2)-木糖残基和/或连接到GlcNAc-1的α(1,3)-海藻糖残基,不具有连接到GlcNAc-l的α(1,6)-海藻糖残基。编码相应的木糖基(XylT)和海藻糖基(FucT)转移酶的基因已经被分离[Strasser等,“拟南芥β1,2-木糖基转移酶cDNA的分子克隆和功能性表达”,FEBS Lett.472:105(2000);Leiter等,“从绿豆中纯化、cDNA克隆和表达GDP-L-Fuc:Asn联GlcNAcα1,3-海藻糖转移酶”,生物学化学杂志(J.Biol.Chem.)274:21830(1999)]。植物不能生成β(1,4)-半乳糖基转移酶和α(2,6)唾液酸转移酶,结果植物聚糖缺乏常见于哺乳动物聚糖的β(1,4)-半乳糖和末端的α(2,6)NeuAc残基。
最终的聚糖结构不仅仅由存在的参与聚糖生物合成和转运的酶来决定,还在更大的范围内由各种酶促反应的特定顺序来确定。在后一种情况中,是受这些酶在整个内质网和高尔基中的分散隔离和相对位置来控制,这是通过转移酶的决定因子相互作用和亚高尔基体区室无转移酶的特定特征调节的。许多采用杂合分子的研究已经证明一些糖基转移酶的跨膜结构域在其亚高尔基分类中起主要作用,包括β(1,4)-半乳糖基转移酶的跨膜结构域[Grabenhorst等,生物学化学杂志(J.Biol.Chem.)274:36107(1999);Colley,K.,糖生物学(Glycobiology)7:1(1997);Munro,S.,细胞生物学趋势(Trends Cell Biol.)8:11(1998);Gleeson,P.A.,组织化学细胞生物学(Histochem.Cell Biol.)109:517(1998)]。
虽然植物和哺乳动物在相对较早以前就分化了,N联糖基化似乎至少部分地保守。这由聚糖结构虽然不同但是类似以及哺乳动物的GlcNAcTI基因染色体(complement)不具有GlcNAcTI活性的拟南芥的突变体证实,反之亦然。聚糖结构的差异具有重要作用。例如,已知木糖和α(1,3)-海藻糖抗原决定簇具有极高的免疫原性,并且在某些情况下可能引起过敏,这在用植物生产治疗性糖蛋白时带来了问题。而且,在许多敏感症患者的血液血清中含有直接抵抗这些抗原决定簇的IgE,而且50%的非敏感症血液供体在其血清中含有特异于核心-木糖的抗体,而25%含有特异于核心-α1,3-海藻糖的抗体(Bardor等,2002,在版,糖生物学(Glycobiology))(2002年12月17日预先Access出版),这使得这些个体冒险采用由植物制备的含有海藻糖和/或木糖的重组蛋白处理。此外,由于有证据表明这些糖特异的IgE与致敏反应无关,在血清中指示IgE的这种糖会在使用植物提取物的体外试验中引起假阳性反应。总之,使用植物生产的糖蛋白的治疗失败可能是由于加速清除具有木糖和/或海藻糖的重组糖蛋白。
因此,需要更好地控制植物中的糖基化,特别是用于治疗用途的糖蛋白的糖基化。
定义
为了方便本发明的理解,在本说明书中采用多种术语定义如下。
术语“载体”是指任何遗传元件,例如质粒、噬菌体、转位子、粘粒、染色体、逆转录病毒、病毒子、或类似遗传元件,当与恰当调控元件结合时,其能够复制,并将基因序列转移到细胞内和/或在细胞之间转移。因此,该术语包括克隆载体和表达载体,以及病毒载体。
在此所用术语“表达载体”是指重组DNA分子,其含有期望的编码序列—例如下文更加详细描述的杂合酶的编码序列—和在特定宿主细胞或生物体中表达可操作连接的编码序列所必需的适宜核酸序列。原核细胞中表达所必需的核酸序列通常包括启动子、操作子(可选择的)和核糖体结合位点,常常还有其他序列。已知真核细胞利用启动子、增强子、终止子和聚腺苷酰化信号。这不是将本发明限制在特定的表达载体或具有特定元件的表达载体。
当用于涉及细胞时,术语“转基因的”是指含有转基因的细胞,或者其基因组已经通过导入转基因被改变。当用于涉及、组织或植物时,术语“转基因的”分别是指包含转基因的细胞、组织或植物,其中该组织的一个或多个细胞含有转基因(例如编码本发明的杂合酶的基因),或基因组通过引入转基因而被改变的植物。转基因细胞、组织和植物可以通过一些方法制备,包括将包含核酸(通常DNA)的“转基因”导入目标细胞中或者通过人为介入将转基因整合到目标细胞的染色体中,例如通过本文描述的方法。
在此所用术语“转基因”是指任何核酸序列,其通过试验操作被导入到细胞的基因组中。转基因可以是“内源DNA序列”或“异源DNA序列”(即“外源DNA”)。术语“内源DNA序列”是指天然存在于其被导入的细胞的核苷酸序列,只要该核苷酸序列不含有相对于天然序列的修饰(例如点突变、存在选择性标记基因或其他类似修饰)。术语“异源DNA序列”是指被连接到或者被加工来连接到一条核酸序列上的核苷酸序列,自然条件下该核苷酸不与该核酸序列连接或者在不同位点上连接。异源DNA对于其所导入的细胞来说不是内源的,而是得自其他细胞。异源DNA还包括具有某些修饰的内源DNA序列。虽然不是必要地,但是一般地,异源DNA在细胞中被表达,编码该细胞通常不能生产的RNA和蛋白质。异源DNA的例子包括报道基因、转录和翻译调控序列、选择性标记蛋白(如赋予药物抗性的蛋白)、或其他类似元件。
术语“外源基因”是指通过试验操作被导入细胞基因组的任何核酸(如基因序列),包括存在于该细胞中的基因序列,只要被导入的基因序列具有相对于天然序列的某些修饰(例如点突变、存在选择性标记基因或其他类似修饰)。
术语“融合蛋白”是指其中至少一部分来自第一种蛋白质和另一部分来自第二种蛋白质的蛋白质。术语“杂合酶”是指一种功能性酶的融合蛋白,其中至少一部分是来自第一种类和另一部分来自第二种类。本发明的优选杂合酶是功能性糖基转移酶(或其部分),其中至少一部分来自植物和另一部分来自哺乳动物(如人类)。
术语“导入细胞”或“导入宿主细胞”涉及核酸(如载体)时,是包括本领域所谓的“转化”或“转染”或“转导”。细胞的转化是稳定的或瞬时的—和本发明提供在一定条件下导入载体,一方面可以稳定表达,另一方面仅仅是瞬时表达。术语“瞬时转化”或“瞬时地被转化”是指将一个或多个转基因导入细胞中,而不将转基因整合导宿主细胞的基因组中。瞬时转化可以例如通过酶联免疫吸收分析(ELISA)来检测,检测是否存在由一种或多种转基因编码的多肽。可替代地,瞬时转化可以通过检测由转基因(如抗体基因)编码的蛋白质的活性(如抗体的抗原结合)来检测。术语“瞬时转化”是指瞬时并入一种或多种转基因的细胞。相反,术语“稳定转化”或“稳定地被转化”是指将一种或多种转基因导入或整合到细胞的基因组中。细胞的稳定转化可以通过细胞的基因组DNA与能够结合到一种或多种转基因的核酸序列的Southern印迹杂交来检测。可替代地,细胞的稳定转化还通过细胞基因组DNA的聚合酶链式反应(PCR)来扩增转基因序列来检测。术语“稳定转化”是指稳定地将一个或多个转基因整合到基因组DNA的细胞。因此,稳定转化区别于瞬时转化,其中稳定转化的基因组DNA含有一种或多种转基因,瞬时转化的基因组DNA不含有转基因。
术语“宿主细胞”包括哺乳动物细胞(如人B细胞克隆、中国仓鼠卵巢细胞、肝细胞)和非哺乳动物细胞(如昆虫细胞、细菌细胞、植物细胞)。在一个实施方案中,宿主细胞是哺乳动物细胞,并且导入表达本发明的杂合蛋白(如TmGnTII-GalT)的载体抑制(或至少降低)所述哺乳动物细胞中的海藻糖基化(fucosylation)。
术语“目标核苷酸序列”是指任何核苷酸序列,对于本领域技术人员来说,由于任何原因(如赋予提高质量、用于制备治疗性蛋白质),其处理被认为是期望的。这种核苷酸序列包括但不限于结构基因的编码序列(如报道基因,选择标记基因、致癌基因、抗体基因、药物抗性基因、生长因子和其他类似基因),和不编码mRNA或蛋白产物的非编码调控序列(如启动子序列、聚腺苷酸序列、终止子序列、增强子序列、和其他类似序列)。本发明提供表达由目标核苷酸序列编码的异源蛋白的宿主细胞以及一种或多种杂合酶。
当用于涉及核酸时,如在“分离的核酸序列”中,术语“分离的”是指被鉴定和从一种或多种其他成分中被分离的核酸序列(如从含有该核酸的细胞中分离,或者从至少一种杂质核酸中分离,或者从一种或多种蛋白、一种或多种脂肪中分离),在天然来源中核酸通常与这些成分结合在一起。分离的核酸是以不同于其在自然界中见到的形式或装配(setting)存在的核酸。相反,未被分离的核酸是如以天然存在的状态被发现的DNA和RNA的核酸。例如,在接近于邻近基因的宿主细胞染色体上发现特定的DNA序列(如基因);RNA序列,如编码特定蛋白质的特定mRNA被发现在细胞中与大量编码许多蛋白质的其他mRNA混合在一起。但是,包含SEQ ID NO:1的分离核酸序列包括,作为例子,通常含有SEQ ID N0:1的细胞中这种核酸序列,其中核酸序列在区别于天然细胞的染色体的或染色体外的位置上,或者被不同天然存在的核酸序列侧面连接。分离的核酸序列可能以单链或双链形式存在。当分离的核酸序列被用于表达蛋白质时,该核酸序列将最小地至少含有有义链或编码链的一部分(即该核酸序列可以是单链的)。可替代地,可以同时含有有义链和反义链(即该核酸序列是双链的)。
此处所用术语“纯化的”是指核酸或者氨基酸序列分子,从其天然环境中被取出,被分离或被分开。因此“分离的核酸序列”是被纯化的核酸序列。“基本上纯化的”分子至少60%,优选至少70%和更加优选的至少90%没有该分子天然地结合的其他成分。本发明提供纯化的(包括基本上纯化的)和未纯化的杂合酶(将在下文中更详细描述)。
在此所用术语“互补的”或“互补性”被用于指根据碱基配对原则是相关的核苷酸序列。例如,序列5’-AGT-3’与序列5’-ACT-3’互补。互补性可以是“部分的”或“全部的”。“部分”互补性是其中一个或多个核苷酸碱基按照碱基配对原则是不匹配的。两条核酸之间的“全部的”或者“完全的”互补性是其中每个核酸碱基依据碱基配对原则与另一个碱基匹配。两条核酸链之间的互补程度显著地影响核酸链之间的杂交效率和强度。
在此所用的核酸序列的“互补物”是指核酸与核酸序列的核酸具有全部互补性的核苷酸序列。例如,本发明提供SEQ ID NO:1,3,5,9,27,28,29,30,31,32,33,34,35,37,38,40,41和43的互补物。
当用于涉及核酸时,术语“同源性”是指互补程度。可能是部分同源性(即部分同一性)或完全同源性(即完全同一性)。部分互补的序列是至少部分地抑制完全互补的序列杂交到目标核酸的序列,参照采用功能术语“基本上同源的”。可以在低严紧性条件下进行杂交分析(Southern或Northern印迹、溶液杂交等)来检测对完全互补序列与目标序列杂交的抑制。在低严紧条件下,基本上同源的序列或探针(即能够杂交到另一条目标寡核苷酸的寡核苷酸)将竞争和抑制完全同源的序列结合(即杂交)到目标上。这并不是说低严紧条件是可以进行非特异性结合的条件;低严紧条件要求两条序列相互结合是特异性的(即选择性的)互作。可以采用甚至不具有部分互补性(如小于约30%的同一性)的第二条目标序列来检测是否存在非特异性的结合;没有非特异性结合时,探针不会杂交到第二条非互补的目标链上。
当被用于涉及双链核酸序列如cDNA或基因组克隆时,术语“基本上同源的”是指在上文描述的低严紧条件下能够杂交到双链核酸的一条或两条链上的任何探针。
当被用于涉及单链核酸序列时,术语“基本上同源的”是指在上文描述的低严紧条件下能够杂交到单链核酸序列上的任何探针。
在此所用术语“杂交”包括“通过碱基配对将核酸的一条链结合到互补的链上的任何过程”[Coombs J(1994)生物工艺学词典(Dictionary of Biotechnology),Stockton出版社,纽约]。杂交和杂交强度(即核酸之间的结合强度)受核酸之间的互补程度、涉及的条件的严紧度、形成的杂合体的Tm、核酸中的G∶C比等因素的影响。
此处所用术语“Tm”用于指“解链温度”。解链温度是大量双链核酸分子半数分离成单链时的温度。计算核酸的Tm的方程在本领域是熟知的。如标准参考文献中指出。当核酸在1M NaCl的水溶液中时,Tm的简单估计值可以通过方程Tm=81.5+0.41(%G+C)计算[见如,Anderson和Young,定量滤过杂交:核酸杂交(Nucleic Acid Hybridization)(1985)]。其他的参考文献包括更加精确的计算,将结构特征以及序列特征考虑在内来计算Tm
用于涉及核酸杂交时,低严紧条件包含的条件等价于当采用长度约100到约1000个核苷酸的DNA探针时,在68℃下在由5X SSPE(盐、磷酸钠、EDTA)(43.8g/l NaCl、6.9g/l NaH2PO4·H2O和1.85g/l EDTA(乙二胺四乙酸),用NaOH调节pH为7.4),0.1%SDS(十二烷基硫酸钠),5X Denhardt试剂[每500ml的50XDenhardt中含有:5gFicoll(Type400,Pharmacia),5gBSA(牛血清白蛋白)(Fraction V;Sigma)]和100μg/ml变性的鲑鱼精子DNA组成的溶液中结合或杂交,接着室温下在包含0.2X-2.0X SSPE和0.1%SDS的溶液中洗涤。
用于涉及核酸杂交时,高严紧条件包含的条件等价于当采用长度约100到约1000个核苷酸的DNA探针时,在68℃下在由5X SSPE,5X Denhardt试剂和100μg/ml变性的鲑鱼精子DNA组成的溶液中结合或杂交,接着在68℃下在包含0.2X-2.0X SSPE和0.1%SDS的溶液中洗涤。
当用于涉及与目标杂交条件相关的杂交条件时,术语“等价于”是指杂交条件和目标杂交条件引起具有相同范围的百分同源性的核酸序列的杂交。例如,目标杂交条件引起第一条核酸序列与另一条与第一条核酸序列具有50%-70%同源性的核酸序列的杂交,那么,如果另一种杂交条件也引起第一条核酸序列与另一条与第一条核酸序列具有50%-70%同源性的序列杂交,这种杂交条件被认为等价于目标杂交条件。
当用于涉及核酸杂交时,本领域技术人员知晓许多等价条件可被用于构成低的或高的严紧条件;考虑如探针的长度和性质(DNA、RNA,碱基组成)和靶点的性质(DNA、RNA,碱基组成,存在于溶液中或者是固定的)以及盐和其他成分浓度(如是否存在甲酰胺、硫酸葡聚糖、聚乙二醇)等因素,而且可以改变杂交溶液来产生区别、但等价于上面所列的条件的低严紧的或高严紧的杂交条件。
在此所用的术语“启动子”、“启动子元件”或“启动子序列”是指DNA序列,当被连接到目标核苷酸序列时,能够控制目标核苷酸序列转录为mRNA。虽然不是必须的,但是启动子通常位于目标核苷酸序列的5’端(即上游),该目标核苷酸序列转录成mRNA,启动子控制和提供用于起始转录的RNA聚合酶和其他转录因子的特异性结合位点。
启动子可以是组织特异性的或细胞特异性的。当应用于启动子时,术语“组织特异性的”是指启动子能够指导目标核苷酸序列选择性地表达到特定组织类型(如花瓣),而同一目标核苷酸序列在不同组织类型中(如根)相对地不表达。启动子的组织特异性可以被评价,如通过将报道基因可操作地连接到启动子序列上来产生报道构建体,将该报道构建体导入植物的基因组中,使得该报道构建体被整合到所得到的转基因植物的每个组织中,在转基因植物的不同组织中检测报道基因的表达(如检测mRNA、蛋白质、或由报道基因编码的蛋白质的活性)。在一个或多个组织中检测到比其他组织中报道基因的表达水平更高的报道基因的表达水平,表明启动子对于检测到较高表达水平的组织来说是特异的。术语“细胞类型特异的”应用于启动子是指启动子能够指导目标核苷酸序列在特定类型细胞中选择性地表达,而同一目标核苷酸序列在相同组织的不同类型的细胞中相对地不表达。术语“细胞类型特异的”应用于启动子还指启动子能够促进目标核苷酸序列在单一组织的某个区中选择性地表达。启动子的细胞特异性可以采用本领域熟知的方法来评价,如免疫组织化学染色。简而言之,组织切片被包埋在石蜡中,石蜡切片与特异于目标核苷酸序列所编码的多肽产物的第一抗体反应,该多肽的表达受启动子调控。特异于第一抗体的标记(如过氧化物酶偶联)第二抗体与组织切片结合,并且通过显微镜检测特异性结合(如用抗生物素蛋白/生物素)。
启动子可以是组成型的或调控型的。当术语“组成型的”用于涉及启动子时是指缺乏刺激(如热休克、化学药品、光照或类似刺激)时,启动子能够指导被可操作连接的核酸序列的转录。典型地,组成型启动子能够在几乎任何细胞和任何组织中指导转基因的表达。相反,“调控型的”启动子是在存在刺激(如热休克、化学药品、光照或类似刺激)时能够指导可操作地连接的核酸序列的一定水平的转录,其不同于缺乏刺激时的可操作地连接的核酸序列的转录水平。
术语用细菌“感染”(infecting)和“感染”(infection)是指目标生物样本在一定条件下与细菌共培养,使得包含在细菌内的核酸序列被导入目标生物样本的一个或多个细胞中。
术语“农杆菌”是指土壤中产生的、革兰氏阴性的、杆状的致植物病细菌,其引起冠瘿病。术语“农杆菌”包括但不限于根癌农杆菌(通常在被感染的植物中引起冠瘿病)和毛根农杆菌(其在被感染的宿主植物中引起发根疾病)。用农杆菌感染植物细胞通常导致被感染的细胞生成冠瘿碱(如胭脂碱、农杆碱、章鱼碱)。因此,导致生成胭脂碱的农杆菌菌株(如菌株LBA4301、C58、A208)称作为“胭脂碱型”农杆菌;导致生成农杆碱的农杆菌菌株(如菌株LBA4404、Ach5、B6)称作为“农杆碱型”农杆菌;导致生成章鱼碱的农杆菌菌株(如菌株EHA105、EHA101、A281)称作为“章鱼碱型”农杆菌。
术语“轰击”(bombarding)、“轰击”(bombardment)和“基因枪轰击”(biolistic bombardment)是指加速粒子轰击目标生物样本(如细胞、组织、植物的部分如叶子或完整的植物)的方法,来实现创伤目标生物样本的细胞的细胞膜/或使粒子进入目标生物样本。基因枪轰击的方法在本领域是已知的(如美国专利5,584,807和5,141,131,这两篇专利的内容在此引入作为参考),并且可以购买得到(如氦气生成微发射加速器(PDS-1000/He)(BioRad)。
当术语“微创”(microwounding)用于涉及植物组织时是指在该组织中引入细微的创伤。微创可以通过例如本文描述的粒子轰击来实现。本发明特别地提供采用微创来引入核酸的方案。
在此所用的术语“生物体”是指所用的生物体,并且特别是含有具有N-联聚糖的糖蛋白的生物体。
在此所用的术语“植物”是指充分地分化为存在于植物发育的任何阶段的一种结构的大量植物细胞。这种结构包括但不限于果实、芽、茎、根、叶、种子、花瓣或类似结构。术语“植物组织”包括分化的和未分化的植物组织,包括但不限于根、芽、叶、花粉、种子、瘤组织和各种类型培养细胞(如单细胞、原生质体、胚胎、愈伤组织、原始球茎样体和其他类型的细胞)。植物组织可能是in pLanta的、器官培养、组织培养或细胞培养中的。类似地,“植物细胞”可以是培养中的细胞或是植物的一部分。
糖基转移酶是催化决定细胞寡糖结构的加工反应的酶,包括糖蛋白上的寡糖。在此所用“糖基转移酶”是指包括甘露糖苷酶,既便这些酶修饰聚糖而不“转移”单糖。糖基转移酶具有II型膜定位的特性。每种糖基转移酶由氨基末端细胞质尾区(以下由一串专门用“X”标记氨基酸组成用于说明目的—而不是表示该区的实际大小)、信号锚定结构域(以下由一串用“H”标记的氨基酸组成表示疏水—而不是说明该结构域的实际大小,也不表示该结构域仅由疏水氨基酸组成)其跨过细胞膜(在此称作“跨膜结构域”)、接着是腔茎(以下用由一串专门用“S”标记的氨基酸组成表示—不是表示该区的实际大小)或柄区、和羧基末端的催化结构域(以下用一串专门用“C”标记的氨基组成表示—不是表示该结构域的实际大小:
NH2- XXXXXXHHHHHHHHSSSSSSSSCCCCCCCC
总的来说,胞质尾区-跨膜-茎或“CTS”(已经在上述示意图中用下划线标注来说明)(或其部分)可以被用于本发明提供的实施方案中,其中催化结构域与来自其他分子的相应催化结构域(或这种区/结构域的部分)调换或“交换”来生成杂合蛋白。
例如,在一个优选实施方案中,本发明提供编码杂合酶的核酸(以及含有这种核酸的载体、含有这种载体的宿主细胞和杂合酶本身),所述杂合酶至少包含第一个糖基转移酶(如植物糖基转移酶)的CTS区的一部分[如,胞质尾区(“C”)、跨膜结构域(“T”)、胞质尾区以及跨膜结构域(“CT”)、跨膜结构域以及茎(“TS”)、或者完整的CTS区],和至少第二个糖基转移酶(如哺乳动物糖基转移酶)的催化区的一部分。为了建立这种实施方案,整个CTS区(或其部分)的编码序列从编码哺乳动物糖基转移酶的核酸中被删除,用植物糖基转移酶的完整CTS区(或其部分)的编码序列取代。另一方面,不同的方法可以被用于建立这种实施方案;例如,整个催化结构域(或其部分)的编码序列从植物糖基转移酶的编码序列中删除,并且用哺乳动物糖基转移酶的完整催化结构域(或其部分)的编码序列取代。在这种情况下,得到的杂合酶具有植物糖基转移酶的氨基末端胞质尾区,其连接到以野生型植物酶的一般形式连接在植物糖基转移酶的茎干区的植物糖基转移酶跨膜结构域上—但是茎干区将被连接到哺乳动物糖基转移酶的催化结构域(或其部分)上。
无意将本发明仅限于上面描述的两种方法。包括该方法中的其他改变。例如,为了生成编码杂合酶的核酸,所述杂合酶包含至少植物糖基转移酶的跨膜区的一部分和至少哺乳动物糖基转移酶催化区的一部分,可能采用小于CTS区的整个编码序列(如仅植物糖基转移酶的跨膜结构域,或完整的胞质尾区以及全部或部分跨膜结构域,或完整的胞质尾区以及整个跨膜结构域以及茎干区的部分)。可以删除哺乳动物的整个胞质尾区的编码序列以及跨膜结构域的编码序列(或其部分)—接着用相应的植物糖基转移酶的胞质尾区和跨膜结构域(或其部分)的编码序列取代。在这种情况下,得到的杂合酶具有连接到植物糖基转移酶跨膜结构域(或其部分)的哺乳动物糖基转移酶的茎干区,其接着被连接到植物糖基转移酶的氨基末端的胞质尾区上,而茎干区被连接到哺乳动物糖基转移酶的催化结构域上(即四个区/结构域中的两个是植物来源的,而另外两个是哺乳动物来源的)。
在另一个实施方案中,本发明提供编码杂合酶的核酸(以及载体、含有该载体的宿主细胞、含有该宿主细胞的植物或植物部分),所述杂合酶包含至少植物糖基转移酶的氨基末端的胞质尾区的一部分和至少哺乳动物糖基转移酶的催化区的一部分。在该实施方案中,由核酸编码的杂合酶可能含有或不含有其他植物序列(如跨膜结构域或其部分、茎干区或其部分)。例如,为了建立该实施方案,整个胞质尾区(或其部分)的编码序列被从编码哺乳动物糖基转移酶的核酸中删除,并且用植物糖基转移酶的整个胞质尾区结构域(或其部分)的编码序列取代。在这种情况下,得到的杂合酶具有连接到哺乳动物糖基转移酶跨膜结构域的植物糖基转移酶的氨基末端的胞质尾区(或其部分),其接着被连接到哺乳动物糖基转移酶的茎干区上,该茎干区被连接到哺乳动物的催化结构域上。另一方面,采用不同的方法来建立该实施方案;例如,整个催化结构域(或其部分)的编码序列从植物糖基转移酶的编码序列中删除,并且用哺乳动物糖基转移酶的整个催化结构域(或其部分)的编码序列取代。在这种情况下,得到的杂合酶以野生型植物酶的方式,植物糖基转移酶的氨基末端的胞质尾区被连接到植物糖基转移酶的跨膜结构域,跨膜结构域连接到植物糖基转移酶的茎干区,但是茎干区将被连接到哺乳动物糖基转移酶的催化结构域(或其部分)。
在上述讨论中,采用用语“或其部分”特别指在特定情况下可以使用小于完整的区/结构域(如可以使用一个片段)。例如,糖基转移酶的胞质尾区长度范围在5-50个氨基酸,更典型的是15-30个氨基酸,这取决于特定的转移酶。胞质尾区的“一部分”在此定义为不少于四个氨基酸,并且可以达到比该区/结构域全长少一个氨基酸。期望部分的功能在某种意义上类似于全长的区/结构域—但不必起到相同程度的功能。例如,在一定程度上,全长胞质尾区作为高尔基滞留区或内质网滞留信号,期望在上述实施方案中采用的部分还作为高尔基或内质网滞留区,虽然可能不如全长区一样有效。
类似地,跨膜结构域的长度典型地为15-25个氨基酸,主要由疏水氨基酸组成。跨膜结构域的一部分在此定义为不少于10个氨基酸,可以达到用比全长的区/结构域少一个氨基酸(对于特定转移酶)的长度。期望部分功能在某种意义上类似于全长的区/结构域—但不必起到相同程度的功能。例如,在一定程度上,全长跨膜区作为高尔基滞留区或内质网滞留信号,期望在上述实施方案中采用的部分还作为高尔基或内质网保留区,虽然可能不如全长区一样有效。本发明特别提供保守性取代来生成野生型跨膜结构域或其部分的变体。例如,本发明提供用一个或多个不同的氨基酸,优选还是疏水性氨基酸,来取代一个或多个疏水性氨基酸(在上述方案中表示为“H”)。
催化结构域的一部分可以比该结构域的全长少一个氨基酸。虽然,催化结构域来自β1,4-半乳糖基转移酶,优选该部分包括最小残基345-365,一般认为其参与产生寡糖受体结合位点的构象(优选该部分最小包括这个区,并且两侧有5-10个氨基酸以保证正确的构象)。
本发明还提供合成的CTS区和其部分。CTS的“一部分”必须至少包括一个(可以包括一个以上)完整的结构域(如完整的跨膜结构域),但小于整个CTS区。
重要的是,使用术语“CTS区”或“跨膜结构域”并不是说仅包括野生型的序列。事实上,本发明不限于天然的糖基转移酶和参与糖基化的酶,还包括采用具有相同或相似功能的合成酶。在一个实施方案中,野生型结构域被改变(如通过缺失、插入、取代等)。
最后,当涉及特定杂合体(如″TmXyl-)时使用指示“Tm”,包括完整的跨膜/CTS结构域(改变或未改变野生型序列)以及部分(改变或未改变野生型序列)。
发明概述
本发明提供编码杂合酶(或“融合蛋白”)的核酸(DNA或RNA)、含有这种核酸的载体、含有这种载体的表达杂合酶的宿主细胞(包括但不限于植物组织和整个植物中的细胞),和分离的杂合酶本身。在一个实施方案中,所述杂合酶(或“融合蛋白”)的表达导致糖基化的改变,例如,但不限于糖成分如木糖、海藻糖、LewisA/B/X或其他糖结构的下降,妨碍期望的糖型的沉积。在一个实施方案中,本发明提供编码杂合酶的核酸,所述杂合酶包含糖基转移酶(包括但不限于植物糖基转移酶)的CTS区(或其部分)和非植物糖基转移酶(如哺乳动物、鱼、两栖类、真菌)的糖基转移酶的催化区(或其部分)。优选地,当被表达时CTS区(或其部分)被(直接或间接地)可操作结合地连接到所述催化区(或其部分)。连接优选是共价的,而结合是可操作的,其中催化区具有催化功能(即使所述催化功能相对于野生型酶降低了)。连接的方式是使得不插入氨基酸或其他区/结构域。另一方面,进行连接使得在两者之间插入氨基酸(或其他化学基团)和/或其他区/结构域。当然,用于制备编码上述杂合酶的核酸的核酸可以由酶促从天然序列(如基因组DNA、cDNA等)获得或者可选择地采用参比序列(如电子的或硬拷贝的序列)作为向导合成。
在一个特定的实施方案中,本发明提供编码杂合酶的核酸,所述杂合酶包括植物糖基转移酶的跨膜区(如至少一个跨膜区和可选择地CTS区的多个区)和非植物(如哺乳动物)糖基转移酶的催化区(或其部分)。此外,优选当被表达时,这些区域被可操作结合地(直接或间接)连接。在还有一个实施方案中,本发明提供编码杂合酶的核酸,所述杂合酶包括植物糖基转移酶的跨膜结构域(或其部分)和哺乳动物糖基转移酶的催化区(或其部分)。另外,优选当被表达时,这些区域以可操作结合被(直接或间接地)连接。
无意将本发明限定于特定的转移酶。在一个实施方案中,植物糖基转移酶是木糖基转移酶。在另一个实施方案中,植物糖基转移酶是N-乙酰葡糖胺基转移酶(N-acetylglucosaminyltransferase)。在另一个实施方案中,植物糖基转移酶是海藻糖基转移酶。在一个优选实施方案中,哺乳动物糖基转移酶是人半乳糖基转移酶(如由SEQ ID NO:1编码的人β1,4-半乳糖基转移酶,其中编码跨膜结构域的核苷酸被删除和取代)。
无意将本发明限制于使用植物来源的糖基转移酶CTS结构域和人糖基转移酶催化结构域,而是反之亦然,采用糖基转移酶的任何CTS-结构域与至少另一种糖基转移酶的催化片段结合。事实上,在一个实施方案中,本发明广泛地包括编码杂合酶的核酸,所述杂合酶包含第一个糖基转移酶的跨膜区和第二个糖基转移酶的催化区。优选地,所述第一个和第二个糖基转移酶是来自不同种类(可以来自不同属或甚至来自不同的门)。在一个实施方案中,所述第一个糖基转移酶包含植物糖基转移酶。在另一个实施方案中,所述植物糖基转移酶是木糖基转移酶。在还有一个实施方案中,所述植物糖基转移酶是海藻糖基转移酶。在一个优选实施方案中,所述第二个糖基转移酶包含哺乳动物糖基转移酶。在一个特别优选的实施方案中,所述糖基转移酶是人半乳糖基转移酶。
无意将本发明限制在第一和第二个糖基转移酶分别是植物的和非植物的情况。在一个实施方案中,所述第一个糖基转移酶包含第一个哺乳动物糖基转移酶和所述第二个糖基转移酶包含第二个哺乳动物糖基转移酶。在优选实施方案中,所述第一个哺乳动物糖基转移酶是非人类的糖基转移酶,所述第二个哺乳动物的糖基转移酶是人糖基转移酶。
无意将本发明限制在载体类型。在一个实施方案中,本发明提供包含编码上述杂合酶的核酸的表达载体。
也无意将本发明限制于宿主细胞的类型。各种原核的和真核的宿主细胞可以购买到,用于表达蛋白。在一个实施方案中,本发明提供含有包含编码上述杂合酶的核酸的载体的宿主细胞(含有或不含有其他载体或其他编码其他杂合酶或糖基转移酶的核酸)。在一个优选实施方案中,宿主细胞是植物细胞。在特别优选的实施方案中,本发明提供一种包含这种宿主细胞的植物。
无意将本发明限制在使宿主细胞表达本发明的杂合酶的方法。在一个实施方案中,本发明提供一种方法:包含:a)提供:i)一种宿主细胞(如植物细胞,或者是培养的或是植物组织的部分或甚至是完整生长植物的部分),和ii)一种包含编码杂合酶的核酸的表达载体,所述杂合酶包含至少植物糖基转移酶的CTS区的一部分(如跨膜结构域)和至少哺乳动物糖基转移酶的催化区的一部分;和b)在一定条件下,将所述表达载体导入所述植物细胞中,使得所述杂合酶被表达。此外,无意将本发明限定于特定的转移酶。在一个实施方案中,用于上述方法中的植物糖基转移酶是木糖基转移酶。在另一个实施方案中,植物糖基转移酶是N-乙酰葡糖胺基转移酶。在另一个实施方案中,植物糖基转移酶是海藻糖基转移酶。在一个优选实施方案中,被用于实施方法的哺乳动物糖基转移酶是人半乳糖基转移酶(如由SEQ ID NO:1编码的人β1,4-半乳糖基转移酶,其中编码跨膜结构域的核苷酸被删除和取代)(或简而言之,其中SEQ ID NO:1中编码催化结构域或其部分的核苷酸被取出并连接到编码植物糖基转移酶的CTS区或其部分的核苷酸上)。
无意将本发明限制在用上述杂合酶控制异源蛋白的糖基化的特定方案中。在一个实施方案中,本发明提供一种方法,包含:a)提供:i)一种宿主细胞(如植物细胞),ii)包含编码杂合酶的核酸的第一种表达载体,所述杂合酶包含至少第一个(如植物)糖基转移酶的CTS区的一部分(如至少跨膜结构域)和至少第二个(如哺乳动物)糖基转移酶的催化区的一部分;和iii)包含编码异源糖蛋白(或其部分)的核酸的第二个表达载体;和b)在一定条件下,将所述第一个和第二个表达载体导入所述植物细胞中,使得所述杂合酶和所述异源蛋白被表达。可选择地,采用具有编码杂合酶(或多种杂合酶)和异源糖蛋白的核酸的单一载体。无论采用何种方法,在一个实施方案中,本发明包括分离异源蛋白以及被分离的蛋白本身作为一种组合物的额外步骤(c)。
另一方面,本发明还包括将不同载体导入不同植物细胞(无论是培养中的细胞、植物组织的部分、或甚至是完整生长植物的部分)。在一个实施方案中,本发明提供一种方法,包括:a)提供:i)包含第一种表达载体的第一种植物,所述第一个载体包含编码杂合酶(或编码两种或两种以上杂合酶)的核酸,所述杂合酶包含至少植物糖基转移酶的CTS区的一部分(如约N-末端的前40-60个氨基酸)和至少哺乳动物糖基转移酶的催化区的一部分,和ii)包含第二个表达载体的第二种植物,所述第二个载体包含编码异源蛋白(或其部分)的核酸;和杂交所述第一种植物和第二种植物来制备表达所述杂合酶和所述异源蛋白的子代。当然,这种子代可以被分离、生长和分析是否存在各种(或两种)蛋白。事实上,异源蛋白(典型地首先被纯化,基本上不含有植物细胞物质)可被治疗性地(如施用给人或动物,无论通过口服、静脉内、经皮肤或者其他施用路径)用于治疗或预防疾病。
无意将本发明限制在特定的异源蛋白。在一个实施方案中,提供任何对宿主细胞(或生物体)来说不是内源的肽或蛋白。在一个实施方案中,异源蛋白是抗体或抗体片段。在特别优选实施方案中,抗体是在植物中高产量地表达的人抗体或“人源化的”抗体。“人源化的”抗体通常从非人抗体(如啮齿类抗体)中制备,将非人类的抗体的超变区(也称作CDRs)取出,并将它们“移植”到人的构架中。整个操作可以是人工的(假设序列是已知的),可以从共同的人的构架的数据库中选择构架。多数情况下,除非架构序列被修饰或CDRs被修饰,否则制备过程中会损失亲合性。实际上,当CDRs被系统地突变(例如,通过随机化操作)和试验时,可以反映亲合性升高。
本发明上下文中的异源蛋白是特别有用的,在一个实施方案中,本发明的杂合酶可用于改变内源性蛋白的糖基化,即通常由宿主细胞或生物体表达的蛋白。
本发明特别包括植物本身。在一个实施方案中,本发明提供包含第一个和第二个表达载体的植物,所述第一个载体包含编码杂合酶的核酸,所述杂合酶包含至少植物糖基转移酶的CTS区的一部分(如胞质尾区以及至少跨膜结构域的一部分)和至少哺乳动物糖基转移酶的催化区的一部分,所述第二个表达载体包含编码异源蛋白(或其部分)的核酸。在一个优选实施方案中,通过与本发明的杂合酶(或多种杂合酶)一起表达,异源蛋白与在缺乏杂合酶(或多种杂合酶)的植物中异源蛋白的表达相比,表现为α1,3-海藻糖基化下降(10%-99%)(甚至无海藻糖基化)。在一个优选实施方案中,通过与本发明的杂合酶(或多种杂合酶)一起表达,异源蛋白与在缺乏杂合酶(或多种杂合酶)的植物中异源蛋白的表达相比,表现为木糖基化下降(10%-99%)(甚至无木糖基化)。在一个优选实施方案中,通过与本发明的杂合酶(或多种杂合酶)一起表达,异源蛋白与在缺乏杂合酶(或多种杂合酶)的植物中异源蛋白的表达相比,表现为海藻糖和木糖都下降。
无意将本发明限制在实现降低海藻糖和/或木糖的特定理论中。关于植物中的亚高尔基分类机制知道得极少。由于哺乳动物特异的β(1,4)-半乳糖基转移酶(GaIT)产生通常未见于植物中的聚糖结构,其已经被用作最佳第一标记来研究这种表型(见下文实施例)。表达半乳糖基转移酶的植物的聚糖结构已经与来自表达嵌合半乳糖基转移酶的植物的聚糖结构比较,其CTS结构域换成了植物木糖基转移酶的CTS结构域(或其部分)。观察到的聚糖结构的变化表明半乳糖基转移酶在哺乳动物中局限在植物高尔基的亚区室。不将本发明限制于任何特定机制,植物和哺乳动物的分类机制在某种程度上显然是保守的,植物不识别的糖基转移酶被运载到高尔基中的特定类似位置上。该位置在内源性木糖基、海藻糖基和GlcNAcTII(GnTII)转移酶的位置之后。
这些表达再定位的GalT变体的植物中的N-聚糖含有极少的木糖和海藻糖,这种发现也是具有生物技术相关性的。对于用于在哺乳动物如人中的治疗用途的糖蛋白,本发明的一些实施方案中的方法提供用于在植物中控制糖蛋白的N联糖基化的方法和组合物,使得可以得到一种糖蛋白,其基本上不含有木糖和海藻糖,而含有至少一个双触角N-聚糖(但不限于双触角,还包括三触角等)和在N-聚糖的至少一个臂上的(至少一个)半乳糖残基。因此,无意将本发明限制在双触角N-聚糖,而是包括平分的双触角N-聚糖、三触角N-聚糖等。此外,本发明不限于复合型的N-聚糖,还包括杂合型的N-聚糖以及其他类型的N-聚糖。本发明包括这种生成的糖蛋白。此外,本发明的方法和组合物可以被应用于植物和非植物系统,其中除了木糖、海藻糖之外,LewisA/B/X类型的N-聚糖修饰物(β1-3-GalT、α1-4-FucT等)或其他糖类干扰期望的糖型的沉积。
在一个实施方案中,本发明提供通过调节参与高尔基体中聚糖生物合成的酶的定位来控制植物的N联糖基化。特别地,本发明的实施方案是在植物宿主体系中制备糖蛋白的方法,包括:(a)阻止(或抑制)在所述糖蛋白的聚糖核心中增加木糖和海藻糖和(b)在所述臂上添加一个,优选两个半乳糖残基。该糖蛋白具有双触角聚糖,在至少一个臂上含有至少一个半乳糖残基,不含有(或降低)木糖和海藻糖。
通过将编码杂合酶的核酸导入到所述植物宿主系统中,可以减少或甚至阻止向所述异源糖蛋白中添加木糖和海藻糖,该杂合酶包含一种蛋白特别是一种酶如植物木糖基转移酶的CTS区(或其部分)和通常不存在于植物的半乳糖基转移酶或者其中跨膜部分被去除而插入内质网滞留信号的被修饰的半乳糖基转移酶的催化区(或其部分),其中所述蛋白质或酶早期在所述植物宿主系统中的植物细胞的高尔基体中起作用,而不是作为所述半乳糖基转移酶。优选半乳糖基转移酶是哺乳动物半乳糖基转移酶,特别是人半乳糖基转移酶。在最特别的实施方案中,所述半乳糖基转移酶是人β1,4-半乳糖基转移酶(GalT)。在一个优选的实施方案中,所述木糖基转移酶是β1,2-木糖基转移酶。用于替换哺乳动物糖基转移酶(如半乳糖基转移酶)的CTS区或CTS片段的是早期在高尔基体中起作用而不是作为半乳糖基转移酶的酶之一,包括但不限于导致含有不期望的木糖和海藻糖残基的聚糖的显著降低的XylT、FucT、GnTI、GnTII、GnTIII、GnTIV、GnTV、GnTVI、ManI、ManII和ManIII(见附图2)。此外,半乳糖基化增加而聚糖多样性降低。虽然不限于任何特定的机制,既不含有木糖也不含有海藻糖的半乳糖基化的聚糖增加被认为主要是由于GalGNMan5、GNMan5或GaIGNMan4沉积。此外,半乳糖基化仅在一个聚糖臂上发生。显然,高尔基中早期的半乳糖基化抑制由甘露糖酶II(ManII)将所述糖型修饰为的GaIGNMan3。还抑制由GlcNAcTII(GnTII)增加第二个GlcNAc。
因此,在一个实施方案中,包括获得期望的双臂被半乳糖基化而基本上不含有木糖和海藻糖的糖蛋白的其他步骤。因此,在一个实施方案中,如上指出的本发明的方法还包含增加半乳糖残基到所述糖蛋白的臂上(见附图3)。在本发明的一个实施方案中,半乳糖残基被加到两个臂上,采取往所述植物宿主系统中导入(a)编码包含GnTI的CTS区(或片段,如包括跨膜结构域的片段)和GnTII的活性结构域(或其部分)的第一个杂合酶的核酸序列;(b)编码包含GnTI的CTS区(或片段,如包括跨膜结构域的片段)和ManII的活性结构域的第二个杂合酶的核酸序列;和(c)编码包含XylT的CTS区(或片段,如包括跨膜结构域的片段)和人半乳糖基转移酶(TmXyl-GaIT)的活性结构域(或其部分)的第三个杂合酶的核酸序列。在本发明的另一个实施方案中,半乳糖残基被增加到双臂上,通过往所述植物宿主系统中导入(a)编码包含ManI的CTS区(或片段,如包括跨膜结构域的片段)和GnTI的活性结构域(或其部分)的第一个杂合酶的核酸序列;b)编码包含ManI的CTS区(或片段,如包括跨膜结构域的片段)和GnTII的活性结构域(或其部分)的第二个杂合酶的核酸序列;(c)编码包含ManI的CTS区(或片段,如包括跨膜结构域的片段)和ManII的活性结构域(或其部分)的第三个杂合酶的核酸序列和(d)编码包含XylT的CTS区(或片段,如包括跨膜结构域的片段)和人半乳糖基转移酶(TmXyl-GalT)的活性结构域(或其部分)的第四个杂合酶的核酸序列。
无意将本发明限制于特定的杂合酶的组合或者应用在单个细胞、植物组织或植物中的这种杂合酶的数量中。在一个优选实施方案中,本发明包括表达TmXyl-GaIT和TmGnTI-GnTII及TmGnTI-ManII的宿主细胞。在本发明的一个实施方案中,半乳糖残基被增加到所述臂,通过往所述植物宿主系统中导入(a)编码包含一种蛋白特别是一种酶包括但不限于N-乙酰葡糖胺基转移酶I(GnTI)的CTS区(或其片段)和甘露糖苷酶II(ManII)的催化区(或其部分)的第一个杂合酶的核酸序列,其中所述酶早期在所述植物宿主系统中的植物细胞的高尔基体中起作用,而不是作为甘露糖苷酶II或者其中跨膜部分被删除而插入内质网滞留信号的被修饰的甘露糖苷酶II和(b)编码包含包括但不限于N-乙酰葡糖胺基转移酶I(GnTI)的CTS区(或片段,如包括跨膜结构域的片段)和N-乙酰葡糖胺基转移酶II(GnTII)的催化区(或其部分)的第二个杂合酶的核酸序列,其中所述酶早期在所述植物宿主系统中的植物细胞的高尔基体中起作用,而不是作为N-乙酰葡糖胺基转移酶II(GnTII)或者其中跨膜部分被删除而插入内质网滞留信号的被修饰的N-乙酰葡糖胺基转移酶II(GnTII)。编码N-乙酰葡糖胺基转移酶或甘露糖苷酶或所述跨膜片段的序列来自植物或来自真核的非植物生物体(如哺乳动物)。
还有在另一个优选实施方案中,本发明包括表达TmXyl-GaIT和TmGnTI-GnTI及TmGnTI-ManII和TmGnTI-GnTII的宿主细胞。在本发明的另一个实施方案中,半乳糖残基被添加到所述臂,通过往所述植物宿主系统中导入(a)编码包含一种蛋白特别是一种酶包括但不限于甘露糖苷酶I(ManI)的CTS区(或其片段,如包括跨膜结构域的片段)和N-乙酰葡糖胺基转移酶I(GnTI)的催化区(或其部分)的第一个杂合酶的核酸序列,其中所述酶早期在所述植物宿主系统中的植物细胞的高尔基体中起作用,而不是作为N-乙酰葡糖胺基转移酶I(GnTI)或者其中跨膜部分被删除而插入内质网滞留信号的被修饰的N-乙酰葡糖胺基转移酶I(GnTI)和(b)编码包含包括一种酶但不限于甘露糖苷酶I(ManI)的CTS区(或片段,如包括跨膜结构域的片段)和甘露糖苷酶II(ManII)的催化区(或其部分)的第二个杂合酶的核酸序列,其中所述酶早期在所述植物宿主系统中的植物细胞的高尔基体中起作用,而不是作为甘露糖苷酶II(ManII)或者其中跨膜部分被删除而插入内质网滞留信号的被修饰的甘露糖苷酶II(ManII)和(c)编码包含包括一种酶但不限于甘露糖苷酶I(ManI)的CTS区(或片段,如包括跨膜结构域的片段)和N-乙酰葡糖胺基转移酶II(GnTII)的催化区(或其部分)的第三个杂合酶的核酸序列,其中所述酶早期在所述植物宿主系统中的植物细胞的高尔基体中起作用,而不是作为N-乙酰葡糖胺基转移酶II(GnTII)或者其中跨膜部分被删除而插入内质网滞留信号的被修饰的N-乙酰葡糖胺基转移酶II(GnTII)。编码N-乙酰葡糖胺基转移酶或甘露糖苷酶或所述跨膜片段的序列来自植物或来自真核的非植物生物体(如哺乳动物)。
还有在另一个优选实施方案中,本发明包括表达TmXyl-GaIT及ManIII的宿主细胞。在本发明的另一个实施方案中,半乳糖残基被增加到所述臂上,通过往所述植物宿主体系中导入(a)编码甘露糖苷酶III(ManIII的核酸序列,野生型基因序列但不限于:以及具有内质网滞留信号的ManIII;具有早期(顺式)高尔基体糖基转移酶(GnTI、ManI、GnTIII)的跨膜片段的ManIII。这些编码甘露糖苷酶III的序列来源于昆虫,优选来自草地夜蛾(Spodoptera fiugiperda)或黑腹果蝇(Drosophilamelanogaster)(不限于此)、人或来自其他生物体。
在还有另一个优选实施方案中,本发明包括表达TmXyl-GalT和ManIII及TmGnTI-GnTII的宿主细胞。在还有另一个优选实施方案中,本发明包括表达TmXyl-GalT和ManIII及TmManI-GnTI及TmManI-GnTII的宿主细胞。
在一个实施方案中,本发明的方法可选择地包含,往所述植物宿主体系中导入哺乳动物N-乙酰葡糖胺基转移酶(GnTIII),优选为人GnTIII或包含哺乳动物GnTIII的催化部分,和一种蛋白质的跨膜部分的杂合蛋白,所述蛋白质位于真核细胞的ER或高尔基体的早期区室中。例如,在一个实施方案中,包括杂合酶TmXyl-GnTIII(以及编码这种杂合酶的核酸,含有这种核酸的载体,含有这种载体的宿主细胞和含有这种宿主细胞的植物或植物部分)。在另一个实施方案中,包括杂合酶TmFuc-GnTIII(以及编码这种杂合酶的核酸,含有这种核酸的载体,含有这种载体的宿主细胞和含有这种宿主细胞的植物或植物部分)。本发明特别地包括表达这种杂合酶(含有或不含有其他的杂合酶或其他糖基转移酶)的宿主细胞。
本发明还提供所述杂合酶或被修饰的酶,编码所述杂合酶的核酸序列,包含所制核酸序列的载体和获得所述杂合酶的方法。此外,本发明提供包含异源糖蛋白的植物宿主系统,该糖蛋白优选具有复合型双触角聚糖并至少在一个臂上含有至少一个半乳糖残基,不含木糖和海藻糖。“异源糖蛋白”是来源于一个非植物宿主系统的种类的糖蛋白。糖蛋白包括但不限于抗体、激素、生长因子和生长因子受体和抗原。
实际上,本发明特别可用于控制异源糖蛋白的糖基化,如抗体或抗体片段(单链抗体,Fab片段、Fab2片段、Fv片段等)。为了控制抗体的糖基化,编码本发明的杂合酶的基因构建体(如TmXyl-GaIT基因构建体)被导入到表达一种抗体(如单克隆抗体)或抗体片段的转基因植物中。另一方面,编码抗体(或抗体片段)的基因通过转化表达TmXyl-GaIT基因构建体来被导入。在还有一个实施方案中,含有TmXyl-GaIT表达盒的双元载体与含有在单一T-DNA上包含单克隆抗体的轻链和重链序列的表达盒的植物双元载体或者与含有在各个T-DNA上分别包含单克隆抗体的轻链和重链序列的表达盒的植物双元载体被共转化到植物中。在一个实施方案中,本发明特别地包括将表达抗体的植物与本发明的表达杂合型糖基转移酶的植物杂交。
“宿主系统”包括但不限于含有具有N-聚糖的糖蛋白的任何生物体。
“植物宿主系统”包括但不限于植物或其部分,其包括但不限于植物细胞、植物器官/或植物组织。植物可以是单子叶植物(monocot),是一种开花植物,其种胚具有一片子叶(cotyledon)或子叶(seed leaf),包括但不限于百合、禾本科植物、玉米(Zea mays)、水稻、谷物包括燕麦、小麦和大麦,兰花、鹫尾、洋葱和棕榈。可选择地,植物可以是双子叶植物(dicot),其包括但不限于烟草(Nicotiana)、番茄、马铃薯、豆类(如紫花苜蓿和大豆)、玫瑰、雏菊(daises)、仙人掌、紫罗兰和浮萍。植物也可以是一种苔藓,包括但不限于Physcomitrellapaterls。
本发明还提供获得所述植物系统的方法。该方法包含将表达异源糖蛋白的植物与包含杂合酶(a)、(b)和(c)的植物杂交,杂合酶(a)包含通常不存在于植物中的半乳糖基转移酶的催化区(或其部分)和一种蛋白质的CTS区(或其片段,如包括跨膜结构域的片段),其中所述蛋白质早期在所述植物宿主系统的植物细胞的高尔基体中起作用而不是作为半乳糖基转移酶或其中其跨膜部分已经被删除而插入内质网滞留信号的被修饰的半乳糖基转移酶;杂合酶(b)包含一种蛋白质特别是一种酶包括但不限于N-乙酰葡糖胺基转移酶I(GnTI)的CTS区(或其片段,如包括跨膜结构域的片段)和甘露糖苷酶II(ManII)的催化区(或其部分),其中所述酶早期在所述植物宿主系统的植物细胞的高尔基体中起作用而不是作为甘露糖苷酶II或其中其跨膜部分已经被删除而插入内质网滞留信号的被修饰的甘露糖苷酶II和杂合酶(c)至少包含一种酶包括但不限于N-乙酰葡糖胺基转移酶I(GnTI)的糖基转移酶的跨膜区(如N末端的前40-60个氨基酸)和N-乙酰葡糖胺基转移酶II的催化区,其中所述酶早期在所述植物宿主系统的植物细胞的高尔基体中起作用而不是作为N-乙酰葡糖胺基转移酶II(GnTII)或其中其跨膜部分已经被删除而插入内质网滞留信号的被修饰的N-乙酰葡糖胺基转移酶II(GnTII),从所述杂交中收获子代并筛选期望的子代植物,其表达所述异源糖蛋白。
本发明还提供构成植物宿主系统的所述植物或其部分。所述植物宿主系统还包含哺乳动物GnTIII酶或者包含哺乳动物GnTIII的催化部分和一种蛋白质的跨膜部分的杂合蛋白,所述蛋白质位于真核细胞的ER或高尔基体的早期区室中。
此外,本发明还提供植物宿主体系来制备期望的糖蛋白或其功能性片段的用途。本发明还提供获得期望糖蛋白或其功能性片段的方法,包含培养按照本发明的细胞直到所述植物已经达到收获阶段,例如生长足以有利收获的生物量,然后采用本领域已知的已有方法收获所述植物,用本领域已知的已有的技术分级所述植物材料,至少部分地从所述被分级的植物材料中分离所述糖蛋白。
此外,获得包含所述异源糖蛋白的所述植物宿主细胞体系还可以通过往植物宿主细胞体系或其部分中导入(a)编码包含通常不存在于植物中的半乳糖基转移酶的催化区和至少一种蛋白质的跨膜区(或CTS的更多部分)的杂合酶的核酸序列,所述蛋白质早期在所述植物宿主系统的植物细胞的高尔基体中起作用而不是作为半乳糖基转移酶或其中跨膜部分已经被删除而插入内质网滞留信号的被修饰的半乳糖基转移酶;(b)编码包含至少一种蛋白质特别是一种酶包括但不限于N-乙酰葡糖胺基转移酶I(GnTI)的跨膜区(如果需要可以是CTS区的更多部分)和甘露糖苷酶II(ManII)的催化区的第一个杂合酶的核酸序列,其中所述酶早期在所述植物宿主系统的植物细胞的高尔基体中起作用而不是作为甘露糖苷酶II或其中跨膜部分已经被删除而插入内质网滞留信号的被修饰的甘露糖苷酶II和(c)编码包含至少一种蛋白质特别是一种酶包括但不限于N-乙酰葡糖胺基转移酶I(GnTI)的跨膜区(如果需要可以是CTS区的大部分)和N-乙酰葡糖胺基转移酶II(GnTII)的催化区的第二个杂合酶的核酸序列,其中所述酶早期在所述植物宿主系统的植物细胞的高尔基体中起作用而不是作为N-乙酰葡糖胺基转移酶II(GnTII)或其中跨膜部分已经被删除而插入内质网滞留信号的被修饰的N-乙酰葡糖胺基转移酶II(GnTII),和分离表达所述异源糖蛋白(或其部分)的植物或其部分。在一个实施方案中,包含所用核酸序列的载体被导入所述植物宿主系统中。在另一个实施方案中,每种核酸序列被插入各个载体中,并且这些载体被导入所述植物宿主系统中。在另一个实施方案中,两个或多个核酸序列的组合被插入到各个载体中,然后这些载体通过再转化或共转化或杂交被结合到所述植物宿主系统中。
本发明还提供使用本发明的这种植物来源的糖蛋白或其功能性片段来制备组合物,特别是药物组合物的用途,例如用抗体、激素、疫苗抗原、酶等处理患者。还提供这种包含糖蛋白或其功能性片段的药物组合物。
最后,可以预期上述的方法可以用于降低表达一种或多种本发明的杂合酶的植物中的聚糖的总体差异性(与野生型植物或仅用哺乳动物GaIT简单转化的植物比较)。
附图说明
附图1比较植物和哺乳动物中的糖蛋白的糖基化路径。
附图2显示用木糖基转移酶置换半乳糖基转移酶的CTS片段的效果。
附图3表示再定位甘露糖苷酶II和GlcNAcTII的其他影响。
附图4的上面组表示含有编码聚糖被修饰的酶的基因的T-DNA构建体,其有效生成不含有免疫原性的木糖和海藻糖的半乳糖基化的聚糖,下边组表示具有抗体轻链和重链基因的T-DNA构建体。
附图5表示人半乳糖基转移酶(人B1,4-半乳糖基转移酶-GaIT)的核酸序列(SEQ ID NO:1)。
附图6表示附图5的核酸序列以及相应的氨基酸序列(SEQ ID NO:2)。
附图7表示来自人半乳糖基转移酶的野生型氨基酸序列(SEQ ID NO:2)的示意性的突变序列(SEQ ID NO:59),其中丝氨酸从胞质尾区被去除,而重复基序G-I-Y。当然这种变化仅仅是阐明本发明的保护范围内的多种可能的变化。例如,在一个实施方案中,本发明包括突变序列,其中仅进行(一次或多次)删除(如胞质尾区或茎干结构域中的删除)—没有插入或重复。类似地,在一个实施方案中,本发明包括突变序列,其中仅进行(一次或多次)插入或置换(如在跨膜结构域)—没有删除。
附图8表示编码包含人半乳糖基转移酶(人B1,4-半乳糖基转移酶-GaIT)的杂合酶的核酸序列(SEQ ID NO:3)。大写字母是拟南芥的β1,2-木糖基转移酶的mRNA的核苷酸(数据库登录:EMBL:ATH277603,所用的TmXyl片段包括这个数据库的序列的核苷酸135-297)。
附图9表示附图8的核酸序列以及相应的氨基酸序列(SEQ ID NO:4)。
附图10表示由附图8中的核酸编码的杂合酶的氨基酸序列(SEQ ID NO:4)。
附图11表示人糖基转移酶GnTIII的核酸序列(SEQ ID NO:5)(以及编码myc-标记的其他序列)(原始登录号(primary accession number)Q09327 GNT3 HUMAN)。
附图12表示附图11的核酸序列以及相应的氨基酸序列(SEQ ID NO:6)。
附图13表示人GnTIII的氨基酸序列(SEQ ID NO:6)(以及myc抗原决定簇标记的其他氨基酸序列SEQ ID NO:7)。
附图14表示编码本发明的杂合酶的一个实施方案的核酸序列(SEQ ID NO:9),所述杂合酶包含植物木糖基转移酶(TmXyl-)的跨膜结构域和人GnTIII(TmXyl-GnTIII)(以及编码myc-标记的其他序列)的催化结构域(以及其他区域)。
附图15表示附图14的核酸序列以及相应的氨基酸序列(SEQ ID NO:10)。
附图16表示由附图14的核酸序列编码的杂合酶的氨基酸序列(SEQ ID NO:10)(以及myc抗原决定簇标记SEQ ID NO:7的其他序列)。
附图17表示编码杂合酶TmXyl-GaIT和TmGnTI-GnTII及TmGnTI-ManII的表达盒的完整核酸序列(SEQ ID NO:27)。
附图18表示编码杂合酶TmGnTI-ManII的表达盒的完整核酸序列(SEQ IDNO:28)(具有SEQ ID NO:39所示RbcSl启动子序列)。
附图19表示编码杂合酶TmGnTI-ManII的核酸序列(SEQ ID NO:29)。
附图20表示编码杂合酶TmGnTI-GnTII的核酸序列(SEQ ID NO:30)。
附图21表示编码杂合酶TmGnTI-GnTII的核酸序列(SEQ ID NO:31),其中跨膜片段(被消化的TmGntI)具有SEQ ID NO:32所示核酸序列。
附图22A表示编码跨膜结构域片段(TmGnTI)的一个实施方案的核酸序列(SEQ ID NO:32)。附图22B表示编码跨膜结构域片段(TmManI)的另一个实施方案的核酸序列(SEQ ID NO:33)。
附图23表示本发明的三个表达盒的实施方案的完整核酸序列(SEQ IDNO:34)。
附图24表示杂合基因表达盒(TmManI-GnTI)的核酸序列(SEQ ID NO:35)。
附图25表示组蛋白3.1启动子的核酸序列(SEQ ID NO:36)。
附图26表示杂合基因融合(TmManI-TmGnTI)的核酸序列(SEQ ID NO:37)。
附图27表示杂合基因融合TmManI-ManII的核酸序列(SEQ ID NO:38)(具有SEQ ID NO:39所示RbcSl启动子序列)。
附图28表示RbcSl启动子的核酸序列(SEQ ID NO:39)。
附图29表示杂合基因TmManI-ManII的核酸序列(SEQ ID NO:40),其中显示编码跨膜区片段的核酸序列(SEQ ID NO:33)。
附图30表示杂合基因TmManI-GnTII的核酸序列(SEQ ID NO:41)。
附图31表示Lhca启动子的核酸序列(SEQ ID NO:42)。
附图32表示杂合基因TmManI-GnTII的核酸序列(SEQ ID NO:43),其中显示编码跨膜片段的核酸序列(SEQ ID NO:33)。
附图33表示所用终止子序列(见下文)的核酸序列(SEQ ID NO:44)。
附图34是与对照植物比较,检测本发明的植物总蛋白糖基化的蛋白质印迹。
附图35用RCA对杂交植物的子代F1进行血凝素印迹,所述子代按照本发明的一个实施方案制备。
附图36是蛋白质印迹。组A是用抗IgG抗体分析,组B用抗HRP的抗体分析,组C用特异性抗Xyl抗体片段分析。组D是用特异性抗海藻糖抗体片段分析。组E用血凝素RCA分析。
附图37表示杂合基因的核酸序列(SEQ ID NO:49,其中昆虫甘露糖苷酶III的氨基末端CTS区用小鼠信号肽取代,并且添加羧基末端的内质网滞留信号(KDEL)。
附图38表示附图37的核酸序列的相应氨基酸序列(SEQ ID NO:50)。
附图39表示杂合基因的核酸序列(SEQ ID NO:51),其中人β1,4-半乳糖基转移酶(GalT)基因的氨基末端的CTS区用小鼠信号肽取代,并且添加羧基末端的内质网滞留信号(KDEL)。
附图40表示附图39的核酸序列的相应氨基酸序列(SEQ ID NO:52)。
附图41表示杂合基因的核酸序列(SEQ ID NO:53),其中拟南芥GnTI基因的氨基末端的CTS区用小鼠信号肽取代,并且添加羧基末端的内质网滞留信号(KDEL)。
附图42表示附图41的核酸序列的相应氨基酸序列(SEQ ID NO:54)。
附图43表示杂合基因的核酸序列(SEQ ID NO:55),其中拟南芥GnTII基因的氨基末端的CTS区用小鼠信号肽取代,并且添加羧基末端的内质网滞留信号(KDEL)。
附图44表示附图43的核酸序列的相应氨基酸序列(SEQ ID NO:56)。
附图45表示杂合酶的核酸序列(SEQ ID NO:57),其中人β1,4-半乳糖基转移酶(GalT)基因的氨基末端的CTS区用人的GnTI基因的CTS区取代。
附图46表示附图45的核酸序列的相应氨基酸序列(SEQ ID NO:58)。
附图47是酶如何定位于高尔基体的示意图。
附图48是转移酶的区域“交换”如何引起再定位的非限制性的假定示意图。
发明详述
杂合酶
采用本领域已知的各种重组DNA操作,如多聚酶链式反应或筛选表达文库来删除具有相同结构特征的克隆DNA片段,可以获得编码各种糖基化酶如甘露糖苷酶、GicNAcTs、半乳糖基转移酶的核酸序列。参见,如Innis等,1990,PCR:方法和应用指南(A Guide to Methods and Application),学院出版社,纽约。可以采用其他核酸扩增操作如连接酶链式反应(LCR),连接激活转录(LAT)和核酸序列扩增(NASBA)或远程PCR。
一旦生成DNA片段,通过各种方式实现确定具有期望基因的特定DNA片段。例如,可以得到一定含量的基因的部分或其特定RNA或其片段,并被纯化和标记,可以通过核酸杂交到标记探针来筛选生成的DNA片段[Benton和Davis,科学196:180(1977);Grunstein和Hogness,美国国家科学院汇编72:3961(1975)]。此外,可以通过基于表达产物的物理、化学或免疫特性的分析来检测基因的存在。例如,选择杂交筛选恰当mRNA的cDNA克隆或DNA克隆,其制备一种蛋白质,具有与目标蛋白已知的相似或相同的电泳迁移率、等电聚焦活性、蛋白水解消化图谱或抗原特性。
可如下获得编码包含第一个酶的跨膜部分和第二个酶的催化部分的杂合酶的核酸序列。编码跨膜部分的序列从第二个酶中去除,使得核酸序列包含编码第二个酶的C末端部分的序列,包括催化部位。编码第一个酶的跨膜部分的序列通过PCR被分离或得到,连接到编码包含第二个酶的C末端部分的序列的序列上。
被修饰的酶
去除编码跨膜片段的序列,用甲硫氨酸密码子(起始翻译)取代,和在半乳糖基转移酶的最后一个密码子和终止密码子之间插入编码ER滞留信号的核酸序列,如编码KDEL的序列(氨基酸残基序列:赖氨酸-天冬氨酸-亮氨酸)[Rothman,细胞50:521(1987)],获得编码蛋白质特别是酶的核酸序列,如滞留在ER中的半乳糖基转移酶、甘露糖苷酶和N-乙酰葡胺基转移酶。
使用其结构域和部分
如上指出,词语“至少一部分”或“其片段”是指蛋白或肽保持其性质和天然功能所必需的最小氨基酸序列。例如,酶的功能是指其酶促或催化作用,在高尔基体中锚定一种蛋白质的能力,或作为一种信号肽。因此,词语“至少跨膜结构域的一部分”或“跨膜结构域的一个片段”分别指较大跨膜结构域的最小氨基酸片段,其仍然保留至少一部分天然的跨膜功能(例如,功能虽然降低了,但是明显的)。作为另一个例子,词语“至少催化区的一部分”或“催化区的一个片段”分别指较大催化结构域的最小氨基酸片段,其仍然至少保留部分的天然催化功能(例如,既便有所降低,但是存在)。如在此所讨论,本领域的技术人员将知晓一种蛋白质或肽保持至少一些天然蛋白质或肽功能的最小氨基酸片段。
根据所转移的糖类型,糖基转移酶典型地分成两个家族(半乳糖基转移酶,唾液酸转移酶等)。根据氨基酸相似性和立体化学的反应过程,糖基转移酶可以被分为至少27个和可能多达47个家族[Campbell等,生物化学杂志(Biochem.J.)326:929-939(1997),生物化学杂志(Biochem.J.)329:719(1998)]。至今被克隆的大多数糖基转移酶是II型跨膜蛋白质(即在胞质中具有NH2末端和在高尔基体的内腔具有COOH末端的单一的跨膜结构域)。无论将它们如何分类,所有糖基转移酶具有某些共同的结构特征:短的NH2-末端胞质尾区,16-20个氨基酸信号锚或跨膜结构域,和扩展的茎干区,后面接着大的COOH-末端催化结构域。胞质尾似乎参与一些类型的糖基转移酶特异地定位于高尔基体[Milland等,生物学化学杂志(J.Biol.Chem.)277:10374-10378]。信号锚定结构域可以作为不可裂解的信号肽和作为跨膜区,指导糖基转移酶的催化结构域进入高尔基体的内腔。
在本发明的一个实施方案中,由Nicotiana benthamiana(烟草)乙酰葡糖胺基转移酶I的N-末端的77个氨基酸定义的部分被包含,用于杂合酶,由于该部分被发现足以在植物高尔基体中指向和保持报道蛋白[Essl等,FEBSLett453:169-173(1999)]。在烟草中,由假定的胞质的、跨膜的和茎干结构域构成的各种融合蛋白的亚细胞定位表明,仅胞质—跨膜结构域就足以保持β1,2-木糖基转移酶滞留在高尔基体中,而不需要任何腔序列的帮助[Dirnberger等,植物分子生物学(Plant Mol.Biol.)50:273-281(2002)]。因此,如上指出,本发明的一些实施方案采用仅包括胞质—跨膜结构域(或其部分)的CTS区部分,而未使用CTS区的茎干区。但是,一些类型糖基转移酶滞留高尔基体时主要依赖于其跨膜结构域,其他类型需要其跨膜区和该区的一端或两端的侧翼序列[Colley,糖生物学(Glycobiology)7:1-13(1997)]。例如,包含氨基酸1-32的N末端肽似乎是足以将β1,6N-乙酰葡糖胺基转移酶定位在高尔基体中的最小靶向信号。该肽组成这种酶的胞质结构域和跨膜结构域[Zerfaoui等,糖生物学(Glycobiology)12:15-24]。
大量特定糖基转移酶结构域的氨基酸序列的信息是可以获得的。例如,由GenBank登录号AAM17731提供的哺乳动物半乳糖基转移酶的氨基酸序列具有分别包括残基19-147和残基148-397的“茎”结构域和“催化”结构域[美国专利6,416,988,在此引入作为参考]和在一些实施方案中,本发明特别地包括将这些部分用于杂合酶。GenBank登录号AAC91156提供的大鼠肝脏唾液酸转移酶的氨基酸序列具有9个氨基酸的NH2末端胞质尾区、17个氨基酸的信号锚定结构域,和包括暴露的茎区的腔结构域,接着是41kDa的催化结构域[Hudgin等,加拿大生物化学杂志(Can.J.Biochem.)49:829-837(1971);美国专利5,032,519和5,776,772,在此引入作为参考]。已知的人和小鼠β1,3-半乳糖基转移酶具有催化结构域,其具有8个保守区[Kolbinger等,生物学化学杂志(J.Biol.Chem.)273:433-440(1998);Hennet等,生物学化学杂志(J.Biol.Chem.)273:58-65(1998);美国专利5,955,282,在此引入作为参考]。例如,由GenBank登录号NM020026提供的小鼠UDP-半乳糖:β-N-乙酰氨基葡萄糖β1,3-半乳糖基转移酶-I的氨基酸序列具有如下催化区:从残基78-83的区1;从残基93-102的区2;从残基116-119的区3;从残基147-158的区4;从172-183的区5;从残基203-206的区6;从残基236-246的区7;和从残基264-275的区8.[Hennet等,同上文]-所有这些区都被包含在本发明的一些实施方案中,作为上面讨论的杂合酶的有用部分。
先前在已知的糖基转移酶的cDNA克隆之间的比较表明,酶之间序列的同源性极低[Paulson等,生物化学杂志(J.Biol.Chem.)264:17615-618(1989)],最新进展使得可能推导出特异性不同的糖基转移酶中的保守结构域[Kapitonov等,糖生物学(Glycobiology)9:961-978(1999)]。例如,通过采用由所得到的完整基因组序列提供的序列数据,已经确定各种生物体的大量糖基转移酶的核酸和氨基酸序列,如现代人(人类)、Caehorhabditis elegans(土壤线虫)、拟南芥(thale cress,芥菜)和Oryza sativa(水稻)。
作为广泛研究的结果,已经推导出各种糖基转移酶家族的一致结合位点的共同氨基酸序列。例如,唾液酸转移酶具有唾液酸基序(sialyl motif),其似乎参与共同底物CMP-硅酸的识别[Paulson等,生物学化学杂志(J.Biol.Chem.),264:17615-17618(1989);Datta等,生物学化学杂志(J.Biol.Chem.),270:1497-1500(1995);Katsutoshi,糖科学糖技术趋势(Trends Glycosci.Glycotech.)8:195-215(1996)]。Galα1-3半乳糖基转移酶中的六肽RDKKND和GIcNAcβ1-4半乳糖基转移酶中的RDKKNE被认为是UDP-Gal的结合位点[(Joziasse等,生物学化学杂志(J.Biol.Chem.),260:4941-4951(1985),生物学化学杂志(J.Biol.Chem.),264:14290-14297(1989);Joziasse,糖生物学(Glycobiology),2:271-277(1992))。
由两个天门冬氨酸残基构成小的高保守性基序(DXD),通常被亲水区包围,已经在大量不同真核生物转移酶中被确定,包括α-1,3-甘露糖基转移酶,β-1,4-半乳糖基转移酶,α-1,3-半乳糖基转移酶,葡糖醛酸基转移酶,海藻糖基转移酶,糖原引物(glycogenins)等[Wiggins等,美国国家科学院汇编(Proc.Natl.Acad.Sci.U.S.A.)95:7945-7950(1998)]。突变试验表明这个基序是酶促活性所必需的[Busch等,生物学化学杂志(J.Biol.Chem.)273:19566-19572(1998);Wang等,生物学化学杂志(J.Biol.Chem.)277:18568-18573(2002)]。多重肽对比表明一些对应于假定催化区的基序在所有β3-半乳糖基转移酶家族的成员中是保守的,也就是II型跨膜结构域,保守性DxD基序,N-糖基化位点和五个保守性胱氨酸[Gromova等,分子致癌性(Mol.Carcinog.)32:61-72(2001)]。
通过BLAST检索和多重对比,发现E-X7-E基序在滞留糖基转移酶的四个家族的成员中是高度保守的。[Cid等,生物学化学杂志(J.Biol.Chem.)275:33614-33621(2000)]。O-连接乙酰葡糖胺基转移酶(GIcNAc)将一个P-N-乙酰氨基葡萄糖成分添加到特定丝氨酸或苏氨酸羟基上。BLAST分析、相同的二级结构预测和折叠识别研究表明,第二个Rossmann结构域中的保守基序对应UDP-GicNAc供体-结合位点[Wrabl等,分子生物学杂志(J.Mol.Biol.)314:365-374(2001)]。迄今确定的β1,3-糖基转移酶共有一些保守区和保守半胱氨酸残基,都位于假定的催化区。定点突变鼠β3GatT-I基因(登录号为AF029790)表明,保守性残基W101和W162参与UDP-半乳糖供体的结合,残基W315参与N-乙酰氨基葡萄糖β-p-硝基酚受体结合,包括E264的结构域似乎参与这两种底物的结合[Malissard等,欧洲生物化学杂志(Eur.J.Biochem.)269:233-239(2002)]。
在植物宿主系统中表达目标蛋白
按照本发明的一些实施方案,编码杂合或改进的酶或其他异源蛋白质如异源糖蛋白的核酸被插入到合适的表达载体中,即包含插入的编码序列的转录和翻译所需元件的载体,或者为RNA病毒载体的情况下,复制和翻译的必需元件,以及选择性标记。这些包括但不限于启动子区,信号序列,5’不翻译序列,起始密码子(取决于结构基因是否携带一个),和转录和翻译终止序列。获得这些载体的方法在本领域是已知的(参见WO 01/29242作为综述)。
适合于植物中的表达的启动子序列在现有技术中被描述,如WO 91/198696。包括非组成型启动子或组成型启动子,如胭脂碱合成酶和章鱼碱合成酶启动子、花椰菜花叶病毒(CaMV)19S、35S启动子和玄参花叶病毒(FMV)35启动子(见美国专利5,352,605和6,051,753,都在此引入作为参考)。所用的启动子可以是组织特异性启动子,如靶向胚乳、糊粉层、胚胎、果皮、茎、叶、块茎、根等。
信号序列使蛋白质被恰当地加工和转移。信号来源于植物或者是非植物信号序列。信号肽指引初生多肽到内质网,随后多肽在此进行翻译后的修饰。信号肽可由本领域技术人员常规地确定。信号肽通常具有三联结构,在N末端具有正电荷氨基酸,接着是疏水区,然后在低疏水性区内具有裂解位点。
转录末端通常在转录起始调控区的相反端。其可能与转录起始区相关,来自不同基因,被选择用来增强表达。一个例子是来自农杆菌Ti质粒的NOS终止子和水稻α-淀粉酶终止子。还可以添加聚腺苷酸尾。例子包括但不限于农杆菌章鱼碱合成酶信号[Gielen等,EMBO J.3:835-846(1984)]或相同种类的胭脂碱合成酶[Depicker等,分子应用遗传学(Mol.Appl.Genet.)l:561-573(1982)]。
可以包括增强子来提高和/或最大化异源蛋白质的转录。这些包括但不限于肽排出信号序列、密码子选择、内含子、聚腺苷酰化和转录终止位点(见WO01/29242)。
标记优选包括原核生物的选择性标记。这种标记包括抗生素抗性如氨卡青霉素、四环素、卡那霉素和奇霉素。特别的例子包括但不限于编码链霉素抗性的链霉素磷酸转移酶(spt)基因、编码卡那霉素或遗传抗性的新霉素磷酸转移酶(nptII)基因、编码潮霉素抗性的潮霉素磷酸转移酶(hpt)基因。
采用本领域已知的方法(参见WO 01/29242和WO 01/31045),将所构建的载体导入植物宿主系统中。载体被改进为介导植物转化质粒,含有与根癌农杆菌载体同源的区域、来自根癌农杆菌的T-DNA边界区。可选择地,用于本发明的方法的载体可以是农杆菌载体。导入载体的方法包括但不限于微注射,用具有核酸的小颗粒速度弹道穿透,核酸在小珠或颗粒的基质中或者在表面,以及电穿孔。载体被导入植物细胞、组织或器官中。在一个特别的实施方案中,一旦确定存在异源基因,可用本领域的已知方法再生植物。可以采用本领域已知的方法筛选期望的蛋白,优选采用筛选分析,其中以产生可检测的信号的方式来检测生物学活性位点。该信号可以直接或间接产生。这种分析的例子包括ELISA或放射免疫分析。
瞬时表达
本发明特别包括上述杂合酶的稳定表达和瞬时表达。用于转化大量各种高等植物种类来瞬时表达表达盒的技术是已知的[见如Weising等,Ann.Rev.Genet.22:421-477(1988)]。不同系统的变量包括被转化的核酸类型(DNA、RNA、质粒、病毒)、被转化的组织类型、导入转基因的方法和转化条件。例如可以采用从电转化、PEG poration、粒子轰击、硅纤维呈递、植物细胞原生质体或胚愈伤组织或其他植物组织微注射,或者农杆菌介导转化等范围内的技术[Hiei等,植物杂志(Plant J.)6:271-282(1994)],将核酸构建体直接导入植物细胞中。由于转化效率是变化的,常常采用内参(如35S-Luc)来规格化转化效率。
用于瞬时分析的表达构建体包括质粒和病毒载体。可以用作载体的各种植物病毒在本领域是已知的,包括花椰菜花叶病毒(CaMV)、双粒病毒组、雀麦草花叶病毒和烟草花叶病毒。
适合于瞬时表达的植物组织包括培养的细胞,或者是完整的或者作为原生质体(其中细胞被去除)、培养的组织、培养的植物和植物组织如叶子。
一些瞬时表达的方法采用通过电转化或聚乙二醇介导将基因转化到植物细胞原生质体中。这些方法需要制备和培养植物原生质体,包括在原生质体上形成穿孔,核酸通过该孔被转化到原生质体的内部。
示例性的电转化技术在Fromm等,美国国家科学院(Proc.Natl.Acad.Sci.)82:5824(1985)中被描述。采用聚乙二醇穿透的DNA构建体导入在Paszkowski等,EMBO J.3:2717-2722(1984)中被描述。烟草原生质体的PEG-介导转化在Lyck等,(1997)植物界(Planta)202:117-125和Scharf等,(1998)分子细胞生物学(Mol Cell Biol)18:2240-2251,和Kirschner等,(2000)植物杂志(The PlantJ)24(3):397-411中被描述,包括原生质体的分离、纯化和转化的步骤。这些方法已经被用于例如确定由外部刺激激活的启动子中的顺式作用元件,Abel和Theologis(1994),植物杂志(Plant J)5:421-427;Hattori等,(1992)遗传发育(Genes Dev)6:609-618;Sablowski等,(1994)EMBO J 13:128-137;和Solano等,(1995)EMBO J 14:1773-1784),以及其他的基因表达研究(美国专利6,376,747,在此引入作为参考)。
弹道转化技术在Klein等,(1987)自然(Nature)327:70-73中被描述。弹道瞬时转化用于悬浮细胞或植物器官。例如,其已经被开发用于烟草叶子,Godon等,(1993)Biochimie 75(7):591-595。其还用于研究植物启动子,(Baum等,(1997)植物杂志(Plant J)12:463-469;Stromvik等,(1999)植物分子生物学(PlantMol Biol)41(2):217-31,Tuerck和Fromm(1994)植物细胞(Plant Cell)6:1655-1663;和美国专利5,847,102,在此引入作为参考),和用于表征转录因子(Goff等,(1990)EMBO J 9:2517-2522;Gubler等,(1999)植物杂志(Plant J)17:1-9;和Sainz等,(1997)植物细胞(Plant Cell)9:611-625)。
另一种方法可以原位可视化基因的瞬时表达,例如洋葱表皮剥落,其中可以观察到GFP在各种细胞腔室内表达(Scott等,(1999)生物技术(Biotechniques)26(6):1128-1132。
还可以通过直接注射将核酸导入植物中。瞬时基因表达可以通过将DNA注射到植物的繁殖器官中来实现(见如,Pena等,(1987)自然,325:274),如将DNA转化到花粉中(见如Zhou等,(1983)酶学中的方法(Methods inEnzymology),10l:433;D.Hess(1987)Intern Rev.Cytol.,107:367;Luo等,(1988)植物分子生物学报道(Plant Mol.Biol.Reporter),6:165。DNA还可以直接注射到未成熟的胚胎的细胞中(见如,Neuhaus等,(1987)Theor.Appl.Genet:75:30;和Benbrook等,(1986)Proceedings Bio Expo 1986,Butterworth,Stoneham,Mass,27-54)。
农杆菌介导的转化可以应用于双子叶植物和单子叶植物。用于禾本科植物如水稻和玉米的农杆菌介导的转化的最佳方法和载体已经被描述(见如,Heath等,(1997)分子植物微生物互作(Mol.Plant-Microbe Interact.)10:221-227;Hiei等,(1994)植物杂志(Plant J.)6:271-282和Ishida等,(1996)自然生物技术(Nat.Biotech.)14:745-750)。玉米转化的效率受到各种因素的影响,包括感染的组织的类型和阶段、农杆菌浓度、组织培养液、Ti载体和玉米基因型。
另一种有效的基本转化操作包括结合粒子轰击创伤,接着用农杆菌呈递DNA(见如,Bidney等,(1992)植物分子生物学(Plant Mol.Biol.)18:301-313)。完整的分生转化和断裂分生转化也是已知的(美国专利6,300,545在此引入作为参考)。
利用农杆菌的其他方法包括农杆菌感染法和农杆菌渗入。通过将病毒基因组插入T-DNA,农杆菌可用于介导植物的病毒感染(见如,美国专利6,300,545在此引入作为参考)。在将T-DNA转入植物细胞后,成功病毒感染要求病毒基因组从T-DNA上切除(转移)。这种用于将病毒导入植物宿主的农杆菌介导方法被称作农杆菌感染(见,如,Grimsley,“农杆菌感染”,325-342,分子生物学中的方法(Methods in Molecular Biology),第44卷:农杆菌操作,Gartland和Davey编辑,Humana Press,Inc.,Totowa,新泽西州;Grisley(1990)Physiol.Plant.79:147-153)。
用于在植物中表达外源基因的植物病毒基因载体的发展提供了一种方法,在短时间内产生高水平的基因表达。适宜的表达复制子包括来自具有双链DNA基因组的病毒的双链DNA或者复制介质。被切除的病毒DNA可以独立地或者与翻译中添加因子一起作为复制子和复制介质。病毒DNA编码或不编码感染性的病毒颗粒,还可以具有插入、删除、取代、重排或其他修饰。病毒DNA含有异源DNA,可以是任何非病毒的或来自不同病毒的DNA。例如,异源DNA可以包含目标蛋白或RNA的表达盒。
具有农杆菌A28l和A348的病毒基因的超级双元载体可以用于单子叶植物的高效转化。但是,既便不采用高效的载体,已经证明T-DNA能有效地转化玉米,虽然不形成细胞瘤,但是产生由农杆菌诱导的病毒的系统性感染(Grimsley等,(1989)Mol.Gen.Genet.217:309-316)。这是由于含有病毒基因组的T-DNA的整合不要求病毒增殖,切除的病毒基因组作为独立的复制子。
另一种农杆菌介导的瞬时病毒分析基于农杆菌介导转化in planta的烟草叶片(Yang等,(2000)植物学杂志(The Plant J)22(6):543-551)。这种方法采用含有质粒构建体的农杆菌侵入烟草叶片中,称作为农杆菌侵入;已经被用于体内分析在2-3天内的启动子和转录因子的表达。也可以原位检测外部刺激,如病原体感染和环境应激对启动子活性的影响。
实施例1
采用先前描述的基于亲缘种选择操作的PCR[Bakker等,BBRC 261:829(1999)],从cDNA文库中分离编码β1,2-木糖基转移酶的拟南芥cDNA。用从兔抗辣根过氧化酶抗血清中纯化的木糖特异性抗体免疫染色被转化的CHO细胞,确定木糖基转移酶活性。用引物:
XylTpvuF:ATACTCGAGTTAACAATGAGTAAACGGAATC(SEQ ID NO:45)和
XylTpvuR:TTCTCGATCGCCGATTGGTTATTC(SEQ ID NO:46)
扩增含有木糖基转移酶的N末端部分的DNA片段,在起始密码子的前面引入XhoI和HpaI限制性位点,而在相反末端引入PvuI。用引物
GalTpvuF:GCCGCCGCGATCGGGCAGTCCTCC(SEQ ID NO:47)和
GalTrev:AACGGATCCACGCTAGCTCGGTGTCCCGAT(SEQ ID NO:48)
扩增人β1,4半乳糖基转移酶(登录号x55415,Aoki 1992)的C末端片段,然后引入PvuI和BamHI位点。将XhoI/PvuI和PvuI/BamHI的消化的PCR片段连接到用XhoI/BamHI消化的pBluescriptSK+上并测序。得到的开放阅读框编码融合蛋白,其含有与人β1,4半乳糖基转移酶的69-398氨基酸融合的拟南芥β1,2-木糖基转移酶的前54个氨基酸,称作为TmXyl-GalT。用HpaI/BamHI,将该片段克隆到植物表达载体中,位于CaMV35S启动子和Nos终止子之间。如天然的人β1,4半乳糖基转移酶[Bakker等,美国国家科学院汇编(Proc.Nat.Acad.Sci.USA)98:2899(2001)]一样,该克隆被导入烟草(samsun NN)中。
如描述[Bakker等,美国国家科学院汇编(Proc.Nat.Acad.Sci.USA)98:2899(2001)],进行转基因植物蛋白质的提取和蛋白质印迹。根据血凝素RCA的反应,通过MALDI-TOF[Elbers等,植物生理学(Plant Physiology)126:1314(2001)],选择表达TmXylGalT的转基因植物用于进一步分析聚糖,并与从表达天然β1,4半乳糖基转移酶的植物中分离的聚糖比较,以及与野生型植物的聚糖比较。表1中给出MALDI-TOF质谱的相对峰值区。也就是说,表1是对照烟草(“Tobacco”)、表达人β1,4-半乳糖基转移酶的转基因烟草(“GalT”),以及CTS区用β-1,2-木糖基转移酶的CTS区取代的表达β-1.4-糖基转移酶的转基因烟草植物(“TmXyl-GaIT”)的内源性糖蛋白的N聚糖的质谱(MALDI-TOF)分析结果的比较。
表1
 m/z 类型 烟草 GalT  TmXyl-GaIT
 933  M3  3  7
 1065  XM3  10  16  3
 1079  FM3  4
 1095  M4  9
 1211  FXM3  41  27
 1257  M5  4  5  23
 1268  GNXM3  4
 1298  GalGNM3  6
 1298  GNM4
 1414  GNFXM3  27  13  5
 1419  M6  7  8  10
 1460  GalGNM4  11
 1460  GNM5
 1485  GN2FM3  4
 1576  GalGNFXM3  5
 1576  GNFXM4
 1581  M7  3  4
 1606  GNXM5  3
 1606  GalGNFM4
 1617  GN2FXM3  8  9
 1622  GalGNM5  9
 1622  GNM6
 1743  M8  2  3
 1768  GalGNFM5  3
 1768  GNFM6
 1779  GalGN2FXM3  2
 1905  M9  1
 1941  Gal2GN2FXM3  2
 总计 100  100  101
这些数据表明:
1.在TmXylGalT植物中,聚糖的木糖基化和海藻糖基化显著地降低:与14%野生型植物相比,82%聚糖不携带木糖或海藻糖。
2.半乳糖苷化从GaIT植物的9%增加到TmXylGalT植物的32%。
实施例2
根据生物素标记RCA(Vector Laboratories,伯林盖姆,加利福尼亚)的血凝素印迹,筛选表达所述TmXyl-GaIT基因的转基因植物(TmXyl-GaIT-12植物)(如上)。用抗HRP(辣根过氧化酶)多克隆抗体(已知具有高抗木糖和抗海藻糖的反应性),比较MGR48转基因植物(对照)、表达未被修饰的人β1,4-半乳糖基转移酶基因的被选择的转基因植物和TmXyl-GalT-12植物的蛋白质提取物中含有的木糖和海藻糖,结果表明木糖和海藻糖减少(附图34“抗辣根”)。采用抗HRP的抗木糖片段和抗海藻糖片段的蛋白质印迹(每种都在适宜的配体上通过亲合层析制备)表明,与对照植物相比,尤其降低了木糖(附图34:“抗-Fuc”和“抗-Xyl”)。
实施例3
TmXyl-GaIT-12植物与来自单一T-DNA整合事件的表达单克隆抗体MGR48的转基因植物(MGR48-31)杂交,首先通过选择不能由卡那霉素抗性标记和抗体产物分离的子代植物来纯合(MGR48-31-4)。用MGR48-31-4的花粉给去雄的TmXyl-GaIT-12植物授粉。相反,用TmXyl-GalT-12植物的花粉给去雄的MGR48-31-4植物授粉。通过蛋白质印迹,分析大量的F1植物是否存在MGR48,并采用RCA通过血凝素印迹分析内源性糖蛋白的半乳糖基化(附图35)。选择一种表达MGR48并具有内源性糖蛋白的半乳糖基化的植物,用于进一步分析。该植物称作为XGM8.
种植TmXyl-GalT-12( )×MGR48-31-4( )的种子,采用先前描述的常规技术,通过蛋白质印迹分析子代植物(XGM)的抗体产量和用生物素标记的RCA120(Vector Labs.,伯林盖姆,加利福尼亚)通过血凝素印迹分析半乳糖基化。所有植物如预期表达单克隆抗体MGR48,并且如RCA120的血凝素印迹所示,大部分植物还具有半乳糖基化的聚糖。个别表达抗体MGR48并具有半乳糖基化的N-聚糖的植物被选择用于进一步分析(XGM8)(TmXyl-GaIT-12×MGR48-31-4子代植物8)。如先前描述,从该植物中纯化到单克隆重组MGR48抗体,用于MALDI-TOF的N-聚糖分析。
简而言之,在最佳条件下,将XGM8植物种植在温室里来生产抗体[Elbers等,植物生理学(Plant Physiology)126:1314(2001)]。进行转基因植物XGM8叶片的蛋白质提取,如所述[Bakker等,美国国家科学院汇编(Proc.Nat.Acad.Sci.USA)98:2899(2001)],用G蛋白层析纯化单克隆抗体。纯化的单克隆抗体的N-聚糖的MALDI-TOF被描述(Elbers等,2001,同上文)。如所述的采用牛睾丸β-半乳糖通过酶测序来确定聚糖上是否存在半乳糖(Bakker等,2001,同上文;表2)。表2(下文)是对TmXyl-GaIT-12植物与生产rec-mAb(MGR48)的植物的F1杂合子的内源性糖蛋白(“Xyl-GaIT Endo”)的N-聚糖和通过蛋白G层析从所述F1杂合子纯化的rec-mAB的N-聚糖的质谱分析(MALDI-TOF)的结构的比较。
  表2  Xyl-GaIT Endo  Xyl-GaIT IgG
 m/z 类型
 933  M3  6  4
 1065  XM3  2  2
 1079  FM3  2  3
 1095  M4  5  5
 1136  GNM3  1  2
 1211  FXM3  6  3
 1241  FM4  3  2
 1257  M5  17  12
 1268  GNXM3  1  2
 1282  GNFM3  2  3
 1298  GalGNM3  3  4
 1403  FM5  4  3
 1414  GNFXM3  2  4
 1419  M6  5  4
 1430  GNXM4  2  2
 1430  GalGNXM3
 1444  GNFM4  1  3
 1444  GalGNFM3
 1460  GalGNM4  8  10
 1460  GNM5
 1471  GN2XM3  1
 1485  GN2FM3  1  1
 1501  GalGN2M3  1  1
 1576  GalGNFXM3  2  3
 1576  GNFXM4
 1581  M7  2  2
 1593  GalGNXM4  1  2
 1593  GNXM5
 1606  GNXM5  3  4
 1606  GalGNFM4
 1617  GN2FXM3  2  1
 1622  GalGNM5  6  6
 1622  GNM6
 1647  GalGN2FM3  1  1
 1663  Gal2GN2M3  1  1
 1738  GNFXM5  1  2
 1738  GalGNFXM4
 1743  M8  1  2
 1754  GalGNXM5  1  2
 1768  GalGNFM5  2  3
 1768  GNFM6
 1784  GNM7  1  1
 1784  GalGNM6
 1809  Gal2GN2FM3  2  1
 1900  GNFXM6  1
 1900  GalGNFXM5
 1905  M9  1  1
总计  101  102
这些数据表明:
1.在F1杂合子中,聚糖的木糖基化和海藻糖基化显著下降,内源性糖蛋白的43%聚糖不含木糖和海藻糖,而野生型烟草植物仅为14%。
2.这种F1杂合子的纯化mAb的聚糖的木糖和海藻糖降低了47%,而野生型烟草为14%,见附图36组B-D。
3.F1杂合子的内源性糖蛋白的半乳糖基化从Ga1T植物的9%增加到F1TmXyl-GaIT X MGR48植物的37%。见附图35。
4.从所述F1中纯化的rec-mAb的半乳糖基化升高(见附图36组A);即46%具有半乳糖。见附图36组E。
但是应当指出,所观察到的数量(MALDI-TOF)并不必然地反映体内所述糖型的分子比例。基于MALDI-TOF的量化可能是过低估计或过高估计,取决于所试验的特定糖型。此外,由于Gal和Man之间不存在分子量的差异,一些峰不能被清楚地被标注,除非在半乳糖苷酶处理前后特定分子的相对高度具有显著差别。
实施例4
通过检测来自杂交瘤、转基因烟草和TmXyl-GaIT转基因烟草中的MGR48IgG抗体,可以直接比较木糖、海藻糖和半乳糖的含量。如上所述,TmXyl-GaIT-12植物与表达MGR48IgG的烟草植物(MGR48烟草)杂交,产生具有MGR48 TmXyl-GaIT的F1杂合子。F1植物被选择用于提取和纯化MGR48IgG。采用G蛋白层析(Elbers等,2001.植物生理学(Plant Physiology)126:1314-1322)分离和纯化来自所述植物(烟草和TmXyl-GaIT)的抗体。将300ng的各种杂交瘤MGR48和植物来源的重组MGR48加载到预制的12%SDS-PAGE凝胶上(BioRad),进行电泳。各个泳道的内容物如下:泳道1,杂交瘤MGR48;泳道2,从普通转基因烟草植物中纯化的重组MGR48;泳道3,从TmXyl-GaIT转基因植物中纯化的重组MGR48。在SDS-PAGE之后,用CAPS缓冲液将蛋白质转移到硝化纤维上。斑点与A,抗小鼠IgG;B,多克隆兔抗-HRP(抗木糖/α1,3-海藻糖);C,抗木糖;D,抗(α1,3-)海藻糖抗体;和E,生物素化RCA一起温育。在与HRP标记的绵羊抗小鼠(组A)或山羊抗兔(组B-D)抗体和HRP-标记的链霉抗生物素(E)温育后,在Lumi图像仪中用Lumi光进行检测。
组A表明,在所有泳道中加载了几乎相同含量的MGR48IgG。L是指MGR48IgG轻链,H是指MGR48IgG的重链。组B表示MGR48抗体重链在泳道2(烟草)中如期望的与抗HRP激烈反应,而来自杂交瘤的MGR48的重链(泳道1)不反应(如预期)。来源杂交瘤的抗体不含有木糖和α1,3-海藻糖残基。特别地,来自TmXyl-GaIT烟草植物的MGR48抗体也不反应,表明来自这种植物的抗体的重链的N-聚糖上的木糖和海藻糖的含量显著降低(约90%或更多)。这得到组C(抗木糖)和D(抗海藻糖)表示的试验的证实。组E表明杂交瘤的MGR48抗体的重链(泳道1)具有半乳糖基化的N-聚糖,而烟草来源的MGR48(泳道2)没有,两个结果都是预期的。由于存在表达杂合酶的构建体,来自TmXyl-GalT植物MGR48重链(泳道3)也具有半乳糖基化的N-聚糖。
这些数据与从先前所示采用从类似植物(烟草和TmXyl-GaIT-12植物)提取的总蛋白的类似试验得到的数据一致,说明由TmXyl-GaIT基因的表达而引入烟草的新特性可以被稳定地传递给子代和重组单克隆抗体。
实施例5
用β-半乳糖苷酶处理来进一步表征上述F1杂合子。表3是在用β-半乳糖苷酶处理聚糖前后,用G蛋白层析从TmXyl-GaIT和MGR48植物的F1杂合子纯化的rec-mAbs的N-聚糖的质谱分析(MALDI-TOF)结果的比较。
表3  Xyl-GaIT IgG- Xyl-GaIT IgG+β-半乳糖苷酶
m/z 类型
 933  M3  4  4
 1065  XM3  2  2
 1079  FM3  3  3
 1095  M4  5  4
 1136  GNM3  2  3
 1211  FXM3  3  4
 1241  FM4  2  2
 1257  M5  12  13
 1268  GNXM3  2  3
  1282   GNFM3   3   3
  1298   GalGNM3   4   4
  1403   FM5   3   2
  1414   GNFXM3   4   5
  1419   M6   4   3
  1430   GNXM4   2   2
  1430   GalGNXM3
  1444   GNFM4   3   3
  1444   GalGNFM3
  1460   GalGNM4   10   14
  1460   GNM5
  1471   GN2XM3   1
  1485   GN2FM3   1   1
  1501   GalGN2M3   1
  1576   GalGNFXM3   3   3
  1576   GNFXM4
  1581   M7   2   2
  1593   GalGNXM3   2   2
  1593   GNXM5
  1606   GNXM5   4   6
  1606   GalGNFM4
  1617   GN2FXM3   1   1
  1622   GalGNM5   6   1
  1622   GNM6
  1647   GalGN2FM3   1
  1663   Gal2GN2M3   1
  1738   GNFXM5   2   2
  1738   GalGNFXM4
  1743   M8   2   2
  1754   GalGNXM5   2   1
  1768   GalGNFM5   3   1
  1768   GNFM6
  1784   GNM7   1   1
  1784   GalGNM6
  1809   Gal2GN2FM3   1
 1900  GNFXM6  1
 1900  GalGNFXM5
 1905  M9  1  1
总计 102  100
这些数据表明:
1.来自F1杂合子的Rec-mAb含有半乳糖,这可以从在β-牛乳糖处理后所观察的特定糖型(含半乳糖)的减少和不含有半乳糖的糖型的增加推导出。观察到m/z 1622从6%降低到1%,同时m/z 1460从10%升高到14%,这是由于从GalGNM5去除半乳糖而加上了GNM5所致。m/z 1768(3%降低到1%)和相应的m/z 1606峰(从4%增加到6%)情况也如此。见附图36组E。
2.类似地,大量的峰是由于牛乳糖处理使含有半乳糖的聚糖减少导致的,特别是m/z 1501,1647和1663,说明存在半乳糖。
实施例6
在另一个实施方案中,昆虫甘露糖苷酶III基因(登录号:AF005034;错误地标注为甘露糖苷酶II基因!)的氨基末端的CTS区用进入内质网的小鼠信号肽编码序列取代(见附图37)。编码完全活性的信号肽的信号肽序列通常存在于IgG序列的氨基末端,先前已经在植物和其他生物体中成功地被使用。而且,编码所谓的内质网滞留序列(KDEL)的人工序列被添加到编码ER滞留的催化片段的基因部分的羧基末端。因此,由该基因序列编码的杂合型甘露糖苷酶III优选沉积在内质网中。
实施例7
在另一个实施方案中,人β-1,4半乳糖基转移酶(GalT)基因(登录号A52551)的氨基末端CTS区用编码进入内质网的小鼠信号肽的编码序列取代(见附图39)。编码完全活性的信号肽的信号肽序列通常存在于IgG序列的氨基末端,已经在植物和其他生物体中成功地被使用。而且,编码所谓内质网滞留序列(KDEL)的合成序列被添加到编码ER滞留的催化片段的基因部分的羧基末端。由该基因序列编码的杂合β-1,4半乳糖基转移酶蛋白将优选地沉积在内质网中。
实施例8
在另一个实施方案中,拟南芥GnTI(登录号:AJ243198)的氨基末端的CTS区用编码进入内质网的小鼠信号肽编码序列取代(见附图41)。编码完全活性的信号肽的信号肽序列通常存在于IgG序列的氨基末端,已经在植物和其他生物体中成功使用。而且,编码所谓内质网滞留序列(KDEL)的人工序列被添加到编码ER滞留的催化片段的基因部分的羧基末端。由该基因序列编码的杂合GnTI蛋白将优选地沉积在内质网中。
实施例9
在另一个实施方案中,拟南芥GnTII(登录号:AJ249274)的氨基末端的CTS区用编码进入内质网的小鼠信号肽编码序列取代(见附图43)。编码完全活性的信号肽的信号肽序列通常存在于IgG序列的氨基末端,已经在植物和其他生物体中成功地使用。而且,编码所谓内质网滞留序列(KDEL)的人工序列被添加到编码ER滞留的催化片段的基因部分的羧基末端。由该基因序列编码的杂合GnTII蛋白将优选地沉积在内质网中。
实施例10
在另一个实施方案中,人β-1,4-半乳糖基转移酶(GalT)基因氨基末端的CTS区用人GnTI(TmhuGnTI-GaIT)的CTS区基因取代(见附图45)。
应当理解,本发明不限于任何特定机制。也不需要理解该机制来成功应用本发明的各种实施方案。但是,一般认为,高尔基体酶是连续分布的(附图47),植物糖基转移酶的跨膜结构域的交换引起重新定位(附图48)。
一般认为,本发明不限于在此描述的特定方法、操作、细胞系、载体和试剂,它们是可改变的。还应当理解,在此所用的术语仅是用于描述特定实施方案的目的,而不是限定本发明的保护范围。应当指出,在此和附加的权利要求中,除非文章中清楚指出,单数形式包括复数形式。除非另外定义,在此所用的所有科技术语具有本发明所属领域的普通技术人员通常理解的相同意义。
由于实施方案是用于阐明本发明的各个方面,在此描述和要求保护的发明不被限定在本文描述的特定实施例中。任何等价的实施方案被认为在本发明的保护范围内。实际上,除了本文给出和描述的内容,本发明的各种改进对于本领域技术人员来说根据先前描述的是显而易见的。这种改进也被认为落入附加权利要求的保护范围中。
本文引用的各种参考文献及其公开的内容全部被引入作为参考。
                     序列表
<110>国际植物研究所
<120>在植物中优化聚糖生成
<130>62861A-P033486W0
<150>US-60/365,735
<151>2002-03-19
<160>59
<170>PatentIn version 3.2
<210>1
<211>1197
<212>DNA
<213>类人
<400>1
atgaggcttc gggagccgct cctgagcggc agcgccgcga tgccaggcgc gtccctacag    60
cgggcctgcc gcctgctcgt ggccgtctgc gctctgcacc ttggcgtcac cctcgtttac    120
tacctggctg gccgcgacct gagccgcctg ccccaactgg tcggagtctc cacaccgctg    180
cagggcggct cgaacagtgc cgccgccatc gggcagtcct ccggggagct ccggaccgga    240
ggggcccggc cgccgcctcc tctaggcgcc tcctcccagc cgcgcccggg tggcgactcc    300
agcccagtcg tggattctgg ccctggcccc gctagcaact tgacctcggt cccagtgccc    360
cacaccaccg cactgtcgct gcccgcctgc cctgaggagt ccccgctgct tgtgggcccc    420
atgctgattg agtttaacat gcctgtggac ctggagctcg tggcaaagca gaacccaaat    480
gtgaagatgg gcggccgcta tgcccccagg gactgcgtct ctcctcacaa ggtggccatc    540
atcattccat tccgcaaccg gcaggagcac ctcaagtact ggctatatta tttgcaccca    600
gtcctgcagc gccagcagct ggactatggc atctatgtta tcaaccaggc gggagacact    660
atattcaatc gtgctaagct cctcaatgtt ggctttcaag aagccttgaa ggactatgac    720
tacacctgct ttgtgtttag tgacgtggac ctcattccaa tgaatgacca taatgcgtac    780
aggtgttttt cacagccacg gcacatttcc gttgcaatgg ataagtttgg attcagccta    840
ccttatgttc agtattttgg aggtgtctct gctctaagta aacaacagtt tctaaccatc    900
aatggatttc ctaataatta ttggggctgg ggaggagaag atgatgacat ttttaacaga    960
ttagttttta gaggcatgtc tatatctcgc ccaaatgctg tggtcgggag gtgtcgcatg    1020
atccgccact caagagacaa gaaaaatgaa cccaatcctc agaggtttga ccgaattgca    1080
cacacaaagg agacaatgct ctctgatggt ttgaactcac tcacctacca ggtgctggat    1140
gtacagagat acccattgta tacccaaatc acagtggaca tcgggacacc gagctag       1197
<210>2
<211>398
<212>PRT
<213>类人
<400>2
Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ser Ala Ala Met Pro Gly
 1               5                  10                  15
Ala Ser Leu Gln Arg Ala Cys Arg Leu Leu Val Ala Val Cys Ala Leu
            20                  25                  30
His Leu Gly Val Thr Leu Val Tyr Tyr Leu Ala Gly Arg Asp Leu Ser
        35                  40                  45
Arg Leu Pro Gln Leu Val Gly Val Ser Thr Pro Leu Gln Gly Gly Ser
    50                  55                   60
Asn Ser Ala Ala Ala Ile Gly Gln Ser Ser Gly Glu Leu Arg Thr Gly
65                  70                  75                  80
Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg Pro
                85                  90                  95
Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala Ser
            100                 105                 110
Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu Pro
        115                 120                 125
Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile Glu
    130                 135                 140
Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro Asn
145                 150                 155                 160
Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro His
                165                 170                 175
Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu Lys
            180                 185                 190
Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu Asp
        195                 200                 205
Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr Ile Phe Asn Arg
    210                 215                 220
Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp Tyr Asp
225                 230                 235                 240
Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asn Asp
                245                 250                 255
His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser Val Ala
            260                 265                 270
Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln Tyr Phe Gly Gly
        275                 280                 285
Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly Phe Pro
    290                 295                 300
Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn Arg
305                 310                 315                 320
Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Val Val Gly
                325                 330                 335
Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu Pro Asn
            340                 345                 350
Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met Leu Ser
        355                 360                 365
Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln Arg Tyr
    370                 375                 380
Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser
385                 390                 395
<210>3
<211>1152
<212>DNA
<213>杂合体
<400>3
atgagtaaac ggaatccgaa gattctgaag atttttctgt atatgttact tctcaactct      60
ctctttctca tcatctactt cgtttttcac tcatcgtcgt tttcaccgga gcagtcacag     120
cctcctcata tataccacgt ttcagtgaat aaccaatcgg cgatcgggca gtcctccggg     180
gagctccgga ccggaggggc ccggccgccg cctcctctag gcgcctcctc ccagccgcgc     240
ccgggtggcg actccagccc agtcgtggat tctggccctg gccccgctag caacttgacc     300
tcggtcccag tgccccacac caccgcactg tcgctgcccg cctgccctga ggagtccccg     360
ctgcttgtgg gccccatgct gattgagttt aacatgcctg tggacctgga gctcgtggca     420
aagcagaacc caaatgtgaa gatgggcggc cgctatgccc ccagggactg cgtctctcct     480
cacaaggtgg ccatcatcat tccattccgc aaccggcagg agcacctcaa gtactggcta     540
tattatttgc acccagtcct gcagcgccag cagctggact atggcatcta tgttatcaac     600
caggcgggag acactatatt caatcgtgct aagctcctca atgttggctt tcaagaagcc     660
ttgaaggact atgactacac ctgctttgtg tttagtgacg tggacctcat tccaatgaat     720
gaccataatg cgtacaggtg tttttcacag ccacggcaca tttccgttgc aatggataag     780
tttggattca gcctacctta tgttcagtat tttggaggtg tctctgctct aagtaaacaa     840
cagtttctaa ccatcaatgg atttcctaat aattattggg gctggggagg agaagatgat     900
gacattttta acagattagt ttttagaggc atgtctatat ctcgcccaaa tgctgtggtc     960
gggaggtgtc gcatgatccg ccactcaaga gacaagaaaa atgaacccaa tcctcagagg    1020
tttgaccgaa ttgcacacac aaaggagaca atgctctctg atggtttgaa ctcactcacc    1080
taccaggtgc tggatgtaca gagataccca ttgtataccc aaatcacagt ggacatcggg    1140
acaccgagct ag                                                        1152
<210>4
<211>383
<212>PRT
<213>杂合体
<400>4
Met Ser Lys Arg Asn Pro Lys Ile Leu Lys Ile Phe Leu Tyr Met Leu
 1               5                  10                  15
Leu Leu Asn Ser Leu Phe Leu Ile Ile Tyr Phe Val Phe His Ser Ser
            20                  25                  30
Ser Phe Ser Pro Glu Gln Ser Gln Pro Pro His Ile Tyr His Val Ser
        35                  40                  45
Val Asn Asn G1n Ser Ala Ile Gly Gln Ser Ser Gly Glu Leu Arg Thr
    50                  55                  60
Gly Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg
65                  70                  75                  80
Pro Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala
                85                  90                  95
Ser Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu
            100                 105                 110
Pro Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile
        115                 120                 125
Glu Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro
    130                 135                 140
Asn Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro
145                 150                 155                 160
His Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu
                165                 170                 175
Lys Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu
            180                 185                 190
Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala3Gly Asp Thr Ile Phe Asn
        195                 200                 205
Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp Tyr
    210                 215                 220
Asp Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asn
225                 230                 235                 240
Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser Val
                245                 250                 255
Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val G1n Tyr Phe Gly
            260                 265                 270
Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly Phe
        275                 280                 285
Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn
    290                 295                 300
Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Va1 Val
305                 310                 315                 320
Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu Pro
                325                 330                 335
Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met Leu
            340                 345                 350
Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln Arg
        355                 360                 365
Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser
    370                 375                 380
<210>5
<211>1642
<212>DNA
<213>类人
<400>5
ccatggtgat gagacgctac aagctctttc tcatgttctg tatggccggc ctgtgcctca    60
tctccttcct gcacttcttc aagaccctgt cctatgtcac cttcccccga gaactggcct    120
ccctcagccc taacctggtg tccagctttt tctggaacaa tgccccggtc acgccccagg    180
ccagccccga gccaggaggc cctgacctgc tgcgtacccc actctactcc cactcgcccc    240
tgctgcagcc gctgccgccc agcaaggcgg ccgaggagct ccaccgggtg gacttggtgc    300
tgcccgagga caccaccgag tatttcgtgc gcaccaaggc cggcggcgtc tgcttcaaac    360
ccggcaccaa gatgctggag aggccgcccc cgggacggcc ggaggagaag cctgaggggg    420
ccaacggctc ctcggcccgg cggccacccc ggtacctcct gagcgcccgg gagcgcacgg    480
ggggccgagg cgcccggcgc aagtgggtgg agtgcgtgtg cctgcccggc tggcacggac    540
ccagctgcgg cgtgcccact gtggtgcagt actccaacct gcccaccaag gagcggctgg    600
tgcccaggga ggtgccgcgc cgcgtcatca acgccatcaa cgtcaaccac gagttcgacc    660
tgctggacgt gcgcttccac gagctgggcg acgtggtgga cgcctttgtg gtgtgcgagt    720
ccaacttcac ggcttatggg gagccgcggc cgctcaagtt ccgggagatg ctgaccaatg    780
gcaccttcga gtacatccgc cacaaggtgc tctatgtctt cctggaccac ttcccgcccg    840
gcggccggca ggacggctgg atcgccgacg actacctgcg caccttcctc acccaggacg    900
gcgtctcgcg gctgcgcaac ctgcggcccg acgacgtctt catcattgac gatgcggacg    960
agatcccggc ccgtgacggc gtccttttcc tcaagctcta cgatggctgg accgagccct    1020
tcgccttcca catgcgcaag tcgctctacg gcttcttctg gaagcagccg ggcaccctgg    1080
aggtggtgtc aggctgcacg gtggacatgc tgcaggcagt gtatgggctg gacggcatcc    1140
gcctgcgccg ccgccagtac tacaccatgc ccaacttcag acagtatgag aaccgcaccg    1200
gccacatcct ggtgcagtgg tcgctgggca gccccctgca cttcgccggc tggcactgct    1260
cctggtgctt cacgcccgag ggcatctact tcaagctcgt gtccgcccag aatggcgact    1320
tcccacgctg gggtgactac gaggacaagc gggacctgaa ctacatccgc ggcctgatcc    1380
gcaccggggg ctggttcgac ggcacgcagc aggagtaccc gcctgcagac cccagcgagc    1440
acatgtatgc gcccaagtac ctgctgaaga actacgaccg gttccactac ctgctggaca    1500
acccctacca ggagcccagg agcacggcgg cgggcgggtg gcgccacagg ggtcccgagg    1560
gaaggccgcc cgcccggggc aaactggacg aggcggaagt cgaacaaaaa ctcatctcag    1620
aagaggatct gaattaggat cc                                   1642
<210>6
<211>544
<212>PRT
<213>类人
<400>6
Met Val Met Arg Arg Tyr Lys Leu Phe Leu Met Phe Cys Met Ala Gly
1               5                   10                  15
Leu Cys Leu Ile Ser Phe Leu His Phe Phe Lys Thr Leu Ser Tyr Val
            20                  25                  30
Thr Phe Pro Arg Glu Leu Ala Ser Leu Ser Pro Asn Leu Val Ser Ser
        35                  40                   45
Phe Phe Trp Asn Asn Ala Pro Val Thr Pro Gln Ala Ser Pro Glu Pro
    50                  55                  60
Gly Gly Pro Asp Leu Leu Arg Thr Pro Leu Tyr Ser His Ser Pro Leu
65                  70                  75                  80
Leu Gln Pro Leu Pro Pro Ser Lys A1a Ala Glu Glu Leu His Arg Val
                85                  90                  95
Asp Leu Val Leu Pro Glu Asp Thr Thr Glu Tyr Phe Val Arg Thr Lys
            100                 105                 110
Ala Gly Gly Val Cys Phe Lys Pro Gly Thr Lys Met Leu Glu Arg Pro
        115                 120                 125
Pro Pro Gly Arg Pro Glu Glu Lys Pro Glu Gly Ala Asn Gly Ser Ser
    130                 135                 140
Ala Arg Arg Pro Pro Arg Tyr Leu Leu Ser Ala Arg Glu Arg Thr Gly
145                 150                 155                 160
Gly Arg Gly Ala Arg Arg Lys Trp Val Glu Cys Val Cys Leu Pro Gly
                165                 170                 175
Trp His Gly Pro Ser Cys Gly Val Pro Thr Val Val Gln Tyr Ser Asn
            180                 185                 190
Leu Pro Thr Lys Glu Arg Leu Val Pro Arg Glu Val Pro Arg Arg Val
        195                 200                 205
Ile Asn Ala Ile Asn Val Asn His Glu Phe Asp Leu Leu Asp Val Arg
    210                 215                 220
Phe His Glu Leu Gly Asp Val Val Asp Ala Phe Val Val Cys Glu Ser
225                 230                 235                 240
Asn Phe Thr Ala Tyr Gly Glu Pro Arg Pro Leu Lys Phe Arg Glu Met
                245                 250                 255
Leu Thr Asn Gly Thr Phe Glu Tyr Ile Arg His Lys Val Leu Tyr Val
            260                 265                 270
Phe Leu Asp His Phe Pro Pro Gly Gly Arg Gln Asp Gly Trp Ile Ala
        275                 280                 285
Asp Asp Tyr Leu Arg Thr Phe Leu Thr Gln Asp Gly Val Ser Arg Leu
    290                 295                 300
Arg Asn Leu Arg Pro Asp Asp Val Phe Ile Ile5Asp Asp Ala Asp Glu
305                 310                 315                 320
Ile Pro Ala Arg Asp Gly Val Leu Phe Leu Lys Leu Tyr Asp Gly Trp
                325                 330                 335
Thr Glu Pro Phe Ala Phe His Met Arg Lys Ser Leu Tyr Gly Phe Phe
            340                 345                 350
Trp Lys Gln Pro Gly Thr Leu Glu Val Val Ser Gly Cys Thr Val Asp
        355                 360                 365
Met Leu Gln Ala Val Tyr Gly Leu Asp Gly Ile Arg Leu Arg Arg Arg
    370                 375                 380
Gln Tyr Tyr Thr Met Pro Asn Phe Arg Gln Tyr Glu Asn Arg Thr Gly
385                 390                 395                 400
His Ile Leu Val Gln Trp Ser Leu Gly Ser Pro Leu His Phe Ala Gly
                405                 410                 415
Trp His Cys Ser Trp Cys Phe Thr Pro Glu Gly Ile Tyr Phe Lys Leu
            420                 425                 430
Val Ser Ala Gln Asn Gly Asp Phe Pro Arg Trp Gly Asp Tyr Glu Asp
        435                 440                 445
Lys Arg Asp Leu Asn Tyr Ile Arg Gly Leu Ile Arg Thr Gly Gly Trp
    450                 455                 460
Phe Asp Gly Thr Gln Gln Glu Tyr Pro Pro Ala Asp Pro Ser Glu His
465                 470                 475                 480
Met Tyr Ala Pro Lys Tyr Leu Leu Lys Asn Tyr Asp Arg Phe His Tyr
                485                 490                 495
Leu Leu Asp Asn Pro Tyr Gln Glu Pro Arg Ser Thr Ala Ala Gly Gly
            500                 505                 510
Trp Arg His Arg Gly Pro Glu Gly Arg Pro Pro Ala Arg Gly Lys Leu
        515                 520                 525
Asp Glu Ala Glu Val Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn
    530                 535                 540
<210>7
<211>10
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>7
Glu Gln Lys Leu IIe Ser Glu Glu Asp Leu
 1               5                  10
<210>8
<211>31
<212>PRT
<213>类人
<400>8
Gln Glu Pro Arg Ser Thr Ala Ala Gly Gly Trp Arg His Arg Gly Pro
 1              5                   10                  l5
Glu Gly Arg Pro Pro Ala Arg Gly Lys Leu Asp Glu Ala Glu Val
            20                  25                  30
<210>9
<211>1614
<212>DNA
<213>杂合体
<400>9
catgagtaaa cggaatccga agattctgaa gatttttctg tatatgttac ttctcaactc    60
tctctttctc atcatctact tcgtttttca ctcatcgtcg ttttcaccgg agcagtcaca    120
gcctcctcat atataccacg tttcagtgaa taaccaatcg gcacatggag gccctgacct    180
gctgcgtacc ccactctact cccactcgcc cctgctgcag ccgctgccgc ccagcaaggc    240
ggccgaggag ctccaccggg tggacttggt gctgcccgag gacaccaccg agtatttcgt    300
gcgcaccaag gccggcggcg tctgcttcaa acccggcacc aagatgctgg agaggccgcc    360
cccgggacgg ccggaggaga agcctgaggg ggccaacggc tcctcggccc ggcggccacc    420
ccggtacctc ctgagcgccc gggagcgcac ggggggccga ggcgcccggc gcaagtgggt    480
ggagtgcgtg tgcctgcccg gctggcacgg acccagctgc ggcgtgccca ctgtggtgca    540
gtactccaac ctgcccacca aggagcggct ggtgcccagg gaggtgccgc gccgcgtcat    600
caacgccatc aacgtcaacc acgagttcga cctgctggac gtgcgcttcc acgagctggg    660
cgacgtggtg gacgcctttg tggtgtgcga gtccaacttc acggcttatg gggagccgcg    720
gccgctcaag ttccgggaga tgctgaccaa tggcaccttc gagtacatcc gccacaaggt    780
gctctatgtc ttcctggacc acttcccgcc cggcggccgg caggacggct ggatcgccga    840
cgactacctg cgcaccttcc tcacccagga cggcgtctcg cggctgcgca acctgcggcc    900
cgacgacgtc ttcatcattg acgatgcgga cgagatcccg gcccgtgacg gcgtcctttt    960
cctcaagctc tacgatggct ggaccgagcc cttcgccttc cacatgcgca agtcgctcta    1020
cggcttcttc tggaagcagc cgggcaccct ggaggtggtg tcaggctgca cggtggacat    1080
gctgcaggca gtgtatgggc tggacggcat ccgcctgcgc cgccgccagt actacaccat    1140
gcccaacttc agacagtatg agaaccgcac cggccacatc ctggtgcagt ggtcgctggg    1200
cagccccctg cacttcgccg gctggcactg ctcctggtgc ttcacgcccg agggcatcta    1260
cttcaagctc gtgtccgccc agaatggcga cttcccacgc tggggtgact acgaggacaa    1320
gcgggacctg aactacatcc gcggcctgat ccgcaccggg ggctggttcg acggcacgca    1380
gcaggagtac ccgcctgcag accccagcga gcacatgtat gcgcccaagt acctgctgaa    1440
gaactacgac cggttccact acctgctgga caacccctac caggagccca ggagcacggc    1500
ggcgggcggg tggcgccaca ggggtcccga gggaaggccg cccgcccggg gcaaactgga    1560
cgaggcggaa gtcgaacaaa aactcatctc agaagaggat ctgaattagg atcc          1614
<210>10
<211>535
<212>PRT
<213>杂合体
<400>10
Met Ser Lys Arg Asn Pro Lys Ile Leu Lys Ile Phe Leu Tyr Met Leu
 1               5                  10                  15
Leu Leu Asn Ser Leu Phe Leu Ile Ile Tyr Phe Val Phe His Ser Ser
            20                   25                 30
Ser Phe Ser Pro Glu Gln Ser Gln Pro Pro His Ile Tyr His Val Ser
        35                  40                   45
Val Asn Asn Gln Ser Ala His Gly Gly Pro Asp Leu Leu Arg Thr Pro
    50                  55                  60
Leu Tyr Ser His Ser Pro Leu Leu Gln Pro Leu Pro Pro Ser Lys Ala
65                  7O                   75                 80
Ala Glu Glu Leu His Arg Val Asp Leu Val Leu Pro Glu Asp Thr Thr
                85                  90                   95
Glu Tyr Phe Val Arg Thr Lys Ala Gly Gly Val Cys Phe Lys Pro Gly
            100                 105                 110
Thr Lys Met Leu Glu Arg Pro Pro Pro Gly Arg Pro Glu Glu Lys Pro
        115                 120                 125
Glu Gly Ala Asn Gly Ser Ser Ala Arg Arg Pro Pro Arg Tyr Leu Leu
    130                 135                 140
Ser Ala Arg Glu Arg Thr Gly Gly Arg Gly Ala Arg Arg Lys Trp Val
145                 150                 155                 160
Glu Cys Val Cys Leu Pro Gly Trp His Gly Pro Ser Cys Gly Val Pro
                165                 170                 175
Thr Val Val Gln Tyr Ser Asn Leu Pro Thr Lys Glu Arg Leu Val Pro
            180                 185                 190
Arg Glu Val Pro Arg Arg Val Ile Asn Ala Ile Asn Val Asn His Glu
        195                 200                 205
Phe Asp Leu Leu Asp Val Arg Phe His Glu Leu Gly Asp Val Val Asp
    210                 215                 220
Ala Phe Val Val Cys Glu Ser Asn Phe Thr Ala Tyr Gly Glu Pro Arg
225                 230                 235                 240
Pro Leu Lys Phe Arg Glu Met Leu Thr Asn Gly Thr Phe Glu Tyr Ile
                245                 250                 255
Arg His Lys Val Leu Tyr Val Phe Leu Asp His Phe Pro Pro Gly Gly
            260                 265                 270
Arg Gln Asp Gly Trp Ile Ala Asp Asp Tyr Leu Arg Thr Phe Leu Thr
        275                 280                 285
Gln Asp Gly Val Ser Arg Leu Arg Asn Leu Arg Pro Asp Asp Val Phe
    290                 295                 300
Ile Ile Asp Asp Ala Asp Glu Ile Pro Ala Arg Asp Gly Val Leu Phe
305                 310                 315                 320
Leu Lys Leu Tyr Asp Gly Trp Thr Glu Pro Phe Ala Phe His Met Arg
                325                 330                 335
Lys Ser Leu Tyr Gly Phe Phe Trp Lys Gln Pro Gly Thr Leu Glu Val
            340                 345                 350
Val Ser Gly Cys Thr Val Asp Met Leu Gln Ala Val Tyr Gly Leu Asp
        355                 360                 365
Gly Ile Arg Leu Arg Arg Arg Gln Tyr Tyr Thr Met Pro Asn Phe Arg
    370                 375                 380
Gln Tyr Glu Asn Arg Thr Gly His Ile Leu Val Gln Trp Ser Leu Gly
385                 390                 395                 400
Ser Pro Leu His Phe Ala Gly Trp His Cys Ser Trp Cys Phe Thr Pro
                405                 410                 415
Glu Gly Ile Tyr Phe Lys Leu Val Ser Ala Gln Asn Gly Asp Phe Pro
            420                 425                 430
Arg Trp Gly Asp Tyr Glu Asp Lys Arg Asp Leu Asn Tyr Ile Arg Gly
        435                 440                 445
Leu Ile Arg Thr Gly Gly Trp Phe Asp Gly Thr Gln Gln Glu Tyr Pro
    450                 455                 460
Pro Ala Asp Pro Ser Glu His Met Tyr Ala Pro Lys Tyr Leu Leu Lys
465                 470                 475                 480
Asn Tyr Asp Arg Phe His Tyr Leu Leu Asp Asn Pro Tyr Gln Glu Pro
                485                 490                 495
Arg Ser Thr Ala Ala Gly Gly Trp Arg His Arg Gly Pro Glu Gly Arg
            500                 505                 510
Pro Pro Ala Arg Gly Lys Leu Asp Glu Ala Glu Val Glu Gln Lys Leu
        515                 520                 525
Ile Ser Glu Glu Asp Leu Asn
    530                 535
<210>11
<211>13
<212>DNA
<213>人工序列
<220>合成的
<223>
<400>11
aatacttcca ccc                                           13
<210>12
<211>34
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>12
ccacccgtta acaatgaagatgagacgcta caag                     34
<210>13
<211>29
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>13
gggccatgga gatgagacgc tacaagctc                          29
<210>14
<211>28
<212>DNA
<213>人工序列
<220>合成的
<223>
<400>14
ggatccaatg aagatgagac gctacaag                           28
<210>15
<211>41
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>15
gggcccggga gatcctaatt cagatcctct tctgagatga g                       41
<210>16
<211>35
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>16
cccggatcct aattcagatc ctcttctgag atgag                              35
<210>17
<211>38
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>17
gggtctagat cctaattcag atcctcttct gagatgag                           38
<210>18
<211>35
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>18
ccacccgtta acaatgagta aacggaatcc gaaga                              35
<210>19
<211>35
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>19
gggccatggg taaacggaat ccgaagattc tgaag                              35
<210>20
<211>34
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>20
cccggatcca tgagtaaacg gaatccgaag attc                              34
<210>21
<211>29
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>21
gcgccccggg acgctagctc ggtgtcccg                               29
<210>22
<211>25
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>22
cccggatcca cgctagctcg gtgtc                                   25
<210>23
<211>31
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>23
gggtctagat ccacgctagc tcggtgtccc g                            31
<210>24
<211>39
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>24
ccacccgtta acaatgaggc ttcgggagcc gctcctgag                    39
<210>25
<211>31
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>25
gggccatggg gcttcgggag ccgctcctga g                            31
<210>26
<211>35
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>26
cccggatcca tgaggcttcg ggagccgctc ctgagll                      35
<210>27
<211>7155
<212>DNA
<213>杂合体
<400>27
ggcgcgcctc gaggcgatcg cagatctaat ctaaccaatt acgatacgct ttgggtacac    60
ttgatttttg tttcagtggt tacatatatc ttgttttata tgctatcttt aaggatctgc    120
acaaagatta tttgttgatg ttcttgatgg ggctcagaag atttgatatg atacactcta    180
atctttagga gataccagcc aggattatat tcagtaagac aatcaaattt tacgtgttca    240
aactcgttat cttttcattc aaaggatgag ccagaatctt tatagaatga ttgcaatcga    300
gaatatgttc ggccgatatg cctttgttgg cttcaatatt ctacatatca cacaagaatc    360
gaccgtattg taccctcttt ccataaagga aaacacaata tgcagatgct tttttcccac    420
atgcagtaac atataggtat tcaaaaatgg ctaaaagaag ttggataaca aattgacaac    480
tatttccatt tctgttatat aaatttcaca acacacaaaa gcccgtaatc aagagtctgc    540
ccatgtacga aataacttct attatttggt attgggccta agcccagctc agagtacgtg    600
ggggtaccac atataggaag gtaacaaaat actgcaagat agccccataa cgtaccagcc    660
tctccttacc acgaagagat aagatataag acccaccctg ccacgtgtca catcgtcatg    720
gtggttaatg ataagggatt acatccttct atgtttgtgg acatgatgca tgtaatgtca    780
tgagccacag gatccaatgg ccacaggaac gtaagaatgt agatagattt gattttgtcc    840
gttagatagc aaacaacatt ataaaaggtg tgtatcaata ggaactaatt cactcattgg    900
attcatagaa gtccattcct cctaagtatc tagaaaccat ggcgaggatc tcgtgtgact    960
tgagatttct tctcatcccg gcagctttca tgttcatcta catccagatg aggcttttcc    1020
agacgcaatc acagtatgca gatcgcctca gttccgctat cgaatctgag aaccattgca    1080
ctagtcaaat gcgaggcctc atagatgaag ttagcatcaa acagtcgcgg attgttgccc    1140
tcgaagatat gaagaaccgc caggacgaag aacttgtgca gcttaaggat ctaatccaga    1200
cgtttgaaaa aaaaggaata gcaaaactca ctcaaggtgg agccatggat tccaattcag    1260
gcgccgtcgt tgatatcaca actaaagatc tatacgatag gattgagttt cttgatacag    1320
atggtggtcc atggaaacaa ggttggagag ttacgtataa agacgatgag tgggagaaag    1380
agaagctcaa aatcttcgtt gttcctcatt ctcataacga tcctggttgg aaattgactg    1440
tagaggagta ttatcagaga caatccagac atattcttga caccattgtt gagactttat    1500
ctaaggtatg acgaaagttt ttgcttttgg ttttaatatt ttaattctct cccatggtta    l560
tcccgtgaac aatcttaaat gtcttaaaat tctcatgacg tcattaaact ctataaccaa    1620
acttctttgc tgggttctgt ttttttttag tttcgtgatg aaacagagtt ctagaagttc    1680
gttcttttgg aaaatttgaa gtctttggag ctaaagtttg tttttttatt actgggtttt    1740
gagattgaag gatagctaga atcttatttg tgtgggggtt tgttttgaat atgtttaata    1800
ggattcaaga agaaagttta tatgggagga gatgtcatat ctggagagat ggtggagaga    1860
cgcttcacct aataaacaag aagctttgac taaattggtt aaggatgggc agctagagat    1920
tgttggaggt ggctgggtta tgaatgatga ggctaattca cattattttg ccataattga    1980
acagatagca gagggtaata tgtggctgaa tgacacaatt ggggttattc ctaagaattc    2040
ttgggctata gatccctttg gctattcatc aaccatggct tatcttctcc ggcgtatggg    2100
ttttgaaaac atgcttattc aaaggactca ttacgagctc aagaaagacc ttgcccagca    2160
taagaatctt gaatatattt ggcgtcagag ctgggatgct atggaaacca cagatatctt    2220
tgttcatatg atgccgtttt attcatacga tatcccacac acttgtggac cagagcctgc    2280
aatttgctgt cagtttgatt tcgctcggat gcggggattt aagtatgaac tttgtccatg    2340
gggaaagcac ccagtggaga ccacactaga aaatgtgcag gagagggcat taaagcttct    2400
ggatcaatac aggaaaaaat ccactctata tcgaactaat acacttctta tacctcttgg    2460
agatgatttt aggtacatta gtatcgatga agccgaggct cagttccgta actaccagat    2520
gttgtttgat cacatcaact ctaatcctag tctaaacgca gaagcaaagt ttggtacttt    2580
ggaggattat ttcagaacag tccgagaaga agcagacaga gtgaattatt ctcgtcctgg    2640
tgaggttggc tctggtcagg ttgttggttt cccttctctg tcaggtgact tctttacata    2700
tgcagatagg caacaagact attggagtgg ttattatgtt tcaagacctt tcttcaaagc    2760
tgttgatcgt gtgctcgagc atacccttcg tggagctgag atcatgatgt catttctgct    2820
aggttattgc catcgaattc aatgtgagaa atttccaaca agttttacgt ataagttgac    2880
tgctgcaaga agaaatctgg ctcttttcca gcaccatgat ggggtaactg gaactgctaa    2940
ggattatgtg gtacaagatt acggcacccg gatgcatact tcattgcaag accttcagat    3000
ctttatgtct aaagcaatcg aagttcttct tgggatccgc cacgagaaag aaaaatctga    3060
tcaatcccca tcatttttcg aggcagagca aatgagatca aagtatgatg ctcggccagt    3120
tcacaagcca attgctgccc gggaaggaaa ttcgcacaca gttatactct tcaatccatc    3180
agaacagacg agagaggagg tggtgacggt tgttgttaac cgcgctgaaa tctcggtttt    3240
ggactcaaac tggacttgtg tccctagcca aatttctcct gaagtgcagc atgacgatac    3300
caaactattc accggcagac atcgccttta ctggaaagct tccatcccag ctcttggtct    3360
gagaacatat ttcattgcta atgggaatgt cgagtgtgag aaagctactc cgtctaaact    3420
caaatacgct tctgagtttg acccatttcc ttgtcctcct ccatattcct gctccaaact    3480
ggacaacgac gttactgaga tccgaaatga acatcagact cttgtgtttg atgtgaagaa    3540
cggatcactg cggaagatag tccatagaaa cggatcagag actgttgtgg gagaagagat    3600
aggtatgtac tctagtccag agagtggagc ttacctgttc aaaccagatg gtgaagctca    3660
gccaattgtt caacctgatg gacatgtagt cacctctgag ggtctgctgg ttcaagaagt    3720
cttctcttac cctaaaacca aatgggagaa atcacccctc tctcagaaaa ctcgtcttta    3780
cactggaggt aatacgcttc aggatcaagt ggtcgagata gaatatcatg ttgagcttct    3840
tggtaatgat tttgatgacc gggaattgat tgtccggtac aagactgatg ttgacaacaa    3900
gaaggtcttc tattcagatc tcaatggttt ccaaatgagc aggagagaaa cttatgataa    3960
gatccctctt caaggaaact actacccaat gccatctctc gcatttatcc aaggatccaa    4020
tggtcagaga ttctccgtgc actctcgtca atctctcggt gttgcaagcc tcaaagaggg    4080
ttggttggag attatgctgg acagacggtt ggttcgtgat gacggacggg gtctagggca    4140
aggtgtgatg gataaccgcg caatgaccgt ggtatttcac cttcttgcgg aatctaacat    4200
ttctcaagca gaccctgctt ccaacactaa cccgaggaac ccttcgcttc tctctcacct    4260
cataggtgct cacttaaact accccataaa cacattcatt gccaagaaac cgcaagacat    4320
atctgtgcgt gttccacaat acggttcctt tgctccttta gccaaaccgt taccatgtga    4380
cctccacatt gtaaatttca aggttcctcg tccatccaaa tactctcagc aattggaaga    4440
agacaagcca aggttcgctc ttatcctcaa tagacgagct tgggattcag cttattgcca    4500
taaaggaaga caagtaaact gcacaagcat ggctaatgaa ccagtaaact tttccgacat    4560
gttcaaagat cttgcagctt caaaggtaaa accaacttca ctgaatctct tgcaagaaga    4620
tatggagatt cttgggtacg atgaccaaga gctacctcga gatagttcac agccacggga    4680
aggacgtgtc tcgatctctc ccatggaaat acgagcttat aagcttgaac tgcgacctca    4740
caagtgaacc tgctgaagat ccgctagagt ccgcaaaaat caccagtctc tctctacaaa    4800
tctatctctc tctatttttc tccagaataa tgtgtgagta gttcccagat aagggaatta    4860
gggttcttat agggtttcgc tcatgtgttg agcatataag aaacccttag tatgtatttg    4920
tatttgtaaa atacttctat caataaaatt tctaatccta aaaccaaaat cccgcgcgcg    4980
cctcgaggcg atcgcagatc tcattatacc gttagaagca tagttaaaat ctaaagcttg    5040
tcgttaattc tagtcatttt acattgttgg gttctacatt attaatgaat tttctaatgc    5100
aaatacagaa tttaaatcaa aattgttgaa ttatgctaaa catgtaacat acgtatatct    5160
ccgccttgtg tgttgtatta acttgaagtt atcataagaa ccacaaatac actagtaaat    5220
ctatgagaag gcaggtggca acacaaacaa gagtatctaa gattttcatt tgtgactata    5280
ggaatataat atctcttatc tgatttaatg aatccacatg ttcacttctc atttgtccac    5340
aagatcacaa ctttatcttc aatattcaca acttgttata tccaccacaa tttcattctt    5400
ttcacttagc cccacaaaat actttgtccc cttatttgcc accttttgta tttaatttat    5460
tcttgtggag ctaagtgttc atattattct tcttctcaaa aaaacaaaaa caaaaaaaaa    5520
gagaagaaaa ccatggcgag gatctcgtgt gacttgagat ttcttctcat cccggcagct    5580
ttcatgttca tctacatcca gatgaggctt ttccagacgc aatcacagta tgcagatcgc    5640
ctcagttccg ctatcgaatc tgagaaccat tgcactagtc aaatgcgagg cctcatagat    5700
gaagttagca tcaaacagtc gcggattgtt gccctcgaag atatgaagaa ccgccaggac    5760
gaagaacttg tgcagcttaa ggatctaatc cagacgtttg aaaaaaaagg aatagcaaaa    5820
ctcactcaag gtggagccat ggctctaagg ttgcatagaa ggaaccattt ttcgcctaga    5880
aatacggatc tgttcccgga tttggcaaaa gatcgtgtgg ttatcgtctt gtatgtgcat    5940
aatcgggctc agtattttcg agtcacagtg gaaagtttgt cgaaggttaa aggtataagt    6000
gagacattgt tgattgttag tcatgatggt tactttgaag agatgaatag gattgtggag    6060
agtattaagt tttgtcaagt gaaacagatt ttctcgcctt attcgcctca tatatatcgt    6120
actagcttcc cgggtgtgac cctgaatgat tgtaagaaca agggtgatga ggcaaagggg    6180
cattgtgaag gtaatcctga tcagtatggg aatcatcggt ctccgaagat tgtatctttg    6240
aagcatcact ggtggtggat gatgaacact gtatgggatg ggttggaaga gactaaagga    6300
catgaggggc atatcctttt cattgaagaa gatcattttc tgtttcctaa tgcctatcgt    6360
aacatacaga ctcttacgag gctgaaaccc gcaaagtgtc ctgactgttt tgctgctaat    6420
ttagcaccgt ctgatgtgaa gtcaagagga gaagggcttg aaagtttggt tgcagagaga    6480
atgggaaatg ttgggtattc ttttaataga agtgtgtggg agaatattca tcagaaggca    6540
agagagtttt gtttctttga tgattacaac tgggatataa cgatgtgggc aacggttttc    6600
ccgtcgtttg gttccccggt gtacacattg cgagggccta ggactagtgc ggtacacttt    6660
ggaaaatgtg ggttgcatca aggtagagga gatgagggtg attgcatcga taatggggtc    6720
gtaaacatag aagttaagga aacagataaa gttgtgaaca taaaagaagg atggggagtt    6780
cgggtgtata agcatcaagc gggttataaa gccggtttcg aaggttgggg aggttggggc    6840
gatgataggg accgacattt atgtttggat tttgccacta tgtatcgtta cagcagtagc    6900
agtgcatctc catgaaacgg atccgctaga gtccgcaaaa atcaccagtc tctctctaca    6960
aatctatctc tctctatttt tctccagaat aatgtgtgag tagttcccag ataagggaat    7020
tagggttctt atagggtttc gctcatgtgt tgagcatata agaaaccctt agtatgtatt    7080
tgtatttgta aaatacttct atcaataaaa tttctaatcc taaaaccaaa atcccgcgag    7140
agacctctta attaa                                                     7155
<210>28
<211>4993
<212>DNA
<213>杂合体
<400>28
ggcgcgcctc gaggcgatcg cagatctaat ctaaccaatt acgatacgct ttgggtacac     60
ttgatttttg tttcagtggt tacatatatc ttgttttata tgctatcttt aaggatctgc     120
acaaagatta tttgttgatg ttcttgatgg ggctcagaag atttgatatg atacactcta     180
atctttagga gataccagcc aggattatat tcagtaagac aatcaaattt tacgtgttca     240
aactcgttat cttttcattc aaaggatgag ccagaatctt tatagaatga ttgcaatcga     300
gaatatgttc ggccgatatg cctttgttgg cttcaatatt ctacatatca cacaagaatc     360
gaccgtattg taccctcttt ccataaagga aaacacaata tgcagatgct tttttcccac     420
atgcagtaac atataggtat tcaaaaatgg ctaaaagaag ttggataaca aattgacaac     480
tatttccatt tctgttatat aaatttcaca acacacaaaa gcccgtaatc aagagtctgc     540
ccatgtacga aataacttct attatttggt attgggccta agcccagctc agagtacgtg     600
ggggtaccac atataggaag gtaacaaaat actgcaagat agccccataa cgtaccagcc     660
tctccttacc acgaagagat aagatataag acccaccctg ccacgtgtca catcgtcatg     720
gtggttaatg ataagggatt acatccttct atgtttgtgg acatgatgca tgtaatgtca     780
tgagccacag gatccaatgg ccacaggaac gtaagaatgt agatagattt gattttgtcc     840
gttagatagc aaacaacatt ataaaaggtg tgtatcaata ggaactaatt cactcattgg     900
attcatagaa gtccattcct cctaagtatc tagaaaccat ggcgaggatc tcgtgtgact     960
tgagatttct tctcatcccg gcagctttca tgttcatcta catccagatg aggcttttcc     1020
agacgcaatc acagtatgca gatcgcctca gttccgctat cgaatctgag aaccattgca     1080
ctagtcaaat gcgaggcctc atagatgaag ttagcatcaa acagtcgcgg attgttgccc     1140
tcgaagatat gaagaaccgc caggacgaag aacttgtgca gcttaaggat ctaatccaga     1200
cgtttgaaaa aaaaggaata gcaaaactca ctcaaggtgg agccatggat tccaattcag     1260
gcgccgtcgt tgatatcaca actaaagatc tatacgatag gattgagttt cttgatacag     1320
atggtggtcc atggaaacaa ggttggagag ttacgtataa agacgatgag tgggagaaag     1380
agaagctcaa aatcttcgtt gttcctcatt ctcataacga tcctggttgg aaattgactg     1440
tagaggagta ttatcagaga caatccagac atattcttga caccattgtt gagactttat     1500
ctaaggtatg acgaaagttt ttgcttttgg ttttaatatt ttaattctct cccatggtta     1560
tcccgtgaac aatcttaaat gtcttaaaat tctcatgacg tcattaaact ctataaccaa     1620
acttctttgc tgggttctgt ttttttttag tttcgtgatg aaacagagtt ctagaagttc     1680
gttcttttgg aaaatttgaa gtctttggag ctaaagtttg tttttttatt actgggtttt     1740
gagattgaag gatagctaga atcttatttg tgtgggggtt tgttttgaat atgtttaata     1800
ggattcaaga agaaagttta tatgggagga gatgtcatat ctggagagat ggtggagaga     1860
cgcttcacct aataaacaag aagctttgac taaattggtt aaggatgggc agctagagat     1920
tgttggaggt ggctgggtta tgaatgatga ggctaattca cattattttg ccataattga     1980
acagatagca gagggtaata tgtggctgaa tgacacaatt ggggttattc ctaagaattc     2040
ttgggctata gatccctttg gctattcatc aaccatggct tatcttctcc ggcgtatggg     2100
ttttgaaaac atgcttattc aaaggactca ttacgagctc aagaaagacc ttgcccagca     2160
taagaatctt gaatatattt ggcgtcagag ctgggatgct atggaaacca cagatatctt     2220
tgttcatatg atgccgtttt attcatacga tatcccacac acttgtggac cagagcctgc     2280
aatttgctgt cagtttgatt tcgctcggat gcggggattt aagtatgaac tttgtccatg     2340
gggaaagcac ccagtggaga ccacactaga aaatgtgcag gagagggcat taaagcttct     2400
ggatcaatac aggaaaaaat ccactctata tcgaactaat acacttctta tacctcttgg     2460
agatgatttt aggtacatta gtatcgatga agccgaggct cagttccgta actaccagat     2520
gttgtttgat cacatcaact ctaatcctag tctaaacgca gaagcaaagt ttggtacttt     2580
ggaggattat ttcagaacag tccgagaaga agcagacaga gtgaattatt ctcgtcctgg     2640
tgaggttggc tctggtcagg ttgttggttt cccttctctg tcaggtgact tctttacata     2700
tgcagatagg caacaagact attggagtgg ttattatgtt tcaagacctt tcttcaaagc     2760
tgttgatcgt gtgctcgagc atacccttcg tggagctgag atcatgatgt catttctgct     2820
aggttattgc catcgaattc aatgtgagaa atttccaaca agttttacgt ataagttgac     2880
tgctgcaaga agaaatctgg ctcttttcca gcaccatgat ggggtaactg gaactgctaa     2940
ggattatgtg gtacaagatt acggcacccg gatgcatact tcattgcaag accttcagat     3000
ctttatgtct aaagcaatcg aagttcttct tgggatccgc cacgagaaag aaaaatctga     3060
tcaatcccca tcatttttcg aggcagagca aatgagatca aagtatgatg ctcggccagt     3120
tcacaagcca attgctgccc gggaaggaaa ttcgcacaca gttatactct tcaatccatc     3180
agaacagacg agagaggagg tggtgacggt tgttgttaac cgcgctgaaa tctcggtttt     3240
ggactcaaac tggacttgtg tccctagcca aatttctcct gaagtgcagc atgacgatac     3300
caaactattc accggcagac atcgccttta ctggaaagct tccatcccag ctcttggtct     3360
gagaacatat ttcattgcta atgggaatgt cgagtgtgag aaagctactc cgtctaaact     3420
caaatacgct tctgagtttg acccatttcc ttgtcctcct ccatattcct gctccaaact     3480
ggacaacgac gttactgaga tccgaaatga acatcagact cttgtgtttg atgtgaagaa     3540
cggatcactg cggaagatag tccatagaaa cggatcagag actgttgtgg gagaagagat     3600
aggtatgtac tctagtccag agagtggagc ttacctgttc aaaccagatg gtgaagctca     3660
gccaattgtt caacctgatg gacatgtagt cacctctgag ggtctgctgg ttcaagaagt     3720
cttctcttac cctaaaacca aatgggagaa atcacccctc tctcagaaaa ctcgtcttta     3780
cactggaggt aatacgcttc aggatcaagt ggtcgagata gaatatcatg ttgagcttct     3840
tggtaatgat tttgatgacc gggaattgat tgtccggtac aagactgatg ttgacaacaa     3900
gaaggtcttc tattcagatc tcaatggttt ccaaatgagc aggagagaaa cttatgataa     3960
gatccctctt caaggaaact actacccaat gccatctctc gcatttatcc aaggatccaa     4020
tggtcagaga ttctccgtgc actctcgtca atctctcggt gttgcaagcc tcaaagaggg     4080
ttggttggag attatgctgg acagacggtt ggttcgtgat gacggacggg gtctagggca    4140
aggtgtgatg gataaccgcg caatgaccgt ggtatttcac cttcttgcgg aatctaacat    4200
ttctcaagca gaccctgctt ccaacactaa cccgaggaac ccttcgcttc tctctcacct    4260
cataggtgct cacttaaact accccataaa cacattcatt gccaagaaac cgcaagacat    4320
atctgtgcgt gttccacaat acggttcctt tgctccttta gccaaaccgt taccatgtga    4380
cctccacatt gtaaatttca aggttcctcg tccatccaaa tactctcagc aattggaaga    4440
agacaagcca aggttcgctc ttatcctcaa tagacgagct tgggattcag cttattgcca    4500
taaaggaaga caagtaaact gcacaagcat ggctaatgaa ccagtaaact tttccgacat    4560
gttcaaagat cttgcagctt caaaggtaaa accaacttca ctgaatctct tgcaagaaga    4620
tatggagatt cttgggtacg atgaccaaga gctacctcga gatagttcac agccacggga    4680
aggacgtgtc tcgatctctc ccatggaaat acgagcttat aagcttgaac tgcgacctca    4740
caagtgaacc tgctgaagat ccgctagagt ccgcaaaaat caccagtctc tctctacaaa    4800
tctatctctc tctatttttc tccagaataa tgtgtgagta gttcccagat aagggaatta    4860
gggttcttat agggtttcgc tcatgtgttg agcatataag aaacccttag tatgtatttg    4920
tatttgtaaa atacttctat caataaaatt tctaatccta aaaccaaaat cccgcgagag    4980
acctcttaat taa                                                       4993
<210>29
<211>3825
<212>DNA
<213>杂合体
<400>29
ccatggcgag gatctcgtgt gacttgagat ttcttctcat cccggcagct ttcatgttca    60
tctacatcca gatgaggctt ttccagacgc aatcacagta tgcagatcgc ctcagttccg    120
ctatcgaatc tgagaaccat tgcactagtc aaatgcgagg cctcatagat gaagttagca    180
tcaaacagtc gcggattgtt gccctcgaag atatgaagaa ccgccaggac gaagaacttg    240
tgcagcttaa ggatctaatc cagacgtttg aaaaaaaagg aatagcaaaa ctcactcaag    300
gtggagccat ggattccaat tcaggcgccg tcgttgatat cacaactaaa gatctatacg    360
ataggattga gtttcttgat acagatggtg gtccatggaa acaaggttgg agagttacgt    420
ataaagacga tgagtgggag aaagagaagc tcaaaatctt cgttgttcct cattctcata    480
acgatcctgg ttggaaattg actgtagagg agtattatca gagacaatcc agacatattc    540
ttgacaccat tgttgagact ttatctaagg tatgacgaaa gtttttgctt ttggttttaa    600
tattttaatt ctctcccatg gttatcccgt gaacaatctt aaatgtctta aaattctcat    660
gacgtcatta aactctataa ccaaacttct ttgctgggtt ctgttttttt ttagtttcgt    720
gatgaaacag agttctagaa gttcgttctt ttggaaaatt tgaagtcttt ggagctaaag    780
tttgtttttt tattactggg ttttgagatt gaaggatagc tagaatctta tttgtgtggg    840
ggtttgtttt gaatatgttt aataggattc aagaagaaag tttatatggg aggagatgtc    900
atatctggag agatggtgga gagacgcttc acctaataaa caagaagctt tgactaaatt    960
ggttaaggat gggcagctag agattgttgg aggtggctgg gttatgaatg atgaggctaa    1020
ttcacattat tttgccataa ttgaacagat agcagagggt aatatgtggc tgaatgacac    1080
aattggggtt attcctaaga attcttgggc tatagatccc tttggctatt catcaaccat    1140
ggcttatctt ctccggcgta tgggttttga aaacatgctt attcaaagga ctcattacga    1200
gctcaagaaa gaccttgccc agcataagaa tcttgaatat atttggcgtc agagctggga    1260
tgctatggaa accacagata tctttgttca tatgatgccg ttttattcat acgatatccc    1320
acacacttgt ggaccagagc ctgcaatttg ctgtcagttt gatttcgctc ggatgcgggg    1380
atttaagtat gaactttgtc catggggaaa gcacccagtg gagaccacac tagaaaatgt    1440
gcaggagagg gcattaaagc ttctggatca atacaggaaa aaatccactc tatatcgaac    1500
taatacactt cttatacctc ttggagatga ttttaggtac attagtatcg atgaagccga    1560
ggctcagttc cgtaactacc agatgttgtt tgatcacatc aactctaatc ctagtctaaa    1620
cgcagaagca aagtttggta ctttggagga ttatttcaga acagtccgag aagaagcaga    1680
cagagtgaat tattctcgtc ctggtgaggt tggctctggt caggttgttg gtttcccttc    1740
tctgtcaggt gacttcttta catatgcaga taggcaacaa gactattgga gtggttatta    1800
tgtttcaaga cctttcttca aagctgttga tcgtgtgctc gagcataccc ttcgtggagc    1860
tgagatcatg atgtcatttc tgctaggtta ttgccatcgaattcaatgtg agaaatttcc     1920
aacaagtttt acgtataagt tgactgctgc aagaagaaat ctggctcttt tccagcacca    1980
tgatggggta actggaactg ctaaggatta tgtggtacaa gattacggca cccggatgca    2040
tacttcattg caagaccttc agatctttat gtctaaagca atcgaagttc ttcttgggat    2100
ccgccacgag aaagaaaaat ctgatcaatc cccatcattt ttcgaggcag agcaaatgag    2160
atcaaagtat gatgctcggc cagttcacaa gccaattgct gcccgggaag gaaattcgca    2220
cacagttata ctcttcaatc catcagaaca gacgagagag gaggtggtga cggttgttgt    2280
taaccgcgct gaaatctcgg ttttggactc aaactggact tgtgtcccta gccaaatttc    2340
tcctgaagtg cagcatgacg ataccaaact attcaccggc agacatcgcc tttactggaa    2400
agcttccatc ccagctcttg gtctgagaac atatttcatt gctaatggga atgtcgagtg    2460
tgagaaagct actccgtcta aactcaaata cgcttctgag tttgacccat ttccttgtcc    2520
tcctccatat tcctgctcca aactggacaa cgacgttact gagatccgaa atgaacatca    2580
gactcttgtg tttgatgtga agaacggatc actgcggaag atagtccata gaaacggatc    2640
agagactgtt gtgggagaag agataggtat gtactctagt ccagagagtg gagcttacct    2700
gttcaaacca gatggtgaag ctcagccaat tgttcaacct gatggacatg tagtcacctc    2760
tgagggtctg ctggttcaag aagtcttctc ttaccctaaa accaaatggg agaaatcacc    2820
cctctctcag aaaactcgtc tttacactgg aggtaatacg cttcaggatc aagtggtcga    2880
gatagaatat catgttgagc ttcttggtaa tgattttgat gaccgggaat tgattgtccg    2940
gtacaagact gatgttgaca acaagaaggt cttctattca gatctcaatg gtttccaaat    3000
gagcaggaga gaaacttatg ataagatccc tcttcaagga aactactacc caatgccatc    3060
tctcgcattt atccaaggat ccaatggtca gagattctcc gtgcactctc gtcaatctct    3120
cggtgttgca agcctcaaag agggttggtt ggagattatg ctggacagac ggttggttcg    3180
tgatgacgga cggggtctag ggcaaggtgt gatggataac cgcgcaatga ccgtggtatt    3240
tcaccttctt gcggaatcta acatttctca agcagaccct gcttccaaca ctaacccgag    3300
gaacccttcg cttctctctc acctcatagg tgctcactta aactacccca taaacacatt    3360
cattgccaag aaaccgcaag acatatctgt gcgtgttcca caatacggtt cctttgctcc    3420
tttagccaaa ccgttaccat gtgacctcca cattgtaaat ttcaaggttc ctcgtccatc    3480
caaatactct cagcaattgg aagaagacaa gccaaggttc gctcttatcc tcaatagacg    3540
agcttgggat tcagcttatt gccataaagg aagacaagta aactgcacaa gcatggctaa    3600
tgaaccagta aacttttccg acatgttcaa agatcttgca gcttcaaagg taaaaccaac    3660
ttcactgaat ctcttgcaag aagatatgga gattcttggg tacgatgacc aagagctacc    3720
tcgagatagt tcacagccac gggaaggacg tgtctcgatc tctcccatgg aaatacgagc    3780
ttataagctt gaactgcgac ctcacaagtg aacctgctga agatc                    3825
<210>30
<211>2181
<212>DNA
<213>杂合体
<400>30
ggcgcgcctc gaggcgatcg cagatctcat tataccgtta gaagcatagt taaaatctaa    60
agcttgtcgt taattctagt cattttacat tgttgggttc tacattatta atgaattttc    120
taatgcaaat acagaattta aatcaaaatt gttgaattat gctaaacatg taacatacgt    180
atatctccgc cttgtgtgtt gtattaactt gaagttatca taagaaccac aaatacacta    240
gtaaatctat gagaaggcag gtggcaacac aaacaagagt atctaagatt ttcatttgtg    300
actataggaa tataatatct cttatctgat ttaatgaatc cacatgttca cttctcattt    360
gtccacaaga tcacaacttt atcttcaata ttcacaactt gttatatcca ccacaatttc    420
attcttttca cttagcccca caaaatactt tgtcccctta tttgccacct tttgtattta    480
atttattctt gtggagctaa gtgttcatat tattcttctt ctcaaaaaaa caaaaacaaa    540
aaaaaagaga agaaaaccat ggcgaggatc tcgtgtgact tgagatttct tctcatcccg    600
gcagctttca tgttcatcta catccagatg aggcttttcc agacgcaatc acagtatgca    660
gatcgcctca gttccgctat cgaatctgag aaccattgca ctagtcaaat gcgaggcctc    720
atagatgaag ttagcatcaa acagtcgcgg attgttgccc tcgaagatat gaagaaccgc    780
caggacgaag aacttgtgca gcttaaggat ctaatccaga cgtttgaaaa aaaaggaata    840
gcaaaactca ctcaaggtgg agccatggct ctaaggttgc atagaaggaa ccatttttcg    900
cctagaaata cggatctgtt cccggatttg gcaaaagatc gtgtggttat cgtcttgtat    960
gtgcataatc gggctcagta ttttcgagtc acagtggaaa gtttgtcgaa ggttaaaggt    1020
ataagtgaga cattgttgat tgttagtcat gatggttact ttgaagagat gaataggatt    l080
gtggagagta ttaagttttg tcaagtgaaa cagattttct cgccttattc gcctcatata    1140
tatcgtacta gcttcccggg tgtgaccctg aatgattgta agaacaaggg tgatgaggca    1200
aaggggcatt gtgaaggtaa tcctgatcag tatgggaatc atcggtctcc gaagattgta    1260
tctttgaagc atcactggtg gtggatgatg aacactgtat gggatgggtt ggaagagact    1320
aaaggacatg aggggcatat ccttttcatt gaagaagatc attttctgtt tcctaatgcc    1380
tatcgtaaca tacagactct tacgaggctg aaacccgcaa agtgtcctga ctgttttgct    14440
gctaatttag caccgtctga tgtgaagtca agaggagaag ggcttgaaag tttggttgca    1500
gagagaatgg gaaatgttgg gtattctttt aatagaagtg tgtgggagaa tattcatcag    1560
aaggcaagag agttttgttt ctttgatgat tacaactggg atataacgat gtgggcaacg    1620
gttttcccgt cgtttggttc cccggtgtac acattgcgag ggcctaggac tagtgcggta    1680
cactttggaa aatgtgggtt gcatcaaggt agaggagatg agggtgattg catcgataat    1740
ggggtcgtaa acatagaagt taaggaaaca gataaagttg tgaacataaa agaaggatgg    1800
ggagttcggg tgtataagca tcaagcgggt tataaagccg gtttcgaagg ttggggaggt    1860
tggggcgatg atagggaccg acatttatgt ttggattttg ccactatgta tcgttacagc    1920
agtagcagtg catctccatg aaacggatcc gctagagtcc gcaaaaatca ccagtctctc    1980
tctacaaatc tatctctctc tatttttctc cagaataatg tgtgagtagt tcccagataa    2040
gggaattagg gttcttatag ggtttcgctc atgtgttgag catataagaa acccttagta    2100
tgtatttgta tttgtaaaat acttctatca ataaaatttc taatcctaaa accaaaatcc    2160
cgcgagagac ctcttaatta a                                              2181
<210>31
<211>1394
<212>DNA
<213>杂合体
<400>31
ccatggcgag gatctcgtgt gacttgagat ttcttctcat cccggcagct ttcatgttca     60
tctacatca  gatgaggctt ttccagacgc aatcacagta tgcagatcgc ctcagttccg     120
ctatcgaatc tgagaaccat tgcactagtc aaatgcgagg cctcatagat gaagttagca     180
tcaaacagtc gcggattgtt gccctcgaag atatgaagaa ccgccaggac gaagaacttg     240
tgcagcttaa ggatctaatc cagacgtttg aaaaaaaagg aatagcaaaa ctcactcaag     300
gtggagccat ggctctaagg ttgcatagaa ggaaccattt ttcgcctaga aatacggatc     360
tgttcccgga tttggcaaaa gatcgtgtgg ttatcgtctt gtatgtgcat aatcgggctc     420
agtattttcg agtcacagtg gaaagtttgt cgaaggttaa aggtataagt gagacattgt     480
tgattgttag tcatgatggt tactttgaag agatgaatag gattgtggag agtattaagt     540
tttgtcaagt gaaacagatt ttctcgcctt attcgcctca tatatatcgt actagcttcc     600
cgggtgtgac cctgaatgat tgtaagaaca agggtgatga ggcaaagggg cattgtgaag     660
gtaatcctga tcagtatggg aatcatcggt ctccgaagat tgtatctttg aagcatcact     720
ggtggtggat gatgaacact gtatgggatg ggttggaaga gactaaagga catgaggggc     780
atatcctttt cattgaagaa gatcattttc tgtttcctaa tgcctatcgt aacatacaga     840
ctcttacgag gctgaaaccc gcaaagtgtc ctgactgttt tgctgctaat ttagcaccgt     900
ctgatgtgaa gtcaagagga gaagggcttg aaagtttggt tgcagagaga atgggaaatg     960
ttgggtattc ttttaataga agtgtgtggg agaatattca tcagaaggca agagagtttt     1020
gtttctttga tgattacaac tgggatataa cgatgtgggc aacggttttc ccgtcgtttg     1080
gttccccggt gtacacattg cgagggccta ggactagtgc ggtacacttt ggaaaatgtg     1140
ggttgcatca aggtagagga gatgagggtg attgcatcga taatggggtc gtaaacacag     1200
aagttaagga aacagataaa gttgtgaaca taaaagaagg atggggagtt cgggtgtata     1260
agcatcaagc gggttataaa gccggtttcg aaggttgggg aggttggggc gatgataggg     1320
accgacattt atgtttggat tttgccacta tgtatcgtta cagcagtagc agtgcatctc     1380
catgaaacgg atcc                                                                      1394
<210>32
<211>312
<212>DNA
<213>拟南芥
<400>32
ccatggcgag gatctcgtgt gacttgagat ttcttctcat cccggcagct ttcatgttca     60
tctacatcca gatgaggctt ttccagacgc aatcacagta tgcagatcgc ctcagttccg     120
ctatcgaatc tgagaaccat tgcactagtc aaatgcgagg cctcatagat gaagttagca     180
tcaaacagtc gcggattgtt gccctcgaag atatgaagaa ccgccaggac gaagaacttg     240
tgcagcttaa ggatctaatc cagacgtttg aaaaaaaagg aatagcaaaa ctcactcaag     300
gtggǎgccat gg                                                        312
<210>33
<211>276
<212>DNA
<213>Glycine max
<400>33
ccatggcgag agggagcaga tcagtgggta gcagcagcag caaatggagg tactgcaacc     60
cttcctatta cttgaagcgc ccaaagcgtc ttgctctgct cttcatcgtt ttcgtttgtg     120
tctctttcgt tttctgggac cgtcaaactc tcgtcagaga gcaccaggtt gaaatttctg     180
agctgcagaa agaagtgact gatttgaaaa atttggtgga tgatttaaat aacaaacaag     240
gtggtacctc tgggaaaact gacttgggga ccatgg                               276
<210>34
<211>9240
<212>DNA
<213>杂合体
<400>34
ggcgcgcctc gaggcgatcg cagatccgat ataacaaaat ttgaatcgca cagatcgatc     60
tctttggaga ttctatacct agaaaatgga gacgattttc aaatctctgt aaaaattctg     120
gtttcttctt gacggaagaa gacgacgact ccaatatttc ggttagtact gaaccggaaa     180
gtttgactgg tgcaaccaat ttaatgtacc gtacgtaacg caccaatcgg attttgtatt     240
caatgggcct tatctgtgag cccattaatt gatgtgacgg cctaaactaa atccgaacgg     300
tttatttcag cgatccgcga cggtttgtat tcagccaata gcaatcaatt atgtagcagt     360
ggtgatcctc gtcaaaccag taaagctaga tctggaccgt tgaattggtg caagaaagca     420
catgttgtga tatttttacc cgtacgatta gaaaacttga gaaacacatt gataatcgat     480
aaaaaccgtc cgatcatata aatccgcttt accatcgttg cctataaatt aatatcaata     540
gccgtacacg cgtgaagact gacaatatta tctttttcga attcggagct caagtttgaa     600
attcggagaa gctagagagt tttctgataa ccatggcgag agggagcaga tcagtgggta     660
gcagcagcag caaatggagg tactgcaacc cttcctatta cttgaagcgc ccaaagcgtc     720
ttgctctgct cttcatcgtt ttcgtttgtg tctctttcgt tttctgggac cgtcaaactc     780
tcgtcagaga gcaccaggtt gaaatttctg agctgcagaa agaagtgact gatttgaaaa     840
atttggtgga tgatttaaat aacaaacaag gtggtacctc tgggaaaact gacttgggga     900
ccatgggaca gatgcctgtg gctgctgtag tggttatggc ctgcagtcgt gcagactatc     960
ttgaaaggac tgttaaatca gttttaacat atcaaactcc cgttgcttca aaatatcctc     1020
tatttatatc tcaggatgga tctgatcaag ctgtcaagag caagtcattg agctataatc     1080
aattaacata tatgcagcac ttggattttg aaccagtggt cactgaaagg cctggcgaac     1140
tgactgcgta ctacaagatt gcacgtcact acaagtgggc actggaccag ttgttttaca     1200
aacacaaatt tagtcgagtg attatactag aagatgatat ggaaattgct ccagacttct     1260
ttgattactt tgaggctgca gctagtctca tggataggga taaaaccatt atggctgctt     1320
catcatggaa tgataatgga cagaagcagt ttgtgcatga tccctatgcg ctataccgat     1380
cagatttttt tcctggcctt gggtggatgc tcaagagatc gacttgggat gagttatcac     1440
caaagtggcc aaaggcttac tgggatgatt ggctgagact aaaggaaaac cataaaggcc     1500
gccaattcat tcgaccggaa gtctgtagaa catacaattt tggtgaacat gggtctagtt     1560
tgggacagtt tttcagtcag tatctggaac ctataaagct aaacgatgtg acggttgact     1620
ggaaagcaaa ggacctggga tacctgacag agggaaacta taccaagtac ttttctggct     1680
tagtgagaca agcacgacca attcaaggtt ctgaccttgt cttaaaggct caaaacataa     1740
aggatgatgt tcgtatccgg tataaagacc aagtagagtt tgaacgcatt gcaggggaat     1800
ttggtatatt tgaagaatgg aaggatggtg tgcctcgaac agcatataaa ggagtagtgg     1860
tgtttcgaat ccagacaaca agacgtgtat tcctggttgg gccagattct gtaatgcagc     1920
ttggaattcg aaattcctga tgcggatccg ctagagtccg caaaaatcac cagtctctct     1980
ctacaaatct atctctctct atttttctcc agaataatgt gtgagtagtt cccagataag     2040
ggaattaggg ttcttatagg gtttcgctca tgtgttgagc atataagaaa cccttagtat     2100
gtatttgtat ttgtaaaata cttctatcaa taaaatttct aatcctaaaa ccaaaatccc     2160
gcgcctcgag gcgatcgcag atctaatcta accaattacg atacgctttg ggtacacttg     2220
atttttgttt cagtggttac atatatcttg ttttatatgc tatctttaag gatctgcaca     2280
aagattattt gttgatgttc ttgatggggc tcagaagatt tgatatgata cactctaatc     2340
tttaggagat accagccagg attatattca gtaagacaat caaattttac gtgttcaaac     2400
tcgttatctt ttcattcaaa ggatgagcca gaatctttat agaatgattg caatcgagaa     2460
tatgttcggc cgatatgcct ttgttggctt caatattcta catatcacac aagaatcgac     2520
cgtattgtac cctctttcca taaaggaaaa cacaatatgc agatgctttt ttcccacatg     2580
cagtaacata taggtattca aaaatggcta aaagaagttg gataacaaat tgacaactat     2640
ttccatttct gttatataaa tttcacaaca cacaaaagcc cgtaatcaag agtctgccca     2700
tgtacgaaat aacttctatt atttggtatt gggcctaagc ccagctcaga gtacgtgggg     2760
gtaccacata taggaaggta acaaaatact gcaagatagc cccataacgt accagcctct     2820
ccttaccacg aagagataag atataagacc caccctgcca cgtgtcacat cgtcatggtg     2880
gttaatgata agggattaca tccttctatg tttgtggaca tgatgcatgt aatgtcatga     2940
gccacaggat ccaatggcca caggaacgta agaatgtaga tagatttgat tttgtccgtt     3000
agatagcaaa caacattata aaaggtgtgt atcaatagga actaattcac tcattggatt     3060
catagaagtc cattcctcct aagtatctag aaaccatggc gagagggagc agatcagtgg     3120
gtagcagcag cagcaaatgg aggtactgca acccttccta ttacttgaag cgcccaaagc     3180
gtcttgctct gctcttcatc gttttcgttt gtgtctcttt cgttttctgg gaccgtcaaa     3240
ctctcgtcag agagcaccag gttgaaattt ctgagctgca gaaagaagtg actgatttga     3300
aaaatttggt ggatgattta aataacaaac aaggtggtac ctctgggaaa actgacttgg     3360
ggaccatgga ttccaattca ggcgccgtcg ttgatatcac aactaaagat ctatacgata     3420
ggattgagtt tcttgataca gatggtggtc catggaaaca aggttggaga gttacgtata     3480
aagacgatga gtgggagaaa gagaagctca aaatcttcgt tgttcctcat tctcataacg     3540
atcctggttg gaaattgact gtagaggagt attatcagag acaatccaga catattcttg     3600
acaccattgt tgagacttta tctaaggtat gacgaaagtt tttgcttttg gttttaatat     3660
tttaattctc tcccatggtt atcccgtgaa caatcttaaa tgtcttaaaa ttctcatgac     3720
gtcattaaac tctataacca aacttctttg ctgggttctg ttttttttta gtttcgtgat     3780
gaaacagagt tctagaagtt cgttcttttg gaaaatttga agtctttgga gctaaagttt     3840
gtttttttat tactgggttt tgagattgaa ggatagctag aatcttattt gtgtgggggt     3900
ttgttttgaa tatgtttaat aggattcaag aagaaagttt atatgggagg agatgtcata     3960
tctggagaga tggtggagag acgcttcacc taataaacaa gaagctttga ctaaattggt     4020
taaggatggg cagctagaga ttgttggagg tggctgggtt atgaatgatg aggctaattc     4080
acattatttt gccataattg aacagatagc agagggtaat atgtggctga atgacacaat     4140
tggggttatt cctaagaatt cttgggctat agatcccttt ggctattcat caaccatggc     4200
ttatcttctc cggcgtatgg gttttgaaaa catgcttatt caaaggactc attacgagct     4260
caagaaagac cttgcccagc ataagaatct tgaatatatt tggcgtcaga gctgggatgc     4320
tatggaaacc acagatatct ttgttcatat gatgccgttt tattcatacg atatcccaca    4380
cacttgtgga ccagagcctg caatttgctg tcagtttgat ttcgctcgga tgcggggatt    4440
taagtatgaa ctttgtccat ggggaaagca cccagtggag accacactag aaaatgtgca    4500
ggagagggca ttaaagcttc tggatcaata caggaaaaaa tccactctat atcgaactaa    4560
tacacttctt atacctcttg gagatgattt taggtacatt agtatcgatg aagccgaggc    4620
tcagttccgt aactaccaga tgttgtttga tcacatcaac tctaatccta gtctaaacgc    4680
agaagcaaag tttggtactt tggaggatta tttcagaaca gtccgagaag aagcagacag    4740
agtgaattat tctcgtcctg gtgaggttgg ctctggtcag gttgttggtt tcccttctct    4800
gtcaggtgac ttctttacat atgcagatag gcaacaagac tattggagtg gttattatgt    4860
ttcaagacct ttcttcaaag ctgttgatcg tgtgctcgag catacccttc gtggagctga    4920
gatcatgatg tcatttctgc taggttattg ccatcgaatt caatgtgaga aatttccaac    4980
aagttttacg tataagttga ctgctgcaag aagaaatctg gctcttttcc agcaccatga    5040
tggggtaact ggaactgcta aggattatgt ggtacaagat tacggcaccc ggatgcatac    5100
ttcattgcaa gaccttcaga tctttatgtc taaagcaatc gaagttcttc ttgggatccg    5160
ccacgagaaa gaaaaatctg atcaatcccc atcatttttc gaggcagagc aaatgagatc    5220
aaagtatgat gctcggccag ttcacaagcc aattgctgcc cgggaaggaa attcgcacac    5280
agttatactc ttcaatccat cagaacagac gagagaggag gtggtgacgg ttgttgttaa    5340
ccgcgctgaa atctcggttt tggactcaaa ctggacttgt gtccctagcc aaatttctcc    5400
tgaagtgcag catgacgata ccaaactatt caccggcaga catcgtcttt actggaaagc    5460
ttccatccca gctcttggtc tgagaacata tttcattgct aatgggaatg tcgagtgtga    5520
gaaagctact ccgtctaaac tcaaatacgc ttctgagttt gacccatttc cttgtcctcc    5580
tccatattcc tgctccaaac tggacaacga cgttactgag atccgaaatg aacatcagac    5640
tcttgtgttt gatgtgaaga acggatcact gcggaagata gtccatagaa acggatcaga    5700
gactgttgtg ggagaagaga taggtatgta ctctagtcca gagagtggag cttacctgtt    5760
caaaccagat ggtgaagctc agccaattgt tcaacctgat ggacatgtag tcacctctga    5820
gggtctgctg gttcaagaag tcttctctta ccctaaaacc aaatgggaga aatcacccct    5880
ctctcagaaa actcgtcttt acactggagg taatacgctt caggatcaag tggtcgagat    5940
agaatatcat gttgagcttc ttggtaatga ttttgatgac cgggaattga ttgtccggta    6000
caagactgat gttgacaaca agaaggtctt ctattcagat ctcaatggtt tccaaatgag    6060
caggagagaa acttatgata agatccctct tcaaggaaac tactacccaa tgccatctct    6120
cgcatttatc caaggatcca atggtcagag attctccgtg cactctcgtc aatctctcgg    6180
tgttgcaagc ctcaaagagg gttggttgga gattatgctg gacagacggt tggttcgtga    6240
tgacggacgg ggtctagggc aaggtgtgat ggataaccgc gcaatgaccg tggtattaaa    6300
ccttcttgcg gaatctaaca tttctcaagc agaccctgct tccaacacta acccgagaaa    6360
cccttcgctt ctctctcacc tcataggtgc tcacttaaac taccccataa acacattaat    6420
tgccaagaaa ccgcaagaca tatctgtgcg tgttccacaa tacggttcct ttgctccact    6480
agccaaaccg ttaccatgtg acctccacat tgtaaatttc aaggttcctc gtccatccaa    6540
atactctcag caattggaag aagacaagcc aaggttcgct cttatcctca atagacgagc    6600
ttgggattca gcttattgcc ataaaggaag acaagtaaac tgcacaagca tggctaatga    6660
accagtaaac ttttccgaca tgttcaaaga tcttgcagct tcaaaggtaa aaccaacttc    6720
actgaatctc ttgcaagaag atatggagat tcttgggtac gatgaccaag agctacctcg    6780
agatagttca cagccacggg aaggacgtgt ctcgatctct cccatggaaa tacgagctta    6840
taagcttgaa ctgcgacctc acaagtgaac ctgctgaaga tccgctagag tccgcaaaaa    6900
tcaccagtct ctctctacaa atctatttct ctctattttt ctccagaata atgtgtgagt    6960
agttcccaga taagggaatt agggttctta tagggtttcg ctcatgtgtt gagcatataa    7020
gaaaccctta gtatgtattt gtatttgtaa aatacttcta tcaataaaat ttctaatcct    7080
aaaaccaaaa tcccgcgcgc gcctcgaggc gatcgcagat ctcattatac cgttagaagc    7140
atagttaaaa tctaaagctt gtcgttaatt ctagtcattt tacattgttg ggttctacat    7200
tattaatgaa ttttctaatg caaatacaga atttaaatca aaattgttga attatgctaa    7260
acatgtaaca tacgtatatc tccgccttgt gtgttgtatt aacttgaagt tatcataaga    7320
accacaaata cactagtaaa tctatgagaa ggcaggtggc aacacaaaca agagtatcta    7380
agattttcat ttgtgactat aggaatataa tatctcttat ctgatttaat gaatccacat    7440
gttcacttct catttgtcca caagatcaca actttatctt caatattcac aacttgttat    7500
atccaccaca atttcattct tttcacttag ccccacaaaa tactttgtcc ccttatttgc    7560
caccttttgt atttaattta ttcttgtgga gctaagtgtt catattattc ttcttctcaa    7620
aaaaacaaaa acaaaaaaaa agagaagaaa accatggcga gagggagcag atcagtgggt    7680
agcagcagca gcaaatggag gtactgcaac ccttcctatt acttgaagcg cccaaagcgt    7740
cttgctctgc tcttcatcgt tttcgtttgt gtctctttcg ttttctggga ccgtcaaact    7800
ctcgtcagag agcaccaggt tgaaatttct gagctgcaga aagaagtgac tgatttgaaa    7860
aatttggtgg atgatttaaa taacaaacaa ggtggtacct ctgggaaaac tgacttgggg    7920
accatggctc taaggttgca tagaaggaac catttttcgc ctagaaatac ggatctgttc    7980
ccggatttgg caaaagatcg tgtggttatc gtcttgtatg tgcataatcg ggctcagtat    8040
tttcgagtca cagtggaaag tttgtcgaag gttaaaggta taagtgagac attgttgatt    8100
gttagtcatg atggttactt tgaagagatg aataggattg tggagagtat taagttttgt    8160
caagtgaaac agattttctc gccttattcg cctcatatat atcgtactag cttcccgggt    8220
gtgaccctga atgattgtaa gaacaagggt gatgaggcaa aggggcattg tgaaggtaat    8280
cctgatcagt atgggaatca tcggtctccg aagattgtat ctttgaagca tcactggtgg    8340
tggatgatga acactgtatg ggatgggttg gaagagacta aaggacatga ggggcatatc    8400
cttttcattg aagaagatca ttttctgttt cctaatgcct atcgtaacat  acagactctt    8460
acgaggctga aacccgcaaa gtgtcctgac tgttttgctg ctaatttagc  accgtctgat    8520
gtgaagtcaa gaggagaagg gcttgaaagt ttggttgcag agagaatggg  aaatgttggg    8580
tattctttta atagaagtgt gtgggagaat attcatcaga aggcaagaga  gttttgtttc    8640
tttgatgatt acaactggga tataacgatg tgggcaacgg ttttcccgtc  gtttggttcc    8700
ccggtgtaca cattgcgagg gcctaggact agtgcggtac actttggaaa  atgtgggttg    8760
catcaaggta gaggagatga gggtgattgc atcgataatg gggtcgtaaa  catagaagtt    8820
aaggaaacag ataaagttgt gaacataaaa gaaggatggg gagttcgggt  gtataagcat    8880
caagcgggtt ataaagccgg tttcgaaggt tggggaggtt ggggcgatga  tagggaccga    8940
catttatgtt tggattttgc cactatgtat cgttacagca gtagcagtgc  atctccatga    9000
aacggatccg ctagagtccg caaaaatcac cagtctctct ctacaaatct  atctctctct    9060
atttttctcc agaataatgt gtgagtagtt cccagataag ggaattaggg  ttcttatagg    9120
gtttcgctca tgtgttgagc atataagaaa cccttagtat gtatttgtat  ttgtaaaata    9180
cttctatcaa taaaatttct aatcctaaaa ccaaaatccc gcgagagacc  tcttaattaa    9240
<210>35
<211>2180
<212>DNA
<213>杂合体
<400>35
ggcgcgcctc gaggcgatcg cagatccgat ataacaaaat  ttgaatcgca cagatcgatc    60
tctttggaga ttctatacct agaaaatgga gacgattttc  aaatctctgt aaaaattctg    120
gtttcttctt gacggaagaa gacgacgact ccaatatttc  ggttagtact gaaccggaaa    180
gtttgactgg tgcaaccaat ttaatgtacc gtacgtaacg  caccaatcgg attttgtatt    240
caatgggcct tatctgtgag cccattaatt gatgtgacgg  cctaaactaa atccgaacgg    300
tttatttcag cgatccgcga cggtttgtat tcagccaata  gcaatcaatt atgtagcagt    360
ggtgatcctc gtcaaaccag taaagctaga tctggaccgt  tgaattggtg caagaaagca    420
catgttgtga tatttttacc cgtacgatta gaaaacttga  gaaacacatt gataatcgat    480
aaaaaccgtc cgatcatata aatccgcttt accatcgttg  cctataaatt aatatcaata    540
gccgtacacg cgtgaagact gacaatatta tctttttcga  attcggagct caagtttgaa    600
attcggagaa gctagagagt tttctgataa ccatggcgag  agggagcaga tcagtgggta    660
gcagcagcag caaatggagg tactgcaacc cttcctatta  cttgaagcgc ccaaagcgtc    720
ttgctctgct cttcatcgtt ttcgtttgtg tctctttcgt  tttctgggac cgtcaaactc    780
tcgtcagaga gcaccaggtt gaaatttctg agctgcagaa  agaagtgact gatttgaaaa    840
atttggtgga tgatttaaat aacaaacaag gtggtacctc  tgggaaaact gacttgggga    900
ccatgggaca gatgcctgtg gctgctgtag tggttatggc  ctgcagtcgt gcagactatc    960
ttgaaaggac tgttaaatca gttttaacat atcaaactcc  cgttgcttca aaatatcctc    1020
tatttatatc tcaggatgga tctgatcaag ctgtcaagag  caagtcattg agctataatc    1080
aattaacata tatgcagcac ttggattttg aaccagtggt  cactgaaagg cctggcgaac    1140
tgactgcgta ctacaagatt gcacgtcact acaagtgggc  actggaccag ttgttttaca    1200
aacacaaatt tagtcgagtg attatactag aagatgatat  ggaaattgct ccagacttct    1260
ttgattactt tgaggctgca gctagtctca tggataggga  taaaaccatt atggctgctt    1320
catcatggaa tgataatgga cagaagcagt ttgtgcatga  tccctatgcg ctataccgat    l380
cagatttttt tcctggcctt gggtggatgc tcaagagatc  gacttgggat gagttatcac    1440
caaagtggcc aaaggcttac tgggatgatt ggctgagact  aaaggaaaac cataaaggcc    l500
gccaattcat tcgaccggaa gtctgtagaa catacaattt  tggtgaacat gggtctagtt    1560
tgggacagtt tttcagtcag tatctggaac ctataaagct  aaacgatgtg acggttgact    1620
ggaaagcaaa ggacctggga tacctgacag agggaaacta  taccaagtac ttttctggct    1680
tagtgagaca agcacgacca attcaaggtt ctgaccttgt  cttaaaggct caaaacataa    1740
aggatgatgt tcgtatccgg tataaagacc aagtagagtt  tgaacgcatt gcaggggaat    1800
ttggtatatt tgaagaatgg aaggatggtg tgcctcgaac  agcatataaa ggagtagtgg    1860
tgtttcgaat ccagacaaca agacgtgtat tcctggttgg  gccagattct gtaatgcagc    1920
ttggaattcg aaattcctga tgcggatccg ctagagtccg  caaaaatcac cagtctctct    1980
ctacaaatct atctctctct atttttctcc agaataatgt  gtgagtagtt cccagataag    2040
ggaattaggg ttcttatagg gtttcgctca tgtgttgagc  atataagaaa cccttagtat    2100
gtatttgtat ttgtaaaata cttctatcaa taaaatttct  aatcctaaaa ccaaaatccc    2160
gcgagagacc tcttaattaa                                                 2180
<210>36
<211>615
<212>DNA
<213>拟南芥
<400>36
ggatccgata taacaaaatt tgaatcgcac agatcgatct ctttggagat tctataccta    60
gaaaatggag acgattttca aatctctgta aaaattctgg tttcttcttg acggaagaag    120
acgacgactc caatatttcg gttagtactg aaccggaaag tttgactggt gcaaccaatt    180
taatgtaccg tacgtaacgc accaatcgga ttttgtattc aatgggcctt atctgtgagc    240
ccattaattg atgtgacggc ctaaactaaa tccgaacggt ttatttcagc gatccgcgac    300
ggtttgtatt cagccaatag caatcaatta tgtagcagtg gtgatcctcg tcaaaccagt    360
aaagctagat ctggaccgtt gaattggtgc aagaaagcac atgttgtgat atttttaccc    420
gtacgattag aaaacttgag aaacacattg ataatcgata aaaaccgtcc gatcatataa    480
atccgcttta ccatcgttgc ctataaatta atatcaatag ccgtacacgc gtgaagactg    540
acaatattat ctttttcgaa ttcggagctc aagtttgaaa ttcggagaag ctagagagtt    600
ttctgataac catgg                                                     615
<210>37
<211>1319
<212>DNA
<213>杂合体
<400>37
ccatggcgag agggagcaga tcagtgggta gcagcagcag caaatggagg tactgcaacc    50
cttcctatta cttgaagcgc ccaaagcgtc ttgctctgct cttcatcgtt ttcgtttgtg    120
tctctttcgt tttctgggac cgtcaaactc tcgtcagaga gcaccaggtt gaaatttctg    180
agctgcagaa agaagtgact gatttgaaaa atttggtgga tgatttaaat aacaaacaag    240
gtggtacctc tgggaaaact gacttgggga ccatgggaca gatgcctgtg gctgctgtag    300
tggttatggc ctgcagtcgt gcagactatc ttgaaaggac tgttaaatca gttttaacat    360
atcaaactcc cgttgcttca aaatatcctc tatttatatc tcaggatgga tctgatcaag    420
ctgtcaagag caagtcattg agctataatc aattaacata tatgcagcac ttggattttg    480
aaccagtggt cactgaaagg cctggcgaac tgactgcgta ctacaagatt gcacgtcact    540
acaagtgggc actggaccag ttgttttaca aacacaaatt tagtcgagtg attatactag    600
aagatgatat ggaaattgct ccagacttct ttgattactt tgaggctgca gctagtctca    660
tggataggga taaaaccatt atggctgctt catcatggaa tgataatgga cagaagcagt    720
ttgtgcatga tccctatgcg ctataccgat cagatttttt tcctggcctt gggtggatgc    730
tcaagagatc gacttgggat gagttatcac caaagtggcc aaaggcttac tgggatgatt    840
ggctgagact aaaggaaaac cataaaggcc gccaattcat tcgaccggaa gtctgtagaa    900
catacaattt tggtgaacat gggtctagtt tgggacagtt tttcagtcag tatctggaac    960
ctataaagct aaacgatgtg acggttgact ggaaagcaaa ggacctggga tacctgacag    1020
agggaaacta taccaagtac ttttctggct tagtgagaca agcacgacca attcaaggtt    1080
ctgaccttgt cttaaaggct caaaacataa aggatgatgt tcgtatccgg tataaagacc    1140
aagtagagtt tgaacgcatt gcaggggaat ttggtatatt tgaagaatgg aaggatggtg    1200
tgcctcgaac agcatataaa ggagtagtgg tgtttcgaat ccagacaaca 3gacgtgtat    1260
tcctggttgg gccagattct gtaatgcagc ttggaattcg aaattcctga tgcggatcc     1319
<210>38
<211>4957
<212>DNA
<213>杂合体
<400>38
ggcgcgcctc gaggcgatcg cagatctaat ctaaccaatt acgatacgct ttgggtacac    60
ttgatttttg tttcagtggt tacatatatc ttgttttata tgctatcttt aaggatctgc    120
acaaagatta tttgttgatg ttcttgatgg ggctcagaag atttgatatg atacactcta    180
atctttagga gataccagcc aggattatat tcagtaagac aatcaaattt tacgtgttca    240
aactcgttat cttttcattc aaaggatgag ccagaatctt tatagaatga ttgcaatcga    300
gaatatgttc ggccgatatg cctttgttgg cttcaatatt ctacatatca cacaagaatc    360
gaccgtattg taccctcttt ccataaagga aaacacaata tgcagatgct tttttcccac    420
atgcagtaac atataggtat tcaaaaatgg ctaaaagaag ttggataaca aattgacaac    480
tatttccatt tctgttatat aaatttcaca acacacaaaa gcccgtaatc aagagtctgc    540
ccatgtacga aataacttct attatttggt attgggccta agcccagctc agagtacgtg    600
ggggtaccac atataggaag gtaacaaaat actgcaagat agccccataa cgtaccagcc    660
tctccttacc acgaagagat aagatataag acccaccctg ccacgtgtca catcgtcatg    720
gtggttaatg ataagggatt acatccttct atgtttgtgg acatgatgca tgtaatgtca    780
tgagccacag gatccaatgg ccacaggaac gtaagaatgt agatagattt gattttgtcc    840
gttagatagc aaacaacatt ataaaaggtg tgtatcaata ggaactaatt cactcattgg    900
attcatagaa gtccattcct cctaagtatc tagaaaccat ggcgagaggg agcagatcag    960
tgggtagcag cagcagcaaa tggaggtact gcaacccttc ctattacttg aagcgcccaa    1020
agcgtcttgc tctgctcttc atcgttttcg tttgtgtctc tttcgttttc tgggaccgtc    1080
aaactctcgt cagagagcac caggttgaaa tttctgagct gcagaaagaa gtgactgatt    1140
tgaaaaattt ggtggatgat ttaaataaca aacaaggtgg tacctctggg aaaactgact    1200
tggggaccat ggattccaat tcaggcgccg tcgttgatat cacaactaaa gatctatacg    1260
ataggattga gtttcttgat acagatggtg gtccatggaa acaaggttgg agagttacgt    1320
ataaagacga tgagtgggag aaagagaagc tcaaaatctt cgttgttcct cattctcata    1380
acgatcctgg ttggaaattg actgtagagg agtattatca gagacaatcc agacatattc    1440
ttgacaccat tgttgagact ttatctaagg tatgacgaaa gtttttgctt ttggttttaa    1500
tattttaatt ctctcccatg gttatcccgt gaacaatctt aaatgtctta aaattctcat    1560
gacgtcatta aactctataa ccaaacttct ttgctgggtt ctgttttttt ttagtttcgt    1620
gatgaaacag agttctagaa gttcgttctt ttggaaaatt tgaagtcttt ggagctaaag    1680
tttgtttttt tattactggg ttttgagatt gaaggatagc tagaatctta tttgtgtggg    1740
ggtttgtttt gaatatgttt aataggattc aagaagaaag tttatatggg aggagatgtc    1800
atatctggag agatggtgga gagacgcttc acctaataaa caagaagctt tgactaaatt    1860
ggttaaggat gggcagctag agattgttgg aggtggctgg gttatgaatg atgaggctaa    1920
ttcacattat tttgccataa ttgaacagat agcagagggt aatatgtggc tgaatgacac    1980
aattggggtt attcctaaga attcttgggc tatagatccc tttggctatt catcaaccat    2040
ggcttatctt ctccggcgta tgggttttga aaacatgctt attcaaagga ctcattacga    2100
gctcaagaaa gaccttgccc agcataagaa tcttgaatat atttggcgtc agagctggga    2160
tgctatggaa accacagata tctttgttca tatgatgccg ttttattcat acgatatccc    2220
acacacttgt ggaccagagc ctgcaatttg ctgtcagttt gatttcgctc ggatgcgggg    2280
atttaagtat gaactttgtc catggggaaa gcacccagtg gagaccacac tagaaaatgt    2340
gcaggagagg gcattaaagc ttctggatca atacaggaaa aaatccactc tatatcgaac    2400
taatacactt cttatacctc ttggagatga ttttaggtac attagtatcg atgaagccga    2460
ggctcagttc cgtaactacc agatgttgtt tgatcacatc aactctaatc ctagtctaaa    2520
cgcagaagca aagtttggta ctttggagga ttatttcaga acagtccgag aagaagcaga    2580
cagagtgaat tattctcgtc ctggtgaggt tggctctggt caggttgttg gtttcccttc    2640
tctgtcaggt gacttcttta catatgcaga taggcaacaa gactattgga gtggttatta    2700
tgtttcaaga cctttcttca aagctgttga tcgtgtgctc gagcataccc ttcgtggagc    2760
tgagatcatg atgtcatttc tgctaggtta ttgccatcga attcaatgtg agaaatttcc    2820
aacaagtttt acgtataagt tgactgctgc aagaagaaat ctggctcttt tccagcacca    2880
tgatggggta actggaactg ctaaggatta tgtggtacaa gattacggca cccggatgca    2940
tacttcattg caagaccttc agatctttat gtctaaagca atcgaagttc ttcttgggat    3000
ccgccacgag aaagaaaaat ctgatcaatc cccatcattt ttcgaggcag agcaaatgag    3060
atcaaagtat gatgctcggc cagttcacaa gccaattgct gcccgggaag gaaattcgca    3120
cacagttata ctcttcaatc catcagaaca gacgagagag gaggtggtga cggttgttgt    3180
taaccgcgct gaaatctcgg ttttggactc aaactggact tgtgtcccta gccaaatttc    3240
tcctgaagtg cagcatgacg ataccaaact attcaccggc agacatcgcc tttactggaa    3300
agcttccatc ccagctcttg gtctgagaac atatttcatt gctaatggga atgtcgagtg    3360
tgagaaagct actccgtcta aactcaaata cgcttctgag tttgacccat ttccttgtcc    3420
tcctccatat tcctgctcca aactggacaa cgacgttact gagatccgaa atgaacatca    3480
gactcttgtg tttgatgtga agaacggatc actgcggaag atagtccata gaaacggatc    3540
agagactgtt gtgggagaag agataggtat gtactctagt ccagagagtg gagcttacct    3600
gttcaaacca gatggtgaag ctcagccaat tgttcaacct gatggacatg tagtcacctc    3660
tgagggtctg ctggttcaag aagtcttctc ttaccctaaa accaaatggg agaaatcacc    3720
cctctctcag aaaactcgtc tttacactgg aggtaatacg cttcaggatc aagtggtcga    3780
gatagaatat catgttgagc ttcttggtaa tgattttgat gaccgggaat tgattgtccg    3840
gtacaagact gatgttgaca acaagaaggt cttctattca gatctcaatg gtttccaaat    3900
gagcaggaga gaaacttatg ataagatccc tcttcaagga aactactacc caatgccatc    3960
tctcgcattt atccaaggat ccaatggtca gagattctcc gtgcactctc gtcaatctct    4020
cggtgttgca agcctcaaag agggttggtt ggagattatg ctggacagac ggttggttcg    4080
tgatgacgga cggggtctag ggcaaggtgt gatggataac cgcgcaatga ccgtggtatt    4140
tcaccttctt gcggaatcta acatttctca agcagaccct gcttccaaca ctaacccgag    4200
gaacccttcg cttctctctc acctcatagg tgctcactta aactacccca taaacacatt    4260
cattgccaag aaaccgcaag acatatctgt gcgtgttcca caatacggtt cctttgctcc    4320
tttagccaaa ccgttaccat gtgacctcca cattgtaaat ttcaaggtta ctcgtccatc    4380
caaatactct cagcaattgg aagaagacaa gccaaggttc gctcttatcc tcaatagacg    4440
agcttgggat tcagcttatt gccataaagg aagacaagta aactgcacaa gcatggctaa    4500
tgaaccagta aacttttccg acatgttcaa agatcttgca gcttcaaagg taaaaccaac    4560
ttcactgaat ctcttgcaag aagatatgga gattcttggg tacgatgacc aagagctacc    4620
tcgagatagt tcacagccac gggaaggacg tgtctcgatc tctcccatgg aaatacgagc    4680
ttataagctt gaactgcgac ctcacaagtg aacctgctga agatccgcta gagtccgcaa    4740
aaatcaccag tctctctcta caaatctatc tctctctatt tttctccaga ataatgtgtg    4800
agtagttccc agataaggga attagggttc ttatagggtt tcgctcatgt gttgagcata    4860
taagaaaccc ttagtatgta tttgtatttg taaaatactt ctatcaataa aatttctaat    4920
cctaaaacca aaatcccgcg agagacctct taattaa                             4957
<210>39
<211>921
<212>DNA
<213>Chrysanthemum x morifolium
<400>39
agatctaatc taaccaatta cgatacgctt tgggtacact tgatttttgt  ttcagtggtt    60
acatatatct tgttttatat gctatcttta aggatctgca caaagattat  ttgttgatgt    120
tcttgatggg gctcagaaga tttgatatga tacactctaa tctttaggag  ataccagcca    180
ggattatatt cagtaagaca atcaaatttt acgtgttcaa actcgttatc  ttttcattca    240
aaggatgagc cagaatcttt atagaatgat tgcaatcgag aatatgttcg  gccgatatgc    300
ctttgttggc ttcaatattc tacatatcac acaagaatcg accgtattgt  accctctttc    360
cataaaggaa aacacaatat gcagatgctt ttttcccaca tgcagtaaca  tataggtatt    420
caaaaatggc taaaagaagt tggataacaa attgacaact atttccattt  ctgttatata    480
aatttcacaa cacacaaaag cccgtaatca agagtctgcc catgtacgaa  ataacttcta    540
ttatttggta ttgggcctaa gcccagctca gagtacgtgg gggtaccaca  tataggaagg    600
taacaaaata ctgcaagata gccccataac gtaccagcct ctccttacca  cgaagagata    660
agatataaga cccaccctgc cacgtgtcac atcgtcatgg tggttaatga  taagggatta    720
catccttcta tgtttgtgga catgatgcat gtaatgtcat gagccacagg  atccaatggc    780
cacaggaacg taagaatgta gatagatttg attttgtccg ttagatagca  aacaacatta    840
taaaaggtgt gtatcaatag gaactaattc actcattgga ttcatagaag  tccattcctc    900
ctaagtatct agaaaccatg g                                               921
<210>40
<211>3789
<212>DNA
<213>杂合体
<400>40
ccatggcgag agggagcaga tcagtgggta gcagcagcag caaatggagg tactgcaacc    60
cttcctatta cttgaagcgc ccaaagcgtc ttgctctgct cttcatcgtt ttcgtttgtg    120
tctctttcgt tttctgggac cgtcaaactc tcgtcagaga gcaccaggtt gaaatttctg    180
agctgcagaa agaagtgact gatttgaaaa atttggtgga tgatttaaat aacaaacaag    240
gtggtacctc tgggaaaact gacttgggga ccatggattc caattcaggc gccgtcgttg    300
atatcacaac taaagatcta tacgatagga ttgagtttct tgatacagat ggtggtccat    360
ggaaacaagg ttggagagtt acgtataaag acgatgagtg ggagaaagag aagctcaaaa    420
tcttcgttgt tcctcattct cataacgatc ctggttggaa attgactgta gaggagtatt    480
atcagagaca atccagacat attcttgaca ccattgttga gactttatct aaggtatgac    540
gaaagttttt gcttttggtt ttaatatttt aattctctcc catggttatc ccgtgaacaa    600
tcttaaatgt cttaaaattc tcatgacgtc attaaactct ataaccaaac ttctttgccg    660
ggttctgttt ttttttagtt tcgtgatgaa acagagttct agaagttcgt tcttttggaa    720
aatttgaagt ctttggagct aaagtttgtt tttttattac tgggttttga gattgaagga    780
tagctagaat cttatttgtg tgggggtttg ttttgaatat gtttaatagg attcaagaag    840
aaagtttata tgggaggaga tgtcatatct ggagagatgg tggagagacg cttcacctaa    900
taaacaagaa gctttgacta aattggttaa ggatgggcag ctagagattg ttggaggtgg    960
ctgggttatg aatgatgagg ctaattcaca ttattttgcc ataattgaac agatagcaga    1020
gggtaatatg tggctgaatg acacaattgg ggttattcct aagaattctt gggctataga    1080
tccctttggc tattcatcaa ccatggctta tcttctccgg cgtatgggtt ttgaaaacat    1140
gcttattcaa aggactcatt acgagctcaa gaaagacctt gcccagcata agaatcttga    1200
atatatttgg cgtcagagct gggatgctat ggaaaccaca gatatctttg ttcatatgat    1260
gccgttttat tcatacgata tcccacacac ttgtggacca gagcctgcaa tttgctgtca    1320
gtttgatttc gctcggatgc ggggatttaa gtatgaactt tgtccatggg gaaagcaccc    1380
agtggagacc acactagaaa atgtgcagga gagggcatta aagcttctgg atcaatacag    1440
gaaaaaatcc actctatatc gaactaatac acttcttata cctcttggag atgattttag    1500
gtacattagt atcgatgaag ccgaggctca gttccgtaac taccagatgt tgtttgatca    l560
catcaactct aatcctagtc taaacgcaga agcaaagttt ggtactttgg aggattattt    1620
cagaacagtc cgagaagaag cagacagagt gaattattct cgtcctggtg aggttggctc    1680
tggtcaggtt gttggtttcc cttctctgtc aggtgacttc tttacatatg cagataggca    1740
acaagactat tggagtggtt attatgtttc aagacctttc ttcaaagctg ttgatcgtgt    1800
gctcgagcat acccttcgtg gagctgagat catgatgtca tttctgctag gttattgcca    1860
tcgaattcaa tgtgagaaat ttccaacaag ttttacgtat aagttgactg ctgcaagaag    1920
aaatctggct cttttccagc accatgatgg ggtaactgga actgctaagg attatgtggt    1980
acaagattac ggcacccgga tgcatacttc attgcaagac cttcagatct ttatgtctaa    2040
agcaatcgaa gttcttcttg ggatccgcca cgagaaagaa aaatctgatc aatccccatc    2100
atttttcgag gcagagcaaa tgagatcaaa gtatgatgct cggccagttc acaagccaat    2160
tgctgcccgg gaaggaaatt cgcacacagt tatactcttc aatccatcag aacagacgag    2220
agaggaggtg gtgacggttg ttgttaaccg cgctgaaatc tcggttttgg actcaaactg    2280
gacttgtgtc cctagccaaa tttctcctga agtgcagcat gacgatacca aactattcac    2340
cggcagacat cgcctttact ggaaagcttc catcccagct cttggtctga gaacatattt    2400
cattgctaat gggaatgtcg agtgtgagaa agctactccg tctaaactca aatacgcttc    2460
tgagtttgac ccatttcctt gtcctcctcc atattcctgc tccaaactgg acaacgacgt    2520
tactgagatc cgaaatgaac atcagactct tgtgtttgat gtgaagaacg gatcactgcg    2580
gaagatagtc catagaaacg gatcagagac tgttgtggga gaagagatag gtatgtactc    2640
tagtccagag agtggagctt acctgttcaa accagatggt gaagctcagc caattgttca    2700
acctgatgga catgtagtca cctctgaggg tctgctggtt caagaagtct tctcttaccc    2760
taaaaccaaa tgggagaaat cacccctctc tcagaaaact cgtctttaca ctggaggtaa    2820
tacgcttcag gatcaagtgg tcgagataga atatcatgtt gagcttcttg gtaatgattt    2880
tgatgaccgg gaattgattg tccggtacaa gactgatgtt gacaacaaga aggtcttcta    2940
ttcagatctc aatggtttcc aaatgagcag gagagaaact tatgataaga tccctcttca    3000
aggaaactac tacccaatgc catctctcgc atttatccaa ggatccaatg gtcagagatt    3060
ctccgtgcac tctcgtcaat ctctcggtgt tgcaagcctc aaagagggtt ggttggagat    3120
tatgctggac agacggttgg ttcgtgatga cggacggggt ctagggcaag gtgtgatgga    3180
taaccgcgca atgaccgtgg tatttcacct tcttgcggaa tctaacattt ctcaagcaga    3240
ccctgcttcc aacactaacc cgaggaaccc ttcgcttctc tctcacctca taggtgctca    3300
cttaaactac cccataaaca cattcattgc caagaaaccg caagacatat ctgtgcgtgt    3360
tccacaatac ggttcctttg ctcctttagc caaaccgtta ccatgtgacc tccacattgt    3420
aaatttcaag gttcctcgtc catccaaata ctctcagcaa ttggaagaag acaagccaag    3480
gttcgctctt atcctcaata gacgagcttg ggattcagct tattgccata aaggaagaca    3540
agtaaactgc acaagcatgg ctaatgaacc agtaaacttt tccgacatgt tcaaagatct    3600
tgcagcttca aaggtaaaac caacttcact gaatctcttg caagaagata tggagattct    3660
tgggtacgat gaccaagagc tacctcgaga tagttcacag ccacgggaag gacgtgtctc    3720
gatctctccc atggaaatac gagcttataa gcttgaactg cgacctcaca agtgaacctg    3780
ctgaagatc                                                            3789
<210>41
<211>2145
<212>DNA
<213>杂合体
<400>41
ggcgcgcctc gaggcgatcg cagatctcat tataccgtta gaagcatagt taaaatctaa     60
agcttgtcgt taattctagt cattttacat tgttgggttc tacattatta atgaattttc    120
taatgcaaat acagaattta aatcaaaatt gttgaattat gctaaacatg taacatacgt    180
atatctccgc cttgtgtgtt gtattaactt gaagttatca taagaaccac aaatacacta    240
gtaaatctat gagaaggcag gtggcaacac aaacaagagt atctaagatt ttcatttgtg    300
actataggaa tataatatct cttatctgat ttaatgaatc cacatgttca cttctcattt    360
gtccacaaga tcacaacttt atcttcaata ttcacaactt gttatatcca ccacaatttc    420
attcttttca cttagcccca caaaatactt tgtcccctta tttgccacct tttgtattta    480
atttattctt gtggagctaa gtgttcatat tattcttctt ctcaaaaaaa caaaaacaaa    540
aaaaaagaga agaaaaccat ggcgagaggg agcagatcag tgggtagcag cagcagcaaa    600
tggaggtact gcaacccttc ctattacttg aagcgcccaa agcgtcttgc tctgctcttc    660
atcgttttcg tttgtgtctc tttcgttttc tgggaccgtc aaactctcgt cagagagcac    720
caggttgaaa tttctgagct gcagadagaa gtgactgatt tgaaaaattt ggtggatgat    780
ttaaataaca aacaaggtgg tacctctggg aaaactgact tggggaccat ggctctaagg    840
ttgcatagaa ggaaccattt ttcgcctaga aatacggatc tgttcccgga tttggcaaaa    900
gatcgtgtgg ttatcgtctt gtatgtgcat aatcgggctc agtattttcg agtcacagtg    960
gaaagtttgt cgaaggttaa aggtataagt gagacattgt tgattgttag tcatgatggt    1020
tactttgaag agatgaatag gattgtggag agtattaagt tttgtcaagt gaaacagatt    1080
ttctcgcctt attcgcctca tatatatcgt actagcttcc cgggtgtgac cctgaatgat    1140
tgtaagaaca agggtgatga ggcaaagggg cattgtgaag gtaatcctga tcagtatggg    1200
aatcatcggt ctccgaagat tgtatctttg aagcatcact ggtggtggat gatgaacact    1260
gtatgggatg ggttggaaga gactaaagga catgaggggc atatcctttt cattgaagaa    1320
gatcattttc tgtttcctaa tgcctatcgt aacatacaga ctcttacgag gctgaaaccc    1380
gcaaagtgtc ctgactgttt tgctgctaat ttagcaccgt ctgatgtgaa gtcaagagga    1440
gaagggcttg aaagtttggt tgcagagaga atgggaaatg ttgggtattc ttttaataga    1500
agtgtgtggg agaatattca tcagaaggca agagagtttt gtttctttga tgattacaac    1560
tgggatataa cgatgtgggc aacggttttc ccgtcgtttg gttccccggt gtacacattg    1620
cgagggccta ggactagtgc ggtacacttt ggaaaatgtg ggttgcatca aggtagagga    1680
gatgagggtg attgcatcga taatggggtc gtaaacatag aagttaagga aacagataaa    1740
gttgtgaaca taaaagaagg atggggagtt cgggtgtata agcatcaagc gggttataaa    1800
gccggtttcg aaggttgggg aggttggggc gatgataggg accgacattt atgtttggat    1860
tttgccacta tgtatcgtta cagcagtagc agtgcatctc catgaaacgg atccgctaga    1920
gtccgcaaaa atcaccagtc tctctctaca aatctatctc tctctatttt tctccagaat    1980
aatgtgtgag tagttcccag ataagggaat tagggttctt atagggtttc gctcatgtgt    2040
tgagcatata agaaaccctt agtatgtatt tgtatttgta aaatacttct atcaataaaa    2100
tttctaatcc taaaaccaaa atcccgcgag agacctctta attaa                    2145
<210>42
<211>541
<212>DNA
<213>Solanum tuberosum
<400>42
agatctcatt ataccgttag aagcatagtt aaaatctaaa gcttgtcgtt aattctagtc    60
attttacatt gttgggttct acattattaa tgaattttct aatgcaaata cagaatttaa    120
atcaaaattg ttgaattatg ctaaacatgt aacatacgta tatctccgcc ttgtgtgttg    180
tattaacttg aagttatcat aagaaccaca aatacactag taaatctatg agaaggcagg    240
tggcaacaca aacaagagta tctaagattt tcatttgtga ctataggaat ataatatctc    300
ttatctgatt taatgaatcc acatgttcac ttctcatttg tccacaagat cacaacttta    360
tcttcaatat tcacaacttg ttatatccac cacaatttca ttcttttcac ttagccccac    420
aaaatacttt gtccccttat ttgccacctt ttgtatttaa tttattcttg tggagctaag    480
tgttcatatt attcttcttc tcaaaaaaac aaaaacaaaa aaaaagagaa gaaaaccatg    540
g                                                                    541
<210>43
<211>1358
<212>DNA
<213>杂合体
<400>43
ccatggcgag agggagcaga tcagtgggta gcagcagcag caaatggagg tactgcaacc    60
cttcctatta cttgaagcgc ccaaagcgtc ttgctctgct cttcatcgtt ttcgtttgtg    120
tctctttcgt tttctgggac cgtcaaactc tcgtcagaga gcaccaggtt gaaatttctg    180
agctgcagaa agaagtgact gatttgaaaa atttggtgga tgatttaaat aacaaacaag    240
gtggtacctc tgggaaaact gacttgggga ccatggctct aaggttgcat agaaggaacc    300
atttttcgcc tagaaatacg gatctgttcc cggatttggc aaaagatcgt gtggttatcg    360
tcttgtatgt gcataatcgg gctcagtatt ttcgagtcac agtggaaagt ttgtcgaagg    420
ttaaaggtat aagtgagaca ttgttgattg ttagtcatga tggttacttt gaagagatga    480
ataggattgt ggagagtatt aagttttgtc aagtgaaaca gattttctcg ccttattcgc    540
ctcatatata tcgtactagc ttcccgggtg tgaccctgaa tgattgtaag aacaagggtg    600
atgaggcaaa ggggcattgt gaaggtaatc ctgatcagta tgggaatcat cggtctccga    660
agattgtatc tttgaagcat cactggtggt ggatgatgaa cactgtatgg gatgggttgg    720
aagagactaa aggacatgag gggcatatcc ttttcattga agaagatcat tttctgtttc    780
ctaatgccta tcgtaacata cagactctta cgaggctgaa acccgcaaag tgtcctgact    840
gttttgctgc taatttagca ccgtctgatg tgaagtcaag aggagaaggg cttgaaagtt    900
tggttgcaga gagaatggga aatgttgggt attcttttaa tagaagtgtg tgggagaata    960
ttcatcagaa ggcaagagag ttttgtttct ttgatgatta caactgggat ataacgatgt    1020
gggcaacggt tttcccgtcg tttggttccc cggtgtacac attgcgaggg cctaggacta    1080
gtgcggtaca ctttggaaaa tgtgggttgc atcaaggtag aggagatgag ggtgattgca    1140
tcgataatgg ggtcgtaaac atagaagtta aggaaacaga taaagttgtg aacataaaag    1200
aaggatgggg agttcgggtg tataagcatc aagcgggtta taaagccggt ttcgaaggtt    1260
ggggaggttg gggcgatgat agggaccgac atttatgttt ggattttgcc actatgtatc    1320
gttacagcag tagcagtgca tctccatgaa acggatcc                            1358
<210>44
<211>237
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>44
ggatccgcta gagtccgcaa aaatcaccag tctctctcta caaatctatc tctctctatt   60
tttctccaga ataatgtgtg agtagttccc agataaggga attagggttc ttatagggtt   120
tcgctcatgt gttgagcata taagaaaccc ttagtatgta tttgtatttg taaaatactt   180
ctatcaataa aatttctaat cctaaaacca aaatcccgcg agagacctct taattaa      237
<210>45
<211>31
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>45
atactcgagt taacaatgag taaacggaat c                                   31
<210>46
<211>24
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>46
ttctcgatcg ccgattggtt attc                                           24
<210>47
<211>24
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>47
gccgccgcga tcgggcagtc ctcc                                           24
<210>48
<211>30
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>48
aacggatcca cgctagctcg gtgtcccgat                                     30
<210>49
<211>3327
<212>DNA
<213>杂合体
<400>49
atgggcatca agatggagac acattctcag gtctttgtat acatgttgct gtggttgtct    60
ggtgtcgaca tgaagcactt caaatcttcc ctcactcaca ccgtcaagag ccgagacgag    120
ccaactccgg atcaatgccc tgcattgaag gaaagcgaag cggacatcga caccgtggcg    180
atatacccaa cttttgattt tcagccgagc tggttgcgta caaaggaatt ttgggacaag    240
tccttcgagg atcggtatga aagaattcat aacgacacta cacggcctag actgaaggta    300
atcgtggttc ctcactcaca caacgacccg ggatggctga agacgtttga acagtacttc    360
gagtggaaga ccaagaacat tatcaacaac atagtgaaca aactgcacca gtaccccaac    420
atgaccttca tttggaccga gatatcgttt ctgaatgcct ggtgggaaag gtcgcaccct    480
gtcaaacaaa aggcattgaa aaaacttatc aaagaaggtc gtctcgagat cacgacgggc    540
ggctgggtga tgccggacga agcctgcacg catatctatg cgctaattga ccagtttatt    600
gaaggacatc actgggtgaa aactaatctc ggcgtcatcc cgaagacagg atggtctatt    660
gaccccttcg gccacggggc cactgtgcct tacctgctag accagagcgg ccttgaggga    720
accattatac agagaatcca ttatgcgtgg aaacagtggc tggcggagcg acagattgag    780
gagttttact ggctggcgag ttgggctact acgaagccgt ccatgatagt gcacaatcag    840
ccgtttgata tttattcaat aaaaagcacg tgtggcccgc acccttcaat ttgtctcagt    900
ttcgacttca ggaagattcc cggcgaatat tctgaataca cagctaagca cgaagacatc    960
acggaacaca acttgcacag caaggcaaag actttgatag aggagtacga ccgtatcggg    1020
tccctgactc cacacaacgt ggtgctggtg ccgctcggag acgacttcag atacgagtac  1080
agcgtcgagt ttgatgccca atacgtcaat tatatgaaaa tgtttaacta catcaatgct  1140
cacaaggaaa tcttcaacgc tgacgtacag ttcggaactc ctctcgatta ctttaacgcc  1200
atgaaagaaa gacatcaaaa tatacccagc ttaaagggag atttcttcgt ttactccgat  1260
attttcagcg aaggtaaacc agcgtactgg tcaggttact acactactag accctaccaa  1320
aaaatcctcg cccgtcagtt cgaacaccaa ctgcgatcgg cagagatttt attcaccctt  1380
gtatcgaact acatcagaca gatgggtcgc caaggagagt tcggagcttc tgagaaaaag  1440
ttagaaaaat cttacgagca gcttatctat gctcgacgga acttgggtct gtttcaacat  1500
cacgatgcga ttactggaac atcaaagtcc agtgtgatgc aagattacgg aaccaaactg  1560
ttcacaagtc tgtatcactg catccgcctg caggaggccg cgctcaccac catcatgttg  1620
cctgaccagt cgttgcactc gcagagcatt atacaaagcg aggttgagtg ggaaacttac  1680
ggaaaaccgc ccaagaagct gcaagtgtcc ttcattgaca agaagaaagt tatacttttt  1740
aatccgttgg ctgagactcg aactgaagtg gtcacggtta gatccaacac gtccaacatc  1800
cgggtgtacg atacacacaa gaggaagcac gtcttgtatc agataatgcc cagcatcaca  1860
atccaagaca acggcaagag tatcgtaagc gacaccacgt tcgacataat gttcgtggcc  1920
accatcccgc ccctcacctc catctcgtac aagctgcagg agcacaccaa cacttcccac  1980
cactgcgtca ttttctgcaa caactgcgaa caataccaga aatccaatgt gttccaaatt  2040
aagaaaatga tgcctggtga catacaatta gaaaatgcag tgctaaaact tctcgttaat  2100
aggaacaccg gctttctgag acaagtctat agaaaggaca tccggaagag aactgtcgtt  2160
gacgtacaat tcggcgcata tcaaagtgcc caaagacatt ctggtgctta cctcttcatg  2220
cctcattacg actcacctga gaagaatgtt ctgcatccct acactaatca gaacaacatg  2280
caagatgata acataatcat agtgtccgga cctatttcta cggaaatcac gaccatgtac  2340
ttgcccttct tggtgcacac tattaggata tacaacgtgc cggacccggt actgtcgcgt  2400
gctattctat tagagaccga tgtagatttc gaggcgccac ctaagaacag agagactgag  2460
ttatttatga gattacagac tgatatacaa aacggtgaca ttcccgaatt ttacaccgat  2520
cagaacggat tccagtacca aaagagggtc aaagtgaata aactaggaat agaagctaat  2580
tactacccga tcactaccat ggcgtgcctg caagacgagg agacccggct cactctgctg  2640
acgaaccacg ctcaaggcgc tgctgcatac gaaccaggac gcttagaagt catgctcgat  2700
cgtcgaactc tttatgatga cttcagagga atcggtgaag gagtagtcga taacaaaccg  2760
acgactttcc agaactggat tttaattgaa tccatgccag gcgtgacgcg agccaagaga  2820
gacactagtg aaccaggttt caaatttgtt aatgaacgtc gttttggccc cggccagaag  2880
gaaagccctt accaagtacc gtcgcagact gcggactacc tgagcaggat gttcaattac  2940
ccggtgaacg tgtacctggt ggacactagc gaggttggcg agatcgaggt gaagccgtac  3000
cagtcgttcc tgcagagctt cccgcccggc atccacctgg tcaccctgcg caccatcacc  3060
gacgacgtgc tcgaactctt ccccagcaac gaaagctaca tggtactgca ccgaccagga  3120
tacagctgcg ctgtcggaga gaagccagtc gccaagtctc ccaagttttc g tccaaaacc 3180
aggttcaatg gtctgaacat tcagaacatc actgcagtca gcctgaccggcctgaagtca   3240
ctccgacctc tcacaggtct gagtgacatc cacctgaacg ctatggaggt aaaaacttac  3300
aagatcaggt ttaaggacga gctttaa                                      3327
<210>50
<211>1108
<212>PRT
<213>杂合体
<400>50
Met Gly Ile Lys Met Glu Thr His Ser Gln Val Phe Val Tyr Met Leu
 1               5                  10                  15
Leu Trp Leu Ser Gly Val Asp Met Lys His Phe Lys Ser Ser Leu Thr
            20                  25                  30
His Thr Val Lys Ser Arg Asp Glu Pro Thr Pro Asp Gln Cys Pro Ala
        35                  40                   45
Leu Lys Glu Ser Glu Ala Asp Ile Asp Thr Val Ala Ile Tyr Pro Thr
    50                  55                  60
Phe Asp Phe Gln Pro Ser Trp Leu Arg Thr Lys Glu Phe Trp Asp Lys
65                  70                   75                 80
Ser Phe Glu Asp Arg Tyr Glu Arg Ile His Asn Asp Thr Thr Arg Pro
                85                  90                   95
Arg Leu Lys Val Ile Val Val Pro His Ser His Asn Asp Pro Gly Trp
            100                 105                 110
Leu Lys Thr Phe Glu Gln Tyr Phe Glu Trp Lys Thr Lys Asn Ile Ile
        115                 120                 125
Asn Asn Ile Val Asn Lys Leu His Gln Tyr Pro Asn Met Thr Phe Ile
    130                 135                 140
Trp Thr Glu Ile Ser Phe Leu Asn Ala Trp Trp Glu Arg Ser His Pro
145                 150                 155                 160
Val Lys Gln Lys Ala Leu Lys Lys Leu Ile Lys Glu Gly Arg Leu Glu
                165                 170                 175
Ile Thr Thr Gly Gly Trp Val Met Pro Asp Glu Ala Cys Thr His Ile
            180                 185                 190
Tyr Ala Leu Ile Asp Gln Phe Ile Glu Gly His His Trp Val Lys Thr
        195                 200                 205
Asn Leu Gly Val Ile Pro Lys Thr Gly Trp Ser Ile Asp Pro Phe Gly
    210                 215                 220
His Gly Ala Thr Val Pro Tyr Leu Leu Asp Gln Ser Gly Leu Glu Gly
225                 230                 235                 240
Thr Ile Ile Gln Arg Ile His Tyr Ala Trp Lys Gln Trp Leu Ala Glu
                245                 250                 255
Arg Gln Ile Glu Glu Phe Tyr Trp Leu Ala Ser Tro Ala Thr Thr Lys
            260                 265                 270
Pro Ser Met Ile Val His Asn Gln Pro Phe Asp Ile Tyr Ser Ile Lys
        275                 280                 285
Ser Thr Cys Gly Pro His Pro Ser Ile Cys Leu Ser Phe Asp Phe Arg
    290                 295                 300
Lys Ile Pro Gly Glu Tyr Ser Glu Tyr Thr Ala Lys His Glu Asp Ile
305                 310                 315                 320
Thr Glu His Asn Leu His Ser Lys Ala Lys Thr Leu Ile Glu Glu Tyr
                325                 330                 335
Asp Arg Ile Gly Ser Leu Thr Pro His Asn Val Val Leu Val Pro Leu
            340                 345                 350
Gly Asp Asp Phe Arg Tyr Glu Tyr Ser Val Glu Phe Asp Ala Gln Tyr
        355                 360                 365
Val Asn Tyr Met Lys Met Phe Asn Tyr Ile Asn Ala His Lys Glu Ile
    370                 375                 380
Phe Asn Ala Asp Val Gln Phe Gly Thr Pro Leu Asp Tyr Phe Asn Ala
385                 390                 395                 400
Met Lys Glu Arg His Gln Asn Ile Pro Ser Leu Lys Gly Asp Phe Phe
                405                 410                 415
Val Tyr Ser Asp Ile Phe Ser Glu Gly Lys Pro Ala Tyr Trp Ser Gly
            420                 425                 430
Tyr Tyr Thr Thr Arg Pro Tyr Gln Lys Ile Leu Ala Arg Gln Phe Glu
        435                 440                 445
His Gln Leu Arg Ser Ala Glu Ile Leu Phe Thr Leu Val Ser Asn Tyr
    450                 455                 460
Ile Arg Gln Met Gly Arg Gln Gly Glu Phe Gly Ala Ser Glu Lys Lys
465                 470                 475                 480
Leu Glu Lys Ser Tyr Glu Gln Leu Ile Tyr Ala Arg Arg Asn Leu Gly
                485                 490                 495
Leu Phe Gln His His Asp Ala Ile Thr Gly Thr Ser Lys Ser Ser Val
            500                 505                 510
Met Gln Asp Tyr Gly Thr Lys Leu Phe Thr Ser Leu Tyr His Cys Ile
        515                 520                 525
Arg Leu Gln Glu Ala Ala Leu Thr Thr Ile Met Leu Pro Asp Gln Ser
    530                 535                 540
Leu His Ser Gln Ser Ile Ile Gln Ser Glu Val Glu Trp Glu Thr Tyr
545                 550                 555                 560
Gly Lys Pro Pro Lys Lys Leu Gln Val Ser Phe Ile Asp Lys Lys Lys
                565                 570                 575
Val Ile Leu Phe Asn Pro Leu Ala Glu Thr Arg Thr Glu Val Val Thr
            580                 585                 590
Val Arg Ser Asn Thr Ser Asn Ile Arg Val Tyr Asp Thr His Lys Arg
        595                 600                 605
Lys His Val Leu Tyr Gln Ile Met Pro Ser Ile Thr Ile Gln Asp Asn
    610                 615                 620
Gly Lys Ser Ile Val Ser Asp Thr Thr Phe Asp Ile Met Phe Val Ala
625                 630                 635                 640
Thr Ile Pro Pro Leu Thr Ser Ile Ser Tyr Lys Leu Gln Glu His Thr
                645                 650                 655
Asn Thr Ser His His Cys Val Ile Phe Cys Asn Asn Cys Glu Gln Tyr
            660                 665                 670
Gln Lys Ser Asn Val Phe Gln Ile Lys Lys Met Met Pro Gly Asp Ile
        675                 680                 685
Gln Leu Glu Asn Ala Val Leu Lys Leu Leu Val Asn Arg Asn Thr Gly
    690                 695                 700
Phe Leu Arg Gln Val Tyr Arg Lys Asp Ile Arg Lys Arg Thr Val Val
705                 710                 715                 720
Asp Val Gln Phe Gly Ala Tyr Gln Ser Ala Gln Arg His Ser Gly Ala
                725                 730                 735
Tyr Leu Phe Met Pro His Tyr Asp Ser Pro Glu Lys Asn Val Leu His
            740                 745                 750
Pro Tyr Thr Asn Gln Asn Asn Met Gln Asp Asp Asn Ile Ile Ile Val
        755                 760                 765
Ser Gly Pro Ile Ser Thr Glu Ile Thr Thr Met Tyr Leu Pro Phe Leu
    770                 775                 780
Val His Thr Ile Arg Ile Tyr Asn Val Pro Asp Pro Val Leu Ser Arg
785                 790                 795                 800
Ala Ile Leu Leu Glu Thr Asp Val Asp Phe Glu Ala Pro Pro Lys Asn
                805                 810                 815
Arg Glu Thr Glu Leu Phe Met Arg Leu Gln Thr Asp Ile Gln Asn Gly
            820                 825                 830
Asp Ile Pro Glu Phe Tyr Thr Asp Gln Asn Gly Phe Gln Tyr Gln Lys
        835                 840                 845
Arg Val Lys Val Asn Lys Leu Gly Ile Glu Ala Asn Tyr Tyr Pro Ile
    850                 855                 860
Thr Thr Met Ala Cys Leu Gln Asp Glu Glu Thr Arg Leu Thr Leu Leu
865                 870                 875                 880
Thr Asn His Ala Gln Gly Ala Ala Ala Tyr Glu Pro Gly Arg Leu Glu
                885                 890                 895
Val Met Leu Asp Arg Arg Thr Leu Tyr Asp Asp Phe Arg Gly Ile Gly
            900                 905                 910
Glu Gly Val Val Asp Asn Lys Pro Thr Thr Phe Gln Asn Trp Ile Leu
        915                 920                 925
Ile Glu Ser Met Pro Gly Val Thr Arg Ala Lys Arg Asp Thr Ser Glu
    930                 935                 940
Pro Gly Phe Lys Phe Val Asn Glu Arg Arg Phe Gly Pro Gly Gln Lys
945                 950                 955                 960
Glu Ser Pro Tyr Gln Val Pro Ser Gln Thr Ala Asp Tyr Leu Ser Arg
                965                 970                 975
Met Phe Asn Tyr Pro Val Asn Val Tyr Leu Val Asp Thr Ser Glu Val
            980                 985                 990
Gly Glu Ile Glu Val Lys Pro Tyr Gln Ser Phe Leu Gln Ser Phe Pro
        995                1000                1005
Pro Gly Ile His Leu Val Thr Leu Arg Thr Ile Thr Asp Aso Val
    1010                1015               1020
Leu Glu Leu Phe Pro Ser Asn Glu Ser Tyr Met Val Leu His Arg
    1025                1030               1035
Pro Gly Tyr Ser Cys Ala Val Gly Glu Lys Pro Val Ala Lys Ser
    1040                1045               1050
Pro Lys Phe Ser Ser Lys Thr Arg Phe Asn Gly Leu Asn Ile Gln
    1055                1060               1065
Asn Ile Thr Ala Val Ser Leu Thr Gly Leu Lys Ser Leu Arg Pro
    1070                1075               1080
Leu Thr Gly Leu Ser Asp Ile His Leu Asn Ala Met Glu Val Lys
    1085                1090               1095
Thr Tyr Lys Ile Arg Phe Lys Asp Glu Leu
    1100                1105
<210>51
<211>1068
<212>DNA
<213>杂合体
<400>51
atgggcatca agatggagac acattctcag gtctttgtat acatgttgct gtggttgtct      60
ggtgtcgaca tgcagtcctc cggggagctc cggaccggag gggcccggcc gccgcctcct     120
ctaggcgcct cctcccagcc gcgcccgggt ggcgactcca gcccagtcgt ggattctggc     180
cctggccccg ctagcaactt gacctcggtc ccagtgcccc acaccaccgc actgtcgctg     240
cccgcctgcc ctgaggagtc cccgctgctt gtgggcccca tgctgattga gtttaacatg     300
cctgtggacc tggagctcgt ggcaaagcag aacccaaatg tgaagatggg cggccgctat     360
gcccccaggg actgcgtctc tcctcacaag gtggccatca tcattccatt ccgcaaccgg     420
caggagcacc tcaagtactg gctatattat ttgcacccag tcctgcagcg ccagcagctg    480
gactatggca tctatgttat caaccaggcg ggagacacta tattcaatcg tgctaagctc    540
ctcaatgttg gctttcaaga agccttgaag gactatgact acacctgctt tgtgtttagt    600
gacgtggacc tcattccaat gaatgaccat aatgcgtaca ggtgtttttc acagccacgg    660
cacatttccg ttgcaatgga taagtttgga ttcagcctac cttatgttca gtattttgga    720
ggtgtctctg ctctaagtaa acaacagttt ctaaccatca atggatttcc taataattat    780
tggggctggg gaggagaaga tgatgacatt tttaacagat tagtttttag aggcatgtct    840
atatctcgcc caaatgctgt ggtcgggagg tgtcgcatga tccgccactc aagagacaag    900
aaaaatgaac ccaatcctca gaggtttgac cgaattgcac acacaaagga gacaatgctc    960
tctgatggtt tgaactcact cacctaccag gtgctggatg tacagagata cccattgtat    1020
acccaaatca cagtggacat cgggacaccg agcaaggacg agctttag                 1068
<210>52
<211>355
<212>PRT
<213>杂合体
<400>52
Met Gly Ile Lys Met Glu Thr His Ser Gln Val Phe Val Lyr Met Leu
 1               5                   10                 15
Leu Trp Leu Ser Gly Val Asp Met Gln Ser Ser Gly Glu Leu Arg Thr
            20                  25                  30
Gly Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg
        35                  40                  45
Pro Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala
    50                  55                  60
Ser Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu
65                  70                  75                  80
Pro Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile
                85                   90                  95
Glu Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro
            100                 105                 110
Asn Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro
        115                 120                 125
His Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu
    130                 135                 140
Lys Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu
145                 150                 155                 160
Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr Ile Phe Asn
                165                 170                 175
Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp Tyr
            180                 185                 190
Asp Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asn
        195                 200                 205
Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser Val
    210                 215                 220
Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln Tyr Phe Gly
225                 230                 235                 240
Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly Phe
                245                 250                 255
Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn
            260                 265                 270
Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Val Val
        275                 280                 285
Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu Pro
    290                 295                 300
Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met Leu
305                 310                 315                 320
Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln Arg
                325                 330                 335
Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser Lys
            340                 345                 350
Asp Glu Leu
        355
<210>53
<211>1119
<212>DNA
<213>杂合体
<400>53
atgggcatca agatggagac acattctcag gtctttgtat acatgttgct gtggttgtct    60
ggtgtcgaca tgggacagat gcctgtggct gctgtagtgg ttatggcctg cagtcgtgca    120
gactatcttg aaaggactgt taaatcagtt ttaacatatc aaactcccgt tgcttcaaaa    180
tatcctctat ttatatctca ggatggatct gatcaagctg tcaagagcaa gtcattgagc    240
tataatcaat taacatatat gcagcacttg gattttgaac cagtggtcac tgaaaggcct    300
ggcgaactga ctgcgtacta caagattgca cgtcactaca agtgggcact ggaccagttg    360
ttttacaaac acaaatttag tcgagtgatt atactagaag atgatatgga aattgctcca    420
gacttctttg attactttga ggctgcagct agtctcatgg atagggataa aaccattatg    480
gctgcttcat catggaatga taatggacag aagcagtttg tgcatgatcc ctatgcgcta    540
taccgatcag atttttttcc tggccttggg tggatgctca agagatcgac ttgggatgag    600
ttatcaccaa agtggccaaa ggcttactgg gatgattggc tgagactaaa ggaaaaccat    660
aaaggccgcc aattcattcg accggaagtc tgtagaacat acaattttgg tgaacatggg    720
tctagtttgg gacagttttt cagtcagtat ctggaaccta taaagctaaa cgatgtgacg    780
gttgactgga aagcaaagga cctgggatac ctgacagagg gaaactatac caagtacttt    840
tctggcttag tgagacaagc acgaccaatt caaggttctg accttgtctt aaaggctcaa    900
aacataaagg atgatgttcg tatccggtat aaagaccaag tagagtttga acgcattgca    960
ggggaatttg gtatatttga agaatggaag gatggtgtgc ctcgaacagc atataaagga    1020
gtagtggtgt ttcgaatcca gacaacaaga cgtgtattcc tggttgggcc agattctgta    1080
atgcagcttg gaattcgaaa ttccaaggac gagctttga                           1119
<210>54
<211>372
<212>PRT
<213>杂合体
<400>54
Met Gly Ile Lys Met Glu Thr His Ser Gln Val Phe Val Tyr Met Leu
 1               5                  10                  15
Leu Trp Leu Ser Gly Val Asp Met Gly Gln Met Pro Val Ala Ala Val
            20                  25                   30
Val Val Met Ala Cys Ser Arg Ala Asp Tyr Leu Glu Arg Thr Val Lys
        35                  40                  45
Ser Val Leu Thr Tyr Gln Thr Pro Val Ala Ser Lys Tyr Pro Leu Phe
    50                  55                  60
Ile Ser Gln Asp Gly Ser Asp Gln Ala Val Lys Ser Lys Ser Leu Ser
65                  70                  75                   80
Tyr Asn Gln Leu Thr Tyr Met Gln His Leu Asp Phe Glu Pro Val Val
                85                  90                  95
Thr Glu Arg Pro Gly Glu Leu Thr Ala Tyr Tyr Lys Ile Ala Arg His
            100                 105                 110
Tyr Lys Trp Ala Leu Asp Gln Leu Phe Tyr Lys His Lys Phe Ser Arg
        115                 120                 125
Val Ile Ile Leu Glu Asp Asp Met Glu Ile Ala Pro Asp Phe Phe Asp
    130                 135                 140
Tyr Phe Glu Ala Ala Ala Ser Leu Met Asp Arg Asp Lys Thr Ile Met
145                 150                 155                 160
Ala Ala Ser Ser Trp Asn Asp Asn Gly G1n Lys Gln Phe Val His Asp
                165                 170                 175
Pro Tyr Ala Leu Tyr Arg Ser Asp Phe Phe Pro Gly Leu Gly Trp Met
            180                 185                 190
Leu Lys Arg Ser Thr Trp Asp Glu Leu Ser Pro Lys Trp Pro Lys Ala
        195                 200                 205
Tyr Trp Asp Asp Trp Leu Arg Leu Lys Glu Asn His Lys Gly Arg Gln
    210                 215                 220
Phe Ile Arg Pro Glu Val Cys Arg Thr Tyr Asn Phe Gly Glu His Gly
225                 230                 235                 240
Ser Ser Leu Gly Gln Phe Phe Ser Gln Tyr Leu Glu Pro Ile Lys Leu
                245                 250                 255
Asn Asp Val Thr Val Asp Trp Lys Ala Lys Asp Leu Gly Tyr Leu Thr
            260                 265                 270
Glu Gly Asn Tyr Thr Lys Tyr Phe Ser Gly Leu Val Arg Gln Ala Arg
        275                 280                 285
Pro Ile Gln Gly Ser Asp Leu Val Leu Lys Ala Gln Asn Ile Lys Asp
    290                 295                 300
Asp Val Arg Ile Arg Tyr Lys Asp Gln Val Glu Phe Glu Arg Ile Ala
305                 310                 315                 320
Gly Glu Phe Gly Ile Phe Glu Glu Trp Lys Asp Gly Val Pro Arg Thr
                325                 330                 335
Ala Tyr Lys Gly Val Val Val Phe Arg Ile Gln Thr Thr Arg Arg Val
            340                 345                 350
Phe Leu Val Gly Pro Asp Ser Val Met Gln Leu Gly Ile Arg Asn Ser
        355                 360                 365
Lys Asp Glu Leu
    370
<210>55
<211>1158
<212>DNA
<213>杂合体
<400>55
atgggcatca agatggagac acattctcag gtctttgtat acatgttgct gtggttgtct    60
ggtgtcgaca tggctctaag gttgcataga aggaaccatt tttcgcctag aaatacggat    120
ctgttcccgg atttggcaaa agatcgtgtg gttatcgtct tgtatgtgca taatcgggct    180
cagtattttc gagtcacagt ggaaagtttg tcgaaggtta aaggtataag tgagacattg    240
ttgattgtta gtcatgatgg ttactttgaa gagatgaata ggattgtgga gagtattaag    300
ttttgtcaag tgaaacagat tttctcgcct tattcgcctc atatatatcg tactagcttc    360
ccgggtgtga ccctgaatga ttgtaagaac aagggtgatg aggcaaaggg gcattgtgaa    420
ggtaatcctg atcagtatgg gaatcatcgg tctccgaaga ttgtatcttt gaagcatcac    480
tggtggtgga tgatgaacac tgtatgggat gggttggaag agactaaagg acatgagggg    540
catatccttt tcattgaaga agatcatttt ctgtttccta atgcctatcg taacatacag    600
actcttacga ggctgaaacc cgcaaagtgt cctgactgtt ttgctgctaa tttagcaccg    660
tctgatgtga agtcaagagg agaagggctt gaaagtttgg ttgcagagag aatgggaaat    720
gttgggtatt cttttaatag aagtgtgtgg gagaatattc atcagaaggc aagagagttt    780
tgtttctttg atgattacaa ctgggatata acgatgtggg caacggtttt cccgtcgttt    840
ggttccccgg tgtacacatt gcgagggcct aggactagtg cggtacactt tggaaaatgt    900
gggttgcatc aaggtagagg agatgagggt gattgcatcg ataatggggt cgtaaacata    960
gaagttaagg aaacagataa agttgtgaac ataaaagaag gatggggagt tcgggtgtat    1020
aagcatcaag cgggttataa agccggtttc gaaggttggg gaggttgggg cgatgatagg    1080
gaccgacatt tatgtttgga ttttgccact atgtatcgtt acagcagtag cagtgcatct    1140
ccaaaggacg agctttga                                                  1158
<210>56
<211>385
<212>PRT
<213>杂合体
<400>56
Met Gly Ile Lys Met Glu Thr His Ser Gln Val Phe Val Tyr Met Leu
 1               5                  10                   15
Leu Trp Leu Ser Gly Val Asp Met Ala Leu Arg Leu His Arg Arg Asn
            20                  25                   30
His Phe Ser Pro Arg Asn Thr Asp Leu Phe Pro Asp Leu Ala Lys Asp
        35                  40                   45
Arg Val Val Ile Val Leu Tyr Val His Asn Arg Ala Gln Tyr Phe Arg
    50                  55                  60
Val Thr Val Glu Ser Leu Ser Lys Val Lys Gly Ile Ser Glu Thr Leu
65                  70                  75                  80
Leu Ile Val Ser His Asp Gly Tyr Phe Glu Glu Met Asn Arg Ile Val
                85                  90                  95
Glu Ser Ile Lys Phe Cys Gln Val Lys Gln Ile Phe Ser Pro Tyr Ser
            100                 105                 110
Pro His Ile Tyr Arg Thr Ser Phe Pro Gly Val Thr Leu Asn Asp Cys
        115                 120                 125
Lys Asn Lys Gly Asp Glu Ala Lys Gly His Cys Glu Gly Asn Pro Asp
    130                 135                 140
Gln Tyr Gly Asn His Arg Ser Pro Lys Ile Val Ser Leu Lys His His
145                 150                 155                 160
Trp Trp Trp Met Met Asn Thr Val Trp Asp Gly Leu Glu Glu Thr Lys
                165                 170                 175
Gly His Glu Gly His Ile Leu Phe Ile Glu Glu Asp His Phe Leu Phe
            180                 185                 190
Pro Asn Ala Tyr Arg Asn Ile Gln Thr Leu Thr Arg Leu Lys Pro Ala
        195                 200                 205
Lys Cys Pro Asp Cys Phe Ala Ala Asn Leu Ala Pro Ser Asp Val Lys
    210                 215                 220
Sar Arg Gly Glu Gly Leu Glu Ser Leu Val Ala Glu Arg Met Gly Asn
225                 230                 235                 24D
Va1 Gly Tyr Ser Phe Asn Arg Ser Val Trp Glu Asn Ile His Gln Lys
                245                 250                 255
Ala Arg Glu Phe Cys Phe Phe Asp Asp Tyr Asn Trp Asp Ile Thr Met
            260                 265                 270
Trp Ala Thr Val Phe Pro Ser Phe Gly Ser Pro Val Tyr Thr Leu Arg
        275                 280                 285
Gly Pro Arg Thr Ser Ala Val His Phe Gly Lys Cys Gly Leu His Gln
    290                 295                 300
Gly Arg Gly Asp Glu Gly Asp Cys Ile Asp Asn Gly Val Val Asn Ile
305                 310                 315                 320
Glu Val Lys Glu Thr Asp Lys Val Val Asn Ile Lys Glu Gly Trp Gly
                325                 330                 335
Val Arg Val Tyr Lys His Gln Ala Gly Tyr Lys Ala Gly Phe Glu Gly
            340                 345                 350
Trp Gly Gly Trp Gly Asp Asp Arg Asp Arg His Leu Cys Leu Asp Phe
        355                 360                 365
Ala Thr Met Tyr Arg Tyr Ser Ser Ser Ser Ala Ser Pro Lys Asp Glu
    370                 375                 380
Leu
385
<210>57
<211>1152
<212>DNA
<213>类人
<400>57
atgctgaaga agcagtctgc agggcttgtg ctgtggggcg ctatcctctt tgtggcctgg     60
aatgccctgc tgctcctctt cttctggacg cgcccagcac ctggcaggcc accctcagtc    120
agcgctctcg atggcgaccc cgccagcctc acccgggaag tcgacatgca gtcctccggg    160
gagctccgga ccggaggggc ccggccgccg cctcctctag gcgcctcctc ccagccgcgc    240
ccgggtggcg actccagccc agtcgtggat tctggccctg gccccgctag caacttgacc    300
tcggtcccag tgccccacac caccgcactg tcgctgcccg cctgccctga ggagtccccg    360
ctgcttgtgg gccccatgct gattgagttt aacatgcctg tggacctgga gctcgtggca    420
aagcagaacc caaatgtgaa gatgggcggc cgctatgccc ccagggactg cgtctctcct    480
cacaaggtgg ccatcatcat tccattccgc aaccggcagg agcacctcaa gtactggcta    540
tattatttgc acccagtcct gcagcgccag cagctggact atggcatcta tgttatcaac    600
caggcgggag acactatatt caatcgtgct aagctcctca atgttggctt tcaagaagcc    660
ttgaaggact atgactacac ctgctttgtg tttagtgacg tggacctcat tccaatgaat    720
gaccataatg cgtacaggtg tttttcacag ccacggcaca tttccgttgc aatggataag    780
tttggattca gcctacctta tgttcagtat tttggaggtg tctctgctct aagtaaacaa    840
cagtttctaa ccatcaatgg atttcctaat aattattggg gctggggagg agaagatgat    900
gacattttta acagattagt ttttagaggc atgtctatat ctcgcccaaa tgctgtggtc    960
gggaggtgtc gcatgatccg ccactcaaga gacaagaaaa atgaacccaa tcctcagagg    1020
tttgaccgaa ttgcacacac aaaggagaca atgctctctg atggtttgaa ctcactcacc    1080
taccaggtgc tggatgtaca gagataccca ttgtataccc aaatcacagt ggacatcggg    1140
acaccgagct ag                                                        1152
<210>58
<211>383
<212>PRT
<213>类人
<400>58
Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Leu
 1               5                  10                  15
Phe Val Ala Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Thr Arg Pro
            20                  25                  30
Ala Pro Gly Arg Pro Pro Ser Val Ser Ala Leu Asp Gly Asp Pro Ala
        35                  40                  45
Ser Leu Thr Arg Glu Val Asp Met Gln Ser Ser Gly Glu Leu Arg Thr
    50                  55                  60
Gly Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg
65                  70                  75                  80
Pro Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala
                85                  90                  95
Ser Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu
            100                 105                 110
Pro Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile
        115                 120                 125
Glu Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro
    130                 135                 140
Asn Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro
145                 150                 155                 160
His Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu
                165                 170                 175
Lys Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu
            180                 185                 190
Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr Ile Phe Asn
        195                 200                 205
Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp Tyr
    210                 215                 220
Asp Tyr Thr Cys Phe Va1 Phe Ser Asp Val Asp Leu Ile Pro Met Asn
225                 230                 235                 240
Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser Val
                245                 250                 255
Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln Tyr Phe Gly
            260                 265                 270
Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly Phe
        275                 280                 285
Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn
    290                 295                 300
Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Val Val
305                 310                 315                 320
Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu Pro
                325                 330                 335
Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met Leu
            340                 345                 350
Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln Arg
        355                 360                 365
Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser
    370                 375                 380
<210>59
<211>400
<212>PRT
<213>类人
<400>59
Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ala Ala Met Pro Gly AIa
 1               5                  10                  15
Ser Leu Gln Arg Ala Cys Arg Leu Leu Val Ala Val Cys Ala Leu His
            20                  25                  30
Leu Gly Val Thr Leu Val Tyr Tyr Leu Ala Gly Arg Asp Leu Ser Arg
        35                  40                  45
Leu Pro Gln Leu Val Gly Val Ser Thr Pro Leu Gln Gly Gly Ser Asn
    50                  55                   60
Ser Ala Ala Ala Ile Gly Gln Ser Ser Gly Glu Leu Arg Thr Gly Gly
65                  70                  75                  80
Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg Pro Gly
                85                  90                  95
Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala Ser Asn
            100                 105                 110
Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu Pro Ala
        115                 120                 125
Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile Glu Phe
    130                 135                 140
Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro Asn Val
145                 150                 155                 160
Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro His Lys
                165                 170                 175
Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu Lys Tyr
            180                 185                 190
Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu Asp Tyr
        195                 200                 205
Gly Ile Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr Ile Phe
    210                 215                 220
Asn Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp
225                 230                 235                 240
Tyr Asp Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met
                245                 250                 255
Asn Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser
            260                 265                 270
Val Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln Tyr Phe
        275                 280                 285
Gly Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly
    290                 295                 300
Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe
305                 310                 315                 320
Asn Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Val
                325                 330                 335
Val Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu
            340                 345                 350
Pro Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met
        355                 360                 365
Leu Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln
    370                 375                 380
Arg Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser
385                 390                 395                 400

Claims (53)

1.编码杂合酶的核酸,所述杂合酶包含植物糖基转移酶的跨膜区和哺乳动物糖基转移酶的催化区。
2.权利要求1的核酸,其中所述植物糖基转移酶是木糖基转移酶。
3.权利要求1的核酸,其中所述植物糖基转移酶是N-乙酰葡糖胺基转移酶。
4.权利要求1的核酸,其中所述植物糖基转移酶是海藻糖基转移酶。
5.权利要求1的核酸,其中所述哺乳动物糖基转移酶是人半乳糖基转移酶。
6.权利要求5的核酸,其中所述人半乳糖基转移酶是由至少SEQ ID NO:1的核酸序列的一部分编码。
7.一种表达载体,包含权利要求1的核酸。
8.一种用权利要求7的载体转染的宿主细胞。
9.权利要求8的宿主细胞,其中所述宿主细胞是植物细胞。
10.一种细胞悬浮液,包含权利要求9的宿主细胞。
11.由权利要求9的植物细胞表达的杂合酶。
12.包含权利要求9的宿主细胞的植物。
13.编码一种杂合酶的核酸,所述杂合酶包含第一个糖基转移酶的跨膜区和第二个糖基转移酶的催化区。
14.权利要求13的核酸,其中所述第一个糖基转移酶包含植物糖基转移酶。
15.权利要求14的核酸,其中所述植物糖基转移酶是木糖基转移酶。
16.权利要求14的核酸,其中所述植物糖基转移酶是海藻糖基转移酶。
17.权利要求13的核酸,其中所述第二个糖基转移酶包含哺乳动物糖基转移酶。
18.权利要求17的核酸,其中所述哺乳动物糖基转移酶是人半乳糖基转移酶。
19.权利要求13的核酸,其中所述第一个糖基转移酶包含第一个哺乳动物糖基转移酶和所述第二个糖基转移酶包含第二个哺乳动物糖基转移酶。
20.权利要求19的核酸,其中所述第一个哺乳动物糖基转移酶是非人类糖基转移酶。
21.权利要求19的核酸,其中所述第二个哺乳动物糖基转移酶是人糖基转移酶。
22.一种方法,包含:
a)提供:i)一种植物细胞,和ii)一种包含编码杂合酶的核酸的表达载体,所述杂合酶包含植物糖基转移酶的跨膜区和哺乳动物糖基转移酶的催化区;和
b)在使得所述杂合酶被表达的条件下,将所述表达载体导入所述植物细胞。
23.权利要求22的方法,其中所述植物糖基转移酶是木糖基转移酶。
24.权利要求23的方法,其中所述植物糖基转移酶是N-乙酰葡糖胺基转移酶。
25.权利要求23的方法,其中所述植物糖基转移酶是海藻糖基转移酶。
26.权利要求22的方法,其中所述哺乳动物糖基转移酶是人半乳糖基转移酶。
27.权利要求26的方法,其中所述人半乳糖基转移酶是由至少SEQ ID NO:1的核酸序列的一部分编码。
28.一种方法,包含:
a)提供:i)一种植物细胞,和ii)包含编码杂合酶的核酸的第一种表达载体,所述杂合酶包含植物糖基转移酶的跨膜区和哺乳动物糖基转移酶的催化区;和iii)包含编码异源糖蛋白的核酸的第二个表达载体,和;
b)在使得所述杂合酶被表达的条件下,将所述第一和第二种载体导入所述植物细胞。
29.权利要求28的方法,其中所述异源蛋白是一种抗体或抗体片段。
30.一种方法,包含:
a)提供:i)包含第一种表达载体的第一种植物,所述第一个载体包含编码杂合酶的核酸,所述杂合酶包含至少植物糖基转移酶的跨膜区的一部分和至少哺乳动物糖基转移酶的催化区的一部分,和ii)包含第二个表达载体的第二种植物,所述第二个载体包含编码异源蛋白的核酸;和
b)杂交所述第一种植物和第二种植物来制备表达所述杂合酶和所述异源蛋白的子代。
31.一种植物,包含第一个和第二个表达载体,所述第一个载体包含编码杂合酶的核酸,所述杂合酶包含至少植物糖基转移酶的跨膜区的一部分和至少哺乳动物糖基转移酶的催化区的一部分,所述第二个载体包含编码异源蛋白的核酸。
32.权利要求31的植物,其中所述异源蛋白与异源蛋白在无所述杂合酶的植物中被表达相比,表现为海藻糖含量降低。
33.权利要求31的植物,其中异源蛋白与所述异源蛋白在无所述杂合酶的植物中的表达相比,表现为木糖含量降低。
34.权利要求31的植物,其中异源蛋白与所述异源蛋白在无所述杂合酶的植物中的表达相比,表现为海藻糖和木糖含量都降低。
35.权利要求31的植物,其中异源蛋白具有复合型双触角聚糖,并且至少一个臂上含有半乳糖残基。
36.编码杂合酶的核酸,所述杂合酶包含被修饰的哺乳动物糖基转移酶,其中跨膜部分被删除而插入内质网滞留信号。
37.编码杂合酶的核酸,所述杂合酶包含植物糖基转移酶的CTS区或其部分和哺乳动物糖基转移酶的催化区,其中所述CTS区来自N-乙酰葡糖胺基转移酶I(GnT I),所述催化区来自甘露糖苷酶II(Man II)。
38.编码杂合酶的核酸,所述杂合酶包含植物糖基转移酶的CTS区或其部分和哺乳动物糖基转移酶的催化区,其中所述CTS区或其部分来自N-乙酰葡糖胺基转移酶I(GnT I),所述催化区来自N-乙酰葡糖胺基转移酶II(GnT II)。
39.一种植物宿主系统,包含(a)编码甘露糖苷酶III糖基转移酶的核酸序列;(b)编码杂合酶的核酸序列,所述杂合酶包含植物糖基转移酶的CTS区或其部分和哺乳动物糖基转移酶的催化区。
40.一种方法,包含(a)往所述植物宿主系统中导入一个载体,其包含i)编码杂合酶的核酸序列,杂合酶包含通常不存在于植物的半乳糖基转移酶的催化区和一种蛋白的跨膜区,ii)编码包含N-乙酰葡糖胺基转移酶I(GnT I)的跨膜区和甘露糖苷酶II(Man II)的催化区的杂合酶的核酸序列,iii)编码包含N-乙酰葡糖胺基转移酶I(GnT I)的跨膜区和N-乙酰葡糖胺基转移酶II(GnT II)的催化区的杂合酶的核酸序列;和(b)分离表达所述核酸序列的植物或其部分。
41.一种方法,包含:
(a)提供i)一种宿主细胞,和ii)包含编码杂合酶的核酸的表达载体,所述杂合酶包含第一个糖基转移酶的跨膜区和第二个糖基转移酶的催化区;和
(b)在使得所述杂合酶被表达的条件下,将所述表达载体导入所述宿主系统中。
42.权利要求41的方法,其中所述第一个糖基转移酶包含植物糖基转移酶。
43.权利要求42的方法,其中所述植物糖基转移酶是木糖基转移酶。
44.权利要求42的方法,其中所述植物糖基转移酶是N-乙酰葡糖胺基转移酶。
45.权利要求42的方法,其中所述植物糖基转移酶是海藻糖基转移酶。
46.权利要求41的方法,其中所述第二个糖基转移酶包含哺乳动物糖基转移酶。
47.权利要求46的方法,其中所述哺乳动物糖基转移酶是人半乳糖基转移酶。
48.一种方法,包含:
(a)提供i)一种宿主细胞,和ii)包含编码杂合酶的核酸的第一种表达载体,所述杂合酶包含第一个糖基转移酶的跨膜区和第二个糖基转移酶的催化区;和iii)包含编码异源糖蛋白的核酸的第二个表达载体;和
(b)在使得所述杂合酶和异源蛋白被表达的条件下,将所述第一种和第二种表达载体导入所述宿主系统中,。
49.权利要求48的方法,其中所述异源蛋白是抗体或抗体片段。
50.权利要求48的方法,还包括步骤c)分离所述异源蛋白。
51.按照权利要求50的方法制备的分离的异源蛋白。
52.一种宿主细胞,包含第一种和第二种表达载体,所述第一个载体包含编码杂合酶的核酸,所述杂合酶包含至少第一个糖基转移酶的跨膜部分的一部分和至少第二个糖基转移酶的催化区的一部分,所述第二个载体包含编码异源蛋白的核酸。
53.从权利要求52的宿主细胞分离的异源蛋白。
CNB038065479A 2002-03-19 2003-03-18 在植物中优化聚糖生成 Expired - Fee Related CN100532558C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US36573502P 2002-03-19 2002-03-19
US60/365,735 2002-03-19

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN200910149525A Division CN101613705A (zh) 2002-03-19 2003-03-18 在植物中优化聚糖生成

Publications (2)

Publication Number Publication Date
CN1756844A true CN1756844A (zh) 2006-04-05
CN100532558C CN100532558C (zh) 2009-08-26

Family

ID=28042042

Family Applications (2)

Application Number Title Priority Date Filing Date
CN200910149525A Pending CN101613705A (zh) 2002-03-19 2003-03-18 在植物中优化聚糖生成
CNB038065479A Expired - Fee Related CN100532558C (zh) 2002-03-19 2003-03-18 在植物中优化聚糖生成

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN200910149525A Pending CN101613705A (zh) 2002-03-19 2003-03-18 在植物中优化聚糖生成

Country Status (11)

Country Link
US (3) US7601891B2 (zh)
EP (3) EP1485486B1 (zh)
JP (4) JP4532118B2 (zh)
KR (3) KR101060361B1 (zh)
CN (2) CN101613705A (zh)
AR (1) AR039013A1 (zh)
AU (1) AU2003219418B2 (zh)
CA (3) CA2923247A1 (zh)
HK (2) HK1124364A1 (zh)
NZ (1) NZ534880A (zh)
WO (1) WO2003078637A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102648280A (zh) * 2009-09-22 2012-08-22 沃尔克·桑迪希 生产含有特定聚糖结构之分子的方法
CN104962579A (zh) * 2007-06-15 2015-10-07 麦迪卡格公司 修饰植物中的糖蛋白产生

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR9917026B1 (pt) 1998-12-09 2010-10-19 método para fabricar glicoproteìnas tendo glicosilação do tipo humano.
DE60044858D1 (de) 1999-10-26 2010-09-30 Stichting Dienst Landbouwkundi Säugetierartige Glykosylierung in Pflanzen
US7625756B2 (en) * 2000-06-28 2009-12-01 GycoFi, Inc. Expression of class 2 mannosidase and class III mannosidase in lower eukaryotic cells
CN100385006C (zh) 2001-01-19 2008-04-30 陶氏化学公司 利用植物细胞分泌性生产具有人型糖链的糖蛋白的方法
AU2002236234B2 (en) * 2001-03-06 2007-12-20 Phyton Holdings, LLC. Plant cell having animal-type sugar chain adding function
WO2003078614A2 (en) 2002-03-19 2003-09-25 Plant Research International B.V. Gntiii (udp-n-acethylglucosamine:beta-d mannoside beta (1,4)-n-acethylglucosaminy ltransferase iii) expression in plants
US7601891B2 (en) 2002-03-19 2009-10-13 Plant Research International B.V. Optimizing glycan processing plants
CL2003002461A1 (es) * 2002-11-27 2005-01-07 Dow Chemical Company Agroscien Inmunoglobulina que comprende al menos un glicano afucosilado, composicion que la contiene, secuencia nucleotidica y vector que la comprende, procedimiento para producir dicha inmunoglobulina en plantas.
JP4559358B2 (ja) * 2002-12-20 2010-10-06 グリーンオベーション バイオテク ゲーエムベーハー コケ細胞における異種グリコシル化タンパク質の産生
JP5502328B2 (ja) 2006-02-09 2014-05-28 メディカゴ インコーポレイテッド 植物体中でのシアル酸の合成
EP1867722A1 (en) * 2006-06-16 2007-12-19 Plant Research International B.V. Synthesis of lewis X epitopes on proteins in plants
RU2481399C2 (ru) * 2006-11-08 2013-05-10 Сентр Насьональ Де Ла Решерш Сьентифик-Снрс Набор последовательностей для таргетинга экспрессии и контроля посттрансляционных модификаций рекомбинантного полипептида
PL3199180T3 (pl) 2007-03-08 2022-08-08 Humanigen, Inc. Przeciwciała przeciwko epha3 do leczenia guzów litych
US8829276B2 (en) 2007-04-17 2014-09-09 Stichting Dienst Landbouwkundig Onderzoek Mammalian-type glycosylation in plants by expression of non-mammalian glycosyltransferases
CN102165062B (zh) 2008-07-18 2017-09-08 麦迪卡格公司 新的流感病毒免疫表位
WO2010102244A1 (en) 2009-03-06 2010-09-10 Kalobios Pharmaceuticals, Inc. Treatment of leukemias and chronic myeloproliferative diseases with antibodies to epha3
AU2010262087B9 (en) * 2009-06-15 2015-07-30 Icon Genetics Gmbh Nicotiana benthamiana plants deficient in xylosyltransferase activity
CA2777068C (en) 2009-10-14 2020-05-26 Kalobios Pharmaceuticals, Inc. Antibodies to epha3
EP2551348B1 (en) 2011-07-29 2014-09-24 Icon Genetics GmbH Production of galactosylated N-glycans in plants
US20150119325A1 (en) * 2012-05-29 2015-04-30 North Carolina Central University Methods for the production of cytoprotective asialo-erythropoietin in plants and its purification from plant tissues
WO2014084640A1 (en) 2012-11-28 2014-06-05 Samsung Electronics Co., Ltd. Method and apparatus for performing communication in a wireless communication system
EP3221455B1 (en) * 2014-11-20 2020-08-12 Yissum Research and Development Company of the Hebrew University of Jerusalem Ltd. Compositions and methods for producing polypeptides with a modified glycosylation pattern in plant cells
EP3265567B1 (en) 2015-03-02 2020-07-29 Conagen Inc. Regulatory elements from labyrinthulomycetes microorganisms
JP6936150B2 (ja) 2015-03-17 2021-09-15 エレヴァ・ゲゼルシャフト・ミット・ベシュレンクテル・ハフツングeleva GmbH グリコシル化リソソームタンパク質、その製造方法および使用
KR20180015650A (ko) 2015-05-07 2018-02-13 아게누스 인코포레이티드 항-ox40 항체 및 이의 사용 방법
EP3512883A1 (en) 2016-09-13 2019-07-24 Humanigen, Inc. Epha3 antibodies for the treatment of pulmonary fibrosis
US10457970B2 (en) 2016-11-01 2019-10-29 Conagen Inc. Expression of modified glycoproteins and glycopeptides
US10633454B2 (en) 2016-11-01 2020-04-28 Conagen Inc. Expression of modified glycoproteins and glycopeptides
EP3548612A4 (en) 2016-12-01 2020-04-15 Plantform Corporation TRANSGENIC PLANT WITH REDUCED FUCOSYL TRANSFERASE AND XYLOSYL TRANSFERASE ACTIVITY
AU2017373945A1 (en) 2016-12-07 2019-06-20 Agenus Inc. Antibodies and methods of use thereof
KR20200031571A (ko) 2017-05-29 2020-03-24 가마맵스 파마 암 연관 면역억제의 억제제
UA128472C2 (uk) 2017-08-25 2024-07-24 Файв Прайм Терапеутікс Інк. B7-h4 антитіла і методи їх використання
JP7258038B6 (ja) 2018-02-21 2023-04-25 ファイヴ プライム セラピューティクス インク B7-h4抗体の投薬計画
MA51903A (fr) 2018-02-21 2021-05-26 Five Prime Therapeutics Inc Formulations d'anticorps b7-h4
CA3091801A1 (en) 2018-03-02 2019-09-06 Five Prime Therapeutics, Inc. B7-h4 antibodies and methods of use thereof
BR112021007134A2 (pt) 2018-10-15 2021-08-10 Five Prime Therapeutics, Inc. terapia combinada para câncer
CA3182150A1 (en) 2020-05-17 2021-11-25 Astrazeneca Uk Limited Sars-cov-2 antibodies and methods of selecting and using the same
CN115867571A (zh) * 2020-05-19 2023-03-28 动量制药公司 高唾液酸化免疫球蛋白
JP2023537078A (ja) 2020-08-10 2023-08-30 アストラゼネカ・ユーケイ・リミテッド COVID-19を治療及び防止するためのSARS-CoV-2抗体
US11821014B2 (en) * 2020-12-15 2023-11-21 Frito-Lay North America, Inc. Production of gentisic acid 5-O-β-D xylopyranoside
TW202342095A (zh) 2021-11-05 2023-11-01 英商阿斯特捷利康英國股份有限公司 用於治療和預防covid—19之組成物
TW202342510A (zh) 2022-02-18 2023-11-01 英商Rq生物科技有限公司 抗體
WO2023209177A1 (en) 2022-04-29 2023-11-02 Astrazeneca Uk Limited Sars-cov-2 antibodies and methods of using the same
WO2024154002A1 (en) * 2023-01-19 2024-07-25 Asterix Foods Ltd Glycosylated animal protein expression in plant cells

Family Cites Families (81)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5455790A (en) 1977-10-05 1979-05-04 Tomoyuki Tajima Production of erythropoetin
JPS5616496A (en) 1979-07-20 1981-02-17 Sumitomo Chem Co Ltd Recovery of erythropoietin
JPS5653696A (en) 1979-10-09 1981-05-13 Ajinomoto Co Inc Isolation of erythropoietin by adsorption
JPS56108798A (en) 1980-02-01 1981-08-28 Green Cross Corp:The Purification of erythropoietin
JPS57149228A (en) 1981-03-11 1982-09-14 Ajinomoto Co Inc Novel erythropoietin and its preparation
JPS57169424A (en) 1981-04-10 1982-10-19 Toyo Shinyaku Kk Preparation of erythropoietin
US5352605A (en) 1983-01-17 1994-10-04 Monsanto Company Chimeric genes for transforming plant cells using viral promoters
US4956282A (en) 1985-07-29 1990-09-11 Calgene, Inc. Mammalian peptide expression in plant cells
US5179198A (en) 1988-07-11 1993-01-12 Hidechika Okada Glycoprotein and gene coding therefor
US5141131A (en) 1989-06-30 1992-08-25 Dowelanco Method and apparatus for the acceleration of a propellable matter
US6051753A (en) 1989-09-07 2000-04-18 Calgene, Inc. Figwort mosaic virus promoter and uses
US5032519A (en) 1989-10-24 1991-07-16 The Regents Of The Univ. Of California Method for producing secretable glycosyltransferases and other Golgi processing enzymes
US5541083A (en) 1989-10-24 1996-07-30 The Regents Of The University Of California Method for producing secretable glycosyltransferases and other golgi processing enzymes
US5202422A (en) 1989-10-27 1993-04-13 The Scripps Research Institute Compositions containing plant-produced glycopolypeptide multimers, multimeric proteins and method of their use
US5959177A (en) 1989-10-27 1999-09-28 The Scripps Research Institute Transgenic plants expressing assembled secretory antibodies
WO1991016449A1 (en) 1990-04-16 1991-10-31 The Trustees Of The University Of Pennsylvania Saccharide compositions, methods and apparatus for their synthesis
US5096818A (en) 1990-06-04 1992-03-17 Autogen Instruments, Inc. Nucleic acid separation method
EP0489166A4 (en) 1990-06-21 1992-11-19 Nippon Shokubai Kagaku Kogyo Co. Ltd. Process for producing n-substituted aziridine compound
DE69232259T2 (de) 1991-04-18 2002-06-13 Toray Industries, Inc. Verfahren zur Herstellung von Interleukin-6 Zusammensetzungen
US5874271A (en) * 1992-08-21 1999-02-23 Takara Shuzo Co., Ltd. Human glycosyltransferase gene, compounds and method for inhibiting cancerous metastasis
CA2148929A1 (en) 1992-11-27 1994-06-09 Eric G. Berger Proteins having glycosyltransferase activity
CN1129953A (zh) 1993-07-15 1996-08-28 尼奥斯药品公司 糖组分的合成方法
WO1995018217A1 (fr) 1993-12-24 1995-07-06 The Institute Of Physical And Chemical Research Nouvelle synthetase a chaine de sucres, et procede pour produire cette derniere
CA2158733C (en) 1994-01-21 2007-01-16 Dennis E. Mccabe Gas driven gene delivery instrument
WO1995021248A1 (en) 1994-02-03 1995-08-10 The Scripps Research Institute Method for using tobacco mosaic virus to overproduce peptides and proteins
CA2146712C (en) 1995-04-10 2002-06-25 Jas Singh Cold induced promoter from winter brassica napus
US5723755A (en) 1995-05-16 1998-03-03 Francis E. Lefaivre Large scale production of human or animal proteins using plant bioreactors
US5939288A (en) * 1995-06-07 1999-08-17 Iowa State University Research Foundation, Inc. Plant secretory signal peptides and nectarins
FR2736930B1 (fr) * 1995-07-17 1997-09-19 Biocem Procede de production, par des cellules vegetales, de proteines heminiques, proteines ainsi obtenues et produits contenant ces proteines
AU6504796A (en) 1995-07-20 1997-02-18 Washington State University Research Foundation Production of secreted foreign polypeptides in plant cell culture
EP0816503B1 (en) 1996-01-24 2006-07-05 Toyo Boseki Kabushiki Kaisha Alpha-1-6 fucosyltransferases
US7001998B2 (en) * 1996-08-02 2006-02-21 The Austin Research Institute Nucleic acids encoding a chimeric glycosyltransferase
IL130964A0 (en) 1997-01-16 2001-01-28 Cytel Corp Practical in vitro sialylation of recombinant glycoproteins
US6087115A (en) 1997-01-22 2000-07-11 Cornell Research Foundation, Inc. Methods of identifying negative antagonists for G protein coupled receptors
JP3921271B2 (ja) 1997-05-16 2007-05-30 生化学工業株式会社 グルクロン酸転移酵素をコードするdna
JP4003093B2 (ja) 1997-07-29 2007-11-07 東洋紡績株式会社 糖類の製造方法
AU1585999A (en) 1997-11-12 1999-05-31 Neurotherapeutics Methods for the detection and treatment of disease using a glycosyltransferase
WO1999025855A1 (en) 1997-11-18 1999-05-27 Pioneer Hi-Bred International, Inc. Mobilization of viral genomes from t-dna using site-specific recombination systems
DE19754622A1 (de) 1997-12-09 1999-06-10 Antje Von Dr Schaewen Pflanzliche GntI-Sequenzen und Verwendung derselben zur Gewinnung von Pflanzen mit verminderter oder fehlender N-Acetylglucosaminyltransferase I (GnTI)-Aktivität
US6096546A (en) 1998-01-30 2000-08-01 Board Of Trustees, Rutgers, The State University Of New Jersey Methods for recovering polypeptides from plants and portions thereof
FR2774379B1 (fr) 1998-01-30 2002-03-29 Groupe Limagrain Holding Procede de production, par des cellules vegetales, d'alpha 1-antitrypsine et de ses variantes, et produits contenant l'alpha-antitrypsine ainsi obtenue
US5955282A (en) 1998-04-03 1999-09-21 Incyte Pharmaceuticals, Inc. Human galactosyltransferases
WO1999054342A1 (en) 1998-04-20 1999-10-28 Pablo Umana Glycosylation engineering of antibodies for improving antibody-dependent cellular cytotoxicity
IL126967A (en) 1998-11-09 2002-09-12 Lightech Electronics Ind Ltd Electronic transformer for lighting
JP2002530087A (ja) 1998-11-18 2002-09-17 ネオーズ テクノロジーズ, インコーポレイテッド オリゴ糖の安価な産生
BR9917026B1 (pt) * 1998-12-09 2010-10-19 método para fabricar glicoproteìnas tendo glicosilação do tipo humano.
US6416988B1 (en) 1998-12-10 2002-07-09 Zymogenetics, Inc. Beta-1,3-galactosyltransferase homologs
AT408446B (de) 1999-02-18 2001-11-26 Altmann Friedrich Dr Fucosyltransferase-gen
JP2000245470A (ja) 1999-02-26 2000-09-12 Noda Inst For Scient Res 植物細胞間液による外来ポリペプチドの製造方法
AU3388400A (en) 1999-03-02 2000-09-21 Human Genome Sciences, Inc. Human glycosylation enzymes
JP2000287692A (ja) 1999-04-09 2000-10-17 Mitsui Chemicals Inc 糖タンパク質の有するn−結合型糖鎖の組成中、分岐数が異なる糖鎖の含有割合を制御する方法
US6376747B1 (en) 1999-08-27 2002-04-23 Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Agriculture And Agri-Food Canada Plant-derived map kinase kinase
WO2001029241A2 (en) 1999-10-15 2001-04-26 Calgene Llc Methods and vectors for site-specific recombination in plant cell plastids
CA2388432A1 (en) 1999-10-21 2001-04-26 Monsanto Company Post-translational modification of recombinant proteins produced in plants
DE60044858D1 (de) 1999-10-26 2010-09-30 Stichting Dienst Landbouwkundi Säugetierartige Glykosylierung in Pflanzen
AU1738301A (en) * 1999-10-26 2001-05-08 Id-Lelystad, Instituut Voor Dierhouderij En Diergezondheid B.V. Gonadotrophins in plants
JP2001546898A (en) 1999-12-21 2003-06-10 Kyowa Hakko Kogyo Kk MODIFIED alpha -1,2-FUCOSYLTRANSFERASE GENE AND PROCESS FOR PRODUCING alpha -1,2-FUCOSYLTRANSFERASE AND FUCOSE-CONTAINING SUGAR CHAIN
FR2803307A1 (fr) 1999-12-30 2001-07-06 Centre Nat Rech Scient Lignees de lymphocytes t cd4 specifiques de type th1 et procede pour leur induction ex vivo
WO2001049831A2 (en) 1999-12-30 2001-07-12 Knut Kleesiek Xylosyltransferase and isoforms thereof
EP1257641A2 (en) 2000-02-24 2002-11-20 University of Guelph Method of modulating glycosylation pathways
US20020174453A1 (en) 2001-04-18 2002-11-21 Henry Daniell Production of antibodies in transgenic plastids
AT409381B (de) 2000-03-03 2002-07-25 Gloessl Josef Dr Xylosyltransferase-gen
FR2808286B1 (fr) 2000-04-26 2004-12-17 Agronomique Inst Nat Rech Nouvelle glucosidase i de plante et son application a la production de proteines recombinantes a glycosylation modifiee
AU2001250573A1 (en) 2000-04-28 2001-11-12 Michel Xilinas Treatment of pathological conditions influenced by the action of matrix metalloproteinases (mmps) using phanquinone
HUP0302299A2 (hu) 2000-05-12 2003-10-28 Neose Technologies, Inc. Rekombináns glikopeptidek glikozilezési mintázatának in vitro módosítása
ES2330330T3 (es) * 2000-06-28 2009-12-09 Glycofi, Inc. Procedimiento de produccion de glucoproteinas modificadas.
AU2002222965A1 (en) 2000-07-19 2002-01-30 Digimarc Corporation Print media with embedded messages for controlling printing
TW519716B (en) * 2000-12-19 2003-02-01 Tokyo Electron Ltd Wafer bias drive for a plasma source
CN100385006C (zh) 2001-01-19 2008-04-30 陶氏化学公司 利用植物细胞分泌性生产具有人型糖链的糖蛋白的方法
AU2002236234B2 (en) 2001-03-06 2007-12-20 Phyton Holdings, LLC. Plant cell having animal-type sugar chain adding function
WO2003001187A1 (de) 2001-06-22 2003-01-03 Siemens Building Technologies Ag Video-rauchdetektionssystem und verfahren zu dessen überprüfung
CN1473452A (zh) 2001-07-09 2004-02-04 IBIDEN�ɷ����޹�˾ 陶瓷加热器与陶瓷接合体
SE519261C2 (sv) 2001-07-17 2003-02-04 Sca Hygiene Prod Ab Absorberande alster
WO2003007861A1 (en) 2001-07-20 2003-01-30 Cutmed Ltd. System for performing a micro-drilling procedure in human or animal and a method for use thereof
CN1555411A (zh) 2001-08-03 2004-12-15 ���迨�����\���ɷݹ�˾ 抗体-依赖性细胞毒性增大的抗体糖基化变体
US20030175755A1 (en) 2002-03-05 2003-09-18 Yoshihiro Abiko Method of collecting data for estimation of susceptibility to periodontal disease
WO2003078614A2 (en) 2002-03-19 2003-09-25 Plant Research International B.V. Gntiii (udp-n-acethylglucosamine:beta-d mannoside beta (1,4)-n-acethylglucosaminy ltransferase iii) expression in plants
US7601891B2 (en) 2002-03-19 2009-10-13 Plant Research International B.V. Optimizing glycan processing plants
DE10229635C1 (de) 2002-07-02 2003-07-10 Ise Gmbh Überrollschutzsystem für Kraftfahrzeuge
CL2003002461A1 (es) 2002-11-27 2005-01-07 Dow Chemical Company Agroscien Inmunoglobulina que comprende al menos un glicano afucosilado, composicion que la contiene, secuencia nucleotidica y vector que la comprende, procedimiento para producir dicha inmunoglobulina en plantas.
US8829276B2 (en) 2007-04-17 2014-09-09 Stichting Dienst Landbouwkundig Onderzoek Mammalian-type glycosylation in plants by expression of non-mammalian glycosyltransferases

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104962579A (zh) * 2007-06-15 2015-10-07 麦迪卡格公司 修饰植物中的糖蛋白产生
CN102648280A (zh) * 2009-09-22 2012-08-22 沃尔克·桑迪希 生产含有特定聚糖结构之分子的方法
CN102648280B (zh) * 2009-09-22 2014-10-08 普罗拜奥根股份公司 生产含有特定聚糖结构之分子的方法

Also Published As

Publication number Publication date
KR20110079860A (ko) 2011-07-08
US20100122365A1 (en) 2010-05-13
KR101196023B1 (ko) 2012-10-30
EP1485486A2 (en) 2004-12-15
EP1959018B1 (en) 2011-05-11
EP2339004A1 (en) 2011-06-29
JP2009232858A (ja) 2009-10-15
CA2923247A1 (en) 2003-09-25
EP1959018A1 (en) 2008-08-20
US7601891B2 (en) 2009-10-13
AU2003219418B2 (en) 2008-02-28
JP2005535291A (ja) 2005-11-24
CA2478297C (en) 2013-05-14
EP2339004B1 (en) 2015-02-25
KR101060361B1 (ko) 2011-08-29
JP2014221077A (ja) 2014-11-27
CA2799805A1 (en) 2003-09-25
US20060253928A1 (en) 2006-11-09
CA2799805C (en) 2016-05-17
AR039013A1 (es) 2005-02-02
KR20110004490A (ko) 2011-01-13
US8927810B2 (en) 2015-01-06
HK1124364A1 (en) 2009-07-10
CN100532558C (zh) 2009-08-26
JP5105257B2 (ja) 2012-12-26
WO2003078637A3 (en) 2004-03-11
US20120011600A1 (en) 2012-01-12
HK1153236A1 (zh) 2012-03-23
CA2478297A1 (en) 2003-09-25
CN101613705A (zh) 2009-12-30
JP5694967B2 (ja) 2015-04-01
EP1485486B1 (en) 2012-11-21
NZ534880A (en) 2008-04-30
JP2012070761A (ja) 2012-04-12
WO2003078637A2 (en) 2003-09-25
JP4532118B2 (ja) 2010-08-25
US8058508B2 (en) 2011-11-15
AU2003219418A1 (en) 2003-09-29
KR20040091144A (ko) 2004-10-27
KR101228276B1 (ko) 2013-01-30

Similar Documents

Publication Publication Date Title
CN1756844A (zh) 在植物中优化聚糖生成
JP5350573B2 (ja) 植物におけるgntiii発現
AU2011203355A1 (en) Optimizing glycan processing in plants
US9181532B2 (en) Production of galactosylated N-glycans in plants
AU2016203395A1 (en) Optimizing glycan processing in plants
AU2008202355A1 (en) Optimizing glycan processing in plants
AU2013205262A1 (en) Optimizing glycan processing in plants

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: FOUNDATION AGRICULTURE RESEARCH SERVICE CENTRE

Free format text: FORMER OWNER: INTERNATIONAL INSTITUTE OF BOTANY

Effective date: 20100601

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20100601

Address after: Wageningen

Patentee after: PLANT RESEARCH INTERNATIONAL B.V.

Address before: Holland Wagen

Patentee before: Plant Res Internat B. V.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090826

Termination date: 20180318