Nothing Special   »   [go: up one dir, main page]

CN1146781A - 真菌中的核黄素生物合成 - Google Patents

真菌中的核黄素生物合成 Download PDF

Info

Publication number
CN1146781A
CN1146781A CN95192767A CN95192767A CN1146781A CN 1146781 A CN1146781 A CN 1146781A CN 95192767 A CN95192767 A CN 95192767A CN 95192767 A CN95192767 A CN 95192767A CN 1146781 A CN1146781 A CN 1146781A
Authority
CN
China
Prior art keywords
leu
gly
ala
val
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN95192767A
Other languages
English (en)
Other versions
CN1117151C (zh
Inventor
J·L·里夫犹尔塔多瓦尔
M·J·布特拉格瑟纳
M·A·桑托斯加尔希亚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF SE
Original Assignee
BASF SE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from DE4420785A external-priority patent/DE4420785A1/de
Application filed by BASF SE filed Critical BASF SE
Publication of CN1146781A publication Critical patent/CN1146781A/zh
Application granted granted Critical
Publication of CN1117151C publication Critical patent/CN1117151C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P25/00Preparation of compounds containing alloxazine or isoalloxazine nucleus, e.g. riboflavin

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及真菌棉阿舒囊霉中的核黄素生物合成基因和用这些基因及基因产物制备核黄素的遗传工程方法。

Description

真菌中的核黄素生物合成
本发明涉及真菌中核黄素生物合成的基因、其编码的蛋白质和用这些基因和基因产物制备核黄素的遗传工程方法。
已公开了诸如阿舒假囊酵母(Eremothecium ashbyii)或棉阿舒囊霉(Ashbya gossypii)的真菌发酵制备核黄素的方法(The MerckIndex,Windholz等编,Merck & Co.p1183(1983))。
EP405370描述了核黄素高产细菌株,它们是通过枯草芽孢杆菌的核黄素生物合成基因的转化获得的。
因为在细菌和真核细胞中的核黄素生物合成遗传学是不同的,所以上述枯草芽孢杆菌的基因不适用于用诸如棉阿舒囊霉的真核产生菌制备核黄素的重组方法。
于1992年11月19日在德国专利局提交的一项专利申请中,描述了酿酒醇母(Saccharomyces cerevisiae)的核黄素生物合成基因的克隆。
但不可能用酿酒酵母rib基因通过常规杂交方法来克隆棉阿舒囊霉核黄素生物合成基因;因为酿酒醇母和棉阿舒囊霉的rib基因同源性明显不足以杂交。
本发明的一个目的是从真核细胞中分离核黄素生物合成基因,以便提供一种在真核产生菌中制备核黄素的重组方法。
我们发现通过分离见于子囊菌棉阿舒囊霉的6种基因(rib基因)可达到这一目的,这些基因编码从GTP开始的核黄素生物合成酶。
本发明涉及下列DNA序列:
编码具有SEQ ID NO:2所示氨基酸序列的多肽、或编码SEQID NO:2所示多肽的类似物或衍生物的DNA序列,所述类似物或衍生物中一个或多个氨基酸已被缺失、插入或被其他氨基酸所替代、而基本不降低该多肽的酶促作用。
编码具有SEQ ID NO:4所示氨基酸序列的多肽、或编码SEQID NO:4所示多肽的类似物或衍生物的DNA序列,所述类似物或衍生物中一个或多个氨基酸已被缺失、插入或被其他氨基酸所替代、而基本不降低该多肽的酶促作用。
编码具有SEQ ID NO:6所示氨基酸序列的多肽、或编码SEQID NO:6所示多肽的类似物或衍生物的DNA序列,所述类似物或衍生物中一个或多个氨基酸已被缺失、插入或被其他氨基酸所替代、而基本不降低该多肽的酶促作用。
编码具有SEQ ID NO:8所示氨基酸序列的多肽、或编码SEQID NO:8所示多肽的类似物或衍生物的DNA序列,所述类似物或衍生物中一个或多个氨基酸已被缺失、插入或被其他氨基酸所替代、而基本不降低该多肽的酶促作用。
编码具有SEQ ID NO:10所示氨基酸序列的多肽、或编码SEQID NO:10所示多肽的类似物或衍生物的DNA序列,所述类似物或衍生物中一个或多个氨基酸已被缺失、插入或被其他氨基酸所替代、而基本不降低该多肽的酶促作用。
编码具有SEQ ID NO:12所示氨基酸序列的多肽、或编码SEQID NO:12所示多肽的类似物或衍生物的DNA序列,所述类似物或衍生物中一个或多个氨基酸已被缺失、插入或被其他氨基酸所替代、而基本不降低该多肽的酶促作用。
在序列表中显示了这些基因和其基因产物(多肽)的一级结构,并编排如下:
SEQ ID NO:1:rib1基因
SEQ ID NO:2:rib1基因产物(GTP环水解酶II)
SEQ ID NO:3:rib2基因
SEQ ID NO:4:rib2基因产物(DRAP脱氨基酶)
SEQ ID NO:5:rib3基因
SEQ ID NO:6:rib3基因产物(DBP合成酶)
SEQ ID NO:7:rib4基因
SEQ ID NO:8:rib4基因产物(DMRL合成酶)
SEQ ID NO:9:rib5基因
SEQ ID NO:10:rib5基因产物(核黄素合成酶)
SEQ ID NO:11:rib7基因
SEQ ID NO:12:rib7基因产物(HTP还原酶)
鸟苷三磷酸(GTP)通过GTP环水解酶II(rib1基因产物)转变为2,5-二氨基-6-核糖基氨基-4(3H)-嘧啶二酮5-磷酸。然后该化合物通过rib7基因产物还原成2,5-二氨基核糖醇基氨基-2,4(1H,3H)-嘧啶5-磷酸,然后通过rib2基因产物脱氨基成为5-氨基-6-核糖醇基氨基-2,4(1H,3H)-嘧啶二酮。随后在rib4基因产物催化的反应中在该化合物上加上C4化合物DBP,生成6,7-二甲基-8-核糖醇基-2,4-二氧四氢蝶啶(DMRL),在rib5基因产物催化的反应中从该化合物产生核黄素。C4化合物DBP(L-3,4-二羟基-2-丁酮-4-磷酸)是在rib3基因产物催化的反应中从D-核酮糖5-磷酸形成的。
SEQ ID NO:1、3、5、7、9、11中描述的DNA序列编码SEQ IDNO:2、4、6、8、10、12中描述的多肽。
除序列表中指出的那些外,适用的DNA序列是那些由于遗传密码简并而具有不同的序列但仍编码相同多肽的DNA序列。
本发明还涉及这样的DNA序列,它们编码一级结构与序列表中不同,但仍与序列表中基因产物具有基本相同生物特性的基因产物。生物特性具体指进行核黄素生物合成的酶活性。
这种具有基本相同生物特性的修饰的基因产物可通过缺失或插入一个或多个氨基酸或肽或用其他氨基酸替代氨基酸而获得,或者可从棉阿舒囊霉以外的生物体分离获得。
编码修饰基因产物的DNA序列一般与序列表中所示DNA序列具有80%或更高的同源性。可以用SEQ ID NO:1、3、5、7、9、11中所述DNA序列从棉阿舒囊霉以外的真核细胞中分离这样的DNA序列,例如用常规杂交方法或PCR技术。这些DNA序列在标准条件下与SEQ ID NO:1、3、5、7、9、11中所示DNA序列杂交。
标准条件指:例如浓度为0.1-1×SSC的水性缓中液中(1×SSC:0.15M NaCl,15mM柠檬酸钠,PH7.2)42-58℃。DNA杂交的实验条件在遗传工程的教科书中有述,例如在Sambrook等的“Molecular Cloning”(Cold Spring Harbor haboratory,1989)中。
本发明还涉及调控序列,尤其是启动子序列,它们位于编码适当多肽之DNA序列5′方向的上游。在序列表中具体给出了这些调节序列,并在下文详细解释。
rib1基因的调控序列:
SEQ ID NO:1核苷酸1-242
rib2基因的调控序列:
SEQ ID NO:3核苷酸1-450
rib3基因的调控序列:
SEQ ID NO:5核苷酸1-314
rib4基因的调控序列:
SEQ ID NO:7核苷酸1-270
rib5基因的调控序列:
SEQ ID NO:9核苷酸1-524
rib7基因的调控序列:
SEQ ID NO:11核苷酸1-352
还可以在5′和/或3′方向缩减这些调节序列,而其功能几乎不降低。
调控作用的必需区一般为上述序列区域中的30-100(优选40-70)个核苷酸的片段。
还可以通过与天然序列比较和定向诱变使这些调控序列的功能最优化。
本发明的调控序列适于在Ashbya中过量表达基因,尤其是负责核黄核生物合成的基因。
本发明还涉及含有一种或多种本发明DNA序列的表达载体。通过向本发明DNA序列提供适当的功能调节信号而获得这种表达载体。这种调节信号是负责表达的DNA序列,例如启动子、操纵子、增强子、核糖体结合位点,宿主生物能识别和遵守这些调节信号。
适当时表达载体还可能包含其他如控制重组DNA在宿主生物中的复制或重组的调节信号。
本发明还涉及用本发明的DNA序列或表达载体转化的宿主生物。优选使用真核生物作为宿主生物,特别优选酵母属、假丝酵母属、毕赤酵母属、假囊酵母属或阿舒囊霉属的那些生物。特别优选的种是酿酒酵母、假丝酵母C、flaveri、假丝酵母C、famala、阿舒假囊酵母和棉阿舒囊霉。
本发明还包括制备核黄素的重组方法,其中按常规方法发酵培养本发明的转化宿主生物,从发酵培养基中分离发醇过程中产生的核黄素,和适当时进行纯化。
可按实施例和序列表中所述分离和表征rib基因和基因产物。实施例1棉阿舒囊霉核黄素生物合成基因(rib基因)的分离a.棉阿舒囊霉cDNA文库的构建
在YEPD培养基上培养核黄素高产菌株棉阿舒囊霉ATCC10195后,从对数生长后期的菌丝体中彻底提取RNA(sher-man等,“Methods in Yeast genetics”,cold Spring Harbor,New York,1989)。
通过在oligo(dT)-纤维素上吸附并洗脱两次而纯化Poly(A)+RNA(Aviv and Leder,Proc.Natl,Acrd,Sci,USA 69,1972,1408-1412)。用Gubler和Hoffmann的一般方法(Gene25,1983,263)分离cDNA,在平端cDNA分子的末端加上了合成的ECORI衔接头。然后用T4多核苷酸激酶将EcoRI切割后的cDNA片段磷酸化,并克隆到已用EcoRI切割的去磷酸化载体pYEura3中(图1)。pYEu-ra3(Clonetech Laboratories,Inc.,California)是一种含有半乳糖可诱导的GAL1和GAL10启动子和URA、CEN4和ARS1的酵母表达载体。这些酵母元件使克隆的DNA片段可以在酵母细胞中转化和表达。
连接反应的等分样品用于转化高感受态(Hanahan,DNA Chon-ing ed.D,M,Glover;IRL Press,Oxford1985,109)大肠杆菌XL1-Blue(Bullock等,Biotechniques 5(1987)376-378),基于其氨苄青霉素抗性筛选转化子。
将3×105个氨苄青霉素抗性细胞合并及扩增,并从中分离质粒DNA(Birnboim and Doly,Nucleic Acids Res.7,1979,1513)。b.分离编码核黄素生产酶的棉阿舒囊霉cDNA克隆。
通过参与核黄素生物合成的酿酒酵母突变体的功能互补分离了编码核黄素生产酶的棉阿舒囊霉cDNA克隆。
菌株AJ88(Mata leu 2 his3 rib1::URA3 ura 3-52)、AJ115(Matalpha leu 2 inos1 rib 2::URA 3 ura 3-52)、AJ71(Matalpha leu2 inos1 rib 3::URA 3 ura 3-52)、AJ106(Matalpha leu2 inos1rib4::URA3 ura 3-52)、AJ66(Mata canR inos1 rib5::URA3 ura 3-52)和AJ121(Matalpha leu2 inos1 rib7::URA3 ura 3-52)是通过破坏酿酒酵母中参与核黄素生物合成的6个基因(rib1-rib5和rib7)之一而产生的突变菌株。
用来自棉阿舒囊霉cDNA文库的25μg cDNA转化每种这些菌株,并铺在含半乳糖而无核黄素的固体培养基上。生长约1周后,从培养皿中分离rib+转化子。
每次分析每种转化突变体(Rib1+、Rib2+、Rib3+、Rib4+、Rib5+和Rib7+)的一个转化子,发现Rib+表型均只在半乳糖培养基中表达而不在葡萄糖培养基中表达。
这些结果证明Rib+表型在质粒中的半乳糖可诱导的GAL10启动子控制下表达。
通过大肠杆菌的转化从Rib1+、Rib2+、Rib3+、Rib4+、Rib5+和Rib7+转化子分离质粒DNA,并称为pJR715、pJR669、pJR788、pJR733、pJR681和pJR827。
对这些质粒中存在的cDNA插入物进行部分测序,表明它们编码的蛋白质类似于酵母的rib基因产物的蛋白质。c.分离编码核黄素生成酶的棉阿舒囊霉基因组克隆
为了分离棉阿舒囊霉的产核黄素基因的基因组拷贝,在粘粒su-per Cosl(Stratagene Cloning Systems,California)中构建了棉阿舒囊霉ATCC 10195的基因组文库,并用从棉阿舒囊霉ribl、rib2、rib3、rib4、rib5和rib7基因cDNA拷贝得到的32p标记的探针进行了筛选。
通过菌落杂交(Grunstein and Hoguess,Proc,Natl,Acad,Sci,USA 72,1975,3961-3965)分离了带有rib1、rib2、rib3、rib4、rib5和rib7DNA的粘粒克隆。用相同的rib特异性cDNA探针对酶切粘粒进行进一步的Southern分析,可能鉴别出含有棉阿舒囊霉rib1、rib2、rib3、rib4、rib5和rib7基因的限制性酶切片段。
发现长3.1kb的Bam HI-ClaI DNA片段含有完整的编码GTP环水解酶II的棉阿舒囊霉rib1基因。用琼脂糖凝胶分离该片段并克隆到用Bam HI和ClaI切割的噬菌粒pBluescript KS(t)(Strata-gene Cloning Systems)中,这样就形成了质粒pJR765(图2)。
获得了一种长1329bp的DNA序列(SEQ ID NO:1),它含有906bp的rib1开放读码框架、242bp的5′-非编码区和181bp的3′-非编码区。
发现编码DRAP脱氨基酶的完整棉阿舒囊霉rib2基因在长3.0kb的EcoRI-PstI片段上,将此片段克隆到pBluescript ks(t)中得到质粒pJR758(图3)。
对长2627bp的EcoRI-PstI插入区进行了测序,其包括1830bp的rib2开放读码框架、450bp的5′-未翻译区和347bp的3′-未翻译区(SEQ ID NO:3)。
发现编码DBP合成酶的完整棉阿舒囊霉rib3基因存在于长1.5kb的PstI-HindII片段上,将此片段克隆到pBluescript ks(t)中得质粒pJR790(图4)。
对长1082bp的PstI-HindIII插入区进行了测序,其含有639bp的rib3开放读码框架、314bp的5′-未翻译区和129bp的3′-未翻译区(SEQ ID NO:5)。
发现编码DMRL合成酶的棉阿舒囊霉rib4基因存在于长3.2bP的PstI-PstI片段上,将此片段克隆到pBluescript ks(t)中得质粒pJR762(图5)。
对长996bp的PstI-PstI插入区进行了测序,其包括519bp的rib4开放读码框架、270bp的5′-未翻译区和207bp的3′-未翻译区(SEQ ID NO:7)。
发现编码核黄素合成酶的完整棉阿舒囊霉rib5基因存在于长2.5kb的PstI-PstI片段上,将此片段克隆到pBluescript KS(t)中得质粒pJR739(图6)。
对长1511bp的PstI-PstI插入区进行了测序,其包括708bp的rib5开放读码框架、524bp的5′-未翻译区和279bp的3′-未翻译区(SEQ ID NO:9)。
最后,编码HTP还原酶的棉阿舒囊霉rib7基因见于长4.1kb的EcoRI-EcoRI片段上,该片段克隆至pBluescript ks(t)中得质粒pJR845(图7)。
对长1596bp的EcoRI-EcoRI插入区进行了测序,其包括741bp的rib7开放读码框架、352bp的5′-未翻译区和503bp的3′-未翻译区(SEQ ID NO:11)。实施例2
棉阿舒囊霉rib基因的mRNA分析
进行Northern分析鉴定rib-特异性转录本。从实施例1中所述棉阿舒囊霉菌株ATCC10195分离总RNA。将该菌株的RNA样品(5μg)与RNA大小标志物一起在0.8%琼脂糖甲醛凝胶上电泳进行分级分离并真空吸印在尼龙膜上(Thomas,Proc,Natl,Acad,Sci,USA,77.1980,5201-5205)。
将尼龙膜在50%甲酰胺存在下在5×SSC中42℃下分别与32P-标记的rib-特异性DNA探针杂交。棉阿舒囊霉rib1基因表达为约1150核苷酸的单一信使,用来自质粒pJR765的长0.7kbp的SmaI-SacI探针在两个菌株中都检测了mRNA。
与此相似,用长0.5kpb来自pJR758的SmaI-SmaI片段、长0.6kpb来自pJR790的HindIII-kpnI片段、长0.5kpb来自pJR739的ScaI-HindIII片段和长0.3kpb来自pJR845的PstI-PstI片段作为特异探针,在印迹中检测到了单一的长1900核苷酸的rib2、长900核苷酸的rib3、长800核苷酸的rib4、长1050核苷酸的rib5和长1000核苷酸的rib7的转录本。实施例3
棉阿舒囊霉rib基因在酿酒酵母中的表达
如实施例1所述,在核黄素生物合成一个阶段缺陷的已深入研究过的酿酒酵母突变株,如果它们带有编码互补阿舒囊霉属酶的质粒,则可能在没有核黄素的培养基上生长。为了试验棉阿舒囊霉rib基因产物的功能,在来自带有表达质粒pJR715、pJR669、pJR788、pJR733、pJR681和pJR827之一的酿酒酵母突变株的无细胞提取物中测定了黄素产生酶活性。
这些质粒衍生自pYEura3并在实施例1中进行了描述,它们含有半乳糖可诱导型GAL10启动子控制下的棉阿舒囊霉rib特异的cDNA片段。
酿酒酵母的无细胞蛋白质提取物得自在液体培养基中生长至光密度约为2OD的培养液。
收集细胞,用冷的20mM tris HCl(PH7.5)洗涤,并重悬于补有1mM苯乙基磺酰氟的相同缓中液中。
通过在有玻璃珠存在下涡旋并在4℃下3000g离心20分钟分离细胞裂解液。
按文献中所述方法测定GTP环水解酶II、DRAP脱氨基酶、DBP合成酶、DMRL合成酶、核黄素合成酶和HTP还原酶活性(Shavlovsky et al.,Arch.Microbiol.124,1980,255-259;Richter etal.,J.Bacteriol.175,1993,4045-4051;Klein and Bacher,Z.Natur-forsch.35b,1980,482-484;Richter et al.,J.Bacteriol.174,1992,4050-4056;Nielsen et al.,J.Biol. Chem.261,1986,3661;Plaut and Harvey,Methods Enzymol.18B,1971,515-538;Hollanderand Brown,Biochem. Biophys. Res. Commun.89,1979,759-763;Shavlovski et al.,Biochim. Biophys. Acta,428,1976,611-618).
用Peterson法(Anal.Biochem.83,1977,346-356)进行蛋白质定量。如表1中所示,质粒pJR715在酿酒酵母突变株AJ88中表达GTP环水解酶II活性。而且,该活性只存在于生长在半乳糖培养基上的细胞中,这表明棉阿舒囊霉rib1 cDNA的表达发生在半乳糖可诱导型GAL10启动子的控制之下。
这些结果还证明rib1在棉阿舒囊霉中编码GTP环水解酶II。用相似方法证明了在此真菌中rib2编码DRAP脱氨基酶、rib3编码DBP合成酶、rib4编码DMRL合成酶、rib5编码核黄素合成酶及rib7编码HTP还原酶。表1
酿酒酵母rib1突变体AJ88和其转化子的GTP环水解酶II活性。
菌株 质粒       GTP环水解酶IIU/mg蛋白质**
   葡萄糖    半乳糖
   X2180-1A*     —     0.48     0.34
     AJ88     —     n.d.     n.d
     AJ88    pIR715     n.d.     21.60
n.d.未测到。*)野生型**)GTP环水解酶II活性的单位,1U每小时催化1nmol HTP形成表2
酿酒酵母rib2突变株AJ115和其转化子的DRAP脱氨基酶活性。
菌株 质粒        DRAP脱氨基酶U/mg蛋白质*
   葡萄糖    半乳糖
   X2180-1A      -     0.45     0.38
    AJ115      -     n.d.     n.d.
    AJ115    pJR669     n.d.     53.22
n.d.:未测到。*)1U每小时催化1nmol ARAP形成。表3
酿酒酵母rib3突变株AJ71和其转化子的DBP合成酶活性
菌株 质粒          DBP合成酶U/mg蛋白质*
   葡萄糖    半乳糖
   X2180-1A      -     0.80     0.75
     AJ71      -     n.d.     n.d.
     AJ71    pJR788     n.d.     25.19
n.d.:未测到。*)1U每小时催化1nmol DBP形成。表4
酿酒酵母rib4突变株AJ106和其转化子的DMRL合成酶活性
菌株 质粒         DMRL合成酶U/mg蛋白质*
   葡萄糖    半乳糖
  X2180-1A      -     2.04     1.73
   AJ106      -     n.d.     n.d.
   AJ106    pJR733     n.d.     86.54
n.d.:未测到。*)1U每小时催化1nmol DMRL形成。表5
酿酒酵母rib5突变株AJ66和其转化子的核黄素合成酶活性
菌株 质粒         核黄素合成酶U/mg蛋白质*
   葡萄糖     半乳糖
  X2180-1A      —     4.41      3.80
    AJ66      —     n.d.      n.d.
    AJ66    pJR681     n.d.     164.20
n.d.未测到。*)1U每小时催化1nmol核黄素形成。表6
酿酒酵母rib7突变体AJ121和其转化子的HTP还原酶活性。
菌株 质粒         HTP还原酶U/mg蛋白质*
   葡萄糖    半乳糖
  X2180-1A      -     1.86     2.54
   AJ121      -     n.d.     n.d.
   AJ121    pJR827     n.d.     46.21
n.d.未测到。*)1U每小时催化1nmol DRAP形成。
                 序列表
(1)一般信息:
    (i)申请人:
        (A)名称:BASF Aktiengesellschaft
        (B)街道:Carl-Bosch-Strasse 38
        (C)城市:Ludwigshafen
        (E)国家:德国
        (F)邮编:D-67056
        (G)电话:0621/6048526
        (H)传真:0621/6043123
        (I)电传:1762175170
    (ii)题目:真菌中的核黄素生物合成
    (iii)序列数目:12
    (iv)计算机可读形式:
        (A)媒介类型:软盘
        (B)计算机:IBM PC兼容机
        (C)操作系统:PC-DOS/MS-DOS
        (D)软件:Patenf In Release#1.0,Version#1.25
        (EPO)(2)SEQ ID NO:1的信息:
(i)序列特征:
(A)长度:1329碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线性
(ii)分子类型:cDNA到mRNA
(iii)假拟:否
(iii)反义:否
(vi)原始来源:
(A)生物体:棉阿舒囊霉
(ix)特征:
(A)名称/关键词:5’UTR
(B)位置:1..242
(ix)特征:
(A)名称/关键词:CDS
(B)位置:243..1148
(ix)特征:
(A)名称/关键词:3’UTR
(B)位置:1149..1329
(xi)序列描述:SEQ ID NO:1:TTTCTGTCCG CATACTTCAT ATGCTCATCG CACATTGATA ATGTACATTC GAAAAATTTC      60AAGATTAGCC TCCGTGAACA GCGATTTACC TTAGGCAAAA GTAACAAAAG GCTTTTCCGT     120AGGTGCTTTG TCATTCAACA ATCCACGTCG GAATTGGCGA CTATATAGTG TAGGGCCCAT     180AAAGCAGTAG TCGGTGTTGA TAGCTGTGTC AGACCAACTC TTTGTTAATT ACTGAAGCTG     240AT ATG ACT GAA TAC ACA GTG CCA GAA GTG AGG TGT GTC GCA CGC GCG        287Met Thr Glu Tyr Thr Val Pro Glu Val Arg Cys Val Ala Arg Ala
 1               5                  10                  15CGC ATA CCG ACG GTA CAG GGC ACC GAT GTC TTC CTC CAT CTA TAC CAC       335Arg Ile Pro Thr Val Gln Gly Thr Asp Val Phe Leu His Leu Tyr His
             20                  25                  30AAC TCG ATC GAC AGC AAG GAA CAC CTA GCG ATT GTC TTC GGC GAG AAC       383Asn Ser Ile Asp Ser Lys Glu His Leu Ala Ile Val Phe Gly Glu Asn
         35                  40                  45ATA CGC TCG CGG AGT CTG TTC CGG TAC CGG AAA GAC GAC ACG CAG CAG  431Ile Arg Ser Arg Ser Leu Phe Arg Tyr Arg Lys Asp Asp Thr Gln Gln
     50                  55                  60GCG CGG ATG GTG CGG GGC GCC TAC GTG GGC CAG CTG TAC CCC GGG CGG  479Ala Arg Met Val Arg Gly Ala Tyr Val Gly Gln Leu Tyr Pro Gly Arg
 65                  70                  75ACC GAG GCA GAC GCG GAT CGG CGT CAG GGC CTG GAG CTG CGG TTT GAT  527Thr Glu Ala Asp Ala Asp Arg Arg Gln Gly Leu Glu Leu Arg Phe Asp80                  85                  90                  95GAG ACA GGG CAG CTG GTG GTG GAG CGG GCG ACG ACG TGG ACC AGG GAG  575Glu Thr Gly Gln Leu Val Val Glu Arg Ala Thr Thr Trp Thr Arg Glu
            100                 105                 110CCG ACA CTG GTG CGG CTG CAC TCG GAG TGT TAC ACG GGC GAG ACG GCG  623Pro Thr Leu Val Arg Leu His Ser Glu Cys Tyr Thr Gly Glu Thr Ala
        115                 120                 125TGG AGC GCG CGG TGC GAC TGC GGG GAG CAG TTC GAC CAG GCG GGT AAG  671Trp Ser Ala Arg Cys Asp Cys Gly Glu Gln Phe Asp Gln Ala Gly Lys
    130                 135                 140CTG ATG GCT GCG GCG ACA GAG GGC GAG GTG GTT GGC GGT GCG GGG CAC  719Leu Met Ala Ala Ala Thr Glu Gly Glu Val Val Gly Gly Ala Gly His
145                 150                 155GGC GTG ATC GTG TAC CTG CGG CAG GAG GGC CGC GGC ATC GGG CTA GGC  767Gly Val Ile Val Tyr Leu Arg Gln Glu Gly Arg Gly Ile Gly Leu Gly160                 165                 170                 175GAG AAG CTG AAG GCG TAC AAC CTG CAG GAC CTG GGC GCG GAC ACG GTG  815Glu Lys Leu Lys Ala Tyr Asn Leu Gln Asp Leu Gly Ala Asp Thr Val
            180                 185                 190CAG GCG AAC GAG CTG CTC AAC CAC CCT GCG GAC GCG CGC GAC TTC TCG  863Gln Ala Asn Glu Leu Leu Asn His Pro Ala Asp Ala Arg Asp Phe Ser
        195                 200                 205TTG GGG CGC GCA ATC CTA CTG GAC CTC GGT ATC GAG GAC ATC CGG TTG  911Leu Gly Arg Ala Ile Leu Leu Asp Leu Gly Ile Glu Asp Ile Arg Leu
    210                 215                 220CTC ACG AAT AAC CCC GAC AAG GTG CAG CAG GTG CAC TGT CCG CCG GCG  959Leu Thr Asn Asn Pro Asp Lys Val Gln Gln Val His Cys Pro Pro Ala
225                 230                 235CTA CGC TGC ATC GAG CGG GTG CCC ATG GTG CCG CTT TCA TGG ACT CAG 1007Leu Arg Cys Ile Glu Arg Val Pro Met Val Pro Leu Ser Trp Thr Gln240                 245                 250                 255CCC ACA CAG GGC GTG CGC TCG CGC GAG CTG GAC GGC TAC CTG CGC GCC 1055Pro Thr Gln Gly Val Arg Ser Arg Glu Leu Asp Gly Tyr Leu Arg Ala
            260                 265                 270AAG GTC GAG CGC ATG GGG CAC ATG CTG CAG CGG CCG CTG GTG CTG CAC      1103Lys Val Glu Arg Met Gly His Met Leu Gln Arg Pro Leu Val Leu His
        275                 280                 285ACG TCT GCG GCG GCC GAG CTC CCC CGC GCC AAC ACA CAC ATA TAATCTTTGC   1155Thr Ser Ala Ala Ala Glu Leu Pro Arg Ala Asn Thr His Ile
    290                 295                 300TATATTAAAA CTCTATAAAC GTATGCCACA CGGCGCCCGC GGGCTGCCAC ACGCTGCTCA    1215CGGGCTGCCG AACAGTTCTA ACAAGTAATC GCGCGCCTCG CCAGTGATCG TGGCGAGCAC    1275CTTGTCGTCC ATCATCACAT ATCCTCGGCT ACAGTCGTCG TTGAAGAGCG TGCA          1329(2)SEQ ID NO:2的信息:
(i)序列特征:
(A)长度:301个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:2:Met Thr Glu Tyr Thr Val Pro Glu Val Arg Cys Val Ala Arg Ala Arg1               5                  10                  15Ile Pro Thr Val Gln Gly Thr Asp Val Phe Leu His Leu Tyr His Asn
         20                  25                  30Ser Ile Asp Ser Lys Glu His Leu Ala Ile Val Phe Gly Glu Asn Ile
     35                  40                  45Arg Ser Arg Ser Leu Phe Arg Tyr Arg Lys Asp Asp Thr Gln Gln Ala
 50                  55                  60Arg Met Val Arg Gly Ala Tyr Val Gly Gln Leu Tyr Pro Gly Arg Thr65                  70                  75                  80Glu Ala Asp Ala Asp Arg Arg Gln Gly Leu Glu Leu Arg Phe Asp Glu
             85                  90                  95Thr Gly Gln Leu Val Val Glu Arg Ala Thr Thr Trp Thr Arg Glu Pro
        100                 105                 110Thr Leu Val Arg Leu His Ser Glu Cys Tyr Thr Gly Glu Thr Ala Trp
    115                 120                 125Ser Ala Arg Cys Asp Cys Gly Glu Gin Phe Asp Gln Ala Gly Lys Leu
130                 135                 140Met Ala Ala Ala Thr Glu Gly Glu Val Val Gly Gly Ala Gly His Gly145                 150                 155                 160Val Ile Val Tyr Leu Arg Gln Glu Gly Arg Gly Ile Gly Leu Gly Glu
            165                 170                 175Lys Leu Lys Ala Tyr Asn Leu Gln Asp Leu Gly Ala Asp Thr Val Gln
        180                 185                 190Ala Asn Glu Leu Leu Asn His Pro Ala Asp Ala Arg Asp Phe Ser Leu
    195                 200                 205Gly Arg Ala Ile Leu Leu Asp Leu Gly Ile Glu Asp Ile Arg Leu Leu
210                 215                 220Thr Ash Asn Pro Asp Lys Val Gln Gln Val His Cys Pro Pro Ala Leu225                 230                 235                 240Arg Cys Ile Glu Arg Val Pro Met Val Pro Leu Ser Trp Thr Gln Pro
            245                 250                 255Thr Gln Gly Val Arg Ser Arg Glu Leu Asp Gly Tyr Leu Arg Ala Lys
        260                 265                 270Val Glu Arg Met Gly His Met Leu Gln Arg Pro Leu Val Leu His Thr
    275                 280                 285Ser Ala Ala Ala Glu Leu Pro Arg Ala Asn Thr His Ile
290                 295                 300(2)SEQ ID NO:3的信息:
(i)序列特征:
(A)长度:2627碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线性
(ii)分子类型:cDNA到mRNA
(iii)假拟:否
(iii)反义:否
(vi)原始来源:
(A)生物体:棉阿舒囊霉
(ix)特征:
(A)名称/关键词:5’UTR
(B)位置:1..450
(ix)特征:
(A)名称/关键词:CDS
(B)位置:451..2280
(ix)特征:
(A)名称/关键词:3’UTR
(B)位置:2281..2627
(xi)序列描述:SEQ ID NO:3:CTGCAGGACA ATTTAAATTA CGATTACACG CGGCAGCCTT CTTGGTGCGA CAGGATTTTG      60TACAAGAATG ACCCCAAGCG GGTAAGAGTT CATAGGTATG CCTCGATTGA TAGACGTTCC     120ATTTTGAATT ATACTGATCA CGAACCCGTA ACGCTCGATG TCAGCGTTTC ATGCCATACA     180CAATTTGTCC CAATGGCTAT GCAGAATATT TCCCCACAGA GCACCATGGA AATGTATGTG     240GGAGACGTCA CAGATATACT ACTGATGTTG TTCTCCAGAG TATACTACGC CCCTACCATA     300TTCGATCTTG TGGTATTGAC GATATTCCTC TGTTTGGTTT TACTGGCACT ATTCCGTTTG     360ACGGTATAGC GCTATTCGTT CATAGTGACA CATGCGGCAC TAGCTATTCA GCGAATCCTT     420TATAAACTGC TACTTAACGT TCGTAACACC ATG CTC AAA GGC GTT CCT GGC CTT      474
                             Met Leu Lys Gly Val Pro Gly Leu
                               1               5CTT TTT AAG GAG ACG CAA CGT CAT CTG AAA CCC AGG CTG GTT AGG ATT       522Leu Phe Lys Glu Thr Gln Arg His Leu Lys Pro Arg Leu Val Arg Ile
 10                  15                  20ATG GAA AAC ACA TCG CAG GAT GAG AGT CGC AAA AGA CAG GTC GCT TCG       570Met Glu Asn Thr Ser Gln Asp Glu Ser Arg Lys Arg Gln Val Ala Ser25                  30                  35                  40AAC TTG AGC AGC GAT GCC GAT GAG GGC TCG CCG GCA GTT ACG AGG CCG       618Asn Leu Ser Ser Asp Ala Asp Glu Gly Ser Pro Ala Val Thr Arg Pro
             45                  50                  55GTT AAA ATC ACC AAA CGC CTC AGG AAG AAG AAC CTC GGG ACA GGC GAG       666Val Lys Ile Thr Lys Arg Leu Arg Lys Lys Asn Leu Gly Thr Gly Glu
         60                  65                  70CTA CGG GAC AAA GCA GGA TTC AAG TTG AAG GTG CAA GAC GTG AGC AAA       714Leu Arg Asp Lys Ala Gly Phe Lys Leu Lys Val Gln Asp Val Ser Lys
     75                  80                  85AAC CGT CAC AGA CAG GTC GAT CCG GAA TAC GAA GTC GTG GTA GAT GGC       762Asn Arg His Arg Gln Val Asp Pro Glu Tyr Glu Val Val Val Asp Gly
 90                  95                 100CCG ATG CGC AAG ATC AAA CCG TAT TTC TTC ACA TAC AAG ACT TTC TGC       810Pro Met Arg Lys Ile Lys Pro Tyr Phe Phe Thr Tyr Lys Thr Phe Cys105                 110                 115                 120AAG GAG CGC TGG AGA GAT CGG AAG TTG CTT GAT GTG TTT GTG GAT GAA       858Lys Glu Arg Trp Arg Asp Arg Lys Leu Leu Asp Val Phe Val Asp Glu
            125                 130                 135TTT CGG GAC CGC GAT AGG CCT TAC TAC GAG AAA GTC ATC GGT TCG GGT       906Phe Arg Asp Arg Asp Arg Pro Tyr Tyr Glu Lys Val Ile Gly Ser Gly
        140                 145                 150GGT GTG CTC CTG AAC GGT AAG TCA TCG ACG TTA GAT AGC GTA TTG CGT       954Gly Val Leu Leu Asn Gly Lys Ser Ser Thr Leu Asp Ser Val Leu Arg
    155                 160                 165AAT GGA GAC CTC ATT TCG CAC GAG CTG CAC CGT CAT GAG CCA CCG GTC      1002Asn Gly Asp Leu Ile Ser His Glu Leu His Arg His Glu Pro Pro Val
170                 175                 180TCC TCT AGG CCG ATT AGG ACG GTG TAC GAA GAT GAT GAC ATC CTG GTG      1050Ser Ser Arg Pro Ile Arg Thr Val Tyr Glu Asp Asp Asp Ile Leu Val185                 190                 195                 200ATT GAC AAG CCC AGC GGG ATT CCA GCC CAT CCC ACC GGG CGT TAC CGC   1098Ile Asp Lys Pro Ser Gly Ile Pro Ala His Pro Thr Gly Arg Tyr Arg
            205                 210                 215TTC AAC TCC ATT ACG AAA ATA CTT GAA AAA CAG CTT GGA TAC ACT GTT   1146Phe Asn Ser Ile Thr Lys Ile Leu Glu Lys Gln Leu Gly Tyr Thr Val
        220                 225                 230CAT CCA TGT AAC CGA CTG GAC CGC CTA ACC AGT GGC CTA ATG TTC TTG   1194His Pro Cys Asn Arg Leu Asp Arg Leu Thr Ser Gly Leu Met Phe Leu
    235                 240                 245GCA AAA ACT CCA AAG GGA GCC GAT GAG ATG GGT GAT CAG ATG AAG GCG   1242Ala Lys Thr Pro Lys Gly Ala Asp Glu Met Gly Asp Gln Met Lys Ala
250                 255                 260CGC GAA GTG AAG AAA GAA TAT GTT GCC CGG GTT GTT GGG GAA TTT CCT   1290Arg Glu Val Lys Lys Glu Tyr Val Ala Arg Val Val Gly Glu Phe Pro265                 270                 275                 280ATA GGT GAG ATA GTT GTG GAT ATG CCA CTG AAG ACT ATA GAG CCG AAG   1338Ile Gly Glu Ile Val Val Asp Met Pro Leu Lys Thr Ile Glu Pro Lys
            285                 290                 295CTT GCC CTA AAC ATG GTT TGC GAC CCG GAA GAC GAA GCG GGC AAG GGC   1386Leu Ala Leu Asn Met Val Cys Asp Pro Glu Asp Glu Ala Gly Lys Gly
        300                 305                 310GCT AAG ACG CAG TTC AAA AGA ATC AGC TAC GAT GGA CAA ACG AGC ATA   1434Ala Lys Thr Gln Phe Lys Arg Ile Ser Tyr Asp Gly Gln Thr Ser Ile
    315                 320                 325GTC AAG TGC CAA CCG TAC ACG GGC CGG ACG CAT CAG ATC CGT GTT CAC   1482Val Lys Cys Gln Pro Tyr Thr Gly Arg Thr His Gln Ile Arg Val His
330                 335                 340TTG CAA TAC CTG GGC TTC CCA ATT GCC AAC GAT CCG ATT TAT TCC AAT   1530Leu Gln Tyr Leu Gly Phe Pro Ile Ala Asn Asp Pro Ile Tyr Ser Asn345                 350                 355                 360CCG CAC ATA TGG GGC CCA AGT CTG GGC AAG GAA TGC AAA GCA GAC TAC   1578Pro His Ile Trp Gly Pro Ser Leu Gly Lys Glu Cys Lys Ala Asp Tyr
            365                 370                 375AAG GAG GTC ATC CAA AAA CTA AAC GAA ATT GGT AAG ACT AAA TCT GCG   1626Lys Glu Val Ile Gln Lys Leu Asn Glu Ile Gly Lys Thr Lys Ser Ala
        380                 385                 390GAA AGT TGG TAC CAT TCT GAT TCC CAA GGT GAA GTT TTC AAA GGG GAA   1674Glu Ser Trp Tyr His Ser Asp Ser Gln Gly Glu Val Phe Lys Gly Glu
    395                 400                 405CAA TGC GAT GAA TGT GGC ACC GAA CTG TAC ACT GAC CCG GGC CCG AAT   1722Gln Cys Asp Glu Cys Gly Thr Glu Leu Tyr Thr Asp Pro Gly Pro Asn
410                 415                 420GAT CTT GAC TTA TGG TTG CAT GCA TAT CGG TAT GAA TCC ACT GAA CTG   1770Asp Leu Asp Leu Trp Leu His Ala Tyr Arg Tyr Glu Ser Thr Glu Leu425                 430                 435                 440GAT GAG AAC GGT GCT AAA AAG CGG AGT TAC TCT ACT GCG TTT CCT GAG   1818Asp Glu Asn Gly Ala Lys Lys Arg Ser Tyr Ser Thr Ala Phe Pro Glu
            445                 450                 455TGG GCT CTT GAG CAG CAC GGC GAC TTC ATG CGG CTT GCC ATC GAA CAG   1866Trp Ala Leu Glu Gln His Gly Asp Phe Met Arg Leu Ala Ile Glu Gln
        460                 465                 470GCT AAG AAA TGC CCA CCC GCG AAG ACA TCA TTT AGC GTT GGT GCC GTG   1914Ala Lys Lys Cys Pro Pro Ala Lys Thr Ser Phe Ser Val Gly Ala Val
    475                 480                 485TTA GTT AAT GGG ACC GAG ATT TTG GCC ACT GGT TAC TCA CGG GAG CTG   1962Leu Val Asn Gly Thr Glu Ile Leu Ala Thr Gly Tyr Ser Arg Glu Leu
490                 495                 500GAA GGC AAC ACG CAC GCT GAA CAA TGT GCA CTT CAA AAA TAT TTT GAA   2010Glu Gly Asn Thr His Ala Glu Gln Cys Ala Leu Gln Lys Tyr Phe Glu505                 510                 515                 520CAA CAT AAA ACC GAC AAG GTT CCT ATT GGT ACA GTA ATA TAC ACG ACT   2058Gln His Lys Thr Asp Lys Val Pro Ile Gly Thr Val Ile Tyr Thr Thr
            525                 530                 535ATG GAG CCT TGT TCT CTC CGT CTC AGT GGT AAT AAA CCG TGT GTT GAG   2106Met Glu Pro Cys Ser Leu Arg Leu Ser Gly Asn Lys Pro Cys Val Glu
        540                 545                 550CGT ATA ATC TGC CAG CAG GGT AAT ATT ACT GCT GTT TTT GTT GGC GTA   2154Arg Ile Ile Cys Gln Gln Gly Asn Ile Thr Ala Val Phe Val Gly Val
    555                 560                 565CTT GAG CCA GAC AAC TTC GTG AAG AAC AAT ACA AGT CGT GCG CTA TTG   2202Leu Glu Pro Asp Asn Phe Val Lys Asn Asn Thr Ser Arg Ala Leu Leu
570                 575                 580GAA CAA CAT GGT ATA GAC TAT ATT CTT GTC CCT GGG TTT CAA GAA GAA   2250Glu Gln His Gly Ile Asp Tyr Ile Leu Val Pro Gly Phe Gln Glu Glu585                 590                 595                 600TGT ACT GAA GCC GCA TTG AAG GGT CAT TGATTTTGCT GCGAATTGTA         2297Cys Thr Glu Ala Ala Leu Lys Gly His
            605                 610GATGACTTAA AATATCGAGG CGTATAATTC GTCGCATTTT ATATAGTTAT CTATGTTTAC 2357ATGACTGTTT AAGCTTGATC TATATTTCTC AAGTGAATTG CCACATATGT TGGTACGGTA 2417ATAAATTAAT GAGGGAGTTT TGAAATTCGC AACCAATCTT ATATACGTTT GATGATATAA 2477ACGGATTGAG ATTCATTAAG CTACCTGATT TTCGCTGAAC TGTTTGTTAT AGGTTTTTAC 2537AGTAAGATAG TTCCTAAGTT TGTTTATTGT CCCCAGTCGG CCAATTGTTC CGGACTTATT 2597ATTATTACCA TTAGTGGTGT TAGTAGTATT                                  2627(2)SEQ ID NO:4的信息:
(i)序列特征:
(A)长度:609个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:4:Met Leu Lys Gly Val Pro Gly Leu Leu Phe Lys Glu Thr Gln Arg His1               5                  10                  15Leu Lys Pro Arg Leu Val Arg Ile Met Glu Asn Thr Ser Gln Asp Glu
         20                  25                  30Ser Arg Lys Arg Gln Val Ala Ser Asn Leu Ser Ser Asp Ala Asp Glu
     35                  40                  45Gly Ser Pro Ala Val Thr Arg Pro Val Lys Ile Thr Lys Arg Leu Arg
 50                  55                  60Lys Lys Asn Leu Gly Thr Gly Glu Leu Arg Asp Lys Ala Gly Phe Lys65                  70                  75                  80Leu Lys Val Gln Asp Val Ser Lys Asn Arg His Arg Gln Val Asp Pro
             85                  90                  95Glu Tyr Glu Val Val Val Asp Gly Pro Met Arg Lys Ile Lys Pro Tyr
        100                 105                 110Phe Phe Thr Tyr Lys Thr Phe Cys Lys Glu Arg Trp Arg Asp Arg Lys
    115                 120                 125Leu Leu AsP Val Phe Val Asp Glu Phe Arg Asp Arg Asp Arg Pro Tyr
130                 135                 140Tyr Glu Lys Val Ile Gly Ser Gly Gly Val Leu Leu Asn Gly Lys Ser145                 150                 155                 160Ser Thr Leu Asp Ser Val Leu Arg Asn Gly Asp Leu Ile Ser His Glu
            165                 170                 175Leu His Arg His Glu Pro Pro Val Ser Ser Arg Pro Ile Arg Thr Val
        180                 185                 190Tyr Glu Asp Asp Asp Ile Leu Val Ile Asp Lys Pro Ser Gly Ile Pro
    195                 200                 205Ala His Pro Thr Gly Arg Tyr Arg Phe Asn Ser Ile Thr Lys Ile Leu
210                 215                 220Glu Lys Gln Leu Gly Tyr Thr Val His Pro Cys Asn Arg Leu Asp Arg225                 230                 235                 240Leu Thr Ser Gly Leu Met Phe Leu Ala Lys Thr Pro Lys Gly Ala Asp
            245                 250                 255Glu Met Gly Asp Gln Met Lys Ala Arg Glu Val Lys Lys Glu Tyr Val
        260                 265                 270Ala Arg Val Val Gly Glu Phe Pro Ile Gly Glu Ile Val Val Asp Met
    275                 280                 285Pro Leu Lys Thr Ile Glu Pro Lys Leu Ala Leu Asn Met Val Cys Asp
290                 295                 300Pro Glu Asp Glu Ala Gly Lys Gly Ala Lys Thr Gln Phe Lys Arg Ile305                 310                 315                 320Ser Tyr Asp Gly Gln Thr Ser Ile Val Lys Cys Gln Pro Tyr Thr Gly
            325                 330                 335Arg Thr His Gln Ile Arg Val His Leu Gln Tyr Leu Gly Phe Pro Ile
        340                 345                 350Ala Ash Asp Pro Ile Tyr Ser Asn Pro His Ile Trp Gly Pro Ser Leu
    355                 360                 365Gly Lys Glu Cys Lys Ala Asp Tyr Lys Glu Val Ile Gln Lys Leu Asn
370                 375                 380Glu Ile Gly Lys Thr Lys Ser Ala Glu Ser Trp Tyr His Ser Asp Ser385                 390                 395                 400Gln Gly Glu Val Phe Lys Gly Glu Gln Cys Asp Glu Cys Gly Thr Glu
            405                 410                 415Leu Tyr Thr Asp Pro Gly Pro Asn Asp Leu Asp Leu Trp Leu His Ala
        420                 425                 430Tyr Arg Tyr Glu Ser Thr Glu Leu Asp Glu Asn Gly Ala Lys Lys Arg
    435                 440                 445Ser Tyr Ser Thr Ala Phe Pro Glu Trp Ala Leu Glu Gln His Gly Asp
450                 455                 460Phe Met Arg Leu Ala Ile Glu Gln Ala Lys Lys Cys Pro Pro Ala Lys465                 470                 475                 480Thr Ser Phe Ser Val Gly Ala Val Leu Val Asn Gly Thr Glu Ile Leu
            485                 490                 495Ala Thr Gly Tyr Ser Arg Glu Leu Glu Gly Asn Thr His Ala Glu Gln
        500                 505                 510Cys Ala Leu Gln Lys Tyr Phe Glu Gln His Lys Thr Asp Lys Val Pro
    515                 520                 525Ile Gly Thr Val Ile Tyr Thr Thr Met Glu Pro Cys Ser Leu Arg Leu
530                 535                 540Ser Gly Asn Lys Pro Cys Val Glu Arg Ile Ile Cys Gln Gln Gly Asn545                 550                 555                 560Ile Thr Ala Val Phe Val Gly Val Leu Glu Pro Asp Asn Phe Val Lys
            565                 570                 575Asn Asn Thr Ser Arg Ala Leu Leu Glu Gln His Gly Ile Asp Tyr Ile
        580                 585                 590Leu Val Pro Gly Phe Gln Glu Glu Cys Thr Glu Ala Ala Leu Lys Gly
    595                 600                 605His(2)SEQ ID NO:5的信息:
(i)序列特征:
(A)长度:1082碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线性
(ii)分子类型:cDNA到mRNA
(iii)假拟:否
(iii)反义:否
(vi)原始来源:
(A)生物体:棉阿舒囊霉
(ix)特征:
(A)名称/关键词:5’UTR
(B)位置:1..314
(ix)特征:
(A)名称/关键词:CDS
(B)位置:315..953
(ix)特征:
(A)名称/关键词:3’UTR
(B)位置:954..1082
(xi)序列描述:SEQ ID NO:5:CCCTTCTTGC ACGGTCGTTT CTGAAACTCT ACGATTATTG GAACAATGAG TAAGTCCTCA   60AATGTACCAC CTATCTGTAG TTTACTATCG GATTTACTGG CTAAGAGCTG ACCTGTTAGG  120CAAGTGAAAC ATATCACATC GCCAGCAGGT TGGGCTACCA AGGATAGTTG ATGACTTCCA  180TCACCTATAA AAGCGGCTTG AGTGCTTTTG CAATGATTCT GTTCACATGA TGGACAAGAA  240ATACGTACAA AAATTTCAAC GTTTTACAAG TTCCCAAGCT TAGTCAACTC ATCACCAACG  300ACAAACCAAG CAAC ATG ACA AGC CCA TGC ACT GAT ATC GGT ACC GCT ATA    350
            Met Thr Set Pro Cys Thr Asp Ile Gly Thr Ala Ile
              1               5                  10GAG CAG TTC AAG CAA AAT AAG ATG ATC ATC GTC ATG GAC CAC ATC TCG    398Glu Gln Phe Lys Gln Asn Lys Met Ile Ile Val Met Asp His Ile Ser
     15                  20                  25AGA GAA AAC GAG GCC GAT CTA ATA TGT GCA GCA GCG CAC ATG ACT GCC    446Arg Glu Asn Glu Ala Asp Leu Ile Cys Ala Ala Ala His Met Thr Ala
 30                  35                  40GAG CAA ATG GCA TTT ATG ATT CGG TAT TCC TCG GGC TAC GTT TGC GCT    494Glu Gln Met Ala Phe Met Ile Arg Tyr Ser Ser Gly Tyr Val Cys Ala45                  50                  55                  60CCA ATG ACC AAT GCG ATT GCC GAT AAG CTA GAC CTA CCG CTC ATG AAC    542Pro Met Thr Asn Ala Ile Ala Asp Lys Leu Asp Leu Pro Leu Met Asn
             65                  70                  75ACA TTG AAA TGC AAG GCT TTC TCC GAT GAC AGA CAC AGC ACT GCG TAT    590Thr Leu Lys Cys Lys Ala Phe Ser Asp Asp Arg His Ser Thr Ala Tyr
         80                  85                  90ACA ATC ACC TGT GAC TAT GCG CAC GGG ACG ACG ACA GGT ATC TCC GCA    638Thr Ile Thr Cys Asp Tyr Ala His Gly Thr Thr Thr Gly Ile Ser Ala
     95                 100                 105CGT GAC CGG GCG TTG ACC GTG AAT CAG TTG GCG AAC CCG GAG TCC AAG    686Arg Asp Arg Ala Leu Thr Val Asn Gln Leu Ala Asn Pro Glu Ser Lys
110                 115                 120GCT ACC GAC TTC ACG AAG CCA GGC CAC ATT GTG CCA TTG CGT GCC CGT    734Ala Thr Asp Phe Thr Lys Pro Gly His Ile Val Pro Leu Arg Ala Arg125                 130                 135                 140GAC GGC GGC GTG CTC GAG CGT GAC GGG CAC ACC GAA GCG GCG CTC GAC    782Asp Gly Gly Val Leu Glu Arg Asp Gly His Thr Glu Ala Ala Leu Asp
            145                 150                 155TTG TGC AGA CTA GCG GGT GTG CCA GAG GTC GCT GCT ATT TGT GAA TTA    830Leu Cys Arg Leu Ala Gly Val Pro Glu Val Ala Ala Ile Cys Glu Leu
        160                 165                 170GTA AGC GAA AGG GAC GTC GGG CTG ATG ATG ACT TTG GAT GAG TGT ATA    878Val Ser Glu Arg Asp Val Gly Leu Met Met Thr Leu Asp Glu Cys Ile
    175                 180                 185GAA TTC AGC AAG AAG CAC GGT CTT GCC CTC ATC ACC GTG CAT GAC CTG    926Glu Phe Ser Lys Lys His Gly Leu Ala Leu Ile Thr Val His Asp Leu
190                 195                 200AAG GCT GCA GTT GCC GCC AAG CAG TAGACGGCAA CGAGTTCTTT AAGTCGGTGT   980Lys Ala Ala Val Ala Ala Lys Gln205                 210TCATTTATGT AATATACCAT TTCATCGAAA AAGTCAAATG GTATGAACTA GATTTATCAA 1040TAGTATCTAA GAGTTATGGT ATTCGCAAAA GCTTATCGAT AC                    1082(2)SEQ ID NO:6的信息:
(i)序列特征:
(A)长度:212个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:6:Met Thr Ser Pro Cys Thr Asp Ile Gly Thr Ala Ile Glu Gln Phe Lys1               5                  10                  15Gln Asn Lys Met Ile Ile Val Met Asp His Ile Ser Arg Glu Asn Glu
         20                  25                  30Ala Asp Leu Ile Cys Ala Ala Ala His Met Thr Ala Glu Gln Met Ala
     35                  40                  45Phe Met Ile Arg Tyr Ser Ser Gly Tyr Val Cys Ala Pro Met Thr Asn
 50                  55                  60Ala Ile Ala Asp Lys Leu Asp Leu Pro Leu Met Asn Thr Leu Lys Cys65                  70                  75                  80Lys Ala Phe Ser Asp Asp Arg His Ser Thr Ala Tyr Thr Ile Thr Cys
             85                  90                  95Asp Tyr Ala His Gly Thr Thr Thr Gly Ile Ser Ala Arg Asp Arg Ala
        100                 105                 110Leu Thr Val Asn Gln Leu Ala Asn Pro Glu Ser Lys Ala Thr Asp Phe
    115                 120                 125Thr Lys Pro Gly His Ile Val Pro Leu Arg Ala Arg Asp Gly Gly Val
130                 135                 140Leu Glu Arg Asp Gly His Thr Glu Ala Ala Leu Asp Leu Cys Arg Leu145                 150                 155                 160Ala Gly Val Pro Glu Val Ala Ala Ile Cys Glu Leu Val Ser Glu Arg
            165                 170                 175Asp Val Gly Leu Met Met Thr Leu Asp Glu Cys Ile Glu Phe Ser Lys
        180                 185                 190Lys His Gly Leu Ala Leu Ile Thr Val His Asp Leu Lys Ala Ala Val
    195                 200                 205Ala Ala Lys Gln
210(2)SEQ ID NO:7的信息:
(i)序列特征:
(A)长度:996碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线性
(ii)分子类型:cDNA到mRNA
(iii)假拟:否
(iii)反义:否
(vi)原始来源:
(A)生物体:棉阿舒囊霉
(ix)特征:
(A)名称/关键词:5’UTR
(B)位置:1..270
(ix)特征:
(A)名称/关键词:CDS
(B)位置:271..789
(ix)特征:
(A)名称/关键词:3’UTR
(B)位置:790..996
(xi)序列描述:SEQ ID NO:7:TGGTATAATG ATACAGGAAG TGAAAATCCG AAAGGTTCAG ACGATGAAAA GAGTTTGAGA    60CGCATCAATG ATCAGCTTTG AGCTATATGT AAGTCTATTA ATTGATTACT AATAGCAATT   120TATGGTATCC TCTGTTCTGC ATATCGACGG TTCTCACGTG ATGATCAGCT TGAGGCTTCG   180CGGATAAAGT TCCATCGATT ACTATAAAAC CATCACATTA AACGTTCACT ATAGGCATAC   240ACACAGACTA AGTTCAAGTT AGCAGTGACA ATG ATT AAG GGA TTA GGC GAA GTT    294
                             Met Ile Lys Gly Leu Gly Glu Val
                               1               5GAT CAA ACC TAC GAT GCG AGC TCT GTC GAG GTT GGC ATT GTC CAC GCG     342Asp Gln Thr Tyr Asp Ala Ser Ser Val Glu Val Gly Ile Val His Ala
 10                  15                  20AGA TGG AAC AAG ACT GTC ATT GAC GCT CTC GAC CAA GGT GCA ATT GAG     390Arg Trp Asn Lys Thr Val Ile Asp Ala Leu Asp Gln Gly Ala Ile Glu25                  30                  35                  40AAA CTG CTT GCT ATG GGA GTG AAG GAG AAG AAT ATC ACT GTA AGC ACC     438Lys Leu Leu Ala Met Gly Val Lys Glu Lys Asn Ile Thr Val Ser Thr
             45                  50                  55GTT CCA GGT GCG TTT GAA CTA CCA TTT GGC ACT CAG CGG TTT GCC GAG     486Val Pro Gly Ala Phe Glu Leu Pro Phe Gly Thr Gln Arg Phe Ala Glu
         60                  65                  70CTG ACC AAG GCA AGT GGC AAG CAT TTG GAC GTG GTC ATC CCA ATT GGA     534Leu Thr Lys Ala Ser Gly Lys His Leu Asp Val Val Ile Pro Ile Gly
     75                  80                  85GTC CTG ATC AAA GGC GAC TCA ATG CAC TTT GAA TAT ATA TCA GAC TCT     582Val Leu Ile Lys Gly Asp Ser Met His Phe Glu Tyr Ile Ser Asp Ser
 90                  95                 100GTG ACT CAT GCC TTA ATG AAC CTA CAG AAG AAG ATT CGT CTT CCT GTC     630Val Thr His Ala Leu Met Asn Leu Gln Lys Lys Ile Arg Leu Pro Val105                 110                 115                 120ATT TTT GGT TTG CTA ACG TGT CTA ACA GAG GAA CAA GCG TTG ACA CGT     678Ile Phe Gly Leu Leu Thr Cys Leu Thr Glu Glu Gln Ala Leu Thr Arg
            125                 130                 135GCA GGC CTC GGT GAA TCT GAA GGC AAG CAC AAC CAC GGT GAA GAC TGG     726Ala Gly Leu Gly Glu Ser Glu Gly Lys His Asn His Gly Glu Asp Trp
        140                 145                 150GGT GCT GCT GCC GTG GAG ATG GCT GTA AAG TTT GGC CCA CGC GCC GAA     774Gly Ala Ala Ala Val Glu Met Ala Val Lys Phe Gly Pro Arg Ala Glu
    155                 160                 165CAA ATG AAG AAG TGAATATTAA AAAATCACTA CTTAAAATTA ACGTTTTTAT         826Gln Met Lys Lys
170TATGTCTATA TCAAATTCTT ACGTGATAAC TTTTGATTTC GCTTCCTGGA TTGGCGCAAG   886GCCTCCCTGT GTCGCAGTTT TTGTTCACGG GTCCACACAG CTCTGTTTTC CCAGAACATA   946TCCTCCCAGC CGGCGAACCG GTTAGACGCT TCTGCTGGCG TTCTTATTTT              996(2)SEQ ID NO:8的信息:
(i)序列特征:
(A)长度:172个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:8:Met Ile Lys Gly Leu Gly Glu Val Asp Gln Thr Tyr Asp Ala Ser Ser1               5                  10                  15Val Glu Val Gly Ile Val His Ala Arg Trp Asn Lys Thr Val Ile Asp
         20                  25                  30Ala Leu Asp Gln Gly Ala Ile Glu Lys Leu Leu Ala Met Gly Val Lys
     35                  40                  45Glu Lys Asn Ile Thr Val Ser Thr Val Pro Gly Ala Phe Glu Leu Pro
 50                  55                  60Phe Gly Thr Gln Arg Phe Ala Glu Leu Thr Lys Ala Ser Gly Lys His65                  70                  75                  80Leu Asp Val Val Ile Pro Ile Gly Val Leu Ile Lys Gly Asp Ser Met
             85                  90                  95His Phe Glu Tyr Ile Ser Asp Ser Val Thr His Ala Leu Met Asn Leu
        100                 105                 110Gln Lys Lys Ile Arg Leu Pro Val Ile Phe Gly Leu Leu Thr Cys Leu
    115                 120                 125Thr Glu Glu Gln Ala Leu Thr Arg Ala Gly Leu Gly Glu Ser Glu Gly
130                 135                 140Lys His Asn His Gly Glu Asp Trp Gly Ala Ala Ala Val Glu Met Ala145                 150                 155                 160Val Lys Phe Gly Pro Arg Ala Glu Gln Met Lys Lys
            165                 170(2)SEQ ID NO:9的信息:
(i)序列特征:
(A)长度:1511碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线性
(ii)分子类型:cDNA到mRNA
(iii)假拟:否
(iii)反义:否
(vi)原始来源:
(A)生物体:棉阿舒囊霉
(ix)特征:
(A)名称/关键词:5’UTR
(B)位置:1..524
(ix)特征:
(A)名称/关键词:CDS
(B)位置:525..1232
(ix)特征:
(A)名称/关键词:3’UTR
(B)位置:1233..1511
(xi)序列描述:SEQ ID NO:9:TGTATTCAAC CTGGAGGATA ACGAAATTTC CATGGCGCGG GCGATACCAA CCCACAGGAG    60CCAGATATAA GACCAATCCC GGCGGGTGTG CCAGCCGCCA TCAGAGACAG CGGGCCAGCA   120AGGCATGTGA AGTCAAAAGG CGCCAGCTCC TTATCCGCTC CCGCACAAGC AGGACCGGCA   180TATCCCGATG AGCGCGCCAG CACCCAGACG CTACACCACC ATTCGAAGTA GACTTTAAAA   240GAGCGCTTTC CAGCTTCTCA GGCAGTTAGC TCTACGACAA AGGAACCAAG TGATTTTCCC   300GATAGACGCG ACTTGCTCAA CGATGTTTCT GTGACCAGCG CAAGGAGAGA TAGTCCTAAA   360GTATAATCAG ATAGTTAGTC GTATCTTCTA GTTTTATTAG TCAGCTACAT GGCGAACCGC   420CATTTCCTTA TGCATGTCTT ACGAGTTTAA AAAGCTCGCG GTAGCAGAAA AGAAGATGCA   480TAGATGGCAT ACCGAAGCCT ATATCGCCCA TAGAAGTTGA TAGG ATG TTT ACC GGT    536
                                             Met Phe Thr Gly
                                               1ATA GTG GAA CAC ATT GGC ACT GTT GCT GAG TAC TTG GAG AAC GAT GCC     584Ile Val Glu His Ile Gly Thr Val Ala Glu Tyr Leu Glu Asn Asp Ala5                  10                  15                  20AGC GAG GCA GGC GGC AAC GGT GTG TCA GTC CTT ATC AAG GAT GCG GCT     632Ser Glu Ala Gly Gly Asn Gly Val Ser Val Leu Ile Lys Asp Ala Ala
             25                  30                  35CCG ATA CTG GCG GAT TGC CAC ATC GGT GAC TCG ATT GCA TGC AAT GGT     680Pro Ile Leu Ala Asp Cys His Ile Gly Asp Ser Ile Ala Cys Asn Gly
         40                  45                  50ATC TGC CTG ACG GTG ACG GAG TTC ACG GCC GAT AGC TTC AAG GTC GGG     728Ile Cys Leu Thr Val Thr Glu Phe Thr Ala Asp Ser Phe Lys Val Gly
     55                  60                  65ATC GCA CCA GAA ACA GTT TAT CGG ACG GAA GTC AGC AGC TGG AAA GCT     776Ile Ala Pro Glu Thr Val Tyr Arg Thr Glu Val Ser Ser Trp Lys Ala
 70                  75                  80GGC TCC AAG ATC AAC CTA GAA AGG GCC ATC TCG GAC GAC AGG CGC TAC     824Gly Ser Lys Ile Asn Leu Glu Arg Ala Ile Ser Asp Asp Arg Arg Tyr85                  90                  95                 100GGC GGG CAC TAC GTG CAG GGC CAC GTC GAC TCG GTG GCC TCT ATT GTA     872Gly Gly His Tyr Val Gln Gly His Val Asp Ser Val Ala Ser Ile Val
            105                 110                 115TCC AGA GAG CAC GAC GGG AAC TCT ATC AAC TTT AAG TTT AAA CTG CGC     920Ser Arg Glu His Asp Gly Asn Ser Ile Asn Phe Lys Phe Lys Leu Arg
        120                 125                 130GAT CAA GAG TAC GAG AAG TAC GTA GTA GAA AAG GGT TTT GTG GCG ATC     968Asp Gln Glu Tyr Glu Lys Tyr Val Val Glu Lys Gly Phe Val Ala Ile
    135                 140                 145GAC GGT GTG TCG CTG ACT GTA AGC AAG ATG GAT CCA GAT GGC TGT TTC    1016Asp Gly Val Ser Leu Thr Val Ser Lys Met Asp Pro Asp Gly Cys Phe
150                 155                 160TAC ATC TCG ATG ATT GCA CAC ACG CAG ACC GCT GTA GCC CTT CCA CTG   1064Tyr Ile Ser Met Ile Ala His Thr Gln Thr Ala Val Ala Leu Pro Leu165                 170                 175                 180AAG CCG GAC GGT GCC CTC GTG AAC ATA GAA ACG GAT GTT AAC GGC AAG   1112Lys Pro Asp Gly Ala Leu Val Asn Ile Glu Thr Asp Val Asn Gly Lys
            185                 190                 195CTA GTA GAG AAG CAG GTT GCA CAG TAC CTG AAT GCG CAG CTG GAA GGT   1160Leu Val Glu Lys Gln Val Ala Gln Tyr Leu Asn Ala Gln Leu Glu Gly
        200                 205                 210GAG AGC TCG CCA TTG CAG CGC GTG CTC GAA AGG ATT ATT GAA TCC AAG   1208Glu Ser Ser Pro Leu Gln Arg Val Leu Glu Arg Ile Ile Glu Ser Lys
    215                 220                 225CTT GCT AGC ATC TCA AAT AAG TGATTATATT ATCTTGGGTG CTGTATATCT      1259Leu Ala Ser Ile Ser Asn Lys
230                 235TATGTATGTC TTACGACTGT GAATCAGAGG GGTGGCAGCT GGAACACCAG CGACACACCT 1319TCGTCTCCCG CGGTGATCAG CCTTCTGTTT TCCTCAAGTA GTACAAAGTC TAGGACACCC 1379TGTTGTGGCC AACGCAAACA TGGAGCTGCT GCCCGTTACG CACGTCGAAC TCGTAGACCT 1439TGCCGTCAAT GCACGAGGCG AACAGGTGGA AACCGGTGGT CTTGTCAAAC CGCCAGCTTC 1499GTGACCGAGT CC                                                     1511(2)SEQ ID NO:10的信息:
(i)序列特征:
(A)长度:235个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:10:Met Phe Thr Gly Ile Val Glu His Ile Gly Thr Val Ala Glu Tyr Leu1               5                  10                  15Glu Asn Asp Ala Ser Glu Ala Gly Gly Asn Gly Val Ser Val Leu Ile
         20                  25                  30Lys Asp Ala Ala Pro Ile Leu Ala Asp Cys His Ile Gly Asp Ser Ile
     35                  40                  45Ala Cys Asn Gly Ile Cys Leu Thr Val Thr Glu Phe Thr Ala Asp Ser
 50                  55                  60Phe Lys Val Gly Ile Ala Pro Glu Thr Val Tyr Arg Thr Glu Val Ser65                  70                  75                  80Ser Trp Lys Ala Gly Ser Lys Ile Asn Leu Glu Arg Ala Ile Ser Asp
             85                  90                  95Asp Arg Arg Tyr Gly Gly His Tyr Val Gln Gly His Val Asp Ser Val
        100                 105                 110Ala Ser Ile Val Ser Arg Glu His Asp Gly Asn Ser Ile Asn Phe Lys
    115                 120                 125Phe Lys Leu Arg Asp Gln Glu Tyr Glu Lys Tyr Val Val Glu Lys Gly
130                 135                 140Phe Val Ala Ile Asp Gly Val Ser Leu Thr Val Ser Lys Met Asp Pro145                 150                 155                 160Asp Gly Cvs Phe Tyr Ile Ser Met Ile Ala His Thr Gln Thr Ala Val
            165                 170                 175Ala Leu Pro Leu Lys Pro Asp Gly Ala Leu Val Asn Ile Glu Thr Asp
        180                 185                 190Val Asn Gly Lys Leu Val Glu Lys Gln Val Ala Gln Tyr Leu Asn Ala
    195                 200                 205Gln Leu Glu Gly Glu Ser Ser Pro Leu Gln Arg Val Leu Glu Arg Ile
210                 215                 220Ile Glu Ser Lys Leu Ala Ser Ile Ser Asn Lys225                 230                 235(2)SEQ ID NO:11的信息:
(i)序列特征:
(A)长度:1596碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线性
(ii)分子类型:cDNA到mRNA
(iii)假拟:否
(iii)反义:否
(vi)原始来源:
(A)生物体:棉阿舒囊霉
(ix)特征:
(A)名称/关键词:5’UTR
(B)位置:1..352
(ix)特征:
(A)名称/关键词:CDS
(B)位置:353..1093
(ix)特征:
(A)名称/关键词:3’UTR
(B)位置:1094..1596
(xi)序列描述:SEQ ID NO:11:AGAAGAAGCG CAGGCGCCAG TCCGAGCTGG AGGAGAACGA GGCGGCGCGG TTGACGAACA    60GCGCGCTGCC CATGGACGAT GCGGGTATAC AGACGGCGGG TATACAGACG GCGGGTGGTG   120CCGAGAGAGG CACCAGGCCG GCTTCCTCCA GCGATGCAAG GAAGAGAAGG GGACCAGAGG   180CGAAGTTCAA GCCATCTAAG GTACAGAAGC CCCAATTGAA GCGAACTGCA TCGTCCCGGG   240CGGATGAGAA CGAGTTCTCG ATATTATAGA GGCCCCCGTT TCGAGTGATT GGCGTCAAAA   300ACGGCTATCT GCCTTCGTCC GCCCCCACCA CCCTCGGGAA CACTGGCAAA CC ATG       355
                                                      Met
                                                        1GCG CTA ATA CCA CTT TCT CAA GAT CTG GCT GAT ATA CTA GCA CCG TAC     403Ala Leu Ile Pro Leu Ser Gln Asp Leu Ala Asp Ile Leu Ala Pro Tyr
          5                  10                  15TTA CCG ACA CCA CCG GAC TCA TCC GCA CGC CTG CCG TTT GTC ACG CTG     451Leu Pro Thr Pro Pro Asp Ser Ser Ala Arg Leu Pro Phe Val Thr Leu
     20                  25                  30ACG TAT GCG CAG TCC CTA GAT GCT CGT ATC GCG AAG CAA AAG GGT GAA     499Thr Tyr Ala Gln Ser Leu Asp Ala Arg Ile Ala Lys Gln Lys Gly Glu
 35                  40                  45AGG ACG GTT ATT TCG CAT GAG GAG ACC AAG ACA ATG ACG CAT TAT CTA     547Arg Thr Val Ile Ser His Glu Glu Thr Lys Thr Met Thr His Tyr Leu50                  55                  60                  65CGC TAC CAT CAT AGC GGC ATC CTG ATT GGC TCG GGC ACA GCC CTT GCG     595Arg Tyr His His Ser Gly Ile Leu Ile Gly Ser Gly Thr Ala Leu Ala
             70                  75                  80GAC GAC CCG GAT CTC AAT TGC CGG TGG ACA CCT GCA GCG GAC GGG GCG    643Asp Asp Pro Asp Leu Asn Cys Arg Trp Thr Pro Ala Ala Asp Gly Ala
         85                  90                  95GAT TGC ACC GAA CAG TCT TCA CCA CGA CCC ATT ATC TTG GAT GTT CGG    691Asp Cys Thr Glu Gln Ser Ser Pro Arg Pro Ile Ile Leu Asp Val Arg
    100                 105                 110GGC AGA TGG AGA TAC CGC GGG TCC AAA ATA GAG TAT CTG CAT AAC CTT    739Gly Arg Trp Arg Tyr Arg Gly Ser Lys Ile Glu Tyr Leu His Asn Leu
115                 120                 125GGC AAG GGG AAG GCG CCC ATA GTG GTC ACG GGG GGT GAG CCG GAG GTC    787Gly Lys Gly Lys Ala Pro Ile Val Val Thr Gly Gly Glu Pro Glu Val130                 135                 140                 145CGC GAA CTA GGC GTC AGT TAC CTG CAG CTG GGT GTC GAC GAG GGT GGC    835Arg Glu Leu Gly Val Ser Tyr Leu Gln Leu Gly Val Asp Glu Gly Gly
            150                 155                 160CGC TTG AAT TGG GGC GAG TTG TTT GAG CGA CTC TAT TCT GAG CAC CAC    883Arg Leu Asn Trp Gly Glu Leu Phe Glu Arg Leu Tyr Ser Glu His His
        165                 170                 175CTG GAA AGT GTC ATG GTC GAA GGC GGC GCG GAG GTG CTC AAC CAG CTG    931Leu Glu Ser Val Met Val Glu Gly Gly Ala Glu Val Leu Asn Gln Leu
    180                 185                 190CTG CTG CGC CCA GAT ATT GTG GAC AGT CTG GTG ATC ACG ATA GGA TCC    979Leu Leu Arg Pro Asp Ile Val Asp Ser Leu Val Ile Thr Ile Gly Ser
195                 200                 205AAG TTC CTG GGC TCA CTA GGT GTT GCG GTC TCA CCA GCT GAG GAG GTG   1027Lys Phe Leu Gly Ser Leu Gly Val Ala Val Ser Pro Ala Glu Glu Val210                 215                 220                 225AAC CTA GAG CAT GTG AAC TGG TGG CAC GGA ACA AGT GAC AGT GTT TTG   1075Asn Leu Glu His Val Asn Trp Trp His Gly Thr Ser Asp Ser Val Leu
            230                 235                 240TGC GGC CGG CTC GCA TAGCGGTTAT GACTGGTCTA CTAGTTAAAA CTATTTACTC   1130Cys Gly Arg Leu Ala
        245CTATACATAT TGCGTCACAT AGCGTTTATC CCCCTCGCCA ACCGCCTCGT GCCGTTGGAA 1190ACACGGCGGC CGGGGGACCT CAAGCGCTCC GCATCGACTA GTTTAATTTA CAAACAGATT 1250CTGTAACTTG CGTAACGGCC AGAGGTCTCT GACTTTCTGA TAATCTTCAC CACCTCACCT 1310CGCTTCAACC CCAGGTATAA TGCAACTTGG ATCCATCCTC TGGATTCTAG GTAACTGAGA 1370TTCCTTTAAC CTGTATCTCT TCAACAACTC CTTCTTTTCT TCGTCGCTGA GTTTGATATG 1430TTTTGGCACA AGCTCATGGT GCGTGATATT TACCACCAAA GCTGTTTCGT TGAAAGTCTC 1490AATTGTAGCA GGAGCGACGG AGGGAAGCAG TTTCAACGCG CTGGGCGTTA TGCCGTTCTG 1550ATATATGAAA ATACCCGTCT GGAAGTTCTT CTCGCCAATG TGGATC                1596(2)SEQ ID NO:12的信息:
(i)序列特征:
(A)长度:246个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:12:Met Ala Leu Ile Pro Leu Ser Gln Asp Leu Ala Asp Ile Leu Ala Pro1               5                  10                  15Tyr Leu Pro Thr Pro Pro Asp Ser Ser Ala Arg Leu Pro Phe Val Thr
         20                  25                  30Leu Thr Tyr Ala Gln Ser Leu Asp Ala Arg Ile Ala Lys Gln Lys Gly
     35                  40                  45Glu Arg Thr Val Ile Ser His Glu Glu Thr Lys Thr Met Thr His Tyr
 50                  55                  60Leu Arg Tyr His His Ser Gly Ile Leu Ile Gly Ser Gly Thr Ala Leu65                  70                  75                  80Ala Asp Asp Pro Asp Leu Asn Cys Arg Trp Thr Pro Ala Ala Asp Gly
             85                  90                  95Ala Asp Cys Thr Glu Gln Ser Ser Pro Arg Pro Ile Ile Leu Asp Val
        100                 105                 110Arg Gly Arg Trp Arg Tyr Arg Gly Ser Lys Ile Glu Tyr Leu His Asn
    115                 120                 125Leu Gly Lys Gly Lys Ala Pro Ile Val Val Thr Gly Gly Glu Pro Glu
130                 135                 140Val Arg Glu Leu Gly Val Ser Tyr Leu Gln Leu Gly Val Asp Glu Gly145                 150                 155                 160Gly Arg Leu Asn Trp Gly Glu Leu Phe Glu Arg Leu Tyr Ser Glu His
            165                 170                 175His Leu Glu Ser Val Met Val Glu Gly Gly Ala Glu Val Leu Asn Gln
        180                 185                 190Leu Leu Leu Arg Pro Asp Ile Val Asp Ser Leu Val Ile Thr Ile Gly
    195                 200                 205Ser Lys Phe Leu Gly Ser Leu Gly Val Ala Val Ser Pro Ala Glu Glu
210                 215                 220Val Asn Leu Glu His Val Asn Trp Trp His Gly Thr Ser Asp Ser Val225                 230                 235                 240Leu Cys Gly Arg Leu Ala
            245

Claims (9)

1.编码具有SEQ ID NO:2所示氨基酸序列的多肽、或编码SEQ ID NO:2所示多肽的类似物或衍生物的DNA序列,所述类似物或衍生物中一个或多个氨基酸已被缺失、插入或被其他氨基酸所替代、而基本不降低该多肽的酶促作用。
2.编码具有SEQ ID NO:4所示氨基酸序列的多肽、或编码SEQ ID NO:4所示多肽的类似物或衍生物的DNA序列,所述类似物或衍生物中一个或多个氨基酸已被缺失、插入或被其他氨基酸所替代、而基本不降低该多肽的酶促作用。
3.编码具有SEQ ID NO:6所示氨基酸序列的多肽、或编码SEQ ID NO:6所示多肽的类似物或衍生物的DNA序列,所述类似物或衍生物中一个或多个氨基酸已被缺失、插入或被其他氨基酸所替代、而基本不降低该多肽的酶促作用。
4.编码具有SEQ ID NO:8所示氨基酸序列的多肽、或编码SEQ ID NO:8所示多肽的类似物或衍生物的DNA序列,所述类似物或衍生物中一个或多个氨基酸已被缺失、插入或被其他氨基酸所替代、而基本不降低该多肽的酶促作用。
5.编码具有SEQ ID NO:10所示氨基酸序列的多肽、或编码SEQ ID NO:10所示多肽的类似物或衍生物的DNA序列,所述类似物或衍生物中一个或多个氨基酸已被缺失、插入或被其他氨基酸所替代、而基本不降低该多肽的酶促作用。
6.编码具有SEQ ID NO:12所示氨基酸序列的多肽、或编码SEQ ID NO:12所示多肽的类似物或衍生物的DNA序列,所述类似物或衍生物中一个或多个氨基酸已被缺失、插入或被其他氨基酸所替代、而基本不降低该多肽的酶促作用。
7.含有一种或多种权利要求1-6中的DNA序列的表达载体。
8.已被权利要求7的表达系统转化的宿主生物。
9.制备核黄素的重组方法,该方法利用权利要求8的宿主生物。
CN95192767A 1994-03-25 1995-03-15 真菌中的核黄素生物合成 Expired - Lifetime CN1117151C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
DEP4410382.4 1994-03-25
DE4410382 1994-03-25
DE4420785A DE4420785A1 (de) 1994-03-25 1994-06-15 Riboflavin-Biosynthese in Pilzen
DEP4420785.9 1994-06-15

Publications (2)

Publication Number Publication Date
CN1146781A true CN1146781A (zh) 1997-04-02
CN1117151C CN1117151C (zh) 2003-08-06

Family

ID=25935071

Family Applications (1)

Application Number Title Priority Date Filing Date
CN95192767A Expired - Lifetime CN1117151C (zh) 1994-03-25 1995-03-15 真菌中的核黄素生物合成

Country Status (8)

Country Link
US (1) US5821090A (zh)
EP (1) EP0751995B1 (zh)
JP (1) JP3756180B2 (zh)
CN (1) CN1117151C (zh)
CA (1) CA2186403C (zh)
DK (1) DK0751995T3 (zh)
ES (1) ES2216010T3 (zh)
WO (1) WO1995026406A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8968093B2 (en) 2004-07-15 2015-03-03 Intel Corporation Dynamic insertion of personalized content in online game scenes
CN114592000A (zh) * 2020-12-03 2022-06-07 上海市农业科学院 一种六基因组合在水稻种子中提高vb2含量的应用及方法

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6350597B1 (en) 1994-01-13 2002-02-26 E. I. Du Pont De Nemours & Company Riboflavin synthase genes and enzymes and methods of use
CN1110569C (zh) * 1995-07-13 2003-06-04 巴斯福股份公司 利用异柠檬酸裂合酶活性被改变的微生物制备核黄素
US6239264B1 (en) 1996-12-31 2001-05-29 Syngenta Participations Ag Genomic DNA sequences of ashbya gossypii and uses thereof
US6146866A (en) * 1997-08-15 2000-11-14 E.I. Du Pont De Nemours And Company Lumazine synthase and riboflavin synthase
US6323013B1 (en) 1998-10-28 2001-11-27 E. I. Du Pont De Nemours And Company Lumazine synthase and riboflavin synthase
US6682891B2 (en) 1997-08-15 2004-01-27 E. I. Du Pont De Nemours And Company Methods of identifying nucleic acid sequences encoding plant riboflavin synthase enzymes
DE19840709A1 (de) * 1997-12-22 1999-06-24 Forschungszentrum Juelich Gmbh Ein- oder mehrzellige Organismen zur Herstellung von Riboflavin
EP0927761A3 (de) * 1997-12-23 2001-09-05 Basf Aktiengesellschaft Gene der Purinbiosyntese aus Ashbya gossypii und deren Verwendung in der mikrobiellen Riboflavinsynthese
DE19801120A1 (de) 1998-01-15 1999-07-22 Basf Ag Orotidin-5'-Phosphatdecarboxylase-Gen, Genkonstrukt enthaltend dieses Gen und seine Verwendung
ID23301A (id) 1998-04-23 2000-04-05 Hoffmann La Roche Produksi yang berlebihan dari riboflavin di dalam ragi
US6074830A (en) * 1998-06-09 2000-06-13 E. I. Du Pont De Nemours & Company 3,4-dihydroxy-2-butanone 4-phosphate synthase
US6291660B1 (en) 1998-10-08 2001-09-18 Syngenta Participations Ag Fungal genes required for normal growth and development
US7009045B2 (en) * 2000-07-14 2006-03-07 Archer-Daniels-Midland Company Transformation systems for flavinogenic yeast
US20050221460A1 (en) * 2001-08-22 2005-10-06 Basf Ag Novel genetic products from ashbya gossypii, associated with the structure of the cell wall or the cytoskeleton
KR20040032999A (ko) * 2001-08-29 2004-04-17 바스프 악티엔게젤샤프트 전사 메카니즘, rna 프로세싱 및(또는) 번역과 관련된,아쉬비아 고쉬피로부터의 신규 유전자 산물
DE10159396A1 (de) * 2001-12-04 2003-06-12 Basf Ag Genetische Stammoptimierung zur verbesserten Herstellung von Riboflavin
DE10209363A1 (de) * 2002-03-02 2003-09-11 Basf Ag Verfahren zur Herstellung von Riboflavin
DE60314258T2 (de) * 2002-09-06 2008-02-07 Basf Ag Gtp cyclohydrolase ii als ziel für fungizide
KR100422305B1 (ko) 2002-12-05 2004-03-10 씨제이 주식회사 리보플라빈을 생산하는 미생물 및 이를 이용한리보플라빈의 생산방법
KR100422307B1 (ko) 2002-12-05 2004-03-10 씨제이 주식회사 리보플라빈을 생산하는 미생물 및 이를 이용한리보플라빈의 생산방법
KR101227226B1 (ko) * 2004-07-07 2013-01-28 디에스엠 아이피 어셋츠 비.브이. 개선된 효소
KR101335853B1 (ko) 2011-12-01 2013-12-02 씨제이제일제당 (주) L-아미노산 및 리보플라빈을 동시에 생산하는 미생물 및 이를 이용한 l-아미노산 및 리보플라빈을 생산하는 방법
KR102561863B1 (ko) * 2014-11-19 2023-08-01 바스프 에스이 Imp 데히드로게나아제 활성을 증가시키기 위한 에레모테시움의 유전적 변형

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1066486C (zh) * 1989-06-22 2001-05-30 霍夫曼-拉罗奇有限公司 高产核黄素的细菌菌株
DE59310239D1 (de) * 1992-05-11 2002-01-10 Basf Ag DNA-Verbindungen und rekombinante, die Ribloflavinsynthetaseaktivität von S. cerevisiae codierende DNA-Expressionsvektoren
DE4238904A1 (de) * 1992-11-19 1994-05-26 Basf Ag Riboflavin-Synthese in Hefen

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8968093B2 (en) 2004-07-15 2015-03-03 Intel Corporation Dynamic insertion of personalized content in online game scenes
CN114592000A (zh) * 2020-12-03 2022-06-07 上海市农业科学院 一种六基因组合在水稻种子中提高vb2含量的应用及方法

Also Published As

Publication number Publication date
WO1995026406A2 (de) 1995-10-05
EP0751995A1 (de) 1997-01-08
CA2186403A1 (en) 1995-10-05
JP3756180B2 (ja) 2006-03-15
WO1995026406A3 (de) 2001-12-20
EP0751995B1 (de) 2004-02-18
DK0751995T3 (da) 2004-03-08
CN1117151C (zh) 2003-08-06
ES2216010T3 (es) 2004-10-16
CA2186403C (en) 2006-01-24
US5821090A (en) 1998-10-13
JPH09510618A (ja) 1997-10-28

Similar Documents

Publication Publication Date Title
CN1117151C (zh) 真菌中的核黄素生物合成
CN1253574C (zh) 来自米曲霉的areA基因和其中areA基因已被修饰的真菌
CN1196792C (zh) 新型的基于营养缺陷型互补的非抗生素筛选的大肠杆菌宿主/载体系统
CN100347301C (zh) 无选择标志重组基因的菌株,得到这些菌株的方法及应用
CN100347291C (zh) 用于发酵制备l-半胱氨酸、l-胱氨酸、n-乙酰丝氨酸或四氢噻唑衍生物的微生物和方法
CN1262639C (zh) 新的宿主细胞和生产蛋白质的方法
CN1513057A (zh) 宿主微生物
CN1062169A (zh) 巴斯德毕赤酵母酸性磷酸酶基因
CN1626667A (zh) 生产l-谷氨酸的细菌和生产l-谷氨酸的方法
CN1187539A (zh) 用于产生l-赖氨酸的方法
CN1681942A (zh) 使用酵母表面展示载体筛选具有改良的酶活性的脂肪酶的方法和该脂肪酶
CN1161461C (zh) 碱性磷酸酶在酵母中的表达
CN1852983A (zh) 蛋白质从酵母的分泌
CN1269838C (zh) 用于由大肠杆菌向培养基中分泌来制备Leu-水蛭素的信号序列
CN1160465C (zh) 其中areA、pepC和/或pepE基因已被灭活的真菌
CN1993464A (zh) 新羰基还原酶、其基因及它们的使用方法
CN1536072A (zh) 属于芽孢杆菌属的肌苷生产细菌和生产肌苷的方法
CN101041837A (zh) 一种新的天然脱落酸制备方法
CN1592780A (zh) 产生γ-谷氨酰半胱氨酸的酵母
CN1839199A (zh) 脂质生产菌的育种方法
CN1661015A (zh) 来自产朊假丝酵母的谷胱甘肽合成酶编码基因
CN1154720C (zh) β-呋喃果糖苷酶及其基因
CN1558953A (zh) 编码番茄红素环化酶 /八氢番茄红素合酶(carRP)和八氢番茄红素脱氢酶(carB)的三孢布拉霉β-胡萝卜素的生物合成基因
CN1894404A (zh) 有机酸存在下的启动子及其用途
CN1178245A (zh) 反式-4-羟基-l-脯氨酸的制造方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CX01 Expiry of patent term

Expiration termination date: 20150315

Granted publication date: 20030806