CN109477115B - 用于真核生物的表达系统 - Google Patents
用于真核生物的表达系统 Download PDFInfo
- Publication number
- CN109477115B CN109477115B CN201780020813.9A CN201780020813A CN109477115B CN 109477115 B CN109477115 B CN 109477115B CN 201780020813 A CN201780020813 A CN 201780020813A CN 109477115 B CN109477115 B CN 109477115B
- Authority
- CN
- China
- Prior art keywords
- expression
- dna
- stf
- core promoter
- promoter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
- C12N15/625—DNA sequences coding for fusion proteins containing a sequence coding for a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
- C07H21/04—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/12—Type of nucleic acid catalytic nucleic acids, e.g. ribozymes
- C12N2310/122—Hairpin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/50—Physical structure
- C12N2310/53—Physical structure partially self-complementary or closed
- C12N2310/531—Stem-loop; Hairpin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Organic Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了用于真核宿主的表达系统,其包含:1)包含核心启动子的表达盒,所述核心启动子控制编码合成转录因子(sTF)的DNA序列的表达,和2)一个或多个表达盒,每个表达盒包含与合成启动子可操作连接的编码所需产物的DNA序列,所述合成启动子包含核心启动子和核心启动子上游的sTF特异性结合位点。本发明还提供了鉴定用于真核宿主的通用核心启动子的方法、使用通用核心启动子的表达系统、包含所述系统的宿主以及在真核宿主中产生蛋白质产物的方法。
Description
技术领域
本发明涉及用于真核宿主(例如微生物宿主)的表达系统、包含所述表达系统的宿主和通过使用所述宿主生产所需蛋白质产物的方法。此外,本发明涉及鉴定通用核心启动子的方法、可通过所述方法获得的通用核心启动子和表达系统、真核生物宿主(例如微生物宿主)和通过使用通用核心启动子生产蛋白质产物的方法。
背景
即使在良好建立的宿主中也非常难以实现受控和可预测的基因表达,尤其是在不同培养条件或生长阶段中的稳定表达方面。此外,对于许多潜在有兴趣的工业宿主,存在非常有限的(或甚至不存在)工具和/或方法系列来完成异源基因的表达。在许多情况下,这阻止了在工业应用中使用这些宿主(通常非常有前途的宿主)。在一些宿主中,需要特定的诱导条件以实现期望的靶基因表达。这导致培养基或下游加工的特定要求,最终增加生产成本。工业宿主中的另一个问题是建立复杂的表达程序,其中期望同时具有多个基因的特定表达水平。例如,这对于代谢途径工程化是重要的,其中需要以平衡比率表达编码生产途径中的酶的个体基因(以及所生产的相应酶)以确保最佳代谢流量朝向所需产物。
为了在宿主生物中(在可变条件下)实现靶基因的可预测和/或稳定的表达模式,重要的是这些基因的表达受宿主的内在调控机制的影响最小。这可以通过在工程化的靶基因表达系统中使用非天然(异源)组分(启动子、转录因子和诱导剂)来实现。如果它们不受宿主影响,并且如果它们除有意的方式以外的其他方式影响宿主,这些表达系统称为正交的。然而,正交表达系统仍依赖于宿主内源细胞功能,例如转录和翻译,因此它们必须满足允许其在宿主中的功能性的某些标准。这些标准在某种程度上是物种(宿主)特异性的,这使得难以设计跨越广泛各种非常不同物种的有功能的正交系统。
通常,目前用于表达异源基因的策略是在特定宿主中使用内源的(宿主特异性的)启动子(Hubmann等人2014和Blumhoff等人2012)。这些启动子可以是诱导型的,或所谓的组成型的,但在两种情况下它们都不是正交的,因为它们的功能取决于宿主生物中存在的特定因子。此外,宿主特异性启动子的使用阻止了这些表达系统的种间转移,这导致必须为每个宿主开发定制的表达系统。基于天然宿主启动子的种间可转移表达系统的现有实例限于窄范围的紧密相关的生物,其中启动子起作用。这些包括一些酵母启动子,例如乳酸克鲁维酵母(Kluyveromyces lactis)URA3和LEU2,或在酿酒酵母(Saccharomyces cerevisiae)中起作用的粟酒裂殖酵母(Schizosaccharomyces pombe)HIS5启动子。在丝状真菌中,例如构巢曲霉(Aspergillus nidulans)的gpdA启动子已经成功地用于黑曲霉(Aspergillusniger)、烟曲霉(Aspergillus fumigatus)和里氏木霉(Trichoderma reesei)。然而,这些启动子主要用于在这些生物中表达选择标记基因。它们不适用于靶基因表达(编码所需的蛋白质),并且尤其不适用于同时表达多个基因(编码代谢途径),因为它们的活性受生长条件的强烈影响或它们赋予转录活性的一系列不足。
一些研究已经报告了对一些基因表达系统的表征和工程化,所述系统采用合成(正交)转录因子(sTF)和工程化的sTF依赖性启动子来控制靶基因的表达。sTF依赖性启动子由与核心启动子连接的可变数量的sTF结合位点组成。与特定核心启动子组合的结合位点的数量限定了靶基因的表达水平,并且与利用宿主特异性启动子用于靶基因表达的系统相比,它代表了表达水平控制的显著改善。然而,这些表达系统中使用的sTF是由天然(宿主特异性)启动子或修饰的天然启动子表达的,这使得这些系统仅是部分正交的,并且阻止它们在不同物种中使用。部分正交表达系统的实例包括:
1)针对酿酒酵母开发的表达系统,其中sTF由酿酒酵母TDH3启动子或由组合TDH3UAS和酿酒酵母CYC1核心启动子的启动子表达,并且靶基因由含有多种数量的sTF结合位点和TDH3或CYC1核心启动子的合成启动子表达(Ito等人,2015)。
2)针对构巢曲霉和黑曲霉开发的表达系统,其中sTF由构巢曲霉gpdA启动子表达,并且靶基因由含有sTF的3个结合位点、酿酒酵母URA3核心启动子和源自大肠杆菌的94bp随机序列的合成启动子表达(Pach-linger等人,2005)。
3)针对拟南芥(Arabidopsis thaliana)开发的表达系统,其中sTF由拟南芥35S启动子或其他拟南芥启动子,或由含有sTF的4个结合位点和拟南芥35S最小启动子的合成启动子表达。最小启动子可能是指所引用的出版物中的核心启动子。靶基因由含有sTF的4个结合位点和拟南芥35S最小启动子的合成启动子表达(US2002081667)。
尽管在现有技术中已经公开了几种基因表达系统,但是仍然需要用于真核生物宿主(例如真核微生物宿主)的基因表达系统,其可以提供稳健和稳定的表达,广谱的表达水平,并且能够用于几种不同的真核生物的种和属,如几种不同真核微生物的种和属。这将是例如能够在几个潜在生产宿主中同时有效转移和测试工程化的代谢途径,以进行功能性评估。此外,真正的正交表达系统将为研究真核生物的科学界提供益处。
概述
本发明的一个目的是提供在大范围的真核生物如真核微生物中具有功能(可转移)的正交表达系统。此类表达系统将克服在构建表达系统中使用宿主-天然DNA序列的需要,并因此建立不依赖于表达宿主的内在转录调节的表达系统。
本发明的另一个目的是提供表达系统,其允许靶基因的稳健、稳定和可预测的表达水平,并且其不受宿主生物的培养条件或者发育或生长阶段的影响。
本发明的动机基于以下发现:1)使用宿主特异性启动子或其部分用于表达sTF,和2)在控制靶基因表达的sTF依赖性启动子中使用物种特异性核心启动子是为何基于sTF的现有表达系统不能在不丧失其功能的情况下在不同物种之间转移的主要原因。
本发明显示使用单独用于表达sTF的核心启动子是有利的。这允许sTF在宿主(例如微生物宿主)中的低组成型表达。
此外,本发明显示可以开发鉴定在远缘物种中有功能的核心启动子的方法。
此外,本发明显示可以构建基于在不同物种中有功能的这些核心启动子的表达系统,其允许跨越大范围的真核生物(例如真核微生物)的靶基因的可调节表达水平。
因此,本发明提供了用于真核宿主(例如微生物宿主)的表达系统,其包含:
(a)包含核心启动子的表达盒,
所述核心启动子是控制编码合成转录因子(sTF)的DNA序列表达的唯一“启动子”,和
(b)一个或多个表达盒,每个表达盒包含与合成启动子可操作连接的编码所需蛋白质产物的DNA序列,
所述合成启动子包含与(a)相同的核心启动子或另一种核心启动子和核心启动子上游的sTF特异性结合位点。
本发明还提供了真核宿主,例如真核微生物宿主,其包含所述表达系统。
此外,本发明提供了在真核宿主中生产所需蛋白质产物(或同时产生多种所需蛋白质产物)的方法,包括在合适的培养条件下培养所述真核宿主。
此外,本发明提供了用于在真核微生物宿主中生产所需蛋白质产物(或多种所需蛋白质产物)的方法,包括在合适的培养条件下培养所述真核微生物宿主。
本发明还提供了鉴定用于真核宿主的通用核心启动子的方法。
鉴定方法包括以下步骤:
-在酿酒酵母中组成型表达合成转录因子sTF,
-在共表达与sTF依赖性测试启动子可操作地连接的报告基因的同一宿主中,所述sTF依赖性测试启动子包含待测试的核心启动子和其上游的sTF结合位点,
-在被sTF激活的情况下,允许所述报告基因在测试启动子下表达,
-评估报告基因的表达水平,和
-从测试的核心启动子中选择显示在相同报告系统中测试的酿酒酵母PGK1核心启动子所获得的报告基因表达的至少40%的核心启动子;
-在特定情况下,还选择与在相同报告系统中测试的酿酒酵母PGK1核心启动子所获得的报告基因表达相比,显示报告基因表达低于40%的核心启动子。
此外,本发明提供了通用核心启动子(UCP)。通用核心启动子可通过所公开的鉴定方法获得。
通用核心启动子(UCP)通常包含含有真核基因5'-上游区域的DNA序列,起始于TATA框的上游10-50bp并终止于ATG起始密码子的上游9bp。TATA框与起始密码子之间的距离优选地不大于180bp且不小于80bp。UCP通常还包含在它的3'末端的包含随机1-20bp的DNA序列。在一个实施方案中,UCP通常包含与真核基因的所述5'-上游区域具有至少90%序列同一性的DNA序列,和在它的3'末端的包含随机1-20bp的DNA序列。
此外,本发明提供了用于真核宿主的表达系统,其包含
(a)包含UCP的表达盒,
所述UCP控制编码合成转录因子(sTF)的DNA序列的表达,和
(b)一个或多个表达盒,每个表达盒包含与合成启动子可操作连接的编码所需蛋白质产物的DNA序列,
所述合成启动子包含与(a)相同的UCP或另一种UCP和UCP上游的sTF特异性结合位点。
此外,本发明提供了真核宿主(例如真核微生物宿主),其包含使用通用核心启动子的表达系统。
本发明还提供了使用具有通用核心启动子的表达系统在真核宿主(例如真核微生物宿主)中生产所需蛋白质产物(或同时生产多种所需蛋白质产物)的方法。
因此,本发明提供了在大范围的真核生物或真核微生物中具有功能(可转移)的正交表达系统,其允许靶基因的稳健、稳定和可预测的表达水平,并且不受宿主生物的培养条件或者发育或生长阶段的影响。
本发明提供的表达系统简化并集中在构建新表达宿主所需的遗传工具。目前,存在高度生物和物种特异性的一系列表达系统。利用本发明,致力于真核生物的工业和更广泛的科学界能够采用较小的、通用的正交表达工具集合。这将有利于业界并推动该领域的新创新。
附图简要说明
图1描绘了用于在真核生物(例如真核微生物)中表达单个基因的表达系统的方案。
图2A、2B和2C描绘了用于从候选核心启动子中选择UCP的筛选方法的方案。
图3描绘了在真核生物(例如真核微生物)中利用UCP用于同时调节多个基因表达的表达系统的方案。
图4描绘了在不同生物或微生物中具有功能/可转移的表达系统的实例。
图5A和5B描绘了对不同形式的sTF的测试和通过荧光测定法评估在酿酒酵母中对表达系统的性能的调节。
图6A和6B描绘了对不同真菌宿主中表达系统的分析。通过荧光流式细胞术(6A)和荧光测定法(6B)测定报告基因表达的定量分析。
图7A、7B、7C和7D描绘了通过荧光流式细胞术和蛋白质印迹对不同宿主(库德里阿兹威毕赤酵母(Pichia kudriavzevii)、黑曲霉和里氏木霉)中可调节表达水平的分析。
图8A和8B描绘了表达系统的方案(8A)和通过定量实时PCR(qPCR)对Kazachstaniaexigua中报告基因的表达的分析(8B)。
图9A、9B、9C和9D描绘了对含有表达系统的不同表达宿主(里氏木霉和巴斯德毕赤酵母(Pichia pastoris))中蛋白质生产的分析。
详述
定义
除非另外定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解相同的含义。
DNA指脱氧核糖核酸。
密码子是三核苷酸单元,它在编码蛋白质的基因中编码单个氨基酸。编码一个氨基酸的密码子可以在它们的三个核苷酸的任何一个中不同。不同的生物在其基因组中具有不同频率的密码子,这对mRNA翻译和蛋白质生产的效率具有影响。
编码序列是指编码特定RNA或多肽(即特定氨基酸序列)的DNA序列。在一些情况下,编码序列可含有内含子(即中断阅读框的其他序列,其在RNA分子成熟期间在称为RNA剪接的过程中被除去)。如果编码序列编码多肽,则该序列包含阅读框。
阅读框由起始密码子(RNA中为AUG;对应于DNA序列中为ATG)定义,并且它是编码多肽(蛋白质)的连续密码子的序列。阅读框终止于终止密码子(三种中的一种:RNA中为UAG、UGA和UAA;对应于DNA序列中为TAG、TGA和TAA)。本领域技术人员能够通过使用通常可用的计算机程序和数据库来预测开放阅读框的位置。
真核启动子是启动基因转录所必需的DNA区域。它位于编码特定RNA或多肽的DNA序列(编码序列)的上游。它含有上游激活序列(UAS)和核心启动子。本领域技术人员能够通过使用通常可用的计算机程序和数据库来预测启动子的位置。
核心启动子(CP)是真核启动子的部分,它是由起始密码子所定义的编码序列(其编码多肽)的紧邻上游的DNA区域(5'-上游区域)。核心启动子包含启动转录所必需的所有通用转录调节基序,例如TATA框,但不包含任何特定的调节基序,例如UAS序列(天然激活物和阻遏物的结合位点)。
根据本发明的目的,核心启动子被定义为一种DNA序列,其含有:1)高表达的基因的5'-上游区域,起始于TATA框的上游10-50bp并终止于起始密码子的上游9bp,其中TATA框与起始密码子之间的距离不大于180bp且不小于80bp,2)随机1-20bp,通常为5-15或6-10bp,它们位于起始密码子的紧邻上游的DNA区域(1)的9bp的位置;或核心启动子被定义为含有以下序列的DNA序列:1)与所述5'-上游区域具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的DNA序列和2)随机1-20bp,通常为5-15或6-10bp,它们位于起始密码子的紧邻上游的DNA区域(1)的9bp的位置。
在本发明的上下文中,生物中高表达的基因是通过转录组学分析确定的在任何研究条件下已经显示在该生物中表达的在所有基因的前3%或5%的基因,或者是在尚未进行转录组学分析的生物中其为高表达基因最接近的序列同源物的基因。
根据本发明的目的,TATA框被定义为起始密码子上游的DNA序列(TATA),其中TATA序列和起始密码子的距离不大于180bp且不小于80bp。在多个序列满足描述的情况下,TATA框被定义为与起始密码子具有最小距离的TATA序列。
转录因子是指与UAS中存在的特定DNA序列结合从而控制由RNA II聚合酶执行的转录速率的蛋白质。转录因子通过促进(作为激活物)或阻断(作为阻遏物)RNA聚合酶向基因的核心启动子的募集,单独或与复合物中的其他蛋白质一起发挥该功能。
合成转录因子(sTF)是指作为转录因子起作用但不是宿主生物的天然蛋白质的蛋白质。在本发明的上下文中,sTF是人工蛋白质,其通常包含原核起源的DNA结合蛋白、核定位信号和病毒起源的转录激活结构域。
合成启动子是指作为真核启动子起作用但不是宿主生物的天然存在的启动子的DNA区域。它含有上游激活序列(UAS)和核心启动子,其中UAS或核心启动子或者两种元件对宿主生物而言不是天然的。在本发明的上下文中,合成启动子包含与核心启动子连接的(通常1-10个,通常为1、2、4或8个)sTF特异性结合位点(合成UAS-sUAS)。
DNA结合结构域或DBD是指这样的蛋白质区域,通常是特定的蛋白质结构域,其负责蛋白质与特定DNA序列的相互作用(结合)。
通用核心启动子(UCP)是一种核心启动子,其赋予使用在如本发明所公开的CP-筛选系统中测试的酿酒酵母PKG1核心启动子获得的足够(通常但不一定至少40%)报告表达或活性水平,例如荧光水平。通过使用该系统选择的核心启动子通常在真核生物的各个种和属中提供足够的转录因子表达。
正交表达系统在此是指由异源(非天然)核心启动子、转录因子和转录因子特异性结合位点组成的表达系统。通常,正交表达系统在不同真核生物如真核微生物中具有功能(可转移)。
CP-筛选系统是在酿酒酵母中构建的,并且它包含组成型表达sTF的酿酒酵母菌株和优选地包含与待测试的核心启动子组装的着丝粒型报告质粒。报告质粒通常含有对sTF特异的结合位点,报告基因如mCherry基因,和终止子如用于mCherry基因的ADH1终止子。将测试的核心启动子插入sTF结合位点和报告基因之间。测试的核心启动子通常包含在它的3'末端的包含1-20个随机核苷酸的序列,例如序列TTAATTAAA,并且通常包括限制性位点。通过报告水平测量例如所得菌株的荧光测量评估核心启动子的功能,并与其中核心启动子是酿酒酵母PKG1核心启动子的对照菌株进行比较。
着丝粒质粒在这里是指酿酒酵母中使用的单拷贝数或低拷贝数质粒。该质粒含有酿酒酵母中作为着丝粒起作用(CEN序列)和作为自主复制序列(ARS)的DNA区域。ARS序列提供复制起点,而CEN序列在细胞分裂期间调节质粒的复制和分布,这使得着丝粒质粒与染色体类似。
转录因子的充分表达定义为导致受转录因子依赖性启动子控制的一个基因或多个基因的转录激活的转录因子表达水平。
真核生物在本发明的上下文中定义为属于以下的生物:1)真菌界,包括酵母,例如酵母纲(Saccharomycetales),包括但不限于酿酒酵母,乳酸克鲁维酵母,克鲁伊念珠菌(Candida krusei)(库德里阿兹威毕赤酵母),巴斯德毕赤酵母(Komagataella pastoris),Eremothecium gossypii,Kazachstania exigua,耶氏解脂酵母(Yarrowia lipolytica)等的种;或裂殖酵母纲(Schizosaccharomycetes),如粟酒裂殖酵母;丝状真菌,如散囊菌纲(Eurotiomycetes),包括但不限于黑曲霉,构巢曲霉,产黄青霉(Penicilliumchrysogenum)等的种;粪壳菌纲(Sordariomycetes),包括但不限于里氏木霉,Myceliophthora thermophile等的种;或毛霉菌目(Mucorales),如印度毛霉菌(Mucorindicus)等。2)植物界,包括有花植物,如茄目(Solanales),包括但不限于烟草属(Nicotiana)(本氏烟草(N.benthamiana)),茄属(Solanum)(马铃薯(S.tuberosum)),番茄属(Lycopersicon)(番茄(L.esculentum)),辣椒属(Capsicum)(辣椒(C.anuum))等;十字花目(Brassicales)包括但不限于拟南芥属(Arabidopsis)(拟南芥(A.thaliana)),芸苔属(Brassica)(欧洲油菜(B.napus))等的属;禾本目(Poales)包括但不限于燕麦(Avenasativa),黑麦(Secale cereale),玉米(Zea mays),小麦属的种(Triticum spp.),水稻(Oryza sativa),大麦(Hordeum vulgare),高粱(Sorghum bicolor),甘蔗(Saccharumofficinarum)等的种;豆目(Fabales),包括但不限于菜豆属的种(Phaseolus spp.),豇豆属的种(Vigna spp.),大豆(Glycine max),豌豆(Pisum sativum),兵豆(Lensculinaris),鹰嘴豆(Cicer arietinum)等的种;金虎尾目(Malpighiales),包括但不限于杨属(Populus)等的属;松目(Pinales),包括但不限于松属(Pinus)等的属;或棕榈目(Arecales)包括但不限于油棕(Elaeis guineensis),椰子(Cocos nucifera)等的种;和绿藻,如绿藻纲(Chlorophyceae),包括但不限于衣藻属(Chlamydomonas)(莱茵衣藻(C.reinhardtii));或共球藻纲(Trebouxiophyceae),包括但不限于小球藻属的种(Chlorella spp.)等的种。3)动物界,包括哺乳动物(哺乳动物纲(Mammalia)),包括但不限于小家鼠(Mus musculus)(小鼠),中国仓鼠(Cricetulus griseus)(仓鼠),智人(Homosapiens)(人类)等的种;昆虫,包括但不限于甘蓝夜蛾(Mamestra brassicae),草地贪夜蛾(Spodoptera frugiperda),粉纹夜蛾(Trichoplusia ni),黑腹果蝇(Drosophilamelanogaster)等的种。
真核微生物在本发明的上下文中定义为微生物,包括酵母,例如酵母纲,包括但不限于酿酒酵母,乳酸克鲁维酵母,克鲁伊念珠菌(库德里阿兹威毕赤酵母),巴斯德毕赤酵母(Komagataella pastoris),Eremothecium gossypii,Kazachstania exigua,耶氏解脂酵母等的种;裂殖酵母纲,如粟酒裂殖酵母;和丝状真菌,如散囊菌纲,包括但不限于物种黑曲霉,构巢曲霉,产黄青霉等的种;粪壳菌纲,包括但不限于物种里氏木霉,Myceliophthorathermophile等的种;毛霉菌目,如印度毛霉菌等。
本发明提供了用于真核宿主的表达系统,其包含
(a)包含核心启动子的表达盒;
核心启动子是控制编码合成转录因子(sTF)的DNA序列表达的唯一启动子,和
(b)一个或多个表达盒,每个表达盒包含与合成启动子可操作连接的编码所需蛋白质产物的DNA序列;
合成启动子包含核心启动子,其与(a)中的核心启动子相同或是另一种核心启动子,和核心启动子上游的一个或多个sTF特异性结合位点。
核心启动子通常包含含有真核基因的5'-上游区域的DNA序列,起始于TATA框的上游10-50bp并终止于ATG起始密码子的上游9bp。TATA框与起始密码子之间的距离不大于180bp且不小于80bp。核心启动子通常还包含在其3'末端的包含随机1-20bp的DNA序列。在一个实施方案中,核心启动子通常包含与真核基因的所述5'-上游区域具有至少90%序列同一性的DNA序列,和在其3'末端的包含随机1-20bp的DNA序列。
编码合成转录因子(sTF)的DNA序列通常包含原核转录调节因子、核定位信号和转录激活结构域。
表达系统中使用的CP可以是不同的,或者第一个CP(CP1)可以与第二个CP(CP2)(或第三个CP(CP3)或第四个CP(CP4))相同。这示例于图1和3中。
两个表达盒((a)和(b))可以作为两个个体DNA分子引入真核宿主(通常整合到基因组中),或作为其中两个(或更多个)表达盒连接(融合)形成单个DNA的一个DNA分子引入真核宿主。
在特定应用中,当靶基因是宿主生物的天然(同源)基因时,合成启动子也能够插入宿主生物基因组中靶基因编码区的紧邻上游,可能替换靶基因的原始(天然)启动子。
更具体地,表达系统因此包含两个DNA部分,其组装成包含至少两个个体表达盒的表达系统:
(a)sTF(合成转录因子)盒,其包含编码融合蛋白(sTF)的基因的CP控制表达、sTF本身和终止子。sTF包含源自原核起源的DNA结合蛋白,通常是细菌转录调节因子,例如来自TetR家族;核定位信号,如SV40NLS;和转录激活结构域,例如VP16或VP64激活域;和
(b)靶基因表达盒,其包含合成启动子,其包含由0-20个、通常为5-15个随机核苷酸分开的可变数量通常为1至10个、典型为1、2、4或8个的sTF结合位点,CP,靶基因和终止子。
示例表达系统的组成示例于图1中。
本发明基于使用核心启动子(CP)代替完整启动子来表达合成转录因子(sTF)的理念。当置于基因前面时,一些CP能够维持低水平的转录。由于缺乏条件转录控制所需的存在于完全启动子中(通常在上游激活序列-UAS中)的特定调控序列,因此该转录是组成型的-在所有生长或代谢条件下都是恒定的。因为一般的转录机制是进化上保守的,所以一些CP能够在非常多样的物种中起作用。这些特征在本发明中用于构建可物种转移的表达系统。
由CP促进的sTF基因的组成型低表达提供了足够量的合成转录因子,其与它在靶基因的合成启动子上的特异性结合位点结合并激活它的表达。结合位点的数量与靶基因的表达水平成比例,其中结合位点越多导致表达越高。除包含sTF结合位点外,合成启动子还包含CP。在控制靶基因表达的合成启动子中对CP的选择对于靶基因的表达水平也是重要的。sTF结合位点和CP的组合能够产生一定范围的表达水平,其可以从非常低到非常高进行调节。在最高处,该系统实现的表达超过宿主生物中最高表达的天然基因的表达水平。
图1示例说明了用于在真核生物或微生物中表达单个基因的表达系统的方案的实例。合成转录因子(sTF)表达盒含有CP(CP1)、sTF编码序列和终止子。CP1提供sTF的组成型低表达。因此,sTF在所有生长条件下以及所有发育和生长阶段始终以恒定水平存在于宿主细胞中。靶基因表达盒含有合成启动子、靶基因编码序列和终止子。合成启动子包含多个sTF特异性结合位点(通常为1-10个、典型为1、2、4或8个;形成合成上游激活序列-sUAS)和CP(CP2)。靶基因编码目的蛋白质产物。
CP1的转录活性即“信号”由与sUAS结合的sTF“放大”。这导致对CP2的转录激活,导致靶基因的表达。如上所述,两个表达盒能够作为两个个体DNA分子引入真核宿主(通常整合到基因组中),或作为其中两个盒连接(融合)成单个DNA的一个DNA分子引入真核宿主。在特定应用中,当靶基因是宿主生物的天然(同源)基因时,合成启动子也能够插入宿主生物基因组中靶基因编码区的紧邻上游。表达系统中使用的CP可以是不同的,或者CP1可以与CP2相同。
本发明还提供了真核宿主(例如真核微生物宿主),其包含本文公开的表达系统。
真核生物在这里特别是指:1)真菌物种,包括酵母,例如来自以下的物种:酵母纲,包括但不限于酿酒酵母,乳酸克鲁维酵母,克鲁伊念珠菌(库德里阿兹威毕赤酵母),巴斯德毕赤酵母(Komagataella pastoris),Eremothecium gossypii,Kazachstania exigua,耶氏解脂酵母等;裂殖酵母纲,如粟酒裂殖酵母;和丝状真菌物种,如来自以下的那些:散囊菌纲,包括但不限于黑曲霉,构巢曲霉,产黄青霉等;粪壳菌纲,包括但不限于里氏木霉,Myceliophthora thermophile等;毛霉菌目,如印度毛霉菌等;2)植物物种,包括有花植物,例如来自以下的物种:茄目(Solanales),包括但不限于本氏烟草,马铃薯,番茄,辣椒等;十字花目,包括但不限于拟南芥,欧洲油菜等;禾本目,包括但不限于燕麦,黑麦,玉米,小麦属的种,水稻,大麦,高粱,甘蔗等;豆目,包括但不限于菜豆属的种,豇豆属的种,大豆,豌豆,兵豆,鹰嘴豆等;金虎尾目,包括但不限于杨属的种(Populus sp.)等;松目,包括但不限于松属的种(Pinus sp.)等;或棕榈目包括但不限于油棕,椰子等;和绿藻物种,包括但不限于莱茵衣藻,小球藻属的种等;3)动物物种,包括但不限于哺乳动物(哺乳动物纲),包括但不限于小家鼠(小鼠),中国仓鼠(仓鼠),智人(人类)等的种;昆虫,包括但不限于甘蓝夜蛾,草地贪夜蛾,粉纹夜蛾,黑腹果蝇等的种。
本发明还提供了用于在真核宿主(例如微生物宿主)中生产所需蛋白质产物的方法,包括在合适的培养条件下培养宿主。
合适的培养条件是指允许宿主生物存活或生长和/或在宿主生物中生产所需产物的任何条件。所需产物可以是一个或多个靶基因的产物(一种或多种蛋白质),或者由蛋白质(酶)或通过代谢途径生产的化合物。在本文上下文中,所需产物通常是蛋白质(酶)产物。
本发明还提供了在几种不同的真核物种和属中具有功能的基因表达系统。所述系统中的关键元素是核心启动子,其促进在几个物种中的表达。这种核心启动子在这里被称为通用核心启动子--UCP。
这种性质,即所谓的基础转录活性,是基于RNA聚合酶II复合物向核心启动子的有效募集;并且它在所有培养和生长(发育)条件下导致低但稳定的表达水平。这种低组成型信号由其表达由UCP控制的合成转录因子(sTF)放大成(天然的或异源的)靶基因的可调节表达水平。每个靶基因处于工程化的启动子的控制下,并包含UCP和选定数量的sTF特异性结合位点。sTF特异性结合位点和UCP的组合定义了靶基因的表达水平。
这提供了控制不同宿主中表达的方法,包括具有未开发的专有技术(know-how)的宿主。使用UCP的应用是蛋白质生产、代谢工程和人工基因调节网络。
此外,该系统可以用作鉴定具有新特性的新UCP的平台。
本发明提供了鉴定用于真核宿主的通用核心启动子的方法。该方法包括
-在酿酒酵母中组成型表达合成转录因子sTF,
-在同一宿主中共表达与sTF依赖性测试启动子可操作连接的报告基因,所述sTF依赖性测试启动子包含待测试的核心启动子,和其上游的sTF结合位点,
-在被sTF激活的情况下,允许所述报告基因在测试启动子下表达,
-评估报告基因的表达水平,和
-从测试的核心启动子中选择显示在相同报告系统中测试的酿酒酵母PGK1核心启动子所获得的报告基因表达的至少40%的核心启动子。
-在特定情况下,还选择显示报告基因表达低于40%的核心启动子。
更具体地,该方法最佳地包括使用包含报告基因和与测试的核心启动子可操作地连接的sTF特异性结合位点的环状着丝粒质粒。
编码合成转录因子(sTF)的DNA序列通常包含编码原核起源的DNA结合蛋白的DNA序列、核定位信号和转录激活结构域。sTF包含衍生自原核(通常为细菌起源)的转录调节因子的DNA结合蛋白,例如来自TetR家族的蛋白质;核定位信号,如SV40NLS;和转录激活结构域,例如VP16或VP64激活结构域。
待测试的启动子选自真核基因的启动子,其在给定的真核生物中的任何条件下表达至所有基因的最高的3%或5%的水平。
本发明提供了通用核心启动子(UCP),其中核心启动子可通过本文公开的鉴定方法获得。
通常,通用核心启动子包含DNA序列,其含有1)真核基因的5'-上游区域,起始于TATA框的上游10-50bp并终止于ATG起始密码子的上游9bp;以及2)随机1-20bp DNA序列,它位于起始密码子紧邻上游的DNA区域(1)的9bp位置。TATA框与原始真核基因的起始密码子之间的距离不大于180bp且不小于80bp。在一个实施方案中,核心启动子包含与所述5'-上游区域具有至少90%序列同一性的DNA序列,和随机1-20bp DNA序列,其位于起始密码子紧邻上游的DNA区域(1)的9bp位置。
对在远缘生物中有功能的CP的选择在酿酒酵母中进行,并且候选CP的来源优选地(但不一定)是工业相关的生物,优选地(但不一定)在进化分歧或其他特征方面有所不同,如基因组结构或GC含量。
对候选CP的选择基于在所选来源生物中基因的表达水平,在其启动子中含有候选CP。另一个选择标准是在候选CP中存在TATA框(图2A)。
在一个实施方案中,功能性CP的筛选有利地通过在体内组装候选CP与在组成型表达sTF的酿酒酵母菌株中表达的sTF依赖性报告盒来执行(图2B)。测试所得菌株的报告水平,优选地荧光,并将这些水平与对照菌株进行比较,在对照菌株中酿酒酵母PGK1核心启动子用于报告构建体。促进达到对照菌株的(通常但不一定高于40%)足够的报告水平,优选地荧光(图2C),并因此满足筛选标准的候选CP称为通用核心启动子,UCP。选定的CP和UCP用于构建表达系统。
得到的表达系统在真核宿主中是有功能的。这些宿主包括所有真核生物,特别是:1)真菌微生物,包括丝状真菌和酵母,特别是来自以下分类的生物:A)酵母纲,包括但不限于酿酒酵母,乳酸克鲁维酵母,克鲁伊念珠菌(库德里阿兹威毕赤酵母),巴斯德毕赤酵母(Komagataella pastoris),Eremothecium gossypii,Kazachstania exigua,耶氏解脂酵母等的种;裂殖酵母纲,如粟酒裂殖酵母;B)散囊菌纲,包括但不限于黑曲霉,构巢曲霉,产黄青霉等的种;C)粪壳菌纲,包括但不限于里氏木霉,Myceliophthora thermophile等的种;D)毛霉菌目,如印度毛霉菌等。2)植物生物,包括有花植物和绿藻,特别是来自以下分类的生物:E)茄目,包括但不限于本氏烟草,马铃薯,番茄,辣椒等的种;F)十字花目,包括但不限于拟南芥,欧洲油菜等的种;G)禾本目,包括但不限于燕麦,黑麦,玉米,小麦属的种,水稻,大麦,高粱,甘蔗等的种;H)豆目,包括但不限于菜豆属的种,豇豆属的种,大豆,豌豆,兵豆,鹰嘴豆等的种;I)金虎尾目,包括但不限于杨属的种等的种;J)松目,包括但不限于松属的种等的种;K)棕榈目包括但不限于油棕,椰子等的种;L)绿藻纲,包括但不限于莱茵衣藻等的种;M)共球藻纲,包括但不限于小球藻属的种等的种。3)动物生物,特别是以下分类的生物:N)哺乳动物(哺乳动物纲),包括但不限于物种小家鼠(小鼠),中国仓鼠(仓鼠),智人(人类)等的种;O)昆虫(昆虫纲(Insecta),包括但不限于甘蓝夜蛾,草地贪夜蛾,粉纹夜蛾,黑腹果蝇等的种。
图2A、B和C示例显示了用于从候选核心启动子中选择UCP的筛选方法的方案的示例。
图2A示例显示了在真核生物中选择候选核心启动子的方案。对在任何真核生物的基因(其属于在任何条件下,前3%或5%最高表达的一组基因)紧邻上游的DNA区域进行分析在起始密码子(ATG)上游-180bp和-80bp内的TATA序列(TATA框)的存在。如果在该区域中出现多于一个TATA序列,则选择最接近ATG(起始密码子)的TATA序列作为TATA框。选择开始于TATA框的上游10-50bp并终止于ATG(起始密码子)上游9bp的序列用于核心启动子筛选。
图2B示例说明了组成型表达sTF的酿酒酵母菌株。它通常用线性化的着丝粒(单拷贝数或低拷贝数)质粒和待测试的核心启动子的文库或个体形式进行共转化。着丝粒质粒通常含有例如4个sTF结合位点,报告基因,如mCherry基因,并且它在这两个特征之间线性化,如图所示。每个核心启动子DNA片段包含选择的DNA序列(图2A),随后是包含随机核苷酸的序列,通常含有限制性位点,这里一个有用的序列是例如TTAATTAAA,并且在每个末端侧接20-50bp长的DNA序列。这些侧翼序列与线性化质粒的每个末端同源,5'-侧翼序列与部分覆盖线性化质粒中的sTF结合位点的区域同源,并且3'-侧翼序列与报告基因(如mCherry基因)开放阅读框的5'-末端同源。转化后,通过酿酒酵母的内在同源重组机制在体内组装质粒,产生环状着丝粒质粒,其包含sTF结合位点,然后是包含序列(如TTAATTAAA)的核心启动子,和报告基因,如mCherry基因。分析所得菌株的报告水平,例如由生产的mCherry蛋白引起的红色荧光。报告水平的强度水平,例如荧光,对应于报告基因(例如mCherry基因)的表达水平,其与测试的核心启动子的功能相对应。
图2C)选择转化的菌株,其赋予足够水平的报告基因,例如荧光,其通常为如在含有相同的着丝粒质粒中组装的PGK1核心启动子的菌株的报告基因例如荧光的40%或更高(通过图中的箭头突出显示)。从所选菌株中分离中心质粒,纯化质粒DNA并测序,并将选择的核心启动子用于随后构建表达盒,用于在其他真核生物中进行测试。在特定情况下,也使用不赋予40%或更高的报告表达水平的核心启动子用于构建真核生物的表达盒。如果核心启动子在核心-启动子-供体宿主中以及也在至少一种与所述核心-启动子-供体宿主不同的物种的其他宿主中有作用,则所述核心启动子被指定为通用核心启动子UCP。
本发明提供了通用核心启动子(UCP),其可通过所公开的方法获得。通常,UCP包含含有以下的DNA序列:1)真核基因的5'-上游区域,起始于TATA框的上游10-50bp并终止于ATG起始密码子的上游9bp,并且其中TATA框与起始密码子之间的距离不大于180bp且不小于80bp。2)以及包含随机1-20bp的DNA序列,其位于DNA序列(1)的3'末端。在一个实施方案中,通用核心启动子包含1)与所述5'-上游区域具有至少90%序列同一性的DNA序列和2)包含位于DNA序列的3'末端的随机1-20bp的DNA序列。
本发明还提供了用于真核宿主的表达系统,其包含
(a)包含UCP的表达盒,
所述UCP控制编码合成转录因子(sTF)的DNA序列的表达,和
(b)一个或多个表达盒,每个表达盒包含与合成启动子可操作连接的编码所需蛋白质产物的DNA序列,
所述合成启动子包含(a)的UCP或另一种UCP,和UCP上游的sTF特异性结合位点。
可以构建多个合成启动子,其具有不同数量的结合位点(由0-20个、通常5-15个随机核苷酸分开的通常为1-10个,典型为1、2、4或8个),其通过一个sTF同时控制不同的靶基因。例如,这将导致形成代谢途径的一组不同表达的基因。
图3示例说明了利用UCP同时调节真核生物(例如微生物)中多种基因表达的表达系统方案的实例。该方案描述了假设的代谢途径,但该方法也可用于其他多基因表达系统(信号传导、转运或糖基化途径,蛋白质的同时生产等)或它们的组合。
图3中的合成转录因子(sTF)表达盒(A)类似于图1中所示,实现了相同的目的。靶基因表达盒能够以1至20的可变数量存在。每个靶基因表达盒含有合成启动子,其可以具有经典(单向)结构(B)或双向设计(C)。合成启动子(单向或双向)由UCP和多个sTF特异性结合位点(通常为1-10个,典型为1、2、4或8个)组成。靶基因(基因A、B、C、D)编码目的蛋白质,其可以形成代谢途径或其部分,或根据应用编码蛋白质的任何组合。
图3中示例所示的表达系统的功能类似于图1中所示,UCP1的转录活性由与靶基因的sUAS结合的sTF“调节”。每个sUAS与UCP组合的占用导致每个个体基因的特定表达水平,从而产生特定水平的靶蛋白。表达盒可以作为个体DNA分子或作为其中个体表达盒融合在一起的较大的DNA分子被引入真核宿主(通常整合到基因组中)。在特定应用中,当靶基因是宿主生物的天然(同源)基因时-合成启动子也可以插入宿主生物基因组中每个靶基因编码区的紧邻上游。表达系统中使用的UCP可以是不同的,或者也可以一些或所有UCP是相同的。
本发明提供了真核宿主,其包含所公开的表达系统。这些宿主包括所有真核生物,特别是真菌微生物,包括丝状真菌和酵母,植物宿主,包括有花植物和藻类,以及动物宿主,包括哺乳动物和昆虫。
本发明还提供了在真核宿主(例如微生物宿主)中产生所需蛋白质产物的方法,包括在合适的培养条件下培养宿主。
对用于不同表达水平的表达系统的调节可以在酿酒酵母中进行,其中可以快速测试多种选择,包括UCP、sTF、不同数量的BS和靶基因的选择。建立的不同表达基因的最佳组可以直接转移到目的宿主,在那里它保留其功能。通过该系统实现的高水平表达也可用于蛋白质(酶)生产宿主。使用酿酒酵母的优势在于可用于遗传修饰、DNA转化、筛选、分析、培养和计算机模拟的成熟且快速的方法。这将加速工业宿主发展的过程,并使得能够使用对特定用途具有高潜力的新宿主,但用于遗传工程的工具范围非常有限。
图4示例说明了在不同真核生物中有功能的/可转移的表达系统的实例。在单个DNA分子中组装的表达系统包含两个表达盒:1)sTF表达盒,其包含不同的UCP,在此示例为533cp或008cp(参见表1和2),DNA结合蛋白形式的sTF,在此示例为BM3R1,和终止子,在此示例为里氏木霉TEF1终止子。以及2)靶基因表达盒包含许多sTF特异性结合位点,在此示例为8个BM3R1特异性结合位点,不同的UCP,在此示例为114cp或201cp(见表1和2),报告基因编码区,在此示例为mCherry(红色荧光蛋白)编码区,和终止子,在此示例为酿酒酵母ADH1终止子。将DNA结合蛋白(此处为BM3R1)的编码区进行密码子优化以适合黑曲霉的密码子使用。在实施例3中,含有201cp和008cp的表达系统形式被称为“形式A”,并且含有114cp和533cp的表达系统形式被称为“形式B”。
图5A和5B示例说明了对不同形式的sTF的测试和对酿酒酵母中表达系统性能的调节的评估的实例。
图5A)通过对上述系统进行以下修改构建了与图4中所示类似的表达系统:1)使用不同的DNA结合蛋白作为sTF的部分(LexA、SrpR、PhlF、TetR、BM3R1和TarA,参见实施例1);2)在靶基因表达盒的合成启动子中使用不同数量的sTF特异性结合位点(图中所示的具有8个结合位点的形式);3)将个体盒(sTF表达盒和报告盒)以单拷贝各自整合到酿酒酵母基因组中在两个分开的基因组基因座中(在此示例为URA3和LEU2);4)sTF由酿酒酵母核心启动子表达,在此示例为TDH3核心启动子;5)在报告表达盒中使用的核心启动子在此示例为酿酒酵母ENO1cp。
图5B)测试了具有整合的两个表达盒的菌株的荧光水平。测试了对照表达系统,其具有8个sTF特异性结合位点并且缺少sTF表达盒(在图中显示为“wo sTF”)。DNA结合蛋白SrpR、PhlF、TetR、BM3R1和TarA针对酿酒酵母的密码子使用进行密码子优化。在大多数情况下,证明了对靶基因表达水平的明确调节,其反映了靶基因表达盒的合成启动子中sTF特异性结合位点的数量(图中指定为0-8个)。
图6A和6B描绘了对不同真菌宿主中表达系统分析的实例。通过荧光流式细胞术(6A)和荧光测定法(6B)测定的报告基因表达的定量分析。将构建的表达系统(表2)以单拷贝整合到以下的基因组中:酿酒酵母、黑曲霉、里氏木霉、解脂耶氏酵母、克鲁斯念珠菌(库德里阿兹威毕赤酵母)和巴斯德毕赤酵母(Komagataella pastoris)。通过对转化菌株的荧光分析证实了该系统在所有这些生物中的功能性。用于每种生物的表达系统与图4中显示的那些相同。图(6A和6B)中的菌株标识符表示如下:“WT”代表表达系统没有转化至其的每种表达宿主的背景菌株;“A”代表具有含有201cp和008cp的图4所示的表达系统形式(以单拷贝整合在基因组中)的菌株;“A*”表示具有表达系统形式A的菌株,其中sTF的DNA结合部分经密码子优化以匹配酿酒酵母中常见的密码子;“B”代表具有含有114cp和533cp的图4所示的表达系统形式(以单拷贝整合在基因组中)的菌株;“B*”代表具有表达系统形式B的菌株,其中sTF的DNA结合部分经密码子优化以匹配酿酒酵母中常见的密码子;“A_NC”和“B_NC”代表具有表达系统(A或B)的阴性对照形式的菌株(以单拷贝整合在基因组中),其中sTF表达盒不存在(缺失),仅留下靶基因表达盒(在此示例为8BS+201/114cp+mCherry+Sc-ADH1终止子)。
图6A描绘了宿主中mCherry表达的流式细胞术分析(DB FACSAria III仪器)。它是对细胞(对于单细胞真菌-酿酒酵母、解脂耶氏酵母、库德里阿兹威毕赤酵母、巴斯德毕赤酵母)或孢子(对于丝状真菌-黑曲霉、里氏木霉)进行的。这些图显示了来自每种菌株的10000个细胞/孢子的粒子(细胞/孢子)大小(FSC-前向散射)的标准化的荧光强度(mCherry)。水平线(灰色框内)代表中值,灰色框代表四分位数范围(IQ范围),灰色框底部代表25%百分位值,灰色框顶部代表75%百分位值,并且框图中的细线(whisker)代表从25%/75%的百分位值到最高值和最低值的值,其不大于IQ范围的1.5倍,其与IQ范围一起代表在这些实验中所有测量的实例(细胞/孢子)约99%的值。
图6B描绘了对宿主中mCherry表达分析的实例。在SCD培养基中生长18小时后,使用Varioskan仪器(Thermo Electron Corporation)对细胞/菌丝体悬浮液进行荧光测量。这些图显示了细胞/菌丝体悬浮液的光密度的标准化的荧光强度(mCherry)用于荧光分析。柱代表平均值,误差条表示至少3个实验重复的标准偏差。
图7A、7B、7C和7D描绘了对不同宿主(库德里阿兹威毕赤酵母、黑曲霉和里氏木霉)中可调节表达水平的分析的实例。
图7A描绘了具有可变数量的sTF结合位点的表达系统的实例(显示为方案),所述sTF结合位点用于调节库德里阿兹威毕赤酵母和黑曲霉中的报告基因表达。在单个DNA分子中组装的表达系统包含两个表达盒(类似于图4中的那些):1)sTF表达盒,其包含UCP,在此示例为008cp(参见表1),DNA结合蛋白形式的sTF,在此示例为BM3R1,和激活结构域,在此示例为VP16),和终止子,在此示例为里氏木霉TEF1终止子。以及2)靶基因表达盒,其包含不同数量的sTF特异性结合位点,在此示例为0、1、2、4和8个BM3R1特异性结合位点,不同的UCP,在此示例为201cp(参见表1),报告基因编码区,在此示例为mCherry(红色荧光蛋白)编码区,和终止子,在此示例为酿酒酵母ADH1终止子。将DNA结合蛋白(此处为BM3R1)的编码区进行密码子优化以适合黑曲霉的密码子使用。
图7B描绘了在含有具有可变数量的sTF结合位点(0、1、2、4和8个)的表达系统的库德里阿兹威毕赤酵母和黑曲霉中的mCherry表达的流式细胞术分析(DB FACSAria III仪器)。对在SCD培养基(对于库德里阿兹威毕赤酵母)培养18小时获得的细胞或在PDA琼脂平板(黑曲霉)培养4天后获得的孢子进行分析。这些图显示了来自每种菌株的10000个细胞的粒子(细胞/孢子)大小(FSC-前向散射)的标准化的荧光强度(mCherry)。水平线(灰色框内)代表中值,灰色框代表四分位数范围(IQ范围),灰色框底部代表25%百分位值,灰色框顶部代表75%百分位值,和框图中的细线代表从25%/75%的百分位值到最高值和最低值的值,其不大于IQ范围的1.5倍,其与IQ范围一起代表在这些实验中所有测量的实例(细胞/孢子)约99%的值。
图7C描绘了具有可变数量的sTF结合位点的表达系统的实例(显示为方案),所述sTF结合位点用于调节里氏木霉中的CBH1蛋白质生产。在单个DNA分子中组装的表达系统包含两个表达盒(类似于图4和7A中的那些):1)sTF表达盒,其包含UCP,在此示例为533cp(参见表1),DNA结合蛋白形式的sTF,在此示例为BM3R1,和激活结构域,在此示例为VP16,和终止子,在此示例为里氏木霉TEF1终止子。以及2)靶基因表达盒,其包含不同数量的sTF特异性结合位点,在此示例为0、1、2、4和8个BM3R1特异性结合位点,不同的UCP,在此示例为201cp(参见表1),靶基因编码区,在此示例为里氏木霉CBH1编码区(包括在天然里氏木霉CBH1基因中存在的内含子),和终止子,在此示例为酿酒酵母ADH1终止子。DNA结合蛋白(此处为BM3R1)的编码区经密码子优化以适合黑曲霉的密码子使用。
图7D描绘了里氏木霉产生的CBH1蛋白对使用具有可变数量的sTF结合位点(0、1、2、4和8个)的表达系统的不同水平的蛋白质印迹分析。使用两种不同的培养条件,1)具有废谷物提取物和乳糖的培养基(图中的“SGE-乳糖”),其导致(在背景菌株-WT中)天然CBH1基因表达的强烈上调,以及2)SCD(图中的“SCD”),其(在背景菌株-WT中)对天然CBH1基因表达具有强抑制作用。将来自每个培养物的3天培养物上清液的15μl的等量物上样到凝胶上(4-20%梯度)。将凝胶转移到硝酸纤维素膜上,用特异性(小鼠)抗CBH1一抗(和抗小鼠-IR680-缀合的二抗)检测CBH1蛋白,并在Odyssey CLx Imaging System仪器(LI-CORBiosciences)上对信号进行可视化。
图8A和8B描绘了Kazachstania exigua中表达系统的方案(8A)和报告基因表达的分析(8B)。
图8A描绘了用于Kazachstania exigua的表达系统的实例(显示为方案)。在单个DNA分子中组装的表达系统包含两个表达盒(表3):1)sTF表达盒,其包含UCP,在此示例为Sc-TDH3cp(参见表1),DNA结合蛋白形式的sTF,在此示例为TetR,和激活结构域,在此示例为VP16,和终止子,在此示例为Kazachstania exigua g706终止子。以及2)靶基因表达盒包含许多sTF特异性结合位点,在此示例为8个TetR特异性结合位点,不同的UCP,在此示例为Sc-ENO1cp(见表1),报告基因编码区,在此示例为Venus(黄色荧光蛋白)编码区,和终止子,在此示例为酿酒酵母PDC1终止子。DNA结合蛋白(此处为TetR)的编码区和靶基因(此处为Venus报告基因)的编码区经密码子优化以适合酿酒酵母的密码子使用。
图8B描绘了对含有表达系统的Kazachstania exigua(描述于图8A,表3)中的Venus表达的分析的实例。将表达盒整合到Kazachstania exigua的背景菌株(图中的“WT”)的基因组中,替换天然g706编码区,以获得测试菌株(图中的“SES”)。将两种菌株(WT和SES)在SCD培养基中培养10小时,并将SES菌株培养22小时以达到稳定期(图中的“SES_stat”)。通过qPCR分析Venus和ADH1基因的转录,其中ALG9基因是表达定量的标准化对照。柱表示平均值,误差条表示3个实验重复的标准偏差。
图9A、9B、9C和9D描述了在含有表达系统的不同表达宿主(里氏木霉和毕赤酵母)中蛋白质生产的分析。
图9A描绘了用于在里氏木霉中的CBH1蛋白生产的表达系统的实例(显示为方案)。在单个DNA分子中组装的表达系统包含两个表达盒(与图4和7C中的那些相似):1)sTF表达盒,其包含UCP,在此示例为533cp(参见表1),DNA结合蛋白形式的sTF,在此示例为BM3R1,和激活结构域,在此示例为VP16,和终止子,在此示例为里氏木霉TEF1终止子。以及2)靶基因表达盒,其包括许多sTF特异性结合位点,在此示例为8个BM3R1特异性结合位点,不同的UCP,在此示例为114cp(参见表1),靶基因编码区,在此示例为里氏木霉CBH1编码区(包括在天然里氏木霉CBH1编码区中存在的内含子),和终止子,在此示例为里氏木霉PDC1终止子。将DNA结合蛋白(此处为BM3R1)的编码区进行密码子优化以适合黑曲霉的密码子使用。
图9B描绘了对在含有表达系统的里氏木霉(描述于图9A中)中CBH1的生产的分析的实例。里氏木霉的背景菌株(图中的“WT”)是具有编码8种不同蛋白酶的基因的多个缺失的突变菌株。将表达盒整合到背景菌株的基因组中以获得测试菌株(图中的“SES”)。两种菌株(WT和SES)在生物反应器(发酵罐)中在两种不同的条件下培养:1)在含有废谷物、废谷物提取物和乳糖的培养基中(图中的“SGM”),这导致(在两种菌株中)天然CBH1基因表达(在背景菌株-WT中)和其他纤维素分解基因表达的强烈上调,以及2)在含有酵母提取物和葡萄糖的培养基中(图中的“葡萄糖”),其(在两种菌株中)对天然CBH1基因表达(在背景菌株-WT中)和其他纤维素分解基因表达具有强抑制作用。通过SDS-PAGE(SDS-聚丙烯酰胺凝胶电泳)分析来自这些培养物的上清液的总蛋白含量(考马斯)和特定的CBH1含量(蛋白质印迹)。对于总蛋白质含量分析,将1.5μl的不同时间点的培养物上清液的等量物和一系列纯化CBH1蛋白质(上样对照)上样到凝胶上(4-20%梯度),并且凝胶用胶体考马斯(PageBlueProtein Staining Solution;Thermo Fisher Scientific)进行染色。对于CBH1特异性分析,将0.075μl的不同时间点的培养物上清液的等量物和一系列纯化CBH1蛋白(上样对照)上样到凝胶上(4-20%梯度),并且用特异性(小鼠)抗CBH1一抗(和抗小鼠-IR680-缀合的二抗)检测CBH1蛋白(转移到硝酸纤维素膜上之后)。对于这两种分析,在Odyssey CLxImaging System仪器(LI-COR Biosciences)上进行信号的可视化。从上样至每个凝胶上的纯化CBH1的范围估计蛋白质浓度(在培养物上清液中),并且值显示在图中。
图9C描绘了用于巴斯德毕赤酵母的表达系统用于蛋白质产物生产的实例(显示为方案)。在单个DNA分子中组装的表达系统包含两个表达盒(与图4中的那些相似):1)sTF表达盒,其包含UCP,在此示例为008cp(参见表1),DNA结合蛋白形式的sTF,在此示例为BM3R1,和激活结构域,在此示例为VP16,和终止子,在此示例为里氏木霉TEF1终止子。以及2)靶基因表达盒包含许多sTF特异性结合位点,在此示例为8个BM3R1特异性结合位点,不同的UCP,在此示例为201cp(见表1),靶基因编码区,在此示例为包含酿酒酵母分泌信号(α-因子)、KEX/spe13蛋白酶切割位点、碳水化合物结合模块(CBM),弹性蛋白样蛋白(ELP5)和另一种CBM的融合蛋白的编码区,和终止子,在此示例为酿酒酵母ADH1终止子。DNA结合蛋白(此处为BM3R1)的编码区经密码子优化以适合酿酒酵母的密码子使用。
图9D描绘了对在含有表达系统的毕赤酵母(描述于图9C)中CBM-ELP5-CBM的生产的分析。在不同条件下培养菌株,并且通过蛋白质印迹分析来自这些培养物的上清液。将22.5μl的培养物上清液的等量物上样到凝胶上(4-20%梯度),并用特异性(小鼠)抗CBM一抗(和抗小鼠-IR680-缀合的二抗)检测CBM-ELP5-CBM蛋白(转移到硝酸纤维素膜上后)。在Odyssey CLx Imaging System仪器(LI-COR Biosciences)上进行信号的可视化。
表1:
在酿酒酵母和其他生物中测试的核心启动子的选择。阴影序列是添加到核心启动子序列的3'-侧翼区域,用于筛选或克隆目的。ATG(起始密码子)加下划线。Sc-酿酒酵母起源;An-黑曲霉起源;Tr-里氏木霉起源;At-拟南芥起源;Cr-莱茵衣藻起源;Mm–小鼠起源。
表2:
表3:
表4:
表5:
表6:
实施例
实施例1
在表达系统中使用的细菌DNA结合蛋白及其结合位点:
-LexA(来自大肠杆菌的转录阻遏物;GenBank:EDV67321.1)
Lex结合位点(与DNA链无关):
CTGTATATAAACACAG(SEQ ID NO:76);
CTGTATATATACCCAG(SEQ ID NO:77);
CTGTATATAAAACCAG(SEQ ID NO:78);
GTGGTTATATATACAG(SEQ ID NO:79)
-SrpR(来自恶臭假单胞菌(Pseudomonas putida)的转录调节子,NCBI参考序列:WP_019437727.1)
SrpR结合位点(与DNA链无关):
ATATACATACATGCTTGTTTGTTTGTAAAC(SEQ ID NO:80);
ATTTACATACATTCTTGTTTGTTTGTAAAC(SEQ ID NO:81)
-PhlF(来自Pseudomonas protegens的转录调节子;GenBank:AAF20928.1)
PhlF结合位点(与DNA链无关):
ATGATACGAAACGTACCGTATCGTTAAGGT(SEQ ID NO:82);
ATGATACGGAACGTTACGTATCGTTAAGCT(SEQ ID NO:83);
ATGATACGGAAGCTACCGTATCGTAAAGGT(SEQ ID NO:84);
ATGATACGTAACGTACCGTATCGTAAAGGT(SEQ ID NO:85)
-TetR(来自大肠杆菌的转录调节子,GenBank:EFK45326.1)
TetR结合位点(与DNA链无关):
ACTCCCTATCAGTGATAGAGA(SEQ ID NO:86)
-BM3R1(来自巨大芽胞杆菌(Bacillus megaterium)的转录调节子;NCBI参考序列:WP_013083972.1)
BM3R1结合位点(与DNA链无关):
CGGAATGAAGGTTCATTCCG(SEQ ID NO:87);
CGGAATGAACTTTCATTCCG(SEQ ID NO:88);
CGGAATGAACATTCATTCCG(SEQ ID NO:89);
CGGAATGAACGTTCATTCCG(SEQ ID NO:90)
-TarA(来自Streptomyces lavenduligriseus的转录调节子;NCBI参考序列:WP_030788560.1)
TarA结合位点(与DNA链无关):
AACATACCGTGTGGTATGTT(SEQ ID NO:91);
AACATACCGAGTGGTATGTT(SEQ ID NO:92);
AACATACCGTGAGGTATGTT(SEQ ID NO:93);
AAACATACCGTGTGGTATGTTC(SEQ ID NO:94)
-LacI(来自大肠杆菌的lac阻遏物;NCBI参考序列:WP_048339836.1)
LacI结合位点(与DNA链无关):
AATTGTGAGCGGCTCACAATT(SEQ ID NO:95)
实施例2
测试不同形式的sTF和评估对酿酒酵母中表达系统性能的调节。(图5)
表达系统(用于sTF和报告基因的个体表达盒)构建为两个分开的DNA分子(两个质粒)(图5A)。具有用于每个sTF的表达盒的质粒含有:1)在每个sTF编码区中DNA结合蛋白(LexA、PhlF、SrpR、TetR、BM3R1和TarA;实施例1)的酿酒酵母密码子优化的编码区,2)在每个sTF编码区中的NLS和VP16激活结构域,3)控制每个sTF表达的Sc-TDH3cp(表1),4)URA3选择标记基因(乳酸克鲁维酵母起源),5)用于通过同源重组进入ura3-52基因座而整合到基因组中的侧翼(用于替换基因座的突变编码区),6)质粒在大肠杆菌中增殖所需的区域。具有报告基因盒的质粒含有1)Venus(黄色荧光)蛋白质的酿酒酵母密码子优化编码区,2)控制Venus表达的Sc-ENO1cp(表1)和3)定位上游的sTF特异性结合位点(0、1、2、4或8个)(实施例1),4)LEU2选择标记基因(乳酸克鲁维酵母起源),5)通过同源重组进入leu2-3_112基因座而整合到基因组中的侧翼(用于替换基因座的突变编码区),和6)质粒在大肠杆菌中增殖所需的区域。
酿酒酵母CEN.PK(MATα,ura3-52leu2-3_112his3Δ1MAL2-8C SUC2)用作亲本菌株。通过转化线性化的整合质粒将表达盒(图5A)引入细胞,将sTF和相应的报告基因表达盒转化到单一菌株中。在转化之前,通过NotI限制性内切核酸酶从质粒释放每个整合盒。使用标准的乙酸锂方案进行转化。通过qPCR确认单拷贝整合,其中将Venus基因的qPCR信号与每个菌株中独特天然序列的qPCR信号进行比较。
对于所有培养物,使用6.7g/L酵母基础氮源(YNB,Becton,Dickinson andCompany),合成完全氨基酸混合物,其缺少尿嘧啶和亮氨酸并补充20g/L D-葡萄糖(SCD-LU)。在琼脂平板培养的情况下,除了上述组分外,还使用20g/L琼脂。
将测试菌株的预培养物在SCD-LU琼脂平板上培养24-48小时,然后在24孔培养板中接种4ml的SCD-LU至OD600=0.2。一式三份的培养物在800rpm(Infors HT微型加速器)和28℃培养18小时,离心,洗涤,并重悬于0.2ml的无菌水中。使用Varioskan(ThermoElectron Corporation)荧光计在黑色96孔(Black Cliniplate;Thermo Scientific)中分析200μl的细胞悬浮液。用于Venus的设置分别为510nm(激发)和530nm(发射)。为了荧光结果的标准化,将分析的细胞悬浮液稀释100倍并使用Varioskan(Thermo ElectronCorporation)在透明的96孔微量滴定板(NUNC)中测量OD600。
荧光分析的结果显示在图5B中。
实施例3
对在各种真菌宿主中表达系统性能的定量分析(图6)
将表达系统(表2,图4)和它们的阴性对照形式(具有缺失区域的表达系统,所述缺失区域跨越控制sTF的核心启动子和sTF本身)克隆到质粒中,引入选择标记和基因组整合侧翼用于6种不同的物种。1)酿酒酵母CEN.PK菌株用作亲本菌株。使用相应的侧翼区域进行同源重组,将包括LEU2选择标记基因(乳酸克鲁维酵母来源的)的表达系统(包括具有DNA结合蛋白(BM3R1)的酿酒酵母密码子优化编码区的形式),被整合到leu2-3_112基因座中(替换基因座的突变编码区)。通过标准的乙酸锂方案进行转化。2)黑曲霉ATCC1015菌株用作亲本菌株。使用相应的侧翼区域进行同源重组,将表达系统(包括具有合适启动子和终止子的潮霉素抗性选择标记基因)整合到gaaC基因座中(替换天然编码区)。通过使用CRISPR转化方案(见下文)进行转化,包括:黑曲霉菌株的原生质体,线性供体DNA(具有选择标记和整合侧翼的表达盒),蛋白质Cas9(IDT)和合成crRNA和tracrRNA(IDT)的混合物。Cas9、crRNA和tracrRNA形成核糖核蛋白(RNP)复合物,其在靶基因组基因座处产生双链断裂(brake),然后通过同源重组用线性供体DNA进行修复。3)里氏木霉菌株M124(VTT培养收集物)用作亲本菌株。使用相应的侧翼区域进行同源重组,将包括具有合适启动子和终止子的潮霉素抗性选择标记基因的表达系统整合到pep4基因座中(替换天然编码区)。通过使用CRISPR转化方案(见下文)进行转化,包括:里氏木霉菌株的原生质体,线性供体DNA(具有选择标记和侧翼区域的表达盒)和RNP复合物,其在靶基因组基因座处产生双链断裂,然后用线性供体DNA进行修复。4)库德里阿兹威毕赤酵母ATCC 32196菌株用作亲本菌株。使用相应的侧翼区域进行同源重组,将包括具有合适启动子和终止子的潮霉素抗性选择标记基因的表达系统整合到PDC1基因座中(替换天然编码区)。通过使用标准的乙酸锂方案进行转化。5)巴斯德毕赤酵母X-33菌株(Invitrogen)用作亲本菌株。使用相应的侧翼区域进行同源重组,将包括具有合适启动子和终止子的吉欧霉素抗性选择标记基因的表达系统(具有DNA结合蛋白的编码区,BM3R1,其经密码子优化以适合酿酒酵母的密码子使用)整合到AOX1基因座中(整合到AOX1启动子区域)。通过使用标准的乙酸锂方案进行转化。6)解脂耶氏酵母C-00365(VTT培养收集物)用作亲本菌株。使用相应的侧翼区域进行同源重组,将包括具有合适启动子和终止子的诺尔丝菌素抗性选择标记基因的表达系统整合到ANT1基因座中(替换天然编码区)。通过使用标准的乙酸锂方案进行转化。
CRISPR转化方案:将分离的原生质体悬浮进入200μl的STC溶液(1.33M山梨糖醇,10mM Tris-HCl,50mM CaCl2,pH 8.0)中。将100μl原生质体悬浮液与3.5μg供体DNA和20μl的RNP溶液(1μM Cas9蛋白(IDT),1μM合成crRNA(IDT)和1μM tracrRNA(IDT))和100μl转化溶液(25%PEG 6000,50mM CaCl2,10mM Tris-HCl,pH 7.5)混合。将混合物在冰上孵育20分钟。加入2ml转化溶液,并将混合物在室温孵育5分钟。加入4ml STC,然后加入7ml熔融(50℃)顶层琼脂(200g/L D-山梨糖醇,6.7g/L酵母基础氮源(YNB,Becton,Dickinson andCompany),合成完成氨基酸,20g/L D-葡萄糖,400mg/L(对于黑曲霉)或100mg/L(对于里氏木霉)的潮霉素B,和20g/L琼脂)。将混合物倒到潮霉素选择板(200g/L D-山梨糖醇,6.7g/L酵母基础氮源(YNB,Becton,Dickinson and Company),合成完全氨基酸,20g/L D-葡萄糖,400mg/L(对于黑曲霉)或100mg/L(对于里氏木霉)的潮霉素B,20g/L琼脂)上。在+28℃培养5或7天,挑取菌落并在含有400mg/L(对于黑曲霉)或100mg/L(对于里氏木霉)的潮霉素B的YPD平板上再培养。
通过PCR对每个转化菌株的基因组DNA确认正确的整合,其中扩增子(扩增的DNA区域)跨越整合的构建体和整合侧翼外的基因组DNA。通过qPCR确认单拷贝整合,其中将mCherry基因的qPCR信号与每个宿主中独特天然序列的qPCR信号进行比较。
对于液体培养,使用6.7g/L的酵母基础氮源(YNB,Becton,Dickinson andCompany),补充有20g/L D-葡萄糖的合成完全氨基酸(SCD)。在琼脂平板培养的情况下,固化的培养基含有20g/L琼脂,20g/L细菌蛋白胨(Becton Dickinson),10g/L酵母提取物和20g/L D-葡萄糖(YPD平板)。为了获得丝状真菌的孢子,使用PDA琼脂平板进行孢子形成(39g/L BD-Difco马铃薯葡萄糖琼脂)。
对于测试菌株中mCherry生产的流式细胞术分析(图6A),测试的酵母菌株的预培养物在YPD琼脂平板上培养24-48小时,并且丝状真菌(黑曲霉和里氏木霉)在PDA平板上形成孢子(7天),收集孢子,并在分析前在1×PBS中稀释。在酵母菌株的情况下,将24孔培养板中的4ml SCD培养基从预培养物接种至OD600=0.2/每个测试的酵母菌株。培养物在800rpm(Infors HT Microtron)和28℃培养18小时。在分析之前,将100μL培养物与1.5mL的1×PBS混合。用FACSAria III(BD)进行测量,其中记录10000个事件,并通过将mCherry荧光值除以细胞大小(前向散射,FSC-A)来标准化结果。流式细胞术荧光分析的结果显示在图6A中。
对于定量荧光测定分析(图6B),将测试的酵母菌株的预培养物在YPD琼脂平板上培养24-48小时,并将里氏木霉菌株的预培养物(通过孢子接种)在YPG培养基(20g/L细菌蛋白胨、10g/L酵母提取物和30g/L明胶)中培养24小时。将24孔培养板中的4ml SCD培养基接种至OD600=0.2/每个测试的酵母菌株(在里氏木霉的情况下OD600=0.5)。一式三份的培养物在800rpm(Infors HT微型加速器)和28℃培养18小时,离心,洗涤,并重悬于0.2ml无菌水中。使用Varioskan(Thermo Electron Corporation)荧光计在黑色96孔板(BlackCliniplate;Ther-mo Scientific)中分析200μl每种细胞悬浮液。mCherry的设置分别为587nm(激发)和610nm(发射)。对于荧光结果的标准化,将分析的细胞悬浮液稀释100倍并使用Varioskan(Thermo Electron Corporation)在透明96孔微量滴定板(NUNC)中测量OD600。分析结果如图6B所示。
实施例4
对不同宿主(库德里阿兹威毕赤酵母、黑曲霉和里氏木霉)的可调节表达水平的分析(图7)
具有不同数量的sTF特异性结合位点(0、1、2、4或8个)的库德里阿兹威毕赤酵母和黑曲霉的表达系统(图7A)与实施例3(使用表达系统A(图4所示)的形式)类似地构建。在库德里阿兹威毕赤酵母的情况下,ATCC 32196菌株用作亲本菌株。使用相应的侧翼区域用于同源重组,将包括具有合适启动子和终止子的潮霉素抗性选择标记基因的表达系统整合到PDC1基因座中(替换天然编码区)。使用标准的乙酸锂方案进行转化。在黑曲霉的情况下,ATCC1015菌株用作亲本菌株。使用相应的侧翼区域用于同源重组,将包括具有合适启动子和终止子的潮霉素抗性选择标记基因的表达系统整合到gaaC基因座中(替换天然编码区)。使用CRISPR转化方案进行转化,包括:黑曲霉菌株的原生质体,线性供体DNA(具有选择标记和整合侧翼的表达盒)和RNP复合物,其在靶基因组基因座处产生双链断裂,然后用线性供体DNA将其修复。
含有用于可调节表达CBH1基因的里氏木霉表达系统的DNA分子(图7C)含有201cp(表1)以及控制CBH1编码区表达的上游定位的BM3R1特异性结合位点(0、1、2、4或8个),里氏木霉PDC1终止子,控制sTF编码区表达的533cp(表1),sTF编码区,里氏木霉TEF1终止子,具有合适启动子和终止子的潮霉素抗性选择标记基因,以及通过同源重组进入CBH1基因座(替换天然编码区)而进入基因组的侧翼。里氏木霉菌株M124(VTT培养收集物)用作亲本菌株。通过原生质体转化方案(见下文)进行转化,包括:里氏木霉菌株的原生质体和线性供体DNA(具有选择标记和整合侧翼的表达盒)。
原生质体转化方案:将分离的原生质体悬浮于200μl的STC溶液(1.33M山梨糖醇,10mM Tris-HCl,50mM CaCl2,pH8.0)中。将100μl原生质体悬浮液与10μg供体DNA和100μl转化溶液(25%PEG 6000,50mM CaCl2,10mM Tris-HCl,pH 7.5)混合。将混合物在冰上孵育20分钟。加入2ml转化溶液,并将混合物在室温孵育5分钟。加入4ml的STC,然后加入7ml的熔融顶层琼脂(200g/L D-山梨糖醇,6.7g/L的酵母基础氮源(YNB,Becton,Dickinson andCompany),合成完全氨基酸,20g/L D-葡萄糖,100mg/L潮霉素B,20g/L琼脂)。将混合物倒入选择板(200g/L D-山梨糖醇,6.7g/L酵母基础氮源(YNB,Becton,Dickinson andCompany),合成完全氨基酸,20g/L D-葡萄糖,100mg/L潮霉素B和20g/L琼脂)上。在+28℃培养5天;挑取菌落并在含有100mg/L潮霉素B的YPD平板上再培养。
通过PCR对每个转化菌株的基因组DNA确认正确的整合,其中扩增子(扩增的DNA区域)跨越整合的构建体和整合侧翼外的基因组DNA。通过qPCR确认单拷贝整合,其中将mCherry基因(对于库德里阿兹威毕赤酵母和黑曲霉菌株)或BM3R1编码区(对于里氏木霉菌株)的qPCR信号与每个宿主中独特天然序列的qPCR信号进行比较。
对于液体培养,使用6.7g/L酵母基础氮源(YNB,Becton,Dickinson andCompany),补充有20g/L D-葡萄糖的合成完全氨基酸(SCD)。在琼脂平板培养的情况下,使用含有20g/L琼脂、20g/L细菌蛋白胨(Becton Dickinson)、10g/L酵母提取物和20g/L D-葡萄糖(YPD平板)的固化的培养基。为了获得丝状真菌的孢子,将PDA琼脂平板用于孢子形成(39g/L BD-Difco马铃薯葡萄糖琼脂)。
对于测试菌株中mCherry生产的流式细胞术分析(图7B),将库德里阿兹威毕赤酵母菌株的预培养物在YPD琼脂平板上培养24-48小时,并将黑曲霉菌株在PDA平板上形成孢子(7天),收集孢子,在分析前用1×PBS稀释。在库德里阿兹威毕赤酵母菌株的情况下,将24孔培养板中的4ml SCD培养基从预培养物接种至OD600=0.2。培养物在800rpm(Infors HTMicrotron)和28℃培养18小时。在分析前,将100μL培养物与1.5mL的1×PBS合并。用FACSAria III(BD)进行测量,其中记录10000个事件,并通过将mCherry荧光值除以细胞大小(前向散射,FSC-A)来标准化结果。流式细胞术荧光分析的结果显示在图7B中。
对于里氏木霉菌株中CBH1生产的蛋白质印迹分析,将预培养物(通过孢子接种)在YPG培养基(20g/L细菌蛋白胨、10g/L酵母提取物和30g/L明胶)中培养24小时。4ml的SGE-乳糖(15g/L KH2PO4、5.4g/L Na2SO4、1mL/L微量元素(3.7mg/L CoCl2、5mg/L FeSO4.7H2O、1.4mg/L ZnSO4.7H2O、1.6mg/L MnSO4·7H2O)、40g/L乳糖、333.25g/L废谷物提取物、8.6g/L(NH4)2-柠檬酸盐、100mM PIPPS、2.4mM MgSO4和4.1mM CaCl2,用KOH将pH调节至4.8或SCD培养基在24孔培养板中接种至对于每种测试菌株OD 600=0.5。培养物在800rpm(Infors HT微型加速器)和28℃培养3天,离心,并将上清液转移到干净的试管中。将15μL每种上清液与4μL的4×SDS上样缓冲液(400ml/L甘油、100ml/Lβ-巯基乙醇、2g/L OrangeG染料(Sigma)、40g/L SDS和125mM Tris-HCl pH 6.8)混合,煮沸并上样到4-20%SDS-PAGE梯度凝胶上。将凝胶转移到硝酸纤维素膜上,并用特异性(小鼠)抗CBH1一抗(和抗小鼠-IR680-缀合的二抗)检测CBH1蛋白,并在Odyssey CLx Imaging System仪器(LI-COR Biosciences)上进行信号的可视化。分析结果如图7D所示。
实施例5
对Kazachstania exigua中表达系统的测试(图8)
将用于Kazachstania exigua的表达系统(表3,图8A)克隆到含有用于K.exigua基因g706的侧翼区域的质粒中,所述基因编码酿酒酵母ALD2的同源物。在得到的构建体中,K.exigua g706 3'-UTR侧翼区域在表达系统中形成用于sTF的终止子序列。将包括用于同源重组的侧翼区域的表达系统整合到g706基因座中(替换天然编码区)。
通过用Cas9表达盒(含有合适的启动子和终止子)替换两个KU70基因座来修饰Kazachstania exigua C-02458(VTT培养收集物)菌株。所得菌株(MAT a/αura3Δ/ura3Δku70Δ::Cas9/ku70::Cas9)用作亲本菌株(图8B中的WT)。表达系统(供体DNA)向背景菌株的转化与含有URA3选择标记的着丝粒质粒和用于将Cas9靶向g706基因座的sgRNA的表达盒一起进行(sgRNA在酿酒酵母RNA聚合酶III启动子SNR52和终止子SUP4的控制下表达)。得到的菌株在图8B中显示为“SES”。
通过电穿孔方案进行转化:将细胞接种在YPD培养基中并在250rpm和30℃培养过夜。将过夜培养物稀释至OD600=0.2并培养至OD600=1.3。将收获和洗涤的细胞重悬于含有10mM二硫苏糖醇的10mL Tris-EDTA(pH7.5)中,并在30℃孵育30分钟。向细胞中加入40mL冰冷水,然后离心。接着进行两个洗涤步骤,首先使用50mL冰冷的无菌水,然后使用10mL冰冷的1M山梨糖醇。最后,将细胞重悬于125μL冰冷的1M山梨糖醇中。将50μL细胞悬浮液与15μL的DNA混合物(含有5μg供体DNA和5μg的gRNA质粒)混合。以1.25kV,200Ω和25μF,在2mm比色皿中执行电穿孔。在电穿孔后立即加入950μL回收溶液(10g/L酵母提取物、10g/L细菌蛋白胨、20g/L葡萄糖、1M山梨糖醇)。将细胞在250rpm和30℃回收30分钟,然后在缺乏尿嘧啶的SCD培养基上铺板。
对于表达分析,将两种菌株(WT和SES)一式三份在SCD培养基中培养10小时,并且当所有葡萄糖消耗时,SES菌株也持续22小时达到稳定期(图8B中的“SES_stat”)。从菌株(RNeasy Kit-QIAGEN)中分离总RNA,产生cDNA(Transcriptor First Strand cDNASynthesis Kit-Roche),并且用对每个基因特异的引物通过qPCR对Venus和ADH1(在指数生长期高表达并在没有葡萄糖的情况下调的糖酵解基因)基因的转录进行分析。ALG9基因用作表达定量的标准化对照。分析结果示于图8B中。
实施例6
用于在真菌(里氏木霉和巴斯德毕赤酵母)中生产分泌蛋白的表达系统(图9)
含有里氏木霉表达系统的DNA分子(图9A)含有114cp(表1)以及控制CBH1编码区表达的上游定位的8个BM3R1特异性结合位点,CBH1的编码区基因,里氏木霉PDC1终止子,控制sTF编码区表达的533cp(表1),sTF编码区,里氏木霉TEF1终止子,具有合适启动子和终止子的潮霉素抗性选择标记基因和通过同源重组而基因组整合到CBH1基因座中的侧翼区域(替换天然编码区)。里氏木霉菌株M1763(VTT培养收集物)用作亲本菌株(图9B中的“WT”)。通过原生质体转化方案进行转化(实施例4),使用里氏木霉菌株的原生质体和线性供体DNA(具有选择标记和整合侧翼的表达盒)。
使用来自基因组DNA的PCR确认正确的整合,其中扩增子(扩增的DNA区域)跨越整合的构建体和整合侧翼外的基因组DNA。使用qPCR测试单拷贝整合,其中将来自BM3R1编码区的qPCR信号与来自宿主中独特天然序列的信号进行比较。分析含有表达盒的菌株(图9B中的“SES”)的CBH1生产,并与纤维素酶诱导和抑制的条件下的背景菌株进行比较。
里氏木霉菌株中的CBH1生产在1L生物反应器中进行。用于纤维素酶诱导条件培养的预培养物(用孢子接种)在SGE-乳糖培养基中培养24小时(实施例4),以生产足够量的菌丝体用于生物反应器接种。用于纤维素酶抑制条件培养的预培养物(用孢子接种)在YE-葡萄糖-A培养基(20g/L葡萄糖、10g/L酵母提取物、15g/L KH2PO4、5g/L(NH4)2SO4、1mL/L微量元素(3.7mg/L CoCl2、5mg/L FeSO4.7H2O、1.4mg/L ZnSO4.7H2O、1.6mg/L MnSO4.7H2O)、2.4mMMgSO4和4.1mM CaCl2,pH调节至4.8)中培养24小时。将诱导纤维素酶的生物反应器培养物接种于SGM培养基中(图9B中的“SGM”)(20g/L废谷物提取物、20g/L销售的废谷物、60g/L乳糖,5g/L KH2PO4、5g/L NH4SO4、1mL/L微量元素、2.4mM MgSO4和4.1mM CaCl2、1mL/L消泡剂J647,pH 4.8),空气流量为0.5slpm(0.4-0.6vvm),并以600rpm搅拌。将纤维素酶抑制生物反应器培养物接种于YE-葡萄糖-B培养基中(图9B中的“葡萄糖”)(10g/L葡萄糖、20g/L酵母提取物、5g/L KH2PO4、5g/L NH4SO4、1mL/L微量元素、2.4mM MgSO 4和4.1mM CaCl 2、1mL/L消泡剂J647,pH 4.8),并且向这些培养物连续加入葡萄糖(300g/L葡萄糖,流速为4.4g/h),空气流速为0.5slpm(0.4-0.6vvm),并以900rpm的速度搅拌。培养150小时,在不同时间取样,子集如图9B所示。
对于考马斯染色分析(图9B-左上图),将1.5μL的每种培养物(时间点)上清液与15μL的1×SDS上样缓冲液(100ml/L甘油,25ml/Lβ-巯基乙醇,0.5g/L OrangeG染料(Sigma),10g/L SDS和31.2mM Tris-HCl pH6.8)混合,煮沸并与纯化的CBH1蛋白质稀释物(作为标准)一起上样到4-20%SDS-PAGE梯度凝胶上。根据制造商的方案,用胶体考马斯染料(PageBlue Protein Staining Solution;Thermo Fisher Scientific)对凝胶进行染色。在Odyssey CLx Imaging System系统仪器(LI-COR Biosciences)上进行染色凝胶的可视化。培养物上清液中的蛋白质浓度由CBH1标准在同一凝胶中估算(图9B-右上表)。对于蛋白质印迹分析(图9B-左下图),将0.075μL每种培养物(时间点)上清液与15μL的1×SDS上样缓冲液混合,煮沸并与纯化的CBH1蛋白质稀释物一起上样到4-20%SDS-PAGE梯度上。将凝胶转移到硝酸纤维素膜上,用特异性(小鼠)抗CBH1一抗(和抗小鼠-IR680-缀合的二抗)检测CBH1蛋白质,并在Odyssey CLx Imaging System仪器(LI-COR Biosciences)上进行信号的可视化。估计培养物上清液中的CBH1浓度(图9B-右下表)。
含有用于巴斯德毕赤酵母的表达系统的DNA分子(图9C)由如下组成:201cp(表1)以及控制融合蛋白编码区表达的上游定位的8个BM3R1特异性结合位点,融合蛋白的编码区(由N-末端酿酒酵母分泌信号(α-因子)、KEX/spe13蛋白酶切割位点、碳水化合物结合模块(CBM)、弹性蛋白样蛋白(ELP5)和另一个CBM组成),其后是酿酒酵母ADH1终止子,控制sTF编码区表达的008cp(表1),sTF编码区(sTF的DNA结合蛋白(BM3R1)的编码区,经密码子优化以适合酿酒酵母的密码子使用),里氏木霉TEF1终止子,具有合适启动子和终止子的吉欧霉素抗性选择标记基因,以及通过同源重组进入AOX1基因座而整合到基因组中的侧翼(整合到AOX1启动子区域)。通过使用标准的乙酸锂方案进行转化。测试含有单拷贝的表达盒的菌株在不同条件下的蛋白质生产(图9D)。
巴斯德毕赤酵母中的CBM-ELP5-CBM生产在锥形烧瓶(Erlenmeyer flask)中进行。在具有20g/L甘油的YPP培养基(10g/L酵母菌,20g/L蛋白胨,13.4g/L酵母基础氮源,0.4mg/L生物素,20g/L甘油,13.2mM K2HPO4和86.8mM KH2PO4,pH=6.0)(YPP-Gly)中进行预培养24小时。为了测试不同碳源的影响,用20g/L葡萄糖(图9D中的“YPP-Glc”)或20g/L乙醇(图9D中的“YPP-EtOH”)代替甘油。将来自预培养的细胞在YPP-Gly、YPP-Glc或YPP-EtOH中接种(至OD600=1.0)并培养2天,还测试了蛋白酶抑制剂(胰凝乳蛋白酶抑制剂和胃蛋白酶抑制剂)的添加。还将预培养物再培养两天(总共三天)。
对于蛋白质印迹分析(图9D),将22.5μL每种培养物上清液与7.5μL的4×SDS上样缓冲液混合,煮沸并上样到4-20%SDS-PAGE梯度凝胶上。将凝胶转移到硝酸纤维素膜上,并用特异性(小鼠)抗CBM一抗(和抗小鼠-IR680-缀合的二抗)检测CBM-ELP5-CBM蛋白质,并在Odyssey CLx Imaging System仪器(LI-COR Biosciences)上进行信号的可视化(图9D)。
实施例7
在植物生物(本氏烟草)中对表达系统性能的测试
在本氏烟草中测试两种表达系统(表4):在单个DNA分子中组装的表达系统包含两个表达盒:1)sTF表达盒,其包含用于sTF表达控制的核心启动子,在此示例为At-RPL41D_cp(表1);DNA结合蛋白形式的sTF,在此示例为BM3R1或TetR,和激活结构域,在此示例为VP16AD或VP64AD;和终止子,在此示例为拟南芥MT3终止子。以及2)靶基因表达盒,其包含许多sTF特异性结合位点,在此示例为8个BM3R1特异性结合位点或8个TetR特异性结合位点;另一种核心启动子,在此示例为At-ATTI7_cp(参见表1),靶基因编码区,在此示例为mCherry(红色荧光蛋白报告分子)编码区;和终止子,在此示例为拟南芥PSBX终止子。sTF和mCherry的编码区经密码子优化以适合本氏烟草的密码子使用。此外,构建了阴性对照形式(具有跨越At-RPL41D_cp,sTF和MT3终止子的缺失区域的表达系统)。
将表达系统(和阴性对照形式)克隆到质粒中,所述质粒含有具有合适的启动子和终止子的植物(NptII)选择标记编码区,和用于在根癌农杆菌(Agrobacteriumtumefaciens)中繁殖的序列,包括卡那霉素选择标记。通过电穿孔(2mm比色杯;设置:1.25kV、200Ω和25μF)将质粒转化到根癌农杆菌(菌株EHA105)中,并且在感染本氏烟草叶之前使转化体在卡那霉素和利福平存在下生长。用根癌农杆菌培养物的1:1混合物渗透6周龄植物的叶子,其中一个携带表达系统的菌株,另一个携带用于转录后基因沉默抑制剂p19的表达载体的菌株(Silhavy等人,2002)(两种培养物均用10mM MgCl2+10mM MES-pH=5.8稀释至OD600=0.7)。在温室中培养6天后收获渗透的叶盘(对应于渗透区域),在1×PBS中研磨,并使用Varioskan仪器(Thermo Electron Corporation)分析粗提物的mCherry荧光。
实施例8
在绿藻(莱茵衣藻)中对表达系统性能的测试
在莱茵衣藻中测试两种表达系统(表5):在单个DNA分子中组装的表达系统包含两个表达盒:1)sTF表达盒,其包含用于sTF表达控制的核心启动子,在此示例为Cr-eIF-5A_cp(表1);DNA结合蛋白形式的sTF,在此示例为BM3R1或TetR,和激活结构域,在此示例为VP16AD或VP64AD;和终止子,在此示例为莱茵衣藻RPS27A终止子。以及2)靶基因表达盒,其包含许多sTF特异性结合位点,在此示例为8个BM3R1特异性结合位点或8个TetR特异性结合位点;另一个核心启动子,在此示例为Cr-RPS3A_cp(表1),靶基因编码区,在此示例为mCherry(红色荧光报告蛋白)编码区;和终止子,在此示例为莱茵衣藻RBCS2终止子。sTF和mCherry的编码区经密码子优化以适合莱茵衣藻的密码子使用。此外,构建了阴性对照形式(具有跨越Cr-eIF-5A_cp、sTF和RPS27A终止子的缺失区域的表达系统)。
将表达系统(和阴性对照形式)克隆到质粒pChlamy_4(Invitrogen)的NcoI位点。线性化后,将得到的质粒(包括未修饰的pChlamy_4质粒)转化入莱茵衣藻(菌株137c;Invitrogen)中。根据GeneArt Chlamydomonas Protein Expression Kit手册(Invitrogen)中的方案执行转化。转化体在吉欧霉素存在下的Gibco Tap Growth培养基中培养,并使用Varioskan仪器(Thermo Electron Corporation)分析mCherry荧光。
实施例9
在CHO细胞(中国仓鼠)中对表达系统性能的测试
在单个DNA分子中组装的中国仓鼠的表达系统(表6)包含两个表达盒:1)sTF表达盒,其包含用于sTF表达对照的核心启动子,在此示例为Mm-Atp5b_cp(表1);DNA结合蛋白形式的sTF,在此示例为BM3R1,和激活结构域,在此示例为VP64AD;和终止子,在此示例为小鼠INHA终止子。以及2)靶基因表达盒,其包含许多sTF特异性结合位点,在此示例为8个BM3R1特异性结合位点;另一个核心启动子,在此示例为Mm-Eef2_cp(表1),靶基因编码区,在此示例为mCherry(红色荧光报告蛋白)编码区;和终止子,在此示例为小鼠FTH1终止子。sTF和mCherry的编码区经密码子优化以适合中国仓鼠的密码子使用。此外,构建了阴性对照形式(具有跨越Mm-Atp5b_cp、sTF和INHA终止子的缺失区域的表达系统)。
将表达系统(和阴性对照形式)克隆到质粒pcDNA3.1(Invitrogen)的MluI和XbaI位点之间。将得到的质粒转染到中国仓鼠卵巢细胞(CHO-K1;American Type CultureCollection(Rockville,MD))中。在转化之前,CHO-K1细胞在含有2mM L-谷氨酰胺和1500mg/L碳酸氢钠,并补充有10%胎牛血清(FBS)、100U ml的青霉素和100mg/mL的链霉素的Ham's F-12K(Kaighn's)培养基(Gibco)中培养。将细胞保持在5%CO2和90%相对湿度的气氛并且37℃中。将一瓶细胞进行培养,分瓶,并将3×105个细胞接种到6孔培养板中,并在2ml培养基中培养直至70%汇合。根据制造商的说明用FuGene 6(Roche)进行转染,每孔加入约1μg质粒DNA。使转染的细胞继续生长至多5天。通过荧光显微镜检查每天监测转染后mCherry表达。
非专利文献:
1.Hubmann G,Thevelein J,Nevoigt E(2014)Natural and Modified Promotersfor Tailored Metabolic Engineering of the Yeast Saccharomyces cerevisiae.In:Mapelli V,editor.Yeast Metabolic Engineering:Springer New York.pp.17-42.
2.Blumhoff M,Steiger MG,Marx H,Mattanovich D,Sauer M(2013)Six novelconstitutive promoters for metabolic engineering of Aspergillus niger.ApplMicrobiol Biotechnol 97(1):259-67.
3.Ito Y,Yamanishi M,Ikeuchi A,Matsuyama T(2015)A highly tunablesystem for the simultaneous expression of multiple enzymes in Saccharomycescerevisiae.ACS Synth Biol 4:12-16.
4.Pachlinger R,Mitterbauer R,Adam G,Strauss J(2005)Metabolicallyindependent and accurately adjustable Aspergillus sp.expression system.ApplEnviron Microbiol 71:672-678.
5.Silhavy D,Molnar A,Lucioli A,Szittya G,Hornyik C,Tavazza M,BurgyanJ.(2002)A viral protein suppresses RNA silencing and binds silencing-generated,21-to 25-nucleotide double-stranded RNAs.EMBO J.21(12):3070-80.
专利文献
US2002081667
序列表
<110> 芬兰国家技术研究中心股份公司
<120> 用于真核生物的表达系统
<130> BP210319PC
<150> FI20165137
<151> 2016-02-22
<160> 95
<170> PatentIn version 3.5
<210> 1
<211> 165
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Saccharomyces cerevisiae THI4 core promoter
<400> 1
atcatgaaat tgattttttg attttcaatt tatgaactac ccagatatat aaatattgga 60
ataaattgtg tattaagtag tcgggaaata tcttttatgt tctctttctt atcatctaga 120
aataataaat cacaaccaaa aaaatcaact aacttaatta aaatg 165
<210> 2
<211> 154
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Saccharomyces cerevisiae TEF1 core promoter
<400> 2
ctctttcgat gacctcccat tgatatttaa gttaataaac ggtcttcaat ttctcaagtt 60
tcagtttcat ttttcttgtt ctattacaac tttttttact tcttgctcat tagaaagaaa 120
gcatagcaat ctaatctaag ttttaattaa aatg 154
<210> 3
<211> 203
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Saccharomyces cerevisiae TDH3 core promoter
<400> 3
agctgaaaaa aaaggttgaa accagttccc tgaaattatt cccctacttg actaataagt 60
atataaagac ggtaggtatt gattgtaatt ctgtaaatct atttcttaaa cttcttaaat 120
tctactttta tagttagtct tttttttagt tttaaaacac caagaactta gtttcgaata 180
aacacacata attaattaaa atg 203
<210> 4
<211> 203
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Saccharomyces cerevisiae ENO1 core promoter
<400> 4
tctccccgga aactgtggcc ttttctggca cacatgatct ccacgatttc aacatataaa 60
tagcttttga taatggcaat attaatcaaa tttattttac ttctttcttg taacatctct 120
cttgtaatcc cttattcctt ctagctattt ttcataaaaa accaagcaac tgcttatcaa 180
cacacaaaca cttaattaaa atg 203
<210> 5
<211> 203
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Saccharomyces cerevisiae PGK1 core promoter
<400> 5
aagggggtgg tttagtttag tagaacctcg tgaaacttac atttacatat atataaactt 60
gcataaattg gtcaatgcaa gaaatacata tttggtcttt tctaattcgt agtttttcaa 120
gttcttagat gctttctttt tctctttttt acagatcatc aaggaagtaa ttatctactt 180
tttacaacaa attaattaaa atg 203
<210> 6
<211> 148
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Aspergillus niger core promoter 201205
<400> 6
ttctcttttc ttaagaatat gttcaaagac taggatggat aaatggggta tataaagcac 60
cctgactccc ttcctccaag ttctatctaa ccagccatcc tacactctac atatccacac 120
caatctacta caattattaa ttaaaatg 148
<210> 7
<211> 161
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Aspergillus niger core promoter 53301
<400> 7
cgccccaaga gagctgaaga tgctgagtag ggttgtccag gcagcacata tataagatgc 60
ttcgtcccct cccatcgagt ccttcttttc tctctctcat caatcactct acttcctact 120
ctaccttaaa ctcttcacta cttcatacat taattaaaat g 161
<210> 8
<211> 210
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Aspergillus niger core promoter 205017
<400> 8
tatagtacta ttgatttagt attgttgttg gatgtgctgg taggtgtgta gtatatatag 60
gagatagtag aggcagatga tgatgatggt actattttga atcacctcaa acgatactat 120
tcgcatcttt gataaagata tcaagaaacc agaacaatca ttactactct ccataaggat 180
atatatatac tttacatctt aattaaaatg 210
<210> 9
<211> 205
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Aspergillus niger core promoter 00850
<400> 9
aacccaaagt aataagtctg tagtaattgg tctcgccctg aattccaaac tataaatcaa 60
ccactttccc tcctcccccc cgcccccact tggtcgattc ttcgttttct ctctaccttc 120
tttctattcg gttttcttct tcttttattt tccctctccc atcaatcaaa ttcatatttg 180
aaaaaaatta acattaatta aaatg 205
<210> 10
<211> 204
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Aspergillus niger core promoter 1114556
<400> 10
ggggcggaaa cttgaaactg gacgccttgt gaacggcgta tgtggtatat aaggaaccaa 60
gtcccgctgt agtcttcggt tcatcagacc cagcacagca cagcaacaca acattacagc 120
atagcaagca cttctctata tttctacaca tcacagcaca tttctataca gtttacgtct 180
aattatctcc tgttaattaa aatg 204
<210> 11
<211> 173
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Aspergillus niger core promoter 1147651
<400> 11
gccctgcagt gcctgatcac cttatcaagt ggccaaatat cccactataa aaggcttggg 60
aacccctcgt tctgtcttac cttctatcat cttaccaaat ccactcctct tccttcatac 120
atcaatctta ccaatcaact acctctacaa ctccaataca cttaattaaa atg 173
<210> 12
<211> 178
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Aspergillus niger core promoter 1178623
<400> 12
ggctactcgg gttttaagcc gtcttaaaag ccgacacgaa ttagttataa aagactctgt 60
acttgagcag gatattcctt cattcttttc atttagattg atatcgaatt cattctacaa 120
ggatcggata ctcttccatc ctttattttg tctctgtgaa tcaaacttaa ttaaaatg 178
<210> 13
<211> 218
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Aspergillus niger core promoter 57241
<400> 13
aggtaatgaa tattggttgc tggcgggctg atcttctccc gacacgtcta tataaactgg 60
tcaccttctg gcccttcctt tctatctctt ccttctcatc atcagtctca aacaagcctc 120
tttctctcct accttcactc tccactttct cctttcgaaa gggataaaac tctcctcctc 180
attctcacct atatatacct tgtgctttaa ttaaaatg 218
<210> 14
<211> 214
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Aspergillus niger core promoter 06590
<400> 14
gatttctaga aatttctgcc ctttacttgc cttccctctt tgtcaacaaa tataaagaga 60
ctccaattcc ccttctctga tttccaacat ttttcattct ccacttcaga accatctgaa 120
ggagcttggc tgtctcgctt cttcttcttt ccttctttac taacatccct acccctcctt 180
agaaaaccaa gtctctcctc ctttaattaa aatg 214
<210> 15
<211> 176
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Aspergillus niger core promoter 1141688
<400> 15
acttggatga tggaggagtt gatcgaggtc aatgaggaga ggcttgcaag tataagaaga 60
gactgctcga ccagcagaat ggatcttctt gttcatcaac caagagtcca aggcttcttt 120
gtctggttct atctcttctc cgaactctct tgcttgacat tctcttaatt aaaatg 176
<210> 16
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Trichoderma reesei core promoter 123979
<400> 16
tagccagcag tgaagaagag gggaagaaga taaacctgta ggttggacag agtgtataaa 60
agggagggct gtgcccaacg aggagcgaga ttaactttgg atttggagca gaacaatatt 120
ggaatcacaa gaagaaggat ctctgtcttt aattaaaatg 160
<210> 17
<211> 192
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Trichoderma reesei core promoter 112258
<400> 17
tagccacatc cttggagatc agttgcagtc tattcattca ggctcaacat ataaagatgg 60
gatacttcca acagatgata gttgtcaaac aacctctttg atcctacaca atttggccca 120
agacacacaa gacgctcaca tctcctacct aaccaaacaa agaaaaaaac atccaccaac 180
ttaattaaaa tg 192
<210> 18
<211> 161
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Trichoderma reesei core promoter 123236
<400> 18
atcttacaaa gttgcttggc agtaaaccgt gcaatggaca ccaggtataa agtcagtgat 60
atcctccccg aattcaaagt ttcatcacca agctcctcaa tcaactctac ttgaacaata 120
ctacaaacaa ccaaacctca ttcaacaact taattaaaat g 161
<210> 19
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Trichoderma reesei core promoter 123989
<400> 19
taaacggaat gagctagtag gcaaagtcag cgaatgtgta tatataaagg ttcgaggtcc 60
gtgcctccct catgctctcc ccatctactc atcaactcag atcctccagg agacttgtac 120
accatctttt gaggcacaga aacccaatag tcaaccgcgg acttaattaa aatg 174
<210> 20
<211> 204
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Trichoderma reesei core promoter 119989
<400> 20
aacagcctgc gagagctgga agatgaagag ggccagaaaa aaaagtataa agaagacctc 60
gattcccgcc atccaacaat cttttccatc ctcatcagca cactcatcta caaccatcac 120
cacattcact caactcctct ttctcaactc tccaaacaca aacattcttt gttgaatacc 180
aaccatcacc acttaattaa aatg 204
<210> 21
<211> 150
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Trichoderma reesei core promoter 123232
<400> 21
ggtctggatg aaacgtcttg gccaaatcgt gatcgattga tactcgcatc tataagatgg 60
cacagatcga ctcttgattc acagacatcc gtcagccctc aagccgtttg caagtccaca 120
aacacaagca caagcatatt aattaaaatg 150
<210> 22
<211> 177
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Trichoderma reesei core promoter 73638
<400> 22
ccggcacaaa tcaggagcaa caggcactgc aaaatgacct ggcagtatat atagacctga 60
ccgtatgagt ctattgtaga cattctagct aagagatccg agcctagttc ataatacagt 120
agttgagttc atagcaactt cactctctag ctgaacaaat tatctttaat taaaatg 177
<210> 23
<211> 189
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Trichoderma reesei core promoter 123818
<400> 23
gagacgaggc aagcttgatg aggccaaatt atccgtcaac tgtcttataa aggagcccat 60
gccaaacccc ccctaaagac tcaagaagcc aaacctgaac aaccccagca cctgaacagt 120
catacaaccc ctccaagccc aaaagacaca acaactccta ctagctgaag caagaagtta 180
attaaaatg 189
<210> 24
<211> 156
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Trichoderma reesei core promoter 123979
<400> 24
cagcagtgaa gaagagggga agaagataaa cctgtaggtt ggacagagtg tataaaaggg 60
agggctgtgc ccaacgagga gcgagattaa ctttggattt ggagcagaac aatattggaa 120
tcacaagaag aaggatctct gtctttaatt aaaatg 156
<210> 25
<211> 154
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Trichoderma reesei core promoter 69465
<400> 25
gaaaaatggt gaggagatct gccttcgagt gcgtgtagaa aaatgtatat aaggatgtgt 60
ttcactcaac ttgtcttaag aatcggttct ctagccgcgc tttcaattac ttcgagactt 120
tcgcttaaaa tcgccctgcc atttaattaa aatg 154
<210> 26
<211> 183
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Trichoderma reesei core promoter 49976
<400> 26
tgcccctggc gttgcaagcc gcgtacaact gcccttttac ctaggtataa aagacctgta 60
gtaaccaact actattgcaa ttcttcttca cgtgggcatc tattcgtatc ttacacaagg 120
gcgctgcaac taattgactt gatcttccat ctcgtgtctt gcttgtaacc attaattaaa 180
atg 183
<210> 27
<211> 204
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Trichoderma reesei core promoter 123946
<400> 27
ctgttaggct gtgagttata aaggttgatg gattgggtcg aggttgtcaa tgtcagagca 60
tcttacctct cacgcttcaa tcttacctac acgcttcctc tcaatccttg aacaccaatt 120
gttgctctag cgcctatcct tcactcatca ctcgcctcgt acactaaact cttcatcccg 180
aacagacacg gcttaattaa aatg 204
<210> 28
<211> 189
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Arabidopsis thaliana CRA1 core promoter
<400> 28
aagtcataaa tagcaattta agtgaagtgt aaattgtaca tagtcgactc tatatacctg 60
gttcttatct cattcaattt atcctcaaca actttaatag aaaaatatca aataaattcc 120
ctataaatag cttcacataa tgcaagtgag aaaccacaaa aagtaagaaa tataagatta 180
attaaaatg 189
<210> 29
<211> 214
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Arabidopsis thaliana RPL41D core promoter
<400> 29
atcccctctg gcaaattctt atccatttgg gttttattgg gcttttgaaa taataaagcc 60
cattaagtta gttactaggg ttttgttgtt gtttaaagga ggaataagag cgtaagctac 120
aaaatctttc tattcatctc cgccgctcct catcctgtaa agctaaacaa ataatcagag 180
gaacgaagga gacagcttct gcttaattaa aatg 214
<210> 30
<211> 183
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Arabidopsis thaliana ATTI7 core promoter
<400> 30
gaatttgtgg ttctcgtgaa gtcgtgataa tagtttgtcc aagcgataaa tataaaatag 60
tattgcacct caacaagtgt taagcatgca aatccattta cgcatacata ttaactccga 120
gtgaaatata aatattagag agtagagaca gagaaaaaga cagagacaaa gttaattaaa 180
atg 183
<210> 31
<211> 234
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Arabidopsis thaliana THI1 core promoter
<400> 31
atcgttactt tccattgatg gctaaaaatt aaaataatca cgataaatat taataataca 60
aaaaacaatt aaaataacaa aaaaagatca aaaattctct aacccttcat tccttatctc 120
tgacgtggcc atcaatcttc agattttctt cttcttctaa tttaaatact caacaaccac 180
tcttcacttc accatcagca tcactaaact cgaaccctaa agttaattaa aatg 234
<210> 32
<211> 167
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Arabidopsis thaliana MT2B core promoter
<400> 32
gtggacaaag atcgttgaca cgtggacggt ctacaaattc taattttgcc tataaatatc 60
aaagctcctg aatatgtaag tttcattcac tgattatcgt ttaaggcaaa ttaagatcat 120
cttcataaat cttctcagat ctcttccaat tttctttaat taaaatg 167
<210> 33
<211> 185
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Arabidopsis thaliana TCTP1 core promoter
<400> 33
ccaaaattgt aatttaccga gaattgtaaa tttacctgaa aaccctacgc tatagtttcg 60
actataaata ccaaacttag gacctcactt cagaatcccc tcgtcgctgc gtctctctcc 120
cgcaaccttc gattttcgtt tattcgcatc catcggagag agaaaacaat caattaatta 180
aaatg 185
<210> 34
<211> 238
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Arabidopsis thaliana RPL26A core promoter
<400> 34
gaattaactt ttactaggcc agaagtgtag ctaacataga agaggcccat tataaaactc 60
tttaaaatca aaatctaaaa caggcccagc ccattcataa caaagcccta atatatcgag 120
taaacctagc tccactcaaa acctaactat ataaccttca cacacactca taacctcttc 180
ctcatcccct taaaaaaccc taagagtaga gactctctca atcccgttaa ttaaaatg 238
<210> 35
<211> 188
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Arabidopsis thaliana MED37E core promoter
<400> 35
accaattttt gaccgtccga tggaaactct agcctcaacc caaaactcta tataaagaaa 60
tcttttcctt cgttattgct taccaaatac aaaccctagc cgccttattc gtcttcttcg 120
ttctctagtt ttttcctcag tctctgttct tagatccctt gtagtttcca aatcttttaa 180
ttaaaatg 188
<210> 36
<211> 165
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Arabidopsis thaliana AT1G15270 core
promoter
<400> 36
atacactttc agagcccatt taataggttg cgttgttact acgaactcat tataaatatg 60
aaccgtagcc ccaatcagag agattcgata ccgtctgcaa ctctcagcta ctttttcccc 120
aattttgagc tcaacatcga accctagctc aacttaatta aaatg 165
<210> 37
<211> 236
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Arabidopsis thaliana FKBP12 core promoter
<400> 37
tctgcttctt aattcggtct ggtacagtat tatattatcc acctttgaga aagaataaat 60
aatgggccta aatttcatcg aattgggttt tggattattg ttaggcccag atagggttta 120
gatcaaacag catgataatt gataaataac aaaatatata ggcaaaagct actccgagat 180
tcgaagctgc aaagaacgcg aaacagtgag agagacagag agaattaatt aaaatg 236
<210> 38
<211> 155
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Arabidopsis thaliana AT4G25140 core
promoter
<400> 38
caattgcatg atgtctccat tgacacgtga cttctcgtct cctttcttaa tatatctaac 60
aaacactcct acctcttcca aaatatatac acatcttttt gatcaatctc tcattcaaaa 120
tctcattctc tctagtaaac aagttaatta aaatg 155
<210> 39
<211> 216
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Arabidopsis thaliana DRT112 core promoter
<400> 39
atgccatgtc acgacacagt atctaaaatc aaccaatcac aacgcgtctt tatagataac 60
ttgttttttt atggagtttg cttttagagc catccattgt cctatctcac tttctctctt 120
tcaccacata aaaactcata aactcgatcg aaccaaagct aaacgaaaaa cttaaaaccc 180
aaatcttatc actactctaa aagattaatt aaaatg 216
<210> 40
<211> 222
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Arabidopsis thaliana AT1G13930 core
promoter
<400> 40
ttttcacatt tacgtctaca atcacaatgt atgttattta gaacaataat tatagtggct 60
taaaaatcat taatgaaagt agataatagt atactttttc tttttctttg tgtggccaac 120
atatccattt tctagtctat atatacacat atccatctct taactcttcc atccaaaaaa 180
aacaaaacaa aaaattatat tcaagagaaa ttaattaaaa tg 222
<210> 41
<211> 145
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Arabidopsis thaliana RPL14B core promoter
<400> 41
tatttagtaa agataggccc aaaccacaaa accctagaat gaagattata tatagtgcaa 60
aacctaatcg attttttcct ctgctgtcgc tcgtctacat ttacactcgg agcttagacc 120
ttccaatcta ccgttaatta aaatg 145
<210> 42
<211> 148
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Arabidopsis thaliana BDF2 core promoter
<400> 42
ttaaaaatgc aattctctaa tagactatca aatatcccga tacctcttta tatagtgcca 60
tcttcatcct tagtaatgta cacacacaca cataacactt atttccaact ctgtctctct 120
caattttctt tctcttttaa ttaaaatg 148
<210> 43
<211> 240
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Chlamydomonas reinhardtii eIF-5A core
promoter
<400> 43
cgacgaaggg atgtctccgc aaggcaagta tataacggct agcaacgtat gccttagcat 60
agtagagcaa ttagttgtct atgtgcctcg gtgcaagcgc acacgccggg aataatgcgg 120
catgggggct tctgttggcc ccatgcgagc ccccaggaag aaaagtcgcg cggcgcccgt 180
attctgccct cttgctgtgc caacctccta gtcgcttctt cgcacttttt aattaaaatg 240
<210> 44
<211> 223
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Chlamydomonas reinhardtii RPS27E1 core
promoter
<400> 44
ggatggtgcc aagggtccgg gtcaccgagt agcattggcc cactctaaga tataagttga 60
gccgtgttta acttgttgca acatcaggcc tcgcgcgcaa cgtcaggaat ggctgcatgg 120
ggccaccgta ccatggcgcg gagggagggt attgtcgctg agcgcgactc agagctccct 180
ctccttttgc tgaccgcgga gcctgcccct cttaattaaa atg 223
<210> 45
<211> 221
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Chlamydomonas reinhardtii RPS8 core
promoter
<400> 45
ctgttctgga cgggtccaat gagcccgctc taaataaacg tctaggagaa gcagttaacc 60
taagggaagg tggcagcagg ggagagaggg agagagggag cgggtccatt gctccagggc 120
gagccggaat ggggccggcg ctgcctgggc tttgtccggc tgcagacaca cggctctttc 180
tctttccatt ccttaggggc tgggaacggt taattaaaat g 221
<210> 46
<211> 237
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Chlamydomonas reinhardtii RPS3A core
promoter
<400> 46
ccgaacttgc tctcggtgtc atattgcacc atcccatctt gtataaccga tataacatag 60
cttcgagtgt gccgataaat tattgtgagg gcgtcggggg gcgagctgag ggaaatggag 120
ggggcactca tctcggccgc ccctcccatc gcgacctcgg cgctcaagcg ggggtcccgc 180
actcgcttcg gtctcttttg gtcagcagcc gtttgttgac taccgttaat taaaatg 237
<210> 47
<211> 199
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Chlamydomonas reinhardtii RPL17 core
promoter
<400> 47
aagcggacag aaatttagtt caggaagaat tgtcagattt gctactggca tataattttt 60
tctgcagggt ctggcgtgga agaatgccaa atggcgcgga gctggctgca tggggcgcca 120
cctcccagca agggccacca ctgcaacctg ctctttctct ttcgtcgcgc cttgcacgta 180
gcgttaatta attaaaatg 199
<210> 48
<211> 225
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Chlamydomonas reinhardtii RPL19 core
promoter
<400> 48
agaacgcgcc tagtactcat gccacgagag tttcatcatt ccagcatgca taataaattt 60
gtcactcagg cagagcattt gcggggcgcg caatgtttag cggggcccaa agtcgccatc 120
gcggtcgcgc ccccatgcag cgttccaccc tggctttcag gcgcgggcgc acctggacta 180
tccctttctt tgcgtcgtcc gcttgcaaac agattaatta aaatg 225
<210> 49
<211> 229
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Chlamydomonas reinhardtii RPS24 core
promoter
<400> 49
agcgagcgaa ctagtctcgc gccccggccc ccccgtcgcc aacagaccgc tataaccaag 60
taattttgtg tggctttatt tgtattgcta aaaacccccg agcggggtga gcccaagaca 120
agaaacgaag gcggccccct cctggagcaa tgggcgtctg agagacgggg caagaccagg 180
gagagtccca gcctcctccc tctttctctt ggcacactta attaaaatg 229
<210> 50
<211> 226
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Chlamydomonas reinhardtii RPS15 core
promoter
<400> 50
tctaggaggg gttttccctt gtttagccct atataacgta aagctcacac tttgaatgag 60
caacataaat tatatttagt gcgaaagccg gctatgaaaa tggacatggg gatcgcgatg 120
ggcgcccccg cgccctggcg gcggtgtgca caggagcgag gccctcgcct gctccttcct 180
ctttctctcg ccgtcaggct cgtagtttca aaagttaatt aaaatg 226
<210> 51
<211> 226
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Chlamydomonas reinhardtii ATPC core
promoter
<400> 51
cgtgcaagct actcccaggc tcctgcattc tataagcgta attttatgcc gggtatgctt 60
gtgatttgac gaagatctac tcgacggcgt tctggtgggc aaaatcggag gcaaacccaa 120
ttggcccccc tggagtgata agtcctgggt gccaagtgcg caagtgaagc cttgaactgc 180
gcctttcctt gcaccttgtt cgccgctctt tctattaatt aaaatg 226
<210> 52
<211> 224
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Chlamydomonas reinhardtii RPS9 core
promoter
<400> 52
gcagaagggt gccaaaggga ggctctaagc agtccaggcg ggcacaaaca tataaagctg 60
aagctagtgg tatacctaaa ttaattttgg ggcgctccac tgaaaaatgg actgcctgca 120
tgggccctgt acggcttcgc cgagcgagcc cggtgcaagg gccgcgaccg tgcataagtc 180
tctctctttc aagttggcag agggagcgcc agttaattaa aatg 224
<210> 53
<211> 179
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Chlamydomonas reinhardtii RPL10a core
promoter
<400> 53
ctgggcctta ctttcatcat agggaaagca taaatcataa cagtgtagtt tatattatgc 60
atgatgtctt ccgcagaaga ggcaccgtga tgcccaccgc ccccatgcat caattgtgag 120
ggtcaagagc gcccgcggac ccctggacat tccttttcct tgggtgatta attaaaatg 179
<210> 54
<211> 172
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Chlamydomonas reinhardtii HSP70A core
promoter
<400> 54
cgcgcggcgt ccagaaggcg ccatacggcc cgctggcggc acccatccgg tataaaagcc 60
cgcgaccccg aacggtgacc tccactttca gcgacaaacg agcacttata catacgcgac 120
tattctgccg ctatacataa ccactcaact cgcttaagag ttaattaaaa tg 172
<210> 55
<211> 154
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Chlamydomonas reinhardtii VIP1 core
promoter
<400> 55
cagctgcggg caggccggct gcatggcttg cttctggaga gggccaattg taattaccgc 60
tttcctgcct ttccaagagc cccctacaac ctacgcactt taaaatcaca tacagcctgt 120
ggcccaactt ccttgttagt ccttaattaa aatg 154
<210> 56
<211> 230
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Chlamydomonas reinhardtii NPC1 core
promoter
<400> 56
cctggtaaat attctgcgcc gctttcgtaa caggtgcagg cgcaggtagc tatacaaata 60
tggtcgcggc tgcaaatgcg gggggaggag gagtacttgc atgggtcgcc cgcgatcggc 120
actcccgctc ggtccccgac tgaacacccg cgcgagcccc gtggttcccc ccttttcaac 180
attagccaac tcgaccccag tcgacttttc tcgtcgtttt aattaaaatg 230
<210> 57
<211> 198
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Chlamydomonas reinhardtii AAA1 core
promoter
<400> 57
tcgccattgg gggccgcatg gggccctgga gcaccgaaag tgcagagctc tatagagcgc 60
cactcgttct tcttgcctct tcactagccc gcccacaata attgggttgc agtcaagtga 120
gtgcgtagct tcacagcagg gtctataggg ccccgacact tgcaccaaac ctgccgatca 180
caagcattaa ttaaaatg 198
<210> 58
<211> 164
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Mus musculus Eef2 core promoter
<400> 58
ccggacgagc acccggcgcc gtcacgtgac gcacccaacc ggcgtcgacc tataaaaggc 60
cgggcgttga cgtcagcggt ctcttccgcc gcagccgccg ccatcgtcgg cgcgcttccc 120
tgttcacctc tgactctgag aatccgtcgc cattaattaa aatg 164
<210> 59
<211> 196
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Mus musculus Col1a1 core promoter
<400> 59
tccccctctc cgagaggcag ggttcctccc agctctccat caagatggta taaaaggggc 60
ccaggccagt cgtcggagca gacgggagtt tctcctcggg acggagcagg aggcacgcgg 120
agtgaggcca cgcatgagcc gaagctaacc ccccacccca gccgcaaaga gtctacatgt 180
ctagttaatt aaaatg 196
<210> 60
<211> 137
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Mus musculus Rpl4 core promoter
<400> 60
ctctaatttg attttgataa ggggcaggat gcggaagacg agtggaagga tatatagagt 60
acaagtgaca agtctttcct tttcctgtgg gagcagccgg gtagagagga gcgtggcctt 120
ctcctttaat taaaatg 137
<210> 61
<211> 200
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Mus musculus Fabp9 core promoter
<400> 61
tagagaggct ccctgaatta aactttgcag gttagtttct gttggtggta tataaaatga 60
gtcaaccgcc ggtgcctgga atctcagatt cctggcagcc cattggttgc ttcaggaatg 120
ccacgtgaca aagatgttct ttaaaagaag gggctggcgg cacagcgatg cccacacttc 180
atggtttttt aattaaaatg 200
<210> 62
<211> 206
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Mus musculus Vim core promoter
<400> 62
gctcggcggc taggatggca gtgggagggg accctctttc ctaacagtgt tataaaagca 60
gcgcccttgg cgttgtccag tcctctgcca ctcttgctcc gggaccccag agaccccagc 120
gctcctacga ttcacagcca ccgcgccctc attcccttgt tgcagttttt ccagccgcag 180
caagccagcc caccttaatt aaaatg 206
<210> 63
<211> 172
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Mus musculus Rplp1 core promoter
<400> 63
gtcgggcatc gattggtcgg cgcggtccca taagaagctg cgcgcaggcg tatatgatct 60
tttcctcagc tgccgccaag gtgctcggtc cttccgagga agctaaggcc gcgttggggt 120
gaggccctca cttcatccgg cgactagcac cgtgccggca ttaattaaaa tg 172
<210> 64
<211> 187
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Mus musculus Atp5b core promoter
<400> 64
attggcacca gtttagacca atagctgata agctccgagt ttttttaccc tatagaagcg 60
ttagtggtga tgacgaacag caaaatcacc caattactgt gcctacggcg gaggttgccc 120
cgccccagct gcaggaccgg cggagaggac cgcttcggcg ctcagtctcc acccgttaat 180
taaaatg 187
<210> 65
<211> 178
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Mus musculus Ppt1 core promoter
<400> 65
tgtaaaatga gagcagtgca taagatcaat taaaagatgg aaagccctta tatagtagag 60
tctggtgggt gttaagcaat gaataaacgt ctctgtcagg atgcagagcc cggcaggggg 120
cgtggccacc ggaattactt tggtccacag tccccgcggt catgtgttaa ttaaaatg 178
<210> 66
<211> 232
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Mus musculus Lgals1 core promoter
<400> 66
gactggtcac ctctgctcca aaattgactt tataatccat agactccact tctggtggcc 60
cccatccttg tcctgacatg caattggctg aactcccggg gaggggcggg actcaccggg 120
tctgatccag ttaaaaaggt cggagcgggc ctggggcccg tctctcgggt ggagtcttct 180
gactgctggt ggagcaggtc tcaggaatct cttcgcttca ttaattaaaa tg 232
<210> 67
<211> 231
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence based on Mus musculus Fth1 core promoter
<400> 67
ggccagcgct cgcctgacgc aggatcccgc tataagtgcg gcccgctgtc ccctcctgcg 60
ccagacgttc tcgcccagag tcgccgcggt ttcctgcttc aacagtgctt gaacggaacc 120
cggtgctcga cccctccgac ccccgccggc cgcttcgagc ctgagccctt tgcaacttcg 180
tcgttccgcc gctccagcgt cgccaccgcg cctcgcccct taattaaaat g 231
<210> 68
<211> 3047
<212> DNA
<213> Artificial Sequence
<220>
<223> inter-species DNA sequences
<400> 68
gcatttgctc ggctagtcgg aatgaacatt cattccgaga cctaggatgt gacggaatga 60
aggttcattc cggactctag ataagcacgg aatgaacttt cattccgctg aagcttgtca 120
atcggaatga aggttcattc cggctagtcg gaatgaacat tcattccgag acctaggatg 180
tgacggaatg aaggttcatt ccggactcta gataagcacg gaatgaactt tcattccgct 240
gaagcttgtc aatcggaatg aaggttcatt ccggctagtt ctccccggaa actgtggcca 300
tatgttcaaa gactaggatg gataaatggg gtatataaag caccctgact cccttcctcc 360
aagttctatc taaccagcca tcctacactc tacatatcca caccaatcta ctacaattat 420
taattaaaat ggtgagcaag ggcgaggagg ataacatggc catcatcaag gagttcatgc 480
gcttcaaggt gcacatggag ggctccgtga acggccacga gttcgagatc gagggcgagg 540
gcgagggccg cccctacgag ggcacccaga ccgccaagct gaaggtgacc aagggtggcc 600
ccctgccctt cgcctgggac atcctgtccc ctcagttcat gtacggctcc aaggcctacg 660
tgaagcaccc cgccgacatc cccgactact tgaagctgtc cttccccgag ggcttcaagt 720
gggagcgcgt gatgaacttc gaggacggcg gcgtggtgac cgtgacccag gactcctccc 780
tgcaggacgg cgagttcatc tacaaggtga agctgcgcgg caccaacttc ccctccgacg 840
gccccgtaat gcagaagaag accatgggct gggaggcctc ctccgagcgg atgtaccccg 900
aggacggcgc cctgaagggc gagatcaagc agaggctgaa gctgaaggac ggcggccact 960
acgacgctga ggtcaagacc acctacaagg ccaagaagcc cgtgcagctg cccggcgcct 1020
acaacgtcaa catcaagttg gacatcacct cccacaacga ggactacacc atcgtggaac 1080
agtacgaacg cgccgagggc cgccactcca ccggcggcat ggacgagtta tacaagtaat 1140
gaggatccga atttcttatg atttatgatt tttattatta aataagttat aaaaaaaata 1200
agtgtataca aattttaaag tgactcttag gttttaaaac gaaaattctt attcttgagt 1260
aactctttcc tgtaggtcag gttgctttct caggtatagc atgaggtcgc tcttattgac 1320
cacacctcta ccggccagct tttgttccct ttagtgaggg ttaattgcgc gtcgaggcta 1380
acaacccaaa gtaataagtc tgtagtaatt ggtctcgccc tgaattccaa actataaatc 1440
aaccactttc cctcctcccc cccgccccca cttggtcgat tcttcgtttt ctctctacct 1500
tctttctatt cggttttctt cttcttttat tttccctctc ccatcaatca aattcatatt 1560
tgaaaaaaat taaccattaa ttaacaatgg agtccacacc cacgaaacaa aaagctattt 1620
tttctgcctc gctccttctg ttcgccgaac gcgggtttga cgccactacg atgccgatga 1680
tcgctgaaaa tgctaaggtc ggcgcaggaa cgatttaccg atactttaag aataaggaga 1740
gtctggtcaa cgagctgttc cagcagcacg ttaatgaatt tttgcaatgt atcgagagtg 1800
gcttggcgaa cgaaagggac ggttatcgcg atgggttcca tcatatcttc gagggaatgg 1860
tcacattcac aaagaaccat ccgcgcgcct tgggatttat caagacacat tcccaaggta 1920
cattcctaac cgaagagtca cgccttgcat accaaaaact tgttgagttc gtctgcacct 1980
tctttcgaga gggacagaaa cagggcgtaa ttcgaaactt gcccgagaat gccctgatcg 2040
ccatcctatt cggatcgttt atggaggtct atgagatgat cgaaaacgat tatctctctc 2100
taacggatga gttgcttacg ggggtagagg aatcgctctg ggctgctctc tcccgacaat 2160
cggctagccc tcccaagaag aagcgcaagg tcagcacggc cccccccacg gacgtctccc 2220
tcggcgacga gctccacctg gacggcgagg acgtcgccat ggcccacgcc gacgccctcg 2280
acgacttcga cctcgacatg ctgggcgacg gcgacagccc cggccccggc tttacccccc 2340
acgactccgc cccctacggc gccctggaca tggccgactt cgagtttgag cagatgttca 2400
ccgacgccct gggcattgac gagtacggcg gctgaggccg gccgcgatac ccatcatcaa 2460
cacctgatgt tctggggtcc ctcgtgaggt ttctccaggt gggcaccacc atgcgctcac 2520
ttctacgacg aaacgatcaa tgttgctatg catgagcact cgactatgaa tcgaggcacg 2580
ttaattgaga ggctgggaat aagggttcca tcagaacttc tctgggaatg caaaacaaaa 2640
gggaacaaaa aaactagata gaagtgaatt catgacttcg acaaccaaat catcttgtct 2700
ccgtctgcat acgtgaagct tgtgacgatt attctcgcga tgccacgaca aaggttgtgc 2760
gaccgtatct tgtccactgt cgtccagtct gcctattccc cctccagtgc tgccatgtgt 2820
cgtaccttga ggtaggtagt ctacctaggc cagggagctg ttagtgcccg gctactgggt 2880
aatttgtagc gctggagcga ttcggtcaca ggcgtcaaga gtgctgtagc aatgtccgac 2940
gccattgatc ctgatatcaa ataccacctg ggcaggtctg ggtatgtgag gtcttgtcgg 3000
atgtgtcgag ttcttctcca acgtagtgtt cattcgcgct catgccc 3047
<210> 69
<211> 3044
<212> DNA
<213> Artificial Sequence
<220>
<223> inter-species DNA sequence
<400> 69
gcatttgctc ggctagtcgg aatgaacatt cattccgaga cctaggatgt gacggaatga 60
aggttcattc cggactctag ataagcacgg aatgaacttt cattccgctg aagcttgtca 120
atcggaatga aggttcattc cggctagtcg gaatgaacat tcattccgag acctaggatg 180
tgacggaatg aaggttcatt ccggactcta gataagcacg gaatgaactt tcattccgct 240
gaagcttgtc aatcggaatg aaggttcatt ccggctagtt ctccccggaa actgtggcca 300
tatgccctgc agtgcctgat caccttatca agtggccaaa tatcccacta taaaaggctt 360
gggaacccct cgttctgtct taccttctat catcttacca aatccactcc tcttccttca 420
tacatcaatc ttaccaatca actacctcta caactccaat acacttaatt aaaatggtga 480
gcaagggcga ggaggataac atggccatca tcaaggagtt catgcgcttc aaggtgcaca 540
tggagggctc cgtgaacggc cacgagttcg agatcgaggg cgagggcgag ggccgcccct 600
acgagggcac ccagaccgcc aagctgaagg tgaccaaggg tggccccctg cccttcgcct 660
gggacatcct gtcccctcag ttcatgtacg gctccaaggc ctacgtgaag caccccgccg 720
acatccccga ctacttgaag ctgtccttcc ccgagggctt caagtgggag cgcgtgatga 780
acttcgagga cggcggcgtg gtgaccgtga cccaggactc ctccctgcag gacggcgagt 840
tcatctacaa ggtgaagctg cgcggcacca acttcccctc cgacggcccc gtaatgcaga 900
agaagaccat gggctgggag gcctcctccg agcggatgta ccccgaggac ggcgccctga 960
agggcgagat caagcagagg ctgaagctga aggacggcgg ccactacgac gctgaggtca 1020
agaccaccta caaggccaag aagcccgtgc agctgcccgg cgcctacaac gtcaacatca 1080
agttggacat cacctcccac aacgaggact acaccatcgt ggaacagtac gaacgcgccg 1140
agggccgcca ctccaccggc ggcatggacg agttatacaa gtaatgagga tccgaatttc 1200
ttatgattta tgatttttat tattaaataa gttataaaaa aaataagtgt atacaaattt 1260
taaagtgact cttaggtttt aaaacgaaaa ttcttattct tgagtaactc tttcctgtag 1320
gtcaggttgc tttctcaggt atagcatgag gtcgctctta ttgaccacac ctctaccggc 1380
cagcttttgt tccctttagt gagggttaat tgcgcgtcga ggctagccgc cccaagagag 1440
ctgaagatgc tgagtagggt tgtccaggca gcacatatat aagatgcttc gtcccctccc 1500
atcgagtcct tcttttctct ctctcatcaa tcactctact tcctactcta ccttaaactc 1560
ttcactactt catacgatta acaatggagt ccacacccac gaaacaaaaa gctatttttt 1620
ctgcctcgct ccttctgttc gccgaacgcg ggtttgacgc cactacgatg ccgatgatcg 1680
ctgaaaatgc taaggtcggc gcaggaacga tttaccgata ctttaagaat aaggagagtc 1740
tggtcaacga gctgttccag cagcacgtta atgaattttt gcaatgtatc gagagtggct 1800
tggcgaacga aagggacggt tatcgcgatg ggttccatca tatcttcgag ggaatggtca 1860
cattcacaaa gaaccatccg cgcgccttgg gatttatcaa gacacattcc caaggtacat 1920
tcctaaccga agagtcacgc cttgcatacc aaaaacttgt tgagttcgtc tgcaccttct 1980
ttcgagaggg acagaaacag ggcgtaattc gaaacttgcc cgagaatgcc ctgatcgcca 2040
tcctattcgg atcgtttatg gaggtctatg agatgatcga aaacgattat ctctctctaa 2100
cggatgagtt gcttacgggg gtagaggaat cgctctgggc tgctctctcc cgacaatcgg 2160
ctagccctcc caagaagaag cgcaaggtca gcacggcccc ccccacggac gtctccctcg 2220
gcgacgagct ccacctggac ggcgaggacg tcgccatggc ccacgccgac gccctcgacg 2280
acttcgacct cgacatgctg ggcgacggcg acagccccgg ccccggcttt accccccacg 2340
actccgcccc ctacggcgcc ctggacatgg ccgacttcga gtttgagcag atgttcaccg 2400
acgccctggg cattgacgag tacggcggct gaggccggcc gcgataccca tcatcaacac 2460
ctgatgttct ggggtccctc gtgaggtttc tccaggtggg caccaccatg cgctcacttc 2520
tacgacgaaa cgatcaatgt tgctatgcat gagcactcga ctatgaatcg aggcacgtta 2580
attgagaggc tgggaataag ggttccatca gaacttctct gggaatgcaa aacaaaaggg 2640
aacaaaaaaa ctagatagaa gtgaattcat gacttcgaca accaaatcat cttgtctccg 2700
tctgcatacg tgaagcttgt gacgattatt ctcgcgatgc cacgacaaag gttgtgcgac 2760
cgtatcttgt ccactgtcgt ccagtctgcc tattccccct ccagtgctgc catgtgtcgt 2820
accttgaggt aggtagtcta cctaggccag ggagctgtta gtgcccggct actgggtaat 2880
ttgtagcgct ggagcgattc ggtcacaggc gtcaagagtg ctgtagcaat gtccgacgcc 2940
attgatcctg atatcaaata ccacctgggc aggtctgggt atgtgaggtc ttgtcggatg 3000
tgtcgagttc ttctccaacg tagtgttcat tcgcgctcat gccc 3044
<210> 70
<211> 2627
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence
<400> 70
gctagctctc tatcactgat agggagtatt gacaagcttt ctctatcact gataggagtg 60
gcttatctag atctctatca ctgataggga gttcacatcc taggtctcta tcactgatag 120
ggagtactag ctctctatca ctgataggga gtattgacaa gctttctcta tcactgatag 180
gagtggctta tctagatctc tatcactgat agggagttca catcctaggt ctctatcact 240
gatagggagt actagttctc cccggaaact gtggcctttt ctggcacaca tgatctccac 300
gatttcaaca tataaatagc ttttgataat ggcaatatta atcaaattta ttttacttct 360
ttcttgtaac atctctcttg taatccctta ttccttctag ctatttttca taaaaaacca 420
agcaactgct tatcaacaca caaacactta attaaaatgt ggtctcatcc acaatttgaa 480
aaatctaaag gtgaagaatt attcactggt gttgtcccaa ttttggttga attagatggt 540
gatgttaatg gtcacaaatt ttctgtctcc ggtgaaggtg aaggtgatgc tacttacggt 600
aaattgacct taaaattgat ttgtactact ggtaaattgc cagttccatg gccaacctta 660
gtcactactt taggttatgg tttgcaatgt tttgctagat acccagatca tatgaaacaa 720
catgactttt tcaagtctgc catgccagaa ggttatgttc aagaaagaac tatttttttc 780
aaagatgacg gtaactacaa gaccagagct gaagtcaagt ttgaaggtga taccttagtt 840
aatagaatcg aattaaaagg tattgatttt aaagaagatg gtaacatttt aggtcacaaa 900
ttggaataca actataactc tcacaatgtt tacatcactg ctgacaaaca aaagaatggt 960
atcaaagcta acttcaaaat tagacacaac attgaagatg gtggtgttca attagctgac 1020
cattatcaac aaaatactcc aattggtgat ggtccagtct tgttaccaga caaccattac 1080
ttatcctatc aatctgcctt atccaaagat ccaaacgaaa agagagacca catggtcttg 1140
ttagaatttg ttactgctgc tggtattacc catggtatgg atgaattgta caaaggatcc 1200
taagtcgacg ctaattaaca taaaactcat gattcaacgt ttgtgtattt ttttactttt 1260
gaaggttata gatgtttagg taaataattg gcatagatat agttttagta taataaattt 1320
ctgatttggt ttaaaatatc aactattttt tttcacatat gttcttgtaa ttacttttct 1380
gtcctgtctt ccaggttaaa gattagcttc taatatttta ggtggtttat tatttaattt 1440
tatgctgatt aatttattta ctttcgtatt cggttttgta cctttagcta tgatcttagc 1500
taattgaagg ggcctcgagg ctagcagctg aaaaaaaagg ttgaaaccag ttccctgaaa 1560
ttattcccct acttgactaa taagtatata aagacggtag gtattgattg taattctgta 1620
aatctatttc ttaaacttct taaattctac ttttatagtt agtctttttt ttagttttaa 1680
aacaccaaga acttagtttc gaataaacac acataattaa ttaaatctag acaatgagta 1740
gattagacaa atcaaaagtg ataaattctg cattagaatt gttgaatgaa gtaggcattg 1800
aaggtttgac tacccgtaag ttagctcaga aactaggtgt tgaacaacct acattatact 1860
ggcacgttaa aaataaaagg gcattgttgg atgcgcttgc cattgagatg ttggataggc 1920
atcataccca cttttgccca ttagaaggag agtcttggca ggactttttg aggaataatg 1980
ccaagtcatt tagatgtgca ttgttgtctc atagagatgg ggccaaggtt catctaggta 2040
cccgtcctac ggaaaaacaa tatgagacgt tggaaaatca gttagcgttc ttatgccaac 2100
aaggctttag cttggaaaat gctttatatg ctctatcagc tgtcggtcat tttacattgg 2160
gatgcgtttt agaagaccag gagcaccagg tggcaaagga agaaagagaa acaccaacaa 2220
ctgattcaat gccaccccta ctgagacaag ctatcgaatt atttgatcat caaggtgcgg 2280
aacctgcctt cttgtttggc ctagaattga tcatttgtgg tttagaaaag cagttaaaat 2340
gtgagagtgg ctcagaattc cctcccaaga agaagcgcaa ggtcagcacg gcccccccca 2400
cggacgtctc cctcggcgac gagctccacc tggacggcga ggacgtcgcc atggcccacg 2460
ccgacgccct cgacgacttc gacctcgaca tgctgggcga cggcgacagc cccggccccg 2520
gctttacccc ccacgactcc gccccctacg gcgccctgga catggccgac ttcgagtttg 2580
agcagatgtt caccgacgcc ctgggcattg acgagtacgg cggctga 2627
<210> 71
<211> 3001
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence
<400> 71
catttgctcg gctagtcgga atgaacattc attccgagac ctaggatgtg acggaatgaa 60
ggttcattcc ggactctaga taagcacgga atgaactttc attccgctga agcttgtcaa 120
tcggaatgaa ggttcattcc ggctagtcgg aatgaacatt cattccgaga cctaggatgt 180
gacggaatga aggttcattc cggactctag ataagcacgg aatgaacttt cattccgctg 240
aagcttgtca atcggaatga aggttcattc cggctagttc tccccggaaa ctggaatttg 300
tggttctcgt gaagtcgtga taatagtttg tccaagcgat aaatataaaa tagtattgca 360
cctcaacaag tgttaagcat gcaaatccat ttacgcatac atattaactc cgagtgaaat 420
ataaatatta gagagtagag acagagaaaa agacagagac aaagttaatt aaaatggtaa 480
gcaagggaga agaggataac atggcaatca taaaggaatt tatgcgtttc aaggtccaca 540
tggaaggttc tgtcaatggg cacgagttcg agattgaagg cgagggggag ggtagaccgt 600
atgaagggac ccagactgcc aaattgaagg taacaaaagg cgggccgctt ccattcgctt 660
gggatatcct cagtccgcag ttcatgtatg gctccaaggc ctatgtgaag catcctgcag 720
atatacccga ctatttaaag ctcagtttcc ccgagggctt caaatgggaa agagttatga 780
attttgagga cggaggtgtt gtaaccgtca cgcaggatag cagcttacag gacggcgaat 840
ttatttacaa ggtaaagttg cgtggtacga attttccttc agatggtccg gtcatgcaga 900
agaagactat gggttgggaa gcaagctctg agaggatgta tcccgaagat ggggctctta 960
aaggcgagat aaagcagagg ctgaaactga aggacggcgg gcactacgat gccgaagtca 1020
aaaccaccta taaggctaaa aagcccgtac agcttcccgg tgcttacaac gtgaacatca 1080
aattagacat tacctcccac aatgaagact ataccatcgt ggagcaatac gagagggccg 1140
agggaaggca ctctacagga ggaatggatg aactctacaa aggatcctaa tagctatata 1200
tctttcttac atcattattg taatctgttc tccttctgtg tattcgtttc aatgttgcag 1260
caatgaactt ttggataaaa gtcaaatttg ttgtttcctt aattcgaaag acgattgaga 1320
cttgaaatca taacactaag cttcattgaa tcaagattca atagtattca tcaattcata 1380
atataatagt gtactaaact cgagcttgca tattctgagt taattgaaat acctcactgt 1440
aatacctaga acgaacttac cttacgagca aatcaagcat gtatttactc tcggatgtat 1500
aattcacctt atcaaccttc acaacagtca tcttcactct ttgttcatcc ccatacgatt 1560
cctctttgat cttcagcttc atttaaatgc gatcccctct ggcaaattct tatccatttg 1620
ggttttattg ggcttttgaa ataataaagc ccattaagtt agttactagg gttttgttgt 1680
tgtttaaagg aggaataaga gcgtaagcta caaaatcttt ctattcatct ccgccgctcc 1740
tcatcctgta aagctaaaca aataatcaga ggaacgaagg agacagcttc tgcttaatta 1800
aaatggagag tacaccaacc aaacagaaag ctatttttag cgcaagcctg ttattatttg 1860
ctgagcgtgg ctttgacgct acgacgatgc ccatgatagc cgaaaatgct aaagttgggg 1920
ctggaaccat ataccgatac ttcaaaaaca aagaaagtct ggtgaatgaa ctgtttcaac 1980
aacacgtaaa cgagttcttg cagtgcatcg agtctggact cgctaacgag cgtgacggct 2040
atagagatgg atttcatcat atatttgagg gcatggtcac cttcacaaaa aaccacccaa 2100
gggctctggg tttcataaaa acgcacagtc aaggcacatt ccttacggag gagagcagat 2160
tagcatatca gaaattagtg gagttcgtat gtactttctt tagagaagga cagaagcaag 2220
gagttattcg aaacctgccg gaaaacgcct taattgccat cctgtttggg tctttcatgg 2280
aagtttacga aatgatagag aatgattacc tctcccttac cgacgaattg ttgactggcg 2340
tcgaagaatc attgtgggca gcattgtcta ggcaatcaga attcccacct aagaagaaaa 2400
ggaaagtatc cgcctccggt tctgggcgtg ccgacgctct ggacgatttc gacctcgata 2460
tgttggggtc agacgcattg gacgactttg atttggacat gttaggtagt gatgctttag 2520
acgatttcga cttggacatg ttaggctccg atgcattgga cgattttgac ttagatatgt 2580
tgattaatag taggtaatga gtcgactctt taatcaaaat gtaatatgaa taaaagttga 2640
tgtgggctca tctattgagc tcatgtctct cttattacta ctctctagta tggtgtgatg 2700
taatgggtta tgacccttct ttcccttccc tataaaacta aagaaacttg caagataatt 2760
gaaaagatgg tttcttttta ttatcaatcg catcaaaatg ggattttgta tcaaatgcat 2820
acattatctc ttgcttttat accctaaacc cataccgggt gatgaacaat cttctgttgc 2880
tcattccttt tgatgatcca tcaaattacg tattagaaaa agaaaaaaaa gtatcagacg 2940
ttgaaacctt ctgctcggag acaaatttta tgagcctcga tccatttaaa tcaagcccgg 3000
g 3001
<210> 72
<211> 3088
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence
<400> 72
catttgctcg gctagctctc tatcactgat agggagtatt gacaagcttt ctctatcact 60
gataggagtg gcttatctag atctctatca ctgataggga gttcacatcc taggtctcta 120
tcactgatag ggagtactag ctctctatca ctgataggga gtattgacaa gctttctcta 180
tcactgatag gagtggctta tctagatctc tatcactgat agggagttca catcctaggt 240
ctctatcact gatagggagt actagttctc cccggaaact ggaatttgtg gttctcgtga 300
agtcgtgata atagtttgtc caagcgataa atataaaata gtattgcacc tcaacaagtg 360
ttaagcatgc aaatccattt acgcatacat attaactccg agtgaaatat aaatattaga 420
gagtagagac agagaaaaag acagagacaa agttaattaa aatggtaagc aagggagaag 480
aggataacat ggcaatcata aaggaattta tgcgtttcaa ggtccacatg gaaggttctg 540
tcaatgggca cgagttcgag attgaaggcg agggggaggg tagaccgtat gaagggaccc 600
agactgccaa attgaaggta acaaaaggcg ggccgcttcc attcgcttgg gatatcctca 660
gtccgcagtt catgtatggc tccaaggcct atgtgaagca tcctgcagat atacccgact 720
atttaaagct cagtttcccc gagggcttca aatgggaaag agttatgaat tttgaggacg 780
gaggtgttgt aaccgtcacg caggatagca gcttacagga cggcgaattt atttacaagg 840
taaagttgcg tggtacgaat tttccttcag atggtccggt catgcagaag aagactatgg 900
gttgggaagc aagctctgag aggatgtatc ccgaagatgg ggctcttaaa ggcgagataa 960
agcagaggct gaaactgaag gacggcgggc actacgatgc cgaagtcaaa accacctata 1020
aggctaaaaa gcccgtacag cttcccggtg cttacaacgt gaacatcaaa ttagacatta 1080
cctcccacaa tgaagactat accatcgtgg agcaatacga gagggccgag ggaaggcact 1140
ctacaggagg aatggatgaa ctctacaaag gatcctaata gctatatatc tttcttacat 1200
cattattgta atctgttctc cttctgtgta ttcgtttcaa tgttgcagca atgaactttt 1260
ggataaaagt caaatttgtt gtttccttaa ttcgaaagac gattgagact tgaaatcata 1320
acactaagct tcattgaatc aagattcaat agtattcatc aattcataat ataatagtgt 1380
actaaactcg agcttgcata ttctgagtta attgaaatac ctcactgtaa tacctagaac 1440
gaacttacct tacgagcaaa tcaagcatgt atttactctc ggatgtataa ttcaccttat 1500
caaccttcac aacagtcatc ttcactcttt gttcatcccc atacgattcc tctttgatct 1560
tcagcttcat ttaaatgcga tcccctctgg caaattctta tccatttggg ttttattggg 1620
cttttgaaat aataaagccc attaagttag ttactagggt tttgttgttg tttaaaggag 1680
gaataagagc gtaagctaca aaatctttct attcatctcc gccgctcctc atcctgtaaa 1740
gctaaacaaa taatcagagg aacgaaggag acagcttctg cttaattaaa atgtcaagat 1800
tagacaaaag caaagtaatc aatagtgcat tagaactttt aaacgaggtc ggaatagagg 1860
gattaactac acgtaaactc gcccagaagc tcggagttga acaacctacg ctgtattggc 1920
atgttaaaaa taaacgagca ttattggatg ctctggctat tgagatgctc gataggcacc 1980
atacccactt ttgccctctg gagggggaat cttggcaaga cttcttgcgt aacaacgcca 2040
agtcattcag atgtgccttg ctgagtcacc gtgacggcgc taaagtccat ctcggaaccc 2100
gaccgaccga gaagcaatac gagaccttag aaaaccaatt agcctttctt tgccagcaag 2160
ggttttcatt agagaatgct ctctacgccc tttccgctgt tgggcatttc accctgggtt 2220
gcgtcttgga ggatcaggaa catcaagtag caaaggagga acgagagaca cctactacgg 2280
attctatgcc gcccctcctc aggcaggcaa ttgaactgtt cgatcatcag ggagctgaac 2340
ctgcttttct gtttggcctg gaattgataa tatgcggact ggagaaacag ttaaagtgcg 2400
agagcggtag cgaattccca cctaaaaaaa agagaaaagt ttccactgcc cccccaacgg 2460
acgtctctct gggcgacgag ctgcacctcg atggtgagga cgtggctatg gctcatgctg 2520
atgccttaga cgacttcgac ttagatatgc tgggagatgg cgactcaccg ggaccagggt 2580
ttacacctca tgattctgct ccttacggag ctttagatat ggccgatttt gaatttgagc 2640
aaatgttcac tgacgccctt ggaatagacg aatacggggg ctaatgagtc gactctttaa 2700
tcaaaatgta atatgaataa aagttgatgt gggctcatct attgagctca tgtctctctt 2760
attactactc tctagtatgg tgtgatgtaa tgggttatga cccttctttc ccttccctat 2820
aaaactaaag aaacttgcaa gataattgaa aagatggttt ctttttatta tcaatcgcat 2880
caaaatggga ttttgtatca aatgcataca ttatctcttg cttttatacc ctaaacccat 2940
accgggtgat gaacaatctt ctgttgctca ttccttttga tgatccatca aattacgtat 3000
tagaaaaaga aaaaaaagta tcagacgttg aaaccttctg ctcggagaca aattttatga 3060
gcctcgatcc atttaaatca agcccggg 3088
<210> 73
<211> 2992
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence
<400> 73
gcatttgctc ggctagtcgg aatgaacatt cattccgaga cctaggatgt gacggaatga 60
aggttcattc cggactctag ataagcacgg aatgaacttt cattccgctg aagcttgtca 120
atcggaatga aggttcattc cggctagtcg gaatgaacat tcattccgag acctaggatg 180
tgacggaatg aaggttcatt ccggactcta gataagcacg gaatgaactt tcattccgct 240
gaagcttgtc aatcggaatg aaggttcatt ccggctagtt ctccccggaa actgcgacga 300
agggatgtct ccgcaaggca agtatataac ggctagcaac gtatgcctta gcatagtaga 360
gcaattagtt gtctatgtgc ctcggtgcaa gcgcacacgc cgggaataat gcggcatggg 420
ggcttctgtt ggccccatgc gagcccccag gaagaaaagt cgcgcggcgc ccgtattctg 480
ccctcttgct gtgccaacct cctagtcgct tcttcgcact ttttaattaa aatggtctcc 540
aagggtgagg aggacaacat ggctatcatc aaggagttca tgcgcttcaa ggtccatatg 600
gaggggagcg tgaacggcca cgagtttgag atcgaggggg agggcgaggg ccgcccctac 660
gagggcaccc agacggcgaa gctcaaggtg accaagggtg gccccctgcc ctttgcgtgg 720
gacatcctgt ccccccagtt tatgtacggg agcaaggctt acgtcaagca ccctgcggac 780
atccctgact acctgaagct ctccttcccc gagggtttta agtgggagcg ggtcatgaac 840
tttgaggacg gtggtgtggt caccgtgacc caggacagca gcctccagga tggtgagttt 900
atttacaagg tgaagctccg gggcacgaac ttccccagcg atgggccggt gatgcagaag 960
aagacgatgg gctgggaggc ctcgtcggag cgcatgtacc ctgaggacgg cgccctgaag 1020
ggtgagatca agcagcgcct gaagctgaag gatggggggc attacgacgc tgaggtcaag 1080
acgacgtaca aggccaagaa gccggtgcag ctgcccggtg cctacaacgt gaacatcaag 1140
ctggacatca ccagccacaa cgaggattac accattgtcg agcagtacga gcgggctgag 1200
ggccgccact ccaccggggg tatggacgag ctgtacaagg atatctaaat ggaggcgctc 1260
gttgatctga gccttgcccc ctgacgaacg gcggtggatg gaagatactg ctctcaagtg 1320
ctgaagcggt agcttagctc cccgtttcgt gctgatcagt ctttttcaac acgtaaaaag 1380
cggaggagtt ttgcaatttt gttggttgta acgatcctcc gttgattttg gcctctttct 1440
ccatgggcgg gctgggcgta tttgaagcgc ttttggaaaa gttgctgcgg ggttcatcag 1500
ctgaagggga ctcggttcgc agatcagtta cacactaaag aacggcgggt agcaacacca 1560
gcaaacgtga cgaaacggaa ccgtgcagca tttaaatggc ccgaacttgc tctcggtgtc 1620
atattgcacc atcccatctt gtataaccga tataacatag cttcgagtgt gccgataaat 1680
tattgtgagg gcgtcggggg gcgagctgag ggaaatggag ggggcactca tctcggccgc 1740
ccctcccatc gcgacctcgg cgctcaagcg ggggtcccgc actcgcttcg gtctcttttg 1800
gtcagcagcc gtttgttgac taccgttaat taaaatggag agcaccccta ccaagcagaa 1860
ggcgatcttt tcggcttcgc tgctgctgtt tgccgagcgc gggtttgatg ctaccaccat 1920
gcccatgatc gctgagaacg ctaaggtcgg ggcgggcacg atttaccggt acttcaagaa 1980
caaggagtcg ctcgtcaacg agctgtttca gcagcatgtg aacgagttcc tgcagtgcat 2040
tgagtccggt ctcgccaacg agcgggatgg ctaccgcgat ggtttccatc acatcttcga 2100
gggcatggtc acgtttacga agaaccatcc tcgcgctctc ggttttatca agacccattc 2160
ccaggggacc tttctcacgg aggagtcgcg gctggcttac cagaagctgg tcgagtttgt 2220
ctgcaccttt ttccgggagg gtcagaagca gggtgtgatt cggaacctgc cggagaacgc 2280
tctcattgct atcctctttg gctcgtttat ggaggtctac gagatgattg agaacgatta 2340
cctgtccctg acggacgagc tgctcacggg cgtcgaggag agcctctggg ctgctctgtc 2400
gcggcagtcg gagctccccc ctaagaagaa gcgcaaggtg tcggcctccg ggagcggccg 2460
ggctgatgct ctggatgact tcgacctgga catgctgggt agcgacgctc tcgacgattt 2520
tgacctggac atgctcggct cggatgccct ggacgatttc gatctggata tgctgggtag 2580
cgacgcgctc gacgactttg atctggacat gctcattaac agccgctaaa cgcgtggccc 2640
caccgttgcg tgtgcgcccg cggtgcgctg cgcggtcggc agcttgggtg tggcatccgg 2700
tgcggcttgt cccgccggca tgtagctctt atgtaacggg ctgtctgtac tcacttgtgt 2760
ccaaccgcct ctctggatgt ctggttcatg accaacagct aagcaaagaa gcagctggga 2820
caccagggga cgctgacaat ggagtgggca gccgacgcag cagagggggg actgcgagtt 2880
atacggtatt aggctgggct ggcaggtccg gtagacggta atgcgacaca caagccgtgg 2940
gagaaggttg cgtcaggaag tccaagcagg ttctgtattt aaatgcggcc gc 2992
<210> 74
<211> 3076
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence
<400> 74
ttgctcggct agctctctat cactgatagg gagtattgac aagctttctc tatcactgat 60
aggagtggct tatctagatc tctatcactg atagggagtt cacatcctag gtctctatca 120
ctgataggga gtactagctc tctatcactg atagggagta ttgacaagct ttctctatca 180
ctgataggag tggcttatct agatctctat cactgatagg gagttcacat cctaggtctc 240
tatcactgat agggagtact agttctcccc ggaaactgcg acgaagggat gtctccgcaa 300
ggcaagtata taacggctag caacgtatgc cttagcatag tagagcaatt agttgtctat 360
gtgcctcggt gcaagcgcac acgccgggaa taatgcggca tgggggcttc tgttggcccc 420
atgcgagccc ccaggaagaa aagtcgcgcg gcgcccgtat tctgccctct tgctgtgcca 480
acctcctagt cgcttcttcg cactttttaa ttaaaatggt ctccaagggt gaggaggaca 540
acatggctat catcaaggag ttcatgcgct tcaaggtcca tatggagggg agcgtgaacg 600
gccacgagtt tgagatcgag ggggagggcg agggccgccc ctacgagggc acccagacgg 660
cgaagctcaa ggtgaccaag ggtggccccc tgccctttgc gtgggacatc ctgtcccccc 720
agtttatgta cgggagcaag gcttacgtca agcaccctgc ggacatccct gactacctga 780
agctctcctt ccccgagggt tttaagtggg agcgggtcat gaactttgag gacggtggtg 840
tggtcaccgt gacccaggac agcagcctcc aggatggtga gtttatttac aaggtgaagc 900
tccggggcac gaacttcccc agcgatgggc cggtgatgca gaagaagacg atgggctggg 960
aggcctcgtc ggagcgcatg taccctgagg acggcgccct gaagggtgag atcaagcagc 1020
gcctgaagct gaaggatggg gggcattacg acgctgaggt caagacgacg tacaaggcca 1080
agaagccggt gcagctgccc ggtgcctaca acgtgaacat caagctggac atcaccagcc 1140
acaacgagga ttacaccatt gtcgagcagt acgagcgggc tgagggccgc cactccaccg 1200
ggggtatgga cgagctgtac aaggatatct aaatggaggc gctcgttgat ctgagccttg 1260
ccccctgacg aacggcggtg gatggaagat actgctctca agtgctgaag cggtagctta 1320
gctccccgtt tcgtgctgat cagtcttttt caacacgtaa aaagcggagg agttttgcaa 1380
ttttgttggt tgtaacgatc ctccgttgat tttggcctct ttctccatgg gcgggctggg 1440
cgtatttgaa gcgcttttgg aaaagttgct gcggggttca tcagctgaag gggactcggt 1500
tcgcagatca gttacacact aaagaacggc gggtagcaac accagcaaac gtgacgaaac 1560
ggaaccgtgc agcatttaaa tggcccgaac ttgctctcgg tgtcatattg caccatccca 1620
tcttgtataa ccgatataac atagcttcga gtgtgccgat aaattattgt gagggcgtcg 1680
gggggcgagc tgagggaaat ggagggggca ctcatctcgg ccgcccctcc catcgcgacc 1740
tcggcgctca agcgggggtc ccgcactcgc ttcggtctct tttggtcagc agccgtttgt 1800
tgactaccgt taattaaaat gagccggctg gataagtcca aggtcatcaa ctccgcgctc 1860
gagctgctca acgaggtcgg gatcgagggc ctgacgaccc ggaagctggc gcagaagctg 1920
ggggtggagc agccgaccct gtactggcac gtcaagaaca agcgggccct gctcgatgcc 1980
ctcgctatcg agatgctcga tcggcatcat acgcattttt gccctctcga gggggagtcc 2040
tggcaggact ttctgcggaa caacgccaag tcgttccggt gcgccctgct gtcccatcgg 2100
gatggtgcta aggtccatct cgggacgcgg cctaccgaga agcagtacga gaccctggag 2160
aaccagctcg cttttctgtg ccagcagggg ttctccctgg agaacgctct ctacgccctc 2220
tccgctgtgg gtcattttac cctcggttgc gtcctggagg atcaggagca tcaggtcgcc 2280
aaggaggagc gggagacccc taccacggac tcgatgcccc ctctcctccg gcaggctatt 2340
gagctgtttg accatcaggg cgcggagcct gcctttctct ttgggctcga gctgattatt 2400
tgcggcctcg agaagcagct caagtgcgag tccggttcgg agctccctcc taagaagaag 2460
cgcaaggtga gcaccgcccc ccccacggat gtgtccctgg gtgatgagct gcatctcgac 2520
ggcgaggatg tcgccatggc tcatgccgat gccctggatg atttcgatct cgatatgctg 2580
ggtgatggtg actcccccgg tccgggtttt acgcctcacg atagcgcccc ttacggcgct 2640
ctggacatgg ccgattttga gtttgagcag atgttcacgg acgcgctcgg catcgacgag 2700
tacggcggtt aaacgcgtgg ccccaccgtt gcgtgtgcgc ccgcggtgcg ctgcgcggtc 2760
ggcagcttgg gtgtggcatc cggtgcggct tgtcccgccg gcatgtagct cttatgtaac 2820
gggctgtctg tactcacttg tgtccaaccg cctctctgga tgtctggttc atgaccaaca 2880
gctaagcaaa gaagcagctg ggacaccagg ggacgctgac aatggagtgg gcagccgacg 2940
cagcagaggg gggactgcga gttatacggt attaggctgg gctggcaggt ccggtagacg 3000
gtaatgcgac acacaagccg tgggagaagg ttgcgtcagg aagtccaagc aggttctgta 3060
tttaaatgcg gccgcg 3076
<210> 75
<211> 2980
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence
<400> 75
tttgctcggc tagtcggaat gaacattcat tccgagacct aggatgtgac ggaatgaagg 60
ttcattccgg actctagata agcacggaat gaactttcat tccgctgaag cttgtcaatc 120
ggaatgaagg ttcattccgg ctagtcggaa tgaacattca ttccgagacc taggatgtga 180
cggaatgaag gttcattccg gactctagat aagcacggaa tgaactttca ttccgctgaa 240
gcttgtcaat cggaatgaag gttcattccg gctagttctc cccggaaact gccggacgag 300
cacccggcgc cgtcacgtga cgcacccaac cggcgttgac ctataaaagg ccgggcgttg 360
acgtcagcgg tctcttccgc cgcagccgcc gccatcgtcg gcgcgcttcc ctgttcacct 420
ctgactctga gaatccgtcg ccatccgcca ccatgggatc cgtgtctaaa ggggaggaag 480
acaacatggc tattattaag gagttcatga ggtttaaggt gcatatggag gggagcgtaa 540
acggtcacga atttgagatt gaaggcgaag gggaaggaag accctatgaa ggtactcaaa 600
ctgcaaaact caaggtcacc aaaggtggac cactgccctt cgcttgggat atacttagcc 660
cacagtttat gtacgggtct aaagcctatg taaagcatcc agcagatata ccagactacc 720
ttaaactgag ctttcctgaa ggttttaagt gggagcgggt gatgaatttc gaagacggtg 780
gcgtggttac cgttacccag gacagcagtt tgcaagatgg agaatttatc tacaaggtaa 840
aactgcgggg gaccaatttc ccaagtgacg gacccgtaat gcagaaaaag actatggggt 900
gggaggcttc ttcagaacgc atgtaccccg aagacggtgc tctgaaaggc gaaataaagc 960
aacgattgaa gctcaaagat gggggccatt acgacgccga ggtaaaaact acctataaag 1020
ccaaaaagcc tgttcagctg cctggtgctt ataatgtgaa tataaagttg gacataacct 1080
cacataacga agattacact attgttgaac agtacgagag agcagagggg cggcattcta 1140
caggagggat ggacgaactg tacaaataag atatcttccc caaagccacg tgactttact 1200
ggtcactgag gcagtgcatg catgtcaggc tgccttcatc ttttctataa gttgcaccaa 1260
aacatctgct taagttcttt aatttgtacc atttcttcaa ataaagaatt ttggtaccca 1320
gcttcttttc tttgtgattg aggataagca ttccagcttc cagttgcttc accgccagtt 1380
atactaatca cactgaaaca cctaaaagaa tattcacgtt tattaaactc cttagtttgg 1440
gaaagatcgt aaaatacagg tgttttcagg caggactatt aagtactctt ggttctgagt 1500
tacatgctag actgtcgtgg gaacacactc ctgggtgtcg ctgcttgtgt gcctttgact 1560
gggtcagtga tttaaatatt ggcaccagtt tagaccaata gctgataagc tccgagtttt 1620
tttaccctat agaagcgtta gtggtgatga cgaacagcaa aatcacccaa ttactgtgcc 1680
tacggcggag gttgccccgc cccagctgca ggaccggcgg agaggaccgc ttcggcgctc 1740
agtctccacc cggattccgc catggaaagc acaccaacaa agcaaaaagc aatattttca 1800
gcctcacttc ttttgtttgc cgagaggggt ttcgacgcta caacaatgcc catgatagcc 1860
gaaaatgcca aagtaggagc cgggacaata tacaggtatt ttaaaaacaa ggaaagtctg 1920
gtcaatgaac ttttccagca gcacgtaaat gagtttcttc aatgtattga atctggcctg 1980
gctaacgaac gcgacggtta tcgtgatggc tttcatcaca tatttgaggg aatggtcact 2040
ttcaccaaaa atcaccctag ggccttgggc tttatcaaaa cacattctca gggtacattc 2100
ctcaccgagg aatctcgact cgcctatcaa aagctcgttg agtttgtctg tactttcttt 2160
agggagggac aaaagcaagg cgtaatccga aacctcccag agaacgcctt gatcgctatt 2220
ctcttcggat cttttatgga ggtctatgag atgatcgaaa atgactatct tagtctgaca 2280
gatgagcttc tgacaggtgt tgaagaatca ttgtgggctg ctttgtctag acagagtgaa 2340
ttccctccca agaagaaacg aaaggtaagc gcctctggtt caggtcgtgc tgacgctctg 2400
gatgattttg atctcgacat gcttggttct gatgctcttg acgacttcga ccttgatatg 2460
ctgggcagtg acgcattgga cgactttgat ttggacatgt tgggaagcga tgccttggac 2520
gactttgacc ttgatatgct gataaatagt cgctaatagc tcgagcgcct cctcctccca 2580
tagccgatgg ccacagtcaa ttcaccaccc cagggtcctc agctaggagg aggacagagt 2640
gtggaaagta gacagtttcc acttcctttt ccctacatct ttcagtatga gggtaccata 2700
tcctgctcca cccaggtcct gtggataaca ataaaaaagg aagtgtgtgt gcctttgtat 2760
gtgttcccct cacgtctttg acaatggggt tggggaggtc tggggtcaga gagaattgcg 2820
ttgtgggatt ttgagttaac tgcttttggc tttagagatc gacagtctaa gaggtaaaat 2880
tagatgtgaa ttagttggga agctgccaag tgtcccagag ctttggacac ccactctagg 2940
gacacattgt ccccttattt aaatagggcc cgtttaaacc 2980
<210> 76
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence identical or derived from naturally occurring LexA
binding site
<400> 76
ctgtatataa acacag 16
<210> 77
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence identical or derived from naturally occurring LexA
binding site
<400> 77
ctgtatatat acccag 16
<210> 78
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence identical or derived from naturally occurring LexA
binding site
<400> 78
ctgtatataa aaccag 16
<210> 79
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence identical or derived from naturally occurring LexA
binding site
<400> 79
gtggttatat atacag 16
<210> 80
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence identical or derived from naturally occurring SrpR
binding site
<400> 80
atatacatac atgcttgttt gtttgtaaac 30
<210> 81
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence identical or derived from naturally occurring SrpR
binding site
<400> 81
atttacatac attcttgttt gtttgtaaac 30
<210> 82
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence identical or derived from naturally occurring PhlF
binding site
<400> 82
atgatacgaa acgtaccgta tcgttaaggt 30
<210> 83
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence identical or derived from naturally occurring PhlF
binding site
<400> 83
atgatacgga acgttacgta tcgttaagct 30
<210> 84
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence identical or derived from naturally occurring PhlF
binding site
<400> 84
atgatacgga agctaccgta tcgtaaaggt 30
<210> 85
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence identical or derived from naturally occurring PhlF
binding site
<400> 85
atgatacgta acgtaccgta tcgtaaaggt 30
<210> 86
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence identical or derived from naturally occurring TetR
binding site
<400> 86
actccctatc agtgatagag a 21
<210> 87
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence identical or derived from naturally occurring BM3R1
binding site
<400> 87
cggaatgaag gttcattccg 20
<210> 88
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence identical or derived from naturally occurring BM3R1
binding site
<400> 88
cggaatgaac tttcattccg 20
<210> 89
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence identical or derived from naturally occurring BM3R1
binding site
<400> 89
cggaatgaac attcattccg 20
<210> 90
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence identical or derived from naturally occurring BM3R1
binding site
<400> 90
cggaatgaac gttcattccg 20
<210> 91
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence identical or derived from naturally occurring TarA
binding site
<400> 91
aacataccgt gtggtatgtt 20
<210> 92
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence identical or derived from naturally occurring TarA
binding site
<400> 92
aacataccga gtggtatgtt 20
<210> 93
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence identical or derived from naturally occurring TarA
binding site
<400> 93
aacataccgt gaggtatgtt 20
<210> 94
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence identical or derived from naturally occurring TarA
binding site
<400> 94
aaacataccg tgtggtatgt tc 22
<210> 95
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA sequence identical or derived from naturally occurring LacI
binding site
<400> 95
aattgtgagc ggctcacaat t 21
Claims (8)
1.用于真核宿主的表达系统,其包含:
(a)表达盒,其包含:
核心启动子,其选自表1中提供的核心启动子,所述核心启动子是用于控制编码合成转录因子(sTF)的DNA序列表达的唯一调控序列,和
DNA序列,其编码合成转录因子(sTF),和
(b)一个或多个表达盒,每个表达盒包含与合成启动子可操作连接的编码所需产物的DNA序列,
所述合成启动子包含与(a)的核心启动子相同的核心启动子或选自表1中提供的核心启动子的另一种核心启动子和核心启动子上游的sTF特异性结合位点。
2.根据权利要求1所述的表达系统,其中核心启动子是在多种真核生物中有功能的通用核心启动子(UCP),其选自具有表1中提供的SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:6-SEQ ID NO:67的核心启动子。
3.根据权利要求1-2中任一项所述的表达系统,其中所述合成转录因子(sTF)包含原核转录调节因子、核定位信号和转录激活结构域。
4.根据权利要求1-3中任一项所述的表达系统,其中真核宿主选自包括酵母和丝状真菌的真菌物种、包括有花植物和绿藻物种的植物物种和动物物种。
5.真核宿主,其包含权利要求1至4中任一项所述的表达系统。
6.根据权利要求5所述的真核宿主,其中核心启动子是在多种真核生物中有功能的通用核心启动子(UCP),并且来源于不同于酿酒酵母(Saccharomyces cerevisiae)的另一种真核宿主物种。
7.根据权利要求5或6所述的真核宿主,其中真核宿主选自包括酵母和丝状真菌的真菌物种、包括有花植物和绿藻物种的植物物种和动物物种。
8.在真核宿主中生产所需蛋白质产物的方法,其包括在合适的培养条件下培养根据权利要求5或6所述的宿主。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI20165137 | 2016-02-22 | ||
FI20165137A FI127283B (en) | 2016-02-22 | 2016-02-22 | Expression system for eukaryotic microorganisms |
PCT/FI2017/050114 WO2017144777A1 (en) | 2016-02-22 | 2017-02-21 | Expression system for eukaryotic organisms |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109477115A CN109477115A (zh) | 2019-03-15 |
CN109477115B true CN109477115B (zh) | 2022-06-03 |
Family
ID=58387847
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780020813.9A Active CN109477115B (zh) | 2016-02-22 | 2017-02-21 | 用于真核生物的表达系统 |
Country Status (15)
Country | Link |
---|---|
US (1) | US11332750B2 (zh) |
EP (1) | EP3405580B1 (zh) |
JP (1) | JP6953667B2 (zh) |
KR (1) | KR20180117147A (zh) |
CN (1) | CN109477115B (zh) |
AU (1) | AU2017224865B2 (zh) |
CA (1) | CA3015440C (zh) |
DK (1) | DK3405580T3 (zh) |
ES (1) | ES2870962T3 (zh) |
FI (1) | FI127283B (zh) |
HU (1) | HUE054884T2 (zh) |
LT (1) | LT3405580T (zh) |
MX (1) | MX2018010055A (zh) |
PT (1) | PT3405580T (zh) |
WO (1) | WO2017144777A1 (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI129102B (en) | 2018-03-19 | 2021-07-15 | Teknologian Tutkimuskeskus Vtt Oy | Heterological production of psilosybin |
GB201903244D0 (en) | 2019-03-14 | 2019-04-24 | Syndermix Ag | Methods for lectin production with improved yield |
KR20220040476A (ko) * | 2019-08-01 | 2022-03-30 | 메모리얼 슬로안 케터링 캔서 센터 | 개선된 면역치료법을 위한 세포 및 이의 용도 |
WO2021099685A2 (en) * | 2019-11-19 | 2021-05-27 | Teknologian Tutkimuskeskus Vtt Oy | Non-viral transcription activation domains and methods and uses related thereto |
WO2021220209A1 (en) | 2020-04-30 | 2021-11-04 | Dyadic International (Usa), Inc. | Nicotinamide riboside production in filamentous fungi |
CN116113643A (zh) * | 2020-09-05 | 2023-05-12 | 银杏生物制品公司 | 合成表达系统 |
FR3122436A1 (fr) | 2021-04-30 | 2022-11-04 | IFP Energies Nouvelles | Insertion multicopies d’un gène d’intérêt dans le génome d’un champignon |
BR112023024706A2 (pt) | 2021-05-27 | 2024-02-15 | Novozymes As | Reguladores da transcrição e polinucleotídeos que os codificam |
EP4437114A1 (en) * | 2021-11-23 | 2024-10-02 | Kaesler Nutrition GmbH | Artificial yeast promoter regions |
CN113846024B (zh) * | 2021-12-01 | 2022-03-29 | 南京昊禾生物科技有限公司 | 一种降低l-苹果酸发酵过程中副产物富马酸的方法、菌种及应用 |
US20230372467A1 (en) | 2022-05-20 | 2023-11-23 | Phibro Animal Health Corporation | Using fungal constructs to produce viral protein antigens |
WO2023242273A1 (en) | 2022-06-14 | 2023-12-21 | Newmilkbuzz B.V. | Expression of milk caseins in filamentous fungi |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020081667A1 (en) | 2000-12-06 | 2002-06-27 | Jorn Gorlach | Self-amplifying transcriptional amplification system |
-
2016
- 2016-02-22 FI FI20165137A patent/FI127283B/en active IP Right Grant
-
2017
- 2017-02-21 HU HUE17712530A patent/HUE054884T2/hu unknown
- 2017-02-21 PT PT177125309T patent/PT3405580T/pt unknown
- 2017-02-21 CN CN201780020813.9A patent/CN109477115B/zh active Active
- 2017-02-21 MX MX2018010055A patent/MX2018010055A/es unknown
- 2017-02-21 KR KR1020187027693A patent/KR20180117147A/ko not_active Application Discontinuation
- 2017-02-21 US US15/737,696 patent/US11332750B2/en active Active
- 2017-02-21 ES ES17712530T patent/ES2870962T3/es active Active
- 2017-02-21 EP EP17712530.9A patent/EP3405580B1/en active Active
- 2017-02-21 CA CA3015440A patent/CA3015440C/en active Active
- 2017-02-21 WO PCT/FI2017/050114 patent/WO2017144777A1/en active Application Filing
- 2017-02-21 LT LTEP17712530.9T patent/LT3405580T/lt unknown
- 2017-02-21 JP JP2018544246A patent/JP6953667B2/ja active Active
- 2017-02-21 AU AU2017224865A patent/AU2017224865B2/en active Active
- 2017-02-21 DK DK17712530.9T patent/DK3405580T3/da active
Non-Patent Citations (4)
Title |
---|
A Highly Tunable System for the Simultaneous Expression of Multiple Enzymes in Saccharomyces cerevisiae;Ito Yoichiro等;《Summer Synthetic Biology Conference 2014》;20140303;全文 * |
Plant synthetic promoters and transcription factorsf HTT;Liu W.等;《Current Opinion in Biotechnology》;20151031;全文 * |
Synthetic Core Promoters for Pichia pastorisf HT;Vogl Thomas等;《ACS Synth. Biol》;20131104;全文 * |
草菇gpd启动子的克隆及序列分析;杨帆等;《热带作物学报》;20041230(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
FI20165137A (fi) | 2017-08-23 |
EP3405580B1 (en) | 2021-03-31 |
CA3015440A1 (en) | 2017-08-31 |
DK3405580T3 (da) | 2021-05-25 |
BR112018017088A2 (pt) | 2019-01-02 |
EP3405580A1 (en) | 2018-11-28 |
CN109477115A (zh) | 2019-03-15 |
PT3405580T (pt) | 2021-05-21 |
US20180371468A1 (en) | 2018-12-27 |
ES2870962T3 (es) | 2021-10-28 |
JP2019505230A (ja) | 2019-02-28 |
MX2018010055A (es) | 2018-11-09 |
US11332750B2 (en) | 2022-05-17 |
CA3015440C (en) | 2024-06-18 |
WO2017144777A1 (en) | 2017-08-31 |
AU2017224865B2 (en) | 2022-07-07 |
AU2017224865A1 (en) | 2018-09-13 |
KR20180117147A (ko) | 2018-10-26 |
HUE054884T2 (hu) | 2021-10-28 |
FI127283B (en) | 2018-03-15 |
JP6953667B2 (ja) | 2021-10-27 |
LT3405580T (lt) | 2021-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109477115B (zh) | 用于真核生物的表达系统 | |
KR102229968B1 (ko) | 메틸영양성 효모를 유전적으로 조작하는 발현 구축물 및 방법 | |
US8236528B2 (en) | Method for methanol independent induction from methanol inducible promoters in Pichia | |
KR102253479B1 (ko) | 프로모터 변이체 | |
KR20170087521A (ko) | 진균 게놈 변형 시스템 및 사용 방법 | |
CN114555812A (zh) | 用于蛋白质产生的材料和方法 | |
US20110129874A1 (en) | Pichia Pastoris Das Promoter Variants | |
US10550409B2 (en) | Drimenol synthases III | |
CN109762815A (zh) | 一种在水稻花药与花粉中特异表达的启动子pchf17及其应用 | |
CA2434059C (en) | Constitutive promoter from arabidopsis | |
KR20230107724A (ko) | 변형된 식물 배유체 특이 프로모터 및 이의 용도 | |
US20090162897A1 (en) | Promoter Sequences | |
Xiao-Yi et al. | Production of marker-free transgenic tobacco plants by Flp/frt recombination system | |
KR20140043202A (ko) | 감자 유래 건조 스트레스 저항성 유전자 및 이를 이용하여 제조한 건조 스트레스 저항성 형질전환체 | |
US9145561B2 (en) | Regulatory element for heterologous protein production in the fruiting body of filamentous fungi | |
WO2018236294A1 (en) | GENE EXPRESSION PRODUCT FOR PRODUCING TARGET BIOLOGICAL PROTEINS OR PRODUCTS FROM THERMOTOLERANT YEAST BY INDUCTION AND NON-INDUCTION OF METHANOL, COMPRISING ITS PRODUCT USAGE PROCESS | |
BR112018017088B1 (pt) | Sistema de expressão para organismos eucarióticos | |
KR20220098155A (ko) | 비바이러스성 전사 활성화 도메인들 및 그와 관련된 방법들 및 이용들 | |
Class et al. | Patent application title: Regulation of translation of expressed genes Inventors: Raymond Michael Dimphena Verhaert (Breda, NL) Pieter Victor Schut (Leiden, NL) Sharief Barends (Voorschoten, NL) Maurice Wilhelmus Van Der Heijden (Gouda, NL) Assignees: R1 B3 Holdings BV | |
KR20140043591A (ko) | 감자 유래 고온 스트레스 저항성 유전자 및 이를 이용하여 제조한 고온 스트레스 저항성 형질전환체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |