CN106191040B - 基因打靶方法 - Google Patents
基因打靶方法 Download PDFInfo
- Publication number
- CN106191040B CN106191040B CN201510218188.1A CN201510218188A CN106191040B CN 106191040 B CN106191040 B CN 106191040B CN 201510218188 A CN201510218188 A CN 201510218188A CN 106191040 B CN106191040 B CN 106191040B
- Authority
- CN
- China
- Prior art keywords
- gene
- och1
- seq
- targeting
- ura3
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/905—Stable introduction of foreign DNA into chromosome using homologous recombination in yeast
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/14—Fungi; Culture media therefor
- C12N1/16—Yeasts; Culture media therefor
- C12N1/165—Yeast isolates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/645—Fungi ; Processes using fungi
- C12R2001/84—Pichia
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Mycology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Botany (AREA)
- Medicinal Chemistry (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供一种新型的基因打靶方法以及用于所述方法的核苷酸构建物,所述方法将含干扰基因的核苷酸构建物通过同源重组整合在不依赖于基因的有效基因打靶区域,从而提高基因,尤其是难于打靶的基因的打靶效率。本发明还提供了用于基因表达调控和基因破坏的基因打靶系统,本发明方法可调控或修饰生物体的任何基因。本发明方法利用所有机体细胞中内源性的同源重组过程,因此,可以修饰机体的任何基因。
Description
技术领域
本发明涉及生物技术领域;具体地说,本发明涉及打靶方法以及用于该方法的核苷酸构建物。
背景技术
在生物体基因组中,各基因一般由编码区和调控区两部分组成。编码区或开放读框(ORF)编码具有各种生物学功能的蛋白和RNA链。蛋白编码序列的边界包括5’末端(N-末端)的起始密码子和3’末端(C-末端)的翻译终止无义密码子。编码区之前(5’区)和之后(3’区)的调控区含有各种DNA调控元件,例如启动子、增强子、终止子、多腺苷酸化信号,5'非翻译区(5'UTR)和3’非翻译区(3'UTR),它们控制基因表达过程的各个方面,包括转录、翻译和RNA稳定性等等。
生物基因表达主要有两个步骤:编码的基因从DNA转录成信使RNA(mRNA)或RNA,以及mRNA翻译为蛋白质。基因的表达分别可在转录和翻译步骤通过调控区各种DNA元件进行控制。
基因的转录通过启动子启动、延伸到终止子结束。启动子是基因序列中被RNA聚合酶识别并起始转录的特定区段,它是控制转录起始的序列并决定着基因的表达强度。终止子是基因序列中负责转录终止的特定序列,它提供信号触发转录机器释放新合成的mRNA(或RNA)终止转录。
翻译是以mRNA为模板合成蛋白质的过程。成熟的mRNA由三个部分组成:5'UTR、ORF和3'UTR。翻译起始复合物在5'至3'方向扫描5'UTR直至遇到起始密码子AUG,在该位置核糖体沿mRNA5’端向3’端移动,开始了从N端向C端的蛋白质合成。当核糖体遇到终止密码子(UAA、UAG或UGA)时,蛋白质合成终止,蛋白质从核糖体释放。
实际上,能可预测地调控任何目标基因表达的方法和/或工具将有益于生物学研究和众多生物技术应用。
基因打靶广泛用于破坏或增强染色体基因组中基因的活性。这是一种将外源DNA整合在遗传基因组中的方法,其导致靶基因被修饰、替换或复制。基因打靶是对所有生命体通用的过程并可以用于任何基因,而且与基因的转录和翻译步骤无关。
基因打靶通常经由DNA双链断裂(DSB)的修复介导而实现。这种修复机制通过两种截然不同的分子机制发生:同源重组(HR)途径和非同源末端连接(NHEJ)途径。在同源重组基因打靶中,外源DNA片段(一般为可选择的标记基因)通过两端的同源序列精确整合在基因组的相应序列中。但是在非同源末端连接途径中,外源DNA片段会随机整合在非同源的染色体基因位点上(Paques and Haber 1999,Microbiology and Molecular BiologyReviews,63:349–404)。因此,位点特异性基因打靶的效率由同源重组和非同源末端连接途径之间的相对强度决定。
虽然非同源末端连接途径被认为是造成基因打靶效率低的主要原因,但在具有相同遗传背景的菌株中,同源重组基因打靶的效率也可能是基因依赖性的。这种基因依赖性现象的分子机制不十分清楚。一种可能的原因是各染色体基因组有热点区域,这些热点区域易于发生同源重组(Wahls et al.Plos One3:e2887)。
不同生物系统同源重组基因打靶的效率也大不相同。常规酵母,酿酒酵母(Saccharomyces cerevisiae)和裂殖酵母,粟酒裂殖酵母(Schizosaccharomyces pombe)已经有非常有效的同源重组基因打靶系统。然而,在甲醇营养型酵母,巴斯德毕赤酵母(Pichia pastoris)和其它“非常规”酵母,例如多形汉森酵母(Hansenula polymorpha)、脂耶罗威亚酵母(Yarrowia lipolytica)、树干毕赤酵母(Pichia stipitis)和乳酸克鲁维酵母(Kluyveromyces lactis)中,同源重组基因打靶效率极其低下。包括真菌和真核生物在内的大多数生物也具有极其低下的同源重组基因打靶效率(Klinner U,et al(2004)FemsMicrobiology Reviews 28:201–223;Gregg JM(2010)Pichia Protocols,Secondedition.Totowa,New Jersey:Humanna Press)。。
虽然基因打靶的效率取决于同源重组和非同源末端连接途径之间竞争、也依赖于基因组基因和生物系统,但对于基因的编码和调控区中不同位置的同源重组基因打靶效率知之甚少,特别是在难以破坏的基因中。
因此,本领域急需一种能提高基因打靶效率,特别是针对常规方法难以有效打靶的基因的基因打靶方法。
发明内容
本发明的目的是提供一种能提高基因打靶效率,特别是针对常规方法难以有效打靶的基因的基因打靶方法以及用于这种方法中的物质手段。
在第一方面,本发明提供一种用于调控基因的核苷酸构建物,其结构如下式所示:
5’-A-B-C-3’
其中,A是5’同源序列,B是干扰基因,C是3’同源序列;
所述5’和3’同源序列使得所述核苷酸构建物的重组位点位于该待调控基因的起始密码子的第一个核苷酸到该待调控基因的起始密码子的第一个核苷酸上游的110,优选50个核苷酸之间,或者所述5’和3’同源序列使得所述核苷酸构建物的重组位点位于该待调控基因的终止密码子的第一个核苷酸上游的100、50或20个核苷酸,优选50个核苷酸到该待调控基因的终止密码子的第一个核苷酸下游的300个核苷酸。
在具体的实施方式中,所述重组位点之间间隔0-20个核苷酸,优选0-5个核苷酸,最优选0个核苷酸。
在优选的实施方式中,所述干扰基因可以多于一个,可以相同或不同。
在优选的实施方式中,所述干扰基因可以是标记基因。
在优选的实施方式中,所述核苷酸构建物可以是环状或线形的。
在具体的实施方式中,所述待调控基因可以是重组效率低的基因,优选重组效率<3%,更优选重组效率<1%。
在具体的实施方式中,所述待调控基因是OCH1、ADE1基因。
在优选的实施方式中,所述同源序列的长度为400-1200nt、500-1000nt、600-800nt。
在第二方面,本发明提供一种包含本发明第一方面所述的核苷酸构建物的宿主细胞。
在具体的实施方式中,所述宿主细胞是酵母细胞。
在优选的实施方式中,所述酵母是酿酒酵母(Saccharomyces cerevisiae)、粟酒裂殖酵母(Schizosaccharomyces pombe)、毕赤酵母(Pichia pastoris)、多形汉森酵母(Hansenula polymorpha)、脂耶罗威亚酵母(Yarrowia lipolytica)、树干毕赤酵母(Pichia stipitis)和乳酸克鲁维酵母(Kluyveromyces lactis)。
在优选的实施方式中,所述酵母是毕赤酵母(Pichia pastoris)、多形汉森酵母(Hansenula polymorpha)、脂耶罗威亚酵母(Yarrowia lipolytica)、树干毕赤酵母(Pichia stipitis)和乳酸克鲁维酵母(Kluyveromyces lactis)。
在第三方面,本发明提供一种调控基因表达的方法,所述方法包括:
a)构建本发明第一方面所述的核苷酸构建物;和
b)将步骤a)构建的核苷酸构建物导入细胞,从而通过同源重组整合入待调控基因。
在具体的实施方式中,所述待调控基因可以是重组效率低的基因,优选重组效率<3%,更优选重组效率<1%。
在优选的实施方式中,所述待调控基因是OCH1、ADE1基因
在优选的实施方式中,所述方法还可包括步骤c)检测步骤b)所得细胞中待调控基因的表达。
在第四方面,本发明提供一种改造菌株的方法,包括:
a)构建本发明第一方面所述的核苷酸构建物;和
b)将步骤a)构建的核苷酸构建物转化入待改造的菌株。
在优选的实施方式中,所述方法还可包括步骤c)筛选改造菌株的步骤。
在第五方面,本发明提供一种采用本发明第四方面所述方法改造的菌株的用途,所述菌株用于生产重组蛋白。
在优选的实施方式中,所述重组蛋白中的糖基化模式得到改变。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1是典型的基因图谱,包括5’调控区(5’区)、开放读框(ORF)和3’调控区(3’区)。启动子和增强子决定该基因的哪部分被转录为信使RNA(mRNA)。5’和3’UTR调控mRAN到蛋白质的翻译过程。5'和3'区的核苷酸编号是指编码区的相应起始密码子作为核苷酸1-3,其5’上游区域用减号编号;而相应终止密码子作为核苷酸+1至+3,其3'下游区域用加号编号。载体组分未按比例绘制。
图2描述了构建pUO载体的示意图。载体组分未按比例绘制。
图3描述了构建pUAH(1)打靶载体以便整合入毕赤酵母的OCH1基因的示意图。载体组分未按比例绘制。
图4描述了在毕赤酵母的OCH1基因(SEQ ID NO:126)中不同位置整合的示意图。载体组分未按比例绘制。A.毕赤酵母OCH1基因座中打靶盒的整合位置。OCH1基因座的整合位置由箭头表示并标有核苷酸编号。载体中的基因组分未按比例绘制。B.描述了打靶盒通过双交换同源重组整合入毕赤酵母的OCH1基因(敲入)。交叉表示同源重组。C.显示OCH1基因中不同位置处整合的PCR验证结果。M,DNA大小标记物;泳道1,用P1/P4引物对,JC301中的野生型OCH1得到1433bp;泳道2、3、4,3个位置(-1/1)、(1212/+1)和(+3/+4)的基因整合未得到条带,因为序列太长(4900bp),PCR用P1/P4引物对无法扩增;泳道5,用P1/P2引物对,JC301中的野生型OCH1未得到条带;泳道6、7、8,用P1/P2引物对,3个位置(-1/1)、(1212/+1)和(+3/+4)的基因整合分别得到1300、2550和2550bp带;泳道9,用P3/P4引物对,JC301中的野生型OCH1未得到条带;泳道10、11、12,用P3/P4引物对,3个位置(-1/1)、(1212/+1)和(+3/+4)的基因整合分别得到3500、2500和2300bp条带。
图5描述了在毕赤酵母基因组的ADE1基因(巴斯德毕赤酵母PR-氨基咪唑琥珀酰羧酰胺合酶(ADE1)的DNA序列如SEQ ID NO:127所示)中不同位置整合的示意图。载体组分未按比例绘制。A.毕赤酵母ADE1基因中打靶盒的整合位置。整合位置由箭头表示并标有核苷酸编号。B.描述了打靶盒通过双交换同源重组整合入毕赤酵母的ADE1基因座(敲入)。交叉表示同源重组。C.显示ADE1基因中不同位置处整合的PCR验证结果。M,DNA大小标记物;泳道1-13,用P5/P6引物对,通过PCR验证13个随机选择菌落的基因组DNA。野生型ADE1得到2398bp条带,位置(912/+1)的基因整合得到3763bp条带。
图6描述了构建5’AOX1诱导启动的lacZ表达载体p5’AOX1-URA3-lacZ的示意图,其中URA3位于5’AOX1和lacZ ORF之间。载体组分未按比例绘制。
图7描述了构建一系列5’AOX1诱导启动的lacZ和lacZns表达载体p5’AOX1-lacZ-URA3、p5’AOX1-lacZ-URA3(-)、p5’AOX1-lacZns-URA3和p5’AOX1-lacZns-URA3(-)的示意图,其中URA3以两种取向位于lacZ和lacZns下游。载体组分未按比例绘制。
图8描述了构建一系列5’OCH1启动的lacZ和lacZns表达载体p5’OCH1-lacZ和p5’OCH1-lacZns的示意图。载体组分未按比例绘制。
图9描述了构建5’OCH1启动的lacZ表达载体p5’OCH1-URA3-lacZ的示意图,其中URA3位于5’OCH1和lacZ ORF之间。载体组分未按比例绘制。
图10描述了构建一系列5’OCH1启动的lacZ表达载体p5’OCH1-lacZ-URA3和p5’OCH1-lacZ-URA3(-)的示意图,其中URA3以两种取向位于lacZ的下游。载体组分未按比例绘制。
图11描述了构建一系列5’OCH1启动的lacZns表达载体p5’OCH1-lacZns-URA3和p5’OCH1-lacZns-URA3(-)的示意图,其中URA3以两种取向位于lacZns的下游。载体组分未按比例绘制。
图12显示了lacZ mRNA的相对表达量(%)。A.在毗邻起始和终止密码子的URA3存在下,5’AOX1诱导启动的lacZ mRNA相对表达量(%)。100%对应于无URA3整合下(p5’AOX1-lacZ),5’AOX1诱导启动的lacZ mRNA表达量。B.在毗邻起始和终止密码子的URA3存在下,5’OCH1启动的lacZ mRNA相对表达量(%)。100%对应于无URA3整合下(p5’OCH1-lacZ),5’OCH1启动的lacZ mRNA表达。数据显示为3次实验的平均值±标准偏差(s.d.)。
图13显示了β-半乳糖苷酶在细胞内的相对活性(%)。A.在毗邻起始和终止密码子的URA3存在下,5’AOX1诱导启动的β-半乳糖苷酶活性。100%对应于无URA3整合下(p5’AOX1-lacZ),5’AOX1诱导启动的β-半乳糖苷酶活性。B.在毗邻起始和终止密码子的URA3存在下,5’OCH1启动的β-半乳糖苷酶活性。100%对应于无URA3整合下(p5’OCH1-lacZ),5’OCH1启动的β-半乳糖苷酶活性。数据显示为3次实验的平均值±标准偏差(s.d.)。
图14显示了在毗邻起始和终止密码子含有基因整合的菌株中OCH1 mRNA的相对表达量(%)。100%对应于无基因整合的亲代JC307菌株中的mRNA表达。数据显示为3次实验的平均值±标准偏差(s.d.)。
图15显示mIL-22释放的N-糖链的正离子MALDI-TOF质谱图。A.显示用GS115菌株表达的mIL-22释放的N-糖链的质谱图。B.显示用菌株och1(-1/+1,ADE1URA3)表达的mIL-22释放的N-糖链的质谱图,该菌株在OCH1 ORF上游有基因整合。
具体实施方式
发明人经过广泛而深入的研究,出乎意料地发现了不依赖于基因的同源重组有效基因打靶区域,基于此还开发了用于基因表达调控和基因破坏的基因打靶系统,本发明方法可调控或修饰生物体的任何基因。在此基础上完成了本发明。
本发明系统地分析基因中不同位置的基因打靶,鉴定了基因中同源重组的有效整合区。还开发了基因打靶系统以供基因表达调控和基因破坏。本发明利用所有生物体细胞中内源性的同源重组过程,因此,本发明方法可调控或修饰生物体的任何基因。本发明方法在生物科技产业和生物学研究领域可广泛用于调控基因表达、改进细胞功能和生产异源蛋白质。
以下术语根据下面的定义在本文使用。
“基因”作广义使用,指生物学功能相关的任何核酸区段。
“肽”、“多肽”和“蛋白质”在本文可互换使用,是指任何长度的聚合形式氨基酸。
"基因打靶"是在遗传基因处整合外源DNA的方法,通常导致在靶基因处修饰、替换或复制。这是对所有生命体通用的机制。
"细胞"或"机体"是用于实施本发明的基因打靶的机体的术语。
"细胞转化"表示外源DNA被引入细胞。这通常是外源DNA整合入染色体DNA或引入自我复制质粒所致。
"靶基因"或"靶部位"是指通过本发明的基因打靶方法予以改变的基因或DNA区段。靶基因可以是内源基因或先前引入机体的外源DNA区段。靶基因可以是机体的内源性基因组DNA、基因的任何部分,包括但不限于多肽编码区、开放读框、调控区、内含子、外显子或它们的一部分。
"标记"代表基因序列,其存在或不存在提供机体的可检测表型。不同类型的标记包括但不限于:选择标记、筛选标记和分子标记。选择标记通常是基因,其表达可以使得机体具有对一组特定条件耐受或敏感的表型。筛选标记传递作为可观察和可区分特征的表型。分子标记是可由DNA分析鉴定的基因序列特征。
基因包括编码特定蛋白或功能性RNA的“编码序列”、“编码区”或“开放读框”。蛋白编码序列是转录为mRNA的核酸序列,进而翻译成蛋白质。蛋白编码序列的边界由5’末端(N-末端)的起始密码子和3’末端(C-末端)的翻译终止无义密码子界定。
基因还包括在编码序列之前和之后的“调控区”或“调控元件”。所述调控元件包括但不限于启动子、增强子、内含子、多腺苷酸化信号,5'非翻译区(5'UTR)、3’非翻译区(3'UTR)和它们的任何衍生物。一些调控区转录为RNA分子的一部分,例如5'UTR和3'UTR。术语“5’非翻译区(5′UTR)”应表示成熟mRNA中紧邻任何编码序列上游的核苷酸序列,其不翻译成蛋白质。术语“3’非翻译区(3′UTR)”应表示成熟mRNA中紧邻任何编码序列下游的核苷酸序列,其不翻译成蛋白质。其从任何编码序列的终止密码子之后的第一个核苷酸延伸恰到mRNA的poly(A)尾之前。这些调控元件可以调控基因表达过程的各个方面,包括但不限于转录(例如,启动、延伸和/或终止)、翻译(启动、延伸和/或终止)和RNA稳定性,等等。
“启动子”是能聚合RNA聚合酶并启动下游(3’方向)编码序列转录的核酸调控区。启动子序列在其3’末端以转录起始位点为界,向上游延伸(5’方向),包括启动转录所需的最低数量的碱基或元件。启动子序列中可以找到转录起始位点以及负责结合RNA聚合酶的蛋白质结合域。真核启动子常(但不总是)含有“TATA”盒和“CAT”盒,而原核启动子常含有共有序列TATAAT。许多启动子称为组成型启动子,因为它们在细胞的所有环境中具有活性,但一些是诱导型启动子,其活性通过对特定刺激起反应而受到调控。
“终止子”是核酸序列的某区段,其在转录期间提供信号触发转录机器释放新合成的mRNA(或RNA)终止转录。在原核转录中,两类转录终止子,依赖于Rho和不依赖于Rho的序列负责触发转录终止。在真核mRNA转录中,转录机器识别终止子信号并触发终止过程释放mRNA,随后poly(A)序列通过多腺苷酸化反应加在mRNA的3'端。
对转录的调控根据其作用性质主要可以分为两大类:第一类是DNA模板功能抑止,通过抑止分子与DNA结合改变模板功能;第二类是RNA聚合酶抑止,通过抑止分子与RNA聚合酶结合而抑止其活性(Sandhya Payankaulam,Li M.Li,and David N.Arnosti(2010)Transcriptional repression:conserved and evolved features.Curr Biol.14;20(17):R764–R771)。然而,这两类控制方法不能用作通用方法来专一性地调节任何靶基因的表达。
“翻译”是以mRNA为模板合成蛋白质的过程。成熟的mRNA由三个部分组成:5'UTR、ORF和3'UTR。翻译起始复合物在5'至3'方向扫描5'UTR直至遇到起始密码子AUG,在该位置核糖体沿mRNA5’端向3’端移动,开始了从N端向C端的蛋白质合成。当核糖体遇到终止密码子(UAA、UAG或UGA)时,蛋白质合成终止,蛋白质从核糖体释放。
翻译过程可由RNA-结合蛋白(RBP)和小RNA控制,它们通过结合在mRNA上来调控其翻译。RBP通常结合在位于5’或3’UTR中的特定元件以激活或阻遏翻译。然而,5’UTR内的元件处于扫描/翻译核糖体的途径内,核糖体能在调控元件发生作用前置换它们。通过检测细胞内所有mRNA的降解率和翻译率时发现,对两者影响最高的3’UTR元件是microRNA互补位点,它对mRNA的稳定性和翻译水平分别抑制32%和4%。然而,3’UTR对大多数mRNA的稳定性和翻译效率的影响有限(Noah Spies,Christopher B.Burge,and David P.Bartel(2013),3’UTR-isoform choice has limited influence on the stability and translationalefficiency of most mRNAs in mouse fibroblasts,Genome Research,23:2078–2090)。因此,通过RBP和小RNA结合在mRNA上来调节蛋白质翻译应该不会是一种有效的方法。
细胞具有监督系统来识别和消除异常mRNA以避免产生可能有害的蛋白质产物。例如,细胞能识别缺少终止密码子的异常mRNA(无终止mRNA)并在3’端形成Ski复合物以介导该无终止mRNA的降解。这种无终止mRNA衰减可避免产生可能有害的延伸产物,这种产物相对于野生型基因产物具有显性负活性(van Hoof A,Frischmeyer PA,Dietz HC,Parker R(2002)Exosome mediated recognition and degradation of mRNAs lacking atermination codon.Science 295:2262–2264)。
实际上,目前缺少调控基因组基因表达的有效方法。任何能够可预测专一性地调控基因组中目标基因表达的方法和/或工具都将有益于生物学研究和生物技术发展。
基因打靶技术是一种将外源DNA整合在染色体遗传基因组中的方法,从而导致靶基因处的基因被修饰、替换或复制,它广泛用于破坏基因活性。
“Ends-in”和“Ends-out”是指可用于经同源重组整合外源DNA进入基因组的两种不同设置。在通过“Ends-in”重组的基因打靶中,当外源DNA与基因组中的同源区域配对时,线形外源DNA的末端指向彼此,通过单交换重组(single cross-over recombination,“roll in”)将DNA整合进入基因组,产生靶基因同向重复序列。但是重复的靶基因可以再通过自身的同源重组切除外源DNA,恢复靶基因原来的野生型状态。在通过“ends-out”重组的基因打靶中,当外源DNA与基因组中的同源区域配对时,线形外源DNA的末端背离彼此,通过末端靶向侧翼和宿主基因组同源序列之间的双交换重组将DNA插入基因组中。“Ends-out”打靶常用于小鼠和酵母,因为它可以直接替换或删除靶基因。不过,“ends-out”事件发生的概率远低于“ends-in”事件。(Paques and Haber 1999,Microbiology and MolecularBiology Reviews,63:349–404)。在本发明中,基因打靶是指“ends-out”双交换重组,除非专门表明是通过单交换的“ends-in”打靶(roll-in)。
基因打靶是对所有生命体通用的过程并可以用于任何基因,而且不受其转录和翻译活性影响。然而,该技术受限于以下两个局限性:同源重组效率低和随机(非靶向)整合率高。
基因打靶藉由两种截然不同的分子机制发生:同源重组(HR)途径和非同源末端连接(NHEJ)途径。两种重组途径通常经由DNA断裂双链(DSB)的修复介导。在同源重组基因打靶中,外源DNA片段,通常是两端有同源序列的可选择标记基因,精确整合在其同源基因组的相应序列中。但是在非同源末端连接途径中,含可选择标记基因的外源DNA片段会随机整合在非同源的染色体位点上。位点特异性基因打靶的效率通常由同源重组和非同源末端连接途径之间的相对强度决定。
不同生物系统同源重组基因打靶的效率也大不相同。常规酵母,酿酒酵母(Saccharomyces cerevisiae)和裂殖酵母,粟酒裂殖酵母(Schizosaccharomyces pombe)具有非常有效的同源重组基因打靶系统。在酿酒酵母中,当打靶片段是30至45bp时,同源重组基因打靶替换的效率最高可达到转化菌的95%(Paques and Haber 1999,Microbiologyand Molecular Biology Reviews,63:349–404)。然而,大多数生物具有极低的同源重组基因打靶效率。在甲醇营养型酵母,巴斯德毕赤酵母(Pichia pastoris)和其它“非常规”酵母,包括多形汉森酵母(Hansenula polymorpha)、脂耶罗威亚酵母(Yarrowialipolytica)、树干毕赤酵母(Pichia stipitis)和乳酸克鲁维酵母(Kluyveromyceslactis)中,基因打靶效率极低。基因打靶替换的效率高度依赖于打靶片段中同源序列的长度。当打靶同源序列小于500bp时,效率可能低于0.1%,但是当利用大的1kb的打靶同源序列时,对于一些靶基因可以高于50%(Klinner U,et al(2004)Fems MicrobiologyReviews 28:201–223;Gregg JM(2010)Pichia Protocols,Second edition.Totowa,NewJersey:Humanna Press)。包括真菌和真核生物在内的大多数生物同源重组基因打靶效率也很低。
此外,在具有相同遗传背景的菌株中同源基因打靶的效率还是基因依赖性的。例如,当打靶同源序列的长度在200-900bp时,毕赤酵母GS115菌株中的ARG1、ARG2、ARG3、HIS1、HIS2、HIS5和HIS6以44-90%的高效率发生同源重组(Nett,et al(2005)Yeast 22:295–304)。但当利用约1kb或更长的同源序列去敲除毕赤酵母基因组中OCH1和SGS1基因时,其效率低于1%(Choi,et al.(2003)Proc Natl Acad Sci U S A 100:5022–5027;Chen,etal.(2013)PLoS ONE8(3):e57952)。这种基因依赖性现象的分子机制不十分清楚。一种可能的原因是各染色体有热点区域,这些热点区域易于发生同源重组(Wahls et al.Plos One3:e2887)。
虽然基因打靶的效率取决于同源重组和非同源末端连接途径之间竞争、也依赖于基因组基因和生物系统,但对于基因的编码和调控区中不同位置的同源重组基因打靶效率知之甚少,特别是在难以破坏的基因中。
本发明利用OCH1,一种低效的打靶基因,和ADE1,一种常见的打靶基因,作为模型来系统性分析基因组基因中各种位置的同源基因打靶。本项研究有助于将基因打靶技术体系应用于基因表达调控和基因破坏。
本发明开发了打靶载体,包括标记基因、同源序列和复制起点的诸部分。这些部分可以相连形成环状载体。如果需要的话,该环状载体在诸部分之间可以含有其它部分和接头。然而,本发明也应包括功能等价的其它形式打靶载体。打靶载体也可称为载体。用于重组DNA技术的载体通常是"质粒"的形式。在本说明书中,术语"载体"和"质粒"可互换使用。
"标记"代表基因或序列,其存在或不存在提供机体的可检测表型。可利用一种或多种标记选择和筛选基因打靶事件。可用于本发明的不同类型的标记包括但不限于:选择标记、筛选标记和分子标记。
选择标记基因的表达可以使得机体具有对一组特定条件耐受或敏感的表型。选择标记包括对抗生素,例如卡那霉素、潮霉素、zeocin、博莱霉素、壮观霉素、链霉素、庆大霉素等耐受的基因。
可选择标记体系由营养缺陷突变型宿主菌株和野生型生物基因构成,补充宿主对不完全培养基的缺陷,例如酵母菌中的HIS4、LEU2、URA3、ADE1、LYS2和TRP1基因,和本领域已知的其它基因。例如,酿酒酵母或毕赤酵母HIS4基因可用于his4毕赤酵母菌株的转化。
筛选标记传递可观察和可区分的特征。可筛选标记包括荧光蛋白,例如绿色荧光蛋白(GFP)、报道酶,例如β-半乳糖苷酶(lacZ)、碱性磷酸酶(AP)、β-内酰胺酶、β-葡萄糖醛酸酶、谷胱甘肽S-转移酶(GST)、荧光素酶和本领域已知的其它酶。
分子标记是可由DNA分析鉴定的基因序列特征。
标记基因侧接两个同源重组区。所述同源重组区之一的上游侧与靶基因的上游区域同源,所述同源重组区之一的下游侧与靶基因的下游区域同源。在上、下游同源重组区之间单个或多个标记基因相互间可以以相同或相对的取向相连结。
所述同源重组区使得重组位点在待调控基因的起始密码子的第一个核苷酸到该待调控基因的起始密码子的第一个核苷酸上游的110、优选50个核苷酸之间,或者所述5’和3’同源序列使得所述核苷酸构建物的重组位点位于待调控基因的终止密码子的第一个核苷酸上游的100、50或20个核苷酸,优选50个核苷酸到该待调控基因的终止密码子的第一个核苷酸下游的300个核苷酸。
在本文,某区域与相应基因区域同源表示该区域与所述基因区域的碱基序列有至少90%、优选至少92%、更优选至少94%、还要更优选至少96%、还要更优选至少98%、还要更优选至少99%、最优选100%相同。优先的选择是这种“同源区域”源自所述的基因区域。
同源重组区域的长度不作特别限定。该区域的长度优选适于发生同源重组。因此,该区域的长度至少40个碱基对。
当考虑将本发明的载体转入细菌细胞传代时,优选载体中包含细菌复制起点和抗生素耐受性基因,以确保细菌传代过程中保有该载体。细菌复制起点(ori)包括fl-ori、colisin、col El和本领域已知的其它起点。抗生素耐受性基因包括氨苄青霉素、卡那霉素、四环素、Zeocin耐受性基因和本领域已知的其它抗生素耐受性基因。复制起点和抗生素耐受性基因可以连接在不同部分之间。
本发明提供线形“打靶盒”,可利用限制性酶消化使之从打靶载体线形化,或者可通过基因化学合成得到。为简便起见,该“打靶盒”在本文还可称为“打靶片段”、“基因破坏片段”、或“基因整合的片段”。该打靶盒用于破坏靶基因并将外源基因整合入宿主的染色体基因组中,从而该外源基因能在该宿主中行使功能。
打靶盒的实质性部分包括标记基因和同源区。打靶盒可含有其它部分,如果需要,可在诸部分之间含有接头。标记基因的上游和下游侧侧接同源区域。
将打靶盒或载体引入宿主细胞以供同源重组。可按照本领域技术人员熟知的方法进行宿主细胞的转化和转染。
合适的转化方法包括病毒感染、转染、接合、原生质体融合、电穿孔、基因枪技术、磷酸钙沉淀、直接显微注射等等。方法的选择通常依赖于所转化的细胞类型和进行转化的条件。这些方法的常规讨论见Ausubel,et al.,Short Protocols in Molecular Biology,3rd ed.,Wiley&Sons,1995。
例如,可采用不同的方法实施酵母转化,包括球形体方法、电穿孔、聚乙二醇方法、碱性阳离子方法等等[Gregg JM(2010)Pichia Protocols,Second edition.Totowa,NewJersey:Humanna Press]。
可用于本发明的宿主细胞的例子包括典型的真核的和原核宿主,例如大肠杆菌(E.coli)、假单胞菌属(Pseudomonas spp.)、芽胞杆菌属(Bacillus spp.)、链霉菌属(Streptomyces spp.)、真菌、酵母菌,例如酿酒酵母、毕赤酵母,昆虫细胞,例如草地贪夜蛾(Spodoptera frugiperda)(SF9),动物细胞,例如中国仓鼠卵巢细胞(Chinese hamsterovary cell)(CHO)和小鼠细胞,非洲绿猴细胞,培养的人类细胞和植物细胞。酵母是优选的本发明宿主细胞。毕赤酵母是更优选的宿主细胞。
然后可基于可选标记的表型选择标记选择转化的细胞。
本发明评估了5’-调控区、编码区和3’-调控区的位点特异性同源重组整合,鉴定了高频率基因整合的区域。以前的报道说,当利用1kb或更大同源区域时,同源重组基因打靶的效率依赖于基因组基因,与之相反,本发明发现,当利用小于1kb同源(区域)时,5’-和3’-调控区的同源重组基因整合效率不依赖于基因,其水平显著较高。此外,编码区3’端基因整合的频率高于其它编码区。基因组基因的不同区域中打靶整合的频率可以表示为以下次序:5’-调控区和3’-调控区﹥﹥编码区的3’端﹥其它编码区。
本发明开发了通过在5’-调控区作基因整合来精确控制靶基因表达的方法。整合基因可以是有助于鉴定具有基因整合的转化株的任何标记基因,包括可选择标记体系、筛选标记和分子标记。标记基因ORF可与不同启动子、分泌信号序列(如果需要的话)和转录终止子按一定的位置和方向排列,融合形成表达盒。这些区段的排列位置和方向是本领域普通技术人员已知的。这些标记基因表达盒可以在基因组的DNA双链中,与靶ORF以相同或相对的方向整合在5’-调控区的任何位置,更优选5’-调控区中接近靶ORF的位置,最优选在同一链中,相同取向的紧邻靶ORF上游的位置。也可以将标记基因ORF和转录终止子融合体,整合在5’-调控区同一链中,相同取向接近靶ORF的位置,最优选整合在紧邻靶ORF上游的位置,如此可利用靶基因的5’-调控区以启动标记基因的表达。
5’调控区特别是在紧邻靶ORF上游位置的基因整合可以抑制转录和翻译的效率,从而有效地抑制特定靶基因表达。目前调控基因转录的方法主要包括:通过抑止分子与DNA结合改变模扳功能,通过抑止分子与RNA聚合酶结合而抑止其转录活性。调控蛋白翻译的方法主要采用小RNA和RNA-结合蛋白与mRNA结合来改变其翻译能力。相比之下,在基因组基因中,特别是在ORF上游进行的基因整合是更有效的精确控制靶基因表达的方法。
在另一方面,可通过在接近靶ORF起始密码子的5’区中的任何位置,更优选起始密码子上游,最优选起始密码子上游3-10个碱基的位置整合打靶盒引进强启动子来上调任何靶ORF表达,所述打靶盒由在下游与强启动子融合的标记基因表达盒构成。
另一方面,本发明开发了通过在基因组的DNA双链中,以相同或相对取向在3’-调控区,最优选在紧邻终止密码子下游的位置整合选择标记盒来降低靶ORF基因表达的方法。
另一方面,本发明开发了通过在基因组的DNA双链中,以相同或相对取向在编码区3’端附近整合选择标记盒来降低靶ORF基因表达的方法。
下表1比较了毕赤酵母的OCH1和ADE1基因中不同位置的同源重组整合频率。这些位置由基因组基因的核苷酸编号确定,所述编号是指编码区的相应起始密码子作为核苷酸1-3和相应终止密码子作为核苷酸+1至+3。正确的整合子是通过PCR验证的具有正确基因整合的克隆。打靶频率定义为通过PCR验证的正确整合子与检查的总克隆之比。
表1
基于本发明的基因打靶的方法,技术人员能够改造菌株,具体地说,能够改造菌株中利用常规打靶方法同源重组效率低于3%,优选低于1%的基因。进一步地,本发明提供了改造菌株的方法,这种改造的的菌株可用于生产重组蛋白。在具体的实施方式中,所述重组蛋白中的糖基化模式得到改变。例如,通过破坏OCH1基因,使改造的菌株不会对表达的蛋白过度糖基化修饰而产生不同于哺乳动物细胞的高甘露糖链Man9-100GlcNAc2;通过破坏菌株中的蛋白酶基因,可以减少重组蛋白的降解;等等。通过本发明方法改造的菌株还可用于代谢工程改造、遗传学研究以及生物技术应用等各个领域。
本发明的优点:
1.本发明鉴定到不依赖于基因的有效同源重组基因打靶的区域;
2.本发明方法可调控或修饰生物体的任何基因;
3.本发明方法在生物科技产业和生物学研究领域可广泛用于调控基因表达、改进细胞功能和生产异源蛋白质。
实施例
材料
用于文库的产生、验证和应用的化学试剂、酶、培养基和溶液是常用的并且是分子和细胞生物学领域的技术人员熟知的;它们可以从许多公司获得,包括Thermo FisherScientific、Invitrogen、Sigma、New England BioLabs、Takara Biotechnology、Toyobo、TransGen Biotech和Generay Biotechnology等等。其中许多以试剂盒的形式提供。
pPIC3.5K和pPICZ载体获自Invitrogen。
pBLHIS-SX、pBLURA-SX、pBLADE-SX载体获自Keck Graduate Institute,Claremont,加拿大。
大肠杆菌(E.coli)菌株Trans1-T1获自TransGen Biotech。
毕赤酵母营养缺陷型菌株JC301(ade1 his4 ura3)和JC307(his4 ura3)获自KeckGraduate Institute(KGI),GS115(his)获自Invitrogen。
核苷酸序列数据主要获自公共数据库NCBI(www.ncbi.nlm.nih.gov)。
方法
除非另有表示,按照分子和细胞生物学领域技术人员熟知的标准方法进行本发明所用的方法,包括聚合酶链式反应(PCR)、限制性酶克隆、DNA纯化、细菌和原核细胞培养、转化、转染和蛋白质印迹,例如以下手册所述的:Sambrook J et al.(Molecular Cloning ALaboratory Manual(Third Edition),Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y.,2001),Ausubel F M et al.(Current Protocols in MolecularBiology,Wiley InterScience,2010),and Gregg JM(Pichia Protocols,(Secondedition),Totowa,New Jersey:Humanna Press,2010)。
大肠杆菌菌株Trans1-T1用于构建和扩增质粒。菌株用含合适抗生素的Luria-Bertani(LB)培养基(10g/L胰蛋白胨、5g/L酵母提取物和5g/L氯化钠)或LB平板(15g/L琼脂)培养。抗生素的加入浓度如下所述:100mg/L氨苄青霉素、50mg/L卡那霉素和25mg/LZeocin)。
毕赤酵母菌株利用YPD培养基(10g/L酵母提取物、20g/L蛋白胨、20g/L葡萄糖)和YPD平板(10g/L酵母提取物、20g/L蛋白胨、20g/L葡萄糖、15g/L琼脂)培养。利用不含氨基酸的YNB培养基(67g/L酵母氮源(yeast nitrogen base)、5g/L葡萄糖)和不含氨基酸的YNB平板(67g/L酵母氮源、5g/L葡萄糖,15/L琼脂)来选择毕赤酵母营养缺陷型菌株,视需要适当添加(抗生素)。一些毕赤酵母营养缺陷型菌株利用SC培养基(8g/L SC不含组氨酸和尿嘧啶,20g/L葡萄糖)和SC平板(8g/L SC不含组氨酸和尿嘧啶,20g/L葡萄糖,15/L琼脂)选择,视需要适当添加(抗生素)。抗生素的加入浓度如下所述:500mg/L G-418硫酸盐和100mg/LZeocin。
采用乙酸锂-SDS裂解,然后进行乙醇沉淀提取毕赤酵母中的基因组DNA,该方法描述于以下出版物:Looke et al.2011,Biotechniques.50:325–328。
利用MicroPulserTM电穿孔设备,按照生产商(BioRad)的操作使用说明书,通过电穿孔进行毕赤酵母的转化。
实施例1
构建基础载体
图2描述了构建pUO载体的示意图。
PCR1,用基因组DNA作为模板,用KpnIOch1(+54)F(SEQ ID NO:1,该引物具有Kpn I限制性酶切位点)和Och1(+801)BamHI R(SEQ ID NO:2,该引物具有BamH I限制性酶切位点)引物对作PCR扩增毕赤酵母OCH1 3’序列(3’H);
PCR2,利用pBlunt-URA3SK载体作为模板,利用XhoIURA3 F(SEQ ID NO:3,该引物具有Xho I限制性酶切位点)和DRKpnI R(SEQ ID NO:4,该引物具有Kpn I限制性酶切位点)引物对作PCR扩增毕赤酵母URA3表达盒和SacI-KpnI片段。通过将URA3和SacI-KpnI片段的PCR融合片段连接于pBlunt载体(TransGen Biotech,中国)获得pBlunt-URA3SK载体。
然后,分别用Kpn I和BamH I消化OCH1 3’H的PCR产物,用Xho I和Kpn I消化URA3表达盒。将OCH1 3’H的KpnI-BamHI片段和URA3表达盒的XhoI-KpnI片段插入pBlunt-XB载体的Xho I和BamH I位点以产生pUO3H载体。将含XhoI和BamHI位点的片段连接于pBlunt载体(TransGen Biotech)获得pBlunt-XB。
PCR3,用基因组DNA作为模板,利用SphIOch1(274)F(SEQ ID NO:5,该引物具有SphI限制性酶切位点)和Och1(+53)XhoI R(SEQ ID NO:6,该引物具有Xho I限制性酶切位点)引物对作PCR扩增毕赤酵母OCH1 5’序列(5’H);
然后,分别用Sph I和Xho I消化OCH1 5’H的PCR产物,用Xho I和BamH I消化pUO3H载体。将OCH1 5’H的SphI-XhoI片段和URA3表达盒与OCH1 3’H相连的XhoI-BamHI片段插入pUC19-EBSH载体的BamH I和Sph I位点。用含EcoR I、BamH I、Sph I和Hind III限制性酶切位点的片段替换有多克隆位点的pUC19 EcoRI-HindIII片段得到pUC19-EBSH载体。产生的pUO载体用作基础载体以构建其它不同的OCH1打靶载体。
实施例2
构建OCH1打靶载体
图3描述了构建整合入毕赤酵母OCH1基因的打靶载体的示意图。
PCR4,用毕赤酵母基因组DNA作为模板,用SacIADE1 F(SEQ ID NO:7,该引物具有Sac I限制性酶切位点)和ADE1KpnI R(SEQ ID NO:8,该引物具有Kpn I限制性酶切位点)引物对扩增ADE1表达盒。
PCR5,用pBLURA-SX(Keck Graduate Institute)作为模板,用SacIURA3 F(SEQ IDNO:9,该引物具有Sac I限制性酶切位点)和URA3XhoI R(SEQ ID NO:10,该引物具有Xho I限制性酶切位点)引物对扩增毕赤酵母URA3表达盒。
然后,分别用Sac I和Kpn I消化ADE1表达盒的PCR产物,用Sac I和Xho I消化URA3表达盒的PCR产物。将ADE1的SacI-KpnI片段和URA3的SacI-XhoI片段插入pUO载体的Xho I和KpnI位点以产生pUAH载体。
PCR6,用基因组DNA作为模板,用SphIOch1(-733)F(SEQ ID NO:11,该引物具有SphI限制性酶切位点)和Och1(-1)XhoI R(SEQ ID NO:12,该引物具有Xho I限制性酶切位点)引物对作PCR扩增毕赤酵母OCH1 5’同源序列(5’H,-733/-1)。
用限制性酶消化PCR产物后,将OCH1 5’H的SphI-XhoI片段(-733/-1)插入pUAH的相同限制性酶位点以产生pUA5H。
PCR7,用基因组DNA作为模板,用KpnIOch1(1)F(SEQ ID NO:13,该引物具有Kpn I限制性酶切位点)和Och1(646)BamHI R(SEQ ID NO:14,该引物具有BamH I限制性酶切位点)引物对作PCR扩增毕赤酵母OCH1 3’同源序列(3’H,1/646)。
用限制性酶消化PCR产物后,将OCH1 3’H的KpnI-BamHI片段(1/646)插入pUA5H的相同限制性酶位点以产生OCH1打靶载体pUAH(1),其用于整合入OCH1 5’调控区中紧邻起始密码子上游的位置(-1/1)。
以相同的方式,通过将OCH1 5’和3’同源性(序列)的相应PCR产物插入pUAH来构建一系列OCH1打靶载体,它们整合在OCH1基因的不同位置。
引物对SphIOch1(-118)F(SEQ ID NO:15)和Och1(553)XhoI R(SEQ ID NO:16)以及引物对KpnIOch1(554)F(SEQ ID NO:17)和Och1(+103)BamHI R(SEQ ID NO:18)用于构建pUAH(554)以便整合在OCH1编码区的中的位置(553/554)。
引物对SphIOch1(274)F(SEQ ID NO:19)和Och1(1096)XhoI R(SEQ ID NO:20)以及引物对KpnIOch1(1097)F(SEQ ID NO:21)和Och1(+801)BamHI R(SEQ ID NO:22)用于构建pUAH(1097)以便整合在OCH1编码区中的位置(1096/1097)。
引物对SphIOch1(274)F(SEQ ID NO:19)和Och1(1165)XhoI R(SEQ ID NO:23)以及引物对KpnIOch1(1166)F(SEQ ID NO:24)和Och1(+801)BamHI R(SEQ ID NO:22)用于构建pUAH(1166)以便整合在OCH1编码区中的位置(1165/1166)。
引物对SphIOch1(274)F(SEQ ID NO:19)和Och1(1212)XhoI R(SEQ ID NO:25)以及引物对KpnIOch1(+1)F(SEQ ID NO:26)和Och1(+801)BamHI R(SEQ ID NO:22)用于构建pUAH(+1)以便整合在OCH1编码区中紧邻终止密码子上游的位置(1212/+1)。
引物对SphIOch1(274)F(SEQ ID NO:19)和Och1(+3)XhoI R(SEQ ID NO:27)以及引物对KpnIOch1(+4)F(SEQ ID NO:28)和Och1(+801)BamHI R(SEQ ID NO:22)用于构建pUAH(+4)以便整合在OCH1 3’调控区中紧邻终止密码子下游的位置(+3/+4)。
引物对SphIOch1(274)F(SEQ ID NO:19)和Och1(+203)XhoI R(SEQ ID NO:29)以及引物对KpnIOch1(+204)F(SEQ ID NO:30)和Och1(+801)BamHI R(SEQ ID NO:22)用于构建pUAH(+204)以便整合在OCH1 3’调控区中的位置(+203/+204)。
引物对SphIOch1(-860)F(SEQ ID NO:31)和Och1(-110)XhoI R(SEQ ID NO:32)以及引物对KpnIOch1(-109)F(SEQ ID NO:33)和Och1(+641)BamHI R(SEQ ID NO:34)用于构建pUAH(-109)以便整合在OCH1 5’调控区起始密码子上游的位置(-110/-109)。
实施例3
OCH1基因中不同位置的打靶盒整合
图4A绘制了毕赤酵母的OCH1基因座中打靶整合位置。为进行整合,利用以下引物对,将一系列构建的OCH1打靶载体,包括pUAH(-109,1,554,1097,1166,+1,+4和+204)进行PCR扩增以产生线形形式的UAH(-109,1,554,1097,1166,+1,+4和+204)的OCH1打靶盒:
Och1(-709)F(SEQ ID NO:35)/Och1(491)R(SEQ ID NO:36)
Och1(-600)F(SEQ ID NO:37)/Och1(600)R(SEQ ID NO:38)
Och1(-47)F(SEQ ID NO:39)/Och1(1153)R(SEQ ID NO:40)
Och1(496)F(SEQ ID NO:41)/Och1(+484)R(SEQ ID NO:42)
Och1(565)F(SEQ ID NO:43)/Och1(+553)R(SEQ ID NO:44)
Och1(612)F(SEQ ID NO:45)/Och1(+600)R(SEQ ID NO:46)
Och1(615)F(SEQ ID NO:47)/Och1(+603)R(SEQ ID NO:48)
Och1(816)F(SEQ ID NO:49)/Och1(+803)R(SEQ ID NO:50)。
OCH1打靶盒含有URA3和ADE1表达盒,它们在DNA双链上,以相对取向彼此相邻定位。两种表达盒均侧接600bp相同长度的5’和3’整合同源序列(5’H和3’H),它们是基因特异性的同源序列以确保OCH1基因中打靶位置的精确整合。
利用MicroPulserTM电穿孔设备,按照生产商(BioRad,美国)的操作使用说明书,通过电穿孔将打靶盒转化入毕赤酵母营养缺陷型菌株JC301(ade1 his4 ura3)(KeckGraduate Institute)。转化的细胞在补充了20mg/L组氨酸的YNB平板上培养以选择腺嘌呤和尿嘧啶原养型。
图4B描述了打靶盒在毕赤酵母中紧邻OCH1基因的起始密码子上游的位置(-1/1)的代表性同源整合。在各转化板上,随机挑取菌落并培养以提取基因组DNA供PCR验证基因组的整合。两个引物对,P1(SEQ ID NO:51,位于基因组中5’同源区域的上游)/P2(SEQ IDNO:52,位于打靶片段的URA3内)和P3(SEQ ID NO:53,位于打靶片段的ADE1内)/P4(SEQ IDNO:54,位于基因组中3’同源区域的下游)用于验证打靶位置的同源整合(图4B)。图4C显示OCH1基因座中不同位置整合的PCR验证结果。通过P1/P2引物对分别扩增出预计的1300、2550和2550bp条带。这些菌株在利用P3/P4引物对的PCR中也扩增出预计的3500、2300和2300kb条带。PCR结果验证了相应的打靶片段分别成功整合在指定位置(-1/1,1212/+1,+3/+4)。亲代菌株JC301作为负对照,通过P1/P4引物对扩增1433bp条带,但通过P1/P2和P3/P4引物对没有扩增到条带。紧邻OCH1基因座的起始密码子上游整合的菌株称为och1(-1/+1,ADE1URA3)菌株。
本实施例证明,当利用600bp相同长度的同源序列时,OCH1基因中不同位置的同源重组整合效率显著不同(表1)。在编码区中这些位置(553/554,1096/1097,and 1165/1166)整合的整合转化株无法在100个筛选的菌落中鉴定到。由于在OCH1编码区的整合导致OCH1基因功能破坏并丧失细胞适应性,同源整合不是破坏基因组中OCH1编码区的优选机制。相反,打靶盒通过非同源末端连接随机整合入基因组。这与以前的报道一致,当利用约1kb或更长的同源序列时,毕赤酵母中OCH1的破坏效率显著较低,仅为0.1%,但其它试验室难以获得相同的结果(Choi,2003,Proc Natl Acad Sci U S A 100:5022–5027;Chen,2013,PLoS ONE 8(3):e57952)。
毕赤酵母在同源基因打靶中效率极低是众所周知的。同源重组基因替换事件的频率高度依赖于打靶片段的长度。当打靶同源序列低于500bp时,频率小于0.1%。
然而,与以前的报道不同的是,本发明发现,当利用600bp的短同源序列时,紧邻终止密码子上游位置(1212/+1)的同源整合频率约为7%。这可能归结为OCH1功能的不完全破坏,因为整合导致OCH1基因转录生成OCH1无终止mRNA,其随后翻译生成具有一定功能活性的C-末端延伸OCH1产物。当形成的C-末端延伸产物保留一定活性时,邻近ORF的3’端位点的同源整合频率可能高于其它ORF区域中位点。
此外,本发明还发现在OCH1 5’-和3’-调控区中位置的同源重组的频率显著较高,例如在起始密码子上游的位置(-110/-109,-1/1)为40%、35%,终止密码子下游的两位置(+3/+4,+203/+204)为80%、25%。
实施例4
ADE1基因中不同位置的打靶盒整合
在ADE1基因中不同位置进行打靶盒整合以进一步验证OCH1基因打靶的结果。
图5A描述了基因组ADE1基因中打靶盒的整合位置。
图5B显示了通过PCR构建ADE1打靶盒的示意图。
PCR1,用毕赤酵母基因组DNA作为模板,用ADE1(-800)F(SEQ ID NO:55)和ADE1(-1)U R(SEQ ID NO:56)(该引物具有URA3重叠序列以供融合PCR)引物对作PCR扩增ADE1基因座的5’-同源序列(5’H,-800/-1);
PCR2,用pBLURA-SX载体作为模板,用A(-21)URA3 F(SEQ ID NO:57)和URA3A(19)R(SEQ ID NO:58)(二者均具有ADE1重叠序列以供融合PCR)引物对扩增URA3表达盒。
PCR3,用毕赤酵母基因组DNA作为模板,用UADE1(1)F(SEQ ID NO:59)(该引物具有URA3重叠序列以供融合PCR)和ADE1(800)R(SEQ ID NO:60)引物对作PCR扩增ADE1基因的3'-同源序列(3’H,1/800)。
用ADE1(-800)F(SEQ ID NO:55)和ADE1(800)R(SEQ ID NO:60)引物对,通过重叠延伸PCR连接以上3种PCR产物(1,2,3)。如此产生了线形打靶盒UH(1),其整合在ADE1 5’调控区中紧邻起始密码子上游的位置(-1/1)。
以相同的方式,利用以下相应的引物对,通过PCR扩增和融合构建一系列ADE1打靶盒,它们整合在ADE1基因的不同位置:
引物对ADE1(-98)F(SEQ ID NO:61)和ADE1(703)U R(SEQ ID NO:62)(其具有URA3重叠序列以供融合PCR),引物对A(684)URA3 F(SEQ ID NO:63)和URA3A(728)R(SEQ ID NO:64)(二者均具有ADE1重叠序列以供融合PCR)和引物对ADE1(704)F(SEQ ID NO:65)(其具有URA3重叠序列以供融合PCR)和ADE1(+591)R(SEQ ID NO:66)用于构建打靶盒UH(704)以便整合在ADE1编码区中的位置(703/704)。
引物对ADE1(62)F(SEQ ID NO:67)和ADE1(862)U R(SEQ ID NO:68)(其具有URA3重叠序列以供融合PCR)、引物对A(842)URA3 F(SEQ ID NO:69)和URA3A(881)R(SEQ ID NO:70)(二者均具有ADE1重叠序列以供融合PCR)和引物对UADE1(863)F(SEQ ID NO:71)(其具有URA3重叠序列以供融合PCR)和ADE1(+750)R(SEQ ID NO:72)用于构建打靶盒UH(863)以便整合在ADE1编码区中的位置(862/863)。
引物对ADE1(62)F(SEQ ID NO:67)和ADE1(912)U R(SEQ ID NO:73)(其具有URA3重叠序列以供融合PCR)、引物对A(896)URA3 F(SEQ ID NO:74)和URA3A(+21)R(SEQ ID NO:75)(二者均具有ADE1重叠序列以供融合PCR)和引物对UADE1(+1)F(SEQ ID NO:76)(其具有URA3重叠序列以供融合PCR)和ADE1(+750)R(SEQ ID NO:72)用于构建打靶盒UH(+1)以便整合在编码区中紧邻ADE1终止密码子上游的位置(912/+1)。
引物对ADE1(62)F(SEQ ID NO:67)和ADE1(+3)U R(SEQ ID NO:77)(其具有URA3重叠序列以供融合PCR)、引物对A(896)URA3 F(SEQ ID NO:78)和URA3A(+23)R(SEQ ID NO:79)(二者均具有ADE1重叠序列以供融合PCR)和引物对UADE1(+4)F(SEQ ID NO:80)(其具有URA3重叠序列以供融合PCR)和ADE1(+750)R(SEQ ID NO:72)用于构建打靶盒UH(+4)以便整合在3’调控区中紧邻ADE1终止密码子下游的位置(+3/+4)。
引物对ADE1(298)F(SEQ ID NO:81)和ADE1(+203)U R(SEQ ID NO:82)(其具有URA3重叠序列以供融合PCR)、引物对A(+186)URA3 F(SEQ ID NO:83)和URA3A(+226)R(SEQID NO:84)(二者均具有ADE1重叠序列以供融合PCR)和引物对ADE1(+204)F(SEQ ID NO:85)(其具有URA3重叠序列以供融合PCR)和ADE1(+1004)R(SEQ ID NO:86)用于构建打靶盒UH(+204)以便整合在ADE1 3’调控区中的位置(+203/+204)。
引物对ADE1(-895)F(SEQ ID NO:87)和ADE1(-110)U R(SEQ ID NO:88)(其具有URA3重叠序列以供融合PCR)、引物对A(-133)URA3 F(SEQ ID NO:89)和URA3A(-87)R(SEQID NO:90)(二者均具有ADE1重叠序列以供融合PCR)和引物对UADE1(-109)F(SEQ ID NO:91)(其具有URA3重叠序列以供融合PCR)和ADE1(691)R(SEQ ID NO:92)用于构建打靶盒UH(-109),以便整合在ADE1 5’调控区起始密码子上游的位置(-110/-109)。
这些线形打靶盒含有URA3表达基因,在两侧侧接长度相似在800bp左右(750-850)的5’和3’同源序列,这些序列是基因特异性同源序列以便精确整合在毕赤酵母ADE1基因的打靶位置。
通过电穿孔将这些打靶盒转化入毕赤酵母营养缺陷型菌株JC307(his4 ura3)(Keck Graduate Institute,USA)的细胞。转化的细胞生长在补加了20mg/L组氨酸的SC平板(8g/L SC不含组氨酸和尿嘧啶,20g/L葡萄糖,15g/L琼脂)上以选择尿嘧啶原养型。在2-3天培育期间,从平板随机挑取菌落以避免因白色/淡红色菌落而引起菌落挑取的偏差,因为ade1菌株中红色色素的累积以及淡红色菌落的出现需要较长时间的培育。从过夜培养菌落提取基因组DNA,用于通过PCR验证在ADE1基因中位置的整合。
引物对P5/P6(位于基因组中5’同源区上游,和3’同源区下游)用于验证基因组整合(图5B)。相应的P5/P6引物对进一步命名为P5-1(SEQ ID NO:93)/P6-1(SEQ ID NO:94)、P5-2(SEQ ID NO:95)/P6-2(SEQ ID NO:96)、P5-3(SEQ ID NO:97)/P6-3(SEQ ID NO:98)、和P5-4(SEQ ID NO:99)/P6-4(SEQ ID NO:100)以验证在ADE1基因中不同位置的整合。例如,成功扩增具有3763bp预期大小的条带表明在912/+1位置的染色体整合正确,但扩增大小为2398bp的条带表明无染色体整合(图5C)。
本实施例证明,当利用约800bp相似长度的同源序列时,ADE1基因中不同位点的同源重组整合效率显著不同(表1)。在邻近ORF 3’端的位置(862/863和912/+1)的整合频率超过15%。但在中部ORF位置(703/704)的整合频率仅有3%。与OCH1整合相似,邻近ORF 3’端位点的整合频率要高于其它ORF区域。
与OCH1整合结果一致,在ADE1 5’-和3’-调控区位置的同源整合频率显著较高,例如在起始密码子上游的两位置(-110/-109,-1/1)为50%,65%,在终止密码子下游两位置(+3/+4,+203/+204)为30-45%。
以前的报道表明,同源重组基因打靶频率是基因依赖性的,例如OCH1基因具有极低的效率,而ADE1基因具有较高的频率。然而,本发明发现同源重组基因打靶频率主要取决于靶基因的区域。当利用小于1kb同源序列时,虽然同源重组整合在OCH1和ADE1的ORF区域以破坏基因功能具有完全不同的频率,但同源重组整合在OCH1和ADE1基因座的5’和3’区域都具有相似的高频率,频率超过25%。本发明发现在5’-和3’-调控区的同源重组基因整合的频率不依赖于基因,而且效率很高。此外,邻近ORF 3’端位点的基因整合频率高于其它ORF区域。基因组基因的不同区域中的同源重组打靶整合频率可以表示为以下次序:5’-调控区和3’-调控区﹥﹥编码区的3’端﹥其它编码区。本发明的这些发现为调控靶基因功能提供了新的机会。
实施例5
基因整合以调控β-半乳糖苷酶活性
虽然本发明已经确认在OCH1和ADE1的5’和3’调控区同源重组基因整合具有很高的效率,但是目前还没有系统分析来阐明5’和3’调控区的基因整合将会如何影响基因转录和蛋白质表达。
大肠杆菌(Escherichia coli)的lacZ基因编码β-半乳糖苷酶,其水解包括生色底物在内的各种β-D-半乳糖苷以产生有色产物。由于液体培养中β-半乳糖苷酶活性试验的便利性和灵敏度,其是常用的报道酶以监测基因表达的调控。通过融合lacZ ORF与基因的5’和3’调控区可以构建毕赤酵母的lacZ报道酶。
(1)构建5’AOX1-诱导的lacZ表达载体
图6和7描述了构建一系列5’AOX1-诱导的lacZ表达载体的示意图,其中URA3在lacZ ORF中毗邻起始和终止密码子以调控其表达。
PCR1,用大肠杆菌BL21(DE3)基因组DNA作为模板,用BamHIlacZ F(SEQ ID NO:101)(该引物具有BamH I限制性酶切位点)和lacZNotI R(SEQ ID NO:102)(该引物具有NotI和Xho I限制性酶切位点)引物对作PCR以扩增lacZ ORF(SEQ ID NO:128)。
PCR2,用大肠杆菌BL21(DE3)基因组DNA作为模板,利用BamHIlacZ F(SEQ ID NO:101)和lacZnsNotI R(SEQ ID NO:103)(该引物缺乏lacZ终止启动子并具有Not I和Xho I限制性酶切位点)引物对作PCR以扩增大肠杆菌lacZ ORF。
然后,分别用BamH I和Not I消化lacZ和lacZns的PCR产物。将酶切lacZ和lacZns的BamHI/NotI片段插入pPIC3.5K载体(Invitrogen)的BamH I和Not I位点以产生p5’AOX1-lacZ和p5’AOX1-lacZns载体(图6)。
PCR3,用pBLURA-SX载体作为模板,用BamHIURA3 F(SEQ ID NO:104)(该引物具有BamH I限制性酶切位点)和URA3BamHI R(SEQ ID NO:105)(该引物具有BamH I限制性酶切位点)引物对作PCR以扩增毕赤酵母URA3表达盒。
用BamH I消化URA3表达盒的PCR产物,插入p5’AOX1-lacZ载体的BamH I位点。将含有两种取向的URA3的连接载体转化入大肠杆菌菌株Trans1-T1(TransGen Biotech,中国),进行菌落PCR以选择载体p5’AOX1-URA3-lacZ,其中URA3在同一链中,相同取向紧邻lac ORF上游(图6)。
PCR4,用pBLURA-SX载体作为模板,用NotIURA3 F(SEQ ID NO:106)(该引物具有Not I限制性酶切位点)和URA3NotI R(SEQ ID NO:107)(该引物具有Not I限制性酶切位点)引物对作PCR以扩增毕赤酵母URA3表达盒。
用Not I消化URA3表达盒的PCR产物,分别插入p5’AOX1-lacZ和p5’AOX1-lacZns载体的Not I位点。将含有两种取向的URA3的连接载体转化入噬菌体耐受性大肠杆菌菌株Trans1-T1,进行菌落PCR分别选出载体p5’AOX1-lacZ-URA3、p5’AOX1-lacZ-URA(-)、p5’AOX1-lacZns-URA3、p5’AOX1-lacZns-URA3(-)。p5’AOX1-lacZ-URA3和p5’AOX1-lacZns-URA3均含有URA3表达盒,其位于同一链中,相同取向紧邻lac ORF和lacZns ORF下游(图6)。另两个载体p5’AOX1-lacZ-URA3(-)和p5’AOX1-lacZns-URA3(-)含有URA3表达盒,其位于相对链中,相对取向紧邻lac ORF和lacZns ORF下游(图7)。
(2)构建5’OCH1-介导的lacZ表达载体
图8、9、10和11描述了构建一系列5’OCH1-介导的lacZ表达载体的示意图,其中URA3在lacZ ORF中毗邻起始和终止密码子以调控其表达。
PCR1,用基因组DNA作为模板,利用BamHIOCH1(-731)F(SEQ ID NO:108)(该引物具有BamH I限制性酶切位点)和OCH1(-1)L R(SEQ ID NO:109)(该引物具有lacZ重叠序列以供融合PCR)引物对作PCR以扩增毕赤酵母OCH1的5’调控区(5’OCH1,-731/-1)。
PCR2,用大肠杆菌BL21(DE3)基因组DNA作为模板,用OLacZ F(SEQ ID NO:110)(该引物具有5’OCH1重叠序列以供融合PCR)和lacZXhoI R(SEQ ID NO:111)(该引物具有Xho I限制性酶切位点)引物对作PCR以扩增lacZ ORF。
PCR3,用大肠杆菌BL21(DE3)基因组DNA作为模板,用OLacZ F(SEQ ID NO:110)和lacZnsNotI R(SEQ ID NO:103)(该引物缺乏lacZ终止密码子并具有Not I和Xho I限制性酶切位点)引物对作PCR以扩增无终止密码子的lacZ ORF(lacZns)。
PCR4,用BamHIOCH1(-731)F(SEQ ID NO:108)和LacZXhoI R(SEQ ID NO:111)引物对,通过重叠-延伸PCR融合PCR1和PCR2产物。如此产生5’OCH1-lacZ的片段。
PCR5,用BamHIOCH1(-731)F(SEQ ID NO:108)和lacZnsNotI R(SEQ ID NO:103)引物对,通过重叠-延伸PCR融合PCR1和3产物。如此产生5’OCH1-lacZns的片段。
PCR6,用基因组DNA作为模板,用XhoIOCH1(+4)F(SEQ ID NO:112)(该引物具有XhoI限制性酶切位点)和OCH1(+798)SacI R(SEQ ID NO:113)(该引物具有Sac I限制性酶切位点)引物对作PCR以扩增毕赤酵母OCH1的3’调控区(3’OCH1,+4/+798)。
然后,用BamH I和Xho I消化5’OCH1-lacZ片段的PCR产物,用Xho I和Sac I消化3’OCH1的PCR产物。将5’OCH1-lacZ的BamHI-XhoI片段和3’OCH1的XhoI-SacI片段插入pBLHIS-SX载体的Sac I和BamH I位点以产生p5’OCH1-lacZ载体(图8)。
用BamH I和Xho I消化5’OCH1-lacZns片段的PCR产物,用Xho I和Sac I消化3’OCH1的PCR产物。将5’OCH1-lacZns的BamHI-XhoI片段和3’OCH1的XhoI-SacI片段插入pBLHIS-SX载体的Sac I和BamH I位点以产生p5’OCH1-lacZns载体(图8)。
PCR7,用基因组DNA作为模板,用BamHIOCH1(-731)F(SEQ ID NO:108)和OCH1(-1)UR(SEQ ID NO:114)(该引物具有URA3重叠序列以供融合PCR)引物对作PCR以扩增OCH1的5’调控区(5’OCH1,-731/-1)。
PCR8,用pBLURA-SX载体作为模板,用OURA3 F(SEQ ID NO:115)(该引物具有OCH1重叠序列以供融合PCR)和URA3SphIXhoI R(SEQ ID NO:116)(该引物具有Sph I和Xho I限制性酶切位点)引物对作PCR以扩增毕赤酵母URA3表达盒。
PCR9,用BamHIOCH1(-731)F(SEQ ID NO:108)和URA3SphIXhoI R(SEQ ID NO:116)引物对,通过重叠-延伸PCR融合PCR7和8产物。如此产生5’OCH1-URA3的片段。
PCR10,用大肠杆菌BL21(DE3)基因组DNA作为模板,用SphILacZ F(SEQ ID NO:117)(该引物具有Sph I限制性酶位点)和LacZXhoI R(SEQ ID NO:111)引物对作PCR以扩增lacZ ORF。
然后,用BamH I和Xho I消化5’OCH1-URA3片段的PCR产物,用Sph I和Xho I消化lacZ ORF的PCR产物。将5’OCH1-URA3的BamHI-XhoI片段和lacZ的SphI-XhoI片段插入p5’OCH1-lacZ载体的BamHI和XhoI位点以产生p5’OCH1-URA3-lacZ载体(图9)。
PCR11,用pBLURA-SX载体作为模板,用XhoIURA3 F(SEQ ID NO:3)(该引物具有XhoI限制性酶切位点)和URA3XhoI R(SEQ ID NO:10)(该引物具有Xho I限制性酶切位点)引物对作PCR以扩增毕赤酵母URA3表达盒。
用Xho I消化URA3表达盒的PCR产物,插入p5’OCH1-lacZ和p5’OCH1-lacZns载体的Xho I位点。将含有两种取向的URA3的插入载体转化入大肠杆菌菌株Trans1-T1,进行菌落PCR以分别选择载体p5’OCH1-lacZ-URA3、p5’OCH1-lacZ-URA3(-)、p5’OCH1-lacZns-URA3、p5’OCH1-lacZns-URA3(-)。p5’OCH1-lacZ-URA3和p5’OCH1-lacZns-URA3均含有URA3表达盒,其位于同一链中,相同取向紧邻lac ORF和lacZns ORF下游。另两个载体p5’OCH1-lacZ-URA3(-)和p5’OCH1-lacZns-URA3(-)均含有URA3表达盒,其位于相对链中,相对取向紧邻lacz ORF和lacZns ORF下游(图10和11)。
(3)lacZ表达载体的转化
用Sac I消化来线形化5’AOX1-诱导lacZ表达载体,包括p5’AOX1-lacZ、p5’AOX1-URA3-lacZ、p5’AOX1-lacZ-URA3、p5’AOX1-lacZ-URA3(-)、p5’AOX1-lacZns-URA3和p5’AOX1-lacZns-URA3(-),并通过电穿孔将它们转化入毕赤酵母菌株GS115(his4)(Invitrogen)。将转化的细胞在YNB平板上培养以选择组氨酸原养型。根据生产商(Invitrogen)所述,将线形化的表达载体通过单交换(roll-in)重组整合在基因组中。
用stu I消化来线形化5’OCH1-介导lacZ表达载体,包括p5’OCH1-lacZ、p5’OCH1-URA3-lacZ、p5’OCH1-lacZ-URA3、p5’OCH11-lacZ-URA3(-)、p5’OCH1-lacZns-URA3和p5’OCH1-lacZns-URA3(-),并通过电穿孔将它们转化入毕赤酵母菌株GS115。将转化的细胞在YNB平板上培养以选择组氨酸原养型。将线形化的表达载体通过单交换(roll-in)重组整合在his4基因处。
(4)lacZ mRNA的实时PCR分析
将5’AOX1-诱导lacZ表达载体的转化细胞在5ml BMGY培养基(10g/L酵母提取物、20g/L蛋白胨、13.4g/L YNB不含氨基酸、100mM磷酸钾缓冲液、pH 6.0、0.4mg/L生物素、10ml/L甘油)中,30℃,以225rpm振荡培养48小时。以3000g离心5分钟沉淀细胞,然后将沉淀的细胞重悬在5ml BMMY培养基(10g/L酵母提取物、20g/L蛋白胨、13.4g/L YNB不含氨基酸、100mM磷酸钾缓冲液、pH 6.0、0.4mg/L生物素、10ml/L甲醇),30℃,225rpm振荡以诱导lacZ表达。用50μl 100%甲醇(1%终浓度)每日两次掺入培养液,将诱导再维持48小时。随后,以3000g离心细胞10分钟。用5ml水洗涤,再离心以收集细胞沉淀。将细胞沉淀用于β-半乳糖苷酶试验,或保存在-80℃用于总RNA分离。
将5’OCH1-介导lacZ表达载体的转化细胞在5ml YPD培养基中,30℃,以225rpm振荡培养72小时。随后,以3000g离心细胞10分钟,用5ml水洗涤,再离心以收集细胞沉淀。将细胞沉淀用于β-半乳糖苷酶试验,或保存在-80℃用于总RNA分离。
按照生产商的使用说明,利用ReverTra Ace-α-第一链cDNA合成试剂盒(Toyobo)进行RNA的逆转录。
实时PCR反应:10μl 2×iTaqTM Universal Green supermix(BioRad,Hercules,CA),1μl cDNA和100nM各自的GAPDH F(SEQ ID NO:118)/R(SEQ ID NO:119)和LacZ F(SEQ ID NO:120)/R(SEQ ID NO:121)引物,20μl总反应体积。利用LightCyclerLC480(Roche),以如下参数进行PCR反应:1轮95℃、1分钟,40轮95℃、10秒,58℃、10秒,72℃、10秒。所有的样品一式三份,并测试数次。利用生产商(Roche)的软件分析实时PCR数据。采用比较CT方法(ΔΔCT方法)测定mRNA的相对表达。甘油醛-3-磷酸脱氢酶用作内源性对照以便定量测定基因表达。
图12A和B显示当URA3表达盒整合于起始和终止密码子附近时对5’AOX1和5’OCH1启动的lacZ mRNA表达的抑制作用。当URA3表达盒在同一链中,以相同取向紧邻lacZ ORF起始密码子的上游整合时,其将lacZ mRNA水平分别有效降低60%和70%。这种mRNA降低可归结为3’URA3终止子,其位于lacZ ORF上游并阻断5’AOX1或5’URA3启动子启动的lacZ转录。但是3’URA3终止子未能完全终止转录而产生低水平的异常lacZ mRNA,其缺乏合适的5’UTR以供翻译。
当URA3表达盒在DNA双链中,以两种取向紧邻lacZ ORF终止密码子的上游整合时,预计能产生缺乏终止密码子的异常lacZ mRNA(无终止lacZ mRNA,lacZns)。当URA3表达盒在DNA双链中,以两种取向紧邻lacZ ORF终止密码子的下游整合时,预计能产生含有异常3’UTR的lacZ mRNA。RT-PCR分析显示终止密码子附近的整合能增加或降低5’AOX1或5’OCH1启动的lacZ异常mRNA水平(图12A和B)。这些结果与以前的报道不一致,即,细胞具备监督系统来识别和消除异常mRNA以避免产生可能有害的蛋白质产物(van Hoof A,Frischmeyer PA,Dietz HC,Parker R(2002)Exosome mediated recognition and degradation of mRNAslacking a termination codon.Science 295:2262–2264)。因此,必需要评估DNA双链中、以两种取向在终止密码子附近的整合以获得调节靶基因转录的最佳效应。
(5)β-半乳糖苷酶活性试验
为进一步了解对5’AOX1和5’OCH1介导的蛋白表达的抑制作用,采用标准方案检测收集的细胞沉淀中β-半乳糖苷酶的胞内比活性(Ausubel F M et al.Current Protocolsin Molecular Biology,Wiley InterScience,2010)。
图13A和B显示对应于URA3表达盒整合在起始和终止密码子附近时,β-半乳糖苷酶的相对胞内比活性。当URA3在同一链中,以相同取向整合在紧邻lacZ ORF起始密码子上游的位置时,细胞中没有可检测的β-半乳糖苷酶活性。β-半乳糖苷酶活性的完全抑制可归结于转录和翻译调控作用。首先,3’URA3的终止作用显著降低异常缺乏5’UTR的lacZ mRNA转录。其次,在不含合适5’UTR的异常lacZ mRNA中无法启动翻译。
5’调控区,特别是紧邻ORF上游位置的基因整合能通过阻遏转录和翻译来专一性抑止靶基因表达。目前调控基因转录的方法主要包括:通过抑止分子与DNA结合改变模扳功能,通过抑止分子与RNA聚合酶结合而抑止其转录活性。调控蛋白翻译的方法主要采用小RNA和RNA-结合蛋白与mRNA结合来改变其翻译能力。相比之下,基因组基因中,特别是ORF上游的基因整合是控制靶基因表达的更为有效的方法。
由于URA3整合对lacZ异常mRNA水平有不同作用,在不同链中、以不同取向在终止密码子附近的URA3整合对细胞中5’AOX1和5’OCH1介导的β-半乳糖苷酶翻译有各种不同抑制作用。当URA3以合适取向在终止密码子附近整合时,β-半乳糖苷酶活性可降低最多70%。这种抑制作用比以前报道的通过microRNA抑制更有效。据报道,microRNA对mRNA的稳定性和翻译水平只能抑制32%和4%(Noah Spies,Christopher B.Burge,and David P.Bartel(2013).3’UTR-isoform choice has limited influence on the stability andtranslational efficiency of most mRNAs in mouse fibroblasts,Genome Research,23:2078–2090)。
本发明显示了通过在终止密码子附近整合来控制靶基因表达的另一种方法。必需评估DNA双链中、以两种取向在终止密码子附近的基因整合以获得最佳调节结果。
实施例6
基因整合以抑制OCH1表达
为进一步了解基因整合对调节基因组中基因转录的作用,选择实施例3中的代表性整合菌株来分析OCH1基因的mRNA转录。将对照菌株JC307和3种整合菌株och1(-1/+1)、(1212/+1)、(+3/+4)的细胞在5ml YPD培养基中,30℃,以225rpm振荡培养72小时。随后,以3000g离心细胞10分钟,用5ml水洗涤,再离心以收集细胞沉淀,并保存在-80℃用于总RNA分离。
实时PCR反应:10μL 2×iTaqTM Universal Green supermix(BioRad,Hercules,CA),1μl cDNA和100nM各自的GAPDH F(SEQ ID NO:118)/R(SEQ ID NO:119)和OCH1 F(SEQ ID NO:122)/R(SEQ ID NO:123)引物,20μL总反应体积。利用LightCyclerLC480(Roche),以如下参数进行PCR反应:1轮95℃、1分钟,40轮95℃、10秒,58℃、10秒,72℃、10秒。所有的样品一式三份,并测试数次。利用生产商(Roche)的软件分析实时PCR数据。采用比较CT方法(ΔΔCT方法)测定mRNA的相对表达。甘油醛-3-磷酸脱氢酶(GAPDH)用作内源性对照以便定量测定基因表达。
图14显示了这些菌株中的OCH1 mRNA相对表达量。起始密码子上游位置的基因整合能有效抑制OCH1 mRNA水平超过90%。终止密码子下游位置的基因整合也能降低OCH1mRNA水平。然而,终止密码子上游位置的基因整合显著增加OCH1 mRNA水平。该结果类似于在实施例5中lacZ mRNA调节的观察结果。
实施例7
OCH1抑制菌株中的蛋白质糖基化
N-糖基化是将寡糖连接于共有序列Asn-X-Ser/Thr内的特定天冬酰胺残基(Kornfeld,R.&Kornfeld,S.(Assembly of asparagine-linked oligosaccharides.Annu.Rev.Biochem.54,631–664,1985)。简言之,在真核细胞中,Glc3Man9GlcNAc2寡糖在内质网(ER)膜的腔侧转移到初生多肽链。利用葡糖苷酶I和II除去3个葡萄糖残基后,通过甘露糖苷酶I除去一特定末端的α-1,2-甘露糖。这些反应在大多数低级和高级真核生物之间是保守性的。此时,正确折叠的Man8GlcNAc2 N-糖基化蛋白离开ER到达高尔基体复合物,在该处糖链经历进一步的物种和细胞类型特异性加工。
高级真核生物中,ER的Man8GlcNAc2糖链被几种α-1,2-甘露糖苷酶进一步处理以产生Man5GlcNAc2 N-聚糖,相比之下,酵母菌通过将α-1,6-甘露糖残基加入三甘露糖基核心的α-1,3-甘露糖来修饰Man8GlcNAc2糖链,该反应由高尔基体中的Och1p催化。然后几种(磷酸)甘露糖基转移酶进一步延长这种“启动甘露糖”。如此导致高甘露糖链结构Man9-100GlcNAc2,其由最多数十α-1,6-甘露糖的骨架与短的侧链构成。这种不同与人蛋白糖链的N-高甘露糖链极大地降低蛋白质在体内半衰期,其具有免疫原性并有碍下游工艺操作。
为阻断N-高甘露糖链的形成,目前已进行了大量的工作以敲除酵母菌基因组中的OCH1基因。然而,同源基因打靶直接破坏OCH1基因编码区及其功能的效率极低。在本发明中,5’OCH1调控区的基因整合可应用于阻断重组蛋白产物中Och1p启动的高甘露糖基化过程。
由Generay合成密码子优化的小鼠白介素-22(mIL-22,针对酵母菌密码子作优化的含his-标签小鼠IL-22成熟肽的DNA序列如SEQ ID NO:129所示)做模板,用MIL22 F(SEQID NO:124)/R(SEQ ID NO:125)引物对作PCR扩增。用Xho I和Not I限制性酶消化PCR产物,并克隆入pPICZα(Invitrogen)的Xho I/Not I位点以产生mIL-22表达载体,其能表达并分泌含His-标签的mIL-22。用限制性酶Sac I线形化该表达载体,并电穿孔转入GS115和och1(-1/+1)菌株。转化的细胞在补加了100mg/L的Zeocin的YPD平板上培养。根据生产商(Invitrogen)所述,通过单交换(roll-in)重组将线形化的载体整合在AOX1基因座。
将转化的细胞在5ml YPD培养基中,30℃,225rpm振荡培养24小时。以3000g离心沉淀细胞5分钟,重悬在5ml BMGY培养基中,30℃,225rpm振荡培养24小时。然后,以3000g离心沉淀细胞5分钟,重悬在5ml BMGY培养基中,30℃,225rpm振荡培养以诱导mIL-22表达。用50μl 100%甲醇(1%终浓度)每日两次掺入培养液,将诱导再维持72小时。随后,通过离心收获培养上清液(3000g,10分钟),-20℃冷冻上清液待用。
按照生产商的使用说明书(南京金斯瑞生物科技有限公司),通过Ni-亲和层析从上清液中纯化带His-标签的mIL-22蛋白。
采用以前报道的方法(Gregg JM(2010)Pichia Protocols,Secondedition.Totowa,New Jersey:Humanna Press),通过N-糖苷酶F(PNGaseF)(New EnglandBiolabs,Beverly,MA)处理从带His-标签的mIL-22蛋白释放并分离聚糖。
按照生产商的使用说明书,利用Ultraflex MALDI-TOF(bruker daltonics,不来梅,德国)质谱仪测定聚糖的分子量。
图15A显示GS115菌株中从mIL-22释放的N-糖链的质谱图。其显示主要的N-高甘露糖链为Man14GlcNAc2(m/z:2695.0,[M+H]+)。图15B显示och1(-1/+1)菌株中从mIL-22释放的N-糖链的质谱图。其显示没有Man14GlcNAc2的N-高甘糖链。主要的N-糖链出现在m/z为1843.6处,在Man8GlcNAc2(m/z:1720,[M+H]+)和Man9GlcNAc2(m/z:1883,[M+H]+)之间。这可能通过修饰Man8GlcNAc2来产生这种主要的N-糖链,其需要进一步的确认。N-糖链分析表明OCH1 ORF上游的基因整合能有效阻断Och1p启动的高甘露糖基化过程。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
Claims (14)
1.一种用于调控毕赤酵母 (Pichia pastoris)基因的核苷酸构建物,其结构如下式所示:
5’-A-B-C-3’
其中,A是5’同源序列,B是干扰基因,C是3’同源序列;
所述5’和3’同源序列使得所述核苷酸构建物的重组位点位于该待调控基因的起始密码子DNA的第一个核苷酸处或该待调控基因的起始密码子DNA的第一个核苷酸上游的110个核苷酸处,或者所述5’和3’同源序列使得所述核苷酸构建物的重组位点位于该待调控基因的终止密码子DNA的第三个核苷酸处(+3)或该待调控基因的终止密码子DNA的第一个核苷酸下游的203个核苷酸处。
2.如权利要求1所述的核苷酸构建物,其特征在于,所述干扰基因多于一个,相同或不同。
3.如权利要求1或2所述的核苷酸构建物,其特征在于,所述干扰基因是标记基因。
4.如权利要求1或2所述的核苷酸构建物,其特征在于,所述核苷酸构建物是环状或线形的。
5.如权利要求4所述的核苷酸构建物,其特征在于,所述待调控基因是OCH1、ADE1基因。
6.如权利要求1或2所述的核苷酸构建物,其特征在于,所述同源序列的长度为400-1200 nt。
7.如权利要求6所述的核苷酸构建物,其特征在于,所述同源序列的长度为500-1000nt。
8.如权利要求7所述的核苷酸构建物,其特征在于,所述同源序列的长度为600-800nt。
9.一种包含权利要求1-8中任一项所述的核苷酸构建物的宿主细胞,其特征在于,所述宿主细胞是毕赤酵母 (Pichia pastoris)细胞。
10.一种调控毕赤酵母 (Pichia pastoris)基因表达的方法,所述方法包括:
a) 构建如权利要求1-9中任一项所述的核苷酸构建物;和
b) 将步骤a)构建的核苷酸构建物导入毕赤酵母(Pichia pastoris)细胞,从而通过同源重组整合入待调控基因。
11.如权利要求10所述的方法,其特征在于,所述待调控基因是OCH1、ADE1基因。
12.如权利要求10或11所述的方法,其特征在于,所述方法还包括步骤c) 检测步骤b)所得细胞中待调控基因的表达。
13.一种改造毕赤酵母 (Pichia pastoris)的方法,包括:
a) 构建如权利要求1-9中任一项所述的核苷酸构建物;和
b) 将步骤a)构建的核苷酸构建物转化入待改造的菌株。
14.如权利要求13所述的方法,其特征在于,所述方法还包括步骤c) 筛选改造菌株的步骤。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510218188.1A CN106191040B (zh) | 2015-04-30 | 2015-04-30 | 基因打靶方法 |
US15/570,656 US11466280B2 (en) | 2015-04-30 | 2016-04-29 | Gene targeting method |
PCT/CN2016/080788 WO2016173556A1 (zh) | 2015-04-30 | 2016-04-29 | 新型基因打靶方法 |
EP16785984.2A EP3290519A4 (en) | 2015-04-30 | 2016-04-29 | NOVEL GEN-TARGETING PROCESS |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510218188.1A CN106191040B (zh) | 2015-04-30 | 2015-04-30 | 基因打靶方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106191040A CN106191040A (zh) | 2016-12-07 |
CN106191040B true CN106191040B (zh) | 2021-09-14 |
Family
ID=57198173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510218188.1A Active CN106191040B (zh) | 2015-04-30 | 2015-04-30 | 基因打靶方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11466280B2 (zh) |
EP (1) | EP3290519A4 (zh) |
CN (1) | CN106191040B (zh) |
WO (1) | WO2016173556A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108866050B (zh) * | 2017-05-11 | 2022-12-27 | 杭州菁因康生物科技有限公司 | 一种高效的基因工程载体 |
CN107480473B (zh) * | 2017-07-18 | 2021-02-26 | 中国石油大学(华东) | 一种基于密码子模板的真核生物功能基因序列搜索方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1255166A (zh) * | 1997-03-14 | 2000-05-31 | 艾德药品公司 | 将基因整合至哺乳动物细胞特定位点的方法及所用载体 |
CN102639699A (zh) * | 2009-10-01 | 2012-08-15 | Toto株式会社 | Dna构建体以及用其制备重组cho细胞的方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002209574A (ja) * | 2001-01-19 | 2002-07-30 | Kanegafuchi Chem Ind Co Ltd | 遺伝子破壊酵母 |
FR2912154B1 (fr) * | 2007-02-02 | 2012-11-02 | Glycode | Levures genetiquement modifiees pour la production de glycoproteines homogenes |
CN102120967A (zh) * | 2010-12-09 | 2011-07-13 | 江南大学 | Och1基因缺陷型毕赤酵母x-33菌株的构建及应用 |
CN102154188B (zh) * | 2010-12-22 | 2013-05-08 | 中国人民解放军第三军医大学 | 大肠杆菌DH5α的nfi基因敲除突变株及其制备方法和应用 |
WO2014093595A1 (en) * | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Crispr-cas component systems, methods and compositions for sequence manipulation |
-
2015
- 2015-04-30 CN CN201510218188.1A patent/CN106191040B/zh active Active
-
2016
- 2016-04-29 EP EP16785984.2A patent/EP3290519A4/en active Pending
- 2016-04-29 WO PCT/CN2016/080788 patent/WO2016173556A1/zh active Application Filing
- 2016-04-29 US US15/570,656 patent/US11466280B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1255166A (zh) * | 1997-03-14 | 2000-05-31 | 艾德药品公司 | 将基因整合至哺乳动物细胞特定位点的方法及所用载体 |
CN102639699A (zh) * | 2009-10-01 | 2012-08-15 | Toto株式会社 | Dna构建体以及用其制备重组cho细胞的方法 |
Non-Patent Citations (2)
Title |
---|
Enhancement of the Gene Targeting Efficiency of Non-Conventional Yeasts by Increasing Genetic Redundancy;Zao Chen等;《Plos one》;20130331;第8卷(第3期);第1-9页 * |
微生物基因打靶系统的研究进展;谭晓红等;《生物技术通讯》;20040531;第15卷(第3期);第263-266页 * |
Also Published As
Publication number | Publication date |
---|---|
US11466280B2 (en) | 2022-10-11 |
EP3290519A1 (en) | 2018-03-07 |
EP3290519A4 (en) | 2019-01-23 |
CN106191040A (zh) | 2016-12-07 |
US20190093115A1 (en) | 2019-03-28 |
WO2016173556A1 (zh) | 2016-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2588616B1 (en) | A method for the production of a compound of interest | |
EP2683732B1 (en) | Vector-host system | |
EP2912162B1 (en) | Pichia pastoris strains for producing predominantly homogeneous glycan structure | |
EP2004826A1 (en) | Improved method for homologous recombination in eukaryotic cells | |
CN105492604B (zh) | 受调节的pepc表达 | |
Jørgensen et al. | A novel platform for heterologous gene expression in Trichoderma reesei (Teleomorph Hypocrea jecorina) | |
CN106191041B (zh) | 基因打靶方法 | |
Nett et al. | Cloning and disruption of the PpURA5 gene and construction of a set of integration vectors for the stable genetic modification of Pichia pastoris | |
CN106191040B (zh) | 基因打靶方法 | |
AU2010251133A1 (en) | Eukaryotic host cell comprising an expression enhancer | |
AU754951B2 (en) | Yeast transformation cassette | |
CN102066563A (zh) | 多物种多核苷酸控制序列 | |
Piva et al. | Acetamidase as a dominant recyclable marker for Komagataella phaffii strain engineering | |
US11155824B2 (en) | Episomal plasmid vectors | |
JP4756125B2 (ja) | アスペルギルス・オリザの新規変異株及び選択マーカー | |
JP2016518829A (ja) | 選択的オートファジー経路の不活性化成分を含む糸状真菌細胞及びその使用方法 | |
EP4004211A1 (en) | Filamentous fungal expression system | |
CN108866050B (zh) | 一种高效的基因工程载体 | |
US20230111619A1 (en) | Non-viral transcription activation domains and methods and uses related thereto | |
KR102245298B1 (ko) | 증가된 edc 활성을 갖고 락테이트 생산능을 갖는 유전적으로 조작된 효모 세포, 그를 제조하는 방법, 그를 제조하는 방법, 및 그를 사용하여 락테이트를 생산하는 방법 | |
CN110129346A (zh) | 一种高效的基因工程载体 | |
CN118056003A (zh) | 蛋白组合物及生产方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |