Nothing Special   »   [go: up one dir, main page]

CN117897050A - 大豆中生长调节因子家族转录因子的修饰 - Google Patents

大豆中生长调节因子家族转录因子的修饰 Download PDF

Info

Publication number
CN117897050A
CN117897050A CN202280055484.2A CN202280055484A CN117897050A CN 117897050 A CN117897050 A CN 117897050A CN 202280055484 A CN202280055484 A CN 202280055484A CN 117897050 A CN117897050 A CN 117897050A
Authority
CN
China
Prior art keywords
sequence
seq
transcription factor
plant
nos
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280055484.2A
Other languages
English (en)
Inventor
M·米勒
L·G·马修
B·C·W·克劳福德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pairing Plant Service Co ltd
Original Assignee
Pairing Plant Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pairing Plant Service Co ltd filed Critical Pairing Plant Service Co ltd
Publication of CN117897050A publication Critical patent/CN117897050A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/46Gramineae or Poaceae, e.g. ryegrass, rice, wheat or maize
    • A01H6/4636Oryza sp. [rice]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Botany (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physiology (AREA)
  • Environmental Sciences (AREA)
  • Developmental Biology & Embryology (AREA)
  • Natural Medicines & Medicinal Plants (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)
  • Pretreatment Of Seeds And Plants (AREA)

Abstract

本发明涉及用于修饰大豆植物中的生长调节因子(GRF)家族转录因子以产生具有改善的病原体抗性、任选地具有改善或维持的产量性状的大豆植物和/或具有改善的产量性状而不丧失病原体抗性的大豆植物的组合物和方法。本发明进一步涉及使用本发明的方法和组合物产生的大豆植物。

Description

大豆中生长调节因子家族转录因子的修饰
关于序列表的电子申请的声明
提供了ASCII文本格式的序列表来代替纸质副本,该序列表根据37 C.F.R.§1.821提交,命名为1499.16X.WO_ST25.txt,大小为553,589字节,于2022年5月14日生成,并通过EFS-Web提交。此序列表就其公开内容在此通过引用并入说明书中。
优先权声明
此申请根据35U.S.C.§119(e)要求2021年6月17日提交的美国临时申请号63/211,860的权益,其全部内容通过引用并入本文。
技术领域
本发明涉及用于修饰大豆植物中的生长调节因子(GRF)家族转录因子以产生具有改善的病原体抗性、任选地具有改善或维持的产量性状的大豆植物和/或具有改善的产量性状而不丧失病原体抗性的大豆植物的组合物和方法。本发明进一步涉及使用本发明的方法和组合物产生的大豆植物。
背景技术
GRF是陆地植物特异性转录因子,其与GRF相互作用因子(GIF)一起发挥作用,GIF存在于植物和后生动物中,但不存在于真菌中。陆地植物中GRF家族成员的数量为约8-20个。microRNA396(miR396)-生长调节因子(GRF)转录因子调节网络将环境信号与植物生长和发育相结合。在许多物种中,miR396-GRF网络控制器官增殖和生长(Liebsch&Palatnik.Curr Opin Plant Biol 53,31-42(2020))。最近的证据表明,响应病原体感染,miR396下调并且GRF上调。
本发明通过提供改进的方法和组合物来改善大豆中的产量性状和对病原体感染的抗性,从而克服了本领域的缺点。
发明内容
本发明的一个方面提供了一种大豆植物或其植物部分,其包含编码生长调节因子(GRF)转录因子的内源基因中的至少一个非天然突变,其中编码GRF转录因子的内源基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的区域。
本发明的另一个方面提供了一种大豆植物细胞,其包含碱基编辑系统,所述碱基编辑系统包含:(a)CRISPR-Cas效应蛋白;(b)胞苷脱氨酶或腺苷脱氨酶;和(c)引导核酸(gRNA),其具有与编码GRF转录因子的内源靶基因互补的间隔序列,其中内源靶基因(i)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(ii)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域,任选地,所述区域与SEQ IDNO:109的核苷酸序列具有至少90%序列同一性;(iii)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(iv)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性、任选地与SEQ IDNO:110的氨基酸序列具有至少90%序列同一性的序列的区域。
本发明的另一个方面提供了一种大豆植物或其部分,其包含在内源GRF转录因子基因的miR396结合位点序列内或附近的至少一个非天然突变,其中所述至少一个非天然突变阻止或减少miR396与由内源GRF转录因子基因产生的mRNA的结合,导致由内源GRF转录因子基因产生的mRNA水平增加,进一步其中所述至少一个非天然突变是使用编辑系统引入的取代、插入或缺失,所述编辑系统包含与内源GRF转录因子基因中的靶位点结合的核酸结合结构域,所述靶位点与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%的序列同一性和/或编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列。
另一方面提供了包含生长调节因子(GRF)转录因子基因的大豆植物,所述生长调节因子(GRF)转录因子基因包含SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93、94、96-103、109或122-129中任一个的核苷酸序列中的突变和/或包含SEQ ID NO:111-113或SEQ ID NO:130-131中任一个的核苷酸序列。
还提供了提供具有改善或维持的产量性状、改善的植物结构和/或改善或维持的抗病性状的多个大豆植物的方法,该方法包括在生长区域中种植本发明的两个或更多个大豆植物(例如,包含如本文所述的GRF转录因子基因中的突变的大豆植物),从而提供与不包含至少一个非天然突变的多个对照大豆植物相比具有改善或维持的产量性状、改善的植物结构和/或改善或维持的抗病性状的多个大豆植物,任选地其中与对照大豆植物相比,大豆植物或其植物部分表现出改善的抗病性状而不丧失产量性状或改善的产量性状而不丧失抗病性状的表型。
本发明还提供了产生/培育无转基因的基因组编辑的大豆植物的方法,包括:(a)将本发明的大豆植物与无转基因的大豆植物杂交,从而将突变引入无转基因大豆植物中;和(b)选择包含突变但无转基因的后代大豆植物,从而产生无转基因的基因组编辑的大豆植物。
本发明的另一个方面提供了一种用于编辑大豆植物细胞的基因组中特定位点的方法,该方法包括:以位点特异性方式切割大豆植物细胞中内源GRF转录因子基因内的靶位点,所述内源GRF转录因子基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域,从而在大豆植物细胞的内源GRF转录因子基因中产生编辑。
本发明的另一个方面提供了用于制备大豆植物的方法,包括:(a)使包含编码GRF转录因子的内源基因的大豆植物细胞群体与包含核酸结合结构域的编辑系统接触,所述核酸结合结构域结合内源基因的一部分,所述内源基因(i)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(ii)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(iii)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(iv)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域;(b)从群体中选择包含编码GRF转录因子的至少一个内源基因中的突变的大豆植物细胞,其中所述突变是所述至少一个内源基因中的至少一个核苷酸的取代,其中所述突变降低或消除miR396与由包含突变的编码GRF转录因子的至少一个内源基因产生的mRNA的结合;和(c)使选择的大豆植物细胞生长为大豆植物。
在另外的方面,一种用于产生包含其中内源GRF转录因子基因被突变的至少一个细胞的大豆植物或其部分的方法,该方法包括使大豆植物或植物部分中的GRF转录因子基因中的靶位点与包含与GRF转录因子基因中的靶位点结合的核酸结合结构域的编辑系统接触,所述GRF转录因子基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ IDNO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域,从而产生包含具有内源GRF转录因子基因中的突变的至少一个细胞的大豆植物或其部分。
另一方面,提供了用于产生包含内源GRF转录因子基因中的突变的大豆植物或其部分的方法,所述突变产生具有减少的miR396结合的mRNA,该方法包括使内源GRF转录因子基因中的靶位点与包含与GRF转录因子基因中的靶位点结合的核酸结合结构域的编辑系统接触,所述GRF转录因子基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域,从而产生包含内源GRF转录因子基因中的突变的大豆植物或其部分,所述突变产生具有减少的miR396结合的mRNA。
另一方面,提供了用于产生具有改善或维持的产量性状、改善的植物结构和/或改善或维持的抗病性状的大豆植物或其部分的方法,该方法包括使大豆植物或植物部分中的内源GRF转录因子基因中的靶位点与包含与GRF转录因子基因中的靶位点结合的核酸结合结构域的编辑系统接触,所述GRF转录因子基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域,从而产生包含突变的内源GRF的大豆植物或其部分,所述突变的内源GRF转录因子基因产生具有减少的miR396结合的mRNA,从而产生具有改善或维持的产量性状、改善的植物结构和/或改善或维持的抗病性状的大豆植物或其部分,任选地其中与对照大豆植物相比,所述大豆植物或其植物部分表现出改善的抗病性状而不丧失产量性状或改善的产量性状而不丧失防御性状的表型。
本发明的另一方面提供了一种与GRF转录因子基因中的靶位点结合的引导核酸,所述靶位点包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的序列,或编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列。
进一步提供了一种基因编辑系统,其包含与引导核酸结合的CRISPR-Cas效应蛋白,其中所述引导核酸包含与GRF转录因子基因互补并结合的间隔序列,其中所述GRF转录因子基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:96-103或SEQID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ IDNO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域。
本发明的另一个方面提供了一种复合物,其包含含有切割结构域(例如,核酸酶)的CRISPR-Cas效应蛋白的和引导核酸(例如,gRNA),其中引导核酸与GRF转录因子基因中的靶位点结合,所述GRF转录因子基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域,其中切割结构域切割靶标链。
另一方面提供了一种表达盒,其包含(a)编码包含切割结构域的CRISPR-Cas效应蛋白的多核苷酸和(b)与GRF转录因子基因中的靶位点结合的引导核酸,其中所述引导核酸包含间隔序列,所述间隔序列与以下序列的一部分互补并结合,所述以下序列(i)与SEQ IDNO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93、94、96-103或122-129中任一个的核苷酸序列具有至少80%序列同一性;(ii)编码与SEQ ID NO:74、77、80、83、86、89、92、95或104-108中任一个的氨基酸序列具有至少80%序列同一性的序列,任选地,其中所述一部分是约2至约22个连续核苷酸或约20至约22个连续核苷酸。
另一方面,本发明提供了编码GRF转录因子mRNA的核酸,所述GRF转录因子mRNA包含在miR396结合位点中或附近的突变,所述突变破坏miR396与GRF转录因子mRNA的结合,导致由该核酸产生的GRF转录因子mRNA的水平增加。
还提供了一种大豆植物或其植物部分,其包含至少一个内源生长调节因子(GRF)基因中的至少一个非天然突变,所述内源生长调节因子(GRF)基因具有基因识别号(基因ID)GLYMA_11g008500、GLYMA_01g234400、GLYMA_12g014700、GLYMA_11g110700、GLYMA_07g038400,GLYMA_16g007600、GLYMA_04g230600和/或GLYMA_06g134600。
在本发明的另一个方面,提供了一种与生长调节因子(GRF)中的靶核酸结合的引导核酸,所述生长调节因子(GRF)具有基因识别号(基因ID)GLYMA_11g008500、GLYMA_01g234400、GLYMA_12g014700、GLYMA_11g110700、GLYMA_07g038400、GLYMA_16g007600、GLYMA_04g230600和/或GLYMA_06g134600。
还提供了一种编辑大豆植物或植物部分中的内源GRF转录因子基因的方法,该方法包括使大豆植物或植物部分中的GRF转录因子基因中的靶位点与包含胞嘧啶脱氨酶和与GRF转录因子基因中的靶位点结合的核酸结合结构域的胞嘧啶碱基编辑系统接触,所述GRF转录因子基因(a)与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93、94或96-103中任一个的核苷酸序列具有至少80%序列同一性;(b)编码与SEQ ID NO:74、77、80、83、86、89、92、95或104-108中任一个的氨基酸序列具有至少80%序列同一性的序列,其中胞嘧啶脱氨酶在SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93、94、96-103或122-129中任一个的核苷酸序列中产生至少一个C到T的转换,从而产生包含具有内源GRF转录因子基因中的突变的至少一个细胞的大豆植物或其部分。
本发明的另一个方面提供了一种编辑大豆植物或植物部分中的内源GRF转录因子基因的方法,该方法包括使大豆植物或植物部分中的GRF转录因子基因中的靶位点与包含腺嘌呤脱氨酶和与GRF转录因子基因中的靶位点结合的核酸结合结构域的腺嘌呤碱基编辑系统接触,所述GRF转录因子基因(a)与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93、94、96-103或122-129中任一个的核苷酸序列具有至少80%序列同一性;和/或(b)编码与SEQ ID NO:74、77、80、83、86、89、92、95或104-108中任一个的氨基酸序列具有至少80%序列同一性的序列,其中腺嘌呤脱氨酶在SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93、94、96-103或122-129中任一个的核苷酸序列中产生至少一个A到G的转换,从而产生包含具有内源GRF转录因子基因中的突变的至少一个细胞的大豆植物或其部分。
本发明还提供了一种检测内源GRF转录因子基因中的突变的方法,包括检测大豆植物的基因组中SEQ ID NO:109的核苷酸序列中的至少一个碱基取代。
还提供了一种检测内源GRF转录因子基因中的突变的方法。
本发明的另一个方面提供了用于产生包含内源GRF转录因子基因中的突变和至少一种感兴趣的多核苷酸的大豆植物的方法,该方法包括将第一大豆植物(其是本发明的大豆植物)与包含至少一种感兴趣的多核苷酸的第二大豆植物杂交以产生后代大豆植物;选择包含GRF转录因子基因中的突变和至少一种感兴趣的多核苷酸的后代植物,从而产生包含内源GRF转录因子基因中的突变和至少一种感兴趣的多核苷酸的大豆植物。
本发明的另一方面提供了产生包含内源GRF转录因子基因中的突变和至少一种感兴趣的多核苷酸的大豆植物的方法,该方法包括将至少一种感兴趣的多核苷酸引入本发明的大豆植物中,从而产生包含GRF转录因子基因中的突变和至少一种感兴趣的多核苷酸的大豆植物。
还提供了产生包含内源GRF转录因子基因中的突变和至少一种感兴趣的多核苷酸的大豆植物的方法,该方法包括将至少一种感兴趣的多核苷酸引入本发明的大豆植物中,从而产生包含GRF转录因子基因中的突变和至少一种感兴趣的多核苷酸的大豆植物。
还提供了产生包含内源GRF转录因子基因中的突变并表现出改善的/维持的产量性状、改善的植物结构和/或改善的/维持的抗病性状的表型的大豆植物的方法,将第一大豆植物(其是本发明的大豆植物)与表现出改善的/维持的产量性状、改善的植物结构和/或改善的/维持的抗病性状的表型的第二大豆植物杂交;和选择包含GRF转录因子基因中的突变和改善/维持的产量性状、改善的植物结构和/或改善/维持的抗病性状的表型的后代大豆植物,从而产生包含内源GRF转录因子基因中的突变并且与对照大豆植物相比表现出改善的/维持的产量性状、改善的植物结构和/或改善的/维持的抗病性状的表型的大豆植物,任选地其中与对照大豆植物相比,所述大豆植物或其植物部分表现出改善的防御性状而不丧失产量性状或改善的产量性状而不丧失抗病性状的表型。
另一方面,本发明提供了控制容器(例如,花盆或种子盘等)、生长室、温室、田地、休闲区、草坪或路边中的杂草的方法,包括将除草剂施用于生长在容器、生长室、温室、田地、休闲区、草坪或路边中的一种或多种(多个)本发明的大豆植物,从而控制一种或多种大豆植物生长在其中的容器、生长室、温室、田地、休闲区、草坪或路边中的杂草。
还提供了一种减少大豆植物上的昆虫捕食的方法,包括将杀虫剂施用于本发明的一种或多种大豆植物,从而减少所述一种或多种大豆植物上的昆虫捕食。
还提供了一种减少大豆植物上的真菌病害的方法,包括将杀真菌剂施用于本发明的一种或多种大豆植物,从而减少所述一种或多种大豆植物上的真菌病害。
还提供了在其基因组中包含通过本发明的方法产生的具有非天然突变的一种或多种GRF转录因子基因的大豆植物,以及用于制备本发明的大豆植物的多肽、多核苷酸、核酸构建体、表达盒和载体。
本发明的这些和其他方面在下面的本发明的描述中更详细地阐述。
序列简要描述
SEQ ID NO:1-17是可用于本发明的示例性Cas12a氨基酸序列。
SEQ ID NO:18-20是可用于本发明的示例性Cas12a核苷酸序列。
SEQ ID NO:21-22是编码启动子和内含子的示例性调节序列。
SEQ ID NO:23-29是可用于本发明的示例性胞嘧啶脱氨酶序列。
SEQ ID NO:30-40是可用于本发明的示例性腺嘌呤脱氨酶氨基酸序列。
SEQ ID NO:41是可用于本发明的示例性尿嘧啶-DNA糖基化酶抑制剂(UGI)序列。
SEQ ID NO:42-44提供了V型CRISPR-Cas12a核酸酶的前间隔区邻近基序位置的实例。
SEQ ID NO:45-47提供了可用于本发明的示例性肽标签和亲和多肽。
SEQ ID NO:48-58提供了可用于本发明的示例性RNA募集基序和相应的亲和性多肽。
SEQ ID NO:59-60是可用于本发明的示例性Cas9多肽序列。
SEQ ID NO:61-71是可用于本发明的示例性Cas9多核苷酸序列。
SEQ ID NO:72、SEQ ID NO:75、SEQ ID NO:78、SEQ ID NO:81、SEQ ID NO:84、SEQID NO:87、SEQ ID NO:90和SEQ ID NO:93是编码大豆GRF转录因子的示例性基因组序列。
SEQ ID NO:73、SEQ ID NO:76、SEQ ID NO:79、SEQ ID NO:82、SEQ ID NO:85、SEQID NO:88、SEQ ID NO:91和SEQ ID NO:94是示例性大豆GRF转录因子编码(cds)序列。
SEQ ID NO:74、SEQ ID NO:77、SEQ ID NO:80、SEQ ID NO:83、SEQ ID NO:86、SEQID NO:89、SEQ ID NO:92和SEQ ID NO:95是示例性大豆GRF转录因子多肽序列。
SEQ ID NO:96-108和SEQ ID NO:122-129是用于如本文所述编辑的大豆GRF转录因子核酸的示例性区域。
SEQ ID NO:109是包含miR396结合位点的大豆GRF转录因子核酸的区域。
SEQ ID NO:110是由SEQ ID NO:109编码的大豆GRF转录因子多肽的区域。
SEQ ID NO:111-113和SEQ ID NO:130-132是用于靶向大豆GRF转录因子基因的示例性间隔序列。
SEQ ID NO:114-121是大豆GRF序列的部分。
SEQ ID NO:133-147是示例性编辑的GRF转录因子核酸。
SEQ ID NO:148-150是从如本文所述编辑的GRF转录因子核酸中缺失的示例性多核苷酸序列。
附图简要说明
图1提供了显示与野生型相比,编辑的大豆植物中GRF的表达水平的图。X轴标签指示GRF家族成员(GLYMA_12g014700)等位基因的基因型。Y轴指示GmGRF相对于内源对照基因ActII的表达。条形上方的标签指示每种基因型所包含的样品数量。
图2显示了源自包含编辑的GRF基因(GLYMA_12g014700)并具有如实施例2中所述的等位基因组合C的CE56564的三种E2植物的相对基因表达。
发明详述
现在将在下文中参考附图和实施例来描述本发明,其中示出了本发明的实施方案。该描述并非旨在成为可以实施本发明的所有不同方式或可以添加到本发明的所有特征的详细目录。例如,关于一个实施方案举例说明的特征可以并入其他实施方案中,并且关于特定实施方案举例说明的特征可以从该实施方案中缺失。因此,本发明设想在本发明的一些实施方案中,可以排除或省略本文阐述的任何特征或特征组合。此外,根据本公开内容,对本文提出的各种实施方案的许多变化和添加对于本领域技术人员来说将是明显的,它们不脱离本发明。因此,以下描述旨在举例说明本发明的一些特定实施方案,而不是详尽地指定其所有排列、组合和变化。
除非另有定义,本文使用的所有技术和科学术语与本发明所属领域的普通技术人员通常理解的含义相同。在本文的本发明的描述中使用的术语仅用于描述特定实施方案的目的,并不旨在限制本发明。
本文引用的所有出版物、专利申请、专利和其他参考文献关于与在其中呈现参考文献的句子和/或段落相关的教导通过引用整体并入。
除非上下文另有说明,否则本文所述的本发明的各种特征特别旨在以任何组合形式使用。此外,本发明还设想在本发明的一些实施方案中,可以排除或省略本文阐述的任何特征或特征组合。为了举例说明,如果说明书声明组合物包含组分A、B和C,则特别意在A、B或C中的任何一个或其组合可以单独或以任何组合被省略和弃权。
如在本发明和所附权利要求的描述中使用的,除非上下文另有明确指示,否则单数形式“一个”、“一种”和“该”意在也包括复数形式。
也如本文所用,“和/或”是指并且包括一个或多个相关列出的项目的任何和所有可能的组合,以及在替代(“或”)中解释时组合的缺乏。
如本文所用的术语“约”在提及可测量值诸如量或浓度时,意在涵盖规定值的±10%、±5%、±1%、±0.5%或甚至±0.1%的变化以及规定值。例如,其中X是可测量的值的“约X”意在包括X以及X的±10%、±5%、±1%、±0.5%或甚至±0.1%的变化。此处提供的可测量值的范围可以包括任何其他范围和/或其中的个体值。
如本文所用,诸如“在X和Y之间”和“在约X和Y之间”的短语应当被解释为包括X和Y。如在本文中使用的,诸如“约X和Y之间”的短语意指“约X和约Y之间”并且诸如“从约X到Y”的短语意指“从约X到约Y”。
除非在本文中另有说明,否则本文中数值范围的列举仅旨在用作单独引用落入该范围内的每个单独值的速记方法,并且每个单独的值被并入说明书中,就好像它在本文中单独列举一样。例如,如果公开了范围10到15,则还公开了11、12、13和14。
如本文所用,术语“包括”、“包含”和“含有”指定了所述特征、整数、步骤、操作、元素和/或组件的存在,但不排除一种或多种其他特征、整数、步骤、操作、元素、组件和/或它们的组的存在或添加。
如本文所用,过渡短语“基本上由……组成”是指权利要求的范围应解释为包括权利要求中列举的具体材料或步骤,以及那些不实质影响要求保护的本发明的基本和新颖特征的材料或步骤。因此,当在本发明的权利要求中使用时,术语“基本上由……组成”并不旨在解释为等同于“包括”。
如本文所用,术语“增加”、“增加的”、“增加了”、“增强”、“增强的”、“增强了”和“增强”(及其语法变体)描述了与对照相比至少约15%、20%、25%、50%、75%、100%、150%、200%、300%、400%、500%或更多的升高。例如,包含如本文所述的生长调节因子(GRF)转录因子基因中的突变的植物可以表现出对大豆锈菌(例如,豆薯层锈菌(Phakopsorapachyrhizi)(亚洲大豆锈病)和山马蝗层锈菌(Phakopsora meibomiae)(新世界大豆锈病))增加的抗性(或降低的易感性),即比不包含相同突变的植物的抗性高至少约5%的抗性。
如本文所用,术语“降低”、“降低的”、“降低了”、“减少”、“减小”和“减轻”(及其语法变体)描述例如与对照相比至少约5%、10%、15%、20%、25%、35%、50%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的降低。在一些实施方案中,降低可导致没有或基本上没有(即,微不足道的量,例如,小于约10%或甚至5%)可检测的活性或量。
如本文所用,关于核酸分子和/或核苷酸序列(例如,RNA或DNA)的术语“表达”、“表达的”、“表达了”或“表达”等表示核酸分子和/或核苷酸序列被转录和任选地被翻译。因此,核酸分子和/或核苷酸序列可以表达感兴趣的多肽或例如功能性非翻译RNA。
“异源”或“重组”核苷酸序列是与其引入的宿主细胞不天然相关的核苷酸序列,包括天然存在的核苷酸序列的非天然存在的多个拷贝。
“天然”或“野生型”核酸、核苷酸序列、多肽或氨基酸序列是指天然存在的或内源性核酸、核苷酸序列、多肽或氨基酸序列。因此,例如,“野生型mRNA”是天然存在于参考生物体中或对于参考生物体内源性的mRNA。
如本文所用,术语“杂合的”是指其中不同等位基因位于同源染色体上相应基因座的遗传状态。
如本文所用,术语“纯合的”是指其中相同等位基因位于同源染色体上的相应基因座的遗传状态。
如本文所用,术语“等位基因”是指出现在特定基因座处的两种或更多种不同核苷酸或核苷酸序列之一。
“无效等位基因”是由基因突变引起的非功能性等位基因,该基因突变导致完全缺乏相应蛋白质的产生或产生非功能性蛋白质。
“显性失活突变”是产生改变的基因产物(例如,相对于野生型具有异常功能)的突变,该基因产物不利地影响野生型等位基因或基因产物的功能。例如,“显性失活突变”可能会阻断野生型基因产物的功能。显性失活突变也可称为“反效等位基因突变”。
“半显性突变”是指杂合生物中表型的外显率低于纯合生物中观察到的突变。
“弱功能丧失突变”是导致基因产物与野生型基因产物相比具有部分功能或降低的功能(部分失活)的突变。
“亚形态突变”是导致基因功能部分丧失的突变,其可能通过降低表达(例如,减少蛋白质和/或减少RNA)或降低功能性能(例如,降低活性)而发生,但不是完全丧失功能/活性。“亚形态”等位基因是由基因突变引起的半功能等位基因,该基因突变导致功能在正常效率的1%到99%之间的相应蛋白质的产生。
“超形态突变”是导致基因产物表达增加和/或基因产物活性增加的突变。
“基因座”是基因或标记或等位基因所在的染色体上的位置。在一些实施方案中,基因座可以包含一个或多个核苷酸。
如本文所用,术语“所需等位基因”、“靶等位基因”和/或“感兴趣的等位基因”可互换使用以指代与所需性状相关的等位基因。在一些实施方案中,所需等位基因可与给定性状的增加或减少(相对于对照)或给定性状相关,这取决于所需表型的性质。在本发明的一些实施方案中,短语“期望的等位基因”、“靶等位基因”或“感兴趣的等位基因”是指与植物在非水胁迫条件下相对于没有一种或多种靶等位基因的对照植物的增加的产量相关的等位基因。
当性状与标记相关并且当标记的存在是所需性状或性状形式是否将在包含所述标记的植物/种质中出现和/或以何种程度出现的指示时,所述标记与所述性状“相关”。类似地,当标记与等位基因或染色体区间相关并且当标记的存在是等位基因或染色体区间是否存在于包含标记的植物/种质中的指示时,标记与等位基因或染色体区间“相关”。
如本文所用,术语“回交”和“回交的”是指将后代植物回交至其亲本之一一次或多次(例如,1、2、3、4、5、6、7、8等)的过程。在回交方案中,“供体”亲本是指具有要渗入的所需基因或基因座的亲本植物。“受体”亲本(使用一次或多次)或“循环”亲本(使用两次或更多次)是指基因或基因座正在渗入的亲本植物。例如,参见Ragot,M.等人,Marker-assistedBackcrossing:A Practical Example,TECHNIQUES ET UTILISATIONSDES MARQUEURSMOLECULAIRES LES COLLOQUES,Vol.72,pp.45-56(1995);和Openshaw等人,Marker-assisted Selection in Backcross Breeding,PROCEEDINGS OF THE SYMPOSIUM“ANALYSIS OF MOLECULAR MARKER DATA,”pp.41-43(1994)。最初的杂交产生了F1代。术语“BC1”是指回交双亲的第二次使用,“BC2”是指回交双亲的第三次使用,依此类推。
如本文所用,术语“杂交”或“杂交的”是指配子通过授粉融合以产生后代(例如,细胞、种子或植物)。该术语包括有性杂交(一种植物由另一种植物授粉)和自交(自花授粉,例如,当花粉和胚珠来自同一植物时)。术语“杂交”是指通过授粉融合配子以产生后代的行为。
如本文所用,术语“基因渗入”、“基因渐渗”和“基因渗入的”是指遗传基因座的所需等位基因或所需等位基因组合从一种遗传背景到另一种遗传背景的天然和人工传递。例如,可以通过同一物种的两个亲本之间的有性杂交将特定基因座处的所需等位基因传递给至少一个后代,其中至少一个亲本在其基因组中具有所需等位基因。可替代地,例如,等位基因的传递可以通过两个供体基因组之间的重组发生,例如在融合的原生质体中,其中至少一个供体原生质体在其基因组中具有所需的等位基因。所需等位基因可以是标记、QTL、转基因等的选定等位基因。包含所需等位基因的后代可以与具有所需遗传背景的品系回交一次或多次(例如,1、2、3、4或更多次),选择所需等位基因,结果是所需等位基因固定在所需的遗传背景中。例如,与在非水胁迫条件下增加的产生相关的标记可以从供体渗入到不包含该标记并且在非水胁迫条件下不表现出增加的产生的回交亲本中。然后可以将所得后代回交一次或多次并进行选择,直到后代具有与回交亲本背景中的非水胁迫条件下的产生增加相关的遗传标记。
“遗传图谱”是对给定物种内一条或多条染色体上基因座之间遗传连锁关系的描述,通常以图解或表格形式描绘。对于每个遗传图谱,基因座之间的距离通过它们之间的重组频率来衡量。可以使用多种标记检测基因座之间的重组。遗传图谱是对群体、使用的标记类型以及不同群体之间每个标记的多态性潜力作图的产物。基因座之间的顺序和遗传距离可以从一个遗传图谱到另一个遗传图谱不同。
如本文所用,术语“基因型”是指个体(或个体群体)在一个或多个遗传基因座处的遗传构成,与可观察和/或可检测和/或表现的性状(表型)形成对比。基因型由个体从其亲本继承的一个或多个已知基因座的等位基因定义。术语基因型可用于指个体在单个基因座、多个基因座处的遗传构成,或更一般地,术语基因型可用于指个体基因组中所有基因的遗传构成。基因型可以间接表征,例如使用标记,和/或通过核酸测序直接表征。
如本文所用,术语“种质”是指来自或来源于个体(例如植物)、个体群体(例如植物品系、品种或科)的遗传物质,或源自品系、品种、物种或培养物的克隆。种质可以是生物体或细胞的一部分,或者可以与生物体或细胞分离。一般来说,种质提供了具有特定的遗传组成的遗传物质,其为生物体或细胞培养物的部分或全部遗传特性提供了基础。如本文所用,种质包括可从其生长新植物的细胞、种子或组织,以及可培养成整株植物的植物部分(例如,叶、茎、芽、根、花粉、细胞等)。.
如本文所用,术语“栽培品种”和“品种”是指通过结构或遗传特征和/或性能可与同一物种内的其他品种区分开来的一组相似植物。
如本文所用,术语“外来的”、“外来品系”和“外来种质”是指非优良的任何植物、品系或种质。一般而言,外来植物/种质不是源自任何已知的优良植物或种质,而是被选择以将一种或多种所需遗传元件引入育种程序中(例如,将新等位基因引入育种程序中)。
如本文所用,植物育种上下文中的术语“杂种”是指作为通过杂交不同品系或品种或物种的植物(包括但不限于两个近交系之间的杂交)产生的遗传不同亲本的后代的植物。
如本文所用,术语“近交”是指基本上纯合的植物或品种。该术语可以指在整个基因组中基本上是纯合的或者就特别感兴趣的基因组的一部分而言基本上是纯合的植物或植物品种。
“单倍型”是在多个基因座处的个体的基因型,即等位基因的组合。通常,定义单倍型的遗传基因座在物理上和遗传上是相连的,即在同一染色体区段上。术语“单倍型”可以指特定基因座处的多态性,例如单个标记基因座,或沿着染色体区段的多个基因座处的多态性。
如本文所用,术语“异源”是指源自外来物种或者如果源自相同物种则通过有意的人为干预在组成和/或基因组基因座上从其天然形式显著修饰的核苷酸/多肽。
与缺乏至少一个内源GRF转录因子基因中的修饰的大豆植物相比,其中至少一个GRF转录因子基因被如本文所述修饰(例如,包含如本文所述的修饰)的大豆植物可具有改善的产量性状。如本文所用,“产量性状”是指与生长相关的任何植物性状,例如生物量、产量、氮利用效率(NUE)、花序大小/重量、果实产量、果实质量、果实大小、种子大小、种子数、叶组织重量、结瘤数、结瘤质量、结瘤活性、种子头数、分蘖数、分枝数、花量、块茎量、块茎质量、鳞茎质量、种子数、总种子质量、出叶率、分蘖/分枝出现率、出苗率、根的长度、根的数量、根群的大小和/或重量,或它们的任何组合。因此,在一些方面,“改善的产量性状”可以包括但不限于与对照植物或其部分(例如,不包含/缺乏突变的内源GRF转录因子核酸(例如突变的GRF转录因子基因)的植物)相比增加的花序产量、增加的果实产量(例如增加的果实数量、重量和/或大小;例如,例如玉米的穗的增加的数量、重量和/或大小)、增加的果实质量、根的增加的数量、大小和/或重量、增加的分生组织大小、增加的种子大小、增加的生物量、增加的叶大小、增加的氮利用效率、增加的高度、增加的节间数量和/或增加的节间长度。改善的产量性状也可以由本发明的植物的增加的种植密度产生。因此,在一些方面,本发明的植物能够以增加的密度种植(由于内源突变导致的改变的植物结构的结果),这导致与在相同的密度下种植的对照植物相比改善的产量性状。在一些方面,改善的产量性状可以表示为每面积土地生产的谷物数量(例如,每英亩土地的蒲式耳)。
如本文所用,“改善的植物结构”是指对叶、茎、枝、根等的任何修饰,其可以改善诸如产量和抗病性的因素。在一些实施方案中,具有改善的植物结构的植物可以表现出增强的抗病性和维持或增加的产量。改善的植物结构可包括例如增加的叶的数量和/或大小、增加的分枝或分枝点的数量、增加的分枝数量、增加的植物生物量、更陡的根角(例如更窄的根角)、更长的根、增加的通气组织、增加的根生物量、细胞壁/细胞结构成分的增厚等。
如本文所用,“对照植物”意指不含有如本文所述的赋予增强/改善的性状(例如,产量性状)或改变的表型的经编辑的一个或多个GRF转录因子基因的植物。对照植物用于鉴定和选择如本文所述编辑的并且与对照植物相比具有增强的性状或改变的表型的植物。合适的对照植物可以是用于产生包含突变的GRF转录因子基因的植物的亲本系的植物,例如,缺乏如本文所述的内源GRF转录因子基因中的编辑的野生型植物。合适的对照植物还可以是含有赋予其他性状的重组核酸的植物,例如具有增强的除草剂耐受性的转基因植物。在一些情况下,合适的对照植物可以是缺乏如本文所述的突变的GRF转录因子基因的杂合或半合转基因植物系的后代,称为负分离或负等基因系。
增强的产量性状可以是例如与对照植物相比,从种植到成熟的天数减少、茎大小增加、叶子数量增加、营养阶段的植物高度生长速率增加、穗大小增加、每株植物增加的穗干重、每穗增加的籽粒数量、每籽粒增加的重量、每株植物增加的籽粒数量、减少的空穗、延长的谷粒填充期、降低的植物高度、增加的根枝数量、增加的总根长、增加的产量、增加的氮利用效率和增加的水利用效率。改变的表型可以是例如植物高度、生物量、冠层面积、花青素含量、叶绿素含量、施用的水、水含量和水利用效率。
如本文所用,“性状”是植物或特定植物材料或细胞的生理学、形态学、生物化学或物理学特征。在一些情况下,该特征是人眼可见的并且可以机械地测量,例如种子或植物的大小、重量、形状、形式、长度、高度、生长速率和发育阶段,或者可以通过生物化学技术测量,例如检测种子或叶子的蛋白质、淀粉、某些代谢物或油含量,或通过观察代谢或生理过程,例如通过测量对缺水或特定盐或糖浓度的耐受性,或通过测量一个或多个基因的表达水平,例如通过采用Northern分析、RT-PCR、微阵列基因表达测定或报告基因表达系统,或通过农业观察例如高渗胁迫耐受性或产量。然而,可以使用任何技术来测量转基因植物中任何选择的化合物或大分子的量、比较水平或差异。
如本文所用,“增强的性状”是指由本文所述的GRF转录因子基因中的突变引起的植物的特征。此类性状包括但不限于增强的农艺性状,其特征在于增强的植物形态、生理学、生长和发育、产量、营养增强、疾病或害虫抗性(例如,增强的大豆胞囊线虫(SCN)抗性;增强的对大豆锈菌例如豆薯层锈菌(亚洲大豆锈病)和/或山马蝗层锈菌(新世界大豆锈病)的抗性;或环境或化学耐受性。在一些实施方案中,增强的性状/改变的表型可以是例如与对照植物相比,从种植到成熟的天数减少、茎大小增加、叶子数量增加、营养阶段的植物高度生长速率增加、穗大小增加、每株植物增加的穗干重、每穗增加的籽粒数量、每籽粒增加的重量、每株植物增加的籽粒数量、减少的空穗、延长的谷粒填充期、降低的植物高度、增加的根枝数量、增加的总根长、耐旱、增加的水利用效率、耐寒、增加的氮利用效率和增加的产量。在一些实施方案中,性状是在非胁迫条件下增加的产量或在环境胁迫条件下增加的产量。胁迫条件可包括生物胁迫和非生物胁迫,例如干旱、遮荫、真菌病、病毒病、细菌病、昆虫侵扰、线虫侵扰、低温暴露、热暴露、渗透胁迫、减少的氮养分可用性、减少的磷养分可用性和高植物密度。“产量”可以受到许多特性的影响,包括但不限于植物高度、植物生物量、豆荚数量、植物上的豆荚位置、节间数目、豆荚破碎的发生率、谷粒大小、穗大小、穗尖充盈度、籽粒败育、结瘤和固氮效率、养分同化效率、生物和非生物胁迫抗性、碳同化、植物结构、抗倒伏性、种子发芽率、幼苗活力和幼体性状。产量还可能受到以下因素的影响:发芽效率(包括应激条件下的发芽)、生长速率(包括应激条件下的生长速率)、开花时间和持续时间、穗数、穗大小、穗重量、每穗或豆荚的种子数、种子大小、种子成分(淀粉、油、蛋白质)和种子填充物的特征。
本文还使用的术语“性状修饰”涵盖通过在包含如本文所述的内源GRF转录因子基因中的突变的植物中相对于不包含该突变的植物(例如野生型植物或负分离植物)产生可检测的特征差异来改变天然存在的性状。在一些情况下,可以定量评估性状改变。例如,与对照植物相比,性状修饰可以导致观察到的性状特征或表型的增加或减少。众所周知,经修饰的性状中可能存在自然变异。因此,观察到的性状修饰需要与对照植物相比,植物中性状特征或表型的正态分布和幅度的变化。
本公开内容涉及具有改善的经济上重要的特征的植物,更具体地增加的产量。更具体地,本公开内容涉及包含如本文所述的GRF转录因子基因中的突变的植物,其中所述植物与缺乏所述突变的对照植物相比具有增加的产量。在一些实施方案中,如本文所述产生的植物与对照植物相比表现出增加的产量或改善的产量性状成分。在一些实施方案中,本公开内容的植物表现出与产量相关的改善的性状,包括但不限于增加的氮利用效率、增加的氮胁迫耐受性、增加的水利用效率和增加的干旱耐受性,如下文所定义和讨论的。
产量可以被定义为农作物的经济价值的可测量的产出。产量可以在数量和/或质量的范围内定义。产量可以直接取决于几个因素,例如,器官的数量和大小、植物结构(例如分枝数量、植物生物量,例如更陡的根角(例如更窄的根角)、更长的根、增加的分枝数量、增加的通气组织、增加的根生物量等)、开花时间和持续时间、谷粒填充期。根结构和发育、光合效率、养分吸收、胁迫耐受性、早期活力、延迟的衰老和功能性持绿表型可能是决定产量的因素。因此,优化上述因素有助于提高作物产量。
本文提及的产量相关性状的增加/改善也可以被认为是指植物的一个或多个部分的生物量(重量)的增加,其可以包括地上和/或地下(可收获)植物部分。具体地,此类可收获部分是种子,并且本公开内容的方法的实施导致相对于合适的对照植物的种子产量具有增加的产量和特别是增加的种子产量的植物。术语植物的“产量”可以涉及该植物的营养生物量(根和/或芽生物量)、生殖器官和/或繁殖体(例如种子)。
本公开内容的植物的增加的产量可以通过多种方式测量,包括测试重量、每株植物的种子数、种子重量、每单位面积的种子数(例如,每英亩的种子或种子的重量)、每英亩的蒲式耳、每英亩的吨或每公顷的公斤。增加的产量可以通过关键生化化合物(例如氮、磷和碳水化合物)的改善的利用,或对环境胁迫例如冷、热、干旱、盐、遮荫、高植物密度以及害虫或病原体攻击的改善的反应来实现。
“增加的产量”可以表现为以下一种或多种:(i)植物的一个或多个部分的增加的植物生物量(重量),特别是植物的地上(可收获)部分,增加的根生物量(增加的根数量、增加的根厚度、增加的根长度)或任何其他可收获部分的增加的生物量;或(ii)增加的早期活力,本文定义为发芽后约三周改善的幼苗地上面积。
“早期活力”是指积极健康的植物生长,尤其是在植物生长的早期阶段,并且可以由于因例如植物更好地适应其环境(例如,优化能源的使用、养分的吸收以及在芽和根之间分配碳份额)而增加的植物适应度引起。例如,早期活力可以是种子在种植后发芽和出苗的能力以及幼苗在出苗后生长和发育的能力的组合。具有早期活力的植物还表现出增加的幼苗存活率和更好的作物定植,这通常导致高度均匀的田地,其中大多数植物基本上同时达到不同的发育阶段,这通常导致增加的产量。因此,早期活力可以通过测量各种因素来确定,例如籽粒重量、发芽率、出苗率、幼苗生长、幼苗高度、根长、根和芽生物量、冠层大小和颜色等。
此外,增加的产量还可以表现为增加的总种子产量,这可能是由于因每株植物和/或单个种子基础上的种子重量的增加所致的种子生物量(种子重量)的增加,每株植物增加的花/圆锥花序数量;增加的豆荚数量;增加的茎节数量;每穗/植物增加的花(“小花”)数量;增加的种子饱满率;增加的饱满种子的数量;增加的种子大小(长度、宽度、面积、周长),这也可影响种子的成分;和/或增加的种子体积(这也可影响种子的成分)中的一种或多种引起的。在一个实施方案中,增加的产量可以是增加的种子产量,例如增加的种子重量;增加的饱满种子的数量;和增加的收获指数。
增加的产量也可能导致修饰的结构,或者可能修饰的植物结构而发生。
增加的产量也可以表现为增加的收获指数,其表示为可收获部分(例如种子)的产量与总生物量的比率。
本公开内容还延伸至植物的可收获部分,例如但不限于种子、叶、果实、花、棉铃、豆荚、长角果、坚果、茎、根茎、块茎和球茎。本公开内容还涉及源自此类植物的可收获部分的产品,例如干颗粒、粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
本公开内容提供了用于增加植物的“产量”或植物或植物部分的“大英亩产量”的方法,其被定义为每单位面积可收获的植物部分,例如每英亩的种子或种子的重量、每英亩的磅、每英亩蒲式耳、每英亩的吨(tones per acre)、每英亩的吨、每公顷的公斤。
如本文所用,“氮利用效率”是指导致施用的每单位氮的植物产量、生物量、活力和生长速率增加的过程。这些过程可以包括植物对氮的吸收、同化、积累、信号传导、传感、再转移(在植物内)和利用。
如本文所用,“增加的氮利用效率”是指当经受与正常或标准条件下相同量的可用/施用的氮时,植物比正常情况更快或更好地生长、发育或生产的能力;植物在经受低于可用/施用的氮的最佳量或在氮限制条件下正常生长、发育或生产或者更快或更好地生长、发育或生产的能力。
如本文所用,“氮限制条件”是指提供低于充分或成功的植物代谢、生长、繁殖成功和/或活力所需的最佳氮量的生长条件或环境。
如本文所用,“增加的氮胁迫耐受性”是指植物在经受低于可用/施加的氮的最佳量时或在氮限制条件下正常生长、发育或生产或者更快或更好地生长、发育或生产的能力。
增加的植物氮利用效率可以在田间转化为在供应更少的氮的同时收获相似数量的产量,或者通过供应最佳/足够量的氮获得增加的产量。增加的氮利用效率可以提高植物氮胁迫耐受性,并且还可以改善作物品质和种子的生化成分,例如蛋白质产量和油产量。术语“增加的氮利用效率”、“增强的氮利用效率”和“氮胁迫耐受性”在本公开内容中可互换使用,是指在氮限制条件下具有提高的生产力的植物。
如本文所用,“水利用效率”是指每单位蒸腾的水蒸气被叶子吸收的二氧化碳的量。它构成控制干燥环境中植物生产力的最重要性状。“耐旱性”是指植物适应干燥或干旱条件的程度。植物对缺水的生理反应包括叶子枯萎、叶面积减少、叶子脱落以及通过将养分引导到植物的地下部分来刺激根部生长。通常,植物在开花和种子发育(繁殖阶段)期间更容易受到干旱的影响,因为植物的资源被用来支持根生长。此外,脱落酸(ABA)(一种植物应激激素)诱导叶片气孔(参与气体交换的微孔)关闭,从而减少通过蒸腾作用的水分流失,并降低光合作用速率。这些措施在短期内提高了植物的水利用效率。术语“增加的水利用效率”、“增强的水利用效率”和“增加的耐旱性”在本公开内容中可互换使用,是指在水限制条件下具有改善的生产力的植物。
如本文所用,“增加的水利用效率”是指当经受与正常或标准条件下相同量的可用/施用的水时,植物比正常情况更快或更好地生长、发育或生产的能力;当经受减少量的可用/施用的水(水输入)或在水分胁迫或缺水胁迫条件下时,植物正常生长、发育或生产或者更快或更好地生长、发育或生产的能力。
如本文所用,“增加的耐旱性”是指当经受减少量的可用/施用的水和/或在急性或慢性干旱条件下时,植物正常生长、发育或生产或者比正常情况更快或更好地生长、发育或生产的能力;当经受减少量的可用/施用的水(水输入)或在缺水胁迫条件下或在急性或慢性干旱条件下,植物正常生长、发育或生产的能力。
如本文所用,“干旱胁迫”是指导致缺水并使植物遭受胁迫和/或植物组织损伤和/或负面影响谷物/作物产量的干燥时期(急性或慢性/长期);导致缺水和/或气温升高并使植物遭受胁迫和/或植物组织损伤和/或负面影响谷物/作物产量的干燥时期(急性或慢性/长期)。
如本文所用,“缺水”是指提供低于植物充分/成功生长和发育所需的最佳水量的条件或环境。
如本文所用,“水胁迫”是指提供比植物/作物充分/成功生长和发育所需的水量不适当(更少/不足或更多/过量)的水量的条件或环境,从而使植物遭受胁迫和/或植物组织损伤和/或负面影响谷物/作物产量。
如本文所用,“缺水胁迫”是指提供比植物/作物充分/成功生长和发育所需的水量更少/不足的水量的条件或环境,从而使植物遭受胁迫和/或植物组织损伤和/或负面影响谷物产量。
术语“增强的根结构”、“修饰的根结构”或“改善的根结构”可以互换使用,并且是指提供植物吸收水和养分的能力的改善的根结构,特别是当植物在可能限制不包含增强的根结构的植物中的水和养分吸收(例如,干旱条件)的环境条件下生长时。增强的根结构的特征可以在于表型,包括但不限于更陡的根角、更长的根、增加的分枝数量、增加的通气组织、增加的根生物量和/或改善的产量性状。
如本文所用,术语“核酸”、“核酸分子”、“核苷酸序列”和“多核苷酸”是指线性或支链、单链或双链或其混合体的RNA或DNA。该术语还包括RNA/DNA混合体。当合成产生dsRNA时,较少见的碱基如肌苷、5-甲基胞嘧啶、6-甲基腺嘌呤、次黄嘌呤等也可用于反义、dsRNA和核酶配对。例如,含有尿苷和胞苷的C-5丙炔类似物的多核苷酸已被证明以高亲和力结合RNA,并且是基因表达的强效反义抑制剂。还可以进行其他修饰,例如对磷酸二酯骨架的修饰,或对RNA的核糖糖基中的2'-羟基的修饰。
如本文所用,术语“核苷酸序列”是指核苷酸的杂聚物或这些核苷酸从核酸分子的5’端至3’端的序列,并且包括DNA或RNA分子,包括cDNA、DNA片段或部分、基因组DNA、合成(例如,化学合成)DNA、质粒DNA、mRNA和反义RNA,其中任何一种都可以是单链或双链的。术语“核苷酸序列”、“核酸”、“核酸分子”、“核酸构建体”、“寡核苷酸”和“多核苷酸”在本文中也可互换地用于指核苷酸的杂聚物。本文提供的核酸分子和/或核苷酸序列在本文中从左到右以5’至3’方向呈现,并使用代表美国序列规则、37CFR§§1.821-1.825和世界知识产权组织(WIPO)标准ST.25中所述的核苷酸字符的标准代码来表示。如本文所用,“5’区域”可以是指最接近多核苷酸的5’端的多核苷酸的区域。因此,例如,多核苷酸的5’区域中的元件可以位于从位于多核苷酸5’端的第一核苷酸到位于多核苷酸中间的核苷酸的任何位置。如本文所用,“3’区域”可以是指最接近多核苷酸的3’端的多核苷酸的区域。因此,例如,多核苷酸的3’区域中的元件可以位于从位于多核苷酸3’端的第一核苷酸到位于多核苷酸中间的核苷酸的任何位置。
如本文关于核酸使用的,术语“片段”或“部分”是指相对于参考核酸长度减少(例如减少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、400、450、500、550、600、650、700、750、800、850、900、950或1000或更多个核苷酸或其中的任何范围或值)并且包含与参考核酸的相应部分相同或几乎相同(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同)的连续核苷酸的核苷酸序列、基本上由其组成和/或由其组成的核酸。在适当的情况下,这样的核酸片段可以包含在更大的多核苷酸中,该核酸片段是该多核苷酸的组成部分。例如,本发明的引导核酸的重复序列可以包含野生型CRISPR-Cas重复序列的一部分(例如,野生型CRISR-Cas重复序列;例如,来自例如Cas9、Cas12a(Cpf1)、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b和/或Cas14c等的CRISPR Cas系统的重复序列)。
作为进一步的实例,编码GRF转录因子多核苷酸的核酸的“片段”或“部分”可以是GRF转录因子核酸的约5、6、7、8、9、10、15、20、25 30、35、40、45、50、55、60、65、70、75、80、85、90、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、420、440、460、480、500、520、540、560、580、600、650、700、750、800、850、900、950、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、3000、3250、3500、3750、4000、4250、4500、4750、5000、5250、5500、5750或更多(任选地约10、20、30、40、50、100、150、300至约2500、3000、3500、4000、4500、5000、5500或更多,约10、20、30、40至约50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、250或300)个连续核苷酸,或其中的任何范围或值,任选地其中片段、部分或区域可以被靶向用于编辑以提供表现出改善的或维持的产量性状、改善的植物结构和/或改善的或维持的抗病性状或其任何组合的表型的植物。在一些实施方案中,可被靶向用于编辑的GRF转录因子基因的部分或区域可以是GRF转录因子基因的mRNA的miR396结合位点。在一些实施方案中,可以被靶向用于的GRF转录因子基因的部分或区域可以是与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列包含至少80%序列同一性和/或编码与SEQ ID NO:104-108中任一个具有至少80%序列同一性的氨基酸序列的序列。
在一些实施方案中,可以如本文所述编辑核酸片段或部分(或区域),其中所述编辑导致缺失。在一些实施方案中,编辑可以在GRF转录因子核酸中,其中1、2、3、4、5、6、7、8、9、10至约50、60、70、80、90或100或更多(例如,101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、125、130、135、140、145或150或更多)个连续核苷酸可从GRF转录因子核酸中缺失。在一些实施方案中,如本文所述的从GRF转录因子基因中缺失核苷酸可导致显性突变、半显性突变、无效突变、超形态突变、亚形态突变或弱功能丧失突变,其当包含在植物中时可导致植物与没有缺失/突变的植物相比表现出改善或维持的产量性状、改善的植物结构和/或改善或维持的抗病性或防御性状的表型。
如本文关于多肽使用的,术语“片段”或“部分”可以指相对于参考多肽长度减少并且包含与参考多肽的相应部分相同或几乎相同(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同)的连续氨基酸的氨基酸序列、基本上由其组成和/或由其组成的多肽。在适当的情况下,这样的多肽片段可以包含在更大的多肽中,该多肽片段是该更大的多肽的组成部分。在一些实施方案中,多肽片段包含参考多肽的至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、260、270、280、290、300、350、400或更多个连续氨基酸、基本上由其组成和/或由其组成。在一些实施方案中,多肽片段可包含GRF转录因子的约5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、525、550、560、570、580或更多个连续氨基酸残基、基本上由其组成和/或由其组成。
多核苷酸或多肽的“区域”分别指该多核苷酸或多肽的连续核苷酸或连续氨基酸残基的一部分。例如,GRF转录因子核酸的“区域”可以包括但不限于与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的序列,任选地SEQID NO:109,和/或编码与SEQ ID NO:104-108中任一个具有至少80%序列同一性的氨基酸序列,任选地SEQ ID NO:110。
在一些实施方案中,“序列特异性核酸结合结构域”(例如,序列特异性DNA结合结构域)可以结合GRF转录因子基因(例如,SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94)和/或GRF转录因子核酸的一个或多个片段、部分或区域(例如,如本文所述的允许例如与miRNA396结合位点相邻的miR396结合位点或区域的编辑的GRF转录因子基因的部分或区域)。
如本文所用,短语与miR396结合位点“相邻”或“相邻的区域”是指位于由GRF转录因子核酸编码的miR396结合位点的5'和/或3'的约1至50个连续碱基对,例如由GRF转录因子核酸编码的miRNA396结合位点5’的约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个连续碱基对或核苷酸和/或由GRF转录因子核酸编码的miR396结合位点的3'的约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个连续碱基对或核苷酸。
如本文关于核酸使用的,术语“功能片段”是指编码多肽的功能片段的核酸。
如本文所用,术语“基因”是指能够用于产生mRNA、反义RNA、miRNA、抗microRNA反义寡脱氧核苷酸(AMO)等的核酸分子。基因可能或可能不能够用于生产功能性蛋白或基因产物。基因可以包括编码区和非编码区(例如,内含子、调节元件、启动子、增强子、终止序列和/或5’和3’非翻译区)。基因可以是“分离的”,其是指大体上或基本上不含通常在其自然状态下与核酸相关联的组分的核酸。这些组分包括其他细胞材料、来自重组生产的培养基和/或用于化学合成核酸的各种化学品。
术语“突变”是指点突变(例如,错义或无义,或导致框内移码的单个碱基对的插入或缺失)、插入、缺失和/或截短。当突变是氨基酸序列中的一个残基被另一个残基取代,或者是序列中一个或多个残基的缺失或插入时,突变通常通过识别原始残基,然后是该残基在序列中的位置以及新取代的残基的身份来描述。在一些实施方案中,缺失或插入是框内或框外缺失或框内或框外插入,例如内源GRF转录因子核酸中的框内或框外缺失或框内或框外插入(例如,GRF转录因子核酸的miR396结合位点/结构域中或附近的框内或框外缺失或插入)。在一些实施方案中,植物中的此类突变导致植物与对照大豆植物(例如,缺乏突变的大豆植物)相比表现出一种或多种改善的产量性状、改善的植物结构和/或一种或多种改善的防御性状的表型。在一些实施方案中,植物中的此类突变导致植物与对照大豆植物相比表现出改善的抗病性状而不丧失产量性状(具有或不具有改善的植物结构),或改善的产量性状而不丧失抗病性状(具有或不具有改善的植物结构)的表型。
如本文所用,术语“互补”或“互补性”是指多核苷酸在允许的盐和温度条件下通过碱基配对的自然结合。例如,序列“A-G-T”(5'至3')与互补序列“T-C-A”(3'至5')结合。两个单链分子之间的互补性可能是“部分的”,其中只有一些核苷酸结合,或者当单链分子之间存在完全互补时,互补可能是完全的。核酸链之间的互补程度对核酸链之间杂交的效率和强度有显著影响。
如本文所用,“互补”可以是指与对照核苷酸序列的100%互补性,或其可以是指与比较核苷酸序列的小于100%的互补性(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%等的互补性,例如实质互补性)。
具有同源性的不同核酸或蛋白质在本文中称为“同源物”。术语同源物包括来自相同和其他物种的同源序列以及来自相同和其他物种的直系同源序列。“同源性”是指两个或更多个核酸和/或氨基酸序列在位置同一性百分比(即序列相似性或同一性)方面的相似性水平。同源性也是指不同核酸或蛋白质之间的相似功能特性的概念。因此,本发明的组合物和方法还包括与本发明的核苷酸序列和多肽序列的同源物。如本文所用,“直系同源物”是指在物种形成过程中从共同祖先基因产生的不同物种中的同源核苷酸序列和/或氨基酸序列。本发明的核苷酸序列的同源物与本发明的所述核苷酸序列具有实质性的序列同一性(例如,至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)。
如本文所用,“序列同一性”是指两个最佳比对的多核苷酸或多肽序列在组分(例如核苷酸或氨基酸)的比对的整个窗口中保持不变的程度。“同一性”可通过已知方法容易地计算,包括但不限于以下中描述的那些:Computational Molecular Biology(Lesk,A.M.,ed.)Oxford University Press,New York(1988);Biocomputing:Informatics andGenome Projects(Smith,D.W.,ed.)Academic Press,New York(1993);ComputerAnalysis of Sequence Data,Part I(Griffin,A.M.和Griffin,H.G.,eds.)HumanaPress,New Jersey(1994);Sequence Analysis in Molecular Biology(von Heinje,G.,ed.)Academic Press(1987);和Sequence Analysis Primer(Gribskov,M.和Devereux,J.,eds.)Stockton Press,New York(1991)。
如本文所用,术语“序列同一性百分比”或“同一性百分比”是指当两个序列最佳比对时,与测试(“对象”)多核苷酸分子(或其互补链)相比,参考(“查询”)多核苷酸分子(或其互补链)的线性多核苷酸序列中相同核苷酸的百分比。在一些实施方案中,“同一性百分比”可以指与参考多肽相比氨基酸序列中相同氨基酸的百分比。
如本文所用,在两个核酸分子、核苷酸序列或多肽序列的上下文中,短语“基本上相同”或“实质同一性”是指当针对最大对应性进行比较和比对时,具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%的核苷酸或氨基酸残基同一性的两个或更多个序列或子序列,如使用以下序列比较算法之一或通过目视检查测量的。在本发明的一些实施方案中,实质上的同一性存在于本发明的核苷酸序列的连续核苷酸区域上,该区域的长度为约10个核苷酸至约20个核苷酸、约10个核苷酸至约25个核苷酸、约10个核苷酸至约30个核苷酸、约15个核苷酸至约25个核苷酸、约30个核苷酸至约40个核苷酸、约50个核苷酸至约60个核苷酸、约70个核苷酸至约80个核苷酸、约90个核苷酸至约100个核苷酸、约100个核苷酸至约200个核苷酸、约100个核苷酸至约300个核苷酸、约100个核苷酸至约400个核苷酸、约100个核苷酸至约500个核苷酸、约100个核苷酸至约600个核苷酸、约100个核苷酸至约800个核苷酸、约100个核苷酸至约900个核苷酸、约500个核苷酸至约1000个核苷酸、约500个核苷酸至约1500个核苷酸、约500个核苷酸至约2000个核苷酸、约1000个核苷酸至约2000个核苷酸、约1000个核苷酸至约3000个核苷酸、或约1500个核苷酸至约4000个核苷酸、或更多个核苷酸,以及其中的任何范围,直到序列的全长。在一些实施方案中,核苷酸序列可以在至少约20个连续核苷酸(例如,约20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2500、3000、3500、4000、4500或5000个或更多个核苷酸)上基本相同。在一些实施方案中,两个或更多个GRF转录因子基因可以在GRF转录因子基因(例如SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94)的至少约10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400或1500至约2000、2050、2100、2150、2200、2250、2300、2350、2400、2450、2500、2510、2520、2530、2540、2550、2600、2650、2700、2750、2800、2850、2900、2950、3000、3050、3100、3150、3200、3250、3300、3350、3400、3450、3490、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900、5000、5250、5500、5750或更多个连续核苷酸上彼此基本上相同,任选地在GRF转录因子基因的约10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360,370、380、390、400、420、440、460、480或500个连续核苷酸至约900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、3000、3500、4000、4500或5000或更多个连续核苷酸上彼此基本上相同。
在本发明的一些实施方案中,实质同一性存在于本发明的多肽的连续氨基酸残基的区域上,所述区域的长度为约3个氨基酸残基至约10、11、12、13、14、15、16、17、18、19或20个氨基酸残基、约5个氨基酸残基至约25、30、35、40、45、50或60个氨基酸残基、约15个氨基酸残基至约30个氨基酸残基、约20个氨基酸残基至约40个氨基酸残基、约25个氨基酸残基至约40个氨基酸残基、约25个氨基酸残基至约50个氨基酸残基、约30个氨基酸残基至约50个氨基酸残基、约40个氨基酸残基至约50个氨基酸残基、约40个氨基酸残基至约70个氨基酸残基、约50个氨基酸残基至约70个氨基酸残基、约60个氨基酸残基至约80个氨基酸残基、约70个氨基酸残基至约80个氨基酸残基、约90个氨基酸残基至约100个氨基酸残基或更多个氨基酸残基,以及其中的任何范围,直至序列的全长。在一些实施方案中,多肽序列可以在至少约8、9、10、11、12、13、14或更多个连续氨基酸残基(例如,约8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、130、140、150、175、200、225、250、275、300、325、350、400、450、500个或更多个氨基酸的长度或更多连续氨基酸残基)上彼此基本上相同。在一些实施方案中,两个或更多个GRF转录因子多肽可以在例如SEQ ID NO:74、77、80、83、86、89、92或95的氨基酸序列的至少约10至约550或更多个连续氨基酸残基上;例如,在例如SEQ ID NO:74、77、80、83、86、89、92或95的氨基酸序列的至少约10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、71、72、73、74、75、76、77、78、79、80、85、90、95、100、105、110、120、125、130、135、140、145、150、155、160、165、170、175、200、205、210、215、220、225、230、235、240、245、250、255、260、265、270、275、280、290、300、350、400、450、500、510、520、530、540、550、560、570、580或590或更多个连续氨基酸残基上彼此基本上相同。在一些实施方案中,基本上相同的核苷酸或蛋白质序列可以执行与其基本上相同的核苷酸(或编码的蛋白质序列)基本上相同的功能。
对于序列比较,通常一个序列充当与测试序列进行比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入计算机,必要时指定子序列坐标,并指定序列算法程序参数。然后,序列比较算法基于指定的程序参数计算测试序列相对于参考序列的序列同一性百分比。
用于对比较窗口进行比对的序列的最佳比对是本领域技术人员熟知的,并且可以通过诸如Smith和Waterman的局部同源算法、Needleman和Wunsch的同源比对算法、Pearson和Lipman的相似性方法的搜索的工具以及可选地通过这些算法的计算机化实现诸如GAP、BESTFIT、FASTA和TFASTA(作为Wisconsin(Accelrys Inc.,SanDiego,CA)的一部分提供)来进行。测试序列和参考序列的比对区段的“同一性分数”是指两个比对序列共享的相同组分的数量除以参考序列区段(例如,整个参考序列或参考序列的较小定义部分)中组分的总数。序列同一性百分比表示为同一性分数乘以100。一个或多个多核苷酸序列的比较可以是与全长多核苷酸序列或其一部分,或与更长的多核苷酸序列进行比较。出于本发明的目的,还可以使用BLASTX 2.0版(用于翻译的核苷酸序列)和BLASTN2.0版(用于多核苷酸序列)来确定“同一性百分比”。
当两个序列在严格条件下相互杂交时,也可认为两个核苷酸序列实质上互补。在一些实施方案中,被认为基本上互补的两个核苷酸序列在高度严格的条件下彼此杂交。
“严格杂交条件”和“严格杂交洗涤条件”在核酸杂交实验(例如Southern和Northern杂交)的背景下是序列依赖性的,并且在不同的环境参数下是不同的。核酸杂交的广泛指南见Tijssen Laboratory Techniques in Biochemistry and MolecularBiology-Hybridization with Nucleic Acid Probes part I chapter 2"Overview ofprinciples of hybridization and the strategy of nucleic acid probe assays"Elsevier,New York(1993)。通常,在规定的离子强度和pH值下,选择高度严格的杂交和洗涤条件以比特定序列的热熔点(Tm)低约5℃。
Tm是50%靶序列与完全匹配的探针杂交的温度(在规定的离子强度和pH值下)。选择非常严格的条件以等于特定探针的Tm。在Southern或northern印迹中,在过滤器上具有超过100个互补残基的互补核苷酸序列的杂交的严格杂交条件的示例是在42℃下的50%甲酰胺与1mg肝素,杂交过夜进行。高度严格洗涤条件的示例是0.1 5M NaCl,72℃下约15分钟。严格洗涤条件的一个示例是在65℃下0.2×SSC洗涤15分钟(SSC缓冲液的描述见下文的Sambrook)。通常,在高严格洗涤之前先进行低严格洗涤,以去除背景探针信号。例如,超过100个核苷酸的双链体的中等严格洗涤的示例是在45℃下1xSSC持续15分钟。例如,超过100个核苷酸的双链体的低严格性洗涤的示例是在40℃下4-6x SSC持续15分钟。对于短探针(例如,约10至50个核苷酸),严格条件通常涉及在pH 7.0至8.3下小于约1.0M Na离子的盐浓度,通常约0.01至1.0M Na离子浓度(或其他盐),并且温度通常为至少约30℃。加入去稳定剂(例如甲酰胺)也可达到严格条件。一般来说,是在特定杂交测定中对无关探针观察到的信噪比的2x(或更高)的信噪比表明检测到特异性杂交。如果它们编码的蛋白质基本相同,则在严格条件下不相互杂交的核苷酸序列仍然基本相同。例如,当使用遗传密码子允许的最大密码子简并性创建核苷酸序列的拷贝时,可能发生这种情况。
本发明的多核苷酸和/或重组核酸构建体(例如,表达盒和/或载体)可以被密码子优化以用于表达。在一些实施方案中,本发明的编辑系统(例如,包含/编码序列特异性核酸结合结构域(例如,来自多核苷酸引导的核酸内切酶、锌指核酸酶、转录激活因子样效应核酸酶(TALEN)、Argonaute蛋白和/或CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)(例如,I型CRISPR-Cas效应蛋白、II型CRISPR-Cas效应蛋白、III型CRISPR-Cas效应蛋白、IV型CRISPR-Cas效应蛋白、V型CRISPR-Cas效应蛋白或VI型CRISPR-Cas效应蛋白)的序列特异性核酸结合结构域)、核酸酶(例如,核酸内切酶(例如,Fok1)、多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)、锌指核酸酶和/或转录激活因子样效应核酸酶(TALEN))、脱氨酶蛋白质/结构域(例如,腺嘌呤脱氨酶、胞嘧啶脱氨酶)、编码逆转录酶蛋白质或结构域的多核苷酸、编码5'-3'核酸外切酶多肽的多核苷酸和/或亲和多肽、肽标签等)的多核苷酸、核酸构建体、表达盒和/或载体可以经密码子优化以用于在植物中表达。在一些实施方案中,本发明的密码子优化的核酸、多核苷酸、表达盒和/或载体与没有经过密码子优化的参考核酸、多核苷酸、表达盒和/或载体具有约70%至约99.9%(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%或100%)的同一性或更高。
本发明的多核苷酸或核酸构建体可以与多种启动子和/或其他调节元件可操作地关联以在植物和/或植物的细胞中表达。因此,在一些实施方案中,本发明的多核苷酸或核酸构建体可以进一步包含与一种或多种核苷酸序列可操作地连接至的一种或多种启动子、内含子、增强子和/或终止子。在一些实施方案中,启动子可以与内含子(例如,Ubi1启动子和内含子)可操作地关联。在一些实施方案中,与内含子关联的启动子可以称为“启动子区域”(例如,Ubi1启动子和内含子)(参见例如SEQ ID NO:21和SEQ ID NO:22)。
如本文所用,关于多核苷酸的“可操作地连接至”或“可操作地关联”是指所示元件在功能上彼此相关,并且通常也是物理相关的。因此,如本文所用,术语“可操作地连接至”或“可操作地关联”是指单个核酸分子上功能关联的核苷酸序列。因此,与第二核苷酸序列可操作地连接至的第一核苷酸序列是指当第一核苷酸序列与第二核苷酸序列处于功能关系时的情况。例如,如果启动子影响所述核苷酸序列的转录或表达,则启动子与核苷酸序列可操作地关联。本领域技术人员将理解,控制序列(例如,启动子)不需要与其可操作地连接至的核苷酸序列连续,只要控制序列的功能是指导其表达即可。因此,例如,插入的非翻译但转录的核酸序列可以存在于启动子和核苷酸序列之间,并且启动子仍然可以被认为“可操作地连接至”到核苷酸序列。
如本文所用,关于多肽的术语“连接”是指一种多肽与另一种多肽的连接。多肽可以直接(例如,通过肽键)或通过接头与另一多肽(在N-末端或C-末端)连接。
术语“接头”是本领域公认的并且是指化学基团,或连接两个分子或部分(例如融合蛋白的两个结构域)的分子,例如核酸结合多肽或结构域和肽标签,和/或与肽标签结合的逆转录酶和亲和多肽;或DNA核酸内切酶多肽或结构域和肽标签和/或与肽标签结合的逆转录酶和亲和多肽。接头可以由单个连接分子组成或可以包含多于一个连接分子。在一些实施方案中,接头可以是有机分子、基团、聚合物或化学部分,例如二价有机部分。在一些实施方案中,接头可以是氨基酸或者它可以是肽。在一些实施方案中,接头是肽。
在一些实施方案中,可用于本发明的肽接头长度可为约2至约100个或更多个氨基酸,例如长度为约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个或更多个氨基酸(例如,约2至约40、约2至约50、约2至约60、约4至约40、约4至约50、约4至约60、约5至约40、约5至约50、约5至约60、约9至约40、约9至约50、约9至约60、约10至约40、约10至约50、约10至约60、或约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25个氨基酸至约26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个或更多个氨基酸的长度(例如,长度为约105、110、115、120、130、140、150个或更多个氨基酸)。在一些实施方案中,肽接头可以是GS接头。
如本文所用,关于多核苷酸的术语“连接的”或“融合的”是指一个多核苷酸与另一个多核苷酸的连接。在一些实施方案中,两个或更多个多核苷酸分子可以通过接头连接,接头可以是有机分子、基团、聚合物或化学部分,例如二价有机部分。多核苷酸可以通过共价或非共价键合或结合,包括例如Watson-Crick碱基配对,或通过一个或多个连接核苷酸连接或融合到另一个多核苷酸(在5'末端或3'末端)。在一些实施方案中,可以将某种结构的多核苷酸基序插入另一个多核苷酸序列中(例如,引导RNA中发夹结构的延伸)。在一些实施方案中,连接核苷酸可以是天然存在的核苷酸。在一些实施方案中,连接核苷酸可以是非天然存在的核苷酸。
“启动子”是控制或调节与启动子可操作地关联的核苷酸序列(例如,编码序列)的转录的核苷酸序列。由启动子控制或调节的编码序列可以编码多肽和/或功能性RNA。通常,“启动子”是指包含RNA聚合酶II结合位点并指导转录起始的核苷酸序列。通常,启动子位于相对于相应编码序列的编码区起点的5'或上游。启动子可以包含其他作为基因表达调节因子的元件;例如,启动子区域。这些包括TATA盒共有序列,并且通常是CAAT盒共有序列(Breathnach和Chambon,(1981)Annu.Rev.Biochem.50:349)。在植物中,CAAT盒可以被AGGA盒替代(Messing等人,(1983),Genetic Engineering of Plants,T.Kosuge,C.Meredith和A.Hollaender(eds.),Plenum Press,pp.211-227)。
可用于本发明的启动子可以包括例如组成型、诱导型、时间调节的、发育调节的、化学调节的、组织优选的和/或组织特异性的启动子,用于制备重组核酸分子,例如“合成核酸构建体”或“蛋白质-RNA复合物”。这些不同类型的启动子是本领域已知的。
启动子的选择可能取决于表达的时间和空间要求而不同,并且也可能基于要转化的宿主细胞而不同。许多不同生物的启动子在本领域中是众所周知的。基于本领域现有的广泛知识,可以为感兴趣的特定宿主生物选择合适的启动子。因此,例如,关于在模式生物中高度组成型表达的基因的上游的启动子了解很多,并且可以在其他系统中适当地访问和实施此类知识。
在一些实施方案中,在植物中起作用的启动子可以与本发明的构建体一起使用。可用于在植物中驱动表达的启动子的非限制性实例包括RubisCo小亚基基因1的启动子(PrbcS1)、肌动蛋白基因的启动子(Pactin)、硝酸还原酶基因的启动子(Pnr)和重复碳酸酐酶基因1的启动子(Pdca1)(参见Walker等人,Plant Cell Rep.23:727-735(2005);Li等人,Gene 403:132-142(2007);Li等人,Mol Biol.Rep.37:1143-1154(2010))。PrbcS1和Pactin是组成型启动子,Pnr和Pdca1是诱导型启动子。Pnr由硝酸盐诱导并由铵抑制(Li等人,Gene403:132-142(2007)),Pdca1由盐诱导(Li等人,Mol Biol.Rep.37:1143-1154(2010))。在一些实施方案中,可用于本发明的启动子是RNA聚合酶II(PolII)启动子。在一些实施方案中,来自玉米的U6启动子或7SL启动子可用于本发明的构建体。在一些实施方案中,来自玉米的U6c启动子和/或7SL启动子可用于驱动引导核酸的表达。在一些实施方案中,来自大豆的U6c启动子、U6i启动子和/或7SL启动子可用于本发明的构建体。在一些实施方案中,来自大豆的U6c启动子、U6i启动子和/或7SL启动子可用于驱动引导核酸的表达。
可用于植物的组成型启动子的实例包括但不限于:cestrum病毒启动子(cmp)(美国专利号7,166,770)、水稻肌动蛋白1启动子(Wang等人,(1992)Mol.Cell.Biol.12:3399-3406;以及美国专利号5,641,876)、CaMV 35S启动子(Odell等人,(1985)Nature313:810-812)、CaMV 19S启动子(Lawton等人,(1987)Plant Mol.Biol.9:315-324)、nos启动子(Ebert等人,(1987)Proc.Natl.Acad.Sci USA 84:5745-5749)、Adh启动子(Walker等人,(1987)Proc.Natl.Acad.Sci.USA 84:6624-6629)、蔗糖合酶启动子(Yang&Russell(1990)Proc.Natl.Acad.Sci.USA 87:4144-4148)和泛素启动子。源自泛素的组成型启动子在许多细胞类型中积累。泛素启动子已经从几种植物物种(例如向日葵(Binet等人,1991.PlantScience 79:87-94)、玉米(Christensen等人,1989.Plant Molec.Biol.12:619-632)和拟南芥(Norris等人,1993.Plant Molec.Biol.21:895-906))中克隆出来用于转基因植物。玉米泛素启动子(UbiP)已在转基因单子叶植物系统中开发,其序列和构建用于单子叶植物转化的载体在专利公开EP 0 342 926中公开。泛素启动子适用于本发明的核苷酸序列在转基因植物,尤其是单子叶植物中的表达。此外,McElroy等人,(Mol.Gen.Genet.231:150-160(1991))描述的启动子表达盒可以容易地被修饰以表达本发明的核苷酸序列并且特别适用于单子叶植物宿主。
在一些实施方案中,组织特异性/组织优选启动子可用于在植物细胞中表达异源多核苷酸。组织特异性或优选表达模式包括但不限于绿色组织特异性或优选、根特异性或优选、茎特异性或优选、花特异性或优选或花粉特异性或优选。适合在绿色组织中表达的启动子包括许多调节参与光合作用的基因,其中许多已从单子叶植物和双子叶植物中克隆。在一个实施方案中,可用于本发明的启动子是来自磷酸烯醇羧化酶基因的玉米PEPC启动子(Hudspeth&Grula,Plant Molec.Biol.12:579-589(1989))。组织特异性启动子的非限制性实例包括与编码种子贮藏蛋白(例如β-伴大豆球蛋白、cruciferin、napin和菜豆球蛋白)、玉米醇溶蛋白或油体蛋白(例如油质蛋白)或涉及脂肪酸生物合成的蛋白质(包括酰基载体蛋白、硬脂酰-ACP去饱和酶和脂肪酸去饱和酶(fad2-1))的基因相关的那些启动子,以及在胚胎发育过程中表达的其他核酸(例如Bce4,参见例如Kridl等人,(1991)Seed Sci.Res.1:209-219;以及EP专利号255378)。可用于在植物,特别是玉米中表达本发明的核苷酸序列的组织特异性或组织优先启动子包括但不限于直接在根、髓、叶或花粉中表达的那些。此类启动子公开于例如WO93/07278中,其通过引用整体并入本文。可用于本发明的组织特异性或组织优选启动子的其他非限制性实例是美国专利6,040,504中公开的棉花rubisco启动子;美国专利5,604,121中公开的水稻蔗糖合酶启动子;de Framond(FEBS290:103-106(1991);Ciba-Geigy的EP 0 452 269)描述的根特异性启动子;在美国专利5,625,136(Ciba-Geigy)中描述的茎特异性启动子,其驱动玉米trpA基因的表达;WO01/73087中公开的certrum黄卷叶病毒启动子;和花粉特异性或优选启动子,包括但不限于来自水稻的ProOsLPS10和ProOsLPS11(Nguyen等人,Plant Biotechnol.Reports 9(5):297-306(2015)),来自玉米的ZmSTK2_USP(Wang等人,Genome 60(6):485-495(2017))、来自番茄的LAT52和LAT59(Twell等人,Development 109(3):705-713(1990))、Zm13(美国专利号10,421,972)、来自拟南芥的PLA2-δ启动子(美国专利号7,141,424)和/或来自玉米的ZmC5启动子(国际PCT公开号WO1999/042587)。
植物组织特异性/组织优选启动子的其他例子包括但不限于根毛特异性顺式元件(RHE)(Kim等人,The Plant Cell 18:2958-2970(2006))、根特异性启动子RCc3(Jeong等人,Plant Physiol.153:185-197(2010))和RB7(美国专利号5459252),凝集素启动子(Lindstrom等人,(1990)Der.Genet.11:160-167;和Vodkin(1983)Prog.Clin.Biol.Res.138:87-98),玉米醇脱氢酶1启动子(Dennis等人,(1984)NucleicAcids Res.12:3983-4000),S-腺苷-L-甲硫氨酸合成酶(SAMS)(Vander Mijnsbrugge等人,(1996)Plant and Cell Physiology,37(8):1108-1115),玉米光收获复合启动子(Bansal等人,(1992)Proc.Natl.Acad.Sci.USA 89:3654-3658)、玉米热休克蛋白启动子(O'Dell等人,(1985)EMBO J.5:451-458;和Rochester等人,(1986)EMBO J.5:451-458)、豌豆小亚基RuBP羧化酶启动子(Cashmore,"Nuclear genes encoding the small subunit ofribulose-l,5-bisphosphate carboxylase"pp.29-39In:Genetic Engineering ofPlants(Hollaender ed.,Plenum Press1983;和Poulsen等人,(1986)Mol.Gen.Genet.205:193-200),Ti质粒甘露碱合酶启动子(Langridge等人,(1989)Proc.Natl.Acad.Sci.USA86:3219-3223),Ti质粒胭脂碱合酶启动子(Langridge等人,(1989),同上)、矮牵牛查尔酮异构酶启动子(van Tunen等人,(1988)EMBO J.7:1257-1263)、豆甘氨酸富集蛋白1启动子(Keller等人,(1989)Genes Dev.3:1639-1646),截短的CaMV 35S启动子(O'Dell等人,(1985)Nature 313:810-812)、马铃薯patatin启动子(Wenzler等人,(1989)PlantMol.Biol.13:347-354)、根细胞启动子(Yamamoto等人,(1990)Nucleic Acids Res.18:7449),玉米玉米醇溶蛋白启动子(Kriz等人,(1987)Mol.Gen.Genet.207:90-98;Langridge等人,(1983)Cell34:1015-1022;Reina等人,(1990)Nucleic Acids Res.18:6425;Reina等人,(1990)Nucleic Acids Res.18:7449;和Wandelt等人,(1989)Nucleic Acids Res.17:2354),球蛋白-1启动子(Belanger等人,(1991)Genetics129:863-872)、α-微管蛋白cab启动子(Sullivan等人,(1989)Mol.Gen.Genet.215:431-440)、PEPCase启动子(Hudspeth&Grula(1989)Plant Mol.Biol.12:579-589)、R基因复合物相关启动子(Chandler等人,(1989)Plant Cell 1:1175-1183)和查耳酮合酶启动子(Franken等人,(1991)EMBO J.10:2605-2612)。
可用于种子特异性表达的是豌豆球蛋白启动子(Czako等人,(1992)Mol.Gen.Genet.235:33-40;以及美国专利号5,625,136中公开的种子特异性启动子。可用于在成熟叶中的表达是在衰老开始时被转换的那些,例如来自拟南芥的SAG启动子(Gan等人,(1995)Science270:1986-1988)。
此外,可以使用在叶绿体中起作用的启动子。此类启动子的非限制性实例包括噬菌体T3基因9 5'UTR和美国专利号7,579,516中公开的其他启动子。可用于本发明的其他启动子包括但不限于S-E9小亚基RuBP羧化酶启动子和Kunitz胰蛋白酶抑制剂基因启动子(Kti3)。
可用于本发明的其他调节元件包括但不限于内含子、增强子、终止序列和/或5'和3'非翻译区。
可用于本发明的内含子可以是在植物中鉴定和分离的内含子,然后插入到表达盒中以用于植物的转化。如本领域技术人员将理解的,内含子可包含自我切除所需的序列,并以符合阅读框的方式并入核酸构建体/表达盒中。内含子可用作间隔区以分隔一个核酸构建体中的多个蛋白质编码序列,或者内含子可用于一个蛋白质编码序列内以例如稳定mRNA。如果它们在蛋白质编码序列中使用,它们将被插入“框内”并包含切除位点。内含子也可以与启动子关联以改善或修饰表达。例如,可用于本发明的启动子/内含子组合包括但不限于玉米Ubi1启动子和内含子的组合(参见例如SEQ ID NO:21和SEQ ID NO:22)。
可用于本发明的内含子的非限制性实例包括来自ADHI基因(例如,Adh1-S内含子1、2和6)、泛素基因(Ubi1)、RuBisCO小亚基(rbcS)基因、RuBisCO大亚基(rbcL)基因、肌动蛋白基因(例如,肌动蛋白-1内含子)、丙酮酸脱氢酶激酶基因(pdk)、硝酸还原酶基因(nr)、重复碳酸酐酶基因1(Tdca1)、psbA基因、atpA基因的内含子或其任意组合。
在一些实施方案中,本发明的多核苷酸和/或核酸构建体可以是“表达盒”或可以包含在表达盒内。如本文所用,“表达盒”是指重组核酸分子,其包含例如一种或多种本发明的多核苷酸(例如,编码序列特异性核酸结合结构域(例如,序列特异性DNA结合结构域)的多核苷酸、编码脱氨酶蛋白或结构域的多核苷酸,编码逆转录酶蛋白质或结构域的多核苷酸、编码5'-3'外切核酸酶多肽或结构域的多核苷酸、引导核酸和/或逆转录酶(RT)模板),其中一个或多个多核苷酸与一个或多个控制序列(例如,启动子、终止子等)可操作地关联。因此,在一些实施方案中,可以提供一种或多种表达盒,其被设计为表达例如本发明的核酸构建体(例如,编码序列特异性核酸结合结构域的多核苷酸、编码核酸酶多肽/结构域的多核苷酸、编码脱氨酶蛋白质/结构域的多核苷酸、编码逆转录酶蛋白质/结构域的多核苷酸、编码5'-3'外切核酸酶多肽/结构域的多核苷酸、编码肽标签的多核苷酸和/或编码亲和多肽的多核苷酸等,或包含引导核酸、延伸的引导核酸和/或RT模板等)。当本发明的表达盒包含多于一个多核苷酸时,多核苷酸可以与驱动所有多核苷酸表达的单个启动子可操作地连接,或者多核苷酸可以与一个或多个单独的启动子(例如三个多核苷酸可以由一个、两个或三个任意组合的启动子驱动)可操作地连接。当使用两个或更多个单独的启动子时,启动子可以是相同的启动子或者它们可以是不同的启动子。因此,编码序列特异性核酸结合结构域(例如序列特异性DNA结合结构域)的多核苷酸、编码核酸酶蛋白/结构域的多核苷酸、编码CRISPR-Cas效应蛋白/结构域的多核苷酸、编码脱氨酶蛋白/结构域的多核苷酸、编码逆转录酶多肽/结构域(例如,RNA依赖性DNA聚合酶)的多核苷酸和/或编码5'-3'外切核酸酶多肽/结构域的多核苷酸、引导核酸、延伸的引导核酸和/或当包含在单个表达盒中时可以各自可操作地连接到单个启动子的RT模板,或任何组合的单独的启动子。
包含本发明的核酸构建体的表达盒可以是嵌合的,这意味着它的至少一种成分相对于它的至少一种其他成分是异源的(例如,来自宿主生物的启动子可操作地连接到在宿主生物体中表达的感兴趣的多核苷酸,其中感兴趣的多核苷酸来自与宿主不同的生物体或通常不与该启动子关联)。表达盒也可以是天然存在的但已经以可用于异源表达的重组形式获得的表达盒。
表达盒可以任选地包括在所选宿主细胞中起作用的转录和/或翻译终止区(即终止区)和/或增强子区。多种转录终止子和增强子是本领域已知的并且可用于表达盒。转录终止子负责转录的终止和正确的mRNA多聚腺苷酸化。终止区和/或增强子区对于转录起始区可以是天然的,对于例如编码序列特异性核酸结合蛋白的基因、编码核酸酶的基因、编码逆转录酶的基因、编码脱氨酶的基因等可以是天然的,或者对于宿主细胞可以是天然的,或者对于另一来源(例如,对于例如启动子、对于编码序列特异性核酸结合蛋白的基因、编码核酸酶的基因、编码逆转录酶的基因、编码脱氨酶的基因等,或对于宿主细胞或其任何组合来说是外来的或异源的)可以是天然的。
本发明的表达盒还可包括编码可选择标记的多核苷酸,其可用于选择转化的宿主细胞。如本文所用,“可选择标记”是指多核苷酸序列,其在表达时赋予表达该标记的宿主细胞不同的表型,从而允许将此类转化的细胞与不具有该标记的细胞区分开来。这样的多核苷酸序列可以编码可选择的或可筛选的标记,这取决于标记是否赋予可以通过化学手段(例如通过使用选择剂(例如抗生素等))选择的性状,或者取决于是否标记只是一种可以通过观察或测试来识别的性状,例如通过筛选(例如,荧光)。合适的可选择标记的许多例子是本领域已知的并且可以用于本文所述的表达盒中。
除了表达盒之外,本文所述的核酸分子/构建体和多核苷酸序列可以与载体结合使用。术语“载体”是指用于将核酸(或多种核酸)转移、递送或引入细胞中的组合物。载体包含含有待转移、递送或引入的核苷酸序列的核酸构建体(例如表达盒)。用于宿主生物转化的载体在本领域是众所周知的。一般类型的载体的非限制性实例包括双链或单链线性或环状形式的病毒载体、质粒载体、噬菌体载体、噬菌粒载体、粘粒载体、fosmid载体、噬菌体、人工染色体、小环或农杆菌双元载体,其可以或者可能无法自我传播或移动。在一些实施方案中,病毒载体可以包括但不限于逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹病毒载体。本文定义的载体可以通过整合到细胞基因组中或存在于染色体外(例如具有复制起点的自主复制质粒)来转化原核或真核宿主。另外包括穿梭载体,其意指能够在两种不同宿主生物(其可以选自放线菌和相关物种、细菌和真核生物(例如高等植物、哺乳动物、酵母或真菌细胞))中(天然或通过设计)复制的DNA载体。在一些实施方案中,载体中的核酸在合适启动子或其他调节元件的控制下并且可操作地与其连接以用于在宿主细胞中转录。该载体可以是在多个宿主中起作用的双功能表达载体。在基因组DNA的情况下,这可以包含其自身的启动子和/或其他调节元件,而在cDNA的情况下,这可以在合适的启动子和/或其他调节元件的控制下以用于在宿主细胞中表达。因此,本发明的核酸或多核苷酸和/或包含其的表达盒可以包含在如本文所述和本领域已知的载体中。
如本文所用,“接触”、“接触的”、“接触了”及其语法变体是指将所需反应的组分放在适合进行所需反应(例如,转化、转录控制、基因组编辑、切口和/或切割)的条件下。例如,靶核酸可以与序列特异性核酸结合蛋白(例如,多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应核酸酶(TALEN)和/或Argonaute蛋白))和脱氨酶或编码其的核酸构建体在表达序列特异性核酸结合蛋白、逆转录酶和脱氨酶并且序列特异性核酸结合蛋白与靶核酸结合的条件下接触,逆转录酶和/或脱氨酶可以与序列特异性核酸结合蛋白融合或募集到序列特异性核酸结合蛋白上(例如,通过与序列特异性核酸结合蛋白(例如序列特异性DNA结合蛋白)融合的肽标签和与逆转录酶和/或脱氨酶融合的亲和标签),因此脱氨酶和/或逆转录酶位于靶核酸附近,从而修饰靶核酸。可以使用利用其他蛋白质-蛋白质相互作用的募集逆转录酶和/或脱氨酶的其他方法。此外,RNA-蛋白质相互作用和化学相互作用也可以用于蛋白质-蛋白质和蛋白质-核酸募集。
如本文所用,关于靶核酸的“修饰”或“修饰的”包括编辑(例如突变)、共价修饰、交换/取代核酸/核苷酸碱基、缺失、切割、切口和/或改变靶核酸的转录控制。在一些实施方案中,修饰可以包括任何类型的一个或多个单碱基改变(SNP)。
在多肽“调节”表型的上下文中使用的术语“调节”是指多肽影响一个或多个基因的表达从而修饰表型的能力。
在感兴趣的多核苷酸的上下文中,“引入”、“引入了”、“引入的”(及其语法变体)是指将感兴趣的核苷酸序列(例如,多核苷酸、RT模板、核酸构建体和/或引导核酸)以使得核苷酸序列能够进入细胞内部的方式呈递给植物、其植物部分或其细胞。
术语“转化”或“转染”可以互换使用,并且如本文所用,是指将异源核酸引入细胞。细胞的转化可以是稳定的或瞬时的。因此,在一些实施方案中,宿主细胞或宿主生物体(例如植物)可以用本发明的多核苷酸/核酸分子稳定转化。在一些实施方案中,宿主细胞或宿主生物体可以用本发明的多核苷酸/核酸分子瞬时转化。
在多核苷酸的上下文中,“瞬时转化”是指多核苷酸被引入细胞中并且不整合到细胞的基因组中。
在将多核苷酸引入细胞中的上下文中,“稳定地引入”或“稳定地引入的”意指引入的多核苷酸被稳定地掺入细胞的基因组中,因此细胞被多核苷酸稳定地转化。
如本文所用,“稳定转化”或“稳定转化的”是指将核酸分子引入细胞中并整合到细胞的基因组中。因此,整合的核酸分子能够被其后代,更具体地,被多个连续世代的后代遗传。如本文所用,“基因组”包括核基因组和质体基因组,因此包括将核酸整合到例如叶绿体或线粒体基因组中。如本文所用,稳定转化还可以指在染色体外维持的转基因,例如,作为微染色体或质粒。
瞬时转化可以通过例如酶联免疫吸附测定(ELISA)或蛋白质印迹来检测,其可以检测由引入生物体的一种或多种转基因编码的肽或多肽的存在。细胞的稳定转化可以通过例如细胞的基因组DNA与核酸序列的Southern印迹杂交测定来检测,所述核酸序列与引入生物体(例如植物)中的转基因的核苷酸序列特异性杂交。细胞的稳定转化可以通过例如细胞的RNA与核酸序列的Northern印迹杂交测定来检测,所述核酸序列与引入宿主生物的转基因的核苷酸序列特异性杂交。细胞的稳定转化也可以通过例如聚合酶链式反应(PCR)或本领域熟知的其他扩增反应来检测,使用与转基因的靶序列杂交的特异性引物序列,导致转基因序列的扩增,其可以根据标准方法检测。转化也可以通过本领域公知的直接测序和/或杂交方案检测。
因此,在一些实施方案中,本发明的核苷酸序列、多核苷酸、核酸构建体和/或表达盒可以瞬时表达和/或它们可以稳定地掺入宿主生物的基因组中。因此,在一些实施方案中,本发明的核酸构建体(例如,一种或多种包含用于如本文所述进行编辑的多核苷酸的表达盒)可以与引导核酸一起瞬时引入细胞中,因此,没有DNA保持在细胞中。
可以通过本领域技术人员已知的任何方法将本发明的核酸构建体引入植物细胞中。转化方法的非限制性实例包括通过细菌介导的核酸递送(例如,通过农杆菌)、病毒介导的核酸递送、碳化硅或核酸晶须介导的核酸递送、脂质体介导的核酸递送、显微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米颗粒介导的转化、超声处理、渗透、PEG介导的核酸摄取以及导致将核酸引入植物细胞的任何其他电学、化学、物理(机械)和/或生物机制的转化,包括其任何组合。用于转化真核生物和原核生物的程序在本领域中是众所周知的并且是常规的并且在整个文献中都有描述(参见,例如,Jiang等人,2013.Nat.Biotechnol.31:233-239;Ran等人,Nature Protocols8:2281-2308(2013))。本领域已知的各种植物转化方法的一般指南包括Miki等人,("Procedures for IntroducingForeign DNA into Plants"in Methods in Plant Molecular Biology andBiotechnology,Glick,B.R.和Thompson,J.E.,Eds.(CRC Press,Inc.,Boca Raton,1993),第67-88页)和Rakowoczy-Trojanowska(Cell.Mol.Biol.Lett.7:849-858(2002))。
在本发明的一些实施方案中,细胞的转化可以包括核转化。在其他实施方案中,细胞的转化可以包括质体转化(例如,叶绿体转化)。在更进一步的实施方案中,可以通过常规育种技术将本发明的核酸引入细胞中。在一些实施方案中,可以通过农杆菌转化将一种或多种多核苷酸、表达盒和/或载体引入植物细胞中。
因此,可以以本领域公知的许多方式将多核苷酸引入植物、植物部分、植物细胞中。本发明的方法不依赖于将一个或多个核苷酸序列引入植物的特定方法,仅依赖于它们能够进入细胞内部。在要引入多于多核苷酸的情况下,它们可以组装为单个核酸构建体的一部分,或作为单独的核酸构建体,并且可以位于相同或不同的核酸构建体上。因此,可以在单个转化事件中或在单独的转化事件中将多核苷酸引入感兴趣的细胞,或者,可替代地,作为育种方案的一部分,可以将多核苷酸掺入植物中。
本发明涉及在大豆的内源GRF转录因子基因中产生突变,任选地其中突变位于GRF转录因子基因的amiR396结合位点中或邻近。在一些实施方案中,GRF转录因子基因的miR396结合位点中或附近的突变破坏miR396与GRF转录因子基因产生的mRNA的结合,任选地导致内源基因产生的mRNA的水平增加。在一些实施方案中,包含如本文所述的突变的大豆植物可以与对照大豆植物(例如,没有突变的大豆植物)相比表现出一种或多种修饰的表型,包括但不限于改善的产量性状、改善的植物结构和/或一种或多种改善的防御性状、或其任何组合。在一些实施方案中,大豆植物中的此类突变导致植物与对照大豆植物相比)表现出改善的抗病性状而不丧失产量性状(有或没有改善的植物结构)或改善的产量性状而不丧失抗病性状(有或没有改善的植物结构)的表型。
包含本文所述的突变的大豆植物可以表现出的改善的防御或抗病性状可以包括但不限于对大豆胞囊线虫(SCN)的增加的抗性,例如对大豆胞囊线虫(Heteroderaglycines)感染的增加的抗性,或对大豆锈菌的增加的抗性,例如,对豆薯层锈菌(亚洲大豆锈病)和/或山马蝗层锈菌(新世界大豆锈病)感染的增加的抗性。
大豆胞囊线虫(SCN)是一种植物寄生线虫,其主要经济宿主是大豆。根据特定SCN群体在抗性大豆品种上繁殖的能力,将SCN群体分为HG类型(以前称为“种族”)。大豆植物对大豆胞囊线虫的抗性通常通过将新开发的大豆品种的性能与已知易感品种的性能进行比较来量化。通过在存在线虫的情况下种植每个品种的一组植物并计算每个品种上发育的显著数量来评估不同品种的相对性能。通常,如果根上发育的囊肿数量与已知易感品种的根上发育的数量相比为10%或更少(例如10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%更少),则该品系被认为是“抗性”的。因此,抗性可以被认为是相对于易感品种的胞囊数量的任何显著减少。经常用作“易感”对照的品种包括大豆品种Hutcheson、Williams82和Clark。
亚洲大豆锈病是由专性生物营养病原体豆薯层锈菌引起的真菌病害,新世界大豆锈病是由专性生物营养病原体山马蝗层锈菌引起的真菌病害。这些大豆锈菌病原体可以感染多种豆科植物。由于种族特异性Rpp基因赋予的抗性的迅速丧失,目前大豆中没有有效的抗性基因。因此,部分或定量的抗性机制被视为解决大豆锈病的更持久的方法。
在一些实施方案中,“改善的产量性状”可以包括但不限于增加的产量(蒲式耳/英亩)、每株植物增加的种子数量(例如,增加的种子产量)、每茎节增加的豆荚数量、每株植物增加的豆荚数量(增加的豆荚产量)、增加的种子大小、增加的种子重量、增加的根瘤数量、增加的根瘤活性和/或增加的固氮等中的一种或多种。
因此,在一些实施方案中,本发明提供了包含编码生长调节因子(GRF)转录因子的内源基因中的至少一个非天然突变的大豆植物或其植物部分,其中所述编码GRF转录因子的内源基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的区域。在一些实施方案中,至少一个非天然突变位于GRF转录因子中的miR396结合位点内或附近,任选地其中突变导致miR396与GRF转录因子基因产生的mRNA的减少的结合。在一些实施方案中,miR396与GRF转录因子基因产生的mRNA的减少的结合导致内源GRF转录因子基因产生的mRNA的水平增加。
在一些实施方案中,GRF转录因子基因的miR396结合位点(a)包含在与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的内源基因的区域中,和/或与SEQ ID NO:109的核苷酸序列具有至少90%序列同一性,和/或(b)编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性和/或与SEQ IDNO:110具有至少90%的序列同一性的GRF多肽的区域。
在一些实施方案中,大豆植物中的内源GRF转录因子基因中的突变,例如内源GRF转录因子基因的miR396结合位点中或附近的突变导致大豆植物与不包含相同突变(例如,缺乏该突变)的植物或植物部分(例如,同基因植物(例如,野生型未编辑植物或无效分离子))相比表现出改善或维持的产量性状、改善的植物结构和/或改善或维持的抗病性状的表型,任选地其中与对照大豆植物相比,大豆植物或其植物部分表现出改善的抗病性状而不丧失产量性状,或改善的产量性状而不丧失抗病性状。在一些实施方案中,改善的防御性状包括但不限于改善的对大豆胞囊线虫感染的抗性。在一些实施方案中,改善的产量性状可包括但不限于增加的产量(蒲式耳/英亩)、增加的每株植物的种子数量、增加的每茎节的豆荚数量、增加的每株植物的豆荚数量和/或增加的种子重量。
增强的植物结构可以包括但不限于以下表型中的一种或多种:增加的叶的数量和/或大小、增加的分枝或分枝点的数量、增加的分枝数量、增加的植物生物量、更陡的根角(例如更窄的根角)、更长的根、增加的通气组织、增加的根生物量、细胞壁/细胞结构成分的增厚。在一些实施方案中,使用本发明的方法产生的表现出增强的植物结构的植物可以进一步表现出改善的/增强的抗病性(例如,对SCN的抗性、对大豆锈菌的抗性),并且任选地维持产量性状或表现出改善的产量性状。在一些实施方案中,包含编码GRF转录因子多肽的至少一个内源基因中的至少一个非天然突变的大豆植物与缺乏突变的同基因大豆植物(例如,野生型未编辑植物或无效分离子)相比表现出改善的抗病性(例如,改善的SCN抗性、改善的对大豆锈菌的抗性)。在一些实施方案中,包含编码GRF转录因子多肽的至少一个内源基因中的至少一个非天然突变的大豆植物与缺乏突变的同基因大豆植物(例如,野生型未编辑植物或无效分离子)相比表现出改善的产量性状。在一些实施方案中,包含编码GRF转录因子多肽的至少一个内源基因中的至少一个非天然突变的大豆植物与缺乏突变的同基因大豆植物(例如,野生型未编辑植物或无效分离子)相比表现出改善的SCN抗性和/或改善的大豆锈菌抗性以及产量性状的维持,任选地表现出改善的产量性状。
大豆植物中内源GRF转录因子基因中的非天然突变可以是任何类型的突变,包括但不限于点突变、碱基取代、碱基缺失和/或碱基插入,任选地其中至少一个非天然突变导致移码突变(框内或框外)。可用于本发明的突变可以包括但不限于在内源GRF转录因子基因的miRNA结合位点(例如miR396结合位点)中或附近的一个或多个碱基/碱基对/核苷酸的取代、缺失和/或插入。在一些实施方案中,至少一个非天然突变可包含A、T、G或C的碱基取代,其任选地导致GRF转录因子基因中的移码突变。在一些实施方案中,包含如本文所述的具有至少一个非天然突变的内源GRF转录因子基因的大豆植物与对照大豆植物相比,与缺乏GRF转录因子基因中的至少一个非天然突变的大豆植物(例如,同基因大豆植物)(例如,对照大豆植物)相比,表现出改善或维持的产量性状、改善的植物结构和/或改善或维持的抗病性状的表型,任选地,其中所述大豆植物或其植物部分与对照大豆植物相比表现出改善的抗病性状而不丧失产量性状或改善的产量性状而不丧失抗病性状的表型。
在一些实施方案中,大豆植物或其部分中的内源GRF转录因子基因中的至少一个非天然突变可以是缺失(例如,SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94或SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的一个碱基对或两个或更多个连续碱基对,例如约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31,32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90或100个或更多个(例如,110、120、130、140、150等)连续碱基对的缺失(例如,GRF转录因子基因的miR396结合位点中或附近的缺失),任选地其中通过本发明的方法产生的突变的GRF转录因子基因可以包含与SEQ ID NO:133-147中的任一个具有至少90%序列同一性的序列。
在一些实施方案中,大豆植物或其部分中的内源GRF转录因子中的至少一个非天然突变可以产生显性突变、半显性突变、显性失活突变、无效突变、超形态突变、弱功能丧失突变或亚形态突变,任选地其中大豆植物中内源GRF转录因子基因中的至少一个非天然突变导致植物或部分中与对照大豆植物(例如,不包含突变的同基因大豆植物)相比改善的植物结构、改善或维持的产量性状(例如,增加的豆荚产量、增加的种子产量(例如,增加的数量)、增加的种子大小、增加的种子重量、增加的根瘤数量、增加的根瘤活性和/或增加的固氮)和/或改善或维持的抗病性,或其任何组合,任选地其中包含内源GRF转录因子基因中的至少一个非天然突变的大豆植物或其植物部分与对照大豆植物相比表现出改善的抗病性状而不丧失产量性状或改善的产量性状而不丧失抗病性状的表型。
在一些实施方案中,提供了包含内源GRF转录因子基因的miR396结合位点序列之内或附近的至少一个非天然突变的大豆植物或其部分,其中所述至少一个非天然突变阻止或减少miR396与内源GRF转录因子基因产生的mRNA的结合,导致内源GRF转录因子基因产生的mRNA的水平增加,进一步地,其中所述至少一个非天然突变是使用编辑系统引入的取代、插入或缺失,该编辑系统包含结合内源GRF转录因子基因中的靶位点的核酸结合结构域,该靶位点与SEQ ID NO:96-103中任一个的核苷酸序列具有至少80%的序列同一性和/或编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列。在一些实施方案中,内源GRF转录因子基因在与SEQ ID NO:109的核苷酸序列具有至少90%序列同一性的序列内被突变。
在一些实施方案中,提供了包含碱基编辑系统的大豆植物细胞,所述碱基编辑系统包含:(a)CRISPR-Cas效应蛋白;和(b)引导核酸(例如,gRNA、gDNA、crRNA、crDNA、sgRNA、sgDNA),其具有与编码GRF转录因子的内源靶基因互补的间隔序列,其中内源靶基因(i)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(ii)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域,任选地,与SEQ ID NO:109的核苷酸序列具有至少90%序列同一性;(iii)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;(iv)包含编码与SEQ ID NO:104-108中任一个具有至少80%序列同一性的氨基酸序列的区域,任选地与SEQ ID NO:110的氨基酸序列具有至少90%序列同一性,任选地其中碱基编辑系统进一步包含胞苷脱氨酶或腺苷脱氨酶,从而在编码GRF转录因子蛋白的内源靶基因中产生突变。
还提供了包含生长调节因子(GRF)转录因子基因的大豆植物,所述生长调节因子转录因子基因包含SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93、94、96-103、109或122-129中任一个的核苷酸序列中的突变,任选地其中所述大豆植物与对照大豆植物(例如,缺乏突变的同基因大豆植物)相比表现出改善的植物结构、改善或维持的产量性状和/或改善或维持的抗病性或其任何组合的表型。在一些实施方案中,包含含有SEQ IDNO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93、94、96-103、109或122-129中任一个的核苷酸序列中的突变的生长调节因子(GRF)转录因子基因的大豆植物可以表现出改善的SCN抗性和/或改善的大豆锈菌抗性以及产量性状的维持的表型,或任选地表现出改善的产量性状。在一些实施方案中,包含含有SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93、94、96-103、109或122-129中任一个的核苷酸序列中的突变的生长调节因子(GRF)转录因子基因的大豆植物可以表现出改善的产量性状而不丧失抗病性(例如,不丧失SCN抗性和/或不丧失大豆锈菌抗性)。
当如本文所述修饰时产生表现出改善的植物结构、改善或维持的产量性状和/或改善或维持的抗病性状或其任何组合的表型的大豆植物(与对照大豆植物相比)的大豆植物中的任何内源GRF转录因子基因可用作本发明的内源靶基因。在一些实施方案中,内源GRF转录因子基因:(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性,任选地,与SEQID NO:109的核苷酸序列具有至少90%序列同一性的区域;(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性,任选地与SEQ ID NO:110的氨基酸序列具有至少90%序列同一性的序列的区域。编辑系统的引导核酸的间隔序列与内源GRF转录因子基因中的部分连续核苷酸互补,从而将CRISPR-Cas效应蛋白引导至靶基因中的靶位点。在一些实施方案中,连续核苷酸的部分位于由与SEQ IDNO:96-103或SEQ ID NO:122-129中的任一个、任选地SEQ ID NO:109具有至少80%序列同一性的核苷酸序列所示例的内源基因的区域中。编辑系统的引导核酸的间隔序列可以与内源GRF转录因子基因中的连续核苷酸的一部分互补,所述内源GRF转录因子基因编码与SEQID NO:74、77、80、83、86、89、92或95中的任一个、任选地SEQ ID NO:110具有至少80%序列同一性的氨基酸序列。在一些实施方案中,可用于本发明的间隔序列可以包括但不限于SEQID NO:111-113或SEQ ID NO:130-131的核苷酸序列中的任一个。
在一些实施方案中,编辑系统的核酸结合结构域可以来自例如多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应核酸酶(TALEN)和/或Argonaute蛋白,任选地其切割内源GRF转录因子基因。
在一些实施方案中,至少一个非天然突变是点突变。在一些实施方案中,至少一个非天然突变可以是A、T、G或C的碱基取代,任选地其中碱基取代导致氨基酸取代。在一些实施方案中,至少一个非天然突变可以是至少一个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或更多个)或至少两个或更多个(例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或更多个)连续碱基的碱基缺失或碱基插入,任选地其中缺失是框内缺失、框内插入、框外缺失或框外插入或其任意组合。
在一些实施方案中,大豆植物或其部分包含内源GRF转录因子基因中的至少一个非天然突变,所述内源GRF转录因子基因具有基因识别号(基因ID)GLYMA_11g008500、GLYMA_01g234400、GLYMA_12g014700、GLYMA_11g110700、GLYMA_07g038400、GLYMA_16g007600、GLYMA_04g230600和/或GLYMA_06g134600。
在一些实施方案中,大豆植物可以由本发明的大豆植物部分再生,所述大豆植物部分包括例如大豆细胞。在一些实施方案中,包含GRF转录因子基因中的至少一个非天然突变的本发明的大豆植物与缺乏GRF转录因子基因中的至少一个非天然突变的对照大豆植物相比表现出改善的/增强的植物结构和/或改善的抗病性状和/或抗病性状的保留/维持(例如,没有丧失对一种或多种疾病的抗性)和/或改善的产量性状和/或产量性状的保留/维持(例如,没有产量的降低),或其任何组合。
本文还提供了提供多个大豆植物的方法,所述大豆植物具有改善的/增强的植物结构、改善的抗病性状和/或抗病性状的保留/维持(例如,不丧失对一种或多种疾病的抗性)和/或改善的产量性状和/或产量性状的保留/维持(例如,没有产量的降低)或其任何组合,该方法包括在生长区域中种植两个或更多个本发明的植物(例如,包含在GRF转录因子基因中的突变的植物),从而提供与不包含至少一个非天然突变的多个对照大豆植物相比(例如,与不包含突变的等基因野生型大豆植物相比)具有改善的/增强的植物结构、改善的抗病性状和/或抗病性状的保留/维持和/或改善的产量性状和/或产量性状的保留/维持的多个大豆植物。生长区域可以是其中可以一起种植多个大豆植物的任何区域,包括但不限于田地(例如耕地、农田)、生长室、温室、休闲区、草坪和/或路边等。
在一些实施方案中,提供了产生/培育无转基因的经编辑的大豆植物的方法,该方法包括:将本发明的大豆植物(例如,包含本文所述的GRF转录因子基因中的突变的植物)与无转基因大豆植物杂交,从而将至少一个非天然突变引入无转基因的大豆植物中(例如,引入后代植物中);和选择包含至少一个非天然突变且无转基因的后代大豆植物,从而产生无转基因的经编辑的大豆植物。
在一些实施方案中,提供了用于编辑大豆植物细胞的基因组中的特定位点的方法,该方法包括:以位点特异性方式切割大豆植物细胞中的内源GRF转录因子基因内的靶位点,所述内源GRF转录因子基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域,从而在大豆植物细胞的内源GRF转录因子基因中产生编辑。在一些实施方案中,大豆植物可以从包含内源GRF转录因子基因中的编辑的大豆植物细胞再生,以产生在其基因组中(即,在其内源GRF转录因子基因中)包含编辑的大豆植物,任选地其中编辑导致与SEQ ID NO:133-147中任一个具有至少90%的序列同一性的GRF转录因子基因。当与缺乏其内源GRF转录因子基因的编辑的对照大豆植物相比时,包含如本文所述的内源GRF转录因子基因中的编辑的大豆植物可以表现出改善的/增强的植物结构、改善的抗病性状和/或抗病性状的保留/维持(例如,不丧失对一种或多种疾病的抗性)和/或改善的产量性状和/或产量性状的保留/维持(例如,没有产量的降低)或其任何组合,任选地,其中编辑是在miRNA结合位点中或在与由GRF转录因子基因编码的miRNA结合位点相邻的区域中(例如,在编码的miRNA结合位点内或由GRF转录因子基因编码的miRNA结合位点的5’和/或3'约1至约50个连续碱基对内)。在一些实施方案中,改善的产量性状的特征在于例如增加的产量(蒲式耳/英亩)、增加的每株植物的种子数量、增加的每茎节的豆荚数量、增加的每株植物的豆荚数量和/或增加的种子重量中的一种或多种。在一些实施方案中,改善的抗病性状或保留/维持的抗病性状可包括但不限于对大豆胞囊线虫(SCN)感染的抗性和/或对大豆锈菌感染的抗性。在一些实施方案中,改善/增强的植物结构可以包括但不限于增加的叶的数量和/或大小、增加的分枝或分枝点的数量、增加的分枝数量、增加的植物生物量、更陡的根角(例如更窄的根角)、更长的根、增加的通气组织、增加的根生物量、细胞壁/细胞结构成分的增厚等。
在一些实施方案中,内源GRF转录因子基因中的靶位点可以位于与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性或编码与SEQID NO:104-108中的任一个具有至少80%序列同一性的氨基酸序列的序列内,任选地其中靶位点位于内源GRF转录因子基因的miR396结合位点内或附近。因此,在一些实施方案中,内源GRF转录因子基因包含miR396结合位点,该miR396结合位点位于与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性或编码与SEQ IDNO:104-108中的任一个具有至少80%序列同一性的氨基酸序列的序列内,或位于与SEQ IDNO:109具有至少90%序列同一性的序列内,并且编辑在大豆植物细胞的内源GRF转录因子基因的miR396结合位点内产生或在与miR396结合位点相邻的区域中产生。
在一些实施方案中,编辑的方法产生非天然突变,任选地其中突变是缺失、取代、插入,任选地点突变。在一些实施方案中,编辑的方法产生的突变是显性突变、半显性突变、显性失活突变、无效突变、超形态突变、弱功能丧失突变或亚形态突变。
在一些实施方案中,提供了用于制备大豆植物的方法,该方法包括:(a)使包含编码GRF转录因子的内源基因的大豆植物细胞群体与包含核酸结合结构域的编辑系统接触,所述核酸结合结构域结合内源基因的一部分,所述内源基因(i)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(ii)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(iii)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(iv)包含编码与SEQ IDNO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域;(b)从群体中选择包含编码GRF转录因子的至少一个内源基因中的突变的大豆植物细胞,其中所述突变是所述至少一个内源基因中的至少一个核苷酸的取代,其中所述突变降低或消除miR396与由包含突变的编码GRF转录因子的至少一个内源基因产生的mRNA的结合;和(c)使选择的大豆植物细胞生长为大豆植物。
在一些实施方案中,提供了用于产生包含其中内源GRF转录因子基因被突变的至少一个细胞的大豆植物或其部分的方法,该方法包括使大豆植物或植物部分中的GRF转录因子基因中的靶位点与编辑系统接触,所述编辑系统包含与GRF转录因子基因中的靶位点结合的核酸结合结构域,所述GRF转录因子基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域,从而产生包含具有内源GRF转录因子基因中的突变的至少一个细胞的大豆植物或其部分。在一些实施方案中,突变的内源GRF转录因子基因产生具有miR396的减少的结合的mRNA,任选地其中miR396的减少的结合导致增加的GRF转录因子mRNA水平。
在一些实施方案中,提供了产生包含内源GRF转录因子基因中的突变的大豆植物或其部分的方法,所述突变产生具有减少的miR396结合的mRNA,所述方法包括使内源GRF转录因子基因中的靶位点与编辑系统接触,所述编辑系统包含与GRF转录因子基因中的靶位点结合的核酸结合结构域,所述GRF转录因子基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域,从而产生包含内源GRF转录因子基因中的突变的大豆植物或其部分,所述突变产生具有减少的miR396结合的mRNA。在一些实施方案中,包含内源GRF转录因子基因中的突变(其产生具有减少的miR396结合的mRNA)的大豆植物或其部分与对照大豆植物(例如,没有突变的大豆植物)相比表现出改善的或维持的/保留的产量性状、改善的植物结构和/或改善的或维持的/保留的抗病性状的表型。
在一些实施方案中,提供了产生具有改善的/保留的产量性状、改善的植物结构和/或改善的/保留的抗病性状的大豆植物或其部分的方法,该方法包括将大豆植物或植物部分中的内源GRF转录因子基因中的靶位点与编辑系统接触,所述编辑系统包含与GRF转录因子基因中的靶位点结合的核酸结合结构域,所述GRF转录因子基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)包含编码与SEQ IDNO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域,从而产生包含产生具有减少的miR396结合的mRNA的突变的内源GRF转录因子基因的大豆植物或其部分,从而产生具有改善的/保留的产量性状、改善的植物结构和/或改善的/保留的抗病性状的大豆植物或其部分,任选地其中与对照大豆植物相比,所述大豆植物或其植物部分表现出改善的防御性状而不丧失产量性状或改善的产量性状而不丧失防御性状的表型。
在一些实施方案中,提供了在植物中的内源GRF转录因子基因中产生突变的方法,该方法包括:(a)将基因编辑系统靶向至包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个具有至少80%序列同一性的核苷酸序列的GRF转录因子基因的一部分;(b)选择包含位于与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个具有至少80%序列同一性的MAR1基因的区域中的修饰的植物。
在一些实施方案中,提供了在GRF转录因子基因中产生变异的方法,该方法包括将编辑系统引入植物细胞(例如大豆植物)中,其中该编辑系统靶向至GRF转录因子基因的区域,和将GRF转录因子基因的区域与编辑系统接触,从而在GRF转录因子基因中引入突变,并在植物细胞的GRF转录因子基因中产生变异。在一些实施方案中,GRF转录因子基因:(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的区域。在一些实施方案中,被靶向的GRF转录因子基因的区域与SEQ ID NO:96-103或SEQ ID NO:122-129的核苷酸序列中的任一个具有至少80%的序列同一性,或者编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%的序列同一性的区域。在一些实施方案中,使植物细胞中的内源GRF转录因子基因的区域与编辑系统接触产生在其基因组中包含经编辑的内源GRF转录因子基因的植物细胞,该方法进一步包括(a)从植物细胞再生植物;(b)使植物自交以产生后代植物(E1);(c)针对改善或维持的产量性状、改善的植物结构和/或改善或维持的防御性状(例如,改善或维持的对大豆锈菌感染和/或大豆胞囊线虫感染的抗性)测定(b)的后代植物,任选其中防御性状得到改善或维持而不丧失产量性状和/或提供改善的产量性状而不丧失防御性状;和(d)选择表现出改善或维持的产量性状、改善的植物结构和/或改善或维持的防御性状的后代植物,以产生与对照植物相比表现出改善或维持的产量性状、改善的植物结构和/或改善或维持的防御性状的所选择的后代植物。在一些实施方案中,该方法可以进一步包括(e)使(d)的所选择的后代植物自交以产生后代植物(E2);(f)针对改善或维持的产量性状、改善的植物结构和/或改善或维持的防御性状测定(e)的后代植物;和(g)选择表现出改善的或维持的产量性状、改善的植物结构和/或改善的或维持的防御性状的后代植物,以产生与对照植物相比表现出改善的或维持的产量性状、改善的植物结构和/或改善的或维持的防御性状的所选择的后代植物,任选地重复(e)至(g)额外一次或多次。
在一些实施方案中,本发明的方法提供内源GRF转录因子基因中的突变,其中所述突变是非天然突变。在一些实施方案中,内源GRF转录因子基因中的突变是显性突变、半显性突变、显性失活突变、无效突变、超形态突变、弱功能丧失突变或亚形态突变。在一些实施方案中,通过本发明的方法产生的突变的GRF转录因子基因可包含与SEQ ID NO:133-147中任一个具有至少90%序列同一性的序列。在一些实施方案中,植物(例如,大豆植物)可以包含本文所述的一个或多个(例如,1、2、3、4、5、6或更多个)突变GRF转录因子基因,包括但不限于与SEQ ID NO:133-147具有至少90%序列同一性的突变的GRF转录因子基因。作为实例,植物可包含(1)SEQ ID NO:133、(2)SEQ ID NO:134、(3)SEQ ID NO:135、(4)SEQ ID NO:136、(5)SEQ ID NO:137、SEQ ID NO:138、SEQ ID NO:139和SEQ ID NO:140、(6)SEQ ID NO:144、(7)SEQ ID NO:146、(8)SEQ ID NO:144和SEQ ID NO:147、(9)SEQ ID NO:144和SEQ IDNO:145、(10)SEQ ID NO:141和SEQ ID NO:142和/或(11)SEQ ID NO:143,任选地其中对于任何给定等位基因处的一个或多个突变,植物可以是杂合的或纯合的,或其组合。在一些实施方案中,植物可以是杂合的并且在其基因组中特定基因座处的GRF转录因子基因的一个等位基因中包含突变,并且在相同基因的第二拷贝中的相同基因座处是野生型。在一些实施方案中,在特定的GRF基因座中,植物可以在特定GRF转录因子基因的每个等位基因处包含不同的突变,或者可以在每个等位基因处包含相同的突变。
在一些实施方案中,使用本发明的方法产生的大豆植物与缺乏突变的大豆植物相比表现出改善的或维持的/保留的产量性状、改善的植物结构和/或改善的或维持的/保留的抗病性状。在一些实施方案中,改善的产量性状可包括但不限于与缺乏突变的大豆植物相比增加的产量(蒲式耳/英亩)、增加的每株植物的种子数量、增加的每茎节的豆荚数量、增加的每株植物的豆荚数量和/或增加的种子重量中的一种或多种。一些实施方案中,改善的抗病性状或保留/维持的抗病性状可以包括但不限于对大豆胞囊线虫(SCN)感染的抗性,例如,与缺乏突变的大豆植物相比,增加或维持的对大豆胞囊线虫的抗性。在一些实施方案中,改善的抗病性状或保留/维持的抗病性状可包括但不限于对大豆锈菌感染的抗性,例如与缺乏突变的大豆植物相比,改善或维持的对豆薯层锈菌和/或山马蝗层锈菌的抗性。在一些实施方案中,改善/增强的植物结构可以包括但不限于与没有突变的大豆植物相比,增加的叶的数量和/或大小、增加的分枝或分枝点的数量、增加的分枝数量、增加的植物生物量、更陡的根角(例如更窄的根角)、更长的根、增加的通气组织、增加的根生物量、细胞壁/细胞结构成分的增厚等。
在一些实施方案中,可用于本发明的方法的靶位点可以位于GRF转录因子基因的区域中,该区域位于参考SEQ ID NO:72的核苷酸编号,从约核苷酸888至约核苷酸1069、从核苷酸948至约核苷酸1029和/或从约核苷酸928至约核苷酸1009;参考SEQ ID NO:73的核苷酸编号,从约核苷酸232至约核苷酸413、从约核苷酸272至约核苷酸373和/或从约核苷酸292至约核苷酸353(参见例如SEQ ID NO:96、SEQ ID NO:122);参考SEQ ID NO:75的核苷酸编号,从约核苷酸1200至约核苷酸1381、从约核苷酸1240至约核苷酸1341和/或从约核苷酸1260至约核苷酸11321;参考SEQ ID NO:76的核苷酸编号,从约核苷酸256至约核苷酸436、从约核苷酸296至约核苷酸397和/或从约核苷酸316至约核苷酸377(参见例如SEQ ID NO:97、SEQ ID NO:123);参考SEQ ID NO:78的核苷酸编号,从约核苷酸1226至约核苷酸1407,从约核苷酸1266至约核苷酸1367,和/或从约核苷酸1286至约核苷酸1347;参考SEQ ID NO:79的核苷酸编号,从约核苷酸274至约核苷酸455,从约核苷酸314至约核苷酸415,和/或从约核苷酸334至约核苷酸394(参见例如SEQ ID NO:98、SEQ ID NO:124);参考SEQ ID NO:81的核苷酸编号,从约核苷酸1374至约核苷酸1555、从约核苷酸1414至约核苷酸1515和/或从约核苷酸1434至约核苷酸1495;参考SEQ ID NO:82的核苷酸编号,从约核苷酸295至约核苷酸476、从约核苷酸335至约核苷酸436,和/或从约核苷酸355至约核苷酸416(参见例如SEQID NO:99、SEQ ID NO:125);参考SEQ ID NO:84的核苷酸编号,从约核苷酸798至约核苷酸979,从约核苷酸838至约核苷酸939,和/或从约核苷酸858至约核苷酸919;参考SEQ ID NO:85的核苷酸编号,从约核苷酸256至约核苷酸437,从约核苷酸296至约核苷酸397,和/或从约核苷酸316至约核苷酸377(参见例如SEQ ID NO:100、SEQ ID NO:126);参考SEQ ID NO:87的核苷酸编号,从约核苷酸972至约核苷酸1153、从约核苷酸1012至约核苷酸1113,和/或从约核苷酸1032至约核苷酸1093;参考SEQ ID NO:88的核苷酸编号,从约核苷酸262至约核苷酸443,从约核苷酸302至约核苷酸403,和/或从约核苷酸322至约核苷酸383(参见例如SEQ ID NO:101、SEQ ID NO:127);参考SEQ ID NO:90的核苷酸编号,从约核苷酸1579至约核苷酸1760,从约核苷酸1619至约核苷酸1720,和/或从约核苷酸1639至约核苷酸1700;参考SEQ ID NO:91的核苷酸编号,从约核苷酸640至约核苷酸821,从约核苷酸680至约核苷酸781,和/或从约核苷酸700至约核苷酸761(参见例如SEQ ID NO:102、SEQ ID NO:128);参考SEQ ID NO:93的核苷酸编号,从约核苷酸1538至约核苷酸1719、从约核苷酸1578至约核苷酸1679,和/或从约核苷酸1598至约核苷酸1659;和/或参考SEQ ID NO:94的核苷酸编号,从约核苷酸622至约核苷酸803、从约核苷酸662至约核苷酸763和/或从约核苷酸682至约核苷酸743(参见例如SEQ ID NO:103、SEQ ID NO:129)。
在一些实施方案中,可用于本发明方法的用于接触植物细胞、植物细胞群体和/或靶位点的核酸酶切割内源GRF转录因子基因,从而将突变引入内源GRF转录因子基因中,任选地,其中突变被引入内源GRF转录因子基因的包含miR396结合位点的区域,其中突变可以在miR396结合位点内或附近。在一些实施方案中,引入的突变可以是碱基取代、碱基插入和/或碱基缺失。在一些实施方案中,突变可以是非天然突变,任选地其中非天然突变是显性突变、半显性突变、显性失活突变、无效突变、超形态突变、弱功能丧失突变或亚形态突变。
可用于本发明的核酸酶可以是可用于编辑/修饰靶核酸的任何核酸酶。此类核酸酶包括但不限于锌指核酸酶、转录激活因子样效应核酸酶(TALEN)、核酸内切酶(例如Fok1)和/或CRISPR-Cas效应蛋白。同样地,可用于本发明的核酸结合结构域(例如,DNA结合结构域、RNA结合结构域)可以是可用于编辑/修饰靶核酸的任何核酸结合结构域。此类核酸结合结构域包括但不限于锌指、转录激活因子样DNA结合结构域(TAL)、argonaute和/或CRISPR-Cas效应子DNA结合结构域。
在一些实施方案中,提供了编辑植物或植物部分中的内源GRF转录因子基因的方法,该方法包括使植物或植物部分中的内源GRF转录因子基因中的靶位点与包含胞嘧啶脱氨酶和结合内源GRF转录因子基因中的靶位点的核酸结合结构域的胞嘧啶碱基编辑系统接触,所述内源GRF转录因子基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域,从而产生包含具有因与胞嘧啶碱基编辑系统接触而产生的突变的内源GRF转录因子基因的植物或其部分,并且任选地其中所述植物表现出改善的/增强的植物结构、改善的或维持的/保留的抗病性状和/或改善的或维持的/保留的产量性状或其任何组合。
在一些实施方案中,提供了编辑植物或植物部分中的内源GRF转录因子基因的方法,该方法包括使植物或植物部分中的内源GRF转录因子基因中的靶位点与包含腺苷脱氨酶和与GRF转录因子基因中的靶位点结合的核酸结合结构域的腺苷碱基编辑系统接触,所述内源GRF转录因子基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ IDNO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域,从而产生包含具有因与胞嘧啶碱基编辑系统接触而产生的突变的内源GRF转录因子基因的植物或其部分,并且任选地其中植物表现出改善的/增强的植物结构、改善的或维持的/保留的抗病性状和/或改善的或维持的/保留的产量性状或其任何组合。
因此,在一些实施方案中,通过本发明的方法产生的植物(例如,大豆植物)或其部分可以包含本文所述的一个或多个(例如,1、2、3、4、5、6或更多个)突变的GRF转录因子基因,包括但不限于与SEQ ID NO:133-147具有至少90%序列同一性的一个或多个经突变的GRF转录因子基因。
在一些实施方案中,提供了检测突变型GRF转录因子基因(内源GRF转录因子基因中的突变)的方法,该方法包括检测植物基因组中内源GRF转录因子核酸中的如本文所述的突变。在一些实施方案中,本发明提供了检测内源GRF转录因子基因中的突变的方法,包括检测植物基因组中如本文所述产生的突变的GRF转录因子基因。
在一些实施方案中,提供了检测突变型GRF转录因子基因(例如,检测内源GRF转录因子基因中的突变)的方法,该方法包括检测植物基因组中GRF的amir396结合位点中或附近的突变转录因子基因,任选地其中miR396结合位点位于例如位于以下位置的区域中:参考SEQ ID NO:72的核苷酸编号,从约核苷酸888至约核苷酸1069、从核苷酸948至约核苷酸1029和/或从约核苷酸928至约核苷酸1009;参考SEQ ID NO:73的核苷酸编号,从约核苷酸232至约核苷酸413、从约核苷酸272至约核苷酸373和/或从约核苷酸292至约核苷酸353(参见例如SEQ ID NO:96、SEQ ID NO:122);参考SEQ ID NO:75的核苷酸编号,从约核苷酸1200至约核苷酸1381、从约核苷酸1240至约核苷酸1341和/或从约核苷酸1260至约核苷酸11321;参考SEQ ID NO:76的核苷酸编号,从约核苷酸256至约核苷酸436、从约核苷酸296至约核苷酸397和/或从约核苷酸316至约核苷酸377(参见例如SEQ ID NO:97、SEQ ID NO:123);参考SEQ ID NO:78的核苷酸编号,从约核苷酸1226至约核苷酸1407,从约核苷酸1266至约核苷酸1367,和/或从约核苷酸1286至约核苷酸1347;参考SEQ ID NO:79的核苷酸编号,从约核苷酸274至约核苷酸455,从约核苷酸314至约核苷酸415,和/或从约核苷酸334至约核苷酸394(参见例如SEQ ID NO:98、SEQ ID NO:124);参考SEQ ID NO:81的核苷酸编号,从约核苷酸1374至约核苷酸1555、从约核苷酸1414至约核苷酸1515和/或从约核苷酸1434至约核苷酸1495;参考SEQ ID NO:82的核苷酸编号,从约核苷酸295至约核苷酸476、从约核苷酸335至约核苷酸436,和/或从约核苷酸355至约核苷酸416(参见例如SEQ ID NO:99、SEQID NO:125);参考SEQ ID NO:84的核苷酸编号,从约核苷酸798至约核苷酸979,从约核苷酸838至约核苷酸939,和/或从约核苷酸858至约核苷酸919;参考SEQ ID NO:85的核苷酸编号,从约核苷酸256至约核苷酸437,从约核苷酸296至约核苷酸397,和/或从约核苷酸316至约核苷酸377(参见例如SEQ ID NO:100、SEQ ID NO:126);参考SEQ ID NO:87的核苷酸编号,从约核苷酸972至约核苷酸1153、从约核苷酸1012至约核苷酸1113,和/或从约核苷酸1032至约核苷酸1093;参考SEQ ID NO:88的核苷酸编号,从约核苷酸262至约核苷酸443,从约核苷酸302至约核苷酸403,和/或从约核苷酸322至约核苷酸383(参见例如SEQ ID NO:101、SEQ ID NO:127);参考SEQ ID NO:90的核苷酸编号,从约核苷酸1579至约核苷酸1760,从约核苷酸1619至约核苷酸1720,和/或从约核苷酸1639至约核苷酸1700;参考SEQ ID NO:91的核苷酸编号,从约核苷酸640至约核苷酸821,从约核苷酸680至约核苷酸781,和/或从约核苷酸700至约核苷酸761(参见例如SEQ ID NO:102、SEQ ID NO:128);参考SEQ ID NO:93的核苷酸编号,从约核苷酸1538至约核苷酸1719、从约核苷酸1578至约核苷酸1679,和/或从约核苷酸1598至约核苷酸1659;和/或参考SEQ ID NO:94的核苷酸编号,从约核苷酸622至约核苷酸803、从约核苷酸662至约核苷酸763和/或从约核苷酸682至约核苷酸743(参见例如SEQ ID NO:103、SEQ ID NO:129),任选地位于与SEQ ID NO:109的核苷酸序列具有至少80%同一性的GRF转录因子基因的区域中。在一些实施方案中,突变是至少一个核苷酸的插入、缺失或取代(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个或更多个连续碱基的缺失;例如,至少一个核苷酸的插入和/或取代(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个或更多个碱基任选连续碱基的插入和/或取代))。
在一些实施方案中,本发明提供了产生包含内源GRF转录因子基因中的突变和至少一种感兴趣的多核苷酸的大豆植物的方法,该方法包括使包含内源GRF转录因子基因中的至少一个突变的本发明的大豆植物(第一大豆植物)与包含至少一种感兴趣的多核苷酸的第二大豆植物杂交,以产生后代大豆植物;以及选择包含GRF转录因子基因中的至少一个突变和至少一种感兴趣的多核苷酸的后代大豆植物,从而产生包含内源GRF转录因子基因中的突变和至少一种感兴趣的多核苷酸的大豆植物。
进一步提供了产生包含内源GRF转录因子基因中的突变和至少一种感兴趣的多核苷酸的大豆植物的方法,该方法包括将至少一种感兴趣的多核苷酸引入包含GRF转录因子基因中的至少一个突变的本发明的大豆植物中,从而产生包含GRF转录因子基因中的至少一个突变和至少一种感兴趣的多核苷酸的大豆植物。
感兴趣的多核苷酸可以是能够赋予植物所需的表型或以其他方式修饰植物的表型或基因型的任何多核苷酸。在一些实施方案中,感兴趣的多核苷酸可以是赋予除草剂耐受性、抗虫性、抗病性、改善的产量性状、增加的养分利用效率和/或非生物胁迫抗性的多核苷酸。
可用于本发明的GRF转录因子基因包括大豆植物中的任何内源GRF转录因子基因,其中当内源GRF转录因子基因的miR396结合位点或与miRNA结合位点相邻的区域被修饰时,大豆植物与没有内源GRF转录因子基因的miR396结合位点中或邻近的修饰的大豆植物或植物部分(例如,同基因植物)相比表现出包括改善/增强的植物结构和/或改善的抗病性状和/或抗病性状的保留/维持(例如,不丧失对一种或多种疾病的抗性)和/或改善的产量性状和/或产量性状的保留/维持(例如,没有产量的降低)或其任何组合中的一种或多种的表型。
在一些实施方案中,内源GRF转录因子基因中的突变可以是非天然突变。在一些实施方案中,突变可以是内源GRF转录因子基因中的任何突变,所述突变当包含在大豆植物中时导致改善的或维持的/保留的产量性状、改善的植物结构和/或改善的或维持的/保留的性状、或其任何组合。
在一些实施方案中,内源GRF转录因子基因中的至少一个非天然突变可以是碱基取代、碱基插入和/或碱基缺失,任选地点突变。在一些实施方案中,至少一个非天然突变可以是A、T、G或C的碱基取代。在一些实施方案中,内源GRF转录因子基因中的至少一个非天然突变可以是显性突变、半显性突变、显性失活突变、无效突变、超形态突变、弱功能丧失突变或亚形态突变。在一些实施方案中,大豆植物中的内源GRF转录因子基因中的至少一个非天然突变可以是取代、缺失和/或插入,其导致大豆植物表现出改善的或维持的产量性状、改善的植物结构,和/或改善或维持的抗病性状。在一些实施方案中,包含如本文所述的突变的大豆植物可以表现出的改善的防御性状可以包括但不限于增加的大豆胞囊线虫(SCN)抗性,例如增加的对大豆胞囊线虫的抗性,和/或增加的对大豆锈菌的抗性,例如,增加的对豆薯层锈菌和/或山马蝗层锈菌的抗性。在一些实施方案中,“改善的产量性状”可以包括但不限于增加的产量(蒲式耳/英亩)、增加的每株植物的种子数量、增加的每茎节的豆荚数量、增加的每株植物的豆荚数量和/或增加的种子重量中的一种或多种。在一些实施方案中,改善的植物结构的表型可以包括但不限于增加的叶的数量和/或大小、增加的分枝或分枝点的数量、增加的分枝数量、增加的植物生物量、更陡的根角(例如更窄的根角)、更长的根、增加的通气组织、增加的根生物量、细胞壁/细胞结构成分的增厚等。在一些实施方案中,如本文所述修饰的大豆植物可包含一种或多种改善的产量性状和/或改善的植物结构性状和改善的抗病性状。在一些实施方案中,如本文所述修饰的大豆植物可包含一种或多种改善的产量性状和/或改善的植物结构性状,同时维持抗病性状(不丧失抗病性),包括但不限于大豆胞囊线虫(SCN)抗性和/或大豆锈菌抗性。在一些实施方案中,如本文所述修饰的大豆植物可以包含一种或多种改善的抗病性状,包括但不限于改善的对大豆胞囊线虫(SCN)的抗性和/或改善的对大豆锈菌的抗性,任选地具有改善的植物结构性状,同时保持至少一种产量性状(例如,不丧失产量或丧失至少一种产量性状)。
在一些实施方案中,本发明提供了结合编码GRF转录因子基因的内源基因中的靶位点的引导核酸(例如,gRNA、gDNA、crRNA、crDNA),所述内源基因:(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)包含编码与SEQ IDNO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域。在一些实施方案中,引导核酸结合的靶位点包含与SEQ ID NO:96-103中任一个的核苷酸序列具有至少80%序列同一性的序列或编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列。
与本发明的引导核酸一起使用的间隔序列可以与GRF转录因子核酸的连续核苷酸的片段或部分(或区域)互补或基本上互补,所述GRF转录因子核酸包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的核苷酸序列,或编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列,其中所述片段或部分(或区域)包含与SEQ IDNO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的序列;和/或编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列。在一些实施方案中,引导核酸的示例性间隔区包含与SEQ ID NO:111-113或SEQ ID NO:130-131中任一个具有至少80%同一性的核苷酸序列,任选地其中间隔区包含SEQ ID NO:111-113或SEQ ID NO:130-131中任一个的核苷酸序列。
在一些实施方案中,提供了包含本发明的引导核酸和与引导核酸缔合的CRISPR-Cas效应蛋白的系统。在一些实施方案中,系统还可包含与引导核酸和CRISPR-Cas效应蛋白缔合的tracr核酸,任选地其中tracr核酸和引导核酸共价连接。
在一些实施方案中,提供了基因编辑系统,该基因编辑系统包含与引导核酸结合的CRISPR-Cas效应蛋白,其中该引导核酸包含与GRF转录因子基因结合的间隔序列,其中GRF转录因子基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域。
在一些实施方案中,基因编辑系统包含具有间隔区的引导核酸,所述间隔区与GRF转录因子核酸的连续核苷酸的片段或部分(或区域)互补或基本上互补,所述GRF转录因子核酸包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的核苷酸序列,或编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列,其中所述片段或部分(或区域)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的序列;和/或编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列。在一些实施方案中,本发明的基因编辑系统的引导核酸的示例性间隔区可以包含与SEQ ID NO:111-113或SEQ ID NO:130-131中任一个具有至少80%同一性的核苷酸序列,任选地其中示例间隔子可包含SEQ ID NO:111-113或SEQ ID NO:130-131中任一个的核苷酸序列。
如本文所用,“与引导核酸缔合的CRISPR-Cas效应蛋白”或“与引导核酸缔合的CRISPR-Cas效应蛋白”是指在CRISPR-Cas效应蛋白和引导核酸之间形成的复合物,以将CRISPR-Cas效应蛋白引导至基因中的靶位点。
在一些实施方案中,本发明的基因编辑系统靶向的GRF转录因子基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域。在一些实施方案中,本发明的编辑系统的间隔区序列结合GRF转录因子基因的miR396结合位点或结合靠近或邻近miR396结合位点的GRF转录因子基因的区域(例如,在miR396结合位点的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个核苷酸内;例如,在编码miR396结合位点的GRF转录因子基因的区域的5'和/或3'端的约1至约100个碱基对内)(例如,本发明的编辑系统的间隔序列以这样的方式配置,以使得间隔区与GRF转录因子基因的区域互补(例如,基本上或完全互补)并结合,该区域是编码miRNA396结合位点的GRF转录因子基因的区域的5’或3’的约1至约100个碱基对)。在一些实施方案中,GRF转录因子基因的miR396结合位点被本发明的编辑系统靶向和突变。在一些实施方案中,邻近GRF转录因子基因的miR396结合位点的区域被本发明的编辑系统靶向和突变。
在一些实施方案中,提供了结合内源生长调节因子(GRF)基因中的靶位点的引导核酸,其中所述GRF基因具有GLYMA_11g008500、GLYMA_01g234400、GLYMA_12g014700、GLYMA_11g110700、GLYMA_07g038400、GLYMA_16g007600、GLYMA_04g230600和/或GLYMA_06g134600的基因识别号(基因ID)。在一些实施方案中,引导核酸包含与内源GRF基因的miR396结合位点中或附近(例如邻近)的靶位点具有互补性的间隔序列,所述内源GRF基因具有GLYMA_11g008500、GLYMA_01g234400、GLYMA_12g014700、GLYMA_11g110700、GLYMA_07g038400、GLYMA_16g007600、GLYMA_04g230600和/或GLYMA_06g134600的基因识别号(基因ID)。
本发明进一步提供了包含含有切割结构域(例如,核酸酶)的CRISPR-Cas效应蛋白和引导核酸(例如gRNA)的复合物,其中所述引导核酸与GRF转录因子基因中的靶位点结合,所述GRF转录因子基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域,其中所述切割结构域切割GRF基因中的靶标链。
本文还提供了表达盒,其包含(a)编码包含切割结构域的CRISPR-Cas效应蛋白的多核苷酸和(b)与GRF转录因子基因中的靶位点结合的引导核酸,其中所述引导核酸包含间隔序列,所述间隔序列与以下序列的一部分互补并结合,所述以下序列(i)与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93、94、96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性;和/或(ii)编码与SEQ ID NO:74、77、80、83、86、89、92、95或104-108中任一个的氨基酸序列具有至少80%序列同一性的序列,任选地,其中序列的一部分的长度为约2至约22个连续核苷酸(例如,约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22个连续核苷酸;例如,约2、3、4、5、6、7、8、9或10个连续核苷酸至约11、12、13、14、15、16、17、18、19、20、21或22个连续核苷酸),任选地其中序列的一部分的长度为约19、20、21或22(例如,约19至约22)个连续核苷酸。
可用于本发明的编辑系统可以是现在已知或以后开发的任何位点特异性(序列特异性)基因组编辑系统,该系统可以以靶标特异性方式引入突变。例如,编辑系统(例如,位点特异性或序列特异性编辑系统)可以包括但不限于CRISPR-Cas编辑系统、大范围核酸酶编辑系统、锌指核酸酶(ZFN)编辑系统、转录激活因子样效应核酸酶(TALEN)编辑系统、碱基编辑系统和/或引物编辑系统,其各自可以包含一种或多种多肽和/或一种或多种多核苷酸,当其在细胞中表达为系统时,可以以序列特异性方式修饰(突变)靶核酸。在一些实施方案中,编辑系统(例如,位点特异性或序列特异性编辑系统)可以包含一种或多种多核苷酸和/或一种或多种多肽,包括但不限于核酸结合结构域(DNA结合结构域)、核酸酶,和/或其他多肽,和/或多核苷酸,和/或引导核酸(包含与靶位点具有基本互补性或完全互补性的间隔区)。
在一些实施方案中,编辑系统可以包含一个或多个序列特异性核酸结合结构域(例如,序列特异性DNA结合结构域),其可以来自例如多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应核酸酶(TALEN)和/或Argonaute蛋白。在一些实施方案中,编辑系统可以包含一个或多个切割结构域(例如,核酸酶),包括但不限于核酸内切酶(例如,Fok1)、多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)、锌指核酸酶和/或转录激活因子样效应核酸酶(TALEN)。在一些实施方案中,编辑系统可以包含一种或多种多肽,其包括但不限于脱氨酶(例如,胞嘧啶脱氨酶、腺嘌呤脱氨酶)、逆转录酶、Dna2多肽和/或5’瓣核酸内切酶(FEN)。在一些实施方案中,编辑系统可包含一种或多种多核苷酸,其包括但不限于CRISPR阵列(CRISPR引导)核酸、延伸的引导核酸和/或逆转录酶模板。
在一些实施方案中,修饰或编辑GRF转录因子多肽的方法可以包括使靶核酸(例如,编码GRF转录因子多肽的核酸,例如编码miR369结合位点的GRF转录因子多核苷酸的区域)与融合至脱氨酶结构域(例如,腺嘌呤脱氨酶和/或胞嘧啶脱氨酶)的碱基编辑融合蛋白(例如,序列特异性核酸结合蛋白(例如,CRISPR-Cas效应蛋白或结构域))和引导核酸接触,其中引导核酸能够将碱基编辑融合蛋白引导/靶向至靶核酸,从而编辑靶核酸内的基因座。在一些实施方案中,碱基编辑融合蛋白和引导核酸可以包含在一个或多个表达盒中。在一些实施方案中,靶核酸可以与碱基编辑融合蛋白和包含引导核酸的表达盒接触。在一些实施方案中,序列特异性核酸结合融合蛋白和引导物可以作为核糖核蛋白(RNP)提供。在一些实施方案中,细胞可以与多于一种碱基编辑融合蛋白和/或可以靶向细胞中的一种或多种靶核酸的一种或多种引导核酸接触。
在一些实施方案中,修饰或编辑GRF转录因子基因的方法可以包括使靶核酸(例如,编码GRF转录因子多肽的核酸,例如编码miR369结合位点的GRF转录因子多核苷酸的区域)与融合至肽标签的序列特异性核酸结合融合蛋白(例如,序列特异性DNA结合蛋白(例如,CRISPR-Cas效应蛋白或结构域))、包含融合至能够结合肽标签的亲和多肽的脱氨酶结构域(例如,腺嘌呤脱氨酶和/或胞嘧啶脱氨酶)的脱氨酶融合蛋白和引导核酸接触,其中引导核酸能够将序列特异性核酸结合融合蛋白引导/靶向至靶核酸,并且序列特异性核酸结合融合蛋白能够通过肽标签-亲和多肽相互作用将脱氨酶融合蛋白募集至靶核酸,从而编辑靶核酸内的基因座。在一些实施方案中,序列特异性核酸结合融合蛋白可与结合肽标签的亲和多肽融合,并且脱氨酶可与肽标签融合,从而将脱氨酶募集至序列特异性核酸结合融合蛋白和靶核酸。在一些实施方案中,序列特异性结合融合蛋白、脱氨酶融合蛋白和引导核酸可以包含在一个或多个表达盒中。在一些实施方案中,靶核酸可以与序列特异性结合融合蛋白、脱氨酶融合蛋白和包含引导核酸的表达盒接触。在一些实施方案中,序列特异性核酸结合融合蛋白、脱氨酶融合蛋白和引导物可以作为核糖核蛋白(RNP)提供。
在一些实施方案中,诸如引物编辑的方法可用于在内源GRF转录因子基因中产生突变。在引物编辑中,RNA依赖性DNA聚合酶(逆转录酶,RT)和逆转录酶模板(RT模板)与赋予以序列特异性方式识别和结合靶标的能力并且还可能导致靶标内含有PAM的链的切口的序列特异性核酸结合域组合使用。核酸结合结构域可以是CRISPR-Cas效应蛋白,并且在这种情况下,CRISPR阵列或引导RNA可以是延伸的引导物,其包含含有引物结合位点(PSB)的延伸部分和待掺入基因组(模板)的编辑。与碱基编辑类似,引物编辑可以利用招募蛋白质用于编辑靶位点的各种方法,这些方法包括所选择的基因组编辑过程中使用的蛋白质和核酸之间的非共价和共价相互作用。
在一些实施方案中,提供了突变的GRF转录因子核酸。在一些实施方案中,突变的GRF转录因子核酸包含具有突变的miR396结合位点。在一些实施方案中,当GRF转录因子核酸包含突变的miR396结合位点或邻近miR396结合位点的区域中的突变时,miR396结合位点中或邻近的突变破坏miR396与由突变的GRF转录因子基因产生的mRNA的结合(例如,降低或消除miR396与由突变的GRF转录因子基因产生的GRF mRNA的结合)。
在一些实施方案中,提供了包含如本文所述的突变的GRF转录因子核酸的大豆植物,任选地其中所述突变位于具有基因识别号(基因ID)GLYMA_11g008500、GLYMA_01g234400、GLYMA_12g014700、GLYMA_11g110700、GLYMA_07g038400、GLYMA_16g007600、GLYMA_04g230600和/或GLYMA_06g134600的内源GRF转录因子基因中(参见表1)。在一些实施方案中,突变位于具有基因识别号GLYMA_11g008500、GLYMA_01g234400、GLYMA_12g014700、GLYMA_11g110700、GLYMA_07g038400、GLYMA_16g007600、GLYMA_04g230600和/或GLYMA_06g134600的内源GRF转录因子基因的miR396结合位点/结构域中或附近。在一些实施方案中,包含突变的GRF转录因子核酸的大豆植物表现出改善的或维持的/保留的产量性状、改善的植物结构和/或改善的或维持的抗病性状,任选地与缺乏突变的植物相比表现出一种或多种以下表型:增加的产量(蒲式耳/英亩)、增加的每株植物的种子数量、增加的每茎节的豆荚数量、增加的每株植物的豆荚数量和/或增加的种子重量和/或改善或维持的对SCN和/或大豆锈菌的抗性,或与缺乏突变的植物相比,表现出改善的对SCN和/或大豆锈菌的抗性和以下一种或多种表型的保留或改善:产量(蒲式耳/英亩)、每株植物的种子数、每茎节的豆荚数、每株植物的豆荚数和/或种子重量。在一些实施方案中,具有基因标识号GLYMA_11g008500、GLYMA_01g234400、GLYMA_12g014700、GLYMA_11g110700、GLYMA_07g038400、GLYMA_16g007600、GLYMA_04g230600和/或GLYMA_06g134600的GRF转录因子基因中的突变是显性突变、半显性突变、无效突变、超形态突变、亚形态突变或弱功能丧失突变。
表1.基因ID和间隔序列
在一些实施方案中,引入内源GRF转录因子基因多肽中的突变是非天然突变。在一些实施方案中,引入内源GRF转录因子基因中的突变可以是如本文所述的一个或多个核苷酸的取代、插入和/或缺失。在一些实施方案中,引入内源GRF转录因子基因中的突变可以是缺失,任选地从内源GRF转录因子基因中缺失1个至约100个或更多个核苷酸。在一些实施方案中,突变位于在大豆植物的内源GRF转录因子基因中编码/由大豆植物的内源GRF转录因子基因编码的miR396结合位点中或附近。在一些实施方案中,大豆植物的内源GRF转录因子基因中的突变可以导致植物表现出改善的或维持的/保留的产量性状、改善的植物结构和/或改善的或维持的/保留的抗病性状,任选地与不包含突变的同基因大豆植物(例如,野生型未编辑植物或无效分离子)相比表现出以下一种或多种表型:增加的产量(蒲式耳/英亩)、增加的每株植物的种子数量、增加的每茎节的豆荚数量、增加的每株植物的豆荚数量和/或增加的种子重量和/或改善或维持的对SCN和/或大豆锈菌的抗性,或与不包含突变的同基因大豆植物(例如,野生型未编辑植物或无效分离子)相比表现出一种或多种以下表型:增加的对SCN和/或大豆锈菌的抗性和维持或改善的产量的性状,包括但不限于产量(蒲式耳/英亩)、每株植物的种子数、每茎节的豆荚数、每株植物的豆荚数和/或种子重量。
在一些实施方案中,可用于本发明的编辑系统的序列特异性核酸结合结构域(序列特异性DNA结合结构域)可以来自例如多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应核酸酶(TALEN)和/或Argonaute蛋白。
在一些实施方案中,序列特异性核酸结合结构域可以是CRISPR-Cas效应蛋白,任选地,其中CRISPR-Cas效应蛋白可以来自I型CRISPR-Cas系统、II型CRISPR-Cas系统、III型CRISPR-Cas系统、IV型CRISPR-Cas系统、V型CRISPR-Cas系统或VI型CRISPR-Cas系统。在一些实施方案中,本发明的CRISPR-Cas效应蛋白可以来自II型CRISPR-Cas系统或V型CRISPR-Cas系统。在一些实施方案中,CRISPR-Cas效应蛋白可以是II型CRISPR-Cas效应蛋白,例如Cas9效应蛋白。在一些实施方案中,CRISPR-Cas效应蛋白可以是V型CRISPR-Cas效应蛋白,例如Cas12效应蛋白。
如本文所用,“CRISPR-Cas效应蛋白”是裂解或剪切核酸、结合核酸(例如,靶核酸和/或引导核酸)和/或鉴定、识别或结合本文定义的引导核酸的蛋白质或多肽或其结构域。在一些实施方案中,CRISPR-Cas效应蛋白可以是酶(例如,核酸酶、核酸内切酶、切口酶等)或其部分和/或可以起到酶的作用。在一些实施方案中,CRISPR-Cas效应蛋白是指CRISPR-Cas核酸酶多肽或其结构域,其包含核酸酶活性或其中核酸酶活性已降低或消除,和/或包含切口酶活性或其中切口酶已降低或消除,和/或包含单链DNA切割活性(ss DNA酶活性)或其中ss DNA酶活性已降低或消除,和/或包含自加工RNA酶活性或其中自加工RNA酶活性已降低或消除。CRISPR-Cas效应蛋白可以结合靶核酸。
在一些实施方案中,CRISPR-Cas效应蛋白可以包括但不限于Cas9、C2c1、C2c3、Cas12a(也称为Cpf1)、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3'、Cas3"、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csnl和Csx12)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Cs、Csf2、Csf3、Csf4(dinG)和/或Csf5核酸酶,任选其中CRISPR-Cas效应蛋白可以是Cas9、Cas12a(Cpf1)、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b和/或Cas14c效应蛋白。
在一些实施方案中,可用于本发明的CRISPR-Cas效应蛋白可以在其核酸酶活性位点(例如,RuvC、HNH,例如,Cas12a核酸酶结构域的RuvC位点;例如,Cas9核酸酶结构域的RuvC位点和/或HNH位点)中包含突变。在其核酸酶活性位点具有突变并因此不再包含核酸酶活性的CRISPR-Cas效应蛋白通常被称为“死”,例如dCas。在一些实施方案中,与没有突变的相同CRISPR-Cas效应蛋白(例如切口酶,例如Cas9切口酶,Cas12a切口酶)相比,在其核酸酶活性位点具有突变的CRISPR-Cas效应蛋白结构域或多肽可能具有受损的活性或降低的活性。
可用于本发明的CRISPR Cas9效应蛋白或CRISPR Cas9效应结构域可以是任何已知的或后来鉴定的Cas9核酸酶。在一些实施方案中,CRISPR Cas9多肽可以是来自例如链球菌属的几个种(例如,化脓性链球菌、嗜热链球菌)、乳杆菌属的几个种(Lactobacillusspp.)、双歧杆菌属的几个种(Bifidobacterium spp.)、坎德勒氏菌属的几个种(Kandleriaspp.)、明串珠菌属的几个种(Leuconostoc spp.)、酒球菌属的几个种(Oenococcus spp.)、片球菌属的几个种(Pediococcus spp.)、魏斯氏菌属的几个种(Weissella spp.)和/或奥森氏菌属的几个种(Olsenella spp.)的Cas9多肽。示例性Cas9序列包括但不限于SEQ IDNO:59-60的氨基酸序列或SEQ ID NO:61-71的多核苷酸序列。
在一些实施方案中,CRISPR-Cas效应蛋白可以是源自化脓性链球菌并且识别PAM序列基序NGG、NAG、NGA的Cas9多肽(Mali等人,Science 2013;339(6121):823-826)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自嗜热链球菌并且识别PAM序列基序NGGNG和/或NNAGAAW(W=A或T)的Cas9多肽(参见例如Horvath等人,Science,2010;327(5962):167-170,和Deveau等人,J Bacteriol 2008;190(4):1390-1400)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自变形链球菌(Streptococcus mutans)并且识别PAM序列基序NGG和/或NAAR(R=A或G)的Cas9多肽(参见例如Deveau等人,J BACTERIOL 2008;190(4):1390-1400)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自金黄色链球菌并识别PAM序列基序NN GRR(R=A或G)的Cas9多肽。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自金黄色葡萄球菌的Cas9蛋白,其识别PAM序列基序N GRRT(R=A或G)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自金黄色葡萄球菌的Cas9多肽,其识别PAM序列基序N GRRV(R=A或G)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自脑膜炎奈瑟菌(Neisseriameningitidis)并且识别PAM序列基序N GATT或N GCTT(R=A或G,V=A、G或C)的Cas9多肽(参见,例如,Hou等人,PNAS2013,1-6)。在上述实施方案中,N可以是任何核苷酸残基,例如A、G、C或T中的任何一个。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自沙氏纤毛菌(Leptotrichia shahii)的Cas13a蛋白,其识别单个3'A、U或C的前间隔区侧翼序列(PFS)(或RNA PAM(rPAM))序列基序,其可能位于靶核酸内。
在一些实施方案中,CRISPR-Cas效应蛋白可以源自Cas12a,其是V型聚集规则间隔短回文重复序列(CRISPR)-Cas核酸酶,参见例如SEQ ID NO:1-20)。Cas12a在几个方面与更知名的II型CRISPR Cas9核酸酶不同。例如,Cas9识别富含G的前间隔区邻近基序(PAM),它位于其引导RNA(gRNA、sgRNA、crRNA、crDNA、CRISPR阵列)结合位点(前间隔区、靶核酸、靶DNA)的3'(3'-NGG),而Cas12a识别位于靶核酸的5'的富含T的PAM(5'-TTN,5'-TTTN。事实上,其中Cas9和Cas12a结合其引导RNA的方向关于其N和C末端是非常几乎相反的。此外,Cas12a酶使用单引导RNA(gRNA、CRISPR阵列、crRNA),而不是在天然Cas9系统中发现的双引导RNA(sgRNA(例如crRNA和tracrRNA)),并且Cas12a加工其自身的gRNA。此外,Cas12a核酸酶活性产生交错的DNA双链断裂,而不是由Cas9核酸酶活性产生的平末端,并且Cas12a依赖于单个RuvC结构域来切割两条DNA链,而Cas9利用HNH结构域和RuvC结构域用于切割。
可用于本发明的CRISPR Cas12a效应蛋白/结构域可以是任何已知的或后来鉴定的Cas12a多肽(以前称为Cpf1)(参见例如美国专利号9,790,490,其关于Cpf1(Cas12a)序列的公开内容通过引用并入本文)。术语“Cas12a”、“Cas12a多肽”或“Cas12a结构域”是指包含Cas12a多肽或其片段的RNA引导的核酸酶,其包含Cas12a的引导核酸结合结构域和/或Cas12a的活性、非活性或部分活性DNA切割结构域。在一些实施方案中,可用于本发明的Cas12a可包含核酸酶活性位点(例如,Cas12a结构域的RuvC位点)中的突变。在其核酸酶活性位点中具有突变并因此不再包含核酸酶活性的Cas12a结构域或Cas12a多肽通常被称为deadCas12a(例如,dCas12a)。在一些实施方案中,在其核酸酶活性位点中具有突变的Cas12a结构域或Cas12a多肽可能具有受损的活性,例如,可能具有切口酶活性。
可用于碱基编辑的任何脱氨酶结构域/多肽可用于本发明。在一些实施方案中,脱氨酶结构域可以是胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域。可用于本发明的胞嘧啶脱氨酶(或胞苷脱氨酶)可以是来自任何生物体的任何已知或后来鉴定的胞嘧啶脱氨酶(参见例如美国专利号10,167,457和Thuronyi等人,Nat.Biotechnol.37:1070-1079(2019),其各自关于其胞嘧啶脱氨酶的公开内容通过引用并入本文)。胞嘧啶脱氨酶可分别催化胞苷或脱氧胞苷水解脱氨为尿苷或脱氧尿苷。因此,在一些实施方案中,可用于本发明的脱氨酶或脱氨酶结构域可以是胞苷脱氨酶结构域,其催化胞嘧啶水解脱氨为尿嘧啶。在一些实施方案中,胞嘧啶脱氨酶可以是天然存在的胞嘧啶脱氨酶的变体,包括但不限于灵长类动物(例如人、猴、黑猩猩、大猩猩)、狗、牛、大鼠或小鼠。因此,在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以与野生型胞嘧啶脱氨酶约70%至约100%相同(例如,与天然存在的胞嘧啶脱氨酶约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同,以及其中的任何范围或值)。
在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以是载脂蛋白B mRNA-编辑复合物(APOBEC)家族脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是APOBEC 1脱氨酶、APOBEC 2脱氨酶、APOBEC 3A脱氨酶、APOBEC 3B脱氨酶、APOBEC 3C脱氨酶、APOBEC 3D脱氨酶、APOBEC 3F脱氨酶、APOBEC 3G脱氨酶、APOBEC 3H脱氨酶、APOBEC 4脱氨酶、人活化诱导脱氨酶(hAID)、rAPOBEC 1、FERNY和/或CDA1,任选地pmCDA1、atCDA1(例如,At2g19570),以及它们的进化形式(例如,SEQ ID NO:27、SEQ ID NO:28或SEQ ID NO:29)。在一些实施方案中,胞嘧啶脱氨酶可以是具有SEQ ID NO:23的氨基酸序列的APOBEC1脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是具有SEQ ID NO:24的氨基酸序列的APOBEC3A脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是CDA1脱氨酶,任选地是具有SEQ ID NO:25的氨基酸序列的CDA1。在一些实施方案中,胞嘧啶脱氨酶可以是FERNY脱氨酶,任选地是具有SEQ ID NO:26的氨基酸序列的FERNY。在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以与天然存在的胞嘧啶脱氨酶(例如进化的脱氨酶)的氨基酸序列约70%至约100%相同的(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%相同)。在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可与SEQ ID NO:23、SEQID NO:24、SEQ ID NO:25或SEQ ID NO:26的氨基酸序列约70%至约99.5%相同(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%相同)(例如,与SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28或SEQ ID NO:29的氨基酸序列至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%相同)。在一些实施方案中,可以对编码胞嘧啶脱氨酶的多核苷酸进行密码子优化以用于在植物中表达,并且密码子优化的多肽可以与参考多核苷酸约70%至99.5%相同。
在一些实施方案中,本发明的核酸构建体可以进一步编码尿嘧啶糖基化酶抑制剂(UGI)(例如,尿嘧啶-DNA糖基化酶抑制剂)多肽/结构域。因此,在一些实施方案中,编码CRISPR-Cas效应蛋白和胞嘧啶脱氨酶结构域的核酸构建体(例如,编码包含与胞嘧啶脱氨酶结构域融合的CRISPR-Cas效应蛋白结构域的融合蛋白,和/或与肽标签或能够结合肽标签的亲和多肽融合的CRISPR-Cas效应蛋白结构域和/或与肽标签或能够结合肽标签的亲和多肽融合的脱氨酶蛋白结构域)可以进一步编码尿嘧啶-DNA糖基化酶抑制剂(UGI),任选地其中UGI可以被密码子优化以用于在植物中表达。在一些实施方案中,本发明提供了包含CRISPR-Cas效应多肽、脱氨酶结构域和UGI的融合蛋白和/或一种或多种编码它们的多核苷酸,任选地其中所述一种或多种多核苷酸可以被密码子优化以用于在植物中表达。在一些实施方案中,本发明提供了融合蛋白,其中CRISPR-Cas效应多肽、脱氨酶结构域和UGI可以与如本文所述的肽标签和亲和多肽的任何组合融合,从而将脱氨酶结构域和UGI募集到CRISPR-Cas效应多肽和靶核酸。在一些实施方案中,引导核酸可以与募集RNA基序连接,并且脱氨酶结构域和/或UGI中的一个或多个可以与能够与募集RNA基序相互作用的亲和多肽融合,从而将脱氨酶结构域和UGI募集到靶核酸。
可用于本发明的“尿嘧啶糖基化酶抑制剂”可以是能够抑制尿嘧啶-DNA糖基化酶碱基切除修复酶的任何蛋白质。在一些实施方案中,UGI结构域包含野生型UGI或其片段。在一些实施方案中,可用于本发明的UGI结构域可以与天然存在的UGI结构域的氨基酸序列约70%至约100%相同(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%相同以及其中的任何范围或值)。在一些实施方案中,UGI结构域可包含SEQ ID NO:41的氨基酸序列或与SEQ ID NO:41的氨基酸序列具有约70%至约99.5%同一性的多肽(例如,与SEQ ID NO:41的氨基酸序列具有至少80%,至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的序列同一性)。例如,在一些实施方案中,UGI结构域可以包含SEQ ID NO:41的氨基酸序列的片段,其与SEQ ID NO:41的氨基酸序列的连续核苷酸的一部分(例如,10、15、20、25、30、35、40、45、50、55、60、65、70、75、80个连续核苷酸;例如,约10、15、20、25、30、35、40、45至约50、55、60、65、70、75、80个连续核苷酸)100%相同。在一些实施方案中,UGI结构域可以是与已知UGI具有约70%至约99.5%序列同一性(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%序列同一性,以及其中的任何范围或值)的已知UGI(例如,SEQ ID NO:41)的变体。在一些实施方案中,编码UGI的多核苷酸可以针对在植物(例如植物)中表达进行密码子优化,并且密码子优化的多肽可以与参考多核苷酸具有约70%至约99.5%的同一性。
可用于本发明的腺嘌呤脱氨酶(或腺苷脱氨酶)可以是来自任何生物体的任何已知的或以后鉴定的腺嘌呤脱氨酶(参见例如美国专利号10,113,163,其关于其腺嘌呤脱氨酶的公开内容通过引用并入本文)。腺嘌呤脱氨酶可以催化腺嘌呤或腺苷的水解脱氨。在一些实施方案中,腺嘌呤脱氨酶可分别催化腺苷或脱氧腺苷水解脱氨为肌苷或脱氧肌苷。在一些实施方案中,腺苷脱氨酶可以催化DNA中腺嘌呤或腺苷的水解脱氨。在一些实施方案中,由本发明的核酸构建体编码的腺嘌呤脱氨酶可以在靶核酸的有义链(例如“+”;模板)中产生A→G转换或在靶核酸的反义链(例如,“-”,互补的)中产生T→C转换。
在一些实施方案中,腺苷脱氨酶可以是天然存在的腺嘌呤脱氨酶的变体。因此,在一些实施方案中,腺苷脱氨酶可以与野生型腺嘌呤脱氨酶具有约70%至100%的同一性(例如,与天然存在的腺嘌呤脱氨酶约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同,以及其中的任何范围或值)。在一些实施方案中,一种或多种脱氨酶在自然界中不存在并且可以被称为工程化的、突变的或进化的腺苷脱氨酶。因此,例如,工程化的、突变的或进化的腺嘌呤脱氨酶多肽或腺嘌呤脱氨酶结构域可以与天然存在的腺嘌呤脱氨酶多肽/结构域具有约70%至99.9%的同一性(例如,与天然存在的腺嘌呤脱氨酶多肽或腺嘌呤脱氨酶结构域约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%相同,以及其中的任何范围或值)。在一些实施方案中,腺苷脱氨酶可以来自细菌(例如,大肠杆菌、金黄色葡萄球菌、流感嗜血杆菌、新月柄杆菌等)。在一些实施方案中,编码腺嘌呤脱氨酶多肽/结构域的多核苷酸可以进行密码子优化以用于在植物中表达。
在一些实施方案中,腺嘌呤脱氨酶结构域可以是野生型tRNA特异性腺苷脱氨酶结构域,例如tRNA特异性腺苷脱氨酶(TadA)和/或突变/进化的腺苷脱氨酶结构域,例如突变/进化的tRNA特异性腺苷脱氨酶结构域(TadA*)。在一些实施方案中,TadA结构域可以来自大肠杆菌。在一些实施方案中,TadA可以被修饰,例如截短,相对于全长TadA缺失一个或多个N端和/或C端氨基酸(例如,相对于全长TadA,可能缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个N端和/或C端氨基酸残基。在一些实施方案中,TadA多肽或TadA结构域不包含N-末端甲硫氨酸。在一些实施方案中,野生型大肠杆菌TadA包含SEQ ID NO:30的氨基酸序列。在一些实施方案中,突变/进化的大肠杆菌TadA*包含SEQ ID NO:31-40(例如,SEQ ID NO:31、32、33、34、35、36、37、38、39或40)的氨基酸序列。在一些实施方案中,编码TadA/TadA*的多核苷酸可以进行密码子优化以用于在植物中表达。
胞嘧啶脱氨酶催化胞嘧啶脱氨并产生胸苷(通过尿嘧啶中间体),导致基因组中互补链中的C到T转换或G到A转换。因此,在一些实施方案中,由本发明的多核苷酸编码的胞嘧啶脱氨酶在靶核酸的有义链(例如“+”;模板)中产生C→T转换或在靶核酸的反义链(例如、"-"、互补的)中产生G→A转换。
在一些实施方案中,由本发明的核酸构建体编码的腺嘌呤脱氨酶在靶核酸的有义链(例如“+”;模板)中产生A→G转换或在靶核酸的反义链(例如、"-"、互补的)中产生T→C转换。
本发明的编码包含序列特异性核酸结合蛋白和胞嘧啶脱氨酶多肽的碱基编辑器的核酸构建体,以及编码其的核酸构建体/表达盒/载体,可以与引导核酸组合使用以用于修饰靶标核酸包括但不限于在靶核酸(包括但不限于质粒序列)中产生C→T或G→A突变;在编码序列中产生C→T或G→A突变以改变氨基酸同一性;在编码序列中产生C→T或G→A突变以产生终止密码子;在编码序列中产生C→T或G→A突变以破坏起始密码子;在基因组DNA中产生点突变以产生突变的GRF转录因子基因。
本发明的编码包含序列特异性核酸结合蛋白和腺嘌呤脱氨酶多肽的碱基编辑器的核酸构建体,以及编码其的表达盒和/或载体,可以与引导核酸组合使用以用于修饰靶核酸,包括但不限于在靶核酸(包括但不限于质粒序列)中产生A→G或T→C突变;在编码序列中产生A→G或T→C突变以改变氨基酸同一性;在编码序列中产生A→G或T→C突变以产生终止密码子;在编码序列中产生A→G或T→C突变以破坏起始密码子;在基因组DNA中产生点突变以破坏功能;和/或在基因组DNA中产生点突变以破坏剪接点。
包含CRISPR-Cas效应蛋白或其融合蛋白的本发明的核酸构建体可以与引导RNA(gRNA、CRISPR阵列、CRISPR RNA、crRNA)组合使用,该引导RNA被设计成与编码的CRISPR-Cas效应蛋白或结构域一起发挥作用以修饰靶核酸。可用于本发明的引导核酸包含至少一个间隔序列和至少一个重复序列。引导核酸能够与由本发明的核酸构建体编码和表达的CRISPR-Cas核酸酶结构域形成复合物,并且间隔序列能够与靶核酸杂交,从而引导复合物(例如,CRISPR-Cas效应融合蛋白(例如,与脱氨酶结构域融合的CRISPR-Cas效应结构域和/或与肽标签或亲和多肽融合以募集脱氨酶结构域和任选地UGI的CRISPR-Cas效应结构域)至靶核酸,其中靶核酸可以被脱氨酶结构域修饰(例如,切割或编辑)或调节(例如,调节转录)。
例如,编码与胞嘧啶脱氨酶结构域(例如,融合蛋白)连接的Cas9结构域的核酸构建体可以与Cas9引导核酸组合使用以修饰靶核酸,其中融合蛋白的胞嘧啶脱氨酶结构域使靶核酸中的胞嘧啶碱基脱氨基,从而编辑靶核酸。在另一个实例中,编码与腺嘌呤脱氨酶结构域(例如,融合蛋白)连接的Cas9结构域的核酸构建体可与Cas9引导核酸组合使用以修饰靶核酸,其中融合蛋白的腺嘌呤脱氨酶结构域使靶核酸中的腺苷碱基脱氨基,从而编辑靶核酸。
同样,编码与胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域连接的Cas12a结构域(或其他选择的CRISPR-Cas核酸酶,例如C2c1、C2c3、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Cas1、Cas1B、Cas2、Cas3、Cas3'、Cas3"、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csnl和Csx12)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG)和/或Csf5)(例如,融合蛋白)可与Cas12a引导核酸(或其他选择的CRISPR-Cas核酸酶的引导核酸)组合使用以修饰靶核酸,其中融合蛋白的胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域使靶核酸中的胞嘧啶碱基脱氨基,从而编辑靶核酸。
本文所用的“引导核酸”、“引导RNA”、“gRNA”、“CRISPR RNA/DNA”、“crRNA”或“crDNA”是指包含至少一个与靶DNA(例如,前间隔区)互补(和杂交)的间隔序列和至少一个重复序列(例如,V型Cas12a CRISPR-Cas系统的重复序列,或其片段或部分;II型Cas9CRISPR-Cas系统的重复序列,或其片段;V型C2c1 CRISPR Cas系统的重复序列,或其片段;例如C2c3、Cas12a(也称为Cpf1)、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3'、Cas3"、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csnl和Csx12)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG)和/或Csf5的CRISPR-Cas系统的重复序列,或其片段)的核酸,其中重复序列可以连接到间隔序列的5'端和/或3'端。本发明的gRNA的设计可以基于I型、II型、III型、IV型、V型或VI型CRISPR-Cas系统。
在一些实施方案中,Cas12a gRNA可以从5'到3'包含重复序列(全长或其部分(“柄”);例如,假结样结构)和间隔序列。
在一些实施方案中,引导核酸可以包含多于一个重复序列-间隔序列(例如,2、3、4、5、6、7、8、9、10或更多个重复序列-间隔序列)(例如,重复序列-间隔序列-重复序列,例如,重复序列-间隔序列-重复序列-间隔序列-重复序列-间隔序列-重复序列-间隔序列-重复序列-间隔序列等)。本发明的引导核酸是合成的、人造的并且在自然界中不存在。gRNA可以很长,并且可以用作适配体(如在MS2募集策略中)或拉开(hanging off)间隔区上的其他RNA结构。
如本文所用,“重复序列”是指例如野生型CRISPR Cas基因座(例如,Cas9基因座、Cas12a基因座、C2c1基因座等)的任何重复序列或与本发明的核酸构建体编码的CRISPR-Cas效应蛋白一起起作用的合成crRNA。可用于本发明的重复序列可以是CRISPR-Cas基因座的任何已知或以后鉴定的重复序列(例如,I型、II型、III型、IV型、V型或VI型),或者它可以是设计用于I、II、III、IV、V或VI型CRISPR-Cas系统的合成的重复序列。重复序列可以包含发夹结构和/或茎环结构。在一些实施方案中,重复序列可以在其5'端形成假结样结构(即,“柄”)。因此,在一些实施方案中,重复序列可以与来自野生型I型、CRISPR-Cas基因座、II型CRISPR-Cas基因座、III型CRISPR-Cas基因座、IV型CRISPR-Cas基因座、V型CRISPR-Cas基因座和/或VI型CRISPR-Cas基因座的重复序列相同或基本相同。来自野生型CRISPR-Cas基因座的重复序列可以通过已建立的算法来确定,例如使用通过CRISPRdb提供的CRISPRfinder(参见Grissa等人,Nucleic Acids Res.35(Web Server issue):W52-7)。在一些实施方案中,重复序列或其部分在其3'末端连接到间隔序列的5'末端,从而形成重复间隔序列(例如,引导核酸、引导RNA/DNA、crRNA、crDNA)。
在一些实施方案中,重复序列包含、基本上由或由至少10个核苷酸组成,这取决于特定的重复序列以及包含重复序列的引导核酸是加工的还是未加工的(例如,约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50至100个或更多个核苷酸,或其中的任何范围或值)。在一些实施方案中,重复序列包含约10至约20、约10至约30、约10至约45、约10至约50、约15至约30、约15至约40、约15至约45、约15至约50、约20至约30、约20至约40、约20至约50、约30至约40、约40至约80、约50至约100或更多个核苷酸、基本上由其组成或由其组成。
与间隔序列的5'末端连接的重复序列可以包含重复序列的一部分(例如,野生型重复序列的5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35个或更多个连续核苷酸)。在一些实施方案中,与间隔序列的5'末端连接的重复序列的一部分的长度可以是约5至约10个连续核苷酸(例如,约5、6、7、8、9、10个核苷酸)并且与野生型CRISPR Cas重复核苷酸序列的相同区域(例如,5'端)具有至少90%的序列同一性(例如,至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)。在一些实施方案中,重复序列的一部分可以在其5'端包含假结样结构(例如,“柄”)。
如本文所用,“间隔序列”是与靶核酸(例如,靶DNA)(例如,前间隔区)(例如,GRF转录因子基因的连续核苷酸的一部分,其中GRF转录因子基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:96-103中任一个的核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域)互补的核苷酸序列(例如,SEQ ID NO:111-113或SEQ ID NO:130-131)。间隔序列可以与靶核酸完全互补或基本上互补(例如,至少约70%互补(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)。在一些实施方案中,与靶核酸相比,间隔序列可以具有一个、两个、三个、四个或五个错配,这些错配可以是连续的或不连续的。在一些实施方案中,间隔序列可以与靶核酸具有70%的互补性。在其他实施方案中,间隔核苷酸序列可以与靶核酸具有80%的互补性。在其他实施方案中,间隔核苷酸序列可以与靶核酸(前间隔区)具有85%、90%、95%、96%、97%、98%、99%或99.5%的互补性等。在一些实施方案中,间隔序列与靶核酸100%互补。间隔序列可具有约15个核苷酸至约30个核苷酸(例如,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸或其中的任何范围或值)的长度。因此,在一些实施方案中,间隔序列可在长度为至少约15个核苷酸至约30个核苷酸的靶核酸(例如,前间隔区)的区域上具有完全互补性或基本互补性。在一些实施方案中,间隔区的长度为约20个核苷酸。在一些实施方案中,间隔区的长度为约21、22或23个核苷酸。
在一些实施方案中,引导核酸的间隔序列的5'区域可以与靶DNA相同,而间隔区的3'区域可以与靶DNA基本上互补(例如,对于V型CRISPR-Cas系统中的间隔区),或引导核酸的间隔序列的3'区域可以与靶DNA相同,而间隔区的5'区域可以与靶DNA基本上互补(例如,对于II型CRISPR-Cas系统中的间隔区),并且因此,间隔序列与靶DNA的总体互补性可能低于100%。因此,例如,在V型CRISPR-Cas系统的引导物中,例如20个核苷酸的间隔序列的5'区域(即种子区域)中的前1、2、3、4、5、6、7、8、9、10个核苷酸可以与靶DNA 100%互补,而间隔序列的3'区域中的剩余核苷酸与靶DNA基本上互补(例如,至少约70%互补)。在一些实施方案中,间隔序列的5'端的前1至8个核苷酸(例如,前1、2、3、4、5、6、7、8个核苷酸以及其中的任何范围)可以与靶DNA 100%互补,而间隔序列3'区中的剩余核苷酸与靶DNA基本上互补(例如,至少约50%互补(例如,50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多))。
作为另一个例子,在II型CRISPR-Cas系统的引导物中,例如20个核苷酸的间隔序列的3'区域(即种子区域)中的前1、2、3、4、5、6、7、8、9、10个核苷酸可以与靶DNA 100%互补,而间隔序列的5'区域中的剩余核苷酸与靶DNA基本上互补(例如,至少约70%互补)。在一些实施方案中,间隔序列的3'端的前1至10个核苷酸(例如,前1、2、3、4、5、6、7、8、9、10个核苷酸,以及其中的任何范围)可以与靶DNA 100%互补,而间隔序列的5'区域的剩余核苷酸与靶DNA基本上互补(例如,至少约50%互补(例如,至少约50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多或其中的任何范围或值))。
在一些实施方案中,间隔区的种子区可以是约8至约10个核苷酸的长度、约5至约6个核苷酸的长度或约6个核苷酸的长度。
如本文所用,“靶核酸”、“靶DNA”、“靶核苷酸序列”、“靶区域”或“基因组中的靶区域”是指植物基因组中与本发明的引导核酸中的间隔序列完全互补(100%互补)或基本互补(例如,至少70%互补(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多))的区域。可用于CRISPR-Cas系统的靶区域可以紧邻生物体基因组(例如植物基因组)中的PAM序列的3'(例如,V型CRISPR-Cas系统)或紧邻其5'(例如II型CRISPR-Cas系统)定位。靶区域可以选自紧邻PAM序列定位的至少15个连续核苷酸(例如,16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个核苷酸等)的任何区域。
“前间隔序列”是指靶双链DNA,并且特别是指与CRISPR重复序列-间隔序列(例如,引导核酸、CRISPR阵列、crRNA)完全或基本上互补(和杂交)的靶DNA部分(例如,或基因组中的靶区域)。
在V型CRISPR-Cas(例如,Cas12a)系统和II型CRISPR-Cas(Cas9)系统的情况下,前间隔序列的两侧是(例如,紧邻)前间隔区邻近基序(PAM)。对于IV型CRISPR-Cas系统,PAM位于非靶标链的5'端和靶标链的3'端(例如,见下文)。
在II型CRISPR-Cas(例如Cas9)系统的情况下,PAM紧邻靶区域的3'定位。I型CRISPR-Cas系统的PAM位于靶标链的5'。没有已知的用于III型CRISPR-Cas系统的PAM。Makarova等人描述了CRISPR系统的所有类别、类型和亚型的命名法(Nature ReviewsMicrobiology 13:722-736(2015))。R.Barrangou(Genome Biol.16:247(2015))描述了引导物结构和PAM。
典型的Cas12a PAM富含T。在一些实施方案中,典型的Cas12a PAM序列可以是5'-TTN、5'-TTTN或5'-TTTV。在一些实施方案中,典型的Cas9(例如,化脓性链球菌)PAM可以是5'-NGG-3'。在一些实施方案中,可以使用非典型PAM,但效率可能较低。
本领域技术人员可以通过已建立的实验和计算方法确定另外的PAM序列。因此,例如,实验方法包括靶向侧接所有可能的核苷酸序列的序列并识别不经历靶向的序列成员,例如通过靶质粒DNA的转化(Esvelt等人,2013.Nat.Methods 10:1116-1121;Jiang等人,2013.Nat.Biotechnol.31:233-239)。在一些方面,计算方法可以包括对天然间隔区进行BLAST搜索以鉴定噬菌体或质粒中的原始靶DNA序列,并比对这些序列以确定与靶序列相邻的保守序列(Briner和Barrangou.2014.Appl.Environ.Microbiol.80:994-1001;Mojica等人,2009.Microbiology 155:733-740)。
在一些实施方案中,本发明提供了包含本发明的核酸构建体(例如,本发明的编辑系统的一种或多种组分)的表达盒和/或载体。在一些实施方案中,可以提供包含本发明的核酸构建体和/或一种或多种引导核酸的表达盒和/或载体。在一些实施方案中,编码碱基编辑器(例如,包含CRISPR-Cas效应蛋白和脱氨酶结构域的构建体(例如,融合蛋白))的本发明的核酸构建体或用于碱基编辑的组分(例如,与肽标签或亲和多肽融合的CRISPR-Cas效应蛋白、与肽标签或亲和多肽融合的脱氨酶结构域和/或与肽标签或亲和多肽融合的UGI)可以包含在相同的表达盒或载体上或在与包含一种或多种引导核酸的表达盒或载体分开的表达盒或载体上。当编码碱基编辑器的核酸构建体或用于碱基编辑的组分包含在与包含引导核酸的表达盒或载体不同的表达盒或载体上时,靶核酸可以彼此以任何顺序接触(例如,与其一起提供)编码碱基编辑器或用于碱基编辑的组分的表达盒或载体,例如,在包含引导核酸的表达盒的表达盒之前、同时或之后提供(例如,与靶核酸接触)。
本发明的融合蛋白可以包含与如本领域已知的肽标签或与肽标签相互作用的亲和多肽融合的序列特异性核酸结合结构域(序列特异性DNA结合结构域)、CRISPR-Cas多肽和/或脱氨酶结构域,用于募集脱氨酶到靶核酸。募集方法还可以包括与RNA募集基序连接的引导核酸和与能够与RNA募集基序相互作用的亲和多肽融合的脱氨酶,从而将脱氨酶募集至靶核酸。可替代地,化学相互作用可用于将多肽(例如脱氨酶)募集到靶核酸。
可用于本发明的肽标签(例如表位)可以包括但不限于GCN4肽标签(例如Sun-Tag)、c-Myc亲和标签、HA亲和标签、His亲和标签、S亲和标签、甲硫氨酸-His亲和标签、RGD-His亲和标签、FLAG八肽、strep标签或strep标签II、V5标签和/或VSV-G表位。在一些实施方案中,肽标签还可以包括由SH2结构域识别的特定序列背景中的磷酸化酪氨酸、含有由14-3-3蛋白识别的磷酸丝氨酸的特征共有序列、由SH3结构域识别的富含脯氨酸的肽基序、PDZ蛋白相互作用结构域或PDZ信号序列和来自植物的AGO钩基序。肽标签公开于WO2018/136783和美国专利申请公开号2017/0219596中,这些文献关于它们对肽标签的公开内容通过引用并入。可以与多肽连接并且存在可以与另一多肽连接的相应亲和多肽的任何表位可用于本发明作为肽标签。肽标签可以包含或存在于肽标签的一个拷贝或2个或更多个拷贝中(例如,多聚化肽标签或多聚化表位)(例如,约2、3、4、5、6、7、8、9)、10、11、12、13、14、15、16、17、18、9、20、21、22、23、24或25个或更多个肽标签)。当多聚化时,肽标签可以直接彼此融合,或者它们可以通过一个或多个氨基酸(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个氨基酸,任选约3至约10、约4至约10、约5至约10、约5至约15、或约5至约20个氨基酸等,以及其中的任何值或范围)彼此连接。在一些实施方案中,与肽标签相互作用/结合的亲和多肽可以是抗体。在一些实施方案中,抗体可以是scFv抗体。在一些实施方案中,与肽标签结合的亲和多肽可以是合成的(例如,进化用于亲和相互作用),包括,但不限于,affibody、anticalin、monobody和/或DARPin(参见,例如,Sha等人,Protein Sci.26(5):910-924(2017));Gilbreth(Curr Opin Struc Biol 22(4):413-420(2013)),美国专利号9,982,053,其各自关于affibody、anticalins、monobody和/或DARPin的教导内容通过引用整体并入本文。示例性肽标签序列及其亲和多肽包括但不限于SEQ IDNO:45-47的氨基酸序列。
在一些实施方案中,引导核酸可与RNA募集基序连接,待募集的多肽(例如脱氨酶)可与结合RNA募集基序的亲和多肽融合,其中引导物与靶核酸结合和RNA募集基序与亲和多肽结合,从而将多肽募集到引导物并使靶核酸与多肽(例如脱氨酶)接触。在一些实施方案中,可以将两种或更多种多肽募集到引导核酸,从而使靶核酸与两种或更多种多肽(例如,脱氨酶)接触。示例性RNA募集基序及其亲和多肽包括但不限于SEQ ID NO:48-58的序列。
在一些实施方案中,与亲和多肽融合的多肽可以是逆转录酶并且引导核酸可以是与RNA募集基序连接的延伸的引导核酸。在一些实施方案中,RNA募集基序可以位于延伸的引导核酸的延伸部分的3'末端(例如,5'-3',重复序列-间隔区-延伸部分(RT模板-引物结合位点)-RNA募集基序)。在一些实施方案中,RNA募集基序可以嵌入延伸部分中。
在本发明的一些实施方案中,延伸的引导RNA和/或引导RNA可以与一个或两个或更多个RNA募集基序(例如,1、2、3、4、5、6、7、8、9、10个或更多个基序;例如,至少10至约25个基序)连接,任选地其中两个或更多个RNA募集基序可以是相同的RNA募集基序或不同的RNA募集基序。在一些实施方案中,RNA募集基序和相应的亲和多肽可以包括但不限于端粒酶Ku结合基序(例如,Ku结合发夹)和相应的亲和多肽Ku(例如,Ku异二聚体),端粒酶Sm7结合基序和相应的亲和多肽Sm7、MS2噬菌体操纵子茎环和相应的亲和多肽MS2外壳蛋白(MCP)、PP7噬菌体操纵子茎环和相应的亲和多肽PP7外壳蛋白(PCP)、SfMu噬菌体Com茎环和相应的亲和多肽Com RNA结合蛋白、PUF结合位点(PBS)和亲和多肽Pumilio/fem-3mRNA结合因子(PUF),和/或合成的RNA适配体和适配体配体作为相应的亲和多肽。在一些实施方案中,RNA募集基序和相应的亲和多肽可以是MS2噬菌体操纵子茎环和亲和多肽MS2外壳蛋白(MCP)。在一些实施方案中,RNA募集基序和相应的亲和多肽可以是PUF结合位点(PBS)和亲和多肽Pumilio/fem-3m RNA结合因子(PUF)。
在一些实施方案中,用于募集多肽和核酸的组分可以是通过化学相互作用起作用的那些组分,其可以包括但不限于雷帕霉素诱导的FRB-FKBP二聚化;生物素-链霉亲和素;SNAP标签;Halo标签;CLIP标签;化合物诱导的DmrA-DmrC异二聚体;双功能配体(例如,两种蛋白质结合化学物质一起的融合体;例如二氢叶酸还原酶(DHFR)。
在一些实施方案中,经优化以用于在植物中表达的本发明的核酸构建体、表达盒或载体可以与包含相同多核苷酸但尚未针对在植物中的表达进行密码子优化的核酸构建体、表达盒或载体约70%至100%相同(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)。
本文还提供了包含本发明的一种或多种多核苷酸、引导核酸、核酸构建体、表达盒或载体的细胞。
本发明的核酸构建体(例如,包含序列特异性核酸结合结构域、CRISPR-Cas效应结构域、脱氨酶结构域、逆转录酶(RT)、RT模板和/或引导核酸等的构建体)和包含它们的表达盒/载体可以用作本发明的编辑系统用于修饰靶核酸和/或其表达。
对大豆锈菌或SCN具有增加的抗性的植物(例如,大豆植物)可以与不包含突变的内源GRF转录因子基因的植物或其部分(例如,不包含突变的同基因野生型植物)相比,具有约5%至约100%(例如,约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%其中的任何范围或值)的抗性增加。对大豆锈菌或SCN具有增加的抗性的植物还可以被描述为与不包含突变的内源GRF转录因子基因的植物或其部分相比表现出约5%至约100%的对SCN或大豆锈菌的敏感性降低(例如,对大豆胞囊线虫的敏感性降低、对豆薯层锈菌和山马蝗层锈菌的敏感性降低)。在一些实施方案中,对大豆锈菌的抗性和易感性可以通过褪绿或坏死区域(例如病变)的量(发生率)或严重程度(数量和大小)或落叶量或通过形成的脓疱的数量和他们的大小来测量。
作为一个例子,大豆锈病的水平可以使用叶子衰老测定来测量。对于这样的测定,从完全展开的V3三叶的叶中获取叶打孔物。将叶打孔物漂浮在例如12孔板中的1/2MS液体培养基上,并将板用箔包裹并在室温下孵育约7天。孵化后,对叶打孔物进行成像并进行RGB像素量化。比较编辑线和对照线之间每孔的平均像素比例,以确定黑暗中叶绿素降解(又称叶子衰老)是否已减慢。在其中GRF转录因子基因被修饰的植物中不存在叶绿素降解。本发明的方法产生的植物具有如通过该测定所测量的作为包含野生型GRF转录因子基因的植物和包含修饰的GRF转录因子基因的植物之间的中间值的叶绿素降解水平,从而产生具有增加的对大豆锈菌的抗性的植物。
任何大豆植物或植物部分的靶核酸可以使用本发明的多肽、多核苷酸、核糖核蛋白(RNP)、核酸构建体、表达盒和/或载体修饰(例如,突变,例如碱基编辑、切割、切口等)。可如本文所述修饰的大豆植物和/或植物部分可以是任何品种或栽培品种的大豆植物和/或植物部分。
如本文所用,术语“植物部分”包括但不限于生殖组织(例如,花瓣、萼片、雄蕊、雌蕊、花托、花药、花粉、花、果实、花蕾、胚珠、种子、胚胎、坚果、仁、穗、穗轴和壳);营养组织(例如,叶柄、茎、根、根毛、根尖、髓、胚芽鞘、茎、芽、枝、树皮、顶端分生组织、腋芽、子叶、下胚轴和叶);维管组织(例如韧皮部和木质部);特化细胞,例如表皮细胞、薄壁细胞、胆囊细胞、厚壁细胞、气孔、保卫细胞、角质层、叶肉细胞;愈伤组织;和插条。术语“植物部分”还包括植物细胞,包括在植物和/或植物部分、植物原生质体、植物组织、植物器官、植物细胞组织培养物、植物愈伤组织、植物团块等中完整的植物细胞。如本文所用,“芽”是指地上部分,包括叶和茎。如本文所用,术语“组织培养物”包括组织、细胞、原生质体和愈伤组织的培养物。
如本文所用,“植物细胞”是指植物的结构和生理单位,其通常包括细胞壁,但也包括原生质体。本发明的植物细胞可以是分离的单细胞的形式,或者可以是培养的细胞,或者可以是更高组织单元例如植物组织(包括愈伤组织)或植物器官的一部分。在一些实施方案中,植物细胞可以是藻类细胞。“原生质体”是没有细胞壁或仅具有部分细胞壁的分离的植物细胞。因此,在本发明的一些实施方案中,包含本发明的核酸分子和/或核苷酸序列的转基因细胞是任何植物或植物部分的细胞,包括但不限于根细胞、叶细胞、组织培养细胞、种子细胞、花细胞、果实细胞、花粉细胞等。在本发明的一些方面,植物部分可以是植物种质。在一些方面,植物细胞可以是不再生成植物的非繁殖植物细胞。
“植物细胞培养物”是指植物单元(例如原生质体、细胞培养细胞、植物组织中的细胞、花粉、花粉管、胚珠、胚囊、合子和处于不同发育阶段的胚胎)的培养物。
如本文所用,“植物器官”是植物的独特且明显的结构化和分化的部分,例如根、茎、叶、花蕾或胚。
如本文所用,“植物组织”是指组织成结构和功能单元的一组植物细胞。包括植物中或培养物中的任何植物组织。该术语包括但不限于整株植物、植物器官、植物种子、组织培养物和组织成结构和/或功能单元的任何植物细胞群。该术语与以上列出的或本定义所包含的任何特定类型的植物组织结合或不结合使用时,并不旨在排除任何其他类型的植物组织。
在本发明的一些实施方案中,提供了转基因组织培养物或转基因植物细胞培养物,其中转基因组织或细胞培养物包含本发明的核酸分子/核苷酸序列。在一些实施方案中,可以通过使转基因植物与非转基因植物育种并在后代中选择包含所需基因编辑而不是用于产生该编辑的转基因的植物,可以从由转基因组织或细胞发育而来的植物中消除转基因。
因此,根据本发明要优先处理的大豆植物或大豆栽培品种包括通过遗传修饰接受遗传物质的所有大豆植物,所述遗传物质赋予这些大豆植物特别有利的有用特性(“性状”)。此类特性的实例是更好的生长、活力、胁迫耐受性、站立性、抗倒伏性、养分吸收、植物营养和/或产量,特别是改善的生长、对高温或低温的增加的耐受性、对干旱或水分水平或土壤盐分的增加的耐受性、增强的开花性能、更容易收获、加速成熟、更高产量、更高质量和/或更高营养价值的收获产品、更好的储存寿命和/或收获产品的可加工性。
这样的特性的进一步和特别强调的例子是针对动物和微生物害虫(例如针对昆虫、蛛形纲动物、线虫、螨虫、蛞蝓和蜗牛,例如针对植物中形成的毒素)的增加的抗性。在编码赋予针对此类动物和微生物害虫特别是昆虫的耐受性特性的蛋白质的DNA序列中,将特别提及来自苏云金芽孢杆菌的编码文献中广泛描述且为本领域技术人员熟知的Bt蛋白质的遗传物质。还将提及从细菌如发光杆菌(Photorhabdus)中提取的蛋白质(WO97/17432和WO98/08932)。具体而言,将提及Bt Cry或VIP蛋白,其包括CrylA、CryIAb、CryIAc、CryIIA、CryIIIA、CryIIIB2、Cry9c、Cry2Ab、Cry3Bb和CryIF蛋白或其毒性片段,以及它们的杂合体或组合,尤其是CrylF蛋白或衍生自CrylF蛋白的杂合体(例如杂合CrylA-CrylF蛋白或其毒性片段)、CrylA型蛋白或其毒性片段,优选CrylAc蛋白或衍生自CrylAc蛋白的杂合体(例如杂合CrylAb-CrylAc蛋白)或CrylAb或Bt2蛋白或其毒性片段、Cry2Ae、Cry2Af或Cry2Ag蛋白或其毒性片段、CrylA.105蛋白或其毒性片段、VIP3Aa19蛋白、VIP3Aa20蛋白、在COT202或COT203棉花事件中产生的VIP3A蛋白、如Estruch等人,(1996),Proc Natl Acad Sci USA.28;93(11):5389-94所述的VIP3Aa蛋白或其毒性片段、如WO2001/47952中所述的Cry蛋白、来自异短杆菌属(Xenorhabdus)(如WO98/50427中所述)、沙雷氏菌属(Serratia)(特别是来自嗜虫沙雷氏菌(S.entomophila))或发光杆菌属物种菌株的杀虫蛋白,例如来自发光杆菌属的Tc-蛋白质,如WO98/08932中所述。本文还包括了这些蛋白质中的任何一种的与上述任何序列在一些氨基酸(1-10,优选1-5)中不同的任何变体或突变体,特别是它们的毒性片段的序列,或融合至转运肽,例如质体转运肽或另一种蛋白质或肽。
这种性质的另一个和特别强调的例子是赋予对一种或多种除草剂例如咪唑啉酮、磺酰脲、草甘膦或草丁膦的耐受性。在编码赋予转化的植物细胞和植物对某些除草剂的耐受性特性的蛋白质(即感兴趣的多核苷酸)的DNA序列中,将特别提及WO2009/152359中描述的bar或PAT基因或天蓝色链霉菌基因,其赋予对草铵膦除草剂的耐受性,编码合适的EPSPS(5-烯醇丙酮酸莽草酸-3-磷酸-合酶)的基因,其赋予对以EPSPS作为靶标的除草剂(尤其是诸如草甘膦及其盐的除草剂)的耐受性,编码草甘膦-n-乙酰转移酶的基因,或编码草甘膦氧化还原酶的基因。其他合适的除草剂耐受性状包括至少一种ALS(乙酰乳酸合酶)抑制剂(例如WO2007/024782)、突变的拟南芥ALS/AHAS基因(例如美国专利6,855,533)、编码赋予对2,4-D(2,4-二氯苯氧乙酸)的耐受性的2,4-D-单加氧酶的基因,和编码赋予对麦草畏(3,6-二氯-2-甲氧基苯甲酸)的耐受性的麦草畏单加氧酶的基因。
此类特性的进一步实例包括但不限于由于例如系统性获得性抗性(SAR)、系统素、植物抗毒素、诱导子以及抗性基因和相应表达的蛋白质和毒素而对植物病原真菌、细菌和/或病毒的增加的抗性。
可以根据本发明处理的转基因植物或植物栽培品种中特别有用的转基因事件包括事件531/PV-GHBK04(棉花,昆虫控制,描述于WO2002/040677),事件1143-14A(棉花,昆虫控制,未保藏,描述于WO2006/128569);事件1143-51B(棉花,昆虫控制,未保藏,描述于WO2006/128570);事件1445(棉花、除草剂耐受性、未保藏,描述于US-A 2002-120964或WO2002/034946);事件17053(水稻,除草剂耐受性,保藏为PTA-9843,描述于WO2010/117737);事件17314(水稻,除草剂耐受性,保藏为PTA-9844,描述于WO2010/117735);事件281-24-236(棉花,昆虫控制-除草剂耐受性,保藏为PTA-6233,描述于WO2005/103266或US-A 2005-216969);事件3006-210-23(棉花,昆虫控制-除草剂耐受性,保藏为PTA-6233,描述于US-A 2007-143876或WO2005/103266);事件3272(玉米,质量性状,保藏为PTA-9972,描述于WO2006/098952或US-A 2006-230473);事件33391(小麦,除草剂耐受性,保藏为PTA-2347,描述于WO2002/027004),事件40416(玉米,昆虫控制-除草剂耐受性,保藏为ATCCPTA-11508,描述于WO11/075593);事件43A47(玉米,昆虫控制-除草剂耐受性,保藏为ATCCPTA-11509,描述于WO2011/075595);事件5307(玉米,昆虫控制,保藏为ATCC PTA-9561,描述于WO2010/077816);事件ASR-368(常绿草,除草剂耐受性,保藏为ATCC PTA-4816,描述于US-A 2006-162007或WO2004/053062);事件B16(玉米,除草剂耐受性,未保藏,描述于US-A2003-126634);事件BPS-CV127-9(大豆,除草剂耐受性,保藏为NCIMB No.41603,描述于WO2010/080829);事件BLR1(油菜,雄性不育的恢复,保藏为NCIMB 41193,描述于WO2005/074671),事件CE43-67B(棉花,昆虫控制,保藏为DSM ACC2724,描述于US-A 2009-217423或WO2006/128573);事件CE44-69D(棉花,昆虫控制,未保藏,描述于US-A 2010-0024077);事件CE44-69D(棉花,昆虫控制,未保藏,描述于WO2006/128571);事件CE46-02A(棉花,昆虫控制,未保藏,描述于WO2006/128572);事件COT102(棉花,昆虫控制,未保藏,描述于US-A2006-130175或WO2004/039986);事件COT202(棉花,昆虫控制,未保藏,描述于US-A 2007-067868或WO2005/054479);事件COT203(棉花,昆虫控制,未保藏,描述于WO2005/054480);事件DAS21606-3/1606(大豆,除草剂耐受性,保藏为PTA-11028,描述于WO2012/033794),事件DAS40278(玉米,除草剂耐受性,保藏为ATCC PTA-10244,描述于WO2011/022469);事件DAS-44406-6/pDAB8264.44.06.l(大豆,除草剂耐受性,保藏为PTA-11336,描述于WO2012/075426),事件DAS-14536-7/pDAB8291.45.36.2(大豆,除草剂耐受性,保藏为PTA-11335,描述于WO2012/075429),事件DAS-59122-7(玉米,昆虫控制-除草剂耐受性,保藏为ATCC PTA11384,描述于US-A2006-070139);事件DAS-59132(玉米,昆虫控制-除草剂耐受性,未保藏,描述于WO2009/100188);事件DAS68416(大豆,除草剂耐受性,保藏为ATCC PTA-10442,描述于WO2011/066384或WO2011/066360);事件DP-098140-6(玉米,除草剂耐受性,保藏为ATCCPTA-8296,描述于US-A 2009-137395或WO08/112019);事件DP-305423-1(大豆,质量性状,未保藏,描述于US-A 2008-312082或WO2008/054747);事件DP-32138-1(玉米,杂交系统,保藏为ATCC PTA-9158,描述于US-A 2009-0210970或WO2009/103049);事件DP-356043-5(大豆,除草剂耐受性,保藏为ATCC PTA-8287,描述于US-A 2010-0184079或WO2008/002872);事件EE-I(茄子,昆虫控制,未保藏,描述于WO07/091277);事件Fil17(玉米,除草剂耐受性,保藏为ATCC209031,描述于US-A 2006-059581或WO98/044140);事件FG72(大豆,除草剂耐受性,保藏为PTA-11041,描述于WO2011/063413),事件GA21(玉米,除草剂耐受性,保藏为ATCC209033,描述于US-A 2005-086719或WO98/044140);事件GG25(玉米,除草剂耐受性,保藏为ATCC209032,描述于US-A2005-188434或WO98/044140);事件GHB119(棉花,昆虫控制-除草剂耐受性,保藏为ATCC PTA-8398,描述于WO2008/151780);事件GHB614(棉花,除草剂耐受性,保藏为ATCC PTA-6878,描述于US-A2010-050282或W02007/017186);事件GJ11(玉米,除草剂耐受性,保藏为ATCC209030,描述于US-A 2005-188434或WO98/044140);事件GMRZ13(甜菜,病毒抗性,保藏为NCIMB-41601,描述于WO2010/076212);事件H7-1(甜菜,除草剂耐受性,保藏为NCIMB41158或NCIMB41159,描述于US-A 2004-172669或WO2004/074492);事件JOPLINl(小麦,抗病性,未保藏,描述于US-A2008-064032);事件LL27(大豆,除草剂耐受性,保藏为NCIMB41658,描述于WO2006/108674或US-A 2008-320616);事件LL55(大豆,除草剂耐受性,保藏为NCIMB41660,描述于WO2006/108675或US-A2008-196127);事件LLcotton25(棉花,除草剂耐受性,保藏为ATCC PTA-3343,描述于WO2003/013224或USA2003-097687);事件LLRICE06(水稻,除草剂耐受性,保藏为ATCC203353,描述于US6,468,747或WO2000/026345);事件LLRice62(水稻,除草剂耐受性,保藏为ATCC203352,描述于WO2000/026345),事件LLRICE601(水稻,除草剂耐受性,保藏为ATCC PTA-2600,描述于US-A 2008-2289060或WO2000/026356);事件LY038(玉米,质量性状,保藏为ATCC PTA-5623,描述于US-A 2007-028322或WO2005/061720);事件MIR162(玉米,昆虫控制,保藏为PTA-8166,描述于US-A 2009-300784或WO2007/142840);事件MIR604(玉米,昆虫控制,未保藏,描述于US-A 2008-167456或WO2005/103301);事件MON15985(棉花,昆虫控制,保藏为ATCC PTA-2516,描述于US-A 2004-250317或WO2002/100163);事件MON810(玉米,昆虫控制,未保藏,描述于US-A 2002-102582);事件MON863(玉米,昆虫控制,以ATCC PTA-2605保藏,描述于WO2004/011601或US-A2006-095986);事件MON87427(玉米,授粉对照,保藏为ATCC PTA-7899,描述于WO2011/062904);事件MON87460(玉米,胁迫耐受性,保藏为ATCCPTA-8910,描述于WO2009/111263或US-A2011-0138504);事件MON87701(大豆,昆虫控制,保藏为ATCC PTA-8194,描述于US-A 2009-130071或WO2009/064652);事件MON87705(大豆,质量性状-除草剂耐受性,保藏为ATCC PTA-9241,描述于US-A 2010-0080887或WO2010/037016);事件MON87708(大豆,除草剂耐受性,保藏为ATCC PTA-9670,描述于WO2011/034704);事件MON87712(大豆,产量,保藏为PTA-10296,描述于WO2012/051199),事件MON87754(大豆,质量性状,保藏为ATCC PTA-9385,描述于WO2010/024976);事件MON87769(大豆,质量性状,保藏为ATCC PTA-8911,描述于US-A 2011-0067141或WO2009/102873);事件MON88017(玉米,昆虫控制-除草剂耐受性,保藏为ATCC PTA-5582,描述于US-A 2008-028482或WO2005/059103);事件MON88913(棉花,除草剂耐受性,保藏为ATCC PTA-4854,描述于WO2004/072235或US-A 2006-059590);事件MON88302(油菜,除草剂耐受性,保藏为PTA-10955,描述于WO2011/153186),事件MON88701(棉花,除草剂耐受性,保藏为PTA-11754,描述于WO2012/134808),事件MON89034(玉米,昆虫控制,保藏为ATCC PTA-7455描述于WO07/140256或US-A2008-260932);事件MON89788(大豆,除草剂耐受性,保藏为ATCCPTA-6708,描述于US-A 2006-282915或WO2006/130436);事件MS11(油菜,授粉控制-除草剂耐受性,保藏为ATCC PTA-850或PTA-2485,描述于WO2001/031042);事件MS8(油菜,授粉控制-除草剂耐受性,保藏为ATCC PTA-730,描述于WO2001/041558或US-A2003-188347);事件NK603(玉米,除草剂耐受性,保藏为ATCC PTA-2478,描述于US-A 2007-292854);事件PE-7(水稻,昆虫控制,未保藏,描述于WO2008/114282);事件RF3(油菜,授粉控制-除草剂耐受性,保藏为ATCC PTA-730,描述于WO2001/041558或US-A2003-188347);事件RT73(油菜,除草剂耐受性,未保藏,描述于WO2002/036831或US-A 2008-070260);事件SYHT0H2/SYN-000H2-5(大豆,除草剂耐受性,保藏为PTA-11226,描述于WO2012/082548),事件T227-1(甜菜,除草剂耐受性,未保藏,描述于WO2002/44407或US-A 2009-265817);事件T25(玉米、除草剂耐受性、未保藏,描述于US-A 2001-029014或WO2001/051654);事件T304-40(棉花,昆虫控制-除草剂耐受性,保藏为ATCC PTA-8171,描述于US-A 2010-077501或WO2008/122406);事件T342-142(棉花,昆虫控制,未保藏,描述于WO2006/128568);事件TC1507(玉米,昆虫控制-除草剂耐受性,未保藏,描述于US-A 2005-039226或WO2004/099447);事件VIP1034(玉米,昆虫控制-除草剂耐受性,保藏为ATCC PTA-3925,描述于WO2003/052073),事件32316(玉米,昆虫控制-除草剂耐受性,保藏为PTA-11507,描述于WO2011/084632),事件4114(玉米,昆虫控制-除草剂耐受性,保藏为PTA-11506,描述于WO2011/084621),事件EE-GM3/FG72(大豆,除草剂耐受性,ATCC登录号PTA-11041)任选与事件EE-GM1叠加/LL27或事件EE-GM2/LL55(WO2011/063413A2),事件DAS-68416-4(大豆,除草剂耐受性,ATCC登录号PTA-10442,WO2011/066360A1),事件DAS-68416-4(大豆,除草剂耐受性,ATCC登录号PTA-10442,WO2011/066384A1),事件DP-040416-8(玉米,昆虫控制,ATCC登录号PTA-11508,WO2011/075593A1),事件DP-043A47-3(玉米,昆虫对照,ATCC登录号PTA-11509,WO2011/075595A1),事件DP-004114-3(玉米,昆虫对照,ATCC登记号PTA-11506,WO2011/084621A1),事件DP-032316-8(玉米,昆虫控制,ATCC登录号PTA-11507,WO2011/084632A1),事件MON-88302-9(油菜,除草剂耐受性,ATCC登录号PTA-10955,WO2011/153186A1),事件DAS-21606-3(大豆,除草剂耐受性,ATCC登录号PTA-11028,WO2012/033794A2),事件MON-87712-4(大豆,质量性状,ATCC登录号PTA-10296,WO2012/051199A2),事件DAS-44406-6(大豆,叠加除草剂耐受性,ATCC登录号PTA-11336,WO2012/075426A1),事件DAS-14536-7(大豆,叠加除草剂耐受性,ATCC登录号PTA-11335,WO2012/075429A1),事件SYN-000H2-5(大豆,除草剂耐受性,ATCC登录号PTA-11226,WO2012/082548A2),事件DP-061061-7(油菜,除草剂耐受性,无可用的保藏号,WO2012071039A1),事件DP-073496-4(油菜,除草剂耐受性,无保藏号,US2012131692),事件8264.44.06.1(大豆,叠加除草剂耐受性,登录号PTA-11336,WO2012075426A2),事件8291.45.36.2(大豆,叠加除草剂耐受性,登录号PTA-11335,WO2012075429A2),事件SYHT0H2(大豆,ATCC登录号PTA-11226,WO2012/082548A2),事件MON88701(棉花ATCC登录号PTA-11754,WO2012/134808A1),事件KK179-2(苜蓿,ATCC登录号PTA-11833,WO2013/003558A1),事件pDAB8264.42.32.1(大豆,堆叠除草剂耐受性,ATCC登录号PTA-11993,WO2013/010094A1),事件MZDT09Y(玉米,ATCC登录号PTA-13025,WO2013/012775A1)。
赋予所需性状的基因/事件(例如,感兴趣的多核苷酸)也可以彼此组合存在于转基因植物中。可以提及的转基因植物的实例是重要的农作物,例如谷物(小麦、水稻、黑小麦、大麦、黑麦、燕麦)、玉米、大豆、马铃薯、甜菜、甘蔗、西红柿、豌豆和其他类型的蔬菜、棉花、烟草、油菜以及水果植物(包括水果苹果、梨、柑橘类水果和葡萄),特别强调玉米、大豆、小麦、水稻、马铃薯、棉花、甘蔗、烟草和油菜。特别强调的特性是植物对昆虫、蛛形纲动物、线虫和蛞蝓和蜗牛的增加的抗性,以及植物对一种或多种除草剂的增加的抗性。
可根据本发明优选处理的此类植物、植物部分或植物种子的可商购实例包括以RIBROUNDUPVT DOUBLEVT TRIPLEBOLLGARDROUNDUP READY 2 ROUNDUP2XTENDTM,INTACTA RR2VISTIVE和/或XTENDFLEXTM商品名销售或分销的商业产品,例如植物种子。
现在将参考以下实施例描述本发明。应当理解,这些实施方案并非旨在将权利要求的范围限制于本发明,而是旨在作为某些实施方案的示例。本领域技术人员想到的示例性方法的任何变化都旨在落入本发明的范围内。
实施例
实施例1.GRF转录因子的编辑
通过CRISPR-Cas框内缺失基因编辑提高大豆GRF转录因子的mRNA水平。此实施例证实内源性大豆GRF转录因子(GLYMA_01g234400)的修饰破坏miRNA396的作用并增加GRFmRNA水平。
设计了同时靶向四种不同GRF转录因子(GLYMA_01g234400SEQ ID NO:75、GLYMA_11g008500SEQ ID NO:72、GLYMA_12g014700SEQ ID NO:78、GLYMA_11g110700SEQ ID NO:81)的间隔区(TGATTCCACAGGCTTTCTTGAAC(SEQ ID NO:111))。使用农杆菌将表达间隔区和CRISPR-Cas核酸酶的载体转化到大豆干切胚胎(DEE)中。使用标准下一代测序(NGS)方法对再生植物针对所有四个靶基因座处的缺失进行分析。大豆植物(CE56546)在高%读数下,在基因座GLYMA_01g234400中的miR396靶位点中鉴定出6bp框内缺失。从该植物中采集叶组织样本,并使用标准qPCR方法将所有四个GRF基因座的mRNA水平与野生型对照进行比较(图1)。仅GLYMA_01g234400显示mRNA水平增加,与该基因座的高%编辑一致。其他测定的GRF显示相对低的%编辑,并且mRNA水平没有增加。这些结果表明,大豆GRF的miR396靶标内的框内缺失也可以增加该物种中的mRNA水平。
实施例2.经编辑的等位基因的分子表征
将如实施例1中所述产生的大豆品系再生并转移至温室以产生E1种子。经编辑的GRF等位基因在E1代中分离,以产生编辑/未编辑的GRF基因的各种组合。将E1种子发芽,并使用标准NGS方法测定植物在所有四个靶基因座(如实施例1中所述)处的缺失。如表2所示,鉴定了一系列经编辑的品系。
表2.经编辑的等位基因
值得注意的是,在两种不同的再生植物(CE56564和CE56540)中鉴定出上文描述为CE56564(等位基因组合A)和CE56540(等位基因组合C)的GLYMA_11g008500的经编辑的等位基因。
表3显示了生成的其他经编辑的等位基因组合。
表3.生成的其他经编辑的等位基因组合
实施例3:E1代产量性状评估
在R6生长阶段评估实施例2中描述的E1植物的可指示产量增加的植物结构特征以及种子计数(其是植物产量的直接指示)。测量的植物表型包括植物高度、主干上的茎节数、分枝数、分枝上的豆荚数、主干上的豆荚数、主干上每茎节的豆荚数、每株植物的豆荚数、每豆荚的种子数和每株植物的种子数。结果总结于表4中。
表4.E1植物的表型特征
CE56564等位基因组合B和CE56564等位基因组合C表明,GLYMA_12g014700的框内缺失导致在R6生长阶段分枝上的豆荚数和每株植物的豆荚数增加。CE56564等位基因组合B家族显示每株植物的种子数量增加,但每豆荚的种子数量没有增加,而CE56564等位基因组合C家族显示每株植物的种子数量没有变化,但每豆荚的种子数量减少。
实施例4.CE56564等位基因组合C的表达分析
收集来自衍生自CE56564并含有实施例2中所述的等位基因组合C的三种E2植物的叶样品用于qPCR分析以评估所有四种GRF基因的表达水平。等位基因C组合的GLYMA_12g014700的表达显示基因表达在16-38倍范围内的上调,如图2中进一步描述的。测定的其他GRF(GLYMA_01g234400SEQ ID NO:75、GLYMA_11g008500SEQ ID NO:72和GLYMA_11g110700SEQ ID NO:81)显示出相对较低的%编辑并且mRNA水平没有增加。这些结果表明,大豆GRF的miR396靶标内的框内缺失也可以增加该物种的mRNA水平。
实施例5:E2代的产量性状评估
允许实施例3中描述的E1植物结籽以产生E2群体。将E2种子种植在温室环境中。在R6生长阶段评估植物的植物结构特征(其可指示产量增加)以及种子计数(其是植物产量的直接指示)。测量植物表型,其包括例如植物高度、主干上的茎节数、分枝数、分枝上的豆荚数、主干上的豆荚数、主干上每茎节的豆荚数、每株植物的豆荚数、每豆荚的种子数和每株植物的种子数。
实施例6.编辑的等位基因(GLYMA_04G230600和GLYMA_06G134600)pWISE2900
设计了同时靶向两种不同GRF转录因子(GLYMA_04G230600(SEQ ID NO:90)和GLYMA_06G134600(SEQ ID NO:93))的间隔区PWsp1141(CATAGAGGCCGTCCCCGTTCAAG)(SEQID NO:131)。使用农杆菌将表达间隔区和CRISPR-Cas核酸酶的载体转化到大豆干切胚胎(DEE)中。再生植物并使用标准NGS方法测定两个靶基因座处的缺失。
两个品系CE59504和CE58275被鉴定为携带GRF基因中的编辑(约10%的测序读数显示被靶向的基因中的编辑),并被推进到下一代。在CE59504和CE58275的E1代中鉴定了GRF的经编辑的等位基因的几种不同组合,并在表5中进一步描述。
表5.CE59504和CE52875编辑的等位基因
实施例7.CE59504和CE58275的产量性状的评估
将实施例6中描述的再生植物CE59504和CE58275转移至温室以结籽(E1)。将E1种子在温室中发芽和生长,评估所得植物的产量性状,例如植物高度、主干上的茎节数、分枝数、分枝上的豆荚数、主干上的豆荚数、主干上每茎节的豆荚数、每株植物的豆荚数、每豆荚的种子数和每株植物的种子数。源自CE56546(等位基因组D)的植物E1家族显示每株植物的豆荚数量增加。允许来自E1家族的植物结E2种子。使从E1植物收集的E2种子发芽,并对所得植物的产量性状进行了评估,但未检测到与野生型植物的显著差异;然而,E1表型需要在更大的群体和现场环境中进行测试。
实施例8.CE59504和CE58275疾病测试
针对SCN控制的表型测试
将E2或E3种子(10/盆)播种在0.75”的深度。对盆浇水并放置在生长室/温室中。单叶出现后(种植后约7-10天),在每个盆的土壤中戳约5-6个孔,深度为3-5英寸。通过以大致相同体积倒入5-6个孔的每一个中来引入大豆胞囊线虫(SCN)卵的接种物。通过用顶层土壤捏住/覆盖孔来用土壤覆盖每个孔。产生三个盆的组。在1xSCN生命周期(接种后4-5周)收获培养盆的盆组并提取SCN。除去叶子后,将盆中的内容物倒入桶中,在这里冲洗根。将水倒入筛子组中(顶部20目,底部80目)。从80目筛子中收集胞囊,并将1mL胞囊放入比色皿中并计数胞囊的数量。
针对锈菌控制的表型测试
将E2或E3种子种植在装有Berger BM2盆栽介质的3x2.5”盆中。使用了两项检查:WT Soy(转化系/敏感检查)和T104(抗性检查;例如,非叶绿素降解对照植物或对叶绿素降解具有增强的抗性的对照植物)和八个经编辑的品系。每个条目在八个盆中复制。在V2阶段,用喷枪喷雾器在第一片三叶上用亚洲大豆锈病的致病菌豆薯层锈菌以每毫升20,000个夏孢子(urediniospore)的速度接种植物。用于接种的孢子是来自上一代母株的新鲜孢子。接种后,将植物在100%RH的暗雾箱中孵育24小时,然后返回如下设置的生长室:14小时光照周期、500uE光强度、24C白天/20C黑夜和80%RH。接种后14天,目视评定每个接种的三叶上的疾病百分比。在接种后1、7、9、11和14天(DPI),对每个条目的每个重复的接种的三叶的中间叶进行叶绿素读数。对于每个中间叶,在每个重复和条目的相似位置进行4次测量。叶绿素读数使用Konica Minolta叶绿素计(型号SPAD-502)进行测量。
前述内容是对本发明的说明并且不应被解释为对其进行限制。本发明由所附权利要求限定,权利要求的等同物也包括在其中。

Claims (84)

1.一种大豆植物或其植物部分,其包含编码生长调节因子(GRF)转录因子的内源基因中的至少一个非天然突变,其中所述编码GRF转录因子的内源基因
(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;
(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或
(d)编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的区域。
2.权利要求1的大豆植物或其部分,其中编码GRF转录因子的内源基因中的至少一个非天然突变导致由内源基因产生的mRNA的水平增加。
3.权利要求1或权利要求2的大豆植物或其部分,其中所述至少一个非天然突变位于内源基因中的miR396结合位点内或附近。
4.权利要求3的大豆植物或其部分,其中内源基因的miR396结合位点(a)包含在与SEQID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性和/或与SEQ ID NO:109的核苷酸序列具有至少90%序列同一性的内源基因区域中,和/或(b)编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性和/或与SEQID NO:110具有至少90%序列同一性的GRF多肽区域。
5.前述权利要求中任一项的大豆植物或其植物部分,其中至少一个突变是碱基取代、碱基缺失和/或碱基插入。
6.前述权利要求中任一项的大豆植物或其部分,其中所述至少一个非天然突变包括A、T、G或C的碱基取代,任选地其中所述碱基取代导致氨基酸取代。
7.权利要求1-3中任一项的大豆植物或其部分,其中所述至少一个非天然突变是至少一个碱基对的缺失,任选地约1个碱基对至约100个连续碱基对的缺失。
8.权利要求1-5中任一项的大豆植物或其部分,其中所述至少一个非天然突变是至少一个碱基对的插入。
9.权利要求1-5或7中任一项的大豆植物或其部分,其中所述缺失是框内或框外缺失或者框内或框外插入。
10.权利要求1-5、7或9中任一项的大豆植物或其部分,其中所述至少一个非天然突变导致突变的GRF转录因子基因,其包含与SEQ ID NO:133-147中的任一个具有至少90%序列同一性的核苷酸序列。
11.前述权利要求中任一项的大豆植物或其部分,其中与对照大豆植物相比,大豆植物或其植物部分表现出改善的或维持的产量性状、改善的植物结构和/或改善的或维持的防御性状(例如,改善或维持的对大豆锈菌感染和/或大豆胞囊线虫感染的抗性)的表型,任选地其中与对照大豆植物相比,所述大豆植物或其植物部分表现出改善的防御性状而不丧失产量性状或改善的产量性状而不丧失防御性状的表型。
12.权利要求11的大豆植物或其部分,其中改善的产量性状包括增加的产量(蒲式耳/英亩)、增加的每株植物的种子数量、增加的每茎节的豆荚数量、增加的每株植物的豆荚数量和/或增加的种子重量。
13.一种大豆植物细胞,其包含碱基编辑系统,所述碱基编辑系统包含:
(a)CRISPR-Cas效应蛋白;和
(b)引导核酸(例如,gRNA、gDNA、crRNA、crDNA、sgRNA、sgDNA),其具有与编码GRF转录因子的内源靶基因互补的间隔序列,其中所述内源靶基因
(i)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;
(ii)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性,任选地,与SEQ ID NO:109的核苷酸序列具有至少90%序列同一性的区域;
(iii)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或
(iv)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性、任选地与SEQ ID NO:110的氨基酸序列具有至少90%序列同一性的序列的区域,任选地其中碱基编辑系统进一步包含胞苷脱氨酶或腺苷脱氨酶。
14.权利要求13的大豆植物细胞,其中所述gRNA包含SEQ ID NO:111-113或SEQ ID NO:130-131中任一个的核苷酸序列。
15.一种大豆植物,其由权利要求1至12中任一项的植物部分或权利要求13或权利要求14的大豆植物细胞再生。
16.权利要求15的大豆植物,其中所述植物包含与SEQ ID NO:133-147中任一个的核苷酸序列具有至少90%序列同一性的突变的GRF转录因子基因。
17.一种大豆植物或其部分,其包含在内源GRF转录因子基因的miR396结合位点内或附近的至少一个非天然突变,其中所述至少一个非天然突变阻止或减少miR396与由内源GRF转录因子基因产生的mRNA的结合,导致由内源GRF转录因子基因产生的mRNA水平增加,进一步其中所述至少一个非天然突变是使用编辑系统引入的取代、插入或缺失,所述编辑系统包含与内源GRF转录因子基因中的靶位点结合的核酸结合结构域,所述靶位点与SEQ IDNO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%的序列同一性和/或编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列。
18.权利要求17的大豆植物或其部分,其中所述内源GRF转录因子基因在与SEQ ID NO:109的核苷酸序列具有至少90%序列同一性的序列内被突变。
19.权利要求17或权利要求18的大豆植物或其部分,其中所述至少一个非天然突变是插入和/或缺失。
20.权利要求17-19中任一项的大豆植物或其部分,其中所述突变是点突变。
21.权利要求17-20中任一项的大豆植物或其部分,其中所述编辑系统的核酸结合结构域来自多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应核酸酶(TALEN)和/或Argonaute蛋白。
22.权利要求17-21中任一项的大豆植物或其部分,其中所述部分是细胞。
23.权利要求17-22中任一项的大豆植物或其部分,其中所述植物或其部分包含与SEQID NO:133-147中任一个的核苷酸序列具有至少90%序列同一性的突变的GRF转录因子基因。
24.一种大豆植物,其包含生长调节因子(GRF)转录因子基因,所述GRF转录因子基因包含SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93、94、96-103、109或122-129中任一个的核苷酸序列中的突变,任选地其中所述突变导致与SEQ ID NO:133-147中任一个的核苷酸序列具有至少90%序列同一性的GRF转录因子基因。
25.权利要求17-24中任一项的大豆植物或其部分,其中与对照大豆植物相比,大豆植物表现出改善的或维持的产量性状、改善的植物结构和/或改善的或维持的防御性状(例如,改善或维持的对大豆锈菌感染和/或大豆胞囊线虫感染的抗性)的表型,任选地其中与对照大豆植物相比,所述大豆植物或其植物部分表现出改善的防御性状而不丧失产量性状或改善的产量性状而不丧失防御性状的表型。
26.权利要求25的大豆植物或其部分,其中改善的产量性状包括增加的产量(蒲式耳/英亩)、增加的每株植物的种子数量、增加的每茎节的豆荚数量、增加的每株植物的豆荚数量和/或增加的种子重量。
27.一种产生/培育无转基因的碱基编辑大豆植物的方法,包括:
(a)将权利要求1至26中任一项的大豆植物与无转基因的大豆植物杂交,从而将至少一个突变或突变引入无转基因的大豆植物中;和
(b)选择包含所述至少一个突变或突变且无转基因的后代大豆植物,从而产生无转基因的碱基编辑大豆植物。
28.一种用于编辑大豆植物细胞的基因组中的特定位点的方法,所述方法包括:以位点特异性方式切割所述大豆植物细胞中的内源GRF转录因子基因内的靶位点,所述内源GRF转录因子基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域,从而在所述大豆植物细胞的内源GRF转录因子基因中产生编辑。
29.权利要求28的方法,其中所述内源GRF转录因子基因包含miR396结合位点,所述miR396结合位点具有与SEQ ID NO:109具有至少90%序列同一性的序列,并且所述编辑在大豆植物细胞的内源GRF转录因子基因的miR396结合位点中或附近产生。
30.权利要求28或权利要求29的方法,其中所述靶位点位于与SEQ ID NO:96-103或SEQID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性或编码与SEQ ID NO:104-108中任一个具有至少80%序列同一性的氨基酸序列的序列内。
31.权利要求28-30中任一项的方法,进一步包括从包含内源GRF转录因子基因中的编辑的大豆植物细胞再生大豆植物,以产生包含在其内源GRF转录因子基因中的编辑的大豆植物。
32.权利要求28-31中任一项的方法,其中所述大豆植物包含在其内源GRF转录因子基因中的编辑,其中与对照大豆植物相比,所述大豆植物表现出改善的或维持的产量性状、改善的植物结构和/或改善的或维持的防御性状(例如,改善或维持的对大豆锈菌感染和/或大豆胞囊线虫感染的抗性)的表型,任选地其中与对照大豆植物相比,所述大豆植物或其植物部分表现出改善的防御性状而不丧失产量性状或改善的产量性状而不丧失防御性状的表型。
33.权利要求32的方法,其中改善的产量性状包括增加的产量(蒲式耳/英亩)、增加的每株植物的种子数量、增加的每茎节的豆荚数量、增加的每株植物的豆荚数量和/或增加的种子重量。
34.权利要求28-33中任一项的方法,其中所述编辑导致非天然突变,任选地其中所述非天然突变导致与SEQ ID NO:133-147中任一个的核苷酸序列具有至少90%序列同一性的突变的GRF转录因子基因。
35.一种用于制备大豆植物的方法,包括:
(a)使包含编码GRF转录因子的内源基因的大豆植物细胞群体与包含与所述内源基因的一部分结合的核酸结合结构域的编辑系统接触,所述内源基因(i)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;(ii)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;(iii)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或(iv)包含编码与SEQID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域;
(b)从群体中选择包含编码GRF转录因子的至少一个内源基因中的突变的大豆植物细胞,其中所述突变是所述至少一个内源基因中的至少一个核苷酸的取代,其中所述突变降低或消除miR396与由包含突变的编码GRF转录因子的至少一个内源基因产生的mRNA的结合;和
(c)使选择的大豆植物细胞生长为大豆植物。
36.一种用于产生大豆植物或其部分的方法,所述大豆植物或其部分包含其中内源GRF转录因子基因被突变的至少一个细胞,所述方法包括
使大豆植物或植物部分中的GRF转录因子基因中的靶位点与包含与GRF转录因子基因中的靶位点结合的核酸结合结构域的编辑系统接触,所述GRF转录因子基因
(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;
(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或
(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域,从而产生包含具有内源GRF转录因子基因中的突变的至少一个细胞的大豆植物或其部分。
37.权利要求36的方法,其中突变的内源GRF转录因子基因产生具有减少的miR396结合的mRNA。
38.一种产生大豆植物或其部分的方法,所述大豆植物或其部分包含内源GRF转录因子基因中的突变,所述突变产生具有减少的miR396结合的mRNA,所述方法包括
使内源GRF转录因子基因中的靶位点与包含与GRF转录因子基因中的靶位点结合的核酸结合结构域的编辑系统接触,所述GRF转录因子基因
(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;
(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或
(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域,从而产生包含内源GRF转录因子基因中的突变的大豆植物或其部分,所述突变产生具有减少的miR396结合的mRNA。
39.权利要求35-38中任一项的方法,其中与对照大豆植物相比,所述大豆植物表现出改善的或维持的产量性状、改善的植物结构和/或改善的或维持的防御性状(例如,改善或维持的对大豆锈菌感染和/或大豆胞囊线虫感染的抗性)的表型,任选地其中与对照大豆植物相比,所述大豆植物或其植物部分表现出改善的防御性状而不丧失产量性状或改善的产量性状而不丧失防御性状的表型。
40.权利要求39的方法,其中改善的产量性状包括增加的产量(蒲式耳/英亩)、增加的每株植物的种子数量、增加的每茎节的豆荚数量、增加的每株植物的豆荚数量和/或增加的种子重量。
41.一种产生具有改善的产量性状、改善的植物结构和/或改善的防御性状的大豆植物或其部分的方法,所述方法包括
使大豆植物或植物部分中的内源GRF转录因子基因中的靶位点与包含与GRF转录因子基因中的靶位点结合的核酸结合结构域的编辑系统接触,所述GRF转录因子基因
(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;
(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或
(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域,从而产生包含突变的内源GRF转录因子基因的大豆植物或其部分,所述突变的内源GRF转录因子基因产生具有减少的miR396结合的mRNA,从而产生具有改善的产量性状、改善的植物结构和/或改善的防御性状(例如,改善或维持的对大豆锈菌感染和/或大豆胞囊线虫感染的抗性)的大豆植物或其部分。
42.权利要求36-41中任一项的方法,其中所述靶位点包含与SEQ ID NO:96-103或SEQID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的序列,或编码与SEQ IDNO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列,任选地其中所述突变位于内源GRF转录因子基因中的miR396结合位点中或附近。
43.权利要求42的方法,其中所述miR396结合位点包含与SEQ ID NO:109的核苷酸序列具有至少90%序列同一性的序列和/或编码与SEQ ID NO:110具有至少90%同一性的序列。
44.权利要求35-43中任一项的方法,其中所述编辑系统进一步包含切割所述内源GRF转录因子基因的核酸酶;并且在内源GRF转录因子基因中的miR396结合位点中或附近引入突变。
45.权利要求35-44中任一项的方法,其中所述突变是非天然突变。
46.权利要求35-45中任一项的方法,其中所述突变是取代、插入和/或缺失。
47.权利要求35-46中任一项的方法,其中所述突变是点突变。
48.权利要求35-47中任一项的方法,其中所述核酸酶是核酸内切酶(例如,Fok1)、多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)、锌指核酸酶和/或转录激活因子样效应核酸酶(TALEN)。
49.权利要求35-48中任一项的方法,其中所述突变导致与SEQ ID NO:133-147中任一个的核苷酸序列具有至少90%序列同一性的GRF转录因子基因。
50.一种与GRF转录因子基因中的靶位点结合的引导核酸,所述靶位点包含与SEQ IDNO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的序列,或编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列。
51.权利要求50的引导核酸,其中所述引导核酸包含具有SEQ ID NO:111-113或SEQ IDNO:130-131中任一个的核苷酸序列的间隔区。
52.一种系统,其包含权利要求50或权利要求51的引导核酸,以及与所述引导核酸缔合的CRISPR-Cas效应蛋白。
53.权利要求52的系统,进一步包含与所述引导核酸和CRISPR-Cas效应蛋白缔合的tracr核酸,任选地其中所述tracr核酸和所述引导核酸共价连接。
54.一种基因编辑系统,其包含与引导核酸缔合的CRISPR-Cas效应蛋白,其中所述引导核酸包含与GRF转录因子基因结合的间隔序列,其中所述GRF转录因子基因
(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;
(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或
(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域。
55.权利要求54的基因编辑系统,其中所述引导核酸包含具有SEQ ID NO:111-113或SEQ ID NO:130-131中任一个的核苷酸序列的间隔序列。
56.权利要求54或权利要求55的基因编辑系统,进一步包含与所述引导核酸和CRISPR-Cas效应蛋白缔合的tracr核酸,任选地其中所述tracr核酸和所述引导核酸共价连接。
57.一种复合物,其包含含有切割结构域(例如,核酸酶)的CRISPR-Cas效应蛋白和引导核酸(例如,gRNA),其中所述引导核酸与GRF转录因子基因中的靶位点结合,所述GRF转录因子基因
(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;
(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或
(d)包含编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的序列的区域,其中所述切割结构域切割GRF转录因子基因中的靶标链。
58.一种表达盒,其包含
(a)编码包含切割结构域的CRISPR-Cas效应蛋白的多核苷酸,以及
(b)与GRF转录因子基因中的靶位点结合的引导核酸,其中所述引导核酸包含间隔序列,所述间隔序列与以下序列的一部分互补并结合,所述以下序列
(i)与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93、94、96-103或122-129中任一个的核苷酸序列具有至少80%的序列同一性;和/或
(ii)编码与SEQ ID NO:74、77、80、83、86、89、92、95或104-108中任一个的氨基酸序列具有至少80%序列同一性的序列,任选地其中序列的一部分是约2至约22个连续核苷酸。
59.一种编码GRF转录因子mRNA的核酸,所述GRF转录因子mRNA包含miR396结合位点中或附近的突变,所述突变破坏miR396与GRF转录因子mRNA的结合,导致由所述核酸产生的GRF转录因子mRNA的水平增加。
60.权利要求59的核酸,其中所述突变消除miR396与mRNA的结合。
61.权利要求59或权利要求60的核酸,其中所述突变使miR396结合mRNA的能力降低至少75%。
62.权利要求59-61中任一项的核酸,其中所述核酸包含与SEQ ID NO:133-147中的任一个具有至少90%序列同一性的核苷酸序列。
63.一种大豆植物或其部分,其包含权利要求59-62中任一项的核酸。
64.一种大豆植物或其植物部分,其包含至少一个内源生长调节因子(GRF)基因中的至少一个非天然突变,所述内源生长调节因子(GRF)基因具有基因识别号(基因ID)GLYMA_11g008500、GLYMA_01g234400、GLYMA_12g014700、GLYMA_11g110700、GLYMA_07g038400、GLYMA_16g007600、GLYMA_04g230600和/或GLYMA_06g134600。
65.权利要求64的大豆植物或其植物部分,其包含与SEQ ID NO:133-147的核苷酸序列中的任一个具有至少90%序列同一性的突变的GRF基因。
66.一种与生长调节因子(GRF)中的靶核酸结合的引导核酸,所述生长调节因子(GRF)具有基因识别号(基因ID)GLYMA_11g008500、GLYMA_01g234400、GLYMA_12g014700、GLYMA_11g110700、GLYMA_07g038400、GLYMA_16g007600、GLYMA_04g230600和/或GLYMA_06g134600。
67.一种编辑大豆植物或植物部分中的内源GRF转录因子基因的方法,所述方法包括
使大豆植物或植物部分中的GRF转录因子基因中的靶位点与包含胞嘧啶脱氨酶和与GRF转录因子基因中的靶位点结合的核酸结合结构域的胞嘧啶碱基编辑系统接触,所述GRF转录因子基因
(a)与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93、94、96-103或122-129中任一个的核苷酸序列具有至少80%的序列同一性;和/或
(b)编码与SEQ ID NO:74、77、80、83、86、89、92、95或104-108中任一个的氨基酸序列具有至少80%序列同一性的序列,其中胞嘧啶脱氨酶在SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93、94或96-103中任一个的核苷酸序列中产生至少一个C到T的转换,从而产生包含具有内源GRF转录因子基因中的突变的至少一个细胞的大豆植物或其部分。
68.一种编辑大豆植物或植物部分中的内源GRF转录因子基因的方法,所述方法包括
使大豆植物或植物部分中的GRF转录因子基因中的靶位点与包含腺嘌呤脱氨酶和与GRF转录因子基因中的靶位点结合的核酸结合结构域的腺嘌呤碱基编辑系统接触,所述GRF转录因子基因
(a)与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93、94、96-103或122-129中任一个的核苷酸序列具有至少80%的序列同一性;和/或
(b)编码与SEQ ID NO:74、77、80、83、86、89、92、95或104-108中任一个的氨基酸序列具有至少80%序列同一性的序列,其中腺嘌呤脱氨酶在SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93、94或96-103中任一个的核苷酸序列中产生至少一个A到G的转换,从而产生包含具有内源GRF转录因子基因中的突变的至少一个细胞的大豆植物或其部分。
69.一种检测内源GRF转录因子基因中的突变的方法,包括检测大豆植物的基因组中SEQ ID NO:109的核苷酸序列中的至少一个碱基取代。
70.一种在植物中的内源GRF转录因子基因中产生突变的方法,包括:
(a)将基因编辑系统靶向至包含与SEQ ID NO:96-103或SEQ ID NO:122-129中的任一个具有至少80%序列同一性的序列的GRF转录因子基因的一部分;和
(b)选择包含位于与SEQ ID NO:75-98中的任一个具有至少80%序列同一性的MAR1基因的区域中的修饰的植物。
71.权利要求70的方法,其中所述GRF转录因子基因中的突变导致与SEQ ID NO:133-147中的任一个具有至少90%序列同一性的核苷酸序列。
72.一种在GRF转录因子基因中产生变异的方法,包括:
将编辑系统引入植物细胞中,其中所述编辑系统被靶向至编码生长调节因子(GRF)转录因子的GRF转录因子基因的区域,并且使GRF转录因子基因的区域与所述编辑系统接触,从而将突变引入GRF转录因子基因并在植物细胞的GRF转录因子基因中产生变异。
73.权利要求72的方法,其中所述GRF转录因子基因:
(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、85、87、88、90、91、93或94中任一个的核苷酸序列具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:96-103或SEQ ID NO:122-129中任一个的核苷酸序列具有至少80%序列同一性的区域;
(c)编码与SEQ ID NO:74、77、80、83、86、89、92或95中任一个的氨基酸序列具有至少80%序列同一性的序列;和/或
(d)编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的区域。
74.权利要求72或权利要求73的方法,其中被靶向的GRF转录因子基因的区域与SEQ IDNO:96-103或SEQ ID NO:122-129的核苷酸序列中的任一个具有至少80%的序列同一性或编码与SEQ ID NO:104-108中任一个的氨基酸序列具有至少80%序列同一性的区域。
75.权利要求72-74中任一项的方法,其中使植物细胞中的内源GRF转录因子基因的区域与编辑系统接触产生在其基因组中包含编辑的内源GRF转录因子基因的植物细胞,所述方法进一步包括(a)从植物细胞再生植物;(b)使植物自交产生后代植物(E1);(c)针对改善或维持的产量性状、改善的植物结构和/或改善或维持的防御性状(例如,改善或维持的对大豆锈菌感染和/或大豆胞囊线虫感染的抗性)测定(b)的后代植物,任选其中防御性状得到改善或维持而不丧失产量性状和/或提供改善的产量性状而不丧失防御性状;和(d)选择表现出改善或维持的产量性状、改善的植物结构和/或改善或维持的防御性状的后代植物,以产生与对照植物相比表现出改善或维持的产量性状、改善的植物结构和/或改善或维持的防御性状的所选择的后代植物。
76.权利要求75的方法,进一步包括(e)使(d)的所选择的后代植物自交以产生后代植物(E2);(f)针对改善或维持的产量性状、改善的植物结构和/或改善或维持的防御性状测定(e)的后代植物;和(g)选择表现出改善或维持的产量性状、改善的植物结构和/或改善或维持的防御性状的后代植物,以产生与对照植物相比表现出改善或维持的产量性状、改善的植物结构和/或改善或维持的防御性状的所选择的后代植物,任选地重复(e)至(g)额外一次或多次。
77.一种产生大豆植物的方法,所述大豆植物包含内源GRF转录因子基因中的突变和至少一种感兴趣的多核苷酸,所述方法包括
将第一大豆植物与包含所述至少一种感兴趣的多核苷酸的第二大豆植物杂交以产生后代大豆植物,所述第一大豆植物为权利要求1-12、15-26或63-65中任一项的大豆植物;和
选择包含GRF转录因子基因中的突变和至少一种感兴趣的多核苷酸的后代植物,从而产生包含内源GRF转录因子基因中的突变和至少一种感兴趣的多核苷酸的大豆植物。
78.一种产生大豆植物的方法,所述大豆植物包含内源GRF转录因子基因中的突变和至少一种感兴趣的多核苷酸,所述方法包括
将至少一种感兴趣的多核苷酸引入权利要求1-12、15-26或63-65中任一项的大豆植物中,从而产生包含GRF转录因子基因中的突变和至少一种感兴趣的多核苷酸的大豆植物。
79.一种产生大豆植物的方法,所述大豆植物包含内源GRF转录因子基因中的突变并且表现出改善的植物结构、改善或维持的产量性状和/或改善或维持的防御性状的表型,所述方法包括
将第一大豆植物与表现出改善的植物结构、改善或维持的产量性状和/或改善或维持的防御性状的表型的第二大豆植物杂交,所述第一大豆植物为权利要求1-12、15-26或63-65中任一项的大豆植物;和
选择包含GRF转录因子基因中的突变和改善的植物结构、改善或维持的产量性状和/或改善或维持的防御性状的表型的后代大豆植物,从而产生包含内源GRF转录因子基因中的突变并且与对照大豆植物相比表现出改善的植物结构、改善或维持的产量性状和/或改善或维持的防御性状(例如,改善或维持的对大豆锈菌感染和/或大豆胞囊线虫感染的抗性)的表型的大豆植物。
80.一种控制容器(例如,花盆或种子盘等)、生长室、温室、田地、休闲区、草坪或路边中的杂草的方法,包括
将除草剂施用于生长在容器、生长室、温室、田地、休闲区、草坪或路边中的权利要求1-12、15-26或63-65中任一项的一种或多种(多个)大豆植物,从而控制一种或多种大豆植物生长在其中的容器、生长室、温室、田地、休闲区、草坪或路边中的杂草。
81.一种减少大豆植物上的昆虫捕食的方法,包括
将杀虫剂施用于权利要求1-12、15-26或63-65中任一项的一种或多种大豆植物,从而减少所述一种或多种大豆植物上的昆虫捕食。
82.一种减少大豆植物上的真菌病害的方法,包括
将杀真菌剂施用于权利要求1-12、15-26或63-65中任一项的一种或多种大豆植物,从而减少所述一种或多种大豆植物上的真菌病害。
83.权利要求81或权利要求82的方法,其中所述一种或多种大豆植物生长在容器、生长室、温室、田地、休闲区、草坪或路边中。
84.权利要求77-83中任一项的方法,其中所述感兴趣的多核苷酸是赋予除草剂耐受性、抗虫性、抗病性、增加的产量、增加的养分利用效率或非生物胁迫抗性的多核苷酸。
CN202280055484.2A 2021-06-17 2022-06-16 大豆中生长调节因子家族转录因子的修饰 Pending CN117897050A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163211860P 2021-06-17 2021-06-17
US63/211,860 2021-06-17
PCT/US2022/033701 WO2022266271A1 (en) 2021-06-17 2022-06-16 Modification of growth regulating factor family transcription factors in soybean

Publications (1)

Publication Number Publication Date
CN117897050A true CN117897050A (zh) 2024-04-16

Family

ID=82693898

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280055484.2A Pending CN117897050A (zh) 2021-06-17 2022-06-16 大豆中生长调节因子家族转录因子的修饰

Country Status (8)

Country Link
US (1) US20220411813A1 (zh)
EP (1) EP4355083A1 (zh)
CN (1) CN117897050A (zh)
AR (1) AR126172A1 (zh)
CA (1) CA3223995A1 (zh)
MX (1) MX2023014775A (zh)
UY (1) UY39822A (zh)
WO (1) WO2022266271A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024015781A2 (en) * 2022-07-12 2024-01-18 Inari Agriculture Technology, Inc. Compositions and methods for soybean plant transformation

Family Cites Families (122)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2009A (en) 1841-03-18 Improvement in machines for boring war-rockets
US137395A (en) 1873-04-01 Improvement in nuts
US2010A (en) 1841-03-18 Machine foe
US24077A (en) 1859-05-17 Window-sash supporter
NZ221259A (en) 1986-07-31 1990-05-28 Calgene Inc Seed specific transcriptional regulation
US6040504A (en) 1987-11-18 2000-03-21 Novartis Finance Corporation Cotton promoter
CA1339684C (en) 1988-05-17 1998-02-24 Peter H. Quail Plant ubquitin promoter system
US5641876A (en) 1990-01-05 1997-06-24 Cornell Research Foundation, Inc. Rice actin gene and promoter
ATE225853T1 (de) 1990-04-12 2002-10-15 Syngenta Participations Ag Gewebe-spezifische promotoren
US6395966B1 (en) 1990-08-09 2002-05-28 Dekalb Genetics Corp. Fertile transgenic maize plants containing a gene encoding the pat protein
US5459252A (en) 1991-01-31 1995-10-17 North Carolina State University Root specific gene promoter
DE69230290T2 (de) 1991-08-27 2000-07-20 Novartis Ag, Basel Proteine mit insektiziden eigenschaften gegen homopteran insekten und ihre verwendung im pflanzenschutz
UA48104C2 (uk) 1991-10-04 2002-08-15 Новартіс Аг Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника
US6576455B1 (en) 1995-04-20 2003-06-10 Basf Corporation Structure-based designed herbicide resistant products
AU729228B2 (en) 1995-11-06 2001-01-25 Wisconsin Alumni Research Foundation Insecticidal protein toxins from photorhabdus
TR199901126T2 (xx) 1996-08-29 1999-07-21 Dow Agrosciences Llc Photarhabdus' dan elde edilen insektisid i�levli protein toksinleri.
EP0975778B8 (en) 1997-04-03 2007-11-21 DeKalb Genetics Corporation Use of glyphosate resistant maize lines
CN1137137C (zh) 1997-05-05 2004-02-04 道农业科学公司 来自致病杆菌的杀昆虫蛋白毒素
CA2319079A1 (en) 1998-02-20 1999-08-26 Zeneca Limited Pollen specific promoter
WO2000026356A1 (en) 1998-11-03 2000-05-11 Aventis Cropscience N. V. Glufosinate tolerant rice
US6333449B1 (en) 1998-11-03 2001-12-25 Plant Genetic Systems, N.V. Glufosinate tolerant rice
US6509516B1 (en) 1999-10-29 2003-01-21 Plant Genetic Systems N.V. Male-sterile brassica plants and methods for producing same
US6506963B1 (en) 1999-12-08 2003-01-14 Plant Genetic Systems, N.V. Hybrid winter oilseed rape and methods for producing same
CA2395897C (en) 1999-12-28 2011-11-15 Bayer Cropscience N.V. Insecticidal proteins from bacillus thuringiensis
US6395485B1 (en) 2000-01-11 2002-05-28 Aventis Cropscience N.V. Methods and kits for identifying elite event GAT-ZM1 in biological samples
IL151886A (en) 2000-03-27 2010-11-30 Syngenta Participations Ag Promoters of a virus that causes curling of a yellow leaf of a cyst
AR044724A1 (es) 2000-03-27 2005-10-05 Syngenta Participations Ag Promotores del virus de la rizadura amarilla del cestrum
BR122013026754B1 (pt) 2000-06-22 2018-02-27 Monsanto Company Molécula de dna e processos para produzir uma planta de milho tolerante à aplicação do herbicida glifosato
US6713259B2 (en) 2000-09-13 2004-03-30 Monsanto Technology Llc Corn event MON810 and compositions and methods for detection thereof
CZ300073B6 (cs) 2000-09-29 2009-01-21 Monsanto Technology Llc Zpusob vylepšení tolerance vuci glyfosátu u rostliny pšenice, její bunka, její DNA, dvojice molekulDNA primeru, zpusoby její detekce, zpusob šírení vlastnosti tolerance vuci glyfosátu u rostlin, DNAdetekcní kit
EP1366070A2 (en) 2000-10-25 2003-12-03 Monsanto Technology LLC Cotton event pv-ghgt07(1445) and compositions and methods for detection thereof
EP1417318B1 (en) 2000-10-30 2011-05-11 Monsanto Technology LLC Canola event pv-bngt04(rt73) and compositions and methods for detection thereof
AU2002236442A1 (en) 2000-11-20 2002-05-27 Monsanto Technology Llc Cotton event pv-ghbk04 (531) and compositions and methods for detection thereof
AU2002218413A1 (en) 2000-11-30 2002-06-11 Ses Europe N.V. Glyphosate resistant transgenic sugar beet characterised by a specific transgene insertion (t227-1), methods and primers for the detection of said insertion
EG26529A (en) 2001-06-11 2014-01-27 مونسانتو تكنولوجى ل ل سى Prefixes for detection of DNA molecule in cotton plant MON15985 which gives resistance to damage caused by insect of squamous lepidoptera
US6818807B2 (en) 2001-08-06 2004-11-16 Bayer Bioscience N.V. Herbicide tolerant cotton plants having event EE-GH1
WO2003052073A2 (en) 2001-12-17 2003-06-26 Syngenta Participations Ag Novel corn event
WO2004011601A2 (en) 2002-07-29 2004-02-05 Monsanto Technology, Llc Corn event pv-zmir13 (mon863) plants and compositions and methods for detection thereof
GB0225129D0 (en) 2002-10-29 2002-12-11 Syngenta Participations Ag Improvements in or relating to organic compounds
CA2508032C (en) 2002-12-05 2014-09-16 Monsanto Technology Llc Bentgrass event asr-368 and compositions and methods for detection thereof
CN103088017B (zh) 2003-02-12 2016-04-13 孟山都技术有限公司 棉花事件mon 88913及其组合物和检测方法
US7335816B2 (en) 2003-02-28 2008-02-26 Kws Saat Ag Glyphosate tolerant sugar beet
ES2391090T3 (es) 2003-02-20 2012-11-21 Kws Saat Ag Remolacha tolerante al glifosato
PL1620571T3 (pl) 2003-05-02 2015-10-30 Dow Agrosciences Llc Zdarzenie kukurydzy TC1507 i sposoby jego wykrywania
US7129397B2 (en) 2003-10-06 2006-10-31 Syngenta Participations Ag Promoters functional in plant plastids
KR100537955B1 (ko) 2003-10-29 2005-12-20 학교법인고려중앙학원 꽃가루 특이적 유전자 발현 프로모터
WO2005054480A2 (en) 2003-12-01 2005-06-16 Syngenta Participations Ag Insect resistant cotton plants and methods of detecting the same
WO2005054479A1 (en) 2003-12-01 2005-06-16 Syngenta Participations Ag Insect resistant cotton plants and methods of detecting the same
US7157281B2 (en) 2003-12-11 2007-01-02 Monsanto Technology Llc High lysine maize compositions and event LY038 maize plants
PL1708560T3 (pl) 2003-12-15 2015-10-30 Monsanto Technology Llc Roślina kukurydzy MON88017 oraz kompozycje i sposoby ich wykrywania
GB0402106D0 (en) 2004-01-30 2004-03-03 Syngenta Participations Ag Improved fertility restoration for ogura cytoplasmic male sterile brassica and method
PT2281447T (pt) 2004-03-25 2016-10-13 Syngenta Participations Ag Evento de milho mir604
CN101027396B (zh) 2004-03-26 2011-08-03 美国陶氏益农公司 Cry1F和Cry1Ac转基因棉花株系及其事件特异性鉴定
PL1794308T3 (pl) 2004-09-29 2014-04-30 Pioneer Hi Bred Int Zdarzenie DAS-59122-7 kukurydzy oraz sposoby jego wykrycia
PT1868426T (pt) 2005-03-16 2018-05-08 Syngenta Participations Ag Evento de milho 3272 e métodos para a sua deteção
CN101151373B (zh) 2005-04-08 2016-02-24 拜尔作物科学公司 原种事件a2704-12以及用于鉴定生物样品中此事件的方法和试剂盒
US8017756B2 (en) 2005-04-11 2011-09-13 Bayer Bioscience N.V. Elite event A5547-127 and methods and kits for identifying such event in biological samples
AP2693A (en) 2005-05-27 2013-07-16 Monsanto Technology Llc Soybean event MON89788 and methods for detection thereof
WO2006128569A2 (en) 2005-06-02 2006-12-07 Syngenta Participations Ag 1143-14a, insecticidal transgenic cotton expressing cry1ab
BRPI0611508A2 (pt) 2005-06-02 2010-09-14 Syngenta Participations Ag algodão inseticida ce44-69d
WO2006128572A1 (en) 2005-06-02 2006-12-07 Syngenta Participations Ag Ce46-02a insecticidal cotton
WO2006128570A1 (en) 2005-06-02 2006-12-07 Syngenta Participations Ag 1143-51b insecticidal cotton
WO2006128568A2 (en) 2005-06-02 2006-12-07 Syngenta Participations Ag T342-142, insecticidal transgenic cotton expressing cry1ab
US7834254B2 (en) 2005-06-02 2010-11-16 Syngenta Participations AGY CE43-67B insecticidal cotton
MX2008001839A (es) 2005-08-08 2008-04-09 Bayer Bioscience Nv Plantas de algodon con tolerancia a herbicidas y metodos para identificar las mismas.
EA201000757A1 (ru) 2005-08-24 2010-12-30 Пайонир Хай-Бред Интернэшнл, Инк. Способы борьбы с сорными растениями на возделываемой посевной площади
WO2007091277A2 (en) 2006-02-10 2007-08-16 Maharashtra Hybrid Seeds Company Limited (Mahyco) TRANSGENIC BRINJAL (SOLANUM MELONGENA) EXPRESSING THE CRYlAC GENE
KR101366363B1 (ko) 2006-05-26 2014-02-21 몬산토 테크놀로지 엘엘씨 형질전환 계통 mon89034에 해당하는 옥수수 식물 및 종자와 이의 검출 방법 및 사용
ES2546255T3 (es) 2006-06-03 2015-09-22 Syngenta Participations Ag Evento de Maíz MIR162
US7951995B2 (en) 2006-06-28 2011-05-31 Pioneer Hi-Bred International, Inc. Soybean event 3560.4.3.5 and compositions and methods for the identification and detection thereof
US7928295B2 (en) 2006-08-24 2011-04-19 Bayer Bioscience N.V. Herbicide tolerant rice plants and methods for identifying same
US20080064032A1 (en) 2006-09-13 2008-03-13 Syngenta Participations Ag Polynucleotides and uses thereof
US7928296B2 (en) 2006-10-30 2011-04-19 Pioneer Hi-Bred International, Inc. Maize event DP-098140-6 and compositions and methods for the identification and/or detection thereof
US8609935B2 (en) 2006-10-31 2013-12-17 E. I. Du Pont De Nemours And Company Soybean event DP-305423-1 and compositions and methods for the identification and/or detection thereof
WO2008114282A2 (en) 2007-03-19 2008-09-25 Maharashtra Hybrid Seeds Company Limited Transgenic rice (oryza sativa) comprising pe-7 event and method of detection thereof
CN103773863A (zh) 2007-04-05 2014-05-07 拜尔作物科学公司 抗虫棉花植物及其鉴定方法
EA018012B1 (ru) 2007-06-11 2013-04-30 Байер Кропсайенс Н.В. Устойчивые к насекомым растения хлопчатника и методы их идентификации
CN101861392B (zh) 2007-11-15 2016-01-20 孟山都技术公司 对应于转基因事件mon87701的大豆植物和种子及其检测方法
US8273535B2 (en) 2008-02-08 2012-09-25 Dow Agrosciences, Llc Methods for detection of corn event DAS-59132
BRPI0908831A2 (pt) 2008-02-14 2015-08-04 Pioneer Hi Bred Int Métodos para identificar o evento e6611.32.1.38 em amostra biológica, para detectar a presença do evento e6611.32.1.38 ou a progênie deste em uma amostra biológica, para detectar a presença de dna correspondente ao evento e6611.32.1.38 em uma amostra, para selecionar sementes com a presença do evento e6611.32.1.38, molécula de dna isolada, sequência de nucleotídeos de primer de dna, par de sequências de dna isoladas, planta, célula, tecido, semente transgênicos ou partes destes contendo dna.
CA2712445C (en) 2008-02-15 2018-11-06 Monsanto Technology Llc Soybean plant and seed corresponding to transgenic event mon87769 and methods for detection thereof
EP2602325B1 (en) 2008-02-29 2016-06-08 Monsanto Technology LLC Corn plant event MON87460 and compositions and methods for detection thereof
AU2009257375B2 (en) 2008-06-11 2016-07-07 Dow Agrosciences Llc Constructs for expressing herbicide tolerance genes, related plants, and related trait combinations
WO2010024976A1 (en) 2008-08-29 2010-03-04 Monsanto Technology Llc Soybean plant and seed corresponding to transgenic event mon87754 and methods for detection thereof
MX356687B (es) 2008-09-29 2018-06-07 Monsanto Technology Llc Evento transgénico de frijol de soya mon87705 y métodos para detección del mismo.
BRPI0922656A2 (pt) 2008-12-16 2015-08-04 Syngenta Participations Ag Semente de uma planta de milho transgênica, planta de milho transgênica, células e tecidos desta, molécula de ácido nucléico, amplicos, par de iniciadores de polinucleotídeos, método e kit de detecção da presença de uma molécula de ácido nucléico, molécula de dna, método para confirmar a ausência de uma molécula de ácido nucléico, amostra biológica e extrato derivados de planta, tecido, semente ou célula de milho do evento 5307, métodos de reprodução de uma planta de milho, de seleção auxiliada por marcadores para uma característica resistente a insetos em milho, e de produção de plantas de milho híbridas resistentes a insetos coleópteros, semente e plantas de milho híbridas, sítio-alvo de cromossomo de milho, e método de preparação de uma planta de milho transgênica
WO2010076212A1 (en) 2008-12-19 2010-07-08 Syngenta Participations Ag Transgenic sugar beet event gm rz13
KR101741266B1 (ko) 2009-01-07 2017-05-29 바스프아그로케미칼 프로덕츠 비.브이. 대두 이벤트 127 및 이에 관한 방법
JP5769698B2 (ja) 2009-03-30 2015-08-26 モンサント テクノロジー エルエルシー 遺伝子組換えイネ事象17314およびその使用方法
MY194828A (en) 2009-03-30 2022-12-19 Monsanto Technology Llc Rice transgenic event 17053 and methods of use thereof
AU2010284284B2 (en) 2009-08-19 2015-09-17 Corteva Agriscience Llc AAD-1 event DAS-40278-9, related transgenic corn lines, and event-specific identification thereof
MX351696B (es) 2009-09-17 2017-10-24 Monsanto Technology Llc Evento transgénico de soja mon 87708 y métodos de uso del mismo.
CN106399482B (zh) 2009-11-23 2021-04-27 拜尔作物科学股份有限公司 耐除草剂大豆植物及鉴定其的方法
BR112012012404B1 (pt) 2009-11-23 2019-03-06 Monsanto Technology Llc "molécula de dna reconbinante de amplicon, sonda de dna, par de moléculas de dna mètodo para detectar a presença de uma molècula de dna e kit de detecçao de dna".
UA109644C2 (uk) 2009-11-24 2015-09-25 СПОСІБ ВИЗНАЧЕННЯ ЗИГОТНОСТІ ПОДІЇ У РОСЛИНИ СОЇ, ЩО ВКЛЮЧАЄ AAD-12-ПОДІЮ pDAB4468-0416 У СОЇ
BR112012012494A2 (pt) 2009-11-24 2020-11-03 Dow Agrosciences Llc detecção de evento de soja aad-12 416
US8581046B2 (en) 2010-11-24 2013-11-12 Pioneer Hi-Bred International, Inc. Brassica gat event DP-073496-4 and compositions and methods for the identification and/or detection thereof
WO2011075595A1 (en) 2009-12-17 2011-06-23 Pioneer Hi-Bred International, Inc. Maize event dp-043a47-3 and methods for detection thereof
US20110154525A1 (en) 2009-12-17 2011-06-23 Pioneer Hi-Bred International, Inc. Maize event DP-040416-8 and methods for detection thereof
HUE045002T2 (hu) 2009-12-17 2019-11-28 Pioneer Hi Bred Int DP-004114-3 kukoricaesemény és ennek detektálási módszerei
US20110154524A1 (en) 2009-12-17 2011-06-23 Pioneer Hi-Bred International, Inc. Maize event DP-032316-8 and methods for detection thereof
JP5957447B2 (ja) 2010-06-04 2016-07-27 モンサント テクノロジー エルエルシー 遺伝子組換えアブラナ事象mon88302および同使用方法
BR112013005431A2 (pt) 2010-09-08 2016-06-07 Dow Agrosciences Llc "evento 1606 de aad-12 e linhagens de soja transgênica relacionadas".
JP6393478B2 (ja) 2010-10-12 2018-09-19 モンサント テクノロジー エルエルシー トランスジェニック事象mon87712に対応するダイズ植物および種子、ならびにそれを検出するための方法
WO2012071039A1 (en) 2010-11-24 2012-05-31 Pioner Hi-Bred International, Inc. Brassica gat event dp-061061-7 and compositions and methods for the identification and/or detection thereof
BR112013015745B1 (pt) 2010-12-03 2021-01-19 Ms Technologies, Llc polinucleotídeos referente ao evento de tolerância a herbicida 8291.45.36.2, cassete de expressão, sonda, bem como processos para identificação do evento, determinação da zigosidade, produção de uma planta de soja transgênica e produção de uma proteína em uma célula de planta
CN103561564B (zh) 2010-12-03 2016-11-16 陶氏益农公司 叠加的除草剂耐受性事件8264.44.06.1、相关转基因大豆系、及其检测
TWI667347B (zh) 2010-12-15 2019-08-01 瑞士商先正達合夥公司 大豆品種syht0h2及偵測其之組合物及方法
US8735661B2 (en) 2011-03-30 2014-05-27 Monsanto Technology Llc Cotton transgenic event MON 88701 and methods of use thereof
JP6223332B2 (ja) 2011-06-30 2017-11-01 モンサント テクノロジー エルエルシー 形質転換事象kk179−2に対応するアルファルファ植物および種子、ならびにその検出方法
AR087185A1 (es) 2011-07-13 2014-02-26 Dow Agrosciences Llc Evento 8264.42.32.1 de tolerancia apilada a los herbicidas, lineas de soja transgenicas relacionadas y su deteccion
WO2013012643A1 (en) 2011-07-15 2013-01-24 Syngenta Participations Ag Polynucleotides encoding trehalose-6-phosphate phosphatase and methods of use thereof
GB201200075D0 (en) * 2012-01-04 2012-02-15 Univ Nac De Rosario Grf3 mutants, methods and plants
US9359614B2 (en) 2012-02-01 2016-06-07 Dow Agrosciences Llc Class of glyphosate resistance genes
US20170219596A1 (en) 2014-07-14 2017-08-03 The Regents Of The University Of California A protein tagging system for in vivo single molecule imaging and control of gene transcription
JP6629321B2 (ja) 2014-08-05 2020-01-15 マブクエスト エスエーMabQuest SA 免疫学的試薬
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
EP3365357B1 (en) 2015-10-23 2024-02-14 President and Fellows of Harvard College Evolved cas9 proteins for gene editing
IL308426A (en) 2016-08-03 2024-01-01 Harvard College Adenosine nuclear base editors and their uses
WO2018136783A1 (en) 2017-01-20 2018-07-26 The Regents Of The University Of California Targeted gene activation in plants
WO2019158911A1 (en) * 2018-02-14 2019-08-22 Institute Of Genetics And Developmental Biology Chinese Academy Of Sciences Methods of increasing nutrient use efficiency
CN112251434A (zh) * 2019-07-05 2021-01-22 山东舜丰生物科技有限公司 一种miR396或其编码基因的突变体在调控植物农艺性状的应用

Also Published As

Publication number Publication date
MX2023014775A (es) 2024-01-15
UY39822A (es) 2022-12-30
WO2022266271A1 (en) 2022-12-22
EP4355083A1 (en) 2024-04-24
CA3223995A1 (en) 2022-12-22
US20220411813A1 (en) 2022-12-29
AR126172A1 (es) 2023-09-27

Similar Documents

Publication Publication Date Title
EP4291641A1 (en) Methods and compositions for modifying cytokinin oxidase levels in plants
US20220411813A1 (en) Modification of growth regulating factor family transcription factors in soybean
CN115697045B (zh) 控制分生组织大小以改良作物的方法
CN118843392A (zh) 植物中的避荫反应的抑制
CN118382634A (zh) 用于减少油菜荚果开裂的方法和组合物
CN118076742A (zh) 修饰油菜素内酯受体基因以改善产量性状
EP4298118A1 (en) Methods and compositions for modifying root architecture in plants
US20210371873A1 (en) Methods for controlling meristem size for crop improvement
CN119301147A (zh) 提高对镰孢菌头枯病的抗性的方法和组合物
CN119365481A (zh) 用于控制分生组织大小以进行作物改良的方法和组合物
WO2024006791A1 (en) Methods and compositions for controlling meristem size for crop improvement
CN119487055A (zh) 用于控制分生组织大小以进行作物改良的方法和组合物
AU2023243430A1 (en) Early flowering rosaceae plants with improved characteristics.
CN118613495A (zh) 用于改善小花育性和种子产量的方法
CN119325481A (zh) 用于改变根构型和/或改善植物产量性状的方法和组合物
CN119452082A (zh) 用于提高产量和抗病性的方法和组合物
CN119278208A (zh) 用于改善产量性状的方法和组合物
WO2024238902A1 (en) Methods and compositions for improving yield characteristics in plants
WO2025019522A1 (en) Methods and compositions for modifying root architecture in plants
CN119072487A (zh) 用于改善产量性状的油菜素类固醇受体基因的修饰
CN118434850A (zh) 用于改善小花能育性和种子产量的方法
CN118176205A (zh) 用于改善植物结构和产量性状的方法和组合物
CN118302434A (zh) 用于改善小花育性和种子产量的方法
CN118355126A (zh) 用于修饰植物中的细胞分裂素受体组氨酸激酶基因的组合物和方法
CN117794358A (zh) 用于增强根系发育的方法和组合物

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination