CN118382634A

CN118382634A - 用于减少油菜荚果开裂的方法和组合物

Info

Publication number: CN118382634A
Application number: CN202280075467.5A
Authority: CN
Inventors: B·C·W·克劳福德; N·格拉汉姆; L·G·马修
Original assignee: Pairing Plant Service Co ltd
Current assignee: Pairing Plant Service Co ltd
Priority date: 2021-09-21
Filing date: 2022-09-21
Publication date: 2024-07-23
Also published as: WO2023049720A1; CA3232804A1; AU2022352997A1; EP4405377A1; US20230087522A1

Abstract

本发明涉及用于修饰油菜植物中SHATTERPROOF MADS‑BOX(SHP)基因(任选地以减少荚果开裂)的组合物和方法。本发明还涉及使用本发明的方法和组合物产生的具有减少的荚果开裂的油菜植物。

Description

用于减少油菜荚果开裂的方法和组合物

优先权声明

本申请根据35 U.S.C.§119(e)要求于2021年9月21日提交的美国临时申请第63/246,512号的权益，该申请的全部内容通过引用并入本文。

关于电子提交序列表的声明

XML文本格式的序列表，标题为1499-73_ST26.xml，大小为556,402字节，在2022年9月7日生成并与本申请一起提交，该序列表通过引用将其公开内容并入本说明书。

技术领域

本发明涉及修饰油菜植物的SHATTERPROOF MADS-BOX(SHP)基因(任选地以减少荚果开裂)的组合物和方法。本发明还涉及使用本发明的方法和组合物产生的具有减少的荚果开裂的油菜植物。

背景技术

油菜籽油是一种来自各种油菜籽的植物油，与菜籽油相反的是其芥酸含量低。食用和工业形式的油都是由十字花科植物的几种栽培品种中的任一种的种子产生的，即甘蓝型油菜(Brassica napus L.)、油菜(Brassicarapa subsp.Oleifera)(白菜型油菜(syn.B.campestris L.))和/或芥菜(Brassicajuncea)的栽培品种，它们也称为“油菜”。油菜种子荚中含有黑色种子，这些种子被压榨以提取油。

油菜种子荚是一种果实，该果实在种子成熟时将其包裹并保护，然后在成熟时干燥并打开使种子散布。油菜果实有三个主要区域：瓣、隔膜和瓣缘。瓣是围绕发育中的种子并连接到隔膜的种子荚壁，隔膜形成将果实附着至植物的中脊。瓣缘(VM)在瓣和隔膜之间的边界处形成，专门用于种子散布。当果实成熟和干燥时，瓣沿着边缘从隔膜上脱落，这一过程称为裂开或荚果开裂。

三种特化的细胞类型有助于果实开口：边缘的两层：即分离层(或裂开区)和木质化的边缘层，以及木质化的瓣层(内果皮b)。瓣通过在分泌水解酶后发生的裂开区内细胞与细胞间的分离而脱落。木质化的边缘层和内部木质化的瓣层的木质化导致机械地促成果实开口的压力。随着果实干燥，剩余的薄壁瓣细胞相对于坚硬的木质化的边缘和瓣层的差异收缩被认为会产生内部张力，导致果实裂开的特征性开裂。

裂开的时间影响油菜的种子产量。油菜的果实在整个生长季节都会发育。最早的果实发育完全，而后来的果实仍在发育中。瓣缘中高度分化的细胞削弱了果实的强度，导致种子在成熟时散布。然而，荚果开裂是油菜商业性种子生产的一个高度不可取的性状，并且可以导致高达70％的显著油菜产量损失。一般来说，油菜籽是“风力传播的(windrowed)”，以减少因开裂而导致的种子损失，但此类做法并不完全有效，而且此类做法需大量劳动力。在收获期间，在存在高风速和极高温度的情况下，种子损失会进一步加速。

本发明的目的是通过提供减少油菜荚果开裂的新组合物和方法开发具有抗荚果开裂能力的油菜品种，因此可以直接收获现存作物而不会造成显著的种子损失。

发明内容

本发明的一方面提供了一种油菜植物或其植物部分，所述油菜植物或其植物部分包含编码Shatterproof MADS-box转录因子(SHP)多肽的内源性SHATTERPROOF MADS-BOX(SHP)基因中的至少一个突变，任选地，其中所述至少一个突变可以是非天然突变。

本发明的第二方面提供了一种包含编辑系统的油菜植物细胞，该编辑系统包含:(a)CRISPR-Cas效应蛋白；以及(b)引导核酸，其包含与编码油菜植物细胞中ShatterproofMADS-box转录因子(SHP)多肽的内源性靶基因互补的间隔序列。

本发明的第三方面提供了一种油菜植物细胞，所述油菜植物细胞包含内源性SHP基因中的至少一个突变，其中至少一个非天然突变是使用编辑系统引入的碱基置换、碱基插入或碱基缺失，所述编辑系统包含与内源性SHP基因中的靶位点结合的核酸结合结构域，任选地，其中所述至少一个突变可以是非天然突变。

本发明的第四方面提供了一种产生/育种无转基因的编辑的油菜植物的方法，所述方法包括：将本发明的油菜植物与无转基因的植物杂交，从而将至少一个突变引入无转基因的油菜植物中；以及选择包含至少一个突变且无转基因的子代油菜植物，从而产生无转基因的编辑的油菜植物，任选地，其中所述至少一个突变可以是非天然突变。

本发明的第五方面提供了一种提供多种具有一种或多种改善的产量性状的油菜植物的方法，所述方法包括在生长区域种植两种或更多种本发明的油菜植物，从而提供与没有至少一个突变的多种对照油菜植物相比，具有减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的表型的多种油菜植物，任选地，其中至少一个突变可以是非天然突变。

在第六方面，提供了一种在油菜植物中产生内源性SHATTERPROOFMADS-BOX(SHP)基因中的突变的方法，所述方法包括:(a)将基因编辑系统靶向内源性SHP基因的部分，该内源性SHP基因的部分：(i)包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个具有至少90％的序列同一性的序列；和/或(ii)编码与SEQ IDNO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的同一性的序列，和(b)选择包含位于内源性SHP基因的区域中的修饰的油菜植物，所述内源性SHP基因的区域与SEQ IDNO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个具有至少80％的序列同一性，任选地所述内源性SHP基因的区域与SEQ ID NO:75-82、85-92、107-112、116-120、124-127、129、135、136、139、140、156、157、159-161、164-166、181-184、187-190、195、196、212-219、222-224、229、230、246-248、251-253、255-257、261-264、267、268、271、272、275、276、279、280、283或285中任一个具有至少80％的序列同一性。

在第七方面，提供了一种用于在油菜植物细胞中产生ShatterproofMADS-box转录因子(SHP)多肽中的变异的方法，所述方法包括：将编辑系统引入油菜植物细胞，其中所述编辑系统靶向SHATTERPROOFMADS-BOX(SHP)基因的区域；并使SHP基因的区域与编辑系统接触，从而将突变引入SHP基因并在油菜植物细胞中产生SHP多肽中的变异。

第八方面提供了一种编辑油菜植物细胞基因组中特定位点的方法，所述方法包括：以位点特异性方式切割油菜植物细胞中内源性SHATTERPROOF MADS-BOX(SHP)基因中的靶位点，所述内源性SHP基因:(a)包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核苷酸序列，(b)包含与SEQ IDNO:72-96、103-144、151-1731、180-202、209-236、243-288或324-338中任一个具有至少80％的序列同一性的区域，(c)编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的氨基酸序列，(d)编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个的氨基酸序列具有至少80％的序列同一性的区域，从而在油菜植物细胞的内源性SHP基因中产生编辑，并产生包含内源性SHP基因中的编辑的油菜植物细胞。

第九方面提供了一种产生油菜植物的方法，所述方法包括：(a)使包含内源性SHATTERPROOF MADS-BOX(SHP)基因的油菜植物细胞群与连接至核酸结合结构域(例如，编辑系统)的核酸酶接触，该核酸结合结构域与以下序列结合:(i)所述序列与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个核苷酸序列具有至少80％的序列同一性，(ii)所述序列包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个具有至少80％的同一性的区域；(iii)所述序列编码与SEQ IDNO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的氨基酸序列，和/或(iv)所述序列编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的区域；(b)从内源性SHP基因已被突变的油菜植物细胞群中选择油菜植物细胞，从而产生包含内源性SHP基因中的突变的油菜植物细胞，和(c)将选择的油菜植物细胞生长成包含内源性SHP基因中的突变的油菜植物。

第十方面提供了一种减少油菜植物荚果开裂和/或荚果瓣边缘木质化(减少的木质素含量)的方法，所述方法包括：(a)使包含内源性SHATTERPROOF MADS-BOX(SHP)基因的油菜植物细胞与靶向内源性SHP基因的核酸酶接触，其中所述核酸酶与结合内源性SHP基因中靶位点的核酸结合结构域(例如，编辑系统)连接，其中所述内源性SHP基因：(i)包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核苷酸序列；(ii)包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列具有至少80％的序列同一性的区域；(iii)编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的SHP多肽；和/或(iv)编码与SEQ IDNO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的SHP多肽的区域，以产生包含内源性SHP基因中的突变的油菜植物细胞；和(b)将包含内源性SHP基因中的突变的油菜植物细胞生长成包含内源性SHP基因中的突变的油菜植物，从而产生具有突变的内源性SHP基因和减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的油菜植物。

第十一方面提供了一种产生油菜植物或其部分的方法，所述油菜植物或其部分包含至少一个具有突变的内源性SHATTERPROOF MADS-BOX(SHP)基因的细胞，所述方法包括使油菜植物或植物部分中内源性SHP基因的靶位点与包含切割结构域和核酸结合结构域的核酸酶接触，其中核酸结合结构域与内源性SHP基因中的靶位点结合，其中所述内源性SHP基因：(a)包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核苷酸序列；(b)包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列具有至少80％的序列同一性的区域；(c)编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的SHP多肽；和/或(d)编码与SEQID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的SHP多肽的区域，从而产生包含至少一个在内源性SHP基因中具有突变的细胞的油菜植物或其部分。

本发明的第十二方面提供了一种产生油菜植物或其部分的方法，所述油菜植物或其部分包含突变的内源性SHATTERPROOF MADS-BOX(SHP)基因，并表现出减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)，所述方法包括使油菜植物或植物部分内源性SHP基因中的靶位点与包含切割结构域和核酸结合结构域的核酸酶接触，其中核酸结合结构域与内源性SHP基因中的靶位点结合，其中内源性SHP基因:(a)包含与SEQ IDNO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核苷酸序列；(b)包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列具有至少80％的序列同一性的区域；(c)编码与SEQID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的SHP多肽；和/或(d)编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的SHP多肽的区域，从而产生所述油菜植物或其部分，所述油菜植物或其部分包含具有突变的内源性SHP基因，并且表现出减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)。

第十三方面提供了一种与SHATTERPROOF MADS-BOX(SHP)基因中的靶位点结合的引导核酸，其中所述靶位点在SHP基因的区域中，所述SHP基因的区域与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个具有至少80％的序列同一性，任选地，所述SHP基因的区域与SEQ ID NO:75-82、85-92、107-112、116-120、124-127、129、135、136、139、140、156、157、159-161、164-166、181-184、187-190、195、196、212-219、222-224、229、230、246-248、251-253、255-257、261-264、267、268、271、272、275、276、279、280、283或285中任一个具有至少80％的序列同一性。

在第十四方面中，提供了一种包含本发明的引导核酸和与引导核酸缔合的CRISPR-Cas效应蛋白的系统。

第十五方面提供了一种基因编辑系统，所述系统包含与引导核酸结合的CRISPR-Cas效应蛋白，其中引导核酸包含与内源性SHATTERPROOF MADS-BOX(SHP)基因结合的间隔序列。

在第十六方面，提供了一种包含引导核酸和CRISPR-Cas效应蛋白的复合物，所述CRISPR-Cas效应蛋白包含切割结构域，其中引导核酸与内源性SHATTERPROOF MADS-BOX(SHP)基因中的靶位点结合，其中内源性SHP基因:(a)包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核苷酸序列；(b)包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列具有至少80％的序列同一性的区域；(c)编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的SHP多肽；和/或(d)编码与SEQID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的SHP多肽的区域，并且所述切割结构域切割SHP基因中的靶链。

在第十七方面中，提供了一种表达盒，所述表达盒包含：(a)编码包含切割结构域的CRISPR-Cas效应蛋白的多核苷酸，和(b)与内源性SHATTERPROOF MADS-BOX(SHP)基因中的靶位点结合的引导核酸，其中引导核酸包含间隔序列，该间隔序列与以下互补并结合:(i)与SEQID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核酸的部分；(ii)与SEQ IDNO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个具有至少80％的序列同一性的核酸的部分；(iii)编码与SEQ IDNO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的氨基酸序列的核酸的部分；和/或(iv)编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的同一性的氨基酸序列的核酸的部分。

在另一方面，提供了通过本发明方法产生的在其基因组中包含一个或多个突变的SHATTERPROOF MADS-BOX(SHP)基因的植物，任选地，其中至少一个突变可以是非天然突变，任选地，其中突变的SHP基因包含与SEQ ID NO:298、300、302、304、306、308、310、312、314、316、318、319、321、322或323中任一个具有至少90％的序列同一性的核苷酸序列和/或编码与SEQ ID NO:299、301、303、305、307、309、311、313、315或317中任一个具有至少90％的序列同一性的SHP多肽。

本发明的另一方面提供了一种油菜植物或其植物部分，所述油菜植物或其植物部分包含至少一种内源性SHATTERPROOF MADS-BOX(SHP)基因中的至少一个突变，所述基因具有BnaA04g01810D(SHP3)、BnaA07g18050D(SHP2)、BnaA05g02990D(SHP4)、BnaA09g55330D(SHP1)、BnaC04g23360D(SHP3)和/或BnaC06g16910D(SHP2)的基因识别号(基因ID)，任选地，其中至少一个突变可以是非天然突变。

在另一方面，提供了一种引导核酸，其与SHATTERPROOF MADS-BOX(SHP)基因中的靶核酸结合，所述SHATTERPROOF MADS-BOX(SHP)基因具有BnaA04g01810D(SHP3)、BnaA07g18050D(SHP2)、BnaA05g02990D(SHP4)、BnaA09g55330D(SHP1)、BnaC04g23360D(SHP3)和/或BnaC06g16910D(SHP2)的基因识别号(基因ID)。还提供了用于产生本发明的油菜植物的多肽、多核苷酸、核酸构建体、表达盒和载体。

本发明的这些和其它方面在下文对本发明的描述中更详细地阐述。

序列的简要描述

SEQ ID NO:1-17是用于本发明的示例性Cas12a氨基酸序列。

SEQ ID NO:18-20是用于本发明的示例性Cas12a核苷酸序列。

SEQ ID NO:21-22是编码启动子和内含子的示例性调控序列。

SEQ ID NO:23-29是用于本发明的示例性胞嘧啶脱氨酶序列。

SEQ ID NO:30-40是用于本发明的示例性腺嘌呤脱氨酶氨基酸序列。

SEQ ID NO:41是用于本发明的示例性尿嘧啶DNA糖基化酶抑制剂(UGI)序列。

SEQ ID NO:42-44提供了用于本发明的实例肽标签和亲和多肽。

SEQ ID NO:45-55提供了用于本发明的实例RNA募集基序和相应的亲和多肽。

SEQ ID NO:56-67是用于本发明的示例性Cas9多肽序列。

SEQ ID NO:58-68是用于本发明的示例性Cas9多核苷酸序列。

SEQ ID NO:69(BnaA04g01810D)是来自油菜的实例SHP3(SHP3A)基因组序列。

SEQ ID NO:70是来自油菜的实例SHP3(SHP3A)编码序列。

SEQ ID NO:71是来自油菜的实例SHP3(SHP3A)多肽序列。

SEQ ID NO:72-96是来自油菜(BnaA04g01810D，SHP3A)的SHP3基因组序列和编码序列的实例部分或区域。

SEQ ID NO:97-99是来自油菜(SHP3A)的SHP3多肽的实例部分或区域。

SEQ ID NO:100(BnaA07g18050D)是来自油菜的实例SHP2(SHP2A)基因组序列。

SEQ ID NO:101是来自油菜的实例SHP2(SHP2A)编码序列。

SEQ ID NO:102是来自油菜的实例SHP2(SHP2A)多肽序列。

SEQ ID NO:103-144是来自油菜(BnaA07g18050D，SHP2A)的SHP2基因组序列和编码序列的实例部分或区域。

SEQ ID NO:145-147是来自油菜(SHP2A)的SHP2多肽的实例部分或区域。

SEQ ID NO:148(BnaA05g02990D)是来自油菜的实例SHP4(SHP4A)基因组序列。

SEQ ID NO:149是来自油菜的实例SHP4(SHP4A)编码序列。

SEQ ID NO:150是来自油菜的实例SHP4(SHP4A)多肽序列。

SEQ ID NO:151-173和324-338是来自油菜(BnaA05g02990D，SHP4A)的SHP4基因组序列和编码序列的实例部分或区域。

SEQ ID NO:174-176是来自油菜(SHP4A)的SHP4多肽的实例部分或区域。

SEQ ID NO:177(BnaA09g55330D)是来自油菜的实例SHP1(SHP1A)基因组序列。

SEQ ID NO:178是来自油菜的实例SHP1(SHP1A)编码序列。

SEQ ID NO:179是来自油菜(SHP1A)的实例SHP1多肽序列。

SEQ ID NO:180-202是油菜SHP1基因组序列和编码序列(BnaA09g55330D，SHP1A)的实例部分或区域。

SEQ ID NO:203-205是来自油菜(SHP1A)的SHP1多肽的实例部分或区域。

SEQ ID NO:206(BnaC04g23360D)是来自油菜的实例SHP3(SHP3C)基因组序列。

SEQ ID NO:207是来自油菜的实例SHP3(SHP3C)编码序列。

SEQ ID NO:208是来自油菜的实例SHP3(SHP3C)多肽序列。

SEQ ID NO:209-236是来自油菜(BnaC04g23360D，SHP3C)的SHP3基因组序列和编码序列的实例部分或区域。

SEQ ID NO:237-239是来自油菜(SHP3C)的SHP3多肽的实例部分或区域。

SEQ ID NO:240(BnaC06g16910D)是来自油菜的实例SHP2(SHP2C)基因组序列。

SEQ ID NO:241是来自油菜的实例SHP2(SHP2C)编码序列。

SEQ ID NO:242是来自油菜的实例SHP2(SHP2C)多肽序列。

SEQ ID NO:243-288是来自油菜(BnaC06g16910D，SHP2C)的SHP2基因组序列和编码序列的实例部分或区域。

SEQ ID NO:289-291是来自油菜(SHP2C)的SHP2多肽的实例部分或区域。

SEQ ID NO:292-297和342-346是用于本发明的核酸引导物的实例间隔序列。

SEQ ID NO:298、300、302、306、312、314和321是使用本发明方法产生的实例突变的SHP2(SHP2A)基因组序列(BnA07g18050D，SEQID NO:100)。

SEQ ID NO:299、301、303、307、313和315是分别由SEQ ID NO:298、300、302、309、312和314的突变的SHP2基因组序列编码的实例突变的SHP2(SHP2A)多肽序列。

SEQ ID NO:304、308、310、316、318和319是使用本发明方法产生的实例突变的SHP2(SHP2C)基因组序列(BnaC06g16910D，SEQ IDNO:240)。

SEQ ID NO:305、309、311和317是分别由SEQ ID NO:304、308、310和316的突变的SHP2基因组序列编码的实例突变的SHP2(SHP2C)多肽序列。

SEQ ID NO:320是SHP2C基因(BnaC06g16910D，SEQ ID NO:240)的实例缺失的部分。

SEQ ID NO:322和SEQ ID NO:323是使用本发明方法产生的实例突变的SHP4(SHP4A)基因组序列(BnaA05g02990D，SEQ ID NO:148)。

具体实施方式

现在将在下文中参考附图和实施例来描述本发明，在附图和实施例中示出了本发明的实施方案。该描述并不旨在成为可实施本发明的所有不同方式或可添加到本发明的所有特征的详细目录。例如，关于一个实施方案示出的特征可以合并到其它实施方案中，并且关于特定实施方案示出的特征可以从该实施方案中删除。因此，本发明预期在本发明的一些实施方案中，可以排除或省略本文阐述的任何特征或特征的组合。另外，根据本公开，对本文提出的各种实施方案的多种变化和添加对于本领域技术人员来说将是显而易见的，这些变化和添加不背离本发明。因此，以下描述旨在说明本发明的一些特定实施方案，而不是穷举地指定其所有排列、组合和变化。

除非另外定义，本文中使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同含义。本文中在本发明的描述中使用的术语仅用于描述特定实施方案的目的，并且不旨在限制本发明。

本文引用的所有出版物、专利申请、专利和其它参考文献均通过引用以其整体并入，以用于与其中呈现参考文献的句子和/或段落相关的教导。

除非上下文另有说明，否则具体意在本文描述的本发明的各种特征可以以任何组合使用。此外，本发明还考虑到在本发明的一些实施方案中，可以排除或省略本文阐述的任何特征或特征的组合。为了说明，如果说明书陈述组合物包含组分A、B和C，则具体意在A、B或C中的任一个或其组合可以单独地或以任何组合地被省略和放弃。

如本发明的描述和所附权利要求中所使用的，单数形式“一种”、“一个”和“该/所述”也旨在包括复数形式，除非上下文明确地另有说明。

同样如本文所使用的，“和/或”是指并涵盖一个或多个相关的列出项目的任何和所有可能的组合，以及当以替代方式(“或”)解释时缺少组合。

如本文所用的术语“约”当指可测量值诸如量或浓度等时，意在涵盖规定值的±10％、±5％、±1％、±0.5％或甚至±0.1％的变化以及规定值。例如，“约X”，其中X是可测量值，意在包括X以及X的±10％、±5％、±1％、±0.5％或甚至±0.1％的变化。本文提供的可测量值的范围可以包括其中的任何其它范围和/或单个值。

如本文所用，短语诸如“在X和Y之间”和“在约X和Y之间”应当解释为包括X和Y。如本文所用，短语诸如“在约X和Y之间”是指“在约X和约Y之间”，短语诸如“从约X到Y”是指“从约X到约Y”。

除非本文另有说明，本文中数值范围的列举仅旨在用作单独提及落入该范围内的每个单独值的简写方法，并且每个单独值并入说明书中，如同其在本文中被单独描述一样。例如，如果公开了范围10至15，则也公开了11、12、13和14。

如本文所用的术语“包含”指定所陈述的特征、整数、步骤、操作、元件和/或组件的存在，但不排除一个或多个其它特征、整数、步骤、操作、元件、组件和/或其组的存在或添加。

如本文所用，过渡短语“基本上由......组成”意味着权利要求的范围应被解释为涵盖权利要求中列举的指定材料或步骤以及不实质上影响所要求保护的发明的基本和新颖特征的那些材料或步骤。因此，当用在本发明的权利要求中时，术语“基本上由......组成”不旨在被解释为等同于“包含”。

如本文所用，术语“增加”、“增强”(及其语法变体)描述了与对照相比，至少约5％、10％、15％、20％、25％、50％、75％、100％、150％、200％、300％、400％、500％或更多的升高。例如，如本文所述的包含SHATTERPROOF MADS-BOX(SHP)基因中的突变的油菜植物可以表现出可收获的种子的增加，其中可收获的种子的增加比对照植物产生的种子增加至少10％(例如，可收获的种子增加至少约10％至约70％，例如约10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％或70％，或其中的任何范围或值)。

如本文所用，术语“减少”、“减小”和“降低”(及其语法变体)描述，例如，与对照相比，至少约5％、10％、15％、20％、25％、35％、50％、75％、80％、85％、90％、95％、96％、97％、98％、99％、99.5％、99.6％、99.7％、99.8％、99.9％或100％的减少。在特定实施方案中，减少可导致没有或基本上没有(即，不显著的量，例如，小于约10％或甚至5％)可检测的活性或量。作为实例，与没有至少一个突变的对照油菜植物相比，本文所述的包含SHATTERPROOF MADS-BOX(SHP)基因中的突变的油菜植物可以表现出至少10％的荚果开裂减少(例如，荚果开裂减少至少约10％至约100％，例如，约10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41，42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％，或其中的任何范围或值)。

对照油菜植物通常与编辑的植物是同一植物，但对照植物没有经过类似的编辑，因此没有突变。对照植物可能是同基因植物和/或野生型植物。因此，对照植物可以是与本文所述的突变渐渗的受试植物相同的育种系、品种或培育品种，但对照育种系、品种或培育品种没有突变。在一些实施方案中，本发明的油菜植物和对照油菜植物之间的比较是在相同的生长条件下进行的，例如，相同的环境条件(土壤、水分、光、热、养分等)。

如本文所用，关于核酸分子和/或核苷酸序列(例如，RNA或DNA)的术语“表达”等表示核酸分子和/或核苷酸序列被转录并且任选地被翻译。因此，核酸分子和/或核苷酸序列可以表达感兴趣的多肽或例如功能性非翻译RNA。

“异源”或“重组”核苷酸序列是与其引入的宿主细胞不天然相关的核苷酸序列，包括天然存在的核苷酸序列的非天然存在的多个拷贝。“异源”核苷酸/多肽可以源自外来物种，或者，如果源自相同物种，则通过有意的人为干预在组成和/或基因组基因座上对其天然形式进行了实质性修饰。

“天然”或“野生型”核酸、核苷酸序列、多肽或氨基酸序列是指天然存在或内源性的核酸、核苷酸序列、多肽或氨基序列。在某些情况下，“野生型”核酸是未按本文所述编辑的核酸，并且可以不同于可按本文所述编辑的“内源性”基因(例如，突变的内源性基因)。在某些情况下，“野生型”核酸(例如，未编辑的)可能与发现野生型核酸的生物体(例如，转基因生物体)异源。例如，“野生型内源性SHATTERPROOF MADS-BOX(SHP)基因”是在参考生物体(例如油菜植物)中天然存在或与参考生物体内源性的SHP基因，并且可以如本文所述进行修饰，之后，此类修饰的内源性基因不再是野生型的。在一些实施方案中，内源性SHP基因可以是内源性SHP1基因、内源性SHP2基因、内源性SHP3基因和/或内源性SHP4基因，任选地其中内源性SHP基因具有BnaA04g01810D(SHP3A)、BnaA07g18050D(SHP2A)、BnaA05g02990D(SHP4A)、BnaA09g55330D(SHP1A)、BnaC04g23360D(SHP3C)和/或BnaC06g16910D(SHP2C)基因识别号(基因ID)(BrassicaEDB——芸苔属作物的基因表达数据库(brassica.biodb.org/analysis)或plants.ensembl.org)。

如本文所用，术语“杂合的”是指其中不同等位基因位于同源染色体上的相应基因座处的遗传状态。

如本文所用，术语“纯合的”是指其中相同等位基因位于同源染色体上的相应基因座处的遗传状态。

如本文所用，术语“等位基因”是指在特定基因座处出现的两种或更多种不同核苷酸或核苷酸序列之一。

“无效等位基因”是由基因突变引起的无功能等位基因，其导致相应蛋白质的产生完全缺乏或产生无功能的蛋白质。

“隐性突变”是基因中的当纯合时产生表型但当基因座杂合时表型不可观察到的突变。

“显性突变”是基因中在基因的非突变拷贝的存在下产生突变表型的突变。显性突变可以是功能丧失或功能获得突变、亚效等位基因突变、超等位基因突变或弱功能丧失或弱功能获得突变。

“显性负性突变”是产生改变的基因产物(例如，相对于野生型具有异常功能)的突变，所述基因产物不利地影响野生型等位基因或基因产物的功能。例如，“显性负性突变”可以阻断野生型基因产物的功能。显性负性突变也可称为“反效等位基因突变”。

“半显性突变”是指杂合生物体中表型的外显率小于纯合生物体中观察到的表型外显率的突变。

“弱功能丧失突变”是导致基因产物与野生型基因产物相比具有部分功能或功能降低(部分失活)的突变。

“亚效等位基因突变”是导致基因功能部分丧失的突变，其可以通过表达减少(例如，蛋白质减少和/或RNA减少)或功能性能降低(例如，活性降低)而发生，但不是完全丧失功能/活性。“亚效”等位基因是由基因突变引起的半功能等位基因，其导致产生以正常效率的1％-99％之间的任何水平发挥作用的相应蛋白质。

“超等位基因突变”是导致基因产物的表达增加和/或基因产物的活性增加的突变。

“基因座”是染色体上基因或标记或等位基因所在的位置。在一些实施方案中，基因座可涵盖一个或多个核苷酸。

如本文所用，术语“所需等位基因”、“靶等位基因”和/或“感兴趣的等位基因”可互换使用以指与所需性状相关的等位基因。在一些实施方案中，所需等位基因可以与给定性状的增加或减少(相对于对照)相关，这取决于所需表型的性质。

当所述性状与标记连锁时，并且当该标记的存在是包含该标记的植物/种质中是否和/或以何种程度出现所需性状或性状形式的指示时，该标记与该性状“相关”。类似地，当标记与等位基因或染色体区间连锁并且当标记的存在是等位基因或染色体区间是否存在于包含标记的植物/种质中的指示时，该标记与该等位基因或染色体区间“相关”。

如本文所用，术语“回交是指子代植物与其亲本之一杂交一次或多次(例如1、2、3、4、5、6、7、8次等)。在回交方案中，“供体”亲本是指具有要渗入的所需基因或基因座的亲本植物。“受体”亲本(使用一次或多次)或“轮回”亲本(使用两次或更多次)是指基因或基因座渗入其中的亲本植物。例如，参见Ragot,M.等人，Marker-assisted Backcrossing:APracticalExample,in TECHNIQUES ET UTILISATIONS DES MARQUEURSMOLECULAIRES LESCOLLOQUES,Vol.72,第45-56页(1995)；和Openshaw等人，Marker-assisted Selection inBackcross Breeding,inPROCEEDINGS OF THE SYMPOSIUM"ANALYSIS OF MOLECULARMARKERDATA,"第41-43页(1994)。初始的杂交产生F1代。术语“BC1”是指轮回亲本的第二次使用，“BC2”是指轮回亲本的第三次使用，依此类推。

如本文所用，术语“杂交”是指通过授粉的配子融合以产生子代(例如，细胞、种子或植物)。该术语涵盖有性杂交(一株植物通过另一株植物授粉)和自交(自花授粉，例如当花粉和胚珠来自同一植物时)。术语“杂交”是指通过授粉融合配子以产生子代的行为。

如本文所用，术语“基因渗入”是指一个或多个遗传基因座的所需等位基因或所需等位基因的组合从一种遗传背景到另一种遗传背景的天然和人工传递。例如，特定基因座处的所需等位基因可以通过同一物种的两个亲本之间的有性杂交传递给至少一个(例如，一个或多个)子代，其中至少一个亲本在其基因中具有所需等位基因。备选地，例如，等位基因的传递可以通过两个供体基因组之间的重组而发生，例如在融合的原生质体中，其中至少一个供体原生质体在其基因组中具有所需的等位基因。所需的等位基因可以是标记、QTL、转基因等的选定等位基因。包含所需等位基因的子代可以与具有所需遗传背景的品系回交一次或多次(例如，1、2、3、4或更多次)，针对所需等位基因进行选择，结果是所需等位基因固定在所需的遗传背景中。例如，与非水胁迫条件下增加的产量相关的标记可以从供体渗入到不包含该标记并且在非水胁迫条件下不表现出增加的产量的轮回亲本中。然后可以将所得子代回交一次或多次并进行选择，直到子代拥有与轮回亲本背景中非水胁迫条件下产量增加相关的遗传标记为止。

“遗传图谱”是对给定物种内一个或多个染色体上的基因座之间遗传连锁关系的描述，通常以图表或表格形式描绘。对于每个遗传图谱，基因座之间的距离是通过它们之间的重组频率来测量的。可以使用多种标记来检测基因座之间的重组。遗传图谱是做图群体、所用标记类型以及不同群体之间每个标记的多态性潜力的产物。基因座之间的顺序和遗传距离可以因遗传图谱而异。

如本文所用，术语“基因型”是指个体(或个体群体)在一个或多个遗传基因座处的遗传构成，与可观察和/或可检测和/或表现的性状(表型)形成对比。基因型是由个体从其亲本遗传的一个或多个已知基因座的等位基因定义的。术语基因型可用于指代个体在单个基因座、多个基因座处的遗传构成，或更一般地，术语基因型可用于指个体基因组中所有基因的遗传组成。基因型可以例如使用标记间接表征和/或通过核酸测序直接表征。

如本文所用，术语“种质”是指个体(例如植物)、一组个体(例如植物品系、品种或科)或衍生自品系、品种、物种或培养物的克隆的遗传物质或来自个体(例如植物)、一组个体(例如植物品系、品种或科)或衍生自品系、品种、物种或培养物的克隆的遗传物质。种质可以是生物体或细胞的一部分或者可以与生物体或细胞分开。一般来说，种质提供具有特定遗传组成的遗传物质，为生物体或细胞培养物的部分或全部遗传品质提供基础。如本文所用，种质包括可生长新植物的细胞、种子或组织，以及可培养成完整植物的植物部分(例如叶、茎、芽、根、花粉、细胞等)。

如本文所用，术语“栽培品种”和“品种”是指通过结构或遗传特征和/或性能可与同一物种内的其它品种区分开的一组相似植物。

如本文所用，术语“外来”、“外来品系”和“外来种质”是指非良种的任何植物、品系或种质。一般而言，外来植物/种质并非源自任何已知的优良植物或种质，而是被选择以将一种或多种所需的遗传元件引入育种计划中(例如，将新的等位基因引入育种计划中)。

如本文所用，术语“杂种”在植物育种的背景下是指通过将不同品系或品种或物种的植物杂交产生的遗传上不同的亲本的子代的植物，所述杂交包括但不限于两个自交系之间的杂交。

如本文所用，术语“近交”是指基本上纯合的植物或品种。该术语可以指在整个基因组中基本上纯合的植物或植物品种，或者关于特别感兴趣的基因组的一部分基本上纯合的植物或植物品种。

“单倍型”是个体在多个遗传基因座处的基因型，即等位基因的组合。通常，定义单倍型的遗传基因座在物理上和遗传上是连锁的，即在相同的染色体节段上。术语“单倍型”可以指特定基因座处的多态性，诸如单个标记基因座，或者沿着染色体节段的多个基因座处的多态性。

其中至少一种(例如，一种或多种，例如1、2、3或4种或更多种)内源性SHP基因(例如内源性SHP1基因、内源性SHP2基因、内源性SHP3基因和/或内源性SHP4基因)如本文所述被修饰(例如，包含如本文所述的修饰)的油菜植物与不包含(没有)至少一种内源性SHP基因中的修饰的油菜植物相比，可以具有减少的荚果开裂。在一些实施方案中，其中至少一种内源性SHP基因如本文所述被修饰的油菜植物可以在包含如本文所述修饰的至少一种内源性SHP基因的油菜植物的荚果瓣边缘中表现出减少的木质化(减少的木质素含量)。在一些实施方案中，与不包含(没有)至少一种内源性SHP基因中的修饰的油菜植物相比，其中至少一种内源性SHP基因被修饰的油菜植物可以表现出可收获的种子的增加。

如本文所用，“减少的荚果开裂”是指与没有至少一个突变的对照油菜植物相比，荚果开裂减少至少10％(例如，荚果开裂减少至少约10％至约100％，例如，减少约10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50，51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％，或其中的任何范围或值)。减少的荚果开裂可以导致可收获的种子的增加。

如本文所述，“减少的荚果瓣边缘木质化”是指与没有至少一个突变的对照油菜植物的荚果瓣边缘相比，在荚果瓣边缘可检测的木质素含量减少至少10％(例如，荚果瓣边缘木质化程度减少至少约10％至约100％，例如，荚果瓣边缘木质化程度减少约10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41，42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％或其中的任何范围或值，其中100％的减少意味着没有可检测的木质素(例如，荚果瓣边缘没有木质素染色))。减少的荚果瓣边缘木质化可导致减少的荚果开裂。

如本文所用，“可收获的种子的增加”是指与没有至少一个突变的对照油菜植物相比，可收获的种子增加至少10％(例如，可收获的种子增加至少约10％至约70％，例如，约10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49，50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％或70％，或其中的任何范围或值)。

如本文所用，“对照植物”是指不包含编辑的SHP基因或本文所述的基因的油菜植物，所述基因赋予减少的荚果开裂和/或增加的可收获的种子和/或减少的荚果瓣边缘木质化(减少的木质素含量)的改变的表型。对照油菜植物用于鉴定和选择如本文所述编辑的并且与对照油菜植物相比具有增强的性状或改变的表型的油菜植物。合适的对照植物可以是用于产生包含一种或多种突变的SHP基因的植物的亲本系的植物，例如，如本文所述的缺乏内源性SHP基因中的编辑的野生型植物。合适的对照植物也可以是含有赋予其它性状的重组核酸的植物，例如具有增强的除草剂耐受性的转基因植物。在一些情况下，合适的油菜对照植物可以是杂合子或半合子转基因油菜植物品系的子代，所述油菜植物品系缺乏如本文所述的突变的SHP基因，称其为负分离体或负性同基因系。

增强的性状(例如，改善的产量性状)可以包括，例如，与对照植物相比，减少的从种植到成熟的天数，增加的茎大小、增加的叶数、增加的营养阶段株高生长速率、增加的穗大小、增加的每株植物穗干重、增加的每穗籽粒数、增加的每籽粒重量、增加的每株籽粒数、减少的穗空、延长的灌浆期、降低的株高、增加的根分枝数量、增加的总根长、增加的产量(例如，可收获的种子增加)、提高的氮利用效率和/或提高的水利用效率。改变的表型可以是，例如，株高、生物量、冠层面积、花青素含量、叶绿素含量、施用的水、含水量和水利用效率。

在一些实施方案中，本发明的植物可以包括一种或多种改善的产量性状，包括但不限于。在一些实施方案中，与没有至少一个突变的对照植物相比，一种或多种改善的产量性状包括更高的产量(蒲式耳/英亩)、增加的生物量、增加的株高、增加的茎直径、增加的叶面积、增加的花数、增加的籽粒行数(任选地，其中穗长没有显著减少)、增加的籽粒数、增加的籽粒大小、增加的穗长、减少的分蘖数、减少的雄穗分枝数、增加的荚果数量(包括增加的每个节点的荚果数和/或增加的每株荚果数)、每个荚果增加的种子数量、增加的种子数量、增加的种子大小和/或增加的种子重量(例如，增加的百粒种子重量)。在一些实施方案中，本发明的植物可以包括一种或多种改善的产量性状，包括但不限于与对照植物或其部分相比，任选地，产量(蒲式耳/英亩)、种子大小(包括籽粒大小)、种子重量(包括籽粒重量)的增加、增加的籽粒行数(任选地，其中穗长没有显著减少)、增加的荚果数量、每个荚果增加的种子数量以及增加的穗长。

如本文所用，“性状”是植物或特定植物材料或细胞的生理学、形态学、生物化学或物理特征。在一些情况下，该特征是人眼可见的并且可以机械地测量，诸如种子或植物的大小、重量、形状、形式、长度、高度、生长速率和发育阶段，或者可以通过生物化学技术测量，诸如检测种子或叶的蛋白质、淀粉、某些代谢物或油含量，或通过观察代谢或生理过程而测量，例如，通过测量对缺水或特定盐或糖浓度的耐受性，或通过测量一个或多个基因的表达水平而测量，例如，通过采用Northern分析、RT-PCR、微阵列基因表达测定或报告基因表达系统，或通过农业观察诸如高渗胁迫耐受性或产量而测量。然而，任何技术都可以用来测量转基因植物中任何选定的化学化合物或大分子的量、比较水平或差异。

如本文所用，“增强的性状”是指由如本文所述的SHP基因中的突变引起的油菜植物特征。此类性状包括但不限于，增强的农艺性状，其特征在于增强的植物形态学、生理学、生长和发育、产量、营养增强、病害或害虫抗性、或环境或化学耐受性。在一些实施方案中，增强的性状/改变的表型可以是，例如，从种植到成熟的天数减少、增加的茎大小、增加的叶数、增加的营养阶段株高生长速率、增加的穗大小、增加的每株植物穗干重、增加的每穗籽粒数、增加的每籽粒重量、增加的每株植物籽粒数、减少的穗空、延长的灌浆期、降低的株高、增加的根分枝数量、增加的总根长、耐旱性、提高的水利用效率、耐寒性、提高的氮利用效率和/或增加的产量。在一些实施方案中，性状是在非胁迫条件下增加的产量或在环境胁迫条件下增加的产量。胁迫条件可包括生物胁迫和非生物胁迫，例如，干旱、荫蔽、真菌病害、病毒病、细菌病、昆虫侵扰、线虫侵扰、低温暴露、热暴露、渗透胁迫、氮养分利用度降低、磷养分利用度降低和高植株密度。“产量”可以受到许多特性的影响，包括但不限于株高、植物生物量、荚果数、植株上的荚果位置、节间数、荚果开裂的发生率、谷粒大小、穗大小、穗尖灌浆度、籽粒败育、结瘤和固氮效率、养分同化效率、生物和非生物胁迫抗性、碳同化、植物结构、抗倒伏性、种子发芽率、幼苗活力和子苗性状。产量还可能受到以下因素的影响：发芽效率(包括胁迫条件下的发芽)、生长速率(包括胁迫条件下的生长速率)、开花时间和持续时间、穗数、穗大小、穗重量、每穗或荚果的种子数、种子大小、种子的成分(淀粉、油、蛋白质)和种子饱满的特征。

还如本文所用，术语“性状修饰”涵盖通过在包含如本文所述的内源性SHP基因中的突变的油菜植物中相对于不包含该突变的油菜植物(诸如野生植型物，或负分离体)产生可检测到的特征差异来改变天然存在的性状。在某些情况下，可以定量评估性状修饰。例如，与对照植物相比，性状修饰可以导致观察到的性状特征或表型的增加或减少。众所周知，在经过修饰的性状中可以存在自然变异。因此，与对照植物相比，观察到的性状修饰可以导致植物中性状特征或表型的正态分布和幅度的变化。

本发明涉及一种具有改善的经济相关特性的油菜植物，更具体地说，具有减少的荚果开裂、减少的荚果瓣边缘木质化(减少的木质素含量)和/或增加的可收获的种子产量的油菜植物。更具体地，本发明涉及一种油菜植物，该植物包含如本文所述的SHP基因中的突变，其中与没有所述突变的对照植物相比，油菜植物具有减少的荚果开裂、减少的荚果瓣边缘木质化(减少的木质素含量)和/或增加的可收获的种子产量。在一些实施方案中，本公开的油菜植物表现出与产量有关的改善的性状，包括但不限于增加的氮利用效率、增加的氮胁迫耐受性、增加的水利用效率和增加的耐旱性，如下文所定义和讨论的。

产量可以定义为作物的可测量的经济价值产生。产量可以在数量和/或质量的范围内定义。产量可以直接取决于几个因素，例如器官的数量和大小(例如花数)、植物结构(诸如分枝数、植物生物量，例如增加的根生物量、更陡的根角和/或更长的根等)、开花时间和持续时间、谷物灌浆期。根系结构和发育、光合效率、养分吸收、胁迫耐受性、早期活力、延迟衰老和功能性滞绿表型可能是决定产量的因素。因此，优化上述因素有助于提高作物产量。

本文提及的产量相关性状的增加/改善也可以被认为是指植物的一个或多个部分的生物量(重量)的增加，其可以包括地上和/或地下(可收获)植物部分。具体地，此类可收获部分是种子，并且本公开的方法的实施导致相对于合适的对照植物的种子产量具有增加的产量、特别是增加的种子产量的油菜植物。在一些实施方案中，本发明方法的实施导致的油菜植物相对于合适的对照油菜植物具有增加的可收获的种子(并因此增加了种子产量)，任选地，减少的荚果瓣边缘木质化(减少的木质素含量)，这是由于减少的荚果开裂导致的种子损失减少。术语植物的“产量”可以涉及该植物的营养生物量(根和/或枝条生物量)、繁殖器官和/或繁殖体(诸如种子)。

本公开的植物增加的产量可以通过多种方式测量，包括测试重量、每株植物的种子数、种子重量、每单位面积的种子数(例如，每英亩的种子或种子的重量)、每英亩蒲式耳数、每英亩吨数或每公顷公斤数。增加的产量可以通过改善关键生化化合物(诸如氮、磷和碳水化合物)的利用或改善对环境胁迫(诸如冷、热、干旱、盐、荫蔽、高植物密度以及害虫或病原体攻击)的反应来实现。

“增加的产量”可以表现为以下一种或多种：(i)植物的一个或多个部分，特别是植物的地上(可收获)部分的增加的植物生物量(重量)，增加的根生物量(增加的根数、增加根厚度、增加根长度)或增加的任何其它可收获部分的生物量；或(ii)增加的早期活力，本文定义为发芽后约三周的幼苗地上面积的提高。

“早期活力”是指活跃健康的植物生长，尤其是在植物生长的早期阶段，并且可以由于例如植物更好地适应其环境(例如，优化对能源的利用、对养分的吸收以及在芽和根之间分配碳)引起的植物适应度增加产生。例如，早期活力可以是种子在种植后发芽和出苗的能力以及幼苗在出苗后生长和发育的能力的组合。具有早期活力的植物还表现出增加的幼苗存活率和更好的作物种植，这通常导致高度均匀的田地，其中大多数植物基本上同时达到各个发育阶段，这通常导致产量增加。因此，早期活力可以通过测量各种因素来确定，诸如籽粒重量、发芽率、出苗率、幼苗生长、幼苗高度、根长、根和芽生物量、冠层大小和颜色等。

此外，增加的产量还可以表现为增加的总种子产量，这可以由于下列中的一种或多种所致：由于基于每株植物和/或单个种子的种子重量的增加所致的种子生物量(种子重量)的增加，例如，每株植物的花/圆锥花序数量增加；荚果数量增加；节数量增加；每个圆锥花序/植物的花(“小花”)数量增加；种子饱满率提高；饱满种子的数量增加；种子大小(长度、宽度、面积、周长和/或重量)的增加，这也会影响种子的组成；和/或种子体积增加，这也会影响种子的组成。在一个实施方案中，增加的产量可以是增加的种子产量，例如，增加的种子重量；增加的饱满种子数量；和/或增加的收获指数。

产量的增加还可以导致结构改变，或者可以由于植物结构改变而发生。

产量的增加也可以表现为收获指数的增加，收获指数表示为可收获部分(诸如种子)的产量与总生物量的比率。

本公开还延伸至植物的可收获部分，诸如但不限于种子、叶、果实、花、棉铃、荚果、长角果、坚果、茎、根茎、块茎和球茎。本公开还涉及源自此类植物的可收获部分的产品，诸如干颗粒、粉末、油、脂肪和脂肪酸、淀粉或蛋白质。

本公开提供了用于增加植物的“产量”或植物或植物部分的“泛英亩产量(broadacre yield)”的方法，其被定义为每单位面积可收获的植物部分，例如种子，或种子的重量，每英亩，每英亩磅数、每英亩蒲式耳数、每英亩吨数(tones per acre)、每英亩吨数、每公顷公斤数。

如本文所用，“氮利用效率”是指导致施用的每单位氮的植物产量、生物量、活力和生长速率增加的过程。这些过程可以包括植物对氮的吸收、同化、积累、信号传导、传感、再转移(在植物内)和利用。

如本文所用，“提高的氮利用效率”是指在经受与正常或标准条件下相同的可利用/施用量的氮时，植物比正常情况更快或更好地生长、发育或产出的能力；在经受低于最适的可利用/施用量的氮，或在氮限制条件下植物正常生长、发育或产出的能力，或更快或更好地生长、发育或产出的能力。

如本文所用，“氮限制条件”是指生长条件或环境，其提供低于植物充分或成功代谢、生长、繁殖成功和/或生存能力所需的氮最佳量。

如本文所用，“增加的氮胁迫耐受性”是指在经受低于最适的可利用/施用量的氮时，或在氮限制条件下植物正常生长、发育或产出的能力，或更快或更好地生长、发育或产出的能力。

植物氮利用效率的提高可以在田间转化为在供应较少的氮的同时收获相似数量的产量，或者通过供应最适/足够量的氮来获得增加的产量。提高的氮利用效率可以提高植物氮胁迫耐受性，还可以改善作物品质和种子的生化成分，诸如蛋白质产量和油产量。术语“增加的氮利用效率”、“提高的氮利用效率”和“氮胁迫耐受性”在本公开中可互换使用，是指在氮限制条件下具有提高的生产力的植物。

如本文所用，“水利用效率”是指每单位蒸腾的水蒸气被叶子同化的二氧化碳的量。它是控制干燥环境中植物生产力的最重要性状之一。“耐旱性”是指植物适应干旱或干旱条件的程度。植物对缺水的生理反应包括叶子枯萎、叶面积减小、叶离现象以及通过将养分引导到植物的地下部分来刺激根部生长。通常，植物在开花和种子发育(繁殖阶段)期间更容易受到干旱的影响，因为植物的资源被用来支持根系生长。此外，脱落酸(ABA)是一种植物应激激素，诱导叶片气孔(参与气体交换的微孔)关闭，从而减少蒸腾作用造成的水分损失，并降低光合作用速率。这些反应在短期内提高了植物的水利用效率。术语“增加的水利用效率”、“提高的水利用效率”和“增加的耐旱性”在本公开中可互换使用，是指在水限制条件下具有提高的生产力的植物。

如本文所用，“增加的水利用效率”是指在经受与正常或标准条件下相同的可利用/施用量的水时，植物比正常情况更快或更好地生长、发育或产出的能力；在经受减少的可利用/施用量的水(水输入)时，或在水分胁迫或缺水胁迫的条件下植物正常生长、发育或产出的能力，或更快或更好地生长、发育或产出的能力。

如本文所用，“增强的耐旱性”是指在经受减少的可利用/施用量的水和/或在短期或长期干旱的条件下，植物正常生长、发育或产出的能力，或者比正常情况更快或更好地生长、发育或产出的能力；在经受减少的可利用/施用量的水(水输入)时，或在缺水胁迫的条件下或短期或长期干旱的条件下植物正常生长、发育或产出的能力。

如本文所用，“干旱胁迫”是指导致缺水并使植物受到胁迫和/或对植物组织造成损害和/或对谷物/作物产量产生负面影响的干旱期(短期或长期/延长)；导致缺水和/或温度升高并使植物受到胁迫和/或对植物组织造成损害和/或对谷物/作物产量产生负面影响的干旱期(短期或长期/延长)。

如本文所用，“缺水”是指提供低于植物充分/成功的生长和发育所需的最适水量的条件或环境。

如本文所用，“水分胁迫”是指提供相对于植物/作物充分/成功的生长和发育所需的水量不适当(较少/不足或更多/过量)的水量的条件或环境，从而使植物受到胁迫和/或对植物组织造成损害和/或对谷物/作物产量产生负面影响。

如本文所用，“缺水胁迫”是指提供相对于植物/作物充分/成功的生长和发育所需的水量较少/不足的水量的条件或环境，从而使植物受到胁迫和/或对植物组织造成损害和/或对谷物产量产生负面影响。

如本文所用，术语“核酸”、“核酸分子”、“核苷酸序列”和“多核苷酸”是指线性或支链、单链或双链的RNA或DNA，或其杂交体。该术语还涵盖RNA/DNA杂交体。当合成产生dsRNA时，不太常见的碱基，诸如肌苷、5-甲基胞嘧啶、6-甲基腺嘌呤、次黄嘌呤等也可用于反义、dsRNA和核酶配对。例如，含有尿苷和胞苷的C-5丙炔类似物的多核苷酸已被证明以高亲和力结合RNA，并且是基因表达的有效反义抑制剂。也可以进行其它修饰，诸如对磷酸二酯骨架或RNA核糖基团中的2'-羟基的修饰。

如本文所用，术语“核苷酸序列”是指核苷酸的异聚物或这些核苷酸从核酸分子的5'至3'端的序列，包括DNA或RNA分子，包括cDNA、DNA片段或部分、基因组DNA、合成(例如化学合成)DNA、质粒DNA、mRNA和反义RNA，其中任一个都可以是单链或双链。术语“核苷酸序列”、“核酸”、“核酸分子”、“核酸构建体”、“寡核苷酸”和“多核苷酸”在本文中也可互换使用，以指代核苷酸的异聚物。本文提供的核酸分子和/或核苷酸序列在此从左到右以5'至3'方向呈现，并使用美国序列规则37 CFR§§1.821-1.825中规定的用于表示核苷酸字符的标准代码和世界知识产权组织(WIPO)标准ST.25表示。本文中使用的“5'区域”可以表示最接近多核苷酸5'端的多核苷酸区域。因此，例如，多核苷酸5'区域中的元素可以位于从位于多核苷酸5'端的第一个核苷酸到位于多核苷酸中间的核苷酸的任何位置。如本文中使用的“3'区域”可以表示最接近多核苷酸3'端的多核苷酸区域。因此，例如，多核苷酸3'区域中的元素可以位于从位于多核苷酸3'端的第一个核苷酸到位于多核苷酸中间的核苷酸的任何位置。

如本文所用，关于核酸，术语“片段”或“部分”是指相对于参考核酸长度减少的核酸(例如，减少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、400、450、500、550、600、650、700、750、800、850或900个或更多个核苷酸，或其中的任何范围或值)，并且包含下列核苷酸序列，或基本上由下列核苷酸序列组成和/或由下列核苷酸序列组成：与参考核酸的对应部分相同或几乎相同(例如，70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％相同)的连续核苷酸的核苷酸序列。在适当情况下，此类核酸片段可以包含在较大的多核苷酸中，所述核酸片段是所述较大的多核苷酸的组成部分。作为示例，本发明的引导核酸的重复序列可以包含野生型CRISPR-Cas重复序列的“部分”(例如，野生型CRISPR-Cas重复序列；例如，来自例如Cas9、Cas12a(Cpf1)、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b和/或Cas14c等的CRISPR Cas系统的重复序列)。

在一些实施方案中，核酸片段可包含下列连续核苷酸、基本上由下列连续核苷酸组成或由下列连续核苷酸组成：编码SHP多肽的核酸的约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、240、245、250、255、260、265、270、275、280、285、290、295、300、305、310、320、330、340、350、360、370、380、390、395、400、410、415、420、425、430、440、445、450、500、550、600、650、700、750、800、850、900、950、1000、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1900、2000、3000、4000或5000个或更多个连续核苷酸，或其中的任何范围或值，任选地，SHP基因的片段的长度可以是约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、110、115、120、125、130、135、140、145、150个连续核苷酸至约155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、240、245、250、255、260、265、270、275、280、285、290、295、300、305、310、315、320、325、330、340、345、350、355、360、365、370、375、380、385、390、395、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740或750个或更多个连续核苷酸，或其中的任何范围或值(例如，SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或141中任一个的片段或部分(例如，SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338))。

在一些实施方案中，“序列特异性核酸结合结构域”可以结合编码例如本文所述的Shatterproof MADS-box转录因子(SHP)多肽的核苷酸序列(例如DNA、RNA)的一个或多个片段或部分。

如本文中关于多肽所使用的，术语“片段”或“部分”可指长度相对于参考多肽减少的多肽，并且其包含以下、基本上由以下组成和/或由以下组成：与参考多肽的相应部分相同或几乎相同(例如90％、91％、92％、93％、94％、95％、96％、97％、98％、99％相同)的连续氨基酸的氨基酸序列。在适当的情况下，这样的多肽片段可以包含在它是其组成部分的更大多肽中。在一些实施方案中，多肽片段包含以下、基本上由以下组成或由以下组成：参考多肽的至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、260、270、280或290或更多个的连续氨基酸。在一些实施方案中，多肽片段可以包含下列连续氨基酸残基、基本上由下列连续氨基酸残基组成或由下列连续氨基酸残基组成：SHP的10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、110、120、130、140或150或更多个连续氨基酸残基，或其中的任何范围或值(例如，SEQ ID NO:71、102、150、179、208或242的任一种多肽的片段或部分(例如，SEQ IDNO:100-102、148-150、177-179、206-208、240-242或292-294))。在一些实施方案中，SHP多肽片段可以包含以下、基本上由以下组成或由以下组成：约13、59、63、64、68、69、71、72、76或77个连续氨基酸残基(参见，例如，SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291)。

在一些实施方案中，SHP多肽的片段可以是如本文所述由编码SHP多肽的SHP基因组序列的突变产生的截短的SHP多肽。例如，SHP多肽的片段可以是SHP多肽的N末端或其部分(参见例如，约前170-190个连续氨基酸残基(例如，前170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190个连续氨基酸残基，例如，前172至185(例如，172、173、174、175、176、178、179、180、181、182、183、184、185、186、187、188或189)个连续的氨基酸残基，以及其中的任何范围或值)(例如，SEQ ID NO:71、102、150、179、208或242)。在一些实施方案中，SHP多肽的片段可以是在编码SHP多肽的至少一种如本文所述的内源性基因(例如内源性SHP1基因、内源性SHP2基因、内源性SHP3基因和/或内源性SHP4基因)中产生的突变(例如，在油菜植物中的一种或多种内源性SHP基因中的缺失、插入等)的结果。在一些实施方案中，如本文所述编辑的SHP多肽是缺少约前170-190个连续氨基酸的N末端截短的多肽，参见例如，SEQ ID NO:299、301、303、305、307、309、311或317。在一些实施方案中，截短的SHP多肽(N末端片段)可以在截短的多肽的C末端包含至少一个氨基酸置换，所述氨基酸置换在内源性SHP基因编码的多肽中不存在(例如，在C末端置换1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸残基，任选1个氨基酸残基至约2、3、4、5、6、7、8、9或10个氨基酸残基)(参见例如，SEQ IDNO:313或SEQ ID NO:315)。

在一些实施方案中，SHP多肽的片段可以来自SHP多肽的C末端。例如，SHP多肽的片段可以是SHP多肽或其部分(例如，参见SEQ IDNO:97-99、145-147、174-176、203-205、237-239或289-291)的约最后76或77个连续氨基酸残基。在一些实施方案中，SHP多肽的片段可以包含由SHP基因的倒数第二个外显子和/或最后一个外显子编码的SHP多肽的部分。在一些实施方案中，SHP多肽的片段可以包含由除SHP基因的倒数第二个外显子和/或最后一个外显子以外的所有外显子编码的SHP多肽的部分。

在一些实施方案中，与不包含(没有)所述缺失的油菜植物相比，当所述缺失包含在油菜植物中时，所述缺失可以导致油菜植物表现出减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)。可以在一个或多于一个位置编辑SHP基因(并使用一个或多个不同的编辑工具)，从而提供包含一个或多于一个突变的SHP基因。在一些实施方案中，如本文所述突变的SHP多肽可以包含一个或多于一个编辑，其可导致多肽具有一个或多个氨基酸残基的缺失(例如，缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76或更多个连续氨基酸残基，以及其中的任何范围或值(例如，截短的多肽)，任选地缺失约100至约600个连续氨基酸残基(例如，约100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、350、360、370、370，390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590或600个，以及其中的任何范围或值)。

在一些实施方案中，参考核酸的“部分”或“区域”是指来自基因的至少2、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66，67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、210、220、230、240、250、260、270、280、285、290、300、310、320、330、350、360、370、380、390、395、400、405、410、415、420、425、430、435、440、445、450、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2500、3000、3500、4000、4500或5000个或更多个连续核苷酸(例如，来自SHP基因的连续核苷酸)，任选地，SHP基因的“部分”或“区域”的长度可以是约20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、105、110、115、120、125、130、135、140、145或150个连续核苷酸至约155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、240、245、250、255、260、265、270、275、280、285、290、295、300、305、310、315、320、325、330、340、345、350、355、360、365、370、375、380、385、390、395、400、410、420，430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740或750个或更多个连续核苷酸，或其中的任何范围或值(例如，SEQ IDNO:69、70、100、101、148、149、177、178、206、207、240或241中任一个的部分或区域(例如，SEQ ID NO:75-82、85-92、107-112、116-120、124-127、129、135、136、139、140、156、157、159-161、164-166、181-184、187-190、195、196、212-219、222-224、229、230、246-248、251-253、255-257、261-264、267、268、271、272、275、276、279、280、283或285))。

在一些实施方案中，SHP多肽序列的“部分”或“区域”的长度是约5至约200个或更多个连续氨基酸残基(例如，长度为约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、58、59，60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、176、177、178、179、180、181、812、183、184、185、186、187、188、189、190、195或200个或更多个的连续氨基酸残基(例如，SEQ ID NO:71、102、150、179、208或242中任一个的部分，任选地是SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291)(例如，SHP多肽的C末端部分，例如，SEQ ID NO:299、301、303、305、307、309或317)。

如本文中关于核酸所使用的，术语“功能性片段”是指编码多肽的功能性片段的核酸。关于多肽的“功能性片段”是保留天然参考多肽的一种或多种活性的多肽片段。

如本文所用，术语“基因”是指能够用于产生mRNA、反义RNA、miRNA、抗微小RNA反义寡脱氧核糖核苷酸(AMO)等的核酸分子。基因可以或不可以能够用于产生功能性蛋白质或基因产物。基因可以包括编码区和非编码区(例如，内含子、调控元件、启动子、增强子、终止序列和/或5'和3'非翻译区)两者。基因可以是“分离的”，这意味着基本上或实质上不含通常与天然状态的核酸相关的组分的核酸。这些组分包括其它细胞材料、来自重组生产的培养基和/或用于化学合成核酸的各种化学品。

术语“突变”是指点突变(例如，错义或无义，或导致移码的单碱基对的插入或缺失)、插入、缺失、倒位和/或截短。当突变是用另一个残基置换氨基酸序列中的一个残基时，或者是序列中一个或多个残基的缺失或插入时，通常通过标示原始残基、然后标示该残基在序列中的位置以及标示新置换的残基来描述突变。截短可以包括在多肽的C-末端或多肽的N-末端的截短。多肽的截短可以是编码多肽的基因的相应5'端或3'端缺失的结果。当一个或多个碱基对的缺失或插入被引入基因时，可以发生移码突变，任选地导致框外突变或框内突变。基因中的移码突变可以导致产生比野生型多肽更长、更短或相同长度的多肽，取决于第一个终止密码子何时出现在基因突变区域之后。作为实例，产生过早终止密码子的框外突变可以产生比野生型多肽短的多肽，或者，在一些实施方案中，多肽可以不存在/检测不到。DNA倒位是染色体区域内基因片段旋转的结果。

如本文所用，术语“互补的”或“互补性”是指多核苷酸在允许的盐和温度条件下通过碱基配对的天然结合。例如，序列“A-G-T”(5'至3')与互补序列“T-C-A”(3'至5')结合。两个单链分子之间的互补性可以是“部分的”，其中只有一些核苷酸结合，或者当单链分子之间存在完全互补性时，它可以是完全的。核酸链之间的互补程度对核酸链之间的杂交效率和强度有显著影响。

如本文所用，“互补体”可以表示与比较核苷酸序列的100％互补性，或者它可以表示与比较核苷酸序列的互补性小于100％(例如，约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％等的互补性)。

具有同源性的不同核酸或蛋白质在本文中称为“同源物”。术语同源物包括来自同一物种和其它物种的同源序列以及来自同一物种和其它物种的直系同源序列。“同源性”是指两个或更多个核酸和/或氨基酸序列之间的相似程度，以位置同一性(即序列相似性或同一性)的百分比表示。同源性也指不同核酸或蛋白质之间具有相似功能特性的概念。因此，本发明的组合物和方法还包括本发明的核苷酸序列和多肽序列的同源物。如本文所用，“直系同源”是指不同物种中的同源核苷酸序列和/或氨基酸序列，这些序列在物种形成过程中产生于共同的祖先基因。本发明的核苷酸序列的同源物与本发明的所述核苷酸序列具有实质性的序列同一性(例如，至少约70％、71％、72％、73％、74％、75％、76％、77％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％或100％)。

如本文所用，“序列同一性”是指两个最佳比对的多核苷酸或多肽序列在整个组分(例如核苷酸或氨基酸)比对窗中不变的程度。“同一性”可以很容易地通过已知的方法计算，包括但不限于以下方法：Computational Molecular Biology(Lesk,A.M.编辑)OxfordUniversityPress,New York(1988)；Biocomputing:Informatics and Genome Projects(Smith,D.W.编辑)Academic Press,New York(1993)；ComputerAnalysis of SequenceData,Part I(Griffin,A.M.和Griffin,H.G.编辑)Humana Press,New Jersey(1994)；Sequence Analysis in MolecularBiology(von Heinje,G.编辑)Academic Press(1987)；和SequenceAnalysis Primer(Gribskov,M.和Devereux,J.编辑)Stockton Press,NewYork(1991)。

如本文所用，术语“百分比序列同一性”或“百分比同一性”是指当两个序列最佳比对时，与测试(“对象”)多核苷酸分子(或其互补链)相比，参考(“查询”)多核苷酸分子(或其互补链)的线性多核苷酸序列中相同核苷酸的百分比。在一些实施方案中，“百分比序列同一性”可以指与参考多肽相比，氨基酸序列中相同氨基酸的百分比。

如本文所用，短语“基本上相同”或“实质同一性”在两个核酸分子、核苷酸序列或多肽序列的情形中，是指两个或更多个序列或子序列，当比较和比对最大对应关系时，使用以下序列比较算法之一或目视检查进行测量，其具有至少约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％或100％的核苷酸或氨基酸残基同一性。在本发明的一些实施方案中，在本发明的核苷酸序列的连续核苷酸区域存在实质同一性，所述区域的长度为约10个核苷酸至约20个核苷酸，约10个核苷酸至约25个核苷酸，约10个核苷酸至约30个核苷酸，约15个核苷酸至约25个核苷酸，约30个核苷酸至约40个核苷酸，约50个核苷酸至约60个核苷酸，约70个核苷酸至约80个核苷酸，约90个核苷酸至约100个核苷酸，约100个核苷酸至约200个核苷酸，约100个核苷酸至约300个核苷酸，约100个核苷酸至约400个核苷酸，约100个核苷酸至约500个核苷酸，约100个核苷酸至约600个核苷酸，约100个核苷酸至约800个核苷酸，约100个核苷酸至约900个核苷酸，或更多个核苷酸，或其中的任何范围，至多达全长序列。在一些实施方案中，在至少约20个核苷酸(例如，约20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、50、60、70或80个核苷酸或更多个核苷酸)的范围内核苷酸序列可以是基本上相同的。

在本发明的一些实施方案中，在本发明的多肽的连续氨基酸残基区域存在实质同一性，所述区域的长度为约3个氨基酸残基至约20个氨基酸残基，约5个氨基酸残基至约25个氨基酸残基，约7个氨基酸残基至约30个氨基酸残基，约10个氨基酸残基至约25个氨基酸残基，约15个氨基酸残基至约30个氨基酸残基，约20个氨基酸残基至约40个氨基酸残基，约25个氨基酸残基至约40个氨基酸残基，约25个氨基酸残基至约50个氨基酸残基，约30个氨基酸残基至约50个氨基酸残基，约40个氨基酸残基至约50个氨基酸残基，约40个氨基酸残基至约70个氨基酸残基，约50个氨基酸残基至约70个氨基酸残基，约60个氨基酸残基至约80个氨基酸残基，约70个氨基酸残基至约80个氨基酸残基，约90个氨基酸残基至约100个氨基酸残基，或更多个氨基酸残基，以及其中的任何范围，至多达全长序列。在一些实施方案中，多肽序列可以在至少约8个连续氨基酸残基(例如，长度为约8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、130、140、150、175、200、225、250、300、350个或更多个氨基酸或更多个连续氨基酸残基)的范围与另一个序列基本上相同。在一些实施方案中，两种或更多种SHP多肽在至少8个连续氨基酸至约350个连续氨基酸之间可以是相同或基本上相同的(例如，至少70％至99.9％相同；例如，约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％、99.9％相同，或其中的任何范围或值)。在一些实施方案中，两种或更多种SHP多肽可以在至少8、9、10、11、12、13、14或15个连续氨基酸至约20、21、22、23、24，25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个连续氨基酸上相同或基本上相同)。

对于序列比较，通常一个序列充当与测试序列比较的参考序列。当使用序列比较算法时，将测试序列和参考序列输入计算机，必要时指定子序列坐标，并指定序列算法程序参数。然后，序列比较算法根据指定的程序参数计算测试序列相对于参考序列的序列同一性百分比。

用于比对比较窗口的序列最佳比对是本领域技术人员所熟知的，并且可以通过诸如Smith和Waterman的局部同源算法，Needleman和Wunsch的同源比对算法，Pearson和Lipman的相似性搜索方法等工具进行，并且任选地通过这些算法的计算机化形式来实施，诸如GAP、BESTFIT、FASTA和TFASTA，它们可作为Wisconsin(Accelrys Inc.,San Diego,CA)的一部分获得。用于测试序列和参考序列的比对节段的“同一性分数”是两个比对序列共享的相同组分的数量除以参考序列节段(例如，整个参考序列或参考序列的较小定义部分)中的组分总数。百分比序列同一性表示为同一性分数乘以100。一个或多个多核苷酸序列的比较可以是全长多核苷酸序列或其部分，或者是较长的多核苷酸序列。就本发明的目的而言，还可以使用BLASTX2.0版为翻译的核苷酸序列确定“百分比同一性”，以及使用BLASTN2.0版为多核苷酸序列确定“百分比同一性”。

当两个核苷酸序列在严格条件下彼此杂交时，也可以认为这两个核苷酸序列基本上是互补的。在一些实施方案中，被认为基本上互补的两个核苷酸序列在高度严格的条件下彼此杂交。

在核酸杂交实验(诸如Southern和Northern杂交)的背景下，“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的，并且在不同的环境参数下是不同的。在TijssenLaboratory Techniques in Biochemistryand Molecular Biology-Hybridization withNucleic Acid Probes第I部分第2章"Overview of principles of hybridization andthe strategy of nucleicacid probe assays"Elsevier,New York(1993)中提供了有关核酸杂交的广泛指南。通常，高度严格的杂交和洗涤条件选择为，在规定的离子强度和pH值下，比具体序列的解链温度(Tm)低约5℃。

Tm是50％靶序列与完美匹配的探针杂交时的温度(在规定的离子强度和pH值下)。非常严格的条件选择为等于特定探针的Tm。在Southern或Northern印迹中，具有超过100个互补残基的互补核苷酸序列在滤器上杂交的严格杂交条件的实例是50％甲酰胺与1mg肝素在42℃，杂交过夜。高度严格的洗涤条件的实例是0.1 5M NaCl在72℃约15分钟。严格洗涤条件的实例是在65℃用0.2x SSC洗涤15分钟(对于SSC缓冲液的描述，参见Sambrook，同前所述)。通常，在进行高度严格清洗之前，先进行低严格清洗，以去除背景探针信号。例如，超过100个核苷酸的双联体的中等严格洗涤的实例是在45℃1xSSC 15分钟。例如，超过100个核苷酸的双联体的低严格洗涤的实例是在40℃4-6x SSC 15分钟。对于短探针(例如，约10个至50个核苷酸)，严格的条件通常涉及低于约1.0 M Na离子的盐浓度，通常约0.01至1.0M Na离子浓度(或其它盐)在pH 7.0至8.3，温度通常至少为约30℃。通过添加诸如甲酰胺等去稳定剂也可以达到严格的条件。通常，在特定的杂交测定中，为对不相关探针观察到的信噪比2倍(或更高)的信噪比表明检测到特异性杂交。如果核苷酸序列编码的蛋白质基本相同，则在严格条件下彼此不杂交的核苷酸序列仍然基本相同。例如，当使用遗传密码允许的最大密码子简并性生成核苷酸序列的拷贝时，就会发生此类情况。

本发明的多核苷酸和/或重组核酸构建体(例如，表达盒和/或载体)可以针对表达进行密码子优化。在一些实施方案中，本发明的编辑系统的多核苷酸、核酸构建体、表达盒和/或载体(例如，包含/编码序列特异性核酸结合结构域(例如，来自以下的序列特异性核酸结合结构域(例如核酸结合结构域(例如，DNA结合结构域))：多核苷酸引导的核酸内切酶、锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)、Argonaute蛋白和/或CRISPR-Cas核酸内切酶(例如，CRISPR-Cas效应蛋白)(例如，I型CRISPR-Cas效应蛋白、II型CRISPR-Cas效应蛋白、III型CRISPR-Cas效应蛋白、IV型CRISPR-Cas效应蛋白、V型CRISPR-Cas效应蛋白或VI型CRISPR-Cas效应蛋白))，核酸酶(例如，核酸内切酶(例如，Fok1)，多核苷酸引导的核酸内切酶，CRISPR-Cas核酸内切酶(例如，CRISPR-Cas效应蛋白)，锌指核酸酶和/或转录激活因子样效应物核酸酶(TALEN))，脱氨酶蛋白/结构域(例如，腺嘌呤脱氨酶，胞嘧啶脱氨酶)，编码逆转录酶蛋白或结构域的多核苷酸，编码5'-3'核酸外切酶多肽的多核苷酸，和/或亲和多肽，肽标签等)可以对植物中的表达进行密码子优化。在一些实施方案中，本发明的密码子优化的核酸、多核苷酸、表达盒和/或载体与没有进行密码子优化的参考核酸、多核苷酸、表达盒和/或载体具有约70％至约99.9％(例如，70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％、99.9％或100％)或更高的同一性。

在本文描述的任何实施方案中，本发明的多核苷酸或核酸构建体可以与多种启动子和/或其它调控元件可操作缔合以用于在植物和/或植物细胞中表达。因此，在一些实施方案中，本发明的多核苷酸或核酸构建体还可以包含与一个或多个核苷酸序列可操作连接的一个或多个启动子、内含子、增强子和/或终止子。在一些实施方案中，启动子可以与内含子可操作地缔合(例如，Ubi1启动子和内含子)。在一些实施方案中，与内含子缔合的启动子可以被称为“启动子区域”(例如，Ubi1启动子和内含子)。

如本文所用，提及多核苷酸时“可操作地连接”或“可操作地缔合”，意指所指示的元件在功能上彼此相关，并且通常也在物理上相关。因此，如本文所用的术语“可操作地连接”或“可操作地缔合”是指单个核酸分子功能上关联的核苷酸序列。因此，可操作地连接到第二核苷酸序列的第一核苷酸序列意指第一核苷酸序列以与第二核苷酸序列功能相关的关系进行定位的情形。例如，如果启动子影响所述核苷酸序列的转录或表达，则启动子与该核苷酸序列可操作地缔合。本领域技术人员将理解，控制序列(例如，启动子)不必和与其可操作地缔合的核苷酸序列相邻，只要控制序列的功能是指导其表达即可。因此，例如，启动子和核苷酸序列之间可以存在介于中间的未翻译但转录的核酸序列，并且启动子仍可被视为与核苷酸序列“可操作地连接”。

如本文所用，在提及多肽时，术语“连接”是指一个多肽与另一个多肽的连接。多肽可以直接(例如，通过肽键)或通过接头与另一个多肽(在N-端或C-端)连接。

术语“接头”是本领域公认的，是指连接两个分子或部分的化学基团或分子，所述两个分子或部分例如融合蛋白的两个结构域，诸如，例如，核酸结合多肽或结构域和肽标签和/或逆转录酶和与肽标签结合的亲和多肽；或DNA核酸内切酶多肽或结构域和肽标签和/或逆转录酶和与肽标签结合的亲和多肽。接头可以由单个连接分子组成，或可以包含多个连接分子。在一些实施方案中，接头可以是有机分子、基团、聚合物或化学部分，诸如二价有机部分。在一些实施方案中，接头可以是氨基酸，或者也可以是肽。在一些实施方案中，接头是肽。

在一些实施方案中，可用于本发明的肽接头可以是约2至约100个或更多个氨基酸的长度，例如，约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个或更多个氨基酸的长度(例如，约2至约40、约2至约50、约2至约60、约4至约40、约4至约50、约4至约60、约5至约40、约5至约50、约5至约60、约9至约40、约9至约50、约9至约60、约10至约40、约10至约50、约10至约60，或约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25个氨基酸至约26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个或更多个氨基酸的长度(例如，约105、110、115、120、130、140、150个或更多个氨基酸的长度)。在一些实施方案中，肽接头可以是GS接头。

如本文所用，在提及多核苷酸时，术语“连接”或“融合”是指一个多核苷酸与另一个多核苷酸的连接。在一些实施方案中，两个或更多个多核苷酸分子可以通过接头连接，接头可以是有机分子、基团、聚合物或化学部分，诸如二价有机部分。多核苷酸可以通过共价或非共价键或结合与另一个多核苷酸(在5'端或3'端)连接或融合，包括例如通过Watson-Crick碱基配对或通过一个或多个连接核苷酸连接或融合。在一些实施方案中，某种结构的多核苷酸基序可以插入到另一个多核苷酸序列中(例如，引导RNA中发夹结构的延伸)。在一些实施方案中，连接核苷酸可以是天然存在的核苷酸。在一些实施方案中，连接核苷酸可以是非天然的核苷酸。

“启动子”是控制或调节与启动子可操作地缔合的核苷酸序列(例如，编码序列)转录的核苷酸序列。由启动子控制或调节的编码序列可以编码多肽和/或功能性RNA。通常，“启动子”是指包含RNA聚合酶II的结合位点并指导转录起始的核苷酸序列。通常，启动子位于相对于对应编码序列的编码区起点的5'或上游。启动子可以包含作为基因表达调节物的其它元件；例如，启动子区。这些包括TATA盒共有序列，通常还包括CAAT盒共有序列(Breathnach和Chambon,(1981)Annu.Rev.Biochem.50:349)。在植物中，CAAT盒可以被AGGA盒替代(Messing等人,(1983)在Genetic Engineering of Plants中,T.Kosuge,C.Meredith和A.Hollaender(编辑),Plenum Press,第211-227页)。

可用于本发明的启动子可以包括，例如，组成性、诱导性、时间调控性、发育调控性、化学调控性、组织偏好性和/或组织特异性的启动子，用于制备重组核酸分子，例如，“合成核酸构建体”或“蛋白质-RNA复合物”。这些不同类型的启动子是本领域已知的。

对启动子的选择可以因表达的时间和空间要求而异，也可以因要转化的宿主细胞而异。许多不同生物体的启动子在本领域是众所周知的。基于本领域存在的广泛知识，可以为感兴趣的特定宿主生物体选择适当的启动子。因此，例如，模式生物体中高度组成性表达的基因上游的启动子是已知的，并且这些知识可以很容易地获得，并酌情在其它系统中实施。

在一些实施方案中，在植物中有功能的启动子可以与本发明的构建体一起使用。可用于驱动在植物中表达的启动子的非限制性实例包括RubisCo小亚基基因1的启动子(PrbcS1)、肌动蛋白基因的启动子(Pactin)、硝酸还原酶基因的启动子(Pnr)和双拷贝碳酸酐酶基因1的启动子(Pdca1)(参见Walker等人，Plant Cell Rep.23:727-735(2005)；Li等人，Gene 403:132-142(2007)；Li等人，Mol Biol.Rep.37:1143-1154(2010))。PrbcS1和Pactin是组成性启动子，Pnr和Pdca1是诱导性启动子。Pnr由硝酸盐诱导并被铵抑制(Li等人，Gene 403:132-142(2007))，Pdca1由盐诱导(Li等人，Mol Biol.Rep.37:1143-1154(2010))。在一些实施方案中，可用于本发明的启动子是RNA聚合酶II(Pol II)启动子。在一些实施方案中，来自玉米的U6启动子或7SL启动子可以用于本发明的构建体。在一些实施方案中，来自玉米的U6c启动子和/或7SL启动子可以用于驱动引导核酸的表达。在一些实施方案中，来自大豆(Glycine max)的U6c启动子、U6i启动子和/或7SL启动子可用于本发明的构建体。在一些实施方案中，来自大豆的U6c启动子、U6i启动子和/或7SL启动子可以用于驱动引导核酸的表达。

对植物有用的组成性启动子的实例包括但不限于，洋丁香病毒启动子(cmp)(美国专利号7,166,770)、水稻肌动蛋白1启动子(Wang等人，(1992)Mol.Cell.Biol.12:3399-3406；以及美国专利号5,641,876)、CaMV 35S启动子(Odell等人，(1985)Nature 313:810-812)、CaMV 19S启动子(Lawton等人，(1987)Plant Mol.Biol.9:315-324)、nos启动子(Ebert等人(1987)Proc.Natl.Acad.Sci USA 84:5745-5749)、Adh启动子(Walker等人(1987)Proc.Natl.Acad.Sci.USA84:6624-6629)、蔗糖合酶启动子(Yang&Russell(1990)Proc.Natl.Acad.Sci.USA 87:4144-4148)和泛素启动子。源自泛素的组成性启动子在许多细胞类型中积累。泛素启动子已从几种植物物种中克隆出来，用于转基因植物，例如，向日葵(Binet等人,1991.Plant Science 79:87-94)，玉米(Christensen等人,1989.PlantMolec.Biol.12:619-632)和拟南芥(Norris等人1993.Plant Molec.Biol.21:895-906)。玉米泛素启动子(UbiP)已在转基因单子叶植物系统中开发，构建用于单子叶植物转化的其序列和载体在专利公布EP 0 342 926中公开。泛素启动子适用于本发明的核苷酸序列在转基因植物中的表达，特别是单子叶植物。此外，McElroy等人(Mol.Gen.Genet.231:150-160(1991))描述的启动子表达盒可以很容易地被改良用于本发明的核苷酸序列的表达，并且特别适用于单子叶植物宿主。

在一些实施方案中，组织特异性/组织偏好性启动子可用于在植物细胞中表达异源多核苷酸。组织特异性或偏好表达模式包括但不限于，绿色组织特异性或偏好性、根特异性或偏好性、茎特异性或偏好性、花特异性或偏好性或花粉特异性或偏好性。适合在绿色组织中表达的启动子包括调节参与光合作用的基因的许多启动子，其中许多是从单子叶植物和双子叶植物克隆而来的。在一个实施方案中，可用于本发明的启动子是来自磷酸烯醇羧化酶基因的玉米PEPC启动子(Hudspeth&Grula,Plant Molec.Biol.12:579-589(1989))。组织特异性启动子的非限制性实例包括与编码种子储存蛋白(诸如β-伴大豆球蛋白、十字花科蛋白、油菜贮藏蛋白和菜豆蛋白)、玉米醇溶蛋白或油体蛋白(诸如油质蛋白)或参与脂肪酸生物合成的蛋白(包括酰基载体蛋白、硬脂酰-ACP去饱和酶和脂肪酸去饱和酶(fad 2-1))的基因缔合的那些，以及胚发育过程中表达的其它核酸(诸如Bce4，参见，例如，Kridl等人(1991)Seed Sci.Res.1:209-219；以及EP专利号255378)。可用于在植物、特别是玉米中表达本发明的核苷酸序列的组织特异性或组织偏好性启动子包括但不限于那些直接在根、髓、叶或花粉中表达的启动子。例如，在WO 93/07278(其全部内容通过引用并入本文)中公开了此类启动子。可用于本发明的组织特异性或组织偏好性启动子的其它非限制性实例是美国专利6,040,504中公开的棉花rubisco启动子；在美国专利5,604,121中公开的水稻蔗糖合酶启动子；由de Framond(FEBS 290:103-106(1991)；Ciba-Geigy的EP 0 452 269)所述的根特异性启动子；在美国专利5,625,136(Ciba-Geigy)中描述的茎特异性启动子，其可驱动玉米trpA基因的表达；在WO 01/73087中公开的洋丁香黄曲叶病毒启动子；以及花粉特异性或偏好性启动子，包括但不限于，来自水稻的ProOsLPS10和ProOsLPS11(Nguyen等人PlantBiotechnol.Reports 9(5):297-306(2015))，来自玉米的ZmSTK2_USP(Wang等人Genome 60(6):485-495(2017))、来自番茄的LAT52和LAT59(Twell等人Development 109(3):705-713(1990))、Zm13(美国专利号10,421,972)、来自拟南芥的PLA2-δ启动子(美国专利号7,141,424)和/或来自玉米的ZmC5启动子(国际PCT公开号WO1999/042587)。

植物组织特异性/组织偏好性启动子的其它实例包括但不限于，根毛特异性顺式元件(RHE)(Kim等人The Plant Cell 18:2958-2970(2006))、根特异性启动子RCc3(Jeong等人Plant Physiol.153:185-197(2010))和RB7(美国专利号5459252)、凝集素启动子(Lindstrom等人(1990)Der.Genet.11:160-167；和Vodkin(1983)Prog.Clin.Biol.Res.138:87-98)、玉米醇脱氢酶1启动子(Dennis等人(1984)NucleicAcids Res.12：3983-4000)、S-腺苷-L-蛋氨酸合成酶(SAMS)(Vander Mijnsbrugge等人(1996)Plant and Cell Physiology,37(8):1108-1115)、玉米光捕获复合物启动子(Bansal等人(1992)Proc.Natl.Acad.Sci.USA 89:3654-3658)、玉米热休克蛋白启动子(O'Dell等人(1985)EMBO J.5:451-458；和Rochester等人(1986)EMBO J.5:451-458)、豌豆小亚基RuBP羧化酶启动子(Cashmore,"Nucleargenes encoding the small subunit ofribulose-l,5-bisphosphate carboxylase"第29-39页，In:Genetic Engineering ofPlants(Hollaender编辑,PlenumPress 1983；和Poulsen等人(1986)Mol.Gen.Genet.205:193-200)、Ti质粒甘露糖碱合酶启动子(Langridge等人(1989)Proc.Natl.Acad.Sci.USA86:3219-3223)、Ti质粒胭脂碱合酶启动子(Langridge等人(1989),见上)、矮牵牛查尔酮异构酶启动子(van Tunen等人(1988)EMBO J.7:1257-1263)、豆类富甘氨酸蛋白1启动子(Keller等人(1989)Genes Dev.3:1639-1646)、截短的CaMV 35S启动子(O'Dell等人(1985)Nature 313:810-812)、马铃薯块茎储藏蛋白启动子(Wenzler等人(1989)PlantMol.Biol.13:347-354)、根细胞启动子(Yamamoto等人(1990)Nucleic Acids Res.18:7449)、玉米醇溶蛋白启动子(Kriz等人(1987)Mol.Gen.Genet.207:90-98；Langridge等人(1983)Cell 34:1015-1022；Reina等人(1990)Nucleic Acids Res.18:6425；Reina等人(1990)Nucleic Acids Res.18:7449；和Wandelt等人(1989)Nucleic Acids Res.17:2354)、球蛋白-1启动子(Belanger等人(1991)Genetics 129:863-872)、α-微管蛋白cab启动子(Sullivan等人(1989)Mol.Gen.Genet.215:431-440)、PEPCase启动子(Hudspeth&Grula(1989)Plant Mol.Biol.12:579-589)、R基因复合物相关启动子(Chandler等人(1989)Plant Cell 1:1175-1183)和查尔酮合酶启动子(Franken等人(1991)EMBO J.10:2605-2612)。

可用于种子特异性表达的是豌豆球蛋白启动子(Czako等人(1992)Mol.Gen.Genet.235:33-40；以及美国专利号5,625,136中公开的种子特异性启动子。可用于在成熟叶片中表达的启动子是那些在衰老开始时切换的启动子，诸如来自拟南芥的SAG启动子(Gan等人(1995)Science 270:1986-1988)。

此外，还可以使用叶绿体中起作用的启动子。此类启动子的非限制性实例包括噬菌体T3基因9 5'UTR和美国专利号7,579,516中公开的其它启动子。可用于本发明的其它启动子包括但不限于S-E9小亚基RuBP羧化酶启动子和Kunitz胰蛋白酶抑制剂基因启动子(Kti3)。

可用于本发明的其它调控元件包括但不限于内含子、增强子、终止序列和/或5'和3'非翻译区。

可用于本发明的内含子可以是在植物中鉴定并从中分离，然后插入到用于植物转化的表达盒中的内含子。正如本领域技术人员所理解的那样，内含子可以包含自我切除所需的序列，并被框内掺入到核酸构建体/表达盒中。内含子可以用作间隔子以在一个核酸构建体中分开多个蛋白质编码序列，或者也可以在一个蛋白质编码序列内使用内含子，例如，以稳定mRNA。如果它们在蛋白质编码序列中使用，则将它们“框内”插入，并包括切除位点。内含子也可以与启动子缔合以改善或修饰表达。作为实例，可用于本发明的启动子/内含子组合包括但不限于玉米Ubi1启动子和内含子的启动子/内含子组合(参见，例如，SEQ IDNO:21和SEQ ID NO:22)。

可用于本发明的内含子的非限制性实例包括来自以下的内含子：ADHI基因(例如，Adh1-S内含子1、2和6)，泛素基因(Ubi1)，RuBisCO小亚基(rbcS)基因，RuBisCO大亚基(rbcL)基因，肌动蛋白基因(例如，肌动蛋白-1内含子)，丙酮酸脱氢酶激酶基因(pdk)，硝酸还原酶基因(nr)，双拷贝碳酸酐酶基因1(Tdca1)，psbA基因、atpA基因或其任意组合。

在一些实施方案中，本发明的多核苷酸和/或核酸构建体可以是“表达盒”，或可以包含在表达盒内。如本文所用，“表达盒”是指重组核酸分子，包含例如，本发明的一个或多个多核苷酸(例如，编码序列特异性核酸结合结构域的多核苷酸、编码脱氨酶蛋白或结构域的多核苷酸、编码逆转录酶蛋白或结构域的多核苷酸、编码5'-3'核酸外切酶多肽或结构域的多核苷酸、引导核酸和/或逆转录酶(RT)模板)，其中一个或多个多核苷酸可操作地缔合一个或多个控制序列(例如，启动子、终止子等)。因此，在一些实施方案中，可以提供一个或多个表达盒，其设计用于表达，例如，本发明的核酸构建体(例如，编码序列特异性核酸结合结构域的多核苷酸、编码核酸酶多肽/结构域的多核苷酸、编码脱氨酶蛋白/结构域的多核苷酸、编码逆转录酶蛋白/结构域的多核苷酸、编码5'-3'核酸外切酶多肽/结构域的多核苷酸、编码肽标签的多核苷酸和/或编码亲和多肽的多核苷酸等，或包含引导核酸、延伸的引导核酸和/或RT模板等)。当本发明的表达盒包含多于一个多核苷酸时，多核苷酸可以可操作地连接到驱动所有多核苷酸表达的单个启动子，或者该多核苷酸可以可操作地连接到一个或多个单独的启动子(例如，三个多核苷酸可以由一个、两个或三个启动子以任意组合驱动)。当使用两个或更多个单独的启动子时，启动子可以是同一个启动子，或它们可以是不同的启动子。因此，当包含在单个表达盒中时，编码序列特异性核酸结合结构域的多核苷酸、编码核酸酶蛋白/结构域的多核苷酸、编码CRISPR-Cas效应蛋白/结构域的多核苷酸、编码脱氨酶蛋白/结构域的多核苷酸、编码逆转录酶多肽/结构域的多核苷酸(例如，RNA依赖性DNA聚合酶)和/或编码5'-3'核酸外切酶多肽/结构域的多核苷酸、引导核酸、延伸的引导核酸和/或RT模板可以各自可操作地连接单个启动子或任意组合的独立启动子。

包含本发明的核酸构建体的表达盒可以是嵌合的，这意味着其至少一个(例如，一个或多个)组分相对于其至少一个其它组分是异源的(例如，来自宿主生物体的启动子可操作地连接到要在宿主生物体中表达的感兴趣多核苷酸，其中所述感兴趣多核苷酸来自与宿主不同的生物体，或者通常不与该启动子缔合)。表达盒也可以是天然存在的，但已以可用于异源表达的重组形式获得。

表达盒可以任选地包括转录和/或翻译终止区(即终止区)和/或在选择的宿主细胞中起作用的增强子区。本领域已知多种转录终止子和增强子，可用于表达盒。转录终止子负责终止转录和纠正mRNA多聚腺苷酸化。终止区和/或增强子区可以对转录起始区来说是天然的，可以对下列来说是天然的：例如，编码序列特异性核酸结合蛋白的基因、编码核酸酶的基因、编码逆转录酶的基因、编码脱氨酶的基因等，或者可以对宿主细胞来说天然的，或者可以对另一来源(例如，外源的或异源的，例如，对启动子、编码序列特异性核酸结合蛋白的基因、编码核酸酶的基因、编码逆转录酶的基因、编码脱氨酶的基因等，或对宿主细胞，或它们的任意组合)来说是天然的。

本发明的表达盒还可以包括编码可选择标记物的多核苷酸，其可用于选择转化的宿主细胞。如本文所用，“可选择标记物”是指这样的多核苷酸序列：当表达时，赋予表达该标记物的宿主细胞独特的表型，从而允许将此类转化的细胞与没有该标记物的细胞区分开来。此类多核苷酸序列可以编码可选择或可筛选的标记物，这取决于该标记物是否赋予可以通过化学手段选择的性状，诸如使用选择性剂(例如，抗生素等)，或者该标记物是否只是人们可以通过观察或测试识别的性状，诸如通过筛选(例如，荧光)识别。许多合适的可选择标记物的实例是本领域已知的，并且可用于本文所述的表达盒中。

除表达盒外，本文所述的核酸分子/构建体和多核苷酸序列可与载体结合使用。术语“载体”是指用于将核酸(或多个核酸)转移、递送或引入细胞的组合物。载体包括包含要转移、递送或引入的核苷酸序列的核酸构建体(例如，表达盒)。用于转化宿主生物体的载体是本领域公知的。一般类别载体的非限制性实例包括病毒载体、质粒载体、噬菌体载体、噬菌粒载体、粘粒载体、fosmid载体、噬菌体、人工染色体、微环或双链或单链线性或环状形式的农杆菌二元载体，这些载体可以是或可以不是可自我传播或可动员的。在一些实施方案中，病毒载体可以包括但不限于逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹病毒载体。本文定义的载体可以通过整合到细胞基因组中或染色体外存在(例如，具有复制起点的自主复制质粒)来转化原核或真核宿主。此外，还包括穿梭载体，其是指天然地或通过设计能够在两种不同的宿主生物体中复制的DNA载体，其可以选自放线菌和相关物种、细菌和真核生物(例如，高等植物、哺乳动物、酵母或真菌细胞)。在一些实施方案中，载体中的核酸受适当的启动子或其它调控元件的控制，并可操作地与适当的启动子或其它调控元件连接，以便在宿主细胞中进行转录。该载体可以是在多个宿主中起作用的双功能表达载体。在基因组DNA的情况下，这可以包含其自己的启动子和/或其它调控元件，而在cDNA的情况下，这可以在适当的启动子和/或其它调控元件的控制下，以便在宿主细胞中表达。因此，本发明的核酸或多核苷酸和/或包含所述核酸或多核苷酸的表达盒可以包含在本文所述和本领域已知的载体中。

如本文所用，“接触”及其语法变体，是指在适合进行所需反应(例如，转化、转录控制、基因组编辑、做切口和/或裂解)的条件下将所需反应的组分放在一起。作为实例，靶核酸可以与序列特异性核酸结合蛋白(例如，多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如，CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)和/或Argonaute蛋白))和脱氨酶或编码这些的核酸构建体在以下的条件下接触：序列特异性核酸结合蛋白、逆转录酶和/或脱氨酶表达，序列特异性核酸结合蛋白与靶核酸结合，逆转录酶和/或脱氨酶可以与序列特异性核酸结合蛋白融合或募集到序列特异性核酸结合蛋白(例如，通过与序列特异性核酸结合蛋白融合的肽标签和与逆转录酶和/或脱氨酶融合的亲和标签)，因此，脱氨酶和/或逆转录酶位于靶核酸附近，从而修饰靶核酸。可以使用其它募集逆转录酶和/或脱氨酶的方法，利用其它蛋白质-蛋白质相互作用，并且RNA-蛋白质相互作用和化学相互作用也可用于蛋白质-蛋白质和蛋白质-核酸募集。

如本文所用，提及靶核酸，“修饰”包括编辑(例如，突变)、共价修饰、交换/置换核酸/核苷酸碱基、缺失、裂解、做切口和/或改变对靶核酸的转录控制。在一些实施方案中，修饰可以包括任何类型的一个或多个单碱基变化(SNP)。

在感兴趣多核苷酸的背景下，“引入”(及其语法变体)意指将感兴趣的核苷酸序列(例如，多核苷酸、RT模板、核酸构建体和/或引导核酸)呈递给植物、其植物部分或其细胞，使核苷酸序列能够进入细胞内部。

术语“转化”或“转染”可以互换使用，如本文所用是指将异源核酸引入细胞。细胞的转化可以是稳定的或瞬时的。因此，在一些实施方案中，宿主细胞或宿主生物体(例如，植物)可以用本发明的多核苷酸/核酸分子稳定地转化。在一些实施方案中，宿主细胞或宿主生物体可以用本发明的多核苷酸/核酸分子瞬时转化。

在多核苷酸的背景下，“瞬时转化”意指多核苷酸被引入细胞中，并且不整合到细胞的基因组中。

在将多核苷酸引入细胞的背景下，通过“稳定引入”或“被稳定引入”，意指将引入的多核苷酸稳定地掺入细胞的基因组中，从而使细胞被多核苷酸稳定地转化。

如本文所用，“稳定转化”或“稳定地转化”意指将核酸分子引入细胞并整合到细胞的基因组中。因此，整合的核酸分子能够被其子代继承，更具体地说，能够被连续多代的子代继承。如本文所用的“基因组”包括核基因组和质体基因组，因此包括将核酸整合到例如叶绿体或线粒体基因组中。如本文所用的稳定转化也可以指在染色体外维持的转基因，例如，作为微染色体或质粒。

瞬时转化可以通过例如酶联免疫吸附测定(ELISA)或蛋白质印迹法来检测，其可以检测由引入生物体的一个或多个转基因编码的肽或多肽的存在。例如，可以通过对细胞的基因组DNA与核酸序列进行Southern印迹杂交测定来检测细胞的稳定转化，所述核酸序列与引入生物体(例如，植物)的转基因的核苷酸序列特异性杂交。例如，可以通过对细胞的RNA与核酸序列进行Northern印迹杂交测定来检测细胞的稳定转化，所述核酸序列与引入宿主生物体的转基因的核苷酸序列特异性杂交。细胞的稳定转化也可以通过，例如，聚合酶链反应(PCR)或本领域公知的其它扩增反应来检测，采用与转基因的靶序列杂交的特异性引物序列，从而扩增转基因序列，其可以根据标准方法检测。转化也可以通过本领域公知的直接测序和/或杂交方案来检测。

因此，在一些实施方案中，本发明的核苷酸序列、多核苷酸、核酸构建体和/或表达盒可以被瞬时表达和/或它们可以稳定地掺入宿主生物体的基因组中。因此，在一些实施方案中，本发明的核酸构建体(例如，一个或多个包含如本文所述的用于编辑的多核苷酸的表达盒)可以瞬时引入到具有引导核酸的细胞中，因此，没有DNA在细胞中维持。

本发明的核酸构建体可以通过本领域技术人员已知的任何方法引入植物细胞中。转化方法的非限制性实例包括通过细菌介导的核酸递送(例如，通过农杆菌)的转化、病毒介导的核酸递送、碳化硅或核酸晶须介导的核酸递送、脂质体介导的核酸递送、显微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米颗粒介导的转化、超声处理、浸润、PEG介导的核酸摄取，以及导致将核酸引入植物细胞的任何其它电、化学、物理(机械)和/或生物机制，包括它们的任意组合。转化真核生物和原核生物的程序在本领域是众所周知和常规的，并且其描述遍布文献(参见，例如，Jiang等人2013.Nat.Biotechnol.31:233-239；Ran等人Nature Protocols 8:2281–2308(2013))。对本领域已知的各种植物转化方法的一般指南包括Miki等人("Procedures for Introducing Foreign DNA intoPlants"in Methods inPlant Molecular Biology and Biotechnology,Glick,B.R.和Thompson,J.E.编辑(CRC Press,Inc.,Boca Raton,1993),第67-88页)和Rakowoczy-Trojanowska(Cell.Mol.Biol.Lett.7:849-858(2002))。

在本发明的一些实施方案中，细胞的转化可以包括核转化。在其它实施方案中，细胞的转化可以包括质体转化(例如，叶绿体转化)。在进一步的实施方案中，本发明的核酸可以通过常规育种技术引入细胞中。在一些实施方案中，一种或多种多核苷酸、表达盒和/或载体可以通过农杆菌转化引入植物细胞中。

因此，多核苷酸可以以本领域公知的任意数量的方式引入植物、植物部分、植物细胞中。本发明的方法不依赖于将一个或多个核苷酸序列引入植物的特定方法，只要它们能够进入细胞内部即可。如果要引入多个多核苷酸，它们可以组装为单个核酸构建体的一部分，也可以组装为单独的核酸构建体，并且可以位于相同或不同的核酸构建体上。因此，多核苷酸可以在单个转化事件中引入感兴趣细胞，或者，也可以在单独的转化事件中引入感兴趣细胞，或者，备选地，可以将多核苷酸作为育种方案的一部分掺入植物中。

本发明涉及通过有助于荚果开裂的基因修饰表达和蛋白质产生，以控制种子裂开并改善产量和劳动力成本。功能冗余的MADS结构域因子SHATTERPROOF1(SHP1)和SHATTERPROOF2(SHP2)是分离层分化和促进拟南芥中木质化的边缘层的木质化所必需的。因此，当shp1 shp2突变体果实成熟时，它们无法打开，而种子被困在里面。因此，本发明提供了用于修饰油菜植物中SHATTERPROOF MADS-BOX(SHP)基因(例如内源性SHP1基因、内源性SHP2基因、内源性SHP3基因和/或内源性SHP4基因)的方法和组合物，以提供表现出减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的油菜植物。在油菜中，SHP基因包括SHP1(BnaA09g55330D)、SHP2(BnaA07g18050D、BnaC06g16910D)、SHP3(BnaA04g01810D、BnaC04g23360D)和/或SHP4(BnaA05g02990D)(基因ID来自BrassicaEDB——芸苔属作物的基因表达数据库(Brassica.biodb.org/analysis))，每种基因都可能靶向植物。因此，对本发明有用的编辑策略可以包括在油菜植物中的一种或多种SHP基因中产生突变，例如，油菜植物可以包含1、2、3、4、5和/或6种或更多种包含本文所述的修饰的SHP基因。在一些实施方案中，可以在植物的SHP基因中产生一个或多个突变(任选地，非天然突变)。可能有助于产生具有减少的荚果裂开和/或减少的荚果瓣边缘木质化(减少的木质素含量)的油菜植物的突变包括例如置换、缺失和/或插入。在一些方面，编辑技术产生的突变可以是点突变。在一些实施方案中，如本文所述的一种或多于一种SHP基因中的突变导致一种或多于一种SHP基因表达的敲低。在一些实施方案中，如本文所述的一种或多于一种SHP基因中的突变导致产生修饰的SHP多肽，任选地，其中修饰的SHP多肽包含C末端截短，任选地，截短由未修饰的内源性SHP基因产生的SHP多肽的约最后65-80个连续氨基酸残基(约65、66、67、68、69、70,、71、72、73、74、75、76、77、78、79或80个连续氨基酸残基)。

在一些实施方案中，本发明提供了一种油菜植物或其植物部分，其包含编码Shatterproof MADS-box转录因子(SHP)多肽的至少一种(例如，一种或多于一种SHP基因)内源性SHATTERPROOF MADS-BOX(SHP)基因中的至少一个突变，任选地，其中至少一个突变可以是非天然突变。在一些实施方案中，内源性SHP基因是内源性SHP1基因、内源性SHP2基因、内源性SHP3基因和/或内源性SHP4基因，其中编码的SHP多肽分别是SHP1多肽、SHP2多肽、SHP3多肽或SHP4多肽。内源性SHP基因可能具有BnaA04g01810D(SHP3)、BnaA07g18050D(SHP2)、BnaA05g02990D(SHP4)、BnaA09g55330D(SHP1)、BnaC04g23360D(SHP3)和/或BnaC06g16910D(SHP2)的基因识别号(基因ID)。在一些实施方案中，油菜植物中的至少一个突变可以是亚效等位基因突变、显性负性突变或显性负性亚效等位基因突变。在一些实施方案中，突变可以是敲低突变。如本文所使用的，敲低突变导致活性减少至少5％(例如，活性减少约5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％，以及其中的任何范围或值)。

在一些实施方案中，提供了油菜植物细胞，所述油菜植物细胞包含编辑系统，该编辑系统包含:(a)CRISPR-Cas效应蛋白；和(b)引导核酸(例如，gRNA、gDNA、crRNA、crDNA、sgRNA、sgDNA)，该引导核酸包含与编码油菜植物细胞中Shatterproof MADS-box转录因子(SHP)多肽的内源性靶基因互补的间隔序列。编辑系统可用于在编码SHP多肽的内源性靶基因中产生突变。在一些实施方案中，内源性靶基因是内源性SHATTERPROOF MADS-BOX(SHP)基因(例如，一种或多于一种内源性SHP基因)，任选地是内源性SHP1基因、内源性SHP2基因、内源性SHP3基因和/或内源性SHP4基因，并且SHP多肽分别是SHP1多肽、SHP2多肽、SHP3多肽或SHP4多肽。在一些实施方案中，突变是非天然突变。在一些实施方案中，内源性靶基因：(a)包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核苷酸序列；(b)包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列具有至少80％的序列同一性的区域；(c)编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的SHP多肽；和/或(d)编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的SHP多肽的区域。在一些实施方案中，编辑系统的引导核酸可以包含SEQ ID NO:292-297中任一个的核苷酸序列(间隔序列，例如，一个或多个间隔子)(例如SEQ ID NO:292(PWsp236)、SEQ ID NO:293(PWsp237)、SEQ IDNO:294(PWsp238)、SEQ ID NO:295(PWsp239)、SEQ ID NO:296(PWsp240)和/或SEQ ID NO:297(PWsp241))和/或SEQ ID NO:342-346(例如，SEQ ID NO:342(PWsp291)、SEQ ID NO:343(PWsp292)、SEQ ID NO:344(PWsp293)、SEQ ID NO:345(PWsp294)和/或SEQ IDNO:346(PWsp294)，或其反向互补序列)。

用于本发明的油菜植物、其植物部分或油菜植物细胞的SHP基因中的突变可以是任何类型的突变，包括碱基置换、碱基缺失和/或碱基插入。在一些实施方案中，突变可以是非天然突变。在一些实施方案中，突变可以包括对A、T、G或C的碱基置换。在一些实施方案中，突变可以是至少一个碱基对的缺失(任选地，框外缺失或框内缺失)(例如，至少一个碱基对(例如，1个碱基对至约100个碱基对；例如，1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个连续碱基对；例如，1至约50个连续碱基对，1至约30个连续碱基对，1至约15个连续碱基对)或插入(例如，1个碱基对至约15个碱基对；例如，1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个连续碱基对)，任选地，其中缺失是框外缺失。例如，SHP基因中的缺失可以是约7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个连续碱基对，任选地是约7、8、10、20或45个连续碱基对。在一些实施方案中，非天然突变可以是至少一个碱基对的插入(例如，1个碱基对至约100个连续碱基对；例如，1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个连续碱基)。在一些实施方案中，1至约100个碱基对的插入是框外插入。

SHP基因中的突变(任选的，非天然突变)可以位于SHP基因(例如，SHP1基因、SHP2基因、SHP3基因和/或SHP4基因)的3'区域，任选地在编码SHP多肽的C末端区域的SHP基因的3'区域(例如，3'编码区域(外显子))中。例如，SHP基因中的突变可以位于：(a)倒数第二个外显子中，(b)倒数第二个外显子中和内含子中，该内含子在倒数第二个外显子的3'和最后一个外显子的5'，和/或(c)最后一个外显子中。在一些实施方案中，突变可以是框外缺失、框内缺失或框外插入。在一些实施方案中，框外缺失、框内缺失或框外插入可导致基因的最后一个外显子的缺失。在一些实施方案中，框外缺失、框内缺失或框外插入导致编码截短多肽的基因，任选地，具有由缺失或插入产生的过早终止密码子产生的C末端截短的多肽。在一些实施方案中，C末端截短是从SHP多肽的C末端(例如，约最后65至80个连续氨基酸残基)缺失约65至约80个连续氨基酸残基(约65、66、67、68、69、70、71、72、73、74、75、76、77、78、79或80个连续氨基酸残基)。

如本文所用，“非天然突变”是指通过人类干预产生的突变，其不同于在自然界中发生的相同基因中发现的突变(例如，自然发生的突变)。

在一些实施方案中，本发明有用的突变可以是亚效等位基因突变、显性负性突变或显性负性亚效等位基因突变。

可用于在油菜SHP基因中产生这些突变和其它突变的编辑工具类型包括任何碱基编辑器或切割器，使用与如本文所述的SHP基因的部分或区域(例如一种或多于一种SHP基因，例如SHP1基因、SHP2基因、SHP3基因和/或SHP4)具有至少80％(例如80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％，或其中任何范围或值)互补性的间隔子将所述碱基编辑器或切割器引导至靶位点。

在一些实施方案中，SHP基因的突变在内源性SHP基因的部分或区域中，所述内源性SHP基因的部分或区域与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列具有至少80％的序列同一性，任选地所述内源性SHP基因的部分或区域与SEQ ID NO:75-82、85-92、107-112、116-120、124-127、129、135、136、139、140、156、157、159-161、164-166、181-184、187-190、195、196、212-219、222-224、229、230、246-248、251-253、255-257、261-264、267、268、271、272、275、276、279、280、283、285或324-338中任一个核苷酸序列具有至少80％的序列同一性。

用于本发明的内源性SHP基因(例如内源性靶基因)编码ShatterproofMADS-box转录因子(SHP)多肽，并且包括内源性SHP1基因、内源性SHP2基因、内源性SHP3基因或内源性SHP4基因，其分别编码SHP1多肽、SHP2多肽、SHP3多肽或SHP4多肽。在一些实施方案中，内源性SHP基因(例如内源性靶基因)：(1)可以包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核酸序列，(2)可以包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个具有至少80％的序列同一性的SHP基因的区域，(3)可以编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的多肽，和/或(4)可以编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的SHP多肽的区域。

在一些实施方案中，与没有至少一个突变的油菜植物(例如，同基因植物(例如，野生型未编辑的植物或空缺分离体)相比，在内源性SHP基因(在至少一种内源性SHP转基因中，例如，在一种或多种SHP基因中，例如SHP1、SHP2、SHP3、SHP4)中包含至少一个(例如，一个或多个，例如，1、2、3、4、5或更多个)突变的油菜植物表现出减少的荚果开裂(和/或减少的荚果瓣边缘木质化(减少的木质素含量)和/或增加的可收获的种子)。

在一些实施方案中，可以从本发明的油菜植物部分和/或植物细胞再生油菜植物，所述油菜植物部分和/或植物细胞包含一种或多于一种如本文所述的内源性SHP基因(内源性SHP1基因、内源性SHP2基因、内源性SHP3基因和/或内源性SHP4基因)中的突变，其中再生的油菜植物包含一种或多于一种内源性SHP基因中的突变，并且与在一种或多于一种SHP基因中没有相同突变的对照油菜植物相比，具有减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的表型。

在一些实施方案中，提供了一种油菜植物细胞，所述油菜植物细胞包含内源性SHATTERPROOF MADS-BOX(SHP)基因中的至少一个(例如，一个或多个)突变(任选的，非天然突变)，其中至少一个突变是使用编辑系统引入的置换、插入或缺失，该编辑系统包含与内源性SHP基因中的靶位点结合的核酸结合结构域。在一些实施方案中，例如，置换、插入或缺失导致过早终止密码子。在一些实施方案中，例如，置换、插入或缺失导致截短的SHP蛋白，任选地，具有C末端截短的SHP多肽。在一些实施方案中，至少一个突变是点突变，任选地，产生过早终止密码子，任选地，截短的SHP蛋白。在一些实施方案中，SHP基因中的至少一个突变是插入和/或缺失，任选地，至少一个突变是框外插入或框外缺失。在一些实施方案中，内源性SHP基因是内源性SHP1基因、内源性SHP2基因、内源性SHP3基因或内源性SHP4基因。

在一些实施方案中，油菜植物细胞的SHP基因中的靶位点可以在内源性SHP基因的区域或部分中，所述区域与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列具有至少80％的序列同一性，任选地与SEQ ID NO:75-82、85-92、107-112、116-120、124-127、129、135、136、139、140、156、157、159-161、164-166、181-184、187-190、195、196、212-219、222-224、229、230、246-248、251-253、255-257、261-264、267、268、271、272、275、276、279、280、283或285中任一个具有至少80％的序列同一性。在一些实施方案中，SHP基因中的靶位点在内源性SHP基因的区域中，所述区域编码与SEQID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的氨基酸序列。

在一些实施方案中，可以通过包含核酸酶和核酸结合结构域的编辑系统切割后进行突变，该核酸结合结构域与在以下序列中的靶位点结合:(a)与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个的编码序列具有至少80％的序列同一性的序列，任选地，在与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个的编码序列具有至少80％的序列同一性的序列的3'区域内，任选地位于与SEQ IDNO:69、100、148、177、206或240中任一个的编码序列具有至少80％的序列同一性的序列的：(i)倒数第二个外显子中，(ii)倒数第二个外显子中和内含子中，该内含子位于倒数第二个外显子的3'和最后一个外显子的5'，和/或(iii)最后一个外显子中，或(b)与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个的编码序列具有至少80％的序列同一性的序列，任选地，与SEQ ID NO:75-82、85-92、107-112、116-120、124-127、129、135、136、139、140、156、157、159-161、164-166、181-184、187-190、195、196、212-219、222-224、229、230、246-248、251-253、255-257、261-264、267、268、271、272、275、276、279、280、283或285中任一个具有至少80％的序列同一性的序列，以及SHP基因中的至少一个突变是在核酸酶切割后产生的，任选地，其中至少一个突变是非天然突变。

在一些实施方案中，至少一个突变可以导致亚效等位基因突变、显性负性突变或显性负性亚效等位基因突变。

在一些实施方案中，可以将油菜植物细胞再生成包含至少一个突变的油菜植物，任选地，其中与没有至少一个突变的对照植物相比，从油菜植物细胞再生的油菜植物表现出减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的表型。在一些实施方案中，包含内源性SHP基因中的至少一个突变的油菜植物不是再生的。

在一些实施方案中，提供了一种产生/育种无转基因的编辑的油菜植物的方法，所述方法包括：使本发明的油菜植物(例如，在一种或多种SHP基因中包含一个或多个突变(任选地，一个或多个非天然突变)并且具有减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量))的油菜植物与无转基因植物杂交，从而将突变引入无转基因的油菜植物中；以及选择包含突变且无转基因的子代油菜植物，从而产生无转基因的编辑的油菜植物。

本文还提供了一种提供具有减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的多种油菜植物的方法，所述方法包括在生长区域(例如，田地(例如，耕地，农田)、生长室、温室，休闲区、草坪和/或路边等)种植本发明的两种或更多种油菜植物(例如，2、3、4、5、6、7、8、9、10、20、30、40、50、100、200、300、400、500、1000、2000、3000、4000、5000或10000或更多种油菜植物，其在一种或多种SHP基因中包含一个或多个突变(任选地，一个或多个非天然突变)并且具有减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)，从而提供了与没有突变的多种对照油菜植物相比具有减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的多种油菜植物。

在一些实施方案中，提供了一种编辑油菜植物细胞基因组中特定位点的方法，所述方法包括：以位点特异性方式切割油菜植物细胞中内源性SHATTERPROOMADS-BOX(SHP)基因中的靶位点，该内源性SHP基因:(a)包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核苷酸序列，(b)包含与SEQID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个具有至少80％的序列同一性的区域，(c)编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的氨基酸序列，(d)编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个的氨基酸序列具有至少80％的序列同一性的区域，从而在油菜植物细胞的内源性SHP基因中产生编辑，并产生包含内源性SHP基因中的编辑的油菜植物细胞。在一些实施方案中，内源性SHP基因是内源性SHP1基因、内源性SHP2基因、内源性SHP3基因或内源性SHP4基因，任选地，其中在两种或更多种内源性SHP基因(例如，SHP1、SHP2、SHP3和/或SHP4中的两种或更多种)中产生编辑。

在一些实施方案中，油菜植物内源性SHP基因中的编辑导致突变，包括但不限于碱基缺失、碱基置换或碱基插入，任选地，其中至少一个突变是突变。在一些实施方案中，至少一个突变可以位于SHP基因的3'区域，例如，位于SHP基因组序列的倒数第二个外显子中、倒数第二个外显子和3'相邻内含子中、和/或最后一个外显子中。在一些实施方案中，编辑可产生至少一个突变，该突变是至少一个碱基对(例如，1个碱基对至约100个碱基对)的插入，任选地，其中插入是框外插入。在一些实施方案中，编辑可以导致至少一个突变，即缺失，任选地，其中缺失的长度约为1至约100个连续碱基对，例如，长度为约1-50个连续碱基对，约1-30个连续碱基对或约1-15个连续碱基对，任选地约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41，42、43、44、45、46、47、48、49或50个连续碱基对。对本发明有用的缺失或插入可以是框外插入或框外缺失。在一些实施方案中，框外插入或框外缺失可以导致过早终止密码子和截短的蛋白质。在一些实施方案中，SHP基因中的编辑产生截短的SHP多肽，任选地，SHP多肽的C末端截短，任选地，其中C末端截短是从SHP多肽的C末端(例如，约最后65至80个连续氨基酸残基；由SHP基因组序列的最后一个外显子编码的至少所有连续氨基酸残基，任选地由SHP基因组序列的最后一个外显子编码的所有氨基酸残基和由SHP基因组序列的倒数第二个外显子编码的至少部分氨基酸残基)缺失约65至约80个连续氨基酸残基(约65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、或80个连续氨基酸残基)。

在一些实施方案中，编辑的方法还可以包括从包含内源性SHP基因中的编辑的油菜植物细胞再生油菜植物，从而产生包含其内源性SHP基因中(任选地在SHP基因的3'端，任选地在倒数第二个外显子中、倒数第二个外显子和3'相邻内含子中、和/或在最后一个外显子中)的编辑的油菜植物，并且与没有编辑的对照油菜植物相比，具有减少的荚果开裂的表型。

在一些实施方案中，提供了一种产生油菜植物的方法，所述方法包括：(a)使包含内源性SHATTERPROOF MADS-BOX(SHP)基因的油菜植物细胞群与连接至核酸结合结构域(例如，编辑系统)的核酸酶接触，该核酸结合结构域与序列结合，该序列：(i)与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个核苷酸序列具有至少80％的序列同一性，(ii)包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个具有至少80％的同一性的区域；(iii)编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的氨基酸序列，和/或(iv)编码与SEQID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的区域；(b)从内源性SHP基因已被突变的油菜植物细胞群中选择油菜植物细胞，从而产生包含内源性SHP基因中的突变的油菜植物细胞；(c)将选择的油菜植物细胞生长成包含内源性SHP基因中的突变的油菜植物。

在一些实施方案中，提供了一种用于减少油菜植物荚果开裂和/或减少荚果瓣边缘木质化(减少的木质素含量)的方法，所述方法包括：(a)使包含内源性SHATTERPROOFMADS-BOX(SHP)基因的油菜植物细胞与靶向内源性SHP基因的核酸酶接触，其中核酸酶与结合内源性SHP基因中靶位点的核酸结合结构域(例如，编辑系统)连接，其中内源性SHP基因:(i)包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核苷酸序列；(ii)包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列具有至少80％的序列同一性的区域；(iii)编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的SHP多肽；和/或(iv)编码与SEQ IDNO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的SHP多肽的区域，以产生包含内源性SHP基因中的突变的油菜植物细胞；(b)将包含内源性SHP基因中的突变的油菜植物细胞生长成包含内源性SHP基因中的突变的油菜植物，从而产生具有突变的内源性SHP基因以及减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的油菜植物。

在一些实施方案中，提供产生油菜植物或其部分的方法，所述油菜植物或其部分包含至少一个具有突变的内源性SHATTERPROOF MADS-BOX(SHP)基因(例如，一种或多种突变的内源性SHP基因)的细胞，所述方法包括：使油菜植物或植物部分中内源性SHP基因中的靶位点与包含切割结构域和核酸结合结构域的核酸酶接触，其中核酸结合结构域与内源性SHP基因中的靶位点结合，其中内源性SHP基因：(a)包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核苷酸序列；(b)包含与SEQID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列具有至少80％的序列同一性的区域；(c)编码与SEQID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的SHP多肽；和/或(d)编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的SHP多肽的区域，从而产生包含至少一个在内源性SHP基因中具有突变(例如，一种或多种内源性SHP基因中的突变)的细胞的油菜植物或其部分。

本文还提供了一种产生油菜植物或其部分的方法，所述油菜植物或其部分包含突变的内源性SHATTERPROOF MADS-BOX(SHP)基因，并表现出减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)，所述方法包括使油菜植物或植物部分中内源性SHP基因中的靶位点与包含切割结构域和核酸结合结构域的核酸酶接触，其中核酸结合结构域与内源性SHP基因中的靶位点结合，其中内源性SHP基因:(a)包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核苷酸序列；(b)包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列具有至少80％的序列同一性的区域；(c)编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的SHP多肽；和/或(d)编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的SHP多肽的区域，从而产生油菜植物或其部分，其包含具有突变的内源性SHP基因(例如，至少一种具有突变的内源性SHP基因)，并且表现出减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)。

在一些实施方案中，核酸酶可以切割内源性SHP基因，从而将突变引入内源性SHP基因。本发明有用的核酸酶可以是可用于编辑/修饰靶核酸的任何核酸酶。此类核酸酶包括但不限于锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)、核酸内切酶(例如，Fok1)和/或CRISPR-Cas效应蛋白。同样，本发明有用的任何核酸结合结构域可以是可用于编辑/修饰靶核酸的任何DNA结合结构域或RNA结合结构域。此类核酸结合结构域包括但不限于锌指、转录激活因子样DNA结合结构域(TAL)、argonaute和/或CRISPR-Cas效应物DNA结合结构域。

在一些实施方案中，核酸结合结构域(例如DNA结合结构域)包含在核酸结合多肽中。本文使用的“核酸结合蛋白”或“核酸结合多肽”是指以位点特异性和/或序列特异性方式结合和/或能够结合核酸的多肽。在一些实施方案中，核酸结合多肽可以是序列特异性核酸结合多肽(例如序列特异性DNA结合结构域)，例如但不限于来自例如多核苷酸引导的核酸内切酶、CRISPR-Cas效应蛋白(例如CRISPR-Cas核酸内切酶)、锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)和/或Argonaute蛋白的序列特异性结合多肽和/或结构域。在一些实施方案中，核酸结合多肽包含切割多肽(例如核酸酶多肽和/或结构域)，例如但不限于核酸内切酶(例如Fok1)、多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶、锌指核酸酶和/或转录激活因子样效应物核酸酶(TALEN)。在一些实施方案中，核酸结合多肽与一个或多个核酸分子缔合和/或能够与其缔合(例如，与一个或多个核酸分子形成复合物(例如，与本文所述的引导核酸形成复合物))，所述核酸分子可以将核酸结合多肽导向或引导至与一个或多个核酸分子(或其部分或区域)互补的特定靶核苷酸序列(例如，基因组的基因座)，从而导致核酸结合多肽与特定靶位点的核苷酸序列结合。在一些实施方案中，核酸结合多肽是如本文所述的CRISPR-Cas效应蛋白。在一些实施方案中，为了简单起见，特别提及CRISPR-Cas效应蛋白，但是可以使用如本文所述的核酸结合多肽。在一些实施方案中，本发明的多核苷酸和/或核酸构建体可以是“表达盒”或可以包含在表达盒内。

在一些实施方案中，提供了一种编辑油菜植物或植物部分中的内源性SHATTERPROOF MADS-BOX(SHP)基因(例如，SHP1、SHP2、SHP3和/或SHP4)的方法，所述方法包括使油菜植物或植物部分中内源性SHP基因中的靶位点与胞嘧啶碱基编辑系统接触，该胞嘧啶碱基编辑系统包含胞嘧啶脱氨酶和与内源性SHP基因中的靶位点结合的核酸结合结构域，其中内源性SHP基因:(a)包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核苷酸序列；(b)包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列具有至少80％的序列同一性的区域；(c)编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的SHP多肽；和/或(d)编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的SHP多肽的区域，从而编辑油菜植物或其部分中的内源性SHP基因，并产生包含至少一个在内源性SHP基因中具有突变的细胞的油菜植物或其部分。

在一些实施方案中，提供了一种编辑油菜植物或植物部分中的内源性SHATTERPROOF MADS-BOX(SHP)基因(例如SHP1、SHP2、SHP3和/或SHP4)的方法，所述方法包括使油菜植物或植物部分中SHP基因中的靶位点与腺苷碱基编辑系统接触，该腺苷碱基编辑系统包含腺苷脱氨酶和与SHP基因中的靶位点结合的核酸结合结构域，其中SHP基因(a)包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核苷酸序列；(b)包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列具有至少80％的序列同一性的区域；(c)编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的SHP多肽；和/或(d)编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的SHP多肽的区域，从而编辑油菜植物或其部分中的内源性SHP基因，并产生包含至少一个在内源性SHP基因中具有突变的细胞的油菜植物或其部分。

在一些实施方案中，提供了一种在油菜植物中产生SHATTERPROOFMADS-BOX(SHP)基因(例如，SHP1、SHP2、SHP3和/或SHP4)中的突变的方法，所述方法包括：(a)使基因编辑系统靶向内源性SHP基因的部分，该内源性SHP基因的部分：(i)包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个具有至少80％的序列同一性的序列；和/或(ii)编码与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个具有至少80％的同一性的序列，以及(b)选择在与SEQ ID NO:75-82、85-92、107-112、116-120、124-127、129、135、136、139、140、156、157、159-161、164-166、181-184、187-190、195、196、212-219、222-224、229、230、246-248、251-253、255-257、261-264、267、268、271、272、275、276、279、280、283或285中任一个具有至少80％的同一性的区域中包含修饰的核酸序列的油菜植物。在一些实施方案中，修饰是缺失或插入。在一些实施方案中，修饰是框外缺失或框外插入，导致截短的Shatterproof MADS-box转录因子(SHP)多肽。

在一些实施方案中，由本发明方法提供的突变可以是非天然突变。在一些实施方案中，突变可以是置换、插入和/或缺失，任选地，其中插入或缺失是框外插入或框外缺失。在一些实施方案中，突变可以是亚效等位基因突变、显性负性突变或显性负性亚效等位基因突变。在一些实施方案中，突变可以包括对A、T、G或C的碱基置换。在一些实施方案中，突变可以是约1个碱基对至约100个连续碱基对的缺失(例如，框外缺失)，任选地，缺失1至约50个连续碱基对，1至约30个连续碱基对，1至约15个连续碱基对。在一些实施方案中，突变可以是至少一个碱基对(例如，1个碱基对至约100个连续碱基对)的插入(例如，框外插入)。SHP基因中的突变可以位于SHP基因的3'区域，任选地，其中突变可以位于编码SHP多肽的内源性SHP基因的部分或区域中(例如，编码区(外显子)中，例如，倒数第二个外显子和/或最后一个外显子中)。在一些实施方案中，SHP基因中的突变可以位于SHP基因的倒数第二个外显子和最后一个外显子之间的内含子中。在一些实施方案中，突变可以位于SHP基因的区域中，所述区域桥接倒数第二个外显子和位于SHP基因倒数第二个外显子和最后一个外显子之间的内含子(例如，紧邻倒数第二个外显子3'的内含子)。SHP基因中的突变可导致多肽具有由最后一个外显子编码的氨基酸的缺失，任选地缺失由最后一个外显子编码的氨基酸和由SHP基因的倒数第二个外显子编码的至少一个氨基酸(例如，1、2、3、4、5、6、7、8、9、10、11、12或13个氨基酸)。在一些实施方案中，作为框外缺失或框外插入的SHP基因的突变可导致过早终止密码子和截短的SHP多肽。在一些实施方案中，框外缺失或框外插入可以是亚效等位基因突变、显性负性突变或显性负性亚效等位基因突变。

在一些实施方案中，提供了一种检测油菜植物中突变体SHATTERPROOF MADS-BOX(SHP)基因(例如SHP1、SHP2、SHP3和/或SHP4)的方法，所述方法包括在油菜植物的基因组中检测编码截短的SHP多肽的内源性SHP基因，任选地，其中突变位于SHP基因的3'区域(任选地，倒数第二个外显子和/或最后一个外显子和/或位于倒数第二个外显子和最后一个外显子之间的内含子)，该3'区域与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列具有至少80％的序列同一性，任选地，与SEQ IDNO:75-82、85-92、107-112、116-120、124-127、129、135、136、139、140、156、157、159-161、164-166、181-184、187-190、195、196、212-219、222-224、229、230、246-248、251-253、255-257、261-264、267、268、271、272、275、276、279、280、283或285中任一个具有至少80％的序列同一性。在一些实施方案中，检测到的突变是框外缺失或框外插入。

在一些实施方案中，本发明提供了一种产生油菜植物的方法，所述油菜植物包含内源性SHATTERPROOF MADS-BOX(SHP)基因(例如SHP1、SHP2、SHP3和/或SHP4)中的突变和至少一种感兴趣的多核苷酸，所述方法包括使本发明的包含内源性SHP基因中的至少一个突变的油菜植物(第一油菜植物)与包含至少一种感兴趣的多核苷酸的第二油菜植物杂交以产生子代油菜植物；以及选择包含SHP基因中的至少一个突变和至少一种感兴趣的多核苷酸的子代油菜植物，从而产生包含内源性SHP基因中的突变和至少一种感兴趣的多核苷酸的油菜植物。

本发明还提供了一种产生油菜植物的方法，所述油菜植物包含内源性SHATTERPROOF MADS-BOX(SHP)基因(例如SHP1、SHP2、SHP3和/或SHP4)中的突变和至少一种感兴趣的多核苷酸，所述方法包括将至少一种感兴趣的多核苷酸引入本发明的油菜植物中，所述油菜植物包含SHP基因中的至少一个突变，从而产生包含SHP基因中的至少一个突变和至少一种感兴趣的多核苷酸的油菜植物。

在一些实施方案中，还提供了一种产生油菜植物的方法，所述油菜植物包含内源性SHATTERPROOF MADS-BOX(SHP)基因(例如SHP1、SHP2、SHP3和/或SHP4)中的突变并表现出减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的表型，所述方法包括将第一油菜植物(其为本发明的油菜植物，包含SHP基因中的至少一个突变)与第二油菜植物杂交，第二油菜植物表现出减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的表型；并选择包含SHP基因中的突变和减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)表型的子代油菜植物，从而产生包含内源性SHP基因中的突变并且与对照植物相比表现出减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的表型的油菜植物。

还提供了一种防治容器(例如，花盆或育苗盘等)、生长室、温室、田地、休闲区、草坪或路边的杂草的方法，所述方法包括对在容器、生长室、温室、田地、休闲区、草坪或路边生长的本发明的一种或多种(多种)油菜植物(例如，本文所述的包含SHATTERPROOF MADS-BOX(SHP)基因(例如，SHP1、SHP2、SHP3和/或SHP4)中的至少一个突变的油菜植物)施用除草剂，从而防治其中生长有所述一种或多种油菜植物的容器、生长室、温室、田地、休闲区、草坪或路边的杂草。

在一些实施方案中，提供了一种减少昆虫对油菜植物捕食的方法，所述方法包括向本发明的一种或多种油菜植物施用杀虫剂，任选地，其中一种或多种油菜植物生长在容器、生长室、温室、田地、休闲区、草坪或路边，从而减少昆虫对一种或多种油菜植物的捕食。

在一些实施方案中，提供了一种减少油菜植物上的物真菌病害的方法，所述方法包括将杀真菌剂施用于本发明的一种或多种油菜植物，任选地，其中一种或多种油菜植物生长在容器、生长室、温室、田地、休闲区、草坪或路边，从而减少一种或多种油菜植物上的真菌病害。

表1中提供了用于本发明的实例内源性SHP基因和编码的SHP多肽，以及用于编辑的靶区域和实例编辑的SHP基因和编码多肽。

表1.

感兴趣的多核苷酸可以是可以赋予植物以期望的表型或另外改变表型或基因型的任何多核苷酸。在一些实施方案中，感兴趣的多核苷酸可以是赋予除草剂耐受性、抗虫性、线虫抗性、抗病性、增加的产量、增加的养分利用效率或非生物胁迫抗性的多核苷酸。

因此，根据本发明优选的待处理的植物或植物品种包括通过基因修饰获得遗传物质的所有植物，这些遗传物质赋予这些植物特别有利的有用特性(“性状”)。这些特性的例子是更好的植物生长、活力、抗胁迫性、站立性、抗倒伏性、养分吸收、植物营养和/或产量，特别是改善的生长、增加的对高温或低温的耐受性、增加的对干旱或对水或土壤盐度的耐受性、增强的开花性能、更容易收获、加速成熟、更高的产量、更高的质量和/或收获产品的更高营养价值，更长的储存寿命和/或收获产品的可加工性。

这些特性的进一步实例是对动物和微生物害虫的抵抗力提高，诸如对昆虫、蛛形纲动物、线虫、螨虫、蛞蝓和蜗牛的抵抗力，例如，因植物中形成的毒素所致。在编码赋予对此类动物和微生物害虫，特别是昆虫的耐受性特性的蛋白质的DNA序列中，将特别提到来自苏云金芽孢杆菌的编码Bt蛋白的遗传物质，Bt蛋白在文献中被广泛描述并为本领域技术人员所熟知。还将提到从细菌中提取的蛋白质，所述细菌诸如发光杆菌属(Photorhabdus)(WO97/17432和WO98/08932)。特别要提到的是Bt Cry或VIP蛋白，包括CrylA、CryIAb、CryIAc、CryIIA、CryIIIA、CryIIIB2、Cry9c Cry2Ab、Cry3Bb和CryIF蛋白或其毒性片段，以及它们的杂交体或组合，特别是CrylF蛋白或源自CrylF蛋白的杂交体(例如杂交CrylA-CrylF蛋白或其毒性片段)，CrylA型蛋白或其毒性片段，优选CrylAc蛋白或衍生自CrylAc蛋白的杂交体(例如，杂交CrylAb-CrylAc蛋白)或CrylAb或Bt2蛋白或其毒性片段，Cry2Ae、Cry2Af或Cry2Ag蛋白或其毒性片段，CrylA.105蛋白或其毒性片段，VIP3Aa19蛋白，VIP3Aa20蛋白，在COT202或COT203棉花事件中产生的VIP3A蛋白，VIP3Aa蛋白或其毒性片段，如Estruch等人(1996),Proc Natl Acad Sci USA.28；93(11):5389-94中所述，如WO2001/47952中所述的Cry蛋白，来自致病杆菌属(Xenorhabdus)的杀虫蛋白(如WO98/50427中所述)、沙雷氏菌属(特别是来自嗜虫沙雷氏菌)或发光杆菌属菌株，诸如WO98/08932中所述的来自发光杆菌属的Tc蛋白。此外，这些蛋白质中任一个在某些氨基酸(1-10个，优选1-5个)上与上述命名的序列中任一个不同的任何变体或突变体，特别是它们的毒性片段的序列，或与转运肽融合，诸如质体转运肽，或另一种蛋白质或肽，都包括在本文中。

这种特性的另一个特别强调的实例是赋予对一种或多种除草剂的耐受性，所述除草剂例如咪唑啉酮、磺酰脲类、草甘膦或草丁膦。在编码蛋白质(即，感兴趣的多核苷酸)的DNA序列中，这些蛋白质赋予经转化的植物细胞和植物对某些除草剂的耐受性的特性，将特别提到WO2009/152359中描述的bar或PAT基因或天蓝链霉菌(Streptomyces coelicolor)基因，所述基因赋予对草铵膦除草剂的耐受性；编码合适的EPSPS(5-烯醇丙酮酰莽草酸-3-磷酸-合酶)的基因赋予对以EPSPS为靶标的除草剂的耐受性，特别是诸如草甘膦及其盐类的除草剂；编码草甘膦-n-乙酰转移酶的基因，或编码草甘膦氧化还原酶的基因。其它合适的耐除草剂性状包括至少一种ALS(乙酰乳酸合酶)抑制剂(例如，WO2007/024782)，突变的拟南芥ALS/AHAS基因(例如，美国专利6,855,533)，编码2,4-D-单加氧酶的基因赋予对2,4-D(2,4-二氯苯氧乙酸)的耐受性和编码麦草畏单加氧酶的基因赋予对麦草畏(3,6-二氯-2-甲氧基苯甲酸)的耐受性。

这些特性的进一步实例是对植物病原真菌、细菌和/或病毒的抗性增强，例如，因系统获得性抗性(SAR)、系统素(systemin)、植物抗毒素、诱导子以及抗性基因和相应表达的蛋白质和毒素所致。

可以优先地根据本发明处理的转基因植物或植物栽培种中的特别有用的转基因事件包括：事件531/PV-GHBK04(棉花，昆虫防治，记载于WO2002/040677)，事件1143-14A(棉花，昆虫防治，未保藏，记载于WO2006/128569)；事件1143-51B(棉花，昆虫防治，未保藏，记载于WO2006/128570)；事件1445(棉花，除草剂耐受性，未保藏，记载于US-A 2002-120964或WO2002/034946)；事件17053(水稻，除草剂耐受性，保藏为PTA-9843，记载于WO2010/117737)；事件17314(水稻，除草剂耐受性，保藏为PTA-9844，记载于WO2010/117735)；事件281-24-236(棉花，昆虫防治-除草剂耐受性，保藏为PTA-6233，记载于WO2005/103266或US-A 2005-216969)；事件3006-210-23(棉花，昆虫防治-除草剂耐受性，保藏为PTA-6233，记载于US-A 2007-143876或WO2005/103266)；事件3272(玉米，质量性状，保藏为PTA-9972，记载于WO2006/098952或US-A 2006-230473)；事件33391(小麦，除草剂耐受性，保藏为PTA-2347，记载于WO2002/027004)，事件40416(玉米，昆虫防治-除草剂耐受性，保藏为ATCCPTA-11508，记载于WO 11/075593)；事件43A47(玉米，昆虫防治-除草剂耐受性，保藏为ATCCPTA-11509，记载于WO2011/075595)；事件5307(玉米，昆虫防治，保藏为ATCC PTA-9561，记载于WO2010/077816)；事件ASR-368(翦股颖，除草剂耐受性，保藏为ATCC PTA-4816，记载于US-A 2006-162007或WO2004/053062)；事件B16(玉米，除草剂耐受性，未保藏，记载于US-A2003-126634)；事件BPS-CV127-9(大豆，除草剂耐受性，保藏为NCIMB No.41603，记载于WO2010/080829)；事件BLRl(油菜，恢复雄性不育，保藏为NCIMB 41193，记载于WO2005/074671)，事件CE43-67B(棉花，昆虫防治，保藏为DSMACC2724，记载于US-A 2009-217423或WO2006/128573)；事件CE44-69D(棉花，昆虫防治，未保藏，记载于US-A 2010-0024077)；事件CE44-69D(棉花，昆虫防治，未保藏，记载于WO2006/128571)；事件CE46-02A(棉花，昆虫防治，未保藏，记载于WO2006/128572)；事件COT102(棉花，昆虫防治，未保藏，记载于US-A2006-130175或WO2004/039986)；事件COT202(棉花，昆虫防治，未保藏，记载于US-A 2007-067868或WO2005/054479)；事件COT203(棉花，昆虫防治，未保藏，记载于WO2005/054480)；事件DAS21606-3/1606(大豆，除草剂耐受性，保藏为PTA-11028，记载于WO2012/033794)，事件DAS40278(玉米，除草剂耐受性，保藏为ATCC PTA-10244，记载于WO2011/022469)；事件DAS-44406-6/pDAB8264.44.06.l(大豆，除草剂耐受性，保藏为PTA-11336，记载于WO2012/075426)，事件DAS-14536-7/pDAB8291.45.36.2(大豆，除草剂耐受性，保藏为PTA-11335，记载于WO2012/075429)，事件DAS-59122-7(玉米，昆虫防治-除草剂耐受性，保藏为ATCC PTA11384，记载于US-A 2006-070139)；事件DAS-59132(玉米，昆虫防治-除草剂耐受性，未保藏，记载于WO2009/100188)；事件DAS68416(大豆，除草剂耐受性，保藏为ATCC PTA-10442，记载于WO2011/066384或WO2011/066360)；事件DP-098140-6(玉米，除草剂耐受性，保藏为ATCC PTA-8296，记载于US-A 2009-137395或WO 08/112019)；事件DP-305423-1(大豆，质量性状，未保藏，记载于US-A 2008-312082或WO2008/054747)；事件DP-32138-1(玉米，杂交系统，保藏为ATCC PTA-9158，记载于US-A 2009-0210970或WO2009/103049)；事件DP-356043-5(大豆，除草剂耐受性，保藏为ATCC PTA-8287，记载于US-A 2010-0184079或WO2008/002872)；事件EE-I(茄子，昆虫防治，未保藏，记载于WO 07/091277)；事件Fil 17(玉米，除草剂耐受性，保藏为ATCC 209031，记载于US-A 2006-059581或WO 98/044140)；事件FG72(大豆，除草剂耐受性，保藏为PTA-11041，记载于WO2011/063413)，事件GA21(玉米，除草剂耐受性，保藏为ATCC 209033，记载于US-A 2005-086719或WO 98/044140)；事件GG25(玉米，除草剂耐受性，保藏为ATCC 209032，记载于US-A 2005-188434或WO98/044140)；事件GHB119(棉花，昆虫防治-除草剂耐受性，保藏为ATCC PTA-8398，记载于WO2008/151780)；事件GHB614(棉花，除草剂耐受性，保藏为ATCC PTA-6878，记载于US-A 2010-050282或WO2007/017186)；事件GJ11(玉米，除草剂耐受性，保藏为ATCC 209030，记载于US-A 2005-188434或WO98/044140)；事件GM RZ13(糖用甜菜，抗病毒性，保藏为NCIMB-41601，记载于WO2010/076212)；事件H7-l(糖用甜菜，除草剂耐受性，保藏为NCIMB 41158或NCIMB 41159，记载于US-A 2004-172669或WO 2004/074492)；事件JOPLINl(小麦，抗病性，未保藏，记载于US-A 2008-064032)；事件LL27(大豆，除草剂耐受性，保藏为NCIMB41658，记载于WO2006/108674或US-A 2008-320616)；事件LL55(大豆，除草剂耐受性，保藏为NCIMB 41660，记载于WO 2006/108675或US-A 2008-196127)；事件LLcotton25(棉花，除草剂耐受性，保藏为ATCCPTA-3343，记载于WO2003/013224或US-A 2003-097687)；事件LLRICE06(水稻，除草剂耐受性，保藏为ATCC 203353，记载于US 6,468,747或WO2000/026345)；事件LLRice62(水稻，除草剂耐受性，保藏为ATCC 203352，记载于WO2000/026345)，事件LLRICE601(水稻，除草剂耐受性，保藏为ATCC PTA-2600，记载于US-A 2008-2289060或WO2000/026356)；事件LY038(玉米，质量性状，保藏为ATCC PTA-5623，记载于US-A2007-028322或WO2005/061720)；事件MIR162(玉米，昆虫防治，保藏为PTA-8166，记载于US-A 2009-300784或WO2007/142840)；事件MIR604(玉米，昆虫防治，未保藏，记载于US-A 2008-167456或WO2005/103301)；事件MON15985(棉花，昆虫防治，保藏为ATCCPTA-2516，记载于US-A 2004-250317或WO2002/100163)；事件MON810(玉米，昆虫防治，未保藏，记载于US-A 2002-102582)；事件MON863(玉米，昆虫防治，保藏为ATCC PTA-2605，记载于WO2004/011601或US-A 2006-095986)；事件MON87427(玉米，人工授粉，保藏为ATCC PTA-7899，记载于WO2011/062904)；事件MON87460(玉米，胁迫抗性，保藏为ATCC PTA-8910，记载于WO2009/111263或US-A 2011-0138504)；事件MON87701(大豆，昆虫防治，保藏为ATCC PTA-8194，记载于US-A 2009-130071或WO2009/064652)；事件MON87705(大豆，质量性状-除草剂耐受性，保藏为ATCC PTA-9241，记载于US-A 2010-0080887或WO2010/037016)；事件MON87708(大豆，除草剂耐受性，保藏为ATCCPTA-9670，记载于WO2011/034704)；事件MON87712(大豆，产量，保藏为PTA-10296，记载于WO2012/051199)，事件MON87754(大豆，质量性状，保藏为ATCC PTA-9385，记载于WO2010/024976)；事件MON87769(大豆，质量性状，保藏为ATCC PTA-8911，记载于US-A 2011-0067141或WO2009/102873)；事件MON88017(玉米，昆虫防治-除草剂耐受性，保藏为ATCCPTA-5582，记载于US-A 2008-028482或WO2005/059103)；事件MON88913(棉花，除草剂耐受性，保藏为ATCC PTA-4854，记载于WO2004/072235或US-A 2006-059590)；事件MON88302(油菜，除草剂耐受性，保藏为PTA-10955，记载于WO2011/153186)，事件MON88701(棉花，除草剂耐受性，保藏为PTA-11754，记载于WO2012/134808)，事件MON89034(玉米，昆虫防治，保藏为ATCC PTA-7455，记载于WO 07/140256或US-A 2008-260932)；事件MON89788(大豆，除草剂耐受性，保藏为ATCC PTA-6708，记载于US-A 2006-282915或WO2006/130436)；事件MSl 1(油菜，人工授粉-除草剂耐受性，保藏为ATCC PTA-850或PTA-2485，记载于WO2001/031042)；事件MS8(油菜，人工授粉-除草剂耐受性，保藏为ATCC PTA-730，记载于WO2001/041558或US-A 2003-188347)；事件NK603(玉米，除草剂耐受性，保藏为ATCC PTA-2478，记载于US-A 2007-292854)；事件PE-7(水稻，昆虫防治，未保藏，记载于WO2008/114282)；事件RF3(油菜，人工授粉-除草剂耐受性，保藏为ATCC PTA-730，记载于WO2001/041558或US-A2003-188347)；事件RT73(油菜，除草剂耐受性，未保藏，记载于WO2002/036831或US-A2008-070260)；事件SYHT0H2/SYN-000H2-5(大豆，除草剂耐受性，保藏为PTA-11226，记载于WO2012/082548)，事件T227-1(糖用甜菜，除草剂耐受性，未保藏，记载于WO2002/44407或US-A 2009-265817)；事件T25(玉米，除草剂耐受性，未保藏，记载于US-A 2001-029014或WO2001/051654)；事件T304-40(棉花，昆虫防治-除草剂耐受性，保藏为ATCC PTA-8171，记载于US-A 2010-077501或WO2008/122406)；事件T342-142(棉花，昆虫防治，未保藏，记载于WO2006/128568)；事件TC1507(玉米，昆虫防治-除草剂耐受性，未保藏，记载于US-A 2005-039226或WO2004/099447)；事件VIP1034(玉米，昆虫防治-除草剂耐受性，保藏为ATCC PTA-3925，记载于WO2003/052073)，事件32316(玉米，昆虫防治-除草剂耐受性，保藏为PTA-11507，记载于WO2011/084632)，事件4114(玉米，昆虫防治-除草剂耐受性，保藏为PTA-11506，记载于WO2011/084621)，事件EE-GM3/FG72(大豆，除草剂耐受性，ATCC登录号N°PTA-11041)任选地叠加事件EE-GM1/LL27或事件EE-GM2/LL55(WO2011/063413A2)，事件DAS-68416-4(大豆，除草剂耐受性，ATCC登录号N°PTA-10442，WO2011/066360A1)，事件DAS-68416-4(大豆，除草剂耐受性，ATCC登录号N°PTA-10442，WO2011/066384A1)，事件DP-040416-8(玉米，昆虫防治，ATCC登录号N°PTA-11508，WO2011/075593A1)，事件DP-043A47-3(玉米，昆虫防治，ATCC登录号N°PTA-11509，WO2011/075595A1)，事件DP-004114-3(玉米，昆虫防治，ATCC登录号N°PTA-11506，WO2011/084621A1)，事件DP-032316-8(玉米，昆虫防治，ATCC登录号N°PTA-11507，WO2011/084632A1)，事件MON-88302-9(油菜，除草剂耐受性，ATCC登录号N°PTA-10955，WO2011/153186A1)，事件DAS-21606-3(大豆，除草剂耐受性，ATCC登录号No.PTA-11028，WO2012/033794A2)，事件MON-87712-4(大豆，质量性状，ATCC登录号N°.PTA-10296，WO2012/051199A2)，事件DAS-44406-6(大豆，叠加了除草剂耐受性，ATCC登录号N°.PTA-11336，WO2012/075426A1)，事件DAS-14536-7(大豆，叠加了除草剂耐受性，ATCC登录号N°.PTA-11335，WO2012/075429A1)，事件SYN-000H2-5(大豆，除草剂耐受性，ATCC登录号N°.PTA-11226，WO2012/082548A2)，事件DP-061061-7(油菜，除草剂耐受性，无保藏N°可获得，WO2012071039A1)，事件DP-073496-4(油菜，除草剂耐受性，无保藏N°可获得，US2012131692)，事件8264.44.06.1(大豆，叠加了除草剂耐受性，登录号N°PTA-11336，WO2012075426A2)，事件8291.45.36.2(大豆，叠加了除草剂耐受性，登录号N°.PTA-11335，WO2012075429A2)，事件SYHT0H2(大豆，ATCC登录号N°.PTA-11226，WO2012/082548A2)，事件MON88701(棉花，ATCC登录号N°PTA-11754，WO2012/134808A1)，事件KK179-2(苜蓿，ATCC登录号N°PTA-11833，WO2013/003558A1)，事件pDAB8264.42.32.1(大豆，叠加了除草剂耐受性，ATCC登录号N°PTA-11993，WO2013/010094A1)，事件MZDT09Y(玉米，ATCC登录号N°PTA-13025，WO2013/012775A1)。

赋予关心的期望性状的基因/事件(例如，感兴趣的多核苷酸)也可以在转基因植物中与另一基因/事件彼此组合存在。可以提及的转基因植物的实例是重要作物植物，诸如谷物(小麦、水稻、黑小麦、大麦、黑麦、燕麦)、玉米、大豆、马铃薯、糖用甜菜、甘蔗、番茄、豌豆和其它类型的蔬菜、棉花、烟草、油菜和水果植物(水果有苹果、梨、柑橘类水果和葡萄)，特别强调玉米、大豆、小麦、水稻、马铃薯、棉花、甘蔗、烟草和油菜。特别强调的性状是植物对昆虫、蛛形纲动物、线虫、蛞蝓和蜗牛的抗性增强，以及植物对一种或多种除草剂的耐受性增强。

根据本发明可以优先处理的此类植物、植物部分或植物种子的市售实例包括商业产品，诸如以 ROUNDUPREADY2ROUNDUP2XTENDTM、INTACTA RR2VISTIVE和/或XTENDFLEX^TM商品名销售或分销的植物种子。

用于本发明的SHATTERPROOF MADS-BOX(SHP)基因(例如，SHP1、SHP2、SHP3和/或SHP4)包括任何油菜SHP基因，其中如本文所述的突变可以在包含突变的油菜植物或其部分中赋予减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)。在一些实施方案中，内源性SHP基因：(a)包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核苷酸序列；(b)包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列具有至少80％的序列同一性的区域；(c)编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的SHP多肽；和/或(d)编码与SEQID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的SHP多肽的区域。

在一些实施方案中，油菜植物内源性SHP基因中的至少一个突变可以是碱基置换、碱基缺失和/或碱基插入，任选地，其中至少一个突变可以是非天然突变。在一些实施方案中，与没有编辑/突变的对照植物相比，油菜植物内源性SHP基因中的至少一个突变可以导致油菜植物具有减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的表型。本发明的油菜植物具有减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的表型，也可以表现出/提供可收获的种子的增加。

在一些实施方案中，内源性SHP基因中的突变可以是至少1个碱基对的碱基置换、碱基缺失和/或碱基插入。在一些实施方案中，碱基缺失可以是1个核苷酸至约100个核苷酸(例如，约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63，64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个碱基对，或其中的任何范围或值，例如1至约50个碱基对，1至约30个碱基对，1至约15个碱基对，或其中的任何范围或值)，任选地，其中突变位于约2至约100个连续核苷酸(例如，1至约50个连续碱基对，1至约30个连续碱基对，1至约15个连续碱基对)。在一些实施方案中，内源性SHP基因中的突变可以是SHP核酸的1至约100个连续核苷酸的碱基插入。在一些实施方案中，内源性SHP基因中的突变可以是框外插入或框外缺失，其导致SHP蛋白具有C末端截短。在一些实施方案中，至少一个突变可以是碱基置换，任选地，是对A、T、G或C的置换。对本发明有用的突变可以是点突变。在一些实施方案中，突变可以是非天然突变。

在一些实施方案中，内源性SHP基因中的突变可以在编辑系统切割后产生，该编辑系统包含核酸酶和核酸结合结构域，该核酸结合结构域与靶核酸(例如，内源性SHP基因，例如SHP1、SHP2、SHP3和/或SHP4)内的靶位点结合，该靶核酸包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个核苷酸序列具有至少80％的序列同一性的序列，和/或编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的氨基酸序列，任选地，其中靶位点位于SHP基因的区域中：所述区域包含与SEQID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个具有至少80％的同一性的序列和/或编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个的氨基酸序列具有至少80％的同一性的序列。

还提供了与SHATTERPROOF MADS-BOX(SHP)基因(例如，SHP1、SHP2、SHP3和/或SHP4)中的靶位点结合的引导核酸(例如，gRNA、gDNA、crRNA、crDNA)，其中靶位点在SHP基因的区域中，所述区域与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列，任选地SEQ ID NO:75-82、85-92、107-112、116-120、124-127、129、135、136、139、140、156、157、159-161、164-166、181-184、187-190、195、196、212-219、222-224、229、230、246-248、251-253、255-257、261-264、267、268、271、272、275、276、279、280、283或285中任一个具有至少80％的序列同一性。在一些实施方案中，引导核酸包含含有SEQ ID NO:292-297和/或SEQ ID NO:342-346中任一个核苷酸序列的间隔子。

在一些实施方案中，提供了一种油菜植物或其植物部分，其包含至少一种内源性SHATTERPROOF MADS-BOX(SHP)基因中的至少一个突变，所述基因具有BnaA04g01810D(SHP3)、BnaA07g18050D(SHP2)、BnaA05g02990D(SHP4)、BnaA09g55330D(SHP1)、BnaC04g23360D(SHP3)和/或BnaC06g16910D(SHP2)的基因识别号(基因ID)。

在一些实施方案中，提供了一种引导核酸，其与SHATTERPROOFMADS-BOX(SHP)基因中的靶核酸结合，所述基因具有BnaA04g01810D(SHP3)、BnaA07g18050D(SHP2)、BnaA05g02990D(SHP4)、BnaA09g55330D(SHP1)、BnaC04g23360D(SHP3)和/或BnaC06g16910D(SHP2)的基因识别号(基因ID)。

在一些实施方案中，提供了一种系统，所述系统包含引导核酸以及与引导核酸缔合的CRISPR-Cas效应蛋白，该引导核酸包含间隔子(例如，一个或多个间隔子)，该间隔子具有SEQ ID NO:292-297和/或SEQ IDNO:342-346中任一个核苷酸序列。在一些实施方案中，所述系统可还包含与引导核酸缔合的tracr核酸和CRISPR-Cas效应蛋白，任选地，其中tracr核酸和引导核酸共价连接。

如本文所用，“与引导核酸缔合的CRISPR-Cas效应蛋白”是指在CRISPR-Cas效应蛋白和引导核酸之间形成的复合物，以将CRISPR-Cas效应蛋白导向至基因中的靶位点。

本发明还提供了一种基因编辑系统，所述系统包含与引导核酸缔合的CRISPR-Cas效应蛋白，并且引导核酸包含与SHATTERPROOF MADS-BOX(SHP)基因结合的间隔序列，任选地，其中SHP基因：(a)包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核苷酸序列；(b)包含与SEQID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列具有至少80％的序列同一性的区域；(c)编码与SEQID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的SHP多肽；和/或(d)编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的SHP多肽的区域。在一些实施方案中，引导核酸的间隔序列可以包含SEQ ID NO:292-297和/或SEQ ID NO:342-346中任一个核苷酸序列。在一些实施方案中，基因编辑系统可以还包含与引导核酸缔合的tracr核酸和CRISPR-Cas效应蛋白，任选地，其中tracr核酸和引导核酸共价连接。

本发明还提供了一种包含CRISPR-Cas效应蛋白和引导核酸的复合物，该效应蛋白包含切割结构域，其中引导核酸与油菜内源性SHATTERPROOF MADS-BOX(SHP)基因中的靶位点结合，其中内源性SHP基因:(a)包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核苷酸序列；(b)包含与SEQ IDNO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列具有至少80％的序列同一性的区域；(c)编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的SHP多肽；和/或(d)编码与SEQID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的SHP多肽的区域，并且所述切割结构域切割SHP基因中的靶链。

在一些实施方案中，提供了表达盒，所述表达盒包含：(a)编码包含切割结构域的CRISPR-Cas效应蛋白的多核苷酸和(b)与内源性SHATTERPROOF MADS-BOX(SHP)基因中的靶位点结合的引导核酸，其中引导核酸包含与以下互补并结合的间隔序列：(i)与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或141中任一个具有至少80％的序列同一性的核酸的部分；(ii)与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338(任选SEQ ID NO:75-82、85-92、107-112、116-120、124-127、129、135、136、139、140、156、157、159-161、164-166、181-184、187-190、195、196、212-219、222-224、229、230、246-248、251-253、255-257、261-264、267、268、271、272、275、276、279、280、283或285)中任一个具有至少90％的序列同一性的核酸的部分；(iii)编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的氨基酸序列的核酸的部分；和/或(iv)编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的同一性的氨基酸序列的核酸的部分。

还提供了编码Shatterproof MADS-box转录因子(SHP)多肽(例如，SHP1、SHP2、SHP3、SHP4)的核酸，任选地，其中当突变的SHP多肽/突变的SHP基因存在于油菜植物或植物部分中时，突变的SHP多肽/突变的SHP基因导致的油菜植物与没有突变的对照油菜植物或植物部分相比，具有减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的表型。

本发明的核酸构建体(例如，包含序列特异性核酸结合结构域(例如，序列特异性DNA结合结构域)、CRISPR-Cas效应结构域、脱氨酶结构域、逆转录酶(RT)、RT模板和/或引导核酸等的构建体)以及包含该核酸构建体的表达盒/载体可用作本发明的编辑系统，用于修饰靶核酸(例如，内源性SHP基因，例如，内源性SHP1基因、内源性SHP2基因、内源性SHP3基因、内源性SHP4基因)和/或它们的表达。

包含内源性SHP基因的任何油菜植物(当按照本文所述修饰内源性SHP基因时，能够赋予减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量))可以按照本文所述进行修饰(例如突变，例如碱基编辑、切割、切口等)(例如，使用本发明的多肽、多核苷酸、RNP、核酸构建体、表达盒和/或载体)以减少油菜植物荚果开裂和/或减少荚果瓣边缘的木质化(减少的木质素含量)。

可用于本发明的编辑系统可以是现在已知或以后开发的任何位点特异性(序列特异性)基因组编辑系统，所述系统可以以靶标特异性的方式引入突变。例如，编辑系统(例如，位点或序列特异性编辑系统)可以包括但不限于，CRISPR-Cas编辑系统、兆核酸酶编辑系统、锌指核酸酶(ZFN)编辑系统、转录激活因子样效应物核酸酶(TALEN)编辑系统、碱基编辑系统和/或先导编辑系统，其中每个系统可以包含一个或多个多肽和/或一个或多个多核苷酸，当在细胞中作为一个系统表达时可以以序列特异性方式修饰(突变)靶核酸。在一些实施方案中，编辑系统(例如，位点或序列特异性编辑系统)可以包含一个或多个多核苷酸和/或一个或多个多肽，包括但不限于核酸结合结构域(DNA结合结构域)、核酸酶、和/或其它多肽、和/或多核苷酸。

在一些实施方案中，编辑系统可以包含一个或多个序列特异性核酸结合结构域(DNA结合结构域)，这些结构域可以来自，例如，多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如，CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)和/或Argonaute蛋白。在一些实施方案中，编辑系统可以包含一个或多个裂解结构域(例如，核酸酶)，包括但不限于，核酸内切酶(例如，Fok1)、多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如，CRISPR-Cas效应蛋白)、锌指核酸酶和/或转录激活因子样效应物核酸酶(TALEN)。在一些实施方案中，编辑系统可以包含一种或多种多肽，包括但不限于，脱氨酶(例如，胞嘧啶脱氨酶、腺嘌呤脱氨酶)、逆转录酶、Dna2多肽和/或5'flap核酸内切酶(FEN)。在一些实施方案中，编辑系统可以包含一个或多个多核苷酸，包括但不限于，CRISPR阵列(CRISPR引导)核酸、延伸的引导核酸和/或逆转录酶模板。

在一些实施方案中，修饰或编辑SHATTERPROOF MADS-BOX(SHP)基因的方法可以包括使靶核酸(例如编码Shatterproof MADS-box转录因子(SHP)多肽(例如SHP1多肽、SHP2多肽、SHP3多肽、SHP4多肽)的核酸)与融合至脱氨酶结构域(例如腺嘌呤脱氨酶和/或胞嘧啶脱氨酶)的碱基编辑性融合蛋白(例如序列特异性DNA结合蛋白(例如CRISPR-Cas效应蛋白或结构域)和引导核酸接触，其中引导核酸能够将碱基编辑性融合蛋白引导/靶向至靶核酸，从而编辑靶核酸内的基因座。在一些实施方案中，碱基编辑性融合蛋白和引导核酸可以包含在一个或多个表达盒中。在一些实施方案中，靶核酸可以与碱基编辑性融合蛋白和包含引导核酸的表达盒接触。在一些实施方案中，序列特异性核酸结合融合蛋白和引导物可以作为核糖核蛋白(RNP)提供。在一些实施方案中，细胞可以与一种以上的碱基编辑性融合蛋白和/或一种或多种引导核酸接触，所述引导核酸可以靶向细胞中的一个或多个靶核酸。

在一些实施方案中，修饰或编辑SHATTERPROOF MADS-BOX(SHP)基因的方法可以包括使靶核酸(例如编码SHP多肽的核酸)与融合至肽标签的序列特异性核酸结合融合蛋白(例如，序列特异性DNA结合蛋白(例如CRISPR-Cas效应蛋白或结构域)、包含融合至能够结合肽标签的亲和多肽的脱氨酶结构域(例如腺嘌呤脱氨酶和/或胞嘧啶脱氨酶)的脱氨酶融合蛋白和引导核酸接触，其中引导核酸能够将序列特异性核酸结合融合蛋白引导/靶向至靶核酸，并且序列特异性核酸结合融合蛋白能够经由肽标签-亲和多肽相互作用将脱氨酶融合蛋白募集至靶核酸，从而编辑靶核酸内的基因座。在一些实施方案中，序列特异性核酸结合融合蛋白可以与结合肽标签的亲和多肽融合，并且脱氨酶可以与肽标签融合，从而将脱氨酶募集到序列特异性核苷酸结合融合蛋白和靶核酸。在一些实施方案中，序列特异性结合融合蛋白、脱氨酶融合蛋白和引导核酸可以包含在一个或多个表达盒中。在一些实施方案中，靶核酸可以与序列特异性结合融合蛋白、脱氨酶融合蛋白和包含引导核酸的表达盒接触。在一些实施方案中，序列特异性核酸结合融合蛋白、脱氨酶融合蛋白和引导物可以作为核糖核蛋白(RNP)提供。

在一些实施方案中，可以使用诸如先导编辑的方法在油菜或其部分的内源性SHP基因中产生突变。在先导编辑中，RNA依赖性DNA聚合酶(逆转录酶，RT)和逆转录酶模板(RT模板)与序列特异性核酸结合结构域组合使用，这些结构域赋予以序列特异性方式识别和结合靶标的能力，并且还可以导致靶标内含PAM的链出现缺口。核酸结合结构域可以是CRISPR-Cas效应蛋白，在这种情况下，CRISPR阵列或引导RNA可以是延伸的引导物，其包括包含引物结合位点(PSB)和要掺入基因组的编辑(模板)的延伸部分。与碱基编辑类似，先导编辑可以利用各种募集蛋白质的方法用于对靶位点进行编辑，这些方法包括在选定的基因组编辑过程中使用的蛋白质和核酸之间的非共价和共价相互作用两者。

如本文所用，“CRISPR-Cas效应蛋白”是裂解或切割核酸、结合核酸(例如，靶核酸和/或引导核酸)和/或鉴定、识别或结合如本文定义的引导核酸的蛋白质或多肽或其结构域。在一些实施方案中，CRISPR-Cas效应蛋白可以是酶(例如，核酸酶、核酸内切酶、切口酶等)或其部分和/或可以作为酶起作用。在一些实施方案中，CRISPR-Cas效应蛋白是指CRISPR-Cas核酸酶多肽或其结构域，其包含核酸酶活性或其中核酸酶活性已降低或消除，和/或包含切口酶活性或其中切口酶已降低或消除，和/或包含单链DNA裂解活性(ss DNAse活性)或其中ssDNAse活性已降低或消除，和/或包含自加工RNAse活性或其中自加工RNAse活性已降低或消除。CRISPR-Cas效应蛋白可以与靶核酸结合。

在一些实施方案中，序列特异性核酸结合结构域可以是CRISPR-Cas效应蛋白。在一些实施方案中，CRISPR-Cas效应蛋白可以来自I型CRISPR-Cas系统、II型CRISPR-Cas系统、III型CRISPR-Cas系统、IV型CRISPR-Cas系统、V型CRISPR-Cas系统或VI型CRISPR-Cas系统。在一些实施方案中，本发明的CRISPR-Cas效应蛋白可以来自II型CRISPR-Cas系统或V型CRISPR-Cas系统。在一些实施方案中，CRISPR-Cas效应蛋白可以是II型CRISPR-Cas效应蛋白，例如，Cas9效应蛋白。在一些实施方案中，CRISPR-Cas效应蛋白可以是V型CRISPR-Cas效应蛋白，例如Cas12效应蛋白。

在一些实施方案中，CRISPR-Cas效应蛋白可以包括但不限于，Cas9、C2c1、C2c3、Cas12a(也称为Cpf1)、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3'、Cas3”、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csnl和Csx12)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG)，和/或Csf5核酸酶，任选地其中CRISPR-Cas效应蛋白可以是Cas9、Cas12a(Cpf1)、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b，和/或Cas14c效应蛋白。

在一些实施方案中，可用于本发明的CRISPR-Cas效应蛋白可以包含在其核酸酶活性位点(例如，RuvC、HNH，例如，Cas12a核酸酶结构域的RuvC位点；例如，Cas9核酸酶结构域的RuvC位点和/或HNH位点)中的突变。CRISPR-Cas效应蛋白在其核酸酶活性位点发生突变，因此不再包含核酸酶活性，通常称为“死”，例如，dCas。在一些实施方案中，与没有突变的相同CRISPR-Cas效应蛋白(例如，切口酶，例如，Cas9切口酶，Cas12a切口酶)相比，在其核酸酶活性位点中具有突变的CRISPR-Cas效应蛋白结构域或多肽可以具有活性受损或活性降低。

可用于本发明的CRISPR Cas9效应蛋白或CRISPR Cas9效应结构域可以是任何已知或后来鉴定的Cas9核酸酶。在一些实施方案中，CRISPR Cas9多肽可以是来自例如链球菌属(例如，酿脓链球菌、嗜热链球菌)、乳杆菌属(Lactobacillus spp.)、双歧杆菌属(Bifidobacteriumspp.)、坎德尔菌属(Kandleria spp.)、明串珠菌属(Leuconostocspp.)、酒球菌属(Oenococcus spp.)、片球菌属(Pediococcus spp.)、魏斯氏菌属(Weissella spp.)和/或欧鲁森氏菌属(Olsenella spp.)的Cas9多肽。示例性Cas9序列包括但不限于，SEQ ID NO:56和SEQ ID NO:57的氨基酸序列或SEQ ID NO:58-68的核苷酸序列。

在一些实施方案中，CRISPR-Cas效应蛋白可以是源自酿脓链球菌的Cas9多肽，并识别PAM序列基序NGG、NAG、NGA(Mali等人，Science 2013；339(6121):823-826)。在一些实施方案中，CRISPR-Cas效应蛋白可以是源自嗜热链球菌的Cas9多肽，并识别PAM序列基序NGGNG和/或NNAGAAW(W＝A或T)(参见，例如，Horvath等人，Science，2010；327(5962):167-170，和Deveau等人，J Bacteriol2008；190(4):1390-1400)。在一些实施方案中，CRISPR-Cas效应蛋白可以是源自变形链球菌的Cas9多肽，并识别PAM序列基序NGG和/或NAAR(R＝A或G)(参见，例如，Deveau等人，J BACTERIOL2008；190(4):1390-1400)。在一些实施方案中，CRISPR-Cas效应蛋白可以是源自金黄色葡萄球菌的Cas9多肽，并识别PAM序列基序NNGRR(R＝A或G)。在一些实施方案中，CRISPR-Cas效应蛋白可以是源自金黄色葡萄球菌的Cas9蛋白，其识别PAM序列基序N GRRT(R＝A或G)。在一些实施方案中，CRISPR-Cas效应蛋白可以是源自金黄色葡萄球菌的Cas9多肽，其识别PAM序列基序N GRRV(R＝A或G)。在一些实施方案中，CRISPR-Cas效应蛋白可以是源自脑膜炎奈瑟氏菌的Cas9多肽，并识别PAM序列基序NGATT或N GCTT(R＝A或G，V＝A，G或C)(参见，例如，Hou等人，PNAS 2013，1-6)。在上述实施方案中，N可以是任何核苷酸残基，例如，A、G、C或T中的任一种。在一些实施方案中，CRISPR-Cas效应蛋白可以是来源于沙氏纤毛菌(Leptotrichia shahii)的Cas13a蛋白，其识别单个3'A、U或C的原间隔子侧翼序列(PFS)(或RNA PAM(rPAM))序列基序，其可以位于靶核酸内。

在一些实施方案中，CRISPR-Cas效应蛋白可衍生自Cas12a，其为V型成簇规则间隔短回文重复序列(CRISPR)-Cas核酸酶(参见，例如SEQID NO:1-17的氨基酸序列，SEQ IDNO:18-20的核酸序列)。Cas12a在几个方面与更已知的II型CRISPR Cas9核酸酶不同。例如，Cas9识别富含G的原间隔子相邻基序(PAM)，该基序在其引导RNA(gRNA、sgRNA、crRNA、crDNA、CRISPR阵列)结合位点(原间隔子、靶核酸、靶DNA)的3'(3'-NGG)，而Cas12a识别位于靶核酸5'处的富含T的PAM(5'-TTN，5'-TTTN)。事实上，Cas9和Cas12a结合其引导RNA的方向在它们的N端和C端几乎相反。此外，Cas12a酶使用单引导RNA(gRNA、CRISPR阵列、crRNA)而不是在天然Cas9系统中发现的双引导RNA(sgRNA(例如crRNA和tracrRNA))，并且Cas12a处理其自身的gRNA。此外，Cas12a核酸酶活性产生交错的DNA双链断裂，而不是Cas9核酸酶活性所产生的钝端，并且Cas12a依赖于单个RuvC结构域来切割两条DNA链，而Cas9利用HNH结构域和RuvC域进行切割。

可用于本发明的CRISPR Cas12a效应蛋白/结构域可以是任何已知的或后来鉴定的Cas12a多肽(以前称为Cpf1)(参见，例如，美国专利号9,790,490，其公开的Cpf1(Cas12a)序列通过引用并入)。术语“Cas12a”、“Cas12a多肽”或“Cas12a结构域”是指包含Cas12a多肽或其片段的RNA引导的核酸酶，其包含Cas12a的引导核酸结合结构域和/或Cas12a的活性、无活性或部分活性DNA裂解结构域。在一些实施方案中，可用于本发明的Cas12a可以包含核酸酶活性位点(例如，Cas12a结构域的RuvC位点)中的突变。Cas12a结构域或Cas12a多肽在其核酸酶活性位点具有突变，因此不再包含核酸酶活性，通常称为deadCas12a(例如，dCas12a)。在一些实施方案中，在其核酸酶活性位点具有突变的Cas12a结构域或Cas12a多肽可以具有受损的活性，例如，可以具有切口酶活性。

任何可用于碱基编辑的脱氨酶结构域/多肽都可以用于本发明。在一些实施方案中，脱氨酶结构域可以是胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域。可用于本发明的胞嘧啶脱氨酶(或胞苷脱氨酶)可以是来自任何生物体的任何已知或后来鉴定的胞嘧啶脱氨酶(参见，例如，美国专利号10,167,457和Thuronyi等人Nat.Biotechnol.37:1070–1079(2019)，其中每一篇文献关于胞嘧啶脱氨酶的公开内容通过引用并入本文)。胞嘧啶脱氨酶可分别催化胞苷或脱氧胞苷水解脱氨为尿苷或脱氧尿苷。因此，在一些实施方案中，可用于本发明的脱氨酶或脱氨酶结构域可以是胞苷脱氨酶结构域，催化胞嘧啶水解脱氨为尿嘧啶。在一些实施方案中，胞嘧啶脱氨酶可以是天然存在的胞嘧啶脱氨酶的变体，包括但不限于，灵长类动物(例如，人、猴、黑猩猩、大猩猩)、狗、牛、大鼠或小鼠。因此，在一些实施方案中，可用于本发明的胞嘧啶脱氨酶可以与野生型胞嘧啶脱氨酶约70％至约100％相同(例如，与天然存在的胞嘧啶脱氨酶约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同，以及其中的任何范围或值)。

在一些实施方案中，可用于本发明的胞嘧啶脱氨酶可以是载脂蛋白B mRNA-编辑复合物(APOBEC)家族脱氨酶。在一些实施方案中，胞嘧啶脱氨酶可以是APOBEC1脱氨酶、APOBEC2脱氨酶、APOBEC3A脱氨酶、APOBEC3B脱氨酶、APOBEC3C脱氨酶、APOBEC3D脱氨酶、APOBEC3F脱氨酶、APOBEC3G脱氨酶、APOBEC3H脱氨酶、APOBEC4脱氨酶、人激活诱导脱氨酶(hAID)、rAPOBEC1、FERNY，和/或CDA1，任选地pmCDA1、atCDA1(例如，At2g19570)及其进化形式(例如，SEQ ID NO:27、SEQ ID NO:28或SEQ ID NO:29)。在一些实施方案中，胞嘧啶脱氨酶可以是具有SEQID NO:23的氨基酸序列的APOBEC1脱氨酶。在一些实施方案中，胞嘧啶脱氨酶可以是具有SEQ ID NO:24的氨基酸序列的APOBEC3A脱氨酶。在一些实施方案中，胞嘧啶脱氨酶可以是CDA1脱氨酶，任选地是具有SEQ ID NO:25的氨基酸序列的CDA1。在一些实施方案中，胞嘧啶脱氨酶可以是FERNY脱氨酶，任选地是具有SEQ ID NO:26的氨基酸序列的FERNY。在一些实施方案中，可用于本发明的胞嘧啶脱氨酶可以与天然存在的胞嘧啶脱氨酶(例如，进化的脱氨酶)的氨基酸序列约70％至约100％相同(例如，70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％或100％相同)。在一些实施方案中，可用于本发明的胞嘧啶脱氨酶可以与SEQ ID NO:23、SEQ ID NO:24、SEQID NO:25或SEQ ID NO:26的氨基酸序列约70％至约99.5％相同(例如，约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或99.5％相同)(例如，与SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ IDNO:26、SEQ ID NO:27、SEQID NO:28或SEQ ID NO:29的氨基酸序列至少80％、至少85％、至少90％、至少92％、至少95％、至少96％、至少97％、至少98％、至少99％或至少99.5％相同)。在一些实施方案中，编码胞嘧啶脱氨酶的多核苷酸可以进行密码子优化以在植物中表达，并且密码子优化的多肽可以与参考多核苷酸约70％至99.5％相同。

在一些实施方案中，本发明的核酸构建体可以进一步编码尿嘧啶糖基化酶抑制剂(UGI)(例如，尿嘧啶-DNA糖基化酶抑制剂)多肽/结构域。因此，在一些实施方案中，编码CRISPR-Cas效应蛋白和胞嘧啶脱氨酶结构域的核酸构建体(例如，编码融合蛋白，所述融合蛋白包含融合到胞嘧啶脱氨酶结构域的CRISPR-Cas效应蛋白结构域，和/或融合到肽标签或融合到能够结合肽标签的亲和多肽的CRISPR-Cas效应蛋白结构域和/或融合到肽标签或融合到能够结合肽标签的亲和多肽的脱氨酶蛋白结构域)可以进一步编码尿嘧啶-DNA糖基化酶抑制剂(UGI)，任选地其中UGI可以进行密码子优化以在植物中表达。在一些实施方案中，本发明提供融合蛋白，其包含CRISPR-Cas效应多肽、脱氨酶结构域和UGI和/或编码它们的一个或多个多核苷酸，任选地其中一个或多个多核苷酸可以进行密码子优化以在植物中表达。在一些实施方案中，本发明提供融合蛋白，其中CRISPR-Cas效应多肽、脱氨酶结构域和UGI可以融合到如本文所述的肽标签和亲和多肽的任意组合，从而将脱氨酶结构域和UGI募集到CRISPR-Cas效应多肽和靶核酸。在一些实施方案中，引导核酸可以与募集RNA基序连接，并且一个或多个脱氨酶结构域和/或UGI可以融合到能够与募集RNA基序相互作用的亲和多肽，从而将脱氨酶结构域和UGI募集到靶核酸。

可用于本发明的“尿嘧啶糖基化酶抑制剂”可以是能够抑制尿嘧啶-DNA糖基化酶碱基切除修复酶的任何蛋白质。在一些实施方案中，UGI结构域包括野生型UGI或其片段。在一些实施方案中，可用于本发明的UGI结构域可以与天然存在的UGI结构域的氨基酸序列约70％至约100％相同(例如，70％、71％、72％、73％、75％、76％、77％、79％、80％、81％、82％、83％、84％、85％、86％、87％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％或100％相同，以及其中的任何范围或值)。在一些实施方案中，UGI结构域可以包含SEQ ID NO:41的氨基酸序列或与SEQ ID NO:41的氨基酸序列具有约70％至约99.5％序列同一性的多肽(例如，与SEQ ID NO:41的氨基酸序列至少80％、至少85％、至少90％、至少92％、至少95％、至少96％、至少97％、至少98％、至少99％或至少99.5％相同)。例如，在一些实施方案中，UGI结构域可以包含SEQ ID NO:41的氨基酸序列片段，该片段与SEQ ID NO:41的氨基酸序列的一部分连续核苷酸(例如，10、15、20、25、30、35、40、45、50、55、60、65、70、75、80个连续核苷酸；例如，约10、15、20、25、30、35、40、45至约50、55、60、65、70、75、80个连续核苷酸)100％相同。在一些实施方案中，UGI结构域可以是已知UGI(例如，SEQ ID NO:41)的变体，与已知UGI具有约70％至约99.5％的序列同一性(例如，70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％的序列同一性，以及其中的任何范围或值)。在一些实施方案中，编码UGI的多核苷酸可以进行密码子优化以在植物(例如，植物)中表达，并且密码子优化的多肽可以与参考多核苷酸约70％至约99.5％相同。

可用于本发明的腺嘌呤脱氨酶(或腺苷脱氨酶)可以是任何已知或后来鉴定的来自任何生物体的腺嘌呤脱氨酶(参见，例如，美国专利号10,113,163，其关于腺嘌呤脱氨酶的公开内容而通过引用并入本文)。腺嘌呤脱氨酶可以催化腺嘌呤或腺苷的水解脱氨反应。在一些实施方案中，腺嘌呤脱氨酶可分别催化腺苷或脱氧腺苷的水解脱氨为肌苷或脱氧肌苷。在一些实施方案中，腺苷脱氨酶可以催化DNA中腺嘌呤或腺苷的水解脱氨反应。在一些实施方案中，由本发明的核酸构建体编码的腺嘌呤脱氨酶可以产生靶核酸的有义(例如，“+”；模板)链中的A→G转换或靶核酸的反义(例如，“-”，互补)链中的T→C转换。

在一些实施方案中，腺苷脱氨酶可以是天然存在的腺嘌呤脱氨酶的变体。因此，在一些实施方案中，腺苷脱氨酶可以与野生型腺嘌呤脱氨酶约70％至100％相同(例如，与天然存在的腺嘌呤脱氨酶约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同，以及其中的任何范围或值)。在一些实施方案中，腺嘌呤脱氨酶或腺苷脱氨酶在自然界中不存在，可称为工程化、突变或进化的腺苷脱氨酶。因此，例如，工程化、突变或进化的腺嘌呤脱氨酶多肽或腺嘌呤脱氨酶结构域可以与天然存在的腺嘌呤脱氨酶多肽/结构域约70％至99.9％相同(例如，与天然存在的腺嘌呤脱氨酶多肽或腺嘌呤脱氨酶结构域约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.1％、99.2％、99.3％、99.4％、99.5％、99.6％、99.7％、99.8％或99.9％相同，以及其中的任何范围或值)。在一些实施方案中，腺苷脱氨酶可以来自细菌，(例如，大肠杆菌、金黄色葡萄球菌、流感嗜血杆菌、新月柄杆菌等)。在一些实施方案中，编码腺嘌呤脱氨酶多肽/结构域的多核苷酸可以进行密码子优化以在植物中表达。

在一些实施方案中，腺嘌呤脱氨酶结构域可以是野生型tRNA特异性腺苷脱氨酶结构域，例如，tRNA-特异性腺苷脱氨酶(TadA)和/或突变/进化的腺苷脱氨酶结构域，例如，突变/进化的tRNA-特异性腺苷脱氨酶结构域(TadA*)。在一些实施方案中，TadA结构域可以来自大肠杆菌。在一些实施方案中，TadA可以被修饰，例如，截短，相对于全长TadA丢失一个或多个N-末端和/或C末端氨基酸(例如，可以相对于全长TadA缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个N-末端和/或C末端氨基酸残基)。在一些实施方案中，TadA多肽或TadA结构域不包含N-末端蛋氨酸。在一些实施方案中，野生型大肠杆菌TadA包含SEQ ID NO:30的氨基酸序列。在一些实施方案中，突变/进化的大肠杆菌TadA*包含SEQIDNO:31-40的氨基酸序列(例如，SEQ ID NO:31、32、33、34、35、36、37、38、39或40)。在一些实施方案中，编码TadA/TadA*的多核苷酸可以进行密码子优化以在植物中表达。

胞嘧啶脱氨酶催化胞嘧啶脱氨并产生胸苷(通过尿嘧啶中间体)，导致基因组中的互补链中C到T转换或G到A转换。因此，在一些实施方案中，由本发明的多核苷酸编码的胞嘧啶脱氨酶产生靶核酸的有义(例如，“+”；模板)链中的C→T转换或靶核酸的反义(例如，“-”，互补)链中的G→A转换。

在一些实施方案中，由本发明的核酸构建体编码的腺嘌呤脱氨酶产生靶核酸的有义(例如，“+”；模板)链中的A→G转换或靶核酸的反义(例如，“-”，互补)链中的T→C转换。

编码包含序列特异性核酸结合蛋白和胞嘧啶脱氨酶多肽的碱基编辑器的本发明核酸构建体，以及编码其的核酸构建体/表达盒/载体，可与引导核酸组合用于修饰靶核酸，包括但不限于靶核酸中的C→T或G→A突变的生成，包括但不限于质粒序列；编码序列中C→T或G→A突变的生成以改变氨基酸同一性；编码序列中C→T或G→A突变的生成以产生终止密码子；编码序列中C→T或G→A的生成以破坏起始密码子；基因组DNA中点突变的生成以破坏功能；和/或在基因组DNA中产生点突变以破坏剪接连接。

编码包含序列特异性核酸结合蛋白和腺嘌呤脱氨酶多肽的碱基编辑器的本发明的核酸构建体，以及编码它们的表达盒和/或载体，可以与引导核酸组合用于修饰靶核酸，包括但不限于，在靶核酸中产生A→G或T→C突变，包括，但不限于质粒序列；在编码序列中产生A→G或T→C突变以改变氨基酸身份；在编码序列中产生A→G或T→C突变以产生终止密码子；在编码序列中产生A→G或T→C突变以破坏起始密码子；在基因组DNA中产生点突变以破坏功能；和/或在基因组DNA中产生点突变以破坏剪接连接。

包含CRISPR-Cas效应蛋白或其融合蛋白的本发明的核酸构建体可以与引导RNA(gRNA、CRISPR阵列、CRISPR RNA、crRNA)组合使用，引导RNA设计用于与编码的CRISPR-Cas效应蛋白或结构域一起发挥作用，以修饰靶核酸。可用于本发明的引导核酸包含至少一个间隔序列和至少一个重复序列。引导核酸能够与CRISPR-Cas核酸酶结构域形成复合物，CRISPR-Cas核酸酶结构域由本发明的核酸构建体编码和表达，并且间隔序列能够与靶核酸杂交，从而引导复合物(例如，CRISPR-Cas效应融合蛋白(例如，融合到脱氨酶结构域的CRISPR-Cas效应结构域和/或融合到肽标签或亲和多肽的CRISPR-Cas效应结构域以募集脱氨酶结构域和任选地，UGI)到靶核酸，其中靶核酸可以被脱氨酶结构域修饰(例如，裂解或编辑)或调节(例如，调节转录)。

作为实例，编码与胞嘧啶脱氨酶结构域(例如，融合蛋白)相连的Cas9结构域的核酸构建体可以与Cas9引导核酸组合使用来修饰靶核酸，其中融合蛋白的胞嘧啶脱氨酶结构域使靶核酸中的胞嘧啶碱基脱氨，从而编辑靶核酸。在另一个实例中，编码与腺嘌呤脱氨酶结构域(例如，融合蛋白)相连的Cas9结构域的核酸构建体可以与Cas9引导核酸组合使用以修饰靶核酸，其中融合蛋白的腺嘌呤脱氨酶结构域使靶核酸中的腺苷碱基脱氨，从而编辑靶核酸。

同样，编码与胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域(例如，融合蛋白)相连的Cas12a结构域(或其它选定的CRISPR-Cas核酸酶，例如，C2c1，C2c3，Cas12b，Cas12c，Cas12d，Cas12e，Cas13a，Cas13b，Cas13c，Cas13d，Casl，CaslB，Cas2，Cas3，Cas3'，Cas3"，Cas4，Cas5，Cas6，Cas7，Cas8，Cas9(也称为Csnl和Csx12)，Cas10，Csyl，Csy2，Csy3，Csel，Cse2，Cscl，Csc2，Csa5，Csn2，Csm2，Csm3，Csm4，Csm5，Csm6，Cmrl，Cmr3，Cmr4，Cmr5，Cmr6，Csbl，Csb2，Csb3，Csxl7，Csxl4，Csx10，Csx16，CsaX，Csx3，Csxl，Csxl5，Csfl，Csf2，Csf3，Csf4(dinG)和/或Csf5)的核酸构建体可以与Cas12a引导核酸(或其它选定的CRISPR-Cas核酸酶的引导核酸)组合使用来修饰靶核酸，其中融合蛋白的胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域将靶核酸中的胞嘧啶碱基脱氨，从而编辑靶核酸。

本文所用的“引导核酸”、“引导RNA”、“gRNA”、“CRISPR RNA/DNA”、“crRNA”或“crDNA”是指包含至少一个间隔序列和至少一个重复序列的核酸，所述间隔序列与靶DNA(例如，原间隔子)互补(并杂交)，(所述至少一个重复序列例如：V型Cas12a CRISPR-Cas系统的重复序列，或其片段或部分；II型Cas9 CRISPR-Cas系统的重复序列，或其片段或部分；V型C2c1 CRISPR Cas系统的重复序列，或其片段；CRISPR-Cas系统的重复序列，例如，C2c3，Cas12a(也称为Cpf1)，Cas12b，Cas12c，Cas12d，Cas12e，Cas13a，Cas13b，Cas13c，Cas13d，Casl，CaslB，Cas2，Cas3，Cas3'，Cas3"，Cas4，Cas5，Cas6，Cas7，Cas8，Cas9(也称为Csnl和Csx12)，Cas10，Csyl，Csy2，Csy3，Csel，Cse2，Cscl，Csc2，Csa5，Csn2，Csm2，Csm3，Csm4，Csm5，Csm6，Cmrl，Cmr3，Cmr4，Cmr5，Cmr6，Csbl，Csb2，Csb3，Csxl7，Csxl4，Csx10，Csx16，CsaX，Csx3，Csxl，Csxl5，Csfl，Csf2，Csf3，Csf4(dinG)和/或Csf5，或其片段)，其中重复序列可以连接到间隔序列的5'端和/或3'端。本发明的gRNA的设计可以基于I型、II型、III型、IV型、V型或VI型CRISPR-Cas系统。

在一些实施方案中，Cas12a gRNA可以在5'至3'包含重复序列(全长或其部分(“手柄”)；例如，假结样结构)和间隔序列。

在一些实施方案中，引导核酸可以包含多于一个重复序列-间隔序列(例如，2、3、4、5、6、7、8、9、10个或更多个重复序列-间隔序列)(例如，重复序列-间隔序列-重复序列，例如，重复序列-间隔序列-重复序列-间隔序列-重复序列-间隔序列-重复序列-间隔序列-重复序列-间隔序列等)。本发明的引导核酸是合成的、人造的，在自然界中没有发现。gRNA可以很长，可以用作适配体(如MS2募集策略)或是悬挂间隔序列的其它RNA结构。

如本文所用，“重复序列”是指，例如，野生型CRISPR Cas基因座(例如，Cas9基因座、Cas12a基因座、C2c1基因座等)的任何重复序列，或与由本发明的核酸构建体编码的CRISPR-Cas效应蛋白一起发挥作用的合成crRNA的重复序列。可用于本发明的重复序列可以是CRISPR-Cas基因座(例如，I型、II型、III型、IV型、V型或VI型)的任何已知或后来鉴定的重复序列，或可以是设计用于在I、II、III、IV、V或VI型CRISPR-Cas系统中起作用的合成重复序列。重复序列可以包含发夹结构和/或茎环结构。在一些实施方案中，重复序列可以在其5'端形成假结样结构(即“手柄”)。因此，在一些实施方案中，重复序列可以与来自野生型I型CRISPR-Cas基因座、II型CRISPR-Cas基因座、III型CRISPR-Cas基因座、IV型CRISPR-Cas基因座、V型CRISPR-Cas基因座和/或VI型CRISPR-Cas基因座的重复序列相同或基本相同。来自野生型CRISPR-Cas基因座的重复序列可以通过已建立的算法来确定，诸如使用CRISPRdb提供的CRISPRfinder(参见，Grissa等人Nucleic Acids Res.35(Web Serverissue):W52-7)。在一些实施方案中，重复序列或其部分在其3'端与间隔序列的5'端相连，从而形成重复序列-间隔序列(例如，引导核酸、引导RNA/DNA、crRNA、crDNA)。

在一些实施方案中，重复序列包括至少10个核苷酸，基本上由至少10个核苷酸组成或由至少10个核苷酸组成，这取决于特定的重复序列以及包含该重复序列的向导核酸是经过处理还是未处理(例如，约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50至100个或更多个核苷酸，或其中的任何范围或值)。在一些实施方案中，重复序列包含约10至约20、约10至约30、约10至约45、约10至约50、约15至约30、约15至约40、约15至约45、约15至约50、约20至约30、约20至约40、约20至约50、约30至约40、约40至约80、约50至约100个或更多个核苷酸，基本上由上述核苷酸组成或由上述核苷酸组成。

连接到间隔序列的5'端的重复序列可以包含重复序列的一部分(例如，野生型重复序列的5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35或更多个连续核苷酸)。在一些实施方案中，连接到间隔序列的5'端的重复序列的一部分可以是约5至约10个连续核苷酸的长度(例如，约5、6、7、8、9、10个核苷酸)并且与野生型CRISPRCas重复核苷酸序列的相同区域(例如，5'端)具有至少90％的序列同一性(例如，至少约90％、91％、92％、93％、94％、95％、96％、97％、98％、99％，或更多(例如，99.1％、99.2％、99.3％、99.4％、99.5％、99.6％、99.7％、99.8％、99.9或100％))。在一些实施方案中，重复序列的一部分可以在其5'端包含假结样结构(例如，“手柄”)。

本文使用的“间隔序列”是与靶核酸(例如，靶DNA)(例如，原间隔序列)(例如，序列的连续核苷酸的部分)互补的核苷酸序列，该序列：(a)包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个核苷酸序列具有至少80％的序列同一性的序列；(b)包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338(任选地，SEQ ID NO:75-82、85-92、107-112、116-120、124-127、129、135、136、139、140、156、157、159-161、164-166、181-184、187-190、195、196、212-219、222-224、229、230、246-248、251-253、255-257、261-264、267、268、271、272、275、276、279、280、283或285)中任一个具有至少80％的同一性的区域；(c)编码与SEQ IDNO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的氨基酸序列；和/或(d)编码氨基酸序列，该氨基酸序列包含与SEQID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的同一性的区域。在一些实施方案中，间隔序列(例如，一个或多个间隔子)可以包括但不限于SEQ ID NO:292-297和/或SEQ IDNO:342-346中任一个核苷酸序列。间隔序列可以与靶核酸完全互补或基本上互补(例如，至少约70％互补(例如约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多(例如，99.1％、99.2％、99.3％、99.4％、99.5％、99.6％、99.7％、99.8％、99.9％或100％))。因此，在一些实施方案中，与靶核酸相比，间隔序列可以具有一个、两个、三个、四个或五个错配，这些错配可以是连续的或不连续的。在一些实施方案中，间隔序列可以与靶核酸具有70％的互补性。在其它实施方案中，间隔子核苷酸序列可以与靶核酸具有80％的互补性。在其它实施方案中，间隔子核苷酸序列可以与靶核酸(原间隔子)具有85％、90％、95％、96％、97％、98％、99％或99.5％的互补性等。在一些实施方案中，间隔序列与靶核酸100％互补。间隔序列的长度可以为约15个核苷酸至约30个核苷酸(例如，15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸，或其中的任何范围或值)。因此，在一些实施方案中，间隔序列可以在长度为至少约15个核苷酸至约30个核苷酸的靶核酸(例如，原间隔子)的区域上具有完全互补性或基本的互补性。在一些实施方案中，间隔子的长度为约20个核苷酸。在一些实施方案中，间隔子的长度为约21、22或23个核苷酸。

在一些实施方案中，引导核酸的间隔序列的5'区可以与靶DNA相同，而间隔子的3'区可以与靶DNA基本上互补(例如，参见V型CRISPR-Cas系统的间隔序列)，或者引导核酸的间隔序列的3'区可以与靶DNA相同，而间隔子的5'区可以与靶DNA基本上互补(例如，参见II型CRISPR-Cas系统的间隔序列)，因此，间隔序列与靶DNA的整体互补性可以小于100％。因此，例如，在V型CRISPR-Cas系统的引导物中，例如，20个核苷酸间隔序列的5'区域(即种子区域)中的前1、2、3、4、5、6、7、8、9、10个核苷酸可以与靶DNA 100％互补，而间隔序列的3'区域中的剩余核苷酸与靶DNA基本上互补(例如，至少约70％互补)。在一些实施方案中，间隔序列的5'端的前1至8个核苷酸(例如，前1、2、3、4、5、6、7、8个核苷酸，以及其中的任何范围)可以与靶DNA 100％互补，而间隔序列的3'区域中的剩余核苷酸与靶DNA基本上互补(例如，至少约50％互补(例如，50％、55％、60％、65％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多))。

作为另一个实例，在II型CRISPR-Cas系统的引导物中，例如，20个核苷酸间隔序列的3'区域(即种子区域)中的前1、2、3、4、5、6、7、8、9、10个核苷酸可以与靶DNA 100％互补，而间隔序列的5'区域中的剩余核苷酸与靶DNA基本上互补(例如，至少约70％互补)。在一些实施方案中，间隔序列的3'端的前1至10个核苷酸(例如，前1、2、3、4、5、6、7、8、9、10个核苷酸，以及其中的任何范围)可以与靶DNA 100％互补，而间隔序列的5'区域中的剩余核苷酸与靶DNA基本上互补(例如，至少约50％互补(例如，至少约50％、55％、60％、65％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多，或其中的任何范围或值))。

在一些实施方案中，间隔区的种子区域的长度可以为约8至约10个核苷酸，长度为约5至约6个核苷酸，或长度为约6个核苷酸。

如本文所用，“靶核酸”、“靶DNA”、“靶核苷酸序列”、“靶区”或“基因组中的靶区”是指植物基因组中与本发明的引导核酸中的间隔序列完全互补(100％互补)或基本上互补(例如，至少70％互补(例如，70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多))的区域。可用于CRISPR-Cas系统的靶区可以位于生物体基因组(例如，植物基因组)中PAM序列的紧邻3'(例如V型CRISPR-Cas系统)或紧邻5'(例如II型CRISPR-Cas系统)的位置。靶区可以选自紧邻PAM序列的至少15个连续核苷酸(例如，16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个核苷酸等)的任何区域。

“原间隔序列”是指靶双链DNA，特别是靶DNA中与CRISPR重复序列-间隔序列(例如，引导核酸、CRISPR阵列、crRNA)的间隔序列完全或基本上互补(和杂交)的部分(例如，或基因组中的靶区)。

在V型CRISPR-Cas(例如，Cas12a)系统和II型CRISPR-Cas(Cas9)系统的情况下，原间隔序列的两侧是(例如，紧邻)原间隔区邻接基序(PAM)。对于IV型CRISPR-Cas系统，PAM位于非靶链的5'端和靶链的3'端(见下文，作为实例)。

在II型CRISPR-Cas(例如，Cas9)系统的情况下，PAM紧邻靶区的3'。I型CRISPR-Cas系统的PAM位于靶链的5'。目前尚无针对III型CRISPR-Cas系统的已知PAM。Makarova等人描述了CRISPR系统的所有类别、类型和亚型的命名法(Nature Reviews Microbiology13:722–736(2015))。R.Barrangou(Genome Biol.16:247(2015))描述了引导结构和PAM。

经典的Cas12a PAM富含T。在一些实施方案中，经典的Cas12aPAM序列可以是5'-TTN、5'-TTTN或5'-TTTV。在一些实施方案中，经典的Cas9(例如，酿脓链球菌)PAM可以是5'-NGG-3'。在一些实施方案中，可以使用非经典PAM，但效率可能较低。

其它PAM序列可由本领域技术人员通过已建立的实验和计算方法确定。因此，例如，实验方法包括靶向侧翼为所有可能的核苷酸序列的序列，并识别不进行靶向的序列成员，诸如通过对靶质粒DNA的转化(Esvelt等人2013.Nat.Methods 10:1116-1121；Jiang等人2013.Nat.Biotechnol.31:233-239)。在某些方面，计算方法可以包括对天然间隔区进行BLAST搜索，以识别噬菌体或质粒中的原始靶DNA序列，并对这些序列进行比对以确定与靶序列相邻的保守序列(Briner和Barrangou.2014.Appl.Environ.Microbiol.80:994-1001；Mojica等人2009.Microbiology 155:733-740)。

在一些实施方案中，本发明提供包含本发明的核酸构建体(例如，本发明编辑系统的一个或多个组分)的表达盒和/或载体。在一些实施方案中，可以提供包含本发明的核酸构建体和/或一种或多种引导核酸的表达盒和/或载体。在一些实施方案中，本发明的编码碱基编辑器的核酸构建体(例如，包含CRISPR-Cas效应蛋白和脱氨酶结构域(例如，融合蛋白)的构建体)或用于碱基编辑的组分(例如，融合到肽标签或亲和多肽的CRISPR-Cas效应蛋白，融合到肽标签或亲和多肽的脱氨酶结构域，和/或融合到肽标签或亲和多肽的UGI)可以包含在与包含一种或多种引导核酸的表达盒或载体相同的或分开的表达盒或载体上。当编码碱基编辑器的核酸构建体或用于碱基编辑的组分包含在与包含所述引导核酸的表达盒或载体分开的表达盒或载体上时，靶核酸可以与编码碱基编辑器的表达盒或载体或用于碱基编辑的组分以彼此的任何顺序以及引导核酸接触(例如，向所述靶核酸提供后者)，例如，在提供包含引导核酸的表达盒之前、同时或之后(例如，与靶核酸接触)。

本发明的融合蛋白可以包含序列特异性核酸结合结构域(例如，序列特异性DNA结合结构域)、CRISPR-Cas多肽、和/或融合到肽标签或亲和多肽(亲和多肽与肽标签相互作用)的脱氨酶结构域，如本领域所知，用于将脱氨酶募集到靶核酸。募集方法还可以包括与RNA募集基序相连的引导核酸和与能够与RNA募集基序相互作用的亲和多肽融合的脱氨酶，从而将脱氨酶募集到靶核酸。备选地，化学相互作用可用于将多肽(例如，脱氨酶)募集到靶核酸。

可用于本发明的肽标签(例如，表位)可以包括但不限于，GCN4肽标签(例如，Sun-Tag)、c-Myc亲和标签、HA亲和标签、His亲和标签、S亲和标签、蛋氨酸-His亲和标签、RGD-His亲和标签、FLAG八肽、strep标签或strep标签II、V5标签、和/或VSV-G表位。任何表位可以在本发明中用作肽标签，所述表位可以与多肽连接并且存在可以与另一种多肽连接的相应亲和多肽。在一些实施方案中，肽标签可以包含1个或2个或更多个肽标签拷贝(例如，重复单元，多聚化表位(例如，串联重复序列))(例如，1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或更多个重复单元)。在一些实施方案中，与肽标签相互作用/结合的亲和多肽可以是抗体。在一些实施方案中，该抗体可以是scFv抗体。在一些实施方案中，与肽标签结合的亲和多肽可以是合成的(例如，进化为亲和相互作用)，包括但不限于，亲和体、抗运载蛋白、monobody和/或DARPin(参见，例如，Sha等人，Protein Sci.26(5):910-924(2017))；Gilbreth(Curr Opin Struc Biol 22(4):413-420(2013))，美国专利号9,982,053，每一项关于与亲和体、抗运载蛋白、monobodies和/或DARPin相关的教导通过引用全部并入)。肽标签序列及其亲和多肽实例包括但不限于SEQ ID NO:42-44的氨基酸序列。

在一些实施方案中，引导核酸可以与RNA募集基序连接，并且要募集的多肽(例如，脱氨酶)可以融合到与RNA募集基序结合的亲和多肽，其中引导与靶核酸结合，RNA募集基序与亲和多肽结合，从而将多肽募集到引导物并使靶核酸与多肽(例如，脱氨酶)接触。在一些实施方案中，可以将两个或更多个多肽募集到引导核酸，从而使两个或更多个多肽(例如，脱氨酶)接触靶核酸。RNA募集基序及其亲和多肽的实例包括但不限于SEQ ID NO:45-55的序列。

在一些实施方案中，与亲和多肽融合的多肽可以是逆转录酶，而引导核酸可以是与RNA募集基序相连的延伸的引导核酸。在一些实施方案中，RNA募集基序可以位于延伸的引导核酸的延伸部分的3'端(例如，5'-3'，重复序列-间隔序列-延伸部分(RT模板-引物结合位点)-RNA募集基序)。在一些实施方案中，RNA募集基序可以嵌入到延伸部分中。

在本发明的一些实施方案中，延伸的引导RNA和/或引导RNA可以连接到一个或连接到两个或更多个RNA募集基序(例如，1、2、3、4、5、6、7、8、9、10个或更多个基序；例如，至少10至约25个基序)，任选地，其中两个或更多个RNA募集基序可以是相同的RNA募集基序或不同的RNA募集基序。在一些实施方案中，RNA募集基序和相应的亲和多肽可以包括但不限于，端粒酶Ku结合基序(例如，Ku结合发夹)和相应的亲和多肽Ku(例如，Ku异二聚体)，端粒酶Sm7结合基序和相应的亲和多肽Sm7，MS2噬菌体操纵子茎环和相应的亲和多肽MS2外壳蛋白(MCP)，PP7噬菌体操纵子茎环和相应的亲和多肽PP7外壳蛋白(PCP)，SfMu噬菌体Com茎环和相应的亲和多肽Com RNA结合蛋白，PUF结合位点(PBS)和亲和多肽Pumilio/fem-3mRNA结合因子(PUF)，和/或合成RNA适配体和作为相应的亲和多肽的适配体配体。在一些实施方案中，RNA募集基序和相应的亲和多肽可以是MS2噬菌体操纵子茎环和亲和多肽MS2外壳蛋白(MCP)。在一些实施方案中，RNA募集基序和相应的亲和多肽可以是PUF结合位点(PBS)和亲和多肽Pumilio/fem-3 mRNA结合因子(PUF)。

在一些实施方案中，用于募集多肽和核酸的组分可以是那些通过化学相互作用起作用的组分，其可以包括但不限于，雷帕霉素诱导的FRB–FKBP二聚化；生物素-链霉亲和素；SNAP标签；Halo标签；CLIP标签；化合物诱导的DmrA-DmrC异二聚体；双功能配体(例如，将两个结合蛋白质的化学物质融合在一起，例如，二氢叶酸还原酶(DHFR)。

在一些实施方案中，被优化以在植物中表达的本发明的核酸构建体、表达盒或载体与包含相同的多核苷酸但没有进行密码子优化以在植物中表达的核酸构建体、表达盒或载体可以约70％至100％相同(例如，约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％或100％)。

本文还提供包含本发明的一种或多种多核苷酸、引导核酸、核酸构建体、表达盒或载体的细胞。

本发明的核酸构建体(例如，包含序列特异性DNA结合结构域、CRISPR-Cas效应结构域、脱氨酶结构域、逆转录酶(RT)、RT模板和/或引导核酸等的构建体)和包含这些的表达盒/载体可用作本发明的编辑系统用于修饰靶核酸和/或其表达。

可以使用本发明的多肽、多核苷酸、核糖核蛋白(RNP)、核酸构建体、表达盒和/或载体修饰(例如，突变，例如，碱基编辑，裂解，做切口等)任何植物或植物部分(或植物的分组，例如，分为属或更高阶分类)的靶核酸，植物包括被子植物、裸子植物、单子叶植物、双子叶植物、C3、C4、CAM植物、苔藓植物、蕨类植物和/或拟蕨植物、微藻，和/或大型藻类。可以如本文所述修饰的植物和/或植物部分可以是任何植物物种/品种/栽培品种的植物和/或植物部分。在一些实施方案中，可以如本文所述修饰的植物是单子叶植物。在一些实施方案中，可以如本文所述修饰的植物是双子叶植物。

如本文所用，术语“植物部分”包括但不限于繁殖组织(例如，花瓣、萼片、雄蕊、雌蕊、花托、花药、花粉、花、果实、花蕾、胚珠、种子、胚、坚果、核仁、穗、玉米棒和壳)；营养组织(例如，叶柄、茎、根、根毛、根尖、髓、胚芽、茎杆、芽、枝、树皮、顶端分生组织、腋芽、子叶、下胚轴和叶)；维管组织(例如，韧皮部和木质部)；特化细胞，诸如表皮细胞、薄壁细胞、厚角细胞(chollenchyma cells)、厚壁组织细胞、气孔细胞、保卫细胞、角质层、叶肉细胞；愈伤组织；和插条。术语“植物部分”还包括植物细胞，包括在植物和/或植物部分中完整的植物细胞、植物原生质体、植物组织、植物器官、植物细胞组织培养物、植物愈伤组织、植物团块等。如本文所用，“枝条”是指地上部分，包括叶和茎。如本文所用，术语“组织培养物”包括组织、细胞、原生质体和愈伤组织的培养物。

如本文所用，“植物细胞”是指植物的结构和生理单元，其通常包含细胞壁但也包含原生质体。本发明的植物细胞可以是分离的单细胞的形式，或可以是培养的细胞，或者可以是更高组织单元的一部分，诸如，例如，植物组织(包括愈伤组织)或植物器官的一部分。在一些实施方案中，植物细胞可以是藻类细胞。“原生质体”是一种分离的植物细胞，没有细胞壁或只有部分细胞壁。因此，在本发明的一些实施方案中，包含本发明的核酸分子和/或核苷酸序列的转基因细胞是任何植物或植物部分的细胞，包括但不限于，根细胞、叶细胞、组织培养细胞、种子细胞、花细胞、果实细胞、花粉细胞等。在本发明的某些方面，植物部分可以是植物种质。在某些方面，植物细胞可以是不繁殖的植物细胞，不会再生为植物。

“植物细胞培养物”是指植物单元的培养物，诸如，例如，原生质体、细胞培养物细胞、植物组织中的细胞、花粉、花粉管、胚珠、胚囊、受精卵和处于不同发育阶段的胚。

如本文所用，“植物器官”是植物的独特且可见的结构和分化部分(诸如根、茎、叶、花蕾或胚)。

如本文所用，“植物组织”是指一组组织成结构和功能单元的植物细胞。原位植物或培养物中的任何组织都包括在内。该术语包括但不限于，整个植物、植物器官、植物种子、组织培养物和组织成结构和/或功能单元的任何植物细胞组。将该术语与上述任何特定类型的植物组织结合使用或在缺少上述任何特定类型的植物组织，或在本定义所包含的任何特定类型的植物组织的情况下使用，并不意味着排除任何其它类型的植物组织。

在本发明的一些实施方案中，提供了转基因组织培养物或转基因植物细胞培养物，其中转基因组织或细胞培养物包含本发明的核酸分子/核苷酸序列。在一些实施方案中，转基因可以从由转基因组织或细胞发育的植物中消除，方法是将转基因植物与非转基因植物杂交，并在子代中选择包含所需基因编辑而不含用于产生该编辑的转基因的植物。

包含内源性SHATTERPROOF MADS-BOX(SHP)基因的任何油菜植物可以如本文所述进行修饰，以改善一种或多种产量性状。可以如本文所述进行修饰的油菜植物物种的非限制性实例可以包括但不限于甘蓝型油菜(Brassica napus)、芜菁(Brassica rapa)、芥菜(Brassica juncea)和/或油菜(Brassica rapa subsp.Oleifera)(白菜型油菜(syn.B.campestris L.)。

现在将参照以下实施例来描述本发明。应当理解，这些实施例并不旨在将权利要求的范围限制到本发明，而是旨在作为某些实施方案的示例。本领域技术人员想到的在示例方法中出现的任何变化都将落入本发明的范围内。

实施例

实施例1.油菜SHATTERPROOF MADS-BOX(SHP)基因的修饰

开发了一种在BnaA07g18050D(SEQ ID NO:100)(SHP2)和BnaC06g16910D(SHP2)(SEQ ID NO:240)的油菜SHP基因中产生编辑的策略，以降低由SHP基因编码的MADS结构域转录因子的活性。为了产生在靶SHP基因的C末端区域中具有编辑的一系列等位基因，设计了包含与SHP基因中的靶标具有互补性的间隔子(SEQ ID NO:292-297)(参见表2)的多个CRISPR引导核酸，并将其置于构建体中。

筛选了在SHP基因中进行编辑的品系，那些显示约10％的测序读数在靶基因中进行了编辑的品系被推进到下一代。

表2.引导核酸的间隔子

实施例2.

用NGS测序技术对编辑的植物进行测序，以进一步表征产生的编辑等位基因。如表3进一步所述，产生了靶基因的一系列等位基因。

表3.编辑的等位基因

实施例3.对编辑的植物的木质素含量的评价

通过染色来评估携有如表3所提供的编辑的植物的荚果瓣边缘的木质素含量。表4提供了两种编辑的植物的结果。

表4.木质素染色

植物品系	木质素染色
		CE69293	+++
CE69294	+
		野生型	+++++

实施例4.编辑的等位基因

如实施例1所述产生油菜品系，并回收了几个品系，其包含SHP基因BnaA07g18050D(SEQ ID NO:100)和BnaC06g16910D(SEQ IDNO:240)的一系列编辑的等位基因。通过下一代测序对SHP基因进行测序，表5和表6进一步描述了鉴别出的编辑的等位基因。

表5.BnaA07g18050D的编辑的等位基因

表6.BnaC06g16910D的编辑的等位基因

实施例5.表型分析

通过在完全成熟时收获油菜荚果来评估荚果开裂。收获的荚果在种子干燥器中(例如48-72小时)完全干燥。随机选择十个油菜荚果进行评估，并将其与2-9毫米钢球一起放入空的塑料移液管头盒中。将装有荚果和钢球的盒放入Geno/Grinder自动植物组织匀浆器中，设定速度为600，持续45秒。检查了盒子里的东西，并记录了未开裂的荚果的数量。对于每个评估的样品，将上述操作重复五次，结果的统计分析如下表7所示。

表7:荚果开裂的结果。

*表明与野生型相比，p<0.05具有显著性

具有BnaC06g16910D的编辑的等位基因A且没有其它SHP基因编辑的油菜品系；以及具有BnaA07g18050D的编辑的等位基因C且没有其它SHP基因编辑的油菜品系，与野生型对照相比，在未开裂的荚果的数量上没有显著差异。

具有编辑的等位基因F/等位基因G基因型组合的油菜品系显示出与野生型对照显著不同的未开裂的荚果数量的增加。与野生型对照相比，具有编辑的等位基因B且没有其它SHP基因编辑的油菜品系也表现出显著更少的开裂。此外，与野生型对照品系相比，具有编辑的等位基因D和编辑的等位基因E组合的油菜品系以及具有编辑的等位基因F和编辑的等位基因B组合的油菜品系得到了显著改善；但与空缺分离体对照没有显著差异，这表明可能存在转化影响，该转化影响有助于观察到的表型。

编辑的等位基因F/等位基因G的组合观察到油菜品系中荚果开裂减少的有力统计证据(p值<0.003)。此外，与野生型对照品系相比，仅具有编辑的SHP等位基因B的基因型也显示出荚果开裂的强烈降低，而与空缺分离体对照相比，荚果开裂中度降低(p值<0.07)。与野生型对照相比，具有等位基因D/等位基因E的编辑的SHP等位基因组合的基因型和具有等位基因F/等位基因B的组合的基因型两者都发现对完整荚果的存在的显著的改善(减少的荚果开裂)(但与空缺分立体对照相比没有显著的改善(p值>0.58))。

实施例6.油菜SHATTERPROOF MADS-BOX(SHP)基因的修饰

开发了一种在BnaA05g02990D(SEQ ID NO:148)(SHP4，SHP4A)的油菜SHP基因中产生编辑的策略，以降低SHP基因编码的MADS结构域转录因子的活性。为了产生在靶SHP基因的C末端区域具有编辑的一系列等位基因，设计了包含与SHP基因中的靶标具有互补性的间隔子(SEQ ID NO:342-346)(参见表8)的多个CRISPR引导核酸，并将其置于构建体中。

表8.基因ID号为BnaA05g02990D(SHP4A，SEQ ID NO:148)的油菜SHP基因引导物的间隔序列

间隔子名称	SEQ ID NO	序列
			PWsp291	342	TATAATTCTACAGATTAATGAAA
PWsp292	343	CGAGTCATCTTCTCATCAGTCGG
			PWsp293	344	CTTAAACAAGTTGGAGAGGTGGT
PWsp294	345	ACCATAATTGTAACATGAATAGA
			PWsp295	346	AGAGGGACCTAAGTTACATATGT

筛选了在SHP4基因中进行编辑的品系，那些显示约10％的测序读数在靶向的基因中进行了编辑的品系被推进到下一代。用NGS测序技术对编辑的植物进行测序，以进一步表征产生的编辑等位基因。

鉴别了BnaA05g02990D基因的两个编辑的等位基因。Bna05g02990D的等位基因H在SEQ ID NO:148的3472位含有2 bp的缺失(AC)，产生了SEQ ID NO:322的编辑的基因组序列。等位基因H的缺失不影响BnaA05g02990D的编码区(SEQ ID NO:148)，但会改变基因的3'UTR。

Bna05g02990D的等位基因I在SEQ ID NO:148的3401位含有7 bp缺失(CTATTCA)，产生了SEQ ID NO:323的编辑的基因组序列。等位基因I中的缺失不影响BnaA05g02990D的编码区(SEQ ID NO:148)，但会改变基因的3'UTR。

通过染色来评估携带编辑的等位基因H和/或等位基因I的植物的荚果瓣边缘的木质素含量。结果如表9所示。

表9.

在每个基因型内观察到木质素染色强度的相当大的不同，这可能是由于收集的荚果的发育阶段的差异。来自SHP4a等位基因I(Hom和Het)的荚果染色强度与空缺分离体样品一样强。来自SHP4a-纯合的等位基因H的荚果的染色强度不如空缺分离体。该数据表明，存在与至少等位基因H相关的木质素沉积中度减少。

上述内容是对本发明的示例说明，而不应被解释为对本发明的限制。本发明由后附权利要求以及其中所包括的权利要求的等同物所定义。

Claims

1.一种油菜植物或其植物部分，其包含编码Shatterproof MADS-box转录因子(SHP)多肽的至少一种(例如，一种或多种)内源性SHATTERPROOF MADS-BOX(SHP)基因中的至少一个突变。

2.权利要求1所述的油菜植物或其植物部分，其中所述内源性SHP基因是内源性SHP1基因、内源性SHP2基因、内源性SHP3基因和/或内源性SHP4基因，任选地，其中所述内源性SHP基因具有BnaA04g01810D(SHP3)、BnaA07g18050D(SHP2)、BnaA05g02990D(SHP4)、BnaA09g55330D(SHP1)、BnaC04g23360D(SHP3)和/或BnaC06g16910D(SHP2)的基因识别号(基因ID)。

3.权利要求1或权利要求2所述的油菜植物或其植物部分，其中所述至少一个突变导致亚效等位基因突变、显性负性突变或显性负性亚效等位基因突变。

4.前述权利要求中任一项所述的油菜植物或其植物部分，其中所述至少一个突变是碱基置换、碱基缺失和/或碱基插入。

5.前述权利要求中任一项所述的油菜植物或其植物部分，其中所述至少一个突变包含对A、T、G或C的碱基置换。

6.前述权利要求中任一项所述的油菜植物或其植物部分，其中所述至少一个突变是至少一个碱基对的缺失，任选地是一个碱基对至约100个连续碱基对的缺失。

7.权利要求1至5中任一项所述的油菜植物或其植物部分，其中所述至少一个突变是至少一个碱基对的插入。

8.前述权利要求中任一项所述的油菜植物或其植物部分，其中所述至少一个突变位于内源性SHP基因的3'端中。

9.前述权利要求中任一项所述的油菜植物或其植物部分，其中内源性SHP基因中的所述至少一个突变位于内源性SHP基因的倒数第二个外显子中、倒数第二个外显子中和与倒数第二个外显子的3'端相邻的内含子中(例如，突变跨越倒数第二个外显子和与倒数第二个外显子的3'端相邻的内含子)和/或最后一个外显子中。

10.前述权利要求中任一项所述的油菜植物或其植物部分，其中内源性SHP基因中的所述至少一个突变导致产生截短的蛋白的突变的SHP基因。

11.前述权利要求中任一项所述的油菜植物或其植物部分，其中所述至少一个突变是框外插入或框外缺失。

12.权利要求11所述的油菜植物或其植物部分，其中所述框外插入或框外缺失产生/导致过早终止密码子，任选地导致编码的多肽的C末端截短(例如截短的SHP多肽)。

13.前述权利要求中任一项所述的油菜植物或其植物部分，其中内源性SHP基因中的所述至少一个突变导致编码的SHP多肽的C末端截短。

14.权利要求13所述的油菜植物或其植物部分，其中所述C末端截短是从编码的SHP多肽缺失一个氨基酸残基至约100个连续氨基酸残基，任选地从编码的SHP多肽的C末端缺失约70、71、72、73、74、75、76、77、78、79或80个连续氨基酸残基。

15.前述权利要求中任一项所述的油菜植物或其植物部分，其中所述油菜植物或其植物部分包含两种或更多种(例如，2、3、4、5或6种或更多种)内源性SHP基因(例如，SHP1基因、SHP2基因、SHP3基因和/或SHP4基因中的两种或更多种)中的至少一个突变。

16.前述权利要求中任一项所述的油菜植物或其植物部分，其中所述内源性SHP基因:(a)包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核苷酸序列；(b)包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列具有至少80％的序列同一性的区域；(c)编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的SHP多肽；和/或(d)编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的SHP多肽的区域。

17.前述权利要求中任一项所述的油菜植物或其植物部分，其中所述至少一个突变导致位于与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列具有至少80％的序列同一性的区域中的一个或多个碱基对的缺失或插入。

18.前述权利要求中任一项所述的油菜植物或其植物部分，其中与没有所述至少一个突变的对照油菜植物相比，包含所述至少一个突变的油菜植物表现出减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)。

19.前述权利要求中任一项所述的油菜植物或其植物部分，其中所述至少一个突变导致突变的SHP基因，所述突变的SHP基因包含与SEQ ID NO:298、300、302、304、306、308、310、312、314、316、318、319、321、322或323中任一个具有至少90％的序列同一性的核苷酸序列。

20.前述权利要求中任一项所述的油菜植物或其植物部分，其中所述至少一个突变导致突变的SHP基因，所述突变的SHP基因编码的SHP多肽与SEQ ID NO:299、301、303、305、307、309、311、313、315或317中任一个具有至少90％的序列同一性。

21.前述权利要求中任一项所述的油菜植物或其植物部分，其中所述突变是非天然突变。

22.一种油菜植物细胞，其包含碱基编辑系统，所述碱基编辑系统包含：

(a)CRISPR-Cas效应蛋白；和

(b)引导核酸(例如，gRNA、gDNA、crRNA、crDNA、sgRNA、sgDNA)，所述引导核酸包含与编码油菜植物细胞中ShatterproofMADS-box转录因子(SHP)多肽的内源性靶基因互补的间隔序列。

23.权利要求22所述的油菜植物细胞，其中所述SHP多肽是SHP1多肽、SHP2多肽、SHP3多肽和/或SHP4多肽，任选地是SHP1A多肽、SHP2A多肽、SHP2C多肽、SHP3A多肽、SHP3C多肽或SHP4A多肽。

24.权利要求22或权利要求23所述的油菜植物细胞，其中所述编辑系统在编码SHP多肽的内源性靶基因中产生突变。

25.权利要求22-24中任一项所述的油菜植物细胞，其中所述内源性靶基因包含两种或更多种内源性SHP基因(例如，内源性SHP1基因、内源性SHP2基因、内源性SHP3基因和/或内源性SHP4基因中的两种或更多种，任选地是内源性SHP1A基因、内源性SHP2A基因、内源性SHP2C基因、内源性SHP3A基因、内源性SHP3C基因或内源性SHP4A基因中的两种或更多种)。

26.权利要求22-25中任一项所述的油菜植物细胞，其中所述内源性靶基因:(a)包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核苷酸序列；(b)包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列具有至少80％的序列同一性的区域；(c)编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的SHP多肽；和/或(d)编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的SHP多肽的区域。

27.权利要求22-26中任一项所述的油菜植物细胞，其中所述引导核酸包含SEQ ID NO:292-297或342-346的核苷酸序列中的任一个。

28.从权利要求1-21中任一项所述的植物部分或权利要求22-27中任一项所述的油菜植物细胞再生的油菜植物。

29.权利要求28所述的油菜植物，其中所述油菜植物包含突变的SHP基因，所述突变的SHP基因包含与SEQ ID NO:298、300、302、304、306、308、310、312、314、316、318、319、321、322或323中任一个具有至少90％的序列同一性的核苷酸序列，和/或编码与SEQ ID NO:299、301、303、305、307、309、311、313、315或317中任一个具有至少90％的序列同一性的SHP多肽。

30.权利要求28或权利要求29所述的油菜植物，其中所述油菜植物包含减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的表型。

31.权利要求28-30中任一项所述的油菜植物，其中所述突变的SHP基因包含非天然突变。

32.一种油菜植物细胞，其包含内源性SHP基因中的至少一个突变，其中所述至少一个突变是使用编辑系统引入的碱基置换、碱基插入或碱基缺失，所述编辑系统包含与内源性SHP基因中的靶位点结合的核酸结合结构域。

33.权利要求32所述的油菜植物细胞，其中所述内源性SHP基因是内源性SHP1基因、内源性SHP2基因、内源性SHP3基因和/或内源性SHP4基因，任选地是内源性SHP1A基因、内源性SHP2A基因、内源性SHP2C基因、内源性SHP3A基因、内源性SHP3C基因或内源性SHP4A基因。

34.权利要求32或权利要求33所述的油菜植物细胞，其中内源性SHP基因是两种或更多种内源性SHP基因，并且所述油菜植物细胞包含两种或更多种内源性SHP基因中的至少一个突变。

35.权利要求32-34中任一项所述的油菜植物细胞，其中所述至少一个突变是亚效等位基因突变、显性负性突变或显性负性亚效等位基因突变。

36.权利要求32-35中任一项所述的油菜植物细胞，其中所述靶位点位于内源性SHP基因的倒数第二个外显子中、最后一个外显子中和/或倒数第二个外显子中和与倒数第二个外显子的3'端相邻的内含子中(例如，突变跨越倒数第二个外显子和与倒数第二个外显子的3'端相邻的内含子)。

37.权利要求32-36中任一项所述的油菜植物细胞，其中所述靶位点在所述内源性SHP基因的区域中，所述区域与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个具有至少80％的序列同一性。

38.权利要求32-37中任一项所述的油菜植物细胞，其中所述靶位点在所述内源性SHP基因的区域中，所述内源性SHP基因编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的氨基酸序列，任选地在所述内源性SHP基因的区域中，所述区域编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的氨基酸序列。

39.权利要求32-38中任一项所述的油菜植物细胞，其中所述编辑系统还包含核酸酶，所述核酸结合结构域与序列中的靶位点结合，所述序列与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中的任一个具有至少80％的序列同一性，和/或所述序列与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个序列具有至少80％的序列同一性，以及SHP基因中的至少一个突变是由核酸酶切割后产生。

40.权利要求39所述的油菜植物细胞，其中所述核酸酶是锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)、核酸内切酶(例如，Fok1)或CRISPR-Cas效应蛋白。

41.权利要求32-40中任一项所述的油菜植物细胞，其中所述核酸结合结构域是锌指、转录激活因子样DNA结合结构域(TAL)、argonaute或CRISPR-Cas效应物核酸结合结构域。

42.权利要求32-41中任一项所述的油菜植物细胞，其中SHP基因中的所述至少一个突变是插入和/或缺失，任选地，所述至少一个突变是框外插入或框外缺失。

43.权利要求32-42中任一项所述的油菜植物细胞，其中SHP基因中的所述至少一个突变是导致过早终止密码子、任选地导致具有C端截短的SHP多肽的插入和/或缺失。

44.权利要求32-43中任一项所述的油菜植物细胞，其中SHP基因中的所述至少一个突变包含点突变。

45.权利要求32-44中任一项所述的油菜植物细胞，其中所述至少一个突变产生突变的SHP基因，所述突变的SHP基因包含与SEQ ID NO:298、300、302、304、306、308、310、312、314、316、318、319、321、322或323中任一个具有至少90％的序列同一性的核苷酸序列。

46.权利要求32-45中任一项所述的油菜植物细胞，其中所述至少一个突变导致突变的SHP基因，所述突变的SHP基因编码与SEQ ID NO:299、301、303、305、307、309、311、313、315或317中的任一个具有至少90％的序列同一性的SHP多肽。

47.权利要求32-46中任一项所述的油菜植物细胞，其中所述至少一个突变是非天然突变。

48.从权利要求32-47中任一项所述的油菜植物细胞再生的油菜植物，所述油菜植物包含内源性SHP基因中的至少一个突变。

49.权利要求48所述的油菜植物，其中与没有所述至少一个突变的所述油菜植物(例如同基因植物(例如野生型未编辑的植物或空缺分离体))相比，包含所述至少一个突变的油菜植物具有减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的表型。

50.一种产生/育种无转基因的编辑的油菜植物的方法，所述方法包括：

将权利要求1-21、28-31、48或49中任一项所述的油菜植物与无转基因植物杂交，从而将至少一个突变引入无转基因的油菜植物中；和

选择包含至少一个突变且无转基因的子代油菜植物，从而产生无转基因的编辑的油菜植物。

51.一种提供具有减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的表型的多种油菜植物的方法，所述方法包括在生长区域种植权利要求1-21、28-31、48或49中任一项所述的两种或更多种油菜植物，从而提供与没有至少一个突变的多种对照油菜植物相比，具有减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的表型的多种油菜植物。

52.一种在油菜植物内源性SHATTERPROOF MADS-BOX(SHP)基因中产生突变的方法，所述方法包括：

(a)使基因编辑系统靶向内源性SHP基因的部分，所述部分：

(i)包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个具有至少80％的序列同一性的序列；和/或

(ii)编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的同一性的序列，以及

(b)选择包含位于内源性SHP基因的区域中的修饰的油菜植物，所述区域与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个具有至少80％的序列同一性，任选地所述区域与SEQ ID NO:75-82、85-92、107-112、116-120、124-127、129、135、136、139、140、156、157、159-161、164-166、181-184、187-190、195、196、212-219、222-224、229、230、246-248、251-253、255-257、261-264、267、268、271、272、275、276、279、280、283或285中任一个具有至少80％的序列同一性。

53.一种在油菜植物细胞中的Shatterproof MADS-box转录因子(SHP)多肽中产生变异的方法，所述方法包括：

将编辑系统引入油菜植物细胞，其中所述编辑系统靶向SHATTERPROOF MADS-BOX(SHP)基因的区域；和

使SHP基因的区域与编辑系统接触，从而将突变引入SHP基因并在油菜植物细胞中的SHP多肽中产生变异。

54.权利要求53所述的方法，其中所述SHP基因包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241具有至少80％的序列同一性的核苷酸序列，和/或产生变异的SHP基因的区域包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个具有至少80％的序列同一性的核苷酸序列。

55.权利要求53或权利要求54所述的方法，其中所述SHP多肽包含与SEQ ID NO:71、102、150、179、208或242具有至少80％的序列同一性的氨基酸序列，和/或产生变异的SHP多肽的区域包含与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的氨基酸序列。

56.权利要求53-55中任一项所述的方法，其中在油菜植物中的SHP多肽中产生变异导致油菜植物具有减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)。

57.权利要求53-56中任一项所述的方法，其中使油菜植物细胞中的内源性SHP基因的区域与编辑系统接触产生在基因组中包含编辑的内源性SHP基因的油菜植物细胞，所述方法还包括：(a)从油菜植物细胞再生油菜植物；(b)使油菜植物自交以产生子代油菜植物(E1)；(c)测定(b)的子代油菜植株的减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)；以及(d)选择表现出减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的子代油菜植物，以产生与对照油菜植物相比，表现出减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的选择的子代油菜植物。

58.权利要求57所述的方法，所述方法还包括：(e)使(d)的选择的子代油菜植物自交以产生子代油菜植物(E2)；(f)测定(e)的子代油菜植物的减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)；和(g)选择表现出减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的子代油菜植物，以产生与对照油菜植物相比，表现出减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的选择的子代油菜植物，任选地重复(e)至(g)一次或多次。

59.一种检测油菜植物中突变SHP基因(内源性SHP基因中的突变)的方法，所述方法包括在油菜植物的基因组中检测SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个的核酸序列，所述核酸序列在基因的3'区域中具有至少一个突变，任选地具有的至少一个突变位于内源性SHP基因的倒数第二个外显子中、最后一个外显子中和/或倒数第二个外显子中和与倒数第二个外显子的3'端相邻的内含子中(例如，突变跨越倒数第二个外显子和与倒数第二个外显子的3'端相邻的内含子)。

60.权利要求59所述的方法，其中检测到的突变shp基因包含与SEQ ID NO:298、300、302、304、306、308、310、312、314、316、318、319、321、322或323中任一个具有至少90％的序列同一性的核苷酸序列。

61.权利要求59或权利要求60所述的方法，其中突变shp基因编码的多肽与SEQ ID NO:299、301、303、305、307、309、311、313、315或317中任一个具有至少90％的同一性。

62.一种编辑油菜植物细胞基因组中特定位点的方法，所述方法包括：以位点特异性方式切割油菜植物细胞中内源性SHATTERPROOF MADS-BOX(SHP)基因中的靶位点，所述内源性SHP基因：

(a)包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核苷酸序列，

(b)包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个具有至少80％的序列同一性的区域，

(c)编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的氨基酸序列，

(d)编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个的氨基酸序列具有至少80％的序列同一性的区域，

从而在油菜植物细胞的内源性SHP基因中产生编辑并产生包含内源性SHP基因中的编辑的油菜植物细胞。

63.权利要求62所述的方法，其中所述内源性SHP基因是内源性SHP1基因、内源性SHP2基因、内源性SHP3基因和/或内源性SHP4基因，任选地是内源性SHP1A基因、内源性SHP2A基因、内源性SHP2C基因、内源性SHP3A基因、内源性SHP3C基因或内源性SHP4A基因。

64.权利要求62或权利要求63所述的方法，其中在两种或更多种内源性SHP基因中产生编辑。

65.权利要求62-64中任一项所述的方法，所述方法还包括从包含内源性SHP基因中的编辑的油菜植物细胞再生油菜植物，以产生在其内源性SHP基因中包含所述编辑的油菜植物。

66.权利要求62-65中任一项所述的方法，其中所述编辑导致非天然突变。

67.权利要求62-66中任一项所述的方法，其中所述编辑位于内源性SHP基因的3'端中，任选地位于内源性SHP基因的倒数第二个外显子中、最后一个外显子中和/或倒数第二个外显子中以及与倒数第二个外显子的3'端相邻的内含子中(例如，突变跨越倒数第二个外显子和与倒数第二个外显子的3'端相邻的内含子)。

68.权利要求62-67中任一项所述的方法，其中在其内源性SHP基因中包含所述编辑的油菜植物表现出减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的表型。

69.权利要求62-68中任一项所述的方法，其中所述内源性SHP基因编码ShatterproofMADS-box转录因子(SHP)多肽，并且所述编辑产生截短的SHP多肽，任选地产生SHP多肽的C末端截短，任选地，其中所述C末端截短导致从SHP多肽的C末端缺失1个氨基酸残基至约100个连续氨基酸残基。

70.权利要求62-69中任一项所述的方法，其中所述编辑产生突变的SHP基因，所述突变的SHP基因包含与SEQ ID NO:298、300、302、304、306、308、310、312、314、316、318、319、321、322或323中任一个具有至少90％的序列同一性的核苷酸序列。

71.权利要求62-70中任一项所述的方法，其中所述编辑产生突变的SHP基因，所述突变的SHP基因编码的SHP多肽与SEQ ID NO:299、301、303、305、307、309、311、313、315或317中任一个具有至少90％的序列同一性。

72.一种产生油菜植物的方法，所述方法包括：

(a)使包含内源性SHATTERPROOF MADS-BOX(SHP)基因的油菜植物细胞群与连接至核酸结合结构域(例如编辑系统)的核酸酶接触，所述核酸结合结构域与下述序列结合：(i)所述序列与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个核苷酸序列具有至少80％的序列同一性，(ii)所述序列包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个具有至少80％的同一性的区域；(iii)所述序列编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的氨基酸序列，和/或(iv)所述序列编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的区域；

(b)从内源性SHP基因已被突变的油菜植物细胞群中选择油菜植物细胞，从而产生包含内源性SHP基因中的突变的油菜植物细胞；和

(c)将选择的油菜植物细胞生长成包含内源性SHP基因中的突变的油菜植物。

73.一种用于减少油菜植物荚果开裂和/或减少荚果瓣边缘木质化(减少的木质素含量)的方法，所述方法包括：

(a)使包含内源性SHATTERPROOF MADS-BOX(SHP)基因的油菜植物细胞与靶向内源性SHP基因的核酸酶接触，其中所述核酸酶与核酸结合结构域(例如编辑系统)连接，所述核酸结合结构域与内源性SHP基因中的靶位点结合，其中所述内源性SHP基因：

(i)包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核苷酸序列；

(ii)包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列具有至少80％的序列同一性的区域；

(iii)编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的SHP多肽；和/或

(iv)编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的SHP多肽的区域，以产生包含内源性SHP基因中的突变的油菜植物细胞；和

(b)将包含内源性SHP基因中的突变的油菜植物细胞生长成包含内源性SHP基因中的突变的油菜植物，从而产生具有突变的内源性SHP基因和减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)的油菜植物。

74.一种产生油菜植物或其部分的方法，所述油菜植物或其部分包含至少一个具有突变的内源性SHATTERPROOF MADS-BOX(SHP)基因的细胞，所述方法包括：

使油菜植物或植物部分中内源性SHP基因中的靶位点与包含切割结构域和核酸结合结构域的核酸酶接触，其中所述核酸结合结构域与内源性SHP基因中的靶位点结合，其中所述内源性SHP基因：

(a)包含与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核苷酸序列；

(b)包含与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个核苷酸序列具有至少80％的序列同一性的区域；

(c)编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的SHP多肽；和/或

(d)编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的SHP多肽的区域，

从而产生包含至少一个在内源性SHP基因中具有突变的细胞的所述油菜植物或其部分。

75.一种产生油菜植物或其部分的方法，所述油菜植物或其部分包含突变的内源性SHATTERPROOF MADS-BOX(SHP)基因，并表现出减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)，所述方法包括使油菜植物或植物部分中内源性SHP基因中的靶位点与包含切割结构域和核酸结合结构域的核酸酶接触，其中所述核酸结合结构域与内源性SHP基因中的靶位点结合，其中所述内源性SHP基因：

从而产生所述油菜植物或其部分，所述油菜植物或其部分包含具有突变的内源性SHP基因，并且表现出减少的荚果开裂和/或减少的荚果瓣边缘木质化(减少的木质素含量)。

76.权利要求72-75中任一项所述的方法，其中所述内源性SHP基因是内源性SHP1基因、内源性SHP2基因、内源性SHP3基因和/或内源性SHP4基因，任选地是内源性SHP1A基因、内源性SHP2A基因、内源性SHP2C基因、内源性SHP3A基因、内源性SHP3C基因或内源性SHP4A基因。

77.权利要求72-76中任一项所述的方法，其中所述核酸酶切割内源性SHP基因，从而将突变引入内源性SHP基因。

78.权利要求72-77中任一项所述的方法，其中所述突变是非天然突变。

79.权利要求72-78中任一项所述的方法，其中所述突变是置换、插入和/或缺失。

80.权利要求72-79中任一项所述的方法，其中所述突变是亚效等位基因突变、显性负性突变或显性负性亚效等位基因突变。

81.权利要求72-80中任一项所述的方法，其中所述突变是置换、插入和/或缺失。

82.权利要求72-81中任一项所述的方法，其中所述突变包括点突变。

83.权利要求72-82中任一项所述的方法，其中所述突变是约一个碱基对至约100个碱基对的插入。

84.权利要求72-83中任一项所述的方法，其中所述突变是一个碱基对至约100个碱基对的缺失。

85.权利要求72-84中任一项所述的方法，其中所述突变是导致过早终止密码子的框外插入或框外缺失。

86.权利要求72-85中任一项所述的方法，其中所述突变导致突变的SHP基因，所述突变的SHP基因产生突变的SHP蛋白，任选地，其中突变的SHP多肽在其C末端被截短。

87.权利要求86所述的方法，其中所述突变的SHP多肽在其C末端包含一个氨基酸残基至约100个连续氨基酸残基的截短，任选地包含约70个连续氨基酸残基至约80个连续氨基酸残基的C末端截短。

88.权利要求86或权利要求87所述的方法，其中所述突变的SHP基因包含与SEQ ID NO:298、300、302、304、306、308、310、312、314、316、318、319、321、322或323中任一个具有至少90％的序列同一性的核苷酸序列。

89.权利要求86-88中任一项所述的方法，其中所述突变的SHP多肽包含与SEQ ID NO:299、301、303、305、307、309、311、313、315或317中任一个具有至少90％的序列同一性的氨基酸序列。

90.权利要求72-89中任一项所述的方法，其中所述核酸酶是锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)、核酸内切酶或CRISPR-Cas效应蛋白。

91.权利要求72-90中任一项所述的方法，其中所述核酸结合结构域是锌指、转录激活因子样DNA结合结构域(TAL)、argonaute或CRISPR-Cas效应物DNA结合结构域。

92.一种通过权利要求72-91中任一项所述的方法产生的植物。

93.一种与SHATTERPROOF MADS-BOX(SHP)基因中的靶位点结合的引导核酸，其中所述靶位点在SHP基因的区域中，所述SHP基因的区域与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个具有至少80％的序列同一性，任选地，所述SHP基因的区域与SEQ ID NO:75-82、85-92、107-112、116-120、124-127、129、135、136、139、140、156、157、159-161、164-166、181-184、187-190、195、196、212-219、222-224、229、230、246-248、251-253、255-257、261-264、267、268、271、272、275、276、279、280、283或285中任一个具有至少80％的序列同一性。

94.权利要求93所述的引导核酸，其中所述引导核酸包含间隔子，所述间隔子包含SEQID NO:292-279中任一个的核苷酸序列。

95.一种系统，所述系统包含权利要求93或权利要求94所述的引导核酸和与所述引导核酸缔合的CRISPR-Cas效应蛋白。

96.权利要求95所述的系统，所述系统还包含与引导核酸缔合的tracr核酸和CRISPR-Cas效应蛋白，任选地，其中所述tracr核酸和引导核酸共价连接。

97.一种基因编辑系统，所述系统包含与引导核酸缔合的CRISPR-Cas效应蛋白，其中所述引导核酸包含与内源性SHATTERPROOF MADS-BOX(SHP)基因结合的间隔序列。

98.权利要求97所述的基因编辑系统，其中SHP基因：

(d)编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的序列同一性的SHP多肽的区域。

99.权利要求97或权利要求98所述的基因编辑系统，其中所述引导核酸包含间隔序列，所述间隔序列包含SEQ ID NO:292-297或342-346中任一个的核苷酸序列。

100.权利要求97-99中任一项所述的基因编辑系统，所述系统还包含与引导核酸缔合的tracr核酸和CRISPR-Cas效应蛋白，任选地，其中所述tracr核酸和引导核酸共价连接。

101.一种包含引导核酸和CRISPR-Cas效应蛋白的复合物，所述CRISPR-Cas效应蛋白包含切割结构域，其中所述引导核酸与内源性SHATTERPROOF MADS-BOX(SHP)基因中的靶位点结合，其中所述内源性SHP基因：

并且所述切割结构域切割SHP基因中的靶链。

102.一种表达盒，所述表达盒包含：(a)编码包含切割结构域的CRISPR-Cas效应蛋白的多核苷酸和(b)与内源性SHATTERPROOF MADS-BOX(SHP)基因中的靶位点结合的引导核酸，其中引导核酸包含与以下互补并结合的间隔序列：

(i)与SEQ ID NO:69、70、100、101、148、149、177、178、206、207、240或241中任一个具有至少80％的序列同一性的核酸的部分；

(ii)与SEQ ID NO:72-96、103-144、151-173、180-202、209-236、243-288或324-338中任一个具有至少80％的序列同一性的核酸的部分；

(iii)编码与SEQ ID NO:71、102、150、179、208或242中任一个具有至少80％的序列同一性的氨基酸序列的核酸的部分；和/或

(iv)编码与SEQ ID NO:97-99、145-147、174-176、203-205、237-239或289-291中任一个具有至少80％的同一性的氨基酸序列的核酸的部分。

103.一种油菜植物或其植物部分，所述油菜植物或其植物部分包含至少一种内源性SHATTERPROOF MADS-BOX(SHP)基因中的至少一个突变，所述基因具有BnaA04g01810D(SHP3)、BnaA07g18050D(SHP2)、BnaA05g02990D(SHP4)、BnaA09g55330D(SHP1)、BnaC04g23360D(SHP3)和/或BnaC06g16910D(SHP2)的基因识别号(基因ID)，任选地，其中所述至少一个突变是非天然突变。

104.与SHATTERPROOF MADS-BOX(SHP)基因中的靶核酸结合的引导核酸，所述基因具有BnaA04g01810D(SHP3)、BnaA07g18050D(SHP2)、BnaA05g02990D(SHP4)、BnaA09g55330D(SHP1)、BnaC04g23360D(SHP3)和/或BnaC06g16910D(SHP2)的基因识别号(基因ID)。

105.一种产生油菜植物的方法，所述油菜植物包含内源性SHATTERPROOF MADS-BOX(SHP)基因中的突变和至少一种感兴趣的多核苷酸，所述方法包括：

将第一油菜植物与包含至少一种感兴趣的多核苷酸的第二油菜植物杂交以产生子代油菜植物，所述第一油菜植物是权利要求1-21、28-31、48、49、92或103中任一项所述的油菜植物；和

选择包含SHP基因中的突变和至少一种感兴趣的多核苷酸的子代油菜植物，从而产生包含内源性SHP转基因中的突变和至少一种感兴趣的多核苷酸的油菜植物。

106.一种产生油菜植物的方法，所述油菜植物包含内源性SHP基因中的突变和至少一种感兴趣的多核苷酸，所述方法包括：

将至少一种感兴趣的多核苷酸引入权利要求1-21、28-31、48、49、92和103中任一项所述的油菜植物中，从而产生包含SHP基因中的突变和至少一种感兴趣的多核苷酸的油菜植物。

107.一种产生油菜植物的方法，所述油菜植物包含内源性SHP基因中的突变并表现出改善的产量性状、改善的植物结构和/或改善的防御性状的表型，所述方法包括：

将第一植物与表现出改善的产量性状、改善的植物结构和/或改善的防御性状的表型的第二植物杂交，所述第一植物是权利要求1-21、28-31、48、49、92或103中任一项所述的植物；以及

选择包含SHP基因中的突变和改善的产量性状、改善的植物结构和/或改善的防御性状的表型的子代植物，从而产生包含内源性SHP基因中的突变并且与对照植物相比表现出改善的产量性状、改善的植物结构和/或改善的防御性状的表型的植物。

108.一种防治容器(例如，花盆或育苗盘等)、生长室、温室、田地、休闲区、草坪或路边的杂草的方法，所述方法包括：

对在容器、生长室、温室、田地、休闲区、草坪或路边生长的权利要求1-21、28-31、48、49、92或103中任一项所述的一种或多种(多株)油菜植物施用除草剂，从而防治其中生长有所述一种或多种油菜植物的容器、生长室、温室、田地、休闲区、草坪或路边的杂草。

109.一种减少昆虫对油菜植物的捕食的方法，所述方法包括向权利要求1-21、28-31、48、49、92或103中任一项所述的一种或多种油菜植物施用杀虫剂，从而减少昆虫对所述一种或多种植物的捕食。

110.一种减少油菜植物上的真菌病害的方法，所述方法包括将杀真菌剂施用于权利要求1-21、28-31、48、49、92或103中任一项所述的一种或多种油菜植物，从而减少所述一种或多种油菜植物上的真菌病害。

111.权利要求109或权利要求110所述的方法，其中一种或多种油菜植物生长在容器、生长室、温室、田地、休闲区、草坪或路边。

112.权利要求105-111中任一项所述的方法，其中所述感兴趣的多核苷酸是赋予除草剂耐受性、抗虫性、抗病性、增加的产量、提高养分利用效率或非生物胁迫抗性的多核苷酸。