CN116286742B

CN116286742B - CasD蛋白、CRISPR/CasD基因编辑系统及其在植物基因编辑中的应用

Info

Publication number: CN116286742B
Application number: CN202310237362.1A
Authority: CN
Inventors: 吕玉平; 林敏�; 左开井; 贾志伟; 张念; 李晓娇; 王劲; 燕永亮
Original assignee: Longping Biotechnology Hainan Co ltd
Current assignee: Longping Biotechnology Hainan Co ltd
Priority date: 2022-09-29
Filing date: 2023-03-13
Publication date: 2023-11-17
Anticipated expiration: 2043-03-13
Also published as: CN116286742A

Abstract

本发明属于植物基因编辑技术领域，具体涉及CasD蛋白、CRISPR/CasD基因编辑系统及其应用。本发明基因编辑系统的Cas基因来自耐辐射奇球菌与极端古菌，经过人工改造形成编码CasD蛋白，与gRNA形成的核酸核蛋白复合体，能精确靶向目标基因序列并产生切割，使所述靶基因DNA序列发生双链断裂(DSB)，DSB激活植物细胞的内源修复途径，造成靶标基因序列的改变，从而造成基因编辑。本发明的CasD蛋白具有特定的氨基酸序列，并且本发明的CRISPR/CasD基因编辑系统能够识别更广泛的PAM序列，且切割效率高、脱靶性低，在基因编辑领域中具有广泛的应用前景。

Description

CasD蛋白、CRISPR/CasD基因编辑系统及其在植物基因编辑中的应用

技术领域

本发明涉及基因编辑技术领域，具体涉及CasD蛋白、CRISPR/CasD基因编辑系统及其应用。

背景技术

基因编辑技术

早期的基因工程技术只能将外源或内源遗传物质随机插入宿主基因组，基因编辑则能定点编辑想要编辑的基因。基因编辑依赖于经过基因工程改造的核酸酶，也称“分子剪刀”，在基因组中特定位置产生位点特异性双链断裂(DSB)，诱导生物体通过非同源末端连接(NHEJ)或同源重组(HR)来修复DSB。CRISPR/Cas系统，是原核生物的一种获得性免疫系统，用于抵抗存在于噬菌体或质粒的外源遗传元件的入侵，存在于大多数细菌与所有的古菌中的一种防御机制，以消灭外来的质体或者噬菌体的DNA。CRISPR/Cas基因编辑技术凭借其操作方便、价格低廉，对基因位点进行精确性编辑的应用已经远超锌指核酸酶(ZFN)和转录激活因子效应类似物核酸酶(TALEN)技术，是近年来应用最为广泛使用的第3代基因编辑技术。

目前最为常用的编辑系统是CRISPR/Cas9系统，它识别NGG的PAM，该特征序列位于spacer的下游，对靶标序列进行平末端切割。Cas9是一种由crRNA和反式激活crRNA(Trans-activating crRNA，tracrRNA)引导的DNA核酸内切酶，能对基因进行精确性敲除、敲入或替换等，从而对靶基因表达水平进行有效的控制、或者改变靶基因所编码蛋白序列的目的。与通过蛋白定位目标序列的ZFN和TALEN技术相比，CRISPR/Cas9技术通过RNA碱基互补配对识别DNA，指导Cas9核酸酶切割识别的双链DNA，然后在特定的碱基之间产生DSB，DSB可以激活细胞内源的修复系统，包括非同源末端连接修复(NHEJ，non-homologous end-joining)和同源重组修复(HDR，homologous directed repair)，从而在靶标序列产生定向编辑，进而造成基因失活或者所编码产物的改变，该技术广泛用于基因功能研究以及植物基因定向突变育种工作。

用于基因组编辑的CRISPR/Cas9系统主要组成包括核酸内切酶Cas9、crRNA(CRISPR RNA)和反式激活CRISPR RNA(trans-activating crRNA，tracrRNA)所组成。成熟的crRNA单元是由DR(Direct Repeat)序列和间隔序列(spacer)组成。实际应用中crRNA和tracrRNA形成一条嵌合的单分子向导RNA(single guide RNA，sgRNA)，Cas9和sgRNA在细胞中形成二元复合体进行基因编辑。在基因编辑的过程中，该二元复合体首先在基因组中寻找PAM序列NGG，然后通过sgRNA中的～20nt的特异序列进行目标识别，一旦确定目标序列，Cas9蛋白会在PAM上游的第三和第四个核苷酸处介导生成双链断裂(DSB)(Jinek et al.，2012)。这些双链断裂导致宿主细胞中DNA修复系统的激活，通常通过非同源末端连接途径、或者同源重组的方式进行修复，在修复过程中将引入小的缺失或插入，从而产生定向突变(Voytas 2013)。

CRISPR/Cas12a属于V-A型系统，是继Cas9系统后发现的另一种类型的CRISPR系统，它识别TTTV的PAM，该基序位于spacer的5’端，对靶标序列切割后产生4-5bp的5’突出末端。该系统不包括tracrRNA，只需要Cas12a蛋白和crRNA就可以产生特定位点的切割，同时Cas12a蛋白除了核酸内切酶功能，还具有RNA酶的活性，可以将前体crRNA(pre-crRNA)处理成单个的成熟crRNA用于基因编辑，因此在多基因编辑设计中更为方便。两类CRISPR/Cas系统具有不同的优势，目前均被广泛应用于不同的基因编辑研究之中。

尽管CRISPR/Cas系统应用非常广泛，但在植物基因编辑的应用中仍存在一些问题。首先，不同类型的系统需要不同的PAM，PAM的识别序列限制了gRNA的设计。其次，CRISPR/Cas系统的编辑效率有待进一步提高，影响编辑效率的因素很多，包括Cas基因的表达，导向RNA的表达，核定位信号NLS的数量和位置等。此外，目前报道的系统脱靶性相对较高，因此，我们希望通过对Cas基因的序列进行定向改造，开发一种识别更为广泛的PAM，切割效率更高、脱靶性低、具有多方面良好性能的新型CRISPR/Cas系统。

发明内容

本发明的目的在于提供CasD蛋白、编码该蛋白的核苷酸序列、CRISPR/CasD系统以及基于该系统的基因编辑方法及其在植物基因编辑中的应用。发明人经过大量实验和反复探索，证实来自于耐辐射球菌(Deinococcus radiodurans，Dr)的Cas核酸酶结构区域序列可以用于Cas9蛋白的改造，改造后Cas蛋白的核酸切割效率非常高。基于此，本发明提供了一种DNA切割活性高、脱靶率低以及PAM识别广泛的复合新型RNA指导的DNA核酸内切酶——CasD系统，可用于水稻、玉米、小麦等禾本植物和双子叶植物的特异性位点诱变。

本发明提供的技术方案如下：

CasD蛋白

本发明的第一方面，提供了一种CasD蛋白，所述CasD蛋白的氨基酸序列如SEQIDNo:1所示；或与SEQ ID No.1所示的序列相比具有一个或多个氨基酸的置换、缺失或添加，且具有相同或相似生物学功能；或与SEQ ID No.1所示的序列相比具有至少90％的同一性，且具有相同或相似生物学功能。编码所述CasD蛋白的基因的核苷酸序列如SEQ ID No:2所示。

在某些实施方案中，所述CasD蛋白与SEQ ID No:1有90％，91％，92％，93％，94％，95％，96％，97％，98％，99％的同源性。

在某些实施方案中，所述CasD蛋白大小为1058个氨基酸。其结构域包含McrA/HNH、RuvC-like结构域以及WED结构域。

在本发明中，上述序列的生物学功能包括但不限于，与导向RNA结合的活性、核酸内切酶活性、在导向RNA引导下与靶序列特定位点结合并切割的活性。

衍生的蛋白

本发明的第二方面，提供了一种衍生蛋白，所述衍生蛋白包含本发明第一方面提供的CasD蛋白和其他多肽，所述其他多肽与所述CasD蛋白连接的方式包括化学偶合、基因融合、非共价连接，所述其他多肽包括核定位信号(NLS)序列、信号肽、蛋白标签。

在某些实施方案中，将本发明的CasD蛋白与核定位信号(NLS)序列连接，以赋予本发明的CasD蛋白进入细胞核的能力。

在某些实施方案中，将本发明的CasD蛋白与信号肽相互连接，以使得本发明的CasD蛋白具有细胞器的靶向性。

在某些实施方案中，将本发明的CasD蛋白与蛋白标签连接，以便于本发明的CasD蛋白的表达、检测、示踪和纯化。

需要说明的是，本发明的衍生蛋白不会影响CasD蛋白的期望活性(例如，与向导RNA结合的活性、核酸内切酶活性、在向导RNA引导下与靶序列特定位点结合并切割的活性)。

融合蛋白

本发明的第三方面，提供了一种融合蛋白，所述融合蛋白包含本发明第一方面提供的CasD蛋白和修饰部分，所述修饰部分直接连接于CasD蛋白的N端或C端；所述修饰部分包含蛋白标签和/或报告基因序列；

在某些实施方案中，本发明的修饰部分包含蛋白标签(protein tag)，这类蛋白标签是本领域技术人员熟知的，包括但不限于His、FLAG、Myc、MBP等，并且本领域技术人员已知如何根据期望目的(例如，纯化、检测或示踪)选择合适的蛋白标签。

在某些实施方案中，本发明的修饰部分包含报告基因序列，这类报告基因是本领域技术人员熟知的，包括但不限于GST、GFP、CFP、YFP等。

在某些实施方案中，本发明的融合蛋白编码如SEQ ID No:4所示的核苷酸序列。

需要说明的是，本发明的蛋白、融合蛋白不受其产生方式的限定，例如，其可以通过基因工程方法(重组技术)产生，也可以通过化学合成方法产生。

CRISPR/CasD复合物

本发明的第四方面，提供了一种复合物，其包含：(i)蛋白组分，选自本发明第一方面所述的CasD蛋白、本发明第二方面所述的衍生蛋白、本发明第三方面所述的融合蛋白及其任意组合，和(ii)核酸组分，所述核酸组分从5’至3’方向包含编码本发明第一方面提供的CasD蛋白的核酸分子和能够与靶序列杂交的导向序列，所述蛋白组分与所述核酸组分相互结合形成复合物。

在某些实施方案中，所述导向序列包含所述靶序列的互补序列。在某些实施方案中，所述核酸组分是gRNA，所述gRNA具有20-70个核苷酸。

在具体的实施方式中，本发明提供了一种CRISPR-CasD系统，包含CasD蛋白；所述gRNA与所述CasD蛋白形成二元复合物，其中所述CasD蛋白大小为1058个氨基酸，其结构域包含McrA/HNH、RuvC-like结构域以及WED结构域。

表达载体、宿主细胞、组合物

另一方面，本发明还提供了一种表达载体，所述载体包含以下任一种：本发明第一方面提供的CasD蛋白的核苷酸序列、表达本发明第一方面所述的CasD蛋白、表达本发明第二方面所述的衍生蛋白、表达本发明第三方面所述的融合蛋白。

在某些实施方案中，所述表达载体具有如SEQ ID No:3所示的核苷酸序列。

另一方面，本发明还提供了包含或表达前述CasD蛋白、编码CasD蛋白的核苷酸、衍生蛋白、融合蛋白、表达载体中的一种或多种的宿主细胞。

另一方面，本发明还提供了一种组合物，包含：(i)第一组分，选自前述宿主细胞、CasD蛋白、编码CasD蛋白的核苷酸、衍生蛋白、融合蛋白、表达载体中的一种或多种，和(ii)第二组分，包含gRNA核苷酸序列，或者编码所述gRNA核苷酸序列的脱氧核糖核苷酸序列。

在某些实施方案中，所述组合物不包含tracrRNA，只需要人工合成的gRNA。在某些实施方案中，所述组合物是非天然存在的或经修饰的。在某些实施方案中，所述组合物中的至少一个组分是非天然存在的或经修饰的。在某些实施方案中，所述第一组分是非天然存在的或经修饰的；和/或，所述第二组分是非天然存在的或经修饰的。

在某些实施方案中，当所述靶序列为DNA时，所述靶序列位于原间隔序列临近基序(PAM)的3’端，并且所述PAM具有5’-TNN所示的序列，其中，N选自A、G、T、C。

在某些实施方案中，所述靶序列存在于细胞内。在某些实施方案中，所述靶序列存在于细胞核内或细胞质(例如，细胞器)内。在某些实施方案中，所述细胞是真核细胞。

在某些实施方案中，所述CasD蛋白连接有一个或多个细胞核定位信号(NLS)序列。在某些实施方案中，所述NLS序列连接至所述CasD蛋白的N端或C端。在某些实施方案中，所述NLS序列融合至所述CasD蛋白的N端或C端。

基因编辑系统

另一方面，本发明还提供了一种CRISPR/CasD基因编辑系统，所述基因编辑系统包含前述CasD蛋白、衍生蛋白、融合蛋白、表达前述CasD蛋白的质粒、表达前述衍生蛋白的质粒、表达前述融合蛋白的质粒中的任一种或多种；所述基因编辑系统还包含gRNA或表达所述gRNA的质粒。

方法

另一方面，本发明还提供了一种编辑植物基因的方法，所述方法包括：(1)根据前述CasD蛋白的PAM识别位点确定待编辑基因的gRNA；(2)将所述CasD蛋白的基因序列和相应的gRNA克隆到表达载体中；(3)将所述表达载体转化到农杆菌中，通过农杆菌介导的遗传转化方法，将所述表达载体导入目标植物，获得定向基因编辑植株。

在某些实施方案中，所述植物为单子叶植物或双子叶植物；在某些实施方案中，所述植物选自玉米、高粱、小麦，水稻、木薯、大豆、棉花、拟南芥、烟草的任一种；在具体实施方式中，所述植物为水稻。

在某些实施方案中，所述靶基因存在于体外的核酸分子(例如，质粒)中。在某些实施方案中，所述靶基因存在于质粒中。所述修饰是指所述靶序列的断裂，如DNA的双链断裂或RNA的单链断裂。

在某些实施方案中，所述方法还包括：将编辑模板与所述靶基因接触，或者递送至包含所述靶基因的细胞中。在此类实施方案中，所述方法通过与外源模板多核苷酸同源重组修复所述断裂的靶基因，其中所述修复导致一种突变，包括所述靶基因的一个或多个核苷酸的插入、缺失、或取代。在某些实施方案中，所述突变导致在从包含该靶序列的基因表达的蛋白质中的一个或多个氨基酸改变。

应用

另一方面，本发明还提供了前述CasD蛋白、核苷酸、衍生蛋白、融合蛋白、复合物、权表达载体、宿主细胞、或组合物在植物基因编辑中的应用。

另一方面，本发明还提供了前述CasD蛋白、核苷酸、衍生蛋白、融合蛋白、复合物、权表达载体、宿主细胞、或组合物在离体单链DNA检测中的应用。

另一方面，本发明还提供了前述CasD蛋白、核苷酸、衍生蛋白、融合蛋白、复合物、权表达载体、宿主细胞、或组合物在改变植物生物学特性中的应用。

另一方面，本发明还提供了前述CasD蛋白、核苷酸、衍生蛋白、融合蛋白、复合物、权表达载体、宿主细胞、或组合物在调控水稻对NO₃ ^-吸收中的应用。

术语定义

在本发明中，除非另有说明，否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且，本文中所用的分子遗传学、核酸化学、化学、分子生物学、生物化学、细胞培养、微生物学、细胞生物学、基因组学和重组DNA等操作步骤均为相应领域内广泛使用的常规步骤。同时，为了更好地理解本发明，下面提供相关术语的定义和解释。

术语“CasD”是指，本发明人首次发现并鉴定的一种Cas效应蛋白，其具有选自下列的氨基酸序列：(i)SEQ ID No：1所示的序列；(ii)与SEQ ID No：1所示的序列相比具有一个或多个氨基酸的置换、缺失或添加(例如2个-10个氨基酸的置换、缺失或添加)的序列；或(iii)与SEQ ID No：1所示的序列具有至少80％的序列同一性的序列。

本发明的CasD是一种在导向RNA引导下与靶序列特定位点结合并切割的核酸内切酶，同时具有DNA和RNA内切酶活性。

如本文中所使用的，术语“规律成簇的间隔短回文重复(Clustered RegularlyInterspersed Short Palindromic Repeats)-关联(associated)系统(CRISPR-Cas系统)”或“CRISPR系统”可互换地使用并且具有本领域技术人员通常理解的含义，其通常包含与CRISPR相关基因(Cas)的表达有关的转录产物或其他元件，或者能够指导所述Cas基因活性的转录产物或其他元件。此类转录产物或其他元件可以包含编码Cas效应蛋白的序列和包含CRISPR RNA(crRNA)的导向RNA，以及在CRISPR-Cas9系统中所含有的反式激活CRISPRRNA(tracrRNA)，或来自CRISPR基因座的其他序列或转录产物。在本发明所述的基于CasD的CRISPR系统中，不需要tracrRNA序列。

如本文中所使用的，术语“Cas效应蛋白”、“Cas效应酶”可互换地使用并且是指，CRISPR-Cas系统中呈现的任一种大于长度900个氨基酸的蛋白质。在某些情况下，这类蛋白是指从Cas基因座中鉴定的蛋白。

如本文中所使用的，术语“向导RNA(guide RNA)”、“成熟crRNA”可互换地使用并且具有本领域技术人员通常理解的含义。一般而言，向导RNA可以包含同向重复序列(directrepeat)和间隔序列(spacer)，或者基本上由或由同向重复序列和导向序列(在内源性CRISPR系统背景下也称为间隔序列(spacer)组成。在某些情况下，导向序列是与靶序列具有足够互补性从而与所述靶序列杂交并引导CRISPR/Cas复合物与所述靶序列的特异性结合的任何多核苷酸序列。在某些实施方案中，当最佳比对时，导向序列与其相应靶序列之间的互补程度为至少50％。确定最佳比对在本领域的普通技术人员的能力范围内。例如，存在公开和可商业的比对算法和程序，诸如但不限于ClustalW、matlab中的史密斯-沃特曼算法(Smith-Waterman)、Bowtie、Geneious、Biopython以及SeqMan。在某些情况下，所述导向序列(gRNA)在长度上为至少15个核苷酸。

如本文中所使用的，术语“CRISPR/Cas复合物”是指，导向RNA(guide RNA)或成熟crRNA与Cas蛋白结合所形成的核糖核蛋白复合体，其包含杂交到靶序列上并且与Cas蛋白结合的导向序列。该核糖核蛋白复合体能够识别并切割能与该导向RNA或成熟crRNA杂交的多核苷酸。

因此，在形成CRISPR/Cas复合物的情况下，“靶序列”是指被设计为具有靶向性的导向序列所靶向的多核苷酸，例如与该导向序列具有互补性的序列，其中靶序列与导向序列之间的杂交将促进CRISPR/Cas复合物的形成。完全互补性不是必需的，只要存在足够互补性以引起杂交并且促进一种CRISPR/Cas复合物的形成即可。靶序列可以包含任何多核苷酸，如DNA或RNA。在某些情况下，所述靶序列位于细胞的细胞核或细胞质中。在某些情况下，该靶序列可位于真核细胞的一个细胞器例如线粒体或叶绿体内。可被用于重组到包含该靶序列的靶基因座中的序列或模板被称为“编辑模板”或“编辑多核苷酸”或“编辑序列”。在某些实施方案中，所述编辑模板为外源核酸。在某些实施方案中，该重组是同源重组。

本发明中，表述“靶序列”或“靶多核苷酸”可以是对细胞(例如，真核细胞)而言任何内源或外源的多核苷酸。例如，该靶多核苷酸可以是一种存在于真核细胞的细胞核中的多核苷酸。该靶多核苷酸可以是一个编码基因产物(例如，蛋白质)的序列或一个非编码序列(例如，调节多核苷酸或无用DNA)。在某些情况下，该靶序列应该与原间隔序列临近基序(PAM)相关。对PAM的精确序列和长度要求取决于使用的Cas效应酶而不同，但是PAM典型地是临近原间隔序列(也即靶序列)的2-5个碱基对序列。本领域技术人员能够鉴定与给定的Cas效应蛋白一起使用的PAM序列。

在某些情况下，靶序列或靶多核苷酸的实例包括产量、品质与抗逆性等相关基因或核苷酸。在改变的表达与产量、品质与抗逆性等相关基因相关的情况下，它可以是一个以异常高的水平被表达的基因；或者，它可以是一个以异常低的水平被表达的基因。转录的或翻译的产物可以是已知的或未知的，并且可以处于正常或异常水平。

如本文中所使用的，术语“野生型”具有本领域技术人员通常理解的含义，其表示生物、菌株、基因的典型形式或者当它在自然界存在时区别于突变体或变体形式的特征，其可从自然中的来源分离并且没有被人为有意地修饰。

如本文中所使用的，术语“非天然存在的”或“工程化的”可互换地使用并且表示人工的参与。当这些术语用于描述核酸分子或多肽时，其表示该核酸分子或多肽至少基本上从它们在自然界中或如发现于自然界中的与其结合的至少另一种组分游离出来。

如本文中所使用的，术语“直系同源物(orthologue,ortholog)”具有本领域技术人员通常理解的含义。作为进一步指导，如本文中所述的蛋白质的“直系同源物”是指属于不同物种的蛋白质，该蛋白质执行与作为其直系同源物的蛋白相同或相似的功能。

如本文中所使用的，术语“同一性”用于指两个多肽之间或两个核酸之间序列的匹配情况。当两个进行比较的序列中的某个位置都被相同的碱基或氨基酸单体亚单元占据时(例如，两个DNA分子的每一个中的某个位置都被腺嘌呤占据，或两个多肽的每一个中的某个位置都被赖氨酸占据)，那么各分子在该位置上是同一的。两个序列之间的“百分数同一性”是由这两个序列共有的匹配位置数目除以进行比较的位置数目×100的函数。例如，如果两个序列的10个位置中有6个匹配，那么这两个序列具有60％的同一性。例如，DNA序列CTGACT和CAGGTT共有50％的同一性(总共6个位置中有3个位置匹配)。通常，在将两个序列比对以产生最大同一性时进行比较。这样的比对可通过使用，例如，可通过计算机程序例如Align程序方便地进行的Needleman等人(1970)J.Mol.Biol.48：443-453的方法来实现。

如本文中所使用的，术语“载体”是指，可将多聚核苷酸插入其中的一种核酸运载工具。当载体能使插入的多核苷酸编码的蛋白获得表达时，载体称为表达载体。载体可以通过转化，转导或者转染导入宿主细胞，使其携带的遗传物质元件在宿主细胞中获得表达。载体是本领域技术人员公知的，包括但不限于：质粒；噬菌粒；柯斯质粒；人工染色体，例如酵母人工染色体(YAC)、细菌人工染色体(BAC)或P1来源的人工染色体(PAC)；噬菌体如λ噬菌体或M13噬菌体及动物病毒等。一种载体可以含有多种控制表达的元件，包括但不限于，启动子序列、转录起始序列、增强子序列、选择元件及报告基因。另外，载体还可含有复制起始位点。

如本文中所使用的，术语“宿主细胞”是指，可用于导入载体的细胞，其包括但不限于，如大肠杆菌或枯草菌等原核细胞，如酵母细胞或曲霉菌等真菌细胞、以及各种植物细胞。

本领域技术人员将理解，表达载体的设计可取决于诸如待转化的宿主细胞的选择、所希望的表达水平等因素。一种载体可以被引入到宿主细胞中而由此产生转录物、蛋白质、或肽，包括由如本文所述的蛋白、融合蛋白、分离的核酸分子等(例如，CRISPR转录物，如核酸转录物、蛋白质、或酶)。

如本文中所使用的，术语“调节元件”旨在包括启动子、增强子、内部核糖体进入位点(IRES)、和其他表达控制元件(例如转录终止信号)，这些数据可以在相关的专业网站上进行检索。在某些情况下，调节元件包括指导一个核苷酸序列在许多类型的宿主细胞中的组成型表达的那些序列以及指导该核苷酸序列只在某些宿主细胞中表达的那些序列(例如，组织特异型调节序列)。组织特异型启动子可主要指导基因在感兴趣的期望组织中的表达，所述组织例如根、茎秆、叶片、花序等类型的细胞。

如本文中所使用的，术语“启动子”具有本领域技术人员公知的含义，其是指一段位于基因的上游能启动下游基因表达的非编码核苷酸序列。组成型(constitutive)启动子核苷酸与编码或者限定基因产物的多核苷酸可操作地相连时，在细胞的大多数或者所有生理条件下，其导致细胞中基因产物的产生。诱导型启动子是这样的核苷酸序列，当可操作地与编码或者限定基因产物的多核苷酸相连时，基本上只有当对应于所述启动子的诱导物在细胞中存在时，其导致所述基因产物在细胞内产生。组织特异性启动子是这样的核苷酸序列：当可操作地与编码或者限定基因产物的多核苷酸相连时，基本上只有当细胞是该启动子对应的组织类型的细胞时，其才导致在细胞中产生基因产物。

如本文中所使用的，术语“可操作地连接”旨在表示感兴趣的核苷酸序列以一种允许该核苷酸序列的表达的方式被连接至该一种或多种调节元件(例如，处于一种体外转录/翻译系统中或当该载体被引入到宿主细胞中时，处于该宿主细胞中)。

如本文中所使用的，术语“互补性”是指核酸与另一个核酸序列借助于传统的沃森-克里克或其他非传统类型形成一个或多个氢键的能力。互补百分比表示一个核酸分子中可与一个第二核酸序列形成氢键(例如，沃森-克里克碱基配对)的残基的百分比(例如，10个之中有70％以上互补)。“完全互补”表示一个核酸序列的所有连续残基与一个第二核酸序列中的相同数目的连续残基形成氢键。

如本文中所使用的，对于杂交的“严格条件”是指与靶序列具有互补性的一个核酸主要地与该靶序列杂交并且基本上不杂交到非靶序列上的条件。严格条件通常是序列依赖性的，并且取决于许多因素而变化。一般而言，该序列越长，则该序列特异性地杂交到其靶序列上的温度就越高。

如本文中所使用的，术语“杂交”是指其中一个或多个多核苷酸反应形成一种复合物的反应，该复合物经由这些核苷酸残基之间的碱基的氢键键合而稳定化。氢键键合可以借助于沃森-克里克碱基配对、Hoogstein结合或以任何其他序列特异性方式而发生。该复合物可包含形成一个双链体的两条链、形成多链复合物的三条或多条链、单个自我杂交链、或这些的任何组合。杂交反应可以构成一个更广泛的过程(如PCR的开始、或经由一种酶的多核苷酸的切割)中的一个步骤。能够与一个给定序列杂交的序列被称为该给定序列的“互补物”。

如本文中所使用的，术语“表达”是指，藉此从DNA模板转录成多核苷酸(如转录成mRNA或其他RNA转录物)的过程和/或转录的mRNA随后藉此翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以总称为“基因产物”。如果多核苷酸来源于基因组DNA，表达可以包括真核细胞中mRNA的剪接。

如本文中所使用的，术语“接头”是指，由多个氨基酸残基通过肽键连接形成的线性多肽。本发明的接头可以为人工合成的氨基酸序列，或天然存在的多肽序列，例如具有铰链区功能的多肽。

如本文中所使用的，术语“含有”、“具有”或“包括”包括了“包含”、“主要由……构成”、“基本上由……构成”和“由……构成”。

有益效果

(1)本发明提供了一种新的CasD蛋白和一种高效、稳定的CasD介导的基因编辑系统，可以在植物细胞中稳定、高效的表达，从而更好的调控靶基因的表达。CasD蛋白氨基酸数目少，CasD体积小为传递进入植物细胞中提供了优势(便于包装和递送)，且CasD使用单一活性位点进行crRNA处理和对DNA序列的切割。

(2)本发明CasD蛋白的PAM结构域具有较强的宽泛性5’-TNN结构，即具有广泛的PAM识别位点，提高了gRNA设计的多样性，可以构建多个基因编辑位点载体，实现对更多的基因进行敲除。

(3)本发明的CasD蛋白及CRISPR/CasD基因编辑系统可用于真核生物(如拟南芥、烟草、大豆、玉米等)中DNA序列的基因编辑，且DNA的切割效率更高。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是pCPB-CasD载体的结构示意图；其中，LB、RB指左、右边界序列，pZmU6为启动子，gRNA为向导RNA，FLAG为蛋白标签，KanR为卡那霉素抗性基因，Bar为筛选标记基因；tNOS为终止子。

图2是水稻CML18基因编辑植株的CasD基因扩增的琼脂糖凝胶电泳图；M：marker，WT：野生型(日本晴)，NC为水对照；#3、#8、#12、#14、#19、#21、#24：编号为3、8、12、14、19、21、24的转基因阳性植株。

图3是水稻CML18基因编辑植株的靶点碱基序列和序列比对图，红色高亮为PAM识别位点；WT：野生型(日本晴)，#14、#24：编号为14和24的基因编辑植株。

图4是不同NO₃ ^-浓度下野生型和基因编辑植株的N吸收差异；LN：0.3Mm NO₃ ^-浓度；HN:3mM；NO₃ ^-浓度误差线为标准误差(n＝3，每个重复包含20-25株幼苗)(*，P<0.05，**，P<0.01)。

具体实施方式

下面结合实施例对本发明做进一步的说明，以下所述，仅是对本发明的较佳实施例而已，并非对本发明做其他形式的限制，任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更为同等变化的等效实施例。凡是未脱离本发明方案内容，依据本发明的技术实质对以下实施例所做的任何简单修改或等同变化，均落在本发明的保护范围内。

另外，实施例中未注明具体条件者，按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者，均为可以通过市购获得的常规产品。本领域技术人员知晓，实施例以举例方式描述本发明，且不意欲限制本发明所要求保护的范围。本文中提及的全部公开案和其他参考资料以其全文通过引用合并入本文。

实施例1：CasD基因的获得

1、极端微生物中所有Cas蛋白的检索：

从NCBI、TAIR、Enzyme等网站下载已报道的Cas9、Cas12等蛋白的氨基酸序列。使用Prodigal对NCBI和JGI数据库的微生物基因组和宏基因组数据进行基因注释得到所有蛋白。利用所有氨基酸序列建立本地Blast数据库，利用Gene Edit软件本地Blast功能，检索极端微生物中所有的Cas蛋白以及与Cas9功能有关的结构域。

2、蛋白质比对：

使用BLASTP对CRISPR相关蛋白质家族的蛋白比对，获得去除CRISPR相关蛋白的非冗余大分子蛋白数据库，输出E value<1e-10的比对结果。如果一个非CRISPR相关蛋白数据库发现的同源蛋白小于100％，那么则说明这个家族的蛋白在CRISPR区域是富集的，通过这种方法我们对CRISPR富集大分子蛋白质家族进行鉴定。

3、蛋白质的过滤：

通过序列一致性对所有注释蛋白去冗余，去除序列完全一致的蛋白，同时将长度大于800个氨基酸的蛋白划分为大分子蛋白。由于目前发现的所有第二类CRISPR/Cas系统的效应蛋白长度多数大于900个氨基酸，所以为了降低计算复杂度，我们在挖掘CRISPR效应蛋白的时候只对大分子蛋白进行考虑。

4、CasD基因及蛋白的获得：

对所获得Cas家族氨基酸序列，利用Mega X软件绘制系统进化树。获得与哺乳动物乳球菌(Mammaliicoccus fleurettii)、化脓链球菌Cas9蛋白关系较近的极端微生物的Cas蛋白。进一步利用TAIL-PCR方法，根据推测的序列获得CasD基因5’端序列，以收集的极端环境(沙漠、土壤环境的)混合DNA为模板，经过2轮扩增以后最终获得CasD全长核苷酸序列。

5、CasD核酸序列优化：

考虑到极端微生物基因与植物之间的进化关系比较远，核酸的密码子偏好性有较大的差异，我们根据单子叶、双子叶共有的密码子偏好性对极端微生物CasD基因的核酸序列进行密码子优化，最终优化后得到的CasD核酸序列如SEQ ID No.2所示，CasD蛋白的氨基酸序列如SEQ ID No.1所示，克隆后连接于PUC19载体，转化Top10菌株保存。

实施例2：利用拟南芥原生质体鉴定CRISPR-CasD的所识别的PAM结构

1、实验方法

(1)CasD基因表达质粒的构建：

将CasD基因构建到CPB载体上，通过测序鉴定基因已经插入到多克隆位点之中。同时构建编辑GFP基因的CRISPR-CasD/GFP表达载体。构建好的载体可以通过gRNA引导作用，对GFP基因进行编辑，影响GFP基因的正常表达。

(2)PAM文库的构建：

人工合成4个随机碱基的序列，并通过PCR扩增在5’、3’端加上NcoI的接头。将随机碱基的片段分别引入到pCAMBIA1301-GFP载体中GFP靶序列位置前后，构建PAM打靶文库质粒。

(3)原生质体制备：

选取长势较好的3-4周龄的拟南芥幼苗，取0.1g左右的拟南芥叶片(约10～15叶片)，用刀片去除叶片的尖端与基部，并将其切成0.5-1mm左右的小条，用平头镊子将切好的小条放入准备好的细胞壁消化液中并使其完全浸入。使用玻璃真空干燥器室温避光条件下抽真空30min，以使细胞壁消化液更好地进入细胞间隙。在室温条件下，酶消化3h。细胞壁消化液(0.4M甘露醇，1％cellulose RS，0.1％ Macenzyme，5mM MES，0.1％果胶酶，0.15％BSA，8mM CaCl₂)在缓慢旋转后变成绿色，表示已有原生质体释放。显微镜下观察和检查原生质体的释放情况，拟南芥原生质体大小约为30-50μM。

(4)遗传转化：

取适量5×Dilution Buffer(0.4M甘露醇，0.1％ MgCl₂，4mM MES)，用水稀释至1×，用等体积的1×Dilution Buffer稀释原生质体，70μm细胞过滤器(FSTR070)或者75μm孔径的尼龙筛网(约200目)过滤去除未消化的叶片组织。收集滤液于50mL离心管，室温100g离心1-2min，尽量去除上清，用5mL 1×Dilution Buffer重新悬浮原生质体，室温静置30min。室温100g离心1-2min)，加入约1.5-2.5mL或更小体积的Resuspension Buffer，将原生质体以2×10⁵/mL的密度或更高密度悬浮于重悬液中，即为原生质体悬液。制备好的原生质体可以在4℃或冰浴保存至少24h。待使用前，向制备好的原生质体中加入等体积的40％ PEG，利用PEG转化方法将实验组(CRISPR-CasD/GFP、PAM的打靶文库质粒)以及对照组(CRISPR-CasD/GFP、pCAMBIA1301载体质粒)分别转化到拟南芥原生质体中。

(5)PCR扩增与测序：

原生质体文库过夜培养以后，利用流式细胞仪分离荧光减弱的细胞并提取DNA，并对PAM区域序列进行PCR扩增和测序。

2、实验结果

分别统计实验组(同时转化CRISPR-CasD/GFP、PAM打靶文库质粒)和对照组(同时转化CRISPR-CasD/GFP、pCAMBIA1301载体质粒)中组合的PAM序列出现次数，总共得到了2100条显著可以被CRISPR/CasD系统识别的PAM序列。对被切割GFP序列的PAM序列进行测序和Alignment比对分析，发现CRISPR-CasD/GFP系统只能对带有5’-TTA、5’-TAT、5’-TAC和5’-TTG的PAM靶标序列进行有效地编辑，说明CRISPR/CasD系统对5’-TW(A/T)N具有高编辑活性。

实施例3：CasD表达载体的构建

1、实验目的

以pCPB载体为基础构建带有通用接头的pCPB-GT载体，如图1所示为pCPB-CasD(CRISPR/CasD)基因编辑载体的结构示意图，其序列如SEQ No:3所示，其中gRNA为非固定序列。

OsCML18(基因号：Os05g0223000)所编码的蛋白是与Ca²⁺结合的类钙调素蛋白。CML18蛋白的功能主要是通过与受体蛋白结合负向调控植物的氮素利用效率、抗逆境水平以及根系发育。本发明以水稻CML18基因为目的基因，利用CRISPR/CasD定向编辑水稻CML18基因从而实现改善水稻的氮素利用效率以及增强抗逆性。

2、实验方法

(1)合成引物序列

CasD-attBF：5’-GGGGACAAGTTTGTACAAAAAAGCAGGCTTCATGAAAAACAG CTAC ATCCTGG-3’；

CasD-attBR：5’-GGGGACCACTTTGTACAAGAAAGCTGGGTCCAGCACGCCTCTT TT GAAGATCAG-3’。

(2)PCR扩增CasD基因

以合成的基因CasD-pUC19为模板，PCR扩增CasD基因。PCR扩增体系如下表所示。

将上述体系按照3步法进行反应，35个循环后，72℃延伸10min，反应程序如下：

对获得的PCR产物进行1％琼脂糖凝胶电泳，获得单一明亮的3200bp左右的条带，对该条带进行切胶回收，然后利用Axygen DNA胶回收试剂盒离心回收PCR产物。

(3)CasD-pDONR质粒的构建

将纯化后的DNA分子pCasD-attB进行BP克隆反应连入中间载体pDONR，反应体系如下：CasD-attB:3μL，pDONR质粒：1μL，BP克隆酶：1μL。

在上述体系中25℃反应1小时后全部转化大肠杆菌DH5α。转化子在抗性平板上进行筛选，在37℃倒置平板培养14小时后，挑取单克隆进行摇菌在LB+博来霉素25mg/L的培养基中进行培养4-6h。然后对培养物进行PCR检测。PCR表现为阳性的克隆进行测序验证。

(4)pCPB-CasD质粒的构建

选择2个合适的靶位点。在目标基因编码区上游选取靶序列(PAM序列前20bp，PAM序列为TNN)，合成靶序列的正义链和反义链并退火合成靶序列dsDNA；

根据CasD识别的PAM序列，选择水稻CML18基因的特异序列作为gRNA靶点，其靶标核苷酸序列如下：

靶序列：5’-TGGAGCAGGTGTTCCGGCGG-3’

已测序验证的CasD-pDONR质粒进行LR克隆反应，连接入植物表达载体pCPB-CasD，反应体系如下表。

在上述反应体系中25℃反应1小时后全部转化大肠杆菌DH5α，37℃倒置平板培养14h后挑取单克隆进行培养。在液体LB(卡那霉素100mg/L)培养4-6h后PCR检测，阳性克隆进行测序验证。

(5)pCPB-CasD质粒转化农杆菌

已测序验证的pCPB-CasD质粒转化农杆菌GV3101。转化后的农杆菌平板在28℃倒置培养48h。挑单克隆摇菌在液体LB(卡那霉素100mg/L，庆大霉素50mg/L，利福平50mg/L)培养基中培养4-6h后进行PCR检测。

阳性克隆继续扩大培养，10μL菌液，10mL液体LB(卡那霉素100mg/L，庆大霉素50mg/L，利福平50mg/L)培养，28℃，220rpm培养过夜后，5000rpm离心菌体，10mM MgCl₂重悬菌体，OD₆₀₀约0.6-0.8，10mM MES，200μM AS，黑暗诱导3小时，用于遗传转化。

实施例4：CasD表达载体的遗传转化

1、培养基

本实验所用的培养基如下(具体成分见下表)：

(1)诱导培养基(MS2)：MS0+2，4-D 2ppm(mg/l)；

(2)共培养基(MSCO)：MS2+AS 100μmol(液体培养基不加phytagel)；

(3)选择培养基(S1)：MS2+Kan(卡那霉素)75ppm+Cef(头孢霉素)250ppm；

(4)选择培养基(S2)：MS2+Kan(卡那霉素)75ppm 50ppm+Cef(头孢霉素)250ppm；

(5)预分化培养基：MS0+KT 2ppm+NAA 0.2ppm+6-BA 2ppm+Kan(卡那霉素)75ppm+phytagel 5g/L+麦芽糖30g/L；

(6)分化培养基：MS0+KT 2ppm+NAA 0.2ppm+6-BA 2ppm+Kan(卡那霉素)75ppm+phytagel 5g/L+麦芽糖30g/l；

(7)生根培养基：1/2MS0+Kan(卡那霉素)75ppm+NAA 0.5ppm+phytagel 2.5g/l+蔗糖20g/l。

表4-1水稻遗传转化MS0培养基组分以及配方

配制基本培养基MS0作为后续培养基的基础使用，后续培养基在基础培养基的基础添加不同的化合物和抗生素。在121℃条件下，培养基灭菌20分钟。如果添加麦芽糖的要求的培养基，灭菌温度在115℃保持15分钟。

2、实验方法

(1)外植体消毒：

在无菌器皿中，水稻品种日本晴成熟胚或幼胚经过以下洗涤：75％酒精浸1-2min—无菌水洗2次—25％的次氯酸钠浸30min(期间要摇动几次，或放在摇床上摇动)—无菌水洗4-5次—将种子移到无菌滤纸上，吸干水分接到MS2上，每皿25粒、27℃暗培养。

(2)继代：

将水稻长出的黄色愈伤转到新鲜的MS2上继续培养，以后每2周继代一次。经2次继代后即可选择嫩黄、颗粒状的胚性愈伤准备与农杆菌进行共培养。

(3)农杆菌的活化：

取用甘油保存于-80℃的农杆菌(实施例3中得到的pCPB-CasD质粒转化的农杆菌)50-100μl于2mL的LB液体培养基中(酵母粉:5g；蛋白胨:10g；NaCl:10g；琼脂:7g；Ph＝7.0；总体积1L。需要高压灭菌)，并加入相应的抗生素(例如：利福平，20-50ppm；链霉素，50-100ppm；卡那霉素，50ppm；壮观霉素，50-100ppm；氯霉素，20-50ppm)，在摇床上以250rpm转速左右，27℃摇菌24-36h至OD₆₀₀＝0.5。再取新摇菌100-200μL于30mL的LB液体培养基中，并加入相应的抗生素(浓度、条件同上)，经过12小时左右生长，菌液达到OD₆₀₀＝0.5时，即可以用来转化。

(4)共培养：

菌液在无菌的50mL的离心管中5000rpm，离心5min，去上清，再用30mL的共培养液体培养基重悬。将预先挑好的愈伤浸在菌液中20-30min后，再用无菌滤纸或吸水纸洗去多余的菌液(无须进一步吸干)，置于共培养液体培养基(MSCO)固体培养基(可覆盖一层无菌滤纸)上，27℃条件下暗培养3d。

(5)愈伤选择：

共培养的愈伤先用无菌水冲洗3次，再浸于含头孢霉素的MSCO液体培养基中20-30分钟，将愈伤组织用无菌滤纸或吸水纸洗干后，接种于选择培养基S1上，培养3周。挑选新长出的愈伤接种于选择培养基S2上，培养3周。

(6)分化与生根：

将经过2次选择得到的抗性愈伤接种到预分化培养基上，然后进行暗培养10天左右，再转到分化培养基上进行光照培养。约1-2个月，将2cm左右高的幼苗转到生根培养基上。当苗长至10cm高时，先要少量透气，并在培养基上加水，防止杂菌生长。待苗适应后，完全置于空气中。当可移栽于温室中时，先要洗净根部的培养基，再移入土中。实施例5：CasD在水稻中的基因编辑效果分析

1、PCR鉴定

筛选实施例4中正常生长的幼苗，提取单株扩增植株中的CasD基因。以DNA或菌液为模板，利用2×Hieff^TMPCR Master Mix酶进行扩增，PCR反应体系如下。

将上述体系按照3步法进行反应，35个循环后，72℃延伸10min，4℃终止反应，反应程序如下：

利用1％琼脂糖凝胶电泳成像拍照。

经过PCR检测，共获得阳性植株85株。编号#3、#8、#12、#14、#19、#21、#24的7株基因编辑阳性植株的琼脂糖凝胶电泳图(图2)。

2、25株阳性植株的测序分析

在上述阳性植株的基础上筛选25株基因编辑植株进行测序分析，PAM序列(TNN)前20bp设置为检测序列(实施例3中的靶序列)，与靶序列(5’-TGGAGCAGGTGTTCCGGCGG-3’)进行比对，经过显示靶标基因发生编辑的植株为24株，基因编辑效率为96％。

为了显示基因编辑效果，对其中14号基因编辑植株、24号基因编辑植株靶标基因进行进一步比较。如图3所示，与靶序列进行比对，14号基因编辑植株发生了碱基缺失突变，缺失了碱基G，而24号基因编辑植株发生了碱基增加情况，增加了一个A碱基。

3、基因功能缺失分析

为了检测水稻CML18基因被编辑后是否影响水稻对NO₃ ^-的吸收，利用¹⁵N同位素标记法测定一定时间内水稻根部吸收的NO₃ ^-的量。将在无NO₃ ^-培养基中生长的水稻植株和对照植株用CaSO₄进行清洗，然后转移到含有0.2mM K¹⁵NO₃(¹⁵N:99％)的培养基中培养5min；

在0.1mM CaSO₄中再次冲洗植株根系1min，然后收集根，在80℃烘箱中干燥4天后，称重。使用超高效液相色谱-三重四极杆质谱仪(UPLC-3Q-MS，Sciex Quadrupole 5500)对样品进行¹⁵N含量分析。根据根的全N和¹⁵N含量计算¹⁵NO₃ ^-的吸收量。

结果如图4所示，与野生型相比，cml18突变体植株14和24对NO₃ ^-的吸收能力显著上调。由于有碱基的增加与缺失造成移码突变，基因编辑植株的碱基序列发生了复杂的变异，可能导致CML18完全丧失其功能，进而导致植株对NO₃ ^-的吸收能力发生显著提高。以上结果表明CML18可能负调控水稻对NO₃ ^-的吸收。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.CasD蛋白，其特征在于，所述CasD蛋白的氨基酸序列如SEQ ID NO:1所示。

2.一种融合蛋白，其特征在于，所述融合蛋白包含权利要求1所述的CasD蛋白和修饰部分，所述修饰部分直接连接于CasD蛋白的N端或C端；

所述修饰部分选自蛋白标签和/或报告基因；

所述蛋白标签选自His、FLAG、Myc或MBP；

所述报告基因选自GST、GFP、CFP或YFP；

所述融合蛋白由如SEQ ID NO:4所示的核酸编码。

3.一种复合物，其特征在于，所述复合物包含：(i)蛋白组分，选自权利要求1所述的CasD蛋白或权利要求2所述的融合蛋白中的任意一种，和(ii)核酸组分，所述蛋白组分与所述核酸组分相互结合形成复合物；所述核酸组分为gRNA，所述gRNA具有20-70个核苷酸。

4.一种表达载体，其特征在于，所述载体包含权利要求2所述的融合蛋白的编码核酸。

5.根据权利要求4所述的表达载体，其特征在于，所述表达载体的核苷酸序列如SEQ IDNO:3所示。

6.一种宿主细胞，其特征在于，所述宿主细胞中包括权利要求1所述的CasD蛋白、权利要求2所述的融合蛋白或权利要求4所述的表达载体中的任意一种；

所述宿主细胞是原核细胞或真核细胞；

所述原核细胞是农杆菌；

所述真核细胞是酵母细胞或植物细胞；

所述植物细胞是水稻细胞、拟南芥细胞或烟草细胞。

7.一种组合物，其特征在于，所述组合物包含：(i)第一组分，选自权利要求1所述的CasD蛋白、权利要求2所述的融合蛋白、编码权利要求1所述CasD蛋白的核酸或编码权利要求2所述的融合蛋白的核酸中的任意一种；和(ii)第二组分，包含gRNA；

所述组合物不包含tracrRNA。

8.一种CRISPR/CasD基因编辑系统，其特征在于，所述基因编辑系统包含以下任意一种：权利要求1所述的CasD蛋白、权利要求2所述的融合蛋白、表达权利要求1所述的CasD蛋白的质粒、表达权利要求2所述的融合蛋白的质粒；

所述基因编辑系统还包含gRNA或表达所述gRNA的质粒。

9.一种编辑植物基因的方法，其特征在于，所述方法包括：

（1）根据权利要求1所述的CasD蛋白的PAM识别位点确定待编辑基因的gRNA；

（2）将权利要求1所述的CasD蛋白的编码基因和步骤（1）所述的gRNA克隆到表达载体中；

（3）将所述表达载体转化到农杆菌中，通过农杆菌介导的遗传转化方法，将所述表达载体导入目标植物，获得定向基因编辑植株。

10.根据权利要求9所述的方法，其特征在于，所述植物为单子叶植物或双子叶植物。

11.根据权利要求10所述的方法，其特征在于，所述植物选自玉米、高粱、小麦，水稻、木薯、大豆、棉花、拟南芥、烟草的任一种。

12.根据权利要求11所述的方法，其特征在于，所述植物为水稻。

13.一种应用，其特征在于，所述应用包括以下任一项：

1）权利要求1所述的CasD蛋白、权利要求2所述的融合蛋白、权利要求3所述的复合物、权利要求4所述的表达载体、权利要求6所述的宿主细胞、或权利要求7所述的组合物在植物基因编辑中的应用；

2）权利要求1所述的CasD蛋白、权利要求2所述的融合蛋白、权利要求4所述的表达载体、权利要求6所述的宿主细胞、或权利要求7所述的组合物在改变植物生物学特性中的应用。