JP2023539668A

JP2023539668A - 操作されたＣＲＩＳＰＲ－Ｃａｓタンパク質およびその使用方法

Info

Publication number: JP2023539668A
Application number: JP2023514122A
Authority: JP
Inventors: ガフィー，シャロン・リー; ワッツ，ジョセフ・マシュー
Original assignee: Pairwise Plants Services Inc
Current assignee: Pairwise Plants Services Inc
Priority date: 2020-08-28
Filing date: 2021-08-27
Publication date: 2023-09-15
Also published as: CL2023000554A1; CN116745415A; MX2023002160A; KR20230058090A; IL300823A; US20220112473A1; CA3192195A1; EP4204436A1; AU2021331344A1; WO2022047135A1

Abstract

本明細書中に記載されるのは、操作されたＣＲＩＳＰＲ－Ｃａｓタンパク質およびそのようなタンパク質の使用方法である。特に、非Ｖ型ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼ由来のヌクレアーゼまたはニッカーゼドメインを有するＣａｓ１２ａのようなＶ型ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼが、Ｒｅｃ１ドメインとＲｅｃ２ドメインとの間のドメイン間リンカー領域内に挿入されている。また、本明細書中に記載されるのは、本発明の操作されたタンパク質を含む複合体、組成物、および系であり、これらは各々、標的核酸を修飾または編集するのに用いられてよい。本発明の操作されたタンパク質は、酵素であってよく、かつ／またはＲＮＡガイドＤＮＡ結合タンパク質であってよい。

Description

配列表の電子ファイルに関する陳述
３７Ｃ．Ｆ．Ｒ．§１．８２１に従って提出した、表題１４９９－３７ＷＯ＿ＳＴ２５の、９２２，２１７バイトのサイズの、２０２１年８月２７日に作成した、ＥＦＳ－Ｗｅｂを介して提出したＡＳＣＩＩテキストフォーマットの配列表を、紙コピーの代わりに提供する。この配列表は、その開示が参照によって本明細書中に組み込まれる。

分野
本発明は、操作されたタンパク質（例えば、操作された酵素）に、そしてそのようなタンパク質の使用方法に関する。本発明はさらに、標的核酸を修飾または編集するための組成物および系に関する。

ＩＩ型ＣＲＩＳＰＲエンドヌクレアーゼ（広く用いられるＳｐＣａｓ９が挙げられる）は、ＤＮＡ切断について、共通の機構を共有する。このファミリー内での酵素は、２つのヌクレアーゼドメイン（ＨＮＨおよびＲｕｖＣ）を含有し、これらは各々、単一のＤＮＡ鎖を切断する。Ｃａｓ９－ｓｇＲＮＡ複合体（またはＣａｓ９－ｃｒＲＮＡ－ｔｒＲＮＡ複合体）が、その標的ＤＮＡ配列に結合する場合、標的ＤＮＡ鎖は、ＲＮＡスペーサー配列に結合する一方、非標的ＤＮＡ鎖は、一本鎖ループを形成する。Ｃａｓ９のＨＮＨドメインは、標的ＤＮＡ鎖を切断し、ＲｕｖＣドメインは、非標的鎖を切断する（図１）。図１に示されるように、ＩＩ型ＣＲＩＳＰＲエンドヌクレアーゼ（例えばＣａｓ９）の場合、標的ＤＮＡ鎖および非標的ＤＮＡ鎖は、それぞれＨＮＨドメインおよびＲｕｖＣドメインによって同時に切断されて、平滑末端二本鎖切断を形成する。

ＩＩ型ＣＲＩＳＰＲエンドヌクレアーゼとは異なり、Ｖ型ＣＲＩＳＰＲエンドヌクレアーゼ（例えばＣａｓ１２ａ）は、非標的鎖から始めて双方のＤＮＡ鎖を順次切断する単一のヌクレアーゼドメインのみを有する。図２に示されるように、Ｖ型エンドヌクレアーゼ（例えばＣａｓ１２ａ）の場合、ＲｕｖＣドメインは、非標的ＤＮＡ鎖および標的ＤＮＡ鎖を順次切断して、スタガー二本鎖切断が生じる。

ＩＩ型ＣＲＩＳＰＲエンドヌクレアーゼおよびＶ型ＣＲＩＳＰＲエンドヌクレアーゼは、類似の機能を実行するが、それらの機構および構造は、高度に異なっている。２つの異なる型は、異なる前駆体から進化してきたと考えられており、ＲｕｖＣドメインのみが、２つの型にわたって、重要なあらゆる配列または構造相同性を共有している。Ｖ型ＣＲＩＳＰＲエンドヌクレアーゼは、ＩＩ型酵素内の標的鎖切断を担うＨＮＨドメインを欠いている。その代わりとして、Ｖ型ＣＲＩＳＰＲエンドヌクレアーゼ内のＲｕｖＣドメインは、非標的鎖から始まる双方のＤＮＡ鎖を順次切断する（図２）。したがって、ＲｕｖＣドメインの触媒残基を変異させると、全てのヌクレアーゼ活性を妨げ、標的鎖ニッカーゼを生成するのではなく不活化された酵素を生成する。非標的鎖ニッカーゼ変異が、Ｃａｓ１２ａにおいて特定されている。しかしながら、この変異は、ＲｕｖＣドメインの外側にあり、酵素の触媒効率全体を引き下げることによって機能すると考えられる。Ｖ型ＣＲＩＳＰＲ標的鎖ニッカーゼは存在せず、そしてＩＩ型ＣＲＩＳＰＲエンドヌクレアーゼと比較した、Ｖ型ＣＲＩＳＰＲエンドヌクレアーゼの構造および作用機構の差異を考えると、明確な生成方法はない。

本発明の第１の態様は、少なくとも２つの異なるポリペプチドを含む操作されたタンパク質に関し、少なくとも２つの異なるポリペプチドの一方は、第１のＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の第１の部分である第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドであり、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、ヌクレアーゼドメインが欠けており；少なくとも２つの異なるポリペプチドのもう１つは、Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質に対して異種であり、かつＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分でない異種ポリペプチドである。

本発明の別の態様は、標的鎖ニッカーゼドメインまたはその部分であり、かつＶ型ヌクレアーゼドメインまたはその部分でない第１のヌクレアーゼドメインと；Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分である第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドとを含む操作されたタンパク質に関する。一部の実施形態において、第１のヌクレアーゼドメインは、標的鎖特異的ニッカーゼドメイン、または標的および非標的鎖ニッカーゼドメインである。

本発明の更なる態様は、第１のＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の第１の部分である第１のポリペプチドと；第１のＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の第２の部分である第２のポリペプチドと；第１のＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質に対して異種である異種ポリペプチドとを含む操作されたタンパク質に関し、異種ポリペプチドは、第１のポリペプチドと第２のポリペプチドとの間にあり、異種ポリペプチドは、第１のＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質のドメイン間リンカー領域に対応する位置において、操作されたタンパク質内に配置されている。

本発明の追加の態様は、配列番号２～１７または１２５～１３２のいずれか１つに対して少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、またはそれを超える配列同一性を有するアミノ酸配列を含む操作されたタンパク質に関し、場合によっては、操作されたタンパク質は、配列番号２～１７または１２５～１３２のいずれか１つのアミノ酸配列を含む。

本発明の更なる態様は、本明細書中に記載される操作されたタンパク質；ガイド核酸（例えばガイドＲＮＡ）、および場合によってはデアミナーゼを含む組成物（例えば塩基編集組成物）または系に関し、場合によっては、操作されたタンパク質、ガイド核酸、および場合によってはデアミナーゼは、複合体を形成するか、または複合体内に含まれる。

本発明の別の態様は、本明細書中に記載される操作されたタンパク質；ガイド核酸（例えばガイドＲＮＡ）；および場合によってはデアミナーゼを含む複合体に関する。

本発明の追加の態様は、本明細書中に記載される操作されたタンパク質をコードするヌクレオチド配列を含む核酸分子に関する。

本発明の別の態様は、標的核酸を修飾する方法に関し、当該方法は、標的核酸を、本明細書中に記載される操作されたタンパク質、およびガイド核酸（例えばガイドＲＮＡ）と接触させることによって、標的核酸を修飾することを含み、場合によっては、操作されたタンパク質およびガイド核酸は、複合体を形成するか、または複合体内に含まれる。

本発明の更なる態様は、標的核酸を修飾する効率を上昇させる方法に関し、当該方法は、標的核酸を、本明細書中に記載される操作されたタンパク質、およびガイド核酸（例えばガイドＲＮＡ）と接触させることによって、標的核酸を修飾することを含み、場合によっては、操作されたタンパク質およびガイド核酸は、複合体を形成するか、複合体内に含まれる。

本発明はさらに、本発明の核酸構築体を含む発現カセットおよび／またはベクター、ならびに本発明のポリペプチド、融合タンパク質、および／または核酸構築体を含む細胞を提供する。加えて、本発明は、本発明の核酸構築体、ならびに同上を含む発現カセット、ベクター、および／または細胞を含むキットを提供する。

なお、一実施形態に関して記載される本発明の態様は、異なる実施形態に関して具体的に記載されていなくても、この中に組み込まれ得る。すなわち、全ての実施形態、および／またはあらゆる実施形態の特徴は、いかなる形および／または組合せであれ、組み合わせることができる。出願人は、最初に提出したあらゆる特許請求の範囲を変え、かつ／またはそれに応じて新しいあらゆる特許請求の範囲を提出する権利を保有しており、権利として、最初にその様式で特許請求されていないが、他のあらゆる特許請求の範囲のあらゆる特徴に従属し、かつ／またはこれを組み込むように、最初に提出したあらゆる特許請求の範囲を補正することができることが挙げられる。本発明のこれらの、そして他の目的および／または態様を、以下に示す明細書中で詳細に説明する。本発明の更なる特徴、利点、および詳細は、以下に続く好ましい実施形態の図および詳細な説明を読めば、当業者によって認識されるであろう。そのような説明は、本発明の単なる実例である。

ＩＩ型ＣＲＩＳＰＲエンドヌクレアーゼについての作用の機構を示す図である。Ｖ型ＣＲＩＳＰＲエンドヌクレアーゼについての作用の機構を示す図である。単一のガイドＲＮＡ（ｓｇＲＮＡ）に結合したＳｐＣａｓ９（ＰＤＢＩＤ４ＵＮ３）および標的ＤＮＡの結晶構造である。示されるドメインは、ＲｕｖＣ、架橋ヘリックス、Ｒｅｃ１、Ｒｅｃ２、ＨＮＨ、およびＰＡＭ相互作用である。Ｒｅｃローブに向かって見られるＣａｓ１２ａドメインのダイアグラムである。この図から、ｃｒＲＮＡ／標的ＤＮＡデュプレックスの部分が、Ｃａｓ１２ａの表面にありありと曝される。ＬｂＣａｓ１２ａ内の候補挿入部位上へのＳｐＣａｓ９由来のＨＮＨドメインのオーバレイである。ＨＮＨ－３２８７、３２８８、３２８９、３２９０、３２９６、３２９７、３２９８、および３２９９を発現する可溶性の画分溶解大腸菌（Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ）を示す図である。精製されたＨＮＨ－３２８７、３２８８、３２８９、３２９０、３２９６、３２９７、および３２９８のニッキング活性を示す図である。本発明の一部の実施形態に従うニッカーゼが、大腸菌内で可溶的に発現されたことを示すゲルの画像である。本発明の一部の実施形態に従うニッカーゼが、ＤＮＡ基質にニックを入れることができることを示すゲルの画像である。本発明の一部の実施形態に従うニッカーゼが、ＲＮＡ依存性であり得ることを示すゲルの画像である。本発明の一部の実施形態に従うニッカーゼが、ＤＮＡニッカーゼとしての機能を果たすことができることを示すゲルの画像である。標識された標的鎖を示す図である。標識された非標的鎖を示す図である。標識された標的鎖とインキュベートされた試料を含むゲルの画像である。標識された非標的鎖とインキュベートされた試料を含むゲルの画像である。図１４および図１５のレーンを、対照のレーンと共に示すゲル全体の画像である。本発明の一部の実施形態に従う各酵素対についての編集効率を示す図であるＦＡＮＣＦスペーサー１に対応する種々の標的領域についてのＣからＴ編集のパーセンテージを示すグラフである。ＦＡＮＣＦスペーサー２に対応する種々の標的領域についてのＣからＴ編集のパーセンテージを示すグラフである。ＡＡＶＳ１スペーサー１に対応する種々の標的領域についてのＣからＴ編集のパーセンテージを示すグラフである。ＡＡＶＳ１スペーサー２に対応する種々の標的領域についてのＣからＴ編集のパーセンテージを示すグラフである。ＲＮＦ２スペーサー１に対応する種々の標的領域についてのＡからＧ編集のパーセンテージを示すグラフである。ＲＮＦ２スペーサー２に対応する種々の標的領域についてのＡからＧ編集のパーセンテージを示すグラフである。

次に本発明を、本発明の実施形態を示す添付の図面および実施例を参照して、以降で説明する。この説明は、本発明が実行され得る様々な全ての方法の詳細なカタログであることも、本発明に加えられ得る全ての特徴であることも意図されない。例えば、一実施形態に関して具体的に説明される特徴が、他の実施形態に組み込まれてもよく、そして特定の実施形態に関して具体的に説明される特徴が、その実施形態から消されてもよい。ゆえに、本発明は、本発明の一部の実施形態において、本明細書中で示されるあらゆる特徴または特徴の組合せを、除外することも省略することもできることを意図する。また、本明細書中で示唆される種々の実施形態に対する、本発明から逸脱しない多数の変形および追加が、本開示を考慮して、当業者に明らかとなろう。それゆえに、以下の説明は、本発明の一部の特定の実施形態を示すことが意図されており、それらの全ての再配列、組合せ、および変形を網羅的に指定することは意図されない。

別段定義されない限り、本明細書中で用いられる全ての技術用語および科学用語は、本発明が属する技術の当業者によって一般的に理解されるのと同じ意味を有する。本明細書中で本発明の説明に用いられる専門用語は、特定の実施形態のみを説明する目的のものであり、本発明の限定であることは意図されない。

本明細書中で引用される全ての刊行物、特許出願、特許、および他の参照は、参照が示されるセンテンスおよび／または段落に関連する教示について、それらの全体が参照によって組み込まれる。

文脈が別途指示しない限り、本明細書中に記載される本発明の種々の特徴を、あらゆる組合せで用いることができることが具体的に意図される。さらに、本発明はまた、本発明の一部の実施形態において、本明細書中で示されるあらゆる特徴または特徴の組合せを除外することも省略することもできることを意図する。説明のために、組成が、構成要素Ａ、Ｂ、およびＣを含むと明細書が述べているならば、Ａ、Ｂ、もしくはＣのいずれか、またはそれらの組合せを単独で、またはあらゆる組合せで省略かつ放棄することができることが具体的に意図される。

本発明および添付の特許請求の範囲の記載に用いられている単数形「ａ」、「ａｎ」、および「ｔｈｅ」は、文脈が別途明らかに指示しない限り、複数形を同様に含むことが意図される。

また、本明細書中で用いられる「および／または」は、関連する記載された項目の１つまたは複数の考えられるあらゆる全ての組合せ、および択一的に解釈される場合（「または」）の組合せの欠如を指し、かつ包含する。

測定可能な値、例えば量または濃度等に言及する場合に本明細書中で用いられる用語「約」は、指定された値の±１０％、±５％、±１％、±０．５％、または±０．１％の変動、ならびに指定された値を包含することを意図する。例えば、Ｘが測定可能な値である場合の「約Ｘ」は、Ｘ、ならびにＸの±１０％、±５％、±１％、±０．５％、または±０．１％の変動を含むことを意図する。測定可能な値について本明細書中で提供される範囲は、他のあらゆる範囲および／またはその中の個々の値を含み得る。

本明細書中で用いられる「ＸとＹとの間」および「約ＸとＹとの間」等のフレーズは、ＸおよびＹを含むと解釈されるべきである。本明細書中で用いられる「約ＸとＹとの間」等のフレーズは、「約Ｘと約Ｙとの間」を意味し、そして「約ＸからＹ」等のフレーズは、「約Ｘから約Ｙ」を意味する。

本明細書中の値の範囲の詳述は、本明細書中で示されない限り、単に、当該範囲内にある別個の各値に個々に言及する速記の方法の役目を果たすことが意図されており、そして別個の各値は、あたかも本明細書中で個々に列挙されているかの如く、本明細書に組み込まれる。例えば、範囲１０～１５が開示されていれば、１１、１２、１３、および１４もまた開示されている。

本明細書中で用いられる用語「含む（「ｃｏｍｐｒｉｓｅ」、「ｃｏｍｐｒｉｓｅｓ」、および「ｃｏｍｐｒｉｓｉｎｇ」）」は、明示される特徴、整数、工程、操作、要素、および／または構成要素の存在を指定するが、１つまたは複数の他の特徴、整数、工程、操作、要素、構成要素、および／またはそれらの群の存在または追加を排除しない。

本明細書中で用いられる移行句「から本質的になる」は、特許請求の範囲が、特許請求の範囲に列挙される指定された材料または工程、および特許請求される本発明の基本的かつ新規の特徴に物質的に影響を与えないものを包含すると解釈されるべきであることを意味する。ゆえに、本発明の特許請求の範囲で用いられる場合の用語「から本質的になる」は、「含む」に等しいと解釈されることは意図されない。

本明細書中で用いられる用語「増大させる」、「増大させること」、「増強させる」、「増強させること」、「向上させる」、および「向上させること」（およびその文法上の変形）は、例えば別の測定可能な特性または量（例えば対照値）と比較して、少なくとも約５％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、１００％、１５０％、２００％、３００％、４００％、５００％またはそれを超える上昇を説明する。

本明細書中で用いられる用語「引き下げる」、「引き下げられた」、「引き下げること」、「引下げ」、「減少させる」、および「低下させる」（およびその文法上の変形）は、例えば別の測定可能な特性または量（例えば対照値）と比較して、少なくとも約５％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９７％、９８％、９９％、または１００％の低下を説明する。一部の実施形態において、引下げは、検出可能な活性または量をもたらし得ないか、または本質的にもたらし得ない（すなわち、有意でない量、例えば、約１０％または５％未満）。

「異種ヌクレオチド配列」または「組換えヌクレオチド配列」は、これが導入される宿主細胞と天然に関連しないヌクレオチド配列であり、天然に存在するヌクレオチド配列の天然に存在しない複数のコピーが挙げられる。

「固有」または「野生型」の核酸、ヌクレオチド配列、ポリペプチド、またはアミノ酸配列は、天然に存在するか、または内因性の核酸、ヌクレオチド配列、ポリペプチド、またはアミノ酸配列を指す。ゆえに、例えば、「野生型ｍＲＮＡ」は、参照生物内に天然に存在するか、または参照生物に内因性のｍＲＮＡである。「相同」核酸配列は、これが導入される宿主細胞と天然に関連するヌクレオチド配列である。

本明細書中で用いられる用語「核酸」、「核酸分子」、「ヌクレオチド配列」、および「ポリヌクレオチド」は、直鎖状であるか、もしくは分岐している、一本鎖もしくは二本鎖、またはそれらのハイブリッドであるＲＮＡまたはＤＮＡを指す。また、当該用語は、ＲＮＡ／ＤＮＡハイブリッドを包含する。また、ｄｓＲＮＡが合成的に生成される場合、あまり一般的でない塩基、例えばイノシン、５－メチルシトシン、６－メチルアデニン、ヒポキサンチンその他を、アンチセンス、ｄｓＲＮＡ、およびリボザイム対形成に用いることができる。例えば、ウリジンおよびシチジンのＣ－５プロピン類似体を含有するポリヌクレオチドは、高い親和性でＲＮＡに結合すること、そして遺伝子発現の強力なアンチセンスインヒビターであることが示されている。また、他の修飾、例えば、ホスホジエステル骨格、またはＲＮＡのリボース糖基内の２’－ヒドロキシへの修飾をすることができる。

本明細書中で用いられる用語「ヌクレオチド配列」は、核酸分子の５’末端から３’末端までの、ヌクレオチドのヘテロポリマーまたはヌクレオチドの配列を指し、ｃＤＮＡ、ＤＮＡ断片または部分、ゲノムＤＮＡ、合成（例えば、化学的に合成された）ＤＮＡ、プラスミドＤＮＡ、ｍＲＮＡ、およびアンチセンスＲＮＡ（いずれも一本鎖または二本鎖であり得る）が挙げられる、ＤＮＡ分子またはＲＮＡ分子が挙げられる。また、用語「ヌクレオチド配列」、「核酸」、「核酸分子」、「核酸構築体」、「組換え核酸」、「オリゴヌクレオチド」、および「ポリヌクレオチド」は、ヌクレオチドのヘテロポリマーを指すのに本明細書中で互換的に用いられる。本明細書中で提供される核酸分子および／またはヌクレオチド配列が、本明細書中で左から右に５’から３’の向きに示されており、そして米国配列規則、３７ＣＦＲ§§１．８２１－１．８２５、および世界知的所有権機関（ＷＩＰＯ）基準ＳＴ．２５に示されるヌクレオチド文字を示すための標準コードを用いて表される。本明細書中で用いられる「５’領域」は、ポリヌクレオチドの５’末端に最も近いポリヌクレオチドの領域を意味し得る。ゆえに、例えば、ポリヌクレオチドの５’領域内の要素を、ポリヌクレオチドの５’末端に位置決めされた第１のヌクレオチドから、ポリヌクレオチドの途中に位置決めされたヌクレオチドまでのどこでも位置決めすることができる。本明細書中で用いられる「３’領域」は、ポリヌクレオチドの３’末端に最も近いポリヌクレオチドの領域を意味し得る。ゆえに、例えば、ポリヌクレオチドの３’領域内の要素を、ポリヌクレオチドの３’末端に位置決めされた第１のヌクレオチドから、ポリヌクレオチドの途中に位置決めされたヌクレオチドまでのどこでも位置決めすることができる。

本明細書中で用いられる用語「遺伝子」は、ｍＲＮＡ、アンチセンスＲＮＡ、ｍｉＲＮＡ、および抗マイクロＲＮＡアンチセンスオリゴデオキシリボヌクレオチド（ＡＭＯ）等を生成するのに用いることができる核酸分子を指す。遺伝子は、機能タンパク質または遺伝子産物を生成するのに用いることができる場合もあるし、できない場合もある。遺伝子は、コード領域および非コード領域（例えば、イントロン、調節要素、プロモーター、エンハンサー、終結配列、ならびに／または５’および３’非翻訳領域）の双方を含むことができる。

ポリヌクレオチド、遺伝子、またはポリペプチドは、「単離」されていてもよく、これは、天然の状態で核酸またはポリペプチドと関連して通常見出される構成要素から実質的に、または本質的に遊離している核酸またはポリペプチドをそれぞれ意味する。一部の実施形態において、そのような構成要素として、他の細胞物質、組換え生成由来の培地、および／または核酸もしくはポリペプチドを化学的に合成するのに用いられる種々の化学物質が挙げられる。

用語「変異」は、点変異（例えば、ミスセンス、またはナンセンス、またはフレームシフトをもたらす単一の塩基対の挿入もしくは欠失）、挿入、欠失、および／またはトランケーションを指す。変異が、アミノ酸配列内の残基の、別の残基による置換、または配列内の１つもしくは複数の残基の欠失もしくは挿入である場合、変異は、典型的に、元の残基に続く配列内の残基の位置を同定することによって、そして新たに置換された残基を同定することによって説明される。

本明細書中で用いられる用語「相補的な」または「相補性」は、許容可能な塩および温度条件の下での塩基対合によるポリヌクレオチドの天然の結合を指す。例えば、配列「Ａ－Ｇ－Ｔ」（５’から３’）は、相補的な配列「Ｔ－Ｃ－Ａ」（３’から５’）に結合する。２つの一本鎖分子間の相補性は、ヌクレオチドの一部のみが結合する「部分的」であってもよいし、一本鎖分子間に総相補性が存在する場合、完全であってもよい。核酸鎖間の相補性の程度は、核酸鎖間のハイブリダイゼーションの効率および強度に対して大きな影響を有する。

本明細書中で用いられる「相補体」は、コンパレータヌクレオチド配列との１００％の相補性を意味し得るし、１００％未満の相補性（例えば、「実質的には相補的な」、例えば、約70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%,等の相補性）をも意味し得る。

ヌクレオチド配列またはポリペプチドの「部分」または「断片」（ドメインを含む）は、参照ヌクレオチド配列またはポリペプチドとそれぞれ比較して、長さが引き下げられ（例えば、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０個、またはそれを超える残基（例えば、ヌクレオチドまたはペプチド）だけ引き下げられ）、かつ参照ヌクレオチド配列またはポリペプチドとそれぞれ同一であるかまたはほぼ同一の（例えば、70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%同一の）連続した残基のヌクレオチド配列またはポリペプチドを含む、これから本質的になる、かつ／またはこれからなるヌクレオチド配列またはポリペプチドを意味することが理解される。本発明に従うそのような核酸断片または部分は、適切な場合には、これが構成成分となるより大きなポリヌクレオチド内に含まれてもよい。一例として、本発明のガイド核酸の反復配列は、野生型ＣＲＩＳＰＲ－Ｃａｓ反復配列の一部（例えば、野生型Ｖ型ＣＲＩＳＰＲ－Ｃａｓ反復、例えば、Ｃａｓ１２ａ（Ｃｐｆ１）、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ（Ｃ２ｃ３）、Ｃａｓ１２ｄ（ＣａｓＹ）、Ｃａｓ１２ｅ（ＣａｓＸ）、Ｃａｓ１２ｇ、Ｃａｓ１２ｈ、Ｃａｓ１２ｉ、Ｃ２ｃ１、Ｃ２ｃ４、Ｃ２ｃ５、Ｃ２ｃ８、Ｃ２ｃ９、Ｃ２ｃ１０、Ｃａｓ１４ａ、Ｃａｓ１４ｂ，および／またはＣａｓ１４ｃ等が挙げられるがこれらに限定されないＣＲＩＳＰＲＣａｓ系由来の反復）を含んでもよい。

相同性を有する異なる核酸またはタンパク質は、本明細書中で「相同体」と称する。用語相同体は、同じ種および他の種由来の相同配列、ならびに同じ種および他の種由来のオーソログ配列を含む。「相同性」は、位置同一性（すなわち、配列類似性または同一性）のパーセントに換算した、２つ以上の核酸および／またはアミノ酸配列間の類似性のレベルを指す。また、相同性は、異なる核酸またはタンパク質間の類似した機能特性の概念を指す。ゆえに、本発明の組成物および方法はさらに、本発明のヌクレオチド配列およびポリペプチドに対する相同体を含む。本明細書中で用いられる「オーソログ」および「オルソログ」は、種形成の間に共通祖先遺伝子から生じた異なる種における相同ヌクレオチド配列および／またはアミノ酸配列を指す。本発明のヌクレオチド配列の相同体またはオルソログは、本発明の前記ヌクレオチド配列に対して実質的な配列同一性（例えば、少なくとも約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、９９．５％または１００％）を有する。

本明細書中で用いられる「配列同一性」は、２つの最適にアラインされたポリヌクレオチドまたはポリペプチド配列が、構成要素、例えば、ヌクレオチドまたはアミノ酸のアラインメントのウィンドウの全体を通して不変である程度を指す。「同一性」は、ＣｏｍｐｕｔａｔｉｏｎａｌＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ（Ｌｅｓｋ，Ａ．Ｍ．，ｅｄ．）ＯｘｆｏｒｄＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ，ＮｅｗＹｏｒｋ（１９８８）；Ｂｉｏｃｏｍｐｕｔｉｎｇ：ＩｎｆｏｒｍａｔｉｃｓａｎｄＧｅｎｏｍｅＰｒｏｊｅｃｔｓ（Ｓｍｉｔｈ，Ｄ．Ｗ．，ｅｄ．）ＡｃａｄｅｍｉｃＰｒｅｓｓ，ＮｅｗＹｏｒｋ（１９９３）；ＣｏｍｐｕｔｅｒＡｎａｌｙｓｉｓｏｆＳｅｑｕｅｎｃｅＤａｔａ，ＰａｒｔＩ（Ｇｒｉｆｆｉｎ，Ａ．Ｍ．，ａｎｄＧｒｉｆｆｉｎ，Ｈ．Ｇ．，ｅｄｓ．）ＨｕｍａｎａＰｒｅｓｓ，ＮｅｗＪｅｒｓｅｙ（１９９４）；ＳｅｑｕｅｎｃｅＡｎａｌｙｓｉｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ（ｖｏｎＨｅｉｎｊｅ，Ｇ．，ｅｄ．）ＡｃａｄｅｍｉｃＰｒｅｓｓ（１９８７）；およびＳｅｑｕｅｎｃｅＡｎａｌｙｓｉｓＰｒｉｍｅｒ（Ｇｒｉｂｓｋｏｖ，Ｍ．ａｎｄＤｅｖｅｒｅｕｘ，Ｊ．，ｅｄｓ．）ＳｔｏｃｋｔｏｎＰｒｅｓｓ，ＮｅｗＹｏｒｋ（１９９１）に記載されるものが挙げられるがこれらに限定されない知られている方法によって容易に算出することができる。

本明細書中で用いられる用語「配列同一性パーセント」または「同一性パーセント」は、試験（「対象」）ポリヌクレオチド分子（またはその相補鎖）と比較した、参照（「クエリ」）ポリヌクレオチド分子（またはその相補鎖）の直鎖状ポリヌクレオチド配列内の、２つの配列が最適にアラインされた場合の同一のヌクレオチドのパーセンテージを指す。一部の実施形態において、「同一性パーセント」は、参照ポリペプチドと比較したアミノ酸配列内の同一のアミノ酸のパーセンテージを指し得る。

本明細書中で用いられるフレーズ、２つの核酸分子、ヌクレオチド配列、またはタンパク質配列の文脈における「実質的に同一の」または「実質的同一性」は、以下の配列比較アルゴリズムの１つを用いて、または目視検査によって測定して、最大対応について比較かつアラインした場合のヌクレオチドまたはアミノ酸残基同一性が、少なくとも約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、９９．５％または１００％である２つ以上の配列またはサブ配列を指す。本発明の一部の実施形態において、実質的同一性は、約１０ヌクレオチド～約２０ヌクレオチド、約１０ヌクレオチド～約２５ヌクレオチド、約１０ヌクレオチド～約３０ヌクレオチド、約１５ヌクレオチド～約２５ヌクレオチド、約３０ヌクレオチド～約４０ヌクレオチド、約５０ヌクレオチド～約６０ヌクレオチド、約７０ヌクレオチド～約８０ヌクレオチド、約９０ヌクレオチド～約１００ヌクレオチド、またはそれを超えるヌクレオチド長、およびそれらにおけるあらゆる範囲、最大で配列の完全長である本発明のヌクレオチド配列の連続ヌクレオチドの領域にわたって存在する。一部の実施形態において、ヌクレオチド配列は、少なくとも約２０ヌクレオチド（例えば、約２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０ヌクレオチド）にわたって、実質的に同一であり得る。一部の実施形態において、実質的に同一のヌクレオチドまたはタンパク質配列は、これが実質的に同一であるヌクレオチド（またはコードされたタンパク質配列）と実質的に同じ機能を実行する。

配列比較について、典型的に１つの配列が、試験配列が比較される参照配列として機能する。配列比較アルゴリズムを用いる場合、試験配列および参照配列がコンピュータに入力され、必要であれば、サブ配列座標が指定され、配列アルゴリズムプログラムパラメータが指定される。続いて、配列比較アルゴリズムは、指定されたプログラムパラメータに基づいて、参照配列と比較した試験配列についての配列同一性パーセントを算出する。

比較ウィンドウをアラインするための配列の最適なアラインメントが、当業者に周知であり、ツール、例えばＳｍｉｔｈａｎｄＷａｔｅｒｍａｎのローカル相同性アルゴリズム、ＮｅｅｄｌｅｍａｎａｎｄＷｕｎｓｃｈの相同性アラインメントアルゴリズム、ＰｅａｒｓｏｎａｎｄＬｉｐｍａｎの類似性の検索方法によって、そして場合によってはこれらのアルゴリズムのコンピュータによる実施、例えばＧＣＧ（登録商標）ＷｉｓｃｏｎｓｉｎＰａｃｋａｇｅ（登録商標）（ＡｃｃｅｌｒｙｓＩｎｃ．，ＳａｎＤｉｅｇｏ，ＣＡ）の一部として利用可能なＧＡＰ、ＢＥＳＴＦＩＴ、ＦＡＳＴＡ、およびＴＦＡＳＴＡによって行われてもよい。試験配列および参照配列のアラインされたセグメントについての「同一性分率」は、参照配列セグメント、例えば、参照配列全体、または参照配列の定義したより小さな部分内の構成要素の総数で割った、２つのアラインされた配列によって共有される同一の構成要素の数である。配列同一性パーセントは、１００を乗算した同一性分率として表される。１つまたは複数のポリヌクレオチド配列の比較は、全長ポリヌクレオチド配列もしくはその一部、またはより長いポリヌクレオチド配列に対してであってもよい。また、本発明の目的上、「同一性パーセント」は、翻訳されたヌクレオチド配列についてＢＬＡＳＴＸバージョン２．０、そしてポリヌクレオチド配列についてＢＬＡＳＴＮバージョン２．０を用いて求められてもよい。

また、２つのヌクレオチド配列は、２つの配列がストリンジェント条件の下で互いにハイブリダイズする場合、実質的に相補的であると考えてもよい。代表的な一部の実施形態において、実質的に相補的であると考えられる２つのヌクレオチド配列は、高度にストリンジェントな条件の下で、互いにハイブリダイズする。

サザンハイブリダイゼーションおよびノーザンハイブリダイゼーション等の核酸ハイブリダイゼーション実験の文脈における「ストリンジェントハイブリダイゼーション条件」および「ストリンジェントハイブリダイゼーション洗浄条件」は、配列依存的であり、様々な環境パラメータの下で異なる。核酸のハイブリダイゼーションの広範囲にわたるガイドが、ＴｉｊｓｓｅｎＬａｂｏｒａｔｏｒｙＴｅｃｈｎｉｑｕｅｓｉｎＢｉｏｃｈｅｍｉｓｔｒｙａｎｄＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ－ＨｙｂｒｉｄｉｚａｔｉｏｎｗｉｔｈＮｕｃｌｅｉｃＡｃｉｄＰｒｏｂｅｓｐａｒｔＩｃｈａｐｔｅｒ２“Ｏｖｅｒｖｉｅｗｏｆｐｒｉｎｃｉｐｌｅｓｏｆｈｙｂｒｉｄｉｚａｔｉｏｎａｎｄｔｈｅｓｔｒａｔｅｇｙｏｆｎｕｃｌｅｉｃａｃｉｄｐｒｏｂｅａｓｓａｙｓ”Ｅｌｓｅｖｉｅｒ，ＮｅｗＹｏｒｋ（１９９３）において見出される。通常、高度にストリンジェントなハイブリダイゼーション条件および洗浄条件は、定義したイオン強度およびｐＨでの特定の配列についての熱融点（Ｔ_ｍ）よりも約５℃低くなるように選択される。

Ｔ_ｍは、標的配列の５０％が、完全にマッチするプローブにハイブリダイズする（定義したイオン強度およびｐＨ下での）温度である。特定のプローブについてのＴ_ｍと等しくなるように、非常にストリンジェントな条件が選択される。サザンブロットまたはノーザンブロットにおいてフィルター上に１００を超える相補的な残基を有する相補的なヌクレオチド配列のハイブリダイゼーション用のストリンジェントハイブリダイゼーション条件の例として、ハイブリダイゼーションが一晩実行される、４２℃での１ｍｇヘパリン入り５０％ホルムアミドがある。高度にストリンジェントな洗浄条件の例として、７２℃にて約１５分間の０．１５ＭＮａＣｌがある。ストリンジェント洗浄条件の例として、６５℃にて１５分間の０．２×ＳＳＣ洗浄がある（ＳＳＣバッファの解説について、以下のＳａｍｂｒｏｏｋ参照）。多くの場合、高ストリンジェンシー洗浄が、バックグラウンドプローブシグナルを取り除くために、低ストリンジェンシー洗浄の後にある。例えば１００を超えるヌクレオチドのデュプレックスについての中程度のストリンジェンシー洗浄の例として、４５℃にて１５分間の１×ＳＳＣがある。例えば１００を超えるヌクレオチドのデュプレックスについての低ストリンジェンシー洗浄の例として、４０℃にて１５分間の４～６×ＳＳＣがある。短いプローブ（例えば約１０～５０ヌクレオチド）について、ストリンジェント条件は、典型的に、約１．０ＭＮａイオン未満の塩濃度、典型的にはｐＨ７．０～８．３にて約０．０１～１．０ＭＮａイオン濃度（または他の塩）を包含し、温度は、典型的に、少なくとも約３０℃である。また、ストリンジェント条件は、ホルムアミド等の不安定化剤を添加することで達成することができる。一般に、特定のハイブリダイゼーションアッセイにおいて無関係なプローブについて観察されるよりも２×（またはより高い）のシグナル対ノイズ比が、特異的ハイブリダイゼーションの検出を示す。ストリンジェント条件下で互いにハイブリダイズしないヌクレオチド配列は、コードするタンパク質が実質的に同一であるならば、やはり実質的に同一である。これは、例えば、ヌクレオチド配列のコピーが、遺伝コードによって容認される最大コドン縮重を用いて生じる場合に、起こり得る。

本発明のポリヌクレオチドおよび／または組換え核酸構築体は、発現のためにコドン最適化され得る。一部の実施形態において、本発明のポリヌクレオチド、核酸構築体、発現カセット、および／またはベクター（例えば、操作されたタンパク質、核酸結合ドメイン（例えば、ＤＮＡ結合ドメイン、例えば、ポリヌクレオチドガイドエンドヌクレアーゼ、ジンクフィンガーヌクレアーゼ、転写アクティベータ様エフェクターヌクレアーゼ（ＴＡＬＥＮ）、アルゴノートタンパク質、および／またはＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質由来の配列特異的ＤＮＡ結合ドメイン）、ガイド核酸、シトシンデアミナーゼ、および／またはアデニンデアミナーゼを含む／コードする）が、生物（例えば、動物、植物、真菌、古細菌、または細菌）内での発現のためにコドン最適化されていてもよい。一部の実施形態において、本発明のコドン最適化核酸構築体、ポリヌクレオチド、発現カセット、および／またはベクターは、コドン最適化されていない参照核酸構築体、ポリヌクレオチド、発現カセット、および／またはベクターに対して約７０％～約９９．９％（またはそれを超える）（例えば、７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、９９．５％、９９．９％または１００％）の同一性を有する。

本明細書中に記載される実施形態のいずれにおいても、本発明のポリヌクレオチドまたは核酸構築体は、生物またはその細胞（例えば、植物および／または植物の細胞）内での発現用の種々のプロモーターおよび／または他の調節要素と作動可能に関連し得る。ゆえに、一部の実施形態において、本発明のポリヌクレオチドまたは核酸構築体はさらに、１つまたは複数のヌクレオチド配列に作動可能に連結した１つまたは複数のプロモーター、イントロン、エンハンサー、および／またはターミネーターを含んでもよい。一部の実施形態において、プロモーターは、イントロンと作動可能に関連し得る（例えば、Ｕｂｉ１プロモーターおよびイントロン）。一部の実施形態において、イントロンと関連するプロモーターは、「プロモーター領域」と称され得る（例えば、Ｕｂｉ１プロモーターおよびイントロン）。

ポリヌクレオチドに関して本明細書中で用いられる「作動可能に連結した」または「作動可能に関連した」は、示される要素が、互いに機能的に関連しており、かつ通常物理的にも関連していることを意味する。ゆえに、本明細書中で用いられる用語「作動可能に連結した」または「作動可能に関連した」は、機能的に関連する単一の核酸分子上のヌクレオチド配列を指す。ゆえに、第２のヌクレオチド配列に作動可能に連結した第１のヌクレオチド配列は、第１のヌクレオチド配列が第２のヌクレオチド配列と機能的に関係して配置されている状況を意味する。例えば、プロモーターは、プロモーターがヌクレオチド配列の転写または発現をもたらすならば、前記ヌクレオチド配列と作動可能に関連している。当業者であれば、制御配列（例えばプロモーター）は、作動可能に関連するヌクレオチド配列に、制御配列がその発現を導くように機能する限り、連続している必要はないことを理解するであろう。ゆえに、例えば、転写はされるが翻訳されない介在核酸配列が、プロモーターとヌクレオチド配列との間に存在することができ、そしてプロモーターは依然として、ヌクレオチド配列に「作動可能に連結している」と考えることができる。

本明細書中で用いられる用語、ポリペプチドに関して「連結した」または「融合した」は、一方のポリペプチドの、もう１つへの付着を指す。ポリペプチドは、別のポリペプチドに（Ｎ末端またはＣ末端にて）直接（例えば、ペプチド結合を介して）連結または融合されても、リンカー（例えばペプチドリンカー）を介して連結または融合されてもよい。

ポリペプチドに関する用語「リンカー」は、当該技術において認識されており、２つの分子または部分、例えば、融合タンパク質、例えばＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質ならびに注目するペプチドタグおよび／またはポリペプチドの２つのドメインを連結する化学基または分子を指す。リンカーは、単一の連結分子（例えば単一のアミノ酸）で構成されていてもよいし、複数の連結分子を含んでもよい。一部の実施形態において、リンカーは、有機分子、基、ポリマー、または化学部分、例えば二価有機部分であり得る。一部の実施形態において、リンカーは、アミノ酸であってもよいし、ペプチドであってもよい。一部の実施形態において、リンカーはペプチドである。

一部の実施形態において、本発明に有用なペプチドリンカーは、約２～約１００、またはそれを超えるアミノ酸長、例えば、約２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７７、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００またはそれを超えるアミノ酸長（例えば、約２～約４０、約２～約５０、約２～約６０、約４～約４０、約４～約５０、約４～約６０、約５～約４０、約５～約５０、約５～約６０、約９～約４０、約９～約５０、約９～約６０、約１０～約４０、約１０～約５０、約１０～約６０、または約２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５アミノ酸～約２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７７、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００またはそれを超えるアミノ酸長（例えば、約１０５、１１０、１１５、１２０、１３０、１４０、１５０、またはそれを超えるアミノ酸長））であり得る。一部の実施形態において、ペプチドリンカーは、ＧＳリンカーであってもよい。一部の実施形態において、ペプチドリンカーは、配列番号１８～４７のアミノ酸配列の１つを有する。一部の実施形態において、ペプチドリンカーは、(GGS)_n、GS、SG、GSSG（配列番号１７５）、S(GGS)_n（配列番号４２）、SGGS（配列番号４３）、または(GGGGS)n（配列番号４４）、のアミノ酸配列を含んでもよく、式中、ｎは、１～２０の整数（例えば、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、または２０）である。一部の実施形態において、ペプチドリンカーは、アミノ酸配列：SGGSGGSGGS（配列番号４５）を含んでもよい。一部の実施形態において、ペプチドリンカーは、アミノ酸配列：SGSETPGTSESATPES（配列番号４６）を含んでもよく、ＸＴＥＮリンカーとも称される。一部の実施形態において、ペプチドリンカーは、アミノ酸配列：SGGSSGGSSGSETPGTSESATPESSGGSSGGS（配列番号４７）を含んでもよく、ＧＳ－ＸＴＥＮ－ＧＳリンカーとも称される。

ポリヌクレオチドに関して本明細書中で用いられる用語「連結した」または「融合した」は、一方のポリヌクレオチドの、もう１つのポリヌクレオチドへの付着を指す。一部の実施形態において、２つ以上のポリヌクレオチド分子が、有機分子、基、ポリマー、または化学部分、例えば二価有機部分であり得るリンカーによって連結されていてよい。ポリヌクレオチドは、例えばワトソン－クリック型の塩基対合が挙げられる共有結合もしくは非共有結合を介して、または１つもしくは複数の連結ヌクレオチドを介して、別のポリヌクレオチドに（５’末端または３’末端にて）連結または融合されていてよい。一部の実施形態において、特定の構造のポリヌクレオチドモチーフは、別のポリヌクレオチド配列（例えば、ガイドＲＮＡ内のヘアピン構造の伸長部）内に挿入されていてよい。一部の実施形態において、連結ヌクレオチドは、天然に存在するヌクレオチドであってよい。一部の実施形態において、連結ヌクレオチドは、天然に存在しないヌクレオチドであってよい。

「プロモーター」は、プロモーターと作動可能に関連するヌクレオチド配列（例えばコード配列）の転写を制御または調節するヌクレオチド配列である。プロモーターによって制御または調節されるコード配列は、ポリペプチドおよび／または機能ＲＮＡをコードし得る。典型的には、「プロモーター」は、ＲＮＡポリメラーゼＩＩの結合部位を含有し、かつ転写の開始を指示するヌクレオチド配列を指す。一般に、プロモーターは、対応するコード配列のコード領域の開始点に対して、５’側、または上流側に見出される。プロモーターは、遺伝子発現の調節因子の働きをする他の要素；例えばプロモーター領域を含んでもよい。これは、ＴＡＴＡボックスコンセンサス配列および多くの場合ＣＡＡＴボックスコンセンサス配列を含む（ＢｒｅａｔｈｎａｃｈａｎｄＣｈａｍｂｏｎ，（１９８１）Ａｎｎｕ．Ｒｅｖ．Ｂｉｏｃｈｅｍ．５０：３４９）。植物では、ＣＡＡＴボックスは、ＡＧＧＡボックスによって置換されている場合がある（Ｍｅｓｓｉｎｇｅｔａｌ．，（１９８３）ｉｎＧｅｎｅｔｉｃＥｎｇｉｎｅｅｒｉｎｇｏｆＰｌａｎｔｓ，Ｔ．Ｋｏｓｕｇｅ，Ｃ．ＭｅｒｅｄｉｔｈａｎｄＡ．Ｈｏｌｌａｅｎｄｅｒ（ｅｄｓ．），ＰｌｅｎｕｍＰｒｅｓｓ，ｐｐ．２１１－２２７）。一部の実施形態において、プロモーター領域は、少なくとも１つのイントロン（例えば、配列番号４８または配列番号４９）を含んでもよい。

本発明に有用なプロモーターの例として、組換え核酸分子、例えば、「合成核酸構築体」または「タンパク質－ＲＮＡ複合体」の調製に用いられる構成的、誘導性、時間的に調節された、発生的に調節された、化学的に調節された、組織選好プロモーターおよび／または組織特異的プロモーターが挙げられ得る。これらの種々のタイプのプロモーターが、当該技術において知られている。

プロモーターの選択は、発現の時間的かつ空間的な必要条件に応じて変わってもよいし、形質転換されることとなる宿主細胞に基づいて変わってもよい。様々な多くの生物用のプロモーターが、当該技術において周知である。当該技術において存在する広範囲にわたる知識に基づいて、注目する特定の宿主生物に適したプロモーターを選択することができる。ゆえに、例えば、モデル生物において高度に構成的に発現される遺伝子の上流側のプロモーターについてかなり知られており、そのような知識は、必要に応じて、他の系において容易にアクセスすることができ、かつ実行することができる。

一部の実施形態において、植物において機能的なプロモーターが、本発明の構築体に用いられてもよい。植物内での発現を駆動するのに有用なプロモーターの非限定的な例として、ＲｕｂｉｓＣｏ小サブユニット遺伝子１のプロモーター（ＰｒｂｃＳ１）、アクチン遺伝子のプロモーター（Ｐａｃｔｉｎ）、硝酸還元酵素遺伝子のプロモーター（Ｐｎｒ）、および重複炭素脱水酵素遺伝子１のプロモーター（Ｐｄｃａ１）が挙げられる（Ｗａｌｋｅｒｅｔａｌ．ＰｌａｎｔＣｅｌｌＲｅｐ．２３：７２７－７３５（２００５）、Ｌｉｅｔａｌ．Ｇｅｎｅ４０３：１３２－１４２（２００７）、Ｌｉｅｔａｌ．ＭｏｌＢｉｏｌ．Ｒｅｐ．３７：１１４３－１１５４（２０１０）参照）。ＰｒｂｃＳ１およびＰａｃｔｉｎは構成的プロモーターであり、ＰｎｒおよびＰｄｃａ１は誘導性プロモーターである。Ｐｎｒは、ニトラートによって誘導され、アンモニウムによって抑制され（Ｌｉｅｔａｌ．Ｇｅｎｅ４０３：１３２－１４２（２００７））、そしてＰｄｃａ１は、塩によって誘導される（Ｌｉｅｔａｌ．ＭｏｌＢｉｏｌ．Ｒｅｐ．３７：１１４３－１１５４（２０１０））。

植物に有用な構成的プロモーターの例として、以下に限定されないが、セストラムウイルスプロモーター（ｃｍｐ）（米国特許第７，１６６，７７０号）、イネアクチン１プロモーター（Ｗａｎｇｅｔａｌ．（１９９２）Ｍｏｌ．Ｃｅｌｌ．Ｂｉｏｌ．１２：３３９９－３４０６、および米国特許第５，６４１，８７６号）、ＣａＭＶ３５Ｓプロモーター（Ｏｄｅｌｌｅｔａｌ．（１９８５）Ｎａｔｕｒｅ３１３：８１０－８１２）、ＣａＭＶ１９Ｓプロモーター（Ｌａｗｔｏｎｅｔａｌ．（１９８７）ＰｌａｎｔＭｏｌ．Ｂｉｏｌ．９：３１５－３２４）、ｎｏｓプロモーター（Ｅｂｅｒｔｅｔａｌ．（１９８７）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．ＳｃｉＵＳＡ８４：５７４５－５７４９）、Ａｄｈプロモーター（Ｗａｌｋｅｒｅｔａｌ．（１９８７）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８４：６６２４－６６２９）、スクロース合成酵素プロモーター（Ｙａｎｇ＆Ｒｕｓｓｅｌｌ（１９９０）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８７：４１４４－４１４８）、およびユビキチンプロモーターが挙げられる。ユビキチンに由来する構成的プロモーターは、多くの細胞型において蓄積している。ユビキチンプロモーターは、トランスジェニック植物に用いられるいくつかの植物種、例えば、ヒマワリ（Ｂｉｎｅｔｅｔａｌ．，１９９１．ＰｌａｎｔＳｃｉｅｎｃｅ７９：８７－９４）、トウモロコシ（Ｃｈｒｉｓｔｅｎｓｅｎｅｔａｌ．，１９８９．ＰｌａｎｔＭｏｌｅｃ．Ｂｉｏｌ．１２：６１９－６３２）、およびアラビドプシス（ａｒａｂｉｄｏｐｓｉｓ）（Ｎｏｒｒｉｓｅｔａｌ．１９９３．ＰｌａｎｔＭｏｌｅｃ．Ｂｉｏｌ．２１：８９５－９０６）からクローニングされている。トウモロコシユビキチンプロモーター（ＵｂｉＰ）は、トランスジェニック単子葉植物系において開発されており、その配列、および単子葉植物形質転換のために構築されたベクターが、欧州特許出願公開第０３４２９２６号に開示されている。ユビキチンプロモーターは、トランスジェニック植物、とりわけ単子葉植物内での本発明のヌクレオチド配列の発現に適している。さらに、ＭｃＥｌｒｏｙｅｔａｌ．（Ｍｏｌ．Ｇｅｎ．Ｇｅｎｅｔ．２３１：１５０－１６０（１９９１））によって記載されるプロモーター発現カセットは、本発明のヌクレオチド配列の発現用に容易に修飾することができ、そして単子葉植物宿主に用いるのに特に適している。

一部の実施形態において、組織特異的／組織選好プロモーターは、植物細胞内での異種ポリヌクレオチドの発現に用いることができる。組織特異的または組織選好発現パターンとして、以下に限定されないが、緑色組織特異的もしくは緑色組織選好、根特異的もしくは根選好、茎特異的もしくは茎選好、花卉特異的もしくは花卉選好、または花粉特異的もしくは花粉選好なものが挙げられる。緑色組織内での発現に適したプロモーターとして、光合成に関与する遺伝子を調節する多くのものが挙げられ、これらの多くは、単子葉植物および双子葉植物の双方からクローニングされている。一実施形態において、本発明に有用なプロモーターとして、ホスホエノールカルボキシラーゼ遺伝子由来のトウモロコシＰＥＰＣプロモーターがある（Ｈｕｄｓｐｅｔｈ＆Ｇｒｕｌａ，ＰｌａｎｔＭｏｌｅｃ．Ｂｉｏｌ．１２：５７９－５８９（１９８９））。組織特異的プロモーターの非限定的な例として、種子貯蔵タンパク質（例えば、β－コングリシニン、クルシフェリン、ｎａｐｉｎ、およびファゼオリン）、ゼインもしくは油体タンパク質（例えばオレオシン）、または脂肪酸生合成に関与するタンパク質（アシルキャリアタンパク質、ステアロイル－ＡＣＰデサチュラーゼ、および脂肪酸デサチュラーゼ（ｆａｄ２－１）が挙げられる）をコードする遺伝子、および胚発生中に発現される他の核酸（例えばＢｃｅ４、例えば、Ｋｒｉｄｌｅｔａｌ．（１９９１）ＳｅｅｄＳｃｉ．Ｒｅｓ．１：２０９－２１９、および欧州特許出願公開第２５５３７８号参照）と関連するものが挙げられる。植物、特にトウモロコシ内での本発明のヌクレオチド配列の発現に有用な組織特異的または組織選好性プロモーターとして、以下に限定されないが、根、髄、葉、または花粉内での発現を導くものが挙げられる。そのようなプロモーターは、例えば、国際公開第９３／０７２７８号（プロモーターの開示が参照によって本明細書に組み込まれる）に開示されている。本発明に有用な組織特異的または組織選好プロモーターの他の非限定的な例として、米国特許第６，０４０，５０４号に開示されるワタルビスコプロモーター；米国特許第５，６０４，１２１号に開示されるイネスクロース合成酵素プロモーター；ｄｅＦｒａｍｏｎｄ（ＦＥＢＳ２９０：１０３－１０６（１９９１）；Ｃｉｂａ－Ｇｅｉｇｙの欧州特許出願公開第０４５２２６９号）によって記載される根特異的プロモーター；米国特許第５，６２５，１３６号（Ｃｉｂａ－Ｇｅｉｇｙ）に記載され、トウモロコシｔｒｐＡ遺伝子の発現を駆動する茎特異的プロモーター；国際公開第０１／７３０８７号に開示されるケストルムイエローリーフカーリングウイルスプロモーター；ならびに花粉特異的または花粉選好プロモーター（イネ由来のＰｒｏＯｓＬＰＳ１０およびＰｒｏＯｓＬＰＳ１１（Ｎｇｕｙｅｎｅｔａｌ．ＰｌａｎｔＢｉｏｔｅｃｈｎｏｌ．Ｒｅｐｏｒｔｓ９（５）：２９７－３０６（２０１５））、トウモロコシ由来のＺｍＳＴＫ２＿ＵＳＰ（Ｗａｎｇｅｔａｌ．Ｇｅｎｏｍｅ６０（６）：４８５－４９５（２０１７））、トマト由来のＬＡＴ５２およびＬＡＴ５９（Ｔｗｅｌｌｅｔａｌ．Ｄｅｖｅｌｏｐｍｅｎｔ１０９（３）：７０５－７１３（１９９０））、Ｚｍ１３（米国特許第１０，４２１，９７２号）、アラビドプシス由来のＰＬＡ_２－δプロモーター（米国特許第７，１４１，４２４号）、ならびに／またはトウモロコシ由来のＺｍＣ５プロモーター（国際公開第１９９９／０４２５８７号）が挙げられるが、これらに限定されない）がある。

植物組織特異的／組織選好プロモーターの更なる例として、以下に限定されないが、根毛特異的シスエレメント（ＲＨＥ）（ＫｉｍＥＴＡＬ．ＴｈｅＰｌａｎｔＣｅｌｌ１８：２９５８－２９７０（２００６））、根特異的プロモーターＲＣｃ３（Ｊｅｏｎｇｅｔａｌ．ＰｌａｎｔＰｈｙｓｉｏｌ．１５３：１８５－１９７（２０１０））およびＲＢ７（米国特許第５４５９２５２号）、レクチンプロモーター（Ｌｉｎｄｓｔｒｏｍｅｔａｌ．（１９９０）Ｄｅｒ．Ｇｅｎｅｔ．１１：１６０－１６７；およびＶｏｄｋｉｎ（１９８３）Ｐｒｏｇ．Ｃｌｉｎ．Ｂｉｏｌ．Ｒｅｓ．１３８：８７－９８）、トウモロコシアルコール脱水素酵素１プロモーター（Ｄｅｎｎｉｓｅｔａｌ．（１９８４）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．１２：３９８３－４０００）、Ｓ－アデノシル－Ｌ－メチオニン合成酵素（ＳＡＭＳ）（ＶａｎｄｅｒＭｉｊｎｓｂｒｕｇｇｅｅｔａｌ．（１９９６）ＰｌａｎｔａｎｄＣｅｌｌＰｈｙｓｉｏｌｏｇｙ，３７（８）：１１０８－１１１５）、トウモロコシ集光性複合体プロモーター（Ｂａｎｓａｌｅｔａｌ．（１９９２）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８９：３６５４－３６５８）、トウモロコシヒートショックタンパク質プロモーター（Ｏ’Ｄｅｌｌｅｔａｌ．（１９８５）ＥＭＢＯＪ．５：４５１－４５８；およびＲｏｃｈｅｓｔｅｒｅｔａｌ．（１９８６）ＥＭＢＯＪ．５：４５１－４５８）、エンドウ小サブユニットＲｕＢＰカルボキシラーゼプロモーター（Ｃａｓｈｍｏｒｅ，“Ｎｕｃｌｅａｒｇｅｎｅｓｅｎｃｏｄｉｎｇｔｈｅｓｍａｌｌｓｕｂｕｎｉｔｏｆｒｉｂｕｌｏｓｅ－１，５－ｂｉｓｐｈｏｓｐｈａｔｅｃａｒｂｏｘｙｌａｓｅ”ｐｐ．２９－３９Ｉｎ：ＧｅｎｅｔｉｃＥｎｇｉｎｅｅｒｉｎｇｏｆＰｌａｎｔｓ（Ｈｏｌｌａｅｎｄｅｒｅｄ．，ＰｌｅｎｕｍＰｒｅｓｓ１９８３、およびＰｏｕｌｓｅｎｅｔａｌ．（１９８６）Ｍｏｌ．Ｇｅｎ．Ｇｅｎｅｔ．２０５：１９３－２００）、Ｔｉプラスミドマンノピン合成酵素プロモーター（Ｌａｎｇｒｉｄｇｅｅｔａｌ．（１９８９）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８６：３２１９－３２２３）、Ｔｉプラスミドノパリン合成酵素プロモーター（Ｌａｎｇｒｉｄｇｅｅｔａｌ．（１９８９）、前掲）、ペチュニアカルコンイソメラーゼプロモーター（ｖａｎＴｕｎｅｎｅｔａｌ．（１９８８）ＥＭＢＯＪ．７：１２５７－１２６３）、インゲンマメグリシンリッチタンパク質１プロモーター（Ｋｅｌｌｅｒｅｔａｌ．（１９８９）ＧｅｎｅｓＤｅｖ．３：１６３９－１６４６）、トランケート型ＣａＭＶ３５Ｓプロモーター（Ｏ’Ｄｅｌｌｅｔａｌ．（１９８５）Ｎａｔｕｒｅ３１３：８１０－８１２）、ジャガイモパタチンプロモーター（Ｗｅｎｚｌｅｒｅｔａｌ．（１９８９）ＰｌａｎｔＭｏｌ．Ｂｉｏｌ．１３：３４７－３５４）、根細胞プロモーター（Ｙａｍａｍｏｔｏｅｔａｌ．（１９９０）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．１８：７４４９）、トウモロコシゼインプロモーター（Ｋｒｉｚｅｔａｌ．（１９８７）Ｍｏｌ．Ｇｅｎ．Ｇｅｎｅｔ．２０７：９０－９８；Ｌａｎｇｒｉｄｇｅｅｔａｌ．（１９８３）Ｃｅｌｌ３４：１０１５－１０２２；Ｒｅｉｎａｅｔａｌ．（１９９０）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．１８：６４２５；Ｒｅｉｎａｅｔａｌ．（１９９０）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．１８：７４４９；およびＷａｎｄｅｌｔｅｔａｌ．（１９８９）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．１７：２３５４）、グロブリン－１プロモーター（Ｂｅｌａｎｇｅｒｅｔａｌ．（１９９１）Ｇｅｎｅｔｉｃｓ１２９：８６３－８７２）、α－チューブリンｃａｂプロモーター（Ｓｕｌｌｉｖａｎｅｔａｌ．（１９８９）Ｍｏｌ．Ｇｅｎ．Ｇｅｎｅｔ．２１５：４３１－４４０）、ＰＥＰＣａｓｅプロモーター（Ｈｕｄｓｐｅｔｈ＆Ｇｒｕｌａ（１９８９）ＰｌａｎｔＭｏｌ．Ｂｉｏｌ．１２：５７９－５８９）、Ｒ遺伝子複合体－関連プロモーター（Ｃｈａｎｄｌｅｒｅｔａｌ．（１９８９）ＰｌａｎｔＣｅｌｌ１：１１７５－１１８３）、ならびにカルコン合成酵素プロモーター（Ｆｒａｎｋｅｎｅｔａｌ．（１９９１）ＥＭＢＯＪ．１０：２６０５－２６１２）が挙げられる。

種子特異的発現に有用なものとして、エンドウビシリンプロモーター（Ｃｚａｋｏｅｔａｌ．（１９９２）Ｍｏｌ．Ｇｅｎ．Ｇｅｎｅｔ．２３５：３３－４０）、および米国特許第５，６２５，１３６号に開示される種子特異的プロモーターがある。成葉内での発現に有用なプロモーターとして、老化の開始時にスイッチされるもの、例えばシロイヌナズナ（Ａｒａｂｉｄｏｐｓｉｓ）属由来のＳＡＧプロモーター（Ｇａｎｅｔａｌ．（１９９５）Ｓｃｉｅｎｃｅ２７０：１９８６－１９８８）がある。

また、葉緑体内で機能的なプロモーターを用いることができる。そのようなプロモーターの非限定的な例として、バクテリオファージＴ３遺伝子９５’ＵＴＲ、および米国特許第７，５７９，５１６号中で開示される他のプロモーターが挙げられる。本発明に有用な他のプロモーターとして、以下に限定されないが、Ｓ－Ｅ９小サブユニットＲｕＢＰカルボキシラーゼプロモーターおよびクニッツトリプシンインヒビター遺伝子プロモーター（Ｋｔｉ３）が挙げられる。

本発明に有用な更なる調節要素として、以下に限定されないが、イントロン、エンハンサー、終止配列、ならびに／または５’および３’非翻訳領域が挙げられる。

本発明に有用なイントロンとして、植物において同定されており、かつ植物から単離されてから、植物の形質転換に用いられることとなる発現カセット中に挿入されるイントロンがあり得る。当業者によって理解されるように、イントロンは、自己切除に必要とされる配列を含むことができ、そして核酸構築体／発現カセット中にフレーム単位で（ｉｎｆｒａｍｅ）組み込まれる。イントロンを、一核酸構築体内で複数のタンパク質コード配列を分離するスペーサーとして用いることもできるし、イントロンを、例えば、ｍＲＮＡを安定させるのに、一タンパク質コード配列の内側で用いることもできる。イントロンは、タンパク質コード配列内で用いられるならば、切除部位を含んだ「フレーム単位で」挿入される。また、イントロンは、発現を向上させるか、または修飾するように、プロモーターと関連してもよい。一例として、本発明に有用なプロモーター／イントロンの組合せとして、以下に限定されないが、トウモロコシＵｂｉ１プロモーターおよびイントロンの組合せが挙げられる。

本発明に有用なイントロンの非限定的な例として、ＡＤＨＩ遺伝子（例えば、Ａｄｈ１－Ｓイントロン１、２、および６）、ユビキチン遺伝子（Ｕｂｉ１）、ＲｕＢｉｓＣｏ小サブユニット（ｒｂｃＳ）遺伝子、ＲｕＢｉｓＣｏ大サブユニット（ｒｂｃＬ）遺伝子、アクチン遺伝子（例えばａｃｔｉｎ－１イントロン）、ピルビン酸脱水素酵素キナーゼ遺伝子（ｐｄｋ）、硝酸還元酵素遺伝子（ｎｒ）、重複炭素脱水酵素遺伝子１（Ｔｄｃａ１）、ｐｓｂＡ遺伝子、ａｔｐＡ遺伝子、またはそれらのあらゆる組合せ由来のイントロンが挙げられる。

本明細書中で用いられる「編集系」は、現在知られているか、または後に開発されるあらゆる部位特異的（例えば配列特異的）核酸編集系を指し、当該系は、核酸内に修飾（例えば変異）を標的特異的に導入することができる。例えば、編集系（例えば、部位特異的かつ／または配列特異的編集系）として、以下に限定されないが、ＣＲＩＳＰＲ－Ｃａｓ編集系、メガヌクレアーゼ編集系、ジンクフィンガーヌクレアーゼ（ＺＦＮ）編集系、転写アクティベータ様エフェクターヌクレアーゼ（ＴＡＬＥＮ）編集系、塩基編集系、および／またはプライム編集系が挙げられ得、これらは各々、組成物および／または細胞内で一緒に（例えば、系として）存在し、かつ／または発現される場合に、標的核酸を配列特異的に修飾する（例えば変異させる）ことができる１つもしくは複数のポリペプチドおよび／または１つもしくは複数のポリヌクレオチドを含んでよい。一部の実施形態において、編集系（例えば、部位特異的かつ／または配列特異的編集系）は、１つもしくは複数のポリヌクレオチドおよび／または１つもしくは複数のポリペプチドを含み得、以下に限定されないが、核酸結合ドメイン（例えば、ＤＮＡ結合ドメイン）、ヌクレアーゼ、別のポリペプチド、および／またはポリヌクレオチドが挙げられる。一部の実施形態において、本発明の操作されたタンパク質を含むＣＲＩＳＰＲ－Ｃａｓ編集系が提供され、かつ／または用いられる。

一部の実施形態において、編集系は、例えば、ポリヌクレオチドガイドエンドヌクレアーゼ、ＣＲＩＳＰＲ－Ｃａｓエンドヌクレアーゼ（例えばＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）、ジンクフィンガーヌクレアーゼ、転写アクティベータ様エフェクターヌクレアーゼ（ＴＡＬＥＮ）、および／またはアルゴノートタンパク質に由来し得る１つまたは複数の配列特異的核酸結合ポリペプチド（例えばＤＮＡ結合ドメイン）を含む。一部の実施形態において、編集系は、以下に限定されないが、エンドヌクレアーゼ（例えばＦｏｋ１）、ポリヌクレオチドガイドエンドヌクレアーゼ、ＣＲＩＳＰＲ－Ｃａｓエンドヌクレアーゼ（例えばＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）、ジンクフィンガーヌクレアーゼ、および／または転写アクティベータ様エフェクターヌクレアーゼ（ＴＡＬＥＮ）が挙げられる１つまたは複数の切断ポリペプチド（例えばヌクレアーゼ）を含む。

本明細書中で用いられる「核酸結合ドメイン」は、核酸（例えば標的核酸）に結合するか、または結合することができるポリペプチドまたはドメインを指す。ＤＮＡ結合ドメインは、例となる核酸結合ドメインであり、部位特異的かつ／または配列特異的核酸結合ドメインであってよい。一部の実施形態において、核酸結合ドメインは、以下に限定されないが、例えば、ポリヌクレオチドガイドエンドヌクレアーゼ、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えばＣＲＩＳＰＲ－Ｃａｓエンドヌクレアーゼ）、ジンクフィンガーヌクレアーゼ、転写アクティベータ様エフェクターヌクレアーゼ（ＴＡＬＥＮ）、および／またはアルゴノートタンパク質由来の、配列特異的結合ドメイン等の配列特異的核酸結合ドメインであってよい。一部の実施形態において、核酸結合ドメインは、以下に限定されないが、エンドヌクレアーゼ（例えばＦｏｋ１）、ポリヌクレオチドガイドエンドヌクレアーゼ、ＣＲＩＳＰＲ－Ｃａｓエンドヌクレアーゼ、ジンクフィンガーヌクレアーゼ、および／または転写アクティベータ様エフェクターヌクレアーゼ（ＴＡＬＥＮ）等の切断ドメイン（例えばヌクレアーゼドメイン）を含む。一部の実施形態において、核酸結合ドメインは、１つまたは複数の核酸分子（またはその部分もしくは領域）に相補的な特定の標的ヌクレオチド配列（例えばゲノムの遺伝子座）に、核酸結合ドメインを導くか、またはガイドすることによって、核酸結合ドメインを、特定の標的部位にて、ヌクレオチド配列に結合させることができる１つまたは複数の核酸分子と結合する（例えば、複合体を形成する）ことができる（例えば、本明細書中に記載されるガイド核酸と複合体を形成する）ことができるポリペプチドである。一部の実施形態において、核酸結合ドメインは、本明細書中に記載されるＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質である。

一部の実施形態において、編集系は、アセンブルされたリボ核タンパク質複合体等のリボ核タンパク質（例えば、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、ガイド核酸、および場合によってはデアミナーゼを含むリボ核タンパク質）を含むか、またはこれである。一部の実施形態において、編集系のリボ核タンパク質は、例えば、標的核酸に接触する場合に、または細胞（例えば植物細胞）中に導入される場合に、一緒にアセンブルされてもよい（例えば、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、ガイド核酸、および場合によってはデアミナーゼを含む予めアセンブルされたリボ核タンパク質）。一部の実施形態において、編集系のリボ核タンパク質が、複合体（例えば、共有結合的かつ／または非共有結合的に結合した複合体）にアセンブルしていてもよい一方、リボ核タンパク質の部分が、標的核酸に接触しており、かつ／または植物細胞中への導入の後かつ／もしくはその間にアセンブルしてもよい。一部の実施形態において、編集系は、植物細胞中に導入される場合に、（例えば、共有結合的かつ／または非共有結合的に結合した複合体に）アセンブルされてもよい。一部の実施形態において、リボ核タンパク質は、操作されたタンパク質、ガイド核酸、および場合によってはデアミナーゼを含んでもよい。

本明細書中で用いられる用語「導入遺伝子」または「トランスジェニック」は、一生物のゲノムからとられるか、または合成的に生成され、かつ続いて注目する宿主細胞（例えば植物細胞）または生物または組織中に導入され、かつその後に「安定した」形質転換アプローチまたは形質移入アプローチによる宿主のゲノム中に組み込まれる少なくとも１つの核酸配列を指す。これに対し、用語「一過性の」形質転換または形質移入または導入は、場合によっては適切な化学薬剤または生物学的薬剤を含む、少なくとも１つの核酸（ＤＮＡ、ＲＮＡ、一本鎖もしくは二本鎖、またはそれらの混合物）、および／または少なくとも１つのアミノ酸配列が挙げられる分子ツールを導入して、以下に制限されないが、細胞質、細胞小器官（核、ミトコンドリア、液胞、葉緑体が挙げられる）を含む細胞の注目する少なくとも１つのコンパートメント中への、または膜中への移入を達成して、ゲノム中への安定した組込み（ｉｎｔｅｇｒａｔｉｏｎまたはｉｎｃｏｒｐｏｒａｔｉｏｎ）を達成することなく、そして故に細胞のゲノム中に導入される少なくとも１つの各分子を遺伝することなく、導入された少なくとも１つの分子の転写および／または翻訳および／または結合および／または活性をもたらす方法を指す。用語「導入遺伝子フリー」は、導入遺伝子が、注目する宿主細胞または組織または生物のゲノム内に存在しないか、または見出されない状況を指す。

一部の実施形態において、本発明のポリヌクレオチドおよび／または核酸構築体は、「発現カセット」であり得、または発現カセット内に含まれ得る。本明細書中で用いられる「発現カセット」は、例えば、本発明の核酸構築体（例えば、操作されたタンパク質をコードするポリヌクレオチド、シトシンデアミナーゼをコードするポリヌクレオチド、アデニンデアミナーゼをコードするポリヌクレオチド、デアミナーゼ融合タンパク質をコードするポリヌクレオチド、ペプチドタグをコードするポリヌクレオチド、親和性ポリペプチドをコードするポリヌクレオチド、グリコシラーゼをコードするポリヌクレオチド、および／またはガイド核酸を含むポリヌクレオチド）を含む組換え核酸分子を意味し、核酸構築体は、少なくとも制御配列（例えばプロモーター）と作動可能に結合されている。ゆえに、本発明の一部の実施形態は、例えば、本発明の核酸構築体を発現するように設計された発現カセットを提供する。発現カセットが複数のポリヌクレオチドを含む場合、ポリヌクレオチドは、ポリヌクレオチドの全ての発現を駆動する単一のプロモーターに作動可能に連結されていてもよいし、ポリヌクレオチドは、１つまたは複数の別個のプロモーターに作動可能に連結されていてもよい（例えば、３つのポリヌクレオチドが、１つ、２つ、または３つのプロモーターによって、あらゆる組合せで駆動されてよい）。ゆえに、例えば、発現カセット内に含まれる、操作されたタンパク質をコードするポリヌクレオチド、デアミナーゼ（例えばアデニンデアミナーゼ）をコードするポリヌクレオチド、およびガイド核酸を含むポリヌクレオチドが、各々、単一のプロモーターと作動可能に結合されていてもよく、またはポリヌクレオチドの１つもしくは複数が、別個のプロモーター（例えば、２つまたは３つのプロモーター）（互いと同じであっても異なってもよい）と、あらゆる組合せで作動可能に結合されていてもよい。

一部の実施形態において、本発明のポリヌクレオチド／核酸構築体を含む発現カセットは、生物（例えば、動物、植物、および細菌等）内での発現のために最適化されていてよい。

本発明の核酸構築体を含む発現カセットは、キメラであってもよく、このことは、その構成要素の少なくとも１つが、その他の構成要素の少なくとも１つに関して、異種である（例えば、宿主生物において発現されることとなる、注目するポリヌクレオチドに作動可能に連結した、宿主生物由来のプロモーター。ここで、注目するポリヌクレオチドは、宿主とは異なる生物由来であるか、または当該プロモーターと関連して通常見出されない）ことを意味する。また、発現カセットは、天然に存在するが、異種発現に有用な組換え形態で得られたものであってもよい。

発現カセットは、場合によっては、選択された宿主細胞内で機能的である転写終止領域および／または翻訳終止領域（すなわち終止領域）および／またはエンハンサー領域を含み得る。種々の転写ターミネーターおよびエンハンサーが、当該技術において知られており、発現カセットに用いるのに入手可能である。転写ターミネーターは、転写の終止および正確なｍＲＮＡポリアデニル化を担っている。終止領域および／またはエンハンサー領域は、転写開始領域に固有であってもよいし、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質をコードする遺伝子またはデアミナーゼをコードする遺伝子に固有であってもよいし、宿主細胞に固有であってもよいし、別の源（例えば、プロモーター、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質をコードする遺伝子またはデアミナーゼをコードする遺伝子、宿主細胞、またはそれらのあらゆる組合せに対して外来であるか、異種である）に固有であってもよい。

また、本発明の発現カセットは、選択マーカーをコードするポリヌクレオチドを含むことができ、これは、形質転換された宿主細胞を選択するのに用いることができる。本明細書中で用いられる「選択マーカー」は、発現された場合に、マーカーを発現する宿主細胞に目立った表現型を与えるので、そのような形質転換された細胞を、マーカーを有していない細胞から区別することができるポリヌクレオチド配列を意味する。そのようなポリヌクレオチド配列は、マーカーが、化学手段によって、例えば選択剤（例えば抗生物質等）を用いることによって選択され得る形質を付与するかどうかに応じて、またはマーカーが単純に、観察もしくは試験を通して、例えばスクリーニング（例えば蛍光）によって識別することができる形質であるかに応じて、選択マーカーまたはスクリーニングマーカーをコードしてよい。適した選択マーカーの多くの例が、当該技術において知られており、本明細書中に記載される発現カセットに用いることができる。

本明細書中に記載される発現カセット、核酸分子／構築体、およびポリヌクレオチド配列は、ベクターと関連させて用いることができる。用語「ベクター」は、細胞中に核酸（複数可）を移入するか、送達するか、または導入するための組成物を指す。ベクターは、移入されるか、送達されるか、または導入されることとなるヌクレオチド配列を含む核酸構築体を含む。宿主生物の形質転換に用いられるベクターは、当該技術において周知である。ベクターの一般的なクラスの非限定的な例として、自己伝染性であっても可動性であってもよいしそうでなくてもよい二本鎖または一本鎖の直鎖状または環状の形態の、ウイルスベクター、プラスミドベクター、ファージベクター、ファージミドベクター、コスミドベクター、フォスミドベクター、バクテリオファージ、人工染色体、ミニサークル、またはアグロバクテリウム（Ａｇｒｏｂａｃｔｅｒｉｕｍ）属バイナリベクターが挙げられる。一部の実施形態において、ウイルスベクターとして、以下に限定されないが、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス、または単純ヘルペスウイルスのベクターが挙げられ得る。本明細書中で定義されるベクターは、細胞ゲノム中への組込み、または染色体外の存在（例えば、複製起点を有する自律複製プラスミド）のいずれかによって、原核生物宿主または真核生物宿主を形質転換することができる。加えて、含まれるのは、２つの異なる宿主生物内での複製が天然で、または設計によって可能なＤＮＡビヒクルを意味するシャトルベクターであり、これは、アクチノミセスおよび関連する種、細菌、および真核生物（例えば、より高次の植物、哺乳動物、酵母、または真菌の細胞）から選択され得る。一部の実施形態において、ベクター内の核酸は、宿主細胞内での転写に適したプロモーターまたは他の調節要素の制御下にあり、かつこれと作動可能に連結されている。ベクターは、複数の宿主において機能する二元機能性発現ベクターであってもよい。ゲノムＤＮＡの場合には、これは、それ自体のプロモーターおよび／または他の調節要素を含有してもよく、そしてｃＤＮＡの場合には、これは、宿主細胞内での発現に適したプロモーターおよび／または他の調節要素の制御下にあってもよい。したがって、本発明の核酸構築体、および／またはこれを含む発現カセットが、本明細書中に記載されるベクター、および当該技術において知られているベクター内に含まれてもよい。

本明細書中で用いられる「接触させる」、「接触させている」、「接触した」、およびその文法上の変形は、所望される反応（例えば、形質転換、転写制御、ゲノム編集、ニッキング、および／または切断）の構成要素を、所望される反応を実行するのに適した条件下に一緒に置くことを指す。ゆえに、例えば、核酸結合ドメイン（例えばＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）が発現され、そして核酸結合ドメインがガイド核酸と複合体を形成し、複合体が標的核酸にハイブリダイズし、そして場合によっては、シトシンデアミナーゼおよび／もしくはアデニンデアミナーゼが核酸結合ドメインに（故に、標的核酸に）動員される条件の下で、標的核酸を、例えば、核酸結合ドメイン（例えば、ＤＮＡ結合ドメイン、例えば配列特異的ＤＮＡ結合タンパク質（例えば、ポリヌクレオチドガイドエンドヌクレアーゼ、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えばＣＲＩＳＰＲ－Ｃａｓエンドヌクレアーゼ）、ジンクフィンガーヌクレアーゼ、転写アクティベータ様エフェクターヌクレアーゼ（ＴＡＬＥＮ）、および／またはアルゴノートタンパク質））、ガイド核酸、ならびに場合によってはシトシンデアミナーゼおよび／もしくはアデニンデアミナーゼをコードする本発明の核酸構築体と接触させてよく、またはシトシンデアミナーゼおよび／もしくはアデニンデアミナーゼは、核酸結合ドメインに融合しており、それによって、標的核酸を修飾する。一部の実施形態において、シトシンデアミナーゼおよび／またはアデニンデアミナーゼ、ならびに核酸結合ドメインは、場合によっては共有結合性かつ／または非共有結合性の相互作用を介して、標的核酸に局在する。

一部の実施形態において、操作されたタンパク質が発現され、または標的核酸が、操作されたタンパク質、ガイド核酸、ならびに場合によってはシトシンデアミナーゼおよび／またはアデニンデアミナーゼと接触し得る条件の下で、標的核酸を、操作されたタンパク質、ガイド核酸、ならびに場合によってはシトシンデアミナーゼおよび／またはアデニンデアミナーゼをコードする本発明の核酸構築体と接触させてもよい。操作されたタンパク質は、ガイド核酸と複合体を形成することができ、複合体は、標的核酸にハイブリダイズすることができ、そして場合によっては、シトシンデアミナーゼおよび／もしくはアデニンデアミナーゼは、操作されたタンパク質に（故に、標的核酸に）動員され、またはシトシンデアミナーゼおよび／もしくはアデニンデアミナーゼは、操作されたタンパク質に融合しており、それによって、標的核酸を修飾する。シトシンデアミナーゼおよび／またはアデニンデアミナーゼ、ならびに操作されたタンパク質は、場合によっては共有結合性かつ／または非共有結合性の相互作用を介して、標的核酸に局在してもよい。

本明細書中で用いられる、標的核酸に関する「修飾すること」または「修飾」は、修飾核酸を提供し、かつ／または標的核酸の転写制御を変更して修飾核酸を提供するための、標的核酸の編集（例えば変異）、共有結合修飾、核酸／ヌクレオチド塩基の交換／置換、欠失、切断、および／またはニッキングを含む。一部の実施形態において、修飾は、あらゆるサイズの挿入および／もしくは欠失、ならびに／またはあらゆるタイプの単一塩基変化（ＳＮＰ）を含んでもよい。一部の実施形態において、修飾はＳＮＰを含む。一部の実施形態において、修飾は、１つまたは複数（例えば、１、２、３、４、５つ、またはこれを超える）のヌクレオチドを交換かつ／または置換すること含む。一部の実施形態において、挿入または欠失は、約１塩基長～約３０，０００塩基長（例えば、約１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７７、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２１０、２２０、２３０、２４０、２５０、２６０、２７０、２８０、２９０、３００、３１０、３２０、３３０、３４０、３５０、３６０、３７０、３８０、３９０、４００、４１０、４００、４１０、４２０、４３０、４４０、４５０、４６０、４７０、４８０、４９０、５００、５１０、５２０、５３０、５４０、５５０、５６０、５７０、５８０、５９０、６００、６１０、６２０、６３０、６４０、６５０、６６０、６７０、６８０、６９０、７００、７１０、７２０、７３０、７４０、７５０、７６０、７７０、７８０、７９０、８００、８１０、８２０、８３０、８４０、８５０、８６０、８７０、８８０、８９０、９００、９１０、９２０、９３０、９４０、９５０、９６０、９７０、９８０、９９０、１０００、１１００、１２００、１３００、１４００、１５００、１６００、１７００、１８００、１９００、２０００、２５００、３０００、３５００、４０００、４５００、５０００、５５００、６０００、６５００、７０００、７５００、８０００、８５００、９０００、９５００、１０，０００、１０，５００、１１，０００、１１，５００、１２，０００、１２，５００、１３，０００、１３，５００、１４，０００、１４，５００、１５，０００、１５，５００、１６，０００、１６，５００、１７，０００、１７，５００、１８，０００、１８，５００、１９，０００、１９，５００、２０，０００、２０，５００、２１，０００、２１，５００、２２，０００、２２，５００、２３，０００、２３，５００、２４，０００、２４，５００、２５，０００、２５，５００、２６，０００、２６，５００、２７，０００、２７，５００、２８，０００、２８，５００、２９，０００、２９，５００、３０，０００塩基長以上、またはそれらの中のあらゆる値もしくは範囲）であってよい。ゆえに、一部の実施形態において、挿入または欠失は、約１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７７、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２１０、２２０、２３０、２４０、２５０、２６０、２７０、２８０、２９０、３００～約３１０、３２０、３３０、３４０、３５０、３６０、３７０、３８０、３９０、４００、４１０、４２０、４３０、４４０、４５０、４６０、４７０、４８０、４９０、５００、５１０、５２０、５３０、５４０、５５０、５６０、５７０、５８０、５９０、６００、６１０、６２０、６３０、６４０、６５０、６６０、６７０、６８０、６９０、７００、７１０、７２０、７３０、７４０、７５０、７６０、７７０、７８０、７９０、８００、８１０、８２０、８３０、８４０、８５０、８６０、８７０、８８０、８９０、９００、９１０、９２０、９３０、９４０、９５０、９６０、９７０、９８０、９９０、１０００塩基長、またはそれらの中のあらゆる範囲もしくは値；約５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７７、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２１０、２２０、２３０、２４０、２５０、２６０、２７０、２８０、２９０、３００塩基～約３１０、３２０、３３０、３４０、３５０、３６０、３７０、３８０、３９０、４００、４１０、４２０、４３０、４４０、４５０、４６０、４７０、４８０、４９０、５００、５１０、５２０、５３０、５４０、５５０、５６０、５７０、５８０、５９０、６００、６１０、６２０、６３０、６４０、６５０、６６０、６７０、６８０、６９０、７００、７１０、７２０、７３０、７４０、７５０、７６０、７７０、７８０、７９０、８００、８１０、８２０、８３０、８４０、８５０、８６０、８７０、８８０、８９０、９００、９１０、９２０、９３０、９４０、９５０、９６０、９７０、９８０、９９０、１０００、１１００、１２００、１３００、１４００、１５００、１６００、１７００、１８００、１９００、２０００塩基長以上、またはそれらの中のあらゆる値もしくは範囲；約５００、５１０、５２０、５３０、５４０、５５０、５６０、５７０、５８０、５９０、６００、６１０、６２０、６３０、６４０、６５０、６６０、６７０、６８０、６９０、７００、７１０、７２０、７３０、７４０、７５０、７６０、７７０、７８０、７９０、８００、８１０、８２０、８３０、８４０、８５０、８６０、８７０、８８０、８９０、９００、９１０、９２０、９３０、９４０、９５０、９６０、９７０、９８０、９９０、１０００、１１００、１２００、１３００、１４００、１５００、１６００、１７００、１８００、１９００、２０００塩基～約２５００、３０００、３５００、４０００、４５００、５０００、５５００、６０００、６５００、７０００、７５００、８０００、８５００、９０００、９５００、もしくは１０，０００塩基長以上、またはそれらの中のあらゆる値もしくは範囲；あるいは約４００、４１０、４２０、４３０、４４０、４５０、４６０、４７０、４８０、４９０、５００、５１０、５２０、５３０、５４０、５５０、５６０、５７０、５８０、５９０、６００、６１０、６２０、６３０、６４０、６５０、６６０、６７０、６８０、６９０、もしくは７００塩基長から、約７１０、７２０、７３０、７４０、７５０、７６０、７７０、７８０、７９０、８００、８１０、８２０、８３０、８４０、８５０、８６０、８７０、８８０、８９０、９００、９１０、９２０、９３０、９４０、９５０、９６０、９７０、９８０、９９０、１０００、１１００、１２００、１３００、１４００、１５００、１６００、１７００、１８００、１９００、２０００、２５００、３０００、３５００、４０００、４５００，もしくは５０００塩基長以上、またはそれらの中のあらゆる値もしくは範囲であってよい。一部の実施形態において、挿入または欠失は、約１０００、１１００、１２００、１３００、１４００、１５００、１６００、１７００、１８００、１９００、２０００、２５００、３０００、３５００、４０００、４５００、５０００、５５００、６０００、６５００、７０００、７５００、８０００、８５００、９０００、９５００、もしくは１００００塩基長～約１０，５００、１１，０００、１１，５００、１２，０００、１２，５００、１３，０００、１３，５００、１４，０００、１４，５００、１５，０００、１５，５００、１６，０００、１６，５００、１７，０００、１７，５００、１８，０００、１８，５００、１９，０００、１９，５００、２０，０００、２０，５００、２１，０００、２１，５００、２２，０００、２２，５００、２３，０００、２３，５００、２４，０００、２４，５００、２５，０００、２５，５００、２６，０００、２６，５００、２７，０００、２７，５００、２８，０００、２８，５００、２９，０００、２９，５００，もしくは３０，０００塩基長以上、またはそれらの中のあらゆる値もしくは範囲であってよい。

本明細書中で用いられる「動員する」、「動員すること」、または「動員」は、タンパク質－タンパク質相互作用、核酸タンパク質相互作用（例えばＲＮＡ－タンパク質相互作用）、および／または化学的相互作用を用いて、１つまたは複数のポリペプチドまたはポリヌクレオチドを、別のポリペプチドまたはポリヌクレオチドに（例えば、ゲノム内の特定の位置に）引き寄せることを指す。タンパク質－タンパク質相互作用として、以下に限定されないが、ペプチドタグ（エピトープ、多量体化エピトープ）および対応する親和性ポリペプチド、ＲＮＡ動員モチーフおよび対応する親和性ポリペプチド、ならびに／または化学的相互作用が挙げられ得る。動員の目的でポリペプチドおよびポリヌクレオチドに有用であり得る例となる化学的相互作用として、以下に限定されないが、ＦＲＢ－ＦＫＢＰのラパマイシン誘導性二量体化；ビオチン－ストレプトアビジン相互作用；ＳＮＡＰタグ（Ｈｕｓｓａｉｎｅｔａｌ．ＣｕｒｒＰｈａｒｍＤｅｓ．１９（３０）：５４３７－４２（２０１３））；Ｈａｌｏタグ（Ｌｏｓｅｔａｌ．ＡＣＳＣｈｅｍＢｉｏｌ．３（６）：３７３－８２（２００８））；ＣＬＩＰタグ（Ｇａｕｔｉｅｒｅｔａｌ．Ｃｈｅｍｉｓｔｒｙ＆Ｂｉｏｌｏｇｙ１５：１２８－１３６（２００８））；化合物によって誘導されるＤｍｒＡ－ＤｍｒＣヘテロダイマー（Ｔａｋｅｔａｌ．ＮａｔＭｅｔｈｏｄｓ１４（１２）：１１６３－１１６６（２０１７））；二官能性リガンドアプローチ（２つのタンパク質－結合化学物質を一緒に融合させる）（Ｖｏβ ｅｔａｌ．ＣｕｒｒＯｐｉｎＣｈｅｍｉｃａｌＢｉｏｌｏｇｙ２８：１９４－２０１（２０１５））（例えばジヒドロ葉酸還元酵素（ＤＨＦＲ）（Ｋｏｐｙｔｅｃｋｅｔａｌ．ＣｅｌｌＣｅｈｍＢｉｏｌ７（５）：３１３－３２１（２０００））が挙げられ得る。

注目するポリヌクレオチドまたは編集系の文脈における「導入すること」、「導入する」、「導入された」（およびその文法上の変形）は、注目するヌクレオチド配列（例えば、ポリヌクレオチド、核酸構築体、および／またはガイド核酸）および／または編集系（例えば、ポリヌクレオチド、ポリペプチド、および／またはリボ核タンパク質）を、宿主生物または前記生物の細胞（例えば、宿主細胞、例えば植物細胞）および／または編集系が、細胞の内部にアクセスするように提示することを意味する。ゆえに、例えば、操作されたタンパク質、ガイド核酸、ならびにシトシンデアミナーゼおよび／またはアデニンデアミナーゼをコードする本発明の核酸構築体が、生物の細胞中に導入されることによって、細胞が、操作されたタンパク質、ガイド核酸、ならびにシトシンデアミナーゼおよび／またはアデニンデアミナーゼにより形質転換されてもよい。一部の実施形態において、操作されたタンパク質および／またはガイド核酸が、生物の細胞中に導入されてもよく、場合によっては、操作されたタンパク質およびガイド核酸は、複合体（例えばリボ核タンパク質）内に含まれてもよい。一部の実施形態において、生物は真核生物（例えば、ヒト等の哺乳動物）である。

本明細書中で用いられる用語「形質転換」は、細胞中への異種核酸、ポリペプチド、および／またはリボ核タンパク質の導入を指す。細胞の形質転換は、安定していてもよいし、一過性であってもよい。ゆえに、一部の実施形態において、宿主細胞または宿主生物は、本発明のポリヌクレオチド／核酸分子により安定して形質転換されていてもよい。一部の実施形態において、宿主細胞または宿主生物は、本発明の核酸構築体、ポリペプチド、および／またはリボ核タンパク質により一時的に形質転換されていてもよい。

ポリヌクレオチド、ポリペプチド、および／またはリボ核タンパク質の文脈における「一過性の形質転換」は、ポリヌクレオチド、ポリペプチド、および／またはリボ核タンパク質が細胞中に導入され、細胞のゲノム中に組み込まれないことを意味する。

細胞中に導入されるポリヌクレオチドの文脈における、「安定して導入すること」または「安定して導入される」によって意図されるのは、導入されたポリヌクレオチドが、細胞のゲノム中に安定して組み込まれていることで、細胞が、ポリヌクレオチドにより安定して形質転換されていることである。

本明細書中で用いられる「安定した形質転換」または「安定して形質転換された」は、核酸分子が細胞中に導入され、細胞のゲノム中に組み込まれることを意味する。したがって、組み込まれた核酸分子は、その後代によって、より詳細には複数の連続する世代の後代によって遺伝され得る。本明細書中で用いられる「ゲノム」は、核および色素体ゲノムを含むので、例えば、葉緑体ゲノムまたはミトコンドリアゲノム中への核酸の組込みを含む。また、本明細書中で用いられる安定した形質転換は、例えば微小染色体またはプラスミドとして、染色体外に維持される導入遺伝子を指し得る。

一過性の形質転換は、例えば、酵素結合免疫吸着アッセイ（ＥＬＩＳＡ）またはウェスタンブロットによって検出され得、これらは、生物中に導入される１つまたは複数の導入遺伝子によってコードされるペプチドまたはポリペプチドの存在を検出することができる。細胞の安定した形質転換は、例えば、生物（例えば植物）中に導入される導入遺伝子のヌクレオチド配列と特異的にハイブリダイズする核酸配列との細胞のゲノムＤＮＡのサザンブロットハイブリダイゼーションアッセイによって検出することができる。細胞の安定した形質転換は、例えば、宿主生物中に導入される導入遺伝子のヌクレオチド配列と特異的にハイブリダイズする核酸配列との細胞のＲＮＡのノーザンブロットハイブリダイゼーションアッセイによって検出することができる。また、細胞の安定した形質転換は、例えば、当該技術において周知のポリメラーゼ連鎖反応（ＰＣＲ）または他の増幅反応によって検出することができ、これは、導入遺伝子の標的配列とハイブリダイズする特異的プライマー配列を使用して、導入遺伝子配列の増幅をもたらし、これが標準的な方法に従って検出され得る。また、形質転換は、当該技術において周知であるダイレクトシーケンシングおよび／またはハイブリダイゼーションプロトコールによって検出することができる。

したがって、一部の実施形態において、本発明のヌクレオチド配列、ポリヌクレオチド、核酸構築体、および／または発現カセットは、一過性に発現され得、かつ／または宿主生物のゲノム中に安定して組み込まれ得る。ゆえに、一部の実施形態において、本発明の核酸構築体が、ガイド核酸により細胞中に一過性に導入されるので、ＤＮＡは細胞内で維持され得ない。

本発明の核酸構築体、ポリペプチド、および／またはリボ核タンパク質は、当業者に知られているいかなる方法によっても、細胞中に導入され得る。一部の実施形態において、形質転換方法として、以下に限定されないが、細菌媒介核酸送達（例えば、アグロバクテリア（Ａｇｒｏｂａｃｔｅｒｉａ）を介する）、ウイルス媒介核酸送達、炭化ケイ素および／または核酸ウィスカー媒介核酸送達、リポソーム媒介核酸送達、マイクロインジェクション、マイクロ粒子衝撃、リン酸カルシウム媒介形質転換、シクロデキストリン媒介形質転換、エレクトロポレーション、ナノ粒子媒介形質転換、超音波処理、浸潤、ＰＥＧ媒介核酸吸収、ならびに細胞（例えば、植物細胞または動物細胞）中への核酸の導入をもたらす他のあらゆる電気的、化学的、物理的（機械的）、かつ／または生物学的機構（それらのあらゆる組合せを含む）を介した形質転換が挙げられる。本発明の一部の実施形態において、細胞の形質転換は、核形質転換を含む。一部の実施形態において、細胞の形質転換は、色素体形質転換（例えば葉緑体形質転換）を含む。一部の実施形態において、本発明の組換え核酸構築体は、従来の育種技術を介して細胞中に導入され得る。

真核生物および原核生物の双方を形質転換する手順は、当該技術において周知であり、かつルーチンであり、文献の全体を通して記載されている（例えば、Ｊｉａｎｇｅｔａｌ．２０１３．Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．３１：２３３－２３９、Ｒａｎｅｔａｌ．ＮａｔｕｒｅＰｒｏｔｏｃｏｌｓ８：２２８１－２３０８（２０１３）参照）。当該技術において知られている種々の植物形質転換方法の一般的なガイドとして、Ｍｉｋｉｅｔａｌ．（“ＰｒｏｃｅｄｕｒｅｓｆｏｒＩｎｔｒｏｄｕｃｉｎｇＦｏｒｅｉｇｎＤＮＡｉｎｔｏＰｌａｎｔｓ”ｉｎＭｅｔｈｏｄｓｉｎＰｌａｎｔＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙａｎｄＢｉｏｔｅｃｈｎｏｌｏｇｙ，Ｇｌｉｃｋ，Ｂ．Ｒ．ａｎｄＴｈｏｍｐｓｏｎ，Ｊ．Ｅ．，Ｅｄｓ．（ＣＲＣＰｒｅｓｓ，Ｉｎｃ．，ＢｏｃａＲａｔｏｎ，１９９３），ｐａｇｅｓ６７－８８）およびＲａｋｏｗｏｃｚｙ－Ｔｒｏｊａｎｏｗｓｋａ（Ｃｅｌｌ．Ｍｏｌ．Ｂｉｏｌ．Ｌｅｔｔ．７：８４９－８５８（２００２））が挙げられる。

したがって、ヌクレオチド配列、ポリペプチド、および／またはリボ核タンパク質が、当該技術において周知の任意の数の方法により、宿主生物またはその細胞中に導入され得る。本発明の方法は、生物の少なくとも１つの細胞の内部にアクセスするだけの、１つまたは複数のヌクレオチド配列、ポリペプチド、および／またはリボ核タンパク質を生物中に導入する特定の方法に依存しない。複数のヌクレオチド配列、ポリペプチド、および／またはリボ核タンパク質が導入されることとなる場合、これらは、単一の核酸構築体の一部として、または別個の核酸構築体としてアセンブルされ得、かつ同じ、または異なる核酸構築体上に位置決めされ得る。したがって、ヌクレオチド配列、ポリペプチド、および／またはリボ核タンパク質は、単一の形質転換事象において、かつ／または別個の形質転換事象において、注目する細胞中に導入され得、または代わりに、妥当な場合、ヌクレオチド配列は、例えば、育種プロトコールの一部として、植物中に組み込まれ得る。一部の実施形態において、細胞は、真核細胞（例えば、哺乳動物、例えばヒト細胞または植物細胞）である。

一部の実施形態において、本発明の核酸構築体（例えば、本発明の操作されたタンパク質をコードするポリヌクレオチド、デアミナーゼをコードするポリヌクレオチド、ならびに／または同上を含むガイド核酸および／もしくは発現カセットおよび／もしくはベクター）は、少なくとも１つの調節配列に作動可能に連結されていてもよく、場合によっては、少なくとも１つの調節配列が、植物内での発現のためにコドン最適化されていてもよい。一部の実施形態において、少なくとも１つの調節配列は、例えば、プロモーター、オペロン、ターミネーター、またはエンハンサーであってよい。一部の実施形態において、少なくとも１つの調節配列は、プロモーターであってよい。一部の実施形態において、調節配列はイントロンであってよい。一部の実施形態において、少なくとも１つの調節配列は、例えば、イントロンと作動可能に結合されたプロモーター、またはイントロンを含むプロモーター領域であってよい。一部の実施形態において、少なくとも１つの調節配列は、例えばユビキチンプロモーターおよびその関連イントロン（例えば、タルウマゴヤシ（Ｍｅｄｉｃａｇｏｔｒｕｎｃａｔｕｌａ）および／またはトウモロコシ（Ｚｅａｍａｙｓ）、ならびにそれらの関連するイントロン）であってよい。一部の実施形態において、少なくとも１つの調節配列は、ターミネーターヌクレオチド配列および／またはエンハンサーヌクレオチド配列であってよい。

一部の実施形態において、本発明の核酸構築体は、プロモーター領域と作動可能に結合されていてよく、プロモーター領域はイントロンを含み、場合によっては、プロモーター領域は、ユビキチンプロモーターおよびイントロン（例えばウマゴヤシ（Ｍｅｄｉｃａｇｏ）属またはトウモロコシユビキチンプロモーターおよびイントロン、例えば、配列番号４８または配列番号４９であってもよい。一部の実施形態において、イントロンを含むプロモーター領域と作動可能に結合された本発明の核酸構築体は、植物内での発現のためにコドン最適化されていてもよい。

一部の実施形態において、本発明の核酸構築体は、注目する１つまたは複数（例えば、１、２、３、４つ、またはそれを超える）のポリペプチドをコードしていてよく、場合によっては、注目する１つまたは複数のポリペプチドは、植物内での発現のためにコドン最適化されていてもよい。一部の実施形態において、操作されたタンパク質は、注目する１つまたは複数（例えば、１、２、３、４つ、またはそれを超える）のポリペプチドを含んでもよい。例えば、操作されたタンパク質の異種ポリペプチドは、注目するポリペプチドを含んでもよいし、これであってもよい。

本発明に有用な注目するポリペプチドとして、以下に限定されないが、デアミナーゼ活性、ニッカーゼ活性、リコンビナーゼ活性、トランスポザーゼ活性、メチラーゼ活性、グリコシラーゼ（ＤＮＡグリコシラーゼ）活性、グリコシラーゼインヒビター活性（例えばウラシル－ＤＮＡグリコシラーゼインヒビター（ＵＧＩ））、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子（ｔｒａｎｓｃｒｉｐｔｉｏｎｒｅｌｅａｓｅｆａｃｔｏｒ）活性、ヒストン修飾活性、ヌクレアーゼ活性、一本鎖ＲＮＡ切断活性、二本鎖ＲＮＡ切断活性、制限酵素活性（例えばＦｏｋ１）、核酸結合活性、メチルトランスフェラーゼ活性、ＤＮＡ修復活性、ＤＮＡ損傷活性、ジスムターゼ活性、アルキル化活性、脱プリン化活性、酸化活性、ピリミジンダイマー形成活性、インテグラーゼ活性、トランスポザーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、核局在化配列もしくは活性、親和性ポリペプチド、ペプチドタグ、および／またはフォトリアーゼ活性を有するポリペプチドまたはタンパク質ドメインが挙げられ得る。一部の実施形態において、注目するポリペプチドは、Ｆｏｋ１ヌクレアーゼまたはウラシル－ＤＮＡグリコシラーゼインヒビターである。核酸（ポリヌクレオチド、発現カセット、および／またはベクター）内にコードされる場合、コードされるポリペプチドまたはタンパク質ドメインは、生物内での発現のためにコドン最適化されていてもよい。一部の実施形態において、注目するポリペプチドは、本発明の操作されたタンパク質、またはＣＲＩＳＰＲ－Ｃａｓ融合タンパク質を提供するためにＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質ドメインに連結されていてもよい。一部の実施形態において、ペプチドタグに連結されたＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質ドメインを含むＣＲＩＳＰＲ－Ｃａｓ融合タンパク質はまた、注目するポリペプチドに連結されていてもよい（例えば、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質ドメインは、例えば、ペプチドタグ（または親和性ポリペプチド）、および例えば注目するポリペプチドの双方に連結されていてもよい）。

一部の実施形態において、本発明の編集系は、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質を含む。本明細書中で用いられる「ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質」は、核酸を切断するか、切るか、もしくはニックを入れ；核酸（例えば、標的核酸および／またはガイド核酸）に結合し；かつ／または本明細書中で規定されるガイド核酸を識別するか、認識するか、もしくはこれに結合するタンパク質またはポリペプチドである。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、酵素（例えば、ヌクレアーゼ、エンドヌクレアーゼ、ニッカーゼその他）であってよく、かつ／または酵素として機能してよい。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼを指す。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、ヌクレアーゼ活性および／もしくはニッカーゼ活性を含み、ヌクレアーゼ活性および／もしくはニッカーゼ活性が引き下げられたか、もしくは除外されたヌクレアーゼドメインを含み、一本鎖ＤＮＡ切断活性（ｓｓＤＮａｓｅ活性）を含み、または引き下げられたか、もしくは除外されたｓｓＤＮａｓｅ活性を有し、かつ／または自己プロセシングＲＮａｓｅ活性を含み、または引き下げられたか、もしくは除外された自己プロセシングＲＮａｓｅ活性を有する。ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、標的核酸に結合してよい。ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、Ｉ、ＩＩ、ＩＩＩ、ＩＶ、Ｖ、またはＶＩ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質であってよい。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、Ｉ型ＣＲＩＳＰＲ－Ｃａｓ系、ＩＩ型ＣＲＩＳＰＲ－Ｃａｓ系、ＩＩＩ型ＣＲＩＳＰＲ－Ｃａｓ系、ＩＶ型ＣＲＩＳＰＲ－Ｃａｓ系、Ｖ型ＣＲＩＳＰＲ－Ｃａｓ系、またはＶＩ型ＣＲＩＳＰＲ－Ｃａｓ系由来であってよい。一部の実施形態において、本発明のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、ＩＩ型ＣＲＩＳＰＲ－Ｃａｓ系またはＶ型ＣＲＩＳＰＲ－Ｃａｓ系由来であってよい。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、ＩＩ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、例えばＣａｓ９エフェクタータンパク質であってよい。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、例えばＣａｓ１２エフェクタータンパク質であってよい。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、Ｃａｓ１２ａであってよく、そして場合によっては、配列番号５０～６６のいずれか１つのアミノ酸配列および／または配列番号６７～６９のいずれか１つのヌクレオチド配列を有してもよい。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、活性Ｃａｓ１２ａであってよく、そして場合によっては、配列番号５８のアミノ酸配列を有してもよい。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、不活性（すなわち、死んだ（ｄｅａｄ））Ｃａｓ１２ａであってよく、そして場合によっては、配列番号５０のアミノ酸配列を有してもよい。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、Ｃａｓ１２ｂであってよく、そして場合によっては、配列番号１５１のアミノ酸配列を有してもよい。

例示的なＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質として、以下に限定されないが、Ｃａｓ９、Ｃ２ｃ１、Ｃ２ｃ３、Ｃａｓ１２ａ（Ｃｐｆ１とも称される）、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１２ｄ、Ｃａｓ１２ｅ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、Ｃａｓ１３ｄ、Ｃａｓｌ、ＣａｓｌＢ、Ｃａｓ２、Ｃａｓ３、Ｃａｓ３’、Ｃａｓ３”、Ｃａｓ４、Ｃａｓ５、Ｃａｓ６、Ｃａｓ７、Ｃａｓ８、Ｃａｓ９（ＣｓｎｌおよびＣｓｘ１２としても知られている）、Ｃａｓ１０、Ｃｓｙｌ、Ｃｓｙ２、Ｃｓｙ３、Ｃｓｅｌ、Ｃｓｅ２、Ｃｓｃｌ、Ｃｓｃ２、Ｃｓａ５、Ｃｓｎ２、Ｃｓｍ２、Ｃｓｍ３、Ｃｓｍ４、Ｃｓｍ５、Ｃｓｍ６、Ｃｍｒｌ、Ｃｍｒ３、Ｃｍｒ４、Ｃｍｒ５、Ｃｍｒ６、Ｃｓｂｌ、Ｃｓｂ２、Ｃｓｂ３、Ｃｓｘｌ７、Ｃｓｘｌ４、Ｃｓｘ１０、Ｃｓｘ１６、ＣｓａＸ、Ｃｓｘ３、Ｃｓｘｌ、Ｃｓｘｌ５、Ｃｓｆｌ、Ｃｓｆ２、Ｃｓｆ３、Ｃｓｆ４（ｄｉｎＧ）、および／またはＣｓｆ５ヌクレアーゼが挙げられ、場合によっては、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、Ｃａｓ９、Ｃａｓ１２ａ（Ｃｐｆ１）、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ（Ｃ２ｃ３）、Ｃａｓ１２ｄ（ＣａｓＹ）、Ｃａｓ１２ｅ（ＣａｓＸ）、Ｃａｓ１２ｇ、Ｃａｓ１２ｈ、Ｃａｓ１２ｉ、Ｃ２ｃ４、Ｃ２ｃ５、Ｃ２ｃ８、Ｃ２ｃ９、Ｃ２ｃ１０、Ｃａｓ１４ａ、Ｃａｓ１４ｂ，および／またはＣａｓ１４ｃエフェクタータンパク質であってよい。

一部の実施形態において、本発明に有用なＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、そのヌクレアーゼ活性部位および／またはヌクレアーゼドメイン（例えば、ＲｕｖＣ、ＨＮＨ、例えばＣａｓ１２ａヌクレアーゼドメインのＲｕｖＣ部位；例えば、Ｃａｓ９ヌクレアーゼドメインのＲｕｖＣ部位および／またはＨＮＨ部位）内に変異を含んでもよい。ヌクレアーゼ活性部位および／またはヌクレアーゼドメイン内に変異を有するので、もはやヌクレアーゼ活性を含まないＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、一般的に、「不活性」または「死んだ」、例えばｄＣａｓ９と称される。一部の実施形態において、ヌクレアーゼ活性部位および／またはヌクレアーゼドメイン内に変異を有するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、変異のない同じＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質と比較して、活性が損なわれているか、または活性（例えばニッカーゼ活性）が引き下げられていてよい。

本発明に有用なＣＲＩＳＰＲＣａｓ９エフェクタータンパク質またはＣａｓ９は、知られているか、または後に同定されるあらゆるＣａｓ９ヌクレアーゼであってよい。一部の実施形態において、本発明のＣａｓ９は、例えば、連鎖球菌（Ｓｔｒｅｐｔｏｃｏｃｃｕｓ）属種（例えば、化膿連鎖球菌（Ｓ．ｐｙｏｇｅｎｅｓ）、Ｓ．サーモフィルス（Ｓ．ｔｈｅｒｍｏｐｈｉｌｕｓ））、ラクトバチルス（Ｌａｃｔｏｂａｃｉｌｌｕｓ）属種、ビフィドバクテリウム（Ｂｉｆｉｄｏｂａｃｔｅｒｉｕｍ）属種、カンドレリア（Ｋａｎｄｌｅｒｉａ）属種、リューコノストック（Ｌｅｕｃｏｎｏｓｔｏｃ）属種、オエノコッカス（Ｏｅｎｏｃｏｃｃｕｓ）属種、ペディオコッカス（Ｐｅｄｉｏｃｏｃｃｕｓ）属種、ワイセラ（Ｗｅｉｓｓｅｌｌａ）属種、および／またはオルセネラ（Ｏｌｓｅｎｅｌｌａ）属種由来のタンパク質であってよい。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、Ｃａｓ９であってよく、そして場合によっては、配列番号７０～８０もしくは１４０～１４３のいずれか１つのヌクレオチド配列、および／または配列番号８１～８２のいずれか１つのアミノ酸配列を有してもよい。

一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、化膿連鎖球菌に由来するＣａｓ９であってよく、かつ／またはＰＡＭ配列モチーフＮＧＧ、ＮＡＧ、ＮＧＡを認識し得る（Ｍａｌｉｅｔａｌ，Ｓｃｉｅｎｃｅ２０１３；３３９（６１２１）：８２３－８２６）。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、ストレプトコッカス・サーモフィルス（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｔｈｅｒｍｏｐｈｉｌｅｓ）に由来するＣａｓ９であってよく、かつ／またはＰＡＭ配列モチーフＮＧＧＮＧおよび／もしくはＮＮＡＧＡＡＷ（Ｗ＝ＡまたはＴ）を認識し得る（例えば、Ｈｏｒｖａｔｈｅｔａｌ，Ｓｃｉｅｎｃｅ，２０１０；３２７（５９６２）：１６７－１７０、およびＤｅｖｅａｕｅｔａｌ，ＪＢａｃｔｅｒｉｏｌ２００８；１９０（４）：１３９０－１４００参照）。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、ストレプトコッカス・ミュータンス（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｍｕｔａｎｓ）に由来するＣａｓ９であってよく、かつ／またはＰＡＭ配列モチーフＮＧＧおよび／またはＮＡＡＲ（Ｒ＝ＡまたはＧ）を認識し得る（例えば、Ｄｅｖｅａｕｅｔａｌ，ＪＢＡＣＴＥＲＩＯＬ２００８；１９０（４）：１３９０－１４００参照）。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、ストレプトコッカス・アウレウス（Ｓｔｒｅｐｔｏｃｏｃｃｕｓａｕｒｅｕｓ）に由来するＣａｓ９であってよく、かつ／またはＰＡＭ配列モチーフＮＮＧＲＲ（Ｒ＝ＡまたはＧ）を認識し得る。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、黄色ブドウ球菌（Ｓ．ａｕｒｅｕｓ）に由来するＣａｓ９であってよく、かつ／またはＰＡＭ配列モチーフＮＧＲＲＴ（Ｒ＝ＡまたはＧ）を認識し得る。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、黄色ブドウ球菌に由来するＣａｓ９であってよく、かつ／またはＰＡＭ配列モチーフＮＧＲＲＶ（Ｒ＝ＡまたはＧ）を認識し得る。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、髄膜炎菌（Ｎｅｉｓｓｅｒｉａｍｅｎｉｎｇｉｔｉｄｉｓ）に由来するＣａｓ９であってよく、かつ／またはＰＡＭ配列モチーフＮＧＡＴＴまたはＮＧＣＴＴ（Ｒ＝ＡまたはＧ、Ｖ＝Ａ、Ｇ、またはＣ）を認識し得る（例えば、Ｈｏｕｅｔａｈ，ＰＮＡＳ２０１３，１－６参照）。この段落内の上述の実施形態において、ＰＡＭ配列モチーフ内のＮは、あらゆるヌクレオチド残基、例えば、Ａ、Ｇ、Ｃ、またはＴのいずれでもあり得る。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、レプトトリキア・シャーイイ（Ｌｅｐｔｏｔｒｉｃｈｉａｓｈａｈｉｉ）に由来するＣａｓ１３ａであってよく、かつ／または標的核酸内に位置決めされている場合がある、単一の３’Ａ、Ｕ、もしくはＣのプロトスペーサーフランキング配列（ＰＦＳ）（またはＲＮＡＰＡＭ（ｒＰＡＭ））配列モチーフを認識し得る。

本発明の実施形態に有用なＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、あらゆるＶ型ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼであり得る。例示的なＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質として、以下に限定されないが、Ｃａｓ１２ａ（Ｃｐｆ１）、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ（Ｃ２ｃ３）、Ｃａｓ１２ｄ（ＣａｓＹ）、Ｃａｓ１２ｅ（ＣａｓＸ）、Ｃａｓ１２ｇ、Ｃａｓ１２ｈ、Ｃａｓ１２ｉ、Ｃ２ｃ１、Ｃ２ｃ４、Ｃ２ｃ５、Ｃ２ｃ８、Ｃ２ｃ９、Ｃ２ｃ１０、Ｃａｓ１４ａ、Ｃａｓ１４ｂ，および／またはＣａｓ１４ｃヌクレアーゼが挙げられる。一部の実施形態において、Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、Ｃａｓ１２ａであってよい。一部の実施形態において、Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、ニッカーゼ、場合によっては、Ｃａｓ１２ａニッカーゼであってよい。一部の実施形態において、Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、Ｃａｓ１２ｂ（例えば配列番号１５１）であってよい。

一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、Ｖ型ＣｌｕｓｔｅｒｅｄＲｅｇｕｌａｒｌｙＩｎｔｅｒｓｐａｃｅｄＳｈｏｒｔＰａｌｉｎｄｒｏｍｉｃＲｅｐｅａｔ（ＣＲＩＳＰＲ）－Ｃａｓヌクレアーゼであってよい。Ｃａｓ１２ａは、より周知のＩＩ型ＣＲＩＳＰＲＣａｓ９ヌクレアーゼとはいくつかの点で異なる。例えば、Ｃａｓ９は、ガイドＲＮＡ（ｇＲＮＡ、ｓｇＲＮＡ、ｃｒＲＮＡ、ｃｒＤＮＡ、ＣＲＩＳＰＲアレイ）結合部位（プロトスペーサ、標的核酸、標的ＤＮＡ）に対して３’側のＧリッチプロトスペーサ隣接モチーフ（ＰＡＭ）（３’－ＮＧＧ）を認識する一方、Ｃａｓ１２ａは、標的核酸に対して５’側に位置決めされているＴリッチＰＡＭ（５’－ＴＴＮ、５’－ＴＴＴＮ）を認識する。実際、Ｃａｓ９およびＣａｓ１２ａが、それらのガイドＲＮＡに結合する向きは、それらのＮ末端およびＣ末端に関して、大半逆である。さらに、Ｃａｓ１２ａ酵素は、天然のＣａｓ９系において見出されるデュアルガイドＲＮＡ（ｓｇＲＮＡ（例えば、ｃｒＲＮＡおよびｔｒａｃｒＲＮＡ））ではなく単一のガイドＲＮＡ（ｇＲＮＡ、ＣＲＩＳＰＲアレイ、ｃｒＲＮＡ）を用い、そしてＣａｓ１２ａは、それ自体のｇＲＮＡをプロセシングする。加えて、Ｃａｓ１２ａヌクレアーゼ活性は、Ｃａｓ９ヌクレアーゼ活性によって生成される平滑末端の代わりに、スタガーＤＮＡ二本鎖切断を生成し、そしてＣａｓ１２ａは、単一のＲｕｖＣドメインに依存して、ＤＮＡ鎖の双方を切断するが、Ｃａｓ９は、ＨＮＨドメインおよびＲｕｖＣドメインを切断に利用する。

本発明に有用なＣＲＩＳＰＲＣａｓ１２ａエフェクタータンパク質は、知られているか、または後に同定されるあらゆるＣａｓ１２ａ（以前にＣｐｆ１として知られている）（例えば、米国特許第９，７９０，４９０号（Ｃｐｆ１（Ｃａｓ１２ａ）配列の開示が参照によって組み込まれる）参照）であってよい。用語「Ｃａｓ１２ａ」は、ヌクレアーゼ活性を有し得るＲＮＡガイドタンパク質を指し、当該タンパク質は、ガイド核酸結合ドメイン、および活性であるか、不活性であるか、または部分的に活性であるＤＮＡ切断ドメインを含み、よって、Ｃａｓ１２ａのＲＮＡガイドヌクレアーゼ活性は、それぞれ、活性であり得るか、不活性であり得るか、または部分的に活性であり得る。一部の実施形態において、本発明に有用なＣａｓ１２ａは、ヌクレアーゼ活性部位（例えば、Ｃａｓ１２ａドメインのＲｕｖＣ部位）内に変異を含んでもよい。そのヌクレアーゼドメインおよび／またはヌクレアーゼ活性部位内に変異を有するので、もはやヌクレアーゼ活性を含まないＣａｓ１２ａは、一般に、ｄｅａｄＣａｓ１２ａ（例えばｄＣａｓ１２ａ）と称される。一部の実施形態において、ヌクレアーゼドメインおよび／またはヌクレアーゼ活性部位内に変異を有するＣａｓ１２ａは、活性が損なわれていてよく、例えば、ニッカーゼ活性が引き下げられていてよい。

一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、生物内での、例えば、動物（例えば、ヒト等の哺乳動物）、植物、真菌、古細菌、または細菌内での発現のために最適化されていてもよい。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、Ｃａｓ１２ａポリペプチド／ドメインまたはＣａｓ９ポリペプチド／ドメイン）は、植物内での発現のために最適化されていてもよい。

塩基編集に有用なあらゆるデアミナーゼドメイン／ポリペプチドが、本発明に用いられてよい。本明細書中で用いられる「シトシンデアミナーゼ」および「シチジンデアミナーゼ」は、ポリペプチドまたはそのドメインが、シトシン塩基からアミン基の除去を触媒するか、または触媒することができる点で、シトシン脱アミノを触媒するか、または触媒することができるポリペプチドまたはドメインを指す。ゆえに、シトシンデアミナーゼは、シトシンの、（ウラシル中間体を介した）チミジンへの変換をもたらして、ＣからＴの変換を引き起こし、またはゲノム内の相補鎖内で、ＧからＡへの変換を引き起こし得る。ゆえに、一部の実施形態において、本発明のポリヌクレオチドによってコードされるシトシンデアミナーゼは、標的核酸のセンス（例えば、「＋」、鋳型）鎖内のＣ→Ｔ変換、または標的核酸のアンチセンス（例えば、「－」、相補）鎖内のＧ→Ａ変換を生成する。一部の実施形態において、本発明のポリヌクレオチドによってコードされるシトシンデアミナーゼは、ゲノム内の相補鎖内でのＣからＴ、Ｇ、またはＡへの変換を生成する。

本発明に有用なシトシンデアミナーゼは、あらゆる生物由来の、知られているか、または後に同定されるあらゆるシトシンデアミナーゼであってよい（例えば、米国特許第１０，１６７，４５７号およびＴｈｕｒｏｎｙｉｅｔａｌ．Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．３７：１０７０－１０７９（２０１９）（これらは各々、シトシンデアミナーゼの開示が参照によって本明細書中に組み込まれる））。シトシンデアミナーゼは、シチジンまたはデオキシシチジンの、それぞれウリジンまたはデオキシウリジンへの加水分解脱アミノを触媒することができる。ゆえに、一部の実施形態において、本発明に有用なデアミナーゼまたはデアミナーゼドメインは、シトシンの、ウラシルへの加水分解脱アミノを触媒するシチジンデアミナーゼドメインであってよい。一部の実施形態において、シトシンデアミナーゼは、以下に限定されないが、霊長類（例えば、ヒト、サル、チンパンジー、ゴリラ）、イヌ、ウシ、ラット、またはマウスが挙げられる、天然に存在するシトシンデアミナーゼのバリアントであってよい。ゆえに、一部の実施形態において、本発明に有用なシトシンデアミナーゼは、野生型シトシンデアミナーゼに対して約７０％～約１００％同一（例えば、天然に存在するシトシンデアミナーゼに対して約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、または１００％同一、そしてそれらの中のあらゆる範囲または値）であってよい。

一部の実施形態において、本発明に有用なシトシンデアミナーゼは、アポリポタンパク質ＢｍＲＮＡ編集複合体（ＡＰＯＢＥＣ）ファミリーデアミナーゼであってよい。一部の実施形態において、シトシンデアミナーゼは、ＡＰＯＢＥＣ１デアミナーゼ、ＡＰＯＢＥＣ２デアミナーゼ、ＡＰＯＢＥＣ３Ａデアミナーゼ、ＡＰＯＢＥＣ３Ｂデアミナーゼ、ＡＰＯＢＥＣ３Ｃデアミナーゼ、ＡＰＯＢＥＣ３Ｄデアミナーゼ、ＡＰＯＢＥＣ３Ｆデアミナーゼ、ＡＰＯＢＥＣ３Ｇデアミナーゼ、ＡＰＯＢＥＣ３Ｈデアミナーゼ、ＡＰＯＢＥＣ４デアミナーゼ、ヒト活性化誘導デアミナーゼ（ｈＡＩＤ）、ｒＡＰＯＢＥＣ１、ＦＥＲＮＹ、および／またはＣＤＡ１、場合によってはｐｍＣＤＡ１、ａｔＣＤＡ１（例えばＡｔ２ｇ１９５７０）、および同上の進化バージョンであってよい。進化デアミナーゼは、例えば、米国特許第１０，１１３，１６３号、Ｇａｕｄｅｌｌｉｅｔａｌ．Ｎａｔｕｒｅ５５１（７６８１）：４６４－４７１（２０１７）、およびＴｈｕｒｏｎｙｉｅｔａｌ．（ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ３７：１０７０－１０７９（２０１９）（これらは各々、デアミナーゼおよび進化デアミナーゼの開示が参照によって本明細書に組み込まれる）において開示されている。一部の実施形態において、シトシンデアミナーゼは、配列番号８３のアミノ酸配列を有するＡＰＯＢＥＣ１デアミナーゼであってよい。一部の実施形態において、シトシンデアミナーゼは、配列番号８４のアミノ酸配列を有するＡＰＯＢＥＣ３Ａデアミナーゼであってよい。一部の実施形態において、シトシンデアミナーゼは、ＣＤＡ１デアミナーゼ、場合によっては配列番号８５のアミノ酸配列を有するＣＤＡ１であってよい。一部の実施形態において、シトシンデアミナーゼは、ＦＥＲＮＹデアミナーゼ、場合によっては配列番号８６のアミノ酸配列を有するＦＥＲＮＹであってよい。一部の実施形態において、シトシンデアミナーゼは、ｒＡＰＯＢＥＣ１デアミナーゼ、場合によっては配列番号８７のアミノ酸配列を有するｒＡＰＯＢＥＣ１デアミナーゼであってよい。一部の実施形態において、シトシンデアミナーゼは、ｈＡＩＤデアミナーゼ、場合によっては配列番号８８または配列番号８９のアミノ酸配列を有するｈＡＩＤであってよい。一部の実施形態において、本発明に有用なシトシンデアミナーゼは、天然に存在するシトシンデアミナーゼ（例えば「進化デアミナーゼ」）のアミノ酸配列に対して約７０％～約１００％同一（例えば、７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、９９．５％または１００％同一）であってよい（例えば、配列番号９０、配列番号９１、配列番号９２参照）。一部の実施形態において、本発明に有用なシトシンデアミナーゼは、配列番号８３～９２のいずれか１つのアミノ酸配列に対して約７０％～約９９．５％同一（例えば、約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、または９９．５％同一）（例えば、配列番号８３～９２のいずれか１つのアミノ酸配列に対して少なくとも８０％、少なくとも８５％、少なくとも９０％、少なくとも９２％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、少なくとも９９％、または少なくとも９９．５％同一）であってよい。一部の実施形態において、シトシンデアミナーゼをコードするポリヌクレオチドは、植物内での発現のためにコドン最適化されていてもよく、そしてコドン最適化ポリペプチドは、参照ポリヌクレオチドに対して約７０％～９９．５％同一であってよい。

本明細書中で用いられる「アデニンデアミナーゼ」および「アデノシンデアミナーゼ」は、アデニンまたはアデノシンの加水分解脱アミノ（例えば、アデニンからのアミン基の除去）を触媒するか、または触媒することができるポリペプチドまたはそのドメインを指す。一部の実施形態において、アデニンデアミナーゼは、アデノシンまたはデオキシアデノシンの、それぞれイノシンまたはデオキシイノシンへの加水分解脱アミノを触媒し得る。一部の実施形態において、アデノシンデアミナーゼは、ＤＮＡ内のアデニンまたはアデノシンの加水分解脱アミノを触媒し得る。一部の実施形態において、本発明の核酸構築体によってコードされるアデニンデアミナーゼは、標的核酸のセンス（例えば、「＋」、鋳型）鎖内のＡ→Ｇ変換、または標的核酸のアンチセンス（例えば、「－」、相補）鎖内のＴ→Ｃ変換を生成し得る。本発明に有用なアデニンデアミナーゼは、あらゆる生物由来の、知られているか、または後に同定されるあらゆるアデニンデアミナーゼであってよい（例えば、米国特許第１０，１１３，１６３号参照（これは、アデニンデアミナーゼの開示が参照によって本明細書に組み込まれる））。

一部の実施形態において、アデノシンデアミナーゼは、天然に存在するアデニンデアミナーゼのバリアントであってよい。ゆえに、一部の実施形態において、アデノシンデアミナーゼは、野生型アデニンデアミナーゼに対して約７０％～１００％同一（例えば、天然に存在するアデニンデアミナーゼに対して約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、または１００％同一、そしてそれらの中のあらゆる範囲または値）であってよい。一部の実施形態において、デアミナーゼまたはデアミナーゼは、自然界に存在せず、操作されたか、変異したか、または進化したアデノシンデアミナーゼと称され得る。ゆえに、例えば、操作されたか、変異したか、または進化したアデニンデアミナーゼポリペプチドまたはアデニンデアミナーゼドメインは、天然に存在するアデニンデアミナーゼポリペプチド／ドメインに対して約７０％～９９．９％同一（例えば、天然に存在するアデニンデアミナーゼポリペプチドまたはアデニンデアミナーゼドメインに対して約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、９９．１％、９９．２％、９９．３％、９９．４％、９９．５％、９９．６％、９９．７％、９９．８％または９９．９％同一、そしてそれらの中のあらゆる範囲または値）であってよい。一部の実施形態において、アデノシンデアミナーゼは、細菌（例えば、大腸菌、黄色ブドウ球菌、インフルエンザ菌（Ｈａｅｍｏｐｈｉｌｕｓｉｎｆｌｕｅｎｚａｅ）、カウロバクター・クレセンタス（Ｃａｕｌｏｂａｃｔｅｒｃｒｅｓｃｅｎｔｕｓ）等）由来であってもよい。一部の実施形態において、アデニンデアミナーゼポリペプチド／ドメインをコードするポリヌクレオチドは、植物内での発現のためにコドン最適化されていてもよい。

一部の実施形態において、アデニンデアミナーゼドメインは、野生型ｔＲＮＡ特異的アデノシンデアミナーゼドメイン、例えばｔＲＮＡ特異的アデノシンデアミナーゼ（ＴａｄＡ）、および／または変異／進化アデノシンデアミナーゼドメイン、例えば変異／進化ｔＲＮＡ特異的アデノシンデアミナーゼドメイン（ＴａｄＡ^＊）であってもよい。一部の実施形態において、ＴａｄＡドメインは、大腸菌由来であってもよい。一部の実施形態において、ＴａｄＡは、全長ＴａｄＡに対して修飾された、例えば、トランケートされた、欠けた１つまたは複数のＮ末端および／またはＣ末端アミノ酸であってよい（例えば、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、６、１７、１８、１９、または２０個のＮ末端および／またはＣ末端アミノ酸残基が、全長ＴａｄＡと比較して、欠けていてもよい）。一部の実施形態において、ＴａｄＡポリペプチドまたはＴａｄＡドメインは、Ｎ末端メチオニンを含まない。一部の実施形態において、野生型大腸菌ＴａｄＡは、配列番号９３のアミノ酸配列を含む。一部の実施形態において、変異／進化大腸菌ＴａｄＡ^＊は、配列番号９４～９７のいずれか１つのアミノ酸配列を含む。一部の実施形態において、ＴａｄＡ／ＴａｄＡ^＊をコードするポリヌクレオチドは、植物内での発現のためにコドン最適化されていてもよい。一部の実施形態において、アデニンデアミナーゼは、配列番号９８～１０３のいずれか１つのアミノ酸配列の全てまたは部分を含んでもよい。一部の実施形態において、アデニンデアミナーゼは、配列番号９３～１０３のいずれか１つのアミノ酸配列の全てまたは部分を含んでもよい。

一部の実施形態において、本発明の核酸構築体はさらに、グリコシラーゼインヒビター（例えば、ウラシル－ＤＮＡグリコシラーゼインヒビター等のウラシルグリコシラーゼインヒビター（ＵＧＩ））をコードしていてもよい。一部の実施形態において、本発明は、操作されたタンパク質およびＵＧＩを含む融合タンパク質、ならびに／または同上をコードする１つもしくは複数のポリヌクレオチドを提供し、場合によっては、１つまたは複数のポリヌクレオチドは、植物内での発現のためにコドン最適化されていてもよい。

本発明に有用な「ウラシルグリコシラーゼインヒビター」は、ウラシル－ＤＮＡグリコシラーゼ塩基－切除修復酵素を阻害することができるあらゆるタンパク質またはポリペプチドであってもよい。一部の実施形態において、ＵＧＩドメインは、野生型ＵＧＩまたはその断片を含む。一部の実施形態において、本発明に有用なＵＧＩドメインは、天然に存在するＵＧＩドメインのアミノ酸配列に対して約７０％～約１００％同一（例えば、７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、９９．５％、または１００％同一、そしてそれらの中のあらゆる範囲または値）であってよい。一部の実施形態において、ＵＧＩドメインは、配列番号１０４のアミノ酸配列、または配列番号１０４のアミノ酸配列に対して約７０％～約９９．５％の同一性を有する（例えば、配列番号１０４のアミノ酸配列に対して少なくとも８０％、少なくとも８５％、少なくとも９０％、少なくとも９２％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、少なくとも９９％、または少なくとも９９．５％同一である）ポリペプチドを含んでもよい。例えば、一部の実施形態において、ＵＧＩドメインは、配列番号１０４のアミノ酸配列の連続ヌクレオチドの部分と１００％同一の、配列番号１０４のアミノ酸配列の断片（例えば、１０、１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０個の連続ヌクレオチド；例えば、約１０、１５、２０、２５、３０、３５、４０、４５～約５０、５５、６０、６５、７０、７５、８０個の連続ヌクレオチド）を含んでもよい。一部の実施形態において、ＵＧＩドメインは、知られているＵＧＩに対して約７０％～約９９．５％の同一性を有する（例えば、７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、９９．５％同一、そしてそれらの中のあらゆる範囲または値）、知られているＵＧＩのバリアント（例えば配列番号１０４）であってもよい。一部の実施形態において、ＵＧＩをコードするポリヌクレオチドは、植物（例えば植物）内での発現のためにコドン最適化されていてよく、そしてコドン最適化されたポリペプチドは、参照ポリヌクレオチドに対して、約７０％～約９９．５％同一であってよい。

操作されたタンパク質は、標的核酸を修飾するように操作されたタンパク質と機能するように設計されているガイド核酸（例えば、ガイドＲＮＡ（ｇＲＮＡ）、ＣＲＩＳＰＲアレイ、ＣＲＩＳＰＲＲＮＡ、ｃｒＲＮＡ）と組み合わせて用いられてもよい。本発明に有用なガイド核酸は、少なくとも１つのスペーサー配列および少なくとも１つの反復配列を含んでもよい。ガイド核酸は、操作されたタンパク質と（例えば、操作されたタンパク質のヌクレアーゼドメインと）複合体を形成することができ、そしてスペーサー配列は、標的核酸にハイブリダイズすることができ、これによって、複合体を標的核酸にガイドし、標的核酸は、デアミナーゼ（例えば、場合によっては複合体中に存在し、かつ／またはこれに動員される、シトシンデアミナーゼおよび／またはアデニンデアミナーゼ）によって修飾（例えば、切断または編集）かつ／または調節され得る（例えば、転写を調節する）。

一部の実施形態において、Ｃａｓ９ドメインを含む操作されたタンパク質（または同上をコードする核酸構築体）は、Ｃａｓ９ガイド核酸と組み合わせて、標的核酸を修飾するのに用いられてもよく、そしてデアミナーゼ（例えば、シトシンおよび／またはアデニン）は、操作されたタンパク質に連結されていてもよいし、これと複合体を形成してもよい。シトシンデアミナーゼは、標的核酸内のシトシン塩基を脱アミノ化することによって、標的核酸を編集する。アデニンデアミナーゼは、標的核酸内のアデノシン塩基を脱アミノ化することによって、標的核酸を編集する。

同様に、操作されたタンパク質は、Ｃａｓ１２ａドメイン（または他の選択されたＣＲＩＳＰＲ－Ｃａｓヌクレアーゼ、例えば、Ｃ２ｃ１、Ｃ２ｃ３、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１２ｄ、Ｃａｓ１２ｅ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、Ｃａｓ１３ｄ、Ｃａｓｌ、ＣａｓｌＢ、Ｃａｓ２、Ｃａｓ３、Ｃａｓ３’、Ｃａｓ３”、Ｃａｓ４、Ｃａｓ５、Ｃａｓ６、Ｃａｓ７、Ｃａｓ８、Ｃａｓ９（ＣｓｎｌおよびＣｓｘ１２としても知られている）、Ｃａｓ１０、Ｃｓｙｌ、Ｃｓｙ２、Ｃｓｙ３、Ｃｓｅｌ、Ｃｓｅ２、Ｃｓｃｌ、Ｃｓｃ２、Ｃｓａ５、Ｃｓｎ２、Ｃｓｍ２、Ｃｓｍ３、Ｃｓｍ４、Ｃｓｍ５、Ｃｓｍ６、Ｃｍｒｌ、Ｃｍｒ３、Ｃｍｒ４、Ｃｍｒ５、Ｃｍｒ６、Ｃｓｂｌ、Ｃｓｂ２、Ｃｓｂ３、Ｃｓｘｌ７、Ｃｓｘｌ４、Ｃｓｘ１０、Ｃｓｘ１６、ＣｓａＸ、Ｃｓｘ３、Ｃｓｘｌ、Ｃｓｘｌ５、Ｃｓｆｌ、Ｃｓｆ２、Ｃｓｆ３、Ｃｓｆ４（ｄｉｎＧ）、および／またはＣｓｆ５）を含んでもよく、これは、シトシンデアミナーゼドメインおよび／またはアデニンデアミナーゼドメインとの複合体を形成してもよいし、これに連結されていてもよく、そしてＣａｓ１２ａガイド核酸（または他の選択されたＣＲＩＳＰＲ－Ｃａｓヌクレアーゼのためのガイド核酸）と組み合わせて、標的核酸を修飾するのに用いられてもよく、融合タンパク質のシトシンデアミナーゼドメインまたはアデニンデアミナーゼドメインはそれぞれ、標的核酸内のシトシン塩基またはアデノシン塩基を脱アミノ化することによって、標的核酸を編集する。

本明細書中で用いられる「ガイド核酸」、「ガイドＲＮＡ」、「ｇＲＮＡ」、「ＣＲＩＳＰＲＲＮＡ／ＤＮＡ」、「ｃｒＲＮＡ」、または「ｃｒＤＮＡ」は、少なくとも１つのスペーサー配列を含む核酸を意味し、これは、標的ＤＮＡ（例えばプロトスペーサー）、および少なくとも１つの反復配列（例えば、Ｖ型Ｃａｓ１２ａＣＲＩＳＰＲ－Ｃａｓ系の反復、またはその断片もしくは部分；ＩＩ型Ｃａｓ９ＣＲＩＳＰＲ－Ｃａｓ系の反復またはその断片；Ｖ型Ｃ２ｃ１ＣＲＩＳＰＲＣａｓ系の反復またはその断片；例えば、Ｃ２ｃ３、Ｃａｓ１２ａ（Ｃｐｆ１とも称される）、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１２ｄ、Ｃａｓ１２ｅ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、Ｃａｓ１３ｄ、Ｃａｓｌ、ＣａｓｌＢ、Ｃａｓ２、Ｃａｓ３、Ｃａｓ３’、Ｃａｓ３”、Ｃａｓ４、Ｃａｓ５、Ｃａｓ６、Ｃａｓ７、Ｃａｓ８、Ｃａｓ９（ＣｓｎｌおよびＣｓｘ１２としても知られている）、Ｃａｓ１０、Ｃｓｙｌ、Ｃｓｙ２、Ｃｓｙ３、Ｃｓｅｌ、Ｃｓｅ２、Ｃｓｃｌ、Ｃｓｃ２、Ｃｓａ５、Ｃｓｎ２、Ｃｓｍ２、Ｃｓｍ３、Ｃｓｍ４、Ｃｓｍ５、Ｃｓｍ６、Ｃｍｒｌ、Ｃｍｒ３、Ｃｍｒ４、Ｃｍｒ５、Ｃｍｒ６、Ｃｓｂｌ、Ｃｓｂ２、Ｃｓｂ３、Ｃｓｘｌ７、Ｃｓｘｌ４、Ｃｓｘ１０、Ｃｓｘ１６、ＣｓａＸ、Ｃｓｘ３、Ｃｓｘｌ、Ｃｓｘｌ５、Ｃｓｆｌ、Ｃｓｆ２、Ｃｓｆ３、Ｃｓｆ４（ｄｉｎＧ）、および／もしくはＣｓｆ５、またはそれらの断片のＣＲＩＳＰＲ－Ｃａｓ系の反復）と相補的であり（かつこれにハイブリダイズし）、反復配列は、スペーサー配列の５’末端および／または３’末端に連結されていてもよい。一部の実施形態において、ガイド核酸はＤＮＡを含む。一部の実施形態において、ガイド核酸はＲＮＡを含む（例えば、ガイドＲＮＡである）。本発明のｇＲＮＡの設計は、Ｉ型、ＩＩ型、ＩＩＩ型、ＩＶ型、Ｖ型、またはＶＩ型ＣＲＩＳＰＲ－Ｃａｓ系に基づいてもよい。

一部の実施形態において、Ｃａｓ１２ａｇＲＮＡは、５’側から３’側に、反復配列（全長またはその部分（「ハンドル」）；例えばシュードノット様構造）およびスペーサー配列を含んでもよい。

一部の実施形態において、ガイド核酸は、複数の反復配列－スペーサー配列（例えば、２、３、４、５、６、７、８、９、１０個、またはそれを超える反復－スペーサー配列）（例えば反復－スペーサー－反復、例えば、反復－スペーサー－反復－スペーサー－反復－スペーサー－反復－スペーサー－反復－スペーサー等）を含んでもよい。本発明のガイド核酸は、合成的であり、人工的であり、かつ自然界に見出されない。ｇＲＮＡは、非常に長い場合があり、アプタマー（ＭＳ２動員戦略におけるような）、またはスペーサーからぶら下がる他のＲＮＡ構造として用いられてもよい。

本明細書中で用いられる「反復配列」は、例えば、野生型ＣＲＩＳＰＲＣａｓ遺伝子座（例えば、Ｃａｓ９遺伝子座、Ｃａｓ１２ａ遺伝子座、Ｃ２ｃ１遺伝子座その他）のあらゆる反復配列、または本発明の核酸構築体によってコードされるＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質により機能的な合成ｃｒＲＮＡの反復配列を指す。本発明に有用な反復配列は、ＣＲＩＳＰＲ－Ｃａｓ遺伝子座（例えば、Ｉ型、ＩＩ型、ＩＩＩ型、ＩＶ型、Ｖ型、またはＶＩ型）の知られているか、または後に同定されるあらゆる反復配列であってもよいし、Ｉ、ＩＩ、ＩＩＩ、ＩＶ、Ｖ、またはＶＩ型ＣＲＩＳＰＲ－Ｃａｓ系において機能するように設計された合成反復であってもよい。反復配列は、ヘアピン構造および／またはステムループ構造を含んでもよい。一部の実施形態において、反復配列は、その５’末端にてシュードノット様構造（すなわち、「ハンドル」）を形成してもよい。ゆえに、一部の実施形態において、反復配列は、野生型Ｉ型ＣＲＩＳＰＲ－Ｃａｓ遺伝子座、ＩＩ型ＣＲＩＳＰＲ－Ｃａｓ遺伝子座、ＩＩＩ型ＣＲＩＳＰＲ－Ｃａｓ遺伝子座、ＩＶ型ＣＲＩＳＰＲ－Ｃａｓ遺伝子座、Ｖ型ＣＲＩＳＰＲ－Ｃａｓ遺伝子座、および／またはＶＩ型ＣＲＩＳＰＲ－Ｃａｓ遺伝子座由来の反復配列と同一であり得るか、または実質的に同一であり得る。野生型ＣＲＩＳＰＲ－Ｃａｓ遺伝子座由来の反復配列は、例えばＣＲＩＳＰＲｄｂにより提供されるＣＲＩＳＰＲｆｉｎｄｅｒを用いる（Ｇｒｉｓｓａｅｔａｌ．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．３５（ＷｅｂＳｅｒｖｅｒｉｓｓｕｅ）：Ｗ５２－７参照）、確立されたアルゴリズムにより決定されてもよい。一部の実施形態において、反復配列またはその部分は、その３’末端にてスペーサー配列の５’末端に連結されることによって、反復－スペーサー配列（例えば、ガイド核酸、ガイドＲＮＡ／ＤＮＡ、ｃｒＲＮＡ、ｃｒＤＮＡ）を形成する。

一部の実施形態において、反復配列は、特定の反復に、そして反復を含むガイド核酸がプロセシングされるか、またはプロセシングされないかに応じて、少なくとも１０個のヌクレオチド（例えば、約１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０～１００個、もしくはそれを超えるヌクレオチド、またはそれらの中のあらゆる範囲もしくは値；例えば約）を含むか、それから本質的になるか、またはそれからなる。一部の実施形態において、反復配列は、約１０～約２０、約１０～約３０、約１０～約４５、約１０～約５０、約１５～約３０、約１５～約４０、約１５～約４５、約１５～約５０、約２０～約３０、約２０～約４０、約２０～約５０、約３０～約４０、約４０～約８０、約５０～約１００個、またはそれを超えるヌクレオチドを含むか、それから本質的になるか、またはそれからなる。

スペーサー配列の５’末端に連結された反復配列は、反復配列の部分（例えば、野生型反復配列の５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、またはそれを超える連続ヌクレオチド）を含み得る。一部の実施形態において、スペーサー配列の５’末端に連結される反復配列の部分は、約５～約１０連続ヌクレオチド（例えば、約５、６、７、８、９、１０ヌクレオチド）長であり得、そして野生型ＣＲＩＳＰＲＣａｓ反復ヌクレオチド配列の同じ領域（例えば５’末端）に対して少なくとも９０％（例えば、少なくとも約９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、またはそれを超える）の配列同一性を有する。一部の実施形態において、反復配列の部分は、その５’末端にてシュードノット様構造（例えば「ハンドル」）を含んでもよい。

本明細書中で用いられる「スペーサー配列」は、標的核酸（例えば標的ＤＮＡ）と相補的なヌクレオチド配列（例えばプロトスペーサー）である。スペーサー配列は、標的核酸と完全に相補的であり得るか、または実質的に相補的であり得る（例えば、少なくとも約７０％（例えば、約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、またはそれを超える）相補的である）。ゆえに、一部の実施形態において、スペーサー配列は、標的核酸と比較して、１、２、３、４、または５つのミスマッチを有し得、当該ミスマッチは、連続していてもよいし、非連続であってもよい。一部の実施形態において、スペーサー配列は、標的核酸に対して７０％の相補性を有し得る。他の実施形態において、スペーサーヌクレオチド配列は、標的核酸に対して８０％の相補性を有し得る。さらに他の実施形態において、スペーサーヌクレオチド配列は、標的核酸（プロトスペーサー）に対して８５％、９０％、９５％、９６％、９７％、９８％、９９％、または９９．５％等の相補性を有し得る。一部の実施形態において、スペーサー配列は、標的核酸と１００％相補的である。スペーサー配列は、長さが約１５ヌクレオチド～約３０ヌクレオチド（例えば、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、もしくは３０ヌクレオチド、またはそれらの中のあらゆる範囲もしくは値）であってよい。ゆえに、一部の実施形態において、スペーサー配列は、少なくとも約１５ヌクレオチド～約３０ヌクレオチド長である標的核酸（例えばプロトスペーサ）の領域にわたって完全な相補性または実質的な相補性を有し得る。一部の実施形態において、スペーサーは、約２０ヌクレオチド長である。一部の実施形態において、スペーサーは、約２１、２２、または２３ヌクレオチド長である。

一部の実施形態において、ガイド核酸のスペーサー配列の５’領域は、標的核酸と完全に相補的であり得る一方、スペーサーの３’領域は、標的核酸と（例えば、Ｖ型ＣＲＩＳＰＲ－Ｃａｓ系内のスペーサーについて）実質的に相補的であり得、またはガイド核酸のスペーサー配列の３’領域は、標的核酸と完全に相補的であり得る一方、スペーサーの５’領域は、標的核酸と（例えば、ＩＩ型ＣＲＩＳＰＲ－Ｃａｓ系内のスペーサーについて）実質的に相補的であり得るので、標的核酸に対するスペーサー配列の全体的な相補性は、１００％未満であってもよい。ゆえに、例えば、Ｖ型ＣＲＩＳＰＲ－Ｃａｓ系用のガイド核酸において、例えば２０ヌクレオチドスペーサー配列の、５’領域内の最初の１、２、３、４、５、６、７、８、９、１０ヌクレオチド（すなわちシード領域）は、標的核酸と１００％相補的であり得る一方、スペーサー配列の３’領域内の残りのヌクレオチドは、標的核酸と実質的に相補的である（例えば、少なくとも約７０％相補的である）。一部の実施形態において、スペーサー配列の５’末端の最初の１～８ヌクレオチド（例えば、最初の１、２、３、４、５、６、７、８ヌクレオチド、およびそれらの中のあらゆる範囲）は、標的核酸と１００％相補的であり得る一方、スペーサー配列の３’領域内の残りのヌクレオチドは、標的核酸と実質的に相補的である（例えば、少なくとも約５０％（例えば、５０％、５５％、６０％、６５％、７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、またはそれを超える）相補的である）。

更なる例として、ＩＩ型ＣＲＩＳＰＲ－Ｃａｓ系用のガイド核酸において、例えば２０ヌクレオチドスペーサー配列の、３’領域内の最初の１、２、３、４、５、６、７、８、９、１０ヌクレオチド（すなわちシード領域）は、標的核酸と１００％相補的であり得る一方、スペーサー配列の５’領域内の残りのヌクレオチドは、標的核酸と実質的に相補的である（例えば、少なくとも約７０％相補的である）。一部の実施形態において、スペーサー配列の３’末端の最初の１～１０ヌクレオチド（例えば、最初の１、２、３、４、５、６、７、８、９、１０ヌクレオチド、およびそれらの中のあらゆる範囲）は、標的核酸と１００％相補的であり得る一方、スペーサー配列の５’領域内の残りのヌクレオチドは、標的核酸と実質的に相補的である（例えば、少なくとも約５０％（例えば、少なくとも約５０％、５５％、６０％、６５％、７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、もしくはそれを超えるか、またはそれらの中のあらゆる範囲もしくは値）相補的である）。動員ガイドＲＮＡはさらに、本明細書中に記載される１つまたは複数の動員モチーフを含み、これは、ガイドの５’末端または３’末端に連結されていてもよいし、動員ガイド核酸中に（例えば、ヘアピンループ内に）挿入されていてもよい。

一部の実施形態において、スペーサーのシード領域は、約８～約１０ヌクレオチド長、約５～約６ヌクレオチド長、または約６ヌクレオチド長であってもよい。

「標的核酸」、「標的ＤＮＡ」、「標的ヌクレオチド配列」、「標的領域」、または「ゲノム内の標的領域」は、本明細書中で互換的に用いられており、本明細書中で規定されるガイド核酸内のスペーサー配列と完全に相補的な（１００％相補的な）、または実質的に相補的な（例えば、少なくとも７０％（例えば、７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、またはそれを超える）相補的な）配列を含む生物の（例えば植物の）ゲノムの領域を指す。標的核酸は、本明細書中に記載される編集系（またはその構成要素）によって標的とされる。ＣＲＩＳＰＲ－Ｃａｓ系に有用な標的領域は、生物のゲノム（例えば、植物ゲノムまたは哺乳動物（例えばヒト）ゲノム）内のＰＡＭ配列に対して直ぐ３’側に（例えばＶ型ＣＲＩＳＰＲ－Ｃａｓ系）、または直ぐ５’側に（例えばＩＩ型ＣＲＩＳＰＲ－Ｃａｓ系）位置決めされ得る。標的領域は、ＰＡＭ配列に直ぐ隣接して位置決めされている少なくとも１５個の連続ヌクレオチド（例えば、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０ヌクレオチド等）のあらゆる領域から選択され得る。

本明細書中で用いられる「プロトスペーサー配列」または「プロトスペーサー」は、ガイド核酸のスペーサー配列と完全に、または、実質的には相補的である（かつこれにハイブリダイズすることができる）配列を指す。一部の実施形態において、プロトスペーサーは、ＣＲＩＳＰＲ反復－スペーサー配列のスペーサー配列と完全に、または実質的に相補的である（かつこれにハイブリダイズする）、本明細書中で定義される標的核酸（例えば、ガイド核酸、ＣＲＩＳＰＲアレイ、ｃｒＲＮＡ）の全てまたは部分である。

Ｖ型ＣＲＩＳＰＲ－Ｃａｓ（例えばＣａｓ１２ａ）系およびＩＩ型ＣＲＩＳＰＲ－Ｃａｓ（Ｃａｓ９）系の場合、プロトスペーサー配列は、プロトスペーサー隣接モチーフ（ＰＡＭ）が隣に（例えば直接隣接して）位置する。ＩＶ型ＣＲＩＳＰＲ－Ｃａｓ系について、ＰＡＭは、非標的鎖上の５’末端に、そして標的鎖の３’末端に位置決めされている（一例として、下記参照）。

ＩＩ型ＣＲＩＳＰＲ－Ｃａｓ（例えばＣａｓ９）系の場合、ＰＡＭは、標的領域の直ぐ３’側に位置決めされている。Ｉ型ＣＲＩＳＰＲ－Ｃａｓ系用のＰＡＭは、標的鎖の５’側に位置決めされている。ＩＩＩ型ＣＲＩＳＰＲ－Ｃａｓ系用のＰＡＭは知られていない。Ｍａｋａｒｏｖａｅｔａｌ．は、ＣＲＩＳＰＲ系の全てのクラス、型、およびサブタイプについての命名法を記載している（ＮａｔｕｒｅＲｅｖｉｅｗｓＭｉｃｒｏｂｉｏｌｏｇｙ１３：７２２－７３６（２０１５））。ガイド構造およびＰＡＭが、Ｒ．Ｂａｒｒａｎｇｏｕ（ＧｅｎｏｍｅＢｉｏｌ．１６：２４７（２０１５））によって記載されている。

カノニカルＣａｓ１２ａＰＡＭは、Ｔリッチである。一部の実施形態において、カノニカルＣａｓ１２ａＰＡＭ配列は、５’－ＴＴＮ、５’－ＴＴＴＮ、または５’－ＴＴＴＶであり得る。一部の実施形態において、カノニカルＣａｓ９（例えば化膿連鎖球菌）ＰＡＭは、５’－ＮＧＧ－３’であり得る。一部の実施形態において、非カノニカルＰＡＭが用いられてもよいが、あまり有効でない可能性がある。

更なるＰＡＭ配列が、確立されている実験的アプローチおよび計算論的アプローチにより、当業者によって決定されてもよい。ゆえに、例えば、実験的アプローチは、考えられる全てのヌクレオチド配列が隣に位置する配列を標的とすることと、例えば標的プラスミドＤＮＡの形質転換により、標的化を受けない配列メンバーを識別することとを含む（Ｅｓｖｅｌｔｅｔａｌ．２０１３．ＮａｔＭｅｔｈｏｄｓ１０：１１１６－１１２１、Ｊｉａｎｇｅｔａｌ．２０１３．Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．３１：２３３－２３９）。一部の態様において、計算論的アプローチは、天然のスペーサーのＢＬＡＳＴ検索を実行して、バクテリオファージまたはプラスミド内の元の標的ＤＮＡ配列を同定することと、これらの配列をアラインして、標的配列に隣接する保存された配列を決定することとを含み得る（ＢｒｉｎｅｒａｎｄＢａｒｒａｎｇｏｕ．２０１４．Ａｐｐｌ．Ｅｎｖｉｒｏｎ．Ｍｉｃｒｏｂｉｏｌ．８０：９９４－１００１、Ｍｏｊｉｃａｅｔａｌ．２００９．Ｍｉｃｒｏｂｉｏｌｏｇｙ１５５：７３３－７４０）。

一部の実施形態において、本発明は、本発明の核酸構築体（例えば、本発明の編集系の１つまたは複数の構成要素）を含む発現カセットおよび／またはベクターを提供する。一部の実施形態において、本発明の核酸構築体および／または１つもしくは複数のガイド核酸を含む発現カセットおよび／またはベクターが提供されてもよい。一部の実施形態において、本発明の核酸構築体は、操作されたタンパク質および／またはデアミナーゼをコードしており、そして各々が、同上に、または１つもしくは複数のガイド核酸を含むものとは別個の発現カセットまたはベクター上に含まれてもよい。操作されたタンパク質をコードする核酸構築体、または編集系の構成要素が、ガイド核酸を含むものとは別個の発現カセットまたはベクター上に含まれる場合、標的核酸は、例えば、ガイド核酸を含む発現カセットが提供される（例えば、標的核酸と接触する）よりも前に、これと同時に、またはこれの後に、操作されたタンパク質、または編集系の構成要素を、互いにあらゆる順序でコードする発現カセットまたはベクター、およびガイド核酸と接触して（例えばこれらが提供されて）もよい。

編集系の１つまたは複数の構成要素を互いに、かつ／または標的核酸に動員する方法が、当該技術において知られており、ペプチドタグまたはペプチドタグと相互作用する親和性ポリペプチドの使用を含んでもよい。一部の実施形態において、ガイド核酸は、ＲＮＡ動員モチーフに連結されていてもよく、そしてデアミナーゼは、ＲＮＡ動員モチーフと相互作用することができる親和性ポリペプチドに連結されていてもよく、これによってデアミナーゼを標的核酸に動員する。これ以外にも、化学相互作用が、ポリペプチド（例えばデアミナーゼ）を標的核酸に動員するのに用いられてもよい。

本発明に有用なペプチドタグ（例えばエピトープ）として、以下に限定されないが、ＧＣＮ４ペプチドタグ（例えばＳｕｎ－タグ）、ｃ－Ｍｙｃ親和性タグ、ＨＡ親和性タグ、Ｈｉｓ親和性タグ、Ｓ親和性タグ、メチオニンＨｉｓ親和性タグ、ＲＧＤ－Ｈｉｓ親和性タグ、ＦＬＡＧオクタペプチド、ｓｔｒｅｐタグもしくはｓｔｒｅｐタグＩＩ、Ｖ５タグ、および／またはＶＳＶ－Ｇエピトープが挙げられ得る。ポリペプチドに連結されていてもよいあらゆるエピトープであって、別のポリペプチドに連結されていてもよい対応する親和性ポリペプチドが存在するあらゆるエピトープが、ペプチドタグとして本発明に用いられてもよい。一部の実施形態において、ペプチドタグは、１、２、またはそれを超えるコピーのペプチドタグ（例えば、反復単位、多量体化エピトープ（例えばタンデム反復））（例えば、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５個、またはそれを超える反復ユニット）を含んでもよい。一部の実施形態において、ペプチドタグと相互作用する／に結合する親和性ポリペプチドが、抗体であってもよい。一部の実施形態において、抗体はｓｃＦｖ抗体であってもよい。一部の実施形態において、ペプチドタグに結合する親和性ポリペプチドは、合成的（例えば、親和性相互作用について進化した）であってもよく、以下に限定されないが、アフィボディ、アンチカリン、モノボディ、および／またはＤＡＲＰｉｎが挙げられる（例えば、Ｓｈａｅｔａｌ．，ＰｒｏｔｅｉｎＳｃｉ．２６（５）：９１０－９２４（２０１７）；Ｇｉｌｂｒｅｔｈ（ＣｕｒｒＯｐｉｎＳｔｒｕｃＢｉｏｌ２２（４）：４１３－４２０（２０１３）、米国特許第９，９８２，０５３号（これらは各々、アフィボディ、アンチカリン、モノボディ、および／またはＤＡＲＰｉｎｓに関連する教示について、それらの全体が参照によって組み込まれる）参照）。

一部の実施形態において、ガイド核酸は、ＲＮＡ動員モチーフに連結されていてもよく、そして動員されることとなるポリペプチド（例えばデアミナーゼ）は、ＲＮＡ動員モチーフに結合する親和性ポリペプチドに融合していてもよく、ここでは、ガイドは標的核酸に結合し、そしてＲＮＡ動員モチーフは親和性ポリペプチドに結合し、これによって、ポリペプチドをガイドに動員して、標的核酸をポリペプチド（例えばデアミナーゼ）と接触させる。一部の実施形態において、２つ以上のポリペプチドが、ガイド核酸に動員されることによって、標的核酸を、２つ以上のポリペプチド（例えばデアミナーゼ）と接触させてもよい。

本発明の一部の実施形態において、ガイドＲＮＡは、１つまたは２つ以上のＲＮＡ動員モチーフ（例えば、１、２、３、４、５、６、７、８、９、１０モチーフ、またはそれを超える、例えば、少なくとも１０～約２５モチーフ）に連結されていてもよく、場合によっては、２つ以上のＲＮＡ動員モチーフは、同じＲＮＡ動員モチーフであっても、異なるＲＮＡ動員モチーフであってもよい。一部の実施形態において、ＲＮＡ動員モチーフおよび対応する親和性ポリペプチドとして、以下に限定されないが、テロメラーゼＫｕ結合モチーフ（例えばＫｕ結合ヘアピン）および対応する親和性ポリペプチドＫｕ（例えばＫｕヘテロダイマー）、テロメラーゼＳｍ７結合モチーフおよび対応する親和性ポリペプチドＳｍ７、ＭＳ２ファージオペレーターステム－ループおよび対応する親和性ポリペプチドＭＳ２コートタンパク質（ＭＣＰ）、ＰＰ７ファージオペレーターステム－ループおよび対応する親和性ポリペプチドＰＰ７コートタンパク質（ＰＣＰ）、ＳｆＭｕファージＣｏｍステム－ループおよび対応する親和性ポリペプチドＣｏｍＲＮＡ結合タンパク質、ＰＵＦ結合部位（ＰＢＳ）および親和性ポリペプチドプミリオ／ｆｅｍ－３ｍＲＮＡ結合因子（ＰＵＦ）、ならびに／または合成ＲＮＡアプタマーおよび対応する親和性ポリペプチドとしてのアプタマーリガンドが挙げられ得る。一部の実施形態において、ＲＮＡ動員モチーフおよび対応する親和性ポリペプチドは、ＭＳ２ファージオペレーターステム－ループおよび親和性ポリペプチドＭＳ２コートタンパク質（ＭＣＰ）であってもよい。一部の実施形態において、ＲＮＡ動員モチーフおよび対応する親和性ポリペプチドは、ＰＵＦ結合部位（ＰＢＳ）および親和性ポリペプチドプミリオ／ｆｅｍ－３ｍＲＮＡ結合因子（ＰＵＦ）であってもよい。本発明に有用であり得る例示的なＲＮＡ動員モチーフおよび対応する親和性ポリペプチドとして、以下に限定されないが、配列番号１０８～１１８が挙げられ得る。

一部の実施形態において、ポリペプチドおよび核酸を動員するための構成要素として、以下に限定されないが、ＦＲＢ－ＦＫＢＰのラパマイシン誘導性の二量体化；ビオチン－ストレプトアビジン；ＳＮＡＰタグ；Ｈａｌｏタグ；ＣＬＩＰタグ；化合物によって誘導されるＤｍｒＡ－ＤｍｒＣヘテロダイマー；二官能性リガンド（例えば、２つのタンパク質結合化学物質の一緒の融合；例えばジヒドロ葉酸還元酵素（ＤＨＦＲ）が挙げられ得る、化学相互作用を通して機能するものが挙げられ得る。

一部の実施形態において、植物内での発現のために最適化されている本発明の核酸構築体、発現カセット、またはベクターは、同じポリヌクレオチドを含むが、植物内での発現のためにコドン最適化されていない核酸構築体、発現カセット、またはベクターに対して約７０％～１００％（例えば、約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、９９．５％または１００％）同一であってよい。

本明細書中に記載される「ペプチドタグ」は、１つまたは複数のポリペプチドを動員するのに使用されてよい。ペプチドタグは、対応する親和性ポリペプチドによって結合することができるあらゆるポリペプチドであってよい。また、ペプチドタグは、エピトープと称され得、複数のコピーで提供される場合には「多量体化エピトープ」と称され得る。例示的なペプチドタグとして、以下に限定されないが、ＧＣＮ４ペプチドタグ（例えばＳｕｎ－タグ）、ｃ－Ｍｙｃ親和性タグ、ＨＡ親和性タグ、Ｈｉｓ親和性タグ、Ｓ親和性タグ、メチオニンＨｉｓ親和性タグ、ＲＧＤ－Ｈｉｓ親和性タグ、ＦＬＡＧオクタペプチド、ｓｔｒｅｐタグもしくはｓｔｒｅｐタグＩＩ、Ｖ５タグ、および／またはＶＳＶ－Ｇエピトープが挙げられ得る。一部の実施形態において、ペプチドタグとしてまた、ＳＨ２ドメインによって認識される特定の配列の文脈におけるリン酸化チロシン、１４－３－３タンパク質によって認識されるホスホセリンを含有する特徴的なコンセンサス配列、ＳＨ３ドメインによって認識されるプロリンリッチペプチドモチーフ、ＰＤＺタンパク質相互作用ドメイン、またはＰＤＺシグナル配列、および植物由来のＡＧＯｈｏｏｋモチーフが挙げられ得る。ペプチドタグは、国際公開第２０１８／１３６７８３号および米国特許出願公開第２０１７／０２１９５９６号に開示されており、これらは、ペプチドタグの開示が参照によって組み込まれる。本発明に有用であり得るペプチドタグとして、以下に限定されないが、配列番号１１９および配列番号１２０が挙げられ得る。ペプチドタグに有用な親和性ポリペプチドとして、以下に限定されないが、配列番号１２１が挙げられる。

ペプチドタグは、ペプチドタグの１コピー、２コピー、またはそれを超えるコピーを含んでもよいし、その中に存在してもよい（例えば、多量体化ペプチドタグまたは多量体化エピトープ）（例えば、約２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、９、２０、２１、２２、２３、２４、もしくは２５個、またはそれを超えるペプチドタグ）。多量体化される場合、ペプチドタグは、互いに直接融合していてもよいし、１つまたは複数のアミノ酸（例えば、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、またはそれを超えるアミノ酸、場合によっては、約３～約１０、約４～約１０、約５～約１０、約５～約１５、または約５～約２０個のアミノ酸等、そしてそれらの中のあらゆる値もしくは範囲）を介して互いに連結されていてもよい。ゆえに、一部の実施形態において、本発明のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、１つのペプチドタグに、または２つ以上のペプチドタグに融合したＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質ドメインを含んでもよく、場合によっては、２つ以上のペプチドタグは、１つまたは複数のアミノ酸残基を介して互いに融合している。一部の実施形態において、本発明に有用なペプチドタグは、ＧＣＮ４ペプチドタグまたはエピトープの単一コピーであってもよいし、ペプチドタグの約２～約２５コピー、またはそれを超えるコピーを含む多量体化ＧＣＮ４エピトープ（例えば、約２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５コピー、またはそれを超えるコピーのＧＣＮ４エピトープ、またはそれらの中のあらゆる範囲）であってもよい。

一部の実施形態において、ペプチドタグは、ＣＲＩＳＰＲ－Ｃａｓポリペプチドまたはドメインに融合していてもよい。一部の実施形態において、ペプチドタグは、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質のＣ末端に融合または連結して、ＣＲＩＳＰＲ－Ｃａｓ融合タンパク質を形成してもよい。一部の実施形態において、ペプチドタグは、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質のＮ末端に融合または連結して、ＣＲＩＳＰＲ－Ｃａｓ融合タンパク質を形成してもよい。一部の実施形態において、ペプチドタグは、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質内で融合していてもよい（例えば、ペプチドタグは、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質のループ領域内にあってもよい）。一部の実施形態において、ペプチドタグは、シトシンデアミナーゼに、かつ／またはアデニンデアミナーゼに融合していてもよい。

「親和性ポリペプチド」（例えば「動員ポリペプチド」）は、その対応するペプチドタグ、ペプチドタグ、またはＲＮＡ動員モチーフに結合することができるあらゆるポリペプチドを指す。ペプチドタグに対する親和性ポリペプチドは、例えば、ペプチドタグにそれぞれ特異的に結合する抗体および／または一本鎖抗体であってもよい。一部の実施形態において、ペプチドタグに対する抗体として、以下に限定されないが、ｓｃＦｖ抗体が挙げられ得る。一部の実施形態において、親和性ポリペプチドは、デアミナーゼ（例えば、シトシンデアミナーゼまたはアデニンデアミナーゼ）のＮ末端に融合または連結していてもよい。一部の実施形態において、親和性ポリペプチドは、細胞または細胞抽出物の還元条件下で、安定している。

本発明の核酸構築体および／またはガイド核酸は、本明細書中に記載される１つまたは複数の発現カセット内に含まれてもよい。一部の実施形態において、本発明の核酸構築体は、同上内に、またはガイド核酸および／もしくは動員ガイド核酸を含むものとは別個の発現カセットもしくはベクター内に含まれてもよい。

ガイド核酸および動員ガイド核酸と組み合わせて用いられる場合、本発明の核酸構築体（ならびに同上を含む発現カセットおよびベクター）は、標的核酸および／またはその発現を修飾するのに用いられ得る。標的核酸は、本発明の核酸構築体、ならびに／または同上を含む発現カセットおよび／もしくはベクターと、標的核酸を、ガイド核酸／動員ガイド核酸、ならびに／または同上を含む発現カセットおよびベクターと接触させるよりも前に、これと同時に、またはこれの後に、接触させ得る。

本発明の実施形態に従えば、提供されるのは、操作されたタンパク質である。本明細書中で用いられる「操作されたタンパク質」は、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質由来のポリペプチドを含むポリペプチド（すなわち、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド）、およびＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドに対して異種であるポリペプチド（すなわち、異種ポリペプチド）を指す。ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質由来のポリペプチドは、本明細書中で「ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド」と称され、そして「ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド」は、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分である。したがって、本明細書中で用いられる「ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド」は、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の全てを含むわけではないので、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質についてのアミノ酸の数と比較して、アミノ酸の数が引き下げられている。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、ヌクレアーゼドメインが欠けている（例えば、ＲｕｖＣドメインが欠けている）。ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドに対して異種であるポリペプチドは、本明細書中で異種ポリペプチドと称される。異種ポリペプチドは、本明細書中に記載される注目するポリペプチドであってもよい。一部の実施形態において、操作されたタンパク質は、デアミナーゼドメイン（例えば、シトシンデアミナーゼおよび／またはアデニンデアミナーゼ）の全てまたは部分を含み、これは、操作されたタンパク質のあらゆる部分に連結されていてよい。例えば、一部の実施形態において、デアミナーゼドメインの全てまたは部分が、ＣＲＩＳＰＲ－ＣａｓエフェクターポリペプチドのＮ末端もしくはＣ末端に、かつ／または操作されたタンパク質のＮ末端もしくはＣ末端に連結されている。一部の実施形態において、デアミナーゼドメインの全てまたは部分は、操作されたタンパク質の２つの部分の間にある。操作されたタンパク質は、核酸を切断するか、切るか、もしくはニックを入れ；核酸（例えば、標的核酸および／またはガイド核酸）に結合し；かつ／または本明細書中で規定されるガイド核酸を識別するか、認識するか、もしくはこれに結合することができる。一部の実施形態において、操作されたタンパク質またはその部分は、酵素（例えば、ヌクレアーゼ、エンドヌクレアーゼ、ニッカーゼその他）であってよく、かつ／または酵素として機能してよい。一部の実施形態において、本発明の操作されたタンパク質は、ＲＮＡガイドＤＮＡ結合タンパク質である。一部の実施形態において、操作されたタンパク質は、単一のガイド核酸（例えば、ｇＲＮＡ、ＣＲＩＳＰＲアレイ、および／またはｃｒＲＮＡ）であるガイド核酸中に存在し、かつ／またはこれと複合体を形成し、場合によっては、ガイド核酸は単一のｃｒＲＮＡである。一部の実施形態において、複合体は、操作されたタンパク質およびガイド核酸を含み、そしてガイド核酸および／または複合体は、単一のガイド核酸（例えば単一のｃｒＲＮＡ）からなる。一部の実施形態において、操作されたタンパク質は、単一のガイド核酸（例えば、単一のｃｒＲＮＡ）に結合し、標的核酸を認識し、かつ／またはこれに結合し、かつヌクレアーゼ活性を有し、場合によっては、操作されたタンパク質は、標的核酸の標的鎖を切断する。

一部の実施形態において、操作されたタンパク質は、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドおよび異種ポリペプチドを含む。第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、ヌクレアーゼドメインが欠けていてもよく、場合によってはＲｕｖＣドメインが欠けていてもよい。異種ポリペプチドは、第１のＣＲＩＳＰＲ－ＣａｓエフェクターポリペプチドのＮまたはＣ末端に、場合によってはリンカー（例えばペプチドリンカー）ありで、または無しで連結されていてもよい。一部の実施形態において、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、第１のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分（例えば、Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分、例えばＣａｓ１２ａの部分）である。一部の実施形態において、異種ポリペプチドは、ヌクレアーゼドメイン、場合によってはＨＮＨドメイン（例えば、配列番号１または１６９～１７４の１つまたは複数のアミノ酸配列に対して少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、または１００％の配列同一性を有する配列を含むＨＮＨドメイン）を含む。一部の実施形態において、異種ポリペプチドは、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質由来のＨＮＨドメインを含み、かつ／または配列番号１もしくは１７２の１つのアミノ酸配列に対して少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、もしくは１００％の配列同一性を有する配列を含む。一部の実施形態において、異種ポリペプチドは、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質に由来しないＨＮＨドメインを含み、かつ／または配列番号１６９～１７１もしくは１７３～１７４の１つのアミノ酸配列に対して少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、もしくは１００％の配列同一性を有する配列を含む。一部の実施形態において、異種ポリペプチドは、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質由来のポリペプチドであり、場合によっては、異種ポリペプチドは、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドの部分が由来する第１のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質のタイプ（例えば、ＩＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）とは異なるタイプのＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、ＩＩ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）に由来する。

一部の実施形態において、操作されたタンパク質は、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド、異種ポリペプチド、および第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドを含み、これらはあらゆる順序で一緒に連結され得る。一部の実施形態において、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、ＲｕｖＣドメインが欠けていてもよい。異種ポリペプチドは、第１のＣＲＩＳＰＲ－ＣａｓエフェクターポリペプチドのＮもしくはＣ末端に、場合によってはリンカー（例えばペプチドリンカー）ありで、もしくは無しで連結されていてよく、かつ／または異種ポリペプチドは、場合によってはリンカー（例えばペプチドリンカー）ありで、もしくは無しで、第２のＣＲＩＳＰＲ－ＣａｓエフェクターポリペプチドのＮもしくはＣ末端に連結されていてもよい。一部の実施形態において、異種ポリペプチドは、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドと第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドとの間にある。一部の実施形態において、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、第１のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分（例えば、Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分、例えばＣａｓ１２ａの部分）であり、そして第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、第２のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分（例えば、Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分、例えばＣａｓ１２ａの部分）であり、第１のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質および第２のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、同じタンパク質であっても異なるタンパク質であってもよい。一部の実施形態において、第１のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質および第２のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質は、同じであることによって、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドおよび第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、同じタンパク質由来の部分であるが、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の異なる部分であってもよい。第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドおよび第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、異なる配列を有してもよい。一部の実施形態において、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドおよび第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、同じ配列を含んでもよい。一部の実施形態において、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドおよび第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは一緒に、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の完全配列を提供する。一部の実施形態において、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドおよび第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは一緒に、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の完全配列を構成しない（すなわち、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の配列の部分は、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドおよび第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドの２つの配列内に存在しない）；例えば、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の１もしくは５～１０、１５、２０、２５、３０個、またはこれを超えるアミノ酸（例えば、１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０個、またはこれを超えるアミノ酸）は、第１および第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドの配列内に存在しなくてもよい。一部の実施形態において、異種ポリペプチドは、ヌクレアーゼドメイン、場合によってはＨＮＨドメイン（例えば、ＩＩ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質由来のＨＮＨドメイン）を含む。一部の実施形態において、異種ポリペプチドは、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質に由来しないＨＮＨドメインを含む。一部の実施形態において、異種ポリペプチドは、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質由来のポリペプチドであり、場合によっては、異種ポリペプチドは、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドの部分が由来する第１のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、ＩＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）のタイプとは異なり、かつ／または第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドの部分が由来する第２のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、ＩＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）のタイプとは異なるタイプのＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、ＩＩ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）に由来する。一部の実施形態において、異種ポリペプチドは、ＩＩ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質に由来し（例えば、ＩＩ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分（例えば、ＨＮＨドメインまたはその部分）であり）、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、ＩＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分であり、そして第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、ＩＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分であり、第１および第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは異なる。一部の実施形態において、異種ポリペプチドは、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドおよび第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドの１つに対して異種である。一部の実施形態において、異種ポリペプチドは、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドおよび第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドの双方に対して異種である。

本明細書中で用いられる「異種ポリペプチド」は、操作されたタンパク質のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドと比較して、天然に存在しないポリペプチドを指す。したがって、操作されたタンパク質の異種ポリペプチドは、自然界で、操作されたタンパク質の少なくとも１つのＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド内に見出されないので、異種ポリペプチドは、少なくとも１つのＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドに関して、天然に存在しない。例えば、本発明の操作されたタンパク質は、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分であるＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドを含み、そして操作されたタンパク質は異種ポリペプチドを含み、そして異種ポリペプチドは、異種ポリペプチドの非存在下のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド（例えば、異種ポリペプチドおよびＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド（例えば、これの挿入または融合）を含まないか、またはこれを含む前のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド）と比較して、天然に存在しない；一部の実施形態において、異種ポリペプチドは、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドの部分が由来するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質に対して異種である。一部の実施形態において、操作されたタンパク質は、異種ポリペプチド、第１のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分である第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド、および第２のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分である第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドを含み、異種ポリペプチドは、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド、第１のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、第２のＣＲＩＳＰＲ－Ｃａｓエフェクター、および第２のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質内に天然に存在しない（すなわち、これらに対して異種である）。同様に、異種ポリペプチドをコードするヌクレオチド配列は、操作されたタンパク質のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドをコードするヌクレオチド配列に対して異種である（すなわち、これと比較して、天然に存在しない）。

一部の実施形態において、異種ポリペプチドは、操作されたタンパク質のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドとは異なるタイプのタンパク質由来のポリペプチドまたはドメインを含む。一部の実施形態において、操作されたタンパク質は、Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えばＣａｓ１２ａ）の１つまたは複数（例えば、１、２、３つ、またはそれを超える）の部分（すなわち、これに由来する１つまたは複数のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド）、および異なるタイプのＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、例えばＩＩ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質由来の１つまたは複数（例えば、１、２、３つ、またはそれを超える）のポリペプチドを含む。２つ以上の部分またはポリペプチドが、同上のタンパク質に由来し、かつ各々が、操作されたタンパク質内に存在する場合、２つ以上の部分またはポリペプチドは、リンカーおよび／または異種ポリペプチドによって、操作されたタンパク質内で互いに分離されていてもよい（すなわち、２つ以上の部分またはポリペプチドは、直接連結されていなくてもよい）し、それらの部分が由来するタンパク質のもの（例えば、野生型タンパク質および／またはＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）と異なる順序であってもよい。一部の実施形態において、操作されたタンパク質は、Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えばＣａｓ１２ａ）の１つまたは複数（例えば、１、２、３つ、またはそれを超える）の部分（すなわち、これに由来する１つまたは複数のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド）、ならびにＩＩ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えばＣａｓ９）由来の少なくとも１つのポリペプチドおよび／またはその部分を含む。一部の実施形態において、操作されたタンパク質は、Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えばＣａｓ１２ａ）の部分である第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド、およびＩＩ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えばＣａｓ９）由来の異種ポリペプチドを含む。一部の実施形態において、操作されたタンパク質は、Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えばＣａｓ１２ａ）の部分である第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド、ＩＩ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えばＣａｓ９）由来の異種ポリペプチド、およびＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えばＣａｓ１２ａ）の部分である第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドを含み、場合によっては、第１および第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、同じＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えばＣａｓ１２ａ）と異なる部分である。一部の実施形態において、操作されたタンパク質は、Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えばＣａｓ１２ａ）の部分である第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド、ＨＮＨドメインまたはその部分を含む異種ポリペプチド、およびＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えばＣａｓ１２ａ）の部分である第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドを含み、場合によっては、第１および第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、同じＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えばＣａｓ１２ａ）と異なる部分である。

一部の実施形態において、操作されたタンパク質は、Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、Ｃａｓ１２ａ）由来の１つもしくは複数の（例えば、１、２、３つ、またはそれを超える）ドメインまたはその部分、および異なるタイプのＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、例えばＩＩ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質由来の１つもしくは複数の（例えば、１、２、３つ、またはそれを超える）ドメインまたはその部分を含む。一部の実施形態において、操作されたタンパク質は、Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えばＣａｓ１２ａ）由来の１つまたは複数の（例えば、１、２、３つ、またはそれを超える）ドメインまたはその部分、およびＩＩ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えばＣａｓ９）由来の少なくとも１つのドメインまたはその部分を含む。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドの、かつ／またはＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドの１つもしくは複数のドメイン（例えばＲｕｖＣドメイン）の活性に干渉しないし、悪影響を与えない。

異種ポリペプチドは、約１０～約３００アミノ酸、例えば、約１０、２０、３０、４０、５０、６０、７０、８０、９０、または１００アミノ酸～約１１０、１２５、１５０、１７５、２００、２２５、２５０、２７５、または３００アミノ酸の長さを有してもよい。一部の実施形態において、異種ポリペプチドは、約１０、２０、３０、４０、５０、６０、７０、８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２１０、２２０、２３０、２４０、２５０、２６０、２７０、２８０、２９０、または３００アミノ酸の長さを有する。一部の実施形態において、異種ポリペプチドは、約１２０、１２５、１３０、１３５、または１４０アミノ酸～約１４５、１５０、１５５、または１６０アミノ酸の長さを有する。一部の実施形態において、異種ポリペプチドは、１２０、１２１、１２２、１２３、１２４、１２５、１２６、１２７、１２８、１２９、１３０、１３１、１３２、１３３、１３４、１３５、１３６、１３７、１３８、１３９、１４０、１４１、１４２、１４３、１４４、１４５、１４６、１４７、１４８、１４９、１５０、１５１、１５２、１５３、１５４、１５５、１５６、１５７、１５８、または１６０アミノ酸の長さを有する。一部の実施形態において、異種ポリペプチドは、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドと第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドとの間にあり、そして異種ポリペプチドは、第１および第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドの一方または双方に対して異種である。

一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、約１００、１５０、２００、または２５０アミノ酸～約３００、３５０、または４００アミノ酸の長さを有する。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、約１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２１０、２２０、２３０、２４０、２５０、２６０、２７０、２８０、２９０、３００、３１０、３２０、３３０、３４０、３５０、３６０、３７０、３８０、３９０、または４００アミノ酸の長さを有する。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、約８００、８５０、または９００アミノ酸～約９５０、１０００、１０５０、または１１００アミノ酸の長さを有する。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、約８００、８１０、８２０、８３０、８４０、８５０、８６０、８７０、８８０、８９０、９００、９１０、９２０、９３０、９４０、９５０、９６０、９７０、９８０、９９０、１，０００、１，０１０、１，０２０、１，０３０、１，０４０、１，０５０、１，０６０、１，０７０、１，０８０、１，０９０、１，１００アミノ酸の長さを有する。一部の実施形態において、操作されたタンパク質は、約１００、１５０、２００、または２５０アミノ酸～約３００、３５０、または４００アミノ酸の長さを有する第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド、約１０、５０、１００、または１４０アミノ酸～約１６０、２００、２５０、または３００アミノ酸の長さを有する異種ポリペプチド；および約１００、２００、３００、４００、５００、６００、７００、８００、８５０、または９００アミノ酸～約９５０、１，０００、１，０５０、または１，１００アミノ酸の長さを有する第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドを含む。

一部の実施形態において、異種ポリペプチドは、ヌクレアーゼドメインまたはその部分を含み、これは、本明細書中で「異種ヌクレアーゼドメインまたはその部分」と称され得る。なぜなら、異種ポリペプチド由来のヌクレアーゼドメインまたはその部分は、操作されたタンパク質内に存在する１つまたは複数のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドに対して異種であるからである。異種ポリペプチドは、ＤＮＡヌクレアーゼドメインまたはその部分であってよい。一部の実施形態において、異種ヌクレアーゼドメインまたはその部分は、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質由来である。一部の実施形態において、異種ヌクレアーゼドメインまたはその部分は、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質由来でない。一部の実施形態において、異種ヌクレアーゼドメインまたはその部分は、細菌タンパク質由来であり、場合によっては、異種ヌクレアーゼドメインまたはその部分は、制限酵素、ホーミングエンドヌクレアーゼ、コリシン、ピオシン、逆転写酵素、ＤＮａｓｅ、および／またはスタンドアロンＨＮＨドメイン由来である。一部の実施形態において、操作されたタンパク質は、ヌクレアーゼドメインまたはその部分（すなわち、異種ヌクレアーゼドメインまたはその部分）を含む異種ポリペプチドを含み、操作されたタンパク質は、場合によっては標的核酸の標的鎖および／または標的核酸の非標的鎖を切断するヌクレアーゼである。一部の実施形態において、操作されたタンパク質は、標的核酸の標的鎖、および標的核酸の非標的鎖を切断し、そして標的核酸の平滑末端二本鎖切断、または標的核酸のスタガー二本鎖切断を実現する。一部の実施形態において、操作されたタンパク質は、標的核酸の標的鎖、および標的核酸の非標的鎖を切断し、そして切られる部位間の距離（例えば、ヌクレオチドの数）は、０、１、２、３、４、または５ヌクレオチド～約６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、または２０ヌクレオチドである。

一部の実施形態において、異種ヌクレアーゼドメインまたはその部分は、標的鎖ニッカーゼドメインまたはその部分であってもよい。本明細書中で用いられる「標的鎖ニッカーゼドメインまたはその部分」は、ドメインまたはその部分が、その固有のタンパク質内にある場合に、標的核酸の標的鎖に対するニッカーゼ活性を有するポリペプチドを指す。すなわち、標的鎖ニッカーゼドメインまたはその部分は、ドメインまたはその部分が、その固有のタンパク質内にある場合、標的核酸の標的鎖（センス（例えば、「＋」；鋳型）鎖とも称される）にニックを入れる（例えば、これを切断または分解する）ことができる。例えば、Ｃａｓ９のＨＮＨドメインは、標的核酸の標的鎖にニックを入れ、かつ／またはこれに対するニッカーゼ活性を有する。本明細書中で用いられる「ニッカーゼ活性」は、核酸内の一本鎖切断を指す。

一部の実施形態において、標的鎖ニッカーゼドメインまたはその部分は、操作されたタンパク質内に存在する場合、標的核酸の標的鎖に対するニッカーゼ活性を有してもよい。一部の実施形態において、標的鎖ニッカーゼドメインまたはその部分は、操作されたタンパク質内に存在する場合、標的核酸の非標的鎖（アンチセンス（例えば、「－」、相補）鎖とも称される）に対するニッカーゼ活性を有してもよい。操作されたタンパク質内の標的鎖ニッカーゼドメインまたはその部分が、標的鎖および非標的鎖の双方に対するニッカーゼ活性を有する場合、標的鎖ニッカーゼドメインまたはその部分は、双方の鎖を順次切断し得る。一部の実施形態において、操作されたタンパク質内の標的鎖ニッカーゼドメインまたはその部分は、標的核酸の非標的鎖よりも標的鎖に対して大きい活性（例えば酵素活性）を有する。例えば、操作されたタンパク質内に存在する場合、標的鎖ニッカーゼドメインまたはその部分は、標的核酸の非標的鎖よりも標的核酸の標的鎖を速く選好または切断し得る。

本明細書中で用いられる「標的鎖特異的ニッカーゼドメイン」は、標的核酸の標的鎖に対してのみニッカーゼ活性を有し、かつ標的核酸の非標的鎖にニックを入れないポリペプチドを指す。本明細書中で用いられる「非標的鎖特異的ニッカーゼドメイン」は、標的核酸の非標的鎖に対してのみニッカーゼ活性を有し、かつ標的核酸の標的鎖にニックを入れないポリペプチドを指す。本明細書中で用いられる「標的および非標的鎖ニッカーゼドメイン」は、標的核酸の標的鎖および非標的鎖の双方に対するニッカーゼ活性を有するポリペプチドを指す。一部の実施形態において、操作されたタンパク質は、標的鎖ニッカーゼドメインまたはその部分を含み、標的鎖ニッカーゼドメインまたはその部分は、操作されたタンパク質内の標的鎖特異的ニッカーゼドメインである。一部の実施形態において、操作されたタンパク質は、標的鎖ニッカーゼドメインまたはその部分を含み、標的鎖ニッカーゼドメインまたはその部分は、操作されたタンパク質内の非標的鎖特異的ニッカーゼドメインである。一部の実施形態において、操作されたタンパク質は、標的鎖ニッカーゼドメインまたはその部分を含み、標的鎖ニッカーゼドメインまたはその部分は、操作されたタンパク質内の標的および非標的鎖ニッカーゼドメインである。

操作されたタンパク質は、標的鎖ニッカーゼドメインまたはその部分を含む異種ポリペプチドを含んでもよい。したがって、操作されたタンパク質は、標的核酸の標的鎖および／または標的核酸の非標的鎖に対するニッカーゼ活性を有してもよい。これによって、操作されたタンパク質は、標的鎖ニッカーゼおよび／または非標的鎖ニッカーゼであってもよい。操作されたタンパク質を参照して本明細書中で用いられる「標的鎖ニッカーゼ」は、標的核酸の標的鎖を切断することができる操作されたタンパク質を指す。操作されたタンパク質を参照して本明細書中で用いられる「非標的鎖ニッカーゼ」は、標的核酸の非標的鎖を切断することができる操作されたタンパク質を指す。操作されたタンパク質を参照して本明細書中で用いられる「標的および非標的鎖ニッカーゼ」は、標的核酸の標的および非標的鎖の双方をあらゆる順序で（例えば、順次、または同時に）切断することができる操作されたタンパク質を指す。一部の実施形態において、操作されたタンパク質は、標的鎖ニッカーゼであり、かつ／または標的核酸の標的鎖に対するニッカーゼ活性を有する。一部の実施形態において、操作されたタンパク質は、非標的鎖ニッカーゼであり、かつ／または標的核酸の非標的鎖に対するニッカーゼ活性を有する。一部の実施形態において、操作されたタンパク質は、標的および非標的鎖ニッカーゼであり、かつ／または標的核酸の標的鎖および非標的鎖に対するニッカーゼ活性を有する。

一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、標的鎖ニッカーゼドメインまたはその部分を含み、操作されたタンパク質の標的鎖ニッカーゼドメインまたはその部分は、標的核酸の標的鎖に対するニッカーゼ活性を有し、よって、操作されたタンパク質は、標的鎖ニッカーゼである。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、標的鎖ニッカーゼドメインまたはその部分を含み、操作されたタンパク質の標的鎖ニッカーゼドメインまたはその部分は、標的核酸の非標的鎖に対するニッカーゼ活性を有し、よって、操作されたタンパク質は、非標的鎖ニッカーゼである。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、標的鎖ニッカーゼドメインまたはその部分を含み、操作されたタンパク質の標的鎖ニッカーゼドメインまたはその部分は、標的核酸の標的および非標的鎖の双方に対するニッカーゼ活性を有し、よって、操作されたタンパク質は、標的および非標的鎖ニッカーゼである。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、標的鎖ニッカーゼドメインまたはその部分を含み、操作されたタンパク質の標的鎖ニッカーゼドメインまたはその部分は、標的核酸の少なくとも標的鎖に対するニッカーゼ活性を有し、操作されたタンパク質のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、標的核酸の少なくとも非標的鎖に対するニッカーゼ活性を有するヌクレアーゼドメインまたはその部分を含み、よって、操作されたタンパク質は、標的および非標的鎖ニッカーゼである。一部の実施形態において、操作されたタンパク質のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、標的および非標的鎖ニッカーゼドメインまたはその部分であるヌクレアーゼドメインまたはその部分を含むが、ヌクレアーゼドメインまたはその部分は、標的鎖に対するヌクレアーゼ活性が不活化されており、よって、標的核酸の標的鎖が、ヌクレアーゼドメインまたはその部分によってニックを入れられないように不活化されている。

一部の実施形態において、操作されたタンパク質は、１つまたは複数（例えば、１、２つ、またはそれを超える）のヌクレアーゼドメインまたはその部分を含んでもよい。一部の実施形態において、操作されたタンパク質は、少なくとも２つの異なるヌクレアーゼドメインまたはその部分を含む。一部の実施形態において、操作されたタンパク質は、固有のヌクレアーゼドメイン、場合によっては１つまたは複数の（例えば、１、２つ、またはそれを超える）固有のヌクレアーゼドメインを含んでもよい。本明細書中で用いられる「固有のヌクレアーゼドメイン」は、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質内に天然に存在するヌクレアーゼドメインを指す。一部の実施形態において、操作されたタンパク質は、第１の異種ヌクレアーゼドメイン（例えば、異種ポリペプチドに由来し、かつ／またはその中に存在する）および第２のヌクレアーゼドメインを含む。第２のヌクレアーゼドメインは、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質に由来してもよく、かつ／またはその中に存在してもよい。一部の実施形態において、第１のヌクレアーゼドメインは、固有のヌクレアーゼドメインであってよく、かつ／または第２のヌクレアーゼドメインは、固有のヌクレアーゼドメインであってもよい。一部の実施形態において、第２のヌクレアーゼドメインは、標的および非標的鎖ニッカーゼドメインまたはその部分である。本明細書中で用いられる「非標的および標的鎖ニッカーゼドメインまたはその部分」は、ドメインまたはその部分が、その固有のタンパク質内にある場合、標的核酸の非標的鎖に対する、そして標的核酸の標的鎖に対するニッカーゼ活性を有し、かつ標的鎖の前に非標的鎖を切断するか、または標的鎖よりも速く非標的鎖を選好もしくは切断するポリペプチドを指す。非標的および標的鎖ニッカーゼドメインまたはその部分は、標的核酸内でのスタガー二本鎖切断を実現してもよい。一部の実施形態において、第２のヌクレアーゼドメインは活性である。一部の実施形態において、第２のヌクレアーゼドメインは、不活化されている（すなわち、死んだか、不活性であるか、またはニッカーゼ活性を欠いている）。一部の実施形態において、第２のヌクレアーゼドメインは、標的核酸の非標的鎖にのみニックを入れ、かつ／または標的核酸の標的鎖に対するニッカーゼ活性を不活化する変異を含む。操作されたタンパク質内のヌクレアーゼドメインまたはその部分は、ニッカーゼ活性を除去または不活化するヌクレアーゼドメインまたはその部分内の変異によって不活化されていてもよい。一部の実施形態において、操作されたタンパク質は、Ｃａｓ１２ａ（例えば、配列番号５０～６６の１つ由来）またはＣａｓ１２ｂ（例えば、配列番号１５１由来）等のＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質由来のヌクレアーゼドメインまたはその部分を含む。一部の実施形態において、ヌクレアーゼドメインは、Ｃａｓ１２ａまたはＣａｓ１２ｂ等のＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質由来のＲｕｖＣドメインである。操作されたタンパク質は、標的核酸の平滑末端二本鎖切断、または標的核酸のスタガー二本鎖切断を実現する１つまたは複数のヌクレアーゼドメインを含んでもよい。

一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質のＨＮＨドメインの全てまたは部分を含む。異種ポリペプチドおよび／またはＨＮＨドメインは、ジンクフィンガーモチーフを含んでもよく、かつ／またはこれを形成してもよい。一部の実施形態において、異種ポリペプチドおよび／またはＨＮＨドメインは、約１０、２０、３０、４０、５０、６０、７０、８０、９０、または１００アミノ酸～約１１０、１２５、１５０、１７５、２００、２２５、２５０、２７５、または３００アミノ酸の長さを有する。異種ポリペプチドおよび／またはＨＮＨドメインは、約２５もしくは３０～約４０もしくは４５アミノ酸を含んでもよく、かつ／または場合によっては核酸結合および切断部位内にある、１つまたは少なくとも２つのヒスチジンおよびアスパラギンを含んでもよい。一部の実施形態において、異種ポリペプチドおよび／またはＨＮＨドメインは、ジンクフィンガーモチーフ内に存在し、かつ／またはこれを形成する２つのヒスチジンおよび１つのアスパラギンを含む、約２５または３０～約４０または４５アミノ酸を含んでよい。異種ポリペプチドおよび／またはＨＮＨドメインは、ループによって連結されている２つの逆平行ベータ鎖を含んでもよく、かつ／もしくは形成してもよく、かつ／またはアルファヘリックスを含んでもよく、場合によっては、ヒスチジンは、ベータ鎖の少なくとも１つの中に存在し、アスパラギンは、ループ内に存在し、かつ／またはヒスチジンもしくはアスパラギンは、アルファヘリックス内に存在する。異種ポリペプチドは、ＰｅｄｉａｄｉｔａｋｉｓＭ，ｅｔａｌ．ＪｏｕｒｎａｌｏｆＢａｃｔｅｒｉｏｌｏｇｙ１９４（２２）；６１８４－６１９４に記載される構造を有するＨＮＨドメインの全てまたは部分を含んでもよい。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、ＩＩ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質のＨＮＨドメイン、例えばＣａｓ９ＨＮＨドメインの全てまたは部分を含む。操作されたタンパク質の異種ポリペプチドは、不活性であるＨＮＨドメイン（例えば、Ｃａｓ９ＨＮＨドメイン）の全てまたは部分を含んでもよい。ＨＮＨドメインまたはその部分は、不活化変異（例えば、ニッカーゼ活性を除去する変異）を有してもよい。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、不活化変異を有するＨＮＨドメインの全てもしくは部分を含み、かつ／またはＨＮＨドメインは不活性である（例えば、ニッカーゼ活性を有していない）。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、Ｈ８４０Ａ変異を有する不活化ＨＮＨドメインの全てまたは部分を含む。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、配列番号１または１６９～１７４の１つまたは複数のアミノ酸配列に対して少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、または１００％の配列同一性を有するアミノ酸配列を含む。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、配列番号１または１６９～１７４のいずれか１つのアミノ酸配列を含む。

一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、異種ポリペプチドおよび配列番号８１のアミノ酸配列が最適にアラインされている場合に、配列番号８１のアミノ数８３９に対応する位置にてヒスチジン残基でないアミノ酸残基を有するアミノ酸配列を含む。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、異種ポリペプチドおよび配列番号１のアミノ酸配列が最適にアラインされている場合に、配列番号１のアミノ数７５に対応する位置にてヒスチジン残基でないアミノ酸残基を有するアミノ酸配列を含む。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、異種ポリペプチドおよび配列番号８１のアミノ酸配列が最適にアラインされている場合に、配列番号８１のアミノ数８３９に対応する位置にてアラニン残基を有するアミノ酸配列を含む。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、異種ポリペプチドおよび配列番号１のアミノ酸配列が最適にアラインされている場合に、配列番号１のアミノ数７５に対応する位置にてアラニン残基を有するアミノ酸配列を含む。

一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質内に存在する２つの連続または非連続アミノ酸の間にあってもよく、かつ／またはこれらに（例えば、直接的または間接的に）連結してもよい。一部の実施形態において、操作されたタンパク質は、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質またはその部分の２つの連続または非連続アミノ酸の間に異種ポリペプチドを挿入することによって、調製される。一部の実施形態において、操作されたタンパク質は、アミノ末端からカルボキシ末端方向に、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド、異種ポリペプチド、および第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドを含んでよく、第１および第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、同じＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質由来である。

一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、例えばＣａｓ１２ａまたはＣａｓ１２ｂの部分を含む。ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、核酸結合ドメイン、例えばＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、Ｃａｓ１２ａまたはＣａｓ１２ｂ）由来の核酸結合ドメインの全てまたは部分を含んでもよい。一部の実施形態において、操作されたタンパク質のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、配列番号５０～６６または１５１の１つまたは複数のアミノ酸配列の部分に対して少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、または１００％の配列同一性を有するアミノ酸配列を含む。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、配列番号５０～６６または１５１のいずれか１つのアミノ酸配列の部分を含む。一部の実施形態において、操作されたタンパク質は、配列番号５０～６６または１５１のいずれか１つのアミノ酸配列の２つ以上（例えば、２、３、４つ、またはそれを超える）の別個の部分を含む。

一部の実施形態において、本発明の操作されたタンパク質は、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質内に存在する約５、１０、１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０、８５、９０、９５、１００個、またはそれを超えるアミノ酸、例えば配列番号５０～６６または１５１のいずれか１つの配列を有するものが欠けていてもよい。一部の実施形態において、本発明の操作されたタンパク質は、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質内に存在する０、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、または１５個のアミノ酸、例えば配列番号５０～６６または１５１のいずれか１つの配列を有するものが欠けていてもよい。例えば、操作されたタンパク質は、配列番号５０または配列番号５８のアミノ酸残基２８３～アミノ酸残基２９３；配列番号５５のアミノ酸残基３３１～アミノ酸残基３４１；配列番号５１のアミノ酸残基３１２～アミノ酸残基３２２；または配列番号５０、５１、５８、もしくは５５の１つに対して最適にアラインされている配列についての対応するアミノ酸残基（例えば、配列（例えば配列番号５２）が配列番号５０に対して最適にアラインされている場合にアミノ酸残基２８３～２９３に相当するアミノ酸残基）由来の１つまたは複数のアミノ酸が欠けていてもよい。一部の実施形態において、操作されたタンパク質は、ＣＲＩＳＰＲ－Ｃａｓエフェクターの部分が由来し、かつ操作されたタンパク質内に存在するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質内に存在する１つまたは複数の（例えば、１、２、３、４つ、またはそれを超える）ドメイン間リンカー領域（例えば、２つのドメイン、例えば２つの隣接ドメインの間にある領域）（例えば、配列番号５０～６６または１５１のいずれか１つの配列を有するもの）が欠けている。

一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、配列番号５０～６６または１５１のいずれか１つのアミノ酸配列を有するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）の２つの連続または非連続アミノ酸の間にあってもよく、かつ／またはこれらに（例えば、直接的または間接的に）連結されていてもよい。例えば、操作されたタンパク質は、ＮからＣ末端に、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド、ＨＮＨドメイン、および第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドを含んでもよく、第１および第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは各々、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分であり、第１のＣＲＩＳＰＲ－ＣａｓエフェクターポリペプチドのＣ末端の最後のアミノ酸残基、および第２のＣＲＩＳＰＲ－ＣａｓエフェクターポリペプチドのＮ末端の第１のアミノ酸残基は、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の２つの連続または非連続アミノ酸残基である。異種ポリペプチドは、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の２つの連続または非連続アミノ酸の一方または双方に直接連結されていてもよい（すなわち、異種ポリペプチドの一方の末端を、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分であるＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドの末端に付着するのに、リンカーが用いられない）。一部の実施形態において、異種ポリペプチドは、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の２つの連続または非連続アミノ酸の一方または双方に、間接的に（例えば、リンカー、例えばペプチドリンカーを介して）連結されていてもよい。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、配列番号５０～６６または１５１のいずれか１つのアミノ酸配列を有するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）の２つの連続アミノ酸の間にあってもよく、かつ／またはこれらに（例えば、直接的または間接的に）連結されていてもよい。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、配列番号５０～６６または１５１のいずれか１つのアミノ酸配列を有するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）の２つの非連続アミノ酸の間にあってもよく、かつ／またはこれらに（例えば、直接的または間接的に）に連結されていてもよい。

一部の実施形態において、２つの連続または非連続アミノ酸は、それぞれ連続または非連続である、アミノ酸残基２５０、２６０、２７０、または２８０からアミノ酸残基２９０、３００、３１０、３２０、３３０、３４０、または３５０までのアミノ酸残基の２つである。一部の実施形態において、異種ポリペプチドは、以下のアミノ酸残基の２つである２つの連続または非連続アミノ酸の間にあってもよいし、かつ／またはこれらに（例えば、直接的または間接的に）連結されていてもよい：ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、配列番号５０～６６または１５１のいずれか１つのアミノ酸配列を有するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）のアミノ酸残基２５０、２５１、２５２、２５３、２５４、２５５、２５６、２５７、２５８、２５９、２６０、２６１、２６２、２６３、２６４、２６５、２６６、２６７、２６８、２６９、２７０、２７１、２７２、２７３、２７４、２７５、２７６、２７７、２７８、２７９、２８０、２８１、２８２、２８３、２８４、２８５、２８６、２８７、２８８、２８９、２９０、２９１、２９２、２９３、２９４、２９５、２９６、２９７、２９８、２９９、３００、３０１、３０２、３０３、３０４、３０５、３０６、３０７、３０８、３０９、３１０、３１１、３１２、３１３、３１４、３１５、３１６、３１７、３１８、３１９、３２０、３２１、３２２、３２３、３２４、３２５、３２６、３２７、３２８、３２９、３３０、３３１、３３２、３３３、３３４、３３５、３３６、３３７、３３８、３３９、３４０、３４１、３４２、３４３、３４４、３４５、３４６、３４７、３４８、３４９，および３５０。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、配列番号５０～６６または１５１のいずれか１つのアミノ酸配列を有するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）の２つの非連続アミノ酸の間にあってもよく、かつ／またはこれらに（例えば、直接的または間接的に）連結されていてもよく、場合によっては配列番号５０～６６または１５１の、２つの非連続アミノ酸残基の一方が、アミノ酸残基２７０、２７１、２７２、２７３、２７４、２７５、２７６、２７７、２７８、２７９、２８０、２８１、２８２、２８３、２８４、または２８５であり、２つの非連続アミノ酸残基の他方が、アミノ酸残基２８６、２８７、２８８、２８９、２９０、２９１、２９２、２９３、２９４、２９５、２９６、２９７、２９８、２９９、３００、３０１、３０２、３０３、３０４、または３０５である。一部の実施形態において、異種ポリペプチドは、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、例えば配列番号５０～６６または１５１のいずれか１つのアミノ酸配列を有するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質のアミノ酸残基２９０と２９１、アミノ酸残基２９１と２９２、アミノ酸残基２９２と２９３、アミノ酸残基２９３と２９４、アミノ酸残基３２０と３２１、アミノ酸残基３２１と３２２、アミノ酸残基３３９と３４０、またはアミノ酸残基３４０と３４１の間にあり、かつ／またはこれらに（例えば、直接的または間接的に）連結されている。例えば、一部の実施形態において、異種ポリペプチドは、配列番号５０のアミノ酸残基２９０と２９１；配列番号５０のアミノ酸残基２９１と２９２；配列番号５８のアミノ酸残基２９１と２９２；配列番号５８のアミノ酸残基２９２と２９３；配列番号５１のアミノ酸残基３２０と３２１；配列番号５１のアミノ酸残基３２１と３２２；配列番号５１のアミノ酸残基３２２と３２３；配列番号５５のアミノ酸残基３３９と３４０；配列番号５５のアミノ酸残基３４０と３４１；または配列番号５０、５１、５８、もしくは５５の１つに対して最適にアラインされている配列についての対応するアミノ酸残基（例えば、配列（例えば配列番号５２）が、配列番号５０に対して最適にアラインされている場合に、アミノ酸残基２９１および２９２に相当するアミノ酸残基）の間にあってもよく、かつ／またはこれらに（例えば、直接的または間接的に）連結されていてもよい。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質のドメイン間リンカー領域（例えば、２つのドメイン、例えば２つの隣接ドメインの間にある領域）内にあってもよい。一部の実施形態において、異種ポリペプチドは、標的核酸の標的鎖の露出部分に隣接するように、操作されたタンパク質内に配置されていてもよい。

一部の実施形態において、操作されたタンパク質は、ウェッジドメイン、Ｒｅｃ１ドメイン、Ｒｅｃ２ドメイン、ＰＡＭ相互作用ドメイン、ＲｕｖＣドメイン、架橋ヘリックス、および／またはＮｕｃドメインの全てまたは部分を含み、これらは各々、Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、例えば、Ｃａｓ１２ａ、Ｃａｓ１２ｂ、および／または配列番号５０～６６もしくは１５１のいずれか１つの配列を有するタンパク質由来であってもよい。一部の実施形態において、操作されたタンパク質は、Ｙａｍａｎｏ，Ｔａｋａｓｈｉ，ｅｔａｌ．，ＭｏｌＣｅｌｌ６７：６３３－６４５（２０１７）に記載される構造を有するＣａｓ１２ａドメインの全てまたは部分を含む。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、Ｒｅｃ１ドメインの全てまたは部分についてのポリペプチドと、Ｒｅｃ２ドメインの全てまたは部分についてのポリペプチドとの間にあってよく、これらは各々、Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、例えば、Ｃａｓ１２ａ、Ｃａｓ１２ｂ、および／または配列番号５０～６６もしくは１５１のいずれか１つの配列を有するタンパク質由来であってもよい。一部の実施形態において、異種ポリペプチドの全てまたは部分は、操作されたタンパク質の露出表面またはインターフェースにある。一部の実施形態において、操作されたタンパク質のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、ＲｕｖＣドメインの全てまたは部分を含む。当業者であれば理解するように、一部のドメイン（例えば、Ｃａｓ１２ａのウェッジドメインおよびＲｕｖＣドメイン）は、順番が連続せず、そして２つ以上（例えば、２、３、４つ、またはそれを超える）の非連続配列に分割されていてもよい。例えば、Ｃａｓ１２についてのポリペプチドは、Ｎ末端からＣ末端に、ウェッジドメインの第１の部分（ＷＥＤ－１）、Ｒｅｃ１ドメイン、Ｒｅｃ２ドメイン、ウェッジドメインの第２の部分（ＷＥＤ－２）、ＰＡＭ相互作用ドメイン（ＰＩ）、ウェッジドメインの第３の部分（ＷＥＤ－３）、ＲｕｖＣドメインの第１の部分（ＲｕｖＣ－１）、架橋ヘリックス、ＲｕｖＣドメインの第２の部分（ＲｕｖＣ－２）、Ｎｕｃドメイン、およびＲｕｖＣドメインの第３の部分（ＲｕｖＣ－３）を有してもよい。一部の実施形態において、操作されたタンパク質は、活性ＲｕｖＣドメインの全てまたは部分を含む。一部の実施形態において、操作されたタンパク質は、不活化ＲｕｖＣドメインの全てまたは部分、場合によってはＤ１０Ａ変異を有する不活化ＲｕｖＣドメインの全てまたは部分を含む。一部の実施形態において、操作されたタンパク質は、不活化ＲｕｖＣドメインの全てまたは部分を含み、不活化ＲｕｖＣドメインの全てまたは部分を含むポリペプチドは、ポリペプチドが配列番号５０に対して最適にアラインされている場合に、アミノ酸残基８３１配列番号５０に対応する位置にてアラニンを有し、場合によっては、変異は、Ｄ１０Ａおよび／またはＤ８３２Ａ変異と称される。

ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、ヌクレアーゼ、場合によってはＲｕｖＣ様ヌクレアーゼを含んでもよい。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、ＲｕｖＣドメインまたはその部分を含む。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、ＲｎａｓｅＨスーパーファミリー内のヌクレアーゼを含む。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、５つのβ鎖を含む（３２１４５に順序付け）βシートを含んでもよい触媒コアを有するＲＮａｓｅＨ様酵素を含み、場合によっては、β鎖２は、他のβ鎖に対して逆平行である。両側で、中心βシートは、αヘリックスが側面に位置してもよく、その数は、関連する酵素間で異なってもよい。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、ＲＮａｓｅＨ様触媒コアを含み、ここでは、活性部位残基は、アスパラギン酸、グルタミン酸、およびヒスチジンの１つまたは複数を含む。一部の実施形態において、ＲＮａｓｅＨ様触媒コアを含むＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、直接的に、または水分子を介して、二価金属イオンの配位に関与する、ＲＮａｓｅＨ様ポリペプチドの活性部位内に、負に帯電した側鎖を含んでもよい。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、触媒作用の２つのイオン依存性機構を用いるＲＮａｓｅＨ様触媒コアを含み、場合によっては、イオンは、Ｍｇ^２＋および／またはＭｎ^２＋である。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、ＭａｊｏｒｅｋＫＡ，ｅｔａｌ．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２０１４；４２（７）：４１６０－４１７９（その全体が参照によって本明細書に組み込まれる）に記載されるヌクレアーゼおよび／またはＲＮａｓｅＨ様ヌクレアーゼを含む。

一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、１つまたは複数の（例えば、１、２、３、４つ、またはそれを超える）変異を含む。１つまたは複数の変異は、異種ポリペプチドの活性および／またはＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドの活性を向上させるか、または修飾することとなってもよい。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、不活化変異、例えばＲｕｖＣドメイン内のＤ１０Ａ変異を含んでもよい。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、例えば、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、配列番号５０～６６または１５１のいずれか１つのアミノ酸配列を有するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）のアミノ酸残基２４３～２５３の１つまたは複数内の、かつ／または配列GFVTESGEKIK（配列番号１２２）内の、１つまたは複数の（例えば、１、２、３、４つ、またはそれを超える）変異を含むＲｅｃ１ドメインの全てまたは部分を含む。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、ヘアピンおよび／または配列GFVTESGEKIK（配列番号１２２）を含み、ヘアピンおよび／または配列内のアミノ酸残基の１つまたは複数が変異していてもよい。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、ヘアピンおよび／または配列GFVTESGEKIK（配列番号１２２）を含み、ヘアピンおよび／または配列内の全てまたは部分が欠失している。一部の実施形態において、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、ヘアピンおよび／または配列GFVTESGEKIK（配列番号１２２）を含み、１、２、３、４、５つ、またはそれを超えるアミノ酸残基が、ヘアピンおよび／または配列の一方または双方の末端に加えられている。

一部の実施形態において、操作されたタンパク質は、ＮからＣ末端に、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド、ＨＮＨドメイン、および第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドを含み、第１および第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、各々、不活化ＬｂＣａｓ１２ａの部分（例えば、配列番号５０の配列を有するＬｂＣａｓ１２ａ）であり、第１のＣＲＩＳＰＲ－ＣａｓエフェクターポリペプチドのＣ末端の最後のアミノ酸残基および第２のＣＲＩＳＰＲ－ＣａｓエフェクターポリペプチドのＮ末端の第１のアミノ酸残基は、不活化ＬｂＣａｓ１２ａの２つの連続アミノ酸残基である。ＨＮＨドメインは、化膿連鎖球菌Ｃａｓ９（ＳｐＣａｓ９）由来であってもよく、かつ／または配列番号１を含む配列を有してもよい。一部の実施形態において、ＨＮＨドメインは、配列番号１または１６９～１７４のいずれか１つの配列を有してもよい。ＨＮＨドメインは、標的核酸の標的鎖の露出部分に隣接するように、操作されたタンパク質内に配置されていてもよい。操作されたタンパク質は、標的鎖ニッカーゼであってもよい。一部の実施形態において、操作されたタンパク質のみ、標的ＤＮＡ鎖にニックを入れる。一部の実施形態において、操作されたタンパク質は、標的および非標的鎖ニッカーゼである。

１つまたは複数の（例えば、１、２、３、４つ、またはそれを超える）リンカーは、操作されたタンパク質内に存在してもよい。例えば、リンカーは、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドと異種ポリペプチドとの間に存在してもよい。一部の実施形態において、リンカーは、第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドと異種ポリペプチドとの間に存在してもよく、そしてリンカーは、異種ポリペプチドと第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドとの間に存在してもよい。例示的なリンカーとして、以下に限定されないが、本明細書中に記載されるものが挙げられる。一部の実施形態において、リンカーは、１～２、３、４、５、６、７、８、９、もしくは１０個のアミノ酸を含み、かつ／またはグリシンおよび／もしくはセリンを含む。一部の実施形態において、リンカーは、グリシンおよび／またはセリンである１、２、３、または４つのアミノ酸を含む。一部の実施形態において、操作されたタンパク質は、ＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドと異種ポリペプチドとの間で、リンカーが欠けている。一部の実施形態において、異種ポリペプチドは、ＣＲＩＳＰＲ－ＣａｓエフェクターポリペプチドのＮ末端のアミノ酸残基に、リンカーを介して間接的に連結されており、かつ／または異種ポリペプチドは、ＣＲＩＳＰＲ－ＣａｓエフェクターポリペプチドのＣ末端のアミノ酸残基に、リンカーを介して間接的に連結されている。

一部の実施形態において、異種ポリペプチドは、ＣＲＩＳＰＲ－ＣａｓエフェクターポリペプチドのＮ末端のアミノ酸残基に直接（すなわち、リンカー無しで）連結され、かつ／または異種ポリペプチドは、ＣＲＩＳＰＲ－ＣａｓエフェクターポリペプチドのＣ末端のアミノ酸残基に直接（すなわち、リンカー無しで）連結されている。

操作されたタンパク質は、配列番号２～１７、１２５～１３２、または１５７～１６８のいずれか１つに対して少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、またはそれを超える配列同一性を有するアミノ酸配列を含んでもよい。一部の実施形態において、操作されたタンパク質は、配列番号２～１７、１２５～１３２、または１５７～１６８のいずれか１つのアミノ酸配列を含み、かつ／またはこれを有する。操作されたタンパク質は、野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質のアミノ酸配列の全てまたは部分に対して少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、またはそれを超える配列同一性を有してもよい。一部の実施形態において、操作されたタンパク質は、配列番号５０～６６または１５１のいずれか１つのアミノ酸配列の全てまたは部分に対して少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、またはそれを超える配列同一性を有する。一部の実施形態において、操作されたタンパク質は、配列番号５０～６６または１５１のいずれか１つのアミノ酸配列の全てまたは部分に対して約７０％、７５％、または８０％～約８５％、９０％、９５％、または９８％の配列同一性を有する。

操作されたタンパク質は、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、Ｃａｓ１２ａ、配列番号５０～６６もしくは１５１の配列を有するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、および／または野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）と比較して、効率が上昇し得、例えば、標的核酸の標的鎖および／または非標的鎖にニックを入れる効率が上昇し得る。一部の実施形態において、操作されたタンパク質は、標的核酸の標的鎖にニックを入れる効率が、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、Ｃａｓ１２ａ、配列番号５０～６６もしくは１５１の配列を有するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、および／または野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）と比較して、上昇し得る。一部の実施形態において、操作されたタンパク質は、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、Ｃａｓ１２ａ、配列番号５０～６６もしくは１５１の配列を有するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、および／または野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）による標的核酸内の標的鎖切断の数と比較して、標的核酸内の標的鎖切断の数が増加し得る。一部の実施形態において、操作されたタンパク質は、標的核酸を修飾する効率が、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、Ｃａｓ１２ａ、配列番号５０～６６もしくは１５１の配列を有するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、および／または野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）と比較して、上昇し得る。

操作されたタンパク質を含む組成物、複合体、および系は、本発明の実施形態に従って提供され得る。一部の実施形態において、操作されたタンパク質を含む組成物、複合体、および／または系は、塩基編集組成物、複合体、および／または系であってもよい。本発明の組成物、複合体、および／または系は、ガイド核酸（例えばガイドＲＮＡ）および／またはデアミナーゼ（例えば、シトシンデアミナーゼおよび／またはアデニンデアミナーゼ）を含んでもよい。一部の実施形態において、操作されたタンパク質、ガイド核酸、および場合によってはデアミナーゼは、複合体（例えばリボ核タンパク質）を形成するか、または複合体内に含まれる。操作されたタンパク質、ガイド核酸、および場合によってはデアミナーゼは、一緒に天然に存在しなくてもよく、かつ／または操作されたタンパク質、ガイド核酸、および場合によってはデアミナーゼを含む複合体は、一緒に天然に存在しなくてもよい。一部の実施形態において、操作されたタンパク質は、デアミナーゼ（例えば、アデニンデアミナーゼおよび／またはシトシンデアミナーゼ）を含み、かつ／またはこれに融合している。

また、本明細書中で提供されるのは、本発明の操作されたタンパク質を、本発明の核酸分子を含む発現カセットおよび／またはベクターと共にコードする核酸分子である。

一部の実施形態に従えば、標的核酸を、本発明の操作されたタンパク質、ガイド核酸（例えばガイドＲＮＡ）、および場合によってはデアミナーゼと接触させることを含む方法が提供される。一部の実施形態において、操作されたタンパク質、ガイド核酸、および／またはデアミナーゼは、複合体を形成するか、または複合体内に含まれる。一部の実施形態において、方法は、標的核酸を修飾し得、かつ／または標的核酸内に１つもしくは複数の一本鎖切断を提供し得る。

一部の実施形態において、操作されたタンパク質を含む組成物、系、方法、および／または複合体は、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、Ｃａｓ１２ａ、配列番号５０～６６もしくは１５１の配列を有するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、および／または野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）を含む組成物、系、方法、および／または複合体と比較して、効率が上昇し得る。一部の実施形態において、標的鎖ニッカーゼである操作されたタンパク質を含む組成物、系、方法、および／または複合体は、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、Ｃａｓ１２ａ、配列番号５０～６６もしくは１５１の配列を有するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、および／または野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）を含む組成物、系、方法、および／または複合体と比較して、効率が上昇し得る。これは、標的鎖にニックを入れることにより、ゲノム編集ツール、例えば塩基エディタおよび／または塩基ダイバーシファイアーの効率を上昇させ得るからであるかもしれない。一部の実施形態において、操作されたタンパク質を含む組成物、系、方法、および／または複合体は、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、Ｃａｓ１２ａ、配列番号５０～６６もしくは１５１の配列を有するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、および／または野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）を含む組成物、系、方法、および／または複合体による標的核酸内の標的鎖切断の数と比較して、標的核酸内の標的鎖切断の数を増加させ得る。

操作されたタンパク質、ならびに／または操作されたタンパク質を含む組成物、系、方法、および／もしくは複合体は、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、Ｃａｓ１２ａ、配列番号５０～６６もしくは１５１の配列を有するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、および／または野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）と、かつ／またはＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、Ｃａｓ１２ａ、配列番号５０～６６もしくは１５１の配列を有するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、および／または野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）を含む組成物、系、方法、および／もしくは複合体と比較して、インデルサイズおよび／もしくは組成の向上もしくは改変、標的核酸内の欠失サイズの向上もしくは改変、いずれかの鎖（すなわち、標的核酸の標的または非標的鎖）へのニッキング能力の向上もしくは改変、ならびに／またはヌクレアーゼ活性の増大を実現し得る。一部の実施形態において、操作されたタンパク質、ならびに／または操作されたタンパク質を含む組成物、系、方法、および／もしくは複合体は、触媒的に不活化されたＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質上にヌクレアーゼ機能を与える。一部の実施形態において、操作されたタンパク質、ならびに／または操作されたタンパク質を含む組成物、系、方法、および／もしくは複合体は、Ｃａｓエフェクタータンパク質（例えば、Ｃａｓ１２ａ、配列番号５０～６６もしくは１５１の配列を有するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、および／または野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）、ならびに／またはＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、Ｃａｓ１２ａ、配列番号５０～６６もしくは１５１の配列を有するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、および／または野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）を含む組成物、系、方法、および／もしくは複合体についての標的核酸の編集プロファイルおよび／または様々な切断パターンと比較して、標的核酸についての様々な編集プロファイルおよび／または様々な切断パターンを提供する。

一部の実施形態において、本発明の方法は、対照方法（例えば、標的核酸を、ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、Ｃａｓ１２ａ、配列番号５０～６６もしくは１５１の配列を有するＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、および／または野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質）と接触させることを含み、かつ／または操作されたタンパク質を欠く方法）の効率と比較して、標的核酸を改変する効率が上昇し得る。

本明細書中に記載されるように、本発明の操作されたタンパク質、核酸、発現カセット、および／またはベクターは、生物における発現のためにコドン最適化されていてもよい。本発明に有用な生物は、核酸修飾が有用であり得るあらゆる生物またはその細胞であってよい。生物として、以下に限定されないが、あらゆる動物（例えば哺乳動物）、あらゆる植物、あらゆる真菌、あらゆる古細菌、またはあらゆる細菌が挙げられ得る。一部の実施形態において、生物は、植物またはその細胞であってもよい。一部の実施形態において、生物は、動物、例えば哺乳動物（例えばヒト）である。

標的核酸は、あらゆる生物（例えば真核生物、例えば、哺乳動物または植物）由来のゲノム配列であってもよい。一部の実施形態において、標的核酸は、以下に限定されないが、大腸菌、不死化ヒト細胞株（例えば、ＨＥＫ２９３、ＨｅＬａ、その他）、線虫（Ｃａｅｎｏｒｈａｂｄｉｔｉｓｅｌｅｇａｎｓ）、および／またはキイロショウジョウバエ（ＤｒｏｓｏｐｈｉｌａＭｅｌａｎｏｇａｓｔｅｒ）等のモデル生物由来のゲノム配列である。一部の実施形態において、標的核酸は、非モデル生物由来のゲノム配列である。例示的な非モデル生物として、以下に限定されないが、作物植物（例えば、果実作物植物、蔬菜作物植物、および／または農作物植物）ならびに／または動物、例えば、ヒト、霊長類、および／もしくはマウスが挙げられる。一部の実施形態において、非モデル生物は、作物植物、例えば、トウモロコシ、ダイズ、コムギ、またはキャノーラである。一部の実施形態において、非モデル生物は、ヒト治療薬を試験するための、かつ／またはこれに用いられる動物である。

あらゆる植物または植物部分の標的核酸が、本発明の核酸構築体を用いて修飾され得る。被子植物、裸子植物、単子葉植物、双子葉植物、Ｃ３、Ｃ４、ＣＡＭ植物、蘚苔門の植物、シダおよび／もしくはシダ綱以外のシダ、微細藻類、ならびに／または大型藻類が挙げられるあらゆる植物（または、例えば、属もしくはより高次の分類への植物のグループ化）が、本発明の操作されたタンパク質を用いて修飾され得る。本発明に有用な植物および／または植物部分は、あらゆる植物種／変種／品種の植物および／または植物部分であってよい。本明細書中で用いられる用語「植物部分」は、以下に限定されないが、胚、花粉、胚珠、種子、葉、幹、シュート、花卉、枝、果実、仁、穂、コッブ、外皮、茎、根、根端、葯、植物細胞（植物および／または植物の部分において無傷の植物細胞、植物プロトプラスト、植物組織、植物細胞組織培養体、植物カルス、植物塊等が挙げられる）が挙げられる。本明細書中で用いられる「シュート」は、葉および幹を含む地上部を指す。さらに、本明細書中で用いられる「植物細胞」は、植物の構造的生理学的単位を指し、これは、細胞壁を含み、そしてまたプロトプラストを指し得る。植物細胞は、単離された単一の細胞の形態であってもよいし、培養された細胞であってもよいし、より高度に組織化された単位、例えば植物組織または植物器官の一部であってもよい。

本発明に有用な植物の非限定的な例として、芝草（例えば、ブルーグラス、ベントグラス、ライグラス、ウシノケグサ属）、ウモウヨシ、ヒロハノコメススキ、ススキ属、ダンチク属、スイッチグラス、蔬菜作物（アーティチョーク、コールラビ、キバナスズシロ、ニラネギ、アスパラガス、レタス（例えば、サラダ菜、リーフレタス、タチチシャ）、マランガ、メロン（例えば、マスクメロン、スイカ、クレンショーメロン、ハネデューメロン、カンタロープ）、アブラナ属作物（例えば、メキャベツ、キャベツ、カリフラワー、ブロッコリー、コラード、ケール、ハクサイ、パクチョイ）、カルドニ（ｃａｒｄｏｎｉ）、ニンジン、ハクサイ、オクラ、タマネギ、セロリ、パセリ、ヒヨコマメ、パースニップ、チコリ、コショウ、ジャガイモ、ウリ科植物（例えば、マロウ、キュウリ、ズッキーニ、スカッシュ、カボチャ、ハネデューメロン、スイカ、カンタロープ）、ハツカダイコン、乾球タマネギ、ルタバガ、ナス、セイヨウゴボウ、キクヂシャ、エシャロット、エンダイブ、ニンニク、ホウレンソウ、ネギ、スカッシュ、グリーン、ビート（シュガービートおよび飼料ビート）、サツマイモ、フダンソウ、セイヨウワサビ、トマト、カブ、およびスパイスが挙げられる）、果実作物、例えば、リンゴ、アプリコット、チェリー、ネクタリン、モモ、西洋ナシ、プラム、プルーン、チェリー、マルメロ、イチジク、ナッツ（例えば、クリ、ペカン、ピスタチオ、ヘイゼルナッツ、ピスタチオ、ピーナッツ、クルミ、マカダミアナッツ、アーモンド等）、柑橘類（例えば、クレメンタイン、キンカン、オレンジ、グレープフルーツ、タンジールミカン、ミカン、レモン、ライム等）、ブルーベリー、ブラックラズベリー、ボイゼンベリー、クランベリー、カランツ、グズベリー、ローガンベリー、ラズベリー、ストロベリー、ブラックベリー、ブドウ（ワイン用および食用）、アボカド、バナナ、キーウィ、柿、ザクロ、パイナップル、トロピカルフルーツ、梨状果、メロン、マンゴー、パパイア、およびライチ、農作物植物、例えば、クローバー、アルファルファ、チモシー、マツヨイグサ、メドウフォーム、トウモロコシ（飼料用、スイートコーン、ポップコーン）、ホップ、ホホバ、ソバ、ベニバナ、キノア、コムギ、イネ、オオムギ、ライムギ、キビ、モロコシ、エンバク、ライコムギ、モロコシ、タバコ、カポック、マメ科植物（インゲンマメ（例えば、サヤインゲンおよび乾燥インゲンマメ）、レンズマメ、エンドウ、ダイズ）、油料植物（ナタネ、キャノーラ、マスタード、ポピー、オリーブ、ヒマワリ、ココナッツ、ヒマシ油植物、カカオ豆、落花生、アブラヤシ）、ウキクサ、シロイヌナズナ属、繊維植物（ワタ、アマ、アサ、ジュート）、カンナビス（例えば、アサ（Ｃａｎｎａｂｉｓｓａｔｉｖａ）、インド麻（Ｃａｎｎａｂｉｓｉｎｄｉｃａ）、およびカンナビス・ルデラリス（Ｃａｎｎａｂｉｓｒｕｄｅｒａｌｉｓ））、クスノキ科（シナモン、カンファー）、もしくはコーヒー、サトウキビ、チャ、および天然ゴム植物等の植物、ならびに／または花壇用花卉、例えば、顕花植物、サボテン、多肉植物、および／もしくは観賞植物（例えば、バラ、チューリップ、スミレ）、ならびに樹木、例えば森林樹木（広葉樹および常緑植物、例えば針葉樹、例えば、ニレ、トネリコ、オーク、カエデ、モミ、トウヒ、スギ、マツ、カバノキ、イトスギ、ユーカリノキ、ヤナギ）、ならびに潅木および他の苗木が挙げられる。一部の実施形態において、本発明の核酸構築体、ならびに／または同上をコードする発現カセットおよび／もしくはベクターは、トウモロコシ、ダイズ、コムギ、キャノーラ、イネ、トマト、コショウ、ヒマワリ、ラズベリー、ブラックベリー、ブラックラズベリー、および／またはチェリーを修飾するのに用いられ得る。

一部の実施形態において、本発明は、本発明のポリペプチド、ポリヌクレオチド、核酸構築体、発現カセット、またはベクターを含む細胞（例えば、植物細胞、動物細胞、細菌細胞、古細菌細胞等）を提供する。

本発明はさらに、本発明の方法を実行するためのキットを含む。本発明のキットは、標的核酸を修飾するのに適切な、混合、測定、ソーティング、標識その他用の試薬、バッファ、および装置、ならびに説明書等を含み得る。

一部の実施形態において、本発明は、本発明の１つもしくは複数の核酸構築体を含むキット、ならびに／または本明細書中に記載される同上を含む発現カセットおよび／もしくはベクターおよび／もしくは細胞を、場合によってはその使用説明書と共に提供する。一部の実施形態において、キットはさらに、ＣＲＩＳＰＲ－Ｃａｓガイド核酸（本発明のポリヌクレオチドによってコードされていてもよい、操作されたタンパク質に対応する）、ならびに／または同上を含む発現カセットおよび／もしくはベクターおよび／もしくは細胞を含んでもよい。一部の実施形態において、ガイド核酸は、本発明の１つまたは複数の核酸構築体と同じ発現カセットおよび／またはベクター上に提供されてもよい。一部の実施形態において、ガイド核酸は、本発明の１つまたは複数の核酸構築体を含むものとは別個の発現カセットまたはベクター上に提供されてもよい。

したがって、一部の実施形態において、（ａ）本明細書中で提供されるポリヌクレオチド、および（ｂ）（ａ）のポリヌクレオチドの発現を駆動するプロモーターを含む核酸構築体を含むキットが提供される。一部の実施形態において、キットはさらに、ガイド核酸をコードする核酸構築体を含んでもよく、構築体は、標的核酸配列と同一であるか、またはこれと相補的な核酸配列の、ガイド核酸の骨格中へのクローニング用のクローニング部位を含む。

一部の実施形態において、本発明の核酸構築体は、コードされるポリヌクレオチド内に１つまたは複数のイントロンをコードしていてもよいｍＲＮＡであってもよい。一部の実施形態において、本発明の核酸構築体、ならびに／または同上を含む発現カセットおよび／もしくはベクター構築体はさらに、形質転換体を識別するのに有用な１つまたは複数の選択マーカー（例えば、抗生物質耐性遺伝子、除草剤耐性遺伝子等をコードする核酸）をコードしていてもよい。

本発明のポリペプチド、ポリヌクレオチド、核酸構築体、発現カセット、ベクター、組成物、キット、系、および／または細胞は、配列番号１～１７５の１つまたは複数の配列の全てまたは部分を含んでもよい。一部の実施形態において、本発明のポリペプチド、ポリヌクレオチド、核酸構築体、発現カセット、ベクター、組成物、キット、系、および／または細胞は、配列番号１～１７５の１つまたは複数の配列の少なくとも約２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、またはそれを超える連続アミノ酸を含んでもよい。

次に、本発明を、以下の実施例を参照して説明する。これらの実施例は、特許請求の範囲を本発明に限定することは意図されず、むしろ特定の実施形態の例示となることが意図されることが認識されるべきである。当業者が思い浮かべる、例示される方法におけるあらゆる変形が、本発明の範囲に入ることが意図される。

［実施例１］
既存のドメイン注釈を、ＰｙＭＯＬ（ＴｈｅＰｙＭＯＬＭｏｌｅｃｕｌａｒＧｒａｐｈｉｃｓＳｙｓｔｅｍ，Ｖｅｒｓｉｏｎ２．０．Ｓｃｈｒｏｄｉｎｇｅｒ，ＬＬＣ）内のＳｐＣａｓ９結晶構造（ＰＤＢＩＤ４ＵＮ３）の目視検査と共に用いて、ＳｐＣａｓ９由来の完全ＨＮＨドメイン（図３）を最初に特定して、その残基境界を決定した。ドメインは、結晶構造が大部分解かれているが、ＨＮＨドメインのＮ末端をＲｅｃ１ドメインに連結するいくつかの残基は、結晶構造が解かれていない。また、ＨＮＨドメインと比較したＣａｓ９標的ＤＮＡ鎖切断部位の位置に注目した。この相対配向を、Ｃａｓ１２ａの標的ＤＮＡ鎖と比較した、ＨＮＨドメインの以降の合理的な位置決めにおいて、模倣した。

次に、ＬｂＣａｓ１２ａ三元複合体（ＰＤＢＩＤ５ＸＵＳ）の結晶構造を調べて、標的ＤＮＡ鎖のアクセス可能領域の位置決めをした。標的ＤＮＡ／ｃｒＲＮＡデュプレックスの、ＲｕｖＣドメインに最も近い側が、他のＣａｓ１２ａドメインによってかなり遮蔽されているが、Ｒｅｃ１ドメインとＲｅｃ２ドメインとの間のインターフェースにて（図４）、タンパク質の反対側に、標的ＤＮＡの露出部分（図４内で左の矢印によって示す）が存在する。２つのドメインを連結するリンカー（図４内で右の矢印によって示す）が、この露出部位に隣接しており、ＬｂＣａｓ１２ａ内の他の残基との相互作用はごく少数である。当該リンカーを、ドメイン挿入のための候補部位として選択した。

次に、ＬｂＣａｓ１２ａと比較したＳｐＣａｓ９ＨＮＨドメインの正確な配置を決定するために、ＬｂＣａｓ１２ａのＲｅｃ１ドメインとＲｅｃ２ドメインとの間の溝内に露出するＤＮＡ塩基を特定した。続いて、ＨＮＨドメインおよびその標的ＤＮＡ（切断部位の両側の２つの塩基を有する４つの塩基）をユニットとして扱って、ＨＮＨ標的ＤＮＡの、ＬｂＣａｓ１２ａの露出標的鎖へのアラインメントを、ＨＮＨドメインを挿入ループの近くに配置して、ＬｂＣａｓ１２ａの他のドメインとの衝突を最小にするアラインメントが特定されるまで、ＰｙＭＯＬを用いてスライディングウィンドウ内で試験した。続いて、ＨＮＨドメインの位置を、ＰｙＭＯＬを用いてマニュアルで調整して、ＨＮＨとＣａｓ１２ａとの間の衝突を最小にした。

ＨＮＨドメインの最終の選択位置を図５に示す。ＨＮＨドメインのＣ末端は、挿入ループのＣ末端に非常に近い一方、ＨＮＨＮ末端は、挿入ループから比較的遠い。しかしながら、この構造は、ＳｐＣａｓ９Ｒｅｃ１ドメインおよびＨＮＨドメインを連結する、構造化されていない残基を含まない。標的ＤＮＡ／ｃｒＲＮＡデュプレックスと相互作用するこの領域内の高度に保存されたヘアピンを、後の設計のための潜在的部位としてさらに特定した。

計算リンカーモデリングのためのＣａｓ１２ａ－ＨＮＨ融合構造を調製するために、ＨＮＨドメインのＮ末端を最初に、ＰｙＭＯＬを用いて、Ｒｅｃ１ドメインおよびＨＮＨドメインを連結する（そして、ＳｐＣａｓ９結晶構造が解かれていない）ＳｐＣａｓ９から、残基を追加することによって伸長させた。結果として生じた構造を、表１内に示す挿入ループの至る所にある考えられる挿入部位中にＨＮＨドメイン残基を挿入するカスタムＰｙｔｈｏｎスクリプトを用いて、リンカーモデリングのためにエクスポートして調製した。

続いて、Ｒｏｓｅｔｔａ巨大分子モデリングソフトウェアパッケージ内に含まれるＲｏｓｅｔｔａＲｅｍｏｄｅｌプロトコール（ＨｕａｎｇＰ．Ｓ．ｅｔａｌ２０１１）を用いて、迅速な計算スクリーンを実行して、リンカー切断部位の２つの末端に連結するＨＮＨドメイン末端の能力を試験した。挿入点毎に、ループ閉鎖の１０回の繰返し（配列設計も挿入もない）を実行した。１０回の繰返しのうち、リンカーが首尾よく連結することができる回数を集計して、比較した（表１）。続いて、これらの挿入部位のうちの２つを、成功したループ閉鎖および手動の検査の速度の組合せに基づいて、リンカー長の変動を含む、より徹底的なリンカーモデリングについて選択した（表１内でボールド体で示す）。

続いて、２つの選択した挿入部位について、細粒試験（ｆｉｎｅ－ｇｒａｉｎｅｄｔｅｓｔｉｎｇ）を、Ｎ末端リンカーおよびＣ末端リンカー内の小さな（２～４残基）グリシン－セリン挿入または欠失により、そしてより徹底的なサンプリング（各々１００回の繰返し）により実行した。欠失用の考えられる残基を、配列の手動検査に基づいて選択した。リンカーモデリング結果に基づいて、Ｎ末端リンカーの０、２、または４残基の伸長部、およびＣ末端リンカーの０または２残基の伸長部を含む、８つの設計（挿入部位毎に４つ）を、実験的試験について選択した。

［実施例２］
８つのＬｂＣａｓ１２ａ－ＨＮＨ構築体（ＨＮＨ－３２８７、ＨＮＨ－３２８８、ＨＮＨ－３２８９、ＨＮＨ－３２９０、ＨＮＨ－３２９６、ＨＮＨ－３２９７、ＨＮＨ－３２９８、およびＨＮＨ－３２９９）についてのＤＮＡコード領域を、固相合成を用いて６－ヒスチジンタグと共に合成した。コード領域を、ｐＥＴ２８ａプラスミド（Ｎｏｖａｇｅｎ）に、誘導性Ｔ７プロモーターの後方に円錐形にして、ＢＬ２１（ＤＥ３）－Ｓｔａｒ細胞（Ｉｎｖｉｔｒｏｇｅｎ）中に形質移入して、カナマイシン上にプレーティングした。単一のコロニーを、３０ｍｌのＬｕｒｉａＢｒｏｔｈ中で３７℃にて、０．５のＡ６００光学濃度まで増殖させた。５００ｍＭＩＰＴＧを加えて、１８時間の発現のために、温度を１８℃に下げた。細胞をペレット化して、ＢｕｇＢｕｓｔｅｒＭａｓｔｅｒＭｉｘ（Ｍｉｌｌｉｐｏｒｅ）と共に、メーカーの指示に従って溶解させた。細胞片をペレット化して、可溶性の画分を、４～１２％Ｂｉｓ－ＴｉｓＰＡＧＥゲル（Ｉｎｖｉｔｒｏｇｅｎ）上で、還元条件下で画像化して、クマシー染色を用いて視覚化した。８つのＨＮＨ構築体は全て、おおよそ１６０ｋＤａのＭＷにて、可溶性のタンパク質発現を示した（図６、矢印）。

Ｃａｓ１２ａタンパク質の中央にＨＮＨヌクレアーゼを含有する８つの構築体全てについての可溶性タンパク質発現は、融合設計の質に言及する。タンパク質の中央への大きなドメインの挿入により、多くの場合、不溶性のタンパク質発現が生じ、または大腸菌内での発現が生じない。高度に発現されている８つのタンパク質全ての観察は、キメラタンパク質が適切に折り畳まれていること、そしてタンパク質折畳みの破壊に至っていないことを示唆している。

発現プロトコールを反復して、ヌクレアーゼアッセイに適したタンパク質を生成した。８つの構築体をペレット化した後に、大腸菌細胞を凍結して、解凍して、バッファＡ（２０ｍＭＨＥＰＥＳ－ＫＯＨｐＨ７．５、５００ｍＭＮａＣｌ、１０％グリセロール、２ｍＭＴＣＥＰ、および１０ｍＭイミダゾールｐＨ７．５）中に懸濁させた。０．３ｍｇ／ｍｌリゾチームを加えて、細胞を室温にて２０分間インキュベートしてから、１／８インチチップ、２５％の力、１０秒のバーストの後に３０秒の静置、２．２５分間による超音波処理（ＱＳｏｎｉｃａ）を続ける。細胞片をペレット化して、上清をＮｉ－ＮＴＡアガロース（Ｂｉｏ－Ｒａｄ）上にロードして、バッファＡ中２０ｍＭイミダゾールで洗浄して、バッファＡ中３００ｍＭイミダゾールで溶出した。タンパク質のおおよその濃度は、２００μＬの総溶出液中０．５～２ｍｇ／ｍｌ（ＮａｎｏＤｒｏｐＡ２８０吸光度によって推定）であった。

［実施例３］
プラスミドベースのアッセイを用いて、ニッキング活性を、精製したＨＮＨ－３２８７、ＨＮＨ－３２８８、ＨＮＨ－３２８９、ＨＮＨ－３２９０、ＨＮＨ－３２９６、ＨＮＨ－３２９７、およびＨＮＨ－３２９８によって評価した。プラスミドニッキングアッセイは、細菌から抽出したスーパーコイルプラスミドが、アガロースゲル上で、線状化ダブルカットプラスミドよりも短く泳動されるという原理に基づいて、機能する。さらに、１つの鎖のみにニックが入れられれば、プラスミドは、線状化プラスミドよりもずっと長く泳動される。このアッセイは、酵素が二本鎖ヌクレアーゼまたは一本鎖ヌクレアーゼであるかを評価するのに、ＣＲＩＳＰＲ分野において広範囲にわたって用いられている（Ｊｉｎｅｋｅｔａｌ．，Ｓｃｉｅｎｃｅ．２０１２Ａｕｇ１７；３３７（６０９６）：８１６－２１）（Ｚｅｔｓｃｈｅｅｔａｌ．，Ｃｅｌｌ．２０１５Ｏｃｔ２２；１６３（３）：７５９－７１）。

配列5'-TTTAGGAAT CCCTTCTGC AGCACCTGG-3'（配列番号１２３）（プロトスペーサー隣接モチーフ（ＰＡＭ）はボールド体である）を合成して、ｐＵＣ１８プラスミド中にクローニングした。プラスミドをＤＨ５α細胞内で発現させて、プラスミドミニプレップキット（Ｑｉａｇｅｎ）を用いて精製した。配列5'-AAUUUCUACU AAGUGUAGAU GGAAUCCCUU CUGCAGCACC UGG-3'（配列番号１２４）（プラスミドに賞賛的な部分を太字にしている）によるいかなる化学修飾もないＣＲＩＳＰＲＲＮＡ分子を合成した（Ｓｙｎｔｈｅｇｏ）。３０μＬの反応液を、１０：１０：１のＲＮＡ：タンパク質：プラスミド比でアセンブルして、３７℃にて１５分間インキュベートして、８５℃にて２分間熱不活化して、１／１００ｖ／ｖＳＹＢＲ－Ｓａｆｅ染料（Ｉｎｖｉｔｒｏｇｅｎ）を含有する１％アガロースゲル上にロードした。

試験したタンパク質は、野生型ＬｂＣａｓ１２ａ（ｗｔＬｂＣａｓ１２ａ）、ＬｂＣａｓ１２ａ－Ｒ１１３８Ａ、および種々のキメラＨＮＨタンパク質であった。Ｒ１１３８Ａは、ＡｓＣａｓ１２ａ（Ｒ１２２６Ａ）についての知られている非鋳型鎖ニッカーゼ変異に対応するＬｂＣａｓ１２ａ内の点変異である（ＹａｍａｎｏＴ，ｅｔａｌ．Ｃｅｌｌ．２０１６Ｍａｙ５；１６５（４）：９４９－６２）。試験した濃度は、ｗｔＬｂＣａｓ１２ａおよびＬｂＣａｓ１２ａ－Ｒ１１３８について、３３ｎＭであった。より低い９ｎＭを、種々のＨＮＨ構築体に用いて、完全なニッキングを生成するのではなく、予想されるＫｄに幾分近いことによって、最も活性なヌクレアーゼを見分けた。

結果として生じたゲル（図７）は、ＨＮＨ－３２８７、ＨＮＨ－３２８８、ＨＮＨ－３２８９、ＨＮＨ－３２９０、ＨＮＨ－３２９６、ＨＮＨ－３２９７、およびＨＮＨ－３２９８が全て、低い９ｎＭタンパク質濃度にて約２５％効率～約７５％効率（上部のバンド、ニックを入れられたプラスミドを、下部のバンド、スーパーコイルプラスミドと比較）であるニッキングのパーセンテージを有するニッカーゼであることを示している。インキュベーションが長いほど、または濃度が高いほど、ニッキングは完全になるが、相対的変異活性の比較はできない。キメラＨＮＨ－３２９８は、ニッキング活性のパーセンテージが最も高いようであり、３７℃にて１５分間で９ｎＭ［タンパク質］である。

［実施例４］
方法
タンパク質の発現および精製
発現および活性の最初の試験について、Ｈｉｓタグ付けしたタンパク質、SYN3287（配列番号１２５）、SYN3288（配列番号１２６）、SYN3289（配列番号１２７）、SYN3290（配列番号１２８）、SYN3296（配列番号１２９）、SYN3297（配列番号１３０）、SYN3298（配列番号１３１）、およびSYN3299（配列番号１３２）、を、３０ｍＬ培養液中のＢＬ２１細胞内で発現させた。各タンパク質は、活性ＨＮＨドメインおよび不活化ＲｕｖＣドメインを含んだ。細胞をペレット化して、一晩中凍結させて、超音波処理によって溶解した。続いて、ＨｉｓＰｕｒ（商標）Ｎｉ－ＮＴＡスピンカラムを用いて、タンパク質を溶解液から粗精製した。

ＳＹＮ３２９８およびＳＹＮ３２８９のアッセイについて、タンパク質を、以下の変化を伴って同じように発現させた：タンパク質を、１Ｌ培養液中で発現させて、ＨｉｓＴｒａｐ－ＨＦカラムを用いてＦＰＬＣによって精製した。注目するタンパク質を含有する画分を、陽イオン交換によってさらに精製して、５０％グリセロール中で貯蔵した。

プラスミドニッカーゼアッセイ
ニッカーゼまたはヌクレアーゼとしての精製タンパク質の活性を判定するために、１×ＮＥバッファ３．１、１００フェントモルのＤＮＡ基質、ならびに等部の精製タンパク質および適切なガイドＲＮＡ（特に明記しない限り、各々１ピコモル）を含有する３０μＬ反応液を調製した。反応を、３７℃にて３０分間インキュベートして、室温にて２０分のプロテイナーゼＫ消化によって止めて、１％アガロースゲル上で分離した。プラスミドニッカーゼアッセイ用の標的部位は、配列番号１３３の配列を有した。

蛍光ニッカーゼアッセイ
１つの標識ＤＮＡ鎖（配列番号１３４）および１つの非標識ＤＮＡ鎖（配列番号１３５）を、Ｃｙ５で標識した基質を生成するために、ＰＡＭ含有鎖または非ＰＡＭ含有鎖上にアニーリングすることによって、ＤＮＡ基質を生成した。このアッセイ用のスペーサーは、配列番号１５０の配列を含んだ。ニッキング反応を、プラスミドニッカーゼアッセイについて記載したように調製して、３７℃にて３０分間インキュベートした。プロテイナーゼＫにより試料を１０分間消化することによって、反応を止めた。続いて、全ての試料を、尿素ローディングバッファと混合して、１×濃度にして、９０℃まで５分間加熱して、基質を変性させた。６％ＴＢＥ尿素ゲル上で４℃、１００Ｖにて泳動することによって、試料を分離した。

ＨＥＫ２９３Ｔ細胞形質移入
真核ＨＥＫ２９３Ｔ（ＡＴＣＣＣＲＬ－３２１６）細胞を、１０％（ｖ／ｖ）ＦＢＳ（ＦＢＳ）を補充したダルベッコ改変イーグル培地プラスＧｌｕｔａＭａｘ（ＴｈｅｒｍｏＦｉｓｈｅｒ）内で、５％ＣＯ_２、３７℃にて培養した。タンパク質構成要素を、遺伝子合成を用いて合成してから、ＣＭＶプロモーターを有するプラスミドにクローニングした。ガイドＲＮＡを、ヒトＵ６プロモーターによりクローニングした。ＨＥＫ２９３Ｔ細胞を、４８ウェルコラーゲンコーティングＢｉｏＣｏａｔプレート（Ｃｏｒｎｉｎｇ）上に播種した。細胞を、約７０％のコンフルエンシーにて形質移入した。３７５ｎｇのＣＲＩＳＰＲプラスミドおよび１２５ｎｇのガイドＲＮＡ発現プラスミドを、メーカーのプロトコールに従って、ウェルあたり１．５μｌのリポフェクタミン３０００（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を用いて形質移入した。形質移入した細胞由来のゲノムＤＮＡを３日後に得て、高スループットＩｌｌｕｍｉｎａアンプリコン配列決定を用いて、インデルを検出して定量化した。

設計したタンパク質がどの鎖に優先的にニックを入れるかを判定するために、Ｃａｓ９ガイド、および同じ鎖上の設計したタンパク質のためのガイドが、互いの近くで（約１０ｂｐ以内）切れるように、ガイドの対を設計した。試験した各設計が、ヌクレアーゼデッドＳｐＣａｓ９、ＳｐＣａｓ９Ｄ１０Ａ標的鎖ニッカーゼ、またはＳｐＣａｓ９Ｈ８４０Ａ非標的鎖ニッカーゼと対形成した。合成ニッカーゼおよびその対形成したＣａｓ９ニッカーゼが反対側の鎖を切るならば、二本鎖切断の生成に起因して、同じ鎖を切る場合よりも大きな編集頻度が予想された。

結果
Ｈｉｓタグ付けした設計合成ニッカーゼは、ＢＬ２１大腸菌内で首尾よく発現された。
先に述べたように設計したニッカーゼの粗精製後、全ての試料は、図８に示すような予想されるサイズ（約１６０ｋＤａ）にてバンドを示した。このことは、ニッカーゼが大腸菌内で可溶性で発現されたことを示している。

合成ニッカーゼの粗精製から観察された、最初のプラスミドニッキング活性。
プラスミドニッカーゼアッセイを、図８に示す粗ニッカーゼ精製を用いて、先の方法の節に記載するように実行した。一部の精製からの収量が低いことに起因して、設計した全てのニッカーゼを、直接的に比較することができるような低い濃度にて試験した。図９において分かるように、設計の１つの他は全て、陰性対照試料におけるよりも顕著な、ニックが入ったプラスミドの存在を示すバンドを示した。このことは、設計が、ＤＮＡ基質にニックを入れることができることを示唆している。

粗精製した合成ニッカーゼを用いるプラスミドニッキングのＲＮＡ依存性。
プラスミドの観察されたニッキングおよび切断が、ガイド依存性であり、かつランダムなヌクレアーゼ活性に起因しなかったことを確実にするために、プラスミドニッカーゼアッセイを、標的化ｃｒＲＮＡの存在下での選択した設計について、反復した。設計ＳＹＮ３２８８、ＳＹＮ３２９６、およびＳＹＮ３２９８は全て、図１０において分かるように、ｃｒＲＮＡの存在下で、存在する非切断プラスミドの量の引下げを示した。このことは、これらのヌクレアーゼ活性がＲＮＡ依存性であることを示している。

精製した合成ニッカーゼＳＹＮ３２９８のプラスミドニッキング活性。
様々な量のタンパク質＋ガイドを、用いたＬｂＣａｓ１２ａ対照の濃度（例えば、３０×は、３０ピコモルのタンパク質およびガイドが、反応液内に含まれることを示す）と比較して試験した。プラスミドのニッキング、およびそれほどではないにせよ切断を、ＳＹＮ３２９８の全ての試験した濃度にて観察した（図１１）。このことは、この設計がＤＮＡニッカーゼとしての機能を果たすことを確認している。

精製した合成ニッカーゼＳＹＮ３２９８およびＳＹＮ３２８９を用いる蛍光ニッカーゼアッセイ。
標的（図１２）または非標的（図１３）上の蛍光Ｃｙ５標識を有する基質を、設計したニッカーゼ（活性ＨＮＨドメインおよび不活化ＲｕｖＣドメインを含む）、ＬｂＣａｓ１２ａ、またはＬｂＣａｓ１２ａＲ１１３８Ａ変異体（非標的鎖ニッカーゼ）とインキュベートして、変性ＴＢＥ－尿素ゲル上で分離した。標識バンドの位置のシフトは、その鎖が切断されたことを示している。図１４は、標識標的鎖とインキュベートした試料についてのゲルの部分を示し、図１５は、標識非標的鎖とインキュベートした試料についてのゲルの部分を示し、図１６は、対照、標識標的鎖とインキュベートした試料（「ａ」と表す囲まれたレーン）、および標識非標的鎖とインキュベートした試料（「ｂ」と表す囲まれたレーン）についてのレーンを有するゲル全体を示す。ＳＹＮ３２９８は、非標的ＤＮＡ鎖ではなく標的ＤＮＡ鎖用の切断基質について予想される位置のバンドを示す。このことはこれが、標的鎖ニッカーゼとしての機能を果たすことを示している。

ＨＥＫ２９３Ｔ細胞内のゲノムＤＮＡの配列ベースの鎖特異的ニッカーゼアッセイ。
合成ニッカーゼを、標的鎖（例えばＣａｓ９（Ｄ１０Ａ））または非標的鎖（例えばＣａｓ９（Ｈ８４０Ａ））を切る、直ぐ近くのＣａｓ９ニッカーゼ（例えばＣａｓ９（Ｈ８４０Ａ）またはＣａｓ９（Ｄ１０Ａ））と共に同時形質移入した。配列ベースの鎖特異的ニッカーゼアッセイに用いたスペーサーに関する情報を、表２に記載する。上流のガイドは、どのスペーサーがＰＡＭ含有ＤＮＡ鎖の５’末端のより近くで切れると予想されるかについて言及する。切られた部位間の推定距離を、固有のヌクレアーゼドメイン毎の予測切断部位に基づいて決定した。

Ｃａｓ９ニッカーゼが、同じ標的部位にてヌクレアーゼデッドＬｂＣａｓ１２ａと対形成した場合のインデルの観察レベルに対して、酵素対毎の編集効率を正規化した（図１７）。図１７における括弧内の数字は、正規化の前に観察された編集効率を示す。合成酵素（ＳＹＮ）（すなわち、ＳＹＮ３２８９、ＳＹＮ３２９０、またはＳＹＮ３２９８）が優先的に標的鎖を切るならば、（Ｈ４８０Ａ：：ＳＹＮ）／（Ｄ１０Ａ：：ＳＹＮ）＞１である。合成酵素（ＳＹＮ）（すなわち、ＳＹＮ３２８９、ＳＹＮ３２９０、またはＳＹＮ３２９８）が優先的に非標的鎖を切るならば、（Ｈ４８０Ａ：：ＳＹＮ）／（Ｄ１０Ａ：：ＳＹＮ）＜１である。

設計したタンパク質がどの鎖に優先的にニックを入れるかを判定するために、Ｃａｓ９ガイド、および同じ鎖上の設計したタンパク質のためのガイドが、互いの近くで（約１０ｂｐ以内）切れるように、ガイドの対を設計した。試験した各設計が、ヌクレアーゼデッドＳｐＣａｓ９、ＳｐＣａｓ９Ｄ１０Ａ標的鎖ニッカーゼ、またはＳｐＣａｓ９Ｈ８４０Ａ非標的鎖ニッカーゼと対形成した。合成ニッカーゼおよびその対形成したＣａｓ９ニッカーゼが反対側の鎖を切るならば、二本鎖切断の生成に起因して、同じ鎖を切る場合よりも大きな編集頻度が見られると予想された。インデル頻度の増大（約３倍の増大）は、全ての設計したニッカーゼが、Ｃａｓ９非標的鎖ニッカーゼと対形成された場合に、Ｃａｓ９標的鎖ニッカーゼと比較して、一貫して観察された。このことは、設計されたニッカーゼが、標的ＤＮＡ鎖を優先的に切ることを示している。

［実施例５］
Ａ３Ａシトシンデアミナーゼ（配列番号１５２）を、ＳＹＮ３２８９、ＳＹＮ３２９０、またはＳＹＮ３２９８と組み合わせる塩基エディタのためのシトシン塩基編集データを得た（図１８～２１）。３つのアーキテクチャを、酵素毎に試験した：配列番号１６０～１６２を提供するための、リンカー（配列番号２２）を用いた合成酵素のＮ末端へのＡ３Ａの融合、および配列番号４５のリンカーを用いた合成酵素のＣ末端へのＵＧＩ（配列番号１０４）の融合；配列番号１６３～１６５を提供するための、以前に公開されたリンカー（配列番号１５３；Ｌｉｅｔａｌ．ＮａｔＢｉｏｔｅｃｈｎｏｌ３６，３２４－３２７（２０１８））を用いた合成酵素のＮ末端へのＡ３Ａの融合、および配列番号１５４のリンカーを用いた合成酵素のＣ末端へのＵＧＩ（配列番号１０４）の融合；または配列番号１５７～１５９の１つのペプチドタグ付けした合成酵素に動員される配列番号１５６を提供するための、Ａ３Ａ（配列番号１５２）のＣ末端に融合したＵＧＩ（配列番号１０４）のＳｕｎｔａｇベースの動員。図１８～２１に示す全てのパーセンテージは、３つのデータポイントの全体にわたる平均を示す。試験した酵素は全て、試験した構成の３つ全てにおけるシトシン塩基編集を示した。図１８についてのスペーサーは、配列番号１４４であり、図１９についてのスペーサーは、配列番号１４５であり、図２０についてのスペーサーは、配列番号１４６であり、図２１についてのスペーサーは、配列番号１４７であった。

［実施例６］
ＴａｄＡ８ｅアデニンデアミナーゼへのＮ末端融合体としての合成酵素ＳＹＮ３２８９、ＳＹＮ３２９０、およびＳＹＮ３２９８についてのアデニン塩基編集データを得た（図２２～２３）。配列番号１６６～１６８を提供するためのリンカー（配列番号４７）を用いて、合成酵素をＴａｄＡ８ｅ（配列番号１５５）に融合させた。図２２～２３に示す全てのパーセンテージは、３つのデータポイントの全体にわたる平均を示す。試験した３つの設計は全て、ＴａｄＡ８ｅと融合した場合のアデニン塩基編集活性を示した。図２２についてのスペーサーは、配列番号１４８であり、図２３についてのスペーサーは、配列番号１４９であった。

前述のものは、本発明の実例であり、その限定と解釈されるべきでない。本発明は、以下の特許請求の範囲によって定義され、特許請求の範囲の均等物もその中に含まれるべきである。

Claims

少なくとも２つの異なるポリペプチドを含む操作されたタンパク質であって、
前記少なくとも２つの異なるポリペプチドの一方が、第１のＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の第１の部分である第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドであり、前記第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドは、ヌクレアーゼドメインが欠けており；
前記少なくとも２つの異なるポリペプチドのもう１つが、前記第１のＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質に対して異種であり、かつＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分でない異種ポリペプチドである、
操作されたタンパク質。
前記異種ポリペプチドが、約１０～約２００アミノ酸長を有し、かつ／または前記第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドが、約１００～約４００アミノ酸長を有し、場合によっては、前記異種ポリペプチドが、約１４０～約１６０アミノ酸長を有し、かつ／または前記第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドが、約２５０～約３５０アミノ酸長を有する、請求項１に記載の操作されたタンパク質。
前記異種ポリペプチドが、前記第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドに対して異種である第１のヌクレアーゼドメインまたはその部分を含む、請求項１または２に記載の操作されたタンパク質。
前記異種ポリペプチドが、標的鎖ニッカーゼドメインまたはその部分を含み、場合によっては、前記異種ポリペプチドが、標的鎖特異的ニッカーゼドメイン、非標的鎖特異的ニッカーゼドメイン、または標的および非標的鎖ニッカーゼドメインを含む、請求項１～３のいずれか一項に記載の操作されたタンパク質。
第２のヌクレアーゼドメインまたはその部分を含む第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドをさらに含み、場合によっては、前記第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドおよび前記第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドが、非連続的である（すなわち、互いに（場合によっては、少なくとも１０、５０、１００、またはそれを超えるアミノ酸だけ）分離しており、かつ互いに直接付着していない）、請求項１～４のいずれか一項に記載の操作されたタンパク質。
前記異種ポリペプチドが、前記第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドに対して異種である、請求項５に記載の操作されたタンパク質。
前記第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドおよび前記第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドが各々、同じ前記ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分（例えば、異なる部分）である、請求項５または６に記載の操作されたタンパク質。
前記第２のヌクレアーゼドメインまたはその部分が、非標的および標的鎖ニッカーゼドメインまたはその部分である、請求項５～７のいずれか一項に記載の操作されたタンパク質。
前記第２のヌクレアーゼドメインが活性である、請求項５～８のいずれか一項に記載の操作されたタンパク質。
前記第２のヌクレアーゼドメインが不活性である、請求項５～８のいずれか一項に記載の操作されたタンパク質。
前記異種ポリペプチドがＨＮＨドメインを含み、場合によっては、前記ＨＮＨドメインが、ＨＮＨドメインの活性を修飾する変異（例えばＨ８４０Ａ変異）を含む、請求項１～１０のいずれか一項に記載の操作されたタンパク質。
前記第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドおよび前記第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドが各々、第１のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分であり、前記異種ポリペプチドが、前記第１のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の２つの連続アミノ酸または非連続アミノ酸である２つのアミノ酸の間にあり、かつ／またはこれらに（例えば、直接的または間接的に）連結されている、請求項５～１１のいずれか一項に記載の操作されたタンパク質。
前記異種ポリペプチドが、前記第１のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質のドメイン間リンカー領域に対応する位置において、前記操作されたタンパク質内に配置されている、請求項１２に記載の操作されたタンパク質。
前記異種ポリペプチドが、配列番号１または１６９～１７４の１つまたは複数に対して少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、またはそれを超える配列同一性を有するアミノ酸配列を含み、場合によっては、前記異種ポリペプチドが、配列番号１または１６９～１７４のいずれか１つのアミノ酸配列を含む、請求項１～１３のいずれか一項に記載の操作されたタンパク質。
前記操作されたタンパク質が、アミノ末端からカルボキシ末端方向に、前記第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド、前記異種ポリペプチド、および前記第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドを含み、場合によっては、前記第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドが、約８００～約１，１００アミノ酸（例えば、約９００～約９５０または１，０００アミノ酸）長を有する、請求項５～１４のいずれか一項に記載の操作されたタンパク質。
前記第１のＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質のウェッジドメイン、Ｒｅｃ１ドメイン、Ｒｅｃ２ドメイン、ＰＡＭ相互作用ドメイン、ＲｕｖＣドメイン、架橋ヘリックス、および／またはＮｕｃドメインの全てまたは部分をさらに含み、場合によっては、前記操作されたタンパク質が、Ｃａｓ１２ａまたはＣａｓ１２ｂのウェッジドメイン、Ｒｅｃ１ドメイン、Ｒｅｃ２ドメイン、ＰＡＭ相互作用ドメイン、ＲｕｖＣドメイン、架橋ヘリックス、および／またはＮｕｃドメインの全てまたは部分を含む、請求項１～１５のいずれか一項に記載の操作されたタンパク質。
前記操作されたタンパク質が、前記Ｒｅｃ１ドメインおよび前記Ｒｅｃ２ドメインを含み、前記異種ポリペプチドが、前記Ｒｅｃ１ドメインと前記Ｒｅｃ２ドメインとの間にある、請求項１６に記載の操作されたタンパク質。
前記第１のＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の少なくとも一部分が欠けており、場合によっては、Ｃａｓ１２ａまたはＣａｓ１２ｂの少なくとも一部分が欠けている、請求項１～１７のいずれか一項に記載の操作されたタンパク質。
前記第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドと前記異種ポリペプチドとの間に第１のリンカーを、かつ／または前記異種ポリペプチドと前記第２のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドとの間に第２のリンカーをさらに含む、請求項５～１８のいずれか一項に記載の操作されたタンパク質。
前記第１のリンカーおよび／または前記第２のリンカーが、１～１０個のアミノ酸を含み、場合によっては、前記第１のリンカーおよび／または前記第２のリンカーが、１、２、３、または４つのアミノ酸を含む、請求項１９に記載の操作されたタンパク質。
前記第１のリンカーおよび／または前記第２のリンカーが、グリシンおよび／またはセリンを含む、請求項１９または２０に記載の操作されたタンパク質。
前記操作されたタンパク質が、野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質のアミノ酸配列に対して約７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、またはそれを超える配列同一性を有するアミノ酸配列を含み、場合によっては、前記操作されたタンパク質が、配列番号５０～６６または１５１のいずれか１つに対して少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、またはそれを超える配列同一性を有するアミノ酸配列を含む、請求項１～２１のいずれか一項に記載の操作されたタンパク質。
前記操作されたタンパク質が、配列番号２～１７、１２５～１３２、または１５７～１６８のいずれか１つに対して約７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、またはそれを超える配列同一性を有するアミノ酸配列を含み、場合によっては、前記操作されたタンパク質が、配列番号２～１７、１２５～１３２、または１５７～１６８のいずれか１つのアミノ酸配列を含む、請求項１～２２のいずれか一項に記載の操作されたタンパク質。
前記操作されたタンパク質がヌクレアーゼであり、場合によっては、前記操作されたタンパク質が、標的鎖ニッカーゼ、非標的鎖ニッカーゼ、または標的および非標的鎖ニッカーゼである、請求項１～２３のいずれか一項に記載の操作されたタンパク質。
ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、および／または配列番号５０～６６または１５１の１つの配列を有するタンパク質）と比較して、前記操作されたタンパク質の、標的核酸の標的鎖および／または非標的鎖にニックを入れる効率が上昇している、請求項１～２４のいずれか一項に記載の操作されたタンパク質。
標的鎖ニッカーゼドメインまたはその部分であり、かつＶ型ヌクレアーゼドメインまたはその部分でない第１のヌクレアーゼドメインと；
Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分である第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドと
を含む、操作されたタンパク質。
前記第１のヌクレアーゼドメインが、標的鎖特異的ニッカーゼドメイン、または標的および非標的鎖ニッカーゼドメインである、請求項２６に記載の操作されたタンパク質。
第２のヌクレアーゼドメインをさらに含み、場合によっては、前記第２のヌクレアーゼドメインが、非標的および標的鎖ニッカーゼドメインまたはその部分である、請求項２７または２８に記載の操作されたタンパク質。
前記第２のヌクレアーゼドメインが活性である、請求項２８に記載の操作されたタンパク質。
前記第２のヌクレアーゼドメインが不活性である、請求項２８に記載の操作されたタンパク質。
前記第１のヌクレアーゼドメインがＨＮＨドメインを含み、場合によっては、前記ＨＮＨドメインが、不活化変異（例えばＨ８４０Ａ変異）を含む、請求項２６～３０のいずれか一項に記載の操作されたタンパク質。
前記第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドおよび前記第２のヌクレアーゼドメインが各々、第１のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の部分であり、前記第１のヌクレアーゼドメインが、前記第１のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の２つの連続アミノ酸または非連続アミノ酸の間にあり、かつ／またはこれらに（例えば、直接的または間接的に）連結されている、請求項２８～３１のいずれか一項に記載の操作されたタンパク質。
前記第１のヌクレアーゼドメインが、前記第１のＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質のドメイン間リンカー領域に対応する位置において、前記操作されたタンパク質内に配置されている、請求項３３に記載の操作されたタンパク質。
前記第１のヌクレアーゼドメインが、配列番号１または１６９～１７４の１つまたは複数に対して少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、またはそれを超える配列同一性を有するアミノ酸配列を含み、場合によっては、前記第１のヌクレアーゼドメインが、配列番号１または１６９～１７４のいずれか１つのアミノ酸配列を含む、請求項２６～３３のいずれか一項に記載の操作されたタンパク質。
アミノ末端からカルボキシ末端方向に、前記第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチド、前記第１のヌクレアーゼドメイン、および前記第２のヌクレアーゼドメインをさらに含む、請求項２６～３４のいずれか一項に記載の操作されたタンパク質。
前記Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質のウェッジドメイン、Ｒｅｃ１ドメイン、Ｒｅｃ２ドメイン、ＰＡＭ相互作用ドメイン、ＲｕｖＣドメイン、架橋ヘリックス、および／またはＮｕｃドメインの全てまたは部分をさらに含み、場合によっては、前記操作されたタンパク質が、Ｃａｓ１２ａまたはＣａｓ１２ｂのウェッジドメイン、Ｒｅｃ１ドメイン、Ｒｅｃ２ドメイン、ＰＡＭ相互作用ドメイン、ＲｕｖＣドメイン、架橋ヘリックス、および／またはＮｕｃドメインの全てまたは部分を含む、請求項２６～３５のいずれか一項に記載の操作されたタンパク質。
前記操作されたタンパク質が、前記Ｒｅｃ１ドメインおよび前記Ｒｅｃ２ドメインを含み、前記第１のヌクレアーゼドメインが、前記Ｒｅｃ１ドメインと前記Ｒｅｃ２ドメインとの間にある、請求項３６に記載の操作されたタンパク質。
前記Ｖ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の少なくとも一部分が欠けており、場合によっては、Ｃａｓ１２ａまたはＣａｓ１２ｂの少なくとも一部分が欠けている、請求項２６～３７のいずれか一項に記載の操作されたタンパク質。
前記第１のＣＲＩＳＰＲ－Ｃａｓエフェクターポリペプチドと前記第１のヌクレアーゼドメインとの間に第１のリンカーを、かつ／または前記第１のヌクレアーゼドメインと前記第２のヌクレアーゼドメインとの間に第２のリンカーをさらに含む、請求項２８～３８のいずれか一項に記載の操作されたタンパク質。
前記第１のリンカーおよび／または前記第２のリンカーが、１～１０個のアミノ酸を含み、場合によっては、前記第１のリンカーおよび／または前記第２のリンカーが、１、２、３、または４つのアミノ酸を含む、請求項３９に記載の操作されたタンパク質。
前記第１のリンカーおよび／または前記第２のリンカーが、グリシンおよび／またはセリンを含む、請求項３９または４０に記載の操作されたタンパク質。
前記操作されたタンパク質が、野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質に対して少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、またはそれを超える配列同一性を有するアミノ酸配列を含み、場合によっては、前記操作されたタンパク質が、配列番号５０～６６または１５１のいずれか１つに対して少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、またはそれを超える配列同一性を有するアミノ酸配列を含む、請求項２６～４１のいずれか一項に記載の操作されたタンパク質。
前記操作されたタンパク質が、配列番号２～１７、１２５～１３２、または１５７～１６８のいずれか１つに対して少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、またはそれを超える配列同一性を有するアミノ酸配列を含み、場合によっては、前記操作されたタンパク質が、配列番号２～１７、１２５～１３２、または１５７～１６８のいずれか１つのアミノ酸配列を含む、請求項２６～４２のいずれか一項に記載の操作されたタンパク質。
前記操作されたタンパク質がヌクレアーゼであり、場合によっては、前記操作されたタンパク質が、標的鎖ニッカーゼ、非標的鎖ニッカーゼ、または標的および非標的鎖ニッカーゼである、請求項２６～４２のいずれか一項に記載の操作されたタンパク質。
ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、および／または配列番号５０～６６または１５１の１つの配列を有するタンパク質）と比較して、前記操作されたタンパク質の、標的核酸の標的鎖および／または非標的鎖にニックを入れる効率が上昇している、請求項２６～４４のいずれか一項に記載の操作されたタンパク質。
配列番号２～１７、１２５～１３２、または１５７～１６８のいずれか１つに対して少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、またはそれを超える配列同一性を有するアミノ酸配列を含む操作されたタンパク質であって、場合によっては、配列番号２～１７、１２５～１３２、または１５７～１６８のいずれか１つのアミノ酸配列を有する操作されたタンパク質。
第１のＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の第１の部分である第１のポリペプチドと；
前記第１のＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質の第２の部分である第２のポリペプチドと；
前記第１のＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質に対して異種である異種ポリペプチドと
を含む操作されたタンパク質であって、
前記異種ポリペプチドが、前記第１のポリペプチドと前記第２のポリペプチドとの間にあり、前記異種ポリペプチドが、前記第１のＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質のドメイン間リンカー領域に対応する位置において、前記操作されたタンパク質内に配置されている、
操作されたタンパク質。
前記ドメイン間リンカー領域が、配列番号５０のアミノ酸残基２８３～２９３の、または配列番号５０に対して最適にアラインされている配列についての対応するアミノ酸残基（例えば、配列（例えば配列番号５２）が、配列番号５０に対して最適にアラインされている場合に、アミノ酸残基２８３～２９３に相当するアミノ酸残基）の１つまたは複数のアミノ酸を含む、請求項４７に記載の操作されたタンパク質。
第１のポリペプチドが、前記第１のＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質のウェッジドメインおよび／もしくはＲｅｃ１ドメインの全てもしくは部分を含み；かつ／または
前記第２のポリペプチドが、前記第１のＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質のウェッジドメイン、Ｒｅｃ２ドメイン、ＰＡＭ相互作用ドメイン、ＲｕｖＣドメイン、架橋ヘリックス、および／もしくはＮｕｃドメインの全てもしくは部分を含む、
請求項４７または４８に記載の操作されたタンパク質。
前記操作されたタンパク質が、前記Ｒｅｃ１ドメインおよび前記Ｒｅｃ２ドメインを含み、前記異種ポリペプチドが、前記Ｒｅｃ１ドメインと前記Ｒｅｃ２ドメインとの間にある、請求項４９に記載の操作されたタンパク質。
前記第１のＶ型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、Ｃａｓ１２ａまたはＣａｓ１２ｂ）の少なくとも一部分が欠けている、請求項４７～５０のいずれか一項に記載の操作されたタンパク質。
前記異種ポリペプチドが、標的鎖ニッカーゼドメインまたはその部分を含み、場合によっては、前記異種ポリペプチドが、標的鎖特異的ニッカーゼドメイン、非標的鎖特異的ニッカーゼドメイン、または標的および非標的鎖ニッカーゼドメインを含む、請求項４７～５１のいずれか一項に記載の操作されたタンパク質。
前記第２のポリペプチドが、ヌクレアーゼドメインまたはその部分を含み、場合によっては、前記ヌクレアーゼドメインまたはその部分が、非標的および標的鎖ニッカーゼドメインまたはその部分（例えば、ＲｕｖＣドメインまたはその部分）である、請求項４７～５２のいずれか一項に記載の操作されたタンパク質。
前記ヌクレアーゼドメインが活性である、請求項５３に記載の操作されたタンパク質。
前記ヌクレアーゼドメインが不活性である、請求項５３に記載の操作されたタンパク質。
前記異種ポリペプチドがＨＮＨドメインを含み、場合によっては、前記ＨＮＨドメインが、ＨＮＨドメインの活性を修飾する変異（例えばＨ８４０Ａ変異）を含む、請求項４７～５５のいずれか一項に記載の操作されたタンパク質。
前記異種ポリペプチドが、配列番号１または１６９～１７４の１つまたは複数に対して少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、またはそれを超える配列同一性を有するアミノ酸配列を含み、場合によっては、前記異種ポリペプチドが、配列番号１または１６９～１７４のいずれか１つのアミノ酸配列を含む、請求項４７～５６のいずれか一項に記載の操作されたタンパク質。
前記第１のポリペプチドと前記異種ポリペプチドとの間に第１のリンカーを、かつ／または前記異種ポリペプチドと前記第２のポリペプチドとの間に第２のリンカーをさらに含む、請求項４７～５７のいずれか一項に記載の操作されたタンパク質。
前記第１のリンカーおよび／または前記第２のリンカーが、１～１０個のアミノ酸を含み、場合によっては、前記第１のリンカーおよび／または前記第２のリンカーが、１、２、３、または４つのアミノ酸を含む、請求項５８に記載の操作されたタンパク質。
前記第１のリンカーおよび／または前記第２のリンカーが、グリシンおよび／またはセリンを含む、請求項５８または５９に記載の操作されたタンパク質。
前記操作されたタンパク質が、野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質のアミノ酸配列に対して約７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、またはそれを超える配列同一性を有するアミノ酸配列を含み、場合によっては、前記操作されたタンパク質が、配列番号５０～６６または１５１のいずれか１つに対して少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、またはそれを超える配列同一性を有するアミノ酸配列を含む、請求項４７～６０のいずれか一項に記載の操作されたタンパク質。
前記操作されたタンパク質が、配列番号２～１７、１２５～１３２、または１５７～１６８のいずれか１つに対して約７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、またはそれを超える配列同一性を有するアミノ酸配列を含み、場合によっては、前記操作されたタンパク質が、配列番号２～１７、１２５～１３２、または１５７～１６８のいずれか１つのアミノ酸配列を含む、請求項４７～６１のいずれか一項に記載の操作されたタンパク質。
前記操作されたタンパク質がヌクレアーゼであり、場合によっては、前記操作されたタンパク質が、標的鎖ニッカーゼ、非標的鎖ニッカーゼ、または標的および非標的鎖ニッカーゼである、請求項４７～６２のいずれか一項に記載の操作されたタンパク質。
ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質（例えば、野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質、および／または配列番号５０～６６または１５１の１つの配列を有するタンパク質）と比較して、前記操作されたタンパク質の、標的核酸の標的鎖および／または非標的鎖にニックを入れる効率が上昇している、請求項４７～６３のいずれか一項に記載の操作されたタンパク質。
請求項１～６４のいずれか一項に記載の操作されたタンパク質；
ガイド核酸（例えばガイドＲＮＡ）、および
場合によってはデアミナーゼ
を含む組成物（例えば塩基編集組成物）または系であって、
場合によっては、前記操作されたタンパク質、前記ガイド核酸、および場合によっては前記デアミナーゼが、複合体を形成するか、または複合体内に含まれる、
組成物（例えば塩基編集組成物）または系。
請求項１～６４のいずれか一項に記載の操作されたタンパク質；
ガイド核酸（例えばガイドＲＮＡ）；および
場合によってはデアミナーゼ
を含む複合体。
請求項１～６４のいずれか一項に記載の操作されたタンパク質をコードするヌクレオチド配列を含む核酸分子。
請求項６７に記載の核酸分子、または請求項１～６４のいずれか一項に記載の操作されたタンパク質をコードするヌクレオチド配列を含む発現カセットまたはベクター。
標的核酸を修飾する方法であって、
前記標的核酸を、
請求項１～６４のいずれか一項に記載の操作されたタンパク質、および
ガイド核酸（例えばガイドＲＮＡ）
と接触させることによって、前記標的核酸を修飾することを含み、
場合によっては、前記操作されたタンパク質および前記ガイド核酸が、複合体を形成するか、または複合体内に含まれる、
方法。
対照方法（例えば、前記標的核酸を、野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質と接触させることを含む方法）の効率と比較して、前記標的核酸を修飾し、かつ／または標的核酸の標的鎖および／もしくは非標的鎖にニックを入れる効率が上昇した、請求項６９に記載の方法。
標的核酸を修飾する効率を上昇させる方法であって、
前記標的核酸を、
請求項１～６４のいずれか一項に記載の操作されたタンパク質、および
ガイド核酸（例えばガイドＲＮＡ）
と接触させることによって、前記標的核酸を修飾することによって、対照方法（例えば、前記標的核酸を、野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質と接触させることを含み、前記操作されたタンパク質を欠く方法）と比較して、前記標的核酸を修飾する効率を上昇させることを含み、
場合によっては、前記操作されたタンパク質および前記ガイド核酸が、複合体を形成するか、または複合体内に含まれる、
方法。
前記標的核酸が、真核細胞内に存在し、場合によっては、前記標的核酸が、植物細胞内に存在する、請求項６９～７１のいずれか一項に記載の方法。
前記操作されたタンパク質が、前記標的核酸に、野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質についての標的核酸の編集プロファイルと比較して異なる編集プロファイルを提供する、請求項６９～７２のいずれか一項に記載の方法。
前記操作されたタンパク質が、前記標的核酸に、野生型ＣＲＩＳＰＲ－Ｃａｓエフェクタータンパク質についての標的核酸の切断パターンと比較して異なる切断パターンを提供する、請求項６９～７３のいずれか一項に記載の方法。