JP2019534695A

JP2019534695A - Ｒｎａ誘導型核酸修飾酵素及びその使用方法

Info

Publication number: JP2019534695A
Application number: JP2019517246A
Authority: JP
Inventors: エー．ダウドナ，ジェニファー; エフ．バンフィールド，ジリアン; バースタイン，デイビッド; ベンジャミンハリントン，ルーカス
Original assignee: University of California
Current assignee: University of California
Priority date: 2016-09-30
Filing date: 2017-09-28
Publication date: 2019-12-05
Anticipated expiration: 2037-09-28
Also published as: CN110418647B; GB201905581D0; KR20190072548A; JP2023030067A; IL265599A; KR20230169449A; AU2017335883A1; EP3532089A4; CN110418647A; US11371062B2; AU2017335883B2; GB2569734B; BR112019006388A2; JP7306696B2; MX2019003678A; EA201990860A1; GB2569734A; SA519401442B1; CA3038982A1; EP3532089A1

Abstract

本開示は、ＣａｓＹタンパク質、ＣａｓＹタンパク質をコードする核酸、ならびにＣａｓＹタンパク質及び／またはそれをコードする核酸を含む改変宿主細胞を提供する。ＣａｓＹタンパク質は、提供される多様な用途に有用である。本開示は、ＣａｓＹタンパク質に結合して、ＣａｓＹタンパク質に配列特異性を与えるＣａｓＹガイドＲＮＡ、ＣａｓＹガイドＲＮＡをコードする核酸、ならびにＣａｓＹガイドＲＮＡ及び／またはそれをコードする核酸を含む改変宿主細胞を提供する。ＣａｓＹガイドＲＮＡは、提供される多様な用途に有用である。本開示は、ＣＲＩＳＰＲＲＮＡ誘導型エンドヌクレアーゼを同定する方法を提供する。

Description

ＣＲＩＳＰＲ−Ｃａｓシステムは、ＤＮＡシーケンシングの時代以前の科学では未知であった経路の一例であるが、今ではファージ及びウイルスに対する獲得免疫を細菌及び古細菌に付与するものであることがわかっている。過去１０年間の集中的研究により、このシステムの生化学が明らかになった。

ＣＲＩＳＰＲ−Ｃａｓシステムは、外来ＤＮＡまたはＲＮＡの獲得、標的化、及び切断に関与するＣａｓタンパク質と、Ｃａｓタンパク質をその標的に誘導する短いスペーサー配列に隣接する直列反復配列を含むＣＲＩＳＰＲ配列からなる。クラス２のＣＲＩＳＰＲ−Ｃａｓは簡素化型であり、ＲＮＡに結合された単一のＣａｓタンパク質が、標的配列への結合とその切断を担う。

このようなプログラム可能な性質をもつ最小限のシステムにより、汎用技術としての使用が可能になったことで、ゲノム操作の分野に変革がもたらされつつある。

現在のＣＲＩＳＰＲ−Ｃａｓ技術は、培養細菌に由来するシステムに基づいているため、単離されていない大部分の生物は未開発のままである。今のところ、クラス２のＣＲＩＳＰＲ／Ｃａｓシステムは、ごくわずかしか発見されていない。さらなるクラス２のＣＲＩＳＰＲ／Ｃａｓシステム（例えば、Ｃａｓタンパク質とガイドＲＮＡとの組み合わせ）が当技術分野で必要とされている。

本開示は、本明細書で「ＣａｓＹ」ポリペプチド（別称「ＣａｓＹタンパク質」）と称するＲＮＡ誘導型エンドヌクレアーゼポリペプチド；ＣａｓＹポリペプチドをコードする核酸；ならびにＣａｓＹポリペプチド及び／またはそれをコードする核酸を含む改変宿主細胞を提供する。ＣａｓＹポリペプチドは、提供される多様な用途に有用である。

本開示は、ＣａｓＹタンパク質に結合して、ＣａｓＹタンパク質に配列特異性を与えるガイドＲＮＡ（本明細書で「ＣａｓＹガイドＲＮＡ」とも称する）；ＣａｓＹガイドＲＮＡをコードする核酸；ならびにＣａｓＹガイドＲＮＡ及び／またはそれをコードする核酸を含む改変宿主細胞を提供する。ＣａｓＹガイドＲＮＡは、提供される多様な用途に有用である。

本開示は、ＣＲＩＳＰＲＲＮＡ誘導型エンドヌクレアーゼを同定する方法を提供する。

天然ＣａｓＹタンパク質配列の例を示す。天然ＣａｓＹタンパク質配列の例を示す。天然ＣａｓＹタンパク質配列の例を示す。天然ＣａｓＹタンパク質配列の例を示す。天然ＣａｓＹタンパク質配列のアライメントを示す。天然ＣａｓＹタンパク質配列のアライメントを示す。天然ＣａｓＹタンパク質配列のアライメントを示す。天然ＣａｓＹタンパク質配列のアライメントを示す。天然ＣａｓＹタンパク質配列のアライメントを示す。天然ＣａｓＹタンパク質配列のアライメントを示す。天然ＣａｓＹタンパク質配列のアライメントを示す。天然ＣａｓＹタンパク質配列のアライメントを示す。天然ＣａｓＹタンパク質配列のアライメントを示す。天然ＣａｓＹタンパク質配列のアライメントを示す。天然ＣａｓＹタンパク質配列のアライメントを示す。天然ＣａｓＹタンパク質配列のアライメントを示す。天然ＣａｓＹタンパク質配列のアライメントを示す。天然ＣａｓＹタンパク質配列のアライメントを示す。（パネルＡ及びＢ）ＣａｓＹドメインの模式図を示す。ＣａｓＹのホモログの同定を試行する様々な検索から得た結果も示している。また、同定されたＣａｓＹを含むＣＲＩＳＰＲ遺伝子座の部分も図示している。（パネルＡ及びＢ）ＣａｓＹドメインの模式図を示す。ＣａｓＹのホモログの同定を試行する様々な検索から得た結果も示している。また、同定されたＣａｓＹを含むＣＲＩＳＰＲ遺伝子座の部分も図示している。ＣａｓＹ及びＣ２ｃ３遺伝子座の模式図を示す。干渉タンパク質を緑で、取り込みタンパク質を赤で示している。ＲＮＡ構造を利用して折り畳まれるリピートを右側に示す。５’末端に強度のヘアピンが表れており、ＣａｓＹによるＣＲＩＳＰＲ配列の自己プロセシングを示唆している。ＣａｓＹ及びＣ２ｃ３遺伝子座の模式図を示す。干渉タンパク質を緑で、取り込みタンパク質を赤で示している。ＲＮＡ構造を利用して折り畳まれるリピートを右側に示す。５’末端に強度のヘアピンが表れており、ＣａｓＹによるＣＲＩＳＰＲ配列の自己プロセシングを示唆している。ＣａｓＹ及びＣ２ｃ３遺伝子座の模式図を示す。干渉タンパク質を緑で、取り込みタンパク質を赤で示している。ＲＮＡ構造を利用して折り畳まれるリピートを右側に示す。５’末端に強度のヘアピンが表れており、ＣａｓＹによるＣＲＩＳＰＲ配列の自己プロセシングを示唆している。（パネルＡ〜Ｄ）ＣａｓＹのＰＡＭ配列を決定するために実施した実験（ＣａｓＹによるＰＡＭ依存性プラスミド干渉）を示す。（パネルＡ〜Ｄ）ＣａｓＹのＰＡＭ配列を決定するために実施した実験（ＣａｓＹによるＰＡＭ依存性プラスミド干渉）を示す。（パネルＡ及びＢ）天然ＣａｓＹガイドＲＮＡの「リピート」配列、及び標的ＤＮＡにハイブリダイズするＣａｓＹガイドＲＮＡの例を表す。（上から下へ、配列番号１１〜１５、及び２０）（パネルＡ及びＢ）未培養生物から新規同定されたＣＲＩＳＰＲ−Ｃａｓシステムを表す。Ａは、Ｈｕｇｅｔａｌ．３２のデータに基づいた、すべての細菌及び古細菌のうち、単離された標本のある主要系統または単離された標本のない主要系統が占める比率である。この結果は、これらのドメインで大部分の生物学がほとんど未研究であることを明らかにしている。古細菌Ｃａｓ９及び新規ＣＲＩＳＰＲ−ＣａｓＹは、単離された標本のない系統でのみ見出された。Ｂは、新たに発見されたＣＲＩＳＰＲ−Ｃａｓシステムの遺伝子座構成である。（パネルＡ及びＢ）ＡＲＭＡＮ−１ＣＲＩＳＰＲ配列の多様性、及びＡＲＭＡＮ−１Ｃａｓ９ＰＡＭ配列の同定を示す。Ａは、１５種類のＡＭＤ試料から再構成されたＣＲＩＳＰＲ配列である。白いボックスはリピートを示し、カラーのひし形はスペーサーを示す（同一のスペーサーは同色であり、一意なスペーサーは黒色である）。配列の保存領域を（右側に）ハイライト表示している。最近獲得されたスペーサー（左側）の多様性は、システムが活動性であることを示す。リードデータからのＣＲＩＳＰＲ断片も含む分析を図１４に示す。Ｂは、ＡＭＤメタゲノムデータから再構成した単一の推定ウイルスコンティグが、ＡＲＭＡＮ−１ＣＲＩＳＰＲ配列からの５６のプロトスペーサー（赤い垂直バー）を含むことを示す。（パネルＣ）非標的鎖上のプロトスペーサー下流の保存された「ＮＧＧ」ＰＡＭモチーフを明らかにした配列分析を示す。（パネルＡ及びＢ）ＣａｓＸがＥ．ｃｏｌｉにおいてプログラム可能なＤＮＡ干渉を媒介することを示すデータを表す。Ａは、ＣａｓＸプラスミド干渉アッセイの図である。最小ＣａｓＸ遺伝子座を発現するＥ．ｃｏｌｉを、ＣＲＩＳＰＲ配列のスペーサーが一致する配列を含むプラスミド（標的）、または一致しないスペーサーを含むプラスミド（非標的）で形質転換する。形質転換後、培養物をプレーティングし、コロニー形成単位（ｃｆｕ）を定量する。Ｂは、スペーサー１（ｓＸ．１）を標的とするＰｌａｎｃｔｏｍｙｃｅｔｅｓのＣａｓＸ遺伝子座を発現し、指定の標的で形質転換されたＥ．ｃｏｌｉの段階希釈である（ｓＸ１、ＣａｓＸスペーサー１；ｓＸ２、ＣａｓＸスペーサー２；ＮＴ、非標的）。（パネルＣ及びＤ）ＣａｓＸがＥ．ｃｏｌｉにおいてプログラム可能なＤＮＡ干渉を媒介することを示すデータを表す。Ｃは、ＤｅｌｔａｐｒｏｔｅｏｂａｃｔｅｒｉａＣａｓＸによるプラスミド干渉である。実験は３連で実施し、平均±ｓ．ｄ．を示す。Ｄは、Ｅ．ｃｏｌｉで発現したＰｌａｎｃｔｏｍｙｃｅｔｅｓＣａｓＸ遺伝子座についてのＰＡＭ欠失アッセイである。対照ライブラリと比較して３０倍超、欠失しているＰＡＭ配列を使用して、ＷｅｂＬｏｇｏを作成した。（パネルＡ〜Ｃ）ＣａｓＸが二本鎖誘導型ＣＲＩＳＰＲ複合体であることを示すデータを表す。Ａの下部に、環境ＲＮＡ配列（メタトランスクリプトームデータ）をＣａｓＸＣＲＩＳＰＲ遺伝子座とマッピングしたものを図示した（赤の矢印、推定ｔｒａｃｒＲＮＡ；白のボックス、リピート配列；緑のひし形、スペーサー配列）。挿入図は、最初のリピートとスペーサーの詳細図を示す。Ｂは、ＣａｓＸ二本鎖ＤＮＡ干渉の図である。ＲＮＡプロセシング部位は黒の矢印で示す。Ｃは、推定ｔｒａｃｒＲＮＡをＣａｓＸ遺伝子座からノックアウトしたプラスミド干渉アッセイの結果である（Ｔ、標的；ＮＴ、非標的）。実験は３連で実施し、平均±ｓ．ｄ．を示す。（パネルＡ）Ｅ．ｃｏｌｉのＣａｓＹ遺伝子座の発現が、ＤＮＡ干渉に十分であることを示すデータを表す。Ａは、ＣａｓＹ遺伝子座及び隣接タンパク質の図である。（パネルＢ及びＣ）Ｅ．ｃｏｌｉのＣａｓＹ遺伝子座の発現が、ＤＮＡ干渉に十分であることを示すデータを表す。Ｂは、対照ライブラリと比較してＣａｓＹによって３倍超、欠失している５’ＰＡＭ配列のＷｅｂＬｏｇｏである。Ｃは、ＣａｓＹ．１を発現し、指定のＰＡＭを含む標的で形質転換されたＥ．ｃｏｌｉによるプラスミド干渉である。実験は３連で実施し、平均±ｓ．ｄを示す。（パネルＡ及びＢ）既知のシステムに関連して新たに同定されたＣＲＩＳＰＲ−Ｃａｓを表す。Ａは、一般的なＣａｓ１タンパク質の簡略化した系統発生樹である。ＣＲＩＳＰＲ型の既知のシステムはくさび形及び分岐で示し、新たに記載されるシステムは太字で示す。詳細なＣａｓ１の系統は、補足データ２に示す。Ｂは、ＩＩ−Ｂ型遺伝子座とＩＩ−Ｃ型遺伝子座との組換えの結果、古細菌ＩＩ型システムに生じた進化シナリオを提案したものである。ＡＲＭＡＮ−４からの古細菌Ｃａｓ９が、縮重ＣＲＩＳＰＲ配列をもつ多数のコンティグに見出されることを示す。１６の異なるコンティグに関して、ＡＲＭＡＮ−４からのＣａｓ９を暗赤色でハイライト表示している。推定ドメインまたは機能をもつタンパク質は標識されており、仮想タンパク質は非標識である。１５のコンティグは、２つの縮重直列リピート（１ｂｐのミスマッチ）と、単一の保存スペーサーを含む。残りのコンティグは、直列リピートを１つのみ含む。ＡＲＭＡＮ−１とは異なり、ＡＲＭＡＮ−４ではＣａｓ９に隣接する追加のＣａｓタンパク質は見られない。ＡＲＭＡＮ−４からの古細菌Ｃａｓ９が、縮重ＣＲＩＳＰＲ配列をもつ多数のコンティグに見出されることを示す。１６の異なるコンティグに関して、ＡＲＭＡＮ−４からのＣａｓ９を暗赤色でハイライト表示している。推定ドメインまたは機能をもつタンパク質は標識されており、仮想タンパク質は非標識である。１５のコンティグは、２つの縮重直列リピート（１ｂｐのミスマッチ）と、単一の保存スペーサーを含む。残りのコンティグは、直列リピートを１つのみ含む。ＡＲＭＡＮ−１とは異なり、ＡＲＭＡＮ−４ではＣａｓ９に隣接する追加のＣａｓタンパク質は見られない。ＡＲＭＡＮ−４からの古細菌Ｃａｓ９が、縮重ＣＲＩＳＰＲ配列をもつ多数のコンティグに見出されることを示す。１６の異なるコンティグに関して、ＡＲＭＡＮ−４からのＣａｓ９を暗赤色でハイライト表示している。推定ドメインまたは機能をもつタンパク質は標識されており、仮想タンパク質は非標識である。１５のコンティグは、２つの縮重直列リピート（１ｂｐのミスマッチ）と、単一の保存スペーサーを含む。残りのコンティグは、直列リピートを１つのみ含む。ＡＲＭＡＮ−１とは異なり、ＡＲＭＡＮ−４ではＣａｓ９に隣接する追加のＣａｓタンパク質は見られない。ＡＲＭＡＮ−４からの古細菌Ｃａｓ９が、縮重ＣＲＩＳＰＲ配列をもつ多数のコンティグに見出されることを示す。１６の異なるコンティグに関して、ＡＲＭＡＮ−４からのＣａｓ９を暗赤色でハイライト表示している。推定ドメインまたは機能をもつタンパク質は標識されており、仮想タンパク質は非標識である。１５のコンティグは、２つの縮重直列リピート（１ｂｐのミスマッチ）と、単一の保存スペーサーを含む。残りのコンティグは、直列リピートを１つのみ含む。ＡＲＭＡＮ−１とは異なり、ＡＲＭＡＮ−４ではＣａｓ９に隣接する追加のＣａｓタンパク質は見られない。ＡＲＭＡＮ−１ＣＲＩＳＰＲ配列の再構成全体を表す。ＣＲＩＳＰＲ配列の再構成には、参照アセンブル配列、ならびに短いＤＮＡリードから再構成された配列セグメントを含む。緑の矢印はリピートを示し、カラーの矢印はＣＲＩＳＰＲスペーサーを示す（同一のスペーサーは同色であり、一意なスペーサーは黒色である）。ＣＲＩＳＰＲシステムでは、スペーサーは通常、一方向に追加されるので、左側のスペーサーの不一致が大きいのは、最近獲得されたことに起因する。ＡＲＭＡＮ−１ＣＲＩＳＰＲ配列の再構成全体を表す。ＣＲＩＳＰＲ配列の再構成には、参照アセンブル配列、ならびに短いＤＮＡリードから再構成された配列セグメントを含む。緑の矢印はリピートを示し、カラーの矢印はＣＲＩＳＰＲスペーサーを示す（同一のスペーサーは同色であり、一意なスペーサーは黒色である）。ＣＲＩＳＰＲシステムでは、スペーサーは通常、一方向に追加されるので、左側のスペーサーの不一致が大きいのは、最近獲得されたことに起因する。ＡＲＭＡＮ−１ＣＲＩＳＰＲ配列の再構成全体を表す。ＣＲＩＳＰＲ配列の再構成には、参照アセンブル配列、ならびに短いＤＮＡリードから再構成された配列セグメントを含む。緑の矢印はリピートを示し、カラーの矢印はＣＲＩＳＰＲスペーサーを示す（同一のスペーサーは同色であり、一意なスペーサーは黒色である）。ＣＲＩＳＰＲシステムでは、スペーサーは通常、一方向に追加されるので、左側のスペーサーの不一致が大きいのは、最近獲得されたことに起因する。ＡＲＭＡＮ−１ＣＲＩＳＰＲ配列の再構成全体を表す。ＣＲＩＳＰＲ配列の再構成には、参照アセンブル配列、ならびに短いＤＮＡリードから再構成された配列セグメントを含む。緑の矢印はリピートを示し、カラーの矢印はＣＲＩＳＰＲスペーサーを示す（同一のスペーサーは同色であり、一意なスペーサーは黒色である）。ＣＲＩＳＰＲシステムでは、スペーサーは通常、一方向に追加されるので、左側のスペーサーの不一致が大きいのは、最近獲得されたことに起因する。ＡＲＭＡＮ−１ＣＲＩＳＰＲ配列の再構成全体を表す。ＣＲＩＳＰＲ配列の再構成には、参照アセンブル配列、ならびに短いＤＮＡリードから再構成された配列セグメントを含む。緑の矢印はリピートを示し、カラーの矢印はＣＲＩＳＰＲスペーサーを示す（同一のスペーサーは同色であり、一意なスペーサーは黒色である）。ＣＲＩＳＰＲシステムでは、スペーサーは通常、一方向に追加されるので、左側のスペーサーの不一致が大きいのは、最近獲得されたことに起因する。ＡＲＭＡＮ−１ＣＲＩＳＰＲ配列の再構成全体を表す。ＣＲＩＳＰＲ配列の再構成には、参照アセンブル配列、ならびに短いＤＮＡリードから再構成された配列セグメントを含む。緑の矢印はリピートを示し、カラーの矢印はＣＲＩＳＰＲスペーサーを示す（同一のスペーサーは同色であり、一意なスペーサーは黒色である）。ＣＲＩＳＰＲシステムでは、スペーサーは通常、一方向に追加されるので、左側のスペーサーの不一致が大きいのは、最近獲得されたことに起因する。（パネルＡ及びＢ）ＡＲＭＡＮ−１スペーサーと、古細菌群集のメンバーのゲノムとのマッッピングを示す。Ａは、ＡＲＭＡＮ−１からのプロトスペーサー（赤の矢印）と、同じ環境からのナノ古細菌ＡＲＭＡＮ−２のゲノムとのマッピングである。６つのプロトスペーサーは、２つの長末端反復配列（ＬＴＲ）が隣接するゲノムの一部に一意にマッピングされ、さらに２つの別のプロトスペーサーがＬＴＲ内で完全に一致している（青及び緑）。この領域はトランスポゾンである可能性が高く、これは、ＡＲＭＡＮ−１のＣＲＩＳＰＲ−Ｃａｓシステムがこの要素の動員を抑制する役割を果たしていることを示唆する。Ｂでは、ＡＲＭＡＮ生物と同じ試料に見られる、リッチモンド鉱山生態系のもう１つのメンバーであるＴｈｅｒｍｏｐｌａｓｍａｔａｌｅｓ古細菌（Ｉ−プラズマ）ともプロトスペーサーをマッピングしている。プロトスペーサーは、短い仮想タンパク質をコードするゲノムの領域内に集合しており、これが流動要素を表し得ることも示唆している。（パネルＡ）ＡＲＭＡＮ−１ｃｒＲＮＡ及びｔｒａｃｒＲＮＡの予測される二次構造を表す。Ａは、ＣＲＩＳＰＲのリピート及びｔｒａｃｒＲＮＡアンチリピートを黒で図示し、スペーサー由来の配列を一連の緑のＮで示している。遺伝子座からは明確な終結シグナルを予測できないため、二次構造に基づいて、３つの異なるｔｒａｃｒＲＮＡ長を試験した（６９、１０４、及び１７９、それぞれ赤、青、及びピンク）。（パネルＢ）ＡＲＭＡＮ−１ｃｒＲＮＡ及びｔｒａｃｒＲＮＡの予測される二次構造を表す。Ｂは、Ａにおける二本鎖ガイドに対応する遺伝子操作された一本鎖ガイドＲＮＡである。（パネルＣ〜Ｅ）ＡＲＭＡＮ−１ｃｒＲＮＡ及びｔｒａｃｒＲＮＡの予測される二次構造を表す。Ｃは、ｔｒａｃｒＲＮＡの３’末端に２つの異なるヘアピン（７５及び１２２）をもつＡＲＭＡＮ−４Ｃａｓ９の二本鎖ガイドである。Ｄは、Ｃにおける二本鎖ガイドに対応する遺伝子操作された一本鎖ガイドＲＮＡである。Ｅは、Ｅ．ｃｏｌｉのｉｎｖｉｖｏ標的アッセイの試験条件である。（パネルＡ及びＢ）ｉｎｖｉｔｒｏでの生化学研究のための精製スキーマを表す。Ａは、補足資料に概説されている様々な条件下で、ＡＲＭＡＮ−１（ＡＲ１）及びＡＲＭＡＮ−４（ＡＲ４）Ｃａｓ９を発現し、精製したことを示す。青いボックスで囲まれたタンパク質のｉｎｖｉｔｒｏでの切断活性について試験した。Ｂは、ＡＲ１−Ｃａｓ９及びＡＲ４−Ｃａｓ９精製物の画分を１０％ＳＤＳ−ＰＡＧＥゲル上で分離したものを示す。新たに同定されたＣＲＩＳＰＲ−Ｃａｓシステムと既知のタンパク質との比較を表す。（１）ＮＣＢＩの非重複（ＮＲ）タンパク質に対するＢＬＡＳＴ検索、（２）すべての既知のタンパク質のＨＭＭデータベースに対する、隠れマルコフモデル（ＨＭＭ）検索、及び（３）ＨＨｐｒｅｄ³⁰を使用した遠隔相同性検索に基づいた、既知のタンパク質に対するＣａｓＸ及びＣａｓＹの類似性を示す。（パネルＡ及びＢ）ＣａｓＸによってプログラムされたＤＮＡ干渉に関連するデータを表す。Ａは、図９のパネルＣから続く、ＣａｓＸ２（Ｐｌａｎｃｔｏｍｙｃｅｔｅｓ）及びＣａｓＸ１（Ｄｅｌｔａｐｒｏｔｅｏｂａｃｔｅｒｉａ）についてのプラスミド干渉アッセイである（ｓＸ１、ＣａｓＸスペーサー１；ｓＸ２、ＣａｓＸスペーサー２；ＮＴ、非標的）。実験は３連で実施し、平均±ｓ．ｄ．を示す。Ｂは、図９のパネルＢから続く、ＣａｓＸ遺伝子座を発現し、指定された標的で形質転換された、Ｅ．ｃｏｌｉの段階希釈である。（パネルＣ）ＣａｓＸによってプログラムされたＤＮＡ干渉に関連するデータを表す。Ｃは、Ｅ．ｃｏｌｉで発現したＤｅｌｔａｐｒｏｔｅｏｂａｃｔｅｒｉａＣａｓＸについてのＰＡＭ欠失アッセイである。対照ライブラリと比較して、示されたＰＡＭ欠失閾値（ＰＤＶＴ）を超えて欠失しているＰＡＭ配列を使用して、ＷｅｂＬｏｇｏを作成した。（パネルＤ）ＣａｓＸによってプログラムされたＤＮＡ干渉に関連するデータを表す。Ｄは、Ｅ．ｃｏｌｉで発現したＰｌａｎｃｔｏｍｙｃｅｔｅｓＣａｓＸについてのＰＡＭ欠失アッセイである。対照ライブラリと比較して、示されたＰＡＭ欠失閾値（ＰＤＶＴ）を超えて欠失しているＰＡＭ配列を使用して、ＷｅｂＬｏｇｏを作成した。Ｃａｓ９ホモログの進化樹を表す。以前に記載されているシステムを示す、Ｃａｓ９タンパク質の最尤系統樹。各型に基づいて、ＩＩ−Ａは青、ＩＩ−Ｂは緑、及びＩＩ−Ｃは紫に色分けされている。ＩＩ−Ｃ型ＣＲＩＳＰＲ−Ｃａｓシステムに、新たに記載された未培養細菌からの２つの細菌Ｃａｓ９を加えて群化した古細菌Ｃａｓ９である。ＡＲＭＡＮ−１及びＡＲＭＡＮ−４からのＣａｓ９についてアッセイした、切断条件の表を表す。

本明細書で使用される場合、「異種」とは、ヌクレオチドまたはポリペプチドの配列が、それぞれ天然の核酸またはタンパク質に見られないものであることを意味する。例えば、ＣａｓＹポリペプチドに関して、異種ポリペプチドは、ＣａｓＹポリペプチド以外のタンパク質からのアミノ酸配列を含む。場合によって、１つの種由来のＣａｓＹタンパク質の一部が、異なる種由来のＣａｓＹタンパク質の一部に融合されている。そのため、それぞれの種由来のＣａｓＹ配列は、互いに対して異種であるとみなすことができる。別の例として、ＣａｓＹタンパク質（例えば、ｄＣａｓＹタンパク質）を非ＣａｓＹタンパク質（例えば、ヒストンデアセチラーゼ）由来の活性ドメインに融合させることができ、その活性ドメインの配列は、異種ポリペプチド（ＣａｓＹタンパク質に対して異種である）とみなすことができる。

本明細書で同義に使用される用語「ポリヌクレオチド」及び「核酸」は、重合形態の、長さを問わないヌクレオチド、すなわちリボヌクレオチドまたはデオキシヌクレオチドを指す。したがって、この用語には、一本鎖、二本鎖、もしくは多重鎖のＤＮＡもしくはＲＮＡ、ゲノムＤＮＡ、ｃＤＮＡ、ＤＮＡ−ＲＮＡハイブリッド、またはプリン及びピリミジン塩基、もしくは他の天然ヌクレオチド塩基、化学的もしくは生化学的に修飾されたヌクレオチド塩基、非天然のヌクレオチド塩基、もしくは誘導体化ヌクレオチド塩基を含む重合体が含まれるが、それらに限定されない。用語「ポリヌクレオチド」及び「核酸」は、記載される実施形態に適用可能である場合、一本鎖（例えば、センスまたはアンチセンス）ポリヌクレオチド及び二本鎖ポリヌクレオチドを含むと理解されるべきである。

本明細書で同義に使用される用語「ポリペプチド」、「ペプチド」、及び「タンパク質」は、任意の長さのアミノ酸の重合形態を指し、これには、遺伝的にコードされた及び非遺伝的にコードされたアミノ酸、化学的にまたは生化学的に修飾または誘導体化されたアミノ酸、ならびに修飾ペプチド骨格を有するポリペプチドを含み得る。本用語には、限定されるものではないが、異種アミノ酸配列を有する融合タンパク質、異種及び同種のリーダー配列を有する融合体、Ｎ末端メチオニン残基を有するまたは有しない融合体、免疫標識されたタンパク質などを含む、融合タンパク質が含まれる。

核酸、タンパク質、細胞、または生物に適用される場合、本明細書で使用される用語「天然の」は、天然に存在する核酸、細胞、タンパク質、または生物を指す。

本明細書で使用される場合、用語「単離された」とは、ポリヌクレオチド、ポリペプチド、または細胞が、そのポリヌクレオチド、ポリペプチド、または細胞が天然に存在する場合とは異なる環境に存在することを意味する。単離された遺伝子改変宿主細胞は、遺伝子改変宿主細胞の混合集団に存在する場合がある。

本明細書で使用される場合、用語「外因性核酸」とは、自然界で得られる細菌、生物、もしくは細胞に通常は見られないもしくは天然で見られない核酸、及び／またはそれらによって産生されない核酸を指す。本明細書で使用される場合、用語「内因性核酸」とは、自然界で得られる細菌、生物、もしくは細胞に通常見られる核酸、及び／またはそれらによって産生される核酸を指す。「内因性核酸」は「天然の核酸」とも呼ばれる、所与の細菌、生物、または細胞に「天然の」核酸である。

本明細書で使用される場合、「組換え」とは、特定の核酸（ＤＮＡまたはＲＮＡ）が、天然の系に見られる内因性核酸とは区別できる構造コード配列または非コード配列を有する構築物を生じさせるクローニング、制限酵素による切断、及び／またはライゲーションといった工程の様々な組み合わせの産物であることを意味する。一般に、構造コード配列をコードするＤＮＡ配列を、ｃＤＮＡ断片及び短いオリゴヌクレオチドリンカーから、または一連の合成オリゴヌクレオチドからアセンブルして合成核酸を提供し、これを細胞内または無細胞の転写系及び翻訳系に含まれる組換え転写単位から発現させることができる。そのような配列は、真核生物の遺伝子に通常存在する内部非翻訳配列、すなわちイントロンによって中断されないオープンリーディングフレームの形態で提供することができる。関連配列を含むゲノムＤＮＡはまた、組換え遺伝子または転写単位の形成に使用することもできる。非翻訳ＤＮＡの配列は、オープンリーディングフレームの５’側に存在しても、または３’側に存在してもよく、そのような配列は、コード領域の操作または発現を妨害せず、かつ、事実上、様々な機構によって望ましい産物の産生を調節するように作用することができる（以下の「ＤＮＡ制御配列」を参照）。

したがって、例えば、用語「組換え」ポリヌクレオチドまたは「組換え」核酸とは、天然に存在しないもの、例えば、本来は２つに分離されている配列セグメントを、人為的介入を経て人工的に組み合わせることによって作製されたものを指す。この人工的な組み合わせは、化学合成手段によって、または核酸の単離セグメントの人工的な操作、例えば遺伝子工学技術のいずれかによって行われる場合が多い。それらは通常、配列認識部位を導入または除去すると同時に、同一アミノ酸または保存的アミノ酸をコードする縮重コドンでコドンを置換して行われる。あるいは、所望する機能の核酸セグメントを一つに連結し、所望する機能の組み合わせを生じさせることで実行される。この人工的な組み合わせは、化学合成手段によって、または核酸の単離セグメントの人工的な操作、例えば遺伝子工学技術のいずれかによって行われる場合が多い。

同様に、用語「組換え」ポリペプチドとは、天然に存在しないポリペプチド、例えば、本来は２つに分離されているアミノ配列セグメントを、人為的介入を経て人工的に組み合わせることによって作製されたポリペプチドを指す。したがって、例えば、異種アミノ酸配列を含むポリペプチドは組換えである。

「構築物」または「ベクター」とは、特定のヌクレオチド配列（複数可）の発現及び／または伝播を目的として生成された、または他の組換えヌクレオチド配列の構築に使用することを意図する組換え核酸、一般には組換えＤＮＡを意味する。

本明細書で同義に使用される用語「ＤＮＡ制御配列」、「制御要素」、及び「調節要素」は、宿主細胞において、コード配列の発現及び／またはコードされたポリペプチドの産生をもたらす及び／または調節するようなプロモーター、エンハンサー、ポリアデニル化シグナル、ターミネーター、タンパク質分解シグナルなどの転写及び翻訳制御配列を指す。

用語「形質転換」は、本明細書において「遺伝子改変」と同義に使用され、細胞への新たな核酸（例えば、細胞に対して外因性のＤＮＡ）の導入後に誘導される恒久的または一過性の遺伝的変化を指す。遺伝的変化（「改変」）は、宿主細胞のゲノムへの新たな核酸の取り込みによって、または新たな核酸のエピソーム要素としての一過性の保持もしくは安定保持のいずれかによってなされ得る。細胞が真核細胞である場合、恒久的な遺伝的変化は、一般に、細胞のゲノムへの新たなＤＮＡの導入によってなされる。原核細胞の場合、恒久的な変化が染色体に導入されることもあれば、またはプラスミド及び発現ベクターなどの染色体外要素を介して導入されることもあり、染色体外要素には、組換え宿主細胞での保持に利用される１つ以上の選択マーカーを含む場合がある。遺伝子改変に適した方法として、ウイルス感染、トランスフェクション、コンジュゲート、プロトプラスト融合、エレクトロポレーション、パーティクルガン技術、リン酸カルシウム沈降、直接マイクロインジェクションなどが挙げられる。方法の選択は一般に、形質転換される細胞の種類及び形質転換が行われる状況（すなわち、ｉｎｖｉｔｒｏ、ｅｘｖｉｖｏ、またはｉｎｖｉｖｏ）に応じて異なる。これらの方法の一般的な考察は、Ａｕｓｕｂｅｌ，ｅｔａｌ，ＳｈｏｒｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，３ｒｄｅｄ．，Ｗｉｌｅｙ＆Ｓｏｎｓ，１９９５で参照することができる。

「機能的に連結された」とは、そのように記載される構成要素が意図された方法で機能できるような関係にある並置を指す。例えば、プロモーターがコード配列の転写または発現に影響を及ぼす場合、プロモーターはコード配列と機能的に連結されている。本明細書で使用される場合、用語「異種プロモーター」及び「異種制御領域」は、自然界において特定の核酸と通常は関連しないプロモーター及び他の制御領域を指す。例えば、「コード領域と異種である転写制御領域」とは、自然界においてコード領域と通常は関連しない転写制御領域である。

本明細書で使用される場合、「宿主細胞」とは、ｉｎｖｉｖｏもしくはｉｎｖｉｔｒｏの真核細胞、原核細胞、または真核細胞でも原核細胞でもよい単細胞実体として培養された多細胞生物由来の細胞（例えば、細胞株）、もしくは核酸（例えば、発現ベクター）のレシピエントとして使用され、核酸によって遺伝子改変された元の細胞の子孫を含んでいる多細胞生物由来の細胞を意味する。単一細胞の子孫は、天然の、偶発的な、または意図的な変異のため、モルホロジーまたはゲノムもしくは全ＤＮＡ相補性が、必ずしも元の親と完全に同一でなくてもよいものと理解される。「組換え宿主細胞」（別称「遺伝子改変宿主細胞」）は、異種核酸、例えば発現ベクターを導入された宿主細胞である。例えば、本発明の原核宿主細胞は、例えば原核宿主細胞に対して外来性である（自然界では通常見られない）外因性核酸、または原核宿主細胞には通常見られない組換え核酸といった異種核酸を適切な原核宿主細胞に導入することによって遺伝子改変された原核宿主細胞（例えば、細菌）であり、本発明の真核宿主細胞は、例えば真核宿主細胞対して外来性である外因性核酸、または真核宿主細胞には通常見られない組換え核酸といった異種核酸を適切な真核宿主細胞に導入することによって遺伝子改変された真核宿主細胞である。

用語「保存的アミノ酸置換」とは、類似する側鎖を有するアミノ酸残基のタンパク質と互換性であることを意味する。例えば、脂肪族側鎖を有するアミノ酸の群は、グリシン、アラニン、バリン、ロイシン、及びイソロイシンからなり；脂肪族ヒドロキシル側鎖を有するアミノ酸の群は、セリン及びスレオニンからなり；アミドを含む側鎖を有するアミノ酸の群は、アスパラギン及びグルタミンからなり；芳香族側鎖を有するアミノ酸の群は、フェニルアラニン、チロシン、及びトリプトファンからなり；塩基性側鎖を有するアミノ酸の群は、リジン、アルギニン、及びヒスチジンからなり；ならびに硫黄を含む側鎖を有するアミノ酸の群は、システイン及びメチオニンからなる。例示的な保存的アミノ酸置換群は、バリン−ロイシン−イソロイシン、フェニルアラニン−チロシン、リジン−アルギニン、アラニン−バリン、及びアスパラギン−グルタミンである。

ポリヌクレオチドまたはポリペプチドは、別のポリヌクレオチドまたはポリペプチドに対して一定の比率の「配列同一性」を有する。これは、アライメントしたとき、塩基またはアミノ酸の比率が同じであり、２つの配列を比較すると、同一の相対位置にあることを意味する。配列類似性はいくつかの異なる方法で決定することができる。配列同一性を決定するには、ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ＢＬＡＳＴでワールドワイドウェブ経由で利用可能であるＢＬＡＳＴを含む方法及びコンピュータープログラムを使用して配列をアライメントすることができる。例えば、Ａｌｔｓｃｈｕｌｅｔａｌ．（１９９０），Ｊ．Ｍｏｌ．Ｂｉｏｌ．２１５：４０３−１０を参照のこと。別のアライメントアルゴリズムは、ＯｘｆｏｒｄＭｏｌｅｃｕｌａｒＧｒｏｕｐ，Ｉｎｃの完全子会社であるＧｅｎｅｔｉｃｓＣｏｍｐｕｔｉｎｇＧｒｏｕｐ（ＧＣＧ）（所在地Ｍａｄｉｓｏｎ，Ｗｉｓｃｏｎｓｉｎ，ＵＳＡ）のパッケージで利用可能なＦＡＳＴＡである。アライメントのための他の技術については、ＭｅｔｈｏｄｓｉｎＥｎｚｙｍｏｌｏｇｙ，ｖｏｌ．２６６：ＣｏｍｐｕｔｅｒＭｅｔｈｏｄｓｆｏｒＭａｃｒｏｍｏｌｅｃｕｌａｒＳｅｑｕｅｎｃｅＡｎａｌｙｓｉｓ（１９９６），ｅｄ．Ｄｏｏｌｉｔｔｌｅ，ＡｃａｄｅｍｉｃＰｒｅｓｓ，Ｉｎｃ．（ＨａｒｃｏｕｒｔＢｒａｃｅ＆Ｃｏ．，ＳａｎＤｉｅｇｏ，Ｃａｌｉｆｏｒｎｉａ，ＵＳＡの一部門）に記載されている。特に興味深いのは、配列中のギャップを許容するアライメントプログラムである。Ｓｍｉｔｈ−Ｗａｔｅｒｍａｎは、配列アライメント中のギャップを許容するアルゴリズムの一種である。Ｍｅｔｈ．Ｍｏｌ．Ｂｉｏｌ．７０：１７３−１８７（１９９７）を参照のこと。また、Ｎｅｅｄｌｅｍａｎ及びＷｕｎｓｃｈのアライメント法を使用するＧＡＰプログラムを、配列のアライメントに利用することができる。Ｊ．Ｍｏｌ．Ｂｉｏｌ．４８：４４３−４５３（１９７０）を参照のこと。

本明細書で使用される場合、「治療」、「治療する」などの用語は、望ましい薬学的効果及び／または生理学的効果を得ることを指す。効果は、疾患もしくはその症状を完全にもしくは部分的に予防する点では予防的であり得、及び／または、疾患及び／または疾患に起因する有害作用の部分的もしくは完全な治癒という点では治療的であり得る。本明細書で使用される場合、「治療」は、哺乳動物、例えばヒトの疾患のいずれかの治療を包含し、それには、（ａ）疾患の素因を有し得るが、まだそれを有すると診断されていない対象に疾患が生じることを予防すること；（ｂ）疾患を抑制する、すなわちその発生を抑止すること；及び（ｃ）疾患を緩和する、すなわち疾患の退縮を引き起こすことを含む。

本明細書で同義に使用される用語「個体」、「対象」、「宿主」、及び「患者」は、個々の生物、例えば、マウス、サル、ヒト、哺乳動物の家畜、哺乳動物の競技用動物、及び哺乳動物のペットを含むが、それらに限定されない哺乳動物を指す。

本発明をさらに記載するにあたり、本発明は記載される特定の実施形態に限定されず、当然ながら、これらを変更できるものと理解されるべきである。また、本発明の範囲は添付の特許請求の範囲によってのみ限定されるため、本明細書で使用される用語は特定の実施形態の記載のみを目的としており、限定を意図しないものと理解されるべきである。

ある範囲の数値が与えられるとき、文脈から特に明示されない限り、この範囲の上限と下限との間の各中間値、ならびにこの記載された範囲内の他のいずれの記載値または中間値も下限の単位の１０分の１まで本発明に包含されるものと理解されるべきである。これよりも狭い範囲の上限と下限は、その狭い範囲に独立して包含されてもよく、また記載された範囲に何らかの具体的な除外制限があることを条件として本発明内に包含される。記載された範囲が上限と下限の一方または両方を含む場合、その含まれる上限下限の一方または両方を除外した範囲もまた本発明の範囲内に包含される。

特に定義しない限り、本明細書で使用される技術用語及び科学用語はすべて、本発明が属する技術分野の当業者に共通して理解されているものと同じ意味を有する。好ましい方法及び材料を後述するが、本明細書に記載するものと同様または同等であるいかなる方法及び材料も本発明の実施または試験に使用することができる。本明細書で言及する全ての刊行物は、刊行物の引用箇所と関連する方法及び／または材料の開示及び記載について参照することにより本明細書に組み込まれる。

本明細書及び添付の特許請求の範囲で使用される場合、単数形「ａ」、「ａｎ」、及び「ｔｈｅ」は、文脈によって特に明示されない限り、複数の指示対象物を包含することに留意されたい。したがって、例えば「ＣａｓＹポリペプチド」に関する言及は、複数のこのようなポリペプチドを含み、「ガイドＲＮＡ」に関する言及は、当業者に公知である１つ以上のガイドＲＮＡ及びその等価物に関する言及を含むなどである。さらに、任意の構成要素を除外するように特許請求の範囲を起草できることにも留意されたい。そのため、本記載は、特許請求の範囲の構成要素の列挙に関連して、「単独で」、「のみ」などのような排他的用語を使用する際、または「否定的」限定を使用する際の前提基準としての役割を果たすことを意図とする。

明確性を目的として個々の実施形態に関連して記載される本発明の特定の特徴は、組み合わせることで単一の実施形態としても提供することができる。逆に、簡潔性を目的として単一の実施形態に関連して記載される本発明の種々の特徴は、個別に提供することも、または任意の好適なサブコンビネーションで提供することもできる。本発明と関連する実施形態のあらゆる組み合わせは、本発明に明確に包含され、どの組み合わせもすべて個別に及び明示的に開示されているかのように本明細書に開示される。加えて、様々な実施形態及びその要素のサブコンビネーションもすべて本発明に明確に包含され、そのような、どのサブコンビネーションもすべて個別に及び明示的に本明細書に開示されているかのように本明細書に開示される。

本明細書で考察する刊行物は、本出願の出願日に先立つその開示のためにのみ提供される。本明細書のいかなる内容も、本発明が、先行発明を理由としてこのような刊行物に先行する権利を与えられないことを容認するものとはみなされない。さらに、記載された刊行物の日付は実際の公開日と異なる場合があり、それぞれ確認を要する場合がある。

組成物
ＣＲＩＳＰＲ／ＣａｓＹタンパク質及びガイドＲＮＡ
ＣＲＩＳＰＲ／Ｃａｓエンドヌクレアーゼ（例えば、ＣａｓＹタンパク質）は、対応するガイドＲＮＡ（例えば、ＣａｓＹガイドＲＮＡ）と相互作用（結合）し、ガイドＲＮＡと標的核酸分子内の標的配列との間の塩基対形成を介して標的核酸内の特定部位を標的化するリボ核タンパク質（ＲＮＰ）複合体を形成する。ガイドＲＮＡは、標的核酸の配列（標的部位）に相補的なヌクレオチド配列（ガイド配列）を含む。したがって、ＣａｓＹタンパク質は、ＣａｓＹガイドＲＮＡと複合体を形成し、このガイドＲＮＡはガイド配列によってＲＮＰ複合体に配列特異性を与える。複合体のＣａｓＹタンパク質は、部位特異的な活性を与える。換言すれば、ＣａｓＹタンパク質は、ガイドＲＮＡとの会合によって、標的核酸配列（例えば、染色体配列または染色体外配列、例えばエピソーム配列、ミニサークル配列、ミトコンドリア配列、葉緑体配列など）内の標的部位に誘導される（例えば、標的部位で安定である）。

本開示は、ＣａｓＹポリペプチド（及び／またはＣａｓＹポリペプチドをコードする核酸）を含む組成物を提供する（例えば、この場合のＣａｓＹポリペプチドは、天然タンパク質、ニッカーゼＣａｓＹタンパク質、ｄＣａｓＹタンパク質、キメラＣａｓＹタンパク質などであり得る）。本開示は、ＣａｓＹガイドＲＮＡ（及び／またはＣａｓＹガイドＲＮＡをコードする核酸）を含む組成物を提供する。本開示は、（ａ）ＣａｓＹポリペプチド（及び／またはＣａｓＹポリペプチドをコードする核酸）（例えば、この場合のＣａｓＹポリペプチドは、天然タンパク質、ニッカーゼＣａｓＹタンパク質、ｄＣａｓＹタンパク質、キメラＣａｓＹタンパク質などであり得る）、及び（ｂ）ＣａｓＹガイドＲＮＡ（及び／またはＣａｓＹガイドＲＮＡをコードする核酸）を含む組成物を提供する。本開示は、（ａ）本開示のＣａｓＹポリペプチド（例えば、この場合のＣａｓＹポリペプチドは、天然タンパク質、ニッカーゼＣａｓＹタンパク質、ｄＣａｓＹタンパク質、キメラＣａｓＹタンパク質などであり得る）；及び（ｂ）ＣａｓＹガイドＲＮＡを含む、核酸／タンパク質複合体（ＲＮＰ複合体）を提供する。

ＣａｓＹタンパク質
ＣａｓＹポリペプチド（この用語は用語「ＣａｓＹタンパク質」と同義に使用される）は、標的核酸及び／または標的核酸と会合したポリペプチドに結合する、及び／またはそれらを修飾（例えば、切断、ニック、メチル化、脱メチル化など）することができる（例えば、ヒストンテールのメチル化またはアセチル化）（例えば、ＣａｓＹタンパク質は活性を有する融合パートナーを含む場合もあれば、ＣａｓＹタンパク質がヌクレアーゼ活性を与える場合もある）。場合によって、ＣａｓＹタンパク質は天然のタンパク質である（例えば、原核細胞に天然に存在する）。他の場合には、ＣａｓＹタンパク質は、天然のポリペプチドではない（例えば、ＣａｓＹタンパク質は変異体ＣａｓＹタンパク質、キメラタンパク質などである）。

所与のタンパク質がＣａｓＹガイドＲＮＡと相互作用するかどうかを決定するアッセイは、タンパク質と核酸との間の結合を試験する任意の利便な結合アッセイであってよい。好適な結合アッセイ（例えば、ゲルシフトアッセイ）を当業者は把握しているであろう（例えば、ＣａｓＹガイドＲＮＡ及びタンパク質を標的核酸に添加することを含むアッセイ）。タンパク質が活性を有するかどうかを決定する（例えば、タンパク質が、標的核酸を切断するヌクレアーゼ活性及び／または何らかの異種活性を有するかどうかを決定する）アッセイは、任意の利便なアッセイであってよい（例えば、核酸の切断について試験する任意の利便な核酸切断アッセイ）。好適なアッセイ（例えば切断アッセイ）を当業者は把握しているであろう。

天然のＣａｓＹタンパク質は、標的とする二本鎖ＤＮＡ（ｄｓＤＮＡ）の特異的配列での二本鎖切断を触媒するエンドヌクレアーゼとして機能する。配列特異性は、会合するガイドＲＮＡが標的ＤＮＡ内の標的配列にハイブリダイズすることによって与えられる。天然のＣａｓＹガイドＲＮＡはｃｒＲＮＡであり、ｃｒＲＮＡは、（ｉ）標的ＤＮＡ内の標的配列にハイブリダイズするガイド配列、及び（ｉｉ）ＣａｓＹタンパク質に結合するステムループ（ヘアピン−ｄｓＲＮＡ二重鎖）を含むタンパク質結合セグメントを含む。

いくつかの実施形態では、本発明の方法及び／または組成物のＣａｓＹタンパク質は天然（野生型）タンパク質である（またはそれらに由来する）。天然ＣａｓＹタンパク質の例を図１に示し、配列番号１〜７として記載する。天然ＣａｓＹタンパク質の例を図１に示し、配列番号１〜８として記載する。例示的な天然ＣａｓＹタンパク質のアライメントを図２に表す（タンパク質には「Ｙ１」、「Ｙ２」、「Ｙ３」などの名前がつけられている）。（配列決定データからアセンブルした）７つの天然ＣａｓＹＣＲＩＳＰＲ遺伝子座の部分ＤＮＡ骨格を配列番号２１〜２７として記載する。重要な点として、この新たに発見されたタンパク質（ＣａｓＹ）は、以前に同定されたＣＲＩＳＰＲ−Ｃａｓエンドヌクレアーゼと比較して短く、したがって、このタンパク質を代わりに使用することで、タンパク質をコードするヌクレオチド配列が比較的短くなるという利点をもたらす。これは、例えば、ＣａｓＹタンパク質をコードする核酸が望ましい場合、例えば、研究及び／または臨床用途のために真核細胞（例えば、哺乳動物細胞、ヒト細胞、マウス細胞、ｉｎｖｉｔｒｏ、ｅｘｖｉｖｏ、ｉｎｖｉｖｏ）などの細胞への送達にウイルスベクター（例えば、ＡＡＶベクター）を用いる場合に有用である。ＣａｓＹＣＲＩＳＰＲ遺伝子座を保有する細菌が、低温（例えば、１０〜１７℃）で採取された環境試料中に存在したことも本明細書で指摘されている。したがって、ＣａｓＹは、低温（例えば、１０〜１４℃、１０〜１７℃、１０〜２０℃）で良好に機能できると期待される（例えば、これまでに発見された他のＣａｓエンドコヌクレアーゼ（ｅｎｄｏｃｏｎｕｃｌｅａｓｅ）よりも優れている）。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。例えば、場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、その配列が、（例えば、後述するアミノ酸位置などに）タンパク質の天然の触媒活性を減少させるアミノ酸置換（例えば、１、２、または３つのアミノ酸置換）を含むという点を除いて、配列番号１として記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。

場合によって、ＣａｓＹタンパク質は、配列番号２として記載されるＣａｓＹタンパク質配列と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号２として記載されるＣａｓＹタンパク質配列と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号２として記載されるＣａｓＹタンパク質配列と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号２として記載されるＣａｓＹタンパク質配列と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号２として記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、その配列が、（例えば、後述するアミノ酸位置などに）タンパク質の天然の触媒活性を減少させるアミノ酸置換（例えば、１、２、または３つのアミノ酸置換）を含むという点を除いて、配列番号２として記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。

場合によって、ＣａｓＹタンパク質は、配列番号３として記載されるＣａｓＹタンパク質配列と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号３として記載されるＣａｓＹタンパク質配列と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号３として記載されるＣａｓＹタンパク質配列と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号３として記載されるＣａｓＹタンパク質配列と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号３として記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、その配列が、（例えば、後述するアミノ酸位置などに）タンパク質の天然の触媒活性を減少させるアミノ酸置換（例えば、１、２、または３つのアミノ酸置換）を含むという点を除いて、配列番号３として記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。

場合によって、ＣａｓＹタンパク質は、配列番号４として記載されるＣａｓＹタンパク質配列と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号４として記載されるＣａｓＹタンパク質配列と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号４として記載されるＣａｓＹタンパク質配列と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号４として記載されるＣａｓＹタンパク質配列と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号４として記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、その配列が、（例えば、後述するアミノ酸位置などに）タンパク質の天然の触媒活性を減少させるアミノ酸置換（例えば、１、２、または３つのアミノ酸置換）を含むという点を除いて、配列番号４として記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。

場合によって、ＣａｓＹタンパク質は、配列番号５として記載されるＣａｓＹタンパク質配列と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号５として記載されるＣａｓＹタンパク質配列と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号５として記載されるＣａｓＹタンパク質配列と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号５として記載されるＣａｓＹタンパク質配列と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号５として記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、その配列が、（例えば、後述するアミノ酸位置などに）タンパク質の天然の触媒活性を減少させるアミノ酸置換（例えば、１、２、または３つのアミノ酸置換）を含むという点を除いて、配列番号５として記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。

場合によって、ＣａｓＹタンパク質は、配列番号６として記載されるＣａｓＹタンパク質配列と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号６として記載されるＣａｓＹタンパク質配列と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号６として記載されるＣａｓＹタンパク質配列と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号６として記載されるＣａｓＹタンパク質配列と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号６として記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、その配列が、（例えば、後述するアミノ酸位置などに）タンパク質の天然の触媒活性を減少させるアミノ酸置換（例えば、１、２、または３つのアミノ酸置換）を含むという点を除いて、配列番号６として記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。

場合によって、ＣａｓＹタンパク質は、配列番号７として記載されるＣａｓＹタンパク質配列と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号７として記載されるＣａｓＹタンパク質配列と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号７として記載されるＣａｓＹタンパク質配列と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号７として記載されるＣａｓＹタンパク質配列と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号７として記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、その配列が、（例えば、後述するアミノ酸位置などに）タンパク質の天然の触媒活性を減少させるアミノ酸置換（例えば、１、２、または３つのアミノ酸置換）を含むという点を除いて、配列番号７として記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。

場合によって、ＣａｓＹタンパク質は、配列番号８として記載されるＣａｓＹタンパク質配列と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号８として記載されるＣａｓＹタンパク質配列と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号８として記載されるＣａｓＹタンパク質配列と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号８として記載されるＣａｓＹタンパク質配列と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号８として記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、その配列が、（例えば、後述するアミノ酸位置などに）タンパク質の天然の触媒活性を減少させるアミノ酸置換（例えば、１、２、または３つのアミノ酸置換）を含むという点を除いて、配列番号８として記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。

場合によって、ＣａｓＹタンパク質は、配列番号９として記載されるＣａｓＹタンパク質配列と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号９として記載されるＣａｓＹタンパク質配列と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号９として記載されるＣａｓＹタンパク質配列と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号９として記載されるＣａｓＹタンパク質配列と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号９として記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、その配列が、（例えば、後述するアミノ酸位置などに）タンパク質の天然の触媒活性を減少させるアミノ酸置換（例えば、１、２、または３つのアミノ酸置換）を含むという点を除いて、配列番号９として記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。

場合によって、ＣａｓＹタンパク質は、配列番号１〜４として記載されるＣａｓＹタンパク質配列のいずれか１つと２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜４として記載されるＣａｓＹタンパク質配列のいずれか１つと５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜４として記載されるＣａｓＹタンパク質配列のいずれか１つと８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜４として記載されるＣａｓＹタンパク質配列のいずれか１つと９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜４のいずれか１つに記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、その配列が、（例えば、後述するアミノ酸位置などに）タンパク質の天然の触媒活性を減少させるアミノ酸置換（例えば、１、２、または３つのアミノ酸置換）を含むという点を除いて、配列番号１〜４のいずれか１つに記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。

場合によって、ＣａｓＹタンパク質は、配列番号１〜５として記載されるＣａｓＹタンパク質配列のいずれか１つと２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜５として記載されるＣａｓＹタンパク質配列のいずれか１つと５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜５として記載されるＣａｓＹタンパク質配列のいずれか１つと８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜５として記載されるＣａｓＹタンパク質配列のいずれか１つと９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜５のいずれか１つに記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、その配列が、（例えば、後述するアミノ酸位置などに）タンパク質の天然の触媒活性を減少させるアミノ酸置換（例えば、１、２、または３つのアミノ酸置換）を含むという点を除いて、配列番号１〜５のいずれか１つに記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。

場合によって、ＣａｓＹタンパク質は、配列番号１〜７として記載されるＣａｓＹタンパク質配列のいずれか１つと２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜７として記載されるＣａｓＹタンパク質配列のいずれか１つと５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜７として記載されるＣａｓＹタンパク質配列のいずれか１つと８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜７として記載されるＣａｓＹタンパク質配列のいずれか１つと９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜７のいずれか１つに記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、その配列が、（例えば、後述するアミノ酸位置などに）タンパク質の天然の触媒活性を減少させるアミノ酸置換（例えば、１、２、または３つのアミノ酸置換）を含むという点を除いて、配列番号１〜７のいずれか１つに記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。

場合によって、ＣａｓＹタンパク質は、配列番号１〜８として記載されるＣａｓＹタンパク質配列のいずれか１つと２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜８として記載されるＣａｓＹタンパク質配列のいずれか１つと５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜８として記載されるＣａｓＹタンパク質配列のいずれか１つと８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜８として記載されるＣａｓＹタンパク質配列のいずれか１つと９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜８のいずれか１つに記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、その配列が、（例えば、後述するアミノ酸位置などに）タンパク質の天然の触媒活性を減少させるアミノ酸置換（例えば、１、２、または３つのアミノ酸置換）を含むという点を除いて、配列番号１〜８のいずれか１つに記載されるＣａｓＹタンパク質配列を有するアミノ酸配列を含む。

ＣａｓＹタンパク質ドメイン
ＣａｓＹタンパク質のドメインを図３に示す。図３の模式図（アミノ酸は、ＣａｓＹ１タンパク質（配列番号１）に基づいて付番されている）に見られるように、ＣａｓＹタンパク質には、おおよそ８００〜１０００アミノ酸長（例えば、ＣａｓＹ１は約８１５、及びＣａｓＹ５は約９８０）のＮ末端ドメインと、３つの部分ＲｕｖＣドメイン（ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ。本明細書でサブドメインとも称する）を含むＣ末端ドメインとが含まれ、ＲｕｖＣドメインは、ＣａｓＹタンパク質の一次アミノ酸配列では隣接していないが、タンパク質が産生され、折り畳まれるとＲｕｖＣドメインを形成する。したがって、場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有するＮ末端ドメインをもつアミノ酸配列を含む（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）。場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、分割されたＲｕｖＣドメイン（例えば、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）に対してＮ末端側である、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有するアミノ酸配列を含む（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。例えば、場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のアミノ酸１〜８１２を有するアミノ酸配列を含む。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜４のいずれか１つに記載されるＣａｓＹタンパク質配列のＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。例えば、場合によって、ＣａｓＹタンパク質は、配列番号１〜４のいずれか１つに記載されるＣａｓＹタンパク質配列のＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜４のいずれか１つに記載されるＣａｓＹタンパク質配列のＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜４のいずれか１つに記載されるＣａｓＹタンパク質配列のＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のアミノ酸１〜８１２に対応する、配列番号１〜４のいずれか１つのアミノ酸配列の断片を含む。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜５のいずれか１つに記載されるＣａｓＹタンパク質配列のＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。例えば、場合によって、ＣａｓＹタンパク質は、配列番号１〜５のいずれか１つに記載されるＣａｓＹタンパク質配列のＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜５のいずれか１つに記載されるＣａｓＹタンパク質配列のＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜５のいずれか１つに記載されるＣａｓＹタンパク質配列のＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のアミノ酸１〜８１２に対応する、配列番号１〜５のいずれか１つのアミノ酸配列の断片を含む。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜７のいずれか１つに記載されるＣａｓＹタンパク質配列のＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。例えば、場合によって、ＣａｓＹタンパク質は、配列番号１〜７のいずれか１つに記載されるＣａｓＹタンパク質配列のＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜７のいずれか１つに記載されるＣａｓＹタンパク質配列のＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜７のいずれか１つに記載されるＣａｓＹタンパク質配列のＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のアミノ酸１〜８１２に対応する、配列番号１〜７のいずれか１つのアミノ酸配列の断片を含む。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜８のいずれか１つに記載されるＣａｓＹタンパク質配列のＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。例えば、場合によって、ＣａｓＹタンパク質は、配列番号１〜８のいずれか１つに記載されるＣａｓＹタンパク質配列のＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜８のいずれか１つに記載されるＣａｓＹタンパク質配列のＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜８のいずれか１つに記載されるＣａｓＹタンパク質配列のＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のアミノ酸１〜８１２に対応する、配列番号１〜８のいずれか１つのアミノ酸配列の断片を含む。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜４として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、分割ＲｕｖＣドメイン（例えば、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）を含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含む。例えば、場合によって、ＣａｓＹタンパク質は、配列番号１〜４として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、分割ＲｕｖＣドメイン（例えば、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）を含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜４として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、分割ＲｕｖＣドメイン（例えば、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）を含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜４として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、分割ＲｕｖＣドメイン（例えば、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）を含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含む。場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のアミノ酸１〜８１２に対応するアミノ酸配列と、分割ＲｕｖＣドメイン（例えば、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）を含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含む。場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜５として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、分割ＲｕｖＣドメイン（例えば、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）を含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含む。例えば、場合によって、ＣａｓＹタンパク質は、配列番号１〜５として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、分割ＲｕｖＣドメイン（例えば、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）を含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜５として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、分割ＲｕｖＣドメイン（例えば、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）を含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜５として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、分割ＲｕｖＣドメイン（例えば、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）を含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含む。場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のアミノ酸１〜８１２に対応するアミノ酸配列と、分割ＲｕｖＣドメイン（例えば、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）を含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含む。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜７として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、分割ＲｕｖＣドメイン（例えば、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）を含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含む。例えば、場合によって、ＣａｓＹタンパク質は、配列番号１〜７として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、分割ＲｕｖＣドメイン（例えば、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）を含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜７として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、分割ＲｕｖＣドメイン（例えば、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）を含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜７として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、分割ＲｕｖＣドメイン（例えば、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）を含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含む。場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のアミノ酸１〜８１２に対応するアミノ酸配列と、分割ＲｕｖＣドメイン（例えば、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）を含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含む。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜８として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、分割ＲｕｖＣドメイン（例えば、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）を含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含む。例えば、場合によって、ＣａｓＹタンパク質は、配列番号１〜８として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、分割ＲｕｖＣドメイン（例えば、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）を含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜８として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、分割ＲｕｖＣドメイン（例えば、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）を含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜８として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、分割ＲｕｖＣドメイン（例えば、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）を含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含む。場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のアミノ酸１〜８１２に対応するアミノ酸配列と、分割ＲｕｖＣドメイン（例えば、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）を含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含む。

いくつかの実施形態では、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質の分割ＲｕｖＣドメインは、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間にＲｕｖＣ−ＩＩＩサブドメインより大きい領域を含む。例えば、場合によっては、ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比が１．１以上である（例えば、１．２）。場合によって、ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比が１より大きい。場合によって、ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．４、１〜１．３、または１〜１．２）である。

（本発明の組成物及び／または方法のＣａｓＹタンパク質に関する）いくつかの実施形態では、ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は２以下（例えば、１．８以下、１．７以下、１．６以下、１．５以下、または１．４以下）である。例えば、場合によっては、ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は１．５以下（例えば、１．４以下）である。いくつかの実施形態では、ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は、１〜２（例えば、１．１〜２、１．２〜２、１〜１．８、１．１〜１．８、１．２〜１．８、１〜１．６、１．１〜１．６、１．２〜１．６、１〜１４、１．１〜１．４、または１．２〜１．４）の範囲内である。

（本発明の組成物及び／または方法のＣａｓＹタンパク質に関して）場合によって、ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きい。場合によって、ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．３（例えば、１〜１．２）である。

（本発明の組成物及び／または方法のＣａｓＹタンパク質に関して）場合によって、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６０アミノ酸長（例えば、少なくとも６５、６８、または７０アミノ酸長）である。場合によって、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６０〜１１０アミノ酸の範囲（例えば、６０〜１０５、６０〜１００、６０〜９５、６０〜９０、６５〜１１０、６５〜１０５、６５〜１００、６５〜９５、または６５〜９０アミノ酸の範囲）の長さを有する。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜４として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩを含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含み、ここで、（ｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１．１以上（例えば、１．２）であるか；（ｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．４、１〜１．３、または１〜１．２）であるか；（ｉｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は２以下（例えば、１．８以下、１．７以下、１．６以下、１．５以下、または１．４以下）であるか；（ｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は１．５以下（例えば、１．４以下）であるか；（ｖｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は、１〜２（例えば、１．１〜２、１．２〜２、１〜１．８、１．１〜１．８、１．２〜１．８、１〜１．６、１．１〜１．６、１．２〜１．６、１〜１４、１．１〜１．４、または１．２〜１．４）の範囲内であるか；（ｖｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｖｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．２）であるか；（ｉｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６０アミノ酸長（例えば、少なくとも６５または少なくとも７０アミノ酸長）であるか；（ｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６５アミノ酸長であるか；（ｘｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６０〜１１０アミノ酸の範囲（例えば、６０〜１０５、６０〜１００、６０〜９５、６０〜９０、６５〜１１０、６５〜１０５、６５〜１００、６５〜９５、または６５〜９０アミノ酸の範囲）の長さを有するか；または（ｘｉｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６５〜９５アミノ酸の範囲の長さを有する。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜４として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と７５％以上の配列同一性（例えば、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩを含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含み、ここで、（ｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１．１以上（例えば、１．２）であるか；（ｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．４、１〜１．３、または１〜１．２）であるか；（ｉｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は２以下（例えば、１．８以下、１．７以下、１．６以下、１．５以下、または１．４以下）であるか；（ｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は１．５以下（例えば、１．４以下）であるか；（ｖｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は、１〜２（例えば、１．１〜２、１．２〜２、１〜１．８、１．１〜１．８、１．２〜１．８、１〜１．６、１．１〜１．６、１．２〜１．６、１〜１４、１．１〜１．４、または１．２〜１．４）の範囲内であるか；（ｖｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｖｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．２）であるか；（ｉｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６０アミノ酸長（例えば、少なくとも６５または少なくとも７０アミノ酸長）であるか；（ｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６５アミノ酸長であるか；（ｘｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６０〜１１０アミノ酸の範囲（例えば、６０〜１０５、６０〜１００、６０〜９５、６０〜９０、６５〜１１０、６５〜１０５、６５〜１００、６５〜９５、または６５〜９０アミノ酸の範囲）の長さを有するか；または（ｘｉｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６５〜９５アミノ酸の範囲の長さを有する。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜４として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と８５％以上の配列同一性（例えば、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩを含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含み、ここで、（ｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１．１以上（例えば、１．２）であるか；（ｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．４、１〜１．３、または１〜１．２）であるか；（ｉｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は２以下（例えば、１．８以下、１．７以下、１．６以下、１．５以下、または１．４以下）であるか；（ｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は１．５以下（例えば、１．４以下）であるか；（ｖｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は、１〜２（例えば、１．１〜２、１．２〜２、１〜１．８、１．１〜１．８、１．２〜１．８、１〜１．６、１．１〜１．６、１．２〜１．６、１〜１４、１．１〜１．４、または１．２〜１．４）の範囲内であるか；（ｖｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｖｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．２）であるか；（ｉｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６０アミノ酸長（例えば、少なくとも６５または少なくとも７０アミノ酸長）であるか；（ｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６５アミノ酸長であるか；（ｘｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６０〜１１０アミノ酸の範囲（例えば、６０〜１０５、６０〜１００、６０〜９５、６０〜９０、６５〜１１０、６５〜１０５、６５〜１００、６５〜９５、または６５〜９０アミノ酸の範囲）の長さを有するか；または（ｘｉｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６５〜９５アミノ酸の範囲の長さを有する。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜５として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩを含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含み、ここで、（ｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１．１以上（例えば、１．２）であるか；（ｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．４、１〜１．３、または１〜１．２）であるか；（ｉｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は２以下（例えば、１．８以下、１．７以下、１．６以下、１．５以下、または１．４以下）であるか；（ｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は１．５以下（例えば、１．４以下）であるか；（ｖｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は、１〜２（例えば、１．１〜２、１．２〜２、１〜１．８、１．１〜１．８、１．２〜１．８、１〜１．６、１．１〜１．６、１．２〜１．６、１〜１４、１．１〜１．４、または１．２〜１．４）の範囲内であるか；（ｖｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｖｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．２）であるか；（ｉｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６０アミノ酸長（例えば、少なくとも６５または少なくとも７０アミノ酸長）であるか；（ｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６５アミノ酸長であるか；（ｘｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６０〜１１０アミノ酸の範囲（例えば、６０〜１０５、６０〜１００、６０〜９５、６０〜９０、６５〜１１０、６５〜１０５、６５〜１００、６５〜９５、または６５〜９０アミノ酸の範囲）の長さを有するか；または（ｘｉｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６５〜９５アミノ酸の範囲の長さを有する。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜５として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と７５％以上の配列同一性（例えば、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩを含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含み、ここで、（ｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１．１以上（例えば、１．２）であるか；（ｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．４、１〜１．３、または１〜１．２）であるか；（ｉｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は２以下（例えば、１．８以下、１．７以下、１．６以下、１．５以下、または１．４以下）であるか；（ｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は１．５以下（例えば、１．４以下）であるか；（ｖｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は、１〜２（例えば、１．１〜２、１．２〜２、１〜１．８、１．１〜１．８、１．２〜１．８、１〜１．６、１．１〜１．６、１．２〜１．６、１〜１４、１．１〜１．４、または１．２〜１．４）の範囲内であるか；（ｖｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｖｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．２）であるか；（ｉｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６０アミノ酸長（例えば、少なくとも６５または少なくとも７０アミノ酸長）であるか；（ｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６５アミノ酸長であるか；（ｘｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６０〜１１０アミノ酸の範囲（例えば、６０〜１０５、６０〜１００、６０〜９５、６０〜９０、６５〜１１０、６５〜１０５、６５〜１００、６５〜９５、または６５〜９０アミノ酸の範囲）の長さを有するか；または（ｘｉｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６５〜９５アミノ酸の範囲の長さを有する。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜５として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と８５％以上の配列同一性（例えば、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩを含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含み、ここで、（ｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１．１以上（例えば、１．２）であるか；（ｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．４、１〜１．３、または１〜１．２）であるか；（ｉｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は２以下（例えば、１．８以下、１．７以下、１．６以下、１．５以下、または１．４以下）であるか；（ｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は１．５以下（例えば、１．４以下）であるか；（ｖｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は、１〜２（例えば、１．１〜２、１．２〜２、１〜１．８、１．１〜１．８、１．２〜１．８、１〜１．６、１．１〜１．６、１．２〜１．６、１〜１４、１．１〜１．４、または１．２〜１．４）の範囲内であるか；（ｖｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｖｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．２）であるか；（ｉｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６０アミノ酸長（例えば、少なくとも６５または少なくとも７０アミノ酸長）であるか；（ｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６５アミノ酸長であるか；（ｘｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６０〜１１０アミノ酸の範囲（例えば、６０〜１０５、６０〜１００、６０〜９５、６０〜９０、６５〜１１０、６５〜１０５、６５〜１００、６５〜９５、または６５〜９０アミノ酸の範囲）の長さを有するか；または（ｘｉｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６５〜９５アミノ酸の範囲の長さを有する。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜７として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩを含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含み、ここで、（ｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１．１以上（例えば、１．２）であるか；（ｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．４、１〜１．３、または１〜１．２）であるか；（ｉｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は２以下（例えば、１．８以下、１．７以下、１．６以下、１．５以下、または１．４以下）であるか；（ｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は１．５以下（例えば、１．４以下）であるか；（ｖｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は、１〜２（例えば、１．１〜２、１．２〜２、１〜１．８、１．１〜１．８、１．２〜１．８、１〜１．６、１．１〜１．６、１．２〜１．６、１〜１４、１．１〜１．４、または１．２〜１．４）の範囲内であるか；（ｖｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｖｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．２）であるか；（ｉｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６０アミノ酸長（例えば、少なくとも６５または少なくとも７０アミノ酸長）であるか；（ｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６５アミノ酸長であるか；（ｘｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６０〜１１０アミノ酸の範囲（例えば、６０〜１０５、６０〜１００、６０〜９５、６０〜９０、６５〜１１０、６５〜１０５、６５〜１００、６５〜９５、または６５〜９０アミノ酸の範囲）の長さを有するか；または（ｘｉｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６５〜９５アミノ酸の範囲の長さを有する。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜７として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と７５％以上の配列同一性（例えば、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩを含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含み、ここで、（ｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１．１以上（例えば、１．２）であるか；（ｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．４、１〜１．３、または１〜１．２）であるか；（ｉｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は２以下（例えば、１．８以下、１．７以下、１．６以下、１．５以下、または１．４以下）であるか；（ｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は１．５以下（例えば、１．４以下）であるか；（ｖｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は、１〜２（例えば、１．１〜２、１．２〜２、１〜１．８、１．１〜１．８、１．２〜１．８、１〜１．６、１．１〜１．６、１．２〜１．６、１〜１４、１．１〜１．４、または１．２〜１．４）の範囲内であるか；（ｖｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｖｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．２）であるか；（ｉｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６０アミノ酸長（例えば、少なくとも６５または少なくとも７０アミノ酸長）であるか；（ｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６５アミノ酸長であるか；（ｘｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６０〜１１０アミノ酸の範囲（例えば、６０〜１０５、６０〜１００、６０〜９５、６０〜９０、６５〜１１０、６５〜１０５、６５〜１００、６５〜９５、または６５〜９０アミノ酸の範囲）の長さを有するか；または（ｘｉｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６５〜９５アミノ酸の範囲の長さを有する。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜７として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と８５％以上の配列同一性（例えば、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩを含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含み、ここで、（ｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１．１以上（例えば、１．２）であるか；（ｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．４、１〜１．３、または１〜１．２）であるか；（ｉｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は２以下（例えば、１．８以下、１．７以下、１．６以下、１．５以下、または１．４以下）であるか；（ｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は１．５以下（例えば、１．４以下）であるか；（ｖｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は、１〜２（例えば、１．１〜２、１．２〜２、１〜１．８、１．１〜１．８、１．２〜１．８、１〜１．６、１．１〜１．６、１．２〜１．６、１〜１４、１．１〜１．４、または１．２〜１．４）の範囲内であるか；（ｖｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｖｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．２）であるか；（ｉｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６０アミノ酸長（例えば、少なくとも６５または少なくとも７０アミノ酸長）であるか；（ｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６５アミノ酸長であるか；（ｘｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６０〜１１０アミノ酸の範囲（例えば、６０〜１０５、６０〜１００、６０〜９５、６０〜９０、６５〜１１０、６５〜１０５、６５〜１００、６５〜９５、または６５〜９０アミノ酸の範囲）の長さを有するか；または（ｘｉｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６５〜９５アミノ酸の範囲の長さを有する。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜８として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩを含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含み、ここで、（ｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１．１以上（例えば、１．２）であるか；（ｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．４、１〜１．３、または１〜１．２）であるか；（ｉｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は２以下（例えば、１．８以下、１．７以下、１．６以下、１．５以下、または１．４以下）であるか；（ｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は１．５以下（例えば、１．４以下）であるか；（ｖｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は、１〜２（例えば、１．１〜２、１．２〜２、１〜１．８、１．１〜１．８、１．２〜１．８、１〜１．６、１．１〜１．６、１．２〜１．６、１〜１４、１．１〜１．４、または１．２〜１．４）の範囲内であるか；（ｖｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｖｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．２）であるか；（ｉｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６０アミノ酸長（例えば、少なくとも６５または少なくとも７０アミノ酸長）であるか；（ｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６５アミノ酸長であるか；（ｘｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６０〜１１０アミノ酸の範囲（例えば、６０〜１０５、６０〜１００、６０〜９５、６０〜９０、６５〜１１０、６５〜１０５、６５〜１００、６５〜９５、または６５〜９０アミノ酸の範囲）の長さを有するか；または（ｘｉｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６５〜９５アミノ酸の範囲の長さを有する。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜８として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と７５％以上の配列同一性（例えば、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩを含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含み、ここで、（ｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１．１以上（例えば、１．２）であるか；（ｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．４、１〜１．３、または１〜１．２）であるか；（ｉｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は２以下（例えば、１．８以下、１．７以下、１．６以下、１．５以下、または１．４以下）であるか；（ｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は１．５以下（例えば、１．４以下）であるか；（ｖｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は、１〜２（例えば、１．１〜２、１．２〜２、１〜１．８、１．１〜１．８、１．２〜１．８、１〜１．６、１．１〜１．６、１．２〜１．６、１〜１４、１．１〜１．４、または１．２〜１．４）の範囲内であるか；（ｖｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｖｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．２）であるか；（ｉｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６０アミノ酸長（例えば、少なくとも６５または少なくとも７０アミノ酸長）であるか；（ｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６５アミノ酸長であるか；（ｘｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６０〜１１０アミノ酸の範囲（例えば、６０〜１０５、６０〜１００、６０〜９５、６０〜９０、６５〜１１０、６５〜１０５、６５〜１００、６５〜９５、または６５〜９０アミノ酸の範囲）の長さを有するか；または（ｘｉｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６５〜９５アミノ酸の範囲の長さを有する。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜８として記載されるＣａｓＹタンパク質配列のいずれか１つのＮ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸１〜８１２として示されるドメイン）と８５％以上の配列同一性（例えば、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有する第１のアミノ酸配列と、３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩを含む、第１のアミノ酸配列に対してＣ末端側にある第２のアミノ酸配列とを含み、ここで、（ｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１．１以上（例えば、１．２）であるか；（ｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．４、１〜１．３、または１〜１．２）であるか；（ｉｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は２以下（例えば、１．８以下、１．７以下、１．６以下、１．５以下、または１．４以下）であるか；（ｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は１．５以下（例えば、１．４以下）であるか；（ｖｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は、１〜２（例えば、１．１〜２、１．２〜２、１〜１．８、１．１〜１．８、１．２〜１．８、１〜１．６、１．１〜１．６、１．２〜１．６、１〜１４、１．１〜１．４、または１．２〜１．４）の範囲内であるか；（ｖｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｖｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．２）であるか；（ｉｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６０アミノ酸長（例えば、少なくとも６５または少なくとも７０アミノ酸長）であるか；（ｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６５アミノ酸長であるか；（ｘｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６０〜１１０アミノ酸の範囲（例えば、６０〜１０５、６０〜１００、６０〜９５、６０〜９０、６５〜１１０、６５〜１０５、６５〜１００、６５〜９５、または６５〜９０アミノ酸の範囲）の長さを有するか；または（ｘｉｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６５〜９５アミノ酸の範囲の長さを有する。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有するＮ末端ドメインをもつ第１のアミノ酸配列（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）；ならびに３つの部分ＲｕｖＣドメイン−ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩを有する分割ＲｕｖＣドメインをもつ（第１のアミノ酸配列に対してＣ末端側にある）第２のアミノ酸配列を含み、ここで、（ｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１．１以上（例えば、１．２）であるか；（ｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．４、１〜１．３、または１〜１．２）であるか；（ｉｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は２以下（例えば、１．８以下、１．７以下、１．６以下、１．５以下、または１．４以下）であるか；（ｖ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は１．５以下（例えば、１．４以下）であるか；（ｖｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインの長さの比は、１〜２（例えば、１．１〜２、１．２〜２、１〜１．８、１．１〜１．８、１．２〜１．８、１〜１．６、１．１〜１．６、１．２〜１．６、１〜１４、１．１〜１．４、または１．２〜１．４）の範囲内であるか；（ｖｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は１より大きいか；（ｖｉｉｉ）ＲｕｖＣ−ＩＩＩサブドメインの長さに対する、ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域の長さの比は、１より大きく、かつ１〜１．５（例えば、１〜１．２）であるか；（ｉｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６０アミノ酸長（例えば、少なくとも６５または少なくとも７０アミノ酸長）であるか；（ｘ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、少なくとも６５アミノ酸長であるか；（ｘｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６０〜１１０アミノ酸の範囲（例えば、６０〜１０５、６０〜１００、６０〜９５、６０〜９０、６５〜１１０、６５〜１０５、６５〜１００、６５〜９５、または６５〜９０アミノ酸の範囲）の長さを有するか；または（ｘｉｉ）ＲｕｖＣ−ＩＩサブドメインとＲｕｖＣ−ＩＩＩサブドメインとの間の領域は、６５〜９５アミノ酸の範囲の長さを有する。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。例えば、場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のアミノ酸８１２〜１１２５を有するアミノ酸配列を含む。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜４として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。例えば、場合によって、ＣａｓＹタンパク質は、配列番号１〜４として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜４として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜４として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のアミノ酸８１２〜１１２５に対応する、配列番号１〜４として記載されるＣａｓＹタンパク質配列のいずれか１つのアミノ酸配列の断片を含む。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜５として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。例えば、場合によって、ＣａｓＹタンパク質は、配列番号１〜５として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜５として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜５として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のアミノ酸８１２〜１１２５に対応する、配列番号１〜５として記載されるＣａｓＹタンパク質配列のいずれか１つのアミノ酸配列の断片を含む。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜７として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。例えば、場合によって、ＣａｓＹタンパク質は、配列番号１〜７として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜７として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜７として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のアミノ酸８１２〜１１２５に対応する、配列番号１〜７として記載されるＣａｓＹタンパク質配列のいずれか１つのアミノ酸配列の断片を含む。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、配列番号１〜８として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。例えば、場合によって、ＣａｓＹタンパク質は、配列番号１〜８として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜８として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１〜８として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有するアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、配列番号１として記載されるＣａｓＹタンパク質配列のアミノ酸８１２〜１１２５に対応する、配列番号１〜８として記載されるＣａｓＹタンパク質配列のいずれか１つのアミノ酸配列の断片を含む。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有する第１のアミノ酸配列（Ｎ末端ドメイン）（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）；及び配列番号１〜４として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有し、第１のアミノ酸配列に対してＣ末端側に位置する第２のアミノ酸配列を含む。例えば、場合によって、ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有する第１のアミノ酸配列（Ｎ末端ドメイン）（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）；及び配列番号１〜４として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有し、第１のアミノ酸配列に対してＣ末端側に位置する第２のアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有する第１のアミノ酸配列（Ｎ末端ドメイン）（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）；及び配列番号１〜４として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有し、第１のアミノ酸配列に対してＣ末端側に位置する第２のアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有する第１のアミノ酸配列（Ｎ末端ドメイン）（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）；及び配列番号１〜４として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有し、第１のアミノ酸配列に対してＣ末端側に位置する第２のアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有する第１のアミノ酸配列（Ｎ末端ドメイン）（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）；及び配列番号１として記載されるＣａｓＹタンパク質配列のアミノ酸８１２〜１１２５に対応する、配列番号１〜４として記載されるＣａｓＹタンパク質配列のいずれか１つのアミノ酸配列の断片を有し、第１のアミノ酸配列に対してＣ末端側に位置する第２のアミノ酸配列を含む。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有する第１のアミノ酸配列（Ｎ末端ドメイン）（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）；及び配列番号１〜５として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有し、第１のアミノ酸配列に対してＣ末端側に位置する第２のアミノ酸配列を含む。例えば、場合によって、ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有する第１のアミノ酸配列（Ｎ末端ドメイン）（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）；及び配列番号１〜５として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有し、第１のアミノ酸配列に対してＣ末端側に位置する第２のアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有する第１のアミノ酸配列（Ｎ末端ドメイン）（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）；及び配列番号１〜５として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有し、第１のアミノ酸配列に対してＣ末端側に位置する第２のアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有する第１のアミノ酸配列（Ｎ末端ドメイン）（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）；及び配列番号１〜５として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有し、第１のアミノ酸配列に対してＣ末端側に位置する第２のアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有する第１のアミノ酸配列（Ｎ末端ドメイン）（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）；及び配列番号１として記載されるＣａｓＹタンパク質配列のアミノ酸８１２〜１１２５に対応する、配列番号１〜５として記載されるＣａｓＹタンパク質配列のいずれか１つのアミノ酸配列の断片を有し、第１のアミノ酸配列に対してＣ末端側に位置する第２のアミノ酸配列を含む。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有する第１のアミノ酸配列（Ｎ末端ドメイン）（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）；及び配列番号１〜７として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有し、第１のアミノ酸配列に対してＣ末端側に位置する第２のアミノ酸配列を含む。例えば、場合によって、ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有する第１のアミノ酸配列（Ｎ末端ドメイン）（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）；及び配列番号１〜７として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有し、第１のアミノ酸配列に対してＣ末端側に位置する第２のアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有する第１のアミノ酸配列（Ｎ末端ドメイン）（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）；及び配列番号１〜７として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有し、第１のアミノ酸配列に対してＣ末端側に位置する第２のアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有する第１のアミノ酸配列（Ｎ末端ドメイン）（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）；及び配列番号１〜７として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有し、第１のアミノ酸配列に対してＣ末端側に位置する第２のアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有する第１のアミノ酸配列（Ｎ末端ドメイン）（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）；及び配列番号１として記載されるＣａｓＹタンパク質配列のアミノ酸８１２〜１１２５に対応する、配列番号１〜７として記載されるＣａｓＹタンパク質配列のいずれか１つのアミノ酸配列の断片を有し、第１のアミノ酸配列に対してＣ末端側に位置する第２のアミノ酸配列を含む。

場合によって、（本発明の組成物及び／または方法の）ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有する第１のアミノ酸配列（Ｎ末端ドメイン）（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）；及び配列番号１〜８として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と２０％以上の配列同一性（例えば、３０％以上、４０％以上、５０％以上、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有し、第１のアミノ酸配列に対してＣ末端側に位置する第２のアミノ酸配列を含む。例えば、場合によって、ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有する第１のアミノ酸配列（Ｎ末端ドメイン）（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）；及び配列番号１〜８として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と５０％以上の配列同一性（例えば、６０％以上、７０％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有し、第１のアミノ酸配列に対してＣ末端側に位置する第２のアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有する第１のアミノ酸配列（Ｎ末端ドメイン）（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）；及び配列番号１〜８として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と８０％以上の配列同一性（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有し、第１のアミノ酸配列に対してＣ末端側に位置する第２のアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有する第１のアミノ酸配列（Ｎ末端ドメイン）（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）；及び配列番号１〜８として記載されるＣａｓＹタンパク質配列のいずれか１つのＣ末端ドメイン（例えば、図３、パネルＡのＣａｓＹ１においてアミノ酸８１２〜１１２５として示されるドメイン）と９０％以上の配列同一性（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％の配列同一性）を有し、第１のアミノ酸配列に対してＣ末端側に位置する第２のアミノ酸配列を含む。場合によって、ＣａｓＹタンパク質は、７５０〜１０５０アミノ酸（例えば、７５０〜１０２５、７５０〜１０００、７５０〜９５０、７７５〜１０５０、７７５〜１０２５、７７５〜１０００、７７５〜９５０、８００〜１０５０、８００〜１０２５、８００〜１０００、または８００〜９５０アミノ酸）の範囲の長さを有する第１のアミノ酸配列（Ｎ末端ドメイン）（例えば、ＮＬＳ及び／または触媒活性を有するドメインのような何らかの融合された異種配列は含まない）；及び配列番号１として記載されるＣａｓＹタンパク質配列のアミノ酸８１２〜１１２５に対応する、配列番号１〜８として記載されるＣａｓＹタンパク質配列のいずれか１つのアミノ酸配列の断片を有し、第１のアミノ酸配列に対してＣ末端側に位置する第２のアミノ酸配列を含む。

ＣａｓＹ変異体
変異体ＣａｓＹタンパク質は、対応する野生型ＣａｓＹタンパク質のアミノ酸配列と比較した場合に、少なくとも１つのアミノ酸が異なっている（例えば、欠失、挿入、置換、融合を有する）アミノ酸配列を有する。二本鎖標的核酸の一方の鎖を切断するが、他方の鎖は切断しないＣａｓＹタンパク質を、本明細書で「ニッカーゼ」（例えば、「ニッカーゼＣａｓＹ」）と称する。実質的にヌクレアーゼ活性をもたないＣａｓＹタンパク質を、本明細書で不活性ＣａｓＹタンパク質（「ｄＣａｓＹ」）と称する（ただし、以下で詳細に説明するキメラＣａｓＹタンパク質の場合、融合パートナーである異種ポリペプチドによってヌクレアーゼ活性を得ることができる）。本明細書に記載するＣａｓＹ変異体タンパク質のいずれでも（例えば、ニッカーゼＣａｓＹ、ｄＣａｓＹ、キメラＣａｓＹ）、ＣａｓＹ変異体は、上記と同じパラメーター（例えば、存在するドメイン、同一性パーセントなど）をもつＣａｓＹタンパク質配列を含み得る。

変異体−触媒活性
場合によって、ＣａｓＹタンパク質は、例えば、天然の触媒活性配列と比較して変異された変異体ＣａｓＹタンパク質であり、対応する天然配列と比較した場合に、減少した切断活性を示す（例えば、９０％以下、８０％以下、７０％以下、６０％以下、５０％以下、４０％以下、または３０％以下の切断活性を示す）。場合によって、そのような変異体ＣａｓＹタンパク質は、触媒「不活性」タンパク質であり（実質的に切断活性をもたない）、「ｄＣａｓＹ」と称されることがある。場合によって、変異体ＣａｓＹタンパク質はニッカーゼである（二本鎖標的核酸、例えば二本鎖標的ＤＮＡの一方の鎖のみを切断する）。本明細書で詳細に記載されるように、場合によって、ＣａｓＹタンパク質（野生型切断活性をもつＣａｓＹタンパク質の場合もあれば、減少した切断活性をもつ変異体ＣａｓＹ、例えばｄＣａｓＹまたはニッカーゼＣａｓＹの場合もある）は、目的とする活性（例えば、目的とする触媒活性）をもつ異種ポリペプチドと融合（複合体化）され、融合タンパク質（キメラＣａｓＹタンパク質）を形成する。

ＣａｓＹ１（配列番号１）に従う付番によれば、ＣａｓＹの触媒残基は、Ｄ８２８、Ｅ９１４、Ｄ１０７４を含む（配列番号１を示す図１では、これらの残基に下線が引かれている）。（例えば、図２のパネルＡ及びＢのアライメントを参照）。

このように、場合によって、ＣａｓＹタンパク質は、減少した活性をもち、かつ、上記アミノ酸の１つ以上（または任意ＣａｓＹタンパク質の１つ以上の対応するアミノ酸）が変異している（例えば、アラニンで置換されている）。場合によって、変異体ＣａｓＹタンパク質は触媒「不活性」タンパク質であり（触媒不活性であり）、「ｄＣａｓＹ」と称される。ｄＣａｓＹタンパク質は、活性を与える融合パートナーに融合することができ、場合によって、ｄＣａｓＹ（例えば、触媒活性を与える融合パートナーをもたないが、真核細胞に発現するとＮＬＳを有し得るもの）は標的ＤＮＡに結合することができ、ＲＮＡポリメラーゼを遮断して標的ＤＮＡからの翻訳を阻害することができる。場合によって、変異体ＣａｓＹタンパク質はニッカーゼである（二本鎖標的核酸、例えば二本鎖標的ＤＮＡの一方の鎖のみを切断する）。

変異体−キメラＣａｓＹ（すなわち融合タンパク質）
上記で述べたように、場合によって、ＣａｓＹタンパク質（野生型切断活性をもつＣａｓＹタンパク質の場合もあれば、減少した切断活性をもつ変異体ＣａｓＹ、例えばｄＣａｓＹまたはニッカーゼＣａｓＹの場合もある）は、目的とする活性（例えば、目的とする触媒活性）をもつ異種ポリペプチドと融合（複合体化）され、融合タンパク質（キメラＣａｓＹタンパク質）を形成する。ＣａｓＹタンパク質が融合することができる異種ポリペプチドを本明細書で「融合パートナー」と称する。

場合によって、融合パートナーは、標的ＤＮＡの転写を調節（例えば、転写を阻害、転写を増加）することができる。例えば、場合によって、融合パートナーは、転写を阻害するタンパク質（またはタンパク質由来のドメイン）である（例えば、転写抑制因子、ならびに転写阻害タンパク質の動員、メチル化などの標的ＤＮＡの修飾、ＤＮＡ修飾因子の動員、標的ＤＮＡと会合するヒストンの調節、ヒストンのアセチル化及び／またはメチル化を変更するもののようなヒストン修飾因子の動員などを介して機能するタンパク質）。場合によって、融合パートナーは、転写を増加させるタンパク質（またはタンパク質由来のドメイン）である（例えば、転写活性化因子、ならびに転写活性化タンパク質の動員、脱メチル化などの標的ＤＮＡの修飾、ＤＮＡ修飾因子の動員、標的ＤＮＡと会合するヒストンの調節、ヒストンのアセチル化及び／またはメチル化を変更するもののようなヒストン修飾因子の動員などを介して作用するタンパク質）。

場合によって、キメラＣａｓＹタンパク質は、標的核酸を修飾する酵素活性（例えば、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、ＤＮＡ修復活性、ＤＮＡ損傷活性、脱アミノ化活性、ジスムターゼ活性、アルキル化活性、脱プリン活性、酸化活性、ピリミジン二量体を形成する活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、またはグリコシラーゼ活性）をもつ異種ポリペプチドを含む。

場合によって、キメラＣａｓＹタンパク質は、標的核酸と会合するポリペプチド（例えばヒストン）を修飾する酵素活性（例えば、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、ＳＵＭＯ化活性、脱ＳＵＭＯ化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、または脱ミリストイル化活性）をもつ異種ポリペプチドを含む。

転写の増加に使用することができるタンパク質（またはその断片）の例として、ＶＰ１６、ＶＰ６４、ＶＰ４８、ＶＰ１６０、ｐ６５サブドメイン（例えば、ＮＦκＢ由来）、ならびにＥＤＬＬの活性化ドメイン及び／またはＴＡＬ活性化ドメイン（例えば、植物での活性のため）などの転写活性化因子；ＳＥＴ１Ａ、ＳＥＴ１Ｂ、ＭＬＬ１〜５、ＡＳＨ１、ＳＹＭＤ２、ＮＳＤ１などのヒストンリジンメチルトランスフェラーゼ；ＪＨＤＭ２ａ／ｂ、ＵＴＸ、ＪＭＪＤ３などのようなヒストンリジンデメチラーゼ；ＧＣＮ５、ＰＣＡＦ、ＣＢＰ、ｐ３００、ＴＡＦ１、ＴＩＰ６０／ＰＬＩＰ、ＭＯＺ／ＭＹＳＴ３、ＭＯＲＦ／ＭＹＳＴ４、ＳＲＣ１、ＡＣＴＲ、Ｐ１６０、ＣＬＯＣＫなどのようなヒストンアセチルトランスフェラーゼ；ならびにＴｅｎ−ＥｌｅｖｅｎＴｒａｎｓｌｏｃａｔｉｏｎ（ＴＥＴ）ジオキシゲナーゼ１（ＴＥＴ１ＣＤ）、ＴＥＴ１、ＤＭＥ、ＤＭＬ１、ＤＭＬ２、ＲＯＳ１などのようなＤＮＡデメチラーゼが挙げられるが、これらに限定されない。

転写の減少に使用することができるタンパク質（またはその断片）の例として、Ｋｒｕｐｐｅｌ関連ボックス（ＫＲＡＢまたはＳＫＤ）などの転写抑制因子；ＫＯＸ１抑制ドメイン；ＭａｄｍＳＩＮ３相互作用ドメイン（ＳＩＤ）；ＥＲＦ抑制因子ドメイン（ＥＲＤ）、ＳＲＤＸ抑制ドメイン（例えば、植物での抑制のため）など；Ｐｒ−ＳＥＴ７／８、ＳＵＶ４−２０Ｈ１、ＲＩＺ１などのようなヒストンリジンメチルトランスフェラーゼ；ＪＭＪＤ２Ａ／ＪＨＤＭ３Ａ、ＪＭＪＤ２Ｂ、ＪＭＪＤ２Ｃ／ＧＡＳＣ１、ＪＭＪＤ２Ｄ、ＪＡＲＩＤ１Ａ／ＲＢＰ２、ＪＡＲＩＤ１Ｂ／ＰＬＵ−１、ＪＡＲＩＤ１Ｃ／ＳＭＣＸ、ＪＡＲＩＤ１Ｄ／ＳＭＣＹなどのようなヒストンリジンデメチラーゼ；ＨＤＡＣ１、ＨＤＡＣ２、ＨＤＡＣ３、ＨＤＡＣ８、ＨＤＡＣ４、ＨＤＡＣ５、ＨＤＡＣ７、ＨＤＡＣ９、ＳＩＲＴ１、ＳＩＲＴ２、ＨＤＡＣ１１などのようなヒストンリジンデアセチラーゼ；ＨｈａＩＤＮＡｍ５ｃメチルトランスフェラーゼ（Ｍ．ＨｈａＩ）、ＤＮＡメチルトランスフェラーゼ１（ＤＮＭＴ１）、ＤＮＡメチルトランスフェラーゼ３ａ（ＤＮＭＴ３ａ）、ＤＮＡメチルトランスフェラーゼ３ｂ（ＤＮＭＴ３ｂ）、ＭＥＴＩ、ＤＲＭ３（植物）、ＺＭＥＴ２、ＣＭＴ１、ＣＭＴ２（植物）などのようなＤＮＡメチラーゼ；ならびにラミンＡ、ラミンＢなどのような周辺動員要素が挙げられるが、これらに限定されない。

場合によって、融合パートナーは、標的核酸（例えば、ｓｓＲＮＡ、ｄｓＲＮＡ、ｓｓＤＮＡ、ｄｓＤＮＡ）を修飾する酵素活性をもつ。融合パートナーが与えることができる酵素活性の例としては、制限酵素（例えば、ＦｏｋＩヌクレアーゼ）によって得られるようなヌクレアーゼ活性、メチルトランスフェラーゼ（例えば、ＨｈａＩＤＮＡｍ５ｃメチルトランスフェラーゼ（Ｍ．ＨｈａＩ）、ＤＮＡメチルトランスフェラーゼ１（ＤＮＭＴ１）、ＤＮＡメチルトランスフェラーゼ３ａ（ＤＮＭＴ３ａ）、ＤＮＡメチルトランスフェラーゼ３ｂ（ＤＮＭＴ３ｂ）、ＭＥＴＩ、ＤＲＭ３（植物）、ＺＭＥＴ２、ＣＭＴ１、ＣＭＴ２（植物）など）によって得られるようなメチルトランスフェラーゼ活性；デメチラーゼ（例えば、Ｔｅｎ−ＥｌｅｖｅｎＴｒａｎｓｌｏｃａｔｉｏｎ（ＴＥＴ）ジオキシゲナーゼ１（ＴＥＴ１ＣＤ）、ＴＥＴ１、ＤＭＥ、ＤＭＬ１、ＤＭＬ２、ＲＯＳ１など）によって得られるようなデメチラーゼ活性、ＤＮＡ修復活性、ＤＮＡ損傷活性、デアミナーゼ（例えば、ラットＡＰＯＢＥＣ１のようなシトシンデアミナーゼ酵素）によって得られるような脱アミノ化活性、ジスムターゼ活性、アルキル化活性、脱プリン活性、酸化活性、ピリミジン二量体を形成する活性、インテグラーゼ及び／またはレゾルバーゼ（例えば、Ｇｉｎインベルターゼの機能亢進変異体、ＧｉｎＨ１０６ＹなどのＧｉｎインベルターゼ；ヒト免疫不全ウイルス１型インテグラーゼ（ＩＮ）；Ｔｎ３レゾルバーゼなど）によって得られるようなインテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ（例えば、Ｇｉｎリコンビナーゼの触媒ドメイン）によって得られるようなリコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、ならびにグリコシラーゼ活性が挙げられるが、これらに限定されない。

場合によって、融合パートナーは、標的核酸（例えば、ｓｓＲＮＡ、ｄｓＲＮＡ、ｓｓＤＮＡ、ｄｓＤＮＡ）と会合するタンパク質（例えば、ヒストン、ＲＮＡ結合タンパク質、ＤＮＡ結合タンパク質など）を修飾する酵素活性をもつ。融合パートナーが与えることができる（標的核酸と会合するタンパク質を修飾する）酵素活性の例としては、ヒストンメチルトランスフェラーゼ（ＨＭＴ）（例えば、ｓｕｐｐｒｅｓｓｏｒｏｆｖａｒｉｅｇａｔｉｏｎ３−９ｈｏｍｏｌｏｇ１（ＳＵＶ３９Ｈ１、別称ＫＭＴ１Ａ）、ユークロマチンヒストンリジンメチルトランスフェラーゼ２（Ｇ９Ａ、別称ＫＭＴ１Ｃ及びＥＨＭＴ２）、ＳＵＶ３９Ｈ２、ＥＳＥＴ／ＳＥＴＤＢ１など、ＳＥＴ１Ａ、ＳＥＴ１Ｂ、ＭＬＬ１〜５、ＡＳＨ１、ＳＹＭＤ２、ＮＳＤ１、ＤＯＴ１Ｌ、Ｐｒ−ＳＥＴ７／８、ＳＵＶ４−２０Ｈ１、ＥＺＨ２、ＲＩＺ１）によって得られるようなメチルトランスフェラーゼ活性、ヒストンデメチラーゼ（例えば、リジンデメチラーゼ１Ａ（ＫＤＭ１Ａ、別称ＬＳＤ１）、ＪＨＤＭ２ａ／ｂ、ＪＭＪＤ２Ａ／ＪＨＤＭ３Ａ、ＪＭＪＤ２Ｂ、ＪＭＪＤ２Ｃ／ＧＡＳＣ１、ＪＭＪＤ２Ｄ、ＪＡＲＩＤ１Ａ／ＲＢＰ２、ＪＡＲＩＤ１Ｂ／ＰＬＵ−１、ＪＡＲＩＤ１Ｃ／ＳＭＣＸ、ＪＡＲＩＤ１Ｄ／ＳＭＣＹ、ＵＴＸ、ＪＭＪＤ３など）によって得られるようなデメチラーゼ活性、ヒストンアセチラーゼトランスフェラーゼ（例えば、ヒトアセチルトランスフェラーゼｐ３００、ＧＣＮ５、ＰＣＡＦ、ＣＢＰ、ＴＡＦ１、ＴＩＰ６０／ＰＬＩＰ、ＭＯＺ／ＭＹＳＴ３、ＭＯＲＦ／ＭＹＳＴ４、ＨＢＯ１／ＭＹＳＴ２、ＨＭＯＦ／ＭＹＳＴ１、ＳＲＣ１、ＡＣＴＲ、Ｐ１６０、ＣＬＯＣＫなどの触媒コア／断片）によって得られるようなアセチルトランスフェラーゼ活性、ヒストンデアセチラーゼ（例えば、ＨＤＡＣ１、ＨＤＡＣ２、ＨＤＡＣ３、ＨＤＡＣ８、ＨＤＡＣ４、ＨＤＡＣ５、ＨＤＡＣ７、ＨＤＡＣ９、ＳＩＲＴ１、ＳＩＲＴ２、ＨＤＡＣ１１など）によって得られるようなデアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、ＳＵＭＯ化活性、脱ＳＵＭＯ化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、ならびに脱ミリストイル化活性が挙げられるが、これらに限定されない。

好適な融合パートナーのさらなる例は、（例えば、化学的に制御可能なキメラＣａｓＹタンパク質を生成するための）ジヒドロ葉酸レダクターゼ（ＤＨＦＲ）不安定化ドメイン、及び葉緑体輸送ペプチドである。好適な葉緑体輸送ペプチドとして、以下が挙げられるが、これらに限定されない。

ＭＡＳＭＩＳＳＳＡＶＴＴＶＳＲＡＳＲＧＱＳＡＡＭＡＰＦＧＧＬＫＳＭＴＧＦＰＶＲＫＶＮＴＤＩＴＳＩＴＳＮＧＧＲＶＫＣＭＱＶＷＰＰＩＧＫＫＫＦＥＴＬＳＹＬＰＰＬＴＲＤＳＲＡ（配列番号８３）；ＭＡＳＭＩＳＳＳＡＶＴＴＶＳＲＡＳＲＧＱＳＡＡＭＡＰＦＧＧＬＫＳＭＴＧＦＰＶＲＫＶＮＴＤＩＴＳＩＴＳＮＧＧＲＶＫＳ（配列番号８４）；ＭＡＳＳＭＬＳＳＡＴＭＶＡＳＰＡＱＡＴＭＶＡＰＦＮＧＬＫＳＳＡＡＦＰＡＴＲＫＡＮＮＤＩＴＳＩＴＳＮＧＧＲＶＮＣＭＱＶＷＰＰＩＥＫＫＫＦＥＴＬＳＹＬＰＤＬＴＤＳＧＧＲＶＮＣ（配列番号８５）；ＭＡＱＶＳＲＩＣＮＧＶＱＮＰＳＬＩＳＮＬＳＫＳＳＱＲＫＳＰＬＳＶＳＬＫＴＱＱＨＰＲＡＹＰＩＳＳＳＷＧＬＫＫＳＧＭＴＬＩＧＳＥＬＲＰＬＫＶＭＳＳＶＳＴＡＣ（配列番号８６）；ＭＡＱＶＳＲＩＣＮＧＶＷＮＰＳＬＩＳＮＬＳＫＳＳＱＲＫＳＰＬＳＶＳＬＫＴＱＱＨＰＲＡＹＰＩＳＳＳＷＧＬＫＫＳＧＭＴＬＩＧＳＥＬＲＰＬＫＶＭＳＳＶＳＴＡＣ（配列番号８７）；ＭＡＱＩＮＮＭＡＱＧＩＱＴＬＮＰＮＳＮＦＨＫＰＱＶＰＫＳＳＳＦＬＶＦＧＳＫＫＬＫＮＳＡＮＳＭＬＶＬＫＫＤＳＩＦＭＱＬＦＣＳＦＲＩＳＡＳＶＡＴＡＣ（配列番号８８）；ＭＡＡＬＶＴＳＱＬＡＴＳＧＴＶＬＳＶＴＤＲＦＲＲＰＧＦＱＧＬＲＰＲＮＰＡＤＡＡＬＧＭＲＴＶＧＡＳＡＡＰＫＱＳＲＫＰＨＲＦＤＲＲＣＬＳＭＶＶ（配列番号８９）；ＭＡＡＬＴＴＳＱＬＡＴＳＡＴＧＦＧＩＡＤＲＳＡＰＳＳＬＬＲＨＧＦＱＧＬＫＰＲＳＰＡＧＧＤＡＴＳＬＳＶＴＴＳＡＲＡＴＰＫＱＱＲＳＶＱＲＧＳＲＲＦＰＳＶＶＶＣ（配列番号９０）；ＭＡＳＳＶＬＳＳＡＡＶＡＴＲＳＮＶＡＱＡＮＭＶＡＰＦＴＧＬＫＳＡＡＳＦＰＶＳＲＫＱＮＬＤＩＴＳＩＡＳＮＧＧＲＶＱＣ（配列番号９１）；ＭＥＳＬＡＡＴＳＶＦＡＰＳＲＶＡＶＰＡＡＲＡＬＶＲＡＧＴＶＶＰＴＲＲＴＳＳＴＳＧＴＳＧＶＫＣＳＡＡＶＴＰＱＡＳＰＶＩＳＲＳＡＡＡＡ（配列番号９２）；及びＭＧＡＡＡＴＳＭＱＳＬＫＦＳＮＲＬＶＰＰＳＲＲＬＳＰＶＰＮＮＶＴＣＮＮＬＰＫＳＡＡＰＶＲＴＶＫＣＣＡＳＳＷＮＳＴＩＮＧＡＡＡＴＴＮＧＡＳＡＡＳＳ（配列番号９３）。

場合によって、本開示のＣａｓＹ融合ポリペプチドは、ａ）本開示のＣａｓＹポリペプチド；及びｂ）葉緑体輸送ペプチドを含む。したがって、例えば、ＣＲＩＳＰＲ−ＣａｓＹ複合体は、葉緑体を標的とすることができる。場合によって、この標的化は、葉緑体輸送ペプチド（ＣＴＰ）または色素体輸送ペプチドと呼ばれるＮ末端伸長の存在によってなされ得る。発現されるポリペプチドが、植物色素体（例えば、葉緑体）において区画化されるようにする場合、細菌源からの染色体導入遺伝子は、発現されるポリペプチドをコードする配列に融合されたＣＴＰ配列をコードする配列を有していなければならない。したがって、葉緑体への外因性ポリペプチドの移行は、外因性ポリペプチドをコードするポリヌクレオチドの５’領域に機能可能に連結されているＣＴＰ配列をコードするポリヌクレオチド配列によって達成される場合が多い。ＣＴＰは、色素体への移行時の処理段階で除去される。しかしながら、処理効率は、ペプチドのＮＨ₂ 末端のＣＴＰ及び近傍配列のアミノ酸配列によって影響され得る。記載されている葉緑体を標的化するための他の選択肢は、トウモロコシｃａｂ−ｍ７シグナル配列（米国特許第７，０２２，８９６号、ＷＯ９７／４１２２８）、エンドウグルタチオンレダクターゼシグナル配列（ＷＯ９７／４１２２８）、及びＵＳ２００９０２９８６１に記載のＣＴＰである。

場合によって、本開示のＣａｓＹ融合ポリペプチドは、ａ）本開示のＣａｓＹポリペプチド；及びｂ）エンドソーム放出ペプチドを含み得る。場合によって、エンドソーム放出ポリペプチドは、アミノ酸配列ＧＬＦＸＡＬＬＸＬＬＸＳＬＷＸＬＬＬＸＡ（配列番号９４）を含み、ここで、各Ｘは独立して、リジン、ヒスチジン、及びアルギニンから選択される。場合によって、エンドソーム放出ポリペプチドは、アミノ酸配列ＧＬＦＨＡＬＬＨＬＬＨＳＬＷＨＬＬＬＨＡ（配列番号９５）を含む。

（部位特異的標的核酸修飾、転写の調節、及び／または標的タンパク質修飾、例えばヒストン修飾のための）Ｃａｓ９、ジンクフィンガー、及び／またはＴＡＬＥタンパク質との融合に関連して使用される上記の融合パートナーのいくつか（及びそれより多く）の例については、例えば、Ｎｏｍｕｒａｅｔａｌ，ＪＡｍＣｈｅｍＳｏｃ．２００７Ｊｕｌ１８；１２９（２８）：８６７６−７；Ｒｉｖｅｎｂａｒｋｅｔａｌ．，Ｅｐｉｇｅｎｅｔｉｃｓ．２０１２Ａｐｒ；７（４）：３５０−６０；ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２０１６Ｊｕｌ８；４４（１２）：５６１５−２８；Ｇｉｌｂｅｒｔｅｔａｌ．，Ｃｅｌｌ．２０１３Ｊｕｌ１８；１５４（２）：４４２−５１；Ｋｅａｒｎｓｅｔａｌ．，ＮａｔＭｅｔｈｏｄｓ．２０１５Ｍａｙ；１２（５）：４０１−３；Ｍｅｎｄｅｎｈａｌｌｅｔａｌ．，ＮａｔＢｉｏｔｅｃｈｎｏｌ．２０１３Ｄｅｃ；３１（１２）：１１３３−６；Ｈｉｌｔｏｎｅｔａｌ．，ＮａｔＢｉｏｔｅｃｈｎｏｌ．２０１５Ｍａｙ；３３（５）：５１０−７；Ｇｏｒｄｌｅｙｅｔａｌ．，ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２００９Ｍａｒ３１；１０６（１３）：５０５３−８；Ａｋｏｐｉａｎｅｔａｌ．，ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２００３Ｊｕｌ２２；１００（１５）：８６８８−９１；Ｔａｎｅｔ．，ａｌ．，ＪＶｉｒｏｌ．２００６Ｆｅｂ；８０（４）：１９３９−４８；Ｔａｎｅｔａｌ．，ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２００３Ｏｃｔ１４；１００（２１）：１１９９７−２００２；Ｐａｐｗｏｒｔｈｅｔａｌ．，ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２００３Ｆｅｂ１８；１００（４）：１６２１−６；Ｓａｎｊａｎａｅｔａｌ．，ＮａｔＰｒｏｔｏｃ．２０１２Ｊａｎ５；７（１）：１７１−９２；Ｂｅｅｒｌｉｅｔａｌ．，ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．１９９８Ｄｅｃ８；９５（２５）：１４６２８−３３；Ｓｎｏｗｄｅｎｅｔａｌ．，ＣｕｒｒＢｉｏｌ．２００２Ｄｅｃ２３；１２（２４）：２１５９−６６；Ｘｕｅｔ．ａｌ．，Ｘｕｅｔａｌ．，ＣｅｌｌＤｉｓｃｏｖ．２０１６Ｍａｙ３；２：１６００９；Ｋｏｍｏｒｅｔａｌ．，Ｎａｔｕｒｅ．２０１６Ａｐｒ２０；５３３（７６０３）：４２０−４；Ｃｈａｉｋｉｎｄｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２０１６Ａｕｇ１１；Ｃｈｏｕｄｈｕｒｙａｔ．ａｌ．，Ｏｎｃｏｔａｒｇｅｔ．２０１６Ｊｕｎ２３；Ｄｕｅｔａｌ．，ＣｏｌｄＳｐｒｉｎｇＨａｒｂＰｒｏｔｏｃ．２０１６Ｊａｎ４；Ｐｈａｍｅｔａｌ．，ＭｅｔｈｏｄｓＭｏｌＢｉｏｌ．２０１６；１３５８：４３−５７；Ｂａｌｂｏａｅｔａｌ．，ＳｔｅｍＣｅｌｌＲｅｐｏｒｔｓ．２０１５Ｓｅｐ８；５（３）：４４８−５９；Ｈａｒａｅｔａｌ．，ＳｃｉＲｅｐ．２０１５Ｊｕｎ９；５：１１２２１；Ｐｉａｔｅｋｅｔａｌ．，ＰｌａｎｔＢｉｏｔｅｃｈｎｏｌＪ．２０１５Ｍａｙ；１３（４）：５７８−８９；Ｈｕｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２０１４Ａｐｒ；４２（７）：４３７５−９０；Ｃｈｅｎｇｅｔａｌ．，ＣｅｌｌＲｅｓ．２０１３Ｏｃｔ；２３（１０）：１１６３−７１；及びＭａｅｄｅｒｅｔａｌ．，ＮａｔＭｅｔｈｏｄｓ．２０１３Ｏｃｔ；１０（１０）：９７７−９を参照のこと。

その他の好適な異種ポリペプチドとして、標的核酸の転写及び／または翻訳を直接的及び／または間接的に増加させるポリペプチド（例えば、転写活性化因子またはその断片、転写活性化因子を動員するタンパク質またはその断片、小分子／薬物応答性転写制御因子及び／または翻訳制御因子、翻訳制御タンパク質など）が挙げられるが、これらに限定されない。転写の増加または減少を果たす異種ポリペプチドの非限定的な例として、転写活性化因子ドメイン及び転写抑制因子ドメインが挙げられる。いくつかのそのような場合には、キメラＣａｓＹポリペプチドは、ガイド核酸（ガイドＲＮＡ）によって、標的核酸内の特定の場所（すなわち、配列）に対して標的化され、例えば、プロモーター（転写活性化因子の機能を選択的に阻害する）へのＲＮＡポリメラーゼの結合を遮断する、及び／またはクロマチンの局所状態を変化させるなどの遺伝子座特異的制御を及ぼす（例えば、標的核酸の修飾、または標的核酸に会合するポリペプチドの修飾に融合配列が使用される場合）。場合によって、変更（例えば、転写抑制または活性化）は一過性である。場合によって、変更は継承される（例えば、エピジェネティック修飾が、標的核酸または標的核酸に会合するタンパク質、例えばヌクレオソームヒストンに加えられた場合）。

ｓｓＲＮＡ標的核酸を標的とする場合に使用される異種ポリペプチドの非限定的な例として、（限定はされないが）スプライシング因子（例えば、ＲＳドメイン）；タンパク質翻訳構成要素（例えば、翻訳開始因子、伸長因子、及び／または放出因子；例えばｅＩＦ４Ｇ）；ＲＮＡメチラーゼ；ＲＮＡ編集酵素（例えばＲＮＡデアミナーゼ、例えばＲＮＡに作用するアデノシンデアミナーゼ（ＡＤＡＲ）。ＡからＩ及び／またはＣからＵに編集する酵素を含む）；ヘリカーゼ；ＲＮＡ結合タンパク質などが挙げられる。異種ポリペプチドは、タンパク質全体を含むこともあれば、場合によってタンパク質の断片（例えば、機能ドメイン）を含むこともあると理解される。

本発明のキメラＣａｓＹポリペプチドの異種ポリペプチドは、一過性または不可逆性、直接的または間接的を問わず、ｓｓＲＮＡ（本開示の目的では、分子内及び／または分子間二次構造、例えば、ヘアピン、ステムループなどの二本鎖ＲＮＡ二重鎖を含む）と相互作用できる任意のドメインであってよく、限定はされないが、以下を含む群から選択されるエフェクタードメインを含む：エンドヌクレアーゼ（例えば、ＳＭＧ５及びＳＭＧ６などのタンパク質由来のＲＮａｓｅＩＩＩ、ＣＲＲ２２ＤＹＷドメイン、ダイサー、及びＰＩＮ（ＰｉｌＴＮ末端）ドメイン）；ＲＮＡ切断の刺激を担うタンパク質及びタンパク質ドメイン（例えば、ＣＰＳＦ、ＣｓｔＦ、ＣＦＩｍ、及びＣＦＩＩｍ）；エキソヌクレアーゼ（例えば、ＸＲＮ−１またはエキソヌクレアーゼＴ）；デアデニラーゼ（例えばＨＮＴ３）；ナンセンス介在性のＲＮＡ分解を担うタンパク質及びタンパク質ドメイン（例えば、ＵＰＦ１、ＵＰＦ２、ＵＰＦ３、ＵＰＦ３ｂ、ＲＮＰＳ１、Ｙ１４、ＤＥＫ、ＲＥＦ２、及びＳＲｍ１６０）；ＲＮＡの安定化を担うタンパク質及びタンパク質ドメイン（例えばＰＡＢＰ）；翻訳の抑制を担うタンパク質及びタンパク質ドメイン（例えば、Ａｇｏ２及びＡｇｏ４）；翻訳刺激を担うタンパク質及びタンパク質ドメイン（例えばＳｔａｕｆｅｎ）；翻訳の調節を担う（例えば、可能である）タンパク質及びタンパク質ドメイン（例えば、開始因子、伸長因子、放出因子などの翻訳因子、例えばｅＩＦ４Ｇ）；ＲＮＡのポリアデニル化を担うタンパク質及びタンパク質ドメイン（例えば、ＰＡＰ１、ＧＬＤ−２、及びＳｔａｒ−ＰＡＰ）；ＲＮＡのポリウリジニル化を担うタンパク質及びタンパク質ドメイン（例えばＣＩＤ１及び末端ウリジル酸トランスフェラーゼ）；ＲＮＡの移行を担うタンパク質及びタンパク質ドメイン（例えば、ＩＭＰ１、ＺＢＰ１、Ｓｈｅ２ｐ、Ｓｈｅ３ｐ、及びＢｉｃａｕｄａｌ−Ｄに由来）；ＲＮＡの核内保持を担うタンパク質及びタンパク質ドメイン（例えばＲｒｐ６）；ＲＮＡの核外輸送を担うタンパク質及びタンパク質ドメイン（例えば、ＴＡＰ、ＮＸＦ１、ＴＨＯ、ＴＲＥＸ、ＲＥＦ、及びＡｌｙ）；ＲＮＡスプライシングの抑制を担うタンパク質及びタンパク質ドメイン（例えば、ＰＴＢ、Ｓａｍ６８、及びｈｎＲＮＰＡ１）；ＲＮＡスプライシングの刺激を担うタンパク質及びタンパク質ドメイン（例えばセリン／アルギニンリッチ（ＳＲ）ドメイン）；転写効率の低下を担うタンパク質及びタンパク質ドメイン（例えばＦＵＳ（ＴＬＳ））；転写の刺激を担うタンパク質及びタンパク質ドメイン（例えばＣＤＫ７及びＨＩＶＴａｔ）。あるいは、エフェクタードメインは、エンドヌクレアーゼ；ＲＮＡ切断の刺激が可能であるタンパク質及びタンパク質ドメイン；エキソヌクレアーゼ；デアデニラーゼ；ナンセンス介在性のＲＮＡ分解活性をもつタンパク質及びタンパク質ドメイン；ＲＮＡの安定化が可能であるタンパク質及びタンパク質ドメイン；翻訳の抑制が可能であるタンパク質及びタンパク質ドメイン；翻訳の刺激が可能であるタンパク質及びタンパク質ドメイン；翻訳の調節が可能であるタンパク質及びタンパク質ドメイン（例えば、開始因子、伸長因子、放出因子などの翻訳因子、例えばｅＩＦ４Ｇ）；ＲＮＡのポリアデニル化が可能であるタンパク質及びタンパク質ドメイン；ＲＮＡのポリアデニル化が可能であるタンパク質及びタンパク質ドメイン；ＲＮＡの移行活性をもつタンパク質及びタンパク質ドメイン；ＲＮＡの核内保持が可能であるタンパク質及びタンパク質ドメイン；ＲＮＡ核外輸送活性をもつタンパク質及びタンパク質ドメイン；ＲＮＡスプライシングの抑制が可能であるタンパク質及びタンパク質ドメイン；ＲＮＡスプライシングの刺激が可能であるタンパク質及びタンパク質ドメイン；転写効率の低下が可能であるタンパク質及びタンパク質ドメイン；ならびに転写の刺激が可能であるタンパク質及びタンパク質ドメインを含む群から選択してもよい。別の好適な異種ポリペプチドは、ＷＯ２０１２０６８６２７（その全体が参照により本明細書に組み込まれる）に詳細に記載されているＰＵＦＲＮＡ結合ドメインである。

キメラＣａｓＹポリペプチドにおいて異種ポリペプチドとして（全体またはその断片として）使用できるＲＮＡスプライシング因子のいくつかは、個別の配列特異的ＲＮＡ結合モジュール及びスプライシングエフェクタードメインをもつモジュール構造を有する。例えば、セリン／アルギニンリッチ（ＳＲ）タンパク質ファミリーのメンバーは、ｍＲＮＡ前駆体においてエキソンスプライシングエンハンサー（ＥＳＥ）に結合するＮ末端ＲＮＡ認識モチーフ（ＲＲＭ）、及びエキソンの取り込みを促進するＣ末端ＲＳドメインで構成される。別の例として、ｈｎＲＮＰタンパク質ｈｎＲＮＰＡｌは、ＲＲＭドメインを介してエキソンスプライシングサイレンサー（ＥＳＳ）に結合し、Ｃ末端グリシンリッチドメインを介してエキソンの取り込みを阻害する。いくつかのスプライシング因子は、２つの別の部位間の制御配列に結合することにより、スプライス部位（ＳＳ）の選択的使用を制御することができる。例えば、ＡＳＦ／ＳＦ２は、ＥＳＥを認識し、イントロン近位の部位の使用を促進することができ、一方のｈｎＲＮＰＡｌはＥＳＳに結合し、イントロン遠位の部位を使用するようにスプライシングをシフトすることができる。このような因子の一用途は、内因性遺伝子、特に疾患関連遺伝子の選択的スプライシングを調節するＥＳＦを生成することである。例えば、Ｂｃｌ−ｘｍＲＮＡ前駆体は、相対する機能のタンパク質をコードする２つの選択的５’スプライス部位を有する２つのスプライシングアイソフォームを生成する。長鎖スプライシングアイソフォームＢｃｌ−ｘＬは、長寿命の有糸分裂後細胞に発現する強力なアポトーシス阻害因子であり、多くのがん細胞において上方制御され、アポトーシスシグナルから細胞を保護する。短鎖アイソフォームＢｃｌ−ｘＳは、アポトーシス促進性アイソフォームであり、代謝回転率の高い（例えば、リンパ球を発生する）細胞に高レベルで発現する。２つのＢｃｌ−ｘスプライシングアイソフォームの比は、エキソン中核領域またはエキソン伸長領域のいずれか（すなわち、２つの選択的５’スプライス部位間）に配置された複数のシスエレメントによって制御される。その他の例については、その全体が参照により本明細書に組み込まれるＷＯ２０１００７５３０３を参照のこと。

さらに好適な融合パートナーとして、境界要素であるタンパク質（またはその断片）（例えば、ＣＴＣＦ）、周辺動員をもたらすタンパク質及びその断片（例えば、ラミンＡ、ラミンＢなど）、タンパク質ドッキング要素（例えば、ＦＫＢＰ／ＦＲＢ、Ｐｉｌ１／Ａｂｙ１など）が挙げられるが、これらに限定されない。

本発明のキメラＣａｓＹポリペプチドに適した様々な追加の異種ポリペプチド（またはその断片）の例としては、以下の出願：ＰＣＴ特許出願：ＷＯ２０１００７５３０３、ＷＯ２０１２０６８６２７、及びＷＯ２０１３１５５５５５に記載されるものが挙げられるが、これらに限定されない（公報は、Ｃａｓ９などの他のＣＲＩＳＰＲエンドヌクレアーゼに関するものであるが、記載される融合パートナーを代わりにＣａｓＹと共に使用することができる）。また、例えば、米国特許及び特許出願：第８，９０６，６１６号；第８，８９５，３０８号；第８，８８９，４１８号；第８，８８９，３５６号；第８，８７１，４４５号；第８，８６５，４０６号；第８，７９５，９６５号；第８，７７１，９４５号；第８，６９７，３５９号；第２０１４００６８７９７号；第２０１４０１７０７５３号；第２０１４０１７９００６号；第２０１４０１７９７７０号；第２０１４０１８６８４３号；第２０１４０１８６９１９号；第２０１４０１８６９５８号；第２０１４０１８９８９６号；第２０１４０２２７７８７号；第２０１４０２３４９７２号；第２０１４０２４２６６４号；第２０１４０２４２６９９号；第２０１４０２４２７００号；第２０１４０２４２７０２号；第２０１４０２４８７０２号；第２０１４０２５６０４６号；第２０１４０２７３０３７号；第２０１４０２７３２２６号；第２０１４０２７３２３０号；第２０１４０２７３２３１号；第２０１４０２７３２３２号；第２０１４０２７３２３３号；第２０１４０２７３２３４号；第２０１４０２７３２３５号；第２０１４０２８７９３８号；第２０１４０２９５５５６号；第２０１４０２９５５５７号；第２０１４０２９８５４７号；第２０１４０３０４８５３号；第２０１４０３０９４８７号；第２０１４０３１０８２８号；第２０１４０３１０８３０号；第２０１４０３１５９８５号；第２０１４０３３５０６３号；第２０１４０３３５６２０号；第２０１４０３４２４５６号；第２０１４０３４２４５７号；第２０１４０３４２４５８号；第２０１４０３４９４００号；第２０１４０３４９４０５号；第２０１４０３５６８６７号；第２０１４０３５６９５６号；第２０１４０３５６９５８号；第２０１４０３５６９５９号；第２０１４０３５７５２３号；第２０１４０３５７５３０号；第２０１４０３６４３３３号；第２０１４０３７７８６８号で参照することができ、すべての文献はその全体が参照により本明細書に組み込まれる。

場合によって、異種ポリペプチド（融合パートナー）は細胞内移行をもたらす。すなわち、この異種ポリペプチドは、細胞内移行配列（例えば、核を標的とする核移行シグナル（ＮＬＳ）、融合タンパク質を核に入れないようにする配列、例えば、核外輸送配列（ＮＥＳ）、融合タンパク質を細胞質内に保持したままにする配列、ミトコンドリアを標的とするミトコンドリア移行シグナル、葉緑体を標的とする葉緑体移行シグナル、ＥＲ保持シグナルなど）を含んでいる。いくつかの実施形態では、ＣａｓＹ融合ポリペプチドは、タンパク質が核を標的にしないようにＮＬＳを含まない（例えば、標的核酸が、サイトゾル内に存在するＲＮＡである場合に有利になる可能性がある）。いくつかの実施形態では、異種ポリペプチドは、追跡及び／または精製を容易にするためのタグ（例えば、蛍光タンパク質、例えば、緑色蛍光タンパク質（ＧＦＰ）、ＹＦＰ、ＲＦＰ、ＣＦＰ、ｍＣｈｅｒｒｙ、ｔｄＴｏｍａｔｏなど；ヒスチジンタグ、例えば、６ＸＨｉｓタグ；ヘマグルチニン（ＨＡ）タグ；ＦＬＡＧタグ；Ｍｙｃタグなど）を提供することができる（すなわち、異種ポリペプチドは検出可能な標識である）。

場合によって、ＣａｓＹタンパク質（例えば、野生型ＣａｓＹタンパク質、変異体ＣａｓＹタンパク質、キメラＣａｓＹタンパク質、ｄＣａｓＹタンパク質、減少したヌクレアーゼ活性をＣａｓＹ部分がもつキメラＣａｓＹタンパク質（例えば、融合パートナーに融合されたｄＣａｓＹタンパク質）など）は、核移行シグナル（ＮＬＳ）（例えば、場合によって２つ以上、３つ以上、４つ以上、または５つ以上のＮＬＳ）を含む（に融合されている）。したがって、場合によって、ＣａｓＹポリペプチドは、１つ以上のＮＬＳ（例えば、２つ以上、３つ以上、４つ以上、または５つ以上のＮＬＳ）を含む。場合によって、１つ以上のＮＬＳ（２つ以上、３つ以上、４つ以上、または５つ以上のＮＬＳ）は、Ｎ末端及び／またはＣ末端に、またはその付近（例えば５０アミノ酸以内）に位置する。場合によって、１つ以上のＮＬＳ（２つ以上、３つ以上、４つ以上、または５つ以上のＮＬＳ）は、Ｎ末端に、またはその付近（例えば５０アミノ酸以内）に位置する。場合によって、１つ以上のＮＬＳ（２つ以上、３つ以上、４つ以上、または５つ以上のＮＬＳ）は、Ｃ末端に、またはその付近（例えば５０アミノ酸以内）に位置する。場合によって、１つ以上のＮＬＳ（３つ以上、４つ以上、または５つ以上のＮＬＳ）は、Ｎ末端とＣ末端の両方に、または両方の付近（例えば５０アミノ酸以内）に位置する。場合によって、１つのＮＬＳがＮ末端に位置し、１つのＮＬＳがＣ末端に位置している。

場合によって、ＣａｓＹタンパク質（例えば、野生型ＣａｓＹタンパク質、変異体ＣａｓＹタンパク質、キメラＣａｓＹタンパク質、ｄＣａｓＹタンパク質、減少したヌクレアーゼ活性をＣａｓＹ部分がもつキメラＣａｓＹタンパク質（例えば、融合パートナーに融合されたｄＣａｓＹタンパク質）など）は、１〜１０個のＮＬＳ（例えば、１〜９、１〜８、１〜７、１〜６、１〜５、２〜１０、２〜９、２〜８、２〜７、２〜６、または２〜５個のＮＬＳ）を含む（に融合されている）。場合によって、ＣａｓＹタンパク質（例えば、野生型ＣａｓＹタンパク質、変異体ＣａｓＹタンパク質、キメラＣａｓＹタンパク質、ｄＣａｓＹタンパク質、減少したヌクレアーゼ活性をＣａｓＹ部分がもつキメラＣａｓＹタンパク質（例えば、融合パートナーに融合されたｄＣａｓＹタンパク質）など）は、２〜５個のＮＬＳ（例えば、２〜４または２〜３個のＮＬＳ）を含む（に融合されている）。

ＮＬＳの非限定的な例としては、アミノ酸配列ＰＫＫＫＲＫＶ（配列番号９６）を有するＳＶ４０ウイルスラージＴ抗原のＮＬＳ；ヌクレオプラスミン由来のＮＬＳ（例えば、配列ＫＲＰＡＡＴＫＫＡＧＱＡＫＫＫＫ（配列番号９７）を有するヌクレオプラスミン二分型ＮＬＳ）；アミノ酸配列ＰＡＡＫＲＶＫＬＤ（配列番号９８）またはＲＱＲＲＮＥＬＫＲＳＰ（配列番号９９）を有するｃ−ｍｙｃＮＬＳ；配列ＮＱＳＳＮＦＧＰＭＫＧＧＮＦＧＧＲＳＳＧＰＹＧＧＧＧＱＹＦＡＫＰＲＮＱＧＧＹ（配列番号１００）を有するｈＲＮＰＡ１Ｍ９ＮＬＳ；インポーチン−アルファ由来のＩＢＢドメインの配列ＲＭＲＩＺＦＫＮＫＧＫＤＴＡＥＬＲＲＲＲＶＥＶＳＶＥＬＲＫＡＫＫＤＥＱＩＬＫＲＲＮＶ（配列番号１０１）；筋腫Ｔタンパク質の配列ＶＳＲＫＲＰＲＰ（配列番号１０２）及びＰＰＫＫＡＲＥＤ（配列番号１０３）；ヒトｐ５３の配列ＰＱＰＫＫＫＰＬ（配列番号１０４）；マウスｃ−ａｂｌＩＶの配列ＳＡＬＩＫＫＫＫＫＭＡＰ（配列番号１０５）；インフルエンザウイルスＮＳ１の配列ＤＲＬＲＲ（配列番号１０６）及びＰＫＱＫＫＲＫ（配列番号１０７）；肝炎ウイルスデルタ抗原の配列ＲＫＬＫＫＫＩＫＫＬ（配列番号１０８）；マウスＭｘ１タンパク質の配列ＲＥＫＫＫＦＬＫＲＲ（配列番号１０９）；ヒトポリ（ＡＤＰリボース）ポリメラーゼの配列ＫＲＫＧＤＥＶＤＧＶＤＥＶＡＫＫＫＳＫＫ（配列番号１１０）；ステロイドホルモン受容体（ヒト）グルココルチコイドの配列ＲＫＣＬＱＡＧＭＮＬＥＡＲＫＴＫＫ（配列番号１１１）に由来するＮＬＳ配列が挙げられる。一般に、ＮＬＳ（または複数のＮＬＳ）は、真核細胞の核内への検出可能な量のＣａｓＹタンパク質の蓄積を誘導するのに十分な強度のものである。核内の蓄積の検出は、任意の好適な技術によって実施することができる。例えば、細胞内での位置を可視化できるように、検出可能なマーカーをＣａｓＹタンパク質に融合してもよい。細胞核は細胞から単離することができ、その後、内容物を免疫組織化学法、ウェスタンブロット、または酵素活性アッセイなどのタンパク質の検出に適した任意の方法によって分析することができる。核内の蓄積はまた、間接的に決定することもできる。

場合によって、ＣａｓＹ融合ポリペプチドは、脂質二重層、ミセル、細胞膜、オルガネラ膜、または小胞膜の透過を促進するポリペプチド、ポリヌクレオチド、炭水化物、または有機もしくは無機化合物を指す、「タンパク質導入ドメイン」すなわちＰＴＤ（細胞膜透過性ペプチド、ＣＰＰとも呼ばれる）を含む。極性小分子から大きな巨大分子及び／またはナノ粒子までを範囲とし得る別の分子に結合したＰＴＤは、例えば、細胞外空間から細胞内空間への、またはサイトゾルからオルガネラ内への移行といった、分子の膜透過を促進する。いくつかの実施形態では、ＰＴＤはポリペプチドのアミノ末端に共有結合している（例えば、野生型ＣａｓＹに結合して融合タンパク質を形成する、またはｄＣａｓＹ、ニッカーゼＣａｓＹ、もしくはキメラＣａｓＹタンパク質などの変異体ＣａｓＹタンパク質に結合して融合タンパク質を形成する）。いくつかの実施形態では、ＰＴＤはポリペプチドのカルボキシル末端に共有結合している（例えば、野生型ＣａｓＹに結合して融合タンパク質を形成する、またはｄＣａｓＹ、ニッカーゼＣａｓＹ、もしくはキメラＣａｓＹタンパク質などの変異体ＣａｓＹタンパク質に結合して融合タンパク質を形成する）。場合によって、ＰＴＤは、適切な挿入部位でＣａｓＹ融合ポリペプチド内に内部挿入されている（すなわち、ＣａｓＹ融合ポリペプチドのＮ末端またはＣ末端にはない）。場合によって、本発明のＣａｓＹ融合ポリペプチドは、１つ以上のＰＴＤ（例えば、２つ以上、３つ以上、４つ以上のＰＴＤ）を含む（ＰＴＤと複合体化される、融合される）。場合によって、ＰＴＤは、核移行シグナル（ＮＬＳ）（例えば、場合によって２つ以上、３つ以上、４つ以上、または５つ以上のＮＬＳ）を含む。したがって、場合によって、ＣａｓＹ融合ポリペプチドは、１つ以上のＮＬＳ（例えば、２つ以上、３つ以上、４つ以上、または５つ以上のＮＬＳ）を含む。いくつかの実施形態では、ＰＴＤは核酸（例えば、ＣａｓＹガイド核酸、ＣａｓＹガイド核酸をコードするポリヌクレオチド、ＣａｓＹ融合ポリペプチドをコードするポリヌクレオチド、ドナーポリヌクレオチドなど）に共有結合している。ＰＴＤの例としては、最小のウンデカペプチドタンパク質導入ドメイン（ＹＧＲＫＫＲＲＱＲＲＲ：配列番号１１２を含むＨＩＶ−１ＴＡＴの４７〜５７残基に対応）；細胞への直接導入に十分な複数のアルギニン（例えば、３、４、５、６、７、８、９、１０、または１０〜５０のアルギニン）を含むポリアルギニン配列；ＶＰ２２ドメイン（Ｚｅｎｄｅｒｅｔａｌ．（２００２）ＣａｎｃｅｒＧｅｎｅＴｈｅｒ．９（６）：４８９−９６）；ＤｒｏｓｏｐｈｉｌａＡｎｔｅｎｎａｐｅｄｉａタンパク質導入ドメイン（Ｎｏｇｕｃｈｉｅｔａｌ．（２００３）Ｄｉａｂｅｔｅｓ５２（７）：１７３２−１７３７）；短縮ヒトカルシトニンペプチド（Ｔｒｅｈｉｎｅｔａｌ．（２００４）Ｐｈａｒｍ．Ｒｅｓｅａｒｃｈ２１：１２４８−１２５６）；ポリリジン（Ｗｅｎｄｅｒｅｔａｌ．（２０００）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９７：１３００３−１３００８）；ＲＲＱＲＲＴＳＫＬＭＫＲ（配列番号１１３）；トランスポータンＧＷＴＬＮＳＡＧＹＬＬＧＫＩＮＬＫＡＬＡＡＬＡＫＫＩＬ（配列番号１１４）；ＫＡＬＡＷＥＡＫＬＡＫＡＬＡＫＡＬＡＫＨＬＡＫＡＬＡＫＡＬＫＣＥＡ（配列番号１１５）；及びＲＱＩＫＩＷＦＱＮＲＲＭＫＷＫＫ（配列番号１１６）が挙げられるが、これらに限定されない。例示的なＰＴＤとして、限定はされないが、ＹＧＲＫＫＲＲＱＲＲＲ（配列番号１１７）、ＲＫＫＲＲＱＲＲＲ（配列番号１１８）；３アルギニン残基から５０アルギニン残基までからなるアルギニンホモポリマーが挙げられ、例示的なＰＴＤドメインアミノ酸配列には、限定はされないが、以下のいずれかが含まれる：ＹＧＲＫＫＲＲＱＲＲＲ（配列番号１１９）；ＲＫＫＲＲＱＲＲ（配列番号１２０）；ＹＡＲＡＡＡＲＱＡＲＡ（配列番号１２１）；ＴＨＲＬＰＲＲＲＲＲＲ（配列番号１２２）；及びＧＧＲＲＡＲＲＲＲＲＲ（配列番号１２３）。いくつかの実施形態では、ＰＴＤは、活性化可能なＣＰＰ（ＡＣＰＰ）である（Ａｇｕｉｌｅｒａｅｔａｌ．（２００９）ＩｎｔｅｇｒＢｉｏｌ（Ｃａｍｂ）Ｊｕｎｅ；１（５−６）：３７１−３８１）。ＡＣＰＰには、対となるポリアニオン（例えば、Ｇｌｕ９すなわち「Ｅ９」）に切断可能なリンカーを介して接続されたポリカチオン性ＣＰＰ（例えば、ＡＲＧ９すなわち「Ｒ９」）が含まれ、これが実効電荷をほぼゼロに低下させ、それによって細胞への接着及び取り込みを阻害する。リンカーの切断時に、ポリアニオンが遊離して、ポリアルギニン及びそれに備わる接着性が局所的に露出され、それによってＡＣＰＰの膜透過が「活性化」する。

リンカー（例えば、融合パートナー用）
いくつかの実施形態では、本発明のＣａｓＹタンパク質は、リンカーポリペプチド（例えば、１つ以上のリンカーポリペプチド）を介して融合パートナーに融合することができる。リンカーポリペプチドは、種々のアミノ酸配列のいずれかを有し得る。タンパク質は、一般に柔軟な性質のスペーサーペプチドによって連結することができるが、他の化学的結合を排除するものではない。好適なリンカーには、４アミノ酸長〜４０アミノ酸長、または４アミノ酸長〜２５アミノ酸長のポリペプチドを含む。これらのリンカーは、タンパク質を結合するようなリンカーをコードする合成オリゴヌクレオチドを用いて作製することも、または融合タンパク質をコードする核酸配列によってコードすることもできる。ある程度の柔軟性をもつペプチドリンカーを使用することができる。連結ペプチドは、実質的にいずれのアミノ酸配列を有していてもよいが、好ましいリンカーは、一般に柔軟なペプチドが得られるような配列を有することに留意されたい。グリシン及びアラニンなどの小さいアミノ酸の使用は、柔軟なペプチドの作製に有益なものである。そのような配列の作製は当業者にとって日常的である。多種多様なリンカーが市販されており、使用に適していると考えられる。

リンカーポリペプチドの例として、グリシンポリマー（Ｇ）_n 、グリシン−セリンポリマー（例えば、（ＧＳ）_n 、ＧＳＧＧＳ_n （配列番号１２４）、ＧＧＳＧＧＳ_n （配列番号１２５）、及びＧＧＧＳ_n （配列番号１２６）を含む。ここで、ｎは少なくとも１つの整数である）、グリシン−アラニンポリマー、アラニン−セリンポリマーが挙げられる。例示的なリンカーには、ＧＧＳＧ（配列番号１２７）、ＧＧＳＧＧ（配列番号１２８）、ＧＳＧＳＧ（配列番号１２９）、ＧＳＧＧＧ（配列番号１３０）、ＧＧＧＳＧ（配列番号１３１）、ＧＳＳＳＧ（配列番号１３２）などを含むが、それに限定されないアミノ酸配列を含み得る。任意の望ましい要素と複合体化されたペプチドの設計は、柔軟なリンカーに加え、柔軟性の低い構造を与える１つ以上の部分をリンカーが含み得るように、全体的にまたは部分的に柔軟であるリンカーを含んでもよいことを当業者は理解しているであろう。

検出可能な標識
場合によって、本開示のＣａｓＹポリペプチドは、検出可能な標識を含む。検出可能なシグナルをもたらすことができる好適な検出可能な標識及び／または部分には、酵素、放射性同位体、特異的結合対のメンバー；フルオロフォア；蛍光タンパク質；量子ドットなどを含み得るが、これらに限定されない。

好適な蛍光タンパク質として、緑色蛍光タンパク質（ＧＦＰ）またはその変異体、ＧＦＰの青色蛍光変異体（ＢＦＰ）、ＧＦＰのシアン蛍光変異体（ＣＦＰ）、ＧＦＰの黄色蛍光変異体（ＹＦＰ）、改良型ＧＦＰ（ＥＧＦＰ）、改良型ＣＦＰ（ＥＣＦＰ）、改良型ＹＦＰ（ＥＹＦＰ）、ＧＦＰＳ６５Ｔ、Ｅｍｅｒａｌｄ、Ｔｏｐａｚ（ＴＹＦＰ）、Ｖｅｎｕｓ、Ｃｉｔｒｉｎｅ、ｍＣｉｔｒｉｎｅ、ＧＦＰｕｖ、不安定化ＥＧＦＰ（ｄＥＧＦＰ）、不安定化ＥＣＦＰ（ｄＥＣＦＰ）、不安定化ＥＹＦＰ（ｄＥＹＦＰ）、ｍＣＦＰｍ、Ｃｅｒｕｌｅａｎ、Ｔ−Ｓａｐｐｈｉｒｅ、ＣｙＰｅｔ、ＹＰｅｔ、ｍＫＯ、ＨｃＲｅｄ、ｔ−ＨｃＲｅｄ、ＤｓＲｅｄ、ＤｓＲｅｄ２、ＤｓＲｅｄモノマー、Ｊ−Ｒｅｄ、ｄｉｍｅｒ２、ｔ−ｄｉｍｅｒ２（１２）、ｍＲＦＰ１、ポシロポリン、ウミシイタケＧＦＰ、ＭｏｎｓｔｅｒＧＦＰ、ｐａＧＦＰ、カエデタンパク質及びキンドリングタンパク質、フィコビリタンパク質及びフィコビリタンパク質コンジュゲート、例えばＢ−フィコエリスリン、Ｒ−フィコエリスリン、及びアロフィコシアニンが挙げられるが、これらに限定されない。蛍光タンパク質のその他の例として、ｍＨｏｎｅｙｄｅｗ、ｍＢａｎａｎａ、ｍＯｒａｎｇｅ、ｄＴｏｍａｔｏ、ｔｄＴｏｍａｔｏ、ｍＴａｎｇｅｒｉｎｅ、ｍＳｔｒａｗｂｅｒｒｙ、ｍＣｈｅｒｒｙ、ｍＧｒａｐｅ１、ｍＲａｓｐｂｅｒｒｙ、ｍＧｒａｐｅ２、ｍＰｌｕｍ（Ｓｈａｎｅｒｅｔａｌ．（２００５）Ｎａｔ．Ｍｅｔｈｏｄｓ２：９０５−９０９）などが挙げられる。Ｍａｔｚｅｔａｌ．（１９９９）ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌ．１７：９６９−９７３に記載されるような花虫綱種由来の種々の蛍光タンパク質及び有色タンパク質はいずれも使用に適している。

好適な酵素として、西洋ワサビペルオキシダーゼ（ＨＲＰ）、アルカリホスファターゼ（ＡＰ）、ベータ−ガラクトシダーゼ（ＧＡＬ）、グルコース−６−リン酸デヒドロゲナーゼ、ベータ−Ｎ−アセチルグルコサミニダーゼ、β−グルクロニダーゼ、インベルターゼ、キサンチンオキシダーゼ、ホタルルシフェラーゼ、グルコースオキシダーゼ（ＧＯ）などが挙げられるが、これらに限定されない。

プロトスペーサー隣接モチーフ（ＰＡＭ）
ＣａｓＹタンパク質は、ＤＮＡを標的とするＲＮＡと標的ＤＮＡとの相補性領域によって規定される標的配列の位置で標的ＤＮＡに結合する。多くのＣＲＩＳＰＲエンドヌクレアーゼについていえることだが、二本鎖標的ＤＮＡの部位特異的結合（及び／または切断）は、（ｉ）ガイドＲＮＡと標的ＤＮＡとの間の塩基対相補性；かつ（ｉｉ）標的ＤＮＡの短鎖モチーフ［プロトスペーサー隣接モチーフ（ＰＡＭ）と呼ぶ］の両方によって決定される位置で発生する。

いくつかの実施形態では、ＣａｓＹタンパク質におけるＰＡＭは、標的ＤＮＡの非相補鎖の標的配列のすぐ５’側である（相補鎖はガイドＲＮＡのガイド配列にハイブリダイズするが、非相補鎖は、非相補鎖の逆相補鎖であるガイドＲＮＡとは直接ハイブリダイズしない）。いくつかの実施形態では（例えば、本明細書に記載のＣａｓＹ１が使用される場合）、非相補鎖のＰＡＭ配列は、５’−ＴＡ−３’である（場合によってはＸＴＡ、ここで、ＸはＣ、Ａ、またはＴである）。一例として、図５及び図７を参照のこと（ＰＡＭはＴＡ、またはＰＡＭがＸＴＡ（ここで、ＸはＣ、Ａ、またはＴ）であると考えられる場合はＣＴＡである）。いくつかの実施形態では（例えば、本明細書に記載のＣａｓＹ１が使用される場合）、非相補鎖のＰＡＭ配列は、５’−ＴＡ−３’である（場合によってはＨＴＡ、ここで、ＨはＣ、Ａ、またはＴである）。一例として、図５及び図７を参照のこと（ＰＡＭはＴＡ、またはＰＡＭがＨＴＡ（ここで、ＨはＣ、Ａ、またはＴ）であると考えられる場合はＣＴＡである）。場合によっては（例えば、本明細書に記載のＣａｓＹ２が使用される場合）、非相補鎖のＰＡＭ配列は、標的の５’隣接配列５’−ＹＲ−３’である（ここで、ＹはＴまたはＣであり、ＲはＡまたはＧである）。場合によっては（例えば、本明細書に記載のＣａｓＹ２が使用される場合）、非相補鎖のＰＡＭ配列は、５’−ＴＲ−３’（例えば、５’−ＤＴＲ−３’）である（ここで、ＲはＡまたはＧであり、ＤはＡ、Ｇ、またはＴである）。一例として、図５Ｄを参照のこと。

場合によって、種々の提供される方法で、異なるＣａｓＹタンパク質（すなわち、様々な種由来のＣａｓＹタンパク質）を使用し、それによって異なるＣａｓＹタンパク質の様々な酵素特性を利用すると有利な場合がある（例えば、異なるＰＡＭ配列選択性；酵素活性の増加または減少；細胞傷害性レベルの増加または減少；ＮＨＥＪ、相同組換え修復、一本鎖切断、二本鎖切断など同士の均衡変化；短鎖全配列の利用などのため）。異なる種由来のＣａｓＹタンパク質は、標的ＤＮＡに異なるＰＡＭ配列を必要とする場合がある。したがって、選択した特定のＣａｓＹタンパク質について、ＰＡＭ配列条件が、上記の５’−ＴＡ−３’（またはＸＴＡ、ＨＴＡ）配列と異なっていてもよい。適切なＰＡＭ配列を同定するための（ｉｎｓｉｌｉｃｏ及び／またはウェットラボ方法を含む）様々な方法が当技術分野において公知かつ日常的であり、任意の利便な方法を使用することができる。本明細書に記載のＴＡ（ＸＴＡ、ＨＴＡ）ＰＡＭ配列は、ＰＡＭ欠失アッセイを使用して同定された（例えば、下記の実施例の図５を参照）。

ＣａｓＹガイドＲＮＡ
ＣａｓＹタンパク質に結合してリボ核タンパク質複合体（ＲＮＰ）を形成し、標的核酸（例えば、標的ＤＮＡ）内の特定の場所に複合体を標的化する核酸分子を、本明細書で「ＣａｓＹガイドＲＮＡ」または単に「ガイドＲＮＡ」と称する。場合によって、ＣａｓＹガイドＲＮＡにＲＮＡ塩基に加えてＤＮＡ塩基を含むようなハイブリッドＤＮＡ／ＲＮＡを作製できるが、用語「ＣａｓＹガイドＲＮＡ」は、本明細書でそのような分子を包含する場合にも使用されると理解すべきである。

ＣａｓＹガイドＲＮＡは、標的化セグメント及びタンパク質結合セグメントという２つのセグメントを含むと言ってよい。ＣａｓＹガイドＲＮＡの標的化セグメントには、標的核酸（例えば、標的ｓｓＲＮＡ、標的ｓｓＤＮＡ、二本鎖標的ＤＮＡの相補鎖など）内の特定の配列（標的部位）に相補的な（それによってその配列とハイブリダイズされる）ヌクレオチド配列（ガイド配列）を含む。タンパク質結合セグメント（または「タンパク質結合配列」）は、ＣａｓＹポリペプチドと相互作用（結合）する。本発明のＣａｓＹガイドＲＮＡのタンパク質結合セグメントは、互いにハイブリダイズして二本鎖ＲＮＡ二重鎖（ｄｓＲＮＡ二重鎖）を形成する、ヌクレオチドの２つの相補ストレッチを含む。標的核酸（例えば、ゲノムＤＮＡ）の部位特異的結合及び／または切断は、ＣａｓＹガイドＲＮＡ（ＣａｓＹガイドＲＮＡのガイド配列）と標的核酸との間の塩基対相補性によって決定される位置（例えば、標的遺伝子座の標的配列）で発生し得る。

ＣａｓＹガイドＲＮＡとＣａｓＹタンパク質、例えば融合ＣａｓＹポリペプチドは、複合体を形成する（例えば、非共有結合性相互作用による結合）。ＣａｓＹガイドＲＮＡは、ガイド配列（標的核酸の配列に相補的であるヌクレオチド配列）を含む標的化セグメントを含むことによって、複合体に標的特異性を与える。複合体のＣａｓＹタンパク質は部位特異的活性（ＣａｓＹタンパク質によって得られる切断活性及び／またはキメラＣａｓＹタンパク質の場合には、融合パートナーによって得られる活性）を与える。換言すれば、ＣａｓＹタンパク質は、ＣａｓＹガイドＲＮＡとの会合によって、標的核酸配列（例えば、標的配列）に誘導される。

ＣａｓＹガイドＲＮＡの「標的化配列」とも称する「ガイド配列」は、（例えば、本明細書で記載されるように）ＰＡＭ配列が考慮される可能性があることを除いて、ＣａｓＹガイドＲＮＡが、ＣａｓＹタンパク質（例えば、天然ＣａｓＹタンパク質、融合ＣａｓＹポリペプチド（キメラＣａｓＹ）など）を、任意の所望する標的核酸の任意の所望する配列に標的化できるように変更することができる。したがって、例えば、ＣａｓＹガイドＲＮＡは、真核細胞の核酸、例えば、ウイルス核酸、真核生物の核酸など（例えば、真核生物の染色体、染色体配列、真核生物のＲＮＡなど）の配列に相補的である（例えば、ハイブリダイズすることができる）ガイド配列を有してもよい。

ＣａｓＹガイドＲＮＡのガイド配列
本発明のＣａｓＹガイドＲＮＡは、標的核酸の配列（標的部位）に相補的なヌクレオチド配列であるガイド配列（すなわち、標的化配列）を含む。換言すれば、ＣａｓＹガイドＲＮＡのガイド配列は、標的核酸（例えば、二本鎖ＤＮＡ（ｄｓＤＮＡ）、一本鎖ＤＮＡ（ｓｓＤＮＡ）、一本鎖ＲＮＡ（ｓｓＲＮＡ）、または二本鎖ＲＮＡ（ｄｓＲＮＡ））と、ハイブリダイゼーション（すなわち、塩基対形成）を介して配列特異的に相互作用することができる。ＣａｓＹガイドＲＮＡのガイド配列は、標的核酸（例えば、真核生物の標的核酸、ゲノムＤＮＡなど）内の任意の所望する標的配列にハイブリダイズするように（例えば、ｄｓＤＮＡ標的を標的とする場合には、ＰＡＭを考慮して）修飾（例えば、遺伝子工学によって）／設計することができる。

いくつかの実施形態では、ガイド配列と標的核酸の標的部位との相補性パーセントは６０％以上（例えば、６５％以上、７０％以上、７５％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％）である。場合によって、ガイド配列と標的核酸の標的部位との相補性パーセントは８０％以上（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％）である。場合によって、ガイド配列と標的核酸の標的部位との相補性パーセントは９０％以上（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％）である。場合によって、ガイド配列と標的核酸の標的部位との相補性パーセントは１００％である。

場合によって、ガイド配列と標的核酸の標的部位との相補性パーセントは、標的核酸の標的部位の７つの連続する最も３’側のヌクレオチドにわたって１００％である。

場合によって、ガイド配列と標的核酸の標的部位との相補性パーセントは、１７以上（例えば、１８以上、１９以上、２０以上、２１以上、２２以上）の連続するヌクレオチドにわたって６０％以上（例えば、７０％以上、７５％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％）である。場合によって、ガイド配列と標的核酸の標的部位との相補性パーセントは、１７以上（例えば、１８以上、１９以上、２０以上、２１以上、２２以上）の連続するヌクレオチドにわたって８０％以上（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％）である。場合によって、ガイド配列と標的核酸の標的部位との相補性パーセントは、１７以上（例えば、１８以上、１９以上、２０以上、２１以上、２２以上）の連続するヌクレオチドにわたって９０％以上（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％）である。場合によって、ガイド配列と標的核酸の標的部位との相補性パーセントは、１７以上（例えば、１８以上、１９以上、２０以上、２１以上、２２以上）の連続するヌクレオチドにわたって１００％である。

場合によって、ガイド配列と標的核酸の標的部位との相補性パーセントは、１９以上（例えば、２０以上、２１以上、２２以上）の連続するヌクレオチドにわたって６０％以上（例えば、７０％以上、７５％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％）である。場合によって、ガイド配列と標的核酸の標的部位との相補性パーセントは、１９以上（例えば、２０以上、２１以上、２２以上）の連続するヌクレオチドにわたって８０％以上（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％）である。場合によって、ガイド配列と標的核酸の標的部位との相補性パーセントは、１９以上（例えば、２０以上、２１以上、２２以上）の連続するヌクレオチドにわたって９０％以上（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％）である。場合によって、ガイド配列と標的核酸の標的部位との相補性パーセントは、１９以上（例えば、２０以上、２１以上、２２以上）の連続するヌクレオチドにわたって１００％である。

場合によって、ガイド配列と標的核酸の標的部位との相補性パーセントは、１７〜２５の連続するヌクレオチドにわたって６０％以上（例えば、７０％以上、７５％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％）である。場合によって、ガイド配列と標的核酸の標的部位との相補性パーセントは、１７〜２５の連続するヌクレオチドにわたって８０％以上（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％）である。場合によって、ガイド配列と標的核酸の標的部位との相補性パーセントは、１７〜２５の連続するヌクレオチドにわたって９０％以上（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％）である。場合によって、ガイド配列と標的核酸の標的部位との相補性パーセントは、１７〜２５の連続するヌクレオチドにわたって１００％である。

場合によって、ガイド配列と標的核酸の標的部位との相補性パーセントは、１９〜２５の連続するヌクレオチドにわたって６０％以上（例えば、７０％以上、７５％以上、８０％以上、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％）である。場合によって、ガイド配列と標的核酸の標的部位との相補性パーセントは、１９〜２５の連続するヌクレオチドにわたって８０％以上（例えば、８５％以上、９０％以上、９５％以上、９７％以上、９８％以上、９９％以上、または１００％）である。場合によって、ガイド配列と標的核酸の標的部位との相補性パーセントは、１９〜２５の連続するヌクレオチドにわたって９０％以上（例えば、９５％以上、９７％以上、９８％以上、９９％以上、または１００％）である。場合によって、ガイド配列と標的核酸の標的部位との相補性パーセントは、１９〜２５の連続するヌクレオチドにわたって１００％である。

場合によって、ガイド配列は１７〜３０ヌクレオチド（ｎｔ）（例えば、１７〜２５、１７〜２２、１７〜２０、１９〜３０、１９〜２５、１９〜２２、１９〜２０、２０〜３０、２０〜２５、または２０〜２２ｎｔ）の範囲の長さを有する。場合によって、ガイド配列は１７〜２５ヌクレオチド（ｎｔ）（例えば、１７〜２２、１７〜２０、１９〜２５、１９〜２２、１９〜２０、２０〜２５、または２０〜２２ｎｔ）の範囲の長さを有する。場合によって、ガイド配列は、１７ｎｔ以上（例えば、１８ｎｔ以上、１９ｎｔ以上、２０ｎｔ以上、２１ｎｔ以上、または２２ｎｔ以上；１９ｎｔ、２０ｎｔ、２１ｎｔ、２２ｎｔ、２３ｎｔ、２４ｎｔ、２５ｎｔなど）の長さを有する。場合によって、ガイド配列は、１９ｎｔ以上（例えば、２０ｎｔ以上、２１ｎｔ以上、または２２ｎｔ以上；１９ｎｔ、２０ｎｔ、２１ｎｔ、２２ｎｔ、２３ｎｔ、２４ｎｔ、２５ｎｔなど）の長さを有する。場合によって、ガイド配列は１７ｎｔの長さを有する。場合によって、ガイド配列は１８ｎｔの長さを有する。場合によって、ガイド配列は１９ｎｔの長さを有する。場合によって、ガイド配列は２０ｎｔの長さを有する。場合によって、ガイド配列は２１ｎｔの長さを有する。場合によって、ガイド配列は２２ｎｔの長さを有する。場合によって、ガイド配列は２３ｎｔの長さを有する。

ＣａｓＹガイドＲＮＡのタンパク質結合セグメント
本発明のＣａｓＹガイドＲＮＡのタンパク質結合セグメントはＣａｓＹタンパク質と相互作用する。ＣａｓＹガイドＲＮＡは結合したＣａｓＹタンパク質を、上述したガイド配列を介して標的核酸内の特異的ヌクレオチド配列に誘導する。ＣａｓＹガイドＲＮＡのタンパク質結合セグメントには、互いに相補的であり、ハイブリダイズして二本鎖ＲＮＡ二重鎖（ｄｓＲＮＡ二重鎖）を形成する、ヌクレオチドの２つのストレッチを含む。したがって、タンパク質結合セグメントは、ｄｓＲＮＡ二重鎖を含む。

場合によって、ｄｓＲＮＡ二重鎖領域は、５〜２５塩基対（ｂｐ）（例えば、５〜２２、５〜２０、５〜１８、５〜１５、５〜１２、５〜１０、５〜８、８〜２５、８〜２２、８〜１８、８〜１５、８〜１２、１２〜２５、１２〜２２、１２〜１８、１２〜１５、１３〜２５、１３〜２２、１３〜１８、１３〜１５、１４〜２５、１４〜２２、１４〜１８、１４〜１５、１５〜２５、１５〜２２、１５〜１８、１７〜２５、１７〜２２、または１７〜１８ｂｐ、例えば、５ｂｐ、６ｂｐ、７ｂｐ、８ｂｐ、９ｂｐ、１０ｂｐなど）の範囲を含む。場合によって、ｄｓＲＮＡ二重鎖領域は、６〜１５塩基対（ｂｐ）（例えば、６〜１２、６〜１０、または６〜８ｂｐ、例えば、６ｂｐ、７ｂｐ、８ｂｐ、９ｂｐ、１０ｂｐなど）の範囲を含む。場合によって、二重鎖領域は５ｂｐ以上（例えば、６ｂｐ以上、７ｂｐ以上、または８ｂｐ以上）を含む。場合によって、二重鎖領域は６ｂｐ以上（例えば、７ｂｐ以上または８ｂｐ以上）を含む。場合によって、二重鎖領域のヌクレオチドすべてが対を形成するとは限らないため、二重鎖形成領域はバルジを含むことがある。本明細書の用語「バルジ」は、二本鎖二重鎖に関与しないが、関与するヌクレオチドによって５’及び３’が取り囲まれているヌクレオチドのストレッチ（ヌクレオチドは１つの可能性がある）を意味する際に使用され、そのようなバルジは二重鎖領域の一部とみなされる。場合によって、ｄｓＲＮＡは１つ以上のバルジ（例えば、２つ以上、３つ以上、４つ以上のバルジ）を含む。場合によって、ｄｓＲＮＡ二重鎖は２つ以上のバルジ（例えば、３つ以上、４つ以上のバルジ）を含む。場合によって、ｄｓＲＮＡ二重鎖は、１〜５個のバルジ（例えば、１〜４、１〜３、２〜５、２〜４、または２〜３個のバルジ）を含む。

したがって、場合によって、互いにハイブリダイズしてｄｓＲＮＡ二重鎖を形成するヌクレオチドのストレッチは、互いに７０％〜１００％の相補性（例えば、７５％〜１００％、８０％〜１０％、８５％〜１００％、９０％〜１００％、９５％〜１００％の相補性）を有する。場合によって、互いにハイブリダイズしてｄｓＲＮＡ二重鎖を形成するヌクレオチドのストレッチは、互いに７０％〜１００％の相補性（例えば、７５％〜１００％、８０％〜１０％、８５％〜１００％、９０％〜１００％、９５％〜１００％の相補性）を有する。場合によって、互いにハイブリダイズしてｄｓＲＮＡ二重鎖を形成するヌクレオチドのストレッチは、互いに８５％〜１００％の相補性（例えば、９０％〜１００％、９５％〜１００％の相補性）を有する。場合によって、互いにハイブリダイズしてｄｓＲＮＡ二重鎖を形成するヌクレオチドのストレッチは、互いに７０％〜９５％の相補性（例えば、７５％〜９５％、８０％〜９５％、８５％〜９５％、９０％〜９５％の相補性）を有する。

換言すれば、いくつかの実施形態では、ｄｓＲＮＡ二重鎖は、互いに７０％〜１００％の相補性（例えば、７５％〜１００％、８０％〜１０％、８５％〜１００％、９０％〜１００％、９５％〜１００％の相補性）を有するヌクレオチドの２つのストレッチを含む。場合によって、ｄｓＲＮＡ二重鎖は、互いに８５％〜１００％の相補性（例えば、９０％〜１００％、９５％〜１００％の相補性）を有するヌクレオチドの２つのストレッチを含む。場合によって、ｄｓＲＮＡ二重鎖は、互いに７０％〜９５％の相補性（例えば、７５％〜９５％、８０％〜９５％、８５％〜９５％、９０％〜９５％の相補性）を有するヌクレオチドの２つのストレッチを含む。

本発明のＣａｓＹガイドＲＮＡの二重鎖領域は、天然の二重鎖領域と比較して１つ以上（１つ、２つ、３つ、４つ、５つなど）の変異を含み得る。例えば、場合によって、各セグメントからの塩基対に関与するヌクレオチドが異なっていても、塩基対を維持することができる。場合によって、本発明のＣａｓＹガイドＲＮＡの二重鎖領域は、（天然のＣａｓＹガイドＲＮＡの）天然の二重鎖領域と比較して、それよりも多くの塩基対、少ない塩基対、小さいバルジ、大きいバルジ、少ないバルジ、多くのバルジ、またはそれらの任意の好都合な組み合わせを含む。

様々なＣａｓ９ガイドＲＮＡの例を当技術分野において見出すことができ、場合によって、Ｃａｓ９ガイドＲＮＡに導入されたものと類似する変形例も本開示のＣａｓＹガイドに導入することができる（例えば、ｄｓＲＮＡ二重鎖領域に対する変異、安定性を付加して別のタンパク質との相互作用をもたらすための５’末端または３’末端の伸長など）。例えば、Ｊｉｎｅｋｅｔａｌ．，Ｓｃｉｅｎｃｅ．２０１２Ａｕｇ１７；３３７（６０９６）：８１６−２１；Ｃｈｙｌｉｎｓｋｉｅｔａｌ．，ＲＮＡＢｉｏｌ．２０１３Ｍａｙ；１０（５）：７２６−３７；Ｍａｅｔａｌ．，ＢｉｏｍｅｄＲｅｓＩｎｔ．２０１３；２０１３：２７０８０５；Ｈｏｕｅｔａｌ．，ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２０１３Ｓｅｐ２４；１１０（３９）：１５６４４−９；Ｊｉｎｅｋｅｔａｌ．，Ｅｌｉｆｅ．２０１３；２：ｅ００４７１；Ｐａｔｔａｎａｙａｋｅｔａｌ．，ＮａｔＢｉｏｔｅｃｈｎｏｌ．２０１３Ｓｅｐ；３１（９）：８３９−４３；Ｑｉｅｔａｌ，Ｃｅｌｌ．２０１３Ｆｅｂ２８；１５２（５）：１１７３−８３；Ｗａｎｇｅｔａｌ．，Ｃｅｌｌ．２０１３Ｍａｙ９；１５３（４）：９１０−８；Ａｕｅｒｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．２０１３Ｏｃｔ３１；Ｃｈｅｎｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２０１３Ｎｏｖ１；４１（２０）：ｅ１９；Ｃｈｅｎｇｅｔａｌ．，ＣｅｌｌＲｅｓ．２０１３Ｏｃｔ；２３（１０）：１１６３−７１；Ｃｈｏｅｔａｌ．，Ｇｅｎｅｔｉｃｓ．２０１３Ｎｏｖ；１９５（３）：１１７７−８０；ＤｉＣａｒｌｏｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２０１３Ａｐｒ；４１（７）：４３３６−４３；Ｄｉｃｋｉｎｓｏｎｅｔａｌ．，ＮａｔＭｅｔｈｏｄｓ．２０１３Ｏｃｔ；１０（１０）：１０２８−３４；Ｅｂｉｎａｅｔａｌ．，ＳｃｉＲｅｐ．２０１３；３：２５１０；Ｆｕｊｉｉｅｔ．ａｌ，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２０１３Ｎｏｖ１；４１（２０）：ｅ１８７；Ｈｕｅｔａｌ．，ＣｅｌｌＲｅｓ．２０１３Ｎｏｖ；２３（１１）：１３２２−５；Ｊｉａｎｇｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２０１３Ｎｏｖ１；４１（２０）：ｅ１８８；Ｌａｒｓｏｎｅｔａｌ．，ＮａｔＰｒｏｔｏｃ．２０１３Ｎｏｖ；８（１１）：２１８０−９６；Ｍａｌｉｅｔ．ａｔ．，ＮａｔＭｅｔｈｏｄｓ．２０１３Ｏｃｔ；１０（１０）：９５７−６３；Ｎａｋａｙａｍａｅｔａｌ．，Ｇｅｎｅｓｉｓ．２０１３Ｄｅｃ；５１（１２）：８３５−４３；Ｒａｎｅｔａｌ．，ＮａｔＰｒｏｔｏｃ．２０１３Ｎｏｖ；８（１１）：２２８１−３０８；Ｒａｎｅｔａｌ．，Ｃｅｌｌ．２０１３Ｓｅｐ１２；１５４（６）：１３８０−９；Ｕｐａｄｈｙａｙｅｔａｌ．，Ｇ３（Ｂｅｔｈｅｓｄａ）．２０１３Ｄｅｃ９；３（１２）：２２３３−８；Ｗａｌｓｈｅｔａｌ．，ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２０１３Ｓｅｐ２４；１１０（３９）：１５５１４−５；Ｘｉｅｅｔａｌ．，ＭｏｌＰｌａｎｔ．２０１３Ｏｃｔ９；Ｙａｎｇｅｔａｌ．，Ｃｅｌｌ．２０１３Ｓｅｐ１２；１５４（６）：１３７０−９；Ｂｒｉｎｅｒｅｔａｌ．，ＭｏｌＣｅｌｌ．２０１４Ｏｃｔ２３；５６（２）：３３３−９；ならびに米国特許及び出願：第８，９０６，６１６号；第８，８９５，３０８号；第８，８８９，４１８号；第８，８８９，３５６号；第８，８７１，４４５号；第８，８６５，４０６号；第８，７９５，９６５号；第８，７７１，９４５号；第８，６９７，３５９号；第２０１４００６８７９７号；第２０１４０１７０７５３号；第２０１４０１７９００６号；第２０１４０１７９７７０号；第２０１４０１８６８４３号；第２０１４０１８６９１９号；第２０１４０１８６９５８号；第２０１４０１８９８９６号；第２０１４０２２７７８７号；第２０１４０２３４９７２号；第２０１４０２４２６６４号；第２０１４０２４２６９９号；第２０１４０２４２７００号；第２０１４０２４２７０２号；第２０１４０２４８７０２号；第２０１４０２５６０４６号；第２０１４０２７３０３７号；第２０１４０２７３２２６号；第２０１４０２７３２３０号；第２０１４０２７３２３１号；第２０１４０２７３２３２号；第２０１４０２７３２３３号；第２０１４０２７３２３４号；第２０１４０２７３２３５号；第２０１４０２８７９３８号；第２０１４０２９５５５６号；第２０１４０２９５５５７号；第２０１４０２９８５４７号；第２０１４０３０４８５３号；第２０１４０３０９４８７号；第２０１４０３１０８２８号；第２０１４０３１０８３０号；第２０１４０３１５９８５号；第２０１４０３３５０６３号；第２０１４０３３５６２０号；第２０１４０３４２４５６号；第２０１４０３４２４５７号；第２０１４０３４２４５８号；第２０１４０３４９４００号；第２０１４０３４９４０５号；第２０１４０３５６８６７号；第２０１４０３５６９５６号；第２０１４０３５６９５８号；第２０１４０３５６９５９号；第２０１４０３５７５２３号；第２０１４０３５７５３０号；第２０１４０３６４３３３号；及び第２０１４０３７７８６８号を参照のこと（すべての文献はその全体が参照により本明細書に組み込まれる）。

ＣａｓＹガイドＲＮＡは、ガイド配列、及びハイブリダイズしてタンパク質結合セグメントのｄｓＲＮＡ二重鎖を形成するヌクレオチドの２つのストレッチ（「二重鎖形成セグメント」）の両方を含む。所与のＣａｓＹガイドＲＮＡの特定の配列は、ｃｒＲＮＡが存在する種の特徴であり得る。好適なＣａｓＹガイドＲＮＡの例は、本明細書に記載されている。

例示的なガイドＲＮＡ配列
図６（パネルＡ及びＢ）に示されているリピート配列（例示的なＣａｓＹガイドＲＮＡの非ガイド配列部分）は、ＣａｓＹ１〜Ｙ５では天然遺伝子座由来である。場合によって、本発明のＣａｓＹガイドＲＮＡは、（例えばガイド配列に加えて）ｃｒＲＮＡ配列ＣＴＣＣＧＡＡＡＧＴＡＴＣＧＧＧＧＡＴＡＡＡＧＧＣ（配列番号３１）［ＲＮＡは、ＣＵＣＣＧＡＡＡＧＵＡＵＣＧＧＧＧＡＵＡＡＡＧＧＣ（配列番号１１）である］を含む（例えば、図６を参照）。場合によって、本発明のＣａｓＹガイドＲＮＡは、ｃｒＲＮＡ配列ＣＴＣＣＧＡＡＡＧＴＡＴＣＧＧＧＧＡＴＡＡＡＧＧＣ（配列番号３１）［ＲＮＡは、ＣＵＣＣＧＡＡＡＧＵＡＵＣＧＧＧＧＡＵＡＡＡＧＧＣ（配列番号１１）である］と８０％以上の同一性（例えば、８５％以上、９０％以上、９３％以上、９５％以上、９７％以上、９８％以上、または１００％の同一性）を有するヌクレオチド配列を含む。場合によって、本発明のＣａｓＹガイドＲＮＡは、ｃｒＲＮＡ配列ＣＴＣＣＧＡＡＡＧＴＡＴＣＧＧＧＧＡＴＡＡＡＧＧＣ（配列番号３１）［ＲＮＡは、ＣＵＣＣＧＡＡＡＧＵＡＵＣＧＧＧＧＡＵＡＡＡＧＧＣ（配列番号１１）である］と９０％以上の同一性（例えば、９３％以上、９５％以上、９７％以上、９８％以上、または１００％の同一性）を有するヌクレオチド配列を含む。

場合によって、本発明のＣａｓＹガイドＲＮＡは、（例えばガイド配列に加えて）ｃｒＲＮＡ配列ＣＡＣＣＧＡＡＡＴＴＴＧＧＡＧＡＧＧＡＴＡＡＧＧＣ（配列番号３２）［ＲＮＡは、ＣＡＣＣＧＡＡＡＵＵＵＧＧＡＧＡＧＧＡＵＡＡＧＧＣ（配列番号１２）である］を含む（例えば、図６を参照）。場合によって、本発明のＣａｓＹガイドＲＮＡは、ｃｒＲＮＡ配列ＣＡＣＣＧＡＡＡＴＴＴＧＧＡＧＡＧＧＡＴＡＡＧＧＣ（配列番号３２）［ＲＮＡは、ＣＡＣＣＧＡＡＡＵＵＵＧＧＡＧＡＧＧＡＵＡＡＧＧＣ（配列番号１２）である］と８０％以上の同一性（例えば、８５％以上、９０％以上、９３％以上、９５％以上、９７％以上、９８％以上、または１００％の同一性）を有するヌクレオチド配列を含む。場合によって、本発明のＣａｓＹガイドＲＮＡは、ｃｒＲＮＡ配列ＣＡＣＣＧＡＡＡＴＴＴＧＧＡＧＡＧＧＡＴＡＡＧＧＣ（配列番号３２）［ＲＮＡは、ＣＡＣＣＧＡＡＡＵＵＵＧＧＡＧＡＧＧＡＵＡＡＧＧＣ（配列番号１２）である］と９０％以上の同一性（例えば、９３％以上、９５％以上、９７％以上、９８％以上、または１００％の同一性）を有するヌクレオチド配列を含む。

場合によって、本発明のＣａｓＹガイドＲＮＡは、（例えばガイド配列に加えて）ｃｒＲＮＡ配列ＣＴＣＣＧＡＡＴＴＡＴＣＧＧＧＡＧＧＡＴＡＡＧＧＣ（配列番号３３）［ＲＮＡは、ＣＵＣＣＧＡＡＵＵＡＵＣＧＧＧＡＧＧＡＵＡＡＧＧＣ（配列番号１３）である］を含む（例えば、図６を参照）。場合によって、本発明のＣａｓＹガイドＲＮＡは、ｃｒＲＮＡ配列ＣＴＣＣＧＡＡＴＴＡＴＣＧＧＧＡＧＧＡＴＡＡＧＧＣ（配列番号３３）［ＲＮＡは、ＣＵＣＣＧＡＡＵＵＡＵＣＧＧＧＡＧＧＡＵＡＡＧＧＣ（配列番号１３）である］と８０％以上の同一性（例えば、８５％以上、９０％以上、９３％以上、９５％以上、９７％以上、９８％以上、または１００％の同一性）を有するヌクレオチド配列を含む。場合によって、本発明のＣａｓＹガイドＲＮＡは、ｃｒＲＮＡ配列ＣＴＣＣＧＡＡＴＴＡＴＣＧＧＧＡＧＧＡＴＡＡＧＧＣ（配列番号３３）［ＲＮＡは、ＣＵＣＣＧＡＡＵＵＡＵＣＧＧＧＡＧＧＡＵＡＡＧＧＣ（配列番号１３）である］と９０％以上の同一性（例えば、９３％以上、９５％以上、９７％以上、９８％以上、または１００％の同一性）を有するヌクレオチド配列を含む。

場合によって、本発明のＣａｓＹガイドＲＮＡは、（例えばガイド配列に加えて）ｃｒＲＮＡ配列ＣＣＣＣＧＡＡＴＡＴＡＧＧＧＧＡＣＡＡＡＡＡＧＧＣ（配列番号３４）［ＲＮＡは、ＣＣＣＣＧＡＡＵＡＵＡＧＧＧＧＡＣＡＡＡＡＡＧＧＣ（配列番号１４）である］を含む（例えば、図６を参照）。場合によって、本発明のＣａｓＹガイドＲＮＡは、ｃｒＲＮＡ配列ＣＣＣＣＧＡＡＴＡＴＡＧＧＧＧＡＣＡＡＡＡＡＧＧＣ（配列番号３４）［ＲＮＡは、ＣＣＣＣＧＡＡＵＡＵＡＧＧＧＧＡＣＡＡＡＡＡＧＧＣ（配列番号１４）である］と８０％以上の同一性（例えば、８５％以上、９０％以上、９３％以上、９５％以上、９７％以上、９８％以上、または１００％の同一性）を有するヌクレオチド配列を含む。場合によって、本発明のＣａｓＹガイドＲＮＡは、ｃｒＲＮＡ配列ＣＣＣＣＧＡＡＴＡＴＡＧＧＧＧＡＣＡＡＡＡＡＧＧＣ（配列番号３４）［ＲＮＡは、ＣＣＣＣＧＡＡＵＡＵＡＧＧＧＧＡＣＡＡＡＡＡＧＧＣ（配列番号１４）である］と９０％以上の同一性（例えば、９３％以上、９５％以上、９７％以上、９８％以上、または１００％の同一性）を有するヌクレオチド配列を含む。

場合によって、本発明のＣａｓＹガイドＲＮＡは、（例えばガイド配列に加えて）ｃｒＲＮＡ配列ＧＴＣＴＡＧＡＣＡＴＡＣＡＧＧＴＧＧＡＡＡＧＧＴＧＡＧＡＧＴＡＡＡＧＡＣ（配列番号３５）［ＲＮＡは、ＧＵＣＵＡＧＡＣＡＵＡＣＡＧＧＵＧＧＡＡＡＧＧＵＧＡＧＡＧＵＡＡＡＧＡＣ（配列番号１５）である］を含む（例えば、図６を参照）。場合によって、本発明のＣａｓＹガイドＲＮＡは、ｃｒＲＮＡ配列ＧＴＣＴＡＧＡＣＡＴＡＣＡＧＧＴＧＧＡＡＡＧＧＴＧＡＧＡＧＴＡＡＡＧＡＣ（配列番号３５）［ＲＮＡは、ＧＵＣＵＡＧＡＣＡＵＡＣＡＧＧＵＧＧＡＡＡＧＧＵＧＡＧＡＧＵＡＡＡＧＡＣ（配列番号１５）である］と８０％以上の同一性（例えば、８５％以上、９０％以上、９３％以上、９５％以上、９７％以上、９８％以上、または１００％の同一性）を有するヌクレオチド配列を含む。場合によって、本発明のＣａｓＹガイドＲＮＡは、ｃｒＲＮＡ配列ＧＴＣＴＡＧＡＣＡＴＡＣＡＧＧＴＧＧＡＡＡＧＧＴＧＡＧＡＧＴＡＡＡＧＡＣ（配列番号３５）［ＲＮＡは、ＧＵＣＵＡＧＡＣＡＵＡＣＡＧＧＵＧＧＡＡＡＧＧＵＧＡＧＡＧＵＡＡＡＧＡＣ（配列番号１５）である］と９０％以上の同一性（例えば、９３％以上、９５％以上、９７％以上、９８％以上、または１００％の同一性）を有するヌクレオチド配列を含む。

場合によって、本発明のＣａｓＹガイドＲＮＡは、（例えばガイド配列に加えて）配列番号１１〜１５のいずれか１つに記載されるｃｒＲＮＡ配列を含む。場合によって、本発明のＣａｓＹガイドＲＮＡは、配列番号１１〜１５のいずれか１つに記載されるｃｒＲＮＡ配列と８０％以上の同一性（例えば、８５％以上、９０％以上、９３％以上、９５％以上、９７％以上、９８％以上、または１００％の同一性）を有するヌクレオチド配列を含む。場合によって、本発明のＣａｓＹガイドＲＮＡは、配列番号１１〜１５のいずれか１つに記載されるｃｒＲＮＡ配列と９０％以上の同一性（例えば、９３％以上、９５％以上、９７％以上、９８％以上、または１００％の同一性）を有するヌクレオチド配列を含む。

場合によって、本発明のＣａｓＹガイドＲＮＡは、（例えばガイド配列に加えて）配列番号１１〜１４のいずれか１つに記載されるｃｒＲＮＡ配列を含む。場合によって、本発明のＣａｓＹガイドＲＮＡは、配列番号１１〜１４のいずれか１つに記載されるｃｒＲＮＡ配列と８０％以上の同一性（例えば、８５％以上、９０％以上、９３％以上、９５％以上、９７％以上、９８％以上、または１００％の同一性）を有するヌクレオチド配列を含む。場合によって、本発明のＣａｓＹガイドＲＮＡは、配列番号１１〜１４のいずれか１つに記載されるｃｒＲＮＡ配列と９０％以上の同一性（例えば、９３％以上、９５％以上、９７％以上、９８％以上、または１００％の同一性）を有するヌクレオチド配列を含む。

ＣａｓＹ１８の天然遺伝子座由来のリピート配列（例示的なＣａｓＹガイドＲＮＡの非ガイド配列部分）は、ＣＴＣＣＧＴＧＡＡＴＡＣＧＴＧＧＧＧＴＡＡＡＧＧＣ（配列番号３６）である［ＲＮＡは、ＣＵＣＣＧＵＧＡＡＵＡＣＧＵＧＧＧＧＵＡＡＡＧＧＣ（配列番号１６）である］。場合によって、本発明のＣａｓＹガイドＲＮＡは、（例えばガイド配列に加えて）ｃｒＲＮＡ配列ＣＴＣＣＧＴＧＡＡＴＡＣＧＴＧＧＧＧＴＡＡＡＧＧＣ（配列番号３６）［ＲＮＡは、ＣＵＣＣＧＵＧＡＡＵＡＣＧＵＧＧＧＧＵＡＡＡＧＧＣ（配列番号１６）である］を含む。場合によって、本発明のＣａｓＹガイドＲＮＡは、ｃｒＲＮＡ配列ＣＴＣＣＧＴＧＡＡＴＡＣＧＴＧＧＧＧＴＡＡＡＧＧＣ（配列番号３６）［ＲＮＡは、ＣＵＣＣＧＵＧＡＡＵＡＣＧＵＧＧＧＧＵＡＡＡＧＧＣ（配列番号１６）である］と８０％以上の同一性（例えば、８５％以上、９０％以上、９３％以上、９５％以上、９７％以上、９８％以上、または１００％の同一性）を有するヌクレオチド配列を含む。場合によって、本発明のＣａｓＹガイドＲＮＡは、ｃｒＲＮＡ配列ＣＴＣＣＧＴＧＡＡＴＡＣＧＴＧＧＧＧＴＡＡＡＧＧＣ（配列番号３６）［ＲＮＡは、ＣＵＣＣＧＵＧＡＡＵＡＣＧＵＧＧＧＧＵＡＡＡＧＧＣ（配列番号１６）である］と９０％以上の同一性（例えば、９３％以上、９５％以上、９７％以上、９８％以上、または１００％の同一性）を有するヌクレオチド配列を含む。

場合によって、本発明のＣａｓＹガイドＲＮＡは、（例えばガイド配列に加えて）配列番号１１〜１６のいずれか１つに記載されるｃｒＲＮＡ配列を含む。場合によって、本発明のＣａｓＹガイドＲＮＡは、（例えばガイド配列に加えて）配列番号１１〜１６のいずれか１つに記載されるｃｒＲＮＡ配列と８０％以上の同一性（例えば、８５％以上、９０％以上、９３％以上、９５％以上、９７％以上、９８％以上、または１００％の同一性）を有するヌクレオチド配列を含む。場合によって、本発明のＣａｓＹガイドＲＮＡは、配列番号１１〜１６のいずれか１つに記載されるｃｒＲＮＡ配列と９０％以上の同一性（例えば、９３％以上、９５％以上、９７％以上、９８％以上、または１００％の同一性）を有するヌクレオチド配列を含む。

ＣａｓＹシステム
本開示は、ＣａｓＹシステムを提供する。本開示のＣａｓＹシステムは以下を含み得る：ａ）本開示のＣａｓＹポリペプチド及びＣａｓＹガイドＲＮＡ；ｂ）本開示のＣａｓＹポリペプチド、ＣａｓＹガイドＲＮＡ、及びドナー鋳型核酸；ｃ）本開示のＣａｓＹ融合ポリペプチド及びＣａｓＹガイドＲＮＡ；ｄ）本開示のＣａｓＹ融合ポリペプチド、ＣａｓＹガイドＲＮＡ、及びドナー鋳型核酸；ｅ）本開示のＣａｓＹポリペプチドをコードするｍＲＮＡ及びＣａｓＹガイドＲＮＡ；ｆ）本開示のＣａｓＹポリペプチドをコードするｍＲＮＡ、ＣａｓＹガイドＲＮＡ、及びドナー鋳型核酸；ｇ）本開示のＣａｓＹ融合ポリペプチドをコードするｍＲＮＡ及びＣａｓＹガイドＲＮＡ；ｈ）本開示のＣａｓＹ融合ポリペプチドをコードするｍＲＮＡ、ＣａｓＹガイドＲＮＡ、及びドナー鋳型核酸；ｉ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列及びＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む組換え発現ベクター；ｊ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列、ＣａｓＹガイドＲＮＡをコードするヌクレオチド配列、及びドナー鋳型核酸をコードするヌクレオチド配列を含む組換え発現ベクター；ｋ）本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列及びＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む組換え発現ベクター；ｌ）本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列、ＣａｓＹガイドＲＮＡをコードするヌクレオチド配列、及びドナー鋳型核酸をコードするヌクレオチド配列を含む組換え発現ベクター；ｍ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列を含む第１の組換え発現ベクター、及びＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む第２の組換え発現ベクター；ｎ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列を含む第１の組換え発現ベクター、ならびにＣａｓＹガイドＲＮＡをコードするヌクレオチド配列及びドナー鋳型核酸を含む第２の組換え発現ベクター；ｏ）本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列を含む第１の組換え発現ベクター、及びＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む第２の組換え発現ベクター；ｐ）本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列を含む第１の組換え発現ベクター、ならびにＣａｓＹガイドＲＮＡをコードするヌクレオチド配列及びドナー鋳型核酸を含む第２の組換え発現ベクター；ｑ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列、第１のＣａｓＹガイドＲＮＡをコードするヌクレオチド配列、及び第２のＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む組換え発現ベクター；もしくはｒ）本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列、第１のＣａｓＹガイドＲＮＡをコードするヌクレオチド配列、及び第２のＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む組換え発現ベクター；または（ａ）〜（ｒ）のいずれか１つの何らかの変形例。

核酸
本開示は、ドナーポリヌクレオチド配列、ＣａｓＹポリペプチド（例えば、野生型ＣａｓＹタンパク質、ニッカーゼＣａｓＹタンパク質、ｄＣａｓＹタンパク質、キメラＣａｓＹタンパク質など）をコードするヌクレオチド配列、ＣａｓＹガイドＲＮＡ、及びＣａｓＹガイドＲＮＡをコードするヌクレオチド配列のうち１つ以上を含む１つ以上の核酸を提供する。本開示は、ＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列を含む核酸を提供する。本開示は、ＣａｓＹポリペプチドをコードするヌクレオチド配列を含む組換え発現ベクターを提供する。本開示は、ＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列を含む組換え発現ベクターを提供する。本開示は、ａ）ＣａｓＹポリペプチドをコードするヌクレオチド配列；及びｂ）ＣａｓＹガイドＲＮＡ（複数可）をコードするヌクレオチド配列を含む組換え発現ベクターを提供する。本開示は、ａ）ＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列；及びｂ）ＣａｓＹガイドＲＮＡ（複数可）をコードするヌクレオチド配列を含む組換え発現ベクターを提供する。場合によって、ＣａｓＹタンパク質をコードするヌクレオチド配列及び／またはＣａｓＹガイドＲＮＡをコードするヌクレオチド配列は、選択した細胞型（例えば、原核細胞、真核細胞、植物細胞、動物細胞、哺乳動物細胞、霊長類細胞、齧歯類細胞、ヒト細胞など）において機能できるプロモーターに機能的に連結される。

場合によって、本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列は、コドン最適化されている。この種類の最適化は、同じタンパク質をコードしながら、意図する宿主生物または細胞のコドン選択性を模倣する、ＣａｓＹをコードするヌクレオチド配列の変異を引き起こすことができる。したがって、コドンを変更することはできるが、コードされたタンパク質は変更されないままである。例えば、意図する標的細胞がヒト細胞であった場合、ヒトコドンに最適化された、ＣａｓＹをコードするヌクレオチド配列を使用することができる。別の非限定的な例として、意図する宿主細胞がマウス細胞であった場合、マウスコドンに最適化された、ＣａｓＹをコードするヌクレオチド配列を生成することができる。別の非限定的な例として、意図する宿主細胞が植物細胞であった場合、植物コドンに最適化された、ＣａｓＹをコードするヌクレオチド配列を生成することができる。別の非限定的な例として、意図する宿主細胞が昆虫細胞であった場合、昆虫コドンに最適化された、ＣａｓＹをコードするヌクレオチド配列を生成することができる。

本開示は、（ｉ）ドナー鋳型核酸のヌクレオチド配列（ドナー鋳型は、標的核酸（例えば標的ゲノム）の標的配列と相同性を有するヌクレオチド配列を含む）；（ｉｉ）標的ゲノムの標的遺伝子座の標的配列にハイブリダイズするＣａｓＹガイドＲＮＡをコードするヌクレオチド配列（例えば、真核細胞などの標的細胞において機能できるプロモーターに機能的に連結される）；及び（ｉｉｉ）ＣａｓＹタンパク質をコードするヌクレオチド配列（例えば、真核細胞などの標的細胞において機能できるプロモーターに機能的に連結される）を含む１つ以上の組換え発現ベクターを提供する（異なる組換え発現ベクターの場合もあれば、同一の組換え発現ベクターの場合もある）。本開示は、（ｉ）ドナー鋳型核酸のヌクレオチド配列（ドナー鋳型は、標的核酸（例えば標的ゲノム）の標的配列と相同性を有するヌクレオチド配列を含む）；及び（ｉｉ）標的ゲノムの標的遺伝子座の標的配列にハイブリダイズするＣａｓＹガイドＲＮＡをコードするヌクレオチド配列（例えば、真核細胞などの標的細胞において機能できるプロモーターに機能的に連結される）を含む１つ以上の組換え発現ベクターを提供する（異なる組換え発現ベクターの場合もあれば、同一の組換え発現ベクターの場合もある）。本開示は、（ｉ）標的ゲノムの標的遺伝子座の標的配列にハイブリダイズするＣａｓＹガイドＲＮＡをコードするヌクレオチド配列（例えば、真核細胞などの標的細胞において機能できるプロモーターに機能的に連結される）；及び（ｉｉ）ＣａｓＹタンパク質をコードするヌクレオチド配列（例えば、真核細胞などの標的細胞において機能できるプロモーターに機能的に連結される）を含む１つ以上の組換え発現ベクターを提供する（異なる組換え発現ベクターの場合もあれば、同一の組換え発現ベクターの場合もある）。

好適な発現ベクターとして、ウイルス発現ベクター（例えば、ワクシニアウイルス；ポリオウイルス；アデノウイルス（例えば、Ｌｉｅｔａｌ．，ＩｎｖｅｓｔＯｐｔｈａｌｍｏｌＶｉｓＳｃｉ３５：２５４３２５４９，１９９４；Ｂｏｒｒａｓｅｔａｌ．，ＧｅｎｅＴｈｅｒ６：５１５５２４，１９９９；ＬｉａｎｄＤａｖｉｄｓｏｎ，ＰＮＡＳ９２：７７００７７０４，１９９５；Ｓａｋａｍｏｔｏｅｔａｌ．，ＨＧｅｎｅＴｈｅｒ５：１０８８１０９７，１９９９；ＷＯ９４／１２６４９、ＷＯ９３／０３７６９；ＷＯ９３／１９１９１；ＷＯ９４／２８９３８；ＷＯ９５／１１９８４、及びＷＯ９５／００６５５を参照）；アデノ随伴ウイルス（ＡＡＶ）（例えば、Ａｌｉｅｔａｌ．，ＨｕｍＧｅｎｅＴｈｅｒ９：８１８６，１９９８、Ｆｌａｎｎｅｒｙｅｔａｌ．，ＰＮＡＳ９４：６９１６６９２１，１９９７；Ｂｅｎｎｅｔｔｅｔａｌ．，ＩｎｖｅｓｔＯｐｔｈａｌｍｏｌＶｉｓＳｃｉ３８：２８５７２８６３，１９９７；Ｊｏｍａｒｙｅｔａｌ．，ＧｅｎｅＴｈｅｒ４：６８３６９０，１９９７、Ｒｏｌｌｉｎｇｅｔａｌ．，ＨｕｍＧｅｎｅＴｈｅｒ１０：６４１６４８，１９９９；Ａｌｉｅｔａｌ．，ＨｕｍＭｏｌＧｅｎｅｔ５：５９１５９４，１９９６；ＷＯ９３／０９２３９のＳｒｉｖａｓｔａｖａ、Ｓａｍｕｌｓｋｉｅｔａｌ．，Ｊ．Ｖｉｒ．（１９８９）６３：３８２２−３８２８；Ｍｅｎｄｅｌｓｏｎｅｔａｌ．，Ｖｉｒｏｌ．（１９８８）１６６：１５４−１６５；及びＦｌｏｔｔｅｅｔａｌ．，ＰＮＡＳ（１９９３）９０：１０６１３−１０６１７を参照）；ＳＶ４０；単純ヘルペスウイルス；ヒト免疫不全ウイルス（例えば、Ｍｉｙｏｓｈｉｅｔａｌ．，ＰＮＡＳ９４：１０３１９２３，１９９７；Ｔａｋａｈａｓｈｉｅｔａｌ．，ＪＶｉｒｏｌ７３：７８１２７８１６，１９９９を参照）系のウイルスベクター；レトロウイルスベクター（例えば、マウス白血病ウイルス、脾臓壊死ウイルス、ならびにラウス肉腫ウイルス、ハーベイ肉腫ウイルス、トリ白血病ウイルス、レンチウイルス、ヒト免疫不全ウイルス、骨髄増殖性肉腫ウイルス、及び乳癌ウイルスなどのレトロウイルス由来のベクター）などが挙げられる。場合によって、本開示の組換え発現ベクターは、組換えアデノ随伴ウイルス（ＡＡＶ）ベクターである。場合によって、本開示の組換え発現ベクターは、組換えレンチウイルスベクターである。場合によって、本開示の組換え発現ベクターは、組換えレトロウイルスベクターである。

利用する宿主／ベクター系に応じて、構成的プロモーター及び誘導性プロモーター、転写エンハンサー要素、転写ターミネーターなどを含む、いくつかの好適な転写及び翻訳制御要素のいずれかを発現ベクターに使用することができる。

いくつかの実施形態では、ＣａｓＹガイドＲＮＡをコードするヌクレオチド配列は、制御要素、例えば、プロモーターなどの転写制御要素に機能的に連結される。いくつかの実施形態では、ＣａｓＹタンパク質またはＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列は、制御要素、例えば、プロモーターなどの転写制御要素に機能的に連結される。

転写制御要素はプロモーターであり得る。場合によって、プロモーターは構成的に活性なプロモーターである。場合によって、プロモーターは制御可能なプロモーターである。場合によって、プロモーターは誘導性プロモーターである。場合によって、プロモーターは組織特異的プロモーターである。場合によって、プロモーターは細胞型特異的プロモーターである。場合によって、転写制御要素（例えば、プロモーター）は、標的細胞型または標的細胞集団において機能的である。例えば、場合によって、転写制御要素は、真核細胞、例えば造血幹細胞（例えば、動員された末梢血（ｍＰＢ）ＣＤ３４（＋）細胞、骨髄（ＢＭ）ＣＤ３４（＋）細胞など）において機能的であり得る。

真核生物プロモーター（真核細胞において機能するプロモーター）の非限定的な例として、ＥＦ１α、サイトメガロウイルス（ＣＭＶ）最初期由来のもの、単純ヘルペスウイルス（ＨＳＶ）チミジンキナーゼ、初期及び後期ＳＶ４０、レトロウイルス由来の長末端反復配列（ＬＴＲ）、及びマウスメタロチオネインＩが挙げられる。適切なベクター及びプロモーターの選択は、十分に当業者のレベルの範囲内である。発現ベクターはまた、翻訳開始及び転写ターミネーターに対するリボソーム結合部位を含んでいてもよい。発現ベクターはまた、発現を増幅するための適切な配列を含んでいてもよい。発現ベクターはまた、ＣａｓＹタンパク質に融合することができ、それによってキメラＣａｓＹポリペプチドを生じる、タンパク質タグ（例えば、６ｘＨｉｓタグ、ヘマグルチニンタグ、蛍光タンパク質など）をコードするヌクレオチド配列を含んでいてもよい。

いくつかの実施形態では、ＣａｓＹガイドＲＮＡ及び／またはＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列は、誘導性プロモーターに機能的に連結される。いくつかの実施形態では、ＣａｓＹガイドＲＮＡ及び／またはＣａｓＹ融合タンパク質をコードするヌクレオチド配列は、構成的プロモーターに機能的に連結される。

プロモーターは構成的に活性なプロモーター（すなわち、構成的に活性／「オン」状態であるプロモーター）であっても、誘導性プロモーター（すなわち、活性／「オン」または不活性／「オフ」の状態が、外部刺激、例えば特定の温度、化合物、またはタンパク質の存在によって制御されるプロモーター）であっても、空間的に制限されたプロモーター（すなわち、転写制御要素、エンハンサーなど）（例えば、組織特異的プロモーター、細胞型特異的プロモーターなど）であっても、一時的に制限されるプロモーター（すなわち、胚発生の特定の段階または生物学的過程の特定の段階（例えば、マウスにおける毛包サイクル）の間、プロモーターが「オン」状態または「オフ」状態にある）であってもよい。

好適なプロモーターは、ウイルスに由来するものであるため、ウイルスプロモーターと呼ばれる場合がある。あるいは好適なプロモーターは、原核生物または真核生物を含む任意の生物に由来するものであってもよい。好適なプロモーターを使用して、任意のＲＮＡポリメラーゼ（例えば、ｐｏｌＩ、ｐｏｌＩＩ、ｐｏｌＩＩＩ）によって発現を駆動することができる。例示的なプロモーターとして、ＳＶ４０初期プロモーター、マウス乳癌ウイルスの長末端反復配列（ＬＴＲ）プロモーター；アデノウイルス主要後期プロモーター（ＡｄＭＬＰ）；単純ヘルペスウイルス（ＨＳＶ）プロモーター、ＣＭＶ最初期プロモーター領域（ＣＭＶＩＥ）などのサイトメガロウイルス（ＣＭＶ）プロモーター、ラウス肉腫ウイルス（ＲＳＶ）プロモーター、ヒトＵ６核内低分子プロモーター（Ｕ６）（Ｍｉｙａｇｉｓｈｉｅｔａｌ．，ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ２０，４９７−５００（２００２））、改良型Ｕ６プロモーター（例えば、Ｘｉａｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２００３Ｓｅｐ１；３１（１７））、ヒトＨ１プロモーター（Ｈ１）などが挙げられるが、これらに限定されない。

場合によって、ＣａｓＹガイドＲＮＡをコードするヌクレオチド配列は、真核生物細胞において機能できるプロモーター（例えば、Ｕ６プロモーター、改良型Ｕ６プロモーター、Ｈ１プロモーターなど）に機能的に連結される（その制御下に置かれる）。当業者であれば理解しているであろうが、Ｕ６プロモーター（例えば真核細胞において）または別のＰｏｌＩＩＩプロモーターを使用して核酸（例えば発現ベクター）からＲＮＡ（例えばガイドＲＮＡ）を発現する場合、いくつかのＴ（ＲＮＡではＵをコードする）が連続して存在する場合に、ＲＮＡの変異を要する場合がある。これは、ＤＮＡのＴの列（例えば５つのＴ）が、ポリメラーゼＩＩＩ（ＰｏｌＩＩＩ）に対するターミネーターとして作用する可能性があるためである。したがって、真核細胞のガイドＲＮＡの転写を確実にするには、場合によりガイドＲＮＡをコードする配列を変更して、Ｔの連続を排除することが必要となる場合がある。場合によって、ＣａｓＹタンパク質（例えば、野生型ＣａｓＹタンパク質、ニッカーゼＣａｓＹタンパク質、ｄＣａｓＹタンパク質、キメラＣａｓＹタンパク質など）をコードするヌクレオチド配列は、真核生物細胞において機能できるプロモーター（例えば、ＣＭＶプロモーター、ＥＦ１αプロモーター、エストロゲン受容体制御性プロモーターなど）に機能的に連結される。

誘導性プロモーターの例としては、Ｔ７ＲＮＡポリメラーゼプロモーター、Ｔ３ＲＮＡポリメラーゼプロモーター、イソプロピル−ベータ−Ｄ−チオガラクトピラノシド（ＩＰＴＧ）制御性プロモーター、ラクトース誘導性プロモーター、熱ショックプロモーター、テトラサイクリン制御性プロモーター、ステロイド制御性プロモーター、金属制御性プロモーター、エストロゲン受容体制御性プロモーターなどが挙げられるが、これらに限定されない。したがって誘導性プロモーターは、ドキシサイクリン；エストロゲン及び／またはエストロゲン類似体；ＩＰＴＧなどを含むがこれに限定されない分子によって制御することができる。

使用に適した誘導性プロモーターには、本明細書に記載される、または当業者に公知である任意の誘導性プロモーターを含む。誘導性プロモーターの例として、化学的／生化学的制御及び物理的制御プロモーター、例えば、アルコール制御性プロモーター、テトラサイクリン制御性プロモーター（例えば、アンヒドロテトラサイクリン（ａＴｃ）応答性プロモーター及び他のテトラサイクリン応答性プロモーター系。これにはテトラサイクリン抑制因子タンパク質（ｔｅｔＲ）、テトラサイクリンオペレーター配列（ｔｅｔＯ）、及びテトラサイクリントランス活性化因子融合タンパク質（ｔＴＡ）を含む）、ステロイド制御性プロモーター（例えば、ラットのグルココルチコイド受容体、ヒトエストロゲン受容体、蛾のエクジソン受容体に基づいたプロモーター、及びステロイド／レチノイド／甲状腺受容体スーパーファミリーからのプロモーター）、金属制御性プロモーター（例えば、酵母、マウス、及びヒトからのメタロチオネイン（金属イオンに結合して封鎖するタンパク質）遺伝子に由来するプロモーター）、病原性制御プロモーター（例えば、サリチル酸、エチレン、またはベンゾチアジアゾール（ＢＴＨ）によって誘導される）、温度／熱誘導性プロモーター（例えば、熱ショックプロモーター）、及び光制御性プロモーター（例えば、植物細胞由来の光応答性プロモーター）が挙げられるが、これらに限定されない。

場合によって、プロモーターは、多細胞生物において、特異的細胞のサブセットでプロモーターが活性（すなわち、「オン」）であるような空間的に制限されたプロモーター（すなわち、細胞型特異的プロモーター、組織特異的プロモーターなど）である。空間的に制限されたプロモーターはまた、エンハンサー、転写制御要素、制御配列などと呼ばれる場合もある。プロモーターが標的宿主細胞（例えば、真核細胞；原核細胞）において機能的である限り、利便な空間的に制限されたプロモーターであればいずれでも使用することができる。

場合によって、プロモーターは可逆的プロモーターである。可逆的な誘導性プロモーターを含む、好適な可逆的プロモーターは当技術分野で公知である。そのような可逆的プロモーターは、多くの生物、例えば真核生物及び原核生物から単離して得ることができる。第１の生物に由来する可逆的プロモーターを第２の生物で使用する、例えば、第１の原核生物と第２の真核生物、第１の真核生物と第２の原核生物などで使用するための改変は、当技術分野で周知されている。そのような可逆的プロモーター、及びそのような可逆的プロモーターに基づくが、追加の制御タンパク質も含むシステムとして、アルコール制御性プロモーター（例えば、アルコールデヒドロゲナーゼＩ（ａｌｃＡ）遺伝子プロモーター、アルコールトランス活性化因子タンパク質（ＡｌｃＲ）に応答性のプロモーターなど）、テトラサイクリン制御性プロモーター（例えば、ＴｅｔＡｃｔｉｖａｔｏｒ、ＴｅｔＯＮ、ＴｅｔＯＦＦなどを含むプロモーター系）、ステロイド制御性プロモーター（例えば、ラットのグルココルチコイド受容体プロモーター系、ヒトのエストロゲン受容体プロモーター系、レチノイドプロモーター系、甲状腺プロモーター系、エクジソンプロモーター系、ミフェプリストンプロモーター系など）、金属制御性プロモーター（例えば、メタロチオネインプロモーター系など）、病原関連制御性プロモーター（例えば、サリチル酸制御性プロモーター、エチレン制御性プロモーター、ベンゾチアジアゾール制御性プロモーターなど）、温度制御性プロモーター（例えば、熱ショック誘導性プロモーター（例えば、ＨＳＰ−７０、ＨＳＰ−９０、ダイズ熱ショックプロモーターなど））、光制御性プロモーター、合成誘導性プロモーターなどが挙げられるが、これらに限定されない。

核酸（例えば、ドナーポリヌクレオチド配列を含む核酸、ＣａｓＹタンパク質及び／またはＣａｓＹガイドＲＮＡをコードする１つ以上の核酸など）を宿主細胞に導入する方法は当技術分野で公知であり、任意の利便な方法を使用して、核酸（例えば発現構築物）を細胞へと導入することができる。好適な方法として、例えば、ウイルス感染、トランスフェクション、リポフェクション、エレクトロポレーション、リン酸カルシウム沈降、ポリエチレンイミン（ＰＥＩ）介在型トランスフェクション、ＤＥＡＥ−デキストラン介在型トランスフェクション、リポソーム介在型トランスフェクション、パーティクルガン技術、リン酸カルシウム沈降、直接マイクロインジェクション、ナノ粒子介在型核酸送達などが挙げられる。

細胞への組換え発現ベクターの導入は、細胞の生存を促進する任意の培地及び任意の培養条件下で行なうことができる。標的細胞への組換え発現ベクターの導入は、ｉｎｖｉｖｏまたはｅｘｖｉｖｏで実施することができる。標的細胞への組換え発現ベクターの導入は、ｉｎｖｉｔｒｏで実施することができる。

いくつかの実施形態では、ＣａｓＹタンパク質をＲＮＡとして提供することができる。ＲＮＡは、直接的な化学合成によって提供することも、または（例えば、ＣａｓＹタンパク質をコードする）ＤＮＡからｉｎｖｉｔｒｏで転写することもできる。合成した後は、核酸を細胞に導入するための周知の技術（例えば、マイクロインジェクション、エレクトロポレーション、トランスフェクションなど）のいずれかによってＲＮＡを細胞に導入することができる。

核酸は、十分に開発されたトランスフェクション技術（例えばＡｎｇｅｌａｎｄＹａｎｉｋ（２０１０）ＰＬｏＳＯＮＥ５（７）：ｅ１１７５６を参照）、ならびに市販されているＱｉａｇｅｎ製のＴｒａｎｓＭｅｓｓｅｎｇｅｒ（登録商標）試薬、Ｓｔｅｍｇｅｎｔ製のＳｔｅｍｆｅｃｔ（商標）ＲＮＡＴｒａｎｓｆｅｃｔｉｏｎＫｉｔ、及びＭｉｒｕｓＢｉｏＬＬＣ製のＴｒａｎｓＩＴ（登録商標）−ｍＲＮＡＴｒａｎｓｆｅｃｔｉｏｎＫｉｔを使用して細胞に供給することができる。Ｂｅｕｍｅｒｅｔａｌ．（２００８）ＰＮＡＳ１０５（５０）：１９８２１−１９８２６も参照のこと。

標的宿主細胞にベクターを直接供給してもよい。換言すれば、ベクターが細胞によって取り込まれるように、本発明の核酸を含むベクター（例えば、ドナー鋳型配列を有し、ＣａｓＹガイドＲＮＡをコードする組換え発現ベクター；ＣａｓＹタンパク質をコードする組換え発現ベクターなど）と細胞を接触させる。プラスミドである核酸ベクターと細胞を接触させるための方法として、エレクトロポレーション、塩化カルシウムトランスフェクション、マイクロインジェクション、及びリポフェクションが挙げられ、当技術分野で周知である。ウイルスベクター送達では、本発明のウイルス発現ベクターを含むウイルス粒子と細胞を接触させることができる。

レトロウイルス、例えば、レンチウイルスが本開示の方法での使用に適している。一般的に使用されるレトロウイルスベクターは「機能欠損型」、すなわち増殖性感染に必要なウイルスタンパク質を産生することができない。代わりに、ベクターの複製にパッケージング細胞株の増殖を必要とする。対象となる核酸を含むウイルス粒子を生成するには、その核酸を含むレトロウイルス核酸を、パッケージング細胞株によってウイルスカプシドにパッケージングする。パッケージング細胞株が異なると、カプシドに組み込まれるエンベロープタンパク質（エコトロピック、アンホトロピック、またはゼノトロピック）が異なる。このエンベロープタンパク質は、細胞に対するウイルス粒子の特異性を決定する（マウス及びラットではエコトロピック；ヒト、イヌ、及びマウスを含むほとんどの哺乳動物細胞型ではアンホトロピック；ならびにマウス細胞を除くほとんどの哺乳動物細胞型ではゼノトロピック）。適切なパッケージング細胞株を使用すると、パッケージングされるウイルス粒子によって細胞を確実に標的化することができる。本発明のベクター発現ベクターをパッケージング細胞株に導入する方法、及びパッケージング株によって生成されるウイルス粒子を回収する方法は、当技術分野で周知されている。核酸はまた、直接マイクロインジェクション（例えば、ＲＮＡの注入）によって導入することができる。

ＣａｓＹガイドＲＮＡ及び／またはＣａｓＹポリペプチドをコードする核酸を標的宿主細胞へ供給するために使用されるベクターは、対象となる核酸の発現の駆動、すなわち転写活性化に適したプロモーターを含み得る。換言すれば、場合によって、対象となる核酸はプロモーターに機能的に連結される。これは遍在的に作用するプロモーター、例えばＣＭＶ−β−アクチンプロモーター、または特定の細胞集団で活性であるプロモーター、もしくはテトラサイクリンなどの薬物の存在に応答するプロモーターのような誘導性プロモーターを含み得る。転写活性化とは、標的細胞における基礎レベルよりも、転写を１０倍、１００倍、より一般的には１０００倍増加させることを意図する。加えて、ＣａｓＹガイドＲＮＡ及び／またはＣａｓＹタンパク質をコードする核酸を細胞に供給するために使用されるベクターには、ＣａｓＹガイドＲＮＡ及び／またはＣａｓＹタンパク質が取り込まれた細胞を同定するために、標的細胞の選択マーカーをコードする核酸配列を含んでもよい。

ＣａｓＹポリペプチドまたはＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列を含む核酸は、場合によってＲＮＡである。したがって、ＣａｓＹ融合タンパク質はＲＮＡとして細胞に導入することができる。細胞にＲＮＡを導入する方法は、当技術分野で公知であり、例えば、直接注入、トランスフェクション、またはＤＮＡの導入に使用される任意の他の方法を含み得る。ＣａｓＹタンパク質は、代わりにポリペプチドとして細胞に供給されてもよい。そのようなポリペプチドは、必要に応じて生成物の可溶性を増加させるポリペプチドドメインに融合されてもよい。ドメインは、規定されたプロテアーゼ切断部位、例えば、ＴＥＶプロテアーゼによって切断されるＴＥＶ配列を介してポリペプチドに連結することができる。リンカーはまた、１つ以上の柔軟な配列、例えば１〜１０個のグリシン残基を含んでもよい。いくつかの実施形態では、融合タンパク質の切断は、生成物の可溶性を維持する緩衝液中、例えば０．５〜２Ｍの尿素の存在下、可溶性を高めるポリペプチド及び／またはポリヌクレオチドの存在下などで行われる。対象となるドメインとして、エンドソーム分解ドメイン、例えばインフルエンザＨＡドメイン；及び産生を助けるポリペプチド、例えばＩＦ２ドメイン、ＧＳＴドメイン、ＧＲＰＥドメインなどが挙げられる。ポリペプチドは、安定性を改善するように製剤化することができる。例えば、ペプチドをＰＥＧ化することで、ポリエチレンオキシ基によって血流中での持続時間の延長をもたらすことができる。

加えてまたはその代わりに、本開示のＣａｓＹポリペプチドを、細胞による取り込みを促進するポリペプチド透過性ドメインに融合することができる。いくつかの透過性ドメインが当技術分野で公知であり、これをペプチド、ペプチド模倣物、及び非ペプチド担体を含む本開示の非組み込み型ポリペプチドに使用することができる。例えば、透過性ペプチドは、ペネトラチンと呼ばれる、Ｄｒｏｓｏｐｈｉｌａｍｅｌａｎｏｇａｓｔｅｒの転写因子Ａｎｔｅｎｎａｐａｅｄｉａの３番目のアルファヘリックスに由来するものであってよく、アミノ酸配列ＲＱＩＫＩＷＦＱＮＲＲＭＫＷＫＫ（配列番号１３３）を含む。別の例として、透過性ペプチドは、ＨＩＶ−１ｔａｔの塩基性領域のアミノ酸配列を含み、これには、例えば天然のｔａｔタンパク質の４９〜５７アミノ酸を含み得る。他の透過性ドメインとして、ポリアルギニンモチーフ、例えば、ＨＩＶ−１ｒｅｖタンパク質の３４〜５６アミノ酸の領域、ノナアルギニン、オクタアルギニンなどが挙げられる。（例えば、Ｆｕｔａｋｉｅｔａｌ．（２００３）ＣｕｒｒＰｒｏｔｅｉｎＰｅｐｔＳｃｉ．２００３Ａｐｒ；４（２）：８７−９及び４４６；ならびにＷｅｎｄｅｒｅｔａｌ．（２０００）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．Ｕ．Ｓ．Ａ２０００Ｎｏｖ．２１；９７（２４）：１３００３−８；公開された米国特許出願第２００３０２２０３３４号；第２００３００８３２５６号；第２００３００３２５９３号；及び第２００３００２２８３１号を参照のこと。転位ペプチド及びペプトイドの教示のために参照により本明細書に明確に組み込まれる）。ノナアルギニン（Ｒ９）配列は、特性決定されているより効率的なＰＴＤのいずれかである（Ｗｅｎｄｅｒｅｔａｌ．２０００；Ｕｅｍｕｒａｅｔａｌ．２００２）。融合がなされる部位を選択して、ポリペプチドの生物学的活性、分泌、または結合特性を最適化することができる。最適な部位は日常的な実験によって決定されるであろう。

本開示のＣａｓＹポリペプチドは、ｉｎｖｉｔｒｏで、または真核細胞もしくは原核細胞によって産生することができ、さらにアンフォールディング、例えば熱変性、ジチオスレイトール還元などにより処理すること、さらに当技術分野で公知の方法を使用してリフォールディングすることもできる。

一次配列を変更しないことを目的とする修飾には、ポリペプチドの化学誘導体化、例えば、アシル化、アセチル化、カルボキシル化、アミド化などを含む。これにはグリコシル化修飾、例えば、その合成及び処理工程またはさらなる処理工程、例えば、哺乳動物のグリコシル化または脱グリコシル化酵素など、グリコシル化に影響を及ぼす酵素にポリペプチドを曝露することによってポリペプチドのグリコシル化パターンを変更することによりなされるものを含む。また、アミノ酸残基をリン酸化した配列、例えばホスホチロシン、ホスホセリン、またはホスホスレオニンも包含される。

本開示の実施形態に包含するのに適するものは、通常の分子生物学的技術及び合成化学を使用して修飾し、それによってタンパク質分解耐性を改善した、標的配列特異性を変更した、可溶特性を最適化した、タンパク質の活性（例えば、転写調節活性、酵素活性など）を変更した、または適合性を高めた核酸（例えば、ＣａｓＹガイドＲＮＡをコードする核酸、ＣａｓＹ融合タンパク質をコードする核酸など）及びタンパク質（例えば、野生型タンパク質または変異体タンパク質由来ＣａｓＹ融合タンパク質）である。そのようなポリペプチドの類似体として、天然Ｌ−アミノ酸以外、例えばＤ−アミノ酸または非天然合成アミノ酸の残基を含むものが挙げられる。アミノ酸残基の一部または全部がＤ−アミノ酸に置換されていてもよい。

本開示のＣａｓＹポリペプチドは、当技術分野で公知の従来法を用いて、ｉｎｖｉｔｒｏ合成により調製することができる。種々の市販の合成装置、例えば、ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ，Ｉｎｃ．，Ｂｅｃｋｍａｎなどによる自動合成装置が提供されている。合成装置を使用して、天然アミノ酸が非天然アミノ酸に置換されていてもよい。具体的な配列及び調製方法は、利便性、経済性、要求される純度などによって決定されることになる。

必要に応じて、合成過程または発現時に種々の基をペプチドに導入して、他の分子との、または表面との連結を可能にすることができる。したがって、チオエーテルの生成にシステインを、金属イオン錯体との結合にヒスチジンを、アミドまたはエステルの形成にカルボキシル基を、アミドの形成にアミノ基を使用することなどが可能である。

本開示のＣａｓＹポリペプチドはまた、組換え合成の従来法に従って単離及び精製されていてもよい。発現宿主から溶解物を調製し、その溶解物を高速液体クロマトグラフィー（ＨＰＬＣ）、排除クロマトグラフィー、ゲル電気泳動、アフィニティクロマトグラフィー、またはその他の精製技術を使用して精製することができる。ほとんどの場合、使用される組成物は、生成物の調製方法及びその精製と関連する夾雑物に対して、目的生成物が２０重量％以上、より一般的には７５重量％以上、好ましくは９５重量％以上を占め、また治療目的には、通常９９．５重量％以上を占める。通常、パーセンテージは総タンパク質を基準とする。したがって、場合によって、本開示のＣａｓＹポリペプチド、またはＣａｓＹ融合ポリペプチドは、少なくとも純度８０％、少なくとも純度８５％、少なくとも純度９０％、少なくとも純度９５％、少なくとも純度９８％、または少なくとも純度９９％である（例えば、夾雑物、非ＣａｓＹタンパク質、または他の巨大分子などを含まない）。

標的核酸（例えば、ゲノムＤＮＡ）に対する切断または任意の所望する修飾、または標的核酸と会合したポリペプチドに対する任意の所望する修飾を誘導するには、本開示のＣａｓＹガイドＲＮＡ及び／またはＣａｓＹポリペプチド、及び／またはドナー鋳型配列は、それらが核酸またはポリペプチドとして導入されるかどうかにかかわらず、約３０分〜約２４時間、例えば、１時間、１．５時間、２時間、２．５時間、３時間、３．５時間、４時間、５時間、６時間、７時間、８時間、１２時間、１６時間、１８時間、２０時間、または約３０分〜約２４時間の間の他の任意の期間、細胞に供給され、約１日〜約４日ごと、例えば、１．５日ごと、２日ごと、３日ごと、または約１日〜約４日ごとの間の他の任意の頻度でこれを繰り返すことができる。作用物質（複数可）は対象細胞に１回以上、例えば１回、２回、３回、または３回超供給されてもよく、各接触事象の後、ある程度の時間、例えば１６〜２４時間、細胞を作用物質（複数可）とインキュベートし、その後、培地を新鮮な培地と交換し、細胞をさらに培養することができる。

２つ以上の異なる標的化複合体（例えば、同一または異なる標的核酸内の異なる配列に相補的な２つの異なるＣａｓＹガイドＲＮＡ）を細胞に供給する場合、各複合体を（例えば、２つのポリペプチド及び／または核酸などとして）同時に供給するか、または同時に送達することができる。あるいは、例えば最初に供給される標的化複合体に続いて、第２の標的化複合体を供給する、またはその逆の順番で、それらを連続して供給することができる。

標的細胞へのＤＮＡベクターの送達を改善するには、例えば、リポプレックス及びポリプレックスを使用することによって、ＤＮＡを損傷から保護し、細胞内への進入を促進することができる。したがって、場合によって、本開示の核酸（例えば、本開示の組換え発現ベクター）を、ミセルまたはリポソームのような組織構造の脂質で覆うことができる。組織構造がＤＮＡと複合体を形成している場合、それをリポプレックスと呼ぶ。脂質には、アニオン性（負電荷）、中性、またはカチオン性（正電荷）の３種類がある。カチオン性脂質を利用するリポプレックスは、遺伝子導入での有用性が実証されている。カチオン性脂質は、その正電荷により、負電荷のＤＮＡと自然に複合体を形成する。また、電荷の結果として細胞膜と相互作用する。その後、リポプレックスのエンドサイトーシスが発生し、ＤＮＡは細胞質に放出される。カチオン性脂質は、細胞によるＤＮＡの分解を阻止する。

ポリマーとＤＮＡとの複合体をポリプレックスと呼ぶ。ほとんどのポリプレックスはカチオン性ポリマーからなり、その産生はイオン相互作用によって制御される。ポリプレックスとリポプレックスの作用方法の大きな違いの一つは、ポリプレックスはＤＮＡ積荷を細胞質に放出できないため、この目的のために、不活性化アデノウイルスのようなエンドソーム溶解剤（エンドサイトーシス中に作られるエンドソームを溶解する）との同時トランスフェクションを行う必要があることである。ただし、必ずしもそうでない場合もあり、ポリエチレンイミンのようなポリマーは、キトサン及びトリメチルキトサンと同様、独自のエンドソーム分解方法を有している。

デンドリマー、すなわち球状の形状を有する高度に分岐した巨大分子もまた、幹細胞の遺伝子改変に使用することができる。デンドリマー粒子の表面を官能化して、その特性を変化させることができる。具体的には、カチオン性デンドリマー（すなわち、正の表面電荷を有するもの）を構築することができる。ＤＮＡプラスミドなどの遺伝子材料が存在する場合、電荷の相補性により、核酸とカチオン性デンドリマーとが一時的に会合される。デンドリマーと核酸の複合体が目的地に到達すると、エンドサイトーシスにより、複合体を細胞内に取り込むことができる。

場合によって、本開示の核酸（例えば、発現ベクター）には、対象となるガイド配列に対する挿入部位を含む。例えば、核酸は、対象となるガイド配列に対する挿入部位を含み得るが、この挿入部位は、ガイド配列が所望の標的配列にハイブリダイズするように変化するときに、変化しないＣａｓＹガイドＲＮＡの部分をコードするヌクレオチド配列（例えば、ガイドＲＮＡのＣａｓＹ結合局面に寄与する配列、例えば、ＣａｓＹガイドＲＮＡのｄｓＲＮＡ二重鎖（複数可）に寄与する配列。ガイドＲＮＡのこの部分は、ガイドＲＮＡの「骨格」または「定常領域」と呼ばれることもある）に直接隣接する。したがって、場合によって、本発明の核酸（例えば、発現ベクター）には、ガイドＲＮＡのガイド配列部分をコードする部分が挿入配列（挿入部位）であることを除いて、ＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む。挿入部位は、目的配列の挿入に使用される任意のヌクレオチド配列である。種々の技術で使用される「挿入部位」は当業者に公知であり、任意の利便な挿入部位を使用することができる。挿入部位は、核酸配列を操作するための任意の方法に応じたものであり得る。例えば、場合によって、挿入部位は、多重クローニング部位（ＭＣＳ）（例えば、１つ以上の制限酵素認識配列を含む部位）、ライゲーション非依存性クローニングのための部位、組換えによるクローニングのための部位（例えば、ａｔｔ部位に基づく組換え）、ＣＲＩＳＰＲ／Ｃａｓ（例えばＣａｓ９）を用いる技術によって認識されるヌクレオチド配列などである。

挿入部位は、任意の望ましい長さであってよく、挿入部位の種類に依存し得る（例えば、その部位が（及びいくつの部位が）１つ以上の制限酵素認識配列を含むかどうか、その部位がＣＲＩＳＰＲ／Ｃａｓタンパク質に対する標的部位を含むかどうかなどに依存し得る）。場合によって、本発明の核酸の挿入部位は、長さが３ヌクレオチド（ｎｔ）以上（例えば、長さが５ｎｔ以上、８ｎｔ以上、１０ｎｔ以上、１５ｎｔ以上、１７ｎｔ以上、１８ｎｔ以上、１９ｎｔ以上、２０ｎｔ以上、または２５ｎｔ以上、または３０ｎｔ以上）である。場合によって、本発明の核酸の挿入部位の長さは、２〜５０ヌクレオチド（ｎｔ）（例えば、２〜４０ｎｔ、２〜３０ｎｔ、２〜２５ｎｔ、２〜２０ｎｔ、５〜５０ｎｔ、５〜４０ｎｔ、５〜３０ｎｔ、５〜２５ｎｔ、５〜２０ｎｔ、１０〜５０ｎｔ、１０〜４０ｎｔ、１０〜３０ｎｔ、１０〜２５ｎｔ、１０〜２０ｎｔ、１７〜５０ｎｔ、１７〜４０ｎｔ、１７〜３０ｎｔ、１７〜２５ｎｔ）の範囲の長さを有する。場合によって、本発明の核酸の挿入部位の長さは、５〜４０ｎｔの範囲の長さを有している。

核酸修飾
いくつかの実施形態では、本発明の核酸（例えば、ＣａｓＹガイドＲＮＡ）は、新機能または改良機能（例えば、改善された安定性）をもつ核酸を提供するように、１つ以上の修飾、例えば塩基修飾、骨格修飾などを有する。ヌクレオシドは塩基−糖の組み合わせである。ヌクレオシドの塩基部分は通常、複素環塩基である。そのような複素環塩基のうち最も一般的な２つのクラスがプリン及びピリミジンである。ヌクレオチドは、ヌクレオシドの糖部分に共有結合したリン酸基をさらに含むヌクレオシドである。ペントフラノシル糖を含むヌクレオシドの場合、リン酸基は、糖の２’、３’、または５’位のヒドロキシル部分に結合する可能性がある。オリゴヌクレオチドを形成する場合、そのリン酸基が、隣接するヌクレオシドを互いに共有結合させて直鎖の高分子化合物を形成する。それに続いて、この直鎖の高分子化合物のそれぞれの末端がさらに結合され、環状化合物を形成することも可能であるが、直鎖状化合物が好適である。また、直鎖状化合物は、内部ヌクレオチド塩基の相補性を有する場合があり、その結果、完全にまたは部分的に二本鎖の化合物を生成するような方法で折り畳まれる場合がある。オリゴヌクレオチド内では、リン酸基は一般に、オリゴヌクレオチドのヌクレオシド間骨格を形成すると言われる。ＲＮＡ及びＤＮＡの通常の結合または骨格は、３’と５’とのホスホジエステル結合である。

好適な核酸修飾として、２’Ｏメチル修飾ヌクレオチド、２’フルオロ修飾ヌクレオチド、ロックド核酸（ＬＮＡ）修飾ヌクレオチド、ペプチド核酸（ＰＮＡ）修飾ヌクレオチド、ホスホロチオエート架橋を有するヌクレオチド、及び５’キャップ（例えば、７−メチルグアニル酸キャップ（ｍ７Ｇ））が挙げられるが、これらに限定されない。追加詳細及びその他の修飾は、以下に記載されている。

２’−Ｏ−メチル修飾ヌクレオチド（２’−Ｏ−メチルＲＮＡとも称する）は、転写後修飾として起こる、ｔＲＮＡ及び他の低分子ＲＮＡに見られる天然のＲＮＡ修飾である。２’−Ｏ−メチルＲＮＡを含むオリゴヌクレオチドを直接合成することができる。この修飾により、ＲＮＡ：ＲＮＡ二重鎖のＴｍは増加するが、ＲＮＡ：ＤＮＡの安定性にはわずかしか変化が生じない。これは、一本鎖リボヌクレアーゼによる攻撃に対して安定であり、通常、ＤＮＡよりも５〜１０倍ＤＮａｓｅに反応しにくい。この修飾は、標的メッセージに対する安定性及び結合親和性を増加させる手段としてアンチセンスオリゴによく使用される。

２’フルオロ修飾ヌクレオチド（例えば、２’フルオロ塩基）は、結合親和性（Ｔｍ）を増加させ、また天然のＲＮＡと比較した場合に、ある程度の相対的なヌクレアーゼ耐性を付与するフッ素修飾リボースを有する。この修飾は、血清または他の体液中での安定性を改善するためにリボザイム及びｓｉＲＮＡによく使用される。

ＬＮＡ塩基は、Ｃ３’エンド位置に塩基をロックするリボース骨格への修飾を有し、ＲＮＡがＡ型らせん二重鎖形状をとりやすくする。この修飾はＴｍを著しく増加させ、また極めてヌクレアーゼに耐性である。３’末端以外の任意の位置で、複数のＬＮＡ挿入をオリゴに配置することができる。アンチセンスオリゴからハイブリダイゼーションプローブ、さらにはＳＮＰ検出及び対立遺伝子特異的ＰＣＲに至る用途が記載されている。また、ＬＮＡによってＴｍの大きな増加が得られることから、プライマー二量体の形成、ならびに自己ヘアピン形成の増加をもたらすこともできる。場合によって、単一のオリゴに組み込まれるＬＮＡの数は１０塩基以下である。

ホスホロチオエート（ＰＳ）結合（すなわち、ホスホロチオエート架橋）では、核酸（例えば、オリゴ）のリン酸骨格の非架橋酸素が硫黄原子に置換されている。この修飾により、ヌクレオチド間結合はヌクレアーゼ分解に対して耐性になる。ホスホロチオエート結合を、オリゴの５’末端または３’末端の最後の３〜５ヌクレオチドの間に導入することで、エキソヌクレアーゼ分解を阻害することができる。オリゴ内に（例えば、オリゴ全体にわたって）ホスホロチオエート結合を含めると、エンドヌクレアーゼによる攻撃もまた軽減できる効果がある。

いくつかの実施形態では、本発明の核酸は、２’−Ｏ−メチル修飾ヌクレオチドである１つ以上のヌクレオチドを有する。いくつかの実施形態では、本発明の核酸（例えば、ｄｓＲＮＡ、ｓｉＮＡなど）は、１つ以上の２’フルオロ修飾ヌクレオチドを有する。いくつかの実施形態では、本発明の核酸（例えば、ｄｓＲＮＡ、ｓｉＮＡなど）は、１つ以上のＬＮＡ塩基を有する。いくつかの実施形態では、本発明の核酸（例えば、ｄｓＲＮＡ、ｓｉＮＡなど）は、ホスホロチオエート結合により連結された１つ以上のヌクレオチドを有する（すなわち、本発明の核酸は、１つ以上のホスホロチオエート架橋を有する）。いくつかの実施形態では、本発明の核酸（例えば、ｄｓＲＮＡ、ｓｉＮＡなど）は、５’キャップ（例えば、７−メチルグアニル酸キャップ（ｍ７Ｇ））を有する。いくつかの実施形態では、本発明の核酸（例えば、ｄｓＲＮＡ、ｓｉＮＡなど）は、修飾ヌクレオチドの組み合わせを有する。例えば、本発明の核酸（例えば、ｄｓＲＮＡ、ｓｉＮＡなど）は、５’キャップ（例えば、７−メチルグアニル酸キャップ（ｍ７Ｇ））を有し、さらに他の修飾（例えば、２’−Ｏ−メチルヌクレオチド及び／または２’フルオロ修飾ヌクレオチド及び／またはＬＮＡ塩基及び／またはホスホロチオエート架橋）を有する１つ以上のヌクレオチドを有する可能性がある。

修飾骨格及び修飾ヌクレオシド間結合
修飾を含む好適な核酸（例えば、ＣａｓＹガイドＲＮＡ）の例として、修飾骨格または非天然ヌクレオシド間結合を含む核酸がある。修飾骨格を有する核酸には、骨格にリン原子を保持するもの及び骨格にリン原子をもたないものを含む。

リン原子をそこに含む好適な修飾オリゴヌクレオチド骨格としては、例えば、ホスホロチオエート、キラルホスホロチオエート、ホスホロジチオエート、ホスホトリエステル、アミノアルキルホスホトリエステル、メチル及び他のアルキルホスホネート（３’−アルキレンホスホネート、５’−アルキレンホスホネート、及びキラルホスホネートを含む）、ホスフィネート、ホスホロアミダート（３’−アミノホスホロアミダート及びアミノアルキルホスホロアミダートを含む）、ホスホロジアミダート、チオノホスホロアミダート、チオノアルキルホスホネート、チオノアルキルホスホトリエステル、セレノホスフェート、及びボラノホスフェートが挙げられ、これらは通常の３’−５’結合を有するもの、２’−５’結合されたこれらの類似体、ならびに１つ以上の反転極性を有する（ヌクレオチド間結合が、３’と３’、５’と５’、または２’と２’の結合である）ものを含む。反転極性を有する好適なオリゴヌクレオチドは、最も３’側のヌクレオチド間結合に単一の３’と３’の結合、すなわち塩基性であり得る（核酸塩基がないか、またはその代わりにヒドロキシル基をもつ）単一の反転ヌクレオシド残基を含む。様々な塩（例えば、カリウムまたはナトリウムなど）、混合塩、及び遊離酸形態も含まれる。

いくつかの実施形態では、本発明の核酸は、１つ以上のホスホロチオエート結合及び／またはヘテロ原子ヌクレオシド間結合、特に−ＣＨ₂ −ＮＨ−Ｏ−ＣＨ₂ −、−ＣＨ₂ −Ｎ（ＣＨ₃ ）−Ｏ−ＣＨ₂ −（メチレン（メチルイミノ）またはＭＭＩ骨格と呼ばれる）、−ＣＨ₂ −Ｏ−Ｎ（ＣＨ₃ ）−ＣＨ₂ −、−ＣＨ₂ −Ｎ（ＣＨ₃ ）−Ｎ（ＣＨ₃ ）−ＣＨ₂ −、及び−Ｏ−Ｎ（ＣＨ₃ ）−ＣＨ₂ −ＣＨ₂ −を含む（ここで、天然のホスホジエステルヌクレオチド間連結は、−Ｏ−Ｐ（＝Ｏ）（ＯＨ）−Ｏ−ＣＨ₂ −として表される）。ＭＭＩ型ヌクレオシド間結合は、上記で引用した米国特許第５，４８９，６７７号に記載されており、その開示内容全体が参照により本明細書に組み込まれる。好適なアミドヌクレオシド間結合は、米国特許第５，６０２，２４０号に記載されており、その開示内容全体が参照により本明細書に組み込まれる。

また、例えば米国特許第５，０３４，５０６号に記載されるようなモルホリノ骨格構造を有する核酸も適している。例えば、いくつかの実施形態では、本発明の核酸は、リボース環の代わりに、６員のモルホリノ環を含む。これらの実施形態のいくつかは、ホスホジエステル結合の代わりに、ホスホロジアミダートまたは他の非ホスホジエステルヌクレオシド間結合である。

そこにリン原子を含まない好適な修飾ポリヌクレオチド骨格は、短鎖アルキルもしくはシクロアルキルヌクレオシド間結合、混合ヘテロ原子及びアルキルもしくはシクロアルキルヌクレオシド間結合、または１つ以上の短鎖ヘテロ原子もしくは複素環ヌクレオシド間結合によって形成される骨格を有する。これには、モルホリノ結合（ヌクレオシドの糖部分から部分的に形成される）；シロキサン骨格；スルフィド骨格、スルホキシド骨格、及びスルホン骨格；ホルムアセチル骨格及びチオホルムアセチル骨格；メチレンホルムアセチル骨格及びチオホルムアセチル骨格；リボアセチル骨格；アルケンを含む骨格；スルファメート骨格；メチレンイミノ骨格及びメチレンヒドラジド骨格；スルホネート骨格及びスルホンアミド骨格；アミド骨格；ならびにＮ、Ｏ、Ｓ、及びＣＨ₂ 構成要素部分の混合を有するその他の骨格をもつものを含む。

模倣物
本発明の核酸は、核酸模倣物であり得る。ポリヌクレオチドに適用される場合、用語「模倣物」は、フラノース環のみまたはフラノース環とヌクレオチド間結合の両方が、非フラノース基で置換されているポリヌクレオチドを含むことを意図し、またフラノース環のみの置換は当技術分野で糖代用物であると称される。適切な標的核酸とのハイブリダイゼーションにおいて、複素環塩基部分または修飾複素環塩基部分は維持される。そのような核酸の１つが、優れたハイブリダイゼーション特性を有することが示されているポリヌクレオチド模倣物であり、ペプチド核酸（ＰＮＡ）と呼ばれる。ＰＮＡでは、ポリヌクレオチドの糖骨格が、アミドを含む骨格、特にアミノエチルグリシン骨格で置換されている。ヌクレオチドは保持され、骨格のアミド部分のアザ窒素原子に直接的または間接的に結合される。

優れたハイブリダイゼーション特性を有することが報告されているポリヌクレオチド模倣物の１つが、ペプチド核酸（ＰＮＡ）である。ＰＮＡ化合物の骨格は、アミドを含む骨格をＰＮＡに与える２つ以上の連結されたアミノエチルグリンシン単位である。複素環塩基部分は、骨格のアミド部分のアザ窒素原子に直接的または間接的に結合される。ＰＮＡ化合物の調製について記載している代表的な米国特許として、限定はされないが、米国特許第５，５３９，０８２号；第５，７１４，３３１号；及び第５，７１９，２６２号が挙げられ、各開示内容全体が参照により本明細書に組み込まれる。

研究されているポリヌクレオチド模倣物の別のクラスは、モルホリノ環に結合された複素環塩基を有する連結されたモルホリノ単位（モルホリノ核酸）を基にしている。モルホリノ核酸において、モルホリノモノマー単位を結合する連結基がいくつか報告されている。連結基のクラスの１つは、非イオン性オリゴマー化合物を得られるように選択されている。非イオン性モルホリノ系オリゴマー化合物は、細胞タンパク質との望ましくない相互作用を有する可能性が低い。モルホリノ系ポリヌクレオチドは、細胞タンパク質との望ましくない相互作用を生じさせる可能性が低い非イオン性のオリゴヌクレオチド模倣物である（ＤｗａｉｎｅＡ．ＢｒａａｓｃｈａｎｄＤａｖｉｄＲ．Ｃｏｒｅｙ，Ｂｉｏｃｈｅｍｉｓｔｒｙ，２００２，４１（１４），４５０３−４５１０）。モルホリノ系ポリヌクレオチドは、米国特許第５，０３４，５０６号に記載されており、その開示内容全体が参照により本明細書に組み込まれる。モノマーサブユニットを結合する多種多様な連結基を有する、モルホリノクラスのポリヌクレオチドに属する様々な化合物が調製されている。

ポリヌクレオチド模倣物のさらなるクラスは、シクロヘキセニル核酸（ＣｅＮＡ）と呼ばれる。ＤＮＡ／ＲＮＡ分子に通常存在するフラノース環が、シクロヘキセニル環で置換されている。古典的なホスホロアミダイト化学に従って、ＣｅＮＡＤＭＴ保護ホスホロアミダイトモノマーが調製され、オリゴマー化合物の合成に使用されてきた。ＣｅＮＡで修飾された特異的部分を有する完全修飾ＣｅＮＡオリゴマー化合物及びオリゴヌクレオチドが調製及び研究されている（Ｗａｎｇｅｔａｌ．，Ｊ．Ａｍ．Ｃｈｅｍ．Ｓｏｃ．，２０００，１２２，８５９５−８６０２を参照のこと。その開示内容全体が参照により本明細書に組み込まれる）。一般に、ＤＮＡ鎖へのＣｅＮＡモノマーの組み込みは、ＤＮＡ／ＲＮＡハイブリッドの安定性を増加させる。ＲＮＡ及びＤＮＡと複合体を形成するＣｅＮＡオリゴアデニル酸は、天然複合体と同様の安定性を補う。研究によれば、天然の核酸構造にＣｅＮＡ構造を組み込むと、立体構造の容易な適合が続行されることがＮＭＲ及び円偏光二色性によって示された。

さらなる修飾には、糖環の４’炭素原子に２’−ヒドロキシル基が結合し、それによって２’−Ｃ，４’−Ｃ−オキシメチレン結合を形成し、それによって二環式糖部分を形成するロックド核酸（ＬＮＡ）を含む。この連結基は、メチレン（−ＣＨ₂ −）、すなわち、ｎが１または２である、２’酸素原子と４’炭素原子を架橋する基であり得る（Ｓｉｎｇｈｅｔａｌ．，Ｃｈｅｍ．Ｃｏｍｍｕｎ．，１９９８，４，４５５−４５６。その開示内容全体が参照により本明細書に組み込まれる）。ＬＮＡ及びＬＮＡ類似体は、相補的ＤＮＡ及びＲＮＡとの非常に高い二重鎖熱安定性（Ｔｍ＝＋３〜＋１０℃）、３’−エキソヌクレアーゼ分解に対する安定性、及び良好な溶解特性を示す。ＬＮＡを含む強力かつ非毒性のアンチセンスオリゴヌクレオチドが記載されている（例えば、Ｗａｈｌｅｓｔｅｄｔｅｔａｌ．，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．Ｕ．Ｓ．Ａ．，２０００，９７，５６３３−５６３８。その開示内容全体が参照により本明細書に組み込まれる）。

ＬＮＡモノマーのアデニン、シトシン、グアニン、５−メチル−シトシン、チミン、及びウラシルの合成及び調製に加え、それらのオリゴマー合成、及び核酸認識特性が記載されている（例えば、Ｋｏｓｈｋｉｎｅｔａｌ．，Ｔｅｔｒａｈｅｄｒｏｎ，１９９８，５４，３６０７−３６３０。その開示内容全体が参照により本明細書に組み込まれる）。ＬＮＡ及びその調製については、ＷＯ９８／３９３５２及びＷＯ９９／１４２２６、ならびに米国出願第２０１２０１６５５１４号、第２０１００２１６９８３号、第２００９００４１８０９号、第２００６０１１７４１０号、第２００４００１４９５９号、第２００２００９４５５５号、及び第２００２００８６９９８号にも記載されており、その開示内容全体が参照により本明細書に組み込まれる。

修飾糖部分
本発明の核酸はまた、１つ以上の置換された糖部分を含み得る。好適なポリヌクレオチドは、ＯＨ；Ｆ；Ｏ−、Ｓ−、もしくはＮ−アルキル；Ｏ−、Ｓ−、もしくはＮ−アルケニル；Ｏ−、Ｓ−、もしくはＮ−アルキニル；またはＯ−アルキル−Ｏ−アルキルから選択される糖置換基を含み、ここでのアルキル、アルケニル、及びアルキニルは、置換または非置換のＣ₁ 〜Ｃ₁₀アルキルまたはＣ₂ 〜Ｃ₁₀アルケニル及びアルキニルであり得る。特に、Ｏ（（ＣＨ₂ ）_n Ｏ）_m ＣＨ₃ 、Ｏ（ＣＨ₂ ）_n ＯＣＨ₃ 、Ｏ（ＣＨ₂ ）_n ＮＨ₂ 、Ｏ（ＣＨ₂ ）_n ＣＨ₃ 、Ｏ（ＣＨ₂ ）_n ＯＮＨ₂ 、及びＯ（ＣＨ₂ ）_n ＯＮ（（ＣＨ₂ ）_n ＣＨ₃ ）₂ （ここで、ｎ及びｍは１〜約１０である）が適している。他の好適なポリヌクレオチドは、Ｃ₁ 〜Ｃ₁₀低級アルキル、置換低級アルキル、アルケニル、アルキニル、アルカリル、アラルキル、Ｏ−アルカリルまたはＯ−アラルキル、ＳＨ、ＳＣＨ₃ 、ＯＣＮ、Ｃｌ、Ｂｒ、ＣＮ、ＣＦ₃ 、ＯＣＦ₃ 、ＳＯＣＨ₃ 、ＳＯ₂ ＣＨ₃ 、ＯＮＯ₂ 、ＮＯ₂ 、Ｎ₃ 、ＮＨ₂ 、ヘテロシクロアルキル、ヘテロシクロアルカリル、アミノアルキルアミノ、ポリアルキルアミノ、置換シリル、ＲＮＡ切断基、レポーター基、インターカレーター、オリゴヌクレオチドの薬物動態特性を改善するための基、またはオリゴヌクレオチドの薬力学特性を改善するための基、及び同様の特性を有する他の置換基から選択される糖置換基を含む。好適な修飾には、２’−メトキシエトキシ（２′−Ｏ−ＣＨ₂ ＣＨ₂ ＯＣＨ₃ 、２′−Ｏ−（２−メトキシエチル）または２′−ＭＯＥとしても知られる）（Ｍａｒｔｉｎｅｔａｌ．，Ｈｅｌｖ．Ｃｈｉｍ．Ａｃｔａ，１９９５，７８，４８６−５０４。その開示内容全体が参照により本明細書に組み込まれる）、すなわちアルコキシアルコキシ基を含む。さらに好適な修飾には、本明細書で以下の実施例に記載するような、２’−ＤＭＡＯＥとしても知られる２’−ジメチルアミノオキシエトキシ、すなわちＯ（ＣＨ₂ ）₂ ＯＮ（ＣＨ₃ ）₂ 基、及び２’−ジメチルアミノエトキシエトキシ（当技術分野で２’−Ｏ−ジメチル−アミノーエトキシ−エチルまたは２’−ＤＭＡＥＯＥとしても知られる）、すなわち２′−Ｏ−ＣＨ₂ −Ｏ−ＣＨ₂ −Ｎ（ＣＨ₃ ）₂ を含む。

他の好適な糖置換基として、メトキシ（−Ｏ−ＣＨ₃ ）、アミノプロポキシ（−−ＯＣＨ₂ ＣＨ₂ ＣＨ₂ ＮＨ₂ ）、アリル（−ＣＨ₂ −ＣＨ＝ＣＨ₂ ）、−Ｏ−アリル（−−Ｏ−−ＣＨ₂ −ＣＨ＝ＣＨ₂ ）、及びフルオロ（Ｆ）が挙げられる。２’−糖置換基は、アラビノ位置（上）であっても、またはリボ位置（下）であってもよい。好適な２’−アラビノ修飾は、２’−Ｆである。同様の修飾はまた、オリゴマー化合物の他の位置、特に３’末端ヌクレオシドまたは２’−５’結合オリゴヌクレオチドの糖の３’位置、及び５’末端ヌクレオチドの５’位置でなされ得る。オリゴマー化合物はまた、ペントフラノシル糖の代わりにシクロブチル部分などの糖模倣物を有していてもよい。

塩基の修飾及び置換
本発明の核酸はまた、（当技術分野で単に「塩基」と呼ばれることが多い）核酸塩基の修飾または置換を含み得る。本明細書で使用される場合、「非修飾」または「天然」核酸塩基には、プリン塩基のアデニン（Ａ）及びグアニン（Ｇ）、ならびにピリミジン塩基のチミン（Ｔ）、シトシン（Ｃ）、及びウラシル（Ｕ）を含む。修飾核酸塩基には、他の合成核酸塩基及び天然核酸塩基を含み、例えば、５−メチルシトシン（５−ｍｅ−Ｃ）、５−ヒドロキシメチルシトシン、キサンチン、ヒポキサンチン、２−アミノアデニン、アデニン及びグアニンの６−メチル及び他のアルキル誘導体、アデニン及びグアニンの２−プロピル及び他のアルキル誘導体、２−チオウラシル、２−チオチミン及び２−チオシトシン、５−ハロウラシル及びシトシン、５−プロピニル（−Ｃ＝Ｃ−ＣＨ₃ ）ウラシル及びシトシン、ならびにピリミジン塩基の他のアルキニル誘導体、６−アゾウラシル、シトシン及びチミン、５−ウラシル（シュードウラシル）、４−チオウラシル、８−ハロ、８−アミノ、８−チオール、８−チオアルキル、８−ヒドロキシル及び他の８−置換アデニン及びグアニン、５−ハロ、特に５−ブロモ、５−トリフルオロメチル及び他の５−置換ウラシル及びシトシン、７−メチルグアニン及び７−メチルアデニン、２−Ｆ−アデニン、２−アミノアデニン、８−アザグアニン及び８−アザアデニン、７−デアザグアニン及び７−デアザアデニン、ならびに３−デアザグアニン及び３−デアザアデニンが挙げられる。さらなる修飾核酸塩基として、フェノキサジンシチジン（１Ｈ−ピリミド（５，４−ｂ）（１，４）ベンゾキサジン−２（３Ｈ）−オン）、フェノチアジンシチジン（１Ｈ−ピリミド（５，４−ｂ）（１，４）ベンゾチアジン−２（３Ｈ）−オン）などの三環ピリミジン、置換フェノキサジンシチジン（例えば、９−（２−アミノエトキシ）−Ｈ−ピリミド（５，４−（ｂ）（１，４）ベンゾキサジン−２（３Ｈ）−オン）、カルバゾールシチジン（２Ｈ−ピリミド（４，５−ｂ）インドール−２−オン）、ピリドインドールシチジン（Ｈ−ピリド（３’，２’：４，５）ピロロ（２，３−ｄ）ピリミジン−２−オン）などのＧクランプが挙げられる。

複素環塩基部分にはまた、プリン塩基またはピリミジン塩基が他の複素環で置換されているもの、例えば７−デアザ−アデニン、７−デアザグアノシン、２−アミノピリジン、及び２−ピリドンを含み得る。さらなる核酸塩基として、米国特許第３，６８７，８０８号に記載のもの、ＴｈｅＣｏｎｃｉｓｅＥｎｃｙｃｌｏｐｅｄｉａＯｆＰｏｌｙｍｅｒＳｃｉｅｎｃｅＡｎｄＥｎｇｉｎｅｅｒｉｎｇ，ｐａｇｅｓ８５８−８５９，Ｋｒｏｓｃｈｗｉｔｚ，Ｊ．Ｉ．，ｅｄ．ＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ，１９９０に記載のもの、Ｅｎｇｌｉｓｃｈｅｔａｌ．，ＡｎｇｅｗａｎｄｔｅＣｈｅｍｉｅ，ＩｎｔｅｒｎａｔｉｏｎａｌＥｄｉｔｉｏｎ，１９９１，３０，６１３によって記載されるもの、及びＳａｎｇｈｖｉ，Ｙ．Ｓ．，Ｃｈａｐｔｅｒ１５，ＡｎｔｉｓｅｎｓｅＲｅｓｅａｒｃｈａｎｄＡｐｐｌｉｃａｔｉｏｎｓ，ｐａｇｅｓ２８９−３０２，Ｃｒｏｏｋｅ，Ｓ．Ｔ．ａｎｄＬｅｂｌｅｕ，Ｂ．，ｅｄ．，ＣＲＣＰｒｅｓｓ，１９９３によって記載されるものが挙げられ、その開示内容全体が参照により本明細書に組み込まれる。これらのうち、ある種の核酸塩基は、オリゴマー化合物の結合親和性を増加させるのに有用である。このような核酸塩基として、５−置換ピリミジン、６−アザピリミジン、及びＮ−２、Ｎ−６及びＯ−６置換プリン、例えば、２−アミノプロピルアデニン、５−プロピニルウラシル、及び５−プロピニルシトシンが挙げられる。５−メチルシトシン置換は、核酸の二重鎖安定性を０．６〜１．２℃上昇させることが示されており（Ｓａｎｇｈｖｉｅｔａｌ．，ｅｄｓ．，ＡｎｔｉｓｅｎｓｅＲｅｓｅａｒｃｈａｎｄＡｐｐｌｉｃａｔｉｏｎｓ，ＣＲＣＰｒｅｓｓ，ＢｏｃａＲａｔｏｎ，１９９３，ｐｐ．２７６−２７８。その開示内容全体が参照により本明細書に組み込まれる）、例えば、２’−Ｏ−メトキシエチル糖修飾と組み合わせた場合、好適な塩基置換である。

コンジュゲート
本発明の核酸について可能な別の修飾は、オリゴヌクレオチドの活性、細胞分布、または細胞取り込みを増強する１つ以上の部分またはコンジュゲートを、ポリヌクレオチドに化学的に連結することを伴う。これらの部分またはコンジュゲートには、第１級または第２級ヒドロキシル基などの官能基に共有結合するコンジュゲート基を含み得る。コンジュゲート基としては、インターカレーター、レポーター分子、ポリアミン、ポリアミド、ポリエチレングリコール、ポリエーテル、オリゴマーの薬力学的特性を向上させる基、及びオリゴマーの薬物動態特性を向上させる基が挙げられるが、これらに限定されない。好適なコンジュゲート基として、コレステロール、脂質、リン脂質、ビオチン、フェナジン、葉酸、フェナントリジン、アントラキノン、アクリジン、フルオレセイン、ローダミン、クマリン、及び色素が挙げられるが、これらに限定されない。薬力学的特性を向上させる基には、取り込みを改善する基、分解に対する耐性を高める基、及び／または標的核酸との配列特異的ハイブリダイゼーションを強化する基が含まれる。薬物動態特性を向上させる基には、本発明の核酸の取り込み、分布、代謝、または排出を改善する基が含まれる。

コンジュゲート部分として、限定はされないが、脂質部分が挙げられ、これには例えば、コレステロール部分（Ｌｅｔｓｉｎｇｅｒｅｔａｌ．，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，１９８９，８６，６５５３−６５５６）、コール酸（Ｍａｎｏｈａｒａｎｅｔａｌ．，Ｂｉｏｏｒｇ．Ｍｅｄ．Ｃｈｅｍ．Ｌｅｔ．，１９９４，４，１０５３−１０６０）、チオエーテル、例えばヘキシル−Ｓ−トリチルチオール（Ｍａｎｏｈａｒａｎｅｔａｌ．，Ａｎｎ．Ｎ．Ｙ．Ａｃａｄ．Ｓｃｉ．，１９９２，６６０，３０６−３０９；Ｍａｎｏｈａｒａｎｅｔａｌ．，Ｂｉｏｏｒｇ．Ｍｅｄ．Ｃｈｅｍ．Ｌｅｔ．，１９９３，３，２７６５−２７７０）、チオコレステロール（Ｏｂｅｒｈａｕｓｅｒｅｔａｌ．，Ｎｕｃｌ．ＡｃｉｄｓＲｅｓ．，１９９２，２０，５３３−５３８）、脂肪族鎖、例えばドデカンジオール残基もしくはウンデシル残基（Ｓａｉｓｏｎ−Ｂｅｈｍｏａｒａｓｅｔａｌ．，ＥＭＢＯＪ．，１９９１，１０，１１１１−１１１８；Ｋａｂａｎｏｖｅｔａｌ．，ＦＥＢＳＬｅｔｔ．，１９９０，２５９，３２７−３３０；Ｓｖｉｎａｒｃｈｕｋｅｔａｌ．，Ｂｉｏｃｈｉｍｉｅ，１９９３，７５，４９−５４）、リン脂質、例えばジ−ヘキサデシル−ｒａｃ−グリセロールもしくはトリエチルアンモニウム１，２−ジ−Ｏ−ヘキサデシル−ｒａｃ−グリセロール−３−Ｈ−ホスホネート（Ｍａｎｏｈａｒａｎｅｔａｌ．，ＴｅｔｒａｈｅｄｒｏｎＬｅｔｔ．，１９９５，３６，３６５１−３６５４；Ｓｈｅａｅｔａｌ．，Ｎｕｃｌ．ＡｃｉｄｓＲｅｓ．，１９９０，１８，３７７７−３７８３）、ポリアミンもしくはポリエチレングリコール鎖（Ｍａｎｏｈａｒａｎｅｔａｌ．，Ｎｕｃｌｅｏｓｉｄｅｓ＆Ｎｕｃｌｅｏｔｉｄｅｓ，１９９５，１４，９６９−９７３）、またはアダマンタン酢酸（Ｍａｎｏｈａｒａｎｅｔａｌ．，ＴｅｔｒａｈｅｄｒｏｎＬｅｔｔ．，１９９５，３６，３６５１−３６５４）、パルミチル部分（Ｍｉｓｈｒａｅｔａｌ．，Ｂｉｏｃｈｉｍ．Ｂｉｏｐｈｙｓ．Ａｃｔａ，１９９５，１２６４，２２９−２３７）、またはオクタデシルアミンもしくはヘキシルアミノ−カルボニル−オキシコレステロール部分（Ｃｒｏｏｋｅｅｔａｌ．，Ｊ．Ｐｈａｒｍａｃｏｌ．Ｅｘｐ．Ｔｈｅｒ．，１９９６，２７７，９２３−９３７）などがある。

コンジュゲートには、「タンパク質導入ドメイン」すなわちＰＴＤ（細胞膜透過性ペプチド、ＣＰＰとも呼ばれる）を含み得るが、これは脂質二重層、ミセル、細胞膜、オルガネラ膜、または小胞膜の透過を促進するポリペプチド、ポリヌクレオチド、炭水化物、または有機もしくは無機化合物を指す場合がある。極性小分子から大きな巨大分子及び／またはナノ粒子までを範囲とし得る別の分子に結合したＰＴＤは、例えば、細胞外空間から細胞内空間への、またはサイトゾルからオルガネラ（例えば、核）内への移行といった、分子の膜透過を促進する。いくつかの実施形態では、ＰＴＤは、外因性ポリヌクレオチドの３’末端に共有結合されている。いくつかの実施形態では、ＰＴＤは、外因性ポリヌクレオチドの５’末端に共有結合されている。例示的なＰＴＤとして、最小のウンデカペプチドタンパク質導入ドメイン（ＹＧＲＫＫＲＲＱＲＲＲ：配列番号１１２を含むＨＩＶ−１ＴＡＴの４７〜５７残基に対応）；細胞への直接導入に十分な複数のアルギニン（例えば、３、４、５、６、７、８、９、１０、または１０〜５０のアルギニン）を含むポリアルギニン配列；ＶＰ２２ドメイン（Ｚｅｎｄｅｒｅｔａｌ．（２００２）ＣａｎｃｅｒＧｅｎｅＴｈｅｒ．９（６）：４８９−９６）；ＤｒｏｓｏｐｈｉｌａＡｎｔｅｎｎａｐｅｄｉａタンパク質導入ドメイン（Ｎｏｇｕｃｈｉｅｔａｌ．（２００３）Ｄｉａｂｅｔｅｓ５２（７）：１７３２−１７３７）；短縮ヒトカルシトニンペプチド（Ｔｒｅｈｉｎｅｔａｌ．（２００４）Ｐｈａｒｍ．Ｒｅｓｅａｒｃｈ２１：１２４８−１２５６）；ポリリジン（Ｗｅｎｄｅｒｅｔａｌ．（２０００）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９７：１３００３−１３００８）；ＲＲＱＲＲＴＳＫＬＭＫＲ（配列番号１１３）；トランスポータンＧＷＴＬＮＳＡＧＹＬＬＧＫＩＮＬＫＡＬＡＡＬＡＫＫＩＬ（配列番号１１４）；ＫＡＬＡＷＥＡＫＬＡＫＡＬＡＫＡＬＡＫＨＬＡＫＡＬＡＫＡＬＫＣＥＡ（配列番号１１５）；及びＲＱＩＫＩＷＦＱＮＲＲＭＫＷＫＫ（配列番号１１６）が挙げられるが、これらに限定されない。例示的なＰＴＤとして、限定はされないが、ＹＧＲＫＫＲＲＱＲＲＲ（配列番号１１７）、ＲＫＫＲＲＱＲＲＲ（配列番号１１８）；３アルギニン残基〜５０アルギニン残基までからなるアルギニンホモポリマーが挙げられ、例示的なＰＴＤドメインアミノ酸配列には、限定はされないが、以下のいずれかが含まれる：ＹＧＲＫＫＲＲＱＲＲＲ（配列番号１１９）；ＲＫＫＲＲＱＲＲ（配列番号１２０）；ＹＡＲＡＡＡＲＱＡＲＡ（配列番号１２１）；ＴＨＲＬＰＲＲＲＲＲＲ（配列番号１２２）；及びＧＧＲＲＡＲＲＲＲＲＲ（配列番号１２３）。いくつかの実施形態では、ＰＴＤは、活性化可能なＣＰＰ（ＡＣＰＰ）である（Ａｇｕｉｌｅｒａｅｔａｌ．（２００９）ＩｎｔｅｇｒＢｉｏｌ（Ｃａｍｂ）Ｊｕｎｅ；１（５−６）：３７１−３８１）。ＡＣＰＰには、対となるポリアニオン（例えば、Ｇｌｕ９すなわち「Ｅ９」）に切断可能なリンカーを介して接続されたポリカチオン性ＣＰＰ（例えば、ＡＲＧ９すなわち「Ｒ９」）が含まれ、これが実効電荷をほぼゼロに低下させ、それによって細胞への接着及び取り込みを阻害する。リンカーの切断時に、ポリアニオンが遊離して、ポリアルギニン及びそれに備わる接着性が局所的に露出され、それによってＡＣＰＰの膜透過が「活性化」する。

標的細胞への構成要素の導入
本開示のＣａｓＹガイドＲＮＡ（またはそれをコードするヌクレオチド配列を含む核酸）及び／またはＣａｓＹポリペプチド（またはそれをコードするヌクレオチド配列を含む核酸）及び／または本開示のＣａｓＹ融合ポリペプチド（または本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列を含む核酸）及び／またはドナーポリヌクレオチド（ドナー鋳型）は、周知の様々な方法のいずれかによって宿主細胞に導入することができる。

種々の化合物及び方法のいずれかを使用して、本開示のＣａｓＹシステムを標的細胞に送達することができる。例えば、ＣａｓＹシステムは以下を含む：ａ）本開示のＣａｓＹポリペプチド及びＣａｓＹガイドＲＮＡ；ｂ）本開示のＣａｓＹポリペプチド、ＣａｓＹガイドＲＮＡ、及びドナー鋳型核酸；ｃ）本開示のＣａｓＹ融合ポリペプチド及びＣａｓＹガイドＲＮＡ；ｄ）本開示のＣａｓＹ融合ポリペプチド、ＣａｓＹガイドＲＮＡ、及びドナー鋳型核酸；ｅ）本開示のＣａｓＹポリペプチドをコードするｍＲＮＡ及びＣａｓＹガイドＲＮＡ；ｆ）本開示のＣａｓＹポリペプチドをコードするｍＲＮＡ、ＣａｓＹガイドＲＮＡ、及びドナー鋳型核酸；ｇ）本開示のＣａｓＹ融合ポリペプチドをコードするｍＲＮＡ及びＣａｓＹガイドＲＮＡ；ｈ）本開示のＣａｓＹ融合ポリペプチドをコードするｍＲＮＡ、ＣａｓＹガイドＲＮＡ、及びドナー鋳型核酸；ｉ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列及びＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む組換え発現ベクター；ｊ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列、ＣａｓＹガイドＲＮＡをコードするヌクレオチド配列、及びドナー鋳型核酸をコードするヌクレオチド配列を含む組換え発現ベクター；ｋ）本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列及びＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む組換え発現ベクター；ｌ）本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列、ＣａｓＹガイドＲＮＡをコードするヌクレオチド配列、及びドナー鋳型核酸をコードするヌクレオチド配列を含む組換え発現ベクター；ｍ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列を含む第１の組換え発現ベクター、及びＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む第２の組換え発現ベクター；ｎ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列を含む第１の組換え発現ベクター、ならびにＣａｓＹガイドＲＮＡをコードするヌクレオチド配列及びドナー鋳型核酸を含む第２の組換え発現ベクター；ｏ）本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列を含む第１の組換え発現ベクター、及びＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む第２の組換え発現ベクター；ｐ）本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列を含む第１の組換え発現ベクター、ならびにＣａｓＹガイドＲＮＡをコードするヌクレオチド配列及びドナー鋳型核酸を含む第２の組換え発現ベクター；ｑ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列、第１のＣａｓＹガイドＲＮＡをコードするヌクレオチド配列、及び第２のＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む組換え発現ベクター；もしくはｒ）本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列、第１のＣａｓＹガイドＲＮＡをコードするヌクレオチド配列、及び第２のＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む組換え発現ベクター；または（ａ）〜（ｒ）のいずれか１つの何らかの変形例。非限定的な例として、本開示のＣａｓＹシステムは、脂質と組み合わせることができる。別の非限定的な例として、本開示のＣａｓＹシステムは、粒子と組み合わせる、または粒子に製剤化することができる。

宿主細胞に核酸を導入する方法は、当技術分野で公知であり、任意の利便な方法を使用して、本発明の核酸（例えば、発現構築物／ベクター）を標的細胞（例えば、原核細胞、真核細胞、植物細胞、動物細胞、哺乳動物細胞、ヒト細胞など）に導入することができる。好適な方法として、例えば、ウイルス感染、トランスフェクション、コンジュゲーション、プロトプラスト融合、リポフェクション、エレクトロポレーション、リン酸カルシウム沈降、ポリエチレンイミン（ＰＥＩ）介在型トランスフェクション、ＤＥＡＥ−デキストラン介在型トランスフェクション、リポソーム介在型トランスフェクション、パーティクルガン技術、リン酸カルシウム沈降、直接マイクロインジェクション、ナノ粒子介在型核酸送達（例えば、Ｐａｎｙａｍｅｔ．，ａｌＡｄｖＤｒｕｇＤｅｌｉｖＲｅｖ．２０１２Ｓｅｐ１３．ｐｉｉ：Ｓ０１６９−４０９Ｘ（１２）００２８３−９．ｄｏｉ：１０．１０１６／ｊ．ａｄｄｒ．２０１２．０９．０２３を参照）などが挙げられる。

場合によって、本開示のＣａｓＹポリペプチドは、ＣａｓＹポリペプチドをコードする核酸（例えば、ｍＲＮＡ、ＤＮＡ、プラスミド、発現ベクター、ウイルスベクターなど）として提供される。場合によって、本開示のＣａｓＹポリペプチドは、タンパク質として（例えば、関連するガイドＲＮＡなしで、または関連するガイドＲＮＡあり、すなわちリボ核タンパク質複合体として）直接提供される。本開示のＣａｓＹポリペプチドは、任意の利便な方法によって細胞に導入する（細胞に供給する）ことができる。そのような方法は、当業者に公知である。例示的な一例として、本開示のＣａｓＹポリペプチドは、（例えば、ＣａｓＹガイドＲＮＡまたはＣａｓＹガイドＲＮＡをコードする核酸ありまたはなしで、及びドナーポリヌクレオチドありまたはなしで）細胞内に直接注入することができる。別の例として、本開示のＣａｓＹポリペプチドとＣａｓＹガイドＲＮＡ（ＲＮＰ）との複合体を予め形成して、それを細胞（例えば、真核細胞）に導入することができる（例えば、注入によって、ヌクレオフェクションによって；１つ以上の構成要素にコンジュゲートされたタンパク質導入ドメイン（ＰＴＤ）、例えばＣａｓＹタンパク質にコンジュゲートされたＰＴＤ、ガイドＲＮＡにコンジュゲートされたＰＴＤ、本開示のＣａｓＹポリペプチド及びガイドＲＮＡにコンジュゲートされたＰＴＤを介してなど）。

場合によって、本開示のＣａｓＹ融合ポリペプチド（例えば、融合パートナーに融合されたｄＣａｓＹ、融合パートナーに融合されたニッカーゼＣａｓＹなど）は、ＣａｓＹ融合ポリペプチドをコードする核酸（例えば、ｍＲＮＡ、ＤＮＡ、プラスミド、発現ベクター、ウイルスベクターなど）として提供される。場合によって、本開示のＣａｓＹ融合ポリペプチドは、タンパク質として（例えば、関連するガイドＲＮＡなしで、または関連するガイドＲＮＡあり、すなわちリボ核タンパク質複合体として）直接提供される。本開示のＣａｓＹ融合ポリペプチドは、任意の利便な方法によって細胞に導入する（細胞に供給する）ことができる。そのような方法は、当業者に公知である。例示的な一例として、本開示のＣａｓＹ融合ポリペプチドは、（例えば、ＣａｓＹガイドＲＮＡをコードする核酸ありまたはなしで、及びドナーポリヌクレオチドありまたはなしで）細胞内に直接注入することができる。別の例として、本開示のＣａｓＹ融合ポリペプチドとＣａｓＹガイドＲＮＡ（ＲＮＰ）との複合体を予め形成して、それを細胞に導入することができる（例えば、注入によって、ヌクレオフェクションによって；１つ以上の構成要素にコンジュゲートされたタンパク質導入ドメイン（ＰＴＤ）、例えばＣａｓＹ融合タンパク質にコンジュゲートされたＰＴＤ、ガイドＲＮＡにコンジュゲートされたＰＴＤ、本開示のＣａｓＹ融合ポリペプチド及びガイドＲＮＡにコンジュゲートされたＰＴＤを介してなど）。

場合によって、核酸（例えば、ＣａｓＹガイドＲＮＡ；本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列を含む核酸など）は、粒子内の、または粒子と会合する細胞（例えば、標的宿主細胞）及び／またはポリペプチド（例えば、ＣａｓＹポリペプチド；ＣａｓＹ融合ポリペプチド）に送達される。場合によって、本開示のＣａｓＹシステムは、粒子内の、または粒子と会合する細胞に送達される。用語「粒子」及び「ナノ粒子」は、必要に応じて同義に使用することができる。本開示のＣａｓＹポリペプチド及び／またはＣａｓＹガイドＲＮＡをコードするヌクレオチド配列、本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列を含むｍＲＮＡ、及びガイドＲＮＡを含む組換え発現ベクターは、粒子または脂質エンベロープを使用して、例えば、ＣａｓＹポリペプチド及びＣａｓＹガイドＲＮＡを、例えば複合体（例えば、リボ核タンパク質（ＲＮＰ）複合体）として同時に送達してもよく、粒子、例えば脂質またはリピドイドと親水性ポリマー、例えばカチオン性脂質と親水性ポリマーを含む送達粒子を介して送達することができる。例えば、その場合のカチオン性脂質は、１，２−ジオレオイル−３−トリメチルアンモニウム−プロパン（ＤＯＴＡＰ）または１，２−ジテトラデカノイル−ｓｎ−グリセロ−３−ホスホコリン（ＤＭＰＣ）を含み、及び／または親水性ポリマーは、エチレングリコールまたはポリエチレングリコール（ＰＥＧ）を含み、及び／または粒子はさらにコレステロールを含む（例えば、製剤１＝ＤＯＴＡＰ１００、ＤＭＰＣ０、ＰＥＧ０、コレステロール０；製剤番号２＝ＤＯＴＡＰ９０、ＤＭＰＣ０、ＰＥＧ１０、コレステロール０；製剤番号３＝ＤＯＴＡＰ９０、ＤＭＰＣ０、ＰＥＧ５、コレステロール５から得られる粒子）。例えば、複数工程の処理を用いて粒子を形成することができ、その工程では、ＣａｓＹポリペプチド及びＣａｓＹガイドＲＮＡを、例えばモル比１：１で、例えば室温で、例えば３０分間、例えばヌクレアーゼを含まない滅菌１倍リン酸緩衝生理食塩水（ＰＢＳ）中で一緒に混合し、かつ、製剤に応じて、ＤＯＴＡＰ、ＤＭＰＣ、ＰＥＧ、及びコレステロールを別々にアルコール（例えば、１００％エタノール）に溶解し、この２つの溶液を一緒に混合して、複合体を含有する粒子を形成する。

本開示のＣａｓＹポリペプチド（または本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列を含むｍＲＮＡ；または本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列を含む組換え発現ベクター）及び／またはＣａｓＹガイドＲＮＡ（またはＣａｓＹガイドＲＮＡをコードする１つの以上の発現ベクターなどの核酸）は、粒子または脂質エンベロープを使用して同時に送達することができる。例えば、リン脂質二重層シェルに封入されたポリ（β−アミノエステル）（ＰＢＡＥ）コアをもつ、生分解性のコア−シェル構造のナノ粒子を使用することができる。場合によって、自己組織化生体接着性ポリマーを用いた粒子／ナノ粒子が使用される。そのような粒子／ナノ粒子を、例えば脳への、ペプチドの経口送達、ペプチドの静脈内送達、及びペプチドの経鼻送達に利用してもよい。疎水性薬物の経口吸収及び眼内送達のような他の実施形態もまた企図される。疾患の部位を保護するように、及び疾患の部位に送達するように設計されたポリマーエンベロープに関連する分子エンベロープ技術を使用することができる。様々な因子、例えば標的組織に応じて、約５ｍｇ／ｋｇ用量を単回投与または複数回投与で用いることができる。

リピドイド化合物（例えば、米国特許出願第２０１１０２９３７０３号に記載されているようなもの）もポリヌクレオチドの投与に有用であり、本開示のＣａｓＹポリペプチド、本開示のＣａｓＹ融合ポリペプチド、本開示のＲＮＰ、本開示の核酸、または本開示のＣａｓＹシステムの送達に使用することができる（例えば、ＣａｓＹシステムは以下を含む：ａ）本開示のＣａｓＹポリペプチド及びＣａｓＹガイドＲＮＡ；ｂ）本開示のＣａｓＹポリペプチド、ＣａｓＹガイドＲＮＡ、及びドナー鋳型核酸；ｃ）本開示のＣａｓＹ融合ポリペプチド及びＣａｓＹガイドＲＮＡ；ｄ）本開示のＣａｓＹ融合ポリペプチド、ＣａｓＹガイドＲＮＡ、及びドナー鋳型核酸；ｅ）本開示のＣａｓＹポリペプチドをコードするｍＲＮＡ及びＣａｓＹガイドＲＮＡ；ｆ）本開示のＣａｓＹポリペプチドをコードするｍＲＮＡ、ＣａｓＹガイドＲＮＡ、及びドナー鋳型核酸；ｇ）本開示のＣａｓＹ融合ポリペプチドをコードするｍＲＮＡ及びＣａｓＹガイドＲＮＡ；ｈ）本開示のＣａｓＹ融合ポリペプチドをコードするｍＲＮＡ、ＣａｓＹガイドＲＮＡ、及びドナー鋳型核酸；ｉ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列及びＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む組換え発現ベクター；ｊ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列、ＣａｓＹガイドＲＮＡをコードするヌクレオチド配列、及びドナー鋳型核酸をコードするヌクレオチド配列を含む組換え発現ベクター；ｋ）本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列及びＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む組換え発現ベクター；ｌ）本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列、ＣａｓＹガイドＲＮＡをコードするヌクレオチド配列、及びドナー鋳型核酸をコードするヌクレオチド配列を含む組換え発現ベクター；ｍ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列を含む第１の組換え発現ベクター、及びＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む第２の組換え発現ベクター；ｎ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列を含む第１の組換え発現ベクター、ならびにＣａｓＹガイドＲＮＡをコードするヌクレオチド配列及びドナー鋳型核酸を含む第２の組換え発現ベクター；ｏ）本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列を含む第１の組換え発現ベクター、及びＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む第２の組換え発現ベクター；ｐ）本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列を含む第１の組換え発現ベクター、ならびにＣａｓＹガイドＲＮＡをコードするヌクレオチド配列及びドナー鋳型核酸を含む第２の組換え発現ベクター；ｑ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列、第１のＣａｓＹガイドＲＮＡをコードするヌクレオチド配列、及び第２のＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む組換え発現ベクター；もしくはｒ）本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列、第１のＣａｓＹガイドＲＮＡをコードするヌクレオチド配列、及び第２のＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む組換え発現ベクター；または（ａ）〜（ｒ）のいずれか１つの何らかの変形例）。一態様では、アミノアルコールリピドイド化合物は、細胞または対象に送達される薬剤と組み合わされ、微粒子、ナノ粒子、リポソーム、またはミセルを形成する。アミノアルコールリピドイド化合物を、他のアミノアルコールリピドイド化合物、ポリマー（合成または天然）、界面活性剤、コレステロール、炭水化物、タンパク質、脂質などと組み合わせ、粒子を形成することができる。その後、このような粒子を必要に応じて医薬賦形剤と組み合わせて、医薬組成物を形成することができる。

ポリ（ベータ−アミノアルコール）（ＰＢＡＡ）を、本開示のＣａｓＹポリペプチド、本開示のＣａｓＹ融合ポリペプチド、本開示のＲＮＰ、本開示の核酸、または本開示のＣａｓＹシステムの標的細胞への送達に使用することができる。米国特許公開番号第２０１３０３０２４０１号は、コンビナトリアル重合を用いて調製されたポリ（ベータ−アミノアルコール）（ＰＢＡＡ）の１クラスに関する。

糖ベースの粒子、例えば、ＷＯ２０１４１１８２７２（参照により本明細書に組み込まれる）及びＮａｉｒ，ＪＫｅｔａｌ．，２０１４，ＪｏｕｒｎａｌｏｆｔｈｅＡｍｅｒｉｃａｎＣｈｅｍｉｃａｌＳｏｃｉｅｔｙ１３６（４９），１６９５８−１６９６１に関連して記載される、ＧａｌＮＡｃを使用してもよく、本開示のＣａｓＹポリペプチド、本開示のＣａｓＹ融合ポリペプチド、本開示のＲＮＰ、本開示の核酸、または本開示のＣａｓＹシステムの標的細胞への送達に、これを使用することができる。

場合によって、脂質ナノ粒子（ＬＮＰ）を、本開示のＣａｓＹポリペプチド、本開示のＣａｓＹ融合ポリペプチド、本開示のＲＮＰ、本開示の核酸、または本開示のＣａｓＹシステムの標的細胞への送達に使用することができる。ＲＮＡなどの負電荷ポリマーは、イオン性脂質が正電荷を示すような低ｐＨ値（例えば、ｐＨ４）でＬＮＰに充填することができる。しかしながら、生理的ｐＨ値では、ＬＮＰは、循環時間が長いと共溶性となる低表面電荷を示す。４種のイオン性カチオン性脂質、すなわち、１，２−ジリノレイル−３−ジメチルアンモニウム−プロパン（ＤＬｉｎＤＡＰ）、１，２−ジリノレイルオキシ−３−Ｎ，Ｎ−ジメチルアミノプロパン（ＤＬｉｎＤＭＡ）、１，２−ジリノレイルオキシ−ケト−Ｎ，Ｎ−ジメチル−３−アミノプロパン（ＤＬｉｎＫＤＭＡ）、及び１，２−ジリノレイル−４−（２−ジメチルアミノエチル）−［１，３］−ジオキソラン（ＤＬｉｎＫＣ２−ＤＭＡ）が注目されている。ＬＮＰの調製については、Ｒｏｓｉｎｅｔａｌ．（２０１１）ＭｏｌｅｃｕｌａｒＴｈｅｒａｐｙ１９：１２８６−２２００）に記載されている。カチオン性脂質、１，２−ジリノレイル−３−ジメチルアンモニウム−プロパン（ＤＬｉｎＤＡＰ）、１，２−ジリノレイルオキシ−３−Ｎ，Ｎ−ジメチルアミノプロパン（ＤＬｉｎＫ−ＤＭＡ）、１，２−ジリノレイル−４−（２−ジメチルアミノエチル）−［１，３］−ジオキソラン（ＤＬｉｎＫＣ２−ＤＭＡ）、（３−ｏ−［２”−（メトキシポリエチレングリコール２０００）スクシノイル］−１，２−ジミリストイル−ｓｎ−グリコール（ＰＥＧ−Ｓ−ＤＭＧ）、及びＲ−３−［（オメガ−メトキシ−ポリ（エチレングリコール）２０００）カルバモイル］−１，２−ジミリスチルオキシプロピル−３−アミン（ＰＥＧ−Ｃ−ＤＯＭＧ）を使用してもよい。核酸（例えば、ＣａｓＹガイドＲＮＡ；本開示の核酸など）をＤＬｉｎＤＡＰ、ＤＬｉｎＤＭＡ、ＤＬｉｎＫ−ＤＭＡ、及びＤＬｉｎＫＣ２−ＤＭＡを含有するＬＮＰ（モル比４０：１０：４０：１０のカチオン性脂質：ＤＳＰＣ：ＣＨＯＬ：ＰＥＧ−ＤＭＧまたはＰＥＧ−Ｃ−ＤＯＭＧ）に封入してもよい。場合によって、０．２％のＳＰ−ＤｉＯＣ１８が組み込まれる。

ＳｐｈｅｒｉｃａｌＮｕｃｌｅｉｃＡｃｉｄ（ＳＮＡ（商標））構築物及び他のナノ粒子（特に金ナノ粒子）を、本開示のＣａｓＹポリペプチド、本開示のＣａｓＹ融合ポリペプチド、本開示のＲＮＰ、本開示の核酸、または本開示のＣａｓＹシステムの標的細胞への送達に使用することができる。例えば、Ｊ．Ａｍ．Ｃｈｅｍ．Ｓｏｃ．２０１１１３３：９２５４−９２５７、Ｈａｏｅｔａｌ．，Ｓｍａｌｌ．２０１１７：３１５８−３１６２、Ｚｈａｎｇｅｔａｌ．，ＡＣＳＮａｎｏ．２０１１５：６９６２−６９７０、Ｃｕｔｌｅｒｅｔａｌ．，Ｊ．Ａｍ．Ｃｈｅｍ．Ｓｏｃ．２０１２１３４：１３７６−１３９１、Ｙｏｕｎｇｅｔａｌ．，ＮａｎｏＬｅｔｔ．２０１２１２：３８６７−７１、Ｚｈｅｎｇｅｔａｌ．，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ．２０１２１０９：１１９７５−８０，Ｍｉｒｋｉｎ，Ｎａｎｏｍｅｄｉｃｉｎｅ２０１２７：６３５−６３８、Ｚｈａｎｇｅｔａｌ．，Ｊ．Ａｍ．Ｃｈｅｍ．Ｓｏｃ．２０１２１３４：１６４８８−１６９１，Ｗｅｉｎｔｒａｕｂ，Ｎａｔｕｒｅ２０１３４９５：Ｓ１４−Ｓ１６、Ｃｈｏｉｅｔａｌ．，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ．２０１３１１０（１９）：７６２５−７６３０、Ｊｅｎｓｅｎｅｔａｌ．，Ｓｃｉ．Ｔｒａｎｓｌ．Ｍｅｄ．５，２０９ｒａ１５２（２０１３）、及びＭｉｒｋｉｎ，ｅｔａｌ．，Ｓｍａｌｌ，１０：１８６−１９２を参照のこと。

ＲＮＡを含む自己組織化ナノ粒子は、ポリエチレングリコール（ＰＥＧ）の遠位端に結合されたＡｒｇ−Ｇｌｙ−Ａｓｐ（ＲＧＤ）ペプチドリガンドでＰＥＧ化されたポリエチレンイミン（ＰＥＩ）を用いて構築することができる。

一般に、「ナノ粒子」とは、１０００ｎｍ未満の直径を有する任意の粒子を指す。場合によって、本開示のＣａｓＹポリペプチド、本開示のＣａｓＹ融合ポリペプチド、本開示のＲＮＰ、本開示の核酸、または本開示のＣａｓＹシステムの標的細胞への送達に使用するのに適したナノ粒子は、５００ｎｍ以下、例えば、２５ｎｍ〜３５ｎｍ、３５ｎｍ〜５０ｎｍ、５０ｎｍ〜７５ｎｍ、７５ｎｍ〜１００ｎｍ、１００ｎｍ〜１５０ｎｍ、１５０ｎｍ〜２００ｎｍ、２００ｎｍ〜３００ｎｍ、３００ｎｍ〜４００ｎｍ、または４００ｎｍ〜５００ｎｍの直径を有する。場合によって、本開示のＣａｓＹポリペプチド、本開示のＣａｓＹ融合ポリペプチド、本開示のＲＮＰ、本開示の核酸、または本開示のＣａｓＹシステムの標的細胞への送達に使用するのに適したナノ粒子は、２５ｎｍ〜２００ｎｍの直径を有する。場合によって、本開示のＣａｓＹポリペプチド、本開示のＣａｓＹ融合ポリペプチド、本開示のＲＮＰ、本開示の核酸、または本開示のＣａｓＹシステムの標的細胞への送達に使用するのに適したナノ粒子は、１００ｎｍ以下の直径を有する。場合によって、本開示のＣａｓＹポリペプチド、本開示のＣａｓＹ融合ポリペプチド、本開示のＲＮＰ、本開示の核酸、または本開示のＣａｓＹシステムの標的細胞への送達に使用するのに適したナノ粒子は、３５ｎｍ〜６０ｎｍの直径を有する。

本開示のＣａｓＹポリペプチド、本開示のＣａｓＹ融合ポリペプチド、本開示のＲＮＰ、本開示の核酸、または本開示のＣａｓＹシステムの標的細胞への送達に使用するのに適したナノ粒子は、例えば、固体ナノ粒子（例えば、銀、金、鉄、チタンなどの金属、非金属、脂質ベースの固体、ポリマー）、ナノ粒子の懸濁液、またはそれらの組み合わせのような異なる形態で提供することができる。ハイブリッド構造（例えば、コア−シェルナノ粒子）とならび、金属、誘電体、及び半導体ナノ粒子を作製してもよい。また、電子エネルギー準位の量子化が起きるほどナノ粒子が小さい（通常は１０ｎｍより小さい）場合、半導体材料で作製されたナノ粒子を標識化量子ドットにすることができる。そのようなナノスケール粒子は、薬物担体または造影剤といった生物医学用途に使用され、本開示における同様の目的に応用することができる。

半固体及びソフトナノ粒子もまた、本開示のＣａｓＹポリペプチド、本開示のＣａｓＹ融合ポリペプチド、本開示のＲＮＰ、本開示の核酸、または本開示のＣａｓＹシステムの標的細胞への送達に使用するのに適している。典型的な半固体性質のナノ粒子がリポソームである。

場合によって、本開示のＣａｓＹポリペプチド、本開示のＣａｓＹ融合ポリペプチド、本開示のＲＮＰ、本開示の核酸、または本開示のＣａｓＹシステムの標的細胞への送達に、エクソソームが使用される。エクソソームは、ＲＮＡ及びタンパク質を運搬して、脳及び他の標的器官にＲＮＡを送達することができる内因性ナノ小胞である。

場合によって、本開示のＣａｓＹポリペプチド、本開示のＣａｓＹ融合ポリペプチド、本開示のＲＮＰ、本開示の核酸、または本開示のＣａｓＹシステムの標的細胞への送達に、リポソームが使用される。リポソームは、内部の水性区画を取り巻く単層または多層脂質二重層と、比較的不透過性である外側の親油性リン脂質二重層で構成される球状小胞構造体である。リポソームは、いくつかの異なる種類の脂質から作製できるが、リン脂質がリポソームの作製に最もよく使用される。脂質膜を水溶液と混合すると、リポソーム形成が自発的に起こるが、ホモジナイザー、ソニケーター、または押出成形装置を使用して振盪という形で力を加えることによりリポソーム形成を促進することもできる。いくつかの他の添加剤をリポソームに添加して、その構造及び特性を改質することができる。例えば、コレステロールまたはスフィンゴミエリンのいずれかをリポソーム混合物に添加すると、リポソーム構造の安定化、及びリポソーム内の積荷の漏出防止に役立てることができる。リポソーム製剤は主に、１，２−ジステアロリル−ｓｎ−グリセロ−３−ホスファチジルコリン（ＤＳＰＣ）、スフィンゴミエリン、卵ホスファチジルコリン、及びモノシアロガングリオシドのような天然のリン脂質及び脂質で構成することができる。

安定な核酸−脂質粒子（ＳＮＡＬＰ）を、本開示のＣａｓＹポリペプチド、本開示のＣａｓＹ融合ポリペプチド、本開示のＲＮＰ、本開示の核酸、または本開示のＣａｓＹシステムの標的細胞への送達に使用することができる。ＳＮＡＬＰ製剤は、脂質３−Ｎ−［（メトキシポリ（エチレングリコール）２０００）カルバモイル］−１，２−ジミリスチルオキシ−プロピルアミン（ＰＥＧ−Ｃ−ＤＭＡ）、１，２−ジリノレイルオキシ−Ｎ，Ｎ−ジメチル−３−アミノプロパン（ＤＬｉｎＤＭＡ）、１，２−ジステアロイル−ｓｎ−グリセロ−３−ホスホコリン（ＤＳＰＣ）、及びコレステロールを、モル比２：４０：１０：４８で含有し得る。ＳＮＡＬＰリポソームは、２５：１の脂質／ｓｉＲＮＡ比、及び４８／４０／１０／２のコレステロール／Ｄ−Ｌｉｎ−ＤＭＡ／ＤＳＰＣ／ＰＥＧ−Ｃ−ＤＭＡモル比を使用して、Ｄ−Ｌｉｎ−ＤＭＡ及びＰＥＧ−Ｃ−ＤＭＡを、ジステアロイルホスファチジルコリン（ＤＳＰＣ）、コレステロール、及びｓｉＲＮＡとともに製剤化することによって調製することができる。得られるＳＮＡＬＰリポソームは、大きさが約８０〜１００ｎｍであり得る。ＳＮＡＬＰは、合成コレステロール（Ｓｉｇｍａ−Ａｌｄｒｉｃｈ，ＳｔＬｏｕｉｓ，Ｍｏ．，ＵＳＡ）、ジパルミトイルホスファチジルコリン（ＡｖａｎｔｉＰｏｌａｒＬｉｐｉｄｓ，Ａｌａｂａｓｔｅｒ，Ａｌａ．，ＵＳＡ）、３−Ｎ−［（ｗ−メトキシポリ（エチレングリコール）２０００）カルバモイル］−１，２−ジミリスチルオキシプロピルアミン、及びカチオン性１，２−ジリノレイルオキシ−３−Ｎ，Ｎジメチルアミノプロパンを含んでもよい。ＳＮＡＬＰは、合成コレステロール（Ｓｉｇｍａ−Ａｌｄｒｉｃｈ）、１，２−ジステアロイル−ｓｎ−グリセロ−３−ホスホコリン（ＤＳＰＣ；ＡｖａｎｔｉＰｏｌａｒＬｉｐｉｄｓＩｎｃ．）、ＰＥＧ−ｃＤＭＡ、及び１，２−ジリノレイルオキシ−３−（Ｎ；Ｎ−ジメチル）アミノプロパン（ＤＬｉｎＤＭＡ）を含んでもよい。

アミノ脂質２，２−ジリノレイル−４−ジメチルアミノエチル−［１，３］−ジオキソラン（ＤＬｉｎ−ＫＣ２−ＤＭＡ）のような他のカチオン性脂質を、本開示のＣａｓＹポリペプチド、本開示のＣａｓＹ融合ポリペプチド、本開示のＲＮＰ、本開示の核酸、または本開示のＣａｓＹシステムの標的細胞への送達に使用することができる。以下の脂質組成物：それぞれ４０／１０／４０／１０モル比のアミノ脂質、ジステアロイルホスファチジルコリン（ＤＳＰＣ）、コレステロール、及び（Ｒ）−２，３−ビス（オクタデシルオキシ）プロピル−１−（メトキシポリ（エチレングリコール）２０００）プロピルカルバメート（ＰＥＧ脂質）、ならびに総脂質比が約０．０５（ｗ／ｗ）のＦＶＩＩｓｉＲＮＡを用いた予備成形小胞を企図することができる。７０〜９０ｎｍの範囲の狭い粒度分布及び０．１１±０．０４（ｎ＝５６）の低い多分散指数を確保するために、ガイドＲＮＡを添加する前に、最大３回、８０ｎｍ膜を通して押し出してもよい。極めて強力なアミノ脂質１６を含有する粒子を使用してもよく、その場合、１６、ＤＳＰＣ、コレステロール、及びＰＥＧ脂質という４つの脂質成分のモル比（５０／１０／３８．５／１．５）をさらに最適化して、ｉｎｖｉｖｏ活性を増強することができる。

本開示のＣａｓＹシステムまたはその構成要素（複数可）またはそれをコードする核酸と脂質を製剤化して、脂質ナノ粒子（ＬＮＰ）を形成してもよい。好適な脂質として、限定はされないが、ＤＬｉｎ−ＫＣ２−ＤＭＡ４、Ｃ１２−２００及び補脂質ジステロイルホスファチジルコリン、コレステロール、ならびにＰＥＧ−ＤＭＧが挙げられ、自発的な小胞形成手順を用いて本開示のＣａｓＹシステムまたはその構成要素と製剤化することができる。成分のモル比は、約５０／１０／３８．５／１．５（ＤＬｉｎ−ＫＣ２−ＤＭＡまたはＣ１２−２００／ジステロイルホスファチジルコリン／コレステロール／ＰＥＧ−ＤＭＧ）であり得る。

本開示のＣａｓＹシステム、またはその構成要素は、米国公開出願第２０１３０２５２２８１号及び第２０１３０２４５１０７号及び第２０１３０２４４２７９号にさらに記載されるようなＰＬＧＡマイクロスフィアに封入して送達することができる。

超荷電タンパク質を、本開示のＣａｓＹポリペプチド、本開示のＣａｓＹ融合ポリペプチド、本開示のＲＮＰ、本開示の核酸、または本開示のＣａｓＹシステムの標的細胞への送達に使用することができる。超荷電タンパク質とは、異常に高い正または負の正味理論電荷を有する、遺伝子操作されたタンパク質または天然タンパク質のクラスである。超負荷電のタンパク質と超正荷電のタンパク質はいずれも、熱的または化学的に誘発される凝集に耐える能力を示す。超正荷電のタンパク質はまた、哺乳動物細胞を透過することができる。このようなタンパク質、例えばプラスミドＤＮＡ、ＲＮＡ、または他のタンパク質と積荷を会合することで、ｉｎｖｉｔｒｏとｉｎｖｉｖｏとの両方で、このような巨大分子の哺乳動物細胞への機能的送達を可能にすることができる。

細胞透過性ペプチド（ＣＰＰ）を、本開示のＣａｓＹポリペプチド、本開示のＣａｓＹ融合ポリペプチド、本開示のＲＮＰ、本開示の核酸、または本開示のＣａｓＹシステムの標的細胞への送達に使用することができる。ＣＰＰは通常、リジンまたはアルギニンのような正荷電アミノ酸が、高い相対存在量で含まれているか、または極性／荷電アミノ酸と非極性の疎水性アミノ酸の交互パターンを含む配列を有しているアミノ酸組成物を有する。

本開示のＣａｓＹポリペプチド、本開示のＣａｓＹ融合ポリペプチド、本開示のＲＮＰ、本開示の核酸（例えば、ＣａｓＹガイドＲＮＡ、ＣａｓＹガイドＲＮＡをコードする核酸、ＣａｓＹポリペプチドをコードする核酸、ドナー鋳型など）、または本開示のＣａｓＹシステムを、標的細胞（例えば、ｉｎｖｉｖｏの標的細胞。その場合の標的細胞とは、血中の標的細胞、組織内の標的細胞、器官内の標的細胞などである）に送達するために埋込型装置を使用することができる。本開示のＣａｓＹポリペプチド、本開示のＣａｓＹ融合ポリペプチド、本開示のＲＮＰ、本開示の核酸、または本開示のＣａｓＹシステムの、標的細胞（例えば、ｉｎｖｉｖｏの標的細胞。その場合の標的細胞とは、血中の標的細胞、組織内の標的細胞、器官内の標的細胞などである）への送達に使用するのに適した埋込型装置には、ＣａｓＹポリペプチド、ＣａｓＹ融合ポリペプチド、ＲＮＰ、またはＣａｓＹシステム（またはその構成要素、例えば本開示の核酸）を含む容器（例えば、リザーバー、マトリックスなど）を含み得る。

好適な埋込型装置には、例えば装置本体として使用される、マトリックスなどのポリマー基材、及び場合によって金属または追加のポリマーなどの追加の足場材料、及び可視化能及びイメージングを向上させる材料を含み得る。埋込型の送達装置は、局所的かつ長期間にわたる放出をもたらす際に有利となる可能性があり、送達されるポリペプチド及び／または核酸が、標的部位、例えば細胞外マトリックス（ＥＣＭ）、腫瘍周囲の血管系、罹患組織などに直接放出される。好適な埋込型の送達装置として、薬物送達系が固定されないまたは取り付けられない、腹腔などの腔への送達及び／または他の任意の種類の投与に使用する際に適しており、生体安定性及び／または分解性及び／または生体吸収性のポリマー基材（例えば必要に応じてマトリックスであってよい）を含む装置が挙げられる。場合によって、好適な埋込型の薬物送達装置は、分解性ポリマーを含み、主要な放出メカニズムがバルク崩壊である。場合によって、好適な埋込型の薬物送達装置は、非分解性または遅分解性ポリマーを含み、主要な放出メカニズムがバルク崩壊ではなく拡散であり、それによって、外側部分は膜として機能し、かつ内側部分は薬物リザーバーとして機能し、実質的に長期間（例えば、約１週間〜約数か月間）周囲の影響を受けない。放出メカニズムが異なる別のポリマーの組み合わせも必要に応じて使用することができる。全放出期間のかなりの期間にわたって濃度勾配を事実上、一定に維持することができるため、拡散速度が事実上、一定である（「ゼロモード」拡散と称する）。「一定」という用語は、治療有効性の下限を超えて維持されるが、さらに必要に応じて初期バーストを特徴とする場合がある拡散速度、及び／または変動する、例えばある程度まで増減する場合がある拡散速度を意味する。拡散速度は長期間にわたってそのように維持することができ、治療有効期間、例えば有効サイレンシング期間を最適化するような、ある水準までを一定とみなすことができる。

場合によって、埋込型の送達系は、ヌクレオチドを用いた治療薬を分解から保護するように設計される。分解は、本質的に化学的であるか、または対象の体内の酵素及び他の因子からの攻撃に起因するかを問わない。

装置の埋込部位、すなわち標的部位は、最大の治療効果を得るように選択することができる。例えば、送達装置は、腫瘍環境内もしくは腫瘍環境付近、または腫瘍に関連する血液供給源に埋め込むことができる。標的位置は、例えば、１）パーキンソン病またはアルツハイマー病での大脳基底核、白質及び灰白質のような変性部位の脳；２）（筋萎縮性側索硬化症（ＡＬＳ）の場合のような）脊椎；３）子宮頸部；４）活動性及び慢性炎症性関節；５）（乾癬の場合のような）真皮；７）交感神経及び感覚神経部位（鎮痛効果のため）；７）骨；８）急性または慢性感染部位；９）膣内；１０）内耳−聴覚系、内耳迷路、前庭系；１１）気管内；１２）心臓内；冠動脈、心外膜；１３）尿路または膀胱；１４）胆管系；１５）腎臓、肝臓、脾臓を含むが、これに限定されない実質組織；１６）リンパ節；１７）唾液腺；１８）歯肉；１９）関節内（関節内部）；２０）眼内；２１）脳組織；２２）脳室；２３）腹腔を含む腔（例えば限定されないが、卵巣癌の場合）；２４）食道内；及び２５）直腸内；ならびに２６）血管系内部であり得る。

他の種類の組織埋込及び／または挿入及び／または組織のサンプリングのために、埋込などの挿入方法を必要に応じて予め使用することができる。場合により、そのような方法に変更を加えずに、または必要に応じて重要でない変更のみを加えて代替的に使用してもよい。そのような方法には場合により、小線源治療法、生検、超音波を用いる及び／または用いない内視鏡法、例えば脳組織への定位法、腹腔鏡手術（関節、腹部臓器、膀胱壁、及び体腔への腹腔鏡の挿入を含む）を含むが、これらに限定されない。

改変宿主細胞
本開示は、本開示のＣａｓＹポリペプチド、及び／または本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列を含む核酸を含む改変細胞を提供する。本開示は、本開示のＣａｓＹポリペプチドを含む改変細胞であり、通常は本開示のＣａｓＹポリペプチドを含んでいない細胞である改変細胞を提供する。本開示は、本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列を含む核酸を含む改変細胞（例えば遺伝子改変細胞）を提供する。本開示は、本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列を含むｍＲＮＡで遺伝子改変された遺伝子改変細胞を提供する。本開示は、本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列を含む組換え発現ベクターで遺伝子改変された遺伝子改変細胞を提供する。本開示は、ａ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列；及びｂ）本開示のＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む組換え発現ベクターで遺伝子改変された遺伝子改変細胞を提供する。本開示は、ａ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列；ｂ）本開示のＣａｓＹガイドＲＮＡをコードするヌクレオチド配列；及びｃ）ドナー鋳型をコードするヌクレオチド配列を含む組換え発現ベクターで遺伝子改変された遺伝子改変細胞を提供する。

本開示のＣａｓＹポリペプチド、及び／または本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列を含む核酸、及び／または本開示のＣａｓＹガイドＲＮＡのレシピエントの役割を果たす細胞は、例えば、ｉｎｖｉｔｒｏの細胞；ｉｎｖｉｖｏの細胞；ｅｘｖｉｖｏの細胞；初代細胞；がん細胞；動物細胞；植物細胞；藻類細胞；真菌細胞などを含む、種々の細胞のいずれかであり得る。本開示のＣａｓＹポリペプチド、及び／または本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列を含む核酸、及び／または本開示のＣａｓＹガイドＲＮＡのレシピエントの役割を果たす細胞を、「宿主細胞」または「標的細胞」と称する。宿主細胞または標的細胞は、本開示のＣａｓＹシステムのレシピエントであってよい。宿主細胞または標的細胞は、本開示のＣａｓＹＲＮＰのレシピエントであってよい。宿主細胞または標的細胞は、本開示のＣａｓＹシステムの単一構成要素のレシピエントであってよい。

細胞（標的細胞）の非限定的な例として、原核細胞、真核細胞、細菌細胞、古細菌細胞、単細胞真核生物の細胞、原生動物細胞、植物由来細胞（例えば、作物（植物）、果実、野菜、穀物、大豆、トウモロコシ（ｃｏｒｎ、ｍａｉｚｅ）、小麦、種子、トマト、イネ、キャッサバ、サトウキビ、カボチャ、干し草、ジャガイモ、綿、大麻、タバコ、顕花植物、針葉樹、裸子植物、被子植物、シダ類、ヒカゲノカズラ類、ツノゴケ類、ゼニゴケ類、セン類、双子葉植物、単子葉植物など由来の細胞）、藻類細胞（例えば、Ｂｏｔｒｙｏｃｏｃｃｕｓｂｒａｕｎｉｉ、Ｃｈｌａｍｙｄｏｍｏｎａｓｒｅｉｎｈａｒｄｔｉｉ、Ｎａｎｎｏｃｈｌｏｒｏｐｓｉｓｇａｄｉｔａｎａ、Ｃｈｌｏｒｅｌｌａｐｙｒｅｎｏｉｄｏｓａ、Ｓａｒｇａｓｓｕｍｐａｔｅｎｓ、Ｃ．ａｇａｒｄｈなど）、海藻（例えばケルプ）、真菌細胞（例えば、酵母細胞、キノコ由来の細胞）、動物細胞、無脊椎動物（例えば、ショウジョウバエ、刺胞動物、棘皮動物、線虫など）由来の細胞、脊椎動物（例えば、魚類、両生類、爬虫類、鳥類、哺乳類）由来の細胞、哺乳動物（例えば、有蹄類（例えば、ブタ、ウシ、ヤギ、ヒツジ）；齧歯類（例えば、ラット、マウス）；非ヒト霊長類；ヒト；ネコ科動物（例えば、ネコ）；イヌ科動物（例えば、イヌ）など）由来の細胞などが挙げられる。場合によって、細胞は、天然の生物に由来しない細胞である（例えば、細胞は、合成的に作製された細胞であり得る：これは人工細胞とも呼ばれる）。

細胞はｉｎｖｉｔｒｏの細胞（例えば、樹立培養細胞株）であってよい。細胞はｅｘｖｉｖｏの細胞（個体由来の培養細胞）であってよい。細胞はｉｎｖｉｖｏの細胞（例えば、個体内の細胞）であってよい。細胞は単離細胞であってよい。細胞は生物の体内細胞であってよい。細胞は生物であってよい。細胞は細胞培養物（例えば、ｉｎｖｉｔｒｏの細胞培養物）中の細胞であってよい。細胞は細胞の集合のうちの１つであってよい。細胞は、原核細胞であっても、または原核細胞に由来するものであってもよい。細胞は、細菌細胞であっても、または細菌細胞に由来するものであってもよい。細胞は、古細菌細胞であっても、または古細菌細胞に由来するものであってもよい。細胞は、真核細胞であっても、または真核細胞に由来するものであってもよい。細胞は、植物細胞であっても、または植物細胞に由来するものであってもよい。細胞は、動物細胞であっても、または動物細胞に由来するものであってもよい。細胞は、無脊椎動物細胞であっても、または無脊椎動物細胞に由来するものであってもよい。細胞は、脊椎動物細胞であっても、または脊椎動物細胞に由来するものであってもよい。細胞は、哺乳動物細胞であっても、または哺乳動物細胞に由来するものであってもよい。細胞は、齧歯類細胞であっても、または齧歯類細胞に由来するものであってもよい。細胞は、ヒト細胞であっても、またはヒト細胞に由来するものであってもよい。細胞は、微生物細胞であっても、または微生物細胞に由来するものであってもよい。細胞は、真菌細胞であっても、または真菌細胞に由来するものであってもよい。細胞は昆虫細胞であってよい。細胞は節足動物細胞であってよい。細胞は原生動物細胞であってよい。細胞は蠕虫細胞であってよい。

好適な細胞として、幹細胞（例えば、胚性幹（ＥＳ）細胞、人工多能性幹（ｉＰＳ）細胞）；生殖細胞（例えば、卵母細胞、精子、卵原細胞、精原細胞など）；体細胞、例えば線維芽細胞、オリゴデンドロサイト、グリア細胞、造血細胞、ニューロン、筋肉細胞、骨細胞、肝細胞、膵臓細胞などが挙げられる。

好適な細胞として、ヒト胚性幹細胞、胎児心筋細胞、筋線維芽細胞、間葉系幹細胞、自家移植拡張心筋細胞、脂肪細胞、全能性細胞、多能性細胞、血液幹細胞、筋芽細胞、成体幹細胞、骨髄細胞、間葉系細胞、胚性幹細胞、実質細胞、上皮細胞、内皮細胞、中皮細胞、線維芽細胞、骨芽細胞、軟骨細胞、外因性細胞、内因性細胞、幹細胞、造血幹細胞、骨髄由来前駆細胞、心筋細胞、骨格細胞、胎児細胞、未分化細胞、多能性前駆細胞、単能性前駆細胞、単球、心筋芽細胞、骨格筋芽細胞、マクロファージ、毛細血管内皮細胞、異種細胞、同種細胞、及び出生後幹細胞が挙げられる。

場合によって細胞は、免疫細胞、ニューロン、上皮細胞、及び内皮細胞、または幹細胞である。場合によって、免疫細胞は、Ｔ細胞、Ｂ細胞、単球、ナチュラルキラー細胞、樹状細胞、またはマクロファージである。場合によって、免疫細胞は細胞傷害性Ｔ細胞である。場合によって、免疫細胞はヘルパーＴ細胞である。場合によって、免疫細胞は制御性Ｔ細胞（Ｔｒｅｇ）である。

場合によって、細胞は幹細胞である。幹細胞には成体幹細胞を含む。成体幹細胞は、体性幹細胞とも呼ばれる。

成体幹細胞は、分化組織に常在しているが、自己再生及び複数の細胞型（通常は、幹細胞が見られる組織に特有の細胞型）の発生能といった特性を保有する。体性幹細胞の多数の例が、当業者に知られており、これには、筋幹細胞；造血幹細胞；上皮幹細胞；神経幹細胞；間葉系幹細胞；乳腺幹細胞；腸管幹細胞；中胚葉幹細胞；内皮幹細胞；嗅覚幹細胞；神経堤幹細胞などが含まれる。

対象となる幹細胞には哺乳動物の幹細胞を含むが、その場合の用語「哺乳動物」とは、哺乳動物として分類されるいずれかの動物を指し、ヒト；非ヒト霊長類；家畜及び農場動物；ならびに動物園の動物、実験動物、競技用動物、または愛玩動物、例えば、イヌ、ウマ、ネコ、ウシ、マウス、ラット、ウサギなどを含む。場合によって、幹細胞はヒト幹細胞である。場合によって、幹細胞は齧歯類（例えばマウス；ラット）幹細胞である。場合によって、幹細胞は非ヒト霊長類の幹細胞である。

幹細胞は、１つ以上の幹細胞マーカー、例えば、ＳＯＸ９、ＫＲＴ１９、ＫＲＴ７、ＬＧＲ５、ＣＡ９、ＦＸＹＤ２、ＣＤＨ６、ＣＬＤＮ１８、ＴＳＰＡＮ８、ＢＰＩＦＢ１、ＯＬＦＭ４、ＣＤＨ１７、及びＰＰＡＲＧＣ１Ａを発現することができる。

いくつかの実施形態では、幹細胞は造血幹細胞（ＨＳＣ）である。ＨＳＣは、骨髄、血液、臍帯血、胎児肝、及び卵黄嚢から単離することができる中胚葉由来の細胞である。ＨＳＣは、ＣＤ３４⁺ 及びＣＤ３^- を特徴とする。ＨＳＣは、ｉｎｖｉｖｏの赤血球、好中球マクロファージ、巨核球、及びリンパ系の造血細胞株を再増殖することができる。ｉｎｖｉｔｒｏで、少なくともいくつかの自己再生細胞分裂を受けるようにＨＳＣを誘導することができ、ｉｎｖｉｖｏで見られるものと同じ系統へと分化するようにＨＳＣを誘導することができる。したがって、ＨＳＣは赤血球系細胞、巨核球、好中球、マクロファージ、及びリンパ系細胞のうち１つ以上に分化するように誘導することができる。

他の実施形態では、幹細胞は神経幹細胞（ＮＳＣ）である。神経幹細胞（ＮＳＣ）は、ニューロン及びグリア（オリゴデンドロサイト及びアストロサイトを含む）に分化することができる。神経幹細胞は、多様な分化が可能な多能性幹細胞であり、特定の条件下で、神経幹細胞である娘細胞、または神経芽細胞またはグリア芽細胞となり得る神経前駆細胞、例えば、それぞれ１つ以上の種類のニューロン及びグリア細胞となることが約束された細胞を産生することができる。ＮＳＣの入手方法は、当技術分野において公知である。

他の実施形態では、幹細胞は間葉系幹細胞（ＭＳＣ）である。ＭＳＣは本来、胚中胚葉に由来し、成体骨髄から単離され、分化して筋肉、骨、軟骨、脂肪、骨髄間質、及び腱を形成することができる。ＭＳＣの単離方法は当技術分野で公知であり、任意の公知の方法を使用してＭＳＣを得ることができる。例えば、ヒトＭＳＣの単離について記載している米国特許第５，７３６，３９６号を参照のこと。

細胞は場合によって植物細胞である。植物細胞は、単子葉植物の細胞であってよい。細胞は、双子葉植物の細胞であってよい。

場合によって、細胞は植物細胞である。例えば、細胞は、主要な農業植物、例えば、大麦、豆（食用乾燥）、キャノーラ、トウモロコシ、綿（ピマ）、綿（高地）、亜麻仁、干し草（アルファルファ）、干し草（アルファルファ以外）、カラスムギ、ピーナッツ、イネ、モロコシ、大豆、テンサイ、サトウキビ、ヒマワリ（油）、ヒマワリ（油以外）、サツマイモ、タバコ（バーレー種）、タバコ（熱風乾燥）、トマト、小麦（デュラム）、小麦（春）、小麦（冬）などの細胞であり得る。別の例として、細胞は、野菜作物の細胞であり、限定されないが、例えば、アルファルファもやし、アロエの葉、クズウコン、クワイ、アーティチョーク、アスパラガス、タケノコ、バナナの花、モヤシ、豆、ビート茎葉部、ビート、ニガウリ、チンゲンサイ、ブロッコリー、ブロッコリーレイブ（ラピニ）、芽キャベツ、キャベツ、キャベツスプラウト、サボテンの葉（ノパレス）、ヒョウタン、カルドン、ニンジン、カリフラワー、セロリ、ハヤトウリ、チョロギ（クローヌ）、白菜、キンサイ、ニラ、サイシン、キクナ（春菊）、コラード若葉、トウモロコシの茎、スイートコーン、キュウリ、ダイコン、タンポポの葉、タロイモ、豆苗（エンドウ若葉）、トウガン（冬瓜）、ナス、エンダイブ、キクヂシャ、ゼンマイシダ、グンバイナズナ、チコリ、ガイチョイ（芥菜）、ガイラン、ガランガ（シャム、タイショウガ）、ニンニク、ショウガの根、ゴボウ、緑色野菜、ハノーバーサラダの葉、ウアウソントレ、キクイモ、ヒカマ、ケールの葉、コールラビ、シロザ（アマランサス）、レタス（ビブ）、レタス（ボストン）、レタス（ボストンレッド）、レタス（グリーンリーフ）、レタス（アイスバーグ）、レタス（ロロロッサ）、レタス（オークリーフグリーン）、レタス（オークリーフレッド）、レタス（加工）、レタス（レッドリーフ）、レタス（ロメイン）、レタス（ルビーロメイン）、レタス（ロシアンレッドマスタード）、ヒシの実、ロボク、ササゲ、レンコン、ノヂシャ、リュウゼツラン（アガーベ）の葉、タロイモ、メスキュランミックス、ミズナ、モープ（ｍｏａｐ）（ヘチマ）、ムー、マクア（ファジースカッシュ）、マッシュルーム、マスタード、ナガイモ、オクラ、空心菜、九条ネギ、オポ（ロングスカッシュ）、観賞用トウモロコシ、観賞用ヒョウタン、パセリ、パースニップ、エンドウマメ、トウガラシ（ベルタイプ）、トウガラシ、カボチャ、エンダイブ、カイワレナ、ラディッシュ、アブラナ、アブラナ、ルバーブ、ロメイン（ベイビーレッド）、ルタバガ、アッケシソウ（シービーンズ）、ヘチオク（トカド／十角ヘチマ）、ホウレンソウ、スクオッシュ、ストローベイル、サトウキビ、サツマイモ、スイスチャード、タマリンド、タロイモ、タロイモの葉、タロイモの茎、ターサイ、テペグアヘ（グアヘ）、ティンドラ、トマティーヨ、トマト、トマト（チェリー）、トマト（グレープ種）、トマト（プラム種）、ターメリック、カブ上菜、カブ、オオクログワイ、ヤンピ、ヤムイモ（ナメス）、ユーチョイ、ユカ（キャッサバ）などを含む。

細胞は、場合によって節足動物細胞である。例えば、細胞は、例えば、Ｃｈｅｌｉｃｅｒａｔａ、Ｍｙｒｉａｐｏｄｉａ、Ｈｅｘｉｐｏｄｉａ、Ａｒａｃｈｎｉｄａ、Ｉｎｓｅｃｔａ、Ａｒｃｈａｅｏｇｎａｔｈａ、Ｔｈｙｓａｎｕｒａ、Ｐａｌａｅｏｐｔｅｒａ、Ｅｐｈｅｍｅｒｏｐｔｅｒａ、Ｏｄｏｎａｔａ、Ａｎｉｓｏｐｔｅｒａ、Ｚｙｇｏｐｔｅｒａ、Ｎｅｏｐｔｅｒａ、Ｅｘｏｐｔｅｒｙｇｏｔａ、Ｐｌｅｃｏｐｔｅｒａ、Ｅｍｂｉｏｐｔｅｒａ、Ｏｒｔｈｏｐｔｅｒａ、Ｚｏｒａｐｔｅｒａ、Ｄｅｒｍａｐｔｅｒａ、Ｄｉｃｔｙｏｐｔｅｒａ、Ｎｏｔｏｐｔｅｒａ、Ｇｒｙｌｌｏｂｌａｔｔｉｄａｅ、Ｍａｎｔｏｐｈａｓｍａｔｉｄａｅ、Ｐｈａｓｍａｔｏｄｅａ、Ｂｌａｔｔａｒｉａ、Ｉｓｏｐｔｅｒａ、Ｍａｎｔｏｄｅａ、Ｐａｒａｐｎｅｕｒｏｐｔｅｒａ、Ｐｓｏｃｏｐｔｅｒａ、Ｔｈｙｓａｎｏｐｔｅｒａ、Ｐｈｔｈｉｒａｐｔｅｒａ、Ｈｅｍｉｐｔｅｒａ、ＥｎｄｏｐｔｅｒｙｇｏｔａもしくはＨｏｌｏｍｅｔａｂｏｌａ、Ｈｙｍｅｎｏｐｔｅｒａ、Ｃｏｌｅｏｐｔｅｒａ、Ｓｔｒｅｐｓｉｐｔｅｒａ、Ｒａｐｈｉｄｉｏｐｔｅｒａ、Ｍｅｇａｌｏｐｔｅｒａ、Ｎｅｕｒｏｐｔｅｒａ、Ｍｅｃｏｐｔｅｒａ、Ｓｉｐｈｏｎａｐｔｅｒａ、Ｄｉｐｔｅｒａ、Ｔｒｉｃｈｏｐｔｅｒａ、またはＬｅｐｉｄｏｐｔｅｒａの亜目、科、亜科、属、亜属、または種の細胞であり得る。

細胞は、場合によって昆虫細胞である。例えば、場合によって、細胞は、カ、バッタ、半翅目の昆虫、ハエ、ノミ、ハチ、スズメバチ、アリ、シラミ、ガ、または甲虫の細胞である。

キット
本開示は、本開示のＣａｓＹシステムまたは本開示のＣａｓＹシステムの構成要素を含むキットを提供する。

本開示のキットは、ａ）本開示のＣａｓＹポリペプチド及びＣａｓＹガイドＲＮＡ；ｂ）本開示のＣａｓＹポリペプチド、ＣａｓＹガイドＲＮＡ、及びドナー鋳型核酸；ｃ）本開示のＣａｓＹ融合ポリペプチド及びＣａｓＹガイドＲＮＡ；ｄ）本開示のＣａｓＹ融合ポリペプチド、ＣａｓＹガイドＲＮＡ、及びドナー鋳型核酸；ｅ）本開示のＣａｓＹポリペプチドをコードするｍＲＮＡ及びＣａｓＹガイドＲＮＡ；ｆ）本開示のＣａｓＹポリペプチドをコードするｍＲＮＡ、ＣａｓＹガイドＲＮＡ、及びドナー鋳型核酸；ｇ）本開示のＣａｓＹ融合ポリペプチドをコードするｍＲＮＡ及びＣａｓＹガイドＲＮＡ；ｈ）本開示のＣａｓＹ融合ポリペプチドをコードするｍＲＮＡ、ＣａｓＹガイドＲＮＡ、及びドナー鋳型核酸；ｉ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列及びＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む組換え発現ベクター；ｊ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列、ＣａｓＹガイドＲＮＡをコードするヌクレオチド配列、及びドナー鋳型核酸をコードするヌクレオチド配列を含む組換え発現ベクター；ｋ）本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列及びＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む組換え発現ベクター；ｌ）本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列、ＣａｓＹガイドＲＮＡをコードするヌクレオチド配列、及びドナー鋳型核酸をコードするヌクレオチド配列を含む組換え発現ベクター；ｍ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列を含む第１の組換え発現ベクター、及びＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む第２の組換え発現ベクター；ｎ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列を含む第１の組換え発現ベクター、ならびにＣａｓＹガイドＲＮＡをコードするヌクレオチド配列及びドナー鋳型核酸を含む第２の組換え発現ベクター；ｏ）本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列を含む第１の組換え発現ベクター、及びＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む第２の組換え発現ベクター；ｐ）本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列を含む第１の組換え発現ベクター、ならびにＣａｓＹガイドＲＮＡをコードするヌクレオチド配列及びドナー鋳型核酸を含む第２の組換え発現ベクター；ｑ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列、第１のＣａｓＹガイドＲＮＡをコードするヌクレオチド配列、及び第２のＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む組換え発現ベクター；もしくはｒ）本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列、第１のＣａｓＹガイドＲＮＡをコードするヌクレオチド配列、及び第２のＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む組換え発現ベクター；または（ａ）〜（ｒ）のいずれか１つの何らかの変形例を含み得る。

本開示のキットは、ａ）本開示のＣａｓＹシステムの上記のような構成要素を含んでもよく、または本開示のＣａｓＹシステム；ならびにｂ）例えば、ｉ）緩衝液；ｉｉ）プロテアーゼ阻害剤；ｉｉｉ）ヌクレアーゼ阻害剤；ｉｖ）検出可能な標識を顕色または可視化するために必要な試薬；ｖ）陽性対照及び／または陰性対照の標的ＤＮＡ；ｖｉ）陽性対照及び／または陰性対照のＣａｓＹガイドＲＮＡなどの１つ以上の追加の試薬を含んでもよい。本開示のキットは、ａ）本開示のＣａｓＹシステムの上記のような構成要素を含んでもよく、または本開示のＣａｓＹシステム；及びｂ）治療薬を含んでもよい。

本開示のキットは、ａ）標的核酸内の標的ヌクレオチド配列にハイブリダイズするＣａｓＹガイドＲＮＡの部分をコードするヌクレオチド配列を含む核酸を挿入するための挿入部位；及びｂ）ＣａｓＹガイドＲＮＡのＣａｓＹ結合部分をコードするヌクレオチド配列を含む、組換え発現ベクターを含んでもよい。本開示のキットは、ａ）標的核酸内の標的ヌクレオチド配列にハイブリダイズするＣａｓＹガイドＲＮＡの部分をコードするヌクレオチド配列を含む核酸を挿入するための挿入部位；ｂ）ＣａｓＹガイドＲＮＡのＣａｓＹ結合部分をコードするヌクレオチド配列；及びｃ）本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列を含む、組換え発現ベクターを含んでもよい。

有用性
本開示のＣａｓＹポリペプチドまたは本開示のＣａｓＹ融合ポリペプチドは、（例えば、ＣａｓＹガイドＲＮＡと組み合わせて、場合によってさらにドナー鋳型と組み合わせて）種々の方法に使用することができる。例えば、本開示のＣａｓＹポリペプチドを使用して、（ｉ）標的核酸（ＤＮＡまたはＲＮＡ；一本鎖または二本鎖）を修飾する（例えば、切断、例えばニック；メチル化など）；（ｉｉ）標的核酸の転写を調節する；（ｉｉｉ）標的核酸を標識する；（ｉｖ）（例えば、単離、標識、イメージング、追跡などを目的として）標的核酸に結合する；（ｖ）標的核酸と会合するポリペプチド（例えば、ヒストン）を修飾することなどが可能である。このように、本開示は標的核酸を修飾する方法を提供する。場合によって、標的核酸を修飾するための本開示の方法は、ａ）本開示のＣａｓＹポリペプチド；及びｂ）１つ以上（例えば、２つ）のＣａｓＹガイドＲＮＡと、標的核酸を接触させることを含む。場合によって、標的核酸を修飾するための本開示の方法は、ａ）本開示のＣａｓＹポリペプチド；ｂ）ＣａｓＹガイドＲＮＡ；及びｃ）ドナー核酸（例えばドナー鋳型）と、標的核酸を接触させることを含む。場合によって、接触工程はｉｎｖｉｔｒｏの細胞に行われる。場合によって、接触工程はｉｎｖｉｖｏの細胞に行われる。場合によって、接触工程はｅｘｖｉｖｏの細胞に行われる。

ＣａｓＹポリペプチドを用いる方法には、（会合するＣａｓＹガイドＲＮＡによって、そこを標的とすることにより）標的核酸内の特定の領域にＣａｓＹポリペプチドを結合することを含むため、この方法は一般に、本明細書で結合する方法（例えば、標的核酸を結合する方法）とも称する。しかしながら、結合する方法の結果が標的核酸の結合にしかすぎない場合もあれば、この方法が異なる最終結果をもたらし得る場合もあると理解されるべきである（例えば、この方法は、標的核酸の修飾、例えば切断／メチル化など、標的核酸からの転写の調節；標的核酸の翻訳の調節；ゲノム編集；標的核酸と会合するタンパク質の調節；標的核酸の単離などをもたらし得る）。

好適な方法の例としては、例えば、Ｊｉｎｅｋｅｔａｌ．，Ｓｃｉｅｎｃｅ．２０１２Ａｕｇ１７；３３７（６０９６）：８１６−２１；Ｃｈｙｌｉｎｓｋｉｅｔａｌ．，ＲＮＡＢｉｏｌ．２０１３Ｍａｙ；１０（５）：７２６−３７；Ｍａｅｔａｌ．，ＢｉｏｍｅｄＲｅｓＩｎｔ．２０１３；２０１３：２７０８０５；Ｈｏｕｅｔａｌ．，ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２０１３Ｓｅｐ２４；１１０（３９）：１５６４４−９；Ｊｉｎｅｋｅｔａｌ．，Ｅｌｉｆｅ．２０１３；２：ｅ００４７１；Ｐａｔｔａｎａｙａｋｅｔａｌ．，ＮａｔＢｉｏｔｅｃｈｎｏｌ．２０１３Ｓｅｐ；３１（９）：８３９−４３；Ｑｉｅｔａｌ，Ｃｅｌｌ．２０１３Ｆｅｂ２８；１５２（５）：１１７３−８３；Ｗａｎｇｅｔａｌ．，Ｃｅｌｌ．２０１３Ｍａｙ９；１５３（４）：９１０−８；Ａｕｅｒｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．２０１３Ｏｃｔ３１；Ｃｈｅｎｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２０１３Ｎｏｖ１；４１（２０）：ｅ１９；Ｃｈｅｎｇｅｔａｌ．，ＣｅｌｌＲｅｓ．２０１３Ｏｃｔ；２３（１０）：１１６３−７１；Ｃｈｏｅｔａｌ．，Ｇｅｎｅｔｉｃｓ．２０１３Ｎｏｖ；１９５（３）：１１７７−８０；ＤｉＣａｒｌｏｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２０１３Ａｐｒ；４１（７）：４３３６−４３；Ｄｉｃｋｉｎｓｏｎｅｔａｌ．，ＮａｔＭｅｔｈｏｄｓ．２０１３Ｏｃｔ；１０（１０）：１０２８−３４；Ｅｂｉｎａｅｔａｌ．，ＳｃｉＲｅｐ．２０１３；３：２５１０；Ｆｕｊｉｉｅｔａｌ，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２０１３Ｎｏｖ１；４１（２０）：ｅ１８７；Ｈｕｅｔａｌ．，ＣｅｌｌＲｅｓ．２０１３Ｎｏｖ；２３（１１）：１３２２−５；Ｊｉａｎｇｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２０１３Ｎｏｖ１；４１（２０）：ｅ１８８；Ｌａｒｓｏｎｅｔａｌ．，ＮａｔＰｒｏｔｏｃ．２０１３Ｎｏｖ；８（１１）：２１８０−９６；Ｍａｌｉｅｔ．ａｔ．，ＮａｔＭｅｔｈｏｄｓ．２０１３Ｏｃｔ；１０（１０）：９５７−６３；Ｎａｋａｙａｍａｅｔａｌ．，Ｇｅｎｅｓｉｓ．２０１３Ｄｅｃ；５１（１２）：８３５−４３；Ｒａｎｅｔａｌ．，ＮａｔＰｒｏｔｏｃ．２０１３Ｎｏｖ；８（１１）：２２８１−３０８；Ｒａｎｅｔａｌ．，Ｃｅｌｌ．２０１３Ｓｅｐ１２；１５４（６）：１３８０−９；Ｕｐａｄｈｙａｙｅｔａｌ．，Ｇ３（Ｂｅｔｈｅｓｄａ）．２０１３Ｄｅｃ９；３（１２）：２２３３−８；Ｗａｌｓｈｅｔａｌ．，ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２０１３Ｓｅｐ２４；１１０（３９）：１５５１４−５；Ｘｉｅｅｔａｌ．，ＭｏｌＰｌａｎｔ．２０１３Ｏｃｔ９；Ｙａｎｇｅｔａｌ．，Ｃｅｌｌ．２０１３Ｓｅｐ１２；１５４（６）：１３７０−９；ならびに米国特許及び出願：第８，９０６，６１６号；第８，８９５，３０８号；第８，８８９，４１８号；第８，８８９，３５６号；第８，８７１，４４５号；第８，８６５，４０６号；第８，７９５，９６５号；第８，７７１，９４５号；第８，６９７，３５９号；第２０１４００６８７９７号；第２０１４０１７０７５３号；第２０１４０１７９００６号；第２０１４０１７９７７０号；第２０１４０１８６８４３号；第２０１４０１８６９１９号；第２０１４０１８６９５８号；第２０１４０１８９８９６号；第２０１４０２２７７８７号；第２０１４０２３４９７２号；第２０１４０２４２６６４号；第２０１４０２４２６９９号；第２０１４０２４２７００号；第２０１４０２４２７０２号；第２０１４０２４８７０２号；第２０１４０２５６０４６号；第２０１４０２７３０３７号；第２０１４０２７３２２６号；第２０１４０２７３２３０号；第２０１４０２７３２３１号；第２０１４０２７３２３２号；第２０１４０２７３２３３号；第２０１４０２７３２３４号；第２０１４０２７３２３５号；第２０１４０２８７９３８号；第２０１４０２９５５５６号；第２０１４０２９５５５７号；第２０１４０２９８５４７号；第２０１４０３０４８５３号；第２０１４０３０９４８７号；第２０１４０３１０８２８号；第２０１４０３１０８３０号；第２０１４０３１５９８５号；第２０１４０３３５０６３号；第２０１４０３３５６２０号；第２０１４０３４２４５６号；第２０１４０３４２４５７号；第２０１４０３４２４５８号；第２０１４０３４９４００号；第２０１４０３４９４０５号；第２０１４０３５６８６７号；第２０１４０３５６９５６号；第２０１４０３５６９５８号；第２０１４０３５６９５９号；第２０１４０３５７５２３号；第２０１４０３５７５３０号；第２０１４０３６４３３３号；及び第２０１４０３７７８６８号を参照のこと（各文献はその全体が参照により本明細書に組み込まれる）。

例えば、本開示は、（限定はされないが）標的核酸を切断する方法；標的核酸を編集する方法；標的核酸からの転写を調節する方法；標的核酸を単離する方法；標的核酸に結合する方法；標的核酸をイメージングする方法、標的核酸を修飾する方法などを提供する。

本明細書で使用される場合、例えば、ＣａｓＹポリペプチドまたはＣａｓＹ融合ポリペプチドと、「標的核酸を接触させる」及び「標的核酸を接触させること」という用語／語句は、標的核酸を接触させるための方法すべてを包含する。例えば、ＣａｓＹポリペプチドを、タンパク質、（ＣａｓＹポリペプチドをコードする）ＲＮＡ、または（ＣａｓＹポリペプチドをコードする）ＤＮＡとして細胞に供給することもでき、一方、ＣａｓＹガイドＲＮＡをガイドＲＮＡとしてまたはガイドＲＮＡをコードする核酸として供給することもできる。したがって、例えば、細胞内（例えば、ｉｎｖｉｔｒｏの細胞内部、ｉｎｖｉｖｏの細胞内部、ｅｘｖｉｖｏの細胞内部）で方法を実行する場合、標的核酸を接触させることを含む方法は、活性状態／最終状態（例えば、ＣａｓＹポリペプチドのタンパク質（複数可）形態；ＣａｓＹ融合ポリペプチドのタンパク質形態；場合よってガイドＲＮＡのＲＮＡ形態）である構成要素の一部または全部を細胞に導入することを包含し、また、１つ以上の構成要素をコードする１つ以上の核酸（例えば、ＣａｓＹポリペプチドまたはＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列（複数可）を含む核酸（複数可）、ガイドＲＮＡ（複数可）をコードするヌクレオチド配列（複数可）を含む核酸（複数可）、ドナー鋳型をコードするヌクレオチド配列を含む核酸など）を細胞に導入することを包含する。方法はまた、細胞外のｉｎｖｉｔｒｏで行うこともできるため、標的核酸を接触させることを含む方法には、（特に明記しない限り）ｉｎｖｉｔｒｏの細胞外、ｉｎｖｉｔｒｏの細胞内部、ｉｎｖｉｖｏの細胞内部、ｅｘｖｉｖｏの細胞内部での接触を包含する。

場合によって、標的核酸を修飾するための本開示の方法は、標的細胞にＣａｓＹ遺伝子座、例えば、ＣａｓＹポリペプチドをコードするヌクレオチド配列、ならびにＣａｓＹ遺伝子座を含む細胞（例えば、場合によって、天然状態（自然界で起こる状態）でＣａｓＹ遺伝子座を含む細胞）に由来するＣａｓＹをコードするヌクレオチド配列を囲む長さ約１キロベース（ｋｂ）〜５ｋｂのヌクレオチド配列を含む核酸を導入することを含み、その場合、標的細胞は通常では（天然状態では）ＣａｓＹ遺伝子座を含まない。しかしながら、コードされたｃｒＲＮＡ（複数可）に対するガイド配列をコードする１つ以上のスペーサー配列を、対象となる１つ以上の標的配列を標的とするように修飾することができる。したがって、例えば、場合によって、標的核酸を修飾するための本開示の方法は、標的細胞にＣａｓＹ遺伝子座、例えば、起源細胞（例えば、場合によって、天然状態（自然界で起こる状態）でＣａｓＹ遺伝子座を含む細胞）から得られる核酸を導入することを含み、その場合の核酸は、１００ヌクレオチド（ｎｔ）〜５ｋｂの長さ（例えば、１００ｎｔ〜５００ｎｔ、５００ｎｔ〜１ｋｂ、１ｋｂ〜１．５ｋｂ、１．５ｋｂ〜２ｋｂ、２ｋｂ〜２．５ｋｂ、２．５ｋｂ〜３ｋｂ、３ｋｂ〜３．５ｋｂ、３．５ｋｂ〜４ｋｂ、または４ｋｂ〜５ｋｂの長さ）を有し、ＣａｓＹポリペプチドをコードするヌクレオチド配列を含む。上記のように、いくつかのそのような場合に、コードされたｃｒＲＮＡ（複数可）に対するガイド配列をコードする１つ以上のスペーサー配列を、対象となる１つ以上の標的配列を標的とするように修飾することができる。場合によって、この方法は、標的細胞に：ｉ）ＣａｓＹ遺伝子座；及びｉｉ）ドナーＤＮＡ鋳型を導入することを含む。場合によって、標的核酸は、ｉｎｖｉｔｒｏの無細胞組成物中にある。場合によって、標的核酸は、標的細胞中に存在する。場合によって、標的核酸は、原核細胞である標的細胞中に存在する。場合によって、標的核酸は、真核細胞である標的細胞に存在する。場合によって、標的核酸は、哺乳動物細胞である標的細胞中に存在する。場合によって、標的核酸は、植物細胞である標的細胞中に存在する。

場合によって、標的核酸を修飾するための本開示の方法は、本開示のＣａｓＹポリペプチドまたは本開示のＣａｓＹ融合ポリペプチドと、標的核酸を接触させることを含む。場合によって、標的核酸を修飾するための本開示の方法は、ＣａｓＹポリペプチド及びＣａｓＹガイドＲＮＡと、標的核酸を接触させることを含む。場合によって、標的核酸を修飾するための本開示の方法は、ＣａｓＹポリペプチド、第１のＣａｓＹガイドＲＮＡ、及び第２のＣａｓＹガイドＲＮＡと、標的核酸を接触させることを含む。場合によって、標的核酸を修飾するための本開示の方法は、本開示のＣａｓＹポリペプチド、ならびにＣａｓＹガイドＲＮＡ及びドナーＤＮＡ鋳型と、標的核酸を接触させることを含む。

対象となる標的核酸及び標的細胞
本開示のＣａｓＹポリペプチドまたは本開示のＣａｓＹ融合ポリペプチドは、ＣａｓＹガイドＲＮＡに結合されている場合、標的核酸と結合することができ、また場合によっては標的核酸と結合してそれを修飾することができる。標的核酸は、任意の核酸（例えば、ＤＮＡ、ＲＮＡ）であってよく、二本鎖または一本鎖であってもよく、どの種類（例えば、染色体（ゲノムＤＮＡ）、染色体由来、染色体ＤＮＡ、プラスミド、ウイルス、細胞外、細胞内、ミトコンドリア、葉緑体、直鎖、環状など）の核酸であってもよく、（例えば、ＣａｓＹガイドＲＮＡが、標的核酸の標的配列にハイブリダイズするヌクレオチド配列を含み、それによって標的核酸を標的化できる限り）どの生物由来のものであってもよい。

標的核酸はＤＮＡであってもＲＮＡであってもよい。標的核酸は、二本鎖（例えば、ｄｓＤＮＡ、ｄｓＲＮＡ）であっても、一本鎖（例えば、ｓｓＲＮＡ、ｓｓＤＮＡ）であってもよい。場合によって、標的核酸は一本鎖である。場合によって、標的核酸は一本鎖ＲＮＡ（ｓｓＲＮＡ）である。場合によって、標的ｓｓＲＮＡ（例えば、標的細胞のｓｓＲＮＡ、ウイルスｓｓＲＮＡなど）は、ｍＲＮＡ、ｒＲＮＡ、ｔＲＮＡ、ノンコーディングＲＮＡ（ｎｃＲＮＡ）、長鎖ノンコーディングＲＮＡ（ｌｎｃＲＮＡ）、及びマイクロＲＮＡ（ｍｉＲＮＡ）から選択される。場合によって、標的核酸は一本鎖ＤＮＡ（ｓｓＤＮＡ）（例えば、ウイルスＤＮＡ）である。上述するように、場合によって、標的核酸は一本鎖である。

標的核酸は、場所を問わず、例えば、ｉｎｖｉｔｒｏの細胞外、ｉｎｖｉｔｒｏの細胞内部、ｉｎｖｉｖｏの細胞内部、ｅｘｖｉｖｏの細胞内部に局在するものであってよい。好適な標的細胞（例えば、ゲノムＤＮＡなどの標的核酸を含み得る標的細胞）として、細菌細胞；古細菌細胞；単細胞真核生物の細胞；植物細胞；藻類細胞、例えば、Ｂｏｔｒｙｏｃｏｃｃｕｓｂｒａｕｎｉｉ、Ｃｈｌａｍｙｄｏｍｏｎａｓｒｅｉｎｈａｒｄｔｉｉ、Ｎａｎｎｏｃｈｌｏｒｏｐｓｉｓｇａｄｉｔａｎａ、Ｃｈｌｏｒｅｌｌａｐｙｒｅｎｏｉｄｏｓａ、Ｓａｒｇａｓｓｕｍｐａｔｅｎｓ、Ｃ．ａｇａｒｄｈなど）；真菌細胞（例えば酵母細胞）；動物細胞；無脊椎動物（例えば、ショウジョウバエ、刺胞動物、棘皮動物、線虫など）由来の細胞；昆虫（例えば、カ、ハチ、農業害虫など）の細胞；クモ類（例えば、クモ、ダニなど）の細胞；脊椎動物（例えば、魚類、両生類、爬虫類、鳥類、哺乳類）由来の細胞；哺乳動物由来の細胞（例えば、齧歯類由来の細胞；ヒト由来の細胞；非ヒト哺乳動物由来の細胞）；齧歯類（例えば、マウス、ラット）の細胞；ウサギ目（例えば、ウサギ）の細胞；有蹄類（例えば、ウシ、ウマ、ラクダ、ラマ、ビクーナ、ヒツジ、ヤギなど）の細胞；海洋哺乳動物（例えば、クジラ、アザラシ、ゾウアザラシ、イルカ、アシカなど）の細胞が挙げられるが、これらに限定されない。いかなる種類の細胞も対象となり得る（例えば、幹細胞、例えば、胚性幹（ＥＳ）細胞、人工多能性幹（ｉＰＳ）細胞、生殖細胞（例えば、卵母細胞、精子、卵原細胞、精原細胞など）、成体幹細胞、体細胞、例えば線維芽細胞、造血細胞、ニューロン、筋肉細胞、骨細胞、肝細胞、膵臓細胞；任意の段階の胚のｉｎｖｉｔｒｏまたはｉｎｖｉｖｏ胚細胞、例えば、１細胞期、２細胞期、４細胞期、８細胞期などのゼブラフィッシュ胚など）。

細胞は、樹立細胞株由来のものであってもよく、または初代細胞であってもよい。ここで、「初代細胞」、「初代細胞株」、及び「初代培養物」は、本明細書で同義に使用され、対象に由来しており、培養物の限定回数の継代（すなわち分割）により、ｉｎｖｉｔｒｏで増殖させることができる細胞及び細胞培養物を指す。例えば、初代培養物は、０回、１回、２回、４回、５回、１０回、または１５回継代されていてもよいが、危機的段階を経験するほどの回数は継代されていない培養物である。通常、初代細胞株のｉｎｖｉｔｒｏでの継代は１０回未満に保たれる。標的細胞は単細胞生物であってもよく、及び／または培養で増殖させることもできる。細胞が初代細胞である場合、細胞を任意の利便な方法により個体から採取することができる。例えば、アフェレーシス、白血球アフェレーシス、密度勾配分離などによって、白血球を利便に採取できる一方、皮膚、筋肉、骨髄、脾臓、肝臓、膵臓、肺、腸、胃などの組織由来の細胞を生検によって利便に採取することができる。

上記の用途のいくつかでは、本発明の方法が、ｉｎｖｉｖｏ及び／またはｅｘｖｉｖｏ及び／またはｉｎｖｉｔｒｏの有糸分裂細胞または有糸分裂後細胞において、標的核酸の切断、標的核酸の修飾を誘導する、及び／または（例えば、可視化、回収、及び／または分析などのために）標的核酸に結合させる際に用いられる場合がある（例えば、標的ｍＲＮＡによってコードされるタンパク質の産生を妨害する、標的ＤＮＡを切断またはその他の方法により修飾する、標的細胞を遺伝子改変するなど）。ガイドＲＮＡは標的核酸にハイブリダイズすることによって特異性を与えるため、開示される方法で対象となる有糸分裂細胞及び／または有糸分裂後細胞は、どの生物に由来する細胞をも含み得る（例えば、細菌細胞、古細菌細胞、単細胞真核生物の細胞、植物細胞、藻類細胞、例えば、Ｂｏｔｒｙｏｃｏｃｃｕｓｂｒａｕｎｉｉ、Ｃｈｌａｍｙｄｏｍｏｎａｓｒｅｉｎｈａｒｄｔｉｉ、Ｎａｎｎｏｃｈｌｏｒｏｐｓｉｓｇａｄｉｔａｎａ、Ｃｈｌｏｒｅｌｌａｐｙｒｅｎｏｉｄｏｓａ、Ｓａｒｇａｓｓｕｍｐａｔｅｎｓ、Ｃ．ａｇａｒｄｈなど、真菌細胞（例えば酵母細胞）、動物細胞、無脊椎動物（例えば、ショウジョウバエ、刺胞動物、棘皮動物、線虫など）由来の細胞、脊椎動物（例えば、魚類、両生類、爬虫類、鳥類、哺乳類）由来の細胞、哺乳動物由来の細胞、齧歯類由来の細胞、ヒト由来の細胞）。場合によって、本発明のＣａｓＹタンパク質（及び／またはタンパク質をコードする核酸、例えばＤＮＡ及び／またはＲＮＡ）、及び／またはＣａｓＹガイドＲＮＡ（及び／またはガイドＲＮＡをコードするＤＮＡ）、及び／またはドナー鋳型、及び／またはＲＮＰは、個体（例えば、哺乳動物、ラット、マウス、ブタ、霊長類、非ヒト霊長類、ヒトなど）に導入することができる（すなわち、標的細胞はｉｎｖｉｖｏであり得る）。場合によって、そのような投与は、例えば、標的細胞のゲノムを編集することによる疾患の治療及び／または予防を目的としたものであり得る。

植物細胞は単子葉植物の細胞、及び双子葉植物の細胞を含む。この細胞は、根細胞、葉細胞、木部の細胞、師部の細胞、形成層の細胞、頂端分裂組織細胞、柔細胞、厚角組織細胞、厚膜組織細胞などであり得る。植物細胞には、小麦、トウモロコシ、イネ、モロコシ、キビ、大豆などの農作物の細胞を含む。植物細胞には、農産果実及びナッツ植物、例えば、アプリコット、オレンジ、レモン、リンゴ、プラム、ナシ、アーモンドなどを実らせる植物の細胞を含む。

標的細胞のさらなる例は、上記の「改変細胞」という表題のセクションで列挙されている。細胞（標的細胞）の非限定的な例として、原核細胞、真核細胞、細菌細胞、古細菌細胞、単細胞真核生物の細胞、原生動物細胞、植物由来細胞（例えば、作物（植物）、果実、野菜、穀物、大豆、トウモロコシ（ｃｏｒｎ、ｍａｉｚｅ）、小麦、種子、トマト、イネ、キャッサバ、サトウキビ、カボチャ、干し草、ジャガイモ、綿、大麻、タバコ、顕花植物、針葉樹、裸子植物、被子植物、シダ類、ヒカゲノカズラ類、ツノゴケ類、ゼニゴケ類、セン類、双子葉植物、単子葉植物など由来の細胞）、藻類細胞（例えば、Ｂｏｔｒｙｏｃｏｃｃｕｓｂｒａｕｎｉｉ、Ｃｈｌａｍｙｄｏｍｏｎａｓｒｅｉｎｈａｒｄｔｉｉ、Ｎａｎｎｏｃｈｌｏｒｏｐｓｉｓｇａｄｉｔａｎａ、Ｃｈｌｏｒｅｌｌａｐｙｒｅｎｏｉｄｏｓａ、Ｓａｒｇａｓｓｕｍｐａｔｅｎｓ、Ｃ．ａｇａｒｄｈなど）、海藻（例えばケルプ）、真菌細胞（例えば、酵母細胞、キノコ由来の細胞）、動物細胞、無脊椎動物（例えば、ショウジョウバエ、刺胞動物、棘皮動物、線虫など）由来の細胞、脊椎動物（例えば、魚類、両生類、爬虫類、鳥類、哺乳類）由来の細胞、哺乳動物（例えば、有蹄類（例えば、ブタ、ウシ、ヤギ、ヒツジ）；齧歯類（例えば、ラット、マウス）；非ヒト霊長類；ヒト；ネコ科動物（例えば、ネコ）；イヌ科動物（例えば、イヌ）など）由来の細胞などが挙げられる。場合によって、細胞は、天然の生物に由来しない細胞である（例えば、細胞は、合成的に作製された細胞であり得る：これは人工細胞とも呼ばれる）。

細胞はｉｎｖｉｔｒｏの細胞（例えば、樹立培養細胞株）であってよい。細胞はｅｘｖｉｖｏの細胞（個体由来の培養細胞）であってよい。細胞はｉｎｖｉｖｏの細胞（例えば、個体内の細胞）であってよい。細胞は単離細胞であってよい。細胞は生物の体内細胞であってよい。細胞は生物であってよい。細胞は細胞培養物（例えば、ｉｎｖｉｔｒｏ細胞培養物）中の細胞であってよい。細胞は細胞の集合のうちの１つであってよい。細胞は、原核細胞であっても、または原核細胞に由来するものであってもよい。細胞は、細菌細胞であっても、または細菌細胞に由来するものであってもよい。細胞は、古細菌細胞であっても、または古細菌細胞に由来するものであってもよい。細胞は、真核細胞であっても、または真核細胞に由来するものであってもよい。細胞は、植物細胞であっても、または植物細胞に由来するものであってもよい。細胞は、動物細胞であっても、または動物細胞に由来するものであってもよい。細胞は、無脊椎動物細胞であっても、または無脊椎動物細胞に由来するものであってもよい。細胞は、脊椎動物細胞であっても、または脊椎動物細胞に由来するものであってもよい。細胞は、哺乳動物細胞であっても、または哺乳動物細胞に由来するものであってもよい。細胞は、齧歯類細胞であっても、または齧歯類細胞に由来するものであってもよい。細胞は、ヒト細胞であっても、またはヒト細胞に由来するものであってもよい。細胞は、微生物細胞であっても、または微生物細胞に由来するものであってもよい。細胞は、真菌細胞であっても、または真菌細胞に由来するものであってもよい。細胞は昆虫細胞であってよい。細胞は節足動物細胞であってよい。細胞は原生動物細胞であってよい。細胞は蠕虫細胞であってよい。

標的細胞への構成要素の導入
Ｃａｓ９ガイドＲＮＡ（またはそれをコードするヌクレオチド配列を含む核酸）及び／またはＣａｓ９融合ポリペプチド（またはそれをコードするヌクレオチド配列を含む核酸）及び／またはドナーポリヌクレオチドは、周知の様々な方法のいずれかによって宿主細胞に導入することができる。

細胞に核酸を導入する方法は、当技術分野で公知であり、任意の利便な方法を使用して、核酸（例えば、発現構築物）を標的細胞（例えば、真核細胞、ヒト細胞、幹細胞、前駆細胞など）に導入することができる。好適な方法は本明細書の別の箇所で詳細に記載しており、例えば、ウイルスまたはバクテリオファージ感染、トランスフェクション、コンジュゲーション、プロトプラスト融合、リポフェクション、エレクトロポレーション、リン酸カルシウム沈降、ポリエチレンイミン（ＰＥＩ）介在型トランスフェクション、ＤＥＡＥ−デキストラン介在型トランスフェクション、リポソーム介在型トランスフェクション、パーティクルガン技術、リン酸カルシウム沈降、直接マイクロインジェクション、ナノ粒子介在型核酸送達（例えば、Ｐａｎｙａｍｅｔ．，ａｌＡｄｖＤｒｕｇＤｅｌｉｖＲｅｖ．２０１２Ｓｅｐ１３．ｐｉｉ：Ｓ０１６９−４０９Ｘ（１２）００２８３−９．ｄｏｉ：１０．１０１６／ｊ．ａｄｄｒ．２０１２．０９．０２３を参照）などが挙げられる。構成要素の一部または全部を、例えばヌクレオフェクションなどの公知の方法を使用して、組成物（例えば、ＣａｓＹポリペプチド、ＣａｓＹガイドＲＮＡ、ドナーポリヌクレオチドなどの任意の利便な組み合わせを含む）として細胞に導入することができる。

ドナーポリヌクレオチド（ドナー鋳型）
ＣａｓＹタンパク質は、ＣａｓＹガイドＲＮＡによって誘導されて、場合によって、二本鎖ＤＮＡ（ｄｓＤＮＡ）標的核酸内の部位特異的二本鎖切断（ＤＳＢ）または一本鎖切断（ＳＳＢ）（例えば、ＣａｓＹタンパク質がニッカーゼ変異体である場合）を生成し、非相同末端結合（ＮＨＥＪ）または相同指向性組換え（ＨＤＲ）のいずれかによって切断を修復する。

場合によって、（ＣａｓＹタンパク質及びＣａｓＹガイドＲＮＡとの）標的ＤＮＡの接触は、非相同末端結合または相同組換え修復が許容される条件下で行う。したがって、場合によって、本発明の方法は、（例えば、細胞へのドナーポリヌクレオチドの導入によって）標的ＤＮＡをドナーポリヌクレオチドと接触させ、ドナーポリヌクレオチド、ドナーポリヌクレオチドの一部、ドナーポリヌクレオチドのコピー、またはドナーポリヌクレオチドのコピーの一部を標的ＤＮＡに組み込むことを含む。場合によって、この方法は、ドナーポリヌクレオチドと細胞を接触させることを含まず、かつ、標的ＤＮＡは、標的ＤＮＡ内のヌクレオチドが欠失されるように改変される。

場合によって、ＣａｓＹガイドＲＮＡ（またはそれをコードするＤＮＡ）及びＣａｓＹタンパク質（またはＲＮＡもしくはＤＮＡなどの、それをコードする核酸、例えば１つ以上の発現ベクター）は、少なくとも標的ＤＮＡ配列と相同性を有するセグメントを含むドナーポリヌクレオチド配列と同時投与される（例えば、標的核酸と接触させる、細胞に投与されるなど）。本発明の方法は、核酸材料を標的ＤＮＡ配列に付加する、すなわち挿入または置換する（例えば、核酸、例えばタンパク質をコードする核酸、ｓｉＲＮＡ、ｍｉＲＮＡなどを「ノックイン」する）、タグ（例えば、６ｘＨｉｓ、蛍光タンパク質（例えば、緑色蛍光タンパク質；黄色蛍光タンパク質など）、ヘマグルチニン（ＨＡ）、ＦＬＡＧなど）を付加する、遺伝子に制御配列（例えば、プロモーター、ポリアデニル化シグナル、内部リボソーム進入配列（ＩＲＥＳ）、２Ａペプチド、開始コドン、終止コドン、スプライスシグナル、移行シグナルなど）を付加する、核酸配列を修飾する（例えば、変異を導入する、正しい配列を導入することにより疾患原因変異を除去する）などのために使用することができる。したがって、ＣａｓＹガイドＲＮＡ及びＣａｓＹタンパク質を含む複合体は、部位特異的、すなわち「標的指向性」方法でのＤＮＡ修飾、例えば遺伝子ノックアウト、遺伝子ノックイン、遺伝子編集、遺伝子タグ付けなどが望ましい、いずれのｉｎｖｉｔｒｏまたはｉｎｖｉｖｏ用途、例えば、例えば疾患の治療、または抗ウイルス、抗病原性、もしくは抗がん療法としての遺伝子療法、農業における遺伝子組換え作物の生産、治療、診断または研究を目的とした細胞によるタンパク質の大規模製造、ｉＰＳ細胞の誘導、生物学的研究、欠失または置換などのための病原体遺伝子の標的化などでの使用に有用である。

標的配列が切断された場所のゲノムにポリヌクレオチド配列を挿入することが望まれる用途でも、ドナーポリヌクレオチド（ドナー配列を含む核酸）を細胞に供給することができる。「ドナー配列」または「ドナーポリヌクレオチド」または「ドナー鋳型」とは、（例えば、ｄｓＤＮＡの切断後、標的ＤＮＡのニッキング後、標的ＤＮＡの二重ニッキング後などに）ＣａｓＹタンパク質によって切断された部位に挿入される核酸配列を意味する。ドナーポリヌクレオチドは、相同性を有するゲノム配列との間の相同組換え修復を維持するため、標的部位のゲノム配列に対して十分な相同性、例えば、標的部位に隣接するヌクレオチド配列、例えば、標的部位の約５０塩基以内、例えば、約３０塩基以内、約１５塩基以内、約１０塩基以内、約５塩基以内、または標的部位とすぐ隣接するヌクレオチド配列と、７０％、８０％、８５％、９０％、９５％、または１００％の相同性を備え得る。ドナーとゲノム配列との間の配列相同性が、約２５、５０、１００、または２００ヌクレオチド、または２００ヌクレオチド超（または１０〜２００ヌクレオチド、もしくはそれ以上の任意の整数値）の場合、相同組換え修復を維持することができる。ドナーポリヌクレオチドは、任意の長さ、例えば１０ヌクレオチド以上、５０ヌクレオチド以上、１００ヌクレオチド以上、２５０ヌクレオチド以上、５００ヌクレオチド以上、１０００ヌクレオチド以上、５０００ヌクレオチド以上などのものであり得る。

ドナー配列は通常、置換するゲノム配列と同一ではない。むしろ、（例えば遺伝子修正、例えば、疾患の原因となる塩基対または疾患の原因ではない塩基対の変換のための）相同組換え修復を維持するのに十分な相同性が存在する限り、ドナー配列は、ゲノム配列に対して、少なくとも１つ以上の単一塩基の変更、挿入、欠失、逆位、または再配置を含んでいてもよい。いくつかの実施形態では、ドナー配列は、相同性のある２つの領域が隣接する非相同配列を含み、それによって標的ＤＮＡ領域と２つの隣接配列との間の相同組換え修復の結果、標的領域に非相同配列が挿入される。ドナー配列にはまた、対象となるＤＮＡ領域に相同ではなく、対象となるＤＮＡ領域への挿入を意図しない配列を含むベクター骨格を含み得る。一般に、ドナー配列の相同領域（複数可）は、組換えを必要とするゲノム配列に対して、少なくとも５０％の配列同一性を有する。ある特定の実施形態では、６０％、７０％、８０％、９０％、９５％、９８％、９９％、または９９．９％の配列同一性が存在する。ドナーポリヌクレオチドの長さに応じて、１％〜１００％の任意の値の配列同一性が存在し得る。

ドナー配列は、ゲノム配列など、例えば制限部位、ヌクレオチド多型、選択マーカー（例えば、薬剤耐性遺伝子、蛍光タンパク質、酵素など）と比較して、ある一定の配列相違性を含んでいてもよく、切断部位でのドナー配列の挿入の成功を評価するために使用することも、または場合によって他の目的（例えば、標的ゲノム遺伝子座での発現を表すため）に使用することもできる。場合によって、コード領域に位置する場合、このようなヌクレオチド配列の相違により、アミノ酸配列が変更されないか、またはアミノ酸がサイレント変異されることになる（すなわち、タンパク質の構造または機能に影響を与えない）。あるいは、これらの配列の相違には、後で活性化されてマーカー配列を除去することができる、ＦＬＰ、ｌｏｘＰ配列などの隣接する組換え配列を含み得る。

場合によって、ドナー配列は、一本鎖ＤＮＡとして細胞に供給される。場合によって、ドナー配列は、ニ本鎖ＤＮＡとして細胞に供給される。これは、直鎖形態または環状形態で細胞に導入することができる。直鎖形態で導入された場合、ドナー配列の末端は、任意の利便な方法によって（例えば、エキソヌクレアーゼ分解から）保護されていてもよく、そのような方法は当業者に公知である。例えば、１つ以上のジデオキシヌクレオチド残基を直鎖分子の３’末端に付加すること、及び／または自己相補性オリゴヌクレオチドを一方または両方の末端にライゲートすることができる。例えば、Ｃｈａｎｇｅｔａｌ．（１９８７）Ｐｒｏｃ．Ｎａｔｌ．ＡｃａｄＳｃｉＵＳＡ８４：４９５９−４９６３；Ｎｅｈｌｓｅｔａｌ．（１９９６）Ｓｃｉｅｎｃｅ２７２：８８６−８８９を参照のこと。外因性ポリヌクレオチドを分解から保護するための追加の方法には、末端アミノ基（複数可）の付加、及び修飾ヌクレオチド間結合、例えばホスホロチオエート、ホスホロアミダート、及びＯ−メチルリボースまたはデオキシリボース残基などの使用が挙げられるが、これらに限定されない。直鎖ドナー配列の末端を保護する代わりに、相同性領域の外側にさらに配列の長さを加えることで、組換えに影響を与えることなく分解することができる。ドナー配列は、例えば、複製起点、プロモーター、及び抗生物質抵抗性をコードする遺伝子のような付加的な配列を有するベクター分子の一部として細胞に導入することができる。さらに、ドナー配列は、裸の核酸として、リポソームまたはポロキサマーなどの薬剤と複合体化された核酸として導入することができ、あるいはＣａｓＹガイドＲＮＡ及び／またはＣａｓＹ融合ポリペプチド及び／またはドナーポリヌクレオチドをコードする核酸について本明細書の他の箇所に記載するように、ウイルス（例えば、アデノウイルス、ＡＡＶ）によって送達することができる。

トランスジェニック非ヒト生物
上述するように、場合によって、本開示の核酸（例えば、組換え発現ベクター）（例えば、本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列を含む核酸；本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列を含む核酸など）は、本開示のＣａｓＹポリペプチドまたはＣａｓＹ融合ポリペプチドを産生するトランスジェニック非ヒト生物を作製するための導入遺伝子として使用される。本開示は、本開示のＣａｓＹポリペプチドまたはＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列を含むトランスジェニック非ヒト生物を提供する。

トランスジェニック非ヒト動物
本開示は、トランスジェニック非ヒト動物を提供する。この動物は、ＣａｓＹポリペプチドまたはＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列を含む核酸を含んでいる導入遺伝子を含む。いくつかの実施形態では、トランスジェニック非ヒト動物のゲノムは、本開示のＣａｓＹポリペプチド、またはＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列を含む。場合によって、トランスジェニック非ヒト動物は、遺伝子改変されるホモ接合体である。場合によって、トランスジェニック非ヒト動物は、遺伝子改変されるヘテロ接合体である。いくつかの実施形態では、トランスジェニック非ヒト動物は、脊椎動物、例えば、魚類（例えば、サケ、マス、ゼブラフィッシュ、キンギョ、フグ、洞窟魚など）、両生類（カエル、イモリ、サンショウウオなど）、鳥類（例えば、ニワトリ、七面鳥など）、爬虫類（例えば、ヘビ、トカゲなど）、非ヒト哺乳動物など（例えば、有蹄動物、例えば、ブタ、ウシ、ヤギ、ヒツジ、など；ウサギ目（例えばウサギ）；齧歯類（例えば、ラット、マウス）；非ヒト霊長類など）である。場合によって、トランスジェニック非ヒト動物は無脊椎動物である。場合によって、トランスジェニック非ヒト動物は昆虫（例えば、カ；農業害虫など）である。場合によって、トランスジェニック非ヒト動物はクモ類である。

本開示のＣａｓＹポリペプチドまたはＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列は、（例えば、核酸が宿主細胞ゲノムに無作為に組み込まれる場合）未知のプロモーターの制御下にあってもよく（すなわち、機能的に連結される）、既知のプロモーターの制御下にあってもよい（すなわち、機能的に連結される）。好適な既知のプロモーターは任意の既知のプロモーターであってよく、構成的に活性なプロモーター（例えば、ＣＭＶプロモーター）、誘導性プロモーター（例えば、熱ショックプロモーター、テトラサイクリン制御性プロモーター、ステロイド制御性プロモーター、金属制御性プロモーター、エストロゲン受容体制御性プロモーターなど）、空間制限及び／または時間制限されたプロモーターなど（例えば、組織特異的プロモーター、細胞型特異的プロモーターなど）を含む。

トランスジェニック植物
上述するように、場合によって、本開示の核酸（例えば、組換え発現ベクター）（例えば、本開示のＣａｓＹポリペプチドをコードするヌクレオチド配列を含む核酸；本開示のＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列を含む核酸など）は、本開示のＣａｓＹポリペプチドまたはＣａｓＹ融合ポリペプチドを産生するトランスジェニック植物を作製するための導入遺伝子として使用される。本開示は、本開示のＣａｓＹポリペプチドまたはＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列を含むトランスジェニック植物を提供する。いくつかの実施形態では、トランスジェニック植物のゲノムは、本発明の核酸を含む。いくつかの実施形態では、トランスジェニック植物は、遺伝子改変されるホモ接合体である。いくつかの実施形態では、トランスジェニック植物は、遺伝子改変されるヘテロ接合体である。

外因性核酸を植物細胞に導入する方法は当技術分野で周知されている。そのような植物細胞は、上記で定義するように「形質転換された」とみなされる。好適な方法として、ウイルス感染（二本鎖ＤＮＡウイルスなど）、トランスフェクション、コンジュゲート、プロトプラスト融合、エレクトロポレーション、パーティクルガン技術、リン酸カルシウム沈降、直接マイクロインジェクション、炭化ケイ素ウィスカー技術、Ａｇｒｏｂａｃｔｅｒｉｕｍ介在性形質転換などが挙げられる。方法の選択は一般に、形質転換される細胞の種類、及び形質転換が行われる状況（すなわち、ｉｎｖｉｔｒｏ、ｅｘｖｉｖｏ、またはｉｎｖｉｖｏ）に応じて異なる。

土壌細菌Ａｇｒｏｂａｃｔｅｒｉｕｍｔｕｍｅｆａｃｉｅｎｓを用いた形質転換法は、維管束植物に外因性核酸分子を導入するために特に有用である。Ａｇｒｏｂａｃｔｅｒｉｕｍの野生型形態には、宿主植物での腫瘍形成性クラウンゴールの増殖の発生を誘導するＴｉ（腫瘍誘発）プラスミドが含まれている。Ｔｉプラスミドの腫瘍誘発性Ｔ−ＤＮＡ領域を植物ゲノムに転写するには、Ｔｉプラスミドが病原性遺伝子ならびにＴ−ＤＮＡ境界をコードする必要がある。これらは、転送されるべき領域の境界を示す一連のＤＮＡ直列反復配列である。Ａｇｒｏｂａｃｔｅｒｉｕｍ系のベクターはＴｉプラスミドの改変形態であり、対象となる核酸配列によって腫瘍誘導機能が置き換えられて植物宿主に導入される。

Ａｇｒｏｂａｃｔｅｒｉｕｍ介在性の形質転換は一般に、融合ベクターシステムまたはバイナリーベクターシステムを用いる。このシステムでは、Ｔｉプラスミドの構成要素が、Ａｇｒｏｂａｃｔｅｒｉｕｍ宿主に恒久的に常在して病原性遺伝子を保有するヘルパーベクターと、Ｔ−ＤＮＡ配列によって境界が規定された対象となる遺伝子を含むシャトルベクターとに分かれている。種々のバイナリーベクターが当技術分野において周知され、市販されており、例えば、Ｃｌｏｎｔｅｃｈ（ＰａｌｏＡｌｔｏ，Ｃａｌｉｆ．）製のものがある。例えば、葉組織、根の外植片、子葉部、茎片または塊茎などの、培養植物細胞または損傷組織とＡｇｒｏｂａｃｔｅｒｉｕｍとの共培養方法もまた、当技術分野において周知されている。例えば、ＧｌｉｃｋａｎｄＴｈｏｍｐｓｏｎ，（ｅｄｓ．），ＭｅｔｈｏｄｓｉｎＰｌａｎｔＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙａｎｄＢｉｏｔｅｃｈｎｏｌｏｇｙ，ＢｏｃａＲａｔｏｎ，Ｆｌａ．：ＣＲＣＰｒｅｓｓ（１９９３）を参照のこと。

マイクロプロジェクタイル介在性形質転換もまた、本発明のトランスジェニック植物の産生に使用することができる。Ｋｌｅｉｎｅｔａｌ．（Ｎａｔｕｒｅ３２７：７０−７３（１９８７））によって最初に記載されたこの方法は、塩化カルシウム、スペルミジン、またはポリエチレングリコールを用いた沈降によって、所望する核酸分子で被覆した金またはタングステンなどのマイクロプロジェクタイルを利用する。マイクロプロジェクタイル粒子は、ＢＩＯＬＩＳＴＩＣＰＤ−１０００（Ｂｉｏｒａｄ；ＨｅｒｃｕｌｅｓＣａｌｉｆ．）などの装置を使用して、被子植物組織に高速で打ち込まれる。

本開示の核酸（例えば、本開示のＣａｓＹポリペプチドまたはＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列を含む核酸（例えば、組換え発現ベクター））は、核酸を植物細胞（複数可）に進入させることができるような方法で、例えば、ｉｎｖｉｖｏまたはｅｘｖｉｖｏのプロトコールによって植物に導入することができる。「ｉｎｖｉｖｏ」とは、核酸が植物の生体に投与されること、例えば浸入することを意味する。「ｅｘｖｉｖｏ」とは、細胞または外植片を植物の外部で改変した後、そのような細胞または器官を植物に再生させることを意味する。植物細胞の安定な形質転換またはトランスジェニック植物の樹立に適したベクターがいくつか記載されており、それには、ＷｅｉｓｓｂａｃｈａｎｄＷｅｉｓｓｂａｃｈ，（１９８９）ＭｅｔｈｏｄｓｆｏｒＰｌａｎｔＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙＡｃａｄｅｍｉｃＰｒｅｓｓ、及びＧｅｌｖｉｎｅｔａｌ．，（１９９０）ＰｌａｎｔＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙＭａｎｕａｌ，ＫｌｕｗｅｒＡｃａｄｅｍｉｃＰｕｂｌｉｓｈｅｒｓに記載されているものが含まれる。具体例として、ＡｇｒｏｂａｃｔｅｒｉｕｍｔｕｍｅｆａｃｉｅｎｓのＴｉプラスミドに由来するもの、ならびにＨｅｒｒｅｒａ−Ｅｓｔｒｅｌｌａｅｔａｌ．（１９８３）Ｎａｔｕｒｅ３０３：２０９，Ｂｅｖａｎ（１９８４）ＮｕｃｌＡｃｉｄＲｅｓ．１２：８７１１−８７２１，Ｋｌｅｅ（１９８５）Ｂｉｏ／Ｔｅｃｈｎｏｌｏ３：６３７−６４２に記載されているものが挙げられる。あるいは、非Ｔｉベクターを使用して、遊離ＤＮＡ送達技術を用いて植物及び細胞にＤＮＡを転写することができる。これらの方法を使用して、小麦、イネ（Ｃｈｒｉｓｔｏｕ（１９９１）Ｂｉｏ／Ｔｅｃｈｎｏｌｏｇｙ９：９５７−９及び４４６２）、及びトウモロコシ（Ｇｏｒｄｏｎ−Ｋａｍｍ（１９９０）ＰｌａｎｔＣｅｌｌ２：６０３−６１８）などのトランスジェニック植物を生産することができる。未熟胚もまた、パーティクルガンを使用した直接ＤＮＡ送達技術（Ｗｅｅｋｓｅｔａｌ．（１９９３）ＰｌａｎｔＰｈｙｓｉｏｌ１０２：１０７７−１０８４；Ｖａｓｉｌ（１９９３）Ｂｉｏ／Ｔｅｃｈｎｏｌｏ１０：６６７−６７４；ＷａｎａｎｄＬｅｍｅａｕｘ（１９９４）ＰｌａｎｔＰｈｙｓｉｏｌ１０４：３７−４８）、及びＡｇｒｏｂａｃｔｅｒｉｕｍ介在性ＤＮＡ転写（Ｉｓｈｉｄａｅｔａｌ．（１９９６）ＮａｔｕｒｅＢｉｏｔｅｃｈ１４：７４５−７５０）において、単子葉植物に適切な標的組織であり得る。葉緑体にＤＮＡを導入するための例示的な方法は、バイオリスティックボンバードメント、プロトプラストのポリエチレングリコール形質転換、及びマイクロインジェクションである（ＤａｎｉｅｌｉｅｔａｌＮａｔ．Ｂｉｏｔｅｃｈｎｏｌ１６：３４５−３４８，１９９８；ＳｔａｕｂｅｔａｌＮａｔ．Ｂｉｏｔｅｃｈｎｏｌ１８：３３３−３３８，２０００；Ｏ’ＮｅｉｌｌｅｔａｌＰｌａｎｔＪ．３：７２９−７３８，１９９３；ＫｎｏｂｌａｕｃｈｅｔａｌＮａｔ．Ｂｉｏｔｅｃｈｎｏｌ１７：９０６−９０９；米国特許第５，４５１，５１３号、第５，５４５，８１７号、第５，５４５，８１８号、及び第５，５７６，１９８号；国際出願第ＷＯ９５／１６７８３号；ならびにＢｏｙｎｔｏｎｅｔａｌ．，ＭｅｔｈｏｄｓｉｎＥｎｚｙｍｏｌｏｇｙ２１７：５１０−５３６（１９９３）、Ｓｖａｂｅｔａｌ．，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９０：９１３−９１７（１９９３）、及びＭｃＢｒｉｄｅｅｔａｌ．，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９１：７３０１−７３０５（１９９４））。バイオリスティックボンバードメント、プロトプラストのポリエチレングリコール形質転換、及びマイクロインジェクションの方法に適した任意のベクターは、葉緑体形質転換のための標的化ベクターとして適している。任意の二本鎖ＤＮＡベクターは、特にＡｇｒｏｂａｃｔｅｒｉｕｍを利用しない導入方法の場合に、形質転換ベクターとして使用することができる。

遺伝子改変することができる植物には、穀物、飼料作物、果実、野菜、脂肪種子作物、ヤシ、森林、及び蔓植物を含む。改変できる植物の具体例は以下の通りである：トウモロコシ、バナナ、ピーナッツ、フィールドピー、ヒマワリ、トマト、キャノーラ、タバコ、小麦、大麦、オート麦、ジャガイモ、大豆、綿、カーネーション、モロコシ、ハウチワマメ、及びイネ。

本開示は、形質転換された植物細胞、組織、植物、及び形質転換された植物細胞を含む産物を提供する。本発明の形質転換細胞及び組織、ならびにそれを含む産物の特徴は、ゲノムに組み込まれた本発明の核酸の存在、及び植物細胞による本開示のＣａｓＹポリペプチドまたはＣａｓＹ融合ポリペプチドの産生である。本発明の組換え植物細胞は、組換え細胞の集団として、または組織、種子、植物全体、茎、果実、葉、根、花、茎、塊茎、穀粒、家畜飼料、植物用地などとして有用である。

本開示のＣａｓＹポリペプチドまたはＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列は、（例えば、核酸が宿主細胞ゲノムに無作為に組み込まれる場合）未知のプロモーターの制御下にあってもよく（すなわち、機能的に連結される）、既知のプロモーターの制御下にあってもよい（すなわち、機能的に連結される）。好適な既知のプロモーターは任意の既知のプロモーターであってよく、構成的に活性なプロモーター、誘導性プロモーター、空間制限及び／または時間制限されたプロモーターなどを含む。

ＣＲＩＳＰＲＲＮＡ誘導型エンドヌクレアーゼの同定方法
ＣＲＩＳＰＲＲＮＡ誘導型エンドヌクレアーゼの同定方法を提供する。例えば、いくつかの実施形態では、そのような方法には、複数のメタゲノムヌクレオチド配列において、Ｃａｓ１ポリペプチドをコードするヌクレオチド配列を検出する工程を含む。Ｃａｓ１タンパク質は、当技術分野において公知であり、クラス２ＣＲＩＳＰＲシステムのＣＲＩＳＰＲ遺伝子座の近傍に存在している。このようなＣＲＩＳＰＲシステムには、エンドヌクレアーゼとして機能し、タンパク質の複合体との相互作用を必要とせずに適切に機能する単一のエフェクタータンパク質が含まれる。Ｃａｓ１タンパク質自体は、ＣＲＩＳＰＲ遺伝子座への新規標的配列の取り込みに関与しているため、この方法による同定に望ましいエフェクタータンパク質ではないが、ＣＲＩＳＰＲ遺伝子の近傍にＣａｓ１タンパク質が存在することは、遺伝子座付近に存在する他のＣａｓタンパク質の少なくとも１つがエフェクタータンパク質（ＲＮＡ誘導型エンドヌクレアーゼ）であり得ることの指標である。

本明細書で使用される場合、用語「メタゲノミクス」とは、試料、例えば未知量の原核生物（細菌／古細菌）を含む試料、及び以前に発見及び／または特性決定されていない原核生物を含み得る試料などの環境試料中の複数の微生物（例えば、細菌、古細菌など）から回収された核酸の並行分析を意味する。任意の利便な方法によって、そのような試料から核酸を回収することができ、一般に、分析前には、任意の所与の核酸分子の起源となる微生物が不明であるような試料全体から核酸を網羅的に回収する。いくつかの実施形態では、試料は、微生物の未知の混合物及び／または未知量の微生物を含有する。核酸をさらに配列決定して、複数のメタゲノム配列を得ることができる。場合によって、ＣＲＩＳＰＲＲＮＡ誘導型エンドヌクレアーゼを同定する本発明の方法は、試料（例えば、環境試料）を単離する工程を含む。場合によって、ＣＲＩＳＰＲＲＮＡ誘導型エンドヌクレアーゼを同定する本発明の方法には、試料から核酸を単離する工程、及び／または試料から複数のメタゲノムヌクレオチド配列を得るために試料をアッセイする工程を含む。

ＣＲＩＳＰＲＲＮＡ誘導型エンドヌクレアーゼを同定する本発明の方法は、Ｃａｓ１タンパク質が同定された後に、Ｃａｓ１をコードするヌクレオチド配列の近傍にあるＣＲＩＳＰＲ配列（リピート−スペーサー−リピート配列）を検出する工程を含み得る。次に、この方法は、検出されたＣＲＩＳＰＲ配列を含むＣＲＩＳＰＲ遺伝子座を（例えば、複数のメタゲノムヌクレオチド配列が由来する核酸試料から）発現ベクターにクローニングして、組換えＣＲＩＳＰＲ遺伝子座発現ベクターを生成する工程を含み得る。さらに、組換えＣＲＩＳＰＲ遺伝子座発現ベクターが標的核酸を切断する能力についてアッセイすることにより、ＣＲＩＳＰＲ遺伝子座の機能を試験することができる。任意の利便なアッセイを使用することができる。いくつかの実施形態では、アッセイ工程には、組換えＣＲＩＳＰＲ遺伝子座発現ベクター及び標的核酸を、細胞、例えば、Ｅ．ｃｏｌｉ細胞などの異種宿主細胞に導入することを含む。例えば、下記の実施例（図５）のＰＡＭ欠失アッセイを参照のこと。場合によって、アッセイ工程は、宿主細胞（例えば、Ｅ．ｃｏｌｉ細胞）の集団にプラスミドライブラリを導入することを含み、その場合、ライブラリの各プラスミドは、標的配列の５’及び／または３’をランダム抽出した４〜１０（例えば、５〜１０、５〜８、６〜１０、６〜８、５、６、７、８）個のヌクレオチドを有する。宿主細胞には、試験される組換えＣＲＩＳＰＲ遺伝子座発現ベクターが予め含まれていてもよく、または組換えＣＲＩＳＰＲ遺伝子座発現ベクターが、ライブラリの後に導入されてもよい。機能的である試験ＣＲＩＳＰＲ遺伝子座、すなわち機能的なＣＲＩＳＰＲＲＮＡ誘導型エンドヌクレアーゼを含む試験ＣＲＩＳＰＲ遺伝子座のみが、標的配列を有するプラスミドを切断する能力をもたらすことになる。標的配列の５’及び３’ランダム配列を含める理由は、実験の開始時に目的とするエンドヌクレアーゼに必要なＰＡＭ配列が未知である可能性があるためである。

発現ベクターが、標的核酸（例えば、適切な標的配列及びＰＡＭを有するもの、例えば、ＣＲＩＳＰＲ配列の少なくとも１つのスペーサーに適合する標的配列など）を切断することができる場合、そのＣＲＩＳＰＲ遺伝子座は、候補のＣＲＩＳＰＲＲＮＡ誘導型エンドヌクレアーゼをコードするヌクレオチド配列を含む。したがって、ＣＲＩＳＰＲＲＮＡ誘導型エンドヌクレアーゼをコードするＣＲＩＳＰＲ遺伝子座のオープンリーディングフレームをさらに同定することができる。場合によって、以前に未知であったＣＲＩＳＰＲＲＮＡ誘導型エンドヌクレアーゼを同定することが望ましく、それゆえ、場合によって、同定されるポリペプチドは、既知のＣＲＩＳＰＲＲＮＡ誘導型エンドヌクレアーゼのポリペプチドのアミノ酸配列に対して２０％未満のアミノ酸配列同一性（例えば、１５％未満、１０％未満、５％未満のアミノ酸配列同一性）を有する。

本開示の非限定的な態様の例
上述する本発明の主題となる、実施形態を含む態様は、単独で、または１つ以上の他の態様もしくは実施形態と組み合わせて利益をもたらすことができる。前述の記載、本開示の特定の非限定的な態様に限定することなく、以下の番号１〜１２３を提供する。本開示を読めば当業者には明らかであるように、個別番号の態様のそれぞれを使用しても、または前後の個別番号の態様のいずれかと組み合わせてもよい。これは、態様のそのような組み合わせすべてに対する支持を示すことを意図しており、以下に明示的に示す態様の組み合わせに限定されない。

１．ａ）ＣａｓＹポリペプチド、または前記ＣａｓＹポリペプチドをコードする核酸分子、及び
ｂ）ＣａｓＹガイドＲＮＡ、または前記ＣａｓＹガイドＲＮＡをコードする１つ以上のＤＮＡ分子を含む、組成物。
２．前記ＣａｓＹポリペプチドが、配列番号１または配列番号２に記載されるアミノ酸配列（または配列番号１〜８のいずれか１つに記載されるアミノ酸配列）に対して、５０％以上の同一性を有するアミノ酸配列を含む、１に記載の組成物。
３．前記ＣａｓＹガイドＲＮＡが、配列番号１１〜１５のいずれか１つに記載されるｃｒＲＮＡ配列と８０％以上の同一性を有するヌクレオチド配列を含む、１または２に記載の組成物。
４．前記ＣａｓＹポリペプチドがＮＬＳ配列に融合されている、１または２に記載の組成物。
５．前記組成物が脂質を含む、１〜４のいずれかに１つに記載の組成物。

６．ａ）及びｂ）がリポソーム内にある、１〜４のいずれか１つに記載の組成物。
７．ａ）及びｂ）が粒子内にある、１〜４のいずれか１つに記載の組成物。
８．緩衝液、ヌクレアーゼ阻害剤、及びプロテアーゼ阻害剤のうち１つ以上を含む、１〜７のいずれか１つに記載の組成物。
９．前記ＣａｓＹポリペプチドが、配列番号１または配列番号２に記載されるアミノ酸配列（または配列番号１〜８のいずれか１つに記載されるアミノ酸配列）に対して、８５％以上の同一性を有するアミノ酸配列を含む、１〜８のいずれか１つに記載の組成物。
１０．前記ＣａｓＹポリペプチドが、二本鎖標的核酸分子の一方の鎖のみを切断することができるニッカーゼである、１〜９のいずれか１つに記載の組成物。

１１．前記ＣａｓＹポリペプチドが、触媒不活性なＣａｓＹポリペプチド（ｄＣａｓＹ）である、１〜９のいずれか１つに記載の組成物。
１２．前記ＣａｓＹポリペプチドが、配列番号１のＤ６７２、Ｅ７６９、及びＤ９３５から選択されるものに対応する位置に１つ以上の変異を含む、１０または１１に記載の組成物。
１３．ＤＮＡドナー鋳型をさらに含む、１〜１２のいずれかに１つに記載の組成物。
１４．異種ポリペプチドに融合されたＣａｓＹポリペプチドを含む、ＣａｓＹ融合ポリペプチド。
１５．前記ＣａｓＹポリペプチドが、配列番号１または配列番号２に記載されるアミノ酸配列（または配列番号１〜８のいずれか１つに記載されるアミノ酸配列）に対して、５０％以上の同一性を有するアミノ酸配列を含む、１４に記載のＣａｓＹ融合ポリペプチド。

１６．前記ＣａｓＹポリペプチドが、配列番号１または配列番号２に記載されるアミノ酸配列（または配列番号１〜８のいずれか１つに記載されるアミノ酸配列）に対して、８５％以上の同一性を有するアミノ酸配列を含む、１４に記載のＣａｓＹ融合ポリペプチド。
１７．前記ＣａｓＹポリペプチドが、二本鎖標的核酸分子の一方の鎖のみを切断することができるニッカーゼである、１４〜１６のいずれか１つに記載のＣａｓＹ融合ポリペプチド。
１８．前記ＣａｓＹポリペプチドが、触媒不活性なＣａｓＹポリペプチド（ｄＣａｓＹ）である、１４〜１７のいずれか１つに記載のＣａｓＹ融合ポリペプチド。
１９．前記ＣａｓＹポリペプチドが、配列番号１のＤ６７２、Ｅ７６９、及びＤ９３５から選択されるものに対応する位置に１つ以上の変異を含む、１７または１８に記載のＣａｓＹ融合ポリペプチド。
２０．前記異種ポリペプチドが、前記ＣａｓＹポリペプチドのＮ末端及び／またはＣ末端に融合される、１４〜１９のいずれか１つに記載のＣａｓＹ融合ポリペプチド。

２１．ＮＬＳを含む、１４〜２０のいずれか１つに記載のＣａｓＹ融合ポリペプチド。
２２．前記異種ポリペプチドが、標的細胞または標的細胞型の細胞表面部分への結合性を備える標的化ポリペプチドである、１４〜２１のいずれか１つに記載のＣａｓＹ融合ポリペプチド。
２３．前記異種ポリペプチドが、標的ＤＮＡを修飾する酵素活性を示す、１４〜２１のいずれか１つに記載のＣａｓＹ融合ポリペプチド。
２４．前記異種ポリペプチドが、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、ＤＮＡ修復活性、ＤＮＡ損傷活性、脱アミノ化活性、ジスムターゼ活性、アルキル化活性、脱プリン活性、酸化活性、ピリミジン二量体を形成する活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、及びグリコシラーゼ活性から選択される１つ以上の酵素活性を示す、２３に記載のＣａｓＹ融合ポリペプチド。
２５．前記異種ポリペプチドが、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、脱アミノ化活性、脱プリン活性、インテグラーゼ活性、トランスポザーゼ活性、及びリコンビナーゼ活性から選択される１つ以上の酵素活性を示す、２４に記載のＣａｓＹ融合ポリペプチド。

２６．前記異種ポリペプチドが、標的核酸と会合する標的ポリペプチドを修飾する酵素活性を示す、１４〜２１のいずれか１つに記載のＣａｓＹ融合ポリペプチド。
２７．前記異種ポリペプチドが、ヒストン修飾活性を示す、２６に記載のＣａｓＹ融合ポリペプチド。
２８．前記異種ポリペプチドが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、ＳＵＭＯ化活性、脱ＳＵＭＯ化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、脱ミリストイル化活性、グリコシル化活性（例えば、Ｏ−ＧｌｃＮＡｃトランスフェラーゼによる）、及び脱グリコシル化活性から選択される１つ以上の酵素活性を示す、２６または２７に記載のＣａｓＹ融合ポリペプチド。
２９．前記異種ポリペプチドが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、及びデアセチラーゼ活性から選択される１つ以上の酵素活性を示す、２８に記載のＣａｓＹ融合ポリペプチド。
３０．前記異種ポリペプチドが、エンドソーム放出ポリペプチドである、１４〜２１のいずれか１つに記載のＣａｓＹ融合ポリペプチド。

３１．前記エンドソーム放出ポリペプチドが、ＧＬＦＸＡＬＬＸＬＬＸＳＬＷＸＬＬＬＸＡ（配列番号９４）及びＧＬＦＨＡＬＬＨＬＬＨＳＬＷＨＬＬＬＨＡ（配列番号９５）から選択されるアミノ酸配列を含み、ここで、各Ｘは独立して、リジン、ヒスチジン、及びアルギニンから選択される、３０に記載のＣａｓＹ融合ポリペプチド。
３２．前記異種ポリペプチドが、葉緑体輸送ペプチドである、１４〜２１のいずれか１つに記載のＣａｓＹ融合ポリペプチド。
３３．前記葉緑体輸送ペプチドが、ＭＡＳＭＩＳＳＳＡＶＴＴＶＳＲＡＳＲＧＱＳＡＡＭＡＰＦＧＧＬＫＳＭＴＧＦＰＶＲＫＶＮＴＤＩＴＳＩＴＳＮＧＧＲＶＫＣＭＱＶＷＰＰＩＧＫＫＫＦＥＴＬＳＹＬＰＰＬＴＲＤＳＲＡ（配列番号８３）；ＭＡＳＭＩＳＳＳＡＶＴＴＶＳＲＡＳＲＧＱＳＡＡＭＡＰＦＧＧＬＫＳＭＴＧＦＰＶＲＫＶＮＴＤＩＴＳＩＴＳＮＧＧＲＶＫＳ（配列番号８４）；ＭＡＳＳＭＬＳＳＡＴＭＶＡＳＰＡＱＡＴＭＶＡＰＦＮＧＬＫＳＳＡＡＦＰＡＴＲＫＡＮＮＤＩＴＳＩＴＳＮＧＧＲＶＮＣＭＱＶＷＰＰＩＥＫＫＫＦＥＴＬＳＹＬＰＤＬＴＤＳＧＧＲＶＮＣ（配列番号８５）；ＭＡＱＶＳＲＩＣＮＧＶＱＮＰＳＬＩＳＮＬＳＫＳＳＱＲＫＳＰＬＳＶＳＬＫＴＱＱＨＰＲＡＹＰＩＳＳＳＷＧＬＫＫＳＧＭＴＬＩＧＳＥＬＲＰＬＫＶＭＳＳＶＳＴＡＣ（配列番号８６）；ＭＡＱＶＳＲＩＣＮＧＶＷＮＰＳＬＩＳＮＬＳＫＳＳＱＲＫＳＰＬＳＶＳＬＫＴＱＱＨＰＲＡＹＰＩＳＳＳＷＧＬＫＫＳＧＭＴＬＩＧＳＥＬＲＰＬＫＶＭＳＳＶＳＴＡＣ（配列番号８７）；ＭＡＱＩＮＮＭＡＱＧＩＱＴＬＮＰＮＳＮＦＨＫＰＱＶＰＫＳＳＳＦＬＶＦＧＳＫＫＬＫＮＳＡＮＳＭＬＶＬＫＫＤＳＩＦＭＱＬＦＣＳＦＲＩＳＡＳＶＡＴＡＣ（配列番号８８）；ＭＡＡＬＶＴＳＱＬＡＴＳＧＴＶＬＳＶＴＤＲＦＲＲＰＧＦＱＧＬＲＰＲＮＰＡＤＡＡＬＧＭＲＴＶＧＡＳＡＡＰＫＱＳＲＫＰＨＲＦＤＲＲＣＬＳＭＶＶ（配列番号８９）；ＭＡＡＬＴＴＳＱＬＡＴＳＡＴＧＦＧＩＡＤＲＳＡＰＳＳＬＬＲＨＧＦＱＧＬＫＰＲＳＰＡＧＧＤＡＴＳＬＳＶＴＴＳＡＲＡＴＰＫＱＱＲＳＶＱＲＧＳＲＲＦＰＳＶＶＶＣ（配列番号９０）；ＭＡＳＳＶＬＳＳＡＡＶＡＴＲＳＮＶＡＱＡＮＭＶＡＰＦＴＧＬＫＳＡＡＳＦＰＶＳＲＫＱＮＬＤＩＴＳＩＡＳＮＧＧＲＶＱＣ（配列番号９１）；ＭＥＳＬＡＡＴＳＶＦＡＰＳＲＶＡＶＰＡＡＲＡＬＶＲＡＧＴＶＶＰＴＲＲＴＳＳＴＳＧＴＳＧＶＫＣＳＡＡＶＴＰＱＡＳＰＶＩＳＲＳＡＡＡＡ（配列番号９２）；及びＭＧＡＡＡＴＳＭＱＳＬＫＦＳＮＲＬＶＰＰＳＲＲＬＳＰＶＰＮＮＶＴＣＮＮＬＰＫＳＡＡＰＶＲＴＶＫＣＣＡＳＳＷＮＳＴＩＮＧＡＡＡＴＴＮＧＡＳＡＡＳＳ（配列番号９３）から選択されるアミノ酸配列を含む、３２に記載のＣａｓＹ融合ポリペプチド。
３４．前記異種ポリペプチドが、転写を増加させるかまたは減少させるタンパク質である、１４〜２１のいずれか１つに記載のＣａｓＹ融合ポリペプチド。
３５．前記異種ポリペプチドが転写抑制因子ドメインである、３４に記載のＣａｓＹ融合ポリペプチド。

３６．前記異種ポリペプチドが転写活性化ドメインである、３４に記載のＣａｓＹ融合ポリペプチド。
３７．前記異種ポリペプチドがタンパク質結合ドメインである、１４〜２１のいずれか１つに記載のＣａｓＹ融合ポリペプチド。
３８．１４〜３７のいずれか１つに記載のＣａｓＹ融合ポリペプチドをコードする核酸分子。
３９．前記ＣａｓＹ融合ポリペプチドをコードする前記ヌクレオチド配列が、プロモーターに機能的に連結される、３８に記載の核酸分子。
４０．前記プロモーターが、真核細胞において機能的である、３９に記載の核酸分子。

４１．前記プロモーターが、植物細胞、真菌細胞、動物細胞、脊椎動物の細胞、ハエ細胞、脊椎動物の細胞、哺乳動物細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞のうち１つ以上において機能的である、４０に記載の核酸分子。
４２．前記プロモーターが、構成的プロモーター、誘導性プロモーター、細胞型特異的プロモーター、及び組織特異的プロモーターのうち１つ以上である、３９〜４１のいずれか１つに記載の核酸分子。
４３．前記ＤＮＡ分子が組換え発現ベクターである、３８〜４２のいずれか１つに記載の核酸分子。
４４．前記組換え発現ベクターが、組換えアデノ随伴ウイルスベクター、組換えレトロウイルスベクター、または組換えレンチウイルスベクターである、４３に記載の核酸分子。
４５．前記プロモーターが、原核細胞において機能的である、３９に記載の核酸分子。

４６．前記核酸分子がｍＲＮＡである、３８に記載の核酸分子。
４７．（ａ）ＣａｓＹガイドＲＮＡ、及び
（ｂ）ＣａｓＹポリペプチド
をコードする１つ以上の核酸分子。
４８．前記ＣａｓＹポリペプチドが、配列番号１または配列番号２に記載されるアミノ酸配列（または配列番号１〜８のいずれか１つに記載されるアミノ酸配列）に対して、５０％以上の同一性を有するアミノ酸配列を含む、４７に記載の１つ以上の核酸分子。
４９．前記ＣａｓＹポリペプチドが、配列番号１または配列番号２に記載されるアミノ酸配列（または配列番号１〜８のいずれか１つに記載されるアミノ酸配列）に対して、８５％以上の同一性を有するアミノ酸配列を含む、４７に記載の１つ以上の核酸分子。
５０．前記ＣａｓＹガイドＲＮＡが、配列番号１１〜１５のいずれか１つに記載されるｃｒＲＮＡ配列と８０％以上の同一性を有するヌクレオチド配列を含む、４７〜４９のいずれか１つに記載の１つ以上の核酸分子。

５１．前記ＣａｓＹポリペプチドがＮＬＳ配列に融合されている、４７〜５０のいずれか１つに記載の１つ以上の核酸分子。
５２．前記１つ以上の核酸分子が、プロモーターに機能的に連結される前記ＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む、４７〜５１のいずれか１つに記載の１つ以上の核酸分子。
５３．前記１つ以上の核酸分子が、プロモーターに機能的に連結される前記ＣａｓＹポリペプチドをコードするヌクレオチド配列を含む、４７〜５２のいずれか１つに記載の１つ以上の核酸分子。
５４．前記プロモーターが、前記ＣａｓＹガイドＲＮＡをコードする前記ヌクレオチド配列に機能的に連結される、及び／または前記プロモーターが、前記ＣａｓＹポリペプチドをコードする前記ヌクレオチド配列に機能的に連結され、真核生物において機能的である、５２または５３に記載の１つ以上の核酸分子。
５５．前記プロモーターが、植物細胞、真菌細胞、動物細胞、脊椎動物の細胞、ハエ細胞、脊椎動物の細胞、哺乳動物細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞のうち１つ以上において機能的である、５４に記載の１つ以上の核酸分子。

５６．前記プロモーターが、構成的プロモーター、誘導性プロモーター、細胞型特異的プロモーター、及び組織特異的プロモーターのうち１つ以上である、５３〜５５のいずれか１つに記載の１つ以上の核酸分子。
５７．前記１つ以上の核酸分子が、１つ以上の組換え発現ベクターである、４７〜５６のいずれか１つに記載の１つ以上の核酸分子。
５８．前記１つ以上の組換え発現ベクターが、１つ以上のアデノ随伴ウイルスベクター、１つ以上の組換えレトロウイルスベクター、または１つ以上の組換えレンチウイルスベクターから選択される、５７に記載の１つ以上の核酸分子。
５９．前記プロモーターが、原核細胞において機能的である、５３に記載の１つ以上の核酸分子。
６０．ａ）ＣａｓＹポリペプチド、または前記ＣａｓＹポリペプチドをコードする核酸分子、
ｂ）ＣａｓＹ融合ポリペプチド、または前記ＣａｓＹ融合ポリペプチドをコードする核酸分子、及び
ｃ）ＣａｓＹガイドＲＮＡ、または前記ＣａｓＹガイドＲＮＡをコードする核酸分子
のうち１つ以上を含む真核細胞。

６１．前記ＣａｓＹポリペプチドをコードする前記核酸分子を含み、前記核酸分子が前記細胞のゲノムＤＮＡに組み込まれている、６０に記載の真核細胞。
６２．前記真核細胞が、植物細胞、哺乳動物細胞、昆虫細胞、クモ類細胞、真菌細胞、鳥類細胞、爬虫類細胞、両生類細胞、無脊椎動物細胞、マウス細胞、ラット細胞、霊長類細胞、非ヒト霊長類細胞、またはヒト細胞である、６０または６１に記載の真核細胞。
６３．ＣａｓＹ融合ポリペプチド、または前記ＣａｓＹ融合ポリペプチドをコードする核酸分子を含む、細胞。
６４．前記細胞が原核細胞である、６３に記載の細胞。
６５．前記ＣａｓＹ融合ポリペプチドをコードする前記核酸分子を含み、前記核酸分子が前記細胞のゲノムＤＮＡに組み込まれている、６３または６４に記載の細胞。

６６．標的核酸を修飾する方法であって、
前記標的核酸を
ａ）ＣａｓＹポリペプチド、及び
ｂ）前記標的核酸の標的配列にハイブリダイズするガイド配列を含むＣａｓＹガイドＲＮＡと接触させることを含み、
前記接触が、前記ＣａｓＹポリペプチドによる前記標的核酸の修飾をもたらす、方法。
６７．前記修飾が、前記標的核酸の切断である、６６に記載の方法。
６８．前記標的核酸が、二本鎖ＤＮＡ、一本鎖ＤＮＡ、ＲＮＡ、ゲノムＤＮＡ、及び染色体外ＤＮＡから選択される、６６または６７に記載の方法。
６９．前記接触が、細胞外のｉｎｖｉｔｒｏ（インビトロ）で行われる、６６〜６８のいずれかに記載の方法。
７０．前記接触が、培養物中の細胞内で行われる、６６〜６８のいずれかに記載の方法。

７１．前記接触が、ｉｎｖｉｖｏ（インビボ）の細胞内で行われる、６６〜６８のいずれかに記載の方法。
７２．前記細胞が真核細胞である、７０または７１に記載の方法。
７３．前記細胞が、植物細胞、真菌細胞、哺乳動物細胞、爬虫類細胞、昆虫細胞、鳥類細胞、魚類細胞、寄生生物細胞、節足動物細胞、無脊椎動物の細胞、脊椎動物の細胞、齧歯類細胞、マウス細胞、ラット細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞から選択される、７２に記載の方法。
７４．前記細胞が原核細胞である、７０または７１に記載の方法。
７５．前記接触の結果、ゲノムが編集される、６６〜７４のいずれか１つに記載の方法。

７６．前記接触が、（ａ）前記ＣａｓＹポリペプチド、または前記ＣａｓＹポリペプチドをコードする核酸分子、及び（ｂ）前記ＣａｓＹガイドＲＮＡ、または前記ＣａｓＹガイドＲＮＡをコードする核酸分子を細胞に導入することを含む、６６〜７５のいずれか１つに記載の方法。
７７．前記接触が、ＤＮＡドナー鋳型を前記細胞に導入することをさらに含む、７６に記載の方法。
７８．前記ＣａｓＹガイドＲＮＡが、配列番号１１〜１５のいずれか１つに記載されるｃｒＲＮＡ配列と８０％以上の同一性を有するヌクレオチド配列を含む、６６〜７７のいずれか１つに記載の方法。
７９．前記ＣａｓＹポリペプチドがＮＬＳ配列に融合されている、６６〜７８のいずれか１つに記載の方法。
８０．標的ＤＮＡからの転写を調節する、標的核酸を修飾する、または標的核酸と会合するタンパク質を修飾する方法であって、
前記標的核酸を
ａ）異種ポリペプチドに融合されたＣａｓＹポリペプチドを含む、ＣａｓＹ融合ポリペプチド、及び
ｂ）前記標的核酸の標的配列にハイブリダイズするガイド配列を含むＣａｓＹガイドＲＮＡと接触させることを含む、方法。

８１．前記ＣａｓＹガイドＲＮＡが、配列番号１１〜１５のいずれか１つに記載されるｃｒＲＮＡ配列と８０％以上の同一性を有するヌクレオチド配列を含む、８０に記載の方法。
８２．前記ＣａｓＹ融合ポリペプチドがＮＬＳ配列を含む、８０または８１に記載の方法。
８３．前記修飾が、前記標的核酸の切断ではない、８０〜８２のいずれかに記載の方法。
８４．前記標的核酸が、二本鎖ＤＮＡ、一本鎖ＤＮＡ、ＲＮＡ、ゲノムＤＮＡ、及び染色体外ＤＮＡから選択される、８０〜８３のいずれかに記載の方法。
８５．前記接触が、細胞外のｉｎｖｉｔｒｏ（インビトロ）で行われる、８０〜８４のいずれかに記載の方法。

８６．前記接触が、培養物中の細胞内で行われる、８０〜８４のいずれかに記載の方法。
８７．前記接触が、ｉｎｖｉｖｏ（インビボ）の細胞内で行われる、８０〜８４のいずれかに記載の方法。
８８．前記細胞が真核細胞である、８６または８７に記載の方法。
８９．前記細胞が、植物細胞、真菌細胞、哺乳動物細胞、爬虫類細胞、昆虫細胞、鳥類細胞、魚類細胞、寄生生物細胞、節足動物細胞、無脊椎動物の細胞、脊椎動物の細胞、齧歯類細胞、マウス細胞、ラット細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞から選択される、８８に記載の方法。
９０．前記細胞が原核細胞である、８６または８７に記載の方法。

９１．前記接触が、（ａ）前記ＣａｓＹ融合ポリペプチド、または前記ＣａｓＹ融合ポリペプチドをコードする核酸分子、及び（ｂ）前記ＣａｓＹガイドＲＮＡ、または前記ＣａｓＹガイドＲＮＡをコードする核酸分子を細胞に導入することを含む、８０〜９０のいずれか１つに記載の方法。
９２．前記ＣａｓＹポリペプチドが、触媒不活性なＣａｓＹポリペプチド（ｄＣａｓＹ）である、８０〜９１のいずれか１つに記載の方法。
９３．前記ＣａｓＹポリペプチドが、配列番号１のＤ６７２、Ｅ７６９、及びＤ９３５から選択されるものに対応する位置に１つ以上の変異を含む、８０〜９２のいずれか１つに記載の方法。
９４．前記異種ポリペプチドが、標的ＤＮＡを修飾する酵素活性を示す、８０〜９３のいずれか１つに記載の方法。
９５．前記異種ポリペプチドが、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、ＤＮＡ修復活性、ＤＮＡ損傷活性、脱アミノ化活性、ジスムターゼ活性、アルキル化活性、脱プリン活性、酸化活性、ピリミジン二量体を形成する活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、及びグリコシラーゼ活性から選択される１つ以上の酵素活性を示す、９４に記載の方法。

９６．前記異種ポリペプチドが、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、脱アミノ化活性、脱プリン活性、インテグラーゼ活性、トランスポザーゼ活性、及びリコンビナーゼ活性から選択される１つ以上の酵素活性を示す、９５に記載の方法。
９７．前記異種ポリペプチドが、標的核酸と会合する標的ポリペプチドを修飾する酵素活性を示す、８０〜９３のいずれか１つに記載の方法。
９８．前記異種ポリペプチドが、ヒストン修飾活性を示す、９７に記載の方法。
９９．前記異種ポリペプチドが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、ＳＵＭＯ化活性、脱ＳＵＭＯ化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、脱ミリストイル化活性、グリコシル化活性（例えば、Ｏ−ＧｌｃＮＡｃトランスフェラーゼによる）、及び脱グリコシル化活性から選択される１つ以上の酵素活性を示す、９７または９８に記載の方法。
１００．前記異種ポリペプチドが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、及びデアセチラーゼ活性から選択される１つ以上の酵素活性を示す、９９に記載の方法。

１０１．前記異種ポリペプチドが、転写を増加させるかまたは減少させるタンパク質である、８０〜９３のいずれか１つに記載の方法。
１０２．前記異種ポリペプチドが転写抑制因子ドメインである、１０１に記載の方法。
１０３．前記異種ポリペプチドが転写活性化ドメインである、１０１に記載の方法。
１０４．前記異種ポリペプチドがタンパク質結合ドメインである、８０〜９３のいずれか１つに記載の方法。
１０５．ａ）ＣａｓＹポリペプチド、
ｂ）ＣａｓＹ融合ポリペプチド、及び
ｃ）ＣａｓＹガイドＲＮＡ
のうち１つ以上をコードするヌクレオチド配列を含む導入遺伝子をゲノムに含む、トランスジェニック多細胞非ヒト生物。

１０６．前記ＣａｓＹポリペプチドが、配列番号１または配列番号２に記載されるアミノ酸配列（または配列番号１〜８のいずれか１つに記載されるアミノ酸配列）に対して、５０％以上のアミノ酸配列同一性を有するアミノ酸配列を含む、１０５に記載のトランスジェニック多細胞非ヒト生物。
１０７．前記ＣａｓＹポリペプチドが、配列番号１または配列番号２に記載されるアミノ酸配列（または配列番号１〜８のいずれか１つに記載されるアミノ酸配列）に対して、８５％以上のアミノ酸配列同一性を有するアミノ酸配列を含む、１０５に記載のトランスジェニック多細胞非ヒト生物。
１０８．前記生物が、植物、単子葉植物、双子葉植物、無脊椎動物、昆虫、節足動物、クモ類、寄生生物、蠕虫、刺胞動物、脊椎動物、魚類、爬虫類、両生類、有蹄動物、鳥類、ブタ、ウマ、ヒツジ、齧歯類、マウス、ラット、または非ヒト霊長類である、１０５〜１０７のいずれか１つに記載のトランスジェニック多細胞非ヒト生物。
１０９．ａ）ＣａｓＹポリペプチド及びＣａｓＹガイドＲＮＡ、
ｂ）ＣａｓＹポリペプチド、ＣａｓＹガイドＲＮＡ、及びＤＮＡドナー鋳型、
ｃ）ＣａｓＹ融合ポリペプチド及びＣａｓＹガイドＲＮＡ、
ｄ）ＣａｓＹ融合ポリペプチド、ＣａｓＹガイドＲＮＡ、及びＤＮＡドナー鋳型、
ｅ）ＣａｓＹポリペプチドをコードするｍＲＮＡ、及びＣａｓＹガイドＲＮＡ、
ｆ）ＣａｓＹポリペプチドをコードするｍＲＮＡ、ＣａｓＹガイドＲＮＡ、及びＤＮＡドナー鋳型、
ｇ）ＣａｓＹ融合ポリペプチドをコードするｍＲＮＡ、及びＣａｓＹガイドＲＮＡ、
ｈ）ＣａｓＹ融合ポリペプチドをコードするｍＲＮＡ、ＣａｓＹガイドＲＮＡ、及びＤＮＡドナー鋳型、
ｉ）ｉ）ＣａｓＹポリペプチドをコードするヌクレオチド配列、及びｉｉ）ＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む１つ以上の組換え発現ベクター、
ｊ）ｉ）ＣａｓＹポリペプチドをコードするヌクレオチド配列、ｉｉ）ＣａｓＹガイドＲＮＡをコードするヌクレオチド配列、及びｉｉｉ）ＤＮＡドナー鋳型を含む１つ以上の組換え発現ベクター、
ｋ）ｉ）ＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列、及びｉｉ）ＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む１つ以上の組換え発現ベクター、ならびに
ｌ）ｉ）ＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列、ｉｉ）ＣａｓＹガイドＲＮＡをコードするヌクレオチド配列、及びＤＮＡドナー鋳型を含む１つ以上の組換え発現ベクターを含む、ＣａｓＹシステム。
１１０．前記ＣａｓＹポリペプチドが、配列番号１または配列番号２に記載されるアミノ酸配列（または配列番号１〜８のいずれか１つに記載されるアミノ酸配列）に対して、５０％以上のアミノ酸配列同一性を有するアミノ酸配列を含む、１０９に記載のＣａｓＹシステム。

１１１．前記ＣａｓＹポリペプチドが、配列番号１または配列番号２に記載されるアミノ酸配列（または配列番号１〜８のいずれか１つに記載されるアミノ酸配列）に対して、８５％以上のアミノ酸配列同一性を有するアミノ酸配列を含む、１０９に記載のＣａｓＹシステム。
１１２．前記ドナー鋳型核酸が、８ヌクレオチド〜１０００ヌクレオチドの長さを有する、１０９〜１１１のいずれかに記載のＣａｓＹシステム。
１１３．前記ドナー鋳型核酸が、２５ヌクレオチド〜５００ヌクレオチドの長さを有する、１０９〜１１１のいずれかに記載のＣａｓＹシステム。
１１４．１０９〜１１３のいずれか１つに記載のＣａｓＹシステムを含むキット。
１１５．前記キットの構成要素が同じ容器内にある、１１４に記載のキット。

１１６．前記キットの構成要素が別の容器内にある、１１４に記載のキット。
１１７．１０９〜１１６のいずれか１つに記載のＣａｓＹシステムを含む滅菌容器。
１１８．前記容器が注射器である、１１７に記載の滅菌容器。
１１９．１０９〜１１６のいずれか１つに記載のＣａｓＹシステムを含む埋込型装置。
１２０．前記ＣａｓＹシステムがマトリックス内にある、１１９に記載の埋込型装置。

１２１．前記ＣａｓＹシステムがリザーバー内にある、１１９に記載の埋込型装置。
１２２．ＣＲＩＳＰＲＲＮＡ誘導型エンドヌクレアーゼを同定する方法であって、
複数のメタゲノムヌクレオチド配列において、Ｃａｓ１ポリペプチドをコードするヌクレオチド配列を検出すること、
前記Ｃａｓ１をコードするヌクレオチド配列の近傍にあるＣＲＩＳＰＲ配列を検出すること、
検出されたＣＲＩＳＰＲ配列を含むＣＲＩＳＰＲ遺伝子座を、前記複数のメタゲノムヌクレオチド配列が由来する核酸試料から発現ベクターにクローニングして、組換えＣＲＩＳＰＲ遺伝子座発現ベクターを生成すること、
前記組換えＣＲＩＳＰＲ遺伝子座発現ベクターが標的核酸を切断する能力についてアッセイすること（標的核酸を切断する能力を有するＣＲＩＳＰＲ遺伝子座は、ＣＲＩＳＰＲＲＮＡ誘導型エンドヌクレアーゼをコードするヌクレオチド配列を含む）、及び
前記ＣＲＩＳＰＲ遺伝子座内において、既知のＣＲＩＳＰＲＲＮＡ誘導型エンドヌクレアーゼポリペプチドのアミノ酸配列に対して２０％未満のアミノ酸配列同一性を有するポリペプチドをコードするオープンリーディングフレームを同定することを含む、方法。
１２３．前記アッセイすることが、前記組換えＣＲＩＳＰＲ遺伝子座発現ベクター及び標的核酸を細胞に導入することを含む、１２２に記載の方法。

以下の実施例は、本発明の作製方法及び使用方法の完全な開示及び説明を当業者に提供するために記載するものであり、発明者が発明とみなすものの範囲を限定することを意図せず、また以下の実験が、すべてまたは唯一の実施された実験であることを意味することも意図しない。使用した数字（例えば、量、温度など）に関しては正確性を確保するよう努めたが、一部の実験誤差及び偏差が考慮されるべきである。特に記載のない限り、部は重量部であり、分子量は重量平均分子量であり、温度は摂氏度であり、圧力は大気圧または大気圧付近である。例えば、ｂｐ、塩基対（複数可）；ｋｂ、キロベース（複数可）；ｐｌ、ピコリットル（複数可）；ｓまたはｓｅｃ、秒（複数可）；ｍｉｎ、分（複数可）；ｈまたはｈｒ、時間（複数可）；ａａ、アミノ酸（複数可）；ｋｂ、キロベース（複数可）；ｂｐ、塩基対（複数可）；ｎｔ、ヌクレオチド（複数可）；ｉ．ｍ．、筋肉内（筋肉内に）；ｉ．ｐ．、腹腔内（腹腔内に）；ｓ．ｃ．、皮下（皮下に）などの標準的な略語を使用する場合がある。

実施例１
本明細書に記載の研究には、地下水、堆積物、及び酸性鉱山排水からの微生物群集のメタゲノム試料の分析を含む。培養生物には存在しない新たなクラス２のＣＲＩＳＰＲ−Ｃａｓシステムを同定した。

図３．ＣａｓＹドメイン及び類似性検索。（パネルＡ）ＨＨｐｒｅｄを使用した、ＡｃＣｐｆ１との遠隔ホモログアライメントから推定したＣａｓＹドメインの模式図。保存される触媒残基を、タンパク質の上部に赤いバーでマークしている。ＣａｓＹは、Ｃ末端領域のＲｕｖＣ分割ドメイン（ＲｕｖＣ−Ｉ、ＲｕｖＣ−ＩＩ、及びＲｕｖＣ−ＩＩＩ）、及び大きい新規Ｎ末端ドメインで構成される。模式図の下に、以下の検索に基づく上位ヒットを示す：（１）ＮＣＢＩ（モデル及び環境タンパク質を含むＮＲデータベース）の全タンパク質に対するＢＬＡＳＴ検索。（２）Ｍａｋａｒｏｖａｅｔａｌ．ＮａｔＲｅｖＭｉｃｒｏｂｉｏｌ．２０１５Ｎｏｖ；１３（１１）：７２２−３６、及びＳｈｍａｋｏｖｅｔａｌ．ＭｏｌＣｅｌｌ．２０１５Ｎｏｖ５；６０（３）：３８５−９７）に記載されるＣａｓタンパク質すべてを使用して構築されたモデルに基づく、プロファイル隠れマルコフモデル（ＨＭＭ）の検索。（３）ＨＨｐｒｅｄに基づく遠隔ホモログ検索。ヒットは、その有意性に基づいて色分けし、ヒット範囲及びＥ値を示している。注目すべき点として、ＣａｓＹは局所的なヒットのみであった。ＣａｓＹの８１２Ｎ末端アミノ酸は、極めてマイナーな部分ヒットを１つだけ有した。総合すると、これらの知見は、ＣａｓＹが新規のＣａｓタンパク質であることを示している。（パネルＢ）異なるＣａｓＹを含むＣＲＩＳＰＲ遺伝子座骨格を配列データから構築した。

実施例２
図４．ＣａｓＹ及びＣ２ｃ３遺伝子座の模式図。干渉タンパク質を緑で、取り込みタンパク質を赤で示している。ＲＮＡ構造を利用して折り畳まれるリピートを右側に示す。５’末端に強度のヘアピンが表れており、ＣａｓＹによるＣＲＩＳＰＲ配列の自己プロセシングを示唆している。

図５（パネルＡ〜Ｄ）ＣａｓＹによるＰＡＭ依存性プラスミド干渉。（パネルＡ）ＣａｓＹを用いてＰＡＭ欠失アッセイを実施した。ＣａｓＹＣＲＩＳＰＲ遺伝子座を含むＥ．ｃｏｌｉを、標的配列の５’または３’をランダム抽出した７ヌクレオチドのプラスミドライブラリで形質転換した。標的プラスミドを選別して、形質転換体をプールした。ランダムな領域を増幅して調製し、ディープシーケンシングした。欠失配列を同定し、これを使用してＰＡＭのロゴを生成した。（パネルＢ）生成したＣａｓＹ．１のＰＡＭロゴは、標的の５’隣接配列５’−ＴＡ−３’を含む配列に対して高い選択性を示した。３’ＰＡＭは検出されなかった。（パネルＣ）４種類のＰＡＭを直接アッセイして、ＰＡＭ欠失アッセイから決定されるＰＡＭを確認した。（パネルＤ）生成したＣａｓＹ．２のＰＡＭロゴは、標的の５’隣接配列５’−ＹＲ−３’及び／または５’−ＴＲ−３’（例えば、５’−ＤＴＲ−３’）（それぞれ下限閾値及び上限閾値）を含む配列に対して選択性を示した（ここで、ＹはＴまたはＣであり、ＲはＡまたはＧであり、ＤはＡ、Ｇ、またはＴである）。３’ＰＡＭは検出されなかった。

図６．（パネルＡ）天然のＣａｓＹガイドＲＮＡからの「リピート」配列（ＣａｓＹ遺伝子座Ｙ１〜Ｙ６に対応）。（パネルＢ）ＤＮＡ切断を誘導するＣａｓＹＲＮＡの図。ＣａｓＹタンパク質はリピート領域のｃｒＲＮＡ（ＣａｓＹガイドＲＮＡ）に結合する（黒、リピート；赤、スペーサー）。ガイドＲＮＡのガイド配列と、正しいプロトスペーサー隣接モチーフ（ＰＡＭ）を含む標的配列（青）との塩基対形成により、標的ＤＮＡの二本鎖切断が生じる。

実施例３：未培養微生物からの新規ＣＲＩＳＰＲ−Ｃａｓシステム
ＣＲＩＳＰＲ−Ｃａｓ適応免疫系は、部位特異的ＤＮＡ切断が可能であるプログラム可能な酵素を提供することにより、ゲノム工学に変革をもたらした。しかしながら、現在のＣＲＩＳＰＲ−Ｃａｓ技術は、培養細菌に由来するシステムのみに基づいているため、単離されていない生物に由来する大部分の酵素は未開発のままである。本明細書に示すデータは、古細菌の生命ドメインにおいて初めて報告されたＣａｓ９を含む新たなＣＲＩＳＰＲ−Ｃａｓシステムが、培養に依存しないゲノム解決型のメタゲノミクスを使用して同定されることを示している。この異なったＣａｓ９酵素は、現行のＣＲＩＳＰＲ−Ｃａｓシステムの一部としてはほとんど研究されていないナノ古細菌において見出された。細菌には、以前は未知であった２つのシステム、ＣＲＩＳＰＲ−ＣａｓＸ及びＣＲＩＳＰＲ−ＣａｓＹが発見された。これは、まだ解明されていない最も合理的なシステムに属する。注目すべきは、必要なすべての機能構成要素が、メタゲノミクスによって同定され、その結果、Ｅ．ｃｏｌｉにおける頑強なＲＮＡ誘導型ＤＮＡ干渉活性の検証を可能にしたことである。本明細書のデータは、生きた細胞での実験と併せて、環境微生物群集を調べることで、ゲノムの従来にない多様性を知ることが可能であり、その内容が、微生物を用いたバイオテクノロジーの守備範囲を広げるであろうことを示している。

結果
地下水、堆積物、及び酸性鉱山排水の微生物群集から得たテラベース規模のメタゲノムデータセットを分析し、培養生物には存在しない新たなクラス２のＣＲＩＳＰＲ−Ｃａｓシステムを探索した。最初に古細菌ドメインのＣａｓ９タンパク質を同定し、非培養細菌において、２つの新たなＣＲＩＳＰＲ−Ｃａｓシステム、ＣＲＩＳＰＲ−ＣａｓＸ及びＣＲＩＳＰＲ−ＣａｓＹを発見した（図７）。注目すべきは、古細菌Ｃａｓ９とＣａｓＹの両方が、既知の単離標本がない系統からの生物のゲノムにおいて排他的にコードされていることであった。

古細菌Ｃａｓ９の最初の同定
ＣＲＩＳＰＲ−Ｃａｓ９の特徴の一つは、細菌ドメインにのみ存在が推定されることであった。したがって、酸鉱山排水（ＡＭＤ）のメタゲノムデータセットにおいて、ナノ古細菌ＡＲＭＡＮ−１（ＣａｎｄｉｄａｔｕｓＭｉｃｒａｒｃｈａｅｕｍａｃｉｄｉｐｈｉｌｕｍＡＲＭＡＮ−１）及びＡＲＭＡＮ−４（ＣａｎｄｉｄａｔｕｓＰａｒｖａｒｃｈａｅｕｍＡＲＭＡＮ−４）のゲノムにコードされたＣａｓ９タンパク質が発見されたことは驚くべきことであった。これらの知見から、Ｃａｓ９を含むＣＲＩＳＰＲシステムが別の生命ドメインでも発生することがわかる。

ＡＲＭＡＮ−４ｃａｓ９遺伝子は、ゲノム内容が同じであるが、（２５ｋｂｐ超のいくつかのＤＮＡ配列コンティグの中央部に位置しているにもかかわらず）他の隣接するｃａｓ遺伝子がなく、隣接するＣＲＩＳＰＲリピート−スペーサー単位を１つだけもつ１６種類の試料に見出された（図１３）。一般的なＣＲＩＳＰＲ配列、及び一般的なＣＲＩＳＰＲインテグラーゼをコードするｃａｓ１の欠失は、新しいスペーサーを取り込む能力をもたないシステムであることを示す。スペーサー配列に対する標的は同定できなかったが、数年にわたって採取された試料の遺伝子座が保全されているとすれば、「単一標的」のＣＲＩＳＰＲ−Ｃａｓシステムでの機能をこの時点で排除することはできない。

逆に、１５種類の試料から回収されたＡＲＭＡＮ−１におけるＣＲＩＳＰＲ−Ｃａｓ遺伝子座は、ｃａｓ１、ｃａｓ２、ｃａｓ４、及びｃａｓ９遺伝子に隣接する大きなＣＲＩＳＰＲ配列を含む。大部分が保存された末端（おそらく最も古いスペーサーからなる）及び多くの異なったスペーサーが組み込まれた可変領域をもつ、多数の代替ＡＲＭＡＮ−１ＣＲＩＳＰＲ配列を再構成した（図８Ａ及び図１４）。スペーサー含量のこの超可変性に基づくと、これらのデータは、ＡＲＭＡＮ−１ＣＲＩＳＰＲ−Ｃａｓ９システムが試料集団において活動性であることを示している。

注目すべきことに、ＡＲＭＡＮ−１ＣＲＩＳＰＲ−Ｃａｓ９システムの５６の推定スペーサー標的（プロトスペーサー）は、単一の１０ｋｂｐのゲノム断片上に位置した。高密度の短い仮想タンパク質をコードしていることを考慮すると、これはＡＲＭＡＮ−１ウイルスである可能性が高い（図８Ｂ）。実際、クライオ電子断層撮影法による再構成では、ＡＲＭＡＮ細胞に結合したウイルス粒子が特定されることが多かった。ＡＲＭＡＮ−１プロトスペーサーはまた、ＡＲＭＡＮ−２（別のナノ古細菌）のゲノム内の推定トランスポゾン、及び同じ生態系のＩ−プラズマのものを含む、Ｔｈｅｒｍｏｐｌａｓｍａｔａｌｅｓ古細菌のゲノム内の推定流動要素に由来していた（図１５）。ＡＲＭＡＮとＴｈｅｒｍｏｐｌａｓｍａｔａｌｅｓ細胞との間に直接的な原形質「架橋」が観察され、両者の密接な関係を示唆した。したがって、ＡＲＭＡＮ−１ＣＲＩＳＰＲ−Ｃａｓ９は、これらの生物間でのトランスポゾンの増殖を抑止することができる。これは、真核生物の生殖系列での転移に対するｐｉＲＮＡ介在性の防御を連想させる役割である。

現行のＤＮＡ標的ＣＲＩＳＰＲ−Ｃａｓシステムは、自己と非自己を区別するために、標的配列に隣接する２〜４ｂｐのプロトスペーサー隣接モチーフ（ＰＡＭ）を使用する。ゲノム標的配列に隣接する配列を調べると、実際にＡＲＭＡＮ−１において「ＮＧＧ」ＰＡＭの高い選択性が明らかであった（図８Ｃ）。Ｃａｓ９はまた、ＲＮＡ誘導型ＤＮＡ切断のために、２つの個別の転写物、ＣＲＩＳＰＲＲＮＡ（ｃｒＲＮＡ）及びトランス活性化ＣＲＩＳＰＲＲＮＡ（ｔｒａｃｒＲＮＡ）を用いる。ＡＲＭＡＮ−１とＡＲＭＡＮ−４両方のＣＲＩＳＰＲ−Ｃａｓ９システムの近傍に推定ｔｒａｃｒＲＮＡが同定された（図１６）。ｃｒＲＮＡ−ｔｒａｃｒＲＮＡ誘導複合体の成熟を担う宿主因子、ＲＮａｓｅＩＩＩが欠損しているため、ＩＩ型ＣＲＩＳＰＲシステムは古細菌に存在しないことが以前に示唆されていた。注目すべきことに、ＡＲＭＡＮ−１ゲノム（９５％完全と推定）に同定されたＲＮａｓｅＩＩＩホモログはなく、ＣＲＩＳＰＲ配列に予測される内部プロモーターもなく、今まで未確認のガイドＲＮＡの産生メカニズムであることが示唆された。Ｅ．ｃｏｌｉ及び酵母の両方から精製したＡＲＭＡＮ−１及びＡＲＭＡＮ−４Ｃａｓ９タンパク質の切断活性を試験する生化学的実験、及びｉｎｖｉｖｏＥ．ｃｏｌｉ標的アッセイでは、検出可能な活性はまったく示されなかった（図２１及び図１７を参照）。

ＣＲＩＳＰＲ−ＣａｓＸは、新たな二重ＲＮＡ誘導型ＣＲＩＳＰＲシステムである
Ｃａｓ９に加えて、発見され、実験的に検証されているクラス２のＣａｓエフェクタータンパク質のファミリーは、Ｃｐｆ１、Ｃ２ｃ１、及びＣ２ｃ２の３つのみである。小さいＤＮＡ断片にのみ同定された別の遺伝子ｃ２ｃ３もまた、このようなタンパク質ファミリーをコードすることが示唆されている。新たな種類のクラス２のＣＲＩＳＰＲ−Ｃａｓシステムが、地下水試料及び堆積物試料から繰り返し回収した２種類の細菌ゲノムに見出された。属する種族が異なる２つの生物、Ｄｅｌｔａｐｒｏｔｅｏｂａｃｔｅｒｉａ及びＰｌａｎｃｔｏｍｙｃｅｔｅｓにおけるこのシステムの高度な保存性は、最近の近縁種間転写を示唆している。この新たに記載されるシステムは、Ｃａｓ１、Ｃａｓ２、Ｃａｓ４、及び本明細書でＣａｓＸと称する特性が未知の約９８０ａａのタンパク質を含む。各ＣａｓＸと関連するＣＲＩＳＰＲ配列は、酷似した３７塩基対のリピート、３３〜３４塩基対のスペーサー、及びＣａｓオペロンとＣＲＩＳＰＲ配列との間の推定ｔｒａｃｒＲＮＡを有していた（図７Ｂ）。ＢＬＡＳＴ検索によると、トランスポザーゼに対して弱い類似性（ｅ値＞１×１０^-4）のみを示し、類似性はＣａｓＸＣ末端の特定領域に限定された。遠隔相同性の検出及びタンパク質モデリングでは、Ｖ型ＣＲＩＳＰＲ−Ｃａｓシステムに見られるものを連想させる組織をもつＣａｓＸＣ末端近傍のＲｕｖＣドメインが同定された（図１８）。ＣａｓＸタンパク質の残部（６３０個のＮ末端アミノ酸）は、どの既知のタンパク質とも検出可能な類似性を示さず、これが新たなクラス２のエフェクターであることを示唆した。ｔｒａｃｒＲＮＡとＣａｓ１、Ｃａｓ２、及びＣａｓ４の個々のタンパク質との組み合わせは、Ｖ型システムの中でも独特である。さらに、ＣａｓＸは、任意の既知のＶ型タンパク質よりもかなり小さく、Ｃｐｆ１、Ｃ２ｃ１、及びＣ２ｃ３の通常サイズ１２００ａａ超と比較して９８０ａａである。

次なる疑問点は、その小さなサイズと非標準遺伝子座の含量にもかかわらず、ＣａｓＸがＣａｓ９及びＣｐｆ１酵素と類似するＲＮＡ誘導型ＤＮＡ標的化が可能であるかどうかということであった。この可能性を試験するために、ｃａｓＸ、短いリピート−スペーサー配列、及び間にあるノンコーディング領域を含む最小のＣＲＩＳＰＲ−ＣａｓＸ遺伝子座をコードするプラスミドを合成した。Ｅ．ｃｏｌｉで発現させると、この最小遺伝子座は、メタゲノム解析で同定された標的配列をもつプラスミドによる形質転換を遮断した（図９Ａ〜Ｃ、図１９）。さらに、ミニ遺伝子座におけるスペーサー配列がプラスミド標的のプロトスペーサー配列と一致した場合にのみ、形質転換の干渉が起こった。ＣａｓＸのＰＡＭ配列を同定するために、標的部位に隣接する５’または３’いずれかのランダム配列を含むプラスミドを使用して、Ｅ．ｃｏｌｉにおいて形質転換アッセイを繰り返した。この分析により、プロトスペーサー配列のすぐ５’側に位置する配列「ＴＴＣＮ」に対して、厳密な選択性が示された（図９Ｄ）。３’のＰＡＭ選択性は観察されなかった（図１９）。この知見と一致して、「ＴＴＣＡ」は、環境試料で同定された推定ＤｅｌｔａｐｒｏｔｅｏｂａｃｔｅｒｉａＣＲＩＳＰＲ−ＣａｓＸのプロトスペーサー上流に見られる配列であった。注目すべきは、ＣａｓＸタンパク質の高度な相同性と同様、ＣＲＩＳＰＲ−ＣａｓＸの両方の遺伝子座が同じＰＡＭ配列を共有していることである。

Ｖ型ＣＲＩＳＰＲ遺伝子座には、一本鎖ＲＮＡ及び二本鎖ＲＮＡ誘導型システムいずれの例も存在する。環境メタトランスクリプトームデータを使用して、ＣａｓＸがＤＮＡの標的化活性にｔｒａｃｒＲＮＡを必要とするかどうかを決定した。この分析により、Ｃａｓ２オープンリーディングフレームとＣＲＩＳＰＲ配列との間にコードされたＣＲＩＳＰＲリピートと相補的な配列をもつノンコーディングＲＮＡ転写物が明らかになった（図１０Ａ）。さらにトランスクリプトームマッピングは、ＣＲＩＳＰＲＲＮＡ（ｃｒＲＮＡ）が、ＣＲＩＳＰＲ−Ｃａｓ９システムで起こるｃｒＲＮＡプロセシングと同様に、２２ｎｔのリピート及び２０ｎｔの隣接スペーサーを含むようにプロセシングされることを示唆している（図１０Ａ）。また、ｃｒＲＮＡ−ｔｒａｃｒＲＮＡ二重鎖のＲＮａｓＩＩＩ介在性のプロセシングと一致する、２ｎｔの３’オーバーハングが同定された（図１０Ｂ）。推定ｔｒａｃｒＲＮＡに対するＣａｓＸ活性の依存性を決定するために、上述した最小のＣＲＩＳＰＲ−ＣａｓＸ遺伝子座からこの領域を欠失させ、プラスミド干渉アッセイを繰り返した。推定ｔｒａｃｒＲＮＡコード配列をＣａｓＸプラスミドから欠失させると、存在時に観察された頑強な形質転換干渉が無効化された（図１０Ｃ）。これらの結果を総合すると、ＣａｓＸは、新たな機能性ＤＮＡ標的化二本鎖ＲＮＡ誘導型ＣＲＩＳＰＲ酵素であると確定される。

ＣＲＩＳＰＲ−ＣａｓＹ、分離株を欠く細菌系統でのみ見出されたシステム
特定の候補門放散（ｃａｎｄｉｄａｔｅｐｈｙｌａｒａｄｉａｔｉｏｎ：ＣＰＲ）細菌のゲノムにコードされた別の新たなクラス２のＣａｓタンパク質を同定した。これらの細菌は通常、細胞の大きさが小さく（クライオＴＥＭデータ及び濾過による濃縮に基づく）、ゲノムが極小であり、生合成能力が限られている。このことは、これらの細菌がほぼ間違いなく共生生物であることを示している。本明細書でＣａｓＹと称する、新たな約１２００ａａのＣａｓタンパク質は、Ｃａｓ１及びＣＲＩＳＰＲ配列程度しか含まない最小のＣＲＩＳＰＲ−Ｃａｓシステムに属すると思われる（図１１Ａ）。ＣＲＩＳＰＲ配列のほとんどは、１７〜１９ｎｔの異常に短いスペーサーを有するが、Ｃａｓ１を欠く、あるシステム（ＣａｓＹ．５）はそれよりも長いスペーサー（２７〜２９ｎｔ）を有している。同定されたＣａｓＹタンパク質の６つの例は、公開データベースのどのタンパク質とも有意な配列類似性を有していなかった。公開されたＣａｓタンパク質３、４から構築されたプロファイルモデル（ＨＭＭ）を使用した高感度検索は、６つのＣａｓＹタンパク質のうち４つが、ＲｕｖＣドメインと重複するＣ末端領域及びＮ末端の小領域（約４５ａａ）に、Ｃ２ｃ３に対する局所類似性（ｅ値４×１０^-11 〜３×１０^-18 ）を有することを示した（図１８参照）。Ｃ２ｃ３は、分類学的関係のない短いコンティグに同定された推定Ｖ型Ｃａｓエフェクターであり、実験的には確認されていない。ＣａｓＹ同様、Ｃ２ｃ３は、短いスペーサーとＣａｓ１をもつ配列の隣に見られたが、他のＣａｓタンパク質をもつ配列には見られない。注目すべきは、現在の研究で同定されたＣａｓＹタンパク質のうち２つが、他のＣａｓＹタンパク質と有意な配列類似性（Ｂｌａｓｔの最適ヒット：ｅ値６×１０^-85 、７×１０^-75 ）を共有しているにもかかわらず、Ｃ２ｃ３に対して有意な類似性を有さなかったことである。

実験的に検証されたどのＣＲＩＳＰＲ遺伝子座に対してもＣＲＩＳＰＲ−ＣａｓＹの相同性が低いことを考慮すると、次なる疑問点は、このシステムがＲＮＡ誘導型ＤＮＡ干渉を付与するかどうかであったが、スペーサー長が短いため、そのような活性に必要とされ得る可能なＰＡＭモチーフに関して信頼性の高い情報が存在しなかった。これに対処するために、ＣＲＩＳＰＲ−ＣａｓＹ．１遺伝子座全体を、短縮型ＣＲＩＳＰＲ配列を用いて合成し、プラスミドベクターでＥ．ｃｏｌｉに導入した。次に、形質転換アッセイにおいて、配列内のスペーサー配列と一致し、隣接するランダムな５’または３’領域を含む配列をもつ標的プラスミドを使用してこの細胞を攻撃し、可能性のあるＰＡＭを同定した。形質転換体の分析では、標的配列にすぐ隣接する５’ＴＡを含む配列の欠失が明らかになった（図１１Ｂ）。この同定されたＰＡＭ配列を使用して、ＣａｓＹ．１遺伝子座を単一のＰＡＭを含むプラスミドに対して試験した。同定された５’ＴＡＰＡＭ配列を含む標的が存在する場合のみプラスミド干渉を示した（図１１Ｃ）。したがって、これらのデータは、ＣＲＩＳＰＲ−ＣａｓＹがＤＮＡ干渉活性を有することを示している。

考察
未培養細菌及び古細菌由来のゲノムにおける新たなクラス２のＣＲＩＳＰＲ−Ｃａｓ適応免疫系を同定し、特性決定した。現行のＣＲＩＳＰＲ遺伝子座に共通する、Ｃａｓ１の進化分析（図１２Ａ）は、本明細書に記載の古細菌Ｃａｓ９システムが明確にはどの既存のＩＩ型サブタイプにも分類されないことを示唆した。Ｃａｓ１の系統（ならびにｃａｓ４の存在）は、ＩＩ−Ｂ型のシステムと一緒に群化されるが、Ｃａｓ９の配列は、ＩＩ−Ｃ型タンパク質との類似性が高かった（図２０）。したがって、古細菌ＩＩ型システムはＩＩ−Ｃ型及びＩＩ−Ｂ型システムの融合体として生じた可能性がある（図１２Ｂ）。同様に、Ｃａｓ１系統発生分析では、ＣＲＩＳＰＲ−ＣａｓＸシステムのＣａｓ１は、他のどの既知のＶ型システムからも遠いことが示された。Ｖ型システムは、祖先Ｉ型システムからの適応モジュールを有するトランスポゾン融合（Ｃａｓ１−Ｃａｓ２）の結果であると示唆されている。したがって、ＣＲＩＳＰＲ−ＣａｓＸシステムは、前述したＶ型システムに生じたものとは異なる融合事象の後に生じると仮定される。驚くべきことに、ＣＲＩＳＰＲ−ＣａｓＹと推定Ｃ２ｃ３システムの両方が、ＣＲＩＳＰＲ遺伝子座へのＤＮＡの組み込みに不可欠であると考えられるタンパク質、Ｃａｓ２を欠いていると思われる。すべてのＣＲＩＳＰＲ−Ｃａｓシステムが、Ｃａｓ１とＣａｓ２の両方を含んだ祖先Ｉ型システムの子孫であると考えられていることを考慮すると、ＣＲＩＳＰＲ−ＣａｓＹ及びＣ２ｃ３システムはいずれも、それ以外のＣＲＩＳＰＲ−Ｃａｓシステムとは異なる祖先を有するか、あるいは両システムの進化の歴史の過程でＣａｓ２が失われた可能性がある。

本明細書に記載する、古細菌でのＣａｓ９の発見、及び以前は未知であった２つのＣＲＩＳＰＲ−Ｃａｓシステムの細菌での発見には、複雑な天然微生物群集から得た網羅的なＤＮＡ及びＲＮＡ配列データセットを使用した。ＣａｓＸ及びＣａｓＹの場合、未アセンブルの配列情報から明らかにされていない機能の予測には、ゲノム内容が不可欠であった。さらに、メタゲノムデータ支援型の機能試験の分析を通じて、推定ｔｒａｃｒＲＮＡの同定、ならびに標的ウイルス配列を明らかにした。興味深いことに、これまでに同定された最もコンパクトなＣＲＩＳＰＲ−Ｃａｓ遺伝子座のいくつかは、極小ゲノムを有する生物で発見された。ゲノムサイズが小さい結果、このような生物は基本的な代謝条件が群集の他のメンバーによって左右されるため、大部分が従来の培養による方法の範囲から除外されたままであった。干渉に必要とされるタンパク質の数が限定されるため、これらの最小システムは、新たなゲノム編集ツールの開発に特に有益である。重要なことに、ＣＲＩＳＰＲ−Ｃａｓシステムに関するメタゲノムの発見は、ｉｎｓｉｌｉｃｏでの観察に限定されるものではなく、その機能を試験することができる実験環境に導入可能であることが本明細書で示されている。今後、生命が存在する事実上すべての環境をゲノム解決型メタゲノム法によって実証できるとすれば、本明細書に記載の複合的な計算−実験的アプローチは、既知のＣＲＩＳＰＲ−Ｃａｓシステムの多様性を大いに拡大し、生物学的研究及び臨床応用のための新技術を提供するものと期待される。

方法
メタゲノミクスとメタトランスクリプトーム
次の異なる３箇所から得たメタゲノム試料を分析した：（１）２００６年〜２０１０年にカリフォルニア州アイアンマウンテン、リッチモンド鉱山から採取した酸性鉱山排水（ＡＭＤ）試料、（２）２００７年〜２０１３年にコロラド州ライフル近郊コロラド川沿いのＲｉｆｌｅＩｎｔｅｇｒａｔｅｄＦｉｅｌｄＲｅｓｅａｒｃｈ（ＩＦＲＣ）の敷地から採取した地下水及び堆積物試料、（３）２００９年及び２０１４年にユタ州コロラド高原のＣＯ₂ 噴出冷間欠泉、ＣｒｙｓｔａｌＧｅｙｓｅｒから採取した地下水。

ＡＭＤのデータに関しては、ＤＮＡ抽出方法及びショートリード配列決定が、ＤｅｎｅｆａｎｄＢａｎｆｉｅｌｄ（２０１２）及びＭｉｌｌｅｒｅｔａｌ．（２０１１）によって報告された。Ｒｉｆｌｅのデータに関しては、ＤＮＡ及びＲＮＡの抽出、ならびに配列決定、アセンブル、及び再構成されたゲノムが、Ａｎａｎｔｈａｒａｍａｎｅｔａｌ．（２０１６）及びＢｒｏｗｎｅｔａｌ．（２０１５）によって記載された。ＣｒｙｓｔａｌＧｅｙｓｅｒからの試料に関しては、Ｐｒｏｂｓｔｅｔａｌ（２０１６）及びＥｍｅｒｓｏｎｅｔａｌ．（２０１５）によって記載された方法に従っている。簡潔には、ＰｏｗｅｒＳｏｉｌＤＮＡ単離キット（ＭｏＢｉｏＬａｂｏｒａｔｏｒｉｅｓＩｎｃ．，Ｃａｒｌｓｂａｄ，ＣＡ，ＵＳＡ）を使用して試料からＤＮＡを抽出した。Ｂｒｏｗｎｅｔａｌ．（２０１５）によって記載されているように、６つの２０１１年のＲｉｆｌｅ地下水試料からＲＮＡを回収して、０．２μｍフィルターから抽出した。ＩｌｌｕｍｉｎａＨｉＳｅｑ２０００プラットフォームでＤＮＡを配列決定し、５５００ＸＬＳＯＬｉＤプラットフォームでメタトランスクリプトームｃＤＮＡを配列決定した。ＣｒｙｓｔａｌＧｅｙｓｅｒのデータの新規報告、及びＡＭＤのデータの再分析のために、ＩＤＢＡ−ＵＤを用いて配列をアセンブルした。配列決定範囲及び遺伝子発現をそれぞれ決定するために使用されるＤＮＡ及びＲＮＡ（ｃＤＮＡ）のリードマッピングを、Ｂｏｗｔｉｅ２を使用して実施した。Ｐｒｏｄｉｇａｌを使用してアセンブルした骨格に基づいてオープンリーディングフレーム（ＯＲＦ）を予測した。ＡＢＡＷＡＣＡ、ＡＢＡＷＡＣＡ２（ｈｔｔｐｓ：／／ｇｉｔｈｕｂ．ｃｏｍ／ＣＫ７）Ｍａｘｂｉｎ２の組み合わせを使用して、差次的な重複度の存在量パターンに基づいて、ＣｒｙｓｔａｌＧｅｙｓｅｒのデータセットから得た骨格をビニングし、ＥｍｅｒｇｅｎｔＳｅｌｆ−ＯｒｇａｎｉｚｉｎｇＭａｐｓ（ＥＳＯＭ）を使用してテトラヌクレオチド頻度をビニングした。ゲノムは、ＧＣ含量％、分類学的関係、及びゲノムの完全性を用いて手動でキュレーションした。骨格構築エラーを、ｒａ２．ｐｙ（ｈｔｔｐｓ：／／ｇｉｔｈｕｂ．ｃｏｍ／ｃｈｒｉｓｔｏｐｈｅｒｔｂｒｏｗｎ）を使用して補正した。

ＣＲＩＳＰＲ−Ｃａｓ計算解析
種々の試料からアセンブルしたコンティグを、Ｍａｋａｒｏｖａｅｔａｌ．及びＳｈｍａｋｏｖｅｔａｌ．によるアライメントに基づいて、ＨＭＭｅｒスイートを使用して構築された隠れマルコフモデル（ＨＭＭ）プロファイルを用いてスキャンして既知のＣａｓタンパク質を探索した。ＣｒｉｓｐｒＦｉｎｄｅｒソフトウェアのローカルバージョンを使用して、ＣＲＩＳＰＲ配列を同定した。ｃａｓ１遺伝子に隣接する１０のＯＲＦのうち１つが、８００ａａより大きい、特性が未知のタンパク質をコードしているかどうか、及び同じコンティグに既知のｃａｓ干渉遺伝子が同定されていないかどうか、Ｃａｓ１及びＣＲＩＳＰＲ配列の両方を含む遺伝子座をさらに分析した。この大きなタンパク質をクラス２のＣａｓエフェクター候補としてさらに分析した。エフェクター候補を、ＭＣＬを使用して配列類似性に基づいたタンパク質ファミリーに群化した。これらのファミリーのそれぞれを代表するＨＭＭを構築し、類似するＣａｓタンパク質のメタゲノムデータセットの検索に使用することにより、これらのタンパク質ファミリーを拡張した。タンパク質ファミリーが事実上、新しいことを確認するために、ＢＬＡＳＴを使用して、ＮＣＢＩの非重複（ｎｒ）及びメタゲノム（ｅｎｖ＿ｎｒ）タンパク質データベースに対して既知のホモログを検索し、ならびにＵｎｉＰｒｏｔＫｎｏｗｌｅｄｅｇｅＢａｓｅに対してＨＭＭを検索した。全長ヒット（タンパク質の長さの２５％超）がないタンパク質のみを新規タンパク質とみなした。推定Ｃａｓタンパク質の遠隔相同性検索を、ＨＨ−ｓｕｉｔｅのＨＨｐｒｅｄを使用して実施した。ハイスコアのＨＨｐｒｅｄヒットを使用して、決定された結晶構造及びＪＰｒｅｄ４によって予測した二次構造との比較に基づいてドメインアーキテクチャを推定した。新たに発見されたＣａｓタンパク質を含む、ＨＭＭデータベースは、補足データ１に記載している。

スペーサー配列は、ＣｒｉｓｐｒＦｉｎｄｅｒを使用してアセンブルしたデータから決定した。ＣＲＡＳＳを使用して、関連する試料の短いＤＮＡリードで追加のスペーサーの配置を特定した。次に、スペーサー標的（プロトスペーサー）を、スペーサーに対するミスマッチが１以下のヒットの関連するメタゲノムアセンブルに対するＢＬＡＳＴ検索（「−ｔａｓｋｂｌａｓｔｎ−ｓｈｏｒｔ」を使用）によって同定した。関連するリピートを含んだコンティグに属するヒットは除外した（ＣＲＩＳＰＲ配列をプロトスペーサーとして同定することを回避するため）。プロトスペーサーに隣接する領域をアライメントすることにより、プロトスペーサー隣接モチーフ（ＰＡＭ）を同定し、ＷｅｂＬｏｇｏを使用して可視化した。ＲＮＡ構造はｍＦｏｌｄを使用して予測した。アセンブルしたデータからのスペーサー、リピート、及び隣接配列を手動でアライメントすることにより、ＣＲＩＳＰＲ配列の多様性を分析した。手動アライメント及びコンティグの可視化は、Ｇｅｎｅｉｏｕｓ９．１を用いて実施した。

新たに同定されたシステムのＣａｓ１及びＣａｓ９タンパク質の系統発生分析のため、Ｍａｋａｒｏｖａｅｔａｌ．及びＳｈｍａｋｏｖｅｔａｌ．によるタンパク質とともに使用した。ＣＤ−ＨＩＴを使用して、９０％以上同一性のあるタンパク質をまとめて群化することにより、非重複セットを編集した。ＭＡＦＦＴでアライメントを作成し、ＲＡｘＭＬを使用して、代入モデルＰＲＯＴＧＡＭＭＡＬＧ及び１００ブートストラップサンプリングで最尤系統発生を構成した。ｃａｓｐｏｓｏｎに至る分岐を用いてＣａｓ１のツリーのルートを決定した。ＦｉｇＴｒｅｅ１．４．１（ｈｔｔｐ：／／ｔｒｅｅ．ｂｉｏ．ｅｄ．ａｃ．ｕｋ／ｓｏｆｔｗａｒｅ／ｆｉｇｔｒｅｅ／）及びｉＴＯＬｖ３を使用して、ツリーを可視化した。

異種プラスミドの作製
ＣａｓＸの取り込みに関連するタンパク質を除去し、ＣａｓＸとＣａｓＹ両方のＣＲＩＳＰＲ配列のサイズを減少させることによって、メタゲノムコンティグから最小ＣＲＩＳＰＲ干渉プラスミドを作製した。最小遺伝子座はＧｂｌｏｃｋｓ（ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｙ）として合成し、ＧｉｂｓｏｎＡｓｓｅｍｂｌｙを使用してアセンブルした。

ＰＡＭ欠失アッセイ
以前の記載に改変を加えてＰＡＭ欠失アッセイを実施した。７ｎｔのランダムなＰＡＭ領域をもつ標的を含むＤＮＡオリゴヌクレオチドをプライマーとアニーリングすることによって、ランダムなＰＡＭ配列を含むプラスミドライブラリをアセンブルし、クレノウ断片（ＮＥＢ）で伸長させた。二本鎖ＤＮＡをＥｃｏＲＩ及びＮｃｏＩで消化して、ｐＵＣ１９骨格にライゲーションした。ライゲーションしたライブラリをＤＨ５αに形質転換して、１０⁸ 超の細胞を回収し、プラスミドを抽出し、精製した。ＣＲＩＳＰＲ遺伝子座を保有するエレクトロコンピテントＥ．ｃｏｌｉ、または遺伝子座をもたない対照プラスミドに、プールされたライブラリ２００ｎｇを形質転換した。カルベニシリン（１００ｍｇＬ^-1）及びクロラムフェニコール（３０ｍｇＬ^-1）を含有する選択培地に形質転換細胞をプレーティングし、２５℃で３０時間培養した。プラスミドＤＮＡを抽出し、アダプターを付加してＰＡＭ配列を増幅し、Ｉｌｌｕｍｉｎａで配列決定した。７ｎｔのＰＡＭ領域を抽出し、各７ｎｔの配列についてＰＡＭ頻度を算出した。指定閾値を超える欠失のあるＰＡＭ配列を使用して、ＷｅｂＬｏｇｏを作成した。

プラスミド干渉
メタゲノム配列解析またはＰＡＭ欠失アッセイから同定された推定標的をｐＵＣ１９プラスミドにクローニングした。１０ｎｇの標的プラスミドを、ＣＲＩＳＰＲ遺伝子座プラスミドを含むエレクトロコンピテントＥ．ｃｏｌｉ（ＮＥＢ安定）に形質転換した。細胞を２５℃で２時間回復させ、適切な希釈液を選択培地にプレーティングした。プレートを２５℃でインキュベートし、コロニー形成単位を計数した。プラスミド干渉実験はすべて３連で実施し、エレクトロコンピテント細胞は複製物ごとに個別に調製した。

ＡＲＭＡＮ−Ｃａｓ９タンパク質の発現及び精製
ＡＲＭＡＮ−１（ＡＲ１）及びＡＲＭＡＮ−４（ＡＲ４）から得たＣａｓ９の発現構築物を、Ｅ．ｃｏｌｉ用にコドン最適化されたｇＢｌｏｃｋｓ（ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓ）からアセンブルした。アセンブルした遺伝子を、Ｎ末端Ｈｉｓ₆ −ＭＢＰまたはＨｉｓ₆ 融合タンパク質として、ｐＥＴ系の発現ベクターにクローニングした発現ベクターをＢＬ２１（ＤＥ３）Ｅ．ｃｏｌｉ細胞に形質転換し、ＬＢブロス中にて３７℃で増殖させた。タンパク質を発現させるため、中間対数期の間、０．４ｍＭのＩＰＴＧ（イソプロピルβ−Ｄ−１−チオガラクトピラノシド）で細胞を誘導し、１６℃で一晩インキュベートした。以降の工程はすべて、４℃で実施した。細胞ペレットを溶解緩衝液（５０ｍＭＴｒｉｓ−ＨＣｌｐＨ８、５００ｍＭＮａＣｌ、１ｍＭＴＣＥＰ、１０ｍＭイミダゾール）０．５％ＴｒｉｔｏｎＸ−１００に再懸濁し、Ｃｏｍｐｌｅｔｅプロテアーゼ阻害混合物（Ｒｏｃｈｅ）を補充した後、超音波処理により溶解した。溶解物を１５０００ｇで４０分間遠心分離して清澄化し、ＳｕｐｅｒｆｌｏｗＮｉ−ＮＴＡアガロース（Ｑｉａｇｅｎ）にバッチで適用した。樹脂を洗浄緩衝液Ａ（５０ｍＭＴｒｉｓ−ＨＣｌｐＨ８、５００ＭＮａＣｌ、１ｍＭＴＣＥＰ、１０ｍＭイミダゾール）、続いて５カラム体積の洗浄緩衝液Ｂ（５０ｍＭＴｒｉｓ−ＨＣｌｐＨ８、１ＭＮａＣｌ、１ｍＭＴＣＥＰ、１０ｍＭイミダゾール）で十分に洗浄した。溶出緩衝液（５０ｍＭＴｒｉｓ−ＨＣｌｐＨ８、５００ｍＭＮａＣｌ、１ｍＭＴＣＥＰ、３００ｍＭイミダゾール）で、Ｎｉ−ＮＴＡ樹脂からタンパク質を溶出した。洗浄緩衝液Ａに対する一晩の透析中に、ＴＥＶプロテアーゼによってＨｉｓ６−ＭＢＰタグを除去した。第２のＮｉ−ＮＴＡアガロースカラムを通して、切断されたＣａｓ９をアフィニティタグから除去した。ＩＥＸ緩衝液Ａ（５０ｍＭＴｒｉｓ−ＨＣｌｐＨ７．５、３００ｍＭＮａＣｌ、１ｍＭＴＣＥＰ、５％グリセロール）にタンパク質を透析した後、５ｍＬＨｅｐａｒｉｎＨｉＴｒａｐカラム（ＧＥＬｉｆｅＳｃｉｅｎｃｅｓ）にかけた。Ｃａｓ９をＮａＣｌ（０．３〜１．５Ｍ）の線形勾配で溶出した。画分をプールし、３０ｋＤａのスピン濃縮器（ＴｈｅｒｍｏＦｉｓｈｅｒ）で濃縮した。必要に応じて、Ｓｕｐｅｒｄｅｘ２００ｐｇカラム（ＧＥＬｉｆｅＳｃｉｅｎｃｅｓ）でのサイズ排除クロマトグラフィーによってＣａｓ９をさらに精製し、その後の切断アッセイに備えてＩＥＸ緩衝液Ａ中に保存した。酵母を発現させるため、ＡＲ１−Ｃａｓ９を、Ｇａｌ１／１０Ｈｉｓ６−ＭＢＰＴＥＶＵｒａＳ．ｃｅｒｅｖｉｓｉａｅ発現ベクター（Ａｄｄｇｅｎｅプラスミド＃４８３０５）にクローニングした。ベクターをＢＹ４７４１ＵＲＡ３株に形質転換し、培養物を培地中にて３０℃で増殖させた。ＯＤ６００が約０．６のとき、２％ｗ／ｖガラクトースでタンパク質発現を誘導し、１６℃で一晩インキュベートした。タンパク質精製を上記の通り実施した。

ＲＮＡのｉｎｖｉｔｒｏ転写とオリゴヌクレオチド精製
Ｔ７プロモーター配列を含む合成ＤＮＡ鋳型を使用して、以前の記載のように６５、ｉｎｖｉｔｒｏ転写反応を実施した。ｉｎｖｉｔｒｏ転写したガイドＲＮＡ及び標的ＲＮＡまたはＤＮＡをすべて変性ＰＡＧＥによって精製した。２０ｍＭＴｒｉｓＨＣｌｐＨ７．５及び１００ｍＭＮａＣｌ中で、９５℃で１分間インキュベートすることにより二本鎖標的ＲＮＡ及びＤＮＡをハイブリダイズさせた後、室温まで徐冷した。非変性ＰＡＧＥによってハイブリッドを精製した。

ｉｎｖｉｔｒｏ切断アッセイ
精製したＤＮＡ及びＲＮＡオリゴヌクレオチドを、１倍ＰＮＫ緩衝液中にて、３７℃で３０分間、Ｔ４ポリヌクレオチドキナーゼ（ＮＥＢ）及び［γ−３２Ρ］ＡＴＰ（Ｐｅｒｋｉｎ−Ｅｌｍｅｒ）を用いて放射性標識した。ＰＮＫを６５℃で２０分間熱失活させ、ｉｌｌｕｓｔｒａＭｉｃｒｏｓｐｉｎＧ−２５カラム（ＧＥＬｉｆｅＳｃｉｅｎｃｅｓ）を使用して遊離ＡＴＰを標識反応物から除去した。１倍リフォールディング緩衝液（５０ｍＭＴｒｉｓＨＣｌｐＨ７．５、３００ｍＭＮａＣｌ、１ｍＭＴＣＥＰ、５％グリセロール）中で、ＣｒＲＮＡとｔｒａｃｒＲＮＡｓを等モル量で混合し、７０℃で５分間インキュベートした後、室温まで徐冷した。最終金属濃度１ｍＭまで反応物を補充し、引き続き５０℃で５分間加熱した。室温まで徐冷した後、リフォールディングしたガイドを氷上に置いた。緩衝液、塩濃度の指定がない限り、Ｃａｓ９は、１倍切断緩衝液（５０ｍＭＴｒｉｓＨＣｌｐＨ７．５、３００ｍＭＮａＣｌ、１ｍＭＴＣＥＰ、５％グリセロール、５ｍＭ二価金属）中にて、３７℃で１０分間、等モル量のガイドと再構成した。放射性標識標的よりも１０倍過剰のＣａｓ９ガイド複合体を用いて、１倍切断緩衝液中にて３７℃または指定温度で、切断反応を実施した。５０ｍＭＥＤＴＡを補充した等体積のゲルローディング緩衝液で反応をクエンチした。切断産物を１０％変性ＰＡＧＥで分離し、リン光によって可視化した。

ｉｎｖｉｖｏＥ．ｃｏｌｉ干渉アッセイ
ＡＲ１−Ｃａｓ９及びＡＲ４−Ｃａｓ９のＥ．ｃｏｌｉ形質転換アッセイは、以前に公開された６６通りに実施した。簡潔には、ガイドＲＮＡで形質転換したＥ．ｃｏｌｉをエレクトロコンピテントにした。次に、野生型または触媒不活性のＣａｓ９（ｄＣａｓ９）をコードする９ｆｍｏｌのプラスミドで細胞を形質転換した。回収した細胞の希釈系列を、選択抗生物質を入れたＬＢプレートにプレーティングした。３７℃で１６時間経過後にコロニーを計数した。

表１．ＣＲＩＳＰＲ− Ｃａｓシステムが同定された生物及びゲノム位置に関する詳細、ならびに再構成したスペーサーの数及び平均長ならびにリピート長に関する情報（ＮＡ、該当なし）。ＡＲＭＡＮ−１のスペーサーは１６の試料から再構成した。

本発明をその具体的な実施形態を参照しながら説明してきたが、当業者は、本発明の真の趣旨及び範囲を逸脱することなく、種々の変更を加えることができる、及び等価物に代替えできるものと理解されるべきである。加えて、特定の状況、材料、物質の組成、方法、方法の工程、または工程が、本発明の目的、趣旨及び範囲に適合するように多くの変更を加えることができる。そのような変更はすべて、本明細書に添付の特許請求の範囲の範囲内であることを意図する。

関連出願の相互参照
本出願は、２０１６年９月３０日出願の米国仮特許出願第６２／４０２，８４９号の利益を主張するものであり、その全体が参照により本明細書に組み込まれる。

テキストファイルとして提供される配列表の参照による組み込み
配列表を２０１７年９月２８日作成のテキストファイル「ＢＥＲＫ−３４３ＷＯ＿ＳｅｑＬｉｓｔ＿ＳＴ２５．ｔｘｔ」（ファイルサイズ２４４ＫＢ）として本明細書とともに提出する。テキストファイルの内容は、その全体が参照により本明細書に組み込まれる。

Claims

ａ）ＣａｓＹポリペプチド、または前記ＣａｓＹポリペプチドをコードする核酸分子、及び
ｂ）ＣａｓＹガイドＲＮＡ、または前記ＣａｓＹガイドＲＮＡをコードする１つ以上のＤＮＡ分子
を含む、組成物。
前記ＣａｓＹポリペプチドが、配列番号１または配列番号２に記載されるアミノ酸配列に対して、５０％以上の同一性を有するアミノ酸配列を含む、請求項１に記載の組成物。
前記ＣａｓＹガイドＲＮＡが、配列番号１１〜１５のいずれか１つに記載されるｃｒＲＮＡ配列と８０％以上の同一性を有するヌクレオチド配列を含む、請求項１または請求項２に記載の組成物。
前記ＣａｓＹポリペプチドがＮＬＳ配列に融合されている、請求項１または請求項２に記載の組成物。
脂質を含む、請求項１〜４のいずれかに１項に記載の組成物。
ａ）及びｂ）がリポソーム内にある、請求項１〜４のいずれか１項に記載の組成物。
ａ）及びｂ）が粒子内にある、請求項１〜４のいずれか１項に記載の組成物。
緩衝液、ヌクレアーゼ阻害剤、及びプロテアーゼ阻害剤のうち１つ以上を含む、請求項１〜７のいずれか１項に記載の組成物。
前記ＣａｓＹポリペプチドが、配列番号１または配列番号２に記載されるアミノ酸配列に対して、８５％以上の同一性を有するアミノ酸配列を含む、請求項１〜８のいずれか１項に記載の組成物。
前記ＣａｓＹポリペプチドが、二本鎖標的核酸分子の一方の鎖のみを切断することができるニッカーゼである、請求項１〜９のいずれか１項に記載の組成物。
前記ＣａｓＹポリペプチドが、触媒不活性なＣａｓＹポリペプチド（ｄＣａｓＹ）である、請求項１〜９のいずれか１項に記載の組成物。
前記ＣａｓＹポリペプチドが、配列番号１のＤ６７２、Ｅ７６９、及びＤ９３５から選択されるものに対応する位置に１つ以上の変異を含む、請求項１０または請求項１１に記載の組成物。
ＤＮＡドナー鋳型をさらに含む、請求項１〜１２のいずれかに１項に記載の組成物。
異種ポリペプチドに融合されたＣａｓＹポリペプチドを含む、ＣａｓＹ融合ポリペプチド。
前記ＣａｓＹポリペプチドが、配列番号１または配列番号２に記載されるアミノ酸配列に対して、５０％以上の同一性を有するアミノ酸配列を含む、請求項１４に記載のＣａｓＹ融合ポリペプチド。
前記ＣａｓＹポリペプチドが、配列番号１または配列番号２に記載されるアミノ酸配列に対して、８５％以上の同一性を有するアミノ酸配列を含む、請求項１４に記載のＣａｓＹ融合ポリペプチド。
前記ＣａｓＹポリペプチドが、二本鎖標的核酸分子の一方の鎖のみを切断することができるニッカーゼである、請求項１４〜１６のいずれか１項に記載のＣａｓＹ融合ポリペプチド。
前記ＣａｓＹポリペプチドが、触媒不活性なＣａｓＹポリペプチド（ｄＣａｓＹ）である、請求項１４〜１７のいずれか１項に記載のＣａｓＹ融合ポリペプチド。
前記ＣａｓＹポリペプチドが、配列番号１のＤ６７２、Ｅ７６９、及びＤ９３５から選択されるものに対応する位置に１つ以上の変異を含む、請求項１７または請求項１８に記載のＣａｓＹ融合ポリペプチド。
前記異種ポリペプチドが、前記ＣａｓＹポリペプチドのＮ末端及び／またはＣ末端に融合される、請求項１４〜１９のいずれか１項に記載のＣａｓＹ融合ポリペプチド。
ＮＬＳを含む、請求項１４〜２０のいずれか１項に記載のＣａｓＹ融合ポリペプチド。
前記異種ポリペプチドが、標的細胞または標的細胞型の細胞表面部分への結合性を備える標的化ポリペプチドである、請求項１４〜２１のいずれか１項に記載のＣａｓＹ融合ポリペプチド。
前記異種ポリペプチドが、標的ＤＮＡを修飾する酵素活性を示す、請求項１４〜２１のいずれか１項に記載のＣａｓＹ融合ポリペプチド。
前記異種ポリペプチドが、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、ＤＮＡ修復活性、ＤＮＡ損傷活性、脱アミノ化活性、ジスムターゼ活性、アルキル化活性、脱プリン活性、酸化活性、ピリミジン二量体を形成する活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、及びグリコシラーゼ活性から選択される１つ以上の酵素活性を示す、請求項２３に記載のＣａｓＹ融合ポリペプチド。
前記異種ポリペプチドが、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、脱アミノ化活性、脱プリン活性、インテグラーゼ活性、トランスポザーゼ活性、及びリコンビナーゼ活性から選択される１つ以上の酵素活性を示す、請求項２４に記載のＣａｓＹ融合ポリペプチド。
前記異種ポリペプチドが、標的核酸と会合する標的ポリペプチドを修飾する酵素活性を示す、請求項１４〜２１のいずれか１項に記載のＣａｓＹ融合ポリペプチド。
前記異種ポリペプチドが、ヒストン修飾活性を示す、請求項２６に記載のＣａｓＹ融合ポリペプチド。
前記異種ポリペプチドが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、ＳＵＭＯ化活性、脱ＳＵＭＯ化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、脱ミリストイル化活性、グリコシル化活性（例えば、Ｏ−ＧｌｃＮＡｃトランスフェラーゼによる）、及び脱グリコシル化活性から選択される１つ以上の酵素活性を示す、請求項２６または請求項２７に記載のＣａｓＹ融合ポリペプチド。
前記異種ポリペプチドが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、及びデアセチラーゼ活性から選択される１つ以上の酵素活性を示す、請求項２８に記載のＣａｓＹ融合ポリペプチド。
前記異種ポリペプチドが、エンドソーム放出ポリペプチドである、請求項１４〜２１のいずれか１項に記載のＣａｓＹ融合ポリペプチド。
前記エンドソーム放出ポリペプチドが、ＧＬＦＸＡＬＬＸＬＬＸＳＬＷＸＬＬＬＸＡ（配列番号９４）及びＧＬＦＨＡＬＬＨＬＬＨＳＬＷＨＬＬＬＨＡ（配列番号９５）から選択されるアミノ酸配列を含み、ここで、各Ｘは独立して、リジン、ヒスチジン、及びアルギニンから選択される、請求項３０に記載のＣａｓＹ融合ポリペプチド。
前記異種ポリペプチドが、葉緑体輸送ペプチドである、請求項１４〜２１のいずれか１項に記載のＣａｓＹ融合ポリペプチド。
前記葉緑体輸送ペプチドが、ＭＡＳＭＩＳＳＳＡＶＴＴＶＳＲＡＳＲＧＱＳＡＡＭＡＰＦＧＧＬＫＳＭＴＧＦＰＶＲＫＶＮＴＤＩＴＳＩＴＳＮＧＧＲＶＫＣＭＱＶＷＰＰＩＧＫＫＫＦＥＴＬＳＹＬＰＰＬＴＲＤＳＲＡ（配列番号８３）；ＭＡＳＭＩＳＳＳＡＶＴＴＶＳＲＡＳＲＧＱＳＡＡＭＡＰＦＧＧＬＫＳＭＴＧＦＰＶＲＫＶＮＴＤＩＴＳＩＴＳＮＧＧＲＶＫＳ（配列番号８４）；ＭＡＳＳＭＬＳＳＡＴＭＶＡＳＰＡＱＡＴＭＶＡＰＦＮＧＬＫＳＳＡＡＦＰＡＴＲＫＡＮＮＤＩＴＳＩＴＳＮＧＧＲＶＮＣＭＱＶＷＰＰＩＥＫＫＫＦＥＴＬＳＹＬＰＤＬＴＤＳＧＧＲＶＮＣ（配列番号８５）；ＭＡＱＶＳＲＩＣＮＧＶＱＮＰＳＬＩＳＮＬＳＫＳＳＱＲＫＳＰＬＳＶＳＬＫＴＱＱＨＰＲＡＹＰＩＳＳＳＷＧＬＫＫＳＧＭＴＬＩＧＳＥＬＲＰＬＫＶＭＳＳＶＳＴＡＣ（配列番号８６）；ＭＡＱＶＳＲＩＣＮＧＶＷＮＰＳＬＩＳＮＬＳＫＳＳＱＲＫＳＰＬＳＶＳＬＫＴＱＱＨＰＲＡＹＰＩＳＳＳＷＧＬＫＫＳＧＭＴＬＩＧＳＥＬＲＰＬＫＶＭＳＳＶＳＴＡＣ（配列番号８７）；ＭＡＱＩＮＮＭＡＱＧＩＱＴＬＮＰＮＳＮＦＨＫＰＱＶＰＫＳＳＳＦＬＶＦＧＳＫＫＬＫＮＳＡＮＳＭＬＶＬＫＫＤＳＩＦＭＱＬＦＣＳＦＲＩＳＡＳＶＡＴＡＣ（配列番号８８）；ＭＡＡＬＶＴＳＱＬＡＴＳＧＴＶＬＳＶＴＤＲＦＲＲＰＧＦＱＧＬＲＰＲＮＰＡＤＡＡＬＧＭＲＴＶＧＡＳＡＡＰＫＱＳＲＫＰＨＲＦＤＲＲＣＬＳＭＶＶ（配列番号８９）；ＭＡＡＬＴＴＳＱＬＡＴＳＡＴＧＦＧＩＡＤＲＳＡＰＳＳＬＬＲＨＧＦＱＧＬＫＰＲＳＰＡＧＧＤＡＴＳＬＳＶＴＴＳＡＲＡＴＰＫＱＱＲＳＶＱＲＧＳＲＲＦＰＳＶＶＶＣ（配列番号９０）；ＭＡＳＳＶＬＳＳＡＡＶＡＴＲＳＮＶＡＱＡＮＭＶＡＰＦＴＧＬＫＳＡＡＳＦＰＶＳＲＫＱＮＬＤＩＴＳＩＡＳＮＧＧＲＶＱＣ（配列番号９１）；ＭＥＳＬＡＡＴＳＶＦＡＰＳＲＶＡＶＰＡＡＲＡＬＶＲＡＧＴＶＶＰＴＲＲＴＳＳＴＳＧＴＳＧＶＫＣＳＡＡＶＴＰＱＡＳＰＶＩＳＲＳＡＡＡＡ（配列番号９２）；及びＭＧＡＡＡＴＳＭＱＳＬＫＦＳＮＲＬＶＰＰＳＲＲＬＳＰＶＰＮＮＶＴＣＮＮＬＰＫＳＡＡＰＶＲＴＶＫＣＣＡＳＳＷＮＳＴＩＮＧＡＡＡＴＴＮＧＡＳＡＡＳＳ（配列番号９３）から選択されるアミノ酸配列を含む、請求項３２に記載のＣａｓＹ融合ポリペプチド。
前記異種ポリペプチドが、転写を増加させるかまたは減少させるタンパク質である、請求項１４〜２１のいずれか１項に記載のＣａｓＹ融合ポリペプチド。
前記異種ポリペプチドが転写抑制因子ドメインである、請求項３４に記載のＣａｓＹ融合ポリペプチド。
前記異種ポリペプチドが転写活性化ドメインである、請求項３４に記載のＣａｓＹ融合ポリペプチド。
前記異種ポリペプチドがタンパク質結合ドメインである、請求項１４〜２１のいずれか１項に記載のＣａｓＹ融合ポリペプチド。
請求項１４〜３７のいずれか１項に記載のＣａｓＹ融合ポリペプチドをコードする核酸分子。
前記ＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列が、プロモーターに機能的に連結される、請求項３８に記載の核酸分子。
前記プロモーターが、真核細胞において機能的である、請求項３９に記載の核酸分子。
前記プロモーターが、植物細胞、真菌細胞、動物細胞、脊椎動物の細胞、ハエ細胞、脊椎動物の細胞、哺乳動物細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞のうち１つ以上において機能的である、請求項４０に記載の核酸分子。
前記プロモーターが、構成的プロモーター、誘導性プロモーター、細胞型特異的プロモーター、及び組織特異的プロモーターのうち１つ以上である、請求項３９〜４１のいずれか１項に記載の核酸分子。
ＤＮＡ分子が組換え発現ベクターである、請求項３８〜４２のいずれか１項に記載の核酸分子。
前記組換え発現ベクターが、組換えアデノ随伴ウイルスベクター、組換えレトロウイルスベクター、または組換えレンチウイルスベクターである、請求項４３に記載の核酸分子。
前記プロモーターが、原核細胞において機能的である、請求項３９に記載の核酸分子。
ｍＲＮＡである、請求項３８に記載の核酸分子。
（ａ）ＣａｓＹガイドＲＮＡ、及び
（ｂ）ＣａｓＹポリペプチド
をコードする、１つ以上の核酸分子。
前記ＣａｓＹポリペプチドが、配列番号１または配列番号２に記載されるアミノ酸配列に対して、５０％以上の同一性を有するアミノ酸配列を含む、請求項４７に記載の１つ以上の核酸分子。
前記ＣａｓＹポリペプチドが、配列番号１または配列番号２に記載されるアミノ酸配列に対して、８５％以上の同一性を有するアミノ酸配列を含む、請求項４７に記載の１つ以上の核酸分子。
前記ＣａｓＹガイドＲＮＡが、配列番号１１〜１５のいずれか１つに記載されるｃｒＲＮＡ配列と８０％以上の同一性を有するヌクレオチド配列を含む、請求項４７〜４９のいずれか１項に記載の１つ以上の核酸分子。
前記ＣａｓＹポリペプチドがＮＬＳ配列に融合されている、請求項４７〜５０のいずれか１項に記載の１つ以上の核酸分子。
プロモーターに機能的に連結される前記ＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む、請求項４７〜５１のいずれか１項に記載の１つ以上の核酸分子。
プロモーターに機能的に連結される前記ＣａｓＹポリペプチドをコードするヌクレオチド配列を含む、請求項４７〜５２のいずれか１項に記載の１つ以上の核酸分子。
前記プロモーターが、前記ＣａｓＹガイドＲＮＡをコードする前記ヌクレオチド配列に機能的に連結される、及び／または前記プロモーターが、前記ＣａｓＹポリペプチドをコードする前記ヌクレオチド配列に機能的に連結され、真核生物において機能的である、請求項５２または請求項５３に記載の１つ以上の核酸分子。
前記プロモーターが、植物細胞、真菌細胞、動物細胞、脊椎動物の細胞、ハエ細胞、脊椎動物の細胞、哺乳動物細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞のうち１つ以上において機能的である、請求項５４に記載の１つ以上の核酸分子。
前記プロモーターが、構成的プロモーター、誘導性プロモーター、細胞型特異的プロモーター、及び組織特異的プロモーターのうち１つ以上である、請求項５３〜５５のいずれか１項に記載の１つ以上の核酸分子。
１つ以上の組換え発現ベクターである、請求項４７〜５６のいずれか１項に記載の１つ以上の核酸分子。
前記１つ以上の組換え発現ベクターが、１つ以上のアデノ随伴ウイルスベクター、１つ以上の組換えレトロウイルスベクター、または１つ以上の組換えレンチウイルスベクターから選択される、請求項５７に記載の１つ以上の核酸分子。
前記プロモーターが、原核細胞において機能的である、請求項５３に記載の１つ以上の核酸分子。
ａ）ＣａｓＹポリペプチド、または前記ＣａｓＹポリペプチドをコードする核酸分子、
ｂ）ＣａｓＹ融合ポリペプチド、または前記ＣａｓＹ融合ポリペプチドをコードする核酸分子、及び
ｃ）ＣａｓＹガイドＲＮＡ、または前記ＣａｓＹガイドＲＮＡをコードする核酸分子
のうち１つ以上を含む、真核細胞。
前記ＣａｓＹポリペプチドをコードする前記核酸分子を含み、前記核酸分子が細胞のゲノムＤＮＡに組み込まれている、請求項６０に記載の真核細胞。
植物細胞、哺乳動物細胞、昆虫細胞、クモ類細胞、真菌細胞、鳥類細胞、爬虫類細胞、両生類細胞、無脊椎動物細胞、マウス細胞、ラット細胞、霊長類細胞、非ヒト霊長類細胞、またはヒト細胞である、請求項６０または請求項６１に記載の真核細胞。
ＣａｓＹ融合ポリペプチド、または前記ＣａｓＹ融合ポリペプチドをコードする核酸分子を含む、細胞。
原核細胞である、請求項６３に記載の細胞。
前記ＣａｓＹ融合ポリペプチドをコードする前記核酸分子を含み、前記核酸分子が細胞のゲノムＤＮＡに組み込まれている、請求項６３または請求項６４に記載の細胞。
標的核酸を修飾する方法であって、
前記標的核酸を
ａ）ＣａｓＹポリペプチド、及び
ｂ）前記標的核酸の標的配列にハイブリダイズするガイド配列を含むＣａｓＹガイドＲＮＡと接触させることを含み、
前記接触が、前記ＣａｓＹポリペプチドによる前記標的核酸の修飾をもたらす、
方法。
前記修飾が、前記標的核酸の切断である、請求項６６に記載の方法。
前記標的核酸が、二本鎖ＤＮＡ、一本鎖ＤＮＡ、ＲＮＡ、ゲノムＤＮＡ、及び染色体外ＤＮＡから選択される、請求項６６または請求項６７に記載の方法。
前記接触が、細胞外のインビトロ（ｉｎｖｉｔｒｏ）で行われる、請求項６６〜６８のいずれかに記載の方法。
前記接触が、培養物中の細胞内で行われる、請求項６６〜６８のいずれかに記載の方法。
前記接触が、インビボ（ｉｎｖｉｖｏ）の細胞内で行われる、請求項６６〜６８のいずれかに記載の方法。
前記細胞が真核細胞である、請求項７０または請求項７１に記載の方法。
前記細胞が、植物細胞、真菌細胞、哺乳動物細胞、爬虫類細胞、昆虫細胞、鳥類細胞、魚類細胞、寄生生物細胞、節足動物細胞、無脊椎動物の細胞、脊椎動物の細胞、齧歯類細胞、マウス細胞、ラット細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞から選択される、請求項７２に記載の方法。
前記細胞が原核細胞である、請求項７０または請求項７１に記載の方法。
前記接触の結果、ゲノムが編集される、請求項６６〜７４のいずれか１項に記載の方法。
前記接触が、（ａ）前記ＣａｓＹポリペプチド、または前記ＣａｓＹポリペプチドをコードする核酸分子、及び（ｂ）前記ＣａｓＹガイドＲＮＡ、または前記ＣａｓＹガイドＲＮＡをコードする核酸分子を細胞に導入することを含む、請求項６６〜７５のいずれか１項に記載の方法。
前記接触が、ＤＮＡドナー鋳型を前記細胞に導入することをさらに含む、請求項７６に記載の方法。
前記ＣａｓＹガイドＲＮＡが、配列番号１１〜１５のいずれか１つに記載されるｃｒＲＮＡ配列と８０％以上の同一性を有するヌクレオチド配列を含む、請求項６６〜７７のいずれか１項に記載の方法。
前記ＣａｓＹポリペプチドがＮＬＳ配列に融合されている、請求項６６〜７８のいずれか１項に記載の方法。
標的ＤＮＡからの転写を調節する、標的核酸を修飾する、または標的核酸と会合するタンパク質を修飾する方法であって、
前記標的核酸を
ａ）異種ポリペプチドに融合されたＣａｓＹポリペプチドを含む、ＣａｓＹ融合ポリペプチド、及び
ｂ）前記標的核酸の標的配列にハイブリダイズするガイド配列を含むＣａｓＹガイドＲＮＡと接触させることを含む、
方法。
前記ＣａｓＹガイドＲＮＡが、配列番号１１〜１５のいずれか１つに記載されるｃｒＲＮＡ配列と８０％以上の同一性を有するヌクレオチド配列を含む、請求項８０に記載の方法。
前記ＣａｓＹ融合ポリペプチドがＮＬＳ配列を含む、請求項８０または請求項８１に記載の方法。
前記修飾が、前記標的核酸の切断ではない、請求項８０〜８２のいずれかに記載の方法。
前記標的核酸が、二本鎖ＤＮＡ、一本鎖ＤＮＡ、ＲＮＡ、ゲノムＤＮＡ、及び染色体外ＤＮＡから選択される、請求項８０〜８３のいずれかに記載の方法。
前記接触が、細胞外のインビトロ（ｉｎｖｉｔｒｏ）で行われる、請求項８０〜８４のいずれかに記載の方法。
前記接触が、培養物中の細胞内で行われる、請求項８０〜８４のいずれかに記載の方法。
前記接触が、インビボ（ｉｎｖｉｖｏ）の細胞内で行われる、請求項８０〜８４のいずれかに記載の方法。
前記細胞が真核細胞である、請求項８６または請求項８７に記載の方法。
前記細胞が、植物細胞、真菌細胞、哺乳動物細胞、爬虫類細胞、昆虫細胞、鳥類細胞、魚類細胞、寄生生物細胞、節足動物細胞、無脊椎動物の細胞、脊椎動物の細胞、齧歯類細胞、マウス細胞、ラット細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞から選択される、請求項８８に記載の方法。
前記細胞が原核細胞である、請求項８６または請求項８７に記載の方法。
前記接触が、（ａ）前記ＣａｓＹ融合ポリペプチド、または前記ＣａｓＹ融合ポリペプチドをコードする核酸分子、及び（ｂ）前記ＣａｓＹガイドＲＮＡ、または前記ＣａｓＹガイドＲＮＡをコードする核酸分子を細胞に導入することを含む、請求項８０〜９０のいずれか１項に記載の方法。
前記ＣａｓＹポリペプチドが、触媒不活性なＣａｓＹポリペプチド（ｄＣａｓＹ）である、請求項８０〜９１のいずれか１項に記載の方法。
前記ＣａｓＹポリペプチドが、配列番号１のＤ６７２、Ｅ７６９、及びＤ９３５から選択されるものに対応する位置に１つ以上の変異を含む、請求項８０〜９２のいずれか１項に記載の方法。
前記異種ポリペプチドが、標的ＤＮＡを修飾する酵素活性を示す、請求項８０〜９３のいずれか１項に記載の方法。
前記異種ポリペプチドが、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、ＤＮＡ修復活性、ＤＮＡ損傷活性、脱アミノ化活性、ジスムターゼ活性、アルキル化活性、脱プリン活性、酸化活性、ピリミジン二量体を形成する活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、及びグリコシラーゼ活性から選択される１つ以上の酵素活性を示す、請求項９４に記載の方法。
前記異種ポリペプチドが、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、脱アミノ化活性、脱プリン活性、インテグラーゼ活性、トランスポザーゼ活性、及びリコンビナーゼ活性から選択される１つ以上の酵素活性を示す、請求項９５に記載の方法。
前記異種ポリペプチドが、標的核酸と会合する標的ポリペプチドを修飾する酵素活性を示す、請求項８０〜９３のいずれか１項に記載の方法。
前記異種ポリペプチドが、ヒストン修飾活性を示す、請求項９７に記載の方法。
前記異種ポリペプチドが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、ＳＵＭＯ化活性、脱ＳＵＭＯ化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、脱ミリストイル化活性、グリコシル化活性（例えば、Ｏ−ＧｌｃＮＡｃトランスフェラーゼによる）、及び脱グリコシル化活性から選択される１つ以上の酵素活性を示す、請求項９７または請求項９８に記載の方法。
前記異種ポリペプチドが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、及びデアセチラーゼ活性から選択される１つ以上の酵素活性を示す、請求項９９に記載の方法。
前記異種ポリペプチドが、転写を増加させるかまたは減少させるタンパク質である、請求項８０〜９３のいずれか１項に記載の方法。
前記異種ポリペプチドが転写抑制因子ドメインである、請求項１０１に記載の方法。
前記異種ポリペプチドが転写活性化ドメインである、請求項１０１に記載の方法。
前記異種ポリペプチドがタンパク質結合ドメインである、請求項８０〜９３のいずれか１項に記載の方法。
ａ）ＣａｓＹポリペプチド、
ｂ）ＣａｓＹ融合ポリペプチド、及び
ｃ）ＣａｓＹガイドＲＮＡ
のうち１つ以上をコードするヌクレオチド配列を含む導入遺伝子をゲノムに含む、
トランスジェニック多細胞非ヒト生物。
前記ＣａｓＹポリペプチドが、配列番号１または配列番号２に記載されるアミノ酸配列に対して、５０％以上のアミノ酸配列同一性を有するアミノ酸配列を含む、請求項１０５に記載のトランスジェニック多細胞非ヒト生物。
前記ＣａｓＹポリペプチドが、配列番号１または配列番号２に記載されるアミノ酸配列に対して、８５％以上のアミノ酸配列同一性を有するアミノ酸配列を含む、請求項１０５に記載のトランスジェニック多細胞非ヒト生物。
植物、単子葉植物、双子葉植物、無脊椎動物、昆虫、節足動物、クモ類、寄生生物、蠕虫、刺胞動物、脊椎動物、魚類、爬虫類、両生類、有蹄動物、鳥類、ブタ、ウマ、ヒツジ、齧歯類、マウス、ラット、または非ヒト霊長類である、請求項１０５〜１０７のいずれか１項に記載のトランスジェニック多細胞非ヒト生物。
ａ）ＣａｓＹポリペプチド及びＣａｓＹガイドＲＮＡ、
ｂ）ＣａｓＹポリペプチド、ＣａｓＹガイドＲＮＡ、及びＤＮＡドナー鋳型、
ｃ）ＣａｓＹ融合ポリペプチド及びＣａｓＹガイドＲＮＡ、
ｄ）ＣａｓＹ融合ポリペプチド、ＣａｓＹガイドＲＮＡ、及びＤＮＡドナー鋳型、
ｅ）ＣａｓＹポリペプチドをコードするｍＲＮＡ、及びＣａｓＹガイドＲＮＡ、
ｆ）ＣａｓＹポリペプチドをコードするｍＲＮＡ、ＣａｓＹガイドＲＮＡ、及びＤＮＡドナー鋳型、
ｇ）ＣａｓＹ融合ポリペプチドをコードするｍＲＮＡ、及びＣａｓＹガイドＲＮＡ、
ｈ）ＣａｓＹ融合ポリペプチドをコードするｍＲＮＡ、ＣａｓＹガイドＲＮＡ、及びＤＮＡドナー鋳型、；
ｉ）ｉ）ＣａｓＹポリペプチドをコードするヌクレオチド配列、及びｉｉ）ＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む１つ以上の組換え発現ベクター、
ｊ）ｉ）ＣａｓＹポリペプチドをコードするヌクレオチド配列、ｉｉ）ＣａｓＹガイドＲＮＡをコードするヌクレオチド配列、及びｉｉｉ）ＤＮＡドナー鋳型を含む１つ以上の組換え発現ベクター、；
ｋ）ｉ）ＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列、及びｉｉ）ＣａｓＹガイドＲＮＡをコードするヌクレオチド配列を含む１つ以上の組換え発現ベクター、ならびに
ｌ）ｉ）ＣａｓＹ融合ポリペプチドをコードするヌクレオチド配列、ｉｉ）ＣａｓＹガイドＲＮＡをコードするヌクレオチド配列、及びＤＮＡドナー鋳型を含む１つ以上の組換え発現ベクターを含む、
ＣａｓＹシステム。
前記ＣａｓＹポリペプチドが、配列番号１または配列番号２に記載されるアミノ酸配列に対して、５０％以上のアミノ酸配列同一性を有するアミノ酸配列を含む、請求項１０９に記載のＣａｓＹシステム。
前記ＣａｓＹポリペプチドが、配列番号１または配列番号２に記載されるアミノ酸配列に対して、８５％以上のアミノ酸配列同一性を有するアミノ酸配列を含む、請求項１０９に記載のＣａｓＹシステム。
ドナー鋳型核酸が、８ヌクレオチド〜１０００ヌクレオチドの長さを有する、請求項１０９〜１１１のいずれかに記載のＣａｓＹシステム。
ドナー鋳型核酸が、２５ヌクレオチド〜５００ヌクレオチドの長さを有する、請求項１０９〜１１１のいずれかに記載のＣａｓＹシステム。
請求項１０９〜１１３のいずれか１項に記載のＣａｓＹシステムを含むキット。
前記キットの構成要素が同じ容器内にある、請求項１１４に記載のキット。
前記キットの構成要素が別の容器内にある、請求項１１４に記載のキット。
請求項１０９〜１１６のいずれか１項に記載のＣａｓＹシステムを含む滅菌容器。
注射器である、請求項１１７に記載の滅菌容器。
請求項１０９〜１１６のいずれか１項に記載のＣａｓＹシステムを含む埋込型装置。
前記ＣａｓＹシステムがマトリックス内にある、請求項１１９に記載の埋込型装置。
前記ＣａｓＹシステムがリザーバー内にある、請求項１１９に記載の埋込型装置。
ＣＲＩＳＰＲＲＮＡ誘導型エンドヌクレアーゼを同定する方法であって、
複数のメタゲノムヌクレオチド配列において、Ｃａｓ１ポリペプチドをコードするヌクレオチド配列を検出すること、
前記Ｃａｓ１ポリペプチドをコードするヌクレオチド配列の近傍にあるＣＲＩＳＰＲ配列を検出すること、
検出されたＣＲＩＳＰＲ配列を含むＣＲＩＳＰＲ遺伝子座を、前記複数のメタゲノムヌクレオチド配列が由来する核酸試料から発現ベクターにクローニングして、組換えＣＲＩＳＰＲ遺伝子座発現ベクターを生成すること、
前記組換えＣＲＩＳＰＲ遺伝子座発現ベクターが標的核酸を切断する能力についてアッセイすること（標的核酸を切断する能力を有するＣＲＩＳＰＲ遺伝子座は、ＣＲＩＳＰＲＲＮＡ誘導型エンドヌクレアーゼをコードするヌクレオチド配列を含む）、及び
前記ＣＲＩＳＰＲ遺伝子座内において、既知のＣＲＩＳＰＲＲＮＡ誘導型エンドヌクレアーゼポリペプチドのアミノ酸配列に対して２０％未満のアミノ酸配列同一性を有するポリペプチドをコードするオープンリーディングフレームを同定することを含む、
方法。
前記アッセイすることが、前記組換えＣＲＩＳＰＲ遺伝子座発現ベクター及び標的核酸を細胞に導入することを含む、請求項１２２に記載の方法。