WO2024053964A1

WO2024053964A1 - 캄필로박터 제주니 유래 cas9의 가이드 rna 구조변화를 통한 유전자교정 향상 시스템

Info

Publication number: WO2024053964A1
Application number: PCT/KR2023/013166
Authority: WO
Inventors: 송동우; 김석중; 이혜림; 오혜경; 김운기; 이재영
Original assignee: 주식회사 툴젠
Priority date: 2022-09-06
Filing date: 2023-09-04
Publication date: 2024-03-14
Also published as: KR20240034661A

Abstract

본 명세서에서는 연속하는 4개 이상의 유리딘을 포함하지 않도록 변형된 캄필로박터 제주니 유래 Cas9 단백질에 대한 엔지니어링 된 가이드 RNA를 개시한다. 상기 엔지니어링 된 가이드 RNA를 포함하는 CRISPR/Cas9 시스템은, 1) 발현 벡터 발현 시 transcriptional pausing이나 immature termination이 일어나지 않아 세포 내에서 높은 발현량을 보이며, 2) 상기 엔지니어링 된 가이드 RNA가 Cas9 단백질과 상호작용하여 DNA 절단 효율 자체가 높아진다. 따라서, 본 명세서에서 개시하는 상기 엔지니어링 된 가이드 RNA를 포함하는 CRISPR/Cas9 시스템은 야생형의 CRISPR/Cas9 시스템보다 높은 유전자 편집 활성을 보인다.

Description

캄필로박터 제주니 유래 CAS9의 가이드 RNA 구조변화를 통한 유전자교정 향상 시스템

본 발명은 CRISPR/Cas9 시스템 기술분야의 발명이다. CRISPR/Cas 시스템은 원핵생물 유기체에서 발견되는 면역 시스템의 일종이며, Cas 단백질, 및 가이드 RNA를 포함한다. Cas 단백질, 또는 가이드 RNA의 자세한 구성에 대해서는 공개문헌인 WO2018/231018(국제공개번호)에 자세히 설명되어 있다.

캄필로박터 제주니 (Campylobacter jejuni) 유래 Cas9 단백질은, CjCas9이라고도 지칭되며, Cas9 단백질의 오르쏘로그(orthologs) 중 하나이다. 상기 CjCas9은 Cas9 중에서도 가장 작은 크기를 가지며, 진핵세포에서 이중가닥 DNA 절단 활성을 보이는 것으로 알려져 있다. 본 발명은 캄필로박터 제주니 유래 Cas9 단백질 및 상기 Cas9 단백질과 복합체를 이룰 수 있는 가이드 RNA에 대한 발명이다.

본 명세서에서는 연속하는 4개 이상의 유리딘을 포함하지 않도록 변형된 캄필로박터 제주니 유래 Cas9 단백질에 대한 엔지니어링 된 가이드 RNA를 제공하고자 한다. 본 명세서에서는 상기 엔지니어링 된 가이드 RNA를 포함하는 엔지니어링 된 CRISPR/Cas9 시스템의 다양한 구현 형태를 제공하고자 한다. 본 명세서에서는 상기 엔지니어링 된 CRISPR/Cas9 시스템을 사용한 유전자 편집 방법을 제공하고자 한다. 본 명세서에서는 상기 엔지니어링 된 CRISPR/Cas9 시스템의 용도를 제공하고자 한다.

본 명세서에서는 캄필로박터 제주니 (Campylobacter jejuni) 유래 Cas9 단백질과 복합체를 이룰 수 있는 엔지니어링 된 가이드 RNA로, 다음 서열로 표현되는 것을 제공한다:

5'-[가이드 서열]-[제1 서열]-[제2 서열]-[제3 서열]-[제4 서열]-3'

여기서, 상기 가이드 서열은 미리 결정된 표적 서열을 표적할 수 있고,

상기 제2 서열은 AGUCCCUGAAGGGACU(서열번호 6), 또는 상기 서열번호 6과 80% 이상 일치하는 서열이고,

상기 제4 서열은 UAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGC(서열번호 7), 또는 상기 서열번호 7과 80% 이상 일치하는 서열이며,

상기 제1 서열 및 상기 제3 서열은 다음 조합 중 선택됨:

제1 서열은 5'-GUUUC-3'이고, 제3 서열은 5'-GAAA-3';

제1 서열은 5'-GUUCU-3'이고, 제3 서열은 5'-AGAA-3';

제1 서열은 5'-GUCUU-3'이고, 제3 서열은 5'-AAGA-3'; 및

제1 서열은 5'-GCUUU-3'이고, 제3 서열은 5'-AAAG-3'.

일 실시예로, 상기 엔지니어링 된 스캐폴드의 서열은 GUUUCAGUCCCUGAAGGGACUGGAAAUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGC(서열번호 2), GUUCUAGUCCCUGAAGGGACUGAGAAUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGC(서열번호 3), GUCUUAGUCCCUGAAGGGACUGAAGAUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGC(서열번호 4), 및 GCUUUAGUCCCUGAAGGGACUAAAGUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGC(서열번호 5) 중 선택된 것일 수 있다.

일 실시예로, 상기 엔지니어링 된 스캐폴드의 서열은 GUCUUAGUCCCUGAAGGGACUGAAGAUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGC(서열번호 4)일 수 있다.

본 명세서에서는 다음을 포함하는 엔지니어링 된 CRISPR/Cas9 복합체를 제공한다:

상기 엔지니어링 된 가이드 RNA; 및

캄필로박터 제주니 유래 Cas9 단백질,

여기서, 상기 CRISPR/Cas9 복합체는 상기 엔지니어링 된 가이드 RNA의 미리 결정된 표적 서열을 표적할 수 있음.

본 명세서에서는 상기 엔지니어링 된 가이드 RNA를 암호화하는 DNA를 제공한다.

본 명세서에서는 CRISPR/Cas9 시스템의 각 구성요소를 발현할 수 있는 벡터로, 다음을 포함하는 것을 제공한다:

캄필로박터 제주니 유래 Cas9 단백질을 암호화하는 핵산; 및

상기 엔지니어링 된 가이드 RNA를 암호화하는 핵산.

일 실시예로, 상기 벡터는 바이러스 벡터, 또는 비-바이러스 벡터일 수 있다.

일 실시예로, 상기 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 하나 이상의 바이러스 벡터인 것을 특징으로 할 수 있다.

일 실시예로, 상기 벡터는 단일 벡터(single vector)에 포함된 것일 수 있다.

일 실시예로, 상기 벡터는 둘 이상의 벡터에 포함된 것일 수 있다.

본 명세서에서는 엔지니어링 된 CRISPR/Cas9 조성물로, 다음을 포함하는 것을 제공한다:

캄필로박터 제주니 유래 Cas9 단백질, 또는 상기 Cas9 단백질을 암호화하는 핵산; 및

상기 엔지니어링 된 가이드 RNA, 또는 상기 가이드 RNA를 암호화하는 핵산.

일 실시예로, 상기 조성물은 상기 Cas9 단백질 및 상기 엔지니어링 된 가이드 RNA를 포함하고, 상기 Cas9 단백질은 상기 엔지니어링 된 가이드 RNA와 결합하여 Cas9-gRNA 복합체를 형성하고 있을 수 있다.

일 실시예로, 상기 조성물은 상기 Cas9 단백질을 암호화하는 핵산 및 상기 엔지니어링 된 가이드 RNA를 암호화하는 핵산을 포함하는 조성물일 수 있다.

일 실시예로, 상기 조성물은 상기 벡터를 포함하는 것을 특징으로 하는 조성물.

본 명세서에서는 다음을 포함하는, 세포 내 유전자의 표적 서열을 가지는 표적 핵산을 편집하는 방법을 제공한다:

상기 CRISPR/Cas9 조성물을 상기 세포에 도입하는 것,

여기서, 상기 조성물의 엔지니어링 된 가이드 RNA의 가이드 도메인은 상기 표적 핵산을 표적할 수 있음.

본 명세서에서 제공하는 엔지니어링 된 가이드 RNA를 사용하여, 캄필로박터 제주니 유래 CRISPR/Cas9 시스템의 유전자 편집 효율을 비약적으로 높일 수 있다. 특히, 상기 캄필로박터 제주니 유래 CRISPR/Cas9 시스템 발현 벡터를 사용하는 경우, 유전자 편집 효율이 크게 높아지는 것을 기대할 수 있다.

도 1은 본 명세서에서 개시하는 엔지니어링 된 가이드 RNA를 모식적으로 나타낸 것이며, 대표적인 4가지 엔지니어링 된 가이드 RNA의 예시를 나타낸다.

도 2는 실험예 2에 따른, 인간 세포주 (HEK293T)에서 HIF1A 유전자를 표적으로 하는 야생형의 싱글 가이드 RNA 및 엔지니어링 된 가이드 RNA 각각을 포함하는 CRISPR/CjCas9 시스템의 상기 HIF1A-E4 유전자 내 인델 발생 비율을 나타낸 그래프이다. 여기서, NT는 음성 대조군, Ori는 야생형의 가이드 RNA, Modi-1은 서열번호 2의 엔지니어링 된 스캐폴드 서열을 가지는 엔지니어링 된 가이드 RNA, Modi-2은 서열번호 3의 엔지니어링 된 스캐폴드 서열을 가지는 엔지니어링 된 가이드 RNA, Modi-3은 서열번호 4의 엔지니어링 된 스캐폴드 서열을 가지는 엔지니어링 된 가이드 RNA, Modi-4은 서열번호 5의 엔지니어링 된 스캐폴드 서열을 가지는 엔지니어링 된 가이드 RNA를 나타낸다.

도 3은 실험예 2에 따른, 인간 세포주 (HEK293T)에서 HIF1A 유전자를 표적으로 하는 야생형의 싱글 가이드 RNA 및 엔지니어링 된 가이드 RNA 각각에 대한 발현 벡터의 발현 효율을 나타낸 그래프이다. 여기서, NT는 음성 대조군, Ori는 야생형의 가이드 RNA, Modi-1은 서열번호 2의 엔지니어링 된 스캐폴드 서열을 가지는 엔지니어링 된 가이드 RNA, Modi-2은 서열번호 3의 엔지니어링 된 스캐폴드 서열을 가지는 엔지니어링 된 가이드 RNA, Modi-3은 서열번호 4의 엔지니어링 된 스캐폴드 서열을 가지는 엔지니어링 된 가이드 RNA, Modi-4은 서열번호 5의 엔지니어링 된 스캐폴드 서열을 가지는 엔지니어링 된 가이드 RNA를 나타낸다.

도 4는 실험예 3에 따른, 랫드 세포주 (RT4-D6P2T) 내 Low 240ng plasmid transfection 및 High 800ng plasmid transfection으로 형질감염시킨 Modi-3의 엔지니어링 된 가이드 RNA를 포함하는 CRISPR/CjCas9 시스템의 인델 발생 효율을 야생형의 가이드 RNA를 포함하는 CRISPR/CjCas9 시스템과 비교한 그래프이다. 여기서, ORI-Low는 야생형의 가이드 RNA를 Low 240ng plasmid transfection으로 감염시킨 것, ORI-High는 야생형의 가이드 RNA를 High 800ng plasmid transfection으로 감염시킨 것, Modi-3-Low는 서열번호 4의 엔지니어링 된 스캐폴드 서열을 가지는 엔지니어링 된 가이드 RNA를 Low 240ng plasmid transfection으로 감염시킨 것, Modi-3-High는 Modi-3-Low는 서열번호 4의 엔지니어링 된 스캐폴드 서열을 가지는 엔지니어링 된 가이드 RNA를 High 800ng plasmid transfection으로 감염시킨 것이다.

도 5는 실험예 3에 따른, 랫드 세포주 (RT4-D6P2T) 내 Low 240ng plasmid transfection 및 High 800ng plasmid transfection으로 형질감염시킨 Modi-3의 엔지니어링 된 가이드 RNA의 발현량을 야생형의 가이드 RNA와 비교한 그래프이다. 여기서, ORI-Low는 야생형의 가이드 RNA를 Low 240ng plasmid transfection으로 감염시킨 것, ORI-High는 야생형의 가이드 RNA를 High 800ng plasmid transfection으로 감염시킨 것, Modi-3-Low는 서열번호 4의 엔지니어링 된 스캐폴드 서열을 가지는 엔지니어링 된 가이드 RNA를 Low 240ng plasmid transfection으로 감염시킨 것, Modi-3-High는 Modi-3-Low는 서열번호 4의 엔지니어링 된 스캐폴드 서열을 가지는 엔지니어링 된 가이드 RNA를 High 800ng plasmid transfection으로 감염시킨 것이다.

이하, 첨부된 도면을 참조하여, 발명의 내용을 특정한 구현예와 예시들을 통해 더욱 상세하게 설명한다. 상기 첨부된 도면은 발명의 일부 구현예를 포함하지만, 모든 구현예를 포함하고 있지는 않다는 점에 유의해야 한다. 본 명세서에 의해 개시되는 발명의 내용은 다양하게 구현될 수 있으며, 여기에 설명되는 특정 구현예로 제한되지 않는다. 이러한 구현예들은 본 명세서에 적용되는 법적 요건을 만족시키기 위해 제공되는 것으로 보아야 한다. 본 명세서에 개시된 발명이 속한 기술분야에 있어 통상의 기술자라면, 본 명세서에 개시된 발명의 내용에 대한 많은 변형 및 다른 구현예들을 떠올릴 수 있을 것이다. 따라서, 본 명세서에서 개시된 발명의 내용은 여기에 기재된 특정 구현예로 제한되지 않으며, 이에 대한 변형 및 다른 구현예들도 청구범위 내에 포함되는 것으로 이해되어야 한다.

용어의 정의

약

본 명세서에서 사용되는 "약"이라는 용어는 참조 양, 수준, 값, 수, 빈도, 퍼센트, 치수, 크기, 양, 중량 또는 길이에 대해 30, 25, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1 또는 0% 정도로 변하는 양, 수준, 값, 수, 빈도, 퍼센트, 치수, 크기, 양, 중량 또는 길이를 의미한다.

NLS (Nuclear Localization Sequence)

본 명세서에서 "NLS"라 함은, 핵 수송(nuclear transport) 작용으로 세포 핵 외부의 물질을 핵 내부로 수송할 때, 수송 대상인 단백질에 붙어 일종의 "태그"역할을 하는 일정 길이의 펩타이드, 또는 그 서열을 의미한다. 구체적으로, 상기 NLS는 아미노산 서열 PKKKRKV(서열번호 23)을 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK(서열번호 24)를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD(서열번호 25) 또는 RQRRNELKRSP(서열번호 26)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(서열번호 27)를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부 터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(서열번호 28); 마이오마(myoma) T 단백질의 서열 VSRKRPRP(서열번호 29) 및 PPKKARED(서열번호 30); 인간 p53의 서열 PQPKKKPL(서열번호 31); 마우스 c-abl IV의 서열 SALIKKKKKMAP(서열번호 32); 인플루엔자 바이러스 NS1의 서열 DRLRR(서열번호 33) 및 PKQKKRK(서열번호 34); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL(서열번호 35); 마우스 Mx1 단백질의 서열 REKKKFLKRR(서열번호 36); 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK(서열번호 37); 또는 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(서열번호 38)로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다. 본 명세서에서 사용되는 "NLS"라는 용어는 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다.

아미노산 서열 표기

달리 서술하지 않는 한, 본 명세서에서 아미노산 서열을 기재할 때는 아미노산 일문자 표기법, 또는 세문자 표기법을 사용하여, N-터미널에서 C-터미널 방향으로 기재한다. 예를 들어, RNVP로 표기하는 경우, N-터미널에서 C-터미널 방향으로 아르기닌(arginine), 아스파라긴(asparagine), 발린(valine), 및 프롤린(proline)이 차례로 연결된 펩타이드를 의미한다. 또 다른 예를 들어, Thr-Leu-Lys로 표기하는 경우, N-터미널에서 C-터미널 방향으로 트레오닌(Threonine), 류신(Leucine), 및 리신(Lysine)이 차례로 연결된 펩타이드를 의미한다. 상기 일문자 표기법으로 나타낼 수 없는 아미노산의 경우, 다른 문자를 사용하여 표기하며, 추가적으로 보충하여 설명한다.

각각의 아미노산 표기 방법은 다음과 같다: 알라닌(Alanine; Ala, A); 아르기닌(Arginine; Arg, R); 아스파라긴(Asparagine; Asn, N); 아스파르트산(Aspartic acid; Asp, D); 시스테인(Cysteine; Cys, C); 글루탐산(Glutamic acid; Glu, E); 글루타민(Glutamine; Gln, Q); 글리신(Glycine; Gly, G); 히스티딘(Histidine; His, H); 이소류신(Isoleucine; Ile, I); 류신(Leucine; Leu, L); 리신(Lysine; Lys K); 메티오닌(Methionine; Met, M); 페닐알라닌(Phenylalanine; Phe, F); 프롤린(Proline; Pro, P); 세린(Serine; Ser, S); 트레오닌(Threonine; Thr, T); 트립토판(Tryptophan; Trp, W); 티로신(Tyrosine; Tyr, Y); 및 발린(Valine; Val, V).

핵산 서열 표기

본 명세서에서 사용되는 A, T, C, G 및 U 기호는 당업계 통상의 기술자가 이해하는 의미로 해석된다. 문맥 및 기술에 따라 DNA 또는 RNA 상에서 염기, 뉴클레오사이드 또는 뉴클레오타이드로 적절히 해석될 수 있다. 예를 들어, 염기를 의미하는 경우는 각각 아데닌(A), 티민(T), 시토신(C), 구아닌(G) 또는 우라실(U) 자체로 해석될 수 있고, 뉴클레오사이드를 의미하는 경우는 각각 아데노신(A), 티미딘(T), 시티딘(C), 구아노신(G) 또는 유리딘(U)으로 해석될 수 있으며, 서열에서 뉴클레오타이드를 의미하는 경우는 상기 각각의 뉴클레오사이드를 포함하는 뉴클레오타이드를 의미하는 것으로 해석되어야 한다.

작동 가능하게 연결된(operably linked)

본 명세서에서 사용되는 "작동 가능하게 연결된"이라는 용어는 유전자 발현 기술에 있어서, 특정 구성이 다른 구성과 연결되어, 상기 특정 구성이 의도된 방식대로 기능할 수 있도록 연결되어 있는 것을 의미한다. 예를 들어, 프로모터 서열이 암호화 서열과 작동적으로 연결되었다고 할 때, 상기 프로모터가 상기 암호화 서열의 세포 내에서의 전사 및/또는 발현에 영향을 미칠 수 있도록 연결된 것을 의미한다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.

표적 유전자 또는 표적 핵산

본 명세서에서 사용되는 "표적 유전자" 또는 "표적 핵산"은 기본적으로, 유전자 편집의 대상이 되는 세포 내 유전자, 또는 핵산을 의미한다. 상기 표적 유전자 또는 표적 핵산은 혼용될 수 있으며, 서로 동일한 대상을 지칭할 수 있다. 상기 표적 유전자 또는 표적 핵산은 달리 기재되지 않은 한, 대상 세포가 가진 고유한 유전자 또는 핵산, 혹은 외부 유래의 유전자 또는 핵산 모두를 의미할 수 있으며, 유전자 편집의 대상이 될 수 있다면 특별히 제한되지 않는다. 상기 표적 유전자 또는 표적 핵산은 단일가닥 DNA, 이중가닥 DNA, 및/또는 RNA일 수 있다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.

표적 서열

본 명세서에서 사용되는 "표적 서열"은 CRISPR/Cas 복합체가 표적 유전자 또는 표적 핵산을 절단하기 위해 인식하는 특정 서열을 의미한다. 상기 표적 서열은 그 목적에 따라 적절히 선택될 수 있다. 구체적으로, "표적 서열"은 표적 유전자 또는 표적 핵산 서열 내에 포함된 서열이며, 본 명세서에서 제공하는 가이드 RNA, 또는 엔지니어링 된 가이드 RNA에 포함된 스페이서 서열과 상보성을 가지는 서열을 의미한다. 일반적으로, 상기 스페이서 서열은 표적 유전자 또는 표적 핵산의 서열 및 CRISPR/Cas 시스템의 이펙터 단백질이 인식하는 PAM 서열을 고려하여 결정된다. 상기 표적 서열은 CRISPR/Cas 복합체의 가이드 RNA와 상보적으로 결합하는 특정 가닥만을 지칭할 수 있으며, 상기 특정 가닥 부분을 포함하는 표적 이중 가닥 전체를 지칭할 수도 있으며, 이는 문맥에 따라 적절히 해석된다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.

벡터

본 명세서에서 사용되는 "벡터"는 달리 특정되지 않는 한, 유전 물질을 세포 내로 운반할 수 있는 모든 물질을 통틀어 일컫는다. 예를 들어, 벡터는 대상이 되는 유전 물질, 예를 들어 CRISPR/Cas 시스템의 이펙터 단백질을 암호화하는 핵산, 및/또는 가이드 RNA를 암호화하는 핵산을 포함하는 DNA 분자일 수 있으나, 이에 제한되는 것은 아니다. 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.

CRISPR/Cas 시스템

CRISPR/Cas 시스템 개괄

CRISPR/Cas 시스템은 원핵생물 유기체에서 발견되는 면역 시스템의 일종이며, Cas 단백질, 및 가이드 RNA를 포함한다. Cas 단백질, 또는 가이드 RNA의 자세한 구성에 대해서는 공개문헌인 WO2018/231018(국제공개번호)에 자세히 설명되어 있다. 본 명세서에서 사용되는 "Cas 단백질" 이라는 용어는 CRISPR/Cas 시스템에서 이용되는 것으로 해석될 수 있는 뉴클레이즈(nuclease)를 총칭하는 용어이다. 이하에서는 가장 일반적으로 쓰이는 CRISPR/Cas9 시스템의 DNA 절단 과정을 간략히 설명한다.

Cas9 단백질

CRISPR/Cas9 복합체에서, 핵산을 절단하는 뉴클레이즈(nuclase) 활성을 가지는 단백질을 Cas9 단백질이라 한다. 상기 Cas9 단백질은 CRISPR/Cas 시스템 분류 상 Class 2, Type II에 해당하며, 스트렙토코커스 피오게네스(Streptococcus pyogenes), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 속 (Streptococcus sp.), 스트렙토마이세스 프리스티네스피랄리스(Streptomyces pristinaespiralis), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 스트렙토스포랑기움 로세움(Streptosporangium roseum) 유래 Cas9 단백질 등이 있다.

가이드 RNA

CRISPR/Cas9 복합체에서, 표적 핵산에 포함된 특정 서열을 인식하도록 CRISPR/Cas9 복합체를 유도하는 기능을 가지는 RNA를 가이드 RNA라 한다. 상기 가이드 RNA의 구성을 기능적으로 나눈다면 크게, 1) 스캐폴드 서열 부분, 및 2) 가이드 서열 부분으로 나눌 수 있다. 상기 스캐폴드 서열 부분은 Cas9 단백질과 상호작용하는 부분으로, Cas9 단백질과 결합하여 복합체를 이룰 수 있도록 하는 부분이다. 일반적으로, 상기 스캐폴드 서열 부분은 tracrRNA, crRNA 반복 서열 부분을 포함하며, 상기 스캐폴드 서열은 어떤 Cas9 단백질을 사용하느냐에 따라서 결정된다. 상기 가이드 서열 부분은, 표적 핵산 내 일정 길이의 뉴클레오타이드 서열 부분과 상보적으로 결합할 수 있는 부분이다. 상기 가이드 서열 부분은 인위적으로 변형할 수 있는 염기 부분으로, 관심 있는 표적 뉴클레오타이드 서열에 의해 결정된다.

CRISPR/Cas9 복합체가 표적 핵산을 절단하는 과정

CRISPR/Cas9 복합체가 표적 핵산에 접촉하여 Cas9 단백질이 일정 길이의 뉴클레오타이드 서열을 인식하고, 가이드 RNA의 일부(상기 가이드 서열 부분)가 상기 PAM 서열과 인접한 부분과 상보적으로 결합하는 경우, CRISPR/Cas9 복합체에 의해 상기 표적 핵산이 절단된다. 이때, Cas9 단백질이 인식하는 일정 길이의 뉴클레오타이드 서열은 프로토스페이서 인접 모티프(protospacer-adjacent motif, PAM) 서열이라 하며, 이는 Cas9 단백질의 종류나 기원에 따라 결정되는 서열이다. 예를 들어, 스트렙토코커스 피오게네스(Streptococcus pyogenes) 유래 Cas9 단백질은 표적 핵산 내 5'-NGG-3' 서열을 인식할 수 있다. 이때, 상기 N은 아데노신(A), 티미딘(T), 사이티딘(C), 구아노신(G)중 하나이다. CRISPR/Cas9 복합체가 표적 핵산을 절단하기 위해서는 가이드 RNA의 가이드 서열 부분이 PAM 서열에 인접한 서열 부분과 상보적으로 결합해야 하므로, 상기 가이드 서열 부분은 표적 핵산의 서열, 구체적으로는 PAM 서열과 인접한 서열 부분에 맞추어 결정된다. CRISPR/Cas9 복합체가 상기 표적 핵산을 절단할 때, 표적 핵산의 PAM 서열 부분 및/또는 상기 가이드 서열과 상보적으로 결합하는 서열 부분 내 임의의 위치가 절단되게 된다.

표적 가닥, 비표적 가닥

CRISPR/Cas9 복합체는 이중가닥 DNA에 대한 절단 활성을 가진다. 상기 이중가닥 DNA에서, 상기 가이드 서열 부분과 결합하는 프로토스페이서(protospacer)가 있는 가닥을 표적 가닥(Target strand, TS)이라 한다. 상기 표적 가닥과는 상보적인 가닥으로, 상기 가이드 서열 부분과 결합하지 않는 프로토스페이서(protospacer)가 있는 가닥을 비표적 가닥(Non-target strand, NTS)라 한다. 상기 가이드 서열 부분은 이중가닥 DNA의 표적 가닥(TS)에 포함된 프로토스페이서 서열 부분과 상보적으로 결합할 수 있다. 상기 가이드 서열 및 이중가닥 DNA의 비표적 가닥(NTS)에 포함된 프로토스페이서 서열은 동등한(equivalent) 서열이다. 구체적으로, 가이드 서열은 RNA 서열이고, 비표적 가닥(NTS)에 포함된 프로토스페이서 서열은 이에 대응되는 DNA 서열이라는 차이가 있을 뿐이다.

캄필로박터 제주니(Campylobacter jejuni) 유래 Cas9 단백질

캄필로박터 제주니 유래 Cas9 단백질은, CjCas9이라고도 지칭되며, Cas9 단백질의 오르쏘로그(orthologs) 중 하나이다. 상기 CjCas9은 Cas9 중에서도 가장 작은 크기를 가지며, 진핵세포에서 이중가닥 DNA 절단 활성을 보이는 것으로 알려져 있다.

종래 기술의 한계점

캄필로박터 제주니 유래 Cas9 단백질의 유전자 편집 효율이 낮음

캄필로박터 제주니 유래 Cas9 단백질의 경우, 이중가닥 DNA 절단 활성을 보이며, 그 크기가 상대적으로 작아 상용화하는 데 있어 이점이 있다. 하지만, 캄필로박터 제주니 유래 Cas9 단백질은 세포 내에서 유전자 편집 효율이 스트렙토코커스 피오게네스 유래 Cas9에 비해 낮은 것으로 알려져 있으며, 특히 Cas9 단백질 및 가이드 RNA를 벡터화하여 도입하는 경우 특히 그 효율이 떨어지는 문제점이 있다.

가이드 RNA가 4개의 연속된 유리딘을 포함

상기 캄필로박터 제주니 유래 Cas9 단백질에 대한 가이드 RNA는 그 스캐폴드 서열 중, crRNA의 repeat 부분에 4개의 유리딘이 연속된 서열을 포함한다 이에 따라, 상기 가이드 RNA를 벡터화하는 경우, 4개의 티미딘이 연속된 DNA 서열이 벡터에 포함되게 된다. 상기 벡터를 전사하여 RNA를 생산하는 RNA 중합효소는 5개의 티미딘이 연속된 서열(5'-TTTTT-3')을 종결 신호로 인식하여 중합을 멈춘다. 상기 벡터화된 가이드 RNA에 포함된 4개의 티미딘이 연속된 DNA 서열(5'-TTTT-3')은 비록 종결 신호는 아니지만, 종결 신호와 유사하게 인식되어 transcriptional pausing이나 immature termination이 일어날 수 있음이 보고되어 있다. 따라서, 상기 가이드 RNA는 벡터 형태로 세포 내에 도입하는 경우 제대로 발현되지 않을 가능성이 있다. 이는 캄필로박터 제주니 유래 Cas9 단백질-가이드 RNA 복합체가 세포 내에서 충분히 형성되지 못하는 원인이 되므로, CRISPR/CjCas9 시스템 발현 벡터의 유전자 편집 효율을 떨어트린다.

엔지니어링 된 CRISPR/Cas9 시스템

엔지니어링 된 CRISPR/Cas9 시스템 개괄

본 명세서에서는 엔지니어링 된 CRISPR/Cas9 시스템을 개시한다. 상기 엔지니어링 된 CRISPR/Cas9 시스템은 캄필로박터 제주니 유래 Cas9 단백질(CjCas9) 및 (엔지니어링 된) 가이드 RNA를 포함하며, 가이드 RNA가 엔지니어링 된 것을 특징으로 한다. 구체적으로, 상기 가이드 RNA는 가이드 도메인과 엔지니어링 된 스캐폴드를 포함하며, 상기 엔지니어링 된 스캐폴드는 이에 대응되는 야생형 CjCas9 단백질의 가이드 RNA와 비교하여, 가이드 도메인에 인접한 5'-UUUU-3' 서열 부분 및 이와 상보적으로 결합하여 Tetraloop을 이루는 5'-AAAA-3' 서열 부분이 변형된 것이다. 이러한 특징으로 인해 상기 엔지니어링 된 CRISPR/Cas9 시스템은 1) 발현벡터 형태로 세포 내 도입 시, 야생형의 가이드 RNA와 비교하여 높은 발현량을 나타내고, 2) CRISPR/Cas9 시스템의 활성이 증가되는 특징을 가진다.

엔지니어링 된 가이드 RNA

본 명세서에서 개시하는 엔지니어링 된 CRISPR/Cas9 시스템은 엔지니어링 된 가이드 RNA를 포함한다. 상기 엔지니어링 가이드 RNA는 5'말단에서 3'말단 방향으로 가이드 도메인 및 엔지니어링 된 스캐폴드가 순차적으로 연결된 것이다. 상기 가이드 도메인은 표적 서열을 가지는 핵산을 표적할 수 있는 부분으로, 엔지니어링 된 CRISPR/Cas9 시스템이 표적-특이적 핵산 절단 활성을 보일 수 있도록 한다. 상기 가이드 도메인은 표적 서열에 따라 적절하게 설계된다. 상기 엔지니어링 된 스캐폴드는 Cas9 단백질과 상호작용하여 복합체를 이루도록 하는 부분이다. 상기 엔지니어링 된 스캐폴드는 연속하는 4개 이상의 유리딘(U)를 가지지 않도록 설계되어, 벡터 사용 시 높은 발현량을 보인다.

Cas9 단백질

본 명세서에서 개시하는 엔지니어링 된 CRISPR/Cas9 시스템은 Cas9 단백질을 포함한다. 구체적으로, 상기 Cas9 단백질은 캄필로박터 제주니 유래 Cas9 단백질이다. 상기 Cas9 단백질은 야생형의 Cas9 단백질, 변형된 Cas9 단백질, 및 상기 Cas9 단백질에 추가적인 도메인이 융합된 융합 단백질을 통틀어 일컫는다.

엔지니어링 된 CRISPR/Cas9 시스템의 특징 1 - 가이드 RNA 발현량 증가

본 명세서에서 개시하는 엔지니어링 된 CRISPR/Cas9 시스템은 자연계에서 발견되는 CRISPR/Cas9 시스템의 가이드 RNA에 비해 스캐폴드 부분이 엔지니어링 된 것이 특징이다. 구체적으로, 야생형 crRNA의 repeat 부분에 포함된 5'-UUUU-3' 서열, 및 이와 상보적으로 결합하는 야생형 tracrRNA에 포함된 Antirepeat 부분에 포함된 5'-AAAA-3' 서열이 적절하게 변경되어 있다. 따라서, 상기 엔지니어링 된 가이드 RNA는 서열 내 4개 이상의 유리딘이 연속되는 부분이 존재하지 않는다. 이는 상기 엔지니어링 된 CRISPR/Cas9 시스템을 벡터화하여 세포에 도입하였을 때, RNA 중합효소가 4개의 연속된 티미딘(T) 부분을 인식하여 transcriptional pausing이나 immature termination이 되는 일을 방지한다. 결과적으로, 본 명세서에서 개시하는 상기 엔지니어링 된 가이드 RNA는 벡터 사용 시 세포 내에서 높은 발현량을 보인다.

엔지니어링 된 CRISPR/Cas9 시스템의 특징 2 - CRISPR/Cas9 시스템 활성 증가

본 명세서에서 개시하는 엔지니어링 된 CRISPR/Cas9 시스템은 상기 엔지니어링 된 스캐폴드로 인해 유전자 절단 활성 및/또는 효율 그 자체가 향상된 효과를 가진다. 즉, 전술한 스캐폴드 부분이 엔지니어링된 가이드 RNA는 전술한 가이드 RNA의 발현량의 증가뿐만 아니라, CjCas9과의 상호작용에 의한 DNA 절단 효율 자체도 높아지는 특징을 나타낸다. 따라서, 상기 엔지니어링 된 CRISPR/Cas9 시스템은 그 사용 형태 (리보뉴클레오프로틴, 벡터, 및/또는 조성물)를 막론하고 야생형의 CRISPR/Cas9 시스템보다 높은 유전자 편집 활성을 보인다.

엔지니어링 된 스캐폴드

엔지니어링 된 스캐폴드 개괄

본 명세서에서 개시하는 엔지니어링 된 스캐폴드는 5'말단으로부터 3'말단 방향으로 제1 영역, 제2 영역, 제3 영역, 및 제4 영역으로 나눌 수 있다. 상기 각각의 영역은, 이하 설명하는, 캄필로박터 제주니 유래 Cas9 단백질에 대한 야생형 가이드 RNA의 스캐폴드(이하, 야생형 스캐폴드)의 각 부분과 대응될 수 있다. 이하, "제n 영역" (n은 1, 2, 3, 또는 4)이라 지칭하는 경우 엔지니어링 된 스캐폴드의 제n 영역을 의미한다 "야생형의 제n 영역"이라 지칭하는 경우 야생형 가이드 RNA의 스캐폴드 중 해당 부분을 지칭한다. 여기서, 상기 야생형 가이드 RNA는 자연적으로 발생한 crRNA 및 tracrRNA를 포함하는 가이드 RNA를 지칭한다. 또한, 상기 crRNA 및 tracrRNA가 링커(예를 들어 5'-GAAA-3' 또는 5'-GA-3' 서열의 링커)로 연결된 싱글 가이드 RNA도 본 명세서의 야생형 가이드 RNA에 포함되며, 이하, 이를 중심으로 설명하도록 한다.

야생형 스캐폴드의 각 부분

상기 야생형 스캐폴드는 자연적으로 발생한, 캄필로박터 제주니 유래 Cas9 단백질에 대한 가이드 RNA의 스캐폴드를 지칭한다.

일 구현예로, 상기 야생형 스캐폴드는 GUUUUAGUCCCUGAAGGGACUAAAAUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGC (서열번호 1)의 서열로 표현될 수 있다.

일 구현예로, 상기 야생형 스캐폴드는 다음과 같이 구분될 수 있다:

5'-[야생형의 제1 영역]-[야생형의 제2 영역]-[야생형의 제3 영역]-[야생형의 제4 영역]-3'

여기서, 야생형의 제1 영역은 5'-GUUUU-3'이고, 야생형의 제2 영역은 5'-AGUCCCUGAAGGGACU-3'(서열번호 6)이고, 야생형의 제3 영역은 5'-AAAA-3'이고, 야생형의 제4 영역은 5'-UAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGC-3'(서열번호 7)이다.

제1 영역

본 명세서에서 개시하는 엔지니어링 된 스캐폴드의 제1 영역은 연속하는 4개의 유리딘(U)을 가지지 않도록 변형된 것이 특징이다. 구체적으로, 상기 제1 영역은 5'-GUUUC-3', 5'-GUUCU-3', 5'-GUCUU-3', 및 5'-GCUUU-3' 중 선택된 서열로 표현된다.

제2 영역

본 명세서에서 개시하는 엔지니어링 된 스캐폴드의 제2 영역은 야생형의 제2 영역의 서열과 동일하거나 유사한 서열로 표현된다. 구체적으로, 상기 제2 영역은 5'-AGUCCCUGAAGGGACU-3'(서열번호 6)과 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 또는 100% 동일하거나, 동등하거나, 상동성 있는 서열로 표현된다.

제3 영역

본 명세서에서 개시하는 엔지니어링 된 스캐폴드의 제3 영역은 상기 제1 영역과 상보적으로 결합하여 stem-loop 구조를 이룰 수 있는 서열이다. 상기 제3 영역은 상기 제1 영역이 어떤 서열로 표현되느냐에 따라 결정된다. 구체적으로, 상기 제1 영역이 5'-GUUUC-3'으로 표현되는 경우, 상기 제3 영역은 5'-GAAA-3'으로 표현되고, 상기 제1 영역이 5'-GUUCU-3'으로 표현되는 경우, 상기 제3 영역은 5'-AGAA-3'으로 표현되고, 상기 제1 영역이 5'-GUCUU-3'으로 표현되는 경우, 상기 제3 영역은 5'-AAGA-3'으로 표현되고, 상기 제1 영역이 5'-GCUUU-3'으로 표현되는 경우, 상기 제3 영역은 5'-AAAG-3'으로 표현된다.

제4 영역

본 명세서에서 개시하는 엔지니어링 된 스캐폴드의 제4 영역은 야생형의 제4 영역의 서열과 동일하거나 유사한 서열로 표현된다. 구체적으로, 상기 제4영역은 5'-UAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGC-3'(서열번호 7)과 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 또는 100% 동일하거나, 동등하거나, 상동성 있는 서열로 표현된다.

엔지니어링 된 가이드 RNA

엔지니어링 된 가이드 RNA 개괄

본 명세서에서 제공하는 엔지니어링 된 가이드 RNA는 Cas9 단백질과 상호작용하여 복합체를 형성할 수 있으며, 표적 서열을 가진 핵산을 표적할 수 있다. 상기 엔지니어링 된 가이드 RNA는 가이드 도메인 및 엔지니어링 된 스캐폴드를 포함한다. 상기 엔지니어링 된 스캐폴드는 상기 가이드 RNA가 Cas9 단백질과 상호작용하여 복합체를 형성하는 데 관여하는 구성이다. 상기 가이드 도메인은 표적 서열을 가진 핵산을 표적하여 상기 Cas9-가이드 RNA 복합체가 표적-특이적 핵산 절단 활성을 나타낼 수 있도록 하는 구성이다. 구체적으로, 상기 가이드 도메인은 표적 서열을 가진 핵산을 표적할 수 있도록 설계된다. 상기 엔지니어링 된 가이드 RNA는 5'말단에서 3'말단 방향으로, 가이드 도메인 및 엔지니어링 된 스캐폴드가 순차적으로 연결된 것이다.

엔지니어링 된 스캐폴드

상기 가이드 RNA의 엔지니어링 된 스캐폴드는 상기 가이드 RNA가 Cas9 단백질과 상호작용하여 복합체를 형성할 수 있도록 한다. 상기 엔지니어링 된 스캐폴드는 《엔지니어링 된 스캐폴드》 단락에서 설명한 바와 같다.

가이드 도메인

상기 프로그램 가능한 가이드 RNA는 가이드 도메인을 포함한다. 상기 가이드 도메인은 표적 서열의 핵산을 표적할 수 있는 구성으로, CRISPR/Cas9 시스템의 표적-특이적 핵산 절단 효과 활성화에 관여한다. 구체적으로, 상기 가이드 도메인은 표적 핵산과 상보적으로 결합할 수 있다. 본 명세서에서 개시하는 신규 CRISPR/Cas9 시스템을 유전자 편집 용도로 사용하기 위해서, 상기 가이드 도메인은 편집하고자 하는 유전자, 또는 표적 서열의 핵산을 표적할 수 있도록 인공적으로 설계된 것이다.

가이드 도메인 및 표적서열의 관계

엔지니어링 된 CRISPR/Cas9 시스템이 특정 핵산을 절단하기 위해서는, 우선 상기 가이드 도메인이 표적 서열의 핵산과 결합할 수 있어야 한다. 따라서, 상기 가이드 도메인은 표적 서열과 상보적인 서열을 가지거나, 경우에 따라서는 표적 서열과 동등한(equivalent) 서열을 가질 수 있다. 전술한 가이드 도메인 및 표적 서열의 관계는 표적 서열을 가진 핵산의 종류 및/또는 표적 서열의 핵산 내 위치에 따라 달라진다.

일 구현예로, 상기 표적 서열의 핵산이 단일가닥 핵산인 경우, 상기 가이드 도메인은 상기 표적 서열과 상보적인 서열을 가질 수 있다. 또 다른 구현예로, 상기 표적 서열의 핵산이 이중가닥 핵산이고, 상기 표적 서열이 CRISPR/Cas9 시스템의 PAM 서열이 위치하는 가닥과 동일한 가닥에 위치하는 경우, 상기 가이드 도메인은 상기 표적 서열과 동등한(equivalent) 서열일 수 있다. 또 다른 구현예로, 상기 표적 서열의 핵산이 이중가닥 핵산이고, 상기 표적 서열이 CRISPR/Cas9 시스템의 PAM 서열이 위치하는 가닥과 다른 가닥에 위치하는 경우, 상기 가이드 도메인은 상기 표적 서열과 상보적인 서열일 수 있다.

가이드 도메인 길이

일 구현예로, 상기 가이드 도메인은 1nt, 2nt, 3nt, 4nt, 5nt, 6nt, 7nt, 8nt, 9nt, 10nt, 11nt, 12nt, 13nt, 14nt, 15nt, 16nt, 17nt, 18nt, 19nt, 20nt, 21nt, 22nt, 23nt, 24nt, 25nt, 26nt, 27nt, 28nt, 29nt, 또는 30nt 길이일 수 있다. 일 구현예로, 상기 가이드 도메인은 바로 이전 문장에서 선택된 두 수치범위 사이의 길이일 수 있다. 예를 들어, 상기 가이드 도메인은 18nt 내지 22nt 길이일 수 있다.

가이드 RNA 구조

상기 가이드 RNA에서, 상기 가이드 도메인은 상기 엔지니어링 된 스캐폴드의 5'말단 방향에, 상기 엔지니어링 된 스캐폴드는 상기 가이드 도메인의 3'말단 방향에 위치한다.

일 구현예로, 상기 가이드 RNA는 5'말단에서 3'말단 방향으로 상기 가이드 도메인 및 상기 엔지니어링 된 스캐폴드가 차례로 연결되어 있는 것을 특징으로 한다.

또 다른 구현예로, 상기 가이드 RNA는 다음 [구조식 2]로 표현된다:

[구조식 2]

5'-[가이드 도메인]-[엔지니어링 된 스캐폴드]-3'.

Cas9 단백질

Cas9 단백질 개괄

본 명세서에서 제공하는 엔지니어링 된 CRISPR/Cas9 시스템은 Cas9 단백질, 구체적으로는 캄필로박터 제주니 유래 Cas9 단백질을 포함한다. 여기서, 상기, Cas9 단백질은 야생형의 Cas9 단백질, 하나 이상의 서열이 변형된 Cas9 단백질, 기능이 변경된 Cas9 단백질, 기타 추가 변형을 포함하는 Cas9 단백질, 및 상기 Cas9 단백질을 포함하는 융합 단백질을 모두 포괄한다. 본 명세서에서 Cas9 단백질이라 함은, 본 《Cas9 단백질》 단락에서 설명하는 다양한 형태의 Cas9 단백질을 모두 포함하는 것으로 해석해야 한다.

야생형의 Cas9 단백질

본 명세서에서 제공하는 엔지니어링 된 CRISPR/Cas9 시스템의 Cas9 단백질은 야생형의 Cas9 단백질일 수 있다. 구체적으로, 상기 야생형의 Cas9 단백질은 캄필로박터 제주니 유래 Cas9 단백질일 수 있다.

변형된 Cas9 단백질 1 - 서열 변형

본 명세서에서 제공하는 엔지니어링 된 CRISPR/Cas9 시스템은 변형된 Cas9 단백질을 포함할 수 있다. 상기 변형된 Cas9은 야생형, 또는 코돈 최적화된 Cas9 단백질 서열에서 적어도 일부 서열이 변형된 것을 의미한다. 상기 Cas9 단백질 변형은 개별 아미노산 단위로 이루어진 것일 수 있고, 단백질의 기능적 도메인 단위로 이루어진 것일 수 있다.

일 구현예로, 상기 단백질의 변형은 야생형, 또는 코돈 최적화된 Cas9 단백질 서열에서 하나 이상의 아미노산, 펩타이드, 폴리펩타이드, 단백질, 및/또는 도메인이 개별적으로 치환, 제거, 및/또는 부가된 것일 수 있다. 일 구현예로, 상기 Cas9 단백질은 야생형 Cas9 단백질에 포함된 RuvC 도메인, REC1 도메인, REC2 도메인, HNH 도메인, 및/또는 PI 도메인 내 하나 이상의 아미노산, 펩타이드, 및/또는 폴리펩타이드가 치환, 제거, 및/또는 부가된 것일 수 있다.

변형된 Cas9 단백질 2 - 기능 변형

본 명세서에서 제공하는 엔지니어링 된 CRISPR/Cas9 시스템에 포함된 Cas9 단백질은 야생형의 Cas9 단백질과 동일한 기능을 가질 수 있다. 본 명세서에서 제공하는 엔지니어링 된 CRISPR/Cas9 시스템에 포함된 Cas9 단백질은 야생형의 Cas9 단백질과 비교할 때, 기능이 변경된 것일 수 있다. 구체적으로, 상기 변경은 전부 또는 일부 기능의 변형, 전부 또는 일부 기능의 상실, 및/또는 부가적인 기능의 추가일 수 있다. 일 구현예로, 상기 Cas9 단백질은 당업계 통상의 기술자가 CRISPR/Cas 시스템의 Cas 단백질에 적용할 수 있는 변경이라면, 특별히 제한되지 않는다. 이때 상기 변경은 공지의 기술을 이용한 것일 수 있다.

일 구현예로, 상기 Cas9 단백질은 표적 핵산의 이중가닥 중 하나의 가닥만 절단하도록 변경된 것일 수 있다. 더 나아가, 상기 Cas9 단백질은 표적 핵산의 이중가닥 중 하나의 가닥만 절단할 수 있고, 절단하지 않는 가닥에 대해 베이스 에디팅(Base editing) 또는 프라임 에디팅(Prime editing)을 할 수 있도록 변경된 것일 수 있다. 일 구현예로, 상기 Cas9 단백질은 표적 핵산의 이중가닥 전부를 절단할 수 없도록 변경된 것일 수 있다. 더 나아가, 상기 Cas9 단백질은 표적 핵산의 이중가닥 전부를 절단할 수 없고, 표적 핵산에 대해 베이스 에디팅(Base editing), 프라임 에디팅(Prime editing), 또는 유전자 발현 조절 기능을 할 수 있도록 변경된 것일 수 있다.

Cas9 단백질을 포함하는 융합 단백질

본 명세서에서 제공하는 엔지니어링 된 CRISPR/Cas9 시스템은 Cas9 융합 단백질을 포함할 수 있다. 이때, 상기 Cas9 융합 단백질은 야생형, 또는 변형된 Cas9 단백질에 추가적인 아미노산, 펩타이드, 폴리펩타이드, 단백질, 및/또는 도메인이 융합된 단백질을 의미한다. 일 구현예로, Cas9 단백질은 야생형의 Cas9 단백질에 베이스 에디터, 및/또는 역전사 효소(reverse transcriptase)가 융합된 것일 수 있다. 일 구현예로, 상기 베이스 에디터는 adenosine deaminase, 및/또는 cytidine deaminase일 수 있다. 일 구현예로, 상기 역전사 효소는 Moloney Murine Leukemia Virus(M-MLV) 역전사 효소, 및/또는 그 변이체일 수 있다. 이때, 상기 역전사 효소가 융합된 Cas9 단백질은 프라임 에디터로 기능할 수 있다. 일 구현예로 , Cas9 단백질은 야생형의 Cas9 단백질에, 세포 내의 유전자 발현 과정에 관여할 수 있는 다양한 효소가 융합된 것일 수 있다. 이때, 상기 효소가 융합된 Cas9 단백질은 세포 내 유전자 발현에 다양한 양적, 질적 변화를 초래할 수 있다.

변형된 Cas9 단백질 3 - 기타 변형

일 구현예로, 상기 Cas9 단백질은 NLS(Nuclear Localization Sequence), 또는 NES(Nuclear Export Sequence)를 포함할 수 있다. 구체적으로, 상기 NLS는 《용어의 정의》 중 NLS 단락에 예시된 것 중 어느 하나일 수 있으나, 이에 제한되는 것은 아니다. 일 구현예로, 상기 Cas9 단백질은 태그를 포함할 수 있다. 구체적으로, 상기 태그는 "용어의 정의" 중 태그 단락에 예시된 것 중 어느 하나일 수 있으나, 이에 제한되는 것은 아니다.

PAM 서열

CRISPR/Cas9 시스템이 표적 유전자, 또는 표적 핵산을 절단하기 위해서는 두 가지 조건이 필요하다.

첫째, 표적 유전자, 또는 표적 핵산 내에 Cas9 단백질이 인식할 수 있는 일정 길이의 염기 서열(뉴클레오타이드 서열)이 있어야 한다. 이때, 상기 Cas9 단백질에 의해 인식되는 일정 길이의 염기 서열(뉴클레오타이드 서열)을 Protospacer Adjacent Motif(PAM) 서열이라 한다. 상기 PAM 서열은 상기 Cas9 단백질에 따라 정해지는 고유한 서열이다, 둘째, 상기 일정 길이의 PAM 서열 주변에 가이드 RNA에 포함된 스페이서 서열과 상보적으로 결합할 수 있는 서열이 있어야 한다.

이러한 두 가지 조건이 만족되어 1) Cas9 단백질이 상기 일정 길이의 PAM 서열을 인식하고, 2) 상기 스페이서 서열 부분이 상기 PAM 서열 주변 서열 부분과 상보적으로 결합하는 경우, Cas9 단백질/가이드 RNA 복합체(CRISPR/Cas9 복합체)는 표적 유전자, 또는 표적 핵산을 절단한다. 따라서, 상기 CRISPR/Cas9 복합체의 표적 서열을 결정할 때, 상기 PAM 서열과 인접한 서열 내에서 상기 표적 서열을 결정해야 한다는 제약이 따른다.

PAM 서열 예시

본 명세서에서 제공하는 CRISPR/Cas9 시스템의 Cas9 시스템은 캄필로박터 제주니 유래 Cas9 단백질을 기초로 하므로, 캄필로박터 제주니 유래 Cas9 단백질이 인식하는 PAM 서열을 인식할 수 있다. 일 구현예로, 상기 Cas9 단백질의 PAM 서열은 5'-NNNNRYAC-3'일 수 있다. 여기서, 상기 N은 각각 독립적으로 디옥시티미딘(T), 디옥시아데노신(A), 디옥시사이티딘(C), 또는 디옥시구아노신(G) 중 하나이다. 상기 R은 디옥시아데노신(A), 또는 디옥시구아노신(G) 중 하나이다. 상기 Y는 디옥시티미딘(T), 또는 디옥시사이티딘(C) 중 하나이다. 일 구현예로, 상기 Cas9 단백질의 PAM 서열은 야생형의 캄필로박터 제주니 유래 Cas9의 PAM 서열과는 다른 것일 수 있다.

엔지니어링 된 CRISPR/Cas9 복합체

본 명세서에서는 엔지니어링 된 CRISPR/Cas9 복합체를 개시한다. 상기 엔지니어링 된 CRISPR/Cas9 복합체는 Cas9 단백질, 및 엔지니어링 된 가이드 RNA가 복합체를 이루고 있는 것이며, 직접적으로 표적-특이적 핵산 절단 활성을 나타낸다. 여기서, 상기 Cas9 단백질은 《Cas9 단백질》 단락에서 서술된 것과 같다. 또한, 상기 엔지니어링 된 가이드 RNA는 《엔지니어링 된 가이드 RNA》 단락에서 서술된 것과 같다.

엔지니어링 된 CRISPR/Cas9의 각 구성요소를 발현할 수 있는 벡터

발현 벡터 개괄

본 명세서에서는 엔지니어링 된 CRISPR/Cas9 시스템 각 구성요소를 발현할 수 있는 벡터를 개시한다. 상기 벡터는 엔지니어링 된 CRISPR/Cas9 시스템을 대상 세포 내에서 발현시켜서 소정의 목적을 달성할 수 있다. 상기 발현 벡터는 엔지니어링 된 CRISPR/Cas9 시스템의 각 구성요소를 발현할 수 있는 것이라면 특별히 제한되지 않는다. 구체적으로, 상기 발현 벡터는 Cas9 단백질을 암호화하는 핵산, 엔지니어링 된 가이드 RNA를 암호화하는 핵산을 포함하고, 프로모터 등 기타 추가 구성을 포함할 수 있다. 또한, 상기 발현 벡터는 DNA 및/또는 mRNA일 수 있으나, 이에 제한되는 것은 아니다.

발현 벡터 구성 1 - Cas9 단백질 암호화하는 핵산

상기 엔지니어링 된 CRISPR/Cas9 시스템 각 구성요소 발현 벡터는 Cas9 단백질을 암호화하는 핵산을 포함한다. 여기서, 상기 Cas9 단백질은 《Cas9 단백질》 단락에서 서술된 것과 같다.

발현 벡터 구성 2 - 엔지니어링 된 가이드 RNA 암호화 핵산

상기 엔지니어링 된 CRISPR/Cas9 시스템 각 구성요소 발현 벡터는 엔지니어링 된 가이드 RNA를 암호화하는 핵산을 포함한다. 여기서, 상기 엔지니어링 된 가이드 RNA는 《엔지니어링 된 가이드 RNA》 단락에서 서술된 것과 같다.

발현 벡터 구성 3 - 기타 구성

상기 엔지니어링 된 CRISPR/Cas9 시스템 구성요소 발현 벡터는 그 외 세포 내에서 엔지니어링 된 CRISPR/Cas9 시스템의 각 구성요소를 발현하기 위해 필요한 기타 구성을 포함할 수 있다.

일 구현예로, 상기 기타 구성은 프로모터, 인핸서, 인트론, 폴리아데닐화 신호, 코작 공통(Kozak consensus) 서열, 내부 리보솜 유입 부위(IRES, Internal Ribosome Entry Site), 스플라이스 억셉터, 2A 서열 및/또는 복제원점(replication origin)을 포함할 수 있다. 여기서, 상기 프로모터 서열은 대응하는 RNA 전사 인자, 또는 발현 환경에 따라 달리 설계할 수 있으며, CRISPR/Cas 시스템의 구성 요소를 세포 내에서 적절히 발현시킬 수 있는 것이라면 제한되지 않는다. 예를 들어, 상기 프로모터는 SV40 초기 프로모터, mouse mammary tumor virus long terminal repeat(LTR) 프로모터, adenovirus major late 프로모터 (Ad MLP), herpes simplex virus (HSV) 프로모터, CMV immediate early promoter region (CMVIE)와 같은 cytomegalovirus (CMV) 프로모터, rous sarcoma virus (RSV) 프로모터, human U6 small nuclear 프로모터 (U6) (Miyagishi et al., Nature Biotechnology 20, 497 - 500 (2002)), enhanced U6 프로모터 (e.g., Xia et al., Nucleic Acids Res. 2003 Sep 1;31(17)), human H1 프로모터 (H1), 및 7SK 중 하나 일 수 있으나, 이에 제한되는 것은 아니다. 또한, 상기 복제원점은 f1 복제원점, SV40 복제원점, pMB1 복제원점, 아데노 복제원점, AAV 복제원점, 및/또는 BBV 복제원점일 수 있으나, 이에 제한되는 것은 아니다.

발현 벡터 형태 1 - 바이러스 벡터

상기 발현 벡터는 바이러스 벡터일 수 있다.

일 구현예로, 상기 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 하나 이상일 수 있다. 일 구현예로, 상기 바이러스 벡터는 아데노-연관 바이러스일 수 있다.

발현 벡터 형태 2 - 비바이러스 벡터

상기 발현 벡터는 비바이러스 벡터일 수 있다. 일 구현예로, 상기 비바이러스 벡터는 플라스미드, 파지, 네이키드 DNA, DNA 복합체, 및 mRNA로 구성된 군에서 선택되는 1 이상일 수 있다. 일 구현예로, 상기 플라스미드는 pcDNA 시리즈, pS456, p326, pACYC177, ColE1, pKT230, pME290, pBR322, pUC8/9, pUC6, pBD9, pHC79, pIJ61, pLAFR1, pHV14, pGEX 시리즈, pET 시리즈, 및 pUC19으로 이뤄진 군에서 선택된 것일 수 있다. 일 구현예로, 상기 파지는 λgt4λB, λ-Charon, λΔz1, 및 M13으로 이뤄진 군에서 선택된 것일 수 있다. 일 구현예로, 상기 암호화 핵산은 PCR 앰플리콘(amplicon)일 수 있다.

엔지니어링 된 CRISPR/Cas9 조성물

본 명세서에서는 엔지니어링 된 CRISPR/Cas9 시스템의 각 구성요소 및/또는 각 구성요소를 암호화하는 핵산을 포함하는 엔지니어링 된 CRISPR/Cas9 조성물을 개시한다. 여기서, 엔지니어링 된 CRISPR/Cas9 시스템의 각 구성요소는 《Cas9 단백질》, 및 《엔지니어링 된 가이드 RNA> 단락에서 설명된 것이다. 상기 엔지니어링 된 CRISPR/Cas9 조성물의 형태는 CRISPR/Cas9 시스템이 목적에 맞게 기능할 수 있는 한 특별히 제한되지 않는다.

엔지니어링 된 CRISPR/Cas9 시스템을 사용한 유전자 편집 방법

유전자 편집 방법 개괄

본 명세서에서는 엔지니어링 된 CRISPR/Cas9 시스템을 사용한 유전자 편집 방법을 개시한다. 일 예로, 상기 유전자 편집 방법은 엔지니어링 된 CRISPR/Cas9 시스템을 적절한 전달형태로, 적절한 전달방법을 사용하여 유전자 편집 대상에 전달(deliver), 주입(inject), 및/또는 도입(administer)하는 것일 수 있다. 또 다른 예로, 상기 유전자 편집 방법은 엔지니어링 된 CRISPR/Cas9 복합체를 표적 서열을 가지는 핵산에 접촉시키거나, 접촉하도록 유도하는 것일 수 있다.

유전자 편집 대상 1 - 대상개체, 또는 대상조직

상기 유전자 편집 대상은 개체 또는 조직일 수 있으며, 대상개체 또는 대상조직으로 지칭될 수 있다. 일 구현예로, 상기 대상개체는 식물, 동물, 비인간 동물, 및/또는 인간일 수 있다. 구체적으로, 상기 대상개체는 포유류일 수 있다. 일 구현예로, 상기 대상조직은 비인간 동물의 조직 및/또는 인간의 조직일 수 있다.

유전자 편집 대상 2 - 대상세포

상기 유전자 편집 대상은 세포를 의미할 수 있으며, 대상 세포로 지칭될 수 있다. 일 구현예로, 상기 대상 세포는 원핵 세포일 수 있다. 또 다른 구현예로, 상기 대상 세포는 진핵 세포일 수 있다. 구체적으로, 상기 진핵 세포는 식물 세포, 동물 세포, 비인간 동물 세포 및/또는 인간 세포일 수 있다.

CRISPR/Cas9 시스템 전달형태 1 - RNP

상기 전달형태는 Cas9 단백질 및 엔지니어링 된 가이드 RNA가 결합한 리보뉴클레오프로틴 입자일 수 있다. 이는, 《엔지니어링 된 CRISPR/Cas9 복합체》 단락에서 설명된 단백질-핵산 복합체 형태일 수 있다.

CRISPR/Cas9 시스템 전달형태 2 - 벡터

상기 전달형태는 엔지니어링 된 CRISPR/Cas9의 각 구성요소를 발현할 수 있는 벡터일 수 있다. 이는, 《엔지니어링 된 CRISPR/Cas9의 각 구성요소를 발현할 수 있는 벡터》 단락에서 설명된 것일 수 있다.

CRISPR/Cas9 시스템 전달형태 3 - 조성물

상기 전달형태는 엔지니어링 된 CRISPR/Cas9 시스템의 각 구성요소 및/또는 각 구성요소를 암호화하는 핵산을 포함하는 조성물일 수 있다. 이는, 《엔지니어링 된 CRISPR/Cas9 조성물》 단락에서 설명된 조성물일 수 있다.

CRISPR/Cas9 시스템 전달방법 1 - 일반적인 전달 수단

상기 전달방법은, 세포 내로 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas9 단백질 또는 이를 암호화하는 핵산을 상기 전달형태 중 어느 하나로 세포 내로 전달할 수 있는 것이라면 특별히 제한되지 않는다. 일 구현예로, 상기 전달 방법은 전기천공법, 유전자총, 초음파천공법, 자기주입법(magnetofection), 및/또는 일시적인 세포 압축 또는 스퀴징일 수 있다.

CRISPR/Cas9 시스템 전달방법 2 - 나노파티클

상기 전달 방법은, 상기 CRISPR/Cas9 시스템에 포함된 적어도 하나의 구성요소를 나노파티클을 이용하여 전달하는 것일 수 있다. 이때, 상기 전달 방법은 당업계 통상의 기술자가 적절히 선택할 수 있는 공지된 방법일 수 있다. 예를 들어, 상기 나노파티클 전달 방법은 (WO 2019/089820 A1)에 개시된 방법일 수 있으나, 이에 제한되는 것은 아니다.

일 구현예로, 상기 전달 방법은 Cas9 단백질 또는 이를 암호화하는 핵산 및/또는 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산을 나노파티클을 이용하여 전달하는 것일 수 있다. 이때, 상기 전달 방법은 양이온성 리포좀법, 초산 리튬-DMSO, 지질-매개 형질감염(transfection), 인산칼슘 침전법(precipitation), lipofection, PEI(Polyethyleneimine)-매개 형질감염, DEAE-dextran 매개 형질감염, 및/또는 나노파티클-매개 핵산 전달(Panyam et. , al Adv Drug Deliv Rev.　2012 Sep 13.pii: S0169-409X(12)00283-9. doi: 10.1016/j.addr.2012.09.023 참조)일 수 있으나, 이에 제한되는 것은 아니다. 이때, 상기 CRISPR/Cas9 시스템의 구성 요소는 상기 전달형태 중 어느 하나일 수 있다. 예를 들어, 상기 CRISPR/Cas9 시스템의 구성 요소는 각 구성요소를 암호화하는 mRNA 형태일 수 있으나, 이에 제한되는 것은 아니다.

CRISPR/Cas9 시스템 각 구성요소 전달 순서

상기 유전자 편집 방법은 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas9 단백질 또는 이를 암호화하는 핵산을 세포 내 전달하는 것을 포함하는데, 이때 상기 구성이 세포 내에 동시에 전달되거나 또는 시간차를 두고 순차적으로 전달될 수 있다. 이때, 어떤 구성이 먼저 전달될 지는 유전자 편집 목적을 달성할 수 있는 한, 달리 제한되지 않는다.

유전자 편집 결과 1 - 인델(indel)

본 명세서에서 제공하는 유전자 편집 방법의 수행 결과로, 표적 유전자 또는 표적 핵산에 인델이 발생할 수 있다. 이때, 상기 인델은 표적 서열 부분 및/또는 프로토스페이서 서열 부분의 내부 및/또는 외부에서 일어날 수 있다. 상기 인델은, 유전자 편집 전 핵산의 뉴클레오타이드 배열에서 일부 뉴클레오타이드가 중간에 결실되거나, 임의의 뉴클레오타이드가 삽입되거나, 및/또는 상기 삽입과 결실이 혼입된 변이를 일컫는다. 일반적으로, 표적 유전자 또는 표적 핵산 서열 내 인델이 일어나면, 해당 유전자 또는 핵산이 불활성화된다. 일 구현예로, 상기 유전자 편집 방법의 수행 결과, 표적 유전자 또는 표적 핵산 내 하나 이상의 뉴클레오타이드가 결실 및/또는 추가될 수 있다.

유전자 편집 결과 2 - 베이스 에디팅(base editing)

본 명세서에서 제공하는 유전자 편집 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 내 베이스 에디팅이 일어날 수 있다. 이는 표적 유전자 또는 표적 핵산 내 임의의 뉴클레오타이드가 결실, 또는 추가되는 인델과는 달리, 핵산 내 하나 이상의 특정 뉴클레오타이드를 의도한 대로 변경하는 것을 의미한다. 달리 표현하면, 표적 유전자 또는 표적 핵산 내 특정 위치에서, 미리 의도한 점 돌연변이(point mutation)를 일으키는 것이다. 일 구현예로, 상기 유전자 편집 방법의 수행 결과, 표적 유전자 또는 표적 핵산 내 하나 이상의 뉴클레오타이드가 다른 뉴클레오타이드로 치환될 수 있다.

유전자 편집 결과 3 - 삽입(insertion)

본 명세서에서 제공하는 유전자 편집 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 내 넉인이 발생할 수 있다. 상기 넉인은 표적 유전자 또는 표적 핵산 서열 내에 추가적인 핵산 서열을 삽입하는 것을 의미한다. 상기 넉인이 일어나려면, CRISPR/Cas9 복합체 외에 상기 추가적인 핵산 서열을 포함하는 도너가 더 필요하다. 세포 내에서 CRISPR/Cas9 복합체가 표적 유전자 또는 표적 핵산을 절단하는 경우, 상기 절단된 표적 유전자 또는 표적 핵산의 수복이 일어나게 된다. 이때, 상기 도너가 상기 수복 과정에 관여하여 상기 추가적인 핵산 서열이 표적 유전자 또는 표적 핵산 내에 삽입될 수 있도록 한다. 일 구현예로, 상기 유전자 편집 방법은 대상 세포 내로 도너를 도입하는 것을 추가적으로 포함할 수 있다. 예를 들어, 상기 도너는 세포 내 게놈에 삽입하기 위한 외래 DNA 서열(exogeneous DNA sequence)을 포함하며, 상기 도너에 의해 상기 표적 유전자 또는 상기 표적 핵산 내 상기 외래 DNA 서열 의 삽입이 유도된다. 이때, 상기 도너를 대상 세포 내로 전달할 때, 전술한 전달 형태 및/또는 전달 방법이 사용될 수 있다.

유전자 편집 결과 4 - 제거(deletion)

본 명세서에서 제공하는 유전자 편집 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 서열의 전부 또는 일부를 제거할 수 있다. 상기 제거는 상기 표적 유전자 또는 상기 표적 핵산 내 일부 염기 서열(뉴클레오타이드 서열)을 일정 길이 이상 제거하는 것을 의미한다. 상기 제거는 전술한 인델 효과와 비교하여, 유전자의 특정 영역, 예를 들어, 제1 엑손 영역을 전체적으로 제거(removal)할 수 있는 효과를 의미한다.

일 구현예로, 상기 유전자 편집 방법은 Cas12f1 단백질 또는 이를 암호화하는 핵산, 제1 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산, 및 제2 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산을 표적 유전자 또는 표적 핵산을 포함하는 세포내에 도입하는 것을 포함한다. 이로 인해, 상기 유전자 편집 결과 표적 유전자 또는 표적 핵산 내에 특정 서열 부분의 제거가 일어난다.

유전자 편집 방법 특징 1 - 높은 가이드 RNA 발현량

본 명세서에서 개시하는 유전자 편집 방법은 엔지니어링 된 CRISPR/Cas9 시스템을 사용한다. 여기서, 상기 엔지니어링 된 CRISPR/Cas9 시스템에 포함된 가이드 RNA는 서열 내 4개 이상의 유리딘이 연속되는 부분이 존재하지 않는다. 따라서, 상기 유전자 편집 방법에 따라 엔지니어링 된 CRISPR/Cas9 시스템을 벡터화하여 편집 대상에 전달하였을 때, 세포 내에서 RNA 중합효소가 4개의 연속된 티미딘(T) 부분을 인식하여 transcriptional pausing이나 immature termination 될 확률이 매우 낮거나 없다. 결과적으로, 상기 유전자 편집 방법에 의하면, 편집 대상인 세포 내에서 상기 엔지니어링 된 CRIPSR/Cas9 시스템에 포함된 가이드 RNA의 발현량이 증가한다는 점이 특징이다.

유전자 편집 방법 특징 2 - 높은 CRISPR/Cas9 시스템 활성

전술한 바, 본 명세서에서 개시하는 엔지니어링 된 CRISPR/Cas9 시스템은 상기 엔지니어링 된 스캐폴드로 인해 유전자 절단 활성 그 자체가 증대되었다는 특징이 있다. 따라서, 상기 엔지니어링 된 CRISPR/Cas9 시스템을 유전자 편집 방법에 사용하였을 때, 그 사용 형태 (리보뉴클레오프로틴, 벡터, 및/또는 조성물)를 막론하고 야생형의 CRISPR/Cas9 시스템을 사용할 때보다 높은 유전자 편집 활성을 나타낸다.

발명의 가능한 실시예

이하 본 명세서에서 제공하는 발명의 가능한 실시예들을 나열한다. 본 단락에서 제공하는 이하의 실시예들은 단지 발명의 일 예시에 해당될 뿐이다. 따라서, 본 명세서에서 제공하는 발명을 하기 실시예로 제한하여 해석할 수 없다. 실시예 번호와 함께 기재된 간략한 설명 또한, 각 실시예 간 구분의 편의를 위한 것일 뿐 본 명세서에서 개시하는 발명에 대한 제한으로 해석될 수 없다.

엔지니어링 된 스캐폴드

실시예 1, 엔지니어링 된 스캐폴드

GUUUUAGUCCCUGAAGGGACUAAAAUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGC(서열번호 1)의 핵산서열을 가지는 RNA에서, 연속하는 4개의 유리딘을 가지지 않도록 변형된 엔지니어링 된 가이드 RNA 스캐폴드.

실시예 2, 엔지니어링 된 스캐폴드 영역

실시예 1에 있어서, 다음 서열로 표현되는 엔지니어링 된 가이드 RNA 스캐폴드:

5'-[제1 영역]-[제2 영역]-[제3 영역]-[제4 영역]-3'

여기서, 제1 영역은 5'-GUUUC-3', 5'-GUUCU-3', 5'-GUCUU-3', 5'-GCUUU-3' 중 선택된 것이고,

제2 영역은 AGUCCCUGAAGGGACU(서열번호 6), 또는 서열번호 6의 서열과 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상 일치하거나, 상동성있거나, 상응하는 서열이고,

제3 영역은 5'-GAAA-3', 5'-AGAA-3', 5'-AAGA-3', 5'-AAAG-3' 중 선택된 것이고,

제4 영역은 UAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGC(서열번호 7), 또는 서열번호 7의 서열과 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상 일치하거나, 상동성있거나, 상응하는 서열임.

실시예 3, 서열한정

실시예 1 내지 실시예 2 중 어느 하나에 있어서, 상기 엔지니어링 된 가이드 RNA 스캐폴드는 GUUUCAGUCCCUGAAGGGACUGGAAAUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGC(서열번호 2), GUUCUAGUCCCUGAAGGGACUGAGAAUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGC(서열번호 3), GUCUUAGUCCCUGAAGGGACUGAAGAUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGC(서열번호 4), 및 GCUUUAGUCCCUGAAGGGACUAAAGUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGC(서열번호 5)의 핵산 서열로 이뤄진 군에서 서열을 가지는 엔지니어링 된 가이드 RNA 스캐폴드.

실시예 4, CjCas9 한정

실시예 1 내지 실시예 3 중 어느 하나에 있어서, 상기 엔지니어링 된 가이드 RNA 스캐폴드는 캄필로박터 제주니 유래 Cas9 단백질과 상호작용하여 복합체를 형성할 수 있는 것인, 엔지니어링 된 가이드 RNA 스캐폴드.

엔지니어링 된 가이드 RNA

실시예 5, 엔지니어링 된 가이드 RNA

다음 서열로 표현되는 엔지니어링 된 가이드 RNA:

5'-[가이드 도메인]-[엔지니어링 된 가이드 RNA 스캐폴드]-3'

여기서, 상기 가이드 도메인은 미리 결정된 표적 서열을 가지는 표적 핵산을 표적할 수 있도록 인공적으로 설계된 것이고,

상기 엔지니어링 된 가이드 RNA 스캐폴드는 실시예 1 내지 실시예 4 중 선택된 어느 하나의 엔지니어링 된 가이드 RNA 스캐폴드임.

실시예 6, 가이드 도메인 길이

실시예 5에 있어서, 상기 가이드 도메인은 1nt, 2nt, 3nt, 4nt, 5nt, 6nt, 7nt, 8nt, 9nt, 10nt, 11nt, 12nt, 13nt, 14nt, 15nt, 16nt, 17nt, 18nt, 19nt, 20nt, 21nt, 22nt, 23nt, 24nt, 25nt, 26nt, 27nt, 28nt, 29nt, 또는 30nt 길이를 가지는, 엔지니어링 된 가이드 RNA.

실시예 7, 가이드 도메인 및 표적 서열의 관계

실시예 5 내지 실시예 6 중 어느 하나에 있어서, 상기 가이드 도메인은 상기 미리 결정된 표적 서열과 동등한(equivalent) 서열을 가지거나, 또는 상기 미리 결정된 표적 서열과 상보적인(complementary) 서열을 가지는 것을 특징으로 하는 프로그램 가능한 가이드 RNA.

실시예 8, 가이드 도메인 및 표적 서열의 관계

실시예 5 내지 실시예 7 중 어느 하나에 있어서,

상기 미리 결정된 표적 서열을 가지는 표적 핵산은 이중가닥 핵산이고,

상기 표적 핵산은 표적 가닥 (target strand) 및 비표적 가닥 (nontarget strand)을 포함하고,

상기 표적 가닥의 서열 및 상기 비표적 가닥의 서열은 서로 상보적인 서열이므로, 상기 표적 핵산의 표적 서열은 상기 표적 가닥의 서열 또는 상기 비표적 가닥의 서열만으로 특정될 수 있으며,

상기 가이드 도메인이 상기 미리 결정된 표적 서열의 표적 핵산을 표적한다는 서술은 다음 중 선택된 의미를 가짐:

상기 가이드 도메인이 상기 표적 핵산의 표적 가닥과 상보적으로 결합하거나 (complementarily binds), 및/또는 혼성화될 (hybridize) 수 있음;

상기 가이드 도메인의 서열은 상기 표적 핵산의 표적 가닥의 전부 또는 일부 서열과 상보적인 서열을 포함함;

상기 가이드 도메인의 서열은 상기 표적 핵산의 비표적 가닥의 전부 또는 일부 서열과 일치하거나 (identical), 매치되거나 (match), 상동이거나 (homolog), 및/또는 동등한 (equivalant) 서열을 포함함; 및

통상의 기술자가 인식할 수 있는 범위 내에서, 상기 서술의 적절한 조합.

실시예 9, 미스매치 포함

실시예 8에 있어서, 상기 가이드 도메인의 서열은 다음 중 선택된 어느 하나임:

상기 표적 핵산의 비표적 가닥에 포함된 상기 표적 서열의 전부 또는 일부 서열과 1개, 2개, 3개, 4개, 또는 5개의 뉴클레오티드 염기를 제외한 나머지 염기가 일치하거나 (identical), 매치되거나 (match), 상동이거나 (homolog), 및/또는 동등한 (equivalant) 서열; 및

상기 표적 핵산의 표적 가닥에 포함된 상기 표적 서열의 전부 또는 일부 서열과 1개, 2개, 3개, 4개, 또는 5개의 뉴클레오티드 염기를 제외한 나머지 염기가 상보적인 서열.

Cas9 단백질

실시예 10, CjCas9

캄필로박터 제주니(Campylobacter jejuni) 유래 Cas9 단백질.

실시예 11, CjCas9, 서열한정

실시예 10에 있어서, MARILAFDIGISSIGWAFSENDELKDCGVRIFTKVENPKTGESLALPRRLARSARKRLARRKARLNHLKHLIANEFKLNYEDYQSFDESLAKAYKGSLISPYELRFRALNELLSKQDFARVILHIAKRRGYDDIKNSDDKEKGAILKAIKQNEEKLANYQSVGEYLYKEYFQKFKENSKEFTNVRNKKESYERCIAQSFLKDELKLIFKKQREFGFSFSKKFEEEVLSVAFYKRALKDFSHLVGNCSFFTDEKRAPKNSPLAFMFVALTRIINLLNNLKNTEGILYTKDDLNALLNEVLKNGTLTYKQTKKLLGLSDDYEFKGEKGTYFIEFKKYKEFIKALGEHNLSQDDLNEIAKDITLIKDEIKLKKALAKYDLNQNQIDSLSKLEFKDHLNISFKALKLVTPLMLEGKKYDEACNELNLKVAINEDKKDFLPAFNETYYKDEVTNPVVLRAIKEYRKVLNALLKKYGKVHKINIELAREVGKNHSQRAKIEKEQNENYKAKKDAELECEKLGLKINSKNILKLRLFKEQKEFCAYSGEKIKISDLQDEKMLEIDHIYPYSRSFDDSYMNKVLVFTKQNQEKLNQTPFEAFGNDSAKWQKIEVLAKNLPTKKQKRILDKNYKDKEQKNFKDRNLNDTRYIARLVLNYTKDYLDFLPLSDDENTKLNDTQKGSKVHVEAKSGMLTSALRHTWGFSAKDRNNHLHHAIDAVIIAYANNSIVKAFSDFKKEQESNSAELYAKKISELDYKNKRKFFEPFSGFRQKVLDKIDEIFVSKPERKKPSGALHEETFRKEEEFYQSYGGKEGVLKALELGKIRKVNGKIVKNGDMFRVDIFKHKKTNKFYAVPIYTMDFALKVLPNKAVARSKKGEIKDWILMDENYEFCFSLYKDSLILIQTKDMQEPEFVYYNAFTSSTVSLIVSKHDNKFETLSKNQKILFKNANEKEVIAKSIGIQNLKVFEKYIVSALGEVTKAEFRQREDFKKSGPPKKKRKVYPYDVPDYA(서열번호 39) 의 아미노산 서열, 또는 서열번호 39의 아미노산 서열과 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상 동일하거나(identical), 상응하거나(corresponding), 동등한(equivalent) 서열로 표현되는 Cas9 단백질.

실시예 12, CjCas9 기능변이 - nickase

실시예 10 내지 실시예 11 중 어느 하나에 있어서, 상기 Cas9은 nickase 기능을 가지도록 변형된 것인, Cas9 단백질.

실시예 13, CjCas9 기능변이 - Dead

실시예 10 내지 실시예 12 중 어느 하나에 있어서, 상기 Cas9은 핵산 절단 활성을 가지지 않도록 변형된 것인, Cas9 단백질.

실시예 14, CjCas9 기능변이 - BE, PE, a/i

실시예 10 내지 실시예 13 중 어느 하나에 있어서, 상기 Cas9은 다음 중 선택된 도메인과 융합된 것인, Cas9 단백질:

베이스 에디터 도메인; 프라임 에디터 도메인; 유전자 전사/발현 억제 도메인; 및 유전자 전사/발현 증가 도메인.

실시예 15, NLS 추가 포함

실시예 10 내지 실시예 14 중 어느 하나에 있어서, 상기 Cas9 단백질은 N말단 및/또는 C말단에 하나 이상의 Nuclear Localization Signal을 포함하는 Cas9 단백질.

실시예 16, NLS 서열 한정

실시예 15에 있어서, 상기 하나 이상의 Nuclear Localization Signal은 각각 독립적으로 PKKKRKV(서열번호 23), KRPAATKKAGQAKKKK(서열번호 24), PAAKRVKLD(서열번호 25), RQRRNELKRSP(서열번호 26), NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(서열번호 27), RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(서열번호 28), VSRKRPRP(서열번호 29), PPKKARED(서열번호 30), PQPKKKPL(서열번호 31), SALIKKKKKMAP(서열번호 32), DRLRR(서열번호 33), PKQKKRK(서열번호 34), RKLKKKIKKL(서열번호 35), REKKKFLKRR(서열번호 36), KRKGDEVDGVDEVAKKKSKK(서열번호 37), 및 RKCLQAGMNLEARKTKK(서열번호 38) 중 선택된 아미노산 서열을 가짐.

엔지니어링 된 CRISPR/Cas9 복합체

실시예 17, CjCas9-gRNA complex

다음을 포함하는 엔지니어링 된 CRISPR/Cas9 복합체:

실시예 10 내지 실시예 16 중 선택된 어느 하나의 Cas9 단백질; 및

실시예 5 내지 실시예 9 중 선택된 어느 하나의 엔지니어링 된 가이드 RNA,

여기서, 상기 엔지니어링 된 가이드 RNA의 가이드 도메인은 미리 결정된 표적 서열의 핵산을 표적할 수 있도록 인공적으로 설계된 것이고,

상기 엔지니어링 된 가이드 RNA의 엔지니어링 된 스캐폴드는 상기 Cas9 단백질과 상호작용하여 복합체를 이룰 수 있는 것임.

엔지니어링 된 CRISPR/Cas9 구성요소 발현 벡터

실시예 18, CjCas9, gRNA expression vector

다음을 포함하는 엔지니어링 된 CRISPR/Cas9 구성요소 발현 벡터:

실시예 10 내지 실시예 16 중 선택된 어느 하나의 Cas9 단백질을 암호화하는 핵산; 및

실시예 5 내지 실시예 9 중 선택된 어느 하나의 엔지니어링 된 가이드 RNA를 암호화하는 핵산,

실시예 19, single vector

실시예 18에 있어서, 상기 벡터는 상기 Cas9 단백질을 암호화하는 핵산 및 상기 가이드 RNA를 암호화하는 핵산을 단일 벡터(single vector)에 포함하는 것을 특징으로 하는 발현 벡터.

실시예 20, multiple vectors

실시예 18에 있어서, 상기 벡터는 상기 Cas9 단백질을 암호화하는 핵산 및 상기 가이드 RNA를 암호화하는 핵산을 둘 이상의 벡터에 포함하는 것을 특징으로 하는 발현 벡터.

실시예 21, promoters

실시예 18 내지 실시예 20 중 어느 하나에 있어서, 상기 Cas9 단백질을 암호화하는 핵산 및 상기 엔지니어링 된 가이드 RNA를 암호화하는 핵산은 각각 독립적으로, 이를 발현시킬 수 있는 프로모터와 작동적으로 연결된 발현 벡터.

실시예 22, promoter 한정

실시예 21에 있어서, 상기 프로모터는 SV40 초기 프로모터, mouse mammary tumor virus long terminal repeat(LTR) 프로모터, adenovirus major late 프로모터 (Ad MLP), herpes simplex virus (HSV) 프로모터, CMV immediate early promoter region (CMVIE)와 같은 cytomegalovirus (CMV) 프로모터, rous sarcoma virus (RSV) 프로모터, human U6 small nuclear 프로모터 (U6) (Miyagishi et al., Nature Biotechnology 20, 497 - 500 (2002)), enhanced U6 프로모터 (e.g., Xia et al., Nucleic Acids Res. 2003 Sep 1;31(17)), human H1 프로모터 (H1), 및 7SK 중 각각 독립적으로 선택된 발현 벡터.

실시예 23, viral vector

실시예 18 내지 실시예 22 중 어느 하나에 있어서, 상기 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 하나 이상인 발현 벡터.

실시예 24, non-viral vector

실시예 18 내지 실시예 23 중 어느 하나에 있어서, 상기 비바이러스 벡터는 플라스미드, 파지, 네이키드 DNA, DNA 복합체, 및 mRNA로 구성된 군에서 선택되는 하나 이상인 발현 벡터.

실시예 25, guide RNA 암호화 핵산 특정

실시예 18 내지 실시예 24 중 어느 하나에 있어서, 상기 상기 엔지니어링 된 가이드 RNA를 암호화하는 핵산은 GTTTCAGTCCCTGAAGGGACTGGAAATAAAGAGTTTGCGGGACTCTGCGGGGTTACAATCCCCTAAAACCGC(서열번호 9), GTTCTAGTCCCTGAAGGGACTGAGAATAAAGAGTTTGCGGGACTCTGCGGGGTTACAATCCCCTAAAACCGC(서열번호 10), GTCTTAGTCCCTGAAGGGACTGAAGATAAAGAGTTTGCGGGACTCTGCGGGGTTACAATCCCCTAAAACCGC(서열번호 11), 및 GCTTTAGTCCCTGAAGGGACTAAAGTAAAGAGTTTGCGGGACTCTGCGGGGTTACAATCCCCTAAAACCGC(서열번호 12) 중 선택된 핵산 서열을 가지는 발현 벡터.

실시예 26, DNA 한정

실시예 18 내지 실시예 25 중 어느 하나에 있어서, 상기 Cas9 단백질을 암호화하는 핵산 및 상기 가이드 RNA를 암호화하는 핵산은 DNA인 것을 특징으로 하는 발현 벡터.

엔지니어링 된 CRISPR/Cas9 조성물

실시예 27, CRISPR/Cas9 조성물

다음을 포함하는 엔지니어링 된 CRISPR/Cas9 조성물:

실시예 10 내지 실시예 16 중 선택된 어느 하나의 Cas9 단백질, 또는 상기 Cas9 단백질을 암호화하는 핵산; 및

실시예 5 내지 실시예 9 중 선택된 어느 하나의 엔지니어링 된 가이드 RNA, 또는 상기 가이드 RNA를 암호화하는 핵산,

실시예 28, RNP

실시예 27에 있어서, 상기 엔지니어링 된 CRISPR/Cas9 조성물은 상기 Cas9 단백질 및 상기 엔지니어링 된 가이드 RNA를 포함하고, 상기 Cas9 단백질은 상기 엔지니어링 된 가이드 RNA와 결합하여 리보뉴클레오프로틴(ribonucleoprotein)을 이루는 조성물.

실시예 29, Vector

실시예 27에 있어서, 상기 엔지니어링 된 CRISPR/Cas9 조성물은 상기 Cas9 단백질을 암호화하는 핵산 및 상기 엔지니어링 된 가이드 RNA를 암호화하는 핵산을 포함하는 조성물.

실시예 30, RNP/Vector 구체화

실시예 27에 있어서, 상기 조성물은 실시예 17의 CRISPR/Cas9 복합체, 또는 실시예 18 내지 실시예 26 중 어느 하나의 벡터를 포함하는 조성물.

유전자 편집 방법

실시예 31, 유전자 편집 방법

표적 핵산을 포함하는 세포에 대한 유전자 편집 방법으로, 다음을 포함함:

실시예 27 내지 실시예 30 중 어느 하나의 엔지니어링 된 CRISPR/Cas9 조성물을 상기 세포에 전달(deliver), 도입(introduce), 주입(injection), 또는 투여(administer) 하는 것,

여기서, 상기 조성물의 엔지니어링 된 가이드 RNA의 가이드 도메인은 상기 표적 핵산을 표적할 수 있는 것임.

실시예 32, 접촉을 통한 방법

표적핵산을 포함하는 세포에 대한 유전자 편집 방법으로, 다음을 포함함:

실시예 17의 엔지니어링 된 CRISPR/Cas9 복합체와 상기 표적핵산을 접촉시키거나, 접촉을 유도하는 것,

여기서, 상기 조성물의 엔지니어링 된 가이드 RNA의 가이드 도메인은 상기 표적핵산을 표적할 수 있는 것임.

실시예 33, 진핵/원핵 세포 한정

실시예 31 내지 실시예 32 중 어느 하나에 있어서, 상기 세포는 원핵세포, 또는 진핵세포임.

실시예 34, 세포 종류 한정

실시예 31 내지 실시예 33 중 어느 하나에 있어서, 상기 세포는 진핵세포이고, 상기 세포는 인간 세포, 비인간 동물 세포, 및 식물 세포 중 선택된 어느 하나임.

실시예 35, 단리된 세포

실시예 31 내지 실시예 34 중 어느 하나에 있어서, 상기 세포는 단리된 (isolated) 세포임.

실시예 36, 방법 수행 환경 한정

실시예 31 내지 실시예 35 중 어느 하나에 있어서, 상기 방법은 생체 내 (in vivo), 시험관 내 (in vitro) 및/또는 생체 외 (ex vivo)에서 수행됨.

이하, 실험예 및 실시예를 통해 본 명세서가 제공하는 발명에 대해 더욱 상세히 설명한다. 이들 실시예는 오로지 본 명세서에 의해 개시되는 내용을 예시하기 위한 것으로, 본 명세서에 의해 개시되는 내용의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지 않는 것은 당업계에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.

실험예 1. 실험 방법 및 재료

실험예 1.1. 플라스미드 제조

AAV2의 inverted tandem repeat (ITR) 사이에 CjCas9 단백질을 암호화하는 핵산 서열 및 야생형의 스캐폴드를 포함하는 CjCas9 가이드 RNA를 암호화하는 핵산을 모두 포함하는 플라스미드를 깁슨 어셈블리 (Gibson assembly, NEB/M5520AA) 방식으로 클로닝하여 제조하였다 (pAAV-EFS-CjCas9-U6-sgRNA 벡터). 이후, 상기 야생형의 CjCas9 가이드 RNA의 스캐폴드를 암호화하는 서열 (서열번호 8) 중 4개의 T가 연속된 부분을 하나씩 C로 치환하고, 이와 pair를 이루는 부분을 A>G로 변형시킨 엔지니어링 된 가이드 RNA에 대한 4종류의 벡터를 각각 추가적으로 제조하였다. 여기서, 각 엔지니어링 된 가이드 RNA는 도 1에 모식적으로 나타내었고, 각각의 서열은 다음 표 1에 정리하였다.

(엔지니어링 된) 가이드 RNA의 스캐폴드 서열을 암호화하는 서열

Label	1st sequence	2nd sequence	3rd sequence	4th sequence
Ori	GTTTT	AGTCCCTGAAGGGACT (SEQ ID NO: 13)	AAAA	TAAAGAGTTTGCGGGACTCTGCGGGGTTACAATCCCCTAAAACCGC (SEQ ID NO: 14)
Modi-1	GTTTC		GAAA
Modi-2	GTTCT		AGAA
Modi-3	GTCTT		AAGA
Modi-4	GCTTT		AAAG

이후, 위 실험예 2 및 실험예 3에 사용될 표적서열 CATGAGGAAATGAGAGAAATGCTTACACAC(서열번호 16)을 표적하는 가이드 도메인 서열을 합성하고, 이를 위 벡터 내 스캐폴드 서열의 5'말단쪽에 BSPQ1 Site를 이용하여 클로닝하여 최종적으로 세포에 형질감염 (transfection)시킬 벡터를 준비하였다. 여기서 상기 표적서열은 CjCas9 단백질이 인식하는 PAM 서열을 포함하는 것이다.

실험예 1.2. 세포 배양

인간 세포인 HEK293T 세포 (CRL-3216, ATCC), 또는 랫드 세포인 RT4-D6P2T 세포 (CRL-2768TM, ATCC)를 배양하여 사용하였다. 상기 세포를 10% fetal bovine serum (WelGene)과 1Хpenicillin/streptomycin (WelGene)을 첨가한 Dulbecco's Modified Eagle Medium (DMEM) (WelGene)을 사용, 2-3일 간격으로 계대배양 (subculture)하고, 이를 유지하였다.

실험예 1.3. CRISPR/Cas9 형질감염 (transfection) 및 DNA/RNA 추출

HEK293T cell

24-well 접시에 웰 당 5.5 x 10⁴ 개의 세포를 시딩하고, 실험예 1.1에서 제조한 플라스미드를 각각 300 ng, Lipofectamin2000 (Thermofisher) 2ul를 사용하여 제조사 프로토콜에 따라 형질감염 (transfection) 시켰다. 형질감염 3일 후, 셀 펠릿을 수득하여 Quick DNA/RNA Miniprep Kit (ZYMO RESEARCH)로 DNA, RNA를 추출하였다.

RT4-D6P2T cell

24-well 접시에 웰 당 2 x 10⁵ 개의 세포를 실험예 1.1에서 제조한 플라스미드로 각각 240 ng(Low dose), 800ng(High dose), Neon electrophoration (Thermofisher)를 사용하여 제조사 프로토콜에 따라 1400/20/2의 조건으로 형질감염 (transfection) 시켰다. 형질감염 3일 후, 셀 펠릿을 수득하여 Quick DNA/RNA Miniprep Kit (ZYMO RESEARCH)로 DNA, RNA를 추출하였다.

실험예 1.4. Real time PCR (qRT-PCR)

실험예 1.3에 의해 추출된 RNA는 1000 ng을 맞추어 cDNA Reverse-transcription kit (ThermoFisher)을 사용하여 cDNA를 제조하였다. 제조업체의 프로토콜(Thermo Fisher)에 따라, 수득된 cDNA 10 ng - 15 ng에 SYBR Green Master Mix를 사용하여, QuantStudio 3에서 qRT-PCR을 수행하였다. 상기 qRT-PCR 결과 얻어진 CT 값 정보를 사용하여, 각 엔지니어링 된 가이드 RNA의 발현을 야생형 스캐폴드를 포함하는 가이드 RNA의 발현량과 상대적으로 비교하였다.

qRT-PCR에 사용된 프라이머 정보는 표 2에 나타내었다.

(엔지니어링 된) 가이드 RNA qRT-PCR 분석에 사용한 프라이머 정보

Primer name	Sequence (5'-3')	SEQ ID NO
HIF1_sgRNA_qRT_F	CATGAGGAAATGAGAGAAATG	17
sgRNA-primer-R	GCGGTTTTAGGGGATTGTAAC	18

실험예 1.5. 인델 분석 (Targeted deep-sequencing)

실험예 1.3에 의해 추출된 genomic DNA를 분석, 인델 발생 비율을 측정하여 각각의 벡터에 의한 유전자 편집 효율을 평가하였다. 구체적인 과정은 다음과 같다:

1) 추출된 genomic DNA 및 프라이머 (표 3 참조)를 사용하여 On-target 위치의 서열을 증폭시켰다.

2) Illumine TrueSeq adaptor (Illumina)를 사용하여 추가 PCR을 진행하여, 각 샘플에 대한 Barcode를 제작하였다.

3) PCR purification kit (Intronbio)을 사용하여 각 샘플들을 정제하였다.

4) 정제된 샘플을 등몰비 (Equimolar ratio)로 풀링하고, Miseq, TrueSeq HT dual index system (Illumina)을 사용하여 paired sequencing을 진행, 시퀀싱 리드 (sequencing read)를 생산하였다.

5) 4)에서 생산된 시퀀싱 리드를 CRISPR/RGEN Tools (www.rgenome.net)의 Cas9-Analyzer를 통해 분석하여 on-target 유전체 위치에서의 인델 발생률을 정량적으로 계산하였다.

여기서, 위 1) 과정에서 사용한 프라이머는 하기 표 3에 나타내었다:

인델 분석 과정에 사용한 프라이머 정보

Cell line	Primer name	Sequence (5'-3')	SEQ ID NO
HEK293	hHIF1a_F	acactctttccctacacgacgctcttccgatctACATGGGATTAACTCAGG	19
HEK293	hHIF1a_R	gtgactggagttcagacgtgtgctcttccgatctTTTGCCTTGGGTAAGTAC	20
RT4-D6P2T	rHIF1a_F	acactctttccctacacgacgctcttccgatctCCACATATGAAGAGCACTTATGGG	21
RT4-D6P2T	rHIF1a_R	gtgactggagttcagacgtgtgctcttccgatctGTAGTAACAATATCTGACTGAAA	22

실험예 1.6. 통계분석

각 실험은 3-4회 반복하여 평균값을 사용하였으며, Student t-test를 사용하여 각 그룹 별 차이의 통계적 유의성을 분석하였다. 각 도면에서 *는 p-value <0.05, **는 p-value <0.01, ***는 p-value <0.001을 의미한다.

실험예 2. 엔지니어링 된 가이드 RNA의 사용에 따른 가이드 RNA 발현 개선 효과 및 표적 핵산 편집 효율 개선 효과 1

실험예 1.1에 따라 제조한 각 실시예의 플라스미드를, 실험예 1.2에 따라 배양한 HEK293T 세포에 실험예 1.3에 따라 형질감염 시킨 후, 실험예 1.4 내지 실험예 1.6에 따라 가이드 RNA 발현 개선 효과 및 표적 핵산 편집 효율을 측정하였다.

사용한 각각의 실시예 정보는 표 4에 나타내었다:

실험예 2에 사용한 각 CRISPR/Cas9 시스템의 구성

Label	Cas9 protein	Guide domain of guide RNA	SEQ ID NO	Scaffold of guide RNA	SEQ ID NO
Ori	CjCas9 (SEQ ID NO: 39)	CATGAGGAAATGAGAGAAATGC	15	GTTTTAGTCCCTGAAGGGACTAAAATAAAGAGTTTGCGGGACTCTGCGGGGTTACAATCCCCTAAAACCGC	8
Modi-1				GTTTCAGTCCCTGAAGGGACTGGAAATAAAGAGTTTGCGGGACTCTGCGGGGTTACAATCCCCTAAAACCGC	9
Modi-2				GTTCTAGTCCCTGAAGGGACTGAGAATAAAGAGTTTGCGGGACTCTGCGGGGTTACAATCCCCTAAAACCGC	10
Modi-3				GTCTTAGTCCCTGAAGGGACTGAAGATAAAGAGTTTGCGGGACTCTGCGGGGTTACAATCCCCTAAAACCGC	11
Modi-4				GCTTTAGTCCCTGAAGGGACTAAAGTAAAGAGTTTGCGGGACTCTGCGGGGTTACAATCCCCTAAAACCGC	12

실험 결과는 도 2 및 도 3에 나타내었다. 실험 결과, 야생형의 스캐폴드를 포함하는 가이드 RNA인 Ori에 비해, Modi-1, Modi-2, Modi-3에서 통계적으로 유의미한 가이드 RNA 발현량 증가가 나타났다. 나아가, Modi-2 및 Modi-3은 Ori에 비해 통계적으로 유의미한 인델 발생 효율 증가가 나타났다. 결론적으로, 야생형의 스캐폴드를 암호화하는 핵산의 서열 중, poly-T 및 poly-A 서열을 변경한 엔지니어링 된 가이드 RNA를 사용하면, 1) 세포 내 가이드 RNA 발현량이 증가하고, 및 2) 세포의 내인성 유전자에 대한 편집 효율이 증가되는 것을 확인할 수 있었다.

실험예 3. 엔지니어링 된 가이드 RNA의 사용에 따른 가이드 RNA 발현 개선 효과 및 표적 핵산 편집 효율 개선 효과 2

실험예 1.1에 따라 제조한 각 실시예의 플라스미드를, 실험예 1.2에 따라 배양한 RT4-D6P2T 세포에 실험예 1.3에 따라 형질감염 시킨 후, 실험예 1.4 내지 실험예 1.6에 따라 가이드 RNA 발현 개선 효과 및 표적 핵산 편집 효율을 측정하였다.

사용한 각각의 실시예 정보는 표 5에 나타내었다:

실험예 3에 사용한 각 CRISPR/Cas9 시스템의 구성 및 형질감염 조건

Label	Transfection Condition	Cas9 protein	Guide domain of guide RNA	Scaffold of guide RNA
Ori-Low	Low dose	CjCas9 (SEQ ID NO: 39)	CATGAGGAAATGAGAGAAATGC (SEQ ID NO: 15)	GTTTTAGTCCCTGAAGGGACTAAAATAAAGAGTTTGCGGGACTCTGCGGGGTTACAATCCCCTAAAACCGC (SEQ ID NO: 8)
Ori-High	High dose
Modi-3-Low	Low dose			GTCTTAGTCCCTGAAGGGACTGAAGATAAAGAGTTTGCGGGACTCTGCGGGGTTACAATCCCCTAAAACCGC (SEQ ID NO: 11)
Modi-3-High	High dose

실험 결과는 도 4 및 도 5에 나타내었다. 실험 결과, Modi-3에 대해, Low dose, 및 High dose 형질감염 조건에서 모두 Ori와 비교하여 1) 통계적으로 유의한 가이드 RNA 발현량 증가, 및 2) 통계적으로 유의미한 인델 발생 효율 증가가 나타났다.

본 명세서에서 제공하는, 4개 이상의 유리딘을 포함하지 않도록 변형된 캄필로박터 제주니 유래 Cas9 단백질에 대한 엔지니어링 된 가이드 RNA 및 이를 포함하는 CRISPR/CjCas9 시스템은 유전자 편집 용도로 사용할 수 있다.

Claims

캄필로박터 제주니 (Campylobacter jejuni) 유래 Cas9 단백질과 복합체를 이룰 수 있는 엔지니어링 된 가이드 RNA,

상기 엔지니어링 된 가이드 RNA는 다음 서열로 표현됨:

5'-[가이드 서열]-[제1 서열]-[제2 서열]-[제3 서열]-[제4 서열]-3'

여기서, 상기 가이드 서열은 미리 결정된 표적 서열을 표적할 수 있고,

상기 제2 서열은 AGUCCCUGAAGGGACU(서열번호 6), 또는 상기 서열번호 6과 80% 이상 일치하는 서열이고,

상기 제4 서열은 UAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGC(서열번호 7), 또는 상기 서열번호 7과 80% 이상 일치하는 서열이며,

상기 제1 서열 및 상기 제3 서열은 다음 조합 중 선택됨:

제1 서열은 5'-GUUUC-3'이고, 제3 서열은 5'-GAAA-3';

제1 서열은 5'-GUUCU-3'이고, 제3 서열은 5'-AGAA-3';

제1 서열은 5'-GUCUU-3'이고, 제3 서열은 5'-AAGA-3'; 및

제1 서열은 5'-GCUUU-3'이고, 제3 서열은 5'-AAAG-3'.
제1항에 있어서, 상기 엔지니어링 된 스캐폴드의 서열은 GUUUCAGUCCCUGAAGGGACUGGAAAUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGC(서열번호 2), GUUCUAGUCCCUGAAGGGACUGAGAAUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGC(서열번호 3), GUCUUAGUCCCUGAAGGGACUGAAGAUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGC(서열번호 4), 및 GCUUUAGUCCCUGAAGGGACUAAAGUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGC(서열번호 5) 중 선택된 것인 엔지니어링 된 가이드 RNA.
제2항에 있어서, 상기 엔지니어링 된 스캐폴드의 서열은 GUCUUAGUCCCUGAAGGGACUGAAGAUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGC(서열번호 4)인 엔니지어링 된 가이드 RNA.
다음을 포함하는 엔지니어링 된 CRISPR/Cas9 복합체:

제1항 내지 제3항 중 선택된 어느 하나의 엔지니어링 된 가이드 RNA; 및

캄필로박터 제주니 유래 Cas9 단백질,

여기서, 상기 CRISPR/Cas9 복합체는 상기 엔지니어링 된 가이드 RNA의 미리 결정된 표적 서열을 표적할 수 있음.
제1항 내지 제3항 중 선택된 어느 하나의 엔지니어링 된 가이드 RNA를 암호화하는 DNA.
CRISPR/Cas9 시스템의 각 구성요소를 발현할 수 있는 벡터로, 다음을 포함함:

캄필로박터 제주니 유래 Cas9 단백질을 암호화하는 핵산; 및

제1항 내지 제3항 중 선택된 어느 하나의 엔지니어링 된 가이드 RNA를 암호화하는 핵산.
제6항에 있어서, 상기 벡터는 바이러스 벡터, 또는 비-바이러스 벡터인 것을 특징으로 하는 벡터.
제7항에 있어서, 상기 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 하나 이상의 바이러스 벡터인 것을 특징으로 하는 벡터.
제6항 내지 제8항 중 선택된 어느 하나에 있어서, 상기 벡터는 단일 벡터(single vector)에 포함된 것을 특징으로 하는 벡터.
제6항 내지 제8항 중 선택된 어느 하나에 있어서, 상기 벡터는 둘 이상의 벡터에 포함된 것을 특징으로 하는 벡터.
엔지니어링 된 CRISPR/Cas9 조성물로, 다음을 포함함:

캄필로박터 제주니 유래 Cas9 단백질, 또는 상기 Cas9 단백질을 암호화하는 핵산; 및

제1항 내지 제3항 중 선택된 어느 하나의 엔지니어링 된 가이드 RNA, 또는 상기 가이드 RNA를 암호화하는 핵산.
제11항에 있어서, 상기 조성물은 상기 Cas9 단백질 및 상기 엔지니어링 된 가이드 RNA를 포함하고, 상기 Cas9 단백질은 상기 엔지니어링 된 가이드 RNA와 결합하여 Cas9-gRNA 복합체를 형성하고 있는 조성물.
제11항에 있어서, 상기 조성물은 상기 Cas9 단백질을 암호화하는 핵산 및 상기 엔지니어링 된 가이드 RNA를 암호화하는 핵산을 포함하는 조성물.
제13항에 있어서, 상기 조성물은 제6항 내지 제10항 중 선택된 어느 하나의 벡터를 포함하는 것을 특징으로 하는 조성물.
다음을 포함하는, 세포 내 유전자의 표적 서열을 가지는 표적 핵산을 편집하는 방법:

제11항 내지 제14항 중 선택된 어느 하나의 조성물을 상기 세포에 도입하는 것,

여기서, 상기 조성물의 엔지니어링 된 가이드 RNA의 가이드 도메인은 상기 표적 핵산을 표적할 수 있음.