KR101939420B1

KR101939420B1 - 돌연변이체 세공

Info

Publication number: KR101939420B1
Application number: KR1020137023664A
Authority: KR
Inventors: 제임스 클라크; 앤드류 존 헤론; 라크말 자야싱헤; 제인 월러스; 제임스 화이트
Original assignee: 옥스포드 나노포어 테크놀로지즈 리미티드
Priority date: 2011-02-11
Filing date: 2012-02-10
Publication date: 2019-01-16
Also published as: JP2017148052A; AU2012215135B9; AU2012215135B2; CA2826374A1; CA2826374C; US20140186823A1; CN103460040A; CN103460040B; EP2673638B1; WO2012107778A2; BR112013020411B1; JP2014506575A; JP6169976B2; US9751915B2; KR20140049511A; WO2012107778A3; EP2673638A2; BR112013020411A2

Abstract

본 발명은 Msp의 돌연변이체 형태에 관한 것이다. 본 발명은 또한 Msp를 사용한 핵산의 특징 규명에 관한 것이다.

Description

돌연변이체 세공 {MUTANT PORES}

나노세공 감지란 피분석물 분자와 수용체 사이의 개별적인 결합 이벤트에 대한 관찰 결과에 의존하는 감지 접근법이다. 나노세공 센서는 절연막에 나노미터 크기의 단일 세공을 설치하고, 피분석물 분자의 존재하에 세공을 통한 전압-구동식 이온 수송을 측정함으로써 형성될 수 있다. 피분석물의 정체는 그의 독특한 전류 신호, 특히, 전류 블록의 지속 기간 및 정도, 및 전류 수준의 변동을 통해 밝혀진다.

현재 넓은 범위에 걸쳐 적용되는 신속하고 저렴한 핵산 (예컨대 DNA 또는 RNA) 서열분석 기술이 요구되고 있다. 현 기술은 대개 다량의 핵산을 제조하고, 신호 검출을 위한 고품질의 전문 형광성 화학 물질이 필요하기 때문에 속도가 느리고, 비용이 많이 든다. 나노세공 감지는 필요한 뉴클레오티드와 시약의 정량을 감소시킴으로써 신속하고 저렴한 핵산 서열분석을 제공할 수 있는 잠재능을 가진다.

나노세공 감지를 사용하여 핵산을 서열분석하는 데 필수적인 구성 요소 중 2가지는 (1) 세공을 통과하는 핵산 이동 조절, 및 (2) 핵산 중합체가 세공을 통해 이동함에 따른 뉴클레오티드의 판별이다. 과거에는 뉴클레오티드를 판별하기 위해 핵산을 헤몰리신의 돌변변이체를 통해 통과시켰다. 이는 서열 의존성인 것으로 보인 전류 신호를 제공하였다. 또한 다수의 뉴클레오티드가 관찰되는 전류 결과에 기여하며, 이를 통해 관찰되는 전류 결과와 핵산 서열 도전 과제 사이의 직접적인 관계가 형성되는 것으로 나타났다.

뉴클레오티드 판별을 위한 전류 범위는 헤몰리신 세공의 돌연변이를 통해 개선되기는 하였지만, 뉴클레오티드 사이의 전류차가 추가로 개선될 수만 있다면, 서열분석 시스템의 성능은 더욱 높아지게 될 것이다. 추가로, 핵산이 세공을 통해 이동할 때, 일부 전류 상태는 높은 변동을 보인 것으로 관찰되었다. 또한, 일부 돌연변이체 헤몰리신 세공은 다른 것보다도 더 높은 변동을 보인다. 이러한 상태의 변동은 서열 특이 정보를 포함할 수 있지만, 시스템을 단순화시키기 위해서는 변동이 낮은 세공이 바람직할 수 있다. 또한, 관찰되는 전류 결과에 기여하는 뉴클레오티드의 개수를 축소시키는 것이 바람직할 수 있다.

다른 형태의 Msp로는 미코박테리움 스메그마티스(Mycobacterium smegmatis)로부터의 세공이다. MspA는 미코박테리움 스메그마티스로부터 유래된 157 kDa의 팔량체 포린이다. MspA의 구조는 연구원들에 의해 문서로 잘 기록되어 있다 (문헌 [Gundlach, Proc Natl Acad Sci U S A. 2010 Sep 14; 107(37): 16060-5. Epub 2010 Aug 26]). 일부 중요한 잔기가 확인되었으며, 이는 세공의 특성을 증진시키기 위해 변형되었다. 이같은 돌연변이화는 DNA가 MspA 세공을 통해 천이될 수 있도록 하기 위해 수행될 수 있다. MspB, C 및 D 또한 Msp의 공지된 형태이다.

본 발명의 개요

본 발명자들은 놀랍게도 Msp의 신규한 돌연변이체가 예컨대 핵산의 서열과 같은 특징을 예측할 수 있는 개선된 특성을 보인다는 것을 입증하였다. 돌연변이체는 놀랍게도 개선된 뉴클레오티드 판별을 보인다. 특히, 돌연변이체는 놀랍게도 증가된 전류 범위 (이로써 상이한 뉴클레오티드들 간의 판별은 더욱 쉬워진다), 및 감소된 상태 변동 (이로써 신호 대 노이즈 비는 증가한다)을 보인다. 추가로, 핵산이 세공을 통해 이동함에 따른 전류에 기여하는 뉴클레오티드의 개수는 감소하게 된다. 이로써, 핵산이 세공을 통해 이동함에 따라 관찰되는 전류 결과와 핵산 서열 사이의 직접적인 관계를 더욱 쉽게 확인할 수 있다.

본 발명자들은 또한 놀랍게도 세공을 통한 핵산 이동이 Phi29 DNA 폴리머라제에 의해 조절될 때 Msp가 개선된 서열분석 특성을 보인다는 것도 밝혀냈다. 특히, Msp와 Phi29 DNA 폴리머라제의 커플링을 통해 3가지 예상치 못했던 이점을 얻게 되었다. 첫번째로, 상업적으로 실행 가능한 속도로의 세공을 통한 핵산 이동으로 또한 효과적인 서열분석이 가능해진다. 두번째로, 세공을 통해 핵산이 이동함에 따라 전류 범위가 증가하는 것이 관찰되며, 이로써 서열은 보다 쉽게 측정될 수 있다. 세번째로, 전류 변동은 감소하는 것이 관찰되며, 이로써 신호 대 노이즈 비는 증가하게 된다.

따라서, 본 발명은 서열 번호 2에 제시된 서열의 변이체를 포함하며, 여기서 변이체는 하기 돌연변이 중 하나 이상의 돌연변이를 포함하는 것인, 돌연변이체 Msp 단량체를 제공한다:

(a) 88번 위치의 아스파라긴 (N), 세린 (S), 글루타민 (Q) 또는 트레오닌 (T);

(b) 90번 위치의 세린 (S), 글루타민 (Q) 또는 티로신 (Y);

(c) 105번 위치의 류신 (L) 또는 세린 (S);

(d) 126번 위치의 아르기닌 (R);

(e) 75번 위치의 세린 (S);

(f) 77번 위치의 세린 (S);

(g) 59번 위치의 아르기닌 (R);

(h) 75번 위치의 글루타민 (Q), 아스파라긴 (N) 또는 트레오닌 (T);

(i) 77번 위치의 글루타민 (Q), 아스파라긴 (N) 또는 트레오닌 (T);

(j) 78번 위치의 류신 (L);

(k) 81번 위치의 아스파라긴 (N);

(l) 83번 위치의 아스파라긴 (N);

(m) 86번 위치의 세린 (S) 또는 트레오닌 (T);

(n) 87번 위치의 페닐알라닌 (F), 발린 (V) 또는 류신 (L);

(o) 88번 위치의 티로신 (Y), 페닐알라닌 (F), 발린 (V), 아르기닌 (R), 알라닌 (A), 글리신 (G) 또는 시스테인 (C);

(p) 89번 위치의 페닐알라닌 (F), 발린 (V) 또는 류신 (L);

(q) 90번 위치의 류신 (L), 페닐알라닌 (F), 트립토판 (W), 히스티딘 (H), 트레오닌 (T), 글리신 (G), 알라닌 (A), 발린 (V), 아르기닌 (R), 리신 (K), 아스파라긴 (N) 또는 시스테인 (C);

(r) 91번 위치의 세린 (S), 글루타민 (Q), 류신 (L), 메티오닌 (M), 이소류신 (I), 알라닌 (A), 발린 (V), 글리신 (G), 페닐알라닌 (F), 트립토판 (W), 티로신 (Y), 히스티딘 (H), 트레오닌 (T), 아르기닌 (R), 리신 (K), 아스파라긴 (N) 또는 시스테인 (C);

(s) 92번 위치의 알라닌 (A) 또는 세린 (S);

(t) 93번 위치의 세린 (S), 알라닌 (A), 트레오닌 (T), 글리신 (G);

(u) 94번 위치의 류신 (L);

(v) 95번 위치의 발린 (V);

(w) 96번 위치의 아르기닌 (R), 아스파르트산 (D), 발린 (V), 아스파라긴 (N), 세린 (S) 또는 트레오닌 (T);

(x) 97번 위치의 세린 (S);

(y) 98번 위치의 세린 (S);

(z) 99번 위치의 세린 (S);

(aa) 100번 위치의 세린 (S);

(bb) 101번 위치의 페닐알라닌 (F);

(cc) 102번 위치의 리신 (K), 세린 (S) 또는 트레오닌 (T);

(dd) 103번 위치의 알라닌 (A), 글루타민 (Q), 아스파라긴 (N), 글리신 (G) 또는 트레오닌 (T);

(ee) 104번 위치의 이소류신;

(ff) 105번 위치의 티로신 (Y), 알라닌 (A), 글루타민 (Q), 아스파라긴 (N), 트레오닌 (T), 페닐알라닌 (F), 트립토판 (W), 히스티딘 (H), 글리신 (G), 발린 (V), 아르기닌 (R), 리신 (K), 프롤린 (P), 또는 시스테인 (C);

(gg) 106번 위치의 페닐알라닌 (F), 이소류신 (I), 발린 (V) 또는 세린 (S);

(hh) 108번 위치의 프롤린 (P) 또는 세린 (S);

(ii) 118번 위치의 아스파라긴 (N);

(jj) 103번 위치의 세린 (S) 또는 시스테인 (C); 및

(kk) 10 내지 15번 위치, 51 내지 60번 위치, 136 내지 139번 위치 및 168 내지 172번 위치 중 하나 이상의 위치의 시스테인.

본 발명은 또한

- Msp로부터 유래된 2개 이상의 공유적으로 부착된 단량체를 포함하는 구축물;

- 본 발명의 돌연변이체 또는 본 발명의 구축물을 코딩하는 폴리뉴클레오티드;

- 본 발명의 동일한 돌연변이체 단량체를 포함하는, Msp로부터 유래된 동종올리고머 세공;

- 본 발명의 1개 이상의 돌연변이체 단량체를 포함하며, 여기서 8개의 단량체 중 1개 이상은 나머지 다른 단량체와 상이한 것인, Msp로부터 유래된 이종올리고머 세공;

- (a) 표적 서열을 본 발명의 세공 및 핵산 결합 단백질과 접촉시켜, 상기 단백질이 세공을 통과하는 표적 서열의 이동을 제어하도록 하고, 표적 서열 중 일부의 뉴클레오티드가 세공과 상호작용하도록 하는 단계; 및 (b) 각 상호작용 동안 세공을 통과하는 전류를 측정하여, 표적 서열의 특징을 규명하는 단계를 포함하는, 표적 핵산 서열의 특징을 규명하는 방법;

- (a) 본 발명의 세공 및 (b) 핵산 처리 효소를 포함하는, 표적 핵산 서열의 서열분석을 위한 키트;

- (a) 다수의 본 발명의 세공 및 (b) 다수의 핵산 처리 효소를 포함하는, 샘플 중의 표적 핵산 서열의 서열분석을 위한 장치;

- (a) 표적 서열을 Msp로부터 유래된 세공 및 Phi29 DNA 폴리머라제와 접촉시켜, 상기 폴리머라제가 세공을 통과하는 표적 서열의 이동을 제어하도록 하고, 표적 서열 중 일부의 뉴클레오티드가 세공과 상호작용하도록 하는 단계; 및 (b) 각 상호작용 동안 세공을 통과하는 전류를 측정하여, 표적 서열의 특징을 규명하는 단계를 포함하며, 여기서 단계 (a) 및 (b)는 세공을 가로질러 적용되는 전압을 사용하여 수행되는 것인, 표적 핵산 서열의 특징을 규명하는 방법;

- (a) 표적 핵산 서열의 존재하에서 Msp로부터 유래된 세공을 Phi29 DNA 폴리머라제와 접촉시키는 단계; 및 (b) 세공을 가로질러 전압을 적용하여 세공과 폴리머라제 사이에 복합체를 형성하고, 이로써 표적 핵산 서열의 특징 규명을 위한 센서를 형성하는 단계를 포함하는, 표적 핵산 서열의 특징 규명을 위한 센서를 형성하는 방법;

- (a) 핵산 서열의 존재하에서 Phi29 DNA 폴리머라제를 Msp로부터 유래된 세공과 접촉시키는 단계; 및 (b) 세공을 가로질러 전압을 적용하여 세공과 폴리머라제 사이에 복합체를 형성하고, 이로써 Phi29 DNA 폴리머라제의 활성 속도를 증가시키는 단계를 포함하는, Phi29 DNA 폴리머라제의 활성 속도를 증가시키는 방법;

- (a) Msp로부터 유래된 세공 및 (b) Phi29 DNA 폴리머라제를 포함하는, 표적 핵산 서열의 특징 규명을 위한 키트; 및

- 다수의 Msp로부터 유래된 세공 및 다수의 Phi29 DNA 폴리머라제를 포함하는, 샘플 중의 표적 핵산 서열의 특징 규명을 위한 장치

를 제공한다.

도 1은 단일 DNA 가닥이 나노세공을 전좌함에 따른 개별 전류 수준의 평균 체류 시간을 나타낸 것이다. 데이터를 다수의 단일 분자로부터 수집하고, 전류 수준에 의해 사분위수로 나누었다.
도 2는 MS-(NNNRRK)₈ 나노세공을 통해 DNA 가닥 (서열 번호 15)을 이동시키는 언지핑(unzipping) 모드의, Phi29 사용으로부터 얻은 전류 수준 및 변동을 보여주는 것이다.
도 3은 HL-(돌연변이체)₇ 나노세공을 통해 DNA 가닥 (서열 번호 15)을 이동시키는 언지핑 모드의, Phi29 사용으로부터 얻은 전류 수준 및 변동을 보여주는 것이다.
도 4는 (-200 mV 내지 200 mV인) 적용 전위 범위에서 기록된 단일의 MspA 채널에 대한 전류 수준을 보여주는 것이다.
도 5는 기준 MspA 돌연변이체인 MS-(B1)8에 대한 개방 세공 수준의 IV 곡선을 보여주는 것이다. 각각의 선은 단일 세공을 나타낸다.
도 6은 MspA 돌연변이체인 MS-(B1-I105Y)8에 대한 개방 세공 수준의 IV 곡선을 보여주는 것이다. 각각의 선은 단일 세공을 나타낸다.
도 7은 MspA 돌연변이체인 MS-(B1-I105N)8에 대한 개방 세공 수준의 IV 곡선을 보여주는 것이다. 각각의 선은 단일 세공을 나타낸다.
도 8은 180 mV에서 MS-(B1-I105A)8 세공에 대한 고 전도도 상태 (275 pA) 및 저 전도도 상태 (150 pA) 사이의 전류 변화를 보여주는 것이다.
도 9는 DNA가 언지핑될 때, 기준 MS-(B1)8 세공을 통과시 생성되는 전류 수준을 보여주는 것이다. 이 이벤트에 대한 전류 범위는 ~30 pA이다.
도 10은 DNA가 언지핑될 때, 기준 MS-(B1-I105A)8 세공을 통과시 생성되는 전류 수준을 보여주는 것이다. 이 이벤트에 대한 전류 범위는 ~40 pA이다.
도 11은 실시예 9 및 12 및 15에서 사용된 DNA 기질 디자인을 보여주는 것이다.
도 12는 실시예 10 및 11에서 사용된 DNA 기질 디자인을 보여주는 것이다.
도 13은 MspA 단량체 서열에서 점 돌연변이화가 이루어질 때, 같은 DNA 서열에 대하여 서열분석 프로파일이 어떻게 변화하는지를 보여주는 것이다. 이러한 플롯은 다중 폴리뉴클레오티드로부터 수득된 수준의 프로파일의 평균을 보여주는 것이다. A) 이 그래프는 MS-(B1)8 세공에 대한 서열분석 프로파일을 보여주는 것이다. B) 이 그래프는 MS-(B1-D90Q-D93S-I105A)8 세공에 대한 서열분석 프로파일을 보여주는 것이다. C) 이 그래프는 MS-(B1-D90Q-Q126R)8 세공에 대한 서열분석 프로파일을 보여주는 것이다. D) 이 그래프는 MS-(B1-L88N-D90Q-D91M)8 세공에 대한 서열분석 프로파일을 보여주는 것이다. E) 이 그래프는 MS-(B1-L88N-D90Q-D91S)8 세공에 대한 서열분석 프로파일을 보여주는 것이다. F) 이 그래프는 MS-(B1-G75S-G77S-L88N-Q126R)8 세공에 대한 서열분석 프로파일을 보여주는 것이다.
도 14는 실시예 13에서 사용된 DNA 기질 디자인을 보여주는 것이다.
도 15는 Phi29 DNA 폴리머라제에 의해 매개되는, MspA 돌연변이체 세공 MS-(B1)8을 통과하는 RNA의 조절형 전좌에 대한 예시적인 이벤트 자취를 보여주는 것이다. 상부 자취에서 강조 표시된 부분의 확대도는 하기는 제시되어 있다.
도 16은 지질 이중층 내로의 세공 삽입을 보여주는 것이다. A)는 단량체로부터 올리고머화된 MS-(B1)8의 세공 삽입을 보여주는 것이다. B)는 이량체로부터 올리고머화된 MS-(B1-B1)4의 세공 삽입을 보여주는 것이다.
도 17은 헬리카제에 의해 매개되는, 단량체의 올리고머화에 의해 제조된 MS-(B1)8 돌연변이체 세공을 통과하는 DNA의 조절형 전좌에 대한 예시적인 이벤트 자취를 보여주는 것이다. 상부 자취에서 강조 표시된 부분의 확대도는 하기는 제시되어 있다.
도 18은 헬리카제에 의해 매개되는, 이량체의 올리고머화에 의해 제조된 MS-(B1-B1)4 돌연변이체 세공을 통과하는 DNA의 조절형 전좌에 대한 예시적인 이벤트 자취를 보여주는 것이다. 상부 자취에서 강조 표시된 부분의 확대도는 하기는 제시되어 있다.
도 19는 실시예 16에서 사용된 DNA 기질 디자인을 보여주는 것이다.
도 20은 헬리카제에 의해 매개되는, MS-(B1-L88N)8 돌연변이체 세공을 통과하는 시토신 및 5-메틸시토신 둘 모두를 포함하는 DNA의 조절형 전좌에 대한 예시적인 이벤트 자취를 보여주는 것이다. 상부 자취에서 강조 표시된 부분의 확대도는 하기는 제시되어 있다.
서열 목록에 대한 설명
서열 번호 1은 NNN-RRK 돌연변이체 MspA 단량체를 코딩하는 폴리뉴클레오티드 서열을 보여준다.
서열 번호 2 (이는 "B1"로도 지칭된다)는 MspA 단량체의 성숙한 형태의 NNN-RRK 돌연변이체의 아미노산 서열을 보여준다. 돌연변이체에는 신호 서열 및 (출발 코돈으로 코딩되는) 아미노 말단 메티오닌이 결여되어 있고, 하기 돌연변이를 포함한다: D90N, D91N, D93N, D118R, D134R 및 E139K. 이들 돌연변이에 의해 MspA 세공을 통한 DNA 전이가 가능해진다.
서열 번호 3은 Phi29 DNA 폴리머라제를 코딩하는 폴리뉴클레오티드 서열을 보여준다.
서열 번호 4는 Phi29 DNA 폴리머라제의 아미노산 서열을 보여준다.
서열 번호 5는 E. 콜라이(E. coli)로부터의 sbcB 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오티드 서열을 보여준다. 이는 E. 콜라이로부터의 엑소뉴클레아제 I 효소 (EcoExo I)를 코딩한다.
서열 번호 6은 E. 콜라이로부터의 엑소뉴클레아제 I 효소 (EcoExo I)의 아미노산 서열을 보여준다.
서열 번호 7은 E. 콜라이로부터의 xthA 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오티드 서열을 보여준다. 이는 E. 콜라이로부터의 엑소뉴클레아제 III 효소를 코딩한다.
서열 번호 8은 E. 콜라이로부터의 엑소뉴클레아제 III 효소의 아미노산 서열을 보여준다. 이 효소는 이중 가닥 DNA (dsDNA)의 한 가닥으로부터 3'-5' 방향으로 5' 모노포스페이트 뉴클레오시드의 분배성 분해를 수행한다. 가닥 상에서 효소 개시를 위해서는 대략 4개 정도의 뉴클레오티드로 이루어진 5' 오버행이 필요하다.
서열 번호 9는 T. 써모필루스(T. thermophilus)로부터의 recJ 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오티드 서열을 보여준다. 이는 T. 써모필루스로부터의 RecJ 효소 (TthRecJ-cd)를 코딩한다.
서열 번호 10은 T. 써모필루스로부터의 RecJ 효소 (TthRecJ-cd)의 아미노산 서열을 보여준다. 이 효소는 ssDNA으로부터 5'-3' 방향으로 5' 모노포스페이트 뉴클레오시드의 진행성 분해를 수행한다. 가닥 상에서 효소 개시를 위해서는 4개 이상의 뉴클레오티드가 필요하다.
서열 번호 11은 박테리오파지 람다 exo (redX) 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오티드 서열을 보여준다. 이는 박테리오파지 람다 엑소뉴클레아제를 코딩한다.
서열 번호 12는 박테리오파지 람다 엑소뉴클레아제의 아미노산 서열을 보여준다. 서열은 삼량체로 조립되는 3개의 동일한 서브유닛 중 하나이다. 효소는 dsDNA으로부터 5'-3' 방향으로 뉴클레오티드의 고도로 진행성인 분해를 수행한다 (http://www.neb.com/nebecomm/products/productM0262.asp). 가닥 상에서 효소 개시를 위해서는 우선적으로 5' 포스페이트를 가진 대략 4개 정도의 뉴클레오티드로 이루어진 5' 오버행이 필요하다.
서열 번호 13 내지 15는 실시예 2에서 사용된 서열을 보여준다.
서열 번호 16 내지 18은 각각 성숙한 형태의 MspB, C 및 D 돌연변이체의 아미노산 서열을 보여준다. 성숙한 형태에는 신호 서열이 결여되어 있다.
서열 번호 19 및 20은 실시예 9, 12 및 15에서 사용된 서열을 보여준다.
서열 번호 21 내지 23은 실시예 10 및 11에서 사용된 서열을 보여준다.
서열 번호 24 내지 27은 실시예 13에서 사용된 서열을 보여준다.
서열 번호 28은 실시예 14에서 사용된 MspA 단량체의 성숙한 형태의 NNN-RRK 돌연변이체인 이량체의 DNA 서열을 보여준다.
서열 번호 29는 실시예 14에서 사용된 MspA 단량체의 성숙한 형태의 NNN-RRK 돌연변이체인 이량체의 단백질 서열을 보여준다.
서열 번호 30, 31 및 32는 실시예 16에서 사용된 서열을 보여준다.
서열 번호 33은 서열 번호 29에서 제시된 구축물에서 사용되는 제시되는 링커 서열을 보여준다.

개시된 생성물 및 방법의 상이한 적용은 당업계에서의 구체적인 요구에 맞게 맞춤화될 수 있다는 것을 이해하여야 한다. 본원에서 사용되는 용어는 단지 본 발명의 특정 실시양태를 기술하기 위한 목적의 것이며, 제한하고자 하는 것이 아니라는 것 또한 이해하여야 한다.

추가로, 본 명세서 및 첨부된 특허청구범위에서 사용되는 바와 같이, 단수 형태 "하나"("a", "an") 및 "그"라는 것은 달리 문맥상 명확하게 명시되지 않는 한, 다수의 지시 대상을 포함한다. 따라서, 예를 들어, "한 돌연변이체"라고 언급하는 것은 "돌연변이체들"을 포함하고, "한 치환"이라고 언급하는 것은 2개 이상의 상기 치환들을 포함하며, "한 세공"이라고 언급하는 것은 2개 이상의 상기 세공들을 포함하고, "한 핵산 서열"이라고 언급하는 것은 2개 이상의 상기 서열들을 포함하는 등의 예를 들 수 있다.

상기 또는 하기에서 본원에서 인용된 모든 공개 문헌, 특허 및 특허 출원은 그의 전문이 본원에서 참고로 포함된다.

돌연변이체 Msp 단량체

본 발명은 돌연변이체 Msp 단량체를 제공한다. 돌연변이체 Msp 단량체는 본 발명의 세공을 형성하는 데 사용될 수 있다. 돌연변이체 Msp 단량체는, 그의 서열이 야생형 Msp 단량체의 것으로부터 변이되고, 세공을 형성할 수 있는 능력을 보유하는 단량체이다. 세공을 형성할 수 있는 돌연변이체 단량체의 능력을 확인하는 방법은 당업계에 주지되어 있고, 하기에서 더 상세하게 논의된다.

돌연변이체 단량체는 개선된 뉴클레오티드 판독 특성을 가지며, 즉, 개선된 뉴클레오티드 포획 및 판별을 보인다. 특히, 돌연변이체 단량체로부터 구축된 세공은 야생형보다 더욱 쉽게 뉴클레오티드 및 핵산을 포획한다. 추가로, 돌연변이체 단량체로부터 구축된 세공은 증가된 전류 범위 (이로써 상이한 뉴클레오티드들 간의 판별은 더욱 쉬워진다), 및 감소된 상태 변동 (이로써 신호 대 노이즈 비는 증가한다)을 보인다. 추가로, 핵산이 돌연변이체로부터 구축된 세공을 통해 이동함에 따른 전류에 기여하는 뉴클레오티드의 개수를 감소하게 된다. 이로써, 핵산이 세공을 통해 이동함에 따라 관찰되는 전류 결과와 핵산 서열 사이의 직접적인 관계를 더욱 쉽게 확인할 수 있다. 돌연변이체의 개선된 뉴클레오티드 판독 특성은 5가지 주요 기전을 통해, 즉,

· 입체구조적 변화 (아미노산 잔기의 크기를 증가 또는 축소);

· 전하의 변화 (예컨대 핵산 서열과 상호작용하는 +ve 전하 도입);

· 수소 결합의 변화 (예컨대 염기쌍에 수소 결합할 수 있는 아미노산 도입);

· 파이 스태킹(pi stacking) 변화 (예컨대 비국소화된 전자 파이계를 통해 상호작용하는 아미노산 도입); 및/또는

· 세공의 구조 변경의 변화 (예컨대 전정부 및/또는 협착부의 크기를 증가시키는 아미노산 도입)에 의해 달성된다.

상기 5가지 기전 중 임의의 하나 이상의 것이 본 발명의 세공의 개선된 특성의 원인이 될 수 있다. 예를 들어, 본 발명의 세공은 변경된 입체구조, 변경된 수소 결합 및 변경된 구조의 결과로서 개선된 뉴클레오티드 판독 특성을 보일 수 있다.

벌키 잔기, 예컨대 페닐알라닌 (F), 트립토판 (W), 티로신 (Y) 또는 히스티딘 (H)의 도입으로 세공의 입체구조는 증가하게 된다. 또한, 방향족 잔기, 예컨대 페닐알라닌 (F), 트립토판 (W), 티로신 (Y) 또는 히스티딘 (H)의 도입으로 세공의 파이 스태킹은 증가하게 된다. 또한, 벌키 또는 방향족 잔기의 도입으로 예를 들어, 세공을 펼치고, 전정부 및/또는 협착부의 크기를 증가시킴으로써 세공 구조는 증가하게 된다. 이하는 하기에서 더욱 상세하게 기술된다.

본 발명의 돌연변이체 단량체는 서열 번호 2에 제시된 서열에 변이체를 포함한다. 서열 번호 2는 MspA 단량체의 NNN-RRK 돌연변이체이다. 이는 하기 돌연변이: D90N, D91N, D93N, D118R, D134R 및 E139K를 포함한다. 서열 번호 2의 변이체는 서열 번호 2의 것으로부터 변이되고, 세공을 형성할 수 있는 그의 능력을 보유하는 아미노산 서열을 가지는 폴리펩티드이다.

변이체는 하기 돌연변이 중 하나 이상의 돌연변이를 포함한다:

(b) 90번 위치의 세린 (S), 글루타민 (Q) 또는 티로신 (Y);

(c) 105번 위치의 류신 (L) 또는 세린 (S);

(d) 126번 위치의 아르기닌 (R);

(e) 75번 위치의 세린 (S);

(f) 77번 위치의 세린 (S);

(g) 59번 위치의 아르기닌 (R);

(j) 78번 위치의 류신 (L);

(k) 81번 위치의 아스파라긴 (N);

(l) 83번 위치의 아스파라긴 (N);

(m) 86번 위치의 세린 (S) 또는 트레오닌 (T);

(n) 87번 위치의 페닐알라닌 (F), 발린 (V) 또는 류신 (L);

(p) 89번 위치의 페닐알라닌 (F), 발린 (V) 또는 류신 (L);

(s) 92번 위치의 알라닌 (A) 또는 세린 (S);

(t) 93번 위치의 세린 (S), 알라닌 (A), 트레오닌 (T), 글리신 (G);

(u) 94번 위치의 류신 (L);

(v) 95번 위치의 발린 (V);

(x) 97번 위치의 세린 (S);

(y) 98번 위치의 세린 (S);

(z) 99번 위치의 세린 (S);

(aa) 100번 위치의 세린 (S);

(bb) 101번 위치의 페닐알라닌 (F);

(cc) 102번 위치의 리신 (K), 세린 (S) 또는 트레오닌 (T);

(ee) 104번 위치의 이소류신;

(hh) 108번 위치의 프롤린 (P) 또는 세린 (S);

(ii) 118번 위치의 아스파라긴 (N);

(jj) 103번 위치의 세린 (S) 또는 시스테인 (C); 및

야생형 MspA에서, 각 단량체의 잔기 88 및 105는 세공의 내부 협착부에서 소수성 고리를 형성한다. L88 및 I105 위치의 소수성 잔기는 세공의 주요 협착부 바로 위에 있으며, 수성 채널쪽으로 향해 있다. 이 잔기를 돌연변이화시키면, 기준 (서열 번호 2)에 비해 유의적으로 더 높은 개방 세공 전류를 가진 세공이 형성된다. 상기 위치에서 돌연변이화시켰을 때 관찰되는 전류차는 단일 돌연변이화시켰을 때에 기대되는 것보다도 유의적으로 더 높다. 이러한 놀라운 결과는 상기 위치에서의 돌연변이는 단지 상기 잔기에서의 국소 환경보다는 채널 구조에 영향을 미치질 수 있다는 것을 암시한다. 비록 서열 번호 2인 기준이 광범위한 세공 전도도를 보인다고 보고된 바 있기는 하지만, 상기에 대한 이유로 인해 잘 이해되고 있지 않다. L88 및 I105 위치에서 돌연변이화하면, 기준 세공보다 유의적으로 더 높은 지배적인 세공 전류 수준을 얻게 된다. 추가로, 이러한 더 높은 전도도 상태는 돌연변이체의 지배적인 입체구조이며, 큰 전류 범위 및 증가된 신호 대 노이즈에 대해서 바람직할 수 있다.

88번 위치의 N, S, Q 또는 T 도입 (즉, 상기 (a) 돌연변이)은 핵산에서 뉴클레오티드에 수소 결합할 수 있는 아미노산을 세공의 내부 협착부 내로 도입한다.

각 단량체의 잔기 90 및 91 또한 세공의 내부 협착부의 일부를 형성한다. 각 단량체의 잔기 118은 세공의 전정부 내부에 존재한다. 각 단량체의 잔기 134는 세공으로의 입구의 일부이다.

90번 위치의 S, Q 또는 Y 도입 (즉, 상기 (b) 돌연변이)은 핵산에서 뉴클레오티드에 수소 결합할 수 있는 아미노산을 세공의 내부 협착부 내로 도입한다.

변이체는 임의의 개수의 돌연변이 (a) 내지 (kk), 예컨대 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 돌연변이를 포함할 수 있다. 바람직한 돌연변이 조합은 하기에서 논의된다. 변이체 내로 도입되는 아미노산은 천연적으로 발생된 또는 비-천연적으로 발생된 그의 유도체일 수 있다. 변이체 내로 도입되는 아미노산은 D-아미노산일 수 있다.

임의의 개수의 시스테인이 변이체 내로 도입될 수 있다. 90, 91 및 103번 위치 중 하나 이상, 예컨대 2개의 위치에 또는 모든 위치에 시스테인이 도입되는 것이 바람직하다. 하기에서 더욱 상세하게 논의되는 바와 같이, 상기 위치는 분자 어댑터(adaptor)의 화학적 부착에 유용할 수 있다. 임의의 개수의 시스테인, 예컨대 2, 3, 4, 5, 6개 이상의 시스테인이 10 내지 15번 위치, 51 내지 60번 위치, 136 내지 139번 위치 및 168 내지 172번 위치에 도입될 수 있다. 상기 위치는 세공의 비-보존적 루프 영역에 존재하며, 따라서, 하기에서 더욱 상세하게 논의되는 바와 같이, 세공에의 핵산 결합 단백질의 화학적 부착에 유용하다.

바람직한 실시양태에서, 변이체는 하기 (A) 내지 (Z)에 제시되어 있는 치환 중 하나 이상의 치환을 포함한다. 변이체는 임의의 개수, 예컨대 1, 2, 3, 4 또는 5개의 A 내지 Z의 치환을 포함할 수 있다.

(A) (i) 75번 위치의 세린 (S), (ii) 77번 위치의 세린 (S), (iii) 88번 위치의 아스파라긴 (N), (iv) 90번 위치의 글루타민 (Q) 및 (v) 126번 위치의 아르기닌 (R) 중 하나 이상의 도입. 변이체는 이들 치환을 1, 2, 3, 4 또는 5개 포함할 수 있다. 각 단량체에 4개의 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 3에 제시되어 있다.

(B) (i) 90번 위치의 글루타민 (Q) 및 (ii) 126번 위치의 아르기닌 (R) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 3에 제시되어 있다.

(C) (i) 88번 위치의 아스파라긴 (N), (ii) 90번 위치의 글루타민 (Q) 및 (iii) 126번 위치의 아르기닌 (R) 중 하나 이상의 도입. 변이체는 이들 치환을 1, 2, 또는 3개 포함할 수 있다. 각 단량체에 3개의 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 3에 제시되어 있다.

(D) (i) 88번 위치의 세린 (S) 및 (ii) 90번 위치의 글루타민 (Q) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 3에 제시되어 있다.

(E) (i) 88번 위치의 아스파라긴 (N) 및 (ii) 90번 위치의 글루타민 (Q) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 3에 제시되어 있다.

(F) (i) 90번 위치의 글루타민 (Q) 및 (ii) 105번 위치의 알라닌 (A) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.

(G) (i) 90번 위치의 세린 (S) 및 (ii) 92번 위치의 세린 (S) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.

(H) (i) 88번 위치의 트레오닌 (T) 및 (ii) 90번 위치의 세린 (S) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.

(I) (i) 87번 위치의 글루타민 (Q) 및 (ii) 90번 위치의 세린 (S) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.

(J) (i) 89번 위치의 티로신 (Y) 및 (ii) 90번 위치의 세린 (S) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.

(K) (i) 88번 위치의 아스파라긴 (N) 및 (ii) 89번 위치의 페닐알라닌 (F) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.

(L) (i) 88번 위치의 아스파라긴 (N) 및 (ii) 89번 위치의 티로신 (Y) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.

(M) (i) 90번 위치의 세린 (S) 및 (ii) 92번 위치의 알라닌 (A) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.

(N) (i) 90번 위치의 세린 (S) 및 (ii) 94번 위치의 아스파라긴 (N) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.

(O) (i) 90번 위치의 세린 (S) 및 (ii) 104번 위치의 이소류신 (I) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.

(P) (i) 88번 위치의 아스파르트산 (D) 및 (ii) 105번 위치의 리신 (K) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.

(Q) (i) 88번 위치의 아스파라긴 (N) 및 (ii) 126번 위치의 아르기닌 (R) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.

(R) (i) 88번 위치의 아스파라긴 (N), (ii) 90번 위치의 글루타민 (Q) 및 (iii) 91번 위치의 아르기닌 (R) 중 하나 이상의 도입. 변이체는 이들 치환을 1, 2 또는 3개 포함할 수 있다. 각 단량체에 3개의 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.

(S) (i) 88번 위치의 아스파라긴 (N), (ii) 90번 위치의 글루타민 (Q) 및 (iii) 91번 위치의 세린 (S) 중 하나 이상의 도입. 변이체는 이들 치환을 1, 2 또는 3개 포함할 수 있다. 각 단량체에 3개의 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.

(T) (i) 88번 위치의 아스파라긴 (N), (ii) 90번 위치의 글루타민 (Q) 및 (iii) 105번 위치의 발린 (V) 중 하나 이상의 도입. 변이체는 이들 치환을 1, 2 또는 3개 포함할 수 있다. 각 단량체에 3개의 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.

(U) (i) 90번 위치의 글루타민 (Q), (ii) 93번 위치의 세린 (S) 및 (iii) 105번 위치의 알라닌 (A) 중 하나 이상의 도입. 변이체는 이들 치환을 1, 2 또는 3개 포함할 수 있다. 각 단량체에 3개의 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.

(V) (i) 90번 위치의 페닐알라닌 (F), 트립토판 (W), 티로신 (Y) 또는 히스티딘 (H), (ii) 91번 위치의 페닐알라닌 (F), 트립토판 (W), 티로신 (Y) 또는 히스티딘 (H) 및 (iii) 105번 위치의 페닐알라닌 (F), 트립토판 (W), 티로신 (Y) 또는 히스티딘 (H) 중 하나 이상의 도입. 변이체는 이들 치환을 1, 2 또는 3개 포함할 수 있다. 이들 벌키, 방향족 잔기의 도입으로 세공의 전정부 및/또는 협착부에서 파이 스태킹 및 입체구조는 증가한다. 또한 전정부 및/또는 협착부 크기도 증가한다 (즉, 세공은 열린다).

(W) (i) 90번 위치의 세린 (S), 트레오닌 (T), 글리신 (G), 알라닌 (A) 또는 발린 (V), (ii) 91번 위치의 세린 (S), 트레오닌 (T), 글리신 (G), 알라닌 (A) 또는 발린 (V) 및 (iii) 105번 위치의 세린 (S), 트레오닌 (T), 글리신 (G), 알라닌 (A) 또는 발린 (V) 중 하나 이상의 도입. 변이체는 이들 치환을 1, 2 또는 3개 포함할 수 있다. 더 작은 잔기를 도입하게 되면 세공의 전정부 및/또는 협착부의 입체구조는 축소된다.

(X) 90번 위치의 세린 (S), 아르기닌 (R), 리신 (K) 또는 히스티딘 (H) 및/또는 91번 위치의 세린 (S), 아르기닌 (R), 리신 (K) 또는 히스티딘 (H)의 도입. 양으로 하전된 잔기 (R, K 또는 H)를 도입하게 되면, 세공의 협착부와 핵산 서열 사이의 상호작용은 증가하게 된다.

(Y) 90번 위치의 세린 (S), 트레오닌 (T), 아스파라긴 (N), 글루타민 (Q), 티로신 (Y) 또는 91번 위치의 히스티딘 (H) 및/또는 세린 (S), 트레오닌 (T), 아스파라긴 (N), 글루타민 (Q), 티로신 (Y) 또는 히스티딘 (H)의 도입. 상기 잔기를 도입하면, 세공의 협착부와 핵산 서열 사이에 발생되는 수소 결합은 증가하게 된다. 또한, 전정부 및/또는 협착부 크기도 증가한다 (즉, 세공은 열린다).

(Z) 90, 91 및 103번 위치 중 하나 이상의 위치의 시스테인 도입. 이러한 도입으로 화학기는 시스테인 연결부를 통해 세공에 부착될 수 있다. 이에 대해서는 상기 및 하기에서 더욱 상세하게 논의된다.

바람직한 변이체로는 하기 치환(들) 중 하나 이상의 치환을 포함하는 변이체를 포함하나, 이에 한정되지 않는다: L88N; L88S; L88Q; L88T; D90S; D90Q; D90Y; I105L; I105S; Q126R; G75S; G77S; G75S, G77S, L88N 및 Q126R; G75S, G77S, L88N, D90Q 및 Q126R; D90Q 및 Q126R; L88N, D90Q 및 Q126R; L88S 및 D90Q; L88N 및 D90Q; E59R; G75Q; G75N; G75S; G75T; G77Q; G77N; G77S; G77T; I78L; S81N; T83N; N86S; N86T; I87F; I87V; I87L; L88N; L88S; L88Y; L88F; L88V; L88Q; L88T; I89F; I89V; I89L; N90S; N90Q; N90L; N90Y; N91S; N91Q; N91L; N91M; N91I; N91A; N91V; N91G; G92A; G92S; N93S; N93A; N93T; I94L; T95V; A96R; A96D; A96V; A96N; A96S; A96T; P97S; P98S; F99S; G100S; L101F; N102K; N102S; N102T; S103A; S103Q; S103N; S103G; S103T; V104I; I105Y; I105L; I105A; I105Q; I105N; I105S; I105T; T106F; T106I; T106V; T106S; N108P; N108S; D90Q 및 I105A; D90S 및 G92S; L88T 및 D90S; I87Q 및 D90S; I89Y 및 D90S; L88N 및 I89F; L88N 및 I89Y; D90S 및 G92A; D90S 및 I94N; D90S 및 V104I; L88D 및 I105K; L88N 및 Q126R; L88N, D90Q 및 D91R; L88N, D90Q 및 D91S; L88N, D90Q 및 I105V; D90Q, D93S 및 I105A; N91Y; N90Y 및 N91G; N90G 및 N91Y; N90G 및 N91G; I05G; N90R; N91R; N90R 및 N91R; N90K; N91K; N90K 및 N91K; N90Q 및 N91G; N90G 및 N91Q; N90Q 및 N91Q; R118N; N91C; N90C; N90W; N91W; N90K; N91K; N90R; N91R; N90S 및 N91S; N90Y 및 I105A; N90G 및 I105A; N90Q 및 I105A; N90S 및 I105A; L88A 및 I105A; L88S 및 I105S; L88N 및 I105N; N90G 및 N93G; N90G; N93G; N90G 및 N91A; I105K; I105R; I105V; I105P; I105W; L88R; L88A; L88G; L88N; N90R 및 I105A; N90S 및 I105A; L88A 및 I105A; L88S 및 I105S; L88N 및 I105N; L88C; S103C; 및 I105C.

특히 바람직한 변이체는 I105N을 포함한다. I105N을 포함하는, 돌연변이체 단량체로부터 구축된 세공은 대략 80%만큼 증가된 잔류 전류를 가진다. 상이한 뉴클레오티드와 관련하여 전류 변화 또한 증가한다. 이는 I105N을 포함하는, 돌연변이체 단량체로부터 구축된 세공의 구조 변화를 반영한다. 그러므로, 상기 세공은 뉴클레오티드를 판별할 수 있는 개선된 능력을 가진다.

바람직한 단일 돌연변이체 및 동종-팔량체 세공에서 사용되었을 때의 그의 장점은 하기 표 1에 제시되어 있다.

바람직한 다중돌연변이체 및 동종-팔량체 세공에서 사용되었을 때의 그의 장점은 하기 표 2에 제시되어 있다.

가장 바람직한 돌연변이체 및 동종-팔량체 세공에서 사용되었을 때의 그의 장점은 하기 표 3에 제시되어 있다.

상기 논의된 구체적인 돌연변이 이외에도, 변이체는 다른 돌연변이를 포함할 수 있다. 변이체는 서열 번호 2의 전장의 아미노산 서열 전체에 걸쳐 바람직하게는 아미노산 동일성 기준으로 상기 서열과 50% 이상 상동성일 것이다. 더욱 바람직하게, 변이체는 전체 서열에 걸쳐 아미노산 동일성 기준으로 서열 번호 2의 아미노산 서열과 55% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상 및 더욱 바람직하게는, 95% 이상, 97% 이상 또는 99% 이상 상동성일 수 있다. 100개 이상, 예를 들어, 125, 150, 175 또는 200개 이상의 연속된 아미노산으로 이루어진 스트레치에 걸쳐 80% 이상, 예를 들어, 85% 이상, 90% 이상 또는 95% 이상으로 아미노산이 동일할 수 있다 ("강력한 상동성(hard homology)").

상동성을 측정하는 데 당업계의 표준이 사용될 수 있다. 예를 들어, UWGCG 패키지는 예를 들어, 그의 디폴트 환경 설정에서 사용되는 상동성을 계산할 수 있는 BESTFIT 프로그램을 제공한다 (문헌 [Devereux et al (1984) Nucleic Acids Research 12, p387-395]). PILEUP 및 BLAST 알고리즘은 예를 들어, 문헌 [Altschul S. F. (1993) J Mol Evol 36:290-300]; [Altschul, S.F et al (1990) J Mol Biol 215:403-10]에 기술되어 있는 바와 같이, 상동성을 계산하거나, 또는 서열을 정렬하는 데 (예컨대 (전형적으로 그의 디폴트 환경 설정에서) 등가 잔기 또는 상응하는 서열을 확인하는 데) 사용될 수 있다.

BLAST 분석을 실행하기 위한 소프트웨어는 미국 국립 생물 기술 정보 센터(National Center for Biotechnology Information) (http://www.ncbi.nlm.nih.gov/)를 통해 공개적으로 이용가능하다. 상기 알고리즘은 먼저, 데이터베이스 서열 중 길이가 같은 워드와 함께 정렬되었을 때, 매치되거나 또는 일부 양의 값 임계값 스코어 T를 충족시키는, 질의 서열 중의 길이가 W인 짧은 워드를 확인함으로써 높은 스코어링 서열쌍 (HSP)을 확인하는 것을 포함한다. T는 이웃 워드 스코어 임계값으로서 의미되어 진다 (문헌 [Altschul et al, 상기 문헌 동일]). 이들 초기 이웃 워드 히트는 이를 포함하는 HSP를 찾아내기 위해 검색을 개시하기 위한 시드로서의 역할을 한다. 워드 히트는 정렬 누적 점수가 증가할 수 있을 때까지 각 서열을 따라 양 방향으로 연장된다. 워드 히트의 각 방향으로의 연장은, 정렬 누적 점수가 그의 최대 달성값으로부터 정량 X만큼 감소하였을 때; 하나 이상의 음성 스코어링 잔기 정렬의 누적으로 인하여 누적 점수가 0 이하로 하락하였을 때; 또는 각 서열 말단에 도달하였을 때에 중단된다. BLAST 알고리즘 파라미터 W, T 및 X가 정렬 감도 및 속도를 결정짓는다. BLAST 프로그램은 디폴트로서 워드 길이 (W)=11, BLOSUM62 스코어링 매트릭스 (문헌 [Henikoff and Henikoff (1992) Proc . Natl . Acad . Sci . USA 89: 10915-10919] 참조) 정렬 (B)=50, 기대치 (E)=10, M=5, N=4, 및 양 가닥 비교를 사용하였다.

BLAST 알고리즘은 두 서열 간의 유사성에 관한 통계학적 분석을 실행한다; 예컨대 문헌 [Karlin 및 Altschul (1993) Proc . Natl . Acad . Sci . USA 90: 5873-5787] 참조. BLAST 알고리즘이 제공하는 유사성에 관한 한 척도는 최소합 확률 (P(N))인데, 이는 두 아미노산 서열 간의 매칭이 우연히 일어날 수 있는 확률을 나타낸다. 예를 들어, 제1 서열을 제2 서열과 비교하였을 때, 최소합 확률이 약 1 미만일 경우, 바람직하게는 약 0.1 미만, 더욱 바람직하게는 약 0.01, 및 가장 바람직하게는 약 0.001 미만일 경우, 서열은 또 다른 서열과 유사한 것으로 간주된다.

서열 번호 2는 MspA 단량체의 NNN-RRK 돌연변이체이다. 변이체는 MspA와 비교하여 MspB, C 또는 D 단량체 중에 돌연변이 중 임의의 것을 포함할 수 있다. 성숙한 형태의 MspB, C 및 D는 서열 번호 16 내지 18에 제시되어 있다. 특히, 변이체는 MspB 중에 존재하는 하기 치환: A138P를 포함할 수 있다. 변이체는 MspC 중에 존재하는 하기 치환: A96G, N102E 및 A138P 중 하나 이상을 포함할 수 있다. 변이체는 MspD 중에 존재하는 하기 돌연변이: G1의 결실, L2V, E5Q, L8V, D13G, W21A, D22E, K47T, I49H, I68V, D91G, A96Q, N102D, S103T, V104I, S136K 및 G141A 중 하나 이상을 포함할 수 있다. 변이체는 Msp B, C 및 D로부터의 돌연변이 및 치환 중 하나 이상을 포함할 수 있다.

아미노산 치환은 상기 논의된 것 이외에도 서열 번호 2의 아미노산 서열에 대하여, 예를 들어, 최대 1, 2, 3, 4, 5, 10, 20 또는 30개까지 치환이 이루어질 수 있다. 보존적 치환은 아미노산을, 화학적 구조가 유사하거나, 화학적 특성이 유사하거나, 측쇄 부피가 유사한 다른 아미노산으로 치환하는 것이다. 도입되는 아미노산은 치환되는 아미노산과 유사한 극성, 친수성, 소수성, 염기도, 산도, 중성도 또는 전하를 가질 수 있다. 별법으로, 보존적 치환은 기존 방향족 또는 지방족 아미노산의 위치에 방향족 또는 지방족인 또 다른 아미노산을 도입할 수 있다. 보존적 아미노산 변경은 당업계에 주지되어 있고, 이는 하기 표 4에 정의되어 있는 바와 같은 20종의 주요 아미노산의 특성에 따라 선택될 수 있다. 아미노산이 유사한 극성을 가지는 경우, 이는 하기 표 5의 아미노산 측쇄에 대한 소수성 등급을 참조함으로써 결정될 수 있다.

서열 번호 2의 아미노산 서열의 하나 이상의 아미노산 잔기가 추가로 상기 기술된 폴리펩티드로부터 결실될 수 있다. 최대 1, 2, 3, 4, 5, 10, 20 또는 30개 까지의, 또는 그 이상의 잔기가 결실될 수 있다.

변이체는 서열 번호 2의 단편을 포함할 수 있다. 상기 단편은 세공 형성 활성을 보유한다. 단편의 길이는 50, 100, 150 또는 200개 이상의 아미노산 길이일 수 있다. 상기 단편은 본 발명의 세공을 제조하는 데 사용될 수 있다. 단편은 바람직하게 서열 번호 2의 세공 형성 도메인을 포함한다. 단편은 서열 번호 2의 잔기 88, 90, 91, 105, 118 및 134 중 하나를 포함하여야 한다. 전형적으로, 단편은 서열 번호 2의 잔기 88, 90, 91, 105, 118 및 134 모두를 포함한다.

별법으로 또는 추가적으로 하나 이상의 아미노산이 상기 기술된 폴리펩티드에 부가될 수 있다. 연장은 서열 번호 2의 아미노산 서열 또는 그의 폴리펩티드 변이체 또는 단편의 아미노 말단 또는 카르복시 말단에서 제공될 수 있다. 연장 길이는 예를 들어, 1 내지 10개의 아미노산 길이 정도로 매우 짧을 수 있다. 별법으로, 연장은 예를 들어, 최대 50 또는 100개 이하의 아미노산 정도로 보다 장쇄일 수 있다. 캐리어 단백질이 본 발명의 아미노산 서열에 융합될 수 있다. 다른 융합 단백질은 하기에서 더욱 상세하게 논의된다. 변이체는 서열 번호 2의 아미노 말단에 메티오닌을 가질 수 있다.

상기에서 논의된 바와 같이, 변이체는 서열 번호 2의 것으로부터 변이되고, 세공을 형성할 수 있는 그의 능력을 보유하는 아미노산 서열을 가지는 폴리펩티드이다. 변이체는 전형적으로 세공 형성을 담당하는 서열 번호 2의 영역을 포함한다. β-베럴 구조를 포함하는 Msp의 세공 형성 능력은 각 서브유닛에서 β-시트형 구조로 제공된다. 서열 번호 2의 변이체는 전형적으로 서열 번호 2에 β-시트형 구조를 형성하는 영역을 포함한다. 생성된 변이체가 세공을 형성할 수 있는 그의 능력을 보유하는 한, 서열 번호 2 중의 β-시트형 구조를 형성하는 영역에 대해 하나 이상의 변형이 이루어질 수 있다. 서열 번호 2의 변이체는 바람직하게 그의 α-헬릭스 및/또는 루프 영역 내에 하나 이상의 변형, 예컨대 치환, 부가 또는 결실을 포함한다.

돌연변이체 단량체는 그의 확인 또는 정제를 도울 수 있도록, 예를 들어, 히스티딘 잔기 (his 태그), 아스파르트산 잔기 (asp 태그), 스트렙트아비딘 태그 또는 플래그 태그의 부가에 의해, 또는 폴리펩티드가 천연적으로 신호 서열을 함유하지 않는 세포로부터의 그의 분비 촉진을 위한 신호 서열의 부가에 의해 변형될 수 있다. 유전자 태그를 도입하는 것에 대한 대안은 세공 상의 본래의 또는 조작된 위치에 있는 태그를 화학적으로 반응시키는 것이다. 이것의 예는 세공의 바깥쪽 상에서 조작된 시스테인에 대한 겔-이동 시약을 반응시키는 것이 될 것이다. 이는 헤몰리신 이종-올리고머를 분리시키는 방법으로서 입증된 바 있다 (문헌 [Chem Biol. 1997 Jul;4(7):497-505]).

돌연변이체 단량체는 시현용 표지로 표지화될 수 있다. 시현용 표지는 세공이 검출될 수 있도록 하는 임의의 적합한 표지일 수 있다. 적합한 표지로는 형광성 분자, 방사성 동위 원소, 예컨대 ¹²⁵I, ³⁵S, 효소, 항체, 항원, 폴리뉴클레오티드 및 리간드, 예컨대 비오틴을 포함하나, 이에 한정되지 않는다.

돌연변이체 단량체는 합성적으로 또는 재조합 수단에 의해 제조될 수 있다. 예를 들어, 세공은 시험관내 번역 및 전사 (IVTT)에 의해 합성될 수 있다. 돌연변이체 단량체의 아미노산 서열은 비-천연적으로 발생된 아미노산을 포함하도록 또는 단량체의 안정성을 증가시키도록 변형될 수 있다. 돌연변이체 단량체가 합성 수단에 의해 제조되었을 때, 상기 아미노산은 제조되는 동안에 도입될 수 있다. 돌연변이체 단량체는 또한 합성적 또는 재조합 제조 이후에 변경될 수 있다.

돌연변이체 단량체는 또한 D-아미노산을 사용하여 제조될 수 있다. 예를 들어, 돌연변이체 단량체는 L-아미노산 및 D-아미노산의 혼합물을 포함할 수 있다. 이는 상기 단백질 또는 펩티드를 제조하는 분야에 있어서 통상적인 것이다.

돌연변이체 단량체는 용이한 뉴클레오티드 판별을 위해 하나 이상의 특이적인 변형을 포함한다. 돌연변이체 단량체는 또한, 세공 형성을 간섭하지 않는 한, 다른 비-특이적인 변형도 포함할 수 있다. 다수의 비-특이적인 측쇄 변형이 당업계에 공지되어 있고, 그러한 변형은 돌연변이체 단량체의 측쇄에 대해 이루어질 수 있다. 상기 변형은 예를 들어, 알데히드와의 반응에 의한 아미노산의 환원적 알킬화에 이은, NaBH₄에 의한 환원, 메틸아세트이미데이트에 의한 아미딘화 또는 아세트산 무수물에 의한 아실화를 포함한다.

돌연변이체 단량체는 당업계에 공지된 표준 방법을 사용하여 제조될 수 있다. 돌연변이체 단량체를 코딩하는 폴리뉴클레오티드 서열은 당업계의 표준 방법을 사용하여 유도되고 복제될 수 있다. 상기 서열은 하기에서 더욱 상세하게 논의된다. 돌연변이체 단량체를 코딩하는 폴리뉴클레오티드 서열은 당업계의 표준 기법을 사용하여 박테리아 숙주 세포에서 발현될 수 있다. 돌연변이체 단량체는 재조합 발현 벡터로부터의 폴리펩티드의 계내 발현에 의해 세포에서 제조될 수 있다. 발현 벡터는 임의적으로 폴리펩티드의 발현을 제어하기 위해 유도가능한 프로모터를 보유한다.

돌연변이체 단량체는 임의의 단백질 액체 크로마토그래피 시스템에 의한 세공 제조 유기체로부터의 정제 이후에, 또는 하기 기술되는 바와 같은 재조합 발현 이후에 대규모로 제조될 수 있다. 전형적인 단백질 액체 크로마토그래피 시스템으로는 FPLC, AKTA 시스템, 바이오-캐드(Bio-Cad) 시스템, 바이오-래드 바이오로직(Bio-Rad BioLogic) 시스템 및 및 길슨(Gilson) HPLC 시스템을 포함한다. 이어서, 돌연변이체 단량체는 본 발명에 따른 용도를 위해 천연적으로 발생된 막 또는 인공막 내로 삽입될 수 있다. 세공을 막 내로 삽입하는 막은 하기에서 논의된다.

일부 실시양태에서, 돌연변이체 단량체는 화학적으로 변형된다. 돌연변이체 단량체는 임의의 방식으로 및 임의의 부위에서 화학적으로 변형될 수 있다. 돌연변이체 단량체는 바람직하게 분자의 하나 이상의 시스테인에의 부착 (시스테인 연결), 분자의 하나 이상의 리신에의 부착, 분자의 하나 이상의 비천연 아미노산에의 부착, 에피토프의 효소 변형 또는 말단의 변형에 의해 화학적으로 변형된다. 상기 변형을 수행하는 데 적합한 방법은 당업계에 주지되어 있다. 돌연변이체 단량체는 임의의 분자의 부착에 의해 화학적으로 변형될 수 있다. 예를 들어, 돌연변이체 단량체는 염료 또는 형광단의 부착에 의해 화학적으로 변형될 수 있다.

일부 실시양태에서, 돌연변이체 단량체는 상기 단량체를 포함하는 세공과 표적 뉴클레오티드 또는 표적 핵산 서열 사이의 상호작용을 촉진하는 분자 어댑터로 화학적으로 변형된다. 어댑터가 존재하면 세공과 뉴클레오티드 또는 핵산 서열의 주객 화학법이 개선되고, 이로써, 돌연변이체 단량체로부터 형성된 세공의 서열분석 능력이 개선된다. 주객 화학법의 원리는 당업계에 주지되어 있다. 어댑터는 세공과 뉴클레오티드 또는 핵산 서열과의 상호작용을 개선시키는 세공의 물리적 또는 화학적 특성에 영향을 미친다. 어댑터는 세공의 베럴 또는 채널의 전하를 변경시킬 수 있거나, 특이적으로 뉴클레오티드 또는 핵산 서열과 상호작용하거나, 그에 결합함으로써 세공과 그의 상호작용이 용이하게 이루어지게 할 수 있다.

분자 어댑터는 바람직하게 시클릭 분자, 시클로덱스트린, 하이브리드화할 수 있는 종, DNA 결합제 또는 인터킬레이터, 펩티드 또는 펩티드 유사체, 합성 중합체, 방향족 평면 분자, 양으로 하전된 소형 분자 또는 수소 결합이 가능한 소형 분자이다.

어댑터는 시클릭일 수 있다. 시클릭 어댑터는 바람직하게 세공과 동일한 대칭 구조이다. Msp가 전형적으로 중심축을 기준으로 그 둘레에 8개의 서브유닛을 가지는 바, 어댑터는 바람직하게 8중 대칭 구조이다. 이에 대해서는 하기에서 더욱 상세하게 논의한다.

어댑터는 전형적으로 주객 화학법을 통해 뉴클레오티드 또는 핵산 서열과 상호작용한다. 어댑터는 전형적으로 뉴클레오티드 또는 핵산 서열과 상호작용할 수 있다. 어댑터는 뉴클레오티드 또는 핵산 서열과 상호작용할 수 있는 하나 이상의 화학기를 포함한다. 하나 이상의 화학기는 바람직하게 비-공유 상호작용, 예컨대 소수성 상호작용, 수소 결합, 반 데르 발스의 힘(Van der Waal's forces), π-양이온 상호작용 및/또는 정전력에 의해 뉴클레오티드 또는 핵산 서열과 상호작용한다. 뉴클레오티드 또는 핵산 서열과 상호작용할 수 있는 하나 이상의 화학기는 바람직하게 양으로 하전된. 뉴클레오티드 또는 핵산 서열과 상호작용할 수 있는 하나 이상의 화학기는 더욱 바람직하게는 아미노기를 포함한다. 아미노기는 제1급, 제2급 또는 제3급 탄소 원자에 부착될 수 있다. 어댑터는 더욱더 바람직하게는 아미노기 고리, 예컨대 6, 7, 8개의 아미노기로 이루어진 고리를 포함한다. 어댑터는 가장 바람직하게는 8개의 아미노기로 이루어진 고리를 포함한다. 양성자화된 아미노기로 이루어진 고리는 뉴클레오티드 또는 핵산 서열 중의 음으로 하전된 포스페이트기와 상호작용할 수 있다.

세공 내에 어댑터를 정확하게 배치하는 것은 어댑터와, 돌연변이체 단량체를 포함하는 세공 사이의 주객 화학법에 의해 용이하게 이루어질 수 있다. 어댑터는 바람직하게 세공 중의 하나 이상의 아미노산과 상호작용할 수 있는 하나 이상의 화학기를 포함한다. 어댑터는 더욱 바람직하게는 비-공유 상호작용, 예컨대 소수성 상호작용, 수소 결합, 반 데르 발스의 힘, π-양이온 상호작용 및/또는 정전력을 통해 세공 중의 하나 이상의 아미노산과 상호작용할 수 있는 하나 이상의 화학기를 포함한다. 세공 중의 하나 이상의 아미노산과 상호작용할 수 있는 화학기는 전형적으로 히드록실 또는 아민이다. 히드록실기는 제1급, 제2급 또는 제3급 탄소 원자에 부착될 수 있다. 히드록실기는 세공 중의 비하전된 아미노산과 수소 결합을 형성할 수 있다. 세공과 뉴클레오티드 또는 핵산 서열 사이의 상호작용이 용이하게 이루어지게 하는 임의의 어댑터가 사용될 수 있다.

적합한 어댑터로는 시클로덱스트린, 시클릭 펩티드 및 쿠커비투릴을 포함하나, 이에 한정되지 않는다. 어댑터는 바람직하게 시클로덱스트린 또는 그의 유도체이다. 시클로덱스트린 또는 그의 유도체는 문헌 [Eliseev, A. V., and Schneider, H-J. (1994) J. Am . Chem . Soc . 116, 6081-6088]에 개시된 것 중 임의의 것일 수 있다. 어댑터는 더욱 바람직하게는 헵타키스-6-아미노-β-시클로덱스트린 (am₇-βCD), 6-모노데옥시-6-모노아미노-β-시클로덱스트린 (am₁-βCD) 또는 헵타키스-(6-데옥시-6-구아니디노)-시클로덱스트린 (gu₇-βCD)이다. gu₇-βCD 중의 구아니디노기는 am₇-βCD 중의 1급 아민보다 훨씬 더 높은 pKa를 가지며, 이로써 더 크게 양으로 하전되어 있다. 이러한 gu₇-βCD 어댑터는 세공 중 뉴클레오티드의 체류 시간을 증가시키는 데, 측정된 잔류 전류의 정확도를 증가시키는 데 뿐만 아니라, 고온에서의 염기 검출률을 증가시키는 데, 또는 낮은 데이터 획득률을 증가시키는 데 사용될 수 있다.

하기에서 더욱 상세하게 논의되는 바와 같이, 숙신이미딜 3-(2-피리딜디티오)프로피오네이트 (SPDP) 가교제가 사용될 경우, 어댑터는 바람직하게 헵타키스(6-데옥시-6-아미노)-6-N-모노(2-피리딜)디티오프로파노일-β-시클로덱스트린 (am₆amPDP₁-βCD)이다.

더욱 적합한 어댑터로는 8개의 당 유닛을 포함하는 (그리고, 이로써 8중 대칭 구조를 가지는) γ-시클로덱스트린을 포함한다. γ-시클로덱스트린은 링커 분자를 포함할 수 있거나, 또는 상기에서 논의된 β-시클로덱스트린 예에서 사용된 변형된 당 유닛 모두 또는 그 이상을 포함하도록 변형될 수 있다.

분자 어댑터는 바람직하게 돌연변이체 단량체에 공유적으로 부착된다. 어댑터는 당업계에 공지된 임의의 방법을 사용하여 세공에 공유적으로 부착될 수 있다. 어댑터는 전형적으로 화학적 연결부를 통해 부착된다. 분자 어댑터가 시스테인 연결부를 통해 부착될 경우, 하나 이상의 시스테인은 바람직하게 치환에 의해 돌연변이체로 도입된다. 물론 본 발명의 돌연변이체 단량체는 88, 90, 91, 103 및 105번 위치 중 하나 이상의 위치에 시스테인 잔기를 포함할 수 있다. 돌연변이체 단량체는 하나 이상의, 예컨대 2, 3, 4 또는 5개의 상기 시스테인에의 분자 어댑터의 부착에 의해 화학적으로 변형될 수 있다. 별법으로, 돌연변이체 단량체는 다른 위치에 도입된 하나 이상의 시스테인에의 분자의 부착에 의해 화학적으로 변형될 수 있다. 분자 어댑터는 바람직하게 서열 번호 2의 90, 91 및 103번 위치 중 하나 이상의 위치에 부착된다.

시스테인 잔기의 반응성은 인접 잔기의 변형에 의해 증진될 수 있다. 예를 들어, 측면에 위치하는 아르기닌, 히스티딘 또는 리신 잔기의 염기성 기는 시스테인 티올기의 pKa를 반응성이 더 큰 S^- 기의 것으로 변화시킬 것이다. 시스테인 잔기의 반응성은 티올 보호기, 예컨대 dTNB에 의해 보호될 수 있다. 이는 링커 부착 이전에 돌연변이체 단량체의 하나 이상의 시스테인 잔기와 함께 반응할 수 있다. 상기 분자는 돌연변이체 단량체에 직접 부착될 수 있다. 상기 분자는 바람직하게 링커, 예컨대 화학적 가교제 또는 펩티드 링커를 사용하여 돌연변이체 단량체에 부착된다.

적합한 화학적 가교제는 당업계에 주지되어 있다. 바람직한 가교제로는 2,5-디옥소피롤리딘-1-일 3-(피리딘-2-일디술파닐)프로파노에이트, 2,5-디옥소피롤리딘-1-일 4-(피리딘-2-일디술파닐)부타노에이트 및 2,5-디옥소피롤리딘-1-일 8-(피리딘-2-일디술파닐)옥타노에이트를 포함한다. 가장 바람직한 가교제는 숙신이미딜 3-(2-피리딜디티오)프로피오네이트 (SPDP)이다. 전형적으로, 분자는, 분자/가교제 복합체가 돌연변이체 단량체에 공유적으로 부착되기 이전에 이작용성 가교제에 공유적으로 부착되기도 하지만, 이작용성 가교제/단량체 복합체가 분자에 부착되기 이전에 이작용성 가교제가 단량체에 공유적으로 부착될 수도 있다.

링커는 바람직하게 디티오트레이톨 (DTT)에 대해 적합성을 띤다. 적합한 링커로는 요오도아세트아미드계 및 말레이미드계 링커를 포함하지만, 이에 한정되지 않는다.

다른 실시양태에서, 단량체는 핵산 결합 단백질에 부착될 수 있다. 이는 본 발명의 서열분석 방법에서 사용될 수 있는 모듈식 서열분석 시스템을 형성한다. 핵산 결합 단백질은 하기에서 논의한다.

핵산 결합 단백질은 바람직하게 돌연변이체 단량체에 공유적으로 부착된다. 단백질은 당업계에 공지된 임의의 방법을 사용하여 세공에 공유적으로 부착될 수 있다. 단량체 및 단백질은 화학적으로 융합되거나, 유전자적으로 융합될 수 있다. 전체 구축물이 단일 폴리뉴클레오티드 서열로부터 발현된다면, 단량체 및 단백질은 유전자적으로 융합된다. 세공의 핵산 결합 단백질에의 유전적 융합은 국제 출원 번호 PCT/GB09/001679 (공개 공보 WO 2010/004265)에서 논의된 바 있다.

핵산 결합 단백질이 시스테인 연결부를 통해 부착될 경우, 하나 이상의 시스테인은 바람직하게 치환에 의해 돌연변이체로 도입된다. 물론 본 발명의 돌연변이체 단량체는 10 내지 15번 위치, 51 내지 60번 위치, 136 내지 139번 위치 및 168 내지 172번 위치 중 하나 이상의 위치에 시스테인 잔기를 포함할 수 있다. 상기 위치는 동족체 중 보존도가 낮은 루프 영역 중에 존재하는데, 이는 돌연변이 또는 삽입이 내성을 띨 수 있다는 것을 시사한다. 그러므로, 핵산 결합 단백질을 부착시키는 데 적합하다. 시스테인 잔기의 반응성은 상기 기술된 바와 같이 변형에 의해 증진될 수 있다.

핵산 결합 단백질은 돌연변이체 단량체에 직접 또는 하나 이상의 링커를 통해 부착될 수 있다. 분자는 국제 출원 번호 PCT/GB10/000132 (공개 공보 WO 2010/086602)에 기술된 하이브리드화 링커를 사용하여 돌연변이체 단량체에 부착될 수 있다. 별법으로, 펩티드 링커가 사용될 수 있다. 펩티드 링커는 아미노산 서열이다. 펩티드 링커의 길이, 가요성, 및 친수성은 전형적으로는 단량체 및 분자의 기능을 방해하지 않도록 디자인된다. 바람직한 가요성 펩티드 링커는 2 내지 20개, 예컨대 4, 6, 8, 10 또는 16개의 세린 및/또는 글리신 아미노산으로 이루어진 스트레치이다. 더욱 바람직한 가요성 링커로는 (SG)₁, (SG)₂, (SG)₃, (SG)₄, (SG)₅ 및 (SG)₈ (여기서 S는 세린이고, G는 글리신이다)을 포함한다. 바람직한 강성 링커는 2 내지 30개, 예컨대 4, 6, 8, 16 또는 24개의 프롤린 아미노산으로 이루어진 스트레치이다. 더욱 바람직한 강성 링커는 (P)₁₂ (여기서 P는 프롤린이다).

돌연변이체 단량체는 분자 어댑터 및 핵산 결합 단백질로 화학적으로 변형될 수 있다.

구축물

본 발명은 또한 Msp로부터 유래된 2개 이상의 공유적으로 부착된 단량체를 포함하는 구축물을 제공한다. 본 발명의 구축물은 세공을 형성할 수 있는 그의 능력을 보유한다. 본 발명의 하나 이상의 구축물은 핵산 서열의 특징을 규명하기 위해, 예컨대 그의 서열을 분석하기 위해 세공을 형성하는 데 사용될 수 있다. 구축물은 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 단량체를 포함할 수 있다. 2개 이상의 단량체는 동일하거나, 상이할 수 있다.

단량체가 본 발명의 돌연변이체 단량체일 필요는 없다. 예를 들어, 1개 이상의 단량체는 서열 번호 2에 제시된 서열을 포함할 수 있다. 별법으로, 1개 이상의 단량체는 그의 전체 서열에 걸쳐 아미노산 동일성 기준으로 서열 번호 2와 50% 이상 상동성이지만, 본 발명의 돌연변이체 단량체에 필요한 특이적인 돌연변이 중 어느 것도 포함하지 않는 서열 번호 2의 변이체를 포함할 수 있다. 더욱 바람직하게는, 변이체는 전체 서열에 걸쳐 아미노산 동일성 기준으로 서열 번호 2의 아미노산 서열과 55% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상 및 더욱 바람직하게는, 95% 이상, 97% 이상 또는 99% 이상 상동성일 수 있다. 바람직한 실시양태에서, 구축물 중 1개 이상의 단량체는 본 발명의 돌연변이체 단량체이다. 구축물 중의 단량체들은 모두 본 발명의 돌연변이체 단량체일 수 있다. 돌연변이체 단량체는 동일하거나, 상이할 수 있다. 더욱 바람직한 실시양태에서, 구축물은 2개의 단량체를 포함하고, 단량체 중 1개 이상은 본 발명의 돌연변이체 단량체이다.

단량체는 바람직하게 유전자적으로 융합된다. 전체 구축물이 단일 폴리뉴클레오티드 서열로부터 발현된다면, 단량체는 유전자적으로 융합된다. 단량체의 코딩 서열은 구축물을 코딩하는 단일 폴리뉴클레오티드 서열을 형성하는 임의의 방식으로 조합될 수 있다.

단량체는 임의의 배열로 유전자적으로 융합될 수 있다. 단량체는 그의 말단 아미노산을 통해 융합될 수 있다. 예를 들어, 한 단량체의 아미노산 말단은 또 다른 단량체의 카르복시 말단에 융합될 수 있다. 각각이 서열 번호 2에 제시된 서열 또는 변이체를 포함하는 것인 2개 이상의 단량체의 유전적 융합으로부터 구축물이 형성된 경우에는, (아미노에서 카르복시 방향으로) 구축물 중 두번째 및 후속 단량체는 그의 아미노 말단 단부 (이들 각각은 앞의 단량체의 카르복시 말단에 융합된다)에 메티오닌을 포함할 수 있다. 예를 들어, M이 서열 번호 2에 제시된 서열 또는 (아미노 말단 메티오닌을 포함하지 않는) 변이체를 포함하는 단량체이고, mM이 서열 번호 2에 제시된 서열 또는 아미노 말단 메티오닌을 포함하는 변이체를 포함하는 단량체일 경우, 구축물은 서열 M-mM, M-mM-mM 또는 M-mM-mM-mM을 포함할 수 있다. 상기 메티오닌의 존재는 전형적으로 전체 구축물을 코딩하는 폴리뉴클레오티드 내의, 두번째 및 후속 단량체를 코딩하는 폴리뉴클레오티드의 5' 말단의 출발 코돈 (즉, ATG)이 발현되었기 때문이다. (아미노에서 카르복시 방향으로) 구축물 중 첫번째 단량체 또한 메티오닌을 포함할 수 있다 (예컨대 mM-mM, mM-mM-mM 또는 mM-mM-mM-mM).

2개 이상의 단량체는 함께 직접적으로 유전자적으로 융합될 수 있다. 단량체는 바람직하게 링커를 사용하여 유전자적으로 융합된다. 링커는 단량체의 이동성을 제한하도록 디자인될 수 있다. 바람직한 링커는 아미노산 서열 (즉, 펩티드 링커)이다. 상기에서 논의된 펩티드 링거 중 임의의 것이 사용될 수 있다. 구축물은 바람직하게 서열 번호 29에 제시된 서열 또는 그의 변이체를 포함한다. 서열 번호 29의 각 단량체는 서열 번호 2에 제시된 서열 또는 그의 변이체를 포함한다. 두번째 단량체 또한 상기 기술된 바와 같이 그의 아미노 말단에 메티오닌을 포함한다. 두 단량체는 펩티드 링커에 의해 연결된다. 서열 번호 29의 변이체는 서열 번호 2의 변이체를 참조로 하여 상기에서 논의된 방식 중 임의의 것으로 서열 번호 29로부터 변이될 수 있다. 링커는 또한 상기에서 논의된 펩티드 링커로 변형되거나, 치환될 수 있다.

또 다른 바람직한 실시양태에서, 단량체는 화학적으로 융합된다. 두 부분이 예를 들어, 화학적 가교제를 통해 화학적으로 부착되어 있다면, 서브유닛은 효소에 화학적으로 융합된다. 상기에서 논의된 화학적 가교제 중 임의의 것이 사용될 수 있다. 링커는 본 발명의 돌연변이체 단량체로 도입된 하나 이상의 시스테인 잔기에 부착될 수 있다. 별법으로, 링커는 구축물 중 한 단량체의 말단에 부착될 수 있다.

구축물이 상이한 단량체를 포함할 경우, 방대한 과량의 단량체 중의 링커의 농도를 유지시킴으로써 단량체의 그 자신에의 가교결합을 막을 수 있다. 별법으로, 2개의 링커가 사용되는 "록(lock)" 및 "키(key)" 배열이 사용될 수 있다. 각 링커 중 단 하나의 말단만이 함께 반응하여 보다 긴 장쇄의 링커를 형성할 수 있고, 링커의 나머지 다른 한 말단은 다른 단량체와 반응한다. 상기 링커는 국제 출원 번호 PCT/GB10/000132 (공개 공보 WO 2010/086602)에 기술되어 있다.

폴리뉴클레오티드

본 발명은 또한 본 발명의 돌연변이체 단량체를 코딩하는 폴리뉴클레오티드 서열을 제공한다. 돌연변이체 단량체는 상기에서 논의된 것 중 임의의 것일 수 있다. 폴리뉴클레오티드 서열은 바람직하게 전체 서열에 걸쳐 뉴클레오티드 동일성 기준으로 서열 번호 1의 서열과 50%, 60%, 70%, 80%, 90% 또는 95% 이상 상동성인 서열을 포함한다. 300개 이상, 예를 들어, 375, 450, 525 또는 600개 이상의 연속된 뉴클레오티드로 이루어진 스트레치에 걸쳐 80% 이상, 예를 들어, 85% 이상, 90% 이상 또는 95% 이상으로 뉴클레오티드가 동일할 수 있다 ("강력한 상동성"). 상동성은 상기 기술된 바와 같이 계산될 수 있다. 폴리뉴클레오티드 서열은 유전자 코드의 축퇴성에 근거하여 서열 번호 1과 상이한 서열을 포함할 수 있다.

본 발명은 또한 본 발명의 유전자적으로 융합된 구축물 중 어느 것을 코딩하는 폴리뉴클레오티드 서열을 제공한다. 폴리뉴클레오티드는 바람직하게 상기 기술된 바와 같이 서열 번호 1에 제시된 서열 또는 그의 변이체를 2개 이상 포함한다. 폴리뉴클레오티드 서열은 바람직하게 서열 번호 28의 서열, 또는 전체 서열에 걸쳐 뉴클레오티드 동일성 기준으로 서열 번호 28의 서열과 50%, 60%, 70%, 80%, 90% 또는 95% 이상 상동성인 서열을 포함한다. 600개 이상, 예를 들어, 750, 900, 1050 또는 1,200개 이상의 연속된 뉴클레오티드로 이루어진 스트레치에 걸쳐 80% 이상, 예를 들어, 85% 이상, 90% 이상 또는 95% 이상으로 뉴클레오티드가 동일할 수 있다 ("강력한 상동성"). 상동성은 상기 기술된 바와 같이 계산될 수 있다. 폴리뉴클레오티드 서열은 유전자 코드의 축퇴성에 근거하여 서열 번호 28과 상이한 서열을 포함할 수 있다.

폴리뉴클레오티드 서열은 당업계의 표준 방법을 사용하여 유도되고 복제될 수 있다. 야생형 Msp를 코딩하는 염색체 DNA는 제조 유기체, 예컨대 미코박테리움 스메그마티스로부터 추출될 수 있다. 세공 서브유닛을 코딩하는 유전자는 특이 프라이머를 포함하는 PCR을 사용하여 증폭시킬 수 있다. 이어서, 증폭된 서열을 부위-지정 돌연변이유발에 의해 돌연변이화시킬 수 있다. 적합한 부위-지정 돌연변이유발 방법이 당업계에 공지되어 있으며, 그 예로는 예를 들어, 조합 연쇄 반응을 포함한다. 본 발명의 구축물을 코딩하는 폴리뉴클레오티드는 주지된 기법, 예컨대 문헌 [Sambrook, J. and Russell, D. (2001). Molecular Cloning: A Laboratory Manual, 3rd Edition. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY.]에 기술되어 있는 것을 사용하여 제조될 수 있다.

이어서, 생성된 폴리뉴클레오티드 서열을 재조합 복제가능한 벡터, 예컨대 클로닝 벡터 내로 도입할 수 있다. 벡터를 사용하여 적합성 숙주 세포에서 폴리뉴클레오티드를 복제할 수 있다. 따라서, 폴리뉴클레오티드 서열은 폴리뉴클레오티드를 복제가능한 벡터 내로 도입하고, 상기 벡터를 적합성 숙주 세포 내로 도입하고, 벡터를 복제시킬 수 있는 조건하에서 상기 숙주 세포를 성장시킴으로써 제조할 수 있다. 벡터를 숙주 세포로부터 회수할 수 있다. 폴리뉴클레오티드의 클로닝에 적합한 숙주 세포는 당업계에 공지되어 있고, 이는 하기에서 더욱 상세하게 기술된다.

폴리뉴클레오티드 서열은 적합한 발현 벡터로 클로닝될 수 있다. 발현 벡터에서, 폴리뉴클레오티드 서열은 전형적으로 숙주 세포에 의해 코딩 서열이 발현될 수 있도록 하는 제어 서열에 작동가능하게 연결되어 있다. 상기 발현 벡터를 사용하여 세공 서브유닛을 발현시킬 수 있다.

"작동가능하게 연결된"이라는 용어는 기술된 성분들이 그의 의도된 방식으로 기능을 할 수 있도록 허용하는 관계를 맺고 있는 병렬 배치를 의미한다. 코딩 서열에 제어 서열은 "작동가능하게 연결되어 있는" 제어 서열은 제어 서열과 적합성이 조건하에서 코딩 서열의 발현이 이루어질 수 있도록 하는 방식으로 결찰되어 있다. 동일하거나, 또는 상이한 폴리뉴클레오티드 서열의 다중 카피를 벡터 내로 도입할 수 있다.

이어서, 발현 벡터를 적합한 숙주 세포 내로 도입할 수 있다. 따라서, 본 발명의 돌연변이체 단량체 또는 구축물은 폴리뉴클레오티드 서열을 발현 벡터 내로 삽입하고, 상기 벡터를 적합성 박테리아 숙주 세포 내로 도입하고, 폴리뉴클레오티드 서열을 발현시킬 수 있는 조건하에서 상기 숙주 세포를 성장시킴으로써 제조할 수 있다. 재조합적으로 발현된 단량체 또는 구축물은 숙주 세포막에서 세공 내로 자가 조립될 수 있다. 별법으로, 상기 방식으로 제조된 재조합 세공을 숙주 세포로부터 제거하고, 또 다른 막 내로 삽입할 수 있다. 2개 이상의 상이한 서브유닛을 포함하는 세공을 제조할 때, 상이한 서브유닛이 상기 기술된 바와 같이 상이한 숙주 세포에서 별개로 발현될 수 있고, 상기 숙주 세포로부터 이를 제거하고, 별개의 막, 예컨대 토끼 세포막에서 세공 내로 조립할 수 있다.

벡터는 예를 들어, 복제 기점과 함께, 임의로는 상기 폴리뉴클레오티드 서열의 발현을 위한 프로모터와 함께, 및 임의로는 프로모터의 조절 인자와 함께 제공되는 플라스미드, 바이러스 또는 파지 벡터일 수 있다. 벡터는 하나 이상의 선별가능한 마커 유전자, 예를 들어, 테트라시클린 내성 유전자를 포함할 수 있다. 프로모터 및 다른 발현 조절 신호는 발현 벡터를 디자인하는 데 있어서 숙주 세포와 적합성을 띠는 것으로 선택될 수 있다. 전형적으로는 T7, trc , lac, ara 또는 λ_L 프로모터가 사용된다.

숙주 세포는 전형적으로 세공 서브유닛을 고수준으로 발현한다. 폴리뉴클레오티드 서열로 형질전환된 숙주 세포는 상기 세포를 형질전환시키는 데 사용되는 발현 벡터와 적합성을 띠는 것으로 선택될 것이다. 숙주 세포는 전형적으로 박테리아, 및 바람직하게는 에스케리키아 콜라이(Escherichia coli). λ DE3 용원을 포함하는 임의의 세포, 예를 들어, C41 (DE3), BL21 (DE3), JM109 (DE3), B834 (DE3), TUNER, Origami 및 Origami B는 T7 프로모터를 포함하는 벡터를 발현시킬 수 있다. 상기 열거된 조건 이외에도, 문헌 [Proc Natl Acad Sci U S A. 2008 Dec 30;105(52):20647-52]에서 인용된 방법 중 임의의 것이 Msp 단백질을 발현시키는 데 사용될 수 있다.

세공

본 발명은 또한 다양한 세공을 제공한다. 본 발명의 세공은 상이한 뉴클레오티드들 간을 고감도로 판별할 수 있기 때문에 핵산 서열의 특징을 규명하는 데, 예컨대 서열분석하는 데 이상적이다. 놀랍게도 세공은 DNA 및 RNA의 4가지 뉴클레오티드들을 구별해 낼 수 있다. 본 발명의 세공은 심지어 메틸화된 및 메틸화되지 않은 뉴클레오티드들을 구별해 낼 수 있다. 놀랍게도 본 발명의 세공에 대한 기본 해상도는 높다. 세공은 4가지 DNA 뉴클레오티드 모두를 거의 완전하게 분리해낼 수 있는 것으로 보인다. 세공은 추가로 세공에서의 체류 시간 및 세공을 통해 유동하는 전류에 근거하여 데옥시시티딘 모노포스페이트 (dCMP) 및 메틸-dCMP을 판별해 낸다.

본 발명의 세공은 또한 다양한 조건하에서 상이한 뉴클레오티드들을 판별해낼 수 있다. 특히, 세공은 핵산의 특징을 규명하는 데, 예컨대 서열분석하는 데 바람직한 조건하에서 뉴클레오티드들을 판별해낼 것이다. 본 발명의 세공이 상이한 뉴클레오티드들을 판별해낼 수 있는 판별 정도는 적용 전위, 염 농도, 완충제, 온도 및 첨가제, 예컨대 우레아, 베타인 및 DTT의 존재 여부를 변경함으로써 조절될 수 있다. 이를 통해 세공의 기능은 미세 조정될 수 있고, 특히 서열분석시에 그러하다. 이는 하기에서 더욱 상세하게 논의된다. 본 발명의 세공은 또한 뉴클레오티드별로 하나씩 하는 것에 기초하는 것보다는 하나 이상의 단량체와의 상호작용으로부터 핵산 중합체를 확인하는 데 사용될 수 있다.

본 발명의 세공은 단리될 수 있거나, 실질적으로 단리될 수 있거나, 정제될 수 있거나, 또는 실질적으로 정제될 수 있다. 본 발명의 세공에 임의의 다른 성분, 예컨대 지질 또는 다른 세공이 완전하게 존재하지 않는다면, 이는 단리 또는 정제된 것이다. 세공이 그의 의도된 용도를 방해하지 않는 담체 또는 희석제와 함께 혼합되어 있다면, 이는 실질적으로 단리되어 있는 것이다. 예를 들어, 세공이 10% 미만, 5% 미만, 2% 미만 또는 1% 미만으로 다른 성분, 예컨대 지질 또는 다른 세공을 포함하는 형태로 나타난다면, 이는 실질적으로 단리된 것이거나, 또는 실질적으로 정제된 것이다. 별법으로, 본 발명의 세공은 지질 이중층에 존재할 수 있다.

본 발명의 세공은 개별 또는 단일 세공으로서 존재할 수 있다. 별법으로, 본 발명의 세공은 2개 이상의 세공으로 이루어진 동종성 또는 이종성 집단으로 존재할 수 있다.

동종올리고머 세공

본 발명은 또한 본 발명의 동일한 돌연변이체 단량체를 포함하는, Msp로부터 유래된 동종올리고머 세공을 제공한다. 동종올리고머 세공은 바람직하게 표 1, 2 및 3에 제시되어 있는 돌연변이체 중 하나를 포함한다. 본 발명의 동종올리고머 세공은 핵산의 특징을 규명하는 데, 예컨대 서열분석하는 데 이상적이다. 본 발명의 동종올리고머 세공은 상기 논의된 장점들 중 임의의 것을 가질 수 있다. 본 발명의 구체적인 동종올리고머 세공이 가지는 장점은 표 1, 2 및 3에 명시되어 있다.

동종올리고머 세공은 임의의 개수의 돌연변이체 단량체를 포함할 수 있다. 세공운 전형적으로 7, 8, 9 또는 10개의 동일한 돌연변이체 단량체를 포함한다. 세공은 바람직하게 8개의 동일한 돌연변이체 단량체를 포함한다. 바람직하게는 상기에서 논의된 바와 같이 하나 이상, 예컨대 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 돌연변이체 단량체는 화학적으로 변형된 것이다.

세공을 제조하는 방법은 하기에서 더욱 상세하게 논의된다.

이종올리고머 세공

본 발명은 또한 본 발명의 1개 이상의 돌연변이체 단량체를 포함하며, 여기서 8개의 단량체 중 1개 이상은 나머지 다른 단량체와 상이한 것인, Msp로부터 유래된 이종올리고머 세공을 제공한다. 본 발명의 이종올리고머 세공은 핵산의 특징을 규명하는 데, 예컨대 서열분석하는 데 이상적이다. 이종올리고머 세공은 당업계에 공지된 방법을 사용하여 제조될 수 있다 (예컨대 문헌 [Protein Sci. 2002 Jul;11(7): 1813-24]).

이종올리고머 세공은 세공을 형성하는 데 충분한 개수의 단량체를 포함한다. 단량체는 임의의 유형일 수 있다. 세공은 전형적으로 7, 8, 9 또는 10개의 단량체를 포함한다. 세공은 바람직하게 8개의 단량체를 포함한다.

세공은 본 발명의 돌연변이체 단량체에 필요한 돌연변이를 포함하지 않는 (a) 서열 번호 2에 제시된 서열, 또는 (b) 그의 변이체를 포함하는 1개 이상의 단량체를 포함할 수 있다. 적합한 변이체는 상기에서 논의된 바 있다. 본 실시양태에서, 나머지 단량체는 바람직하게 본 발명의 돌연변이체 단량체이다. 그러므로, 세공은 본 발명의 돌연변이체 단량체를 9, 8, 7, 6, 5, 4, 3, 2 또는 1개 포함할 수 있다.

바람직한 실시양태에서, 세공은 (a) 1개의 돌연변이체 단량체 및 (b) 7개의 동일한 단량체를 포함하는데, 여기서 (a)의 돌연변이체 단량체는 (b)의 동일한 단량체와 상이한 것이다. (b)의 동일한 단량체는 바람직하게는 본 발명의 돌연변이체 단량체에 존재하는 돌연변이를 포함하지 않는 (i) 서열 번호 2에 제시된 서열, 또는 (ii) 그의 변이체를 포함한다.

바람직한 세공은 하기 중 임의의 것을 포함하나, 이에 한정되지 않는다:

(a) 서열 번호 2에 제시된 서열을 포함하는 7개의 단량체, 및 치환 N90R, N90K, N90Y, N90Q, N90W 또는 N90C를 포함하는 1개의 돌연변이체 단량체. 이러한 세공은 단일의 입체구조적 아미노산 (Y 또는 W), 단일의 하전된 아미노산 (K 또는 R) 또는 내부 협착부 내로 도입된 단일의 반응성 아미노산 (C)을 가진다.

(b) 서열 번호 2에 제시된 서열을 포함하는 7개의 단량체, 및 치환 N91R, N91K, N91Y, N91Q, N91W 또는 N91C를 포함하는 1개의 돌연변이체 단량체. 이러한 세공은 단일의 입체구조적 아미노산 (Y 또는 W), 단일의 하전된 아미노산 (K 또는 R) 또는 내부 협착부 내로 도입된 단일의 반응성 아미노산 (C)을 가진다.

(c) 서열 번호 2에 제시된 서열을 포함하는 7개의 단량체, 및 치환 L88C, S103C 또는 I105C를 포함하는 1개의 돌연변이체 단량체. 이러한 세공은 세공 내로 도입된 반응성 아미노산을 가진다.

또 다른 바람직한 실시양태에서, 단량체들 모두 (즉, 10, 9, 8 또는 7개의 단량체) 본 발명의 돌연변이체 단량체이고, 그 중 1개 이상은 나머지 다른 단량체와 상이한 것이다. 더욱 바람직한 실시양태에서, 세공은 본 발명의 8개의 돌연변이체 단량체를 포함하고, 그 중 1개 이상은 나머지 다른 단량체와 상이한 것이다.

상기 논의된 모든 실시양태에서, 하나 이상, 예컨대 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 돌연변이체 단량체는 바람직하게 상기에서 논의된 바와 같이 화학적으로 변형된 것이다. 상기의 바람직한 세공 (a) 내지 (c)는 바람직하게 도입된 시스테인 중 하나 이상에의 분자의 부착에 의해 화학적으로 변형된 것이다.

세공을 제조하는 방법은 하기에서 더욱 상세하게 논의된다.

구축물-함유 세공

본 발명은 또한 본 발명의 구축물을 1개 이상 포함하는 세공을 제공한다. 본 발명의 구축물은 Msp로부터 유래된, 2개 이상의 공유적으로 부착된 단량체를 포함한다. 다시 말해, 구축물은 1개 초과의 단량체를 포함하여야 한다. 세공은 세공을 형성하는 데 충분한 개수의 구축물, 및 필요할 경우, 단량체를 포함한다. 예를 들어, 팔량체 세공은 (a) 각각이 4개의 단량체를 포함하는 것인 2개의 구축물, 또는 (b) 2개의 단량체를 포함하는 1개의 구축물과, 구축물의 일부를 형성하지 않는 6개의 단량체를 포함할 수 있다. 세공 중 2개 이상의 단량체가 본 발명의 구축물 형태를 띤다. 단량체는 임의의 유형일 수 있다. 세공은 전형적으로 총 7, 8, 9 또는 10개의 단량체를 포함한다 (이중 2개 이상이 구축물 중에 존재하여야 한다). 세공은 바람직하게 8개의 단량체를 포함한다 (이중 2개 이상이 구축물 중에 존재하여야 한다).

세공은 전형적으로 (a) 2개의 단량체를 포함하는 1개의 구축물과, (b) 5, 6, 7 또는 8개의 단량체를 포함한다. 구축물은 상기에서 논의된 것 중 임의의 것일 수 있다. 단량체는 본 발명의 돌연변이체 단량체를 비롯한, 상기에서 논의된 것 중 임의의 것일 수 있다.

또 다른 전형적인 세공은 1개 초과의 본 발명의 구축물, 예컨대 2, 3, 또는 4개의 본 발명의 구축물을 포함한다. 상기 세공은 추가로 세공을 형성하는 충분한 개수의 단량체를 포함한다. 단량체는 상기에서 논의된 것 중 임의의 것일 수 있다. 본 발명의 추가의 세공은 2개의 단량체를 포함하는 단 1개의 구축물을 포함하고, 예를 들어, 세공은 2개의 단량체를 포함하는 4, 5, 6, 7 또는 8개의 구축물을 포함할 수 있다. 본 발명에 따른 구체적인 세공은 각각이 2개의 단량체를 포함하는 것인 4개의 구축물을 포함한다. 구축물은 구축물의 단 하나의 단량체만이 세공의 베럴 또는 전정부에 기여하도록 하는 구조를 가진 세공으로 올리고머화될 수 있다. 전형적으로, 구축물의 나머지 다른 단량체는 세공의 베럴 또는 전정부의 바깥쪽에 위치할 것이다. 예를 들어, 본 발명의 세공은 베럴 또는 전정부가 8개의 단량체를 포함하는 것인, 2개의 단량체를 포함하는 5, 6, 7 또는 8개의 구축물을 포함할 수 있다.

상기 기술된 바와 같이, 돌연변이가 구축물 내로 도입될 수 있다. 돌연변이는 교대로 있을 수 있고, 즉, 2개의 단량체를 포함하는 구축물 내에서 돌연변이는 각 단량체에 대해 상이하며, 구축물은 동종올리고머로서 조립되어 교대 변형을 형성할 수 있다. 다시 말해, MutA 및 MutB를 포함하는 단량체가 융합되고 조립됨으로써 A-B:A-B:A-B:A-B 세공을 형성한다. 별법으로, 이웃해 있을 수 있고, 즉, 동일한 돌연변이가 구축물 중 2개의 단량체 내로 도입되고, 이어서, 상이한 돌연변이체 단량체로 올리고머화된다. 다시 말해, MutA를 포함하는 단량체가 융합된 후, MutB 함유 단량체와 올리고머화하여 A-A:B:B:B:B:B:B를 형성한다.

구축물을 함유하는 세공 중 하나 이상의 본 발명의 단량체는 상기에서 논의된 바와 같이 화학적으로 변형될 수 있다.

개별 뉴클레오티드를 확인하는 방법

본 발명은 또한 개별 뉴클레오티드의 특징을 규명하는 방법을 제공한다. 본 방법은 뉴클레오티드를 본 발명의 세공과 접촉시켜 뉴클레오티드가 세공과 상호작용하도록 하는 단계, 및 상호작용하는 동안 세공을 통해 통과하는 전류를 측정하는 단계, 및 이로써 뉴클레오티드의 특징을 규명하는 단계를 포함한다. 그러므로, 본 발명은 개별 뉴클레오티드의 나노세공 감지를 포함한다. 본 발명은 또한 상호작용하는 동안 세공을 통해 통과하는 전류를 측정하는 단계, 및 이로써 뉴클레오티드의 정체를 확인하는 단계를 포함하는, 개별 뉴클레오티드를 확인하는 방법을 제공한다. 본 발명의 세공 중 임의의 것이 사용될 수 있다. 본 발명의 세공은 바람직하게 상기에서 논의된 바와 같이 분자 어댑터로 화학적으로 변형된다.

전류가 뉴클레오티드에 대해 특이적인 방식으로 세공을 통해 유동한다면 (즉, 뉴클레오티드와 관련된 독특한 전류가 세공을 통해 유동하는 것이 검출된다면), 그 뉴클레오티드는 존재하는 것이다. 전류가 뉴클레오티드에 대해 특이적인 방식으로 세공을 통해 유동하지 않는다면, 그 뉴클레오티드는 존재하지 않는 것이다.

본 발명은 세공을 통해 통과하는 전류에 미치는 상이한 효과에 근거하여 유사한 구조를 가지는 뉴클레오티드를 구별하는 데 사용될 수 있다. 개별 뉴클레오티드는 그가 세공과 상호작용할 때, 그의 전류 진폭으로부터 단일 분자로 확인될 수 있다. 본 발명은 또한 샘플 중 특정의 뉴클레오티드가 존재하는지 여부를 측정하는 데 사용될 수 있다. 본 발명은 또한 샘플 중 특정 뉴클레오티드의 농도를 측정하는 데 사용될 수 있다.

본 발명은 본 발명의 세공이 막 내로 삽입되어 있는 임의의 적합한 막/세공 시스템을 사용하여 수행될 수 있다. 본 방법은 전형적으로 (i) 본 발명의 세공을 포함하는 인공막, (ii) 본 발명의 세공을 포함하는, 단리된, 천연적으로 발생된 막, 또는 (iii) 본 발명에 따라 변형된 세공을 발현하는 세포를 사용하여 수행될 수 있다. 본 방법은 바람직하게 인공막을 사용하여 수행된다. 상기 막은 본 발명의 세공 이외에도, 다른 막횡단 및/또는 막내 단백질 뿐만 아니라, 다른 분자를 포함할 수 있다.

막은 이온, 뉴클레오티드 및 핵산의 유동을 막는 장벽을 형성한다. 임의의 막이 본 발명에 따라 사용될 수 있다. 적합한 막은 당업계에 주지되어 있다. 막 은 바람직하게 양친매성 층이다. 양친매성 층은 친수성 및 친유성 특성 둘 모두를 가지는 양친매성 분자, 예컨대 인지질로부터 형성된 층이다. 양친매성 물질은 합성 또는 천연적으로 발생된 것일 수 있다. 양친매성 층은 단층 또는 이중층일 수 있다. 비천연적으로 발생된 양친매성 물질 및 단층을 형성하는 양친매성 물질은 당업계에 공지되어 있고, 예를 들어, 블록 공중합체를 포함한다 (문헌 [Gonzalez-Perez et al., Langmuir, 2009, 25, 10447-10450]).

막은 지질 이중층일 수 있다. 본 발명에 따라 사용하기에 적합한 지질 이중층은 당업계에 공지되어 있는 방법을 사용하여 제조될 수 있다. 예를 들어, 지질 이중층 막은 문헌 [Montal and Mueller (1972)]의 방법을 사용하여 형성될 수 있다. 지질 이중층은 또한 국제 출원 번호 PCT/GB08/000563에 기술되어 있는 방법을 사용하여 형성될 수도 있다.

본 발명의 방법은 인지질, 당지질, 콜레스테롤, 미콜산 및 그의 혼합물을 포함하나, 이에 한정되지 않는 임의의 막 지질로부터 형성된 지질 이중층을 사용하여 수행될 수 있다. 국제 출원 번호 PCT/GB08/000563에 기술된 지질 중 임의의 것이 사용될 수 있다.

또 다른 바람직한 실시양태에서, 막은 고상 층이다. 고상 층은 생물학적 기원의 것은 아니다. 다시 말해, 고상 층은 생물학적 환경, 예컨대 유기체 또는 세포로부터 유래되거나, 단리되거나 한 것이 아니거나, 또는 합성적으로 제조된, 생물학상 이용가능한 구조체이다. 고상 층은 마이크로전자 물질, 절연체, 예컨대 Si₃N₄, Al₂O₃, 및 SiO, 유기 및 무기 중합체, 예컨대 폴리아미드, 플라스틱, 예컨대 테플론(Teflon)® 또는 엘라스토머, 예컨대 제2성분 부가 경화형 실리콘 고무, 및 유리를 포함하나, 이에 한정되지 않는, 유기 및 무기 물질 둘 모두로부터 형성될 수 있다. 고상 층은 단원자 층, 예컨대 그래핀, 또는 단지 몇 안되는 원자 두께를 가지는 층으로부터 형성될 수 있다. 적합한 그래핀 층은 국제 출원 번호 PCT/US2008/010637 (공개 공보 WO 2009/035647)에 개시되어 있다. 양친매성 층은 고상 세공 건너편에 형성될 수 있다. 이는 하이브리드 세공 형성으로서 기술되어 있다 (문헌 [Hall et al., Nat Nanotechnol., 2010, 5, 874-877]).

세공을 막, 예컨대 지질 이중층 내로 삽입하는 방법은 당업계에 공지되어 있다. 예를 들어, 세공이 지질 이중층으로 확산되고, 지질 이중층에 의해 결합 및 기능적 상태로의 조립에 의해 삽입될 수 있도록 지질 이중층을 함유하는 용액 중에 세공을 정제된 형태로 현탁시킬 수 있다. 별법으로, 문헌 [M.A. Holden, H. Bayley. J. Am. Chem. Soc. 2005, 127, 6502-6503] 및 국제 출원 번호 PCT/GB2006/001057 (공개 공보 WO 2006/100484)에 기술되어 있는 "픽 앤 플레이스(pick and place)" 방법을 사용하여 세공을 직접 막 내로 삽입시킬 수 있다.

본 발명의 방법은 전형적으로는 시험관내에서 수행된다.

개별 뉴클레오티드

개별 뉴클레오티드는 단일의 뉴클레오티드이다. 개별 뉴클레오티드는 뉴클레오티드 결합에 의해 또 다른 뉴클레오티드 또는 핵산에 결합되어 있지 않은 것이다. 뉴클레오티드 결합은 또 다른 뉴클레오티드의 당 기에 결합되는 한 뉴클레오티드의 포스페이트 기 중 하나를 포함한다. 개별 뉴클레오티드는 전형적으로 5개 이상, 10개 이상, 20개 이상, 50개 이상, 100개 이상, 200개 이상, 500개 이상, 1,000개 이상, 또는 5,000개 이상의 뉴클레오티드로 이루어진, 뉴클레오티드 결합에 의해 또 다른 핵산 서열에 결합되어 있지 않은 것이다. 예를 들어, 개별 뉴클레오티드는 표적 폴리뉴클레오티드 서열, 예컨대 DNA 또는 RNA 가닥으로부터 분해된 것이다.

본 발명의 방법은 임의의 뉴클레오티드를 확인하는 데 사용될 수 있다. 뉴클레오티드는 천연적으로 발생된 것이거나, 인공의 것일 수 있다. 뉴클레오티드는 전형적으로 뉴클레오염기, 당, 및 1개 이상의 포스페이트 기를 포함한다. 뉴클레오염기는 전형적으로 헤테로시클릭이다. 적합한 뉴클레오염기는 퓨린 및 피리미딘을 포함하고, 더욱 구체적으로는 아데닌, 구아닌, 티민, 우라실 및 시토신을 포함한다. 당은 전형적으로 5탄당이다. 적합한 당은 리보스 및 데옥시리보스를 포함하나, 이에 한정되지 않는다. 뉴클레오티드는 전형적으로 리보뉴클레오티드 또는 데옥시리보뉴클레오티드이다. 뉴클레오티드는 전형적으로 모노포스페이트, 디포스페이트 또는 트리포스페이트를 포함한다.

적합한 뉴클레오티드는 아데노신 모노포스페이트 (AMP), 아데노신 디포스페이트 (ADP), 아데노신 트리포스페이트 (ATP), 구아노신 모노포스페이트 (GMP), 구아노신 디포스페이트 (GDP), 구아노신 트리포스페이트 (GTP), 티미딘 모노포스페이트 (TMP), 티미딘 디포스페이트 (TDP), 티미딘 트리포스페이트 (TTP), 우리딘 모노포스페이트 (UMP), 우리딘 디포스페이트 (UDP), 우리딘 트리포스페이트 (UTP), 시티딘 모노포스페이트 (CMP), 시티딘 디포스페이트 (CDP), 시티딘 트리포스페이트 (CTP), 시클릭 아데노신 모노포스페이트 (cAMP), 시클릭 구아노신 모노포스페이트 (cGMP), 데옥시아데노신 모노포스페이트 (dAMP), 데옥시아데노신 디포스페이트 (dADP), 데옥시아데노신 트리포스페이트 (dATP), 데옥시구아노신 모노포스페이트 (dGMP), 데옥시구아노신 디포스페이트 (dGDP), 데옥시구아노신 트리포스페이트 (dGTP), 데옥시티미딘 모노포스페이트 (dTMP), 데옥시티미딘 디포스페이트 (dTDP), 데옥시티미딘 트리포스페이트 (dTTP), 데옥시우리딘 모노포스페이트 (dUMP), 데옥시우리딘 디포스페이트 (dUDP), 데옥시우리딘 트리포스페이트 (dUTP), 데옥시시티딘 모노포스페이트 (dCMP), 데옥시시티딘 디포스페이트 (dCDP) 및 데옥시시티딘 트리포스페이트 (dCTP)를 포함하나, 이에 한정되지 않는다. 뉴클레오티드는 바람직하게 AMP, TMP, GMP, UMP, dAMP, dTMP, dGMP 또는 dCMP이다.

뉴클레오티드는 핵산 서열, 예컨대 리보핵산 (RNA) 또는 데옥시리보핵산의 분해로부터 유도될 수 있다. 핵산 서열은 당업계에 공지된 임의의 방법을 사용하여 분해될 수 있다. 적합한 방법은 효소 또는 촉매를 사용하는 것을 포함하나, 이에 한정되지 않는다. 핵산의 촉매적 분해는 문헌 [Deck et al., Inorg. Chem, 2002; 41: 669-677]에 개시되어 있다.

핵산 전체 또는 그 일부의 서열을 분석하기 위하여 단일의 핵산 서열로부터의 개별 뉴클레오티드를 순차적인 방식으로 세공과 접촉시킬 수 있다. 핵산 서열분석은 하기에서 더욱 상세하게 논의된다.

예컨대 뉴클레오티드가 핵산 서열의 분해로부터 유도된 것인 경우, 뉴클레오티드는 전형적으로 변형되지 않은 것이다. 별법으로, 뉴클레오티드는 변형되거나, 손상된 것일 수 있다. 뉴클레오티드는 전형적으로 메틸화되거나, 산화된 것이다. 뉴클레오티드는 시현용 표지로 표지화될 수 있다. 시현용 표지는 뉴클레오티드가 검출될 수 있도록 하는데 적합한 임의의 표지일 수 있다. 적합한 표지로는 형광성 분자, 방사성 동위 원소, 예컨대 ¹²⁵I, ³⁵S, 및 링커, 예컨대 비오틴을 포함한다.

뉴클레오티드는 전형적으로 임의의 적합한 생물학적 샘플 중에 존재한다. 적합한 생물학적 샘플은 상기에서 논의된 것이다.

세공과 뉴클레오티드 사이의 상호작용

뉴클레오티드를 막 양측의 세공과 접촉시킬 수 있다. 뉴클레오티드를 막 양측의 세공에 도입시킬 수 있다. 뉴클레오티드가 세공을 통해 막의 나머지 다른 한쪽으로 통과할 수 있도록 허용하는 막의 한 측과 뉴클레오티드를 접촉시킬 수 있다. 예를 들어, 뉴클레오티드가 세공을 통해 통과할 수 있도록 그의 천연 환경하에서 이온 또는 소형 분자, 예컨대 뉴클레오티드가 세공의 베럴 또는 채널 내로 유입될 수 있도록 허용하는 세공의 한쪽 단부와 뉴클레오티드를 접촉시킨다. 상기와 같은 경우, 뉴클레오티드는 세공의 베럴 또는 채널을 통해 막을 통과함에 따라 세공 및/또는 어댑터와 상호작용하게 된다. 별법으로, 뉴클레오티드가 어댑터를 통해 또는 그와 함께 세공과 상호작용하고, 세공으로부터 해리되고, 막의 같은 측면 상에 남아있을 수 있도록 막의 한 측면과 접촉시킬 수 있다. 본 발명은 어댑터의 위치가 고정되어 있는 것인 세공을 제공한다. 그 결과, 뉴클레오티드는 바람직하게 어댑터가 뉴클레오티드와 상호작용할 수 있도록 허용하는 세공의 단부과 접촉한다.

뉴클레오티드는 임의의 방식으로 임의의 부위에서 세공과 상호작용할 수 있다. 상기에서 논의된 바와 같이, 뉴클레오티드는 바람직하게 어댑터를 통해 또는 그와 함께 세공에 가역적으로 결합한다. 가장 바람직하게 뉴클레오티드는 막을 가로질로 세공을 통해 통과함에 따라 어댑터를 통해 또는 그와 함께 세공에 가역적으로 결합한다. 뉴클레오티드는 또한 막을 가로질로 세공을 통해 통과함에 따라 어댑터를 통해 또는 그와 함께 세공의 베럴 또는 채널에 가역적으로 결합할 수 있다.

뉴클레오티드와 세공이 상호작용하는 동안, 뉴클레오티드는 상기 뉴클레오티드에 특이적인 방식으로 세공을 통해 유동하는 전류에 영향을 미친다. 예를 들어, 특정 뉴클레오티드는 특정의 평균 시간 동안 특정 정도로까지 세공을 통해 유동하는 전류를 감소시킬 것이다. 다시 말해, 세공을 통해 유동하는 전류는 특정 뉴클레오티드에 독특한 것이다. 특정 뉴클레오티드가 세공을 통해 유동하는 전류에 대해 미치는 효과를 측정하기 위해 대조군 실험을 수행할 수 있다. 이어서, 샘플 중에 특정 뉴클레오티드를 확인하기 위해, 또는 특정 뉴클레오티드가 샘플 중에 존재하는지 여부를 측정하기 위해 본 발명의 방법을 수행하여 얻은 시험 샘플에 대한 결과를 상기 대조군 실험으로부터 유도된 것과 비교할 수 있다. 특정 뉴클레오티드임을 나타내는 방식으로 세공을 통해 유동하는 전류가 영향을 받는 빈도를 사용하여 샘플 중의 상기 뉴클레오티드의 농도를 측정할 수 있다. 샘플 내의 상이한 뉴클레오티드의 비 또한 계산할 수 있다. 예를 들어, dCMP 대 메틸-dCMP의 비를 계산할 수 있다.

장치

본 방법은 본 발명의 세공이 막 내로 삽입되어 있는 막/세공 시스템을 조사하는 데 적합한 임의의 장치를 사용함으로써 수행될 수 있다. 본 방법은 나노세공 감지에 적합한 임의의 장치를 사용함으로써 수행될 수 있다. 예를 들어, 본 장치는 수용액을 포함하는 챔버, 및 챔버를 두 섹션으로 분리하는 장벽을 포함한다. 장벽은 세공을 포함하는 막이 형성되는 곳에 개구부를 가진다. 뉴클레오티드를 챔버 내로 도입함으로써 뉴클레오티드를 세공과 접촉시킬 수 있다. 뉴클레오티드를 챔버의 두 섹션 중 하나로 도입할 수 있다.

본 방법은 국체 출원 번호 PCT/GB08/000562에 기술되어 있는 장치를 사용함으로써 수행될 수 있다.

본 발명의 방법은 뉴클레오티드와의 상호작용 동안 세공을 통과하는 전류를 측정하는 단계를 포함한다. 따라서, 본 장치는 또한 전위를 적용할 수 있고, 막 및 세공을 가로지르는 전기 신호를 측정할 수 있는 전기 회로를 포함한다. 본 방법은 패치 클램프 또는 전압 클램프를 사용함으로써 수행될 수 있다. 본 방법은 바람직하게 전압 클램프를 사용하는 것을 포함한다.

샘플

뉴클레오티드는 임의의 적합한 샘플 중에 존재한다. 본 발명은 전형적으로 뉴클레오티드를 함유하거나, 함유할 것으로 의심되는 것으로 알려져 있는 샘플에 대해 수행된다. 본 발명은 그의 정체가 알려져 있지 않은 하나 이상의 뉴클레오티드를 함유하는 샘플에 대해 수행될 수 있다. 별법으로, 본 발명은 샘플 중에 그가 존재하는 것으로 알려져 있거나, 그러할 것으로 기대되는 하나 이상의 뉴클레오티드의 정체를 확인하기 위해 샘플에 대해 수행될 수 있다.

샘플은 생물학적 샘플일 수 있다. 본 발명은 임의의 유기체 또는 미생물로부터 수득되거나, 그로부터 추출된 샘플에 대해 시험관내에서 수행될 수 있다. 유기체 또는 미생물은 전형적으로 원핵생물 또는 진핵생물이고, 이는 전형적으로 5개의 생물계: 식물계, 동물계, 진균계, 모네라계 및 원생생물계 중 하나에 속한다. 본 발명은 임의의 바이러스로부터 수득되거나, 그로부터 추출된 샘플에 대해 시험관내에서 수행될 수 있다. 샘플은 바람직하게 유체 샘플이다. 샘플은 전형적으로 환자의 체액을 포함한다. 샘플은 뇨, 림프액, 타액, 점액 또는 양수일 수 있지만, 바람직하게는 혈액, 혈장 또는 혈청이다. 전형적으로, 샘플은 인간 기원의 것이지만, 별법으로는 또 다른 포유동물로부터 유래된 것, 예컨대 상업상의 사육 동물, 예컨대 말, 소, 양 또는 돼지로부터 유래된 것일 수 있거나, 별법으로, 애완동물, 예컨대 고양이 또는 개일 수 있다. 별법으로, 식물 기원의 샘플은 전형적으로 상업 작물, 예컨대 시리얼, 콩과 식물, 과일, 또는 야채, 예를 들어, 밀, 보리, 귀리, 카놀라, 옥수수, 콩, 벼, 바나나, 사과, 토마토, 감자, 포도, 담배, 콩류, 렌틸, 사탕수수, 코코아, 목화, 홍차, 커피로부터 수득된다.

샘플은 비-생물학적 샘플일 수 있다. 비-생물학적 샘플은 바람직하게 유체 샘플이다. 비-생물학적 샘플의 예로는 수술 유체, 물, 예컨대 식수, 해수 또는 강물, 및 실험실 시험용 시약을 포함한다.

샘플은 전형적으로 검정되기 전에 예를 들어, 원심분리에 의해 또는 원치않는 분자 또는 세포, 예컨대 적혈구를 걸러내는 막을 통해 통과시킴으로써 프로세싱된다. 샘플은 채취 즉시 측정될 수 있다. 샘플은 또한 전형적으로는 검정 이전에 바람직하게는 -70℃ 미만의 온도에서 보관될 수 있다.

조건

본 발명의 방법은 뉴클레오티드와의 상호작용 동안 세공을 통과하는 전류를 측정하는 단계를 포함한다. 막횡단 단백질 세공을 통과하는 이온 전류를 측정하는 데 적합한 조건은 당업계에 공지되어 있고, 실시예에 개시되어 있다. 본 방법은 막 및 세공을 가로질러 적용되는 전압을 사용하여 수행된다. 사용 전압은 전형적으로 -400 mV 내지 +400 mV이다. 사용 전압은 바람직하게는 하한이 -400 mV, -300 mV, -200 mV, -150 mV, -100 mV, -50 mV, -20 mV 및 0 mV로부터 선택되고, 상한은 독립적으로 +10 mV, +20 mV, +50 mV, +100 mV, +150 mV, +200 mV, +300 mV 및 +400 mV로부터 선택되는 범위의 값이다. 사용 전압은 더욱 바람직하게는 100 mV 내지 240 mV 범위이고, 가장 바람직하게는 160 mV 내지 240 mV 범위이다. 증가된 적용 전위를 사용함으로써 본 발명에 의해 상이한 뉴클레오티드 간의 판별을 증가시킬 수 있다.

본 방법은 전형적으로 임의의 알칼리 금속 클로라이드 염의 존재하에서 수행된다. 상기에서 논의된 예시적인 장치에서, 염은 챔버 중 수용액 중에 존재한다. 전형적으로 염화칼륨 (KCl), 염화나트륨 (NaCl) 또는 염화세슘 (CsCl)이 사용된다. KCl이 바람직하다. 염 농도는 전형적으로 0.1 내지 2.5 M, 0.3 내지 1.9 M, 0.5 내지 1.8 M, 0.7 내지 1.7 M, 0.9 내지 1.6 M 또는 1 M 내지 1.4 M이다. 염 농도는 바람직하게 150 mM 내지 1 M이다. 고염 농도가 높은 신호 대 노이즈 비를 제공하고, 그러한 고염 농도를 통해 뉴클레오티드의 존재를 나타내는 전류를 표준 전류 파동의 배경으로부터 확인할 수 있다. 저염 농도는 뉴클레오티드 검출이 효소의 존재하에서 수행되는 경우, 예컨대 핵산을 서열분석할 때 사용될 수 있다. 이러한 내용은 하기에서 더욱 상세하게 논의된다.

본 방법은 전형적으로 완충제의 존재하에서 수행된다. 상기에서 논의된 예시적인 장치에서, 완충제는 챔버 중 수용액 중에 존재한다. 본 발명의 방법에서 임의의 완충제가 사용될 수 있다. 한 적합한 완충제는 트리스-HCl 완충제이다. 본 방법은 전형적으로 pH 4.0 내지 12.0, 4.5 내지 10.0, 5.0 내지 9.0, 5.5 내지 8.8, 6.0 내지 8.7 또는 7.0 내지 8.8 또는 7.5 내지 8.5에서 수행된다. 사용되는 pH는 바람직하게 약 7.5이다.

본 방법은 전형적으로 0℃ 내지 100℃, 15℃ 내지 95℃, 16℃ 내지 90℃, 17℃ 내지 85℃, 18℃ 내지 80℃, 19℃ 내지 70℃, 또는 20℃ 내지 60℃에서 수행된다. 본 방법은 실온에서 수행될 수 있다. 본 방법은 바람직하게 효소 기능을 지원하는 온도, 예컨대 약 37℃에서 수행된다.

핵산의 특징을 규명하는 방법

본 발명은 또한 표적 핵산 서열의 특징을 규명하는 방법을 제공한다. 표적 핵산 서열의 하나 이상의 특징이 측정될 수 있다. 본 방법은 표적 핵산 서열의 2, 3, 4, 또는 5개 이상의 특징을 측정하는 것을 포함한다. 하나 이상의 특징은 바람직하게 (i) 표적 핵산 서열의 길이 (ii) 표적 핵산 서열의 정체, (iii) 표적 핵산 서열의 서열, (iv) 표적 핵산 서열의 2차 구조 및 (v) 표적 핵산 서열의 변형 여부로부터 선택된다. 본 발명에 따라 (i) 내지 (v)의 임의의 조합이 측정될 수 있다.

(i)의 경우, 핵산 서열의 길이는 표적 핵산 서열과 세공 사이의 상호작용수를 사용하여 측정될 수 있다.

(ii)의 경우, 핵산 서열의 정체는 여러 가지 방법으로 측정될 수 있다. 핵산 서열의 정체는 표적 핵산 서열의 서열 측정과 함께, 또는 표적 핵산 서열의 서열 측정없이 측정될 수 있다. 전자의 경우가 간단한데; 핵산을 서열분석함으로써 확인된다. 후자의 경우는 여러 방법으로 수행될 수 있다. 예를 들어, (폴리뉴클레오티드의 남은 서열을 측정하지 않고) 핵산 서열 중 특정 모티프의 존재를 측정할 수 있다. 별법으로, 본 방법에서 특정의 전기 신호를 측정함으로써 표적 핵산 서열은 특정의 근원으로부터 생겨나는 것임을 확인할 수 있다.

(iii)의 경우, 핵산 서열의 서열은 앞서 기술된 바와 같이 측정될 수 있다. 적합한 서열분석 방법, 특히, 전기 측정을 사용하는 것은 문헌 [Stoddart D et al., Proc Natl Acad Sci, 12;106(19):7702-7], [Lieberman KR et al, J Am Chem Soc. 2010;132(50):17961-72], 및 국체 출원 WO 2000/28312에 기술되어 있다.

(iv)의 경우, 2차 구조는 다양한 방법으로 측정될 수 있다. 예를 들어, 2차 구조는 체류 시간 변화 또는 세공을 통해 유동하는 전류의 변화를 사용함으로써 측정될 수 있다.

본 발명은 또한 표적 핵산 서열의 서열을 추정하는 방법을 제공한다. 본 발명은 추가로 표적 핵산 서열의 서열분석 방법을 제공한다.

핵산은 2개 이상의 뉴클레오티드를 포함하는 거대분자이다. 뉴클레오티드는 상기에서 논의된 것 중 임의의 것일 수 있다.

한 실시양태에서, 본 방법은 (a) 표적 서열을 본 발명의 세공 및 핵산 결합 단백질과 접촉시켜, 상기 단백질이 세공을 통과하는 표적 서열의 이동을 제어하도록 하고, 표적 서열 중 일부의 뉴클레오티드가 세공과 상호작용하도록 하는 단계, 및 (b) 각 상호작용 동안 세공을 통과하는 전류를 측정하여 예컨대 표적 서열의 서열을 추정하거나, 또는 표적 서열을 서열분석하는 것과 같이, 특징을 규명하는 단계를 포함한다. 그러므로, 본 방법은 표적 서열을 서열분석하는 것과 같이, 특징을 규명하기 위해 뉴클레오티드가 베럴 또는 채널을 통해 통과함에 따라 표적 핵산 서열 중 일부의 뉴클레오티드를 나노세공 감지하는 것을 포함한다.

또 다른 실시양태에서, 본 방법은 (a) 표적 서열을 본 발명의 세공 및 엑소뉴클레아제와 접촉시켜 엑소뉴클레아제가 표적 서열의 한쪽 말단으로부터 개별 뉴클레오티드를 분해할 수 있도록 하는 단계; (b) 뉴클레오티드를 세공과 접촉시켜 뉴클레오티드가 어댑터와 상호작용하도록 하는 단계; (c) 상호작용 동안 세공을 통과하는 전류를 측정하여 뉴클레오티드의 특징을 규명하는 단계; 및 (d) 표적 서열의 같은 쪽 말단에서 단계 (a) 내지 (c)를 반복함으로써 표적 서열의 특징을 규명하는 단계를 포함한다. 그러므로, 본 방법은 표적 서열의 특징을 규명하기 위해 연속 방식으로 표적 핵산 서열 중 일부의 뉴클레오티드를 나노세공 감지하는 것을 포함한다. 바람직한 실시양태에서, 본 방법은 표적 핵산 서열을 서열분석하는 것에 관한 것이고, 단계 (a)는 뉴클레오티드의 정체를 측정하는 것을 포함한다. 개별 뉴클레오티드는 상기에 기술되어 있다.

본 발명의 세공은 개선된 뉴클레오티드 판별을 보이는 바, 이는 특히 상기 방법에 적합하다. 특히, 증가된 전류 범위 (이로써 상이한 뉴클레오티드들 간의 판별은 더욱 쉬워진다), 및 감소된 상태 변동 (이로써 신호 대 노이즈 비는 증가한다)을 보인다. 추가로, 전자의 실시양태와 관련하여, 핵산이 세공을 통해 이동함에 따라 전류에 기여하는 뉴클레오티드의 개수는 감소하게 된다. 이로써 핵산이 세공을 통해 이동함에 따라 관찰되는 전류 결과와 핵산 서열 사이의 직접적인 관계를 더욱 쉽게 확인할 수 있게 된다. 본 발명의 세공은 바람직하게 상기에서 논의된 바와 같이, (1) 분자 어댑터 및/또는 (2) 핵산 결합 단백질 또는 엑소뉴클레아제로 화학적으로 변형된다.

상기 방법을 사용함으로써 표적 핵산 서열 전체, 또는 단지 그의 일부만을 특징 규명, 예컨대 서열분석할 수 있다. 핵산 서열은 임의의 길이일 수 있다. 예를 들어, 핵산 서열의 길이는 10개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상, 400개 이상 또는 500개 이상의 뉴클레오티드 길이일 수 있다. 핵산 서열의 길이는 1,000개 이상 뉴클레오티드 또는 5,000개 이상의 뉴클레오티드 길이일 수 있다. 핵산 서열은 천연적으로 발생된 것 또는 인공의 것일 수 있다. 예를 들어, 본 방법은 제조된 올리고뉴클레오티드의 서열을 확인하는 데 사용될 수 있다. 본 방법은 전형적으로 시험관내에서 수행된다.

본 방법은 세공이 막 내로 삽입되어 있는 임의의 적합한 막/세공 시스템을 사용하여 수행될 수 있다. 본 방법은 전형적으로 상기에 개시되어 있는 시스템, 장치, 또는 조건 중 임의의 것을 사용하여 수행될 수 있다.

상기에서 언급된 바와 같이, 우수한 뉴클레오티드 판별은 온도가 상승하게 되면 저염 농도에서 달성될 수 있다. 용액의 온도를 상승시키는 것 이외에도, 효소 활성에 적합한 조건은 유지시키면서, 용액의 전도도를 증가시키는 데 사용될 수 있는 다른 전략법은 다수 존재한다. 그러한 한가지 전략법으로는 효소 한쪽의 염 농도는 저염 농도로, 및 반대쪽은 고염 농도로 하는 것과 같이, 염 용액의 농도를 상이한 2가지 농도로 나누는 지질 이중층을 사용하는 것이 있다. 상기 전략법의 일례는 막의 시스 쪽에서는 200 mM의 KCl을 사용하고, 트랜스 챔버에서는 500 mM의 KCl을 사용하는 것이다. 이러한 조건하에서 세공을 통과하는 전도도는 표준 조건하의 400 mM의 KCl의 것에 대략적으로 등가인 것으로 예측되며, 효소는 단지 시스 쪽에 배치되었을 경우에만 200 mM을 경험하게 된다. 비대칭적 염 농도를 사용하는 것이 가지는 또 다른 가능한 이점은 세공을 가로질러 유도되는 삼투 구배이다. 이러한 물의 순 유동을 사용하여 검출을 위해 뉴클레오티드를 세공 내로 끌어올 수 있다. 유사한 효과는 중성 삼투질, 예컨대 수크로스, 글리세롤 또는 PEG를 사용함으로써 달성될 수 있다. 또 다른 가능성은 상대적으로 낮은 수준의 KCl을 포함하는 용액을 사용하고, 효소 활성에는 지장을 덜 주는 추가의 전하 보유 종에 의존하는 것에 있다.

벌크 용액 중에 있는 동안 결합 단백질 또는 엑소뉴클레아제의 작용으로부터 서열을 보호하기 위해 분석되는 표적 서열을 공지된 보호 화학법과 조합할 수 있다. 이어서, 세공을 사용하여 보호 화학법을 제거할 수 있다. 이는 적용 전위하에 세공, 결합 단백질 또는 효소에 의해 하이브리드화되지 않는 보호기를 사용함으로써 (WO 2008/124107), 또는 세공에 매우 근접하게 고정되어 있을 때에는 결합 단백질 또는 효소에 의해 제거되는 보호 화학법을 사용함으로써 (문헌 [J Am Chem Soc. 2010 Dec 22;132(50):17961-72]) 달성될 수 있다.

가닥 서열분석

가닥 서열분석은 세공을 통과하는 핵산 중합체의 조절형의 단계식 전좌를 포함한다. 본 발명의 세공은 가닥 서열분석에 사용될 수 있다. 본 발명의 한 방법은 세공을 통과하는 표적 서열의 이동을 제어하기 위해 핵산 결합 단백질을 사용한다. 상기 단백질의 예로는 핵산 처리 효소, 예컨대 뉴클레아제, 폴리머라제, 토포이소머라제, 리가제 및 헬리카제, 및 비-촉매성 결합 단백질, 예컨대 핵산-결합 단백질 수퍼패밀리(Nucleic acid-binding protein superfamily) (50249)하에 SCOP (단백질의 구조 분류(Structural Classification of Proteins))에 의해 분류된 것을 포함하나, 이에 한정되지 않는다. 결합 단백질은 단일 가닥 결합 단백질 (SSB)일 수 있다.

핵산은 2개 이상의 뉴클레오티드를 포함하는 거대분자이다. 단백질에 결합된 핵산은 임의의 뉴클레오티드의 임의의 조합을 포함할 수 있다. 뉴클레오티드는 상기에서 논의된 것 중 임의의 것일 수 있다. 핵산은 데옥시리보핵산 (DNA) 또는 리보핵산 (RNA)일 수 있다. 핵산은 당업계에 공지된 임의의 합성 핵산, 예컨대 펩티드 핵산 (PNA), 글리세롤 핵산 (GNA), 트레오스 핵산 (TNA), 잠금 핵산 (LNA) 또는 뉴클레오티드 측쇄를 가지는 다른 합성 중합체일 수 있다. 단백질에 결합된 핵산은 단일 가닥, 예컨대 cDNA, RNA, GNA, TNA 또는 LNA, 또는 이중 가닥, 예컨대 DNA일 수 있다. 단일 가닥 핵산에 결합하는 단백질은, 이중 가닥 DNA가 그에 단백질이 결합하기 이전에 단일 가닥으로 해리되는 한, 이중 가닥 DNA의 서열을 분석하는 데 사용될 수 있다.

핵산 결합 단백질은 바람직하게 핵산 처리 효소이다. 핵산 처리 효소는 핵산과 상호작용하고, 그의 1개 이상의 특성을 변형시킬 수 있는 폴리펩티드이다. 효소는 핵산을 절단하여 개별 뉴클레오티드 또는 더 짧은 단쇄의 뉴클레오티드, 예컨대 디- 또는 트리뉴클레오티드를 형성함으로써 핵산을 변형시킬 수 있다. 효소는 핵산을 배향시키거나, 그를 특이 위치로 이동시킴으로써 핵산을 변형시킬 수 있다. 핵산 처리 효소는 표적 서열에 결합할 수 있고, 세공을 통과하는 그의 이동을 조절할 수 있는 한, 효소 활성을 보여야 할 필요는 없다. 예를 들어, 효소는 그의 효소 활성을 제거하기 위해 변형될 수 있거나, 또는 그가 효소로서 작용하지 못하도록 하는 조건하에서 사용될 수 있다. 그러한 조건은 하기에서 상세하게 논의된다.

핵산 처리 효소는 바람직하게 뉴클레오티드 분해 효소로부터 유도된 것이다. 효소의 구축물에 사용되는 핵산 처리 효소는 더욱 바람직하게는 효소 분류(EC: Enzyme Classification) 군 3.1.11, 3.1.13, 3.1.14, 3.1.15, 3.1.16, 3.1.21, 3.1.22, 3.1.25, 3.1.26, 3.1.27, 3.1.30 및 3.1.31 중 임의의 것의 구성원으로부터 유도된 것이다. 효소는 국제 출원 번호 PCT/GB10/000133 (공개 공보 WO 2010/086603)에 개시된 것 중 임의의 것일 수 있다.

바람직한 효소는 폴리머라제, 엑소뉴클레아제, 헬리카제 및 토포이소머라제, 예컨대 기라제이다. 적합한 효소로는 E. 콜라이로부터의 엑소뉴클레아제 I (서열 번호 6), E. 콜라이로부터의 엑소뉴클레아제 III (서열 번호 8), T. 써모필루스로부터의 RecJ (서열 번호 10) 및 박테리오파지 람다 엑소뉴클레아제 (서열 번호 12) 및 그의 변이체를 포함하나, 이에 한정되지 않는다. 서열 번호 10에 제시된 서열 또는 그의 변이체를 포함하는 3개의 서브유닛은 상호작용하여 삼량체 엑소뉴클레아제를 형성한다. 효소는 바람직하게 Phi29 DNA 폴리머라제 (서열 번호 4)에 기반한 것이다.

서열 번호 4, 6, 8, 10 또는 12의 변이체는 서열 번호 4, 6, 8, 10 또는 12의 것으로부터 변이되고, 핵산 결합 능력을 보유하는 아미노산 서열을 가지는 효소이다. 변이체는 핵산 결합을 촉진시키고/거나, 고염 농도 및/또는 실온에서 그의 활성을 촉진시키는 변형을 포함할 수 있다.

변이체는 바람직하게 서열 번호 4, 6, 8, 10 또는 12의 전장의 아미노산 서열에 걸쳐 아미노산 동일성 기준으로 상기 서열과 50% 이상 상동성일 것이다. 더욱 바람직하게는, 변이체 폴리펩티드는 전체 서열에 걸쳐 아미노산 동일성 기준으로 서열 번호 4, 6, 8, 10 또는 12의 아미노산 서열과 55% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상 상동성, 및 더욱 바람직하게는, 95% 이상, 97% 이상 또는 99% 이상 상동성일 수 있다. 200개 이상, 예를 들어, 230, 250, 270 또는 280개 이상의 연속된 아미노산으로 이루어진 스트레치에 걸쳐 80% 이상, 예를 들어, 85% 이상, 90% 이상 또는 95% 이상으로 아미노산이 동일할 수 있다 ("강력한 상동성"). 상동성은 상기 기술된 바와 같이 계산된다. 변이체는 서열 번호 2를 참고로 하여 상기에서 논의된 방법 중 임의의 것으로 야생형 서열과 다를 수 있다. 효소는 상기에서 논의된 바와 같이 세공에 공유적으로 부착될 수 있다.

뉴클레오티드가 일련으로 무질서하게 세공의 감지 모이어티에 도달할 가능성은 없기 때문에, 효소는 개별 뉴클레오티드 서열분석을 위한 경우에서와 같이 세공 루멘에 매우 근접해 있을 필요는 없다.

단일 가닥 DNA 서열분석을 위한 2가지 전략법은 적용 전위에 따라 또는 그와 반대로, 시스에서 트랜스로 및 트랜스에서 시스로인 둘 모두로 나노세공을 통과하는 DNA의 전좌이다. 가닥 서열분석을 위해 가장 이로운 기전은 적용 전위하에서 나노세공을 통한 단일 가닥 DNA의 조절형 전좌이다. 이중 가닥 DNA에 대해 점진적으로 또는 진행적으로 작용하는 엑소뉴클레아제는 적용 전위하에 그를 통해 나머지 단일 가닥을 공급하는 세공의 시스 쪽에서, 또는 역방향 전위하에 트랜스 쪽에서 사용될 수 있다. 유사하게, 이중 가닥 DNA를 푸는 헬리카제 또한 유사한 방식으로 사용될 수 있다. 적용 전위에 대해 반대되는 가닥 전좌를 필요로 하는 서열분석에 적용될 수 있지만, DNA는 먼저 역방향 전위하에서 또는 전위가 없는 조건하에서 효소에 의해 "포획"되어야 한다. 이어서, 전위가 결합 후에 이전 방향으로 되돌아가게 되면, 가닥은 세공을 통해 시스에서 트랜스로 통과할 것이고, 전류 유동에 의해 확장된 입체구조로 유지될 수 있다. 단일 가닥 DNA 엑소뉴클레아제 또는 단일 가닥 DNA 의존 폴리머라제는 적용 전위에 대해 반대 방향으로 트랜스에서 시스로 세공을 통해 최근에 전좌된 단일 가닥을 조절형의 단계식 방식으로 풀백(pull back)시키는 분자 모터로서의 역할을 할 수 있다.

엑소뉴클레아제 -기반 방법

한 실시양태에서, 표적 핵산 서열의 특징을 규명하는 방법은 표적 서열을 엑소뉴클레아제 효소와 접촉시키는 단계를 포함한다. 상기에서 논의된 엑소뉴클레아제 효소 중 임의의 것이 본 방법에서 사용될 수 있다. 엑소뉴클레아제는 표적 서열의 한쪽 말단으로부터 개별 뉴클레오티드를 유리시킨다. 효소는 상기에서 논의된 바와 같이 세공에 공유적으로 부착될 수 있다.

엑소뉴클레아제는 전형적으로는 핵산 서열의 한쪽 말단에 래칭하여 상기 말단으로부터 한번에 뉴클레오티드 1개씩 서열을 분해하는 효소이다. 엑소뉴클레아제는 5'→3' 방향으로, 또는 3'→5' 방향으로 핵산을 분해할 수 있다. 엑소뉴클레아제가 결합하는 핵산의 말단은 전형적으로는 사용되는 효소의 선택 및/또는 당업계에 공지된 방법을 사용함으로써 결정된다. 전형적으로 엑소뉴클레아제의 핵산 서열의 특정 말단에의 결합을 방해하거나, 또는 촉진시키는 데 핵산 서열의 한쪽 말단의 히드록실 기 또는 캡 구조가 사용될 수 있다.

본 방법은 핵산 서열을 엑소뉴클레아제와 접촉시켜 상기에서 논의된 바와 같이 뉴클레오티드의 일부의 특징을 규명하거나, 그를 확인할 수 있을 정도의 속도로 뉴클레오티드를 핵산의 말단으로부터 분해시키는 단계를 포함한다. 이를 수행하는 방법은 당업계에 주지되어 있다. 예를 들어, 에드만 분해(Edman degradation)를 사용하여 폴리펩티드의 말단으로부터 단일 아미노산을 연속하여 분해함으로써 이를 고성능 액체 크로마토그래피 (HPLC)를 이용하여 확인할 수 있다. 본 발명에서는 상동성 방법이 사용될 수 있다.

엑소뉴클레아제의 작용 속도는 전형적으로 야생형 엑소뉴클레아제의 최적의 속도보다 느리다. 본 발명의 방법에서 엑소뉴클레아제의 적합한 활성 속도는 1초당 0.5 내지 1,000개의 뉴클레오티드, 1초당 0.6 내지 500개의 뉴클레오티드, 1초당 0.7 내지 200개의 뉴클레오티드, 1초당 0.8 내지 100개의 뉴클레오티드, 1초당 0.9 내지 50 뉴클레오티드, 또는 1초당 1 내지 20개 내지 10개의 뉴클레오티드를 분해하는 것을 포함한다. 상기 속도는 1초당 1, 10, 100, 500 또는 1,000개의 뉴클레오티드인 것인 바람직하다. 엑소뉴클레아제의 적합한 활성 속도는 다양한 방법으로 달성될 수 있다. 예를 들어, 최적의 활성 속도가 감소된 변이체 엑소뉴클레아제가 본 발명에 따라 사용될 수 있다.

Msp 및 Phi29 DNA 폴리머라제

바람직한 실시양태에서, 특징 규명, 예컨대 가닥 서열분석은 Msp로부터 유래된 세공 및 Phi29 DNA 폴리머라제를 사용함으로써 수행된다. 본 방법은 (a) 표적 서열을 Msp로부터 유래된 세공 및 Phi29 DNA 폴리머라제와 접촉시켜, 상기 폴리머라제가 세공을 통과하는 표적 서열의 이동을 제어하도록 하고, 표적 서열 중 일부의 뉴클레오티드가 세공과 상호작용하도록 하는 단계, (b) 각 상호작용 동안 세공을 통과하는 전류를 측정하여 예컨대 표적 서열의 서열을 측정하는 것과 같이, 특징을 규명하는 단계를 포함하며, 여기서 단계 (a) 및 (b)는 세공을 가로질러 적용되는 전압을 사용하여 수행된다. 표적 서열이 Phi29 DNA 폴리머라제 및 Msp로부터 유래된 세공과 접촉할 경우, 표적 서열은 먼저 Phi29 DNA 폴리머라제와 함께 복합체를 형성한다. 세공을 가로질러 전압이 적용되었을 때, 표적 서열/Phi29 DNA 폴리머라제 복합체는 세공과 함께 복합체를 형성하고, 세공을 통과하는 표적 서열의 이동을 조절한다.

이러한 실시양태는 예상 밖의 3가지 장점을 가지고 있다. 첫번째로, 표적 서열은 상업적으로 실행 가능한 속도로 세공을 통해 이동하지만, 효과적으로 서열분석이 이루어질 수 있다. 표적 서열은 헤몰리신 세공을 통해 이동할 때보다 더욱 빠르게 Msp 세공을 통해 이동한다. 두번째로, 핵산이 세공을 통해 이동함에 따라 전류 범위는 증가하는 것이 관찰되는데, 이로써 서열은 보다 쉽게 측정될 수 있다. 세번째로, 특이 세공 및 폴리머라제가 함께 사용될 때, 전류 변동이 감소하는 것이 관찰되며, 이로써 신호 대 노이즈 비는 증가하게 된다.

상기 기술된 임의의 핵산 서열은 특징 규명될 수 있거나, 또는 서열분석될 수 있다. 핵산 서열 중 적어도 일부는 이중 가닥인 것이 바람직하다.

세공은 상기에서 논의된 세공 중 임의의 것일 수 있다. 세공은 바람직하게 본 발명의 세공이다. 세공은 서열 번호 2, 16, 17 또는 18에 제시된 서열 또는 그의 변이체를 포함하는 8개의 단량체를 포함할 수 있다. 세공이 본 발명의 돌연변이 중 임의의 것을 포함할 필요는 없다.

야생형 Phi29 DNA 폴리머라제는 폴리머라제 및 엑소뉴클레아제 활성을 가진다. 이는 또한 올바른 조건하에서는 이중 가닥 핵산을 언지핑할 수 있다. 그러므로, 효소는 3가지 모드로 작동할 수 있다. 이는 하기에서 더욱 상세하게 논의된다.

Phi29 DNA 폴리머라제는 서열 번호 4에 제시된 서열 또는 그의 변이체를 포함할 수 있다. 서열 번호 4의 변이체는 서열 번호 4의 것으로부터 변이되고, 핵산 결합 활성을 보유하는 아미노산 서열을 가지는 효소이다. 변이체는 하기에서 논의되는 3가지 모드 중 1개 이상의 모드로 작동할 수 있다. 바람직하게, 변이체는 3가지 모드 모두로 작동한다. 변이체는 핵산의 처리를 촉진시키고/거나, 고염 농도 및/또는 실온에서 그의 활성을 촉진시키는 변형을 포함할 수 있다.

변이체는 바람직하게 서열 번호 4의 전장의 아미노산 서열에 걸쳐 아미노산 동일성 기준으로 상기 서열과 40% 이상 상동성일 것이다. 더욱 바람직하게는, 변이체 폴리펩티드는 전체 서열에 걸쳐 아미노산 동일성 기준으로 서열 번호 4의 아미노산 서열과 50% 이상, 55% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상 및 더욱 바람직하게는, 95% 이상, 97% 이상 또는 99% 이상 상동성일 수 있다. 200개 이상, 예를 들어, 230, 250, 270 또는 280개 이상의 연속된 아미노산으로 이루어진 스트레치에 걸쳐 80% 이상, 예를 들어, 85% 이상, 90% 이상 또는 95% 이상으로 아미노산이 동일할 수 있다 ("강력한 상동성"). 상동성은 상기 기술된 바와 같이 계산된다. 변이체는 서열 번호 2를 참고로 하여 상기에서 논의된 방법 중 임의의 것으로 야생형 서열과 다를 수 있다. 효소는 상기에서 논의된 바와 같이 세공에 공유적으로 부착될 수 있다.

상기에서 논의된 시스템, 장치, 또는 조건 중 임의의 것이 본 바람직한 실시양태에 따라 사용될 수 있다. 염 농도는 전형적으로 0.15 M 내지 0.6 M이다. 염 은 바람직하게 KCl이다.

본 방법은 3가지 모드의 Phi29 DNA 폴리머라제에 기초하여 3가지 바람직한 방법 중 하나로 수행될 수 있다. 각 방법은 서열을 교정(proof reading)하는 방법을 포함한다. 첫번째, 본 방법은 바람직하게 폴리머라제로서 Phi29 DNA 폴리머라제를 사용함으로써 수행된다. 본 실시양태에서, 단계 (a) 및 (b)를 유리 뉴클레오티드 및 효소 보조인자의 존재하에서 수행하여, 폴리머라제가 적용 전압으로부터 생성되는 장(field)에 대해 반대로 표적 서열을 세공을 통해 이동시키도록 한다. 표적 서열은 5'→3' 방향으로 이동한다. 유리 뉴클레오티드는 상기에서 논의된 개별 뉴클레오티드 중 하나 이상의 임의의 것일 수 있다. 효소 보조인자는 Phi29 DNA 폴리머라제가 폴리머라제 또는 엑소뉴클레아제로서 작용할 수 있도록 하는 인자이다. 효소 보조인자는 바람직하게 2가 금속 양이온이다. 2가 금속 양이온은 바람직하게 Mg² ⁺, Mn²⁺, Ca² ⁺ 또는 Co² ⁺이다. 효소 보조인자는 가장 바람직하게는 Mg²⁺이다. 본 방법은 바람직하게 (c) 유리 뉴클레오티드를 제거하여, 폴리머라제가 적용 전압으로부터 생성되는 장을 따라 (즉, 3'→5' 방향으로) 표적 서열을 세공을 통해 이동시키도록 하고, 표적 서열 중 일부의 뉴클레오티드가 세공과 상호작용하도록 하는 단계, 및 (d) 각 상호작용 동안 세공을 통과하는 전류를 측정하여, 단계 (b)에서 수득된 표적 서열의 서열을 교정하는 단계를 추가로 포함하며, 여기서 단계 (c) 및 (d)는 또한 세공을 가로질러 적용되는 전압을 사용하여 수행된다.

두번째로, 본 방법은 바람직하게 엑소뉴클레아제로서 Phi29 DNA 폴리머라제를 사용함으로써 수행된다. 본 실시양태에서, 단계 (a) 및 (b)를 유리 뉴클레오티드의 부재하에 및 효소 보조인자의 존재하에서 수행하여, 폴리머라제가 적용 전압으로부터 생성되는 장을 따라 표적 서열을 세공을 통해 이동시키도록 한다. 표적 서열은 3'→5' 방향으로 이동한다. 본 방법은 바람직하게 (c) 유리 뉴클레오티드를 부가하여, 폴리머라제가 적용 전압으로부터 생성되는 장에 대해 반대로 (즉, 5'→3' 방향으로) 표적 서열을 세공을 통해 이동시키도록 하고, 표적 서열 중 일부의 뉴클레오티드가 세공과 상호작용하도록 하는 단계, 및 (d) 각 상호작용 동안 세공을 통과하는 전류를 측정하여, 단계 (b)에서 수득된 표적 서열의 서열을 교정하는 단계를 추가로 포함하며, 여기서 단계 (c) 및 (d)는 또한 세공을 가로질러 적용되는 전압을 사용하여 수행된다.

세번째로, 본 방법은 바람직하게 언지핑 모드로 Phi29 DNA 폴리머라제를 사용함으로써 수행된다. 본 실시양태에서, 단계 (a) 및 (b)를 유리 뉴클레오티드의 부재하 및 효소 보조인자의 부재하에서 수행하여, 폴리머라제가 (그가 언지핑됨에 따라) 적용 전압으로부터 생성되는 장을 따라 표적 서열의 세공을 통한 이동을 제어하도록 한다. 본 실시양태에서, 폴리머라제는 적용되는 전압의 영향하에서 표적 서열이 세공을 통해 매우 빠르게 이동하지 못하도록 막는 브레이크와 같은 역할을 한다. 본 방법은 바람직하게 (c) 세공을 가로질러 적용되는 전압을 강하시켜, 표적 서열이 세공을 통해 반대 방향으로 단계 (a) 및 (b)의 방향으로 (즉, 재-어닐링됨에 따라) 이동하도록 하고, 표적 서열 중 일부의 뉴클레오티드가 세공과 상호작용하도록 하는 단계, 및 (d) 각 상호작용 동안 세공을 통과하는 전류를 측정하여, 단계 (b)에서 수득된 표적 서열의 서열을 교정하는 단계를 추가로 포함하며, 여기서 단계 (c) 및 (d)는 또한 세공을 가로질러 적용되는 전압을 사용하여 수행된다.

본 발명은 또한 (a) 표적 핵산 서열의 존재하에서 Msp로부터 유래된 세공을 Phi29 DNA 폴리머라제와 접촉시키는 단계, 및 (b) 세공을 가로질러 전압을 적용하여 세공과 폴리머라제 사이에 복합체를 형성하고, 이로써 표적 핵산 서열의 서열분석을 위한 센서를 형성하는 단계를 포함하는, 표적 핵산 서열의 서열분석을 위한 센서를 형성하는 방법을 제공한다. 본 발명은 추가로 핵산 서열의 존재하에서 Phi29 DNA 폴리머라제를 Msp로부터 유래된 세공과 접촉시키는 단계, 및 세공을 가로질러 전압을 적용하여 세공과 폴리머라제 사이에 복합체를 형성하고, 이로써 Phi29 DNA 폴리머라제의 활성 속도를 증가시키는 단계를 포함하는, Phi29 DNA 폴리머라제의 활성 속도를 증가시키는 방법을 제공한다.

키트

본 발명은 또한 예컨대 표적 핵산 서열의 서열분석과 같이 특징 규명을 위한 키트를 제공한다. 한 키트는 (a) 본 발명의 세공 및 (b) 핵산 처리 효소를 포함한다. 또 다른 키트는 (a) Msp로부터 유래된 세공 및 (b) Phi29 DNA 폴리머라제를 포함한다. 본 발명의 방법을 참고로 하여 상기에서 논의된 실시양태 중 임의의 것이 본 발명의 키트에 동등하게 적용될 수 있다.

본 발명의 키트는 추가로 상기에서 언급된 실시양태 중 임의의 것이 수행될 수 있도록 하는 하나 이상의 다른 시약 또는 장치를 포함할 수 있다. 그러한 시약 또는 장치로는 하기: 적합한 완충제(들) (수용액), 대상체로부터 샘플을 수득하기 위한 수단 (예컨대 베쓸 또는 바늘을 포함하는 장치), 폴리뉴클레오티드 서열을 증폭 및/또는 발현시키기 위한 수단, 상기 정의된 것과 같은 막, 또는 전압 또는 패치 클램프 장치 중 하나 이상을 포함한다. 시약은 유체 샘플이 시약을 재현탁시킬 수 있도록 건식 상태로 키트 중에 존재할 수 있다. 키트는 또한 임의적으로 본 발명의 방법에서의 키트 사용 설명서 또는 본 방법은 어떤 환자에 대해 사용될 수 있는지에 관한 상세한 설명을 포함할 수 있다. 키트는 임의적으로 뉴클레오티드를 포함할 수 있다.

장치

본 발명은 또한 예컨대 샘플 중의 표적 핵산 서열의 서열분석과 같이 특징 규명을 위한 장치를 제공한다. 장치는 (a) 다수의 본 발명의 세공 및 (b) 다수의 핵산 처리 효소를 포함할 수 있다. 별법으로, 본 발명은 다수의 Msp로부터 유래된 세공 및 다수의 Phi29 DNA 폴리머라제를 포함할 수 있다. 장치는 임의의 통상적인 피분석물 분석용 장치, 예컨대 어레이 또는 칩일 수 있다.

장치는 바람직하게

- 다수의 세공을 지지할 수 있으며 세공 및 효소를 사용하여 핵산 특징 규명 또는 서열분석을 수행하도록 작동가능한 센서 장치;

- 특징 규명 또는 서열분석 수행용 물질을 담아두기 위한 1개 이상의 저장소;

- 물질을 1개 이상의 저장소로부터 센서 장치로 제어가능하게 공급하도록 구성된 유체 시스템; 및

- 각 샘플을 수용하기 위한 다수의 용기를 포함하며, 상기 유체 시스템은 샘플을 용기로부터 센서 장치로 선택적으로 공급하도록 구성된 것이다. 장치는 국제 출원 번호 PCT/GB10/000789 (공개 공보 WO 2010/122293), 국제 출원 번호 PCT/GB10/002206 (아직 공개되지 않음) 또는 국제 출원 번호 PCT/US99/25679 (공개 공보 WO 00/28312)에 기술되어 있는 것 중 임의의 것일 수 있다.

하기 실시예가 본 발명을 설명한다:

실시예 1

동종올리고머는 단량체 단위 모두가 동일한 세공이다. 단량체 단위는 자가 조립하기 때문에, 이는 제조하기 가장 간단한 구축물이다. 염기 판독기 특성을 개선시키기 위한 본 발명자들의 전략법은 하기 카테고리로 분리될 수 있다:

· 입체구조 (아미노산 잔기의 크기를 증가 또는 축소)

· 전하 (DNA 와 상호작용하는 + ve 전하 도입)

· 수소 결합 (염기쌍에 수소 결합할 수 있는 잔기)

· 파이 스태킹 (비국소화된 전자 파이계를 통해 상호작용하는 아미노산)

입체구조/파이 스태킹 증가 (모두 NNN - RRK 배경):

입체구조 - 벌크한 잔기 (예컨대 페닐알라닌, 트립토판, 티로신, 히스티딘)치환

파이 스태킹 - 방향족 잔기 (예컨대 페닐알라닌, 트립토판, 티로신, 히스티딘) 치환

하기 표 (6-11)에는 서열 번호 2에 대한 돌연변이가 제시되어 있다. B1 = 서열 번호 2.

입체구조 감소 - 크기가 보다 작은 잔기 (예컨대 세린, 트레오닌, 글리신, 알라닌, 발린) 치환

전하 - 양전하 잔기(예컨대 아르기닌, 리신, 히스티딘) 치환

수소 결합 - 결합능이 있는 잔기 (예컨대 아스파라긴, 글루타민, 티로신, 히스티딘) 치환

동종올리고머는 또한 반응성 기를 포함하도록 변형될 수 있고, 이는 이어서 화학적으로 변형될 수 있다.

실시예 2

상기 단량체 단위를 조합하여 신규한 올리고머 세공을 제조할 수 있다. 올리고머가 1개 초과의 상이한 서브유닛을 포함할 때 (예컨대 MS -( MutA ) ₆ ( MutB ) ₁ (MutC) ₁ ), 세공은 이종올리고머이다. 이종올리고머에서는 전형적으로 오직 한 단위만이 변형된다 (예컨대 MS -( MutA ) ₇ ( MutB ) ₁ ). 다른 비율의 이종올리고머 또한 형성될 수 있다 (예컨대 MS -( MutA ) ₆ ( MutB ) ₂ ). 서브유닛은 또한 서열 번호 2를 포함할 수 있다.

이종올리고머가 가지는 장점은 (모든 단량체 단위에 변화를 도입한다기 보다는) 세공에 단일로 화학적으로 변화시킬 수 있다는 점이다. 이는 동종올리고머보다는 구조에 대해서 덜 급격한 변화이며, 이를 통해 동종올리고머의 경우에는 작동하지 않은 위치의 세공 내로 잔기를 도입할 수 있다. DNA와 상호작용하는 단일 잔기는 다중 단위에 비하여 유익할 수 있다 (예컨대 팔량체 상의 8개의 Arg에 비하여 이종팔량체 상의 단일의 Arg). 돌연변이체는 또한 조합되어 같은 잔기에서 상이한 효과를 발휘할 수 있는데, 그 예로는 하나의 크기는 증가시키면서, 7개의 단위의 크기는 축소시키는 것이 있을 수 있다 (예컨대 MS -( D90G ) ₈ ( D90Y ) ₁ ).

돌연변이체 디자인 규칙은 동종올리고머에 대하여 상기 제시된 것과 유사할 것이다.

단일 입체구조 잔기 도입

단일 하전된 잔기 도입

단일 반응성 잔기 도입

실시예 3

화학적 변형을 위한 단일 반응성 잔기 도입.

실시예 4

하기 표에는 본 발명의 돌연변이체 세공이 요약되어 있다. 첫번째 것은 동종올리고머에 관한 것이고, 두번째 것은 이종올리고머에 관한 것이다.

실시예 5 - MspA 와 HL 의 비교

본 발명자들은 세공을 통과하는 DNA 가닥의 이동을 조절하기 위해 분자 모터로서의 Phi29 DNA 폴리머라제 (DNAP)를 돌연변이체 MspA 나노세공과 조합하였다. 세공을 가로질러 전압을 적용하였고, 나노세공 양측의 염 용액 중 이온 이동으로부터 전류가 생성되었다. DNA가 세공을 통해 이동함에 따라, 세공을 통과하는 이온 유동은 DNA에 대하여 변화하였다. 이러한 정보는 서열에 의존하는 것으로 나타났다.

본 발명자들은 헤몰리신의 돌연변이체 형태를 MspA, 특히 MS-(B1)₈과 비교하였다. MspA의 전류 범위는 헤몰리신 (HL)과 비교하여 더 높았다. 추가로, MspA의 전류 범위는 또한 DNA의 가닥이 세공으로 쓰레딩되었을 때(threaded), 더 크다.

본 발명자들은 MspA와 Phi29 DNAP를 함께 조합함에 따라 예상하지 못했던 MspA의 놀라운 특징들이 다수 존재한다는 것을 밝혀냈다. 주요 차이는:

1. HL과 비교하였을 때, 더욱 신속한 가닥 이동 (언지핑 모드).

2. 세공을 통과하는 가닥 이동시, 전류 범위 증가.

3. HL 돌연변이체와 비교하였을 때, 전류 수준 변동 감소.

더욱 신속한 가닥 이동

134 mer ssDNA 주형 (서열 번호 13)을 84 mer ssDNA (서열 번호 14)에 하이브리드화시켜 50 mer ssDNA 5' 오버행을 가지는 84 mer dsDNA 주형을 형성하였다. 이 가닥은 언지핑 모드로 Phi29 DNAP를 이용하여 MS-(B1)₈ MspA 돌연변이체 및 헤몰리신 돌연변이체를 통해 이동하였다. 모두 실온하에 10 mM Hepes (pH 8.0), 1 mM EDTA, 1 mM DTT에서 2개의 런(run): 하나는 400 mM KCl에서, 나머지 다른 하나는 600 mM KCl에서 획득하였다. 각 돌연변이체 구축물에 대해 적용 전위를 최적화시켰다; HL은 220 mV 에서 및 MspA는 180 mV에서 실행되었다.

전류 수준을 효소 결합 상태인 DNA로부터의 이벤트로서 얻어내고, 본 이벤트를 인덱싱하고, 이벤트의 전류 수준, 지속 기간 및 변동을 기록하였다.

모든 언지핑 실행의 경우, 언지핑 속도가 가닥 전체에 걸쳐 일관되지는 않았다.

이는 이벤트 인덱스의 사분위수로 나뉜, 이벤트 지속 기간의 평균을 계산함으로써 제시될 수 있다 (도 1). 제1 사분위수는 다음 사분위수보다 지속 기간이 훨씬 더 긴 이벤트를 제공하였고, 이는 HL 및 MspA 둘 모두에 대해 해당되었다. 제1 사분위수의 경우, 평균 이벤트 길이는 MspA의 경우, 400 mM KCl일 때 가장 짧고, HL의 경우는 600 mM일 때 가장 짧았다. 그러나, Q2, Q3 및 Q4에서, MspA의 경우, 두 염 조건 모두에서 보다 짧은 이벤트가 일어났다. 신호 대 노이즈가 충분하다고 가정할 때, 짧은 이벤트는 세공을 통과하는 DNA 가닥의 빠른 이동을 나타내는 것이고, 이로써, 실험 처리량은 증가하게 되는 바, 짧은 이벤트가 바람직할 수 있다.

전류 범위 증가 및 변동 감소

본원에 기술된 나노세공 실험에서, 전류 수준은 주로 염 농도, 적용된 전압, 및 온도에 의존한다. 600 mM KCl, 10 mM Hepes, 1 mM EDTA, 1 mM DTT (pH 8.0), +220 mV로 물리적 조건을 설정하고, Phi29 DNA 폴리머라제를 사용하여 언지핑 모드로 HL 및 MS-(B1)₈ MspA 돌연변이체를 비교하였다. 본 실험에서 사용되는 DNA는 34 mer 단일 가닥 5' 오버행 (서열 번호 15)을 가지는 100 mer 헤어핀이었다. 런을 실온에서 수행하였다.

전류 수준을 효소 결합 상태인 DNA로부터의 이벤트로서 얻어내고, 본 이벤트를 인덱싱하고, 이벤트의 전류 수준, 지속 기간 및 변동을 기록하였다 (도 2 및 3).

범위가 대략 20 pA인 HL 돌연변이체와 비교해 볼 때, MspA 돌연변이체는 대략 50 pA로 유의적으로 더 큰 전류 범위를 제공한다는 것이 본 실험으로부터 분명해졌다 (도 2 및 3). 큰 전류 범위는 더욱 큰 신호 대 노이즈 비를 제공할 것이며, 이로써 더욱 쉽게 상이한 전류 상태를 구별할 수 있게 되는 바, 이롭다. 이는 N 염기가 전류 신호에 기여할 수 있고, 이로써 4^N 가능한 전류 상태에 이르게 될 때, 서열분석 적용에 있어서 특이 유익하다.

상태 변동 또한 HL과 비교하였을 때, MspA 돌연변이체의 경우에 감소된다. 이는 상기 자취에서 이벤트의 표준 편차로 제시된다 (도 2 및 3). 상기 가닥의 경우, MspA 가닥에 대한 모든 이벤트 전체 걸친 평균의 표준 편차는 HL의 경우, 4.5인 것과 비교하여 3.6이었다. 상태 변동이 낮은 것은 이를 통해 이벤트 전류 수준을 정확하게 추정할 수 있기 때문에 바람직할 수 있다.

실시예 6 - MS -(B1)8 기준과 MS -(B1- I105 )8 돌연변이체의 개방 세공 전류 비교

MspA 세공의 전류 수준은 단백질 중 I105 위치를 돌연변이화시킴으로써 조절될 수 있다. 본 발명자들은 개방 세공 전류가 MspA 단량체에 대한 단일 돌연변이화의 결과로서 80% 초과만큼 증가할 수 있다는 것을 입증하였다.

하기 조건: 400 mM KCl, 10 mM Hepes (pH 8.0), 실온하에 단일 채널을 지질 막 내로 삽입하였다. -200 mV 내지 200 mV의 적용 전위 범위에 걸쳐 개방 세공 전류 수준을 기록하여 IV 곡선을 작성하였다. 여러 세공에 대해 실험을 반복함으로써 샘플의 분포를 평가하였다. IV 곡선 런으로부터 얻은 데이터의 예는 (도 4에서) 볼 수 있다.

본 발명자들의 실험에서, 기준 MS-(B1)8 돌연변이체가 +160 mV에서 대략 150 pA의 개방 세공 전류를 가지는 세공을 생성하였다 (도 5).

본 실험을 MS-(B1-I105Y)8 돌연변이체에 대해 반복하였는데, 이는 잔류 전류가 보다 높은 다수의 세공을 나타내었다. 이러한 채널의 경우, 개방 세공 전류는 +160 mV에서 대략 200 pA였다 (도 6).

본 실험을 MS-(B1-I105N)8 돌연변이체에 대해 반복하였는데, 이는 2개의 주된 전류 수준 분포를 나타내었다. 16개의 세공 중 10개가 조밀한 분포로 더 높은 잔류 전류를 제공하였다. 이러한 채널의 경우, 개방 세공 전류는 +160 mV에서 대략 280 pA였다 (도 7).

실시예 7 - 자발적으로 전도도를 변화시키는 MS -(B1- I105A )8 세공

MspA 돌연변이체 세공은 전기 기록 실험 동안 자발적으로 전도도를 변화시키는 것으로 관찰되었다.

MS-(B1-I105A)8 돌연변이체 세공을 사용하여 실시예 6에 기술된 바와 같이 전기 측정을 하였다.

단일 MspA 돌연변이체 세공은 고 전도도와 저 전도도 상태 사이를 자발적으로 상호교환할 수 있다 (도 8). 이는 MspA에 대한 돌연변이를 통해 기준 MS-(B1)8 세공에서는 거의 관찰되지 않는 입체구조 변화가 일어날 수 있다는 것을 제안하는 것이다. I105 위치에서의 돌연변이는 세공의 고 전도도 상태를 안정화시키는 것도 가능하다.

실시예 8 - MS -(B1- I105A )8 세공과의 비교로서, 기준 MS -(B1)8 세공을 통해 DNA를 이동시킬 때의 DNA 전류 비교

400 mM KCl, 10 mM Hepes, 1 mM EDTA, 1 mM DTT (pH 8.0), +180 mV로 물리적 조건을 설정하고, Phi29 DNA 폴리머라제를 사용하여 언지핑 모드로 MS-(B1)₈ 세공 및 MS-(B1-I105N)₈ 세공을 비교하였다. 본 실험에서 사용되는 DNA는 34 mer 단일 가닥 5' 오버행 (서열 번호 15)을 가지는 100 mer 헤어핀이었다. 런을 실온에서 수행하였다.

MS-(B1)₈ 돌연변이체를 통해 이동하는 DNA 가닥으로부터의 전류 수준의 범위는 상기 조건하에서 ~30 pA였다 (도 9). MS-(B1-I105A)₈ 돌연변이체를 사용하여 같은 실험을 반복하였는데, 전류 수준은 같은 DNA 가닥에 대하여 ~40 pA 범위를 보였다 (도 10). 나노세공 내에서 뉴클레오티드의 조합을 판별하는 데에는 MS-(I105A)₈ 돌연변이체의 보다 큰 전류 범위가 바람직할 수 있다.

실시예 9 - MS -(B1)8 기준과 MS -(B1- L88N )8 돌연변이체의 신호 노이즈 비교

MspA 세공의 노이즈 수준은 MspA 단량체 서열 중 L88 위치를 돌연변이화시킴으로써 조절될 수 있다. 노이즈 수준은 MspA 단량체에 대한 단일 돌연변이화의 결과로서 19%만큼 감소할 수 있다는 것이 입증되었다.

본 실시예에서는 나노세공을 통과하는 온전한 DNA 가닥의 이동을 조절하기 위해 헬리카제를 이용함으로써 전좌 모드로 MS-(B1)8 세공 및 MS-(B1-L88N)8 세공을 비교하였다.

물질

PhiX174의 ~400 bp 단편을 증폭시키기 위해 프라이머를 디자인하였다. 상기 프라이머의 각각의 5'-말단은 동종중합체 스트레치 또는 10개의 뉴클레오티드로 된 동종중합체 섹션의 반복 단위부인 50개의 뉴클레오티드 비-상보적(complimentary) 영역을 포함한다. 이는 나노세공을 통과하는 상기 가닥의 전자 조절을 위한 식별자로서 뿐만 아니라, 전자의 방향성을 결정짓는 데에도 역할을 한다. 추가로, 정방향 프라이머의 5'-말단은 "캡핑"되어 4개의 2'-O-메틸-우라실 (mU) 뉴클레오티드를 포함하고, 역방향 프라이머의 5'-말단은 화학적으로 인산화되었다. 이어서, 상기 프라이머 변형을 통해 람다 엑소뉴클레아제를 사용하여 오직 안티센스 가닥만을 지배적으로 분해하는 것을 조절할 수 있었다. mU 캡핑은 뉴클레아제 분해로부터 센스 가닥을 보호하는 반면, 안티센스 가닥의 5'의 PO4는 그를 촉진시켰다. 그러므로, 람다 엑소뉴클레아제와의 인큐베이션 후, 이중체 중 오직 센스 가닥만이 온전한 상태 그대로 유지되고, 즉, 단일 가닥 DNA (ssDNA)로 남게 되었다. 이어서, 앞서 기술된 바와 같이, 생성된 ssDNA를 PAGE 정제하였다.

본 실험에서 사용된 DNA 기질 디자인은 도 11에 제시되어 있다 (서열 번호 19 및 20 (하기 제시되는 서열 및 태그)). DNA 기질은 나노세공에 의한 포획을 돕기 위한 50T 5'-리더와 함께, PhiX로부터의 ssDNA의 400개의 염기 섹션으로 구성되었다. 이중층 표면 상에 DNA를 강화시키고, 이로써 포획 효율을 개선시키기 위하여, 3' 콜레스테롤 태그 (3' 콜레스테릴-TEG)를 포함하는 프라이머를 50T 리더 바로 뒤의 상기 가닥에 어닐링시켰다.

서열 번호 19

서열 번호 20 (+ 3' 콜레스테릴-TEG 태그)

실험 방법

완충 처리된 용액: 400 mM NaCl, 10 mM Hepes (pH 8.0), 1 mM ATP, 1 mM MgCl₂, 1 mM DTT

나노세공: MS(B1)8 MspA

MS(B1-L88N)8 MspA

효소: 헬리카제

1,2-디피타노일-글리세로-3-포스포콜린 지질 (아반티 폴라 리피드(Avanti Polar Lipids)) 이중층에 삽입된 단일 MspA 나노세공으로부터 전기 측정을 하였다. 2개의 1 mL 완충 처리된 용액을 분리하면서, 몬탈-뮐러(Montal-Mueller) 기법을 통해 (주문 제작된 델린(Delrin) 챔버 중) 20 ㎛ 두께의 PTFE 필름에서 개구부 직경이 ~100 ㎛인 이중층을 형성하였다. 모든 실험은 언급된 완충 처리된 용액 중에서 수행하였다. 1440A 디지타이저가 장착된 아폭스패치 200B(Axopatch 200B) 증폭기 (몰레큘러 디바이시즈(Molecular Devices)) 상에서 단일 채널 전류를 측정하였다. (나노세공 및 효소/DNA 둘 모두가 첨가되는) 시스 구획을 아폭스패치 헤드스테이지의 접지에 연결하고, 트랜스 구획을 헤드스테이지의 활성 전극에 연결시키기 위해 Ag/AgCl 전극을 완충 처리된 용액에 연결시켰다.

이중층에서 MS(B1)8 또는 MS(B1-L88N)8의 단일 세공을 얻은 후, DNA 폴리뉴클레오티드 (서열 번호 19 및 20) 및 헬리카제를 100 ㎕의 완충제에 첨가하고, 5 min 동안 사전 인큐베이션시켰다 (DNA = 1.5 nM, 효소 = 1 μM). 이 사전 인큐베이션 믹스를 전기생리 챔버의 시스 구획 중의 900 ㎕의 완충제에 첨가하여 MspA 나노세공 중 헬리카제-DNA 복합체의 포획을 개시시켰다 (최종 농도가 DNA = 0.15 nM, 효소 = 0.1 μM이 되도록 만들었다). 필요에 따라 2가 금속 (1 mM MgCl₂) 및 NTP (1 mM ATP)를 시스 구획에 첨가함으로써 헬리카제 ATPase 활성을 개시시켰다. 실험은 +140 mV의 정전위에서 수행하였다. 전류 수준을 효소 결합 상태인 DNA로부터의 이벤트로서 얻어내고, 본 이벤트를 인덱싱하고, 이벤트의 전류 수준, 지속 기간 및 변동을 기록하였다.

MspA 세공 MS-(B1)8을 사용하였을 때, +140 mV의 적용 전위에서 검출된 이벤트 중 31.08%의 표준 편차가 >2.0이었다 (추가 데이터는 하기 표 18에 요약되어 있다). 본 실험을 MS-(B1-L88N)8 돌연변이체에 대해 반복하였는데, +140 mV의 적용 전위에서 검출된 이벤트 중 단 12.38%만의 표준 편차가 >2.0이었다 (추가 데이터는 하기 표 18에 요약되어 있다). 그러므로, MspA 단량체 서열 중 L88에서의 점 돌연변이는 관찰되는 노이즈 범위를 19%만큼 감소시켰다.

실시예 10 - MS -(B1)8 기준과 MS -(B1- L88N )8, MS -(B1- L88S )8 및 MS -(B1-L88Q)8 돌연변이체의 신호 노이즈 비교

MspA 세공의 노이즈 수준은 단백질 중 L88 위치를 돌연변이화시킴으로써 변경될 수 있다. 노이즈 수준은 MspA 단량체에 대한 단일 돌연변이화의 결과로서 감소될 수 있다는 것이 입증되었다.

본 실시예에서는 나노세공을 통과하는 온전한 DNA 가닥의 이동을 조절하기 위해 Phi29 DNA 폴리머라제를 이용함으로써 언지핑 모드로 MS-(B1)8 세공과 MS-(B1-L88N)8, MS-(B1-L88S)8 및 MS-(B1-L88Q)8 세공을 비교하였다. 본 실시예에서 기술된 실험 모두에서 사용된 DNA 기질 디자인은 도 12에 제시되어 있다 (서열 번호 21, 22 및 23). 서열 번호 23은 하기 제시된 바와 같이, IDT Int Spacer 9 (iSp9) 및 3' 콜레스테릴-TEG (3CholTEG)로 태깅하였다. +180 mV의 적용 전위에서 실온하에 런을 수행하였다.

서열 번호 23:

실험 방법

완충 처리된 용액: 400 mM KCl, 10 mM Hepes (pH 8.0), 1 mM EDTA, 1 mM DTT

나노세공: MS(B1)8 MspA;

MS-(B1-L88N)8 MspA;

MS-(B1-L88S)8 MspA;

MS-(B1-L88Q)8 MspA;

효소: Phi29 DNA 폴리머라제 (서열 번호 4)

실시예 9에 기술된 바와 같이 전기 측정을 하였다. 이중층에서 MS(B1)8, MS(B1-L88N)8, MS(B1-L88S)8 또는 MS(B1-L88Q)8의 단일 세공을 얻은 후, DNA 폴리뉴클레오티드 (서열 번호 21, 22 및 23) 및 Phi29 DNA 폴리머라제를 100 ㎕의 완충제에 첨가하고, 5 min 동안 사전 인큐베이션시켰다. 이 사전 인큐베이션 믹스를 전기생리 챔버의 시스 구획 중의 900 ㎕의 완충제에 첨가하여 MspA 나노세공 중 폴리머라제-DNA 복합체의 포획을 개시시켰다 (최종 농도가 DNA = 0.5 nM, 효소 = 0.1 μM이 되도록 만들었다). 실험은 +180 mV의 정전위에서 수행하였다. DNA가 효소 결합 상태일 때 관찰되는 전류 수준을 인덱싱하고, 전류 수준, 그의 지속 기간 및 변동을 기록하였다.

본 실험에서, 기준 MS-(B1)8 돌연변이체는 +180 mV에서 높은 잡은 수준을 보였다 (76.15%의 표준 편차가 > 2.0, 하기 표 19 참조). 시험된 다른 나머지 3개의 돌연변이체인 L88 위치에 단일의 점 돌연변이를 가지고 있는 (MS-(B1-L88N)8, MS-(B1-L88S)8 및 MS-(B1-L88Q)8)은 모두 같은 DNA 가닥 서열에 걸쳐 기준 세공보다 노이즈 수준이 더 낮은 것으로 관찰되었다 (표 19 참조). 그러므로, MspA 단량체 서열 중 L88 위치에 점 돌연변이를 적용시킴으로써 신호 노이즈를 감소시킬 수 있었다.

실시예 11 - MS -(B1)8 기준과 다른 MspA 돌연변이체의 전체 신호 범위 비교

MspA 세공의 신호 범위는 MspA 단백질 단량체 서열 중 다양한 위치를 돌연변이화시킴으로써 증가될 수 있다.

본 실시예에서는 나노세공을 통과하는 온전한 DNA 가닥의 이동을 조절하기 위해 Phi29 DNA 폴리머라제를 이용함으로써 언지핑 모드로 MS-(B1)8 세공을 하기 세공- MS-(B1-D90Q)8, MS-(B1-I105L)8, MS-(B1-I105Y)8, MS-(B1-I89Y-D90S)8, MS-(B1-N86T)8 및 MS-(B1-S103G)8 세공과 비교하였다. 본 실시예에서 기술된 실험 모두에서 사용된 DNA 기질 디자인은 도 12에 제시되어 있다 (서열 번호 21, 22 및 23). iSp9 및 3CholTEG로 태깅된 서열 번호 23은 상기에 제시되어 있다. +180 mV의 적용 전위에서 실온하에 런을 수행하였다. DNA가 효소 결합 상태일 때 관찰되는 전류 수준을 인덱싱하고, 전류 수준, 그의 지속 기간 및 변동을 기록하였다.

실험 방법

나노세공: MS(B1)8 MspA;

MS-(B1-D90Q)8 MspA;

MS-(B1-I105L)8 MspA;

MS-(B1-I105Y)8 MspA;

MS-(B1-I89Y-D90S)8 MspA;

MS-(B1-N86T)8 MspA;

MS-(B1-S103G)8 MspA;

효소: Phi29 DNA 폴리머라제 (서열 번호 4)

실시예 10에 기술된 바와 같이 전기 측정을 하였다. 이중층에서 MS(B1)8, MS(B1-D90Q)8, MS(B1-I105L)8, MS(B1-I105Y)8, MS-(B1-I189Y-D90S)8, MS-(B1-N86T)8 또는 MS-(B1-S103G)8의 단일 세공을 얻은 후, DNA 폴리뉴클레오티드 (서열 번호 21, 22 및 23) 및 Phi29 DNA 폴리머라제를 100 ㎕의 완충제에 첨가하고, 5 min 동안 사전 인큐베이션시켰다. 이 사전 인큐베이션 믹스를 전기생리 챔버의 시스 구획 중의 900 ㎕의 완충제에 첨가하여 MspA 나노세공 중 폴리머라제-DNA 복합체의 포획을 개시시켰다 (최종 농도가 DNA = 0.5 nM, 효소 = 0.1 μM이 되도록 만들었다). 실험은 +180 mV의 정전위에서 수행하였다. DNA가 효소 결합 상태일 때 관찰되는 전류 수준을 인덱싱하고, 전류 수준, 그의 지속 기간 및 변동을 기록하였다.

본 실험에서, 기준 MS-(B1)8 돌연변이체는 +180 mV에서 35 pA인 최대 범위를 보였다 (표 20). 시험된 다른 나머지 6개의 돌연변이체인 (MS-(B1-D90Q)8, MS-(B1-I105L)8, MS-(B1-I105Y)8, MS-(B1-I89Y-D90S)8, MS-(B1-N86T)8 및 MS-(B1-S103G)8)은 모두 같은 DNA 가닥 서열에 걸쳐 기준 세공보다 더 큰 최대 범위를 가지는 것으로 관찰되었다 (표 20 참조). 그러므로, MspA 단량체 서열 중 다양한 위치에 점 돌연변이를 적용시킴으로써 신호 범위를 증가시킬 수 있었다.

실시예 12 - MS -(B1)8 기준과 MspA 돌연변이체와의 전반적인 서열분석 프로파일 비교

MspA 세공의 서열분석 프로파일은 MspA 단백질 단량체 서열 중 다양한 위치를 돌연변이화시킴으로써 조절할 수 있다.

본 실시예에서는 나노세공을 통과하는 온전한 DNA 가닥의 이동을 조절하기 위해 헬리카제를 이용함으로써 전좌 모드로 MS-(B1)₈ 세공을 MS-(B1-D90Q-D93S-I105A)8, MS-(B1-D90Q-Q126R)8, MS-(B1-L88N-D90Q-D91M)8, MS-(B1-L88N-D90Q-D91 S)8 및 MS-(B1-G75S-G77S-L88N-Q126R)8 세공과 비교하였다

실험 방법

나노세공:

MS(B1)8 MspA;

MS(B1-D90Q-D93S-I105A)8 MspA;

MS(B1-D90Q-Q126R)8 MspA;

MS(B1-L88N-D90Q-D91M)8 MspA;

MS(B1-L88N-D90Q-D91S)8 MspA;

MS(B1-G75S-G77S-L88N-Q126R)8 MspA;

효소: 헬리카제

실시예 9에 기술된 바와 같이 실험 설정을 수행하였다. 이중층에서 MS-(B1)8, MS-(B1-D90Q-D93S-I105A)8, MS-(B1-D90Q-Q126R), MS-(B1-L88N-D90Q-D91M)8, MS-(B1-L88N-D90Q-D91S)8 또는 MS-(B1-G75S-G77S-L88N-Q126R)8 중 하나의 단일 세공을 얻은 후, DNA 폴리뉴클레오티드 (서열 번호 19 및 20 (상기 제시된 서열 및 태크)) 및 헬리카제를 100 ㎕의 완충제에 첨가하고, 5 min 동안 사전 인큐베이션시켰다 (DNA = 1.5 nM, 효소 = 1 μM). 이 사전 인큐베이션 믹스를 전기생리 챔버의 시스 구획 중의 900 ㎕의 완충제에 첨가하여 MspA 나노세공 중 헬리카제-DNA 복합체의 포획을 개시시켰다 (최종 농도가 DNA = 0.15 nM, 효소 = 0.1 μM이 되도록 만들었다). 필요에 따라 2가 금속 (1 mM MgCl₂) 및 NTP (1 mM ATP)를 시스 구획에 첨가함으로써 헬리카제 ATPase 활성을 개시시켰다. 실험은 +140 mV의 정전위에서 수행하였다. DNA가 효소 결합 상태일 때 관찰되는 전류 수준을 인덱싱하고, 전류 수준, 그의 지속 기간 및 변동을 기록하였다.

본 실험에서, 기준 MS-(B1)8 돌연변이체를 통해 도 13a에 제시된 서열분석 프로파일이 작성되었다. 본 실험을 하기 돌연변이체 MS-(B1-D90Q-D93S-I105A)8, MS-(B1-D90Q-Q126R), MS-(B1-L88N-D90Q-D91M)8, MS-(B1-L88N-D90Q-D91S)8 및 MS-(B1-G75S-G77S-L88N-Q126R)8을 이용하여 반복하였는데, 이들은 다양하게 다른 서열분석 프로파일을 나타내었다 (도 13b-f 참조). 그러므로, MspA 단량체 서열내 다양한 위치에서 점 돌연변이를 일으킴으로써 검출되는 서열분석 프로파일을 변경시킬 수 있었다.

실시예 13 - MS -(B1)8 기준 세공을 사용한 RNA 가닥 서열의 분석

본 실시예는 RNA 가닥의 서열을 분석하기 위해 사용될 수 있는, Phi29 DNA 폴리머라제와 함께 조합된 MspA 기준 세공 MS-(B1)8의 사용 방법을 기술한다.

본 실시예에서는 나노세공을 통과하는 RNA 가닥의 이동을 조절하기 위해 Phi29 DNA 폴리머라제를 이용함으로써 언지핑 모드로 MS-(B1)8 세공을 이용하였다. 본 실험에서 사용된 RNA/DNA 하이브리드 기질 디자인은 도 14에 제시되어 있다 (서열 번호 24 및 25). 서열 번호 24 및 25는 하기에 제시되어 있다 (RNA는 굵은체로 표시). 실온에서 +180 mV의 적용 전위하에서 런을 수행하였다.

서열 번호 24:

서열 번호 25 (+ 콜레스테롤 태그):

물질

RNA/DNA 하이브리드 가닥 (길이 120 mer)을 합성하기 위해서는 서열 번호 24 및 25를 함께 결찰시켜야 했다. 이는 상기 두 가닥이 매우 근접해 있도록 하기 위해 상보적인 DNA 어댑터 가닥 서열 번호 26을 사용함으로써 달성하였고, 여기서 이는 함께 결찰됨으로써 120 mer DNA/RNA 하이브리드 서열 번호 27이 형성되었다.

서열 번호 27 (+ 콜레스테롤 태그; RNA은 굵은체 표시):

실험 방법

완충처리된 용액: 400 mM KCl, 10 mM Hepes (pH 8.0), 1 mM EDTA, 1 mM DTT

나노세공: MS(B1)8 MspA;

효소: Phi29 DNA 폴리머라제 (서열 번호 4)

실시예 10에 기술된 바와 같이 전기 측정을 하였다. 이중층에서 MS(B1)8의 단일 세공을 얻은 후, DNA 폴리뉴클레오티드 (서열 번호 24 및 25) 및 Phi29 DNA 폴리머라제를 100 ㎕의 완충제에 첨가하고, 5 min 동안 사전 인큐베이션시켰다. 이 사전 인큐베이션 믹스를 전기생리 챔버의 시스 구획 중의 900 ㎕의 완충제에 첨가하여 MspA 나노세공 중 폴리머라제-DNA 복합체의 포획을 개시시켰다 (최종 농도가 DNA = 0.2 nM, 효소 = 0.2 μM이 되도록 만들었다). 실험은 +180 mV의 정전위에서 수행하였다. 전류 수준을 효소 결합 상태인 DNA로부터의 이벤트로서 얻어내고, 본 이벤트를 인덱싱하고, 이벤트의 전류 수준, 지속 기간 및 변동을 기록하였다.

본 실험에서, 분자 모터로서의 Phi29 DNA 폴리머라제와 조합된 기준 MS-(B1)8 돌연변이체에서는 RNA 가닥이 세공을 통해 쓰레딩됨에 따라 뚜렷이 다른 전류 수준이 검출되는 것이 관찰되었다. 이어서, 이러한 전류 신호를 사용함으로써 표적 서열을 측정하였다. Phi29 DNA 폴리머라제 언지핑 모드에서의 전형적인 RNA 전좌 이벤트는 도 15에 제시되어 있다.

실시예 14 - MspA 이량체 및 세공 형성을 위한 올리고머화

본 실시예는 MspA 이량체의 제조 및 올리고머화를 기술한다.

이량체 제조

MspA NNNRRK 단량체 단백질은 184개의 아미노산 잔기로 구성된다. MspA-NNNRRK 단백질의 이량체 버전을 제조하기 위해 단일 폴리펩티드를 디자인하였다.

184개의 잔기로 이루어진 MspA-NNNRRK 폴리펩티드를 코딩하는 DNA 서열을 짧은 DNA 링커 서열을 통해 동일한 폴리펩티드를 쇄를 코딩하는 제2 DNA 서열에 연결시켰다. 링커 DNA 서열은 SGSGSGDDDDDDDDSGSGSS (서열 번호 33; -(SG)₃-D₈-(SG)₂(SS)-로 제시됨)를 코딩한다. 제1 염기 바로 앞에 개시 인자 코돈 (ATG)을 부가하고, 종결 코돈 2개를 코딩하는 DNA (TAATAG)는 마지막 염기 다음에 부가하였다. 그러므로, MspA-NNNRRK-(SG)₃-D₈-(SG)₂(SS)-MspA-NNNRRK를 코딩하는 전체 DNA 서열은 서열 번호 28에 제시되어 있다.

진스크립트 USA 인코퍼레이티드(GenScript USA Inc)에서 DNA를 합성하였고, 이를 발현 목적으로 pT7 벡터로 클로닝하였다.

환형 DNA용 E. 콜라이 T7-S30 추출 시스템 (프로메가(Promega))을 사용하여 커플링된 시험관내 전사 및 번역 (IVTT)에 의해 단백질을 생성하였다.

시스테인이 없는 완전한 1 mM 아미노산 혼합물 및 메티오닌이 없는 완전한 1 mM 아미노산 혼합물을 동일한 부피로 혼합하여 고농도의 단백질을 생성하는 데 필요한 작업 아미노산 용액을 수득하였다. 아미노산 믹스 (2.5.0 ㎕), 프리믹스 용액 (10 ㎕), [35S]L-메티오닌 (0.5 ㎕) 및 리팜피신 (2 ㎕, 50 mg/mL)을 플라스미드 DNA (4 ㎕, 400 ng/mL) 및 T7 S30 추출물 (7.5 ㎕)과 함께 혼합하였다. 37℃에서 90 min 동안 합성을 수행하여 MspA-NNNRRK 단량체 및 이량체에 대한 25 ㎕의 IVTT 단백질을 생성하였다. 반응 후, 샘플을 25,000 g으로 10 min 동안 원심분리하고, 상청액을 버렸다. 펠릿을 100 ㎕의 MBSA (10 mM MOPS, 150 mM NaCl (pH 7.4), 1 mg/mL BSA 함유)로 세척하고, 25 ㎕ 라멜라(Lamellae) 샘플 완충제 중에 재현탁시켰다. 샘플을 10% 겔 상에서 SDS-PAGE하였다. 겔을 80℃에서 45 min 동안 건조시키고, 2시간 동안 X선 필름에 노출시켰다. 겔은 2개의 상이한 밴드를 나타내었는데, 하나는 MspA 이량체에 상응하는 것이고, 또 다른 하나는 MspA 단량체에 상응하는 것이었다.

단량체 및 이량체의 올리고머화

합성 지질 소포체의 존재하에서 이량체, 및 별도로 단량체의 발현을 수행하여 올리고머화를 촉진시켰다. 5가지 성분으로 이루어진 지질 혼합물 (PS:SM:PE: PC:콜레스테롤의 비 10:10:20:30:30, 25 mg/mL)을 사용하였다. 50 ㎕의 지질 혼합물을 1.5 mL 에펜도르프 튜브 중에서 25,000 g에서 10 min 동안 원심분리하고, 상청액을 버렸다. 시스테인이 없는 완전한 1 mM 아미노산 혼합물 및 메티오닌이 없는 완전한 1 mM 아미노산 혼합물을 동일한 부피로 혼합하여 고농도의 단백질을 생성하는 데 필요한 작업 아미노산 용액을 수득하였다. 막 펠릿을 아미노산 믹스 (10.0 ㎕), 프리믹스 용액 (40 ㎕), [35S]L-메티오닌 및 리팜피신 (2 ㎕, 50 mg/mL)와 함께 재현탁시켰다. 플라스미드 DNA (16 ㎕, 400 ng/mL) 및 T7 S30 추출물 (30.0 ㎕)을 첨가하여 합성을 개시시켰다. 37℃에서 90 min 동안 합성을 수행하여 100 ㎕의 IVTT 단백질을 생성하였다. IVTT 반응 샘플을 원심분리하고 (25,000 g, 10 min) 및 생성된 막 펠릿을 MBSA로 세척하고, 7.5% 겔 중에서 SDS-폴리아크릴아미드 겔 전기영동을 하였다. 겔을 50℃에서 3시간 동안 와트맨(watman) 3M 종이 상에서 건조시키고, 2시간 동안 X선 필름에 노출시켰다. 겔은 올리고머화된 MspA 이량체에 대하여 8개의 상이한 밴드를 나타내었는데, 이들 모두 SDS PAGE에서 올리고머화된 단량체보다 더 느린 속도로 이동하였다.

이중층 실험을 위한 단백질 정제

이량체 올리고머화 실험으로부터 얻은 3개의 단백질 밴드를 겔로부터 잘라내고, 정제하였다. 주형으로서 오토라디오그램을 이용하여, 밴드를 절단하고, 완충제 (150 내지 200 ㎕의 25 mM 트리스.HCl (pH 8.0)) 중에 재수화시켰다. 종이를 제거하고, 막자를 사용하여 겔 조각을 파쇄시켰다. 25,000 x g로 10 min 동안 원심분리하여 퀴아슈레더(QIAshredder) 칼럼 (퀴아젠(Qiagen)))을 통해 슬러리를 여과하였다. 이어서, 단량체 수준으로부터 세번째 밴드로부터 생성된 단백질을 실시예 15에 기술되는 전기생리 실험에서 사용하였다.

실시예 15 - 단량체로부터 올리고머화된 MS -(B1)8과 이량체로부터 올리고머화된 MS -(B1-B1)4의 비교

본 실시예에서는 나노세공을 통과하는 온전한 DNA 가닥 (서열 번호 19 및 20 (상기 제시된 서열 및 태그))의 이동을 조절하기 위해 헬리카제를 이용함으로써 전좌 모드로 단량체로부터 올리고머화된 MS-(B1)8 세공 (서열 번호 2)을 이량체로부터 올리고머화된 MS-(B1-B1)4 세공 (서열 번호 29)을 비교하였다.

실험 방법

나노세공: MS-(B1)8;

MS-(B1-B1)4

효소: 헬리카제

은 도금된 128 웰 실리콘 칩 (포맷 75 ㎛ 직경, 20 ㎛ 깊이 및 250 ㎛ 피치)을 사용하여 전기 측정을 하였다 (WO 2009/077734). 먼저, 칩을 20 mL 에탄올로 세척한 후, 20 mL dH₂O, 이어서, CF4 플라즈마 처리 이전에 20 mL 에탄올로 세척하였다. 이어서, 사용되는 칩을 딥 코팅하여 전처리하고, 진공 밀봉하고, 4℃에서 보관하였다. 사용하기 전, 칩을 20분 이상 동안 실온으로 가온시켰다.

1 M KCl, 10 mM 트리스 (pH 7.5)에 용해된 3.6 mg/mL 1,2-디피타노일-글리세로-3-포스포콜린 지질 (DPhPC, 아반티 폴라 리피드(미국 앨라배마주))로 이루어진 일련의 슬러그를 0.45 ㎕/s로 칩을 통해 통과시킴으로써 이중층을 형성하였다. 먼저, 칩을 통과하도록 지질 슬러그 (250 ㎕)를 유동시킨 후, 100 ㎕의 대기 슬러그를 유동시켰다. 이어서, 각각 100 ㎕의 대기 슬러그로 분리되어 있는, 155 ㎕ 및 150 ㎕의 지질 용액으로 이루어진 2개의 추가의 슬러그를 칩 상에 통과시켰다. 이중층 형성 후, 3 ㎕/s 유속으로 3 mL의 완충제로 챔버를 플러싱하였다. 1.0 pF의 적분 정전 용량을 이용하여 10 kHz에서 이중층 형성의 전기 기록을 수행하였다.

단량체로부터 올리고머화된 MS-(B1)8 세공 또는 이량체로부터 올리고머화된 MS-(B1-B1)4 세공을 사용하여 10 mM 트리스, 1 mM EDTA (pH 8.0) 중에서 생물학적 나노세공의 용액을 제조하였다. +180 mV의 유지 전위를 적용하고, 용액을 칩 상에 유동시키고, 세공이 이중층 내로 유입될 수 있도록 하였다. 이어서, 샘플링 속도 및 적분 정전 용량은 각각 10 kHz 및 1.0 pF로 유지시키고, 적용 전위를 0까지 감소시켰다.

+180 mV의 유지 전위를 적용하는 대조군 프로그램을 실행시켰다. DNA 폴리뉴클레오티드 (서열 번호 19 및 20) 및 헬리카제를 5 min 동안 사전 인큐베이션시켰다. 이어서, 상기 사전 인큐베이션 믹스 (MgCl₂ 및 ATP 포함)를 칩 상에 유동시켜 MspA 나노세공 중 헬리카제-DNA 복합체의 포획을 개시시켰다 (최종 농도가 DNA = 1.5 nM, 효소 = 10 nM이 되도록 만들었다). 실험은 +180 mV의 정전위에서 수행하였다. 전류 수준을 효소 결합 상태인 DNA로부터의 이벤트로서 얻었다. 이 이벤트와 인덱싱하고, 이벤트의 전류 수준, 지속 기간 및 변동을 기록하였다.

본 실험에서, 이량체의 올리고머화로부터 형성된 기준 MS-(B1-B1)4 돌연변이체 세공은 단량체의 올리고머화로부터 형성된 MS(B1)8 세공만큼 효과적으로 지질 이중층 내로 삽입하였다 (MS(B1)8 및 MS-(B1-B1)4에 대한 세공 삽입을 보여주는 도 16 참조). 단량체 및 이량체 올리고머화된 세공을 분자 모터로서 헬라카제와 함께 조합하였을 때, DNA 가닥이 세공을 통해 쓰레딩됨에 따라 뚜렷이 다른 전류 수준이 검출될 수 있었다. 헬리카제 전좌 모드의 전형적인 DNA 전좌 이벤트는 단량체의 올리고머화로부터 형성된 MS-(B1)8 세공의 경우, 도 17에, 및 이량체의 올리고머화로부터 형성된 MS-(B1-B1)4 세공의 경우, 도 18에 제시되어 있다. 그러므로, 이량체 단위로부터 올리고머화된 MS-(B1-B1)4 세공 돌연변이체가 단량체 단위로부터 올리고머화된 MS-(B1)8 세공 돌연변이체만큼 우수한 세공이라는 것이 밝혀졌다.

실시예 16 - 시토신으로부터 5- 메틸시토신을 구별하기 위한 MS -(B1- L88N )8 돌연변이체 MspA 세공의 용도

본 실시예는 시토신을 그의 후생학적 방식으로 변형된 염기 5-메틸시토신으로부터 구별해내기 위해 사용될 수 있는 MspA의 MS-(B1-L88N)8 돌연변이체 세공의 사용 방법을 기술한다. 본 실험에서 사용된 DNA 기질 디자인은 도 19에 제시되어 있고, 하기 서열을 가진다:

(상기 서열은 9T 뉴클레오티드 및 5' 말단에 IDT Int d Spacer (idSp)를 포함하는 서열 번호 30이다). mC는 5-메틸시토신

(서열 번호 31) 및

(5' 콜레스테릴-TEG 태그를 포함하는 서열 번호 32)을 나타낸다.

물질

도 19에 제시된 DNA 가닥 구축물을 형성하기 위해서는 서열 번호 30, 31 및 32를 함께 하이브리드화시켜야 했다. 이는 3가닥 모두를 동시에 사전 인큐베이션시킴으로써 수행되었다.

실험 방법

완충 처리된 용액: 1 M KCl, 10 mM Hepes (pH 8.0), 1 mM ATP, 1 mM MgCl₂, 1 mM DTT

나노세공: MS(B1-L88N)8 MspA

효소: 헬리카제

실시예 9에 기술된 바와 같이 실험 설정을 수행하였다. 이중층에서 MS-(B1-L88N)8의 단일 세공을 얻은 후, DNA 폴리뉴클레오티드 (서열 번호 30, 31 및 32) 및 헬리카제를 50 ㎕의 완충제에 첨가하고, 5 min 동안 사전 인큐베이션시켰다 (DNA = 5 nM, 효소 = 100 nM). 이 사전 인큐베이션 믹스를 전기생리 챔버의 시스 구획 중의 950 ㎕의 완충제에 첨가하여 MspA 나노세공 중 헬리카제-DNA 복합체의 포획을 개시시켰다 (최종 농도가 DNA = 5 nM, 효소 = 100 nM이 되도록 만들었다). 필요에 따라 2가 금속 (1 mM MgCl₂) 및 NTP (1 mM ATP)를 시스 구획에 첨가함으로써 헬리카제 ATPase 활성을 개시시켰다. 실험은 +120 mV의 정전위에서 수행하였다. 전류 수준을 효소 결합 상태인 DNA로부터의 이벤트로서 얻어내었다. 본 이벤트를 인덱싱하고, 이벤트의 전류 수준, 지속 기간 및 변동을 기록하였다.

본 실험에서는 시토신 및 5-메틸시토신이 헬리카제의 조절하에 MS-(B1-L88N)8 세공을 통해 전좌되었을 때, 다른 전류 수준을 생성한 것으로 관찰되었다 (도 20 참조). 그러므로, 이러한 돌연변이화된 형태의 MspA를 사용함으로써 시토신을 그의 후생학적 방식으로 변형된 염기 5-메틸시토신으로부터 구별해낼 수 있었다.

SEQUENCE LISTING <110> Oxford Nanopore Technologies Limited <120> Mutant Pores <130> N.112981B <150> US 61/441,718 <151> 2011-02-11 <160> 33 <170> PatentIn version 3.5 <210> 1 <211> 558 <212> DNA <213> Artificial Sequence <220> <223> NNN-RRK mutant MspA monomer <400> 1 atgggtctgg ataatgaact gagcctggtg gacggtcaag atcgtaccct gacggtgcaa 60 caatgggata cctttctgaa tggcgttttt ccgctggatc gtaatcgcct gacccgtgaa 120 tggtttcatt ccggtcgcgc aaaatatatc gtcgcaggcc cgggtgctga cgaattcgaa 180 ggcacgctgg aactgggtta tcagattggc tttccgtggt cactgggcgt tggtatcaac 240 ttctcgtaca ccacgccgaa tattctgatc aacaatggta acattaccgc accgccgttt 300 ggcctgaaca gcgtgattac gccgaacctg tttccgggtg ttagcatctc tgcccgtctg 360 ggcaatggtc cgggcattca agaagtggca acctttagtg tgcgcgtttc cggcgctaaa 420 ggcggtgtcg cggtgtctaa cgcccacggt accgttacgg gcgcggccgg cggtgtcctg 480 ctgcgtccgt tcgcgcgcct gattgcctct accggcgaca gcgttacgac ctatggcgaa 540 ccgtggaata tgaactaa 558 <210> 2 <211> 184 <212> PRT <213> Artificial Sequence <220> <223> Mature form of NNN-RRK mutant of the MspA monomer <400> 2 Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu 1 5 10 15 Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp 20 25 30 Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr 35 40 45 Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu 50 55 60 Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe 65 70 75 80 Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asn Asn Gly Asn Ile Thr Ala 85 90 95 Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly 100 105 110 Val Ser Ile Ser Ala Arg Leu Gly Asn Gly Pro Gly Ile Gln Glu Val 115 120 125 Ala Thr Phe Ser Val Arg Val Ser Gly Ala Lys Gly Gly Val Ala Val 130 135 140 Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu 145 150 155 160 Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr 165 170 175 Tyr Gly Glu Pro Trp Asn Met Asn 180 <210> 3 <211> 1830 <212> DNA <213> Bacillus subtilis phage Phi29 <400> 3 atgaaacaca tgccgcgtaa aatgtatagc tgcgcgtttg aaaccacgac caaagtggaa 60 gattgtcgcg tttgggccta tggctacatg aacatcgaag atcattctga atacaaaatc 120 ggtaacagtc tggatgaatt tatggcatgg gtgctgaaag ttcaggcgga tctgtacttc 180 cacaacctga aatttgatgg cgcattcatt atcaactggc tggaacgtaa tggctttaaa 240 tggagcgcgg atggtctgcc gaacacgtat aataccatta tctctcgtat gggccagtgg 300 tatatgattg atatctgcct gggctacaaa ggtaaacgca aaattcatac cgtgatctat 360 gatagcctga aaaaactgcc gtttccggtg aagaaaattg cgaaagattt caaactgacg 420 gttctgaaag gcgatattga ttatcacaaa gaacgtccgg ttggttacaa aatcaccccg 480 gaagaatacg catacatcaa aaacgatatc cagatcatcg cagaagcgct gctgattcag 540 tttaaacagg gcctggatcg catgaccgcg ggcagtgata gcctgaaagg tttcaaagat 600 atcatcacga ccaaaaaatt caaaaaagtg ttcccgacgc tgagcctggg tctggataaa 660 gaagttcgtt atgcctaccg cggcggtttt acctggctga acgatcgttt caaagaaaaa 720 gaaattggcg agggtatggt gtttgatgtt aatagtctgt atccggcaca gatgtacagc 780 cgcctgctgc cgtatggcga accgatcgtg ttcgagggta aatatgtttg ggatgaagat 840 tacccgctgc atattcagca catccgttgt gaatttgaac tgaaagaagg ctatattccg 900 accattcaga tcaaacgtag tcgcttctat aagggtaacg aatacctgaa aagctctggc 960 ggtgaaatcg cggatctgtg gctgagtaac gtggatctgg aactgatgaa agaacactac 1020 gatctgtaca acgttgaata catcagcggc ctgaaattta aagccacgac cggtctgttc 1080 aaagatttca tcgataaatg gacctacatc aaaacgacct ctgaaggcgc gattaaacag 1140 ctggccaaac tgatgctgaa cagcctgtat ggcaaattcg cctctaatcc ggatgtgacc 1200 ggtaaagttc cgtacctgaa agaaaatggc gcactgggtt ttcgcctggg cgaagaagaa 1260 acgaaagatc cggtgtatac cccgatgggt gttttcatta cggcctgggc acgttacacg 1320 accatcaccg cggcccaggc atgctatgat cgcattatct actgtgatac cgattctatt 1380 catctgacgg gcaccgaaat cccggatgtg attaaagata tcgttgatcc gaaaaaactg 1440 ggttattggg cccacgaaag tacgtttaaa cgtgcaaaat acctgcgcca gaaaacctac 1500 atccaggata tctacatgaa agaagtggat ggcaaactgg ttgaaggttc tccggatgat 1560 tacaccgata tcaaattcag tgtgaaatgc gccggcatga cggataaaat caaaaaagaa 1620 gtgaccttcg aaaacttcaa agttggtttc agccgcaaaa tgaaaccgaa accggtgcag 1680 gttccgggcg gtgtggttct ggtggatgat acgtttacca ttaaatctgg cggtagtgcg 1740 tggagccatc cgcagttcga aaaaggcggt ggctctggtg gcggttctgg cggtagtgcc 1800 tggagccacc cgcagtttga aaaataataa 1830 <210> 4 <211> 608 <212> PRT <213> Bacillus subtilis phage Phi29 <400> 4 Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Ala Phe Glu Thr Thr 1 5 10 15 Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile 20 25 30 Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met 35 40 45 Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys 50 55 60 Phe Asp Gly Ala Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys 65 70 75 80 Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg 85 90 95 Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys 100 105 110 Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe 115 120 125 Pro Val Lys Lys Ile Ala Lys Asp Phe Lys Leu Thr Val Leu Lys Gly 130 135 140 Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro 145 150 155 160 Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala 165 170 175 Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser 180 185 190 Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys 195 200 205 Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Tyr 210 215 220 Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Glu Lys 225 230 235 240 Glu Ile Gly Glu Gly Met Val Phe Asp Val Asn Ser Leu Tyr Pro Ala 245 250 255 Gln Met Tyr Ser Arg Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu 260 265 270 Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile 275 280 285 Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile 290 295 300 Lys Arg Ser Arg Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly 305 310 315 320 Gly Glu Ile Ala Asp Leu Trp Leu Ser Asn Val Asp Leu Glu Leu Met 325 330 335 Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys 340 345 350 Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr 355 360 365 Tyr Ile Lys Thr Thr Ser Glu Gly Ala Ile Lys Gln Leu Ala Lys Leu 370 375 380 Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr 385 390 395 400 Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu 405 410 415 Gly Glu Glu Glu Thr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe 420 425 430 Ile Thr Ala Trp Ala Arg Tyr Thr Thr Ile Thr Ala Ala Gln Ala Cys 435 440 445 Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly 450 455 460 Thr Glu Ile Pro Asp Val Ile Lys Asp Ile Val Asp Pro Lys Lys Leu 465 470 475 480 Gly Tyr Trp Ala His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg 485 490 495 Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Glu Val Asp Gly Lys 500 505 510 Leu Val Glu Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val 515 520 525 Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Lys Glu Val Thr Phe Glu 530 535 540 Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Pro Val Gln 545 550 555 560 Val Pro Gly Gly Val Val Leu Val Asp Asp Thr Phe Thr Ile Lys Ser 565 570 575 Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser 580 585 590 Gly Gly Gly Ser Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys 595 600 605 <210> 5 <211> 1390 <212> DNA <213> Escherichia coli <400> 5 atgatgaacg atggcaaaca gcagagcacc ttcctgtttc atgattatga aaccttcggt 60 acccatccgg ccctggatcg tccggcgcag tttgcggcca ttcgcaccga tagcgaattc 120 aatgtgattg gcgaaccgga agtgttttat tgcaaaccgg ccgatgatta tctgccgcag 180 ccgggtgcgg tgctgattac cggtattacc ccgcaggaag cgcgcgcgaa aggtgaaaac 240 gaagcggcgt ttgccgcgcg cattcatagc ctgtttaccg tgccgaaaac ctgcattctg 300 ggctataaca atgtgcgctt cgatgatgaa gttacccgta atatctttta tcgtaacttt 360 tatgatccgt atgcgtggag ctggcagcat gataacagcc gttgggatct gctggatgtg 420 atgcgcgcgt gctatgcgct gcgcccggaa ggcattaatt ggccggaaaa cgatgatggc 480 ctgccgagct ttcgtctgga acatctgacc aaagccaacg gcattgaaca tagcaatgcc 540 catgatgcga tggccgatgt ttatgcgacc attgcgatgg cgaaactggt taaaacccgt 600 cagccgcgcc tgtttgatta tctgtttacc caccgtaaca aacacaaact gatggcgctg 660 attgatgttc cgcagatgaa accgctggtg catgtgagcg gcatgtttgg cgcctggcgc 720 ggcaacacca gctgggtggc cccgctggcc tggcacccgg aaaatcgtaa cgccgtgatt 780 atggttgatc tggccggtga tattagcccg ctgctggaac tggatagcga taccctgcgt 840 gaacgcctgt ataccgccaa aaccgatctg ggcgataatg ccgccgtgcc ggtgaaactg 900 gttcacatta acaaatgccc ggtgctggcc caggcgaaca ccctgcgccc ggaagatgcg 960 gatcgtctgg gtattaatcg ccagcattgt ctggataatc tgaaaatcct gcgtgaaaac 1020 ccgcaggtgc gtgaaaaagt ggtggcgatc ttcgcggaag cggaaccgtt caccccgagc 1080 gataacgtgg atgcgcagct gtataacggc ttctttagcg atgccgatcg cgcggcgatg 1140 aaaatcgttc tggaaaccga accgcgcaat ctgccggcgc tggatattac ctttgttgat 1200 aaacgtattg aaaaactgct gtttaattat cgtgcgcgca attttccggg taccctggat 1260 tatgccgaac agcagcgttg gctggaacat cgtcgtcagg ttttcacccc ggaatttctg 1320 cagggttatg cggatgaact gcagatgctg gttcagcagt atgccgatga taaagaaaaa 1380 gtggcgctgc 1390 <210> 6 <211> 485 <212> PRT <213> Escherichia coli <400> 6 Met Met Asn Asp Gly Lys Gln Gln Ser Thr Phe Leu Phe His Asp Tyr 1 5 10 15 Glu Thr Phe Gly Thr His Pro Ala Leu Asp Arg Pro Ala Gln Phe Ala 20 25 30 Ala Ile Arg Thr Asp Ser Glu Phe Asn Val Ile Gly Glu Pro Glu Val 35 40 45 Phe Tyr Cys Lys Pro Ala Asp Asp Tyr Leu Pro Gln Pro Gly Ala Val 50 55 60 Leu Ile Thr Gly Ile Thr Pro Gln Glu Ala Arg Ala Lys Gly Glu Asn 65 70 75 80 Glu Ala Ala Phe Ala Ala Arg Ile His Ser Leu Phe Thr Val Pro Lys 85 90 95 Thr Cys Ile Leu Gly Tyr Asn Asn Val Arg Phe Asp Asp Glu Val Thr 100 105 110 Arg Asn Ile Phe Tyr Arg Asn Phe Tyr Asp Pro Tyr Ala Trp Ser Trp 115 120 125 Gln His Asp Asn Ser Arg Trp Asp Leu Leu Asp Val Met Arg Ala Cys 130 135 140 Tyr Ala Leu Arg Pro Glu Gly Ile Asn Trp Pro Glu Asn Asp Asp Gly 145 150 155 160 Leu Pro Ser Phe Arg Leu Glu His Leu Thr Lys Ala Asn Gly Ile Glu 165 170 175 His Ser Asn Ala His Asp Ala Met Ala Asp Val Tyr Ala Thr Ile Ala 180 185 190 Met Ala Lys Leu Val Lys Thr Arg Gln Pro Arg Leu Phe Asp Tyr Leu 195 200 205 Phe Thr His Arg Asn Lys His Lys Leu Met Ala Leu Ile Asp Val Pro 210 215 220 Gln Met Lys Pro Leu Val His Val Ser Gly Met Phe Gly Ala Trp Arg 225 230 235 240 Gly Asn Thr Ser Trp Val Ala Pro Leu Ala Trp His Pro Glu Asn Arg 245 250 255 Asn Ala Val Ile Met Val Asp Leu Ala Gly Asp Ile Ser Pro Leu Leu 260 265 270 Glu Leu Asp Ser Asp Thr Leu Arg Glu Arg Leu Tyr Thr Ala Lys Thr 275 280 285 Asp Leu Gly Asp Asn Ala Ala Val Pro Val Lys Leu Val His Ile Asn 290 295 300 Lys Cys Pro Val Leu Ala Gln Ala Asn Thr Leu Arg Pro Glu Asp Ala 305 310 315 320 Asp Arg Leu Gly Ile Asn Arg Gln His Cys Leu Asp Asn Leu Lys Ile 325 330 335 Leu Arg Glu Asn Pro Gln Val Arg Glu Lys Val Val Ala Ile Phe Ala 340 345 350 Glu Ala Glu Pro Phe Thr Pro Ser Asp Asn Val Asp Ala Gln Leu Tyr 355 360 365 Asn Gly Phe Phe Ser Asp Ala Asp Arg Ala Ala Met Lys Ile Val Leu 370 375 380 Glu Thr Glu Pro Arg Asn Leu Pro Ala Leu Asp Ile Thr Phe Val Asp 385 390 395 400 Lys Arg Ile Glu Lys Leu Leu Phe Asn Tyr Arg Ala Arg Asn Phe Pro 405 410 415 Gly Thr Leu Asp Tyr Ala Glu Gln Gln Arg Trp Leu Glu His Arg Arg 420 425 430 Gln Val Phe Thr Pro Glu Phe Leu Gln Gly Tyr Ala Asp Glu Leu Gln 435 440 445 Met Leu Val Gln Gln Tyr Ala Asp Asp Lys Glu Lys Val Ala Leu Leu 450 455 460 Lys Ala Leu Trp Gln Tyr Ala Glu Glu Ile Val Ser Gly Ser Gly His 465 470 475 480 His His His His His 485 <210> 7 <211> 804 <212> DNA <213> Escherichia coli <400> 7 atgaaatttg tctcttttaa tatcaacggc ctgcgcgcca gacctcacca gcttgaagcc 60 atcgtcgaaa agcaccaacc ggatgtgatt ggcctgcagg agacaaaagt tcatgacgat 120 atgtttccgc tcgaagaggt ggcgaagctc ggctacaacg tgttttatca cgggcagaaa 180 ggccattatg gcgtggcgct gctgaccaaa gagacgccga ttgccgtgcg tcgcggcttt 240 cccggtgacg acgaagaggc gcagcggcgg attattatgg cggaaatccc ctcactgctg 300 ggtaatgtca ccgtgatcaa cggttacttc ccgcagggtg aaagccgcga ccatccgata 360 aaattcccgg caaaagcgca gttttatcag aatctgcaaa actacctgga aaccgaactc 420 aaacgtgata atccggtact gattatgggc gatatgaata tcagccctac agatctggat 480 atcggcattg gcgaagaaaa ccgtaagcgc tggctgcgta ccggtaaatg ctctttcctg 540 ccggaagagc gcgaatggat ggacaggctg atgagctggg ggttggtcga taccttccgc 600 catgcgaatc cgcaaacagc agatcgtttc tcatggtttg attaccgctc aaaaggtttt 660 gacgataacc gtggtctgcg catcgacctg ctgctcgcca gccaaccgct ggcagaatgt 720 tgcgtagaaa ccggcatcga ctatgaaatc cgcagcatgg aaaaaccgtc cgatcacgcc 780 cccgtctggg cgaccttccg ccgc 804 <210> 8 <211> 268 <212> PRT <213> Escherichia coli <400> 8 Met Lys Phe Val Ser Phe Asn Ile Asn Gly Leu Arg Ala Arg Pro His 1 5 10 15 Gln Leu Glu Ala Ile Val Glu Lys His Gln Pro Asp Val Ile Gly Leu 20 25 30 Gln Glu Thr Lys Val His Asp Asp Met Phe Pro Leu Glu Glu Val Ala 35 40 45 Lys Leu Gly Tyr Asn Val Phe Tyr His Gly Gln Lys Gly His Tyr Gly 50 55 60 Val Ala Leu Leu Thr Lys Glu Thr Pro Ile Ala Val Arg Arg Gly Phe 65 70 75 80 Pro Gly Asp Asp Glu Glu Ala Gln Arg Arg Ile Ile Met Ala Glu Ile 85 90 95 Pro Ser Leu Leu Gly Asn Val Thr Val Ile Asn Gly Tyr Phe Pro Gln 100 105 110 Gly Glu Ser Arg Asp His Pro Ile Lys Phe Pro Ala Lys Ala Gln Phe 115 120 125 Tyr Gln Asn Leu Gln Asn Tyr Leu Glu Thr Glu Leu Lys Arg Asp Asn 130 135 140 Pro Val Leu Ile Met Gly Asp Met Asn Ile Ser Pro Thr Asp Leu Asp 145 150 155 160 Ile Gly Ile Gly Glu Glu Asn Arg Lys Arg Trp Leu Arg Thr Gly Lys 165 170 175 Cys Ser Phe Leu Pro Glu Glu Arg Glu Trp Met Asp Arg Leu Met Ser 180 185 190 Trp Gly Leu Val Asp Thr Phe Arg His Ala Asn Pro Gln Thr Ala Asp 195 200 205 Arg Phe Ser Trp Phe Asp Tyr Arg Ser Lys Gly Phe Asp Asp Asn Arg 210 215 220 Gly Leu Arg Ile Asp Leu Leu Leu Ala Ser Gln Pro Leu Ala Glu Cys 225 230 235 240 Cys Val Glu Thr Gly Ile Asp Tyr Glu Ile Arg Ser Met Glu Lys Pro 245 250 255 Ser Asp His Ala Pro Val Trp Ala Thr Phe Arg Arg 260 265 <210> 9 <211> 1275 <212> DNA <213> Thermus thermophilus <400> 9 atgtttcgtc gtaaagaaga tctggatccg ccgctggcac tgctgccgct gaaaggcctg 60 cgcgaagccg ccgcactgct ggaagaagcg ctgcgtcaag gtaaacgcat tcgtgttcac 120 ggcgactatg atgcggatgg cctgaccggc accgcgatcc tggttcgtgg tctggccgcc 180 ctgggtgcgg atgttcatcc gtttatcccg caccgcctgg aagaaggcta tggtgtcctg 240 atggaacgcg tcccggaaca tctggaagcc tcggacctgt ttctgaccgt tgactgcggc 300 attaccaacc atgcggaact gcgcgaactg ctggaaaatg gcgtggaagt cattgttacc 360 gatcatcata cgccgggcaa aacgccgccg ccgggtctgg tcgtgcatcc ggcgctgacg 420 ccggatctga aagaaaaacc gaccggcgca ggcgtggcgt ttctgctgct gtgggcactg 480 catgaacgcc tgggcctgcc gccgccgctg gaatacgcgg acctggcagc cgttggcacc 540 attgccgacg ttgccccgct gtggggttgg aatcgtgcac tggtgaaaga aggtctggca 600 cgcatcccgg cttcatcttg ggtgggcctg cgtctgctgg ctgaagccgt gggctatacc 660 ggcaaagcgg tcgaagtcgc tttccgcatc gcgccgcgca tcaatgcggc ttcccgcctg 720 ggcgaagcgg aaaaagccct gcgcctgctg ctgacggatg atgcggcaga agctcaggcg 780 ctggtcggcg aactgcaccg tctgaacgcc cgtcgtcaga ccctggaaga agcgatgctg 840 cgcaaactgc tgccgcaggc cgacccggaa gcgaaagcca tcgttctgct ggacccggaa 900 ggccatccgg gtgttatggg tattgtggcc tctcgcatcc tggaagcgac cctgcgcccg 960 gtctttctgg tggcccaggg caaaggcacc gtgcgttcgc tggctccgat ttccgccgtc 1020 gaagcactgc gcagcgcgga agatctgctg ctgcgttatg gtggtcataa agaagcggcg 1080 ggtttcgcaa tggatgaagc gctgtttccg gcgttcaaag cacgcgttga agcgtatgcc 1140 gcacgtttcc cggatccggt tcgtgaagtg gcactgctgg atctgctgcc ggaaccgggc 1200 ctgctgccgc aggtgttccg tgaactggca ctgctggaac cgtatggtga aggtaacccg 1260 gaaccgctgt tcctg 1275 <210> 10 <211> 425 <212> PRT <213> Thermus thermophilus <400> 10 Met Phe Arg Arg Lys Glu Asp Leu Asp Pro Pro Leu Ala Leu Leu Pro 1 5 10 15 Leu Lys Gly Leu Arg Glu Ala Ala Ala Leu Leu Glu Glu Ala Leu Arg 20 25 30 Gln Gly Lys Arg Ile Arg Val His Gly Asp Tyr Asp Ala Asp Gly Leu 35 40 45 Thr Gly Thr Ala Ile Leu Val Arg Gly Leu Ala Ala Leu Gly Ala Asp 50 55 60 Val His Pro Phe Ile Pro His Arg Leu Glu Glu Gly Tyr Gly Val Leu 65 70 75 80 Met Glu Arg Val Pro Glu His Leu Glu Ala Ser Asp Leu Phe Leu Thr 85 90 95 Val Asp Cys Gly Ile Thr Asn His Ala Glu Leu Arg Glu Leu Leu Glu 100 105 110 Asn Gly Val Glu Val Ile Val Thr Asp His His Thr Pro Gly Lys Thr 115 120 125 Pro Pro Pro Gly Leu Val Val His Pro Ala Leu Thr Pro Asp Leu Lys 130 135 140 Glu Lys Pro Thr Gly Ala Gly Val Ala Phe Leu Leu Leu Trp Ala Leu 145 150 155 160 His Glu Arg Leu Gly Leu Pro Pro Pro Leu Glu Tyr Ala Asp Leu Ala 165 170 175 Ala Val Gly Thr Ile Ala Asp Val Ala Pro Leu Trp Gly Trp Asn Arg 180 185 190 Ala Leu Val Lys Glu Gly Leu Ala Arg Ile Pro Ala Ser Ser Trp Val 195 200 205 Gly Leu Arg Leu Leu Ala Glu Ala Val Gly Tyr Thr Gly Lys Ala Val 210 215 220 Glu Val Ala Phe Arg Ile Ala Pro Arg Ile Asn Ala Ala Ser Arg Leu 225 230 235 240 Gly Glu Ala Glu Lys Ala Leu Arg Leu Leu Leu Thr Asp Asp Ala Ala 245 250 255 Glu Ala Gln Ala Leu Val Gly Glu Leu His Arg Leu Asn Ala Arg Arg 260 265 270 Gln Thr Leu Glu Glu Ala Met Leu Arg Lys Leu Leu Pro Gln Ala Asp 275 280 285 Pro Glu Ala Lys Ala Ile Val Leu Leu Asp Pro Glu Gly His Pro Gly 290 295 300 Val Met Gly Ile Val Ala Ser Arg Ile Leu Glu Ala Thr Leu Arg Pro 305 310 315 320 Val Phe Leu Val Ala Gln Gly Lys Gly Thr Val Arg Ser Leu Ala Pro 325 330 335 Ile Ser Ala Val Glu Ala Leu Arg Ser Ala Glu Asp Leu Leu Leu Arg 340 345 350 Tyr Gly Gly His Lys Glu Ala Ala Gly Phe Ala Met Asp Glu Ala Leu 355 360 365 Phe Pro Ala Phe Lys Ala Arg Val Glu Ala Tyr Ala Ala Arg Phe Pro 370 375 380 Asp Pro Val Arg Glu Val Ala Leu Leu Asp Leu Leu Pro Glu Pro Gly 385 390 395 400 Leu Leu Pro Gln Val Phe Arg Glu Leu Ala Leu Leu Glu Pro Tyr Gly 405 410 415 Glu Gly Asn Pro Glu Pro Leu Phe Leu 420 425 <210> 11 <211> 738 <212> DNA <213> Bacteriophage lambda <400> 11 tccggaagcg gctctggtag tggttctggc atgacaccgg acattatcct gcagcgtacc 60 gggatcgatg tgagagctgt cgaacagggg gatgatgcgt ggcacaaatt acggctcggc 120 gtcatcaccg cttcagaagt tcacaacgtg atagcaaaac cccgctccgg aaagaagtgg 180 cctgacatga aaatgtccta cttccacacc ctgcttgctg aggtttgcac cggtgtggct 240 ccggaagtta acgctaaagc actggcctgg ggaaaacagt acgagaacga cgccagaacc 300 ctgtttgaat tcacttccgg cgtgaatgtt actgaatccc cgatcatcta tcgcgacgaa 360 agtatgcgta ccgcctgctc tcccgatggt ttatgcagtg acggcaacgg ccttgaactg 420 aaatgcccgt ttacctcccg ggatttcatg aagttccggc tcggtggttt cgaggccata 480 aagtcagctt acatggccca ggtgcagtac agcatgtggg tgacgcgaaa aaatgcctgg 540 tactttgcca actatgaccc gcgtatgaag cgtgaaggcc tgcattatgt cgtgattgag 600 cgggatgaaa agtacatggc gagttttgac gagatcgtgc cggagttcat cgaaaaaatg 660 gacgaggcac tggctgaaat tggttttgta tttggggagc aatggcgatc tggctctggt 720 tccggcagcg gttccgga 738 <210> 12 <211> 226 <212> PRT <213> Bacteriophage lambda <400> 12 Met Thr Pro Asp Ile Ile Leu Gln Arg Thr Gly Ile Asp Val Arg Ala 1 5 10 15 Val Glu Gln Gly Asp Asp Ala Trp His Lys Leu Arg Leu Gly Val Ile 20 25 30 Thr Ala Ser Glu Val His Asn Val Ile Ala Lys Pro Arg Ser Gly Lys 35 40 45 Lys Trp Pro Asp Met Lys Met Ser Tyr Phe His Thr Leu Leu Ala Glu 50 55 60 Val Cys Thr Gly Val Ala Pro Glu Val Asn Ala Lys Ala Leu Ala Trp 65 70 75 80 Gly Lys Gln Tyr Glu Asn Asp Ala Arg Thr Leu Phe Glu Phe Thr Ser 85 90 95 Gly Val Asn Val Thr Glu Ser Pro Ile Ile Tyr Arg Asp Glu Ser Met 100 105 110 Arg Thr Ala Cys Ser Pro Asp Gly Leu Cys Ser Asp Gly Asn Gly Leu 115 120 125 Glu Leu Lys Cys Pro Phe Thr Ser Arg Asp Phe Met Lys Phe Arg Leu 130 135 140 Gly Gly Phe Glu Ala Ile Lys Ser Ala Tyr Met Ala Gln Val Gln Tyr 145 150 155 160 Ser Met Trp Val Thr Arg Lys Asn Ala Trp Tyr Phe Ala Asn Tyr Asp 165 170 175 Pro Arg Met Lys Arg Glu Gly Leu His Tyr Val Val Ile Glu Arg Asp 180 185 190 Glu Lys Tyr Met Ala Ser Phe Asp Glu Ile Val Pro Glu Phe Ile Glu 195 200 205 Lys Met Asp Glu Ala Leu Ala Glu Ile Gly Phe Val Phe Gly Glu Gln 210 215 220 Trp Arg 225 <210> 13 <211> 134 <212> DNA <213> Artificial Sequence <220> <223> Sequence used in Example 2 <400> 13 cccccccccc cccccccccc cccccccccc cacccccccc cccccccccc cctaaagcta 60 catcgtcaac gttatatttt gatagtttga cggttaatgc tggtaatggt ggttttcttc 120 aaaatttgtt agcc 134 <210> 14 <211> 84 <212> DNA <213> Artificial Sequence <220> <223> Sequence used in Example 2 <400> 14 ggctaacaaa ttttgaagaa aaccaccatt accagcatta accgtcaaac tatcaaaata 60 taacgttgac gatgtagctt tagg 84 <210> 15 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Sequence used in Example 2 <400> 15 cccccccccc cccccacccc cccccccccc ccccctattc tgtttatgtt tcttgtttgt 60 tagccttttg gctaacaaac aagaaacata aacagaatag 100 <210> 16 <211> 184 <212> PRT <213> Mycobacterium smegmatis <400> 16 Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu 1 5 10 15 Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp 20 25 30 Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr 35 40 45 Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu 50 55 60 Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe 65 70 75 80 Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Ala 85 90 95 Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly 100 105 110 Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val 115 120 125 Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val 130 135 140 Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu 145 150 155 160 Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr 165 170 175 Tyr Gly Glu Pro Trp Asn Met Asn 180 <210> 17 <211> 184 <212> PRT <213> Mycobacterium smegmatis <400> 17 Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu 1 5 10 15 Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp 20 25 30 Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr 35 40 45 Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu 50 55 60 Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe 65 70 75 80 Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Gly 85 90 95 Pro Pro Phe Gly Leu Glu Ser Val Ile Thr Pro Asn Leu Phe Pro Gly 100 105 110 Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val 115 120 125 Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val 130 135 140 Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu 145 150 155 160 Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr 165 170 175 Tyr Gly Glu Pro Trp Asn Met Asn 180 <210> 18 <211> 183 <212> PRT <213> Mycobacterium smegmatis <400> 18 Val Asp Asn Gln Leu Ser Val Val Asp Gly Gln Gly Arg Thr Leu Thr 1 5 10 15 Val Gln Gln Ala Glu Thr Phe Leu Asn Gly Val Phe Pro Leu Asp Arg 20 25 30 Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Thr Tyr His 35 40 45 Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu Gly 50 55 60 Tyr Gln Val Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe Ser 65 70 75 80 Tyr Thr Thr Pro Asn Ile Leu Ile Asp Gly Gly Asp Ile Thr Gln Pro 85 90 95 Pro Phe Gly Leu Asp Thr Ile Ile Thr Pro Asn Leu Phe Pro Gly Val 100 105 110 Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val Ala 115 120 125 Thr Phe Ser Val Asp Val Lys Gly Ala Lys Gly Ala Val Ala Val Ser 130 135 140 Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu Arg 145 150 155 160 Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr Tyr 165 170 175 Gly Glu Pro Trp Asn Met Asn 180 <210> 19 <211> 454 <212> DNA <213> Artificial Sequence <220> <223> Sequence used in the Examples <220> <221> modified_base <222> (1)..(4) <223> 2'-O-Methyl-Uracil <400> 19 nnnntttttt tttttttttt tttttttttt tttttttttt tttttttttt ttttggttgt 60 ttctgttggt gctgatattg cttttgatgc cgaccctaaa ttttttgcct gtttggttcg 120 ctttgagtct tcttcggttc cgactaccct cccgactgcc tatgatgttt atcctttgaa 180 tggtcgccat gatggtggtt attataccgt caaggactgt gtgactattg acgtccttcc 240 ccgtacgccg ggcaataacg tttatgttgg tttcatggtt tggtctaact ttaccgctac 300 taaatgccgc ggattggttt cgctgaatca ggttattaaa gagattattt gtctccagcc 360 acttaagtga ggtgatttat gtttggtgct attgctggcg gtattgcttc tgctcttgct 420 ggtggcgcca tgtctaaatt gtttggaggc ggtc 454 <210> 20 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Sequence used in the Examples <400> 20 gcaatatcag caccaacaga aacaaccttt tttttttttt tttttttttt ttttttt 57 <210> 21 <211> 139 <212> DNA <213> Artificial Sequence <220> <223> Sequence used in the Examples <400> 21 tttttttttt tttttttttt tccccccccc ccccctattc tgtttatgtt tcttgtttgt 60 tagccccctt tgataagaca aatacaaaga acaaacaatc ggccctttag tggagcgagt 120 gcgagaggcg agcggtcaa 139 <210> 22 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Sequence used in the Examples <400> 22 gtatctccat cgctgttgac cgctcgcctc tcgcactcgc tccactaaag ggccgattgt 60 ttgttctttg tatttgtctt atcaaagggg gctaacaaac aagaaacata aacagaatag 120 <210> 23 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Sequence used in the Examples <400> 23 cagcgatgga gatac 15 <210> 24 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Sequence used in the Examples <400> 24 cccccccccc cccccacccc cccccccccc cccccuauuc uguuuauguu ucuuguuugu 60 <210> 25 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Sequence used in the Examples <400> 25 uauucuguuu auguuucuug uuuguuagcc cccuuugaua agacaaauac aaagaacaaa 60 <210> 26 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Sequence used in the Examples <400> 26 agaaacataa acagaataac aaacaagaaa cataaacaga atag 44 <210> 27 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Sequence used in the Examples <400> 27 cccccccccc cccccacccc cccccccccc cccccuauuc uguuuauguu ucuuguuugu 60 uauucuguuu auguuucuug uuuguuagcc cccuuugaua agacaaauac aaagaacaaa 120 <210> 28 <211> 1176 <212> DNA <213> Artificial Sequence <220> <223> Dimer of NNN-RRK in Example 14 <400> 28 atgggtctgg ataatgaact gagcctggtg gacggtcaag atcgtaccct gacggtgcaa 60 caatgggata cctttctgaa tggcgttttt ccgctggatc gtaatcgcct gacccgtgaa 120 tggtttcatt ccggtcgcgc aaaatatatc gtcgcaggcc cgggtgctga cgaattcgaa 180 ggcacgctgg aactgggtta tcagattggc tttccgtggt cactgggcgt tggtatcaac 240 ttctcgtaca ccacgccgaa tattctgatc aacaatggta acattaccgc accgccgttt 300 ggcctgaaca gcgtgattac gccgaacctg tttccgggtg ttagcatctc tgcccgtctg 360 ggcaatggtc cgggcattca agaagtggca acctttagtg tgcgcgtttc cggcgctaaa 420 ggcggtgtcg cggtgtctaa cgcccacggt accgttacgg gcgcggccgg cggtgtcctg 480 ctgcgtccgt tcgcgcgcct gattgcctct accggcgaca gcgttacgac ctatggcgaa 540 ccgtggaata tgaactcggg ttcaggatcc ggagatgacg atgatgacga cgatgactcc 600 ggatcgggtt cttccatggg tctggataat gaactgagcc tggtggacgg tcaagatcgt 660 accctgacgg tgcaacaatg ggataccttt ctgaatggcg tttttccgct ggatcgtaat 720 cgcctgaccc gtgaatggtt tcattccggt cgcgcaaaat atatcgtcgc aggcccgggt 780 gctgacgaat tcgaaggcac gctggaactg ggttatcaga ttggctttcc gtggtcactg 840 ggcgttggta tcaacttctc gtacaccacg ccgaatattc tgatcaacaa tggtaacatt 900 accgcaccgc cgtttggcct gaacagcgtg attacgccga acctgtttcc gggtgttagc 960 atctctgccc gtctgggcaa tggtccgggc attcaagaag tggcaacctt tagtgtgcgc 1020 gtttccggcg ctaaaggcgg tgtcgcggtg tctaacgccc acggtaccgt tacgggcgcg 1080 gccggcggtg tcctgctgcg tccgttcgcg cgcctgattg cctctaccgg cgacagcgtt 1140 acgacctatg gcgaaccgtg gaatatgaac taatag 1176 <210> 29 <211> 390 <212> PRT <213> Artificial Sequence <220> <223> Dimer of NNN-RRK used in Example 14 <400> 29 Met Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr 1 5 10 15 Leu Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu 20 25 30 Asp Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys 35 40 45 Tyr Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu 50 55 60 Leu Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn 65 70 75 80 Phe Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asn Asn Gly Asn Ile Thr 85 90 95 Ala Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro 100 105 110 Gly Val Ser Ile Ser Ala Arg Leu Gly Asn Gly Pro Gly Ile Gln Glu 115 120 125 Val Ala Thr Phe Ser Val Arg Val Ser Gly Ala Lys Gly Gly Val Ala 130 135 140 Val Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu 145 150 155 160 Leu Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr 165 170 175 Thr Tyr Gly Glu Pro Trp Asn Met Asn Ser Gly Ser Gly Ser Gly Asp 180 185 190 Asp Asp Asp Asp Asp Asp Asp Ser Gly Ser Gly Ser Ser Met Gly Leu 195 200 205 Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu Thr Val 210 215 220 Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp Arg Asn 225 230 235 240 Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr Ile Val 245 250 255 Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu Gly Tyr 260 265 270 Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe Ser Tyr 275 280 285 Thr Thr Pro Asn Ile Leu Ile Asn Asn Gly Asn Ile Thr Ala Pro Pro 290 295 300 Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly Val Ser 305 310 315 320 Ile Ser Ala Arg Leu Gly Asn Gly Pro Gly Ile Gln Glu Val Ala Thr 325 330 335 Phe Ser Val Arg Val Ser Gly Ala Lys Gly Gly Val Ala Val Ser Asn 340 345 350 Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu Arg Pro 355 360 365 Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr Tyr Gly 370 375 380 Glu Pro Trp Asn Met Asn 385 390 <210> 30 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Sequence used in Example 16 <220> <221> modified_base <222> (9)..(9) <223> 5-methylcytosine <220> <221> modified_base <222> (27)..(27) <223> 5-methylcytosine <400> 30 ttttttttnt tttttttctt ttttttngtt ttttttcgtt ttttttgtat ctccatcgct 60 gccccctttt tccccctttt t 81 <210> 31 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Sequence used in Example 16 <400> 31 ggcagcgatg gagatacttg aggcgagcgg tcaa 34 <210> 32 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Sequence used in Example 16 <400> 32 ttgaccgctc gcctc 15 <210> 33 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Sequence used in the Examples <400> 33 Ser Gly Ser Gly Ser Gly Asp Asp Asp Asp Asp Asp Asp Asp Ser Gly 1 5 10 15 Ser Gly Ser Ser 20

Claims

서열 번호 2에 제시된 서열의 변이체를 포함하며, 여기서 변이체는 L88N 치환을 포함하는 것인, 돌연변이체 Msp 단량체.
제1항에 있어서, 변이체가 G75S, G77S 및 Q126R 치환 중 하나 이상을 더 포함하는 것인 돌연변이체 Msp 단량체.
제2항에 있어서, 변이체가 G75S, G77S 및 Q126R 치환 모두를 더 포함하는 것인 돌연변이체 Msp 단량체.
제1항 내지 제3항 중 어느 한 항에 있어서, 변이체가 하기 돌연변이 중 하나 이상을 더 포함하는 것인 돌연변이체 Msp 단량체:
(a) 90번 위치의 세린 (S), 글루타민 (Q) 또는 티로신 (Y);
(b) 105번 위치의 류신 (L) 또는 세린 (S);
(c) 59번 위치의 아르기닌 (R);
(d) 78번 위치의 류신 (L);
(e) 81번 위치의 아스파라긴 (N);
(f) 83번 위치의 아스파라긴 (N);
(g) 86번 위치의 세린 (S) 또는 트레오닌 (T);
(h) 87번 위치의 페닐알라닌 (F), 발린 (V) 또는 류신 (L);
(i) 89번 위치의 페닐알라닌 (F), 발린 (V) 또는 류신 (L);
(j) 90번 위치의 류신 (L), 페닐알라닌 (F), 트립토판 (W), 히스티딘 (H), 트레오닌 (T), 글리신 (G), 알라닌 (A), 발린 (V), 아르기닌 (R), 리신 (K), 아스파라긴 (N) 또는 시스테인 (C);
(k) 91번 위치의 세린 (S), 글루타민 (Q), 류신 (L), 메티오닌 (M), 이소류신 (I), 알라닌 (A), 발린 (V), 글리신 (G), 페닐알라닌 (F), 트립토판 (W), 티로신 (Y), 히스티딘 (H), 트레오닌 (T), 아르기닌 (R), 리신 (K), 아스파라긴 (N) 또는 시스테인 (C);
(l) 92번 위치의 알라닌 (A) 또는 세린 (S);
(m) 93번 위치의 세린 (S), 알라닌 (A), 트레오닌 (T) 또는 글리신 (G);
(n) 94번 위치의 류신 (L);
(o) 95번 위치의 발린 (V);
(p) 96번 위치의 아르기닌 (R), 아스파르트산 (D), 발린 (V), 아스파라긴 (N), 세린 (S) 또는 트레오닌 (T);
(q) 97번 위치의 세린 (S);
(r) 98번 위치의 세린 (S);
(s) 99번 위치의 세린 (S);
(t) 100번 위치의 세린 (S);
(u) 101번 위치의 페닐알라닌 (F);
(v) 102번 위치의 리신 (K), 세린 (S) 또는 트레오닌 (T);
(w) 103번 위치의 알라닌 (A), 글루타민 (Q), 아스파라긴 (N), 글리신 (G) 또는 트레오닌 (T);
(x) 104번 위치의 이소류신 (I);
(y) 105번 위치의 티로신 (Y), 알라닌 (A), 글루타민 (Q), 아스파라긴 (N), 트레오닌 (T), 페닐알라닌 (F), 트립토판 (W), 히스티딘 (H), 글리신 (G), 발린 (V), 아르기닌 (R), 리신 (K), 프롤린 (P) 또는 시스테인 (C);
(z) 106번 위치의 페닐알라닌 (F), 이소류신 (I), 발린 (V) 또는 세린 (S);
(aa) 108번 위치의 프롤린 (P) 또는 세린 (S);
(bb) 118번 위치의 아스파라긴 (N);
(cc) 103번 위치의 세린 (S) 또는 시스테인 (C); 및
(dd) 10 내지 15번 위치, 51 내지 60번 위치, 136 내지 139번 위치 및 168 내지 172번 위치 중 하나 이상의 위치의 시스테인 (C).
제1항 내지 제3항 중 어느 한 항에 있어서, 변이체가 하기 치환 중 하나 이상의 치환을 포함하는 것인 돌연변이체 Msp 단량체:
(a) 75번 위치의 세린 (S), 77번 위치의 세린 (S), 88번 위치의 아스파라긴 (N), 90번 위치의 글루타민 (Q) 및 126번 위치의 아르기닌 (R);
(b) (i) 90번 위치의 글루타민 (Q) 및 (ii) 105번 위치의 알라닌 (A) 중 하나 이상;
(c) (i) 90번 위치의 세린 (S) 및 (ii) 92번 위치의 세린 (S) 중 하나 이상;
(d) (i) 87번 위치의 글루타민 (Q) 및 (ii) 90번 위치의 세린 (S) 중 하나 이상;
(e) (i) 89번 위치의 티로신 (Y) 및 (ii) 90번 위치의 세린 (S) 중 하나 이상;
(f) (i) 90번 위치의 세린 (S) 및 (ii) 92번 위치의 알라닌 (A) 중 하나 이상;
(g) (i) 90번 위치의 세린 (S) 및 (ii) 94번 위치의 아스파라긴 (N) 중 하나 이상;
(h) (i) 90번 위치의 세린 (S) 및 (ii) 104번 위치의 이소류신 (I) 중 하나 이상;
(i) (i) 90번 위치의 글루타민 (Q), (ii) 93번 위치의 세린 (S) 및 (iii) 105번 위치의 알라닌 (A) 중 하나 이상;
(j) (i) 90번 위치의 페닐알라닌 (F), 트립토판 (W), 티로신 (Y) 또는 히스티딘 (H), (ii) 91번 위치의 페닐알라닌 (F), 트립토판 (W), 티로신 (Y) 또는 히스티딘 (H), 및 (iii) 105번 위치의 페닐알라닌 (F), 트립토판 (W), 티로신 (Y) 또는 히스티딘 (H) 중 하나 이상;
(k) (i) 90번 위치의 세린 (S), 트레오닌 (T), 글리신 (G), 알라닌 (A) 또는 발린 (V), (ii) 91번 위치의 세린 (S), 트레오닌 (T), 글리신 (G), 알라닌 (A) 또는 발린 (V), 및 (iii) 105번 위치의 세린 (S), 트레오닌 (T), 글리신 (G), 알라닌 (A) 또는 발린 (V) 중 하나 이상;
(l) 90번 위치의 세린 (S), 아르기닌 (R), 리신 (K) 또는 히스티딘 (H), 및/또는 91번 위치의 세린 (S), 아르기닌 (R), 리신 (K) 또는 히스티딘 (H);
(m) 90번 위치의 세린 (S), 트레오닌 (T), 아스파라긴 (N), 글루타민 (Q), 티로신 (Y) 또는 히스티딘 (H), 및/또는 91번 위치의 세린 (S), 트레오닌 (T), 아스파라긴 (N), 글루타민 (Q), 티로신 (Y) 또는 히스티딘 (H); 및
(n) 90, 91 및 103번 위치 중 하나 이상의 위치의 시스테인 (C).
제1항 내지 제3항 중 어느 한 항에 있어서, 변이체가 하기 치환(들) 중 하나 이상의 치환을 포함하는 것인 돌연변이체 Msp 단량체:
제1항 내지 제3항 중 어느 한 항에 있어서, (i) 분자의 하나 이상의 시스테인에의 부착, 분자의 하나 이상의 리신에의 부착, 분자의 하나 이상의 비천연 아미노산에의 부착, 에피토프의 효소 변형 또는 말단의 변형에 의해 화학적으로 변형되거나; (ii) 분자의 하나 이상의 시스테인에의 부착에 의해 화학적으로 변형되며, 하나 이상의 시스테인이 치환에 의해 돌연변이체에 도입된 것이거나; (iii) 분자의 하나 이상의 시스테인에의 부착, 분자의 하나 이상의 리신에의 부착 또는 분자의 하나 이상의 비천연 아미노산에의 부착에 의해 화학적으로 변형되며, 분자가 (a) 단량체를 포함하는 세공과 표적 뉴클레오티드 또는 표적 핵산 서열 사이의 상호작용을 촉진하는 분자 어댑터(adaptor) 또는 (b) 핵산 결합 단백질이거나; (iv) 분자의 하나 이상의 시스테인에의 부착, 분자의 하나 이상의 리신에의 부착 또는 분자의 하나 이상의 비천연 아미노산에의 부착에 의해 화학적으로 변형되며, 부착이 링커를 통해 이루어지는 것이거나; 또는 (v) 분자의 하나 이상의 시스테인에의 부착, 분자의 하나 이상의 리신에의 부착 또는 분자의 하나 이상의 비천연 아미노산에의 부착에 의해 화학적으로 변형되며, 분자가 서열 번호 2의 90, 91 및 103번 위치 중 하나 이상의 위치에 부착되는 것인 돌연변이체 Msp 단량체.
Msp로부터 유래된 2개 이상의 공유적으로 부착된 단량체를 포함하며, 여기서 단량체 중 1개 이상이 제1항에서 정의된 바와 같은 돌연변이체 Msp 단량체인 구축물.
제8항에 있어서, (a) 2개 이상의 단량체가 동일하거나 상이한 것이거나; (b) 1개 이상의 단량체가 서열 번호 2에 제시된 서열을 포함하는 것이거나; (c) 2개의 단량체를 포함하고, 단량체 중 1개 이상이 제1항 내지 제3항 중 어느 한 항에서 정의된 바와 같은 돌연변이체 Msp 단량체이거나; (d) 단량체가 유전자적으로 융합되는 것이거나; 또는 (e) 단량체가 링커를 통해 부착되는 것인 구축물.
제1항 내지 제3항 중 어느 한 항에 따른 돌연변이체 Msp 단량체 또는 제8항에 따른 구축물을 코딩하는 폴리뉴클레오티드.
제1항에 따른 동일한 돌연변이체 Msp 단량체를 포함하는, Msp로부터 유래된 동종올리고머 세공.
제11항에 있어서, 8개의 동일한 돌연변이체 Msp 단량체를 포함하는 동종올리고머 세공.
제1항에 따른 1개 이상의 돌연변이체 Msp 단량체를 포함하며, 여기서 8개의 단량체 중 1개 이상은 나머지 다른 단량체와 상이한 것인, Msp로부터 유래된 이종올리고머 세공.
제13항에 있어서, (i) 제1항 내지 제3항 중 어느 한 항에 따른 8개의 돌연변이체 Msp 단량체를 포함하고, 그 중 1개 이상은 나머지 다른 단량체와 상이한 것이거나; (ii) 서열 번호 2에 제시된 서열을 포함하는 1개 이상의 단량체를 포함하거나; (iii) (a) 1개의 돌연변이체 단량체 및 (b) 7개의 동일한 단량체를 포함하며, 여기서 (a)의 돌연변이체 단량체는 (b)의 동일한 단량체와 상이한 것이거나; 또는 (iv) (a) 서열 번호 2에 제시된 서열을 포함하는 7개의 단량체, 및 N90R, N90K, N90Y, N90Q, N90W 또는 N90C 치환을 더 포함하는 제1항 내지 제3항 중 어느 한 항에 따른 1개의 돌연변이체 Msp 단량체; (b) 서열 번호 2에 제시된 서열을 포함하는 7개의 단량체, 및 N91R, N91K, N91Y, N91Q, N91W 또는 N91C 치환을 포함하는 제1항 내지 제3항 중 어느 한 항에 따른 1개의 돌연변이체 Msp 단량체; 또는 (c) 서열 번호 2에 제시된 서열을 포함하는 7개의 단량체, 및 L88C, S103C 또는 I105C 치환을 포함하는 제1항 내지 제3항 중 어느 한 항에 따른 1개의 돌연변이체 Msp 단량체를 포함하는 이종올리고머 세공.
제8항에 따른 1개 이상의 구축물을 포함하는 세공.
제15항에 있어서,
- 각각 2개의 단량체를 포함하며 단량체 중 1개 이상은 제1항 내지 제3항 중 어느 한 항에서 정의된 바와 같은 돌연변이체 Msp 단량체인 4개의 구축물; 또는
- 제1항 내지 제3항 중 어느 한 항에서 정의된 바와 같은 돌연변이체 Msp 단량체, 및 각각 (i) 서열 번호 2에 제시된 서열 또는 (ii) 제1항 내지 제3항 중 어느 한 항에서 정의된 바와 같은 서열 번호 2의 변이체를 포함하는 6개의 단량체를 포함하는 1개의 구축물
을 포함하는 세공.
(a) 표적 서열을 제11항 내지 제13항 및 제15항 중 어느 한 항에 따른 세공 및 핵산 결합 단백질과 접촉시켜, 상기 단백질이 세공을 통과하는 표적 서열의 이동을 제어하도록 하고, 표적 서열 중 일부의 뉴클레오티드가 세공과 상호작용하도록 하는 단계; 및
(b) 각 상호작용 동안 세공을 통과하는 전류를 측정하여, 표적 서열의 특징을 규명하는 단계
를 포함하는, 표적 핵산 서열의 특징을 규명하는 방법.
제17항에 있어서, 표적 핵산 서열의 특징을 규명하는 단계가 표적 핵산 서열의 서열을 추정하거나 또는 표적 핵산 서열을 서열분석하는 것을 포함하는 것인 방법.
(a) 제11항 내지 제13항 및 제15항 중 어느 한 항에 따른 세공 및 (b) 뉴클레아제, 폴리머라제, 토포이소머라제, 리가제 또는 헬리카제를 포함하는, 표적 핵산 서열의 특징 규명을 위한 키트.
(a) 다수의 제11항 내지 제13항 및 제15항 중 어느 한 항에 따른 세공 및 (b) 다수의 뉴클레아제, 폴리머라제, 토포이소머라제, 리가제 또는 헬리카제를 포함하는, 샘플 중의 표적 핵산 서열의 특징 규명을 위한 장치.
제20항에 있어서,
다수의 세공을 지지할 수 있으며 세공 및 효소를 사용하여 핵산 특징 규명을 수행하도록 작동가능한 센서 장치;
특징 규명 수행용 물질을 담아두기 위한 1개 이상의 저장소;
물질을 1개 이상의 저장소로부터 센서 장치로 제어가능하게 공급하도록 구성된 유체 시스템; 및
각 샘플을 수용하기 위한 다수의 용기
를 포함하며, 상기 유체 시스템은 샘플을 용기로부터 센서 장치로 선택적으로 공급하도록 구성된 것인 장치.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제