KR20220088724A

KR20220088724A - ctDNA에서 종양 특이적 유전자의 돌연변이 및 메틸화를 검출하는 방법

Info

Publication number: KR20220088724A
Application number: KR1020227016270A
Authority: KR
Inventors: 위천 지아오; 춘펑 취; 위팅 왕; 페이 왕; 쿤 천; 치엔치엔 송; 후이 리우; 징징 왕; 스전 왕
Original assignee: 캔서 호스피탈 차이니즈 아카데미 오브 메디컬 사이언스; 제네트론 헬쓰 (베이징) 코, 엘티디.
Priority date: 2019-10-16
Filing date: 2020-10-13
Publication date: 2022-06-28
Also published as: JP2022551688A; EP4023795A1; US20230272475A1; CN112176419B; WO2021073490A1; CN112176419A; EP4023795A4

Abstract

본 발명은 ctDNA에서 종양 특이적 유전자의 돌연변이 및 메틸화를 검출하는 방법을 개시한다. 상기 방법은 하나의 샘플에서 ctDNA 중의 종양 특이적 유전자의 돌연변이(점 돌연변이, 삽입 결실 돌연변이, HBV 통합 등 다양한 돌연변이 형태 포함) 및/또는 메틸화를 동시에 검출할 수 있는 방법이다. 샘플량 수요가 낮을 뿐만 아니라, 상기 방법으로 제조한 MC 라이브러리는 10 내지 20회의 후속 검출을 지원할 수 있다. 매회 검출의 결과는 모두 모든 원래 ctDNA 표본의 돌연변이 상태 및 효소 절단 부위 커버 영역의 메틸화 변형 상태를 나타낼 수 있으며, 민감도와 특이성을 낮추지 않는다. 본 발명은 종양 조기 스크리닝, 질병 추적, 치료 효과 평가, 예후 예측 등에 있어서 중요한 임상적 의의를 가지며, 응용 가치가 크다.

Description

ctDNA에서 종양 특이적 유전자의 돌연변이 및 메틸화를 검출하는 방법

본 발명은 생물의학 분야에 속하며, 구체적으로 ctDNA에서 종양 특이적 유전자의 돌연변이 및 메틸화를 검출하는 방법에 관한 것이다.

순환 종양 DNA(circulating tumor DNA, ctDNA)는 종양 세포의 세포 사멸, 괴사 또는 분비에 의해 생성된 DNA 단편에서 유래하며, 점 돌연변이, 유전자 재배열, 융합, 카피수 변이, 메틸화 변형 등과 같이 종양 조직 DNA와 동일한 유전자 돌연변이와 후성 유전적 변형을 포함한다. ctDNA의 검출은 암 조기 스크리닝, 진단 및 병기 결정, 표적 약물의 안내, 효능 평가, 재발 모니터링 등 다양한 부문에서 사용될 수 있다. ctDNA에 의해 운반되는 종양 특이적 유전자의 돌연변이 및 메틸화 두 측면의 정보를 결합하면, 검출의 민감도와 특이성을 향상시키고 암 흔적을 조기에 발견하는 데 도움이 되어 종양 조기 스크리닝에 있어서 매우 중요한 의미를 갖는다.

현재의 유전자 돌연변이 검출과 메틸화 검출은 상이한 기술적 경로를 따라야 한다. ctDNA 유전자 돌연변이의 검출은, cfDNA에서 ctDNA가 차지하는 비율이 비교적 낮은 한계가 있기 때문에 실질적으로 저주파 돌연변이를 검출한다. 종래 기술은 두 가지로 나뉜다. 1) PCR 기반의 핫스팟 돌연변이 검출법으로, 통상적으로 하나 또는 여러 핫스팟 돌연변이 또는 공지된 돌연변이를 검출하며, 유전자 융합 등과 같은 복잡한 돌연변이를 검출할 수 없고, 공지되지 않은 돌연변이를 검출할 수 없어 적용 범위가 비교적 작다. 2) 캡쳐 시퀀싱 방법으로, 복잡한 돌연변이를 포함한 다중 표적 검출에 적합하지만 캡쳐 키트가 일반적으로 가격이 비싸고 조작이 복잡하며 시간이 비교적 오래 걸린다. 적용 과정에서 표적의 수량과 특성에 따라 적절한 검출 방법을 선택해야 한다. ctDNA 메틸화 마커의 장점은 클러스터 분포, 유전자 변이보다 높은 특이성, 조직 특이성을 가지고 있어 종양 유래를 추적할 수 있고 마커 수가 더 많아 더 높은 민감도에 도달할 수 있다. 이의 검출 방법에는 다음이 포함된다. 1) 메틸화 PCR은 중아황산염 변환 단계로 인해 DNA 손실 및 서열 다양성 감소가 유발된다. 이 방법은 다중 표적 검출을 구현하기 어렵다. 2) 프로브 혼성화 기반의 메틸화 캡쳐는 8% 내지 13%의 CpG 부위를 커버할 수 있으며, 동시에 대량의 마커를 검출할 수 있으나, 제한된 ctDNA 초기량의 한계가 있고 중아황산염 처리 후 게놈 서열 풍부도가 낮고 프로브 특이성을 보장하기가 쉽지 않다. 3) MspI 효소 절단 기반의 RRBS(Reduced representation bisulfite sequencing)는 커버하는 CpG 부위가 효소 절단 부위 "CCGG"에 의해 결정되며, 약 8% 내지 10%의 CpG 부위를 차지하고, 메틸화 C 염기에 대한 식별이 마찬가지로 중아황산염 변환에 의존한다. RRBS 검출의 메틸화 부위는 CpG 섬 및 프로모터 영역에 집중되어 있으며 비용이 저렴하다. 상기 세 가지 방법은 메틸화 PCR 커버 부위가 제한적이다. 메틸화 캡쳐는 비교적 많은 부위를 커버할 수 있어 RRBS 데이터보다 더 안정적이다. RRBS는 비용이 가장 저렴하며 대량의 메틸화 부위를 커버할 수 있다. 따라서 적용 과정에서 표적의 수량과 특성에 따라 선별해야 한다.

현재 ctDNA에서 두 가지 중요한 종양 특이적 마커인 유전자 돌연변이와 메틸화를 동시에 검출할 수 있는 간단하고 저렴하며 신뢰할 수 있는 해결책은 없다. 주요 어려움은 다음과 같다. 1) 일회성 채혈에서 획득하는 ctDNA 표본량이 제한적이며, 통상적으로 1 내지 2회 검출만 지원할 수 있다. 따라서 ctDNA 임상 검출은 통상적으로 단일 플랫폼, 일회성이므로, 하나의 샘플로 돌연변이 검출 및 메틸화 검출을 동시에 구현하기 어렵다. 특히 중아황산염 변환에 의존하는 메틸화 검출 기술은 처리 과정에서 비교적 많은 DNA 손실을 야기할 수 있다. 2) 메틸화 검출 기술의 중아황산염 변환 단계는 DNA 서열이 대부분의 돌연변이 정보를 제시하지 못하며, 이 부분 DNA 운반 정보의 손실은 저주파 돌연변이 검출 민감도를 저하시킬 수 있다. 3) 임상 검출에서는 1차 검출 결과를 바탕으로 후속 검출의 목적과 계획을 판단해야 하는 경우가 많다. 이는 후속 검출에서 다시 채혈을 해야 하므로 검출 주기가 연장된다. 또한 ctDNA 관련 임상 검출 또는 연구는 종종 비교적 많은 기술의 장단점을 비교할 필요가 있다. 이를 위해 정상 채혈량의 수배에 달하는 표본이 필요하므로 일반적으로 환자가 견디지 못한다. 4) PCR법과 캡쳐법을 불문하고 증폭 과정에서 발생하는 노이즈 돌연변이는 ctDNA 저주파 돌연변이 검출을 심각하게 간섭하여 위양성 결과를 초래하고 환자의 진단과 치료를 오도할 수 있다. 5) ctDNA 돌연변이 함량이 낮아 조작 과정에서 오염이 발생하기 쉬워 위양성 결과가 나올 수 있다.

본 발명의 목적은 ctDNA에서 다양한 종양 특이적 유전자의 돌연변이 및/또는 메틸화를 동시에 검출하는 데에 있다.

본 발명은 먼저 시퀀싱 라이브러리 구축 방법을 보호하며, 여기에는 이하 단계가 순차적으로 포함될 수 있다.

(1) DNA 샘플을 취하고 메틸화 감응성 제한 엔도뉴클레아제를 이용해 효소 절단한다.

(2) 단계 (1)에서 효소 절단한 DNA 샘플에 대해 말단 수복 및 3' 말단 A 추가 처리를 순차적으로 수행한다.

(3) 단계 (2)에서 처리한 DNA 샘플을 어댑터 혼합물 중의 어댑터와 연결하고, PCR 증폭을 거쳐 라이브러리를 획득하는 단계를 순차적으로 포함한다.

상기 어댑터 혼합물은 n개 어댑터로 구성된다.

각 어댑터는 하나의 업스트림 프라이머 A와 하나의 다운스트림 프라이머 A에서 부분적인 이중 가닥 구조를 형성하여 획득하고, 업스트림 프라이머 A는 시퀀싱 어댑터 A, 랜덤 태그, 고정 서열 A 및 말단(예를 들어 3' 말단)에 위치한 염기 T를 가지며, 다운스트림 프라이머 A는 고정 서열 B 및 시퀀싱 어댑터 B를 가지고, 상기 부분적인 이중 가닥 구조는 고정 서열 A와 고정 서열 B의 역상보에 의해 형성된다.

상기 시퀀싱 어댑터 A와 시퀀싱 어댑터 B는 상이한 시퀀싱 플랫폼에 따라 대응하는 시퀀싱 어댑터를 선택한다.

상기 랜덤 태그는 8-14bp(예를 들어 8-10bp, 10-14bp, 8bp, 10bp 또는 14bp)의 랜덤 염기이다.

상기 고정 서열 A는 길이가 12-20bp(예를 들어 12-16bp, 16-20bp, 12bp, 16bp 또는 20bp)이고, 연속 반복 염기가 ≤3개이다.

n개 어댑터는 n개의 상이한 고정 서열 A를 채택하고, 각 고정 서열 A 중 4가지 염기가 균형을 이루며, 미스매치 염기 수는 ≥3이다.

n은 ≥8인 임의 자연수이다.

통상적으로 라이브러리 제작용 어댑터는 두 서열을 어닐링하여 형성되며 "Y" 구조를 나타낸다. 두 서열 사이 상보적인 쌍 부분(즉, 고정 서열 A와 고정 서열 B)을 고정 서열이라 부른다. 상기 고정 서열은 원본 템플릿 분자를 표시하기 위해 서열을 고정하는 내장 태그로 사용할 수 있다.

상기 고정 서열은 프라이머의 다른 부분과 상호 작용하지 않는다(예를 들어 헤어핀 구조, 이량체 형성 등).

상기 업스트림 프라이머 A는 5' 말단으로부터 순차적으로 시퀀싱 어댑터 A, 랜덤 태그, 고정 서열 A 및 염기 T를 포함할 수 있다.

상기 업스트림 프라이머 A는 5' 말단으로부터 순차적으로 시퀀싱 어댑터 A, 랜덤 태그, 고정 서열 A 및 염기 T로 구성될 수 있다.

상기 다운스트림 프라이머 A는 5' 말단으로부터 순차적으로 고정 서열 B 및 시퀀싱 어댑터 B를 포함할 수 있다.

상기 다운스트림 프라이머 A는 5' 말단으로부터 순차적으로 고정 서열 B 및 시퀀싱 어댑터 B로 구성될 수 있다.

상기 "각 고정 시퀀스 A 중 4가지 염기 균형", 즉 A, T, C 및 G가 고르게 분포되어 있다.

상기 "미스매치 염기 수≥3"은 상기 어댑터 혼합물이 n개 고정 서열 A를 포함하고, 각 고정 서열 A 사이의 염기는 적어도 3개 상이한 것일 수 있다. 이러한 차이는 위치의 차이 또는 순서의 차이일 수 있다.

상기 DNA 샘플은 게놈 DNA, cDNA, ctDNA 또는 cfDNA 샘플일 수 있다.

상기 n은 구체적으로 12일 수 있다.

상기 랜덤 태그는 구체적으로 8bp의 랜덤 염기일 수 있다.

상기 고정 서열 A의 길이는 구체적으로 12bp일 수 있다.

n=12인 경우, 상기 고정 서열 A의 뉴클레오티드 서열은 구체적으로 각각 서열표 서열 1의 5' 말단으로부터 제30-41위치, 서열표 서열 3의 5' 말단으로부터 제30-41위치, 서열표 서열 5의 5' 말단으로부터 제30-41위치, 서열표 서열 7의 5' 말단으로부터 제30-41위치, 서열표 서열 9의 5' 말단으로부터 제30-41위치, 서열표 서열 11의 5' 말단으로부터 제30-41위치, 서열표 서열 13의 5' 말단으로부터 제30-41위치, 서열표 서열 15의 5' 말단으로부터 제30-41위치, 서열표 서열 17의 5' 말단으로부터 제30-41위치, 서열표 서열 19의 5' 말단으로부터 제30-41위치, 서열표 서열 21의 5' 말단으로부터 제30-41위치, 서열표 서열 23의 5' 말단으로부터 제30-41위치로 표시될 수 있다.

상기 시퀀싱 어댑터 A는 구체적으로 Ⅲumina의 Truseq 시퀀싱 키트의 시퀀싱 어댑터일 수 있다. 상기 시퀀싱 어댑터 A는 구체적으로 서열표에 도시된 바와 같이 서열 1의 5' 말단으로부터 제1-29위치로 표시될 수 있다.

상기 시퀀싱 어댑터 B는 구체적으로 Ⅲumina의 nextera 시퀀싱 키트의 시퀀싱 어댑터일 수 있다. 상기 시퀀싱 어댑터 B는 구체적으로 서열표에 도시된 바와 같이 서열 2의 5' 말단으로부터 제13-41위치로 표시될 수 있다.

n=12인 경우 상기 12개 어댑터는 다음과 같다.

어댑터 1은 서열표의 서열 1로 표시되는 단일 가닥 DNA 분자와 서열 2로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 2는 서열표의 서열 3으로 표시되는 단일 가닥 DNA 분자와 서열 4로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 3은 서열표의 서열 5로 표시되는 단일 가닥 DNA 분자와 서열 6으로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 4는 서열표의 서열 7로 표시되는 단일 가닥 DNA 분자와 서열 8로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 5는 서열표의 서열 9로 표시되는 단일 가닥 DNA 분자와 서열 10으로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 6은 서열표의 서열 11로 표시되는 단일 가닥 DNA 분자와 서열 12로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 7은 서열표의 서열 13으로 표시되는 단일 가닥 DNA 분자와 서열 14로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 8은 서열표의 서열 15로 표시되는 단일 가닥 DNA 분자와 서열 16으로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 9는 서열표의 서열 17로 표시되는 단일 가닥 DNA 분자와 서열 18로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 10은 서열표의 서열 19로 표시되는 단일 가닥 DNA 분자와 서열 20으로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 11은 서열표의 서열 21로 표시되는 단일 가닥 DNA 분자와 서열 22로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 12는 서열표의 서열 23으로 표시되는 단일 가닥 DNA 분자와 서열 24로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있다.

상기 어댑터는 업스트림 프라이머 A와 다운스트림 프라이머 A를 어닐링하여 획득할 수 있다.

상기 어댑터 혼합물에서 각 어댑터는 등몰로 혼합될 수 있다.

상기 방법은 단계 (3)에서 획득한 라이브러리를 증폭하는 단계를 더 포함할 수 있다. 상기 증폭 프라이머는 어댑터 서열에 따라 설계된다. 즉, 상기 증폭 프라이머는 적어도 한 세그먼트 서열과 어댑터의 특정 세그먼트 서열이 완전히 일치해야 한다. 상기 증폭에 사용되는 프라이머 쌍은 구체적으로 서열표의 서열 25 및 서열 26으로 표시된 두 단일 가닥 DNA 분자로 구성될 수 있다.

서열표의 서열 25로 표시된 단일 가닥 DNA 분자는 바로 시퀀싱 어댑터 A 5' 말단 제1-19위치이다.

서열표의 서열 26으로 표시된 단일 가닥 DNA 분자는 바로 시퀀싱 어댑터 B 3' 말단 제1-22위치이다.

본 발명은 상기 방법에 의해 제작된 DNA 라이브러리를 더 보호한다.

본 발명은 상술한 어느 하나의 어댑터 혼합물 및 메틸화 감응성 제한 엔도뉴클레아제를 포함할 수 있는 시퀀싱 라이브러리 구축용 키트를 더 보호한다.

상기 시퀀싱 라이브러리 구축용 키트는 상술한 어느 하나의 어댑터 혼합물 및 메틸화 감응성 제한 엔도뉴클레아제로 구성될 수 있다.

본 발명은 상술한 어느 하나의 어댑터 혼합물과 프라이머 조합을 포함하는 DNA 샘플에서 종양 돌연변이 및/또는 메틸화 검출용 키트를 더 보호한다. 상기 프라이머 조합은 프라이머 세트 I, 프라이머 세트 II, 프라이머 세트 III, 프라이머 세트 IV, 프라이머 세트 V, 프라이머 세트 VI, 프라이머 세트 VII 및 프라이머 세트 VIII을 포함한다.

상기 프라이머 세트 I 및 상기 프라이머 세트 II의 각 프라이머는 종양 돌연변이와 관련된 영역에 따라 설계된 특이적 프라이머이며, 그 기능은 게놈 특정 위치에 위치하여 표적 영역의 PCR 농축을 구현하는 것이고, 상기 프라이머 세트 I 및 상기 프라이머 세트 II는 각각 DNA 양성 가닥 및 음성 가닥의 돌연변이 부위를 검출하는 데 사용된다.

상기 프라이머 세트 III 및 상기 프라이머 세트 IV의 각 프라이머는 종양 특이적 과메틸화 영역에 따라 설계된 특이적 프라이머이며, 그 기능은 게놈 특정 위치에 위치하여 표적 영역의 PCR 농축을 구현하는 것이고, 상기 프라이머 세트 III 및 상기 프라이머 세트 IV는 각각 DNA 양성 가닥 및 음성 가닥의 메틸화 부위를 검출하는 데 사용된다.

상기 프라이머 세트 V, 상기 프라이머 세트 VI, 상기 프라이머 세트 VII 및 상기 프라이머 세트 VIII의 각 프라이머는 모두 어댑터 서열 및 특이적 서열을 포함하며, 특이적 서열은 표적 영역의 추가적 농축에 사용된다.

상기 프라이머 세트 V와 상기 프라이머 세트 I에서 동일한 돌연변이 부위에 대해 설계된 2개의 프라이머는 "네스티드" 관계에 있다.

상기 프라이머 세트 VI와 상기 프라이머 세트 II에서 동일한 돌연변이 부위에 대해 설계된 2개의 프라이머는 "네스티드" 관계에 있다.

상기 프라이머 세트 VII와 상기 프라이머 세트 III에서 동일한 메틸화 부위에 대해 설계된 2개의 프라이머는 "네스티드" 관계에 있다.

상기 프라이머 세트 VIII와 상기 프라이머 세트 IV에서 동일한 메틸화 부위에 대해 설계된 2개의 프라이머는 "네스티드" 관계에 있다.

상기 "종양 돌연변이와 관련된 영역에 따라 설계된 특이적 프라이머"는 구체적으로 종양 특이적 유전자 돌연변이(예를 들어 점 돌연변이, 삽입 결실 돌연변이, HBV 통합 등 다양한 돌연변이 형태)의 영역에 따라 대응하는 유전자 특이적 프라이머를 설계할 수 있다.

상기 "종양 특이적 과메틸화 영역에 따라 설계된 특이적 프라이머"는 구체적으로 종양 특이적 메틸화 영역에 따라 대응하는 유전자 특이적 프라이머를 설계할 수 있다.

상기 키트에서 상기 종양은 간 악성 종양, 즉 간세포암일 수 있다.

상기 간세포암 돌연변이와 관련된 영역은 구체적으로 간세포암 고주파 돌연변이 유전자(TP53, CTNNB1, AXIN1, TERT)의 관련 영역 및 HBV 통합을 위한 핫스팟 영역일 수 있다.

상술한 어느 하나의 키트에 있어서, 상기 프라이머 세트 I은 78개 단일 가닥 DNA 분자를 포함하고, 78개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 28 내지 105로 표시된다. 상기 프라이머 세트 II은 82개 단일 가닥 DNA 분자를 포함하고, 82개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 106 내지 187로 표시된다. 상기 프라이머 세트 III은 14개 단일 가닥 DNA 분자를 포함하고, 14개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 188 내지 201로 표시된다. 상기 프라이머 세트 IV은 15개 단일 가닥 DNA 분자를 포함하고, 15개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 202 내지 216으로 표시된다. 상기 프라이머 세트 V는 75개 단일 가닥 DNA 분자를 포함하고, 75개 단일 가닥 DNA 분자는 서열표의 서열 220 내지 294에서 5' 말단부터 시작해 제16위치 3' 말단으로 표시되는 뉴클레오티드 서열을 순차적으로 포함한다. 상기 프라이머 세트 VI는 79개 단일 가닥 DNA 분자를 포함하고, 79개 단일 가닥 DNA 분자는 서열표의 서열 295 내지 373에서 5' 말단부터 시작해 제16위치 3' 말단으로 표시되는 뉴클레오티드 서열을 순차적으로 포함한다. 상기 프라이머 세트 VII는 14개 단일 가닥 DNA 분자를 포함하고, 14개 단일 가닥 DNA 분자는 서열표의 서열 374 내지 387에서 5' 말단부터 시작해 제16위치 3' 말단으로 표시되는 뉴클레오티드 서열을 순차적으로 포함한다. 상기 프라이머 세트 VIII는 15개 단일 가닥 DNA 분자를 포함하고, 15개 단일 가닥 DNA 분자는 서열표의 서열 388 내지 402에서 5' 말단부터 시작해 제16위치 3' 말단으로 표시되는 뉴클레오티드 서열을 순차적으로 포함한다.

상기 프라이머 세트 V 중 75개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 220 내지 294로 표시될 수 있다. 상기 프라이머 세트 VI 중 79개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 295 내지 373으로 표시될 수 있다. 상기 프라이머 세트 VII 중 14개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 374 내지 387로 표시될 수 있다. 상기 프라이머 세트 VIII 중 15개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 388 내지 402로 표시될 수 있다.

상기 프라이머 세트 I는 구체적으로 상기 78개 단일 가닥 DNA 분자로 구성될 수 있다.

상기 프라이머 세트 II는 구체적으로 상기 82개 단일 가닥 DNA 분자로 구성될 수 있다.

상기 프라이머 세트 III는 구체적으로 상기 14개 단일 가닥 DNA 분자로 구성될 수 있다.

상기 프라이머 세트 IV는 구체적으로 상기 15개 단일 가닥 DNA 분자로 구성될 수 있다.

상기 프라이머 세트 V는 구체적으로 상기 75개 단일 가닥 DNA 분자로 구성될 수 있다.

상기 프라이머 세트 VI는 구체적으로 상기 79개 단일 가닥 DNA 분자로 구성될 수 있다.

상기 프라이머 세트 VII는 구체적으로 상기 14개 단일 가닥 DNA 분자로 구성될 수 있다.

상기 프라이머 세트 VIII는 구체적으로 상기 15개 단일 가닥 DNA 분자로 구성될 수 있다.

상술한 어느 하나의 키트는 구체적으로 상술한 어느 하나의 어댑터 혼합물과 상기 프라이머 조합으로 구성될 수 있다.

상술한 어느 하나의 프라이머 조합은 구체적으로 상기 프라이머 세트 I, 상기 프라이머 세트 II, 상기 프라이머 세트 III, 상기 프라이머 세트 IV, 상기 프라이머 세트 V, 상기 프라이머 세트 VI, 상기 프라이머 세트 VII 및 상기 프라이머 세트 VIII로 구성될 수 있다.

상술한 어느 하나의 키트에는 DNA 추출용 시약, DNA 라이브러리 제작용 시약, 라이브러리 정제용 시약, 라이브러리 포획용 시약 등 라이브러리 제작용 재료가 더 포함될 수 있다.

본 발명은 상기 어느 하나의 프라이머 조합을 더 보호한다. 상기 프라이머 조합의 용도는 DNA 샘플에서 종양 돌연변이 및/또는 메틸화를 검출하는 것일 수 있다.

본 발명은 S1) 또는 S2) 또는 S3)을 더 포함한다.

S1) DNA 샘플에서 종양 돌연변이 및/또는 메틸화 검출용 키트의 제조에서 상술한 어느 하나의 프라이머 조합의 응용이다.

S2) 종양 환자 혈액 샘플 및 비종양 환자 혈액 샘플 구분에서 상술한 어느 하나의 프라이머 조합의 응용이다.

S3) 종양 환자 혈액 샘플 및 비종양 환자 혈액 샘플 구분에서 상술한 어느 하나의 키트의 응용이다.

상술한 응용에 있어서, 상기 종양은 간 악성 종양, 즉 간세포암일 수 있다.

본 발명은 다음 단계를 포함할 수 있는 DNA 샘플 중 표적 돌연변이 및/또는 메틸화를 검출하는 방법을 더 보호한다.

(1) 상기 어느 하나의 방법에 따라 라이브러리를 제작한다.

(2) 단계 (1)에서 획득한 라이브러리에 대해 두 번의 네스티드 PCR 증폭을 수행하고, 생성물을 시퀀싱하며, 시퀀싱 결과에 따라 DNA 샘플 중 표적 돌연변이 및/또는 메틸화 발생 상황을 분석한다.

상기 단계 (2)에서는 프라이머 조합 A를 채택하여 1차 PCR 증폭을 수행한다.

프라이머 조합 A는 업스트림 프라이머 A와 다운스트림 프라이머 조합 A로 구성된다.

상기 업스트림 프라이머 A는 단계 (1)의 라이브러리 증폭에 사용되는 라이브러리 증폭 프라이머이다.

상기 다운스트림 프라이머 조합 A는 X개 표적 부위에 따라 설계된 Y개 프라이머의 조합이며, X와 Y는 모두 1 이상의 자연수이고, X≤Y이다.

1차 PCR의 생성물을 템플릿으로 사용하고, 프라이머 조합 B를 채택해 2차 PCR 증폭을 수행한다.

프라이머 조합 B는 업스트림 프라이머 B, 다운스트림 프라이머 조합 B 및 인덱스 프라이머로 구성된다.

상기 업스트림 프라이머 B는 라이브러리 증폭 프라이머이고 3' 말단은 상기 업스트림 프라이머 A 부분과 동일하며, 1차 PCR 생성물의 증폭에 사용된다.

상기 index 프라이머는 5' 말단으로부터 시퀀싱을 위한 세그먼트 A, 샘플을 구분하기 위한 index 서열 및 시퀀싱을 위한 세그먼트 B를 포함한다.

상기 다운스트림 프라이머 세트 B의 프라이머는 상기 세그먼트 B를 가지며 다운스트림 프라이머 조합 A 중 동일한 표적을 검출하는 프라이머와 네스티드 관계를 형성한다.

상기 업스트림 프라이머 B의 뉴클레오티드 서열은 서열표 서열 217에 표시된 것과 같을 수 있다.

상기 index 프라이머는 5' 말단으로부터 구체적으로 상기 세그먼트 A, 상기 인덱스 서열 및 상기 세그먼트 B로 구성될 수 있다.

상기 세그먼트 A의 뉴클레오티드 서열은 서열표 서열 218에 표시된 것과 같을 수 있다.

상기 세그먼트 B의 뉴클레오티드 서열은 서열표 서열 219에 표시된 것과 같을 수 있다.

상기 업스트림 프라이머 A의 부분 서열은 "각 어댑터의 업스트림 프라이머 A의 시퀀싱 어댑터 A"의 서열과 완전히 동일하다.

상기 업스트림 프라이머 B는 라이브러리 분자의 어댑터 서열을 보완하는 데 사용되므로, 증폭 생성물을 곧바로 시퀀싱할 수 있다. 상기 업스트림 프라이머 B와 상기 업스트림 프라이머 A(1차 PCR 증폭에 사용되는 프라이머)의 부분 뉴클레오티드 서열은 완전히 동일하다.

상기 업스트림 프라이머 A의 뉴클레오티드 서열은 구체적으로 서열표 서열 27에 표시된 것과 같을 수 있다.

상기 업스트림 프라이머 B의 뉴클레오티드 서열은 구체적으로 서열표 서열 188에 표시된 것과 같을 수 있다.

상기 표적 돌연변이가 간세포암 돌연변이인 경우, 상기 다운스트림 프라이머 세트 A는 상술한 어느 하나의 프라이머 세트 I 및 프라이머 세트 II로 구성된다. 상기 다운스트림 프라이머 세트 B는 상술한 어느 하나의 프라이머 세트 V 및 프라이머 세트 VI로 구성된다. 프라이머 세트 I 및 프라이머 세트 II를 각각 사용하여 템플릿에 대해 1차 PCR 증폭을 수행한다. 프라이머 세트 I로 증폭된 생성물은 2차 증폭을 위한 템플릿으로 사용되며 프라이머 세트 V를 채택해 증폭을 수행한다. 프라이머 세트 II로 증폭된 생성물은 2차 증폭을 위한 템플릿으로 사용되며 프라이머 세트 VI를 채택해 증폭을 수행한다. 마지막으로 동일한 부피의 증폭 생성물을 혼합한다.

상기 표적 메틸화가 간세포암 메틸화인 경우, 상기 다운스트림 프라이머 세트 A는 상술한 어느 하나의 프라이머 세트 III 및 프라이머 세트 IV로 구성된다. 상기 다운스트림 프라이머 세트 B는 상술한 어느 하나의 프라이머 세트 VII 및 프라이머 세트 VIII로 구성된다.

프라이머 세트 III 및 프라이머 세트 IV를 각각 사용하여 템플릿에 대해 1차 PCR 증폭을 수행한다. 프라이머 세트 III로 증폭된 생성물은 2차 증폭을 위한 템플릿으로 사용되며 프라이머 세트 VII를 채택해 증폭을 수행한다. 프라이머 세트 IV로 증폭된 생성물은 2차 증폭을 위한 템플릿으로 사용되며 프라이머 세트 VIII를 채택해 증폭을 수행한다. 마지막으로 동일한 부피의 증폭 생성물을 혼합한다.

상술한 방법에 있어서, 상기 DNA 샘플에서 표적 돌연변이의 분석 방법은, 시퀀싱 데이터가 기준 A를 충족하는 DNA 분자를 하나의 분자 클러스터로 되돌리고, 기준 B를 충족하는 분자 클러스터를 한 쌍의 duplex 분자 클러스터로 표시하는 것일 수 있으며, 특정 돌연변이의 경우, (a1) 적어도 한 쌍의 dulpex 분자 클러스터가 지원되는 조건(상기 조건은 캡쳐 시퀀싱의 데이터만 지원되며, race에 대한 데이터는 적용하지 않음) 또는 (a2) 적어도 4개의 분자 클러스터가 지원되는 조건이 충족되면, 상기 돌연변이는 원래 DNA 샘플 유래의 진정한 돌연변이이고, 기준 A는 ① DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, ② 랜덤 태그 서열이 동일한 조건, 및 ③ 고정 서열이 동일한 조건을 동시에 충족하고, 기준 B는 ④ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, 및 ⑤ 분자 클러스터 양단의 고정 서열이 동일하나 위치는 반대인 조건을 동시에 충족한다.

상기 방법에 있어서, 상기 DNA 샘플에서 메틸화의 분석 방법은, 시퀀싱 데이터가 기준 C를 충족하는 DNA 분자를 하나의 클러스터로 표시하고, 단편 말단이 관심 효소 절단 부위인 클러스터의 수량을 각각 계산하여, 비메틸화된 단편으로 기록하고, 증폭 단편이 제1 효소 절단 부위에 도달 또는 초과하는 모든 클러스터의 수량을 계산하여 단편 총 수로 기록하고, 두 가지 단편 수량에 따라 대응 영역의 평균 메틸화 수준을 계산하는 것일 수 있고, 영역의 메틸화 수준 = (1 - 비메틸화 단편 수/단편 총 수) × 100%이고, 기준 C는 ⑥ 랜덤 태그 서열이 동일한 조건, ⑦ 고정 서열이 동일한 조건, 및 ⑧ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건을 동시에 충족한다.

상기 DNA 삽입 단편은 구체적으로 어댑터 이외의 증폭된 DNA 단편을 지칭한다.

본 발명은 다음 단계를 포함할 수 있는 DNA 샘플 중 다양한 표적 돌연변이 및/또는 메틸화를 검출하는 방법을 더 보호한다.

(1) 상기 어느 하나의 방법에 따라 라이브러리를 제작한다.

(2) 단계 (1)의 라이브러리에 대해 표적 영역 농축 및 시퀀싱을 수행하며, 시퀀싱 결과에 따라 DNA 샘플 중 표적 돌연변이 및/또는 메틸화의 발생 상황을 분석한다.

상술한 방법에 있어서, 상기 DNA 샘플에서 표적 돌연변이의 분석 방법은, 시퀀싱 데이터가 기준 A를 충족하는 DNA 분자를 하나의 분자 클러스터로 되돌리고, 기준 B를 충족하는 분자 클러스터를 한 쌍의 duplex 분자 클러스터로 표시하는 것일 수 있으며, 특정 돌연변이의 경우, (a1) 적어도 한 쌍의 duplex 분자 클러스터가 지원되는 조건, 또는 (a2) 적어도 4개 분자 클러스터가 지원되는 조건이 충족되면, 상기 돌연변이는 원래 DNA 샘플 유래의 진정한 돌연변이이고, 기준 A는 ① DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, ② 랜덤 태그 서열이 동일한 조건, 및 ③ 고정 서열이 동일한 조건을 동시에 충족하고, 기준 B는 ④ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, 및 ⑤ 분자 클러스터 양단의 고정 서열이 동일하나 위치는 반대인 조건을 동시에 충족한다.

상기 표적 영역 농축은 종래의 상용화된 표적 포획 키트(예를 들어 Agilent sureselect XT 표적 포획 키트, Agilent 5190-8646)를 사용하여 수행할 수 있으며, 여기에서 마지막 단계 PCR 증폭의 프라이머 쌍을 프라이머 A와 프라이머 B로 구성된 프라이머 쌍으로 변경한다. 상기 프라이머 B의 뉴클레오티드 서열은 서열표 서열 403에 표시된 것과 같을 수 있다. 상기 프라이머 B는 세그먼트 A, 인덱스 서열 및 세그먼트 B를 포함할 수 있다. 상기 프라이머 B는 구체적으로 상기 세그먼트 A, 상기 인덱스 서열 및 상기 세그먼트 B로 구성될 수 있다. 상기 세그먼트 A의 뉴클레오티드 서열은 서열표 서열 404에 표시된 것과 같을 수 있다. 상기 세그먼트 B의 뉴클레오티드 서열은 서열표 서열 405에 표시된 것과 같을 수 있다.

상술한 어느 하나의 방법에 있어서, 상기 표적 돌연변이 및/또는 메틸화는 종양 돌연변이 및/또는 메틸화일 수 있다. 상기 종양은 간 악성 종양, 즉 간세포암일 수 있다.

상기에서 통상적으로 복수의 상이한 샘플의 라이브러리는 함께 혼합되어 시퀀싱될 수 있고, 상기 인덱스 서열은 상이한 샘플을 표시하는 데 사용된다. 시퀀싱이 완료된 후, 상이한 인덱스 서열에 따라 전체 시퀀싱 데이터에 대해 분할을 수행한다. 인덱스의 설계 원칙은 전술한 고정 서열의 설계 원칙과 기본적으로 유사하다.

상기 내용에서 DNA 샘플은 메틸화 감응성 제한 엔도뉴클레아제로 효소 절단한 후 DNA 단편을 형성한다(이때의 DNA 단편 양단은 모두 점성 말단을 형성하고, 말단의 단일 가닥 부분의 뉴클레오티드 서열이 바로 중단점 서열임). DNA 단편은 말단 수복을 수행한 후 어댑터와 연결된다(5' 말단 및 3' 말단에 각각 하나의 어댑터가 연결되며, 이는 동일한 어댑터 또는 반대 어댑터일 수 있음). 이때 DNA 분자의 경우, 두 어댑터 사이의 DNA 단편이 바로 DNA 삽입 단편이다.

본 발명은 하나의 샘플로 ctDNA에서 종양 특이적 유전자의 돌연변이(점 돌연변이, 삽입 결실 돌연변이, HBV 통합 등 다양한 돌연변이 형태 포함) 및/또는 메틸화를 동시에 검출할 수 있는 방법을 제공한다. 이는 샘플 수요량이 적을 뿐만 아니라 이 방법으로 제조된 MC 라이브러리는 10 내지 20회의 후속 검출을 지원할 수 있다. 매회 검출의 결과는 모두 모든 원래 ctDNA 표본의 돌연변이 상태 및 효소 절단 부위 커버 영역의 메틸화 변형 상태를 나타낼 수 있고, 민감도와 특이성 저하를 초래하지 않는다. 상기 방법으로 구축된 라이브러리는 PCR의 핫스팟 검출과 캡쳐 시퀀싱에 동시에 사용될 수 있으며, 추가된 DNA 바코드는 위양성 결과를 효과적으로 필터링할 수 있고, duplex 기반의 고특이성 시퀀싱을 구현할 수 있다. 동시에 라이브러리 제작 방법은 cfDNA 샘플뿐만 아니라 게놈 DNA 또는 cDNA 샘플에도 적합하다. 본 발명은 종양 조기 스크리닝, 질병 추적, 치료 효과 평가, 예후 예측 등에 있어서 중요한 임상적 의의를 가지며, 응용 가치가 크다.

도 1은 adapter 및 프라이머 구성의 모식도이다.
도 2는 RaceSeq 표적 영역 농축 및 라이브러리 제작 모식도이다.
도 3은 MC 라이브러리 포획 및 duplex 시퀀싱을 수행하는 모식도이다.
도 4는 Padlock 방법 및 돌연변이/메틸화 동시 검출 방법(즉, 본 발명에서 제공하는 방법)에 의한 AK055957 유전자의 메틸화 수준에 대한 검출 결과이다.
도 5는 돌연변이 단독 검출법과 돌연변이/메틸화 동시 검출법에 의한 돌연변이 검출 및 돌연변이 빈도의 결과이다.

이하의 실시예는 본 발명의 더 나은 이해를 돕기 위한 것으로 본 발명을 제한하지 않는다.

이하의 실시예에 사용된 실험 방법은 달리 명시되지 않는 한 모두 일반적인 방법이다.

이하의 실시예에 사용된 시험 재료는 달리 명시되지 않는 한 모두 일반적인 생화학 시약 판매점에서 구입한 것이다.

이하의 실시예에 사용된 정량 시험은 모두 3회 반복 실험으로 설정되었으며 결과는 평균값을 취하였다.

하기 실시예 중의 TE 버퍼는 ThermoFisher사의 제품이며 제품 카탈로그 번호는 12090015이다.

하기 실시예에 있어서, 간세포암 환자는 본 발명의 내용에 대하여 사전동의를 받았다.

실시예 1. MC 라이브러리의 제작

一. 메틸화 감응성 제한 엔도뉴클레아제 효소 절단

5-40ng cfDNA를 취하고 표 1과 같이 반응 시스템을 구성한 후, 표 2의 절차에 따라 PCR 기계에서 효소 절단 처리를 수행하여 효소 절단 생성물을 획득한다(4℃에 보관).

Restriction Enzyme와 Restriction Enzyme 10×Buffer는 모두 ThermoFisher사의 제품이다. Restriction Enzyme와 Restriction Enzyme 10×Buffer는 상이한 검출 대상 표적 영역에 따라 선택할 수 있으며, 선택 기준은 검출 대상 영역 내에 적어도 하나의 상기 메틸화 감응성 제한 엔도뉴클레아제의 효소 절단 부위가 포함되는 것이다.

표 1. 반응 시스템

표 2. 반응 절차

二. 효소 절단 생성물의 정제

단계 1에서 획득한 효소 절단 생성물을 취하고 Apostle MiniMax^™ 고효율 유리 DNA 농축 분리 키트(표준 버전)(Apostle사 제품, 제품 카탈로그 번호 A17622-50)를 사용하여 정제 및 농축하여 정제 생성물을 수득한다.

三. 정제 생성물의 평활 말단 수복 및 A 추가 처리

단계 2에서 획득한 정제 생성물을 취하고, 표 3과 같이 반응 시스템을 구성한 후, 표 4의 절차에 따라 PCR 기계에서 말단 수복 및 3' 말단 A 추가 처리를 수행하여 반응 생성물을 획득한다(4℃에 보관).

표 3. 반응 시스템

표 4. 반응 절차

四. 반응 생성물과 어댑터 연결

표 5에 따라 반응 시스템을 구성하고, 20℃에서 15분 동안 반응시켜 결찰 생성물을 획득한다(4℃에 보관).

표 5. 반응 시스템

Adapter 서열 정보는 표 6과 같다.

각각 표 6의 단일 가닥 DNA 분자를 TE 버퍼로 용해하고 100μM 농도로 희석한다. 동일한 세트 중의 두 단일 가닥 DNA 분자를 동일한 부피로 혼합한 후(각각 50μl) 어닐링을 수행하여(어닐링 절차: 95℃, 15분; 25℃, 2시간), 12세트의 DNA 용액을 획득하며, 12세트 DNA 용액을 동일한 부피로 혼합하여 Adapter Mix를 획득한다.

표 6. adapter 서열 정보

표 6에서 8개 N은 8bp 랜덤 태그를 나타낸다. 실제 적용에서 랜덤 태그 길이는 8-14bp일 수 있다.

밑줄은 12bp의 고정 서열을 나타내며, 각 세트의 업스트림 서열(명칭에 "F"가 포함된 업스트림 서열)과 다운스트림 서열(명칭에 "R"이 포함된 다운스트림 서열)에서 밑줄 부분은 역상보이며, 어닐링을 통해 업스트림 및 다운스트림 서열을 함께 결합하여 어댑터를 형성할 수 있다. 동시에 고정 서열은 원본 템플릿 분자를 표시하기 위해 서열을 고정하는 내장 태그로 사용할 수 있다. 실제 적용에서 고정 서열의 길이는 12-20bp일 수 있고, 연속 반복 염기는 3개를 초과하지 않으며, 프라이머의 다른 부분과 상호작용할 수 없다(예를 들어 헤어핀 구조, 이량체 형성 등). 12세트 각 위치 염기는 균형을 이루며(즉, A, T, C 및 G가 고르게 분포됨), 미스매치 염기 수는 ≥3이다(즉, 각 고정 서열 간의 염기는 적어도 3개가 상이하며, 상이함은 위치가 상이하거나 순서가 상이한 것일 수 있음).

업스트림 서열 중 말단에 추가한 굵은 T는 원본 분자 말단에 추가한 "A"와 상보적이며 TA가 연결을 수행한다.

업스트림 서열에 있어서, 5' 말단으로부터 제1 내지 21위치(Ⅲumina 회사의 Truseq 시퀀싱 키트)는 시퀀싱 프라이머 결합 서열이고, 여기에서 5' 말단으로부터 제1 내지 19위치는 라이브러리 증폭 프라이머 부분이다.

다운스트림 서열에 있어서, 밑줄이 없는 부분(Ⅲumina 회사의 nextera 시퀀싱 키트)은 시퀀싱 프라이머 결합 서열이고, 여기에서 3' 말단 제1 내지 22위치는 라이브러리 증폭 프라이머의 부분이다.

표 6은 총 12세트 어댑터를 포함하며, 12×12=144가지 표시 조합을 형성할 수 있고, 분자 자체의 서열 정보를 결합하며, 원본 샘플 중의 모든 분자를 구분하기에 충분하고, 실제 적용에서 세트 수를 적절하게 증가시키거나(합성 비용 증가) 감소시킬(구분 효과 미약) 수도 있다.

결찰 생성물 구조는 도 1에 도시된 바와 같다. 여기에서 a는 어댑터 부분이고, b 및 f는 각각 라이브러리 증폭 프라이머이고, c는 8bp 랜덤 태그이고(표 6에서 8개 N으로 표시), d는 12bp 고정 서열이고(표 6에서 밑줄로 표시), e는 삽입 단편이다(cfDNA).

五. 결찰 생성물 정제

단계 4에서 획득한 결찰 생성물에 110μl 내지 220μl(즉 1 내지 2배 부피)의 AMPure XP 마그네틱 비드(Beckman A63880)를 추가하고, 균일하게 와류 혼합하고, 실온에서 10분 동안 거치하고, 마그네틱 스탠드에 5분 동안 흡착시킨다. 용액이 맑아지면 상청액을 버린 후 200μl 80%(부피분율 함량) 에탄올 수용액을 첨가하여 2회 세척하고, 상청액을 버린다. 에탄올 건조 후 DNase/RNase-Free Water 30μl를 첨가하고 균일하게 완류 혼합하며, 실온에서 10분 동안 거치하고, 마그네틱 스탠드에 5분간 흡착시키고, 상청 용액을 취하여 PCR 튜브 내에 넣고 PCR 템플릿으로 사용한다.

六. 라이브러리 증폭 및 정제

1. 단계 5에서 수득한 PCR 템플릿을 취하여 표 7에 따라 반응 시스템을 구성하고 표 8에 따라 PCR 증폭을 수행하여 PCR 증폭 생성물을 획득한다(4℃에 보관).

표 7. 반응 시스템

표 7에서 프라이머 정보는 다음과 같다.

MC_F(서열 25): 5'-GACACGACGCTCTTCCGAT-3'

MC_R(서열 26): 5'-GTGGGCTCGGAGATGTGTATAA-3'

표 8. 반응 절차

2. 단계 1에서 획득한 PCR 증폭 생성물에 70 내지 140μl(즉, 1 내지 2배 부피)의 AMPure XP 마그네틱 비드를 추가하고, 균일하게 와류 혼합하고, 실온에서 10분 동안 거치하고, 마그네틱 스탠드에 5분 동안 흡착시킨다. 용액이 맑아지면 상청액을 버린 후 200μl 80%(부피분율 함량) 에탄올 수용액을 첨가하여 2회 세척하고, 상청액을 버린다. 에탄올 건조 후 DNase/RNase-Free Water 100μl를 첨가하고 균일하게 완류 혼합하며, 실온에서 10분 동안 거치하고, 마그네틱 스탠드에 5분간 흡착시키고, 상청 용액을 취하여 생성물을 획득한다(-20℃에 보관). 생성물이 바로 장기 보관 가능하고 반복 사용 가능한 MC 라이브러리이다.

검출을 거쳐, MC 라이브러리는 10 내지 20회의 후속 검출 지원할 수 있었으며, 매회 검출의 결과는 모두 모든 원본 샘플의 돌연변이 상태 및 효소 절단 부위 커버 영역의 메틸화 변형 상태를 나타낼 수 있고, 민감도와 특이성을 저하시키지 않는다. 동시에 라이브러리 제작 방법은 cfDNA 샘플뿐만 아니라 게놈 DNA 또는 cDNA 샘플에도 적합하다.

실시예 2: RaceSeq 농축 표적 영역 및 시퀀싱 라이브러리 제작

도 2에 도시된 바와 같이, 중국 간세포암 고주파 돌연변이 유전자(TP53, CTNNB1, AXIN1, TERT)의 관련 영역, HBV 통합 핫스팟 영역 및 간세포암 특이적 과메틸화 영역(EMX1, LRRC4, BDH1 등)에 대해 설계한 프라이머를 사용하여 고정 프라이머와 함께 MC 라이브러리에 대해 2회 PCR 증폭을 수행하며, 증폭 생성물은 바로 시퀀싱 라이브러리이다.

도 2에서 a는 1차 라이브러리 증폭 업스트림 프라이머이고, b는 2차 라이브러리 증폭 업스트림 프라이머이고, c는 1차 라이브러리 증폭 다운스트림 프라이머 라이브러리이며 특이 표적 서열 농축에 사용되고, d는 2차 라이브러리 증폭 다운스트림 프라이머 라이브러리이며 특이 표적 서열 농축에 사용되고, e는 index primer이며 index 서열을 추가하는 데 사용된다.

1. 실시예 1에서 제조된 MC 라이브러리 300ng를 취하여 두 부분으로 나누고, 표 9과 같이 반응 시스템을 구성하며(한 부분은 GSP1A mix를 추가하고 다른 부분은 GSP1B mix를 추가함), 표 11의 반응 절차에 따라 1차 PCR 증폭을 수행하여 1차 증폭 생성물을 획득한다(총 두 부분의 1차 증폭 생성물을 획득하며, 한 부분은 GSP1A mix의 증폭 생성물이고 다른 하나는 GSP1B mix의 증폭 생성물임).

표 9. 반응 시스템

표 9에서 프라이머 정보는 다음과 같다.

업스트림 프라이머 1355(서열 27): 5'-TCTTTCCCTACACGACGCTCTTCCGAT-3'

GSP1A mix: 표 10에서 프라이머 풀 GSP1A에 속하는 각 프라이머는 TE 버퍼를 사용해 용해하여 100μM 농도로 희석한 후, 동일한 부피로 혼합하고 TE 버퍼를 사용해 0.3μM로 희석한다. 프라이머 풀 GSP1A 중의 프라이머는 템플릿의 양성 가닥을 증폭하는 데 사용된다.

GSP1B mix: 표 10에서 프라이머 풀 GSP1B에 속하는 각 프라이머는 TE 버퍼를 사용해 용해하여 100μM 농도로 희석한 후, 동일한 부피로 혼합하고 TE 버퍼를 사용해 0.3μM로 희석한다. 프라이머 풀 GSP1B 중의 프라이머는 템플릿의 음성 가닥을 증폭하는 데 사용된다.

프라이머 풀 GSP1A 및 프라이머 풀 GSP1B에 있어서, 동일한 일련번호의 프라이머(즉, 프라이머 일련번호의 뒤 네 자리가 동일)는 양성 및 음성 두 방향에서 동일한 돌연변이 부위를 검출하였으며, 동시에 최대 가능 한도의 농축 원본 분자 정보를 사용하였다.

표 10. 프라이머 정보

표 11. 반응 절차

2. 단계 1에서 획득한 두 개의 1차 증폭 생성물을 30 내지 60μl(즉, 1 내지 2배 부피)의 AMPure XP 마그네틱 비드로 정제한 다음 25μl DNase/RNase-Free Water로 용출하여 1차 정제 생성물을 획득한다.

3. 각각 단계 2에서 획득한 1차 정제 생성물을 템플릿으로 사용하여 표 12의 반응 시스템을 구성하며(GSP1A mix 증폭 생성물을 템플릿으로 채택하는 경우 GSP2A mix 증폭을 채택하고, GSP1B mix 증폭 생성물을 템플릿으로 채택하는 경우 GSP2B mix 증폭을 채택함), 표 14의 반응 절차에 따라 2차 PCR 증폭을 수행하여 2차 증폭 생성물을 획득한다(4℃에 보관).

표 12. 반응 시스템

표 12에서 프라이머 정보는 다음과 같다.

업스트림 프라이머 3355(서열 217): 5'-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCT-3', 밑줄 부분은 1차의 업스트림 프라이머 1355 동일 부분이며, 3355 및 1355는 모두 Ⅲumina 시퀀싱 플랫폼에 의해 시퀀싱된 고정 서열이다(기타 시퀀싱 플랫폼에 의해 시퀀싱된 서열로 변경될 수도 있음).

GSP2A mix: 표 13에서 프라이머 풀 GSP2A에 속하는 각 프라이머는 TE 버퍼를 사용해 용해하여 100μM 농도로 희석한 후, 동일한 부피로 혼합하고 TE 버퍼를 사용해 0.3μM로 희석한다. 프라이머 풀 GSP2A 중의 프라이머는 템플릿의 양성 가닥을 증폭하는 데 사용된다.

GSP2B mix: 표 13에서 프라이머 풀 GSP2B에 속하는 각 프라이머는 TE 버퍼를 사용해 용해하여 100μM 농도로 희석한 후, 동일한 부피로 혼합하고 TE 버퍼를 사용해 0.3μM로 희석한다. 프라이머 풀 GSP2B 중의 프라이머는 템플릿의 음성 가닥을 증폭하는 데 사용된다.

표 13에 있어서, 5' 말단으로부터 제1 내지 15위치는 Index 프라이머에 결합하는 부분이다.

GSP2A mix와 GSP1A mix에서 동일한 프라이머 일련번호를 가진 프라이머(즉, 프라이머 일련번호의 뒤 네 자리가 동일)는 동일한 돌연변이 부위에 대해 설계되었으며, 두 프라이머는 네스티드 관계를 형성한다.

GSP2B mix와 GSP2A mix에서 동일한 프라이머 일련번호를 가진 프라이머(즉, 프라이머 일련번호의 뒤 네 자리가 동일)는 동일한 돌연변이 부위에 대해 설계되었으며, 두 프라이머는 네스티드 관계를 형성한다.

Index 프라이머: 5'-CAAGCAGAAGACGGCATACGAGAT(서열 218) )********GTGACTGGAGTTCCTTGGCACCCGAGAA-3'(서열 219), 밑줄 부분은 GSP2 mix에 결합하는 부분이다. ********는 index 서열 위치이며, index의 길이는 6-8bp이고, 샘플 간의 서열 구별하고 여러 샘플의 혼합 시퀀싱을 용이하게 하는 데 사용된다. index 시퀀스를 제외한 나머지는 Ⅲumina의 small RNA 시퀀싱 키트의 고정 서열이다.

표 13. 프라이머 정보

비고: NA는 프라이머가 없음을 나타낸다.

표 14. 반응 절차

4. 단계 3에서 획득한 GSP2A mix를 채택하여 2차 증폭을 수행한 생성물과 GSP1B mix를 채택하여 2차 증폭을 수행한 생성물을 동일한 부피로 혼합하고, AMPure XP 마그네틱 비드를 이용하여 1:(1-2)의 비율로 정제를 수행한 후, 50μl DNase/RNase-Free Water로 용출하여 2차 정제 생성물을 획득하며, 이는 바로 Ⅲumina Hiseq X 플랫폼에서 시퀀싱할 수 있는 시퀀싱 라이브러리이다.

MC 라이브러리 상의 DNA 랜덤 태그는 cfDNA 서열과 함께 시퀀싱 라이브러리의 Read1 서열 다운스트림에 추가된다. 시퀀싱에 있어서, DNA 랜덤 태그 서열, 고정 서열, cfDNA 서열을 순차적으로 획득한다(도 1의 c, d, e 서열).

간세포암 특이적 유전자 돌연변이의 분석 방법은, 시퀀싱 데이터가 기준 A를 충족하는 DNA 분자를 하나의 분자 클러스터로 되돌리고, 기준 B를 충족하는 분자 클러스터를 한 쌍의 duplex 분자 클러스터로 표시하는 것이며, 특정 돌연변이의 경우, (a1) 적어도 한 쌍의 duplex 분자 클러스터가 지원되는 조건, 또는 (a2) 적어도 4개 분자 클러스터가 지원되는 조건이 충족되면, 상기 돌연변이는 원래 DNA 샘플 유래의 진정한 돌연변이이고, 기준 A는 ① DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, ② 랜덤 태그 서열이 동일한 조건, 및 ③ 고정 서열이 동일한 조건을 동시에 충족하고, 기준 B는 ④ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, 및 ⑤ 분자 클러스터 양단의 고정 서열이 동일하나 위치는 반대인 조건을 동시에 충족한다.

간세포암 특이적 메틸화 변형 정도의 분석 방법은, 시퀀싱 데이터가 기준 C를 충족하는 DNA 분자를 하나의 클러스터로 표시하고, 단편 말단이 관심 효소 절단 부위인 클러스터의 수량을 각각 계산하여, 비메틸화된 단편으로 기록하고, 증폭 단편이 제1 효소 절단 부위에 도달 또는 초과하는 모든 클러스터의 수량을 계산하여 단편 총 수로 기록하고, 두 가지 단편 수량에 따라 대응 영역의 평균 메틸화 수준을 계산하는 것이고, 영역의 메틸화 수준 = (1 - 비메틸화 단편 수/단편 총 수) × 100%이고, 기준 C는 ⑥ 랜덤 태그 서열이 동일한 조건, ⑦ 고정 서열이 동일한 조건, 및 ⑧ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건을 동시에 충족한다.

실시예 3. MC 라이브러리의 포획 및 시퀀싱

도 3에 도시된 바와 같이, 표적 영역 농축은 종래의 상용화된 표적 캡쳐 키트를 기반으로 최적화되도록 설계하여 캡쳐할 수 있다. 예를 들어, 메틸화 영역 기반의 캡쳐는 Roche SeqCap Epi CpGiant Enrichment Kit(Roche 07138881001) 또는 Ⅲumina Infinium Methylation EPIC BeadChipWG-317-1001를 참조할 수 있으며, 메틸화 영역 표적 캡쳐의 설계는 효소 절단 부위 커버 정도에 따라 스크리닝을 수행해야 하고, 프로브에서 중아황산염 처리를 기반으로 변환한 염기를 조정한다. 유전자 돌연변이 영역 기반의 캡쳐는 Agilent Sureselect XT 표적 캡쳐 키트(Agilent5190-8646)를 참조할 수 있으며, 마지막 단계 PCR 증폭의 프라이머만 다음 프라이머로 교체한다.

업스트림 프라이머: 5'-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3'(서열 403)(도 3의 "a"), 밑줄 부분은 프라이머 MC_F 부분과 동일하며, 증폭 라이브러리로 작용하고, 나머지 부분은 Ⅲumina 시퀀싱 플랫폼에서 시퀀싱하는 데 필요한 고정 서열이다.

다운스트림 프라이머: 5'-CAAGCAGAAGACGGCATACGAGAT(서열 404) ********GTCTCGTGGGCTCGGAGATGTGTATAA-3'(서열 405)(도 3의 "b"), 밑줄 부분은 프라이머 MC_R과 동일하게 증폭 라이브러리로 작용한다. ********는 index 서열 위치이며, index의 길이는 6-8bp이고, 샘플 간의 서열 구별하고 여러 샘플의 혼합 시퀀싱을 용이하게 하는 데 사용된다. 나머지 부분은 Ⅲumina 시퀀싱 플랫폼에서 시퀀싱에 필요한 고정 서열이다.

포획된 라이브러리와 MC 라이브러리는 동일한 DNA 랜덤 태그 서열, 고정 서열 및 cfDNA 서열을 가지며, 순차적으로 Read1 다운스트림에 위치한다.

시퀀싱 데이터가 기준 A를 충족하는 DNA 분자를 하나의 분자 클러스터로 되돌리며, 기준 A는 ① DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, ② 랜덤 태그 서열이 동일한 조건, 및 ③ 고정 서열이 동일한 조건을 동시에 충족한다. 기준 B를 충족하는 분자 클러스터를 한 쌍의 duplex 분자 클러스터로 표시하며, 기준 B는 ④ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, 및 ⑤ 분자 클러스터 양단의 고정 서열이 동일하나 위치는 반대인 조건을 동시에 충족한다. 특정 돌연변이의 경우, (a1) 적어도 한 쌍의 duplex 분자 클러스터가 지원되는 조건, 또는 (a2) 적어도 4개 분자 클러스터가 지원되는 조건이 충족되면, 상기 돌연변이는 원래 DNA 샘플 유래의 진정한 돌연변이이다. 한 쌍의 duplex 분자 클러스터가 공동 지원하는 돌연변이의 신뢰성은 더 높으며 위양성 돌연변이를 90%를 줄일 수 있다.

시퀀싱 데이터가 기준 C를 충족하는 DNA 분자를 하나의 클러스터로 표시하고, 단편 말단이 관심 효소 절단 부위인 클러스터의 수량을 각각 계산하여, 비메틸화된 단편으로 기록하고, 증폭 단편이 제1 효소 절단 부위에 도달 또는 초과하는 모든 클러스터의 수량을 계산하여 단편 총 수로 기록한다. 두 가지 단편 수량에 따라 대응 영역의 평균 메틸화 수준을 계산하며, 영역의 메틸화 수준 = (1 - 비메틸화 단편 수/단편 총 수) × 100%이다. 기준 C는 ⑥ 랜덤 태그 서열이 동일한 조건, ⑦ 고정 서열이 동일한 조건, 및 ⑧ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건을 동시에 충족한다.

실시예 4. 검출 방법의 비교

一. 검출 방법의 비교 1

1. 간세포암 환자 21명의 cfDNA 표본을 수집한다.

2. 단계 1 완료 후, 각 cfDNA 표본을 취하여 실시예 1의 방법에 따라 MC 라이브러리를 구축한 후, 실시예 2의 방법에 따라 RaceSeq 표적 영역을 농축 및 시퀀싱하여 AK055957 유전자의 메틸화 수준을 획득한다.

3. 단계 1 완료 후, 각 cfDNA 표본을 취하여 Padlock 방법(Xu R H , Wei W , Krawczyk M , et al. Circulating tumour DNA methylation markers for diagnosis and prognosis of hepatocellular carcinoma[J]. Nature Materials, 2017, 16(11):1155.)을 채택하여 AK055957 유전자의 메틸화 수준을 검출한다. Padlock은 메틸화 표적 시퀀싱 기술이다. Padlock 프로브 구조는 자물쇠와 유사하며, 고처리량 메틸화 표적 시퀀싱에 적용할 수 있다. 이는 고효율의 중아황산염 변환 후 라이브러리 구축 방법에 속하며 "BSPP"라고 불린다. cfDNA는 중아황산염 변환을 거친 후, 중아황산염 패드록 프로브(BSPP)의 캡처 암과 상보적으로 쌍을 이룰 때 증폭되어 고리형으로 연결될 수 있으며, 엑소뉴클리아제를 이용해 고리형으로 연결된 패드록 프로브를 스크리닝할 수 있으며, 증폭 생성물에 대해 시퀀싱을 수행하여 상응하는 DNA 메틸화 정보를 획득한다.

검출 결과는 도 4와 같다. 결과에 따르면, Padlock 방법과 돌연변이/메틸화 동시 검출 방법(즉, 본 발명에서 제공하는 방법)은 AK055957 유전자(간세포암 특이적 유전자에 속함)의 메틸화 수준 검출 결과와 기본적으로 동일하다.

二. 검출 방법의 비교 2

1. 돌연변이/메틸화 동시 검출 방법을 채택해 돌연변이와 돌연변이 빈도를 검출한다.

(1) 특정 간세포암 환자의 cfDNA를 수집한다.

(2) 단계 (1)을 완료한 후, 5-40ng의 cfDNA를 취하여 표 1과 같이 반응 시스템을 구성한 다음 PCR 기계에서 효소 절단을 수행하여 효소 절단 생성물을 획득한다(4℃에서 보관). 여기에서 효소 절단 처리의 시간은 0시간, 0.2시간, 0.4시간, 0.6시간, 0.8시간 또는 1시간이다.

(3) 단계 (2)를 완료한 후, 상기 효소 절단 생성물을 취하며, 실시예 1에서 2 내지 6의 방법에 따라 MC 라이브러리를 구축한 후, 실시예 2의 방법에 따라 RaceSeq 표적 농축을 수행하고 시퀀싱한다. 데이터 분석 시, 랜덤 태그 서열이 동일하고 DNA 삽입 단편 길이가 동일하며 돌연변이 부위 이외의 서열이 일치하는 DNA 분자 시퀀싱 데이터는 분자 클러스터로 되돌아간다. 만약 클러스터 내 분자 수가 >5개이고 클러스터 내 분자 돌연변이 일치율이 >80%이고 클러스터 수가 ≥5이면, 상기 돌연변이는 원본 DNA 샘플에서 유래된 진정한 돌연변이이다. 상기 분자 돌연변이를 포함하는 클러스터의 비율이 돌연변이 빈도이다.

2. 단독 검출 돌연변이법을 채택하여 돌연변이와 돌연변이 빈도를 검출한다.

(1) 특정 간세포암 환자의 cfDNA를 수집한다.

(2) 단계 (1)를 완료한 후, 5-40ng cfDNA를 취하고, 표 3과 같이 반응 시스템을 구성한 후, 표 4의 절차에 따라 PCR 기계에서 말단 수복 및 3' 말단 A 추가 처리를 수행하여 반응 생성물을 획득한다(4℃에 보관).

(3) 단계 (2)를 완료한 후, 상기 반응 생성물을 취하며, 실시예 1에서 4 내지 6의 방법에 따라 MC 라이브러리를 구축한 후, 실시예 2의 방법에 따라 RaceSeq 표적 농축을 수행하고 시퀀싱한다. 데이터 분석 시, 랜덤 태그 서열이 동일하고 DNA 삽입 단편 길이가 동일하며 돌연변이 부위 이외의 서열이 일치하는 DNA 분자 시퀀싱 데이터는 분자 클러스터로 되돌아간다. 만약 클러스터 내 분자 수가 >5개이고 클러스터 내 분자 돌연변이 일치율이 >80%이고 클러스터 수가 ≥5이면, 상기 돌연변이는 원본 DNA 샘플에서 유래된 진정한 돌연변이이다. 상기 분자 돌연변이를 포함하는 클러스터의 비율이 돌연변이 빈도이다.

3. 각 돌연변이 부위는 돌연변이/메틸화 동시 검출법에 따라 획득한 돌연변이 빈도를 횡좌표로 사용하고, 돌연변이 단독 검출법으로 획득한 돌연변이 빈도를 종좌표로 사용하여 산점도를 도시하고, 선형 적합 곡선 및 상관 계수 R²를 추가한다.

결과는 도 5와 같다. 결과에 따르면, 돌연변이/메틸화 동시 검출법과 돌연변이 단독 검출법은 기본적으로 돌연변이 및 돌연변이 빈도에 대한 검출 결과가 동일하다. 즉, 메틸화 검출은 돌연변이의 검출에 영향을 미치지 않는다.

실시예 5. 정확성 실험

돌연변이 표준은 Horizon Discovery사의 제품이며, 제품 카탈로그 번호는 HD701이다.

一. 정확성 실험 1

1. 돌연변이 표준품을 취하고, 실시예 1의 1 내지 6의 방법에 따라 MC 라이브러리를 구축한 후, 실시예 2의 방법(단계 3의 GSP2A mix만 GSP2A mix-1로, GSP2B mix만 GSP2B mix-1로 교체함)에 따라 RaceSeq 표적 영역 농축 및 시퀀싱을 수행한다.

GSP2A mix-1: 표 15에서 프라이머 풀 GSP2A에 속하는 각 프라이머는 TE 버퍼를 사용해 용해하여 100μM 농도로 희석한 후, 동일한 부피로 혼합하고 TE 버퍼를 사용해 0.3μM로 희석한다. 프라이머 풀 GSP2A 중의 프라이머는 템플릿의 양성 가닥을 증폭하는 데 사용된다.

GSP2B mix-1: 표 15에서 프라이머 풀 GSP2B에 속하는 각 프라이머는 TE 버퍼를 사용해 용해하여 100μM 농도로 희석한 후, 동일한 부피로 혼합하고 TE 버퍼를 사용해 0.3μM로 희석한다. 프라이머 풀 GSP2B 중의 프라이머는 템플릿의 음성 가닥을 증폭하는 데 사용된다.

표 15. 프라이머 서열

2. 시퀀싱 결과에 따라 돌연변이 부위의 돌연변이 빈도를 획득한다.

검출 결과는 표 16과 같다. 결과에 따르면 돌연변이/메틸화 동시 검출법을 채택하여 돌연변이 표준품을 검출하였으며, 획득한 돌연변이 부위의 돌연변이 빈도는 이론적인 값에 기본적으로 근접하였다. 여기에서 알 수 있듯이, 돌연변이/메틸화 동시 검출법은 간세포암 특이적 유전자(예를 들어 CTNNB1 유전자, TP53 유전자, AXIN1 유전자)의 돌연변이 검출에 대해 비교적 높은 정확성을 갖는다.

표 16. 정확성 실험

비고: geneID는 Ensemble 데이터베이스 중 일련번호를 나타내고, Ref는 정상 유형이고, Alt는 유전자 돌연변이 후 유형이고, INS는 삽입을 나태내고, DEL은 결실을 나타내고, SNP는 단일 염기 돌연변이를 나타낸다.

二. 정확성 실험 2

인간 메틸화와 비메틸화 표준품은 Zymo Research사의 제품이며 제품 카탈로그 번호는 D5014이다.

1. 인간 메틸화와 비메틸화 표준품 중의 메틸화 표준품과 비메틸화 표준품을 상이한 비율에 따라 혼합하여 측정 대상 샘플을 획득한다. 측정 대상 샘플에서 메틸화 표준품의 비율은 0%, 20% 또는 100%이다. 즉 종양 특이적 유전자(BDH1 유전자, EMX1 유전자, LRRC4 유전자, CLEC11A 유전자, HOXA1 유전자, AK055957 유전자, COTL1 유전자, ACP1 유전자 또는 DAB2IP 유전자) 메틸화의 비율은 0%, 20% 또는 100%이다.

2. 측정 대상 샘플을 취하고, 실시예 1의 방법에 따라 MC 라이브러리를 구축한 후, 실시예 2의 방법에 따라 RaceSeq 표적 영역 농축 및 시퀀싱을 수행하여 메틸화 부위의 검출값을 획득한다.

검출 결과는 표 17 및 표 18과 같다(샘플 유형의 뒤 네 자리는 종양 특이적 유전자의 명칭임). 메틸화 표준품은 돌연변이/메틸화 동시 검출법으로 검출하였으며, 검출값은 기본적으로 이론값에 근접하였다. 여기에서 알 수 있듯이, 돌연변이/메틸화 동시 검출법은 종양 특이적 유전자(BDH1 유전자, EMX1 유전자, LRRC4 유전자, CLEC11A 유전자, HOXA1 유전자, AK055957 유전자, COTL1 유전자, ACP1 유전자, DAB2IP 유전자)의 메틸화 수준 검출에 대해 비교적 높은 정확성을 갖는다.

표 17. 메틸화 표준품 정확도 검출 결과(양성 가닥)

표 18. 메틸화 표준품 정확도 검출 결과(음성 가닥)

실시예 6. 간세포암 환자 cfDNA에서 돌연변이/메틸화 동시 검출법의 응용

1. 정상인 1명, 간경변증 환자 1명, 간세포암 환자 3명의 혈액 샘플을 수집하고 cfDNA를 추출한다.

2. 5-40ng의 cfDNA를 취하고, 실시예 1에 따라 MC 라이브러리 구축하며, 실시예 2의 방법에 따라 RaceSeq 표적 영역 농축 및 시퀀싱을 수행한다.

3. 메틸화 검출 결과는 표 19 및 표 20과 같다.

결과에 따르면 간세포암 특이적 과메틸화의 유전자가 나타났으며, 검출한 간세포암 샘플 중의 메틸화 수준이 비간세포암 샘플 중의 메틸화 수준보다 높다. 돌연변이/메틸화 동시 검출법은 간세포암 cfDNA 샘플의 검출에 적용할 수 있다.

표 19. cfDNA 샘플 표적 영역 메틸화 수준 검출 결과(양성 가닥)

표 20. cfDNA 샘플 표적 영역 메틸화 수준 검출 결과(음성 가닥)

본 발명은 하나의 샘플로 ctDNA에서 종양 특이적 유전자의 돌연변이(점 돌연변이, 삽입 결실 돌연변이, HBV 통합 등 다양한 돌연변이 형태 포함) 및/또는 메틸화를 동시에 검출할 수 있는 방법을 개시한다. 이는 샘플 수요량이 적을 뿐만 아니라 이 방법으로 제조된 MC 라이브러리는 10 내지 20회의 후속 검출을 지원할 수 있다. 매회 검출의 결과는 모두 모든 원래 ctDNA 표본의 돌연변이 상태 및 효소 절단 부위 커버 영역의 메틸화 변형 상태를 나타낼 수 있고, 민감도와 특이성 저하를 초래하지 않는다. 동시에 라이브러리 제작 방법은 cfDNA 샘플뿐만 아니라 게놈 DNA 또는 cDNA 샘플에도 적합하다. 본 발명은 종양 조기 스크리닝, 질병 추적, 치료 효과 평가, 예후 예측 등에 있어서 중요한 임상적 의의를 가지며, 응용 가치가 크다.

<110> CANCER HOSPITAL, CHINESE ACADEMY OF MEDICAL SCIENCES GENETRON HEALTH (BEIJING) CO., LTD. <120> METHOD FOR DETECTING MUTATION AND METHYLATION OF TUMOR SPECIFIC GENE IN CTDNA <160> 405 <170> PatentIn version 3.5 <210> 1 <211> 42 <212> DNA <213> Artificial sequence <220> <221> misc_feature <222> (22)..(29) <223> n is a, c, g, or t <400> 1 gacacgacgc tcttccgatc tnnnnnnnnc cactagtagc ct 42 <210> 2 <211> 41 <212> DNA <213> Artificial sequence <400> 2 ggctactagt ggctgtctct tatacacatc tccgagccca c 41 <210> 3 <211> 42 <212> DNA <213> Artificial sequence <220> <221> misc_feature <222> (22)..(29) <223> n is a, c, g, or t <400> 3 gacacgacgc tcttccgatc tnnnnnnnng gactgtgtcg gt 42 <210> 4 <211> 41 <212> DNA <213> Artificial sequence <400> 4 ccgacacagt ccctgtctct tatacacatc tccgagccca c 41 <210> 5 <211> 42 <212> DNA <213> Artificial sequence <220> <221> misc_feature <222> (22)..(29) <223> n is a, c, g, or t <400> 5 gacacgacgc tcttccgatc tnnnnnnnng gtactgacag gt 42 <210> 6 <211> 41 <212> DNA <213> Artificial sequence <400> 6 cctgtcagta ccctgtctct tatacacatc tccgagccca c 41 <210> 7 <211> 42 <212> DNA <213> Artificial sequence <220> <221> misc_feature <222> (22)..(29) <223> n is a, c, g, or t <400> 7 gacacgacgc tcttccgatc tnnnnnnnnc ctagtacagc ct 42 <210> 8 <211> 41 <212> DNA <213> Artificial sequence <400> 8 ggctgtacta ggctgtctct tatacacatc tccgagccca c 41 <210> 9 <211> 42 <212> DNA <213> Artificial sequence <220> <221> misc_feature <222> (22)..(29) <223> n is a, c, g, or t <400> 9 gacacgacgc tcttccgatc tnnnnnnnng gtagtcagag gt 42 <210> 10 <211> 41 <212> DNA <213> Artificial sequence <400> 10 cctctgacta ccctgtctct tatacacatc tccgagccca c 41 <210> 11 <211> 42 <212> DNA <213> Artificial sequence <220> <221> misc_feature <222> (22)..(29) <223> n is a, c, g, or t <400> 11 gacacgacgc tcttccgatc tnnnnnnnnt tctcacgtgt tt 42 <210> 12 <211> 41 <212> DNA <213> Artificial sequence <400> 12 aacacgtgag aactgtctct tatacacatc tccgagccca c 41 <210> 13 <211> 42 <212> DNA <213> Artificial sequence <220> <221> misc_feature <222> (22)..(29) <223> n is a, c, g, or t <400> 13 gacacgacgc tcttccgatc tnnnnnnnna actccacgta at 42 <210> 14 <211> 41 <212> DNA <213> Artificial sequence <400> 14 ttacgtggag ttctgtctct tatacacatc tccgagccca c 41 <210> 15 <211> 42 <212> DNA <213> Artificial sequence <220> <221> misc_feature <222> (22)..(29) <223> n is a, c, g, or t <400> 15 gacacgacgc tcttccgatc tnnnnnnnnt tctcgagaat tt 42 <210> 16 <211> 41 <212> DNA <213> Artificial sequence <400> 16 aattctcgag aactgtctct tatacacatc tccgagccca c 41 <210> 17 <211> 42 <212> DNA <213> Artificial sequence <220> <221> misc_feature <222> (22)..(29) <223> n is a, c, g, or t <400> 17 gacacgacgc tcttccgatc tnnnnnnnna aactcttcca at 42 <210> 18 <211> 41 <212> DNA <213> Artificial sequence <400> 18 ttggaagagt ttctgtctct tatacacatc tccgagccca c 41 <210> 19 <211> 42 <212> DNA <213> Artificial sequence <220> <221> misc_feature <222> (22)..(29) <223> n is a, c, g, or t <400> 19 gacacgacgc tcttccgatc tnnnnnnnnt tggaacgtct tt 42 <210> 20 <211> 41 <212> DNA <213> Artificial sequence <400> 20 aagacgttcc aactgtctct tatacacatc tccgagccca c 41 <210> 21 <211> 42 <212> DNA <213> Artificial sequence <220> <221> misc_feature <222> (22)..(29) <223> n is a, c, g, or t <400> 21 gacacgacgc tcttccgatc tnnnnnnnnc cggactcctc ct 42 <210> 22 <211> 41 <212> DNA <213> Artificial sequence <400> 22 ggaggagtcc ggctgtctct tatacacatc tccgagccca c 41 <210> 23 <211> 42 <212> DNA <213> Artificial sequence <220> <221> misc_feature <222> (22)..(29) <223> n is a, c, g, or t <400> 23 gacacgacgc tcttccgatc tnnnnnnnna aggaggagta at 42 <210> 24 <211> 41 <212> DNA <213> Artificial sequence <400> 24 ttactcctcc ttctgtctct tatacacatc tccgagccca c 41 <210> 25 <211> 19 <212> DNA <213> Artificial sequence <400> 25 gacacgacgc tcttccgat 19 <210> 26 <211> 22 <212> DNA <213> Artificial sequence <400> 26 gtgggctcgg agatgtgtat aa 22 <210> 27 <211> 27 <212> DNA <213> Artificial sequence <400> 27 tctttcccta cacgacgctc ttccgat 27 <210> 28 <211> 20 <212> DNA <213> Artificial sequence <400> 28 tgtattaggg tgcagcgctc 20 <210> 29 <211> 18 <212> DNA <213> Artificial sequence <400> 29 cgctcggatc tggacctg 18 <210> 30 <211> 19 <212> DNA <213> Artificial sequence <400> 30 tggagccctg tgactcgaa 19 <210> 31 <211> 21 <212> DNA <213> Artificial sequence <400> 31 gtgaccagga catggatgag g 21 <210> 32 <211> 21 <212> DNA <213> Artificial sequence <400> 32 tcctccagta gacggtacag c 21 <210> 33 <211> 18 <212> DNA <213> Artificial sequence <400> 33 tgctgcttgt ccccacac 18 <210> 34 <211> 18 <212> DNA <213> Artificial sequence <400> 34 ccgcttggca ccacttcc 18 <210> 35 <211> 18 <212> DNA <213> Artificial sequence <400> 35 ggcacgggaa gcacgtac 18 <210> 36 <211> 18 <212> DNA <213> Artificial sequence <400> 36 ccttgcagtg ggaaggtg 18 <210> 37 <211> 23 <212> DNA <213> Artificial sequence <400> 37 gacagaaaag cggctgttag tca 23 <210> 38 <211> 19 <212> DNA <213> Artificial sequence <400> 38 ccgacctcag ctacagcat 19 <210> 39 <211> 21 <212> DNA <213> Artificial sequence <400> 39 acttgagcaa cccggagtct g 21 <210> 40 <211> 20 <212> DNA <213> Artificial sequence <400> 40 ctcctagctc tgcagtccga 20 <210> 41 <211> 18 <212> DNA <213> Artificial sequence <400> 41 gcgcctggct ccatttcc 18 <210> 42 <211> 21 <212> DNA <213> Artificial sequence <400> 42 cgcctgagaa cctgcaaaga g 21 <210> 43 <211> 18 <212> DNA <213> Artificial sequence <400> 43 gtccagggag caatgcgt 18 <210> 44 <211> 19 <212> DNA <213> Artificial sequence <400> 44 cgggttaccc cacagccta 19 <210> 45 <211> 18 <212> DNA <213> Artificial sequence <400> 45 ggctcccagt ggattcgc 18 <210> 46 <211> 18 <212> DNA <213> Artificial sequence <400> 46 gtcctgcccc ttcacctt 18 <210> 47 <211> 22 <212> DNA <213> Artificial sequence <400> 47 ccgactactg cctcacccat at 22 <210> 48 <211> 26 <212> DNA <213> Artificial sequence <400> 48 gggtttttct tgttgacaag aatcct 26 <210> 49 <211> 22 <212> DNA <213> Artificial sequence <400> 49 ccaacctcca atcactcacc aa 22 <210> 50 <211> 28 <212> DNA <213> Artificial sequence <400> 50 ggcgttttat catattcctc ttcatcct 28 <210> 51 <211> 26 <212> DNA <213> Artificial sequence <400> 51 ctacttccag gaacatcaac taccag 26 <210> 52 <211> 23 <212> DNA <213> Artificial sequence <400> 52 ctgcacttgt attcccatcc cat 23 <210> 53 <211> 27 <212> DNA <213> Artificial sequence <400> 53 tcagtttact agtgccattt gttcagt 27 <210> 54 <211> 28 <212> DNA <213> Artificial sequence <400> 54 tacaacatct tgagtccctt tttacctc 28 <210> 55 <211> 23 <212> DNA <213> Artificial sequence <400> 55 agaattgtgg gtcttttggg ctt 23 <210> 56 <211> 30 <212> DNA <213> Artificial sequence <400> 56 tgtaaacaat atctgaacct ttaccctgtt 30 <210> 57 <211> 20 <212> DNA <213> Artificial sequence <400> 57 gcatgcgtgg aacctttgtg 20 <210> 58 <211> 23 <212> DNA <213> Artificial sequence <400> 58 aactctgttg tcctctctcg gaa 23 <210> 59 <211> 18 <212> DNA <213> Artificial sequence <400> 59 ctgaatcccg cggacgac 18 <210> 60 <211> 21 <212> DNA <213> Artificial sequence <400> 60 ccgtctgtgc cttctcatct g 21 <210> 61 <211> 19 <212> DNA <213> Artificial sequence <400> 61 gaacgcccac caggtcttg 19 <210> 62 <211> 24 <212> DNA <213> Artificial sequence <400> 62 ccttgaggcg tacttcaaag actg 24 <210> 63 <211> 23 <212> DNA <213> Artificial sequence <400> 63 ggaggctgta ggcataaatt ggt 23 <210> 64 <211> 22 <212> DNA <213> Artificial sequence <400> 64 gtcctactgt tcaagcctcc aa 22 <210> 65 <211> 22 <212> DNA <213> Artificial sequence <400> 65 gggcttctgt ggagttactc tc 22 <210> 66 <211> 22 <212> DNA <213> Artificial sequence <400> 66 ttgtatcggg aggccttaga gt 22 <210> 67 <211> 21 <212> DNA <213> Artificial sequence <400> 67 ttctgtgttg gggtgagttg a 21 <210> 68 <211> 25 <212> DNA <213> Artificial sequence <400> 68 ccagcatcca gggaattagt agtca 25 <210> 69 <211> 27 <212> DNA <213> Artificial sequence <400> 69 ttcctgtctt acctttggaa gagaaac 27 <210> 70 <211> 25 <212> DNA <213> Artificial sequence <400> 70 ccggaaacta ctgttgttag acgta 25 <210> 71 <211> 23 <212> DNA <213> Artificial sequence <400> 71 cgtcgcagaa gatctcaatc tcg 23 <210> 72 <211> 28 <212> DNA <213> Artificial sequence <400> 72 aaactccctc ctttcctaac attcattt 28 <210> 73 <211> 26 <212> DNA <213> Artificial sequence <400> 73 tatgcctgct aggttctatc ctaacc 26 <210> 74 <211> 27 <212> DNA <213> Artificial sequence <400> 74 ggcattattt acatactctg tggaagg 27 <210> 75 <211> 22 <212> DNA <213> Artificial sequence <400> 75 gttggtcttc caaacctcga ca 22 <210> 76 <211> 22 <212> DNA <213> Artificial sequence <400> 76 ttcaacccca acaaggatca ct 22 <210> 77 <211> 20 <212> DNA <213> Artificial sequence <400> 77 ttccaccaat cggcagtcag 20 <210> 78 <211> 21 <212> DNA <213> Artificial sequence <400> 78 gccctgctca gaatactgtc t 21 <210> 79 <211> 20 <212> DNA <213> Artificial sequence <400> 79 attcgcagtc ccaaatctcc 20 <210> 80 <211> 21 <212> DNA <213> Artificial sequence <400> 80 catcttcctc tgcatcctgc t 21 <210> 81 <211> 22 <212> DNA <213> Artificial sequence <400> 81 ttccaggatc atcaaccacc ag 22 <210> 82 <211> 18 <212> DNA <213> Artificial sequence <400> 82 gtccctttat gccgctgt 18 <210> 83 <211> 29 <212> DNA <213> Artificial sequence <400> 83 acccttataa agaatttgga gctactgtg 29 <210> 84 <211> 22 <212> DNA <213> Artificial sequence <400> 84 ctcctgaaca ttgctcacct ca 22 <210> 85 <211> 18 <212> DNA <213> Artificial sequence <400> 85 agactgcctt ccgggtca 18 <210> 86 <211> 22 <212> DNA <213> Artificial sequence <400> 86 cctgtgggaa gcgaaaattc ca 22 <210> 87 <211> 19 <212> DNA <213> Artificial sequence <400> 87 acctggtcct ctgactgct 19 <210> 88 <211> 24 <212> DNA <213> Artificial sequence <400> 88 aagcaatgga tgatttgatg ctgt 24 <210> 89 <211> 20 <212> DNA <213> Artificial sequence <400> 89 gacccaggtc cagatgaagc 20 <210> 90 <211> 18 <212> DNA <213> Artificial sequence <400> 90 tcctggcccc tgtcatct 18 <210> 91 <211> 22 <212> DNA <213> Artificial sequence <400> 91 gtgccctgac tttcaactct gt 22 <210> 92 <211> 18 <212> DNA <213> Artificial sequence <400> 92 caactggcca agacctgc 18 <210> 93 <211> 20 <212> DNA <213> Artificial sequence <400> 93 cgccatggcc atctacaagc 20 <210> 94 <211> 18 <212> DNA <213> Artificial sequence <400> 94 ggtccccagg cctctgat 18 <210> 95 <211> 22 <212> DNA <213> Artificial sequence <400> 95 gagtggaagg aaatttgcgt gt 22 <210> 96 <211> 19 <212> DNA <213> Artificial sequence <400> 96 gcactggcct catcttggg 19 <210> 97 <211> 26 <212> DNA <213> Artificial sequence <400> 97 ccatccacta caactacatg tgtaac 26 <210> 98 <211> 24 <212> DNA <213> Artificial sequence <400> 98 tttccttact gcctcttgct tctc 24 <210> 99 <211> 20 <212> DNA <213> Artificial sequence <400> 99 gggacggaac agctttgagg 20 <210> 100 <211> 23 <212> DNA <213> Artificial sequence <400> 100 cacagaggaa gagaatctcc gca 23 <210> 101 <211> 26 <212> DNA <213> Artificial sequence <400> 101 tgcctcagat tcacttttat cacctt 26 <210> 102 <211> 30 <212> DNA <213> Artificial sequence <400> 102 ctcaggtact gtgtatatac ttacttctcc 30 <210> 103 <211> 19 <212> DNA <213> Artificial sequence <400> 103 cgtgagcgct tcgagatgt 19 <210> 104 <211> 22 <212> DNA <213> Artificial sequence <400> 104 gtgatgtcat ctctcctccc tg 22 <210> 105 <211> 25 <212> DNA <213> Artificial sequence <400> 105 tgaagtccaa aaagggtcag tctac 25 <210> 106 <211> 20 <212> DNA <213> Artificial sequence <400> 106 gggagcatct tcggtgaaac 20 <210> 107 <211> 22 <212> DNA <213> Artificial sequence <400> 107 caggcttatc ccatcttggt ca 22 <210> 108 <211> 18 <212> DNA <213> Artificial sequence <400> 108 ttggtggctg gcttggtc 18 <210> 109 <211> 21 <212> DNA <213> Artificial sequence <400> 109 gctgtaccgt ctactggagg a 21 <210> 110 <211> 21 <212> DNA <213> Artificial sequence <400> 110 gcttgttctc cagctctcgg a 21 <210> 111 <211> 18 <212> DNA <213> Artificial sequence <400> 111 gggaagtggt gccaagcg 18 <210> 112 <211> 18 <212> DNA <213> Artificial sequence <400> 112 gcacacgctg tacgtgct 18 <210> 113 <211> 18 <212> DNA <213> Artificial sequence <400> 113 gcctccacct gctccttg 18 <210> 114 <211> 22 <212> DNA <213> Artificial sequence <400> 114 ccctcaatga tccactgcat ga 22 <210> 115 <211> 24 <212> DNA <213> Artificial sequence <400> 115 ctcatacagg acttgggagg tatc 24 <210> 116 <211> 18 <212> DNA <213> Artificial sequence <400> 116 cacaaccgca ggacagct 18 <210> 117 <211> 18 <212> DNA <213> Artificial sequence <400> 117 ctccaagcct cggactgc 18 <210> 118 <211> 19 <212> DNA <213> Artificial sequence <400> 118 gcctcacacc agccacaac 19 <210> 119 <211> 20 <212> DNA <213> Artificial sequence <400> 119 tccccaccat gagcaaacca 20 <210> 120 <211> 18 <212> DNA <213> Artificial sequence <400> 120 gtgcctccct gcaacact 18 <210> 121 <211> 18 <212> DNA <213> Artificial sequence <400> 121 gcaccacgaa tgccggac 18 <210> 122 <211> 18 <212> DNA <213> Artificial sequence <400> 122 gtggggtaac ccgaggga 18 <210> 123 <211> 18 <212> DNA <213> Artificial sequence <400> 123 gaggaggcgg agctggaa 18 <210> 124 <211> 18 <212> DNA <213> Artificial sequence <400> 124 agcgctgcct gaaactcg 18 <210> 125 <211> 17 <212> DNA <213> Artificial sequence <400> 125 cgcacgaacg tggccag 17 <210> 126 <211> 19 <212> DNA <213> Artificial sequence <400> 126 gagccaccag caggaaagt 19 <210> 127 <211> 24 <212> DNA <213> Artificial sequence <400> 127 ctaggaatcc tgatgttgtg ctct 24 <210> 128 <211> 22 <212> DNA <213> Artificial sequence <400> 128 cgcgagtcta gactctgtgg ta 22 <210> 129 <211> 24 <212> DNA <213> Artificial sequence <400> 129 atagccagga caaattggag gaca 24 <210> 130 <211> 21 <212> DNA <213> Artificial sequence <400> 130 gacaaacggg caacatacct t 21 <210> 131 <211> 23 <212> DNA <213> Artificial sequence <400> 131 ccgaaggttt tgtacagcaa caa 23 <210> 132 <211> 23 <212> DNA <213> Artificial sequence <400> 132 ctgagccagg agaaacggac tga 23 <210> 133 <211> 26 <212> DNA <213> Artificial sequence <400> 133 gggactcaag atgttgtaca gacttg 26 <210> 134 <211> 21 <212> DNA <213> Artificial sequence <400> 134 gttaagggag tagccccaac g 21 <210> 135 <211> 25 <212> DNA <213> Artificial sequence <400> 135 caggcagttt tcgaaaacat tgctt 25 <210> 136 <211> 27 <212> DNA <213> Artificial sequence <400> 136 ttaaagcagg atagccacat tgtgtaa 27 <210> 137 <211> 25 <212> DNA <213> Artificial sequence <400> 137 ggcaacaggg taaaggttca gatat 25 <210> 138 <211> 19 <212> DNA <213> Artificial sequence <400> 138 ccacaaaggt tccacgcat 19 <210> 139 <211> 24 <212> DNA <213> Artificial sequence <400> 139 tggaaaggaa gtgtacttcc gaga 24 <210> 140 <211> 18 <212> DNA <213> Artificial sequence <400> 140 gtcgtccgcg ggattcag 18 <210> 141 <211> 18 <212> DNA <213> Artificial sequence <400> 141 aaggcacaga cggggaga 18 <210> 142 <211> 18 <212> DNA <213> Artificial sequence <400> 142 tcacggtggt ctccatgc 18 <210> 143 <211> 22 <212> DNA <213> Artificial sequence <400> 143 ggtcgttgac attgctgaga gt 22 <210> 144 <211> 22 <212> DNA <213> Artificial sequence <400> 144 aacctaatct cctcccccaa ct 22 <210> 145 <211> 23 <212> DNA <213> Artificial sequence <400> 145 gcagaggtga aaaagttgca tgg 23 <210> 146 <211> 18 <212> DNA <213> Artificial sequence <400> 146 ccacccaagg cacagctt 18 <210> 147 <211> 18 <212> DNA <213> Artificial sequence <400> 147 actccacaga agccccaa 18 <210> 148 <211> 20 <212> DNA <213> Artificial sequence <400> 148 gcctcccgat acaaagcaga 20 <210> 149 <211> 24 <212> DNA <213> Artificial sequence <400> 149 gattcatcaa ctcaccccaa caca 24 <210> 150 <211> 27 <212> DNA <213> Artificial sequence <400> 150 acatagctga ctactaattc cctggat 27 <210> 151 <211> 25 <212> DNA <213> Artificial sequence <400> 151 atccacactc caaaagacac caaat 25 <210> 152 <211> 22 <212> DNA <213> Artificial sequence <400> 152 gcgagggagt tcttcttcta gg 22 <210> 153 <211> 25 <212> DNA <213> Artificial sequence <400> 153 cagtaaagtt tcccaccttg tgagt 25 <210> 154 <211> 27 <212> DNA <213> Artificial sequence <400> 154 cctcctgtaa atgaatgtta ggaaagg 27 <210> 155 <211> 26 <212> DNA <213> Artificial sequence <400> 155 gtttaatgcc tttatccaag ggcaaa 26 <210> 156 <211> 27 <212> DNA <213> Artificial sequence <400> 156 ctcttatata gaatcccagc cttccac 27 <210> 157 <211> 22 <212> DNA <213> Artificial sequence <400> 157 cttgtcgagg tttggaagac ca 22 <210> 158 <211> 20 <212> DNA <213> Artificial sequence <400> 158 gtttgagttg gctccgaacg 20 <210> 159 <211> 18 <212> DNA <213> Artificial sequence <400> 159 ctgagggctc caccccaa 18 <210> 160 <211> 23 <212> DNA <213> Artificial sequence <400> 160 gtgaagagat gggagtaggc tgt 23 <210> 161 <211> 26 <212> DNA <213> Artificial sequence <400> 161 cccatctttt tgttttgtga gggttt 26 <210> 162 <211> 26 <212> DNA <213> Artificial sequence <400> 162 ttaaagcagg atatccacat tgcgta 26 <210> 163 <211> 22 <212> DNA <213> Artificial sequence <400> 163 ttgctgaaag tccaagagtc ct 22 <210> 164 <211> 23 <212> DNA <213> Artificial sequence <400> 164 ggtgagcaat gttcaggaga ttc 23 <210> 165 <211> 22 <212> DNA <213> Artificial sequence <400> 165 actactagat ccctggacgc tg 22 <210> 166 <211> 23 <212> DNA <213> Artificial sequence <400> 166 ggtggagata agggagtagg ctg 23 <210> 167 <211> 20 <212> DNA <213> Artificial sequence <400> 167 tgcccttcca atggatccac 20 <210> 168 <211> 18 <212> DNA <213> Artificial sequence <400> 168 gtccccagcc caaccctt 18 <210> 169 <211> 20 <212> DNA <213> Artificial sequence <400> 169 ctctggcatt ctgggagctt 20 <210> 170 <211> 22 <212> DNA <213> Artificial sequence <400> 170 tggtaggttt tctgggaagg ga 22 <210> 171 <211> 21 <212> DNA <213> Artificial sequence <400> 171 tgtcccagaa tgcaagaagc c 21 <210> 172 <211> 24 <212> DNA <213> Artificial sequence <400> 172 ggcattgaag tctcatggaa gcca 24 <210> 173 <211> 20 <212> DNA <213> Artificial sequence <400> 173 acctccgtca tgtgctgtga 20 <210> 174 <211> 21 <212> DNA <213> Artificial sequence <400> 174 ctcaccatcg ctatctgagc a 21 <210> 175 <211> 18 <212> DNA <213> Artificial sequence <400> 175 gcaaccagcc ctgtcgtc 18 <210> 176 <211> 21 <212> DNA <213> Artificial sequence <400> 176 gcaccaccac actatgtcga a 21 <210> 177 <211> 21 <212> DNA <213> Artificial sequence <400> 177 ttaacccctc ctcccagaga c 21 <210> 178 <211> 24 <212> DNA <213> Artificial sequence <400> 178 ttccagtgtg atgatggtga ggat 24 <210> 179 <211> 18 <212> DNA <213> Artificial sequence <400> 179 cagcaggcca gtgtgcag 18 <210> 180 <211> 18 <212> DNA <213> Artificial sequence <400> 180 ccggtctctc ccaggaca 18 <210> 181 <211> 20 <212> DNA <213> Artificial sequence <400> 181 gtgaggctcc cctttcttgc 20 <210> 182 <211> 19 <212> DNA <213> Artificial sequence <400> 182 tggtctcctc caccgcttc 19 <210> 183 <211> 26 <212> DNA <213> Artificial sequence <400> 183 gaaactttcc acttgataag aggtcc 26 <210> 184 <211> 18 <212> DNA <213> Artificial sequence <400> 184 ctcccccctg gctccttc 18 <210> 185 <211> 19 <212> DNA <213> Artificial sequence <400> 185 ggggagtagg gccaggaag 19 <210> 186 <211> 23 <212> DNA <213> Artificial sequence <400> 186 gcccttctgt cttgaacatg agt 23 <210> 187 <211> 18 <212> DNA <213> Artificial sequence <400> 187 gtgggaggct gtcagtgg 18 <210> 188 <211> 16 <212> DNA <213> Artificial sequence <400> 188 gccacccgga cgcttc 16 <210> 189 <211> 21 <212> DNA <213> Artificial sequence <400> 189 caaacgaaac cccacacgaa c 21 <210> 190 <211> 17 <212> DNA <213> Artificial sequence <400> 190 gcggagggag cgagttc 17 <210> 191 <211> 20 <212> DNA <213> Artificial sequence <400> 191 aacatagtcc ccgctggcta 20 <210> 192 <211> 18 <212> DNA <213> Artificial sequence <400> 192 ggagcgctca aacccaca 18 <210> 193 <211> 18 <212> DNA <213> Artificial sequence <400> 193 tacaactggc ccgtgtgg 18 <210> 194 <211> 20 <212> DNA <213> Artificial sequence <400> 194 gtccttcttc gcctggcatc 20 <210> 195 <211> 17 <212> DNA <213> Artificial sequence <400> 195 tgggctggga gaccgtg 17 <210> 196 <211> 19 <212> DNA <213> Artificial sequence <400> 196 ccaccggctc ttcaagctc 19 <210> 197 <211> 16 <212> DNA <213> Artificial sequence <400> 197 catcgtcgcc gctgca 16 <210> 198 <211> 20 <212> DNA <213> Artificial sequence <400> 198 aacgcatagg aggggtggaa 20 <210> 199 <211> 22 <212> DNA <213> Artificial sequence <400> 199 cctttgggtt gggagaagaa aa 22 <210> 200 <211> 18 <212> DNA <213> Artificial sequence <400> 200 cacccgccgt gtacgttt 18 <210> 201 <211> 20 <212> DNA <213> Artificial sequence <400> 201 cggaatcggg gtctaagtgg 20 <210> 202 <211> 18 <212> DNA <213> Artificial sequence <400> 202 cctagcgatc agggcacc 18 <210> 203 <211> 20 <212> DNA <213> Artificial sequence <400> 203 gatgagagag cagtctgcgt 20 <210> 204 <211> 20 <212> DNA <213> Artificial sequence <400> 204 cgttctcgcg ctctgcttac 20 <210> 205 <211> 16 <212> DNA <213> Artificial sequence <400> 205 gacccccgct gctcac 16 <210> 206 <211> 17 <212> DNA <213> Artificial sequence <400> 206 ccccctaagc cgctgtt 17 <210> 207 <211> 18 <212> DNA <213> Artificial sequence <400> 207 ccacacgggc cagttgta 18 <210> 208 <211> 22 <212> DNA <213> Artificial sequence <400> 208 tggccgtttt cgaagaggta ga 22 <210> 209 <211> 17 <212> DNA <213> Artificial sequence <400> 209 caccgttggg ctggtcc 17 <210> 210 <211> 19 <212> DNA <213> Artificial sequence <400> 210 cgagcttgaa gagccggtg 19 <210> 211 <211> 17 <212> DNA <213> Artificial sequence <400> 211 cgcccacccg agttcct 17 <210> 212 <211> 16 <212> DNA <213> Artificial sequence <400> 212 tggccgggac tggagg 16 <210> 213 <211> 22 <212> DNA <213> Artificial sequence <400> 213 ggtaatacgt tccggcactt cg 22 <210> 214 <211> 19 <212> DNA <213> Artificial sequence <400> 214 gcccccactt tccaactcc 19 <210> 215 <211> 18 <212> DNA <213> Artificial sequence <400> 215 gcggttccga agtccctg 18 <210> 216 <211> 17 <212> DNA <213> Artificial sequence <400> 216 ctctccagcc ctcggtg 17 <210> 217 <211> 50 <212> DNA <213> Artificial sequence <400> 217 aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct 50 <210> 218 <211> 24 <212> DNA <213> Artificial sequence <400> 218 caagcagaag acggcatacg agat 24 <210> 219 <211> 28 <212> DNA <213> Artificial sequence <400> 219 gtgactggag ttccttggca cccgagaa 33 <210> 220 <211> 38 <212> DNA <213> Artificial sequence <400> 220 cttggcaccc gagaattcca ttgttccttg acgcagag 38 <210> 221 <211> 40 <212> DNA <213> Artificial sequence <400> 221 cttggcaccc gagaattcca gacctggggt atgagcctga 40 <210> 222 <211> 38 <212> DNA <213> Artificial sequence <400> 222 cttggcaccc gagaattcca aggctgaagc tggcgaga 38 <210> 223 <211> 40 <212> DNA <213> Artificial sequence <400> 223 cttggcaccc gagaattcca tgaggacgat ggcagagacg 40 <210> 224 <211> 40 <212> DNA <213> Artificial sequence <400> 224 cttggcaccc gagaattcca gtacagcgaa ggcagagagt 40 <210> 225 <211> 41 <212> DNA <213> Artificial sequence <400> 225 cttggcaccc gagaattcca cacacaggag gaggaaggtg a 41 <210> 226 <211> 39 <212> DNA <213> Artificial sequence <400> 226 cttggcaccc gagaattcca tgtgtggaca tgggctgtg 39 <210> 227 <211> 38 <212> DNA <213> Artificial sequence <400> 227 cttggcaccc gagaattcca acccaagtca ggggcgaa 38 <210> 228 <211> 44 <212> DNA <213> Artificial sequence <400> 228 cttggcaccc gagaattcca gcgtgcaaaa gaaatgccaa gaag 44 <210> 229 <211> 41 <212> DNA <213> Artificial sequence <400> 229 cttggcaccc gagaattcca tagtcactgg cagcaacagt c 41 <210> 230 <211> 38 <212> DNA <213> Artificial sequence <400> 230 cttggcaccc gagaattcca ctgcaaggcc tcgggaga 38 <210> 231 <211> 41 <212> DNA <213> Artificial sequence <400> 231 cttggcaccc gagaattcca attcctggga agtcctcagc t 41 <210> 232 <211> 38 <212> DNA <213> Artificial sequence <400> 232 cttggcaccc gagaattcca gcttggagcc aggtgcct 38 <210> 233 <211> 43 <212> DNA <213> Artificial sequence <400> 233 cttggcaccc gagaattcca catttcccac cctttctcga cgg 43 <210> 234 <211> 38 <212> DNA <213> Artificial sequence <400> 234 cttggcaccc gagaattcca acgggcctgt gtcaagga 38 <210> 235 <211> 38 <212> DNA <213> Artificial sequence <400> 235 cttggcaccc gagaattcca atgcgtcctc gggttcgt 38 <210> 236 <211> 38 <212> DNA <213> Artificial sequence <400> 236 cttggcaccc gagaattcca agcctaggcc gattcgac 38 <210> 237 <211> 38 <212> DNA <213> Artificial sequence <400> 237 cttggcaccc gagaattcca gattcgcggg cacagacg 38 <210> 238 <211> 38 <212> DNA <213> Artificial sequence <400> 238 cttggcaccc gagaattcca ttccagctcc gcctcctc 38 <210> 239 <211> 44 <212> DNA <213> Artificial sequence <400> 239 cttggcaccc gagaattcca cccatatcgt caatcttctc gagg 44 <210> 240 <211> 45 <212> DNA <213> Artificial sequence <400> 240 cttggcaccc gagaattcca tcacagtacc acagagtcta gactc 45 <210> 241 <211> 44 <212> DNA <213> Artificial sequence <400> 241 cttggcaccc gagaattcca aacctcttgt cctccaattt gtcc 44 <210> 242 <211> 42 <212> DNA <213> Artificial sequence <400> 242 cttggcaccc gagaattcca cctgctgcta tgcctcatct tc 42 <210> 243 <211> 39 <212> DNA <213> Artificial sequence <400> 243 cttggcaccc gagaattcca cacgggacca tgcaagacc 39 <210> 244 <211> 42 <212> DNA <213> Artificial sequence <400> 244 cttggcaccc gagaattcca tgggctttcg caagattcct at 42 <210> 245 <211> 39 <212> DNA <213> Artificial sequence <400> 245 cttggcaccc gagaattcca cgtagggctt tcccccact 39 <210> 246 <211> 51 <212> DNA <213> Artificial sequence <400> 246 cttggcaccc gagaattcca cctctattac caattttctt ttgtctttgg g 51 <210> 247 <211> 42 <212> DNA <213> Artificial sequence <400> 247 cttggcaccc gagaattcca acacaatgtg gctatcctgc tt 42 <210> 248 <211> 38 <212> DNA <213> Artificial sequence <400> 248 cttggcaccc gagaattcca ggcaacggtc aggtctct 38 <210> 249 <211> 43 <212> DNA <213> Artificial sequence <400> 249 cttggcaccc gagaattcca ctctgccgat ccatactgcg gaa 43 <210> 250 <211> 42 <212> DNA <213> Artificial sequence <400> 250 cttggcaccc gagaattcca cacttccttt ccatggctgc ta 42 <210> 251 <211> 39 <212> DNA <213> Artificial sequence <400> 251 cttggcaccc gagaattcca ccgtttggga ctctaccgt 39 <210> 252 <211> 38 <212> DNA <213> Artificial sequence <400> 252 cttggcaccc gagaattcca cgtgtgcact tcgcttca 38 <210> 253 <211> 44 <212> DNA <213> Artificial sequence <400> 253 cttggcaccc gagaattcca ttgcccaagg tcttacataa gagg 44 <210> 254 <211> 45 <212> DNA <213> Artificial sequence <400> 254 cttggcaccc gagaattcca gtttgtttaa ggactgggag gagtt 45 <210> 255 <211> 41 <212> DNA <213> Artificial sequence <400> 255 cttggcaccc gagaattcca ggtctgttca ccagcaccat g 41 <210> 256 <211> 38 <212> DNA <213> Artificial sequence <400> 256 cttggcaccc gagaattcca ctgtgccttg ggtggctt 38 <210> 257 <211> 47 <212> DNA <213> Artificial sequence <400> 257 cttggcaccc gagaattcca ttgccttctg atttctttcc ttctatt 47 <210> 258 <211> 43 <212> DNA <213> Artificial sequence <400> 258 cttggcaccc gagaattcca gagtctccgg aacattgttc acc 43 <210> 259 <211> 41 <212> DNA <213> Artificial sequence <400> 259 cttggcaccc gagaattcca agttgatgaa tctggccacc t 41 <210> 260 <211> 48 <212> DNA <213> Artificial sequence <400> 260 cttggcaccc gagaattcca cagctatgtt aatgttaata tgggccta 48 <210> 261 <211> 46 <212> DNA <213> Artificial sequence <400> 261 cttggcaccc gagaattcca tatttggtgt cttttggagt gtggat 46 <210> 262 <211> 41 <212> DNA <213> Artificial sequence <400> 262 cttggcaccc gagaattcca tagaggcagg tcccctagaa g 41 <210> 263 <211> 46 <212> DNA <213> Artificial sequence <400> 263 cttggcaccc gagaattcca caatgttagt atcccttgga ctcaca 46 <210> 264 <211> 47 <212> DNA <213> Artificial sequence <400> 264 cttggcaccc gagaattcca acaggaggac attattgata gatgtca 47 <210> 265 <211> 43 <212> DNA <213> Artificial sequence <400> 265 cttggcaccc gagaattcca aaccttacca agtatttgcc ctt 43 <210> 266 <211> 45 <212> DNA <213> Artificial sequence <400> 266 cttggcaccc gagaattcca tctgtggaag gctgggattc tatat 45 <210> 267 <211> 42 <212> DNA <213> Artificial sequence <400> 267 cttggcaccc gagaattcca gggacaaatc tttctgttcc ca 42 <210> 268 <211> 39 <212> DNA <213> Artificial sequence <400> 268 cttggcaccc gagaattcca ggccagaggc aaatcaggt 39 <210> 269 <211> 42 <212> DNA <213> Artificial sequence <400> 269 cttggcaccc gagaattcca cagtcaggaa gacagcctac tc 42 <210> 270 <211> 44 <212> DNA <213> Artificial sequence <400> 270 cttggcaccc gagaattcca aatactgtct ctgccatatc gtca 44 <210> 271 <211> 42 <212> DNA <213> Artificial sequence <400> 271 cttggcaccc gagaattcca gtgtgtttca tgagtgggag ga 42 <210> 272 <211> 44 <212> DNA <213> Artificial sequence <400> 272 cttggcaccc gagaattcca tttgccttct gacttctttc cgtc 44 <210> 273 <211> 40 <212> DNA <213> Artificial sequence <400> 273 cttggcaccc gagaattcca cacagcactc aggcaagcta 40 <210> 274 <211> 39 <212> DNA <213> Artificial sequence <400> 274 cttggcaccc gagaattcca gtcactgcca tggaggagc 39 <210> 275 <211> 40 <212> DNA <213> Artificial sequence <400> 275 cttggcaccc gagaattcca ccatgggact gactttctgc 40 <210> 276 <211> 43 <212> DNA <213> Artificial sequence <400> 276 cttggcaccc gagaattcca actgctcttt tcacccatct aca 43 <210> 277 <211> 41 <212> DNA <213> Artificial sequence <400> 277 cttggcaccc gagaattcca tgtccccgga cgatattgaa c 41 <210> 278 <211> 42 <212> DNA <213> Artificial sequence <400> 278 cttggcaccc gagaattcca cagatgaagc tcccagaatg cc 42 <210> 279 <211> 42 <212> DNA <213> Artificial sequence <400> 279 cttggcaccc gagaattcca tgtcatcttc tgtcccttcc ca 42 <210> 280 <211> 44 <212> DNA <213> Artificial sequence <400> 280 cttggcaccc gagaattcca caactctgtc tccttcctct tcct 44 <210> 281 <211> 39 <212> DNA <213> Artificial sequence <400> 281 cttggcaccc gagaattcca tgtgcagctg tgggttgat 39 <210> 282 <211> 42 <212> DNA <213> Artificial sequence <400> 282 cttggcaccc gagaattcca caagcagtca cagcacatga cg 42 <210> 283 <211> 43 <212> DNA <213> Artificial sequence <400> 283 cttggcaccc gagaattcca cctctgattc ctcactgatt gct 43 <210> 284 <211> 42 <212> DNA <213> Artificial sequence <400> 284 cttggcaccc gagaattcca ttgcgtgtgg agtatttgga tg 42 <210> 285 <211> 42 <212> DNA <213> Artificial sequence <400> 285 cttggcaccc gagaattcca tcttgggcct gtgttatctc ct 42 <210> 286 <211> 44 <212> DNA <213> Artificial sequence <400> 286 cttggcaccc gagaattcca acatgtgtaa cagttcctgc atgg 44 <210> 287 <211> 46 <212> DNA <213> Artificial sequence <400> 287 cttggcaccc gagaattcca cttgcttctc ttttcctatc ctgagt 46 <210> 288 <211> 41 <212> DNA <213> Artificial sequence <400> 288 cttggcaccc gagaattcca ctttgaggtg cgtgtttgtg c 41 <210> 289 <211> 39 <212> DNA <213> Artificial sequence <400> 289 cttggcaccc gagaattcca gcaagaaagg ggagcctca 39 <210> 290 <211> 43 <212> DNA <213> Artificial sequence <400> 290 cttggcaccc gagaattcca atcacctttc cttgcctctt tcc 43 <210> 291 <211> 40 <212> DNA <213> Artificial sequence <400> 291 cttggcaccc gagaattcca ttctccccct cctctgttgc 40 <210> 292 <211> 41 <212> DNA <213> Artificial sequence <400> 292 cttggcaccc gagaattcca cttcgagatg ttccgagagc t 41 <210> 293 <211> 41 <212> DNA <213> Artificial sequence <400> 293 cttggcaccc gagaattcca cctccctgct tctgtctcct a 41 <210> 294 <211> 40 <212> DNA <213> Artificial sequence <400> 294 cttggcaccc gagaattcca tcagtctacc tcccgccata 40 <210> 295 <211> 40 <212> DNA <213> Artificial sequence <400> 295 cttggcaccc gagaattcca gaaacttgct ccgaggtcca 40 <210> 296 <211> 40 <212> DNA <213> Artificial sequence <400> 296 cttggcaccc gagaattcca catccagcag ggaatgcagt 40 <210> 297 <211> 44 <212> DNA <213> Artificial sequence <400> 297 cttggcaccc gagaattcca gacacgatgc cattgttatc aaga 44 <210> 298 <211> 40 <212> DNA <213> Artificial sequence <400> 298 cttggcaccc gagaattcca ctgtctccag gagcagcttc 40 <210> 299 <211> 42 <212> DNA <213> Artificial sequence <400> 299 cttggcaccc gagaattcca cggaggtgag tacagaaagt gg 42 <210> 300 <211> 39 <212> DNA <213> Artificial sequence <400> 300 cttggcaccc gagaattcca ggaggcagct tgtgacacg 39 <210> 301 <211> 40 <212> DNA <213> Artificial sequence <400> 301 cttggcaccc gagaattcca ctcgtccagg atgctctcag 40 <210> 302 <211> 38 <212> DNA <213> Artificial sequence <400> 302 cttggcaccc gagaattcca gtggtggacg tggtggtg 38 <210> 303 <211> 44 <212> DNA <213> Artificial sequence <400> 303 cttggcaccc gagaattcca tgattttctg gttcttctcc gcat 44 <210> 304 <211> 44 <212> DNA <213> Artificial sequence <400> 304 cttggcaccc gagaattcca gaggtatcca catcctcttc ctca 44 <210> 305 <211> 40 <212> DNA <213> Artificial sequence <400> 305 cttggcaccc gagaattcca aggacttccc aggaatccag 40 <210> 306 <211> 38 <212> DNA <213> Artificial sequence <400> 306 cttggcaccc gagaattcca agctaggagg cccgactt 38 <210> 307 <211> 38 <212> DNA <213> Artificial sequence <400> 307 cttggcaccc gagaattcca acaacggcct tgaccctg 38 <210> 308 <211> 43 <212> DNA <213> Artificial sequence <400> 308 cttggcaccc gagaattcca ccaccccaaa tctgttaatc acc 43 <210> 309 <211> 40 <212> DNA <213> Artificial sequence <400> 309 cttggcaccc gagaattcca aacacttccc cgcgacttgg 40 <210> 310 <211> 38 <212> DNA <213> Artificial sequence <400> 310 cttggcaccc gagaattcca cgtgaagggg aggacgga 38 <210> 311 <211> 38 <212> DNA <213> Artificial sequence <400> 311 cttggcaccc gagaattcca ggggccatga tgtggagg 38 <210> 312 <211> 38 <212> DNA <213> Artificial sequence <400> 312 cttggcaccc gagaattcca aaggtgaagg ggcaggac 38 <210> 313 <211> 38 <212> DNA <213> Artificial sequence <400> 313 cttggcaccc gagaattcca gcggaaagga aggggagg 38 <210> 314 <211> 37 <212> DNA <213> Artificial sequence <400> 314 cttggcaccc gagaattcca gcagcacctc gcggtag 37 <210> 315 <211> 42 <212> DNA <213> Artificial sequence <400> 315 cttggcaccc gagaattcca ggaaagtata ggcccctcac tc 42 <210> 316 <211> 38 <212> DNA <213> Artificial sequence <400> 316 cttggcaccc gagaattcca ctctccatgt tcggggca 38 <210> 317 <211> 47 <212> DNA <213> Artificial sequence <400> 317 cttggcaccc gagaattcca gaggattctt gtcaacaaga aaaaccc 47 <210> 318 <211> 43 <212> DNA <213> Artificial sequence <400> 318 cttggcaccc gagaattcca acaagaggtt ggtgagtgat tgg 43 <210> 319 <211> 46 <212> DNA <213> Artificial sequence <400> 319 cttggcaccc gagaattcca gtccagaaga accaacaaga agatga 46 <210> 320 <211> 45 <212> DNA <213> Artificial sequence <400> 320 cttggcaccc gagaattcca catagaggtt ccttgagcag gaatc 45 <210> 321 <211> 43 <212> DNA <213> Artificial sequence <400> 321 cttggcaccc gagaattcca cactcccata ggaatcttgc gaa 43 <210> 322 <211> 43 <212> DNA <213> Artificial sequence <400> 322 cttggcaccc gagaattcca cccccaatac cacatcatcc ata 43 <210> 323 <211> 47 <212> DNA <213> Artificial sequence <400> 323 cttggcaccc gagaattcca agggttcaaa tgtataccca aagacaa 47 <210> 324 <211> 48 <212> DNA <213> Artificial sequence <400> 324 cttggcaccc gagaattcca agttttagta caatatgttc ttgcggta 48 <210> 325 <211> 41 <212> DNA <213> Artificial sequence <400> 325 cttggcaccc gagaattcca cattgtgtaa aaggggcagc a 41 <210> 326 <211> 46 <212> DNA <213> Artificial sequence <400> 326 cttggcaccc gagaattcca tgtttacaca gaaaggcctt gtaagt 46 <210> 327 <211> 39 <212> DNA <213> Artificial sequence <400> 327 cttggcaccc gagaattcca catgcggcga tggccaata 39 <210> 328 <211> 45 <212> DNA <213> Artificial sequence <400> 328 cttggcaccc gagaattcca ttccgagaga ggacaacaga gttgt 45 <210> 329 <211> 41 <212> DNA <213> Artificial sequence <400> 329 cttggcaccc gagaattcca gacgggacgt aaacaaagga c 41 <210> 330 <211> 40 <212> DNA <213> Artificial sequence <400> 330 cttggcaccc gagaattcca ggagaccgcg taaagagagg 40 <210> 331 <211> 40 <212> DNA <213> Artificial sequence <400> 331 cttggcaccc gagaattcca gtgcagaggt gaagcgaagt 40 <210> 332 <211> 45 <212> DNA <213> Artificial sequence <400> 332 cttggcaccc gagaattcca tccaagagtc ctcttatgta agacc 45 <210> 333 <211> 43 <212> DNA <213> Artificial sequence <400> 333 cttggcaccc gagaattcca caactcctcc cagtccttaa aca 43 <210> 334 <211> 40 <212> DNA <213> Artificial sequence <400> 334 cttggcaccc gagaattcca ggtgctggtg aacagaccaa 40 <210> 335 <211> 42 <212> DNA <213> Artificial sequence <400> 335 cttggcaccc gagaattcca cttggaggct tgaacagtag ga 42 <210> 336 <211> 45 <212> DNA <213> Artificial sequence <400> 336 cttggcaccc gagaattcca aattctttat acgggtcaat gtcca 45 <210> 337 <211> 38 <212> DNA <213> Artificial sequence <400> 337 cttggcaccc gagaattcca cagaggcggt gtcgagga 38 <210> 338 <211> 40 <212> DNA <213> Artificial sequence <400> 338 cttggcaccc gagaattcca acacagaaca gcttgcctga 40 <210> 339 <211> 44 <212> DNA <213> Artificial sequence <400> 339 cttggcaccc gagaattcca ctgggtcttc caaattactt ccca 44 <210> 340 <211> 46 <212> DNA <213> Artificial sequence <400> 340 cttggcaccc gagaattcca gtttctcttc caaaggtaag acagga 46 <210> 341 <211> 43 <212> DNA <213> Artificial sequence <400> 341 cttggcaccc gagaattcca acctgcctct acgtctaaca aca 43 <210> 342 <211> 47 <212> DNA <213> Artificial sequence <400> 342 cttggcaccc gagaattcca ttgtgagtcc aagggatact aacattg 47 <210> 343 <211> 44 <212> DNA <213> Artificial sequence <400> 343 cttggcaccc gagaattcca gggagtttgc cactcaggat taaa 44 <210> 344 <211> 47 <212> DNA <213> Artificial sequence <400> 344 cttggcaccc gagaattcca gggcaaatac ttggtaaggt taggata 47 <210> 345 <211> 49 <212> DNA <213> Artificial sequence <400> 345 cttggcaccc gagaattcca ccttccacag agtatgtaaa taatgccta 49 <210> 346 <211> 42 <212> DNA <213> Artificial sequence <400> 346 cttggcaccc gagaattcca ctcccatgct gtagctcttg tt 42 <210> 347 <211> 40 <212> DNA <213> Artificial sequence <400> 347 cttggcaccc gagaattcca gctgggtcca actggtgatc 40 <210> 348 <211> 40 <212> DNA <213> Artificial sequence <400> 348 cttggcaccc gagaattcca ccccaaaaga ccaccgtgtg 40 <210> 349 <211> 41 <212> DNA <213> Artificial sequence <400> 349 cttggcaccc gagaattcca tcttcctgac tgccgattgg t 41 <210> 350 <211> 40 <212> DNA <213> Artificial sequence <400> 350 cttggcaccc gagaattcca caagaccttg ggcaggttcc 40 <210> 351 <211> 43 <212> DNA <213> Artificial sequence <400> 351 cttggcaccc gagaattcca attctaaggc ttcccgatac aga 43 <210> 352 <211> 46 <212> DNA <213> Artificial sequence <400> 352 cttggcaccc gagaattcca acgctggatc ttctaaatta ttaccc 46 <210> 353 <211> 43 <212> DNA <213> Artificial sequence <400> 353 cttggcaccc gagaattcca gatccactca cagtttccat agg 43 <210> 354 <211> 40 <212> DNA <213> Artificial sequence <400> 354 cttggcaccc gagaattcca cagcccaacc cttgtcctta 40 <210> 355 <211> 41 <212> DNA <213> Artificial sequence <400> 355 cttggcaccc gagaattcca tgggagcttc atctggacct g 41 <210> 356 <211> 41 <212> DNA <213> Artificial sequence <400> 356 cttggcaccc gagaattcca gaagggacag aagatgacag g 41 <210> 357 <211> 41 <212> DNA <213> Artificial sequence <400> 357 cttggcaccc gagaattcca caagaagccc agacggaaac c 41 <210> 358 <211> 38 <212> DNA <213> Artificial sequence <400> 358 cttggcaccc gagaattcca cccctcaggg caactgac 38 <210> 359 <211> 44 <212> DNA <213> Artificial sequence <400> 359 cttggcaccc gagaattcca gtgctgtgac tgcttgtaga tggc 44 <210> 360 <211> 41 <212> DNA <213> Artificial sequence <400> 360 cttggcaccc gagaattcca atctgagcag cgctcatggt g 41 <210> 361 <211> 38 <212> DNA <213> Artificial sequence <400> 361 cttggcaccc gagaattcca ccctgtcgtc tctccagc 38 <210> 362 <211> 47 <212> DNA <213> Artificial sequence <400> 362 cttggcaccc gagaattcca ctatgtcgaa aagtgtttct gtcatcc 47 <210> 363 <211> 41 <212> DNA <213> Artificial sequence <400> 363 cttggcaccc gagaattcca gagaccccag ttgcaaacca g 41 <210> 364 <211> 38 <212> DNA <213> Artificial sequence <400> 364 cttggcaccc gagaattcca tgggcctccg gttcatgc 38 <210> 365 <211> 38 <212> DNA <213> Artificial sequence <400> 365 cttggcaccc gagaattcca gtgcagggtg gcaagtgg 38 <210> 366 <211> 39 <212> DNA <213> Artificial sequence <400> 366 cttggcaccc gagaattcca gacaggcaca aacacgcac 39 <210> 367 <211> 44 <212> DNA <213> Artificial sequence <400> 367 cttggcaccc gagaattcca ttcttgcgga gattctcttc ctct 44 <210> 368 <211> 40 <212> DNA <213> Artificial sequence <400> 368 cttggcaccc gagaattcca cgcttcttgt cctgcttgct 40 <210> 369 <211> 46 <212> DNA <213> Artificial sequence <400> 369 cttggcaccc gagaattcca acttgataag aggtcccaag acttag 46 <210> 370 <211> 38 <212> DNA <213> Artificial sequence <400> 370 cttggcaccc gagaattcca agcctgggca tccttgag 38 <210> 371 <211> 38 <212> DNA <213> Artificial sequence <400> 371 cttggcaccc gagaattcca caggaagggg ctgaggtc 38 <210> 372 <211> 44 <212> DNA <213> Artificial sequence <400> 372 cttggcaccc gagaattcca catgagtttt ttatggcggg aggt 44 <210> 373 <211> 41 <212> DNA <213> Artificial sequence <400> 373 cttggcaccc gagaattcca cagtggggaa caagaagtgg a 41 <210> 374 <211> 34 <212> DNA <213> Artificial sequence <400> 374 cttggcaccc gagaaggacg cttctacacg cgaa 34 <210> 375 <211> 38 <212> DNA <213> Artificial sequence <400> 375 cttggcaccc gagaacacga acgaaaagga acatgtct 38 <210> 376 <211> 32 <212> DNA <213> Artificial sequence <400> 376 cttggcaccc gagaacgagt tcgcggcttc gg 32 <210> 377 <211> 31 <212> DNA <213> Artificial sequence <400> 377 cttggcaccc gagaacagca gcagcagcgg g 31 <210> 378 <211> 39 <212> DNA <213> Artificial sequence <400> 378 cttggcaccc gagaacaaac ccacagggta tctatcagg 39 <210> 379 <211> 32 <212> DNA <213> Artificial sequence <400> 379 cttggcaccc gagaagctgg gcgtgcacga tc 32 <210> 380 <211> 32 <212> DNA <213> Artificial sequence <400> 380 cttggcaccc gagaacctgg catcgctcac cc 32 <210> 381 <211> 32 <212> DNA <213> Artificial sequence <400> 381 cttggcaccc gagaagaccg tggggctgtg ag 32 <210> 382 <211> 35 <212> DNA <213> Artificial sequence <400> 382 cttggcaccc gagaactctt caagctcgga atgga 35 <210> 383 <211> 31 <212> DNA <213> Artificial sequence <400> 383 cttggcaccc gagaagccgc tgcagacgga t 31 <210> 384 <211> 33 <212> DNA <213> Artificial sequence <400> 384 cttggcaccc gagaaaggag gggtggaacc cag 33 <210> 385 <211> 40 <212> DNA <213> Artificial sequence <400> 385 cttggcaccc gagaatggga gaagaaaaaa acacacacac 40 <210> 386 <211> 35 <212> DNA <213> Artificial sequence <400> 386 cttggcaccc gagaatttcg cgggacaaaa accac 35 <210> 387 <211> 35 <212> DNA <213> Artificial sequence <400> 387 cttggcaccc gagaatctaa gtggccaggg cactg 35 <210> 388 <211> 33 <212> DNA <213> Artificial sequence <400> 388 cttggcaccc gagaagatca gggcaccttg ggc 33 <210> 389 <211> 32 <212> DNA <213> Artificial sequence <400> 389 cttggcaccc gagaactgca acaccgcgag cc 32 <210> 390 <211> 35 <212> DNA <213> Artificial sequence <400> 390 cttggcaccc gagaacgctc tgcttacgtg ctgac 35 <210> 391 <211> 31 <212> DNA <213> Artificial sequence <400> 391 cttggcaccc gagaagccgc tgcagcagtc c 31 <210> 392 <211> 32 <212> DNA <213> Artificial sequence <400> 392 cttggcaccc gagaacgctg ttgccttggc ga 32 <210> 393 <211> 33 <212> DNA <213> Artificial sequence <400> 393 cttggcaccc gagaagccag ttgtagggag cga 33 <210> 394 <211> 35 <212> DNA <213> Artificial sequence <400> 394 cttggcaccc gagaacgaag aggtagaggc cctcg 35 <210> 395 <211> 32 <212> DNA <213> Artificial sequence <400> 395 cttggcaccc gagaagtccg ggctgagcgg at 32 <210> 396 <211> 35 <212> DNA <213> Artificial sequence <400> 396 cttggcaccc gagaagccct ccaccacggt tctat 35 <210> 397 <211> 33 <212> DNA <213> Artificial sequence <400> 397 cttggcaccc gagaagagtt cctcccagcc agc 33 <210> 398 <211> 34 <212> DNA <213> Artificial sequence <400> 398 cttggcaccc gagaagggac tggagggcgt agag 34 <210> 399 <211> 31 <212> DNA <213> Artificial sequence <400> 399 cttggcaccc gagaaacttc gcggcggctc a 31 <210> 400 <211> 35 <212> DNA <213> Artificial sequence <400> 400 cttggcaccc gagaaccaac tccacggttc ctgc 34 <210> 401 <211> 32 <212> DNA <213> Artificial sequence <400> 401 cttggcaccc gagaatgagg gcgaaggcct ga 32 <210> 402 <211> 34 <212> DNA <213> Artificial sequence <400> 402 cttggcaccc gagaaggtgg taccgatgag agcg 34 <210> 403 <211> 58 <212> DNA <213> Artificial sequence <400> 403 aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58 <210> 404 <211> 24 <212> DNA <213> Artificial sequence <400> 404 caagcagaag acggcatacg agat 24 <210> 405 <211> 27 <212> DNA <213> Artificial sequence <400> 405 gtctcgtggg ctcggagatg tgtataa 27

Claims

시퀀싱 라이브러리 구축 방법에 있어서,
(1) DNA 샘플을 취하고 메틸화 감응성 제한 엔도뉴클레아제를 이용해 효소 절단하는 단계;
(2) 단계 (1)에서 효소 절단한 DNA 샘플에 대해 말단 수복 및 3' 말단 A 추가 처리를 순차적으로 수행하는 단계; 및
(3) 단계 (2)에서 처리한 DNA 샘플을 어댑터 혼합물 중의 어댑터와 연결하고, PCR 증폭을 거쳐 라이브러리를 획득하는 단계;를 순차적으로 포함하고,
상기 어댑터 혼합물은 n개 어댑터로 구성되고,
각 어댑터는 하나의 업스트림 프라이머 A와 하나의 다운스트림 프라이머 A에서 부분적인 이중 가닥 구조를 형성하여 획득하고, 업스트림 프라이머 A는 시퀀싱 어댑터 A, 랜덤 태그, 고정 서열 A 및 말단에 위치한 염기 T를 가지며, 다운스트림 프라이머 A는 고정 서열 B 및 시퀀싱 어댑터 B를 가지고, 상기 부분적인 이중 가닥 구조는 고정 서열 A와 고정 서열 B의 역상보에 의해 형성되고,
상기 시퀀싱 어댑터 A와 시퀀싱 어댑터 B는 상이한 시퀀싱 플랫폼에 따라 대응하는 시퀀싱 어댑터를 선택한다.
상기 랜덤 태그는 8-14bp의 랜덤 염기이고,
상기 고정 서열 A의 길이는 12-20bp이고, 연속 반복 염기 수는 ≤3이고,
n개 어댑터는 n개의 상이한 고정 서열 A를 채택하고, 각 고정 서열 A 중 4가지 염기가 균형을 이루며, 미스매치 염기 수는 ≥3이고,
n은 ≥8인 임의 자연수인 시퀀싱 라이브러리 구축 방법.
제1항에 있어서,
상기 업스트림 프라이머 A는 5' 말단으로부터 순차적으로 상기 시퀀싱 어댑터 A, 상기 랜덤 태그, 상기 고정 서열 A 및 상기 염기 T를 포함하고,
상기 다운스트림 프라이머 A는 5' 말단으로부터 순차적으로 상기 고정 서열 B 및 상기 시퀀싱 어댑터 B를 포함하는 것을 특징으로 하는 구축 방법.
제1항에 있어서,
상기 미스매치 염기 수 ≥ 3은 상기 어댑터 혼합물에 n개의 고정 서열 A가 포함되고, 각 고정 서열 A 사이의 염기는 적어도 3개가 상이하며, 상기 상이한 것은 위치가 상이하거나 순서가 상이한 것인 것을 특징으로 하는 구축 방법.
제1항에 있어서,
상기 DNA 샘플은 게놈 DNA, cDNA, ctDNA 또는 cfDNA 샘플인 것을 특징으로 하는 구축 방법.
제1항 내지 제4항 중 어느 한 항의 방법에 따라 구축된 DNA 라이브러리.
제1항 내지 제4항 중 어느 한 항에 따른 어댑터 혼합물 및 메틸화 감응성 제한 엔도뉴클레아제를 포함하는 시퀀싱 라이브러리 구축용 키트.
DNA 샘플에서 종양 돌연변이 및/또는 메틸화 검출용 키트에 있어서,
제1항 내지 제4항 중 어느 한 항에 따른 어댑터 혼합물과 프라이머 조합을 포함하고,
상기 프라이머 조합은 프라이머 세트 I, 프라이머 세트 II, 프라이머 세트 III, 프라이머 세트 IV, 프라이머 세트 V, 프라이머 세트 VI, 프라이머 세트 VII 및 프라이머 세트 VIII을 포함하고,
상기 프라이머 세트 I 및 상기 프라이머 세트 II의 각 프라이머는 종양 돌연변이와 관련된 영역에 따라 설계된 특이적 프라이머이며, 그 기능은 게놈 특정 위치에 위치하여 표적 영역의 PCR 농축을 구현하는 것이고, 상기 프라이머 세트 I 및 상기 프라이머 세트 II는 각각 DNA 양성 가닥 및 음성 가닥의 돌연변이 부위를 검출하는 데 사용되고,
상기 프라이머 세트 III 및 상기 프라이머 세트 IV의 각 프라이머는 종양 특이적 과메틸화 영역에 따라 설계된 특이적 프라이머이며, 그 기능은 게놈 특정 위치에 위치하여 표적 영역의 PCR 농축을 구현하는 것이고, 상기 프라이머 세트 III 및 상기 프라이머 세트 IV는 각각 DNA 양성 가닥 및 음성 가닥의 메틸화 부위를 검출하는 데 사용되고,
상기 프라이머 세트 V, 상기 프라이머 세트 VI, 상기 프라이머 세트 VII 및 상기 프라이머 세트 VIII의 각 프라이머는 모두 어댑터 서열 및 특이적 서열을 포함하며, 특이적 서열은 표적 영역의 추가적 농축에 사용되고,
상기 프라이머 세트 V와 상기 프라이머 세트 I에서 동일한 돌연변이 부위에 대해 설계된 2개의 프라이머는 "네스티드" 관계에 있고,
상기 프라이머 세트 VI와 상기 프라이머 세트 II에서 동일한 돌연변이 부위에 대해 설계된 2개의 프라이머는 "네스티드" 관계에 있고,
상기 프라이머 세트 VII와 상기 프라이머 세트 III에서 동일한 메틸화 부위에 대해 설계된 2개의 프라이머는 "네스티드" 관계에 있고,
상기 프라이머 세트 VIII와 상기 프라이머 세트 IV에서 동일한 메틸화 부위에 대해 설계된 2개의 프라이머는 "네스티드" 관계에 있는 것을 특징으로 하는 키트.
제7항에 있어서,
상기 종양은 간 악성 종양인 것을 특징으로 하는 키트.
제8항에 있어서,
상기 프라이머 세트 I은 78개 단일 가닥 DNA 분자를 포함하고, 78개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 28 내지 105로 표시되고,
상기 프라이머 세트 II은 82개 단일 가닥 DNA 분자를 포함하고, 82개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 106 내지 187로 표시되고,
상기 프라이머 세트 III은 14개 단일 가닥 DNA 분자를 포함하고, 14개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 188 내지 201로 표시되고,
상기 프라이머 세트 IV은 15개 단일 가닥 DNA 분자를 포함하고, 15개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 202 내지 216으로 표시되고,
상기 프라이머 세트 V는 75개 단일 가닥 DNA 분자를 포함하고, 75개 단일 가닥 DNA 분자는 서열표의 서열 220 내지 294에서 5' 말단부터 시작해 제16위치 3' 말단으로 표시되는 뉴클레오티드 서열을 순차적으로 포함하고,
상기 프라이머 세트 VI는 79개 단일 가닥 DNA 분자를 포함하고, 79개 단일 가닥 DNA 분자는 서열표의 서열 295 내지 373에서 5' 말단부터 시작해 제16위치 3' 말단으로 표시되는 뉴클레오티드 서열을 순차적으로 포함하고,
상기 프라이머 세트 VII는 14개 단일 가닥 DNA 분자를 포함하고, 14개 단일 가닥 DNA 분자는 서열표의 서열 374 내지 387에서 5' 말단부터 시작해 제16위치 3' 말단으로 표시되는 뉴클레오티드 서열을 순차적으로 포함하고,
상기 프라이머 세트 VIII는 15개 단일 가닥 DNA 분자를 포함하고, 15개 단일 가닥 DNA 분자는 서열표의 서열 388 내지 402에서 5' 말단부터 시작해 제16위치 3' 말단으로 표시되는 뉴클레오티드 서열을 순차적으로 포함하는 것을 특징으로 하는 키트.
제7항 내지 제9항 중 어느 한 항의 프라이머 조합.
S1) 또는 S2) 또는 S3)에 있어서,
S1) DNA 샘플에서 종양 돌연변이 및/또는 메틸화 검출용 키트의 제조에서 제7항 내지 제9항 중 어느 한 항에 따른 프라이머 조합의 응용이고,
S2) 종양 환자 혈액 샘플 및 비종양 환자 혈액 샘플 구분에서 제7항 내지 제9항 중 어느 한 항에 따른 프라이머 조합의 응용이고,
S3) 종양 환자 혈액 샘플 및 비종양 환자 혈액 샘플 구분에서 제7항 내지 제9항 중 어느 한 항에 따른 키트의 응용인 S1) 또는 S2) 또는 S3).
DNA 샘플에서 표적 돌연변이 및/또는 메틸화를 검출하는 방법에 있어서,
(1) 제1항 내지 제4항 중 어느 한 항의 방법에 따라 라이브러리를 구축하는 단계; 및
(2) 단계 (1)에서 획득한 라이브러리에 대해 두 번의 네스티드 PCR 증폭을 수행하고, 생성물을 시퀀싱하며, 시퀀싱 결과에 따라 DNA 샘플 중 표적 돌연변이 및/또는 메틸화 발생 상황을 분석하는 단계를 포함하고,
상기 단계 (2)에서는 프라이머 조합 A를 채택하여 1차 PCR 증폭을 수행하고,
프라이머 조합 A는 업스트림 프라이머 A와 다운스트림 프라이머 조합 A로 구성되고,
상기 업스트림 프라이머 A는 단계 (1)의 라이브러리 증폭에 사용되는 라이브러리 증폭 프라이머이고,
상기 다운스트림 프라이머 조합 A는 X개 표적 부위에 따라 설계된 Y개 프라이머의 조합이며, X와 Y는 모두 1 이상의 자연수이고, X≤Y이고,
1차 PCR의 생성물을 템플릿으로 사용하고, 프라이머 조합 B를 채택해 2차 PCR 증폭을 수행하고,
프라이머 조합 B는 업스트림 프라이머 B, 다운스트림 프라이머 조합 B 및 인덱스 프라이머로 구성되고,
상기 업스트림 프라이머 B는 라이브러리 증폭 프라이머이고 3' 말단은 상기 업스트림 프라이머 A 부분과 동일하며, 1차 PCR 생성물의 증폭에 사용되고,
상기 index 프라이머는 5' 말단으로부터 시퀀싱을 위한 세그먼트 A, 샘플을 구분하기 위한 index 서열 및 시퀀싱을 위한 세그먼트 B를 포함하고,
상기 다운스트림 프라이머 세트 B의 프라이머는 상기 세그먼트 B를 가지며 다운스트림 프라이머 조합 A 중 동일한 표적을 검출하는 프라이머와 네스티드 관계를 형성하는 것을 특징으로 하는 방법.
제12항에 있어서,
상기 DNA 샘플에서 표적 돌연변이의 분석 방법은, 시퀀싱 데이터가 기준 A를 충족하는 DNA 분자를 하나의 분자 클러스터로 되돌리고, 기준 B를 충족하는 분자 클러스터를 한 쌍의 duplex 분자 클러스터로 표시하는 것이며, 특정 돌연변이의 경우, (a1) 적어도 한 쌍의 duplex 분자 클러스터가 지원되는 조건, 또는 (a2) 적어도 4개 분자 클러스터가 지원되는 조건이 충족되면, 상기 돌연변이는 원래 DNA 샘플 유래의 진정한 돌연변이이고, 기준 A는 ① DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, ② 랜덤 태그 서열이 동일한 조건, 및 ③ 고정 서열이 동일한 조건을 동시에 충족하고, 기준 B는 ④ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, 및 ⑤ 분자 클러스터 양단의 고정 서열이 동일하나 위치는 반대인 조건을 동시에 충족하고,
상기 DNA 샘플에서 메틸화의 분석 방법은, 시퀀싱 데이터가 기준 C를 충족하는 DNA 분자를 하나의 클러스터로 표시하고, 단편 말단이 관심 효소 절단 부위인 클러스터의 수량을 각각 계산하여, 비메틸화된 단편으로 기록하고, 증폭 단편이 제1 효소 절단 부위에 도달 또는 초과하는 모든 클러스터의 수량을 계산하여 단편 총 수로 기록하고, 두 가지 단편 수량에 따라 대응 영역의 평균 메틸화 수준을 계산하는 것이고, 영역의 메틸화 수준 = (1 - 비메틸화 단편 수/단편 총 수) × 100%이고, 기준 C는 ⑦ 랜덤 태그 서열이 동일한 조건, ⑧ 고정 서열이 동일한 조건, 및 ⑨ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건을 동시에 충족하는 것을 특징으로 하는 방법.
DNA 샘플에서 다양한 표적 돌연변이 및/또는 메틸화를 검출하는 방법에 있어서,
(1) 제1항 내지 제4항 중 어느 한 항의 방법에 따라 라이브러리를 구축하는 단계; 및
(2) 단계 (1)의 라이브러리에 대해 표적 영역 농축 및 시퀀싱을 수행하며, 시퀀싱 결과에 따라 DNA 샘플 중 표적 돌연변이 및/또는 메틸화의 발생 상황을 분석하는 단계를 포함하는 방법.
제14항에 있어서,
상기 DNA 샘플에서 표적 돌연변이의 분석 방법은, 시퀀싱 데이터가 기준 A를 충족하는 DNA 분자를 하나의 분자 클러스터로 되돌리고, 기준 B를 충족하는 분자 클러스터를 한 쌍의 duplex 분자 클러스터로 표시하는 것이며, 특정 돌연변이의 경우, (a1) 적어도 한 쌍의 duplex 분자 클러스터가 지원되는 조건, 또는 (a2) 적어도 4개 분자 클러스터가 지원되는 조건이 충족되면, 상기 돌연변이는 원래 DNA 샘플 유래의 진정한 돌연변이이고, 기준 A는 ① DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, ② 랜덤 태그 서열이 동일한 조건, 및 ③ 고정 서열이 동일한 조건을 동시에 충족하고, 기준 B는 ④ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, 및 ⑤ 분자 클러스터 양단의 고정 서열이 동일하나 위치는 반대인 조건을 동시에 충족하고, 상기 DNA 샘플에서 메틸화의 분석 방법은, 시퀀싱 데이터가 기준 C를 충족하는 DNA 분자를 하나의 클러스터로 표시하고, 단편 말단이 관심 효소 절단 부위인 클러스터의 수량을 각각 계산하여, 비메틸화된 단편으로 기록하고, 증폭 단편이 제1 효소 절단 부위에 도달 또는 초과하는 모든 클러스터의 수량을 계산하여 단편 총 수로 기록하고, 두 가지 단편 수량에 따라 대응 영역의 평균 메틸화 수준을 계산하는 것이고, 영역의 메틸화 수준 = (1 - 비메틸화 단편 수/단편 총 수) × 100%이고, 기준 C는 ⑥ 랜덤 태그 서열이 동일한 조건, ⑦ 고정 서열이 동일한 조건, 및 ⑧ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건을 동시에 충족하는 것을 특징으로 하는 방법.