KR20220088724A - ctDNA에서 종양 특이적 유전자의 돌연변이 및 메틸화를 검출하는 방법 - Google Patents
ctDNA에서 종양 특이적 유전자의 돌연변이 및 메틸화를 검출하는 방법 Download PDFInfo
- Publication number
- KR20220088724A KR20220088724A KR1020227016270A KR20227016270A KR20220088724A KR 20220088724 A KR20220088724 A KR 20220088724A KR 1020227016270 A KR1020227016270 A KR 1020227016270A KR 20227016270 A KR20227016270 A KR 20227016270A KR 20220088724 A KR20220088724 A KR 20220088724A
- Authority
- KR
- South Korea
- Prior art keywords
- dna
- primer
- artificial sequence
- sequence
- primer set
- Prior art date
Links
- 230000035772 mutation Effects 0.000 title claims abstract description 148
- 230000011987 methylation Effects 0.000 title claims abstract description 108
- 238000007069 methylation reaction Methods 0.000 title claims abstract description 108
- 238000000034 method Methods 0.000 title claims abstract description 84
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 53
- 108090000623 proteins and genes Proteins 0.000 title abstract description 27
- 238000003776 cleavage reaction Methods 0.000 claims abstract description 25
- 230000007017 scission Effects 0.000 claims abstract description 25
- 108020004414 DNA Proteins 0.000 claims description 582
- 238000012163 sequencing technique Methods 0.000 claims description 93
- 102000053602 DNA Human genes 0.000 claims description 84
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 74
- 239000012634 fragment Substances 0.000 claims description 68
- 230000003321 amplification Effects 0.000 claims description 49
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 49
- 239000000203 mixture Substances 0.000 claims description 37
- 238000011144 upstream manufacturing Methods 0.000 claims description 37
- 238000003780 insertion Methods 0.000 claims description 23
- 230000037431 insertion Effects 0.000 claims description 23
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 17
- 238000012408 PCR amplification Methods 0.000 claims description 17
- 239000002773 nucleotide Substances 0.000 claims description 17
- 125000003729 nucleotide group Chemical group 0.000 claims description 17
- 102000004190 Enzymes Human genes 0.000 claims description 14
- 108090000790 Enzymes Proteins 0.000 claims description 14
- 108091008146 restriction endonucleases Proteins 0.000 claims description 12
- 239000008280 blood Substances 0.000 claims description 11
- 210000004369 blood Anatomy 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 9
- 201000011510 cancer Diseases 0.000 claims description 6
- 239000002299 complementary DNA Substances 0.000 claims description 5
- 230000006607 hypermethylation Effects 0.000 claims description 5
- 230000008439 repair process Effects 0.000 claims description 5
- 230000006862 enzymatic digestion Effects 0.000 claims description 4
- 210000004185 liver Anatomy 0.000 claims description 4
- 230000036210 malignancy Effects 0.000 claims description 4
- 230000002441 reversible effect Effects 0.000 claims description 3
- 238000011276 addition treatment Methods 0.000 claims description 2
- 238000007857 nested PCR Methods 0.000 claims description 2
- 238000002360 preparation method Methods 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 claims 3
- 238000001514 detection method Methods 0.000 abstract description 73
- 230000002255 enzymatic effect Effects 0.000 abstract description 11
- 238000011282 treatment Methods 0.000 abstract description 8
- 230000035945 sensitivity Effects 0.000 abstract description 7
- 230000010354 integration Effects 0.000 abstract description 6
- 230000004048 modification Effects 0.000 abstract description 6
- 238000012986 modification Methods 0.000 abstract description 6
- 238000012216 screening Methods 0.000 abstract description 6
- 230000000694 effects Effects 0.000 abstract description 4
- 238000011156 evaluation Methods 0.000 abstract description 4
- 238000004393 prognosis Methods 0.000 abstract description 4
- 201000010099 disease Diseases 0.000 abstract description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 3
- 239000000523 sample Substances 0.000 description 48
- 239000000047 product Substances 0.000 description 42
- 238000006243 chemical reaction Methods 0.000 description 27
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 24
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 17
- 239000007984 Tris EDTA buffer Substances 0.000 description 14
- 230000036438 mutation frequency Effects 0.000 description 10
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 9
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 8
- 206010064571 Gene mutation Diseases 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 6
- 239000012264 purified product Substances 0.000 description 6
- 238000000137 annealing Methods 0.000 description 5
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 101100184147 Caenorhabditis elegans mix-1 gene Proteins 0.000 description 4
- 102000016911 Deoxyribonucleases Human genes 0.000 description 4
- 108010053770 Deoxyribonucleases Proteins 0.000 description 4
- 239000011324 bead Substances 0.000 description 4
- 239000007795 chemical reaction product Substances 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 108091029430 CpG site Proteins 0.000 description 3
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 description 3
- 101001017833 Homo sapiens Leucine-rich repeat-containing protein 4 Proteins 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- 101150002976 ACP1 gene Proteins 0.000 description 2
- 102100035682 Axin-1 Human genes 0.000 description 2
- 101150031273 BDH1 gene Proteins 0.000 description 2
- 101150072309 COTL1 gene Proteins 0.000 description 2
- 102100028914 Catenin beta-1 Human genes 0.000 description 2
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 2
- 101150101472 DAB2IP gene Proteins 0.000 description 2
- 230000007067 DNA methylation Effects 0.000 description 2
- 101000874566 Homo sapiens Axin-1 Proteins 0.000 description 2
- 101000942297 Homo sapiens C-type lectin domain family 11 member A Proteins 0.000 description 2
- 101000916173 Homo sapiens Catenin beta-1 Proteins 0.000 description 2
- 101150028927 Hoxa1 gene Proteins 0.000 description 2
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 2
- 238000004873 anchoring Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 238000001035 drying Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000003756 stirring Methods 0.000 description 2
- 239000010414 supernatant solution Substances 0.000 description 2
- 101150030271 AXIN1 gene Proteins 0.000 description 1
- VWEWCZSUWOEEFM-WDSKDSINSA-N Ala-Gly-Ala-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(O)=O VWEWCZSUWOEEFM-WDSKDSINSA-N 0.000 description 1
- 101150037241 CTNNB1 gene Proteins 0.000 description 1
- 108091029523 CpG island Proteins 0.000 description 1
- 102100022768 D-beta-hydroxybutyrate dehydrogenase, mitochondrial Human genes 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241001123946 Gaga Species 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 102100023823 Homeobox protein EMX1 Human genes 0.000 description 1
- 101000903373 Homo sapiens D-beta-hydroxybutyrate dehydrogenase, mitochondrial Proteins 0.000 description 1
- 102100033304 Leucine-rich repeat-containing protein 4 Human genes 0.000 description 1
- 101100393821 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) GSP2 gene Proteins 0.000 description 1
- 238000012167 Small RNA sequencing Methods 0.000 description 1
- 101150080074 TP53 gene Proteins 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000001369 bisulfite sequencing Methods 0.000 description 1
- 238000010241 blood sampling Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 208000019425 cirrhosis of liver Diseases 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 108700025694 p53 Genes Proteins 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- -1 point mutations Proteins 0.000 description 1
- 238000012113 quantitative test Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1093—General methods of preparing gene libraries, not provided for in other subgroups
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Plant Pathology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 발명은 ctDNA에서 종양 특이적 유전자의 돌연변이 및 메틸화를 검출하는 방법을 개시한다. 상기 방법은 하나의 샘플에서 ctDNA 중의 종양 특이적 유전자의 돌연변이(점 돌연변이, 삽입 결실 돌연변이, HBV 통합 등 다양한 돌연변이 형태 포함) 및/또는 메틸화를 동시에 검출할 수 있는 방법이다. 샘플량 수요가 낮을 뿐만 아니라, 상기 방법으로 제조한 MC 라이브러리는 10 내지 20회의 후속 검출을 지원할 수 있다. 매회 검출의 결과는 모두 모든 원래 ctDNA 표본의 돌연변이 상태 및 효소 절단 부위 커버 영역의 메틸화 변형 상태를 나타낼 수 있으며, 민감도와 특이성을 낮추지 않는다. 본 발명은 종양 조기 스크리닝, 질병 추적, 치료 효과 평가, 예후 예측 등에 있어서 중요한 임상적 의의를 가지며, 응용 가치가 크다.
Description
본 발명은 생물의학 분야에 속하며, 구체적으로 ctDNA에서 종양 특이적 유전자의 돌연변이 및 메틸화를 검출하는 방법에 관한 것이다.
순환 종양 DNA(circulating tumor DNA, ctDNA)는 종양 세포의 세포 사멸, 괴사 또는 분비에 의해 생성된 DNA 단편에서 유래하며, 점 돌연변이, 유전자 재배열, 융합, 카피수 변이, 메틸화 변형 등과 같이 종양 조직 DNA와 동일한 유전자 돌연변이와 후성 유전적 변형을 포함한다. ctDNA의 검출은 암 조기 스크리닝, 진단 및 병기 결정, 표적 약물의 안내, 효능 평가, 재발 모니터링 등 다양한 부문에서 사용될 수 있다. ctDNA에 의해 운반되는 종양 특이적 유전자의 돌연변이 및 메틸화 두 측면의 정보를 결합하면, 검출의 민감도와 특이성을 향상시키고 암 흔적을 조기에 발견하는 데 도움이 되어 종양 조기 스크리닝에 있어서 매우 중요한 의미를 갖는다.
현재의 유전자 돌연변이 검출과 메틸화 검출은 상이한 기술적 경로를 따라야 한다. ctDNA 유전자 돌연변이의 검출은, cfDNA에서 ctDNA가 차지하는 비율이 비교적 낮은 한계가 있기 때문에 실질적으로 저주파 돌연변이를 검출한다. 종래 기술은 두 가지로 나뉜다. 1) PCR 기반의 핫스팟 돌연변이 검출법으로, 통상적으로 하나 또는 여러 핫스팟 돌연변이 또는 공지된 돌연변이를 검출하며, 유전자 융합 등과 같은 복잡한 돌연변이를 검출할 수 없고, 공지되지 않은 돌연변이를 검출할 수 없어 적용 범위가 비교적 작다. 2) 캡쳐 시퀀싱 방법으로, 복잡한 돌연변이를 포함한 다중 표적 검출에 적합하지만 캡쳐 키트가 일반적으로 가격이 비싸고 조작이 복잡하며 시간이 비교적 오래 걸린다. 적용 과정에서 표적의 수량과 특성에 따라 적절한 검출 방법을 선택해야 한다. ctDNA 메틸화 마커의 장점은 클러스터 분포, 유전자 변이보다 높은 특이성, 조직 특이성을 가지고 있어 종양 유래를 추적할 수 있고 마커 수가 더 많아 더 높은 민감도에 도달할 수 있다. 이의 검출 방법에는 다음이 포함된다. 1) 메틸화 PCR은 중아황산염 변환 단계로 인해 DNA 손실 및 서열 다양성 감소가 유발된다. 이 방법은 다중 표적 검출을 구현하기 어렵다. 2) 프로브 혼성화 기반의 메틸화 캡쳐는 8% 내지 13%의 CpG 부위를 커버할 수 있으며, 동시에 대량의 마커를 검출할 수 있으나, 제한된 ctDNA 초기량의 한계가 있고 중아황산염 처리 후 게놈 서열 풍부도가 낮고 프로브 특이성을 보장하기가 쉽지 않다. 3) MspI 효소 절단 기반의 RRBS(Reduced representation bisulfite sequencing)는 커버하는 CpG 부위가 효소 절단 부위 "CCGG"에 의해 결정되며, 약 8% 내지 10%의 CpG 부위를 차지하고, 메틸화 C 염기에 대한 식별이 마찬가지로 중아황산염 변환에 의존한다. RRBS 검출의 메틸화 부위는 CpG 섬 및 프로모터 영역에 집중되어 있으며 비용이 저렴하다. 상기 세 가지 방법은 메틸화 PCR 커버 부위가 제한적이다. 메틸화 캡쳐는 비교적 많은 부위를 커버할 수 있어 RRBS 데이터보다 더 안정적이다. RRBS는 비용이 가장 저렴하며 대량의 메틸화 부위를 커버할 수 있다. 따라서 적용 과정에서 표적의 수량과 특성에 따라 선별해야 한다.
현재 ctDNA에서 두 가지 중요한 종양 특이적 마커인 유전자 돌연변이와 메틸화를 동시에 검출할 수 있는 간단하고 저렴하며 신뢰할 수 있는 해결책은 없다. 주요 어려움은 다음과 같다. 1) 일회성 채혈에서 획득하는 ctDNA 표본량이 제한적이며, 통상적으로 1 내지 2회 검출만 지원할 수 있다. 따라서 ctDNA 임상 검출은 통상적으로 단일 플랫폼, 일회성이므로, 하나의 샘플로 돌연변이 검출 및 메틸화 검출을 동시에 구현하기 어렵다. 특히 중아황산염 변환에 의존하는 메틸화 검출 기술은 처리 과정에서 비교적 많은 DNA 손실을 야기할 수 있다. 2) 메틸화 검출 기술의 중아황산염 변환 단계는 DNA 서열이 대부분의 돌연변이 정보를 제시하지 못하며, 이 부분 DNA 운반 정보의 손실은 저주파 돌연변이 검출 민감도를 저하시킬 수 있다. 3) 임상 검출에서는 1차 검출 결과를 바탕으로 후속 검출의 목적과 계획을 판단해야 하는 경우가 많다. 이는 후속 검출에서 다시 채혈을 해야 하므로 검출 주기가 연장된다. 또한 ctDNA 관련 임상 검출 또는 연구는 종종 비교적 많은 기술의 장단점을 비교할 필요가 있다. 이를 위해 정상 채혈량의 수배에 달하는 표본이 필요하므로 일반적으로 환자가 견디지 못한다. 4) PCR법과 캡쳐법을 불문하고 증폭 과정에서 발생하는 노이즈 돌연변이는 ctDNA 저주파 돌연변이 검출을 심각하게 간섭하여 위양성 결과를 초래하고 환자의 진단과 치료를 오도할 수 있다. 5) ctDNA 돌연변이 함량이 낮아 조작 과정에서 오염이 발생하기 쉬워 위양성 결과가 나올 수 있다.
본 발명의 목적은 ctDNA에서 다양한 종양 특이적 유전자의 돌연변이 및/또는 메틸화를 동시에 검출하는 데에 있다.
본 발명은 먼저 시퀀싱 라이브러리 구축 방법을 보호하며, 여기에는 이하 단계가 순차적으로 포함될 수 있다.
(1) DNA 샘플을 취하고 메틸화 감응성 제한 엔도뉴클레아제를 이용해 효소 절단한다.
(2) 단계 (1)에서 효소 절단한 DNA 샘플에 대해 말단 수복 및 3' 말단 A 추가 처리를 순차적으로 수행한다.
(3) 단계 (2)에서 처리한 DNA 샘플을 어댑터 혼합물 중의 어댑터와 연결하고, PCR 증폭을 거쳐 라이브러리를 획득하는 단계를 순차적으로 포함한다.
상기 어댑터 혼합물은 n개 어댑터로 구성된다.
각 어댑터는 하나의 업스트림 프라이머 A와 하나의 다운스트림 프라이머 A에서 부분적인 이중 가닥 구조를 형성하여 획득하고, 업스트림 프라이머 A는 시퀀싱 어댑터 A, 랜덤 태그, 고정 서열 A 및 말단(예를 들어 3' 말단)에 위치한 염기 T를 가지며, 다운스트림 프라이머 A는 고정 서열 B 및 시퀀싱 어댑터 B를 가지고, 상기 부분적인 이중 가닥 구조는 고정 서열 A와 고정 서열 B의 역상보에 의해 형성된다.
상기 시퀀싱 어댑터 A와 시퀀싱 어댑터 B는 상이한 시퀀싱 플랫폼에 따라 대응하는 시퀀싱 어댑터를 선택한다.
상기 랜덤 태그는 8-14bp(예를 들어 8-10bp, 10-14bp, 8bp, 10bp 또는 14bp)의 랜덤 염기이다.
상기 고정 서열 A는 길이가 12-20bp(예를 들어 12-16bp, 16-20bp, 12bp, 16bp 또는 20bp)이고, 연속 반복 염기가 ≤3개이다.
n개 어댑터는 n개의 상이한 고정 서열 A를 채택하고, 각 고정 서열 A 중 4가지 염기가 균형을 이루며, 미스매치 염기 수는 ≥3이다.
n은 ≥8인 임의 자연수이다.
통상적으로 라이브러리 제작용 어댑터는 두 서열을 어닐링하여 형성되며 "Y" 구조를 나타낸다. 두 서열 사이 상보적인 쌍 부분(즉, 고정 서열 A와 고정 서열 B)을 고정 서열이라 부른다. 상기 고정 서열은 원본 템플릿 분자를 표시하기 위해 서열을 고정하는 내장 태그로 사용할 수 있다.
상기 고정 서열은 프라이머의 다른 부분과 상호 작용하지 않는다(예를 들어 헤어핀 구조, 이량체 형성 등).
상기 업스트림 프라이머 A는 5' 말단으로부터 순차적으로 시퀀싱 어댑터 A, 랜덤 태그, 고정 서열 A 및 염기 T를 포함할 수 있다.
상기 업스트림 프라이머 A는 5' 말단으로부터 순차적으로 시퀀싱 어댑터 A, 랜덤 태그, 고정 서열 A 및 염기 T로 구성될 수 있다.
상기 다운스트림 프라이머 A는 5' 말단으로부터 순차적으로 고정 서열 B 및 시퀀싱 어댑터 B를 포함할 수 있다.
상기 다운스트림 프라이머 A는 5' 말단으로부터 순차적으로 고정 서열 B 및 시퀀싱 어댑터 B로 구성될 수 있다.
상기 "각 고정 시퀀스 A 중 4가지 염기 균형", 즉 A, T, C 및 G가 고르게 분포되어 있다.
상기 "미스매치 염기 수≥3"은 상기 어댑터 혼합물이 n개 고정 서열 A를 포함하고, 각 고정 서열 A 사이의 염기는 적어도 3개 상이한 것일 수 있다. 이러한 차이는 위치의 차이 또는 순서의 차이일 수 있다.
상기 DNA 샘플은 게놈 DNA, cDNA, ctDNA 또는 cfDNA 샘플일 수 있다.
상기 n은 구체적으로 12일 수 있다.
상기 랜덤 태그는 구체적으로 8bp의 랜덤 염기일 수 있다.
상기 고정 서열 A의 길이는 구체적으로 12bp일 수 있다.
n=12인 경우, 상기 고정 서열 A의 뉴클레오티드 서열은 구체적으로 각각 서열표 서열 1의 5' 말단으로부터 제30-41위치, 서열표 서열 3의 5' 말단으로부터 제30-41위치, 서열표 서열 5의 5' 말단으로부터 제30-41위치, 서열표 서열 7의 5' 말단으로부터 제30-41위치, 서열표 서열 9의 5' 말단으로부터 제30-41위치, 서열표 서열 11의 5' 말단으로부터 제30-41위치, 서열표 서열 13의 5' 말단으로부터 제30-41위치, 서열표 서열 15의 5' 말단으로부터 제30-41위치, 서열표 서열 17의 5' 말단으로부터 제30-41위치, 서열표 서열 19의 5' 말단으로부터 제30-41위치, 서열표 서열 21의 5' 말단으로부터 제30-41위치, 서열표 서열 23의 5' 말단으로부터 제30-41위치로 표시될 수 있다.
상기 시퀀싱 어댑터 A는 구체적으로 Ⅲumina의 Truseq 시퀀싱 키트의 시퀀싱 어댑터일 수 있다. 상기 시퀀싱 어댑터 A는 구체적으로 서열표에 도시된 바와 같이 서열 1의 5' 말단으로부터 제1-29위치로 표시될 수 있다.
상기 시퀀싱 어댑터 B는 구체적으로 Ⅲumina의 nextera 시퀀싱 키트의 시퀀싱 어댑터일 수 있다. 상기 시퀀싱 어댑터 B는 구체적으로 서열표에 도시된 바와 같이 서열 2의 5' 말단으로부터 제13-41위치로 표시될 수 있다.
n=12인 경우 상기 12개 어댑터는 다음과 같다.
어댑터 1은 서열표의 서열 1로 표시되는 단일 가닥 DNA 분자와 서열 2로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 2는 서열표의 서열 3으로 표시되는 단일 가닥 DNA 분자와 서열 4로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 3은 서열표의 서열 5로 표시되는 단일 가닥 DNA 분자와 서열 6으로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 4는 서열표의 서열 7로 표시되는 단일 가닥 DNA 분자와 서열 8로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 5는 서열표의 서열 9로 표시되는 단일 가닥 DNA 분자와 서열 10으로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 6은 서열표의 서열 11로 표시되는 단일 가닥 DNA 분자와 서열 12로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 7은 서열표의 서열 13으로 표시되는 단일 가닥 DNA 분자와 서열 14로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 8은 서열표의 서열 15로 표시되는 단일 가닥 DNA 분자와 서열 16으로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 9는 서열표의 서열 17로 표시되는 단일 가닥 DNA 분자와 서열 18로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 10은 서열표의 서열 19로 표시되는 단일 가닥 DNA 분자와 서열 20으로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 11은 서열표의 서열 21로 표시되는 단일 가닥 DNA 분자와 서열 22로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있고, 어댑터 12는 서열표의 서열 23으로 표시되는 단일 가닥 DNA 분자와 서열 24로 표시되는 단일 가닥 DNA 분자가 형성하는 부분적 이중 가닥 구조에 의해 획득될 수 있다.
상기 어댑터는 업스트림 프라이머 A와 다운스트림 프라이머 A를 어닐링하여 획득할 수 있다.
상기 어댑터 혼합물에서 각 어댑터는 등몰로 혼합될 수 있다.
상기 방법은 단계 (3)에서 획득한 라이브러리를 증폭하는 단계를 더 포함할 수 있다. 상기 증폭 프라이머는 어댑터 서열에 따라 설계된다. 즉, 상기 증폭 프라이머는 적어도 한 세그먼트 서열과 어댑터의 특정 세그먼트 서열이 완전히 일치해야 한다. 상기 증폭에 사용되는 프라이머 쌍은 구체적으로 서열표의 서열 25 및 서열 26으로 표시된 두 단일 가닥 DNA 분자로 구성될 수 있다.
서열표의 서열 25로 표시된 단일 가닥 DNA 분자는 바로 시퀀싱 어댑터 A 5' 말단 제1-19위치이다.
서열표의 서열 26으로 표시된 단일 가닥 DNA 분자는 바로 시퀀싱 어댑터 B 3' 말단 제1-22위치이다.
본 발명은 상기 방법에 의해 제작된 DNA 라이브러리를 더 보호한다.
본 발명은 상술한 어느 하나의 어댑터 혼합물 및 메틸화 감응성 제한 엔도뉴클레아제를 포함할 수 있는 시퀀싱 라이브러리 구축용 키트를 더 보호한다.
상기 시퀀싱 라이브러리 구축용 키트는 상술한 어느 하나의 어댑터 혼합물 및 메틸화 감응성 제한 엔도뉴클레아제로 구성될 수 있다.
본 발명은 상술한 어느 하나의 어댑터 혼합물과 프라이머 조합을 포함하는 DNA 샘플에서 종양 돌연변이 및/또는 메틸화 검출용 키트를 더 보호한다. 상기 프라이머 조합은 프라이머 세트 I, 프라이머 세트 II, 프라이머 세트 III, 프라이머 세트 IV, 프라이머 세트 V, 프라이머 세트 VI, 프라이머 세트 VII 및 프라이머 세트 VIII을 포함한다.
상기 프라이머 세트 I 및 상기 프라이머 세트 II의 각 프라이머는 종양 돌연변이와 관련된 영역에 따라 설계된 특이적 프라이머이며, 그 기능은 게놈 특정 위치에 위치하여 표적 영역의 PCR 농축을 구현하는 것이고, 상기 프라이머 세트 I 및 상기 프라이머 세트 II는 각각 DNA 양성 가닥 및 음성 가닥의 돌연변이 부위를 검출하는 데 사용된다.
상기 프라이머 세트 III 및 상기 프라이머 세트 IV의 각 프라이머는 종양 특이적 과메틸화 영역에 따라 설계된 특이적 프라이머이며, 그 기능은 게놈 특정 위치에 위치하여 표적 영역의 PCR 농축을 구현하는 것이고, 상기 프라이머 세트 III 및 상기 프라이머 세트 IV는 각각 DNA 양성 가닥 및 음성 가닥의 메틸화 부위를 검출하는 데 사용된다.
상기 프라이머 세트 V, 상기 프라이머 세트 VI, 상기 프라이머 세트 VII 및 상기 프라이머 세트 VIII의 각 프라이머는 모두 어댑터 서열 및 특이적 서열을 포함하며, 특이적 서열은 표적 영역의 추가적 농축에 사용된다.
상기 프라이머 세트 V와 상기 프라이머 세트 I에서 동일한 돌연변이 부위에 대해 설계된 2개의 프라이머는 "네스티드" 관계에 있다.
상기 프라이머 세트 VI와 상기 프라이머 세트 II에서 동일한 돌연변이 부위에 대해 설계된 2개의 프라이머는 "네스티드" 관계에 있다.
상기 프라이머 세트 VII와 상기 프라이머 세트 III에서 동일한 메틸화 부위에 대해 설계된 2개의 프라이머는 "네스티드" 관계에 있다.
상기 프라이머 세트 VIII와 상기 프라이머 세트 IV에서 동일한 메틸화 부위에 대해 설계된 2개의 프라이머는 "네스티드" 관계에 있다.
상기 "종양 돌연변이와 관련된 영역에 따라 설계된 특이적 프라이머"는 구체적으로 종양 특이적 유전자 돌연변이(예를 들어 점 돌연변이, 삽입 결실 돌연변이, HBV 통합 등 다양한 돌연변이 형태)의 영역에 따라 대응하는 유전자 특이적 프라이머를 설계할 수 있다.
상기 "종양 특이적 과메틸화 영역에 따라 설계된 특이적 프라이머"는 구체적으로 종양 특이적 메틸화 영역에 따라 대응하는 유전자 특이적 프라이머를 설계할 수 있다.
상기 키트에서 상기 종양은 간 악성 종양, 즉 간세포암일 수 있다.
상기 간세포암 돌연변이와 관련된 영역은 구체적으로 간세포암 고주파 돌연변이 유전자(TP53, CTNNB1, AXIN1, TERT)의 관련 영역 및 HBV 통합을 위한 핫스팟 영역일 수 있다.
상술한 어느 하나의 키트에 있어서, 상기 프라이머 세트 I은 78개 단일 가닥 DNA 분자를 포함하고, 78개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 28 내지 105로 표시된다. 상기 프라이머 세트 II은 82개 단일 가닥 DNA 분자를 포함하고, 82개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 106 내지 187로 표시된다. 상기 프라이머 세트 III은 14개 단일 가닥 DNA 분자를 포함하고, 14개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 188 내지 201로 표시된다. 상기 프라이머 세트 IV은 15개 단일 가닥 DNA 분자를 포함하고, 15개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 202 내지 216으로 표시된다. 상기 프라이머 세트 V는 75개 단일 가닥 DNA 분자를 포함하고, 75개 단일 가닥 DNA 분자는 서열표의 서열 220 내지 294에서 5' 말단부터 시작해 제16위치 3' 말단으로 표시되는 뉴클레오티드 서열을 순차적으로 포함한다. 상기 프라이머 세트 VI는 79개 단일 가닥 DNA 분자를 포함하고, 79개 단일 가닥 DNA 분자는 서열표의 서열 295 내지 373에서 5' 말단부터 시작해 제16위치 3' 말단으로 표시되는 뉴클레오티드 서열을 순차적으로 포함한다. 상기 프라이머 세트 VII는 14개 단일 가닥 DNA 분자를 포함하고, 14개 단일 가닥 DNA 분자는 서열표의 서열 374 내지 387에서 5' 말단부터 시작해 제16위치 3' 말단으로 표시되는 뉴클레오티드 서열을 순차적으로 포함한다. 상기 프라이머 세트 VIII는 15개 단일 가닥 DNA 분자를 포함하고, 15개 단일 가닥 DNA 분자는 서열표의 서열 388 내지 402에서 5' 말단부터 시작해 제16위치 3' 말단으로 표시되는 뉴클레오티드 서열을 순차적으로 포함한다.
상기 프라이머 세트 V 중 75개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 220 내지 294로 표시될 수 있다. 상기 프라이머 세트 VI 중 79개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 295 내지 373으로 표시될 수 있다. 상기 프라이머 세트 VII 중 14개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 374 내지 387로 표시될 수 있다. 상기 프라이머 세트 VIII 중 15개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 388 내지 402로 표시될 수 있다.
상기 프라이머 세트 I는 구체적으로 상기 78개 단일 가닥 DNA 분자로 구성될 수 있다.
상기 프라이머 세트 II는 구체적으로 상기 82개 단일 가닥 DNA 분자로 구성될 수 있다.
상기 프라이머 세트 III는 구체적으로 상기 14개 단일 가닥 DNA 분자로 구성될 수 있다.
상기 프라이머 세트 IV는 구체적으로 상기 15개 단일 가닥 DNA 분자로 구성될 수 있다.
상기 프라이머 세트 V는 구체적으로 상기 75개 단일 가닥 DNA 분자로 구성될 수 있다.
상기 프라이머 세트 VI는 구체적으로 상기 79개 단일 가닥 DNA 분자로 구성될 수 있다.
상기 프라이머 세트 VII는 구체적으로 상기 14개 단일 가닥 DNA 분자로 구성될 수 있다.
상기 프라이머 세트 VIII는 구체적으로 상기 15개 단일 가닥 DNA 분자로 구성될 수 있다.
상술한 어느 하나의 키트는 구체적으로 상술한 어느 하나의 어댑터 혼합물과 상기 프라이머 조합으로 구성될 수 있다.
상술한 어느 하나의 프라이머 조합은 구체적으로 상기 프라이머 세트 I, 상기 프라이머 세트 II, 상기 프라이머 세트 III, 상기 프라이머 세트 IV, 상기 프라이머 세트 V, 상기 프라이머 세트 VI, 상기 프라이머 세트 VII 및 상기 프라이머 세트 VIII로 구성될 수 있다.
상술한 어느 하나의 키트에는 DNA 추출용 시약, DNA 라이브러리 제작용 시약, 라이브러리 정제용 시약, 라이브러리 포획용 시약 등 라이브러리 제작용 재료가 더 포함될 수 있다.
본 발명은 상기 어느 하나의 프라이머 조합을 더 보호한다. 상기 프라이머 조합의 용도는 DNA 샘플에서 종양 돌연변이 및/또는 메틸화를 검출하는 것일 수 있다.
본 발명은 S1) 또는 S2) 또는 S3)을 더 포함한다.
S1) DNA 샘플에서 종양 돌연변이 및/또는 메틸화 검출용 키트의 제조에서 상술한 어느 하나의 프라이머 조합의 응용이다.
S2) 종양 환자 혈액 샘플 및 비종양 환자 혈액 샘플 구분에서 상술한 어느 하나의 프라이머 조합의 응용이다.
S3) 종양 환자 혈액 샘플 및 비종양 환자 혈액 샘플 구분에서 상술한 어느 하나의 키트의 응용이다.
상술한 응용에 있어서, 상기 종양은 간 악성 종양, 즉 간세포암일 수 있다.
본 발명은 다음 단계를 포함할 수 있는 DNA 샘플 중 표적 돌연변이 및/또는 메틸화를 검출하는 방법을 더 보호한다.
(1) 상기 어느 하나의 방법에 따라 라이브러리를 제작한다.
(2) 단계 (1)에서 획득한 라이브러리에 대해 두 번의 네스티드 PCR 증폭을 수행하고, 생성물을 시퀀싱하며, 시퀀싱 결과에 따라 DNA 샘플 중 표적 돌연변이 및/또는 메틸화 발생 상황을 분석한다.
상기 단계 (2)에서는 프라이머 조합 A를 채택하여 1차 PCR 증폭을 수행한다.
프라이머 조합 A는 업스트림 프라이머 A와 다운스트림 프라이머 조합 A로 구성된다.
상기 업스트림 프라이머 A는 단계 (1)의 라이브러리 증폭에 사용되는 라이브러리 증폭 프라이머이다.
상기 다운스트림 프라이머 조합 A는 X개 표적 부위에 따라 설계된 Y개 프라이머의 조합이며, X와 Y는 모두 1 이상의 자연수이고, X≤Y이다.
1차 PCR의 생성물을 템플릿으로 사용하고, 프라이머 조합 B를 채택해 2차 PCR 증폭을 수행한다.
프라이머 조합 B는 업스트림 프라이머 B, 다운스트림 프라이머 조합 B 및 인덱스 프라이머로 구성된다.
상기 업스트림 프라이머 B는 라이브러리 증폭 프라이머이고 3' 말단은 상기 업스트림 프라이머 A 부분과 동일하며, 1차 PCR 생성물의 증폭에 사용된다.
상기 index 프라이머는 5' 말단으로부터 시퀀싱을 위한 세그먼트 A, 샘플을 구분하기 위한 index 서열 및 시퀀싱을 위한 세그먼트 B를 포함한다.
상기 다운스트림 프라이머 세트 B의 프라이머는 상기 세그먼트 B를 가지며 다운스트림 프라이머 조합 A 중 동일한 표적을 검출하는 프라이머와 네스티드 관계를 형성한다.
상기 업스트림 프라이머 B의 뉴클레오티드 서열은 서열표 서열 217에 표시된 것과 같을 수 있다.
상기 index 프라이머는 5' 말단으로부터 구체적으로 상기 세그먼트 A, 상기 인덱스 서열 및 상기 세그먼트 B로 구성될 수 있다.
상기 세그먼트 A의 뉴클레오티드 서열은 서열표 서열 218에 표시된 것과 같을 수 있다.
상기 세그먼트 B의 뉴클레오티드 서열은 서열표 서열 219에 표시된 것과 같을 수 있다.
상기 업스트림 프라이머 A의 부분 서열은 "각 어댑터의 업스트림 프라이머 A의 시퀀싱 어댑터 A"의 서열과 완전히 동일하다.
상기 업스트림 프라이머 B는 라이브러리 분자의 어댑터 서열을 보완하는 데 사용되므로, 증폭 생성물을 곧바로 시퀀싱할 수 있다. 상기 업스트림 프라이머 B와 상기 업스트림 프라이머 A(1차 PCR 증폭에 사용되는 프라이머)의 부분 뉴클레오티드 서열은 완전히 동일하다.
상기 업스트림 프라이머 A의 뉴클레오티드 서열은 구체적으로 서열표 서열 27에 표시된 것과 같을 수 있다.
상기 업스트림 프라이머 B의 뉴클레오티드 서열은 구체적으로 서열표 서열 188에 표시된 것과 같을 수 있다.
상기 표적 돌연변이가 간세포암 돌연변이인 경우, 상기 다운스트림 프라이머 세트 A는 상술한 어느 하나의 프라이머 세트 I 및 프라이머 세트 II로 구성된다. 상기 다운스트림 프라이머 세트 B는 상술한 어느 하나의 프라이머 세트 V 및 프라이머 세트 VI로 구성된다. 프라이머 세트 I 및 프라이머 세트 II를 각각 사용하여 템플릿에 대해 1차 PCR 증폭을 수행한다. 프라이머 세트 I로 증폭된 생성물은 2차 증폭을 위한 템플릿으로 사용되며 프라이머 세트 V를 채택해 증폭을 수행한다. 프라이머 세트 II로 증폭된 생성물은 2차 증폭을 위한 템플릿으로 사용되며 프라이머 세트 VI를 채택해 증폭을 수행한다. 마지막으로 동일한 부피의 증폭 생성물을 혼합한다.
상기 표적 메틸화가 간세포암 메틸화인 경우, 상기 다운스트림 프라이머 세트 A는 상술한 어느 하나의 프라이머 세트 III 및 프라이머 세트 IV로 구성된다. 상기 다운스트림 프라이머 세트 B는 상술한 어느 하나의 프라이머 세트 VII 및 프라이머 세트 VIII로 구성된다.
프라이머 세트 III 및 프라이머 세트 IV를 각각 사용하여 템플릿에 대해 1차 PCR 증폭을 수행한다. 프라이머 세트 III로 증폭된 생성물은 2차 증폭을 위한 템플릿으로 사용되며 프라이머 세트 VII를 채택해 증폭을 수행한다. 프라이머 세트 IV로 증폭된 생성물은 2차 증폭을 위한 템플릿으로 사용되며 프라이머 세트 VIII를 채택해 증폭을 수행한다. 마지막으로 동일한 부피의 증폭 생성물을 혼합한다.
상술한 방법에 있어서, 상기 DNA 샘플에서 표적 돌연변이의 분석 방법은, 시퀀싱 데이터가 기준 A를 충족하는 DNA 분자를 하나의 분자 클러스터로 되돌리고, 기준 B를 충족하는 분자 클러스터를 한 쌍의 duplex 분자 클러스터로 표시하는 것일 수 있으며, 특정 돌연변이의 경우, (a1) 적어도 한 쌍의 dulpex 분자 클러스터가 지원되는 조건(상기 조건은 캡쳐 시퀀싱의 데이터만 지원되며, race에 대한 데이터는 적용하지 않음) 또는 (a2) 적어도 4개의 분자 클러스터가 지원되는 조건이 충족되면, 상기 돌연변이는 원래 DNA 샘플 유래의 진정한 돌연변이이고, 기준 A는 ① DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, ② 랜덤 태그 서열이 동일한 조건, 및 ③ 고정 서열이 동일한 조건을 동시에 충족하고, 기준 B는 ④ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, 및 ⑤ 분자 클러스터 양단의 고정 서열이 동일하나 위치는 반대인 조건을 동시에 충족한다.
상기 방법에 있어서, 상기 DNA 샘플에서 메틸화의 분석 방법은, 시퀀싱 데이터가 기준 C를 충족하는 DNA 분자를 하나의 클러스터로 표시하고, 단편 말단이 관심 효소 절단 부위인 클러스터의 수량을 각각 계산하여, 비메틸화된 단편으로 기록하고, 증폭 단편이 제1 효소 절단 부위에 도달 또는 초과하는 모든 클러스터의 수량을 계산하여 단편 총 수로 기록하고, 두 가지 단편 수량에 따라 대응 영역의 평균 메틸화 수준을 계산하는 것일 수 있고, 영역의 메틸화 수준 = (1 - 비메틸화 단편 수/단편 총 수) × 100%이고, 기준 C는 ⑥ 랜덤 태그 서열이 동일한 조건, ⑦ 고정 서열이 동일한 조건, 및 ⑧ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건을 동시에 충족한다.
상기 DNA 삽입 단편은 구체적으로 어댑터 이외의 증폭된 DNA 단편을 지칭한다.
본 발명은 다음 단계를 포함할 수 있는 DNA 샘플 중 다양한 표적 돌연변이 및/또는 메틸화를 검출하는 방법을 더 보호한다.
(1) 상기 어느 하나의 방법에 따라 라이브러리를 제작한다.
(2) 단계 (1)의 라이브러리에 대해 표적 영역 농축 및 시퀀싱을 수행하며, 시퀀싱 결과에 따라 DNA 샘플 중 표적 돌연변이 및/또는 메틸화의 발생 상황을 분석한다.
상술한 방법에 있어서, 상기 DNA 샘플에서 표적 돌연변이의 분석 방법은, 시퀀싱 데이터가 기준 A를 충족하는 DNA 분자를 하나의 분자 클러스터로 되돌리고, 기준 B를 충족하는 분자 클러스터를 한 쌍의 duplex 분자 클러스터로 표시하는 것일 수 있으며, 특정 돌연변이의 경우, (a1) 적어도 한 쌍의 duplex 분자 클러스터가 지원되는 조건, 또는 (a2) 적어도 4개 분자 클러스터가 지원되는 조건이 충족되면, 상기 돌연변이는 원래 DNA 샘플 유래의 진정한 돌연변이이고, 기준 A는 ① DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, ② 랜덤 태그 서열이 동일한 조건, 및 ③ 고정 서열이 동일한 조건을 동시에 충족하고, 기준 B는 ④ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, 및 ⑤ 분자 클러스터 양단의 고정 서열이 동일하나 위치는 반대인 조건을 동시에 충족한다.
상기 방법에 있어서, 상기 DNA 샘플에서 메틸화의 분석 방법은, 시퀀싱 데이터가 기준 C를 충족하는 DNA 분자를 하나의 클러스터로 표시하고, 단편 말단이 관심 효소 절단 부위인 클러스터의 수량을 각각 계산하여, 비메틸화된 단편으로 기록하고, 증폭 단편이 제1 효소 절단 부위에 도달 또는 초과하는 모든 클러스터의 수량을 계산하여 단편 총 수로 기록하고, 두 가지 단편 수량에 따라 대응 영역의 평균 메틸화 수준을 계산하는 것일 수 있고, 영역의 메틸화 수준 = (1 - 비메틸화 단편 수/단편 총 수) × 100%이고, 기준 C는 ⑥ 랜덤 태그 서열이 동일한 조건, ⑦ 고정 서열이 동일한 조건, 및 ⑧ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건을 동시에 충족한다.
상기 표적 영역 농축은 종래의 상용화된 표적 포획 키트(예를 들어 Agilent sureselect XT 표적 포획 키트, Agilent 5190-8646)를 사용하여 수행할 수 있으며, 여기에서 마지막 단계 PCR 증폭의 프라이머 쌍을 프라이머 A와 프라이머 B로 구성된 프라이머 쌍으로 변경한다. 상기 프라이머 B의 뉴클레오티드 서열은 서열표 서열 403에 표시된 것과 같을 수 있다. 상기 프라이머 B는 세그먼트 A, 인덱스 서열 및 세그먼트 B를 포함할 수 있다. 상기 프라이머 B는 구체적으로 상기 세그먼트 A, 상기 인덱스 서열 및 상기 세그먼트 B로 구성될 수 있다. 상기 세그먼트 A의 뉴클레오티드 서열은 서열표 서열 404에 표시된 것과 같을 수 있다. 상기 세그먼트 B의 뉴클레오티드 서열은 서열표 서열 405에 표시된 것과 같을 수 있다.
상술한 어느 하나의 방법에 있어서, 상기 표적 돌연변이 및/또는 메틸화는 종양 돌연변이 및/또는 메틸화일 수 있다. 상기 종양은 간 악성 종양, 즉 간세포암일 수 있다.
상기에서 통상적으로 복수의 상이한 샘플의 라이브러리는 함께 혼합되어 시퀀싱될 수 있고, 상기 인덱스 서열은 상이한 샘플을 표시하는 데 사용된다. 시퀀싱이 완료된 후, 상이한 인덱스 서열에 따라 전체 시퀀싱 데이터에 대해 분할을 수행한다. 인덱스의 설계 원칙은 전술한 고정 서열의 설계 원칙과 기본적으로 유사하다.
상기 내용에서 DNA 샘플은 메틸화 감응성 제한 엔도뉴클레아제로 효소 절단한 후 DNA 단편을 형성한다(이때의 DNA 단편 양단은 모두 점성 말단을 형성하고, 말단의 단일 가닥 부분의 뉴클레오티드 서열이 바로 중단점 서열임). DNA 단편은 말단 수복을 수행한 후 어댑터와 연결된다(5' 말단 및 3' 말단에 각각 하나의 어댑터가 연결되며, 이는 동일한 어댑터 또는 반대 어댑터일 수 있음). 이때 DNA 분자의 경우, 두 어댑터 사이의 DNA 단편이 바로 DNA 삽입 단편이다.
본 발명은 하나의 샘플로 ctDNA에서 종양 특이적 유전자의 돌연변이(점 돌연변이, 삽입 결실 돌연변이, HBV 통합 등 다양한 돌연변이 형태 포함) 및/또는 메틸화를 동시에 검출할 수 있는 방법을 제공한다. 이는 샘플 수요량이 적을 뿐만 아니라 이 방법으로 제조된 MC 라이브러리는 10 내지 20회의 후속 검출을 지원할 수 있다. 매회 검출의 결과는 모두 모든 원래 ctDNA 표본의 돌연변이 상태 및 효소 절단 부위 커버 영역의 메틸화 변형 상태를 나타낼 수 있고, 민감도와 특이성 저하를 초래하지 않는다. 상기 방법으로 구축된 라이브러리는 PCR의 핫스팟 검출과 캡쳐 시퀀싱에 동시에 사용될 수 있으며, 추가된 DNA 바코드는 위양성 결과를 효과적으로 필터링할 수 있고, duplex 기반의 고특이성 시퀀싱을 구현할 수 있다. 동시에 라이브러리 제작 방법은 cfDNA 샘플뿐만 아니라 게놈 DNA 또는 cDNA 샘플에도 적합하다. 본 발명은 종양 조기 스크리닝, 질병 추적, 치료 효과 평가, 예후 예측 등에 있어서 중요한 임상적 의의를 가지며, 응용 가치가 크다.
도 1은 adapter 및 프라이머 구성의 모식도이다.
도 2는 RaceSeq 표적 영역 농축 및 라이브러리 제작 모식도이다.
도 3은 MC 라이브러리 포획 및 duplex 시퀀싱을 수행하는 모식도이다.
도 4는 Padlock 방법 및 돌연변이/메틸화 동시 검출 방법(즉, 본 발명에서 제공하는 방법)에 의한 AK055957 유전자의 메틸화 수준에 대한 검출 결과이다.
도 5는 돌연변이 단독 검출법과 돌연변이/메틸화 동시 검출법에 의한 돌연변이 검출 및 돌연변이 빈도의 결과이다.
도 2는 RaceSeq 표적 영역 농축 및 라이브러리 제작 모식도이다.
도 3은 MC 라이브러리 포획 및 duplex 시퀀싱을 수행하는 모식도이다.
도 4는 Padlock 방법 및 돌연변이/메틸화 동시 검출 방법(즉, 본 발명에서 제공하는 방법)에 의한 AK055957 유전자의 메틸화 수준에 대한 검출 결과이다.
도 5는 돌연변이 단독 검출법과 돌연변이/메틸화 동시 검출법에 의한 돌연변이 검출 및 돌연변이 빈도의 결과이다.
이하의 실시예는 본 발명의 더 나은 이해를 돕기 위한 것으로 본 발명을 제한하지 않는다.
이하의 실시예에 사용된 실험 방법은 달리 명시되지 않는 한 모두 일반적인 방법이다.
이하의 실시예에 사용된 시험 재료는 달리 명시되지 않는 한 모두 일반적인 생화학 시약 판매점에서 구입한 것이다.
이하의 실시예에 사용된 정량 시험은 모두 3회 반복 실험으로 설정되었으며 결과는 평균값을 취하였다.
하기 실시예 중의 TE 버퍼는 ThermoFisher사의 제품이며 제품 카탈로그 번호는 12090015이다.
하기 실시예에 있어서, 간세포암 환자는 본 발명의 내용에 대하여 사전동의를 받았다.
실시예 1. MC 라이브러리의 제작
一. 메틸화 감응성 제한 엔도뉴클레아제 효소 절단
5-40ng cfDNA를 취하고 표 1과 같이 반응 시스템을 구성한 후, 표 2의 절차에 따라 PCR 기계에서 효소 절단 처리를 수행하여 효소 절단 생성물을 획득한다(4℃에 보관).
Restriction Enzyme와 Restriction Enzyme 10×Buffer는 모두 ThermoFisher사의 제품이다. Restriction Enzyme와 Restriction Enzyme 10×Buffer는 상이한 검출 대상 표적 영역에 따라 선택할 수 있으며, 선택 기준은 검출 대상 영역 내에 적어도 하나의 상기 메틸화 감응성 제한 엔도뉴클레아제의 효소 절단 부위가 포함되는 것이다.
표 1. 반응 시스템
표 2. 반응 절차
二. 효소 절단 생성물의 정제
단계 1에서 획득한 효소 절단 생성물을 취하고 Apostle MiniMax™ 고효율 유리 DNA 농축 분리 키트(표준 버전)(Apostle사 제품, 제품 카탈로그 번호 A17622-50)를 사용하여 정제 및 농축하여 정제 생성물을 수득한다.
三. 정제 생성물의 평활 말단 수복 및 A 추가 처리
단계 2에서 획득한 정제 생성물을 취하고, 표 3과 같이 반응 시스템을 구성한 후, 표 4의 절차에 따라 PCR 기계에서 말단 수복 및 3' 말단 A 추가 처리를 수행하여 반응 생성물을 획득한다(4℃에 보관).
표 3. 반응 시스템
표 4. 반응 절차
四. 반응 생성물과 어댑터 연결
표 5에 따라 반응 시스템을 구성하고, 20℃에서 15분 동안 반응시켜 결찰 생성물을 획득한다(4℃에 보관).
표 5. 반응 시스템
Adapter 서열 정보는 표 6과 같다.
각각 표 6의 단일 가닥 DNA 분자를 TE 버퍼로 용해하고 100μM 농도로 희석한다. 동일한 세트 중의 두 단일 가닥 DNA 분자를 동일한 부피로 혼합한 후(각각 50μl) 어닐링을 수행하여(어닐링 절차: 95℃, 15분; 25℃, 2시간), 12세트의 DNA 용액을 획득하며, 12세트 DNA 용액을 동일한 부피로 혼합하여 Adapter Mix를 획득한다.
표 6. adapter 서열 정보
표 6에서 8개 N은 8bp 랜덤 태그를 나타낸다. 실제 적용에서 랜덤 태그 길이는 8-14bp일 수 있다.
밑줄은 12bp의 고정 서열을 나타내며, 각 세트의 업스트림 서열(명칭에 "F"가 포함된 업스트림 서열)과 다운스트림 서열(명칭에 "R"이 포함된 다운스트림 서열)에서 밑줄 부분은 역상보이며, 어닐링을 통해 업스트림 및 다운스트림 서열을 함께 결합하여 어댑터를 형성할 수 있다. 동시에 고정 서열은 원본 템플릿 분자를 표시하기 위해 서열을 고정하는 내장 태그로 사용할 수 있다. 실제 적용에서 고정 서열의 길이는 12-20bp일 수 있고, 연속 반복 염기는 3개를 초과하지 않으며, 프라이머의 다른 부분과 상호작용할 수 없다(예를 들어 헤어핀 구조, 이량체 형성 등). 12세트 각 위치 염기는 균형을 이루며(즉, A, T, C 및 G가 고르게 분포됨), 미스매치 염기 수는 ≥3이다(즉, 각 고정 서열 간의 염기는 적어도 3개가 상이하며, 상이함은 위치가 상이하거나 순서가 상이한 것일 수 있음).
업스트림 서열 중 말단에 추가한 굵은 T는 원본 분자 말단에 추가한 "A"와 상보적이며 TA가 연결을 수행한다.
업스트림 서열에 있어서, 5' 말단으로부터 제1 내지 21위치(Ⅲumina 회사의 Truseq 시퀀싱 키트)는 시퀀싱 프라이머 결합 서열이고, 여기에서 5' 말단으로부터 제1 내지 19위치는 라이브러리 증폭 프라이머 부분이다.
다운스트림 서열에 있어서, 밑줄이 없는 부분(Ⅲumina 회사의 nextera 시퀀싱 키트)은 시퀀싱 프라이머 결합 서열이고, 여기에서 3' 말단 제1 내지 22위치는 라이브러리 증폭 프라이머의 부분이다.
표 6은 총 12세트 어댑터를 포함하며, 12×12=144가지 표시 조합을 형성할 수 있고, 분자 자체의 서열 정보를 결합하며, 원본 샘플 중의 모든 분자를 구분하기에 충분하고, 실제 적용에서 세트 수를 적절하게 증가시키거나(합성 비용 증가) 감소시킬(구분 효과 미약) 수도 있다.
결찰 생성물 구조는 도 1에 도시된 바와 같다. 여기에서 a는 어댑터 부분이고, b 및 f는 각각 라이브러리 증폭 프라이머이고, c는 8bp 랜덤 태그이고(표 6에서 8개 N으로 표시), d는 12bp 고정 서열이고(표 6에서 밑줄로 표시), e는 삽입 단편이다(cfDNA).
五. 결찰 생성물 정제
단계 4에서 획득한 결찰 생성물에 110μl 내지 220μl(즉 1 내지 2배 부피)의 AMPure XP 마그네틱 비드(Beckman A63880)를 추가하고, 균일하게 와류 혼합하고, 실온에서 10분 동안 거치하고, 마그네틱 스탠드에 5분 동안 흡착시킨다. 용액이 맑아지면 상청액을 버린 후 200μl 80%(부피분율 함량) 에탄올 수용액을 첨가하여 2회 세척하고, 상청액을 버린다. 에탄올 건조 후 DNase/RNase-Free Water 30μl를 첨가하고 균일하게 완류 혼합하며, 실온에서 10분 동안 거치하고, 마그네틱 스탠드에 5분간 흡착시키고, 상청 용액을 취하여 PCR 튜브 내에 넣고 PCR 템플릿으로 사용한다.
六. 라이브러리 증폭 및 정제
1. 단계 5에서 수득한 PCR 템플릿을 취하여 표 7에 따라 반응 시스템을 구성하고 표 8에 따라 PCR 증폭을 수행하여 PCR 증폭 생성물을 획득한다(4℃에 보관).
표 7. 반응 시스템
표 7에서 프라이머 정보는 다음과 같다.
MC_F(서열 25): 5'-GACACGACGCTCTTCCGAT-3'
MC_R(서열 26): 5'-GTGGGCTCGGAGATGTGTATAA-3'
표 8. 반응 절차
2. 단계 1에서 획득한 PCR 증폭 생성물에 70 내지 140μl(즉, 1 내지 2배 부피)의 AMPure XP 마그네틱 비드를 추가하고, 균일하게 와류 혼합하고, 실온에서 10분 동안 거치하고, 마그네틱 스탠드에 5분 동안 흡착시킨다. 용액이 맑아지면 상청액을 버린 후 200μl 80%(부피분율 함량) 에탄올 수용액을 첨가하여 2회 세척하고, 상청액을 버린다. 에탄올 건조 후 DNase/RNase-Free Water 100μl를 첨가하고 균일하게 완류 혼합하며, 실온에서 10분 동안 거치하고, 마그네틱 스탠드에 5분간 흡착시키고, 상청 용액을 취하여 생성물을 획득한다(-20℃에 보관). 생성물이 바로 장기 보관 가능하고 반복 사용 가능한 MC 라이브러리이다.
검출을 거쳐, MC 라이브러리는 10 내지 20회의 후속 검출 지원할 수 있었으며, 매회 검출의 결과는 모두 모든 원본 샘플의 돌연변이 상태 및 효소 절단 부위 커버 영역의 메틸화 변형 상태를 나타낼 수 있고, 민감도와 특이성을 저하시키지 않는다. 동시에 라이브러리 제작 방법은 cfDNA 샘플뿐만 아니라 게놈 DNA 또는 cDNA 샘플에도 적합하다.
실시예 2: RaceSeq 농축 표적 영역 및 시퀀싱 라이브러리 제작
도 2에 도시된 바와 같이, 중국 간세포암 고주파 돌연변이 유전자(TP53, CTNNB1, AXIN1, TERT)의 관련 영역, HBV 통합 핫스팟 영역 및 간세포암 특이적 과메틸화 영역(EMX1, LRRC4, BDH1 등)에 대해 설계한 프라이머를 사용하여 고정 프라이머와 함께 MC 라이브러리에 대해 2회 PCR 증폭을 수행하며, 증폭 생성물은 바로 시퀀싱 라이브러리이다.
도 2에서 a는 1차 라이브러리 증폭 업스트림 프라이머이고, b는 2차 라이브러리 증폭 업스트림 프라이머이고, c는 1차 라이브러리 증폭 다운스트림 프라이머 라이브러리이며 특이 표적 서열 농축에 사용되고, d는 2차 라이브러리 증폭 다운스트림 프라이머 라이브러리이며 특이 표적 서열 농축에 사용되고, e는 index primer이며 index 서열을 추가하는 데 사용된다.
1. 실시예 1에서 제조된 MC 라이브러리 300ng를 취하여 두 부분으로 나누고, 표 9과 같이 반응 시스템을 구성하며(한 부분은 GSP1A mix를 추가하고 다른 부분은 GSP1B mix를 추가함), 표 11의 반응 절차에 따라 1차 PCR 증폭을 수행하여 1차 증폭 생성물을 획득한다(총 두 부분의 1차 증폭 생성물을 획득하며, 한 부분은 GSP1A mix의 증폭 생성물이고 다른 하나는 GSP1B mix의 증폭 생성물임).
표 9. 반응 시스템
표 9에서 프라이머 정보는 다음과 같다.
업스트림 프라이머 1355(서열 27): 5'-TCTTTCCCTACACGACGCTCTTCCGAT-3'
GSP1A mix: 표 10에서 프라이머 풀 GSP1A에 속하는 각 프라이머는 TE 버퍼를 사용해 용해하여 100μM 농도로 희석한 후, 동일한 부피로 혼합하고 TE 버퍼를 사용해 0.3μM로 희석한다. 프라이머 풀 GSP1A 중의 프라이머는 템플릿의 양성 가닥을 증폭하는 데 사용된다.
GSP1B mix: 표 10에서 프라이머 풀 GSP1B에 속하는 각 프라이머는 TE 버퍼를 사용해 용해하여 100μM 농도로 희석한 후, 동일한 부피로 혼합하고 TE 버퍼를 사용해 0.3μM로 희석한다. 프라이머 풀 GSP1B 중의 프라이머는 템플릿의 음성 가닥을 증폭하는 데 사용된다.
프라이머 풀 GSP1A 및 프라이머 풀 GSP1B에 있어서, 동일한 일련번호의 프라이머(즉, 프라이머 일련번호의 뒤 네 자리가 동일)는 양성 및 음성 두 방향에서 동일한 돌연변이 부위를 검출하였으며, 동시에 최대 가능 한도의 농축 원본 분자 정보를 사용하였다.
표 10. 프라이머 정보
표 11. 반응 절차
2. 단계 1에서 획득한 두 개의 1차 증폭 생성물을 30 내지 60μl(즉, 1 내지 2배 부피)의 AMPure XP 마그네틱 비드로 정제한 다음 25μl DNase/RNase-Free Water로 용출하여 1차 정제 생성물을 획득한다.
3. 각각 단계 2에서 획득한 1차 정제 생성물을 템플릿으로 사용하여 표 12의 반응 시스템을 구성하며(GSP1A mix 증폭 생성물을 템플릿으로 채택하는 경우 GSP2A mix 증폭을 채택하고, GSP1B mix 증폭 생성물을 템플릿으로 채택하는 경우 GSP2B mix 증폭을 채택함), 표 14의 반응 절차에 따라 2차 PCR 증폭을 수행하여 2차 증폭 생성물을 획득한다(4℃에 보관).
표 12. 반응 시스템
표 12에서 프라이머 정보는 다음과 같다.
업스트림 프라이머 3355(서열 217): 5'-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCT-3', 밑줄 부분은 1차의 업스트림 프라이머 1355 동일 부분이며, 3355 및 1355는 모두 Ⅲumina 시퀀싱 플랫폼에 의해 시퀀싱된 고정 서열이다(기타 시퀀싱 플랫폼에 의해 시퀀싱된 서열로 변경될 수도 있음).
GSP2A mix: 표 13에서 프라이머 풀 GSP2A에 속하는 각 프라이머는 TE 버퍼를 사용해 용해하여 100μM 농도로 희석한 후, 동일한 부피로 혼합하고 TE 버퍼를 사용해 0.3μM로 희석한다. 프라이머 풀 GSP2A 중의 프라이머는 템플릿의 양성 가닥을 증폭하는 데 사용된다.
GSP2B mix: 표 13에서 프라이머 풀 GSP2B에 속하는 각 프라이머는 TE 버퍼를 사용해 용해하여 100μM 농도로 희석한 후, 동일한 부피로 혼합하고 TE 버퍼를 사용해 0.3μM로 희석한다. 프라이머 풀 GSP2B 중의 프라이머는 템플릿의 음성 가닥을 증폭하는 데 사용된다.
표 13에 있어서, 5' 말단으로부터 제1 내지 15위치는 Index 프라이머에 결합하는 부분이다.
GSP2A mix와 GSP1A mix에서 동일한 프라이머 일련번호를 가진 프라이머(즉, 프라이머 일련번호의 뒤 네 자리가 동일)는 동일한 돌연변이 부위에 대해 설계되었으며, 두 프라이머는 네스티드 관계를 형성한다.
GSP2B mix와 GSP2A mix에서 동일한 프라이머 일련번호를 가진 프라이머(즉, 프라이머 일련번호의 뒤 네 자리가 동일)는 동일한 돌연변이 부위에 대해 설계되었으며, 두 프라이머는 네스티드 관계를 형성한다.
Index 프라이머: 5'-CAAGCAGAAGACGGCATACGAGAT(서열 218) )********GTGACTGGAGTTCCTTGGCACCCGAGAA-3'(서열 219), 밑줄 부분은 GSP2 mix에 결합하는 부분이다. ********는 index 서열 위치이며, index의 길이는 6-8bp이고, 샘플 간의 서열 구별하고 여러 샘플의 혼합 시퀀싱을 용이하게 하는 데 사용된다. index 시퀀스를 제외한 나머지는 Ⅲumina의 small RNA 시퀀싱 키트의 고정 서열이다.
표 13. 프라이머 정보
비고: NA는 프라이머가 없음을 나타낸다.
표 14. 반응 절차
4. 단계 3에서 획득한 GSP2A mix를 채택하여 2차 증폭을 수행한 생성물과 GSP1B mix를 채택하여 2차 증폭을 수행한 생성물을 동일한 부피로 혼합하고, AMPure XP 마그네틱 비드를 이용하여 1:(1-2)의 비율로 정제를 수행한 후, 50μl DNase/RNase-Free Water로 용출하여 2차 정제 생성물을 획득하며, 이는 바로 Ⅲumina Hiseq X 플랫폼에서 시퀀싱할 수 있는 시퀀싱 라이브러리이다.
MC 라이브러리 상의 DNA 랜덤 태그는 cfDNA 서열과 함께 시퀀싱 라이브러리의 Read1 서열 다운스트림에 추가된다. 시퀀싱에 있어서, DNA 랜덤 태그 서열, 고정 서열, cfDNA 서열을 순차적으로 획득한다(도 1의 c, d, e 서열).
간세포암 특이적 유전자 돌연변이의 분석 방법은, 시퀀싱 데이터가 기준 A를 충족하는 DNA 분자를 하나의 분자 클러스터로 되돌리고, 기준 B를 충족하는 분자 클러스터를 한 쌍의 duplex 분자 클러스터로 표시하는 것이며, 특정 돌연변이의 경우, (a1) 적어도 한 쌍의 duplex 분자 클러스터가 지원되는 조건, 또는 (a2) 적어도 4개 분자 클러스터가 지원되는 조건이 충족되면, 상기 돌연변이는 원래 DNA 샘플 유래의 진정한 돌연변이이고, 기준 A는 ① DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, ② 랜덤 태그 서열이 동일한 조건, 및 ③ 고정 서열이 동일한 조건을 동시에 충족하고, 기준 B는 ④ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, 및 ⑤ 분자 클러스터 양단의 고정 서열이 동일하나 위치는 반대인 조건을 동시에 충족한다.
간세포암 특이적 메틸화 변형 정도의 분석 방법은, 시퀀싱 데이터가 기준 C를 충족하는 DNA 분자를 하나의 클러스터로 표시하고, 단편 말단이 관심 효소 절단 부위인 클러스터의 수량을 각각 계산하여, 비메틸화된 단편으로 기록하고, 증폭 단편이 제1 효소 절단 부위에 도달 또는 초과하는 모든 클러스터의 수량을 계산하여 단편 총 수로 기록하고, 두 가지 단편 수량에 따라 대응 영역의 평균 메틸화 수준을 계산하는 것이고, 영역의 메틸화 수준 = (1 - 비메틸화 단편 수/단편 총 수) × 100%이고, 기준 C는 ⑥ 랜덤 태그 서열이 동일한 조건, ⑦ 고정 서열이 동일한 조건, 및 ⑧ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건을 동시에 충족한다.
실시예 3. MC 라이브러리의 포획 및 시퀀싱
도 3에 도시된 바와 같이, 표적 영역 농축은 종래의 상용화된 표적 캡쳐 키트를 기반으로 최적화되도록 설계하여 캡쳐할 수 있다. 예를 들어, 메틸화 영역 기반의 캡쳐는 Roche SeqCap Epi CpGiant Enrichment Kit(Roche 07138881001) 또는 Ⅲumina Infinium Methylation EPIC BeadChipWG-317-1001를 참조할 수 있으며, 메틸화 영역 표적 캡쳐의 설계는 효소 절단 부위 커버 정도에 따라 스크리닝을 수행해야 하고, 프로브에서 중아황산염 처리를 기반으로 변환한 염기를 조정한다. 유전자 돌연변이 영역 기반의 캡쳐는 Agilent Sureselect XT 표적 캡쳐 키트(Agilent5190-8646)를 참조할 수 있으며, 마지막 단계 PCR 증폭의 프라이머만 다음 프라이머로 교체한다.
업스트림 프라이머: 5'-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3'(서열 403)(도 3의 "a"), 밑줄 부분은 프라이머 MC_F 부분과 동일하며, 증폭 라이브러리로 작용하고, 나머지 부분은 Ⅲumina 시퀀싱 플랫폼에서 시퀀싱하는 데 필요한 고정 서열이다.
다운스트림 프라이머: 5'-CAAGCAGAAGACGGCATACGAGAT(서열 404) ********GTCTCGTGGGCTCGGAGATGTGTATAA-3'(서열 405)(도 3의 "b"), 밑줄 부분은 프라이머 MC_R과 동일하게 증폭 라이브러리로 작용한다. ********는 index 서열 위치이며, index의 길이는 6-8bp이고, 샘플 간의 서열 구별하고 여러 샘플의 혼합 시퀀싱을 용이하게 하는 데 사용된다. 나머지 부분은 Ⅲumina 시퀀싱 플랫폼에서 시퀀싱에 필요한 고정 서열이다.
포획된 라이브러리와 MC 라이브러리는 동일한 DNA 랜덤 태그 서열, 고정 서열 및 cfDNA 서열을 가지며, 순차적으로 Read1 다운스트림에 위치한다.
시퀀싱 데이터가 기준 A를 충족하는 DNA 분자를 하나의 분자 클러스터로 되돌리며, 기준 A는 ① DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, ② 랜덤 태그 서열이 동일한 조건, 및 ③ 고정 서열이 동일한 조건을 동시에 충족한다. 기준 B를 충족하는 분자 클러스터를 한 쌍의 duplex 분자 클러스터로 표시하며, 기준 B는 ④ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, 및 ⑤ 분자 클러스터 양단의 고정 서열이 동일하나 위치는 반대인 조건을 동시에 충족한다. 특정 돌연변이의 경우, (a1) 적어도 한 쌍의 duplex 분자 클러스터가 지원되는 조건, 또는 (a2) 적어도 4개 분자 클러스터가 지원되는 조건이 충족되면, 상기 돌연변이는 원래 DNA 샘플 유래의 진정한 돌연변이이다. 한 쌍의 duplex 분자 클러스터가 공동 지원하는 돌연변이의 신뢰성은 더 높으며 위양성 돌연변이를 90%를 줄일 수 있다.
시퀀싱 데이터가 기준 C를 충족하는 DNA 분자를 하나의 클러스터로 표시하고, 단편 말단이 관심 효소 절단 부위인 클러스터의 수량을 각각 계산하여, 비메틸화된 단편으로 기록하고, 증폭 단편이 제1 효소 절단 부위에 도달 또는 초과하는 모든 클러스터의 수량을 계산하여 단편 총 수로 기록한다. 두 가지 단편 수량에 따라 대응 영역의 평균 메틸화 수준을 계산하며, 영역의 메틸화 수준 = (1 - 비메틸화 단편 수/단편 총 수) × 100%이다. 기준 C는 ⑥ 랜덤 태그 서열이 동일한 조건, ⑦ 고정 서열이 동일한 조건, 및 ⑧ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건을 동시에 충족한다.
실시예 4. 검출 방법의 비교
一. 검출 방법의 비교 1
1. 간세포암 환자 21명의 cfDNA 표본을 수집한다.
2. 단계 1 완료 후, 각 cfDNA 표본을 취하여 실시예 1의 방법에 따라 MC 라이브러리를 구축한 후, 실시예 2의 방법에 따라 RaceSeq 표적 영역을 농축 및 시퀀싱하여 AK055957 유전자의 메틸화 수준을 획득한다.
3. 단계 1 완료 후, 각 cfDNA 표본을 취하여 Padlock 방법(Xu R H , Wei W , Krawczyk M , et al. Circulating tumour DNA methylation markers for diagnosis and prognosis of hepatocellular carcinoma[J]. Nature Materials, 2017, 16(11):1155.)을 채택하여 AK055957 유전자의 메틸화 수준을 검출한다. Padlock은 메틸화 표적 시퀀싱 기술이다. Padlock 프로브 구조는 자물쇠와 유사하며, 고처리량 메틸화 표적 시퀀싱에 적용할 수 있다. 이는 고효율의 중아황산염 변환 후 라이브러리 구축 방법에 속하며 "BSPP"라고 불린다. cfDNA는 중아황산염 변환을 거친 후, 중아황산염 패드록 프로브(BSPP)의 캡처 암과 상보적으로 쌍을 이룰 때 증폭되어 고리형으로 연결될 수 있으며, 엑소뉴클리아제를 이용해 고리형으로 연결된 패드록 프로브를 스크리닝할 수 있으며, 증폭 생성물에 대해 시퀀싱을 수행하여 상응하는 DNA 메틸화 정보를 획득한다.
검출 결과는 도 4와 같다. 결과에 따르면, Padlock 방법과 돌연변이/메틸화 동시 검출 방법(즉, 본 발명에서 제공하는 방법)은 AK055957 유전자(간세포암 특이적 유전자에 속함)의 메틸화 수준 검출 결과와 기본적으로 동일하다.
二. 검출 방법의 비교 2
1. 돌연변이/메틸화 동시 검출 방법을 채택해 돌연변이와 돌연변이 빈도를 검출한다.
(1) 특정 간세포암 환자의 cfDNA를 수집한다.
(2) 단계 (1)을 완료한 후, 5-40ng의 cfDNA를 취하여 표 1과 같이 반응 시스템을 구성한 다음 PCR 기계에서 효소 절단을 수행하여 효소 절단 생성물을 획득한다(4℃에서 보관). 여기에서 효소 절단 처리의 시간은 0시간, 0.2시간, 0.4시간, 0.6시간, 0.8시간 또는 1시간이다.
(3) 단계 (2)를 완료한 후, 상기 효소 절단 생성물을 취하며, 실시예 1에서 2 내지 6의 방법에 따라 MC 라이브러리를 구축한 후, 실시예 2의 방법에 따라 RaceSeq 표적 농축을 수행하고 시퀀싱한다. 데이터 분석 시, 랜덤 태그 서열이 동일하고 DNA 삽입 단편 길이가 동일하며 돌연변이 부위 이외의 서열이 일치하는 DNA 분자 시퀀싱 데이터는 분자 클러스터로 되돌아간다. 만약 클러스터 내 분자 수가 >5개이고 클러스터 내 분자 돌연변이 일치율이 >80%이고 클러스터 수가 ≥5이면, 상기 돌연변이는 원본 DNA 샘플에서 유래된 진정한 돌연변이이다. 상기 분자 돌연변이를 포함하는 클러스터의 비율이 돌연변이 빈도이다.
2. 단독 검출 돌연변이법을 채택하여 돌연변이와 돌연변이 빈도를 검출한다.
(1) 특정 간세포암 환자의 cfDNA를 수집한다.
(2) 단계 (1)를 완료한 후, 5-40ng cfDNA를 취하고, 표 3과 같이 반응 시스템을 구성한 후, 표 4의 절차에 따라 PCR 기계에서 말단 수복 및 3' 말단 A 추가 처리를 수행하여 반응 생성물을 획득한다(4℃에 보관).
(3) 단계 (2)를 완료한 후, 상기 반응 생성물을 취하며, 실시예 1에서 4 내지 6의 방법에 따라 MC 라이브러리를 구축한 후, 실시예 2의 방법에 따라 RaceSeq 표적 농축을 수행하고 시퀀싱한다. 데이터 분석 시, 랜덤 태그 서열이 동일하고 DNA 삽입 단편 길이가 동일하며 돌연변이 부위 이외의 서열이 일치하는 DNA 분자 시퀀싱 데이터는 분자 클러스터로 되돌아간다. 만약 클러스터 내 분자 수가 >5개이고 클러스터 내 분자 돌연변이 일치율이 >80%이고 클러스터 수가 ≥5이면, 상기 돌연변이는 원본 DNA 샘플에서 유래된 진정한 돌연변이이다. 상기 분자 돌연변이를 포함하는 클러스터의 비율이 돌연변이 빈도이다.
3. 각 돌연변이 부위는 돌연변이/메틸화 동시 검출법에 따라 획득한 돌연변이 빈도를 횡좌표로 사용하고, 돌연변이 단독 검출법으로 획득한 돌연변이 빈도를 종좌표로 사용하여 산점도를 도시하고, 선형 적합 곡선 및 상관 계수 R2를 추가한다.
결과는 도 5와 같다. 결과에 따르면, 돌연변이/메틸화 동시 검출법과 돌연변이 단독 검출법은 기본적으로 돌연변이 및 돌연변이 빈도에 대한 검출 결과가 동일하다. 즉, 메틸화 검출은 돌연변이의 검출에 영향을 미치지 않는다.
실시예 5. 정확성 실험
돌연변이 표준은 Horizon Discovery사의 제품이며, 제품 카탈로그 번호는 HD701이다.
一. 정확성 실험 1
1. 돌연변이 표준품을 취하고, 실시예 1의 1 내지 6의 방법에 따라 MC 라이브러리를 구축한 후, 실시예 2의 방법(단계 3의 GSP2A mix만 GSP2A mix-1로, GSP2B mix만 GSP2B mix-1로 교체함)에 따라 RaceSeq 표적 영역 농축 및 시퀀싱을 수행한다.
GSP2A mix-1: 표 15에서 프라이머 풀 GSP2A에 속하는 각 프라이머는 TE 버퍼를 사용해 용해하여 100μM 농도로 희석한 후, 동일한 부피로 혼합하고 TE 버퍼를 사용해 0.3μM로 희석한다. 프라이머 풀 GSP2A 중의 프라이머는 템플릿의 양성 가닥을 증폭하는 데 사용된다.
GSP2B mix-1: 표 15에서 프라이머 풀 GSP2B에 속하는 각 프라이머는 TE 버퍼를 사용해 용해하여 100μM 농도로 희석한 후, 동일한 부피로 혼합하고 TE 버퍼를 사용해 0.3μM로 희석한다. 프라이머 풀 GSP2B 중의 프라이머는 템플릿의 음성 가닥을 증폭하는 데 사용된다.
표 15. 프라이머 서열
2. 시퀀싱 결과에 따라 돌연변이 부위의 돌연변이 빈도를 획득한다.
검출 결과는 표 16과 같다. 결과에 따르면 돌연변이/메틸화 동시 검출법을 채택하여 돌연변이 표준품을 검출하였으며, 획득한 돌연변이 부위의 돌연변이 빈도는 이론적인 값에 기본적으로 근접하였다. 여기에서 알 수 있듯이, 돌연변이/메틸화 동시 검출법은 간세포암 특이적 유전자(예를 들어 CTNNB1 유전자, TP53 유전자, AXIN1 유전자)의 돌연변이 검출에 대해 비교적 높은 정확성을 갖는다.
표 16. 정확성 실험
비고: geneID는 Ensemble 데이터베이스 중 일련번호를 나타내고, Ref는 정상 유형이고, Alt는 유전자 돌연변이 후 유형이고, INS는 삽입을 나태내고, DEL은 결실을 나타내고, SNP는 단일 염기 돌연변이를 나타낸다.
二. 정확성 실험 2
인간 메틸화와 비메틸화 표준품은 Zymo Research사의 제품이며 제품 카탈로그 번호는 D5014이다.
1. 인간 메틸화와 비메틸화 표준품 중의 메틸화 표준품과 비메틸화 표준품을 상이한 비율에 따라 혼합하여 측정 대상 샘플을 획득한다. 측정 대상 샘플에서 메틸화 표준품의 비율은 0%, 20% 또는 100%이다. 즉 종양 특이적 유전자(BDH1 유전자, EMX1 유전자, LRRC4 유전자, CLEC11A 유전자, HOXA1 유전자, AK055957 유전자, COTL1 유전자, ACP1 유전자 또는 DAB2IP 유전자) 메틸화의 비율은 0%, 20% 또는 100%이다.
2. 측정 대상 샘플을 취하고, 실시예 1의 방법에 따라 MC 라이브러리를 구축한 후, 실시예 2의 방법에 따라 RaceSeq 표적 영역 농축 및 시퀀싱을 수행하여 메틸화 부위의 검출값을 획득한다.
검출 결과는 표 17 및 표 18과 같다(샘플 유형의 뒤 네 자리는 종양 특이적 유전자의 명칭임). 메틸화 표준품은 돌연변이/메틸화 동시 검출법으로 검출하였으며, 검출값은 기본적으로 이론값에 근접하였다. 여기에서 알 수 있듯이, 돌연변이/메틸화 동시 검출법은 종양 특이적 유전자(BDH1 유전자, EMX1 유전자, LRRC4 유전자, CLEC11A 유전자, HOXA1 유전자, AK055957 유전자, COTL1 유전자, ACP1 유전자, DAB2IP 유전자)의 메틸화 수준 검출에 대해 비교적 높은 정확성을 갖는다.
표 17. 메틸화 표준품 정확도 검출 결과(양성 가닥)
표 18. 메틸화 표준품 정확도 검출 결과(음성 가닥)
실시예 6. 간세포암 환자 cfDNA에서 돌연변이/메틸화 동시 검출법의 응용
1. 정상인 1명, 간경변증 환자 1명, 간세포암 환자 3명의 혈액 샘플을 수집하고 cfDNA를 추출한다.
2. 5-40ng의 cfDNA를 취하고, 실시예 1에 따라 MC 라이브러리 구축하며, 실시예 2의 방법에 따라 RaceSeq 표적 영역 농축 및 시퀀싱을 수행한다.
3. 메틸화 검출 결과는 표 19 및 표 20과 같다.
결과에 따르면 간세포암 특이적 과메틸화의 유전자가 나타났으며, 검출한 간세포암 샘플 중의 메틸화 수준이 비간세포암 샘플 중의 메틸화 수준보다 높다. 돌연변이/메틸화 동시 검출법은 간세포암 cfDNA 샘플의 검출에 적용할 수 있다.
표 19. cfDNA 샘플 표적 영역 메틸화 수준 검출 결과(양성 가닥)
표 20. cfDNA 샘플 표적 영역 메틸화 수준 검출 결과(음성 가닥)
본 발명은 하나의 샘플로 ctDNA에서 종양 특이적 유전자의 돌연변이(점 돌연변이, 삽입 결실 돌연변이, HBV 통합 등 다양한 돌연변이 형태 포함) 및/또는 메틸화를 동시에 검출할 수 있는 방법을 개시한다. 이는 샘플 수요량이 적을 뿐만 아니라 이 방법으로 제조된 MC 라이브러리는 10 내지 20회의 후속 검출을 지원할 수 있다. 매회 검출의 결과는 모두 모든 원래 ctDNA 표본의 돌연변이 상태 및 효소 절단 부위 커버 영역의 메틸화 변형 상태를 나타낼 수 있고, 민감도와 특이성 저하를 초래하지 않는다. 동시에 라이브러리 제작 방법은 cfDNA 샘플뿐만 아니라 게놈 DNA 또는 cDNA 샘플에도 적합하다. 본 발명은 종양 조기 스크리닝, 질병 추적, 치료 효과 평가, 예후 예측 등에 있어서 중요한 임상적 의의를 가지며, 응용 가치가 크다.
<110> CANCER HOSPITAL, CHINESE ACADEMY OF MEDICAL SCIENCES GENETRON HEALTH (BEIJING) CO., LTD.
<120> METHOD FOR DETECTING MUTATION AND METHYLATION OF TUMOR SPECIFIC GENE IN CTDNA
<160> 405
<170> PatentIn version 3.5
<210> 1
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 1
gacacgacgc tcttccgatc tnnnnnnnnc cactagtagc ct 42
<210> 2
<211> 41
<212> DNA
<213> Artificial sequence
<400> 2
ggctactagt ggctgtctct tatacacatc tccgagccca c 41
<210> 3
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 3
gacacgacgc tcttccgatc tnnnnnnnng gactgtgtcg gt 42
<210> 4
<211> 41
<212> DNA
<213> Artificial sequence
<400> 4
ccgacacagt ccctgtctct tatacacatc tccgagccca c 41
<210> 5
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 5
gacacgacgc tcttccgatc tnnnnnnnng gtactgacag gt 42
<210> 6
<211> 41
<212> DNA
<213> Artificial sequence
<400> 6
cctgtcagta ccctgtctct tatacacatc tccgagccca c 41
<210> 7
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 7
gacacgacgc tcttccgatc tnnnnnnnnc ctagtacagc ct 42
<210> 8
<211> 41
<212> DNA
<213> Artificial sequence
<400> 8
ggctgtacta ggctgtctct tatacacatc tccgagccca c 41
<210> 9
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 9
gacacgacgc tcttccgatc tnnnnnnnng gtagtcagag gt 42
<210> 10
<211> 41
<212> DNA
<213> Artificial sequence
<400> 10
cctctgacta ccctgtctct tatacacatc tccgagccca c 41
<210> 11
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 11
gacacgacgc tcttccgatc tnnnnnnnnt tctcacgtgt tt 42
<210> 12
<211> 41
<212> DNA
<213> Artificial sequence
<400> 12
aacacgtgag aactgtctct tatacacatc tccgagccca c 41
<210> 13
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 13
gacacgacgc tcttccgatc tnnnnnnnna actccacgta at 42
<210> 14
<211> 41
<212> DNA
<213> Artificial sequence
<400> 14
ttacgtggag ttctgtctct tatacacatc tccgagccca c 41
<210> 15
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 15
gacacgacgc tcttccgatc tnnnnnnnnt tctcgagaat tt 42
<210> 16
<211> 41
<212> DNA
<213> Artificial sequence
<400> 16
aattctcgag aactgtctct tatacacatc tccgagccca c 41
<210> 17
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 17
gacacgacgc tcttccgatc tnnnnnnnna aactcttcca at 42
<210> 18
<211> 41
<212> DNA
<213> Artificial sequence
<400> 18
ttggaagagt ttctgtctct tatacacatc tccgagccca c 41
<210> 19
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 19
gacacgacgc tcttccgatc tnnnnnnnnt tggaacgtct tt 42
<210> 20
<211> 41
<212> DNA
<213> Artificial sequence
<400> 20
aagacgttcc aactgtctct tatacacatc tccgagccca c 41
<210> 21
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 21
gacacgacgc tcttccgatc tnnnnnnnnc cggactcctc ct 42
<210> 22
<211> 41
<212> DNA
<213> Artificial sequence
<400> 22
ggaggagtcc ggctgtctct tatacacatc tccgagccca c 41
<210> 23
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 23
gacacgacgc tcttccgatc tnnnnnnnna aggaggagta at 42
<210> 24
<211> 41
<212> DNA
<213> Artificial sequence
<400> 24
ttactcctcc ttctgtctct tatacacatc tccgagccca c 41
<210> 25
<211> 19
<212> DNA
<213> Artificial sequence
<400> 25
gacacgacgc tcttccgat 19
<210> 26
<211> 22
<212> DNA
<213> Artificial sequence
<400> 26
gtgggctcgg agatgtgtat aa 22
<210> 27
<211> 27
<212> DNA
<213> Artificial sequence
<400> 27
tctttcccta cacgacgctc ttccgat 27
<210> 28
<211> 20
<212> DNA
<213> Artificial sequence
<400> 28
tgtattaggg tgcagcgctc 20
<210> 29
<211> 18
<212> DNA
<213> Artificial sequence
<400> 29
cgctcggatc tggacctg 18
<210> 30
<211> 19
<212> DNA
<213> Artificial sequence
<400> 30
tggagccctg tgactcgaa 19
<210> 31
<211> 21
<212> DNA
<213> Artificial sequence
<400> 31
gtgaccagga catggatgag g 21
<210> 32
<211> 21
<212> DNA
<213> Artificial sequence
<400> 32
tcctccagta gacggtacag c 21
<210> 33
<211> 18
<212> DNA
<213> Artificial sequence
<400> 33
tgctgcttgt ccccacac 18
<210> 34
<211> 18
<212> DNA
<213> Artificial sequence
<400> 34
ccgcttggca ccacttcc 18
<210> 35
<211> 18
<212> DNA
<213> Artificial sequence
<400> 35
ggcacgggaa gcacgtac 18
<210> 36
<211> 18
<212> DNA
<213> Artificial sequence
<400> 36
ccttgcagtg ggaaggtg 18
<210> 37
<211> 23
<212> DNA
<213> Artificial sequence
<400> 37
gacagaaaag cggctgttag tca 23
<210> 38
<211> 19
<212> DNA
<213> Artificial sequence
<400> 38
ccgacctcag ctacagcat 19
<210> 39
<211> 21
<212> DNA
<213> Artificial sequence
<400> 39
acttgagcaa cccggagtct g 21
<210> 40
<211> 20
<212> DNA
<213> Artificial sequence
<400> 40
ctcctagctc tgcagtccga 20
<210> 41
<211> 18
<212> DNA
<213> Artificial sequence
<400> 41
gcgcctggct ccatttcc 18
<210> 42
<211> 21
<212> DNA
<213> Artificial sequence
<400> 42
cgcctgagaa cctgcaaaga g 21
<210> 43
<211> 18
<212> DNA
<213> Artificial sequence
<400> 43
gtccagggag caatgcgt 18
<210> 44
<211> 19
<212> DNA
<213> Artificial sequence
<400> 44
cgggttaccc cacagccta 19
<210> 45
<211> 18
<212> DNA
<213> Artificial sequence
<400> 45
ggctcccagt ggattcgc 18
<210> 46
<211> 18
<212> DNA
<213> Artificial sequence
<400> 46
gtcctgcccc ttcacctt 18
<210> 47
<211> 22
<212> DNA
<213> Artificial sequence
<400> 47
ccgactactg cctcacccat at 22
<210> 48
<211> 26
<212> DNA
<213> Artificial sequence
<400> 48
gggtttttct tgttgacaag aatcct 26
<210> 49
<211> 22
<212> DNA
<213> Artificial sequence
<400> 49
ccaacctcca atcactcacc aa 22
<210> 50
<211> 28
<212> DNA
<213> Artificial sequence
<400> 50
ggcgttttat catattcctc ttcatcct 28
<210> 51
<211> 26
<212> DNA
<213> Artificial sequence
<400> 51
ctacttccag gaacatcaac taccag 26
<210> 52
<211> 23
<212> DNA
<213> Artificial sequence
<400> 52
ctgcacttgt attcccatcc cat 23
<210> 53
<211> 27
<212> DNA
<213> Artificial sequence
<400> 53
tcagtttact agtgccattt gttcagt 27
<210> 54
<211> 28
<212> DNA
<213> Artificial sequence
<400> 54
tacaacatct tgagtccctt tttacctc 28
<210> 55
<211> 23
<212> DNA
<213> Artificial sequence
<400> 55
agaattgtgg gtcttttggg ctt 23
<210> 56
<211> 30
<212> DNA
<213> Artificial sequence
<400> 56
tgtaaacaat atctgaacct ttaccctgtt 30
<210> 57
<211> 20
<212> DNA
<213> Artificial sequence
<400> 57
gcatgcgtgg aacctttgtg 20
<210> 58
<211> 23
<212> DNA
<213> Artificial sequence
<400> 58
aactctgttg tcctctctcg gaa 23
<210> 59
<211> 18
<212> DNA
<213> Artificial sequence
<400> 59
ctgaatcccg cggacgac 18
<210> 60
<211> 21
<212> DNA
<213> Artificial sequence
<400> 60
ccgtctgtgc cttctcatct g 21
<210> 61
<211> 19
<212> DNA
<213> Artificial sequence
<400> 61
gaacgcccac caggtcttg 19
<210> 62
<211> 24
<212> DNA
<213> Artificial sequence
<400> 62
ccttgaggcg tacttcaaag actg 24
<210> 63
<211> 23
<212> DNA
<213> Artificial sequence
<400> 63
ggaggctgta ggcataaatt ggt 23
<210> 64
<211> 22
<212> DNA
<213> Artificial sequence
<400> 64
gtcctactgt tcaagcctcc aa 22
<210> 65
<211> 22
<212> DNA
<213> Artificial sequence
<400> 65
gggcttctgt ggagttactc tc 22
<210> 66
<211> 22
<212> DNA
<213> Artificial sequence
<400> 66
ttgtatcggg aggccttaga gt 22
<210> 67
<211> 21
<212> DNA
<213> Artificial sequence
<400> 67
ttctgtgttg gggtgagttg a 21
<210> 68
<211> 25
<212> DNA
<213> Artificial sequence
<400> 68
ccagcatcca gggaattagt agtca 25
<210> 69
<211> 27
<212> DNA
<213> Artificial sequence
<400> 69
ttcctgtctt acctttggaa gagaaac 27
<210> 70
<211> 25
<212> DNA
<213> Artificial sequence
<400> 70
ccggaaacta ctgttgttag acgta 25
<210> 71
<211> 23
<212> DNA
<213> Artificial sequence
<400> 71
cgtcgcagaa gatctcaatc tcg 23
<210> 72
<211> 28
<212> DNA
<213> Artificial sequence
<400> 72
aaactccctc ctttcctaac attcattt 28
<210> 73
<211> 26
<212> DNA
<213> Artificial sequence
<400> 73
tatgcctgct aggttctatc ctaacc 26
<210> 74
<211> 27
<212> DNA
<213> Artificial sequence
<400> 74
ggcattattt acatactctg tggaagg 27
<210> 75
<211> 22
<212> DNA
<213> Artificial sequence
<400> 75
gttggtcttc caaacctcga ca 22
<210> 76
<211> 22
<212> DNA
<213> Artificial sequence
<400> 76
ttcaacccca acaaggatca ct 22
<210> 77
<211> 20
<212> DNA
<213> Artificial sequence
<400> 77
ttccaccaat cggcagtcag 20
<210> 78
<211> 21
<212> DNA
<213> Artificial sequence
<400> 78
gccctgctca gaatactgtc t 21
<210> 79
<211> 20
<212> DNA
<213> Artificial sequence
<400> 79
attcgcagtc ccaaatctcc 20
<210> 80
<211> 21
<212> DNA
<213> Artificial sequence
<400> 80
catcttcctc tgcatcctgc t 21
<210> 81
<211> 22
<212> DNA
<213> Artificial sequence
<400> 81
ttccaggatc atcaaccacc ag 22
<210> 82
<211> 18
<212> DNA
<213> Artificial sequence
<400> 82
gtccctttat gccgctgt 18
<210> 83
<211> 29
<212> DNA
<213> Artificial sequence
<400> 83
acccttataa agaatttgga gctactgtg 29
<210> 84
<211> 22
<212> DNA
<213> Artificial sequence
<400> 84
ctcctgaaca ttgctcacct ca 22
<210> 85
<211> 18
<212> DNA
<213> Artificial sequence
<400> 85
agactgcctt ccgggtca 18
<210> 86
<211> 22
<212> DNA
<213> Artificial sequence
<400> 86
cctgtgggaa gcgaaaattc ca 22
<210> 87
<211> 19
<212> DNA
<213> Artificial sequence
<400> 87
acctggtcct ctgactgct 19
<210> 88
<211> 24
<212> DNA
<213> Artificial sequence
<400> 88
aagcaatgga tgatttgatg ctgt 24
<210> 89
<211> 20
<212> DNA
<213> Artificial sequence
<400> 89
gacccaggtc cagatgaagc 20
<210> 90
<211> 18
<212> DNA
<213> Artificial sequence
<400> 90
tcctggcccc tgtcatct 18
<210> 91
<211> 22
<212> DNA
<213> Artificial sequence
<400> 91
gtgccctgac tttcaactct gt 22
<210> 92
<211> 18
<212> DNA
<213> Artificial sequence
<400> 92
caactggcca agacctgc 18
<210> 93
<211> 20
<212> DNA
<213> Artificial sequence
<400> 93
cgccatggcc atctacaagc 20
<210> 94
<211> 18
<212> DNA
<213> Artificial sequence
<400> 94
ggtccccagg cctctgat 18
<210> 95
<211> 22
<212> DNA
<213> Artificial sequence
<400> 95
gagtggaagg aaatttgcgt gt 22
<210> 96
<211> 19
<212> DNA
<213> Artificial sequence
<400> 96
gcactggcct catcttggg 19
<210> 97
<211> 26
<212> DNA
<213> Artificial sequence
<400> 97
ccatccacta caactacatg tgtaac 26
<210> 98
<211> 24
<212> DNA
<213> Artificial sequence
<400> 98
tttccttact gcctcttgct tctc 24
<210> 99
<211> 20
<212> DNA
<213> Artificial sequence
<400> 99
gggacggaac agctttgagg 20
<210> 100
<211> 23
<212> DNA
<213> Artificial sequence
<400> 100
cacagaggaa gagaatctcc gca 23
<210> 101
<211> 26
<212> DNA
<213> Artificial sequence
<400> 101
tgcctcagat tcacttttat cacctt 26
<210> 102
<211> 30
<212> DNA
<213> Artificial sequence
<400> 102
ctcaggtact gtgtatatac ttacttctcc 30
<210> 103
<211> 19
<212> DNA
<213> Artificial sequence
<400> 103
cgtgagcgct tcgagatgt 19
<210> 104
<211> 22
<212> DNA
<213> Artificial sequence
<400> 104
gtgatgtcat ctctcctccc tg 22
<210> 105
<211> 25
<212> DNA
<213> Artificial sequence
<400> 105
tgaagtccaa aaagggtcag tctac 25
<210> 106
<211> 20
<212> DNA
<213> Artificial sequence
<400> 106
gggagcatct tcggtgaaac 20
<210> 107
<211> 22
<212> DNA
<213> Artificial sequence
<400> 107
caggcttatc ccatcttggt ca 22
<210> 108
<211> 18
<212> DNA
<213> Artificial sequence
<400> 108
ttggtggctg gcttggtc 18
<210> 109
<211> 21
<212> DNA
<213> Artificial sequence
<400> 109
gctgtaccgt ctactggagg a 21
<210> 110
<211> 21
<212> DNA
<213> Artificial sequence
<400> 110
gcttgttctc cagctctcgg a 21
<210> 111
<211> 18
<212> DNA
<213> Artificial sequence
<400> 111
gggaagtggt gccaagcg 18
<210> 112
<211> 18
<212> DNA
<213> Artificial sequence
<400> 112
gcacacgctg tacgtgct 18
<210> 113
<211> 18
<212> DNA
<213> Artificial sequence
<400> 113
gcctccacct gctccttg 18
<210> 114
<211> 22
<212> DNA
<213> Artificial sequence
<400> 114
ccctcaatga tccactgcat ga 22
<210> 115
<211> 24
<212> DNA
<213> Artificial sequence
<400> 115
ctcatacagg acttgggagg tatc 24
<210> 116
<211> 18
<212> DNA
<213> Artificial sequence
<400> 116
cacaaccgca ggacagct 18
<210> 117
<211> 18
<212> DNA
<213> Artificial sequence
<400> 117
ctccaagcct cggactgc 18
<210> 118
<211> 19
<212> DNA
<213> Artificial sequence
<400> 118
gcctcacacc agccacaac 19
<210> 119
<211> 20
<212> DNA
<213> Artificial sequence
<400> 119
tccccaccat gagcaaacca 20
<210> 120
<211> 18
<212> DNA
<213> Artificial sequence
<400> 120
gtgcctccct gcaacact 18
<210> 121
<211> 18
<212> DNA
<213> Artificial sequence
<400> 121
gcaccacgaa tgccggac 18
<210> 122
<211> 18
<212> DNA
<213> Artificial sequence
<400> 122
gtggggtaac ccgaggga 18
<210> 123
<211> 18
<212> DNA
<213> Artificial sequence
<400> 123
gaggaggcgg agctggaa 18
<210> 124
<211> 18
<212> DNA
<213> Artificial sequence
<400> 124
agcgctgcct gaaactcg 18
<210> 125
<211> 17
<212> DNA
<213> Artificial sequence
<400> 125
cgcacgaacg tggccag 17
<210> 126
<211> 19
<212> DNA
<213> Artificial sequence
<400> 126
gagccaccag caggaaagt 19
<210> 127
<211> 24
<212> DNA
<213> Artificial sequence
<400> 127
ctaggaatcc tgatgttgtg ctct 24
<210> 128
<211> 22
<212> DNA
<213> Artificial sequence
<400> 128
cgcgagtcta gactctgtgg ta 22
<210> 129
<211> 24
<212> DNA
<213> Artificial sequence
<400> 129
atagccagga caaattggag gaca 24
<210> 130
<211> 21
<212> DNA
<213> Artificial sequence
<400> 130
gacaaacggg caacatacct t 21
<210> 131
<211> 23
<212> DNA
<213> Artificial sequence
<400> 131
ccgaaggttt tgtacagcaa caa 23
<210> 132
<211> 23
<212> DNA
<213> Artificial sequence
<400> 132
ctgagccagg agaaacggac tga 23
<210> 133
<211> 26
<212> DNA
<213> Artificial sequence
<400> 133
gggactcaag atgttgtaca gacttg 26
<210> 134
<211> 21
<212> DNA
<213> Artificial sequence
<400> 134
gttaagggag tagccccaac g 21
<210> 135
<211> 25
<212> DNA
<213> Artificial sequence
<400> 135
caggcagttt tcgaaaacat tgctt 25
<210> 136
<211> 27
<212> DNA
<213> Artificial sequence
<400> 136
ttaaagcagg atagccacat tgtgtaa 27
<210> 137
<211> 25
<212> DNA
<213> Artificial sequence
<400> 137
ggcaacaggg taaaggttca gatat 25
<210> 138
<211> 19
<212> DNA
<213> Artificial sequence
<400> 138
ccacaaaggt tccacgcat 19
<210> 139
<211> 24
<212> DNA
<213> Artificial sequence
<400> 139
tggaaaggaa gtgtacttcc gaga 24
<210> 140
<211> 18
<212> DNA
<213> Artificial sequence
<400> 140
gtcgtccgcg ggattcag 18
<210> 141
<211> 18
<212> DNA
<213> Artificial sequence
<400> 141
aaggcacaga cggggaga 18
<210> 142
<211> 18
<212> DNA
<213> Artificial sequence
<400> 142
tcacggtggt ctccatgc 18
<210> 143
<211> 22
<212> DNA
<213> Artificial sequence
<400> 143
ggtcgttgac attgctgaga gt 22
<210> 144
<211> 22
<212> DNA
<213> Artificial sequence
<400> 144
aacctaatct cctcccccaa ct 22
<210> 145
<211> 23
<212> DNA
<213> Artificial sequence
<400> 145
gcagaggtga aaaagttgca tgg 23
<210> 146
<211> 18
<212> DNA
<213> Artificial sequence
<400> 146
ccacccaagg cacagctt 18
<210> 147
<211> 18
<212> DNA
<213> Artificial sequence
<400> 147
actccacaga agccccaa 18
<210> 148
<211> 20
<212> DNA
<213> Artificial sequence
<400> 148
gcctcccgat acaaagcaga 20
<210> 149
<211> 24
<212> DNA
<213> Artificial sequence
<400> 149
gattcatcaa ctcaccccaa caca 24
<210> 150
<211> 27
<212> DNA
<213> Artificial sequence
<400> 150
acatagctga ctactaattc cctggat 27
<210> 151
<211> 25
<212> DNA
<213> Artificial sequence
<400> 151
atccacactc caaaagacac caaat 25
<210> 152
<211> 22
<212> DNA
<213> Artificial sequence
<400> 152
gcgagggagt tcttcttcta gg 22
<210> 153
<211> 25
<212> DNA
<213> Artificial sequence
<400> 153
cagtaaagtt tcccaccttg tgagt 25
<210> 154
<211> 27
<212> DNA
<213> Artificial sequence
<400> 154
cctcctgtaa atgaatgtta ggaaagg 27
<210> 155
<211> 26
<212> DNA
<213> Artificial sequence
<400> 155
gtttaatgcc tttatccaag ggcaaa 26
<210> 156
<211> 27
<212> DNA
<213> Artificial sequence
<400> 156
ctcttatata gaatcccagc cttccac 27
<210> 157
<211> 22
<212> DNA
<213> Artificial sequence
<400> 157
cttgtcgagg tttggaagac ca 22
<210> 158
<211> 20
<212> DNA
<213> Artificial sequence
<400> 158
gtttgagttg gctccgaacg 20
<210> 159
<211> 18
<212> DNA
<213> Artificial sequence
<400> 159
ctgagggctc caccccaa 18
<210> 160
<211> 23
<212> DNA
<213> Artificial sequence
<400> 160
gtgaagagat gggagtaggc tgt 23
<210> 161
<211> 26
<212> DNA
<213> Artificial sequence
<400> 161
cccatctttt tgttttgtga gggttt 26
<210> 162
<211> 26
<212> DNA
<213> Artificial sequence
<400> 162
ttaaagcagg atatccacat tgcgta 26
<210> 163
<211> 22
<212> DNA
<213> Artificial sequence
<400> 163
ttgctgaaag tccaagagtc ct 22
<210> 164
<211> 23
<212> DNA
<213> Artificial sequence
<400> 164
ggtgagcaat gttcaggaga ttc 23
<210> 165
<211> 22
<212> DNA
<213> Artificial sequence
<400> 165
actactagat ccctggacgc tg 22
<210> 166
<211> 23
<212> DNA
<213> Artificial sequence
<400> 166
ggtggagata agggagtagg ctg 23
<210> 167
<211> 20
<212> DNA
<213> Artificial sequence
<400> 167
tgcccttcca atggatccac 20
<210> 168
<211> 18
<212> DNA
<213> Artificial sequence
<400> 168
gtccccagcc caaccctt 18
<210> 169
<211> 20
<212> DNA
<213> Artificial sequence
<400> 169
ctctggcatt ctgggagctt 20
<210> 170
<211> 22
<212> DNA
<213> Artificial sequence
<400> 170
tggtaggttt tctgggaagg ga 22
<210> 171
<211> 21
<212> DNA
<213> Artificial sequence
<400> 171
tgtcccagaa tgcaagaagc c 21
<210> 172
<211> 24
<212> DNA
<213> Artificial sequence
<400> 172
ggcattgaag tctcatggaa gcca 24
<210> 173
<211> 20
<212> DNA
<213> Artificial sequence
<400> 173
acctccgtca tgtgctgtga 20
<210> 174
<211> 21
<212> DNA
<213> Artificial sequence
<400> 174
ctcaccatcg ctatctgagc a 21
<210> 175
<211> 18
<212> DNA
<213> Artificial sequence
<400> 175
gcaaccagcc ctgtcgtc 18
<210> 176
<211> 21
<212> DNA
<213> Artificial sequence
<400> 176
gcaccaccac actatgtcga a 21
<210> 177
<211> 21
<212> DNA
<213> Artificial sequence
<400> 177
ttaacccctc ctcccagaga c 21
<210> 178
<211> 24
<212> DNA
<213> Artificial sequence
<400> 178
ttccagtgtg atgatggtga ggat 24
<210> 179
<211> 18
<212> DNA
<213> Artificial sequence
<400> 179
cagcaggcca gtgtgcag 18
<210> 180
<211> 18
<212> DNA
<213> Artificial sequence
<400> 180
ccggtctctc ccaggaca 18
<210> 181
<211> 20
<212> DNA
<213> Artificial sequence
<400> 181
gtgaggctcc cctttcttgc 20
<210> 182
<211> 19
<212> DNA
<213> Artificial sequence
<400> 182
tggtctcctc caccgcttc 19
<210> 183
<211> 26
<212> DNA
<213> Artificial sequence
<400> 183
gaaactttcc acttgataag aggtcc 26
<210> 184
<211> 18
<212> DNA
<213> Artificial sequence
<400> 184
ctcccccctg gctccttc 18
<210> 185
<211> 19
<212> DNA
<213> Artificial sequence
<400> 185
ggggagtagg gccaggaag 19
<210> 186
<211> 23
<212> DNA
<213> Artificial sequence
<400> 186
gcccttctgt cttgaacatg agt 23
<210> 187
<211> 18
<212> DNA
<213> Artificial sequence
<400> 187
gtgggaggct gtcagtgg 18
<210> 188
<211> 16
<212> DNA
<213> Artificial sequence
<400> 188
gccacccgga cgcttc 16
<210> 189
<211> 21
<212> DNA
<213> Artificial sequence
<400> 189
caaacgaaac cccacacgaa c 21
<210> 190
<211> 17
<212> DNA
<213> Artificial sequence
<400> 190
gcggagggag cgagttc 17
<210> 191
<211> 20
<212> DNA
<213> Artificial sequence
<400> 191
aacatagtcc ccgctggcta 20
<210> 192
<211> 18
<212> DNA
<213> Artificial sequence
<400> 192
ggagcgctca aacccaca 18
<210> 193
<211> 18
<212> DNA
<213> Artificial sequence
<400> 193
tacaactggc ccgtgtgg 18
<210> 194
<211> 20
<212> DNA
<213> Artificial sequence
<400> 194
gtccttcttc gcctggcatc 20
<210> 195
<211> 17
<212> DNA
<213> Artificial sequence
<400> 195
tgggctggga gaccgtg 17
<210> 196
<211> 19
<212> DNA
<213> Artificial sequence
<400> 196
ccaccggctc ttcaagctc 19
<210> 197
<211> 16
<212> DNA
<213> Artificial sequence
<400> 197
catcgtcgcc gctgca 16
<210> 198
<211> 20
<212> DNA
<213> Artificial sequence
<400> 198
aacgcatagg aggggtggaa 20
<210> 199
<211> 22
<212> DNA
<213> Artificial sequence
<400> 199
cctttgggtt gggagaagaa aa 22
<210> 200
<211> 18
<212> DNA
<213> Artificial sequence
<400> 200
cacccgccgt gtacgttt 18
<210> 201
<211> 20
<212> DNA
<213> Artificial sequence
<400> 201
cggaatcggg gtctaagtgg 20
<210> 202
<211> 18
<212> DNA
<213> Artificial sequence
<400> 202
cctagcgatc agggcacc 18
<210> 203
<211> 20
<212> DNA
<213> Artificial sequence
<400> 203
gatgagagag cagtctgcgt 20
<210> 204
<211> 20
<212> DNA
<213> Artificial sequence
<400> 204
cgttctcgcg ctctgcttac 20
<210> 205
<211> 16
<212> DNA
<213> Artificial sequence
<400> 205
gacccccgct gctcac 16
<210> 206
<211> 17
<212> DNA
<213> Artificial sequence
<400> 206
ccccctaagc cgctgtt 17
<210> 207
<211> 18
<212> DNA
<213> Artificial sequence
<400> 207
ccacacgggc cagttgta 18
<210> 208
<211> 22
<212> DNA
<213> Artificial sequence
<400> 208
tggccgtttt cgaagaggta ga 22
<210> 209
<211> 17
<212> DNA
<213> Artificial sequence
<400> 209
caccgttggg ctggtcc 17
<210> 210
<211> 19
<212> DNA
<213> Artificial sequence
<400> 210
cgagcttgaa gagccggtg 19
<210> 211
<211> 17
<212> DNA
<213> Artificial sequence
<400> 211
cgcccacccg agttcct 17
<210> 212
<211> 16
<212> DNA
<213> Artificial sequence
<400> 212
tggccgggac tggagg 16
<210> 213
<211> 22
<212> DNA
<213> Artificial sequence
<400> 213
ggtaatacgt tccggcactt cg 22
<210> 214
<211> 19
<212> DNA
<213> Artificial sequence
<400> 214
gcccccactt tccaactcc 19
<210> 215
<211> 18
<212> DNA
<213> Artificial sequence
<400> 215
gcggttccga agtccctg 18
<210> 216
<211> 17
<212> DNA
<213> Artificial sequence
<400> 216
ctctccagcc ctcggtg 17
<210> 217
<211> 50
<212> DNA
<213> Artificial sequence
<400> 217
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct 50
<210> 218
<211> 24
<212> DNA
<213> Artificial sequence
<400> 218
caagcagaag acggcatacg agat 24
<210> 219
<211> 28
<212> DNA
<213> Artificial sequence
<400> 219
gtgactggag ttccttggca cccgagaa 33
<210> 220
<211> 38
<212> DNA
<213> Artificial sequence
<400> 220
cttggcaccc gagaattcca ttgttccttg acgcagag 38
<210> 221
<211> 40
<212> DNA
<213> Artificial sequence
<400> 221
cttggcaccc gagaattcca gacctggggt atgagcctga 40
<210> 222
<211> 38
<212> DNA
<213> Artificial sequence
<400> 222
cttggcaccc gagaattcca aggctgaagc tggcgaga 38
<210> 223
<211> 40
<212> DNA
<213> Artificial sequence
<400> 223
cttggcaccc gagaattcca tgaggacgat ggcagagacg 40
<210> 224
<211> 40
<212> DNA
<213> Artificial sequence
<400> 224
cttggcaccc gagaattcca gtacagcgaa ggcagagagt 40
<210> 225
<211> 41
<212> DNA
<213> Artificial sequence
<400> 225
cttggcaccc gagaattcca cacacaggag gaggaaggtg a 41
<210> 226
<211> 39
<212> DNA
<213> Artificial sequence
<400> 226
cttggcaccc gagaattcca tgtgtggaca tgggctgtg 39
<210> 227
<211> 38
<212> DNA
<213> Artificial sequence
<400> 227
cttggcaccc gagaattcca acccaagtca ggggcgaa 38
<210> 228
<211> 44
<212> DNA
<213> Artificial sequence
<400> 228
cttggcaccc gagaattcca gcgtgcaaaa gaaatgccaa gaag 44
<210> 229
<211> 41
<212> DNA
<213> Artificial sequence
<400> 229
cttggcaccc gagaattcca tagtcactgg cagcaacagt c 41
<210> 230
<211> 38
<212> DNA
<213> Artificial sequence
<400> 230
cttggcaccc gagaattcca ctgcaaggcc tcgggaga 38
<210> 231
<211> 41
<212> DNA
<213> Artificial sequence
<400> 231
cttggcaccc gagaattcca attcctggga agtcctcagc t 41
<210> 232
<211> 38
<212> DNA
<213> Artificial sequence
<400> 232
cttggcaccc gagaattcca gcttggagcc aggtgcct 38
<210> 233
<211> 43
<212> DNA
<213> Artificial sequence
<400> 233
cttggcaccc gagaattcca catttcccac cctttctcga cgg 43
<210> 234
<211> 38
<212> DNA
<213> Artificial sequence
<400> 234
cttggcaccc gagaattcca acgggcctgt gtcaagga 38
<210> 235
<211> 38
<212> DNA
<213> Artificial sequence
<400> 235
cttggcaccc gagaattcca atgcgtcctc gggttcgt 38
<210> 236
<211> 38
<212> DNA
<213> Artificial sequence
<400> 236
cttggcaccc gagaattcca agcctaggcc gattcgac 38
<210> 237
<211> 38
<212> DNA
<213> Artificial sequence
<400> 237
cttggcaccc gagaattcca gattcgcggg cacagacg 38
<210> 238
<211> 38
<212> DNA
<213> Artificial sequence
<400> 238
cttggcaccc gagaattcca ttccagctcc gcctcctc 38
<210> 239
<211> 44
<212> DNA
<213> Artificial sequence
<400> 239
cttggcaccc gagaattcca cccatatcgt caatcttctc gagg 44
<210> 240
<211> 45
<212> DNA
<213> Artificial sequence
<400> 240
cttggcaccc gagaattcca tcacagtacc acagagtcta gactc 45
<210> 241
<211> 44
<212> DNA
<213> Artificial sequence
<400> 241
cttggcaccc gagaattcca aacctcttgt cctccaattt gtcc 44
<210> 242
<211> 42
<212> DNA
<213> Artificial sequence
<400> 242
cttggcaccc gagaattcca cctgctgcta tgcctcatct tc 42
<210> 243
<211> 39
<212> DNA
<213> Artificial sequence
<400> 243
cttggcaccc gagaattcca cacgggacca tgcaagacc 39
<210> 244
<211> 42
<212> DNA
<213> Artificial sequence
<400> 244
cttggcaccc gagaattcca tgggctttcg caagattcct at 42
<210> 245
<211> 39
<212> DNA
<213> Artificial sequence
<400> 245
cttggcaccc gagaattcca cgtagggctt tcccccact 39
<210> 246
<211> 51
<212> DNA
<213> Artificial sequence
<400> 246
cttggcaccc gagaattcca cctctattac caattttctt ttgtctttgg g 51
<210> 247
<211> 42
<212> DNA
<213> Artificial sequence
<400> 247
cttggcaccc gagaattcca acacaatgtg gctatcctgc tt 42
<210> 248
<211> 38
<212> DNA
<213> Artificial sequence
<400> 248
cttggcaccc gagaattcca ggcaacggtc aggtctct 38
<210> 249
<211> 43
<212> DNA
<213> Artificial sequence
<400> 249
cttggcaccc gagaattcca ctctgccgat ccatactgcg gaa 43
<210> 250
<211> 42
<212> DNA
<213> Artificial sequence
<400> 250
cttggcaccc gagaattcca cacttccttt ccatggctgc ta 42
<210> 251
<211> 39
<212> DNA
<213> Artificial sequence
<400> 251
cttggcaccc gagaattcca ccgtttggga ctctaccgt 39
<210> 252
<211> 38
<212> DNA
<213> Artificial sequence
<400> 252
cttggcaccc gagaattcca cgtgtgcact tcgcttca 38
<210> 253
<211> 44
<212> DNA
<213> Artificial sequence
<400> 253
cttggcaccc gagaattcca ttgcccaagg tcttacataa gagg 44
<210> 254
<211> 45
<212> DNA
<213> Artificial sequence
<400> 254
cttggcaccc gagaattcca gtttgtttaa ggactgggag gagtt 45
<210> 255
<211> 41
<212> DNA
<213> Artificial sequence
<400> 255
cttggcaccc gagaattcca ggtctgttca ccagcaccat g 41
<210> 256
<211> 38
<212> DNA
<213> Artificial sequence
<400> 256
cttggcaccc gagaattcca ctgtgccttg ggtggctt 38
<210> 257
<211> 47
<212> DNA
<213> Artificial sequence
<400> 257
cttggcaccc gagaattcca ttgccttctg atttctttcc ttctatt 47
<210> 258
<211> 43
<212> DNA
<213> Artificial sequence
<400> 258
cttggcaccc gagaattcca gagtctccgg aacattgttc acc 43
<210> 259
<211> 41
<212> DNA
<213> Artificial sequence
<400> 259
cttggcaccc gagaattcca agttgatgaa tctggccacc t 41
<210> 260
<211> 48
<212> DNA
<213> Artificial sequence
<400> 260
cttggcaccc gagaattcca cagctatgtt aatgttaata tgggccta 48
<210> 261
<211> 46
<212> DNA
<213> Artificial sequence
<400> 261
cttggcaccc gagaattcca tatttggtgt cttttggagt gtggat 46
<210> 262
<211> 41
<212> DNA
<213> Artificial sequence
<400> 262
cttggcaccc gagaattcca tagaggcagg tcccctagaa g 41
<210> 263
<211> 46
<212> DNA
<213> Artificial sequence
<400> 263
cttggcaccc gagaattcca caatgttagt atcccttgga ctcaca 46
<210> 264
<211> 47
<212> DNA
<213> Artificial sequence
<400> 264
cttggcaccc gagaattcca acaggaggac attattgata gatgtca 47
<210> 265
<211> 43
<212> DNA
<213> Artificial sequence
<400> 265
cttggcaccc gagaattcca aaccttacca agtatttgcc ctt 43
<210> 266
<211> 45
<212> DNA
<213> Artificial sequence
<400> 266
cttggcaccc gagaattcca tctgtggaag gctgggattc tatat 45
<210> 267
<211> 42
<212> DNA
<213> Artificial sequence
<400> 267
cttggcaccc gagaattcca gggacaaatc tttctgttcc ca 42
<210> 268
<211> 39
<212> DNA
<213> Artificial sequence
<400> 268
cttggcaccc gagaattcca ggccagaggc aaatcaggt 39
<210> 269
<211> 42
<212> DNA
<213> Artificial sequence
<400> 269
cttggcaccc gagaattcca cagtcaggaa gacagcctac tc 42
<210> 270
<211> 44
<212> DNA
<213> Artificial sequence
<400> 270
cttggcaccc gagaattcca aatactgtct ctgccatatc gtca 44
<210> 271
<211> 42
<212> DNA
<213> Artificial sequence
<400> 271
cttggcaccc gagaattcca gtgtgtttca tgagtgggag ga 42
<210> 272
<211> 44
<212> DNA
<213> Artificial sequence
<400> 272
cttggcaccc gagaattcca tttgccttct gacttctttc cgtc 44
<210> 273
<211> 40
<212> DNA
<213> Artificial sequence
<400> 273
cttggcaccc gagaattcca cacagcactc aggcaagcta 40
<210> 274
<211> 39
<212> DNA
<213> Artificial sequence
<400> 274
cttggcaccc gagaattcca gtcactgcca tggaggagc 39
<210> 275
<211> 40
<212> DNA
<213> Artificial sequence
<400> 275
cttggcaccc gagaattcca ccatgggact gactttctgc 40
<210> 276
<211> 43
<212> DNA
<213> Artificial sequence
<400> 276
cttggcaccc gagaattcca actgctcttt tcacccatct aca 43
<210> 277
<211> 41
<212> DNA
<213> Artificial sequence
<400> 277
cttggcaccc gagaattcca tgtccccgga cgatattgaa c 41
<210> 278
<211> 42
<212> DNA
<213> Artificial sequence
<400> 278
cttggcaccc gagaattcca cagatgaagc tcccagaatg cc 42
<210> 279
<211> 42
<212> DNA
<213> Artificial sequence
<400> 279
cttggcaccc gagaattcca tgtcatcttc tgtcccttcc ca 42
<210> 280
<211> 44
<212> DNA
<213> Artificial sequence
<400> 280
cttggcaccc gagaattcca caactctgtc tccttcctct tcct 44
<210> 281
<211> 39
<212> DNA
<213> Artificial sequence
<400> 281
cttggcaccc gagaattcca tgtgcagctg tgggttgat 39
<210> 282
<211> 42
<212> DNA
<213> Artificial sequence
<400> 282
cttggcaccc gagaattcca caagcagtca cagcacatga cg 42
<210> 283
<211> 43
<212> DNA
<213> Artificial sequence
<400> 283
cttggcaccc gagaattcca cctctgattc ctcactgatt gct 43
<210> 284
<211> 42
<212> DNA
<213> Artificial sequence
<400> 284
cttggcaccc gagaattcca ttgcgtgtgg agtatttgga tg 42
<210> 285
<211> 42
<212> DNA
<213> Artificial sequence
<400> 285
cttggcaccc gagaattcca tcttgggcct gtgttatctc ct 42
<210> 286
<211> 44
<212> DNA
<213> Artificial sequence
<400> 286
cttggcaccc gagaattcca acatgtgtaa cagttcctgc atgg 44
<210> 287
<211> 46
<212> DNA
<213> Artificial sequence
<400> 287
cttggcaccc gagaattcca cttgcttctc ttttcctatc ctgagt 46
<210> 288
<211> 41
<212> DNA
<213> Artificial sequence
<400> 288
cttggcaccc gagaattcca ctttgaggtg cgtgtttgtg c 41
<210> 289
<211> 39
<212> DNA
<213> Artificial sequence
<400> 289
cttggcaccc gagaattcca gcaagaaagg ggagcctca 39
<210> 290
<211> 43
<212> DNA
<213> Artificial sequence
<400> 290
cttggcaccc gagaattcca atcacctttc cttgcctctt tcc 43
<210> 291
<211> 40
<212> DNA
<213> Artificial sequence
<400> 291
cttggcaccc gagaattcca ttctccccct cctctgttgc 40
<210> 292
<211> 41
<212> DNA
<213> Artificial sequence
<400> 292
cttggcaccc gagaattcca cttcgagatg ttccgagagc t 41
<210> 293
<211> 41
<212> DNA
<213> Artificial sequence
<400> 293
cttggcaccc gagaattcca cctccctgct tctgtctcct a 41
<210> 294
<211> 40
<212> DNA
<213> Artificial sequence
<400> 294
cttggcaccc gagaattcca tcagtctacc tcccgccata 40
<210> 295
<211> 40
<212> DNA
<213> Artificial sequence
<400> 295
cttggcaccc gagaattcca gaaacttgct ccgaggtcca 40
<210> 296
<211> 40
<212> DNA
<213> Artificial sequence
<400> 296
cttggcaccc gagaattcca catccagcag ggaatgcagt 40
<210> 297
<211> 44
<212> DNA
<213> Artificial sequence
<400> 297
cttggcaccc gagaattcca gacacgatgc cattgttatc aaga 44
<210> 298
<211> 40
<212> DNA
<213> Artificial sequence
<400> 298
cttggcaccc gagaattcca ctgtctccag gagcagcttc 40
<210> 299
<211> 42
<212> DNA
<213> Artificial sequence
<400> 299
cttggcaccc gagaattcca cggaggtgag tacagaaagt gg 42
<210> 300
<211> 39
<212> DNA
<213> Artificial sequence
<400> 300
cttggcaccc gagaattcca ggaggcagct tgtgacacg 39
<210> 301
<211> 40
<212> DNA
<213> Artificial sequence
<400> 301
cttggcaccc gagaattcca ctcgtccagg atgctctcag 40
<210> 302
<211> 38
<212> DNA
<213> Artificial sequence
<400> 302
cttggcaccc gagaattcca gtggtggacg tggtggtg 38
<210> 303
<211> 44
<212> DNA
<213> Artificial sequence
<400> 303
cttggcaccc gagaattcca tgattttctg gttcttctcc gcat 44
<210> 304
<211> 44
<212> DNA
<213> Artificial sequence
<400> 304
cttggcaccc gagaattcca gaggtatcca catcctcttc ctca 44
<210> 305
<211> 40
<212> DNA
<213> Artificial sequence
<400> 305
cttggcaccc gagaattcca aggacttccc aggaatccag 40
<210> 306
<211> 38
<212> DNA
<213> Artificial sequence
<400> 306
cttggcaccc gagaattcca agctaggagg cccgactt 38
<210> 307
<211> 38
<212> DNA
<213> Artificial sequence
<400> 307
cttggcaccc gagaattcca acaacggcct tgaccctg 38
<210> 308
<211> 43
<212> DNA
<213> Artificial sequence
<400> 308
cttggcaccc gagaattcca ccaccccaaa tctgttaatc acc 43
<210> 309
<211> 40
<212> DNA
<213> Artificial sequence
<400> 309
cttggcaccc gagaattcca aacacttccc cgcgacttgg 40
<210> 310
<211> 38
<212> DNA
<213> Artificial sequence
<400> 310
cttggcaccc gagaattcca cgtgaagggg aggacgga 38
<210> 311
<211> 38
<212> DNA
<213> Artificial sequence
<400> 311
cttggcaccc gagaattcca ggggccatga tgtggagg 38
<210> 312
<211> 38
<212> DNA
<213> Artificial sequence
<400> 312
cttggcaccc gagaattcca aaggtgaagg ggcaggac 38
<210> 313
<211> 38
<212> DNA
<213> Artificial sequence
<400> 313
cttggcaccc gagaattcca gcggaaagga aggggagg 38
<210> 314
<211> 37
<212> DNA
<213> Artificial sequence
<400> 314
cttggcaccc gagaattcca gcagcacctc gcggtag 37
<210> 315
<211> 42
<212> DNA
<213> Artificial sequence
<400> 315
cttggcaccc gagaattcca ggaaagtata ggcccctcac tc 42
<210> 316
<211> 38
<212> DNA
<213> Artificial sequence
<400> 316
cttggcaccc gagaattcca ctctccatgt tcggggca 38
<210> 317
<211> 47
<212> DNA
<213> Artificial sequence
<400> 317
cttggcaccc gagaattcca gaggattctt gtcaacaaga aaaaccc 47
<210> 318
<211> 43
<212> DNA
<213> Artificial sequence
<400> 318
cttggcaccc gagaattcca acaagaggtt ggtgagtgat tgg 43
<210> 319
<211> 46
<212> DNA
<213> Artificial sequence
<400> 319
cttggcaccc gagaattcca gtccagaaga accaacaaga agatga 46
<210> 320
<211> 45
<212> DNA
<213> Artificial sequence
<400> 320
cttggcaccc gagaattcca catagaggtt ccttgagcag gaatc 45
<210> 321
<211> 43
<212> DNA
<213> Artificial sequence
<400> 321
cttggcaccc gagaattcca cactcccata ggaatcttgc gaa 43
<210> 322
<211> 43
<212> DNA
<213> Artificial sequence
<400> 322
cttggcaccc gagaattcca cccccaatac cacatcatcc ata 43
<210> 323
<211> 47
<212> DNA
<213> Artificial sequence
<400> 323
cttggcaccc gagaattcca agggttcaaa tgtataccca aagacaa 47
<210> 324
<211> 48
<212> DNA
<213> Artificial sequence
<400> 324
cttggcaccc gagaattcca agttttagta caatatgttc ttgcggta 48
<210> 325
<211> 41
<212> DNA
<213> Artificial sequence
<400> 325
cttggcaccc gagaattcca cattgtgtaa aaggggcagc a 41
<210> 326
<211> 46
<212> DNA
<213> Artificial sequence
<400> 326
cttggcaccc gagaattcca tgtttacaca gaaaggcctt gtaagt 46
<210> 327
<211> 39
<212> DNA
<213> Artificial sequence
<400> 327
cttggcaccc gagaattcca catgcggcga tggccaata 39
<210> 328
<211> 45
<212> DNA
<213> Artificial sequence
<400> 328
cttggcaccc gagaattcca ttccgagaga ggacaacaga gttgt 45
<210> 329
<211> 41
<212> DNA
<213> Artificial sequence
<400> 329
cttggcaccc gagaattcca gacgggacgt aaacaaagga c 41
<210> 330
<211> 40
<212> DNA
<213> Artificial sequence
<400> 330
cttggcaccc gagaattcca ggagaccgcg taaagagagg 40
<210> 331
<211> 40
<212> DNA
<213> Artificial sequence
<400> 331
cttggcaccc gagaattcca gtgcagaggt gaagcgaagt 40
<210> 332
<211> 45
<212> DNA
<213> Artificial sequence
<400> 332
cttggcaccc gagaattcca tccaagagtc ctcttatgta agacc 45
<210> 333
<211> 43
<212> DNA
<213> Artificial sequence
<400> 333
cttggcaccc gagaattcca caactcctcc cagtccttaa aca 43
<210> 334
<211> 40
<212> DNA
<213> Artificial sequence
<400> 334
cttggcaccc gagaattcca ggtgctggtg aacagaccaa 40
<210> 335
<211> 42
<212> DNA
<213> Artificial sequence
<400> 335
cttggcaccc gagaattcca cttggaggct tgaacagtag ga 42
<210> 336
<211> 45
<212> DNA
<213> Artificial sequence
<400> 336
cttggcaccc gagaattcca aattctttat acgggtcaat gtcca 45
<210> 337
<211> 38
<212> DNA
<213> Artificial sequence
<400> 337
cttggcaccc gagaattcca cagaggcggt gtcgagga 38
<210> 338
<211> 40
<212> DNA
<213> Artificial sequence
<400> 338
cttggcaccc gagaattcca acacagaaca gcttgcctga 40
<210> 339
<211> 44
<212> DNA
<213> Artificial sequence
<400> 339
cttggcaccc gagaattcca ctgggtcttc caaattactt ccca 44
<210> 340
<211> 46
<212> DNA
<213> Artificial sequence
<400> 340
cttggcaccc gagaattcca gtttctcttc caaaggtaag acagga 46
<210> 341
<211> 43
<212> DNA
<213> Artificial sequence
<400> 341
cttggcaccc gagaattcca acctgcctct acgtctaaca aca 43
<210> 342
<211> 47
<212> DNA
<213> Artificial sequence
<400> 342
cttggcaccc gagaattcca ttgtgagtcc aagggatact aacattg 47
<210> 343
<211> 44
<212> DNA
<213> Artificial sequence
<400> 343
cttggcaccc gagaattcca gggagtttgc cactcaggat taaa 44
<210> 344
<211> 47
<212> DNA
<213> Artificial sequence
<400> 344
cttggcaccc gagaattcca gggcaaatac ttggtaaggt taggata 47
<210> 345
<211> 49
<212> DNA
<213> Artificial sequence
<400> 345
cttggcaccc gagaattcca ccttccacag agtatgtaaa taatgccta 49
<210> 346
<211> 42
<212> DNA
<213> Artificial sequence
<400> 346
cttggcaccc gagaattcca ctcccatgct gtagctcttg tt 42
<210> 347
<211> 40
<212> DNA
<213> Artificial sequence
<400> 347
cttggcaccc gagaattcca gctgggtcca actggtgatc 40
<210> 348
<211> 40
<212> DNA
<213> Artificial sequence
<400> 348
cttggcaccc gagaattcca ccccaaaaga ccaccgtgtg 40
<210> 349
<211> 41
<212> DNA
<213> Artificial sequence
<400> 349
cttggcaccc gagaattcca tcttcctgac tgccgattgg t 41
<210> 350
<211> 40
<212> DNA
<213> Artificial sequence
<400> 350
cttggcaccc gagaattcca caagaccttg ggcaggttcc 40
<210> 351
<211> 43
<212> DNA
<213> Artificial sequence
<400> 351
cttggcaccc gagaattcca attctaaggc ttcccgatac aga 43
<210> 352
<211> 46
<212> DNA
<213> Artificial sequence
<400> 352
cttggcaccc gagaattcca acgctggatc ttctaaatta ttaccc 46
<210> 353
<211> 43
<212> DNA
<213> Artificial sequence
<400> 353
cttggcaccc gagaattcca gatccactca cagtttccat agg 43
<210> 354
<211> 40
<212> DNA
<213> Artificial sequence
<400> 354
cttggcaccc gagaattcca cagcccaacc cttgtcctta 40
<210> 355
<211> 41
<212> DNA
<213> Artificial sequence
<400> 355
cttggcaccc gagaattcca tgggagcttc atctggacct g 41
<210> 356
<211> 41
<212> DNA
<213> Artificial sequence
<400> 356
cttggcaccc gagaattcca gaagggacag aagatgacag g 41
<210> 357
<211> 41
<212> DNA
<213> Artificial sequence
<400> 357
cttggcaccc gagaattcca caagaagccc agacggaaac c 41
<210> 358
<211> 38
<212> DNA
<213> Artificial sequence
<400> 358
cttggcaccc gagaattcca cccctcaggg caactgac 38
<210> 359
<211> 44
<212> DNA
<213> Artificial sequence
<400> 359
cttggcaccc gagaattcca gtgctgtgac tgcttgtaga tggc 44
<210> 360
<211> 41
<212> DNA
<213> Artificial sequence
<400> 360
cttggcaccc gagaattcca atctgagcag cgctcatggt g 41
<210> 361
<211> 38
<212> DNA
<213> Artificial sequence
<400> 361
cttggcaccc gagaattcca ccctgtcgtc tctccagc 38
<210> 362
<211> 47
<212> DNA
<213> Artificial sequence
<400> 362
cttggcaccc gagaattcca ctatgtcgaa aagtgtttct gtcatcc 47
<210> 363
<211> 41
<212> DNA
<213> Artificial sequence
<400> 363
cttggcaccc gagaattcca gagaccccag ttgcaaacca g 41
<210> 364
<211> 38
<212> DNA
<213> Artificial sequence
<400> 364
cttggcaccc gagaattcca tgggcctccg gttcatgc 38
<210> 365
<211> 38
<212> DNA
<213> Artificial sequence
<400> 365
cttggcaccc gagaattcca gtgcagggtg gcaagtgg 38
<210> 366
<211> 39
<212> DNA
<213> Artificial sequence
<400> 366
cttggcaccc gagaattcca gacaggcaca aacacgcac 39
<210> 367
<211> 44
<212> DNA
<213> Artificial sequence
<400> 367
cttggcaccc gagaattcca ttcttgcgga gattctcttc ctct 44
<210> 368
<211> 40
<212> DNA
<213> Artificial sequence
<400> 368
cttggcaccc gagaattcca cgcttcttgt cctgcttgct 40
<210> 369
<211> 46
<212> DNA
<213> Artificial sequence
<400> 369
cttggcaccc gagaattcca acttgataag aggtcccaag acttag 46
<210> 370
<211> 38
<212> DNA
<213> Artificial sequence
<400> 370
cttggcaccc gagaattcca agcctgggca tccttgag 38
<210> 371
<211> 38
<212> DNA
<213> Artificial sequence
<400> 371
cttggcaccc gagaattcca caggaagggg ctgaggtc 38
<210> 372
<211> 44
<212> DNA
<213> Artificial sequence
<400> 372
cttggcaccc gagaattcca catgagtttt ttatggcggg aggt 44
<210> 373
<211> 41
<212> DNA
<213> Artificial sequence
<400> 373
cttggcaccc gagaattcca cagtggggaa caagaagtgg a 41
<210> 374
<211> 34
<212> DNA
<213> Artificial sequence
<400> 374
cttggcaccc gagaaggacg cttctacacg cgaa 34
<210> 375
<211> 38
<212> DNA
<213> Artificial sequence
<400> 375
cttggcaccc gagaacacga acgaaaagga acatgtct 38
<210> 376
<211> 32
<212> DNA
<213> Artificial sequence
<400> 376
cttggcaccc gagaacgagt tcgcggcttc gg 32
<210> 377
<211> 31
<212> DNA
<213> Artificial sequence
<400> 377
cttggcaccc gagaacagca gcagcagcgg g 31
<210> 378
<211> 39
<212> DNA
<213> Artificial sequence
<400> 378
cttggcaccc gagaacaaac ccacagggta tctatcagg 39
<210> 379
<211> 32
<212> DNA
<213> Artificial sequence
<400> 379
cttggcaccc gagaagctgg gcgtgcacga tc 32
<210> 380
<211> 32
<212> DNA
<213> Artificial sequence
<400> 380
cttggcaccc gagaacctgg catcgctcac cc 32
<210> 381
<211> 32
<212> DNA
<213> Artificial sequence
<400> 381
cttggcaccc gagaagaccg tggggctgtg ag 32
<210> 382
<211> 35
<212> DNA
<213> Artificial sequence
<400> 382
cttggcaccc gagaactctt caagctcgga atgga 35
<210> 383
<211> 31
<212> DNA
<213> Artificial sequence
<400> 383
cttggcaccc gagaagccgc tgcagacgga t 31
<210> 384
<211> 33
<212> DNA
<213> Artificial sequence
<400> 384
cttggcaccc gagaaaggag gggtggaacc cag 33
<210> 385
<211> 40
<212> DNA
<213> Artificial sequence
<400> 385
cttggcaccc gagaatggga gaagaaaaaa acacacacac 40
<210> 386
<211> 35
<212> DNA
<213> Artificial sequence
<400> 386
cttggcaccc gagaatttcg cgggacaaaa accac 35
<210> 387
<211> 35
<212> DNA
<213> Artificial sequence
<400> 387
cttggcaccc gagaatctaa gtggccaggg cactg 35
<210> 388
<211> 33
<212> DNA
<213> Artificial sequence
<400> 388
cttggcaccc gagaagatca gggcaccttg ggc 33
<210> 389
<211> 32
<212> DNA
<213> Artificial sequence
<400> 389
cttggcaccc gagaactgca acaccgcgag cc 32
<210> 390
<211> 35
<212> DNA
<213> Artificial sequence
<400> 390
cttggcaccc gagaacgctc tgcttacgtg ctgac 35
<210> 391
<211> 31
<212> DNA
<213> Artificial sequence
<400> 391
cttggcaccc gagaagccgc tgcagcagtc c 31
<210> 392
<211> 32
<212> DNA
<213> Artificial sequence
<400> 392
cttggcaccc gagaacgctg ttgccttggc ga 32
<210> 393
<211> 33
<212> DNA
<213> Artificial sequence
<400> 393
cttggcaccc gagaagccag ttgtagggag cga 33
<210> 394
<211> 35
<212> DNA
<213> Artificial sequence
<400> 394
cttggcaccc gagaacgaag aggtagaggc cctcg 35
<210> 395
<211> 32
<212> DNA
<213> Artificial sequence
<400> 395
cttggcaccc gagaagtccg ggctgagcgg at 32
<210> 396
<211> 35
<212> DNA
<213> Artificial sequence
<400> 396
cttggcaccc gagaagccct ccaccacggt tctat 35
<210> 397
<211> 33
<212> DNA
<213> Artificial sequence
<400> 397
cttggcaccc gagaagagtt cctcccagcc agc 33
<210> 398
<211> 34
<212> DNA
<213> Artificial sequence
<400> 398
cttggcaccc gagaagggac tggagggcgt agag 34
<210> 399
<211> 31
<212> DNA
<213> Artificial sequence
<400> 399
cttggcaccc gagaaacttc gcggcggctc a 31
<210> 400
<211> 35
<212> DNA
<213> Artificial sequence
<400> 400
cttggcaccc gagaaccaac tccacggttc ctgc 34
<210> 401
<211> 32
<212> DNA
<213> Artificial sequence
<400> 401
cttggcaccc gagaatgagg gcgaaggcct ga 32
<210> 402
<211> 34
<212> DNA
<213> Artificial sequence
<400> 402
cttggcaccc gagaaggtgg taccgatgag agcg 34
<210> 403
<211> 58
<212> DNA
<213> Artificial sequence
<400> 403
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58
<210> 404
<211> 24
<212> DNA
<213> Artificial sequence
<400> 404
caagcagaag acggcatacg agat 24
<210> 405
<211> 27
<212> DNA
<213> Artificial sequence
<400> 405
gtctcgtggg ctcggagatg tgtataa 27
Claims (15)
- 시퀀싱 라이브러리 구축 방법에 있어서,
(1) DNA 샘플을 취하고 메틸화 감응성 제한 엔도뉴클레아제를 이용해 효소 절단하는 단계;
(2) 단계 (1)에서 효소 절단한 DNA 샘플에 대해 말단 수복 및 3' 말단 A 추가 처리를 순차적으로 수행하는 단계; 및
(3) 단계 (2)에서 처리한 DNA 샘플을 어댑터 혼합물 중의 어댑터와 연결하고, PCR 증폭을 거쳐 라이브러리를 획득하는 단계;를 순차적으로 포함하고,
상기 어댑터 혼합물은 n개 어댑터로 구성되고,
각 어댑터는 하나의 업스트림 프라이머 A와 하나의 다운스트림 프라이머 A에서 부분적인 이중 가닥 구조를 형성하여 획득하고, 업스트림 프라이머 A는 시퀀싱 어댑터 A, 랜덤 태그, 고정 서열 A 및 말단에 위치한 염기 T를 가지며, 다운스트림 프라이머 A는 고정 서열 B 및 시퀀싱 어댑터 B를 가지고, 상기 부분적인 이중 가닥 구조는 고정 서열 A와 고정 서열 B의 역상보에 의해 형성되고,
상기 시퀀싱 어댑터 A와 시퀀싱 어댑터 B는 상이한 시퀀싱 플랫폼에 따라 대응하는 시퀀싱 어댑터를 선택한다.
상기 랜덤 태그는 8-14bp의 랜덤 염기이고,
상기 고정 서열 A의 길이는 12-20bp이고, 연속 반복 염기 수는 ≤3이고,
n개 어댑터는 n개의 상이한 고정 서열 A를 채택하고, 각 고정 서열 A 중 4가지 염기가 균형을 이루며, 미스매치 염기 수는 ≥3이고,
n은 ≥8인 임의 자연수인 시퀀싱 라이브러리 구축 방법. - 제1항에 있어서,
상기 업스트림 프라이머 A는 5' 말단으로부터 순차적으로 상기 시퀀싱 어댑터 A, 상기 랜덤 태그, 상기 고정 서열 A 및 상기 염기 T를 포함하고,
상기 다운스트림 프라이머 A는 5' 말단으로부터 순차적으로 상기 고정 서열 B 및 상기 시퀀싱 어댑터 B를 포함하는 것을 특징으로 하는 구축 방법. - 제1항에 있어서,
상기 미스매치 염기 수 ≥ 3은 상기 어댑터 혼합물에 n개의 고정 서열 A가 포함되고, 각 고정 서열 A 사이의 염기는 적어도 3개가 상이하며, 상기 상이한 것은 위치가 상이하거나 순서가 상이한 것인 것을 특징으로 하는 구축 방법. - 제1항에 있어서,
상기 DNA 샘플은 게놈 DNA, cDNA, ctDNA 또는 cfDNA 샘플인 것을 특징으로 하는 구축 방법. - 제1항 내지 제4항 중 어느 한 항의 방법에 따라 구축된 DNA 라이브러리.
- 제1항 내지 제4항 중 어느 한 항에 따른 어댑터 혼합물 및 메틸화 감응성 제한 엔도뉴클레아제를 포함하는 시퀀싱 라이브러리 구축용 키트.
- DNA 샘플에서 종양 돌연변이 및/또는 메틸화 검출용 키트에 있어서,
제1항 내지 제4항 중 어느 한 항에 따른 어댑터 혼합물과 프라이머 조합을 포함하고,
상기 프라이머 조합은 프라이머 세트 I, 프라이머 세트 II, 프라이머 세트 III, 프라이머 세트 IV, 프라이머 세트 V, 프라이머 세트 VI, 프라이머 세트 VII 및 프라이머 세트 VIII을 포함하고,
상기 프라이머 세트 I 및 상기 프라이머 세트 II의 각 프라이머는 종양 돌연변이와 관련된 영역에 따라 설계된 특이적 프라이머이며, 그 기능은 게놈 특정 위치에 위치하여 표적 영역의 PCR 농축을 구현하는 것이고, 상기 프라이머 세트 I 및 상기 프라이머 세트 II는 각각 DNA 양성 가닥 및 음성 가닥의 돌연변이 부위를 검출하는 데 사용되고,
상기 프라이머 세트 III 및 상기 프라이머 세트 IV의 각 프라이머는 종양 특이적 과메틸화 영역에 따라 설계된 특이적 프라이머이며, 그 기능은 게놈 특정 위치에 위치하여 표적 영역의 PCR 농축을 구현하는 것이고, 상기 프라이머 세트 III 및 상기 프라이머 세트 IV는 각각 DNA 양성 가닥 및 음성 가닥의 메틸화 부위를 검출하는 데 사용되고,
상기 프라이머 세트 V, 상기 프라이머 세트 VI, 상기 프라이머 세트 VII 및 상기 프라이머 세트 VIII의 각 프라이머는 모두 어댑터 서열 및 특이적 서열을 포함하며, 특이적 서열은 표적 영역의 추가적 농축에 사용되고,
상기 프라이머 세트 V와 상기 프라이머 세트 I에서 동일한 돌연변이 부위에 대해 설계된 2개의 프라이머는 "네스티드" 관계에 있고,
상기 프라이머 세트 VI와 상기 프라이머 세트 II에서 동일한 돌연변이 부위에 대해 설계된 2개의 프라이머는 "네스티드" 관계에 있고,
상기 프라이머 세트 VII와 상기 프라이머 세트 III에서 동일한 메틸화 부위에 대해 설계된 2개의 프라이머는 "네스티드" 관계에 있고,
상기 프라이머 세트 VIII와 상기 프라이머 세트 IV에서 동일한 메틸화 부위에 대해 설계된 2개의 프라이머는 "네스티드" 관계에 있는 것을 특징으로 하는 키트. - 제7항에 있어서,
상기 종양은 간 악성 종양인 것을 특징으로 하는 키트. - 제8항에 있어서,
상기 프라이머 세트 I은 78개 단일 가닥 DNA 분자를 포함하고, 78개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 28 내지 105로 표시되고,
상기 프라이머 세트 II은 82개 단일 가닥 DNA 분자를 포함하고, 82개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 106 내지 187로 표시되고,
상기 프라이머 세트 III은 14개 단일 가닥 DNA 분자를 포함하고, 14개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 188 내지 201로 표시되고,
상기 프라이머 세트 IV은 15개 단일 가닥 DNA 분자를 포함하고, 15개 단일 가닥 DNA 분자의 뉴클레오티드 서열은 순차적으로 서열표의 서열 202 내지 216으로 표시되고,
상기 프라이머 세트 V는 75개 단일 가닥 DNA 분자를 포함하고, 75개 단일 가닥 DNA 분자는 서열표의 서열 220 내지 294에서 5' 말단부터 시작해 제16위치 3' 말단으로 표시되는 뉴클레오티드 서열을 순차적으로 포함하고,
상기 프라이머 세트 VI는 79개 단일 가닥 DNA 분자를 포함하고, 79개 단일 가닥 DNA 분자는 서열표의 서열 295 내지 373에서 5' 말단부터 시작해 제16위치 3' 말단으로 표시되는 뉴클레오티드 서열을 순차적으로 포함하고,
상기 프라이머 세트 VII는 14개 단일 가닥 DNA 분자를 포함하고, 14개 단일 가닥 DNA 분자는 서열표의 서열 374 내지 387에서 5' 말단부터 시작해 제16위치 3' 말단으로 표시되는 뉴클레오티드 서열을 순차적으로 포함하고,
상기 프라이머 세트 VIII는 15개 단일 가닥 DNA 분자를 포함하고, 15개 단일 가닥 DNA 분자는 서열표의 서열 388 내지 402에서 5' 말단부터 시작해 제16위치 3' 말단으로 표시되는 뉴클레오티드 서열을 순차적으로 포함하는 것을 특징으로 하는 키트. - 제7항 내지 제9항 중 어느 한 항의 프라이머 조합.
- S1) 또는 S2) 또는 S3)에 있어서,
S1) DNA 샘플에서 종양 돌연변이 및/또는 메틸화 검출용 키트의 제조에서 제7항 내지 제9항 중 어느 한 항에 따른 프라이머 조합의 응용이고,
S2) 종양 환자 혈액 샘플 및 비종양 환자 혈액 샘플 구분에서 제7항 내지 제9항 중 어느 한 항에 따른 프라이머 조합의 응용이고,
S3) 종양 환자 혈액 샘플 및 비종양 환자 혈액 샘플 구분에서 제7항 내지 제9항 중 어느 한 항에 따른 키트의 응용인 S1) 또는 S2) 또는 S3). - DNA 샘플에서 표적 돌연변이 및/또는 메틸화를 검출하는 방법에 있어서,
(1) 제1항 내지 제4항 중 어느 한 항의 방법에 따라 라이브러리를 구축하는 단계; 및
(2) 단계 (1)에서 획득한 라이브러리에 대해 두 번의 네스티드 PCR 증폭을 수행하고, 생성물을 시퀀싱하며, 시퀀싱 결과에 따라 DNA 샘플 중 표적 돌연변이 및/또는 메틸화 발생 상황을 분석하는 단계를 포함하고,
상기 단계 (2)에서는 프라이머 조합 A를 채택하여 1차 PCR 증폭을 수행하고,
프라이머 조합 A는 업스트림 프라이머 A와 다운스트림 프라이머 조합 A로 구성되고,
상기 업스트림 프라이머 A는 단계 (1)의 라이브러리 증폭에 사용되는 라이브러리 증폭 프라이머이고,
상기 다운스트림 프라이머 조합 A는 X개 표적 부위에 따라 설계된 Y개 프라이머의 조합이며, X와 Y는 모두 1 이상의 자연수이고, X≤Y이고,
1차 PCR의 생성물을 템플릿으로 사용하고, 프라이머 조합 B를 채택해 2차 PCR 증폭을 수행하고,
프라이머 조합 B는 업스트림 프라이머 B, 다운스트림 프라이머 조합 B 및 인덱스 프라이머로 구성되고,
상기 업스트림 프라이머 B는 라이브러리 증폭 프라이머이고 3' 말단은 상기 업스트림 프라이머 A 부분과 동일하며, 1차 PCR 생성물의 증폭에 사용되고,
상기 index 프라이머는 5' 말단으로부터 시퀀싱을 위한 세그먼트 A, 샘플을 구분하기 위한 index 서열 및 시퀀싱을 위한 세그먼트 B를 포함하고,
상기 다운스트림 프라이머 세트 B의 프라이머는 상기 세그먼트 B를 가지며 다운스트림 프라이머 조합 A 중 동일한 표적을 검출하는 프라이머와 네스티드 관계를 형성하는 것을 특징으로 하는 방법. - 제12항에 있어서,
상기 DNA 샘플에서 표적 돌연변이의 분석 방법은, 시퀀싱 데이터가 기준 A를 충족하는 DNA 분자를 하나의 분자 클러스터로 되돌리고, 기준 B를 충족하는 분자 클러스터를 한 쌍의 duplex 분자 클러스터로 표시하는 것이며, 특정 돌연변이의 경우, (a1) 적어도 한 쌍의 duplex 분자 클러스터가 지원되는 조건, 또는 (a2) 적어도 4개 분자 클러스터가 지원되는 조건이 충족되면, 상기 돌연변이는 원래 DNA 샘플 유래의 진정한 돌연변이이고, 기준 A는 ① DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, ② 랜덤 태그 서열이 동일한 조건, 및 ③ 고정 서열이 동일한 조건을 동시에 충족하고, 기준 B는 ④ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, 및 ⑤ 분자 클러스터 양단의 고정 서열이 동일하나 위치는 반대인 조건을 동시에 충족하고,
상기 DNA 샘플에서 메틸화의 분석 방법은, 시퀀싱 데이터가 기준 C를 충족하는 DNA 분자를 하나의 클러스터로 표시하고, 단편 말단이 관심 효소 절단 부위인 클러스터의 수량을 각각 계산하여, 비메틸화된 단편으로 기록하고, 증폭 단편이 제1 효소 절단 부위에 도달 또는 초과하는 모든 클러스터의 수량을 계산하여 단편 총 수로 기록하고, 두 가지 단편 수량에 따라 대응 영역의 평균 메틸화 수준을 계산하는 것이고, 영역의 메틸화 수준 = (1 - 비메틸화 단편 수/단편 총 수) × 100%이고, 기준 C는 ⑦ 랜덤 태그 서열이 동일한 조건, ⑧ 고정 서열이 동일한 조건, 및 ⑨ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건을 동시에 충족하는 것을 특징으로 하는 방법. - DNA 샘플에서 다양한 표적 돌연변이 및/또는 메틸화를 검출하는 방법에 있어서,
(1) 제1항 내지 제4항 중 어느 한 항의 방법에 따라 라이브러리를 구축하는 단계; 및
(2) 단계 (1)의 라이브러리에 대해 표적 영역 농축 및 시퀀싱을 수행하며, 시퀀싱 결과에 따라 DNA 샘플 중 표적 돌연변이 및/또는 메틸화의 발생 상황을 분석하는 단계를 포함하는 방법. - 제14항에 있어서,
상기 DNA 샘플에서 표적 돌연변이의 분석 방법은, 시퀀싱 데이터가 기준 A를 충족하는 DNA 분자를 하나의 분자 클러스터로 되돌리고, 기준 B를 충족하는 분자 클러스터를 한 쌍의 duplex 분자 클러스터로 표시하는 것이며, 특정 돌연변이의 경우, (a1) 적어도 한 쌍의 duplex 분자 클러스터가 지원되는 조건, 또는 (a2) 적어도 4개 분자 클러스터가 지원되는 조건이 충족되면, 상기 돌연변이는 원래 DNA 샘플 유래의 진정한 돌연변이이고, 기준 A는 ① DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, ② 랜덤 태그 서열이 동일한 조건, 및 ③ 고정 서열이 동일한 조건을 동시에 충족하고, 기준 B는 ④ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건, 및 ⑤ 분자 클러스터 양단의 고정 서열이 동일하나 위치는 반대인 조건을 동시에 충족하고, 상기 DNA 샘플에서 메틸화의 분석 방법은, 시퀀싱 데이터가 기준 C를 충족하는 DNA 분자를 하나의 클러스터로 표시하고, 단편 말단이 관심 효소 절단 부위인 클러스터의 수량을 각각 계산하여, 비메틸화된 단편으로 기록하고, 증폭 단편이 제1 효소 절단 부위에 도달 또는 초과하는 모든 클러스터의 수량을 계산하여 단편 총 수로 기록하고, 두 가지 단편 수량에 따라 대응 영역의 평균 메틸화 수준을 계산하는 것이고, 영역의 메틸화 수준 = (1 - 비메틸화 단편 수/단편 총 수) × 100%이고, 기준 C는 ⑥ 랜덤 태그 서열이 동일한 조건, ⑦ 고정 서열이 동일한 조건, 및 ⑧ DNA 삽입 단편 길이가 동일하고 돌연변이 부위를 제외한 서열이 일치하는 조건을 동시에 충족하는 것을 특징으로 하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910983038.8 | 2019-10-16 | ||
CN201910983038.8A CN112176419B (zh) | 2019-10-16 | 2019-10-16 | 一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法 |
PCT/CN2020/120560 WO2021073490A1 (zh) | 2019-10-16 | 2020-10-13 | 一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220088724A true KR20220088724A (ko) | 2022-06-28 |
Family
ID=73919743
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227016270A KR20220088724A (ko) | 2019-10-16 | 2020-10-13 | ctDNA에서 종양 특이적 유전자의 돌연변이 및 메틸화를 검출하는 방법 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230272475A1 (ko) |
EP (1) | EP4023795A4 (ko) |
JP (1) | JP2022551688A (ko) |
KR (1) | KR20220088724A (ko) |
CN (1) | CN112176419B (ko) |
WO (1) | WO2021073490A1 (ko) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112397150B (zh) * | 2021-01-20 | 2021-04-20 | 臻和(北京)生物科技有限公司 | 基于目标区域捕获测序的ctDNA甲基化水平预测装置及方法 |
CN112852934B (zh) * | 2021-04-16 | 2022-02-18 | 武汉友芝友医疗科技股份有限公司 | 检测基因甲基化的引物、试剂和试剂盒 |
CN113674802B (zh) * | 2021-08-20 | 2022-09-09 | 深圳吉因加医学检验实验室 | 一种基于甲基化测序数据进行变异检测的方法及装置 |
CN113718034A (zh) * | 2021-09-27 | 2021-11-30 | 中国医学科学院肿瘤医院 | 一种指导卵巢癌铂耐药患者用药及疗效评估的标志物、检测试剂盒及检测方法 |
CN115896238A (zh) * | 2021-09-30 | 2023-04-04 | 中国医学科学院肿瘤医院 | 一种个体化检测胃癌患者腹腔微小转移灶预测腹膜转移的方法 |
CN114093428B (zh) * | 2021-11-08 | 2023-04-14 | 南京世和基因生物技术股份有限公司 | 一种ctDNA超高测序深度下低丰度突变的检测系统和方法 |
CN115410649B (zh) * | 2022-04-01 | 2023-03-28 | 北京吉因加医学检验实验室有限公司 | 一种同时检测甲基化和突变信息的方法及装置 |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6150112A (en) * | 1998-09-18 | 2000-11-21 | Yale University | Methods for identifying DNA sequences for use in comparison of DNA samples by their lack of polymorphism using Y shape adaptors |
AU2003903430A0 (en) * | 2003-07-04 | 2003-07-17 | Johnson & Johnson Research Pty Limited | Method for detection of alkylated cytosine in dna |
CA2559209C (en) * | 2004-03-08 | 2016-06-07 | Rubicon Genomics, Inc. | Methods and compositions for generating and amplifying dna libraries for sensitive detection and analysis of dna methylation |
KR20140040697A (ko) * | 2011-01-14 | 2014-04-03 | 키진 엔.브이. | 쌍 말단 무작위 서열 기반 유전자형 판별 |
CN102877136B (zh) * | 2012-09-24 | 2014-03-12 | 上海交通大学 | 基于基因组简化与二代测序dna文库构建方法及试剂盒 |
CN102943074B (zh) * | 2012-10-25 | 2015-01-07 | 盛司潼 | 一种接头和构建测序文库的方法 |
MA39951A (fr) * | 2014-05-09 | 2017-03-15 | Lifecodexx Ag | Détection de l'adn provenant d'un type spécifique de cellule et méthodes associées |
US11085084B2 (en) * | 2014-09-12 | 2021-08-10 | The Board Of Trustees Of The Leland Stanford Junior University | Identification and use of circulating nucleic acids |
JP6807873B2 (ja) * | 2015-02-24 | 2021-01-13 | ルプレクト−カールズ−ウニベルシタット ハイデルベルク | 癌の検出のためのバイオマーカーパネル |
CN109072294A (zh) * | 2015-12-08 | 2018-12-21 | 特温斯特兰德生物科学有限公司 | 用于双重测序的改良衔接子、方法和组合物 |
JP7481804B2 (ja) * | 2016-04-14 | 2024-05-13 | マヨ ファウンデーション フォア メディカル エデュケーション アンド リサーチ | 高度膵異形成の検出 |
US20190085406A1 (en) * | 2016-04-14 | 2019-03-21 | Guardant Health, Inc. | Methods for early detection of cancer |
US11566284B2 (en) * | 2016-08-10 | 2023-01-31 | Grail, Llc | Methods of preparing dual-indexed DNA libraries for bisulfite conversion sequencing |
CN107723352A (zh) * | 2016-08-12 | 2018-02-23 | 嘉兴允英医学检验有限公司 | 一种循环肿瘤dna肝癌驱动基因高通量检测方法 |
CN116064795A (zh) * | 2016-09-02 | 2023-05-05 | 梅约医学教育与研究基金会 | 确定差异甲基化区域的甲基化状态的方法和试剂盒 |
GB201615486D0 (en) * | 2016-09-13 | 2016-10-26 | Inivata Ltd | Methods for labelling nucleic acids |
CN106497920A (zh) * | 2016-11-21 | 2017-03-15 | 深圳华大基因研究院 | 一种用于非小细胞肺癌基因突变检测的文库构建方法及试剂盒 |
KR102479432B1 (ko) * | 2016-12-12 | 2022-12-20 | 세페이드 | 자동화 반응 카트리지에서 DNA 메틸화의 통합 정제 및 측정 및 돌연변이 및/또는 mRNA 발현도의 동시 측정 |
EP3583214B1 (en) * | 2017-02-02 | 2023-11-22 | New York Genome Center, Inc. | Methods and compositions for identifying or quantifying targets in a biological sample |
CA3068446A1 (en) * | 2017-06-30 | 2019-01-02 | The Regents Of The University Of California | Methods and systems for evaluating dna methylation in cell-free dna |
WO2019099420A1 (en) * | 2017-11-15 | 2019-05-23 | Yan Wang | A method for detecting multiple dna mutations and copy number variations |
CN108103060A (zh) * | 2017-12-27 | 2018-06-01 | 广州赛哲生物科技股份有限公司 | ctDNA甲基化建库的标签接头、引物组、试剂盒和建库方法 |
EP3527673A1 (en) * | 2018-02-15 | 2019-08-21 | QIAGEN GmbH | Sequencing method |
CN108893466B (zh) * | 2018-06-04 | 2021-04-13 | 上海奥根诊断技术有限公司 | 测序接头、测序接头组和超低频突变的检测方法 |
CN110669823B (zh) * | 2018-07-03 | 2022-05-24 | 中国医学科学院肿瘤医院 | 一种同时检测多种肝癌常见突变的ctDNA文库构建和测序数据分析方法 |
AU2020254760A1 (en) * | 2019-04-03 | 2021-10-28 | Exact Sciences Corporation | Detecting pancreatic ductal adenocarcinoma in plasma |
CN110904225B (zh) * | 2019-11-19 | 2022-04-12 | 中国医学科学院肿瘤医院 | 用于肝癌检测的组合标志物及其应用 |
-
2019
- 2019-10-16 CN CN201910983038.8A patent/CN112176419B/zh active Active
-
2020
- 2020-10-13 KR KR1020227016270A patent/KR20220088724A/ko not_active Application Discontinuation
- 2020-10-13 EP EP20876690.7A patent/EP4023795A4/en active Pending
- 2020-10-13 US US17/768,891 patent/US20230272475A1/en active Pending
- 2020-10-13 JP JP2022521219A patent/JP2022551688A/ja active Pending
- 2020-10-13 WO PCT/CN2020/120560 patent/WO2021073490A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
JP2022551688A (ja) | 2022-12-13 |
EP4023795A1 (en) | 2022-07-06 |
US20230272475A1 (en) | 2023-08-31 |
CN112176419B (zh) | 2022-03-22 |
WO2021073490A1 (zh) | 2021-04-22 |
CN112176419A (zh) | 2021-01-05 |
EP4023795A4 (en) | 2023-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20220088724A (ko) | ctDNA에서 종양 특이적 유전자의 돌연변이 및 메틸화를 검출하는 방법 | |
KR102359767B1 (ko) | 무-세포 메틸화된 dna의 포획 방법 및 이의 이용 | |
KR101569498B1 (ko) | 위용종 및 위암 특이적 메틸화 마커 유전자를 이용한 위용종 및 위암의 검출방법 | |
KR102547995B1 (ko) | 다양한 간암 일반 돌연변이를 동시에 검출하는 ctDNA 라이브러리 제작 및 시퀀싱 데이터 분석 방법 | |
JP6968894B2 (ja) | メチル化dnaの多重検出方法 | |
KR20160096632A (ko) | 핵산의 다중 검출 | |
CN104350161A (zh) | 用于核酸分子中的敏感突变检测的组合物和方法 | |
KR20160096633A (ko) | 핵산 프로브 및 게놈 단편을 검출하는 방법 | |
CN106834515A (zh) | 一种检测met基因14外显子突变的探针库、检测方法和试剂盒 | |
CN109837273A (zh) | 一种crispr辅助dna靶向富集方法及其应用 | |
JP2020536525A (ja) | プローブ及びこれをハイスループットシーケンシングに適用するターゲット領域の濃縮方法 | |
CN109182454A (zh) | 一种捕获基因组特定dna片段的方法 | |
CN111690748B (zh) | 使用高通量测序检测微卫星不稳定的探针组、试剂盒及微卫星不稳定的检测方法 | |
WO2021018127A1 (zh) | 一种建库方法及应用 | |
CN111020019B (zh) | 基于纳米孔技术进行基因融合检测的方法 | |
CN115851921B (zh) | 引物探针组合产品、试剂盒及其在鼻咽癌甲基化检测中的应用 | |
KR20220157325A (ko) | 캡쳐 프로브 및 이의 용도 | |
CN109750098B (zh) | Atp7b基因大片段缺失检测试剂盒及检测方法 | |
CN109762901B (zh) | 用于富集低频dna突变的dna探针应用于多种突变的同时检测 | |
CN112063690A (zh) | 单分子探针多重靶向捕获文库的构建方法及应用 | |
CN112266963A (zh) | 一种联合检测慢性粒细胞白血病检测试剂盒 | |
KR102604416B1 (ko) | 가이드 rna를 이용한 유전자 분석 방법 | |
WO2022066844A1 (en) | Compositions and methods for preserving dna methylation | |
AU2021281223A1 (en) | Compositions and methods for preserving DNA methylation | |
CN113215163A (zh) | 一种特异性扩增目的基因的分子锁及应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal |