JP2024529674A - 同時での変異検出およびメチル化分析のための方法 - Google Patents
同時での変異検出およびメチル化分析のための方法 Download PDFInfo
- Publication number
- JP2024529674A JP2024529674A JP2024508357A JP2024508357A JP2024529674A JP 2024529674 A JP2024529674 A JP 2024529674A JP 2024508357 A JP2024508357 A JP 2024508357A JP 2024508357 A JP2024508357 A JP 2024508357A JP 2024529674 A JP2024529674 A JP 2024529674A
- Authority
- JP
- Japan
- Prior art keywords
- double
- watson
- stranded
- primer
- strand
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 146
- 230000035772 mutation Effects 0.000 title claims description 118
- 230000011987 methylation Effects 0.000 title claims description 94
- 238000007069 methylation reaction Methods 0.000 title claims description 94
- 238000004458 analytical method Methods 0.000 title claims description 27
- 238000001514 detection method Methods 0.000 title description 7
- 108020004414 DNA Proteins 0.000 claims abstract description 359
- 102000053602 DNA Human genes 0.000 claims abstract description 337
- 239000012634 fragment Substances 0.000 claims abstract description 150
- 230000001973 epigenetic effect Effects 0.000 claims abstract description 64
- 230000002068 genetic effect Effects 0.000 claims abstract description 55
- 238000012163 sequencing technique Methods 0.000 claims description 242
- 239000012491 analyte Substances 0.000 claims description 116
- 239000011324 bead Substances 0.000 claims description 52
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical group O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 46
- 210000001519 tissue Anatomy 0.000 claims description 37
- 230000000295 complement effect Effects 0.000 claims description 33
- 238000004925 denaturation Methods 0.000 claims description 27
- 230000036425 denaturation Effects 0.000 claims description 27
- 230000004048 modification Effects 0.000 claims description 25
- 238000012986 modification Methods 0.000 claims description 25
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 claims description 24
- 238000007031 hydroxymethylation reaction Methods 0.000 claims description 23
- 229940035893 uracil Drugs 0.000 claims description 23
- 108010033040 Histones Proteins 0.000 claims description 21
- 108700011259 MicroRNAs Proteins 0.000 claims description 21
- 230000021736 acetylation Effects 0.000 claims description 21
- 238000006640 acetylation reaction Methods 0.000 claims description 21
- 230000033228 biological regulation Effects 0.000 claims description 21
- 239000002679 microRNA Substances 0.000 claims description 21
- 230000026731 phosphorylation Effects 0.000 claims description 21
- 238000006366 phosphorylation reaction Methods 0.000 claims description 21
- 230000010741 sumoylation Effects 0.000 claims description 21
- 230000034512 ubiquitination Effects 0.000 claims description 21
- 238000010798 ubiquitination Methods 0.000 claims description 21
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 19
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 claims description 16
- 238000003780 insertion Methods 0.000 claims description 14
- 230000002441 reversible effect Effects 0.000 claims description 13
- 210000004185 liver Anatomy 0.000 claims description 12
- 210000001072 colon Anatomy 0.000 claims description 9
- 229940104302 cytosine Drugs 0.000 claims description 9
- 210000004072 lung Anatomy 0.000 claims description 9
- 210000000496 pancreas Anatomy 0.000 claims description 9
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 8
- 238000001369 bisulfite sequencing Methods 0.000 claims description 8
- 210000000013 bile duct Anatomy 0.000 claims description 7
- 210000000481 breast Anatomy 0.000 claims description 7
- 210000003679 cervix uteri Anatomy 0.000 claims description 7
- 238000003508 chemical denaturation Methods 0.000 claims description 7
- 238000012217 deletion Methods 0.000 claims description 7
- 230000037430 deletion Effects 0.000 claims description 7
- 230000037433 frameshift Effects 0.000 claims description 7
- 210000000232 gallbladder Anatomy 0.000 claims description 7
- 210000003128 head Anatomy 0.000 claims description 7
- 230000011132 hemopoiesis Effects 0.000 claims description 7
- 230000037431 insertion Effects 0.000 claims description 7
- 210000003734 kidney Anatomy 0.000 claims description 7
- 208000019420 lymphoid neoplasm Diseases 0.000 claims description 7
- 201000001441 melanoma Diseases 0.000 claims description 7
- 201000000050 myeloid neoplasm Diseases 0.000 claims description 7
- 210000003739 neck Anatomy 0.000 claims description 7
- 210000001672 ovary Anatomy 0.000 claims description 7
- 210000002307 prostate Anatomy 0.000 claims description 7
- 210000000664 rectum Anatomy 0.000 claims description 7
- 238000006467 substitution reaction Methods 0.000 claims description 7
- 210000001685 thyroid gland Anatomy 0.000 claims description 7
- 230000005945 translocation Effects 0.000 claims description 7
- 210000003741 urothelium Anatomy 0.000 claims description 7
- 210000004291 uterus Anatomy 0.000 claims description 7
- 210000000436 anus Anatomy 0.000 claims description 6
- 208000036878 aneuploidy Diseases 0.000 claims description 5
- 231100001075 aneuploidy Toxicity 0.000 claims description 5
- 239000013615 primer Substances 0.000 description 374
- 150000007523 nucleic acids Chemical class 0.000 description 215
- 230000003321 amplification Effects 0.000 description 197
- 238000003199 nucleic acid amplification method Methods 0.000 description 197
- 102000039446 nucleic acids Human genes 0.000 description 160
- 108020004707 nucleic acids Proteins 0.000 description 160
- 239000000047 product Substances 0.000 description 155
- 238000012408 PCR amplification Methods 0.000 description 139
- 239000000523 sample Substances 0.000 description 59
- 125000003729 nucleotide group Chemical group 0.000 description 54
- 239000002773 nucleotide Substances 0.000 description 50
- 239000012071 phase Substances 0.000 description 44
- 238000003752 polymerase chain reaction Methods 0.000 description 36
- 102000040430 polynucleotide Human genes 0.000 description 33
- 108091033319 polynucleotide Proteins 0.000 description 33
- 239000002157 polynucleotide Substances 0.000 description 33
- 210000002381 plasma Anatomy 0.000 description 22
- 108010090804 Streptavidin Proteins 0.000 description 20
- 239000012472 biological sample Substances 0.000 description 20
- 238000006243 chemical reaction Methods 0.000 description 19
- 108091028043 Nucleic acid sequence Proteins 0.000 description 16
- 238000000137 annealing Methods 0.000 description 16
- 239000000463 material Substances 0.000 description 14
- 230000008995 epigenetic change Effects 0.000 description 13
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 12
- 238000007481 next generation sequencing Methods 0.000 description 12
- 239000007787 solid Substances 0.000 description 11
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 10
- 101000721661 Homo sapiens Cellular tumor antigen p53 Proteins 0.000 description 10
- 210000004027 cell Anatomy 0.000 description 10
- 108091093088 Amplicon Proteins 0.000 description 9
- 230000027455 binding Effects 0.000 description 9
- 108060002716 Exonuclease Proteins 0.000 description 8
- 229960002685 biotin Drugs 0.000 description 8
- 239000011616 biotin Substances 0.000 description 8
- 102000013165 exonuclease Human genes 0.000 description 8
- 238000007857 nested PCR Methods 0.000 description 8
- 229920001184 polypeptide Polymers 0.000 description 8
- 102000004196 processed proteins & peptides Human genes 0.000 description 8
- 108090000765 processed proteins & peptides Proteins 0.000 description 8
- 238000010008 shearing Methods 0.000 description 8
- 108091029523 CpG island Proteins 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 7
- 108090000790 Enzymes Proteins 0.000 description 7
- 206010028980 Neoplasm Diseases 0.000 description 7
- 239000007788 liquid Substances 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 7
- 229920002477 rna polymer Polymers 0.000 description 7
- 235000020958 biotin Nutrition 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 108090000623 proteins and genes Proteins 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 239000000356 contaminant Substances 0.000 description 5
- 230000037452 priming Effects 0.000 description 5
- 102000005962 receptors Human genes 0.000 description 5
- 108020003175 receptors Proteins 0.000 description 5
- 108090001008 Avidin Proteins 0.000 description 4
- 102000036365 BRCA1 Human genes 0.000 description 4
- 108700020463 BRCA1 Proteins 0.000 description 4
- 108091061744 Cell-free fetal DNA Proteins 0.000 description 4
- 108091029430 CpG site Proteins 0.000 description 4
- 102100032543 Phosphatidylinositol 3,4,5-trisphosphate 3-phosphatase and dual-specificity protein phosphatase PTEN Human genes 0.000 description 4
- 101710132081 Phosphatidylinositol 3,4,5-trisphosphate 3-phosphatase and dual-specificity protein phosphatase PTEN Proteins 0.000 description 4
- 108091081021 Sense strand Proteins 0.000 description 4
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 4
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 4
- 230000000692 anti-sense effect Effects 0.000 description 4
- 150000001720 carbohydrates Chemical class 0.000 description 4
- 238000011109 contamination Methods 0.000 description 4
- 238000012350 deep sequencing Methods 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 238000003505 heat denaturation Methods 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 3
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 3
- 101710163270 Nuclease Proteins 0.000 description 3
- 210000001744 T-lymphocyte Anatomy 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 239000005547 deoxyribonucleotide Substances 0.000 description 3
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 3
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 239000003446 ligand Substances 0.000 description 3
- 210000004698 lymphocyte Anatomy 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 210000000440 neutrophil Anatomy 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- CUERSNZXAITQPB-UHFFFAOYSA-N 4-amino-2-oxo-5,6-dihydro-1h-pyrimidin-3-ium-6-sulfonate Chemical compound NC1=[NH+]C(=O)NC(S([O-])(=O)=O)C1 CUERSNZXAITQPB-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 206010069754 Acquired gene mutation Diseases 0.000 description 2
- 102000052609 BRCA2 Human genes 0.000 description 2
- 108700020462 BRCA2 Proteins 0.000 description 2
- 101150008921 Brca2 gene Proteins 0.000 description 2
- 102100028914 Catenin beta-1 Human genes 0.000 description 2
- 108010009392 Cyclin-Dependent Kinase Inhibitor p16 Proteins 0.000 description 2
- 230000007067 DNA methylation Effects 0.000 description 2
- 230000030933 DNA methylation on cytosine Effects 0.000 description 2
- 102000004099 Deoxyribonuclease (Pyrimidine Dimer) Human genes 0.000 description 2
- 108010082610 Deoxyribonuclease (Pyrimidine Dimer) Proteins 0.000 description 2
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 2
- 102100031780 Endonuclease Human genes 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 102100028138 F-box/WD repeat-containing protein 7 Human genes 0.000 description 2
- 101710105178 F-box/WD repeat-containing protein 7 Proteins 0.000 description 2
- 102100023600 Fibroblast growth factor receptor 2 Human genes 0.000 description 2
- 101710182389 Fibroblast growth factor receptor 2 Proteins 0.000 description 2
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 2
- 102100029974 GTPase HRas Human genes 0.000 description 2
- 102100039788 GTPase NRas Human genes 0.000 description 2
- 102100032610 Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Human genes 0.000 description 2
- 101000916173 Homo sapiens Catenin beta-1 Proteins 0.000 description 2
- 101000584633 Homo sapiens GTPase HRas Proteins 0.000 description 2
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 description 2
- 101001014590 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Proteins 0.000 description 2
- 101001014594 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms short Proteins 0.000 description 2
- 101001014610 Homo sapiens Neuroendocrine secretory protein 55 Proteins 0.000 description 2
- 101000605639 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Proteins 0.000 description 2
- 101000779418 Homo sapiens RAC-alpha serine/threonine-protein kinase Proteins 0.000 description 2
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 2
- 101000783404 Homo sapiens Serine/threonine-protein phosphatase 2A 65 kDa regulatory subunit A alpha isoform Proteins 0.000 description 2
- 101000648539 Homo sapiens Transmembrane protein 59-like Proteins 0.000 description 2
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 2
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 102000004856 Lectins Human genes 0.000 description 2
- 108090001090 Lectins Proteins 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 239000004793 Polystyrene Substances 0.000 description 2
- 206010036790 Productive cough Diseases 0.000 description 2
- 102100033810 RAC-alpha serine/threonine-protein kinase Human genes 0.000 description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 2
- 229920002684 Sepharose Polymers 0.000 description 2
- 102100028863 Transmembrane protein 59-like Human genes 0.000 description 2
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 2
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 2
- 210000004100 adrenal gland Anatomy 0.000 description 2
- 125000003275 alpha amino acid group Chemical group 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 210000003567 ascitic fluid Anatomy 0.000 description 2
- 210000003719 b-lymphocyte Anatomy 0.000 description 2
- 102000023732 binding proteins Human genes 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000032823 cell division Effects 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000009615 deamination Effects 0.000 description 2
- 238000006481 deamination reaction Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000006209 dephosphorylation reaction Methods 0.000 description 2
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 2
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 2
- 150000002016 disaccharides Chemical class 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 2
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 2
- 210000003238 esophagus Anatomy 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 150000004676 glycans Chemical class 0.000 description 2
- 210000002216 heart Anatomy 0.000 description 2
- 125000000623 heterocyclic group Chemical group 0.000 description 2
- 230000003301 hydrolyzing effect Effects 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 238000007852 inverse PCR Methods 0.000 description 2
- 239000002523 lectin Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 150000002772 monosaccharides Chemical class 0.000 description 2
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 229920002223 polystyrene Polymers 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 150000003212 purines Chemical class 0.000 description 2
- 150000003230 pyrimidines Chemical class 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 210000003296 saliva Anatomy 0.000 description 2
- 210000000582 semen Anatomy 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 239000000377 silicon dioxide Substances 0.000 description 2
- 210000000813 small intestine Anatomy 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 230000037439 somatic mutation Effects 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 210000003802 sputum Anatomy 0.000 description 2
- 208000024794 sputum Diseases 0.000 description 2
- BDHFUVZGWQCTTF-UHFFFAOYSA-M sulfonate Chemical compound [O-]S(=O)=O BDHFUVZGWQCTTF-UHFFFAOYSA-M 0.000 description 2
- 210000004243 sweat Anatomy 0.000 description 2
- 210000001138 tear Anatomy 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 239000011534 wash buffer Substances 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 108020001019 DNA Primers Proteins 0.000 description 1
- 230000005778 DNA damage Effects 0.000 description 1
- 231100000277 DNA damage Toxicity 0.000 description 1
- 230000009946 DNA mutation Effects 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- VVQNEPGJFQJSBK-UHFFFAOYSA-N Methyl methacrylate Chemical compound COC(=O)C(C)=C VVQNEPGJFQJSBK-UHFFFAOYSA-N 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 239000013616 RNA primer Substances 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- PPBRXRYQALVLMV-UHFFFAOYSA-N Styrene Natural products C=CC1=CC=CC=C1 PPBRXRYQALVLMV-UHFFFAOYSA-N 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 210000004958 brain cell Anatomy 0.000 description 1
- 150000007942 carboxylates Chemical class 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 229920001577 copolymer Polymers 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000013024 dilution buffer Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000001641 gel filtration chromatography Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 238000002663 nebulization Methods 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 238000001668 nucleic acid synthesis Methods 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000009598 prenatal testing Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 239000002987 primer (paints) Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 150000003291 riboses Chemical class 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 210000003765 sex chromosome Anatomy 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本明細書において提供されるのは、二本鎖DNA分子の集団におけるある二本鎖DNA分子の遺伝的特徴、断片特徴、およびエピジェネティックな特徴を、該二本鎖DNA分子の両方の鎖をアッセイすることによって同定するための方法である。TIFF2024529674000004.tif119170
Description
関連出願の相互参照
本出願は、2021年8月12日付で出願された米国仮特許出願第63/232,438号の優先権を主張する。この先行出願の開示は、本出願の開示の一部と見なされ、その全体が本出願に組み入れられる。
本出願は、2021年8月12日付で出願された米国仮特許出願第63/232,438号の優先権を主張する。この先行出願の開示は、本出願の開示の一部と見なされ、その全体が本出願に組み入れられる。
技術分野
本開示は核酸分析の分野に関する。特に、本開示は、核酸配列の変異およびメチル化を検出することができる核酸配列分析に関する。
本開示は核酸分析の分野に関する。特に、本開示は、核酸配列の変異およびメチル化を検出することができる核酸配列分析に関する。
連邦政府支援の研究開発
本発明は、米国国立衛生研究所から授与された助成金GM136577、GM008752およびCA006973の下で政府支援を受けて行われた。政府は本発明において一定の権利を有する。
本発明は、米国国立衛生研究所から授与された助成金GM136577、GM008752およびCA006973の下で政府支援を受けて行われた。政府は本発明において一定の権利を有する。
背景
希少な変異の同定は、基礎生物学の局面において有用であるだけでなく、患者の臨床管理を改善するためにも有用である。利用分野には、感染性疾患、免疫レパートリープロファイリング、古遺伝学、法医学、老化、非侵襲的出生前検査、およびがんが含まれる。次世代シーケンシング(NGS)技術は、理論的にはこの用途に適しており、希少変異の検出のために種々のNGSアプローチが存在する。しかしながら、従来のNGSアプローチの場合、シーケンシングそれ自体の誤り率が高すぎて、変異、特にオリジナルのサンプルにおいて低い頻度で存在する変異を確信的に検出することができない。
希少な変異の同定は、基礎生物学の局面において有用であるだけでなく、患者の臨床管理を改善するためにも有用である。利用分野には、感染性疾患、免疫レパートリープロファイリング、古遺伝学、法医学、老化、非侵襲的出生前検査、およびがんが含まれる。次世代シーケンシング(NGS)技術は、理論的にはこの用途に適しており、希少変異の検出のために種々のNGSアプローチが存在する。しかしながら、従来のNGSアプローチの場合、シーケンシングそれ自体の誤り率が高すぎて、変異、特にオリジナルのサンプルにおいて低い頻度で存在する変異を確信的に検出することができない。
オリジナルの鋳型分子にタグ付けする分子バーコードの使用は、希少変異の検出におけるさまざまな障害を克服するために考案された。分子バーコーディングを用いると、タグ付けされた各分子の、PCRで生成された産生物についての冗長シーケンシングが実施され、シーケンシングの誤りが容易に認識される。例えば、バーコード付けされた鋳型分子の産生物の所与の閾値に同じ変異が入る場合、その変異は本物と見なされる。産生物の所与の閾値未満に関心対象の変異が入る場合、その変異は人工産物と見なされる。外因性および内因性の2種類の分子バーコードが記述されている。外因性バーコード(外因性固有識別子、または「UID」ともいわれる)は、予め指定されたヌクレオチドまたはランダムなヌクレオチドを含み、ライブラリ調製中またはPCR中に付加される。内因性バーコード(内因性UIDともいわれる)は、アッセイされる鋳型DNAに存在する配列、例えば、DNAのランダムな剪断によって生成された断片、または無細胞液体生物学的サンプルに存在する断片によって形成される。場合によっては、内因性バーコードは断片の5'末端および/または3'末端に存在する配列である。そのようなバーコードは、アンプリコンをオリジナルの出発鋳型までさかのぼって追跡し、分子計数を可能にし、臨床的に関連するサンプルにおける真の変異の同定を改善するのに有用であることが証明されている。
シトシンのメチル化またはヒドロキシメチル化に関連するものなどの、DNAの希少なエピジェネティックな変化の同定には、変異について上述したのと同様の課題が提示される。現在のところ、(例えば)血漿中の変異を非常に高い特異性で評価する実験技法には、1つのアリコットの血漿が必要である。エピジェネティックな変化を評価する実験技法には、もう1つのアリコットの血漿が必要である。早期がん患者の血漿におけるある特定の変異およびエピジェネティックな変化は希少であるため、遺伝的変化とエピジェネティックな変化の両方についてできるだけ多くの分子を評価することが有利であろう。半分は遺伝的変化のために、半分はエピジェネティックな変化のために、サンプルを分割すると、両方のタイプの変化について感度が50%低減する。
したがって、非限定的に血漿などの、臨床的に関連するサンプルから精製されたDNAの同じアリコットからの、変異、例えば、希少変異およびエピジェネティックな変化の正確な同定を可能にするために、シーケンシングライブラリの調製とワークフローとを改善する必要がある。
概要
本明細書において提供されるのは、二本鎖DNA分子の集団におけるある二本鎖DNA分子の遺伝的特徴およびエピジェネティックな特徴を、該二本鎖DNA分子の少なくとも一方の鎖をアッセイすることによって同定するための方法であって、以下の段階:(a) 適合された二本鎖DNA分子を生成するために、二本鎖DNA分子の各末端にアダプター断片を付着させる段階であって、該適合された二本鎖DNA分子が、適合されたワトソン鎖および適合されたクリック鎖を含み、該アダプター断片が、分子バーコード、プライマー配列、およびアダプター配列を含み、かつ該適合されたワトソン鎖の分子バーコードが、該適合されたクリック鎖の分子バーコードの逆相補体である、該段階; (b) 該適合された二本鎖DNA分子の両方の鎖をコピーする段階であって、該コピーする段階が、(i) 該適合された二本鎖DNA分子を、タグ付けされたプライマーと接触させることと、(ii) 該適合された二本鎖DNA分子の線状伸長のラウンドを実施し、タグ付けされたワトソン鎖およびタグ付けされたクリック鎖を生成することとを含む、該段階; (c) 増幅された産物を変性条件に供する段階; (d) 該適合されたワトソン鎖およびクリック鎖と、該タグ付けされたワトソン鎖およびクリック鎖とを別々に回収する段階; (e) 該タグ付けされたワトソン鎖およびクリック鎖から分析物DNA断片の第1の集団を生成する段階、ならびに分析物DNA断片の第1の集団のうちの少なくとも1つの成員について第1のシーケンシングリードを生成する段階; (f) 該適合されたワトソン鎖およびクリック鎖から分析物DNA断片の第2の集団を生成する段階、ならびに分析物DNA断片の第2の集団のうちの少なくとも1つの成員について第2のシーケンシングリードを生成する段階; (g) 第1の分析物DNAファミリーを生成するために、分析物DNA断片の第1の集団のうちの該少なくとも1つの成員上に存在する分子バーコードに従って第1のシーケンシングリードを分類する段階; (h) 第2の分析物DNAファミリーを生成するために、分析物DNA断片の第2の集団のうちの該少なくとも1つの成員上に存在する分子バーコードに従って第2のシーケンシングリードを分類する段階; (i) 第1の分析物DNAファミリーにおいて、該タグ付けされたワトソン鎖およびクリック鎖の遺伝的特徴を同定する段階; ならびに(j) 第2の分析物DNAファミリーにおいて、該適合されたワトソン鎖およびクリック鎖のエピジェネティックな特徴を同定する段階を含み、したがって、該二本鎖DNA分子の少なくとも一方の鎖上に存在する遺伝的特徴およびエピジェネティックな特徴を同定する、該方法である。
本明細書において提供されるのは、二本鎖DNA分子の集団におけるある二本鎖DNA分子の遺伝的特徴およびエピジェネティックな特徴を、該二本鎖DNA分子の少なくとも一方の鎖をアッセイすることによって同定するための方法であって、以下の段階:(a) 適合された二本鎖DNA分子を生成するために、二本鎖DNA分子の各末端にアダプター断片を付着させる段階であって、該適合された二本鎖DNA分子が、適合されたワトソン鎖および適合されたクリック鎖を含み、該アダプター断片が、分子バーコード、プライマー配列、およびアダプター配列を含み、かつ該適合されたワトソン鎖の分子バーコードが、該適合されたクリック鎖の分子バーコードの逆相補体である、該段階; (b) 該適合された二本鎖DNA分子の両方の鎖をコピーする段階であって、該コピーする段階が、(i) 該適合された二本鎖DNA分子を、タグ付けされたプライマーと接触させることと、(ii) 該適合された二本鎖DNA分子の線状伸長のラウンドを実施し、タグ付けされたワトソン鎖およびタグ付けされたクリック鎖を生成することとを含む、該段階; (c) 増幅された産物を変性条件に供する段階; (d) 該適合されたワトソン鎖およびクリック鎖と、該タグ付けされたワトソン鎖およびクリック鎖とを別々に回収する段階; (e) 該タグ付けされたワトソン鎖およびクリック鎖から分析物DNA断片の第1の集団を生成する段階、ならびに分析物DNA断片の第1の集団のうちの少なくとも1つの成員について第1のシーケンシングリードを生成する段階; (f) 該適合されたワトソン鎖およびクリック鎖から分析物DNA断片の第2の集団を生成する段階、ならびに分析物DNA断片の第2の集団のうちの少なくとも1つの成員について第2のシーケンシングリードを生成する段階; (g) 第1の分析物DNAファミリーを生成するために、分析物DNA断片の第1の集団のうちの該少なくとも1つの成員上に存在する分子バーコードに従って第1のシーケンシングリードを分類する段階; (h) 第2の分析物DNAファミリーを生成するために、分析物DNA断片の第2の集団のうちの該少なくとも1つの成員上に存在する分子バーコードに従って第2のシーケンシングリードを分類する段階; (i) 第1の分析物DNAファミリーにおいて、該タグ付けされたワトソン鎖およびクリック鎖の遺伝的特徴を同定する段階; ならびに(j) 第2の分析物DNAファミリーにおいて、該適合されたワトソン鎖およびクリック鎖のエピジェネティックな特徴を同定する段階を含み、したがって、該二本鎖DNA分子の少なくとも一方の鎖上に存在する遺伝的特徴およびエピジェネティックな特徴を同定する、該方法である。
いくつかの態様において、アダプター断片はサンプルバーコードをさらに含む。いくつかの態様において、分子バーコードは、内因性バーコード、外因性バーコード、または両方を含む。
いくつかの態様において、コピーする段階(b)は、適合された二本鎖DNA分子の1ラウンド、2ラウンド、または3ラウンドの線状伸長を実施することを含む。いくつかの態様において、タグ付けされたプライマーはウラシル含有ビオチン化プライマーであり、かつタグ付けされたワトソン鎖およびクリック鎖は、該ウラシル含有ビオチン化プライマーから生成される。
いくつかの態様において、回収する段階(d)は、タグ付けされたワトソン鎖およびクリック鎖をストレプトアビジン官能化ビーズと接触させることを含み、かつここで、タグ付けされたワトソン鎖およびクリック鎖は、該ストレプトアビジン官能化ビーズに結合する。いくつかの態様において、変換されたDNA分子の集団を含む分析物DNA断片の第2の集団を生成すべくシトシン塩基をウラシル塩基に変換するために、ストレプトアビジン官能化ビーズに結合していない、回収された、適合されたワトソン鎖およびクリック鎖が、バイサルファイトで処理される。
いくつかの態様において、変性条件はNaOH変性を含む。いくつかの態様において、変性条件は、熱変性、化学変性、またはそれらの組み合わせを含む。いくつかの態様において、生成する段階(e)および(f)はPCR条件下で実施される。
いくつかの態様において、遺伝的特徴は変異である。いくつかの態様において、変異は、挿入、欠失、置換、欠失-挿入、重複、逆位、フレームシフト、反復拡張、転座、およびそれらの組み合わせからなる群より選択される。いくつかの態様において、エピジェネティックな特徴はメチル化である。いくつかの態様において、エピジェネティックな特徴はメチル化パターンである。いくつかの態様において、メチル化パターンは、不確定な起源のクローン性造血を介して生成された細胞に存在するメチル化パターンに対応する。いくつかの態様において、メチル化パターンは、起源組織に存在するメチル化パターンに対応する。いくつかの態様において、起源組織は、肛門、膀胱/尿路上皮、乳房、子宮頸部、結腸/直腸、頭頸部、腎臓、肝臓/胆管、肺、リンパ系新生物、黒色腫、骨髄系新生物、卵巣、膵臓/胆嚢、前立腺、甲状腺、上部GI、または子宮である。いくつかの態様において、エピジェネティックな特徴は、ヒドロキシメチル化、ヒストン修飾、マイクロRNA調節、アセチル化、リン酸化、ユビキチン化、またはSUMO化である。いくつかの態様において、本方法は、二本鎖DNA分子の集団におけるある二本鎖DNA分子の遺伝的特徴およびエピジェネティックな特徴を、該二本鎖DNA分子の両方の鎖をアッセイすることによって同定する。
同様に本明細書において提供されるのは、二本鎖DNA分子の集団におけるある二本鎖DNA分子の第1の特徴および第2の特徴を、該二本鎖DNA分子の少なくとも一方の鎖をアッセイすることによって同定するための方法であって、以下の段階:(a) 適合された二本鎖DNA分子を生成するために、二本鎖DNA分子の各末端にアダプター断片を付着させる段階であって、該適合された二本鎖DNA分子が、適合されたワトソン鎖および適合されたクリック鎖を含み、該アダプター断片が、分子バーコード、プライマー配列、およびアダプター配列を含み、かつ該適合されたワトソン鎖の分子バーコードが、該適合されたクリック鎖の分子バーコードの逆相補体である、該段階; (b) 該適合された二本鎖DNA分子の両方の鎖をコピーする段階であって、該コピーする段階が、(i) 該適合された二本鎖DNA分子を、タグ付けされたプライマーと接触させることと、(ii) 該適合された二本鎖DNA分子の線状伸長のラウンドを実施し、タグ付けされたワトソン鎖およびタグ付けされたクリック鎖を生成することとを含む、該段階; (c) 増幅された産物を変性条件に供する段階; (d) 該適合されたワトソン鎖およびクリック鎖と、該タグ付けされたワトソン鎖およびクリック鎖とを別々に回収する段階; (e) 該タグ付けされたワトソン鎖およびクリック鎖から分析物DNA断片の第1の集団を生成する段階、ならびに分析物DNA断片の第1の集団のうちの少なくとも1つの成員について第1のシーケンシングリードを生成する段階; (f) 該適合されたワトソン鎖およびクリック鎖から分析物DNA断片の第2の集団を生成する段階、ならびに分析物DNA断片の第2の集団のうちの少なくとも1つの成員について第2のシーケンシングリードを生成する段階; (g) 第1の分析物DNAファミリーを生成するために、分析物DNA断片の第1の集団のうちの該少なくとも1つの成員上に存在する分子バーコードに従って第1のシーケンシングリードを分類する段階; (h) 第2の分析物DNAファミリーを生成するために、分析物DNA断片の第2の集団のうちの該少なくとも1つの成員上に存在する分子バーコードに従って第2のシーケンシングリードを分類する段階; (i) 第1の分析物DNAファミリーにおいて、該タグ付けされたワトソン鎖およびクリック鎖の第1の特徴を同定する段階; ならびに(j) 第2の分析物DNAファミリーにおいて、該適合されたワトソン鎖およびクリック鎖の第2の特徴を同定する段階を含み、したがって、該二本鎖DNA分子の少なくとも一方の鎖上に存在する第1の特徴および第2の特徴を同定する、該方法である。
いくつかの態様において、アダプター断片はサンプルバーコードをさらに含む。いくつかの態様において、分子バーコードは、内因性バーコード、外因性バーコード、または両方を含む。
いくつかの態様において、コピーする段階(b)は、適合された二本鎖DNA分子の1ラウンド、2ラウンド、または3ラウンドの線状伸長を実施することを含む。いくつかの態様において、タグ付けされたプライマーはウラシル含有ビオチン化プライマーであり、かつタグ付けされたワトソン鎖およびクリック鎖は、該ウラシル含有ビオチン化プライマーから生成される。
いくつかの態様において、回収する段階(d)は、第1の一本鎖DNA断片をストレプトアビジン官能化ビーズと接触させることを含み、かつここで、第1の一本鎖DNA断片は、該ストレプトアビジン官能化ビーズに結合する。いくつかの態様において、変性条件はNaOH変性を含む。いくつかの態様において、変性条件は、熱変性、化学変性、またはそれらの組み合わせを含む。
いくつかの態様において、生成する段階(e)および(f)はPCR条件下で実施される。いくつかの態様において、生成する段階は、全ゲノムPCR、全ゲノムバイサルファイトシーケンシング、または捕捉シーケンシングを利用する。
いくつかの態様において、第1の特徴は遺伝的特徴またはエピジェネティックな特徴である。いくつかの態様において、第2の特徴はエピジェネティックな特徴またはエピジェネティックな特徴である。いくつかの態様において、第1の特徴および第2の特徴は両方とも遺伝的特徴である。いくつかの態様において、第1の特徴および第2の特徴は両方ともエピジェネティックな特徴である。
いくつかの態様において、遺伝的特徴は変異である。いくつかの態様において、変異は、挿入、欠失、置換、欠失-挿入、重複、逆位、フレームシフト、反復拡張、転座、およびそれらの組み合わせからなる群より選択される。いくつかの態様において、遺伝的特徴の同定は、変異分析、異数性分析、またはフラグメントミクスを含む。
いくつかの態様において、エピジェネティックな特徴はメチル化である。いくつかの態様において、エピジェネティックな特徴はメチル化パターンである。いくつかの態様において、メチル化パターンは、不確定な起源のクローン性造血を介して生成された細胞に存在するメチル化パターンに対応する。いくつかの態様において、メチル化パターンは、起源組織に存在するメチル化パターンに対応する。いくつかの態様において、起源組織は、肛門、膀胱/尿路上皮、乳房、子宮頸部、結腸/直腸、頭頸部、腎臓、肝臓/胆管、肺、リンパ系新生物、黒色腫、骨髄系新生物、卵巣、膵臓/胆嚢、前立腺、甲状腺、上部GI、または子宮である。いくつかの態様において、エピジェネティックな特徴は、ヒドロキシメチル化、ヒストン修飾、マイクロRNA調節、アセチル化、リン酸化、ユビキチン化、またはSUMO化である。
いくつかの態様において、本方法は、二本鎖DNA分子の集団におけるある二本鎖DNA分子の第1の特徴および第2の特徴を、該二本鎖DNA分子の両方の鎖をアッセイすることによって同定する。
特に定義されない限り、本明細書において用いられる全ての技術的および科学的用語は、本発明が属する技術分野の当業者によって一般的に理解されるのと同じ意味を有する。本発明を実践するために本明細書において記述されたものと類似または等価な方法および材料を用いることができるが、適当な方法および材料を後述する。本明細書において言及される全ての刊行物、特許出願、特許および他の参考文献は、参照によりその全体が組み入れられる。矛盾する場合、定義を含めて、本明細書に従う。さらに、材料、方法、および実施例は、例示的なものにすぎず、限定することを意図するものではない。
本発明の1つまたは複数の態様の詳細は、添付の図面および以下の説明に記載されている。本発明の他の特徴、目的、および利点は、当該説明および図面、ならびに特許請求の範囲から明らかになるであろう。
詳細な説明
DNAの希少な変異または希少なエピジェネティックな変化(例えば、シトシンのメチル化、ヒドロキシメチル化)の同定は、基礎生物学の局面において有用であるだけでなく、患者の臨床管理を改善するためにも有用である。現在のところ、血漿中の変異を非常に高い特異性で評価する従来技法には、1つのアリコットの血漿が必要であるが、エピジェネティックな変化を評価する従来技法には、もう1つのアリコットの血漿が必要である。早期がん患者の血漿におけるある特定の変異およびエピジェネティックな変化は希少であるため、遺伝的変化とエピジェネティックな変化の両方についてできるだけ多くの分子を評価することが有利であろう。半分は遺伝的変化のために、半分はエピジェネティックな変化のために、サンプルを分割すると、両方のタイプの変化について感度が50%低減する。
DNAの希少な変異または希少なエピジェネティックな変化(例えば、シトシンのメチル化、ヒドロキシメチル化)の同定は、基礎生物学の局面において有用であるだけでなく、患者の臨床管理を改善するためにも有用である。現在のところ、血漿中の変異を非常に高い特異性で評価する従来技法には、1つのアリコットの血漿が必要であるが、エピジェネティックな変化を評価する従来技法には、もう1つのアリコットの血漿が必要である。早期がん患者の血漿におけるある特定の変異およびエピジェネティックな変化は希少であるため、遺伝的変化とエピジェネティックな変化の両方についてできるだけ多くの分子を評価することが有利であろう。半分は遺伝的変化のために、半分はエピジェネティックな変化のために、サンプルを分割すると、両方のタイプの変化について感度が50%低減する。
したがって、臨床的に関連するサンプルから精製されたDNAの同じアリコットからの、変異、例えば、希少変異およびエピジェネティックな変化の正確な同定を可能にするために、シーケンシングライブラリの調製とワークフローとを改善する必要がある。
本明細書において提供されるのは、二本鎖DNA分子の集団におけるある二本鎖DNA分子の遺伝的特徴およびエピジェネティックな特徴を、該二本鎖DNA分子の少なくとも一方の鎖をアッセイすることによって同定するための方法であって、以下の段階:(a) 適合された二本鎖DNA分子を生成するために、二本鎖DNA分子の各末端にアダプター断片を付着させる段階であって、該適合された二本鎖DNA分子が、適合されたワトソン鎖および適合されたクリック鎖を含み、該アダプター断片が、分子バーコード、プライマー配列、およびアダプター配列を含み、かつ該適合されたワトソン鎖の分子バーコードが、該適合されたクリック鎖の分子バーコードの逆相補体である、該段階; (b) 該適合された二本鎖DNA分子の両方の鎖をコピーする段階であって、該コピーする段階が、(i) 該適合された二本鎖DNA分子を、タグ付けされたプライマーと接触させることと、(ii) 該適合された二本鎖DNA分子の線状伸長のラウンドを実施し、タグ付けされたワトソン鎖およびタグ付けされたクリック鎖を生成することとを含む、該段階; (c) 増幅された産物を変性条件に供する段階; (d) 該適合されたワトソン鎖およびクリック鎖と、該タグ付けされたワトソン鎖およびクリック鎖とを別々に回収する段階; (e) 該タグ付けされたワトソン鎖およびクリック鎖から分析物DNA断片の第1の集団を生成する段階、ならびに分析物DNA断片の第1の集団のうちの少なくとも1つの成員について第1のシーケンシングリードを生成する段階; (f) 該適合されたワトソン鎖およびクリック鎖から分析物DNA断片の第2の集団を生成する段階、ならびに分析物DNA断片の第2の集団のうちの少なくとも1つの成員について第2のシーケンシングリードを生成する段階; (g) 第1の分析物DNAファミリーを生成するために、分析物DNA断片の第1の集団のうちの該少なくとも1つの成員上に存在する分子バーコードに従って第1のシーケンシングリードを分類する段階; (h) 第2の分析物DNAファミリーを生成するために、分析物DNA断片の第2の集団のうちの該少なくとも1つの成員上に存在する分子バーコードに従って第2のシーケンシングリードを分類する段階; (i) 第1の分析物DNAファミリーにおいて、該タグ付けされたワトソン鎖およびクリック鎖の遺伝的特徴を同定する段階; ならびに(j) 第2の分析物DNAファミリーにおいて、該適合されたワトソン鎖およびクリック鎖のエピジェネティックな特徴を同定する段階を含み、したがって、該二本鎖DNA分子の少なくとも一方の鎖上に存在する遺伝的特徴およびエピジェネティックな特徴を同定する、該方法である。
これらの方法のさまざまな非限定的な局面が本明細書において記述されており、非限定的に任意の組み合わせで用いられうる。変異およびメチル化の存在または非存在を同定するための方法のさまざまな構成要素のさらなる局面は、当技術分野において公知である。
本明細書および添付の特許請求の範囲において用いられる場合、単数形「1つの(a)」、「1つの(an)」および「その(the)」は、文脈上明らかにそうでない場合を除き、複数の参照対象を含むことに留意されたい。
本明細書において用いられる場合、「アダプター(adaptor)」、「アダプター(adapter)」および「タグ」は、互換的に用いられる用語であり、ライゲーション、ハイブリダイゼーション、およびタグメンテーションを含むが、これらに限定されない、多くの異なる技法のいずれか1つを用いて、(例えば、「タグ付け」といわれるプロセスにおいて)ポリヌクレオチド配列に結合させることができる種を指す。いくつかの態様において、アダプターは、機能を付加する核酸配列、例えば、スペーサー配列、プライマー配列/部位、バーコード配列、または固有の分子識別子配列であることもできる。
本明細書において用いられる場合、「バーコード」という用語は、情報(例えば、サンプル中の分析物に関する情報)を伝達する、または伝達可能であるラベル、または識別子を指す。バーコードは分析物の一部であってもよく、または分析物から独立していてもよい。いくつかの態様において、バーコードは分析物に付着させることができる。いくつかの態様において、特定のバーコードは、他のバーコードと比べて固有であることができる。いくつかの態様において、バーコードは種々の異なる形式を有することができる。例えば、バーコードは非ランダム、準ランダムおよび/またはランダムな核酸および/またはアミノ酸配列、ならびに合成核酸および/またはアミノ酸配列を含むことができる。いくつかの態様において、バーコードは可逆的または不可逆的な様式で、分析物または別の部分もしくは構造に付着させることができる。いくつかの態様において、バーコードは、例えば、デオキシリボ核酸(DNA)またはリボ核酸(RNA)サンプルの断片に、サンプルのシーケンシング前またはシーケンシング中に付加することができる。いくつかの態様において、バーコードは個々のシーケンシングリードの同定および/または定量を可能にすることができる。いくつかの態様において、バーコードは固有の識別子(UID)を指すことができ、「バーコード」および「UID」という用語は、互換的に用いることができる。
本明細書において用いられる場合、「ヌクレオチド」および「nt」という用語は、核酸を含む生物学的分子を広く指すように、本明細書において互換的に用いられる。ヌクレオチドは、公知のプリン塩基およびピリミジン塩基を含む部分を有することができる。ヌクレオチドは、修飾されている他の複素環塩基を有していてもよい。そのような修飾は、例えば、メチル化プリンもしくはピリミジン、アシル化プリンもしくはピリミジン、アルキル化リボース、または他の複素環を含む。「ポリヌクレオチド」、「核酸」および「オリゴヌクレオチド」という用語は互換的に用いることができ、デオキシリボヌクレオチドもしくはリボヌクレオチドのいずれかの、任意の長さのヌクレオチドの重合体、またはそれらの類似体を指す。ポリヌクレオチドは任意の三次元構造を有していてもよく、既知または未知の任意の機能を果たしていてもよい。以下はポリヌクレオチドの非限定的な例である: 遺伝子または遺伝子断片のコード領域または非コード領域、連鎖分析から定義される遺伝子座、エクソン、イントロン、メッセンジャーRNA (mRNA)、転移RNA、リボソームRNA、リボザイム、cDNA、組み換えポリヌクレオチド、分枝ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたDNA、任意の配列の単離されたRNA、核酸プローブ、およびプライマー。ポリヌクレオチドは、天然に存在しない配列を含んでいてもよい。ポリヌクレオチドは、メチル化ヌクレオチドおよびヌクレオチド類似体などの修飾ヌクレオチドを含んでいてもよい。存在する場合、ヌクレオチド構造への修飾は、重合体の組み立て前または組み立て後に付与されてもよい。ヌクレオチドの配列は、非ヌクレオチド成分によって中断されていてもよい。ポリヌクレオチドは、標識成分とのコンジュゲーションによってなど、重合後にさらに修飾されてもよい。
本明細書において用いられる場合、「プライマー」は、鋳型配列(標的ポリヌクレオチド、またはプライマー伸長産物などの)とハイブリダイズし、鋳型に相補的なポリヌクレオチドの重合を促進することができる、遊離3'-OH基を一般に有するヌクレオチド配列(例えば、オリゴヌクレオチド)を含むポリヌクレオチド分子を広く指す。いくつかの態様において、プライマーはビオチン化プライマーである。
概観
本明細書において提供されるのは、核酸サンプル中に存在する遺伝的特徴およびエピジェネティックな特徴を正確に同定するのに有用な方法および材料である。いくつかの態様において、本方法は、遺伝的特徴およびエピジェネティックな特徴を、それが二本鎖核酸鋳型のワトソン鎖およびクリック鎖の少なくとも一方に存在する場合に同定することを含む。いくつかの態様において、本方法は、遺伝的特徴およびエピジェネティックな特徴を、それが二本鎖核酸鋳型のワトソン鎖およびクリック鎖の両方に存在する場合に同定することを含む。いくつかの態様において、二本鎖核酸鋳型はワトソン鎖およびクリック鎖を含むことができる。いくつかの態様において、二本鎖核酸鋳型はプラス鎖およびマイナス鎖を含むことができる。いくつかの態様において、二本鎖核酸鋳型は第1の鎖および第2の鎖を含むことができる。当技術分野において認識されるように、ワトソン/クリック、プラス/マイナス、および第1/第2は、二本鎖核酸分子の2つの鎖を指す。そのような方法は、例えば、DNA損傷、PCR、および他のシーケンシング人工産物に由来する人工産物から真の変異を区別するために特に有用であり、高い信頼性で変異の同定を可能にする。
本明細書において提供されるのは、核酸サンプル中に存在する遺伝的特徴およびエピジェネティックな特徴を正確に同定するのに有用な方法および材料である。いくつかの態様において、本方法は、遺伝的特徴およびエピジェネティックな特徴を、それが二本鎖核酸鋳型のワトソン鎖およびクリック鎖の少なくとも一方に存在する場合に同定することを含む。いくつかの態様において、本方法は、遺伝的特徴およびエピジェネティックな特徴を、それが二本鎖核酸鋳型のワトソン鎖およびクリック鎖の両方に存在する場合に同定することを含む。いくつかの態様において、二本鎖核酸鋳型はワトソン鎖およびクリック鎖を含むことができる。いくつかの態様において、二本鎖核酸鋳型はプラス鎖およびマイナス鎖を含むことができる。いくつかの態様において、二本鎖核酸鋳型は第1の鎖および第2の鎖を含むことができる。当技術分野において認識されるように、ワトソン/クリック、プラス/マイナス、および第1/第2は、二本鎖核酸分子の2つの鎖を指す。そのような方法は、例えば、DNA損傷、PCR、および他のシーケンシング人工産物に由来する人工産物から真の変異を区別するために特に有用であり、高い信頼性で変異の同定を可能にする。
いくつかの態様において、二本鎖DNA分子の集団におけるある二本鎖DNA分子の遺伝的特徴およびエピジェネティックな特徴を、該二本鎖DNA分子の少なくとも一方の鎖をアッセイすることによって同定するための方法は、(a) 適合された二本鎖DNA分子を生成するために、二本鎖DNA分子の各末端にアダプター断片を付着させる段階であって、該適合された二本鎖DNA分子が、適合されたワトソン鎖および適合されたクリック鎖を含み、該アダプター断片が、分子バーコード、プライマー配列、およびアダプター配列を含み、かつ該適合されたワトソン鎖の分子バーコードが、該適合されたクリック鎖の分子バーコードの逆相補体である、該段階; (b) 該適合された二本鎖DNA分子の両方の鎖をコピーする段階であって、該コピーする段階が、(i) 該適合された二本鎖DNA分子を、タグ付けされたプライマーと接触させることと、(ii) 該適合された二本鎖DNA分子の線状伸長のラウンドを実施し、タグ付けされたワトソン鎖およびタグ付けされたクリック鎖を生成することとを含む、該段階; (c) 増幅された産物を変性条件に供する段階; (d) 該適合されたワトソン鎖およびクリック鎖と、該タグ付けされたワトソン鎖およびクリック鎖とを別々に回収する段階; (e) 該タグ付けされたワトソン鎖およびクリック鎖から分析物DNA断片の第1の集団を生成する段階、ならびに分析物DNA断片の第1の集団のうちの少なくとも1つの成員について第1のシーケンシングリードを生成する段階; (f) 該適合されたワトソン鎖およびクリック鎖から分析物DNA断片の第2の集団を生成する段階、ならびに分析物DNA断片の第2の集団のうちの少なくとも1つの成員について第2のシーケンシングリードを生成する段階; (g) 第1の分析物DNAファミリーを生成するために、分析物DNA断片の第1の集団のうちの該少なくとも1つの成員上に存在する分子バーコードに従って第1のシーケンシングリードを分類する段階; (h) 第2の分析物DNAファミリーを生成するために、分析物DNA断片の第2の集団のうちの該少なくとも1つの成員上に存在する分子バーコードに従って第2のシーケンシングリードを分類する段階; (i) 第1の分析物DNAファミリーにおいて、該タグ付けされたワトソン鎖およびクリック鎖の遺伝的特徴を同定する段階; ならびに(j) 第2の分析物DNAファミリーにおいて、該適合されたワトソン鎖およびクリック鎖のエピジェネティックな特徴を同定する段階を含むことができ、したがって、該二本鎖DNA分子の少なくとも一方の鎖上に存在する遺伝的特徴およびエピジェネティックな特徴を同定する。いくつかの態様において、本方法は、二本鎖DNA分子の両方の鎖上に存在する遺伝的特徴およびエピジェネティックな特徴を同定することを含む(図1)。
場合によっては、本明細書において記述される方法および材料を用いて、効率的な二重鎖回収を達成することができる。いくつかの態様において、本明細書において記述される方法を用いて、二本鎖核酸鋳型のワトソン鎖およびクリック鎖の少なくとも一方に由来する増幅産物を回収することができる。例えば、本明細書において記述される方法を用いて、二本鎖核酸鋳型のワトソン鎖およびクリック鎖の両方に由来する増幅産物を回収することができる。場合によっては、本明細書において記述される方法を用いて、少なくとも50% (例えば、約50%、約60%、約70%、約75%、約80%、約82%、約85%、約88%、約90%、約93%、約95%、約97%、約99%または100%)の二重鎖回収を達成することができる(図2)。
いくつかの態様において、二本鎖核酸の少なくとも一方の鎖に存在する1つまたは複数の変異を検出するための方法は、ライブラリにおける各核酸の各末端(例えば、5'末端および3'末端)に二重鎖分子バーコードを有する二重鎖シーケンシングライブラリを生成する段階、二重鎖シーケンシングライブラリから一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成する段階、ならびに各一本鎖ライブラリにおける二本鎖核酸の少なくとも一方の鎖に存在する1つまたは複数の変異の存在を検出する段階を含むことができる。いくつかの態様において、二本鎖核酸の両方の鎖に存在する1つまたは複数の変異を検出するための方法は、ライブラリにおける各核酸の各末端(例えば、5'末端および3'末端)に二重鎖分子バーコードを有する二重鎖シーケンシングライブラリを生成する段階、二重鎖シーケンシングライブラリから一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成する段階、ならびに各一本鎖ライブラリにおける二本鎖核酸の両方の鎖に存在する1つまたは複数の変異の存在を検出する段階を含むことができる。3'二重鎖アダプターにおける第1の分子バーコードおよび5'アダプターに存在する第2の分子バーコードの存在を用いて、ワトソン鎖に由来する増幅産物をクリック鎖に由来する増幅産物と区別することができる。
場合によっては、本明細書において記述される方法および材料を用いて、二本鎖核酸の各鎖を独立して評価することができる。例えば、本明細書において記述されるように独立して評価された二本鎖核酸鎖において核酸変異が同定される場合、本明細書において記述される材料および方法を用いて、核酸変異が二本鎖核酸のどの鎖に由来するかを決定することができる。
任意の適切な方法を用いて、二重鎖シーケンシングライブラリを生成することができる。本明細書において用いられる場合、二重鎖シーケンシングライブラリは、ライブラリにおける各核酸断片の一端(例えば、5'末端および/または3'末端)に二重鎖分子バーコードを含む複数の核酸断片であり、二本鎖核酸の少なくとも一方の鎖が配列決定されることを可能にすることができる。いくつかの態様において、二本鎖核酸の両方の鎖が配列決定される。場合によっては、核酸サンプル(例えば、二本鎖DNA分子)を断片化して、核酸断片(例えば、分析物DNA断片)を生成することができ、生成された核酸断片を用いて二重鎖シーケンシングライブラリを生成することができる。二重鎖シーケンシングライブラリを生成するために用いられる核酸断片は、本明細書においてインプット核酸ともいうことができる。例えば、二重鎖シーケンシングライブラリを生成するために用いられる核酸断片がDNA断片である場合、DNA断片は本明細書においてインプットDNAともいうことができる。二重鎖シーケンシングライブラリは、任意の適切な数の核酸断片を含むことができる。場合によっては、二重鎖シーケンシングライブラリを生成することは、核酸鋳型を断片化すること、およびライブラリにおける各核酸断片の各末端にアダプターをライゲーションすることを含むことができる。
(1) 適合された二本鎖DNA分子
いくつかの態様において、本明細書において記述される方法は、(a) 適合された二本鎖DNA分子を生成するために、二本鎖DNA分子の各末端にアダプター断片を付着させる段階であって、該適合された二本鎖DNA分子が、適合されたワトソン鎖および適合されたクリック鎖を含み、該アダプター断片が、分子バーコード、プライマー配列、およびアダプター配列を含み、かつ該適合されたワトソン鎖の分子バーコードが、該適合されたクリック鎖の分子バーコードの逆相補体である、該段階; ならびに(b) 該適合された二本鎖DNA分子の両方の鎖をコピーする段階であって、該コピーする段階が、(i) 該適合された二本鎖DNA分子を、タグ付けされたプライマーと接触させることと、(ii) 該適合された二本鎖DNA分子の線状伸長のラウンドを実施し、タグ付けされたワトソン鎖およびタグ付けされたクリック鎖を生成することとを含む、該段階を含むことができる。
いくつかの態様において、本明細書において記述される方法は、(a) 適合された二本鎖DNA分子を生成するために、二本鎖DNA分子の各末端にアダプター断片を付着させる段階であって、該適合された二本鎖DNA分子が、適合されたワトソン鎖および適合されたクリック鎖を含み、該アダプター断片が、分子バーコード、プライマー配列、およびアダプター配列を含み、かつ該適合されたワトソン鎖の分子バーコードが、該適合されたクリック鎖の分子バーコードの逆相補体である、該段階; ならびに(b) 該適合された二本鎖DNA分子の両方の鎖をコピーする段階であって、該コピーする段階が、(i) 該適合された二本鎖DNA分子を、タグ付けされたプライマーと接触させることと、(ii) 該適合された二本鎖DNA分子の線状伸長のラウンドを実施し、タグ付けされたワトソン鎖およびタグ付けされたクリック鎖を生成することとを含む、該段階を含むことができる。
分析物核酸
本明細書において提供されるさまざまな方法のいずれかによって分析される核酸は、任意のタイプの核酸(例えば、DNA、RNAおよびDNA/RNAハイブリッド)を含むことができる。分析することができる核酸の例としては、ゲノムDNAおよび無細胞DNA (cfDNA) (例えば、血中循環腫瘍DNA (ctDNA)、または無細胞胎児DNA (cffDNA)が挙げられるが、これらに限定されることはない。いくつかの態様において、分析される核酸は、二本鎖DNA分子であることができる。いくつかの態様において、二本鎖DNA分子はワトソン鎖を含むことができ、ここでワトソン鎖は二本鎖DNA分子の第1の一本鎖である。いくつかの態様において、二本鎖DNA分子はクリック鎖を含むことができ、ここでクリック鎖は二本鎖DNA分子の第2の一本鎖である。
本明細書において提供されるさまざまな方法のいずれかによって分析される核酸は、任意のタイプの核酸(例えば、DNA、RNAおよびDNA/RNAハイブリッド)を含むことができる。分析することができる核酸の例としては、ゲノムDNAおよび無細胞DNA (cfDNA) (例えば、血中循環腫瘍DNA (ctDNA)、または無細胞胎児DNA (cffDNA)が挙げられるが、これらに限定されることはない。いくつかの態様において、分析される核酸は、二本鎖DNA分子であることができる。いくつかの態様において、二本鎖DNA分子はワトソン鎖を含むことができ、ここでワトソン鎖は二本鎖DNA分子の第1の一本鎖である。いくつかの態様において、二本鎖DNA分子はクリック鎖を含むことができ、ここでクリック鎖は二本鎖DNA分子の第2の一本鎖である。
いくつかの態様において、分析される二本鎖DNA分子は核酸断片(例えば、DNA断片)である。いくつかの態様において、核酸断片は手作業で産生される。いくつかの態様において、断片は剪断(例えば、酵素剪断、化学的手段による剪断、アコースティック剪断、噴霧化、遠心剪断、ポイント-シンク剪断、針剪断、超音波処理、制限エンドヌクレアーゼ、非特異的ヌクレアーゼ(例えば、DNase I)、またはそれらの任意の組み合わせ)によって産生される。いくつかの態様において、核酸断片は対象において天然に産生される。例えば、分析される核酸断片は、cfDNA (例えば、血中循環腫瘍DNA (ctDNA)、または無細胞胎児DNA (cffDNA)であることができる。
いくつかの態様において、分析される核酸断片は、約4~約1000ヌクレオチド(例えば、約10~約1000、約20~約1000、約30~約1000、約40~約1000、約50~約1000、約60~約1000、約70~約1000、約80~約1000、約90~約1000、約100~約1000、約250~約1000、約500~約1000、約750~約1000、約4~約750、約10~約750、約20~約750、約30~約750、約40~約750、約50~約750、約60~約750、約70~約750、約80~約750、約90~約750、約100~約750、約250~約750、約500~約750、約4~約500、約10~約500、約20~約500、約30~約500、約40~約500、約50~約500、約60~約500、約70~約500、約80~約500、約90~約500、約100~約500、約250~約500、約4~約250、約10~約250、約20~約250、約30~約250、約40~約250、約50~約250、約60~約250、約70~約250、約80~約250、約90~約250、約100~約250、約4~約100、約10~約100、約20~約100、約30~約100、約40~約100、約50~約100、約60~約100、約70~約100、約80~約100、約90~約100、約4~約90、約10~約90、約20~約90、約30~約90、約40~約90、約50~約90、約60~約90、約70~約90、約80~約90、約4~約80、約10~約80、約20~約80、約30~約80、約40~約80、約50~約80、約60~約80、約70~約80、約4~約70、約10~約70、約20~約70、約30~約70、約40~約70、約50~約70、約60~約70、約4~約60、約10~約60、約20~約60、約30~約60、約40~約60、約50~約60、約4~約50、約10~約50、約20~約50、約30~約50、約40~約50、約4~約40、約10~約40、約20~約40、約30~約40、約4~約30、約10~約30、約20~約30、約4~約20、約10~約20または約4~約10)の長さを有する。いくつかの態様において、分析される核酸断片の長さは、1000未満(例えば、750未満、500未満、250未満、100未満、50未満または20未満)のヌクレオチドでありうる。
いくつかの態様において、分析される核酸(例えば、核酸の一方または両方の末端)に存在する配列が、内因性バーコードとして用いられる。いくつかの態様において、DNA断片の末端は、断片の内因性バーコード(例えば、固有の識別子)として用いることができる固有の配列に相当する。当業者は、例えば、全体的な鋳型の長さ、分割または出発核酸サンプル中の核酸鋳型の複雑さなどのような因子を用いて、核酸鋳型を固有に識別するために必要な内因性バーコードの長さを決定しうる。いくつかの態様において、核酸鋳型の末端の約10~約500ヌクレオチド(例えば、約25~約500、約50~約500、約100~約500、約250~約500、約10~約250、約25~約250、約50~約250、約100~約250、約10~約100、約25~約100、約50~約100、約10~約50、約25~約50または約10~約25ヌクレオチド)が内因性バーコードとして用いられる。いくつかの態様において、核酸鋳型の両方の末端が内因性バーコードとして用いられる。いくつかの態様において、核酸鋳型の一方の末端のみが内因性バーコードとして用いられる。
いくつかの態様において、分析される核酸は、生物学的サンプル中に存在し、および/または生物学的サンプルから得ることができる。生物学的サンプルは対象から得られうる。いくつかの態様において、対象は哺乳動物である。核酸が得られ、本明細書において記述される方法において核酸鋳型として用いられうる哺乳動物の例としては、非限定的に、ヒト、非ヒト霊長類(例えば、サル)、イヌ、ネコ、ヒツジ、ウサギ、マウス、ハムスターおよびラットが挙げられる。いくつかの態様において、対象はヒト対象である。
生物学的サンプルは、血漿、血清、血液、組織、腫瘍サンプル、便、喀痰、唾液、尿、汗、涙、腹水、気管支肺胞洗浄液、精液、考古学的標本および法医学的サンプルを含むが、これらに限定されることはない。いくつかの態様において、生物学的サンプルは固形の生物学的サンプル、例えば腫瘍サンプルである。いくつかの態様において、固形の生物学的サンプルは処理される。固形の生物学的サンプルは、ホルマリン溶液中での固定、次いでパラフィン中での包埋によって処理されうる(例えば、FFPEサンプルである)。あるいは、処理は、プローブに基づくアッセイを実施する前にサンプルを凍結することを含んでもよい。いくつかの態様において、サンプルは固定も凍結もされない。非固定、非凍結サンプルは、単なる例として、核酸の保存用に構成された貯蔵溶液中に貯蔵することができる。
いくつかの態様において、生物学的サンプルは液体の生物学的サンプルである。液体の生物学的サンプルは、血漿、血清、血液、喀痰、唾液、尿、汗、涙、腹水、気管支肺胞洗浄液および精液を含むが、これらに限定されることはない。いくつかの態様において、液体の生物学的サンプルは、無細胞または実質的に無細胞である。いくつかの態様において、生物学的サンプルは血漿または血清サンプルである。いくつかの態様において、液体の生物学的サンプルは全血サンプルである。いくつかの態様において、液体の生物学的サンプルは末梢血単核細胞を含む。
いくつかの態様において、分析される核酸は生物学的サンプルから単離され、精製される。核酸は、当技術分野において公知の任意の手段を用いて、生物学的サンプルから単離および精製することができる。例えば、生物学的サンプルは、細胞から核酸を放出させるために、または生物学的サンプルの不要な成分(例えば、タンパク質、細胞壁、他の夾雑物)から核酸を分離するために処理されうる。さらにまたはあるいは、液体抽出(例えば、Trizol、DNAzol)技法を用いて、核酸を生物学的サンプルから抽出することができる。核酸は市販のキット(例えば、Qiagen DNeasyキット、QIAampキット、Qiagen Midiキット、QIAprep spinキット)を用いて抽出することもできる。
核酸はほんの一例として、遠心分離を含む、公知の方法によって濃縮することができる。核酸は、精製の目的で選択的膜(例えば、シリカ)に結合させることができる。核酸は、所望の長さの断片、例えば、長さが1000、500、400、300、200または100塩基対未満の断片について濃縮することもできる。サイズに基づくそのような濃縮は、例えば、PEG誘導沈殿、電気泳動ゲルまたはクロマトグラフィー材料(Huber et al. (1993) Nucleic Acids Res. 21:1061-6)、ゲルろ過クロマトグラフィー、TSKゲル(Kato et al. (1984) J. Biochem, 95:83-86)を用いて実施することができ、これらの刊行物は参照により本明細書に組み入れられる。
いくつかの態様において、分析される核酸を含む核酸サンプルは、約35 ng未満の核酸を含む。例えば、核酸サンプルは約1 ng~約35 ngの核酸(例えば、約1 ng~約30 ng、約1 ng~約25 ng、約1 ng~約20 ng、約1 ng~約15 ng、約1 ng~約10 ng、約1 ng~約5 ng、約5 ng~約35 ng、約5 ng~約30 ng、約5 ng~約25 ng、約5 ng~約20 ng、約5 ng~約15 ng、約5 ng~約10 ng、約10 ng~約35 ng、約10 ng~約30 ng、約10 ng~約25 ng、約10 ng~約20 ng、約10 ng~約25 ng、約10 ng~約20 ng、約10 ng~約15 ng、約15 ng~約35 ng、約15 ng~約30 ng、約15 ng~約25 ng、約15 ng~約20 ng、約20 ng~約35 ng、約20 ng~約30 ng、約20 ng~約25 ng、約25 ng~約35 ng、約25 ng~約30 ngまたは約30 ng~約35 ngの核酸)を含むことができる。場合によっては、核酸サンプルは、約数百ヌクレオチド超の核酸を含むゲノムからの核酸を含むことができる。
場合によっては、分析される核酸を含む核酸サンプルは、本質的に夾雑のないものでありうる。例えば、核酸サンプルが、分析されるcfDNA核酸を含む場合、cfDNAは、本質的にゲノムDNA夾雑のないものでありうる。場合によっては、本質的にゲノムDNA夾雑のないcfDNAを含む核酸サンプルは、高分子量(例えば、1000 bp超の) DNAを最小限しか含まない(または全く含まない)こともありうる。場合によっては、本明細書において記述される方法は、核酸サンプルが本質的に夾雑のないものであるかどうかを決定する段階を含むことができる。任意の適切な方法を用いて、核酸サンプルが本質的に夾雑のないものであるかどうかを決定することができる。核酸サンプルが本質的に夾雑のないものであるかどうかを決定するために用いることができる方法の例としては、例えば、TapeStationシステムおよびBioanalyzerが挙げられる。例えば、cfDNAサンプルが本質的にゲノムDNA夾雑のないものであるかどうかを決定するためにTapeStationシステムおよび/またはBioanalyzerを用いる場合、およそ180 bpの顕著なピーク(例えば、単核体DNAに対応する)を用いて、核酸サンプルが本質的にゲノムDNA夾雑のないものであることを示すことができる。
場合によっては、(例えば、核酸断片の3'末端に3'二重鎖アダプターを付着させる前に)二重鎖シーケンシングライブラリを生成するために用いることができる核酸断片は、末端修復することができる。任意の適切な方法を用いて、核酸鋳型を末端修復することができる。例えば、平滑末端化反応(例えば、平滑末端ライゲーション)および/または脱リン酸化反応を用いて、核酸鋳型を末端修復することができる。場合によっては、平滑末端化は一本鎖領域をフィルインすることを含むことができる。場合によっては、平滑末端化は一本鎖領域を分解することを含むことができる。場合によっては、平滑末端化および脱リン酸化反応を用いて、核酸鋳型を末端修復することができる。
アダプター
本明細書において用いられる場合、「アダプター」および「アダプター断片」は、ライゲーション、ハイブリダイゼーション、およびタグメンテーションを含むが、これらに限定されない、多くの異なる技法のいずれか1つを用いて、ポリヌクレオチド配列に結合させることができる種を指すことができる。いくつかの態様において、アダプター断片は、機能を付加する核酸配列、例えば、スペーサー配列、プライマー配列/部位、またはバーコード配列(例えば、UID配列)であることもできる。
本明細書において用いられる場合、「アダプター」および「アダプター断片」は、ライゲーション、ハイブリダイゼーション、およびタグメンテーションを含むが、これらに限定されない、多くの異なる技法のいずれか1つを用いて、ポリヌクレオチド配列に結合させることができる種を指すことができる。いくつかの態様において、アダプター断片は、機能を付加する核酸配列、例えば、スペーサー配列、プライマー配列/部位、またはバーコード配列(例えば、UID配列)であることもできる。
いくつかの態様において、本明細書において記述される方法は、適合された二本鎖DNA分子を生成するために、二本鎖DNA分子の各末端にアダプター断片を付着させる段階であって、該適合された二本鎖DNA分子が、適合されたワトソン鎖および適合されたクリック鎖を含み、該アダプター断片が、分子バーコード、プライマー配列、およびアダプター配列を含み、かつ該適合されたワトソン鎖の分子バーコードが、該適合されたクリック鎖の分子バーコードの逆相補体である、該段階を含む。いくつかの態様において、プライマー配列はアダプター配列の逆相補体であることができる。いくつかの態様において、アダプター配列は、シーケンスライブラリを生成する際にシーケンシングを可能にするための特定の配列を含むことができる。いくつかの態様において、アダプター配列はシーケンシングプライマー配列(例えば、R1、R2)を含む。
いくつかの態様において、アダプター断片は、分子バーコードを含む二本鎖部分と、(i) 一本鎖3'アダプター配列および(ii) 一本鎖5'アダプター配列を含むフォーク部分とを含む。いくつかの態様において、一本鎖3'アダプター配列は一本鎖5'アダプター配列と相補的でない。いくつかの態様において、3'アダプター配列は第2の(例えば、R2)シーケンシングプライマー部位を含み、5'アダプター配列は第1の(例えば、R1)シーケンシングプライマー部位を含む。「R1」および「R2」シーケンシングプライマー部位は、ペアエンドリード、例えば、配列決定されるDNA断片の反対側の末端からのリードを産生するシーケンシングシステムによって用いられることが理解されるべきである。いくつかの態様において、R1シーケンシングプライマーは、DNA断片の第1の末端からのリードの第1の集団を産生するために用いられ、R2シーケンシングプライマーは、DNA断片の反対側の末端からのリードの第2の集団を産生するために用いられる。第1の集団は、本明細書において「R1」または「リード1」リードといわれる。第2の集団は、本明細書において「R2」または「リード2」リードといわれる。R1およびR2リードは、二本鎖分析物DNA断片の各鎖に対応する「リード対」または「メイト対」としてアライメントすることができる。
ある特定のシーケンシングシステム(例えば、Illumina)では、「R1」および「R2」プライマー、ならびに「R1」および「R2」リードといわれるものを利用する。本出願の目的のために、「R1」および「R2」、ならびに「リード1」および「リード2」という用語は、特定のシーケンシングプラットフォームに関連して参照される方法に限定されないことに留意すべきである。例えば、Illuminaシーケンサーが用いられる場合、本明細書において開示される「R2」プライマーおよび対応するR2リードは、Illumina「R2」プライマーおよびリードを指すことができ、または本明細書において開示される「R1」プライマーおよび対応するR1リードが他のIlluminaプライマーおよびリードを指す限り、Illumina「R1」プライマーおよびリードを指すことができる。明確にするために、本明細書において提供される「R2」プライマーが「R1」リードを生ずるIllumina「R1」プライマーであるいくつかの態様において、本明細書において提供される対応する「R1」プライマーは、「R2」リードを生ずるIllumina「R2」プライマーである。明確にするために、本明細書において提供される「R2」プライマーが「R2」リードを提供するIllumina「R2」プライマーであるいくつかの態様において、本明細書において提供される「R1」プライマーは、R1リードを提供するIllumina「R1」プライマーである。
いくつかの態様において、適合された二本鎖DNA分子は、アダプターが二本鎖DNA分子に付着している該二本鎖DNA分子であることができる。いくつかの態様において、アダプター断片はサンプルバーコードをさらに含む。いくつかの態様において、サンプルバーコードは分子バーコードとは異なり、ここでサンプルバーコードは、二本鎖DNA分子が得られたサンプルに固有である。いくつかの態様において、第1のサンプルからの第1の二本鎖DNA分子は、第1のサンプルに固有の第1のサンプルバーコードを含む第1のアダプター断片と接触させることができる。いくつかの態様において、第2のサンプルからの第2の二本鎖DNA分子は、第2のサンプルに固有の第2のサンプルバーコードを含む第2のアダプター断片と接触させることができる。いくつかの態様において、第1の適合された二本鎖DNA分子および第2の適合された二本鎖DNA分子は、本明細書において記述される方法のいずれかにおいて用いられる適合された二本鎖DNA分子の集団において混合することができる。いくつかの態様において、第1および第2の適合された二本鎖DNA分子の混合は、付着させる段階(a)およびコピーする段階(b)の後に実施することができる。いくつかの態様において、第1および第2の適合された二本鎖DNA分子の混合は、適合された二本鎖DNA分子を、タグ付けされたプライマーと接触させた後に実施することができる。いくつかの態様において、第1および第2の適合された二本鎖DNA分子の混合は、増幅された産物を変性条件に供する段階(c)の後に実施することができる。
いくつかの態様において、二本鎖DNA分子の集団は、同じサンプルバーコードを含む複数の二本鎖DNA分子を含むことができる。いくつかの態様において、二本鎖DNA分子の集団は、異なるサンプルバーコードを含む複数の二本鎖DNA分子を含むことができる。
分子バーコード
本明細書において用いられる場合、「分子バーコード」は、バーコード付けおよび増幅の前に、オリジナルのサンプル中の個々の核酸断片を同定するのに役立つバーコードを指す。いくつかの態様において、各個々の核酸断片は、固有の分子バーコードを有する。いくつかの態様において、バーコードは、ランダムに生成されたヌクレオチド配列または意図的に選択されたヌクレオチドランであってもよい。特に分子バーコードを付着させる場合、反応混合物中の個々の分子バーコードの数は、核酸断片の数を超えるであろう。
本明細書において用いられる場合、「分子バーコード」は、バーコード付けおよび増幅の前に、オリジナルのサンプル中の個々の核酸断片を同定するのに役立つバーコードを指す。いくつかの態様において、各個々の核酸断片は、固有の分子バーコードを有する。いくつかの態様において、バーコードは、ランダムに生成されたヌクレオチド配列または意図的に選択されたヌクレオチドランであってもよい。特に分子バーコードを付着させる場合、反応混合物中の個々の分子バーコードの数は、核酸断片の数を超えるであろう。
いくつかの態様において、分子バーコードは核酸サンプル中の各二本鎖DNA断片に固有である。いくつかの態様において、分子バーコードは、内因性バーコード、外因性バーコード、または両方を含む。
いくつかの態様において、分子バーコードは約2~約4000 (例えば、約2~約3500、約2~約3000、約2~約2500、約2~約2000、約2~約1500、約2~約1000、約2~約500、約2~約100、約2~約50、約2~約20、約2~約10、約10~約4000、約10~約3500、約10~約3000、約10~約2500、約10~約2000、約10~約1500、約10~約1000、約10~約500、約10~約100、約10~約50、約10~約20、約20~約4000、約20~約3500、約20~約3000、約20~約2500、約20~約2000、約20~約1500、約20~約1000、約20~約500、約20~約100、約20~約50、約50~約4000、約50~約3500、約50~約3000、約50~約2500、約50~約2000、約50~約1500、約50~約1000、約50~約500、約50~約100、約100~約4000、約100~約3500、約100~約3000、約100~約2500、約100~約2000、約100~約1500、約100~約1000、約100~約500、約500~約4000、約500~約3500、約500~約3000、約500~約2500、約500~約2000、約500~約1500、約500~約1000、約1000~約4000、約1000~約3500、約1000~約3000、約1000~約2500、約1000~約2000、約1000~約1500、約1500~約4000、約1500~約3500、約1500~約3000、約1500~約2500、約1500~約2000、約2000~約4000、約2000~約3500、約2000~約3000、約2000~約2500、約2500~約4000、約2500~約3500、約2500~約3000、約3000~約4000、約3000~約3500または約3500~約4000)ヌクレオチドの長さを有する。いくつかの態様において、分子バーコードの長さは、分子に固有にバーコード付けするのに十分であり、分子バーコードの長さ/配列は下流の増幅段階を妨害しない。
いくつかの態様において、分子バーコード配列はランダムであることができる。いくつかの態様において、分子バーコード配列はランダムなN-merであることができる。例えば、分子バーコード配列が6 ntの長さを有する場合、それはランダムな六量体でありうる。分子バーコード配列が12 ntの長さを有する場合、それはランダムな12-merでありうる。
いくつかの態様において、分子バーコードは、識別子として用いられる長さを有する配列を形成するために、ヌクレオチドのランダムな付加を用いて作製することができる。各付加位置で、4つのデオキシリボヌクレオチドからの1つの選択が用いられうる。あるいは、3つ、2つまたは1つのデオキシリボヌクレオチドからの1つの選択が用いられてもよい。このように、分子バーコードは、完全にランダムであってもよく、ある程度ランダムであってもよく、または特定の位置において非ランダムであってもよい。いくつかの態様において、分子バーコードはランダムなN-merではなく、分子バーコード配列の所定のセットから選択される。本明細書において開示される方法で用いるのに適した例示的な分子バーコードは、PCT/US2012/033207に記述されており、これは参照によりその全体が本明細書に組み入れられる。
核酸断片への分子バーコードの付着は、酵素的、化学的または生物学的な手段を含めて、当技術分野において公知の任意の手段によって実施されうる。いくつかの態様において、1つの手段ではポリメラーゼ連鎖反応を利用する。いくつかの態様において、別の手段ではリガーゼ酵素を利用する。例えば、リガーゼ酵素は、哺乳動物または細菌のものでありうる。付着のために用いられうる他の酵素は、他のポリメラーゼ酵素である。分子バーコードは断片の一方または両方の末端に、好ましくは両方の末端に付加されうる。いくつかの態様において、分子バーコードは、他の意図された機能性のための他の領域を含む核酸分子内に含まれうる。例えば、後の増幅を可能にするために、ユニバーサルプライミング部位が付加されうる。いくつかの態様において、別の付加部位は、核酸断片中の特定の領域または遺伝子と相補性の領域でありうる。
(2) タグ付けされた二本鎖DNA分子
いくつかの態様において、本明細書において記述される方法は、(b) 適合された二本鎖DNA分子の両方の鎖をコピーする段階であって、該コピーする段階が、(i) 該適合された二本鎖DNA分子を、タグ付けされたプライマーと接触させることと、(ii) 該適合された二本鎖DNA分子の線状伸長のラウンドを実施し、タグ付けされたワトソン鎖およびタグ付けされたクリック鎖を生成することとを含む、該段階を含む。いくつかの態様において、コピーする段階は、単一ラウンドの線状伸長を実施することを含むことができる。いくつかの態様において、コピーする段階は、1、2、または3ラウンドの線状伸長を実施することを含むことができる。いくつかの態様において、コピーする段階は、1ラウンドまたは複数ラウンド(例えば、1、2、3、4、または5ラウンド)の線状伸長を実施することを含むことができる。いくつかの態様において、タグ付けされたプライマーはウラシル含有ビオチン化プライマーであり、かつタグ付けされたワトソン鎖およびクリック鎖は、該ウラシル含有ビオチン化プライマーから生成される。いくつかの態様において、タグ付けされたワトソン鎖およびクリック鎖は、ビオチン化-ストレプトアビジン親和性を当技術分野で公知の任意の数の方法(例えば、ストレプトアビジンビーズ)のなかで用いて選択することができる。
いくつかの態様において、本明細書において記述される方法は、(b) 適合された二本鎖DNA分子の両方の鎖をコピーする段階であって、該コピーする段階が、(i) 該適合された二本鎖DNA分子を、タグ付けされたプライマーと接触させることと、(ii) 該適合された二本鎖DNA分子の線状伸長のラウンドを実施し、タグ付けされたワトソン鎖およびタグ付けされたクリック鎖を生成することとを含む、該段階を含む。いくつかの態様において、コピーする段階は、単一ラウンドの線状伸長を実施することを含むことができる。いくつかの態様において、コピーする段階は、1、2、または3ラウンドの線状伸長を実施することを含むことができる。いくつかの態様において、コピーする段階は、1ラウンドまたは複数ラウンド(例えば、1、2、3、4、または5ラウンド)の線状伸長を実施することを含むことができる。いくつかの態様において、タグ付けされたプライマーはウラシル含有ビオチン化プライマーであり、かつタグ付けされたワトソン鎖およびクリック鎖は、該ウラシル含有ビオチン化プライマーから生成される。いくつかの態様において、タグ付けされたワトソン鎖およびクリック鎖は、ビオチン化-ストレプトアビジン親和性を当技術分野で公知の任意の数の方法(例えば、ストレプトアビジンビーズ)のなかで用いて選択することができる。
本明細書において用いられる場合、「伸長」という用語は、2つの核酸配列が、それぞれの末端相補的核酸配列(すなわち、例えば、3'末端)の重なりによって連結(例えば、ハイブリダイズ)される方法を指すことができる。そのような連結に続いて、他方の核酸配列を伸長用鋳型として用いて、一方または両方の末端の核酸伸長(例えば、酵素的伸長)を行うことができる。
いくつかの態様において、核酸伸長は一般に、連続する核酸が酵素(ポリメラーゼまたは逆転写酵素などの)により組み込まれ、それによって新たに合成された核酸分子が生成されるような、鋳型依存的な様式で1つまたは複数の核酸(例えば、A、G、C、T、U、ヌクレオチド類似体、またはそれらの誘導体)を核酸配列に組み込むことを伴う。いくつかの態様において、酵素的伸長は、ポリメラーゼおよび/または逆転写酵素を含むが、これらに限定されない、酵素によって実施することができる。例えば、相補的な核酸配列とハイブリダイズするプライマーを使って、相補的な核酸配列を核酸合成用の鋳型として用いることにより、新たな核酸分子を合成することができる。
いくつかの態様において、プライマーは、核酸伸長反応において核酸ポリメラーゼの化学的基質として用いることができる3'末端を有する一本鎖核酸配列であることができる。RNAプライマーはRNAヌクレオチドから形成され、RNA合成において用いられ、一方でDNAプライマーはDNAヌクレオチドから形成され、DNA合成において用いられる。プライマーは、RNAヌクレオチドおよびDNAヌクレオチドの両方を(例えば、ランダムなパターンまたはデザインされたパターンで)含むこともできる。いくつかの態様において、プライマーは、追加の機能性を有しうる、本明細書において記述される他の天然または合成ヌクレオチドを含むこともできる。
いくつかの態様において、プライマーは、別の特異的なまたは特定の分子または部分と会合または結合するために高い親和性または選好性を有する分子または分子部分であるタグを含むことができる。いくつかの態様において、別の特異的なまたは特定の分子または部分との会合または結合は、水素結合、イオン力およびファンデルワールス相互作用などの、非共有結合相互作用によるものであることができる。例えば、親和性基は、タンパク質アビジンまたはストレプトアビジンに会合または結合する高い親和性または選好性を有するビオチンであることができる。あるいは、親和性基は、ビオチンに対する親和性を有するアビジンまたはストレプトアビジンを指すこともできる。親和性基およびそれが結合または会合する特異的なまたは特定の分子または部分の他の例としては、抗体または抗体断片およびその各抗原、例えばジゴキシゲニンおよび抗ジゴキシゲニン抗体、レクチン、炭水化物(例えば、糖類、単糖類、二糖類または多糖類)、ならびに受容体および受容体リガンドが挙げられるが、これらに限定されることはない。いくつかの態様において、タグ付けされたプライマーはビオチン化プライマーであり、かつタグ付けされたワトソン鎖およびクリック鎖が、ビオチン化プライマーから生成される。いくつかの態様において、タグ付けされたプライマーはウラシル含有ビオチン化プライマーであり、かつタグ付けされたワトソン鎖およびクリック鎖は、該ウラシル含有ビオチン化プライマーから生成される。いくつかの態様において、タグ付けされたワトソン鎖およびクリック鎖は、ビオチン化-ストレプトアビジン親和性を当技術分野で公知の任意の数の方法(例えば、ストレプトアビジンビーズ)のなかで用いて選択することができる。
(3) 二本鎖DNA分子の変性
いくつかの態様において、本方法は、(c) 増幅された産物を変性条件に供する段階も含む。いくつかの態様において、変性条件はNaOH変性を含む。いくつかの態様において、変性条件は、熱変性、化学変性、またはそれらの組み合わせを含むことができるが、これらに限定されることはない。いくつかの態様において、二本鎖DNA分子は、熱を用いることによって変性させることができる。いくつかの態様において、二本鎖DNA分子の変性は、化学変性によって達成することができる。いくつかの態様において、化学変性はNaOH処理を含むことができる。いくつかの態様において、二本鎖DNA分子は、塩を用いることによって変性させることができる。いくつかの態様において、二本鎖DNA分子は、塩および追加の化学物質(例えば、イソプロパノールおよびエタノール)を用いることによって変性させることができる。
いくつかの態様において、本方法は、(c) 増幅された産物を変性条件に供する段階も含む。いくつかの態様において、変性条件はNaOH変性を含む。いくつかの態様において、変性条件は、熱変性、化学変性、またはそれらの組み合わせを含むことができるが、これらに限定されることはない。いくつかの態様において、二本鎖DNA分子は、熱を用いることによって変性させることができる。いくつかの態様において、二本鎖DNA分子の変性は、化学変性によって達成することができる。いくつかの態様において、化学変性はNaOH処理を含むことができる。いくつかの態様において、二本鎖DNA分子は、塩を用いることによって変性させることができる。いくつかの態様において、二本鎖DNA分子は、塩および追加の化学物質(例えば、イソプロパノールおよびエタノール)を用いることによって変性させることができる。
(4) 分析物DNA断片の回収および生成
いくつかの態様において、本明細書において記述される方法のいずれかは、(d) 適合されたワトソン鎖およびクリック鎖と、タグ付けされたワトソン鎖およびクリック鎖とを別々に回収する段階; (e) タグ付けされたワトソン鎖およびクリック鎖から分析物DNA断片の第1の集団を生成する段階、ならびに分析物DNA断片の第1の集団のうちの少なくとも1つの成員について第1のシーケンシングリードを生成する段階; ならびに(f) 適合されたワトソン鎖およびクリック鎖から分析物DNA断片の第2の集団を生成する段階、ならびに分析物DNA断片の第2の集団のうちの少なくとも1つの成員について第2のシーケンシングリードを生成する段階を含むことができる。いくつかの態様において、回収する段階(d)は、タグ付けされたワトソン鎖およびクリック鎖をストレプトアビジン官能化ビーズと接触させることを含み、かつここで、タグ付けされたワトソン鎖およびクリック鎖は、該ストレプトアビジン官能化ビーズに結合する。
いくつかの態様において、本明細書において記述される方法のいずれかは、(d) 適合されたワトソン鎖およびクリック鎖と、タグ付けされたワトソン鎖およびクリック鎖とを別々に回収する段階; (e) タグ付けされたワトソン鎖およびクリック鎖から分析物DNA断片の第1の集団を生成する段階、ならびに分析物DNA断片の第1の集団のうちの少なくとも1つの成員について第1のシーケンシングリードを生成する段階; ならびに(f) 適合されたワトソン鎖およびクリック鎖から分析物DNA断片の第2の集団を生成する段階、ならびに分析物DNA断片の第2の集団のうちの少なくとも1つの成員について第2のシーケンシングリードを生成する段階を含むことができる。いくつかの態様において、回収する段階(d)は、タグ付けされたワトソン鎖およびクリック鎖をストレプトアビジン官能化ビーズと接触させることを含み、かつここで、タグ付けされたワトソン鎖およびクリック鎖は、該ストレプトアビジン官能化ビーズに結合する。
いくつかの態様において、変換されたDNA分子の集団を含む分析物DNA断片の第2の集団を生成すべくシトシン塩基をウラシル塩基に変換するために、ストレプトアビジン官能化ビーズに結合していない、回収された、適合されたワトソン鎖およびクリック鎖が、バイサルファイトで処理される。いくつかの態様において、バイサルファイト処理は、DNA分子中のC塩基をU塩基に効率的に変換することができる。いくつかの態様において、この変換は2つの鎖(例えば、ワトソン鎖およびクリック鎖)を区別可能にする。いくつかの態様において、バイサルファイトでの変換を用いて、T塩基に変換されないメチル化C塩基を、非メチル化C塩基と区別し、それによってエピジェネティックな変化を明らかにすることができる。
いくつかの態様において、タグ付けされたワトソン鎖およびクリック鎖は、親和性基と、それが結合または会合するその特異的なまたは特定の分子または部分との任意の対を用いることにより分離することができる。例えば、親和性基は、タンパク質アビジンまたはストレプトアビジンに会合または結合する高い親和性または選好性を有するビオチンであることができる。あるいは、親和性基は、ビオチンに対する親和性を有するアビジンまたはストレプトアビジンを指すこともできる。いくつかの態様において、タグ付けされたワトソン鎖およびクリック鎖は、ビオチン化-ストレプトアビジン親和性を当技術分野で公知の任意の数の方法(例えば、ストレプトアビジンビーズ)のなかで用いて選択することができる。親和性基およびそれが結合または会合する特異的なまたは特定の分子または部分の他の例としては、抗体または抗体断片およびその各抗原、例えばジゴキシゲニンおよび抗ジゴキシゲニン抗体、レクチン、炭水化物(例えば、糖類、単糖類、二糖類または多糖類)、ならびに受容体および受容体リガンドが挙げられるが、これらに限定されることはない。
いくつかの態様において、回収する段階は、タグ付けされたワトソン鎖およびクリック鎖を分離するために磁気ビーズを用いることを含むことができる。いくつかの態様において、磁気ビーズは、ストレプトアビジンで共有結合的にコーティングすることができ、ビオチン化されタグ付けされたワトソン鎖およびクリック鎖に結合することができる。いくつかの態様において、磁気ビーズは、磁石を用いることにより精製することができる。いくつかの態様において、磁気ビーズは、遠心分離により回収することができ、ろ過または流動選別によってサイズ分画することができる。
いくつかの態様において、タグ付けされたワトソン鎖およびクリック鎖は単一のビーズに結合することができ、ここでビーズは蛍光プローブで染色され、フローサイトメトリーを用いて計数される。特定の変種を表すビーズを任意で、流動選別によって回収し、その後の確認および実験のために用いてもよい。いくつかの態様において、ビーズは微小球または微粒子であることができる。粒子サイズは、直径が約0.1~10ミクロンの間でさまざまでありうる。典型的には、ビーズはポリスチレンなどの高分子材料で作られるが、シリカなどの非高分子材料も用いることができる。使用することができる他の材料は、スチレン共重合体、メチルメタクリレート、官能化ポリスチレン、ガラス、シリコンおよびカルボキシレートを含む。任意で、粒子は超常磁性であってもよく、これにより反応に用いられた後のその精製が容易になる。いくつかの態様において、ビーズは、疎水性または親水性などの総表面特性を変化させるか、または結合特異性を付与する分子を付着させるために、他の材料との共有性または非共有結合性の相互作用によって修飾することができる。そのような分子は抗体、リガンド、特異的結合タンパク質対の成員、受容体、核酸を含むことができるが、これらに限定されることはない。特異的結合タンパク質対はアビジン-ビオチン、ストレプトアビジン-ビオチンおよび第VII因子-組織因子を含む。
いくつかの態様において、タグ付けされたワトソン鎖およびクリック鎖は、USER (ウラシル特異的切除試薬)酵素による処理を用いることにより分離することができ、ここでUSER酵素は、ウラシルDNAグリコシラーゼと、鎖の5'末端内に埋め込まれたデオキシウリジン塩基を標的とするDNAグリコシラーゼ-リアーゼエンドヌクレアーゼVIIIとの混合物を含む。
遺伝的特徴 - 配列の決定
本明細書において用いられる場合、「遺伝的特徴」という用語は、各細胞分裂時に親細胞から子孫細胞へと複製され受け継がれる遺伝情報および/または材料を指す。いくつかの態様において、遺伝的特徴は核酸(例えば、DNA分子)における変異であることができる。いくつかの態様において、変異は、挿入、欠失、置換、欠失-挿入、重複、逆位、フレームシフト、反復拡張、転座、およびそれらの組み合わせからなる群より選択される。いくつかの態様において、遺伝的特徴の同定は、変異分析、異数性分析、またはフラグメントミクスを含むことができる。本明細書において開示される方法で用いるのに適した遺伝的特徴を同定するための例示的な方法は、PCT/US2021/017937に記述されており、これは参照によりその全体が本明細書に組み入れられる。
本明細書において用いられる場合、「遺伝的特徴」という用語は、各細胞分裂時に親細胞から子孫細胞へと複製され受け継がれる遺伝情報および/または材料を指す。いくつかの態様において、遺伝的特徴は核酸(例えば、DNA分子)における変異であることができる。いくつかの態様において、変異は、挿入、欠失、置換、欠失-挿入、重複、逆位、フレームシフト、反復拡張、転座、およびそれらの組み合わせからなる群より選択される。いくつかの態様において、遺伝的特徴の同定は、変異分析、異数性分析、またはフラグメントミクスを含むことができる。本明細書において開示される方法で用いるのに適した遺伝的特徴を同定するための例示的な方法は、PCT/US2021/017937に記述されており、これは参照によりその全体が本明細書に組み入れられる。
(a) アダプターが付着した鋳型の初期増幅
アダプター付着後、適合された二本鎖DNA分子を初期増幅反応において増幅(例えば、PCR増幅)することができる。任意の適切な方法を用いて、適合された二本鎖DNA分子を増幅することができる。適合された二本鎖DNA分子を増幅するために用いることができる例示的な方法は、非限定的に、全ゲノムPCRを含む。いくつかの態様において、適合された二本鎖DNA分子は、単一ラウンドの線状伸長を実施することによって増幅される。いくつかの態様において、適合された二本鎖DNA分子は、1、2、または3ラウンドの線状伸長を実施することによって増幅される。いくつかの態様において、適合された二本鎖DNA分子は、1ラウンドまたは複数ラウンド(例えば、1、2、3、4、または5ラウンド)の線状伸長を実施することによって増幅される。
アダプター付着後、適合された二本鎖DNA分子を初期増幅反応において増幅(例えば、PCR増幅)することができる。任意の適切な方法を用いて、適合された二本鎖DNA分子を増幅することができる。適合された二本鎖DNA分子を増幅するために用いることができる例示的な方法は、非限定的に、全ゲノムPCRを含む。いくつかの態様において、適合された二本鎖DNA分子は、単一ラウンドの線状伸長を実施することによって増幅される。いくつかの態様において、適合された二本鎖DNA分子は、1、2、または3ラウンドの線状伸長を実施することによって増幅される。いくつかの態様において、適合された二本鎖DNA分子は、1ラウンドまたは複数ラウンド(例えば、1、2、3、4、または5ラウンド)の線状伸長を実施することによって増幅される。
任意の適切なプライマー対を用いて、適合された二本鎖DNA分子を増幅することができる。いくつかの態様において、ユニバーサルプライマー対を用いることができる。プライマーは、非限定的に、約12ヌクレオチド~約30ヌクレオチドを含むことができる。いくつかの態様において、任意の適切なPCR条件を初期増幅において用いることができる。PCR増幅は変性相、アニーリング相および伸長相を含むことができる。増幅サイクルの各相は、任意の適切な条件を含むことができる。場合によっては、変性相は約90℃~約105℃(例えば、約94℃~約98℃)の温度、および約1秒~約5分(例えば、約10秒~約1分)の時間を含むことができる。例えば、変性相は約10秒間、約98℃の温度を含むことができる。場合によっては、アニーリング相は約50℃~約72℃の温度、および約30秒~約90秒の時間を含むことができる。場合によっては、伸長相は約55℃~約80℃の温度、および生成されるアンプリコン1 kbあたり約15秒~生成されるアンプリコン1 kbあたり約30秒の時間を含むことができる。場合によっては、アニーリング相および伸長相を単一サイクルにおいて実施することができる。例えば、アニーリング相および伸長相は約75秒間、約65℃の温度を含むことができる。
初期増幅において用いられるPCR条件は、任意の適切な数のPCR増幅サイクルを含むことができる。場合によっては、PCR増幅は約1~約50 (例えば、約5~約50、約10~約50、約15~約50、約20~約50、約25~約50、約30~約50、約35~約50、約40~約50、約45~約50、約1~約45、約5~約45、約10~約45、約15~約45、約20~約45、約25~約45、約30~約45、約35~約45、約40~約45、約1~約40、約5~約40、約10~約40、約15~約40、約20~約40、約25~約40、約30~約40、約35~約40、約1~約35、約5~約35、約10~約35、約15~約35、約20~約35、約25~約35、約30~約35、約1~約30、約5~約30、約10~約30、約15~約30、約20~約30、約25~約30、約1~約25、約5~約25、約10~約25、約15~約25、約20~約25、約1~約20、約5~約20、約10~約20、約15~約20、約1~約15、約5~約15、約10~約15、約1~約10、約5~約10または約1~約5)サイクルを含むことができる。いくつかの態様において、PCR増幅は11サイクル以下を含む。いくつかの態様において、PCR増幅は7サイクル以下を含む。いくつかの態様において、PCR増幅は5サイクル以下を含む。
場合によっては、PCR条件が熱活性化ポリメラーゼを含む場合、PCR増幅は初期化段階も含むことができる。例えば、PCR増幅はPCR増幅サイクルを実施する前に初期化段階を含むことができる。場合によっては、初期化段階は約94℃~約98℃の温度、および約15秒~約1分の時間を含むことができる。例えば、初期化段階は約30秒間、約98℃の温度を含むことができる。
場合によっては、PCR増幅は保持段階も含むことができる。例えば、PCR増幅はPCR増幅サイクルを実施した後に、任意で最終伸長段階を実施した後に、保持段階を含むことができる。場合によっては、保持段階は限定されていない時間量の間、約4℃~約15℃の温度を含むことができる。
場合によっては、本明細書において記述されるように生成された二重鎖シーケンシングライブラリ(例えば、増幅された二重鎖シーケンシングライブラリ)を精製することができる。任意の適切な方法を用いて、二重鎖シーケンシングライブラリを精製することができる。二重鎖シーケンシングライブラリを精製するために用いることができる例示的な方法は、非限定的に、磁気ビーズ(例えば、固相可逆固定化(SPRI)磁気ビーズ)を含む。
(b) 任意のssDNAライブラリ調製
場合によっては、二重鎖シーケンシングライブラリを用いて、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成することができる。一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成することにより、(例えば、3'二重鎖アダプターまたは5'アダプターなどのライゲーション配列に相補的なプライマーからの)非特異的増幅を最小限に抑えることができる。任意の適切な方法を用いて、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを(例えば、本明細書に記載のように作製された二重鎖シーケンシングライブラリから)生成することができる。場合によっては、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリは、増幅産物を少なくとも2つのアリコットに分割し、各アリコットを、ワトソン鎖が第1のアリコットから増幅され、クリック鎖が第2のアリコットから増幅されるPCR増幅に供することによって、増幅された二重鎖シーケンシングライブラリから生成することができる。例えば、増幅された二重鎖シーケンシングライブラリからの増幅産物の第1のアリコットを、第1のプライマーがビオチン化されており、かつ第2のプライマーが非ビオチン化されているプライマー対を用いたPCR増幅に供して、ワトソン鎖の一本鎖ライブラリを生成することができ、増幅された二重鎖シーケンシングライブラリからの増幅産物の第2のアリコットを、第1のプライマーが非ビオチン化されており、かつ第2のプライマーがビオチン化されているプライマー対を用いたPCR増幅に供して、クリック鎖の一本鎖ライブラリを生成することができる。場合によっては、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成することができる。
場合によっては、二重鎖シーケンシングライブラリを用いて、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成することができる。一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成することにより、(例えば、3'二重鎖アダプターまたは5'アダプターなどのライゲーション配列に相補的なプライマーからの)非特異的増幅を最小限に抑えることができる。任意の適切な方法を用いて、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを(例えば、本明細書に記載のように作製された二重鎖シーケンシングライブラリから)生成することができる。場合によっては、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリは、増幅産物を少なくとも2つのアリコットに分割し、各アリコットを、ワトソン鎖が第1のアリコットから増幅され、クリック鎖が第2のアリコットから増幅されるPCR増幅に供することによって、増幅された二重鎖シーケンシングライブラリから生成することができる。例えば、増幅された二重鎖シーケンシングライブラリからの増幅産物の第1のアリコットを、第1のプライマーがビオチン化されており、かつ第2のプライマーが非ビオチン化されているプライマー対を用いたPCR増幅に供して、ワトソン鎖の一本鎖ライブラリを生成することができ、増幅された二重鎖シーケンシングライブラリからの増幅産物の第2のアリコットを、第1のプライマーが非ビオチン化されており、かつ第2のプライマーがビオチン化されているプライマー対を用いたPCR増幅に供して、クリック鎖の一本鎖ライブラリを生成することができる。場合によっては、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成することができる。
任意の適切な方法を用いて、増幅された二重鎖シーケンシングライブラリから一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成することができる。例えば、増幅された二重鎖シーケンシングライブラリからの増幅産物を、PCRプライマー対における2つのプライマーのうちの一方のみがタグ付けされている、第1のPCR増幅および第2のPCR増幅に分離することができる。例えば、第1のPCR増幅では、タグ付けされているプライマー(例えば、第1のプライマー)およびタグ付けされていないプライマー(例えば、第2のプライマー)を含むプライマー対を用いることができ、第2のPCR増幅では、タグ付けされていないプライマー(例えば、第1のプライマー)およびタグ付けされているプライマー(例えば、第2のプライマー)を含むプライマー対を用いることができる。プライマータグは、タグ付けされたプライマーから生成されたPCR増幅産物を、回収することを可能にする任意のタグであることができる。場合によっては、タグ付けされたプライマーはビオチン化されたプライマーであることができ、ビオチン化されたプライマーから生成されたPCR増幅産物はストレプトアビジンを用いて回収することができる。場合によっては、タグ付けされたプライマーは、ウラシルを含有するビオチン化されたプライマーであることができ、ウラシルを含有するビオチン化されたプライマーから生成されたPCR増幅産物はストレプトアビジンを用いて回収することができる。例えば、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリは、ビオチン化プライマーおよび非ビオチン化プライマーを含むプライマー対を用いるPCR増幅において生成することができる。場合によっては、タグ付けされたプライマーはリン酸化されたプライマーであることができ、リン酸化されたプライマーから生成されたPCR増幅産物はラムダヌクレアーゼを用いて回収することができる。例えば、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリは、リン酸化プライマーおよび非リン酸化プライマーを含むプライマー対を用いるPCR増幅において生成することができる。
任意の適切なプライマー対を用いて、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリから)生成することができる。プライマーは、非限定的に、約12ヌクレオチド~約30ヌクレオチドを含むことができる。場合によっては、プライマー対は、(例えば、増幅の前に二重鎖シーケンシングライブラリにおける核酸断片に、第1の分子バーコードを含む3'二重鎖アダプターおよび第2の分子バーコードを含む5'アダプターをライゲーションすることによって)本明細書において記述されるように生成された増幅産物に存在するアダプター配列(例えば、分子バーコードを含むアダプター配列)を標的とする(例えば、標的とし、それに結合する)ことができる少なくとも1つのプライマーを含むことができる。本明細書において記述される一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成するために用いることができるプライマー対の例は、非限定的に、P5プライマーおよびP7プライマーを含む。
任意の適切なPCR条件を用いて、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリから)生成することができる。PCR増幅は変性相、アニーリング相および伸長相を含むことができる。増幅サイクルの各相は、任意の適切な条件を含むことができる。場合によっては、変性相は約90℃~約105℃の温度、および約1秒~約5分の時間を含むことができる。例えば、変性相は約10秒間、約98℃の温度を含むことができる。場合によっては、アニーリング相は約50℃~約72℃の温度、および約30秒~約90秒の時間を含むことができる。場合によっては、伸長相は約55℃~約80℃の温度、および生成されるアンプリコン1 kbあたり約15秒~生成されるアンプリコン1 kbあたり約30秒の時間を含むことができる。場合によっては、伸長相は、用いられるポリメラーゼの処理能力を反映する。場合によっては、アニーリング相および伸長相は単一のサイクルにおいて実施することができる。例えば、アニーリング相および伸長相は約75秒間、約65℃の温度を含むことができる。
一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリから)生成するために用いられるPCR条件は、任意の適切な数のPCR増幅サイクルを含むことができる。場合によっては、PCR増幅は、非限定的に、約1~約50 (例えば、約5~約50、約10~約50、約15~約50、約20~約50、約25~約50、約30~約50、約35~約50、約40~約50、約45~約50、約1~約45、約5~約45、約10~約45、約15~約45、約20~約45、約25~約45、約30~約45、約35~約45、約40~約45、約1~約40、約5~約40、約10~約40、約15~約40、約20~約40、約25~約40、約30~約40、約35~約40、約1~約35、約5~約35、約10~約35、約15~約35、約20~約35、約25~約35、約30~約35、約1~約30、約5~約30、約10~約30、約15~約30、約20~約30、約25~約30、約1~約25、約5~約25、約10~約25、約15~約25、約20~約25、約1~約20、約5~約20、約10~約20、約15~約20、約1~約15、約5~約15、約10~約15、約1~約10、約5~約10または約1~約5)サイクルを含むことができる。例えば、PCR増幅は約4増幅サイクルを含むことができる。いくつかの態様において、PCR増幅は約8増幅サイクルを含むことができる。いくつかの態様において、PCR増幅は約11増幅サイクルを含むことができる。
場合によっては、PCR条件が熱活性化ポリメラーゼを含む場合、PCR増幅は初期化段階も含むことができる。例えば、PCR増幅はPCR増幅サイクルを実施する前に初期化段階を含むことができる。場合によっては、初期化段階は約94℃~約98℃の温度、および約15秒~約1分の時間を含むことができる。例えば、初期化段階は約30秒間、約98℃の温度を含むことができる。
場合によっては、PCR増幅は保持段階も含むことができる。例えば、PCR増幅はPCR増幅サイクルを実施した後に、任意で最終伸長段階を実施した後に、保持段階を含むことができる。場合によっては、保持段階は限定されていない時間量の間、約4℃~約15℃の温度を含むことができる。
任意の適切な方法を用いて、二本鎖増幅産物を一本鎖増幅産物に分離することができる。場合によっては、二本鎖増幅産物を変性させて、二本鎖増幅産物を2つの一本鎖増幅産物に分離することができる。二本鎖増幅産物を一本鎖増幅産物に分離するために用いることができる方法の例は、非限定的に、熱変性、化学(例えば、NaOH)変性、および塩変性を含む。
PCR増幅後、タグ付けされたワトソン鎖およびクリック鎖を回収することができる。タグ付けされたプライマーを用いて生成されたタグ付けされたワトソン鎖およびクリック鎖を回収するために、任意の適切な方法を用いることができる。タグ付けされたプライマーがビオチン化されたプライマーである場合、(例えば、ビオチン化されたプライマーから生成された)ビオチン化された増幅産物は、ストレプトアビジン(例えば、ストレプトアビジン官能化ビーズ)を用いて回収することができる。例えば、増幅された二重鎖シーケンシングライブラリが、第1のビオチン化プライマーおよび第2の非ビオチン化プライマーを含むプライマー対を用いる第1のPCR増幅、ならびに第1の非ビオチン化プライマーおよび第2のビオチン化プライマーを含むプライマー対を用いる第2のPCR増幅においてさらに増幅される場合、第1のPCR増幅から生成されるビオチン化された増幅産物は、ストレプトアビジン官能化ビーズ(例えば、第1のセットのストレプトアビジン官能化ビーズ)に結合させることができ、第2のPCR増幅から生成されるビオチン化された増幅産物は、ストレプトアビジン官能化ビーズ(例えば、第1第2 (first second)のストレプトアビジン官能化ビーズ)に結合させることができ、二本鎖増幅産物を一本鎖の増幅産物に分離する(例えば、変性させる)ことができる。場合によっては、ビオチン化されたPCR増幅産物を回収することは、ストレプトアビジン(例えば、ストレプトアビジン官能化ビーズ)からビオチン化されたPCR増幅産物を放出させることも含むことができる。第1のビオチン化プライマーおよび第2の非ビオチン化プライマーを含むプライマー対を用いた第1のPCR増幅、ならびに第1の非ビオチン化プライマーおよび第2のビオチン化プライマーを含むプライマー対を用いた第2のPCR増幅によって生成された二本鎖増幅産物を分離することは、ビオチン化プライマーから生成された一本鎖増幅産物をストレプトアビジン官能化ビーズに結合したままにすることを可能にすることができ、一方で、非ビオチン化プライマーから生成された一本鎖増幅産物をストレプトアビジン官能化ビーズから変性させ(例えば、変性させ、かつ分解し)、それにより二重鎖シーケンシングライブラリのうちの一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成することができる。
タグ付けされたプライマーがリン酸化されたプライマーである場合、(例えば、リン酸化されたプライマーから生成される)リン酸化された増幅産物は、エキソヌクレアーゼ(例えば、ラムダエキソヌクレアーゼ)を用いて回収することができる。例えば、増幅された二重鎖シーケンシングライブラリが、第1のリン酸化プライマーおよび第2の非リン酸化プライマーを含むプライマー対を用いる第1のPCR増幅、ならびに第1の非リン酸化プライマーおよび第2のリン酸化プライマーを含むプライマー対を用いる第2のPCR増幅においてさらに増幅される場合、二本鎖増幅産物を一本鎖の増幅産物に分離することができる。第1のリン酸化プライマーおよび第2の非リン酸化プライマーを含むプライマー対を用いる第1のPCR増幅、ならびに第1の非リン酸化プライマーおよび第2のリン酸化プライマーを含むプライマー対を用いる第2のPCR増幅によって生成された二本鎖増幅産物を分離することは、非リン酸化プライマーから生成された一本鎖増幅産物を回収することを可能にすることができ、一方で、リン酸化プライマーから生成された一本鎖増幅産物をラムダエキソヌクレアーゼによって分解し、それにより二重鎖シーケンシングライブラリのうちの一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成することができる。
(c) 標的濃縮
本明細書における方法のいずれか1つのいくつかの態様において、初期増幅によって産生される増幅産物は、1つまたは複数の標的ポリヌクレオチドについて濃縮される。いくつかの態様において、標的濃縮の前に、一本鎖DNAライブラリが初期増幅によって産生された増幅産物から調製される。一本鎖DNAライブラリを産生するための例示的な方法が、本明細書において記述される。
本明細書における方法のいずれか1つのいくつかの態様において、初期増幅によって産生される増幅産物は、1つまたは複数の標的ポリヌクレオチドについて濃縮される。いくつかの態様において、標的濃縮の前に、一本鎖DNAライブラリが初期増幅によって産生された増幅産物から調製される。一本鎖DNAライブラリを産生するための例示的な方法が、本明細書において記述される。
任意の適切な方法を用いて、増幅産物のライブラリ(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリ、一本鎖ワトソン鎖由来の配列のライブラリ、または一本鎖クリック鎖由来の配列のライブラリ)から標的領域を増幅することができる。場合によっては、(例えば、増幅の前に、二重鎖シーケンシングライブラリにおける核酸断片に、第1の分子バーコードを含む3'二重鎖アダプターおよび第2の分子バーコードを含む5'アダプターをライゲーションすることにより)本明細書において記述されるように生成された増幅産物に存在するアダプター配列(例えば、分子バーコードを含むアダプター配列)を標的とする(例えば、標的とし、それに結合する)ことができるプライマー(例えば、第1のプライマー)、ならびに標的領域(例えば、関心対象の領域)を標的とする(例えば、標的とし、それに結合する)ことができるプライマー(例えば、第2のプライマー)である、プライマー対を用いてPCR増幅に増幅産物のライブラリを供することにより増幅産物のライブラリから標的領域を増幅することができる。
場合によっては、単一のPCR増幅において増幅産物のライブラリ(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリ、一本鎖ワトソン鎖由来の配列のライブラリ、または一本鎖クリック鎖由来の配列のライブラリ)から標的領域を増幅することができる。例えば、(例えば、増幅の前に、二重鎖シーケンシングライブラリにおける核酸断片に、第1の分子バーコードを含む3'二重鎖アダプターおよび第2の分子バーコードを含む5'アダプターをライゲーションすることにより)本明細書において記述されるように生成された増幅産物に存在するアダプター配列(例えば、分子バーコードを含むアダプター配列)を標的とすることができる第1のプライマー、ならびに標的領域を標的とすることができる第2のプライマーを含むプライマー対を用い単一のPCR増幅において増幅産物のライブラリから標的領域を増幅することができる。
場合によっては、複数のPCR増幅において増幅産物のライブラリ(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリ、一本鎖ワトソン鎖由来の配列のライブラリ、または一本鎖クリック鎖由来の配列のライブラリ)から標的領域を増幅することができる。複数のPCR増幅(例えば、最初のPCR増幅と後続のネステッドPCR増幅)を用いて、標的領域を増幅する特異性を増加させることができる。例えば、第1のPCR増幅では、(例えば、増幅の前に、二重鎖シーケンシングライブラリにおける核酸断片に、第1の分子バーコードを含む3'二重鎖アダプターおよび第2の分子バーコードを含む5'アダプターをライゲーションすることにより)本明細書において記述されるように生成された増幅産物に存在するアダプター配列(例えば、分子バーコードを含むアダプター配列)を標的とすることができる第1のプライマー、ならびに標的領域を標的とすることができる第2のプライマーを含むプライマー対を用い、第1のPCR増幅において生成された増幅産物を、(例えば、増幅の前に、二重鎖シーケンシングライブラリにおける核酸断片に、第1の分子バーコードを含む3'二重鎖アダプターおよび第2の分子バーコードを含む5'アダプターをライゲーションすることにより)本明細書において記述されるように生成された増幅産物に存在するアダプター配列(例えば、分子バーコードを含むアダプター配列)を標的とすることができる第1のプライマー、ならびに第1のPCR増幅において生成された増幅産物に存在する標的領域からの核酸配列を標的とすることができる第2のプライマーを含むプライマー対を用いる後続のネステッドPCR増幅に供する、一連のPCR増幅において増幅産物のライブラリから標的領域を増幅することができる。
任意の適切なプライマー対を用いて、増幅産物のライブラリ(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリ、一本鎖ワトソン鎖由来の配列のライブラリ、または一本鎖クリック鎖由来の配列のライブラリ)から標的領域を増幅することができる。プライマーは、非限定的に、約12ヌクレオチド~約30ヌクレオチドを含むことができる。場合によっては、プライマー対は、(例えば、増幅の前に、二重鎖シーケンシングライブラリにおける核酸断片に、第1の分子バーコードを含む3'二重鎖アダプターおよび第2の分子バーコードを含む5'アダプターをライゲーションすることにより)本明細書において記述されるように生成された増幅産物に存在するアダプター配列(例えば、分子バーコードを含むアダプター配列)を標的とする(例えば、標的とし、それに結合する)ことができるプライマー(例えば、第1のプライマー)、ならびに標的領域(例えば、関心対象の領域)を標的とする(例えば、標的とし、それに結合する)ことができるプライマー(例えば、第2のプライマー)を含むことができる。(例えば、増幅の前に、二重鎖シーケンシングライブラリにおける核酸断片に、第1の分子バーコードを含む3'二重鎖アダプターおよび第2の分子バーコードを含む5'アダプターをライゲーションすることにより)本明細書において記述されるように生成された増幅産物に存在する分子バーコードを含むアダプター配列を標的とすることができるプライマーの例は、非限定的に、i5インデックスプライマーおよびi7インデックスプライマーを含む。標的領域を標的とすることができるプライマーは、標的領域に相補的な配列を含むことができる。標的領域がTP53をコードする核酸である場合、TP53をコードする核酸を標的とすることができるプライマーの例は、非限定的に、TP53_342_GSP1およびTP53_GSP2を含む。
場合によっては、増幅産物のライブラリ(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリ、一本鎖ワトソン鎖由来の配列のライブラリ、または一本鎖クリック鎖由来の配列のライブラリ)から標的領域を増幅するために用いられるプライマー対の一方または両方のプライマーは、1つまたは複数の分子バーコードを含むことができる。
場合によっては、増幅産物のライブラリ(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリ、一本鎖ワトソン鎖由来の配列のライブラリ、または一本鎖クリック鎖由来の配列のライブラリ)から標的領域を増幅するために用いられるプライマー対の一方または両方のプライマーは、1つまたは複数グラフト配列(例えば、次世代シーケンシングのためのグラフト配列)を含むことができる。
いくつかの態様において、標的濃縮は、(a) ワトソン標的選択的プライマー対の第1のセットであって、(i) ユニバーサル3'アダプター配列のR2シーケンシングプライマー部位に相補的な配列を含む第1のワトソン標的選択的プライマーと、(ii) 標的選択的な配列を含む第2のワトソン標的選択的プライマーとを含み、それにより標的ワトソン増幅産物を作製する、該ワトソン標的選択的プライマー対の第1のセットによって、標的ポリヌクレオチド配列を含むワトソン鎖の増幅産物を選択的に増幅する段階と、(b) クリック標的選択的プライマー対の第1のセットであって、(i) ユニバーサル5'アダプター配列のR1シーケンシングプライマー部位に相補的な配列を含む第1のクリック標的選択的プライマーと、(ii) 第2のワトソン標的選択的プライマー配列と同じ標的選択的な配列を含む第2のクリック標的選択的プライマーとを含み、それにより標的クリック増幅産物を作製する、該クリック標的選択的プライマー対の第1のセットによって、同じ標的ポリヌクレオチド配列を含むクリック鎖の増幅産物を選択的に増幅する段階とを含む。
いくつかの態様において、本方法は、標的ワトソン増幅産物および標的クリック増幅産物を非標的ポリヌクレオチドから精製する段階をさらに含む。いくつかの態様において、精製する段階は、標的ワトソン増幅産物および標的クリック増幅産物を固体支持体に付着させる段階を含む。いくつかの態様において、第1のワトソン標的選択的プライマーおよび第1のクリック標的選択的プライマーは、親和性結合対の第1の成員を含み、ここで固体支持体は親和性結合対の第2の成員を含む。いくつかの態様において、第1の成員はビオチンであり、かつ第2の成員はストレプトアビジンである。いくつかの態様において、固体支持体はビーズ、ウェル、膜、チューブ、カラム、プレート、セファロース、磁気ビーズまたはチップを含む。いくつかの態様において、本方法は、固体支持体に付着していないポリヌクレオチドを除去する段階を含む。
いくつかの態様において、本方法は、(a) ワトソン標的選択的プライマーの第2のセットであって、(i) ユニバーサル3'アダプター配列のR2シーケンシングプライマー部位に相補的な配列を含む第3のワトソン標的選択的プライマーと、(ii) 5'から3'方向に、R1シーケンシングプライマー部位および同じ標的ポリヌクレオチドに対して選択的な標的選択的配列を含む第4のワトソン標的選択的プライマーとを含み、それにより標的ワトソンライブラリ成員を作製する、該ワトソン標的選択的プライマーの第2のセットによって、標的ワトソン増幅産物をさらに増幅する段階と、(b) クリック標的選択的プライマーの第2のセットであって、(i) ユニバーサル3'アダプター配列のR1シーケンシングプライマー部位に相補的な配列を含む第3のクリック標的選択的プライマーと、(ii) 5'から3'方向に、R2シーケンシングプライマー部位および第4のワトソン標的選択的プライマーについての同じ標的ポリヌクレオチドに対して選択的な標的選択的配列を含む第4のクリック標的選択的プライマーとを含み、それにより標的クリックライブラリ成員を作製する、該クリック標的選択的プライマーの第2のセットによって、標的クリック増幅産物をさらに増幅する段階とをさらに含む。
いくつかの態様において、第3のワトソン標的選択的プライマーおよび第3のクリック標的選択的プライマーは、サンプルバーコード配列をさらに含む。いくつかの態様において、第3のワトソン標的選択的プライマーは、シーケンサー上の第1のグラフト用プライマーへのハイブリダイゼーションを可能にする第1のグラフト用配列をさらに含み、かつここで第3のクリック標的選択的プライマーが、シーケンサー上の第2のグラフト用プライマーへのハイブリダイゼーションを可能にする第2のグラフト用配列をさらに含む。いくつかの態様において、第4のワトソン標的選択的プライマーは、第2のグラフト用配列をさらに含み、かつここで第4のクリック標的選択的プライマーが、第1のグラフト用配列をさらに含む。いくつかの態様において、第1のグラフト用配列はP7配列であり、かつここで第2のグラフト用配列がP5配列である。
任意の適切なPCR条件を用いて、(例えば、生成された二重鎖シーケンシングライブラリ、一本鎖ワトソン鎖由来の配列のライブラリ、または一本鎖クリック鎖由来の配列のライブラリなどの増幅産物のライブラリから)本明細書において記述される増幅された標的領域を生成することができる。例示的なPCR条件は本明細書において記述される。(例えば、生成された二重鎖シーケンシングライブラリ、一本鎖ワトソン鎖由来の配列のライブラリ、または一本鎖クリック鎖由来の配列のライブラリなどの増幅産物のライブラリから)本明細書において記述される増幅された標的領域を生成するために用いられるPCR条件は、任意の適切な数のPCR増幅サイクルを含むことができる。場合によっては、PCR増幅は、非限定的に、約1~約50 (例えば、約5~約50、約10~約50、約15~約50、約20~約50、約25~約50、約30~約50、約35~約50、約40~約50、約45~約50、約1~約45、約5~約45、約10~約45、約15~約45、約20~約45、約25~約45、約30~約45、約35~約45、約40~約45、約1~約40、約5~約40、約10~約40、約15~約40、約20~約40、約25~約40、約30~約40、約35~約40、約1~約35、約5~約35、約10~約35、約15~約35、約20~約35、約25~約35、約30~約35、約1~約30、約5~約30、約10~約30、約15~約30、約20~約30、約25~約30、約1~約25、約5~約25、約10~約25、約15~約25、約20~約25、約1~約20、約5~約20、約10~約20、約15~約20、約1~約15、約5~約15、約10~約15、約1~約10、約5~約10または約1~約5)サイクルを含むことができる。例えば、増幅された標的領域のPCR増幅が単一のPCR増幅を含む場合、PCR増幅は約18増幅サイクルを含むことができる。例えば、増幅された標的領域のPCR増幅が最初のPCR増幅と後続のネステッドPCR増幅を含む場合、最初のPCR増幅は約18増幅サイクルを含むことができ、後続のネステッドPCR増幅は約10増幅サイクルを含むことができる。
(d) 例示的な標的
任意の適切な標的領域(例えば、関心対象の領域)を、増幅産物のライブラリ(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリ、一本鎖ワトソン鎖由来の配列のライブラリ、または一本鎖クリック鎖由来の配列のライブラリ)から増幅させ、1つまたは複数の変異の存在または非存在について評価することができる。場合によっては、標的領域は、1つまたは複数の変異が疾患または障害に関連する核酸の領域であることができる。増幅させ、1つまたは複数の変異の存在または非存在について評価することができる標的領域の例は、非限定的に、腫瘍タンパク質p53 (TP53)をコードする核酸、乳がん1 (BRCA1)をコードする核酸、BRCA2をコードする核酸、ホスファターゼ・テンシン相同体(PTEN)ポリペプチドをコードする核酸、AKT1ポリペプチドをコードする核酸、APCポリペプチドをコードする核酸、CDKN2Aポリペプチドをコードする核酸、EGFRポリペプチドをコードする核酸、FBXW7ポリペプチドをコードする核酸、GNASポリペプチドをコードする核酸、KRASポリペプチドをコードする核酸、NRASポリペプチドをコードする核酸、PIK3CAポリペプチドをコードする核酸、BRAFポリペプチドをコードする核酸、CTNNB1ポリペプチドをコードする核酸、FGFR2ポリペプチドをコードする核酸、HRASポリペプチドをコードする核酸、およびPPP2R1Aポリペプチドをコードする核酸を含む。場合によっては、増幅させ、1つまたは複数の変異の存在または非存在について評価することができる標的領域は、TP53をコードする核酸であることができる。
任意の適切な標的領域(例えば、関心対象の領域)を、増幅産物のライブラリ(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリ、一本鎖ワトソン鎖由来の配列のライブラリ、または一本鎖クリック鎖由来の配列のライブラリ)から増幅させ、1つまたは複数の変異の存在または非存在について評価することができる。場合によっては、標的領域は、1つまたは複数の変異が疾患または障害に関連する核酸の領域であることができる。増幅させ、1つまたは複数の変異の存在または非存在について評価することができる標的領域の例は、非限定的に、腫瘍タンパク質p53 (TP53)をコードする核酸、乳がん1 (BRCA1)をコードする核酸、BRCA2をコードする核酸、ホスファターゼ・テンシン相同体(PTEN)ポリペプチドをコードする核酸、AKT1ポリペプチドをコードする核酸、APCポリペプチドをコードする核酸、CDKN2Aポリペプチドをコードする核酸、EGFRポリペプチドをコードする核酸、FBXW7ポリペプチドをコードする核酸、GNASポリペプチドをコードする核酸、KRASポリペプチドをコードする核酸、NRASポリペプチドをコードする核酸、PIK3CAポリペプチドをコードする核酸、BRAFポリペプチドをコードする核酸、CTNNB1ポリペプチドをコードする核酸、FGFR2ポリペプチドをコードする核酸、HRASポリペプチドをコードする核酸、およびPPP2R1Aポリペプチドをコードする核酸を含む。場合によっては、増幅させ、1つまたは複数の変異の存在または非存在について評価することができる標的領域は、TP53をコードする核酸であることができる。
任意の適切な方法を用いて、1つまたは複数の変異の存在または非存在について標的領域(例えば、増幅された標的領域)を評価することができる。場合によっては、1つまたは複数のシーケンシング法を用いて、1つまたは複数の変異の存在または非存在について、増幅された標的領域を評価することができる。
(e) 配列の決定
場合によっては、1つまたは複数のシーケンシング法を用いて、増幅された標的領域を評価し、変異がワトソン鎖およびクリック鎖の両方に存在するかどうかを決定することができる。場合によっては、シーケンシングリードを用いて、1つまたは複数の変異の存在または非存在について、増幅された標的領域を評価することができ、シーケンシングリードを用いて、変異がワトソン鎖およびクリック鎖の両方に存在するかどうかを決定することができる。本明細書において記述される1つまたは複数の変異の存在または非存在について、増幅された標的領域を評価するために用いることができるシーケンシング法の例は、非限定的に、単一リードシーケンシング、ペアエンドシーケンシング、NGS、およびディープシーケンシングを含む。いくつかの態様において、単一リードシーケンシングは、鋳型の全長にわたってシーケンスリードを生成するシーケンシングを含む。いくつかの態様において、シーケンシングはペアエンドシーケンシングを含む。いくつかの態様において、シーケンシングは超並列シーケンサーで実施される。いくつかの態様において、超並列シーケンサーは、鋳型ポリヌクレオチドの両末端からシーケンスリードを決定するように構成される。
場合によっては、1つまたは複数のシーケンシング法を用いて、増幅された標的領域を評価し、変異がワトソン鎖およびクリック鎖の両方に存在するかどうかを決定することができる。場合によっては、シーケンシングリードを用いて、1つまたは複数の変異の存在または非存在について、増幅された標的領域を評価することができ、シーケンシングリードを用いて、変異がワトソン鎖およびクリック鎖の両方に存在するかどうかを決定することができる。本明細書において記述される1つまたは複数の変異の存在または非存在について、増幅された標的領域を評価するために用いることができるシーケンシング法の例は、非限定的に、単一リードシーケンシング、ペアエンドシーケンシング、NGS、およびディープシーケンシングを含む。いくつかの態様において、単一リードシーケンシングは、鋳型の全長にわたってシーケンスリードを生成するシーケンシングを含む。いくつかの態様において、シーケンシングはペアエンドシーケンシングを含む。いくつかの態様において、シーケンシングは超並列シーケンサーで実施される。いくつかの態様において、超並列シーケンサーは、鋳型ポリヌクレオチドの両末端からシーケンスリードを決定するように構成される。
(f) シーケンスリードの分析
いくつかの態様において、シーケンスリードは参照ゲノムにマッピングされる。
いくつかの態様において、シーケンスリードは参照ゲノムにマッピングされる。
いくつかの態様において、シーケンスリードはバーコード(例えば、UID)ファミリーに割り当てられる。バーコードファミリーは、オリジナルの鋳型、例えば、核酸サンプルからのオリジナルの二本鎖DNA断片に由来する増幅された産物からのシーケンスリードを含むことができる。
いくつかの態様において、バーコードファミリーの各成員は、同じ外因性バーコード配列を含む。いくつかの態様において、バーコードファミリーの各成員は、同じ内因性バーコード配列をさらに含む。内因性バーコードは、本明細書において記述される。
いくつかの態様において、バーコードファミリーの各成員は、同じ外因性バーコード配列および同じ内因性バーコード配列をさらに含む。いくつかの態様において、外因性バーコード配列および内因性バーコード配列の組み合わせは、バーコードファミリーに固有である。いくつかの態様において、外因性バーコード配列および内因性バーコード配列の組み合わせは、核酸サンプルにおいて表される別のバーコードファミリーには存在しない。
バーコードファミリーの成員の数はシーケンシングの深さに依存することができる。いくつかの態様において、バーコードファミリーは、少なくとも1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500または1000個の成員を含む。いくつかの態様において、UIDファミリーは約2~1000個の成員、約2~500個の成員、約2~100個の成員、約2~50個の成員、または約2~20個の成員を含む。
いくつかの態様において、個々のバーコードファミリーのシーケンスリードは、ワトソンサブファミリーおよびクリックサブファミリーに割り当てられる。いくつかの態様において、個々のバーコードファミリーのシーケンスリードは、アダプター配列に対する挿入断片の配向に基づいて、ワトソンサブファミリーおよびクリックサブファミリーに割り当てられる。いくつかの態様において、アダプター配列に対する挿入断片の配向は、シーケンスリードが「リード対(read pair)」または「メイト対(mate pair)」としてどのようにアライメントされたかによって解決される。
いくつかの態様において、シーケンスリードのワトソンサブファミリーおよびクリックサブファミリーへの割り当ては、R1リード配列およびR2リード配列に対する外因性バーコード配列の空間的関係に基づく。いくつかの態様において、ワトソンサブファミリーの成員は、外因性バーコード配列がR2配列の下流およびR1配列の上流にあることによって特徴付けられる。いくつかの態様において、クリックサブファミリーの成員は、外因性バーコード配列がR1配列の下流およびR2配列の上流にあることによって特徴付けられる。いくつかの態様において、ワトソンサブファミリーの成員は、外因性バーコード配列がR2配列に大いに近接し、R1配列にあまり近接していないことによって特徴付けられる。いくつかの態様において、クリックサブファミリーの成員は、外因性バーコード配列がR1配列に大いに近接し、R2配列にあまり近接していないことによって特徴付けられる。いくつかの態様において、ワトソンサブファミリーの成員は、外因性バーコード配列が、R2配列のすぐ下流または1~70、1~60、1~50、1~40、1~30、1~20、1~10もしくは1~5ヌクレオチド以内にあることによって特徴付けられる。いくつかの態様において、クリックサブファミリーの成員は、外因性バーコード配列が、R1配列のすぐ下流または1~70、1~60、1~50、1~40、1~30、1~20、1~10もしくは1~5ヌクレオチド以内にあることによって特徴付けられる。
いくつかの態様において、バーコードサブファミリー(例えば、ワトソンサブファミリーおよび/またはクリックサブファミリー)は、少なくとも1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490または500個の成員を含む。いくつかの態様において、バーコードサブファミリー(例えば、ワトソンサブファミリーおよび/またはクリックサブファミリー)は約2~500個の成員、約2~100個の成員、約2~50個の成員、約2~20個の成員、または約2~10個の成員を含む。
いくつかの態様において、ヌクレオチド配列は、ある閾値割合(またはある閾値を超える割合)のワトソンサブファミリーの成員がその配列を含む場合に、分析物DNA断片、例えば、核酸サンプルからの二本鎖DNA断片のワトソン鎖を正確に表すと決定される。いくつかの態様において、ヌクレオチド配列は、ある閾値割合(またはある閾値を超える割合)のクリックサブファミリーの成員がその配列を含む場合に、分析物DNA断片、例えば、核酸サンプルからの二本鎖DNA断片のクリック鎖を正確に表すと決定される。
閾値は、例えば、サブファミリーの成員の数、シーケンシング実験の特定の目的、およびシーケンシング実験の特定のパラメータに基づき当業者によって決定されることができる。いくつかの態様において、閾値は1%、5%、10%、20%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%または100%に設定される。特定の態様において、閾値は50%に設定される。ほんの一例として、閾値が50%に設定される態様において、ヌクレオチド配列は、サブファミリー成員の少なくとも50%がその配列を含む場合に、分析物DNA断片、例えば、核酸サンプルからの二本鎖DNA断片のワトソン鎖またはクリック鎖を正確に表すと決定される。他のほんの一例として、閾値が50%に設定される態様において、ヌクレオチド配列は、サブファミリー成員の50%超がその配列を含む場合に、分析物DNA断片、例えば、核酸サンプルからの二本鎖DNA断片のワトソン鎖またはクリック鎖を正確に表すと決定される。
いくつかの態様において、分析物DNA断片のワトソン鎖を正確に表す配列は、変異を有すると決定される。いくつかの態様において、分析物DNA断片のワトソン鎖を正確に表す配列は、配列が、変異を欠く参照配列と異なる場合、変異を有すると決定される。
いくつかの態様において、分析物DNA断片のクリック鎖を正確に表す配列は、変異を有すると決定される。いくつかの態様において、分析物DNA断片のクリック鎖を正確に表す配列は、配列が、変異を欠く参照配列と異なる場合、変異を有すると決定される。
いくつかの態様において、分析物DNA断片は、ワトソン鎖を正確に表す配列とクリック鎖を正確に表す配列とが同じ変異を含む場合、変異を有すると決定される。
場合によっては、増幅された標的領域のペアエンドシーケンシングリード内の分子バーコードの位置を用いて、増幅された標的領域が二本鎖核酸鋳型のどの鎖に由来するかを区別することができる。例えば、増幅された標的領域の第1のペアエンドシーケンシングリードが、分子バーコードを最後に読み出したことを示す場合、増幅された標的領域は、核酸鋳型のセンス鎖に由来すると同定することができ、増幅された標的領域の第1のペアエンドシーケンシングリードが、分子バーコードを最初に読み出したことを示す場合、増幅された標的領域は、核酸鋳型のアンチセンス鎖に由来すると同定することができる。例えば、増幅された標的領域の第2のペアエンドシーケンシングリードが、分子バーコードを最初に読み出したことを示す場合、増幅された標的領域は、核酸鋳型のアンチセンス鎖に由来すると同定することができ、増幅された標的領域の第2のペアエンドシーケンシングリードが、分子バーコードを最後に読み出したことを示す場合、増幅された標的領域は、核酸鋳型のセンス鎖に由来すると同定することができる。場合によっては、ペアエンドシーケンシングを用いて、ワトソン鎖に由来する増幅産物をクリック鎖に由来する増幅産物と区別することができる。
標的領域(例えば、本明細書において記述されるように増幅された標的領域)のシーケンシング後、シーケンシングリードを、参照ゲノムとアライメントさせ、各シーケンシングリードに存在する分子バーコード別に分類することができる。場合によっては、同じ分子バーコードを含み、二本鎖核酸鋳型のワトソン鎖およびクリック鎖の両方(例えば、標的領域のワトソン鎖およびクリック鎖の両方)にマッピングされるシーケンシングリードは、二重鎖サポート(duplex support)を有すると同定することができる。例えば、標的領域における1つまたは複数の変異の存在を示すシーケンシングリードが、同じ分子バーコードを含み、標的領域のワトソン鎖およびクリック鎖の両方にマッピングされる場合、変異は、二重鎖サポートを有すると同定することができる。
分子バーコードを含む核酸断片の増幅は、バーコード付けされた断片のファミリーを生成するために、公知の技法に従って実施することができる。いくつかの態様において、ポリメラーゼ連鎖反応(PCR)を用いることができる。いくつかの態様において、逆PCRが用いられうる。いくつかの態様において、ローリングサークル増幅を用いることができる。断片の増幅は、典型的には、分子バーコードと同時に断片に付着させる、プライミング部位に相補的なプライマーを用いて行われる。いくつかの態様において、増幅が分子バーコードを含むように、プライミング部位は分子バーコードの遠位にある。
いくつかの態様において、増幅は断片のファミリーを形成し、ファミリーの各成員は同じ分子バーコードを共有している。いくつかの態様において、アダプター断片に存在する分子バーコードの多様性は、断片の多様性を大きく上回っており、したがって各ファミリーは単一の核酸断片分子に由来する。いくつかの態様において、増幅のために用いられるプライマーは、エキソヌクレアーゼに対してより耐性にするために化学的に修飾されうる。いくつかの態様において、ファミリー成員を配列決定し比較して、ファミリー内の任意の相違を同定する。いくつかの態様において、シーケンシングは超並列シーケンシングプラットフォーム上で実施され、その多くが市販されている。シーケンシングプラットフォームが「グラフティング」、すなわちシーケンシング装置への付着のための配列を必要とする場合、そのような配列は、分子バーコードの追加中に追加されてもよく、または別個に追加されてもよい。グラフティング配列は、分子バーコード付きプライマー、ユニバーサルプライマー、遺伝子標的特異的プライマー、ファミリーを作製するために用いられる増幅プライマー、サンプルバーコード付きプライマーの一部であってもよく、または別個であってもよい。冗長シーケンシングは、単一ファミリーの複数の成員のシーケンシングを指す。
いくつかの態様において、核酸断片中の変異を同定するための閾値を設定することができる。「変異」がファミリーの全成員に現れる場合、それは核酸断片に由来する。変異が全成員よりも少ない場合、それは分析中(例えば、増幅段階中)に導入された人工産物でありうる。変異をコールするための閾値は、例えば、1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、97%、98%または100%に設定されうる。いくつかの態様において、変異をコールするための閾値は95%であり、したがって同じバーコードを共有するファミリー成員の95%がその変異を含む場合、その変異は本物であり、人工産物ではないと見なされる。閾値は、配列決定されるファミリーの成員の数、ならびに特定の目的および状況に基づいて設定されるであろう。
いくつかの態様において、1つまたは複数のシーケンシング法を用いて、増幅されたDNA分子を評価し、変異が二本鎖DNA分子の両方の鎖上に存在するかどうかを決定することができる。いくつかの態様において、シーケンシングリードを用いて、1つまたは複数の変異の存在または非存在について、増幅されたDNA分子を評価することができ、シーケンシングリードを用いて、変異が二本鎖DNA分子の両方の鎖上に存在するかどうかを決定することができる。本明細書において記述される1つまたは複数の変異の存在または非存在について、増幅されたDNA分子を評価するために用いることができるシーケンシング法の例は、非限定的に、単一リードシーケンシング、ペアエンドシーケンシング、NGS、およびディープシーケンシングを含む。いくつかの態様において、単一リードシーケンシングは、鋳型の全長にわたってシーケンスリードを生成するシーケンシングを含む。いくつかの態様において、シーケンシングはペアエンドシーケンシングを含む。いくつかの態様において、シーケンシングは超並列シーケンサーで実施される。いくつかの態様において、超並列シーケンサーは、鋳型ポリヌクレオチドの両末端からシーケンスリードを決定するように構成される。
いくつかの態様において、本明細書において記述される方法は、(g) 第1の分析物DNAファミリーを生成するために、分析物DNA断片の第1の集団のうちの少なくとも1つの成員上に存在する分子バーコードに従って第1のシーケンシングリードを分類する段階; (h) 第2の分析物DNAファミリーを生成するために、分析物DNA断片の第2の集団のうちの少なくとも1つの成員上に存在する分子バーコードに従って第2のシーケンシングリードを分類する段階; (i) 第1の分析物DNAファミリー中のタグ付けされたワトソン鎖およびクリック鎖の遺伝的特徴を同定する段階; ならびに(j) 第2の分析物DNAファミリー中の適合されたワトソン鎖およびクリック鎖のエピジェネティックな特徴を同定する段階を含み、したがって、二本鎖DNA分子の少なくとも一方の鎖上に存在する遺伝的特徴およびエピジェネティックな特徴を同定する。いくつかの態様において、本方法は、二本鎖DNA分子の両方の鎖上に存在する遺伝的特徴およびエピジェネティックな特徴を同定することを含む。
エピジェネティックな特徴 - メチル化分析
本明細書において用いられる場合、「エピジェネティックな特徴」という用語は、DNA配列の変化を伴わない遺伝性の表現型変化を指すことができる。いくつかの態様において、エピジェネティックな特徴は、ヌクレオチド配列の変化を伴わないゲノムに対する機能的に関連する変化を含む。いくつかの態様において、エピジェネティックな特徴は、ヒドロキシメチル化、ヒストン修飾、マイクロRNA調節、アセチル化、リン酸化、ユビキチン化、またはSUMO化である。いくつかの態様において、エピジェネティックな特徴はメチル化である。いくつかの態様において、エピジェネティックな特徴はメチル化差異領域(differentially methylated region)(DMR)である。いくつかの態様において、エピジェネティックな特徴はメチル化パターンである。いくつかの態様において、メチル化パターンは、不確定な起源のクローン性造血を介して生成された細胞に存在するメチル化パターンに対応する。いくつかの態様において、メチル化パターンは、起源組織に存在するメチル化パターンに対応する。いくつかの態様において、起源組織は、肛門、膀胱/尿路上皮、乳房、子宮頸部、結腸/直腸、頭頸部、腎臓、肝臓/胆管、肺、リンパ系新生物、黒色腫、骨髄系新生物、卵巣、膵臓/胆嚢、前立腺、甲状腺、上部GI、または子宮である(Cypris et al., Front. Genet. 10:785 (2019), Liu et al., Ann Oncol.31(6):745-759 (2020))。
本明細書において用いられる場合、「エピジェネティックな特徴」という用語は、DNA配列の変化を伴わない遺伝性の表現型変化を指すことができる。いくつかの態様において、エピジェネティックな特徴は、ヌクレオチド配列の変化を伴わないゲノムに対する機能的に関連する変化を含む。いくつかの態様において、エピジェネティックな特徴は、ヒドロキシメチル化、ヒストン修飾、マイクロRNA調節、アセチル化、リン酸化、ユビキチン化、またはSUMO化である。いくつかの態様において、エピジェネティックな特徴はメチル化である。いくつかの態様において、エピジェネティックな特徴はメチル化差異領域(differentially methylated region)(DMR)である。いくつかの態様において、エピジェネティックな特徴はメチル化パターンである。いくつかの態様において、メチル化パターンは、不確定な起源のクローン性造血を介して生成された細胞に存在するメチル化パターンに対応する。いくつかの態様において、メチル化パターンは、起源組織に存在するメチル化パターンに対応する。いくつかの態様において、起源組織は、肛門、膀胱/尿路上皮、乳房、子宮頸部、結腸/直腸、頭頸部、腎臓、肝臓/胆管、肺、リンパ系新生物、黒色腫、骨髄系新生物、卵巣、膵臓/胆嚢、前立腺、甲状腺、上部GI、または子宮である(Cypris et al., Front. Genet. 10:785 (2019), Liu et al., Ann Oncol.31(6):745-759 (2020))。
いくつかの態様において、本明細書において記述される方法を用いて、二本鎖DNA分子の一方または両方の鎖におけるCpGジヌクレオチドでのメチル化を(例えば、両方の鎖を同時に)検出することができる。いくつかの態様において、DNA分子の集団をバイサルファイトで処理して、DNA分子中のシトシン塩基をウラシル塩基に変換し、変換されたDNA分子の集団を形成させる。いくつかの態様において、分子バーコードに付着した過剰の標的特異的な増幅プライマーを用いて、変換されたDNA分子の集団の両鎖に分子バーコードを付着させて、増幅された、バーコード付けされた、変換されたDNA分子の集団を形成させる。いくつかの態様において、増幅された、バーコード付けされた、変換されたDNA分子は、増幅反応において増幅されて、増幅された、バーコード付けされた、変換されたDNA分子のファミリーを形成し、ここで、同じ分子バーコードを共有する、増幅された、バーコード付けされた、変換されたDNA分子が、DNA分子のファミリーを形成する。いくつかの態様において、ファミリーの複数の成員をシーケンシング反応に供して、ファミリーの該複数の成員の両鎖のヌクレオチド配列を得る。いくつかの態様において、ファミリーの複数の成員のヌクレオチド配列が比較され、成員の90%超がCpGジヌクレオチドでの選択されたメチル化Cを含むファミリーが同定される。いくつかの態様において、増幅された、バーコード付けされた、変換されたDNA分子の2つの相補鎖のヌクレオチド配列が比較され、CpGジヌクレオチドでのメチル化Cが2つの相補鎖において同定される。
いくつかの態様において、昇温および低pHでの重亜硫酸ナトリウムとのDNA断片のインキュベーションにより、シトシンが脱アミノ化されて5,6-ジヒドロシトシン-6-スルホネートが形成される。本明細書において開示される方法で用いるための重亜硫酸ナトリウム処理の例示的な方法は、PCT/US2018/022664に記述されており、これは参照によりその全体が本明細書に組み入れられる。その後の高pHでの加水分解的脱アミノ化によりスルホネートが除去され、ウラシルが得られる。この基本反応の多くの修正が記述されており、シトシンと5-メチルシトシン(5-mC)を区別するために主に用いられており、この後者はバイサルファイトでの変換の影響を受けない。CをUに変換することに加えて、バイサルファイト処理はDNAを変性させ、それを分解することができる。この分解はバイサルファイト処理の標準的な用途には限定されないが、変換前に既に分解されている臨床サンプル中の変異検出を伴う用途には重要である。いくつかの態様において、これらの産物のシーケンシングにより、平均して、99.8%超のC塩基が(メチル化またはヒドロキシメチル化されているためバイサルファイトでの変換に抵抗性でありうる、5'-CpG部位のC塩基を除いて)両鎖でT塩基に変換されたことが明らかになっている。
(5) 二本鎖DNA分子の複数の特徴の同定
同様に、本明細書において提供されるのは、二本鎖DNA分子の集団におけるある二本鎖DNA分子の第1の特徴および第2の特徴を、該二本鎖DNA分子の少なくとも一方の鎖をアッセイすることによって同定するための方法であって、以下の段階:(a) 適合された二本鎖DNA分子を生成するために、二本鎖DNA分子の各末端にアダプター断片を付着させる段階であって、該適合された二本鎖DNA分子が、適合されたワトソン鎖および適合されたクリック鎖を含み、該アダプター断片が、分子バーコード、プライマー配列、およびアダプター配列を含み、かつ該適合されたワトソン鎖の分子バーコードが、該適合されたクリック鎖の分子バーコードの逆相補体である、該段階; (b) 該適合された二本鎖DNA分子の両方の鎖をコピーする段階であって、該コピーする段階が、(i) 該適合された二本鎖DNA分子を、タグ付けされたプライマーと接触させることと、(ii) 該適合された二本鎖DNA分子の線状伸長のラウンドを実施し、タグ付けされたワトソン鎖およびタグ付けされたクリック鎖を生成することとを含む、該段階; (c) 増幅された産物を変性条件に供する段階; (d) 該適合されたワトソン鎖およびクリック鎖と、該タグ付けされたワトソン鎖およびクリック鎖とを別々に回収する段階; (e) 該タグ付けされたワトソン鎖およびクリック鎖から分析物DNA断片の第1の集団を生成する段階、ならびに分析物DNA断片の第1の集団のうちの少なくとも1つの成員について第1のシーケンシングリードを生成する段階; (f) 該適合されたワトソン鎖およびクリック鎖から分析物DNA断片の第2の集団を生成する段階、ならびに分析物DNA断片の第2の集団のうちの少なくとも1つの成員について第2のシーケンシングリードを生成する段階; (g) 第1の分析物DNAファミリーを生成するために、分析物DNA断片の第1の集団のうちの該少なくとも1つの成員上に存在する分子バーコードに従って第1のシーケンシングリードを分類する段階; (h) 第2の分析物DNAファミリーを生成するために、分析物DNA断片の第2の集団のうちの該少なくとも1つの成員上に存在する分子バーコードに従って第2のシーケンシングリードを分類する段階; (i) 第1の分析物DNAファミリーにおいて、該タグ付けされたワトソン鎖およびクリック鎖の第1の特徴を同定する段階; ならびに(j) 第2の分析物DNAファミリーにおいて、該適合されたワトソン鎖およびクリック鎖の第2の特徴を同定する段階を含み、したがって、該二本鎖DNA分子の少なくとも一方の鎖上に存在する第1の特徴および第2の特徴を同定する、該方法である。いくつかの態様において、本方法は、二本鎖DNA分子の両方の鎖上に存在する第1の特徴および第2の特徴を同定することを含む。
同様に、本明細書において提供されるのは、二本鎖DNA分子の集団におけるある二本鎖DNA分子の第1の特徴および第2の特徴を、該二本鎖DNA分子の少なくとも一方の鎖をアッセイすることによって同定するための方法であって、以下の段階:(a) 適合された二本鎖DNA分子を生成するために、二本鎖DNA分子の各末端にアダプター断片を付着させる段階であって、該適合された二本鎖DNA分子が、適合されたワトソン鎖および適合されたクリック鎖を含み、該アダプター断片が、分子バーコード、プライマー配列、およびアダプター配列を含み、かつ該適合されたワトソン鎖の分子バーコードが、該適合されたクリック鎖の分子バーコードの逆相補体である、該段階; (b) 該適合された二本鎖DNA分子の両方の鎖をコピーする段階であって、該コピーする段階が、(i) 該適合された二本鎖DNA分子を、タグ付けされたプライマーと接触させることと、(ii) 該適合された二本鎖DNA分子の線状伸長のラウンドを実施し、タグ付けされたワトソン鎖およびタグ付けされたクリック鎖を生成することとを含む、該段階; (c) 増幅された産物を変性条件に供する段階; (d) 該適合されたワトソン鎖およびクリック鎖と、該タグ付けされたワトソン鎖およびクリック鎖とを別々に回収する段階; (e) 該タグ付けされたワトソン鎖およびクリック鎖から分析物DNA断片の第1の集団を生成する段階、ならびに分析物DNA断片の第1の集団のうちの少なくとも1つの成員について第1のシーケンシングリードを生成する段階; (f) 該適合されたワトソン鎖およびクリック鎖から分析物DNA断片の第2の集団を生成する段階、ならびに分析物DNA断片の第2の集団のうちの少なくとも1つの成員について第2のシーケンシングリードを生成する段階; (g) 第1の分析物DNAファミリーを生成するために、分析物DNA断片の第1の集団のうちの該少なくとも1つの成員上に存在する分子バーコードに従って第1のシーケンシングリードを分類する段階; (h) 第2の分析物DNAファミリーを生成するために、分析物DNA断片の第2の集団のうちの該少なくとも1つの成員上に存在する分子バーコードに従って第2のシーケンシングリードを分類する段階; (i) 第1の分析物DNAファミリーにおいて、該タグ付けされたワトソン鎖およびクリック鎖の第1の特徴を同定する段階; ならびに(j) 第2の分析物DNAファミリーにおいて、該適合されたワトソン鎖およびクリック鎖の第2の特徴を同定する段階を含み、したがって、該二本鎖DNA分子の少なくとも一方の鎖上に存在する第1の特徴および第2の特徴を同定する、該方法である。いくつかの態様において、本方法は、二本鎖DNA分子の両方の鎖上に存在する第1の特徴および第2の特徴を同定することを含む。
いくつかの態様において、第1の特徴は遺伝的特徴である。いくつかの態様において、第2の特徴はエピジェネティックな特徴である。いくつかの態様において、第1の特徴は遺伝的特徴またはエピジェネティックな特徴である。いくつかの態様において、第2の特徴はエピジェネティックな特徴または遺伝的特徴である。いくつかの態様において、第1の特徴および第2の特徴は両方とも遺伝的特徴である。いくつかの態様において、第1の特徴および第2の特徴は両方ともエピジェネティックな特徴である。
いくつかの態様において、遺伝的特徴は変異である。いくつかの態様において、変異は、挿入、欠失、置換、欠失-挿入、重複、逆位、フレームシフト、反復拡張、転座、およびそれらの組み合わせからなる群より選択される。いくつかの態様において、遺伝的特徴の同定は、変異分析、異数性分析、またはフラグメントミクスを含む。
いくつかの態様において、エピジェネティックな特徴はメチル化である。いくつかの態様において、エピジェネティックな特徴はメチル化パターンである。いくつかの態様において、メチル化パターンは、不確定な起源のクローン性造血を介して生成された細胞に存在するメチル化パターンに対応する。いくつかの態様において、メチル化パターンは、起源組織に存在するメチル化パターンに対応する。いくつかの態様において、起源組織は、肛門、膀胱/尿路上皮、乳房、子宮頸部、結腸/直腸、頭頸部、腎臓、肝臓/胆管、肺、リンパ系新生物、黒色腫、骨髄系新生物、卵巣、膵臓/胆嚢、前立腺、甲状腺、上部GI、または子宮である。いくつかの態様において、エピジェネティックな特徴は、ヒドロキシメチル化、ヒストン修飾、マイクロRNA調節、アセチル化、リン酸化、ユビキチン化、またはSUMO化である。
いくつかの態様において、第1の特徴および第2の特徴は両方ともエピジェネティックな特徴であり、ここで第1の特徴はメチル化であり、かつ第2の特徴はヒドロキシメチル化である。いくつかの態様において、第1の特徴はメチル化であり、かつ第2の特徴はアセチル化である。いくつかの態様において、第1の特徴はメチル化であり、かつ第2の特徴はヒストン修飾である。いくつかの態様において、第1の特徴はメチル化であり、かつ第2の特徴はマイクロRNA調節である。いくつかの態様において、第1の特徴はメチル化であり、かつ第2の特徴はリン酸化である。いくつかの態様において、第1の特徴はメチル化であり、かつ第2の特徴はユビキチン化である。いくつかの態様において、第1の特徴はメチル化であり、かつ第2の特徴はSUMO化である。いくつかの態様において、第1の特徴はヒドロキシメチル化であり、かつ第2の特徴はメチル化である。いくつかの態様において、第1の特徴はヒドロキシメチル化であり、かつ第2の特徴はアセチル化である。いくつかの態様において、第1の特徴はヒドロキシメチル化であり、かつ第2の特徴はヒストン修飾である。いくつかの態様において、第1の特徴はヒドロキシメチル化であり、かつ第2の特徴はマイクロRNA調節である。いくつかの態様において、第1の特徴はヒドロキシメチル化であり、かつ第2の特徴はリン酸化である。いくつかの態様において、第1の特徴はヒドロキシメチル化であり、かつ第2の特徴はユビキチン化である。いくつかの態様において、第1の特徴はヒドロキシメチル化であり、かつ第2の特徴はSUMO化である。いくつかの態様において、第1の特徴はヒストン修飾であり、かつ第2の特徴はメチル化である。いくつかの態様において、第1の特徴はヒストン修飾であり、かつ第2の特徴はアセチル化である。いくつかの態様において、第1の特徴はヒストン修飾であり、かつ第2の特徴はヒドロキシメチル化である。いくつかの態様において、第1の特徴はヒストン修飾であり、かつ第2の特徴はマイクロRNA調節である。いくつかの態様において、第1の特徴はヒストン修飾であり、かつ第2の特徴はリン酸化である。いくつかの態様において、第1の特徴はヒストン修飾であり、かつ第2の特徴はユビキチン化である。いくつかの態様において、第1の特徴はヒストン修飾であり、かつ第2の特徴はSUMO化である。いくつかの態様において、第1の特徴はマイクロRNA調節であり、かつ第2の特徴はメチル化である。いくつかの態様において、第1の特徴はマイクロRNA調節であり、かつ第2の特徴はアセチル化である。いくつかの態様において、第1の特徴はマイクロRNA調節であり、かつ第2の特徴はヒドロキシメチル化である。いくつかの態様において、第1の特徴はマイクロRNA調節であり、かつ第2の特徴はヒストン修飾である。いくつかの態様において、第1の特徴はマイクロRNA調節であり、かつ第2の特徴はリン酸化である。いくつかの態様において、第1の特徴はマイクロRNA調節であり、かつ第2の特徴はユビキチン化である。いくつかの態様において、第1の特徴はマイクロRNA調節であり、かつ第2の特徴はSUMO化である。いくつかの態様において、第1の特徴はアセチル化であり、かつ第2の特徴はメチル化である。いくつかの態様において、第1の特徴はアセチル化であり、かつ第2の特徴はマイクロRNA調節である。いくつかの態様において、第1の特徴はアセチル化であり、かつ第2の特徴はヒドロキシメチル化である。いくつかの態様において、第1の特徴はアセチル化であり、かつ第2の特徴はヒストン修飾である。いくつかの態様において、第1の特徴はアセチル化であり、かつ第2の特徴はリン酸化である。いくつかの態様において、第1の特徴はアセチル化であり、かつ第2の特徴はユビキチン化である。いくつかの態様において、第1の特徴はアセチル化であり、かつ第2の特徴はSUMO化である。いくつかの態様において、第1の特徴はリン酸化であり、かつ第2の特徴はメチル化である。いくつかの態様において、第1の特徴はリン酸化であり、かつ第2の特徴はマイクロRNA調節である。いくつかの態様において、第1の特徴はリン酸化であり、かつ第2の特徴はヒドロキシメチル化である。いくつかの態様において、第1の特徴はリン酸化であり、かつ第2の特徴はヒストン修飾である。いくつかの態様において、第1の特徴はリン酸化であり、かつ第2の特徴はアセチル化である。いくつかの態様において、第1の特徴はリン酸化であり、かつ第2の特徴はユビキチン化である。いくつかの態様において、第1の特徴はリン酸化であり、かつ第2の特徴はSUMO化である。いくつかの態様において、第1の特徴はユビキチン化であり、かつ第2の特徴はメチル化である。いくつかの態様において、第1の特徴はユビキチン化であり、かつ第2の特徴はマイクロRNA調節である。いくつかの態様において、第1の特徴はユビキチン化であり、かつ第2の特徴はヒドロキシメチル化である。いくつかの態様において、第1の特徴はユビキチン化であり、かつ第2の特徴はヒストン修飾である。いくつかの態様において、第1の特徴はユビキチン化であり、かつ第2の特徴はアセチル化である。いくつかの態様において、第1の特徴はユビキチン化であり、かつ第2の特徴はリン酸化である。いくつかの態様において、第1の特徴はユビキチン化であり、かつ第2の特徴はSUMO化である。いくつかの態様において、第1の特徴はSUMO化であり、かつ第2の特徴はメチル化である。いくつかの態様において、第1の特徴はSUMO化であり、かつ第2の特徴はマイクロRNA調節である。いくつかの態様において、第1の特徴はSUMO化であり、かつ第2の特徴はヒドロキシメチル化である。いくつかの態様において、第1の特徴はSUMO化であり、かつ第2の特徴はヒストン修飾である。いくつかの態様において、第1の特徴はSUMO化であり、かつ第2の特徴はアセチル化である。いくつかの態様において、第1の特徴はSUMO化であり、かつ第2の特徴はリン酸化である。いくつかの態様において、第1の特徴はSUMO化であり、かつ第2の特徴はユビキチン化である。
遺伝的特徴 - 配列の決定
いくつかの態様において、第1および/または第2の特徴は遺伝的特徴であることができ、ここで「遺伝的特徴」という用語は、各細胞分裂時に親細胞から子孫細胞へと複製され受け継がれる遺伝情報および/または材料を指す。いくつかの態様において、遺伝的特徴は核酸(例えば、DNA分子)における変異であることができる。いくつかの態様において、変異は、挿入、欠失、置換、欠失-挿入、重複、逆位、フレームシフト、反復拡張、転座、およびそれらの組み合わせからなる群より選択される。いくつかの態様において、遺伝的特徴の同定は、変異分析、異数性分析、またはフラグメントミクスを含むことができる。本明細書において開示される方法で用いるのに適した遺伝的特徴を同定するための例示的な方法は、PCT/US2021/017937に記述されており、これは参照によりその全体が本明細書に組み入れられる。
いくつかの態様において、第1および/または第2の特徴は遺伝的特徴であることができ、ここで「遺伝的特徴」という用語は、各細胞分裂時に親細胞から子孫細胞へと複製され受け継がれる遺伝情報および/または材料を指す。いくつかの態様において、遺伝的特徴は核酸(例えば、DNA分子)における変異であることができる。いくつかの態様において、変異は、挿入、欠失、置換、欠失-挿入、重複、逆位、フレームシフト、反復拡張、転座、およびそれらの組み合わせからなる群より選択される。いくつかの態様において、遺伝的特徴の同定は、変異分析、異数性分析、またはフラグメントミクスを含むことができる。本明細書において開示される方法で用いるのに適した遺伝的特徴を同定するための例示的な方法は、PCT/US2021/017937に記述されており、これは参照によりその全体が本明細書に組み入れられる。
(a) アダプターが付着した鋳型の初期増幅
アダプター付着後、適合された二本鎖DNA分子を初期増幅反応において増幅(例えば、PCR増幅)することができる。任意の適切な方法を用いて、適合された二本鎖DNA分子を増幅することができる。適合された二本鎖DNA分子を増幅するために用いることができる例示的な方法は、非限定的に、全ゲノムPCRを含む。
アダプター付着後、適合された二本鎖DNA分子を初期増幅反応において増幅(例えば、PCR増幅)することができる。任意の適切な方法を用いて、適合された二本鎖DNA分子を増幅することができる。適合された二本鎖DNA分子を増幅するために用いることができる例示的な方法は、非限定的に、全ゲノムPCRを含む。
任意の適切なプライマー対を用いて、適合された二本鎖DNA分子を増幅することができる。いくつかの態様において、ユニバーサルプライマー対を用いることができる。プライマーは、非限定的に、約12ヌクレオチド~約30ヌクレオチドを含むことができる。いくつかの態様において、任意の適切なPCR条件を初期増幅において用いることができる。PCR増幅は変性相、アニーリング相および伸長相を含むことができる。増幅サイクルの各相は、任意の適切な条件を含むことができる。場合によっては、変性相は約90℃~約105℃(例えば、約94℃~約98℃)の温度、および約1秒~約5分(例えば、約10秒~約1分)の時間を含むことができる。例えば、変性相は約10秒間、約98℃の温度を含むことができる。場合によっては、アニーリング相は約50℃~約72℃の温度、および約30秒~約90秒の時間を含むことができる。場合によっては、伸長相は約55℃~約80℃の温度、および生成されるアンプリコン1 kbあたり約15秒~生成されるアンプリコン1 kbあたり約30秒の時間を含むことができる。場合によっては、アニーリング相および伸長相を単一サイクルにおいて実施することができる。例えば、アニーリング相および伸長相は約75秒間、約65℃の温度を含むことができる。
初期増幅において用いられるPCR条件は、任意の適切な数のPCR増幅サイクルを含むことができる。場合によっては、PCR増幅は約1~約50 (例えば、約5~約50、約10~約50、約15~約50、約20~約50、約25~約50、約30~約50、約35~約50、約40~約50、約45~約50、約1~約45、約5~約45、約10~約45、約15~約45、約20~約45、約25~約45、約30~約45、約35~約45、約40~約45、約1~約40、約5~約40、約10~約40、約15~約40、約20~約40、約25~約40、約30~約40、約35~約40、約1~約35、約5~約35、約10~約35、約15~約35、約20~約35、約25~約35、約30~約35、約1~約30、約5~約30、約10~約30、約15~約30、約20~約30、約25~約30、約1~約25、約5~約25、約10~約25、約15~約25、約20~約25、約1~約20、約5~約20、約10~約20、約15~約20、約1~約15、約5~約15、約10~約15、約1~約10、約5~約10または約1~約5)サイクルを含むことができる。いくつかの態様において、PCR増幅は11サイクル以下を含む。いくつかの態様において、PCR増幅は7サイクル以下を含む。いくつかの態様において、PCR増幅は5サイクル以下を含む。
場合によっては、PCR条件が熱活性化ポリメラーゼを含む場合、PCR増幅は初期化段階も含むことができる。例えば、PCR増幅はPCR増幅サイクルを実施する前に初期化段階を含むことができる。場合によっては、初期化段階は約94℃~約98℃の温度、および約15秒~約1分の時間を含むことができる。例えば、初期化段階は約30秒間、約98℃の温度を含むことができる。
場合によっては、PCR増幅は保持段階も含むことができる。例えば、PCR増幅はPCR増幅サイクルを実施した後に、任意で最終伸長段階を実施した後に、保持段階を含むことができる。場合によっては、保持段階は限定されていない時間量の間、約4℃~約15℃の温度を含むことができる。
場合によっては、本明細書において記述されるように生成された二重鎖シーケンシングライブラリ(例えば、増幅された二重鎖シーケンシングライブラリ)を精製することができる。任意の適切な方法を用いて、二重鎖シーケンシングライブラリを精製することができる。二重鎖シーケンシングライブラリを精製するために用いることができる例示的な方法は、非限定的に、磁気ビーズ(例えば、固相可逆固定化(SPRI)磁気ビーズ)を含む。
(b) 任意のssDNAライブラリ調製
場合によっては、二重鎖シーケンシングライブラリを用いて、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成することができる。一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成することにより、(例えば、3'二重鎖アダプターまたは5'アダプターなどのライゲーション配列に相補的なプライマーからの)非特異的増幅を最小限に抑えることができる。任意の適切な方法を用いて、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを(例えば、本明細書に記載のように作製された二重鎖シーケンシングライブラリから)生成することができる。場合によっては、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリは、増幅産物を少なくとも2つのアリコットに分割し、各アリコットを、ワトソン鎖が第1のアリコットから増幅され、クリック鎖が第2のアリコットから増幅されるPCR増幅に供することによって、増幅された二重鎖シーケンシングライブラリから生成することができる。例えば、増幅された二重鎖シーケンシングライブラリからの増幅産物の第1のアリコットを、第1のプライマーがビオチン化されており、かつ第2のプライマーが非ビオチン化されているプライマー対を用いたPCR増幅に供して、ワトソン鎖の一本鎖ライブラリを生成することができ、増幅された二重鎖シーケンシングライブラリからの増幅産物の第2のアリコットを、第1のプライマーが非ビオチン化されており、かつ第2のプライマーがビオチン化されているプライマー対を用いたPCR増幅に供して、クリック鎖の一本鎖ライブラリを生成することができる。場合によっては、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成することができる。
場合によっては、二重鎖シーケンシングライブラリを用いて、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成することができる。一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成することにより、(例えば、3'二重鎖アダプターまたは5'アダプターなどのライゲーション配列に相補的なプライマーからの)非特異的増幅を最小限に抑えることができる。任意の適切な方法を用いて、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを(例えば、本明細書に記載のように作製された二重鎖シーケンシングライブラリから)生成することができる。場合によっては、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリは、増幅産物を少なくとも2つのアリコットに分割し、各アリコットを、ワトソン鎖が第1のアリコットから増幅され、クリック鎖が第2のアリコットから増幅されるPCR増幅に供することによって、増幅された二重鎖シーケンシングライブラリから生成することができる。例えば、増幅された二重鎖シーケンシングライブラリからの増幅産物の第1のアリコットを、第1のプライマーがビオチン化されており、かつ第2のプライマーが非ビオチン化されているプライマー対を用いたPCR増幅に供して、ワトソン鎖の一本鎖ライブラリを生成することができ、増幅された二重鎖シーケンシングライブラリからの増幅産物の第2のアリコットを、第1のプライマーが非ビオチン化されており、かつ第2のプライマーがビオチン化されているプライマー対を用いたPCR増幅に供して、クリック鎖の一本鎖ライブラリを生成することができる。場合によっては、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成することができる。
任意の適切な方法を用いて、増幅された二重鎖シーケンシングライブラリから一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成することができる。例えば、増幅された二重鎖シーケンシングライブラリからの増幅産物を、PCRプライマー対における2つのプライマーのうちの一方のみがタグ付けされている、第1のPCR増幅および第2のPCR増幅に分離することができる。例えば、第1のPCR増幅では、タグ付けされているプライマー(例えば、第1のプライマー)およびタグ付けされていないプライマー(例えば、第2のプライマー)を含むプライマー対を用いることができ、第2のPCR増幅では、タグ付けされていないプライマー(例えば、第1のプライマー)およびタグ付けされているプライマー(例えば、第2のプライマー)を含むプライマー対を用いることができる。プライマータグは、タグ付けされたプライマーから生成されたPCR増幅産物を、回収することを可能にする任意のタグであることができる。場合によっては、タグ付けされたプライマーはビオチン化されたプライマーであることができ、ビオチン化されたプライマーから生成されたPCR増幅産物はストレプトアビジンを用いて回収することができる。場合によっては、タグ付けされたプライマーは、ウラシルを含有するビオチン化されたプライマーであることができ、ウラシルを含有するビオチン化されたプライマーから生成されたPCR増幅産物はストレプトアビジンを用いて回収することができる。例えば、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリは、ビオチン化プライマーおよび非ビオチン化プライマーを含むプライマー対を用いるPCR増幅において生成することができる。場合によっては、タグ付けされたプライマーはリン酸化されたプライマーであることができ、リン酸化されたプライマーから生成されたPCR増幅産物はラムダヌクレアーゼを用いて回収することができる。例えば、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリは、リン酸化プライマーおよび非リン酸化プライマーを含むプライマー対を用いるPCR増幅において生成することができる。
任意の適切なプライマー対を用いて、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリから)生成することができる。プライマーは、非限定的に、約12ヌクレオチド~約30ヌクレオチドを含むことができる。場合によっては、プライマー対は、(例えば、増幅の前に二重鎖シーケンシングライブラリにおける核酸断片に、第1の分子バーコードを含む3'二重鎖アダプターおよび第2の分子バーコードを含む5'アダプターをライゲーションすることによって)本明細書において記述されるように生成された増幅産物に存在するアダプター配列(例えば、分子バーコードを含むアダプター配列)を標的とする(例えば、標的とし、それに結合する)ことができる少なくとも1つのプライマーを含むことができる。本明細書において記述される一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成するために用いることができるプライマー対の例は、非限定的に、P5プライマーおよびP7プライマーを含む。
任意の適切なPCR条件を用いて、一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリから)生成することができる。PCR増幅は変性相、アニーリング相および伸長相を含むことができる。増幅サイクルの各相は、任意の適切な条件を含むことができる。場合によっては、変性相は約90℃~約105℃の温度、および約1秒~約5分の時間を含むことができる。例えば、変性相は約10秒間、約98℃の温度を含むことができる。場合によっては、アニーリング相は約50℃~約72℃の温度、および約30秒~約90秒の時間を含むことができる。場合によっては、伸長相は約55℃~約80℃の温度、および生成されるアンプリコン1 kbあたり約15秒~生成されるアンプリコン1 kbあたり約30秒の時間を含むことができる。場合によっては、伸長相は、用いられるポリメラーゼの処理能力を反映する。場合によっては、アニーリング相および伸長相は単一のサイクルにおいて実施することができる。例えば、アニーリング相および伸長相は約75秒間、約65℃の温度を含むことができる。
一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリから)生成するために用いられるPCR条件は、任意の適切な数のPCR増幅サイクルを含むことができる。場合によっては、PCR増幅は、非限定的に、約1~約50 (例えば、約5~約50、約10~約50、約15~約50、約20~約50、約25~約50、約30~約50、約35~約50、約40~約50、約45~約50、約1~約45、約5~約45、約10~約45、約15~約45、約20~約45、約25~約45、約30~約45、約35~約45、約40~約45、約1~約40、約5~約40、約10~約40、約15~約40、約20~約40、約25~約40、約30~約40、約35~約40、約1~約35、約5~約35、約10~約35、約15~約35、約20~約35、約25~約35、約30~約35、約1~約30、約5~約30、約10~約30、約15~約30、約20~約30、約25~約30、約1~約25、約5~約25、約10~約25、約15~約25、約20~約25、約1~約20、約5~約20、約10~約20、約15~約20、約1~約15、約5~約15、約10~約15、約1~約10、約5~約10または約1~約5)サイクルを含むことができる。例えば、PCR増幅は約4増幅サイクルを含むことができる。いくつかの態様において、PCR増幅は約8増幅サイクルを含むことができる。
場合によっては、PCR条件が熱活性化ポリメラーゼを含む場合、PCR増幅は初期化段階も含むことができる。例えば、PCR増幅はPCR増幅サイクルを実施する前に初期化段階を含むことができる。場合によっては、初期化段階は約94℃~約98℃の温度、および約15秒~約1分の時間を含むことができる。例えば、初期化段階は約30秒間、約98℃の温度を含むことができる。
場合によっては、PCR増幅は保持段階も含むことができる。例えば、PCR増幅はPCR増幅サイクルを実施した後に、任意で最終伸長段階を実施した後に、保持段階を含むことができる。場合によっては、保持段階は限定されていない時間量の間、約4℃~約15℃の温度を含むことができる。
任意の適切な方法を用いて、二本鎖増幅産物を一本鎖増幅産物に分離することができる。場合によっては、二本鎖増幅産物を変性させて、二本鎖増幅産物を2つの一本鎖増幅産物に分離することができる。二本鎖増幅産物を一本鎖増幅産物に分離するために用いることができる方法の例は、非限定的に、熱変性、化学(例えば、NaOH)変性、および塩変性を含む。
PCR増幅後、タグ付けされたワトソン鎖およびクリック鎖を回収することができる。タグ付けされたプライマーを用いて生成されたタグ付けされたワトソン鎖およびクリック鎖を回収するために、任意の適切な方法を用いることができる。タグ付けされたプライマーがビオチン化されたプライマーである場合、(例えば、ビオチン化されたプライマーから生成された)ビオチン化された増幅産物は、ストレプトアビジン(例えば、ストレプトアビジン官能化ビーズ)を用いて回収することができる。例えば、増幅された二重鎖シーケンシングライブラリが、第1のビオチン化プライマーおよび第2の非ビオチン化プライマーを含むプライマー対を用いる第1のPCR増幅、ならびに第1の非ビオチン化プライマーおよび第2のビオチン化プライマーを含むプライマー対を用いる第2のPCR増幅においてさらに増幅される場合、第1のPCR増幅から生成されるビオチン化された増幅産物は、ストレプトアビジン官能化ビーズ(例えば、第1のセットのストレプトアビジン官能化ビーズ)に結合させることができ、第2のPCR増幅から生成されるビオチン化された増幅産物は、ストレプトアビジン官能化ビーズ(例えば、第1第2のストレプトアビジン官能化ビーズ)に結合させることができ、二本鎖増幅産物を一本鎖の増幅産物に分離する(例えば、変性させる)ことができる。場合によっては、ビオチン化されたPCR増幅産物を回収することは、ストレプトアビジン(例えば、ストレプトアビジン官能化ビーズ)からビオチン化されたPCR増幅産物を放出させることも含むことができる。第1のビオチン化プライマーおよび第2の非ビオチン化プライマーを含むプライマー対を用いた第1のPCR増幅、ならびに第1の非ビオチン化プライマーおよび第2のビオチン化プライマーを含むプライマー対を用いた第2のPCR増幅によって生成された二本鎖増幅産物を分離することは、ビオチン化プライマーから生成された一本鎖増幅産物をストレプトアビジン官能化ビーズに結合したままにすることを可能にすることができ、一方で、非ビオチン化プライマーから生成された一本鎖増幅産物をストレプトアビジン官能化ビーズから変性させ(例えば、変性させ、かつ分解し)、それにより二重鎖シーケンシングライブラリのうちの一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成することができる。
タグ付けされたプライマーがリン酸化されたプライマーである場合、(例えば、リン酸化されたプライマーから生成される)リン酸化された増幅産物は、エキソヌクレアーゼ(例えば、ラムダエキソヌクレアーゼ)を用いることにより、非リン酸化された増幅産物から分離することができる。例えば、増幅された二重鎖シーケンシングライブラリが、第1のリン酸化プライマーおよび第2の非リン酸化プライマーを含むプライマー対を用いる第1のPCR増幅、ならびに第1の非リン酸化プライマーおよび第2のリン酸化プライマーを含むプライマー対を用いる第2のPCR増幅においてさらに増幅される場合、二本鎖増幅産物を一本鎖の増幅産物に分離することができる。第1のリン酸化プライマーおよび第2の非リン酸化プライマーを含むプライマー対を用いる第1のPCR増幅、ならびに第1の非リン酸化プライマーおよび第2のリン酸化プライマーを含むプライマー対を用いる第2のPCR増幅によって生成された二本鎖増幅産物を分離することは、非リン酸化プライマーから生成された一本鎖増幅産物を回収することを可能にすることができ、一方で、リン酸化プライマーから生成された一本鎖増幅産物をラムダエキソヌクレアーゼによって分解し、それにより二重鎖シーケンシングライブラリのうちの一本鎖ワトソン鎖由来の配列のライブラリおよび一本鎖クリック鎖由来の配列のライブラリを生成することができる。
(c) 標的濃縮
本明細書における方法のいずれか1つのいくつかの態様において、初期増幅によって産生される増幅産物は、1つまたは複数の標的ポリヌクレオチドについて濃縮される。いくつかの態様において、標的濃縮の前に、一本鎖DNAライブラリが初期増幅によって産生された増幅産物から調製される。一本鎖DNAライブラリを産生するための例示的な方法が、本明細書において記述される。
本明細書における方法のいずれか1つのいくつかの態様において、初期増幅によって産生される増幅産物は、1つまたは複数の標的ポリヌクレオチドについて濃縮される。いくつかの態様において、標的濃縮の前に、一本鎖DNAライブラリが初期増幅によって産生された増幅産物から調製される。一本鎖DNAライブラリを産生するための例示的な方法が、本明細書において記述される。
任意の適切な方法を用いて、増幅産物のライブラリ(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリ、一本鎖ワトソン鎖由来の配列のライブラリ、または一本鎖クリック鎖由来の配列のライブラリ)から標的領域を増幅することができる。場合によっては、(例えば、増幅の前に、二重鎖シーケンシングライブラリにおける核酸断片に、第1の分子バーコードを含む3'二重鎖アダプターおよび第2の分子バーコードを含む5'アダプターをライゲーションすることにより)本明細書において記述されるように生成された増幅産物に存在するアダプター配列(例えば、分子バーコードを含むアダプター配列)を標的とする(例えば、標的とし、それに結合する)ことができるプライマー(例えば、第1のプライマー)、ならびに標的領域(例えば、関心対象の領域)を標的とする(例えば、標的とし、それに結合する)ことができるプライマー(例えば、第2のプライマー)である、プライマー対を用いてPCR増幅に増幅産物のライブラリを供することにより増幅産物のライブラリから標的領域を増幅することができる。
場合によっては、単一のPCR増幅において増幅産物のライブラリ(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリ、一本鎖ワトソン鎖由来の配列のライブラリ、または一本鎖クリック鎖由来の配列のライブラリ)から標的領域を増幅することができる。例えば、(例えば、増幅の前に、二重鎖シーケンシングライブラリにおける核酸断片に、第1の分子バーコードを含む3'二重鎖アダプターおよび第2の分子バーコードを含む5'アダプターをライゲーションすることにより)本明細書において記述されるように生成された増幅産物に存在するアダプター配列(例えば、分子バーコードを含むアダプター配列)を標的とすることができる第1のプライマー、ならびに標的領域を標的とすることができる第2のプライマーを含むプライマー対を用い単一のPCR増幅において増幅産物のライブラリから標的領域を増幅することができる。
場合によっては、複数のPCR増幅において増幅産物のライブラリ(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリ、一本鎖ワトソン鎖由来の配列のライブラリ、または一本鎖クリック鎖由来の配列のライブラリ)から標的領域を増幅することができる。複数のPCR増幅(例えば、最初のPCR増幅と後続のネステッドPCR増幅)を用いて、標的領域を増幅する特異性を増加させることができる。例えば、第1のPCR増幅では、(例えば、増幅の前に、二重鎖シーケンシングライブラリにおける核酸断片に、第1の分子バーコードを含む3'二重鎖アダプターおよび第2の分子バーコードを含む5'アダプターをライゲーションすることにより)本明細書において記述されるように生成された増幅産物に存在するアダプター配列(例えば、分子バーコードを含むアダプター配列)を標的とすることができる第1のプライマー、ならびに標的領域を標的とすることができる第2のプライマーを含むプライマー対を用い、第1のPCR増幅において生成された増幅産物を、(例えば、増幅の前に、二重鎖シーケンシングライブラリにおける核酸断片に、第1の分子バーコードを含む3'二重鎖アダプターおよび第2の分子バーコードを含む5'アダプターをライゲーションすることにより)本明細書において記述されるように生成された増幅産物に存在するアダプター配列(例えば、分子バーコードを含むアダプター配列)を標的とすることができる第1のプライマー、ならびに第1のPCR増幅において生成された増幅産物に存在する標的領域からの核酸配列を標的とすることができる第2のプライマーを含むプライマー対を用いる後続のネステッドPCR増幅に供する、一連のPCR増幅において増幅産物のライブラリから標的領域を増幅することができる。
任意の適切なプライマー対を用いて、増幅産物のライブラリ(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリ、一本鎖ワトソン鎖由来の配列のライブラリ、または一本鎖クリック鎖由来の配列のライブラリ)から標的領域を増幅することができる。プライマーは、非限定的に、約12ヌクレオチド~約30ヌクレオチドを含むことができる。場合によっては、プライマー対は、(例えば、増幅の前に、二重鎖シーケンシングライブラリにおける核酸断片に、第1の分子バーコードを含む3'二重鎖アダプターおよび第2の分子バーコードを含む5'アダプターをライゲーションすることにより)本明細書において記述されるように生成された増幅産物に存在するアダプター配列(例えば、分子バーコードを含むアダプター配列)を標的とする(例えば、標的とし、それに結合する)ことができるプライマー(例えば、第1のプライマー)、ならびに標的領域(例えば、関心対象の領域)を標的とする(例えば、標的とし、それに結合する)ことができるプライマー(例えば、第2のプライマー)を含むことができる。(例えば、増幅の前に、二重鎖シーケンシングライブラリにおける核酸断片に、第1の分子バーコードを含む3'二重鎖アダプターおよび第2の分子バーコードを含む5'アダプターをライゲーションすることにより)本明細書において記述されるように生成された増幅産物に存在する分子バーコードを含むアダプター配列を標的とすることができるプライマーの例は、非限定的に、i5インデックスプライマーおよびi7インデックスプライマーを含む。標的領域を標的とすることができるプライマーは、標的領域に相補的な配列を含むことができる。標的領域がTP53をコードする核酸である場合、TP53をコードする核酸を標的とすることができるプライマーの例は、非限定的に、TP53_342_GSP1およびTP53_GSP2を含む。
場合によっては、増幅産物のライブラリ(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリ、一本鎖ワトソン鎖由来の配列のライブラリ、または一本鎖クリック鎖由来の配列のライブラリ)から標的領域を増幅するために用いられるプライマー対の一方または両方のプライマーは、1つまたは複数の分子バーコードを含むことができる。
場合によっては、増幅産物のライブラリ(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリ、一本鎖ワトソン鎖由来の配列のライブラリ、または一本鎖クリック鎖由来の配列のライブラリ)から標的領域を増幅するために用いられるプライマー対の一方または両方のプライマーは、1つまたは複数グラフト配列(例えば、次世代シーケンシングのためのグラフト配列)を含むことができる。
いくつかの態様において、標的濃縮は、(a) ワトソン標的選択的プライマー対の第1のセットであって、(i) ユニバーサル3'アダプター配列のR2シーケンシングプライマー部位に相補的な配列を含む第1のワトソン標的選択的プライマーと、(ii) 標的選択的な配列を含む第2のワトソン標的選択的プライマーとを含み、それにより標的ワトソン増幅産物を作製する、該ワトソン標的選択的プライマー対の第1のセットによって、標的ポリヌクレオチド配列を含むワトソン鎖の増幅産物を選択的に増幅する段階と、(b) クリック標的選択的プライマー対の第1のセットであって、(i) ユニバーサル5'アダプター配列のR1シーケンシングプライマー部位に相補的な配列を含む第1のクリック標的選択的プライマーと、(ii) 第2のワトソン標的選択的プライマー配列と同じ標的選択的な配列を含む第2のクリック標的選択的プライマーとを含み、それにより標的クリック増幅産物を作製する、該クリック標的選択的プライマー対の第1のセットによって、同じ標的ポリヌクレオチド配列を含むクリック鎖の増幅産物を選択的に増幅する段階とを含む。
いくつかの態様において、本方法は、標的ワトソン増幅産物および標的クリック増幅産物を非標的ポリヌクレオチドから精製する段階をさらに含む。いくつかの態様において、精製する段階は、標的ワトソン増幅産物および標的クリック増幅産物を固体支持体に付着させる段階を含む。いくつかの態様において、第1のワトソン標的選択的プライマーおよび第1のクリック標的選択的プライマーは、親和性結合対の第1の成員を含み、ここで固体支持体は親和性結合対の第2の成員を含む。いくつかの態様において、第1の成員はビオチンであり、かつ第2の成員はストレプトアビジンである。いくつかの態様において、固体支持体はビーズ、ウェル、膜、チューブ、カラム、プレート、セファロース、磁気ビーズまたはチップを含む。いくつかの態様において、本方法は、固体支持体に付着していないポリヌクレオチドを除去する段階を含む。
いくつかの態様において、本方法は、(a) ワトソン標的選択的プライマーの第2のセットであって、(i) ユニバーサル3'アダプター配列のR2シーケンシングプライマー部位に相補的な配列を含む第3のワトソン標的選択的プライマーと、(ii) 5'から3'方向に、R1シーケンシングプライマー部位および同じ標的ポリヌクレオチドに対して選択的な標的選択的配列を含む第4のワトソン標的選択的プライマーとを含み、それにより標的ワトソンライブラリ成員を作製する、該ワトソン標的選択的プライマーの第2のセットによって、標的ワトソン増幅産物をさらに増幅する段階と、(b) クリック標的選択的プライマーの第2のセットであって、(i) ユニバーサル3'アダプター配列のR1シーケンシングプライマー部位に相補的な配列を含む第3のクリック標的選択的プライマーと、(ii) 5'から3'方向に、R2シーケンシングプライマー部位および第4のワトソン標的選択的プライマーについての同じ標的ポリヌクレオチドに対して選択的な標的選択的配列を含む第4のクリック標的選択的プライマーとを含み、それにより標的クリックライブラリ成員を作製する、該クリック標的選択的プライマーの第2のセットによって、標的クリック増幅産物をさらに増幅する段階とをさらに含む。
いくつかの態様において、第3のワトソン標的選択的プライマーおよび第3のクリック標的選択的プライマーは、サンプルバーコード配列をさらに含む。いくつかの態様において、第3のワトソン標的選択的プライマーは、シーケンサー上の第1のグラフト用プライマーへのハイブリダイゼーションを可能にする第1のグラフト用配列をさらに含み、かつここで第3のクリック標的選択的プライマーが、シーケンサー上の第2のグラフト用プライマーへのハイブリダイゼーションを可能にする第2のグラフト用配列をさらに含む。いくつかの態様において、第4のワトソン標的選択的プライマーは、第2のグラフト用配列をさらに含み、かつここで第4のクリック標的選択的プライマーが、第1のグラフト用配列をさらに含む。いくつかの態様において、第1のグラフト用配列はP7配列であり、かつここで第2のグラフト用配列がP5配列である。
任意の適切なPCR条件を用いて、(例えば、生成された二重鎖シーケンシングライブラリ、一本鎖ワトソン鎖由来の配列のライブラリ、または一本鎖クリック鎖由来の配列のライブラリなどの増幅産物のライブラリから)本明細書において記述される増幅された標的領域を生成することができる。例示的なPCR条件は本明細書において記述される。(例えば、生成された二重鎖シーケンシングライブラリ、一本鎖ワトソン鎖由来の配列のライブラリ、または一本鎖クリック鎖由来の配列のライブラリなどの増幅産物のライブラリから)本明細書において記述される増幅された標的領域を生成するために用いられるPCR条件は、任意の適切な数のPCR増幅サイクルを含むことができる。場合によっては、PCR増幅は、非限定的に、約1~約50 (例えば、約5~約50、約10~約50、約15~約50、約20~約50、約25~約50、約30~約50、約35~約50、約40~約50、約45~約50、約1~約45、約5~約45、約10~約45、約15~約45、約20~約45、約25~約45、約30~約45、約35~約45、約40~約45、約1~約40、約5~約40、約10~約40、約15~約40、約20~約40、約25~約40、約30~約40、約35~約40、約1~約35、約5~約35、約10~約35、約15~約35、約20~約35、約25~約35、約30~約35、約1~約30、約5~約30、約10~約30、約15~約30、約20~約30、約25~約30、約1~約25、約5~約25、約10~約25、約15~約25、約20~約25、約1~約20、約5~約20、約10~約20、約15~約20、約1~約15、約5~約15、約10~約15、約1~約10、約5~約10または約1~約5)サイクルを含むことができる。例えば、増幅された標的領域のPCR増幅が単一のPCR増幅を含む場合、PCR増幅は約18増幅サイクルを含むことができる。例えば、増幅された標的領域のPCR増幅が最初のPCR増幅と後続のネステッドPCR増幅を含む場合、最初のPCR増幅は約18増幅サイクルを含むことができ、後続のネステッドPCR増幅は約10増幅サイクルを含むことができる。
(d) 例示的な標的
任意の適切な標的領域(例えば、関心対象の領域)を、増幅産物のライブラリ(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリ、一本鎖ワトソン鎖由来の配列のライブラリ、または一本鎖クリック鎖由来の配列のライブラリ)から増幅させ、1つまたは複数の変異の存在または非存在について評価することができる。場合によっては、標的領域は、1つまたは複数の変異が疾患または障害に関連する核酸の領域であることができる。増幅させ、1つまたは複数の変異の存在または非存在について評価することができる標的領域の例は、非限定的に、腫瘍タンパク質p53 (TP53)をコードする核酸、乳がん1 (BRCA1)をコードする核酸、BRCA2をコードする核酸、ホスファターゼ・テンシン相同体(PTEN)ポリペプチドをコードする核酸、AKT1ポリペプチドをコードする核酸、APCポリペプチドをコードする核酸、CDKN2Aポリペプチドをコードする核酸、EGFRポリペプチドをコードする核酸、FBXW7ポリペプチドをコードする核酸、GNASポリペプチドをコードする核酸、KRASポリペプチドをコードする核酸、NRASポリペプチドをコードする核酸、PIK3CAポリペプチドをコードする核酸、BRAFポリペプチドをコードする核酸、CTNNB1ポリペプチドをコードする核酸、FGFR2ポリペプチドをコードする核酸、HRASポリペプチドをコードする核酸、およびPPP2R1Aポリペプチドをコードする核酸を含む。場合によっては、増幅させ、1つまたは複数の変異の存在または非存在について評価することができる標的領域は、TP53をコードする核酸であることができる。
任意の適切な標的領域(例えば、関心対象の領域)を、増幅産物のライブラリ(例えば、本明細書において記述されるように生成された二重鎖シーケンシングライブラリ、一本鎖ワトソン鎖由来の配列のライブラリ、または一本鎖クリック鎖由来の配列のライブラリ)から増幅させ、1つまたは複数の変異の存在または非存在について評価することができる。場合によっては、標的領域は、1つまたは複数の変異が疾患または障害に関連する核酸の領域であることができる。増幅させ、1つまたは複数の変異の存在または非存在について評価することができる標的領域の例は、非限定的に、腫瘍タンパク質p53 (TP53)をコードする核酸、乳がん1 (BRCA1)をコードする核酸、BRCA2をコードする核酸、ホスファターゼ・テンシン相同体(PTEN)ポリペプチドをコードする核酸、AKT1ポリペプチドをコードする核酸、APCポリペプチドをコードする核酸、CDKN2Aポリペプチドをコードする核酸、EGFRポリペプチドをコードする核酸、FBXW7ポリペプチドをコードする核酸、GNASポリペプチドをコードする核酸、KRASポリペプチドをコードする核酸、NRASポリペプチドをコードする核酸、PIK3CAポリペプチドをコードする核酸、BRAFポリペプチドをコードする核酸、CTNNB1ポリペプチドをコードする核酸、FGFR2ポリペプチドをコードする核酸、HRASポリペプチドをコードする核酸、およびPPP2R1Aポリペプチドをコードする核酸を含む。場合によっては、増幅させ、1つまたは複数の変異の存在または非存在について評価することができる標的領域は、TP53をコードする核酸であることができる。
任意の適切な方法を用いて、1つまたは複数の変異の存在または非存在について標的領域(例えば、増幅された標的領域)を評価することができる。場合によっては、1つまたは複数のシーケンシング法を用いて、1つまたは複数の変異の存在または非存在について、増幅された標的領域を評価することができる。
(e) 配列の決定
場合によっては、1つまたは複数のシーケンシング法を用いて、増幅された標的領域を評価し、変異がワトソン鎖およびクリック鎖の両方に存在するかどうかを決定することができる。場合によっては、シーケンシングリードを用いて、1つまたは複数の変異の存在または非存在について、増幅された標的領域を評価することができ、シーケンシングリードを用いて、変異がワトソン鎖およびクリック鎖の両方に存在するかどうかを決定することができる。本明細書において記述される1つまたは複数の変異の存在または非存在について、増幅された標的領域を評価するために用いることができるシーケンシング法の例は、非限定的に、単一リードシーケンシング、ペアエンドシーケンシング、NGS、およびディープシーケンシングを含む。いくつかの態様において、単一リードシーケンシングは、鋳型の全長にわたってシーケンスリードを生成するシーケンシングを含む。いくつかの態様において、シーケンシングはペアエンドシーケンシングを含む。いくつかの態様において、シーケンシングは超並列シーケンサーで実施される。いくつかの態様において、超並列シーケンサーは、鋳型ポリヌクレオチドの両末端からシーケンスリードを決定するように構成される。いくつかの態様において、シーケンシングは、全ゲノムPCR、全ゲノムバイサルファイトシーケンシング、または捕捉シーケンシングを含む。
場合によっては、1つまたは複数のシーケンシング法を用いて、増幅された標的領域を評価し、変異がワトソン鎖およびクリック鎖の両方に存在するかどうかを決定することができる。場合によっては、シーケンシングリードを用いて、1つまたは複数の変異の存在または非存在について、増幅された標的領域を評価することができ、シーケンシングリードを用いて、変異がワトソン鎖およびクリック鎖の両方に存在するかどうかを決定することができる。本明細書において記述される1つまたは複数の変異の存在または非存在について、増幅された標的領域を評価するために用いることができるシーケンシング法の例は、非限定的に、単一リードシーケンシング、ペアエンドシーケンシング、NGS、およびディープシーケンシングを含む。いくつかの態様において、単一リードシーケンシングは、鋳型の全長にわたってシーケンスリードを生成するシーケンシングを含む。いくつかの態様において、シーケンシングはペアエンドシーケンシングを含む。いくつかの態様において、シーケンシングは超並列シーケンサーで実施される。いくつかの態様において、超並列シーケンサーは、鋳型ポリヌクレオチドの両末端からシーケンスリードを決定するように構成される。いくつかの態様において、シーケンシングは、全ゲノムPCR、全ゲノムバイサルファイトシーケンシング、または捕捉シーケンシングを含む。
(f) シーケンスリードの分析
いくつかの態様において、シーケンスリードは参照ゲノムにマッピングされる。
いくつかの態様において、シーケンスリードは参照ゲノムにマッピングされる。
いくつかの態様において、シーケンスリードはバーコード(例えば、UID)ファミリーに割り当てられる。バーコードファミリーは、オリジナルの鋳型、例えば、核酸サンプルからのオリジナルの二本鎖DNA断片に由来する増幅された産物からのシーケンスリードを含むことができる。
いくつかの態様において、バーコードファミリーの各成員は、同じ外因性バーコード配列を含む。いくつかの態様において、バーコードファミリーの各成員は、同じ内因性バーコード配列をさらに含む。内因性バーコードは、本明細書において記述される。
いくつかの態様において、バーコードファミリーの各成員は、同じ外因性バーコード配列および同じ内因性バーコード配列をさらに含む。いくつかの態様において、外因性バーコード配列および内因性バーコード配列の組み合わせは、バーコードファミリーに固有である。いくつかの態様において、外因性バーコード配列および内因性バーコード配列の組み合わせは、核酸サンプルにおいて表される別のバーコードファミリーには存在しない。
バーコードファミリーの成員の数はシーケンシングの深さに依存することができる。いくつかの態様において、バーコードファミリーは、少なくとも1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500または1000個の成員を含む。いくつかの態様において、UIDファミリーは約2~1000個の成員、約2~500個の成員、約2~100個の成員、約2~50個の成員、または約2~20個の成員を含む。
いくつかの態様において、個々のバーコードファミリーのシーケンスリードは、ワトソンサブファミリーおよびクリックサブファミリーに割り当てられる。いくつかの態様において、個々のバーコードファミリーのシーケンスリードは、アダプター配列に対する挿入断片の配向に基づいて、ワトソンサブファミリーおよびクリックサブファミリーに割り当てられる。いくつかの態様において、アダプター配列に対する挿入断片の配向は、シーケンスリードが「リード対」または「メイト対」としてどのようにアライメントされたかによって解決される。
いくつかの態様において、シーケンスリードのワトソンサブファミリーおよびクリックサブファミリーへの割り当ては、R1リード配列およびR2リード配列に対する外因性バーコード配列の空間的関係に基づく。いくつかの態様において、ワトソンサブファミリーの成員は、外因性バーコード配列がR2配列の下流およびR1配列の上流にあることによって特徴付けられる。いくつかの態様において、クリックサブファミリーの成員は、外因性バーコード配列がR1配列の下流およびR2配列の上流にあることによって特徴付けられる。いくつかの態様において、ワトソンサブファミリーの成員は、外因性バーコード配列がR2配列に大いに近接し、R1配列にあまり近接していないことによって特徴付けられる。いくつかの態様において、クリックサブファミリーの成員は、外因性バーコード配列がR1配列に大いに近接し、R2配列にあまり近接していないことによって特徴付けられる。いくつかの態様において、ワトソンサブファミリーの成員は、外因性バーコード配列が、R2配列のすぐ下流または1~70、1~60、1~50、1~40、1~30、1~20、1~10もしくは1~5ヌクレオチド以内にあることによって特徴付けられる。いくつかの態様において、クリックサブファミリーの成員は、外因性バーコード配列が、R1配列のすぐ下流または1~70、1~60、1~50、1~40、1~30、1~20、1~10もしくは1~5ヌクレオチド以内にあることによって特徴付けられる。
いくつかの態様において、バーコードサブファミリー(例えば、ワトソンサブファミリーおよび/またはクリックサブファミリー)は、少なくとも1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490または500個の成員を含む。いくつかの態様において、バーコードサブファミリー(例えば、ワトソンサブファミリーおよび/またはクリックサブファミリー)は約2~500個の成員、約2~100個の成員、約2~50個の成員、約2~20個の成員、または約2~10個の成員を含む。
いくつかの態様において、ヌクレオチド配列は、ある閾値割合(またはある閾値を超える割合)のワトソンサブファミリーの成員がその配列を含む場合に、分析物DNA断片、例えば、核酸サンプルからの二本鎖DNA断片のワトソン鎖を正確に表すと決定される。いくつかの態様において、ヌクレオチド配列は、ある閾値割合(またはある閾値を超える割合)のクリックサブファミリーの成員がその配列を含む場合に、分析物DNA断片、例えば、核酸サンプルからの二本鎖DNA断片のクリック鎖を正確に表すと決定される。
閾値は、例えば、サブファミリーの成員の数、シーケンシング実験の特定の目的、およびシーケンシング実験の特定のパラメータに基づき当業者によって決定されることができる。いくつかの態様において、閾値は1%、5%、10%、20%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%または100%に設定される。特定の態様において、閾値は50%に設定される。ほんの一例として、閾値が50%に設定される態様において、ヌクレオチド配列は、サブファミリー成員の少なくとも50%がその配列を含む場合に、分析物DNA断片、例えば、核酸サンプルからの二本鎖DNA断片のワトソン鎖またはクリック鎖を正確に表すと決定される。他のほんの一例として、閾値が50%に設定される態様において、ヌクレオチド配列は、サブファミリー成員の50%超がその配列を含む場合に、分析物DNA断片、例えば、核酸サンプルからの二本鎖DNA断片のワトソン鎖またはクリック鎖を正確に表すと決定される。
いくつかの態様において、分析物DNA断片のワトソン鎖を正確に表す配列は、変異を有すると決定される。いくつかの態様において、分析物DNA断片のワトソン鎖を正確に表す配列は、配列が、変異を欠く参照配列と異なる場合、変異を有すると決定される。
いくつかの態様において、分析物DNA断片のクリック鎖を正確に表す配列は、変異を有すると決定される。いくつかの態様において、分析物DNA断片のクリック鎖を正確に表す配列は、配列が、変異を欠く参照配列と異なる場合、変異を有すると決定される。
いくつかの態様において、分析物DNA断片は、ワトソン鎖を正確に表す配列とクリック鎖を正確に表す配列とが同じ変異を含む場合、変異を有すると決定される。
場合によっては、増幅された標的領域のペアエンドシーケンシングリード内の分子バーコードの位置を用いて、増幅された標的領域が二本鎖核酸鋳型のどの鎖に由来するかを区別することができる。例えば、増幅された標的領域の第1のペアエンドシーケンシングリードが、分子バーコードを最後に読み出したことを示す場合、増幅された標的領域は、核酸鋳型のセンス鎖に由来すると同定することができ、増幅された標的領域の第1のペアエンドシーケンシングリードが、分子バーコードを最初に読み出したことを示す場合、増幅された標的領域は、核酸鋳型のアンチセンス鎖に由来すると同定することができる。例えば、増幅された標的領域の第2のペアエンドシーケンシングリードが、分子バーコードを最初に読み出したことを示す場合、増幅された標的領域は、核酸鋳型のアンチセンス鎖に由来すると同定することができ、増幅された標的領域の第2のペアエンドシーケンシングリードが、分子バーコードを最後に読み出したことを示す場合、増幅された標的領域は、核酸鋳型のセンス鎖に由来すると同定することができる。場合によっては、ペアエンドシーケンシングを用いて、ワトソン鎖に由来する増幅産物をクリック鎖に由来する増幅産物と区別することができる。
標的領域(例えば、本明細書において記述されるように増幅された標的領域)のシーケンシング後、シーケンシングリードを、参照ゲノムとアライメントさせ、各シーケンシングリードに存在する分子バーコード別に分類することができる。場合によっては、同じ分子バーコードを含み、二本鎖核酸鋳型のワトソン鎖およびクリック鎖の両方(例えば、標的領域のワトソン鎖およびクリック鎖の両方)にマッピングされるシーケンシングリードは、二重鎖サポートを有すると同定することができる。例えば、標的領域における1つまたは複数の変異の存在を示すシーケンシングリードが、同じ分子バーコードを含み、標的領域のワトソン鎖およびクリック鎖の両方にマッピングされる場合、変異は、二重鎖サポートを有すると同定することができる。
分子バーコードを含む核酸断片の増幅は、バーコード付けされた断片のファミリーを生成するために、公知の技法に従って実施することができる。いくつかの態様において、ポリメラーゼ連鎖反応(PCR)を用いることができる。いくつかの態様において、逆PCRが用いられうる。いくつかの態様において、ローリングサークル増幅を用いることができる。断片の増幅は、典型的には、分子バーコードと同時に断片に付着させる、プライミング部位に相補的なプライマーを用いて行われる。いくつかの態様において、増幅が分子バーコードを含むように、プライミング部位は分子バーコードの遠位にある。
いくつかの態様において、増幅は断片のファミリーを形成し、ファミリーの各成員は同じ分子バーコードを共有している。いくつかの態様において、アダプター断片に存在する分子バーコードの多様性は、断片の多様性を大きく上回っており、したがって各ファミリーは単一の核酸断片分子に由来する。いくつかの態様において、増幅のために用いられるプライマーは、エキソヌクレアーゼに対してより耐性にするために化学的に修飾されうる。いくつかの態様において、ファミリー成員を配列決定し比較して、ファミリー内の任意の相違を同定する。いくつかの態様において、シーケンシングは超並列シーケンシングプラットフォーム上で実施され、その多くが市販されている。シーケンシングプラットフォームが「グラフティング」、すなわちシーケンシング装置への付着のための配列を必要とする場合、そのような配列は、分子バーコードの追加中に追加されてもよく、または別個に追加されてもよい。グラフティング配列は、分子バーコード付きプライマー、ユニバーサルプライマー、遺伝子標的特異的プライマー、ファミリーを作製するために用いられる増幅プライマー、サンプルバーコード付きプライマーの一部であってもよく、または別個であってもよい。冗長シーケンシングは、単一ファミリーの複数の成員のシーケンシングを指す。
いくつかの態様において、核酸断片中の変異を同定するための閾値を設定することができる。「変異」がファミリーの全成員に現れる場合、それは核酸断片に由来する。変異が全成員よりも少ない場合、それは分析中(例えば、増幅段階中)に導入された人工産物でありうる。変異をコールするための閾値は、例えば、1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、97%、98%または100%に設定されうる。いくつかの態様において、変異をコールするための閾値は95%であり、したがって同じバーコードを共有するファミリー成員の95%がその変異を含む場合、その変異は本物であり、人工産物ではないと見なされる。閾値は、配列決定されるファミリーの成員の数、ならびに特定の目的および状況に基づいて設定されるであろう。
いくつかの態様において、1つまたは複数のシーケンシング法を用いて、増幅されたDNA分子を評価し、変異が二本鎖DNA分子の両方の鎖上に存在するかどうかを決定することができる。いくつかの態様において、シーケンシングリードを用いて、1つまたは複数の変異の存在または非存在について、増幅されたDNA分子を評価することができ、シーケンシングリードを用いて、変異が二本鎖DNA分子の両方の鎖上に存在するかどうかを決定することができる。本明細書において記述される1つまたは複数の変異の存在または非存在について、増幅されたDNA分子を評価するために用いることができるシーケンシング法の例は、非限定的に、単一リードシーケンシング、ペアエンドシーケンシング、NGS、およびディープシーケンシングを含む。いくつかの態様において、単一リードシーケンシングは、鋳型の全長にわたってシーケンスリードを生成するシーケンシングを含む。いくつかの態様において、シーケンシングはペアエンドシーケンシングを含む。いくつかの態様において、シーケンシングは超並列シーケンサーで実施される。いくつかの態様において、超並列シーケンサーは、鋳型ポリヌクレオチドの両末端からシーケンスリードを決定するように構成される。
いくつかの態様において、本明細書において記述される方法は、(g) 第1の分析物DNAファミリーを生成するために、分析物DNA断片の第1の集団のうちの少なくとも1つの成員上に存在する分子バーコードに従って第1のシーケンシングリードを分類する段階; (h) 第2の分析物DNAファミリーを生成するために、分析物DNA断片の第2の集団のうちの少なくとも1つの成員上に存在する分子バーコードに従って第2のシーケンシングリードを分類する段階; (i) 第1の分析物DNAファミリー中のタグ付けされたワトソン鎖およびクリック鎖の第1の特徴を同定する段階; ならびに(j) 第2の分析物DNAファミリー中の適合されたワトソン鎖およびクリック鎖の第2の特徴を同定する段階を含み、したがって、二本鎖DNA分子の少なくとも一方の鎖上に存在する第1の特徴および第2の特徴を同定する。いくつかの態様において、本方法は、二本鎖DNA分子の両方の鎖上に存在する第1の特徴および第2の特徴を同定することを含む。
エピジェネティックな特徴 - メチル化分析
いくつかの態様において、第1および/または第2の特徴はエピジェネティックな特徴であることができ、ここで「エピジェネティックな特徴」という用語は、DNA配列の変化を伴わない遺伝性の表現型変化を指すことができる。いくつかの態様において、エピジェネティックな特徴は、ヌクレオチド配列の変化を伴わないゲノムに対する機能的に関連する変化を含む。いくつかの態様において、エピジェネティックな特徴は、ヒドロキシメチル化、ヒストン修飾、マイクロRNA調節、アセチル化、リン酸化、ユビキチン化、またはSUMO化である。いくつかの態様において、エピジェネティックな特徴はメチル化である。いくつかの態様において、エピジェネティックな特徴はメチル化パターンである。いくつかの態様において、メチル化パターンは、不確定な起源のクローン性造血を介して生成された細胞に存在するメチル化パターンに対応する。いくつかの態様において、メチル化パターンは、起源組織に存在するメチル化パターンに対応する。いくつかの態様において、起源組織は、肛門、膀胱/尿路上皮、乳房、子宮頸部、結腸/直腸、頭頸部、腎臓、肝臓/胆管、肺、リンパ系新生物、黒色腫、骨髄系新生物、卵巣、膵臓/胆嚢、前立腺、甲状腺、上部GI、または子宮である(Cypris et al., Front. Genet. 10:785 (2019), Liu et al., Ann Oncol.31(6):745-759 (2020))。
いくつかの態様において、第1および/または第2の特徴はエピジェネティックな特徴であることができ、ここで「エピジェネティックな特徴」という用語は、DNA配列の変化を伴わない遺伝性の表現型変化を指すことができる。いくつかの態様において、エピジェネティックな特徴は、ヌクレオチド配列の変化を伴わないゲノムに対する機能的に関連する変化を含む。いくつかの態様において、エピジェネティックな特徴は、ヒドロキシメチル化、ヒストン修飾、マイクロRNA調節、アセチル化、リン酸化、ユビキチン化、またはSUMO化である。いくつかの態様において、エピジェネティックな特徴はメチル化である。いくつかの態様において、エピジェネティックな特徴はメチル化パターンである。いくつかの態様において、メチル化パターンは、不確定な起源のクローン性造血を介して生成された細胞に存在するメチル化パターンに対応する。いくつかの態様において、メチル化パターンは、起源組織に存在するメチル化パターンに対応する。いくつかの態様において、起源組織は、肛門、膀胱/尿路上皮、乳房、子宮頸部、結腸/直腸、頭頸部、腎臓、肝臓/胆管、肺、リンパ系新生物、黒色腫、骨髄系新生物、卵巣、膵臓/胆嚢、前立腺、甲状腺、上部GI、または子宮である(Cypris et al., Front. Genet. 10:785 (2019), Liu et al., Ann Oncol.31(6):745-759 (2020))。
いくつかの態様において、本明細書において記述される方法を用いて、二本鎖DNA分子の一方または両方の鎖におけるCpGジヌクレオチドでのメチル化を(例えば、両方の鎖を同時に)検出することができる。いくつかの態様において、DNA分子の集団をバイサルファイトで処理して、DNA分子中のシトシン塩基をウラシル塩基に変換し、変換されたDNA分子の集団を形成させる。いくつかの態様において、分子バーコードに付着した過剰の標的特異的な増幅プライマーを用いて、変換されたDNA分子の集団の両鎖に分子バーコードを付着させて、増幅された、バーコード付けされた、変換されたDNA分子の集団を形成させる。いくつかの態様において、増幅された、バーコード付けされた、変換されたDNA分子は、増幅反応において増幅されて、増幅された、バーコード付けされた、変換されたDNA分子のファミリーを形成し、ここで、同じ分子バーコードを共有する、増幅された、バーコード付けされた、変換されたDNA分子が、DNA分子のファミリーを形成する。いくつかの態様において、ファミリーの複数の成員をシーケンシング反応に供して、ファミリーの該複数の成員の両鎖のヌクレオチド配列を得る。いくつかの態様において、ファミリーの複数の成員のヌクレオチド配列が比較され、成員の90%超がCpGジヌクレオチドでの選択されたメチル化Cを含むファミリーが同定される。いくつかの態様において、増幅された、バーコード付けされた、変換されたDNA分子の2つの相補鎖のヌクレオチド配列が比較され、CpGジヌクレオチドでのメチル化Cが2つの相補鎖において同定される。
いくつかの態様において、昇温および低pHでの重亜硫酸ナトリウムとのDNA断片のインキュベーションにより、シトシンが脱アミノ化されて5,6-ジヒドロシトシン-6-スルホネートが形成される。本明細書において開示される方法で用いるための重亜硫酸ナトリウム処理の例示的な方法は、PCT/US2018/022664に記述されており、これは参照によりその全体が本明細書に組み入れられる。その後の高pHでの加水分解的脱アミノ化によりスルホネートが除去され、ウラシルが得られる。この基本反応の多くの修正が記述されており、シトシンと5-メチルシトシン(5-mC)を区別するために主に用いられており、この後者はバイサルファイトでの変換の影響を受けない。CをUに変換することに加えて、バイサルファイト処理はDNAを変性させ、それを分解することができる。この分解はバイサルファイト処理の標準的な用途には限定されないが、変換前に既に分解されている臨床サンプル中の変異検出を伴う用途には重要である。いくつかの態様において、これらの産物のシーケンシングにより、平均して、99.8%超のC塩基が(メチル化またはヒドロキシメチル化されているためバイサルファイトでの変換に抵抗性でありうる、5'-CpG部位のC塩基を除いて)両鎖でT塩基に変換されたことが明らかになっている。
本開示を以下の実施例においてさらに記述するが、これらは特許請求の範囲において記述される本開示の範囲を限定するものではない。
実施例1 - バイサルファイト処理、ライブラリ調製、およびシーケンシング
EZ DNA Methylation Kit (Zymo Research, カタログ番号D5001)を選択し、製造業者の推奨プロトコルに従ってDNAサンプルをバイサルファイト処理し脱スルホン化した。DNAを37℃の希釈M-Dilution緩衝液中で15分間変性させた後に、暗所中50℃で、16時間、バイサルファイトで変換し、その後に氷上に10分間置いた。M-Wash緩衝液で1回洗浄した後に、サンプルを室温で15分間脱スルホン化した。サンプルをM-Wash緩衝液で2回洗浄した後に、溶出緩衝液(Elution Buffer) 15 μL中に溶出し、-20℃で貯蔵した。Accel-NGS Methyl-Seq DNA Libraryキット(Swift Bioscience, カタログ番号30024)を用い、インデックス作成段階で9 PCRサイクルを使って次世代シーケンシングライブラリを調製した。各ライブラリをIllumina HiSeq 4000機器の単一レーンで150 bpまでペアエンドシーケンスを行った。その後の分析には、Illumina CASAVA Chastityフィルタを通過したリードを用いた。バイサルファイトシーケンシングからのFASTQファイルは、European Genome-phenome Archiveから入手することができる。
EZ DNA Methylation Kit (Zymo Research, カタログ番号D5001)を選択し、製造業者の推奨プロトコルに従ってDNAサンプルをバイサルファイト処理し脱スルホン化した。DNAを37℃の希釈M-Dilution緩衝液中で15分間変性させた後に、暗所中50℃で、16時間、バイサルファイトで変換し、その後に氷上に10分間置いた。M-Wash緩衝液で1回洗浄した後に、サンプルを室温で15分間脱スルホン化した。サンプルをM-Wash緩衝液で2回洗浄した後に、溶出緩衝液(Elution Buffer) 15 μL中に溶出し、-20℃で貯蔵した。Accel-NGS Methyl-Seq DNA Libraryキット(Swift Bioscience, カタログ番号30024)を用い、インデックス作成段階で9 PCRサイクルを使って次世代シーケンシングライブラリを調製した。各ライブラリをIllumina HiSeq 4000機器の単一レーンで150 bpまでペアエンドシーケンスを行った。その後の分析には、Illumina CASAVA Chastityフィルタを通過したリードを用いた。バイサルファイトシーケンシングからのFASTQファイルは、European Genome-phenome Archiveから入手することができる。
実施例2 - DNAシーケンシングデータ分析
Trimmomaticを用いて、25を下回る品質スコアを有するIlluminaアダプターおよび塩基を各リードの先頭および末尾からトリミングした。hg19への全ゲノムアライメントを可能にするため、Trimmomatic v0.38を用いてリード1および2の先頭から14 bp UIDおよび13 bp定常配列をトリミングした。BSMAPを用いて各ペアエンドリードを、バイサルファイトで変換したhg19ゲノムとアライメントし、BSMAPのmethratio.pyスクリプトを用いて各CpGの平均メチル化を計算した。
Trimmomaticを用いて、25を下回る品質スコアを有するIlluminaアダプターおよび塩基を各リードの先頭および末尾からトリミングした。hg19への全ゲノムアライメントを可能にするため、Trimmomatic v0.38を用いてリード1および2の先頭から14 bp UIDおよび13 bp定常配列をトリミングした。BSMAPを用いて各ペアエンドリードを、バイサルファイトで変換したhg19ゲノムとアライメントし、BSMAPのmethratio.pyスクリプトを用いて各CpGの平均メチル化を計算した。
実施例3 - 血漿cfDNA組織デコンボリューションのためのメチル化マーカーの同定
5,653箇所のメチル化差異500 bp領域を用いて、全cfDNAプールに対する12種の組織タイプ(肝臓、肺、結腸、小腸、膵臓、副腎、食道、心臓、脳、T細胞、B細胞、および好中球)の平均寄与を決定した。血漿DNA組織マッピングのためのメチル化マーカーを同定するために、ヒト12組織のバイサルファイトシーケンシングデータを分析した。肝臓、肺、食道、心臓、膵臓、結腸、小腸、副腎、脳、およびT細胞の全ゲノムバイサルファイトシーケンシングデータをベイラー医科大学のヒトエピゲノムアトラス(www.genboree.org/epigenomeatlas/index.rhtml)から検索した。
5,653箇所のメチル化差異500 bp領域を用いて、全cfDNAプールに対する12種の組織タイプ(肝臓、肺、結腸、小腸、膵臓、副腎、食道、心臓、脳、T細胞、B細胞、および好中球)の平均寄与を決定した。血漿DNA組織マッピングのためのメチル化マーカーを同定するために、ヒト12組織のバイサルファイトシーケンシングデータを分析した。肝臓、肺、食道、心臓、膵臓、結腸、小腸、副腎、脳、およびT細胞の全ゲノムバイサルファイトシーケンシングデータをベイラー医科大学のヒトエピゲノムアトラス(www.genboree.org/epigenomeatlas/index.rhtml)から検索した。
常染色体上の全てのCpGアイランド(CGI)およびCpGショアを、メチル化マーカーセットに含まれる可能性があるかについて評価した。ソースデータにおける性関連染色体量の違いに関連するメチル化レベルの潜在的なばらつきを最小限に抑えるために、性染色体上のCGIおよびCpGショアを用いなかった。CGIをカリフォルニア大学サンタクルーズ校(UCSC)データベース(genome.ucsc.edu/, 27,048 CGIs 対ヒトゲノム)からダウンロードし、CpGショアをCGIの2 kbのフランキングウィンドウとして定義した。次に、CGIおよびCpGショアを重複のない500 bp単位に細分化し、各単位を潜在的なメチル化マーカーと見なした。
潜在的なマーカー遺伝子座の全てのメチル化密度(すなわち、500 bp単位内でメチル化されているCpGの割合)を12種の組織タイプ間で比較した。12種の組織タイプのメチル化プロファイルを用いて、2種類のメチル化マーカーを同定した。I型マーカーは、12種の組織タイプの平均レベルと比較して、ある組織においてプラスマイナス3 SDであるメチル化密度を有する任意のゲノム遺伝子座を指す。II型マーカーは、12種の組織タイプにわたって非常に多様なメチル化密度を示すゲノム遺伝子座である。遺伝子座は、(A) 最も高メチル化された組織のメチル化密度が、最も低メチル化された組織のメチル化密度より少なくとも20%高い; (B) 13種の組織タイプにわたるメチル化密度をグループの平均メチル化密度(すなわち、変動係数)で割ったときのSDが少なくとも0.25である場合、高度に多様性であると見なされる。冗長になる可能性のあるマーカーの数を減らすため、1つのCGIに隣接する2つのCpGショアの1つの連続ブロックでは、マーカーが1つだけ選択される。
実施例4 - 血漿cfDNA組織デコンボリューション
血漿中のさまざまなメチル化マーカーのメチル化密度と、さまざまな組織における対応するメチル化マーカーとの間の数学的関係は、
として表すことができ、ここで
は血漿中のメチル化バイオマーカーiのメチル化密度を表し; pkは血漿に対する組織kの比例的寄与を表し; およびMDikは組織kにおけるメチル化バイオマーカーiのメチル化密度を表す。デコンボリューションプロセスの目的は、組織パネルの各成員について、血漿に対する組織kの比例的寄与、すなわちpkを決定することであった。連立方程式を解くために二次プログラミングを用いた。I型マーカーとII型マーカー(合計5,653マーカー)の組み合わせリストにある各メチル化マーカーについて、組織パネルとそれらに対応するメチル化密度を含むマトリックスをコンパイルした。このプログラムでは、各組織タイプのpk値の範囲を入力し、各マーカーについて予想される血漿DNAメチル化密度が決定された。試験されたpk値の範囲は、全ての候補組織、すなわち、肝臓、好中球、およびリンパ球の血漿DNAへの寄与の合計が100%であり、全てのpkの値が負ではないという期待を満たすものでなければならない。これらの3つの組織タイプは、それぞれが1つまたは複数の臨床シナリオ、すなわち肝移植およびHCCにおける肝臓、ならびに骨髄移植およびリンパ腫症例における血液細胞、によって検証されうるので選択された。プログラムでは次に、血漿DNAバイサルファイトシーケンシングから得られたデータに最も酷似していた、マーカー全体で予想されるメチル化密度をもたらすpk値のセットが同定された。
血漿中のさまざまなメチル化マーカーのメチル化密度と、さまざまな組織における対応するメチル化マーカーとの間の数学的関係は、
として表すことができ、ここで
は血漿中のメチル化バイオマーカーiのメチル化密度を表し; pkは血漿に対する組織kの比例的寄与を表し; およびMDikは組織kにおけるメチル化バイオマーカーiのメチル化密度を表す。デコンボリューションプロセスの目的は、組織パネルの各成員について、血漿に対する組織kの比例的寄与、すなわちpkを決定することであった。連立方程式を解くために二次プログラミングを用いた。I型マーカーとII型マーカー(合計5,653マーカー)の組み合わせリストにある各メチル化マーカーについて、組織パネルとそれらに対応するメチル化密度を含むマトリックスをコンパイルした。このプログラムでは、各組織タイプのpk値の範囲を入力し、各マーカーについて予想される血漿DNAメチル化密度が決定された。試験されたpk値の範囲は、全ての候補組織、すなわち、肝臓、好中球、およびリンパ球の血漿DNAへの寄与の合計が100%であり、全てのpkの値が負ではないという期待を満たすものでなければならない。これらの3つの組織タイプは、それぞれが1つまたは複数の臨床シナリオ、すなわち肝移植およびHCCにおける肝臓、ならびに骨髄移植およびリンパ腫症例における血液細胞、によって検証されうるので選択された。プログラムでは次に、血漿DNAバイサルファイトシーケンシングから得られたデータに最も酷似していた、マーカー全体で予想されるメチル化密度をもたらすpk値のセットが同定された。
T細胞およびB細胞からの寄与の合計はリンパ球からの寄与と見なされ、白血球からの寄与の合計はリンパ球と好中球からの寄与と見なされた。
実施例5 - シーケンシングライブラリの生成
ライブラリを本明細書において記述されるように調製した(図3)。非メチル化シトシンではなく5-メチルシトシンを含むカスタム3'および5'アダプターをライゲーション中に使用し、ライゲーションに続いて、3'アダプターを標的とする単一のデオキシウリジン含有ビオチン化プライマーによる1サイクル、2サイクルまたは3サイクルの線状PCRを実施した。増幅された産物をストレプトアビジンビーズに結合させ、その後に変性させて、ビオチン化された増幅鎖(「A」プール)と、メチル化パターンを依然として保持していたオリジナルの、ビオチン化されていない鎖(「M」プール)とを分離した。「M」プールを含む熱変性後の上清を、バイサルファイトで変換しかつ増幅した。捕捉に基づくもしくはPCRに基づく濃縮、および/または全ゲノムバイサルファイトシーケンシングの後、「M」プールをメチル化の変化について分析した。「A」プールの同時調製のために、ストレプトアビジンビーズに結合した鎖を、ウラシルDNAグリコシラーゼと、鎖の5'末端内に埋め込まれたデオキシウリジン塩基を標的とするDNAグリコシラーゼ-リアーゼエンドヌクレアーゼVIIIとの混合物からなるUSER (ウラシル特異的切除試薬)酵素による処理後に放出させた。遊離した鎖を増幅し、体細胞変異の分析のために配列決定する(例えば、Cohen et al. Nat Biotechnol. (2021) 39(10):1220-1227、この刊行物は参照により本明細書に組み入れられる) (図4~5)。
ライブラリを本明細書において記述されるように調製した(図3)。非メチル化シトシンではなく5-メチルシトシンを含むカスタム3'および5'アダプターをライゲーション中に使用し、ライゲーションに続いて、3'アダプターを標的とする単一のデオキシウリジン含有ビオチン化プライマーによる1サイクル、2サイクルまたは3サイクルの線状PCRを実施した。増幅された産物をストレプトアビジンビーズに結合させ、その後に変性させて、ビオチン化された増幅鎖(「A」プール)と、メチル化パターンを依然として保持していたオリジナルの、ビオチン化されていない鎖(「M」プール)とを分離した。「M」プールを含む熱変性後の上清を、バイサルファイトで変換しかつ増幅した。捕捉に基づくもしくはPCRに基づく濃縮、および/または全ゲノムバイサルファイトシーケンシングの後、「M」プールをメチル化の変化について分析した。「A」プールの同時調製のために、ストレプトアビジンビーズに結合した鎖を、ウラシルDNAグリコシラーゼと、鎖の5'末端内に埋め込まれたデオキシウリジン塩基を標的とするDNAグリコシラーゼ-リアーゼエンドヌクレアーゼVIIIとの混合物からなるUSER (ウラシル特異的切除試薬)酵素による処理後に放出させた。遊離した鎖を増幅し、体細胞変異の分析のために配列決定する(例えば、Cohen et al. Nat Biotechnol. (2021) 39(10):1220-1227、この刊行物は参照により本明細書に組み入れられる) (図4~5)。
Claims (43)
- 二本鎖DNA分子の集団におけるある二本鎖DNA分子の遺伝的特徴およびエピジェネティックな特徴を、該二本鎖DNA分子の少なくとも一方の鎖をアッセイすることによって同定するための方法であって、以下の段階:
(a) 適合された二本鎖DNA分子を生成するために、二本鎖DNA分子の各末端にアダプター断片を付着させる段階であって、該適合された二本鎖DNA分子が、適合されたワトソン鎖および適合されたクリック鎖を含み、該アダプター断片が、分子バーコード、プライマー配列、およびアダプター配列を含み、かつ該適合されたワトソン鎖の分子バーコードが、該適合されたクリック鎖の分子バーコードの逆相補体である、該段階;
(b) 該適合された二本鎖DNA分子の両方の鎖をコピーする段階であって、該コピーする段階が、(i) 該適合された二本鎖DNA分子を、タグ付けされたプライマーと接触させることと、(ii) 該適合された二本鎖DNA分子の線状伸長のラウンドを実施し、タグ付けされたワトソン鎖およびタグ付けされたクリック鎖を生成することとを含む、該段階;
(c) 増幅された産物を変性条件に供する段階;
(d) 該適合されたワトソン鎖およびクリック鎖と、該タグ付けされたワトソン鎖およびクリック鎖とを別々に回収する段階;
(e) 該タグ付けされたワトソン鎖およびクリック鎖から分析物DNA断片の第1の集団を生成する段階、ならびに分析物DNA断片の第1の集団のうちの少なくとも1つの成員について第1のシーケンシングリードを生成する段階;
(f) 該適合されたワトソン鎖およびクリック鎖から分析物DNA断片の第2の集団を生成する段階、ならびに分析物DNA断片の第2の集団のうちの少なくとも1つの成員について第2のシーケンシングリードを生成する段階;
(g) 第1の分析物DNAファミリーを生成するために、分析物DNA断片の第1の集団のうちの該少なくとも1つの成員上に存在する分子バーコードに従って第1のシーケンシングリードを分類する段階;
(h) 第2の分析物DNAファミリーを生成するために、分析物DNA断片の第2の集団のうちの該少なくとも1つの成員上に存在する分子バーコードに従って第2のシーケンシングリードを分類する段階;
(i) 第1の分析物DNAファミリーにおいて、該タグ付けされたワトソン鎖およびクリック鎖の遺伝的特徴を同定する段階; ならびに
(j) 第2の分析物DNAファミリーにおいて、該適合されたワトソン鎖およびクリック鎖のエピジェネティックな特徴を同定する段階
を含み、したがって、該二本鎖DNA分子の少なくとも一方の鎖上に存在する遺伝的特徴およびエピジェネティックな特徴を同定する、該方法。 - 前記アダプター断片が、サンプルバーコードをさらに含む、請求項1記載の方法。
- 前記分子バーコードが、内因性バーコード、外因性バーコード、または両方を含む、請求項1または2記載の方法。
- 前記コピーする段階(b)が、前記適合された二本鎖DNA分子の1ラウンド、2ラウンド、または3ラウンドの線状伸長を実施することを含む、請求項1~3のいずれか一項記載の方法。
- 前記タグ付けされたプライマーがウラシル含有ビオチン化プライマーであり、かつ前記タグ付けされたワトソン鎖およびクリック鎖が、該ウラシル含有ビオチン化プライマーから生成される、請求項1~4のいずれか一項記載の方法。
- 前記回収する段階(d)が、前記タグ付けされたワトソン鎖およびクリック鎖をストレプトアビジン官能化ビーズと接触させることを含み、かつここで、前記タグ付けされたワトソン鎖およびクリック鎖が、該ストレプトアビジン官能化ビーズに結合する、請求項5記載の方法。
- 変換されたDNA分子の集団を含む分析物DNA断片の第2の集団を生成すべくシトシン塩基をウラシル塩基に変換するために、前記ストレプトアビジン官能化ビーズに結合していない、回収された前記適合されたワトソン鎖およびクリック鎖が、バイサルファイトで処理される、請求項6記載の方法。
- 前記変性条件が、NaOH変性を含む、請求項1~7のいずれか一項記載の方法。
- 前記変性条件が、熱変性、化学変性、またはそれらの組み合わせを含む、請求項1~8のいずれか一項記載の方法。
- 前記生成する段階(e)および(f)が、PCR条件下で実施される、請求項1~9のいずれか一項記載の方法。
- 遺伝的特徴が変異である、請求項1~10のいずれか一項記載の方法。
- 変異が、挿入、欠失、置換、欠失-挿入、重複、逆位、フレームシフト、反復拡張、転座、およびそれらの組み合わせからなる群より選択される、請求項11記載の方法。
- エピジェネティックな特徴がメチル化である、請求項1~12のいずれか一項記載の方法。
- エピジェネティックな特徴がメチル化パターンである、請求項13記載の方法。
- メチル化パターンが、不確定な起源のクローン性造血を介して生成された細胞に存在するメチル化パターンに対応する、請求項14記載の方法。
- メチル化パターンが、起源組織に存在するメチル化パターンに対応する、請求項15記載の方法。
- 起源組織が、肛門、膀胱/尿路上皮、乳房、子宮頸部、結腸/直腸、頭頸部、腎臓、肝臓/胆管、肺、リンパ系新生物、黒色腫、骨髄系新生物、卵巣、膵臓/胆嚢、前立腺、甲状腺、上部GI、または子宮である、請求項16記載の方法。
- エピジェネティックな特徴が、ヒドロキシメチル化、ヒストン修飾、マイクロRNA調節、アセチル化、リン酸化、ユビキチン化、またはSUMO化である、請求項1~12のいずれか一項記載の方法。
- 二本鎖DNA分子の集団におけるある二本鎖DNA分子の遺伝的特徴およびエピジェネティックな特徴を、該二本鎖DNA分子の両方の鎖をアッセイすることによって同定する、請求項1~18のいずれか一項記載の方法。
- 二本鎖DNA分子の集団におけるある二本鎖DNA分子の第1の特徴および第2の特徴を、該二本鎖DNA分子の少なくとも一方の鎖をアッセイすることによって同定するための方法であって、以下の段階:
(a) 適合された二本鎖DNA分子を生成するために、二本鎖DNA分子の各末端にアダプター断片を付着させる段階であって、該適合された二本鎖DNA分子が、適合されたワトソン鎖および適合されたクリック鎖を含み、該アダプター断片が、分子バーコード、プライマー配列、およびアダプター配列を含み、かつ該適合されたワトソン鎖の分子バーコードが、該適合されたクリック鎖の分子バーコードの逆相補体である、該段階;
(b) 該適合された二本鎖DNA分子の両方の鎖をコピーする段階であって、該コピーする段階が、(i) 該適合された二本鎖DNA分子を、タグ付けされたプライマーと接触させることと、(ii) 該適合された二本鎖DNA分子の線状伸長のラウンドを実施し、タグ付けされたワトソン鎖およびタグ付けされたクリック鎖を生成することとを含む、該段階;
(c) 増幅された産物を変性条件に供する段階;
(d) 該適合されたワトソン鎖およびクリック鎖と、該タグ付けされたワトソン鎖およびクリック鎖とを別々に回収する段階;
(e) 該タグ付けされたワトソン鎖およびクリック鎖から分析物DNA断片の第1の集団を生成する段階、ならびに分析物DNA断片の第1の集団のうちの少なくとも1つの成員について第1のシーケンシングリードを生成する段階;
(f) 該適合されたワトソン鎖およびクリック鎖から分析物DNA断片の第2の集団を生成する段階、ならびに分析物DNA断片の第2の集団のうちの少なくとも1つの成員について第2のシーケンシングリードを生成する段階;
(g) 第1の分析物DNAファミリーを生成するために、分析物DNA断片の第1の集団のうちの該少なくとも1つの成員上に存在する分子バーコードに従って第1のシーケンシングリードを分類する段階;
(h) 第2の分析物DNAファミリーを生成するために、分析物DNA断片の第2の集団のうちの該少なくとも1つの成員上に存在する分子バーコードに従って第2のシーケンシングリードを分類する段階;
(i) 第1の分析物DNAファミリーにおいて、該タグ付けされたワトソン鎖およびクリック鎖の第1の特徴を同定する段階; ならびに
(j) 第2の分析物DNAファミリーにおいて、該適合されたワトソン鎖およびクリック鎖の第2の特徴を同定する段階
を含み、したがって、該二本鎖DNA分子の少なくとも一方の鎖上に存在する第1の特徴および第2の特徴を同定する、該方法。 - 前記アダプター断片が、サンプルバーコードをさらに含む、請求項20記載の方法。
- 前記分子バーコードが、内因性バーコード、外因性バーコード、または両方を含む、請求項20または21記載の方法。
- 前記コピーする段階(b)が、前記適合された二本鎖DNA分子の1ラウンド、2ラウンド、または3ラウンドの線状伸長を実施することを含む、請求項20~22のいずれか一項記載の方法。
- 前記タグ付けされたプライマーがウラシル含有ビオチン化プライマーであり、かつ前記タグ付けされたワトソン鎖およびクリック鎖が、該ウラシル含有ビオチン化プライマーから生成される、請求項20~23のいずれか一項記載の方法。
- 前記回収する段階(d)が、第1の一本鎖DNA断片をストレプトアビジン官能化ビーズと接触させることを含み、かつここで、該第1の一本鎖DNA断片が、該ストレプトアビジン官能化ビーズに結合する、請求項24記載の方法。
- 前記変性条件が、NaOH変性を含む、請求項20~25のいずれか一項記載の方法。
- 前記変性条件が、熱変性、化学変性、またはそれらの組み合わせを含む、請求項20~26のいずれか一項記載の方法。
- 前記生成する段階(e)および(f)が、PCR条件下で実施される、請求項20~27のいずれか一項記載の方法。
- 前記生成する段階が、全ゲノムPCR、全ゲノムバイサルファイトシーケンシング、または捕捉シーケンシングを利用する、請求項20~28のいずれか一項記載の方法。
- 第1の特徴が遺伝的特徴またはエピジェネティックな特徴である、請求項20~29のいずれか一項記載の方法。
- 第2の特徴がエピジェネティックな特徴またはエピジェネティックな特徴である、請求項20~30のいずれか一項記載の方法。
- 第1の特徴および第2の特徴が両方とも遺伝的特徴である、請求項20~31のいずれか一項記載の方法。
- 第1の特徴および第2の特徴が両方ともエピジェネティックな特徴である、請求項20~31のいずれか一項記載の方法。
- 遺伝的特徴が変異である、請求項30~33のいずれか一項記載の方法。
- 変異が、挿入、欠失、置換、欠失-挿入、重複、逆位、フレームシフト、反復拡張、転座、およびそれらの組み合わせからなる群より選択される、請求項34記載の方法。
- 遺伝的特徴の同定が、変異分析、異数性分析、またはフラグメントミクスを含む、請求項30~35のいずれか一項記載の方法。
- エピジェネティックな特徴がメチル化である、請求項30~36のいずれか一項記載の方法。
- エピジェネティックな特徴がメチル化パターンである、請求項30~37のいずれか一項記載の方法。
- メチル化パターンが、不確定な起源のクローン性造血を介して生成された細胞に存在するメチル化パターンに対応する、請求項38記載の方法。
- メチル化パターンが、起源組織に存在するメチル化パターンに対応する、請求項39記載の方法。
- 起源組織が、肛門、膀胱/尿路上皮、乳房、子宮頸部、結腸/直腸、頭頸部、腎臓、肝臓/胆管、肺、リンパ系新生物、黒色腫、骨髄系新生物、卵巣、膵臓/胆嚢、前立腺、甲状腺、上部GI、または子宮である、請求項40記載の方法。
- エピジェネティックな特徴が、ヒドロキシメチル化、ヒストン修飾、マイクロRNA調節、アセチル化、リン酸化、ユビキチン化、またはSUMO化である、請求項30~41のいずれか一項記載の方法。
- 二本鎖DNA分子の集団におけるある二本鎖DNA分子の第1の特徴および第2の特徴を、該二本鎖DNA分子の両方の鎖をアッセイすることによって同定する、請求項20~42のいずれか一項記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163232438P | 2021-08-12 | 2021-08-12 | |
US63/232,438 | 2021-08-12 | ||
PCT/US2022/040174 WO2023018944A1 (en) | 2021-08-12 | 2022-08-12 | Methods for simultaneous mutation detection and methylation analysis |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024529674A true JP2024529674A (ja) | 2024-08-08 |
Family
ID=85201092
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024508357A Pending JP2024529674A (ja) | 2021-08-12 | 2022-08-12 | 同時での変異検出およびメチル化分析のための方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20240352518A1 (ja) |
EP (1) | EP4384637A1 (ja) |
JP (1) | JP2024529674A (ja) |
WO (1) | WO2023018944A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB202308392D0 (en) | 2023-06-06 | 2023-07-19 | Fu Guoliang | Methods, compositions, and kits for preparing library and targeted sequencing |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3495503A1 (en) * | 2012-03-05 | 2019-06-12 | President and Fellows of Harvard College | Systems and methods for epigenetic sequencing |
EP3524694B1 (en) * | 2013-12-28 | 2020-07-15 | Guardant Health, Inc. | Methods and systems for detecting genetic variants |
-
2022
- 2022-08-12 EP EP22856660.0A patent/EP4384637A1/en active Pending
- 2022-08-12 JP JP2024508357A patent/JP2024529674A/ja active Pending
- 2022-08-12 US US18/682,716 patent/US20240352518A1/en active Pending
- 2022-08-12 WO PCT/US2022/040174 patent/WO2023018944A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2023018944A1 (en) | 2023-02-16 |
US20240352518A1 (en) | 2024-10-24 |
EP4384637A1 (en) | 2024-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110536967B (zh) | 用于分析相联系核酸的试剂和方法 | |
JP7379418B2 (ja) | 腫瘍のディープシークエンシングプロファイリング | |
JP5986572B2 (ja) | 固定化プライマーを使用した標的dnaの直接的な捕捉、増幅、および配列決定 | |
US11965157B2 (en) | Compositions and methods for library construction and sequence analysis | |
CA3096668A1 (en) | Compositions and methods for cancer or neoplasia assessment | |
JP2020516281A (ja) | 試料核酸にアダプターを付着する方法 | |
US20250019755A1 (en) | Methods and materials for assessing nucleic acids | |
US20240352518A1 (en) | Methods for simultaneous mutation detection and methylation analysis | |
US20220127601A1 (en) | Method of determining the origin of nucleic acids in a mixed sample | |
US20220145368A1 (en) | Methods for noninvasive prenatal testing of fetal abnormalities | |
EA047854B1 (ru) | Способы неинвазивного пренатального тестирования аномалий плода | |
JP2024035110A (ja) | 変異核酸の正確な並行定量するための高感度方法 | |
WO2024137858A2 (en) | Methods and compositions for assessing colorectal cancer |