JP2021534803A - 無細胞核酸試料におけるアレル不均衡を検出するための方法およびシステム - Google Patents
無細胞核酸試料におけるアレル不均衡を検出するための方法およびシステム Download PDFInfo
- Publication number
- JP2021534803A JP2021534803A JP2021512247A JP2021512247A JP2021534803A JP 2021534803 A JP2021534803 A JP 2021534803A JP 2021512247 A JP2021512247 A JP 2021512247A JP 2021512247 A JP2021512247 A JP 2021512247A JP 2021534803 A JP2021534803 A JP 2021534803A
- Authority
- JP
- Japan
- Prior art keywords
- sample
- cnv
- threshold
- nucleic acid
- germline
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 226
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 217
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 217
- 238000000034 method Methods 0.000 title claims description 146
- 238000012163 sequencing technique Methods 0.000 claims abstract description 107
- 238000011109 contamination Methods 0.000 claims abstract description 60
- 210000004602 germ cell Anatomy 0.000 claims description 134
- 108700028369 Alleles Proteins 0.000 claims description 83
- 102000053602 DNA Human genes 0.000 claims description 76
- 108020004414 DNA Proteins 0.000 claims description 76
- 238000005259 measurement Methods 0.000 claims description 64
- 108090000623 proteins and genes Proteins 0.000 claims description 51
- 206010028980 Neoplasm Diseases 0.000 claims description 30
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 24
- 239000013566 allergen Substances 0.000 claims description 22
- 201000011510 cancer Diseases 0.000 claims description 20
- 201000010099 disease Diseases 0.000 claims description 17
- 210000004369 blood Anatomy 0.000 claims description 14
- 239000008280 blood Substances 0.000 claims description 14
- 102000054767 gene variant Human genes 0.000 claims description 14
- 210000001124 body fluid Anatomy 0.000 claims description 12
- 239000010839 body fluid Substances 0.000 claims description 12
- 238000001914 filtration Methods 0.000 claims description 12
- 108091034117 Oligonucleotide Proteins 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 11
- 230000000392 somatic effect Effects 0.000 claims description 7
- 108700040618 BRCA1 Genes Proteins 0.000 claims description 6
- 101150072950 BRCA1 gene Proteins 0.000 claims description 6
- 210000002381 plasma Anatomy 0.000 claims description 6
- 210000002700 urine Anatomy 0.000 claims description 6
- 230000002776 aggregation Effects 0.000 claims description 5
- 238000004220 aggregation Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 102220223425 rs201596327 Human genes 0.000 claims description 5
- 210000002966 serum Anatomy 0.000 claims description 5
- 206010036790 Productive cough Diseases 0.000 claims description 4
- 210000003097 mucus Anatomy 0.000 claims description 4
- 210000003296 saliva Anatomy 0.000 claims description 4
- 230000035945 sensitivity Effects 0.000 claims description 4
- 210000003802 sputum Anatomy 0.000 claims description 4
- 208000024794 sputum Diseases 0.000 claims description 4
- 238000013179 statistical model Methods 0.000 claims description 4
- 230000001052 transient effect Effects 0.000 claims description 2
- JJWKPURADFRFRB-UHFFFAOYSA-N carbonyl sulfide Chemical compound O=C=S JJWKPURADFRFRB-UHFFFAOYSA-N 0.000 claims 2
- 238000003556 assay Methods 0.000 abstract description 16
- 239000000523 sample Substances 0.000 description 229
- 101000962461 Homo sapiens Transcription factor Maf Proteins 0.000 description 66
- 101000613608 Rattus norvegicus Monocyte to macrophage differentiation factor Proteins 0.000 description 66
- 125000003729 nucleotide group Chemical group 0.000 description 63
- 239000002773 nucleotide Substances 0.000 description 60
- 238000003199 nucleic acid amplification method Methods 0.000 description 27
- 230000003321 amplification Effects 0.000 description 25
- 238000006243 chemical reaction Methods 0.000 description 20
- 238000003860 storage Methods 0.000 description 20
- 230000015654 memory Effects 0.000 description 17
- 230000035772 mutation Effects 0.000 description 17
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 14
- 241000282414 Homo sapiens Species 0.000 description 13
- 230000000295 complement effect Effects 0.000 description 12
- 238000007481 next generation sequencing Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- 238000011282 treatment Methods 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 11
- 210000004027 cell Anatomy 0.000 description 11
- 108091028043 Nucleic acid sequence Proteins 0.000 description 9
- 235000019506 cigar Nutrition 0.000 description 9
- 238000012217 deletion Methods 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 102000040430 polynucleotide Human genes 0.000 description 9
- 108091033319 polynucleotide Proteins 0.000 description 9
- 239000002157 polynucleotide Substances 0.000 description 9
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 8
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 8
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000003752 polymerase chain reaction Methods 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 210000000349 chromosome Anatomy 0.000 description 6
- 238000003066 decision tree Methods 0.000 description 6
- 208000035475 disorder Diseases 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 108091093088 Amplicon Proteins 0.000 description 5
- 108091035707 Consensus sequence Proteins 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 239000002777 nucleoside Substances 0.000 description 5
- 229930024421 Adenine Natural products 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 4
- 239000012472 biological sample Substances 0.000 description 4
- 229940104302 cytosine Drugs 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012165 high-throughput sequencing Methods 0.000 description 4
- 238000009396 hybridization Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 229940035893 uracil Drugs 0.000 description 4
- 206010069754 Acquired gene mutation Diseases 0.000 description 3
- 208000026350 Inborn Genetic disease Diseases 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000003766 bioinformatics method Methods 0.000 description 3
- 238000005251 capillar electrophoresis Methods 0.000 description 3
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 210000003722 extracellular fluid Anatomy 0.000 description 3
- 208000016361 genetic disease Diseases 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 230000014759 maintenance of location Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 125000003835 nucleoside group Chemical group 0.000 description 3
- 102000054765 polymorphisms of proteins Human genes 0.000 description 3
- 238000012175 pyrosequencing Methods 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 230000037439 somatic mutation Effects 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 101150058202 73 gene Proteins 0.000 description 2
- 240000005020 Acaciella glauca Species 0.000 description 2
- 108091061744 Cell-free fetal DNA Proteins 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- -1 DNA or RNA (eg Chemical class 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 2
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 230000001464 adherent effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000001574 biopsy Methods 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 210000003754 fetus Anatomy 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000011278 mitosis Effects 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 235000003499 redwood Nutrition 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 229920002477 rna polymer Polymers 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 239000000377 silicon dioxide Substances 0.000 description 2
- 239000004055 small Interfering RNA Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- CKTSBUTUHBMZGZ-ULQXZJNLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-tritiopyrimidin-2-one Chemical compound O=C1N=C(N)C([3H])=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-ULQXZJNLSA-N 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 208000035143 Bacterial infection Diseases 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 206010005176 Blindness congenital Diseases 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 206010015150 Erythema Diseases 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 208000031220 Hemophilia Diseases 0.000 description 1
- 208000009292 Hemophilia A Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 208000029462 Immunodeficiency disease Diseases 0.000 description 1
- 108020005198 Long Noncoding RNA Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 1
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 208000037844 advanced solid tumor Diseases 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000000386 athletic effect Effects 0.000 description 1
- 208000022362 bacterial infectious disease Diseases 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 210000001772 blood platelet Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 231100000321 erythema Toxicity 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 210000000416 exudates and transudate Anatomy 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000008303 genetic mechanism Effects 0.000 description 1
- 210000003731 gingival crevicular fluid Anatomy 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 239000007943 implant Substances 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007834 ligase chain reaction Methods 0.000 description 1
- 238000011528 liquid biopsy Methods 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 210000004880 lymph fluid Anatomy 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 208000030159 metabolic disease Diseases 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 201000006938 muscular dystrophy Diseases 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 208000012978 nondisjunction Diseases 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 210000004910 pleural fluid Anatomy 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 239000010454 slate Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 210000001179 synovial fluid Anatomy 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6858—Allele-specific amplification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/10—Ploidy or copy number detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/20—Sequence assembly
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Theoretical Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
本出願は、2018年9月4日に出願された米国仮特許出願第62/726,922号、および2019年2月26日に出願された米国仮特許出願第62/810,625号に基づく利益を主張し、これらの出願は、それぞれ参照によりその全体が本明細書に援用される。
がんの対象(例えば、患者)において、アレル不均衡は、ヘテロ接合性の喪失によって引き起こされることがあり、また、アレル不均衡がない試料と比較して、対象からの無細胞核酸試料のアッセイにおいて、異なった変異アレル割合(MAF)分布をもたらしうる。例えば、アレル不均衡がある試料は、MAFが非常に低い生殖系列バリアントを含みうる。例えばシーケンシングのための処置中などに、試料にコンタミネーションが生じた場合や、試料が、例えば移植片、輸血、または胎児から生じた(対象のゲノム以外の)第2のゲノムを含む場合にも、MAFが低い生殖系列バリアントが観察されることがある。
本明細書において、アレル不均衡試料と、コンタミネーションが生じた試料または第2のゲノムを含む試料との区別において直面する問題が認識される。コンタミネーションまたは第2のゲノムを含む試料からの無細胞核酸をアッセイする場合、そのような試料は、追加の人手による精査、または追加のシーケンシングランの実施を必要とすることがある。その結果、アレル不均衡試料と、コンタミネーションが生じた試料または第2ゲノム試料との識別に失敗すると、そのような試料を信頼性をもってアッセイするためのコストと所要時間が著しく増大しうる。本開示は、無細胞核酸試料におけるアレル不均衡またはコンタミネーションを識別する方法およびシステムを提供する。これらの方法およびシステムによれば、小さなバリアントおよびコピー数多型の定量的測定値を取得および解析することによって、アレル不均衡またはコンタミネーションを識別しうる。
本開示の種々の実施形態が本明細書において示されかつ説明されているが、当業者は、そのような実施形態は例として示されているにすぎないことを理解するであろう。多数の変形、変更、および置換が、本開示を逸脱することなく、当業者によって見いだされうる。本明細書に記載の本開示の実施形態に対する種々の代替が採用されうることを理解すべきである。
[発明を実施するための形態]
がん患者において、アレル不均衡は、ヘテロ接合性の喪失によって引き起こされることがあり、また、アレル不均衡がない試料と比較して、対象からの無細胞核酸試料のアッセイにおいて、異なった変異アレル割合(MAF)分布をもたらしうる。例えば、アレル不均衡がある試料は、MAFが非常に低い生殖系列バリアントを含みうる。例えばシーケンシングのための処置中などに、試料にコンタミネーションが生じた場合や、試料が、例えば移植片、輸血、または胎児から生じた(対象のゲノム以外の)第2のゲノムを含む場合にも、MAFが低い生殖系列バリアントが観察されることがある。したがって、アレル不均衡試料と、コンタミネーションが生じた試料または第2のゲノムを含む試料とを識別する場合に、問題に直面することがありうる。
II.方法およびシステムの一般的な特徴
A.試料
B.核酸タグ
C.核酸増幅
D.核酸の富化
E.核酸シーケンシング
F.分析
通常の無細胞DNA分析方法を用いて試料をアッセイする場合、体細胞MAFの範囲内のMAF(約15%未満であろう)で存在する2つを超える生殖系列バリアントを有するどのような試料も、その試料が「コンタミネーションがありうる」状態であるか否かを評価するために、人手による精査を必要とする。このようなアプローチでは、このような生殖系列バリアントを複数含む種々の試料、例えば、(1)アッセイレベルのコンタミネーションを含む試料、(2)(例えば、移植片、輸血、または胎児由来の)第2のゲノムを含む試料、および(3)ヘテロ接合性の喪失(LoH)の結果アレル不均衡を示している試料、に印をつける。さらに、試料を通常のcfDNAアッセイ方法によって分析した場合、このようなケースの試料を識別することができない。例えば、第2のゲノムを含む試料と、LoHの結果アレル不均衡を示している試料は、どちらも、誤ってアッセイレベルのコンタミネーションを含む試料とみなされ、それにより、確認目的の試料アッセイを繰り返すことが必要になるであろう。したがって、このアプローチでは、コンタミネーション試料をオーバーコール(overcall)し、その結果、実際にはコンタミネーションではなくアレル不均衡を有する試料を再アッセイすることが必要となるために、アッセイ所要時間が増加し、コストも増大するおそれがある。
実施例2:無細胞DNA(cfDNA)におけるアレル特異的なヘテロ接合性の喪失(LoH)の検出
Claims (53)
- 対象からの試料におけるアレル不均衡の存在または非存在を検出するための方法であって、
(a)前記試料からの複数の無細胞デオキシリボ核酸(DNA)分子をシーケンシングして、複数の配列リードを生成すること;
(b)前記複数の配列リードの少なくとも一部を参照配列にアラインして、複数のアラインした配列リードを生成すること;
(c)前記複数のアラインした配列リードの少なくとも一部について、前記試料中に変異アレル割合(MAF)で存在する生殖系列バリアントを識別することによって、前記試料中の生殖系列バリアントのセットを識別することであって、前記生殖系列バリアントのセット中の個々の生殖系列バリアントは、対応するMAF値を有すること;
(d)(c)において識別された、MAF値の複数の別々の範囲の間にある、前記生殖系列バリアントのセットの定量的測定値を決定すること;および
(e)(c)において識別された前記生殖系列バリアントのセットを、少なくとも前記(d)の定量的測定値に基づいてフィルタリングすることによって、前記試料中の前記アレル不均衡の存在または非存在を所定の基準に基づいて検出すること
を含む、方法。 - (e)における検出が、前記複数のアラインした配列リードから、コピー数多型(CNV)または二倍体遺伝子を示す1つまたはそれを超える定量的測定値を検出することを含み、前記所定の基準が、前記CNVまたは前記二倍体遺伝子を示す前記1つまたはそれを超える定量的測定値を含む、請求項1に記載の方法。
- 前記試料において前記アレル不均衡の非存在が検出された場合に、前記試料におけるコンタミネーションまたは第2のゲノムの存在または非存在を検出することをさらに含む、請求項1または2に記載の方法。
- 前記生殖系列バリアントのセットが、少なくとも約1,000個の異なる生殖系列バリアントを含む、請求項1〜3のいずれか1項に記載の方法。
- 前記遺伝子バリアントのセットが、一塩基バリアント(SNV)、挿入または欠失(挿入欠失)、および融合からなる群から選択される遺伝子バリアントを含む、請求項1〜4のいずれか1項に記載の方法。
- 前記試料が、血液、血漿、血清、尿、唾液、粘膜分泌物、喀痰、便、および涙からなる群から選択される体液試料である、請求項1〜5のいずれか1項に記載の方法。
- 前記対象が、疾患または障害を有する、請求項1〜6のいずれか1項に記載の方法。
- 前記疾患が、がんである、請求項7に記載の方法。
- シーケンシングの前に、前記無細胞DNA分子を増幅することをさらに含む、請求項1〜8のいずれか1項に記載の方法。
- シーケンシングの前に、遺伝子座のセットについて、前記無細胞DNA分子、または前記増幅された無細胞DNA分子を選択的に富化することをさらに含む、請求項1〜9のいずれか1項に記載の方法。
- シーケンシングの前に、分子バーコードを含む1つまたはそれを超えるアダプターを、前記無細胞DNA分子に結合させることをさらに含む、請求項1〜10のいずれか1項に記載の方法。
- 前記1つまたはそれを超えるアダプターが、前記無細胞DNA分子の両方の末端にランダムに結合される、請求項11に記載の方法。
- 前記無細胞DNA分子が、分子バーコードで固有にバーコード化される、請求項11に記載の方法。
- 前記無細胞DNA分子が、分子バーコードで非固有にバーコード化される、請求項11に記載の方法。
- 各分子バーコードが、選択された領域からシーケンシングされた分子の多様性と組み合わせて、固有の無細胞DNA分子の識別を可能にする、既定のまたはセミランダムなオリゴヌクレオチド配列を含む、請求項11に記載の方法。
- 前記複数のゲノム領域が、COSMIC、TCGA(The Cancer Genome Atlas)、またはExAC(Exome Aggregation Consortium)中に見いだされる遺伝子バリアントを含む、請求項1〜15のいずれか1項に記載の方法。
- 前記複数の別々の範囲のMAF値が、約3%〜約40%の第1の範囲、および約60%〜約97%の第2の範囲を含む、請求項1〜16のいずれか1項に記載の方法。
- 前記(d)の定量的測定値が、MAF値の複数の別々の範囲の間にある、前記遺伝子バリアントの多数のセットを含む、請求項17に記載の方法。
- 前記所定の基準が、前記(d)の定量的測定値が所定の生殖系列バリアント閾値より大きいことを含む、請求項18に記載の方法。
- 前記所定の生殖系列バリアント閾値が、約21である、請求項19に記載の方法。
- 前記CNVまたは前記二倍体遺伝子を示す前記1つまたはそれを超える定量的測定値が、前記試料全体の最大CNVレベル、前記試料全体の最小CNVレベル、二倍体遺伝子割合、およびコピー数平均からなる群から選択される、請求項2、または17〜20のいずれか1項に記載の方法。
- 前記CNVまたは前記二倍体遺伝子を示す前記1つまたはそれを超える定量的測定値が、前記試料全体の最大CNVレベル、前記試料全体の最小CNVレベル、二倍体遺伝子割合、およびコピー数平均からなる群から選択される、2つまたはそれを超える定量的測定値を含む、請求項21に記載の方法。
- 前記CNVまたは前記二倍体遺伝子を示す前記1つまたはそれを超える定量的測定値が、前記試料全体の最大CNVレベル、前記試料全体の最小CNVレベル、二倍体遺伝子割合、およびコピー数平均からなる群から選択される、3つまたはそれを超える定量的測定値を含む、請求項22に記載の方法。
- 前記所定の基準が、前記試料全体の最大CNVレベルが所定の最大CNV閾値より大きい、前記試料全体の最小CNVレベルが所定の最小CNV閾値より小さい、二倍体遺伝子割合が所定の二倍体割合閾値より小さい、および同じ生殖系列バリアントにおけるコピー数平均の絶対値が所定のコピー数平均閾値より大きく、前記同じ生殖系列バリアントのMAFは、約3%より小さい、からなる群から選択される1つまたはそれを超える基準を含む、請求項21〜23のいずれか1項に記載の方法。
- 前記所定の基準が、前記試料全体の最大CNVレベルが所定の最大CNV閾値より大きい、前記試料全体の最小CNVレベルが所定の最小CNV閾値より小さい、二倍体遺伝子割合が所定の二倍体割合閾値より小さい、および同じ生殖系列バリアントにおけるコピー数平均の絶対値が所定のコピー数平均閾値より大きく、前記同じ生殖系列バリアントのMAFは、約3%より小さい、からなる群から選択される2つまたはそれを超える基準を含む、請求項24に記載の方法。
- 前記所定の基準が、前記試料全体の最大CNVレベルが所定の最大CNV閾値より大きい、前記試料全体の最小CNVレベルが所定の最小CNV閾値より小さい、二倍体遺伝子割合が所定の二倍体割合閾値より小さい、および同じ生殖系列バリアントにおけるコピー数平均の絶対値が所定のコピー数平均閾値より大きく、前記同じ生殖系列バリアントのMAFは、約3%より小さい、からなる群から選択される3つまたはそれを超える基準を含む、請求項25に記載の方法。
- 前記所定の基準が、前記試料全体の最大CNVレベルが所定の最大CNV閾値より大きい、前記試料全体の最小CNVレベルが所定の最小CNV閾値より小さい、二倍体遺伝子割合が所定の二倍体割合閾値より小さい、および同じ生殖系列バリアントにおけるコピー数平均の絶対値が所定のコピー数平均閾値より大きく、前記同じ生殖系列バリアントのMAFは、約3%より小さい、という基準を含む、請求項26に記載の方法。
- 前記所定の基準が、最大CNV閾値が約0.22、最小CNV閾値が約−0.14、二倍体割合閾値が約0.7、およびコピー数平均閾値が約10、からなる群から選択される1つまたはそれを超える閾値を含む、請求項24〜27のいずれか1項に記載の方法。
- 前記所定の基準が、最大CNV閾値が約0.22、最小CNV閾値が約−0.14、二倍体割合閾値が約0.7、およびコピー数平均閾値が約10、からなる群から選択される2つまたはそれを超える閾値を含む、請求項28に記載の方法。
- 前記所定の基準が、最大CNV閾値が約0.22、最小CNV閾値が約−0.14、二倍体割合閾値が約0.7、およびコピー数平均閾値が約10、からなる群から選択される3つまたはそれを超える閾値を含む、請求項29に記載の方法。
- 前記所定の基準が、最大CNV閾値が約0.22、最小CNV閾値が約−0.14、二倍体割合閾値が約0.7、およびコピー数平均閾値が約10、という閾値を含む、請求項30に記載の方法。
- 少なくとも約60%の陽性的中率(PPV)で、前記試料中の前記コンタミネーションまたは前記第2のゲノムの存在を検出することをさらに含む、請求項3に記載の方法。
- 少なくとも約90%の陰性的中率(NPV)で、前記試料中の前記コンタミネーションまたは前記第2のゲノムの非存在を検出することさらに含む、請求項3に記載の方法。
- 少なくとも約90%の感度で、前記試料中の前記コンタミネーションまたは前記第2のゲノムの存在を検出することをさらに含む、請求項3に記載の方法。
- 少なくとも約99%の感度で、前記試料中の前記コンタミネーションまたは前記第2のゲノムの存在を検出することをさらに含む、請求項34に記載の方法。
- 少なくとも約35%の特異性で、前記試料中の前記コンタミネーションまたは前記第2のゲノムの非存在を検出することさらに含む、請求項3に記載の方法。
- 前記生殖系列バリアントを、
(i)前記cfDNA分子から核酸バリアントについて、総アレル数および変異アレル数を決定すること;
(ii)前記cfDNA分子からの前記核酸バリアントの関連変数を識別すること;
(iii)前記核酸バリアントの前記関連変数についての定量値を決定すること;
(iv)前記核酸バリアントのゲノム遺伝子座において予測される生殖系列変異アレル数についての統計モデルを生成すること;
(v)予測される生殖系列変異アレル数についての前記統計モデル、前記核酸バリアントの前記関連変数についての前記定量値、および前記核酸バリアントについての前記総アレル数および前記変異アレル数の少なくとも1つ、に少なくとも部分的に基づいて、前記核酸バリアントについてのP値(probability value)を生成すること;および
(vi)前記核酸バリアントを、(1)前記核酸バリアントについての前記p値が所定の閾値より小さい場合に体細胞起源であるとして、または(2)前記核酸バリアントについての前記p値が所定の閾値以上である場合に生殖系列起源であるとして分類すること
によって識別することをさらに含む、請求項1〜36のいずれか1項に記載の方法。 - (c)において所与のMAFで存在するものとして識別された前記生殖系列バリアントのセットの少なくとも1つに基づいて、前記試料におけるアレル特異的喪失を検出することをさらに含む、請求項1〜37のいずれか1項に記載の方法。
- 前記生殖系列バリアントのセットの前記少なくとも1つが、前記対象からの前記試料中に、50%を下回るMAFで存在することに基づいて、前記試料における前記アレル特異的喪失が検出される、請求項38に記載の方法。
- 前記生殖系列バリアントのセットの前記少なくとも1つが、前記対象からの前記試料中、および追加の1つまたはそれを超える対象からの1つまたはそれを超える各試料中に、50%を下回るMAFで存在することに基づいて、前記試料における前記アレル特異的喪失が検出される、請求項39に記載の方法。
- 前記生殖系列バリアントのセットの前記少なくとも1つが、COSMIC、TCGA(The Cancer Genome Atlas)、またはExAC(Exome Aggregation Consortium)中に見いだされる、請求項38〜40のいずれか1項に記載の方法。
- 前記生殖系列バリアントのセットの前記少なくとも1つが、BRCA1遺伝子バリアントである、請求項41に記載の方法。
- 前記BRCA1遺伝子バリアントが、BRCA1 P209Lである、請求項42に記載の方法。
- 前記方法の少なくとも一部が、コンピュータシステムによって実行される、請求項1〜43のいずれか1項に記載の方法。
- システムであって、少なくとも1つの電子プロセッサによって実行された場合に、少なくとも
(a)対象の試料からの複数の無細胞デオキシリボ核酸(DNA)分子に対応する、複数の配列リードを得ること;
(b)前記複数の配列リードの少なくとも一部を参照配列にアラインして、複数のアラインした配列リードを生成すること;
(c)前記複数のアラインした配列リードの少なくとも一部について、前記試料中に変異アレル割合(MAF)で存在する生殖系列バリアントを識別することによって、前記試料中の生殖系列バリアントのセットを識別し、前記生殖系列バリアントのセット中の個々の生殖系列バリアントは、対応するMAF値を有すること;
(d)(c)において識別された、MAF値の複数の別々の範囲の間にある、前記生殖系列バリアントのセットの定量的測定値を決定すること;および(e)(c)において識別された前記生殖系列バリアントのセットを、少なくとも前記(d)の定量的測定値に基づいてフィルタリングすることによって、前記試料中のアレル不均衡の存在または非存在を所定の基準に基づいて検出すること
を実施する非一時的なコンピュータ実行可能命令を含むコンピュータ可読媒体を含むコントローラー、または前記コンピュータ可読媒体にアクセスすることができるコントローラーを含む、システム。 - (e)における検出が、前記複数のアラインした配列リードから、コピー数多型(CNV)または二倍体遺伝子を示す1つまたはそれを超える定量的測定値を検出することを含み、前記所定の基準が、前記CNVまたは前記二倍体遺伝子を示す前記1つまたはそれを超える定量的測定値を含む、請求項45に記載のシステム。
- 前記コントローラーに作動可能に接続された核酸シーケンサーをさらに含み、前記核酸シーケンサーが、前記試料からの前記複数の無細胞DNA分子を処理して、前記複数の配列リードを生成するように構成されている、請求項45または46に記載のシステム。
- 前記非一時的なコンピュータ実行可能命令が、少なくとも1つの電子プロセッサによって実行された場合に、前記試料の前記アレル不均衡の存在または非存在についての情報および/または前記試料の前記コンタミネーションもしくは第2のゲノムの存在または非存在についての情報を必要に応じて含むレポートを生成すること、をさらに実施する、請求項45〜47のいずれか1項に記載のシステム。
- 前記非一時的なコンピュータ実行可能命令が、少なくとも1つの電子プロセッサによって実行された場合に、前記レポートを第三者(例えば、前記試料の起源である前記対象、または医療従事者など)に伝えること、をさらに実施する、請求項48に記載のシステム。
- 対象からの試料中のアレル不均衡の存在または非存在を検出するための方法であって、
(a)前記試料からの複数の無細胞デオキシリボ核酸(DNA)分子から生成された複数のシーケンシングリードに、コンピュータシステムによってアクセスすること;
(b)前記複数の配列リードの少なくとも一部を、前記コンピュータシステムによって参照配列にアラインして、複数のアラインした配列リードを生成すること;
(c)前記複数のアラインした配列リードの少なくとも一部について、前記試料中に変異アレル割合(MAF)で存在する生殖系列バリアントを、前記コンピュータシステムによって識別することによって、前記試料中の生殖系列バリアントのセットを識別し、前記生殖系列バリアントのセット中の個々の生殖系列バリアントは、対応するMAF値を有すること;
(d)(c)において識別された、MAF値の複数の別々の範囲の間にある、前記生殖系列バリアントのセットの定量的測定値を、前記コンピュータシステムによって決定すること;および
(e)(c)において識別された前記生殖系列バリアントのセットを、少なくとも前記(d)の定量的測定値に基づいてフィルタリングすることによって、前記試料中の前記アレル不均衡の存在または非存在を、前記コンピュータシステムによって、所定の基準に基づいて検出すること
を含む、方法。 - 前記(e)における検出が、前記複数のアラインした配列リードから、コピー数多型(CNV)または二倍体遺伝子を示す1つまたはそれを超える定量的測定値を、前記コンピュータシステムによって検出することであって、前記所定の基準は、前記CNVまたは前記二倍体遺伝子を示す前記1つまたはそれを超える定量的測定値を含むこと、を含む、請求項50に記載の方法。
- 前記試料の前記アレル不均衡の前記存在または非存在についての情報および/または前記試料の前記コンタミネーションもしくは第2のゲノムの存在または非存在についての情報を必要に応じて含むレポートを生成することをさらに含む、請求項1〜44または50〜51のいずれか1項に記載のシステム。
- 前記レポートを、前記試料の起源である前記対象、または医療従事者などのような第三者に伝えることをさらに含む、請求項52に記載の方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862726922P | 2018-09-04 | 2018-09-04 | |
US62/726,922 | 2018-09-04 | ||
US201962810625P | 2019-02-26 | 2019-02-26 | |
US62/810,625 | 2019-02-26 | ||
PCT/US2019/049570 WO2020096691A2 (en) | 2018-09-04 | 2019-09-04 | Methods and systems for detecting allelic imbalance in cell-free nucleic acid samples |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021534803A true JP2021534803A (ja) | 2021-12-16 |
Family
ID=69641523
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021512247A Pending JP2021534803A (ja) | 2018-09-04 | 2019-09-04 | 無細胞核酸試料におけるアレル不均衡を検出するための方法およびシステム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20200075124A1 (ja) |
EP (1) | EP3847276A2 (ja) |
JP (1) | JP2021534803A (ja) |
WO (1) | WO2020096691A2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11995051B1 (en) * | 2021-01-04 | 2024-05-28 | Color Health, Inc. | Variant identification by unique data set detection |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010534068A (ja) * | 2007-07-23 | 2010-11-04 | ザ チャイニーズ ユニバーシティー オブ ホンコン | 核酸配列の不均衡性の決定 |
JP2013531980A (ja) * | 2010-05-25 | 2013-08-15 | ザ・リージェンツ・オブ・ザ・ユニバーシティー・オブ・カリフォルニア | Bambam:ハイスループットシークエンシングデータの同時比較解析 |
JP2014519827A (ja) * | 2011-06-17 | 2014-08-21 | ミリアド・ジェネティックス・インコーポレイテッド | アレル不均衡を評価するための方法および材料 |
WO2018144782A1 (en) * | 2017-02-01 | 2018-08-09 | The Translational Genomics Research Institute | Methods of detecting somatic and germline variants in impure tumors |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6582908B2 (en) | 1990-12-06 | 2003-06-24 | Affymetrix, Inc. | Oligonucleotides |
US20030017081A1 (en) | 1994-02-10 | 2003-01-23 | Affymetrix, Inc. | Method and apparatus for imaging a sample on a device |
CA2195562A1 (en) | 1994-08-19 | 1996-02-29 | Pe Corporation (Ny) | Coupled amplification and ligation method |
GB9620209D0 (en) | 1996-09-27 | 1996-11-13 | Cemu Bioteknik Ab | Method of sequencing DNA |
GB9626815D0 (en) | 1996-12-23 | 1997-02-12 | Cemu Bioteknik Ab | Method of sequencing DNA |
US6969488B2 (en) | 1998-05-22 | 2005-11-29 | Solexa, Inc. | System and apparatus for sequential processing of analytes |
AR021833A1 (es) | 1998-09-30 | 2002-08-07 | Applied Research Systems | Metodos de amplificacion y secuenciacion de acido nucleico |
US6818395B1 (en) | 1999-06-28 | 2004-11-16 | California Institute Of Technology | Methods and apparatus for analyzing polynucleotide sequences |
US7501245B2 (en) | 1999-06-28 | 2009-03-10 | Helicos Biosciences Corp. | Methods and apparatuses for analyzing polynucleotide sequences |
AU7537200A (en) | 1999-09-29 | 2001-04-30 | Solexa Ltd. | Polynucleotide sequencing |
CN101525660A (zh) | 2000-07-07 | 2009-09-09 | 维西根生物技术公司 | 实时序列测定 |
WO2003046146A2 (en) | 2001-11-28 | 2003-06-05 | Applera Corporation | Compositions and methods of selective nucleic acid isolation |
US7169560B2 (en) | 2003-11-12 | 2007-01-30 | Helicos Biosciences Corporation | Short cycle methods for sequencing polynucleotides |
US7170050B2 (en) | 2004-09-17 | 2007-01-30 | Pacific Biosciences Of California, Inc. | Apparatus and methods for optical analysis of molecules |
WO2006044078A2 (en) | 2004-09-17 | 2006-04-27 | Pacific Biosciences Of California, Inc. | Apparatus and method for analysis of molecules |
US7482120B2 (en) | 2005-01-28 | 2009-01-27 | Helicos Biosciences Corporation | Methods and compositions for improving fidelity in a nucleic acid synthesis reaction |
US7282337B1 (en) | 2006-04-14 | 2007-10-16 | Helicos Biosciences Corporation | Methods for increasing accuracy of nucleic acid sequencing |
US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
US20160040229A1 (en) | 2013-08-16 | 2016-02-11 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
CN110872617A (zh) | 2012-09-04 | 2020-03-10 | 夸登特健康公司 | 检测稀有突变和拷贝数变异的系统和方法 |
EP4322168A3 (en) * | 2016-07-06 | 2024-05-15 | Guardant Health, Inc. | Methods for fragmentome profiling of cell-free nucleic acids |
-
2019
- 2019-09-04 JP JP2021512247A patent/JP2021534803A/ja active Pending
- 2019-09-04 US US16/560,752 patent/US20200075124A1/en active Pending
- 2019-09-04 WO PCT/US2019/049570 patent/WO2020096691A2/en unknown
- 2019-09-04 EP EP19858652.1A patent/EP3847276A2/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010534068A (ja) * | 2007-07-23 | 2010-11-04 | ザ チャイニーズ ユニバーシティー オブ ホンコン | 核酸配列の不均衡性の決定 |
JP2013531980A (ja) * | 2010-05-25 | 2013-08-15 | ザ・リージェンツ・オブ・ザ・ユニバーシティー・オブ・カリフォルニア | Bambam:ハイスループットシークエンシングデータの同時比較解析 |
JP2014519827A (ja) * | 2011-06-17 | 2014-08-21 | ミリアド・ジェネティックス・インコーポレイテッド | アレル不均衡を評価するための方法および材料 |
WO2018144782A1 (en) * | 2017-02-01 | 2018-08-09 | The Translational Genomics Research Institute | Methods of detecting somatic and germline variants in impure tumors |
Non-Patent Citations (2)
Title |
---|
KIRKIZLAR, ESER ET AL.: ""Detection of Clonal and Subclonal Copy-Number Variants in Cell-Free DNA from Patients with Breast", TRANSLATIONAL ONCOLOGY, vol. 8, no. 5, JPN6023034749, October 2015 (2015-10-01), pages 407 - 416, XP055441218, ISSN: 0005136116, DOI: 10.1016/j.tranon.2015.08.004 * |
NANCE, TRACY ET AL.: ""Abstract 4272: A novel approach to differentiation of somatic vs. germline variants in liquid biop", CANCER RESEARCH, vol. Vol. 78, No. 13_Supplement, JPN6023034748, 1 July 2018 (2018-07-01), pages 4272 - 4272, ISSN: 0005136115 * |
Also Published As
Publication number | Publication date |
---|---|
US20200075124A1 (en) | 2020-03-05 |
EP3847276A2 (en) | 2021-07-14 |
WO2020096691A2 (en) | 2020-05-14 |
WO2020096691A3 (en) | 2020-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111357054B (zh) | 用于区分体细胞变异和种系变异的方法和系统 | |
JP2024056984A (ja) | エピジェネティック区画アッセイを較正するための方法、組成物およびシステム | |
US20200071754A1 (en) | Methods and systems for detecting contamination between samples | |
US20240141425A1 (en) | Correcting for deamination-induced sequence errors | |
US20200232010A1 (en) | Methods, compositions, and systems for improving recovery of nucleic acid molecules | |
JP2021534803A (ja) | 無細胞核酸試料におけるアレル不均衡を検出するための方法およびシステム | |
CN114746560A (zh) | 改进甲基化多核苷酸结合的方法、组合物和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220905 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230816 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230825 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20231121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240422 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240719 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240920 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241021 |