JP2022530088A - マイクロサテライト解析のための方法およびシステム - Google Patents
マイクロサテライト解析のための方法およびシステム Download PDFInfo
- Publication number
- JP2022530088A JP2022530088A JP2021563182A JP2021563182A JP2022530088A JP 2022530088 A JP2022530088 A JP 2022530088A JP 2021563182 A JP2021563182 A JP 2021563182A JP 2021563182 A JP2021563182 A JP 2021563182A JP 2022530088 A JP2022530088 A JP 2022530088A
- Authority
- JP
- Japan
- Prior art keywords
- microsatellite
- subject
- cancer
- sample
- condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 108091092878 Microsatellite Proteins 0.000 title claims abstract description 475
- 238000000034 method Methods 0.000 title claims abstract description 227
- 238000004458 analytical method Methods 0.000 title claims description 57
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 228
- 201000011510 cancer Diseases 0.000 claims abstract description 164
- 230000036541 health Effects 0.000 claims abstract description 154
- 108700028369 Alleles Proteins 0.000 claims abstract description 81
- 230000002068 genetic effect Effects 0.000 claims abstract description 35
- 238000007481 next generation sequencing Methods 0.000 claims abstract description 20
- 208000012902 Nervous system disease Diseases 0.000 claims abstract description 18
- 208000025966 Neurological disease Diseases 0.000 claims abstract description 16
- 208000024172 Cardiovascular disease Diseases 0.000 claims abstract description 14
- 238000005457 optimization Methods 0.000 claims description 102
- 238000011282 treatment Methods 0.000 claims description 74
- 230000007423 decrease Effects 0.000 claims description 53
- 238000004422 calculation algorithm Methods 0.000 claims description 44
- 230000035945 sensitivity Effects 0.000 claims description 33
- 208000020816 lung neoplasm Diseases 0.000 claims description 31
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims description 30
- 201000005202 lung cancer Diseases 0.000 claims description 30
- 230000008901 benefit Effects 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 22
- 230000002411 adverse Effects 0.000 claims description 21
- 230000004043 responsiveness Effects 0.000 claims description 19
- 238000004393 prognosis Methods 0.000 claims description 16
- 230000032683 aging Effects 0.000 claims description 13
- 210000004369 blood Anatomy 0.000 claims description 13
- 239000008280 blood Substances 0.000 claims description 13
- 238000000611 regression analysis Methods 0.000 claims description 10
- 206010006187 Breast cancer Diseases 0.000 claims description 9
- 208000026310 Breast neoplasm Diseases 0.000 claims description 9
- 230000009467 reduction Effects 0.000 claims description 8
- 206010033128 Ovarian cancer Diseases 0.000 claims description 6
- 206010061535 Ovarian neoplasm Diseases 0.000 claims description 6
- 206010060862 Prostate cancer Diseases 0.000 claims description 6
- 208000000236 Prostatic Neoplasms Diseases 0.000 claims description 6
- 208000005017 glioblastoma Diseases 0.000 claims description 6
- 208000030173 low grade glioma Diseases 0.000 claims description 5
- 201000001441 melanoma Diseases 0.000 claims description 5
- 210000003296 saliva Anatomy 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 2
- 150000007523 nucleic acids Chemical class 0.000 abstract description 61
- 102000039446 nucleic acids Human genes 0.000 abstract description 53
- 108020004707 nucleic acids Proteins 0.000 abstract description 53
- 238000003556 assay Methods 0.000 abstract description 22
- 238000003205 genotyping method Methods 0.000 abstract description 12
- 230000000926 neurological effect Effects 0.000 abstract description 9
- 230000004075 alteration Effects 0.000 abstract description 2
- 239000000523 sample Substances 0.000 description 182
- 208000000172 Medulloblastoma Diseases 0.000 description 119
- 108020004414 DNA Proteins 0.000 description 63
- 102000053602 DNA Human genes 0.000 description 62
- 108090000623 proteins and genes Proteins 0.000 description 56
- 229920002477 rna polymer Polymers 0.000 description 43
- 238000012163 sequencing technique Methods 0.000 description 41
- 238000012549 training Methods 0.000 description 37
- 238000010200 validation analysis Methods 0.000 description 34
- 238000003199 nucleic acid amplification method Methods 0.000 description 31
- 230000003321 amplification Effects 0.000 description 30
- 238000009826 distribution Methods 0.000 description 30
- 238000003860 storage Methods 0.000 description 28
- 210000004602 germ cell Anatomy 0.000 description 27
- 238000004590 computer program Methods 0.000 description 26
- 230000015654 memory Effects 0.000 description 25
- 238000012360 testing method Methods 0.000 description 24
- 240000002853 Nelumbo nucifera Species 0.000 description 23
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 23
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 23
- 230000035772 mutation Effects 0.000 description 23
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 22
- 201000010099 disease Diseases 0.000 description 20
- 230000000670 limiting effect Effects 0.000 description 20
- 125000003729 nucleotide group Chemical class 0.000 description 20
- 210000004027 cell Anatomy 0.000 description 18
- 239000002773 nucleotide Substances 0.000 description 18
- 230000004850 protein–protein interaction Effects 0.000 description 15
- 208000011580 syndromic disease Diseases 0.000 description 14
- 230000002596 correlated effect Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 241000282414 Homo sapiens Species 0.000 description 12
- 238000004891 communication Methods 0.000 description 12
- 238000013459 approach Methods 0.000 description 11
- 239000012472 biological sample Substances 0.000 description 11
- 230000014509 gene expression Effects 0.000 description 11
- 102000004169 proteins and genes Human genes 0.000 description 11
- 208000010507 Adenocarcinoma of Lung Diseases 0.000 description 10
- 238000012417 linear regression Methods 0.000 description 10
- 201000005249 lung adenocarcinoma Diseases 0.000 description 10
- 201000005243 lung squamous cell carcinoma Diseases 0.000 description 10
- 238000007482 whole exome sequencing Methods 0.000 description 10
- 108700024394 Exon Proteins 0.000 description 9
- 238000012937 correction Methods 0.000 description 9
- 238000001514 detection method Methods 0.000 description 9
- 230000018109 developmental process Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000012070 whole genome sequencing analysis Methods 0.000 description 9
- 240000008168 Ficus benjamina Species 0.000 description 8
- 108091092195 Intron Proteins 0.000 description 8
- 206010035226 Plasma cell myeloma Diseases 0.000 description 8
- 206010041067 Small cell lung cancer Diseases 0.000 description 8
- 230000001363 autoimmune Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 8
- 238000011161 development Methods 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 208000000587 small cell lung carcinoma Diseases 0.000 description 8
- 108091026890 Coding region Proteins 0.000 description 7
- 208000009956 adenocarcinoma Diseases 0.000 description 7
- 230000003247 decreasing effect Effects 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 7
- 210000001808 exosome Anatomy 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 238000012706 support-vector machine Methods 0.000 description 7
- 210000001519 tissue Anatomy 0.000 description 7
- 238000001712 DNA sequencing Methods 0.000 description 6
- 208000023105 Huntington disease Diseases 0.000 description 6
- 208000022559 Inflammatory bowel disease Diseases 0.000 description 6
- 238000012952 Resampling Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000037433 frameshift Effects 0.000 description 6
- 230000002496 gastric effect Effects 0.000 description 6
- 230000003862 health status Effects 0.000 description 6
- 230000003211 malignant effect Effects 0.000 description 6
- 108010040003 polyglutamine Proteins 0.000 description 6
- 229920000155 polyglutamine Polymers 0.000 description 6
- 230000003252 repetitive effect Effects 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 208000003174 Brain Neoplasms Diseases 0.000 description 5
- 108020004635 Complementary DNA Proteins 0.000 description 5
- 208000018428 Eosinophilic granulomatosis with polyangiitis Diseases 0.000 description 5
- 206010039491 Sarcoma Diseases 0.000 description 5
- 208000024770 Thyroid neoplasm Diseases 0.000 description 5
- 238000010804 cDNA synthesis Methods 0.000 description 5
- 239000002299 complementary DNA Substances 0.000 description 5
- 238000013500 data storage Methods 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 238000007847 digital PCR Methods 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 230000001771 impaired effect Effects 0.000 description 5
- 210000004072 lung Anatomy 0.000 description 5
- 201000000050 myeloid neoplasm Diseases 0.000 description 5
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 5
- 230000000306 recurrent effect Effects 0.000 description 5
- 238000012502 risk assessment Methods 0.000 description 5
- 210000002966 serum Anatomy 0.000 description 5
- 238000000528 statistical test Methods 0.000 description 5
- 208000024891 symptom Diseases 0.000 description 5
- 201000002510 thyroid cancer Diseases 0.000 description 5
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 5
- 208000032671 Allergic granulomatous angiitis Diseases 0.000 description 4
- 102100021571 B-cell CLL/lymphoma 6 member B protein Human genes 0.000 description 4
- 108091033409 CRISPR Proteins 0.000 description 4
- 238000010354 CRISPR gene editing Methods 0.000 description 4
- 201000009030 Carcinoma Diseases 0.000 description 4
- 206010008025 Cerebellar ataxia Diseases 0.000 description 4
- 206010008342 Cervix carcinoma Diseases 0.000 description 4
- 208000006344 Churg-Strauss Syndrome Diseases 0.000 description 4
- 206010009900 Colitis ulcerative Diseases 0.000 description 4
- 206010014733 Endometrial cancer Diseases 0.000 description 4
- 206010014759 Endometrial neoplasm Diseases 0.000 description 4
- 208000007465 Giant cell arteritis Diseases 0.000 description 4
- 208000032612 Glial tumor Diseases 0.000 description 4
- 206010018338 Glioma Diseases 0.000 description 4
- 101000971180 Homo sapiens B-cell CLL/lymphoma 6 member B protein Proteins 0.000 description 4
- 206010061218 Inflammation Diseases 0.000 description 4
- 208000015634 Rectal Neoplasms Diseases 0.000 description 4
- 208000005718 Stomach Neoplasms Diseases 0.000 description 4
- 201000006704 Ulcerative Colitis Diseases 0.000 description 4
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 4
- 201000000053 blastoma Diseases 0.000 description 4
- 210000004556 brain Anatomy 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 210000003169 central nervous system Anatomy 0.000 description 4
- 201000010881 cervical cancer Diseases 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 210000001072 colon Anatomy 0.000 description 4
- 208000029742 colonic neoplasm Diseases 0.000 description 4
- 230000008602 contraction Effects 0.000 description 4
- 208000031513 cyst Diseases 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- 201000008184 embryoma Diseases 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 230000004054 inflammatory process Effects 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 210000003734 kidney Anatomy 0.000 description 4
- 208000014018 liver neoplasm Diseases 0.000 description 4
- 238000007477 logistic regression Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000012628 principal component regression Methods 0.000 description 4
- 238000007637 random forest analysis Methods 0.000 description 4
- 238000003753 real-time PCR Methods 0.000 description 4
- 206010038038 rectal cancer Diseases 0.000 description 4
- 201000001275 rectum cancer Diseases 0.000 description 4
- 238000010839 reverse transcription Methods 0.000 description 4
- 239000004055 small Interfering RNA Substances 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 206010043207 temporal arteritis Diseases 0.000 description 4
- 210000003932 urinary bladder Anatomy 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 238000005303 weighing Methods 0.000 description 4
- 108020003589 5' Untranslated Regions Proteins 0.000 description 3
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 3
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 3
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 3
- 206010003591 Ataxia Diseases 0.000 description 3
- 102000014461 Ataxins Human genes 0.000 description 3
- 108010078286 Ataxins Proteins 0.000 description 3
- 208000005024 Castleman disease Diseases 0.000 description 3
- 206010011732 Cyst Diseases 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 3
- 208000031448 Genomic Instability Diseases 0.000 description 3
- 108091029795 Intergenic region Proteins 0.000 description 3
- 208000005615 Interstitial Cystitis Diseases 0.000 description 3
- 208000008839 Kidney Neoplasms Diseases 0.000 description 3
- 206010025323 Lymphomas Diseases 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 108700011259 MicroRNAs Proteins 0.000 description 3
- 208000034578 Multiple myelomas Diseases 0.000 description 3
- 206010029260 Neuroblastoma Diseases 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 3
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 3
- 206010038389 Renal cancer Diseases 0.000 description 3
- 208000009415 Spinocerebellar Ataxias Diseases 0.000 description 3
- 206010067584 Type 1 diabetes mellitus Diseases 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 3
- 201000004562 autosomal dominant cerebellar ataxia Diseases 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000001574 biopsy Methods 0.000 description 3
- 210000001124 body fluid Anatomy 0.000 description 3
- 239000010839 body fluid Substances 0.000 description 3
- 108091092259 cell-free RNA Proteins 0.000 description 3
- 238000002591 computed tomography Methods 0.000 description 3
- 238000011304 droplet digital PCR Methods 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 210000002308 embryonic cell Anatomy 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 201000004101 esophageal cancer Diseases 0.000 description 3
- 206010017758 gastric cancer Diseases 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 201000010982 kidney cancer Diseases 0.000 description 3
- 208000003849 large cell carcinoma Diseases 0.000 description 3
- 210000004185 liver Anatomy 0.000 description 3
- 201000007270 liver cancer Diseases 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 206010025135 lupus erythematosus Diseases 0.000 description 3
- 210000002751 lymph Anatomy 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000001394 metastastic effect Effects 0.000 description 3
- 206010061289 metastatic neoplasm Diseases 0.000 description 3
- 230000033607 mismatch repair Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 206010065579 multifocal motor neuropathy Diseases 0.000 description 3
- 231100000219 mutagenic Toxicity 0.000 description 3
- 230000003505 mutagenic effect Effects 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 238000003068 pathway analysis Methods 0.000 description 3
- 239000013610 patient sample Substances 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- -1 phosphorotriesters Chemical class 0.000 description 3
- 210000002381 plasma Anatomy 0.000 description 3
- 102000054765 polymorphisms of proteins Human genes 0.000 description 3
- 238000000513 principal component analysis Methods 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 210000000582 semen Anatomy 0.000 description 3
- 210000003491 skin Anatomy 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 230000000392 somatic effect Effects 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 201000011549 stomach cancer Diseases 0.000 description 3
- 230000035882 stress Effects 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 210000002700 urine Anatomy 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 108020005345 3' Untranslated Regions Proteins 0.000 description 2
- 229920001621 AMOLED Polymers 0.000 description 2
- 208000006468 Adrenal Cortex Neoplasms Diseases 0.000 description 2
- 201000004384 Alopecia Diseases 0.000 description 2
- 206010064539 Autoimmune myocarditis Diseases 0.000 description 2
- 206010005003 Bladder cancer Diseases 0.000 description 2
- 208000030939 Chronic inflammatory demyelinating polyneuropathy Diseases 0.000 description 2
- 108020004638 Circular DNA Proteins 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 208000011231 Crohn disease Diseases 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 206010051055 Deep vein thrombosis Diseases 0.000 description 2
- 208000021866 Dressler syndrome Diseases 0.000 description 2
- 208000001914 Fragile X syndrome Diseases 0.000 description 2
- 206010018429 Glucose tolerance impaired Diseases 0.000 description 2
- 201000004331 Henoch-Schoenlein purpura Diseases 0.000 description 2
- 206010019617 Henoch-Schonlein purpura Diseases 0.000 description 2
- 238000010163 Hochberg test Methods 0.000 description 2
- 208000031814 IgA Vasculitis Diseases 0.000 description 2
- 208000028622 Immune thrombocytopenia Diseases 0.000 description 2
- 206010059176 Juvenile idiopathic arthritis Diseases 0.000 description 2
- 238000007397 LAMP assay Methods 0.000 description 2
- 208000031671 Large B-Cell Diffuse Lymphoma Diseases 0.000 description 2
- 208000012309 Linear IgA disease Diseases 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 208000003250 Mixed connective tissue disease Diseases 0.000 description 2
- 208000003445 Mouth Neoplasms Diseases 0.000 description 2
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 description 2
- 108010047956 Nucleosomes Proteins 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 206010033307 Overweight Diseases 0.000 description 2
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 2
- 208000002193 Pain Diseases 0.000 description 2
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 2
- 206010061332 Paraganglion neoplasm Diseases 0.000 description 2
- 208000000733 Paroxysmal Hemoglobinuria Diseases 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 208000009565 Pharyngeal Neoplasms Diseases 0.000 description 2
- 206010034811 Pharyngeal cancer Diseases 0.000 description 2
- 102100032543 Phosphatidylinositol 3,4,5-trisphosphate 3-phosphatase and dual-specificity protein phosphatase PTEN Human genes 0.000 description 2
- 102100036050 Phosphatidylinositol N-acetylglucosaminyltransferase subunit A Human genes 0.000 description 2
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 2
- 235000011613 Pinus brutia Nutrition 0.000 description 2
- 241000018646 Pinus brutia Species 0.000 description 2
- 208000001280 Prediabetic State Diseases 0.000 description 2
- 206010036790 Productive cough Diseases 0.000 description 2
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 2
- 238000003559 RNA-seq method Methods 0.000 description 2
- 208000006265 Renal cell carcinoma Diseases 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 201000001388 Smith-Magenis syndrome Diseases 0.000 description 2
- 208000000102 Squamous Cell Carcinoma of Head and Neck Diseases 0.000 description 2
- 206010041848 Squamous cell carcinoma of the cervix Diseases 0.000 description 2
- 238000000692 Student's t-test Methods 0.000 description 2
- 206010042276 Subacute endocarditis Diseases 0.000 description 2
- 206010042742 Sympathetic ophthalmia Diseases 0.000 description 2
- 102000013530 TOR Serine-Threonine Kinases Human genes 0.000 description 2
- 108010065917 TOR Serine-Threonine Kinases Proteins 0.000 description 2
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 2
- 208000024313 Testicular Neoplasms Diseases 0.000 description 2
- 206010057644 Testis cancer Diseases 0.000 description 2
- 208000031981 Thrombocytopenic Idiopathic Purpura Diseases 0.000 description 2
- 206010043561 Thrombocytopenic purpura Diseases 0.000 description 2
- 208000025851 Undifferentiated connective tissue disease Diseases 0.000 description 2
- 208000017379 Undifferentiated connective tissue syndrome Diseases 0.000 description 2
- 108091023045 Untranslated Region Proteins 0.000 description 2
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 2
- 208000006593 Urologic Neoplasms Diseases 0.000 description 2
- 208000002495 Uterine Neoplasms Diseases 0.000 description 2
- 206010047115 Vasculitis Diseases 0.000 description 2
- 206010047249 Venous thrombosis Diseases 0.000 description 2
- 210000001766 X chromosome Anatomy 0.000 description 2
- 208000006269 X-Linked Bulbo-Spinal Atrophy Diseases 0.000 description 2
- 210000002593 Y chromosome Anatomy 0.000 description 2
- 238000001801 Z-test Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000035508 accumulation Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 201000002454 adrenal cortex cancer Diseases 0.000 description 2
- 231100000360 alopecia Toxicity 0.000 description 2
- 238000000540 analysis of variance Methods 0.000 description 2
- 238000010171 animal model Methods 0.000 description 2
- 210000000013 bile duct Anatomy 0.000 description 2
- 238000007469 bone scintigraphy Methods 0.000 description 2
- 201000007983 brain glioma Diseases 0.000 description 2
- 210000000481 breast Anatomy 0.000 description 2
- 201000006612 cervical squamous cell carcinoma Diseases 0.000 description 2
- 238000000546 chi-square test Methods 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 201000005795 chronic inflammatory demyelinating polyneuritis Diseases 0.000 description 2
- 201000010897 colon adenocarcinoma Diseases 0.000 description 2
- 238000004883 computer application Methods 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 239000013068 control sample Substances 0.000 description 2
- 208000029078 coronary artery disease Diseases 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 206010012818 diffuse large B-cell lymphoma Diseases 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000001819 effect on gene Effects 0.000 description 2
- 230000002124 endocrine Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 210000003608 fece Anatomy 0.000 description 2
- 201000006585 gastric adenocarcinoma Diseases 0.000 description 2
- 238000010448 genetic screening Methods 0.000 description 2
- 201000010536 head and neck cancer Diseases 0.000 description 2
- 208000014829 head and neck neoplasm Diseases 0.000 description 2
- 201000000459 head and neck squamous cell carcinoma Diseases 0.000 description 2
- 210000002216 heart Anatomy 0.000 description 2
- 208000024348 heart neoplasm Diseases 0.000 description 2
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 2
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 208000015446 immunoglobulin a vasculitis Diseases 0.000 description 2
- 238000009169 immunotherapy Methods 0.000 description 2
- 239000012535 impurity Substances 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 210000003292 kidney cell Anatomy 0.000 description 2
- 208000012987 lip and oral cavity carcinoma Diseases 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 208000026807 lung carcinoid tumor Diseases 0.000 description 2
- 208000019420 lymphoid neoplasm Diseases 0.000 description 2
- 238000002595 magnetic resonance imaging Methods 0.000 description 2
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 2
- 208000025854 malignant tumor of adrenal cortex Diseases 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000003340 mental effect Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 208000030159 metabolic disease Diseases 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 206010063344 microscopic polyangiitis Diseases 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 201000000585 muscular atrophy Diseases 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 210000001623 nucleosome Anatomy 0.000 description 2
- 235000016709 nutrition Nutrition 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000002611 ovarian Effects 0.000 description 2
- 230000036407 pain Effects 0.000 description 2
- 210000000496 pancreas Anatomy 0.000 description 2
- 201000002528 pancreatic cancer Diseases 0.000 description 2
- 208000008443 pancreatic carcinoma Diseases 0.000 description 2
- 201000010279 papillary renal cell carcinoma Diseases 0.000 description 2
- 208000007312 paraganglioma Diseases 0.000 description 2
- 201000003045 paroxysmal nocturnal hemoglobinuria Diseases 0.000 description 2
- 208000033808 peripheral neuropathy Diseases 0.000 description 2
- 230000004962 physiological condition Effects 0.000 description 2
- 208000010626 plasma cell neoplasm Diseases 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 238000002600 positron emission tomography Methods 0.000 description 2
- 230000003334 potential effect Effects 0.000 description 2
- 201000009104 prediabetes syndrome Diseases 0.000 description 2
- 201000005825 prostate adenocarcinoma Diseases 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 239000010979 ruby Substances 0.000 description 2
- 229910001750 ruby Inorganic materials 0.000 description 2
- 238000007480 sanger sequencing Methods 0.000 description 2
- 230000037390 scarring Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001568 sexual effect Effects 0.000 description 2
- 239000010454 slate Substances 0.000 description 2
- 230000000391 smoking effect Effects 0.000 description 2
- 210000000278 spinal cord Anatomy 0.000 description 2
- 210000003802 sputum Anatomy 0.000 description 2
- 208000024794 sputum Diseases 0.000 description 2
- 238000013517 stratification Methods 0.000 description 2
- 208000008467 subacute bacterial endocarditis Diseases 0.000 description 2
- 238000012353 t test Methods 0.000 description 2
- 201000003120 testicular cancer Diseases 0.000 description 2
- 210000000115 thoracic cavity Anatomy 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 206010044412 transitional cell carcinoma Diseases 0.000 description 2
- 239000000107 tumor biomarker Substances 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 201000005112 urinary bladder cancer Diseases 0.000 description 2
- 206010046766 uterine cancer Diseases 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 102000010400 1-phosphatidylinositol-3-kinase activity proteins Human genes 0.000 description 1
- 108020005065 3' Flanking Region Proteins 0.000 description 1
- 108020005029 5' Flanking Region Proteins 0.000 description 1
- 208000001889 Acid-Base Imbalance Diseases 0.000 description 1
- 208000008190 Agammaglobulinemia Diseases 0.000 description 1
- 208000006888 Agnosia Diseases 0.000 description 1
- 241001047040 Agnosia Species 0.000 description 1
- 102100032187 Androgen receptor Human genes 0.000 description 1
- 208000003343 Antiphospholipid Syndrome Diseases 0.000 description 1
- 206010003267 Arthritis reactive Diseases 0.000 description 1
- 206010003805 Autism Diseases 0.000 description 1
- 208000020706 Autistic disease Diseases 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 206010003827 Autoimmune hepatitis Diseases 0.000 description 1
- 206010069002 Autoimmune pancreatitis Diseases 0.000 description 1
- 208000031212 Autoimmune polyendocrinopathy Diseases 0.000 description 1
- 208000022106 Autoimmune polyendocrinopathy type 2 Diseases 0.000 description 1
- 206010061666 Autonomic neuropathy Diseases 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 1
- 208000009137 Behcet syndrome Diseases 0.000 description 1
- 208000008439 Biliary Liver Cirrhosis Diseases 0.000 description 1
- 208000033222 Biliary cirrhosis primary Diseases 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 208000006274 Brain Stem Neoplasms Diseases 0.000 description 1
- 206010006143 Brain stem glioma Diseases 0.000 description 1
- 206010068597 Bulbospinal muscular atrophy congenital Diseases 0.000 description 1
- 101710098191 C-4 methylsterol oxidase ERG25 Proteins 0.000 description 1
- 201000002829 CREST Syndrome Diseases 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 208000031229 Cardiomyopathies Diseases 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 102100028914 Catenin beta-1 Human genes 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 206010050389 Cerebral ataxia Diseases 0.000 description 1
- 206010008609 Cholangitis sclerosing Diseases 0.000 description 1
- 241000251730 Chondrichthyes Species 0.000 description 1
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 1
- 201000000724 Chronic recurrent multifocal osteomyelitis Diseases 0.000 description 1
- 108091028075 Circular RNA Proteins 0.000 description 1
- 235000008733 Citrus aurantifolia Nutrition 0.000 description 1
- 208000015943 Coeliac disease Diseases 0.000 description 1
- 208000010007 Cogan syndrome Diseases 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 208000013586 Complex regional pain syndrome type 1 Diseases 0.000 description 1
- 208000032170 Congenital Abnormalities Diseases 0.000 description 1
- 208000002330 Congenital Heart Defects Diseases 0.000 description 1
- 206010010741 Conjunctivitis Diseases 0.000 description 1
- 206010010904 Convulsion Diseases 0.000 description 1
- 206010011258 Coxsackie myocarditis Diseases 0.000 description 1
- 208000019707 Cryoglobulinemic vasculitis Diseases 0.000 description 1
- 208000025939 DNA Repair-Deficiency disease Diseases 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 206010011878 Deafness Diseases 0.000 description 1
- 201000004624 Dermatitis Diseases 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 208000017701 Endocrine disease Diseases 0.000 description 1
- 201000009273 Endometriosis Diseases 0.000 description 1
- 206010072082 Environmental exposure Diseases 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 206010015150 Erythema Diseases 0.000 description 1
- 206010049466 Erythroblastosis Diseases 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 208000004332 Evans syndrome Diseases 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 208000001640 Fibromyalgia Diseases 0.000 description 1
- 206010016654 Fibrosis Diseases 0.000 description 1
- 238000000729 Fisher's exact test Methods 0.000 description 1
- 201000011240 Frontotemporal dementia Diseases 0.000 description 1
- 208000018522 Gastrointestinal disease Diseases 0.000 description 1
- 206010017993 Gastrointestinal neoplasms Diseases 0.000 description 1
- 208000034826 Genetic Predisposition to Disease Diseases 0.000 description 1
- 206010018364 Glomerulonephritis Diseases 0.000 description 1
- 208000024869 Goodpasture syndrome Diseases 0.000 description 1
- 206010072579 Granulomatosis with polyangiitis Diseases 0.000 description 1
- 208000003807 Graves Disease Diseases 0.000 description 1
- 208000015023 Graves' disease Diseases 0.000 description 1
- 208000001204 Hashimoto Disease Diseases 0.000 description 1
- 208000030836 Hashimoto thyroiditis Diseases 0.000 description 1
- 206010019263 Heart block congenital Diseases 0.000 description 1
- 208000032843 Hemorrhage Diseases 0.000 description 1
- 206010062639 Herpes dermatitis Diseases 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 241001272567 Hominoidea Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000775732 Homo sapiens Androgen receptor Proteins 0.000 description 1
- 101100381521 Homo sapiens BCL6B gene Proteins 0.000 description 1
- 101000916173 Homo sapiens Catenin beta-1 Proteins 0.000 description 1
- 101000695187 Homo sapiens Protein patched homolog 1 Proteins 0.000 description 1
- 101000599843 Homo sapiens RelA-associated inhibitor Proteins 0.000 description 1
- 101000626142 Homo sapiens Tensin-1 Proteins 0.000 description 1
- 208000019758 Hypergammaglobulinemia Diseases 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 206010020983 Hypogammaglobulinaemia Diseases 0.000 description 1
- 206010021042 Hypopharyngeal cancer Diseases 0.000 description 1
- 206010056305 Hypopharyngeal neoplasm Diseases 0.000 description 1
- 208000010159 IgA glomerulonephritis Diseases 0.000 description 1
- 206010021263 IgA nephropathy Diseases 0.000 description 1
- 208000021330 IgG4-related disease Diseases 0.000 description 1
- 208000014919 IgG4-related retroperitoneal fibrosis Diseases 0.000 description 1
- 229940076838 Immune checkpoint inhibitor Drugs 0.000 description 1
- 208000031781 Immunoglobulin G4 related sclerosing disease Diseases 0.000 description 1
- 208000004187 Immunoglobulin G4-Related Disease Diseases 0.000 description 1
- 208000027601 Inner ear disease Diseases 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 208000005016 Intestinal Neoplasms Diseases 0.000 description 1
- 206010061252 Intraocular melanoma Diseases 0.000 description 1
- 208000009164 Islet Cell Adenoma Diseases 0.000 description 1
- 208000003456 Juvenile Arthritis Diseases 0.000 description 1
- 208000011200 Kawasaki disease Diseases 0.000 description 1
- 208000027747 Kennedy disease Diseases 0.000 description 1
- 239000005411 L01XE02 - Gefitinib Substances 0.000 description 1
- 239000002146 L01XE16 - Crizotinib Substances 0.000 description 1
- 201000010743 Lambert-Eaton myasthenic syndrome Diseases 0.000 description 1
- 206010023774 Large cell lung cancer Diseases 0.000 description 1
- 206010023825 Laryngeal cancer Diseases 0.000 description 1
- 206010062038 Lip neoplasm Diseases 0.000 description 1
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 description 1
- 108700012912 MYCN Proteins 0.000 description 1
- 101150022024 MYCN gene Proteins 0.000 description 1
- 208000006644 Malignant Fibrous Histiocytoma Diseases 0.000 description 1
- 208000030070 Malignant epithelial tumor of ovary Diseases 0.000 description 1
- 206010073059 Malignant neoplasm of unknown primary site Diseases 0.000 description 1
- 208000027530 Meniere disease Diseases 0.000 description 1
- 208000026680 Metabolic Brain disease Diseases 0.000 description 1
- 208000017144 Metabolic Skin disease Diseases 0.000 description 1
- 208000001145 Metabolic Syndrome Diseases 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 208000032818 Microsatellite Instability Diseases 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 208000002740 Muscle Rigidity Diseases 0.000 description 1
- 206010028289 Muscle atrophy Diseases 0.000 description 1
- 206010028372 Muscular weakness Diseases 0.000 description 1
- 208000003926 Myelitis Diseases 0.000 description 1
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 description 1
- 201000007224 Myeloproliferative neoplasm Diseases 0.000 description 1
- 208000021908 Myocardial disease Diseases 0.000 description 1
- 206010068871 Myotonic dystrophy Diseases 0.000 description 1
- 108700026495 N-Myc Proto-Oncogene Proteins 0.000 description 1
- 102100030124 N-myc proto-oncogene protein Human genes 0.000 description 1
- 206010028729 Nasal cavity cancer Diseases 0.000 description 1
- 208000001894 Nasopharyngeal Neoplasms Diseases 0.000 description 1
- 206010061306 Nasopharyngeal cancer Diseases 0.000 description 1
- 206010028813 Nausea Diseases 0.000 description 1
- 206010029240 Neuritis Diseases 0.000 description 1
- 206010029379 Neutrophilia Diseases 0.000 description 1
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 1
- 102000007999 Nuclear Proteins Human genes 0.000 description 1
- 108010089610 Nuclear Proteins Proteins 0.000 description 1
- 102100030569 Nuclear receptor corepressor 2 Human genes 0.000 description 1
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 206010030113 Oedema Diseases 0.000 description 1
- 206010030216 Oesophagitis Diseases 0.000 description 1
- 206010058461 Orchitis noninfective Diseases 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 208000007571 Ovarian Epithelial Carcinoma Diseases 0.000 description 1
- 206010061328 Ovarian epithelial cancer Diseases 0.000 description 1
- 206010033165 Ovarian failure Diseases 0.000 description 1
- 208000025174 PANDAS Diseases 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 108091007960 PI3Ks Proteins 0.000 description 1
- 206010053869 POEMS syndrome Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 208000000821 Parathyroid Neoplasms Diseases 0.000 description 1
- 206010061336 Pelvic neoplasm Diseases 0.000 description 1
- 208000008223 Pemphigoid Gestationis Diseases 0.000 description 1
- 208000002471 Penile Neoplasms Diseases 0.000 description 1
- 206010034299 Penile cancer Diseases 0.000 description 1
- 208000005764 Peripheral Arterial Disease Diseases 0.000 description 1
- 208000030831 Peripheral arterial occlusive disease Diseases 0.000 description 1
- 208000029088 Phosphorus metabolism disease Diseases 0.000 description 1
- 208000007913 Pituitary Neoplasms Diseases 0.000 description 1
- 206010065159 Polychondritis Diseases 0.000 description 1
- 108010020346 Polyglutamic Acid Proteins 0.000 description 1
- 208000010642 Porphyrias Diseases 0.000 description 1
- 208000012654 Primary biliary cholangitis Diseases 0.000 description 1
- 208000037534 Progressive hemifacial atrophy Diseases 0.000 description 1
- 102100028680 Protein patched homolog 1 Human genes 0.000 description 1
- 201000004681 Psoriasis Diseases 0.000 description 1
- 201000001263 Psoriatic Arthritis Diseases 0.000 description 1
- 208000036824 Psoriatic arthropathy Diseases 0.000 description 1
- 208000010378 Pulmonary Embolism Diseases 0.000 description 1
- 201000008183 Pulmonary blastoma Diseases 0.000 description 1
- 208000006311 Pyoderma Diseases 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 108091028733 RNTP Proteins 0.000 description 1
- 238000001069 Raman spectroscopy Methods 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 208000012322 Raynaud phenomenon Diseases 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 201000001947 Reflex Sympathetic Dystrophy Diseases 0.000 description 1
- 208000021329 Refractory celiac disease Diseases 0.000 description 1
- 206010038979 Retroperitoneal fibrosis Diseases 0.000 description 1
- 208000025747 Rheumatic disease Diseases 0.000 description 1
- 101001135056 Rhizobium meliloti (strain 1021) Apolipoprotein N-acyltransferase Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 208000034189 Sclerosis Diseases 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 102000013380 Smoothened Receptor Human genes 0.000 description 1
- 101710090597 Smoothened homolog Proteins 0.000 description 1
- 208000021712 Soft tissue sarcoma Diseases 0.000 description 1
- 201000002661 Spondylitis Diseases 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 208000031673 T-Cell Cutaneous Lymphoma Diseases 0.000 description 1
- 206010042971 T-cell lymphoma Diseases 0.000 description 1
- 208000027585 T-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 201000008754 Tenosynovial giant cell tumor Diseases 0.000 description 1
- 102100024547 Tensin-1 Human genes 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 235000011941 Tilia x europaea Nutrition 0.000 description 1
- 230000010632 Transcription Factor Activity Effects 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 206010044565 Tremor Diseases 0.000 description 1
- 108091061763 Triple-stranded DNA Proteins 0.000 description 1
- 208000026928 Turner syndrome Diseases 0.000 description 1
- 208000025865 Ulcer Diseases 0.000 description 1
- 208000015778 Undifferentiated pleomorphic sarcoma Diseases 0.000 description 1
- 201000005969 Uveal melanoma Diseases 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 208000025749 Vogt-Koyanagi-Harada disease Diseases 0.000 description 1
- 208000034705 Vogt-Koyanagi-Harada syndrome Diseases 0.000 description 1
- 208000008383 Wilms tumor Diseases 0.000 description 1
- 108091027569 Z-DNA Proteins 0.000 description 1
- 201000010390 abdominal obesity-metabolic syndrome 1 Diseases 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 208000002552 acute disseminated encephalomyelitis Diseases 0.000 description 1
- 208000027137 acute motor axonal neuropathy Diseases 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 229960001686 afatinib Drugs 0.000 description 1
- ULXXDDBFHOBEHA-CWDCEQMOSA-N afatinib Chemical compound N1=CN=C2C=C(O[C@@H]3COCC3)C(NC(=O)/C=C/CN(C)C)=CC2=C1NC1=CC=C(F)C(Cl)=C1 ULXXDDBFHOBEHA-CWDCEQMOSA-N 0.000 description 1
- 238000012152 algorithmic method Methods 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 206010002022 amyloidosis Diseases 0.000 description 1
- 208000007502 anemia Diseases 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 208000007474 aortic aneurysm Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 206010003230 arteritis Diseases 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 201000009780 autoimmune polyendocrine syndrome type 2 Diseases 0.000 description 1
- 206010071578 autoimmune retinopathy Diseases 0.000 description 1
- 208000029407 autoimmune urticaria Diseases 0.000 description 1
- 230000005784 autoimmunity Effects 0.000 description 1
- 210000003050 axon Anatomy 0.000 description 1
- 230000027455 binding Effects 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 230000003913 calcium metabolism Effects 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 208000035269 cancer or benign tumor Diseases 0.000 description 1
- 229940022399 cancer vaccine Drugs 0.000 description 1
- 238000009566 cancer vaccine Methods 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 231100000357 carcinogen Toxicity 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 239000003183 carcinogenic agent Substances 0.000 description 1
- 208000002458 carcinoid tumor Diseases 0.000 description 1
- 230000000747 cardiac effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 210000003591 cerebellar nuclei Anatomy 0.000 description 1
- 210000001638 cerebellum Anatomy 0.000 description 1
- 201000004559 cerebral degeneration Diseases 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 229960001602 ceritinib Drugs 0.000 description 1
- VERWOWGGCGHDQE-UHFFFAOYSA-N ceritinib Chemical compound CC=1C=C(NC=2N=C(NC=3C(=CC=CC=3)S(=O)(=O)C(C)C)C(Cl)=CN=2)C(OC(C)C)=CC=1C1CCNCC1 VERWOWGGCGHDQE-UHFFFAOYSA-N 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 208000011654 childhood malignant neoplasm Diseases 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 description 1
- 208000024376 chronic urticaria Diseases 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 206010009887 colitis Diseases 0.000 description 1
- 230000000112 colonic effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 201000004395 congenital heart block Diseases 0.000 description 1
- 208000028831 congenital heart disease Diseases 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 229960005061 crizotinib Drugs 0.000 description 1
- KTEIFNKAUNYNJU-GFCCVEGCSA-N crizotinib Chemical compound O([C@H](C)C=1C(=C(F)C=CC=1Cl)Cl)C(C(=NC=1)N)=CC=1C(=C1)C=NN1C1CCNCC1 KTEIFNKAUNYNJU-GFCCVEGCSA-N 0.000 description 1
- 201000003278 cryoglobulinemia Diseases 0.000 description 1
- 201000007241 cutaneous T cell lymphoma Diseases 0.000 description 1
- 208000030381 cutaneous melanoma Diseases 0.000 description 1
- 201000003146 cystitis Diseases 0.000 description 1
- 230000002380 cytological effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 231100000895 deafness Toxicity 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 229940124466 diagnostic for cancer Drugs 0.000 description 1
- 235000021045 dietary change Nutrition 0.000 description 1
- 208000035647 diffuse type tenosynovial giant cell tumor Diseases 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- 201000008243 diversion colitis Diseases 0.000 description 1
- 230000001909 effect on DNA Effects 0.000 description 1
- 230000002888 effect on disease Effects 0.000 description 1
- 230000001516 effect on protein Effects 0.000 description 1
- 238000007812 electrochemical assay Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 201000002491 encephalomyelitis Diseases 0.000 description 1
- 230000002357 endometrial effect Effects 0.000 description 1
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 1
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 1
- 206010015037 epilepsy Diseases 0.000 description 1
- 208000010932 epithelial neoplasm Diseases 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 231100000321 erythema Toxicity 0.000 description 1
- 208000006881 esophagitis Diseases 0.000 description 1
- 210000003238 esophagus Anatomy 0.000 description 1
- CKSJXOVLXUMMFF-UHFFFAOYSA-N exalamide Chemical compound CCCCCCOC1=CC=CC=C1C(N)=O CKSJXOVLXUMMFF-UHFFFAOYSA-N 0.000 description 1
- 229950010333 exalamide Drugs 0.000 description 1
- 208000016253 exhaustion Diseases 0.000 description 1
- 238000011985 exploratory data analysis Methods 0.000 description 1
- 210000000416 exudates and transudate Anatomy 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 208000002980 facial hemiatrophy Diseases 0.000 description 1
- 206010016256 fatigue Diseases 0.000 description 1
- 230000002550 fecal effect Effects 0.000 description 1
- 230000004761 fibrosis Effects 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 201000011243 gastrointestinal stromal tumor Diseases 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 229960002584 gefitinib Drugs 0.000 description 1
- XGALLCVXEZPNRQ-UHFFFAOYSA-N gefitinib Chemical compound C=12C=C(OCCCN3CCOCC3)C(OC)=CC2=NC=NC=1NC1=CC=C(F)C(Cl)=C1 XGALLCVXEZPNRQ-UHFFFAOYSA-N 0.000 description 1
- 230000008303 genetic mechanism Effects 0.000 description 1
- 208000018090 giant cell myocarditis Diseases 0.000 description 1
- 230000004153 glucose metabolism Effects 0.000 description 1
- 230000036449 good health Effects 0.000 description 1
- 201000009277 hairy cell leukemia Diseases 0.000 description 1
- 208000016354 hearing loss disease Diseases 0.000 description 1
- 201000010235 heart cancer Diseases 0.000 description 1
- 208000018578 heart valve disease Diseases 0.000 description 1
- 208000007475 hemolytic anemia Diseases 0.000 description 1
- 201000007162 hidradenitis suppurativa Diseases 0.000 description 1
- 201000006866 hypopharynx cancer Diseases 0.000 description 1
- NBZBKCUXIYYUSX-UHFFFAOYSA-N iminodiacetic acid Chemical compound OC(=O)CNCC(O)=O NBZBKCUXIYYUSX-UHFFFAOYSA-N 0.000 description 1
- 239000012274 immune-checkpoint protein inhibitor Substances 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 208000016245 inborn errors of metabolism Diseases 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 201000002313 intestinal cancer Diseases 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 230000010438 iron metabolism Effects 0.000 description 1
- 201000002529 islet cell tumor Diseases 0.000 description 1
- 210000004153 islets of langerhan Anatomy 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000011901 isothermal amplification Methods 0.000 description 1
- 230000000366 juvenile effect Effects 0.000 description 1
- 201000002215 juvenile rheumatoid arthritis Diseases 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 210000000244 kidney pelvis Anatomy 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 210000001821 langerhans cell Anatomy 0.000 description 1
- 206010023841 laryngeal neoplasm Diseases 0.000 description 1
- 201000010901 lateral sclerosis Diseases 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 208000002741 leukoplakia Diseases 0.000 description 1
- 238000007834 ligase chain reaction Methods 0.000 description 1
- 239000004571 lime Substances 0.000 description 1
- 201000006721 lip cancer Diseases 0.000 description 1
- 230000037356 lipid metabolism Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 210000003141 lower extremity Anatomy 0.000 description 1
- 201000009546 lung large cell carcinoma Diseases 0.000 description 1
- 201000003265 lymphadenitis Diseases 0.000 description 1
- 230000036244 malformation Effects 0.000 description 1
- 201000001439 malignant skin fibrous histiocytoma Diseases 0.000 description 1
- 208000026045 malignant tumor of parathyroid gland Diseases 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 210000001767 medulla oblongata Anatomy 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 208000011661 metabolic syndrome X Diseases 0.000 description 1
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical class CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 208000008275 microscopic colitis Diseases 0.000 description 1
- 208000012268 mitochondrial disease Diseases 0.000 description 1
- 208000005264 motor neuron disease Diseases 0.000 description 1
- 208000001725 mucocutaneous lymph node syndrome Diseases 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 230000020763 muscle atrophy Effects 0.000 description 1
- 230000003387 muscular Effects 0.000 description 1
- 201000006938 muscular dystrophy Diseases 0.000 description 1
- 230000036473 myasthenia Effects 0.000 description 1
- 201000005962 mycosis fungoides Diseases 0.000 description 1
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 1
- 201000003631 narcolepsy Diseases 0.000 description 1
- 230000008693 nausea Effects 0.000 description 1
- 230000001338 necrotic effect Effects 0.000 description 1
- 208000029522 neoplastic syndrome Diseases 0.000 description 1
- 201000008383 nephritis Diseases 0.000 description 1
- 201000008026 nephroblastoma Diseases 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 230000004766 neurogenesis Effects 0.000 description 1
- 208000018360 neuromuscular disease Diseases 0.000 description 1
- 208000008795 neuromyelitis optica Diseases 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 201000001119 neuropathy Diseases 0.000 description 1
- 230000007823 neuropathy Effects 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 230000000414 obstructive effect Effects 0.000 description 1
- 201000002575 ocular melanoma Diseases 0.000 description 1
- 201000005443 oral cavity cancer Diseases 0.000 description 1
- 201000008968 osteosarcoma Diseases 0.000 description 1
- 208000021284 ovarian germ cell tumor Diseases 0.000 description 1
- 208000022102 pancreatic neuroendocrine neoplasm Diseases 0.000 description 1
- 208000003154 papilloma Diseases 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 210000003800 pharynx Anatomy 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 208000010916 pituitary tumor Diseases 0.000 description 1
- 229920002643 polyglutamic acid Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 208000005987 polymyositis Diseases 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 208000025638 primary cutaneous T-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 208000016685 primary ovarian failure Diseases 0.000 description 1
- 201000000742 primary sclerosing cholangitis Diseases 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 229960003387 progesterone Drugs 0.000 description 1
- 239000000186 progesterone Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 208000007153 proteostasis deficiencies Diseases 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 208000002574 reactive arthritis Diseases 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 210000000463 red nucleus Anatomy 0.000 description 1
- 239000013643 reference control Substances 0.000 description 1
- 208000037922 refractory disease Diseases 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 210000002345 respiratory system Anatomy 0.000 description 1
- 230000002207 retinal effect Effects 0.000 description 1
- 150000004492 retinoid derivatives Chemical class 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000000552 rheumatic effect Effects 0.000 description 1
- 201000003068 rheumatic fever Diseases 0.000 description 1
- 208000004124 rheumatic heart disease Diseases 0.000 description 1
- 206010039073 rheumatoid arthritis Diseases 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 201000000306 sarcoidosis Diseases 0.000 description 1
- 208000010157 sclerosing cholangitis Diseases 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 208000037968 sinus cancer Diseases 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 201000008261 skin carcinoma Diseases 0.000 description 1
- 210000001626 skin fibroblast Anatomy 0.000 description 1
- 201000003708 skin melanoma Diseases 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 230000005586 smoking cessation Effects 0.000 description 1
- 210000002460 smooth muscle Anatomy 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 206010062261 spinal cord neoplasm Diseases 0.000 description 1
- 208000037959 spinal tumor Diseases 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 206010041823 squamous cell carcinoma Diseases 0.000 description 1
- 238000010972 statistical evaluation Methods 0.000 description 1
- 230000002966 stenotic effect Effects 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 210000002536 stromal cell Anatomy 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- WZWYJBNHTWCXIM-UHFFFAOYSA-N tenoxicam Chemical compound O=C1C=2SC=CC=2S(=O)(=O)N(C)C1=C(O)NC1=CC=CC=N1 WZWYJBNHTWCXIM-UHFFFAOYSA-N 0.000 description 1
- 229960002871 tenoxicam Drugs 0.000 description 1
- 230000002381 testicular Effects 0.000 description 1
- 208000002918 testicular germ cell tumor Diseases 0.000 description 1
- 210000001550 testis Anatomy 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 229940021747 therapeutic vaccine Drugs 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 230000001256 tonic effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000002235 transmission spectroscopy Methods 0.000 description 1
- 208000009174 transverse myelitis Diseases 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- ONDSBJMLAHVLMI-UHFFFAOYSA-N trimethylsilyldiazomethane Chemical compound C[Si](C)(C)[CH-][N+]#N ONDSBJMLAHVLMI-UHFFFAOYSA-N 0.000 description 1
- 230000005740 tumor formation Effects 0.000 description 1
- 231100000397 ulcer Toxicity 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
- 210000001635 urinary tract Anatomy 0.000 description 1
- 210000003741 urothelium Anatomy 0.000 description 1
- 206010046885 vaginal cancer Diseases 0.000 description 1
- 208000019448 vaginal melanoma Diseases 0.000 description 1
- 208000013139 vaginal neoplasm Diseases 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 206010055031 vascular neoplasm Diseases 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 208000016261 weight loss Diseases 0.000 description 1
- 230000004580 weight loss Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/10—Ploidy or copy number detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/40—Population genetics; Linkage disequilibrium
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Data Mining & Analysis (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Pathology (AREA)
- Immunology (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Bioethics (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- Ecology (AREA)
Abstract
Description
本出願は、2019年4月22日に出願された米国特許仮出願第62/837,109号の利益を主張するものであり、その全体を参照により本明細書に組み込む。
本明細書で言及されているあらゆる刊行物、特許および特許出願は、あたかも個々の刊行物、特許または特許出願のそれぞれが、参照により組み込まれていると特にかつ個々に指し示されているのと同じ程度まで、参照により本明細書に組み込まれる。参照により組み込まれる刊行物および特許または特許出願が、本明細書に含有される開示と矛盾する程度まで、本明細書は、いかなる斯かる矛盾した材料よりも優先するおよび/またはその優位に立つことが意図される。
本開示は、例えば、マイクロサテライトを使用して状態のための分類子を作成するコンピュータに実行される方法を提供する。図1は、コンピュータに実行される方法が行われて、分類子を作成する仕方のワークフローの例を説明する。デオキシリボ核酸(DNA)配列は、状態を有する対象の試料由来の配列情報(101)および状態を有しない参照対象由来の配列情報(102)のデータベースから得られる。101および102由来のマイクロサテライト座位が同定(遺伝子型決定)され、互いに比較されて、状態とのみ関連または相関するマイクロサテライトの集団を明らかにする(103)。次に、マイクロサテライト座位の集団は、さらに解析され、重みを加えられて、分類子の最適化(105)のためのマイクロサテライト座位の初期セットに到達する(104)。最適化は、マイクロサテライトが状態に関連または相関する程度を繰り返しランク付ける。最適化は、最適化の追加的なサイクルのためのマイクロサテライトの追加的なセットにより反復することができる。一部の事例では、マイクロサテライトのセットは、ランダムに分割され、再度組み合わせされて、最適化の追加的なサイクルのためのマイクロサテライトの新たな初期セットを生じる(106)。最適化を完了したら、コンピュータに実行される方法は、分類子を作成するための最も情報価値がある可能性があるマイクロサテライトのセットを同定する(107)。追加的な検証または最適化ステップ(108)は、状態の存在または非存在が分かっている対象の追加的な試料(例えば、データベース由来)を解析することにより得ることができる。108の後に、コンピュータに実行される方法を使用して、最終分類子を作成することができる(109)。
本開示は、状態のためのマイクロサテライト分類子を同定するための方法、例えば、コンピュータに実行される方法(例えば、図2を参照)およびシステムを提供する。状態は、対象における健康状態の存在もしくは非存在、対象における健康状態の発症の見込みの増加もしくは減少、対象が健康状態のための処置から利益を得る見込みの増加もしくは減少、対象が健康状態のための処置の結果として有害事象の増加したリスクを有する見込みの増加もしくは減少、健康状態のための処置に対する対象の応答性、対象の健康状態の予後、またはこれらの組合せとなることができる。本方法は、状態を有する対象および状態を有しない対象由来の試料におけるマイクロサテライト座位を同定(遺伝子型決定)するステップを含むことができる。本方法は、状態のための統計的に情報価値があるマイクロサテライト座位を同定するステップを含むことができる。本方法は、統計的に情報価値があるマイクロサテライト座位を使用して、状態のための分類シグネチャーを開発するステップを含むことができる。分類シグネチャーを検証および使用して、対象由来の試料を検査することができる。
マイクロサテライト分類子を同定する方法は、状態を有する対象および状態を有しない対象由来の試料におけるマイクロサテライト座位を遺伝子型決定するステップを含むことができる。一部の事例では、遺伝子型決定するステップは、データベースにおける配列情報を解析するステップを含む。一部の事例では、遺伝子型決定するステップは、試料を得て、例えば、次世代配列決定によって、試料における核酸分子を解析するステップを含む。
一部の事例では、マイクロサテライト座位を同定(例えば、遺伝子型決定)する方法は、1種または複数のデータベース由来の配列情報を解析するステップを含むことができる。1種または複数のデータベースは、状態を有する対象、例えば、がんを有する対象またはがん細胞系由来の核酸試料の配列情報(例えば、配列リード)を含むことができる。1種または複数のデータベースは、参照配列(例えば、ヒトゲノムまたはその部分)を含むことができる。1種または複数のデータベースは、対象の集団(単数または複数)の変動または多型の配列を含むことができる。
試料は、1名または複数の対象から得られるまたはそれに由来する生体試料となることができる。試料を処理または分画して、他の試料、例えば、他の生体試料を産生することができる。本開示に記載されている試料は、核酸分子を得ることができるいずれかの材料を含むことができる。
マイクロサテライトは、アルゴリズムを使用して遺伝子型決定することができる。アルゴリズムは、例えば、経験的に導かれた誤差モデルによってガイドされたベイジアンモデル選択、または離散化ガウス混合物(例えば、GenoTan)を使用することができる。アルゴリズムは、例えば、Repeatseqとなることができる。動的プログラミングに基づくアプローチまたはヒューリスティック方法を使用して、マイクロサテライトを遺伝子型決定することができる。マイクロサテライト遺伝子型決定のための他のツールは、PHOBOS、MISA、Tandem Repeats Finder、FullSSRまたはbMSISEAを含む。
情報価値があるマイクロサテライトの同定は、状態を有する対象の試料由来のマイクロサテライト座位の第1のセット、および状態を有しない対象の試料由来のマイクロサテライト座位の第2のセットの同定を含むことができる。一部の事例では、マイクロサテライト座位の第2のセットは、参照配列のデータベースから得ることができる。
マイクロサテライト座位の第1のセットおよび第2のセットの間の差は、t-検定、Z-検定、ANOVA、回帰解析、マン・ホイットニー・ウィルコクソン、カイ二乗検定、相関、フィッシャー直接検定、ボンフェローニ補正およびベンジャミニ・ホッホバーグ(Benjamini-Hochberg)検定等、1種または複数の統計検定により統計的に検出および比較することができる。一部の事例では、統計的差異は、一般化フィッシャー直接検定を使用して定量化される。一部の事例では、ベンジャミニ・ホッホバーグ多重検定補正が適用されて、偽発見率を制御する。
例えば、状態を有する対象由来の試料および状態を有しない対象由来の試料が、因子に適合しない場合、マイクロサテライトにフィルタリングをかけて、いずれかの数の因子、例えば、年齢、民族性、性別、配列決定プロトコール(例えば、WSG、WESまたは標的化配列決定)を制御することができる。潜在的なバイアスを有するマイクロサテライトは、その後の解析から除外することができる。マイクロサテライトをフィルタリングするための追加的なフィルターは、マイクロサテライト反復モチーフの長さ、マイクロサテライトの長さの総計(例えば、モチーフのコピーの数)、モチーフの配列(例えば、高いGC含量を有するもののみを使用)、マイクロサテライトの純度、例えば、モチーフのコピーの完璧なセットを中断し得るいずれかの塩基を有するか否かを含むことができる。一部の実例では、マイクロサテライトは、ゲノムにおけるそのポジション、例えば、エクソーム、イントロン、遺伝子間領域または非翻訳領域によってフィルタリングをかけることができる。フィルタリングは、マイクロサテライトに近接した遺伝子または機能的エレメントによるフィルタリングを含むことができる。
統計検定は、受信者動作特性(ROC)曲線を生じることができ、ROC曲線下面積は、曲線下面積(AUC)と称される。AUCを決定して、マイクロサテライト座位のセットの比較の精度を評価することができる。より大きいAUCは、マイクロサテライト座位の第1のセットおよび第2のセットの間の差に対する状態の関連または相関のより高い精度を指し示すことができる。ROC曲線は、マイクロサテライト座位の第1のセットおよび第2のセットの間の差に対する状態の関連または相関についての感度(例えば、真陽性)および特異度(例えば、真陰性)の率を決定することができる。真陽性率、リコールまたは検出確率とも称される感度は、状態の存在または非存在について正確に同定される実際の陽性の比率を測定することができる。感度は、真陽性の数および偽陰性の数の和で割った真陽性の数を計算することにより、偽陰性の回避を定量化することができる。真陰性率とも称される特異度は、状態の存在または非存在について正確に同定される実際の陰性の比率を測定することができる。特異度は、真陰性の数および偽陽性の数の和で割った真陰性の数を計算することにより、偽陽性の回避を定量化することができる。
一部の事例では、マイクロサテライト座位のセットの差に関連または相関する状態は、対象における健康状態の存在もしくは非存在、対象における健康状態の発症の見込みの増加もしくは減少、対象が健康状態のための処置から利益を得る見込みの増加もしくは減少、対象が健康状態のための処置の結果として有害事象の増加したリスクを有する見込みの増加もしくは減少、健康状態のための処置に対する対象の応答性、対象の健康状態の予後、またはこれらの組合せを指し示すことができる。一部の事例では、健康状態は、がんである。一部の事例では、がんは、固形または血液学的悪性である。ある特定の事例では、がんは、転移性、再燃性または難治性である。マイクロサテライト座位のセットの差と関連または相関することができるがんは、急性骨髄球性白血病(LAMLまたはAML)、急性リンパ性白血病(ALL)、副腎皮質癌(ACC)、膀胱尿路上皮がん(BLCA)、脳幹神経膠腫、脳低悪性度(lower grade)神経膠腫(LGG)、脳腫瘍、乳がん(BRCA)、気管支腫瘍、バーキットリンパ腫、原発部位不明のがん、カルチノイド腫瘍、原発部位不明の癌腫、中枢神経系異型奇形様/ラブドイド腫瘍、中枢神経系胚性腫瘍、子宮頸部扁平上皮癌、子宮頸管内腺癌(CESC)がん、小児期がん、胆管細胞癌(CHOL)、脊索腫、慢性リンパ球性白血病、慢性骨髄性白血病、慢性骨髄増殖性障害、結腸(腺癌)がん(COAD)、結腸直腸がん、頭蓋咽頭腫、皮膚T細胞リンパ腫、内分泌膵島細胞腫瘍、子宮内膜がん、上衣芽細胞腫、上衣腫、食道がん(ESCA)、感覚神経芽腫、ユーイング肉腫、頭蓋外胚細胞腫瘍、性腺外胚細胞腫瘍、肝外胆管がん、胆嚢がん、胃(gastric/stomach)がん、胃腸管カルチノイド腫瘍、胃腸管間質細胞腫瘍、胃腸管間質腫瘍(GIST)、妊娠性絨毛性腫瘍、多形神経膠芽腫(glioblstoma multiforme)神経膠腫GBM)、ヘアリー細胞白血病、頭頸部がん(HNSD)、心臓がん、ホジキンリンパ腫、下咽頭がん、眼内黒色腫、島細胞腫瘍、カポジ肉腫、腎臓がん、ランゲルハンス細胞組織球増殖症、喉頭がん、口唇がん、肝臓がん、リンパ系新生物びまん性大細胞型B細胞リンパ腫(DLBCL)、悪性線維性組織球腫骨がん、髄芽腫、髄上皮腫、黒色腫、メルケル細胞癌、メルケル細胞皮膚癌、中皮腫(MESO)、原発不明による転移性扁平上皮頸部がん、口腔(mouth)がん、多発性内分泌新生物症候群、多発性骨髄腫、多発性骨髄腫/形質細胞新生物、菌状息肉症、骨髄異形成症候群、骨髄増殖性新生物、鼻腔がん、鼻咽頭がん、ニューロブラストーマ、非ホジキンリンパ腫、非黒色腫皮膚がん、非小細胞肺がん、口腔(oral)がん、口腔(oral cavity)がん、中咽頭がん、骨肉腫、他の脳および脊髄腫瘍、卵巣がん、卵巣上皮がん、卵巣胚細胞腫瘍、卵巣低悪性度腫瘍、膵がん、乳頭腫、副鼻腔がん、副甲状腺がん、骨盤がん、陰茎がん、咽頭がん、褐色細胞腫および傍神経節腫(PCPG)、中等度分化の松果体実質腫瘍、松果体芽腫、下垂体腫瘍、形質細胞新生物/多発性骨髄腫、胸膜肺芽腫、原発性中枢神経系(CNS)リンパ腫、原発性肝細胞性肝臓がん、前立腺腺癌(PRAD)等の前立腺がん、直腸がん、腎がん、腎細胞(腎臓)がん、腎細胞がん、気道がん、網膜芽細胞腫、横紋筋肉腫、唾液腺がん、肉腫(SARC)、セザリー症候群、皮膚の皮膚性黒色腫(SKCM)、小細胞肺がん、小腸がん、軟部組織肉腫、扁平上皮癌、扁平上皮頸部がん、胃(stomach/gastric)がん、テント上原始神経外胚葉性腫瘍、T細胞リンパ腫、精巣がん精巣胚細胞腫瘍(TGCT)、咽頭がん、胸腺癌、胸腺腫(THYM)、甲状腺がん(THCA)、移行細胞がん、腎盂および尿管の移行細胞がん、絨毛性腫瘍、尿管がん、尿道がん、子宮がん、子宮がん、ぶどう膜黒色腫(UVM)、腟がん、外陰部がん、ワルデンストレーム高ガンマグロブリン血症、またはウィルムス腫瘍を含む。一部の態様では、がん型は、急性リンパ性白血病、急性骨髄球性白血病、膀胱がん、乳がん、脳がん、子宮頸部がん、胆管細胞癌、結腸がん、結腸直腸がん、子宮内膜がん、食道がん、胃腸管がん、神経膠腫、神経膠芽腫、頭頸部がん、腎臓がん、肝臓がん、肺がん、リンパ系新生物、黒色腫、骨髄球性新生物、卵巣がん、膵がん、褐色細胞腫および傍神経節腫、前立腺がん、直腸がん、扁平上皮癌、精巣がん、胃がん、または甲状腺がんを含む。
本開示は、対象由来の試料由来の状態のための分類子を作成するためのコンピュータに実行される方法を提供する(例えば、図2および図3を参照)。情報価値があるマイクロサテライト座位リストのリストは、状態を有する対象の第1の群から得られるもしくはそれに由来する試料および/または状態(例えば、肺がん等のがん)を有しない対象の第2の群から得られるもしくはそれに由来する試料を統計的に解析することにより作成することができる。試料の両方の群由来のDNAは、マルチプレックスプラットフォームにおいて配列決定することができる。一部の事例では、標的化配列決定は、ある特定の標的の濃縮により行われる。次に、配列決定結果を品質について解析し、マッピングして、がん試料および対照または参照の間の差を明らかにすることができる。次に、コンピュータに実行される方法を使用して、この差を解析して、分類子を作成することができる。分類子は、状態を有する対象から得られるもしくはそれに由来する追加的な試料および/または状態を有しない対象から得られるもしくはそれに由来する試料によりさらに最適化および検証することができる。一部の態様では、マイクロサテライト以外の情報価値がある遺伝的マーカーのリストは、分類シグネチャーを開発するためのこれらの方法によって作成することができる。
一部の態様では、分類子を作成するためのコンピュータに実行される方法は、遺伝的アルゴリズムの使用を含む。本方法は、状態を有しない試料由来のマイクロサテライト座位とは異なる、状態を有する試料由来のマイクロサテライト座位を同定することにより、状態と関連または相関するマイクロサテライト座位(情報価値がある座位)のサブセットの初期集団を作成するステップを含むことができる。遺伝的アルゴリズムを使用して、情報価値がある座位に基づき分類シグネチャーを決定することができる。遺伝的アルゴリズムは、最終分類子に含まれるように、最も情報価値があるマイクロサテライト座位のサブセットを選択することができる。遺伝的アルゴリズムは、重みを各サブセットに割り当てることができる。重みを加えることは、他の重みを加えるスキーム、例えば、各マイクロサテライト座位の相対的リスクに対する比例と組み合わせることができる。マイクロサテライトの各サブセットは、状態とサブセットの関連または相関に基づき繰り返しランク付けすることができる。次に、マイクロサテライト座位の初期集団のサブセットは、初期集団を、状態を有する対象および/または状態を有しない対象から得られるまたはそれに由来する追加的な試料と比較することにより最適化することができる。一部の事例では、約100個のサブセットの初期集団が、最適化において使用される。一部の事例では、少なくとも100、200、300、400または500個のサブセットの初期集団が、最適化において使用される。一部の実例では、最適化は、約100個のサブセットを追加的な試料と比較する少なくとも1サイクルを含む。一部の実例では、最適化は、約100個のサブセットを追加的な試料と比較する複数のサイクルを含む。各サブセットは、少なくとも1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90または100個のマイクロサテライトを含むことができる。
本開示は、状態に関連または相関することが同定されたマイクロサテライト座位に重みを加える方法を提供する。また、本開示は、状態に関連または相関することが同定されたマイクロサテライト座位以外の遺伝的マーカーに重みを加える方法を提供する。重みまたは重みを加えることは、状態に対する関連または相関に統計的に寄与する個々のマイクロサテライト座位のそれぞれの相対的な重要性または普及を指すことができる。例えば、高度な重みは、状態を有する対象から得られる試料においてのみ出現するマイクロサテライト座位およびそこにより高い頻度で出現するマイクロサテライト座位の両方に割り当てることができる。一部の事例では、重みは、リスク比、オッズ比または相対的リスクに基づき割り当てられる。重みの決定の一部である数値的構成成分の例は、感度、特異度、陰性適中率、陽性適中率、オッズ比、ハザード比またはこれらのいずれかの組合せを含む。一部の事例では、カットオフ(例えば、閾値)は、重みの計算に使用される数値的構成成分に課される。カットオフを下回る数値的分類子を有する試料は、重みの計算から除外することができる。重みは、計算の線形、非線形、代数、三角法、統計学習、ベイジアン、回帰または相関的手段の組合せに基づき計算することができる。マイクロサテライトまたはマイクロサテライトのセットに関連する、値(例えば、相対的リスク)を使用した重みを加えるスキーム、または回帰アプローチを使用して、分類子を作成することができる。重みを加えられた分類子を評価して、重みを加えることが、分類子の感度または特異度を改善するか否か決定することができる。感度および特異度(例えば、感度および特異度の和)を最大化するために、回帰解析(例えば、標準回帰解析)を使用して、座位毎に最適な重みをコンピュータ処理することができる。
本開示は、汎状態(例えば、がん)分類子を作成するためのコンピュータに実行される方法を提供する(例えば、図2および図4を参照)。情報価値があるマイクロサテライト座位リストは、様々な状態(例えば、がん)型および健康な参照配列の試料を統計的に解析することから作成することができる。試料の両方の群由来のDNAは、マルチプレックスプラットフォームにおいて配列決定することができる。一部の事例では、配列決定は、例えばベイトセットを使用した、追加的な濃縮により標的化される。次に、配列決定結果が品質について解析されマッピングされて、状態(例えば、がん)試料および参照の間の差を明らかにする。この差をコンピュータに実行される方法によって(to)解析して、汎状態(例えば、がん)分類子を作成することができる。汎状態(例えば、がん)分類子は、様々な型の状態、例えば、がんの追加的な試料によりさらに最適化および検証することができる。
本明細書に記載されている通りに作成された分類子を使用して、対象(例えば、患者)試料を解析することができる。対象由来の試料は、例えば、臨床検査室改善修正法(Clinical Laboratory Improvements Amendments)(CLIA)認証検査室において解析することができる。一部の事例では、キットが調製され、対象由来の試料は、CLIA検査室の外で解析される。図5は、例えば、CLIA認証ラボにおける対象(例えば、患者)試料解析パイプラインのためのワークフロー(500)の例を説明する;ワークフローは、マルチプレックス化汎がんアッセイのために試料を処理するために使用することができる。試料、例えば、血液、尿、脳脊髄液、精液、唾液、痰、糞便、リンパ液、組織(例えば、甲状腺、皮膚、心臓、肺、腎臓、乳房、膵、肝臓、筋肉、平滑筋、膀胱、胆嚢、結腸、腸、脳、食道または前立腺)またはこれらのいずれかの組合せ由来の試料が、複数の対象から得られる(501)。核酸分子、例えば、ゲノムDNAが、試料から抽出される。標的、例えば、マイクロサテライト標的が、マルチプレックス化(例えば、ベイト、例えば、ハイブリダイゼーションプローブを使用した)によって濃縮される;濃縮された標的にバーコードを付けて増幅することができる(503)。次世代配列決定アッセイが、例えば、約4、8、12、24、96、128、384または1536個のバッチにおける標的濃縮試料において行われる(505)。配列決定データを逆マルチプレックス化(de-multiplex)することができ(例えば、個々の試料それぞれに付加された特有の配列タグ(例えば、バーコード)を使用して)、品質管理フィルターを未加工の配列リードに適用することができ(例えば、Q30を超えるPhred品質)、遺伝子型が決定され(例えば、座位毎にリードが、フランキング配列を使用して参照配列と整列され、次いで、2個の主要対立遺伝子(遺伝子型)がコンピュータ処理される)、マイナー対立遺伝子分布(例えば、メジャー遺伝子型と比べた、マイナー対立遺伝子またはマイナー対立遺伝子の一部分の数)が、各試料のマイクロサテライト座位毎に決定される(507)(マイナー対立遺伝子は、少なくとも1、少なくとも2、少なくとも3個または3個超の配列リードによって支持され得る)。がん毎の試料毎のリスク分類子(例えば、少なくとも5、10、25、50または100個のマイクロサテライト座位に基づく)が計算される(509)(例えば、遺伝子型は、健康集団(例えば、GRCh38)遺伝子型における最も顕著な遺伝子型に関してモーダルまたは非モーダルであると決定され、全座位にわたって合計され、試料は、がんまたは正常遺伝子型を有する座位の一部分のカットオフに関して、座位が位置する場所に応じて、状態のリスクがあるまたはリスクがないと分類され得る)。リスクは、定量的スケールで表される、またはカテゴリー評価によって指し示され得る。リスク分類子を含む臨床検査室報告が作成され(511)、医療提供者、対象または保険会社に提供される。
本開示は、対象のゲノム年齢およびゲノム加齢の速度を決定するコンピュータに実行される方法を提供する。ゲノム年齢は、年数に較正された数で示すことができる。例えば、ゲノム年齢が、対象の数値的年齢におおよそ等しい場合、全体的なゲノム安定性は、ゲノム年齢について正常となることができる。一部の実例では、ゲノム年齢は、対象の実際の年齢よりも若齢に、同じにまたはより高齢になることができる。対象の実際の年齢よりも高齢なゲノム年齢、または速いゲノム加齢の速度は、ゲノム不安定性、および加齢に関連する健康状態(例えば、疾患)、例えば、がん、心血管疾患、神経学的疾患等の発症に対する易罹患性を示唆することができる。ゲノム年齢およびゲノム加齢の速度は、同じ対象の異なる組織(例えば、皮膚または血液)から得られた試料の間で変動し得る。一部の事例では、ゲノム年齢およびゲノム加齢の速度は、対象の生活習慣(例えば、栄養、身体的または精神的ストレス)または医学的状態を指し示すことができる。対象のゲノム年齢に基づき、生活習慣の変化(例えば、禁煙、食事変更および運動)が対象に推奨される場合がある。
本開示は、本開示に記載されている方法を実行するように構成されたコンピュータシステムを提供する。一部の実例では、コンピュータネットワークに必要に応じて接続されたコンピュータ処理デバイスと、コンピュータ処理デバイスによって実行されるソフトウェアモジュールとを含むシステムが本明細書に開示されている。一部の実例では、システムは、中央処理装置(CPU)、メモリ(例えば、ランダムアクセスメモリ、フラッシュメモリ)、電子記憶装置、コンピュータプログラム、1個または複数の他のシステムと通信するための通信インターフェース、およびこれらのいずれかの組合せを含む。一部の実例では、システムは、コンピュータネットワーク、例えば、インターネット、インターネットと通信したイントラネットおよび/もしくはエクストラネット、遠隔通信、またはデータネットワークにカップルされる。一部の態様では、システムは、本開示に記載されている方法のいずれかの態様に関するデータおよび情報を記憶するための記憶装置を含む。システムの様々な態様は、製品または製造品である。
本開示は、本開示の方法を実行するようにプログラムされたコンピュータシステムを提供する。図18は、本明細書に記載されている方法を実行するようにプログラムまたは他の仕方で構成され得るコンピュータシステム(1801)を示す。コンピュータシステム(1801)は、核酸ポジション情報を入力することと、帰属情報をデータセットに転送することと、データセットにより訓練されたアルゴリズムを作成することとを含む本開示の様々な態様を調節することができる。コンピュータシステム(1801)は、ユーザー電子デバイスまたはリモートコンピュータシステムとなることができる。電子デバイスは、モバイル電子デバイスとなることができる。
一部の態様では、本明細書に記載されているプラットフォーム、媒体、方法およびアプリケーションは、電子デバイス、プロセッサー、またはそれらの使用を含む(デジタル処理デバイスとも称される)。さらなる態様では、電子デバイスは、デバイスの関数を実行する1個または複数のハードウェア中央処理装置(CPU)を含む。またさらなる態様では、電子デバイスは、実行可能命令を行うように構成されたオペレーティングシステムをさらに含む。一部の態様では、電子デバイスは、コンピュータネットワークに必要に応じて接続される。さらなる態様では、電子デバイスは、ワールドワイドウェブにアクセスするように、インターネットに必要に応じて接続される。またさらなる態様では、電子デバイスは、クラウドコンピューティングインフラストラクチャーに必要に応じて接続される。一部の態様では、電子デバイスは、イントラネットに必要に応じて接続される。一部の態様では、電子デバイスは、データ記憶デバイスに必要に応じて接続される。本明細書における記載に従って、適した電子デバイスは、非限定的な例として、サーバーコンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、ノートブックコンピュータ、サブノートブック(sub-notebook)コンピュータ、ネットブックコンピュータ、ネットパッド(net pad)コンピュータ、セットトップコンピュータ、ハンドヘルドコンピュータ、インターネット電化製品、モバイルスマートフォン、タブレットコンピュータ、パーソナルデジタルアシスタント、ビデオゲームコンソールおよび車両(vehicle)を含む。様々な実施形態では、多くのスマートフォンが、本明細書に記載されているシステムにおける使用に適する。様々な実施形態では、必要に応じたコンピュータネットワーク接続性を有する選択(select)テレビ、ビデオプレーヤーおよびデジタル音楽プレーヤーが、本明細書に記載されているシステムにおける使用に適する。適したタブレットコンピュータは、ブックレット(booklet)、スレートおよびコンバーチブル構成を有するものを含む。
一部の態様では、本明細書に記載されているプラットフォーム、媒体、方法およびアプリケーションは、必要に応じてネットワーク接続されたデジタル処理デバイスのオペレーティングシステムによって実行可能な命令を含むプログラムによりコードされた、1個または複数の非一時的コンピュータ可読記憶媒体を含む。さらなる態様では、コンピュータ可読記憶媒体は、電子デバイスの有形構成成分である。またさらなる態様では、コンピュータ可読記憶媒体は、電子デバイスから必要に応じて取り外し可能である。一部の態様では、コンピュータ可読記憶媒体は、非限定的な例として、CD-ROM、DVD、フラッシュメモリデバイス、ソリッドステートメモリ、磁気ディスクドライブ、磁気テープドライブ、光ディスクドライブ、クラウドコンピューティングシステムおよびサービスその他を含む。一部の事例では、プログラムおよび命令は、媒体に永続的に、実質的に永続的に、半永続的にまたは非一時的にコードされている。
一部の態様では、本明細書に記載されているプラットフォーム、媒体、方法およびアプリケーションは、少なくとも1種のコンピュータプログラム、またはその使用を含む。コンピュータプログラムは、指定のタスクを行うように書かれた、電子デバイスのCPUにおいて実行可能な命令シーケンスを含む。コンピュータ可読命令は、特定のタスクを行うまたは特定の抽象データ型を実行する、関数、オブジェクト、アプリケーションプログラミングインターフェース(API)、データ構造その他等のプログラムモジュールとして実行され得る。様々な実施形態では、コンピュータプログラムは、様々な言語の様々なバージョンで書くことができる。
一部の態様では、コンピュータプログラムは、ウェブアプリケーションを含む。様々な実施形態では、ウェブアプリケーションは、様々な態様では、1種または複数のソフトウェアフレームワークおよび1種または複数のデータベースシステムを利用する。一部の態様では、ウェブアプリケーションは、Microsoft(登録商標).NETまたはルビーオンレイルズ(Ruby on Rails)(RoR)等のソフトウェアフレームワーク上に創出される。一部の態様では、ウェブアプリケーションは、非限定的な例として、リレーショナル、非リレーショナル、オブジェクト指向、結合的およびXMLデータベースシステムを含む1種または複数のデータベースシステムを利用する。さらなる態様では、適したリレーショナルデータベースシステムは、非限定的な例として、Microsoft(登録商標)SQLサーバー、mySQL(商標)およびOracle(登録商標)を含む。様々な実施形態では、ウェブアプリケーションは、様々な態様では、1種または複数の言語の1種または複数のバージョンで書かれている。ウェブアプリケーションは、1種または複数のマークアップ言語、提示定義言語、クライアント側スクリプト言語、サーバー側コーディング言語、データベースクエリー言語またはこれらの組合せで書かれていてよい。一部の態様では、ウェブアプリケーションは、ある程度まで、ハイパーテキストマークアップ言語(HTML)、拡張可能ハイパーテキストマークアップ言語(XHTML)または拡張可能(eXtensible)マークアップ言語(XML)等のマークアップ言語で書かれている。一部の態様では、ウェブアプリケーションは、ある程度まで、カスケーディング・スタイル・シート(CSS)等の提示定義言語で書かれている。一部の態様では、ウェブアプリケーションは、ある程度まで、非同期ジャバスクリプト(Javascript)およびXML(AJAX)、Flash(登録商標)アクションスクリプト(Actionscript)、ジャバスクリプトまたはSilverlight(登録商標)等のクライアント側スクリプト言語で書かれている。一部の態様では、ウェブアプリケーションは、ある程度まで、アクティブサーバーページ(ASP)、ColdFusion(登録商標)、パール(Perl)、Java(登録商標)、JavaServer Pages(JSP)、ハイパーテキストプリプロセッサ(PHP)、Python(商標)、ルビー(Ruby)、Tcl、スモールトーク(Smalltalk)、WebDNA(登録商標)またはグルービー(Groovy)等のサーバー側コーディング言語で書かれている。一部の態様では、ウェブアプリケーションは、ある程度まで、構造化クエリー言語(SQL)等のデータベースクエリー言語で書かれている。一部の態様では、ウェブアプリケーションは、IBM(登録商標)Lotus Domino(登録商標)等のエンタープライズサーバー製品を統合する。一部の態様では、ウェブアプリケーションは、メディアプレーヤーエレメントを含む。様々なさらなる態様では、メディアプレーヤーエレメントは、非限定的な例として、Adobe(登録商標)Flash(登録商標)、HTML 5、Apple(登録商標)QuickTime(登録商標)、Microsoft(登録商標)Silverlight(登録商標)、Java(登録商標)およびUnity(登録商標)を含む多くの適したマルチメディア技術のうち1種または複数を利用する。
一部の態様では、コンピュータプログラムは、モバイル電子デバイスに提供されるモバイルアプリケーションを含む。一部の態様では、モバイルアプリケーションは、製造時にモバイル電子デバイスに提供される。一部の態様では、モバイルアプリケーションは、本明細書に記載されているコンピュータネットワークを介してモバイル電子デバイスに提供される。
一部の態様では、コンピュータプログラムは、既存プロセスへのアドオンではなく、例えば、プラグインではなく、独立したコンピュータプロセスとして動作されるプログラムである、スタンドアロンアプリケーションを含む。様々な実施形態では、スタンドアロンアプリケーションは多くの場合、コンパイルされる。コンパイラは、プログラミング言語で書かれたソースコードを、アセンブリ言語または機械コード等のバイナリオブジェクトコードへと転換するコンピュータプログラム(複数可)である。適したコンパイルされたプログラミング言語は、非限定的な例として、C、C++、オブジェクティブ-C、COBOL、デルファイ(Delphi)、エッフェル(Eiffel)、Java(登録商標)、Lisp、Python(商標)、ビジュアルベーシックおよびVB.NET、またはこれらの組合せを含む。コンパイルは多くの場合、少なくとも一部には、実行可能プログラムを創出するために行われる。一部の態様では、コンピュータプログラムは、1種または複数の実行可能なコンパイルされたアプリケーションを含む。
一部の態様では、本明細書に記載されているプラットフォーム、媒体、方法およびアプリケーションは、ソフトウェア、サーバーおよび/もしくはデータベースモジュール、またはそれらの使用を含む。様々な実施形態では、ソフトウェアモジュールは、機械、ソフトウェアおよび言語を使用した様々な技法によって創出される。本明細書に開示されているソフトウェアモジュールは、数多くの仕方で実行することができる。様々な態様では、ソフトウェアモジュールは、ファイル、コードセクション、プログラミングオブジェクト、プログラミング構造、またはこれらの組合せを含む。さらに様々な態様では、ソフトウェアモジュールは、複数のファイル、複数のコードセクション、複数のプログラミングオブジェクト、複数のプログラミング構造、またはこれらの組合せを含む。様々な態様では、1種または複数のソフトウェアモジュールは、非限定的な例として、ウェブアプリケーション、モバイルアプリケーションおよびスタンドアロンアプリケーションを含む。一部の態様では、ソフトウェアモジュールは、1種のコンピュータプログラムまたはアプリケーション中に存在する。一部の態様では、ソフトウェアモジュールは、2種以上のコンピュータプログラムまたはアプリケーション中に存在する。一部の態様では、ソフトウェアモジュールは、1個の機械上にホストされる。一部の態様では、ソフトウェアモジュールは、2個以上の機械上にホストされる。さらなる態様では、ソフトウェアモジュールは、クラウドコンピューティングプラットフォーム上にホストされる。一部の態様では、ソフトウェアモジュールは、1つの場所における1個または複数の機械上にホストされる。一部の態様では、ソフトウェアモジュールは、2つ以上の場所における1個または複数の機械上にホストされる。
一部の態様では、本明細書に開示されているプラットフォーム、システム、媒体および方法は、1種もしくは複数のデータベース、またはその使用を含む。様々な実施形態では、多くのデータベースが、バーコード、ルート、小包(parcel)、対象またはネットワーク情報の記憶および検索に適している。様々な態様では、適したデータベースは、非限定的な例として、リレーショナルデータベース、非リレーショナルデータベース、オブジェクト指向データベース、オブジェクトデータベース、エンティティ関係性モデルデータベース、結合的データベースおよびXMLデータベースを含む。一部の態様では、データベースは、インターネットに基づく。さらなる態様では、データベースは、ウェブに基づく。またさらなる態様では、データベースは、クラウドコンピューティングに基づく。一部の態様では、データベースは、1個または複数のローカルコンピュータ記憶デバイスに基づく。
本明細書に提供される方法およびシステムを含む本明細書に記載されている主題は、1つまたは複数の場所における1つまたは複数の施設において行われるように構成することができる。施設の場所は、国家によって限定されず、いかなる国家または領土も含む。一部の実例では、1または複数のステップは、方法の別のステップが行われる国家とは異なる国家において行われる。一部の実例では、試料を得るための1または複数のステップは、試料から状態の存在または非存在を検出するための1または複数のステップが行われる国家とは異なる国家において行われる。一部の態様では、コンピュータシステムが関与する1または複数の方法ステップは、本明細書に提供される方法の別のステップが行われる国家とは異なる国家において行われる。一部の態様では、データ処理および解析は、本明細書に記載されている方法の1または複数のステップが行われる国家または場所とは異なる国家または場所において行われる。一部の態様では、1種または複数の物品、製品またはデータは、解析またはさらなる解析のために、施設のうち1つまたは複数から1つまたは複数の異なる施設へと転送される。物品は、対象から得られる1種または複数の構成成分、例えば、処理された細胞材料を含むがこれらに限定されない。処理された細胞材料は、RNAから逆転写されたcDNA、増幅されたRNA、増幅されたcDNA、配列決定されたDNA、単離および/または精製されたRNA、単離および/または精製されたDNA、ならびに単離および/または精製されたポリペプチドを含むがこれらに限定されない。データは、対象の層別化に関する情報、および本明細書に開示されている方法によって産生されるいずれかのデータを含むがこれらに限定されない。本明細書に記載されている方法およびシステムの一部の態様では、解析が行われ、その後のデータ伝送ステップは、解析の結果を伝達または伝送するであろう。
一部の態様では、コンピュータプログラムは、ウェブブラウザプラグインを含む。コンピュータ処理において、プラグインは、より大きいソフトウェアアプリケーションに特異的な機能性を加える1種または複数のソフトウェア構成成分である。ソフトウェアアプリケーションのメーカーは、プラグインを支持して、第三者開発者が、アプリケーションを拡張する能力を創出することを可能にし、新たな特色を容易に加えることを支持し、アプリケーションのサイズを低下させる。支持される場合、プラグインは、ソフトウェアアプリケーションの機能性のカスタマイズを可能にする。例えば、プラグインは、ウェブブラウザにおいて一般的に使用されて、ビデオを再生し、双方向性を生じ、ウイルスをスキャンし、特定のファイル型を表示する。様々な実施形態では、Adobe(登録商標)Flash(登録商標)プレーヤー、Microsoft(登録商標)Silverlight(登録商標)およびApple(登録商標)QuickTime(登録商標)を含む、いくつかのウェブブラウザプラグインを使用することができる。一部の態様では、ツールバーは、1種または複数のウェブブラウザ拡張、アドインまたはアドオンを含む。一部の態様では、ツールバーは、1種または複数のexplorerバー、ツールバンドまたはデスクバンドを含む。
本明細書に記載されている方法は、1個または複数のコンピュータを利用することができる。コンピュータは、試料もしくは顧客追跡、データベース管理、分子プロファイリングデータの解析、細胞学的データの解析、データの記憶、課金(billing)、マーケティング、結果の報告、結果の記憶、またはこれらの組合せ等、顧客および試料情報を管理するために使用することができる。コンピュータは、データ、結果、課金情報、マーケティング情報(例えば、人口動態)、顧客情報または試料情報を表示するためのモニターまたは他のグラフィカルインターフェースを含むことができる。コンピュータは、データまたは情報入力のための手段を含むこともできる。コンピュータは、処理装置および固定されたもしくは取り外し可能な媒体、またはこれらの組合せを含むことができる。コンピュータは、コンピュータに物理的に近接しているユーザーによって、例えば、キーボードおよび/もしくはマウス経由で、または物理的なコンピュータに必ずしもアクセスを有するとは限らないユーザーによって、モデム、インターネット接続、電話接続、もしくは有線もしくは無線通信シグナル搬送波等の通信媒体を介してアクセスすることができる。一部の事例では、コンピュータは、ユーザーからコンピュータへとまたはコンピュータからユーザーへと情報を中継するために、サーバーまたは他の通信デバイスに接続することができる。一部の事例では、ユーザーは、取り外し可能な媒体等の媒体上の通信媒体を介して、コンピュータから得たデータまたは情報を記憶させることができる。本方法に関するデータは、関係者による受け取りおよび/または審査のために斯かるネットワークまたは接続をわたって伝送することができることが想定される。受け取る側の関係者は、個人、医療提供者または医療管理者となることができるがこれらに限定されない。一実例では、コンピュータ可読媒体は、生体試料の解析の結果の伝送に適した媒体を含む。媒体は、対象の結果を含むことができ、斯かる結果は、本明細書に記載されている方法を使用して得られる。
生殖系列マイクロサテライト遺伝子型は、髄芽腫(MB)を有する小児を区別する
序文
髄芽腫(MB)は、一般的な悪性小児期脳腫瘍である。MBを有する小児は未だ生涯にわたる環境曝露およびストレスを経験していないため、MBは主に、遺伝性または自発性の突然変異に起因し得る。大規模ゲノム特徴付けは、MB腫瘍を、少なくとも4種のコンセンサス分子サブグループ:WNT、SHH、群3および群4に分けており、これらはそれぞれ、別個の転写プロファイル、コピー数変更、体細胞突然変異および臨床成績を有する。小児科的脳がんは一般にかつMB特異的に、成人固形腫瘍において典型的に観察されるものの5分の1~10分の1の突然変異を有する。p53、PTEN、RBおよびEGFR等の最も顕著な腫瘍開始遺伝的突然変異が、著しく珍しいものとなる。加えて、公知の遺伝的な腫瘍の素因になる突然変異の発生率は、相対的に低くなることができる。PTCH、SMOおよびCTNNB1の突然変異ならびにMYCおよびMYCNの増幅等、数種の公知遺伝的異常は、個々には、動物モデルにおいてMBを効率的に引き起こすには不十分となり得、ヒト腫瘍の5%未満に見出すことができる増強性バックグラウンド、通常、p53不活性化を要求し得る。MBにおける多数のゲノムワイド関連研究(GWAS)は、非コード領域および反復性DNAを無視しつつ、一塩基バリアントに着目することができた。しかし、生殖系列マイクロサテライト(MS)挿入および欠失(インデル)と、ハンチントン病およびフリートライヒ運動失調症(コード配列におけるマイクロサテライトバリアントに起因する前者と、非コードイントロン配列におけるマイクロサテライトバリアントに起因する後者)等の多数の神経学的障害との間に連鎖が示され得る。さらに、マイクロサテライト変形形態は、いくつかのがんの遺伝的バックグラウンドに寄与することができる。加えて、多くのがん関連遺伝子は、MS座位(例えば、PTENおよびNF1)を含有し、一部の事例では、体細胞MSインデルは必然的に、がんに関係付けられた。これらの知見に基づき、許容的体質的遺伝的環境が、個体の転写および翻訳ランドスケープに影響するDNAマイクロサテライト反復エレメントの協同によって創出され得、これを、基礎を成す細胞プロセスのモジュレーションにより腫瘍形成に対して感受性にする。
方法
生殖系列DNA WESおよび髄芽腫(MB)患者由来のWGSを、次のデータセットからダウンロードした:phs000504、phs000409、EGAD00001000122、EGAD00001000275、EGAD00001000816、およびWaszak, S.M, et. Al(Spectrum and prevalence of genetic predisposition in medulloblastoma: a retrospective genetic study and prospective validation in a clinical trial cohort. The Lancet Oncology, Volume 19, Issue 6 , 785 - 798、その全体を参照により本明細書に組み込む)。その上、TruSeqエクソーム標的濃縮キットおよびIlluminaシーケンサーHiSeq 2500を使用して、6名のMB患者の血液DNA由来のWESを新たに作成した。生殖系列DNA WESおよび健康対照由来のWGSを1000ゲノムからダウンロードした。100名の健康な小児由来の生殖系列DNA WESは、NCT Heidelberg、Heidelberg、GermanyにおけるHopp Children’s Cancer Centerによって提供された。
Bowtie2を使用して、WESおよびWGSリードをヒトGRCh38/hg38参照ゲノムにマッピングした。全体的に見て、120種のMB生殖系列試料に関する被覆度は、31×(31.0±18.2)であった。対照群における試料に関する被覆度は、13×(13.4±7.8)であった。
ヒト参照ゲノムのバージョンGRCh38/hg38におけるマイクロサテライトのリストを、デフォルトパラメーターを使用したカスタムパールスクリプト「searchTandemRepets.pl」により作成した。このスクリプトは、マイクロサテライト研究において使用することができ、オンラインで自由に利用できる。簡潔に説明すると、「searchTandemRepets.pl」スクリプトは先ず、純粋反復性ストレッチについて探索した:不純物は許されない。次に、10塩基対のデフォルト値による「mergeGap」パラメーターを使用して、不完全反復および複合反復を取り扱った。基本的に、純粋反復配列のストレッチを中断した不純物は、10塩基対を超えない限り許容された。同様に、10塩基対よりも近い反復は、複合と考慮された。その結果、CAGmデータベースにおける反復は高度に純粋であり、複合反復の構成成分も高度に純粋であった。このスクリプトにより作成された初期リストは、1,671,121個のマイクロサテライトを含んだ。マイクロサテライト間の不適切リードマッピングの見込みを軽減するために、5塩基対長3’および5’フランキング領域の間に同じ反復モチーフを保有するマイクロサテライトの全サブセットを除去した。例えば、マイクロサテライト「GCTGC(A)34CTTAG」および「GCTGC(A)15CTTAG」は、マイクロサテライトの初期リストから予防的に除去した。マイクロサテライトは、より大きい反復性モチーフに包埋され得る。フィルタリングされたリストは、ヒトゲノムにおける625,195個の特有のマイクロサテライトを含んだ。
プログラムRepeatseqを使用して、次世代配列決定リードにおけるマイクロサテライトの遺伝子型を決定した。Repeatseqは、経験的に導かれた誤差モデルによってガイドされたベイジアンモデル選択を使用する。誤差モデルは、配列ならびにリード特性:単位、長さおよび塩基品質を取り込んだ。Repeatseqは、3種の入力ファイル:参照ゲノム、ヒト参照ゲノムに整列されたリードを含有するファイル(.bamファイル)、および公知マイクロサテライトのリスト(本明細書に開示されている方法およびシステムに従った)において操作した。出力は、最も支持するリードを有する2個の対立遺伝子からなるマイクロサテライト座位毎に遺伝子型を収載する、バリアントコールフォーマット(.vcf)ファイルであった。他のマイクロサテライト遺伝子型決定プログラムに優るRepeatseqの利点は、アレイ長さ検出に先立ち参照ゲノムに各リードを再整列することであった。Repeatseqは、マイクロサテライトの研究において使用することができ、自由に利用できる。
他のがんおよび対照に関するマイクロサテライト遺伝子型分布の以前の観察に基づき検出力計算を行って、検証のための検査セットに十分な試料が存在することを保証しつつ、訓練セットのサイズを選択した。0.01のこの帰無仮説の検査に関連した保存的第I種の過誤確率を検証の一部として選んだ。各対象群内の応答は、1の標準偏差により正規分布されていると示すことができる。2の実験および対照平均の真の差について、実験および対照群の集団平均が、120名の実験対象および426名の対照対象による研究について0.99を超える確率(検出力)で等しかったという帰無仮説が拒絶された。よって、訓練セットは、利用できる試料の数により適切に駆動されると予測された。
本研究は、MBに特異的な生殖系列マイクロサテライト変形形態を同定するように設計された;具体的には、統計的に有意なマイクロサテライトが、120種のMB試料および425種の健康対照において同定された。しかし、これらの試料は、年齢または配列決定プロトコールについて適合しなかった;さらに、これらは、民族性について部分的にしか適合しなかった。よって、このアプローチは、疾患様態単独よりもむしろ、年齢、配列決定および民族的バイアスによりマイクロサテライトを同定するリスクを有し得る。このリスクを軽減するために、マイクロサテライトを潜在的バイアス(年齢、配列決定または民族性についての)により同定し、これらをその後の解析から除外した。
試料をスコアリングするための計量:試料をスコアリングするための計量は、その特有のマイクロサテライト遺伝子型分布に基づき設計した。基本的に、計量は、各試料に属する遺伝子型の重みを加えた和であった:重みは、MBおよび健康群における遺伝子型毎の頻度の差から生じた。計量の視覚的概要を図13に示す。
遺伝的アルゴリズムは、生物学的にインスピレーションを受けたアルゴリズムのクラスとなることができる。簡潔に説明すると、遺伝的アルゴリズムを使用して、139個のセットから、2ステップの繰り返しプロセスを使用して、マーカーの最も情報価値があるサブセットを同定した。先ず、139個のマイクロサテライトマーカーのランダムサブセットによりアルゴリズムを初期化した;次に、成績上位のサブセットを連続的に再度組み合わせ、再度評価し、再度ランク付けした。3種のハイパーパラメーター(例えば、繰り返しアルゴリズムが始まる前のパラメーターセット)を使用して、最大集団サイズ、各サブセットのサイズ、各サブセットの成績、および集団におけるサブセットの多様性を制御した。各ステップおよびハイパーパラメーターの詳細を下に示す。
使用された試料:研究が十分すぎるほどに駆動されていることを保証するために、検証研究において102名の実験対象および428名の対照対象を選んだ。訓練セットを解析する際に見出される対象(MB)および対照分布を使用すると(図7A)、各対象群内の応答は、1.1の標準偏差で正規分布していた。4.4の実験および対照平均の真の差について、実験および対照群の集団平均が、このサイズの試料および対照検証セットによる0.01の第I種の過誤確率について、0.99を超える確率(検出力)で等しかったという帰無仮説に基づき拒絶が為された。訓練および検証において使用された全対照試料を、全エクソーム配列決定に付した。MBについて、収集物は、全エクソームおよび全ゲノム試料の両方を含んだ。全ゲノム配列決定試料を検証のために排他的に使用した。
MBを有する個体が、マイクロサテライト変形形態の傾向が強かったか検査するために、マイクロサテライト毎の遺伝子型決定された対立遺伝子の総数(対立遺伝子ロード)をその変異性の尺度として使用し、この計量を疾患および対照コホートにわたり比較した。生じた計数が2つのエラー源に対して頑強となるように、対立遺伝子を定義した:(a)PCRアーチファクトの潜在的効果は、各対立遺伝子が、少なくとも2個のリードによって支持されることを要求することにより軽減され;(b)試料にわたるリード被覆度の差に対して正規化するために、各対立遺伝子は、マイクロサテライトにマッピングされたリードの総数の少なくとも20%によって支持されることが要求された。対立遺伝子は、試料の少なくとも20パーセントに存在するマッピングされたリードを有するマイクロサテライトに対してのみ計数された。次に、フィッシャー直接検定を行って、MB患者および健康個体の間の統計的有意性を確立した。このプロセスを、0.077の平均p-値により50回反復した。
その遺伝子型がMB対象および対照の間で有意に異なった139個のマイクロサテライト座位に関連する遺伝子を機能解析のために使用した。総計で、遺伝子間領域に位置するマイクロサテライトを除外して、124種の遺伝子が解析に含まれた。Ingenuity Pathway Analysis(QIAGEN Inc.)を使用して、経路解析を行った。PedcBioPortalを使用して、突然変異および同時発生事象を解析した。0.7の最小相互作用スコアを有するSTRING(高い信頼)および第1のシェルにおける5分子以下により、タンパク質-タンパク質相互作用(PPI)ネットワーク構築を行った。この設定は、129個のノードおよび49個のエッジを有するハブを作成し、0.0007のPPIエンリッチメントp-値を有するネットワークをもたらした。
髄芽腫マイクロサテライトの情報価値がある座位の同定
一塩基突然変異は、MBゲノムワイド解析において特徴付けることができる。そこで、髄芽腫素因におけるマイクロサテライト変形形態の影響について研究した。この目的のため、コンピュータによるワークフローを開発して、年齢、民族性およびDNA配列決定プロトコールに伴い変動するものを補正しつつ、その遺伝子型が髄芽腫を有する小児および対照対象の間で異なる生殖系列マイクロサテライトを同定した(図6)。計量も開発して、マイクロサテライト遺伝子型のその特有の収集物に基づき各試料をスコアリングした。本アプローチを、222名の髄芽腫を有する小児および853名の健康対照対象由来の生殖系列DNA配列決定データに適用した。データを2群に分け、両者共に罹患および健康対象を含有し、第1の群は、120名の髄芽腫患者および425名の対照個体を含有する訓練するための群であり、第2の群は、102名の髄芽腫患者および428名の対照個体を有する検証のための群である。解析の第1段階において、訓練セットを使用して、120種の髄芽腫試料および425種の健康対照の両方に存在する43,457個の異なるマイクロサテライトを遺伝子型決定した。これらのマイクロサテライトのそれぞれについて、一般化フィッシャー直接検定を使用して、マイクロサテライト毎に2群間の遺伝子型分布における統計的差異を評価した。p-値<0.05により2,094個のマイクロサテライトを同定した。ベンジャミニ・ホッホバーグ多重検定補正(α=.05)後に、422個が、偽発見に合格した。3つの追加的なステップを行って、年齢、民族性およびDNA配列決定プロトコールに伴い変動するマイクロサテライトを除去した(図6、図10、図11および図12)。総計で、283個のマイクロサテライトを422個のリストから除去し、139個の低下したリストをもたらした(図19)。まとめると、本アプローチは、その遺伝子型が髄芽腫対象および健康対照の間で有意に異なった、139個のマイクロサテライトを生殖系列DNAから同定した。
髄芽腫試料および健康対照の区別において最良の成績を有するマイクロサテライトのサブセットを同定するために、139個のマイクロサテライトのセットを使用して、髄芽腫分類子を訓練した。先ず、計量を、139個のマイクロサテライトの遺伝子型に基づき各髄芽腫および対照試料をスコアリングするように設計した(詳細については方法および図13を参照)。次に、受信者動作特性(ROC)を作成および使用して、髄芽腫のためのバイナリ分類子として機能する試料スコアの能力を決定した。遺伝的アルゴリズム方法に基づくサブセット最適化戦略を使用して、2ステップの繰り返しプロセスを使用して識別マーカーの最良のサブセットを同定した。第一に、完全リストからサブセットをランダムに作成し、そのF-尺度によってランク付けした。第二に、成績上位のサブセットを連続的に混合し、再度評価し、再度ランク付けした。アルゴリズムは、87サイクルにおいて収束して、0.90のF-尺度および0.962の曲線下面積(AUC)による43個のマイクロサテライトのサブセットを明らかにした(図7、図20)。健康対照から髄芽腫試料を区別するための最適カットオフスコアが0.155であったことを指し示す、ヨーデン指標を決定した(図14)。0.92の特異度で、訓練セットに適用される場合の感度は、0.88であった(図7B)。ヒトゲノムにおけるこれら43個のマーカーの染色体位置を図15に示す。よって、43個のマイクロサテライトのセットを同定したところ、これらの遺伝子型分布は、88%感度および92%特異度で、健康対照から髄芽腫患者を区別することができた。
生殖系列において、MSにおけるインデルの率は、ゲノムにおける他の箇所の一塩基置換の率よりも有意に高く、それぞれ世代当たり座位当たり10-8と比較して、10-4~10-3である。しかし、突然変異率も、反復の長さ、その反復性モチーフ、およびDNAフォールディングにおける影響に基づき異なるMSについて変動する。その遺伝子型がMBと非ランダムに関連した、139個のMSに見出された差(図20)が、MBを有する個体に固有のマイクロサテライト遺伝子型変形形態の増加の結果となり得ることが仮定された。MBを有する個体が、マイクロサテライト変形形態の傾向が強かったか検査するために、マイクロサテライト毎の遺伝子型決定された対立遺伝子の総数(対立遺伝子ロード)をその変異性の尺度として使用し、この計量を疾患および対照コホートにわたり比較した。健康およびMB個体の間で遺伝子型決定された対立遺伝子の数に有意差はなく、MB患者において全般的なマイクロサテライト不安定性が存在しなかったという結論を支持する。対立遺伝子ロードによりMSの全てをランク付けすることにより、情報価値があるマイクロサテライトそれ自体の特徴関連について、予測能力を調査して、139個のマーカーが、解析された最も変異できる座位の中に存在するか否か決定した。これらはより変異できるMSの中に存在したが、最も変異できる部位を含まなかったことが見出された。その上、ホモ接合体およびヘテロ接合体遺伝子型の数ならびにマイクロサテライトアレイの長さを、MBにおける可変性の潜在的な供給源として比較した。両方の事例において、MBおよび対照生殖系列DNAの間に統計的に有意な差はなかった。これらの結果およびデータは、MBとこれらの139個のMSの関連が、単純に体質的な高変異性の結果という訳ではなく、これらの個々のマイクロサテライトの遺伝子型の帰結であったことを指し示す。
その遺伝子型がMBおよび対照試料の間で異なった139個のMS座位のうち、114個はイントロン領域に、15個は遺伝子間領域に、6個は3’UTRに、3個はエクソン領域に、1個は5’UTRに位置した(図8A)。これらの遺伝子の潜在的機構的役割を理解するために、Ingenuity Pathway Analysis(登録商標)を行って、情報価値があるMS座位(遺伝子間領域に位置するMSを除外)に関連する124種の遺伝子を解析した。解析は、細胞周期、DNA複製、組換えおよび修復、ならびに細胞成長および増殖等、がんおよび分子細胞機能との統計的に有意な関連を明らかにし、がん生物学との関係性を指し示す(図8Bおよび図21)。情報価値があるMSに関連するこれらの124種の遺伝子における突然変異の出現を、cBioportalにおいて利用できる4種のMBコホートにおいて試験した。MB腫瘍における公知の低い突然変異率にもかかわらず、MBがん試料の平均して17%は、ニューロブラストーマ腫瘍の4.5%と比較して、これらの124種の遺伝子のうち少なくとも1種に突然変異を含有した(図22)。cBioportal内のSick Kids 2016データセットを使用した突然変異同時発生の解析は、あらゆる可能な(9,591=139*(139-1)/2)マイクロサテライト対のうち135対が、有意に同時に発生することが見出された(p-値<0.05)ことを指し示した。2名の患者が、それぞれ20および10個のMB情報価値があるMS座位において突然変異の同時発生を有すると見出された(図23)。
情報価値があるマイクロサテライトマーカーの同定
状態を有する対象(第1の群)および健康対照(第2の群)の両方の核酸配列の試料を、パブリックドメインデータベースから得る。両方の群でマイクロサテライト座位が同定される。マイクロサテライトを比較して、第1の群のみに見出され、状態に特異的に関連または相関するマイクロサテライト座位の差を明らかにする。統計的解析およびモデル化は、状態に対するその関連または相関について、これらの異なるマイクロサテライトに適用される。一部の実例では、マイクロサテライトに統計的に重みを加える。マイクロサテライトのセットが、状態に強く関連付けられると同定された後に、これらのマイクロサテライトは、訓練アルゴリズムへとアセンブルされて、状態に対するこれらのマイクロサテライト関連付けの精度、感度および特異度をさらに最適化する。訓練中のマイクロサテライトをランダムに再度組み合わせて、マイクロサテライトの追加的な組合せを作成することができる。訓練の完了後に、試料の追加的な独立したセットによりアルゴリズムを検証することができる。
患者におけるリスク評価
ルーチンの健康検査の際に対象から血清試料を単離する。血清試料からDNAを抽出し、配列決定する。配列決定データを処理および解析して、対象に特有のマイクロサテライトのセットを得る。次に、対象のマイクロサテライトおよび汎がんデータベース由来のマイクロサテライトの間の比較に基づきがんを発症するリスクを決定するように設計されたコンピュータに実行される方法を使用して、マイクロサテライトのこのセットを解析する。同定された情報価値があるマイクロサテライトのそれぞれに、0~1の間に及ぶ重みを割り当てる。同定されたマイクロサテライトの精度、感度および特異度に基づき重みを作成する。次に、重みの和を決定し、1つの型のがんを発症する見込みのための分類子の創出に使用する。次に、汎がん分類子をコンパイルし、対象のリスク評価のために、複数のがんを発症する複数の見込みのための複数の分類子を報告する。汎がん分類子は、がん、例えば、乳がん、肺がん、前立腺がん、子宮頸部がん、多形神経膠芽腫、子宮体部子宮内膜癌、結腸腺癌、膀胱、尿路上皮癌、頭頸部扁平上皮癌、子宮頸部扁平上皮癌および子宮頸管内腺癌、胃腺癌、甲状腺癌、脳低悪性度神経膠腫、腎臓の乳頭状腎細胞癌、および肝臓の肝細胞癌を発症する対象の見込みのリスク評価を提供する。
マイナー対立遺伝子を使用したゲノム年齢の測定
初代皮膚線維芽細胞由来のDNAの試料を、17歳のときに、また、再度30歳のときに対象から得る。DNA-seqライブラリを構築し、その後、次世代配列決定プラットフォームにより配列決定し、hg19にマッピングする。濃縮を実行して、マイナー対立遺伝子が集団において生じる傾向があるホットスポットを濃縮することができる。最小で5個のリードを有するマイナー対立遺伝子は、サンガー配列決定により独立に確認される。真陽性マイナー対立遺伝子を解析し、重みを加える。マイナー対立遺伝子が現れる位置の例は、遺伝子の上流または下流、エクソン領域、遺伝子間領域、イントロンおよびエクソンにまたがる領域、3’UTR、ならびに5’UTRを含む。マイナー対立遺伝子は、非同義バリアント、同義バリアント、フレームシフトインデル、非フレームシフトインデル、ストップゲイン、ストップロス、またはこれらの組合せとなることができる。
Claims (61)
- 状態のための最適化された分類子を構築するためのコンピュータに実行される方法であって、複数のマイクロサテライトのサブセットを、複数の最適化サイクルにおける前記状態のための分類子としてランク付けするステップを含み、前記複数のマイクロサテライトの前記サブセットが、前記状態と相関するマイクロサテライトの初期集団におけるマイクロサテライトを含み、これにより、前記マイクロサテライトの前記サブセットの最適化されたサブセットを、前記状態のための前記最適化された分類子として同定する、方法。
- 前記状態を有する対象由来の試料の第1のセットにおけるマイクロサテライト、および前記状態を有しない対象由来の試料の第2のセットにおけるマイクロサテライトを比較し、これにより、マイクロサテライトの前記初期集団を同定するステップをさらに含む、請求項1に記載の方法。
- 前記ランク付けするステップが、マイクロサテライトの前記サブセットを、前記状態を有する対象由来の試料におけるマイクロサテライトおよび前記状態を有しない対象由来の試料由来のマイクロサテライトと比較するステップを含む、請求項1に記載の方法。
- 前記複数の最適化サイクルの最適化サイクルにおけるランク付けにおける使用のために、マイクロサテライトの前記初期集団からマイクロサテライトの初期サブセットの集団をランダムに選ぶステップを含む初期化をさらに含む、請求項1に記載の方法。
- マイクロサテライトの前記初期集団の少なくとも100個のサブセットの集団が、前記複数の最適化サイクルにおいて使用される、請求項1に記載の方法。
- マイクロサテライトの前記サブセットのサブセットにおけるマイクロサテライトの最小数が、8である、請求項1に記載の方法。
- マイクロサテライトの前記サブセットのサブセットにおけるマイクロサテライトの最大数が、64である、請求項1に記載の方法。
- 重複マイクロサテライトが、マイクロサテライトの前記サブセットのサブセットにおいて許可されない、請求項1に記載の方法。
- 前記ランク付けするステップが、(i)マイクロサテライトの前記サブセット、(ii)前記状態を有する対象由来の試料におけるマイクロサテライト、および(iii)前記状態を有しない対象由来の試料におけるマイクロサテライトを使用して、受信者動作特性(ROC)解析を行うステップを含む、請求項1に記載の方法。
- 前記複数の最適化サイクルの最適化サイクルにおける前記ランク付けするステップが、前記サブセットの各サブセットにおけるマイクロサテライトの感度および特異度の和を、前記状態のための前記分類子として決定するステップを含む、請求項9に記載の方法。
- 前記複数の最適化サイクルの最適化サイクルが、マイクロサテライトの前記初期集団の10個の新たなサブセットを、前記複数の最適化サイクルの以前の最適化サイクル由来のサブセットに加えるステップを含む、請求項10に記載の方法。
- 前記10個の新たなサブセットのうち7個が、前記以前の最適化サイクル由来の2個のランダムに選ばれたサブセットをランダムに分割し再度組み合わせることにより作成され、前記10個の新たなサブセットのうち3個が、マイクロサテライトの前記初期集団からマイクロサテライトをランダムに選択することにより作成される、請求項11に記載の方法。
- 少なくとも一部には、前記最適化サイクルにおいて最低ランク付けを有することに基づき、前記最適化サイクルにおける前記サブセットの10個のサブセットを廃棄するステップをさらに含む、請求項12に記載の方法。
- 前記状態が、対象における健康状態の存在または非存在を含む、請求項1に記載の方法。
- 前記状態が、対象における健康状態を発症する見込みの増加または減少を含む、請求項1に記載の方法。
- 前記状態が、対象が健康状態の処置から利益を得る見込みの増加または減少を含む、請求項1に記載の方法。
- 前記状態が、対象が健康状態の処置による有害事象の増加したリスクを有する見込みの増加または減少を含む、請求項1に記載の方法。
- 前記状態が、健康状態のための処置に対する対象の応答性を含む、請求項1に記載の方法。
- 前記状態が、対象における健康状態の予後を含む、請求項1に記載の方法。
- 前記健康状態が、がんである、請求項14から19のいずれか一項に記載の方法。
- 前記がんが、肺がんである、請求項20に記載の方法。
- 前記健康状態が、神経学的疾患である、請求項14から19のいずれか一項に記載の方法。
- 前記健康状態が、心血管疾患である、請求項14から19のいずれか一項に記載の方法。
- コンピュータに実行される方法であって、複数のパラメーターを使用して、対象由来の試料由来の状態のための分類子の値を決定するステップを含み、前記複数のパラメーターの各パラメーターが、前記状態を有する対象由来の試料または前記状態を有しない対象由来の試料由来の複数のマイクロサテライトのそれぞれの相関の統計的尺度である、方法。
- 前記複数のパラメーターが、複数の重みを含む、請求項24に記載の方法。
- 前記複数の重みが、複数の最適な重みを含む、請求項25に記載の方法。
- 前記複数の最適な重みを決定するステップをさらに含む、請求項26に記載の方法。
- 前記複数の最適な重みを決定する前記ステップが、標準回帰解析を前記複数の重みに適用するステップを含む、請求項27に記載の方法。
- 前記複数の最適な重みを決定する前記ステップが、遺伝的アルゴリズムの使用を含む、請求項24に記載の方法。
- 前記分類子の前記値を決定する前記ステップが、マイナー対立遺伝子頻度データを使用するステップを含む、請求項24に記載の方法。
- 前記複数のマイクロサテライトが、少なくとも10個のマイクロサテライトを含む、請求項24に記載の方法。
- 前記複数のマイクロサテライトのそれぞれが、前記状態と相関する、請求項24に記載の方法。
- 前記分類子の前記値を閾値と比較するステップをさらに含む、請求項24に記載の方法。
- 前記状態が、対象における健康状態の存在または非存在を含む、請求項24に記載の方法。
- 前記状態が、対象における健康状態を発症する見込みの増加または減少を含む、請求項24に記載の方法。
- 前記状態が、対象が健康状態の処置から利益を得る見込みの増加または減少を含む、請求項24に記載の方法。
- 前記状態が、対象が健康状態の処置による有害事象の増加したリスクを有する見込みの増加または減少を含む、請求項24に記載の方法。
- 前記状態が、健康状態のための処置に対する対象の応答性を含む、請求項24に記載の方法。
- 前記状態が、がん、心血管疾患または神経学的疾患である、請求項34から38のいずれか一項に記載の方法。
- 前記がんが、肺がんである、請求項39に記載の方法。
- 対象のゲノム年齢を決定するコンピュータに実行される方法であって、
a)対象由来の第1の試料におけるマイクロサテライトマイナー対立遺伝子特徴を決定するステップと、
b)前記マイクロサテライトマイナー対立遺伝子特徴を参照により処理するステップと、
c)前記処理するステップに基づき、前記対象の前記ゲノム年齢を決定するステップと
を含む方法。 - 前記処理するステップが、前記マイクロサテライトマイナー対立遺伝子特徴を前記参照と比較するステップを含む、請求項41に記載の方法。
- 前記マイナー対立遺伝子特徴が、遺伝子座におけるマイナー対立遺伝子の数である、請求項41に記載の方法。
- マイナー対立遺伝子の前記数が、少なくとも3個の次世代配列決定配列リードによって支持される、請求項43に記載の方法。
- 前記マイナー対立遺伝子特徴が、遺伝子座における主要対立遺伝子のリードの総数に対して正規化されたマイナー対立遺伝子のリードリードの総数である、請求項41に記載の方法。
- 前記対象由来の前記第1の試料の次世代配列決定を行って、前記対象のマイクロサテライトの配列リードを作成するステップをさらに含む、請求項41に記載の方法。
- 前記第1の試料が、血液、唾液または腫瘍を含む、請求項46に記載の方法。
- 操作c)の後に、前記対象由来の第2の試料におけるマイナー対立遺伝子特徴を決定するステップをさらに含む、請求項45に記載の方法。
- 前記対象由来の前記第1の試料における前記マイナー対立遺伝子特徴および前記対象由来の前記第2の試料における前記マイナー対立遺伝子特徴を評価するステップと、前記評価するステップに基づき、前記対象のゲノム加齢の速度を決定するステップとをさらに含む、請求項47に記載の方法。
- コンピュータに実行される方法であって、
a)対象由来の試料におけるマイクロサテライトを使用して、前記対象由来の前記試料のための複数の分類子を決定するステップと、
b)複数の状態のための複数の参照分類子により、前記複数の分類子を処理するステップと、
c)前記処理するステップに基づき、前記複数の状態の中から、前記対象のために少なくとも1種の状態を決定するステップと
を含む方法。 - 前記処理するステップが、前記複数の分類子を前記複数の状態のための前記複数の参照分類子と比較するステップを含む、請求項50に記載の方法。
- 前記複数の状態のうち前記少なくとも1種の状態が、前記対象の複数の健康状態の中からの少なくとも1種の健康状態の存在または非存在を含む、請求項50に記載の方法。
- 前記複数の状態のうち前記少なくとも1種の状態が、前記対象の複数の健康状態の中からの少なくとも1種の健康状態を発症する見込みの増加または減少を含む、請求項50に記載の方法。
- 前記複数の状態のうち前記少なくとも1種の状態が、前記対象が、前記対象の複数の健康状態の中からの少なくとも1種の健康状態の処置から利益を得る見込みの増加または減少を含む、請求項50に記載の方法。
- 前記複数の状態のうち前記少なくとも1種の状態が、前記対象が、前記対象の複数の健康状態の中からの少なくとも1種の健康状態の処置による有害事象の増加したリスクを有する見込みの増加または減少を含む、請求項50に記載の方法。
- 前記複数の状態のうち前記少なくとも1種の状態が、前記対象の複数の健康状態の中からの少なくとも1種の健康状態のための処置に対する前記対象の応答性を含む、請求項50に記載の方法。
- 前記複数の健康状態が、複数のがんを含む、請求項51から56のいずれか一項に記載の方法。
- 前記複数のがんが、卵巣がん、乳がん、低悪性度神経膠腫、神経膠芽腫、肺がん、前立腺がんまたは黒色腫を含む、請求項57に記載の方法。
- 前記複数の健康状態が、複数の神経学的疾患または複数の心血管疾患を含む、請求項50に記載の方法。
- 1個または複数のプロセッサーによって実行されると、前記1個または複数のプロセッサーに、請求項1から59のいずれか一項に記載の方法を行わせる実行可能命令を含む、非一時的コンピュータ可読媒体。
- 請求項60に記載の非一時的コンピュータ可読媒体における前記命令を実行するように構成されたハードウェアプロセッサーを含む、コンピュータシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962837109P | 2019-04-22 | 2019-04-22 | |
US62/837,109 | 2019-04-22 | ||
PCT/US2020/029145 WO2020219463A1 (en) | 2019-04-22 | 2020-04-21 | Methods and systems for microsatellite analysis |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2022530088A true JP2022530088A (ja) | 2022-06-27 |
JPWO2020219463A5 JPWO2020219463A5 (ja) | 2023-04-27 |
JP7590344B2 JP7590344B2 (ja) | 2024-11-26 |
Family
ID=72941731
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021563182A Active JP7590344B2 (ja) | 2019-04-22 | 2020-04-21 | マイクロサテライト解析のための方法およびシステム |
Country Status (11)
Country | Link |
---|---|
US (1) | US20220189583A1 (ja) |
EP (1) | EP3959341A4 (ja) |
JP (1) | JP7590344B2 (ja) |
KR (1) | KR20220011630A (ja) |
CN (1) | CN114026253A (ja) |
AU (1) | AU2020260998A1 (ja) |
BR (1) | BR112021021128A2 (ja) |
CA (1) | CA3137720A1 (ja) |
IL (1) | IL287458A (ja) |
MX (1) | MX2021012988A (ja) |
WO (1) | WO2020219463A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20240062916A1 (en) * | 2020-12-03 | 2024-02-22 | Foundation Medicine, Inc. | Tree-based model for selecting treatments and determining expected treatment outcomes |
CN113916218B (zh) * | 2021-10-12 | 2024-01-26 | 中国科学院微小卫星创新研究院 | 星敏感器互判和仲裁方法及系统 |
CN114708916B (zh) * | 2022-03-15 | 2023-11-10 | 至本医疗科技(上海)有限公司 | 微卫星稳定性的检测方法、检测装置、计算机设备及存储介质 |
WO2024105220A1 (en) * | 2022-11-17 | 2024-05-23 | Universite De Poitiers | Method for determining microsatellite instability status, kits and uses thereof |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050084907A1 (en) * | 2002-03-01 | 2005-04-21 | Maxygen, Inc. | Methods, systems, and software for identifying functional biomolecules |
US7991557B2 (en) | 2004-06-19 | 2011-08-02 | Genenews Corporation | Computer system and methods for constructing biological classifiers and uses thereof |
WO2009039479A1 (en) * | 2007-09-21 | 2009-03-26 | H. Lee Moffitt Cancer Center And Research Institute, Inc. | Genotypic tumor progression classifier and predictor |
US10359425B2 (en) * | 2008-09-09 | 2019-07-23 | Somalogic, Inc. | Lung cancer biomarkers and uses thereof |
BR112013003391B8 (pt) * | 2010-08-13 | 2022-10-25 | Somalogic Inc | Método para diagnosticar câncer pancreático em um indivíduo |
WO2014099979A2 (en) * | 2012-12-17 | 2014-06-26 | Virginia Tech Intellectual Properties, Inc. | Methods and compositions for identifying global microsatellite instability and for characterizing informative microsatellite loci |
US9471871B2 (en) * | 2014-02-21 | 2016-10-18 | Battelle Memorial Institute | Method of generating features optimal to a dataset and classifier |
WO2017040970A1 (en) * | 2015-09-02 | 2017-03-09 | Georgia Tech Research Corporation | Detection and treatment of early-stage ovarian cancer |
US20210032699A1 (en) * | 2016-04-06 | 2021-02-04 | University Of Florida Research Foundation, Inc. | Measurement of genomic age for predicting the risk of cancer |
JP6703264B2 (ja) * | 2016-06-22 | 2020-06-03 | 富士通株式会社 | 機械学習管理プログラム、機械学習管理方法および機械学習管理装置 |
BR112020002555A2 (pt) * | 2017-08-07 | 2020-08-11 | The Johns Hopkins University | métodos e materiais para avaliar e tratar câncer |
US10635502B2 (en) * | 2017-09-21 | 2020-04-28 | Sap Se | Scalable, multi-tenant machine learning architecture for cloud deployment |
US11315016B2 (en) * | 2017-10-16 | 2022-04-26 | Illumina, Inc. | Deep convolutional neural networks for variant classification |
WO2020081607A1 (en) * | 2018-10-15 | 2020-04-23 | Tempus Labs, Inc. | Microsatellite instability determination system and related methods |
-
2020
- 2020-04-21 KR KR1020217037385A patent/KR20220011630A/ko unknown
- 2020-04-21 WO PCT/US2020/029145 patent/WO2020219463A1/en unknown
- 2020-04-21 CN CN202080045548.1A patent/CN114026253A/zh active Pending
- 2020-04-21 AU AU2020260998A patent/AU2020260998A1/en active Pending
- 2020-04-21 EP EP20794292.1A patent/EP3959341A4/en active Pending
- 2020-04-21 MX MX2021012988A patent/MX2021012988A/es unknown
- 2020-04-21 CA CA3137720A patent/CA3137720A1/en active Pending
- 2020-04-21 JP JP2021563182A patent/JP7590344B2/ja active Active
- 2020-04-21 BR BR112021021128A patent/BR112021021128A2/pt unknown
-
2021
- 2021-10-21 IL IL287458A patent/IL287458A/en unknown
- 2021-10-22 US US17/508,322 patent/US20220189583A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
KR20220011630A (ko) | 2022-01-28 |
US20220189583A1 (en) | 2022-06-16 |
WO2020219463A1 (en) | 2020-10-29 |
CA3137720A1 (en) | 2020-10-29 |
IL287458A (en) | 2021-12-01 |
MX2021012988A (es) | 2022-03-04 |
EP3959341A1 (en) | 2022-03-02 |
AU2020260998A1 (en) | 2021-11-25 |
JP7590344B2 (ja) | 2024-11-26 |
BR112021021128A2 (pt) | 2022-02-08 |
EP3959341A4 (en) | 2023-01-18 |
CN114026253A (zh) | 2022-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200342958A1 (en) | Methods and systems for assessing inflammatory disease with deep learning | |
JP7487163B2 (ja) | がんの進化の検出および診断 | |
JP7590344B2 (ja) | マイクロサテライト解析のための方法およびシステム | |
JP7522735B2 (ja) | 祖先特異的な遺伝リスクスコア | |
JP2024016039A (ja) | 相同組換え欠損を推定するための統合された機械学習フレームワーク | |
CN113228190B (zh) | 分类和/或鉴定癌症亚型的系统和方法 | |
JP2023524627A (ja) | 核酸のメチル化分析による結腸直腸癌を検出するための方法およびシステム | |
Wang et al. | A review of cancer risk prediction models with genetic variants | |
US20240301378A1 (en) | Estimation of phenotypes using large-effect expression variants | |
Widman et al. | Ultrasensitive plasma-based monitoring of tumor burden using machine-learning-guided signal enrichment | |
Van Dyke et al. | Chromosome 5p region SNPs are associated with risk of NSCLC among women | |
JP7470787B2 (ja) | 単一試料からの腫瘍純度の推定 | |
Zhang et al. | Germline genetic variation in JAK2 as a prognostic marker in castration‐resistant prostate cancer | |
US20250014755A1 (en) | Systems and methods for disease assessments | |
US20240254243A1 (en) | Systems and methods for improved targeted therapy | |
Sirisena et al. | Implementation of genomic medicine in Sri Lanka: initial experience and challenges | |
US20220301654A1 (en) | Systems and methods for predicting and monitoring treatment response from cell-free nucleic acids | |
CN113160895A (zh) | 一种结直肠癌风险评估模型及系统 | |
Ren et al. | Clonal architectures predict clinical outcome in gastric adenocarcinoma based on genomic variation, tumor evolution, and heterogeneity | |
US20240395384A1 (en) | Patient centric precision model for anti-tnf therapy | |
US20230230655A1 (en) | Methods and systems for assessing fibrotic disease with deep learning | |
US20220284984A1 (en) | Somatic variant calling from an unmatched biological sample | |
TW202331734A (zh) | 甲基化生物標記選擇裝置及方法 | |
Akbarzadeh et al. | The Role of Different Linkage Disequilibrium Patterns in Genomic Prediction: The gBULP Based Exploratory Method in Tehran Cardiometabolic Genetic Study | |
WO2024118650A2 (en) | Pharmacokinetic modeling systems for improved therapeutic dosing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230419 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240329 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240701 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241015 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241114 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7590344 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |