JP7387777B2 - ヌクレオチド配列決定データの2次分析のためのシステムおよび方法 - Google Patents
ヌクレオチド配列決定データの2次分析のためのシステムおよび方法 Download PDFInfo
- Publication number
- JP7387777B2 JP7387777B2 JP2022025557A JP2022025557A JP7387777B2 JP 7387777 B2 JP7387777 B2 JP 7387777B2 JP 2022025557 A JP2022025557 A JP 2022025557A JP 2022025557 A JP2022025557 A JP 2022025557A JP 7387777 B2 JP7387777 B2 JP 7387777B2
- Authority
- JP
- Japan
- Prior art keywords
- nucleotide subsequence
- nucleotide
- reference sequence
- sequencing
- subsequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 125000003729 nucleotide group Chemical group 0.000 title claims description 173
- 238000012163 sequencing technique Methods 0.000 title claims description 165
- 239000002773 nucleotide Substances 0.000 title claims description 156
- 238000000034 method Methods 0.000 title claims description 153
- 238000004458 analytical method Methods 0.000 title claims description 76
- 238000012545 processing Methods 0.000 claims description 89
- 239000002157 polynucleotide Substances 0.000 claims description 54
- 230000008569 process Effects 0.000 claims description 46
- 102000040430 polynucleotide Human genes 0.000 claims description 44
- 108091033319 polynucleotide Proteins 0.000 claims description 44
- 238000011156 evaluation Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000011282 treatment Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 3
- 239000007850 fluorescent dye Substances 0.000 description 36
- 210000004027 cell Anatomy 0.000 description 34
- 238000002073 fluorescence micrograph Methods 0.000 description 22
- 230000003287 optical effect Effects 0.000 description 22
- 102000053602 DNA Human genes 0.000 description 14
- 108020004414 DNA Proteins 0.000 description 14
- 238000004891 communication Methods 0.000 description 11
- 239000012634 fragment Substances 0.000 description 10
- 239000000523 sample Substances 0.000 description 10
- 239000003153 chemical reaction reagent Substances 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000002864 sequence alignment Methods 0.000 description 6
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 5
- RGWHQCVHVJXOKC-SHYZEUOFSA-N dCTP Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO[P@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-N 0.000 description 5
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 5
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 102000039446 nucleic acids Human genes 0.000 description 5
- 108020004707 nucleic acids Proteins 0.000 description 5
- 150000007523 nucleic acids Chemical class 0.000 description 5
- 238000003384 imaging method Methods 0.000 description 4
- 101000829958 Homo sapiens N-acetyllactosaminide beta-1,6-N-acetylglucosaminyl-transferase Proteins 0.000 description 3
- 102100023315 N-acetyllactosaminide beta-1,6-N-acetylglucosaminyl-transferase Human genes 0.000 description 3
- 238000012300 Sequence Analysis Methods 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000001717 pathogenic effect Effects 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- XYFCBTPGUUZFHI-UHFFFAOYSA-N Phosphine Chemical compound P XYFCBTPGUUZFHI-UHFFFAOYSA-N 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 125000003545 alkoxy group Chemical group 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000008711 chromosomal rearrangement Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 238000010223 real-time analysis Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 102220573043 RNA polymerase II subunit A C-terminal domain phosphatase_A2R_mutation Human genes 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 150000001540 azides Chemical class 0.000 description 1
- 125000000852 azido group Chemical group *N=[N+]=[N-] 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000002798 bone marrow cell Anatomy 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000000295 emission spectrum Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- -1 nucleotide triphosphates Chemical class 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 229910000073 phosphorus hydride Inorganic materials 0.000 description 1
- 210000004910 pleural fluid Anatomy 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 102220281779 rs1555594471 Human genes 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000002922 simulated annealing Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 238000005309 stochastic process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/20—Sequence assembly
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/30—Unsupervised data analysis
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Analytical Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Data Mining & Analysis (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioethics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Description
本願は、2016年10月7日に出芽された米国仮出願番号第62/405824号に基づく優先権を主張しており;その内容は、その全体が参考として本明細書中に援用される。
分野
本開示は、一般に、DNA配列決定の分野に関し、より詳細には、次世代配列決定適用のためにリアルタイム二次分析を行うためのシステムおよび方法に関する。
遺伝子変異は、配列リードにおいて-参照配列に対して-バリアントを識別することによって識別され得る。バリアントを識別するために、被験体に由来するサンプルは、配列リードを得るために、配列決定機器を使用して完全に配列決定され得る。配列リードを得た後、その配列リードは、バリアント呼び出しの前にアセンブルまたは整列され得る。従って、バリアントを識別する工程は、連続して行われかつ配列決定プロセスの完了後に行うために時間を浪費し得る別個の工程を包含する。
本明細書で開示されるのは、ポリヌクレオチドを配列決定するためのシステムおよび方法である。一実施形態において、上記システムは、以下を含む:参照ヌクレオチド配列を含むメモリ;プロセッサであって、以下の工程:リードの第1のヌクレオチド部分配列を配列決定システムから受け取る工程;上記参照配列上での上記リードの第1の複数の候補位置を決定するために、上記第1のヌクレオチド部分配列を第1のアラインメントパスを使用して処理する工程;上記第1のヌクレオチド部分配列が、上記決定された候補位置に基づいて上記参照配列に整列するか否かを決定する工程;第2のヌクレオチド部分配列を上記配列決定システムから受け取る工程;上記参照配列に整列する上記リードの第2の複数の候補位置を決定するために、上記第2のヌクレオチド部分配列を処理する工程であって、上記リードが上記参照配列に整列する場合には、第2のアラインメントパス、およびそうでなければ、第1のアラインメントパスを使用し、ここで上記第2のアラインメントパスは、上記リードの上記第2の複数の候補位置を決定するために、上記第1のアラインメントパスより計算上効率的である工程を包含する方法を行う命令を実行するように構成されたプロセッサ。
特定の実施形態において、例えば、以下が提供される:
(項目1)
ポリヌクレオチドを配列決定するためのシステムであって:
参照ヌクレオチド配列を含むメモリ;
プロセッサであって、以下の工程:
リードの第1のヌクレオチド部分配列を配列決定システムから受け取る工程;
該参照配列上での該リードの第1の複数の候補位置を決定するために、該第1のヌクレオチド部分配列を、第1のアラインメントパスを使用して処理する工程;
該第1のヌクレオチド部分配列が、該決定された候補位置に基づいて該参照配列に整列するか否かを決定する工程;
第2のヌクレオチド部分配列を該配列決定システムから受け取る工程;
該参照配列に整列する該リードの第2の複数の候補位置を決定するために、該第2のヌクレオチド部分配列を処理する工程であって、
該リードが該参照配列に整列される場合には、第2のアラインメントパス、そして
そうでなければ、第1のアラインメントパスを使用し、ここで該第2のアラインメントパスは、該リードの該第2の複数の候補位置を決定するために、該第1のアラインメントパスより計算上効率的である、工程、を包含する方法を行う命令を実行するように構成されたプロセッサ、を含むシステム。
(項目2)
前記第2のヌクレオチド部分配列は、アラインメント品質評価基準に基づいて、前記第1のアラインメントパスまたは前記第2のアラインメントパスを使用して処理される、項目1に記載のシステム。
(項目3)
前記第1のヌクレオチド部分配列は、長さが1またはこれより多くのヌクレオチドである、項目1に記載のシステム。
(項目4)
前記第2のヌクレオチド部分配列は、長さが1またはこれより多くのヌクレオチドである、項目1に記載のシステム。
(項目5)
前記第2のアラインメントパスは、メモリ使用量またはコンピューテーションオペレーションの回数において、前記第1のアラインメントパスより計算上効率的である、項目1に記載のシステム。
(項目6)
前記プロセッサは、前記第1のヌクレオチド部分配列が前記参照配列に整列される場合に、前記第1の複数の候補位置のうちの少なくとも1つに相当するデータを保存するようにさらに構成される、項目1に記載のシステム。
(項目7)
前記プロセッサは、前記リードが前記参照配列に整列したままである場合に、前記第2の複数の候補位置のうちの少なくとも1つに相当するデータを保存するようにさらに構成される、項目6に記載のシステム。
(項目8)
前記第2のヌクレオチド部分配列を、前記第2のアラインメントパスを使用して処理する工程は、単純アラインメントスコアを決定するために、単純アラインメントを行うことを包含する、項目1に記載のシステム。
(項目9)
前記単純アラインメントを行うことは、前記第1の複数の候補位置に基づいて、前記第2のヌクレオチド部分配列と前記参照配列上の該第2のヌクレオチド部分配列の相当する配列とを比較することを包含する、項目8に記載のシステム。
(項目10)
前記第2のヌクレオチド部分配列を、第2のプロセシングパスを使用して処理する工程は、前記リードの前記第2の複数の候補位置の各々についてマッピング品質(MapQ)スコアを決定する工程をさらに包含する、項目8に記載のシステム。
(項目11)
前記単純アラインメントスコアは、前記MapQスコアを含む、項目10に記載のシステム。
(項目12)
前記プロセッサは、前記第1の複数の候補位置のうちの少なくとも1つまたは前記第2の複数の候補位置のうちの少なくとも1つを含む前記第1のまたは第2のアラインメントパスの出力に対してバリアント呼び出しを行うようにさらに構成される、項目1に記載のシステム。
(項目13)
前記第1のまたは第2のアラインメントパスの出力に対して前記バリアント呼び出しを行う工程は、
該第1のまたは第2のアラインメントパスの出力に対して、第1のバリアント呼び出しパスまたは第2のバリアント呼び出しパスを使用してバリアント呼び出しを行うことであって、ここで該第2のバリアント呼び出しパスは、前記第2の部分配列のバリアント呼び出しにおいて、該第1のバリアント呼び出しパスより計算上効率的であることを包含する、項目12に記載のシステム。
(項目14)
前記バリアント呼び出しは、バリアント呼び出し評価基準に基づいて、前記第1のまたは第2のアラインメントパスの出力を使用して行われる、項目12に記載のシステム。
(項目15)
前記バリアント呼び出し評価基準は、前記参照配列の位置において呼び出される多くの異なる塩基タイプに基づいて決定される、項目14に記載のシステム。
(項目16)
前記第1のヌクレオチド部分配列を処理する工程は、前記配列決定システムが、配列決定実行の間に前記第2のヌクレオチド部分配列を決定する前に完了する、項目1に記載のシステム。
(項目17)
前記配列決定システムは、逐次合成配列決定を行う方法を実行して、前記第1の部分配
列を決定する、項目1に記載のシステム。
(項目18)
ポリヌクレオチドを配列決定するための方法であって、該方法は、
配列決定実行の間に、リードの第1のヌクレオチド部分配列を、配列決定システムから受け取る工程;および
該リードの該第1のヌクレオチド部分配列の二次分析を、第1の分析パスまたは第2の分析パスを使用して参照配列に基づいて行う工程であって、ここで該第2の分析パスは、該二次分析を行うにあたって前記第1のプロセシングパスより計算上効率的である工程、を包含する方法。
(項目19)
前記二次分析を行う工程は、前記参照配列に整列する前記リードの第1の複数の候補位置を決定するために、前記第1のヌクレオチド部分配列を処理することであって:
該リードが該参照配列に整列されない場合には、第1のアラインメントパス、そして
そうでなければ、第2のアラインメントパスを使用し、ここで該第2のアラインメントパスは、該リードの該第1の複数の候補位置を決定するために、該第1のアラインメントパスより計算上効率的であること、を包含する、項目18に記載の方法。
(項目20)
前記第2のヌクレオチド部分配列を、前記第2のアラインメントパスを使用して処理することは、単純アラインメントスコアを決定するために、単純アラインメントを行うことを包含する、項目19に記載の方法。
(項目21)
前記二次分析の結果は、前記第1のアラインメントパスの出力、前記第2のアラインメントパスの出力、またはこれらのうちの任意の組み合わせを含む、項目19に記載の方法。
(項目22)
前記二次分析を行う工程は、以下:
第1のまたは第2のアラインメントパスの出力に対して、第1のバリアント呼び出しパスまたは第2のバリアント呼び出しパスを使用してバリアント呼び出しを行うことであって、ここで該第2のバリアント呼び出しパスは、前記第1の部分配列のバリアント呼び出しにおいて該第1のバリアント呼び出しパスより計算上効率的であること、を含む前記第1のヌクレオチド部分配列のバリアント呼び出しを行うことを包含する、項目18に記載の方法。
(項目23)
前記二次分析の結果は、前記第1のバリアント呼び出しパスの出力、前記第2のバリアント呼び出しパスの出力、またはこれらのうちのいずれかの組み合わせを含む、項目22に記載の方法。
(項目24)
前記配列決定実行の間に前記二次分析の結果をユーザーに提供する工程をさらに包含する、項目18に記載の方法。
(項目25)
前記二次分析の結果は、固定された区間で前記ユーザーに提供される、項目24に記載の方法。
(項目26)
前記二次分析の結果は、前記ユーザーの要求に応じて、該ユーザーに提供される、項目24に記載の方法。
(項目27)
前記二次分析を行う工程は、前記リードの前記第1のヌクレオチド部分配列の二次分析を、前記配列決定実行の先の配列決定区間からの結果に基づいて行うことを包含する、項目18に記載の方法。
以下の詳細な説明において、添付の図面に対して参照が行われる。添付の図面は、本明細書の一部を形成する。図面において、類似記号は、状況が別段規定しなければ、代表的には類似の構成要素を識別する。詳細な説明、図面、および特許請求の範囲において記載される例証的実施形態は、限定することを意味しない。他の実施形態が利用され得、本明細書に示される主題の趣旨または範囲から逸脱することなく他の変更が行われ得る。本開示の局面が、本明細書で一般的に記載されかつ図面の中で図示されるように、広く種々の異なる構成で取り合わせられ得、置き換えられ得、組み合わされ得、分離され得、そして設計され得、これらの全てが、本明細書中で明示的に企図されることは、容易に理解される。
別段定義されなければ、本明細書で使用される技術用語および科学用語は、本開示が属する分野の当業者によって一般的に理解されるものと同じ意味を有する。例えば、Singletonら, Dictionary of Microbiology and Molecular Biology 第2版, J. Wiley & Sons(New York, NY 1994);Sambrookら, Molecular Cloning, A Laboratory Manual, Cold Springs Harbor Press(Cold Springs Harbor, NY 1989)を参照のこと。本開示の目的のために、以下の用語が以下で定義される。
本明細書で開示されるのは、時間および/またはコンピューティング資源効率的様式において、二次分析を反復して行うためのシステムおよび方法である、二次分析は、参照配列(例えば、ヒト参照ゲノム配列)への配列リードのアラインメントおよびサンプルと参照との間の差異を検出するためのこのアラインメントの利用の両方を包含し得る。二次分析は、遺伝的差異の検出、バリアント検出および遺伝子決定、一塩基多型(SNPs)、小さな挿入および欠失(インデル)、ならびにDNAにおける構造的変化(例えば、コピー数バリアント(CNVs)および染色体再配置)の識別を可能にし得る。二次分析は、配列決定データが次の配列決定サイクルのために生成されている最中に、1つの配列決定サイクルに関して行われ得る。
配列決定システム100のコンピューターシステム106は、上記で考察されるように、光学システム102および流体システム104を制御するように構成され得る。コンピューターシステム106に関しては多くの構成が可能であるが、一実施形態は、図2に図示される。図2に示されるように、コンピューターシステム106は、メモリ204、記憶装置206、および通信インターフェース208と電子的に通信状態にあるプロセッサ202を含み得る。一実施形態において、コンピューターシステム106は、配列アラインメントを行い、バリアント呼び出しを生成するために、フィールドプログラマブルゲートアレイ(FPGA)、グラフィクス処理ユニット(GPU)、および/またはベクトル中央演算処理装置(CPU)を含む。
図3は、配列決定システム100を利用して逐次合成配列決定を行うための例示的方法300のフローチャートである。方法300がブロック305で開始した後、フラグメント化二本鎖ポリヌクレオチドフラグメントを含むフローセル114は、ブロック310で受け取られる。そのフラグメント化二本鎖ポリヌクレオチドフラグメントは、デオキシリボ核酸(DNA)サンプルから生成され得る。そのDNAサンプルは、種々の供給源、例えば、生物学的サンプル、細胞サンプル、環境サンプル、またはこれらのうちのいずれかの組み合わせに由来し得る。DNAサンプルは、患者に由来する生物学的流体、組織、および細胞のうちの1またはこれより多くを含み得る。例えば、そのDNAサンプルは、血液、尿、脳脊髄液、胸膜液、羊水、精液、唾液、骨髄、生検サンプル、またはこれらのうちのいずれかの組み合わせから採取され得るか、またはこれらを含み得る。
塩基呼び出しは、グアニン(G)、チミン(T)、シトシン(C)、またはアデニン(A)であると配列決定されている最中の、成長中のプライマー-ポリヌクレオチドのクラスターへと組み込まれたヌクレオチドの塩基を決定するプロセスをいい得る。図4は、配列決定システム100を利用して、塩基呼び出しを行うための例示的方法400のフローチャートである。図3で図示されるブロック335において検出されたシグナルを処理する工程は、方法400の塩基呼び出しを行う工程を包含し得る。ブロック405において開始した後、所定の波長の光が、レーザーを使用して生成され得る。その生成された光は、ブロック410においてヌクレオチドアナログ上で光り得る。例えば、コンピューターシステム106は、その光学システムインターフェース212および通信チャネル108aを通じて、レーザー120に所定の波長にある光を生成させ得る。
本明細書で記載される方法は、種々の核酸配列決定技術とともに使用され得る。特に適用可能な技術は、核酸がアレイの中の固定された位置に付着され、その結果、それらの相対的な位置が変化せず、そしてそのアレイが反復して画像化されるものである。画像が異なるカラーチャネルにおいて、例えば、一方のヌクレオチド塩基タイプを別のものから区別するために使用される異なる標識が同時に存在して得られる実施形態は、特に適用可能である。いくつかの実施形態において、標的核酸のヌクレオチド配列を決定するプロセスは、自動化プロセスであり得る。好ましい実施形態としては、逐次合成配列決定を行う(「SBS」)技術が挙げられる。
図5Aおよび図5Bは、一実施形態に従う例示的な反復アラインメントおよびバリアント呼び出しプロセスを示す。ある数の最小限の配列決定サイクルを画像化した後、リアルタイム一次分析が、各整列されていないリードに関する塩基呼び出しおよび品質スコアを決定するために行われ得る。図5Aにおいて、示される最小限の数の配列決定サイクルは、3である。いくつかの実施形態において、最小限の配列決定サイクルは、16、32、またはこれより多くのサイクルであり得る。塩基呼び出しおよび品質スコア決定は、図3を参照して上記で例証される。各リードは、最も可能性の高いアラインメントが選択された状態で参照配列に整列され得、次いで、そのリードは、積み重ねられて、バリアント呼び出しが行われ得る。
図6は、リアルタイム二次配列分析を行うための例示的方法600のフローチャートである。方法600がブロック605で開始した後、配列決定サイクルの画像化データは、ブロック610において受け取られ得る。例えば、コンピューターシステム106は、その画像化データを検出器126から受け取り得る。ブロック615において、塩基が決定され得、その塩基の品質スコアが決定され得る。画像化データを生成し、塩基を決定し、その決定された塩基の品質を決定する工程は、図3~4を参照しながら上記で例証される。各配列決定サイクルの後に、配列決定リードの長さは、1ヌクレオチド長くなり得る。例えば、31回目の配列決定サイクルの後に、その配列決定リードは、長さが31ヌクレオチドであり、32回目の配列決定サイクルの後に、その配列決定リードは、長さが1ヌクレオチド長くなって、32ヌクレオチドになる。
さらなる実施形態は、配列決定リードの反復処理を含む二次分析のためのシステムおよび方法である。二次分析は、参照配列(例えば、ヒト参照ゲノム配列)への配列リードのアラインメントおよびサンプルと参照との間の差異を検出するためのこのアラインメントの利用(例えば、バリアント検出および呼び出し)の両方を包含し得る。1つの実行において、アラインメントおよびバリアント呼び出し結果は、配列決定機が実行を終了する前に得られ得る。例えば、これらの結果は、利用可能なコンピューティング資源に依存する時間区間で提供され得る。これは、前の反復からの中間アラインメント結果を、現在の反復からのアラインメント結果で拡張することによって達成され得る。その現在の反復からのアラインメント結果は、現在の反復の新たに配列決定された塩基と、以前に整列された位置における参照配列からの塩基とを比較することによって生成される。その比較の結果は、前の反復からのアラインメント結果と合わせられ、その合わされた出力は、次の反復のために保存される。
図9Aは、リアルタイム二次分析を行うための例示的方法900のフローチャートである。方法900は、2つのパスを含む:旧来の二次分析法の低信頼度・高コンピューテーションプロセシングパスおよび本開示の一実施形態に従う高信頼度・低コンピューテーションプロセシングパス。低信頼度・高プロセシングパスおよび高信頼度・低プロセシングパスは、それぞれ、青色のパスおよび黄色のパスとして本明細書で言及される。
図11Aおよび図11Bは、既存のバリアント呼び出し法、Strelkaスモールバリアント呼び出し側(図11A)、および本開示のバリアント呼び出し法(図11B)の単純化したフロー図を示す。図11Aは、スモールバリアント呼び出し側が、入力としてアライナーから生成された積み重ね情報を使用することを示す。積み重ねから、スモールバリアント呼び出し側は、アクティブ領域として公知の配列バリエーションの領域を識別する。次に、デノボリアセンブリは、そのアクティブ領域に適用され得る。各ゲノム位置において、ゲノム位置における配列決定されたポリヌクレオチドが、A、C、T、またはGである可能性を決定するために、確率が生成される。これらの確率から、バリアントが検出され得る。
Claims (27)
- ポリヌクレオチドを配列決定するためのシステムであって、
ポリヌクレオチドのヌクレオチド配列を決定するように構成された配列決定装置と、
前記配列決定装置を制御し、かつ以下を含む方法を行う命令を実行するように構成されたプロセッサであって、前記方法が、
前記ポリヌクレオチドの第1のヌクレオチド部分配列を受け取る工程と、
前記第1のヌクレオチド部分配列が、第1の信頼度で参照配列に整列するかどうかを決定する工程であって、前記第1の信頼度は、前記第1のヌクレオチド部分配列と前記参照配列との間のミスマッチの数、または前記第1のヌクレオチド部分配列と前記参照配列との間の正確なマッチの確率によって決定される、工程と、
前記配列決定装置から前記ポリヌクレオチドの第2のヌクレオチド部分配列を受け取る工程であって、前記第2のヌクレオチド部分配列が、前記第1のヌクレオチド部分配列に加えて、1つまたは複数の追加のヌクレオチドを含む、工程と、
前記第1のヌクレオチド部分配列が、前記第1の信頼度で前記参照配列に整列する場合に、前記第2のヌクレオチド部分配列中の前記1つまたは複数の追加のヌクレオチドを、前記参照配列と比較する工程、または
前記第1のヌクレオチド部分配列が、前記第1の信頼度で前記参照配列に整列していない場合に、前記第2のヌクレオチド部分配列の全体が、前記参照配列に整列しているかどうかを決定する工程と
を含む、プロセッサと
を含む、システム。 - 前記第1のヌクレオチド部分配列は、長さが1つまたは複数のヌクレオチドである、請求項1に記載のシステム。
- 前記第2のヌクレオチド部分配列は、長さが1つまたは複数のヌクレオチドである、請求項1記載のシステム。
- 前記第2のヌクレオチド部分配列中の前記1つまたは複数の追加のヌクレオチドを、前記参照配列と比較する工程は、単純アラインメントプロセスを含み、前記単純アラインメントプロセスは、前記第1のヌクレオチド部分配列の全体を前記参照配列に整列させるのに用いられるプロセスよりも、メモリ使用量またはコンピューテーションオペレーションの回数において計算上効率的である、請求項1記載のシステム。
- 前記プロセッサは、前記第1のヌクレオチド部分配列と前記参照配列との比較から得られる第1の複数の候補位置のうちの少なくとも1つに相当するデータを保存するようにさらに構成される、請求項1に記載のシステム。
- 前記プロセッサは、前記第2のヌクレオチド部分配列と前記参照配列との比較から得られる第2の複数の候補位置のうちの少なくとも1つに相当するデータを保存するようにさらに構成される、請求項1に記載のシステム。
- 前記プロセッサは、前記単純アライメントプロセスに基づいて、MapQスコアを決定するようにさらに構成される、請求項4に記載のシステム。
- 前記第2のヌクレオチド部分配列中の前記1つまたは複数の追加のヌクレオチドを、前記参照配列と比較する工程は、前記第1の複数の候補位置に基づいて、前記第2のヌクレオチド部分配列を、前記参照配列上の前記第2のヌクレオチド部分配列の相当する配列と比較することを含む、請求項5に記載のシステム。
- 前記プロセッサは、前記第2の複数の候補位置の各々についてマッピング品質(MapQ)スコアを決定するようにさらに構成される、請求項6に記載のシステム。
- 前記第1のヌクレオチド部分配列が前記参照配列と整列するかどうかの決定が、配列決定反応が完了する前に開始される、請求項1に記載のシステム。
- 前記プロセッサは、前記第1のヌクレオチド部分配列または前記第2のヌクレオチド部分配列に対してバリアントコールを行うようにさらに構成される、請求項1に記載のシステム。
- 前記バリアントコールを実行することは、
第1のバリアントコールプロセスまたは第2のバリアントコールプロセスを用いてバリアントコールを行う工程であって、前記第2のバリアントコールプロセスは、信頼度の閾値に基づいて確率の生成ステップをスキップし、前記第2のバリアントコールプロセスは、前記第2のヌクレオチド部分配列のバリアントコールにおいて、前記第1のバリアントコールプロセスよりも計算上効率的である、工程を含む、請求項11に記載のシステム。 - 前記バリアントコールは、バリアントコール評価基準に基づいて、前記第1のヌクレオチド部分配列と前記参照配列との整列に用いられるプロセス、または前記第2のヌクレオチド部分配列中の前記1つまたは複数の追加のヌクレオチドと前記参照配列との比較に用いられるプロセスの出力を用いて行われる、請求項11に記載のシステム。
- バリアントコール評価基準は、前記参照配列の位置において整列した全塩基の割合に基づいて決定される、請求項13に記載のシステム。
- 前記第2のヌクレオチド部分配列の処理は、配列決定反応が完了する前に開始される、請求項1に記載のシステム。
- 前記配列決定装置が、逐次合成配列決定を行う、請求項1記載のシステム。
- ヌクレオチド部分配列を有するポリヌクレオチドの配列を決定するための、コンピュータに実装された方法であって、
配列決定実行の間に、リードの第1のヌクレオチド部分配列および第2のヌクレオチド部分配列を、配列決定装置から受け取る工程であって、前記第2のヌクレオチド部分配列が、前記第1のヌクレオチド部分配列に加えて、1つまたは複数の追加のヌクレオチドを含む、工程と、
第1の処理または第2の処理を用いて、参照配列に基づいて前記リードの前記第1のヌクレオチド部分配列および前記第2のヌクレオチド部分配列の二次分析を行う工程であって、前記第2の処理は、前記第2のヌクレオチド部分配列中の前記1つまたは複数の追加のヌクレオチドを前記参照配列に整列させることにより、前記第2のヌクレオチド部分配列と前記参照配列との間のバリアントを決定し、かつ前記二次分析を行うにあたって、前記第1のヌクレオチド部分配列の全体が前記参照配列に整列される前記第1の処理よりも計算上効率的であり、かつ前記二次分析は、
前記第1のヌクレオチド部分配列と前記参照配列とを比較して、前記参照配列に整列される前記第1のヌクレオチド部分配列の位置を決定する工程と、
前記配列決定装置が追加のヌクレオチドリードを生成すべきかどうかを決定する工程と
を含む、工程と
を含み、前記二次分析を行う工程が、前記参照配列に整列する前記リードの第1の複数の候補位置を決定するために、第1の信頼度に基づいて前記第1のヌクレオチド部分配列を処理することであって、
前記第1のヌクレオチド部分配列が前記第1の信頼度で前記参照配列に整列されない場合には、前記第1の処理、
それ以外の場合には、前記第2の処理
を使用し、前記第2の処理は、前記リードの前記第1の複数の候補位置を決定するために、前記第1の処理よりも計算上効率的であり、
前記第1の信頼度は、前記第1のヌクレオチド部分配列と前記参照配列との間のミスマッチの数、または前記第1のヌクレオチド部分配列と前記参照配列との間の正確なマッチの確率によって決定される、方法。 - 前記第2の処理を用いて前記第1のヌクレオチド部分配列を処理することが、MapQスコアを決定するために単純アラインメントを行うことを含む、請求項17に記載の方法。
- 前記二次分析の結果が、前記第1の処理の出力、前記第2の処理の出力、またはそれらの任意の組み合わせを含む、請求項17に記載の方法。
- 前記二次分析を行う工程が、
第1のバリアントコールプロセスまたは第2のバリアントコールプロセスを用いて、前記第1の処理または前記第2の処理の出力に対して、バリアントコールを行う工程であって、前記第2のバリアントコールプロセスは、信頼度の閾値に基づいて確率の生成ステップをスキップし、前記第2のバリアントコールプロセスが、前記第1のヌクレオチド部分配列のバリアントコールにおいて、前記第1のバリアントコールプロセスよりも計算上効率的である、工程
を含む、前記第1のヌクレオチド部分配列のバリアントコールを行うことを含む、請求項17に記載の方法。 - 前記二次分析の結果が、第1のバリアントコールプロセスの出力、第2のバリアントコールプロセスの出力、またはそれらの任意の組み合わせを含む、請求項20に記載の方法。
- 前記配列決定実行の間に、前記二次分析の結果をユーザーに提供する工程をさらに含む、請求項17に記載の方法。
- 前記二次分析の結果は、固定された区間で前記ユーザーに提供される、請求項22に記載の方法。
- 前記二次分析の結果は、前記ユーザーの要求に応じて、前記ユーザーに提供される、請求項22に記載の方法。
- 前記二次分析を行う工程は、前記配列決定実行の前の配列決定区間からの結果に基づいて、前記リードの前記第1のヌクレオチド部分配列の二次分析を行うことを含む、請求項17に記載の方法。
- 請求項17~25のいずれかに記載の方法をコンピュータに実行させるプログラムを記録したコンピュータ読取可能な記録媒体。
- 請求項1~16のいずれかに記載のシステムの機能をコンピュータに実現させるプログラムを記録したコンピュータ読取可能な記録媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662405824P | 2016-10-07 | 2016-10-07 | |
US62/405,824 | 2016-10-07 | ||
JP2020091991A JP7051937B2 (ja) | 2016-10-07 | 2020-05-27 | ヌクレオチド配列決定データの2次分析のためのシステムおよび方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020091991A Division JP7051937B2 (ja) | 2016-10-07 | 2020-05-27 | ヌクレオチド配列決定データの2次分析のためのシステムおよび方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022060425A JP2022060425A (ja) | 2022-04-14 |
JP7387777B2 true JP7387777B2 (ja) | 2023-11-28 |
Family
ID=60480359
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019519631A Active JP6898441B2 (ja) | 2016-10-07 | 2017-10-06 | ヌクレオチド配列決定データの2次分析のためのシステムおよび方法 |
JP2020091991A Active JP7051937B2 (ja) | 2016-10-07 | 2020-05-27 | ヌクレオチド配列決定データの2次分析のためのシステムおよび方法 |
JP2022025557A Active JP7387777B2 (ja) | 2016-10-07 | 2022-02-22 | ヌクレオチド配列決定データの2次分析のためのシステムおよび方法 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019519631A Active JP6898441B2 (ja) | 2016-10-07 | 2017-10-06 | ヌクレオチド配列決定データの2次分析のためのシステムおよび方法 |
JP2020091991A Active JP7051937B2 (ja) | 2016-10-07 | 2020-05-27 | ヌクレオチド配列決定データの2次分析のためのシステムおよび方法 |
Country Status (15)
Country | Link |
---|---|
US (2) | US11646102B2 (ja) |
EP (1) | EP3458993A1 (ja) |
JP (3) | JP6898441B2 (ja) |
KR (3) | KR102694651B1 (ja) |
CN (2) | CN115810396A (ja) |
AU (3) | AU2017341069A1 (ja) |
BR (1) | BR122023004154A2 (ja) |
CA (1) | CA3027179C (ja) |
IL (2) | IL300135B2 (ja) |
MX (2) | MX2018015412A (ja) |
MY (1) | MY193917A (ja) |
RU (1) | RU2741807C2 (ja) |
SG (2) | SG10201911912XA (ja) |
WO (1) | WO2018068014A1 (ja) |
ZA (2) | ZA201808277B (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3907297A1 (en) | 2011-04-15 | 2021-11-10 | The Johns Hopkins University | Safe sequencing system |
PL2912468T3 (pl) | 2012-10-29 | 2019-04-30 | Univ Johns Hopkins | Test papanicolaou pod kątem raka jajnika i endometrium |
US11286531B2 (en) | 2015-08-11 | 2022-03-29 | The Johns Hopkins University | Assaying ovarian cyst fluid |
CA3046660A1 (en) * | 2016-12-15 | 2018-06-21 | Illumina, Inc. | Methods and systems for determining paralogs |
CN111868260A (zh) | 2017-08-07 | 2020-10-30 | 约翰斯霍普金斯大学 | 用于评估和治疗癌症的方法和材料 |
US11210554B2 (en) | 2019-03-21 | 2021-12-28 | Illumina, Inc. | Artificial intelligence-based generation of sequencing metadata |
KR20220011055A (ko) | 2019-05-24 | 2022-01-27 | 일루미나, 인코포레이티드 | 해시 테이블 게놈 매핑을 위한 플렉시블 시드 확장 |
KR102292599B1 (ko) * | 2019-11-06 | 2021-08-23 | 주식회사 뷰웍스 | 광학 분석 장치 및 광학 분석 방법 |
IL294741A (en) * | 2020-03-11 | 2022-09-01 | Illumina Inc | Cumulative secondary analysis of nucleic acid sequences |
CN113436683B (zh) * | 2020-03-23 | 2024-08-16 | 北京合生基因科技有限公司 | 筛选候选插入片段的方法和系统 |
AU2022202798A1 (en) * | 2021-05-26 | 2022-12-15 | Genieus Genomics Pty Ltd | Processing sequencing data relating to amyotrophic lateral sclerosis |
CN113299344A (zh) * | 2021-06-23 | 2021-08-24 | 深圳华大医学检验实验室 | 基因测序分析方法、装置、存储介质和计算机设备 |
WO2024081805A1 (en) * | 2022-10-13 | 2024-04-18 | Element Biosciences, Inc. | Separating sequencing data in parallel with a sequencing run in next generation sequencing data analysis |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110270533A1 (en) | 2010-04-30 | 2011-11-03 | Life Technologies Corporation | Systems and methods for analyzing nucleic acid sequences |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2357263A1 (en) | 2001-09-07 | 2003-03-07 | Bioinformatics Solutions Inc. | New methods for faster and more sensitive homology search in dna sequences |
US7575865B2 (en) * | 2003-01-29 | 2009-08-18 | 454 Life Sciences Corporation | Methods of amplifying and sequencing nucleic acids |
CN101137991A (zh) * | 2005-02-11 | 2008-03-05 | 智明基因有限责任公司 | 验证dna测序数据的计算机实施的方法和基于计算机的系统 |
US20120203792A1 (en) | 2011-02-01 | 2012-08-09 | Life Technologies Corporation | Systems and methods for mapping sequence reads |
WO2013052907A2 (en) * | 2011-10-06 | 2013-04-11 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US10424394B2 (en) * | 2011-10-06 | 2019-09-24 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
KR101394339B1 (ko) * | 2012-03-06 | 2014-05-13 | 삼성에스디에스 주식회사 | 시드의 길이를 고려한 염기 서열 처리 시스템 및 방법 |
US10504613B2 (en) * | 2012-12-20 | 2019-12-10 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
KR101481457B1 (ko) * | 2012-10-29 | 2015-01-12 | 삼성에스디에스 주식회사 | 리드 전체를 고려한 염기 서열 정렬 시스템 및 방법 |
US20140238250A1 (en) | 2013-02-28 | 2014-08-28 | Wki Holding Company, Inc. | Microwavable Heating Element and Composition |
WO2014152990A1 (en) * | 2013-03-14 | 2014-09-25 | University Of Rochester | System and method for detecting population variation from nucleic acid sequencing data |
US10191929B2 (en) | 2013-05-29 | 2019-01-29 | Noblis, Inc. | Systems and methods for SNP analysis and genome sequencing |
RU2539038C1 (ru) * | 2013-11-02 | 2015-01-10 | Общество с ограниченной ответственностью "Гамма" | Способ секвенирования днк и устройство для его осуществления (варианты) |
CN104462211B (zh) * | 2014-11-04 | 2018-01-02 | 北京诺禾致源科技股份有限公司 | 重测序数据的处理方法和处理装置 |
-
2017
- 2017-10-06 CN CN202211557451.6A patent/CN115810396A/zh active Pending
- 2017-10-06 MY MYPI2018002632A patent/MY193917A/en unknown
- 2017-10-06 IL IL300135A patent/IL300135B2/en unknown
- 2017-10-06 BR BR122023004154-2A patent/BR122023004154A2/pt unknown
- 2017-10-06 SG SG10201911912XA patent/SG10201911912XA/en unknown
- 2017-10-06 JP JP2019519631A patent/JP6898441B2/ja active Active
- 2017-10-06 RU RU2018143972A patent/RU2741807C2/ru active
- 2017-10-06 IL IL263512A patent/IL263512B2/en unknown
- 2017-10-06 CN CN201780040788.0A patent/CN109416927B/zh active Active
- 2017-10-06 SG SG11201810924WA patent/SG11201810924WA/en unknown
- 2017-10-06 EP EP17804976.3A patent/EP3458993A1/en active Pending
- 2017-10-06 US US16/311,141 patent/US11646102B2/en active Active
- 2017-10-06 WO PCT/US2017/055653 patent/WO2018068014A1/en active Application Filing
- 2017-10-06 KR KR1020237010257A patent/KR102694651B1/ko active IP Right Grant
- 2017-10-06 KR KR1020187038172A patent/KR102384832B1/ko active IP Right Grant
- 2017-10-06 CA CA3027179A patent/CA3027179C/en active Active
- 2017-10-06 AU AU2017341069A patent/AU2017341069A1/en not_active Abandoned
- 2017-10-06 MX MX2018015412A patent/MX2018015412A/es unknown
- 2017-10-06 KR KR1020227011278A patent/KR102515638B1/ko active IP Right Grant
-
2018
- 2018-12-07 ZA ZA2018/08277A patent/ZA201808277B/en unknown
- 2018-12-11 MX MX2022011757A patent/MX2022011757A/es unknown
-
2020
- 2020-05-27 JP JP2020091991A patent/JP7051937B2/ja active Active
- 2020-07-22 AU AU2020207826A patent/AU2020207826B2/en active Active
-
2021
- 2021-03-15 ZA ZA2021/01720A patent/ZA202101720B/en unknown
- 2021-12-01 AU AU2021277671A patent/AU2021277671B2/en active Active
-
2022
- 2022-02-22 JP JP2022025557A patent/JP7387777B2/ja active Active
-
2023
- 2023-04-13 US US18/300,343 patent/US20230410945A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110270533A1 (en) | 2010-04-30 | 2011-11-03 | Life Technologies Corporation | Systems and methods for analyzing nucleic acid sequences |
Non-Patent Citations (1)
Title |
---|
Jason R Miller, et al.,Assembly algorithms for next-generation sequencing data,Genomics,2010年06月,Vol.95, No.6,Pages 315-327,[検索日:2023年4月7日], <URL:https://doi.org/10.1016/j.ygeno.2010.03.001> |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7387777B2 (ja) | ヌクレオチド配列決定データの2次分析のためのシステムおよび方法 | |
US10325675B2 (en) | Methods and systems for detecting sequence variants | |
US20190362810A1 (en) | Systems and methods for determining copy number variation | |
US11049587B2 (en) | Methods and systems for aligning sequences in the presence of repeating elements | |
CN105793689B (zh) | 用于将遗传样本基因分型的方法和系统 | |
US20210358572A1 (en) | Methods, systems, and computer-readable media for calculating corrected amplicon coverages | |
JP2010528608A5 (ja) | ||
US20230343414A1 (en) | Sequence-to-sequence base calling | |
CN114766056A (zh) | 使用单细胞分析的改良的变体调用程序 | |
NZ793021A (en) | System and method for secondary analysis of nucleotide sequencing data | |
US20240352515A1 (en) | Methods of base calling nucleobases | |
US20220068433A1 (en) | Computational detection of copy number variation at a locus in the absence of direct measurement of the locus | |
WO2023164492A1 (en) | Machine-learning models for detecting and adjusting values for nucleotide methylation levels | |
BR112018076983B1 (pt) | Sistema e métodos implementados por computadores para sequenciamento eficiente de polinucleotídeos |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230412 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230712 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230720 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230927 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231016 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231023 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231115 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7387777 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |