JP6930910B2 - Rna転写産物バリアントを定量するための方法及び製品 - Google Patents
Rna転写産物バリアントを定量するための方法及び製品 Download PDFInfo
- Publication number
- JP6930910B2 JP6930910B2 JP2017501008A JP2017501008A JP6930910B2 JP 6930910 B2 JP6930910 B2 JP 6930910B2 JP 2017501008 A JP2017501008 A JP 2017501008A JP 2017501008 A JP2017501008 A JP 2017501008A JP 6930910 B2 JP6930910 B2 JP 6930910B2
- Authority
- JP
- Japan
- Prior art keywords
- artificial
- sequence
- family
- transcript
- molecules
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 99
- 150000007523 nucleic acids Chemical class 0.000 claims description 197
- 108020004707 nucleic acids Proteins 0.000 claims description 195
- 102000039446 nucleic acids Human genes 0.000 claims description 195
- 108090000623 proteins and genes Proteins 0.000 claims description 78
- 239000002773 nucleotide Substances 0.000 claims description 52
- 125000003729 nucleotide group Chemical group 0.000 claims description 52
- 238000012163 sequencing technique Methods 0.000 claims description 52
- 238000013518 transcription Methods 0.000 claims description 43
- 230000035897 transcription Effects 0.000 claims description 43
- 108020004414 DNA Proteins 0.000 claims description 36
- 238000011002 quantification Methods 0.000 claims description 35
- 108700024394 Exon Proteins 0.000 claims description 29
- 108700005078 Synthetic Genes Proteins 0.000 claims description 24
- 108020004705 Codon Proteins 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 5
- 108700009124 Transcription Initiation Site Proteins 0.000 claims description 4
- 230000005030 transcription termination Effects 0.000 claims description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 3
- 210000002784 stomach Anatomy 0.000 claims 1
- 239000000523 sample Substances 0.000 description 79
- 108020004999 messenger RNA Proteins 0.000 description 41
- 239000000203 mixture Substances 0.000 description 38
- 238000005259 measurement Methods 0.000 description 36
- 241000282414 Homo sapiens Species 0.000 description 25
- 238000007481 next generation sequencing Methods 0.000 description 23
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 22
- 238000002360 preparation method Methods 0.000 description 22
- 238000002474 experimental method Methods 0.000 description 19
- 238000003753 real-time PCR Methods 0.000 description 19
- 239000003795 chemical substances by application Substances 0.000 description 18
- 230000000692 anti-sense effect Effects 0.000 description 16
- 238000001514 detection method Methods 0.000 description 16
- 238000003559 RNA-seq method Methods 0.000 description 15
- 238000009826 distribution Methods 0.000 description 15
- 239000013612 plasmid Substances 0.000 description 14
- 108091028043 Nucleic acid sequence Proteins 0.000 description 12
- 108010029485 Protein Isoforms Proteins 0.000 description 12
- 102000001708 Protein Isoforms Human genes 0.000 description 12
- 239000013614 RNA sample Substances 0.000 description 12
- 238000013507 mapping Methods 0.000 description 12
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 11
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 11
- 108091036407 Polyadenylation Proteins 0.000 description 11
- 229940029575 guanosine Drugs 0.000 description 11
- 239000000047 product Substances 0.000 description 11
- 238000000746 purification Methods 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 10
- 238000012937 correction Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 10
- 230000014509 gene expression Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 241001465754 Metazoa Species 0.000 description 8
- 108020005067 RNA Splice Sites Proteins 0.000 description 8
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 8
- 210000004556 brain Anatomy 0.000 description 8
- 230000000977 initiatory effect Effects 0.000 description 8
- 239000002679 microRNA Substances 0.000 description 8
- 241000206602 Eukaryota Species 0.000 description 7
- 108700011259 MicroRNAs Proteins 0.000 description 7
- 108091034057 RNA (poly(A)) Proteins 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 108020005544 Antisense RNA Proteins 0.000 description 6
- 101100184147 Caenorhabditis elegans mix-1 gene Proteins 0.000 description 6
- 108091027974 Mature messenger RNA Proteins 0.000 description 6
- 210000004027 cell Anatomy 0.000 description 6
- 230000000295 complement effect Effects 0.000 description 6
- 238000001035 drying Methods 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 238000011534 incubation Methods 0.000 description 6
- 238000010208 microarray analysis Methods 0.000 description 6
- 102000004169 proteins and genes Human genes 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 239000003381 stabilizer Substances 0.000 description 6
- 230000003612 virological effect Effects 0.000 description 6
- 108091092195 Intron Proteins 0.000 description 5
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 5
- 150000003838 adenosines Chemical class 0.000 description 5
- 238000000546 chi-square test Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000002156 mixing Methods 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 238000004088 simulation Methods 0.000 description 5
- 241001515965 unidentified phage Species 0.000 description 5
- 238000010200 validation analysis Methods 0.000 description 5
- 108091026821 Artificial microRNA Proteins 0.000 description 4
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 4
- 230000006820 DNA synthesis Effects 0.000 description 4
- 102000016911 Deoxyribonucleases Human genes 0.000 description 4
- 108010053770 Deoxyribonucleases Proteins 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 4
- 241000282412 Homo Species 0.000 description 4
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 4
- 101710137500 T7 RNA polymerase Proteins 0.000 description 4
- 229960005305 adenosine Drugs 0.000 description 4
- 239000011324 bead Substances 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 238000010828 elution Methods 0.000 description 4
- 230000007717 exclusion Effects 0.000 description 4
- 238000002493 microarray Methods 0.000 description 4
- 244000005700 microbiome Species 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000009827 uniform distribution Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 3
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 108700005081 Overlapping Genes Proteins 0.000 description 3
- 239000000654 additive Substances 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000006641 stabilisation Effects 0.000 description 3
- 238000011105 stabilization Methods 0.000 description 3
- 239000011550 stock solution Substances 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 108020003215 DNA Probes Proteins 0.000 description 2
- 239000003298 DNA probe Substances 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 102100036498 Dual specificity testis-specific protein kinase 2 Human genes 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- 102100039335 HAUS augmin-like complex subunit 5 Human genes 0.000 description 2
- 101000714156 Homo sapiens Dual specificity testis-specific protein kinase 2 Proteins 0.000 description 2
- 101001035821 Homo sapiens HAUS augmin-like complex subunit 5 Proteins 0.000 description 2
- 101001091379 Homo sapiens Kallikrein-5 Proteins 0.000 description 2
- 101001130147 Homo sapiens Probable D-lactate dehydrogenase, mitochondrial Proteins 0.000 description 2
- 101000671649 Homo sapiens Upstream stimulatory factor 2 Proteins 0.000 description 2
- 102100034868 Kallikrein-5 Human genes 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 108700001094 Plant Genes Proteins 0.000 description 2
- 102100031708 Probable D-lactate dehydrogenase, mitochondrial Human genes 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 102100040103 Upstream stimulatory factor 2 Human genes 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 239000003963 antioxidant agent Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000000205 computational method Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000011157 data evaluation Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 2
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 238000003203 nucleic acid sequencing method Methods 0.000 description 2
- 230000037452 priming Effects 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000003161 ribonuclease inhibitor Substances 0.000 description 2
- 108020004418 ribosomal RNA Proteins 0.000 description 2
- 238000005204 segregation Methods 0.000 description 2
- 239000000377 silicon dioxide Substances 0.000 description 2
- 210000001324 spliceosome Anatomy 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000005303 weighing Methods 0.000 description 2
- 108020004463 18S ribosomal RNA Proteins 0.000 description 1
- GNXFOGHNGIVQEH-UHFFFAOYSA-N 2-hydroxy-3-(2-methoxyphenoxy)propyl carbamate Chemical compound COC1=CC=CC=C1OCC(O)COC(N)=O GNXFOGHNGIVQEH-UHFFFAOYSA-N 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 108700020462 BRCA2 Proteins 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 101150008921 Brca2 gene Proteins 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 102000001493 Cyclophilins Human genes 0.000 description 1
- 108010068682 Cyclophilins Proteins 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 101000878605 Homo sapiens Low affinity immunoglobulin epsilon Fc receptor Proteins 0.000 description 1
- 101000655352 Homo sapiens Telomerase reverse transcriptase Proteins 0.000 description 1
- 238000009015 Human TaqMan MicroRNA Assay kit Methods 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 101710203526 Integrase Proteins 0.000 description 1
- 102100038007 Low affinity immunoglobulin epsilon Fc receptor Human genes 0.000 description 1
- 241001599018 Melanogaster Species 0.000 description 1
- 241000203407 Methanocaldococcus jannaschii Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 101100202339 Mus musculus Slc6a13 gene Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000772415 Neovison vison Species 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 241000209094 Oryza Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 241000271578 Ovophis okinavensis Species 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 208000002193 Pain Diseases 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 241000015864 Protobothrops flavoviridis Species 0.000 description 1
- 238000013381 RNA quantification Methods 0.000 description 1
- 101100202330 Rattus norvegicus Slc6a11 gene Proteins 0.000 description 1
- 101100273253 Rhizopus niveus RNAP gene Proteins 0.000 description 1
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 1
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 206010046865 Vaccinia virus infection Diseases 0.000 description 1
- 241000269457 Xenopus tropicalis Species 0.000 description 1
- 238000011481 absorbance measurement Methods 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000004847 absorption spectroscopy Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical group N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 101150049515 bla gene Proteins 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 239000007857 degradation product Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000009274 differential gene expression Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 235000003869 genetically modified organism Nutrition 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000009830 intercalation Methods 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 235000019689 luncheon sausage Nutrition 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 239000011807 nanoball Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 210000000745 plant chromosome Anatomy 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- -1 promoters Proteins 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 238000011155 quantitative monitoring Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000009790 rate-determining step (RDS) Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 235000002020 sage Nutrition 0.000 description 1
- 238000005464 sample preparation method Methods 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 239000003998 snake venom Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000012536 storage buffer Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000002381 testicular Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000011222 transcriptome analysis Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 208000007089 vaccinia Diseases 0.000 description 1
- 238000012418 validation experiment Methods 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6816—Hybridisation assays characterised by the detection means
- C12Q1/682—Signal amplification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6846—Common amplification features
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/686—Polymerase chain reaction [PCR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2545/00—Reactions characterised by their quantitative nature
- C12Q2545/10—Reactions characterised by their quantitative nature the purpose being quantitative analysis
- C12Q2545/113—Reactions characterised by their quantitative nature the purpose being quantitative analysis with an external standard/control, i.e. control reaction is separated from the test/target reaction
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/166—Oligonucleotides used as internal standards, controls or normalisation probes
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Description
本発明はトランスクリプトミクス、特にトランスクリプトーム全体のショットガンシークエンシング(「RNA−seq」)の分野に関する。より詳しく述べると、それはRNA−seq、マイクロアレイ分析又は定量的PCR(qPCR)によって分析されたサンプル中のRNA転写産物バリアントの同定及び定量に好適な方法及び製品に関する。
次世代シークエンシング技術は、核酸サンプルを配列決定するときに大量のショートリードを作り出す。次世代シークエンシングに不可欠なステップは、ライブラリ調製(又は略してlibrary prep)である。このプロセスは、入力としてmRNA又はcDNAを取り、各々がmRNA分子の区分に対応する短いcDNA断片のライブラリを作り出す。これらの断片は、次にNGSシーケンサーによって、通常はそれらの全体ではなくそれらの開始及び/又はそれらの終結部において部分的に配列決定される。これは、ヌクレオチドの短い配列を生じ、この短い配列は、リードと称され、遺伝コードの核酸塩基を表すA、C、G、T又は0、1、2、3のような4つのASCII文字の一群の配列として、最も一般にはNGSシーケンサーによって記憶される。元のサンプル中にどのmRNA分子が存在したかを推測するために、リードを標準ゲノム又はトランスクリプトーム上へマッピング又は重ね合わせるか、或いは配列オーバラップに基づいて新規アセンブリされる。
EP2 333 104A1は、潜在的に多様なRNA分子のプールに由来する核酸分子断片配列を順序づけるRNA分析方法に関する。遺伝子は、1つの転写産物バリアントで発現されるだけではなく、それらのエクソン−イントロン組成及び転写の開始(TSS)や終結部位(TES)におけるバリエーションを有する多くの転写産物アイソフォームで所定のゲノム領域(例えば、Nilsen and Graveley, 2010; Wang et al., 2009; Koscielny et al., 2009を参照のこと)から転写された。転写産物アイソフォームはまた、それらの存在量が最大6桁異なるので、更に複雑性のレベルを高めている(Aird et al., 2013)。Zhangらは総合的な選択的スプライシングデータベースに関する。
サンプルの転写産物バリアントのより正確な評価(すなわち、同定及び定量)を可能にする方法及び製品を提供することが本発明の目標である。
本発明は、1若しくは複数のサンプルにおける転写産物バリアントの管理された同定及び/又は定量のための方法であって、以下のステップ:
a)各ファミリーが少なくとも2つ、好ましくは少なくとも3つ、より好ましくは少なくとも4つ、特に少なくとも5つの異なったNA分子から成る、少なくとも1つ、好ましくは少なくとも2つ、より好ましくは少なくとも3つ、特に少なくとも5つの異なったNA分子ファミリーを含む、転写産物バリアントをシミュレートする人工核酸(NA)分子の標準セットを提供し、
ここで、各ファミリーで独立に、前記各ファミリーのNA分子が、少なくとも80ヌクレオチド(nt)、好ましくは少なくとも100nt、より好ましくは少なくとも150nt、特に少なくとも200ntの長さの配列を共有し、且つ、前記各ファミリーの少なくとも2つのNA分子が少なくとも80nt、好ましくは少なくとも100nt、より好ましくは少なくとも150nt、より一層好ましくは少なくとも200nt、特に少なくとも300ntの長さの別の配列と異なり、且つ
ここで、前記NA分子の少なくとも2つ、好ましくは各々があらかじめ設定されたモル量で存在し;及び
b)転写産物バリアントを含む1若しくは複数のサンプルに外部対照として前記標準セットを加え;及び
c1)標準リードの割り当てが標準セットリードを用いて作り出され、前記標準リードの割り当てが1若しくは複数のサンプルの転写産物バリアントのリードの割り当てを管理するか、照合するか、又は改変するのに使用される、リード生成及び割り当てに基づくNAシークエンシングをおこなうこと;又は
c2)1若しくは複数のサンプルに対して、NA検出若しくは定量方法、好ましくはマイクロアレイ分析又はqPCRをおこなうこと、
を含む方法を提供する。
本発明は、上記の方法で使用されるのに非常に適している人工NA分子の標準セット、並びに斯かる標準セットを作り出す方法、並びに斯かる標準セットに含まれるのに好適なNA分子を更に提供する。
(真核細胞からのほとんどすべての転写産物サンプルに適用する)転写産物バリアントを含むサンプルの質的計量の違いを決定すること及びそうした複雑な転写産物サンプルを分析することを試みる方法には、内部標準、外部標準、相対標準、及び、絶対標準が不可欠である。定量的データは相対的関係又は絶対的関係のいずれかで表される。それぞれ異なった方法(例えば、マイクロアレイ、qPCR又はNGS)には、測定結果を標準化するのにデータ分析における多くの特殊性がある。
マイクロアレイ及びqPCRによる相対定量に関して、RNAレベルは内部対照又は外部対照を使用することによりサンプル間で比較して、サンプル濃度や添加量の違いを標準化する。NGS実験は、リード数と同定された転写産物の長さに対して異なった標準化手順を用いる。結果は、遺伝子アノテーションの特質及び状態、又は重ね合わせ及びアッセンブリアルゴリズムを用いたライブラリ調製とシークエンシングの偏りの間の取り決めのような多くの変数に依存する。例えば、対照は、ライブラリー調製効率の違いを補完する必要がある。
US2004/009512A1は、内部標準プローブを使用することでmRNAスプライス産物を分析する方法を開示する(文献の請求項7、段落[0097]及び[0106])。本発明が関連する分子の長さを有するバリアントに相当する内部標準の開示はない。
多くの混成RNA標準サンプル、例えば、普遍的なヒト標準RNAや普遍的なヒト脳標準RNA(Ambion, Life Technologies)が市販されている。それらの標準は、複数のドナー及びいくつかの組織/脳領域からプールされており、そのため、遺伝子発現の幅広い不偏性及び再現性の適用範囲を目指している。斯かる標準サンプルの実験は、標準データを提供し、且つ、実験法をバリデート及び評価するのに使用される。互いに、そして前記標準サンプルに対して未知サンプルの測定値を連動させるために、内部又は外部標準が必要である。
そのため、特定の実験事項のために、適当な対照RNAを同定することが必要となり、そしてそれは、たぶんmRNAである。次に、これは標準の適合性に対するmRNAアイソフォームの効果の考慮事項を必要とする。いくつかの内部標準は見つけられるが(β−アクチン、グリセルアルデヒド−3−リン酸脱水素酵素(GAPDH)、又はシクロフィリンmRNA)、外部標準だけが管理され信頼できる標準値を提供する。他の種のRNAサンプルからの定常的な供給源は、例えば、哺乳類サンプルに加えられるバクテリアのトランスクリプトームが外部標準として使用される場合がある。
しかしながら、原核生物のような単純な生物でさえ、そうした多数の転写産物を既に有しているので、動態(濃度)範囲全体にわたる均整の取れた表示には非常に多くのシークエンシングスペースを浪費するであろう。そのため、低い複雑性にもかかわらず、共通点のある動態範囲の外部標準、ERCCが以前に開発された。
Blomquistらは、NGSによるDNA配列決定について述べ、合成内部標準を用いる方法を使用する(文献の要約及び図1)。RNAプロセシング中、ERCCスパイク−イン対照内部標準が使用されている(文献の4頁、左欄)。DevonshireらもERCCについて述べている。
Ambion(Life Technologiesの一部)は、(6桁わたる濃度の)スタンドアロンミックス又は別個の遺伝子発現について比較される必要がある2つのサンプルにスパイク−インされるように設計された2つのミックス(倍量変化判定の精度計測;使用者ガイド:ERCC RNA Spike-In Control Mixes, Ambion)で92のERCC転写産物を商業的に提供している。
ERCCの制限は、それらがi)それらのサイズ範囲が限られていること、ii)短いポリ(A)テールしか含んでいないこと、及びiii)キャップ構造を含んでいないことである。しかしながら、ERCCの主たる難点は、それらがどんな種類の転写産物バリアントも含まないということである。そのため、それらは、転写産物バリアントの管理された同定及び/又は定量に好適ではなく、並びにこの点に関してシークエンシング方法(又は他の解析法)の評価に好適でない。別の不都合は、それらが既知の配列(バチルス及びメタノコッカス)に類似性を有する点である。
本発明は、特にこれらの不都合を克服する。本発明に際して、転写産物バリアントの同定及び定量に関する該問題を解決するのに特別に好適な方法及び産物を思いつくように、多くの異なった方法及び標準セットが開発及び特徴づけされた。
a)各ファミリーが少なくとも2つ、好ましくは少なくとも3つ、より好ましくは少なくとも4つ、特に少なくとも5つの異なったNA分子から成る、少なくとも1つ、好ましくは少なくとも2つ、より好ましくは少なくとも3つ、特に少なくとも5つの異なったNA分子ファミリーを含む、転写産物バリアントをシミュレートする人工核酸(NA)分子の標準セットを提供し、
ここで、各ファミリーで独立に、前記各ファミリーのすべてのNA分子が同じ人工遺伝子の標準転写産物バリアントであり、且つ
ここで、各ファミリーで独立に、前記各ファミリーのNA分子が、少なくとも80ヌクレオチド(nt)、好ましくは少なくとも100nt、より好ましくは少なくとも150nt、特に少なくとも200ntの長さの配列を共有し、且つ、前記各ファミリーの少なくとも2つのNA分子が少なくとも80nt、好ましくは少なくとも100nt、より好ましくは少なくとも150nt、より一層好ましくは少なくとも200nt、特に少なくとも300ntの長さの別の配列と異なり、且つ
ここで、前記NA分子の少なくとも2つ、好ましくは各々が(例えば、標準(すなわち、対照)リードの割り当てに対してサンプルリードの割り当ての標準化を可能にするとき、標準セットを該方法にとって特に好適にする)あらかじめ設定されたモル量で存在し;及び
c1)標準リードの割り当てが標準セットリードを用いて作り出され、前記標準リードの割り当てが1若しくは複数のサンプルの転写産物バリアントのリードの割り当てを管理するか、照合するか、又は改変するのに使用される、リード生成(リードはどんな長さも有していてもよい)及び割り当て(すなわち、標準配列上へのリードのマッピング)に基づくNAシークエンシングをおこなうこと;又は
c2)1若しくは複数のサンプルに対して、NA検出若しくは定量方法、好ましくはマイクロアレイ分析又はqPCRをおこなうこと、
を含む方法を提供する。qPCRでは、プローブは、PCR反応で伸長されるプライマーであっても、又は標識されたDNAプローブであってもよい;マイクロアレイ分析では、プローブは、DNAチップ上に固定されたDNAプローブであってもよい。
人工NA分子は、特にそれらが既知のNA配列に対して配列相同性がないか又はわずかしか有していないとき、本発明の方法に非常によく適合する。これは、次世代シークエンシングに典型的な短配列(例えば、40〜80nt又は20〜200ntであっても)についてでさえ「標準リード」としてリードの明白な割り当てを可能にする(すなわち、標準リードの割り当てを作り出す)。
選択的スプライシングという用語は、一次転写産物(プレ−mRNA)が2つ以上パターンでスプラインシングされて複数の、異なった成熟mRNAを作り出し得るいずれかの場合を説明するために生物学において使用される。選択的スプライシング事象の最も一般的なタイプが表1に示されている。ヒトでは、エクソンスキッピングが33%で、分かっているものの中で最も一般的なスプライシング事象である。選択的5’及び3’スプライシング部位が各々25%で続く。また、選択的スプライシング部位は一緒に起こることが多い(Barbazuk et al., 2008; Roy et al., 2013)。脳組織と睾丸の組織は、多数のAS事象を起こすことがわかった(Roy et al., 2013)。有益なことには、標準セットのNA分子全体は、少なくとも1つ、少なくとも2つ、少なくとも3又は少なくとも4つの別個の例において、先の文に列挙した特徴の0、1、2、3、4、5、6又は7つを、互いに独立に有する各NA分子と共に、表1で列挙した少なくとも1つであり、好ましくは少なくとも2つ、より好ましくは少なくとも3つ、より一層好ましくは少なくとも4つ、特に少なくとも5つの特徴を有する。
リストは、Ensembl遺伝子アノテーションから得られた数個の選択的スプライシング事象を示す。Ensembl遺伝子セットは、実験的証拠に基づくすべての転写産物の自動アノテーションと手動アノテーションの両方を含む(Wang et al., 2008も参照のこと)。
イントロンスプライシング部位ジヌクレオチド:ほとんどのイントロンが、スプライセオソーム成分によって認識され、且つ、スプライソソーム形成に必要である、それらの5’及び3’末端付近の一般的なコンセンサス配列を有する(図1)。主要なクラスにおいて、スプライスジャンクション対は、高度に保存されていて、且つ、イントロンドナー及び頻繁にGC−AG及びAT−ACが後に続く、アクセプター配列GT−AG(アノテーション付ジャンクションの98.70%)を典型的には備える(表2)。より一般的な観点で、最も一般的なエクソン−イントロン配列は:エクソン...AT(略)GT...イントロン...AG(略)G...次のエクソン、と描写され得る。表2では、ドナー−アクセプター対の頻度が示されている。保存及び適度な変異性となるように、すべてのジャンクションの97%がGT−AGであり、2%がGC−AG、1%がAT−ACとなることを目指した。この模倣は、(TopHatなどの)アライナーの使用をして、それらの既存のジャンクション表を評価することを可能にしなければならない。エクソン境界は、それらがより重要なイントロン結合ジヌクレオチドを妨げない5’AG及び3’ATでなければならない。有益なことには、標準セットのNA分子全体が、
例えば、好ましくは、すべてのイントロンドナー−アクセプタージヌクレオチドの存在のそれぞれ約97%、2%、及び1%の頻度を有するGU−AG、GC−AG、AU−ACから選択される、エクソンのイントロンドナー−アクセプタージヌクレオチドの1つ、好ましくは2つ、特にそのすべてを備える。
スプライシング部位ジヌクレオチドは、10,803種のヒト遺伝子のゲノムスプライシング部位(SSs)から成るCoordinates of Exon(ICE)データベースの情報から得られた。256組の理論的に可能なドナーとアクセプタージヌクレオチドとの対から、最も典型的であった具体的な3組(GT−AG、GC−AG、及びAT−AC)は全例の99.56%(91,846件のうちの91,022件)に該当した(Chong et al., 2004)。
a)各ファミリーが少なくとも2つ、好ましくは少なくとも3つ、より好ましくは少なくとも4つ、特に少なくとも5つの異なったNA分子から成る、少なくとも1つ、好ましくは少なくとも2つ、より好ましくは少なくとも3つ、特に少なくとも5つの異なったNA分子ファミリーを含む、(以前説明したような)転写産物バリアントをシミュレートする人工NA分子の標準セットを提供し、
ここで、各ファミリーで独立に、前記各ファミリーのNA分子が、少なくとも80nt、好ましくは少なくとも100nt、より好ましくは少なくとも150nt、特に少なくとも200ntの長さの配列を共有し、且つ、前記各ファミリーの少なくとも2つのNA分子が少なくとも80nt、好ましくは少なくとも100nt、より好ましくは少なくとも150nt、より一層好ましくは少なくとも200nt、特に少なくとも300ntの長さの別の配列と異なり、且つ
ここで、前記NA分子の少なくとも2つ、好ましくは各々があらかじめ設定されたモル量で存在し;及び
b2)NA検出法又は定量法を評価するために、標準セットに対して前記NA検出法又は定量法をおこない、
ここで、少なくとも1つのプローブが標準セットの少なくとも1つのNA分子に結合し;及び
を含む方法を提供する。
標準セットについての既知のパラメーター(例えば、濃度、存在する配列など−すなわち、標準セットはこの場合既知の対照に相当する)から、当業者は、予想される結果(例えば、リード数、推定される濃度など)を計算又は推測できる。(実際の)出力結果を予想された結果と比較することによって、当業者は、実際の結果と予想された結果との間の相違を判断することができ、それにより、核酸シークエンシング方法を評価する。
注目すべきは、核酸シークエンシング方法の演算的態様はまた、(繰り返して)標準セットのこれまでのシークエンシング計測値を使用し、そして、異なった演算的方法部分(例えば、アルゴリズム)を評価するために、又は該方法部分(例えば、(単数若しくは複数の)アルゴリズム)を改善するために、シークエンシング方法の演算的部分を(反復して)変更することによって評価され得る。
本発明に際して、多くの異なった標準セット(及びそのための製造法)が特徴づけされ、そして最終的に、以前に言及された方法にとって例外的に非常に好適な標準セット(及びそのための製造法)を見つけた(しかしながら、以前に言及された方法は本発明の標準セットを使用することに制限されない;他の標準セットも(本発明の標準セットほどではないが)好適であり得る)。
A)天然に存在する真核生物の遺伝子、好ましくは動物又は植物遺伝子、より好ましくは脊椎動物の遺伝子、より一層好ましくは哺乳動物遺伝子、特にヒト遺伝子の群から少なくとも1つ、好ましくは少なくとも2つ、より好ましくは少なくとも3つ、特に少なくとも5つの遺伝子を選択すること。それは斯かる遺伝子を見つけるための技術分野で知られている。好ましくは、この方法ステップがソフトウェアを実装したコンピューターによっておこなわれる。例えば、当業者は、Ensembl、National Center for Bio−technology Information(NCBI)、GenBank又は他のNCBIデータベースなどの公的にアクセス可能なデータベースからそれら(又はそれらのアノテーション付配列若しくは他の公的データベースで使用するためのそれらの名称)を入手し得る。一例として、ヒト遺伝子に関して、当業者は以下のNCBI検索クエリー:
http://www.ncbi.nlm.nih.gov/gene/?term=Homo+sapiens[Orgn]
から遺伝子を選択し得る。更に又は或いは、当業者はEnsemblデータベース(http://www.ensembl.org)でゲノムをブラウズできる。好ましくは、遺伝子は、その転写産物バリアント(転写産物表)に関してよくアノテーションされていて、そして、イントロン/エクソンはアノテーションされている。
各エクソンとは独立に、(エクソン配列として)ほぼ同じ長さの配列によって各配列の各エクソンの配列を置換し、ここで、ほぼ同じ長さの配列が以下の群:ウイルス配列、バクテリオファージ配列、その逆位配列、その他の逆位天然配列(逆位にすることで、重ね合わせソフトウェアがそれらの本来の相補配列に対して配列を重ね合わせること、そしてまた、それらの本来の遺伝子座とのハイブリダイゼーションも妨げる)、非天然ランダム配列、及びその組み合わせ、から選択され、好ましくはほぼ同じ長さの配列は以下の群:ウイルス配列、バクテリオファージ配列、その逆位配列、非天然ランダム配列、及びその組み合わせ、から選択され、より好ましくはほぼ同じ長さの配列は以下の群:ウイルス配列、バクテリオファージ配列、その逆位配列、及びその組み合わせ、から選択され、
但し、同じ選択遺伝子の選択される天然mRNA転写産物バリアントの配列から得られた人工転写産物配列は、好ましくは単一のエクソン配列内に含まれる少なくとも80ntの長さの配列を共有するものとし、及び、
好ましくは、この方法ステップがソフトウェアを実装したコンピューターによっておこなわれる。このステップ(及びすべてのその後の、好ましくはコンピュータによるステップ)は、例えば、広く使用されているソフトウェアCLC Main Workbench(QIAGEN)、Bioconductorパッケージ、UCSC Genome Browser、又は他のものを用いておこなわれてもよい。
この複製は、標準セットに存在すべきであるが(標準セットがより好適である場合、選択的転写事象に関してより包括的なものが得られる)、選択される遺伝子と共に起こらない転写産物バリエーション事象のシミュレーションを可能にする。好ましくは、この方法ステップがソフトウェアを実装したコンピューターによっておこなわれる。
ここで、少なくとも1つの挿入された配列の各々は、互いに独立に、ステップD)の任意の人工転写産物配列と同じ長さ、好ましくは5nt〜10000nt、特に10nt〜1000ntの長さを有するセンス又はアンチセンス配列(すなわち、逆相補配列)と同一である。
有益なことには、多くても5つ、好ましくは多くても4つ、より好ましくは多くても3つ、そして特に多くても2つの挿入が人工転写産物配列ごとにおこなわれる。好ましくは、この方法ステップがソフトウェアを実装したコンピューターによっておこなわれる。
ここで、1以上の人工転写産物配列の各々が、少なくとも100ntのサイズで残り、且つ、少なくとも1つのエクソン配列を含んだ状態を維持する。
有益なことには、多くても5つ、好ましくは多くても4つ、より好ましくは多くても3つ、そして特に多くても2つの除去が人工転写産物配列ごとにおこなわれる。好ましくは、この方法ステップがソフトウェアを実装したコンピューターによっておこなわれる。
ステップE〜Gの組み合わせによって、選択される天然mRNA転写産物に存在しなかった追加の選択的転写事象を含むことが可能である。好ましくは、この方法ステップがソフトウェアを実装したコンピューターによっておこなわれる。
好ましくは、この方法ステップがソフトウェアを実装したコンピューターによっておこなわれる。これで、生成した標準セットをWO2011/095501A1に記載の複雑性の低減方法に適合でき、そして特に好適になる。
L)セットの各人工転写産物配列について:
人工転写産物配列全体を含むNA分子を物理的に合成すること。どのようにNA、特にDNA及びRNA、分子を合成するかは当該技術分野で知られている。DNA及びRNAは、インビボ(組換え細胞、例えば、E.コリで発現される)又はインビトロにおける生化学的方法(例えば、DNA/RNAポリメラーゼ、例えば、ポリメラーゼ連鎖反応−PCRによる合成/増幅)、並びに化学的合成によって製造され得る。人工NAがDNAであれば、それはデノボDNA合成によって好ましくは合成され、PCRによって増幅される。プラスミド内へのクローニング、微生物内への形質転換、配列検定、及び形質転換微生物の培養によりインビボでの増幅も可能である。DNA鋳型から、T7RNAポリメラーゼを用いた転写によってRNAを合成することが可能である。好ましくは、NAがRNAであれば、それは特にT7RNAポリメラーゼによってDNAから転写される。
それによって、好ましくはRNA又はDNA分子の標準セットである、転写産物バリアントをシミュレートする人工NA分子の標準セットを物理的に得る。
から好ましくは選択される。
別の好ましい実施形態において、人工NA分子の標準セットには、GAA、GAC、GAG、GAT、GCA、GCC、GCG、GCT、GGA、GGC、GGG、GGT、GTA、GTC、GTG、GTTから選択される5’開始トリヌクレオチド又はAA、AC、AG、AT、CA、CC、CG、CT、GA、GC、GG、GT、TA、TC、TG、TTから選択される5’開始ジヌクレオチド及び/又はAC、AG、AT、CC、CG、CT、GC、GG、GT、TC、TG、TTから選択される3’終結ジヌクレオチドの実質的にランダムに分布して出現する。これで、生成した標準セットがWO2011/095501A1に記載の複雑性還元法に特に好適になる。
別の好ましい実施形態において、標準セットの各人工NA分子は、5’開始ヌクレオチドとしてグアノシンを有する。
別の好ましい実施形態において、標準セットの人工NA分子の少なくとも1つ、好ましくはその各々は、それがRNA分子であれば、5’キャップ構造を有する。
先に述べたように、安定化及び取り扱いエラーの低減は重要である。そのため、非常に好ましい実施形態において、本発明の方法は、好ましくはコンテナ内で、好ましくは安定化剤と一緒に、物理的に得られた標準セットを乾燥、好ましくは凍結乾燥するステップを含む。
ここで、各ファミリーで独立に、前記各ファミリーのNA分子が、少なくとも80nt、好ましくは少なくとも100nt、より好ましくは少なくとも150nt、特に少なくとも200ntの長さの配列を共有し、且つ、前記各ファミリーの少なくとも2つのNA分子が、少なくとも80nt、好ましくは少なくとも100nt、より好ましくは少なくとも150nt、より一層好ましくは少なくとも200nt、特に少なくとも300ntの長さの少なくとも別の配列と異なる。
別の好ましい実施形態において、本発明の任意の標準セットは25%〜55%の平均GC含量を有する。
別の好ましい実施形態において、標準セットの人工NA分子の少なくとも1つ、好ましくはその各々は、それがRNA分子であれば、5’キャップ構造を有し、及び/又は少なくとも10、好ましくは少なくとも20、特に少なくとも30個のアデノシンから成るポリ(A)テールを有する。好ましくは、本発明の任意の標準セットの配列は、10−1未満、好ましくは1未満、特に10未満の統計的有意性の閾値(期待値)で、NCBI GenBankデータベース受入番号が表3で列挙されている配列に対して類似性を有しない、好ましくは表3及び表4のいずれか一方、特に2014年6月15日のNCBI GenBankデータベースリリース202のすべての配列に対して類似性を有しない、ここで、該類似性は以下のパラメーター:低複雑性領域フィルタリングを伴った、28のワードサイズ、1、−2の直鎖ギャップコスト及びマッチ/ミスマッチスコア、を用いてBLASTnプログラムによって測定される。
DNA配列をRNA配列に変換することが可能であり(ヌクレオチドの交換:T−>U)、逆もまた同様である(ヌクレオチドの交換:U−>T)。そのため、配列がDNA配列として(配列表を含む)本明細書中に与えられるときはいつも、それはまた、その各RNA配列と読むものとし、逆もまた同様である。本明細書中に使用される場合、RNAは一般的に一本鎖であり、DNA分子は一般的に二本鎖である。しかしながら、二本鎖又は一本鎖の形態の各RNA/DNAもまた本発明について請求されるものとし、請求した配列に対して相補的な配列(例えば、cDNA)も同様である。
好ましい実施形態において、天然に存在する又は人工遺伝子は、タンパク質(例えば、mRNA)をコードするが、定義されているものでもあるタンパク質をコードしない転写産物、例えば、microRNA、snoRNA若しくはrRNA、並びにそれらの前駆体、特にpre−microRNA又はpre−rRNAを含む、調節又は触媒RNAもコードする。
本明細書中で使用される場合、「アイソフォーム」又は「転写産物バリアント」は、転写産物の特定のバリアントに関係して使用される。
本明細書中で使用される場合、「約」とは、所定の値と同じ値又は所定の値と+/−10%異なる値を指し得る。
「備える」は、本明細書では、含むのように更なるメンバーを許容する開いた定義として理解するものとする。他方、「成る」は、成るの定義の特徴のさらなる要素を伴わない閉じた定義と見なされる。よって、「備える」はより広い定義であり、「成る」の定義を包含する。「備える」という語を用いた本明細書における任意の定義は、本発明の特別の実施形態では成るの制限を伴って読まれてもよい。
本発明に関する任意の方法又はステップをコンピュータに実装した方法として行うことができる。NA分子をシークエンシング及び合成する通常は湿式化学的なステップでさえも、例えば、自動化または半自動化配列リーダを管理してそこからデータを得るためにコンピュータによって補助されてもよい。コンピュータプログラム製品又はメモリ装置にはサンプルからショートリードを得るリード生成コンポーネント、例えば、シーケンサー、好ましくは、コンピュータコンポーネントを備えるシーケンサーがさらに設けられてもよい。例えば、コンピュータ可読媒体は、磁気記憶装置(例えば、ハードディスク、フロッピディスク、磁気ストリップ、...)、光学ディスク(例えば、コンパクトディスク(CD)、デジタル多用途ディスク(DVD)...)、スマートカードならびにフラッシュメモリ装置(例えば、カード、スティック、キーデバイス、...)を含み得るが、これだけに限定されるものではない。
2つのヌクレオチド配列を重ね合わせるために、needleプログラムは以下のパラメーターで好ましくは実行される:
コマンドライン:needle -auto -stdout -asequence SEQUENCE_FILE_A -bsequence SEQUENCE_FILE_B -datafile EDNAFULL -gapopen 10.0 -gapextend 0.5 -endopen 10.0 -endextend 0.5 -aformat3 pair -snucleotide1 -snucleotide2 (Align_format: pair Report_file: stdout)。
100×割合X/Y
この場合、Xは配列アラインメントプログラムneedle、すなわち、AとBのプログラムによる重ね合わせによって完全一致としてスコア化されたヌクレオチドの数であり、及びこの場合、YはBのヌクレオチドの総数である。ヌクレオチド配列Aの長さがヌクレオチド配列Bの長さと等しくない場合、Bに対するAの%ヌクレオチド配列同一性がAに対するBの%ヌクレオチド配列同一性と等しくなたないことは理解される。「Aの配列がBの配列全体と少なくともN%同一である」場合、YはBの全長である。別段の記述がない限り、本明細書中に使用されるすべての%ヌクレオチド配列同一性値が、needleコンピュータプログラムを使用して直前の段落に記載のように得られる。
本明細書中では、NA配列と関連した「挿入」という用語は、5’又は3’末端における直接的な挿入(すなわち、5’ 又は3’末端における付加)も意味する。
本発明の方法の特に好ましい実施形態は、以下のとおりである:
1若しくは複数のサンプルにおける転写産物バリアントの管理された同定及び/又は定量のための方法であって、以下のステップ:
ここで、各ファミリーで独立に、前記各ファミリーのすべてのNA分子が同じ人工遺伝子の標準転写産物バリアントであり、且つ
ここで、各ファミリーで独立に、前記各ファミリーのNA分子が、少なくとも80ヌクレオチド(nt)、好ましくは少なくとも100nt、より好ましくは少なくとも150nt、特に少なくとも200ntの長さの配列を共有し、且つ、前記各ファミリーの少なくとも2つのNA分子が少なくとも80nt、好ましくは少なくとも100nt、より好ましくは少なくとも150nt、より一層好ましくは少なくとも200nt、特に少なくとも300ntの長さの別の配列と異なり、且つ
ここで、各々人工NA分子があらかじめ設定されたモル量で提供され;そして更に
ここで、各々人工NA分子は:
ここで、前記NA分子の標準セットは:
−25%〜55%の平均GC含量を有し、及び
選択的転写産物開始部位(TSS)、選択的転写産物終結部位(TES)、アンチセンス転写産物、オーバーラップ転写産物、並びに以下の:スキップカセットエクソン(CE)、イントロン残存(IR)、相互除外エクソン(MXE)、選択的3’スプライス部位(A3SS)、選択的5’スプライス部位(A5SS)、選択的第1エクソン(AFE)、選択的最終エクソン(ALE)、及びトランス−スプライシングの群から選択される選択的スプライシング事象、から選択される少なくとも5つの選択的転写事象をシミュレートし、及び
ここで、人工NA分子の標準セットのエクソン配列のすべての5’開始ジヌクレオチドの少なくとも75%がGTであり、且つ、人工NA分子の標準セットのエクソン配列のすべての3’終結ジヌクレオチドの少なくとも75%がATであり、及び
ここで、任意の標準セットの配列は、10未満の統計的有意性の閾値(期待値)で、NCBI GenBankデータベース受入番号が表3及び表4のいずれか一方で列挙されている配列に対して類似性を有しない、ここで、該類似性は以下のパラメーター:低複雑性領域フィルタリングを伴った、28のワードサイズ、1、−2の直鎖ギャップコスト及びマッチ/ミスマッチスコア、を用いてBLASTnプログラムによって測定され;及び
c)標準リードの割り当てが標準セットリードを用いて作り出され、前記標準リードの割り当てが1若しくは複数のサンプルの転写産物バリアントのリードの割り当てを管理するか、照合するか、又は改変するのに使用される、リード生成及び割り当てに基づくNAシークエンシングをおこなうこと、
を含む方法。
Aird SD, et al., (2013) Quantitative high-throughput profiling of snake venom gland transcriptomes and proteomes (Ovophis okinavensis and Protobothrops flavoviridis). BMC Genomics 14:790.
Benson DA, et al., "GenBank." Nucleic acids research (2012). doi: 10.1093/nar/gks1195.
Blomquist, Thomas M., et al. "Targeted RNA-sequencing with competitive multiplex-PCR amplicon libraries." (2013): e79120.
Brennecke P, et al., (2013) Accounting for technical noise in single-cell RNA-seq experiments. Nature Methods 10(11): 1093.
Chaitanya RS, et al. (2008) Overlapping genes in the human and mouse genomes. BMC Genomics 2008, 9:169.
Cronin M, et al., (2004) Universal RNA Reference Materials for Gene Expression. Clinical Chemistry 50(8): 1464 -1471.
Devonshire AS, et al., (2010) "Evaluation of external RNA controls for the standardisation of gene expression biomarker measurements." BMC genomics 11.1: 662.
External RNA Controls Consortium, (2005) Proposed methods for testing and selecting the ERCC external RNA controls. BMC Genomics 6:150. Available at www.biomedcentral.com//1471-2164/6/150.
External RNA Controls Consortium, (2005a) The External RNA Controls Consortium: a progress report. Nature Methods 2:731-734.
ERCC User Guide: ERCC RNA Spike-In Control Mixes (English). Life Technologies (2012). Publication Number 4455352, Revision D.
Hu Y, et al., (2014) PennSeq: accurate isoform-specific gene expression quantification in RNA-Seq by modeling non-uniform read distribution. Nucleic Acids Research 42:3 e20.
James HB, et al., (2010) Evaluation of statistical
methods for normalization and differential expression in mrna-seq experiments. BMC Bioinformatics, 11:94.
Jiang L, et al., (2011) Synthetic spike-in standards for RNA-seq experiments. Genome Research 21:1543-1551.
Lin CY, et al., (2012) Transcriptional Amplification in Tumor Cells with Elevated c-Myc. Cell 151:56-67.
Karlin S, and Altschul SF, (1990) "Methods for assessing the statistical significance of molecular sequence features by using general scoring schemes." Proceedings of the National Academy of Sciences 87(6): 2264-2268.
Koscielny G, et al., (2009) ASTD: The Alternative Splicing and Transcript Diversity database. Genomics. 93(3):213-20.
Loven J, et al., (2012) Revisiting Global Gene Expression Analysis. Cell 151:476-482.
MAQC Consortium,( 2006) The MicroArray Quality Control (MAQC) project shows inter- and intraplatform reproducibility of gene expression measurements. Nature Biotechnology, 24(9):1151-1161. .
Nilsen TW, and Graveley BR, (2010) Expansion of the eukaryotic proteome by alternative splicing. Nature 463.7280: 457-463.
Rapaport F, et al., (2013) Comprehensive evaluation of differential gene expression analysis methods for RNA-seq data. Genome Biology, 14:R95.
Reid L (ERCC), (2005) Proposed methods for testing and selecting the ERCC external RNA controls. BMC Genomics 2005, 6:150.
Rice P, et al., (2000) EMBOSS: the European Molecular Biology Open Software Suite, Trends Genet, 16(6):276-7.
Roberts A, et al., (2011) Improving RNA-Seq expres-
sion estimates by correcting for fragment bias. Genome Biol, 12(3):R22.
Shippy R, et al., (2006) Using RNA sample titrations to assess microarray platform performance and normalization techniques. Nat Biotechnol. 24(9): 1123-1131.
Sun, Bing, Lian Tao, and Yun-Ling Zheng. "Simultaneous quantification of alternatively spliced transcripts in a single droplet digital PCR reaction." BioTechniques 56.6 (2014): 319.
Trapnell C, et al., (2010) Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nature Biotechnology 28, 511-515.
Wang ET, et al., (2008) Alternative Isoform Regulation in Human Tissue Transcriptomes. Nature 456, 470-476.
Wang Z, et al., (2009) "RNA-Seq: a revolutionary tool for transcriptomics." Nature Reviews Genetics 10(1): 57-63.
Xin D, et al., (2008) Alternative Promoters Influence Alternative Splicing at the Genomic Level, PLOS One, DOI: 10.1371/journal.pone.0002377.
Yoon OK, et al., (2012) Genetics and Regulatory Impact of Alternative Polyadenylation in Human B-Lymphoblastoid Cells. PLoS Genet. e1002882, doi: 10.1371/journal.pgen.1002882.
Zhang, Fan, and Renee Drabier. "SASD: the Synthetic Alternative Splicing Database for identifying novel isoform from proteomics." BMC bioinformatics 14.Suppl 14 (2013): S13.
表5:SIRV(本発明の人工NA分子、転写産物バリアントをシミュレートする)の特徴づけ。配列番号75〜148は、30個のアデノシンから成るポリ(A)テールがなければ、それぞれ配列番号1〜74と同一である。「鋳型なし」は、SIRVには直接的なヒト転写産物モデル鋳型はないが、代わりにステップE)〜G)を用いた本発明の製造方法によって入手可能であることを意味する。SIRVファミリーは、同じ人工遺伝子の転写産物バリアントを提供し、ヒトモデル遺伝子の条件をシミュレートする。
例示目的のために、SIRV転写産物ファミリー1〜7をもたらす7つの人工SIRV遺伝子(SIRV1〜SIRV7)を、配列番号149〜156に列挙する。SIRV遺伝子はそれらのエクソン配列によって定義され(すなわち、少なくとも1つの転写産物のエクソンである配列、それらはイントロンであってもよい、すなわち、他の転写産物になるために存在しない)、それらが転写産物として定義される場合、それらは該エクソン配列からもたらされる。本明細書中で言及する場合、それらが単に概念として存在する場合でも、それで十分である。
SIRVは、ヌクレオチド及びタンパク質レベルにおけるblast検索によって明らかになるように、NCBIデータベースにおける登録事項との同一性が不足している。人工SIRVトランスクリプトームからコンピュータ内実験で作り出す50ntの長さのNGSリード、SIRVomeはまた、モデル生物、ヒト、マウス、シロイヌナズナ、C.エレガンス(C.elegans)、D.メラノガスター(D.Melanogaster)、E.コリ(CGA1.20)、S.セレビシエ(S.Cerevisiae)、及びX.トロピカリス(X. tropicalis)からのアノテーション付トランスクリプトームに顕著に重ね合わなかったが、SIRVomeに対して非常にうまくマッピングされた。加えて、あらゆる的外れの重ね合わせが、リードスパイクとして容易に同定され得る。そのため、SIRV転写産物は試験されるモデル生物の転写産物と大きく異なっているので、これらのゲノムにおいてスパイク−イン対照として使用したとき、SIRV転写産物は、転写産物の発見及び定量を妨げることがありそうにないと結論づけられる。推定によると、更に多くの異なった物理的クラスからのゲノムがnt−blastに加えて試験されるので、人工SIRV配列はいずれの既知のゲノムシステムも妨げないであろうことが合理的に想定され得る。
74種類のSIRV転写産物は、
・NGS RNA−Seq実験、及びマイクロアレイ分析又はqPCRなどの他のNA分析法でスパイク−イン転写産物として使用されることができ、
・的外れの重ね合わせの非常に少ない、SIRVomeへの一意的なマッピングを可能にする人工配列であり、
・長さ、GC含量、イントロンスプライシング部位ジヌクレオチド、及びエクソン−イントロン構造に関して天然型のmRNAを模倣し、
・ERCCに関連して使用されることができ、
・T7RNAポリメラーゼ転写産物として費用効率よく作製されることができる。
・ポリ(A)ベースの選択及び増幅、
・アイソフォーム検出、
・アノテーションベースのアイソフォームマッピング及び仮説の構築、
・アイソフォーム存在量の概算、
・(異なったSIRV濃度を有する2つの混合物を使用することによる)ログ倍数変化のバリデーション、
・アイソフォーム存在量概算アルゴリズムの訓練及びバリデーション、
・アイソフォームのデノボアッセンブリ、
・SQUAREシステム(WO2011/095501A1に記載の複雑性低減法)におけるアイソフォーム偏析、
を可能にする。
SIRVを作製するために、インビトロ転写鋳型を外部DNA合成プロバイダーに合成させた。これらの構築物は、5’から3’へと(a)一意的な制限部位(XhoI)と、そのすぐ上流の(b)T7RNAポリメラーゼプロモーターを備え、その3’Gが(c)SIRV配列の第1のヌクレオチドであって、シームレスに(d)A(30)テールが続き、それには(e)排他的なNsiI制限部位が融合されている(図11)。
T7プロモーターの融合並びにA(30)テール内へのNsiI部位の組み込みは、5’G(SIRV配列の一部、且つ、T7プロモーター)から始まり、そして追加の3’ヌクレオチドなしにポリ(A)テールで終わる配列の正確なRNAをもたらす転写を許す。
制限及び転写アッセイに十分である8〜10μgの各ベクターを得た。XhoIとNsiIを用いた二重消化は適切なインサートサイズと制限処理の完了を示す。しかしながら、大規模調製用転写のために、SIRVプラスミドを50μgバッチスケールで作製した。
NsiI制限処理は3’突出末端を作り出す。これは第2鎖転写を開始するかもしれず、その場合我々は付着末端の平滑化を用いる。このために、T4DNAポリメラーゼの3’−5’エキソヌクレアーゼ活性を使用した。
T7転写を制御する重要な要素は、高いdNTP濃度を許容する転写条件を用いるキットの使用である。これは高収量を可能にする、すなわち、1μgのプラスミドが最大160〜180μgのRNAを生じ得る(例えば、Epicentreの高収量キット)。
より長いインキュベーション時間は、開始機会を増やし、短い鋳型の収量に対してよりすばらしい効果を有する。したがって、標準的な2時間のインキュベートではなく、4〜6時間、或いは一晩のインキュベートが推奨されることもある。しかしながら、より長期間のインキュベーションは、T7転写バッファーがMg2+陽イオンを含んでいるので、RNA分解をもたらし得る。
37℃から42℃にT7転写酵素反応温度を上げることは、収量の多大な増大をもたらし得る。これは、更に複雑な(GCリッチ、構造化)鋳型をより顕著にするであろう(図3を参照のこと)。
鋳型DNAはDNアーゼによって取り除かれる必要がある。Epicentre(AmpliScribeマニュアル)によると、含まれているDNアーゼ1単位を転写に直接加え、37℃で15分間更なるインキュベーションを加える。DNアーゼ処置をRNA完全性に影響しないか試験する、すなわち、それがRNAを分解する場合には、残留RNアーゼに起因する。或いは、DNAを、SPLITプロトコール変法による酸フェノール抽出によって取り除くこともできる。しかしながら、GuSCNはその後のシリカカラム結合に不必要であろう。
推奨されるSIRV精製方法を次に記載する。PAGE:NGSスパイク−イン転写産物に必要とされる高い品質を有する転写RNAをインビトロで精製するための標準プロトコールがPAGE溶出であるが、厄介なことに、あまり正確ではなく、UV架橋を誘発する可能性もあるので、それは>1kbの転写産物には好適でない。
シリカベースの精製:最初、精製は、核酸からdNTPs、添加物、及びタンパク質を取り除く技術分野の当業者に知られているワットマンプロトコールによってのみおこなわれる。しかしながら、この手順は損失傾向があり;試験マーカーの最大60%が標準的手順において溶出されなかった。加えて、DNA鋳型は一緒に溶出する。溶出バッファーEB又は保存バッファーSBが効果的な溶出に使用しうるかどうかを試験しなければならない。
品質管理及び定量は、SIRV混合物を作製するのに重要である。Nanodrop定量:吸光光度測定は、A260/A230及びA260/A280比の形態で濃度(これにより、収量)及び純度をもたらす。重要なことには、Nanodrop装置(Nanodrop Instruments)において吸光度測定は、260nmに過剰比例する吸収度を有するdNTPsの痕跡量もまた計測するので、不十分な精製には問題が多い。Qubit測定値(LifeTechnologies)を第三の標準と見なす場合がある。
Agilent Bioanalyzer RNAナノチップ:SIRV転写産物は、適切な長さ、量、、RNA完全性(すなわち、分離又は分解生成物)及び異常な(より長い)生成物についてAgilent Bioanalyzer RNAチップ上で評価され得る。
qPCR:スパイク−イン転写産物の完全性を評価し、且つ、相補的な定量を得るために、完全長cDNA合成に続いて、転写産物の5’、中央、及び3’領域に配置した複数の単位複製配列のqPCRを実施した。外部標準として、PCR転写鋳型を同じ設定で増幅し得る。これらの設定もSIRVミックスの相対濃度を決定するのに適切であり得る。
これらのSIRV特異的プライマーは、例えば、所定の遺伝子のすべてのSIRVに共通のエクソンではなく、特定のSIRVの各々1つだけを標的とするように注意して設計される必要がある。
実験手順が以下のステップ、i)サンプル収集、ii)RNA精製、iii)NGSライブラリ作成、iv)NGSシークエンシング、v)標準アノテーションに対するリードの重ね合わせ、及びvi)その後の正確に相対転写産物量を計算する生物情報科学的処理、から成ることは広く認識されている。しかしながら、異なった方法、例えば、異なったサンプル調製であるが、同様の以下の実施例に我々が示す同じ実験データセットの生物情報科学的処理ルーチンも可能である。
部分的にバリデートされた転写産物量を含んでいるほんのわずかなデータセットのみ利用可能である。これらのうちの1つは、Microarray Quality Control(MAQC)サンプル(MAQC Consortium, 2006)由来であり、普遍的なヒト標準RNA(UHRR)及びヒト脳標準RNA(HBRR)を含んでいる。両RNAサンプルについて、1044個のTaqmanプローブを用いてqPCR測定値を得た。これらの測定値は、Gene Expression Omnibusから受入番号GSE5350で入手可能である。
実施例は、2以上のEnsembl転写産物アノテーションを含む798個のTaqman qPCRバリデート遺伝子座の選択を通じて、2つの異なった生物情報科学的アルゴリズム(更に一方が2つの異なったバイアス補正を有する(Cufflinks))が3つの著しく異なった結果を生じることを証明した。重ね合わせは、間違った転写産物に対して多数の遺伝子内にリードを振り分ける。グラウンド最低値(ground trough)を我々は知らないので絶対相関は不可能である。天然に存在する遺伝子における転写産物と類似した複雑な状況で存在する、既知の存在量の人工転写産物バリアントだけで、個々のステップ及び全体的なワークフローで実施される測量法の精度の定量的な評価が可能である。
一例として、「GAA、GAC、GAG、GAT、GCA、GCC、GCG、GCT、GGA、GGC、GGG、GGT、GTA、GTC、GTG、GTTから選択される5’開始トリヌクレオチドの実質的にランダムに分布した出現がある人工転写産物配列のセット」に対してどのようにカイ二乗検定を適用するかについて説明するものである。
人工転写産物配列の数(N):74
5’開始ヌクレオチド(O1、O2、O3、...、On)の出現(カウント):
GAA 5 GAC 5 GAG 4 GAG 6 GAT 3 GCA 2 GCC 4 GCG 5 GCT 6 GGA7 GGC 4 GGG 3 GTA 4 GTC 5 GTG 6 GTT 5
(離散一様分布の帰無仮説下での)任意の細胞に関する予想される出現:Ei=N/n=4.625。これは、5’開始トリヌクレオチドと言及されたトリヌクレオチドのそれぞれが4.625を、偽って、有するトリヌクレオチドの(完全)一様分布の状況を意味する。
カイ二乗(ピアソンの累積検定統計)は以下のとおり定義される:
特定のカイ二乗値(この実施例では5.57)及び特定の自由度(この実施例では15)に関する確率値(「p値」)は周知の表(いわゆるカイ二乗表)に要約されている。p値はまた、Microsoft Excel、LibreOffice又はOpenOffice(それらのうちの後者2つは無料で利用可能である)などの広く使用されているオフィス用ソフトウェア、又は無料で利用可能なRソフトウェアパッケージによって計算されてもよい。英語版のMicrosoft Excel2003では、この機能はCHIDISTと呼ばれている。
カイ二乗値=5.57及びdf=15に対応するp値は0.9861である。そのため、この実施例における開始ヌクレオチドの出現は、本明細書中に定義した「実質的にランダムに分布」している条件を満たす。
配列番号1〜74によって与えられる上記セットからの74個のSIRVのうちの60個を、合成し、クローニングし、発現し、精製し、品質管理し、そして、電気泳動測定によりそれらの濃度を決定し(Bioanalyzer、AgilentによるRNAナノ及びピコチップ及びアッセイ)、その後、2つのマスターミックスに組み合わせ、そして、更なるサンプル調製のために10ng/μl超の濃度に濃縮した。SIRV Mix1は等しい質量で60個のSIRVすべてを含んだ。SIRV Mix2を、1:10:100の比でランダム化して最大2桁、SIRV遺伝子中の個々のSIRVの量が変動する混合スキームに従って調製した。このSIRV Mix2では、すべての副次的なSIRVの合計としての各SIRV遺伝子を等しい質量で提供した。
3種類のmRNAサンプルをサービスプロバイダ(Fasteris, Suisse)に出荷し、該サービスプロバイダがサンプルを調製し、シークエンシングをおこなった。NGSライブラリを、ポリA選択なしでカスタムライブラリー調製によってサンプル1から準備し、そして一方、サンプル2及び3をポリA選択を伴ってIllumina鎖mRNAライブラリー調製に供した。3種類のライブラリすべてを、バーコードを付し、試みた等比で混合した。シークエンシングを、v3化学薬品を用いたIllumina MiSeqにより実施し、150bpのインデックス付きリードを結果的に得た。
サンプル2及び3では、92個のERCCのうちの58個及び52個が、全リードの0.45及び0.42%に相当することが検出された。
加えられた3重量%未満のERCCリードの繰り返し起こる出現不足は、24個のアデノシンだけの相対的に短いポリ(A)テール、並びに潜在的に加水分解された又は別の方法で断片化され、ポリ(A)選択され、そして激減したERCCに起因する。SIRVを、ERCCを越える10倍増でサンプル中に混合し、そして30個のアデノシンから成るより長いポリAテールとSIRVの潜在的により高い完全性によって引き起こされ10及び20.7%になり、その結果、20〜40倍増になった。
SIRV遺伝子1の全体的な適用範囲は、SIRV Mix1の74個のSIRVのうちの60個の一部ではなく、したがって、アノテーションで含まれない105以外の、以下の同定されたアノテーション付転写産物SIRV101〜109(SIRV1ですべてコードされる)と一緒に、図13の上の行に示す。Cufflinksは追加の転写産物仮説を加え、そして、内部的に定義した長さ依存的確率分布及び他の多数の帰属則に従って転写産物バリアントのセットに対してリードを割り当てたので、0.83のR2値を有するサンプル1と2とのSIRV相関が同一のサンプルについて低い場合、提示された値が単に正しくない。
ここで、74個のSIRVから、キャピラリー電気泳動Bioanalyzerトレースにより、適切な計算サイズのメインピークにおいて≧85w/w%を示すことによって規定される純度で得られた69個のSIRVを選択した。
SIRV溶液を吸収度分光法(Nanodrop, Thermo Scientific)によって計測し、そして原液濃度を≧50ng/μlに調整した。260nm対280nm及び260nm対230nmでの吸収度の比がRNAの最も高い純度を示し、次のとおり記録された:
A260nm/280nm 2.14±0.12、
A260nm/280nm 2.17±0.20。
Nanodropは正確なRNA定量を可能にし、製造者の仕様書によるとエラーは、核酸サンプル≦100ng/μlに対して±2ng/μlである。50ng/μl前後の最終的なSIRV原液濃度計測値の定量に関する相対エラー±4%である。
MW[g/mol]=A*329.2+U*306.2+C*305.2+G*345.2+159
に従ってSIRV配列の塩基分布に基づいて計算した。
等モル比で6〜11種類のSIRV転写産物を含む8種類のPreMixを設計した。それらの長さ分布は、PreMixとその後のMix中のSIRVの出現及び完全性を観察するための図14Aに示されているBioanalyzerトレースによる一意的同定を可能にする(図14B及びC)。Bioanalyzerトレースは絶対定量を可能にしないが、それらを相対混合物分布及び混合手法の整合性を追跡するのに使用した。
8種類のPreMixを2つ一組で組み合わせて、4種類のSubMixを得た。混合ステップを、図14Bに示したように電気泳動によって品質モニターした。4種類のSubMixの体積調製を、Nanodrop濃度測定で管理した(0.8%±2.5%の偏差、最大4.5%)。
非常に狭い許容範囲内で、MixのすべてのBioanalyzerトレースは、それらの各Pre及びSubMix構成要素の合計に類似している(図14)。相対ピーク形状及び位置は、SIRV Mixにとって高い信頼の定量的監視ツールである。
これらの手段によって、信頼できるSIRV濃度及び濃度比が別個の混合物において保証され得る。
間違ってアノテーションされたか、又は典型的な長さのクローン化ESTを有する多数のバリアントが典型的な例である以前の実験の遺物である転写産物バリアントを含む。現在、リードは、実際には実在するサンプルの一部でないSIRVバリアントに割り当てられ得る。本実験に関して、相関プロットはRC−1について0.506、そしてRC−2について0.699のr値を示す。予想及び実測倍数変化の比較は0.871の同様のr値を示す。
正しいSIRV検出の程度及びロバスト性はパイプライン性能の指標である。
倍数変化は更に、示差的出現を予想する際に、真及び偽陽性率(TP及びFP)のような多くのパラメーターの算出を可能にする。TP対FP曲線下の面積(AUC)は、示差的出現分析における診断性能の指標と見なされ得る。
RNAは、RNアーゼ又は二価陽イオンと温度によって促進される加水分解によって分解される傾向がある。更に、RNAは、多くの表面に吸着される傾向がある。そのため、電気泳動ゲル用のRNAラダー又はERCCミックスのようなRNA対照は、抗酸化剤や、EDTA、DDT、RNasin若しくは他のRNアーゼ阻害剤のような添加剤を含むバッファー中に25ng/μl以上の濃度で提供される。斯かるRNA溶液は一般的に−20℃の低温で保存される。mRNAと比較するために低いパーセンテージ範囲でRNA対照を使用すると、数十ピコグラム程度のアリコートが必要とされ、そして、高度に濃縮された対照はスパイク−インに好適になる手前まで希釈される必要がある。いくつかのサンプルだけが一度に加工される必要があるとき、希釈した対照の多くを処分しなければならない。アリコートの希釈及び調製は、好ましくないバリエーションを導入する危険がある。
ある好ましい実施例では、RNA対照は、バーコード配列のような一意的同定要素と共にRNAを含んでいる。バーコード配列は、バーコード配列の存在をマークする独特な人工配列が隣接している。対照中のバーコードは、RNAサンプルが対照に加えられた瞬間から、このサンプルが内部バーコードを用いて一意的に同定されることを確実にする。外部サンプル標識の内部バーコードとの一致は、高速大量処理設定の際に誤りのない同定が生じることを確実にする。
SIRVは、ERCC、上記バーコードRNA、又は人工マイクロRNAのような他のRNA対照と組み合わせられてもよい。マイクロRNAは一般的に21〜23nt程度の短いRNAである。それらの限定されたサイズのため、マイクロRNAライブラリー調製のワークフローは、プライミングと異なり、cDNA合成が妨げられる/影響を受ける。マイクロRNAはすぐにそのまま連結されなければならない。末端配列及び特にいくつかの開始及び終結部位は、5桁くらいの大きさになり得る強い偏りの導入に関与する。そのため、特別なマイクロRNA対照は、連結反応において配列の偏りを評価することを可能にすることが求められる。
中央部のNは、ヌクレオチド分布のランダム性の独立した指標を提供し、Nのつながりの中で、開始部位及び終結部位のNがマイクロRNAライブラリー調製の配列の偏りを決定する。
Claims (3)
- 1若しくは複数のサンプルにおける転写産物バリアントの同定及び/又は定量のための方法であって、以下のステップ
a)各ファミリーが少なくとも2つの異なった人工核酸(NA)分子から成る、少なくとも2つの異なった人工NA分子ファミリーを含む、転写産物バリアントをシミュレートする人工NA分子の標準セットを提供し、
ここで、各ファミリーで独立に、前記各ファミリーのすべての人工NA分子が同じ人工遺伝子の転写産物バリアントであり、ここで、前記人工遺伝子は、少なくとも転写開始部位、転写された領域及び転写終結部位を有し、それらは天然に存在する遺伝子から知られている特徴であり、各ファミリーで独立に、前記人工NA分子の標準セットの配列はエクソンを含み、前記エクソンは、現実に存在する生物に存在する既知の転写産物に対する類似性を欠くように設計され、開始及び停止コドンを有するリーディングフレームを含まず、前記類似性は、以下のパラメーター:低複雑性領域フィルタリングを伴った、28のワードサイズ、1、−2の直鎖ギャップコスト及びマッチ/ミスマッチスコア、を用いてBLASTnプログラムによって測定され、
ここで、各ファミリーで独立に、前記各ファミリーの人工NA分子が、少なくとも80ヌクレオチド(nt)の長さの配列を共有し、且つ、前記各ファミリーの少なくとも2つの人工NA分子が少なくとも80ntの長さの別の配列と異なり、且つここで、各ファミリーで独立に、前記人工NA分子の少なくとも2つがあらかじめ設定されたモル量で存在し;
b)転写産物バリアントを含む1若しくは複数のサンプルに外部対照として前記標準セットを加え;並びに
c)標準リードの割り当てが標準セットのリードを用いて作り出され、前記標準リードの割り当てが1若しくは複数のサンプルの転写産物バリアントのリードの統計的リードの割り当てを調整するか又はシフトするのに使用される、リード生成及び割り当てに基づくNAシークエンシングをおこなうこと、
を含む方法。 - 核酸(NA)シークエンシング方法を評価するための方法であって、以下のステップ
a)各ファミリーが少なくとも2つの異なった人工NA分子から成る、少なくとも2つの異なった人工NA分子ファミリーを含む、転写産物バリアントをシミュレートする人工NA分子の標準セットを提供し、
ここで、各ファミリーで独立に、前記各ファミリーのすべての人工NA分子が同じ人工遺伝子の転写産物バリアントであり、ここで、前記人工遺伝子は、少なくとも転写開始部位、転写された領域及び転写終結部位を有し、それらは天然に存在する遺伝子から知られている特徴であり、各ファミリーで独立に、前記人工NA分子の標準セットの配列はエクソンを含み、前記エクソンは、現実に存在する生物に存在する既知の転写産物に対する類似性を欠くように設計され、開始及び停止コドンを有するリーディングフレームを含まず、前記類似性は、以下のパラメーター:低複雑性領域フィルタリングを伴った、28のワードサイズ、1、−2の直鎖ギャップコスト及びマッチ/ミスマッチスコア、を用いてBLASTnプログラムによって測定され、
ここで、各ファミリーで独立に、前記各ファミリーの人工NA分子が、少なくとも80ntの長さの配列を共有し、且つ、前記各ファミリーの少なくとも2つの人工NA分子が少なくとも80ntの長さの別の配列と異なり、且つここで、各ファミリーで独立に、前記人工NA分子の各々があらかじめ設定されたモル量で存在し;
b)標準リードの割り当てが標準セットのリードを用いて作り出される、リード生成及び割り当てに基づく人工NAシークエンシングをおこない;
c)ステップb)で作り出された標準リードの割り当てと、標準セットについて予想されたリードの割り当てとを比較し、それによって核酸(NA)シークエンシング方法を評価すること、を含む方法。 - 前記NAが、RNA又はDNAである、請求項1又は2に記載の方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021092115A JP7568581B2 (ja) | 2014-07-09 | 2021-06-01 | Rna転写産物バリアントを定量するための方法及び製品 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14176417 | 2014-07-09 | ||
EP14176417.5 | 2014-07-09 | ||
PCT/EP2015/065756 WO2016005524A1 (en) | 2014-07-09 | 2015-07-09 | Methods and products for quantifying rna transcript variants |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019182851A Division JP2020014478A (ja) | 2014-07-09 | 2019-10-03 | Rna転写産物バリアントを定量するための方法及び製品 |
JP2021092115A Division JP7568581B2 (ja) | 2014-07-09 | 2021-06-01 | Rna転写産物バリアントを定量するための方法及び製品 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017525341A JP2017525341A (ja) | 2017-09-07 |
JP6930910B2 true JP6930910B2 (ja) | 2021-09-01 |
Family
ID=51224706
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017501008A Active JP6930910B2 (ja) | 2014-07-09 | 2015-07-09 | Rna転写産物バリアントを定量するための方法及び製品 |
JP2019182851A Pending JP2020014478A (ja) | 2014-07-09 | 2019-10-03 | Rna転写産物バリアントを定量するための方法及び製品 |
JP2021092115A Active JP7568581B2 (ja) | 2014-07-09 | 2021-06-01 | Rna転写産物バリアントを定量するための方法及び製品 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019182851A Pending JP2020014478A (ja) | 2014-07-09 | 2019-10-03 | Rna転写産物バリアントを定量するための方法及び製品 |
JP2021092115A Active JP7568581B2 (ja) | 2014-07-09 | 2021-06-01 | Rna転写産物バリアントを定量するための方法及び製品 |
Country Status (11)
Country | Link |
---|---|
US (1) | US10513726B2 (ja) |
EP (1) | EP3167076B1 (ja) |
JP (3) | JP6930910B2 (ja) |
KR (1) | KR102555447B1 (ja) |
CN (1) | CN106471134B (ja) |
AU (1) | AU2015286672B2 (ja) |
CA (1) | CA2954495C (ja) |
DK (1) | DK3167076T3 (ja) |
HK (1) | HK1231518A1 (ja) |
LT (1) | LT3167076T (ja) |
WO (1) | WO2016005524A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2012307282B2 (en) | 2011-09-16 | 2018-03-15 | Lexogen Gmbh | Nucleic acid transcription method |
EP3167076B1 (en) | 2014-07-09 | 2021-11-17 | Lexogen GmbH | Methods and products for quantifying rna transcript variants |
CN106771194B (zh) * | 2017-01-18 | 2018-07-20 | 青岛大学 | 一种检测病原微生物的方法 |
US10828330B2 (en) * | 2017-02-22 | 2020-11-10 | IO Bioscience, Inc. | Nucleic acid constructs comprising gene editing multi-sites and uses thereof |
SE541799C2 (en) * | 2018-04-11 | 2019-12-17 | David Yudovich | Determination of frequency distribution of nucleotide sequence variants |
CN116144793A (zh) * | 2018-05-02 | 2023-05-23 | 中国农业科学院北京畜牧兽医研究所 | 一种基于基因分型鉴定滩羊与非滩羊的方法 |
EP3666904A1 (en) | 2018-12-14 | 2020-06-17 | Lexogen GmbH | Nucleic acid amplification and identification method |
EP3901284A1 (en) * | 2020-04-20 | 2021-10-27 | BMBK Invest BV | Construct, kit and method for sample tracking |
KR102690573B1 (ko) | 2020-06-26 | 2024-07-31 | 숙명여자대학교산학협력단 | 사이클로덱스트린을 이용한 경구투여용 복합 조성물 및 이의 제조방법 |
KR102690574B1 (ko) | 2020-06-26 | 2024-07-31 | 숙명여자대학교산학협력단 | 비타민 b1의 보호 및 전달을 위한 장용성 조성물 |
WO2023086441A1 (en) * | 2021-11-12 | 2023-05-19 | Regents Of The University Of Minnesota | Compositions and methods for transcriptional activation |
WO2023220742A2 (en) * | 2022-05-13 | 2023-11-16 | Ascidian Therapeutics, Inc. | Abca4 trans-splicing molecules |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2593343B1 (fr) | 1986-01-20 | 1988-03-25 | Thomson Csf | Matrice d'elements photosensibles et son procede de fabrication, procede de lecture associe, et application de cette matrice a la prise de vue d'images |
WO2002072889A2 (en) * | 2001-01-12 | 2002-09-19 | Applera Corporation | Methods and compositions for microarray control |
AU2002340898A1 (en) | 2001-05-07 | 2002-11-18 | Amersham Biosciences Corp | Design of artificial genes for use as controls in gene expression analysis systems |
US20040009512A1 (en) | 2002-05-02 | 2004-01-15 | Manuel Ares | Arrays for detection of products of mRNA splicing |
CA2558641A1 (en) * | 2004-03-11 | 2005-09-22 | The Regents Of The University Of California | Artificial mutation controls for diagnostic testing |
EP2333104A1 (en) * | 2009-12-11 | 2011-06-15 | Lexogen GmbH | RNA analytics method |
EP3167076B1 (en) | 2014-07-09 | 2021-11-17 | Lexogen GmbH | Methods and products for quantifying rna transcript variants |
-
2015
- 2015-07-09 EP EP15736490.2A patent/EP3167076B1/en active Active
- 2015-07-09 CN CN201580035408.5A patent/CN106471134B/zh active Active
- 2015-07-09 WO PCT/EP2015/065756 patent/WO2016005524A1/en active Application Filing
- 2015-07-09 AU AU2015286672A patent/AU2015286672B2/en active Active
- 2015-07-09 JP JP2017501008A patent/JP6930910B2/ja active Active
- 2015-07-09 LT LTEPPCT/EP2015/065756T patent/LT3167076T/lt unknown
- 2015-07-09 CA CA2954495A patent/CA2954495C/en active Active
- 2015-07-09 US US15/323,951 patent/US10513726B2/en active Active
- 2015-07-09 DK DK15736490.2T patent/DK3167076T3/da active
- 2015-07-09 KR KR1020177002619A patent/KR102555447B1/ko active IP Right Grant
-
2017
- 2017-05-24 HK HK17105265.8A patent/HK1231518A1/zh unknown
-
2019
- 2019-10-03 JP JP2019182851A patent/JP2020014478A/ja active Pending
-
2021
- 2021-06-01 JP JP2021092115A patent/JP7568581B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
LT3167076T (lt) | 2022-02-10 |
WO2016005524A1 (en) | 2016-01-14 |
CA2954495C (en) | 2024-03-05 |
AU2015286672B2 (en) | 2021-12-02 |
DK3167076T3 (da) | 2022-02-21 |
KR20170028383A (ko) | 2017-03-13 |
US10513726B2 (en) | 2019-12-24 |
JP2017525341A (ja) | 2017-09-07 |
JP2021153588A (ja) | 2021-10-07 |
JP2020014478A (ja) | 2020-01-30 |
JP7568581B2 (ja) | 2024-10-16 |
CN106471134B (zh) | 2021-11-12 |
CN106471134A (zh) | 2017-03-01 |
CA2954495A1 (en) | 2016-01-14 |
US20170321248A1 (en) | 2017-11-09 |
KR102555447B1 (ko) | 2023-07-13 |
HK1231518A1 (zh) | 2017-12-22 |
EP3167076A1 (en) | 2017-05-17 |
EP3167076B1 (en) | 2021-11-17 |
AU2015286672A1 (en) | 2016-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7568581B2 (ja) | Rna転写産物バリアントを定量するための方法及び製品 | |
Chen et al. | RNA editome in rhesus macaque shaped by purifying selection | |
Rapley et al. | Molecular biology and biotechnology | |
Hiller et al. | Pre-mRNA secondary structures influence exon recognition | |
Kozarewa et al. | Overview of target enrichment strategies | |
Li et al. | Quality control of RNA-seq experiments | |
DK2245187T3 (en) | Methods for accurate sequence data and modified due to localization | |
Seetin et al. | Massively parallel RNA chemical mapping with a reduced bias MAP-seq protocol | |
US20140221218A1 (en) | Methods for single-molecule analysis | |
Driguez et al. | LeafGo: Leaf to Genome, a quick workflow to produce high-quality de novo plant genomes using long-read sequencing technology | |
WO2012027446A2 (en) | Nucleic acid sequence analysis | |
Wang et al. | Forensic nanopore sequencing of microhaplotype markers using QitanTech’s QNome | |
US20210102246A1 (en) | Genetic test for detecting congenital adrenal hyperplasia | |
JP5926189B2 (ja) | Rna分析方法 | |
Bedre et al. | New era in plant alternative splicing analysis enabled by advances in high-throughput sequencing (HTS) technologies | |
WO2014128453A1 (en) | Nucleic acid marker molecules for identifying and detecting cross contamination of nucleic acid samples | |
Zheng et al. | Titration-free massively parallel pyrosequencing using trace amounts of starting material | |
CN114277114B (zh) | 一种扩增子测序添加唯一性标识符的方法及应用 | |
Nikiforova et al. | Amplification-based methods | |
Singh et al. | Next-generation sequencing technologies: approaches and applications for crop improvement | |
Olsen et al. | Transcriptomics: RNA-seq | |
Scheer et al. | High-Resolution mapping of 3’extremities of RNA exosome substrates by 3’RACE-seq | |
Benaglio et al. | Ultra high throughput sequencing in human DNA variation detection: a comparative study on the NDUFA3-PRPF31 region | |
Vecoli | Next-generation sequencing technology in the genetics of cardiovascular disease | |
Olsen et al. | RNA-seq |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170707 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180703 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20181002 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190104 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190604 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191003 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20191003 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20191004 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20191024 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20191029 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20191227 |
|
C211 | Notice of termination of reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C211 Effective date: 20200107 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20200714 |
|
C13 | Notice of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: C13 Effective date: 20201201 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210225 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20210413 |
|
C302 | Record of communication |
Free format text: JAPANESE INTERMEDIATE CODE: C302 Effective date: 20210421 |
|
C302 | Record of communication |
Free format text: JAPANESE INTERMEDIATE CODE: C302 Effective date: 20210527 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210601 |
|
C23 | Notice of termination of proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C23 Effective date: 20210608 |
|
C03 | Trial/appeal decision taken |
Free format text: JAPANESE INTERMEDIATE CODE: C03 Effective date: 20210713 |
|
C30A | Notification sent |
Free format text: JAPANESE INTERMEDIATE CODE: C3012 Effective date: 20210713 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210812 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6930910 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |