CN116249786A - 靶向单细胞cDNA测序的方法和组合物 - Google Patents
靶向单细胞cDNA测序的方法和组合物 Download PDFInfo
- Publication number
- CN116249786A CN116249786A CN202180061602.6A CN202180061602A CN116249786A CN 116249786 A CN116249786 A CN 116249786A CN 202180061602 A CN202180061602 A CN 202180061602A CN 116249786 A CN116249786 A CN 116249786A
- Authority
- CN
- China
- Prior art keywords
- sequence
- nucleic acid
- universal
- universal sequence
- template
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 81
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 60
- 239000002299 complementary DNA Substances 0.000 title claims description 72
- 239000000203 mixture Substances 0.000 title description 3
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 279
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 279
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 278
- 108091034117 Oligonucleotide Proteins 0.000 claims abstract description 154
- 108020004414 DNA Proteins 0.000 claims abstract description 117
- 230000003321 amplification Effects 0.000 claims abstract description 111
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 111
- 108091093088 Amplicon Proteins 0.000 claims abstract description 110
- 238000010839 reverse transcription Methods 0.000 claims abstract description 14
- 238000000137 annealing Methods 0.000 claims abstract description 7
- 239000013615 primer Substances 0.000 claims description 161
- 108020004635 Complementary DNA Proteins 0.000 claims description 83
- 238000010804 cDNA synthesis Methods 0.000 claims description 72
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 70
- 125000003729 nucleotide group Chemical group 0.000 claims description 38
- 239000002773 nucleotide Substances 0.000 claims description 33
- 101100302220 Arabidopsis thaliana TSO2 gene Proteins 0.000 claims description 28
- 108091034057 RNA (poly(A)) Proteins 0.000 claims description 23
- 230000005859 cell recognition Effects 0.000 claims description 15
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 13
- 230000001419 dependent effect Effects 0.000 claims description 13
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 12
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 12
- 108020004999 messenger RNA Proteins 0.000 claims description 11
- 239000011541 reaction mixture Substances 0.000 claims description 11
- 102100034343 Integrase Human genes 0.000 claims description 10
- 108090000623 proteins and genes Proteins 0.000 claims description 9
- 230000001404 mediated effect Effects 0.000 claims description 7
- 241000282620 Hylobates sp. Species 0.000 claims description 6
- 101710203526 Integrase Proteins 0.000 claims description 6
- 238000007363 ring formation reaction Methods 0.000 claims description 6
- 230000000903 blocking effect Effects 0.000 claims description 5
- 230000000295 complement effect Effects 0.000 claims description 5
- 230000035772 mutation Effects 0.000 claims description 5
- 239000003155 DNA primer Substances 0.000 claims description 4
- 102000003960 Ligases Human genes 0.000 claims description 4
- 108090000364 Ligases Proteins 0.000 claims description 4
- 108700019146 Transgenes Proteins 0.000 claims description 3
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 230000004927 fusion Effects 0.000 claims description 3
- 238000003780 insertion Methods 0.000 claims description 3
- 230000037431 insertion Effects 0.000 claims description 3
- 210000004027 cell Anatomy 0.000 description 32
- 238000003559 RNA-seq method Methods 0.000 description 8
- 238000013461 design Methods 0.000 description 7
- 101100315397 Arabidopsis thaliana TSO1 gene Proteins 0.000 description 4
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 230000037452 priming Effects 0.000 description 4
- 238000007480 sanger sequencing Methods 0.000 description 4
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 3
- 238000007857 nested PCR Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 108020004394 Complementary RNA Proteins 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical class C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 208000032839 leukemia Diseases 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 108010068698 spleen exonuclease Proteins 0.000 description 2
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 229910052804 chromium Inorganic materials 0.000 description 1
- 239000011651 chromium Substances 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 238000011223 gene expression profiling Methods 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000003402 intramolecular cyclocondensation reaction Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 208000037819 metastatic cancer Diseases 0.000 description 1
- 208000011575 metastatic malignant neoplasm Diseases 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- -1 nucleic acid (LNA)-modified guanosine Chemical class 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000000548 ribosyl group Chemical class C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
在各种实施方式中,本发明大体上提供生成用于测序的标记DNA扩增子的方法。在一个实施方式中,所述方法包括:a)将第一寡核苷酸退火至核酸模板,其包含靶核酸分子序列和标签序列,其中,所述靶核酸分子序列包含目标基因座;b)从退火的第一寡核苷酸进行核酸模板导向的核酸延伸以提供第一延伸产物;c)环化第一延伸产物以产生环化的DNA模板;和d)进行环化的DNA模板导向的核酸扩增以产生DNA扩增子,从而用于测序。这些方法可用于将远距离目标基因座与逆转录引物连接起来。
Description
相关申请
本申请要求于2020年9月10日提交的美国临时申请号63/076,672的权益。上述申请的全部内容通过引用并入本文。
通过引用将材料并入ASCII文本文件
本申请通过引用并入包含在以下同时提交的ASCII文本文件中的序列表:
文件名:44591155001_SEQUENCELISTING.txt;创建于2021年9月9日,大小为12,288字节。
背景技术
从混合细胞群中获取单细胞转录组信息的能力对于分子生物学研究和医学应用都很重要。需要一种灵敏且快速的方法来生成标记的DNA扩增子,以便对远离转录物末端的目标基因座进行测序。
发明内容
本发明提供了生成用于测序的标记DNA扩增子的方法。
一方面,本发明提供了一种生成用于测序的标记DNA扩增子的方法,其包括以下步骤:
a)将第一寡核苷酸退火至核酸模板,所述核酸模板包含靶核酸分子序列、标签序列和第一通用序列的至少一部分,其中,靶核酸分子序列包含目标基因座;
b)从退火的第一寡核苷酸进行核酸模板导向的核酸延伸以产生第一延伸产物,所述第一延伸产物包含含有目标基因座的靶核酸分子序列的全部或部分、标签序列和第一通用序列的至少一部分;
c)环化第一延伸产物以产生环化的DNA模板,其包含目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分;和
d)进行环化的DNA模板导向的核酸扩增以产生DNA扩增子,其包含目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分,
从而生成用于测序的标记DNA扩增子。
在某些实施方式中,所述方法还包括进行第一延伸产物导向的核酸扩增以扩增第一延伸产物。在某些实施方式中,第一延伸产物导向的核酸扩增使用以下进行:
a)第一寡核苷酸;和
b)第一引物,其包含第一通用序列的至少一部分。
另一方面,本发明提供了一种生成用于测序的标记DNA扩增子的方法,其包括以下步骤:
a)提供核酸模板,其包含靶核酸分子序列、标签序列和第一通用序列的至少一部分,其中,靶核酸分子序列包含目标基因座;
b)通过以下方式进行核酸模板导向的核酸扩增以产生第一扩增产物:
i.在引物退火至核酸模板中的互补核苷酸序列的条件下,使核酸模板与包含第一寡核苷酸和第一引物的反应混合物接触,其中,第一引物包含第一通用序列的至少一部分;和
ii.延伸第一寡核苷酸和第一引物中的每一个;
c)环化第一扩增产物以产生环化的DNA模板,其包含目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分;和
d)进行环化的DNA模板导向的核酸扩增以产生DNA扩增子,其包含目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分,
从而生成用于测序的标记DNA扩增子。
在另一方面,本发明提供了一种生用于测序的标记DNA扩增子的方法,其包括以下步骤:
a)提供核酸模板,其从5'端到3'端包含截短的第一通用序列、标签序列、靶核酸分子序列和第一模板转换寡聚物(TSO1)序列,其中,靶核酸分子序列包含目标基因座;
b)通过以下方式进行核酸模板定向的核酸扩增以产生第一扩增产物:
i.在第一寡核苷酸和第一反向引物退火至核酸模板中的互补核苷酸序列的条件下,使核酸模板与包含第一寡核苷酸和第一反向引物的反应混合物接触,其中:
1)第一寡核苷酸从5'端到3'端包括第二通用序列和靶核酸分子特异性序列;和
2)第一反向引物从5'端到3'端包含第二通用序列、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分;和
ii.延伸第一寡核苷酸和第一反向引物中的每一个;
c)环化第一扩增产物以产生环化DNA模板,其包含第二通用序列、目标基因座、标签序列、第一通用序列和[i7];和
d)进行环化的DNA模板导向的核酸扩增以产生DNA扩增子,其从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、标签序列和IlluminaP7序列,
从而生成用于测序的标记DNA扩增子。
在另一方面,本发明提供了一种生成用于测序的标记DNA扩增子的方法,其包括以下步骤:
a)提供核酸模板,其从5'端到3'端包含截短的第一通用序列、标签序列、第二模板转换寡聚物(TSO2)序列和靶核酸分子序列,其中,靶核酸分子序列包含目标基因座;
b)通过以下方式进行核酸模板导向的核酸扩增以产生第一扩增产物:
i.在第一寡核苷酸和第一反向引物退火至核酸模板中的互补核苷酸序列的条件下,使核酸模板与包含第一寡核苷酸和第一反向引物的反应混合物接触,其中:
1)第一寡核苷酸从5'端到3'端包含第二通用序列和靶核酸分子特异性序列;和
2)第一反向引物从5'端到3'端包含第二通用序列、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分;和
ii.延伸第一寡核苷酸和第一反向引物中的每一个;
c)环化第一扩增产物以产生环化的DNA模板,其包含第二通用序列、目标基因座、TSO2序列、标签序列、第一通用序列和[i7];和
d)进行环化的DNA模板导向的核酸扩增以产生DNA扩增子,其从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、TSO2序列、标签序列和Illumina P7序列,
从而生成用于测序的标记DNA扩增子。
在某些实施方式中,核酸模板是互补DNA(cDNA)模板。在某些实施方式中,cDNA模板是通过反转录来自单个细胞的RNA获得的。在某些实施方式中,RNA是mRNA。在某些实施方式中,核酸模板是通过cDNA分子的扩增产生的双链DNA分子(例如,扩增子)。
在某些实施方式中,cDNA模板对应于第一链cDNA,其从5'端到3'端包含第一通用序列的至少一部分、标签序列、靶核酸分子序列和第一模板转换寡聚物(TSO1)序列。在其他实施方式中,cDNA模板对应于第二链cDNA,其从5'端到3'端包含第一通用序列的至少一部分、标签序列、第二模板转换寡聚物(TSO2)序列和靶核酸分子序列。
在某些实施方式中,目标基因座包含突变、多态性、插入、缺失、基因融合、编辑的核苷酸、修饰的核苷酸、转基因或其组合。
在某些实施方式中,标签序列包含细胞识别标签或独特分子标识符(UMI)序列,或其组合。
在某些实施方式中,所述方法包括单个环化步骤。
在某些实施方式中,环化第一延伸产物包括由吉布森组装介导的分子内连接。
在某些实施方式中,所述方法用于制作测序文库。
在另一方面,本发明提供了一种用于测序的标记DNA扩增子,其从5'端到3'端包含目标基因座、第二通用序列的至少一部分、第一通用序列的至少一部分和标签序列。在某些实施方式中,标记的DNA扩增子从5'端到3'端包含目标基因座、第二通用序列、第一通用序列和标签序列。
在某些实施方式中,标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、第一通用序列、标签序列和Illumina P7序列。
在某些实施方式中,标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、标签序列和Illumina P7序列。
在某些实施方式中,标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、标签序列、poly(T)序列和Illumina P7序列。
在某些实施方式中,标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第二模板转换寡聚物(TSO2)序列和Illumina P7序列。
附图说明
前述内容将从以下示例实施方式的更具体描述中显而易见,如附图中所示,在附图中相同的附图标记在不同的视图中指代相同的部分。附图不一定按比例绘制,而是将重点放在说明实施方式上。
图1A和1B描绘了SIT-seq分子设计的非限制性实例(例如,对于从10x Genomics3'基因表达试剂盒或3'偏向RNA-Seq文库生成的cDNA)。分子设计将远距离目标基因座与逆转录引物(显示为10x Genomics细胞ID序列)联系起来。图1C描绘了用P5引物测序的Illumina文库的Sanger测序色谱图。Read 1和Read 2分别表示第一和第二通用序列。
图2描绘了SIT-seq分子设计的非限制性实例(例如,用于从10x Genomics 5'基因表达试剂盒或5'偏向RNA-Seq文库生成的cDNA)。
图3描绘了Illumina平台上SIT-seq文库测序的非限制性实例。
图4描绘了使用杂交和延伸的靶标富集的非限制性实例。
图5描绘了使用RNase H依赖性PCR(rhPCR)的靶标富集的非限制性实例。
具体实施方式
以下是示例实施方式的描述。
除非另有定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员普遍理解的相同含义。
在一方面,本发明提供了一种生成用于测序的标记DNA扩增子的方法,其包括以下步骤:
a)将第一寡核苷酸退火至核酸模板,其包含靶核酸分子序列、标签序列和第一通用序列的至少一部分,其中,靶核酸分子序列包含目标基因座;
b)从退火的第一寡核苷酸进行核酸模板导向的核酸延伸以产生第一延伸产物,其包含含有目标基因座的靶核酸分子序列的全部或部分、标签序列和第一通用序列的至少一部分;
c)环化第一延伸产物以产生环化的DNA模板,其包含目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分;和
d)进行环化的DNA模板导向的核酸扩增以产生DNA扩增子,其包含目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分,
从而产生用于测序的标记DNA扩增子。
在某些实施方式中:
a)核酸模板包含截短的第一通用序列;
b)环化的DNA模板包含整个第一通用序列和整个第二通用序列;和
c)DNA扩增子包含整个第一通用序列和整个第二通用序列。
在某些实施方式中,所述方法进一步包含进行第一延伸产物导向的核酸扩增以扩增第一延伸产物。
在某些实施方式中,使用以下进行第一延伸产物导向的核酸扩增:
a)第一寡核苷酸;和
b)第一反向引物,其包含截短的第一通用序列的至少一部分。
在另一方面,本发明提供了一种生成用于测序的标记DNA扩增子的方法,其包括以下步骤:
a)提供核酸模板,其包含靶核酸分子序列、标签序列和第一通用序列的至少一部分,其中,所述靶核酸分子序列包含目标基因座;
b)通过以下方式进行核酸模板导向的核酸扩增以产生第一扩增产物:
i.在第一寡核苷酸和第一引物退火至核酸模板中的互补核苷酸序列的条件下,使核酸模板与包含第一寡核苷酸和第一引物的反应混合物接触,其中,第一引物包含第一通用序列的至少一部分,并且其中,第一寡核苷酸、第一引物或两者都包
含第二通用序列;和
ii.延伸第一寡核苷酸和第一引物中的每一个;
c)环化第一扩增产物以产生环化的DNA模板,其包含目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分;和
d)进行环化的DNA模板导向的核酸扩增以产生DNA扩增子,其包含目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分,
从而生成用于测序的标记DNA扩增子。
在另一方面,本发明提供了一种生成用于测序的标记DNA扩增子的方法,其包括以下步骤:
a)提供核酸模板,其从5'端到3'端包含截短的第一通用序列、标签序列、靶核酸分子序列和第一模板转换寡聚物(TSO1)序列,其中,所述靶核酸分子序列包含目标基因座;
b)通过以下方式进行核酸模板导向的核酸扩增以产生第一扩增产物:
i.在第一寡核苷酸和第一反向引物退火至核酸模板中的互补核苷酸序列的条件下,使核酸模板与包含第一寡核苷酸和第一反向引物的反应混合物接触,其中:
1)第一寡核苷酸从5'端到3'端包含第二通用序列和靶核酸分子特异性序列;和
2)第一反向引物从5'端到3'端包含第二通用序列、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分;和
ii.延伸第一寡核苷酸和第一反向引物中的每一个;
c)环化第一扩增产物以产生环化的DNA模板,其包含第二通用序列、目标基因座、标签序列、第一通用序列和[i7];和
d)进行环化的DNA模板导向的核酸扩增以产生DNA扩增子,其从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、标签序列和IlluminaP7序列,
从而生成用于测序的标记DNA扩增子。
在另一方面,本发明提供了一种生成用于测序的标记DNA扩增子的方法,其包括以下步骤:
a)提供核酸模板,其从5'端到3'端包含截短的第一通用序列、标签序列、第二模板转换寡聚物(TSO2)序列和靶核酸分子序列,其中,所述靶核酸分子序列包含目标基因座;
b)通过以下方式进行核酸模板导向的核酸扩增以产生第一扩增产物:
i.在第一寡核苷酸和第一反向引物退火至核酸模板中的互补核苷酸序列的条件下,使核酸模板与包含第一寡核苷酸和第一反向引物的反应混合物接触,其中:
1)第一寡核苷酸从5'端到3'端包含第二通用序列和靶核酸分子特异性序列;和
2)第一反向引物从5'端到3'端包含第二通用序列、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分;和
ii.延伸第一寡核苷酸和第一反向引物中的每一个;
c)环化第一扩增产物以产生环化的DNA模板,其包含第二通用序列、目标基因座、TSO2序列、标签序列、第一通用序列和[i7];和
d)进行环化的DNA模板导向的核酸扩增以产生DNA扩增子,其从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、TSO2序列、标签序列和Illumina P7序列,
从而生成用于测序的标记DNA扩增子。
在某些实施方式中:
a)核酸模板包含截短的第一通用序列;
b)环化的DNA模板包含整个第一通用序列和整个第二通用序列;和
c)DNA扩增子包含整个第一通用序列和整个第二通用序列。
应当注意的是,贯穿本说明书,术语“包含”用于表示本发明的实施方式“包含”所指出的特征,并且因此也可以包括其他特征。然而,在本发明的上下文中,术语“包含”也可以涵盖本发明“基本上由相关特征组成”或“由相关特征组成”的实施方式。
术语“核苷酸”是指天然存在的核糖核苷酸或脱氧核糖核苷酸单体,以及它们的非天然存在的衍生物和类似物。因此,核苷酸可以包括,例如,包含天然存在的碱基(例如,A、G、C或T)的核苷酸、包含修饰碱基(例如,7-脱氮鸟苷或肌苷)的核苷酸和包含修饰核糖的核苷酸(例如,锁核酸(LNA))。
核酸模板
在某些实施方式中,核酸模板是互补DNA(cDNA)模板。如本文所用,“互补DNA”或“cDNA”是指在逆转录酶催化的反应中从单链RNA(例如,信使RNA(mRNA)、非聚腺苷酸化RNA、微小RNA)模板合成的核酸分子。在某些实施方式中,由逆转录酶催化的反应使用选自oligo(dT)引物、基因特异性引物和随机寡聚体的RT引物。在某些实施方式中,随机寡聚体是随机六聚体。
在某些实施方式中,核酸模板是通过cDNA分子的扩增产生的双链DNA分子(例如,扩增子)。
在某些实施方式中,cDNA模板是通过反转录来自单个细胞的RNA(例如,mRNA)获得的。在其他实施方式中,cDNA模板是通过逆转录来自多个细胞的RNA(例如,mRNA)获得的。细胞的非限制性实例包括哺乳动物细胞、植物细胞、细菌细胞和真菌细胞。在某些实施方式中,细胞是哺乳动物细胞。在某些实施方式中,细胞是癌细胞。在某些实施方式中,癌症是血癌(白血病、淋巴瘤或骨髓瘤)。在某些实施方式中,细胞是转移的癌细胞。
在某些实施方式中,cDNA模板对应于10x Genomics’3’RNA-Seq文库(图1A和1B)的cDNA。在某些实施方式中,cDNA模板对应于第一链cDNA。在某些实施方式中,cDNA模板从5'端到3'端包含第一通用序列的至少一部分、标签序列和靶核酸分子序列。在某些实施方式中,cDNA模板从5'端到3'端包含第一通用序列的至少一部分、标签序列、靶核酸分子序列和第一模板转换寡聚物(TSO1)序列。在某些实施方式中,cDNA模板从5'端到3'端包含第一通用序列的至少一部分、标签序列、poly(T)序列和靶核酸分子序列。在某些实施方式中,cDNA模板从5'端到3'端包含第一通用序列的至少一部分、标签序列、poly(T)序列、靶核酸分子序列和TSO1序列。在某些实施方式中,第一通用序列的至少一部分是截短的第一通用序列。在某些实施方式中,第一通用序列的至少一部分是整个第一通用序列。
在某些实施方式中,TSO1序列包含
5’AAGCAGTGGTATCAACGCAGAGTACATrGrGrG 3’(SEQ ID NO:1)。如本文所用,“rG”代表核糖鸟苷。
在某些实施方式中,TSO1序列包含
5’AGAGACAGATTGCGCAATGNNNNNNNNrGrGrG 3’(SEQ ID NO:2),其中,rG是核糖鸟苷。
在某些实施方式中,TSO1序列包含5’AAGCAGTGGTATCAACGCAGAGTACATrGrG+G 3’(SEQ ID NO:3),其中,rG是核糖鸟苷,并且+G是锁核酸(LNA)修饰的鸟苷。
在某些实施方式中,cDNA模板对应于10x Genomics’5’RNA-Seq文库的cDNA(图2)。在某些实施方式中,cDNA模板对应于第二链cDNA。在某些实施方式中,cDNA模板从5'端到3'端包含第一通用序列的至少一部分、标签序列和靶核酸分子序列。在某些实施方式中,cDNA模板从5'端到3'端包含第一通用序列的至少一部分、标签序列、靶核酸分子序列和poly(A)序列。在某些实施方式中,cDNA模板从5'端到3'端包含第一通用序列的至少一部分、标签序列、靶核酸分子序列和PCR handle序列。在某些实施方式中,cDNA模板从5'端到3'端包含第一通用序列的至少一部分、标签序列、靶核酸分子序列、poly(A)序列和PCR handle序列。在某些实施方式中,第一通用序列的至少一部分是截短的第一通用序列。在某些实施方式中,第一通用序列的至少一部分是整个第一通用序列。
在某些实施方式中,cDNA模板从5'端到3'端包含第二模板转换寡聚物(TSO2)序列和靶核酸分子序列。在某些实施方式中,cDNA模板从5'端到3'端包含TSO2序列、靶核酸分子序列和poly(A)序列。在某些实施方式中,cDNA模板从5'端到3'端包含TSO2序列、靶核酸分子序列和PCR handle序列。在某些实施方式中,cDNA模板从5'端到3'端包含TSO2序列、靶核酸分子序列、poly(A)序列和PCR handle序列。
在某些实施方式中,PCR handle序列包含5’AAGCAGTGGTATCAACGCAGAGTAC 3’(SEQID NO:4)。
在某些实施方式中,TSO2序列从5'端到3'端包含截短的第一通用序列、标签序列和5’TTTCTTATATrGrGrG 3’(SEQ ID NO:6)。在某些实施方式中,TSO2序列从5'端到3'端包含5’CTACACGACGCTCTTCCGATCT 3’(SEQ ID NO:5)、标签序列和5’TTTCTTATATrGrGrG 3’(SEQ ID NO:6)。
在某些实施方式中,cDNA模板在多个cDNA中。
在某些实施方式中,所述方法进一步包括进行靶核酸分子(例如,靶mRNA)的逆转录以生成核酸模板(例如,cDNA模板)。在某些实施方式中,进行靶核酸分子的逆转录包括使mRNA(例如,来自单个细胞)与逆转录寡核苷酸和逆转录酶接触。在某些实施方式中,逆转录寡核苷酸选自由oligo(dT)引物、基因特异性引物和随机寡聚物组成的组。在某些实施方式中,随机寡聚体是随机六聚体。在某些实施方式中,逆转录寡核苷酸与珠结合。在某些实施方式中,样品(例如单个细胞)中的靶核酸分子和非靶核酸分子(即mRNA)都被逆转录,从而产生与非靶cDNA产物混合的cDNA模板(靶cDNA产物)。
在某些实施方式中,所述方法进一步包括进行cDNA末端的快速扩增(RACE)以生成核酸模板(例如,cDNA模板)。在某些实施方式中,进行5'-RACE。在某些实施方式中,进行3'-RACE。
靶核酸分子
术语“靶核酸分子”是指包含被分析的连续核苷酸序列的核酸分子(例如,就表达水平、序列信息或突变的存在进行分析)。
靶核酸分子可以是,例如,DNA、cDNA或RNA(例如,非编码RNA或mRNA)。在某些实施方式中,靶核酸分子是非编码RNA。在某些实施方式中,靶核酸分子是mRNA。在某些实施方式中,靶核酸分子包含poly(A)序列。
关于核酸的术语“序列”是指通过共价键(例如,磷酸二酯键)连接的一系列连续的核苷酸。
在某些实施方式中,靶核酸分子序列包含一个目标基因座。在某些实施方式中,目标基因座包含突变、多态性、插入、缺失、基因融合、编辑的核苷酸、修饰的核苷酸、转基因或其组合。在某些实施方式中,靶核酸分子序列包含至少两个目标基因座,例如,2、3、4个以上目标基因座。
通用序列
在某些实施方式中,第一通用序列的至少一部分(例如,截短的第一通用序列)充当用于以测序仪依赖性方式进行下游扩增的PCR handle。第一通用序列可以通过cDNA制备方法来选择。在某些实施方式中,cDNA制备方法是10x Genomics和/或测序仪是Illumina测序仪。在某些实施方式中,截短的第一通用序列是在10x Genomics试剂盒中使用的截短的Illumina Read 1序列。
在某些实施方式中,第一通用序列的至少一部分是整个第一通用序列。在某些实施方式中,整个第一通用序列包含5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’(SEQ IDNO:7)。
在某些实施方式中,第一通用序列的至少一部分是截短的第一通用序列。在某些实施方式中,与整个第一通用序列相比,截短的第一通用序列在5’端缺失至少一个核苷酸。在某些实施方式中,截短的第一通用序列包含5’CTACACGACGCTCTTCCGATCT 3’(SEQ ID NO:5)。
缺失的第一通用序列是指截短的第一通用序列中缺失整个第一通用序列的5'序列。缺失的第一通用序列可包含1-20个核苷酸,例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或1-15、2-15、2-14、3-14、3-13或4-13个核苷酸。
第二通用序列的至少一部分可以基于下游测序仪器来选择或者可以是具有对于PCR特异性而言具有足够高的Tm的任何序列。第二通用序列的至少一部分不应匹配任何已知的天然存在的序列。在某些实施方式中,第二通用序列的至少一部分也在环化事件中起作用。
在某些实施方式中,第二通用序列的至少一部分是截短的第二通用序列。在某些实施方式中,第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中,整个第二通用序列包含5’ACACGTCTGAACTCC 3’(SEQ ID NO:8)。在某些实施方式中,整个第二通用序列包含5’GGAGTTCAGACGTGT 3’(SEQ ID NO:9)。
标签序列
在某些实施方式中,标签序列包含细胞识别标签或独特分子标识符(UMI)序列,或其组合。
如本文所用,“细胞识别标签”是指可以掺入延伸产物(例如,扩增子)中并在测序应用中用于鉴定产生延伸产物的特定细胞(例如,单个细胞)或细胞类型的核苷酸序列。细胞识别标签可以包含在引物(例如,延伸引物,如oligo(dT)引物,或扩增引物)中以用于引入延伸产物(例如,RT产物、扩增子)中。可以通过合适的核酸聚合酶,如逆转录酶或DNA聚合酶,将细胞识别标签掺入延伸产物中。
细胞识别标签序列的非限制性实例包括
5’AAACCTGAGAAACCAT 3’(SEQ ID NO:10),
5’AAACCTGAGAAACCGC 3’(SEQ ID NO:11),
5’AAACCTGAGAAACCTA3’(SEQ ID NO:12),
5’AAACCTGAGAAACGAG 3’(SEQ ID NO:13),
5’AAACCTGAGAAACGCC 3’(SEQ ID NO:14),
5’AAACCTGAGAAAGTGG 3’(SEQ ID NO:15),
5’AAACCTGAGAACAACT 3’(SEQ ID NO:16),
5’AAACCTGAGAACAATC 3’(SEQ ID NO:17),
5’AAACCTGAGAACTCGG 3’(SEQ ID NO:18),和
5’AAACCTGAGAACTGTA3’(SEQ ID NO:19)。
细胞识别标签序列的其他实例可以在https://kb.10xgenomics.com/hc/en-us/articles/115004506263-What-is-a-barcode-whitelist-中找到。
“独特分子标识符”或“UMI”,也称为“随机分子标签(RMT)”,是用于标记核酸分子(例如,在扩增之前)并有助于重复项的识别。UMI通常是随机序列,通常大小范围为约4至约20个核苷酸长度。UMI的实例在本领域中是已知的。
在基于孔的系统(例如,基于96孔的系统)中,如果每个孔包含0或1个细胞,则细胞识别标签序列是可选的。
在某些实施方式中,UMI包含至少一个随机核苷酸序列,例如,1、2、3、4、5、6、7、8、9、10个以上随机核苷酸序列。随机核苷酸序列可包含1、2、3、4、5、6、7个以上核苷酸。某些实施方式中,随机核苷酸是随机六聚体。某些实施方式中,UMI包含10个核苷酸。某些实施方式中,UMI包含12个核苷酸。
第一寡核苷酸
第一寡核苷酸的长度可在约15至约110个核苷酸的范围内。例如,寡核苷酸的长度约为:15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105或110个核苷酸。在某些实施方式中,寡核苷酸的长度为约:20-110、25-110、25-100、30-100、30-95、35-95、35-90、40-90、40-85、50-85、50-80、55-80、55-75、60-75或60-70个核苷酸。
在某些实施方式中,第一寡核苷酸退火至靶核酸分子序列,该靶核酸分子序列是目标基因座3'的约0-400个核苷酸。例如,约:目标基因座3'的0-375、0-350、0-325、0-300、0-275、0-250、0-225、0-200、0-175、0-150、0-125、0-100、0-75、0-50、或0-25个核苷酸。在某些实施方式中,第一寡核苷酸退火至靶核酸分子序列,该序列是目标基因座3'的约0-150个核苷酸。
分子生物学领域的技术人员可以设计适合于要使用的序列平台和试剂盒的第一寡核苷酸。在某些实施方式中,第一寡核苷酸退火至靶核酸分子序列,该序列是目标基因座3’的约0-134,000个核苷酸(例如,用于纳米孔测序)。在某些实施方式中,第一寡核苷酸退火至靶核酸分子序列,该序列是目标基因座3’的约0-16,000个核苷酸处(例如,用于PacBio测序)。在某些实施方式中,第一寡核苷酸退火至靶核酸分子序列,该序列是目标基因座3’的约0-400个核苷酸(例如,用于Illumina测序)。在某些实施方式中,第一寡核苷酸退火至靶核酸分子序列,该序列是目标基因座3’的约0-150个核苷酸(例如,用于Illumina测序)。
在某些实施方式中,第一寡核苷酸包含靶核酸分子特异性序列。在某些实施方式中,第一寡核苷酸从5'端到3'端包含第二通用序列和靶核酸分子特异性序列。在某些实施方式中,第一寡核苷酸从5'端到3'端包含缺失的第一通用序列、第二通用序列和靶核酸分子特异性序列。
在某些实施方式中,第一寡核苷酸包含5’GGAAAGAGTGT 3’(SEQ ID NO:20),5’GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT 3’(SEQ ID NO:31)和靶核酸分子特异性序列。在某些实施方式中,第一寡核苷酸包含5’GGAAAGAGTGT 3’(SEQ ID NO:20)、[i7]、5’GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT 3’(SEQ ID NO:31)和靶核酸分子特异性序列。[i7]是指示(I7)接头序列(Illumina,San Diego,CA)。在某些实施方式中,[i7]序列选自由SEQ ID NO:34-57组成的组。
在某些实施方式中,第一寡核苷酸包含5’GGAGTTCAGACGTGTGCTCTTCCGATCT 3’(SEQ ID NO:21)和靶核酸分子特异性序列。
在某些实施方式中,靶核酸分子序列包含至少两个目标基因座。在某些实施方式中,第一寡核苷酸退火至靶核酸分子序列,该序列位于目标基因座的3’(参考图4的可选方案)。在其他实施方式中,所述方法包含以下步骤:
a)将多个寡核苷酸退火至cDNA模板;
b)从多个退火的寡核苷酸进行cDNA模板导向的核酸延伸以产生多个第一延伸产物,其包含含有一个或多个目标基因座的靶核酸分子序列的全部或一部分、标签序列和第一通用序列的至少一部分;
c)环化多个第一延伸产物以产生多个环化的DNA模板,其包含一个或多个目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分;和
d)进行环化的DNA模板导向的核酸扩增以产生多个DNA扩增子,其包含一个或多个目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分,
从而产生用于测序的多个标记的DNA扩增子。
在某些实施方式中:
a)多个第一延伸产物中的每一个包含截短的第一通用序列;
b)多个环化的DNA模板中的每一个包含整个第一通用序列和整个第二通用序列;和
c)多个DNA扩增子中的每一个包含整个第一通用序列和整个第二通用序列。
在某些实施方式中,从多个退火的寡核苷酸进行cDNA模板导向的核酸延伸使用缺乏5'→3'核酸外切酶活性的DNA聚合酶进行(例如,Bst DNAPolymerase,Large Fragment,New England Biolabs,Ipswich,MA)。
在其他实施方式中,所述方法包括以下步骤:
a)提供核酸模板,其包含靶核酸分子序列、标签序列和第一通用序列的至少一部分,其中,所述靶核酸分子序列包含目标基因座;
b)通过以下方式进行核酸模板导向的核酸扩增以产生多种扩增产物:
i.在多个寡核苷酸引物和第一引物退火至核酸模板中的互补核苷酸序列的条件下,使核酸模板与包含多个寡核苷酸引物和第一引物的反应混合物接触,其中,第一引物包含第一通用序列的至少一部分;和
ii.延伸多个寡核苷酸和第一引物中的每一个;
c)环化多个第一扩增产物以产生多个环化的DNA模板,其包含一个或多个目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分;和
d)进行环化的DNA模板导向的核酸扩增以产生多个DNA扩增子,其包含一个或多个目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分,
从而生成用于测序的多个标记的DNA扩增子。
在某些实施方式中:
a)多个环化的DNA模板中的每一个包含整个第一通用序列和整个第二通用序列;和
b)多个DNA扩增子中的每一个包含整个第一通用序列和整个第二通用序列。
在某些实施方式中,核酸模板导向的核酸扩增使用缺乏5'→3'核酸外切酶活性的DNA聚合酶进行(例如,Bst DNA Polymerase,Large Fragment,New England Biolabs,Ipswich,MA)。
核酸模板导向的核酸延伸
在某些实施方式中,第一延伸产物从5'端到3'端包含含有目标基因座的靶核酸分子序列的全部或一部分、标签序列和第一通用序列的至少一部分。在某些实施方式中,第一延伸产物从5'端到3'端包含含有目标基因座的靶核酸分子序列的全部或一部分、poly(A)序列、标签序列和第一通用序列的至少一部分。
在某些实施方式中,第一延伸产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、标签序列和第一通用序列的至少一部分。在某些实施方式中,第一延伸产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、poly(A)序列,标签序列和第一通用序列的至少一部分。
在某些实施方式中,第一延伸产物从5'端到3'端包含含有目标基因座的靶核酸分子序列的全部或一部分和TSO2序列。在某些实施方式中,第一延伸产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分和TSO2序列。
在某些实施方式中,第一通用序列的至少一部分是截短的第一通用序列。在某些实施方式中,第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中,第一通用序列的至少一部分是截短的第一通用序列并且第二通用序列的至少一部分是整个第二通用序列。
在某些实施方式中,第一延伸产物在5’端包含缺失的第一通用序列。在某些实施方式中,第一延伸产物从5'端到3'端包含缺失的第一通用序列、第二通用序列、包含目标基因座的靶核酸分子序列的全部或一部分、标签序列和截短的第一通用序列。在某些实施方式中,第一延伸产物从5'端到3'端包含缺失的第一通用序列、第二通用序列、包含目标基因座的靶核酸分子序列的全部或一部分、poly(A)序列、标签序列和截短的第一通用序列。在某些实施方式中,第一延伸产物从5'端到3'端包含缺失的第一通用序列、第二通用序列、包含目标基因座的靶核酸分子序列的全部或一部分和TSO2序列。
在某些实施方式中,第一延伸产物包含全部靶核酸分子序列。在某些实施方式中,第一延伸产物包含含有目标基因座的靶核酸分子序列的一部分。
第一延伸产物导向的核酸扩增
在某些实施方式中,所述方法进一步包括进行第一延伸产物导向的核酸扩增以扩增第一延伸产物。在某些实施方式中,使用第一寡核苷酸和第一引物进行第一延伸产物导向的核酸扩增。
在某些实施方式中,第一引物包含整个第一通用序列的至少一部分。在某些实施方式中,第一引物包含截短的第一通用序列的至少一部分。
在某些实施方式中,第一引物进一步包含第二通用序列的至少一部分。在某些实施方式中,第一引物从5'端到3'端包含第二通用序列的至少一部分、缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中,第一引物从5'端到3'端包含第二通用序列的至少一部分和第一通用序列的至少一部分。在某些实施方式中,第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中,第二通用序列的至少一部分是截短的第二通用序列。在某些实施方式中,第一引物从5'端到3'端包含整个第二通用序列、缺失的第一通用序列和截短的第一通用序列的至少一部分。
在某些实施方式中,第一引物进一步包含[i7]。在某些实施方式中,第一引物从5'端到3'端包含第二通用序列的至少一部分、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中,第一引物从5'端到3'端包含第二通用序列的至少一部分、[i7]和第一通用序列的至少一部分。在某些实施方式中,第一引物从5'端到3'端包含整个第二通用序列、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中,第一引物从5'端到3'端包含[i7]和整个第一通用序列的至少一部分。在某些实施方式中,第一引物从5'端到3'端包含[i7]和截短的第一通用序列的至少一部分。在某些实施方式中,[i7]序列选自由SEQ ID NO:34-57组成的组。
在某些实施方式中,第一引物是第一反向引物。在某些实施方式中,第一反向引物包含截短的第一通用序列的至少一部分。在某些实施方式中,第一反向引物从5'端到3'端包含缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中,第一反向引物从5'端到3'端包含第二通用序列、缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中,第一反向引物从5'端到3'端包含第二通用序列、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中,第一反向引物从5'端到3'端包含5’ACACGTCTGAACTCCAGTCAC 3’(SEQ ID NO:22)和5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’(SEQ ID NO:7)。在某些实施方式中,第一反向引物从5'端到3'端包含5’ACACGTCTGAACTCCAGTCAC 3’(SEQ ID NO:22)、[i7]和5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’(SEQ ID NO:7)。
在某些实施方式中,第一引物是第一正向引物。在某些实施方式中,第一正向引物包含截短的第一通用序列的至少一部分。在某些实施方式中,第一正向引物从5'端到3'端包含缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中,第一正向引物从5'端到3'端包含第二通用序列、缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中,第一正向引物从5'端到3'端包含第二通用序列、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中,第一正向引物从5'端到3'端包含5’ACACGTCTGAACTCCAGTCAC 3’(SEQ ID NO:22)、[i7]和5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’(SEQ ID NO:7)。
在某些实施方式中(3’文库),第一延伸产物导向的核酸扩增产物从5'端到3'端包含5’GGAGTTCAGACGTGTGCTCTTCCGATCT 3’(SEQ ID NO:21)、包含目标基因座的靶核酸分子序列的全部或一部分、poly(A)、细胞识别标签序列、UMI、5’AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT 3’(SEQ ID NO:23)、[i7]和5’GTGACTGGAGTTCAGACGTGT 3’(SEQ ID NO:24)。
在某些实施方式中(5’文库),第一延伸产物导向的核酸扩增产物从5'端到3'端包含5’ACACGTCTGAACTCCAGTCAC 3’(SEQ ID NO:22)、[i7]、5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’(SEQ ID NO:7)、细胞识别标签序列、5’TTTCTTATATGGG 3’(SEQ ID NO:25)、包含目标基因座的靶核酸分子序列的全部或一部分和5’AGATCGGAAGAGCACACGTCTGAACTCC 3’(SEQ ID NO:26)。
在某些实施方式中,第一寡核苷酸或第一引物在3’端进一步包含RNA碱基,随后是封闭结构域;扩增第一延伸产物包括进行RNase H依赖性PCR。在某些实施方式中,进行RNA酶H依赖性PCR增加了第一延伸产物导向的核酸扩增的特异性。例如,国际申请No.PCT/IB2019/001398中描述了所述方法的细节,其内容通过引用并入本文。
核酸模板导向的核酸扩增
在某些实施方式中,第一寡核苷酸包含靶核酸分子特异性序列。在某些实施方式中,第一寡核苷酸从5'端到3'端包含第二通用序列的至少一部分和靶核酸分子特异性序列。在某些实施方式中,第一寡核苷酸从5'端到3'端包含缺失的第一通用序列、第二通用序列的至少一部分和靶核酸分子特异性序列。在某些实施方式中,第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中,第二通用序列的至少一部分是截短的第二通用序列。
在某些实施方式中,第一引物包含整个第一通用序列的至少一部分。在某些实施方式中,第一引物包含截短的第一通用序列的至少一部分。在某些实施方式中,第一引物从5'端到3'端包含缺失的第一通用序列和截短的第一通用序列的至少一部分。
在某些实施方式中,第一引物进一步包含第二通用序列的至少一部分。在某些实施方式中,第一引物从5'端到3'端包含第二通用序列的至少一部分、缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中,第一引物从5'端到3'端包含第二通用序列的至少一部分和整个第一通用序列的至少一部分。在某些实施方式中,第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中,第二通用序列的至少一部分是截短的第二通用序列。在某些实施方式中,第一引物从5'端到3'端包含整个第二通用序列、缺失的第一通用序列和截短的第一通用序列的至少一部分。
在某些实施方式中,第一引物进一步包含[i7]。在某些实施方式中,第一引物从5'端到3'端包含[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中,第一引物从5'端到3'端包含[i7]和整个第一通用序列的至少一部分。在某些实施方式中,第一引物从5'端到3'端包含第二通用序列的至少一部分、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中,第一引物从5'端到3'端包含第二通用序列的至少一部分、[i7]和整个第一通用序列的至少一部分。在某些实施方式中,第二通用序列的至少一部分是截短的第二通用序列。在某些实施方式中,第一引物从5'端到3'端包含整个第二通用序列、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分。
在某些实施方式中:
a)第一寡核苷酸从5'端到3'端包含整个第二通用序列和靶核酸分子特异性序列;和
b)第一引物从5'端到3'端包含整个第二通用序列、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分。
在某些实施方式中,第一引物是第一反向引物。在某些实施方式中,第一反向引物从5'端到3'端包含5’ACACGTCTGAACTCCAGTCAC 3’(SEQ ID NO:22)、[i7]和5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’(SEQ ID NO:7)。
在某些实施方式中,第一引物是第一正向引物。在某些实施方式中,第一正向引物从5'端到3'端包含5’ACACGTCTGAACTCCAGTCAC 3’(SEQ ID NO:22)、[i7]和5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’(SEQ ID NO:7)。
在某些实施方式中,第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、标签序列、第一通用序列的至少一部分、[i7]和第二通用序列的至少一部分。在某些实施方式中,第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、poly(A)序列、标签序列、第一通用序列的至少一部分、[i7]和第二通用序列的至少一部分(参见,例如,图1B)。在某些实施方式中,第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、TSO2序列、[i7]和第二通用序列的至少一部分(参见,例如,图2)。
在某些实施方式中,第一扩增产物从5'端到3'端包含含有目标基因座的靶核酸分子序列的全部或一部分、标签序列、第一通用序列的至少一部分、[i7]和第二通用序列的至少一部分。在某些实施方式中,第一扩增产物从5'端到3'端包含含有目标基因座的靶核酸分子序列的全部或一部分、poly(A)序列、标签序列、第一通用序列的至少一部分、[i7]和第二通用序列的至少一部分。在某些实施方式中,第一扩增产物从5'端到3'端包含含有目标基因座的靶核酸分子序列的全部或一部分、TSO2序列、[i7]和第二通用序列的至少一部分。
在某些实施方式中,第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、标签序列、第一通用序列的至少一部分和[i7]。在某些实施方式中,第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、poly(A)序列、标签序列、第一通用序列的至少一部分和[i7]。在某些实施方式中,第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、TSO2序列和[i7]。
在某些实施方式中,第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分。在某些实施方式中,第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、poly(A)序列、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分。在某些实施方式中,第一扩增产物从5'端到3'端包含第二通用序列、包含目标基因座的靶核酸分子序列的全部或一部分、TSO2序列和第二通用序列的至少一部分。
在某些实施方式中,第一扩增产物从5'端到3'端包含含有目标基因座的靶核酸分子序列的全部或一部分、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分。在某些实施方式中,第一扩增产物从5'端到3'端包含含有目标基因座的靶核酸分子序列的全部或一部分、poly(A)序列、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分。在某些实施方式中,第一扩增产物从5'端到3'端包含含有目标基因座的靶核酸分子序列的全部或一部分、TSO2序列和第二通用序列的至少一部分。
在某些实施方式中,第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、标签序列和第一通用序列的至少一部分。在某些实施方式中,第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、poly(A)序列、标签序列和第一通用序列的至少一部分。在某些实施方式中,第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分和TSO2序列。
在某些实施方式中,第一通用序列的至少一部分是整个第一通用序列。在某些实施方式中,第一通用序列的至少一部分是截短的第一通用序列。在某些实施方式中,第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中,第二通用序列的至少一部分是截短的第二通用序列。在某些实施方式中,第一通用序列的至少一部分是整个第一通用序列并且第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中,第一通用序列的至少一部分是整个第一通用序列并且第二通用序列的至少一部分是截短的第二通用序列。在某些实施方式中,第一通用序列的至少一部分是截短的第一通用序列并且第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中,第一通用序列的至少一部分是截短的第一通用序列并且第二通用序列的至少一部分是截短的第二通用序列。
在某些实施方式中,第一扩增产物包含全部靶核酸分子序列。在某些实施方式中,第一扩增产物包含含有目标基因座的靶核酸分子序列的一部分。
在某些实施方式中(3’文库),第一扩增产物从5'端到3'端包含5’GGAGTTCAGACGTGTGCTCTTCCGATCT 3’(SEQ ID NO:21)、包含目标基因座的靶核酸分子序列的全部或一部分、poly(A)、细胞识别标签序列、UMI、5’AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT 3’(SEQ ID NO:23)、[i7]和5’GTGACTGGAGTTCAGACGTGT 3’(SEQ ID NO:24)。
在某些实施方式中(5’RNA-Seq文库),第一扩增产物从5'端到3'端包含5’ACACGTCTGAACTCCAGTCAC 3’(SEQ ID NO:22)、[i7]、5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’(SEQ ID NO:7)、细胞识别标签序列,5’TTTCTTATATGGG 3’(SEQ ID NO:25)、包含目标基因座的靶核酸分子序列的全部或一部分和5’AGATCGGAAGAGCACACGTCTGAACTCC 3’(SEQID NO:26)。
在某些实施方式中,第一寡核苷酸或第一引物在3'端进一步包含RNA碱基,随后是封闭结构域;扩增第一延伸产物包括进行RNase H依赖性PCR。在某些实施方式中,进行依赖于RNase HPCR增加了核酸模板导向的核酸扩增的特异性。例如,国际申请No.PCT/IB2019/001398中描述了该方法的细节,其内容通过引用并入本文。
环化第一个延伸和/或扩增产物
在某些实施方式中,所述方法包括单个环化步骤。在某些实施方式中,需要单个环化步骤的方法提高了效率、减少了数据丢失或其组合。
在某些实施方式中,环化第一延伸和/或扩增产物包括由吉布森组装介导的分子内连接、夹板连接或使用热稳定的ATP依赖性连接酶的连接。在某些实施方式中,环化第一延伸和/或扩增产物包括由吉布森组装介导的分子内连接。在某些实施方式中,环化第一延伸和/或扩增产物包括由夹板连接介导的分子内连接。在某些实施方式中,环化第一延伸和/或扩增产物包括由使用热稳定的ATP依赖性连接酶的连接介导的分子内连接。热稳定的ATP依赖性连接酶的非限制性实例包括CIRCL-连接酶和T4 DNA连接酶。
环化的DNA模板可以是单链或双链的。
在某些实施方式中,环化的DNA模板包括:
a)第二通用序列的至少一部分;
b)包含目标基因座的靶核酸分子序列的全部或一部分;
c)标签序列;和
d)第一通用序列的至少一部分。
在某些实施方式中,环化的DNA模板包括:
a)第二通用序列的至少一部分;
b)包含目标基因座的靶核酸分子序列的全部或一部分;
c)标签序列;
d)第一通用序列的至少一部分;和
e)[i7]。
在某些实施方式中,环化的DNA模板包括:
a)第二通用序列的至少一部分;
b)包含目标基因座的靶核酸分子序列的全部或一部分;
c)poly(A)序列;
d)标签序列;第一通用序列的至少一部分;和
e)第二通用序列的至少一部分。
在某些实施方式中,环化的DNA模板包括:
a)第二通用序列的至少一部分;
b)包含目标基因座的靶核酸分子序列的全部或一部分;
c)poly(A)序列;
d)标签序列;
e)第一通用序列的至少一部分;和
f)[i7]。
在某些实施方式中,环化的DNA模板包括:
a)第二通用序列的至少一部分;
b)包含目标基因座的靶核酸分子序列的全部或一部分;和
c)TSO2序列。
在某些实施方式中,环化的DNA模板包括:
a)第二通用序列的至少一部分;
b)包含目标基因座的靶核酸分子序列的全部或一部分;
c)TSO2序列;和
d)[i7]。
在某些实施方式中,第一通用序列的至少一部分是整个第一通用序列。在某些实施方式中,第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中,第一通用序列的至少一部分是整个第一通用序列并且第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中,第一通用序列的至少一部分是截短的第一通用序列。在某些实施方式中,第二通用序列的至少一部分是截短的第二通用序列。
环化的DNA模板导向的核酸扩增
在某些实施方式中,环化的DNA模板导向的核酸扩增包括用高保真DNA聚合酶扩增环化的DNA模板的一部分。高保真DNA聚合酶的非限制性实例包括高保真DNA聚合酶(New England Biolabs Inc.,Ipswich,MA)和KOD DNA聚合酶(Sigma Aldrich,St.Louis,MO)。
在某些实施方式中,进行环化的DNA模板导向的核酸扩增使用第二正向引物和第二反向引物。
在某些实施方式中,第二正向引物或第二反向引物包含靶核酸分子特异性序列、标签序列的全部或一部分、第一通用序列的全部或一部分、poly(A)序列、或其组合。
在某些实施方式中,第二正向引物包含靶核酸分子特异性序列。在某些实施方式中,第二正向引物从5'端到3'端包含Illumina P7序列和靶核酸分子特异性序列。在某些实施方式中,第二正向引物包含poly(A)序列。在某些实施方式中,第二正向引物从5'端到3'端包含Illumina P7序列和poly(A)序列。在某些实施方式中,第二正向引物包含TSO2序列。在某些实施方式中,第二正向引物从5'端到3'端包含Illumina P7序列和TSO2序列。
在某些实施方式中,第二反向引物包含靶核酸分子特异性序列。在某些实施方式中,第二反向引物从5'端到3'端包含Illumina P5序列和靶核酸分子特异性序列。
在某些实施方式中:
a)第二正向引物进一步包含与第一固定化寡核苷酸序列相反且互补的序列;和
b)第二反向引物进一步包含与第二固定化寡核苷酸序列反向和互补的序列。
在某些实施方式中,第一和第二固定化寡核苷酸被固定在Illumina流通池上。
在某些实施方式中,第一和第二固定化寡核苷酸序列分别包含:
a)CCTCTCTATGGGCAGTCGGTGAT(SEQ ID NO:27)和CCATCTCATCCCTGCGTGTCTCCGACTCAG(SEQ ID NO:28);
b)CCATCTCATCCCTGCGTGTCTCCGACTCAG(SEQ ID NO:28)和CCTCTCTATGGGCAGTCGGTGAT(SEQ ID NO:27);或
c)CAAGCAGAAGACGGCATACGAGAT(SEQ ID NO:29)和AATGATACGGCGACCACCGAGATCTACAC(SEQ ID NO:30)。
在某些实施方式中(3’RNA-Seq文库):
a)第二正向引物从5'端到3'端包含5’AATGATACGGCGACCACCGAGATCTACAC 3’(SEQID NO:30)和靶核酸分子特异性序列;和
b)第二反向引物从5'端到3'端包含5’CAAGCAGAAGACGGCATACGAGAT 3’(SEQ IDNO:29)和poly(A)序列或靶核酸分子特异性序列。
在某些实施方式中(5’RNA-Seq文库):
a)第二正向引物从5'端到3'端包含5’AATGATACGGCGACCACCGAGATCTACAC 3’(SEQID NO:30)和靶核酸分子特异性序列;和
b)第二反向引物从5'端到3'端包含5’CAAGCAGAAGACGGCATACGAGAT 3’(SEQ IDNO:29)和TSO2序列或靶核酸分子特异性序列。
在某些实施方式中,第二正向引物或第二反向引物在3'端进一步包含RNA碱基,随后是封闭结构域;扩增环化的DNA模板包括进行RNase H依赖性PCR(rhPCR)。在某些实施方式中,进行rhPCR以增加PCR特异性。例如,国际申请No.PCT/IB2019/001398中描述了该方法的细节,其内容通过引用并入本文。
DNA扩增子
在某些实施方式中,DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、[i7]、第一通用序列的至少一部分、标签序列、poly(T)序列和Illumina P7序列(参见,例如,图1A)。在某些实施方式中,DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、第一通用序列的至少一部分、标签序列、poly(T)序列和Illumina P7序列。
在某些实施方式中,DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、[i7]、TSO2序列和Illumina P7序列(参见,例如,图2)。在某些实施方式中,DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、TSO2序列和Illumina P7序列。
在某些实施方式中,DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、[i7]、第一通用序列的至少一部分、标签序列和Illumina P7序列。在某些实施方式中,DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、第一通用序列的至少一部分、标签序列和Illumina P7序列。
在某些实施方式中,第一通用序列的至少一部分是整个第一通用序列。在某些实施方式中,第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中,第一通用序列的至少一部分是整个第一通用序列并且第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中,第一通用序列的至少一部分是截短的第一通用序列。在某些实施方式中,第二通用序列的至少一部分是截短的第二通用序列。
在某些实施方式中,DNA扩增子的长度在约100个碱基对和约5,000个碱基对之间。例如,长度约:100-4,500、150-4,500、150-4,000、200-4,000、200-3,500、250-3,500、250-3,000、300-3,000、300-2,500、350-2,500、350-2,000、350-1,500、350-1,000、300-1,000、300-800、400-800或400-600个碱基对。在某些实施方式中,DNA扩增子的长度在约200个碱基对和约500个碱基对之间。
在某些实施方式中,DNA扩增子的长度小于约5,000个碱基对。例如,长度小于约4,500、4,000、3,500、3,000、2,500、2,000、1,500、1,000、900、800、700、600、500、400、300或200个碱基对。
在某些实施方式中(3’RNA-Seq文库),DNA扩增子从5'端到3'端包含5’AATGATACGGCGACCACCGAGATCTACAC 3’(SEQ ID NO:30)、目标基因座、5’AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’(SEQ ID NO:32)、[i7]、5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT3’(SEQ ID NO:7)、细胞识别标签序列、UMI、oligo(dT)、靶核酸分子特异性序列的反向和互补序列和5’ATCTCGTATGCCGTCTTCTGCTTG 3’(SEQ ID NO:33)。
在某些实施方式中(5’RNA-Seq文库),DNA扩增子从5'端到3'端包含5’AATGATACGGCGACCACCGAGATCTACAC 3’(SEQ ID NO:30)、目标基因座、5’AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’(SEQ ID NO:32)、[i7]、5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT3’(SEQ ID NO:7)、细胞识别标签序列、UMI、TSO2、靶核酸分子特异性序列和5’ATCTCGTATGCCGTCTTCTGCTTG 3’(SEQ ID NO:33)。
测序
在某些实施方式中,所述方法用于制作测序文库。
在某些实施方式中,所述方法进一步包含对DNA扩增子进行测序。
在某些实施方式中,使用第一通用序列特异性引物、第二通用序列特异性引物、I7序列特异性引物或前述的组合进行测序。在某些实施方式中,第一通用序列特异性引物包含ACACTCTTTCCCTACACGACGCTCTTCCGATCT(SEQ ID NO:7)的全部或一部分。在某些实施方式中,第二通用序列特异性引物包含GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT(SEQ ID NO:31)的全部或一部分。在某些实施方式中,I7序列特异性引物包含AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC(SEQ ID NO:32)的全部或一部分。
在某些实施方式中,所述方法鉴定修饰的核苷酸。鉴定修饰的核苷酸可能需要对样品进行预处理。
在另一方面,本发明提供了用于测序的标记DNA扩增子,其从5'端到3'端包含目标基因座、第二通用序列的至少一部分、第一通用序列的至少一部分和标签序列。另一方面,本发明提供了用于测序的标记DNA扩增子,其从5'端到3'端包含目标基因座、第二通用序列、第一通用序列的至少一部分和标签序列。另一方面,本发明提供了用于测序的标记DNA扩增子,其从5'端到3'端包含目标基因座、第二通用序列的至少一部分、第一通用序列和标签序列。在某些实施方式中,标记的DNA扩增子从5'端到3'端包含目标基因座、第二通用序列、第一通用序列和标签序列。
在某些实施方式中,标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、第一通用序列的至少一部分、标签序列和IlluminaP7序列。在某些实施方式中,标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、第一通用序列的至少一部分、标签序列和Illumina P7序列。在某些实施方式中,标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、第一通用序列、标签序列和Illumina P7序列。在某些实施方式中,标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、第一通用序列、标签序列和Illumina P7序列。
在某些实施方式中,标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、[i7]、第一通用序列的至少一部分、标签序列和Illumina P7序列。在某些实施方式中,标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列的至少一部分、标签序列和IlluminaP7序列。在某些实施方式中,标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、[i7]、第一通用序列、标签序列和Illumina P7序列。在某些实施方式中,标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、标签序列和Illumina P7序列。
在某些实施方式中,标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、[i7]、第一通用序列的至少一部分、标签序列、poly(T)序列和Illumina P7序列。在某些实施方式中,标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列的至少一部分、标签序列、poly(T)序列和Illumina P7序列。在某些实施方式中,标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、[i7]、第一通用序列、标签序列、poly(T)序列和Illumina P7序列。在某些实施方式中,标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、标签序列、poly(T)序列和Illumina P7序列。
在某些实施方式中,标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、[i7]、第二模板转换寡聚物(TSO2)序列和IlluminaP7序列。在某些实施方式中,标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第二模板转换寡聚物(TSO2)序列和Illumina P7序列。
实施例
实施例1
方法
如图1A所示,使用包含部分Illumina Read 1的oligo dT引物逆转录来自HEK293T细胞系的cDNA。使用部分Read 1、i7和Read 2标记的第一基因特异性寡核苷酸来生成单链扩增子。单链扩增子的分子结构如“3”所示。使用互补RNA寡核苷酸进行夹板连接以桥连5'和3'端。夹板连接生成单链环化模板,如“4”所示。利用P5-GSP和P7-GSP或P7-polyA的PCR产生最终的测序文库。生成的cDNA具有简化的分子结构,类似于使用10x Genomics Chromium3'基因表达试剂盒(10x Genomics,Pleasanton,CA)制备的cDNA。
cDNA合成后,使用KAPA HiFi DNA聚合酶(Kapa Biosystems Inc.,Wilmington,MA)进行半巢式基因特异性PCR。引物对由在目标基因座上游引发1-300个碱基对(例如,约50个碱基对)的基因特异性引物以及引发到cDNA 3'端的Read 1特异性引物组成。两种引物都在5'端包含Illumina Read 2序列,其提供了后续吉布森组装所必需的同源臂。用ZymoDNA清洁和浓缩(DCC-5)柱(Zymo Research,Irvine,CA)清理半巢式PCR扩增子。
纯化的PCR扩增子使用吉布森组装进行自环化。为了有利于分子内环化而不是分子间连接,吉布森组装在1mL的大反应体积中进行。建立以下反应并在50℃温育1小时:100-1000ng PCR扩增子、1x CutSmart缓冲液(New England Biolabs Inc.,Ipswich,MA)和10μL2x Gibson mastermix(New England Biolabs Inc.,Ipswich,MA)加水至终体积1mL。使用6Uλ核酸外切酶(New England Biolabs Inc.,Ipswich,MA)在37℃去除未连接的线性模板30分钟,并在65℃灭活20分钟。使用Zymo DCC-5柱(Zymo Research,Irvine,CA)清理环化模板。
设置第二轮PCR以生成短片段以紧密连接目标基因座和逆转录引发寡核苷酸(相当于单细胞cDNA文库中包含细胞ID的区域),从而可以使用短读Illumina平台对它们进行测序。第二轮PCR中使用的引物是两个基因特异性引物,每个引物都附加有Illumina P5或Illumina P7接头。
最终的测序文库用Zymo DCC-5柱清理并用NEBNext文库定量试剂盒(New EnglandBiolabs Inc.,Ipswich,MA)定量。使用Illumina平台,Read 1序列包括逆转录引发寡核苷酸,而Read 2提供关于目标基因座的序列信息,即突变。
结果
Sanger测序用于验证该Illumina测序文库的分子设计,使用P5作为Sanger测序引物。在图1C中,Sanger测序根据分子设计识别关键元素,用于将远距离目标基因座连接到逆转录引物(cDNA 3'端的10x Genomics Cell ID条形码)。
初步数据表明,本文公开的分子设计产生了一个最佳文库,该文库同时提供有关目标基因座和cDNA标签(条形码/UMI)的序列信息。之前,使用基于液滴或纳米孔的平台生成的单细胞RNA-Seq文库不允许研究人员获得有关特定目标基因座的单细胞信息,并且在很大程度上仅适用于基因表达谱分析。通过这种分子工作流程,现在可以对目标基因座进行测序,同时保留单细胞cDNA标签提供的单细胞信息。
实施例2
如图4所示,可选方案B,多个寡核苷酸在1x NEB Thermo Pol缓冲液(New EnglandBiolabs Inc.,Ipswich,MA)中退火到cDNA模板,在60℃过夜。按照制造商方案(NewEngland Biolabs Inc.,Ipswich,MA),通过添加Bst DNA聚合酶、大片段来使退火的寡核苷酸延伸。使用与PCR handle和截短的Read 1序列杂交的引物,将得到的延伸产物用作最小PCR扩增的模板。然后将产物用于自环化,然后使用第二正向和第二反向引物进行第二轮半巢式PCR,以产生最终的测序文库。
实施例3
如图5所示,PCR反应是根据KAPA HiFi Readymix(Roche,Basel,Switzerland)的制造商方案进行的,并进行了以下修改。rhPCR引物包含一个核糖核苷酸残基和一个3'封闭部分。在PCR循环程序的退火步骤中,退火到靶标的rhPCR引物通过用1mU/μL的RNase H2切割来激活。然后将产物用于自环化,然后使用第二正向和第二反向引物进行第二轮半巢式PCR,以产生最终的测序文库。
本文引用的所有专利、公开申请和参考文献的教导均通过引用以其整体并入本文。
虽然已经具体示出和描述了示例实施方式,但是本领域的技术人员将理解,在不脱离所附权利要求所涵盖的实施方式的范围的情况下,可以在其中进行形式和细节的各种改变。
表
rG:核糖鸟苷;+G:锁核酸(LNA)修饰的鸟苷
序列表
<110> 新加坡国立大学
<120> 靶向单细胞cDNA测序的方法和组合物
<130> 4459.1155001
<150> 63/076,672
<151> 2020-09-10
<160> 57
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<220>
<221> modified_base
<222> (28)...(30)
<223> n是单脱氧鸟嘌呤
<400> 1
aagcagtggt atcaacgcag agtacatnnn 30
<210> 2
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<220>
<221> misc_feature
<222> (20)...(27)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (28)...(30)
<223> n是单脱氧鸟嘌呤
<400> 2
agagacagat tgcgcaatgn nnnnnnnnnn 30
<210> 3
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<220>
<221> misc_feature
<222> (28)...(29)
<223> n是单脱氧鸟嘌呤
<220>
<221> misc_feature
<222> (30)...(30)
<223> n is locked nucleic acid (LNA)-modified guanosine
(+G)
<400> 3
aagcagtggt atcaacgcag agtacatnnn 30
<210> 4
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 4
aagcagtggt atcaacgcag agtac 25
<210> 5
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 5
ctacacgacg ctcttccgat ct 22
<210> 6
<211> 13
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<220>
<221> misc_feature
<222> (11)...(13)
<223> n是单脱氧鸟嘌呤
<400> 6
tttcttatat nnn 13
<210> 7
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 7
acactctttc cctacacgac gctcttccga tct 33
<210> 8
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 8
acacgtctga actcc 15
<210> 9
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 9
ggagttcaga cgtgt 15
<210> 10
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 10
aaacctgaga aaccat 16
<210> 11
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 11
aaacctgaga aaccgc 16
<210> 12
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 12
aaacctgaga aaccta 16
<210> 13
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 13
aaacctgaga aacgag 16
<210> 14
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 14
aaacctgaga aacgcc 16
<210> 15
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 15
aaacctgaga aagtgg 16
<210> 16
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 16
aaacctgaga acaact 16
<210> 17
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 17
aaacctgaga acaatc 16
<210> 18
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 18
aaacctgaga actcgg 16
<210> 19
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 19
aaacctgaga actgta 16
<210> 20
<211> 11
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 20
ggaaagagtg t 11
<210> 21
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 21
ggagttcaga cgtgtgctct tccgatct 28
<210> 22
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 22
acacgtctga actccagtca c 21
<210> 23
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 23
agatcggaag agcgtcgtgt agggaaagag tgt 33
<210> 24
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 24
gtgactggag ttcagacgtg t 21
<210> 25
<211> 13
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 25
tttcttatat ggg 13
<210> 26
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 26
agatcggaag agcacacgtc tgaactcc 28
<210> 27
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 27
cctctctatg ggcagtcggt gat 23
<210> 28
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 28
ccatctcatc cctgcgtgtc tccgactcag 30
<210> 29
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 29
caagcagaag acggcatacg agat 24
<210> 30
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 30
aatgatacgg cgaccaccga gatctacac 29
<210> 31
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 31
gtgactggag ttcagacgtg tgctcttccg atct 34
<210> 32
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 32
agatcggaag agcacacgtc tgaactccag tcac 34
<210> 33
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 33
atctcgtatg ccgtcttctg cttg 24
<210> 34
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 34
gtgaatat 8
<210> 35
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 35
acaggcgc 8
<210> 36
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 36
catagagt 8
<210> 37
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 37
tgcgagac 8
<210> 38
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 38
tctctact 8
<210> 39
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 39
ctctcgtc 8
<210> 40
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 40
ccaagtct 8
<210> 41
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 41
ttggactc 8
<210> 42
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 42
gcagaatt 8
<210> 43
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 43
atgaggcc 8
<210> 44
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 44
actaagat 8
<210> 45
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 45
gtcggagc 8
<210> 46
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 46
agcctcat 8
<210> 47
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 47
gattctgc 8
<210> 48
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 48
tcgtagtg 8
<210> 49
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 49
ctacgaca 8
<210> 50
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 50
atggcatg 8
<210> 51
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 51
gcaatgca 8
<210> 52
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 52
cttatcgg 8
<210> 53
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 53
tccgctaa 8
<210> 54
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 54
gatctatc 8
<210> 55
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 55
agctcgct 8
<210> 56
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 56
acactaag 8
<210> 57
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸
<400> 57
gtgtcgga 8
Claims (49)
1.一种生成用于测序的标记DNA扩增子的方法,其包括以下步骤:
a)将第一寡核苷酸退火至核酸模板,所述核酸模板包含靶核酸分子序列、标签序列和第一通用序列的至少一部分,其中,所述靶核酸分子序列包含目标基因座;
b)从退火的第一寡核苷酸进行核酸模板导向的核酸延伸以产生第一延伸产物,所述第一延伸产物包含含有目标基因座的靶核酸分子序列的全部或部分、标签序列和第一通用序列的至少一部分;
c)环化所述第一延伸产物以产生环化的DNA模板,所述环化的DNA模板包含目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分;和
d)进行环化的DNA模板导向的核酸扩增以产生DNA扩增子,所述DNA扩增子包含目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分,
从而生成用于测序的标记DNA扩增子。
2.如权利要求1所述的方法,其中:
a)所述核酸模板包含截短的第一通用序列;
b)所述环化的DNA模板包含整个第一通用序列和整个第二通用序列;和
c)所述DNA扩增子包含整个第一通用序列和整个第二通用序列。
3.如权利要求2所述的方法,其进一步包括进行第一延伸产物导向的核酸扩增以扩增所述第一延伸产物。
4.如权利要求3所述的方法,其中,使用以下进行第一延伸产物导向的核酸扩增:
a)所述第一寡核苷酸;和
b)包含截短的第一通用序列的至少一部分的第一反向引物。
5.一种生成用于测序的标记DNA扩增子的方法,其包括以下步骤:
a)提供核酸模板,所述核酸模板包含靶核酸分子序列、标签序列和第一通用序列的至少一部分,其中,所述靶核酸分子序列包含目标基因座;
b)通过以下方式进行核酸模板导向的核酸扩增以产生第一扩增产物:
i.在第一寡核苷酸和第一反向引物退火至所述核酸模板中的互补核苷酸序列的条件下,使所述核酸模板与包含第一寡核苷酸和第一反向引物的反应混合物接触,
其中,所述第一反向引物包含所述第一通用序列的至少一部分;和
ii.延伸所述第一寡核苷酸和所述第一反向引物中的每一个;
c)环化所述第一扩增产物以产生环化的DNA模板,所述环化的DNA模板包含目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分;和
d)进行环化的DNA模板导向的核酸扩增以产生DNA扩增子,所述DNA扩增子包含目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分,
从而生成用于测序的标记DNA扩增子。
6.如权利要求5所述的方法,其中:
a)所述核酸模板包含截短的第一通用序列;
b)所述环化的DNA模板包含整个第一通用序列和整个第二通用序列;和
c)所述DNA扩增子包含整个第一通用序列和整个第二通用序列。
7.如权利要求1至6中任一项所述的方法,其中,所述核酸模板是互补DNA(cDNA)模板。
8.如权利要求7所述的方法,其中,所述cDNA模板是通过反转录来自单个细胞的RNA获得的。
9.如权利要求8所述的方法,其中,所述RNA是mRNA。
10.如权利要求1至9中任一项所述的方法,其中,所述cDNA模板对应于第一链cDNA,其从5'端到3'端包含截短的第一通用序列、标签序列和靶核酸分子序列。
11.如权利要求10所述的方法,其中,所述cDNA模板从5'端到3'端包含截短的第一通用序列、标签序列、poly(T)序列、靶核酸分子序列和第一模板转换寡聚物(TSO1)序列。
12.如权利要求1至9中任一项所述的方法,其中,所述cDNA模板对应于第二链cDNA,其从5'端到3'端包含截短的第一通用序列、标签序列、靶核酸分子序列。
13.如权利要求12所述的方法,其中,所述cDNA模板从5'端到3'端包含截短的第一通用序列、标签序列、第二模板转换寡聚物(TSO2)序列、靶核酸分子序列、poly(A)序列和PCRhandle序列。
14.如权利要求1至13中任一项所述的方法,其中,所述目标基因座包括突变、多态性、插入、缺失、基因融合、编辑的核苷酸、修饰的核苷酸、转基因或其组合。
15.如权利要求1至14中任一项所述的方法,其中,所述标签序列包括细胞识别标签或独特分子标识符(UMI)序列或其组合。
16.如权利要求1至15中任一项所述的方法,其中,所述第一寡核苷酸退火至靶核酸分子序列,所述靶核酸分子序列是目标基因座3’的约0-150个核苷酸。
17.如权利要求1至16中任一项所述的方法,其中,所述第一寡核苷酸从5'端到3'端包含第二通用序列和靶核酸分子特异性序列。
18.如权利要求1至17中任一项所述的方法,其中,所述第一延伸产物或所述第一扩增产物从5'端到3'端包含含有目标基因座的靶核酸分子序列的全部或一部分、标签序列和截短的第一通用序列的至少一部分。
19.如权利要求4至18中任一项所述的方法,其中,所述第一寡核苷酸和所述第一反向引物进一步包含第二通用序列。
20.如权利要求4至19中任一项所述的方法,其中:
a)所述第一寡核苷酸或所述第一反向引物在3'端进一步包含RNA碱基,随后是封闭结构域;和
b)扩增所述第一延伸产物包括进行RNase H依赖性PCR。
21.如权利要求1至20中任一项所述的方法,其中,所述方法包括单个环化步骤。
22.如权利要求1至21中任一项所述的方法,其中,环化所述第一延伸产物或所述第一扩增产物包括由吉布森组装介导的分子内连接、夹板连接或使用热稳定的ATP依赖性连接酶的连接。
23.如权利要求22所述的方法,其中,环化所述第一延伸产物或所述第一扩增产物包括由吉布森组装介导的分子内连接。
24.如权利要求1至23中任一项所述的方法,其中,进行环化的DNA模板导向的核酸扩增包括用高保真DNA聚合酶扩增环化DNA模板的一部分。
25.如权利要求1至24中任一项所述的方法,其中,进行环化的DNA模板导向的核酸扩增使用第二正向引物和第二反向引物。
26.如权利要求25所述的方法,其中,所述第二正向引物或所述第二反向引物包含oligo dT序列、带条形码的随机核苷酸序列或其组合。
27.如权利要求25或26所述的方法,其中:
a)所述第二正向引物包含与第一固定寡核苷酸序列相反且互补的序列;和
b)所述第二反向引物包含与第二固定寡核苷酸序列相反和互补的序列。
28.如权利要求27所述的方法,其中,所述第一固定寡核苷酸序列和所述第二固定寡核苷酸序列:
a)分别包括CCTCTCTATGGGCAGTCGGTGAT(SEQ ID NO:27)和CCATCTCATCCCTGCGTGTCTCCGACTCAG(SEQ ID NO:28);
b)分别包括CCATCTCATCCCTGCGTGTCTCCGACTCAG(SEQ ID NO:28)和CCTCTCTATGGGCAGTCGGTGAT(SEQ ID NO:27);
c)分别包括CAAGCAGAAGACGGCATACGAGAT(SEQ ID NO:29)和AATGATACGGCGACCACCGAGATCTACAC(SEQ ID NO:30)。
29.如权利要求25至28中任一项所述的方法,其中:
a)所述第二正向引物或所述第二反向引物包含RNA碱基,随后是3'端的封闭结构域;和
b)进行环化的DNA模板导向的核酸扩增包括进行RNase H依赖性PCR。
30.如权利要求1至29中任一项所述的方法,其中,所述DNA扩增子从5'端到3'端包含目标基因座、第二通用序列、第一通用序列和标签序列。
31.如权利要求1至30中任一项所述的方法,其中,所述DNA扩增子的长度在约200个碱基对和约500个碱基对之间。
32.如权利要求1至31中任一项所述的方法,其中,所述靶核酸分子序列包含至少两个目标基因座。
33.如权利要求32所述的方法,其中,所述第一寡核苷酸退火至靶核酸分子序列,所述靶核酸分子序列位于目标基因座的3’端。
34.如权利要求32所述的方法,其中,所述方法包括以下步骤:
a)将多个寡核苷酸退火至所述cDNA模板;
b)从多个退火的寡核苷酸进行cDNA模板导向的核酸延伸以产生多个第一延伸产物,所述第一延伸产物包含含有一个或多个目标基因座的靶核酸分子序列、标签序列和截短的第一通用序列的至少一部分;
c)环化所述多个第一延伸产物以产生多个环化的DNA模板;和
d)进行环化的DNA模板导向的核酸扩增以产生多个DNA扩增子,其包含一个或多个目标基因座、标签序列、第一通用序列和第二通用序列,
从而生成用于测序的多个标记的DNA扩增子。
35.如权利要求34所述的方法,其进一步包括进行第一延伸产物导向的核酸扩增以扩增多个第一延伸产物。
36.如权利要求32所述的方法,其中,所述方法包括以下步骤:
a)提供核酸模板;
b)通过以下方式进行核酸模板导向的核酸扩增以产生多个扩增产物:
i.在多个寡核苷酸引物和第一反向引物退火至核酸模板中的互补核苷酸序列的条件下,使核酸模板与包含多个寡核苷酸引物和第一反向引物的反应混合物接触;和
ii.延伸所述多个寡核苷酸和所述第一反向引物中的每一个;
c)环化多个第一扩增产物以产生多个环化的DNA模板;和
d)进行环化的DNA模板导向的核酸扩增以产生多个DNA扩增子,所述DNA扩增子包含一个或多个目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分,
从而生成用于测序的多个标记的DNA扩增子。
37.如权利要求36所述的方法,其中,所述多个DNA扩增子包含所述第一通用序列和所述第二通用序列。
38.如权利要求1至37中任一项所述的方法,其中,所述方法用于制作测序文库。
39.如权利要求1至38中任一项所述的方法,其进一步包括对所述DNA扩增子进行测序。
40.如权利要求39所述的方法,其中,使用第一通用序列特异性引物、第二通用序列特异性引物或前述的组合进行测序。
41.如权利要求40所述的方法,其中,其中使用包含以下的全部或部分的引物进行测序:
a)ACACTCTTTCCCTACACGACGCTCTTCCGATCT(SEQ ID NO:7);
b)GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT(SEQ ID NO:31);或
c)AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC(SEQ ID NO:32),
或上述的组合。
42.一种生成用于测序的标记DNA扩增子的方法,其包括以下步骤:
a)提供核酸模板,所述核酸模板从5'端到3'端包含截短的第一通用序列、标签序列、靶核酸分子序列和第一模板转换寡聚物(TSO1)序列,其中,所述靶核酸分子序列包含目标基因座;
b)通过以下方式进行核酸模板导向的核酸扩增以产生第一扩增产物:
i.在第一寡核苷酸和第一反向引物退火至核酸模板中的互补核苷酸序列的条件下,使核酸模板与包含第一寡核苷酸和第一反向引物的反应混合物接触,其中:
1)所述第一寡核苷酸从5'端到3'端包含第二通用序列和靶核酸分子特异性序列;和
2)所述第一反向引物从5'端到3'端包含第二通用序列、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分;和
ii.延伸所述第一寡核苷酸和所述第一反向引物中的每一个;
c)环化所述第一扩增产物以产生环化的DNA模板,所述DNA模板包含第二通用序列、目标基因座、标签序列、第一通用序列和[i7];和
d)进行环化的DNA模板导向的核酸扩增以产生DNA扩增子,所述DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、标签序列和Illumina P7序列,
从而生成用于测序的标记DNA扩增子。
43.一种生成用于测序的标记DNA扩增子的方法,其包括以下步骤:
a)提供核酸模板,所述核酸模板从5'端到3'端包含截短的第一通用序列、标签序列、第二模板转换寡聚物(TSO2)序列和靶核酸分子序列,其中,所述靶核酸分子序列包含目标基因座;
b)通过以下方式进行核酸模板导向的核酸扩增以产生第一扩增产物:
i.在第一寡核苷酸和第一反向引物退火至核酸模板中的互补核苷酸序列的条件下,使核酸模板与包含第一寡核苷酸和第一反向引物的反应混合物接触,其中:
1)所述第一寡核苷酸从5'端到3'端包含第二通用序列和靶核酸分子特异性序列;和
2)所述第一反向引物从5'端到3'端包含第二通用序列、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分;和
ii.延伸所述第一寡核苷酸和所述第一反向引物中的每一个;
c)环化所述第一扩增产物以产生环化的DNA模板,所述环化的DNA模板包含第二通用序列、目标基因座、TSO2序列、标签序列、第一通用序列和[i7];和
d)进行环化的DNA模板导向的核酸扩增以产生DNA扩增子,所述DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、TSO2序列、标签序列和Illumina P7序列,
从而生成用于测序的标记DNA扩增子。
44.一种用于测序的标记DNA扩增子,其从5'端到3'端包含目标基因座、第二通用序列的至少一部分、第一通用序列的至少一部分和标签序列。
45.如权利要求44所述的标记的DNA扩增子,其从5'端到3'端包含目标基因座、第二通用序列、第一通用序列和标签序列。
46.如权利要求45所述的标记的DNA扩增子,其从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、第一通用序列、标签序列和Illumina P7序列。
47.如权利要求46所述的标记的DNA扩增子,其从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、标签序列和Illumina P7序列。
48.如权利要求47所述的标记的DNA扩增子,其从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、标签序列poly(T)序列和Illumina P7序列。
49.如权利要求47所述的标记的DNA扩增子,其从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第二模板转换寡聚物(TSO2)序列和Illumina P7序列。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063076672P | 2020-09-10 | 2020-09-10 | |
US63/076,672 | 2020-09-10 | ||
PCT/IB2021/058218 WO2022053981A1 (en) | 2020-09-10 | 2021-09-09 | Methods and compositions for targeted single cell cdna sequencing |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116249786A true CN116249786A (zh) | 2023-06-09 |
Family
ID=80629784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180061602.6A Pending CN116249786A (zh) | 2020-09-10 | 2021-09-09 | 靶向单细胞cDNA测序的方法和组合物 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230366017A1 (zh) |
EP (1) | EP4211270A4 (zh) |
CN (1) | CN116249786A (zh) |
WO (1) | WO2022053981A1 (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10640763B2 (en) * | 2016-05-31 | 2020-05-05 | Cellular Research, Inc. | Molecular indexing of internal sequences |
EP3682025A1 (en) * | 2017-09-14 | 2020-07-22 | H. Hoffnabb-La Roche Ag | Novel method for generating circular single-stranded dna libraries |
US11732257B2 (en) * | 2017-10-23 | 2023-08-22 | Massachusetts Institute Of Technology | Single cell sequencing libraries of genomic transcript regions of interest in proximity to barcodes, and genotyping of said libraries |
WO2020036926A1 (en) * | 2018-08-17 | 2020-02-20 | Cellecta, Inc. | Multiplex preparation of barcoded gene specific dna fragments |
-
2021
- 2021-09-09 EP EP21866185.8A patent/EP4211270A4/en active Pending
- 2021-09-09 WO PCT/IB2021/058218 patent/WO2022053981A1/en unknown
- 2021-09-09 US US18/025,510 patent/US20230366017A1/en active Pending
- 2021-09-09 CN CN202180061602.6A patent/CN116249786A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4211270A1 (en) | 2023-07-19 |
US20230366017A1 (en) | 2023-11-16 |
EP4211270A4 (en) | 2024-10-09 |
WO2022053981A1 (en) | 2022-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10876108B2 (en) | Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation | |
US9243242B2 (en) | Methods of making di-tagged DNA libraries from DNA or RNA using double-tagged oligonucleotides | |
US9255291B2 (en) | Oligonucleotide ligation methods for improving data quality and throughput using massively parallel sequencing | |
US20120252702A1 (en) | Processing of amplified dna fragments for sequencing | |
WO2011032053A1 (en) | Compositions and methods for whole transcriptome analysis | |
JPH06505872A (ja) | 1本鎖直鎖状dna鋳型から全長2本鎖dnaを合成する方法 | |
JP6219944B2 (ja) | 5’保護に依存した増幅 | |
WO2003050242A2 (en) | Dna amplification and sequencing using dna molecules generated by random fragmentation | |
US8617817B2 (en) | Whole transciptome sequencing | |
JP2023002557A (ja) | シングルプライマーからデュアルプライマーのアンプリコンへのスイッチング | |
JP7206424B2 (ja) | mRNAを増幅する方法及び完全長mRNAライブラリを調製する方法 | |
EP3198064B1 (en) | Methods for sample preparation | |
JP2022515466A (ja) | 標的化された相補的dna富化のための方法 | |
JP4599483B2 (ja) | スタッガード(staggered)ライゲーションを使用して核酸配列を増幅する方法 | |
CN116249786A (zh) | 靶向单细胞cDNA测序的方法和组合物 | |
CN110468179A (zh) | 选择性扩增核酸序列的方法 | |
JP2005503794A (ja) | リボ核酸の増幅 | |
US20210222162A1 (en) | Depletion of abundant uninformative sequences | |
US20060105331A1 (en) | Methods for improving rna transcription reactions | |
US20230348962A1 (en) | Using Hairpin Formation To Identify DNA and RNA Sequences Having A Target Nucleic Acid Sequence | |
EP3978626A1 (en) | Method and means for generating transcribed nucleic acids | |
KR20230080464A (ko) | 전사된 핵산을 생성하는 방법 및 수단 | |
CN113811610A (zh) | 用于改进cDNA合成的组合物和方法 | |
JPWO2022055984A5 (zh) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |