CN111386362B - 一种体液游离dna的文库构建方法及其应用 - Google Patents
一种体液游离dna的文库构建方法及其应用 Download PDFInfo
- Publication number
- CN111386362B CN111386362B CN201780097208.1A CN201780097208A CN111386362B CN 111386362 B CN111386362 B CN 111386362B CN 201780097208 A CN201780097208 A CN 201780097208A CN 111386362 B CN111386362 B CN 111386362B
- Authority
- CN
- China
- Prior art keywords
- dna
- body fluid
- free dna
- transposase
- linker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 210000001124 body fluid Anatomy 0.000 title claims abstract description 51
- 239000010839 body fluid Substances 0.000 title claims abstract description 51
- 238000010276 construction Methods 0.000 title description 17
- 238000000034 method Methods 0.000 claims abstract description 70
- 108010020764 Transposases Proteins 0.000 claims abstract description 23
- 102000008579 Transposases Human genes 0.000 claims abstract description 23
- 108020004414 DNA Proteins 0.000 claims description 144
- 238000006243 chemical reaction Methods 0.000 claims description 39
- 239000012634 fragment Substances 0.000 claims description 38
- 238000012163 sequencing technique Methods 0.000 claims description 29
- 239000000203 mixture Substances 0.000 claims description 28
- 230000017105 transposition Effects 0.000 claims description 28
- 239000011324 bead Substances 0.000 claims description 23
- 108010047956 Nucleosomes Proteins 0.000 claims description 22
- 210000001623 nucleosome Anatomy 0.000 claims description 22
- 102000004190 Enzymes Human genes 0.000 claims description 16
- 108090000790 Enzymes Proteins 0.000 claims description 16
- 230000003321 amplification Effects 0.000 claims description 15
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 15
- 102000053602 DNA Human genes 0.000 claims description 14
- 108010012306 Tn5 transposase Proteins 0.000 claims description 10
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 7
- 238000000137 annealing Methods 0.000 claims description 5
- 238000003776 cleavage reaction Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 5
- 238000011529 RT qPCR Methods 0.000 claims description 4
- 108010052305 exodeoxyribonuclease III Proteins 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 4
- 238000000746 purification Methods 0.000 claims description 4
- 230000007017 scission Effects 0.000 claims description 4
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 claims description 3
- 102100029075 Exonuclease 1 Human genes 0.000 claims description 3
- 238000005520 cutting process Methods 0.000 claims description 3
- 102000039446 nucleic acids Human genes 0.000 claims description 3
- 108020004707 nucleic acids Proteins 0.000 claims description 3
- 150000007523 nucleic acids Chemical class 0.000 claims description 3
- 230000035484 reaction time Effects 0.000 claims description 3
- 108091034117 Oligonucleotide Proteins 0.000 claims description 2
- 230000000295 complement effect Effects 0.000 claims description 2
- 230000029087 digestion Effects 0.000 claims 1
- 230000002068 genetic effect Effects 0.000 claims 1
- 201000011510 cancer Diseases 0.000 abstract description 17
- 206010028980 Neoplasm Diseases 0.000 abstract description 16
- 238000003793 prenatal diagnosis Methods 0.000 abstract description 11
- 108010042407 Endonucleases Proteins 0.000 abstract description 7
- 102000004533 Endonucleases Human genes 0.000 abstract description 7
- 210000004369 blood Anatomy 0.000 description 33
- 239000008280 blood Substances 0.000 description 33
- 239000000523 sample Substances 0.000 description 25
- 210000004027 cell Anatomy 0.000 description 19
- 210000001519 tissue Anatomy 0.000 description 17
- 210000002381 plasma Anatomy 0.000 description 14
- 239000000243 solution Substances 0.000 description 14
- 238000002156 mixing Methods 0.000 description 13
- 239000000047 product Substances 0.000 description 13
- 239000006228 supernatant Substances 0.000 description 13
- 238000001514 detection method Methods 0.000 description 12
- 230000011987 methylation Effects 0.000 description 11
- 238000007069 methylation reaction Methods 0.000 description 11
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 8
- 230000000052 comparative effect Effects 0.000 description 8
- 238000002360 preparation method Methods 0.000 description 8
- 108090000623 proteins and genes Proteins 0.000 description 7
- 210000005259 peripheral blood Anatomy 0.000 description 6
- 239000011886 peripheral blood Substances 0.000 description 6
- 108010077544 Chromatin Proteins 0.000 description 5
- 108010033040 Histones Proteins 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 210000003483 chromatin Anatomy 0.000 description 5
- 238000011176 pooling Methods 0.000 description 5
- 102000006947 Histones Human genes 0.000 description 4
- 238000007664 blowing Methods 0.000 description 4
- 230000004807 localization Effects 0.000 description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- 208000031404 Chromosome Aberrations Diseases 0.000 description 3
- 206010067477 Cytogenetic abnormality Diseases 0.000 description 3
- 230000007067 DNA methylation Effects 0.000 description 3
- 108091061960 Naked DNA Proteins 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000012350 deep sequencing Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 230000001605 fetal effect Effects 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 238000002347 injection Methods 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 239000002096 quantum dot Substances 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000004544 DNA amplification Effects 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- 108010067770 Endopeptidase K Proteins 0.000 description 2
- 206010027476 Metastases Diseases 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 238000007605 air drying Methods 0.000 description 2
- 230000001640 apoptogenic effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000008774 maternal effect Effects 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 230000009401 metastasis Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000001338 necrotic effect Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000001502 supplementing effect Effects 0.000 description 2
- 208000011580 syndromic disease Diseases 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 229910021642 ultra pure water Inorganic materials 0.000 description 2
- 239000012498 ultrapure water Substances 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 244000144725 Amygdalus communis Species 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 208000011359 Chromosome disease Diseases 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 201000010374 Down Syndrome Diseases 0.000 description 1
- 241000607473 Edwardsiella <enterobacteria> Species 0.000 description 1
- 101710193865 Exodeoxyribonuclease 1 Proteins 0.000 description 1
- 101710113436 GTPase KRas Proteins 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 238000001190 Q-PCR Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 1
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 238000012164 methylation sequencing Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000011259 mixed solution Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 1
- 239000002077 nanosphere Substances 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000000135 prohibitive effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 239000012488 sample solution Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003239 susceptibility assay Methods 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Abstract
一种对体液样本游离DNA进行文库构建的方法,包括利用转座酶或内切酶直接作用于体液样本,将其中游离DNA片段化,然后进行扩增获得文库。还提供了利用该方法进行产前诊断或癌症早期发现的试剂盒。
Description
技术领域
本发明涉及测序技术领域,尤其涉及一种体液游离DNA的文库构建方法及其在产前诊断及癌症早期发现中的用途。
背景技术
1948年,法国科学家曼德尔和麦特斯首次在人体外周血中检测到游离于细胞外的DNA片段。这些DNA主要源于凋亡或坏死细胞被切割后的片段化染色质。
1997年,来自香港中文大学的卢煜明研究团队发现,在怀孕母亲的外周血中存在胎儿的血液游离DNA,由此开启了孕妇外周血基因检测的大门。孕妇外周血的基因检测技术称为无创产前诊断技术,其原理为:怀孕的母亲的外周血中存在胎儿的DNA,可以对怀孕母亲的血液游离DNA进行建库测序,并通过对比与母亲DNA的单核苷酸多态性差异分离出胎儿的DNA,从而进行产前诊断(Lo et al,Am.J.Hum.Genet 64,218-224(1999))。目前这项技术在国内外均比较成熟,主要筛查常见的三大染色体疾病,分别是T21染色体异常(唐氏综合征),T18染色体异常(爱德华氏综合征)和T13染色体异常(帕陶氏综合征),检测准确率高达99%以上。
另外,里昂等人确定了癌症病人的血液游离DNA水平与恶性肿瘤的转移程度存在着某种相关性,为癌症的无创诊断提供了理论基础。进而衍生了癌症早期检测技术:在癌症的病理状态下,由于凋亡和坏死细胞数量增多,因此释放到血液中的游离DNA数量明显增加;这些DNA自身携带癌细胞特有的突变,因此能通过检查血液游离DNA的浓度或突变状态,判断癌症类型以及发展进程(Morelli et al.,Ann Oncol 26,731-736(2015))。并且,在癌症患者血液游离DNA上相继检测到了K-ras,EGFR等基因的突变,这些发现能够应用于肺癌及乳腺癌等恶性肿瘤的早期诊断。
应当注意的是,人体包含400多种细胞类型,每种细胞虽然具有相同的一套基因组,但它们的基因表达水平具有显著的细胞特异性。这是由细胞特异性的表观基因组来调控的,表观基因组信息包括DNA甲基化,组蛋白修饰,核小体定位等,通过这些信息并借助细胞参考表观基因组数据库可以直接判断细胞的来源。最新的研究表明,血液游离DNA中隐含表观信息,包括甲基化和核小体定位,因此能够用来进行组织溯源。
其中,血液游离DNA的甲基化能在一定程度上反映来源组织细胞的甲基化水平,而不同类型的组织细胞甲基化程度和位置均不相同,因此可以用于判断游离DNA来自哪种细胞类型。例如,Lo等人报道了血液游离DNA甲基化检测技术:血液游离DNA携带其来源细胞的甲基化状态,因此能够用重亚硫酸盐处理后进行建库测序,通过对血液游离DNA的甲基化分析,可以将其对应到特定的细胞类型上去,从而实现组织溯源(Lo et al.,PNAS 112:5503-5512(2015))。这项研究可用于多种诊断当中,包括产前诊断、癌症定位及肿瘤细胞的转移情况诊断、器官移植患者免疫系统排异性诊断等。但是该方法存在以下弊端:(1)基因组上甲基化位点较少,且血液游离DNA本身浓度就低,因此检测结果往往精确性不高;(2)甲基化测序步骤繁琐,可能会导致大量DNA甲基化信息丢失,产生测序质量低,噪音严重等后果。
此外,细胞中的核小体定位信息可以用来区分细胞和组织类型。大量文献报道,血液游离DNA的长度多集中在167bp左右,这与一个核小体DNA的长度相符合,表明大量血液游离DNA是由核小体包裹的DNA。2016年,Jay Shendure等人通过提取血液中的游离DNA之后,构建测序文库,并采用深度测序策略,将血液游离DNA的核小体信息定位到不同类型的细胞中,进而实现组织溯源(Shendure et al.,CELL 164,57-68(2016);Speicher et al.,Nature Genetics 48,1273-1278(2016))。但该方法直接提取血液中的游离DNA进行建库,然后使用血液游离DNA的测序数据来分析核小体定位,而血液中存在的裸露DNA会产生噪音,干扰正常核小体DNA的定位,最终导致组织溯源效率不高;并且,该方法采用深度测序策略,使得测序成本过高,在商业化上难以形成广泛的应用。
另外,还有研究报导了专门针对染色质开放区域的染色质开放性测序技术:通过对细胞进行裂解和Tn5转座酶处理,在染色质中开放区域插入测序接头,然后通过PCR扩增的方法进行全部开放染色质区域的扩增,并进行建库和测序(Chang et al.,Curr.Protoc.Mol.Biol.109:21.29.1-21.29.9)。但是,该技术恰恰是排除了核小体DNA的信息,因此同样不能根据核小体DNA进行组织溯源。
总之,目前常规的无创产前诊断以及癌症早期检测,是通过先提取血液游离DNA、然后进行常规建库来完成,其存在以下问题:(1)血液游离DNA的含量很低,在建库过程中非常容易带来损失,导致建库失败或者检测灵敏度不高;(2)现有的建库方法都是直接提取血液中的游离DNA,再对提取后的DNA进行建库测序。最终只能得到血液游离DNA的序列或甲基化信息,而核小体分布信息可能会在建库的过程中丢失。(3)测序成本过高。因此,亟待开发出一种高效、灵敏的血液游离DNA建库方法,并且能够用这种方法筛选出血液游离DNA的核小体片段,进行组织溯源。
发明内容
针对上述现有技术中存在的缺陷,本发明旨在提供一种对体液游离DNA进行文库构建的方法,及其在产前诊断及癌症早期发现中的用途。本发明使用酶直接攻击体液,以对其中的游离DNA进行片段化并添加接头,而无需从体液中提取游离DNA,其步骤简单,建库成本低,不仅可以实现体液游离DNA的微量建库策略,而且在建库过程中最大限度保留了体液游离核小体DNA的片段信息。
本发明是通过如下技术方案实现上述目标的。
一方面,本发明提供了一种对体液样本游离DNA进行文库构建的方法,其包括:
(1)用酶直接作用于体液样本,以将体液样本中的游离DNA片段化;
(2)对步骤1)所得片段化的DNA进行扩增,获得体液游离DNA文库。
在优选的具体实施方案中,所述体液选自血液、尿液、唾液的至少一种。在所述体液样本中,游离DNA有两种:一种是与组蛋白结合在一起的核小体DNA,一种是无结合的裸露DNA。在酶作用之后,裸露DNA会被切割成大约50bp的片段,而核小体DNA由于与组蛋白结合,其被切割成的片段可能会大一些。
在优选的具体实施方案中,所述酶为转座酶或内切酶;优选地,所述转座酶为Tn5转座酶,所述内切酶为MNase或DNase酶。
请注意,无论是转座酶还是内切酶,都可以直接作用于体液样本,区别在于:使用转座酶直接进行体液攻击的实施方案可以直接完成DNA片段化与加接头两者,而使用内切酶的实施方案仅能完成片段化,添加接头的步骤需要后续单独进行。
在优选的具体实施方案中,步骤(1)包括:利用转座酶,对含有游离DNA的体液样本进行转座反应,以将所述游离DNA进行片段化并添加接头序列,获得包含接头序列的DNA片段;
优选地,步骤(1)还包括:在将所述游离DNA进行片段化并添加接头序列之后,进行核酸提取的步骤。
在进一步优选的实施方案中,用于所述转座反应的接头为接头混合物,其通过以下步骤制备:
1)将引物A:5′-CTGTCTCTTATACACATCT-3′(SEQ ID NO:1)与引物B:5′-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3′(SEQ ID NO:2)退火,得退火产物1;
2)将引物A:5′-CTGTCTCTTATACACATCT-3′(SEQ ID NO:1)与引物C:5′-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3′(SEQ ID NO:3)退火,得退火产物2;
3)将退火产物1和退火产物2混合,得接头混合物。
优选地,所述接头混合物与所述转座酶进行包埋,获得转座酶包埋复合物,以用于转座反应。
进一步优选地,将所述接头混合物与包含转座酶的Tagment Enzyme AdvancedV5S进行包埋;优选地,所述接头混合物与所述Tagment Enzyme Advanced V5S的体积比为1∶20-1∶25、优选为1∶24.5;优选地,所述包埋在22-28℃、优选在25℃下进行40-80min、优选60min。
在具体实施方案中,优选地,将所述转座酶包埋复合物与所述体液样本在转座反应条件下进行孵育,以实现转座反应。
对于所述转座反应,优选地,所述转座酶包埋复合物与所述体液样本的体积比为1∶50-1∶80,优选为1∶62.5;
优选地,所述转座反应温度为35-40℃,优选为37℃;
优选地,所述转座反应时间为55-65min,优选为60min。
在采用转座反应的本发明的一个具体实例中,所用Tn5转座酶具有随机切割DNA的特性,血浆中裸露的游离DNA(未缠绕在组蛋白上的游离DNA)会被Tn5转座酶切割成约50bp的小片段,而核小体DNA(缠绕在组蛋白上的游离DNA)会保持长于50bp的长度。通过PE50+10测序等,可以将不同长度特征的DNA片段区分开来,从而筛选出核小体DNA序列,分析得到DNA序列的表观信息以及在不同基因启动子或增强子等调控区以及转录起始区的富集程度。后续可以通过这些表观信息将建库所得核小体DNA序列用于实现血液游离DNA的组织溯源。
在本发明的另一个优选的具体实施方案中,步骤(1)包括:利用内切酶处理含有游离DNA的体液样本,以将所述游离DNA进行片段化,然后在所得片段化DNA的两端添加接头序列,获得包含接头序列的DNA片段;
优选地,步骤(1)还包括:在将所述游离DNA进行片段化之后,进行核酸提取的步骤。
在优选的具体实施方案中,步骤(2)中所述扩增包括两次扩增;
优选地,在第一次扩增后,通过qPCR确定需要补加的循环数N,作为第二次扩增的循环数。
在优选的具体实施方案中,所述方法还包括步骤(3):对步骤2)所获得的体液游离DNA文库进行环化和酶切;
优选地,所述环化包括将所述体液游离DNA文库中的双链DNA变性为单链DNA,再通过与单链DNA部分区域互补的寡核苷酸片段、通过碱基互补配对进行连接;进一步优选地,使用介导片段:5′-GCCATGTCGTTCTGTGAGCCAAGG-3′(SEQ ID NO:4)与所述单链DNA互补配对连接以实现环化;
优选地,使用外切核酸酶I和外切核酸酶III进行所述酶切,以去除未环化的DNA;
优选地,步骤(3)还包括:对酶切产物进行纯化的步骤;优选地,使用磁珠进行纯化。
第二方面,本发明还提供了一种获得个体表观信息的方法,其包括:
(1)根据如第一方面所述的方法,获得个体的体液游离DNA文库;
(2)对步骤(1)所得体液游离DNA文库进行测序和分析,以获得个体表观信息。
第三方面,本发明还提供了如第一方面所述的对体液样本游离DNA进行文库构建的方法或如第二方面所述的获得个体表观信息的方法在产前诊断及癌症早期发现中的用途。
第四方面,本发明还提供了一种产前诊断或癌症早期发现的方法,其通过如第一方面所述的对体液样本游离DNA进行文库构建的方法或如第二方面所述的获得个体表观信息的方法实现。
第五方面,本发明还提供了一种分析体液游离DNA以进行产前诊断或癌症早期发现的试剂盒,其包括如第一方面所述的方法中所使用的试剂、引物、介导片段或其中一项或多项的组合。
优选地,所述试剂盒包括以下一种或多种的组合:
转座酶Tn5或MNase或Dnase酶;
引物A:5′-CTGTCTCTTATACACATCT-3′(SEQ ID NO:1),引物B:5′-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3′(SEQ ID NO:2)与引物C:5′-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3′(SEQ ID NO:3):
介导片段:5′-GCCATGTCGTTCTGTGAGCCAAGG-3′(SEQ ID NO:4);以及
所述转座、PCR扩增、酶切、连接反应所需要的酶和/或试剂。
本发明相较于现有技术的优势
如上所述,在现有技术中,通常采用先从体液样本提取游离DNA,再使用Tn5转座酶进行攻击、建库的方法,然而这些方法存在溯源结果精确度不高,且需要深度测序,成本高等缺点。
本发明采用酶(例如转座酶或内切酶)直接攻击体液,以对其中的游离DNA进行片段化并添加接头,实现了体液游离DNA的直接建库;本发明的方法不但步骤简单,建库成本低,而且还降低了测序过程中的信息丢失,最大限度地保留了体液游离DNA的片段信息,尤其是保留了核小体DNA的信息。因此,本发明提供的对体液游离DNA进行文库构建方法,不仅可以实现体液游离DNA的微量建库策略,同时还可获得体液游离DNA的表观信息。通过对所获得的表观信息、尤其是核小体DNA的相关信息进一步分析挖掘,还可实现组织溯源。
本发明提供的方法为体液游离DNA的研究提供了新的研究方法,在产前诊断、肿瘤早期发现和新的疾病监测等临床应用中具有良好的应用前景。
附图说明
图1为实施例1中qPCR确定平台期循环数的数据图;
图2为实施例1中样品扩增曲线图;
图3为实施例1中部分样品磁珠双选后用Agilent 2100检测结果图;
图4为实施例1中样本测序所得数据之间的相关性;
图5为实施例1中测序后所得片段分别在管家基因和沉默基因转录起始区的富集图;
图6为实施例1中样本测序数据与组织测序数据聚类结果。
具体实施方式
为便于理解本发明,本发明列举实施例如下。本领域技术人员应该明了,所述实施例仅仅是帮助理解本发明,不应视为对本发明的具体限制。
实施例1外周血游离DNA的文库构建及表观信息分析
本实施例包括血浆样品准备、Tn5直接转座血浆、转座后DNA扩增、Tn5建库、PE50+10测序、核小体片段筛选等一系列步骤。Tn5转座酶按照Vazyme公司的TruePrep微量DNA样品制备试剂盒(TruePrep Mini DNA Sample Prep Kit)的说明书进行制备。
1血浆样品准备
1.1血浆样品采集
采集健康人全血样本10mL。4℃,1600g离心10min。取上清(即血浆)至新的15mL离心管中。
1.2血浆纯化(可采用以下两种方法中的任意一种)
1.2.1方法一:
滤头过滤法:取3mL血浆,用10mL注射器、0.2μm滤头过滤至新的EP管中(约损失0.5mL)。
1.2.2方法二:
二次离心法:血浆经4℃,16000g离心10min后,取上清至新15mL离心管中。
2部分血浆的转座反应(即本发明的方法,直接采用血浆进行转座反应)
2.1接头混合物(Adapter Mix)的制备
2.1.1参考引物名称及序列:
引物A:5′-CTGTCTCTTATACACATCT-3′(SEQ ID NO:1)
引物B:5′-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3′(SEQ ID NO:2)
引物C:5′-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3′(SEQ ID NO:3)
2.1.2使用退火缓冲液溶解引物A、引物B、引物C至100μM。
2.1.3分别配制如下反应体系,见表1:
表1 接头混合物的制备体系
2.1.4分别将退火产物1和退火产物2涡旋震荡充分混匀,并短暂离心使溶液回到管底。置于PCR仪内,进行如下反应程序:75℃15min;60℃10min;50℃10min;40℃10min;25℃30min。
2.1.5反应结束后,将退火产物1和退火产物2等体积混合,混匀。命名为接头混合物(Adapter Mix),-20℃保存。
2.2接头混合物与Tn5转座酶的包埋,以获得转座酶包埋复合物
2.2.1在灭菌PCR管中依次添加各反应组分,见表2;其中,Tagment EnzymeAdvanced V5S含1000U Tn5转座酶的BGI V5S试剂(供货商:BGI,货号:BGE005S)。
表2 接头混合物与Tn5转座酶的包埋体系
2.2.2使用移液器轻轻吹打,充分混匀。
2.2.3将反应置于25℃反应60min。反应产物命名为Tagment Enzyme AdvancedMix V5S,置于-20℃保存。
2.3血液游离DNA片段化
配制血浆转座体系(见表3),冰上配制完成后,混合均匀,于恒温金属混匀仪上,37℃下进行转座反应60min。
表3 血浆转座反应体系
3转座后血浆游离DNA的提取
3.1利用Magen血液游离DNA提取试剂盒(MAGEN MD5432-01)进行提取。
3.2转座反应完成后,在新的1.5mL离心管中,加入25μL蛋白酶K和35μL MagBind磁珠。
3.3转移样品至含蛋白酶K的离心管中。振荡混匀5秒。
3.4加入700μL MLE至样品中,涡旋混匀。55℃振荡温育15分钟。
3.5转移至磁力架上,静置5~10分钟吸附磁珠。
3.6小心吸弃所有溶液。
3.7加入320μL缓冲液MW1,涡旋混匀15秒。
3.8转移至磁力架上,静置3~5分钟吸附磁珠。小心吸弃所有溶液。
3.9加入320μL缓冲液MW2,涡旋混匀15秒。
3.10转移至磁力架上,静置3~5分钟吸附磁珠。小心吸弃所有溶液。
3.11重复步骤3.9-3.10。
3.12短暂离心,收集管壁上的液滴。转移至磁力架上,小心吸弃所有溶液。
3.13空气干燥5-10分钟。
3.14加20μL缓冲液AE,吹打混匀。
3.15室温静置3分钟。
3.16转移至磁力架上,静置3分钟,用同样方法溶解。
3.17转移DNA溶液至新的1.5mL离心管中。
3.18 Qubit检测浓度。
4片段化DNA扩增
4.1按照表4在0.2mL PCR管中配制PCR反应体系。
表4 转座产物第一次扩增反应体系
*注:其中,DNA溶液为实施例1的步骤3.17所得的纯化后的DNA溶液;而在下述对比例1中所采用的DNA溶液为实施例1的步骤1.4所得的纯化后的DNA溶液。
N5引物:
Pho-GAACGACATGGCTACGATCCGACTTTCGTCGGCAGCGTC(SEQ ID NO:5);
N7引物:
TGTGAGCCAAGGAGTTGTTGTCTTCNNNNNNNNNNGTCTCGTGGGCTCGG(SEQ ID NO:6),
其中NNNNNNNNNN为10个随机碱基组成的标签序列,每个样本使用的标签序列均不同。
4.2按照下列参数进行第一次扩增:
5 Q-PCR鉴定及二次扩增
5.1配制Q-PCR反应体系(如表5):
表5 荧光定量PCR鉴定添加循环数反应体系
5.2按照如下参数进行qPCR:
如图1,在qPCR线性扩增Rn/Cycle曲线中,平台期荧光强度1/3对应的循环数即为需要补加的循环数N。
5.3按照如下参数进行第二次扩增:
其中,N为步骤5.2所确定的循环数,样品扩增曲线见图2。
6 XP磁珠双选
6.1检查PCR管中体积,用NF-H2O补充至50μL;
6.2加入40μL磁珠(0.8×),吹打混匀,室温静置5分钟;
6.3上磁力架2分钟,转移上清至新管中(上清中的DNA片段都小于350bp);
6.4加入35μL磁珠(0.7×),混匀,室温静置5min;
6.5上磁力架2分钟,去掉含小DNA片段和RNA的上清;
6.6保持在磁座上,加入150μL预冷的80%乙醇洗两次(30s);
6.7保持在磁座上5分钟,使得水分蒸发;
6.8为洗脱DNA,加入20μL TE Buffer(AMBION AM9858),轻轻吹打混匀,室温孵育5min;
6.9上磁力架2分钟,将上清转移到新管中,勿吸到磁珠;
6.10 Qubit dsDNA High sensitivity assay(INVITROGEN Q32854)定量
6.11对样品进行Agilent 2100检测。检测结果见图3。
7文库环化与酶切
7.1所使用的单链介导片段为:5′-GCCATGTCGTTCTGTGAGCCAAGG-3′(SEQ ID NO:4)。
7.2取324.5ng步骤6纯化所得的DNA溶液,加入5μL单链介导片段(20μM),用灭菌超纯水补至70μL。
7.3将7.2混合液转移至热循环仪中,95℃反应3min,迅速放置冰上10min。
7.4根据表6配制单链DNA连接反应体系,混合均匀,快速离心3s。
表6 单链DNA连接反应体系
*注:表6中,DNA混合液为步骤7.3所得溶液。
7.5转移至热循环仪中,37℃反应60min,4℃暂存。
7.6按照表7配制酶切反应体系,混合均匀,快速离心3s。
表7 单链DNA酶切反应体系
*注:表7中,EXO I为外切核酸酶I,EXO III为外切核酸酶III。
7.8转移至热循环仪中,37℃反应30min,4℃暂存。
8文库回收
8.1涡旋震荡混匀PEG32磁珠并吸取170μL体积至128μL PCR产物中,使用移液器轻轻吹打10次充分混匀。室温孵育10分钟;
8.2将EP管短暂离心并置于磁力架中分离磁珠和液体。待溶液澄清(约5min)后小心移除上清;
8.3保持EP管始终处于磁力架中,加入200μL新鲜配制的80%乙醇漂洗磁珠。室温孵育30s后小心移除上清;
8.4重复上步,总计漂洗两次;
8.5保持EP管始终处于磁力架中,开盖空气干燥10min;
8.6将EP管从磁力架中取出,加入25μL灭菌超纯水洗脱。使用移液器轻轻吹打充分混匀,室温放置5min。将反应管短暂离心并置于磁力架中分离磁珠和液体。待溶液澄清(约5min)后小心吸取上清至干净EP管中,于-20℃保存;
8.7纯化后产物取1μL测ssDNA浓度。
9上机测序
根据BGI-SEQ500测序仪的操作说明书,将构建好的文库制备成DNB(DNA纳米球),其中,使用文库6ng,RCA反应20min。然后在测序仪上采用常规PE50+10策略进行测序。
需要说明的是,对按照本发明获得的血液游离DNA文库的测序,进行低深度测序即可实现。
10下机数据分析
10.1将下机Fastq测序数据进行质量过滤和比对,得到数据比对后的Bam文件。
10.2通过测序数据双端片段的配对,得到每条片段全长和位置信息。
10.3通过对片段大小进行过滤,保留大片段(60bp以上),计算这些片段所在样本间的相关性,以及这些片段在不同基因的启动子和增强子区域的富集情况,结果如图4与5所示。
10.4将这些片段数据与来自ENCODE数据库中人体不同组织的DNase-seq数据进行聚类分析,结果如图6所示。
对比例1
本对比例采用现有技术中的方法,即直接提取血液游离DNA后进行转座反应,具体如下:
1直接提取血液游离DNA后进行转座反应
1.1对实施例1的步骤1.2中纯化后的血浆直接提取血液游离DNA(具体方法参照实施例1的步骤3)。
1.2按照表8配制Tn5转座反应体系,冰上配制完成后,混合均匀,于恒温金属混匀仪上,37℃转座30min。中间轻轻震荡。
表8 血液游离DNA提取后的转座反应体系
1.3终止反应:加入7.5μL 5×NT缓冲液,轻轻吹打20次,室温放置5分钟。
1.4 1.8×磁珠回收DNA样品
1.4.1 XP磁珠(AGENCOURTA63882)从4℃冰箱中取出,混匀,室温放置10min。
1.4.2加入1.8×XP磁珠,吹打10次混匀,室温静置5min。
1.4.3放到磁力架上,静置2min,磁珠被吸附,液体变澄清。
1.4.4去掉上清,可残留5μL,不要吸到磁珠。
1.4.5加入150μL 80%乙醇,静置30s,弃上清。
1.4.6.重复步骤6.5,最后将乙醇吸干静,晾干至磁珠表面不反光。
1.4.7将PCR管从磁力架上拿下,加入24μL NF水溶解,吹打10次混匀,
室温静置3min。
1.4.8上磁力架,静置1min,液体澄清。
1.4.9将上清转移至新管中。
1.4.10 Qubit dsDNA高灵敏度检测试剂盒(INVITROGEN Q32854)定量。
根据本对比例1的步骤1.4得到DNA样品溶液后,按照实施例1的步骤4-10继续进行实验,以分析在按照本对比例1的方法所构建的文库中,大片段(60bp以上)在不同基因的启动子和增强子区域的富集情况,结果如图4所示。
如图4所示,对实施例1和对比例1的结果进行比较分析可以发现,很明显,依据本发明的方法(实施例1)所得到的样本之间的相关性比现有方法(对比例1)的样本之间相关性更高。
如图5所示,本发明的方法(实施例1)所得到的区域富集效果比现有方法(对比例1)的富集效果显著增强。
如图6所示,用本发明方法所得到的样本数据与来自人体不同组织的数据通过聚类方法聚类到一起,说明本发明方法能捕获到来自人体不同组织的体液游离DNA信息,可以进一步进行组织溯源。
申请人声明,本申请通过上述实施例来说明本申请的详细方法,但本申请并不局限于上述详细方法,即不意味着本申请必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本申请的任何改进,对本申请产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本申请的保护范围和公开范围之内。
SEQUENCE LISTING
<110> 深圳华大生命科学研究院
<120> 一种体液游离DNA的文库构建方法及其应用
<130> PIDC3200976PCN
<160> 6
<170> PatentIn version 3.5
<210> 1
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物A
<400> 1
ctgtctctta tacacatct 19
<210> 2
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物B
<400> 2
tcgtcggcag cgtcagatgt gtataagaga cag 33
<210> 3
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物C
<400> 3
gtctcgtggg ctcggagatg tgtataagag acag 34
<210> 4
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 介导片段
<400> 4
gccatgtcgt tctgtgagcc aagg 24
<210> 5
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> N5 引物
<400> 5
gaacgacatg gctacgatcc gactttcgtc ggcagcgtc 39
<210> 6
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> N7 引物
<220>
<221> misc_feature
<222> (26)..(35)
<223> n is a, c, g, or t
<400> 6
tgtgagccaa ggagttgttg tcttcnnnnn nnnnngtctc gtgggctcgg 50
Claims (24)
1.一种获得个体表观信息的方法,其包括:
(1)获得个体的体液游离DNA文库;
(2)对步骤(1)所得体液游离DNA文库进行双端测序和分析,以获得个体表观信息,其中,所述分析包括:对片段大小进行过滤,保留60bp以上的DNA片段的测序数据,以筛选出核小体DNA片段,基于所述测序数据,获得个体的表观遗传信息;
其中,步骤(1)中获得个体的体液游离DNA文库包括:
(a)用Tn5转座酶直接作用于体液样本,以将体液样本中的游离DNA片段化;
(b)对步骤(a)所得片段化的DNA进行扩增,获得体液游离DNA文库。
2.根据权利要求1所述的方法,其中,步骤(a)包括:利用转座酶,对含有游离DNA的体液样本进行转座反应,以将所述游离DNA进行片段化并添加接头序列,获得包含接头序列的DNA片段。
3.根据权利要求1所述的方法,其中,步骤(a)还包括:在将所述游离DNA进行片段化并添加接头序列之后,进行核酸提取的步骤。
4.根据权利要求2所述的方法,其中,用于所述转座反应的接头为接头混合物,其通过以下步骤制备:
1)将引物A:5'-CTGTCTCTTATACACATCT-3'与引物B:5′-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3′退火,得退火产物1;
2)将引物A:5'-CTGTCTCTTATACACATCT-3'与引物C:5′-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3′退火,得退火产物2;
3)将退火产物1和退火产物2混合,得接头混合物。
5.根据权利要求4所述的方法,其中,所述接头混合物与所述转座酶进行包埋,获得转座酶包埋复合物,以用于转座反应。
6.根据权利要求5所述的方法,其中,将所述接头混合物与包含转座酶的TagmentEnzyme Advanced V5S进行包埋。
7.根据权利要求6所述的方法,其中,所述接头混合物与所述Tagment EnzymeAdvanced V5S的体积比为1:20-1:25。
8.根据权利要求6所述的方法,其中,所述接头混合物与所述Tagment EnzymeAdvanced V5S的体积比为1:24.5。
9.根据权利要求5所述的方法,其中,所述包埋在22-28℃下进行40-80min。
10.根据权利要求5所述的方法,其中,所述包埋在25℃下进行60min。
11.根据权利要求5所述的方法,其中,将所述转座酶包埋复合物与所述体液样本在转座反应条件下进行孵育,以实现转座反应。
12.根据权利要求11所述的方法,其中,对于所述转座反应,所述转座酶包埋复合物与所述体液样本的体积比为1:50-1:80。
13.根据权利要求11所述的方法,其中,对于所述转座反应,所述转座酶包埋复合物与所述体液样本的体积比为1:62.5。
14.根据权利要求11所述的方法,其中,所述转座反应温度为35-40℃。
15.根据权利要求11所述的方法,其中,所述转座反应温度为37℃。
16.根据权利要求11所述的方法,其中,所述转座反应时间为55-65min。
17.根据权利要求11所述的方法,其中,所述转座反应时间为60min。
18.根据权利要求1-17任一项所述的方法,其中,步骤(b)中所述扩增包括两次扩增。
19.根据权利要求18所述的方法,其中,在第一次扩增后,通过qPCR确定需要补加的循环数N,作为第二次扩增的循环数。
20.根据权利要求1-17任一项所述的方法,其还包括:
步骤(c):对步骤b)所获得的体液游离DNA文库进行环化和酶切。
21.根据权利要求20所述的方法,其中,所述环化包括将所述体液游离DNA文库中的双链DNA变性为单链DNA,再通过与单链DNA部分区域互补的寡核苷酸片段、通过碱基互补配对进行连接。
22.根据权利要求21所述的方法,其中,使用介导片段:5'-GCCATGTCGTTCTGTGAGCCAAGG-3'与所述单链DNA互补配对连接以实现环化。
23.根据权利要求20所述的方法,其中,使用外切核酸酶I和外切核酸酶III进行所述酶切,以去除未环化的DNA。
24.根据权利要求20所述的方法,其中,步骤(c)还包括:对酶切产物进行纯化的步骤;优选地,使用磁珠进行纯化。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2017/113208 WO2019024341A1 (zh) | 2017-11-27 | 2017-11-27 | 一种体液游离dna的文库构建方法及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111386362A CN111386362A (zh) | 2020-07-07 |
CN111386362B true CN111386362B (zh) | 2024-11-12 |
Family
ID=
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102296065A (zh) * | 2011-08-04 | 2011-12-28 | 盛司潼 | 用于构建测序文库的系统与方法 |
WO2017004083A1 (en) * | 2015-06-29 | 2017-01-05 | The Regents Of The University Of California | Methods of producing nucleic acid libraries and compositions and kits for practicing same |
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102296065A (zh) * | 2011-08-04 | 2011-12-28 | 盛司潼 | 用于构建测序文库的系统与方法 |
WO2017004083A1 (en) * | 2015-06-29 | 2017-01-05 | The Regents Of The University Of California | Methods of producing nucleic acid libraries and compositions and kits for practicing same |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210254148A1 (en) | Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing | |
CN107190329B (zh) | 基于dna的融合基因定量测序建库、检测方法及其应用 | |
US20230340590A1 (en) | Method for verifying bioassay samples | |
EP1169479B1 (en) | Methods for detecting nucleic acids indicative of cancer | |
EP2376631A1 (en) | Method for analysis of nucleic acid populations | |
CN110760936B (zh) | 构建dna甲基化文库的方法及其应用 | |
CN111979307B (zh) | 用于检测基因融合的靶向测序方法 | |
CN111575380A (zh) | 多基因检测用的探针库、杂交试剂盒和多基因检测的方法 | |
CN112662771B (zh) | 一种肿瘤融合基因的靶向捕获探针及其应用 | |
EP3719182B1 (en) | Method for constructing library of cell-free dnas in body fluids and application thereof | |
CN109680343B (zh) | 一种外泌体微量dna的建库方法 | |
CN111560423B (zh) | 一种高通量高灵敏度单碱基分辨率检测RNA m6A的方法及其应用 | |
CN103797130B (zh) | 用于确定人体具有异常状态的系统和方法 | |
CN110791813A (zh) | 对单链dna进行处理的方法及应用 | |
CN106282361B (zh) | 用于捕获血液病相关基因的基因捕获试剂盒 | |
CN111386362B (zh) | 一种体液游离dna的文库构建方法及其应用 | |
CN111020710A (zh) | 造血及淋巴组织肿瘤的ctDNA高通量检测 | |
CN115961008A (zh) | 用于直接检测多个样本中bcr-abl1融合基因启动子甲基化的试剂盒及使用方法 | |
KR102695246B1 (ko) | 유전체와 후성 유전체 동시 분석 방법 및 분석 시스템 | |
CN113930487B (zh) | 一种新型多样本多片段dna甲基化检测方法 | |
CN114574498B (zh) | 一种靶向肿瘤相关成纤维细胞的核酸适配体及其应用 | |
CN117305466B (zh) | 一种能够识别单碱基甲基化状态的检测方法 | |
US20240376533A1 (en) | Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing | |
WO2024138523A1 (zh) | 时空转录组测序方法 | |
WO2016166530A1 (en) | Method for analysing nuclease hypersensitive sites. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |