分离的寡核苷酸及其在核酸测序中的用途
技术领域
本发明涉及生物技术领域。具体而言,涉及分离的寡核苷酸及其在核酸测序中的用途。更具体的,涉及一种分离的寡核苷酸、一种试剂盒、一种在双链DNA片段两端添加接头的方法、一种针对双链DNA片段构建测序文库的方法以及一种核酸测序方法。
背景技术
高通量测序已经成为了现代分子生物学、生物技术、医学等多领域的基础之一。在近几年,对迅速、精确、经济的基因表达水平和核苷酸序列的测定方法的研究不断推陈出新;以边合成边测序为基本原理的第二代高通量测序技术已趋于成熟,各大测序公司纷纷将重点放在了新测序产品的开发、测序流程的缩短和成本降低上。目前已有的基于第二代测序技术的测序产品有全基因组重测序、全转录组测序、小分子RNA测序等。特别的,第二代测序结合微阵列技术而衍生出来的应用--目标序列捕获测序技术能够使用大量寡核苷酸探针与基因组上的特定区域互补结合,从而富集到特定区段,然后用第二代测序技术对这些区段进行测序,以实现人全外显子组测序(WES)。这种测序方式数据分析压力小,较之全基因组测序有明显优势。
然而,目前关于核酸测序的相关技术仍有待改进。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。
首先,需要说明的是,本发明是基于发明人的下列发现而完成的:
Complete Genomics公司(在本文中有时简称为“CG”)目前已有一套独立自主开发的第二代测序技术,适用于人全基因组测序。其文库构建流程主要包括:基因组DNA打断、第一次接头连接、双链环化并酶切、第二次接头连接、单链分离环化。其中两次接头连接在整个建库流程非常重要。接头是一段DNA序列,通过连接固定在DNA片段两端后,在测序时能被识别并作为测序的起始位点,供仪器读取其后的序列信息。为保证读取的序列信息易于分析,在一个DNA片段的两端(5’端和3’端)需要加上两种不同的接头;为了实现这种特定的方向性连接,同时避免接头间的相互连接,可以采用粘性末端接头连接的方式;但这种方式要求具有粘性末端的片段,难以避免片段间相互连接的问题。而Complete Genomics公司测序文库构建则采用了分多步骤分别添加两端接头的方式。为获得两端均连接上接头的片段,需要经过DNA片段一端连接接头、变性退火延伸、在DNA片段另一端连接接头、缺口补平、聚合酶链式反应在内五个步骤。其中多次的延伸反应所需试剂费用高昂,多个步骤间需要进行多次纯化回收,总体成本高且缺乏效率。并且,在目前的文库构建方案中,这样的接头连接过程要进行两次。
为此,本发明提出了一种适用于在DNA片段两端添加接头的手段。
在本发明的第一方面,本发明提出了一种分离的寡核苷酸。根据本发明的实施例,该寡核苷酸包括:第一链,所述第一链的5’末端核苷酸具有磷酸基团,并且所述第一链的3’末端核苷酸为双脱氧核苷酸;以及第二链,所述第二链的5’末端核苷酸不具有磷酸基团,并且所述第二链的3’末端核苷酸为双脱氧核苷酸,其中,所述第一链的长度大于所述第二链的长度,并且所述第一链和所述第二链之间形成双链结构。由于该寡核苷酸中的第一链和第二链的3’末端均为双脱氧核苷酸,并且在第二链的5’末端核苷酸不具有磷酸基团,这些末端将无法与与其他核酸片段相互连接,从而可以防止寡核苷酸之间的互相连接。由此,该分离的寡核苷酸可以作为接头用于构建测序文库,并且在构建测序文库时可以实现同时在核酸片段的两端连接不同的接头,同时避免了接头之间的互相连接,提高了连接效率,降低了构建测序文库的经济和时间成本。
根据本发明的第二方面,本发明提出了一种试剂盒。根据本发明的实施例,该试剂盒包括:第一接头和第二接头,所述第一接头和第二接头均为前面所述的分离的寡核苷酸,其中,所述第一接头与所述第二接头不同。如前所述,由于根据本发明实施例的寡核苷酸中的第一链和第二链的3’末端均为双脱氧核苷酸,并且在第二链的5’末端核苷酸不具有磷酸基团,这些末端将无法与其他核酸片段相互连接,从而可以防止寡核苷酸之间的互相连接。由此,该试剂盒可以作为接头用于构建测序文库,并且在构建测序文库时可以实现同时在核酸片段的两端连接不同的接头,同时避免了接头之间的互相连接,提高了连接效率,降低了构建测序文库的经济和时间成本。前面关于根据本发明实施例的分离的寡核苷酸的特征和优点的描述同样适用该试剂盒,在此不再赘述。
在本发明的第三方面,本发明提供了一种在双链DNA片段两端添加接头的方法。根据本发明的实施例,所述双链DNA片段具有两个平端末端,并且所述双链DNA片段的四个末端核苷酸均不具有磷酸基团,并且所述方法包括:将所述双链DNA片段与第一接头和第二接头进行连接,以便获得第一连接产物,其中,所述第一接头和第二接头不同,并且所述第一接头和第二接头均为前面所述的分离的寡核苷酸;使用第一单链DNA置换所述第一接头的第二链,并且使用第二单链DNA置换所述第二接头的第二链,其中,所述第一单链DNA能够与所述第一接头的第一链特异性匹配形成双链结构,所述第二单链DNA能够与所述第二接头的第一链特异性匹配形成双链结构;使所述第一单链DNA和所述第二单链DNA分别与所述双链DNA片段发生连接,以便获得第二连接产物;以及利用第一引物和第二引物,对所述第二连接产物进行扩增,以便获得扩增产物,其中,所述扩增产物为两端连接有接头的DNA片段,其中,所述第一引物包含与所述第一单链DNA和所述第二单链DNA之一相同的序列,所述第二引物包含与所述第一单链DNA和所述第二单链DNA的另一个相同的序列,并且与所述第一单链DNA和所述第二单链DNA的所述另一个相比在5’末端具有额外的生物素。如前所述,由于根据本发明实施例的寡核苷酸中的第一链和第二链的3’末端均为双脱氧核苷酸,并且在第二链的5’末端核苷酸不具有磷酸基团,这些末端将无法与其他核酸片段相互连接,从而可以防止寡核苷酸之间的互相连接。由此,该寡核苷酸作为接头在构建测序文库时可以实现同时在核酸片段的两端连接不同的接头,同时避免了接头之间的互相连接,提高了连接效率,降低了构建测序文库的经济和时间成本。前面关于根据本发明实施例的分离的寡核苷酸的特征和优点的描述同样适用该方法,在此不再赘述。另外,在构建测序文库时,可以利用该第一单链DNA和第二单链DNA分别置换两个接头的第二链,并且与第一链形成更稳定的双链结构,进一步,通过采用第一单链DNA和第二单链DNA作为引物,进行PCR扩增,可以形成在两端具有稳定接头的DNA片段。
在本发明的第四方面,本发明提出了一种针对双链DNA片段构建测序文库的方法。根据本发明的实施例,所述双链DNA片段具有两个平端末端,并且所述双链DNA片段的四个末端核苷酸均不具有磷酸基团,并且该方法包括:根据前面所述的在双链DNA片段两端连接接头的方法,在所述双链DNA片段的两端连接接头,以便获得两端连接有接头的DNA片段;从所述两端连接有接头的DNA片段分离单链DNA片段;以及将所述单链DNA片段进行环化,以便获得单链DNA环,所述单链DNA环构成所述测序文库。如前所述,由于根据本发明实施例的寡核苷酸中的第一链和第二链的3’末端均为双脱氧核苷酸,并且在第二链的5’末端核苷酸不具有磷酸基团,这些末端将无法与其他核酸片段相互连接,从而可以防止寡核苷酸之间的互相连接。由此,该寡核苷酸作为接头在构建测序文库时可以实现同时在核酸片段的两端连接不同的接头,同时避免了接头之间的互相连接,提高了连接效率,降低了构建测序文库的经济和时间成本。前面关于根据本发明实施例的分离的寡核苷酸的特征和优点的描述同样适用该方法,在此不再赘述。另外,在构建测序文库时,可以利用该第一单链DNA和第二单链DNA分别置换两个接头的第二链,并且与第一链形成更稳定的双链结构,进一步,通过采用第一单链DNA和第二单链DNA作为引物,进行PCR扩增,可以形成在两端具有稳定接头的DNA片段。进一步通过分离单链DNA,并且进行单链成环反应,可以有效地获得测序文库,例如用于CG测序平台的测序文库。
在本发明的第五方面,本发明提供了一种核酸测序方法。根据本发明的实施例,该方法包括:根据前面所述的针对双链DNA片段构建测序文库的方法,构建测序文库;以及对所述测序文库进行测序。如前所述,由于根据本发明实施例的寡核苷酸中的第一链和第二链的3’末端均为双脱氧核苷酸,并且在第二链的5’末端核苷酸不具有磷酸基团,这些末端将无法与其他核酸片段相互连接,从而可以防止寡核苷酸之间的互相连接。由此,该寡核苷酸作为接头在构建测序文库时可以实现同时在核酸片段的两端连接不同的接头,同时避免了接头之间的互相连接,提高了连接效率,降低了构建测序文库的经济和时间成本。前面关于根据本发明实施例的分离的寡核苷酸的特征和优点的描述同样适用该方法,在此不再赘述。另外,在构建测序文库时,可以利用该第一单链DNA和第二单链DNA分别置换两个接头的第二链,并且与第一链形成更稳定的双链结构,进一步,通过采用第一单链DNA和第二单链DNA作为引物,进行PCR扩增,可以形成在两端具有稳定接头的DNA片段。进一步通过分离单链DNA,并且进行单链成环反应,可以有效地获得测序文库,例如用于CG测序平台的测序文库。从而可以进一步提高测序的效率,降低测序的成本。
在本发明的第六方面,本发明还提供了一种在双链DNA片段两端添加接头的装置。根据本发明的实施例,所述双链DNA片段具有两个平端末端,并且所述双链DNA片段的四个末端核苷酸均不具有磷酸基团,并且该装置包括:第一连接单元,所述第一连接单元用于将所述DNA片段与第一接头和第二接头进行连接,以便获得第一连接产物,其中,所述第一接头和第二接头不同,并且所述第一接头和第二接头均为前面所述的分离的寡核苷酸;置换单元,所述置换单元用于使用第一单链DNA置换所述第一接头的第二链,并且使用第二单链DNA置换所述第二接头的第二链,其中,所述第一单链DNA能够与所述第一接头的第一链特异性匹配形成双链结构,所述第二单链DNA能够与所述第二接头的第一链特异性匹配形成双链结构;第二连接单元,所述第二连接单元用于使所述第一单链DNA和所述第二单链DNA分别与所述DNA片段发生连接,以便获得第二连接产物;以及扩增单元,所述扩增单元用于利用第一引物和第二引物,对所述第二连接产物进行扩增,以便获得扩增产物,其中,所述第一引物包含与所述第一单链DNA和所述第二单链DNA之一相同的序列,所述第二引物包含与所述第一单链DNA和所述第二单链DNA的另一个相同的序列,并且与所述第一单链DNA和所述第二单链DNA的所述另一个相比在5’末端具有额外的生物素。如前所述,由于根据本发明实施例的寡核苷酸中的第一链和第二链的3’末端均为双脱氧核苷酸,并且在第二链的5’末端核苷酸不具有磷酸基团,这些末端将无法与其他核酸片段相互连接,从而可以防止寡核苷酸之间的互相连接。由此,该寡核苷酸作为接头在构建测序文库时可以实现同时在核酸片段的两端连接不同的接头,同时避免了接头之间的互相连接,提高了连接效率,降低了构建测序文库的经济和时间成本。前面关于根据本发明实施例的分离的寡核苷酸的特征和优点的描述同样适用该装置,在此不再赘述。另外,在构建测序文库时,可以利用该第一单链DNA和第二单链DNA分别置换两个接头的第二链,并且与第一链形成更稳定的双链结构,进一步,通过采用第一单链DNA和第二单链DNA作为引物,进行PCR扩增,可以形成在两端具有稳定接头的DNA片段。
在本发明的第七方面,本发明还提出了一种针对双链DNA片段构建测序文库的设备。根据本发明的实施例,所述双链DNA片段具有两个平端末端,并且所述双链DNA片段的四个末端核苷酸均不具有磷酸基团,并且所述设备包括:前面所述的在双链DNA片段两端添加接头的装置,用于在所述双链DNA片段的两端连接接头,以便获得两端连接有接头的DNA片段;单链DNA片段分离装置,所述单链DNA片段分离装置用于从所述两端连接有接头的DNA片段分离单链DNA片段;以及环化装置,所述环化装置用于将所述单链DNA片段进行环化,以便获得单链DNA环,所述单链DNA环构成所述测序文库。如前所述,由于根据本发明实施例的寡核苷酸中的第一链和第二链的3’末端均为双脱氧核苷酸,并且在第二链的5’末端核苷酸不具有磷酸基团,这些末端将无法与其他核酸片段相互连接,从而可以防止寡核苷酸之间的互相连接。由此,该寡核苷酸作为接头在构建测序文库时可以实现同时在核酸片段的两端连接不同的接头,同时避免了接头之间的互相连接,提高了连接效率,降低了构建测序文库的经济和时间成本。前面关于根据本发明实施例的分离的寡核苷酸的特征和优点的描述同样适用该设备,在此不再赘述。另外,在构建测序文库时,可以利用该第一单链DNA和第二单链DNA分别置换两个接头的第二链,并且与第一链形成更稳定的双链结构,进一步,通过采用第一单链DNA和第二单链DNA作为引物,进行PCR扩增,可以形成在两端具有稳定接头的DNA片段。进一步通过分离单链DNA,并且进行单链成环反应,可以有效地获得测序文库,例如用于CG测序平台的测序文库。
在本发明的第八方面,本发明还提出了一种核酸测序系统。根据本发明的实施例,该系统包括:前面所述的针对双链DNA片段构建测序文库的设备;以及测序设备,所述测序设备用于对所述测序文库进行测序。如前所述,由于根据本发明实施例的寡核苷酸中的第一链和第二链的3’末端均为双脱氧核苷酸,并且在第二链的5’末端核苷酸不具有磷酸基团,这些末端将无法与其他核酸片段相互连接,从而可以防止寡核苷酸之间的互相连接。由此,该寡核苷酸作为接头在构建测序文库时可以实现同时在核酸片段的两端连接不同的接头,同时避免了接头之间的互相连接,提高了连接效率,降低了构建测序文库的经济和时间成本。前面关于根据本发明实施例的分离的寡核苷酸的特征和优点的描述同样适用该系统,在此不再赘述。另外,在构建测序文库时,可以利用该第一单链DNA和第二单链DNA分别置换两个接头的第二链,并且与第一链形成更稳定的双链结构,进一步,通过采用第一单链DNA和第二单链DNA作为引物,进行PCR扩增,可以形成在两端具有稳定接头的DNA片段。进一步通过分离单链DNA,并且进行单链成环反应,可以有效地获得测序文库,例如用于CG测序平台的测序文库。从而可以进一步提高测序的效率,降低测序的成本。
在本发明的第九方面,本发明还提出了一种用于针对基因组DNA构建测序文库的装置。根据本发明的实施例,该装置包括:手段,用于对所述基因组DNA进行片段化,以便获得片段化产物;手段,用于对所述片段化产物进行去磷酸化处理,以便获得经过去磷酸化处理的片段化产物;手段,用于对所述经过去磷酸化处理的片段化产物进行末端修复,以便获得双链DNA片段;手段,用于将所述双链DNA片段与第一接头和第二接头进行连接,以便获得第一连接产物,其中,所述第一接头和第二接头不同,并且所述第一接头和第二接头均为前面所述的分离的寡核苷酸;手段,用于使用第一单链DNA置换所述第一接头的第二链,并且使用第二单链DNA置换所述第二接头的第二链,其中,所述第一单链DNA能够与所述第一接头的第一链特异性匹配形成双链结构,所述第二单链DNA能够与所述第二接头的第一链特异性匹配形成双链结构;手段,用于使所述第一单链DNA和所述第二单链DNA分别与所述DNA片段发生连接,以便获得第二连接产物;手段,利用第一引物和第二引物,对所述第二连接产物进行扩增,以便获得扩增产物,其中,所述扩增产物为两端连接有接头的DNA片段,其中,所述第一引物包含与所述第一单链DNA和所述第二单链DNA之一相同的序列,所述第二引物包含与所述第一单链DNA和所述第二单链DNA的另一个相同的序列,并且与所述第一单链DNA和所述第二单链DNA的所述另一个相比在5’末端具有额外的生物素;手段,用于从所述两端连接有接头的DNA片段分离单链DNA片段;以及手段,用于将所述单链DNA片段进行环化,以便获得单链DNA环,所述单链DNA环构成所述测序文库。如前所述,由于根据本发明实施例的寡核苷酸中的第一链和第二链的3’末端均为双脱氧核苷酸,并且在第二链的5’末端核苷酸不具有磷酸基团,这些末端将无法与其他核酸片段相互连接,从而可以防止寡核苷酸之间的互相连接。由此,该寡核苷酸作为接头在构建测序文库时可以实现同时在核酸片段的两端连接不同的接头,同时避免了接头之间的互相连接,提高了连接效率,降低了构建测序文库的经济和时间成本。前面关于根据本发明实施例的分离的寡核苷酸的特征和优点的描述同样适用该装置,在此不再赘述。另外,在构建测序文库时,可以利用该第一单链DNA和第二单链DNA分别置换两个接头的第二链,并且与第一链形成更稳定的双链结构,进一步,通过采用第一单链DNA和第二单链DNA作为引物,进行PCR扩增,可以形成在两端具有稳定接头的DNA片段。进一步通过分离单链DNA,并且进行单链成环反应,可以有效地获得测序文库,例如用于CG测序平台的测序文库。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1显示了根据本发明一个实施例的构建测序文库的流程示意图。1:打断后DNA片段。2:经过去磷酸化、末端修复后的片段(每个末端均为羟基)。3:接头A。4:接头B。5:单链C。6:单链D。7:单链C上的标签序列。8:最终产物环状单链。
图2显示了根据本发明一个实施例的电泳图。
图3显示了根据本发明一个实施例的电泳图。
图4显示了根据本发明一个实施例的在双链DNA片段两端添加接头的方法的流程示意图。
图5显示了根据本发明一个实施例的在双链DNA片段两端添加接头的装置的结构示意图。
图6显示了根据本发明一个实施例的针对双链DNA片段构建测序文库的设备的结构示意图。
图7显示了根据本发明一个实施例的核酸测序系统的结构示意图。
具体实施方式
下面详细描述本发明的实施例。下面描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
需要说明的是,在本文中所采用的术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。进一步地,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
分离的寡核苷酸、试剂盒
在本发明的第一方面,本发明提出了一种分离的寡核苷酸。根据本发明的实施例,该寡核苷酸包括:第一链,所述第一链的5’末端核苷酸具有磷酸基团,并且所述第一链的3’末端核苷酸为双脱氧核苷酸;以及第二链,所述第二链的5’末端核苷酸不具有磷酸基团,并且所述第二链的3’末端核苷酸为双脱氧核苷酸,其中,所述第一链的长度大于所述第二链的长度,并且所述第一链和所述第二链之间形成双链结构。由于该寡核苷酸中的第一链和第二链的3’末端均为双脱氧核苷酸,并且在第二链的5’末端核苷酸不具有磷酸基团,这些末端将无法与与其他核酸片段相互连接,从而可以防止寡核苷酸之间的互相连接。由此,该分离的寡核苷酸可以作为接头用于构建测序文库,并且在构建测序文库时可以实现同时在核酸片段的两端连接不同的接头,同时避免了接头之间的互相连接,提高了连接效率,降低了构建测序文库的经济和时间成本。
根据本发明的一个实施例,所述第二链上与所述第一链不匹配的核苷酸数目不超过3个。由此,可以进一步提高在构建测序文库时的连接效率,进一步降低了构建测序文库的经济和时间成本。
根据本发明的一个实施例,包括:第一突出端,所述第一突出端位于所述第一链的3’端;以及任选的第二突出端,所述第二突出端位于所述第二链的5’端。由此,可以进一步提高在构建测序文库时的连接效率,进一步降低了构建测序文库的经济和时间成本。
根据本发明的一个实施例,所述第一突出端的长度大于所述第二突出端的长度。由此,可以进一步提高在构建测序文库时的连接效率,进一步降低了构建测序文库的经济和时间成本。
根据本发明的一个实施例,所述第一突出端的长度为大约6~12nt。由此,可以进一步提高在构建测序文库时的连接效率,进一步降低了构建测序文库的经济和时间成本。
根据本发明的一个实施例,所述第二突出端的长度为0~4nt。由此,可以进一步提高在构建测序文库时的连接效率,进一步降低了构建测序文库的经济和时间成本。
根据本发明的一个实施例,所述第一链和第二链均为DNA。
根据本发明的一个实施例,所述第一链的长度为大约20~25nt。由此,可以进一步提高在构建测序文库时的连接效率,进一步降低了构建测序文库的经济和时间成本。
根据本发明的一个实施例,所述第二链的长度为大约10~15nt。由此,可以进一步提高在构建测序文库时的连接效率,进一步降低了构建测序文库的经济和时间成本。
根据本发明的一个实施例,所述第一链的序列为:5’GGCTCCGTCGAAGCCCGACGC3’(SEQ ID NO:1),以及所述第二链的序列为:5’CTTCGACGGAGCC3’(SEQ ID NO:2);或者所述第一链的序列为:5’ACGTCGGGGCCAAGCGGTCGTC3’(SEQ ID NO:3),以及所述第二链的序列为:5’TTGGCCCCGGCTT3’(SEQ ID NO:4)。由此,可以进一步提高在构建测序文库时的连接效率,进一步降低了构建测序文库的经济和时间成本。
根据本发明的第二方面,本发明提出了一种试剂盒。根据本发明的实施例,该试剂盒包括:第一接头和第二接头,所述第一接头和第二接头均为前面所述的分离的寡核苷酸,其中,所述第一接头与所述第二接头不同。
如前所述,由于根据本发明实施例的寡核苷酸中的第一链和第二链的3’末端均为双脱氧核苷酸,并且在第二链的5’末端核苷酸不具有磷酸基团,这些末端将无法与其他核酸片段相互连接,从而可以防止寡核苷酸之间的互相连接。由此,该试剂盒可以作为接头用于构建测序文库,并且在构建测序文库时可以实现同时在核酸片段的两端连接不同的接头,同时避免了接头之间的互相连接,提高了连接效率,降低了构建测序文库的经济和时间成本。前面关于根据本发明实施例的分离的寡核苷酸的特征和优点的描述同样适用该试剂盒,在此不再赘述。
根据本发明的一个实施例,进一步包括:第一单链DNA,所述第一单链DNA能够与所述第一接头的第一链匹配形成双链结构;以及第二单链DNA,所述第二单链DNA能够与所述第二接头的第一链匹配形成双链结构。由此,在构建测序文库时,可以利用该第一单链DNA和第二单链DNA分别置换两个接头的第二链,并且与第一链形成更稳定的双链结构,进一步,通过采用第一单链DNA和第二单链DNA作为引物,进行PCR扩增,可以形成在两端具有稳定接头的DNA片段。
根据本发明的一个实施例,所述第一单链DNA与所述第一接头的第一链形成的双链结构的长度大于所述第一接头中所述第一链和所述第二链之间形成双链结构的长度;以及所述第二单链DNA与所述第二接头的第一链形成的双链结构的长度大于所述第二接头中所述第一链和所述第二链之间形成双链结构的长度。由此,可以进一步提高在构建测序文库时的连接效率,进一步降低了构建测序文库的经济和时间成本。
根据本发明的一个实施例,进一步包括:第一引物,所述第一引物与所述第一单链DNA和所述第二单链DNA之一相同;以及第二引物,所述第二引物与所述第一单链DNA和所述第二单链DNA的另一个相比在5’末端具有额外的生物素。由此,可以进一步提高在构建测序文库时的连接效率,进一步降低了构建测序文库的经济和时间成本。并且,采用能够特异性识别生物的试剂,可以有效地分离单链核酸分子,进而可以用于构建CG测序平台的测序文库。
根据本发明的一个实施例,所述第一接头的第一链的序列为:5’GGCTCCGTCGAAGCCCGACGC3’(SEQ ID NO:1);所述第一接头的第二链的序列为:5’CTTCGACGGAGCC3’(SEQ ID NO:2);所述第二接头的第一链的序列为:5’ACGTCGGGGCCAAGCGGTCGTC3’(SEQ ID NO:3);所述第二接头的第二链的序列为:5’TTGGCCCCGGCTT3’(SEQ ID NO:4);所述第一单链DNA的序列为:5’AGACAAGCTC(N)mGATCGGGCTTCGACGGAG3’,其中,(N)m表示长度为m个核苷酸的标签序列,其中,m为4~10中的任意整数,N=A、T、G或者C;以及所述第二单链DNA的序列为5’TCCTAAGACCGCTTGGCCCCG3’(SEQ ID NO:5)。由此,可以进一步提高在构建测序文库时的连接效率,进一步降低了构建测序文库的经济和时间成本。并且,采用能够特异性识别生物的试剂,可以有效地分离单链核酸分子,进而可以用于构建CG测序平台的测序文库。
分离的寡核苷酸在核酸测序中的用途
在本发明的第三方面,本发明提供了一种在双链DNA片段两端添加接头的方法。根据本发明的实施例,所述双链DNA片段具有两个平端末端,并且所述双链DNA片段的四个末端核苷酸均不具有磷酸基团,并且参照图4,所述方法包括:
S100:将双链DNA片段与第一接头和第二接头进行连接
将所述双链DNA片段与第一接头和第二接头进行连接,以便获得第一连接产物,其中,所述第一接头和第二接头不同,并且所述第一接头和第二接头均为前面所述的分离的寡核苷酸。
根据本发明的一个实施例,将所述双链DNA片段与第一接头和第二接头进行连接的步骤是在一步反应中完成的。
根据本发明的一个实施例,所述DNA片段是通过下列步骤获得的:对DNA样本进行片段化,以便获得片段化产物;对所述片段化产物进行去磷酸化处理,以便获得去磷酸化处理的片段化产物;以及对所述经过去磷酸化处理的片段化产物进行末端修复处理,以便获得所述双链DNA片段。由此,可以有效地获得适于构建测序文库的DNA片段。
根据本发明的一个实施例,所述DNA样本为基因组DNA的至少一部分或者RNA的反转录产物。由此,可以有效地针对基因组DNA或者RNA构建测序文库。
S200:使用第一单链DNA置换第一接头的第二链,第二单链DNA置换第二接头的第二链
使用第一单链DNA置换所述第一接头的第二链,并且使用第二单链DNA置换所述第二接头的第二链,其中,所述第一单链DNA能够与所述第一接头的第一链特异性匹配形成双链结构,所述第二单链DNA能够与所述第二接头的第一链特异性匹配形成双链结构。
根据本发明的一个实施例,所述第一单链DNA与所述第一接头的第一链形成的双链结构的长度大于所述第一接头中所述第一链和所述第二链之间形成双链结构的长度;以及所述第二单链DNA与所述第二接头的第一链形成的双链结构的长度大于所述第二接头中所述第一链和所述第二链之间形成双链结构的长度。由此,可以进一步提高在构建测序文库时的连接效率,进一步降低了构建测序文库的经济和时间成本。
根据本发明的一个实施例,所述第一接头的第一链的序列为:5’GGCTCCGTCGAAGCCCGACGC3’(SEQ ID NO:1);所述第一接头的第二链的序列为:5’CTTCGACGGAGCC3’(SEQ ID NO:2);所述第二接头的第一链的序列为:5’ACGTCGGGGCCAAGCGGTCGTC3’(SEQ ID NO:3);所述第二接头的第二链的序列为:5’TTGGCCCCGGCTT3’(SEQ ID NO:4);以及所述第一单链DNA的序列为:5’AGACAAGCTC(N)mGATCGGGCTTCGACGGAG3’,其中,(N)m表示长度为m个核苷酸的标签序列,其中,m为4~10中的任意整数,N=A、T、G或者C;所述第二单链DNA的序列为5’TCCTAAGACCGCTTGGCCCCG3’(SEQID NO:5)。由此,可以进一步提高在构建测序文库时的连接效率,进一步降低了构建测序文库的经济和时间成本。并且,采用能够特异性识别生物素的试剂,可以有效地分离单链核酸分子,进而可以用于构建CG测序平台的测序文库。
根据本发明的一个实施例,通过热裂解-退火处理,使用第一单链DNA置换所述第一接头的第二链,并且使用第二单链DNA置换所述第二接头的第二链。根据本发明的一些具体示例,所述热裂解是在大约60摄氏度下进行的。由此,可以进一步提高在构建测序文库时的连接效率,进一步降低了构建测序文库的经济和时间成本。
S300:使第一单链DNA和第二单链DNA分别与双链DNA片段发生连接
使所述第一单链DNA和所述第二单链DNA分别与所述双链DNA片段发生连接,以便获得第二连接产物。
根据本发明的一个实施例,通过缺口补平反应,使所述第一单链DNA和所述第二单链DNA分别与所述双链DNA片段发生连接。
S400:利用第一引物和第二引物,对所述第二连接产物进行扩增
利用第一引物和第二引物,对所述第二连接产物进行扩增,以便获得扩增产物,其中,所述扩增产物为两端连接有接头的DNA片段,其中,所述第一引物包含与所述第一单链DNA和所述第二单链DNA之一相同的序列,所述第二引物包含与所述第一单链DNA和所述第二单链DNA的另一个相同的序列,并且与所述第一单链DNA和所述第二单链DNA的所述另一个相比在5’末端具有额外的生物素。
如前所述,由于根据本发明实施例的寡核苷酸中的第一链和第二链的3’末端均为双脱氧核苷酸,并且在第二链的5’末端核苷酸不具有磷酸基团,这些末端将无法与其他核酸片段相互连接,从而可以防止寡核苷酸之间的互相连接。由此,该寡核苷酸作为接头在构建测序文库时可以实现同时在核酸片段的两端连接不同的接头,同时避免了接头之间的互相连接,提高了连接效率,降低了构建测序文库的经济和时间成本。前面关于根据本发明实施例的分离的寡核苷酸的特征和优点的描述同样适用该方法,在此不再赘述。另外,在构建测序文库时,可以利用该第一单链DNA和第二单链DNA分别置换两个接头的第二链,并且与第一链形成更稳定的双链结构,进一步,通过采用第一单链DNA和第二单链DNA作为引物,进行PCR扩增,可以形成在两端具有稳定接头的DNA片段。
在本发明的第四方面,本发明提出了一种针对双链DNA片段构建测序文库的方法。根据本发明的实施例,所述双链DNA片段具有两个平端末端,并且所述双链DNA片段的四个末端核苷酸均不具有磷酸基团,并且该方法包括:
首先,根据前面所述的在双链DNA片段两端连接接头的方法,在所述双链DNA片段的两端连接接头,以便获得两端连接有接头的DNA片段。
其次,从所述两端连接有接头的DNA片段分离单链DNA片段。根据本发明的一个实施例,从所述两端连接有接头的DNA片段分离单链DNA片段进一步包括:使所述两端连接有接头的DNA片段与磁珠接触,以便形成磁珠-DNA复合物,其中,所述磁珠上连接有链霉亲和素;以及将所述磁珠-DNA复合物与pH高于7的溶液接触,以便获得所述单链DNA片段。由此,可以有效地分离单链DNA片段,从而提高构建测序文库的效率,降低构建测序文库的成本。根据本发明的一个实施例,所述pH高于7的溶液为氢氧化钠溶液。根据本发明的一个实施例,所述氢氧化钠溶液的浓度为大约0.5~2M。根据本发明的另一个实施例,所述氢氧化钠溶液的浓度为大约1M。根据本发明的一个实施例,在从所述两端连接有接头的DNA片段分离单链DNA片段之前,预先对所述两端连接有接头的DNA片段进行筛选。由此,可以针对预定的区域进行测序文库构建。其中,根据本发明的一个实施例,所述筛选是通过所述两端连接有接头的DNA片段与探针接触进行的,其中,所述探针对于预定序列是特异性的。根据本发明的一个具体示例,所述预定序列包括至少一个外显子。根据本发明的另一个实施例,所述探针是以微芯片阵列的形式提供的。由此,能够有效地将单链DNA片段进行环化。
然后,将所述单链DNA片段进行环化,以便获得单链DNA环,所述单链DNA环构成所述测序文库。根据本发明的一个实施例,通过采用单链核酸分子将所述单链DNA片段进行环化,其中,所述单链核酸分子上限定出第一区段和第二区段,并且所述第一区段能够与包含所述单链DNA片段的5’末端核苷酸和3’末端核苷酸的序列匹配,所述第二区段能够与包含所述单链DNA片段的5’末端核苷酸和3’末端核苷酸的之一的序列匹配。由此,可以进一步提高成环效率。根据本发明的一个实施例,所述第一区段和所述第二区段是毗邻连接的。根据本发明的一个实施例,所述第一区段的序列为5’TCGAGCTTGTCT3’(SEQ ID NO:6);以及所述第二区段的序列为5’TCCTAAGACCGC3’(SEQ ID NO:7)。
如前所述,由于根据本发明实施例的寡核苷酸中的第一链和第二链的3’末端均为双脱氧核苷酸,并且在第二链的5’末端核苷酸不具有磷酸基团,这些末端将无法与其他核酸片段相互连接,从而可以防止寡核苷酸之间的互相连接。由此,该寡核苷酸作为接头在构建测序文库时可以实现同时在核酸片段的两端连接不同的接头,同时避免了接头之间的互相连接,提高了连接效率,降低了构建测序文库的经济和时间成本。前面关于根据本发明实施例的分离的寡核苷酸的特征和优点的描述同样适用该方法,在此不再赘述。另外,在构建测序文库时,可以利用该第一单链DNA和第二单链DNA分别置换两个接头的第二链,并且与第一链形成更稳定的双链结构,进一步,通过采用第一单链DNA和第二单链DNA作为引物,进行PCR扩增,可以形成在两端具有稳定接头的DNA片段。进一步通过分离单链DNA,并且进行单链成环反应,可以有效地获得测序文库,例如用于CG测序平台的测序文库。
在本发明的第五方面,本发明提供了一种核酸测序方法。根据本发明的实施例,该方法包括:根据前面所述的针对双链DNA片段构建测序文库的方法,构建测序文库;以及对所述测序文库进行测序。根据本发明的一个实施例,采用CG测序平台,对所述测序文库进行测序。
如前所述,由于根据本发明实施例的寡核苷酸中的第一链和第二链的3’末端均为双脱氧核苷酸,并且在第二链的5’末端核苷酸不具有磷酸基团,这些末端将无法与其他核酸片段相互连接,从而可以防止寡核苷酸之间的互相连接。由此,该寡核苷酸作为接头在构建测序文库时可以实现同时在核酸片段的两端连接不同的接头,同时避免了接头之间的互相连接,提高了连接效率,降低了构建测序文库的经济和时间成本。前面关于根据本发明实施例的分离的寡核苷酸的特征和优点的描述同样适用该方法,在此不再赘述。另外,在构建测序文库时,可以利用该第一单链DNA和第二单链DNA分别置换两个接头的第二链,并且与第一链形成更稳定的双链结构,进一步,通过采用第一单链DNA和第二单链DNA作为引物,进行PCR扩增,可以形成在两端具有稳定接头的DNA片段。进一步通过分离单链DNA,并且进行单链成环反应,可以有效地获得测序文库,例如用于CG测序平台的测序文库。从而可以进一步提高测序的效率,降低测序的成本。
在本发明的第六方面,本发明还提供了一种在双链DNA片段两端添加接头的装置。根据本发明的实施例,所述双链DNA片段具有两个平端末端,并且所述双链DNA片段的四个末端核苷酸均不具有磷酸基团,并且参照图5,该装置100包括:第一连接单元101、置换单元102、第二连接单元103和扩增单元104。具体地:
第一连接单元101用于将所述DNA片段与第一接头和第二接头进行连接,以便获得第一连接产物,其中,所述第一接头和第二接头不同,并且所述第一接头和第二接头均为前面所述的分离的寡核苷酸。根据本发明的一个实施例,所述第一连接单元被配置为在一步反应中将所述DNA片段与第一接头和第二接头进行连接。
置换单元102用于使用第一单链DNA置换所述第一接头的第二链,并且使用第二单链DNA置换所述第二接头的第二链,其中,所述第一单链DNA能够与所述第一接头的第一链特异性匹配形成双链结构,所述第二单链DNA能够与所述第二接头的第一链特异性匹配形成双链结构。根据本发明的一个实施例,所述第一单链DNA与所述第一接头的第一链形成的双链结构的长度大于所述第一接头中所述第一链和所述第二链之间形成双链结构的长度;以及所述第二单链DNA与所述第二接头的第一链形成的双链结构的长度大于所述第二接头中所述第一链和所述第二链之间形成双链结构的长度。由此,可以进一步提高在后续构建测序文库时的连接效率,进一步降低了构建测序文库的经济和时间成本。根据本发明的一个实施例,所述第一接头的第一链的序列为:5’GGCTCCGTCGAAGCCCGACGC3’(SEQ ID NO:1);所述第一接头的第二链的序列为:5’CTTCGACGGAGCC3’(SEQ ID NO:2);所述第二接头的第一链的序列为:5’ACGTCGGGGCCAAGCGGTCGTC3’(SEQ ID NO:3);所述第二接头的第二链的序列为:5’TTGGCCCCGGCTT3’(SEQ ID NO:4);所述第一单链DNA的序列为:5’AGACAAGCTC(N)mGATCGGGCTTCGACGGAG3’,其中,(N)m表示长度为m个核苷酸的标签序列,其中,m为4~10中的任意整数,N=A、T、G或者C;以及所述第二单链DNA的序列为5’TCCTAAGACCGCTTGGCCCCG3’(SEQ ID NO:5)。由此,可以进一步提高用于构建测序文库时的连接效率,进一步降低了构建测序文库的经济和时间成本。并且,采用能够特异性识别生物素的试剂,可以有效地分离单链核酸分子,进而可以用于构建CG测序平台的测序文库。
根据本发明的一个实施例,所述置换单元102被配置为通过热裂解-退火处理,使用第一单链DNA置换所述第一接头的第二链,并且使用第二单链DNA置换所述第二接头的第二链。根据本发明的一个实施例,所述热裂解是在大约60摄氏度下进行的。由此,可以进一步提高在构建测序文库时的连接效率,进一步降低了构建测序文库的经济和时间成本。
第二连接单元103用于使所述第一单链DNA和所述第二单链DNA分别与所述DNA片段发生连接,以便获得第二连接产物。根据本发明的一个实施例,所述第二连接单元103被配置为通过缺口补平反应,使所述第一单链DNA和所述第二单链DNA分别与所述双链DNA片段发生连接。
扩增单元104用于利用第一引物和第二引物,对所述第二连接产物进行扩增,以便获得扩增产物,其中,所述第一引物包含与所述第一单链DNA和所述第二单链DNA之一相同的序列,所述第二引物包含与所述第一单链DNA和所述第二单链DNA的另一个相同的序列,并且与所述第一单链DNA和所述第二单链DNA的所述另一个相比在5’末端具有额外的生物素。
根据本发明的一个实施例,进一步包括双链DNA片段获取单元(图中未示出),所述DNA片段获取单元包括:片段化组件,所述片断化组件用于对DNA样本进行片段化,以便获得片段化产物;去磷酸化组件,所述去磷酸化组件用于对所述片段化产物进行去磷酸化处理,以便获得经过去磷酸化处理的片段化产物;以及末端修复组件,所述末端修复组件用于对所述经过去磷酸化处理的片段化产物进行末端修复,以便获得所述双链DNA片段。由此,可以有效地获得适于构建测序文库的DNA片段。
根据本发明的一个实施例,所述双链DNA片段获取单元进一步包括:基因组DNA提取组件,所述基因组DNA提取组件用于从生物样本提取基因组DNA;和/或反转录组件,所述反转录组件用于对RNA样本进行反转录反应,以便获得反转录产物,其中,所述基因组DNA的至少一部分和/或RNA的反转录产物构成所述DNA样本。由此,可以有效地针对基因组DNA或者RNA构建测序文库。
如前所述,由于根据本发明实施例的寡核苷酸中的第一链和第二链的3’末端均为双脱氧核苷酸,并且在第二链的5’末端核苷酸不具有磷酸基团,这些末端将无法与其他核酸片段相互连接,从而可以防止寡核苷酸之间的互相连接。由此,该寡核苷酸作为接头在构建测序文库时可以实现同时在核酸片段的两端连接不同的接头,同时避免了接头之间的互相连接,提高了连接效率,降低了构建测序文库的经济和时间成本。前面关于根据本发明实施例的分离的寡核苷酸的特征和优点的描述同样适用该装置,在此不再赘述。另外,在构建测序文库时,可以利用该第一单链DNA和第二单链DNA分别置换两个接头的第二链,并且与第一链形成更稳定的双链结构,进一步,通过采用第一单链DNA和第二单链DNA作为引物,进行PCR扩增,可以形成在两端具有稳定接头的DNA片段。
在本发明的第七方面,本发明还提出了一种针对双链DNA片段构建测序文库的设备。根据本发明的实施例,所述双链DNA片段具有两个平端末端,并且所述双链DNA片段的四个末端核苷酸均不具有磷酸基团,并且参照图6,所述设备1000包括:前面所述的在双链DNA片段两端添加接头的装置100、单链DNA片段分离装置200和环化装置300。具体地:
在双链DNA片段两端添加接头的装置100用于在所述双链DNA片段的两端连接接头,以便获得两端连接有接头的DNA片段。单链DNA片段分离装置200用于从所述两端连接有接头的DNA片段分离单链DNA片段。环化装置300用于将所述单链DNA片段进行环化,以便获得单链DNA环,所述单链DNA环构成所述测序文库。
根据本发明的一个实施例,所述单链DNA片段分离装置200进一步包括:磁珠捕获单元,所述磁珠捕获单元用于使所述两端连接有接头的DNA片段与磁珠接触,以便形成磁珠-DNA复合物,其中,所述磁珠上连接有链霉亲和素;碱性裂解单元,所述碱性裂解单元中设置有pH高于7的溶液,用于将所述磁珠-DNA复合物与pH低于7的溶液接触,以便获得所述单链DNA片段。由此,可以有效地分离单链DNA片段,从而提高构建测序文库的效率,降低构建测序文库的成本。根据本发明的一个实施例,所述pH高于7的溶液为氢氧化钠溶液。根据本发明的一个实施例,所述氢氧化钠溶液的浓度为大约0.5~2M。根据本发明的另一个实施例,所述氢氧化钠溶液的浓度为大约1M。
根据本发明的一个实施例,进一步包括:筛选装置(图中未示出),所述筛选装置用于在从所述两端连接有接头的DNA片段分离单链DNA片段之前,预先对所述两端连接有接头的DNA片段进行筛选。根据本发明的一个实施例,所述筛选装置中设置有探针,其中,所述探针对于预定序列是特异性的。根据本发明的一个实施例,所述预定序列包括至少一个外显子。根据本发明的一个实施例,所述探针是以微芯片阵列的形式提供的。
根据本发明的一个实施例,所述环化装置300中设置有单链核酸分子,其中,所述单链核酸分子上限定出第一区段和第二区段,并且所述第一区段能够与包含所述单链DNA片段的5’末端核苷酸和3’末端核苷酸的序列匹配,所述第二区段能够与包含所述单链DNA片段的5’末端核苷酸和3’末端核苷酸的之一的序列匹配。根据本发明的一个实施例,所述第一区段和所述第二区段是毗邻连接的。根据本发明的一个实施例,所述第一区段的序列为5’TCGAGCTTGTCT3’(SEQ ID NO:6);以及所述第二区段的序列为5’TCCTAAGACCGC3’(SEQID NO:7)。由此,能够有效地通过采用单链核酸分子将单链DNA片段进行环化。
如前所述,由于根据本发明实施例的寡核苷酸中的第一链和第二链的3’末端均为双脱氧核苷酸,并且在第二链的5’末端核苷酸不具有磷酸基团,这些末端将无法与其他核酸片段相互连接,从而可以防止寡核苷酸之间的互相连接。由此,该寡核苷酸作为接头在构建测序文库时可以实现同时在核酸片段的两端连接不同的接头,同时避免了接头之间的互相连接,提高了连接效率,降低了构建测序文库的经济和时间成本。前面关于根据本发明实施例的分离的寡核苷酸的特征和优点的描述同样适用该设备,在此不再赘述。另外,在构建测序文库时,可以利用该第一单链DNA和第二单链DNA分别置换两个接头的第二链,并且与第一链形成更稳定的双链结构,进一步,通过采用第一单链DNA和第二单链DNA作为引物,进行PCR扩增,可以形成在两端具有稳定接头的DNA片段。进一步通过分离单链DNA,并且进行单链成环反应,可以有效地获得测序文库,例如用于CG测序平台的测序文库。
在本发明的第八方面,本发明还提出了一种核酸测序系统。根据本发明的实施例,参照图7,该系统10000包括:前面所述的针对双链DNA片段构建测序文库的设备1000和测序设备2000,所述测序设备2000用于对所述测序文库进行测序。根据本发明的一个实施例,所述测序设备2000为CG测序平台。
如前所述,由于根据本发明实施例的寡核苷酸中的第一链和第二链的3’末端均为双脱氧核苷酸,并且在第二链的5’末端核苷酸不具有磷酸基团,这些末端将无法与其他核酸片段相互连接,从而可以防止寡核苷酸之间的互相连接。由此,该寡核苷酸作为接头在构建测序文库时可以实现同时在核酸片段的两端连接不同的接头,同时避免了接头之间的互相连接,提高了连接效率,降低了构建测序文库的经济和时间成本。前面关于根据本发明实施例的分离的寡核苷酸的特征和优点的描述同样适用该系统,在此不再赘述。另外,在构建测序文库时,可以利用该第一单链DNA和第二单链DNA分别置换两个接头的第二链,并且与第一链形成更稳定的双链结构,进一步,通过采用第一单链DNA和第二单链DNA作为引物,进行PCR扩增,可以形成在两端具有稳定接头的DNA片段。进一步通过分离单链DNA,并且进行单链成环反应,可以有效地获得测序文库,例如用于CG测序平台的测序文库。从而可以进一步提高测序的效率,降低测序的成本。
在本发明的第九方面,本发明还提出了一种用于针对基因组DNA构建测序文库的装置。根据本发明的实施例,该装置包括:
手段,用于对所述基因组DNA进行片段化,以便获得片段化产物;
手段,用于对所述片段化产物进行去磷酸化处理,以便获得经过去磷酸化处理的片段化产物;
手段,用于对所述经过去磷酸化处理的片段化产物进行末端修复,以便获得双链DNA片段;
手段,用于将所述双链DNA片段与第一接头和第二接头进行连接,以便获得第一连接产物,其中,所述第一接头和第二接头不同,并且所述第一接头和第二接头均为前面所述的分离的寡核苷酸;
手段,用于使用第一单链DNA置换所述第一接头的第二链,并且使用第二单链DNA置换所述第二接头的第二链,其中,所述第一单链DNA能够与所述第一接头的第一链特异性匹配形成双链结构,所述第二单链DNA能够与所述第二接头的第一链特异性匹配形成双链结构;
手段,用于使所述第一单链DNA和所述第二单链DNA分别与所述DNA片段发生连接,以便获得第二连接产物;
手段,利用第一引物和第二引物,对所述第二连接产物进行扩增,以便获得扩增产物,其中,所述扩增产物为两端连接有接头的DNA片段,其中,所述第一引物包含与所述第一单链DNA和所述第二单链DNA之一相同的序列,所述第二引物包含与所述第一单链DNA和所述第二单链DNA的另一个相同的序列,并且与所述第一单链DNA和所述第二单链DNA的所述另一个相比在5’末端具有额外的生物素;
手段,用于从所述两端连接有接头的DNA片段分离单链DNA片段;以及
手段,用于将所述单链DNA片段进行环化,以便获得单链DNA环,所述单链DNA环构成所述测序文库。
如前所述,由于根据本发明实施例的寡核苷酸中的第一链和第二链的3’末端均为双脱氧核苷酸,并且在第二链的5’末端核苷酸不具有磷酸基团,这些末端将无法与其他核酸片段相互连接,从而可以防止寡核苷酸之间的互相连接。由此,该寡核苷酸作为接头在构建测序文库时可以实现同时在核酸片段的两端连接不同的接头,同时避免了接头之间的互相连接,提高了连接效率,降低了构建测序文库的经济和时间成本。前面关于根据本发明实施例的分离的寡核苷酸的特征和优点的描述同样适用该装置,在此不再赘述。另外,在构建测序文库时,可以利用该第一单链DNA和第二单链DNA分别置换两个接头的第二链,并且与第一链形成更稳定的双链结构,进一步,通过采用第一单链DNA和第二单链DNA作为引物,进行PCR扩增,可以形成在两端具有稳定接头的DNA片段。进一步通过分离单链DNA,并且进行单链成环反应,可以有效地获得测序文库,例如用于CG测序平台的测序文库。
根据本发明的一个实施例,将所述双链DNA片段与第一接头和第二接头进行连接是在一步反应中完成的。
根据本发明的一个实施例,进一步包括:
手段,用于从生物样本提取基因组DNA;和/或
手段,用于从对RNA样本进行反转录反应,
其中,
所述基因组DNA的至少一部分和/或RNA的反转录产物构成所述DNA样本。
根据本发明的一个实施例,用于从所述两端连接有接头的DNA片段分离单链DNA片段的手段,被配置为适于通过下列步骤分离所述单链DNA片段:使所述两端连接有接头的DNA片段与磁珠接触,以便形成磁珠-DNA复合物,其中,所述磁珠上连接有链霉亲和素;以及将所述磁珠-DNA复合物与pH低于7的溶液接触,以便获得所述单链DNA片段。由此,可以有效地分离单链DNA片段,从而提高构建测序文库的效率,降低构建测序文库的成本。
根据本发明的一个实施例,进一步包括:手段,用于在从所述两端连接有接头的DNA片段分离单链DNA片段之前,预先对所述两端连接有接头的DNA片段进行筛选。根据本发明的一个实施例,所述筛选是通过所述两端连接有接头的DNA片段与探针接触进行的,其中,所述探针对于预定序列是特异性的。根据本发明的一个实施例,所述预定序列包括至少一个外显子。根据本发明的一个实施例,所述探针是以微芯片阵列的形式提供的。
根据本发明的一个实施例,用于将所述单链DNA片段进行环化的手段被配置为采用单链核酸分子将所述单链DNA片段进行环化,其中,所述单链核酸分子上限定出第一区段和第二区段,并且所述第一区段能够与包含所述单链DNA片段的5’末端核苷酸和3’末端核苷酸的序列匹配,所述第二区段能够与包含所述单链DNA片段的5’末端核苷酸和3’末端核苷酸的之一的序列匹配。根据本发明的一个实施例,所述第一区段和所述第二区段是毗邻连接的。根据本发明的一个实施例,所述第一区段的序列为5’TCGAGCTTGTCT3’(SEQ ID NO:6);以及所述第二区段的序列为5’TCCTAAGACCGC3’(SEQ ID NO:7)。由此,能够有效地通过采用单链核酸分子将单链DNA片段进行环化。
综上所述,根据本发明的实施例的技术方案可以具有下列优点的至少之一:
根据本发明的实施例的技术方案解决了Complete Genomics公司测序平台文库构建中存在的接头连接步骤过多,整体文库构建时间过长,成本过高的问题。
根据本发明的实施例的技术方案,在接头连接时抛弃了传统的多步骤分别添加两端接头的方式,转而采用了在同一次反应中加入两端接头的新型方法。
根据本发明的实施例的技术方案,同时加入两种接头的连接方式同样需要解决接头自连、片段互连等问题;而本发明设计的连接接头有着独特的序列构造,通过同样新颖的接头连接方法;同时解决了片段互连、接头自连、片段连接效率低、标签序列引入位置等问题;并成功地将整个接头连接过程缩短为三个步骤;大大缩短了接头连接所需时间,明显地降低了成本。
根据本发明的实施例的技术方案将独创的接头连接方法结合于核酸探针捕获技术,通过进一步设计调整Complete Genomics公司传统文库构建方案;成功将接头连接过程从两次减少为一次。显著缩短文库构建成本和时间;且成功创立了基于Complete Genomics公司测序平台的单接头的全外显子组测序产品。
由此,根据本发明的实施例,参考图1,在本发明的实施例中可以按照下列步骤构建测序文库:
1.基因组核酸链被打断成片段;
2.对目标片段进行去磷酸化;去磷酸化用于封闭目的片段5’端,防止片段自连。
3.补平片段两端,使两端均为平末端(图1中编号2所示)。
4.在目标片段的两端加上接头A(图1中编号3所示)。和接头B(图1中编号4所示)接头A和B均为为多聚核苷酸双链,由一条长链(第一链)和一条短链(第二链)组成。长链由于5’端具有磷酸基团,能与目标核酸片段进行连接,短链通过碱基互补配对结合在长链上,由于短链末端为封闭序列,不会目标核酸片段连接;
5.加入核酸单链C(图1中编号5所示)和核酸单链D(图1编号6所示)。单链C具有标签序列(图1编号7所示),其余部分片段与接头A长链互补配对;单链D则能与接头B长链互补配对。通过退火过程,导致结合不牢固的接头短链掉落、单链C、D与接头长链的互补配对。再通过延伸、连接反应,实现了单链C和单链D与目的片段的连接。
6.以步骤4产物为模板,单链C、D作为引物进行聚合酶链式反应,扩增富集带有标签序列的产物;
7.取步骤5产物进行寡核苷酸探针杂交捕获;具体步骤包括探针杂交、杂交产物洗脱、杂交产物富集步骤;并在杂交产物富集步骤中,在目的核酸双链的一条链上引入生物素修饰。
8.对杂交捕获后的核酸双链进行长度筛选(可选);
9.通过核酸双链中一条链上的生物素标记,将筛选后的核酸双链分离为两条核酸单链;
10.将该核酸单链环化,并去掉剩余的未环化单链。
需要说明的是步骤7片段长度筛选可以选在单链分离前的其他步骤后进行,具体情况视乎测序具体需求和各步骤后产物片段大小的实际变化而定。如果通过质量控制确认各步骤产物的大小一直符合要求,可以去掉步骤8。
采用步骤7,可以实现全外显子测序而引入的步骤。
根据本发明的实施例,通过步骤2、3的处理;目的核酸片段经过去磷酸化的末端封闭处理后,成为了两端封闭的平末端片段,完全避免了片段间相互作用的发生,使连接前片段的利用率得到了极高的保证。
根据本发明的实施例,本发明的特殊接头设计在接头A、B的长链的5’端引入了磷酸基团;且在接头长链3’端和短链的双末端都引入了封闭序列。由于封闭序列的存在,被封闭的末端不但无法与目标核酸片段进行连接,更无法与同时加入的其他接头进行连接;确保了在步骤4进行接头连接时,接头长链的5’末端能够准确地连接至目的片段3’末端。这种设计非常有效地防止了接头互连的发生,使不同接头的连接同时进行成为了可能,且保证了连接反应的效率。
根据本发明的实施例,在步骤5里,巧妙地运用了接头结构中长短链的特性;由于短链互补配对碱基较少、结合不稳定,在相对较温和的温度就会与长链分离;再通过缓慢退火反应,简单地使具有较长碱基互补配对序列,结合能力更占优势的单链C、D与接头长链结合;延伸连接后形成了完整地双链接头。通过在单链C上引入标签序列,还能同时为接头提供识别标签。这种独特的设计有反应条件温和的特点;借此,通过对反应体系、反应时间、反应顺序的适当调整;更使片段置换、连接、延伸三个反应在同一个反应步骤5中进行,且操作简单,反应迅速,极大地降低了处理时间。
根据本发明的实施例,成功地将接头连接从原来的五步缩短为接头连接、缺口补平、聚合酶链式反应三个步骤,操作量大大减少,省去了多种试剂的使用,节约了大量的时间和成本。
根据本发明的实施例,不但从接头连接的具体方法上进行全面的更换,更颠覆性地改变了了CG公司传统的文库构建方案,提出了新颖的单链核酸文库结构(图1标记8);将传统的两次的接头连接过程精简为仅一次接头连接过程;减少了聚合酶链式反应的引入,提升了测序的质量。更主要的是,步骤的精简将文库构建的时间缩短了3-4天之多。成本大量降低;较于传统方案有巨大优势。
根据本发明的实施例,本发明通过对Complete Genomics公司传统的测序文库构建方案进行修改和补充,结合之前阐述的新颖接头连接方法,成功研发出了适合于人全外显子组测序的高效的文库构建方案。开发出了基于Complete Genomics测序平台的新颖的人全外显子组测序产品,实现了基于Complete Genomics平台的全外显子组测序从无到有的突破。
本领域技术人员将会理解,下面的实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件(例如参考J.萨姆布鲁克等著,黄培堂等译的《分子克隆实验指南》,第三版,科学出版社)或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
一般方法
参考图1,在本发明的实施例中按照下列步骤构建测序文库:
1.基因组核酸链被打断成片段;
2.对目标片段进行去磷酸化;去磷酸化用于封闭目的片段5’端,防止片段自连。
3补平片段两端,使两端均为平末端(图1中编号2所示)。
4.在目标片段的两端加上接头A(图1中编号3所示)。和接头B(图1中编号4所示)接头A和B均为为多聚核苷酸双链,由一条长链(第一链)和一条短链(第二链)组成。长链由于5’端具有磷酸基团,能与目标核酸片段进行连接,短链通过碱基互补配对结合在长链上,由于短链末端为封闭序列,不会目标核酸片段连接;
5.加入核酸单链C(图1中编号5所示)和核酸单链D(图1编号6所示)。单链C具有标签序列(图1编号7所示),其余部分片段与接头A长链互补配对;单链D则能与接头B长链互补配对。通过退火过程,导致结合不牢固的接头短链掉落、单链C、D与接头长链的互补配对。再通过延伸、连接反应,实现了单链C和单链D与目的片段的连接。
6.以步骤4产物为模板,单链C、D作为引物进行聚合酶链式反应,扩增富集带有标签序列的产物;
7.取步骤5产物进行寡核苷酸探针杂交捕获;具体步骤包括探针杂交、杂交产物洗脱、杂交产物富集步骤;并在杂交产物富集步骤中,在目的核酸双链的一条链上引入生物素修饰。
8.对杂交捕获后的核酸双链进行长度筛选(可选);
9.通过核酸双链中一条链上的生物素标记,将筛选后的核酸双链分离为两条核酸单链;
10.将该核酸单链环化,并去掉剩余的未环化单链。
需要说明的是步骤7片段长度筛选可以选在单链分离前的其他步骤后进行,具体情况视乎测序具体需求和各步骤后产物片段大小的实际变化而定。如果通过质量控制确认各步骤产物的大小一直符合要求,可以去掉步骤8。
采用步骤7,可以实现全外显子测序而引入的步骤。
实施例1:
1.基因组DNA打断:基因组DNA打断有多种方式,无论是物理超声法还是酶反应法,市场上有非常成熟的方案。本实施例采用的是物理超声打断法。
取96孔PCR板一块,加入一根聚四氟乙烯线,加入基因组DNA 1μg,加入TE缓冲溶液或无酶水补齐80μl。将板封膜后至于E220超声打断仪上超声打断。打断条件设置:
工作周期(DutyCycle) |
20% |
强度(Intensity) |
5 |
循环/脉冲(CyclesperBurst) |
200 |
打断时间 |
60s,5次 |
2.打断片段选择:可以采用磁珠纯化法或凝胶回收法。本实施例采用磁珠纯化法。
取打断后的DNA,加入80μlAmpure XP磁珠,混匀后放置7-15min;置入磁力架后收集上清,在上清中加入40μlAmpure XP磁珠,混匀后放置7-15min;置入磁力架吸去上清,用75%乙醇洗磁珠两次;晾干后加入50μl TE缓冲溶液或无酶水,混匀后放置7-15min溶解回收产物。
3.去磷酸化反应:取上步骤回收产物,按下表配制体系:
10xNEB缓冲液2 |
6μl |
虾碱性磷酸酶(1U/μl) |
6μl |
总体积 |
12μl |
将12μl反应液加入前一步的回收产物中,混匀,按下表条件进行反应。反应产物直接用于进行下一步骤。(其中“以0.1℃/s降温至4℃”步骤并非必须,反应时间也不需过于精确的控制。后同。)
4.片段末端修复:按下表配制体系:
将体系混匀后加入上一步骤产物中,混匀后置于12℃孵育20min。使用80μl PEG32磁珠进行纯化,40μl TE缓冲溶液溶解回收产物。(反应产物的纯化有多种方式,有磁珠法、柱纯化法、凝胶回收法等等。均可用于替换。本实施例如不做特殊说明,均采用磁珠法纯化。)
5.接头A、B连接:本方案中使用的接头序列如下(序列从左到右为5’端至3’端,“//”中为末端修饰基团,“phos”示磷酸化,“dd”示双脱氧,“bio”示生物素)。
接头A:
长链/Phos/GGCTCCGTCGAAGCCCGACG/ddC/
短链GCTTCGACGGAGC/ddC/
接头B:
长链:/phos/ACGTCGGGGCCAAGCGGTCGT/ddC/
短链:TTGGCCCCGGCT/-ddT/。
按下表配制体系:
无酶水 |
11.1μl |
5μM接头A |
1.85μl |
5μM接头B |
1.85μl |
总体积 |
14.8μl |
将以上体系混匀后加入到纯化后的上一步产物中。混匀后,配制以下体系:
将以上体系与之前的体系混匀,置于20℃孵育1h。使用100μlAmpure XP纯化,40μlTE缓冲溶液溶解回收产物。
此步骤完成了目的核酸片段与接头A、接头B的连接。连接前后产物电泳结果如图2所示。由图2可知,步骤5接头连接后片段大小增大明显,说明本方案接头连接是非常成功的。而特别是通过步骤7聚合酶链式反应后,条带更为集中,筛选富集效果明显。
6.单链C、D连接:
单链C:/phos/AGACAAGCTCxxxxxxxxxxGATCGGGCTTCGACGGAG(中间“x”处为可变的标签序列区域)
单链D:/bio/TCCTAAGACCGCTTGGCCCCGA。
按下表配制体系:
无酶水 |
19.88μl |
10xTaq缓冲液 |
8μl |
0.1M三磷酸腺苷 |
0.8μl |
25mM脱氧核糖核苷三磷酸 |
0.32μl |
20μM单链D |
0.5μl |
总体积 |
30μul |
先在上步骤回收产物中加入1μl的10μM的单链C,混匀后加入上述体系混匀,65℃反应5min,以0.1℃/s降温至37℃。
保持以上反应体系为37℃,配制以下反应体系:
无酶水 |
0.4μl |
10xTaq缓冲液 |
0.4μl |
T4DNA连接酶(600U/μl) |
4.8μl |
Taq聚合酶(5U/μl) |
2.4μl |
总体积 |
8μl |
将以上8μl反应混合物加入之前37℃的反应体系中。混匀后37℃反应20min。
使用96μlAmpure XP磁珠进行纯化,25μl TE缓冲溶液溶解回收产物。
7.聚合酶链式反应:按下表配制体系:
取30-40ng上步骤回收产物,用无酶水或TE补足25μl,加入到以上体系中,混匀后按下表条件进行反应:
反应完成后使用120μlAmpure XP磁珠进行纯化,25μl无酶水溶解回收产物。
8.杂交捕获:取500ng-1μg上步骤反应产物,浓缩蒸干后加入以下体系1中溶解:
将混合后的反应体系1置于95℃反应5min,持续放置于65℃。
配制体系2:
将体系2加入体系1中,持续放置于65℃。
配制体系3:
将体系3加入体系1、2中,65℃反应20-24h。
反应完成后使用链霉亲和素包裹的磁珠进行结合,结合完成后将磁珠溶于50μl无酶水中。
配制以下反应体系:
将溶解的磁珠加入反应体系中混匀,按下表进行反应:
反应完成后使用240μlAmpure XP磁珠进行纯化。
9.单链分离:使用链霉亲和素包裹的磁珠结合步骤8中获得的带生物素目的片段。使用78μl 0.1M氢氧化钠将未结合磁珠的单链分离下来,加入酸性缓冲液中和获得的分离产物,中和后产物总体积112μl。
10.单链环化:配制以下反应体系1:其中核酸单链E具有相应互补序列用于连接单链两端。
单链E序列如下:TCGAGCTTGTCTTCCTAAGACCGC(SEQ ID NO:8)
无酶水 |
43μl |
核酸单链E |
20μl |
总体积 |
63μl |
将反应体系1加入步骤9单链产物中。混匀。
配制反应体系2:
将反应体系2加入反应体系1中,混匀,37℃孵育1.5h。
11.外切酶1、外切酶3处理:
配置以下反应缓冲液:
将23.7μl上述配置的反应缓冲液加入步骤10的350μl反应产物中。混匀后置于37℃孵育30min。
加入15.4μl 500mM乙二胺四乙酸,混匀。
使用500μl PEG32磁珠纯化回收,40-80μl无酶水/TE缓冲液回溶。
本实施例最终产物浓度和总量情况如下:
电泳结果见图3。图3为步骤11后产物使用6%聚丙烯酰胺变性凝胶电泳的电泳结果图。如图3所示,产物1、3、5为步骤8杂交后进行了凝胶电泳片段筛选的,而产物2、4、6则是没有经过片段大小筛选步骤的。由图3可知,经过凝胶电泳片段筛选的产物大小更为集中,但不进行片段大小筛选的片段也能进行正常测序。证明本方案是完全成功的。
工业实用性
本发明的分离的寡核苷酸能够有效地作为接头用于构建测序文库,并且在构建测序文库时可以实现同时在核酸片段的两端连接不同的接头,同时避免了接头之间的互相连接,提高了连接效率,降低了构建测序文库的经济和时间成本。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。另外,需要说明的是,本领域技术人员能够理解,在本发明所提出的方案中所包含的步骤顺序,本领域技术人员可以进行调整,这也将包括在本发明的范围内。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
SEQUENCE LISTING
<110> 深圳华大基因科技有限公司
<120> 分离的寡核苷酸及其在核酸测序中的用途
<130> PIOC145502PCN
<160> 8
<170> PatentIn version 3.3
<210> 1
<211> 21
<212> DNA
<213> Artificial
<220>
<223> 接头第一链
<400> 1
ggctccgtcg aagcccgacg c 21
<210> 2
<211> 13
<212> DNA
<213> Artificial
<220>
<223> 接头第二链
<400> 2
cttcgacgga gcc 13
<210> 3
<211> 22
<212> DNA
<213> Artificial
<220>
<223> 接头第一链
<400> 3
acgtcggggc caagcggtcg tc 22
<210> 4
<211> 13
<212> DNA
<213> Artificial
<220>
<223> 接头第二链
<400> 4
ttggccccgg ctt 13
<210> 5
<211> 21
<212> DNA
<213> Artificial
<220>
<223> 第二单链DNA
<400> 5
tcctaagacc gcttggcccc g 21
<210> 6
<211> 12
<212> DNA
<213> Artificial
<220>
<223> 单链核酸分子的第一区段
<400> 6
tcgagcttgt ct 12
<210> 7
<211> 12
<212> DNA
<213> Artificial
<220>
<223> 单链核酸分子的第二区段
<400> 7
tcctaagacc gc 12
<210> 8
<211> 24
<212> DNA
<213> Artificial
<220>
<223> 核酸单链E
<400> 8
tcgagcttgt cttcctaaga ccgc 24