用于添加适配体至核酸的方法及用于实施所述方法的组合物
相关申请的交叉引用
根据35U.S.C.§119(e),本申请要求2013年10月17日提交的美国临时专利申请序列No.61/892,372和2014年4月15日提交的美国临时专利申请序列No.61/979,852的申请日期的优先权;所述申请的公开内容通过引用并入本文。
引言
大规模并行(或“下一代”)测序平台快速转化基因组、表观基因组和转录组研究中的数据收集和分析。某些测序平台,诸如由IonTorrentTM、RocheTM和LifeTechnologiesTM销售的那些,涉及未知序列的多核苷酸的固相扩增。这些多核苷酸的固相扩增通常通过首先连接已知的适配体序列至多核苷酸的每个末端进行。然后使双链多核苷酸变性以形成单链模板分子。使模板的3'末端的适配体序列杂合至固定在固体基质上的延伸引物,并且扩增通过延伸固定的引物进行。在通常被称为“桥PCR”中,与模板的5'末端相同的第二经固定的引物用作反向引物,从而使得正向链和反向链的扩增在固体基质如珠粒或流动池表面上进行。
用于对适配体添加测序的基于连接的方法的劣势是涉及的步骤的数目,包括可开始固相扩增之前制备靶多核苷酸所需的酶促步骤和洗涤步骤。作为一个实例,在连接适配体序列之后,未使用的适配体分子必需从连接的多核苷酸分离,之后添加混合物至流动池。否则,未使用的适配体分子还可杂交至经固定的引物,从而防止引物有效杂交至模板分子及随后的延伸。
基于连接的方法的另一个缺陷是其缺乏方向性,这使得在核酸不同末端处具有不同适配体很难。此外,此类方法的灵敏度较低并使得它们在仅少量样品材料可用的情况下不适用。
概述
提供了添加适配体至核酸的方法。所述方法包括在反应混合物中组合模板核糖核酸(RNA)、模板转换核酸(如模板转换寡核苷酸)(包括3'杂交结构域和测序平台适配体构建体)、聚合酶及dNTP。将反应混合物组分在足以产生包括模板RNA和模板转换寡核苷酸的产物核酸的条件下合并,所述模板RNA和模板转换寡核苷酸各自杂交至单一产物核酸的相邻区(包括通过聚合酶从dNTP聚合的区)。本发明的各方面还包括组合物和试剂盒。
附图详述
图1示意性示出用于产生具有根据本公开的一个实施方案的适配体构建体的核酸的基于模板转换的方法。在该实施方案中,具有少于目标测序平台所必需的所有核酸结构域的适配体构建体通过模板-转换聚合反应提供。剩余的核酸结构域通过聚合酶链式反应(PCR)使用包括剩余结构域的扩增引物提供。
图2示意性示出用于产生具有根据本公开的一个实施方案的适配体构建体的核酸的基于模板转换的方法。在该实施方案中,在模板-转换聚合反应期间提供包括目标测序平台所必需的所有核酸结构域的适配体。
图3示意性示出用于产生具有根据本公开的一个实施方案的适配体构建体的核酸的基于模板转换的方法。在该实施方案中,非-多腺苷酸化RNA用作原料。将非-多腺苷酸化RNA腺苷酸化并且腺苷酸化RNA在产生具有适配体构建体的核酸的模板-转换聚合反应中用作供体模板。
图4是显示cDNA文库可使用本公开的方法用各种量的输入RNA产生的图。根据该实施方案,组成文库的cDNA具有能够通过目标测序平台对cDNA测序的适配体构建体。
图5显示了根据本公开的一个实施方案的适配体构建体。在该实施方案中,所述构建体包括P5、P7、Read1、Read2和索引结构域,其能够对对应于测序平台上的模板RNA的cDNA进行配对-末端测序。
图6显示了使用根据本公开的一个实施方案的方法产生的测序数据与使用分开的cDNA扩增和文库制备步骤的传统方法产生的测序数据的比较。
详述
提供了添加适配体至核酸的方法。所述方法包括在反应混合物中组合模板核糖核酸(RNA)、模板转换寡核苷酸(包括3'杂交结构域和测序平台适配体构建体)、聚合酶和dNTP。将反应混合物组分在足以产生包括模板RNA和模板转换寡核苷酸的产物核酸的条件下合并,所述模板RNA和模板转换寡核苷酸各自杂交至单一产物核酸的相邻区(包括通过聚合酶从dNTP聚合的区)。本发明的各方面还包括组合物和试剂盒。
在详细描述本公开的方法之前,应理解所述方法不限于所述的特定实施方案,因此当然可以发生变化。还应当理解,本文所用的术语只是为了描述特定实施方案,并非旨在进行限制,因为本发明的范围将只由所附权利要求书限定。
当提供数值范围时,应理解该范围的上限和下限之间的每个居间数值(至下限单位的十分之一,除非本文另外清楚地规定)以及所述范围内的任意其它所述或居间的数值都涵盖在本方法中。这些较小范围的上限和下限可独立地包括在该较小的范围内,并且也涵盖在本方法中,服从于所述范围内的任何特别排除的限值。当所述范围包括上下限值之一或两者时,排除那些所包括的界限之一或两者的范围也包括在本方法中。
本文中提供了某些在数值之前加有术语“约”的范围。术语“约”在本文中用于为其之后的确切数字以及与所述术语之后的数字接近或近似的数字提供文字支持。在确定数字是否与明确引用的数字接近或近似中,接近或近似的未引用的数字可以是在其出现的上下文中提供明确引用的数字的基本等同物的数字。
除非另有定义,否则本文使用的所有技术和科学术语具有本方法所属领域中普通技术人员通常所理解的相同含义。虽然类似于或等同于本文所述的那些方法和材料的任何方法和材料也可用于实践或检验本发明,但现在描述代表性说明方法和材料。
本说明书中引用的所有公布和专利通过引用并入本文,就如同特定地及个别地表明各个公布或专利通过引用并入,并且通过引用并入本文以公开和描述与公布一起被引用的方法和/或材料。任何公布的引用是针对其提交日期之前的公开内容,并且不应当解释为本发明无权先于因先前发明所作的此类披露。此外,提供的公布的日期可与可能需要独立确认的实际公布日期不同。
应指出的是,如本文和所附权利要求中所使用的,除非上下文明确地另有说明,否则单数形式“一种/个(a)”、“一种/个(an)”和“该(the)”包括复数指示物。还应指出,可撰写权利要求来排除任何可选元素。这样,该陈述意图用作与权利要求要素的引用联合使用此类排他性术语“单独地”、“仅仅”等或使用“否定(negative)”限制的在先基础。
应理解,也可在单个实施方案中组合地提供本发明的某些特征,所述特征为清楚起见描述于分开的实施方案的上下文中。反之,为简明起见而在单个实施方案的语境中描述的本方法的多个特征也可以分开或以任何合适的子组合提供。所述实施方案的所有组合明确地包括在本发明中并且公开于本文中,就如同各个和每一个组合被个别地且明确地公开一样,至此类包括可操作的工艺和/或装置/系统/试剂盒的程度。此外,描述此类变量的实施方案中所列的所有子组合还明确地包括在本方法中并且公开于本文中,就如同各个和每一个子组合被个别地且明确地公开于本文中一样。
如在阅读本公开内容后对于本领域技术人员是很显然的,本文中描述的和例举的单个实施方案的每一个具有可容易地与其它几个实施方案的任一个的特征分开或组合的独立的组分和特征而不背离本发明的范围或精神。可以以所引用事件的顺序或以逻辑上可能的任何其它顺序进行任何引用的方法。
方法
提供添加适配体至核酸的方法。所述方法利用了某些核酸聚合酶“模板转换”的能力,即使用第一核糖核酸(RNA)链作为聚合模板,然后转换为第二模板核酸链(其可被称为“模板转换核酸”或“受体模板”)同时继续聚合反应。结果是合成具有与第一模板核酸链互补的5’区和与模板转换核酸互补的3’区的杂交核酸链。在某些方面,模板转换寡核苷酸的所有或部分(如5’区)的核苷酸序列可由主题方法的从业者定义,使得新合成的杂交核酸链在其3’末端处具有部分或完全测序平台适配体序列以用于使用目标测序平台对杂交核酸链测序。目标测序平台包括但不限于来自的HiSeqTM、MiSeqTM和GenomeAnalyzerTM测序系统;来自IonTorrentTM的IonPGMTM和IonProtonTM测序系统;来自PacificBiosciences的PACBIORSII测序系统、来自LifeTechnologiesTM的SOLiD测序系统、来自Roche的454GSFLX+和GSJunior测序系统或任何其它目标测序平台。
在某些方面,聚合反应使用在其5’末端具有部分或完全测序平台适配体序列的引物引发,导致在每个末端具有部分或完全测序平台适配体序列的杂交核酸链。适配体在杂交核酸链中的方向性可由主题方法的从业者预定,如通过选择在引物的5’末端处存在的适配体序列和在模板转换寡核苷酸的5’末端处存在的适配体序列。在此,引物中存在的适配体序列和模板转换寡核苷酸中的适配体序列将分别在杂交核酸链的5’和3’末端处存在。
根据本公开的方法,将反应混合物组分在足以产生包括模板RNA和模板转换寡核苷酸的产物核酸的条件下合并,所述模板RNA和模板转换寡核苷酸各自杂交至单一产物核酸的相邻区(包括通过聚合酶从dNTP聚合的区)。
“足以产物核酸的条件”意指允许聚合酶-介导的杂交至模板RNA的核酸链的3’末端延伸、模板转换聚合酶至模板转换寡核苷酸及使用模板转换寡核苷酸作为模板继续延伸反应的反应条件。获得适合的反应条件可包括选择反应混合物组分、其浓度和反应温度以创造环境,其中聚合酶有活性且反应中的相关核酸以所需的方式彼此相互反应(如杂交)。例如,除了模板RNA、聚合酶、模板转换寡核苷酸和dNTP之外,反应混合物可包含构建适当的pH的缓冲液组分、盐浓度(如KCl浓度)、金属辅因子浓度(如Mg2+或Mn2+浓度)等以用于延伸反应和模板转换发生。可包含其它组分,诸如一种或多种核酸酶抑制剂(如RNA酶抑制剂和/或DNA酶抑制剂)、一种或多种用于促进富GC序列扩增/复制的添加剂(如GC-MeltTM试剂(ClontechLaboratories,Inc.(MountainView,CA))、甜菜碱、DMSO、乙二醇、1,2-丙二醇或其组合)、一种或多种分子拥挤剂(如聚乙二醇等)、一种或多种酶-稳定组分(如以1至10mM(如5mM)范围内的最终浓度存在的DTT)和/或任何其它用于促进聚合酶-介导的延伸反应和模板-转换的反应混合物组分。
反应混合物可具有适于引物延伸反应和模板-转换的pH。在某些实施方案中,反应混合物的pH的范围为5至9、诸如7至9,包括8至9、如8至8.5。在一些情况下,反应混合物包含pH调节剂。目标pH调节剂包括但不限于氢氧化钠、盐酸、磷酸缓冲液、柠檬酸缓冲液等。例如,可通过添加适当量的pH调节剂将反应混合物的pH调节至所需的范围。
适于产生产物核酸的温度范围可根据诸如采用的特定聚合酶、采用的任何任选的引物的解链温度等的因素变化。根据一个实施方案,聚合酶是逆转录酶(如MMLV逆转录酶)且足以产生产物核酸的反应混合物条件包括使反应混合物升温至以下范围的温度:4℃至72℃,诸如16℃至70℃,如37℃至50℃,诸如40℃至45℃,包括42℃。
模板核糖核酸(RNA)可为具有任何长度的由核糖核苷酸组成的聚合物,如10个碱基或更长、20个碱基或更长、50个碱基或更长、100个碱基或更长、500个碱基或更长、1000个碱基或更长、2000个碱基或更长、3000个碱基或更长、4000个碱基或更长、5000个碱基或更长或更多碱基。在某些方面,模板核糖核酸(RNA)是由核糖核苷酸组成的聚合物,如10个碱基或更少、20个碱基或更少、50个碱基或更少、100个碱基或更少、500个碱基或更少、1000个碱基或更少、2000个碱基或更少、3000个碱基或更少、4000个碱基或更少或5000个碱基或更少。模板RNA可为任何类型的RNA(或其子型),包括但不限于信使RNA(mRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、反式作用小干扰RNA(ta-siRNA)、天然小干扰RNA(nat-siRNA)、核糖体RNA(rRNA)、转移RNA(tRNA)、小核仁RNA(snoRNA)、小核RNA(snRNA)、长非编码RNA(lncRNA)、非编码RNA(ncRNA)、转移-信使RNA(tmRNA)、前体信使RNA(pre-mRNA)、小卡哈尔体特异性RNA(smallCajalbody-specificRNA,scaRNA)、piwi-相互作用RNA(piRNA)、内切核糖核酸酶-制备的siRNA(esiRNA)、小时序RNA(stRNA)、信号识别RNA、端粒RNA、核酶或者其RNA类型或其子型的任何组合。
可将包括模板RNA的RNA样品以足以产生产物核酸的量合并至反应混合物中。根据一个实施方案,将RNA样品合并至反应混合物中,使得反应混合物中RNA的最终浓度为1fg/μL至10μg/μL、诸如1pg/μL至5μg/μL、诸如0.001μg/μL至2.5μg/μL、诸如0.005μg/μL至1μg/μL、诸如0.01μg/μL至0.5μg/μL,包括0.1μg/μL至0.25μg/μL。在某些方面,包括模板RNA的RNA样品分离自单个细胞。在其它方面,包括模板RNA的RNA样品分离自2、3、4、5、6、7、8、9、10个或更多、20个或更多、50个或更多、100个或更多或者500个或更多细胞。根据某些实施方案,包括模板RNA的RNA样品分离自500个或更少、100个或更少、50个或更少、20个或更少、10个或更少、9、8、7、6、5、4、3或2个细胞。
模板RNA可存在于任何目标核酸样品中,所述目标核酸样品包括但不限于分离自单细胞、多个细胞(如培养细胞)、组织、器官或生物体(如细菌、酵母等)的核酸样品。在某些方面,核酸样品分离自哺乳动物(如人、啮齿科动物(如小鼠)或任何其它目标哺乳动物)的细胞、组织、器官等。在其它方面,核酸样品分离自除了哺乳动物之外的来源,诸如细菌、酵母、昆虫(如果蝇)、两栖动物(如青蛙(如爪蟾属(Xenopus)))、病毒、植物,或任何其它非哺乳动物核酸样品来源。
用于从此类来源分离RNA的方法、试剂和试剂盒是本领域已知的。例如,用于从目标来源分离RNA的试剂盒–诸如ClontechLaboratories,Inc.(MountainView,CA)的和RNA分离试剂盒–可商购获得。在某些方面,RNA分离自固定的生物样品,如福尔马林固定、石蜡包埋(FFPE)组织。来自FFPE组织的RNA可使用可商购获得试剂盒–诸如ClontechLaboratories,Inc.(MountainView,CA)的FFPERNA试剂盒分离。
在某些方面,所述主题方法包括从前体RNA产生模板RNA。例如,当需要控制合并至反应混合物的模板RNA的大小时,分离自目标来源的RNA样品可经受剪切/片段化,如以产生与原始样品中前体非-剪切RNA(如全长mRNA)相比长度更短的模板RNA。模板RNA可通过剪切/片段化策略产生,所述剪切/片段化策略包括但不限于使样品通过微量移液管尖或细规格针一次或多次、雾化样品、超声处理样品(如使用Covaris,Inc.(Woburn,MA)的聚焦-超声发生器)、珠粒-介导的剪切、酶促剪切(如使用一种或多种RNA-剪切酶)、基于化学品的片段化如使用二价阳离子、片段化缓冲液(其可与热组合使用)或任何其它适于剪切/片段化前体RNA以产生较短模板RNA的方法。在某些方面,通过剪切/片段化原始核酸样品产生的模板RNA的长度为10至20个核苷酸、20至30个核苷酸、30至40个核苷酸、40至50个核苷酸、50至60个核苷酸、60至70个核苷酸、70至80个核苷酸、80至90个核苷酸、90至100个核苷酸、100至150个核苷酸、150至200个、200至250个核苷酸、或200至1000个核苷酸、或甚至1000至10,000个核苷酸,例如,如对所选测序平台适当的长度。
可采用用于从前体RNA产生模板RNA的另外策略。例如,产生模板RNA可包括添加核苷酸至前体RNA的末端。在某些方面,前体RNA是非-多腺苷酸化RNA(如微小RNA、小RNA等),并且产生模板RNA包括腺苷酸化(如多腺苷酸化)前体RNA。腺苷酸化前体RNA可使用任何便利的方法进行。根据某些实施方案,腺苷酸化是酶促进行的,如使用聚(A)聚合酶或适用于催化在前体RNA的3’端处掺入腺嘌呤残基的任何其它酶。用于进行腺苷酸化反应的反应混合物可包括任何可用的组分,包括但不限于聚合酶、缓冲液(如Tris-HCL缓冲液)、一种或多种金属阳离子(如MgCl2、MnCl2或其组合)、盐(如NaCl)、一种或多种酶-稳定组分(如DTT)、ATP和用于促进前体RNA的腺苷酸化的任何其它反应组分。腺苷酸化反应可在与采用的聚合酶如聚A聚合酶相容的温度(如30℃-50℃,诸如37℃)和pH(如pH7-pH8.5,诸如pH7.9)下进行。用于添加核苷酸至前体RNA的其它方法包括基于连接的策略,其中RNA连接酶(如T4RNA连接酶)催化所定义序列共价连结至前体RNA的末端(如3’末端)以产生模板RNA。
本公开的方法包括合并聚合酶至反应混合物中。当实施主题方法时,可采用多种聚合酶。合并至反应混合物中的聚合酶能够模板转换,其中所述聚合酶使用第一核酸链作为聚合模板,然后转换至第二“受体”模板核酸链的3’末端以继续相同的聚合反应。在某些方面,合并至反应混合物中的聚合酶是逆转录酶(RT)。可用于实施所述方法的能够模板-转换的逆转录酶包括但不限于逆转录病毒的逆转录酶、逆转录转座子逆转录酶、逆转录质粒逆转录酶、反转录子逆转录酶、细菌逆转录酶、II组反转录子-来源的逆转录酶,及其突变体、变体衍生物或功能片段。例如,逆转录酶可为莫洛尼氏鼠白血病病毒(MoloneyMurineLeukemiaVirus)逆转录酶(MMLVRT)或家蚕(Bombyxmori)逆转录酶(如家蚕R2非-LTR元件逆转录酶)。可用于实施主题方法的能够模板-转换的聚合酶可商购获得并且包括可获自ClontechLaboratories,Inc.(MountainView,CA)的SMARTScribeTM逆转录酶。在某些方面,将两种或多种不同的聚合酶的混合物添加至反应混合物,如用于改善的持续性、校正-读码等。在一些情况下,聚合物是一种相对于模板或其来源异源的聚合物。
将聚合酶合并至反应混合物中,使得聚合酶的最终浓度足以产生所需量的产物核酸。在某些方面,聚合酶(如逆转录酶,诸如MMLVRT或家蚕RT)以0.1至200单位/μL(U/μL)、诸如0.5至100U/μL、诸如1至50U/μL、包括5至25U/μL如20U/μL的最终浓度存在于反应混合物中。
除了模板转换能力之外,合并至反应混合物中的聚合酶可包含其它有用的官能度以促进产物核酸产生。例如,聚合酶可具有末端转移酶活性,其中聚合酶能够催化模板-非依赖性添加脱氧核糖核苷酸至DNA分子的3’羟基端。在某些方面,当聚合酶到达模板RNA的5’末端时,聚合酶能够在非由模板编码的新生链的3’末端处掺入一种或多种另外的核苷酸。例如,当聚合酶具有末端转移酶活性时,聚合酶可能能够在新生DNA链的3’末端处掺入1、2、3、4、5、6、7、8、9、10或更多个另外的核苷酸。在某些方面,具有末端转移酶活性的聚合酶在新生DNA链的3’末端处掺入10个或更少、诸如5个或更少(如3个)另外的核苷酸。所有所述核苷酸可为相同的(如在新生链的3’末端处产生同型核苷酸片段)或所述核苷酸的至少一个可不同于另一个或其它核苷酸。在某些方面,聚合酶的末端转移酶活性导致添加2、3、4、5、6、7、8、9、10或更多个相同核苷酸的同型核苷酸片段(如所有dCTP、所有dGTP、所有dATP或所有dTTP)。根据某些实施方案,聚合酶的末端转移酶活性导致添加10个或更少诸如9、8、7、6、5、4、3或2(如3)个相同核苷酸的同型核苷酸片段。例如,根据一个实施方案,聚合酶是MMLV逆转录酶(MMLVRT)。MMLVRT在新生DNA链的3’末端处掺入另外的核苷酸(主要是dCTP,如三个dCTP)。如在本文其它地方详细描述,这些另外的核苷酸可用于使杂交模板转换寡核苷酸的3’末端能够与新生DNA链的3’末端杂交,如以通过聚合酶促进从模板RNA至模板转换寡核苷酸的模板转换。
如上所示,所述主题方法包括合并模板转换核酸至反应混合物中。在某些方面,模板转换核酸是模板转换寡核苷酸。“模板转换寡核苷酸”意为在核酸聚合反应期间聚合酶从起始模板(如主题方法中的模板RNA)转换至的寡核苷酸模板。就这一点而言,模板RNA可被称为“供体模板”并且模板转换寡核苷酸可被称为“受体模板”。如本文所用,“寡核苷酸”是核苷酸(2至500个核苷酸如2至200个核苷酸)的单链多聚体。寡核苷酸可为合成的或可酶促制备,并且在一些实施方案中,为10至50个核苷酸长。寡核苷酸可含有核糖核苷酸单体(即可为寡核糖核苷酸或“RNA寡核苷酸”)或脱氧核糖核苷酸单体(即可为寡脱氧核糖核苷酸或“DNA寡核苷酸”)。寡核苷酸的长度例如可为10至20、21至30、31至40、41至50、51至60、61至70、71至80、80至100、100至150或150至200、多达500个或更多个核苷酸。
反应混合物包含足以使聚合酶从模板RNA模板转换至模板转换寡核苷酸的浓度的模板转换寡核苷酸。例如,可将模板转换寡核苷酸以0.01至100μM、诸如0.1至10μM、诸如0.5至5μM、包括1至2μM(如1.2μM)的最终浓度添加至反应混合物。
模板转换寡核苷酸可包含经修饰或另外非天然存在的一个或多个核苷酸(或其类似物)。例如,模板转换寡核苷酸可包含一种或多种核苷酸类似物(如LNA、FANA、2’-O-MeRNA、2’-氟RNA等)、键修饰(如硫代磷酸酯,3’-3’和5’-5’反向键)、5’和/或3’末端修饰(如5’和/或3’氨基、生物素、DIG、磷酸酯、硫醇、染料、猝灭剂等)、一种或多种荧光标记的核苷酸或向模板转换寡核苷酸提供所需官能度的任何其它特征。
模板转换寡核苷酸包括3’杂交结构域和测序平台适配体构建体。3'杂交结构域可能在长度方面变化,并且在一些情况下其范围为2至10个nt长、诸如3至7个nt长。3'杂交的序列可为任何便利序列,如任意序列、杂聚序列(如异源-三核苷酸)或均聚序列(如同源-三核苷酸,诸如G-G-G)等。3'杂交结构域和模板转换寡核苷酸的实例进一步描述于美国专利No.5,962,272中,其公开内容通过引用并入本文。除了3’杂交结构域之外,模板转换寡核苷酸包括测序平台适配体构建体。“测序平台适配体构建体”意指包括至少一部分由目标测序平台使用的核酸结构域(如测序平台适配体核酸序列)的核酸构建体,诸如由提供的测序平台(如theHiSeqTM、MiSeqTM和/或GenomeAnalyzerTM测序系统);IonTorrentTM(如IonPGMTM和/或IonProtonTM测序系统);PacificBiosciences(如PACBIORSII测序系统);LifeTechnologiesTM(如SOLiD测序系统);Roche(如454GSFLX+和/或GSJunior测序系统);或任何其它目标测序平台。
在某些方面,测序平台适配体构建体包括选自以下的核酸结构域:特异性结合至表面-连接的测序平台寡核苷酸(如连接至测序系统中的流动池表面的P5或P7寡核苷酸)的结构域(如“捕获位点”或“捕获序列”);测序引物结合结构域(如平台的Read1或Read2引物可结合的结构域);条形码结构域(如独特鉴定测序核酸的样品来源的结构域以通过用特定条形码或“标签”标记来自给定样品的每一个分子来使样品多路复用(multiplexing));条形码测序引物结合结构域(对条形码测序所用的引物结合的结构域);用于独特标记目标分子的分子鉴定结构域(如分子索引标签,诸如4个、6个或其它数目的核苷酸的随机标签)以基于经测序的独特标签的数目确定表达水平;或此类结构域的任何组合。在某些方面,条形码结构域(如样品索引标签)和分子鉴定结构域(如分子索引标签)可包含在相同核酸中。
测序平台适配体构建体可包括任何长度的核酸结构域(如“测序适配体”)和适于目标测序平台的序列。在某些方面,核酸结构域是4至200个核苷酸长。例如,核酸结构域可为4至100个核苷酸长、诸如6至75、8至50或10至40个核苷酸长。根据某些实施方案,测序平台适配体构建体包括2至8个核苷酸长、诸如9至15、16-22、23-29或30-36个核苷酸长的核酸结构域。
核酸结构域可具有使得目标测序平台采用的多核苷酸(如寡核苷酸)特异性结合至核酸结构域的长度和序列,以如用于通过合成核酸结构域侧接的cDNA插入序列的固相扩增和/或测序。示例性核酸结构域包括基于的测序平台上采用的P5(5’-AATGATACGGCGACCACCGA-3’)(SEQIDNO:01)、P7(5’-CAAGCAGAAGACGGCATACGAGAT-3’)(SEQIDNO:02)、Read1引物(5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’)(SEQIDNO:03)和Read2引物(5’-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3’)(SEQIDNO:04)结构域。其它示例性核酸结构域包括基于IonTorrentTM的测序平台上采用的A适配体(5’-CCATCTCATCCCTGCGTGTCTCCGACTCAG-3’)(SEQIDNO:05)和P1适配体(5’-CCTCTCTATGGGCAGTCGGTGAT-3’)(SEQIDNO:06)结构域。
用于在目标测序平台上测序的核酸结构域的核苷酸序列可随着时间变化和/或改变。适配体序列通常由测序平台的制造商提供(如在随测序系统一起提供的和/或可从制造商网站上获得的技术文档中)。基于此类信息,模板转换寡核苷酸的测序平台适配体构建体的序列(和任选第一链合成引物、扩增引物等)可设计为包括呈使得能够在目标平台上对核酸插入序列(对应于模板RNA)测序的构型的一种或多种核酸结构域的所有或部分。
根据某些实施方案,模板转换寡核苷酸包含防止在合成模板转换寡核苷酸的5’末端的补体(如模板转换寡核苷酸的5’适配体序列)之后聚合酶从模板转换寡核苷酸转换至不同模板核酸的修饰。有用的修饰包括但不限于失步症病变(如四氢呋喃衍生物)、核苷酸加合物、异-核苷酸碱基(如异胞嘧啶、异鸟嘌呤等)及其任何组合。
模板转换寡核苷酸可包含使单一产物核酸能够链合成和/或PCR扩增的第二序列(如模板转换寡核苷酸的3’杂交结构域的经定义的核苷酸序列5’)。例如,模板转换寡核苷酸可包含序列,其中在产生单一产物核酸后,第二链合成使用具有此序列的引物进行。第二链合成产生与单一产物核酸互补的第二链DNA。可选地或另外地,单一产物核酸可使用引物对扩增,其中引物之一具有此序列。因此,在某些方面,本公开的方法可另外包括产生产物核酸和使与模板转换寡核苷酸互补的单一产物核酸的3’区与经配置结合其上的第二链引物在杂交条件下接触。在使与模板转换寡核苷酸互补的单一产物核酸的3’区与第二链引物接触后,所述方法还可包括使反应混合物经受核酸聚合条件。
如本文所用的术语“互补的”是指通过非共价键与靶核酸的所有或部分区域(如产物核酸的区域)碱基配对的核苷酸序列。在规范的沃森克里克(Watson-Crick)碱基配对中,在DNA中,腺嘌呤(A)与胸腺嘧啶(T)形成碱基对,而鸟嘌呤(G)与胞嘧啶(C)也形成碱基对。在RNA中,胸腺嘧啶由尿嘧啶(U)替代。因此,A与T互补而G与C互补。在RNA中,A与U互补且反之亦然。通常,“互补的”是指至少部分互补的核苷酸序列。术语“互补的”还可涵盖完全互补的双链体,使得一条链中的每一个核苷酸与另一条链中的在相应位置处的每一个核苷酸互补。在某些情况下,核苷酸序列可与靶部分互补,其中并非所有的核苷酸与靶核酸在所有相应位置处的每一个核苷酸互补。例如,引物可与靶核酸完全(即100%)互补,或者引物和靶核酸可共享一定程度的互补性,其小于完全互补(如70%、75%、85%、90%、95%、99%)。两条核苷酸序列的百分比同一性可为了最优比较目的通过比对序列来确定(如可将空位引入至第一序列的序列中以用于最优比对)。然后比较相应位置处的核苷酸,并且两条序列之间的百分比同一性是序列所共享的相同位置的数目的函数(即%同一性=相同位置的#/位置的总#×100)。当一条序列中的位置被与另一条序列中相应位置处的相同核苷酸占据时,则所述分子在此位置处相同。此类数学算法的非限制实例描述于Karlin等,Proc.Natl.Acad.Sci.USA90:5873-5877(1993)。此类算法如Altschul等,NucleicAcidsRes.25:389-3402(1997)所述并入NBLAST和XBLAST程序(2.0版)中。当使用BLAST和空位BLAST程序时,可使用各程序(如NBLAST)的默认参数。一方面,序列比较的参数可被设置为得分=100、字长=12,或可变化(如字长=5或字长=20)。
如本文所用,术语“杂交条件”意指引物特异性杂交至靶核酸(如模板RNA,单一产物核酸等)的区域的条件。引物特异性是否杂交至靶核酸由诸如聚合物与靶核酸之间的互补性程度和杂交发生的温度(该温度可由引物的解链温度(TM)获知)的因素确定。解链温度是指引物-靶核酸双链体的一半保持杂交且双链体的一半解离为单链的温度。双链体的Tm可实验测定或使用下式预测:Tm=81.5+16.6(log10[Na+])+0.41(G+C分数)–(60/N),其中N是链长且[Na+]小于1M。参见Sambrook和Russell(2001;MolecularCloning:ALaboratoryManual,第3版,ColdSpringHarborPress,ColdSpringHarborN.Y.,Ch.10)。其它取决于各种参数的更高级的模型还可用于根据各种杂交条件预测引物/靶双链体的Tm。用于获得特异性核酸杂交的方法可见于如Tijssen,LaboratoryTechniquesinBiochemistryandMolecularBiology-HybridizationwithNucleicAcidProbes,第I部分,第2章,“Overviewofprinciplesofhybridizationandthestrategyofnucleicacidprobeassays,”Elsevier(1993)。
如上所述,所述主题方法包括合并dNTP至反应混合物中。在某些方面,将四种天然存在的dNTP(dATP、dGTP、dCTP和dTTP)的每一种添加至反应混合物。例如,可将dATP、dGTP、dCTP和dTTP添加至反应混合物使得每种dNTP的最终浓度为0.01至100mM、诸如0.1至10mM、包括0.5至5mM(如1mM)。根据一个实施方案,添加至反应混合物的核苷酸的至少一种类型是非天然存在的核苷酸,如具有连接其上的结合或其它部分(如荧光部分)的经修饰的核苷酸、核苷酸类似物或用于主题方法或目标下游应用中的任何其它类型的非天然存在的核苷酸。
当模板RNA提供适于引发第一-链合成的基质时,添加引物至反应混合物并非必需的。例如,当模板RNA具有双链区且在其末端的一处或两处突出时,dsRNA的“非-突出”链可使第一-链合成反应准备好,其中突出链用作模板。以该方式,聚合酶可用于“填充”突出,转换至模板转换寡核苷酸并使用模板转换寡核苷酸作为受体模板完成第一链合成以产生产物核酸(其中由聚合酶进行的末端转移酶反应任选地在如本文其它地方所述的模板转换之前)。因此,当模板RNA包含如在其末端的一处或两处的突出时,避免了添加引物。
然而,在某些情况下,可能需要添加引物至反应混合物以使单一产物核酸合成准备好。例如,如果模板RNA是单链,则引物可用于引发第一-链合成的目的。此外,使用引物可给予主题方法的从业者更可控RNA样品中哪(些)RNA将用作产生产物核酸的模板RNA,如其中需要产生对应于目标模板RNA的产物核酸(如多腺苷酸化RNA,对于其杂交至所述RNA的聚A尾的基于寡dT的引物可用于使第一链合成准备好)。
因此,在某些方面,所述主题方法还包括使模板RNA与使单一产物核酸的合成准备的第一引物接触。所述接触在引物足以杂交至模板RNA的条件下进行,所述条件在本文的其它地方描述。根据一个实施方案,引物的整条序列是任意的,如引物可为随机六聚体或适当长度的任何其它随机引物(或其混合物)。在其它方面,引物具有定义的序列,如引物序列可由实施特异性杂交至目标模板RNA中已知的互补序列(如模板RNA的聚A尾)的主题方法的人设计。
根据某些实施方案,所述引物包括两个或多个结构域。例如,所述引物可包括杂交至模板RNA的第一(如3’)结构域和不杂交至模板RNA的第二(如5’)结构域。第一和第二结构域的序列可为独立定义的或任意的。在某些方面,第一结构域具有定义的序列且第二结构域的序列是定义的或任意的。在其它方面,第一结构域具有任意序列(如随机序列,诸如随机六聚体序列)且第二结构域的序列是定义的或任意的。根据一个实施方案,第二结构域包含与模板转换寡核苷酸中存在的核苷酸序列相同或不同的核苷酸序列。
在一些实施方案中,引物的第二结构域包括测序平台适配体构建体。第二结构域的测序平台适配体构建体可包括选自以下的核酸结构域:特异性结合至表面-连接的测序平台寡核苷酸(如连接至测序系统中流动池表面的P5或P7寡核苷酸)的结构域(如“捕获位点”或“捕获序列”)、测序引物结合结构域(如平台的Read1或Read2引物可结合的结构域)、条形码结构域(如独特鉴定测序核酸的样品来源的结构域以通过用特定条形码或“标签”标记来自给定样品的每一个分子来使样品多路复用)、条形码测序引物结合结构域(对条形码测序所用的引物结合的结构域)、分子鉴定结构域,或此类结构域的任何组合。
在某些方面,引物的第二结构域的测序平台适配体构建体不同于模板转换寡核苷酸的测序平台适配体构建体。当如任何希望产生一个末端具有一条或多条测序平台适配体序列且第二末端具有与第一末端不同的一条或多条测序平台适配体序列的单一产物核酸(如cDNA或其文库)时,此类实施方案可应用。具有含不同适配体序列的末端可用于如随后固相扩增(如使用基于的测序系统中的表面-连接的P5和P7引物进行簇生成)、DNA测序(如使用基于的测序系统中的Read1和Read2引物)和由在待测序的核酸的相反末端处需要不同适配体序列的测序平台进行的任何其它步骤。具有不同末端还用于提供链特异性信息,因为经测序的链的方向性由不同末端限定。本领域用于进行该操作的当前方法需要多个步骤和降解非所需的链–如使用UDG及掺入dU至非所需链。当前方法更精简并且需要更少的步骤直接产生链-特异性信息。
当所述方法包括使模板RNA与使单一产物核酸的合成准备好的引物接触时,引物可包含一种或多种经修饰的或另外非天然存在的核苷酸(或其类似物)。例如,引物可包含一种或多种核苷酸类似物(如LNA、FANA、2’-O-MeRNA、2’-氟RNA等)、键修饰(如硫代磷酸酯、3’-3’和5’-5’反向键)、5’和/或3’末端修饰(如5’和/或3’氨基、生物素、DIG、磷酸酯、硫醇、染料、猝灭剂等)、一种或多种荧光标记的核苷酸,或为使单一产物核酸的合成准备好的引物提供所需官能度的任何其它特征。
在某些方面,当所述方法包括使所述模板RNA与使单一产物核酸的合成准备好的引物接触时,可需要防止使用单一产物核酸作为模板的任何随后延伸反应延伸超过对应于引物的单一产物核酸的区域中的特定位置。例如,根据某些实施方案,使单一产物核酸的合成准备好的引物包含防止使用对应于引物的区域作为模板的聚合酶聚合新生链超过所述修饰的修饰。有用的修饰包括但不限于失步症病变(如四氢呋喃衍生物)、核苷酸加合物、异-核苷酸碱基(如异胞嘧啶、异鸟嘌呤等)及其任何组合。
任何用于实施本公开的方法的核酸(如模板转换寡核苷酸、使单一产物核酸的合成准备好的引物、第二链合成引物、用于扩增产物核酸的一种或多种引物等)可包含任何有用的核苷酸类似物和/或修饰,包括本文所述的任何核苷酸类似物和/或修饰。
一旦产生产物核酸,则所述方法可包括直接输入产物核酸至目标下游应用(如测序应用等)中。在其它方面,所述方法可包括使用产物核酸作为用于第二-链合成和/或PCR扩增(如用于扩增子的随后测序)的模板。根据一个实施方案,本公开的方法还包括使产物核酸经受核酸扩增条件。此类条件可包括添加经配置扩增所有或所需部分的产物核酸的正向和反向引物、dNTP和适用实现扩增的聚合酶(如热稳定的聚合酶)。单一产物核酸可在其5’末端具有扩增序列并且在其3’末端具有扩增序列,并且经受使用与5’和3’扩增序列互补的引物的PCR扩增条件。扩增序列可为测序平台适配体构建体中的核酸结构域(或与测序平台适配体构建体中的核酸结构域重叠),或可在测序平台适配体构建体之外。进行扩增的起始步骤可包括使产物核酸变性以使模板RNA和模板转换寡核苷酸与单一产物核酸解离,从而制备可用于引物结合的单一产物核酸。
在某些方面,当单一产物核酸在其产生后扩增时,扩增可使用引物对进行,其中所述引物的一者或两者包括测序平台适配体构建体。测序平台适配体构建体可包括本文其它地方描述的任何核酸结构域(如特异性结合至表面-连接的测序平台寡核苷酸的结构域、测序引物结合结构域、条形码结构域、条形码测序引物结合结构域、分子鉴定结构域或其任何组合)。当如其中单一产物核酸不包括目标测序平台中测序使用或必需的所有适配体结构域并且剩余的适配体结构域由用于扩增单一产物核酸的引物提供时,此类实施方案可应用。根据该实施方案的示例性方法示于图1中。如所示,将模板RNA102、聚合酶104、模板转换寡核苷酸106和dNTP(未显示)在足以产生产物核酸的条件下合并至反应混合物100中。模板转换寡核苷酸106包括测序平台适配体构建体B。尽管任选,图1中所示的实施方案采用第一引物,即由用于第一链合成的聚合酶延伸的引物108。引物108包括杂交至模板RNA的第一(3’)结构域110和不杂交至模板RNA的第二(5’)结构域112。第二结构域包括测序平台适配体构建体A。第一结构域110的核苷酸序列可为任意的(如随机序列,诸如随机六聚体序列)或者第一结构域序列可被定义(如经特别选择杂交至特定目标模板RNA的特定区域的序列)。在该实例中,引物108的第一结构域110与模板RNA102内的序列114互补,并且第二结构域112包括具有一个或多个测序平台核酸结构域(如特异性结合至表面-连接的测序平台寡核苷酸的结构域、测序引物结合结构域、条形码结构域、条形码测序引物结合结构域、分子鉴定结构域及其组合)的测序平台适配体构建体A。
引物108杂交至模板RNA102后,当聚合酶104沿着模板RNA102延伸引物108时第一链合成进行。在该实例中,所述聚合酶具有末端转移酶活性,使得当延伸反应到达模板RNA的5’末端时,所述聚合酶添加可为同源二聚体或异源二聚体并且其核苷酸长度可变化(如2个10个nt、诸如2至5个nt)的任意序列诸如同型核苷酸片段(如在本文同源-三核苷酸表示为NNN)至延伸产物。根据该实施方案,模板转换寡核苷酸具有包含与延伸产物3’末端处的同型核苷酸片段互补的同型核苷酸片段(在本文表示为同源-三核苷酸片段,NNN)的3’杂交结构域。该互补性促进了模板转换寡核苷酸的3’杂交结构域杂交至延伸产物的3’末端。杂交将模板转换寡核苷酸的受体模板区(位于3’杂交结构域的5’)带至与所述聚合酶足够近,使得所述聚合酶可使受体模板区模板转换并继续延伸反应至模板转换寡核苷酸的5’末端核苷酸,从而产生包括各自杂交至单一产物核酸的相邻区域的模板RNA和模板转换寡核苷酸的产物核酸。
在该实例中,模板转换寡核苷酸包括具有一个或多个测序平台核酸结构域(如特异性结合至表面-连接的测序平台寡核苷酸的结构域、测序引物结合结构域、条形码结构域、条形码测序引物结合结构域、分子鉴定结构域及其组合)的测序平台适配体构建体B,使得单一产物核酸包括在其5’末端的测序平台适配体构建体A和在其3’末端的测序平台适配体构建体B’。根据该实施方案,所述方法还包括第二链合成步骤,其中与单一产物核酸的3’区互补的引物杂交至单一产物核酸的3’区且由聚合酶延伸–使用单一产物核酸作为模板–至单一产物核酸的5’末端。该第二链合成步骤的结果是包含单一产物核酸及其互补链的双链DNA。
在图1中所示的实例中,适配体构建体A/A’和B/B’不包括对核酸进行下游测序所用或必需的所有测序平台核酸结构域。为了添加剩余的测序平台核酸结构域,使用具有提供剩余的测序平台核酸结构域的适配体构建体C和D(如存在于引物的非-杂交5’区中)的引物扩增所述核酸。扩增子包括在一个末端处的适配体构建体A/A’和C/C’和在相反末端处的适配体构建体B/B’和D/D’。实践主题方法的人可选择第一链合成引物的测序平台适配体构建体的序列、模板转换寡核苷酸和扩增引物,以提供处于适用于在目标测序平台上测序的构型的所有必需的结构域。仅作为一个实例,构建体A/A’和B/B’可包括测序引物结合结构域(如,针对基于的测序平台中所用的Read1和Read2测序引物的引物结合结构域),而构建体C/C’和D/D’包括特异性结合至表面-连接的测序平台寡核苷酸的结构域(如特异性结合至测序系统的表面-连接的P5和P7引物的结构域)。适配体构建体A/A’-D/D’的任一个可包括在目标测序平台上测序所用或必需的任何另外的序列元件。
如上所概述,具有测序平台适配体构建体的引物可用于使单一产物核酸的合成准备好,使得单一产物核酸在其5’和3’末端具有测序平台适配体构建体。在某些方面,单一产物核酸的测序平台适配体构建体包括在目标测序平台上对所述核酸测序所用或必需的所有结构域。如图2所示,产物核酸使用与图1所示方法类似的方法产生。然而,在图2所示的实施方案中,对适配体构建体A/A’和B/B’测序包括在目标测序平台上对单一产物核酸测序所用或必需的所有测序平台核酸结构域(如特异性结合至表面-连接的测序平台寡核苷酸的结构域、测序引物结合结构域、条形码结构域、条形码测序引物结合结构域、分子鉴定结构域及其组合)。根据某些实施方案,单一产物核酸在测序平台上测序之前进行PCR扩增。在其它实施方案中,单一产物核酸不在测序前扩增。
根据本公开的另外实施方案的方法示于图3中。在该实例中,非-多腺苷酸化前体RNA302经历3’多腺苷酸化以产生模板RNA303。在该实例中,使用在其5’末端处具有测序平台适配体构建体(A)的寡(dT)引物使第一链合成准备好,使得单一产物核酸分别在其5’和3’末端具有测序平台适配体构建体A和B’。测序平台适配体构建体可包括少于在目标测序平台上测序所用或必需的所有结构域(如与图1所示的实施方案类似),或则可包括所有有用或必需的结构域(如与图2所示的实施方案类似)。实施方案诸如图3中所示的实施方案可应用于如产生对应于目标生物样品中存在的非-多腺苷酸化RNA(如微小RNA、小RNA、siRNA等)的测序-现成cDNA文库。
在某些实施方案中,所述主题方法可用于产生对应于用于在目标测序平台(如由IonTorrentTM,PacificBiosciences,LifeTechnologiesTM,Roche等提供的测序平台)上的下游测序的mRNA的cDNA文库。在一个实施方案中,将mRNA剪切至约200bp的长度或由使用的测序平台所限定的任何其它适当的长度(如400-800bp),然后用作如本文其它地方所述的模板转换聚合反应中的模板。使用引物使具有测序引物结合结构域(如Read2N6引物结合结构域)的第一链合成准备好,并且模板转换寡核苷酸包括测序平台的第二测序引物结合结构域(如Read1引物结合结构域)。在某些方面,使用随机引物使第一链合成准备好。然后所得文库可用添加结合至表面-连接的测序平台寡核苷酸(如连接至测序系统中的流动池的P5和P7寡核苷酸)的核酸结构域的引物任选地进行PCR扩增。所述文库可与对照文库(如的PhiX对照文库)以50:50混合,并且在测序平台(如测序系统)上测序。可移除对照文库序列并将剩余的序列定位到mRNA的来源(如人、小鼠或任何其它mRNA来源)的转录组。
根据某些实施方案,所述主题方法可用于产生对应于用于在基于的测序系统上的下游测序的非-多腺苷酸化RNA的cDNA文库。在一个实施方案中,微小RNA被多腺苷酸化,然后用作如本文其它地方所述的模板转换聚合反应中的模板。使用dT引物使第一链合成准备好,并且模板转换寡核苷酸包括Read1引物结合结构域。
图5显示了可添加至根据本公开的一个实施方案的核酸的示例性序列。在该实例中,模板转换寡核苷酸(上图)包括3’杂交结构域(GGG)和测序平台适配体构建体,所述测序平台适配体构建体包含用于表面-连接的测序平台寡核苷酸(在该实例中,系统的表面-连接的P5引物)的结合位点和测序引物结合位点(在该实例中,用于系统的Read1测序引物的结合位点)以促进在目标测序平台上测序。所述核酸可在与模板转换寡核苷酸相反的末端处包括的测序平台适配体构建体(下图)包含用于第二表面-连接的测序平台寡核苷酸(在该实例中,系统的表面-连接的P7引物)的结合位点、索引条形码及第二测序引物结合位点(在该实例中,用于系统的Read2测序引物的结合位点)以促进在目标测序平台上测序。
所述主题方法还可包括合并热固聚合酶(如Taq、Pfu、Tfl、Tth、Tli和/或其它热稳定聚合酶)–除了模板转换聚合酶之外–至反应混合物中。可选地,模板转换聚合酶可为热稳定聚合酶。如当需要在单管中实现产物核酸的测序平台适配体构建体添加和扩增(如在另外的适配体添加下或不添加下扩增)时,这些实施方案的任一个可应用。例如,可将单管的内容物放置在适于模板转换聚合反应发生(如本文其它地方所述)的条件下,然后将反应内容物置于热循环条件(如变性、引物退火和聚合条件)下,其中第一-链合成产物使用单管中存在的扩增引物和热稳定聚合酶进行PCR扩增。由于其热稳定性,热稳定聚合酶甚至当在该实施方案的PCR阶段期间存在时仍将保留其活性。
组合物
本公开还提供了组合物。所述主题组合物可包含就主题方法而言上文所述的任何反应混合物组分的一种或多种。例如,所述组合物可包含模板核糖核酸(RNA)、聚合酶(如能够模板-转换的聚合酶、热稳定聚合酶及其组合等)、模板转换寡核苷酸、dNTP、盐、金属辅因子、一种或多种核酸酶抑制剂(如RNA酶抑制剂)、一种或多种酶-稳定组分(如DTT)或任何其它所需的反应混合物组分的一种或多种。
在某些方面,所述主题组合物包含各自杂交至核酸链的相邻区的模板核糖核酸(RNA)和模板转换寡核苷酸,其中模板转换寡核苷酸包括3’杂交结构域和测序平台适配体构建体。测序平台适配体构建体可包括任何目标测序平台核酸结构域,包括就主题方法而言上文所述的任何结构域(如特异性结合至表面-连接的测序平台寡核苷酸的结构域、测序引物结合结构域、条形码结构域、条形码测序引物结合结构域、分子鉴定结构域或其任何组合)。用于从目标核酸来源分离RNA样品的方法,以及用于从前体RNA产生模板RNA的策略在本文其它地方描述。
在某些方面,模板转换寡核苷酸的3’杂交结构域包含如如上文所述的任意序列。
所述主题组合物可存在于任何适合的环境中。根据一个实施方案,所述组合物存在于反应管(如0.2mL管、0.6mL管、1.5mL管等)或孔中。在某些方面,所述组合物存在于两个或多个(如多个)反应管或孔(如板,诸如96-孔板)中。所述管和/或板可由任何适合的材料如聚丙烯等制备。在某些方面,其中存在所述组合物的管和/或板为所述组合物提供有效的热转换(如当置于加热块、水浴、热循环仪等中时),使得所述组合物的温度可在一段短时间内改变,如如特定酶促反应发生所必需。根据某些实施方案,所述组合物存在于薄壁聚丙烯管或具有薄壁聚丙烯孔的板中。在某些实施方案中,其可能便于反应发生在固体表面或珠粒上,在此种情况下,模板转换寡核苷酸或者一种或多种引物可通过本领域已知的方法–诸如生物素键或通过共价键)连接至固体支撑物或珠粒并且使反应在支撑物上进行。
其它适用于主题组合物的环境包括如微流控芯片(如“芯片实验室设备”)。所述组合物可存在于经配置将组合物温度达到所需温度的仪器如温控水浴、加热块等中。经配置将组合物温度达到所需温度的仪器可经配置将组合物达到一系列不同的所需温度,各温度下持续适合的时间段(如所述仪器可为热循环仪)。
试剂盒
本公开的各方面还包括试剂盒。所述试剂盒可包括如就主题方法而言上文所述的任何反应混合物组分的一种或多种。例如,所述试剂盒可包括模板核糖核酸(RNA),用于从前体RNA产生模板RNA的组分(如用于多腺苷酸化非-多腺苷酸化前体RNA的聚(A)聚合酶和相关试剂)、聚合酶(如能够模板-转换的聚合酶、热固聚合酶、其组合等)、模板转换寡核苷酸、dNTP、盐、金属辅因子、一种或多种核酸酶抑制剂(如RNA酶抑制剂和/或DNA酶抑制剂)、一种或多种分子拥挤剂(如聚乙二醇等)、一种或多种酶-稳定组分(如DTT)或任何其它所需的试剂盒组分诸如固体支撑物,如管、珠粒、微流控芯片等的一种或多种。
根据一个实施方案,所述主题试剂盒包括模板转换寡核苷酸及模板转换聚合酶,所述模板转换寡核苷酸包括3’杂交结构域和测序平台适配体构建体。测序平台适配体构建体可包括任何目标测序平台核酸结构域,包括就主题方法和组合物而言上文描述的结构域的任一种(如特异性结合至表面-连接的测序平台寡核苷酸的结构域、测序引物结合结构域、条形码结构域、条形码测序引物结合结构域、分子鉴定结构域或其任何组合)。
本公开的试剂盒可包括第一-链合成引物,所述第一-链合成引物包括杂交至模板RNA的第一结构域和不杂交至模板RNA的第二结构域。第一结构域可具有定义的或任意序列。此类引物的第二结构域可包括如测序平台适配体构建体,所述测序平台适配体构建体包括选自特异性结合至表面-连接的测序平台寡核苷酸的结构域、测序引物结合结构域、条形码结构域、条形码测序引物结合结构域、分子鉴定结构域及其任何组合的核酸结构域。
在某些实施方案中,所述试剂盒包括用于从RNA的来源分离RNA的试剂。所述试剂可适用于从各种RNA来源(包括单细胞、经培养的细胞、组织、器官或生物体)分离核酸样品。所述主题试剂盒可包括用于从固定细胞、组织或器官如福尔马林固定的、石蜡包埋(FFPE)组织分离核酸样品的试剂。此类试剂盒可包括一种或多种脱蜡剂、一种或多种适于去交联核酸的试剂等。
所述试剂盒的组分可存在于分开的容器内,或则多个组分可存在于单个容器内。例如,模板转换寡核苷酸和模板转换聚合酶可提供在相同管中,或可提供在不同管中。在某些实施方案中,以冻干形式提供组分可能是方便的,使得它们易于使用并且可在室温下方便储存。
除了以上提及的组分之外,主题试剂盒还可包括用于使用试剂盒组分如以实施主题方法的说明书。说明书通常记录在适合的记录介质上。例如,可将说明书打印在基质例如纸或塑料等上。这样,说明书可以以包装插页形式存在于试剂盒中,存在于试剂盒或其组分的容器(即,与包装或分包装结合)的标签等中。在其它实施方案中,说明书以存在于适当的计算机可读存储媒介如CD-ROM、磁盘、硬盘驱动器(HDD)等上的电子存储数据文件的形式存在。在另外其它实施方案中,实际说明书不存在于试剂盒中,但提供用于例如经由互联网从远程来源获得说明书的方法。该实施方案的实例是包括其中可察看说明书和/或可从其下载说明书的网址。与说明书一样,用于获得说明书的该方法记录在适当的基质上。
用途
实施主题方法可用于多种应用中,包括那些需要在目标核酸的一端或两端处存在特定核苷酸序列的应用。此类应用存在于基础研究和诊断(如临床诊断)的领域内,并且包括但不限于产生测序-现成cDNA文库。此类文库可包括能够使用任何方便的测序平台对文库成员进行测序的适配体序列,所述测序平台包括:来自的HiSeqTM、MiSeqTM和GenomeAnalyzerTM测序系统;来自IonTorrentTM的IonPGMTM和IonProtonTM测序系统;来自PacificBiosciences的PACBIORSII测序系统、来自LifeTechnologiesTM的SOLiD测序系统、来自Roche的454GSFLX+和GSJunior测序系统,或任何其它方便的测序平台。本公开的方法可用于产生对应于任何目标RNA原料(如mRNA)的测序现成cDNA文库,并且不限于多腺苷酸化RNA。例如,所述主题方法可用于从非-多腺苷酸化RNA产生测序-现成cDNA文库,包括微小RNA、小RNA、siRNA和/或任何其它类型的目标非-多腺苷酸化RNA。所述方法还可用于产生链-特异性信息,其可有助于测定等位基因特异性表达或区分基因组中重叠的转录物。
主题方法的一方面是–使用模板RNA–在其一端或两段具有测序平台适配体序列的cDNA种类在单个步骤中产生,如在没有添加的与传统的基于连接的用于产生下游测序应用所用的杂交核酸分子的传统的基于连接的方法相关的步骤情况下。此类步骤包括连接步骤(其可能需要在先限制消化)、洗涤步骤和与传统的基于连接的方法相关的任何其它必需的步骤。因此,本公开的方法比传统的方法更有效、节约成本并且提供更多灵活性。
以下实施例通过说明的方式而非现实的方式提供。
实验
I.文库构建
将1μg人脑聚ARNA(Clontech)通过添加5X片段化缓冲液(200mMTris乙酸盐,pH8.2、500mM乙酸钾和150mM乙酸镁)并在94℃下加热2分钟30秒来片段化。经片段化的RNA使用NucleospinRNAXSspin柱(MachareyNagel)纯化。
将经片段化的RNA于不含RNA酶的水中稀释至1ng/μl或5ng/μl。将1μl经片段化的RNA或水与1μl12μM第一链引物和2.5μl不含RNA酶的水合并。将样品加热至72℃持续3分钟,然后置于冰上。向这些样品添加2μl5X第一链缓冲液(Clontech)、0.25μl100mMDTT、0.25μl重组RNA酶抑制剂(Takara)、10mMdNTP混合物(Clontech)、1μl12μM模板转换寡核苷酸和1μlSMARTScribeRT(Clontech)。将样品在42℃下孵育90分钟,然后在70℃下10分钟。
第一链cDNA反应物通过添加15μl水和25μlAmpureXP珠粒(BeckmanCoulter)纯化。将样品充分混合并在室温下孵育8分钟。使样品结合至磁性表座持续5分钟,并将珠粒用200μl80%乙醇洗涤两次并使其空气干燥5分钟。
珠粒上的cDNA通过添加50μlPCRMastermix(5μl10Advantage2缓冲液、5μlGCMelt试剂、1μl10mMdNTP、1μlAdvantage2聚合酶(Clontech)、240nM正向PCR引物、240nM反向PCR引物和36.8μl水)洗脱。使样品进行12个PCR循环的热循环,其设定是:95℃1分钟,12X(95℃15秒,65℃30秒,68℃1分钟)。PCR产物用50μlAmpureXP珠粒纯化并于40μlTE缓冲液中洗脱。
将样品洗脱并在使用高灵敏度DNA测定的AgilentBioanalyzer上跑柱。结果提供在图4中。
II.构建Illumina测序文库
A.文库构建
将1μg小鼠脑聚ARNA(Clontech)通过添加5X片段化缓冲液(200mMTris乙酸盐,pH8.2、500mM乙酸钾和150mM乙酸镁)并在94℃下加热2分钟30秒来片段化。经片段化的RNA使用NucleospinRNAXSspin柱(MachareyNagel)纯化。
将于3.5μl中的10ng经片段化的RNA与1μl12μM第一链引物合并。将样品加热至72℃持续3分钟,然后置于冰上。向这些样品添加2μl5X第一链缓冲液(Clontech)、0.25μl100mMDTT、0.25μl重组RNA酶抑制剂(Takara)、10mMdNTP混合物(Clontech)、1μl12μM模板转换寡核苷酸和1μlSMARTScribeRT(Clontech)。将样品在42℃下孵育90分钟,然后在70℃下10分钟。
将第一链cDNA反应物通过添加15μl水和25μlAmpureXP珠粒(BeckmanCoulter)纯化。将样品充分混合并在室温下孵育8分钟。使样品结合至磁性表座5分钟,并将珠粒用200μl80%乙醇洗涤两次并使其空气干燥5分钟。
将珠粒上的cDNA通过添加50μlPCRMastermix(5μl10Advantage2缓冲液、5μlGCMelt试剂、1μl10mMdNTP、1μlAdvantage2聚合酶(均为Clontech)、240nM正向PCR引物、240nM反向PCR引物和36.8μl水)洗脱。使样品进行12个PCR循环的热循环,其设定是:95℃1分钟,12X(95℃15秒,65℃30秒,68℃1分钟)。PCR产物用50μlAmpureXP珠粒纯化并于40μlTE缓冲液中洗脱。
将样品洗脱并在使用高灵敏度DNA测定的AgilentBioanalyzer上跑柱。
B.测序
将以上测序文库稀释至2nM并与等量的PhiX对照文库(Illumina)合并。将样品上样至IlluminaMiSeq仪器中,最终上样浓度为8pM并测序为单一66bp读数。
C.分析概述
所有分析在linux工作站上进行。调整序列的前三个核苷酸,并将PhiX序列通过用Bowtie2软件包将所有序列定位至PhiX基因组并保留所有未定位的读数而生物信息学移除。
将剩余的测序读数使用tophat2软件包定位至小鼠转录组(构造MM10)。基因表达值使用用基因组注释作为指导的Cufflinks软件计算。
将基因表达值与用核糖体耗尽小鼠脑总RNA(Clontech)的SMARTerUniversal试剂盒(Clontech)产生的之前测序的文库比较。
基因表达比较和作图在R中使用CummeRbund分析包进行。
基因体覆盖率和链特异性分别使用geneBody_coverage.py和infer_experiment.py脚本从RSeQC软件采集计算。
III.miRNA文库构建
将1μl5μM合成miR-22(AAGCUGCCAGUUGAAGAACUGUA)(RNA)(SEQIDNO:07)与2μl5X第一链缓冲液(Clontech)、0.25μl100mMDTT、0.25μl重组RNA酶抑制剂(Takara)、0.25μl聚(A)聚合酶(Takara)、1μl10mMATP、5.25μl不含RNA酶的水合并。将样品在37℃下孵育10分钟,然后在65℃下20分钟。
将反应物用10μl不含RNA酶的水稀释。将3.5μl稀释的多腺苷酸化miRNA与1μl12μM第一链引物合并。将样品加热至72℃持续3分钟,然后置于冰上。向这些样品添加2μl5X第一链缓冲液(Clontech)、0.25μl100mMDTT、0.25μl重组RNA酶抑制剂(Takara)、10mMdNTP混合物(Clontech)、1μl12μM模板转换寡核苷酸和1μlSMARTScribeRT(Clontech)。将样品在42℃下孵育60分钟,然后在70℃下15分钟。
将第一链反应物用40μlTE缓冲液稀释。将5μl稀释的cDNA与45μlPCRMastermix(5μl10Advantage2缓冲液、1μl10mMdNTP、1μlAdvantage2聚合酶(均为Clontech)、240nM正向PCR引物、240nM反向PCR引物(和36μl水)合并。使样品进行20个PCR循环的热循环,其设定是:95℃1分钟,20X(95℃15秒,65℃30秒)。将5μlPCR产物在1%琼脂糖凝胶上解析。
尽管有附加条款,但本公开还由以下条款限定:
1.一种方法,其包括:
在足以产生产物核酸的条件下合并:
模板核糖核酸(RNA);
包括3'杂交结构域和测序平台适配体构建体的模板转换寡核苷酸;
聚合酶;和
dNTP;
于反应混合物中,所述产物核酸包括各自杂交至单一产物核酸的相邻区的所述模板RNA和所述模板转换寡核苷酸,所述单一产物核酸的相邻区包括由所述聚合酶从所述dNTP聚合的区。
2.根据条款1所述的方法,其中所述模板RNA是信使RNA(mRNA)。
3.根据条款1所述的方法,其中所述模板RNA是非-多腺苷酸化RNA。
4.根据条款3所述的方法,其中所述方法包括添加核酸序列至所述非-多腺苷酸化RNA的3’末端。
5.根据条款3所述的方法,其中连接至所述非-多腺苷酸化RNA的3’末端的所述核酸序列是多腺嘌呤序列。
6.根据条款3-5中任一项所述的方法,其中所述非-多腺苷酸化RNA是微小RNA(miRNA)。
7.根据条款1-6中任一项所述的方法,其中所述测序平台适配体构建体包括选自由以下组成的组的核酸结构域:特异性结合至表面-连接的测序平台寡核苷酸的结构域、测序引物结合结构域、条形码结构域、条形码测序引物结合结构域、分子鉴定结构域及其组合。
8.根据条款1-7中任一项所述的方法,其中所述3'杂交结构域包含同型核苷酸片段。
9.根据条款1-7中任一项所述的方法,其中所述3'杂交结构域包含异型核苷酸片段。
10.根据条款1-9中任一项所述的方法,其中所述聚合酶是逆转录酶。
11.根据条款1-10中任一项所述的方法,其中所述方法还包括产生所述产物核酸并使与所述模板转换寡核苷酸互补的所述单一产物核酸的3’区与经配置结合其上的第二链引物在杂交条件下接触。
12.根据条款11所述的方法,其中所述方法还包括在使与所述模板转换寡核苷酸互补的所述单一产物核酸的3’区与所述第二链引物接触后使所述反应混合物经受核酸聚合条件。
13.根据条款1-12中任一项所述的方法,其中所述方法还包括使所述模板RNA与使所述单一产物核酸的合成准备好的第一引物接触。
14.根据条款13所述的方法,其中所述第一引物包括杂交至所述模板RNA的第一结构域和不杂交至所述模板RNA的第二结构域。
15.根据条款14所述的方法,其中所述第一结构域具有定义的序列。
16.根据条款14所述的方法,其中所述第一结构域具有任意序列。
17.根据条款14-16中任一项所述的方法,其中所述第二结构域包括测序平台适配体构建体。
18.根据条款17所述的方法,其中所述第二结构域的测序平台适配体构建体包括选自由以下组成的组的核酸结构域:特异性结合至表面-连接的测序平台寡核苷酸的结构域、测序引物结合结构域、条形码结构域、条形码测序引物结合结构域、分子鉴定结构域及其组合。
19.根据条款17或18所述的方法,其中所述第二结构域的测序平台适配体构建体不同于所述模板转换寡核苷酸的测序平台适配体构建体。
20.根据条款13-19中任一项所述的方法,其中所述第一引物包含防止使用所述单一产物核酸作为模板的聚合酶聚合新生链超过所述第一引物中的修饰的修饰。
21.根据条款20所述的方法,其中所述修饰选自由以下组成的组:无碱基损害、核苷酸加合物、异-核苷酸碱基及其组合。
22.根据条款13-21中任一项所述的方法,其中所述第一引物包含一种或多种核苷酸类似物。
23.根据条款13-22中任一项所述的方法,其中所述第一引物包含键修饰、末端修饰或这两者。
24.根据条款1-23中任一项所述的方法,其中所述方法还包括使所述单一产物核酸经受核酸扩增条件。
25.根据条款24所述的方法,其中所述单一产物核酸在其5’末端具有扩增序列和在其3’末端具有扩增序列,并且其中使所述单一产物核酸经受PCR扩增条件包括用与所述5’和3’扩增序列互补的引物扩增所述单一产物核酸。
26.根据条款25所述的方法,其中与所述5’和3’扩增序列互补的引物的一者或两者包括选自由以下组成的组的核酸结构域:特异性结合至表面-连接的测序平台寡核苷酸的结构域、测序引物结合结构域、条形码结构域、条形码测序引物结合结构域、分子鉴定结构域及其组合。
27.根据条款24-26中任一项所述的方法,其中使所述单一产物核酸经受核酸扩增条件包括使所述单一产物核酸与热稳定聚合酶接触。
28.根据条款1-27中任一项所述的方法,其中所述模板转换寡核苷酸包含防止所述聚合酶在合成所述5’适配体序列的补体后从所述模板转换寡核苷酸转换至不同的模板核酸的修饰。
29.根据条款28所述的方法,其中所述修饰选自由以下组成的组:无碱基损害、核苷酸加合物、异-核苷酸碱基及其组合。
30.根据条款1-29中任一项所述的方法,其中所述模板转换寡核苷酸包含一种或多种核苷酸类似物。
31.根据条款1-30中任一项所述的方法,其中所述模板转换寡核苷酸包含键修饰、末端修饰、或两者。
32.一种组合物,其包含各自杂交至核酸链的相邻区的模板核糖核酸(RNA)和模板转换寡核苷酸,其中所述模板转换寡核苷酸包括3’杂交结构域和测序平台适配体构建体。
33.根据条款32所述的组合物,其中所述测序平台适配体构建体包括选自由以下组成的组的核酸结构域:特异性结合至表面-连接的测序平台寡核苷酸的结构域、测序引物结合结构域、条形码结构域、条形码测序引物结合结构域、分子鉴定结构域及其组合。
34.根据条款32或33所述的组合物,其中所述3'杂交结构域包含同型核苷酸片段。
35.根据条款32或33所述的组合物,其中所述3'杂交结构域包含异型核苷酸片段。
36.根据条款32-35中任一项所述的组合物,其中所述组合物存在于反应管中。
37.一种试剂盒,其包括:
模板转换核酸,其包括3’杂交结构域和测序平台适配体构建体;和
模板转换聚合酶。
38.根据条款3所述的试剂盒,其中所述测序平台适配体构建体包括选自由以下组成的组的核酸结构域:特异性结合至表面-连接的测序平台寡核苷酸的结构域、测序引物结合结构域、条形码结构域、条形码测序引物结合结构域、分子鉴定结构域及其组合。
39.根据条款37或38所述的试剂盒,其包括第一-链合成引物,所述第一-链合成引物包括杂交至模板RNA的第一结构域和不杂交至所述模板RNA的第二结构域。
40.根据条款39所述的试剂盒,其中所述第一结构域具有定义的序列。
41.根据条款39所述的试剂盒,其中所述第一结构域具有任意序列。
42.根据条款39-41中任一项所述的试剂盒,其中所述第二结构域包括测序平台适配体构建体,所述测序平台适配体构建体包括选自由以下组成的组的核酸结构域:特异性结合至表面-连接的测序平台寡核苷酸的结构域、测序引物结合结构域、条形码结构域、条形码测序引物结合结构域、分子鉴定结构域及其组合。
43.根据条款37-42中任一项所述的试剂盒,其中所述模板转换聚合酶是逆转录酶。
44.根据条款37-43中任一项所述的试剂盒,其中所述试剂盒还包括固体支撑物。
45.根据条款37-44中任一项所述的试剂盒,其中所述试剂盒包括冻干组分。
尽管为了理解清楚的目的已经通过说明和实施例较详细地描述了上述发明,但根据本发明的教导,对于本领域普通技术人员来说很显然的是,在不背离所附权利要求的精神和范围下可对本发明进行某些改变和更改。
因此,上述内容仅用于说明本发明的原理。应理解,本领域的技术人员将能够设计不同的安排,其尽管未被本文明确地描述或显示,但使本发明的原则具体化,且包含在其精神和范围内。此外,本文中引用的所有实例和条件语言主要旨在帮助读者理解本发明的原理和由本发明者提供以推进现有技术的概念,而不被解释为限定于这些明确引述的实例和条件。此外,本文中引用本发明的原理、方面和实施方案以及其具体的实施例的所有声明意欲包括其结构和功能等同物。此外,期望此类等同物包括目前已知的等同物和未来开发的等同物,即无论结构如何,进行相同功能的开发的任何元件。因而,本发明的范围无意限定于本文中显示和描述的示例性实施方案。相反,本发明的范围和精神由所附权利要求体现。