Nothing Special   »   [go: up one dir, main page]

CN106244578B - 用于对核酸进行测序的方法 - Google Patents

用于对核酸进行测序的方法 Download PDF

Info

Publication number
CN106244578B
CN106244578B CN201610420946.2A CN201610420946A CN106244578B CN 106244578 B CN106244578 B CN 106244578B CN 201610420946 A CN201610420946 A CN 201610420946A CN 106244578 B CN106244578 B CN 106244578B
Authority
CN
China
Prior art keywords
array
oligonucleotide
cases
oligonucleotides
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610420946.2A
Other languages
English (en)
Other versions
CN106244578A (zh
Inventor
贾斯汀·科斯塔
周巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Centrillion Technology Holdings Corp
Original Assignee
Centrillion Technology Holdings Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US15/178,411 external-priority patent/US11060139B2/en
Priority claimed from EP16173782.0A external-priority patent/EP3103885B1/en
Application filed by Centrillion Technology Holdings Corp filed Critical Centrillion Technology Holdings Corp
Publication of CN106244578A publication Critical patent/CN106244578A/zh
Application granted granted Critical
Publication of CN106244578B publication Critical patent/CN106244578B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本文提供了用于对长核酸例如DNA进行测序的方法和组合物。所述方法和组合物适于长核酸分子的空间标记和测序。

Description

用于对核酸进行测序的方法
交叉引用
该申请要求于2015年6月9日提交的第62/173,140号美国临时申请、于2015年6月11日提交的第62/173,943号美国临时申请、2016年6月9日提交的第PCT/US2016/036709号PCT国际申请、2016年6月9日提交的第15/178,411号美国正式申请和2016年6月9日提交的第16173782.0号欧洲申请的优先权,其每篇通过引用整体并入本文。
于2014年6月13日提交的第62/012,238号美国临时申请、于2014年4月14日提交的第61/979,448号美国临时申请、于2014年3月28日提交的第61/971,536号美国临时申请、于2014年4月2日提交的第61/973,864号美国临时申请、于2014年4月25日提交的第61/984,057号美国临时申请、和于2014年6月6日提交的第62/008,985号美国临时申请均通过引用并入。
发明背景
人类基因组计划(Human Genome Project)已使测序成本从每个成品碱基约$10显著减至低于$0.00001。外显子组测序目前可以常规用于研究和临床环境两者中以用于检测与疾病有关的遗传性或获得性突变,并且FDA已列出超过100种药物,这些药物在其标签上具有基因型信息。此外,使用全基因组测序(WGS)已变得普遍。然而,当前核酸测序技术可以被测序长度限制。因此,当前技术仍可存在较大局限性,这可严重限制WGS对于很多研究的可行性和效用。即,这些"下一代测序"(NGS)技术的读段长度可以相对较短。可论证地,用于测序的工业标准可以为Illumina HiSeq2500,其可以对成对的150个碱基读段(read)进行测序。在这种相对短的读段长度的情况下,全基因组再测序研究一般而言对于鉴定单个核苷酸变体(SNV)是相当有用;然而,众所周知,相对短的读段长度也可能对于鉴定大的插入/缺失(indel)以及结构变体是不可靠的。
此外,在没有相当多的额外实验的情况下使用较短读段通常可能难以对变体分期。因此很多临床应用需要长测序或可能受益于长测序。
目前,存在生成较长读段的技术,它们具有较低准确度、较低通量,并且成本昂贵。因此,它们对于全基因组测序不是可行的选项。最终,其他测序技术不提供详细的序列信息。
为了解决这些问题,提供了本文描述的方法、组合物、系统和试剂盒以产生非常长的读段,即兆级碱基范围,以及准确地鉴定很多(如果不是所有的话)遗传变体(例如,单核苷酸多态性、插入/缺失、多倍体、转座、重复序列和/或结构变体)以及对任何鉴定的变体分期至适合的同源染色体。
发明内容
一方面,提供了用于制备修饰表面的方法,其包括:(a)提供表面;(b)使引发剂物质共价键合至所述表面;(c)由所述引发剂物质对聚合物进行表面引发的聚合,由此产生包含多个聚合物链的聚合物涂层;以及(d)使标记物与所述聚合物涂层偶联。在一些情况下,表面选自由以下组成的组:玻璃、二氧化硅、氧化钛、氧化铝、氧化铟锡(ITO)、硅、聚二甲基硅氧烷(PDMS)、聚苯乙烯、多环烯烃、聚甲基丙烯酸甲酯(PMMA)、钛和金。在一些情况下,包含玻璃。在一些情况下,表面包括硅。在一些情况下,表面选自由以下组成的组:流动槽、测序流动槽、流动通道、微流通道、毛细管、压电表面、孔、微孔、微孔阵列、微阵列、芯片、晶片、非磁性珠粒、磁性珠粒、铁磁珠粒、顺磁珠粒、超顺磁珠粒和聚合物凝胶。在一些情况下,引发剂物质包括有机硅烷。在一些情况下,引发剂物质包括分子:
Figure BDA0001017891490000021
在一些情况下,聚合物包括聚丙烯酰胺。在一些情况下,聚合物包括PMMA。在一些情况下,聚合物包括聚苯乙烯。在一些情况下,进行表面引发的聚合包括原子转移自由基聚合(ATRP)。在一些情况下,进行表面引发的聚合包括可逆加成断裂链-转移(RAFT)。在一些情况下,标记物包括寡核苷酸。在一些情况下,标记物包括5'acrydite修饰的寡核苷酸。
在另一方面,提供了用于转移阵列的组合物,其包括:(a)基底;(b)与所述基底偶联的涂层;以及(c)与所述涂层偶联的多个第一受者寡核苷酸,其中所述多个第一受者寡核苷酸中的每一个包含与附加至多个模板寡核苷酸中的每一个的第一接头序列互补的序列,其中所述多个模板寡核苷酸存在于待转移的阵列上。在一些情况下,组合物还包括:与所述涂层偶联的多个第二受者寡核苷酸,其中所述多个第二受者寡核苷酸中的每一个包含与附加至待转移的多个模板寡核苷酸中的每一个的第二接头序列互补的序列。在一些情况下,第一接头序列位于或邻近待转移的所述模板寡核苷酸的3’端。在一些情况下,第一接头序列位于或邻近待转移的所述模板寡核苷酸的5’端。在一些情况下,第二接头序列位于或邻近待转移的所述模板寡核苷酸的3’端。在一些情况下,第二接头序列位于或邻近待转移的所述模板寡核苷酸的5’端。在一些情况下,涂层包括聚合物凝胶或聚合物涂层。在一些情况下,涂层包括丙烯酰胺凝胶、聚丙烯酰胺凝胶、丙烯酰胺涂层或聚丙烯酰胺涂层。
在另一方面,提供了用于转移阵列的方法,其包括:(a)提供基底以及提供与所述基底偶联的多个第一受者寡核苷酸,所述多个第一受者寡核苷酸中的每一个包含与附加至多个模板寡核苷酸的第一接头序列互补的序列;(b)将包含酶和dNTP的反应混合物施加至所述基底的表面;(c)使所述基底与包含所述模板寡核苷酸的阵列接触;以及(d)使用所述多个模板寡核苷酸作为模板来进行所述多个第一受者寡核苷酸的延伸反应。在一些情况下,第一接头序列位于或邻近所述模板寡核苷酸的3’端。在一些情况下,第一接头序列位于或邻近所述模板寡核苷酸的5’端。在一些情况下,基底包括聚合物。在一些情况下,基底包括丙烯酰胺或聚丙烯酰胺。
在又一方面,提供了用于生成阵列的方法,其包括:(a)提供包含与其偶联的至少1,000个不同模板寡核苷酸的模板阵列;(b)使所述模板阵列与具有与与其附接的所述至少1,000个不同寡核苷酸的部分互补的多个寡核苷酸的基底接触,以及(c)在所述接触期间进行酶促反应,由此生成包含多个受者寡核苷酸的受者阵列,其中至少40%的所述受者寡核苷酸与来自所述至少1,000个不同模板寡核苷酸的全长模板寡核苷酸互补或同一。在一些情况下,模板阵列包含至少100个斑点。在一些情况下,模板阵列包含至多500μm大小的斑点。在一些情况下,所述多个受者寡核苷酸相对于所述受者阵列的方向性与所述模板寡核苷酸相对于所述模板阵列的方向性相同。在一些情况下,所述受者寡核苷酸相对于所述受者阵列的方向性与所述模板寡核苷酸相对于所述模板阵列的方向性相反。在一些情况下,生成多个受者阵列。在一些情况下,多个受者寡核苷酸在一个受者阵列与所述多个受者阵列中的另一个之间平均至少99%同一。在一些情况下,多个受者寡核苷酸在一个受者阵列与所述多个受者阵列中的另一个之间至少99%同一。
在又一方面,提供了用于生成阵列的方法,其包括:使用包含多个模板寡核苷酸的模板阵列来合成包含多个受者寡核苷酸的受者阵列,其中所述受者阵列在合成期间与所述模板阵列相接触。在一些情况下,至少40%的所述受者寡核苷酸包含全长产物。在一些情况下,至少50%的所述受者寡核苷酸包含全长产物。在一些情况下,至少60%的所述受者寡核苷酸包含全长产物。在一些情况下,所述受者寡核苷酸相对于所述受者阵列的方向性与所述模板寡核苷酸相对于所述模板阵列的方向性相同。在一些情况下,所述受者寡核苷酸相对于所述受者阵列的方向性与所述模板寡核苷酸相对于所述模板阵列的方向性相反。在一些情况下,生成多个受者阵列。在一些情况下,多个受者寡核苷酸在一个受者阵列与所述多个受者阵列中的另一个之间平均至少99%同一。在一些情况下,多个受者寡核苷酸在一个受者阵列与所述多个受者阵列中的另一个之间至少99%同一。
在另一方面,提供了用于对模板核酸分子进行测序的方法,其包括:(a)向所述模板核酸分子引入一个或多个引物-结合位点以生成引发的模板核酸分子;(b)使所述引发的模板核酸分子与包含固定于其上的多个引物的基底接触,所述多个引物中的每一个包含:(i)与所述一个或多个引物-结合位点中的至少一个互补的序列,以及(ii)指示在所述基底上所述引物的物理位置的条形码序列;(c)使用所述多个引物和所述引发的模板核酸分子作为模板进行延伸反应,由此生成多个延伸产物,所述多个延伸产物中的每一个包含(i)所述模板核酸或其互补序列的片段的序列,以及(ii)所述条形码序列或其互补序列的序列;(d)对所述多个延伸产物进行测序以确定所述片段或其互补序列和所述条形码序列或其互补序列的序列;以及(e)使用所述条形码序列装配所述片段或其互补序列的所述序列,由此确定所述模板核酸分子的序列。在一些情况下,所述方法还包括在步骤(b)之前拉伸所述核酸分子。在一些情况下,拉伸通过分子梳来进行。在一些情况下,拉伸通过分子穿越来进行。在一些情况下,拉伸通过转印来进行。在一些情况下,拉伸在纳米通道中进行。在一些情况下,拉伸通过磁镊来进行。在一些情况下,拉伸通过光镊来进行。在一些情况下,基底包括玻璃。在一些情况下,基底包括疏水玻璃。在一些情况下,基底包括聚合物涂层。
在另一方面,提供了用于克隆多个核酸的方法,所述方法包括:(a)将包含多个寡核苷酸的基底与拓扑异构酶I酶孵育,所述多个寡核苷酸附接到所述基底,其中所述多个寡核苷酸中的每一个包含含有第一接头、可变区和第二接头的双链体,其中所述第一接头附接到所述基底,并且其中所述第二接头包含所述拓扑异构酶I酶在所述双链体的一条链内的第一识别序列以及所述拓扑异构酶I酶在所述双链体的相对链上的3’末端处的第二识别序列,其中与所述拓扑异构酶I酶的所述孵育在所述第一识别序列和第二识别序列的接合点处裂解所述多个寡核苷酸中的每一个的两条链并且使所述拓扑异构酶I酶与所述多个寡核苷酸中的每一个键合,由此生成包含与附接到所述基底的所述多个寡核苷酸中的每一个键合的拓扑异构酶I酶的基底;以及(b)将所述多个核酸与包含与附接到所述基底的所述多个寡核苷酸中的每一个键合的拓扑异构酶I酶的所述基底孵育,其中与所述多个寡核苷酸中的每一个键合的所述拓扑异构酶I酶使所述多个核酸中的每一个的每一端与附接到所述基底的所述多个寡核苷酸中的一个连接,由此克隆所述多个核酸。在一些情况下,拓扑异构酶I酶来自牛痘病毒。在一些情况下,所述第一识别序列、所述第二识别序列或两者为5’-TCCTT-3’。在一些情况下,所述第一识别序列、所述第二识别序列或两者为5’-CCCTT-3’。在一些情况下,基底为阵列。在一些情况下,其中所述多个核酸中的每一个为DNA。在一些情况下,在步骤b)之前拉伸所述多个核酸。在一些情况下,拉伸在固定化基底上进行。在一些情况下,拉伸在包含所述多个寡核苷酸的所述基底上进行。在一些情况下,拉伸通过转印来进行。在一些情况下,拉伸通过磁镊来进行。在一些情况下,拉伸通过光镊来进行。在一些情况下,在步骤b)之前处理所述多个核酸,其中所述处理包括从所述多个核酸中的每一个生成核酸片段,其中所述核酸片段包含在所述核酸片段中的每一个的两端处的平端。在一些情况下,所述生成包括用生成平端的限制酶处理所述多个核酸。在一些情况下,使用聚合酶向所述核酸片段的每一端添加包含单个腺嘌呤残基的3’突出。在一些情况下,使用Taq聚合酶添加所述3’突出。在一些情况下,可变区包含条形码。在一些情况下,第一接头包含限制酶的识别序列。
通过引用并入
在该说明书中提及的所有出版物、专利和专利申请通过引用并入本文,其程度如同具体地且单独地指示每个单独出版物、专利或专利申请通过引用并入一样。
附图说明
本发明的新颖特征详细阐述于所附权利要求书中。参考以下阐述使用本发明原理的说明性实施方案的详细描述以及所附附图将获得对本发明的特征和优势的更充分理解,在所附附图中:
图1说明用于对核酸分子进行测序的方法的流程图。
图2说明用于对核酸分子进行测序的方法的流程图。
图3说明使用本文描述的面对面酶促转移法制备的高-特征阵列。棋盘格DNA阵列是通过Bst酶促转移至10μm薄丙烯酰胺凝胶涂布的第二表面上。
图4说明使用光分解保护基化学使用常规接触式平版印刷逐步错位生成的20聚体寡核苷酸阵列。
图5说明寡核苷酸500的示意图,所述寡核苷酸从5'到3'包含PCR引物序列501、条形码序列502以及限定序列(例如接头或通用序列)503,所述限定序列结合于与目标多核苷酸(即模板核酸)上的限定序列互补的序列。
图6A说明具有空间编码阵列的基底的示意图。
图6B说明具有空间编码行或列的基底的示意图。
图6C说明具有空间编码群集的基底的示意图。
图7A-7D说明用于将模板核酸(例如DNA)阵列拷贝至第二表面(例如受者阵列)上的面对面酶促转移法。合成的阵列(5'向上)被压在含有固定引物的均匀展开物和反应混合物的第二凝胶覆盖表面上图7A。当加热时,引物与互补底部接头杂交图7B且经由Bst聚合延伸图7C。分离这些表面产生原始寡核苷酸阵列的3'向上的拷贝图7D。
图8A说明通过合成进行酶促转移(ETS)的一般示意图。
图8B说明引起核酸相对于基底的不同取向的酶促转移的示意图。
图8C说明引起全长链转移的酶促转移的示意图。
图9说明在受者表面上从模板表面进行合成的示意图。
图10说明为移除接头序列而进行探针末端修剪(PEC)的示意图。
图11说明在切口位点处进行探针末端修剪(PEC)的示意图。
图12说明具有经由酶延伸转移的群集的模板载玻片(左)和凝胶芯片(右)。
图13说明图12的模板(左)和凝胶拷贝(右)的放大图像。
图14说明模板(左)和凝胶拷贝(右)的强度比较,后者具有比前者低约100倍的强度。
图15说明与不存在模板的阴性对照表面相比较向凝胶拷贝的酶促转移。
图16说明与不存在酶的阴性对照表面(右)相比较向凝胶拷贝(左)的酶促转移。
图17说明寡核苷酸固定化转移(OIT)的第一阶段的示意图。
图18说明寡核苷酸固定化转移(OIT)的第二阶段的示意图。
图19说明非酶促凝胶转移的示意图。
图20说明在使用交联剂1,4-亚苯基二异硫氰酸酯(PDITC)硅烷化之后寡核苷酸附接到玻璃表面的第一阶段的示意图。
图21说明在使用PDITC硅烷化之后寡核苷酸附接到玻璃表面的第二阶段的示意图。
图22说明如图20-21中所说明的附接于使用PDITC硅烷化的玻璃表面的寡核苷酸的凝胶转移。
图23说明包含附接到呈棋盘格模式的表面的荧光标记寡核苷酸的模板阵列。
图24说明图23中的表面的放大视图。
图25说明非酶凝胶转移之后的模板,其中信号来自合成链(左)和另一链(右)。
图26说明非酶凝胶转移之前(左)和之后(右)的模板。
图27说明来自凝胶延伸的链转移(左)和凝胶撕裂的模板链转移(右)的拷贝。
图28说明在10x 2S 2bin(左)和10x 0.5s 10bin(右)情况下的凝胶图像。
图29说明酶促转移之后的群集扩增。
图30说明使用本文描述的面对面凝胶转移法进行酶促转移之前(左)和5次酶促转移之后(右)的模板阵列。
图31说明通过连接于固定DNA上进行3色测序。由切口酶在目标多核苷酸上生成引发结合位点。使用标准SBL荧光探针。此图示出了针对切口DNA的ssDNA探针。
图32说明经由转座子插入将可延伸序列添加至长核酸中的示意图。
图33说明使用随机引物将可延伸序列添加至长核酸中的示意图。
图34A说明使用0.5M NaOH变性的dsDNA。用抗ssDNA抗体探查单链DNA。图34B展示固定DNA的聚合酶延伸。Vent聚合酶使被引发的固定ssDNA延伸。将样品用Yoyo(BIO寡核苷酸引物)染色并且通过Vent掺入DIG dGTP。
图35说明在具有空间编码群集的基底上的核酸链的示意图。
图36说明在具有空间编码阵列的基底上的核酸链的示意图。
图37说明将具有梳理过的核酸的盖玻片放置于具有空间编码的基底上的示意图。
图38说明使用基底特征使用随机引物将可延伸序列添加至长核酸中的示意图。
图39说明使用基底特征经由转座子插入将可延伸序列添加至长核酸中的示意图。
图40说明用于构建基于寡核苷酸芯片(DNA阵列)的下一代测序(NGS)文库的步骤a)至f)。步骤a)显示固定寡核苷酸包含与使用分子梳在寡核苷酸阵列上拉伸的目标多核苷酸(拉伸的DNA)杂交的条形码。步骤b)显示延伸并且因此梳理过的目标多核苷酸的拷贝,从而产生双链目标多核苷酸(dsDNA)。步骤c)显示双链目标多核苷酸的酶切割,随后在步骤d)中进行末端修复。步骤e)显示接头附加至片段化双链目标多核苷酸上,随后在步骤f)中双链目标多核苷酸从寡核苷酸阵列释放以进行测序。
图41说明使用随机引物制备基于芯片的文库的示意图。
图42说明引发剂硅烷的实例。
图43说明磷酸胆碱-丙烯酰胺单体的实例。
图44说明甜菜碱-丙烯酰胺单体的实例。
图45说明用于产生具有寡核苷酸的聚丙烯酰胺表面涂层的方法的实例。
图46示出了在寡核苷酸阵列上拉伸的单一分子DNA。
图47示出了在寡核苷酸阵列上拉伸的多个DNA分子。
图48示出了在拉伸后与DNA杂交的经Cy3标记的随机九聚体探针。
图49示出了在拉伸后与DNA杂交的经Cy3标记的随机九聚体探针的移除。
图50示出了在具有经标记的九聚体延伸产物的表面上拉伸的DNA。
图51A-H说明使用拓扑异构酶I酶在寡核苷酸阵列上克隆DNA分子的各种方法。图51A说明在寡核苷酸阵列上的特征中的寡核苷酸的结构的非限制性实例。图51B说明在拓扑异构酶I存在下寡核苷酸从图51A的切割。图51C说明在寡核苷酸阵列上拉伸的DNA分子。图51D说明拓扑异构酶I在如本文描述的自发连接之后的释放。图51E和51F说明在寡核苷酸阵列上的平端拓扑异构酶I克隆。图51G和51H说明在寡核苷酸阵列上的突出拓扑异构酶克隆。
具体实施方式
概述
本文提供了用于制造DNA芯片、控制寡核苷酸在阵列上的取向、拉伸核酸、制备测序库和对可能为几百千碱基至几百兆碱基长的核酸进行测序的方法、组合物和试剂盒。本发明的方法整合了若干种技术以便解决目前的下一代测序(NGS)的限制。尽管NGS已经取得了长足的进步,使得研究人员可在任何机构利用外显子组或全基因组测序,但对结果进行判读可能极具挑战性。关于序列变体和突变的定相单倍型信息是目前的全基因组测序策略中缺失的重要信息,并且可能非常有助于分析和解释基因组序列数据。
本公开提供了可用于阵列的表面上的改善型聚合物涂层的方法和组合物。可以经由表面引发聚合(SIP)经由与表面结合的引发剂物质来生成所述聚合物涂层。所述聚合物涂层可以并入经修饰的单体来调节所述涂层的物理化学性质。所述聚合物涂层可以并入寡核苷酸。
本文中提供了用于生成包含寡核苷酸(“oligo”)的阵列的方法,其中各寡核苷酸包括有标出在所述阵列上的位置或地址的条形码(即,位置条形码)。在一些情况下,本文中提供了寡核苷酸阵列(“芯片”)制造方法,所述方法经过优化以(a)减少特征(“斑点”)大小和间距;(b)任选地逆转所述寡核苷酸在所述阵列上的取向以使得各寡核苷酸的3'端在所述阵列上自由延伸(例如,酶促添加核苷酸碱基);和(c)增加寡核苷酸合成的长度和准确度。投影光刻和光酸生成聚合物膜可以用于合成高特征(“斑点”)密度(>108/cm2)寡核苷酸阵列。在1μm的特征大小下,所述阵列上的带条形码寡核苷酸可以将通过本文中所提供的方法获得的序列读段定位至基因组DNA的约2000bp区域。所述阵列的各斑点中的寡核苷酸可以包含相同条形码的序列,且不同的阵列斑点中的寡核苷酸可以包含不同条形码的序列。
为了生成具有所需取向(例如,5'端连接于阵列基底)的阵列的拷贝,可以采用面对面凝胶转移法。面对面凝胶转移法在翻转寡核苷酸取向的同时使得5'端被固定时可以显著降低单位制造成本,这可以具有如本文中所描述的测定法优点。此外,全长寡核苷酸的选择性转移和全长寡核苷酸的随后扩增可以允许寡核苷酸阵列含有非常长的寡核苷酸(50+碱基)而不受低产率或如本文中所描述的部分长度产物困扰。转移可以包括生成与模板寡核苷酸序列互补的核酸序列。转移过程可以通过在表面之间进行阵列组分的酶促复制或非酶促物理转移而发生。转移可以包括制造已经与受者/转移阵列连接的互补序列。例如,与受者/转移阵列结合的引物与模板阵列上的接头互补,并且可以使用模板阵列序列作为模板加以延伸,从而生成全长或部分长度转移阵列。转移可以包括由模板阵列制造互补序列,随后连接所述互补序列与转移阵列。
转移可以保留核酸相对于其偶联阵列表面的取向(例如,模板核酸的3'端与模板阵列结合,且转移的核酸互补序列的3'端与转移阵列结合)。转移可以逆转核酸相对于其偶联阵列表面的取向(例如,模板核酸的3'端与模板阵列结合,且转移的核酸互补序列的5'端与转移阵列结合)。
在一些情况下,本文中所描述的阵列转移方法可用于生成转移或受者阵列,所述阵列中有增加或富集的量或百分比的寡核苷酸与转移或受者阵列表面偶联,所述寡核苷酸具有用作转移程序的模板的阵列(即,模板阵列)上的相应寡核苷酸的100%长度(即,相同或同一长度)。转移程序可以是如本文中所提供的面对面酶促转移。面对面酶促转移法还可以称为边合成边酶促转移或ETS。阵列转移可以产生转移或受者阵列,所述阵列所包含的至少、至多、多于、少于或大约30%、40%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或99.9%转移寡核苷酸具有用于生成所述转移或受者阵列的模板阵列上的相应寡核苷酸的相同或同一或100%长度。具有模板寡核苷酸的100%长度(即,相同或同一长度)的转移寡核苷酸可以称为全长产物(例如,全长产物寡核苷酸)。通过本领域中已知的方法(例如,点样或原位合成)制造的模板阵列可以包含约20%具有所需长度的寡核苷酸(即,全长寡核苷酸)和约80%不具有所需长度的寡核苷酸(即,部分长度寡核苷酸)。使用如本文中所提供的阵列转移方法对通过本领域中已知的方法生成的包含约20%全长寡核苷酸和约80%部分长度寡核苷酸的阵列进行转移可以生成包含至多约20%全长产物寡核苷酸的转移或受者阵列。包含与模板阵列上的全长寡核苷酸的未结合端上的序列互补的引物的转移阵列可以用来进行转移。包含约20%全长寡核苷酸和约80%部分长度寡核苷酸的模板阵列上的许多或所有部分长度产物缺乏如本文中所提供的阵列转移中所使用的序列的未结合端部分,且因此不能被转移。在一些情况下,根据本文中的方法制造的阵列中有较大百分比的具有所需长度的寡核苷酸(即,全长寡核苷酸),使得与本领域中已知的制造和转移方法相比,使用本文中所提供的阵列转移方法(即,ETS)对根据本文中的方法制造的阵列进行转移产生了具有较高百分比的全长产物寡核苷酸的转移或受者阵列。使用本文中所提供的方法制造的阵列(例如,模板阵列)上的全长寡核苷酸可以是大约、至多或至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个碱基长。使用本文中所提供的阵列转移方法(即,ETS)加以转移的转移或受者阵列上的全长产物寡核苷酸可以是大约、至多或至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个碱基长。
如本文中所提供的阵列转移可以进行多次。在一些情况下,模板阵列(例如,寡核苷酸阵列)经历阵列转移方法多次。模板阵列可以经历阵列转移方法至少、至多、多于、少于或大约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、600、700、800、900或1000次。阵列转移方法可以是如本文中所提供的面对面酶促转移方法。可以使用相同模板阵列由多次阵列转移生成多个转移或受者阵列。使用如本文中所提供的阵列转移方法由单个模板阵列生成的各转移或受者阵列可以与所述模板阵列和/或由所述模板阵列生成的各其他转移或受者阵列至少、至多、多于、少于或大约30%、40%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或99.9%同一。可以在一系列转移中使用一次阵列转移的转移阵列作为随后转移的模板阵列进行多次阵列转移。例如,第一次转移可以从寡核苷酸在其3'端与阵列结合的模板阵列进行至互补寡核苷酸在其5'端与阵列结合的第一转移阵列,且第二次转移可以从所述第一转移阵列(现在充当模板阵列)进行至第二转移阵列。在一些情况下,如本文中所提供的一系列阵列转移反应中的各渐次转移或受者阵列生成了具有富集的百分比的全长产物寡核苷酸(即,具有模板寡核苷酸的100%长度的转移寡核苷酸)和与原始模板阵列相匹配的序列的受者或转移阵列。
在一些情况下,可以通过使用模板寡核苷酸阵列上的寡核苷酸上的接头序列来辅助阵列转移。寡核苷酸可以包括添加有一个或多个接头序列的所需最终序列。所述一个或多个接头序列可以处在模板阵列上的寡核苷酸的5'或3'端上。在一些情况下,所述一个或多个接头序列处在模板阵列上的寡核苷酸的3'端上。在一些情况下,所述一个或多个接头序列处在模板阵列上的寡核苷酸的5'端上。受者/转移阵列上的引物可以与接头序列互补,从而允许引物与模板阵列上的寡核苷酸之间发生杂交(经由与接头序列的全部或一部分杂交)。这样的杂交可以有助于从一个阵列转移至另一个。可以在转移之后从转移阵列寡核苷酸中去除一些或所有接头序列,例如,通过酶促裂解、消化或限制。
在一些情况下,可以通过阵列或阵列上的表面涂层的挠性或变形性来辅助阵列转移。例如,包括偶联有寡核苷酸的聚丙烯酰胺凝胶涂层的阵列可以用于阵列转移。凝胶涂层的变形性可以允许阵列组分彼此接触而不管表面粗糙度。与不包括聚丙烯酰胺凝胶的阵列相比,所述变形性可以允许酶促阵列转移方法(例如,如本文中所提供的ETS)中所需的酶与反应组分发生更有效接触。与不包括聚丙烯酰胺凝胶的阵列相比,所述更有效接触可以允许更高次数的酶促转移。所述更有效接触可以允许生成更高百分比的包括具有阵列转移方法中所使用的模板阵列上的寡核苷酸的100%长度的寡核苷酸的转移或受者阵列。
可以通过酶促反应来扩增或再生阵列组分。例如,可以经由在阵列组分上的接头序列与表面结合的寡核苷酸引物之间进行杂交,随后进行酶促延伸或扩增来对阵列组分寡核苷酸进行桥式扩增。扩增可用于恢复损失的阵列组分密度或使阵列组分密度增加至超过其原始密度。
可以制备模板核酸分子以便在通过如本文中所提供的方法而产生的条形码寡核苷酸阵列上进行拉伸。可以处理模板核酸分子以并入与条形码寡核苷酸阵列上的寡核苷酸中所存在的那些序列互补的序列。实例方法示于图1和图2中。可以提供欲测序的模板核酸分子101、201。可以通过转座子插入102或通过与游离引物杂交202将通用引物结合位点并入模板核酸分子中。可以拉伸模板核酸分子103、203。核酸拉伸可以使用如本文中所提供的方法来进行。可以提供具有位置编码条形码的引物/寡核苷酸阵列和与引物结合位点杂交的接头104、204。可以使拉伸过的模板核酸分子与引物/寡核苷酸阵列接触105、205。可以利用引物进行延伸反应,从而生成包含与模板核酸分子的区段互补的序列的位置编码延伸产物106、206和条形码,使得与指定模板核酸区段相关联的条形码对应于其所接触的阵列斑点。
拉伸过的核酸分子可用于生成测序库,然后可以借助于如图1和图2中所示的位置条形码进行测序。在一些情况下,在使用本文中所提供的方法生成的条形码寡核苷酸阵列表面上(例如,30至40倍二倍体基因组覆盖率)拉伸多个模板核酸分子(例如DNA)。阵列表面上的寡核苷酸可以引导拉伸过的核酸分子(例如DNA),然后这可以充当模板以用于生成下一代测序(NGS)库(如图3中所示)。然后可以使用如本文中所描述的任何NGS平台或任何其他合适的序列读出技术(例如Illumina HiSeq)对NGS库进行测序。因为用于生成测序库的寡核苷酸带有条形码,所以获得了关于装配短NGS读段的位置信息。使用条形码,可以将短读段连接至对应于得到它们的拉伸过的DNA分子的长线中。所述长线可以允许从头装配、核苷酸变体检测、结构变体检测和从二倍体样品中拆分单倍型。所述长线可以具有大于或大约500、550、600、650、700、750、800、850、900、950、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500或10,000个碱基。
本文中所提供的方法尤其可用于测定长核酸分子,例如具有多于100,000个碱基的核酸分子的序列。这些方法还可用于对具有插入、缺失、转座、重复区域、端粒、SNP、癌细胞基因组、病毒细胞基因组和甲氧西林抗性区域(mec区域)的核酸分子或其区域进行测序。由条形码序列传达的位置信息可用于装配或比对来自至少100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500或10,000个模板核酸片段或延伸产物的核酸分子读段。
核酸和其来源
除非另外指示,否则如本文中所提到的“核酸分子”或“核酸”可以是脱氧核糖核酸(DNA)或核糖核酸(RNA),包括已知的类似物或其组合。本文中欲测序的核酸分子可以获自任何核酸来源。所述核酸分子可以是单股或双股的。在一些情况下,所述核酸分子是DNA。所述DNA可以使用本领域中的标准技术来获得和纯化,且包括呈纯化或未纯化形式的DNA。所述DNA可以是线粒体DNA、无细胞DNA、互补DNA(cDNA)或基因组DNA。在一些情况下,所述核酸分子是基因组DNA(gDNA)。所述DNA可以是质粒DNA、粘粒DNA、细菌人工染色体(BAC)或酵母人工染色体(YAC)。所述DNA可以来源于一个或多个染色体。例如,如果所述DNA来自于人类,则所述DNA可以来源于染色体1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、X或Y中的一个或多个。所述RNA可以使用本领域中的标准技术来获得和纯化,且包括呈纯化或未纯化形式的RNA,其包括但不限于mRNA、tRNA、snRNA、rRNA、反向病毒、小非编码RNA、mRNA、多核糖体RNA、前体mRNA、内含子RNA、病毒RNA、无细胞RNA和其片段。非编码RNA或ncRNA可以包括snoRNA、mRNA、siRNA、piRNA和长nc RNA。
用于本文中所描述的方法和组合物中的核酸的来源可以是包含所述核酸的样品。所述核酸可以从所述样品中分离,且通过本领域中已知的任何方法加以纯化,以便从所述样品中纯化所述核酸。所述样品可以来源于包含多核苷酸的非细胞实体(例如病毒)或来源于基于细胞的生物体(例如,古细菌、细菌或真核生物域的成员)。在一些情况下,所述样品是获自诸如门或工作台顶面之类的表面的拭子。
所述样品可以来自于受试者,例如植物、真菌、真细菌、古细菌、原生生物或动物。所述受试者可以是生物体,或是单细胞生物体或是多细胞生物体。所述受试者可以是培养的细胞,所述细胞尤其可以是原代细胞或来自确定细胞系的细胞。所述样品可以呈任何合适的形式从多细胞生物体中初步分离。所述动物可以是鱼,例如斑马鱼。所述动物可以是哺乳动物。所述哺乳动物可以是例如狗、猫、马、牛、小鼠、大鼠或猪。所述哺乳动物可以是灵长类动物,例如,人类、黑猩猩、猩猩或大猩猩。所述人类可以是男性或女性。所述样品可以来自于人类胚胎或人类胎儿。所述人类可以是婴儿、儿童、青少年、成人或老年人。所述女性可以是怀孕的、疑似怀孕的或计划怀孕的。在一些情况下,所述样品是来自受试者的单个或个别细胞,且所述多核苷酸来源于单个或个别细胞。在一些情况下,所述样品是个别微生物或微生物群体或微生物与宿主细胞或无细胞核酸的混合物。
所述样品可以来自于健康受试者(例如人类受试者)。在一些实施方案中,所述样品是取自妊娠至少4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或26周的受试者(例如,待产孕妇)。在一些情况下,所述受试者受遗传性疾病影响,是遗传性疾病的携带者,或处在发展或传下遗传性疾病的风险之下,其中所述遗传性疾病是可能与诸如突变、插入、添加、缺失、易位、点突变、三核苷酸重复病症和/或单核苷酸多态性(SNP)之类的基因变异相关的任何疾病。
所述样品可以来自于患有特定疾病、病症或病状,或疑似患有特定疾病、病症或病状(或处于风险之下)的受试者。例如,所述样品可以来自于癌症患者、疑似患有癌症的患者、或处于患有癌症之风险下的患者。所述癌症可以是例如急性成淋巴细胞性白血病(ALL)、急性髓性白血病(AML)、肾上腺皮质癌、卡波西肉瘤、肛门癌、基底细胞癌、胆管癌、膀胱癌、骨癌、骨肉瘤、恶性纤维组织细胞瘤、脑干胶质瘤、脑癌、颅咽管瘤、成室管膜细胞瘤、室管膜瘤、成髓细胞瘤、髓上皮瘤、松果体实质瘤、乳腺癌、支气管肿瘤、伯基特淋巴瘤、非何杰金淋巴瘤、类癌瘤肿瘤、宫颈癌、脊索瘤、慢性淋巴细胞白血病(CLL)、慢性骨髓性白血病(CML)、结肠癌、结直肠癌、皮肤T-细胞淋巴瘤、原位导管癌、子宫内膜癌、食道癌、尤因肉瘤、眼癌、眼内黑色素瘤、成视网膜细胞瘤、纤维性组织细胞瘤、胆囊癌、胃癌、胶质瘤、毛细胞白血病、头颈癌、心脏癌、肝细胞(肝)癌、霍奇金淋巴瘤、下咽癌、肾癌、喉癌、唇癌、口腔癌、肺癌、非小细胞癌、小细胞癌、黑色素瘤、口腔癌、骨髓发育不良综合征、多发性骨髓瘤、成髓细胞瘤、鼻腔癌、鼻窦癌、成神经细胞瘤、鼻咽癌、口腔癌、口咽癌、骨肉瘤、卵巢癌、胰腺癌、乳头状瘤病、副神经节瘤、副甲状腺癌、阴茎癌、咽癌、垂体肿瘤、浆细胞赘生物、前列腺癌、直肠癌、肾细胞癌、横纹肌肉瘤、唾液腺癌、西泽里综合征、皮肤癌、非黑色素瘤、小肠癌、软组织肉瘤、鳞状细胞癌、睾丸癌、喉癌、胸腺瘤、甲状腺癌、尿道癌、子宫癌、子宫肉瘤、阴道癌、外阴癌、瓦尔登斯特伦巨球蛋白血症或威尔姆氏肿瘤。所述样品可以来自于癌症患者的癌症和/或正常组织。
所述样品可以是房水、玻璃体液、胆汁、全血、血清、血浆、乳汁、脑脊液、耵聍、内淋巴、外淋巴、胃液、粘液、腹膜液、唾液、皮脂、精液、汗液、泪液、阴道分泌物、呕吐物、粪便或尿液。所述样品可以获自医院、实验室、临床或医学实验室。所述样品可以取自受试者。
所述样品是环境样品,包括诸如水、土壤、空气等介质。所述样品可以是司法样品(例如,毛发、血液、精液、唾液等)。所述样品可以包括生物恐怖袭击中所使用的试剂(例如流感、炭疽、天花)。
所述样品可以包括核酸。所述样品可以包括无细胞核酸。所述样品可以是细胞系、基因组DNA、无细胞血浆、福尔马林固定石蜡包埋(FFPE)样品或急骤冷冻样品。福尔马林固定石蜡包埋样品可以在提取核酸之前去除石蜡。所述样品可以来自于器官,例如心脏、皮肤、肝脏、肺、乳房、胃、胰脏、膀胱、结肠、胆囊、脑等。核酸可以通过本领域技术人员可利用的手段从样品中提取。
所述样品可以经过处理以使其胜任用于片段化、连接、变性、扩增、拉伸和/或测序或本文中所提供的任何方法。示例性样品加工可以包括溶解所述样品的细胞以释放核酸、纯化所述样品(例如,以分离核酸与可能抑制酶促反应的其他样品组分)、稀释/浓缩所述样品,和/或组合所述样品与用于进一步核酸处理的试剂。在一些实例中,所述样品可以与限制酶、逆转录酶或核酸处理的任何其他酶组合。
本文中所描述的方法可以用于对一个或多个靶核酸或多核苷酸进行测序。术语多核苷酸或语法等效物可以指共价连接在一起的至少两个核苷酸。本文中所描述的多核苷酸可以含有磷酸二酯键,但在一些情况下,如以下(例如在构建引物和诸如标记探针之类的探针时)所概述,包括可以具有替代骨架的核酸类似物,所述骨架包括例如磷酰胺(Beaucage等,Tetrahedron 49(10):1925(1993)和其中的参考文献;Letsinger,J.Org.Chem.35:3800(1970);Sprinzl等,Eur.J.Biochem.81:579(1977);Letsinger等,Nucl.Acids Res.14:3487(1986);Sawai等,Chem.Lett.805(1984);Letsinger等,J.Am.Chem.Soc.110:4470(1988);和Pauwels等,Chemica Scripta 26:141 91986))、硫代磷酸酯(Mag等,NucleicAcids Res.19:1437(1991);和美国专利No.5,644,048)、二硫代磷酸酯(Briu等,J.Am.Chem.Soc.111:2321(1989))、O-甲基亚磷酰胺键联(参见Eckstein,Oligonucleotides and Analogues:A Practical Approach,Oxford University Press)和肽核酸(本文中也称为“PNA”)骨架和键联(参见Egholm,J.Am.Chem.Soc.114:1895(1992);Meier等,Chem.Int.Ed.Engl.31:1008(1992);Nielsen,Nature,365:566(1993);Carlsson等,Nature 380:207(1996),所有文献都以引用的方式并入)。其他类似物核酸包括具有双环结构的那些,包括锁核酸(本文中也称为“LNA”),Koshkin等,J.Am.Chem.Soc.120.13252 3(1998);正骨架(Denpcy等,Proc.Natl.Acad.Sci.USA 92:6097(1995));非离子骨架(美国专利No.5,386,023、5,637,684、5,602,240、5,216,141和4,469,863;Kiedrowshi等,Angew.Chem.Intl.Ed.English 30:423(1991);Letsinger等,J.Am.Chem.Soc.110:4470(1988);Letsinger等,Nucleoside&Nucleotide 13:1597(1994);第2章和第3章,ASC Symposium Series 580,“Carbohydrate Modifications inAntisense Research”,Y.S.Sanghui和P.Dan Cook编;Mesmaeker等,Bioorganic&Medicinal Chem.Lett.4:395(1994);Jeffs等,J.Biomolecular NMR 34:17(1994);Tetrahedron Lett.37:743(1996))和非核糖骨架,包括美国专利No.5,235,033和5,034,506以及ASC Symposium Series 580,“Carbohydrate Modifications in AntisenseResearch”,Y.S.Sanghui和P.Dan Cook编的第6章和第7章所描述的那些。核酸的定义内还包括含有一个或多个碳环糖的核酸(参见Jenkins等,Chem.Soc.Rev.(1995)第169 176页)。Rawls,C&E News,1997年6月2日,第35页中描述了若干核酸类似物。核酸类似物的定义内还包括“锁核酸”。LNA是一类核酸类似物,其中通过连接2'-O原子与4'-C原子的亚甲基桥来“锁定”核糖环。所有这些参考文献明确以引用的方式并入在此。可以对核糖-磷酸骨架进行这些修饰以增加这样的分子在生理环境中的稳定性和半衰期。例如,PNA:DNA和LNA-DNA杂合体可以表现出更高的稳定性,且因此可以在一些情况下使用。如所说明,所述核酸可以是单股的或双股的,或者含有双股或单股序列两者的部分。取决于应用,所述核酸可以是DNA(包括例如基因组DNA、线粒体DNA和cDNA)、RNA(包括例如mRNA和rRNA)或杂合体,其中所述核酸含有脱氧核糖核苷酸与核糖核苷酸的任何组合,以及包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤、次黄嘌呤、异胞嘧啶、异鸟嘌呤等在内的碱基的任何组合。
如本文中所提到的“核酸分子”或“核酸”可以是“寡核苷酸”、“适配体”或“多核苷酸”。术语“寡核苷酸”可以指核苷酸链,典型地少于200个残基长,例如介于15与100个核苷酸之间长。所述寡核苷酸可以包含至少或大约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45或50个碱基。所述寡核苷酸可以具有约3至约5个碱基、约1至约50个碱基、约8至约12个碱基、约15至约25个碱基、约25至约35个碱基、约35至约45个碱基或约45至约55个碱基。所述寡核苷酸(也称为“oligo”)可以是任何类型的寡核苷酸(例如引物)。在一些情况下,所述寡核苷酸是5'-acrydite修饰的寡核苷酸。所述寡核苷酸可以与如本文中所提供的表面上的如本文中所提供的聚合物涂层偶联。所述寡核苷酸可以包含可裂解的键联。可裂解的键联可以是酶促可裂解的。寡核苷酸可以是单股或双股的。术语“引物”和“寡核苷酸引物”可以指能够与互补核苷酸序列杂交的寡核苷酸。术语“寡核苷酸”可以与术语“引物”、“接头”和“探针”互换使用。术语“多核苷酸”可以指典型地大于200个残基长的核苷酸链。多核苷酸可以是单股或双股的。
术语“杂交”和“退火”可以互换使用,并且可以指互补核酸的配对。
术语“引物”可以指一般具有游离3'羟基、能够与模板核酸或核酸分子(诸如靶多核苷酸、靶DNA、靶RNA或引物延伸产物)杂交而且还能够促进与模板互补的多核苷酸聚合的寡核苷酸。引物可以含有非杂交序列,所述序列构成所述引物的尾部。即使引物的序列未必与靶标完全互补,其也可能仍与所述靶标杂交。
引物可以是可用于通过聚合酶沿多核苷酸模板进行的延伸反应中,例如,诸如用于PCR或cDNA合成中的寡核苷酸。寡核苷酸引物可以是在其3'端含有能够与靶多核苷酸的序列杂交的序列的单股合成多核苷酸。正常情况下,与靶核酸杂交的引物的3'区域与序列或引物结合位点具有至少80%、90%、95%或100%互补性。
引物可以根据已知的参数加以设计,以避免二级结构和自我杂交。不同的引物对可以在大约相同的温度下进行退火和解链,例如,与另一个引物对相差约1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃或10℃以内。在一些情况下,最初使用大于约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、100、200、500、1000、5000、10,000个或更多个引物。这样的引物能够与本文中所描述的基因靶标杂交。在一些情况下,使用约2至约10,000个、约2至约5,000个、约2至约2,500个、约2至约1,000个、约2至约500个、约2至约100个、约2至约50个、约2至约20个、约2至约10个或约2至约6个引物。
引物可以通过多种方法来制备,包括但不限于适当序列的克隆和使用本领域中众所周知的方法的直接化学合成(Narang等,Methods Enzymol.68:90(1979);Brown等,Methods Enzymol.68:109(1979))。所述引物还可以获自商业来源,诸如Integrated DNATechnologies、Operon Technologies、Amersham Pharmacia Biotech、Sigma和LifeTechnologies。所述引物可以具有同一解链温度。引物的解链温度可以是大约、高于、低于或至少30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、81℃、82℃、83℃、84℃、或85℃。在一些情况下,所述引物的解链温度是约30℃至约85℃、约30℃至约80℃、约30℃至约75℃、约30℃至约70℃、约30℃至约65℃、约30℃至约60℃、约30℃至约55℃、约30℃至约50℃、约40℃至约85℃、约40℃至约80℃、约40℃至约75℃、约40℃至约70℃、约40℃至约65℃、约40℃至约60℃、约40℃至约55℃、约40℃至约50℃、约50℃至约85℃、约50℃至约80℃、约50℃至约75℃、约50℃至约70℃、约50℃至约65℃、约50℃至约60℃、约50℃至约55℃、约52℃至约60℃、约52℃至约58℃、约52℃至约56℃或约52℃至约54℃。
所述引物的长度可以在5'端或3'端延伸或缩短以产生具有所需解链温度的引物。引物对中的一个引物可以比另一个引物长。引物对内的引物的3'退火长度可以不同。还有,可以设计各引物对的退火位置,以使得所述引物对的序列和长度产生所需解链温度。用于确定小于25个碱基对的引物的解链温度的等式是华莱士规则(Td=2(A+T)+4(G+C))。还可以使用计算机程序来设计引物,包括但不限于阵列设计软件(Array Designer Software)(Arrayit Inc.)、用于遗传分析的寡核苷酸探针序列设计软件(Oligonucleotide ProbeSequence Design Software for Genetic Analysis)(Olympus Optical Co.)、NetPrimer和得自日立软件工程(Hitachi Software Engineering)的DNAsis。可以使用软件程序,诸如Net Primer(基于网络的免费程序,http://www.premierbiosoft.com/netprimer/index.html)来计算各引物的TM(解链或退火温度)。可以在任何扩增循环后重新计算并增加引物的退火温度,包括但不限于约1、2、3、4、5个循环、约6个循环至约10个循环、约10个循环至约15个循环、约15个循环至约20个循环、约20个循环至约25个循环、约25个至约30个循环、约30个至约35个循环或约35个循环至约40个循环。在初始扩增循环后,可以将引物的5'半部并入来自感兴趣的各基因座的产物中;因此可以基于各引物的5'半部和3'半部的序列重新计算TM
引物的退火温度可以在任何扩增循环后重新计算并增加引物的退火温度,包括但不限于约1、2、3、4、5个循环、约6个循环至约10个循环、约10个循环至约15个循环、约15个循环至约20个循环、约20个循环至约25个循环、约25个至约30个循环、约30个至约35个循环或约35个循环至约40个循环。在初始扩增循环后,可以将引物的5'半部并入来自感兴趣的各基因座的产物中,因此可以基于各引物的5'半部和3'半部的序列重新计算TM
“互补的”可以指与序列(例如模板核酸)的全部或仅一部分的互补性。特定寡核苷酸引物的可杂交序列中的核苷酸数应该使得用于使寡核苷酸引物杂交的严格度条件将阻止过度随机非特异性杂交。通常,寡核苷酸引物的杂交部分中的核苷酸数将至少跟与寡核苷酸引物杂交的靶多核苷酸上的限定序列(例如,模板核酸)同样大,即,至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少约20个且一般约6个至约10个或6个至约12个或12个至约200个核苷酸,通常约10个至约50个核苷酸。靶多核苷酸可以大于寡核苷酸引物或如先前所描述的引物。
如本文中所使用的术语“约”是指指定量+/-10%、9%、8%、7%、6%、5%、4%、3%、2%或1%。
如本文中所使用的术语“较长DNA”、“长DNA”、“较长核酸”“长核酸”可以包括大于、至少或大约100、200、300、400、500、600、700、800、900kb,或者大于、至少或大约1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9、3.0、3.1、3.2、3.3、3.4、3.5、3.6、3.7、3.8、3.9、4.0、4.1、4.2、4.3、4.4、4.5、4.6、4.7、4.8、4.9、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100Mb的核酸(例如DNA)。长核酸的上限可以包括例如100、90、80、70、60、50、40、30、20、10、9、8、7、6、5或4.5Mb。长核酸可以介于100kb至4.6Mb的范围内。长核酸可以介于100kb至10Mb的范围内。在一些情况下,长核酸可以介于100kb至20Mb的范围内。长核酸可以介于100kb至30Mb的范围内。长核酸可以介于100kb至40Mb的范围内。长核酸可以介于100kb至50Mb的范围内。在一些情况下,大核酸由生物体(例如大肠杆菌)的整个基因组组成。应该理解,本文中所提供的方法、组合物、系统和试剂盒不限于DNA,而是可以包括如本文中所描述的其他核酸分子,并且可以使用与以下所描述相同的方法加以测序。
在一些情况下,提供了一组条形码。术语“条形码”可以指允许鉴定与所述条形码相关联的核酸(例如寡核苷酸)的一些特征的已知核酸序列。在一些情况下,欲鉴定的核酸特征是各核酸(例如寡核苷酸)在阵列或芯片上的空间位置。可以设计条形码以获得精确序列性能,例如介于40%与60%之间的GC含量、无均聚物序列长度大于2、无自互补拉伸段长度大于3和由人类基因组参考物中不存在的序列构成。条形码序列可以是至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个碱基。条形码序列可以是至多5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个碱基。条形码序列可以是大约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个碱基。寡核苷酸(例如,引物或接头)可以包含大约、多于、少于或至少1、2、3、4、5、6、7、8、9或10个不同的条形码。条形码可以具有足够的长度且包括可以足够不同从而允许基于与各核酸相关联的条形码来鉴别各核酸(例如寡核苷酸)的空间位置的序列。在一些情况下,各条形码是例如远离阵列中的任何其他条形码的四个缺失或插入或取代。所述带条形码的寡核苷酸阵列的各阵列斑点中的寡核苷酸可以包含相同的条形码序列,且不同的阵列斑点中的寡核苷酸可以包含不同的条形码序列。一个阵列斑点中所使用的条形码序列可以不同于任何其他阵列斑点中的条形码序列。替代地,一个阵列斑点中所使用的条形码序列可以与另一个阵列斑点中所使用的条形码序列相同,只要所述两个阵列斑点不相邻即可。对应于特定阵列斑点的条形码序列可以从所述阵列的控制合成中获知。替代地,对应于特定阵列斑点的条形码序列可以通过对来自特定阵列斑点的材料进行检索和测序而获知。例如,设计了含有150万个18碱基条形码的条形码候选组。
用于本文中所提供的方法和组合物中的RNA依赖性DNA聚合酶能够根据本文中所提供的方法实现引物的延伸。相应地,RNA依赖性DNA聚合酶可以是能够沿至少主要包含核糖核苷酸的核酸模板来延伸核酸引物的DNA聚合酶。用于本文中所提供的方法、组合物和试剂盒中的合适的RNA依赖性DNA聚合酶包括逆转录酶(RT)。RT在本领域中是众所周知的。RT的实例包括但不限于莫洛尼鼠类白血病病毒(M-MLV)逆转录酶、人类免疫缺陷病毒(HIV)逆转录酶、劳氏肉瘤病毒(RSV)逆转录酶、禽类成髓细胞白血病病毒(AMV)逆转录酶、劳氏相关病毒(RAV)逆转录酶和成髓细胞性白血病相关病毒(MAV)逆转录酶或其他禽类肉瘤-白血病病毒(ASLV)逆转录酶和由其衍生的经修饰RT。参见例如US7056716。许多逆转录酶,诸如得自禽类成髓细胞白血病病毒(AMV-RT)和莫洛尼鼠类白血病病毒(MMLV-RT)的那些,包括多于一种活性(例如,聚合酶活性和核糖核酸酶活性),并且可以在双股cDNA分子的形成中发挥功能。然而,在一些情况下,优选使用缺乏或具有实质上降低的RNA酶H活性的RT。缺乏RNA酶H活性的RT在本领域中是已知的,包括包含野生型逆转录酶突变的那些,其中所述突变会消除RNA酶H活性。具有降低的RNA酶H活性的RT的实例描述于US20100203597中。在这些情况下,添加来自其他来源的RNA酶H,诸如从大肠杆菌分离的那些,可以用于降解起始RNA样品和形成双股cDNA。还可以涵盖RT的组合,包括不同的非突变RT的组合、不同的突变RT的组合和一种或多种非突变RT与一种或多种突变RT的组合。
用于本文中所提供的方法和组合物中的DNA依赖性DNA聚合酶能够根据本文中所提供的方法实现引物的延伸。相应地,DNA依赖性DNA聚合酶可以是能够在RNA模板存在下或在选择性去除RNA模板之后沿第一股cDNA来延伸核酸引物的DNA聚合酶。适用于本文中所提供的方法的例示性DNA依赖性DNA聚合酶包括但不限于有或无3'-外切核酸酶的Klenow聚合酶、Bst DNA聚合酶、Bca聚合酶、.phi.29DNA聚合酶、Vent聚合酶、Deep Vent聚合酶、Taq聚合酶、T4聚合酶和大肠杆菌DNA聚合酶1、其衍生物或聚合酶混合物。在一些情况下,聚合酶不包括5'-外切核酸酶活性。在其他情况下,聚合酶包括5'外切核酸酶活性。在一些情况下,引物延伸可以使用包括强股置换活性的聚合酶(诸如例如Bst聚合酶)来进行。在其他情况下,引物延伸可以使用包括弱或无股置换活性的聚合酶来进行。本领域技术人员可以认识到在引物延伸步骤期间使用股置换活性的优点和缺点以及哪种聚合酶可能有望提供股置换活性(参见例如New England Biolabs Polymerases)。例如,股置换活性可用于在随机引导和延伸步骤期间确保整个转录组覆盖率。股置换活性可能进一步可用于在引导和延伸步骤期间生成双股扩增产物。替代地,包括弱或无股置换活性的聚合酶可用于在引物杂交和延伸期间生成可与模板核酸杂交的单股核酸产物。
在一些情况下,可以对通过本文中所描述的方法生成的任何双股产物进行末端修复以产生平端,从而用于本文中所描述的接头连接应用。在双股产物上生成平端可以通过使用单股特异性DNA外切核酸酶,诸如例如外切核酸酶1、外切核酸酶7或其组合来降解双股产物的突出单股末端来生成。替代地,通过本文中所提供的方法生成的任何双股产物都可以通过使用单股特异性DNA内切核酸酶,例如但不限于绿豆内切核酸酶或S1内切核酸酶来进行平端化。替代地,通过本文中所提供的方法生成的任何双股产物都可以通过使用包含单股外切核酸酶活性的聚合酶(诸如例如T4DNA聚合酶)、含有单股外切核酸酶活性的任何其他聚合酶或其组合来降解双股产物的突出单股末端而进行平端化。在一些情况下,包含单股外切核酸酶活性的聚合酶可以在包含或不包含一种或多种dNTP的反应混合物中进行孵育。在其他情况下,可以使用单股核酸特异性外切核酸酶与一种或多种聚合酶的组合来对引物延伸反应的双股产物进行平端化。在其他情况下,可以通过填充双股产物的突出单股末端而对延伸反应的产物进行平端化。例如,片段可以在一种或多种dNTP的存在下与聚合酶诸如T4DNA聚合酶或Klenow聚合酶或其组合一起孵育以填充双股产物的单股部分。替代地,通过本文中所提供的方法生成的任何双股产物都可以通过使用外切核酸酶和/或聚合酶的单股突出降解反应与在一种或多种dNTP的存在下使用一种或多种聚合酶的填充反应的组合而变平。
在另一个实施方案中,本文中所描述的接头连接应用可以在接头的非连接股与双股产物的股之间留出间隙。在这些情况下,间隙修复或填充反应可以用于给双股产物附加与接头的连接股互补的序列。间隙修复可以用本文中所描述的诸多DNA依赖性DNA聚合酶来进行。在一些情况下,间隙修复可以用具有股置换活性的DNA依赖性DNA聚合酶来进行。在一些情况下,间隙修复可以使用具有弱或无股置换活性的DNA依赖性DNA聚合酶来进行。在一些情况下,接头的连接股可以充当间隙修复或填充反应的模板。在一些情况下,间隙修复可以使用Taq DNA聚合酶来进行。
各种连接方法和试剂在本领域中是已知的并且可用于进行本文中所提供的方法。例如,可以采用平式连接。类似地,单个dA核苷酸可以通过缺乏3'-外切核酸酶活性的聚合酶添加至双股DNA产物的3'-端,并且与包含dT突出的接头退火(或相反)。这种设计允许随后连接已杂交的组分(例如,通过T4DNA连接酶)。其他连接策略和相应的试剂在本领域中是已知的,并且用于进行有效连接反应的试剂盒和试剂市售可得(例如,来自New EnglandBiolabs,Roche)。
如本文中所使用的术语“接合”、“附加”和“连接”就诸如茎-环接头/引物寡核苷酸和靶多核苷酸之类的两个多核苷酸而言是指共价连接两个单独的多核苷酸以产生具有连续骨架的单个更大多核苷酸。用于接合两个多核苷酸的方法在本领域中是已知的,且包括但不限于酶促和非酶促(例如化学)方法。非酶促连接反应的实例包括美国专利No.5,780,613和5,476,930中所描述的非酶促连接技术,这些专利以引用的方式并入本文。在一些实施方案中,通过连接酶例如DNA连接酶或RNA连接酶使接头寡核苷酸与靶多核苷酸接合。各自具有表征的反应条件的多种连接酶在本领域中是已知的,且包括但不限于:NAD+依赖性连接酶,包括tRNA连接酶、Taq DNA连接酶、丝状栖热菌(Thermus filiformis)DNA连接酶、大肠杆菌DNA连接酶、Tth DNA连接酶、水管致黑栖热菌(Thermus scotoductus)DNA连接酶(I和II)、热稳定连接酶、Ampligase热稳定DNA连接酶、VanC型连接酶、9°N DNA连接酶、TspDNA连接酶和通过生物勘探发现的新颖连接酶;ATP依赖性连接酶,包括T4RNA连接酶、T4DNA连接酶、T3DNA连接酶、T7DNA连接酶、Pfu DNA连接酶、DNA连接酶1、DNA连接酶III、DNA连接酶IV和通过生物勘探发现的新颖连接酶;以及其野生型、突变同种型和基因工程变体。连接可以在具有诸如互补突出之类的可杂交序列的多核苷酸之间发生。连接还可以在两个平端之间发生。一般来说,在连接反应中利用5'磷酸。5'磷酸可以由靶多核苷酸、接头寡核苷酸或二者一起提供。5'磷酸可根据需要添加至欲接合的多核苷酸,或从中去除。用于添加或去除5'磷酸的方法在本领域中是已知的,且包括但不限于酶促和化学方法。可用于添加和/或去除5'磷酸的酶包括激酶、磷酸酶和聚合酶。
可以使用连接位置条形码信息与拉伸过的DNA分子或延伸产物的其他方法。例如,可以用限制酶或其他完全或部分片段化方法对拉伸过的DNA进行消化,且所产生的完全或部分片段化产物可以经由连接、使用酶促或化学方法的延伸而与位置条形码寡核苷酸连接。
扩增方法
本文中所描述的方法、组合物和试剂盒可用于生成扩增就绪产品以用于下游应用,诸如大规模平行测序(即,下一代测序方法)或杂交平台。扩增方法在本领域中是众所周知的。可以使用的PCR技术的实例包括但不限于定量PCR、定量荧光PCR(QF-PCR)、多路荧光PCR(MF-PCR)、实时PCR(RT-PCR)、单细胞PCR、限制性片段长度多态性PCR(PCR-RFLP)、PCR-RFLP/RT-PCR-RFLP、热启动PCR、巢式PCR、原位聚合酶群落PCR、原位滚环扩增(RCA)、桥式PCR、皮量滴定PCR、数字PCR、微滴式数字PCR和乳液PCR。其他合适的扩增方法包括连接酶链反应(LCR)、转录扩增、分子倒置探针(MIP)PCR、自维持序列复制、选择性扩增靶多核苷酸序列、共有序列引物聚合酶链反应(CP-PCR)、任意引物聚合酶链反应(AP-PCR)、简并寡核苷酸引物PCR(DOP-PCR)和基于核酸的序列扩增(NABSA)、单引物等温扩增(SPIA,参见例如美国专利No.6,251,639)、Ribo-SPIA或其组合。本文中可以使用的其他扩增方法包括美国专利No.5,242,794、5,494,810、4,988,617和6,582,938中所描述的那些。靶核酸是扩增可以在珠粒上发生。在其他实施方案中,扩增不发生在珠粒上。扩增可以通过等温扩增,例如等温线性扩增。可以进行热启动PCR,其中在加入聚合酶之前将反应物加热至95℃后维持两分钟,或可以使聚合酶保持无活性状态直至循环1中的第一加热步骤。热启动PCR可以用来减少非特异性扩增。扩增的其他策略和方面描述于2010年7月8日公开的美国专利申请公开No.2010/0173394A1中,该公开以引用的方式并入本文中。在一些情况下,所述扩增方法可以在限制性条件下进行,从而仅进行数轮扩增(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30等),诸如例如通常对于cDNA生成所进行的。扩增轮数可以是约1-30、1-20、1-15、1-10、5-30、10-30、15-30、20-30、10-30、15-30、20-30或25-30。
用于扩增靶标和参考序列的技术在本领域中是已知的,且包括美国专利No.7,048,481中所描述的方法。简而言之,所述技术可以包括将样品分成微滴的方法和组合物,在一些情况下,其中各微滴平均含有少于约5、4、3、2或1个靶核酸分子(多核苷酸)/微滴,扩增各微滴中的核酸序列且检测靶核酸序列的存在。在一些情况下,所扩增的序列存在于基因组DNA的探针,而不是基因组DNA本身上。在一些情况下,至少200、175、150、125、100、90、80、70、60、50、40、30、20、10或0个微滴具有靶核酸的零拷贝。
PCR可以涉及基于变性、寡核苷酸引物退火和通过嗜热模板依赖性多核苷酸聚合酶实现的引物延伸的重复循环的体外扩增程序,这可以导致侧接所述引物的多核苷酸分析物的所需序列的拷贝的指数式增长。在一些情况下,可以定位与DNA的相反股退火的两个不同的PCR引物,以使得一个引物的聚合酶催化延伸产物可以充当另一个的模板链,从而导致离散双股片段的累积,该片段的长度由寡核苷酸引物的5'端之间的距离来限定。
LCR使用连接酶来接合预先形成的核酸探针对。所述探针可以与核酸分析物的各互补链(如果存在的话)杂交,并且可以采用连接酶将各对探针结合在一起,从而产生可在下一循环中用来重复特定核酸序列的两个模板。
SDA(Westin等,2000,Nature Biotechnology,18,199-202;Walker等,1992,Nucleic Acids Research,20,7,1691-1696)可能涉及基于诸如HincII或BsoBI之类的限制性内切核酸酶使其识别位点的半硫代磷酸形式的未修饰股产生切口的能力,以及诸如Klenow无外切核酸酶聚合酶或Bst聚合酶之类的外切核酸酶缺乏型DNA聚合酶在切口处延伸3'端且置换下游DNA股的能力的等温扩增。指数式扩增由偶联有义反应与反义反应而获得,其中从有义反应中置换的股充当反义反应的靶标,反之亦然。
在一些情况下,所述扩增为指数式的,例如在通过聚合酶链反应(PCR)对DNA的特定双股序列进行的酶促扩增中。
制备表面以用于生成寡核苷酸阵列
本发明中提供的方法和组合物可以包括制备表面以用于生成阵列。在一些情况下,所述阵列是寡核苷酸的阵列(寡核苷酸阵列或oligo阵列)。所述表面的制备可以包括在所述表面上建立聚合物涂层。所述表面可以包括玻璃、二氧化硅、氧化钛、氧化铝、氧化铟锡(ITO)、硅、聚二甲基硅氧烷(PDMS)、聚苯乙烯、多环烯烃、聚甲基丙烯酸甲酯(PMMA)、环状烯烃共聚物(COC)、其他塑料、钛、金、其他金属或其他合适的材料。所述表面可以是平坦的或圆形的、连续的或不连续的、平滑的或粗糙的。表面的实例包括流动槽、测序流动槽、流动通道、微流通道、毛细管、压电表面、孔、微孔、微孔阵列、微阵列、芯片、晶片、非磁性珠粒、磁性珠粒、铁磁珠粒、顺磁珠粒、超顺磁珠粒和聚合物凝胶。
引发剂物质连接
在一些情况下,制备如本文中所描述的表面以用于生成如本文中所提供的寡核苷酸阵列包括使引发剂物质与所述表面键合。在一些情况下,所述引发剂物质包含至少一种有机硅烷。在一些情况下,所述引发剂物质包含一个或多个表面键合基团。在一些情况下,所述引发剂物质包含至少一种有机硅烷,且所述至少一种有机硅烷包含一个或多个表面键合基团。所述有机硅烷可以包含一个表面键合基团,从而产生单足结构。所述有机硅烷可以包含两个表面键合基团,从而产生双足结构。所述有机硅烷可以包含三个表面键合基团,从而产生三足结构。所述表面键合基团可以包含MeO3Si、(MeO)3Si、(EtO)3Si、(AcO)3Si、(Me2N)3Si和/或(HO)3Si。在一些情况下,所述表面键合基团包含MeO3Si(参见例如图42中的4200)。在一些情况下,所述表面键合基团包含(MeO)3Si。在一些情况下,所述表面键合基团包含(EtO)3Si。在一些情况下,所述表面键合基团包含(AcO)3Si。在一些情况下,所述表面键合基团包含(Me2N)3Si。在一些情况下,所述表面键合基团包含(HO)3Si。在一些情况下,所述有机硅烷包含多表面键合基团。所述多表面键合基团可以是相同的,或可以是不同的。所述有机硅烷可以包含图42中所示的硅烷试剂。在一些情况下,所述引发剂物质包含至少一种有机膦酸,其中所述表面键合基团包含(HO)2P(=O)。所述有机膦酸可以包含一个表面键合基团,从而产生单足结构。所述有机膦酸可以包含两个表面键合基团,从而产生双足结构。所述有机膦酸可以包含三个表面键合基团,从而产生三足结构。
表面引发聚合(SIP)
在一些情况下,如本文中所提供的表面包含如本文中所提供的表面结合的引发剂物质,以用于生成包括表面涂层或官能化的寡核苷酸阵列。所述表面涂层或官能化可以是疏水性或亲水性的。所述表面涂层可以包含聚合物涂层或聚合物刷,诸如聚丙烯酰胺或改性聚丙烯酰胺。所述表面涂层可以包含凝胶,诸如聚丙烯酰胺凝胶或改性聚丙烯酰胺凝胶。所述表面涂层可以包含金属,诸如图案化电极或电路。所述表面涂层或官能化可以包含结合剂,诸如链霉亲和素、亲和素、抗体、抗体片段或适配体。所述表面涂层或官能化可以包含多种要素,例如聚合物或凝胶涂层和结合剂。在一些情况下,制备如本文中所描述的表面以用于生成如本文中所提供的寡核苷酸阵列包括在表面结合的引发剂物质上形成聚合物涂层。所述表面结合的引发剂物质可以是本领域中已知的任何表面结合的引发剂物质。在一些情况下,所述表面结合的引发剂物质包含如本文中所提供的有机硅烷。所述有机硅烷可以包含一个或多个如本文中所描述的表面键合基团。在一些情况下,所述有机硅烷包含至少两个表面键合基团。存在两个或更多个表面键合基团可以用于增加引发剂物质-聚合物涂层复合物的稳定性。所述一个或多个表面键合基团可以是如本文中所提供的任何表面键合基团。所产生的聚合物涂层可以包含直链。所产生的聚合物涂层可以包含支链。所述支链可以是轻度分支的。轻度分支链可以包含少于或大约1、2、3、4、5、6、7、8、9或10个分支。所述聚合物涂层可以形成聚合物刷薄膜。所述聚合物涂层可以包括一定程度的交联。所述聚合物涂层可以形成接枝结构。所述聚合物涂层可以形成网状结构。所述聚合物涂层可以形成分支结构。所述聚合物可以包含均匀聚合物。所述聚合物可以包含嵌段共聚物。所述聚合物可以包含梯度共聚物。所述聚合物可以包含周期共聚物。所述聚合物可以包含统计共聚物。
在一些情况下,所述表面结合的引发剂物质上所形成的聚合物涂层包含聚丙烯酰胺(PA)。所述聚合物可以包含聚甲基丙烯酸甲酯(PMMA)。所述聚合物可以包含聚苯乙烯(PS)。所述聚合物可以包含聚乙二醇(PEG)。所述聚合物可以包含聚丙烯腈(PAN)。所述聚合物可以包含聚(苯乙烯-r-丙烯腈)(PSAN)。所述聚合物可以包含单一类型的聚合物。所述聚合物可以包含多种类型的聚合物。所述聚合物可以包含如Ayres,N.(2010).Polymerbrushes:Applications in biomaterials and nanotechnology Polymer Chemistry,1(6),769-777中所描述的聚合物,或如Barbey,R.,Lavanant,L.,Paripovic,D.,Schüwer,N.,Sugnaux,C.,Tugulu,S.,&Klok,H.A.(2009)Polymer brushes via surface-initiatedcontrolled radical polymerization:synthesis,characterization,properties,andapplications.Chemical reviews,109(11),5437-5527中所描述的聚合物,各文献的公开内容以全文引用的方式并入本文中。
表面结合的引发剂物质上的聚合物涂层的聚合可以包括用于控制聚合物链长度、涂布均匀性或其他性质的方法。所述聚合可以包括控制自由基聚合(CRP)、原子转移自由基聚合(ATRP)或可逆加成断裂链-转移(RAFT)。所述聚合可以包括如Ayres,N.(2010).Polymer brushes:Applications in biomaterials and nanotechnology PolymerChemistry,1(6),769-777中所描述或如Barbey,R.,Lavanant,L.,Paripovic,D.,Schüwer,N.,Sugnaux,C.,Tugulu,S.,&Klok,H.A.(2009)Polymer brushes via surface-initiatedcontrolled radical polymerization:synthesis,characterization,properties,andapplications.Chemical reviews,109(11),5437-5527中所描述的活性聚合方法,各文献的公开内容以全文引用的方式并入本文中。
如本文中所提供的表面结合的引发剂物质上所形成的聚合物涂层可以在所述聚合物涂层的整个面积上具有均匀的厚度。如本文中所提供的表面结合的引发剂物质上所形成的聚合物涂层可以在所述聚合物涂层的面积上具有变化的厚度。所述聚合物涂层可以是至少1μm、2μm、3μm、4μm、5μm、7μm、8μm、9μm、10μm、15μm、20μm、25μm、30μm、40μm厚。所述聚合物涂层可以是至少50μm厚。所述聚合物涂层可以是至少75μm厚。所述聚合物涂层可以是至少100μm厚。所述聚合物涂层可以是至少150μm厚。所述聚合物涂层可以是至少200μm厚。所述聚合物涂层可以是至少300μm厚。所述聚合物涂层可以是至少400μm厚。所述聚合物涂层可以是至少500μm厚。所述聚合物涂层可以介于约1μm与约10μm之间厚。所述聚合物涂层可以介于约5μm与约15μm之间厚。所述聚合物涂层可以介于约10μm与约20μm之间厚。所述聚合物涂层可以介于约30μm与约50μm之间厚。所述聚合物涂层可以介于约10μm与约50μm之间厚。所述聚合物涂层可以介于约10μm与约100μm之间厚。所述聚合物涂层可以介于约50μm与约100μm之间厚。所述聚合物涂层可以介于约50μm与约200μm之间厚。所述聚合物涂层可以介于约100μm与约30μm之间厚。所述聚合物涂层可以介于约100μm与约500μm之间厚。
聚合物涂层的物理化学特征的修饰
在一些情况下,本文中的聚合物涂层的生理化学性质经过改性。所述改性可以通过在聚合过程期间并入改性丙烯酰胺单体来实现。在一些情况下,在聚合过程期间并入乙氧基化丙烯酰胺单体。所述乙氧基化丙烯酰胺单体可以包含CH2=CH-CO-NH(-CH2-CH2-O-)nH形式的单体。所述乙氧基化丙烯酰胺单体可以包含羟乙基丙烯酰胺单体。所述乙氧基化丙烯酰胺单体可以包含乙二醇丙烯酰胺单体。所述乙氧基化丙烯酰胺单体可以包含甲基丙烯酸羟乙酯(HEMA)。乙氧基化丙烯酰胺单体的并入可以产生更具疏水性的聚丙烯酰胺表面涂层。在一些情况下,在聚合过程期间并入磷酸胆碱丙烯酰胺单体。所述磷酸胆碱丙烯酰胺单体可以包含具有图43中所示的结构的单体。所述磷酸胆碱丙烯酰胺单体可以包含其他磷酸胆碱丙烯酰胺单体。在一些情况下,在聚合过程期间并入甜菜碱丙烯酰胺单体。所述甜菜碱丙烯酰胺单体可以包含具有图44中所示的结构的单体。所述甜菜碱丙烯酰胺单体可以包含其他甜菜碱丙烯酰胺单体。
在所制备的表面上生成寡核苷酸阵列
在一些情况下,使用如本文中所提供的方法加以处理以包括如本文中所提供的聚合物涂层的如本文中所提供的表面被用来生成寡核苷酸阵列。在一些情况下,在包括形成于如本文中所提供的表面结合的引发剂物质上的如本文中所提供的聚合物涂层的表面上生成寡核苷酸或oligo阵列。所述寡核苷酸阵列可以是高密度寡核苷酸阵列。所述寡核苷酸阵列可以包含至少10、20、50、100、200、500、1,000、2,000、5,000、10,000、20,000、50,000、100,000、200,000、500,000、1,000,000、2,000,000、5,000,000、10,000,000、20,000,000、100,000,000、200,000,000、500,000,000或1,000,000,000个与如本文中所提供的表面偶联的寡核苷酸。所述寡核苷酸阵列可以包含至多10、20、50、100、200、500、1,000、2,000、5,000、10,000、20,000、50,000、100,000、200,000、500,000、1,000,000、2,000,000、5,000,000、10,000,000、20,000,000、100,000,000、200,000,000、500,000,000或1,000,000,000个与如本文中所提供的表面偶联的寡核苷酸。所述寡核苷酸阵列可以包含大约10、20、50、100、200、500、1,000、2,000、5,000、10,000、20,000、50,000、100,000、200,000、500,000、1,000,000、2,000,000、5,000,000、10,000,000、20,000,000、100,000,000、200,000,000、500,000,000或1,000,000,000个与如本文中所提供的表面偶联的寡核苷酸。如本文中所提供的寡核苷酸阵列可以具有以至少10、20、50、100、200、500、1,000、2,000、5,000、10,000、20,000、50,000、100,000、200,000、500,000、1,000,000、2,000,000、5,000,000、10,000,000、20,000,000、100,000,000、200,000,000、500,000,000或1,000,000,000个寡核苷酸/平方毫米的密度排列在它上面的寡核苷酸。如本文中所提供的寡核苷酸阵列上的寡核苷酸可以组织至斑点(特征)、区域或像素中。各斑点(特征)或区域中的寡核苷酸可以彼此同一或彼此相关(例如,所有或实质上所有都包括共同或共用序列)。各斑点或区域中的寡核苷酸可以与彼此具有大于55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或99.9%的同一性。如本文中所提供的寡核苷酸阵列可以包含至少1、2、3、4、5、6、7、8、9、10、100、1000、10,000、50,000、100,000、200,000、500,000、1,000,000、2,000,000、5,000,000、10,000,000、20,000,000、100,000,000、200,000,000、500,000,000或1,000,000,000个斑点(特征)或区域。各斑点或区域可以具有至多约1cm、1mm、500μm、200μm、100μm、10μm、9μm、8μm、7μm、6μm、5μm、4μm、3μm、2μm、1μm、800nm、500nm、300nm、100nm、50nm或10nm的大小。在一些情况下,所述寡核苷酸与表面上的聚合物涂层偶联。所述聚合物涂层可以是如本文中所提供的聚丙烯酰胺涂层。在一些情况下,如本文中所提供的组合物包括表面、与所述表面结合的聚丙烯酰胺涂层;和与所述聚丙烯酰胺涂层偶联的至少一个寡核苷酸。
在一些情况下,所述寡核苷酸在聚合过程期间被并入所述聚合物涂层(例如,聚丙烯酰胺涂层)中。例如,可以在丙烯酰胺聚合过程期间添加5'-acrydite修饰的寡核苷酸链,以允许所述寡核苷酸并入聚合聚丙烯酰胺结构中。在一些情况下,所述寡核苷酸在5'端与所述聚合物涂层(例如聚丙烯酰胺涂层)偶联。在一些情况下,所述寡核苷酸在3'端与所述聚合物涂层(例如聚丙烯酰胺涂层)偶联。在一些情况下,一些寡核苷酸在3'端与所述聚合物涂层(例如聚丙烯酰胺涂层)偶联,且一些寡核苷酸在5'端与所述聚合物涂层(例如聚丙烯酰胺涂层)偶联。
之后一些情况下,所述寡核苷酸在聚合过程之后被并入所述聚合物涂层(例如,聚丙烯酰胺涂层)中。例如,反应位点可以在聚合过程期间被加入所述聚合物(例如,聚丙烯酰胺)结构。然后寡核苷酸可以在所述聚合物(例如聚丙烯酰胺)聚合之后并入在所述反应位点上。所述反应位点可以包括溴乙酰基位点、叠氮化物位点或与叠氮化物-炔烃Huisgen环加成相容的位点。在一些情况下,所述反应位点包括溴乙酰基位点。在一些情况下,所述反应位点包括叠氮化物。在一些情况下,所述反应位点包括与叠氮化物-炔烃Huisgen环加成相容的位点。
在一些情况下,所述寡核苷酸以受控方式并入所述聚合物涂层(例如聚丙烯酰胺涂层)中,其中特定寡核苷酸位于所述聚合物涂层(例如聚丙烯酰胺涂层)的特定区域上。寡核苷酸可以随机并入所述聚合物涂层(例如聚丙烯酰胺涂层)中,其中特定寡核苷酸随机分布在所述聚合物涂层(例如聚丙烯酰胺涂层)中。
可以在如本文中所提供通过各种手段制备的表面上制造寡核苷酸阵列(“oligo”阵列)。所述表面可以包括如本文中所提供的表面结合的引发剂物质。所述表面可以包括如本文中所提供的表面结合的引发剂物质,其中聚合物涂层(例如聚丙烯酰胺涂层)形成在如本文中所提供的所述表面结合的引发剂物质上。所述手段可以包括但不限于原位合成(例如光指导合成)、印刷(例如喷墨式印刷)、点样、转移、桥式扩增或重组酶聚合酶扩增。
在一些情况下,用于本文中所提供的方法中的寡核苷酸阵列是通过原位合成来合成。寡核苷酸区域可以通过原位合成来制造,例如,如Gao等,2004,Biopolymers,73(5):579-596中所描述,该文献的公开内容以全文引用的方式并入本文中。阵列表面上的寡核苷酸的原位合成可以通过印刷来进行;例如,喷墨或其他印刷技术可以向特定阵列区域递送A、C、G或T亚磷酰胺且从而控制各区域的合成。原位合成可以通过电反应来进行;例如,阵列区域可以包括在可独立寻址的电反应电池中,且可以电控制各区域的合成。
在一些情况下,用于本文中所提供的方法中的寡核苷酸阵列是通过点样来合成。点样可以如Gao等,2004,Biopolymers,73(5):579-596中所描述,该文献的公开内容以全文引用的方式并入本文中。非接触或接触印刷方法(例如机械插脚、压电喷墨印刷机)可以用于将预先合成的寡核苷酸沉积至阵列的寡核苷酸或引物区域上。然后可以将寡核苷酸连接或固定至所述表面,例如,通过经由官能团化学连接。在一些情况下,所述官能团可以结合于寡核苷酸的5'端,从而产生3'端远离表面的寡核苷酸。
在一些情况下,原位合成可以通过光刻来进行。光刻可以在有或无掩模的情况下进行。在一些情况下,使用光不稳定保护基来控制各阵列区域的合成,且用光掩模或用无掩模光刻系统进行图案化。
在一些情况下,将投射光刻与对比度增强光酸生成聚合物膜组合用于合成寡核苷酸阵列,以用于本文中所提供的方法中。目前,探针长度至多60bp的高密度寡核苷酸(“oligo”)阵列可购自Affymetrix、NimbleGen和Agilent(即,SurePrint Technology),如以下文献中所描述:Fodor,S.P.等,Light-directed,spatially addressable parallelchemical synthesis.Science 251,767-773,(1991);McGall,G.H.&Christians,F.C.High-density genechip oligonucleotide probe arrays.Adv Biochem EngBiotechnol 77,21-42,(2002);和Nuwaysir,E.F.等,Gene expression analysis usingoligonucleotide arrays produced by maskless photolithography.Genome Res 12,1749-1755,(2002),各文献的公开内容以全文引用的方式并入本文中。然而,这些阵列中制造的最小特征间距分别是5μm、13μm和30μm。图4描绘使用常规接触光刻逐步错位,使用光解保护基化学反应生成的20聚体寡核苷酸阵列。如图4中所示,使用常规接触光刻逐步错位与光解保护基化学反应将所生成的寡核苷酸阵列的可实现的最小特征大小限制于1μm至2μm。在本文中所提供的方法中,组合使用投射光刻与对比度增强光酸生成聚合物膜可以允许等于或小于1μm的分辨率。这可能有利于在减少串话误差的同时紧密包装条形码特征。在一些情况下,通过组合使用投射光刻与对比度增强光酸生成聚合物膜而生成的寡核苷酸阵列包括1500个特征,各自的大小是1μm×1μm,而总阵列大小是3mm×5mm。寡核苷酸阵列上的各寡核苷酸可以是约60个碱基,含具有约20个碱基的条形码,侧接两个具有约20个碱基的通用接头。确定的步进器(例如ASML PAS5500)可用于生成寡核苷酸阵列。确定的步进器(例如ASML PAS5500)在亚微米范围内以±0.060um放置准确度按常规印刷5×减小图案。条形码区域可以≤1μm,使得各特征(“斑点”)跨越使用本文中所提供的方法在阵列上拉伸的模板核酸(例如,DNA)的2000bp部分。所述通用接头可以包括顶部接头和底部接头。顶部接头可用于引发拉伸过的核酸(例如DNA),而底部接头可以充当第一接头以用于NGS库制备。所述条形码可以是一组寡核苷酸条形码。该组条形码可以唯一地鉴定寡核苷酸阵列或芯片上的各寡核苷酸的空间位置。可以设计条形码以获得精确序列性能,例如介于40%与60%之间的GC含量、无均聚物长度大于2、无自互补拉伸段长度大于3、不存在于人类基因组参考物中。在一些情况下,为了防错可寻址性,各条形码为远离阵列中的任何其他条形码的四个缺失或插入或取代。在一些情况下,利用计算机辅助覆盖对准的多次曝光接触光刻被用来使用已证明的光解保护基化学反应达到1μm特征分辨率。
在一些情况下,使用桥式扩增或重组酶聚合酶扩增生成寡核苷酸阵列,例如,如本文中以及美国临时申请No.61/979,448或62/012,238中所描述,各申请的公开内容以全文引用的方式并入本文中。阵列的基底可以包括能够结合个别寡核苷酸上的区域,从而允许在所述基底上对所述个别寡核苷酸进行桥式扩增或重组酶聚合酶扩增的结合接头或寡核苷酸。所述基底可以接种具有已知条形码序列的寡核苷酸(即,引物),随后扩增以生成寡核苷酸区域。替代地,所述寡核苷酸基底可以接种具有随机或未知条形码序列的寡核苷酸,随后扩增以生成寡核苷酸区域且对来自各寡核苷酸区域的寡核苷酸进行测序,以确定对应于各寡核苷酸区域的条形码序列。可以制备所述基底以用于生成如本文中所提供的寡核苷酸阵列。
使用本文中所提供的任何方法生成的寡核苷酸阵列(例如模板和/或受者阵列)上的寡核苷酸可以包括多个区段或序列,诸如PCR或延伸反应引物序列、条形码序列和接头或通用序列。例如,图5示出了寡核苷酸500的示意图,其从5'至3'包括PCR引物序列501、条形码序列502和用于结合的限定序列503。所述限定序列(503)可以是接头序列、通用序列或者与随机引物的特定区域或通过本文中所提供的方法(例如转座子插入)引入靶多核苷酸中的引物结合位点互补的序列。所述寡核苷酸的5'端可以与阵列结合。如本文中所提供的寡核苷酸阵列上的寡核苷酸(例如模板和/或受者阵列)可以包括个别或单个区段或序列。所述个别区段可以是PCR或延伸反应引物序列、条形码序列或接头或通用序列。
在其他实例中,使用本文中所提供的任何方法生成的寡核苷酸阵列(例如,模板和/或受者阵列)上的寡核苷酸可以包括多个区段或序列,诸如底部接头、可变区和顶部接头序列。在一些情况下,寡核苷酸阵列上的寡核苷酸是双股的。寡核苷酸阵列上的双股寡核苷酸可以包括多个区段或序列,诸如底部接头、可变区和顶部接头序列。在一些情况下,双股寡核苷酸的各股连接于阵列表面。在一些情况下,双股寡核苷酸的一股的5'端连接于阵列表面。在一些情况下,双股寡核苷酸的一股的3'端连接于阵列表面。寡核苷酸的一端和/或两端可以用如本文中所提供的方式连接于阵列表面。例如,图51A示出了双股寡核苷酸5100的示意图,其包括底部接头5101、可变区5102和顶部接头5103。在一些情况下,底部接头5101位于阵列表面近端,而顶部接头5103位于阵列表面远端。所述底部接头可以经由所述底部接头的5'端连接于寡核苷酸表面。所述底部接头可以经由所述底部接头的3'端连接于寡核苷酸表面。包含顶部和底部接头的寡核苷酸(例如,图51A)中的所述顶部和/或底部接头可以包括通用的或已知的序列。在一些情况下,所述底部接头包括识别序列。所述识别序列可以对酶具有特异性。在一些情况下,所述识别序列是限制酶或内切核酸酶的限制位点。所述限制位点可以经配置以便由限制酶加以切割,使得限制酶切割可从包含所述限制位点的寡核苷酸所连接的阵列表面释放包含所述限制位点的寡核苷酸上的一股或两股。所释放的寡核苷酸股可以用于下游加工步骤。下游加工步骤可以是测序反应。所述顶部接头可以包含针对酶的识别序列。在一些情况下,所述顶部接头包含针对拓扑异构酶的识别序列。所述拓扑异构酶可以是拓扑异构酶I。在一些情况下,所述顶部接头序列包括针对牛痘病毒拓扑异构酶I的识别序列(例如,图51A)。所述顶部接头内的牛痘病毒识别序列可以是5'-CCCTT-3'。所述顶部接头内的牛痘病毒识别序列可以是5'-TCCTT-3'。所述顶部接头序列内的牛痘病毒识别序列可以侧接在识别序列上游(5')至少6个核苷酸处。所述顶部接头序列内的牛痘病毒识别序列可以侧接在识别序列下游(3')至少6个核苷酸处。如图51A中所示,所述牛痘病毒识别序列下游(3')的序列可以是5'-AAGGA-3'。所述牛痘病毒识别序列下游(3')的序列可以是5'-AAGGG-3'。如本文中所提供,所述顶部接头可用于引导拉伸过的核酸(例如DNA),而所述底部接头可以充当第一接头以用于NGS库制备。
如图51A中所描绘的各双股寡核苷酸的可变区5102可以是条形码。所述条形码可以是一组寡核苷酸条形码。该组条形码可以唯一地鉴定寡核苷酸阵列或芯片上的各寡核苷酸的空间位置。可以设计条形码以获得精确序列性能,例如介于40%与60%之间的GC含量、无均聚物长度大于2、无自互补拉伸段长度大于3、不存在于人类基因组参考物中。在一些情况下,为了防错可寻址性,各条形码为远离阵列中的任何其他条形码的四个缺失或插入或取代。
包含PCR引物序列的寡核苷酸中的PCR引物序列可以是使用聚合酶的PCR反应中所使用的序列,所述聚合酶包括但不限于PolI、PolII、PolIII、Klenow、T4DNA Pol、修饰T7DNAPol、突变修饰T7DNA Pol、TdT、Bst、Taq、Tth、Pfu、Pow、Vent、Pab和Phi-29。例如,可以使用Bst聚合酶,通过在65℃下在1×等温扩增缓冲液(例如,20mM Tris-HCl、10mM(NH4)2SO4、50mM KCl、2mM MgSO4和0.1%Tween 20)中将模板核酸和引物与Bst聚合酶和dNTP一起孵育来进行反应。PCR引物序列可用于引导延伸反应。PCR引物序列可用于引导PCR反应。由包含PCR引物序列的寡核苷酸生成的延伸产物可以用PCR扩增,以增加其浓度或量,随后测序。PCR引物序列可以是至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35bp。PCR引物序列可以是至多5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个碱基。
寡核苷酸阵列上的寡核苷酸中的接头或通用序列可以包括能够直接地(例如,通过与模板核酸内的序列杂交)或间接地(例如,通过与跟模板核酸内的序列杂交过的游离引物杂交)与模板或靶核酸杂交的接头或通用序列。接头或通用序列可以是至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个碱基。接头或通用序列可以是至多5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个碱基。
寡核苷酸阵列上的寡核苷酸区域(例如模板和/或受者寡核苷酸阵列)可以组织在寡核苷酸阵列600上的不同的排列中。寡核苷酸区域可以排列在寡核苷酸阵列上的寡核苷酸区域610的二维阵列中,例如,如图6A中所示。寡核苷酸区域可以排列在寡核苷酸阵列上的在一个方向上延伸越过寡核苷酸阵列的行或列620、621、622、623、624中,如图6B中所示。寡核苷酸区域可以排列在寡核苷酸阵列600上的群集630中,例如,如图6C中所示。
寡核苷酸(oligo)可以呈5'至3'取向或呈3'至5'取向排列在阵列表面上。个别阵列斑点或区域可以具有至多约15μm、至多约14μm、至多约13μm、至多约12μm、至多约11μm、至多约10μm、至多约5μm、至多约3μm、至多约1μm、至多约0.3μm或至多约0.1μm的尺寸。所述引物区域可能以至少100、1,000、10,000、100,000、500,000、1,000,000、2,000,000、5,000,000、10,000,000、20,000,000、50,000,000、100,000,000、200,000,000或500,000,000个区域/cm2的密度排列在基底上。
用于生成转移或受者阵列的转移技术
本文中的方法还可以用于生成具有期望取向的寡核苷酸阵列。在一些情况下,在为了生成如本文中所提供的寡核苷酸阵列而制备的表面上生成如本文中所提供的寡核苷酸阵列的方法被用来生成寡核苷酸阵列,所述寡核苷酸阵列被用作模板(即,模板阵列)来生成一个或多个包含与其偶联的寡核苷酸且与模板阵列上的寡核苷酸互补的寡核苷酸阵列。包含与其偶联的寡核苷酸且与模板阵列互补的寡核苷酸阵列可以称为受者阵列(或替代地,转移阵列)。所述转移或受者寡核苷酸阵列可以包括具有期望取向的寡核苷酸。所述转移或受者阵列可以使用阵列转移方法由模板阵列生成。在一些情况下,具有期望特征(“斑点”)密度(例如,约1μm的特征或斑点大小)的模板寡核苷酸阵列经历如本文中所提供的阵列转移方法,以便生成具有期望取向的转移或受者寡核苷酸阵列。期望取向可以是包含诸多寡核苷酸的转移或受者寡核苷酸阵列,其中所述阵列的各寡核苷酸的5'端附接至所述阵列基底。用于生成呈期望取向的具有诸多寡核苷酸的转移或受者寡核苷酸阵列(即,所述阵列的各寡核苷酸的5'端连接于所述阵列基底)的模板寡核苷酸阵列可以让所述模板阵列的各寡核苷酸的3'端附接至所述基底。所述阵列转移方法可以是面对面转移方法。在一些情况下,所述面对面转移方法通过酶促转移或边合成边酶促转移(ETS)而发生。ETS一般描绘于图7、图8A和图9中。
ETS可以包含如图7、图8A和图9中所描述的面对面聚合酶延伸反应,以便将一个或多个模板寡核苷酸(例如,DNA寡核苷酸)从模板寡核苷酸阵列拷贝到第二表面(例如受者阵列)上。均匀覆盖有与模板寡核苷酸阵列中的寡核苷酸上的序列(例如,包含接头序列的寡核苷酸阵列中的底部接头序列)互补的固定引物的第二表面(例如受者阵列)可以受压而与模板寡核苷酸(例如DNA寡核苷酸)阵列接触。受者阵列表面可以包括至少部分地与模板寡核苷酸阵列上的模板核酸或寡核苷酸互补的表面固定的寡聚物(oligo)、核苷酸或引物。在一些情况下,转移或受者阵列包含选择性地与模板阵列上的适配体杂交或结合的寡核苷酸。转移或受者阵列上的固定的寡核苷酸、核苷酸或引物可以与模板聚合物(例如寡核苷酸)上的接头区域互补。
所述面对面凝胶转移法在翻转寡核苷酸取向(5'被固定)同时可以显著降低单位制造成本,这可以具有诸多测定法优点,诸如允许阵列结合寡核苷酸的3'端的酶促延伸。此外,ETS引起更大数目或更高百分比的具有期望或限定长度的寡核苷酸(即,全长寡核苷酸)从模板阵列转移至受者阵列。随后扩增受者寡核苷酸阵列上的转移全长产物寡核苷酸可以允许受者寡核苷酸阵列含有包括大于50个核苷酸碱基的寡核苷酸而不受低产率或部分长度产物困扰。
在一些情况下,模板和/或受者阵列包括聚合物。所述聚合物可以是适配体或寡核苷酸。在一些情况下,模板或受者阵列包括寡核苷酸。模板或受者阵列可以具有与其偶联的至少10、20、50、100、200、500、1,000、2,000、5,000、10,000、20,000、50,000or 100,000、200,000、500,000、1,000,000、2,000,000、5,000,000、10,000,000、20,000,000、100,000,000、200,000,000、500,000,000或1,000,000,000个模板聚合物(例如寡核苷酸)。模板阵列可以具有以至少10、20、50、100、200、500、1,000、2,000、5,000、10,000、20,000、50,000或100,000个聚合物(例如寡核苷酸)/平方毫米的密度排列在其上面的模板聚合物。模板或受者阵列上的聚合物(例如寡核苷酸)可以组织至斑点、区域或像素中。各斑点(特征)或区域中的聚合物(例如寡核苷酸)可以彼此同一或彼此相关(例如,所有或实质上所有都包括共同或共用序列)。各斑点或区域中的聚合物(例如寡核苷酸)可以彼此大于55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或99.9%同一。所述模板或受者阵列可以包含至少1、2、3、4、5、6、7、8、9、10、100、1000、10,000、100,000、1,000,000或10,000,000个斑点或区域。各斑点或区域可以具有至多约1cm、1mm、500μm、200μm、100μm、10μm、9μm、8μm、7μm、6μm、5μm、4μm、3μm、2μm、1μm、800nm、500nm、300nm、100nm、50nm或10nm的大小。
如本文中所提供的所生成的受者或转移阵列可以包括在其序列和/或数目方面与从中转移受者阵列的模板阵列上的寡核苷酸完全互补、完全同一、部分互补或部分同一的寡核苷酸。部分互补可以指具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或99.9%序列互补性的受者阵列。部分同一可以指具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或99.9%序列同一性的受者阵列。受者阵列可以具有与模板阵列相同数目的寡核苷酸,和/或从中转移受者阵列的模板阵列的寡核苷酸数目的至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或99.9%。
如本文中所提供的阵列制造方法可以产生具有设计、期望或希望的长度的聚合物(例如寡核苷酸)的阵列,所述聚合物可称为全长产物。例如,意在生成具有10个碱基的寡核苷酸的制造方法可以生成与阵列偶联的具有10个碱基的全长寡核苷酸。阵列制造方法可以产生小于设计、期望或希望的长度的聚合物(例如寡核苷酸),所述聚合物可称为部分长度产物。例如,意在生成具有10个碱基的寡核苷酸的制造方法可以生成与阵列偶联的具有仅8个碱基的部分长度寡核苷酸。即,合成的寡核苷酸阵列可以包括沿其长度为同源的或接近同源的但在长度方面可能彼此不同的许多核酸。在这些同源或接近同源的核酸中,具有最长的长度的那些可以被视为全长产物。长度比最长的长度短的核酸可以被视为部分长度产物。本文中所提供的阵列制造方法可以产生与阵列偶联的一些全长产物和一些部分长度产物。与特定阵列偶联的部分长度产物可以在长度方面变化。由全长产物生成的互补核酸也可以被视为全长产物。由部分长度产物生成的互补核酸也可以被视为部分长度产物。
在一些情况下,本文中所提供的转移方法包括生成与模板序列互补的核酸(例如寡核苷酸)序列。所述转移可以通过在阵列表面之间进行阵列组分的酶促复制或非酶促物理转移而发生。所述阵列表面可以是如本文中所提供的任何阵列表面。模板阵列和受者阵列的基底可以相同或可以不同。所述转移可以包括制造互补序列,所述互补序列已经附接至受者阵列,例如,与受者阵列结合的引物,且与模板阵列上的接头互补,可以使用模板阵列序列作为模板加以延伸,从而生成全长或部分长度受者阵列。转移可以包括由模板阵列制造互补序列,随后附接所述互补序列与受者阵列。
如本文中所提供的转移方法可以生成受者阵列,使得模板核酸(例如寡核苷酸)相对于其偶联受者阵列表面的取向得以保留(例如,模板核酸(例如寡核苷酸)的3'端与模板阵列结合,且转移核酸(例如寡核苷酸)互补序列的3'端与受者阵列结合)。转移可以逆转核酸相对于其偶联阵列表面的取向(例如,模板核酸的3'端与模板阵列结合,且转移核酸互补序列的5'端与受者阵列结合)。
如本文中所提供的转移方法可用于增加或富集与阵列表面偶联的全长产物(例如寡核苷酸)的量或百分比。所述转移方法可以产生包括至少约30%、40%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%或100%全长产物(例如寡核苷酸)的阵列。例如,通过标准方法(例如点样或原位合成)制造的模板阵列可以包括约20%全长产物寡核苷酸和约80%部分长度产物寡核苷酸;包括与模板阵列寡核苷酸的未结合端上的序列互补的引物的转移阵列可用于进行转移;许多或所有部分长度产物缺乏与所述引物互补的序列的最终部分且因此不会被转移。
阵列转移可以进行多次。阵列转移可以使用相同模板阵列进行多次。与模板基底结合的模板聚合物的模板阵列可用于产生至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、500、1,000、5,000、10,000、50,000或100,000个受者阵列。可以在一系列转移中使用一次阵列转移的转移阵列作为随后转移的模板阵列进行多次阵列转移。例如,第一次转移可以从寡核苷酸在其3'端与阵列结合的模板阵列进行至互补寡核苷酸在其5'端与阵列结合的第一转移阵列,且第二次转移可以从所述第一转移阵列(现在充当模板阵列)进行至第二转移阵列,所述第二转移阵列具有富集百分比的全长产物和与原始模板阵列相匹配同时保留5'表面结合取向的序列。所述阵列转移方法可以是如本文中所提供的面对面酶促转移方法。
在一些情况下,可以通过使用模板聚合物(例如,寡核苷酸)上的接头序列来辅助转移。聚合物可以包含添加有一个或多个接头序列的期望最终序列。例如,模板寡核苷酸可以按顺序包括具有第一接头序列的3'端、具有第二接头序列的5'端和处于中间的期望最终序列。所述第一接头序列与所述第二接头序列可以相同或可以不同。在一些情况下,相同阵列斑点中的寡核苷酸包含同一的第一接头序列和第二接头序列以及最终序列,且不同阵列斑点中的寡核苷酸包含同一的第一接头序列和第二接头序列但不同的最终序列。转移/受者阵列上的引物(例如寡核苷酸)可以与接头序列互补,从而允许引物与模板聚合物之间的杂交。这样的杂交可以有助于从一个阵列转移至另一个。可以在转移之后从转移/受者阵列聚合物(例如转移寡核苷酸)中去除一些或所有接头序列,例如,通过酶促裂解、消化或限制。可以在转移之后从转移/受者阵列聚合物(例如转移寡核苷酸)中去除一些或所有接头序列,例如,通过酶促裂解、消化或限制。例如,寡核苷酸阵列组分可以经由探针末端截断(PEC)通过双链DNA酶来去除接头。可以添加与接头序列互补的寡核苷酸且与阵列组分杂交。然后可以使用双链DNA特异性DNA酶来消化寡核苷酸(参见图10)。替代地,一个或多个可裂解碱基,诸如dU,可以并入欲去除的链的引物中。然后可以在探针的最3'碱基附近的位置上对引物制造切口,并且可以通过适当的酶,诸如绿豆S1或P1核酸酶来切割切口位点(参见图11)。
还可以使用许多限制酶和其相关限制位点,包括但不限于EcoRI、EcoRII、BamHI、HindIII、TaqI、NotI、HinFI、Sau3AI、PvuII、SmaI、HaeIII、HgaI、AluI、EcoRV、EcoP15I、KpnI、PstI、SacI、SalI、ScaI、SpeI、SphI、StuI和XbaI。在一些情况下,从第二表面(受者表面)向含有与顶部接头互补的引物(例如寡核苷酸)的新第三表面重复以上所描述的转移方法。因为只有全长寡核苷酸可以具有完整顶部接头,所以只有这些才可以被拷贝到第三表面中。所述方法可以从部分产物中纯化全长寡核苷酸,因此产生高特征密度、高品质的全长寡核苷酸阵列。
在一些情况下,可以通过阵列或阵列上的表面涂层的挠性或变形性来辅助阵列转移。例如,包括具有偶联寡核苷酸的聚丙烯酰胺凝胶涂层的阵列可用于阵列转移;凝胶涂层的变形性可以允许阵列组分彼此接触而不管表面粗糙度。
可以通过酶促反应,例如通过扩增特征再生(AFR)来扩增或再生阵列组分。可以在模板阵列和/或受者阵列上进行AFR。AFR可用于在阵列(例如模板和/或受者)上再生全长寡核苷酸,以便确保阵列(例如模板和/或受者阵列)上的特征(例如斑点)中的各寡核苷酸包含期望组分(例如接头、条形码、靶核酸或其互补序列和/或通用序列等)。可以对包含接头和/或引物结合位点的寡核苷酸进行AFR,使得所述寡核苷酸各自包含第一接头(或第一引物结合位点)、探针序列和第二接头(或第二引物结合位点)。在一些情况下,阵列(例如模板和/或受者阵列)上的各特征中的寡核苷酸包括两个或更多个引物结合位点(或接头序列)。可以使用本领域中已知的核酸扩增技术来进行AFR。扩增技术可以包括但不限于等温桥式扩增或聚合酶链反应(PCR)。例如,可以经由在阵列组分上的接头序列与表面结合的寡核苷酸引物之间进行杂交,随后进行酶促延伸或扩增来对阵列组分寡核苷酸进行桥式扩增。扩增可用于恢复损失的阵列组分密度或使阵列组分密度增加至超过其原始密度。
固定的寡核苷酸、核苷酸或引物可以具有彼此相等的长度,或可以具有变化的长度。固定的寡核苷酸、核苷酸或引物可以包括至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195或200个碱基。在一些情况下,固定的寡核苷酸、核苷酸或引物是71个碱基长(71聚体)。
可以使转移阵列的受者表面与模板阵列的模板表面紧密邻近或接触。在一些情况下,模板阵列与转移阵列之间的接触可以通过存在可变形涂层,诸如聚合物凝胶(例如聚丙烯酰胺)加以辅助。所述涂层的变形性可以允许偶联的聚合物(例如寡核苷酸或引物)变得足够接近以便发生杂交。所述涂层的变形性可以辅助克服由于表面粗糙度(例如,表面地形变异性)或否则将会阻止密切程度足以发生杂交的接触的其他特征所致的间隙。可变形涂层的一个附加益处在于其可以预先装载有酶促反应试剂,且因此充当边合成边酶促转移(ETS)的界面反应的储器。所述阵列之一或两者可以包含具有凝胶涂层的基底,所述凝胶涂层具有与其偶联的聚合物分子。例如,转移阵列可以包括与聚丙烯酰胺凝胶偶联的基底,所述聚丙烯酰胺凝胶具有与所述凝胶偶联的寡核苷酸引物。本发明中在其他部分进一步论述了表面和涂层。
模板核酸(寡核苷酸)可以与受者表面上的固定的引物或探针(也称为受者引物或探针或者转移引物或探针)杂交。杂交复合物(例如双链体)可以酶促延伸(参见图8A),诸如例如通过DNA聚合酶,包括但不限于PolI、PolII、PolIII、Klenow、T4DNA Pol、修饰T7DNAPol、突变修饰T7DNA Pol、TdT、Bst、Taq、Tth、Pfu、Pow、Vent、Pab。
所述转移方法可以保留所述寡核苷酸的取向,即,如果5'端与模板表面结合,则合成寡核苷酸的5'端将与受者表面结合,反之亦然。如图8A中所示,在其5'端结合的转移引物可以在其3'端上结合模板核酸,随后进行酶促延伸,以产生与模板寡核苷酸互补且在其5'端与受者阵列表面结合的核酸。
在一些情况下,仅使用全长模板核酸产物来生成受者阵列上的互补序列。图8C示出了仅使用全长模板核酸产物的酶促转移的一个实例,所述全长模板核酸产物包括第一接头区域A、中间区域B和第二接头区域C。在图8C中,受者阵列表面包括与模板核酸的末端上的第二接头序列C互补的引物;模板阵列上的全长产物包括整个序列(即,第一接头A、中间区域B和第二接头C),而部分长度产物则不然(即,第一接头A和中间区域B)。在图8C中,模板阵列上的部分长度产物没有被转移,因为它们缺乏第二接头C且因此不能被受者阵列上包含与第二接头C互补的序列的引物(寡核苷酸)结合。在一些情况下,用于生成受者阵列上的互补序列的模板核酸产物中的至少30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、99.9%或100%是全长产物。在一些情况下,受者阵列上所生成的转移或受者核酸产物中的至少30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、99.9%或100%是全长产物。包括与模板阵列寡核苷酸的未结合端上的序列互补的引物的转移阵列可用于进行转移;许多或所有部分长度产物缺乏与所述引物互补的序列的最终部分且因此不会被转移,从而导致转移阵列上的全长产物的百分比有所增加。
在一些情况下,受者阵列包括处于其上的引物,所述引物与模板聚合物的一部分杂交,以使得延伸反应发生,直至所有模板聚合物都被用作模板来合成互补阵列(或受者阵列)。在一些情况下,合成受者阵列,以使得平均至少100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%或50%的模板聚合物被用于生成受者阵列上的互补序列。换句话说,受者阵列在转移后可以包括使用至少100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%或50%的模板寡核苷酸作为模板合成的受者核苷酸。
所述阵列转移方法可以逆转模板核酸的取向(参见图8B、图9)。即,如果5'端与模板表面结合,则合成寡核苷酸的3'端将与受者表面结合,反之亦然。例如,图8B示出了模板阵列表面上的模板核酸的酶促转移,所述模板核酸可以包括第一接头区域A、中间区域B和第二接头区域C中的一些或全部。在图8B中,与位于模板核酸(A)的基底偶联端上的接头序列互补的受者表面引物(A')被用于进行酶促转移;部分长度产物和全长产物两者都得以转移,且其相对于模板阵列的基底表面的取向得以切换。如图9中所示,在其3'端与模板阵列表面(模板表面)结合的模板核酸可以通过在其5'端与受者阵列表面结合的转移引物结合在其3'端,随后进行酶促延伸,以产生与模板核酸互补且在其5'端与受者阵列表面结合的核酸。可以对在其5'端与模板表面结合的模板核酸和在其3'端与受者阵列表面结合的转移引物进行相同方法,从而产生与模板核酸互补且在其3'端与受者阵列表面结合的核酸。在一些情况下,部分长度产物(模板寡聚物)被用来生成互补序列。在一些情况下,全长产物(模板寡聚物)被用来生成互补序列。
模板表面和受者表面可以是生物相容性的,诸如聚丙烯酰胺凝胶、改性聚丙烯酰胺凝胶、PDMS或任何其他生物相容性表面。
如果所述表面包括聚合物凝胶层,则厚度可能影响其变形性或挠性。凝胶层的变形性或挠性可能使得其可用于保持表面之间的接触,而不管表面粗糙度。本文中进一步讨论了表面的细节。
试剂和其他化合物,包括酶、缓冲液和核苷酸,可以位于表面上或包埋在相容性凝胶层中。酶可以是聚合酶、核酸酶、磷酸酶、激酶、解旋酶、连接酶、重组酶、转录酶或逆转录酶。在一些情况下,位于表面上或包埋在相容性凝胶层中的酶包括聚合酶。聚合酶可以包括但不限于PolI、PolII、PolIII、Klenow、T4DNA Pol、修饰T7DNA Pol、突变修饰T7DNA Pol、TdT、Bst、Taq、Tth、Pfu、Pow、Vent、Pab、Phusion等等。
本文中进一步讨论了表面的细节。在一些情况下,位于表面上或包埋在相容性凝胶层中的酶包括连接酶。连接酶可以包括但不限于大肠杆菌连接酶、T4连接酶、哺乳动物连接酶(例如,DNA连接酶I、DNA连接酶II、DNA连接酶III、DNA连接酶IV)、热稳定连接酶和快速连接酶。
模板表面和通过酶促延伸生成的转移后受者表面示于图12、图13和图14中。受者阵列的表面可以是在模板阵列的顶部上形成的凝胶。图15示出了如本文中所描述的在存在反应混合物(例如,如本文中所概述的引物、酶、缓冲液)和模板的情况下从模板阵列表面至受者表面的酶促延伸反应(即,凝胶拷贝(有模板))的一个实例,以及一个阴性对照,其中模板阵列在存在反应混合物(例如,如本文中所概述的引物、酶、缓冲液)但无模板核酸的情况下经历如本文中所描述的酶促延伸反应至受者表面(凝胶拷贝(无模板))。所述阴性对照(即,凝胶拷贝(无模板))中缺乏荧光说明在不存在模板核酸的情况下缺乏所生成的产物。图16示出了得自附加对照实验的结果,其中模板阵列表面(左)在存在反应混合物(即,引物、缓冲液)(右)但不存在酶的情况下与受者转移表面接触。图16中的受者阵列(右)上缺乏荧光说明缺乏转移。所述反应混合物可以位于受者阵列的表面上或包埋在受者表面中。在一些情况下,所述反应混合物位于受者阵列的表面上。在一些情况下,所述反应混合物包埋在受者表面中。所述受者表面可以是相容性凝胶层。所述反应混合物可以包括进行边合成边酶促转移(ETS)所必需的任何试剂。所述试剂可以包括
模板阵列的酶促转移可以如下进行:1.)制备酶混合物(例如,37μL H2O、5μL 10XThermopol缓冲液、5μL 10mg/mL BSA、1μL 10mM dNTP和2μL 8U/μL Bst酶);2.)将酶混合物施加至受者阵列(例如,如本发明中其他部分所描述而制备的具有偶联寡核苷酸引物的丙烯酰胺凝胶涂布的玻璃载片);3.)将模板阵列与所述受者阵列面对面放置且允许反应(例如,在湿度室中在55℃下夹在一起2小时);4.)分离所述模板阵列与所述受者阵列(例如,通过施加4X SSC缓冲液而使其松动且借助于刀片将其拉开);5.)冲洗(例如,在DI水中)并干燥(例如,用N2)所述模板阵列;和6.)冲洗(例如,用4X SSC缓冲液和2X SSC缓冲液)所述受者阵列。在一些情况下,模板阵列上的寡核苷酸包括接头,使得底部接头位于模板阵列表面近端,而顶部接头位于模板阵列表面远端。在夹层被加热至55℃时,Thermopol PCR缓冲液中的Bst聚合酶可以使引物从所杂交的受者阵列延伸至模板阵列的底部接头,这可以在模板与受者阵列表面之间产生dsDNA分子桥。在物理分离后,第二表面(即,受者阵列)可以含有互补ssDNA条形码阵列,其中寡核苷酸的5'端附接至所述表面且3'端可用于聚合酶延伸。因为模板阵列上均匀分散的引物和受者阵列上的条形码寡核苷酸可以拴系至其相应的表面,所以可以维持转移特征的相对位置(呈镜象形式)。为了实现密切接触且因此整个芯片面积上的均匀转移,可以使用大范围的表面材料(PDMS、聚丙烯酰胺)、厚度和加工条件。图3示出了大(~150tm)特征阵列上的如本文中所描述的面对面酶促转移方法的一个实例。面对面转移的效率可以引起各拷贝阵列特征内的寡核苷酸密度降低。本领域技术人员可以了解到,可以通过例如改变凝胶转移条件,例如选择酶、加工温度和时间、引物长度或表面材料性质来优化转移条件。替代地,可以使用经由固相PCR(例如,桥式PCR)进行的转移后表面扩增将条形码密度增加至如本文中所描述的期望水平。
在一些情况下,通过非酶促转移来进行受者阵列的生成。非酶促转移可以是寡核苷酸固定化转移(OIT)。在OIT中,模板核酸可以是单链的,并且可以通过引物延伸成为双链的。用于引物延伸的引物可以处于溶液中。许多聚合酶可以用于OIT,包括PolI、PolII、PolIII、Klenow、T4DNA Pol、修饰T7DNA Pol、突变修饰T7DNA Pol、TdT、Bst、Taq、Tth、Pfu、Pow、Vent、Pab、Phusion等等。用于引物延伸的引物可以包括可用于将引物延伸产物(参见图17)固定在受者表面上的连接子。所述受者表面可以是平坦表面、珠粒或凝胶。在一些情况下,所述受者表面是在OIT期间形成的聚丙烯酰胺凝胶(如图18中所示)。在延伸之后,所述连接子可以与诸如聚合物凝胶或改性玻璃表面之类的受者表面结合。可以分离模板表面与受者表面。可以对所述DNA进行解链,随后分离。在一些情况下,所述引物是5'-acrydite修饰的引物。5'-acrydite修饰的引物能够在聚合期间并入聚合物凝胶(例如聚丙烯酰胺)中。然后可以用acrydite引物由模板核酸生成延伸产物,与具有结合处理(例如,未聚合聚丙烯酰胺涂层前驱物)的基底接触,在聚合期间并入,并且分离(参见图19)。所述引物可以是5'-己炔基-polyT-DNA。在一些情况下,经由互补5'-己炔基-polyT-DNA引物的结合和延伸由模板核酸生成引物延伸产物。在延伸之后,所述5'己炔基-polyT-DNA引物可以:1.)与具有结合处理的基底(诸如经硅烷处理的玻璃)接触;2.)与交联剂连接,所述交联剂诸如有例如同双官能团连接子,诸如1,4-亚苯基二异硫氰酸酯(PDITC);3.)与具有PEG连接子的N3键合基团连接(例如图20);4.)在所述N3基团处与所述基底键合(例如图21);和5.)在OIT的第二阶段期间分离(图18)。核酸的PDITC-N3附接的实例示于图21和图22中。所述表面可以是如本文中所讨论的表面中的任一种。可用于代替PDITC的其他交联剂可以包括辛二亚氨酸二甲酯(DMS)、二琥珀酰亚胺基碳酸酯(DSC)和/或二琥珀酰亚胺基草酸酯(DSO)。这种方法可以保留所述寡核苷酸的取向,即,如果5'端与模板表面结合,则合成寡核苷酸的5'端将与受者表面结合,反之亦然。尽管可能在转移之前使用酶促延伸,但转移本身可以在无酶促反应的情况下进行。
图23示出了荧光标记的模板阵列的照片,其中模板分子具有结构5'CAGAAGACGGCATACGAGAT_GACTGGAGTTCAGACGTGTGCTCTTCC_GTGTAGATCTCGGTGGTCGCCGTA-3'T*_(HEG)2_(基底表面)。在成像之前,允许所述阵列在4X SSC缓冲液中在55℃下与500nM QCFC2-Cy3杂交60分钟。图24示出了相同模板的区域的放大视图。图25示出了相同模板阵列以及非酶促转移之后的受者转移阵列。使模板核酸与Acr-FC1杂交且用Bst聚合酶加以延伸,然后并入受者转移阵列基底上的聚合物凝胶中并且与模板阵列分离。模板阵列显示转移后信号无可观减少,而转移阵列在10x暴露下显示小信号。图26示出了转移前和转移后的模板阵列的并行比较。如可见,模板阵列显示转移后信号无可观减少。图27示出了利用凝胶延伸链转移的非酶促转移与利用凝胶撕裂的模板链的非酶促转移之间的比较。图28示出了凝胶图像之间的曝光设定比较,一个利用10x 2S 2bin且一个利用10x 0.5s 10bin。
在一些情况下,可以在不进行酶促转移的情况下生成具有5'至3'取向的寡核苷酸阵列。例如,模板寡核苷酸阵列上的合成核酸序列的未结合端可以包括与寡核苷酸的阵列结合端上或附近的序列互补的连接子序列,从而允许所述寡核苷酸合拢。所述寡核苷酸可以进一步包括处于相同端的限制序列。合拢寡核苷酸上的限制序列的消化用来翻转含有连接子序列的全长寡核苷酸且松开所述阵列上缺乏所述连接子序列的任何部分长度寡核苷酸产物。可以使用许多限制酶和其相关限制位点,包括但不限于EcoRI、EcoRII、BamHI、HindIII、TaqI、NotI、HinFI、Sau3AI、PvuII、SmaI、HaeIII、HgaI、AluI、EcoRV、EcoP15I、KpnI、PstI、SacI、SalI、ScaI、SpeI、SphI、StuI和XbaI。
用于寡核苷酸阵列转移方法的表面
用于如本文中所提供的转移方法的表面(例如,模板表面和/或受者表面)可以包括多种可能的材料。在一些情况下,所述表面包括基底上的聚合物凝胶,诸如聚丙烯酰胺凝胶或PDMS凝胶。在一些情况下,所述表面包括无基底载体的凝胶。在一些情况下,所述表面包括基底上的薄涂层,诸如亚-200nm聚合物涂层。在一些情况下,所述表面包括未经涂布的基底,诸如玻璃或硅。
所述涂层和/或凝胶可以具有一定范围的厚度或宽度。所述凝胶或涂层可以具有约0.0001、0.00025、0.0005、0.001、0.005、0.01、0.025、0.05、0.1、0.2、0.5、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175或200mm的厚度或宽度。所述凝胶或涂层可以具有小于0.0001、0.00025、0.0005、0.001、0.005、0.01、0.025、0.05、0.1、0.2、0.5、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175或200mm的厚度或宽度。所述凝胶或涂层可以具有大于0.0001、0.00025、0.0005、0.001、0.005、0.01、0.025、0.05、0.1、0.2、0.5、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175或200mm的厚度或宽度。所述凝胶或涂层可以具有至少0.0001、0.00025、0.0005、0.001、0.005、0.01、0.025、0.05、0.1、0.2、0.5、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175或200mm的厚度或宽度。所述凝胶或涂层可以具有至多0.0001、0.00025、0.0005、0.001、0.005、0.01、0.025、0.05、0.1、0.2、0.5、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175或200mm的厚度或宽度。所述凝胶或涂层可以具有介于0.0001与200mm之间、介于0.01与20mm之间、介于0.1与2mm之间或介于1与10mm之间的厚度或宽度。所述凝胶或涂层可以具有约0.0001至约200mm之间、约0.01至约20mm、约0.1至约2mm或约1至约10mm的厚度或宽度。在一些情况下,所述凝胶或涂层包括约10微米的宽度或厚度。
凝胶和涂层可以另外包括诸多组分以修饰其物理化学性质,例如疏水性。例如,聚丙烯酰胺凝胶或涂层可以在其聚合物结构中包括改性丙烯酰胺单体,诸如乙氧基化丙烯酰胺单体、磷酸胆碱丙烯酰胺单体和/或甜菜碱丙烯酰胺单体。
凝胶和涂层可以另外包括标记或允许并入标记的反应位点。标记可以包括寡核苷酸。例如,可以在聚丙烯酰胺凝胶或涂层的聚合过程中添加5'-acrydite修饰的寡核苷酸。用于并入标记的反应位点可以包括溴乙酰基位点、叠氮化物、与叠氮化物-炔烃Huisgen环加成相容的位点或其他反应位点。可以用受控方式将标记并入聚合物涂层中,其中特定标记位于聚合物涂层的特定区域。标记可以随机并入聚合物涂层中,借此,特定标记可以随机分布在聚合物涂层中。
在一些情况下,具有凝胶涂层的表面可以如下制备:清洁玻璃载片(例如,用NanoStrip溶液),冲洗(例如,用DI水)并且干燥(例如,用N2);用丙烯酰胺单体对所述玻璃载片表面进行官能化;制备硅烷化溶液(例如以体积计含5%(3-丙烯酰胺基丙基)三甲氧基硅烷的乙醇和水);将所述玻璃载片浸在所述硅烷化溶液中(例如,在室温下持续5小时),冲洗(例如,用DI水),并且干燥(例如,用N2);制备12%丙烯酰胺凝胶混合物(例如,5mL H2O、1mg明胶、600mg丙烯酰胺、32mg双丙烯酰胺);制备6%丙烯酰胺凝胶混合物(例如,50μL12%丙烯酰胺凝胶混合物、45μL DI水、5μL 5'-acrydite修饰的寡核苷酸引物(1mM,涡旋成混合物);激活6%丙烯酰胺凝胶混合物(例如,每100μL凝胶混合物各加入1.3μL 5%过硫酸铵和1.3μL 5%TEMED并且涡旋);将凝胶混合物施加至表面(例如硅烷化官能化玻璃载片表面),均匀扩散(例如通过用盖玻片按压或通过旋涂),并且允许聚合(例如,在室温下20分钟)。
寡核苷酸阵列扩增和再生
在一些情况下,各阵列部分中的阵列区段(例如,核酸、寡核苷酸)数目可以扩增或再生。如果模板阵列上的阵列组分已经有所消耗,例如由于转移期间的损失,则可能需要对模板阵列进行扩增。如果受者阵列上的阵列组分数目较低,例如由于从具有低密度或低数目阵列组分的模板阵列中转移之故,则可能需要对受者阵列进行扩增。例如,图29示出了用于酶促转移和随后扩增50-70个扩增循环的模板阵列。
可以通过使用模板聚合物(例如,寡核苷酸)上的接头序列来辅助扩增。模板聚合物(例如寡核苷酸)可以包括期望最终序列加上一个或多个接头序列。例如,模板寡核苷酸可以按顺序包括具有第一接头序列的3'端、具有第二接头序列的5'端和处于中间的期望最终序列。所述第一接头序列与所述第二接头序列可以相同或可以不同。在一些情况下,相同阵列斑点中的寡核苷酸包含同一的第一接头序列和第二接头序列以及最终序列,且不同阵列斑点中的寡核苷酸包含同一的第一接头序列和第二接头序列但不同的最终序列。受者阵列上的引物可以与接头序列互补,这可以允许引物与模板聚合物(例如,寡核苷酸)之间的杂交。这样的杂交可能有助于阵列的扩增或再生。与阵列偶联的引物(例如,寡核苷酸)可以为一般引物,例如通用或随机引物,或靶特异性引物。
阵列组分的扩增可以通过酶促发生。例如,如果阵列(例如模板和/或受者)组分包括寡核苷酸,则扩增可以通过核酸扩增反应而发生,所述核酸扩增反应诸如聚合酶链反应(PCR)、桥式扩增、桥式PCR、等温PCR、等温桥式扩增、等温桥式PCR、连续流式PCR、重组酶聚合扩增(RPA)或其他反应。所使用的酶可以包括多种酶,诸如PolI、PolII、PolIII、Klenow、T4DNA Pol、修饰T7DNA Pol、突变修饰T7DNA Pol、TdT、Bst、Taq、Tth、Pfu、Pow、Vent、Pab或其他聚合酶;解旋酶;重组酶;或其他酶。
阵列(例如模板和/或受者)上的偶联聚合物(例如,核酸、寡核苷酸)的强度或密度可以通过扩增来恢复。阵列(例如模板和/或受者)上的偶联聚合物(例如,核酸、寡核苷酸)的强度或密度可以通过扩增而增加至超过其初始值。阵列(例如模板和/或受者)斑点可以在扩增期间生长。例如,桥式扩增或桥式PCR可以导致核酸分子在28个扩增循环期间生长或行走50-100nm。
阵列表面可以包括防止阵列(例如,模板和/或受者)组分扩增至超过其个别特征边界的屏障。屏障可以包括物理边界、反应边界或其他边界。边界可以通过激光烧蚀表面偶联特征(例如核酸或其他聚合物)来制造。边界可以通过光激活保护基来制造;例如,光激活保护基可以在整个阵列(例如,模板和/或受者)上与核酸偶联,然后可以仅对期望区域进行脱保护。
在一些情况下,模板寡核苷酸阵列可以通过标准手段生成,且可以从所述模板生成多个受者转移寡核苷酸阵列作为互补序列或受者阵列。受者阵列可以使用本文中所提供的面对面转移方法来生成。这可以降低制造成本。在一些情况下,可以从各模板寡核苷酸阵列生成至少5、10、20、50、100、200、500、1,000、2,000、5,000、10,000、20,000、100,000、200,000、500,000个互补序列阵列或受者阵列。例如,图30示出了模板阵列转移前(左)和按照如本文中所提供的面对面酶促凝胶转移进行五次转移后(右)的图像。各互补序列阵列可以产生与模板阵列上的模板分子中的至少50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%或100%互补的寡核苷酸探针。
受者转移寡核苷酸阵列可以包括比通过标准手段制造的阵列更加适宜酶促的环境,从而允许在阵列表面上或附近进行多种反应。例如,受者转移阵列可以包括聚合物凝胶或涂层,诸如聚丙烯酰胺,这与诸如玻璃或硅之类的未涂布表面相比可能对酶活性更适宜。
可以制造包括3'端向上的寡核苷酸的受者转移寡核苷酸阵列。对于杂交来说,这可以降低空间位阻。这还可以提供呈可用于进一步延伸,包括边合成边测序或基因分型(例如SNP检测)的配置的寡核苷酸。
受者转移寡核苷酸阵列可以用非常长的寡核苷酸(例如,大于50个碱基对)生成。尽管非常长寡核苷酸的合成可能产生非常少的全长寡核苷酸产物,但本发明中所描述的组合物和方法可以生成主要或仅包括全长寡核苷酸的受者转移阵列。
在一些情况下,本发明中所描述的组合物和方法可以提供具有呈5'至3'取向且在酶促相容表面上的高分辨率限定(即,非随机)序列的阵列。
对于酶促转移法来说,寡聚物固定化可以减少阵列特征之间的交叉污染。此外,对于单链模板来说,可以消除对在转移之前制造互补链的需要
对阵列表面上的核酸进行位置测序
在寡核苷酸阵列或芯片使用如本文提供的方法合成(和/或转移)后,包含核酸("靶多核苷酸")的样品可被拉伸并固定在如概述于图1和2中并描述于图3中的寡核苷酸阵列的表面上。包含所述核酸的样品可为如本文提供的任何样品。所述核酸可为如本文提供的任何核酸。在一些情况下,所述核酸是DNA。在一些情况下,所述DNA是基因组DNA。所述基因组DNA可为染色体或染色体片段。使用本文提供的方法制造的寡核苷酸阵列可用于测定多核苷酸或核酸分子诸如RNA、DNA、染色体及其片段的序列。此类多核苷酸在本文中被称为模板或靶多核苷酸。在一些情况下,靶多核苷酸在使用本文提供的方法生成的寡核苷酸阵列上拉伸。所述阵列上的寡核苷酸可包含如本文所描述的位置条形码。寡核苷酸阵列可为模板或受者阵列。在一些情况下,在拉伸之前,处理寡核苷酸阵列(如模板或受者阵列)上的靶多核苷酸。
靶多核苷酸处理
在一些情况下,在如本文提供的寡核苷酸阵列上拉伸之前处理靶多核苷酸涉及从样品分离或提取靶多核苷酸。所述样品可为如本文提供的任何样品。可使用本领域已知的用于提取Mb长DNA的任何方法,诸如例如Zhang,M.等Preparation of megabase-sized DNAfrom a variety of organisms using the nuclei method for advanced genomicsresearch.Nature protocols 7,467-478,(2012)中所述的方法,其公开内容通过引用整体并入本文。在一个实例中,可使用BioRad哺乳动物基因组插块试剂盒(BioRad MammalianGenomic DNA Plug Kit)。简而言之,洗涤插块,熔化琼脂糖且随后用β-琼脂糖酶消化。一旦分离,待用于本文提供的方法中的靶多核苷酸可如下所述进一步处理。
在一些情况下,将从样品分离的靶多核苷酸进一步处理,使得引物(如寡核苷酸)结合位点添加至靶多核苷酸。例如,如图1和图2所示,可将通用引物结合位点掺入模板核酸分子102、202。引物结合位点是可包含与引物中的限定序列互补的序列的核酸区域。包含限定序列的引物可为结合至如本文提供的模板或受者阵列的寡核苷酸。所述限定序列可为接头序列。所述限定序列可以为通用序列。模板核酸中的引物结合位点可用于将包含引物结合位点的模板核酸偶联或结合至包含与引物结合位点互补的序列的引物。阵列结合的引物的限定序列(如接头或通用)可以直接诸如通过与模板核酸内的引物结合位点序列杂交,能够偶联至包含互补引物结合位点的模板核酸。阵列结合的引物的限定序列(如接头或通用)可以间接诸如通过与与游离引物中的限定序列互补的引物结合位点序列杂交,能够偶联至模板核酸,同时游离引物可以能够与模板核酸杂交。在一些情况下,引物以限定的间隔杂交。在其它情况下,所述引物以随机的间隔杂交。引物(如结合的阵列或非阵列)优选沿着至少50、100、200、300、400、500、1,000、1,200、1,400、1,600、1,800或2,000个碱基对的靶多核苷酸以间隔与靶多核苷酸杂交。所述引物(如结合的阵列或非阵列)可与靶多核苷酸上的随机序列或使用本文提供的方法引入的靶多核苷酸上的引物结合位点杂交。引物结合位点可包含至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个碱基。引物结合位点可包含至多5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个碱基。
在一些情况下,将引物(如寡核苷酸)结合位点使用切口酶添加至靶多核苷酸,然后连接引物(如寡核苷酸)结合位点。所述方法可包括使用仅在CCD位点处切割一条链的Nt.CviPII或任何其它适合的切口酶,对靶多核苷酸(如长DNA分子)酶促切口。在对靶多核苷酸切口后,靶多核苷酸的切口端可用磷酸酶(如下一代虾碱性磷酸酶(rSAP))处理以去除5'磷酸并防止靶多核苷酸的切口端连接。在一些情况下,对靶多核苷酸切口并去除5'磷酸在单个反应中进行。例如,用Nt.CviPII和rSAP处理靶多核苷酸可在单一反应缓冲液(即NEBuffer 2.1,New England Biolabs)中进行。随后,所述酶可热失活,然后连接引物结合位点至切口内的靶多核苷酸的3'端。这一过程的实例示于图31中。最后,将具有附加的引物结合位点的处理过的靶多核苷酸可在0.5M pH 5.5缓冲液中稀释并倾倒至拉伸储库中以将其制备用于在使用本文提供的方法制造的寡核苷酸阵列上梳理(拉伸)。
在一些情况下,可将通用引物结合位点经由转座子插入掺入到靶多核苷酸(也被称为模板核酸分子)中,例如如图1(102)所概述以及如图32所示。优选地,将此类引物-结合位点平均每至少50、100、200、300、400、500、1,000、1,200、1,400、1,600、1,800或2,000个碱基对沿着靶多核苷酸的长度插入。转座子可以各个间隔整合至靶多核苷酸诸如DNA中。转座子可以约100、200、500、1000、1500或2000个碱基对的平均量插入。图32显示通过转座子插入添加至靶多核苷酸3200的引物结合位点3201。所述引物结合位点可包含限定序列。所述限定序列可为通用序列、接头序列和/或条形码序列。引物结合位点可包含通用序列、接头序列和/或条形码序列。用于转座子整合的方法例如描述于美国专利申请公开No.US 2012/0208724A1中,其公开内容通过引用整体并入本文。
在一些情况下,通用引物结合位点可经由与非基底结合或阵列结合的引物杂交而掺入到靶多核苷酸中,例如如图2(202)所列。所述非基底结合的引物可被认为游离引物。所述非基底结合的引物可在溶液中。例如,如图33所示,模板核酸(靶多核苷酸)3300可与游离引物接触,所述引物包含与模板核酸分子3300杂交的随机序列3301(如随机五聚体、随机六聚体或随机九聚体)和不与模板核酸分子3300杂交的引物结合位点序列3302。如本文所描述,所述引物结合位点可包含限定序列。所述限定序列可为通用序列、接头序列和/或条形码序列。所述引物结合位点可包含通用序列、接头序列和/或条形码序列。用于引入引物结合位点到如本文提供的靶多核苷酸中的游离引物中的随机序列可为至少5、6、7、8、9、10、11、12、13、14或15个碱基对长。在一些情况下,所述随机序列可为至多5、6、7、8、9、10、11、12、13、14或15个碱基对长。在一些情况下,所述随机序列可为5、6、7、8、9、10、11、12、13、14或15个碱基对长。在一些情况下,所述随机序列可为大于5、6、7、8、9、10、11、12、13、14或15个碱基对长。在一些情况下,所述随机序列可为小于5、6、7、8、9、10、11、12、13、14或15个碱基对长。阵列结合的引物可包含与游离引物的引物结合位点序列互补并可经由互补序列之间的结合与游离引物的引物结合位点序列杂交的限定序列(如接头、通用和/或条形码序列),从而使模板核酸与寡核苷酸阵列(模板或受者阵列)直接偶联。这一过程的实例示于图38中并在本文描述。所述寡核苷酸阵列可使用本文提供的任何方法生成。
在一些情况下,靶多核苷酸可被切口,并且可通过引物延伸将生物素化核苷酸添加至所得的核酸片段,从而产生在一端处或附近具有生物素的核酸片段。可选地,用生物素标记的随机引物(如随机六聚体或随机九聚体)进行靶多核苷酸延伸,从而产生在一端处或附近具有生物素的核酸延伸产物。在任何情况下,引物延伸可通过适合的酶进行,包括聚合酶诸如PolI、PolII、PolIII、Klenow、T4DNA Pol、修饰的T7DNA Pol、突变修饰的T7DNA Pol、TdT、Bst、Taq、Tth、Pfu、Pow、Vent、Pab、Phusion和Phi-29。例如,可使用Bst聚合酶,通过在65℃下在1X等温扩增缓冲液(如20mM Tris-HCl、10mM(NH4)2SO4、50mM KCl、2mM MgSO4和0.1%Tween 20)中将靶多核苷酸和引物与Bst聚合酶和dNTP一起孵育来进行反应。包含生物素的DNA分子,诸如如上文所述制备的DNA片段或DNA延伸产物,然后可在拉伸基底上连同它们的模板DNA分子一起拉伸。
在一些情况下,靶多核苷酸可被切口,并且可逆地终止核苷酸可添加至所得DNA片段的3'端以防止或减少连接。在一些情况下,在核苷酸的存在下使用随机引物(如随机六聚体或随机九聚体)对靶多核苷酸模板进行延伸,从而产生DNA延伸产物。如本文所描述,所述随机引物可用生物素在一个末端处或附近标记,使得延伸产生在一个末端处或附近具有生物素的DNA延伸产物。用于延伸的核苷酸可为与小百分比的终止子核苷酸混合的天然核苷酸,从而产生在所得DNA延伸产物的3'端处具有终止核苷酸的一些延伸产物。此类DNA延伸产物不太可能连接。引物延伸可通过适合的酶进行,包括聚合酶诸如PolI、PolII、PolIII、Klenow、T4DNA Pol、修饰的T7DNAPol、突变修饰的T7DNA Pol、TdT、Bst、Taq、Tth、Pfu、Pow、Vent、Pab和Phi-29。例如,可使用Bst聚合酶通过在65℃下在1X等温扩增缓冲液(如20mMTris-HCl、10mM(NH4)2SO4、50mM KCl、2mM MgSO4和0.1%Tween 20)中将靶多核苷酸和引物与Bst聚合酶和dNTP一起孵育来进行反应。dNTP可具有小百分比的终止子核苷酸。DNA分子,诸如如上文所述制备的DNA片段或DNA延伸产物然后可在拉伸基底上连同它们的靶多核苷酸一起拉伸。
靶多核苷酸拉伸
在一些情况下,用于本文提供的方法中的靶多核苷酸被拉伸。所述靶多核苷酸可为如本文提供的DNA。拉伸可通过各种方法进行,包括但不限于分子梳、转印、分子穿越、纳米通道、电力、磁力、光力(optical force)和水动力。拉伸可通过方法组合例如使用分子梳理和纳米通道进行。DNA拉伸可为一个工艺,通过该工艺将于溶液中的DNA("游离DNA")可置于储库中,并且疏水性-涂覆的载玻片可浸入至DNA溶液中并缩回。尽管可能尚未完全理解该工艺的物理性质,但DNA端可通过疏水性相互作用与载玻片表面相互作用,并且缩回所述载玻片的工艺可产生缩回弯月面,所述缩回弯月面可用于牵拉DNA以线性方式跨过表面(参见图31和34的表面上拉伸的标记DNA的实施例)。DNA拉伸可为可产生在表面或基底上拉伸的高密度堆积的DNA分子的高度并行工艺。本领域技术人员可理解DNA拉伸可在多种表面上进行,并且用于在特定表面上拉伸的特定条件可使用本领域已知的方法进行优化。表面或基底的种类可为玻璃、硅和/或聚合物或聚合物涂覆的表面。拉伸基底可包含特征,诸如微通道、纳米通道、微柱或纳米柱。拉伸基底可与引物阵列相同或可为单独的基底。DNA分子的尺寸范围可为数百个kb至大于1Mb。通过拉伸进行的完整的数kb至Mb长度靶多核苷酸(如DNA分子)的固定可提供解析在基因组复杂的重复区域中的序列的能力,并且可进一步降低与WGS相关的测序成本。拉伸可提供改善的用于与模板核酸分子杂交的进入。拉伸可增加模板核酸分子的线性度。拉伸核酸可增加核酸区域之间的分辨度或距离。拉伸可使DNA的长度增加至1.5倍DNA结晶学长度。一旦靶多核苷酸(如DNA)已被拉伸并结合至固体表面,可对其探测以创建骨架用于组装如本文所描述的短NGS读段。例如,如图1和图2所示,在制备具有条形码的位置标记和随后的应用(如NGS)中,如本文所提供的处理过的靶多核苷酸(也被称为模板核酸)可为拉伸或延长的103、203。模板核酸可在寡核苷酸阵列(如模板或受者寡核苷酸阵列)上拉伸。
尽管拉伸可在溶液中或基底上发生,但拉伸过的靶多核苷酸可最终放在基底上或者可以延长的方式定位在基底上。例如,图35显示在阵列基底3500上的拉伸过的核酸分子3502,其包含簇阵列点3501。在另一个实例中,图36显示阵列基底3600上的拉伸核酸分子3602,其包含阵列点3601的二维阵列。阵列基底可为如本文所描述的模板和/或受者寡核苷酸阵列。
所述拉伸基底可包含表面涂层或官能化(functionalization)。所述表面涂层或官能化可为疏水性或亲水性的。所述拉伸基底可为具有基于聚)马来酸酐)-的梳状共聚物)的胺衍生的载玻片。所述表面涂层可包括聚合物涂层,诸如聚丙烯酰胺。所述表面涂层可包含凝胶,诸如聚丙烯酰胺凝胶。所述表面涂层可包含金属,诸如图案化电极或电路。所述表面涂层或官能化可包含结合剂,诸如链霉亲和素、亲和素、抗体、抗体片段或适配体。所述表面涂层或官能化可包含如用于拉伸核酸的延伸片段的引物。所述表面涂层或官能化可包含多个元件,例如聚合物或凝胶涂层和结合剂,或者聚合物凝胶涂层和引物。所述拉伸基底可包含引物阵列。引物阵列在本公开的其它地方进一步讨论。
在一些情况下,使所述靶多核苷酸经受分子梳(也被称为DNA梳理或染色体梳理)。所述分子梳方法可为诸如在下文描述的一种方法:Gueroui,Z.,Place,C.,Freyssingeas,E.&Berge,B.Observation by fluorescence microscopy of transcription on singlecombed DNA.Proceedings of the National Academy of Sciences of the UnitedStates of America 99,6005-6010,(2002)或Bensimon,A.等Alignment and sensitivedetection of DNA by a moving interface.Science265,2096-2098,(1994)或Michalet,X.等Dynamic molecular combing:stretching the whole human genome for high-resolution studies.Science 277,1518-1523,(1997)或Allemand等,1997,BiophysicalJournal 73:20642070,其各个公开内容通过引用整体并入本文。核酸(如DNA)链末端可键合至基底,例如至基底(如硅烷化玻璃板)上的可电离基团。核酸(如DNA分子)与基底的键合可在特定pH、诸如低于可电离基团的pKa的pH下实现。溶液中的核酸分子(如DNA分子)可通过移动跨过基底的溶液的缩回弯月面进行梳理和拉伸。所述核酸(如DNA)可通过倚着拴系分子端牵拉的缩回弯月面进行拉伸。拉伸的程度可独立于核酸(如DNA)长度。在一些情况下,所述拉伸核酸(如DNA)包含每1μm约2kb。
在一些情况下,如本文提供的靶多核苷酸的拉伸通过转印进行。转印方法可为诸如在Zhang等,2005,Langmuir 21:4180-4184中所述的一种方法,其公开内容据此通过引用整体并入。拉伸的核酸可通过用分子梳理拉伸制备并在印记诸如PDMS印记上比对。在印记上拉伸的核酸可例如通过氨基-终止的表面修饰锚定或键合至表面。接触或转印可用于从印记转移比对的核酸至表面。在一些情况下,所述弯月面速度可影响表面上的核酸密度。
在一些情况下,拉伸如本文提供的靶多核苷酸通过分子穿越来进行。分子穿越方法可为诸如在Payne等,2013,PLoS ONE 8:e69058中所述的一种方法,其公开内容据此通过引用整体并入。核酸分子(如DNA分子)在溶液中的液滴可在表面附近定位。探针,诸如经PMMA处理的玻璃针,可用于捕获溶液中的单独核酸分子(如DNA分子)。所述探针然后可从溶液牵拉,从而拉伸相关联的核酸分子(如DNA分子)。拉伸过的核酸分子(如DNA分子)然后可沉积在表面上。在一些情况下,拉伸过的核酸分子(如DNA分子)可以小于或等于约100nm间隔放置。
在一些情况下,拉伸如本文提供的靶多核苷酸通过使用纳米通道来进行。通过使用纳米通道拉伸可诸如描述于Reisner等,2012,Rep.Prog.Phys.,75(10):106601或美国专利No.7,670,770中,其公开内容各自在此通过引用整体并入。纳米通道的宽、高、直径或水动力半径(hydrodynamic radius)可为约200、190、180、170、160、150、140、130、120、110、100、90、80、70、60、50、40、30、20或10nm。纳米通道可在包括聚合物、玻璃和硅的材料中形成。核酸分子(如DNA分子)当在纳米通道中限制时可由于自我回避性相互作用伸出。在纳米通道中延伸或拉伸核酸(如DNA)可取决于核酸(如DNA)溶液的离子强度。
在一些情况下,拉伸如本文提供的靶多核苷酸通过使用纳米结构来进行。通过使用纳米结构拉伸可诸如描述于美国专利No.RE42315中,其公开内容据此通过引用整体并入。基底上的纳米结构可包含纳米沟槽,并且所述基底可具有悬浮其上的脂质双层。可以驱动核酸分子(如DNA分子)通过膜而进入沟槽中并拉伸。
在一些情况下,拉伸如本文提供的靶多核苷酸通过磁力(诸如磁镊)来进行。磁力方法可为诸如Haber和Wirtz,2000,Rev.Sci.Instrum.71:4561中所述的一种方法,其公开内容据此通过引用整体并入。核酸分子(如DNA分子)可连接至磁性颗粒或珠粒,其然后可用施加的磁场操作。例如当分子的一端连接至磁性颗粒并且分子的另一端连接或拴系至基底时,施加的磁力可用于拉伸核酸分子(如DNA分子)。
在一些情况下,拉伸如本文提供的靶多核苷酸通过光力(诸如光镊)来进行。光力方法可为诸如Wang等,1997,Biophysical Journal,72(3):1335-1346中所述的一种方法,其公开内容据此通过引用整体并入。核酸分子(如DNA分子)可连接至磁性颗粒或珠粒,其然后可用光阱操作。例如当分子的一端连接至捕获的颗粒并且分子的另一端连接或拴系至基底时,光阱力可用于拉伸核酸分子(如DNA分子)。
在一些情况下,拉伸如本文提供的靶多核苷酸通过电场来进行。电场方法可为诸如Ferree和Blanch,2003,Biophysical Journal,85(4):2539-2546中所述的一种方法,其公开内容据此通过引用整体并入。核酸分子(如DNA分子)可诸如通过生物素-链霉亲和素结合或其它方法拴系至基底。施加的电场然后可用于产生拉伸分子的力。
在一些情况下,拉伸如本文提供的靶多核苷酸通过水动力来进行。水动力方法可为诸如在Kim等,2007,Nature Methods,4:397-399中所述的一种方法,其公开内容据此通过引用整体并入。靶多核苷酸可诸如通过生物素-链霉亲和素结合或其它方法拴系至基底。围绕靶多核苷酸的流体流动可提供拉伸分子的力。
在一些情况下,靶多核苷酸可在拉伸基底上拉伸,然后与引物阵列(如模板和/或受者寡核苷酸阵列)接触。可选地,靶多核苷酸可直接在引物阵列(如模板和/或受者寡核苷酸阵列)上拉伸。
在一些情况下,分子梳用于拉伸如本文提供的寡核苷酸阵列(如模板和/或受者寡核苷酸阵列)上的靶多核苷酸。所述靶多核苷酸可为来自如本文提供的任何模板核酸来源的任何模板核酸。可存在多个影响DNA与阵列结合的变量。两个关键变量可为滑动面特征和缓冲液的化学组成。本领域技术人员将理解,可能需要改变差别参数诸如表面性质以在寡核苷酸芯片或阵列上优化分子梳。在一些情况下,乙烯基-官能化滑动用于分子梳。表面特征可为影响如Allemand,J.F.,Bensimon,D.,Jullien,L.,Bensimon,A.&Croquette,V.pH-dependent specific binding and combing of DNA.Biophys J 73,2064-2070,(1997)所述的DNA梳理的因素,其公开内容通过引用整体并入本文。在一些情况下,靶多核苷酸的分子梳在氨基-硅烷和乙烯基-硅烷涂覆的载玻片上进行。在一些情况下,模板寡核苷酸阵列至如本文所描述的受者阵列的面对面酶促凝胶转移在官能化PDMS上进行,所述PDMS已用乙烯基-或氨基-硅烷处理。在一些情况下,模板寡核苷酸阵列至如本文所描述的受者阵列的面对面酶促凝胶转移在官能化丙烯酰胺表面上进行,所述表面已用乙烯基-或氨基-硅烷处理。丙烯酰胺可使用各种的经修饰的单体官能化,诸如在Seiffert,S.&Oppermann,W.Amine-Functionalized Polyacrylamide for Labeling and CrosslinkingPurposes.Macromolecular Chemistry and Physics 208,1744-1752,(2007)中所描述,其公开内容通过引用整体并入本文。
此外,本领域技术人员将理解,可能需要最优化表面处理以用于如本文提供的分子梳,并因此使得酶接近靶多核苷酸。在一些情况下,靶多核苷酸的拉伸常数在表面上减小以获得更高的聚合酶效率。所述表面可为已用乙烯基-或氨基-硅烷处理的官能化PDMS。所述表面可为已用乙烯基-或氨基-硅烷处理的官能化丙烯酰胺表面。
固定化
本公开提供将核酸固定在基底上的方法和组合物。任选地,固定化可用于帮助将延伸或扩增产物从模板核酸(“靶多核苷酸”)上分离。在一些情况下,靶多核苷酸被固定至固定化基底。
许多不同的材料适合用作固定化基底。固定化基底可包括玻璃、硅、聚合物(例如聚丙烯酰胺、PMMA)或金属。固定化基底可包含物理特征,如微通道或纳米通道。
固定化基板可包含表面涂层或官能化。表面涂层或官能化可以是疏水性的或亲水性的。表面涂层可以包含聚合物涂层,诸如聚丙烯酰胺。表面涂层可以包含凝胶,诸如聚丙烯酰胺凝胶。表面涂层可以包含金属,诸如图案化电极或电路。表面涂层或官能化可以包含结合剂,诸如链霉亲和素、亲和素、抗体、抗体片段或适配体。表面涂层或官能化可包含多种要素,例如聚合物或凝胶涂层和结合剂。
在一些情况下,靶多核苷酸可被切口,并且可以通过引物延伸将生物素化的核苷酸添加至所得核酸片段,从而产生在一端处或附近具有生物素的核酸片段。可选地,用生物素标记的随机引物(例如随机六聚体或随机九聚体)进行核酸分子模板延伸,从而产生在一端处或附近具有生物素的核酸延伸产物。在任何情况下,引物延伸可通过适合的酶进行,包括聚合酶,诸如PolI、PolII、PolIII、Klenow、T4DNA Pol、修饰的T7DNA Pol、突变修饰的T7DNA Pol、TdT、Bst、Taq、Tth、Pfu、Pow、Vent、Pab和Phi-29。例如,可使用Bst聚合酶,通过在65℃下在1X等温扩增缓冲液(例如20mM Tris-HCl,10mM(NH4)2SO4,50mM KCl,2mM MgSO4和0.1%吐温20)中将模板核酸和引物与Bst聚合酶和dNTP一起孵育来进行反应。在一些情况下,靶多核苷酸是包含生物素的DNA分子。包含生物素的DNA分子,诸如如上文所述制备的DNA片段或DNA延伸产物,随后可在拉伸基底上与它们的模板DNA分子一起拉伸。随后可使拉伸基底上的DNA与固定化基底接触。固定化基底可包含结合剂,诸如亲和素或链霉亲和素。生物素可用于将DNA分子经由亲和素或链霉亲和素与固定化基底结合。可使用加热或其他变性方法使拉伸基底和固定化基底分离。随后固定化基底可与包含本公开中所描述的位置编码的引物(寡核苷酸)的引物基底(例如,本文提供的寡核苷酸排列)接触。引物可以连接到固定化基底上的DNA片段或DNA延伸产物,以用条形码编码位置信息,或以添加可用于对文库结构测序的接头。
在一些情况下,DNA分子可被切口,并且可逆终止核苷酸可添加到所得DNA片段的3'端以防止或减少连接。在一些情况下,在核苷酸存在下使用随机引物(例如随机六聚体或随机九聚体)对靶多核苷酸模板进行延伸,从而产生DNA延伸产物。如本文所描述,随机引物可用生物素在一端处或附近标记,使得延伸产生在一端处或附近具有生物素的DNA延伸产物。用于延伸的核苷酸可以是与小百分比的终止子核苷酸混合的天然核苷酸,从而产生在所得DNA延伸产物的3'端处具有终止核苷酸的一些延伸产物。此类DNA延伸产物不太可能连接。引物延伸可通过适合的酶进行,包括聚合酶,诸如PolI、PolII、PolIII、Klenow、T4DNAPol、修饰的T7DNA Pol、突变修饰的T7DNA Pol、TdT、Bst、Taq、Tth、Pfu、Pow、Vent、Pab和Phi-29。例如,可使用Bst聚合酶通过在65℃下在1X等温扩增缓冲液(例如20mM Tris-HCl,10mM(NH4)2SO4,50mM KCl,2mM MgSO4和0.1%吐温20)中将模板核酸和引物与Bst聚合酶和dNTP一起孵育来进行反应。dNTP可具有小百分比的终止子核苷酸。DNA分子,诸如如上文所述制备的DNA片段或DNA延伸产物,随后可在拉伸基底上与它们的模板DNA分子一起拉伸。随后可使拉伸基底上的DNA与固定化基底接触。固定化基底可包含结合剂,诸如亲和素或链霉亲和素。生物素可用于将DNA分子经由亲和素或链霉亲和素与固定化基底结合。可使用加热或其他变性方法使拉伸基底和固定化基底分离。随后固定化基底可与包含本公开中所描述的位置编码的引物的引物基底接触。引物可以连接到固定化基底上的DNA片段或DNA延伸产物,以用条形码编码位置信息,或以添加可用于对文库结构测序的接头。
延伸反应
一旦靶多核苷酸如本文所提供被分离并处理,就可从靶多核苷酸中生成位置条形码延伸产物。在一些情况下,如本文所提供被处理的靶多核苷酸在拉伸基底上被拉伸并在进行引物延伸反应之前与在引物阵列(例如,模板和/或受者寡核苷酸阵列)上的引物接触,如图1和图2中概述的。如图37中所示,包含凝胶表面涂层3702的引物基底3700可以与包含拉伸靶多核苷酸的拉伸基底3701接触。可选地,靶多核苷酸可以被拉伸、固定在固定化基底上,并与在引物阵列(例如模板和/或受者寡核苷酸阵列)上的引物接触。可选地,靶多核苷酸可以直接在引物阵列(例如模板和/或受者寡核苷酸阵列)基底上拉伸。引物阵列(例如模板和/或受者寡核苷酸阵列)上的引物可以使用本文提供的方法与引入到靶多核苷酸的引物结合位点杂交。
可进行延伸反应来使用靶多核苷酸区段作为模板将与靶多核苷酸杂交的引物延伸。靶多核苷酸可以是拉伸过的靶多核苷酸。与靶多核苷酸(例如拉伸过的多核苷酸)杂交的引物可以是非基底结合的(即游离在溶液中)或基底结合的。在一些情况下,如图1和图2中所概述,用与引物阵列(例如模板和/或受者寡核苷酸阵列)结合的引物进行延伸反应来生成包含与靶多核苷酸106、206的区段互补的序列的位置编码的延伸产物。所得延伸产物仍可与引物阵列(例如模板和/或受者寡核苷酸阵列)结合。所得延伸产物可包含PCR引物位点、条形码序列和在阵列结合的初始引物中存在的接头序列以及与靶多核苷酸区段互补的序列。
在一些情况下,引物阵列(例如模板和/或受者寡核苷酸阵列)上的引物(例如寡核苷酸)使用本文所提供的方法在引入到靶多核苷酸的引物结合位点处与拉伸过的靶多核苷酸杂交或偶联。杂交或偶联引物(例如寡核苷酸)可用于进行延伸反应。图38描绘了利用使用本文提供的方法生成的引物阵列(例如模板和/或受者寡核苷酸阵列)生成与靶多核苷酸互补的延伸产物的多步骤过程。在第一步骤中,非阵列结合的引物3822与靶多核苷酸杂交,其可以在使用本文所提供的方法中的任一种进行杂交之前拉伸。在非阵列结合的引物3822与靶多核苷酸之间的杂交可通过非阵列结合的引物3822上的随机序列3813和与靶多核苷酸3830上的随机序列3813互补的序列来促进。这类似于图33中描绘的方法。杂交之后,可利用靶多核苷酸3830作为模板使用本文提供的任何聚合酶将杂交的非阵列结合的引物3822延伸,以便生成与靶多核苷酸3830互补的延伸产物。非阵列结合的引物3822可进一步包含引物结合位点3812以使所述引物结合位点3812不与靶多核苷酸杂交。引物结合位点3812可包含限定序列。限定序列可以是通用序列、接头序列、PCR引物序列和/或条形码序列。引物结合位点3812可包含通用序列、接头序列、PCR引物序列和/或条形码序列。条形码序列可以本文描述的方式编码位置信息。在一些情况下,所使用的聚合酶包含链置换活性。在一些情况下,所使用的聚合酶不包含链置换活性。延伸产物可与包含引物区3810、3820的引物阵列(例如、模板和/或受者寡核苷酸阵列)3800接触。引物区的每一个可包含与引物阵列3800中引物区3810、3820中的一个结合的引物(例如寡核苷酸3821)。阵列结合的引物(例如寡核苷酸;3821)中的每一个可包含序列3811,所述序列与引物结合位点3812互补,并且可因此在与引物结合位点3812杂交时使所提供的延伸产物拴系至基底以生成阵列结合的延伸产物3814,如图38中所示。可选地,在图38中的延伸反应过程中,可发生从游离引物至靶多核苷酸的模板转换,使得延伸产物并入与靶多核苷酸区段互补的序列。
在一些情况下,延伸产物是从与靶多核苷酸偶联的阵列结合的引物产生的,所述靶多核苷酸包含通过如本文提供的转座子插入来引入的引物结合位点。例如,图39描绘了引物基底3900,其包含引物区3910、3920。引物区3910和3920中的每一个都包含与引物基底3900结合的引物(例如寡核苷酸)以使每一个引物(例如寡核苷酸)使用如本文所述的转座子在并入到靶多核苷酸3930的引物结合位点3931处与拉伸过的靶多核苷酸3930结合,并显示于图32中。随后,使杂交或偶联的引物(例如寡核苷酸)延伸以产生阵列结合的延伸产物3912。引物结合位点3931可包含限定序列。限定序列可以是通用序列、接头序列、PCR引物序列和/或条形码序列。引物结合位点3931可以包含通用序列、接头序列、PCR引物序列和/或条形码序列。条形码序列可以本文描述的方式编码位置信息。
延伸反应可用酶进行,诸如本文提供的任何DNA聚合酶。聚合酶可包括但不限于PolI、PolII、PolIII、Klenow、T4DNA Pol、修饰的T7DNA Pol、突变修饰的T7DNA Pol、TdT、Bst、Taq、Tth、Pfu、Pow、Vent、Pab、Phusion和Phi-29。例如,可使用Bst聚合酶通过在65℃下在1X等温扩增缓冲液(例如20mM Tris-HCl,10mM(NH4)2SO4,50mM KCl,2mM MgSO4和0.1%吐温20)中将模板核酸和引物与Bst聚合酶和dNTP一起孵育来进行延伸反应。可以用逆转录酶进行延伸反应。在一些情况下,模板核酸包含RNA,并且酶促延伸反应使用RNA作为模板使引物伸长。用阵列结合的引物和靶多核苷酸进行的延伸反应可以生成阵列结合的延伸产物,其包含模板核酸序列或其互补序列的部分和本文提供的条形码标签序列。
在一些情况下,延伸产物从本文提供的与靶多核苷酸偶联的阵列上的阵列结合的引物产生,所述靶多核苷酸包含通过使用切口酶对靶多核苷酸切口且随后附加引物结合位点而引入的引物结合位点。切口酶可以是本文提供的任何切口酶。在一些情况下,切口酶是Nt.CviPII。可通过连接进行引发结合位点的附加。连接可以是如本文所描述的任何连接方法。靶多核苷酸的拉伸可以是本文提供的任何拉伸法。在一些情况下,使用分子梳进行靶多核苷酸拉伸。包含附加的引物结合位点的靶多核苷酸可以使用分子梳在寡核苷酸阵列上拉伸,以使一个或多个引物结合位点包含与寡核苷酸阵列上的寡核苷酸互补的序列。可通过本文提供的方法制备寡核苷酸阵列。寡核苷酸阵列可以是模板或受者阵列。受者阵列可以使用本文提供的转移法产生。转移法可以是本文提供的面对面酶促转移法。在一些情况下,在寡核苷酸阵列上拉伸的靶多核苷酸上的引物结合位点与包含互补序列的寡核苷酸结合,以使包含结合的引物结合位点的靶多核苷酸的链使用包含互补序列的寡核苷酸的聚合酶用作延伸的模板,从而产生阵列结合的双链靶多核苷酸。例如,图40显示包含引发结合位点的靶多核苷酸,所述引发结合位点通过切口酶和引物结合位点的附加而引入以及随后在通过本文提供的方法制造的寡核苷酸阵列中拉伸。图40步骤a)显示固定化寡核苷酸,其包含与在寡核苷酸阵列中拉伸的靶多核苷酸(拉伸DNA)杂交的寡核苷酸阵列上的条形码(编码/编码')。靶多核苷酸的拉伸可通过使用分子梳来进行。条形码可以是本文提供的位置条形码。图40步骤b)显示延伸以及因此所得的靶多核苷酸(拉伸过的DNA)的复制,得到固定在寡核苷酸阵列上的双链靶多核苷酸(dsDNA)(图40步骤c)。图34显示使用图40中描绘的方法拉伸和延伸的靶多核苷酸的实施例。在图34中,在用来视觉上确认聚合酶延伸的修饰核苷酸(经荧光团标记)存在下用Vent exo-聚合酶(一种热稳定酶)进行引物延伸。然而,本领域技术人员可理解,可使用本文提供的任何适合的聚合酶。在一些情况下,使用包含链置换性质的聚合酶。链置换聚合酶可以是Vent exo-聚合酶以及phi29和Bst。图40步骤d)显示双链靶多核苷酸的片段化,随后进行端修复。在一些情况下,可通过本领域已知的方法获得片段化。可通过物理片段化方法和/或酶促片段化方法进行片段化。物理片段化方法可包括喷雾、超声处理,和/或水动力剪切。在一些情况下,可以通过机械方式实现片段化,包括使核酸经受声学超声处理。在一些情况下,片段化包含用一种或多种酶在适合于所述一种或多种酶的条件下处理核酸以产生双链核酸的断裂。适用于生成核酸片段的酶的实例包括序列特异性和非序列特异性核酸酶。核酸酶的非限制实例包括DNA酶I、片段化酶、限制性内切核酸酶、其变体和其组合。用于进行酶片段化反应的试剂是市售可得的(例如购自NewEngland Biolabs)。例如,DNA酶I的消化可在没有Mg++的情况下和存在Mn++的情况下诱导DNA中随机的双链断裂。在一些情况下,片段化包含用一种或多种限制内切核酸酶处理靶多核苷酸。片段化可生成具有5'突出、3'突出、平端,或其组合的片段。在一些情况下,比如当片段化包含使用一种或多种限制内切核酸酶时,靶多核苷酸的裂解得到具有可预测的序列的突出。在一些情况下,片段化的双链靶多核苷酸如本文提供的被端部修复,从而产生平端。在一些情况下,片段化的双链靶多核苷酸如本文提供的被端部修复并且随后经受如本文提供的A尾部反应。图40步骤e)显示附加接头到片段化的双链靶多核苷酸,随后在图40步骤f)中从寡核苷酸阵列释放双链靶多核苷酸用于测序。从寡核苷酸阵列释放双链靶多核苷酸可伴随有双链靶多核苷酸从寡核苷酸阵列基底上的片段化。可通过利用本文提供的任何方法进行片段化。在一些情况下,阵列结合的引物(寡核苷酸)优选在它们的5'或3'端具有限制酶切位点,其被并入双链靶多核苷酸并且允许双链靶多核苷酸或其部分进行选择性裂解和释放。在一些情况下,使用NEB片段化酶通过酶促方式使双链靶多核苷酸酶裂解。在一些情况下,双链靶多核苷酸与引物基底之间的键可以被热能断裂。在一些情况下,双链靶多核苷酸可以通过机械破坏或剪切从引物基底分开。附加接头至片段化的双链靶多核苷酸可包括连接。可通过本文证明的任何连接方法进行连接。在一些情况下,附加至双链靶多核苷酸的接头包含与本文提供的下一代测序平台(NGS)兼容的序列。在一些情况下,测序平台是Illumina平台。在一些情况下,附加至双链靶多核苷酸的接头包含用于Illumina HiSeq2500中的Illumina引物序列。Illumina引物序列可以是第二Illumina引物。可以使用本领域已知的任何测序方法对所释放的双链靶多核苷酸测序。在一些情况下,使用NGS法对所释放的双链靶多核苷酸测序。NGS法可以是本文提供的任何NGS法。
寡核苷酸阵列上的拓扑异构酶克隆
本文中提供使用本文提供的拓扑异构酶将寡核苷酸阵列(例如模板和/或受者)上的核酸分子克隆、连接或拉伸的方法。本文提供的方法中使用的拓扑异构酶可以是I型拓扑异构酶。在一些情况下,拓扑异构酶是牛痘病毒拓扑异构酶I。核酸可以是DNA或RNA。可以使用本文提供的任何方法分离和/或制备DNA。核酸(例如DNA)可以是来自本文提供的样本。
在一个实施例中,本文提供的使用拓扑异构酶在寡核苷酸阵列上进行克隆、连接或拉伸核酸(例如DNA)的方法可利用包含双链寡核苷酸(诸如图51A中所描绘的双链寡核苷酸)的寡核苷酸阵列或芯片。如图51A中所示,本文提供的寡核苷酸阵列上的每一特征可经设计包含双链寡核苷酸5100,其包含底部接头5101、可变区5102和顶部接头5103。底部接头5101可连接至阵列表面。可通过底部接头5101的5'端和/或3'端连接。可变区5102可以是或包含条形码序列。条形码序列可以如本文所描述的来设计。顶部接头可包含I型拓扑异构酶的识别序列。在一些情况下,I型拓扑异构酶是牛痘病毒拓扑异构酶且识别序列是5'-TCCTT-3',诸如图51A中所描绘。顶部接头可包含在双链寡核苷酸的第一链上的第一识别序列(例如牛痘病毒识别序列)和双链寡核苷酸的第二互补链上的第二识别序列(例如牛痘病毒识别序列)。如图51A中所示,第一识别序列可以在双链寡核苷酸的第一链内,而第二识别序列可以在双链寡核苷酸的第二互补链的5’终端。因为牛痘病毒拓扑异构酶I可以与5'(C/T)CCTT-3'的3'T键合,诸如5100的寡核苷酸可在第一链和第二链上的识别序列的接合点处形成与牛痘病毒拓扑异构酶I的键。
在一些情况下,如图51A中描绘的双链寡核苷酸是通过使包含与第一链的底部接头互补的序列的引物杂交并与聚合酶进行延伸反应而生成的。如图51A中描绘,延伸可产生双链寡核苷酸的第二链。在一些情况下,I型拓扑异构酶是牛痘病毒拓扑异构酶且识别序列是5'-CCCTT-3'。顶部接头5103可进一步包含识别序列的附加的上游序列(5')和下游序列(3')。如图51A中所示,识别序列的下游序列可以是与识别序列互补的序列。在一些情况下,牛痘病毒拓扑异构酶识别序列(即5'-TCCTT-3')的下游序列是5'-AAGGA-3'。在一些情况下,牛痘病毒拓扑异构酶识别序列(即5'-CCCTT-3')的下游序列是5'-AAGGG-3'。
在一些情况下,利用拓扑异构酶的方法中的第一步骤(参见图51B)包括将牛痘病毒拓扑异构酶I与寡核苷酸(诸如图51A中的5100)一起孵育。与牛痘病毒拓扑异构酶I一起的孵育可使拓扑异构酶裂解顶部接头5103中的两个链(参见图51B)。如图51B中所示,拓扑异构酶I还可与识别序列中末端T上的3'磷酸形成共价键。在与牛痘病毒拓扑异构酶I一起孵育之后,包含多种特征的寡核苷酸阵列上的每个特征(其中每个特征包含如图51A中描绘的寡核苷酸)可具有共价连接的拓扑异构酶。
在与拓扑异构酶I一起孵育之后,可在表面上拉伸所关注的DNA分子。所述表面可以是如本文所描述的包含了共价附接到每个特征中的每个寡核苷酸的拓扑异构酶的寡核苷酸阵列。所述表面可以是如本文所描述的固定化表面。DNA可以使用本文提供的任何方法拉伸。一旦DNA被如图51C中所示拉伸,就可以用本领域中已知产生平端的任何限制酶对其进行消化。生成平端之后,可将包含单个腺嘌呤(A)残基的3'突出添加到切割DNA的平端。可使用本领域已知的任何方法进行3’A突出的添加。可以在dATP存在下使用末端转移酶添加3’A突出。可以在dATP存在下使用聚合酶添加3’A突出。聚合酶可以是没有校对活性的聚合酶。在一些情况下,聚合酶可以是Taq聚合酶。在一些情况下,将3’A突出添加到拉伸过的DNA的每个3’端上。在添加3’A突出之后,与如本文所描述的寡核苷酸阵列上的寡核苷酸键合的拓扑异构酶I(参见图51B)可将拉伸过的DNA连接至结合有拓扑异构酶I的寡核苷酸,如图51D中所示。以这种方式,拓扑异构酶I可有利于将拉伸过的DNA分子克隆在如本文提供的寡核苷酸阵列上。拉伸过的DNA与阵列上的寡核苷酸的连接(诸如图51C和51D中所示)可释放拓扑异构酶I(例如牛痘病毒拓扑异构酶I)。在一些情况下,拉伸过的DNA在包含与拓扑异构酶I键合的寡核苷酸的寡核苷酸阵列上拉伸。在一些情况下,拉伸过的DNA首先在如本文提供的固定化表面上拉伸,然后在拉伸过的DNA的各端添加3’A突出后,与包含与拓扑异构酶I键合的寡核苷酸的寡核苷酸阵列一起孵育。在一些情况下,DNA分子在使用本文提供的任何方法先前与牛痘病毒拓扑异构酶I(参见图51A-B)一起孵育的寡核苷酸阵列上拉伸,用平端切割限制性内切酶处理,与将单个腺嘌呤残基添加到拉伸过的DNA的各端的酶(例如Taq聚合酶)一起孵育,以及经由拓扑异构酶I连接至与拓扑异构酶I键合的寡核苷酸阵列表面上的寡核苷酸。在一些情况下,DNA分子在如本文提供的固定化表面上拉伸,用平端切割限制性内切酶处理,与将单个腺嘌呤残基添加到拉伸过的DNA的各端的酶(例如Taq聚合酶)一起孵育,然后经由拓扑异构酶I连接至与拓扑异构酶I键合的寡核苷酸阵列表面上的寡核苷酸。
在另一个实施例中,本文提供的使用拓扑异构酶在寡核苷酸阵列上进行克隆、连接或拉伸核酸(例如DNA)的方法可利用包含双链寡核苷酸(诸如图51E中所描绘的双链寡核苷酸)的寡核苷酸阵列或芯片。如图51E中所示,本文提供的寡核苷酸阵列上的每个特征可经设计包含双链寡核苷酸5104,其包含底部接头5105、可变区5106和顶部接头5107。底部接头5105可连接至阵列表面。可通过底部接头5105的5'端和/或3'端连接。可变区5106可以是或包含条形码序列。条形码序列可以如本文所描述的来设计。顶部接头可包含I型拓扑异构酶的识别序列。在一些情况下,I型拓扑异构酶是牛痘病毒拓扑异构酶且识别序列是5'-TCCTT-3',诸如图51E中所描绘。顶部接头可包含双链寡核苷酸的第一链上的第一识别序列(例如牛痘病毒识别序列)。在一些情况下,顶部接头可包含双链寡核苷酸的第二互补链上的第二识别序列(例如牛痘病毒识别序列)。如图51E中所示,第一识别序列可以在双链寡核苷酸的第一链内,而第二识别序列可以在双链寡核苷酸的第二互补链的5’终端。因为牛痘病毒拓扑异构酶I可以与5'(C/T)CCTT-3'的3'T键合,诸如5104的寡核苷酸可在第一链和第二链上的识别序列的接合点处形成与牛痘病毒拓扑异构酶I的键。
在一些情况下,如图51E中描绘的双链寡核苷酸可通过第一寡核苷酸5108和第二寡核苷酸5109杂交而生成,各自包含与第一链顶部接头的一部分互补的序列,以使第一寡核苷酸的第一端直接与邻接的第二物的第一端杂交。第一寡核苷酸的第一端和第二寡核苷酸的第一端不会彼此共价键合(即,不会形成磷酸二酯键),从而会在双链寡核苷酸的第二链中产生“切口”5110。顶部接头5107可进一步包含识别序列的额外上游序列(5')和下游序列(3')。如图51E中所示,识别序列的下游序列可以是与识别序列互补的序列。在一些情况下,牛痘病毒拓扑异构酶识别序列(即5'-TCCTT-3')的下游序列是5'-AAGGA-3'。在一些情况下,牛痘病毒拓扑异构酶识别序列(即5'-CCCTT-3')的下游序列是5'-AAGGG-3'。在一些情况下,牛痘病毒拓扑异构酶识别序列的下游序列基本上可以是任何序列(即,除5'-AAGGG-3'以外)。在该实施例中,根据期望的解链温度、G/C含量及特定应用所需要的其它物理参数,第一寡核苷酸和第二寡核苷酸可以是不同的长度和序列。
在一些情况下,利用拓扑异构酶的方法中的第一个步骤(参见图51F)包括将牛痘病毒拓扑异构酶I与寡核苷酸,如图51E中的5104一起孵育。与牛痘病毒拓扑异构酶I一起孵育会使拓扑异构酶与第一条链的识别序列中的末端T上的3’磷酸形成共价键。在与牛痘病毒拓扑异构酶I一起孵育之后,在包含多个特征并且每个特征包含一个寡核苷酸的寡核苷酸阵列上的每个特征(如图51E中所描绘)会共价附接拓扑异构酶。在这一实施例中,所述阵列上的寡核苷酸可以呈平端。
在与拓扑异构酶I一起孵育之后,可以在表面上拉伸所关注的DNA分子。所述表面可以是如本文所描述的包含了共价附接到每个特征中的每个寡核苷酸的拓扑异构酶的寡核苷酸阵列。所述表面可以是如本文所描述的固定化表面。DNA可以使用本文提供的任何方法拉伸。一旦拉伸了DNA,就可以用本领域中已知产生平端的任何限制酶对其进行消化。在本实施例中,由于基底包含平端寡核苷酸,故可以将平端核酸直接克隆到阵列或芯片上。与本文所描述的寡核苷酸阵列上的寡核苷酸键合的拓扑异构酶I(参见图51F)可以将拉伸的平端DNA连接到与拓扑异构酶I键合的寡核苷酸。以此方式,拓扑异构酶I可以帮助将拉伸的平端DNA分子克隆到本文提供的寡核苷酸阵列上。拉伸的DNA连接到阵列上的寡核苷酸可以释放出拓扑异构酶I(例如牛痘病毒拓扑异构酶I)。在一些情况下,DNA是在包含了与拓扑异构酶I键合的寡核苷酸的寡核苷酸阵列上进行拉伸。在一些情况下,DNA首先在本文提供的固定化表面上进行拉伸,然后与包含了与拓扑异构酶I键合的寡核苷酸的寡核苷酸阵列一起孵育。在一些情况下,DNA分子是使用本文提供的任何方法,在预先与牛痘病毒拓扑异构酶I一起孵育的寡核苷酸阵列上进行拉伸,用平端切割限制酶加工,并经由拓扑异构酶I连接到寡核苷酸阵列表面上与拓扑异构酶I键合的寡核苷酸。在一些情况下,DNA分子是在本文提供的固定化表面上进行拉伸,用平端切割限制酶进行加工,然后经由拓扑异构酶I连接到寡核苷酸阵列表面上与拓扑异构酶I键合的寡核苷酸。
在另一实施例中,本文提供的使用拓扑异构酶在寡核苷酸阵列上克隆、附接或拉伸核酸(例如DNA)的方法可以利用包含双链寡核苷酸(如图51G中所描绘的双链寡核苷酸)的寡核苷酸阵列或芯片。如图51G中所示,在本文提供的寡核苷酸阵列上的每个特征都可以被设计成包含双链寡核苷酸5111,双链寡核苷酸包含底部接头5112、可变区5113及顶部接头5114。底部接头5112可以附接到阵列的表面。附接可以通过底部接头5112的5’端和/或3’端进行。可变区5113可以是条形码序列或包含条形码序列。条形码序列可以如本文所描述进行设计。顶部接头可以包含I型拓扑异构酶的识别序列。在一些情况下,I型拓扑异构酶是牛痘病毒拓扑异构酶并且识别序列是5’-TCCTT-3’,如图51G中所描绘。顶部接头可以在双链寡核苷酸第一条链上包含第一识别序列(例如牛痘病毒识别序列)。在一些情况下,I型拓扑异构酶可以裂解识别序列3’端与任何下游序列的5’端之间的磷酸二酯键。考虑到牛痘病毒拓扑异构酶I可以与5’(C/T)CCTT-3’中的3’T键合,因此寡核苷酸,如5111,可以通过牛痘病毒拓扑异构酶I与第一条链中识别序列的3’T形成键。
在一些情况下,如图51G中所描绘,可以通过使第一寡核苷酸5115与第二寡核苷酸5116杂交来生成双链寡核苷酸5111,所述第一寡核苷酸和第二寡核苷酸各自包含与第一条链的一部分顶部接头互补的序列,由此使第一寡核苷酸的第一端紧接着第二寡核苷酸5116的第一端进行杂交。第一寡核苷酸5115的第一端与第二寡核苷酸5116的第一端彼此不会共价键合(即,不会形成磷酸二酯键),由此在双链寡核苷酸5111的第二条链中产生“切口”5117。顶部接头5114可以进一步在识别序列的上游(5’)和下游(3’)包含另外的序列。如图51G中所示,识别序列下游的序列可以是基本上任何序列。在一些情况下,第二寡核苷酸包含与顶部接头中的识别序列互补的序列。第二寡核苷酸可以进一步在与识别序列互补的序列的下游包含一个或多个另外的核苷酸。第二寡核苷酸的这一个或多个另外的核苷酸的选择应使得在用拓扑异构酶裂解双链寡核苷酸之后,在第二条链上产生突出(参见图51H)。在一些情况下,所述突出可以与限制酶生成的突出互补。
在一些情况下,利用拓扑异构酶的方法中的第一个步骤(参见图51H)包括将牛痘病毒拓扑异构酶I与寡核苷酸,如图51G中的5111一起孵育。与牛痘病毒拓扑异构酶I一起孵育会使拓扑异构酶与识别序列中的末端T上的3’磷酸形成共价键。另外,在包含多个特征并且每个特征包含一个寡核苷酸的寡核苷酸阵列上的每个特征(如图51H中所描绘的特征)都可以包含如以上所描述的5’突出。在与牛痘病毒拓扑异构酶I一起孵育之后,在包含多个特征并且每个特征包含一个寡核苷酸的寡核苷酸阵列上的每个特征(如图51H中所描绘的特征)会共价附接拓扑异构酶。
在与拓扑异构酶I一起孵育之后,可以在表面上拉伸所关注的DNA分子。所述表面可以是如本文所描述的包含了共价附接到每个特征中的每个寡核苷酸的拓扑异构酶的寡核苷酸阵列。所述表面可以是如本文所描述的固定化表面。DNA可以使用本文提供的任何方法拉伸。一旦拉伸了DNA,就可以用本领域已知的任何限制酶对其进行消化,由此产生与阵列上的双链寡核苷酸的突出互补的突出。然后,可以将经过消化的DNA直接克隆到阵列或芯片上。与本文所描述的寡核苷酸阵列(参见图51H)上的寡核苷酸键合的拓扑异构酶I可以将拉伸的DNA连接到与拓扑异构酶I键合的寡核苷酸。以此方式,拓扑异构酶I可以帮助将拉伸的DNA分子克隆到本文提供的寡核苷酸阵列上。拉伸的DNA连接到阵列上的寡核苷酸可以释放出拓扑异构酶I(例如牛痘病毒拓扑异构酶I)。在一些情况下,DNA是在包含了与拓扑异构酶I键合的寡核苷酸的寡核苷酸阵列上进行拉伸。在一些情况下,DNA首先在本文提供的固定化表面上进行拉伸,然后与包含了键合拓扑异构酶I的寡核苷酸的寡核苷酸阵列一起孵育。在一些情况下,DNA分子是使用本文提供的任何方法,在预先与牛痘病毒拓扑异构酶I一起孵育的寡核苷酸阵列上进行拉伸,用限制酶进行加工以生成与键合拓扑异构酶I的寡核苷酸的突出互补的突出,并经由拓扑异构酶I连接到寡核苷酸阵列表面上与拓扑异构酶I键合的寡核苷酸。在一些情况下,DNA分子是在本文提供的固定化表面上进行拉伸,用限制酶进行加工以生成与键合拓扑异构酶I的寡核苷酸的突出互补的突出,然后经由拓扑异构酶I连接到寡核苷酸阵列表面上与拓扑异构酶I键合的寡核苷酸。
在连接和释放拓扑异构酶I之后,连接到寡核苷酸阵列(如图51A-H中所示)上的寡核苷酸的拉伸的DNA可以经历如本文所描述的下游加工。下游加工可以是生成如本文所描述的延伸产物。下游加工可以是生成如本文所描述的核酸文库。下游加工可以是生成延伸产物和生成核酸文库,如本文所提供。如图1和图2中概述的,核酸文库可以是能够由延伸产物107,207产生的测序文库。在一些情况下,在下游加工之前,将如图51A-H中所示的寡核苷酸阵列上的拉伸的DNA从寡核苷酸阵列释放。在一些情况下,寡核苷酸优选在底部接头中具有限制性位点(参见图51D),所述位点允许选择性裂解和释放拉伸的DNA。在一些情况下,通过用本文提供的用于片段化核酸的酶消化底部接头,可以将拉伸的DNA从寡核苷酸阵列释放。在一些情况下,通过用限制酶消化,将拉伸的DNA从寡核苷酸阵列释放。限制酶可以是本领域中已知和/或本文提供的任何限制酶。在一些情况下,使用NEB片段化酶促裂解拉伸的DNA。酶促消化的消化时间可以经过调整以获得选定的片段大小。在一些情况下,拉伸的DNA可以被片段化成本文提供的具有一个或多个特定大小范围的一组片段化产物。
在一些情况下,将克隆于寡核苷酸阵列上的核酸分子可以包含RNA。在一些情况下,RNA是mRNA。如本文所描述的涉及拓扑异构酶克隆的方法可以是基本上相同或相似的,或者可以经过修饰,以适应在寡核苷酸阵列上进行的RNA分子克隆。在一个非限制性实施例中,可以利用图51G和51H中所描述的方法在双链寡核苷酸上生成突出,其中所述突出包含多聚T突出。多聚T突出可以与mRNA分子的多聚A尾互补。以此方式,可以将mRNA分子直接克隆到寡核苷酸阵列上。
在一些情况下,可以使组织切片(如肿瘤活检样品)与寡核苷酸阵列的表面接触。寡核苷酸阵列可以包含如本文所描述的与I型拓扑异构酶键合的多个寡核苷酸。在一些情况下,与I型拓扑异构酶键合的多个寡核苷酸可以包含多聚T突出。与阵列上的寡核苷酸键合的I型拓扑异构酶可以将组织切片内所含的mRNA分子连接到阵列上的寡核苷酸。在一些情况下,mRNA分子的身份可以通过对阵列上所克隆的mRNA分子进行测序来确定。在一些情况下,mRNA分子在阵列上(并因此,在组织中)的位置可以通过对条形码序列进行测序来确定,所述条形码序列传达了阵列上的位置信息(例如,x,y坐标)。在一些情况下,可以确定mRNA分子在组织内的x,y坐标。在一些实施例中,可以测定连续组织切片。在该实施例中,可以确定mRNA分子在组织内的z坐标。在一些情况下,可以利用本文所描述的方法获得组织的三维表达谱。
由延伸产物产生测序文库
一旦由靶多核苷酸产生了延伸产物(如本公开中别处所描述),这些延伸产物可以直接进行测序或被用于生成测序文库以供日后测序。在一些情况下,如本文所提供,在加工靶多核苷酸、在寡核苷酸阵列上拉伸并使拉伸的靶多核苷酸延伸之后,产生核酸文库。如图1和图2中概述的,核酸文库可以是能够由延伸产物107,207产生的测序文库。
在一些情况下,在测序之前,将通过本文所描述的方法产生的延伸产物从寡核苷酸阵列释放。图40步骤f)中显示了这一实施方案的一个实例。在一些情况下,可以用热能破坏延伸产物与引物基底之间的键。在一些情况下,可以通过机械破坏或剪切力将延伸产物与引物基底分离。在一些情况下,阵列结合的引物(寡核苷酸)优选在其5'或3'端具有限制性位点,限制性位点被并入延伸产物中并允许选择性裂解和释放延伸产物或其部分。在一些情况下,通过用本文提供的用于片段化核酸的酶消化延伸产物,可以将延伸产物从寡核苷酸阵列释放。在一些情况下,通过用限制酶消化,将延伸产物从寡核苷酸阵列释放。限制酶可以是本领域中已知和/或本文提供的任何限制酶。在一些情况下,使用NEB片段化酶促裂解延伸产物。酶促消化延伸产物的消化时间可以经过调整以获得选定的片段大小。在一些情况下,延伸产物可以被片段化成具有一个或多个特定大小范围的一组片段化延伸产物。在一些情况下,这些片段的平均长度可以是约10到约10,000个核苷酸或碱基对。在一些情况下,这些片段的平均长度是约50到约2,000个核苷酸或碱基对。在一些情况下,这些片段的平均长度是约100到约2,500、约10到约1000、约10到约800、约10到约500、约50到约500、约50到约250,或约50到约150个核苷酸或碱基对。在一些情况下,这些片段的平均长度小于10,000个核苷酸或碱基对,小于7,500个核苷酸或碱基对,小于5,000个核苷酸或碱基对,小于2,500个核苷酸或碱基对,小于2,000个核苷酸或碱基对,小于1,500个核苷酸或碱基对,小于1,000个核苷酸或碱基对,小于500个核苷酸或碱基对,小于400个核苷酸或碱基对,小于300个核苷酸或碱基对,小于200个核苷酸或碱基对,或小于150个核苷酸或碱基对。在一些情况下,这些片段的平均长度是约、超过、小于或至少10、20、30、40、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500或10,000个核苷酸或碱基对。
在一些情况下,通过使本文提供的方法生成的寡核苷酸阵列上的延伸产物片段化而生成的多核苷酸片段经历末端修复。末端修复可以包括生成平端、非平端(即,粘性或凝集性末端),或单碱基突出,如利用缺乏3'-外切核酸酶活性的聚合酶将单个dA核苷酸添加到双链核酸产物的3′端。在一些情况下,对片段进行末端修复以产生平端,其中这些片段的末端含有5'磷酸和3'羟基。末端修复可以使用本领域中已知的许多酶和/或方法实施。突出可以包含约、超过、小于或至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。
在一些情况下,由本文提供的方法生成并且结合到本文提供的寡核苷酸阵列的延伸产物仍结合到寡核苷酸阵列,并且由这些结合的延伸产物生成测序文库。由通过本文提供的方法生成的结合寡核苷酸阵列的延伸产物生成测序文库可以通过使用阵列结合的延伸产物作为模板生成第二组延伸产物来进行。这些第二延伸产物可以包含与条形码序列互补的序列。与条形码序列互补的序列可以与原始条形码序列相关联并由此传达与原始条形码相同的位置信息。这些第二延伸产物还可以包含与靶多核苷酸的区域或区段相对应的序列,因为这些序列可以与第一延伸产物中能够与生成阵列结合的延伸产物的靶多核苷酸互补的区域互补。
在一些情况下,由通过本文提供的方法生成的结合寡核苷酸阵列的延伸产物制备测序文库是通过以下方式进行:使非基底结合的引物(即,溶液形式的引物或“游离”引物)与阵列结合的延伸产物杂交,并使用阵列结合的延伸产物作为模板延伸杂交的非基底结合的引物,由此生成非阵列结合(或游离)的延伸产物。非基底结合的引物可以例如通过本文所描述的具有非基底结合的引物的随机序列区段(例如,随机六聚体等)与阵列结合的延伸产物杂交。随机序列可以是至少5、6、7、8、9、10、11、12、13、14或15个碱基对或核苷酸。随机序列可以是最多5、6、7、8、9、10、11、12、13、14或15个碱基对或核苷酸。游离引物可以包含PCR引物序列。PCR引物序列可以是至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个碱基对或核苷酸。PCR引物序列可以是最多5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个碱基对或核苷酸。非基底结合的引物可以包含接头序列。这些接头序列可以与本领域中已知的任何测序平台相容。在一些情况下,接头序列包含适用于Illumina NGS测序方法,如IlluminaHiSeq 2500系统中的序列。接头序列可以是Y形接头,或者双链体或部分双链体接头。可以用酶,如DNA聚合酶,来延伸与阵列结合的延伸产物杂交的非基底结合的引物。聚合酶可以包括但不限于,PolI、PolII、PolIII、Klenow、T4DNAPol、修饰的T7DNA Pol、突变修饰的T7DNA Pol、TdT、Bst、Taq、Tth、Pfu、Pow、Vent、Pab及Phi-29。例如,可以使用Bst聚合酶通过在65℃下在1X等温扩增缓冲液(例如,20mM Tris-HCl、10mM(NH4)2SO4、50mM KCl、2mM MgSO4及0.1%Tween 20)中将模板核酸和引物与Bst聚合酶和dNTP一起孵育来进行延伸反应。
图41中显示了使用非基底结合的引物,由结合寡核苷酸阵列的延伸产物制备测序文库的一个实例。引物阵列(例如,模板和/或受者寡核苷酸阵列)4100可以包括含阵列结合的延伸产物4113的引物(寡核苷酸)区4110,4120。阵列结合的延伸产物4113可以包含PCR引物序列4111和条形码序列4112,以及对应于靶多核苷酸或其互补序列的序列。添加的非基底结合的引物可以例如通过具有非基底结合的引物的随机六聚体或随机九聚体区段4132的结合而与阵列结合的延伸产物4113结合,并且可以用于延伸反应中。生成的非阵列结合的延伸产物4131可以含有阵列结合的延伸产物部分以及条形码序列或其互补序列。非基底结合的引物可以包含尾部区段4133,所述尾部区段含有与阵列结合的延伸产物中的序列不互补并由此不与阵列结合的延伸产物杂交的限定序列。限定序列可以包含通用的接头和/或条形码序列。
由本文提供的方法(例如,如图41中所描绘)生成的非阵列结合的延伸产物可以包含对应于靶多核苷酸区段的序列。也就是说,非阵列结合的延伸产物可以包含与生成其的阵列结合的延伸产物的一部分或全部区段互补的序列,所述序列可以包含与靶多核苷酸区段相对应或互补的序列。非阵列结合的延伸产物可以包含条形码,所述条形码包含与阵列结合的延伸产物的条形码序列互补的序列。通过将这一互补条形码序列与原始条形码序列相关联,互补的条形码可以传达与原始条形码序列所传达相同的位置信息。在非阵列结合的延伸产物中,由条形码或互补条形码传达的位置信息可以与对应于靶多核苷酸区段的序列相关联,由此沿拉伸的靶多核苷酸分子的长度定位靶多核苷酸的区段。非阵列结合的延伸产物可以包含一个或多个PCR引物序列。非阵列结合的延伸产物可以包含与生成其的阵列结合的延伸产物中的PCR引物序列互补的PCR引物序列。非阵列结合的延伸产物可以包含由被延伸以生成非阵列结合的延伸产物的非阵列结合的引物得到的PCR引物序列。非阵列结合的延伸产物可以包含接头序列,如测序接头。在一些情况下,附加至非阵列结合的延伸产物的接头序列包含适用于Illumina NGS测序方法,如Illumina HiSeq 2500系统中的序列。
延伸产物(非阵列结合或由本文所描述的寡核苷酸阵列释放的延伸产物)或其片段可以被扩增和/或进一步进行分析。所述进一步分析可以是测序。测序可以是本领域中已知的任何测序方法。扩增可以通过本领域中已知的任何扩增方法进行。在一些情况下,扩增包括选自由以下组成的组的方法:聚合酶链反应(PCR)和其变化形式(例如RT-PCR、巢式PCR、多重PCR、等温PCR)、基于核酸序列的扩增(NASBA)、转录介导的扩增(TMA)、链置换扩增(SDA)及环介导的等温扩增(LAMP)。扩增可以用本文提供的任何酶进行。例如,可以使用Bst聚合酶通过在65℃下在1X等温扩增缓冲液(例如,20mM Tris-HCl、10mM(NH4)2SO4、50mMKCl、2mM MgSO4及0.1%Tween 20)中将模板核酸和引物与Bst聚合酶和dNTP一起孵育来进行反应。扩增可以利用并入例如由阵列结合的引物(寡核苷酸)和非基底结合的引物得到的延伸产物中的PCR引物位点。扩增可以用于将接头(如测序接头)并入扩增的延伸产物中。测序接头可以与本领域中已知的任何测序方法相容。
测序
一旦将延伸产物制备为测序文库,可对其进行测序。测序前,可将所制备的与寡核苷酸阵列结合的测序文库通过变性、选择性裂解或PCR扩增从寡核苷酸阵列中释放。例如在图1和图2所概述的,可对测序文库测序,并可以使用位置条形码信息108,208确定序列读段的顺序和比对。将来自延伸产物的序列读段比对或装配到靶多核苷酸中。可通过位置信息辅助比对或装配,所述位置信息是由与靶多核苷酸的每一区段关联的条形码序列所传送的。由条形码所传送的位置信息可与对应于靶多核苷酸的区段的序列相关,从而沿着拉伸过的靶多核苷酸的长度对靶多核苷酸的区段进行定位。当对长核酸分子或含有长重复序列、插入、缺失、转座或其它特征的核酸分子进行测序时,位置信息的用途尤其是有益的。
可使用任意合适的测序技术对测序文库进行测序,该技术包括但不限于单分子实时(SMRT)测序、聚合酶克隆测序(Polony sequencing)、通过连接测序(例如,SOLiD测序)、可逆终止子测序、质子检测测序、离子半导体(例如,离子激流)测序、纳米孔测序(nanoporesequencing)、电子测序、焦磷酸测序(例如,454),Maxam-Gilbert测序,链终止(例如,Sanger)测序,+S测序或通过合成测序(例如,Illumina HiSeq)。
可通过单分子实时(SMRT)测序(例如,太平洋生物科学(Pacific Biosciences))进行测序,如在美国专利号7462452;7476504;7405281;7170050;7462468;7476503;7315019;7302146;7313308;和美国专利申请公开号US20090029385;US20090068655;US20090024331;和US20080206764中所描述的,其每个公开内容通过引用整体并入本文。可将来自使用本文描述的方法所制备的文库的核酸插入或从寡核苷酸阵列所释放的延伸产物固定在零模式波导阵列。可将单一DNA聚合酶用单一靶多核苷酸贴附在零模式波导的底部。可将荧光标记的核苷酸掺入到核酸合成,并当荧光染料从核苷酸上裂解下来时,将零模式波导用于检测荧光染料。这可使模板核酸序列能够进行实时碱基-碱基测量。荧光标记作为核苷酸掺入的部分被剪切掉。在一些情况下,采用环状模板可以实现单一分子上的多个读段。
可通过聚合酶克隆测序进行测序。例如,可将来自使用本文描述的方法所制备的文库的核酸插入或从寡核苷酸阵列所释放的延伸产物剪切成约1kb长度的链。可将这些链环化并用滚环扩增进行扩增。可将所扩增的环化产物例如用MmelII限制性酶消化,产生T30侧接标签的片段。例如用PCR可将片段扩增,并形成文库。可用珠粒-结合的引物在文库上进行乳液PCR,并将捕获珠粒用于富集具有扩增DNA的珠粒。然后可将珠粒通过离心分离,以单层形式与基底结合,并与测序试剂接触。荧光标记的简并九聚体和成像,可测量片段序列,并可对片段序列进行装配。
在一些情况下,本文所描述的方法可用于制备释放的延伸产物或文库,其插入可通过由Applied Biosystems的商业化的连接方法的测序(例如,SOLiD测序)进行测序。可将来自使用本文描述的方法所制备的文库的核酸插入或从寡核苷酸阵列释放的延伸产物掺入到油包水乳液以及聚苯乙烯珠粒,并由例如PCR来扩增。在一些情况下,替代扩增方法可应用在油包水乳液中,如本文所提供的方法的任一个。由乳液所形成的每一水微滴中的扩增产物与在那个微滴中所存在的一个或多个珠粒相互作用、结合或杂交,导致珠粒具有基本上一个序列的多个扩增产物。当乳液被破坏时,珠粒漂浮在样品的顶部,并被置于阵列上面。该方法可包括使核酸结合到成链的或部分单链的珠粒的步骤。然后加入测序引物以及4个不同的荧光标记的寡核苷酸探针的混合物。该探针特异性结合到与测序引物直接相邻和3'处的待测序的多核苷酸中的两个碱基上,以确定四个碱基中的哪一个在那些位置上。在洗涤和读取荧光信号形成第一个掺入的探针后,加入连接酶。该连接酶在第五和第六个碱基之间裂解寡核苷酸探针,从待测序的多核苷酸中除去荧光染料。使用不同的序列引物重复整个方法,直到序列中的全部插入位置成像。该方法能够以“大规模并行”的方式同时读取数百万的DNA片段。此“通过连接的测序”技术使用编码两个碱基而非只是一个碱基的探针,允许通过信号错配的错误识别,导致碱基确定的准确性增加。
可通过可逆终止子测序进行测序。例如,可将荧光标记可逆终止子结合的dNTP掺入到核酸产物,该核酸产物是由来自使用本文所提供的方法制备的文库的模板核酸插入或寡核苷酸阵列所释放的延伸产物所形成的。然后将荧光标记的终止子成像并裂解以便另一个循环的掺入和成像。荧光标记可显示所掺入的碱基,并可得出模板核酸的序列。
在本文所描述的方法中可使用的测序技术的另一个实例是由离子激流(IonTorrent)所提供的半导体测序(例如,使用Ion Personal Genome Machine(PGM))。离子激流技术可使用具有多层的半导体芯片,例如,具有微加工孔的层,离子敏感层和离子传感器层。可将来自使用本文所描述的方法制备的文库的核酸插入或寡核苷酸阵列所释放的延伸产物引入孔内,例如,可将单一核酸克隆性群体附接到单一珠粒,并将该珠粒引入到孔内。为启动对珠粒上核酸的测序,可将一种类型的脱氧核糖核苷酸(例如,dATP、dCTP、dGTP或dTTP)引入孔内。当通过DNA聚合酶掺入一个或多个核苷酸时,在孔内释放质子(氢离子),其可通过离子传感器来检测。然后洗涤半导体芯片并用不同的脱氧核糖核苷酸重复该方法。可在半导体芯片的孔内对多个核酸进行测序。半导体芯片可包含用于测序DNA的化学敏感场效应晶体管(chemFET)阵列(例如,如美国专利申请公开号20090026082所描述的)。一个或多个三磷酸酯在测序引物的3'端掺入到新的核酸链,可通过电流的改变由chemFET进行检测。阵列可具有多个chemFET传感器。加入到微孔的dNTP的种类与氢离子检测之间的关系可实现靶多核苷酸的序列的确定。
可用于本文描述的方法中的测序技术的另一个实例是纳米孔测序(参见例如SoniG V和Meller A.(2007)Clin Chem 53:1996-2001)。纳米孔是一种在直径上具有1纳米数量级的小孔。纳米孔在导电流体中浸没并在其上施加电位可造成微电流,这是由于离子穿过纳米孔导电。流动电流的量对纳米孔的大小很敏感。当来自使用本文所描述的方法制备的文库的核酸插入或寡核苷酸阵列所释放的延伸产物穿过纳米孔时,在核酸插入上的每一核苷酸或所释放的延伸产物以不同程度阻塞纳米孔。因此,由于核酸插入或释放的延伸产物穿过纳米孔引起的穿过纳米孔的电流的改变可表示核酸插入或所释放的延伸产物序列的读段。
可通过焦磷酸测序(例如,454)进行测序。如在Margulies等,Nature(2005)437:376-380(2005)所描述的;以及美国专利号7,244,559;7,335,762;7,211,390;7,244,567;7,264,929;和7,323,305,其每个公开内容通过整体引用并入本文。可将来自使用本文描述的方法所制备的文库的核酸插入或从寡核苷酸阵列释放的延伸产物固定在珠粒上,并在适于PCR扩增的油包水乳液中分隔。在一些情况下,可将除PCR以外的替代扩增方法应用在油包水乳液中,如本文所提供的方法的任一个。当乳液被破坏时,扩增片段仍旧结合到珠粒上。该方法可包括使核酸结合到单链的或部分单链的珠粒的步骤。可将珠粒富集并装入光纤载玻片的孔内,这样在每一孔内有大约1个珠粒。在聚合酶、硫化氢解酶和荧光素酶存在下,核苷酸以固定顺序流过和流入孔内。可将单一种类的dNTP添加到反应区域。dNTP的掺入可产生焦磷酸(PPi),其可通过ATP硫酸化酶被转化为ATP。然后ATP可激发荧光素酶以产生可被检测到的光。添加与靶链互补的核苷酸造成化学发光信号,其可被记录,如通过照相机。此使能够监测添加的dNTP种类是否被掺入,并因此实现对靶多核苷酸的分析。将信号强度和横跨平板生成的位置信息结合起来使软件能够确定DNA序列。
可通过Maxam-Gilbert测序进行测序。例如,可将来自使用本文描述的方法所制备的文库的核酸插入或从寡核苷酸阵列所释放的延伸产物在双链核酸分子的一个5'端进行放射性标记。可将化学处理用于在很小部分的核苷酸碱基上生成断裂。可使用4个不同的反应,每一在特有的碱基或碱基对(例如,G,A+G,C和C+T)生成断裂。然后可将核酸分子裂解,生成一端具有放射性标记的片段,其长度取决于断裂位点。然后将反应产物在凝胶上进行分离,并基于它们的长度和存在的标记进行分析。基于长度,可对反应产物进行排序,并可确定靶核苷酸的序列。
可通过链终止(例如,Sanger)测序进行测序。例如,可将来自使用本文描述的方法所制备的文库的核酸插入或从寡核苷酸阵列所释放的延伸产物用聚合酶、正常dNTP、修饰的ddNTP进行扩增,如果修饰的ddNTP掺入到核酸链中,则其可终止链的延长。可将ddNTP(例如,荧光性或放射性)标记。可将单一种类的ddNTP以及全部四种dNTP添加到模板核酸的延伸反应中。然后将反应产物在凝胶上进行分离,并基于它们的长度和存在的标记进行分析。可将反应产物基于长度进行排序,并可确定模板核酸分子的序列。
可通过Illumina的商业化的方法的合成测序进行测序,如美国专利号5,750,341;6,306,597;和5,969,119中所描述的。然后可将来自使用本文描述的方法所制备的文库的核酸插入或从寡核苷酸阵列所释放的延伸产物变性,并将单链的扩增的多核苷酸随机连接到流动槽通道的内表面。可添加未标记的核苷酸以启动固相桥式扩增,以产生密集簇的双链DNA。为了启动第一个碱基测序循环,可添加四个标记的可逆终止子、引物和DNA聚合酶。激光激发后,将来自流动槽上每一簇的荧光成像。然后记录对于每一簇的第一个碱基的身份。可进行测序循环以确定片段序列,一次一个碱基。
可通过如在WO2012134602中所描述的+S测序进行测序,其公开内容通过引用并入本文。在一些情况下,可在如本文所提供的来自使用本文描述的方法所制备的文库的核酸插入或从寡核苷酸阵列所释放的延伸产物上进行+S测序。+S测序可带来重复数轮的受控的延伸和洗涤循环。与脉冲延伸相似,可通过限制核苷酸的可用性或通过加入可逆终止子核苷酸进行受控延伸。可通过使用核酸聚合酶和一组或多组核苷酸实施受限的延伸。通常一组或多组中的每一组包含不超过3个不同的核苷酸。在一些情况下,在+S测序中所应用的一组或多组核苷酸包含一个至四个核苷酸,且至少一个核苷酸是可逆终止子核苷酸。延伸可用超过一组的核苷酸,如至少1、2、3个或更多组。一组核苷酸可包含一个、两个或三个不同的核苷酸。在一些情况下,+S测序方法进一步包括获得一个或多个额外的序列读段,诸如通过重复从模板释放引物延伸产物的步骤(例如,来自使用本文描述的方法所制备的文库的核酸插入或从寡核苷酸阵列所释放的延伸产物);使额外的测序引物(或延伸引物)与模板杂交;经受控的延伸通过延伸额外的测序引物生成额外的引物延伸产物;以及通过进一步延伸额外的引物延伸产物将模板的一个或多个碱基测序以生成额外的引物延伸产物,从而获得额外的序列读段。额外的测序引物可靶向模板的相同或相似的区域。对模板的测序可通过使用本文所提供的测序方法中的任一个延伸测序引物来完成。在一些情况下,洗涤步骤或核苷酸降解步骤的进行早于随后加入的一组核苷酸。
生物信息学和软件
在测序后,可将序列数据比对。可将每一序列读段分成引物/标签序列信息,基于引物/标签的已知设计序列,和靶多核苷酸信息。可通过与经过其引物/标签序列的每片靶多核苷酸相关联的编码的位置条形码信息来辅助比对。对测序文库或所释放的延伸产物的测序可生成具有相同或相邻的条形码序列的重叠的读段。例如,一些延伸产物可足够长以达到与靶多核苷酸相关联的下一个特异性序列位点。使用条形码序列信息可将很可能重叠的读段集中在一起,其可提高准确度并降低计算时间或精力。
在一些情况下,可将通过本文所提供的方法所获得的序列读段和相关的条形码序列信息通过软件来分析。序列读段可以是短的(即,<100bps)或长的序列读段(即,>100bps)。软件可进行对来源于相同模板的序列读段排列的步骤。这些读段可通过例如搜索具有来自包括如本文所提供的斑点或区域的寡核苷酸阵列中相同或邻近列的条形码的读段来识别。在一些情况下,只有特定距离范围、水平行和/或垂直列的读段可被认为推定来自相同的模板。在对条形码读段中,该软件可基于条形码设计考虑到潜在测序(和其它)错误。该错误可以是具有编辑距离4的条形码,允许某些错误。在一些情况下,如果条形码含有太多错误,不能被唯一识别,则其相关的读段不能直接用于装配序列。当很多读段可基于相对条形码位置(例如,行号)进行装配时,可通过比对来自相同基因组区域的读段来填充一些间隙。本领域技术人员将理解的是,软件产品可基于条形码将读段串在一起,并可考虑到如本文所提供的寡核苷酸阵列上的靶多核苷酸的拉伸方向。例如,如果DNA分子在DNA阵列拉伸后并非严格垂直,则DNA分子相对于条形码列的方向可通过例如所掺加的已知参考DNA样品进行分析。此参考DNA样品可用于检测拉伸的相对角度,假设拉伸角度类似于全部DNA分子。对于基于与参考DNA样品(例如,基因组)的对比的序列读段的装配,如在再测序中,可使用对在测序装配有用的软件。所使用的软件可兼容所使用的测序平台类型。如果用Illumina系统完成测序,则可使用软件包如Partek、Bowtie、Stampy、SHRiMP2、SNP-o-matic、BWA、BWA-MEM、CLC工作站、Mosaik、Novoalign、Tophat、Splicemap、MapSplice、Abmapper.ERNE-map(rNA)和mrsFAST-Ultra。对于基于SOliD的NGS测序,可使用Bfast、Partek、Mosaik、BWA、Bowtie和CLC工作站。对于基于454的测序,可使用Partek、Mosaic、BWA、CLC工作站、GSMapper、SSAHA2、BLAT、BWA-SW和BWA-MEM。对于基于离子激流的测序,可使用Partek、Mosaic、CLC工作站、TMAP、BWA-SW和BWA-MEM。对于从本文所提供的方法所获取的序列读段的重新装配,可使用本领域已知的比对软件。所使用的软件对于较长读段(即,>100bps)可使用重叠布局方式,或者对于较短读段(即,<100bps)可使用基于以de Bruijn图为基础的k-mer的方式。用于重新装配的软件可以是公众可用的软件(例如,ABySS、Trans-ABySS、Trinity、Ray、Contrail)或商用软件(例如,CLCbio Genomics工作台)。
以上描述公开了本发明的一些方法和系统。本发明可接受在方法和材料上的修改以及在制造方法和装置上的变化。从本文所公开的本发明的公开内容或实践考虑,此修改将对本领域的那些技术人员是显而易见的。例如,本发明使用核酸例示,但还可适用于其它聚合物。因此,不应将本发明局限于本文所公开的特定的实施方案之内,相反,本发明应涵盖本发明的范围和精神内的全部修改和替换。
应用和优势
在一些情况下,本文所描述的设备和方法对于长核酸分子如DNA或RNA分子的测序是有用的。例如,大肠杆菌(E.coli)具有约4.6Mb的基因组,其可在一种方法中测序。对于DNA或RNA较大区段的测序,例如50kb或100kb,可准确表征一些重复序列和较大的结构变化,但在兆碱基的数量级上可错误表征结构变化。本文所描述的设备和方法可更为准确地表征重复序列,较大的结构变化和兆碱基规模的结构变化。所测序的核酸分子可以是整个基因组,例如大肠杆菌基因组。所测序的核酸分子可以是人类DNA或染色体的非常长的链。
尽管本文已经显示并描述本发明的优选实施方案,但对于本领域技术人员显而易见的是,这些实施方案仅作为实例被提供。在不脱离本发明的情况下,本领域技术人员将可作出各种变体、变化和替换。应当理解,可将本文所描述的本发明的实施方案的各种替代方案应用于实施本发明。下列权利要求旨在限定本发明的范围,且从而覆盖了在这些权利要求及其等同物的范围内的方法和结构。
实施例
实施例1-平面表面阵列的制备
使具有图42中所示结构的引发剂硅烷在EtOH存在下结合于平面二氧化硅基底,从而形成双臂表面聚合物引发位点。丙烯酰胺和乙氧基化丙烯酰胺的混合物与acrydite修饰的寡核苷酸一起在基底上在CuBr、PMDETA以及H2O存在下经历原子转移自由基聚合(ATRP)。此形成结合于表面引发剂位点的共价键合的轻度交联聚丙烯酰胺表面涂层,并且厚度在约50nm与约200nm之间,并且寡核苷酸并入结构中。此方法展示于图45中。
实施例2-平面表面阵列在测序中的用途
如实施例1中所描述制备聚丙烯酰胺涂布的基底。所要测序的DNA结合于并入聚合物结构中的寡核苷酸。将边合成边测序的试剂添加至基底中并且将边合成边测序进行40个循环。至少90%的聚合物链保持完整并且键合至表面。
实施例3-经由凝胶-芯片表面的单延伸硅烷化进行的模板的酶促转移
阵列表面的制备
将载玻片在NanoStrip溶液中清洗过夜,用去离子(DI)水冲洗,并且用N2干燥。然后,将所述表面用丙烯酰胺单体官能化,所述丙烯酰胺单体使聚丙烯酰胺凝胶结合于所述表面。用475mL乙醇、25mL去离子水以及26mL(3-丙烯酰胺基丙基)三甲氧基硅烷制备硅烷化溶液,以获得5%v/v最终浓度的硅烷。将一支架的清洁并且干燥的玻璃载玻片浸在硅烷化溶液中并且在室温下轻轻地搅拌5小时。随后将载玻片总共五次放置于新鲜乙醇浴槽中。然后,将载玻片在去离子水浴槽中冲洗并且用N2干燥。将载玻片储存于干的腔室中直到进一步使用。
丙烯酰胺凝胶混合物的制备
用5.00mL的H2O、1.00mg明胶、600.00mg丙烯酰胺以及32.00mg双丙烯酰胺制备12%丙烯酰胺凝胶混合物。将组分溶解并且混合在一起,以获得最终浓度为12%的丙烯酰胺凝胶混合物。对于6%凝胶芯片,将50μL的12%丙烯酰胺凝胶混合物、45μL的去离子水以及5'-acrydite-FC1(1mM浓度)官能化寡核苷酸组合以获得50μL的总体积,并且使其涡旋。
薄凝胶的聚合
向关于上文所制备的6%凝胶芯片的混合物中,添加每100μL反应混合物1.3μL的5%过硫酸铵以及每100μL反应混合物1.3μL的5%TEMED作为活化剂,以获得各自0.065%的最终活化剂浓度。然后使混合物涡旋。将15μL的凝胶混合物吸移至清洁平面表面,例如载玻片或硅晶片上。将所述表面上的凝胶混合物用如上文所制备的凝胶-芯片载玻片表面面向下进行覆盖。将玻璃芯片向下按压以获得更均匀的凝胶混合物展开物。允许凝胶在室温下聚合20分钟。使凝胶结合于芯片,并且必要时借助于剃须刀片或其他器具将凝胶-芯片基底从清洁的平面表面上移去。将凝胶芯片在去离子水中冲洗并且从芯片边缘移除过量凝胶。凝胶芯片可立即使用或储存于4x生理盐水-柠檬酸钠(SSC)缓冲液中。
酶混合物的制备
用37μL的H2O、5μL的10x Thermopol缓冲液、5μL的BSA(10mg/mL)、1μL的dNTP(10mM)以及2μL Bst DNA聚合酶(8U/μL)制备酶混合物。
经由单延伸进行的模板的酶促转移
将18μL的如上文所制备的酶混合物放置在所制备的凝胶芯片顶部。使酶混合物溶液渗透至凝胶中达30秒。然后,将凝胶芯片面向下放置于模板芯片上。如实施例1中一般制备模板芯片表面。将一块PDMS放置在两个芯片顶部作为顺应层,并且将芯片堆叠放入夹钳,诸如铝钳中。将芯片堆叠在55℃下在湿度室中孵育2小时。然后,在芯片堆叠的边缘周围添加额外的4x生理盐水-柠檬酸钠(SSC)缓冲液并且使其浸泡以使凝胶芯片松弛。然后必要时借助于剃须刀片或其他器具将凝胶芯片表面和模板芯片表面拉开。凝胶仍然结合于凝胶芯片,并且具有被转移的寡核苷酸。将模板芯片在去离子水中洗涤并且用N2干燥。将凝胶芯片用4x SSC缓冲液洗涤三次并且用2x SSC缓冲液洗涤三次。
转移图案的成像
使FC2QC-Cy3寡核苷酸在55℃下与如上文中所用的模板芯片杂交35分钟。杂交之后,将模板芯片冲洗并且使其成像。使SP2-Cy3寡核苷酸在55℃下与如上文中所制备的具有被转移的寡核苷酸的凝胶芯片杂交30分钟。然后将凝胶芯片用4x SSC缓冲液冲洗两次并且用2x SSC缓冲液冲洗两次,并且使其在4x SSC缓冲液中浸泡3小时以降低背景信号。除了浸泡3小时,凝胶芯片可选地已在4x SSC缓冲液中振荡20分钟。然后,使凝胶芯片在落射荧光显微镜下以所需放大倍数,诸如10x和40x成像。然后,将凝胶芯片条带化并且就模板芯片来说与FC2QC-Cy3寡核苷酸杂交。然后,将凝胶芯片再次成像,并且观测到指示模板分子的物理转移的信号。
用于通过成分体积进行模板扩增的反应缓冲液的制备
用1.5mL的10x Taq缓冲液、750μL的100%DMSO、3mL的5M甜菜碱、120μL的25mMdNTP、75μL的5000U/mL Taq聚合酶以及9.555mL不含核酸酶的H2O制备反应缓冲液。
用于通过最终浓度进行模板扩增的反应缓冲液的制备
用最终浓度的1x Taq缓冲液、5%DMSO、1M甜菜碱、0.2mM dNTP、25U/mL Taq聚合酶在不含核酸酶的H2O中制备反应缓冲液。
经由热循环进行的模板扩增
将具有寡核苷酸的凝胶芯片用添加有0.1%吐温(Tween)-20的0.3x SSC缓冲液洗涤。然后,凝胶芯片如下经历50个浸入溶液中的循环:a)在94℃下在含0.1%吐温-20的0.3xSSC缓冲液中45秒,b)在60℃下在含0.1%吐温-20的5x SSC缓冲液中2分钟,并且c)在72℃下在按照上文所制备的反应缓冲液中1分钟。将凝胶芯片上的模板扩增。
基于芯片的探针杂交
将要经过成像具有双链DNA(dsDNA)的芯片放置于0.1N NaOH溶液中3分钟以使DNA变性。洗涤之后,将芯片用4x SSC缓冲液洗涤。然后将芯片在55℃下在章动器上与20mL的100nM荧光标记的杂交探针溶液一起孵育40分钟。孵育之后,将芯片用4x SSC缓冲液洗涤两次并且用2x SSC缓冲液洗涤两次,每个洗涤步骤持续20分钟。然后使芯片成像。
实施例4-从光引导的3'-5'阵列到5'-3'全长阵列
经由标准光引导合成,制造具有3'-5'寡核苷酸特征的模板微阵列,其中寡核苷酸含有接头1序列、在特征之间变化的探针序列以及接头2序列。使寡核苷酸同与还含有可固定接头的接头1互补的引物杂交。使用聚合酶进行引物延伸反应。使第一受者阵列表面与模板阵列接触并且使接头结合于其表面。将两个表面分离,并且受者阵列含有呈5'-3'取向的部分长度与全长产物两者。使寡核苷酸同与还含有可固定接头的接头2互补的引物杂交。使用聚合酶进行引物延伸反应。使第二受者阵列表面与模板阵列接触并且使接头结合于其表面。将这两个表面分离,并且第二受者阵列主要含有呈5'-3'取向的全长产物。
实施例5-用结合引物将长DNA分子加标签并且测序
制备DNA提取物的溶液,其包含约4Mb长的模板DNA分子长碎片。通过分子梳将模板DNA拉伸至包含纳米通道特征的载玻片上。将游离引物添加至拉伸过的模板DNA分子中,各游离引物包含随机六聚体序列和引物结合位点序列。游离引物经由其随机六聚体区域在沿模板DNA分子的不同位置结合。提供具有凝胶涂层的基底,所述凝胶涂层包含结合型引物的空间限定阵列。各阵列结合的引物具有与引物结合位点序列互补的接头序列、核酸扩增引物序列以及条形码序列,其中给定阵列斑点中的所有引物共享该区域所特有的条形码序列。接头序列与引物结合位点序列杂交。进行延伸反应,以生成模板DNA分子的区域(片段)的拷贝,其中延伸反应从阵列结合的引物上的核酸扩增引物序列开始,并且将条形码序列并入所得延伸产物中。产生含有条形码序列的阵列结合的延伸产物和与模板DNA分子的区域互补的序列。将延伸产物装配成测序文库并且进行测序。通过条形码信息辅助序列读段的比对和装配,并且产生完整的4Mb模板DNA序列。
实施例6-用转座子位点将长DNA分子加标签并且测序
制备DNA提取物的溶液,其包含约4Mb长的模板DNA分子长碎片。通过转座子整合以500bp的平均空隙将引物结合位点添加至模板DNA分子中。通过分子梳将模板DNA拉伸至包含纳米通道特征的载玻片(第一基底)上。提供具有凝胶涂层的第二基底。凝胶涂层包含结合型引物的空间限定阵列。各阵列结合的引物具有与引物结合位点序列互补的接头序列、核酸扩增引物序列(例如PCR引物序列)以及条形码序列。给定阵列斑点或区域中的所有引物共享该区域所特有的条形码序列。阵列结合的引物与先前整合至模板DNA分子中的引物结合位点杂交。进行延伸反应,以生成模板DNA分子(或其互补序列)的区域的多个拷贝,所述延伸反应在5'端以阵列结合的引物的核酸扩增(例如PCR)引物序列开始,接着合并条形码序列,接着合并引物结合位点序列,并且然后延伸以将模板核酸序列并入所得延伸产物中。因此,产生包含条形码序列的阵列结合的延伸产物和与模板DNA分子的区域互补的序列。将延伸产物装配成测序文库并且进行测序。通过条形码信息辅助序列读段的比对和装配,并且产生完整的4Mb模板DNA序列。
实施例7-延伸产物的PCR扩增
使用包含阵列结合的引物区域的引物基底生成延伸产物的阵列。各延伸产物包含一部分与模板核酸分子互补的核酸,以及PCR引物序列和位置编码条形码序列。给定阵列斑点或区域中的所有产物的条形码序列是相同的。引入与延伸产物在一个末端在PCR引物序列处而在另一末端经由随机六聚体结合序列杂交的PCR引物。进行PCR以扩增延伸产物。将包含模板核酸序列的PCR扩增产物和与条形码序列互补的序列测序。借助于位置条形码信息比对序列读段。
实施例8-将RNA分子加标签并且测序
制备包含RNA分子碎片的RNA提取物的溶液。通过分子梳将RNA拉伸至包含纳米通道特征的载玻片上。将游离(即非阵列结合的)引物添加至拉伸过的RNA分子中,各游离引物包括随机六聚体序列和引物结合位点序列。游离引物经由其随机六聚体区域在沿拉伸过的RNA分子的不同位置杂交。提供如实施例1中所描述制备的具有凝胶涂层的基底,凝胶涂层包括在5'端附接到阵列表面上的引物的空间限定阵列。每个阵列结合的引物从3'到5'具有与游离引物上的引物结合位点序列互补的接头序列、条形码序列以及核酸扩增引物序列,其中给定阵列斑点或区域中的所有引物共享该区域所特有的位置条形码序列。接头序列与同RNA分子杂交的游离引物的引物结合位点序列杂交。用逆转录酶进行延伸反应,以生成RNA分子的区域或片段的拷贝。延伸反应从引物上的核酸扩增引物序列开始,并且将条形码序列并入所得延伸产物中。产生含有条形码序列的延伸产物和与RNA分子的区域互补的序列,并且使其与基底结合。将延伸产物装配到测序文库中。为生成测序文库,添加非基底结合的引物以结合于阵列结合的延伸产物并且用于进行延伸反应。生成非阵列结合的延伸产物,其含有一部分阵列结合的延伸产物以及条形码序列或其互补序列。非基底结合的引物包含尾片段,所述尾片段含有限定序列,其不与阵列结合的延伸产物中的序列互补并且因此不与阵列结合的延伸产物杂交。限定序列包含接头和与Illumina NGS测序系统相容的扩增引物序列。因此,非阵列结合的延伸产物包含用于Illumina HiSeq 2500系统中的序列,并且因此使用Illumina HiSeq 2500系统测序。
通过条形码信息辅助序列读段的比对和装配,并且通过电脑模拟装配序列读段产生完整的RNA序列。对于获自新基因的序列读段,使用适合用于从头装配的软件。用于从头装配的软件为公开可用的软件(例如ABySS、Trans-ABySS、Trinity、Ray、Contrail)或商业软件(例如CLCbio Genomics Workbench)。对于获自再测序的序列读段,使用适合用于再测序装配的软件。所用的软件与Illumina系统相容,诸如BWA、BWA-MEM、Novoalign、Tophat、Splicemap、MapSplice、Abmapper或ERNE-map(rNA)。
实施例9-寡核苷酸固定化转移
根据以下方案实施寡核苷酸固定化转移(OIT):
使引物杂交至模板表面并且延伸:A)将200μL的500nM Acr-FC1引物在Grace杂交室中在55℃于孵育1小时。B)用4X SSC(2次)、2X SSC(2次)冲洗。C)使引物在Grace腔室(200μL)中在37℃下延伸10min+在55℃下20min。使用38μL的H2O、5μL的10X Thermopol、5μL的BSA(10mg/ml)、1μL的dNTP(10mM)、1μL的Bst(8U/μl)制备Bst混合物。D)用4X SSC(2次)、2XSSC(2次)冲洗。
以2X浓度制备凝胶混合物,其中:H2O(0.50mL)、明胶(0.10mg)、丙烯酰胺(60.00mg)、双丙烯酰胺(3.20mg)。通过将50μL的2X丙烯酰胺混合物与50μL的2X SSC组合在一起来制备主混合物。
丙烯酰胺凝胶的活化(活化剂最终浓度=各自0.065%):A)对于每100μL的反应物,添加1.3μL的5%过硫酸铵。B)对于每100μL的反应物,添加1.3μL的5%TEMED。C)涡旋。
薄凝胶的聚合:A)将20μL的凝胶混合物吸移至模板玻璃上。B)用经过硅烷化的玻璃芯片(受体表面)面向下覆盖模板,并且按压以得到均匀的不含气泡的展开物。C)允许聚合10-15min。
变性/分离:A)将结合型芯片放置于1X TE浴槽中并且将其加热至65℃。B)用剃刀将表面拉开。凝胶应停留在芯片侧上。
成像:A)使模板表面的任何剩余的Acr-FC1在0.1N NaOH中变性3min。B)用4X SSC(3次)、2X SSC(3次)冲洗。C)使SP2-Cy3寡核苷酸(500nM)在55℃下在芯片侧杂交45min。使用具有浓NaCl溶液(74%RH)的湿度室。D)使FC2-QC-Cy3寡核苷酸(500nM)在55℃下在模板侧杂交1小时。E)用4X SSC(3次)、2X SSC(3次)冲洗。F)使用落射荧光显微镜使凝胶或模板成像。
实施例10-在寡核苷酸探针阵列上直接拉伸DNA分子
在此实施例中,将25pg/μl人类基因组DNA在50mM MES缓冲液(pH 5.5)中用YOYO-1碘化物按1分子YOYO/5bp DNA的比率进行染色,并且放置于由特氟隆(Teflon)制成的比色皿中。将典型的照相平版印刷合成的DNA阵列放置于能够具有多种牵拉速度的常规机械拉伸机器的固持夹中。将阵列在室温下浸入比色皿中1小时。然后,机器将晶片以67μm/秒的速率从DNA/YOYO混合物中牵拉出来。使阵列在荧光显微镜上在60X放大倍数下成像。如图46和47中所示,人类基因组DNA可直接在照相平版印刷合成的DNA阵列的表面上进行拉伸。
实施例11-使探针与拉伸过的DNA分子杂交并且将其移除
为证实使探针与拉伸过的DNA可逆杂交的能力,使寡核苷酸探针杂交至拉伸过的DNA上并且目视观察。图47示出了实验的第一部分,其中经Cy3标记的寡核苷酸(随机九聚体)在经过YOYO染色的DNA已在经过硅烷化的硅晶片上拉伸之后与其杂交。将约15pg/μl的果蝇基因组DNA在50mM MES缓冲液(pH 5.5)中用YOYO-1碘化物按1分子YOYO/5bp DNA的比率进行染色,并且放置于由特氟隆制成的比色皿中并且如上文所描述进行拉伸。然后,使一小滴150μl 500mM NaOH在晶片表面上滚动以使结合型DNA就地变性。然后,使第二滴150μlBSA(100ng/μl)在晶片上滚动作为阻断剂。最后,使一小滴150μl的于50mM MES,15mM MgCl,pH 5.5中的经Cy3标记的九聚体(10nM)在晶片上缓慢滚动,以促进与变性DNA的随机杂交。此图像是使用60X透镜在Nikon Eclipse 90i上获取。看到在Cy3荧光团中目视观察的所有DNA均被涂布(图48)。将同一硅烷化晶片再次用500mM NaOH洗涤以剥去杂交的九聚体(图49)。当再次目视观察载玻片时,大部分的YOYO信号已恢复。
实施例12-与延伸产物杂交的DNA分子的拉伸.
使未标记的DNA在溶液中变性并且在Alexa
Figure BDA0001017891490000961
-标记的dNTP存在下与未标记的随机六聚体杂交。添加聚合酶以使未标记的杂交的探针沿未标记的DNA分子延伸。图50示出了这些实验中的一个的结果。DNA是在以下条件下杂交和延伸:对于总共40μl反应物体积来说,1μg DNA/H20(26μl)、4μl 5nM未标记的引物、4μl 10X Bst缓冲液(减去吐温20,从而不妨碍DNA与经过硅烷化的表面的疏水性相互作用)、4μl经过标记的10X dNTP混合物(100μM最终浓度)以及2μl Bst聚合酶(8单位酶)。将反应物放置于热循环器中并且加热至95℃持续5分钟,然后温度降至40℃持续3分钟,加热至65℃持续15分钟,并且在添加1μl的0.5MEDTA以终止聚合的情况下冷却至4℃持续10分钟。然后如之前所描述拉伸DNA。图50示出了以许多单个的延伸反应事件沿原始DNA分子的未标记的骨架进行拉伸的单一DNA分子。
其他实施方案
本领域技术人员将了解,本发明还涵盖本发明实施方案的变化形式。举例来说,拉伸过的DNA分子可被片段化并且片段化DNA的群集许多是在片段所在位置的近似位置生成。可用寡核苷酸条形码标记群集以指示片段的位置。类似地,拉伸过的DNA的片段可通过例如引物延伸进行拷贝,并且在所述位置生成群集(例如通过桥式扩增),并且用位置条形码标记群集。
添加DNA可为群集生成的一部分。或者,可通过在长DNA分子被拉伸的基底或变得与长DNA分子被拉伸的基底接触的基底上进行DNA扩增来生成群集。
可添加位置条码作为群集生成的一部分,例如作为适合用于群集扩增的引物的一部分。或者,可将条形码固定于条形码表面,并且然后使条形码表面与具有群集的表面接触,以例如通过连接或延伸反应而将条形码添加至群集中的DNA中。
在另外一些实施方案中,可不拉伸DNA或RNA分子。举例来说,可将向上拉伸的DNA分子定位于一个位置中,并且然后将位置条形码添加至DNA片段或DNA分子的延伸产物中。在这种情况下,反映长DNA分子的片段的DNA分子是大部分用同一条形码或相邻条形码标记。因此,一旦测序,就可以将更小的片段追溯回到原始的长DNA分子。类似地,DNA分子的组织分布也可以用位置条形码进行标记并且测序。
本领域技术人员将了解,尽管描述了关于对DNA分子进行测序的一些实施方案,但是这些方法也可以适合于分析RNA分子或甚至蛋白质分子。用于分析聚合物亚单位组合物和空间分布的位置条形码方法通常可适合用于分析大量不同的分子。
尽管本文已经显示并描述本发明的优选实施方案,但对于本领域技术人员显而易见的是,这些实施方案仅作为实例被提供。在不脱离本发明的情况下,本领域技术人员将可作出各种变体、变化和替换。应当理解,可将本文所描述的本发明的实施方案的各种替代方案应用于实施本发明。下列权利要求旨在限定本发明的范围,且从而覆盖了在这些权利要求及其等同物的范围内的方法和结构。

Claims (17)

1.一种用于克隆多个核酸的方法,所述方法包括:
(a)拉伸靶核酸,
(b)使所述靶核酸片段化成多个核酸,
(c)将包含多个寡核苷酸的基底表面与拓扑异构酶I酶孵育,所述多个寡核苷酸附接到所述基底表面,其中所述多个寡核苷酸中的每一个包含含有第一接头、可变区和第二接头的双链体,其中所述可变区位于所述第一接头和所述第二接头之间,其中所述第一接头附接到所述基底表面,并且其中所述第二接头包含所述拓扑异构酶I酶在所述双链体的一条链内的第一识别序列以及所述拓扑异构酶I酶在所述双链体的相对链上的3’末端处的第二识别序列,其中与所述拓扑异构酶I酶的所述孵育在所述第一识别序列和第二识别序列的接合点处裂解所述多个寡核苷酸中的每一个的两条链并且使所述拓扑异构酶I酶与所述多个寡核苷酸中的每一个键合,由此生成包含与附接到所述基底表面的所述多个寡核苷酸中的每一个键合的拓扑异构酶I酶的基底表面;以及
(d)将所述多个核酸与包含与附接到所述基底表面的所述多个寡核苷酸中的每一个键合的拓扑异构酶I酶的所述基底表面孵育,其中与所述多个寡核苷酸中的每一个键合的所述拓扑异构酶I酶使所述多个核酸中的每一个的每一端与附接到所述基底表面的所述多个寡核苷酸中的一个连接,由此克隆所述多个核酸。
2.如权利要求1所述的方法,其中所述拓扑异构酶I酶来自牛痘病毒。
3.如权利要求2所述的方法,其中所述第一识别序列、所述第二识别序列或两者为5’-TCCTT-3’。
4.如权利要求2所述的方法,其中所述第一识别序列、所述第二识别序列或两者为5’-CCCTT-3’。
5.如权利要求1-4中任一项所述的方法,其中所述基底表面为阵列。
6.如权利要求1-5中任一项所述的方法,其中所述多个核酸中的每一个为DNA。
7.如权利要求1所述的方法,其中所述拉伸在固定化基底表面上进行,所述固定化基底表面不同于包含所述多个寡核苷酸的所述基底表面。
8.如权利要求1所述的方法,其中所述拉伸在包含所述多个寡核苷酸的所述基底表面上进行。
9.如权利要求7或8所述的方法,其中所述拉伸通过转印来进行。
10.如权利要求7或8所述的方法,其中所述拉伸通过磁镊来进行。
11.如权利要求7或8所述的方法,其中所述拉伸通过光镊来进行。
12.如权利要求1-11中任一项所述的方法,其中所述多个核酸包含在所述多个核酸中的每一个的两端处的平端。
13.如权利要求12所述的方法,其中所述片段化包括用生成平端的限制酶处理所述多个核酸。
14.如权利要求12或13所述的方法,其中所述处理还包括通过使用聚合酶向包含所述平端的所述多个核酸的每一端添加包含单个腺嘌呤残基的3’突出。
15.如权利要求14所述的方法,其中使用Taq聚合酶添加所述3’突出。
16.如权利要求1-15中任一项所述的方法,其中所述可变区包含条形码。
17.如权利要求1-16中任一项所述的方法,其中所述第一接头包含限制酶的识别序列。
CN201610420946.2A 2015-06-09 2016-06-13 用于对核酸进行测序的方法 Active CN106244578B (zh)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
US201562173140P 2015-06-09 2015-06-09
US62/173,140 2015-06-09
US201562173943P 2015-06-11 2015-06-11
US62/173,943 2015-06-11
US15/178,411 US11060139B2 (en) 2014-03-28 2016-06-09 Methods for sequencing nucleic acids
EP16173782.0A EP3103885B1 (en) 2015-06-09 2016-06-09 Methods for sequencing nucleic acids
EP16173782.0 2016-06-09
USPCT/US2016/036709 2016-06-09
PCT/US2016/036709 WO2016201111A1 (en) 2015-06-09 2016-06-09 Methods for sequencing nucleic acids
US15/178,411 2016-06-09

Publications (2)

Publication Number Publication Date
CN106244578A CN106244578A (zh) 2016-12-21
CN106244578B true CN106244578B (zh) 2021-11-23

Family

ID=57613080

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610420946.2A Active CN106244578B (zh) 2015-06-09 2016-06-13 用于对核酸进行测序的方法

Country Status (1)

Country Link
CN (1) CN106244578B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018214036A1 (zh) * 2017-05-23 2018-11-29 深圳华大基因股份有限公司 基于滚环扩增的基因组目标区域富集方法及其应用
EP3768881A4 (en) * 2018-03-21 2021-12-15 Centrillion Technology Holdings Corporation METHOD AND SYSTEM FOR PRODUCING DNA SEQUENCING ARRAYS
CN112469852A (zh) * 2018-04-14 2021-03-09 生捷科技控股公司 用于捕获dna分子的dna桥方法
WO2020051824A1 (zh) * 2018-09-13 2020-03-19 连俊龙 核苷酸定序元件、芯片及定序分析方法
CN113661250A (zh) * 2019-02-11 2021-11-16 爱披萨佛公司 使用长读长测序的染色质作图测定和试剂盒
US11639521B2 (en) * 2019-06-03 2023-05-02 The Chinese University Of Hong Kong Method for determining the copy number of a tandem repeat sequence
CN111020018B (zh) * 2019-11-28 2021-09-14 天津金匙医学科技有限公司 一种基于宏基因组学的病原微生物检测方法及试剂盒
US10961563B1 (en) * 2019-12-19 2021-03-30 Robert Bosch Gmbh Nanoscale topography system for use in DNA sequencing and method for fabrication thereof

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060008817A1 (en) * 2000-12-08 2006-01-12 Invitrogen Corporation Methods and compositions for generating recombinant nucleic acid molecules
EP1606417A2 (en) * 2003-03-07 2005-12-21 Rubicon Genomics Inc. In vitro dna immortalization and whole genome amplification using libraries generated from randomly fragmented dna
US20090121133A1 (en) * 2007-11-14 2009-05-14 University Of Washington Identification of nucleic acids using inelastic/elastic electron tunneling spectroscopy
AU2012304328B2 (en) * 2011-09-09 2017-07-20 The Board Of Trustees Of The Leland Stanford Junior University Methods for obtaining a sequence
US11414695B2 (en) * 2013-05-29 2022-08-16 Agilent Technologies, Inc. Nucleic acid enrichment using Cas9

Also Published As

Publication number Publication date
CN106244578A (zh) 2016-12-21

Similar Documents

Publication Publication Date Title
CN107002117B (zh) 核酸测序方法
CN106244578B (zh) 用于对核酸进行测序的方法
EP3103885B1 (en) Methods for sequencing nucleic acids
CN106460032B (zh) 图案化阵列的制备
US11060139B2 (en) Methods for sequencing nucleic acids
KR102642680B1 (ko) 샘플 처리를 위한 조성물 및 방법
US20180057873A1 (en) Methods for performing spatial profiling of biological materials
US11486004B2 (en) Methods of sequencing circular template polynucleotides
CN104471075B (zh) 核酸扩增
US20140274729A1 (en) Methods, compositions and kits for generation of stranded rna or dna libraries
US20120252686A1 (en) Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction
JP2017537657A (ja) 標的配列の濃縮
US20200247907A1 (en) Methods for phrasing epigenetic modifications of genomes
JP2023514887A (ja) 遺伝子型決定のためのキット

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
CB02 Change of applicant information

Address after: Cayman Islands Grand Cayman

Applicant after: Sheng Jie Technology Holdings Ltd.

Address before: Cayman Islands Grand Cayman

Applicant before: Centrillion Technology Holding Corp.

COR Change of bibliographic data
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant