CN104254771B

CN104254771B - 基于纳米孔的分子检测与测序

Info

Publication number: CN104254771B
Application number: CN201380015023.3A
Authority: CN
Inventors: 兰德尔·戴维斯; R·陈
Original assignee: Genia Technologies Inc
Current assignee: F Hoffmann La Roche AG
Priority date: 2012-01-20
Filing date: 2013-01-18
Publication date: 2018-01-12
Anticipated expiration: 2033-01-18
Also published as: US20130244340A1; US20200308641A1; JP6333179B2; US20180223351A1; EP3415901A1; CA2861457A1; JP2018072353A; EP2807476A4; US10662471B2; JP6744852B2; CN107828877A; EP2807476A1; US11965210B2; WO2013109970A1; JP2015505458A; CN104254771A

Abstract

本发明提供了使用纳米孔进行分子鉴定和聚合物(例如，核酸)测序的系统和方法。可使聚合物穿过或接近纳米孔，聚合物的各种亚单位可影响流动通过该纳米孔的电流。可通过在跨纳米孔和/或跨膜施加的多个电压下测量电流来鉴定所述各种亚单位。在一些情况下，标记的核苷酸的聚合向纳米孔呈现标签分子，该标签分子可通过在跨纳米孔和/或跨膜施加的多个电压下测量电流来鉴定。本文还提供了用纳米孔对双链核酸分子的有义链和反义链均进行测序的系统和方法，以及使用核糖核酸(RNA)减速物分子来减慢核酸分子穿过或接近纳米孔的方法。

Description

基于纳米孔的分子检测与测序

交叉引用

本申请要求2012年1月20日提交的美国临时专利申请号61/589,196、2012年1月23日提交的美国临时专利申请号61/589,719和2012年2月17日提交的美国临时专利申请号61/600,227的权益，这些临时申请各自通过引用整体并入本文。

发明背景

核酸测序是一个可用于提供核酸样品的序列信息的过程。这样的序列信息在对受试者进行诊断和/或治疗中可能是有帮助的。例如，受试者的核酸序列可用于鉴定、诊断遗传疾病，并且可能开发针对该遗传疾病的治疗。作为另一个例子，对病原体的研究可导致针对接触性传染病的治疗。

有可获得的方法可用于对核酸进行测序。然而，这样的方法是昂贵的，而且可能无法在一个时间段内精确地提供对诊断和/或治疗受试者而言可能是必要的序列信息。

发明内容

纳米孔可用于对包括核酸分子在内的聚合物进行测序。本文认识到对改进的核酸分子鉴定和核酸测序方法的需求。在一些情况下，聚合物穿过纳米孔，而该聚合物的各种亚单位(例如，核酸的腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)和/或尿嘧啶(U)碱基)可影响流过纳米孔的电流。如本文所述，可通过在跨纳米孔和/或跨膜施加的多个电压下测量电流来鉴定各种亚单位。在一些情况下，标记的核苷酸的聚合将标签分子释放和/或呈现给纳米孔，这些标签分子可通过在跨纳米孔和/或跨膜施加的多个电压下测量电流来确定。本文还提供了用纳米孔对双链核酸分子的有义链和反义链二者进行测序的方法，以及利用核糖核酸(RNA)减速物(speed bump)分子减慢核酸分子通过纳米孔的方法。

本发明的一个方面提供了一种用于鉴定分子或其部分的方法，该方法包括(a)提供在邻近或接近电极设置的膜中包含至少一个纳米孔的芯片，其中该电极被适配为检测通过纳米孔的电流。接着，可将分子或其部分插入纳米孔内。然后可跨纳米孔和/或跨膜施加电压，并且电压可以变化。可测量多个电压下的电流来鉴定分子或其部分。

本发明的另一方面提供了一种对核酸分子或其部分进行测序的方法，该方法包括提供包含有义链和反义链的双链核酸分子，以及将第一核酸区段连接在双链核酸分子的第一末端上。该第一核酸区段于双链核酸分子的第一末端将有义链与反义链相连接。接着，可将双链核酸分子解离，以提供包含有义链的有义部分和反义链的反义部分的单链核酸分子。然后可使单链核酸分子穿过或被引导通过或接近在邻近或接近电极设置的膜中的纳米孔。该电极可被适配为在单链核酸分子位于纳米孔中或者穿过或接近纳米孔时检测电流。接着，使用电极，在单链核酸分子驻留于纳米孔中或者穿过或接近纳米孔的同时可获得电流(本文也称为“电流(current)”)测量值。双链核酸的序列可由电流测量值来确定。

本发明的另一方面提供了一种对核酸分子或其部分进行测序的方法，该方法包括使单链核酸分子穿过或接近邻近或接近电极设置的膜上的纳米孔。单链核酸分子包含通过有义链和反义链各自末端部分连接的核酸区段与反义链偶联的有义链。电极被适配为在单链核酸分子穿过或接近纳米孔时检测电流。借助于电极，当单链核酸分子穿过或接近纳米孔的同时获得电流测量值。单链核酸分子的序列可由电流测量值获得。

本发明的另一方面提供了一种对核酸分子进行测序的方法，包括提供在邻近或接近电极设置的膜中包含至少一个纳米孔的芯片。该电极被适配为检测该核酸分子或其部分。接着，可将核酸分子引导通过或接近纳米孔。借助于至少一种与该核酸分子相缔合的核糖核酸(RNA)减速物分子，使核酸分子通过或接近纳米孔的进程停止或停顿(stall)。当核酸分子穿过或接近纳米孔时，可对核酸分子或其部分进行测序。

本发明的另一方面提供了一种获得核酸分子的序列信息的方法，该方法包括形成包含至少一种与核酸分子相缔合的核糖核酸(RNA)减速物分子的双链体区段，以及使核酸分子流动通过、邻近或接近膜中的纳米孔。该膜被设置成邻近或接近电极，该电极可与感测电路耦合或为其一部分。一旦核酸分子流动通过、邻近或接近纳米孔，该双链体区段即被引导至或被引导通过纳米孔。接着，当核酸分子流动通过、邻近或接近纳米孔时，从电极获得电信号。该电信号与该核酸分子的一个或多个碱基与纳米孔的至少一部分的相互作用相关联。借助于该双链体区段，可减少核酸分子的流动，在一些情况下可使其停顿。

通过以下的详细描述(其中仅示出并描述了说明性的实施方案)，本发明的其他方面和优势对本领域技术人员而言将变得显而易见。正如将认识到的，本发明能够有其他不同的实施方案，并且其若干细节能够在各个明显的方面进行修改，所有这些都不脱离本公开内容。因此，附图和说明将被视为说明性的，而非限制性的。

援引并入

本说明书中提到的所有出版物、专利和专利申请均通过引用并入本文，其程度犹如特别地且单独地指出每个单独的出版物、专利和专利申请通过引用而并入。

附图说明

本发明的新特征在随附的权利要求中具体阐述。通过参考以下对在其中利用到本发明原理的说明性实施方案加以阐述的详细描述和附图，将会获得对本发明的特征和优点的更好的理解，在附图中：

图1A、1B和1C示出了纳米孔检测器的实例。在图1A中，纳米孔被设置在电极上；在图1B中，纳米孔被插入位于加样孔(well)上的膜中；而在图1C中，纳米孔被设置在突出的电极上；

图2A、2B、2C和2D示出了能用纳米孔检测的分子的实例。图2A示出了对分子的检测；图2B示出了对聚合物分子的部分的检测；图2C示出了对用于核酸测序的标签分子的检测；而图2D示出了在核苷酸掺入的同时对标签的检测；

图3示出了包含纳米孔而非加样孔的芯片设置的一个实例；

图4示出了超小型测量电路的一个实例；

图5示出了单元模拟电路的一个实例；

图6示出了纳米孔检测器的阵列；

图7示出了测试芯片单元阵列配置的一个实例；

图8示出了配置为用于控制测序仪的计算机系统；

图9示出了一种核酸测序方法；

图10图示说明了单链(ss)测试多核苷酸分子穿过纳米孔；

图11图示说明了在单链测试多核苷酸分子的尾端形成的大体积结构，该结构使单链测试多核苷酸穿过纳米孔停顿；

图12图示说明了与单链测试多核苷酸分子结合的多个减速物，其中单链测试多核苷酸因两端具有大体积结构而被捕获在纳米孔中；

图13图示说明了通过将单链测试多核苷酸与随机减速物池接触而实现的不同结合模式；

图14图示说明了通过随机使纳米孔中的单链测试多核苷酸停顿以获得序列信息而实现的不同序列信息模式；

图15图示说明了与在第一末端具有大体积结构的单链测试多核苷酸结合以使其穿过纳米孔时停顿的减速物；

图16图示说明了通过本发明的纳米孔检测器获得的多组电信号；

图17图示说明了对被捕获在纳米孔中、被两个大体积结构结合的单链测试多核苷酸中的方向标识符的检测；

图18图示说明了通过标识符特异性减速物对标识符的检测；

图19图示说明了包含样品多核苷酸和多个功能部分的单链测试多核苷酸的一个实例；

图20图示说明了包含样品多核苷酸和多个功能部分的双链测试多核苷酸的一个实例；

图21图示说明了被捕获在纳米孔中、在纳米孔的两侧均与多个减速物相结合的单链测试多核苷酸；

图22图示说明了使单链测试多核苷酸与减速物列(train)接触；

图23图示说明了根据本发明实施方案的过程的流程图；

图24图示说明了工作温度与在一端具有BS2-1而在另一端具有BS1的单链测试多核苷酸在纳米孔中的捕获之间的关系；

图25示出了连接至核苷酸的磷酸上的标签分子的一个实例；

图26示出了备选的标签位置的实例；

图27示出了可检测的标签-多磷酸和可检测的标签；

图28图示说明了测试多核苷酸的一个实例，该测试多核苷酸包含样品多核苷酸、该样品多核苷酸的反义多核苷酸、将样品多核苷酸与其反义多核苷酸相连接的接头、第一前大体积结构和第二前大体积结构；

图29示出了波形的实例；

图30示出了针对腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)和胸腺嘧啶(T)这四种核酸碱基，提取的信号相对于施加的电压的图；

图31示出了针对腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)和胸腺嘧啶(T)这四种核酸碱基的多次运行，提取的信号相对于施加的电压的图；和

图32示出了针对腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)和胸腺嘧啶(T)这四种核酸碱基的多次运行，相对电导差百分比(percent relativeconductive difference，％RCD)相对于施加的电压的图。

发明详述

虽然本文已经显示并描述了本发明的各种实施方案，但是对本领域技术人员显而易见的是，这些具体实施方案仅以实例的方式提供。在不脱离本发明的情况下，本领域技术人员现将会想到许多变化、改变和替代。应当理解，可以使用本文所述发明的实施方案的各种替代方案。

本文所用的术语“纳米孔”一般是指在膜中形成的或以其他方式提供的孔、通道或通路。膜可以是有机膜，如脂双层，或合成膜，如由聚合材料形成的膜。膜可以是聚合材料。纳米孔可被设置成邻近或接近感测电路或与感测电路耦合的电极，该感测电路例如为互补金属氧化物半导体(CMOS)或场效应晶体管(FET)电路。在一些实例中，纳米孔具有0.1纳米(nm)至约1000nm级别的特征性宽度或直径。一些纳米孔是蛋白质。α-溶血素是蛋白质纳米孔的一个实例。

本文所用的术语“聚合酶”一般是指能够催化聚合反应的任何酶或其他分子催化剂。聚合酶的实例包括但不限于核酸聚合酶或连接酶。聚合酶可以是聚合作用的酶。

本文所用的术语“核酸”一般是指包含一个或多个核酸亚单位的分子。核酸可包括选自腺苷(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)和尿嘧啶(U)或其变体的一个或多个亚单位。核苷酸可包括A、C、G、T或U，或其变体。核苷酸可包括任何可被掺入生长中的核酸链的亚单位。这样的亚单位可以是A、C、G、T或U，或者是对一个或多个互补A、C、G、T或U具有特异性的，或与嘌呤(即A或G，或其变体)或嘧啶(即C、T或U，或其变体)互补的任何其他亚单位。亚单位可使得单个核酸碱基或成组的碱基(例如，AA、TA、AT、GC、CG、CT、TC、GT、TG、AC、CA或其尿嘧啶对应物)能够被分辨。在一些实例中，核酸是脱氧核糖核酸(DNA)或核糖核酸(RNA)，或其衍生物。核酸可以是单链的或双链的。

本文所用的术语“多核苷酸”或“寡核苷酸”一般是指包含一个或多个核苷酸的聚合物或寡聚物。多核苷酸或寡核苷酸可包含DNA多核苷酸或寡核苷酸、RNA多核苷酸或寡核苷酸，或DNA多核苷酸或寡核苷酸和/或RNA多核苷酸或寡核苷酸的一个或多个部分。

如本文一般所用的，“核苷酸”或“碱基”可以是基本核苷酸或核苷酸类似物。基本核苷酸是脱氧腺苷单磷酸(dAMP)、脱氧胞苷单磷酸(dCMP)、脱氧鸟苷单磷酸(dGMP)、脱氧胸苷单磷酸(dTMP)、腺苷单磷酸(AMP)、胞苷单磷酸(CMP)、鸟苷单磷酸(GMP)或尿苷单磷酸(UMP)。核苷酸类似物是在基本核碱基(A、C、G、T和U)、脱氧核糖/核糖结构、基本核苷酸的磷酸基团或其任意组合上具有修饰的基本核苷酸的类似物或模拟物。例如，核苷酸类似物可具有经修饰的碱基，无论是天然存在的还是人造的。经修饰的碱基的实例包括但不限于甲基化的核碱基、经修饰的嘌呤碱基(例如，次黄嘌呤、黄嘌呤、7-甲基鸟嘌呤、isodG)、经修饰的嘧啶碱基(例如，5,6-二氢尿嘧啶和5-甲基胞嘧啶、isodC)、通用碱基(例如，3-硝基吡咯和5-硝基吲哚)、非结合性碱基模拟物(例如，4-甲基苯并咪唑和2,4-二氟甲苯或苯)以及无碱基(无碱基核苷酸，其中核苷酸类似物不含碱基)。具有经修饰的脱氧核糖(例如，双脱氧核苷，如双脱氧鸟苷、双脱氧腺苷、双脱氧胸苷和双脱氧胞苷)和/或磷酸结构(统称为骨架结构)的核苷酸类似物的实例包括但不限于乙二醇核苷酸、吗啉代和锁定核苷酸。

本文所用的术语“测试聚合物”一般是指出于检测目的而穿过或邻近纳米孔的聚合物分子。测试聚合物可包含多个具有相似化学结构的构件。测试聚合物的实例包括但不限于测试多核苷酸、测试肽/蛋白质和测试碳水化合物。测试多核苷酸可以是单链测试多核苷酸(即ss测试多核苷酸)或双链测试多核苷酸(即ds测试多核苷酸)。构件的实例包括但不限于核苷酸、氨基酸和单糖。

本文所用的术语“样品多核苷酸”一般是指可包含感兴趣的多核苷酸例如单链(“ss”)样品多核苷酸(ss样品多核苷酸)或双链(“ds”)样品多核苷酸(即ds样品多核苷酸，例如，ds样品DNA、ds样品RNA和ds样品DNA-RNA杂合体)的核酸分子。样品多核苷酸可以是从生物样品中获得的天然多核苷酸或合成多核苷酸。合成多核苷酸可以是通过对天然多核苷酸进行修饰而获得的多核苷酸，例如，旨在用于多核苷酸鉴定和/或测序的预加工的多核苷酸。这类预加工的实例包括但不限于：针对期望的片段对样品多核苷酸的富集、配对末端加工、配对读取加工、包括二硫化物处理在内的外遗传预加工、经由PCR的聚焦片段分析、PCR片段测序和短多核苷酸片段分析。

本文所用的术语“测试多核苷酸”一般是指出于检测目的而穿过或邻近纳米孔的多核苷酸分子。测试多核苷酸可以是单链测试多核苷酸(即ss测试多核苷酸)和双链测试多核苷酸(即ds测试多核苷酸，例如，ds测试DNA、ds测试RNA和ds测试DNA-RNA杂合体)。本文所用的单链测试多核苷酸包含在本文所述的方法中将被减速物结合的单链多核苷酸的一部分。单链测试多核苷酸可进一步包含样品多核苷酸和其他功能部分(例如，前大体积结构(pre-bulky structure)、标识符和分离标签)。

本文所用的术语“前大体积结构”一般是指在特定条件下(例如，在特定温度下，存在/不存在特定化合物的情况下)可形成大体积结构的多核苷酸分子中的分子结构。前大体积结构的实例包括寡核苷酸结构。前大体积结构可以是单链多核苷酸或双链多核苷酸。

本文所用的术语“大体积结构”一般是指由单链测试多核苷酸分子中的前大体积结构形成的结构(例如，核苷酸)。大体积结构在工作条件下可使纳米孔中的测试多核苷酸分子减慢或停顿，直至工作条件变为另一种条件，在这种条件下大体积结构转变为前大体积结构，或者是其他可以使测试多核苷酸分子停顿的结构。大体积结构的实例包括但不限于2-D和3-D结构，如多核苷酸双链体结构(RNA双链体、DNA双链体或RNA-DNA杂合体)、多核苷酸发夹结构、多发夹结构和多臂结构。在另一个实施方案中，前大体积结构通过与对前大体积结构具有特异性的配体的相互作用形成大体积结构。这样的前大体积结构/配体对的实例包括但不限于生物素/链霉亲和素、抗原/抗体和碳水化合物/抗体。

在一个实施方案中，大体积结构由寡核苷酸前大体积结构形成，例如，由单链测试多核苷酸分子中的前大体积结构形成的寡核苷酸结构。多核苷酸或寡核苷酸大体积结构的实例包括但不限于发夹核酸链、杂交的反义核酸链、自杂交的多臂和三维DNA或RNA分子。在另一个实施方案中，大体积结构通过如本文所述的前大体积结构/配体对的相互作用而形成。

本文所用的术语“双链体”一般是指双链体结构、部分、区域或区段。双链体可包括RNA双链体、DNA双链体或DNA-RNA双链体结构、部分、区域或区段。

本文所用的术语“减速物”一般是指与测试多核苷酸分子的结合区段形成复合物的分子，如寡核苷酸。在一个实例中，当测试多核苷酸分子在施加的电势下穿过或邻近纳米孔时，在减速物与结合区段间形成的复合物使位于或邻近纳米孔的测试多核苷酸分子减慢或停顿足够长的停留时间，该停留时间足以使纳米孔检测器从测试多核苷酸分子获得信号，该信号可提供关于测试多核苷酸分子的结构或序列信息。停留时间之后，该复合物解离，测试多核苷酸分子向前移动通过纳米孔。

本文所用的术语“已知的减速物”一般是指与单链测试多核苷酸中的已知序列特异性结合的减速物。由于单链测试多核苷酸上的结合区段(已知序列)是已知的，因此减速物结构也可能是已知的(例如，与单链测试多核苷酸上的已知序列互补)。

本文所用的术语“随机减速物池”一般是指可与测试多核苷酸分子或其片段的所有或基本上所有部分结合的减速物的集合。随机减速物池的一个实例包含具有通用核碱基的寡核苷酸，该通用核碱基能与所有基本核碱基(A、T、C、G和U)碱基配对。随机减速物池的另一个实例包含具有基本核碱基的所有可能组合的给定长度的寡核苷酸。随机减速物池的另一个实例包含具有基本核碱基和通用核碱基的每种可能组合的给定长度的寡核苷酸。随机减速物池的另一个实例包含在指定位置具有通用核碱基而在其他位置具有基本核碱基的所有组合的减速物。随机减速物的另一个实例是单链减速物的组合，其与单链测试多核苷酸形成双链体部分，并且该双链体部分具有大致相同的解链温度。这些单链减速物可具有相同或不同的长度，和/或相同或不同的核苷酸。

本文所用的术语“制止物(stopper)”一般是指可与测试多核苷酸形成制止物-测试多核苷酸复合物，并且使该制止物-测试多核苷酸复合物的流动在纳米孔的缩窄区域之前停止一段停留时间的结构。该制止物可以是测试多核苷酸的一部分，或是单独的结构(例如，本文所述的减速物，和在核苷酸聚合酶的存在下形成的测试多核苷酸的反义链)，或是可与测试多核苷酸结合并且任选地使测试多核苷酸移动通过纳米孔的酶。

本文所用的术语“标识符”一般是指测试多核苷酸中可通过本文所述的方法检测或鉴定的已知序列或结构。标识符的实例包括但不限于方向标识符、参照信号标识符、样品来源标识符和样品标识符。标识符可包含提供可识别的独特电信号的一种或多种核苷酸或结构。这样的核苷酸和结构的实例包括但不限于isodG、isodC、甲基化核苷酸、锁定核酸、通用核苷酸和无碱基核苷酸。在一些实施方案中，无碱基核苷酸提供比基本核苷酸更强的信号。因此，通过纳米孔针对同时包含无碱基核苷酸和基本核苷酸的序列检测的电信号可提供比从仅含基本核苷酸的序列获得的电信号更强的信号。例如，相对于仅包含基本核苷酸的4至5个碱基的序列，包含约25％无碱基核苷酸的4至5个碱基的序列可提供强达两倍以上的信号。序列具有的无碱基核苷酸越多，该序列的电信号越强。因此，通过改变标识符序列中无碱基核苷酸的量，标识符可提供期望强度(例如，比具有相同长度的基本寡核苷酸强约两倍、约3、4、5、6、7、8、9或约10倍)的电信号。

本文所用的术语“方向标识符”一般是指定位在距由前大体积结构形成的大体积结构至少0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或50个碱基的已知序列(如图17中所示的单链测试多核苷酸分子中的阴影部分)。在一些实例中，当大体积结构形成时，其可阻止单链测试多核苷酸分子流动通过其内引入单链测试多核苷酸分子的纳米孔。在一个实例中，当大体积结构在纳米孔内部或附近停顿、减慢或停止时，可获得一组电信号，该电信号可以提供在单链测试多核苷酸分子的流动方向上位于大体积结构之前的序列以及该大体积结构的第一个碱基对的序列信息。当序列已知时，这样的电信号可以(但不限于)：(1)证实前大体积结构已经适当地形成大体积结构，以使得该大体积结构阻止单链测试多核苷酸分子流动通过纳米孔；(2)指示单链测试多核苷酸分子已经到达单链测试多核苷酸的单链部分的一个末端，和/或(3)作为参照或校准读数来基线化(base line)在同一纳米孔中获得的其他电信号。在一些实施方案中，方向标识符包含提供容易识别的独特电信号的一个或多个核苷酸或结构。这样的核苷酸和结构的实例包括但不限于isodG、isodC和无碱基核苷酸。

本文所用的术语“参照信号标识符”一般是指测试多核苷酸中的已知序列，当通过本文所述的方法检测或鉴定时，其可作为参照或校准读数来基线化在同一纳米孔中获得的其他电信号。

本文所用的术语“样品来源标识符”一般是指测试多核苷酸中的已知序列，当通过本文所述的方法检测或鉴定时，其可用于鉴定样品多核苷酸的来源。

本文所用的术语“样品标识符”一般是指测试多核苷酸中的已知序列，当通过本文所述的方法检测或鉴定时，其可用于鉴定个体样品多核苷酸。

本文所用的术语“接头标识符”一般是指测试多核苷酸中的已知序列，当通过本文所述的方法检测或鉴定时，其可用于指示样品多核苷酸部分与反义多核苷酸部分之间的过渡。在一个实例中，当检测或鉴定接头标识符时，样品/反义多核苷酸部分已经穿过纳米孔。

本发明提供了用于测序，例如核酸(例如，DNA、RNA)、蛋白质或聚合物测序的装置、系统和方法。本发明的方法可用于对诸如DNA或RNA的核酸分子或诸如蛋白质的其他聚合物分子进行测序。在核酸测序的情况下，可确定核酸分子的核酸碱基含量。在蛋白质测序的情况下，可确定蛋白质的氨基酸序列。

纳米孔检测

本文提供了用纳米孔鉴定分子或其部分的系统和方法。用纳米孔鉴定诸如分子或其部分的物质的方法可包括，提供在邻近或接近电极设置的膜中包含至少一个纳米孔的芯片。该电极可被适配为检测通过纳米孔的电流。该方法可进一步包括将分子或其部分插入纳米孔，并改变跨纳米孔和/或跨膜施加的电压。在一些情况下，该方法包括测量多个电压下的电流以鉴定分子或其部分。在一些实施方案中，多个电压下的电流包括电子签名，并且进一步包括将该电子签名与多个参照电子签名进行比较以鉴定分子或其部分。

纳米孔可形成于或以其他方式嵌入邻近感测电路如集成电路的感测电极设置的膜中。该集成电路可以是专用集成电路(ASIC)。在一些实例中，该集成电路是场效应晶体管或互补金属氧化物半导体(CMOS)。该感测电路可位于芯片或其他具有纳米孔的装置中，或者在芯片或装置之外，诸如芯片外(off-chip)配置。该半导体可以是任何半导体，包括但不限于IV族(例如，硅)和III-V族半导体(例如，砷化镓)。

图1示出了具有温度控制的纳米孔检测器(或传感器)的一个实例，如可以按照美国专利申请公开号2011/0193570中所述的方法制备的，该申请通过引用整体并入本文。参见图1A，纳米孔检测器包含与导电溶液(例如，盐溶液)107接触的顶部电极101。底部导电电极102靠近、邻近或接近插入膜105中的纳米孔106。在一些情况下，底部导电电极102嵌入半导体103中，其中在半导体衬底104中嵌有电路。半导体103的表面可被处理成疏水性的。所检测的样品穿过纳米孔106中的孔。半导体芯片传感器被置于包装208中，而包装208又在温度控制元件109附近。温度控制元件109可以是热电加热和/或冷却装置(例如，珀耳帖装置)。

多个纳米孔检测器可形成纳米孔阵列。纳米孔阵列可包括一个或多个纳米孔检测器。在一些情况下，纳米孔阵列包括至少1、2、3、4、5、6、7、8、9、10、100、1000、10000或100,000个纳米孔检测器。单个纳米孔检测器可包括一个或多个邻近感测电极(例如，底部导电电极102)的纳米孔。在一些情况下，单个纳米孔检测器包括至少1、2、3、4、5、6、7、8、9、10或100个邻近感测电极的纳米孔。

参见图1B，其中相同的数字表示相同的元件，膜105可被放置在加样孔110之上，其中传感器102形成加样孔表面的一部分。图1C示出了一个实例，其中电极102从处理过的半导体表面103突出。

在一些实例中，膜105在底部导电电极102上形成，而非在半导体103上形成。在这样的一种情况下，膜105可与底部导电电极102形成耦合相互作用。然而，在一些情况下，膜105在底部导电电极102和半导体103上形成。作为备选，膜105可在半导体103上形成，而非在底部导电电极102上形成，但是可以延伸超过底部导电电极102。

许多不同类型的分子或其部分可以通过本文所述的方法和/或装置进行检测。图2示出了可被检测的分子以及用于对包括核酸在内的聚合物进行测序的方法的一些实例。在一些情况下，分子201从膜205的顺侧203(远离电极)向反侧204(朝向电极)穿过纳米孔202。

如图2B中所见，分子可以是聚合物分子206，并且当聚合物分子穿过纳米孔时，可以鉴定该聚合物分子的部分207。该聚合物分子可以是生物分子，如核酸或蛋白质。在一些实施方案中，该聚合物分子是核酸，并且该聚合物分子的部分是核酸或成组核酸(例如，2、3、4、5、6、7或8个核酸)。在一些实施方案中，该聚合物分子是多肽，并且该多肽的部分是氨基酸或成组核酸(例如，2、3、4、5、6、7或8个氨基酸)。

在一些情况下，当核酸或标签流动通过或邻近纳米孔时，感测电路检测到与该核酸或标签相关的电信号。该核酸可以是较大链的亚单位。该标签可以是核苷酸掺入事件或标记的核酸与纳米孔或邻近纳米孔的物质(如将标签从核酸上切下的酶)之间的其他相互作用的副产物。该标签可保持连接至核苷酸。可采集检测到的信号，并将其存储在存储单元中，然后用于构建核酸的序列。可对采集的信号进行处理，以解释检测到的信号中的任何异常，例如错误。

如图2C中所见，在一些实施方案中，分子208(例如，“标签分子”)与核苷酸209结合。可在该核苷酸被掺入生长中的核酸链210(例如，通过聚合酶211)的同时鉴定该分子。核苷酸可根据与模板核酸212的碱基配对而掺入。若不同标签与不同核苷酸(例如，A、C、T和G)中的每一个结合，则可通过用纳米孔检测标签分子来确定模板核酸的序列(例如，无需模板核酸穿过纳米孔)。在一些实施方案中，一旦核苷酸掺入生长中的核酸链，该分子即从核苷酸中释放213。如图2D中所示，可在核苷酸被掺入生长中的链的同时和/或从核苷酸214释放之前检测该分子。

装置设置

图3示意性地图示说明了纳米孔装置100(或传感器)，其可如本文所述用于检测分子(和/或对核酸进行测序)。含有脂双层的纳米孔可用电阻和电容进行表征。纳米孔装置100包括在导电性固体衬底106的脂双层相容性表面104上形成的脂双层102，其中脂双层相容性表面104可被脂双层不相容表面105隔离，而导电性固体衬底106可被绝缘材料107电隔离，并且其中脂双层102可被在脂双层不相容表面105上形成的无定形脂质103所包围。脂双层102可嵌有单个纳米孔结构108，该纳米孔结构108具有大到足以使被检测的分子和/或小离子(例如，Na⁺、K⁺、Ca²⁺、Cl^-)在脂双层102的两侧之间穿行的纳米孔110。一层水分子114可被吸附在脂双层相容性表面104上，并夹在脂双层102与脂双层相容性表面104之间。吸附在亲水性脂双层相容性表面104上的水膜114可促进脂质分子的排序，并有助于脂双层相容性表面104上脂双层的形成。含有待测分子(例如，根据需要任选地具有标记的核苷酸或其他组分的核酸分子)112的溶液的样品腔室116可设置在脂双层102之上。该溶液可以是含有电解质的水溶液，其被缓冲至最佳离子浓度，并保持在最佳pH，以使纳米孔110保持开启。该装置包括一对与可变电压源120耦合的电极118(包括负极118a和正极118b)，用于跨脂双层提供电刺激(例如，偏压)以及用于感测脂双层的电特性(例如，电阻、电容和离子电流)。正极118b的表面是或者形成脂双层相容性表面104的一部分。导电性固体衬底106可与电极118之一耦合，或形成其一部分。装置100还可以包括用于控制电刺激和用于处理所检测到的信号的电路122。在一些实施方案中，包括(例如，可变的)电压源120作为电路122的一部分。电路122可包括放大器、积分器、噪音滤波器、反馈控制逻辑和/或各种其它组件。电路122可以是集成在硅衬底128内的集成电路，并且可以进一步耦合至与存储器126耦合的计算机处理器124。

脂双层相容性表面104可以由各种适合于离子传导和气体形成从而有助于脂双层形成的材料形成。在一些实施方案中，可使用导电性或半导电性亲水材料，因为它们可允许更好地检测脂双层电特性的变化。示例性材料包括Ag-AgCl、Au、Pt或掺杂硅或其它半导体材料。在一些情况下，该电极不是牺牲电极。

脂双层不相容表面105可由不适合于脂双层形成的各种材料形成，并且这些材料一般是疏水性的。在一些实施方案中，优选非导电性疏水材料，因为它除了使脂双层区域彼此隔开之外，还使脂双层区域电绝缘。示例性脂双层不相容材料包括例如氮化硅(例如，Si₃N₄)和特氟龙、用疏水分子硅烷化的氧化硅(例如，SiO₂)。

在一个实例中，图3的纳米孔装置100是具有一个α-溶血素(aHL)蛋白108的α-溶血素(aHL)纳米孔装置，该α-溶血素蛋白108嵌入在涂覆于铝材料106上的脂双层相容性银(Ag)表面104之上形成的二植酰磷脂酰胆碱(DPhPC)脂双层102中。脂双层相容性Ag表面104被脂双层不相容氮化硅表面105隔离，并且铝材料106被氮化硅材料107电绝缘。铝106耦合至集成在硅衬底128中的电路122。置于芯片上或从盖板128向下延伸的银-氯化银电极接触含有(例如，核酸)分子的水溶液。

aHL纳米孔是7个单独肽的装配体。aHL纳米孔的入口或前室的直径为大约26埃，这个宽度足以容纳dsDNA分子的一部分。从前室开始，aHL纳米孔先变宽再变窄，变成直径大约为15埃的桶，这个宽度足以允许单个ssDNA分子(或更小的标签分子)穿过，但不足以允许dsDNA分子(或更大的标签分子)穿过。

除了DPhPC，纳米孔装置的脂双层还可由各种其他合适的两亲性材料装配而成，该材料基于各种考虑来选择，例如所用纳米孔的类型，所表征的分子的种类，以及所形成的脂双层的各种物理、化学和/或电学特性，诸如所形成的脂双层的稳定性和通透性、电阻和电容。示例性的两亲性材料包括各种磷脂，如棕榈酰-油酰-磷脂酰-胆碱(POPC)和二油酰-磷脂酰-甲酯(DOPME)、二植酰磷脂酰胆碱(DPhPC)、二棕榈酰磷脂酰胆碱(DPPC)、磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酸、磷脂酰肌醇、磷脂酰甘油和鞘磷脂。

除了如上所示的aHL纳米孔，纳米孔还可以是各种其他类型的纳米孔。实例包括γ-溶血素、杀白细胞素、蜂毒肽、耻垢分枝杆菌(Mycobacterium smegmatis)孔蛋白A(MspA)和各种其他天然存在的、经修饰的天然的及合成的纳米孔。可基于分析物分子的各种特性(诸如分析物分子相对于纳米孔孔径的大小)来选择合适的纳米孔。例如，aHL纳米孔具有大约15埃的限制性孔径。

电流测量

在一些情况下，可以在不同的施加电压下测量电流。为了实现此目的，可向电极施加期望的电势，并且随后可在整个测量中保持所施加的电势。在一个实施方式中，如本文所述地，可以为此目的而使用运算放大器积分器拓扑结构。该积分器依靠电容性反馈来保持电极上的电压电势。积分器电路可提供出色的线性度、单元间匹配以及偏移特性。运算放大器积分器通常需要大尺寸，以便达到所需的性能。本文描述了更紧凑的积分器拓扑结构。

在一些情况下，可向腔室施加电压电势“V液体”，它为芯片上的所有单元提供公共电势(例如，350mV)。积分器电路可将电极(其电气地为积分电容器的顶板)初始化至比公共液体电势更高的电势。例如，450mV的偏压可在电极与液体之间产生正100mV的电势。该正电压电势可造成从电极流向液体腔室接触件的电流。在这种情况下，载流子是：(a)K+离子，其从双层的电极一侧(反侧)向双层的贮液器一侧(顺侧)流动通过该孔；和(b)反侧上的氯离子(Cl-)，其根据以下电化学反应与银电极反应：Ag+Cl-→AgCl+e-。

在一些情况下，当Cl-被转化成氯化银时，K+流出封闭单元(从双层的反侧到顺侧)。作为电流流动的结果，双层的电极侧可变为脱盐的。在一些情况下，银/氯化银液体海绵状材料或基体可作为储存器，以在电腔室接触件处发生的逆反应中提供Cl-离子，以使电路完整。

在一些情况下，电子最终流到积分电容器的顶侧，这创造出所测量的电流。电化学反应将银转化为氯化银，并且只要有银可供转化，电流就会继续流动。在一些情况下，银的有限供应导致依赖于电流的电极寿命。在一些实施方案中，使用非损耗的电极材料(例如，铂)。

电极充电方法

当使用牺牲电极或在载流反应中改变分子特性的电极(例如，包含银的电极)，或者在载流反应中改变分子特性的电极时，在检测周期期间对电极进行再充电的能力可能是有优势的。电极可能在检测周期中损耗，尽管在一些情况下，电极在检测周期中可能不会损耗。再充电可防止电极达到给定的损耗极限(诸如，完全耗尽)——当电极较小时(例如，当电极小到足以提供每平方毫米有至少500个电极的电极阵列时)，这可能是一个问题。电极寿命在一些情况下按比例增减，并且至少部分地取决于电极的宽度。

在一些情况下，对在检测过程中长时间(例如，当通过使核酸穿过纳米孔来对核酸进行测序时)保持跨纳米孔的保守极性的电压差的需求消耗了电极，并可能限制检测的持续时间和/或电极的大小。本文所述的装置和方法允许更长(例如，无限长)的检测时间和/或可按比例缩小到任意小尺寸(例如，受除了检测期间电极损耗以外的其他考虑因素所限)的电极。如本文所述，分子(例如，标签分子)仅在部分时间可检测到(例如，与聚合酶相缔合的标签)。在检测周期之间切换跨纳米孔的电压的极性允许对电极进行再充电。在一些情况下，多次(例如，在100毫秒的时间段内2、3、4、5、6、7、8、9、10、20、30、40、50、100、1000、10,000、100,000、1,000,000次或更多次)检测分子或其部分。

在一些情况下，周期性地反转跨纳米孔的电压的极性。电压极性可在检测周期持续任何合适的时间长度(例如，约1ms、约5ms、约10ms、约15ms、约20ms、约25ms、约30ms、约40ms、约50ms、约60ms、约80ms、约100ms、约125ms、约150ms、约200ms等等)之后反转。在对电极再充电的周期期间(即，当电压极性与用于标签检测的电压相反时)的时间段和电场强度使得电极恢复到其在检测前的状态(例如，电极质量)。在一些情况下，跨纳米孔的净电压为零(例如，在适当长的时间尺度上(诸如1秒、1分钟或5分钟)，正电压周期抵消负电压周期)。在一些情况下，施加于纳米孔的电压是均衡的，使得存在由邻近或接近纳米孔的感测电极检测到的净零电流。

在一些实例中，将交流电(AC)波形施加于膜中的纳米孔或邻近膜的电极，以拖动分子通过或接近纳米孔，并释放该分子。AC波形可具有至少10微秒、1毫秒(ms)、5ms、10ms、20ms、100ms、200ms、300ms、400ms、500ms的数量级的频率。该波形可帮助交替地和按顺序地捕获分子(例如，标签分子)和释放分子，或者以其它方式使分子在多个方向(例如，相反方向)上移动，这样可以增加分子与纳米孔相关联的总时间段。这种充电和放电的均衡可允许来自纳米孔电极和/或给定分子的更长信号的生成。

在一些实例中，施加AC波形以重复引导分子的至少一部分(例如，与标记的核苷酸(例如，掺入的标记的核苷酸)相缔合的标签)进入纳米孔，并且引导分子的至少一部分离开纳米孔。分子(例如，标签或与标签偶联的核苷酸)可被酶(例如，聚合酶)保持。对被酶保持的单个分子的这种重复的加载和驱逐可能有利地提供更多机会来检测分子。例如，如果分子被酶保持40毫秒(ms)，且AC波形高位施加5ms(例如，以便引导标签进入纳米孔)并且低位施加5ms(例如，以便引导标签离开纳米孔)，则纳米孔可用于对分子进行大约4次读取。多次读取可实现修正误差，诸如与分子穿入和/或穿出纳米孔相关联的误差。

波形可具有任何合适的形状，包括规则形状(例如，在一定时间段内重复)和不规则形状(例如，在任何适当长的时间段(诸如1小时、1天或1周)内不重复)。图29示出了一些合适的(规则)波形。波形的实例包括三角波(图A)、正弦波(图B)、锯齿波、方波等。

在一些情况下，电极可能在分子检测过程中损耗。跨纳米孔的电压的极性的反转(即，正到负或负到正)，诸如在施加交流电(AC)波形时的极性反转，可对电极进行再充电。图29C示出了位于跨纳米孔的零电势差处的水平虚线，其中正电压与幅度成比例地向上延伸，并且负电压与幅度成比例地向下延伸。不管波形的形状如何，正方向3100上的电压-时间图的合并的曲线下面积可等于负方向3101上的合并的曲线下面积。在一些情况下，例如当正3100面积和负3101面积相等时，电极在适当长的时间段(例如，一小时、一天或一周)内既不充电也不损耗。在一些状况下，当跨纳米孔施加正电势时，测量第一电流，而当跨纳米孔施加负电势(例如，绝对幅度与正电势相等的负电势)时，测量第二电流。第一电流可等于第二电流，但是在一些情况下，第一电流和第二电流可以不同。例如，第一电流可小于第二电流。

在一些情况下，纳米孔在相对较低幅度电压下，在相对较长的时间段内检测标记的核苷酸(例如，图29，指示3100)，而在相对较大幅度电压下，在相对较短的时间段内对电极进行再充电(例如，图29，指示3101)。在一些情况下，检测时间段比电极再充电时间段长至少2、至少3、至少4、至少5、至少6、至少8、至少10、至少15、至少20或至少50倍。

在一些情况下，响应于输入而改变波形。在一些情况下，输入是电极的损耗水平。在一些情况下，电压的极性和/或幅度至少部分地基于电极的损耗而变化，并且波形是不规则的。

在短时间段内(例如，在少于约5秒、少于约1秒、少于约500ms、少于约100ms、少于约50ms、少于约10ms或少于约1ms的时间段内)重复进行检测和对电极进行再充电的能力允许使用相对于可保持恒定直流电(DC)电势和DC电流的电极而言更小的电极，并且所述更小的电极用于对穿过纳米孔的多核苷酸进行测序。较小的电极可允许表面上大量的检测位点(例如，包含电极、感测电路、纳米孔和聚合酶)。

表面包含任何合适密度的离散位点(例如，适用于在给定时间量内或以给定成本对核酸样品进行测序的密度)。在一个实施方案中，表面具有的离散位点的密度大于或等于每1mm²约500个位点。在一些实施方案中，表面具有的离散位点的密度为每1mm²约100、约200、约300、约400、约500、约600、约700、约800、约900、约1000、约2000、约3000、约4000、约5000、约6000、约7000、约8000、约9000、约10000、约20000、约40000、约60000、约80000、约100000或约500000个位点。在一些实施方案中，表面具有的离散位点的密度为每1mm²至少约200、至少约300、至少约400、至少约500、至少约600、至少约700、至少约800、至少约900、至少约1000、至少约2000、至少约3000、至少约4000、至少约5000、至少约6000、至少约7000、至少约8000、至少约9000、至少约10000、至少约20000、至少约40000、至少约60000、至少约80000、至少约100000或至少约500000个位点。

电极可在检测(例如，对核苷酸掺入事件的检测)之前、之间或期间或之后进行再充电。在一些情况下，电极在约20毫秒(ms)、约40ms、约60ms、约80ms、约100ms、约120ms、约140ms、约160ms、约180ms或约200ms内进行再充电。在一些情况下，电极在少于约20毫秒(ms)、少于约40ms、少于约60ms、少于约80ms、少于约100ms、少于约120ms、少于约140ms、少于约160ms、少于约180ms、约200ms、少于约500ms或少于约1秒内进行再充电。

单元电路

在图4中示出了单元电路的实例。将施加电压Va施加于MOSFET电流传送器门401之前的运算放大器1200。此处还示出了电极402以及由器件403检测到的核酸和/或标签的电阻。

施加电压Va可驱动电流传送器门401。由此在电极上产生的电压是Va-Vt，其中Vt是MOSFET的阈值电压。在一些情况下，这导致向电极施加的实际电压的有限控制，这是由于MOSFET阈值电压可随工艺、电压、温度而显著变化，并且甚至在一个芯片中的器件之间都有显著变化。这样的Vt变化在亚阈值泄露效应开始起作用的低电流水平上可能更大。因此，为了提供对施加电压的更好的控制，可以在具有电流传送器器件的跟随器反馈配置中使用运算放大器。这确保了向电极施加的电压为Va，而不依赖于MOSFET阈值电压的变化。

单元电路的另一实例在图5中示出，并且包括积分器、比较器和数字逻辑，以便移入控制位并同时移出比较器输出的状态。单元电路可适于随本文提供的系统和方法使用。B0线至B1线可出自移位寄存器。模拟信号由库内的所有单元共享，而数字线可在单元之间菊花链式连接。

单元数字逻辑包含5位数据移位寄存器(DSR)、5位并行加载寄存器(PLR)、控制逻辑以及模拟积分器电路。通过使用LIN信号，移入DSR中的控制数据被平行加载到PLR中。这5个位控制数字“先断后合”定时逻辑，该定时逻辑对单元中的开关加以控制。此外，数字逻辑具有置位-复位(SR)锁存器以记录比较器输出的切换。

该架构提供可变采样率，该可变采样率与单个单元电流成比例。较高的电流可以比较低的电流产生每秒更多的样本。电流测量的分辨率与被测量的电流相关。小电流能够以比大电流更精细的分辨率得到测量，这可能比固定分辨率测量系统更为有利。存在允许用户通过改变积分器的电压摆幅来调整采样率的模拟输入。有可能提高采样率以便分析生物学上快速的过程，或者减缓采样率(并从而增加精确度)以便分析生学上慢速的过程。

积分器的输出被初始化成电压LVB(低偏压)，并进行积分直至电压CMP。积分器输出在这两个电平之间每摆动一次就生成一个样本。因此，电流越大，积分器输出摆动就越快，因而采样率就越快。类似地，如果降低CMP电压，则生成新样本所需的积分器输出摆幅就会减小，因而采样率就会提高。因此，简单地降低LVB与CMP之间的电压差提供了一种提高采样率的机制。

基于纳米孔的测序芯片可并入被配置成阵列的大量自主操作的或可单独寻址的单元。例如，可以由1000行单元乘以1000列单元构建成一百万个单元的阵列。该阵列通过例如测量核苷酸掺入事件时释放的标签被纳米孔检测到时的电导差，来实现核苷酸分子的并行测序。并且，该电路实现允许确定孔-分子复合物的电导特性，这在标签辨别上可能是有价值的。

集成的纳米孔/双层电子单元结构可施加合适的电压以便进行电流测量。例如，可能有必要既(a)控制电极电压电势，又(b)同时地监测电极电流，以便正确地进行。

此外，可能有必要彼此独立地控制单元。可能需要对单元的独立控制以便管理大量可能处于不同物理状态的单元。对施加于电极的的分段线性电压波形刺激的精确控制可用于单元的物理状态之间的转换。

为了减小电路尺寸和复杂度，提供用以施加两个单独电压的逻辑可能是足够的。这允许对单元的两个独立分组和施加对应的状态转换刺激。状态转换本质上是随机的，具有相对较低的发生概率。因此，能够断言适当的控制电压并于随后进行测量以确定是否已经发生所期望的状态转变是非常有用的。例如，可以向单元施加适当电压，并继而测量电流以确定是否已经形成双层。单元被划分为两组：(a)那些具有双层形式而不再需要施加电压的单元；这些单元可具有所施加的0V偏压以便实现空操作(NOP)——亦即，停留在相同的状态，以及(b)那些尚未形成双层的单元；这些单元将会再次具有施加的双层形成电压。

通过将可允许的施加电压限制在2个，以及成批地在物理状态之间反复地转换单元，可以实现大幅简化和电路尺寸减小。例如，通过限制可允许的施加电压，可以实现至少1.1、2、3、4、5、6、7、8、9、10、20、30、40、50或100倍的减小。

纳米孔阵列

本发明提供了用于检测分子和/或对核苷酸进行测序的纳米孔检测器(或传感器)阵列。参见图6，多个(例如，核酸)分子可在纳米孔检测器阵列上被检测和/或测序。此处，每个纳米孔位置(例如，601)包含纳米孔，该纳米孔任选地附接于聚合酶和/或磷酸酶。在每个如本文所述的阵列位置上一般还有传感器。在一些实例中，提供了附接于核酸聚合酶的纳米孔阵列，并且标记的核苷酸随聚合酶掺入。在聚合期间，标签被纳米孔检测到(例如，通过释放并穿入或穿过纳米孔，或通过向纳米孔呈现)。

纳米孔阵列可具有任何合适数目的纳米孔。在一些情况下，阵列包含约200、约400、约600、约800、约1000、约1500、约2000、约3000、约4000、约5000、约10000、约15000、约20000、约40000、约60000、约80000、约100000、约200000、约400000、约600000、约800000、约1000000个纳米孔，等等。在一些情况下，阵列包含至少200、至少400、至少600、至少800、至少1000、至少1500、至少2000、至少3000、至少4000、至少5000、至少10000、至少15000、至少20000、至少40000、至少60000、至少80000、至少100000、至少200000、至少400000、至少600000、至少800000、或至少1000000个纳米孔。

纳米孔检测器阵列可具有高密度的离散位点。例如，每单位面积相对较大数目的位点(即，密度)允许较小装置的构建，该装置是便携的、廉价的或具有其他有利特征。阵列中的单个位点可以是可单独寻址的位点。包含纳米孔和感测电路的大量位点可允许一次同时对相对大量的核酸分子进行测序，例如，通过并行测序。这样的系统可以提高通量和/或降低对核酸样品进行测序的成本。

表面包含任何合适密度的离散位点(例如，适用于在给定时间量内或以给定成本对核酸样品进行测序的密度)。每个离散位点可包括传感器。表面可具有大于或等于每1mm²约500个位点的离散位点密度。在一些实施方案中，表面具有的离散位点密度为每1mm²约200、约300、约400、约500、约600、约700、约800、约900、约1000、约2000、约3000、约4000、约5000、约6000、约7000、约8000、约9000、约10000、约20000、约40000、约60000、约80000、约100000或约500000个位点。在一些情况下，表面具有的离散位点密度为每1mm²至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少2000、至少3000、至少4000、至少5000、至少6000、至少7000、至少8000、至少9000、至少10000、至少20000、至少40000、至少60000、至少80000、至少100000、或至少500000个位点。

在一些实例中，测试芯片包括264个传感器的阵列，该264个传感器布置成各含66个传感器单元的4个单独组(也称为库)。每组转而分为三“列”，每列有22个传感器“单元”。考虑到理想情况下在阵列中的264个传感器中的每一个上形成包含脂双层和所插入的纳米孔的虚拟单元(但是在仅有一部分传感器单元被如此填充的情况下，装置仍可成功操作)，“单元”名称是适当的。

存在单个模拟I/O板，其向安装到管芯(die)表面的导电圆筒内所含的液体施加电压电势。该“液体”电势被施加到孔的顶侧，并且对于检测器阵列中的所有单元是公共的。孔的底侧具有暴露电极，并且每个传感器单元可向其电极施加不同的底侧电势。继而测量顶部液体连接与孔底侧上的每个单元的电极连接之间的电流。传感器单元测量受标签分子在孔内穿行所调制的穿过孔的电流。

在一些情况下，五个位控制每个传感器单元的模式。继续参见图7，阵列中的264个单元中的每一个可被单独控制。向一组66个单元分别施加数值。通过向数据移位寄存器(DataShiftRegister，DSR)串行地移入330(66*5位/单元)个数字值来控制组中66个单元中每一个的模式。使用每组66个单元一个单独的引脚对的KIN(时钟)和DIN(数据输入)引脚来将这些值移入阵列之中。

因此，使用330个时钟来将330个位移入DSR移位寄存器。当断言对应的LIN<i>(加载输入)为高时，从这个移位寄存器并行加载第二个330位并行加载寄存器(PLR)。在PLR被并行加载的同时，将单元的状态值加载到DSR中。

完整的操作可包括330个时钟以将330个数据位移入DSR、具有被断言为高的LIN信号的单个时钟周期，随后是330个时钟周期以读取移出DSR的被捕获的状态数据。操作是流水线式，以便当从阵列读出330个位时，可以同时将新的330个位移入DSR。因此，在50MHz时钟频率下，读取的周期时间为331/50MHz＝6.62us。

用于对核酸样品进行测序的计算机系统

借助于计算机系统，可对本发明的装置、系统和方法进行调控。图8示出了系统800，其包含计算机系统801，该计算机系统801耦合至纳米孔检测和/或核苷酸测序系统802。计算机系统801可以是一个服务器或多个服务器。计算机系统801可被编程用于调控样品制备和处理，以及由测序系统802进行的核苷酸测序。如本文所述，纳米孔检测和/或测序系统802可以是基于纳米孔的测序仪(或检测器)。

计算机系统可被编程用于实现本发明的方法。计算机系统801包括中央处理器(CPU，本文中也称为“处理器”)805，该中央处理器805可以是单核或多核处理器，或者是用于并行处理的多个处理器。处理器805可以是电路(诸如集成电路)的一部分。在一些实例中，处理器805可集成在专用集成电路(ASIC)中。计算机系统801还包括存储器810(例如，随机存取存储器、只读存储器、闪速存储器)、电子存储单元815(例如，硬盘)、用于与一个或多个其他系统通信的通信接口820(例如，网络适配器)，以及外围设备825，诸如高速缓冲存储器、其他存储器、数据存储和/或电子显示适配器。存储器810、存储单元815、接口820和外围设备825通过诸如主板等通信总线(实线)而与CPU 805通信。存储单元815可以是用于储存数据的数据存储单元(或数据储存库)。计算机系统801可以借助于通信接口820而可操作地耦合至计算机网络(“网络”)。该网络可以是因特网、因特网和/或外联网，或者是与因特网通信的内联网和/或外联网。网络可包括一个或多个计算机服务器，所述计算机服务器可实现分布式计算。

在一些实例中，计算机系统801包括现场可编程门阵列(FPGA)。在这种情况下可不包括处理器805。

本公开的方法可通过储存在计算机系统801的电子存储位置上(例如，储存在存储器810或电子存储单元815上)的机器(或计算机处理器)可执行代码(或软件)的方式来实现。在使用期间，代码可由处理器805执行。在一些情况下，可从存储单元815中检索代码并将其储存在存储器810上以供处理器805随时访问。在一些情况下，可排除电子存储单元815，并在存储器810上储存机器可执行指令。

代码可被预编译和配置用于随同具有适于执行代码的处理器的机器一起使用，或者可在运行时期间编译。代码能够以编程语言来提供，可以选择编程语言以使代码能够以预编译或当场编译(as-compiled)的方式执行。

计算机系统801可适于储存用户概要信息，例如，姓名、物理地址、电子邮件地址、电话号码、即时消息(IM)处理、教育信息、工作信息、社交喜好和/或厌恶，以及与用户或其他用户潜在相关的其他信息。这样的概要信息可以储存在计算机系统801的存储单元815上。

本文所提供的系统和方法的各个方面，诸如计算机系统801，可以通过编程来体现。该技术的各个方面可以被认为是通常以携载或体现于某种类型的机器可读介质上的机器(或处理器)可执行代码和/或关联数据的形式存在的“产品”或“制品”。机器可执行代码可储存在诸如存储器(例如，ROM、RAM)或硬盘等电子存储单元上。“存储”型介质可包括计算机、处理器等的任何或所有的有形存储器或其关联模块，诸如各种半导体存储器、磁带驱动器、磁盘驱动器等，其可在任何时间为软件编程提供非暂时性存储。整个软件或其各部分可不时通过因特网或各种其他电信网络来通信。这样的通信可例如实现从一个计算机或处理器向另一计算机或处理器中(例如，从管理服务器或主机向应用服务器的计算机平台中)的软件加载。因此，可承载软件元素的另一类型的介质包括经由有线或光学陆线网络或者通过各种空中链路的光波、电波和电磁波，诸如跨本地设备之间的物理接口使用的光波、电波和电磁波。携载此类波的物理元素，诸如有线或无线链路、光学链路等，也可被认为是承载软件的介质。如本文所使用，除非局限于非暂时性的有形“存储”介质，否则诸如计算机或机器“可读介质”等术语是指任何参与向处理器提供用于执行的指令的介质。

因此，机器可读介质，诸如计算机可执行代码，可以采取许多形式，包括但不限于：有形存储介质、载波介质或物理传输介质。非易失性存储介质例如包括光盘或磁盘，诸如任何一个或多个计算机中的任何存储设备等，诸如可用于实现附图中所示数据库的介质。易失性存储介质包括动态存储器，诸如这样的计算机平台的主存储器。有形传输介质包括同轴电缆；铜线和光纤，包括构成计算机系统内的总线的线缆。载波传输介质可采用电信号或电磁信号或者声波或光波的形式，诸如在射频(RF)和红外线(IR)数据通讯中生成的电信号或电磁信号或者声波或光波。计算机可读介质的常见形式因此例如包括：软盘、柔性盘、硬盘、磁带、任何其他磁介质、CD-ROM、DVD或DVD-ROM、任何其他光学介质、穿孔卡片纸带、任何其他具有孔洞图案的物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、任何其他存储器芯片或匣、传送数据或指令的载波、传送这样的载波的电缆或链路，或者计算机可从中读取编程代码和/或数据的任何其他介质。这些计算机可读介质形式中的许多形式可涉及向处理器传送一个或多个指令的一个或多个序列以供执行。

核酸测序

核酸测序方法可包括获取含有待测序核酸的生物样品，从生物样品中提取或以其他方式分离核酸样品，以及在一些情况下制备用于测序的核酸样品。

图9示意性地图示说明了核酸样品的测序方法。该方法包括从生物样品(例如，组织样品、流体样品)中分离核酸分子，和制备用于测序的核酸样品。测序可包括确定核酸样品的单个核酸碱基的碱基组成，包括顺序。在一些情况下，核酸样品提取自细胞。提取核酸的技术的实例有使用溶菌酶、超声处理、提取、高压或其任意组合。在一些情况下核酸为无细胞核酸，因而无需从细胞中提取。

在一些情况下，可通过包括从核酸样品中去除蛋白质、细胞壁碎片和其他组分的过程来为测序制备核酸样品。有许多商业产品可用于完成此过程，例如，离心柱(spincolumn)。还可使用乙醇沉淀和离心。

核酸样品可被分割(或断裂)成多个片段，这可有助于核酸测序，例如借助于包括阵列中的多个纳米孔的装置。然而，使待测序的核酸分子断裂可能不是必需的。

在一些情况下，确定长序列(即，可能不需要“鸟枪测序”法)。可以确定任何适当长度的核酸序列。例如，至少约5、约10、约20、约30、约40、约50、约100、约200、约300、约400、约500、约600、约700、约800、约800、约1000、约1500、约2000、约2500、约3000、约3500、约4000、约4500、约5000、约6000、约7000、约8000、约9000、约10000、约20000、约40000、约60000、约80000，或约100000个碱基等可被测序。在一些情况下，至少5、至少10、至少20、至少30、至少40、至少50、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少800、至少1000、至少1500、至少2000、至少2500、至少3000、至少3500、至少4000、至少4500、至少5000、至少6000、至少7000、至少8000、至少9000、至少10000、至少20000、至少40000、至少60000、至少80000、至少100000个碱基等被测序。在一些情况下，被测序的碱基是连续的。在一些情况下，被测序的碱基不是连续的。例如，给定数目的碱基可以连续测序。在另一个实例中，一个或多个被测序的碱基可以被一个或多个区块隔开，该区块中的序列信息不进行测定和/或不可获得。在一些实施方案中，模板可以被多次测序(例如，使用环状核酸模板)，任选地产生冗余序列信息。在一些情况下，使用软件来提供序列。在一些情况下，核酸样品可在测序前被分割。在一些情况下，可处理核酸样品链以使给定的双链体DNA或RNA/DNA区域成为环状的，这样该双链体DNA或RNA/DNA区域的相应的有义和反义部分被包括在环状DNA或环状DNA/RNA分子中。在这样的情况下，来自这类分子的被测序的碱基可允许更容易的数据装配和对碱基位置阅读的检查。

本发明的系统和方法可用于对多种类型的生物样品如核酸(例如，DNA、RNA)和蛋白质进行测序。在一些实施方案中，本文所述的方法、装置和系统可用于对生物样品(例如，蛋白质或核酸)进行分类。已分类的样品和/或分子可被引导至各个箱元(bin)以供进一步分析。

核酸分子可以直接测序(例如，如图2B所示通过使核酸穿过纳米孔)或间接测序(例如，如图2C所示通过检测释放的标签分子)。

用于核酸样品测序的方法和系统

本文描述了使用或借助于一个或多个纳米孔对核酸进行测序的方法、装置和系统。所述一个或多个纳米孔可以在邻近或感应性接近电极设置的膜(例如，脂双层)中，该电极是集成电路的一部分或耦合至集成电路。

在一些实例中，纳米孔装置包括位于邻近或感应性接近电极的膜中的单个纳米孔。在其他实例中，纳米孔装置包括至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000或10000个接近传感器电路或感测电极的纳米孔。所述一个或多个纳米孔可与单个电极和感测集成电路或多个电极和感测集成电路相关联。

系统可包括反应室，该反应室包括一个或多个纳米孔装置。纳米孔装置可以是可单独寻址的纳米孔装置(例如，能够不依赖于系统中的其他纳米孔装置检测信号并提供输出的装置)。可单独寻址的纳米孔可以是可单独读取的。在一些情况下，可单独寻址的纳米孔可以使可单独写入的。作为备选，可单独寻址的纳米孔可以是可单独读取并且可单独写入的。系统可包括一个或多个计算机处理器，以便于本发明的样品制备和各种操作，诸如核酸测序。该处理器可耦合至纳米孔装置。

纳米孔装置可包括多个可单独寻址的感测电极。每个感测电极可包括邻近电极的膜，以及该膜中的一个或多个纳米孔。

本发明的方法、装置和系统可在核酸分子穿过纳米孔时检测核酸碱基。可修饰核酸分子以便在各种碱基通过纳米孔时更容易地区分它们，如PCT专利公开号WO2007/146158中所述，其通过引用整体并入本文。

RNA减速物和大体积结构

本文提供了用于多核苷酸测序的系统和方法。尤其是，本发明公开的系统和方法优化了纳米孔(或某些类型的蛋白质或突变蛋白质)之内的、通过或至少部分通过该纳米孔的分子(例如，多核苷酸)的控制、速度、移动和/或转运。在一些情况下，穿行速度足够慢或停止足够长的时间，以便累积足够的电流阻断信息来鉴定在多核苷酸的单链区中的分子和/或序列连续核苷酸。换言之，在一些实施方案中，减速物(例如，寡核苷酸n聚物(n-mers))可与靶多核苷酸结合，以使得这些双链部分被“卡”在纳米孔的一部分内一段时间，同时靶标的单链部分(“ss”)受到询问，并且生成及检测遗传分析。一段时间后，“卡住的”寡核苷酸可以熔脱(melted away)，并且样品可被转运通过纳米孔。在一些实施方案中，可选择寡核苷酸n聚物，以使得每个寡核苷酸n聚物以均一的速度熔脱或被去除，以致于样品以受控的和/或恒定的速度移动通过纳米孔。减速物分子的应用在PCT专利公开号WO2012/088339和PCT专利公开号WO2012/088341中有所描述，这些申请通过引用整体并入。

令人惊讶地，可使用包含核糖核酸(RNA)的减速物来控制核酸通过纳米孔的速度。减速物可包含任选地沿RNA骨架定位的通用碱基。可通过如本文所述地使分子穿过纳米孔而对核酸分子进行测序，但是核酸的穿行速度经常太快而无法准确地确定核酸序列和/或分辨单个核酸的位置。RNA减速物可有效地降低和/或控制核酸分子穿过纳米孔的速度。

在一个方面，用于对核酸分子进行测序的方法包括提供在邻近或接近电极设置的膜中包含至少一个纳米孔的芯片。该电极可被适配为检测核酸分子或其部分。该方法可进一步包括引导核酸分子通过纳米孔。可借助于至少一个与核酸分子相缔合的核糖核酸(RNA)减速物分子使核酸分子通过纳米孔的进程停止或停顿。该方法可进一步包括当核酸分子穿过纳米孔时对核酸分子或其部分进行测序。

在另一个方面，用于获得核酸分子的序列信息的方法包括形成含有至少一个与核酸分子相缔合的核糖核酸(RNA)减速物分子的双链体区段，以及使该核酸分子流动通过膜中的纳米孔。该膜被设置成邻近或接近电极，并且当核酸分子流动通过纳米孔时，该双链体区段被导向纳米孔。该方法可进一步包括在核酸分子流动通过纳米孔时从电极获得电信号。该电信号可与该核酸分子的一个或多个碱基与纳米孔的相互作用相关，并且可借助于该双链体区段降低核酸分子的流动。

在一些实施方案中，RNA减速物分子与核酸分子非共价缔合(例如，形成非共价键，如减速物与核酸之间的碱基对相互作用)。

RNA减速物分子可包含含有一个或多个寡核苷酸碱基的序列的寡核苷酸。减速物分子可具有任意长度，包括多达2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个寡核苷酸碱基。在一些情况下，RNA减速物分子具有通用碱基、吗啉代、乙二醇核苷酸、无碱基核苷酸、甲基化核碱基、经修饰的碱基、非结合性碱基模拟物、肽核酸(PNA)、锁定核酸或其任意组合。

减速物分子可在膜的一侧或多侧与核酸相缔合。在一些实施方案中，RNA减速物分子在膜的顺侧(例如，远离电极的一侧)与核酸分子相缔合。在一些实施方案中，RNA减速物分子在膜的反侧(例如，与电极较近的一侧)与核酸分子相缔合。在一些情况下，RNA减速物分子在膜的顺侧和膜的反侧与核酸分子相缔合。当核酸分子穿过纳米孔时，RNA减速物分子可从核酸分子上解离。在一些实施方案中，该方法进一步包括在使包括在双链体区段中的核酸分子的一部分流动通过纳米孔之前使RNA减速物分子从核酸分子上解离。该核酸分子可以是单链的。

借助于多个与核酸分子相缔合的RNA减速物分子，可使核酸分子通过纳米孔的进程减慢、停止或停顿。一旦RNA减速物分子与纳米孔相互作用(例如，纳米孔含有限制核酸分子流动通过纳米孔的缩窄)，流动即可降低。当核酸分子通过纳米孔的进程停止或停顿时，可鉴定任意适当数目的碱基(例如，通过纳米孔进行测序)。在一些实施方案中，核苷酸分子的单碱基得到鉴定。在一些情况下，核酸分子的多达2、3、4、5、6、7、8、9、10个或更多个碱基得到鉴定(例如，作为一组)。

在一些情况下，该方法进一步包括将核酸分子捕获在纳米孔中。借助于在核酸分子的一个或多个末端部分处形成的大体积结构，可将核酸分子捕获在纳米孔中。在一些情况下，借助于附接(例如，连接)到核酸分子的一个或多个末端部分的大体积结构，将核苷酸分子捕获在纳米孔中。在一些实施方案中，该方法进一步包括逆转核酸分子的流动方向。可通过逆转核酸分子的流动方向，对核酸分子或其部分进行再测序。

在一个方面，本发明涉及使用纳米孔检测器检测和/或鉴定测试多核苷酸中的序列的方法。可通过在多核苷酸序列末端形成的一个或两个大体积结构，将多核苷酸序列捕获在纳米孔中，以使得同一测试多核苷酸可被同一纳米孔检测器多次读取。此外，每个大体积结构可与5’末端或3’末端结合，以使样品多核苷酸按已知的方向穿过孔。

已知的减速物可用于结合测试多核苷酸中的已知序列以检测/鉴定已知序列。该方法可不受限制地使用，以检测测试多核苷酸是否已经正确穿入纳米孔内，测试多核苷酸来自哪个样品来源，以及单独地鉴定被捕获在纳米孔中的测试多核苷酸。此外，测试多核苷酸可进一步包含参照信号指示物，以产生能够作为校准参照用于从同一纳米孔获得的其他电信号的电信号。此外，可同时用多个纳米孔分析多个测试多核苷酸，以供同时测序和/或分子表征。多个纳米孔可以是可单独寻址的和/或具有单独施加的电势。因此，多个测试多核苷酸可同时被分析，任选地首先鉴定具有一个或多个所期望的已知序列的多核苷酸。可释放不具有所期望的已知序列的多核苷酸，而不进行进一步的表征。具有所期望的已知序列的多核苷酸可进一步进行表征，并任选地如本文所述进行分离和浓缩。

随机减速物池可用于以随机的方式结合测试多核苷酸或其片段。因此，测试多核苷酸或其片段的每个核苷酸可能在纳米孔中停顿足够长的时间以采集核苷酸序列信息。可通过将所获得的全部序列信息放到一起来鉴定测试多核苷酸或其片段的核苷酸序列。测试多核苷酸可进一步包含已知的结构，如方向标识符、参照信号标识符、样品来源标识符、样品标识符，以提供信息(例如，大体积结构的形成)、测试多核苷酸的来源以及测试多核苷酸的鉴定。测试多核苷酸可进一步包含分离标签以分离和浓缩测试多核苷酸。在一些实施方案中，用多个纳米孔(例如，在纳米孔阵列中)检测/鉴定多个测试多核苷酸。本文所述的方法可应用于每个被检测/鉴定的测试多核苷酸。纳米孔可单独寻址并控制，以选择性地检测/鉴定/采集/浓缩其中的测试多核苷酸。

如图10所示，单链(ss)多核苷酸分子可在施加的电势下通过纳米孔。单链多核苷酸可以是测试多核苷酸。当单链多核苷酸分子穿过纳米孔时，可检测到与单链多核苷酸分子对通过纳米孔的离子流动的阻断相对应的一组电信号。在不存在减速物或大体积结构时，单链多核苷酸分子可遇到很小的阻力，并太快地通过纳米孔，以致无法可靠地记录电信号以供单链多核苷酸的测序。在图示说明的实例中，单链多核苷酸被引导从膜的顺侧(即，远离感测电极设置的膜的一侧)向膜的反侧(即，朝向感测电极设置的膜的一侧)通过纳米孔。

大体积结构(BS)可用于使单链多核苷酸穿过纳米孔减慢或停止。图11图示说明了用于使单链测试多核苷酸分子穿过纳米孔停止的尾端BS。BS可以是通过单链测试多核苷酸尾端的自身包裹而在测试多核苷酸的一个末端形成的发夹结构。通常，单链测试多核苷酸可在施加的电势下穿过纳米孔，直至大体积的发夹结构到达纳米孔的入口。由于发夹结构比纳米孔的直径大，因此单链测试多核苷酸在纳米孔中停顿足够长的时间，从而获得单链测试多核苷酸的一组电信号。然而，所获得的电信号可能仅反映多核苷酸的一部分的结构，该部分位于发夹之前或特定双链体区域之前，并因此位于纳米孔的缩窄区域之中或附近。

图12图示说明了被两个大体积结构捕获在纳米孔中的单链测试多核苷酸。纳米孔检测在工作温度下进行，该工作温度可低于室温和/或形成大体积结构时的温度，使得一个或多个较短多核苷酸双链体部分可在减速物与单链测试多核苷酸之间形成(减速物-测试多核苷酸双链体区段)。减速物-测试多核苷酸双链体区段可使单链测试多核苷酸减慢或停顿一段充足的停留时间，从而获得在单链测试多核苷酸的流动方向上位于减速物-测试多核苷酸双链体区段之前的单链测试多核苷酸区段以及减速物-测试多核苷酸双链体区段的第一个碱基对的序列信息。然后减速物-测试多核苷酸双链体区段可以解离，从而单链测试多核苷酸可向前移动通过纳米孔，直至另一减速物-测试多核苷酸双链体区段使其停顿，或者在单链测试多核苷酸的一个末端上的大体积结构使其停顿、减慢或停止。一旦单链测试多核苷酸到达一个末端，电势任选地可在极性上反转，以使单链测试多核苷酸以相反的方向移动，并根据需要重复该过程。

当单链测试多核苷酸具有未知序列(例如，样品多核苷酸)时，可构建随机减速物池以结合单链测试多核苷酸的随机部分。由于单链测试多核苷酸的每个部分可被随机减速物池中的至少一个减速物所结合，通过使单链测试多核苷酸与随机减速物池接触而实现的结合模式每次都可以是随机的(例如，图13)。因此，获得其序列信息的区段对每次运行来说也是随机的(例如，图14)。然而，如所述的重复该过程允许用纳米孔检测器来鉴定未知序列的每一个和所有核苷酸。因此，可通过使所获得的单链测试多核苷酸的随机部分的序列信息重叠来构建整个未知序列。

当单链测试多核苷酸包含一个或多个已知序列(例如，标识符)时，本文所述的方法还可用于检测一种或多种标识符的存在和/或用于鉴定在单链测试多核苷酸的流动方向上位于标识符之前的单链测试多核苷酸上的序列。单链测试多核苷酸可仅在一个末端(图15)或在两个末端具有BS。纳米孔检测器在任选地低于室温的工作温度下运行。可使用减速物池，其包含可特异性结合标识符(例如，标识符1，图15)以形成减速物-标识符双链体区段的减速物。减速物-标识符双链体区段可使单链测试多核苷酸停顿，并且可获得一组电信号。可表征这些信号，以显示标识符的存在，或鉴定在单链测试多核苷酸的流动方向上位于标识符之前的区段的序列。这样的电信号的一个实例在图16中示出。

由样品多核苷酸设计及构建测试多核苷酸

在一个实施方案中，样品多核苷酸与各个功能部分相连接，以便于纳米孔测序和/或鉴定。功能部分的实例包括但不限于如本文所述的前大体积结构和标识符，以及有助于样品多核苷酸的分离和富集的分离标签。功能部分任选地包含一种或多种核苷酸。

样品多核苷酸可以是合成多核苷酸或从生物样品获得的多核苷酸。在一个实施方案中，样品多核苷酸具有1至约100,000个碱基、1至约10,000个碱基、1至约1,000个碱基、1至约500个碱基、1至约300个碱基、1至约200个碱基、1至约100个碱基、约5至约100,000个碱基、约5至约10,000个碱基、约5至约1,000个碱基、约5至约500个碱基、约5至约300个碱基、约5至约200个碱基、约5至约100个碱基、约10至约100,000个碱基、约10至约10,000个碱基、约10至约1,000个碱基、约10至约500个碱基、约10至约300个碱基、约10至约200个碱基、约10至约100个碱基、约20至约100,000个碱基、约20至约10,000个碱基、约20至约1,000个碱基、约20至约500个碱基、约20至约300个碱基、约20至约200个碱基、约20至约100个碱基、约30至约100,000个碱基、约30至约10,000个碱基、约30至约1,000个碱基、约30至约500个碱基、约30至约300个碱基、约30至约200个碱基、约30至约100个碱基、约50至约100,000个碱基、约50至约10,000个碱基、约50至约1,000个碱基、约50至约500个碱基、约50至约300个碱基、约50至约200个碱基或约50至约100个碱基。

前大体积结构

在一些实施方案中，单链测试多核苷酸在第一末端上包含在第一条件下可形成第一大体积结构(BS1)的第一前大体积结构(PB1)，并且在二末端上包含在第二条件下可形成第二大体积结构(BS2)的第二前大体积结构(PB2)。在一些实施方案中，PB1包含在第一条件下可形成BS1的单链多核苷酸区段。第一条件可以是第一温度T1，其可以是约室温至70℃、约40℃或更高、约30℃或更高、约25℃或更高、约20℃或更高或约15℃或更高。在一些实施方案中，第一条件可以是Ti以及存在可与PB1结合以形成BS1的第一配体。第一配体的实例包括但不限于PB1的反义寡核苷酸、其他有助于形成BS1的化合物(例如，可与配体形成结合对的化合物，其中该配体连接于PB1上)。这样的结合对的实例包括但不限于通过共价和/或非共价相互作用的抗体-抗原、生物素-链霉亲和素系统及其组合。其中BS1为多核苷酸2-D或3-D结构(例如双链体、发夹结构、多发夹结构和多臂结构)，BS1的解链温度(Tml)为15℃或以上、约20℃或以上、约25℃或以上、约30℃或以上、约35℃或以上、约40℃或以上或约50℃或以上。

PB2在第二条件下形成BS2。在一些实施方案中，PB2是在第二条件下可形成BS2(例如，多核苷酸双链体、发夹结构、多发夹结构和多臂结构)的单链多核苷酸区段。第二条件可以是第二温度T2，其为约-5至约50℃、约40℃或更高、约30℃或更高、约25℃或更高、约20℃或更高、约15℃或更高、约10℃或更高或约5℃或更高。在一些实施方案中，T2比T1低至少约5℃，优选低至少约10℃或低至少约20℃。在一些实施方案中，第二条件可以是T2以及存在可与PB2结合形成BS2的第二配体。第二配体的实例包括但不限于PB2的反义寡核苷酸、其他有助于形成BS2的化合物(例如，可与配体形成结合对的化合物，其中该配体连接于PB2上)。这样的结合对的实例包括但不限于通过共价和/或非共价相互作用的抗体-抗原、生物素-链霉亲和素系统及其组合。其中BS2为多核苷酸2-D或3-D结构(例如双链体、发夹结构、多发夹结构和多臂结构)，BS2的解链温度(Tm2)为约5至约10℃、约10至约20℃、约20至约30℃或约20至约50℃。

在一些实施方案中，PB1和/或PB2包含不与减速物池中的减速物结合的结构。这样的结构的实例包括但不限于包含诸如isodG、isodC和无碱基位点等非结合性碱基的核苷酸类似物。

标识符

在一些实施方案中，单链测试多核苷酸进一步包含诸如标识符和分离标签的功能部分。在一些实施方案中，当单链测试多核苷酸与随机减速物池接触时，构建标识符和分离标签，以使得它们不会被随机减速物池结合。例如，标识符区段可具有优选彼此结合的isodG和isodC碱基。如果随机减速物池的减速物不具有isodG或isodC碱基，则来自随机减速物池的减速物将更优选地与单链测试多核苷酸中位于标识符区段以外的部分结合。因此，会采集到较少的关于标识符的序列信息的电信号，这使得更加容易对所采集的电信号进行表征。

标识符的实例包括但不限于方向标识符、参照信号标识符、样品来源标识符和样品标识符。

单链测试多核苷酸可在一个末端上仅具有一个大体积结构(例如，图15)，或者在两个末端上具有两个大体积结构(例如，图17)。一个方向标识符可被定位于紧靠单链测试多核苷酸中的每个大体积结构(例如，相距0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、……或50个碱基)。用于不同大体积结构的方向标识符可以相同或不同。

当单链测试多核苷酸具有两个大体积结构和两个方向标识符时，其他标识符可被定位在两个方向标识符之间。当单链测试多核苷酸具有仅位于一个末端上的一个大体积结构以及一个方向标识符时，其他标识符可被定位在与该方向标识符相比更加远离大体积结构的位置。

其他标识符包括但不限于作为参照或校准读数来基线化在同一纳米孔中获得的其他电信号的参照信号标识符；用于鉴定样品多核苷酸的来源的样品来源标识符；和用于鉴定个体样品多核苷酸的样品标识符。

由于标识符的结构是已知的，因此可通过使标识符特异性减速物与单链测试多核苷酸接触来检测和/或鉴定标识符。如果单链测试多核苷酸包含感兴趣的标识符，则将形成标识符特异性减速物双链体部分，这将使单链测试多核苷酸在纳米孔中停顿。可在单链测试多核苷酸在纳米孔中停顿的同时获得一组电信号，这可用于指示减速物-标识符双链体部分的形成(标识符，图18)和/或鉴定在单链测试多核苷酸分子的流动方向上位于标识符-减速物双链体之前的序列以及标识符-减速物双链体的第一个碱基对(阴影部分，图18)。图18示出了单链测试多核苷酸中仅具有一个大体积结构的情况。当单链测试多核苷酸在两个末端上均具有大体积结构时，可采用相同的方法。

在一些实施方案中，标识符和/或标识符特异性减速物和/或在单链测试多核苷酸分子的流动方向上位于标识符之前的序列可包含能提供易于鉴定的独特电信号的一个或多个核苷酸或结构。这样的核苷酸和结构的实例包括但不限于包含isodG或isodC的核苷酸、无碱基核苷酸、甲基化核苷酸等。

分离标签

分离标签是可与配体形成结合对的结构，其中该配体被进一步修饰以有助于其浓缩或分离。这样的结合对的实例包括但不限于抗体-抗原和生物素-链霉亲和素系统。有助于浓缩或分离的进一步修饰的实例包括但不限于配体向可能容易浓缩和/或分离的磁珠上的附着。

在一些实施方案中，超过一个的功能部分可彼此重叠或发挥超过一种功能。

包含多个功能部分(区段A、B、C、D、F、G、H和I，图19)和样品多核苷酸的单链测试多核苷酸的一个实例在图19中示出。

区段I可作为前大体积结构，并与其互补链形成大体积结构，或者通过自折叠成一个结构(例如，多核苷酸发夹结构、多发夹结构和多臂结构)而形成大体积结构，而区段H或其片段可作为方向标识符。或者，区段I在特定条件下可与区段H形成发夹。因此，在这种情况下，前大体积结构为区段I和H。区段G或其片段可作为方向标识符。

区段F、G和H或其片段可以是参照信号标识符、样品标识符、样品来源标识符。或者，区段F、G和H合在一起可以是标识符，或者其任何片段也可作为本文所述的标识符。类似的情况适用于3’端的区段A、B、C和D。分离标签可以置于3’端或5'端，并且它可与3'末端或5'末端核苷酸相连接，或与区段A、B、C、D、F、G、H和I上的任意核苷酸相连接，只要它不干扰减速物与单链测试多核苷酸的结合、纳米孔的功能或大体积结构的形成。

包含样品多核苷酸和一个或多个功能部分的单链测试多核苷酸的构建

通过采用常规的有机和/或生物学方法根据需要将样品多核苷酸与其他区段相连接，来构建包含样品多核苷酸和一个或多个功能部分的测试多核苷酸。

可通过采用常规连接方法(例如，形成共价键(例如，连接酶辅助的连接或其他共价键，其中该连接可通过配对末端测序化学、平端多核苷酸连接和/或粘端连接来完成)或者非共价相互作用)将多个功能部分与样品多核苷酸相连接，从而形成图19中所示的单链测试多核苷酸。

在一些实施方案中，所获得的样品多核苷酸为双链(ds)样品多核苷酸。采用常规连接方法(例如，平端、悬端和/或接头连接之后的连接酶辅助的连接；配对和末端配对方案)，可将双链样品多核苷酸与一个或多个双链功能部分(例如，ds PB1(区段I和H-区段A'和B'，图20)、ds PB2(区段B和A-区段H'和I，图20)、双链标识符(例如，区段G和F-区段C'和D'，以及区段D和C-区段F'和G'，图20)等)连接(图20)。功能部分与样品多核苷酸可全部在一个步骤中连接或依序连接，或者样品多核苷酸的一个末端上的所有功能部分首先被构建在一起，然后连接到样品多核苷酸的末端上。常规连接方法的实例包括但不限于平端、悬端和/或接头连接之后的连接酶辅助的连接；配对末端测序方案；配对和末端配对方案。然后采用常规方法使所获得的双链多核苷酸变性(例如，加热使双链多核苷酸变性)，以提供单链测试多核苷酸。

在一些实施方案中，所获得的样品多核苷酸为双链样品多核苷酸，并且经由除磷酸二酯键以外的共价键与一个或多个双链功能部分(例如，ds PB1、ds PB2、双链标识符等)相连接。这样的连接的实例包括但不限于在乙二醇核苷酸、吗啉代和锁定核苷酸中的连接。

在一些实施方案中，所获得的样品多核苷酸为单链样品多核苷酸(DNA或RNA)，并且其互补链(DNA或RNA)可采用常规方法创建成能与单链样品多核苷酸退火以形成双链样品多核苷酸(ds DNA、ds RNA或DNA-RNA杂合体)，然后连接至如本文所述的一个或多个双链功能部分。

在一些实施方案中，采用连接酶辅助的连接，将单链样品多核苷酸与一个多个单链功能部分(例如，ss PB1、ss PB2、单链标识符等)相连接。在一些实施方案中，单链样品多核苷酸经由除磷酸二酯键以外的共价键与一个多个单链功能部分相连接。这样的连接的实例包括但不限于在乙二醇核苷酸、吗啉代和锁定核苷酸中的连接。

在一些实施方案中，所获得的样品多核苷酸为双链样品多核苷酸，并且可变性以提供将与如本文所述的一个多个单链功能部分相连接的单链样品多核苷酸。

在一些实施方案中，功能部分通过可切割的键相连接，以使得一个或多个单独的功能部分可从单链测试多核苷酸上切除。在一个实施方案中，可通过切割位于样品多核苷酸与大体积结构之间的功能部分，将大体积结构从单链测试多核苷酸上移除。然后，通过施加电势以使单链测试多核苷酸沿着其不再因切割的大体积结构而停顿、减慢或停止的方向移动通过纳米孔，可将单链测试多核苷酸从其所在的纳米孔中释放。

在一些实施方案中，所期望的功能部分在样品多核苷酸的所期望的末端(3'或5')相连接，以使得其获得的测试多核苷酸可按希望的方向穿入纳米孔(例如，从3’端或从5'端)。

使用随机减速物池对样品多核苷酸的鉴定

本发明的一个方面涉及一种鉴定样品多核苷酸序列的方法，其包括：

(A1)提供双链(ds)样品多核苷酸；

(A2)将第一前大体积(PB1)结构连接至双链样品多核苷酸的第一末端，并将第二前大体积(PB2)结构连接至双链样品多核苷酸的第二末端，

(A3)使A2的双链样品多核苷酸变性为单链测试多核苷酸，

(B1)在第一温度下，由单链测试多核苷酸的第一末端上的PB1形成第一大体积结构(BS1)，

(B2)施加第一电势，以使单链测试多核苷酸流动通过纳米孔，

(B3)在第二温度下，由单链测试多核苷酸的第二末端上的PB2形成第二大体积结构(BS2)，

(B4)任选地施加另一电势，以逆转单链测试多核苷酸的流动，直至BS2使单链测试多核苷酸在纳米孔的缩窄区域之前停顿、减慢或停止，

(B5)在工作温度下，使随机减速物池与单链测试多核苷酸接触，以形成具有至少一个减速物-单链测试多核苷酸双链体区段的减速物-单链测试多核苷酸复合物，

(B6)施加第三电势，以使减速物-单链测试多核苷酸复合物流动通过纳米孔，直至第一减速物-单链测试多核苷酸双链体区段在纳米孔的缩窄区域之前停顿、减慢或停止，

(B7)当第一减速物-单链测试多核苷酸双链体区段在纳米孔内部停顿一段停留时间时获得第一组电信号，并且对在单链多核苷酸的流动方向上位于第一减速物-单链测试多核苷酸双链体区段之前的核苷酸序列以及第一减速物-单链测试多核苷酸双链体区段的第一个碱基对进行表征，

(B8)使第一减速物-单链测试多核苷酸双链体区段解离，并继续使单链多核苷酸流动通过纳米孔，和

(B9)重复步骤(B4)至(B8)，直至BS1或BS2使单链测试多核苷酸停顿、减慢或停止。

在一个实施方案中，单链多核苷酸是包含如本文所述的样品多核苷酸的单链测试多核苷酸。减速物包含一种或多种如本文所定义的核苷酸。

在一些实施方案中，单链样品多核苷酸包含DNA寡核苷酸、RNA寡核苷酸或其组合。在一些实施方案中，双链样品多核苷酸可以是ds DNA、ds RNA或DNA-RNA杂合体。

随机减速物池包含可与单链测试多核苷酸的所有部分或其片段(例如，样品多核苷酸)结合的给定长度的减速物的集合。这样的给定长度可以是2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个，优选10个或更少、8个或更少、6个或更少以及4个或更少。在一个实施方案中，随机减速物池包含由选自通用核苷酸、锁定核苷酸、基本核苷酸、其修饰及其组合的一种或多种核苷酸构成的减速物。通用核苷酸和基本核苷酸的修饰包括在核碱基结构、骨架结构(例如，乙二醇核苷酸、吗啉代和锁定核苷酸)及其组合处的修饰。在一个实施方案中，随机减速物池包含具有能与所有基本核碱基(A、T、C、G和U)进行碱基配对的通用核碱基的寡核苷酸。在另一个实施方案中，随机减速物池包含具有基本核碱基的所有可能的组合的寡核苷酸。在另一个实施方案中，随机减速物池包含具有基本核碱基和通用核碱基的所有可能的组合的寡核苷酸。在另一个实施方案中，随机减速物池包含在指定位置具有通用核苷酸并且在其他位置具有基本核碱基的所有组合的寡核苷酸。在另一个实施方案中，随机减速物池中减速物的骨架结构在指定位置、随机位置或其组合处被修饰(例如，乙二醇核苷酸、吗啉代和锁定核苷酸)。在另一个实施方案中，随机减速物池中的减速物包含DNA寡核苷酸、RNA寡核苷酸或其组合。

减速物可在指定位置处包含通用核碱基，并在其他位置处包含随机基本核碱基，以降低基本核碱基的可能的组合的总数。例如，对于具有10个碱基的寡核苷酸的随机减速物池，基本核碱基的组合的总量为4¹⁰＝1,048,576。然而，如果该10个碱基的核苷酸的4个位置被指定为仅具有通用核碱基，则基本核碱基的组合的总量为4⁶＝4,096，这明显较低。

在一些实施方案中，由于减速物-测试多核苷酸双链体区段的第一个碱基对可部分或完全地处于纳米孔中，并影响所获得的电信号，因此优选地将减速物构建为在5’和/或3’端具有通用核苷酸，以标准化减速物-测试多核苷酸双链体区段的第一个碱基对的贡献，并使信号更容易分析。

在一些实施方案中，可根据需要进一步调节随机减速物池的一种或多种减速物的浓度。例如，对每种类型的减速物而言，浓度可能是大致相同的；并且对其进行调节，以使得存在充足的单链减速物来与单链测试多核苷酸接触。在一个实施方案中，由于polyG链与多聚C链强力结合，因此polyG和polyC减速物将要比具有其他序列的减速物具有更高的浓度，以提供充足的单链polyG和单链polyC来与单链测试多核苷酸接触。在另一个实施方案中，调节减速物和/或用于制备减速物的核苷酸的浓度，以使得每种减速物具有大致相同的亲和力以形成减速物-测试多核苷酸复合物，并且没有特定的减速物比其他减速物显著地更受青睐。在一些实施方案中，调节减速物和/或用于制备减速物的核苷酸的浓度，以使得一种或多种特定减速物比其他减速物显著地更受青睐。例如，可将减速物池构建成基本上不含可与单链测试多核苷酸中的已知区段结合的减速物。因此，更多所获得的序列信息大约将是未知区段，而不是单链测试多核苷酸中的已知区段。

在一些实施方案中，步骤(B5)形成具有至少一个减速物-测试多核苷酸双链体区段的减速物-测试多核苷酸复合物，其中减速物与多达1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个碱基对的单链测试多核苷酸区段形成双链体，并在第一工作条件下穿过纳米孔。工作条件包括诸如工作温度(Tw)、暴露时间、减速物和单链测试多核苷酸的浓度、pH、盐浓度和可影响减速物-测试多核苷酸复合物形成的其他添加剂及其浓度等参数。Tw可以是约-10至约25℃、约-10至约20℃、约-10至约15℃、约-10至约10℃、约-10至约5℃、约-10至约0℃、约-10至约-5℃、约-5至约25℃、约-5至约20℃、约-5至约15℃、约-5至约10℃、约-5至约5℃或约-5至约0℃，以允许相对较短的减速物(2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个碱基)与单链测试多核苷酸的缔合。在一个实施方案中，Tw比T2低至少约10℃，优选低至少约20℃。在另一个实施方案中，在Tw下，至少约50％的PB1和PB2分别为BS1和BS2的形式。在另一个实施方案中，在Tw下，至少约70％的PB1和PB2分别为BS1和BS2的形式。在另一个实施方案中，在Tw下，至少约90％的PB1和PB2分别为BS1和BS2的形式。

单链测试多核苷酸暴露于减速物的暴露时间为约1ns或更长、约10ns或更长、约1μs或更长、约10μs或更长、约1ms或更长、约10ms或更长、约1s或更长或约5s或更长，以允许形成充足的减速物-测试多核苷酸复合物。减速物的浓度优选为单链测试多核苷酸浓度的约100,000倍、10,000倍、1,000倍、300倍、约200倍、约100倍、约50倍或约20倍，或者减速物的浓度与单链测试多核苷酸的大致相同。减速物的浓度优选为约1nM至约100mM、约1nM至约10mM、约1nM至约1mM、约10nM至约100mM、约10nM至约10mM、约10nM至约1mM、约1mM至约10mM或约10mM至100mM。单链测试多核苷酸的浓度为约1nM至约100mM、约1nM至约10mM、约1nM至约1mM、约10nM至约100mM、约10nM至约10mM或约10nM至约1mM。pH优选为约6至约8或约7。盐(例如，KC1、NaC1、磷酸盐)浓度为约1mM至约10M、约1mM至约1M、约10mM至约10M、约10mM至约1M、约100mM至约10M或约100mM至约1M。其他可能影响减速物-测试多核苷酸复合物的形成的添加剂包括但不限于硫酸葡聚糖和甘油。可调节它们的浓度以优化减速物-测试多核苷酸复合物的形成。

工作条件进一步包括约0mV至约320mV的所需极性的电势。可通过基于减速物结合的特征(例如，长度、核苷酸组分和结合亲和力)、纳米孔特征和单链测试多核苷酸性质(例如，其GC含量或二级结构)的过程连续调节工作条件以优化信号质量。因此，电势可连续变化，例如，从-320mV到+320mV。

可在如本文所述的第一工作条件下进行步骤(B4)至(B9)。在一些实施方案中，对步骤(B4)至(B9)的每个步骤所施加的电势可以相同或不同，或者连续变化。在一些实施方案中，可调节用于步骤(B8)的电势以促进减速物-测试多核苷酸双链体区段的解离。在一些实施方案中，可施加用于步骤(B8)的电势，以使单链测试多核苷酸与步骤(B6)中单链测试多核苷酸的流动方向(正向)相比以相反的方向移动，在施加另一电势使多核苷酸正向移动之前，使减速物-测试多核苷酸双链体区段自纳米孔的缩窄区域移动，从而使减速物-测试多核苷酸双链体区段解离。

提供使多核苷酸双链体区段在纳米孔内部停顿的停留时间，以使纳米孔检测器可采集并读取相关序列信息。停留时间通常取决于纳米孔检测器和工作条件。在一些实施方案中，停留时间为至少约10μs、至少约1ms、至少约10ms、至少约200ms、至少约500ms、至少约1s、至少约2s或约至少5s。通常，停留时间越长，信号质量越好，并且可获得越多的序列信息。

当多核苷酸双链体区段在纳米孔内部停顿一段停留时间时，停止点之前多达100个碱基(优选多达50个碱基)以内的任何位置的少量碱基(少于20个碱基)的序列可被一次读取。优选地，一次读取少于5或6个碱基。例如，在任意核苷酸位置1-50处(例如，在距减速物-单链测试多核苷酸双链体区段的位置1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20...50处)可达50个碱基的较大多核苷酸序列内，一次读取1、2、3、4或5个碱基。

如图12中所示，包含在两个末端上形成的大体积结构的单链测试多核苷酸被锁在纳米孔中(步骤(B1)至(B4))，并与多个减速物形成减速物-测试多核苷酸复合物(步骤(B5))。

每次减速物-测试多核苷酸双链体区段使单链测试多核苷酸在纳米孔中停顿一段停留时间时，便可获得一组单链测试多核苷酸的电信号，随后减速物-测试多核苷酸双链体区段解离，并且单链测试多核苷酸向前移动，直到下一减速物-测试多核苷酸双链体区段使其停顿(在图12中，图示说明了单链测试多核苷酸从顺侧向反侧移动)。重复此停顿-检测-解离-停顿的过程，直至一个末端的大体积结构使单链测试多核苷酸停顿、减慢或停止。所获得的电信号的一个实例在图16中示出。

在一些实施方案中，随机减速物池主要存在于纳米孔的一侧(例如，如图13中所示的顺侧)，并且该方法进一步包括：

(B10)施加另一电势，以使单链测试多核苷酸以与步骤(B5)中的单链测试多核苷酸流动相反的方向移动，直至其他大体积结构使单链测试多核苷酸在纳米孔的缩窄区域之前停顿、减慢或停止，

(B11)重复步骤(B4)至(B10)至少1次、至少5次、至少10次、至少15次、至少20次、至少25次、至少30次、至少50次或至少100次，和

(B12)通过使所采集的核苷酸序列信息重叠来构建单链测试多核苷酸序列。

步骤(B10)可在本文所述的工作条件下进行。所施加的电势与步骤(B4)至(B9)中施加的电势相比可具有降低的值或相反的极性，以逆转测试多核苷酸的流动。每个步骤中所施加的电势可以相同或不同，或者连续变化。

在一些实施方案中，随机减速物池存在于纳米孔的两侧，并且减速物与单链测试多核苷酸在暴露于纳米孔的两侧(如图21中所示的顺侧和反侧)的减速物池的区段处结合。鉴定本文所述的单链测试多核苷酸中样品多核苷酸的核苷酸序列的方法，包括：

(1)在第二工作条件下重复步骤(B4)至(B8)，直至其他大体积结构使单链测试多核苷酸在纳米孔的缩窄区域之前停顿、减慢或停止；

(2)重复步骤(B9)和(1)至少1次、至少5次、至少10次、至少15次、至少20次、至少25次、至少30次、至少50次或至少100次；和

(3)通过使所采集的核苷酸序列信息重叠来构建样品多核苷酸的核酸序列。

第二工作条件可以是如本文所述的工作条件。与第一工作条件相比，第二工作条件可具有相同或不同的参数。与步骤(B9)中施加的电势相比，步骤(1)中施加的电势可具有降低的值或相反的极性。每个步骤中施加的电势可以与之前步骤中施加的相同，或者与之前的步骤相比不同，或者连续变化。

由于随机减速物池包含可与单链测试多核苷酸的随机部分结合的减速物，因此每当单链测试多核苷酸根据本文所述的过程从BS1/BS2使其停顿、减慢或停止的一端向另一端行进时，减速物可与单链测试多核苷酸双链体区段的不同组合结合(图13)，并可提供单链测试多核苷酸中的不同区段的序列信息(图14)。因此，当重复步骤(B8)和/或步骤(B9)以获得单链测试多核苷酸中样品多核苷酸的每一个和全部核苷酸的序列信息时，可通过使所采集的核苷酸序列信息重叠来构建样品多核苷酸。

在一些实施方案中，超过一个减速物通过非结合接头(例如无碱基寡核苷酸)相连接，以形成减速物列(图22)，这样每个减速物-测试多核苷酸双链体区段的解离不会导致整个减速物列从单链测试多核苷酸上解离。在一些实施方案中，非结合接头被设计成由约1个碱基、约2个碱基、约3个碱基、约4个碱基或约5个碱基间隔开。因此，图14中所示的已知区段之间的缺口将很可能与接头的长度相同(例如，约1个碱基、约2个碱基、约3个碱基、约4个碱基或约5个碱基)。在这种情况下，将更易于构建样品多核苷酸的核酸序列。

在一些实施方案中，步骤(B2)进一步包括：

(B2a)当第一大体积结构在纳米孔内部停顿时获得一组电信号，并且对在单链测试多核苷酸的流动方向上位于第一大体积结构之前的核苷酸序列以及第一大体积结构的第一个碱基对进行表征，并且

步骤(B3)进一步包括：

(B3a)当第二大体积结构在纳米孔内部停顿时获得另一组电信号，并且对在单链测试多核苷酸的流动方向上位于第二大体积结构之前的核苷酸序列以及第二大体积结构的第一个碱基对进行表征。

在一个实施方案中，如本文所述的方法根据图23中所示的流程图进行。包含PB1、PB2、DI1、DI2和样品多核苷酸的单链测试多核苷酸已被构建并置于纳米孔阵列(方框10，图23)上。然后在T1下，在单链测试多核苷酸的一个末端上由PB1形成BS1(方框20，图23)。施加第一电势以使单链测试多核苷酸穿过纳米孔，直到BS1使单链测试多核苷酸停顿、减慢或停止，其中表征DI1的一组电信号被采集(方框30，图23)。随后将温度降低至T2以由PB2形成BS2(方框40，图23)。施加比第一电势低或与第一电势极性相反的第二电势，直到BS2使单链测试多核苷酸停顿、减慢或停止，其中表征DI2的一组电信号被采集(方框50，图23)。将温度进一步降低至Tw(方框60，图23)，然后在如本文所述的第一工作条件下使随机减速物池与单链测试多核苷酸接触，以形成随机结合的减速物-测试多核苷酸复合物(方框70，图23)。施加第三电势，使减速物-测试多核苷酸复合物移动通过纳米孔，直到第一减速物-测试多核苷酸双链体区段使单链测试多核苷酸停顿。使单链测试多核苷酸停顿一段停留时间，期间获得一组电信号，该电信号将用于表征在单链测试多核苷酸的流动方向上位于第一减速物-测试多核苷酸双链体区段之前的序列以及减速物-测试多核苷酸双链体区段的第一个碱基对。然后，第一减速物-测试多核苷酸双链体区段解离，并且单链测试多核苷酸继续通过纳米孔，直至下一个减速物-测试多核苷酸双链体区段或BS1使其停顿、减慢或停止。当BS1使单链测试多核苷酸在纳米孔中停顿、减慢或停止时，采集指定给DI1的一组电信号(方框80，图23)。然后，施加相比第三电势具有降低的值或相反的极性的第四电势，直到BS2使单链测试多核苷酸停顿、减慢或停止，其中表征DI2的一组电信号被采集(方框90，图23)。然后，重复方框70至90中的步骤，直至采集到充足的序列信息来表征样品多核苷酸的序列。

标识符的检测以及测试多核苷酸分子中标识符的鉴定

本发明的另一方面涉及一种获得如本文所述的单链测试多核苷酸分子的序列信息的方法。该方法包括：

(B1)在测试多核苷酸分子的第一末端上形成第一大体积结构，

(C1)使多个减速物(减速物池)与测试多核苷酸分子接触以形成具有至少一个减速物-测试多核苷酸分子区段的减速物-测试多核苷酸分子复合物，

(C2)施加电势，以使减速物-测试多核苷酸分子复合物流动通过纳米孔，直至第一减速物-测试多核苷酸分子区段在纳米孔的缩窄区域之前停顿，

(C3)在测试多核苷酸分子的流动方向上，当第一减速物-测试多核苷酸分子区段在纳米孔内部停顿一段停留时间时获得第一组电信号，

(C4)使第一减速物-测试多核苷酸分子区段解离，并且继续使该分子流动通过纳米孔，和

(C5)重复步骤(C1)至(C4)，直至BS1使测试多核苷酸分子停顿、减慢或停止。

在一个实施方案中，测试多核苷酸分子为包含如本文所述的一种或多种核苷酸的单链测试多核苷酸，而减速物包含如本文所述的一种或多种核苷酸。单链测试多核苷酸包含如本文所述的PB1。

在一些实施方案中，步骤(Cl)形成具有至少一个减速物-测试多核苷酸双链体区段的减速物-测试多核苷酸复合物，其中减速物与多达1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个碱基对的测试多核苷酸双链体区段形成双链体。

步骤(C1)至(C5)可在如本文所述的工作条件下进行。

纳米孔检测器采集相关序列信息的停留时间与本文所述的相同。

本文所述的方法可用于检测存在于单链测试多核苷酸中的标识符。标识符可作为例如方向标识符(例如，证实BS1的形成以及表明单链测试多核苷酸已到达具有BS1的末端)、参照信号标识符(用于基线化在同一纳米孔中获得的其他电信号的参照或校准读数)、样品来源标识符(鉴定测试多核苷酸的来源)或测试多核苷酸的样品标识符(鉴定测试多核苷酸)。在一些实施方案中，减速物池包含可与第一标识符(图15中的标识符1)结合的第一减速物(图15)，并且基本上不含可与单链测试多核苷酸结合的其他减速物(优选少于10％，更优选少于5％，最优选少于1％)。当包含标识符1的单链测试多核苷酸与第一减速物接触时，第一减速物-标识符1双链体区段形成，以形成第一减速物-测试多核苷酸复合物。在合适的电场的存在下，第一减速物-测试多核苷酸复合物通过纳米孔，直至第一减速物-标识符1双链体区段使其停顿。纳米孔检测器获得第一组电信号。然后第一减速物-测试多核苷酸复合物解离，并且单链测试多核苷酸通过纳米孔，直至第一末端处的BS1使其停顿、减慢或停止(即在步骤(C4)中，单链测试多核苷酸顺畅地流动通过纳米孔，直至BS1使其停顿、减慢或停止，而不会再在该纳米孔中停顿)。当BS1结构使单链测试多核苷酸停顿、减慢或停止时，纳米孔检测器将获得另一组电信号。因此，与不含标识符1序列的单链测试多核苷酸相比，包含标识符1序列的单链测试多核苷酸提供两组电信号，表明其在纳米孔中停顿两次，而不含标识符1序列的单链测试多核苷酸提供一组电信号，表明其在纳米孔中(由于BS1)停顿一次。

在另一个实施方案中，可构建单链测试多核苷酸和/或减速物，以使得步骤(C3)中所获得的第一组电信号不同于当用纳米孔检测一级核苷酸序列时获得的一组电信号。例如，已知的标识符序列可包含一种或多种具有isodG和/或isodC的核苷酸类似物。此标识符序列的前面是已知的读取序列，如果减速物与标识符序列杂交并且在孔中停顿、减慢或停止，那么该读取序列将会处于孔的缩窄区中。读取序列可包含isodC、isodG和/或不与天然核苷酸结合的无碱基位置。此外，标识符序列和该标识符的特异性反义减速物序列均将含有合适的isodG和isodC，这样将只有该标识符的特异性减速物与该位置杂交。天然核苷酸减速物不会干扰或结合含有isodG、isodC的标识符序列，并且天然核苷酸减速物不会干扰读取序列。所导致的在孔中对链的鉴定将不依赖于其他天然或人造核苷酸减速物的存在而发生。在这种情况下，减速物池不必基本上不含可与单链测试多核苷酸形成复合物的其他减速物。当另一减速物与单链测试多核苷酸中除标识符1区段以外的区段结合时，在第一减速物-测试多核苷酸双链体区段在纳米孔中停顿时获得的第一组电信号不同于在其他减速物-测试多核苷酸双链体区段在纳米孔中停顿时获得的另一组电信号。因此，可与单链测试多核苷酸形成复合物的其他减速物的存在不会干扰对由第一减速物与单链测试多核苷酸的标识符1结合所产生的独特信号的检测。可进一步构建单链测试多核苷酸和/或减速物，以使得没有其他减速物与如本文所述的标识符1区段结合。因此，不含isodG或isodC碱基的其他减速物将不会与标识符1区段结合。

在另一个实施方案中，单链测试多核苷酸包含超过一种标识符，并且设计分别与标识符区段(标识符N)结合的单链测试多核苷酸和/或减速物(SBN，N＝1、2……)，以使得当每个SBN-标识符N双链体区段在纳米孔中停顿时，获自纳米孔的那组电信号不同于一级核苷酸序列，并且不同于在其他SBN-标识符N双链体区段在纳米孔中停顿时获得的电信号。减速物池包含对待检测的标识符具有特异性的减速物，并且任选地包括用于其他标识符的减速物和/或其他可与单链测试多核苷酸结合的减速物。

在另一个实施方案中，可与标识符特异性减速物结合的标识符以及在单链测试多核苷酸的流动方向上位于标识符之前的序列均为已知的。因此，在步骤C3中获得的那组电信号还可用于鉴定在单链测试多核苷酸的流动方向上位于标识符之前的序列，该序列转而用于鉴定标识符。

在另一个实施方案中，该方法进一步包括施加第一电势以使单链测试多核苷酸流动通过纳米孔，以及在如本文所述的第二条件下在单链测试多核苷酸的第二末端上形成第二大体积结构(BS2)。在一个实施方案中，第一条件的温度(T1)高于第二条件的温度(T2)，而第二条件的温度(T2)高于工作温度Tw。在一个实施方案中，第一条件的温度(T1)比第二条件的温度(T2)高至少10℃或高至少20℃，而第二条件的温度(T2)比工作温度Tw高至少约1℃、高至少约5℃、高至少约10℃、高至少约15℃、高至少约20℃或高至少约25℃。

在单链测试多核苷酸的流动方向上延伸已知减速物的序列允许鉴定样品多核苷酸中的更长的序列。此方法可包括以下步骤：

(E1)使第一已知减速物与测试多核苷酸分子接触，以形成具有第一已知减速物-测试多核苷酸分子区段的第一已知减速物-测试多核苷酸分子复合物，

(E2)施加电势，以使第一已知减速物-测试多核苷酸分子复合物流动通过纳米孔，直至第一已知减速物-测试多核苷酸分子区段在纳米孔的缩窄区域之前停顿，

(E3)在测试多核苷酸分子的流动方向上，当第一已知减速物-测试多核苷酸分子区段在纳米孔内部停顿一段停留时间时获得第一组电信号，

(E4)使第一已知减速物-测试多核苷酸分子区段解离，并且继续使该分子流动通过纳米孔，

(E5)从纳米孔检测器系统中移除第一已知减速物，并逆转测试多核苷酸的流动，直至末端的大体积结构使其停顿、减慢或停止，和

(E6)用另一已知减速物来重复步骤(E1)至(E5)，该另一已知减速物具有第一已知减速物的序列，并且在步骤(E3)的测试多核苷酸分子的流动方向上长出已知数目的碱基，其中：

E-a)已知数目为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16，

E-b)已知数目的碱基可以是通用碱基或与样品多核苷酸的相应位置处的碱基互补的碱基，并且

E-c)可以调整步骤(E4)的条件，例如提高工作温度和/或增加步骤(E4)中施加的电势值，以使减速物-测试多核苷酸分子区段成

功解离。

这样的认识可有助于采用本文所述的方法(例如，使用随机减速物池)对样品多核苷酸的其余未知序列进行鉴定/测序。此外，相同的过程可用于从另一端鉴定样品多核苷酸的序列。因此，可鉴定多达30个碱基的未知样品多核苷酸，这将在样品多核苷酸整个序列的进一步鉴定/测序中提供很好的参考。

样品多核苷酸的分离

本发明的另一方面涉及分离样品多核苷酸的方法，其包括：

使用如本文所述的步骤(A1)至(A3)制备单链测试多核苷酸

(D1)转变两个大体积结构中的一个，以使单链测试多核苷酸的相应末端能够穿过纳米孔而不停顿、减慢或停止，以及

(D2)施加电势以释放单链靶多核苷酸。

在一些实施方案中，所述单链测试多核苷酸还包含如本文所述的分离标签，并且该方法在步骤(D2)之后进一步包括步骤(D3)：

(D3)将分离标签附接至配体上。

在配体进一步附接至磁珠上的一些实施方案中，步骤(D3)进一步包括：

(D3-1)移除包含所释放的单链测试多核苷酸的导电盐溶液，

(D3-2)通过混合所释放的单链测试多核苷酸与附接至磁珠上的配体将分离标签附接至配体上，以及

(D3-3)采用常规的分离方法分离所释放的单链测试多核苷酸。

在一些实施方案中，所述方法在步骤(D3)之后还包括步骤(D4)：

(D4)使用常规方法(例如，使用碱性溶液)从所述珠上移除所分离的单链测试多核苷酸，以及

(D5)从所述单链测试多核苷酸上切除PB1和PB2以生成单链样品多核苷酸。

在一些实施方案中，步骤(D5)进一步包括使用内切核酸酶切除PB1和PB2。在一些实施方案中，步骤(D5)进一步包括在可切割位点切除PB1和PB2。

在一个实施方案中，步骤(D1)进一步包括：

(D1-1)改变纳米孔的温度至约为或高于第二温度且低于第一温度，以将BS2转变为非大体积结构。

使用多个纳米孔检测器对样品多核苷酸的测序、鉴定、浓缩和分离

本发明的另一方面涉及使用多个纳米孔检测器对样品多核苷酸进行测序、鉴定、浓缩和分离的方法。如本文关于单个纳米孔检测器所述的相同的方法可用于多个纳米孔检测器。

在一个实施方案中，多个纳米孔是可单独寻址的，其中可单独控制每个纳米孔的电势。也可控制纳米孔的温度。因此，可通过在选定的纳米孔上执行步骤(D1)至(D3)而单独释放在纳米孔中检测的单链测试多核苷酸分子。

例如，在纳米孔(编号为Ni、N2、...N10)的阵列中，每个纳米孔具有根据本文所述的方法捕获的单链测试多核苷酸，且将单个多核苷酸编号为在相应的纳米孔N1、N2、...N10中的多核苷酸1、多核苷酸2、...多核苷酸10。如果仅希望收集多核苷酸1和多核苷酸3，则可单独控制纳米孔N1、N2、...N10，以便仅收集多核苷酸1和多核苷酸3(例如，通过施加电势来分别从纳米孔N1和N3移动多核苷酸1和多核苷酸3)。在一个实施方案中，将多核苷酸1、多核苷酸2、...多核苷酸10的BS2转变为能够通过纳米孔的结构(例如，分别使PB2处于约为或高于第二温度同时低于第一温度的温度，或将PB2切除以留下能够通过纳米孔的单链结构)。单独控制纳米孔N2、N4至N10的电势，以使多核苷酸2、多核苷酸4至多核苷酸10分别从纳米孔释放，而多核苷酸1和多核苷酸3仍然分别被捕获在纳米孔N1和N3中。然后单独控制纳米孔N1和N3以分别释放将要收集、浓缩和/或分离的多核苷酸1和多核苷酸3。

用标签进行核酸测序的方法和系统

纳米孔可用于间接地、任选地采用电检测对核酸分子进行测序。间接测序可为在生长链中掺入的核苷酸不穿过纳米孔的任何方法。该核酸分子可在距纳米孔任何合适的距离内和/或接近纳米孔处，任选地在使得在纳米孔中检测到核苷酸掺入事件所释放的标签的距离内通过(例如，如图2C和图2D所示)。任选地，在该标签释放之前，将其预加载到纳米孔中(如图2D所示)。用标签对核酸分子进行测序的一个实例在PCT专利公开号WO2012/083249中描述，该申请通过引用整体并入本文。

核苷酸掺入事件的副产物可用纳米孔来检测。“核苷酸掺入事件”是核苷酸向生长中的多核苷酸链内的掺入。副产物可能与给定类型的核苷酸的掺入相关联。核苷酸掺入事件通常由酶如DNA聚合酶催化，并且利用碱基对与模板分子的相互作用在可用的核苷酸中针对每个位置的掺入进行选择。

可使用标记的核苷酸或核苷酸类似物对核酸样品进行测序。在一些实例中，用于对核酸分子进行测序的方法包括：(a)掺入(例如，聚合)标记的核苷酸，其中与单个核苷酸相缔合的标签在掺入时释放，和(b)借助于纳米孔检测所释放的标签。在一些情况下，该方法进一步包括引导附接至单个核苷酸或从单个核苷酸释放的标签通过纳米孔。可通过任何合适的技术，在某些情况下借助于酶(或分子马达)和/或跨孔电压差来引导所释放或附接的标签。或者，可在不使用酶的情况下引导所释放或附接的标签通过纳米孔。例如，可通过如本文所述的跨纳米孔电压差来引导该标签。

本发明的方法、装置和系统可检测单个核苷酸掺入事件，例如在核苷酸掺入到与模板互补的生长链时。酶(例如，DNA聚合酶、RNA聚合酶、连接酶)可将核苷酸掺入到生长中的多核苷酸链。本文提供的酶(例如，聚合酶)可产生聚合物链。

所添加的核苷酸可互补于与生长链杂交的相应的模板核酸链(例如，聚合酶链反应(PCR))。核苷酸可包括偶联到该核苷酸的任何位置(包括但不限于核苷酸的磷酸(例如，γ磷酸)、糖或含氮碱基部分)的标签(或标签种类)。在一些情况下，在核苷酸标签的掺入过程中，在标签与聚合酶相缔合的同时对标签进行检测。在核苷酸掺入和随后的标签切除和/或释放之后，可继续检测该标签直到该标签转位通过纳米孔。在一些情况下，核苷酸掺入事件从穿过纳米孔并被检测的核苷酸上释放标签。该标签可被聚合酶释放或以任何合适的方式切除/释放，该方式包括但不限于被位于聚合酶附近的酶切割。这样，可识别掺入的碱基(即，A、C、G、T或U)，因为从每种类型的核苷酸(即腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶或尿嘧啶)上释放出独特的标签。在一些情形下，核苷酸掺入事件不释放标签。在这样的情况下，借助于纳米孔检测偶联至掺入的核苷酸上的标签。在一些实例中，标签可移动通过或接近纳米孔，并在纳米孔的辅助下得到检测。

本发明的方法和系统能够进行核酸掺入事件的检测，如在给定的时间段内以至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、100、500、1000、5000、10000、50000或100000个核酸碱基(“碱基”)的分辨率进行。在一些实例中，纳米孔装置用于检测单个核酸掺入事件，其中每个事件与单个核酸碱基相关联。在其他实例中，纳米孔装置用于检测与多个碱基相关联的事件。例如，由纳米孔装置感测到的信号可以是来自至少2、3、4或5个碱基的组合信号。

在一些情形下，标签不穿过纳米孔。标签可用纳米孔进行检测并退出纳米孔而不穿过纳米孔(例如，以与该标签进入纳米孔的方向相反的方向退出)。芯片可配置为将标签主动逐出纳米孔。

在一些情形下，标签在核苷酸掺入事件时并不释放。在一些情况下，核苷酸掺入事件向纳米孔“呈现”标签(即，不释放标签)。标签可在不被释放的情况下被纳米孔检测。可将标签通过具有足够长度的接头附接至核苷酸，以向纳米孔呈现该标签以供检测。

可实时地并借助于纳米孔检测核苷酸掺入事件。在一些情形下，附接至或接近纳米孔的酶(例如DNA聚合酶)可促进核酸分子流动通过或邻近于纳米孔。核苷酸掺入事件或多个核苷酸的掺入可释放或呈现一个或多个可被纳米孔检测的标签种类(本文也称为“标签”)。可在标签流动通过或邻近于纳米孔时、在标签驻留于纳米孔中时和/或在向纳米孔呈现标签时进行检测。在一些情况下，附接至或接近纳米孔的酶可有助于在掺入一个或多个核苷酸时检测标签。

本发明的标签可为原子或分子，或原子或分子的集合。标签可提供光学、电化学、磁性或静电(例如，电感、电容性)签名，该签名可借助于纳米孔进行检测。

本文所述的方法可为单分子方法。也就是说，被检测的信号是由单分子(即，单核苷酸掺入)产生的，而不是由多个克隆分子产生的。该方法可不需要DNA扩增。

核苷酸掺入事件可因包含多种核苷酸(例如脱氧核糖核苷酸三磷酸(dNTP，其中N是腺苷(A)、胞苷(C)、胸苷(T)、鸟苷(G)或尿苷(U))的混合物而发生。核苷酸掺入事件并不一定在包含单一类型的核苷酸(例如，dATP)的溶液中发生。核苷酸掺入事件并不一定因多种核苷酸的交替溶液(例如dATP，随后为dCTP，随后为dGTP，随后为dTTP，随后为ATP)而发生。在一些情况下，通过连接酶掺入多个核苷酸(例如，AA、AG、AC、AT、GA、GG、GG、GC、GT、CA的二聚体等…)。

标记的核苷酸

在一些情况下，标记的核苷酸包含能够在核苷酸掺入事件中被切除并能够借助于纳米孔进行检测的标签。该标签可附接至核苷酸的5'-磷酸。在一些情形下，该标签不是荧光团。该标签可根据其电荷、形状、大小或它们的任意组合进行检测。标签的实例包括各种聚合物。每种类型的核苷酸(即A、C、G、T)一般包含独特的标签。

标签可位于核苷酸上的任何合适的位置上。图25提供了标记的核苷酸的实例。在此，R₁一般为OH，且R₂为H(即，对于DNA)或OH(即，对于RNA)，尽管其他的修饰是可接受的。在图25中，X为任何合适的接头。在一些情况下，接头是可切除的。接头的实例包括但不限于O、NH、S或CH₂。用于Z位置的合适的化学基团的实例包括O、S或BH₃。碱基为适于掺入核酸内的任何碱基，包括腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶或其衍生物。在一些情况下通用碱基也是可以接受的。

磷酸的数目(n)为任何合适的整数值(例如，使得核苷酸可掺入核酸分子的磷酸的数目)。在一些情形下，所有类型的标记的核苷酸具有相同数目的磷酸，但这不是必需的。在一些应用中，针对每种类型的核苷酸具有不同的标签，且磷酸的数目并不一定用来区分各种标签。然而，在一些情况下，多于一种类型的核苷酸(例如，A、C、T、G或U)具有相同的标签分子，且将一种核苷酸与另一种核苷酸区分开来的能力至少部分取决于磷酸的数目(各种类型的核苷酸具有不同的n值)。在一些实施方案中，n的值为1、2、3、4、5、6、7、8、9、10或更大。

本文中描述了合适的标签。在一些情形下，标签具有与化合物的其余部分上的电荷符号相反的电荷。当附接标签时，整个化合物上的电荷可以是中性。标签的释放可产生两个分子：带电荷的标签和带电荷的核苷酸。在一些情况下，带电荷的标签穿过纳米孔且被检测。

合适的标记的核苷酸的更多实例示于图26中。标签可附接至糖分子、碱基分子或它们的任意组合。参见图13，Y为标签，X为接头(任选可切除的)。此外，R₁(如果存在的话)通常为OH、-OCH₂N₃或O-2-硝基苄基，且R₂(如果存在的话)通常为H。此外，Z通常为O、S或BH₃，且n为任意整数，包括1、2、3或4。在一些情况下，所述A为O、S、CH2、CHF、CFF或NH。

继续参见图26，每种dNPP类似物上的碱基类型通常不同于其他三种dNPP类似物中的每一个上的碱基类型，并且每种dNPP类似物上的标签类型通常不同于其他三种dNPP类似物中的每一个上的标签类型。合适的碱基包括但不限于腺嘌呤、鸟嘌呤、胞嘧啶、尿嘧啶或胸腺嘧啶或其各自的衍生物。在一些情况下，碱基为7-脱氮鸟嘌呤、7-脱氮腺嘌呤或5-甲基胞嘧啶之一。

在R₁为-O-CH₂N₃的情况下，该方法任选地进一步包括处理掺入的dNPP类似物，以除去-CH₂N₃并导致OH基连接至3’位置，从而允许掺入另外的dNPP类似物。

在R₁为-O-2-硝基苄基的情况下，该方法任选地进一步包括处理掺入的核苷酸类似物，以除去-2-硝基苄基并导致OH基连接至3’位置，从而允许掺入另外的dNPP类似物。

标签的实例

标签可为能够在纳米孔中被检测到的任何化学基团或分子。在一些情况下，标签包括乙二醇、氨基酸、碳水化合物、肽、染料、化学发光(chemilluminiscent)化合物、单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸、六核苷酸、脂肪族酸、芳族酸、醇、硫醇基、氰基、硝基、烷基、烯基、炔基、叠氮基或其组合中的一个或多个。

还可预期，该标签进一步包括适当数目的赖氨酸或精氨酸，以平衡化合物中的磷酸的数目。

在一些情况下，该标签为聚合物。聚乙二醇(PEG)为聚合物的一个实例且具有如下的结构：

可使用任何数目的乙二醇单元(W)。在一些情形下，W为0和100之间的整数。在一些情况下，乙二醇单元的数目对于每种类型的核苷酸是不同的。在一个实施方案中，四种类型的核苷酸包含具有16、20、24或36个乙二醇单元的标签。在一些情况下，该标签进一步包含另外的可识别部分，例如基于香豆素的染料。在一些情况下，聚合物是带电荷的。在一些情形下，聚合物是不带电荷的，并且该标签在高浓度的盐(如3-4M)中进行检测。

如本文所使用的，术语“烷基”包括具有指定数目的碳原子的支链和直链饱和脂肪族烃基，并且可以是未取代的或取代的。如本文所使用的，“烯基”指含有至少1个碳-碳双键的直链或支链的非芳族烃基，并且可存在高至最大可能数目的非芳族碳-碳双键，并且可以是未取代的或取代的。术语“炔基”指含有至少1个碳-碳叁键的直链或支链的烃基，并且可存在高至最大可能数目的非芳族碳-碳叁键，并且可以是未取代的或取代的。术语“取代的”指如本文所述的官能团，如烷基或烃基，其中连接至其中所包含的氢原子的至少一个键被连接至非氢或非碳原子的键所替代，条件是维持正常的化合价并且该取代产生了稳定的化合物。被取代的基团还包括其中连接至碳或氢原子的一个或多个键被连接至杂原子的一个或多个键(包括双键或叁键)所替代的基团。

用于附接标签的方法

可使用任何合适的用于附接标签的方法。在一个实例中，标签可通过以下步骤附接至末端磷酸：(a)在允许产生环状三偏磷酸的条件下使核苷三磷酸与二环己基碳二亚胺/二甲基甲酰胺接触；(b)使产生自步骤a)的产物与亲核物质接触，以形成-OH或NH₂官能化的化合物；和(c)在允许标签间接地键合至末端磷酸的条件下使步骤b)的产物与连接有-COR基团的标签进行反应，从而形成核苷三磷酸类似物。

在一些情况下，所述亲核物质为H₂N-R-OH、H₂N-R-NH₂、R’S-R-OH、R’S-R-NH₂、或

在一些情形下，所述方法包括，在步骤b)中，使产生自步骤a)的产物与具有下列结构的化合物接触：

且随后或同时使产物与NH₄OH接触，以形成具有下列结构的化合物：

然后可在允许标签间接地键合至末端磷酸的条件下使步骤b)的产物与连接有-COR基团的标签进行反应，从而形成具有下列结构的核苷三磷酸类似物：

其中R₁为OH，其中R₂为H或OH，其中所述碱基为腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶、7-脱氮嘌呤或5-甲基嘧啶。

标签的释放

可以以任何方式释放标签。在一些情况下，将标签附接至多磷酸(例如，图25)，并且核苷酸向核酸分子中的掺入导致附接有标签的多磷酸的释放。掺入可由任选地附接至纳米孔的至少一种聚合酶来催化。在一些情形下，还将至少一种磷酸酶附接至所述孔。磷酸酶可将标签从多磷酸上切除以释放所述标签。在一些情况下，磷酸酶定位为使得在聚合酶反应中通过聚合酶产生的焦磷酸在进入所述孔之前与磷酸酶相互作用。

在一些情况下，标签不附接至多磷酸(参见，例如，图26)。在这些情况下，标签通过任选地可切除的接头(X)进行附接。用于产生可切除加帽的和/或可切除连接的核苷酸类似物的方法公开于美国专利号6,664,079中，该专利通过引用全部并入本文。接头并不需要是可切除的。

接头可为任何合适的接头且任选地以任何合适的方式切除。接头可为光可切除的。在一个实施方案中，使用UV光来光化学地切除光化学可切除的接头和部分。在一个实施方案中，光可切除的接头为2-硝基苄基部分。

可采用TCEP(三(2-羧乙基)膦)处理-CH₂N₃基团，以便将其从dNPP类似物或rNPP类似物的3’O原子上去除，从而产生3’OH基团。

标签的检测

在一些情形下，聚合酶从包含多个不同碱基(例如，A、C、G、T和/或U)的标记核苷酸的库中得到。也可反复地使聚合酶与各种类型的标记的碱基接触。在这种情况下，使每种类型的核苷酸均具有独特的碱基可能不是必需的，但在一些情况下，不同的碱基类型之间的循环增加了过程的成本和复杂性，然而这种实施方案也包含在本发明中。

图27显示，在一些实施方案中，标记的核苷酸向核酸分子中的掺入(例如，使用聚合酶来延伸与模板之间碱基配对的引物)可释放出可检测的标签-多磷酸。在一些情况下，当标签-多磷酸穿过纳米孔时对其进行检测。在一些实施方案中，当标签-多磷酸驻留在纳米孔时对其进行检测。

在一些情况下，所述方法基于构成多磷酸的磷酸的数目对核苷酸进行区分(例如，甚至当标签相同时)。然而，每种类型的核苷酸通常具有独特的标签。

可在标签进入和/或穿过纳米孔并测量离子电流之前，用磷酸酶(例如，碱性磷酸酶)处理标签-多磷酸化合物。

标签可在从核苷酸上释放之后流动通过纳米孔。在一些情形下，施加电压以牵引标签通过纳米孔。至少约85％、至少90％、至少95％、至少99％、至少99.9或至少99.99％的释放的标签可转位通过纳米孔。

在一些情形下，标签驻留在纳米孔中一段时间，在该时间段内对标签进行检测。在一些情形下，施加电压以将标签牵引入纳米孔，检测标签，将标签逐出纳米孔，或其任意组合。在核苷酸掺入事件时标签可被释放或保持与核苷酸结合。

标签可(至少部分地)由于其电荷而在纳米孔中被检测到。在一些情形下，标签化合物为具有第一净电荷且在化学、物理或生物反应后具有不同的第二净电荷的交替地带电荷的化合物。在一些情形下，标签上的电荷的量级与化合物的其余部分上的电荷的量级相同。在一个实施方案中，标签具有正电荷且去除该标签改变化合物的电荷。

在一些情况下，当标签进入和/或穿过纳米孔时，它可产生电子的变化。在一些情况下，电子的变化为电流幅值的变化、纳米孔的电导率的变化或其任意组合。

纳米孔可以是生物的或合成的。还考虑纳米孔为蛋白质的，例如，其中纳米孔为α溶血素蛋白。合成的纳米孔的实例为固态的孔或石墨烯。

在一些情况下，聚合酶和/或磷酸酶附接至纳米孔。融合蛋白或二硫化物交联为用于附接至蛋白质纳米孔的方法的实例。在固态纳米孔的情况下，向纳米孔附近的表面上的附接可以通过生物素-链霉亲和素连接进行。在一个实例中，DNA聚合酶通过采用氨基官能化的烷硫醇自组装单层进行改性的金表面附接至固体表面，其中所述氨基被改性为NHS酯以用于附接至DNA聚合酶上的氨基。

该方法可在任何合适的温度下进行。在一些实施方案中，温度为4℃至10℃。在一些实施方案中，温度为环境温度。

该方法可在任何合适的溶液和/或缓冲液中进行。在一些情形下，缓冲液为含有20mM HEPES的缓冲到pH 7.0至8.0的300mMKCl缓冲液。在一些实施方案中，该缓冲液不包含二价阳离子。在一些情形下，该方法不受二价阳离子的存在的影响。

对两条核酸链的测序

双链核酸分子(例如，脱氧核糖核酸)可具有根据公知的碱基对相互作用(例如，A与T及G与C配对)而杂交(例如，彼此结合)的有义链和反义链。在一些情况下，有义链和反义链以公知的α-螺旋构型彼此环绕。通常，有义链为根据大多数生物体所使用的公知的密码子编码氨基酸的链(例如，从5’到3’方向，TCA通常编码氨基酸丝氨酸等...)。然而，指定哪条链是有义链而哪条是反义链可以是任意的。并非所有的核酸都编码蛋白质。

在此认识到，反义链(例如，从3’到5’方向)的核酸序列可用于确定和/或验证有义链(例如，从5’到3’方向)的序列(例如，由于已知的碱基对相互作用)。此外，对有义链和反义链均进行测序以确定双链核酸分子的序列可具有某些优势。在一些情形下，确定有义链或反义链的序列可能更容易(例如，由于任何原因或未知原因—实施包括但不限于(a)一条链可形成另一条链不形成的二级结构或(b)来自一条链的信号比来自另一条链的信号相对更强和/或更好分辨)。从一条链获得的序列信号和/或信息可互补于从另一条链获得的序列信号和/或信息(例如，不容易在一条链上分辨的碱基可能容易在另一条链上分辨)。

核酸分子可具有各种类型的突变和/或错配。例如，碱基对错配可存在于任何数目的碱基位置(例如，1、2、3、4、5、6、7个或更多个)在两条链之间不互补的情况下(例如，有义链上的A和反义链上的G)。在一些情况下，一条链相对于另一条链可具有碱基位置的插入或缺失(例如，有义链具有与反义链不碱基配对的序列ACCTCGAT)。有义链和反义链可在缺失和/或插入的5’方向上、在缺失和/或插入的3’方向上或在这两个方向上碱基配对。在一些情况下，双链核酸分子可包含仅在其中一条链上发现的信息(例如，外遗传标志物，如甲基化的碱基)。在这种情况下，可对有义链和反义链两者进行测序，以检测外遗传信息(例如，甲基化的碱基)。

本文提供了使用纳米孔对有义链和反义链两者进行测序的方法。有义链和反义链的末端可连接在一起以形成待测序的同时包含有义链和反义链的单链核酸分子。单链核酸分子可通过使其穿过纳米孔(例如，如图2B所示)或者使其行进至邻近检测标签分子的纳米孔(例如，如图2C和图2D所示)而进行测序。

在一个方面，用于对核酸分子或其部分进行测序的方法包括(a)提供包含有义链和反义链的双链核酸分子；(b)将连接有义链与反义链的第一核酸区段连接至双链核酸分子的第一末端上；(c)解离双链核酸以提供包含所述有义链的有义部分和所述反义链的反义部分的单链核酸分子；(d)使单链核酸分子穿过或接近在邻近或接近电极设置的膜中的纳米孔；(e)使用电极，在使单链核酸分子穿过或接近纳米孔的同时获得电流测量值；和(f)从(e)中得到的电流测量值确定双链核酸的序列。该电极可适配为在单链核酸分子穿过或接近纳米孔时检测电流。

第一核酸区段可具有核酸发夹(例如，图28中的接头部分)。该发夹可具有非碱基配对的发夹结构，该发夹结构位于包含碱基配对(双链)的核酸的发夹双链体(HD)的两个区段之间。第一核酸区段还可包含第一标识符。第一标识符可鉴定双链核酸分子来自哪种样品。

在一些实施方案中，所述方法进一步包括将第二核酸区段连接至双链核酸的第二末端(例如，图28中的前大体积部分)上。在一些情形下，第二核酸区段包含能够在纳米孔中捕获单链核酸分子的部分(例如，第一和/或第二前大体积结构)。在一些实施方案中，第二核酸区段能够在低于某一温度下(例如，当温度低于约60℃、低于约50℃、低于约40℃、低于约30℃、低于约20℃、低于约10℃、低于约0℃或低于约-10℃时)在纳米孔中捕获单链核酸分子。在一些实施方案中，第二核酸区段包含第二标识符(例如，能够用于确定单链核酸分子是在第一方向上还是在第二方向上穿过纳米孔)。

在一些情况下，借助于如本文所述的一个或多个减速物分子减慢单链核酸分子穿过或接近纳米孔的穿行速度。可在当单链核酸分子的穿行速度减慢时获得电流测量值。在一些实施方案中，在跨纳米孔和/或跨膜施加的多个电压下进行电流测量。在一些情形下，所述一个或多个减速物分子的单个减速物分子包含核糖核酸。

在一个方面，本发明涉及使用纳米孔检测器和包含样品多核苷酸结构及其反义多核苷酸的测试多核苷酸获得样品多核苷酸的序列和/或结构信息的方法。该测试多核苷酸可被制止物-测试多核苷酸区段捕获于纳米孔中一段停留时间。在该停留时间期间，将包括具有多于一个电压的电势的恒定电势或变化电势分布施加于纳米孔检测器的电极上，并得到一组电信号。电势可根据波形(例如，图29中所示的波形)而变化。在恒定或变化的电势分布下采集的电信号可提供在测试多核苷酸的流动方向上位于制止物-测试多核苷酸区段之前的序列和/或结构的信息。取决于纳米孔和/或测试多核苷酸的性质，从样品多核苷酸的不同序列和/或结构采集的电信号可能难以高置信度地分辨。然而，将从样品多核苷酸和相应的反义多核苷酸采集的电信号集中在一起可提高分辨样品多核苷酸中的序列和/或结构的置信度。在同一纳米孔中表征样品多核苷酸及相应的反义多核苷酸也可通过在大致相同的时间从同一纳米孔采集信号来降低系统误差。先前的方法仅分析样品多核苷酸。因此，与目前可用的方法相比，通过读取样品多核苷酸及其反义多核苷酸所采集的电信号可以更可靠且准确地确定样品多核苷酸序列和/或结构。

本发明的一个方面涉及获得样品的结构信息的方法，该方法包括：

(F1)制备双链(ds)测试多核苷酸，其包含：

具有第一末端和第二末端的双链样品部分，该双链样品部分包含单链(ss)样品多核苷酸及其单链反义多核苷酸；

在第一末端连接所述单链样品多核苷酸与单链反义多核苷酸的接头；以及

在第二末端各自连接至有义多核苷酸或反义多核苷酸的第一前大体积结构和第二前大体积结构；

(F2)使A1的双链测试多核苷酸变性为在一个末端上具有第一前大体积结构且在另一个末端上具有第二前大体积结构的单链测试多核苷酸；

(G1)在第一条件下由第一前大体积结构形成第一大体积结构(BS1)，

(G2)施加电势以使单链测试多核苷酸流动通过纳米孔检测器的纳米孔，任选地直到BSH使单链测试多核苷酸在纳米孔的缩窄区域之前停顿、减慢或停止，

(G3)在第二条件下由第二前大体积结构形成第二大体积结构(BS2)，

(G4)任选地施加另一电势以逆转单链测试多核苷酸的流动，直到BSL使单链测试多核苷酸在纳米孔的缩窄区域之前停顿、减慢或停止，

(G5)使制止物与单链测试多核苷酸接触以形成包含第一制止物-测试多核苷酸区段的测试多核苷酸复合物；

(G6)施加另一电势以使测试多核苷酸复合物流动通过纳米孔，直到第一制止物-测试多核苷酸区段在纳米孔的缩窄区域之前停顿、减慢或停止，

(G7)当第一制止物-测试多核苷酸区段在纳米孔内停顿一段停留时间时，向纳米孔检测器的电极施加包括具有多于一个电压的电势的恒定的电势分布或变化的电势分布，并获得第一组电信号，以及

(G8)通过比较第一组电信号与针对在测试多核苷酸的流动方向上位于制止物-测试多核苷酸区段之前的已知结构在与步骤(G7)相同的电势分布下采集的电信号，确定在测试多核苷酸的流动方向上位于第一制止物-测试多核苷酸区段之前的结构，

(G9)使第一制止物-测试多核苷酸区段解离，并继续使多核苷酸流动通过纳米孔，

(G10)重复步骤(G5)至(G9)，直到BSH或BSL使单链测试多核苷酸停顿、减慢或停止，

(G11)任选地重复步骤(G4)至(G10)，优选重复1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、...或100次，以及

(G12)通过使采集的样品多核苷酸及其反义多核苷酸两者的核苷酸序列信息重叠，构建样品多核苷酸序列。

在一个实施方案中，第一和第二前大体积结构为多核苷酸/寡核苷酸前大体积结构。第一前大体积结构在第一温度下形成相应的第一大体积结构。第二前大体积结构在第二温度下形成相应的第二大体积结构。且第一温度高于第二温度。

在另一个实施方案中，第一前大体积结构为多核苷酸和/或寡核苷酸前大体积结构，其通过与第一前大体积结构特异性配体相互作用而形成第一大体积结构。在一个实施方案中，第一大体积结构的形成与温度无关。第二前大体积结构可设置为使得前大体积结构与相应的大体积结构之间的转变与温度相关。

在一个实施方案中，包含生物素修饰的多核苷酸和/或寡核苷酸的第一前大体积结构通过经由生物素/链霉亲和素相互作用与链霉亲和素结合而形成第一大体积结构。第一大体积结构的形成可与温度无关。

参见图28，在一个实施方案中，本文所述的双链测试多核苷酸包含样品多核苷酸、该样品多核苷酸的反义多核苷酸(反义多核苷酸)、连接该样品多核苷酸与其反义多核苷酸的接头(I3-HD-发夹-HD'-I3'部分)、第一前大体积结构、第二前大体积结构、指示第一大体积结构的正确形成的第一方向标识符(DI1)(图28)。I2、I3、I2'和I3'部分中的每一个任选地包含一个或多个本文所述的标识符。HD1和HD1'一起为多核苷酸双链体。DI-1部分包含第一方向标识符和任选的一个或多个其他标识符。LI部分包含低温方向标识符及任选的一个或多个其他标识符。I2-HI部分可以是或可以不是与I2'-LI部分完全互补的，但其至少一部分形成双链体结构。在I2-HI部分和I2'-LI部分之间的双链体部分可靠近，且更优选为邻近双链样品多核苷酸部分的末端(图28)。双链测试多核苷酸可通过本领域公知的常规变性技术(例如通过加热)转变为单链测试多核苷酸。

样品多核苷酸可为DNA或RNA多核苷酸；且反义多核苷酸为与样品多核苷酸互补的DNA或RNA多核苷酸。接头部分通过：(a)连接样品多核苷酸的3'末端和反义样品多核苷酸的5'末端，和/或(b)连接样品多核苷酸的5'末端和反义样品多核苷酸的3'末端，在样品双链体部分的第一末端上连接样品多核苷酸和反义样品多核苷酸。

在一个实施方案中，测试多核苷酸具有1至约10,000个碱基、1至约1,000个碱基、1至约500个碱基、1至约300个碱基、1至约200个碱基、1至约100个碱基、约5至约10,000个碱基、约5至约1,000个碱基、约5至约500个碱基、约5至约300个碱基、5至约200个碱基、5至约100个碱基、10至约10,000个碱基、10至约1,000个碱基、10至约500个碱基、10至约300个碱基、10至约200个碱基、10至约100个碱基、20至约10,000个碱基、20至约1,000个碱基、20至约500个碱基、20至约300个碱基、20至约200个碱基、20至约100个碱基、30至约10,000个碱基、30至约1,000个碱基、30至约500个碱基、30至约300个碱基、30至约200个碱基、30至约100个碱基、30至约50个碱基、50至约10,000个碱基、50至约1,000个碱基、50至约500个碱基、50至约300个碱基、50至约200个碱基或50至约100个碱基。

制止物可为本文所述的减速物(例如，寡核苷酸)，且单链测试多核苷酸可包含将在本文所述的方法中被减速物结合的单链多核苷酸的一部分。在一些实施方案中，测试多核苷酸为测试DNA或RNA，且减速物为DNA或RNA减速物。减速物可具有2、3、4、5、6、7、8、9、10、11、12、13、14、15或16，优选10或更少、8或更少、6或更少、4或更少的长度。减速物可包含选自通用核苷酸、锁定核苷酸、基本核苷酸、其修饰及其组合的一种或多种核苷酸。通用核苷酸和基本核苷酸的修饰包括在核碱基结构、骨架结构(例如乙二醇核苷酸、吗啉代和锁定核苷酸)及其组合处的修饰。在一些实施方案中，减速物-测试多核苷酸区段的第一碱基对可部分或完全处于纳米孔中并贡献于步骤(G7)中得到的电信号。因此，步骤(G8)进一步包括获得在单链测试多核苷酸的流动方向上减速物-测试多核苷酸区段的第一碱基对的结构信息。在一些实施方案中，优选地将减速物构建为在5’和/或3’端具有与所有基本核碱基(A、T、C、G和U)碱基配对的通用核苷酸，从而标准化减速物-测试多核苷酸区段的第一碱基对的贡献，并使信号更容易分析。

在一些实施方案中，优选地将减速物构建为在5’和/或3’端具有与所有基本核碱基(A、T、C、G和U)碱基配对的通用核苷酸，从而标准化减速物-测试多核苷酸区段的第一碱基对的贡献，并使信号更容易分析。

制止物可为酶，该酶结合至单链测试多核苷酸上通过单链测试多核苷酸与引物杂交而形成的双链体部分处，并且任选地移动单链测试多核苷酸通过纳米孔，并通过在孔中的读取过程中保持与测试多核苷酸相缔合，或通过在测试多核苷酸的反义链的单核苷酸延伸后解离及随后将新形成的样品/反义双链体插入孔中以读取与先前的双链体样品链读取不同的一个碱基，从而引起对测试多核苷酸的读取。这类酶的实例包括但不限于Klenow-exo minus；Phi29聚合酶；Phi29-exominus聚合酶；T4DNA聚合酶；M-MuLV逆转录酶；和T7Gp4a解旋酶。

在一些实施方案中，制止物为酶；单链测试多核苷酸进一步包含用于使酶结合至单链测试多核苷酸上的酶结合位点。参见图28，这样的酶结合位点可存在于DI1、DI2、I2或I2'部分中，并优选存在于DI1或I2中，以确保能够用纳米孔表征所有的样品多核苷酸和反义多核苷酸。

在一些实施方案中，制止物-测试多核苷酸区段的第一碱基对可部分或完全地处于纳米孔中，在步骤(G7)、步骤(G8)中获得的电信号进一步包括：确定在单链测试多核苷酸的流动方向上制止物-测试多核苷酸区段的第一碱基对。在一些实施方案中，优选构建制止物，使之具有与所有基本核碱基(A、T、C、G和U)碱基配对的通用核苷酸，以形成制止物-测试多核苷酸区段的第一碱基对，并使信号更容易分析。

在一些实施方案中，在步骤(G8)中确定的位于制止物-测试多核苷酸区段之前的结构为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20至50个碱基、50至100个碱基、100至200个碱基、200至500个碱基或多于500个碱基序列。在一些实施方案中，在步骤(G8)中确定的位于制止物-测试多核苷酸区段之前的结构为从制止物-测试多核苷酸区段起在位置1-50，如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30或其组合处的任意核苷酸序列。

在一些实施方案中，在步骤(G7)中施加的电势分布为具有约160mV至约-160mV、约160mV至约0mV、约160mV至约60mV、约100mV至约0mV、100mV至约80mV或80mV至约70mV的电压的恒定电势分布。

在一些实施方案中，在步骤(G7)中施加的电势分布为包括具有两个或更多个电压(每个电压施加某一时间)的电势的变化的电势分布。在一些实施方案中，变化的电势分布包括在步骤(G6)中或在步骤(G6)中在制止物-测试多核苷酸复合物在纳米孔中停顿、减慢或停止之后产生的一个或多个电势。所施加的两个或更多个电势中的至少两个电势具有大于约1mV、5mV、10mV或30mV的差值。在一个实施方案中，所述电势具有约160mV至约-160mV、约160mV至约0mV、约160mV至约60mV、约100mV至约0mV、100mV至约80mV或80mV至约70mV的电压。每个电势的时间可为至少约5μs、至少约10μs、至少约50μs、至少约100μs、至少约500μs、至少约1ms、至少约5ms、至少约10ms、至少约50ms、至少约100ms、至少约500ms、至少约1s或至少约2s。

在一些实施方案中，在步骤(G7)中施加的变化的电势分布包括经某一时间周期从第一电势变化到第二电势的电势斜坡(electric potential ramp)。在一些实施方案中，所述变化的电势分布可包括在步骤(G6)中或在步骤(G6)中在制止物-测试多核苷酸复合物在纳米孔中停顿、减慢或停止之后产生的一个或多个电势。例如，所述变化的电势分布的第一电势可为在步骤(G6)中或在步骤(G6)中在制止物-测试多核苷酸复合物在纳米孔中停顿、减慢或停止之后产生的电势。所述变化的电势分布的最高电势与最低电势之间的差值为大于约1mV、5mV、10mV、20mV或30mV。在另一个实施方案中，第一电势为约160mV而第二电势为约-160mV。在一个实施方案中，第一电势为约160mV而第二电势为约60mV。在另一个实施方案中，第一电势为约100mV而第二电势为约0mV。在另一个实施方案中，第一电势为约160mV而第二电势为约0mV。在另一个实施方案中，第一电势为约100mV而第二电势为约80mV。在另一个实施方案中，第一电势为约100mV而第二电势为约90mV。在另一个实施方案中，第一电势为约90mV而第二电势为约85mV。预定的时间周期为至少约5μs、至少约10μs、至少约50μs、至少约100μs、至少约500μs、至少约1ms、至少约5ms、至少约10ms、至少约50ms、至少约100ms、至少约500ms、至少约1s或至少约2s。

在一些实施方案中，在步骤(G7)中施加的变化的电势分布包括从第一电势变化至第二电势至第三电势等等以至多个电势(它们共同形成施加的变化的电势波形)的电势波形。

在一些实施方案中，步骤(G7)在具有至少0.1M盐的溶液中进行。该盐选自盐酸盐、磷酸盐、硝酸盐和硫酸盐。

在一些实施方案中，步骤(G7)在pH为约6.5至约8.5或约7至约8的溶液中进行。可使用任何可提供这样的pH的缓冲液。实例包括但不限于HEPES缓冲液。

在一些实施方案中，纳米孔为α溶血素纳米孔或MspA纳米孔。

在一些实施方案中，纳米孔检测器包括嵌入隔离表面的至少一个金属电极。金属电极的材料的实例包括但不限于银、氯化银、铂、金、钌和镍。隔离表面的材料的实例包括但不限于塑料材料(例如特氟隆(Teflon))、玻璃或半导体材料(例如硅、锗和镓)。在一些实施方案中，使用本领域已知的方法将隔离表面进一步改性为疏水性和亲脂性的以利于生物分子向隔离表面的附接。例如，可采用含有6至20个碳的长链的硅烷分子(例如十八烷基-三氯硅烷、十八烷基-三甲氧基硅烷或十八烷基-三乙氧基硅烷)或DMOC在硅表面上的二氧化硅表面上进行进一步的硅烷化。

在一个实施方案中，在步骤(G7)中在测试多核苷酸的流动方向上位于制止物-测试多核苷酸区段之前的结构可根据从样品多核苷酸及其反义多核苷酸中的相应互补结构收集的信息来确定。因此，读取的可靠度和准确度通过从样品多核苷酸和反义多核苷酸两者收集信息而得到改善。此外，在一些实施方案中，可通过反义多核苷酸中的相应互补结构来进一步将步骤(G7)中提供相似信号的某些结构彼此区分开。

在一个实例中，可在步骤(G7)中表征在测试多核苷酸的流动方向上位于制止物-测试多核苷酸区段之前的结构的单核苷酸差异。C和T可以以高置信度(>约97％、>约99％且优选>99.5％的置信度)确定。G和A可以以较低的置信度(约90-95％的置信度)表征。G和A的互补结构分别为C和T。因此，与根据仅从样品DNA采集的信息确定所有4种核苷酸A、C、T和G(约95％的置信度)相比，确定样品DNA和反义链两者中的C'和T'以更高的置信度(>99％，优选>99.5％的置信度)提供样品DNA的结构。在一些实施方案中，纳米孔为α溶血素纳米孔，所表征的多核苷酸为DNA或RNA，且步骤(G6至G7)中以恒定分布或变化分布施加的电势为至少约10mV、至少约50mV、至少约60mV、约60mV至约160mV，优选至少约90mV、至少约100mV，更优选约100mV至约160mV。

在另一个实例中，可在步骤(G7)中表征将在测试多核苷酸的流动方向上位于制止物-测试多核苷酸区段之前的结构的单核苷酸差异。C和A可以以高置信度(>约98％，优选>99.5％的置信度)确定。G和T可以以较低的置信度(约95％的置信度)表征。G和T的互补结构分别为C和A。因此，与根据仅从样品DNA采集的信息确定所有4种核苷酸A、C、T和G(约95％的置信度)相比，确定样品DNA和反义链两者中的C'和A'以更高的置信度(>99％，优选>99.5％的置信度)提供样品DNA的结构。在一些实施方案中，纳米孔为α溶血素纳米孔，所表征的多核苷酸为DNA或RNA，且步骤(G6至G7)中以恒定分布或变化分布施加的电势为小于约140mV、小于约80mV、约0mV至约140mV，优选小于约100mV、小于约70mV，更优选为约0mV至约70mV。

在另一个实例中，可在步骤(G7)中确定在测试多核苷酸的流动方向上位于制止物-测试多核苷酸区段之前的结构的二核苷酸二聚体。与仅从样品DNA确定所有的二聚体(>约90％，或>约95％的置信度)相比，表征样品DNA和反义链两者中的二聚体以更高的置信度(>约97％，或>约99％，优选>99.5％的置信度)提供样品DNA的结构。在优选的实例中，在步骤(G7)中，这样的二核苷酸二聚体悬浮于α溶血素孔的缩窄位点上。

本发明的另一个方面涉及以阵列形式获得多个单链(ss)测试多核苷酸的序列信息的方法。“多个”指多于1个，优选多于10、100、1,000、100,000、一百万、一千万或一亿个。该方法包括：

(H1)提供阵列形式的多个纳米孔和多个单链测试多核苷酸，以及(H2)针对每个单链测试多核苷酸，执行如本文所述的步骤(F1)至(F2)及(G1)至(G12)，其中纳米孔为多个纳米孔中的一个，其中阵列形式的多个纳米孔中的每一个是单独寻址的，并且在多个纳米孔中的每一个处施加的电势被单独控制。

可变刺激和电子签名

本文提供了采用纳米孔鉴定分子或其部分的系统和方法。该方法可包括在邻近或接近电极设置的膜中提供包含至少一个纳米孔的芯片。该电极可适配为检测通过纳米孔的电流。该方法可包括将分子或其部分插入纳米孔，并跨纳米孔和/或跨膜施加电压。分子或其部分可影响电流(及通过电流鉴定)。在此认识到，在单一电压下测量的电流可能不足以鉴定分子或其部分。在一个方面，本文所述的方法包括在多个电压下测量电流以鉴定分子或其部分。在一些实施方案中，多个电压下的电流包括电子签名，并进一步包括将该电子签名与多个参照电子签名进行比较以鉴定分子或其部分。

在一些实施方案中，聚合物分子的部分以它们沿着聚合物分子的长度的顺序被鉴定，和/或该分子以核苷酸掺入生长中的核酸链的顺序被鉴定。

本文所述的包括在多个电压下测量电流(例如，获得“电子签名”)的方法可在任何应用中与纳米孔一起使用。例如，可如图2A所示鉴定分子。在一些情况下，分子为聚合物分子(例如，核酸分子、蛋白质、碳水化合物)，且任选地以聚合物的部分在聚合物上出现的顺序对聚合物的部分进行鉴定(例如，对聚合物进行测序)。在一些情况下，聚合物如图2B所示流动通过纳米孔。在一些情况下，聚合物为核酸分子且聚合物并不流动通过纳米孔。核酸分子可通过使其行进至邻近检测标签分子的纳米孔而进行测序(例如，如图2C和图2D所示)。

在一些实施方案中，电压根据电压波形而变化。电压波形可为包括方波、正弦波、三角波、锯齿波或者不规则波的任何波形。图29示出了一些适合的波形.

在一些情形下，通过向纳米孔和/或膜施加交流电(AC)波形而使电压变化。AC波形可具有任何合适的频率。在一些实施方案中，频率为约0.1赫兹(Hz)、约0.5Hz、约1Hz、约5Hz、约10Hz、约50Hz、约100Hz、约500Hz、约1000Hz、约5000Hz、约10000Hz、约50000Hz、约100000Hz、约500000Hz或约1000000Hz。在一些实施方案中，频率为至少约0.1赫兹(Hz)、至少约0.5Hz、至少约1Hz、至少约5Hz、至少约10Hz、至少约50Hz、至少约100Hz、至少约500Hz、至少约1000Hz、至少约5000Hz、至少约10000Hz、至少约50000Hz、至少约100000Hz、至少约500000Hz或至少约1000000Hz。在一些实施方案中，频率为至多约0.1赫兹(Hz)、至多约0.5Hz、至多约1Hz、至多约5Hz、至多约10Hz、至多约50Hz、至多约100Hz、至多约500Hz、至多约1000Hz、至多约5000Hz、至多约10000Hz、至多约50000Hz、至多约100000Hz、至多约500000Hz或至多约1000000Hz。

在一些情形下，改变电压以便以高统计学置信度鉴定分子或其部分。在一些情形下，以约90％、约95％、约99％、约99.9％、约99.99％或约99.999％的统计学置信度鉴定分子或其部分。在一些情形下，以至少约90％、至少约95％、至少约99％、至少约99.9％、至少约99.99％或至少约99.999％的统计学置信度鉴定分子或其部分。

在一些情况下，芯片包含邻近或接近多个电极的多个纳米孔，且电极(i)是单独寻址的，(ii)施加的电压被单独控制，或(ii)兼具(i)和(ii)。电压可在包括约120mV至约150mV或约40mV至约150mV的任何合适的范围内变化。

分子可为双链核酸分子，在这种情况下，分子可解离以形成一个或多个单链核酸分子，并且可使所述一个或多个单链核酸分子穿过纳米孔以确定双链核酸分子的序列。纳米孔的实例包括α溶血素纳米孔和耻垢分枝杆菌(MspA)纳米孔。

在一些情形下，借助于一个或多个减速物分子减慢聚合物分子通过纳米孔的穿行速度，其中当聚合物分子的穿行速度减慢时鉴定该聚合物分子的部分。在一些实施方案中，单独的减速物分子包含核糖核酸。

在一些实施方案中，聚合物分子被捕获于纳米孔中(例如，聚合物分子为单链核酸分子，且该分子被在纳米孔的任一侧上形成的大体积结构捕获于纳米孔内)。聚合物分子可往复地穿过纳米孔，以多次(例如，2、3、4、5、6、7、8、9、10次或更多次)鉴定聚合物分子的部分。

在一些情况下，核酸发夹连接至双链核酸分子的末端，以在双链核酸分子解离后提供包含双链核酸分子的有义链和反义链的单链核酸分子。

在一个方面，本发明涉及使用纳米孔检测器获得测试聚合物的序列和/或结构信息的方法。该测试聚合物可被捕获或驻留于纳米孔中一段停留时间(任选地由于制止物-测试聚合物区段)。在该停留时间内，可向纳米孔检测器的电极施加包括具有多于一个电压的电势的变化的电势分布，并可获得一组电信号。与在恒定电势下采集的电信号相比，在变化的电势分布下采集的电信号可提供(例如，在测试聚合物的流动方向上位于制止物-测试聚合物区段之前的)序列和/或结构的更独特的信息。因此，与使用恒定电势的先前方法相比，在变化的电势分布下采集的电信号可更可靠且更准确地确定测试聚合物序列和/或结构。

本发明的一个方面涉及获得测试聚合物的序列和/或结构信息的方法，其包括：

(I1)提供包含制止物-测试聚合物区段的测试聚合物复合物；

(J1)施加第一测试电势以使测试聚合物复合物流动通过纳米孔检测器的纳米孔，直到制止物-测试聚合物区段在纳米孔的缩窄区域之前停顿、减慢或停止，

(J2)当制止物-测试聚合物区段在纳米孔内停顿一段停留时间时，向纳米孔检测器的电极施加包括具有多于一个电压的电势的变化的电势分布，并获得第一组电信号，以及

(J3)通过比较第一组电信号与针对在测试聚合物的流动方向上位于制止物-测试聚合物区段之前的已知结构在与步骤(J2)中相同的变化的电势分布下采集的电信号，确定在测试聚合物的流动方向上位于制止物-测试聚合物区段之前的结构。

在一个实施方案中，测试聚合物为测试多核苷酸，并且构件为如本文所述的核苷酸。在一个实施方案中，测试多核苷酸具有1至约10,000个碱基、1至约1,000个碱基、1至约500个碱基、1至约300个碱基、1至约200个碱基、1至约100个碱基、约5至约10,000个碱基、约5至约1,000个碱基、约5至约500个碱基、约5至约300个碱基、5至约200个碱基、5至约100个碱基、10至约10,000个碱基、10至约1,000个碱基、10至约500个碱基、10至约300个碱基、10至约200个碱基、10至约100个碱基、20至约10,000个碱基、20至约1,000个碱基、20至约500个碱基、20至约300个碱基、20至约200个碱基、20至约100个碱基、30至约10,000个碱基、30至约1,000个碱基、30至约500个碱基、30至约300个碱基、30至约200个碱基、30至约100个碱基、30至约50个碱基、50至约10,000个碱基、50至约1,000个碱基、50至约500个碱基、50至约300个碱基、50至约200个碱基或50至约100个碱基。

制止物可为寡核苷酸减速物，且单链测试多核苷酸可包含在本文所述的方法中被减速物结合的单链多核苷酸的部分。在一些实施方案中，测试多核苷酸为测试DNA或RNA，且减速物为DNA或RNA减速物。减速物可具有2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个碱基的长度。在一些情况下，减速物具有10个或更少、8个或更少、6个或更少或4个或更少的碱基。减速物可包含选自通用核苷酸、锁定核苷酸、基本核苷酸、其修饰及其组合的一种或多种核苷酸。通用核苷酸和基本核苷酸的修饰包括在核碱基结构、骨架结构(例如乙二醇核苷酸、吗啉代和锁定核苷酸)及其组合处的修饰。在另一个优选的实施方案中，减速物的骨架结构在指定的一(多)个位置、随机的位置或其组合处被修饰(例如乙二醇核苷酸、吗啉代和锁定核苷酸)。在一些实施方案中，减速物-测试多核苷酸区段的第一碱基对可部分或完全地处于纳米孔中，并贡献于步骤(J2)中获得的电信号。因此，步骤(J3)进一步包括获得在单链测试多核苷酸的流动方向上减速物-测试多核苷酸区段的第一碱基对的序列和/或结构信息。在一些实施方案中，优选地将减速物构建为在5'和/或3’端具有与所有基本核碱基(A、T、C、G和U)碱基配对的通用核苷酸，从而标准化减速物-测试多核苷酸区段的第一碱基对的贡献，并使信号更容易分析。

制止物可为酶，该酶与单链测试多核苷酸结合，并且任选地移动单链测试多核苷酸通过纳米孔。该酶的实例包括但不限于Klenow,exo minus；Phi29聚合酶；Phi29,exominus聚合酶；T4DNA聚合酶；M-MuLV逆转录酶；和T7Gp4a解旋酶。

制止物可为可形成诸如多核苷酸发夹结构、多发夹结构和多臂结构等2-D或3-D结构的测试多核苷酸的一部分。在一些实施方案中，制止物-测试多核苷酸区段的第一碱基对可部分或完全处于纳米孔内，步骤(J2)、步骤(J3)中获得的电信号进一步包括确定在单链测试多核苷酸的流动方向上制止物-测试多核苷酸区段的第一碱基对。

在一些实施方案中，步骤(J3)中确定的位于制止物-测试多核苷酸区段之前的结构为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20至50个碱基、50至100个碱基、100至200个碱基、200至500个碱基或多于500个碱基的序列.

在一些实施方案中，步骤(J3)中确定的位于制止物-测试多核苷酸区段之前的结构为从制止物-测试多核苷酸区段起在位置1-50，如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30或其组合处的任意核苷酸序列。

在一些实施方案中，步骤(J2)中施加的变化的电势分布包括具有两个或更多个电压(每个施加一定时间)的电势。在一些实施方案中，变化的电势分布包括在步骤(J1)中或在步骤(J1)中在制止物-测试聚合物复合物在纳米孔中停顿、减慢或停止之后产生的一个或多个电势。所施加的两个或更多个电势中的至少两个电势具有大于约1mV、5mV、10mV或30mV的差值。在一个实施方案中，所述电势具有约160mV至约-160mV、约160mV至约0mV、约160mV至约60mV、约100mV至约0mV、100mV至约80mV或80mV至约70mV的电压。每个电势的时间为至少约5μs、至少约10μs、至少约50μs、至少约100μs、至少约500μs、至少约1ms、至少约5ms、至少约10ms、至少约50ms、至少约100ms、至少约500ms、至少约1s或至少约2s。

在一些实施方案中，在步骤(J2)中施加的变化的电势分布包括经一时间周期从第一电势变化到第二电势的电势斜坡。在一些实施方案中，所述变化的电势分布包括在步骤(J1)中或在步骤(J1)中在制止物-测试聚合物复合物在纳米孔中停顿、减慢或停止之后产生的一个或多个电势。例如，所述变化的电势分布的第一电势可为在步骤(J1)中或在步骤(J1)中在制止物-测试聚合物复合物在纳米孔中停顿、减慢或停止之后产生的电势。所述变化的电势分布的最高电势与最低电势之间的差值大于约1mV、5mV、10mV、20mV或30mV。在另一个实施方案中，第一电势为约160mV而第二电势为约-160mV。在一个实施方案中，第一电势为约160mV而第二电势为约60mV。在另一个实施方案中，第一电势为约100mV而第二电势为约0mV。在另一个实施方案中，第一电势为约160mV而第二电势为约0mV。在另一个实施方案中，第一电势为约100mV而第二电势为约80mV。在另一个实施方案中，第一电势为约100mV而第二电势为约90mV。在另一个实施方案中，第一电势为约90mV而第二电势为约85mV。预定的时间周期为至少约5μs、至少约10μs、至少约50μs、至少约100μs、至少约500μs、至少约1ms、至少约5ms、至少约10ms、至少约50ms、至少约100ms、至少约500ms、至少约1s或至少约2s。

在一些实施方案中，在步骤(J2)中施加的变化的电势分布包括从第一电势变化至第二电势至第三电势等等以至多个电势(它们共同形成施加的变化的电势波形)的电势波形。

在一些实施方案中，步骤(J2)在具有至少0.1M盐的溶液中进行。该盐选自盐酸盐、磷酸盐、硝酸盐和硫酸盐。

在一些实施方案中，步骤(J2)在pH为约6.5至约8.5或约7至约8的溶液中进行。可使用任何可提供这样的pH的缓冲液。实例包括但不限于HEPES缓冲液。在一些实施方案中，纳米孔为α溶血素纳米孔或MspA纳米孔。

在一些实施方案中，纳米孔检测器包括嵌入隔离表面的至少一个金属电极。金属电极的材料的实例包括但不限于银、氯化银、铂、金、钌和镍。隔离表面的材料的实例包括但不限于塑料材料(例如特氟隆)、玻璃或半导体材料(例如硅、锗和镓)。在一些实施方案中，使用本领域已知的方法将隔离表面进一步改性为疏水性和亲脂性的以利于生物分子向隔离表面上的附接。例如，可采用含有6至20个碳的长链的硅烷分子(例如十八烷基-三氯硅烷、十八烷基-三甲氧基硅烷或十八烷基-三乙氧基硅烷)或DMOC在硅表面上的二氧化硅表面上进行进一步的硅烷化。

本发明的另一个方面涉及以阵列形式获得多个单链(ss)测试多核苷酸的序列信息的方法。“多个”指多于1个、优选多于10、100、1,000、100,000、一百万、一千万或一亿个。该方法包括：

(K1)提供阵列形式的多个纳米孔和多个单链测试多核苷酸，以及

(K2)针对每个单链测试多核苷酸，执行如本文所述的步骤，其中纳米孔为多个纳米孔中的一个，并且阵列形式的多个纳米孔中的每一个是单独寻址的，且与多个纳米孔中的每一个相关联的电势被单独控制。

通过举例的方式，图30–32示出了核苷酸对于施加的变化的电压的响应。可采用施加的变化的电压和/或电子签名的方法和概念来区分(例如，附接至标记的核苷酸的)标签分子。

图30示出了针对核苷酸腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)和胸腺嘧啶(T)，相对于所施加的电压的提取的信号(DLC)。图31示出了对于多个核苷酸的相同信息(许多实验性尝试)。如此处所看到的，在120mV时胞嘧啶相对容易与胸腺嘧啶区分开，但在150mV时难以彼此区分(例如，这是由于在150mV时，对C和T而言，提取的信号大致相同)。此外，在120mV时胸腺嘧啶难以与腺嘌呤区分开，但在150mV时相对容易区分。因此，在一些情况下，施加的电压可从约120mV至150mV变化(例如，作为电压扫描的一部分)以区分核苷酸A、C、G和T(或U)中的每一种。

图32示出了针对核苷酸腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)和胸腺嘧啶(T)，随施加的电压变化的相对电导差百分比(％RCD)。对％RCD(基本为以30T参照分子为参照的各分子的电导的差异)作图可去除实验之间的偏移和增益变化。图32包括来自17/20试验的第一区组的各个DNA波形。所有单核苷酸DNA的％RCD对于全部17个良好试验捕捉50至200号。指示出了可区分各种核苷酸的电压。

实施例

实施例1.PB2结构(I)

在一端上具有BS2的单链测试DNA在低于T2的温度下被捕获于纳米孔中，而在高于T2的温度下得到释放(图24)。

BS2(BS2-1)为由具有5'-CCCCC CCCCC TTATA CCCCT ATAA-3'序列(SEQ ID NO.1，PB2-1)的PB2形成的DNA 5-碱基双链体发夹结构。根据使用UNAFOLD程序模拟，BS2-1具有约15℃的解链温度及5℃下约-0.96kcal/mol的△G。该适度低的△G表明BS2-1具有相对低的结合能。

在图24中，实线显示了温度从2℃至14℃的变化。点表示各个DNA捕获，意指PB2-1在相应温度下形成BS2-1并被捕获在纳米孔中。当温度约为或低于T2(约5℃)时存在捕获，表明由PB2-1形成BS2-1并且DNA在纳米孔中停顿。当温度增加至在T2之上约5至10℃时，DNA的捕获消失，表明BS2-1已解链并且不再在纳米孔中停顿。

因此，在低于其解链温度约10℃的温度下，PB2-1形成使ssDNA在孔中停顿、减慢或停止的BS2-1。这可能是由于BS2-1所具有的相对低的△G。因此，BS2-1的DNA双链体结构相对容易在纳米孔中解离。因此，具有更高的△G的BS2可能更难以破坏，并且可在更接近BS2的解链温度的温度下提供在纳米孔中更长的停留时间。

实施例2.PB1和PB2结构(II)

PB1在第一温度(T1)下形成BS1，第一温度(T1)高于由PB2形成BS2时的第二温度(T2)。T2高于工作温度(Tw)。在该实施例中，Tw低于室温。因此，PB1被设计为(在具有反义DNA区段的DNA双链体中，或在发夹结构中)具有相对长的DNA双链体区段，以便实现相对长的DNA双链体区段的期望的解链温度。

PB2被设计为具有较低的解链温度和高结合能(在工作条件下，△G＝约-1至-5kcal/mol、约-4至-6kcal/mol、约-4至-5kcal/mol、约-4.5kcal/mol或约-4.0kcal/mol)。已将摩利螺栓(molly bolt)或支链分子设计为提供具有低T2而在工作条件下不易解离的BS2。

PB1的一个实例具有包含15个碱基和一个4碱基A环的序列；5'-CGTCT AGCGTTGCCG AAAAC GGCAA CGCTA GACG-3'(SEQID NO.2，PB1-1)。根据使用UNAFOLD程序模拟，该序列在1M KC1及1μM序列浓度下具有91.4℃的解链温度。

PB2的一个实例具有5'-GACCC TGCCC CCAGC TTTCC CCAAA CGTCA AAAAA-3'的序列(SEQ ID NO.3，PB2-2)，并且根据使用UNAFOLD程序模拟，所形成的BS2-2为如下所示的包含3个茎、3个双链体、2个环的分子:

使用UNAFOLD程序得到BS2-2的以下特征:

△G＝-4.5140kcal/mol，在5℃下(100％折叠)，

△H＝-67.90kcal/mol，

△S＝-227.9cal/(K·mol)，且

Tm＝24.8083℃。

使用最近邻法获得计算的BS2-1的解链曲线。该解链曲线表明在30℃以上约90％的结构为线性(PB2-2)，而在低于20℃时约90％的结构形成BS2-2。这种陡峭的解链曲线显示了BS2-2的控制良好的大体积结构形成，这是非常期望的。在5℃下BS2-2的△G为-4.5kcal/mol，这表明了比实施例1中的5碱基发夹分子BS2-1更强的结合亲和力。

实施例3.4-碱基双链体区段引起的DNA停顿

该实施例说明4-碱基双链体区段使单链测试DNA在纳米孔中停顿足以获得所需序列信息的停留时间。

测试DNA如下：

通过DNA-1：5'-CCCCC CCCCC GCGC-3'(SEQ ID NO.4)的自杂交形成测试DNA。将DNA-1溶解于生物级的水中，加热至90℃，然后使其冷却至室温以进行自杂交。一个DNA-1分子与另一个DNA-1分子杂交以形成在3’端具有4-碱基GCGC双链体区段并且在其5’端具有两个突出的ss 10-C尾的自杂交的DNA-1结构。在工作条件下，自杂交的DNA-1结构进入纳米孔，3’端的4-碱基双链体区段使两个突出的ss 10-C尾之中的一个在纳米孔中停顿一段停留时间，然后当4-碱基双链体区段解离时，自杂交的DNA-1结构转变为两个ss DNA-1分子，这两个分子单链测试DNA一样通过纳米孔。因此，当流动通过纳米孔时，自杂交的DNA-1结构模拟具有通过减速物和单链测试DNA形成的4-碱基双链体区段的单链测试DNA。

利用此处关于形成自杂交的DNA-1所述的相同的方法，通过DNA-2：5'-TTTTTTTTTT GCGC-3'(SEQ ID NO.5)的自杂交形成另一测试DNA，即自杂交的DNA-2结构。自杂交的DNA-2结构在3’端具有4-碱基GCGC双链体并且在5’端具有两个突出的ss 10-T尾。

另一个测试DNA为通过在如下所述的条件下温育DNA-3：5'-TTTTT TTTTT TTTTTTTTTT TTTTT TTTTT TTTTT TTTTT-生物素-3'(SEQ ID NO.6)和链霉亲和素而形成的链霉亲和素-DNA-3复合物。当在一电势下流动通过纳米孔时，链霉亲和素-DNA-3复合物在纳米孔中停顿，直到电势被改变/逆转。因此，链霉亲和素-DNA-3复合物充当阳性对照，显示纳米孔检测器系统工作正常。该分子的停留时间相对较长。

工作条件为在0℃下的20mM HEPE缓冲液和1M的KC1。所施加的电势为约128mV。

如通过引用整体并入本文的美国专利申请公开号2011/0193570所描述的，通过施加电刺激由终浓度为0.2ng/mL的沉积至双层表面上的10ng/mLα溶血素形成纳米孔。如美国申请公开号2011/0193570所描述的，采用涂抹法，在特氟隆表面上基本为平面的AgCl电极之间，由在癸烷中的10mg/mL的DPhPC形成双层。

在该实施例中，在本文所述的工作条件下，自杂交的DNA-1(2μM)、自杂交的DNA-2(2μM)、DNA-3(2μM)及链霉亲和素(1μM)与如本文所述构建的多个纳米孔一起温育约2小时。向纳米孔施加约128mV的电势，并采集电信号。电信号显示4-碱基双链体区段能够使DNA-1和DNA-2在纳米孔中停顿约100ms至200ms的停留时间。这些数据表明，短至4个碱基的减速物发挥作用，使单链测试DNA停顿足以获得相关序列信息的长时间。

实施例4.6-碱基随机减速物池引起的DNA停顿

该实施例说明6-碱基随机减速物池成功地结合至测试DNA、在纳米孔检测器中停顿并从测试DNA上解离。

在该实施例中，单链测试DNA为单链雌性基因组DNA。随机减速物池包含从Invitrogen购买的具有基本DNA核苷酸的所有组合的六聚体DNA寡核苷酸。

工作条件为在0℃下的20mM HEPE缓冲液和1M KC1。所施加的电势为约128mV。

如通过引用整体并入本文的美国专利申请公开号2011/0193570所描述的，通过施加电刺激由终浓度为0.2ng/mL的沉积至双层表面上的10ng/mLα溶血素形成纳米孔。如通过引用整体并入本文的美国专利申请公开号2011/0193570所描述的，采用涂抹法，在特氟隆表面上基本为平面的AgCl电极之间，由在癸烷中的10mg/mL的DPhPC形成双层。

该实施例中，在本文所述的工作条件下，单链测试DNA(1μM)与6-碱基随机减速物池(100μM)温育，与如本文所述构建的多个纳米孔一起温育约2h。向纳米孔施加约128mV的电势并采集电信号。信号显示，如本文所述，6-碱基随机减速物池能够结合至单链测试DNA，使单链测试DNA在纳米孔中停顿足以获得相关序列信息的长时间，并从如本文所述的单链测试DNA上解离。

实施例5.包含样品多核苷酸及其反义多核苷酸的测试多核苷酸的制备

A.样品多核苷酸为双链样品DNA

双链(ds)测试多核苷酸可通过常规的DNA连接技术形成。如图28所示，双链样品多核苷酸可与接头部分的双链体部分和前大体积部分的双链体部分连接。然后可使双链测试多核苷酸变性(例如加热)以提供单链测试多核苷酸(图28)。

B.样品多核苷酸为单链样品DNA

可采用本领域公知的常规方法由单链样品DNA制备双链样品DNA。可根据此处关于双链样品DNA所述的方法进一步处理双链样品DNA。

C.样品多核苷酸为单链样品RNA

可采用本领域公知的常规方法由单链样品RNA制备双链样品DNA-RNA杂合体。然后可根据此处关于双链样品DNA所述的相似的方法进一步处理双链样品DNA-RNA杂合体。

D.由单链样品多核苷酸(ss DNA或ss RNA)制备双链测试多核苷酸中的酶方法

如果提供的样品为ds DNA，可使ds DNA变性以提供将在该酶方法中使用的单链样品DNA：

D1)将特定的钩形引物连接至单链样品多核苷酸的3’端，其中钩形引物包含发夹结构，可与单链样品多核苷酸的3’端形成双链体部分的3'突出端部分。如果样品多核苷酸的结构是完全未知的，则钩形引物的3'突出端可包含可与任何寡核苷酸序列相互作用的几个通用核苷酸(例如2、3、4、5、6、7或8个或更多个核苷酸)。

D2)钩形引物的5'端距离单链样品多核苷酸的3’端可具有缺口，该缺口可用酶在本领域已知的单一温度延伸反应中连接/补平。

D3)从步骤D2)获得的多核苷酸在一个末端上具有发夹结构并且在另一末端上具有单链部分。该单链部分用作模板，以在本领域已知的单一温度延伸反应中采用酶使多核苷酸从钩形引物的3’端延伸。当延伸完全时，多核苷酸在一个末端具有平端并且在另一末端具有发夹。

D4)将从步骤D3)得到的多核苷酸通过平端连接与图28所示的前大体积部分连接。如果前大体积部分具有生物素附接，则可通过将生物素附接至磁性链霉亲和素珠上来分离所获得的多核苷酸。也可使用其他类型的相互作用，例如抗体-抗原相互作用，来分离所需的多核苷酸。

D5)将所需的多核苷酸从链霉亲和素珠上分离并移除，并在必要时使其变性为相应的单链测试多核苷酸。

使用发夹引物中的特异性杂交序列及使用附接至一个或多个前大体积结构(其平端连接至新形成的双链体样品)的生物素分子的方法提供了一种针对被发夹引物所靶向的特异性样品片段而选择性地富集样品的方法。当在发夹引物分子中使用通用多核苷酸时，单个发夹引物或仅几个变异发夹引物可用于从样品中的所有链产生有义/反义样品。这样的方法可能会失去关于样品在3'端的相应反义结构的信息，但它使得由大量不同的核酸分子生成制备好的样品成为可能。

E.通过单链连接由单链样品多核苷酸(ss DNA或ss RNA)制备双链测试多核苷酸中的酶方法

E1.通过衔接体促进的样品的连接

A)通过衔接体促进

将单链样品多核苷酸与特异性引物(衔接体)或通用衔接体杂交至样品分子的3’端上，以使5’突出端存在于杂交的衔接体上。向衔接体的该突出端上连接另一多核苷酸，该另一多核苷酸包含发夹结构，并构建为使得发夹的3’端与衔接体的5’端接触并且发夹的5’端与原始单链样品多核苷酸的3’端接触。该衔接体包含突出端部分，该突出端部分可含有能与全部或部分为发夹核酸链的单独的分子特异性结合的如本文所定义的核苷酸。该衔接体还可包含针对特定样品链序列的特异性序列的部分，或者它可含有当制成衔接体文库时可与任何样品链结合的随机序列，或者它可含有允许衔接体与任何样品链结合的通用碱基或正常碱基与通用碱基的组合。这些潜在的核苷酸的组合是重要的，因为它们允许在衔接体中使用特异性核苷酸的情况下针对特异性序列富集样品，或者它们允许由样品中的所有样品单链核酸普遍生成有义/反义链。在任何情况下，该衔接体的突出端部分可被创建为与人造DNA结合，而不与天然DNA结合，从而使仅被添加的具有突出端以及具有适当的互补核酸或核酸类似物的发夹分子将与发夹或部分发夹分子结合。这可例如通过使用isodG和isodC核苷酸来实现。然后可将充分杂交的复合物在上述两个位置连接到一起，并且该分子准备用于反义延伸。

单链样品多核苷酸也可转变成具有选择的前大体积结构的有义-反义表现形式，这些选择的前大体积结构通过衔接体和发夹杂交、样品链和发夹连接、衔接体熔脱(melt-off)、延伸和平端连接而附接至该分子的末端。该衔接体包含突出端部分，该突出端部分可含有将与全部或部分为发夹核酸链的单独的分子特异性结合的天然或人造核苷酸。该衔接体还可包含针对特定样品链序列的特异性序列的部分，或者它可含有当制成衔接体文库时能够与任何样品链结合的随机序列，或者它可含有允许衔接体与任何样品链结合的通用碱基或正常碱基与通用碱基的组合。在任何情况下，该衔接体的突出端部分可被创建为与人造DNA结合，而不与天然DNA结合，从而使仅被添加的具有突出端以及具有适当的互补核酸或核酸类似物的发夹分子将与发夹或部分发夹分子结合。这可例如通过使用isodG和isodC核苷酸来实现。

该衔接体分子也可被创建为使得衔接体核酸链的5’端不包含使连接发生所需的三磷酸基团。在这种情形下，衔接体将仍然起到其预期的作用，即与ssDNA或ssRNA样品杂交以及与发夹分子杂交，从而使这两个分子靠近从而发生连接。然而，在没有合适的磷酸基团的情况下，将不会发生衔接体和发夹的连接。连接将发生在样品分子和发夹的末端，而不是在发夹与衔接体之间。这是令人满意的，因为随后该衔接体可被熔脱，并且随后的补平反应仍然可从新连接的发夹分子的3’继续进行，该发夹分子将适当的双链3’端呈现给延伸酶以用于延伸反应。这是有利的，因为新形成的反义链现将包含对应于所有原始样品有义链的反义核苷酸。

B)不通过衔接体促进的单链连接

连接的有义样品链和新的反义链的生成也可通过单链样品多核苷酸和包含单链突出端的发夹核酸的单链连接来完成。商购的T4连接酶可连接多核苷酸的两个分离的单链部分。随后前大体积结构的补平和平端连接以及变性(如解链)将产生制备好的有义/反义分子。

以上所有的样品制备方法对于单分子检测和测序都是理想的。尤其是对于使用单独控制的电极的阵列的纳米孔测序，每个电极控制向纳米孔施加和读取的刺激(eachelectrode controlling an applied and read stimulus to a nanopore)。多个电极/纳米孔传感器可组合成在平面或三维表面上单独控制的电极/纳米孔传感器的阵列，例如，可使用半导体领域熟知的技术将其构建在半导体材料之上或之内。

在将发夹连接至单链样品核酸链之后，以下详述了完成为纳米孔测序和或检测准备的有义/反义/前大体积结构样品分子的实施例。

E2)通过诸如Klenow的补平酶由从步骤(E1)得到的多核苷酸合成反义链，以提供在一个末端上具有发夹结构并且在另一末端上具有平端的多核苷酸。

E3)将从步骤E2)得到的多核苷酸通过平端连接与图28所示的前大体积部分连接。如果前大体积结构的一条或多条链具有生物素附接，则可通过将生物素附接至磁性链霉亲和素珠来分离所获得的多核苷酸。也可使用其他类型的相互作用，例如抗体-抗原相互作用，来分离所需的多核苷酸。

E4)将所需的多核苷酸从链霉亲和素珠上分离并移除，并在必要时使其变性为相应的单链测试多核苷酸。

实施例6.通过DNA纳米孔检测以大于99％的置信度获得单核苷酸差异 (differentiation)

合成DNA-TA

(5’-TTTTTTTTTTTTTTTTTTTTTTTTTTTTATTTTTTTTTTT-生物素-3’)、DNA-TT

(5’-TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT-生物素-3’)、DNA-TC

(5’-TTTTTTTTTTTTTTTTTTTTTTTTTTTTCTTTTTTTTTTT-生物素-3’)、DNA-TG

(5’-TTTTTTTTTTTTTTTTTTTTTTTTTTTTGTTTTTTTTTTT-生物素-3’)和含有30T的DNA-TR

(5’-TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT-生物素-3’)。将每种类型的DNA(DNA-TA、DNA-TT、DNA-TC、DNA-TG和DNA-TR)单独与链霉亲和素混合至100μM的DNA和25μM的链霉亲和素的工作浓度。然后将所得到的溶液进一步稀释至4μM的测试DNA和1.0μM的链霉亲和素的最终浓度作为DNA储备溶液。

在α溶血素纳米孔检测器上进行测试。纳米孔检测器具有一对嵌入平面特氟隆表面的银电极。采用1μL在癸烷中的15mg/mL的DPhPC脂质，通过气泡法或通过在平面电极的表面上滑动浸入少量脂质混合物中的移液管尖端来形成脂双层。采用高至1μL的在20％甘油和水中的1μg/mL的α溶血素(用20mM HEPES缓冲至pH 8.0)来制备纳米孔。或者，采用1至100ng/mL的α溶血素孔蛋白来制备纳米孔。

在一个实验中，将2μL的参照DNA——链霉亲和素连接至3’端的均聚物30T(DNA-TR)——的储备溶液和2μL的选自(DNA-TA、DNA-TT、DNA-TC或DNA-TG)的测试DNA的储备溶液与40μL的1.25M KCl(pH 8.0，20mM HEPES缓冲，双过滤溶液)混合，并将4μL的生物级的水加载在此处制备的纳米孔检测器上。通过外部波形发生器施加变化的电势分布，并记录流过纳米孔的电流。向纳米孔检测器的电极施加160mV的初始电势。一旦记录的电流指示纳米孔中捕获了DNA(可以是测试DNA或参照DNA(DNA-TR))，则将施加于电极的电势在2秒内从160mV线性变化至0mV。在约0mV时，施加短的负电势脉冲(约-40mV，持续0.5秒)以从孔中逐出测试分子，接着返回到+160mV的捕获电压以进行另一个捕获/读取循环。当参照DNA(DNA-TR)被捕获时，捕获的DNA在当施加的电势为约40mV时从孔中释放。当测试DNA(DNA-TA、DNA-TT、DNA-TC或DNA-TG)被捕获时，捕获的DNA在施加的电势达到约0mV后释放。因此，基于捕获的DNA从孔中释放时的电势，可将所捕获的DNA鉴定为参照DNA或一种测试DNA。每个实验在一个纳米孔上进行约30分钟。针对每种测试DNA，在三个纳米孔上重复相同的实验，从而提供12组数据。

当参照DNA被捕获于纳米孔内时由纳米孔检测器所记录的电流在此被称为参照读数。当测试DNA被捕获于纳米孔内时由纳米孔检测器所记录的电流在此被称为测试读数。对于具有测试读数和参照读数两者的一组数据，将相对于施加电势的变化的参照读数拟合成二次线。获得相对于电势变化的参照读数的中值(下文称为参照中值)。针对施加的每个电势计算每个测试读数与参照中值之间的δ电流，然后将δ电流除以参照二次拟合的导数，以得到测试读数与参照读数的比值。然后将δ电流的电导乘以100，以转变为％参照电导差。然后绘制并编译测试读数的％参照电导差相对于施加的电势(mV)的曲线。该曲线表明，如本文所述，捕获于纳米孔内的polyT DNA中的A、T、C或G的单置换能够以超过95％的置信度得到鉴定。假定除单置换的核苷酸(A、T、C和G)外其他核苷酸都不影响由纳米孔检测器获得的信号。在步骤(B6至B7)中以恒定分布或变化分布施加的电势为至少约90mV，优选至少约100mV，更优选约100mV至约160mV时，C和T以高置信度(>约99％，优选>99.5％的置信度)被确定。G和A以较低的置信度(约95％的置信度)被表征。G和A的互补结构分别为C和T。因此，确定反义链中的C'和T'也以更高的置信度(>99％、优选>99.5％的置信度)确定了样品DNA中的G'和A'。因此，与根据仅从样品DNA采集的信息确定所有4种核苷酸A、C、T和G(约95％的置信度)相比，确定样品DNA和反义链两者中的C'和T'能够以更高的置信度(>99％、优选>99.5％的置信度)提供样品DNA的结构。

当步骤(B6B7)中以恒定分布或变化分布施加的电势小于约80mV，优选小于约70mV，更优选为约0mV至约70mV时，C和A以高置信度(>约99％，优选>99.5％的置信度)被确定。G和T以较低的置信度(约95％的置信度)被表征。G和T的互补结构分别为C和A。因此，确定反义链中的C'和A'也以更高的置信度(>99％，优选>99.5％的置信度)确定了样品DNA中的G'和T'。因此，与根据仅从样品DNA采集的信息确定所有4种核苷酸A、C、T和G(约95％的置信度)相比，确定样品DNA和反义链两者中的C'和A'能够以更高的置信度(>99％，优选>99.5％的置信度)提供样品DNA的结构。因此，将从样品多核苷酸和相应的反义结构所采集的电信号集中在一起改善了分辨样品多核苷酸中的结构的置信度。

该信号可来源于如前所述的减速物读取系统，来源于如前所述的酶延伸系统，来源于如前所述的酶延伸和酶从样品读取系统中的解离，或来源于其他酶/链移动技术，包括作为实例的解旋酶链移动。解旋酶并不需要反义链的碱基延伸以在纳米孔中移动样品链，而是以线性的方式拆解DNA样品通过纳米孔以进行读取。

实施例7.通过DNA纳米孔检测获得核苷酸二聚体差异

根据实施例6中所述的方法制备DNA储备溶液，该DNA储备溶液含有1.0μM链霉亲和素和4μM的从3'端起在第12位具有单核苷酸置换的PolyA₄₀DNA(如下所示的39A1N、DNA-AA、DNA-AT、DNA-AC和DNA-AG)、从3'端起在第12位具有单核苷酸置换的polyC₄₀DNA(如下所示的39C1N、DNA-CA、DNA-CT、DNA-CC和DNA-CG)、从3'端起在第12位具有单核苷酸置换的PolyT₄₀DNA(39T1N，如实施例6中所示)或参照DNA 30C(如下所示的DNA-CR)的DNA。

DNA-CA

5’-CCCCCCCCCCCCCCCCCCCCCCCCCCACCCCCCCCCCC-生物素-3’

DNA-CT

5’-CCCCCCCCCCCCCCCCCCCCCCCCCCTCCCCCCCCCCC-生物素-3’

DNA-CC

5’-CCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC-生物素-3’DNA-CG

5’-CCCCCCCCCCCCCCCCCCCCCCCCCCGCCCCCCCCCCC-生物素-3’DNA-AA

5’-AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA-生物素-3’

DNA-AT

5’-AAAAAAAAAAAAAAAAAAAAAAAAAAAATAAAAAAAAAAAA-生物素-3’

DNA-AG

5’-AAAAAAAAAAAAAAAAAAAAAAAAAAAAGAAAAAAAAAAAA-生物素-3’

DNA-AC

5’-AAAAAAAAAAAAAAAAAAAAAAAAAAAACAAAAAAAAAAAA-生物素-3’

DNA-TA

5’-TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTATTTTTTTTTTTTTT-生物素-3’

DNA-TT

5’-TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT-生物素-3’

DNA-TG

5’-TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTGTTTTTTTTTTTTTT-生物素-3’

DNA-TC

5’-TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTCTTTTTTTTTTTTTT-生物素-3’

DNA-CR 5’-CCCCCCCCCCCCCCCCCCCCCCCCCCCCCC-生物素-3’

使用DNA-CR作为参照DNA，针对每种测试DNA(DNA-AA、DNA-AT、DNA-AC、DNA-AG、DNA-CA、DNA-CT、DNA-CC、DNA-CG、DNA-TA、DNA-TT、DNA-TC或DNA-TG)进行与实施例6所述相似的实验，不同之处在于该实验在0℃下进行而不是在室温下进行。针对所有测试DNA的实验进行一次，并将获得的数据如实施例6所述进行处理。经编译的数据表明，在由3种不同均聚物骨架链组成的、从测试DNA的3’端起位于第11至13位的2-碱基差异可使用本文所述的变化的电势分布通过DNA纳米孔检测可靠地鉴定。在电势分布的实施例中，提供对应于具有polyA-骨架的DNA、具有polyC-骨架的DNA和具有polyT-骨架的DNA的数据。

发表的研究已表明，α溶血素孔管的上部的缩窄区域是该孔的主要缩窄区域，并且导致当DNA悬浮于孔内时的大部分电流下降。不希望受到任何理论的束缚，据估计，当DNA悬浮于孔内时，共10个核苷酸适配于α-溶血素孔管的全长。图中的读数确定了缩窄区域中的2个核苷酸，但并未对孔内其余8个核苷酸的所有可能的组合获取数据。如文献中所述，电势分布的读数水平假定在测量时孔内其余8个核苷酸不会明显地影响2-核苷酸对的电流读数。

表1.核苷酸二聚体及反义链中相应的互补二聚体

电势分布表明，由于二聚体AC和TC可容易检测到，因此相应的反义二聚体GT和GA也可容易检测到。

在一个实施例中，当在步骤(B6至B7)中施加的电势(以恒定分布或变化分布施加)为至少约130mV时，电势分布(随电压(mV)变化的％参照电导差)显示了如下内容：

TG、TA和TT的信号混合在一起。TG、TA和TT的相应的反义二聚体分别为CA、TA和AA，它们容易彼此区分。

AT、AA和AG的信号混合在一起。AT、AA和AG的相应的反义二聚体分别为AT、TT和CT，它们容易彼此区分。

CG、CA和CT的信号混合在一起。CG、CA和CT的相应的反义二聚体分别为CG、TG和AG。CG和CT在约130mV或更高的电势下难以彼此区分，但在当步骤(B6至B7)中施加的电势较低(例如约100mV)时容易彼此区分。当步骤(B6至B7)中以恒定分布或变化分布施加的电势为约80mV至约120mV时：

CG、CA和CT的信号混合在一起。CG、CA和CT的相应的反义二聚体分别为CG、TG和AG，它们容易彼此区分。

因此，本文所述的方法通过表征样品DNA及其反义DNA两者提供了样品DNA的更可靠和准确的表征。

采用在相同纳米孔中针对样品多核苷酸和相应的反义结构采集的电信号降低了系统误差，并提高了分辨样品多核苷酸的结构的置信度。当样品多核苷酸为RNA且反义多核苷酸为DNA或RNA或人造核苷酸时，可预期类似的结果。

本文所述的样品制备方法简单，并且可应用于任何核酸样品。本文所述的制备方法允许在相同纳米孔传感器上复用样品。本文所述的有义/反义样品制备和读取技术可理想地或以其他方式适合于在包括阵列型单独控制纳米孔传感器的纳米孔测序仪或检测器上使用。在几乎相同的时间且在相同的纳米孔内读取样品DNA或RNA的相同区域的有义和反义链的能力降低了系统误差，并提高了对样品进行正确读取和测序的能力。如可以理解的那样，一个阵列中纳米孔传感器的数目可以较大，并且仅受限于半导体工艺技术。在单个纳米孔处以高置信度读取单个核酸样品的能力，以及在一个芯片或一个检测器上使用纳米孔传感器的阵列以大规模并行方式读取大量样品的能力，将使得简单、价格低廉且便携的DNA或RNA测序成为现实。

实施例8.使用变化的电势分布，通过DNA纳米孔检测，以大于95％的置信度将从3' 端起在第12位具有单核苷酸置换的PolyT₄₀ DNA(39T1N)彼此区分开

合成DNA-TA

(5’-TTTTTTTTTTTTTTTTTTTTTTTTTTTTATTTTTTTTTTT-生物素-3’)、DNA-TT

(5’-TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT-生物素-3’)、DNA-TC

(5’-TTTTTTTTTTTTTTTTTTTTTTTTTTTTCTTTTTTTTTTT-生物素-3’)、DNA-TG

在一个实验中，将2μL的参照DNA(DNA-TR)的储备溶液和2μL的测试DNA(DNA-TA、DNA-TT、DNA-TC或DNA-TG)的储备溶液与40μL的1M KCl(pH 8.0，20mM HEPES缓冲，双过滤溶液)混合，并将4μL的生物级的水加载在如上所制备的纳米孔检测器上。通过外部波形发生器施加变化的电势分布，并记录流过纳米孔的电流。向纳米孔检测器的电极施加160mV的初始电势。一旦记录的电流指示纳米孔中捕获了DNA(可以是测试DNA或参照DNA(DNA-TR))，则将施加于电极的电势在2秒内从160mV线性变化至0mV。在记录的电流显示所捕获的DNA从纳米孔中释放后，将施加于纳米孔检测器的电势恢复至160mV，直到下一次DNA捕获发生。当参照DNA(DNA-TR)被捕获时，捕获的DNA在当施加的电势约为40mV时释放。当测试DNA(DNA-TA、DNA-TT、DNA-TC或DNA-TG)被捕获时，捕获的DNA在施加的电势约为0mV后释放。因此，基于捕获的DNA释放时的电势，可将所捕获的DNA鉴定为参照DNA或一种测试DNA。该实验在一个纳米孔上进行30分钟。针对每种测试DNA，在三个纳米孔上重复相同的实验，从而提供12组数据。

当参照DNA被捕获于纳米孔内时由纳米孔检测器所记录的电流在此可被称为参照读数。当测试DNA被捕获于纳米孔内时由纳米孔检测器所记录的电流在此被称为测试读数。

对于具有测试读数和参照读数两者的一组数据，将相对于施加电势的变化的参照读数拟合成二次线。获得相对于电势变化的参照读数的中值(下文称为参照中值)。针对施加的每个电势计算每个测试读数与参照中值之间的δ电流，然后将δ电流除以参照二次拟合的导数，以得到测试读数与参照读数的比值。计算δ电流的电导，并乘以100，以转变为％参照电导差。然后绘制并编译测试读数的％参照电导差相对于施加的电势(mV)的曲线，以提供电势分布(曲线)。第一组曲线显示从DNA-TA获得的数据，第二组曲线显示从DNA-TG获得的数据，第三组曲线显示从DNA-TT获得的数据，第四组曲线显示从DNA-TC获得的数据。电势分布显示，如本文所述，能够以超过95％的置信度鉴定捕获于纳米孔内的polyT DNA中的A、T、C或G的单置换。

实施例2.通过向纳米孔检测器的电极施加变化的电势，经DNA纳米孔检测获得A、 T、C和G的单核苷酸差异

根据实施例8中所述的方法制备DNA储备溶液，该DNA储备溶液含有1.0μM链霉亲和素和4μM的从3'端起在第12位具有单核苷酸置换的PolyA₄₀DNA(如下所示的39A1N、DNA-AA、DNA-AT、DNA-AC和DNA-AG)、从3'端起在第12位具有单核苷酸置换的polyC₄₀DNA(如下所示的39C1N、DNA-CA、DNA-CT、DNA-CC和DNA-CG)、从3'端起在第12位具有单核苷酸置换的PolyT₄₀DNA(39T1N，如实施例8中所示)或参照DNA 30C(如下所示的DNA-CR)的DNA。

DNA-CA

5’-CCCCCCCCCCCCCCCCCCCCCCCCCCACCCCCCCCCCC-生物素-3’

DNA-CT

5’-CCCCCCCCCCCCCCCCCCCCCCCCCCTCCCCCCCCCCC-生物素-3’

DNA-CC

5’-CCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC-生物素-3’

DNA-CG

5’-CCCCCCCCCCCCCCCCCCCCCCCCCCGCCCCCCCCCCC-生物素-3’

DNA-AA

5’-AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA-生物素-3’

DNA-AT

5’-AAAAAAAAAAAAAAAAAAAAAAAAAAAATAAAAAAAAAAAA-生物素-3’

DNA-AG

5’-AAAAAAAAAAAAAAAAAAAAAAAAAAAAGAAAAAAAAAAAA-生物素-3’

DNA-AC

5’-AAAAAAAAAAAAAAAAAAAAAAAAAAAACAAAAAAAAAAAA-生物素-3’

DNA-TA

5’-TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTATTTTTTTTTTTTTT-生物素-3’

DNA-TT

5’-TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT-生物素-3’

DNA-TG

5’-TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTGTTTTTTTTTTTTTT-生物素-3’

DNA-TC

5’-TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTCTTTTTTTTTTTTTT-生物素-3’

DNA-CR 5’-CCCCCCCCCCCCCCCCCCCCCCCCCCCCCC-生物素-3’

使用DNA-CR作为参照DNA，针对每种测试DNA(DNA-AA、DNA-AT、DNA-AC、DNA-AG、DNA-CA、DNA-CT、DNA-CC、DNA-CG、DNA-TA、DNA-TT、DNA-TC或DNA-TG)进行与实施例8所述相似的实验，不同之处在于该实验在0℃下进行而不是在室温下进行。对于所有测试DNA的实验进行一次，并将获得的数据如实施例8所述进行处理。经编译的数据表明，在由3种不同均聚物骨架链组成的、从测试DNA的3’端起位于第11至13位的2-碱基差异可使用本文所述的变化的电势分布通过DNA纳米孔检测可靠地鉴定。在电势分布的实施例中，提供具有polyA-骨架的DNA的数据、具有polyC-骨架的DNA的数据和具有polyT-骨架的DNA的数据。第一组曲线来自DNA-AA、DNA-CA和DNA-TA的数据；第二组曲线来自DNA-AC、DNA-CC和DNA-TC的数据；第三组曲线来自DNA-AT、DNA-CT和DNA-TT的数据；第四组曲线来自DNA-AG、DNA-CG和DNA-TG的数据。

采用从所述的39A1N的实验中获得的数据产生显示随电压(V)变化的参照电导差百分比的电势分布图。第一组曲线从DNA-AA的数据产生；第二组曲线从DNA-AC的数据产生；第三组曲线从DNA-AT的数据产生；第四组曲线从DNA-AG的数据产生。

采用从本文所述的39C1N的实验中获得的数据产生显示随电压(V)变化的参照电导差百分比的电势分布图。第一组曲线从DNA-CA的数据产生；第二组曲线从DNA-CC的数据产生；第三组曲线从DNA-CT的数据产生；第四组曲线从DNA-CG的数据产生。

采用从本文所述的39T1N的实验中获得的数据产生显示随示出的电压(V)变化的参照电导差百分比的电势分布图。第一组曲线从DNA-TA的数据产生；第二组曲线从DNA-TC的数据产生；第三组曲线从DNA-TT的数据产生；第四组曲线从DNA-TG的数据产生。

所有数据都表明，捕获于纳米孔中的均聚物DNA(polyA、polyC或polyT)中的单个A、T、C或G以超过95％的置信度得到鉴定。

尽管本发明的优选实施方案已在本文中示出和描述，但对于本领域技术人员显而易见的是，这些实施方案仅以示例的方式提供。在不脱离本发明的情况下，本领域技术人员现在将会想到多种变化、改变和替换。应当理解，在实施本发明时可采用本文所述的本发明实施方案的各种替代方案。目的在于以下述权利要求限定本发明的范围，并因此覆盖在这些权利要求的范围内的方法和结构及其等同方案。

Claims

1.一种用于鉴定分子或其部分的方法，该方法包括：

(a)提供在邻近或接近电极设置的脂双层膜中包含至少一个纳米孔的芯片，其中该电极被适配为检测通过该纳米孔的电流；

(b)传递分子或其部分接近该纳米孔或将分子或其部分插入到该纳米孔中，其中所述分子与一个或更多个减速物分子络合；

(c)跨所述纳米孔和/或跨所述脂双层膜施加包括至少两个不同电势的变化的电势分布；和

(d)测量多个不同电势下的电流以鉴定所述分子或其部分。

2.如权利要求1所述的方法，其中所述分子为聚合物分子，并且当该聚合物分子穿过或驻留于所述纳米孔中时，该聚合物分子的部分得到鉴定。

3.如权利要求2所述的方法，其中所述聚合物分子为核酸，并且所述聚合物分子的部分为核酸或成组的核酸。

4.如权利要求2所述的方法，其中所述聚合物分子为多肽，并且所述多肽的部分为氨基酸或成组的氨基酸。

5.如权利要求2所述的方法，其中借助于一个或多个减速物分子减慢所述聚合物分子通过纳米孔的速率，并且其中当所述聚合物分子的穿行速度减慢时，所述聚合物分子的部分得到鉴定。

6.如权利要求5所述的方法，其中单个减速物分子包含核糖核酸。

7.如权利要求2所述的方法，其中所述聚合物分子被捕获在纳米孔中。

8.如权利要求7所述的方法，其中使所述聚合物分子往复地穿过纳米孔以多次鉴定所述聚合物分子的至少一些部分。

9.如权利要求7所述的方法，其中所述聚合物分子为单链核酸分子，并且所述单链核酸分子被在纳米孔任意一侧形成的大体积结构捕获在纳米孔中。

10.如权利要求2所述的方法，其中以沿着所述聚合物分子长度的顺序鉴定所述聚合物分子的部分。

11.如权利要求1所述的方法，其中所述分子与核苷酸结合。

12.如权利要求11所述的方法，其中在所述核苷酸被掺入生长中的核酸链的同时，所述分子或其部分得到鉴定。

13.如权利要求11所述的方法，其中一旦所述核苷酸被掺入生长中的核酸链，所述分子即从所述核苷酸上释放。

14.如权利要求13所述的方法，其中所述分子按所述核苷酸被掺入生长中的核酸链的顺序得到鉴定。

15.如权利要求1所述的方法，其中多个不同电势下的所述电流包括电子签名，并且(d)进一步包括将所述电子签名与多个参照电子签名进行比较，以鉴定所述分子或其部分。

16.如权利要求1所述的方法，其中所述电流根据电压波形而变化。

17.如权利要求16所述的方法，其中所述电压波形为方波、正弦波、三角波、锯齿波或不规则波。

18.如权利要求1所述的方法，其中所述纳米孔为α-溶血素纳米孔或耻垢分枝杆菌孔蛋白A纳米孔。

19.如权利要求1所述的方法，其中所述芯片包含多个邻近或接近多个电极的纳米孔，并且所述电极(i)是单独寻址的，(ii)所施加的不同电势被单独控制，或者(iii)兼具(i)和(ii)。

20.如权利要求1所述的方法，其中所述分子为双链核酸分子，所述分子解离以形成一个或多个单链核酸分子，并且所述一个或多个单链核酸分子穿过纳米孔以确定所述双链核酸分子的序列。

21.如权利要求20所述的方法，其中一旦所述双链核酸分子解离，核酸发夹即连接至所述双链核酸分子的末端，以提供包含所述双链核酸分子的有义链和反义链的单链核酸分子。

22.如权利要求1所述的方法，其中所述不同电势通过向所述纳米孔和/或所述脂双层膜施加交流电(AC)波形而变化。

23.如权利要求22所述的方法，其中所述AC波形具有至少100Hz的频率。

24.一种对核酸分子或其部分进行测序的方法，该方法包括：

(a)提供包含有义链和反义链的双链核酸分子；

(b)在所述双链核酸分子的第一末端上连接第一核酸区段，其中所述第一核酸区段在所述双链核酸分子的所述第一末端将有义链与反义链相连接；

(c)将所述双链核酸分子解离以提供包含所述有义链的有义部分和所述反义链的反义部分的单链核酸分子；

(d)将一个或多个制止物与所述单链核酸分子组合；

(e)使所述单链核酸分子穿过或接近在邻近或接近电极设置的脂双层膜中的纳米孔，其中所述电极被适配为在所述单链核酸分子位于所述纳米孔中或者穿过或接近所述纳米孔时检测电流；

(f)跨所述纳米孔和/或跨所述脂双层膜施加包括至少两个不同电势的变化的电势分布；

(g)使用所述电极，在所述单链核酸分子驻留于所述纳米孔中或者穿过或接近所述纳米孔的同时获得电流测量值；和

(h)由(g)中获得的电流测量值确定所述双链核酸的序列。

25.如权利要求24所述的方法，其中所述第一核酸区段为核酸发夹。

26.如权利要求24所述的方法，其中所述第一核酸区段进一步包含第一标识符。

27.如权利要求26所述的方法，其中所述第一标识符鉴定所述双链核酸分子来源于哪个样品。

28.如权利要求24所述的方法，其进一步包括，在(b)之后将第二核酸区段连接至所述双链核酸分子的第二末端上。

29.如权利要求28所述的方法，其中所述第二核酸区段包含能够将所述单链核酸分子捕获在纳米孔中的部分。

30.如权利要求28所述的方法，其中当温度低于60℃时，所述第二核酸区段能够将所述单链核酸分子捕获在纳米孔中。

31.如权利要求28所述的方法，其中所述第二核酸区段包含第二标识符。

32.如权利要求31所述的方法，其中所述第二标识符能够用于确定所述单链核酸分子是沿着第一方向还是沿着第二方向穿过纳米孔。

33.如权利要求24所述的方法，其中借助于一个或多个减速物分子减慢所述单链核酸分子穿过或接近所述纳米孔的速度。

34.如权利要求33所述的方法，其中当所述单链核酸分子的穿行速度减慢或停顿时，获得电流测量值。

35.如权利要求34所述的方法，其中电流测量在跨所述纳米孔和/或跨所述脂双层膜施加的多个电压下进行。

36.如权利要求33所述的方法，其中所述一个或多个减速物分子的单个减速物分子包含核糖核酸。

37.一种对核酸分子或其部分进行测序的方法，该方法包括：

(a)提供单链核酸分子，所述单链核酸分子具有结合至其的一个或多个减速物；

(b)使该单链核酸分子穿过或接近在邻近或接近电极设置的脂双层膜中的纳米孔，其中所述单链核酸分子包含通过在所述有义链和反义链每一个的末端部分上连接的核酸区段与反义链偶联的有义链，并且其中所述电极被适配为在所述单链核酸分子穿过或接近所述纳米孔时检测电流；

(c)跨所述纳米孔和/或跨所述脂双层膜施加包括至少两个不同电势的变化的电势分布；

(d)借助于所述电极，在所述单链核酸分子穿过或接近所述纳米孔的同时获得电流测量值；和

(e)由(d)中获得的电流测量值来确定所述单链核酸分子的序列。

38.如权利要求37所述的方法，其中在(e)中确定所述单链核酸分子的所述序列进一步包括确定包含所述有义链和所述反义链的双链核酸分子的序列。

39.如权利要求37所述的方法，其中所述核酸区段为核酸发夹。

40.如权利要求37所述的方法，其中借助于一个或多个减速物分子减慢所述单链核酸分子穿过或接近所述纳米孔的速度。

41.如权利要求40所述的方法，其中当所述单链核酸分子的穿行速度减慢或停顿时获得电流测量值。

42.如权利要求41所述的方法，其中电流测量在跨所述纳米孔和/或跨所述脂双层膜施加的多个电压下进行。

43.如权利要求40所述的方法，其中所述一个或多个减速物分子的单个减速物分子包含核糖核酸。

44.一种对核酸分子进行测序的方法，其包括：

(a)提供在邻近或接近电极设置的脂双层膜中包含至少一个纳米孔的芯片，其中所述电极被适配为检测所述核酸分子或其部分；

(b)接触带有所述核酸分子的随机减速物池来形成具有至少一个减速物核酸分子双链体区段的减速物核酸分子复合物；

(c)引导所述核酸分子通过或接近所述纳米孔，其中借助于至少一个与所述核酸分子相缔合的核糖核酸(RNA)减速物分子，使所述核酸分子通过或接近所述纳米孔的进程停止或停顿；

(d)跨所述纳米孔和/或跨所述脂双层膜施加包括至少两个不同电势的变化的电势分布；和

(e)当所述核酸分子穿过或接近所述纳米孔时，对所述核酸分子或其部分进行测序。

45.如权利要求44所述的方法，其中所述RNA减速物分子与所述核酸分子非共价缔合。

46.如权利要求44所述的方法，其中所述RNA减速物分子包含含有一个或多个寡核苷酸碱基的序列的寡核苷酸。

47.如权利要求46所述的方法，其中所述RNA减速物分子具有最多达八个寡核苷酸碱基的长度。

48.如权利要求46所述的方法，其中所述寡核苷酸与所述核酸分子碱基配对。

49.如权利要求46所述的方法，其中所述RNA减速物分子具有通用碱基、吗啉代、乙二醇核苷酸、无碱基核苷酸、甲基化核碱基、经修饰的碱基、非结合性碱基模拟物、肽核酸(PNA)、锁定核酸或其任意组合。

50.如权利要求44所述的方法，其中所述RNA减速物分子在所述脂双层膜的顺侧与所述核酸分子相缔合。

51.如权利要求44所述的方法，其中所述RNA减速物分子在所述脂双层膜的反侧与所述核酸分子相缔合。

52.如权利要求44所述的方法，其中所述RNA减速物分子在所述脂双层膜的顺侧与所述核酸分子相关联，并且另一RNA减速物分子在所述脂双层膜的反侧与所述核酸分子相缔合。

53.如权利要求44所述的方法，其中当所述核酸分子穿过纳米孔时，所述RNA减速物分子从所述核酸分子上解离。

54.如权利要求44所述的方法，其中所述纳米孔为α-溶血素纳米孔。

55.如权利要求44所述的方法，其中所述核酸分子是单链的。

56.如权利要求44所述的方法，其中当所述核酸分子通过所述纳米孔的进程停止或停顿时，所述核酸分子的单碱基得到鉴定。

57.如权利要求44所述的方法，其中当所述核酸分子通过所述纳米孔的进程停止或停顿时，所述核酸分子的多达三个碱基得到鉴定。

58.如权利要求44所述的方法，其中当所述核酸分子通过所述纳米孔的进程停止或停顿时，所述核酸分子的多达五个碱基得到鉴定。

59.如权利要求44所述的方法，其中借助于多个与所述核酸分子相缔合的RNA减速物分子，使所述核酸分子通过所述纳米孔的进程停止或停顿。