JP2019528059A

JP2019528059A - バーコード化ゲノムｄｎａ断片のデノボアセンブリの方法

Info

Publication number: JP2019528059A
Application number: JP2019507862A
Authority: JP
Inventors: シャオリャンサニーシエ、; ドンシン、; チ−ハンチャン、
Original assignee: Harvard College
Current assignee: Harvard College
Priority date: 2016-08-10
Filing date: 2017-08-09
Publication date: 2019-10-10
Also published as: EP3497219A1; CN109804068A; AU2017311306A1; US20190203204A1; RU2019106038A; WO2018031631A1; EP3497219A4; CA3033506A1

Abstract

本開示は、バーコード化断片を用いてゲノムＤＮＡをデノボアセンブリするための方法を提供する。

Description

関連出願情報
本出願は、２０１６年８月１０日に出願された米国仮特許出願第６２／３７３，０５７号の優先権を主張するものであり、これはあらゆる目的のためにその全体が参照により本明細書に組み込まれる。

政府の利益に関する声明
本発明は、国立衛生研究所からの５ＤＰ１ＣＡ１８６６９３に基づく政府の支援を受けてなされた。政府は本発明においてある特定の権利を有する。

本発明の実施形態は、概して、単一細胞由来のＤＮＡなどのゲノム核酸のデノボアセンブリのための方法及び組成物に関する。

デノボゲノムアセンブリは、参照配列の助けを借りずに個々の短い配列リードをより長い配列にアセンブリするプロセスである。現在、ほとんどのハイスループット配列は、ほんの数百塩基対の配列長を生成する。次いで、短い断片は、これらの断片がどこで重なり合うかを決定することによって互いに再構築される。しかし、人間などの複雑な生物のゲノムには、非常に多くの反復配列がある。それらの反復領域の多くはＤＮＡシーケンサーの読み出し長よりも長いため、ギャップなしでゲノム全体をアセンブルすることは困難である。

単一細胞ゲノム配列決定を実行する能力は、腫瘍成長、幹細胞再プログラミング、胚発生など、細胞間変動及び集団の不均一性が重要な役割を果たす研究において重要である。単一細胞ゲノム配列決定はまた、配列決定の対象となる細胞試料が貴重であるか、又は稀であるか、又は微量である場合にも重要である。正確な単一細胞ゲノム配列決定にとって重要なことは、微量となり得るゲノムＤＮＡの初期増幅である。

増幅及び配列決定後のデノボゲノムアセンブリは、全ゲノム配列決定と共に使用される多くの方法の重要な側面である。全ゲノム増幅法は、配列決定及び他の分析の前に単一細胞由来のゲノムＤＮＡを用いて当該分野で使用される一般的な方法である多重置換増幅（ｍｕｌｔｉｐｌｅｄｉｓｐｌａｃｅｍｅｎｔａｍｐｌｉｆｉｃａｔｉｏｎ；ＭＤＡ）を含む。この方法では、ランダムプライマーアニーリングに続いて、強い鎖置換活性を有するＤＮＡポリメラーゼを利用して伸長が行われる。単一細胞由来の元のゲノムＤＮＡは、カスケードのように指数関数的に増幅されて超分岐ＤＮＡ構造を形成する。単一細胞からゲノムＤＮＡを増幅する別の方法は、Ｚｏｎｇ，Ｃ．、Ｌｕ，Ｓ．、Ｃｈａｐｍａｎ，Ａ．Ｒ．、及びＸｉｅ，Ｘ．Ｓ．（２０１２）、Ｇｅｎｏｍｅ−ｗｉｄｅｄｅｔｅｃｔｉｏｎｏｆｓｉｎｇｌｅ−ｎｕｃｌｅｏｔｉｄｅａｎｄｃｏｐｙ−ｎｕｍｂｅｒｖａｒｉａｔｉｏｎｓｏｆａｓｉｎｇｌｅｈｕｍａｎｃｅｌｌ、Ｓｃｉｅｎｃｅ３３８、１６２２〜１６２６に記載されており、これは多重アニーリング及びループに基づく増幅サイクル（ＭｕｌｔｉｐｌｅＡｎｎｅａｌｉｎｇａｎｄＬｏｏｐｉｎｇ−ＢａｓｅｄＡｍｐｌｉｆｉｃａｔｉｏｎＣｙｃｌｅｓ；ＭＡＬＢＡＣ）を説明している。当技術分野において公知の別の方法は、縮重オリゴヌクレオチドプライムＰＣＲ（Ｄｅｇｅｎｅｒａｔｅｄｏｌｉｇｏｎｕｃｌｅｏｔｉｄｅ−ｐｒｉｍｅｄＰＣＲ）すなわちＤＯＰ−ＰＣＲである。単一細胞ゲノムＤＮＡと共に使用される他のいくつかの方法には、Ｃｈｅｕｎｇ，Ｖ．Ｇ．及びＳ．Ｆ．Ｎｅｌｓｏｎ、ＷｈｏｌｅｇｅｎｏｍｅａｍｐｌｉｆｉｃａｔｉｏｎｕｓｉｎｇａｄｅｇｅｎｅｒａｔｅｏｌｉｇｏｎｕｃｌｅｏｔｉｄｅｐｒｉｍｅｒａｌｌｏｗｓｈｕｎｄｒｅｄｓｏｆｇｅｎｏｔｙｐｅｓｔｏｂｅｐｅｒｆｏｒｍｅｄｏｎｌｅｓｓｔｈａｎｏｎｅｎａｎｏｇｒａｍｏｆｇｅｎｏｍｉｃＤＮＡ、ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＮａｔｉｏｎａｌＡｃａｄｅｍｙｏｆＳｃｉｅｎｃｅｓｏｆｔｈｅＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ、１９９６．９３（２５）：ｐ．１４６７６−９；Ｔｅｌｅｎｉｕｓ，Ｈ．ら、Ｄｅｇｅｎｅｒａｔｅｏｌｉｇｏｎｕｃｌｅｏｔｉｄｅ−ｐｒｉｍｅｄＰＣＲ：ｇｅｎｅｒａｌａｍｐｌｉｆｉｃａｔｉｏｎｏｆｔａｒｇｅｔＤＮＡｂｙａｓｉｎｇｌｅｄｅｇｅｎｅｒａｔｅｐｒｉｍｅｒ、Ｇｅｎｏｍｉｃｓ、１９９２．１３（３）：ｐ．７１８−２５；Ｚｈａｎｇ，Ｌ．ら、Ｗｈｏｌｅｇｅｎｏｍｅａｍｐｌｉｆｉｃａｔｉｏｎｆｒｏｍａｓｉｎｇｌｅｃｅｌｌ：ｉｍｐｌｉｃａｔｉｏｎｓｆｏｒｇｅｎｅｔｉｃａｎａｌｙｓｉｓ．ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＮａｔｉｏｎａｌＡｃａｄｅｍｙｏｆＳｃｉｅｎｃｅｓｏｆｔｈｅＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ、１９９２、８９（１３）：ｐ．５８４７−５１；Ｌａｏ，Ｋ．、Ｎ．Ｌ．Ｘｕ、及びＮ．Ａ．Ｓｔｒａｕｓ、Ｗｈｏｌｅｇｅｎｏｍｅａｍｐｌｉｆｉｃａｔｉｏｎｕｓｉｎｇｓｉｎｇｌｅ−ｐｒｉｍｅｒＰＣＲ、ＢｉｏｔｅｃｈｎｏｌｏｇｙＪｏｕｒｎａｌ、２００８、３（３）：ｐ．３７８−８２；Ｄｅａｎ，Ｆ．Ｂ．ら、Ｃｏｍｐｒｅｈｅｎｓｉｖｅｈｕｍａｎｇｅｎｏｍｅａｍｐｌｉｆｉｃａｔｉｏｎｕｓｉｎｇｍｕｌｔｉｐｌｅｄｉｓｐｌａｃｅｍｅｎｔａｍｐｌｉｆｉｃａｔｉｏｎ、ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＮａｔｉｏｎａｌＡｃａｄｅｍｙｏｆＳｃｉｅｎｃｅｓｏｆｔｈｅＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ、２００２．９９（８）：ｐ．５２６１−６；Ｌａｇｅ，Ｊ．Ｍ．ら、ＷｈｏｌｅｇｅｎｏｍｅａｎａｌｙｓｉｓｏｆｇｅｎｅｔｉｃａｌｔｅｒａｔｉｏｎｓｉｎｓｍａｌｌＤＮＡｓａｍｐｌｅｓｕｓｉｎｇｈｙｐｅｒｂｒａｎｃｈｅｄｓｔｒａｎｄｄｉｓｐｌａｃｅｍｅｎｔａｍｐｌｉｆｉｃａｔｉｏｎａｎｄａｒｒａｙ−ＣＧＨ、ＧｅｎｏｍｅＲｅｓｅａｒｃｈ、２００３、１３（２）：ｐ．２９４−３０７；Ｓｐｉｔｓ，Ｃ．ら、Ｏｐｔｉｍｉｚａｔｉｏｎａｎｄｅｖａｌｕａｔｉｏｎｏｆｓｉｎｇｌｅ−ｃｅｌｌｗｈｏｌｅ−ｇｅｎｏｍｅｍｕｌｔｉｐｌｅｄｉｓｐｌａｃｅｍｅｎｔａｍｐｌｉｆｉｃａｔｉｏｎ、ＨｕｍａｎＭｕｔａｔｉｏｎ、２００６、２７（５）：ｐ．４９６−５０３；Ｇｏｌｅ，Ｊ．ら、Ｍａｓｓｉｖｅｌｙｐａｒａｌｌｅｌｐｏｌｙｍｅｒａｓｅｃｌｏｎｉｎｇａｎｄｇｅｎｏｍｅｓｅｑｕｅｎｃｉｎｇｏｆｓｉｎｇｌｅｃｅｌｌｓｕｓｉｎｇｎａｎｏｌｉｔｅｒｍｉｃｒｏｗｅｌｌｓ、ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ、２０１３．３１（１２）：ｐ．１１２６−３２；Ｊｉａｎｇ，Ｚ．ら、Ｇｅｎｏｍｅａｍｐｌｉｆｉｃａｔｉｏｎｏｆｓｉｎｇｌｅｓｐｅｒｍｕｓｉｎｇｍｕｌｔｉｐｌｅｄｉｓｐｌａｃｅｍｅｎｔａｍｐｌｉｆｉｃａｔｉｏｎ、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ、２００５、３３（１０）：ｐ．ｅ９１；Ｗａｎｇ，Ｊ．ら、Ｇｅｎｏｍｅ−ｗｉｄｅＳｉｎｇｌｅ−ＣｅｌｌＡｎａｌｙｓｉｓｏｆＲｅｃｏｍｂｉｎａｔｉｏｎＡｃｔｉｖｉｔｙａｎｄＤｅＮｏｖｏＭｕｔａｔｉｏｎＲａｔｅｓｉｎＨｕｍａｎＳｐｅｒｍ、Ｃｅｌｌ、２０１２．１５０（２）：ｐ．４０２−１２；Ｎｉ，Ｘ．、Ｒｅｐｒｏｄｕｃｉｂｌｅｃｏｐｙｎｕｍｂｅｒｖａｒｉａｔｉｏｎｐａｔｔｅｒｎｓａｍｏｎｇｓｉｎｇｌｅｃｉｒｃｕｌａｔｉｎｇｔｕｍｏｒｃｅｌｌｓｏｆｌｕｎｇｃａｎｃｅｒｐａｔｉｅｎｔｓ、ＰＮＡＳ、２０１３、１１０、２１０８２−２１０８８；Ｎａｖｉｎ，Ｎ．、Ｔｕｍｏｒｅｖｏｌｕｔｉｏｎｉｎｆｅｒｒｅｄｂｙｓｉｎｇｌｅｃｅｌｌｓｅｑｕｅｎｃｉｎｇ、Ｎａｔｕｒｅ、２０１１、４７２（７３４１）：９０−９４；Ｅｖｒｏｎｙ，Ｇ．Ｄ．ら、Ｓｉｎｇｌｅ−ｎｅｕｒｏｎｓｅｑｕｅｎｃｉｎｇａｎａｌｙｓｉｓｏｆｌ１ｒｅｔｒｏｔｒａｎｓｐｏｓｉｔｉｏｎａｎｄｓｏｍａｔｉｃｍｕｔａｔｉｏｎｉｎｔｈｅｈｕｍａｎｂｒａｉｎ、Ｃｅｌｌ、２０１２．１５１（３）：ｐ．４８３−９６；並びにＭｃＬｅａｎ，Ｊ．Ｓ．ら、ＧｅｎｏｍｅｏｆｔｈｅｐａｔｈｏｇｅｎＰｏｒｐｈｙｒｏｍｏｎａｓｇｉｎｇｉｖａｌｉｓｒｅｃｏｖｅｒｅｄｆｒｏｍａｂｉｏｆｉｌｍｉｎａｈｏｓｐｉｔａｌｓｉｎｋｕｓｉｎｇａｈｉｇｈ−ｔｈｒｏｕｇｈｐｕｔｓｉｎｇｌｅ−ｃｅｌｌｇｅｎｏｍｉｃｓｐｌａｔｆｏｒｍ、ＧｅｎｏｍｅＲｅｓｅａｒｃｈ、２０１３．２３（５）：ｐ．８６７−７７が含まれる。全ゲノム増幅の態様に関する方法は、国際公開第２０１２／１６６４２５号パンフレット、米国特許第７，７１８，４０３号明細書、米国特許出願公開第２００３／０１０８８７０号明細書及び米国特許第７，４０２，３８６号明細書に報告されている。

しかしながら、アンプリコンがゲノムＤＮＡにデノボアセンブルされ得る、単一細胞又は少数の細胞群からなどの少量のゲノムＤＮＡを増幅するさらなる方法が必要とされている。

本開示は、断片化プロセス中に断片の隣接する末端が同じ固有の末端バーコード配列でバーコード化され、したがって配列決定された断片が後に同じ固有の末端バーコード配列を有する断片を連結することによってより大きな配列に計算的にアセンブルされ得る、ゲノムＤＮＡ断片化方法を提供する。一態様によれば、トランスポソームライブラリーは、水性媒体中でゲノムＤＮＡの断片を作製するために使用され、固有のバーコード配列が、トランスポソームのトランスポザーゼにより切断された部位で、ゲノムＤＮＡの各末端に挿入されている、又は結合している。本開示は、本明細書に記載のトランスポソームライブラリーを用いて、ゲノムＤＮＡを複数の断片、例えば５以上の断片、１０以上の断片、１００以上の断片、１０００以上の断片、１０，０００以上の断片、１００，０００以上の断片、１，０００，０００以上の断片、又は１０，０００，０００以上の断片に断片化することを企図する。一態様によれば、トランスポソームライブラリーは、５〜１０のトランスポソームメンバー、１０〜１００のトランスポソームメンバー、１００以上のトランスポソームメンバー、１０００以上のトランスポソームメンバー、１０，０００以上のトランスポソームメンバー、１００，０００以上のトランスポソームメンバー、１，０００，０００以上のトランスポソームメンバー、又は、１０，０００，００以上のトランスポソームメンバーを含む。一態様によれば、各トランスポソームは、２つのトランスポザーゼ及び２つのトランスポゾンＤＮＡを含む。トランスポゾンＤＮＡは、トランスポザーゼ結合部位、バーコード及びプライマー結合部位を含む。一態様によれば、トランスポゾンＤＮＡは、単一のトランスポザーゼ結合部位、バーコード及びプライマー結合部位を含む。各トランスポゾンＤＮＡは、トランスポザーゼ結合部位でトランスポザーゼに結合した別々の核酸である。トランスポソームは、それぞれがそれ自身のトランスポゾンＤＮＡに結合した２つの別々のトランスポザーゼの二量体である。一態様によれば、トランスポソームは、それぞれがそれ自体の対応するトランスポザーゼに結合した２つの別々の個々のトランスポゾンＤＮＡを含む。一態様によれば、トランスポソームは、わずか２つのトランスポザーゼ及びわずか２つのトランスポゾンＤＮＡを含む。一態様によれば、トランスポソームの一部としての２つのトランスポゾンＤＮＡは、それぞれがそれ自身の対応するトランスポザーゼに結合している、別々の、個々の又は連結していないトランスポゾンＤＮＡである。一例として、単一のトランスポゾン結合部位、バーコード及びプライマー結合部位を有する本明細書に記載される別個の個々のトランスポゾンＤＮＡは、トランスポソームが、対応するトランスポゾンＤＮＡに結合する、トランスポザーゼの個々の部分によってアセンブルされ得、２つのトランスポザーゼが二量体化してトランスポソームを形成し、またトランスポソームの２つのトランスポゾンＤＮＡが同じバーコード配列を有するため、微小液滴アプローチを用いて何百万ものトランスポソームの作製を可能にする。

一態様によれば、ライブラリーの各トランスポソームメンバーは、トランスポソームの各トランスポゾンＤＮＡ上に同じ配列の固有のバーコードを含む。このようにして、各トランスポソームは、トランスポソームライブラリー内の他の任意のトランスポソームのバーコード配列とは異なる一対の固有のバーコード配列を含む。一態様によれば、トランスポソームライブラリーは、同じバーコードを有するトランスポソームメンバーを含み得るが、同じバーコードを有するメンバーの数は比較的少ないか又はわずかである。このようにして、トランスポソームライブラリーは調製されたトランスポソームの集合のサブセットであると考えることができ、各断片切断部位が固有のバーコード配列で表されるようにゲノムＤＮＡを断片化することが目的であるため、サブセットは固有のバーコード配列を有するトランスポソームのみを含む。トランスポソームライブラリーの調製により、わずかな数の切断部位が同じバーコード配列を共有し得ることが理解されるべきである。例えば、所与のライブラリー調製方法について、同じバーコード対を有するトランスポソームの複数の分子が存在することが数学的に可能であるが、ライブラリーは、異なるバーコード配列の数が実際に標的ゲノムに挿入されるトランスポソーム分子の数を有意に超えるように調製される。例えば、６，０００，０００，０００塩基対長である単一のヒト細胞全ゲノムの場合、６，０００ｂｐの平均断片長を得るためには、１，０００，０００トランスポソームが全ゲノムに挿入される必要がある。この６０００ｂｐの挿入密度に達するために、少なくとも３，０００，０００，０００分子のトランスポソームが反応混合物に添加される。１４ｂｐのランダムに合成されたバーコードの場合、４＾１４＝２６８，４３５，４５６の異なるバーコード配列があり、これはそれぞれの特定のバーコードに対して３，０００，０００，０００／２６８，４３５，４５６＝１１．２の分子のコピーがあることを意味する。しかし、同じバーコード配列を共有する分子のコピー数がいくつであっても、断片を作成するために同じバーコード配列がゲノムに挿入されたトランスポソームの２つの分子を有する可能性は、１，０００，０００／２６８，４３５，４５６＝０．００３７である。この例を使用すると、同じバーコードタグ又は配列を有する２つの異なるゲノムＤＮＡ断片に遭遇する前に、平均して２６８の断片がバーコードによって連結され得る。トランスポソームライブラリー内の各バーコード配列が固有であることを確実にするための方法、すなわち、３，０００，０００，０００を超えるバーコード配列をはじめとする方法が存在する。

一態様によれば、他のサイズのゲノムについては、使用されるバーコードの数はそれに応じて増減することができ、ゲノム中の塩基対の総数を所望の断片サイズで割ったものによって決定される。例えば、約５０，０００塩基対を有するラムダファージなどの小さなゲノムの場合、６，０００ｂｐの平均断片長を有する場合には９つのバーコードのみがゲノムへの挿入に必要であり、したがってそれぞれ固有に紐付けされたバーコードを有する９つのトランスポソームのみがゲノムへの挿入に必要である。一態様によれば、平均断片長はまた、より多い又はより少ない数のトランスポソームを使用することによってより小さく又はより大きくなるように調整することもでき、これは、それぞれより高濃度又はより低濃度のトランスポソーム溶液を使用することによって達成され得る。目標平均断片長がより短く、したがって総断片数が大きくなると予測される場合、使用されるべきバーコードの数は、固有のバーコード化を達成するためにより大きくなるように調整され得、またその逆も可能である。

したがって、一態様によれば、実質的に全ての切断部位が固有のバーコード配列によって表され、したがって、実質的に全ての断片がデノボアセンブルされ得る。一態様によれば、切断部位の９０％超が固有のバーコード配列によって表され、切断部位の９５％超が固有のバーコード配列によって表され、切断部位の９６％が固有のバーコード配列によって表され、切断部位の９７％が固有のバーコード配列によって表され、切断部位の９８％が固有のバーコード配列によって表され、切断部位の９９％が固有のバーコード配列によって表され、切断部位の９９．５％が固有のバーコード配列によって表され、又は切断部位の１００％が固有のバーコード配列によって表される。

次いで、トランスポソームライブラリーを使用してゲノムＤＮＡが切断され、各トランスポソームは、トランスポゾンＤＮＡ内のバーコード配列（固有のバーコード配列など）を切断部位の両端に挿入又は結合させる。このようにして、切断部位の隣接する末端は、バーコード配列をマッチングさせることによって後に識別され得、隣接する末端は、計算的に互いに結合され得る。一態様によれば、トランスポソームライブラリーによって産生される断片は、断片の各末端に、固有のバーコード配列対などのバーコード配列対のうちの一方を有する。一態様によれば、トランスポソームライブラリーによって産生される断片はそれぞれ、断片の各末端に、固有のバーコード配列対などのバーコード配列対のうちの一方を有する。断片が増幅され配列決定された後、断片の末端は、ゲノムＤＮＡをデノボアセンブルするためにバーコードをマッチングさせることにより計算的に互いに連結され得る。したがって、トランスポザーゼを使用して断片に結合したバーコード配列をマッチングさせることにより核酸断片を連結するための方法が提供される。

一態様によれば、トランスポソームのトランスポゾンＤＮＡは、増幅方法を容易にする配列、例えば、断片が当業者に公知の方法を使用したＰＣＲ又はＲＮＡ転写などにより配列決定の前に増幅され得るように、断片に結合され得る特定のプライマー配列又は転写配列を含み得る。本開示は、断片を増幅するための様々な増幅方法及びアンプリコンを配列決定するための様々な配列決定方法を企図し、デノボゲノムアセンブリのための方法は、いかなる特定の増幅又は配列決定方法にも限定されないことが理解されるべきである。

本開示の実施形態は、少量のゲノムＤＮＡ又は限られた量のＤＮＡ、例えば単一細胞か、同じ細胞型の複数の細胞から得られた、又は個体若しくは基質から得られた組織、体液若しくは血液試料から得られた、ゲノム配列（単数又は複数）などのＤＮＡのデノボアセンブリの方法に関する。本開示のある特定の態様によれば、本明細書に記載の方法は、単一の反応混合物を用いて単一の管内で行うことができる。本開示のある特定の態様によれば、核酸試料は、単一細胞由来の未精製又は未処理の溶解物中にあってもよい。本明細書に開示されている方法に供される核酸は、様々な試薬と接触させる前及び本明細書に記載されている様々な条件下で、例えばカラム精製によって精製される必要はない。本明細書に記載のバーコード方法は、ハイスループット配列決定のための増幅されたＤＮＡを産生する、単一細胞の全ゲノムの実質的かつ均一な範囲を提供するのを助けるために、断片化ＤＮＡのデノボアセンブリを補助する。

本発明の実施形態は、一般に、ＤＮＡ断片、例えば単一細胞の全ゲノム由来のＤＮＡ断片を作製するための方法及び組成物に関し、これらは次いで、当業者に公知の、及び本明細書に記載の増幅及び配列決定法に供され得る。ある特定の態様によれば、本明細書に記載の核酸断片を作製する方法は、トランスポソームライブラリーを利用する。一態様によれば、トランスポソームの一部としてのトランスポザーゼは、一組の二本鎖ゲノムＤＮＡ断片を形成するために使用される。ある特定の態様によれば、トランスポザーゼは、トランスポゾンＤＮＡに結合し、反応容器内又は反応容積内に配置される場合など、互いに接触したときに二量体化して、トランスポソームと呼ばれるトランスポザーゼ／トランスポゾンＤＮＡ複合体二量体を形成する能力を有する。トランスポソームの各トランスポゾンＤＮＡは、二本鎖トランスポザーゼ結合部位と、トランスポソームに固有のバーコード配列及び増幅促進配列（例えば特異的プライミング部位（「プライマー結合部位」）又は転写プロモーター部位）を含む第１の核酸配列と、を含む。第１の核酸配列は、一本鎖伸長の形態であってもよい。トランスポソームライブラリーの各トランスポソームは、トランスポソームライブラリーの残りの各メンバーのバーコード配列とは異なる固有のバーコード配列を含む。

トランスポソームは、二本鎖ゲノムＤＮＡなどの二本鎖核酸に沿って並ぶ標的位置群にランダムに結合し、トランスポソーム及び二本鎖ゲノムＤＮＡを含む複合体を形成する能力を有する。トランスポソーム中のトランスポザーゼは二本鎖ゲノムＤＮＡを切断し、１つのトランスポザーゼが上側の鎖を切断し、１つのトランスポザーゼが下の鎖を切断する。トランスポソーム中の各トランスポゾンＤＮＡは、切断部位の各末端で二本鎖ゲノムＤＮＡに結合しており、すなわち、トランスポソームの一方のトランスポゾンＤＮＡは左側の切断部位に結合し、トランスポソームの他方のトランスポゾンＤＮＡは右側の切断部位に結合している。このようにして、左側の切断部位及び右側の切断部位は、切断部位に固有の同じバーコード配列でバーコード化される。したがって、バーコード配列は、左側の切断部位及び右側の切断部位を、デノボゲノムアセンブリのために互いに直接隣接しているものとして識別する。

ある特定の態様によれば、複数のトランスポザーゼ／トランスポゾンＤＮＡ複合体二量体、すなわちトランスポソームは、例えば二本鎖ゲノムＤＮＡに沿って並ぶ対応する複数の標的位置に結合し、次いで二本鎖ゲノムＤＮＡを複数の二本鎖断片に切断するが、各断片は、異なるバーコード配列が二本鎖断片の各末端に結合したトランスポゾンＤＮＡを有する。このようにして、上記の説明と一致して、同じバーコード配列を有する断片の対応する末端を同定し、断片の末端を互いに計算的に連結することにより、各断片が計算的に順番に配置され得る。

一態様によれば、トランスポゾンＤＮＡは、二本鎖ゲノムＤＮＡに結合しており、ゲノムＤＮＡの１つの鎖とトランスポゾンＤＮＡの１つの鎖との間に一本鎖ギャップが存在する。一態様によれば、ギャップを埋めて二本鎖ゲノムＤＮＡと二本鎖トランスポゾンＤＮＡとの間に二本鎖接続を形成するために、ギャップ伸長が行われる。一態様によれば、トランスポザーゼ結合部位、バーコード配列、及びトランスポゾンＤＮＡの増幅促進配列を含む核酸配列が、二本鎖断片の各末端に結合している。ある特定の態様によれば、トランスポザーゼは、二本鎖断片の各末端に結合しているトランスポゾンＤＮＡに結合している。一態様によれば、トランスポザーゼは、二本鎖ゲノムＤＮＡ断片の各末端に結合しているトランスポゾンＤＮＡから除去される。

本開示の一態様によれば、異なるバーコード配列が二本鎖ゲノムＤＮＡ断片の各末端に結合したトランスポゾンＤＮＡを有するトランスポザーゼによって産生される二本鎖ゲノムＤＮＡ断片は、次いで、トランスポゾンＤＮＡをテンプレートとして用いてギャップが埋められ伸長される。したがって、二本鎖ゲノムＤＮＡ断片、並びに二本鎖ゲノムＤＮＡの両端に異なるバーコード配列及び増幅促進配列を含む二本鎖トランスポゾンＤＮＡを含む二本鎖核酸伸長産物が生成される。

この段階で、ゲノムＤＮＡ断片、各末端の異なるバーコード、及び増幅促進配列を含む二本鎖核酸伸長産物は、ゲノムＤＮＡ断片及び各末端の異なるバーコードのアンプリコンを生成するために当業者に知られている方法を用いて増幅され得る。増幅促進配列は、二本鎖ゲノムＤＮＡの各末端の特異的プライマー結合部位であってもよい。「特異的」プライマー結合部位への言及は、２つのプライマー結合部位が同じ配列を有し、したがって共通の配列のプライマーが全ての断片の増幅に使用され得ることを示す。ＰＣＲプライマー配列及び試薬が増幅に使用され得る。増幅促進配列は、ＲＮＡ転写物の産生のためのＲＮＡポリメラーゼ結合部位であってもよく、次いでＲＮＡ転写物は線形増幅のためにｃＤＮＡに逆転写されてもよい。ゲノムＤＮＡ断片、各末端の異なるバーコード及び増幅促進配列を含む二本鎖核酸伸長産物は、増幅試薬と組み合わされてもよく、次いで二本鎖ゲノム核酸断片は、二本鎖ゲノム核酸断片のアンプリコンを製造するために、当業者に公知の方法を用いて増幅されてもよい。

次いで、アンプリコンは、さらなる分析の前に収集及び／又は精製され得る。アンプリコンは、当業者に公知の方法を用いて配列決定され得る。一旦配列決定されると、配列は、同じバーコード配列を有する断片末端を同定するために計算的に分析され得、断片末端は、ゲノムＤＮＡのデノボアセンブリのためのより長い配列を形成するために互いに計算的に結合され得る。一実施形態において、ゲノムＤＮＡが２つ以上の倍数性を有する単一細胞に由来する場合、ゲノムのデノボアセンブリは、固有のバーコード配列が２つの対立遺伝子の各断片の各断片末端に挿入される際、ハプロタイプ分解デノボアセンブリを達成することができる。

本開示の実施形態は、本明細書に記載のバーコード化断片を使用してＤＮＡを増幅する方法に関し、ＤＮＡは、少量のゲノムＤＮＡ又は限られた量のＤＮＡ、例えば単一細胞か、同じ細胞型の複数の細胞から得られた、又は個体若しくは基質から得られた組織、体液若しくは血液試料から得られた、ゲノム配列（単数又は複数）である。本開示のある特定の態様によれば、本明細書に記載の方法は、バーコード化断片を形成するために単一管内で行われてもよく、次いでバーコード化断片は、当業者に公知のハイスループット配列決定プラットフォームを使用して増幅及び配列決定され、次いで、当業者に公知の方法及びソフトウェアを使用して、元の核酸配列の隣接する断片間の切断部位又は断片化部位を指定するバーコード配列をマッチングさせることによって計算的に末端同士が結合される。

本明細書に記載のトランスポソーム断片化及びバーコード化方法は、少量の又は限られた量のＤＮＡの増幅、配列決定及びデノボアセンブリに有用である。本明細書に記載の方法は、腫瘍及び神経塊などの極めて不均一な細胞集団を特徴とする生物系又は組織試料において特に用途がある。バーコード化ゲノムＤＮＡ断片を増幅及び配列決定するための本明細書に記載の方法は、当業者に公知及び本明細書に記載の次世代配列決定技術を使用して、そのような増幅ＤＮＡの分析及びデノボアセンブリを容易にする。本明細書に記載の方法は、遺伝的に不均一な組織（例えばがん）、希少かつ貴重な試料（例えば胚性幹細胞）、及び非分裂細胞（例えばニューロン）などを含む様々なＤＮＡ材料源、並びに当業者に公知の配列決定プラットフォーム及び遺伝子型決定方法を利用することができる。

本開示のある特定の実施形態のさらなる特徴及び利点は、以下の実施形態の説明及びその図面、並びに特許請求の範囲からより完全に明らかとなる。

本発明の前述及び他の特徴及び利点は、添付の図面と併せて以下の例示的な実施形態の詳細な説明からより完全に理解される。

図１は、５’伸長が線形であるトランスポゾンＤＮＡの構造を概略的に示した図であり、Ｔは二本鎖トランスポザーゼ結合部位であり、Ｐは伸長部の一端でのプライミング部位であり、Ｂはバーコード配列である。図２は、トランスポソームを自発的に形成するトランスポザーゼ及びトランスポゾンＤＮＡの一般的な実施形態の概略図であり、これは液滴又は他の形成媒体内で生じ得る。図３は、トランスポソームのゲノムＤＮＡへの結合、断片への切断、並びにプライマー結合部位（紫色）、トランスポザーゼ結合部位（水色）及び各トランスポソームに異なる色で表される固有のバーコード配列を含むトランスポゾンＤＮＡの付加又は挿入の概略図である。図４は、ゲノムＤＮＡ、プライマー結合部位、バーコード配列及びトランスポザーゼ結合部位を含む核酸伸長産物を形成するための、トランスポザーゼ除去、ギャップフィリング及び伸長の概略図である。図５は、短い配列決定リードをより長い連続配列に連鎖するためのバーコードの使用の概略図である。図６は、リンカーによってそれに結合した複数のトランスポゾンＤＮＡを有し、微粒子又はビーズからのトランスポゾンＤＮＡの切断のための切断部位を有する微粒子又はビーズを示す図である。図７は、特定のバーコードを有するトランスポゾンＤＮＡを含有する微粒子を単離するための微小液滴の使用、及び各微小液滴内に同じバーコード対を有するトランスポソームの形成の概略図である。図８は、バーコード化トランスポソームを調製する際に使用するためのマイクロ流体回路の概略図である。図９は、二倍体ゲノムの２つの対立遺伝子への異なる対のバーコードを担持するトランスポソームの挿入及びゲノムのハプロタイピングの概略図である。

ある特定の実施形態の実践又はある特定の実施形態の特徴は、他に示されない限り、当技術分野の通常の技術内である分子生物学、微生物学、組換えＤＮＡなどの従来の技術を使用し得る。そのような技術は、文献において十分に説明されている。例えば、Ｓａｍｂｒｏｏｋ、Ｆｒｉｔｓｃｈ、及びＭａｎｉａｔｉｓ、ＭＯＬＥＣＵＬＡＲＣＬＯＮＩＮＧ：ＡＬＡＢＯＲＡＴＯＲＹＭＡＮＵＡＬ、ＳｅｃｏｎｄＥｄｉｔｉｏｎ（１９８９）、ＯＬＩＧＯＮＵＣＬＥＯＴＩＤＥＳＹＮＴＨＥＳＩＳ（Ｍ．Ｊ．Ｇａｉｔ編、１９８４）、ＡＮＩＭＡＬＣＥＬＬＣＵＬＴＵＲＥ（Ｒ．Ｉ．Ｆｒｅｓｈｎｅｙ編、１９８７）、ＭＥＴＨＯＤＳＩＮＥＮＺＹＭＯＬＯＧＹシリーズ（ＡｃａｄｅｍｉｃＰｒｅｓｓ，Ｉｎｃ．）、ＧＥＮＥＴＲＡＮＳＦＥＲＶＥＣＴＯＲＳＦＯＲＭＡＭＭＡＬＩＡＮＣＥＬＬＳ（Ｊ．Ｍ．Ｍｉｌｌｅｒ及びＭ．Ｐ．Ｃａｌｏｓ編、１９８７）、ＨＡＮＤＢＯＯＫＯＦＥＸＰＥＲＩＭＥＮＴＡＬＩＭＭＵＮＯＬＯＧＹ（Ｄ．Ｍ．Ｗｅｉｒ及びＣ．Ｃ．Ｂｌａｃｋｗｅｌｌ編）、ＣＵＲＲＥＮＴＰＲＯＴＯＣＯＬＳＩＮＭＯＬＥＣＵＬＡＲＢＩＯＬＯＧＹ（Ｆ．Ｍ．Ａｕｓｕｂｅｌ、Ｒ．Ｂｒｅｎｔ、Ｒ．Ｅ．Ｋｉｎｇｓｔｏｎ、Ｄ．Ｄ．Ｍｏｏｒｅ、Ｊ．Ｇ．Ｓｉｅｄｍａｎ、Ｊ．Ａ．Ｓｍｉｔｈ及びＫ．Ｓｔｒｕｈｌ編、１９８７）、ＣＵＲＲＥＮＴＰＲＯＴＯＣＯＬＳＩＮＩＭＭＵＮＯＬＯＧＹ（Ｊ．Ｅ．ｃｏｌｉｇａｎ、Ａ．Ｍ．Ｋｒｕｉｓｂｅｅｋ、Ｄ．Ｈ．Ｍａｒｇｕｌｉｅｓ、Ｅ．Ｍ．Ｓｈｅｖａｃｈ及びＷ．Ｓｔｒｏｂｅｒ編、１９９１）、ＡＮＮＵＡＬＲＥＶＩＥＷＯＦＩＭＭＵＮＯＬＯＧＹ、並びにＡＤＶＡＮＣＥＳＩＮＩＭＭＵＮＯＬＯＧＹなどの雑誌のモノグラフを参照されたい。上記及び下記の本明細書に記載の全ての特許、特許出願、及び刊行物は、参照により本明細書に組み込まれる。

本明細書において使用される核酸化学、生化学、遺伝学、及び分子生物学の用語及び記号は、当分野における標準的な論文及びテキスト、例えば、Ｋｏｒｎｂｅｒｇ及びＢａｋｅｒ、ＤＮＡＲｅｐｌｉｃａｔｉｏｎ、ＳｅｃｏｎｄＥｄｉｔｉｏｎ（Ｗ．Ｈ．Ｆｒｅｅｍａｎ、ＮｅｗＹｏｒｋ、１９９２）、Ｌｅｈｎｉｎｇｅｒ、Ｂｉｏｃｈｅｍｉｓｔｒｙ、ＳｅｃｏｎｄＥｄｉｔｉｏｎ（ＷｏｒｔｈＰｕｂｌｉｓｈｅｒｓ、ＮｅｗＹｏｒｋ、１９７５）、Ｓｔｒａｃｈａｎ及びＲｅａｄ、ＨｕｍａｎＭｏｌｅｃｕｌａｒＧｅｎｅｔｉｃｓ、ＳｅｃｏｎｄＥｄｉｔｉｏｎ（Ｗｉｌｅｙ−Ｌｉｓｓ、ＮｅｗＹｏｒｋ、１９９９）、Ｅｃｋｓｔｅｉｎ、編集者、ＯｌｉｇｏｎｕｃｌｅｏｔｉｄｅｓａｎｄＡｎａｌｏｇｓ：ＡＰｒａｃｔｉｃａｌＡｐｐｒｏａｃｈ（ＯｘｆｏｒｄＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ、ＮｅｗＹｏｒｋ、１９９１）、Ｇａｉｔ、編集者、ＯｌｉｇｏｎｕｃｌｅｏｔｉｄｅＳｙｎｔｈｅｓｉｓ：ＡＰｒａｃｔｉｃａｌＡｐｐｒｏａｃｈ（ＩＲＬＰｒｅｓｓ，Ｏｘｆｏｒｄ，１９８４）などのものに従う。

本発明は、トランスポザーゼ又はトランスポソームを用いて、ゲノムＤＮＡなどの元の又は出発核酸配列を断片化し、バーコード配列を切断又は断片化部位の各末端に結合させ、デノボアセンブリプロセスの一部としての後の断片配列の計算的再結合を容易にするために、ＤＮＡ又はゲノムＤＮＡなどから核酸断片鋳型を作製する方法の発見に部分的に基づく。本明細書に記載の方法は、「トランスポゾン挿入を介したチェーンアノテーション（ｃｈａｉｎａｎｎｏｔａｔｉｏｎ）」又は「ＣＨＩＡＮＴＩ」と呼ばれることがある。バーコード化核酸断片鋳型は、アンプリコンを生成するために増幅される。核酸断片鋳型のアンプリコンは、収集及び配列決定され得る。収集されたアンプリコンは、ゲノムＤＮＡなどの元の核酸の断片のアンプリコンのライブラリーを形成する。

一態様によれば、溶解した単一細胞から得られるゲノム核酸などのゲノムＤＮＡが得られる。ゲノムＤＮＡを二本鎖断片に切断するために、複数のトランスポソーム又はトランスポソームのライブラリーが使用される。複数のトランスポソーム又はトランスポソームのライブラリーの各トランスポソームは、トランスポゾンＤＮＡに結合したトランスポザーゼの二量体であり、すなわち、各トランスポソームは２つの別々のトランスポゾンＤＮＡを含む。トランスポソームの各トランスポゾンＤＮＡは、トランスポザーゼ結合部位、トランスポソームに固有のバーコード配列、及び特異的プライマー結合部位などの増幅促進配列を含む。

トランスポソームの各トランスポゾンＤＮＡのバーコード配列は同じ配列であり、トランスポソームに固有のものである。複数のトランスポソーム又はトランスポソームのライブラリーの各トランスポソームは、複数のトランスポソーム又はトランスポソームライブラリーの残りのメンバーとは異なるそれ自身の固有の代表的バーコード配列を有する。トランスポゾンＤＮＡは、各切断部位又は断片化部位で各二本鎖断片の上下の鎖に結合するようになる。バーコード配列は各トランスポゾンＤＮＡに対して同じであるため、切断部位又は断片化部位は、切断部位又は断片化部位に計算的に再結合するために後で同定され得る同じバーコード配列でタグ付けされる。各トランスポソームはそれ自身の固有のバーコード配列を有し、またトランスポソームのライブラリーは多くの切断又は断片化部位を形成するために使用されるため、各切断又は断片化部位はそれ自身の固有のバーコード配列を有する。したがって、元の核酸配列由来の多くの断片がトランスポソームのライブラリーによって形成され、各断片はその断片の各末端に異なるバーコードを有する。次いで、ギャップを埋めるように二本鎖断片が処理される。断片は、特定のプライマー配列、ＤＮＡポリメラーゼ及びＰＣＲ増幅用のヌクレオチドなどの適切な増幅試薬を使用して増幅され、当業者に公知の方法を使用して配列決定される。切断部位又は断片化部位を示すマッチするバーコードが同定され、マッチするバーコードは、元の核酸配列を再現するために断片を計算的に再結合するために使用される。

本明細書に記載のトランスポザーゼ法を用いて作製されたＤＮＡ断片鋳型は、当業者に公知の方法を用いて微小液滴内で増幅され得る。微小液滴は、油相及び水相のエマルションとして形成されてもよい。エマルションは、連続油相内に水性液滴又は隔離された水性体積を含んでもよい。単一細胞のゲノムの均一な増幅のために、各断片を単離するために油中の小体積水性液滴を使用する、エマルション全ゲノム増幅法が説明されている。各断片をそれ自身の液滴又は隔離された水性反応容積に分配することによって、各液滴はＤＮＡ増幅の飽和に達することが可能になる。各液滴内のアンプリコンは次いで解乳化によって併合され、その結果、単一細胞の全ゲノムの全断片の均一な増幅がもたらされる。

ある特定の態様において、増幅は、ＰＣＲを用いて達成される。ＰＣＲは、上流及び下流プライマーからなる一対のプライマー又は一組のプライマー、並びにＤＮＡポリメラーゼなどの重合触媒、並びに典型的には熱安定性ポリメラーゼ酵素を用いて標的ポリヌクレオチドの複製コピーが作られる反応である。ＰＣＲの方法は当技術分野において周知であり、例えば、ＭａｃＰｈｅｒｓｏｎら（１９９１）ＰＣＲ１：ＡＰｒａｃｔｉｃａｌＡｐｐｒｏａｃｈ（ＩＲＬＰｒｅｓｓａｔＯｘｆｏｒｄＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ）に教示されている。Ｍｕｌｌｉｓ（米国特許第４，６８３，１９５号明細書、第４，６８３，２０２号明細書、及び第４，９６５，１８８号明細書）の用語「ポリメラーゼ連鎖反応」（「ＰＣＲ」）は、クローニング又は精製なしに標的配列のセグメントの濃度を増加させるための方法を指す。標的配列を増幅するためのこのプロセスは、所望の標的配列及び増幅試薬を有するオリゴヌクレオチドプライマーを提供し、続いてポリメラーゼ（例えばＤＮＡポリメラーゼ）の存在下で正確な一連の熱サイクルを行うことを含む。プライマーは、二本鎖標的配列のそれらのそれぞれの鎖（「プライマー結合配列」）に相補的である。増幅を達成するために、二本鎖標的配列が変性され、次いでプライマーが標的分子内のそれらの相補配列にアニーリングされる。アニーリング後、プライマーは、新しい対の相補鎖を形成するようにポリメラーゼで伸長される。所望の標的配列の高濃度の増幅セグメントを得るために、変性、プライマーアニーリング、及びポリメラーゼ伸長の工程を何回も繰り返すことができる（すなわち、変性、アニーリング、及び伸長が１つの「サイクル」を構成し、多数の「サイクル」があり得る）。所望の標的配列の増幅セグメントの長さは、互いに対するプライマーの相対位置によって決定され、したがってこの長さは制御可能なパラメータである。このプロセスの繰り返しの態様によって、方法は、「ポリメラーゼ連鎖反応」（以後「ＰＣＲ」）と呼ばれ、標的配列は「ＰＣＲ増幅された」と言われる。二本鎖ＤＮＡ増幅産物が、ＤＮＡポリメラーゼの活性が阻害されるある特定の量まで蓄積すると、ＰＣＲ増幅は飽和に達する。一旦飽和すると、ＰＣＲ増幅はプラトーに達し、そこで増幅産物はより多くのＰＣＲサイクルで増加しない。

ＰＣＲにより、ゲノムＤＮＡ中の特定の標的配列の単一コピーをいくつかの異なる方法論（例えば、標識プローブとのハイブリダイゼーション、ビオチン化プライマーの組込みとそれに続くアビジン−酵素複合体検出；ｄＣＴＰ又はｄＡＴＰなどの３２Ｐ標識デオキシヌクレオチド三リン酸の増幅セグメントへの組込み）によって検出可能なレベルまで増幅することができる。ゲノムＤＮＡに加えて、任意のオリゴヌクレオチド又はポリヌクレオチド配列が、適切な一組のプライマー分子を用いて増幅され得る。特に、各微小液滴内でＰＣＲプロセス自体によって形成された増幅セグメントは、それ自体、その後のＰＣＲ増幅のための効率的な鋳型である。ＰＣＲを実行するための方法及びキットは、当技術分野において周知である。ＰＣＲ又は遺伝子クローニングなどのポリヌクレオチドの複製コピーを製造する全てのプロセスは、本明細書において集合的に複製と呼ばれる。サザンブロット又はノーザンブロット分析などのハイブリダイゼーション反応において、プライマーをプローブとして使用することもできる。

表現「増幅」又は「増幅する」は、それによって特定のポリヌクレオチドの余分なコピー又は複数のコピーが形成されるプロセスを指す。増幅は、ＰＣＲ、ライゲーション増幅（又はリガーゼ連鎖反応、ＬＣＲ）などの方法及び他の増幅方法を含む。これらの方法は当技術分野において公知であり、広く実践されている。例えば、米国特許第４，６８３，１９５号明細書及び同第４，６８３，２０２号明細書、並びにＩｎｎｉｓら、「ＰＣＲｐｒｏｔｏｃｏｌｓ：ａｇｕｉｄｅｔｏｍｅｔｈｏｄａｎｄａｐｐｌｉｃａｔｉｏｎｓ」ＡｃａｄｅｍｉｃＰｒｅｓｓ，Ｉｎｃｏｒｐｏｒａｔｅｄ（１９９０）（ＰＣＲに関する）、及びＷｕら（１９８９）Ｇｅｎｏｍｉｃｓ４：５６０〜５６９（ＬＣＲに関する）を参照されたい。一般に、ＰＣＲ手順は、（ｉ）ＤＮＡ試料（又はライブラリー）内の特定の遺伝子へのプライマーの配列特異的ハイブリダイゼーション、（ｉｉ）ＤＮＡポリメラーゼを用いた、複数ラウンドのアニーリング、伸長、及び変性を含むその後の増幅、並びに（ｉｉｉ）正しいサイズのバンドについてのＰＣＲ産物のスクリーニングを含む遺伝子増幅方法を説明している。使用されるプライマーは、重合の開始をもたらすのに十分な長さ及び適切な配列のオリゴヌクレオチドである、すなわち、各プライマーは、増幅されるゲノム遺伝子座の各鎖に相補的であるように特別に設計されている。

増幅反応を行うための試薬及びハードウェアは市販されている。特定の遺伝子領域からの配列を増幅するのに有用なプライマーは、好ましくは標的領域又はその隣接領域の配列に相補的であり、かつ特異的にハイブリダイズし、そして当業者に公知の方法を使用して調製され得る。増幅によって生成された核酸配列は直接配列決定され得る。

２つの一本鎖ポリヌクレオチド間で逆平行の配置でハイブリダイゼーションが起こる場合、その反応は「アニーリング」と呼ばれ、それらのポリヌクレオチドは「相補的」と説明される。ハイブリダイゼーションが第１のポリヌクレオチドの鎖と第２のポリヌクレオチドの鎖との間で生じ得る場合、二本鎖ポリヌクレオチドは別のポリヌクレオチドに対して相補的又は相同であり得る。相補性又は相同性（あるポリヌクレオチドが別のポリヌクレオチドと相補的である程度）は、一般に認められている塩基対合規則に従って、互いに水素結合を形成すると予想される対向鎖中の塩基の割合に関して定量化可能である。

「ＰＣＲ産物」、「ＰＣＲ断片」、及び「増幅産物」という用語は、変性、アニーリング及び伸長のＰＣＲ工程の２つ以上のサイクルが完了した後に得られる化合物の混合物を指す。これらの用語は、１又は複数の標的配列の１又は複数のセグメントの増幅があった場合を包含する。本開示の一態様によれば、各微小液滴は、単一の鋳型ＤＮＡ断片のＰＣＲ産物を含む。

「増幅試薬」という用語は、プライマー、核酸鋳型、及び増幅酵素を除いて、増幅に必要とされるそれらの試薬（デオキシリボヌクレオチド三リン酸、緩衝液など）を指す場合がある。典型的には、増幅試薬は、他の反応成分と共に反応容器（試験管、マイクロウェルなど）内に配置及び収納される。増幅方法としては、当業者に公知のＰＣＲ法が含まれ、またローリングサークル増幅（Ｂｌａｎｃｏら、Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．、２６４、８９３５〜８９４０、１９８９）、超分岐ローリングサークル増幅（Ｌｉｚａｒｄら、Ｎａｔ．Ｇｅｎｅｔｉｃｓ、１９、２２５〜２３２、１９９８）、及びループ媒介等温増幅（Ｎｏｔｏｍｉら、Ｎｕｃ．ＡｃｉｄｓＲｅｓ．、２８、ｅ６３、２０００）などが含まれ、これらはそれぞれ参照によりその全体が本明細書に組み込まれる。

エマルションＰＣＲの場合、エマルションＰＣＲ反応は、「油中水」混合物を激しく振盪又は撹拌して、数百万ものミクロンサイズの水性区画を生成することによって形成される。マイクロ流体チップは、油相及び水相を振盪又は撹拌することによってエマルションを形成するためのデバイスを備えていてもよい。あるいは、水滴は、ある特定の油を水相と合わせること、又は水相を油相に導入することによって自発的に形成され得る。増幅されるＤＮＡライブラリーは、乳化前に限界希釈で混合される。区画サイズ、すなわち微小液滴サイズ、及び増幅されるＤＮＡ断片ライブラリーの限界希釈を形成した微小液滴の量の組み合わせは、平均して、ただ１つのＤＮＡ分子を含有する区画を生成するために使用される。微小液滴形成又は乳化工程中に生成される水性区画のサイズに応じて、１μｌ当たり最大３×１０^９個の個々のＰＣＲ反応が、同じ管内で同時に実行され得る。本質的に、エマルション中のそれぞれの小さな水性区画微小液滴が、マイクロＰＣＲ反応器を形成する。エマルション中の区画の平均サイズは、乳化条件に依存して、直径がサブミクロン〜１００ミクロン超、又は１ピコリットル〜１０００ピコリットル、又は１ナノリットル〜１０００ナノリットル、又は１ピコリットル〜１ナノリットル、又は１ピコリットル〜１０００ナノリットルの範囲である。

それぞれ参照により本明細書に組み込まれる英国特許出願第２，２０２，３２８号明細書及びＰＣＴ特許出願第ＰＣＴ／ＵＳ８９／０１０２５号明細書に記載されているような他の増幅方法が、本開示に従って使用されてもよい。前者の出願では、「修飾された」プライマーがＰＣＲ様鋳型及び酵素依存的合成において使用される。プライマーは、捕捉部分（例えば、ビオチン）及び／又は検出部分（例えば、酵素）で標識することによって修飾され得る。後者の出願では、過剰の標識プローブが試料に添加される。標的配列の存在下で、プローブは結合し、触媒的に切断される。切断後、標的配列は無傷で放出され、過剰のプローブに結合される。標識プローブの切断は標的配列の存在を知らせる。

他の適切な増幅方法には、「ｒａｃｅ」及び「片側ＰＣＲ」が含まれる。（Ｆｒｏｈｍａｎ、Ｉｎ：ＰＣＲＰｒｏｔｏｃｏｌｓ：ＡＧｕｉｄｅｔｏＭｅｔｈｏｄｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓ、ＡｃａｄｅｍｉｃＰｒｅｓｓ、Ｎ．Ｙ．、１９９０、それぞれ参照により本明細書に組み込まれる。）得られた「ジ−オリゴヌクレオチド」の配列を有する核酸の存在下で２つ（又はそれ以上）のオリゴヌクレオチドをライゲーションし、それによってジ−オリゴヌクレオチドを増幅することに基づく方法もまた、本開示に従ってＤＮＡを増幅するために使用され得る（Ｗｕら、Ｇｅｎｏｍｉｃｓ４：５６０〜５６９、１９８９（参照により本明細書に組み込まれる））。

ある特定の態様によれば、例示的なトランスポゾン系は、Ｔｎ５トランスポザーゼ、Ｍｕトランスポザーゼ、Ｔｎ７トランスポザーゼ又はＩＳ５トランスポザーゼなどを含む。他の有用なトランスポゾン系は当業者に知られており、Ｔｎ３トランスポゾン系（Ｍａｅｋａｗａ，Ｔ．、Ｙａｎａｇｉｈａｒａ，Ｋ．、及びＯｈｔｓｕｂｏ，Ｅ．（１９９６）、Ａｃｅｌｌ−ｆｒｅｅｓｙｓｔｅｍｏｆＴｎ３ｔｒａｎｓｐｏｓｉｔｉｏｎａｎｄｔｒａｎｓｐｏｓｉｔｉｏｎｉｍｍｕｎｉｔｙ、ＧｅｎｅｓＣｅｌｌｓ１、１００７〜１０１６を参照されたい）、Ｔｎ７トランスポゾン系（Ｃｒａｉｇ，Ｎ．Ｌ．（１９９１）、Ｔｎ７：ａｔａｒｇｅｔｓｉｔｅ−ｓｐｅｃｉｆｉｃｔｒａｎｓｐｏｓｏｎ、Ｍｏｌ．Ｍｉｃｒｏｂｉｏｌ．５、２５６９〜２５７３を参照されたい）、Ｔｎ１０トランスポゾン系（Ｃｈａｌｍｅｒｓ，Ｒ．、Ｓｅｗｉｔｚ，Ｓ．、Ｌｉｐｋｏｗ，Ｋ．、及びＣｒｅｌｌｉｎ，Ｐ．（２０００）、ＣｏｍｐｌｅｔｅｎｕｃｌｅｏｔｉｄｅｓｅｑｕｅｎｃｅｏｆＴｎ１０、Ｊ．Ｂａｃｔｅｒｉｏｌ１８２、２９７０〜２９７２を参照されたい）、Ｐｉｇｇｙｂａｃトランスポゾン系（Ｌｉ，Ｘ．、Ｂｕｒｎｉｇｈｔ，Ｅ．Ｒ．、Ｃｏｏｎｅｙ，Ａ．Ｌ．、Ｍａｌａｎｉ，Ｎ．、Ｂｒａｄｙ，Ｔ．、Ｓａｎｄｅｒ，Ｊ．Ｄ．、Ｓｔａｂｅｒ，Ｊ．、Ｗｈｅｅｌａｎ，Ｓ．Ｊ．、Ｊｏｕｎｇ，Ｊ．Ｋ．、ＭｃＣｒａｙ，Ｐ．Ｂ．，Ｊｒ．ら（２０１３）、ＰｉｇｇｙＢａｃｔｒａｎｓｐｏｓａｓｅｔｏｏｌｓｆｏｒｇｅｎｏｍｅｅｎｇｉｎｅｅｒｉｎｇ、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ１１０、Ｅ２２７９〜２２８７を参照されたい）、Ｓｌｅｅｐｉｎｇｂｅａｕｔｙトランスポゾン系（Ｉｖｉｃｓ，Ｚ．、Ｈａｃｋｅｔｔ，Ｐ．Ｂ．、Ｐｌａｓｔｅｒｋ，Ｒ．Ｈ．、及びＩｚｓｖａｋ，Ｚ．（１９９７）、ＭｏｌｅｃｕｌａｒｒｅｃｏｎｓｔｒｕｃｔｉｏｎｏｆＳｌｅｅｐｉｎｇＢｅａｕｔｙ，ａＴｃ１−ｌｉｋｅｔｒａｎｓｐｏｓｏｎｆｒｏｍｆｉｓｈ，ａｎｄｉｔｓｔｒａｎｓｐｏｓｉｔｉｏｎｉｎｈｕｍａｎｃｅｌｌｓ、Ｃｅｌｌ９１、５０１〜５１０を参照されたい）、Ｔｏｌ２トランスポゾンシステム（Ｋａｗａｋａｍｉ，Ｋ．（２００７）、Ｔｏｌ２：ａｖｅｒｓａｔｉｌｅｇｅｎｅｔｒａｎｓｆｅｒｖｅｃｔｏｒｉｎｖｅｒｔｅｂｒａｔｅｓ、ＧｅｎｏｍｅＢｉｏｌ．８Ｓｕｐｐｌ．１、Ｓ７を参照されたい）を含む。

増幅されるＤＮＡは、単一細胞又は少数の細胞集団から得られてもよい。本明細書に記載される方法は、単一の反応容器内で行われる単一の反応混合物などの反応混合物中の任意の種又は生物からＤＮＡを増幅することを可能にする。一態様では、本明細書に記載の方法は、ヒト、動物、植物、酵母、ウイルス、真核生物及び原核生物のＤＮＡを含むがこれらに限定されない任意の源からのＤＮＡの配列非依存的増幅を含む。

一態様によれば、単一細胞由来の二本鎖ゲノムＤＮＡをそれぞれトランスポゾンＤＮＡに結合したＴｎ５トランスポザーゼと接触させることを含む、単一細胞全ゲノム増幅、配列決定及びデノボアセンブリの方法が提供され、トランスポゾンＤＮＡは、トランスポソームと呼ばれるトランスポザーゼ／トランスポゾンＤＮＡ複合体二量体を形成するための、二本鎖の１９ｂｐトランスポザーゼ（Ｔｎｐ）結合部位と、１又は複数のバーコード配列及びプライマー結合部位を含む第１の核酸配列と、を含む。第１の核酸配列は、一本鎖伸長の形態であってもよい。一態様によれば、第１の核酸配列は、５’オーバーハングなどのオーバーハングであってもよく、オーバーハングは、バーコード領域及びプライミング部位を含む。オーバーハングは、必要に応じてバーコード領域及びプライミング部位を含むのに適した任意の長さであってもよい。トランスポソームは、二本鎖ゲノムＤＮＡに沿った標的位置に結合し、二本鎖ゲノムＤＮＡを複数の二本鎖断片に切断し、各二本鎖断片は、Ｔｎｐ結合部位により上鎖に結合した第１の複合体及びＴｎｐ結合部位により下鎖に結合した第２の複合体を有する。トランスポゾン結合部位、すなわちトランスポゾンＤＮＡは、二本鎖断片の各５’末端に結合している。一態様によれば、Ｔｎ５トランスポザーゼは、複合体から除去される。二本鎖断片は、二本鎖伸長産物の各末端に異なるバーコード配列及び特異的プライマー結合部位を有する二本鎖伸長産物を作製するために、トランスポゾンＤＮＡに沿って伸長される。一態様によれば、Ｔｎ５トランスポザーゼ結合部位の二本鎖ゲノムＤＮＡ断片への結合から生じ得るギャップが埋められ得る。ギャップが埋められた二本鎖伸長産物は、増幅試薬と混合され、二本鎖ゲノムＤＮＡ断片が増幅される。各末端に異なるバーコード配列を含むアンプリコンは、例えば、当業者に公知のハイスループット配列決定法を用いて配列決定される。

特定の態様では、実施形態は、特定部位の表示を欠くことなく実質的に全ゲノムを増幅、配列決定及びデノボアセンブリする方法（本明細書では「全ゲノム増幅」と定義される）に関する。特定の実施形態では、全ゲノム増幅は、ゲノムライブラリーの実質的に全ての断片又は全ての断片の増幅を含む。さらなる特定の実施形態では、「実質的に全体」又は「実質的に全て」とは、ゲノム内の全配列の約８０％、約８５％、約９０％、約９５％、約９７％、又は約９９％を指す。

一態様によれば、ＤＮＡ試料は、ゲノムＤＮＡ、ミクロ解剖染色体ＤＮＡ、酵母人工染色体（ＹＡＣ）ＤＮＡ、プラスミドＤＮＡ、コスミドＤＮＡ、ファージＤＮＡ、Ｐ１由来人工染色体（ＰＡＣ）ＤＮＡ、又は細菌人工染色体（ＢＡＣ）ＤＮＡ、ミトコンドリアＤＮＡ、葉緑体ＤＮＡ、法医学試料ＤＮＡ、又は試験対象の天然若しくは人工の源からのその他のＤＮＡである。別の好ましい実施形態では、ＤＮＡ試料は、哺乳動物ＤＮＡ、植物ＤＮＡ、酵母ＤＮＡ、ウイルスＤＮＡ、又は原核生物ＤＮＡである。さらに別の好ましい実施形態では、ＤＮＡ試料は、ヒト、ウシ、ブタ、ヒツジ、ウマ、げっ歯類、鳥類、魚、エビ、植物、酵母、ウイルス、又は細菌から得られる。好ましくは、ＤＮＡ試料は、ゲノムＤＮＡである。

ある特定の例示的な態様によれば、必要に応じて増幅、配列決定、及びデノボアセンブリのための核酸断片を作製するために、転位方式が使用される。一態様によれば、同じバーコードが挿入されたトランスポゾンＤＮＡを用いてゲノムＤＮＡを二本鎖ゲノムＤＮＡ断片に断片化するために、転位方式が使用される。図１に示されるように、トランスポゾンＤＮＡは、二本鎖トランスポザーゼ結合部位、バーコード配列Ｂ及びプライミング部位Ｐを含む。二本鎖トランスポザーゼ結合部位は、オーバーハングの一方の末端にバーコード領域及びプライミング部位を含む一本鎖オーバーハングに共有結合などによって連結又は接続された二本鎖１９ｂｐＴｎ５トランスポザーゼ（Ｔｎｐ）結合部位であってもよい。トランスポザーゼを用いて数百万の小さな断片を形成しながら、トランスポゾンＤＮＡは単一細胞のゲノムＤＮＡに挿入される。トランスポザーゼ除去及びギャップフィリングの後、断片の各末端に異なるバーコード配列及び特異的プライマー配列を有するゲノムＤＮＡ断片は、ＤＮＡポリメラーゼ、ヌクレオチド及び増幅試薬と共に特異的プライマーを用いて増幅され、単一細胞の全ゲノムがＰＣＲ増幅される。

単一細胞からのＤＮＡなどの少量のＤＮＡを増幅する場合のある特定の態様によれば、増幅前の単一細胞内から得ることができる少量（約６ｐｇ）のゲノムＤＮＡを最大にするようにＤＮＡカラム精製工程は行われない。ＤＮＡは、細胞溶解物又は他の不純な条件から直接増幅され得る。したがって、ＤＮＡ試料は、不純であってもよく、未精製であってもよく、又は単離されていなくてもよい。したがって、本方法の態様は、増幅のためにゲノムＤＮＡを最大化し、また精製による損失を減少させることを可能にする。さらなる態様によれば、本明細書に記載の方法は、ＰＣＲ以外の増幅方法を利用してもよい。

一態様によれば、図２に一般的に示されるように、トランスポザーゼ（Ｔｎｐ）及びトランスポゾンＤＮＡは、例えば微小液滴内で合わされ、Ｔｎｐ及びトランスポゾンＤＮＡは、互いに結合及び二量体化してトランスポソームを形成する。

図３に示されるように、トランスポソームライブラリーのトランスポソームは、二量体として、標的の単一細胞ゲノムＤＮＡをランダムに捕捉するか、又は他の方法で結合する。図示されているトランスポソームには１、２及び３の番号が付されているが、トランスポソームの数は、数千、数万、数十万、数百万などであってもよい。各トランスポソームは、固有のバーコード配列、例えばバーコード配列１、バーコード配列２、バーコード配列３などによって表される。固有のバーコード配列は、トランスポソームの各トランスポゾンＤＮＡ内にある。トランスポソーム当たり２つのトランスポゾンＤＮＡがあるため、２つのトランスポゾンＤＮＡはホモ二量体と考えることができ、これは１つのトランスポゾンＤＮＡ二量体が同じバーコード情報を有する２つのＤＮＡ配列を有することを意味する。トランスポソームライブラリーの各トランスポソーム（及びトランスポゾンＤＮＡ二量体）は、トランスポソームに固有の異なるバーコードを有する。トランスポソーム内のトランスポザーゼは、１つのトランスポザーゼが上鎖を切断し、１つのトランスポザーゼが下鎖を切断することによってゲノムＤＮＡを切断し、ゲノムＤＮＡ断片を形成する。複数のトランスポソームは、複数のゲノムＤＮＡ断片を形成する。したがって、トランスポゾンＤＮＡ二量体からの１つのトランスポゾンＤＮＡは切断部位又は断片化部位の各末端に結合しており、すなわち、トランスポソーム１からの一方のトランスポゾンＤＮＡは左側の切断部位に結合し、トランスポソーム１からの他方のトランスポゾンＤＮＡは右側の切断部位に結合する。トランスポソームライブラリーは核酸を断片に切断するので、各断片は断片の各末端に異なるバーコード配列を有する、すなわち各断片は異なるバーコード配列を含むトランスポソームライブラリーの２つの異なるトランスポソームによって切断される２つの異なる切断部位によって産生される。これは２つの例示的な断片によって示されており、上の断片は一方の末端にバーコード配列１を、また他方の末端にバーコード配列２を有する。同様に、下の断片は一方の末端にバーコード配列２を、また他方の末端にバーコード配列３を有する。図示されるように、２つの断片間の切断部位はトランスポソーム２によって生成され、左側の切断部位（すなわち図３の上の断片の右側を参照）はバーコード配列２を有する１つのトランスポゾンを含み、一方右側の切断部位（すなわち図３の下の断片の左側を参照）は、バーコード配列２を有する他方のトランスポゾンを含む。

図４に示されるように、ゲノムＤＮＡの断片化は転位／挿入部位の両端にギャップを残す。ギャップは任意の長さを有し得るが、９塩基ギャップが例示的である。その結果、上鎖の５’位にトランスポゾンＤＮＡＴｎｐ結合部位が結合し、下鎖の５’位にトランスポゾンＤＮＡＴｎｐ結合部位が結合したゲノムＤＮＡ断片が得られる。トランスポゾンＤＮＡの結合又は挿入から生じるギャップが示されている。図４に示されるように、転位後、トランスポザーゼが除去され、ギャップを埋めてトランスポゾンＤＮＡに元々設計されていた一本鎖オーバーハングを補完するために、ギャップ伸長が行われる。

さらに図５に示されるように、複数の断片を形成するために、対応するバーコード配列Ｂｎを有する複数のトランスポソームｎが使用され、短い配列決定リードをより長い連続配列に連鎖するためにバーコード配列が使用される。それぞれ同じバーコードＢ（ｎ）を有する２つのトランスポゾンＤＮＡを有するトランスポソームのライブラリー（例えば数百万程度）がゲノムＤＮＡに挿入され、ゲノムＤＮＡを数百万の異なる断片（Ｆ１、Ｆ２、Ｆ３・・・）に切断する。全ゲノム増幅及び配列決定の後、同じバーコードでタグ付けされた断片は、より長い断片長を達成するために互いに計算的に連結され得る。

特定のＴｎ５転位システムが説明されており、当業者に利用可能である。Ｇｏｒｙｓｈｉｎ，Ｉ．Ｙ．及びＷ．Ｓ．Ｒｅｚｎｉｋｏｆｆ、Ｔｎ５ｉｎｖｉｔｒｏｔｒａｎｓｐｏｓｉｔｉｏｎ．ＴｈｅＪｏｕｒｎａｌｏｆｂｉｏｌｏｇｉｃａｌｃｈｅｍｉｓｔｒｙ、１９９８．２７３（１３）：ｐ．７３６７〜７４；Ｄａｖｉｅｓ，Ｄ．Ｒ．ら、Ｔｈｒｅｅ−ｄｉｍｅｎｓｉｏｎａｌｓｔｒｕｃｔｕｒｅｏｆｔｈｅＴｎ５ｓｙｎａｐｔｉｃｃｏｍｐｌｅｘｔｒａｎｓｐｏｓｉｔｉｏｎｉｎｔｅｒｍｅｄｉａｔｅ．Ｓｃｉｅｎｃｅ、２０００．２８９（５４７６）：ｐ．７７〜８５；Ｇｏｒｙｓｈｉｎ，Ｉ．Ｙ．ら、ＩｎｓｅｒｔｉｏｎａｌｔｒａｎｓｐｏｓｏｎｍｕｔａｇｅｎｅｓｉｓｂｙｅｌｅｃｔｒｏｐｏｒａｔｉｏｎｏｆｒｅｌｅａｓｅｄＴｎ５ｔｒａｎｓｐｏｓｉｔｉｏｎｃｏｍｐｌｅｘｅｓ．Ｎａｔｕｒｅｂｉｏｔｅｃｈｎｏｌｏｇｙ、２０００．１８（１）：ｐ．９７〜１００；並びにＳｔｅｉｎｉｇｅｒ−Ｗｈｉｔｅ，Ｍ．、Ｉ．Ｒａｙｍｅｎｔ、及びＷ．Ｓ．Ｒｅｚｎｉｋｏｆｆ、Ｓｔｒｕｃｔｕｒｅ／ｆｕｎｃｔｉｏｎｉｎｓｉｇｈｔｓｉｎｔｏＴｎ５ｔｒａｎｓｐｏｓｉｔｉｏｎ．Ｃｕｒｒｅｎｔｏｐｉｎｉｏｎｉｎｓｔｒｕｃｔｕｒａｌｂｉｏｌｏｇｙ、２００４．１４（１）：ｐ．５０〜７を参照されたく、これらはそれぞれ参照することにより全ての目的においてその全体が本明細書に組み込まれる。ＤＮＡライブラリー調製及び他の使用のためのＴｎ５転位方式を利用するキットが知られている。Ａｄｅｙ，Ａ．ら、Ｒａｐｉｄ，ｌｏｗ−ｉｎｐｕｔ，ｌｏｗ−ｂｉａｓｃｏｎｓｔｒｕｃｔｉｏｎｏｆｓｈｏｔｇｕｎｆｒａｇｍｅｎｔｌｉｂｒａｒｉｅｓｂｙｈｉｇｈ−ｄｅｎｓｉｔｙｉｎｖｉｔｒｏｔｒａｎｓｐｏｓｉｔｉｏｎ．Ｇｅｎｏｍｅｂｉｏｌｏｇｙ、２０１０．１１（１２）：ｐ．Ｒ１１９；Ｍａｒｉｎｅ，Ｒ．ら、Ｅｖａｌｕａｔｉｏｎｏｆａｔｒａｎｓｐｏｓａｓｅｐｒｏｔｏｃｏｌｆｏｒｒａｐｉｄｇｅｎｅｒａｔｉｏｎｏｆｓｈｏｔｇｕｎｈｉｇｈ−ｔｈｒｏｕｇｈｐｕｔｓｅｑｕｅｎｃｉｎｇｌｉｂｒａｒｉｅｓｆｒｏｍｎａｎｏｇｒａｍｑｕａｎｔｉｔｉｅｓｏｆＤＮＡ．Ａｐｐｌｉｅｄａｎｄｅｎｖｉｒｏｎｍｅｎｔａｌｍｉｃｒｏｂｉｏｌｏｇｙ、２０１１．７７（２２）：ｐ．８０７１〜９；Ｐａｒｋｉｎｓｏｎ，Ｎ．Ｊ．ら、Ｐｒｅｐａｒａｔｉｏｎｏｆｈｉｇｈ−ｑｕａｌｉｔｙｎｅｘｔ−ｇｅｎｅｒａｔｉｏｎｓｅｑｕｅｎｃｉｎｇｌｉｂｒａｒｉｅｓｆｒｏｍｐｉｃｏｇｒａｍｑｕａｎｔｉｔｉｅｓｏｆｔａｒｇｅｔＤＮＡ．Ｇｅｎｏｍｅｒｅｓｅａｒｃｈ、２０１２．２２（１）：ｐ．１２５〜３３；Ａｄｅｙ，Ａ．及びＪ．Ｓｈｅｎｄｕｒｅ、Ｕｌｔｒａ−ｌｏｗ−ｉｎｐｕｔ，ｔａｇｍｅｎｔａｔｉｏｎ−ｂａｓｅｄｗｈｏｌｅ−ｇｅｎｏｍｅｂｉｓｕｌｆｉｔｅｓｅｑｕｅｎｃｉｎｇ．Ｇｅｎｏｍｅｒｅｓｅａｒｃｈ、２０１２．２２（６）：ｐ．１１３９〜４３；Ｐｉｃｅｌｌｉ，Ｓ．ら、Ｆｕｌｌ−ｌｅｎｇｔｈＲＮＡ−ｓｅｑｆｒｏｍｓｉｎｇｌｅｃｅｌｌｓｕｓｉｎｇＳｍａｒｔ−ｓｅｑ２．Ｎａｔｕｒｅｐｒｏｔｏｃｏｌｓ、２０１４．９（１）：ｐ．１７１〜８１；並びにＢｕｅｎｒｏｓｔｒｏ，Ｊ．Ｄ．ら、Ｔｒａｎｓｐｏｓｉｔｉｏｎｏｆｎａｔｉｖｅｃｈｒｏｍａｔｉｎｆｏｒｆａｓｔａｎｄｓｅｎｓｉｔｉｖｅｅｐｉｇｅｎｏｍｉｃｐｒｏｆｉｌｉｎｇｏｆｏｐｅｎｃｈｒｏｍａｔｉｎ、ＤＮＡ−ｂｉｎｄｉｎｇｐｒｏｔｅｉｎｓａｎｄｎｕｃｌｅｏｓｏｍｅｐｏｓｉｔｉｏｎ．Ｎａｔｕｒｅｍｅｔｈｏｄｓ、２０１３を参照されたく、これらはそれぞれ、参照することにより全ての目的においてその全体が本明細書に組み込まれる。国際公開第９８／１００７７号パンフレット、欧州特許出願公開第２５２７４３８号明細書及び欧州特許出願公開第２３７６５１７号明細書もまた参照されたく、これらはそれぞれ参照することによりその全体が本明細書に組み込まれる。市販の転位キットは、ＮＥＸＴＥＲＡの商品名で販売されており、Ｉｌｌｕｍｉｎａから入手可能である。

本明細書で使用される場合、「ゲノム」という用語は、個体、細胞、又は細胞小器官が有する集合的遺伝子セットとして定義される。本明細書で使用される場合、「ゲノムＤＮＡ」という用語は、個体、細胞、又は細胞小器官が有する部分的又は完全な集合的遺伝子セットを含むＤＮＡ材料として定義される。

本明細書で使用される場合、「ヌクレオシド」という用語は、リボース又はデオキシリボース糖に共有結合したプリン又はピリミジン塩基を有する分子を指す。例示的なヌクレオシドには、アデノシン、グアノシン、シチジン、ウリジン及びチミジンが含まれる。さらなる例示的なヌクレオシドには、イノシン、１−メチルイノシン、シュードウリジン、５，６−ジヒドロウリジン、リボチミジン、２Ｎ−メチルグアノシン及び２，２Ｎ、Ｎ−ジメチルグアノシン（「レア」ヌクレオシドとも呼ばれる）が含まれる。「ヌクレオチド」という用語は、糖部分へのエステル結合で結合した１又は複数のリン酸基を有するヌクレオシドを指す。例示的なヌクレオチドには、ヌクレオシド一リン酸、ヌクレオシド二リン酸及びヌクレオシド三リン酸が含まれる。「ポリヌクレオチド」、「オリゴヌクレオチド」及び「核酸分子」という用語は、本明細書では同義的に使用され、５’と３’の炭素原子間のホスホジエステル結合によって互いに結合した任意の長さのヌクレオチド（デオキシリボヌクレオチド又はリボヌクレオチド）のポリマーを指す。ポリヌクレオチドは、任意の三次元構造を有し得、また既知又は未知の任意の機能を果たし得る。以下は、ポリヌクレオチドの限定されない例である：遺伝子又は遺伝子断片（例えば、プローブ、プライマー、ＥＳＴ又はＳＡＧＥタグ）、エクソン、イントロン、メッセンジャーＲＮＡ（ｍＲＮＡ）、トランスファーＲＮＡ、リボソームＲＮＡ、リボザイム、ｃＤＮＡ、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離ＤＮＡ、任意の配列の単離ＲＮＡ、核酸プローブ及びプライマー。ポリヌクレオチドは、メチル化ヌクレオチド及びヌクレオチド類似体などの修飾ヌクレオチドを含み得る。この用語はまた、二本鎖及び一本鎖分子の両方を指す。他に特定又は要求されない限り、ポリヌクレオチドを含む本発明の任意の実施形態は、二本鎖形態、及び二本鎖形態を構成することが知られている又は予測される２つの相補的一本鎖形態のそれぞれ、の両方を包含する。ポリヌクレオチドは、アデニン（Ａ）、シトシン（Ｃ）、グアニン（Ｇ）、チミン（Ｔ）、及びポリヌクレオチドがＲＮＡである場合はチミンの代わりにウラシル（Ｕ）の４つのヌクレオチド塩基の特定の配列で構成される。したがって、ポリヌクレオチド配列という用語は、ポリヌクレオチド分子のアルファベット表示である。このアルファベット表示は、中央処理装置を有するコンピュータ内のデータベースに入力することができ、機能的ゲノム学及び相同性検索などのバイオインフォマティクス用途に使用することができる。

「ＤＮＡ」、「ＤＮＡ分子」及び「デオキシリボ核酸分子」という用語は、デオキシリボヌクレオチドのポリマーを指す。ＤＮＡは、天然で（例えばＤＮＡ複製により）合成されてもよい。ＲＮＡは、転写後修飾されてもよい。ＤＮＡはまた、化学合成されてもよい。ＤＮＡは、一本鎖（すなわちｓｓＤＮＡ）又は多鎖（例えば二本鎖、すなわちｄｓＤＮＡ）であってもよい。

「ヌクレオチド類似体」、「改変ヌクレオチド」及び「修飾ヌクレオチド」という用語は、天然に存在しないリボヌクレオチド又はデオキシリボヌクレオチドを含む、非標準ヌクレオチドを指す。ある特定の例示的な実施形態では、ヌクレオチド類似体は、ヌクレオチドのある特定の化学的性質を改変するがその意図された機能を果たすヌクレオチド類似体の能力を保持するように、任意の位置で修飾される。誘導体化されてもよいヌクレオチドの位置の例には、５位、例えば、５−（２−アミノ）プロピルウリジン、５−ブロモウリジン、５−プロピンウリジン、５−プロペニルウリジンなど；６位、例えば６−（２−アミノ）プロピルウリジン；アデノシン及び／又はグアノシンの８位、例えば８−ブロモグアノシン、８−クロログアノシン、８−フルオログアノシンなどが含まれる。ヌクレオチド類似体にはまた、デアザヌクレオチド、例えば７−デアザ−アデノシン；Ｏ−及びＮ−修飾（例えばアルキル化、例えばＮ６−メチルアデノシン、又は他の当技術分野で公知の通り）ヌクレオチド；並びにＨｅｒｄｅｗｉｊｎ、ＡｎｔｉｓｅｎｓｅＮｕｃｌｅｉｃＡｃｉｄＤｒｕｇＤｅｖ．、２０００Ａｕｇ．１０（４）：２９７〜３１０に記載のものなどの他の複素環修飾ヌクレオチド類似体が含まれる。

ヌクレオチド類似体はまた、ヌクレオチドの糖部分に対する修飾を含んでもよい。例えば、２’ＯＨ基は、Ｈ、ＯＲ、Ｒ、Ｆ、Ｃｌ、Ｂｒ、Ｉ、ＳＨ、ＳＲ、ＮＨ_２、ＮＨＲ、ＮＲ_２、ＣＯＯＲ、又はＯＲから選択される基で置き換えられてもよい。ここで、Ｒは、置換又は非置換のＣ_１〜Ｃ_６アルキル、アルケニル、アルキニル、アリールなどである。他の可能な修飾には、米国特許第５，８５８，９８８号明細書及び同第６，２９１，４３８号明細書に記載のものが挙げられる。

ヌクレオチドのリン酸基はまた、例えばＥｃｋｓｔｅｉｎ、ＡｎｔｉｓｅｎｓｅＮｕｃｌｅｉｃＡｃｉｄＤｒｕｇＤｅｖ．２０００Ａｐｒ．１０（２）：１１７〜２１、Ｒｕｓｃｋｏｗｓｋｉら、ＡｎｔｉｓｅｎｓｅＮｕｃｌｅｉｃＡｃｉｄＤｒｕｇＤｅｖ．２０００Ｏｃｔ．１０（５）：３３３〜４５、Ｓｔｅｉｎ、ＡｎｔｉｓｅｎｓｅＮｕｃｌｅｉｃＡｃｉｄＤｒｕｇＤｅｖ．２００１Ｏｃｔ．１１（５）：３１７〜２５、Ｖｏｒｏｂｊｅｖら、ＡｎｔｉｓｅｎｓｅＮｕｃｌｅｉｃＡｃｉｄＤｒｕｇＤｅｖ．２００１Ａｐｒ．１１（２）：７７〜８５、及び米国特許第５，６８４，１４３号明細書に記載されるように、例えばリン酸基の１又は複数の酸素を硫黄（例えば、ホスホロチオエート）で置換することによって、又はヌクレオチドがその意図される機能を果たすことを可能にする他の置換を行うことによって改変され得る。上記の修飾のいくつか（例えば、リン酸基修飾）は、インビボ又はインビトロで、例えば、前記類似体を含むポリヌクレオチドの加水分解速度を低下させる。

「インビトロ」という用語は、その当技術分野で認識されている意味を有し、例えば精製試薬又は細胞抽出物などの抽出物を含む。「インビボ」という用語もまた、その当技術分野において認識されている意味を有し、例えば、不死化細胞、初代細胞、細胞株、及び／又は生物内の細胞などの生細胞を含む。

本明細書で使用される場合、「相補的」及び「相補性」という用語は、塩基対合則によって関連しているヌクレオチド配列に関して使用される。例えば、配列５’−ＡＧＴ−３’は、配列５’−ＡＣＴ−３’に相補的である。相補性は部分的であっても、又は全体的であってもよい。部分的相補性は、１又は複数の核酸塩基が塩基対合則に従ってマッチしない場合に生じる。核酸間の全体的又は完全な相補性は、塩基対合則に従ってありとあらゆる核酸塩基が他の塩基とマッチする場合に生じる。核酸鎖間の相補性の程度は、核酸鎖間のハイブリダイゼーションの効率及び強度に大きな影響を与える。

「ハイブリダイゼーション」という用語は、相補的核酸の対合を指す。ハイブリダイゼーション及びハイブリダイゼーションの強度（すなわち、核酸間の会合の強度）は、核酸間の相補性の程度、関与する条件のストリンジェンシー、形成されたハイブリッドのＴ_ｍ、及び核酸内Ｇ：Ｃ比などの要因によって影響を受ける。その構造内に相補的核酸の対合を含む単一分子は、「自己ハイブリダイズした」と言われる。

「Ｔ_ｍ」という用語は、核酸の融解温度を指す。融解温度は、二本鎖核酸分子の集団が一本鎖に半分解離する温度である。核酸のＴ_ｍを計算するための式は、当技術分野において周知である。標準的な参考文献によって示されるように、核酸が１ＭのＮａＣｌの水溶液中にある場合、Ｔ_ｍ値の簡単な推定は、式：Ｔ_ｍ＝８１．５＋０．４１（％Ｇ＋Ｃ）によって計算され得る（例えば、Ａｎｄｅｒｓｏｎ及びＹｏｕｎｇ、ＱｕａｎｔｉｔａｔｉｖｅＦｉｌｔｅｒＨｙｂｒｉｄｉｚａｔｉｏｎ，ｉｎＮｕｃｌｅｉｃＡｃｉｄＨｙｂｒｉｄｉｚａｔｉｏｎ（１９８５）を参照されたい）。他の参考文献は、Ｔ_ｍの計算に構造的特徴及び配列特徴を考慮に入れる、より洗練された演算を含む。

「ストリンジェンシー」という用語は、核酸ハイブリダイゼーションが行われる温度、イオン強度、及び有機溶媒などの他の化合物の存在の条件を指す。

核酸ハイブリダイゼーションに関して使用される場合、「低ストリンジェンシー条件」は、長さ約５００ヌクレオチドのプローブを用いる場合、５×ＳＳＰＥ（４３．８ｇ／ｌのＮａＣｌ、６．９ｇ／ｌのＮａＨ_２ＰＯ_４（Ｈ_２Ｏ）及び１．８５ｇ／ｌのＥＤＴＡ、ＮａＯＨでｐＨ７．４に調整）、０．１％ＳＤＳ、５×デンハルト試薬（５０×デンハルトは５００ｍｌ当たり５ｇのＦｉｃｏｌｌ（Ｔｙｐｅ４００、Ｐｈａｒｍａｃｉａ）、５ｇのＢＳＡ（ＦｒａｃｔｉｏｎＶ、Ｓｉｇｍａ）を含有する）、及び１００ｍｇ／ｍｌの変性サケ精子ＤＮＡからなる溶液中４２℃での結合又はハイブリダイゼーション、並びにその後の５×ＳＳＰＥ、０．１％ＳＤＳを含む溶液中４２℃での洗浄と等価の条件を含む。

核酸ハイブリダイゼーションに関して使用される場合、「中ストリンジェンシー条件」は、長さ約５００ヌクレオチドのプローブを用いる場合、５×ＳＳＰＥ（４３．８ｇ／ｌのＮａＣｌ、６．９ｇ／ｌのＮａＨ_２ＰＯ_４（Ｈ_２Ｏ）及び１．８５ｇ／ｌのＥＤＴＡ、ＮａＯＨでｐＨ７．４に調整）、０．５％ＳＤＳ、５×デンハルト試薬、及び１００ｍｇ／ｍｌの変性サケ精子ＤＮＡからなる溶液中４２℃での結合又はハイブリダイゼーション、並びにその後の１．０×ＳＳＰＥ、１．０％ＳＤＳを含む溶液中４２℃での洗浄と等価の条件を含む。

核酸ハイブリダイゼーションに関して使用される場合、「高ストリンジェンシー条件」は、長さ約５００ヌクレオチドのプローブを用いる場合、５×ＳＳＰＥ（４３．８ｇ／ｌのＮａＣｌ、６．９ｇ／ｌのＮａＨ_２ＰＯ_４（Ｈ_２Ｏ）及び１．８５ｇ／ｌのＥＤＴＡ、ＮａＯＨでｐＨ７．４に調整）、０．５％ＳＤＳ、５×デンハルト試薬、及び１００ｍｇ／ｍｌの変性サケ精子ＤＮＡからなる溶液中４２℃での結合又はハイブリダイゼーション、並びにその後の０．１×ＳＳＰＥ、１．０％ＳＤＳを含む溶液中４２℃での洗浄と等価の条件を含む。

ある特定の例示的な実施形態において、細胞が同定され、次いで単一細胞又は複数の細胞が単離される。本開示の範囲内の細胞は、ＤＮＡ含有量を理解することが当業者によって有用であると考えられる任意の種類の細胞を含む。本開示による細胞は、任意の種類の癌細胞、肝細胞、卵母細胞、胚、幹細胞、ｉＰＳ細胞、ＥＳ細胞、ニューロン、赤血球、メラニン細胞、アストロサイト、生殖細胞、希突起膠細胞、腎臓細胞などを含む。一態様によれば、本発明の方法は、単一細胞由来の細胞ＤＮＡを用いて実践される。複数の細胞は、約２〜約１，０００，０００個の細胞、約２〜約１０個の細胞、約２〜約１００個の細胞、約２〜約１，０００個の細胞、約２〜約１０，０００個の細胞、約２〜約１００，０００個の細胞、約２〜約１０個の細胞、又は約２〜約５個の細胞を含む。

本明細書に記載される方法によって処理される核酸はＤＮＡであってもよく、それらは例えばヒト試料などの任意の有用な源から得ることができる。特定の実施形態では、二本鎖ＤＮＡ分子は、さらに、例えばヒト由来の試料から得られたものなどのゲノムを含むと定義される。試料は、血液、血清、血漿、脳脊髄液、頬掻き取り、乳頭吸引液、生検材料、精液（射精液と呼ばれることもある）、尿、糞便、毛包、唾液、汗、免疫沈降又は物理的に単離されたクロマチンなどのヒト由来の任意の試料であってもよい。特定の実施形態では、試料は、単一細胞を含む。特定の実施形態では、試料は、単一細胞のみを含む。

特定の実施形態では、試料からの増幅及びデノボアセンブルされた核酸分子は、診断又は予後情報を提供する。例えば、試料から調製された核酸分子は、ゲノムコピー数及び／又は配列情報、対立遺伝子変異情報、がん診断、出生前診断、父性情報、疾患診断、検出、モニタリング、及び／又は治療情報、配列情報などを提供し得る。

本明細書で使用される場合、「単一細胞」は、１つの細胞を指す。本明細書に記載の方法において有用な単一細胞は、目的の組織から、又は生検材料、血液試料、若しくは細胞培養物から得られてもよい。さらに、特定の臓器、組織、腫瘍、新生物などからの細胞が取得され、本明細書に記載の方法において使用されてもよい。さらに、一般に、細菌又は酵母を含む原核生物又は真核生物の単一細胞生物の集団などの任意の集団からの細胞が、本方法において使用されてもよい。例えば、組織試料中の細胞を接続するタンパク質を消化するためのトリプシン又はパパインの酵素的使用、又は培養中の接着細胞の遊離、又は試料中の細胞の機械的分離を含む当技術分野で公知の標準的方法を用いて、単一細胞懸濁液が得られてもよい。単一細胞は、単一細胞が個々に処理され得る任意の適切な反応容器に配置されてもよい。例えば、各単一細胞が単一のウェルに配置されるような９６ウェルプレート。

単一細胞を操作する方法は当技術分野において公知であり、蛍光活性化細胞選別（ＦＡＣＳ）、フローサイトメトリー（Ｈｅｒｚｅｎｂｅｒｇ、ＰＮＡＳＵＳＡ７６：１４５３〜５５１９７９）、マイクロマニピュレーション及び半自動細胞ピッカー（例えばＳｔｏｅｌｔｉｎｇＣｏ．のＱｕｉｘｅｌｌ（商標）細胞移入システム）の使用を含む。個々の細胞は、例えば、位置、形態、又はレポーター遺伝子発現などの顕微鏡観察によって検出可能な特徴に基づいて個々に選択され得る。さらに、勾配遠心分離及びフローサイトメトリーの組み合わせもまた、単離又は選別効率を高めるために使用され得る。

所望の細胞が同定されたら、当業者に公知の方法を用いて、細胞を溶解してＤＮＡを含む細胞内容物を放出させる。細胞内容物は容器又は収集容積内に含まれる。本発明のいくつかの態様では、ゲノムＤＮＡなどの細胞内容物は、細胞を溶解することによって細胞から放出され得る。溶解は、例えば、細胞を加熱することによって、又は界面活性剤若しくは他の化学的方法を使用することによって、又はこれらの組み合わせによって達成され得る。しかしながら、当技術分野において公知の任意の適切な溶解方法が使用され得る。例えば、Ｔｗｅｅｎ−２０の存在下での７２℃で２分間の細胞加熱が、細胞を溶解するのに十分である。あるいは、細胞を水中で１０分間６５℃に加熱してもよく（Ｅｓｕｍｉら、ＮｅｕｒｏｓｃｉＲｅｓ６０（４）：４３９〜５１（２００８））、０．５％のＮＰ−４０を添加したＰＣＲ緩衝液ＩＩ（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ）中で９０秒間７０℃に加熱してもよく（Ｋｕｒｉｍｏｔｏら、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ３４（５）：ｅ４２（２００６））、又は、溶解は、プロテイナーゼＫなどのプロテアーゼを用いて、若しくはグアニジンイソチオシアネートなどのカオトロピック塩を使用することによって達成されてもよい（米国特許出願公開第２００７／０２８１３１３号明細書）。本明細書に記載の方法によるゲノムＤＮＡの増幅は、反応混合物が細胞溶解物に添加され得るように、細胞溶解物に対して直接実施されてもよい。あるいは、細胞溶解物は、当業者に公知の方法を使用して、２つ以上の容積、例えば２つ以上の容器、管又は領域に分離されてもよく、細胞溶解物の一部が各容積の容器、管又は領域に含まれてもよい。次いで、各容器、管又は領域に含まれるゲノムＤＮＡが、本明細書に記載の方法又は当業者に公知の方法によって増幅され得る。

本発明において使用される核酸はまた、天然又は非天然塩基を含んでもよい。これに関して、天然のデオキシリボ核酸は、アデニン、チミン、シトシン又はグアニンからなる群から選択される１又は複数の塩基を有してもよく、リボ核酸は、ウラシル、アデニン、シトシン又はグアニンからなる群から選択される１又は複数の塩基を有してもよい。核酸に含まれ得る例示的な非天然塩基は、天然骨格を有するか又は類似体構造を有するかにかかわらず、イノシン、キサタニン、ヒポキサタニン、イソシトシン、イソグアニン、５−メチルシトシン、５−ヒドロキシメチルシトシン、２−アミノアデニン、６−メチルアデニン、６−メチルグアニン、２−プロピルグアニン、２−プロピルアデニン、２−チオリラシル、２−チオチミン、２−チオシトシン、１５−ハロウラシル、１５−ハロシトシン、５−プロピニルウラシル、５−プロピニルシトシン、６−アゾウラシル、６−アゾシトシン、６−アゾチミン、５−ウラシル、４−チオウラシル、８−ハロアデニン又はグアニン、８−アミノアデニン又はグアニン、８−チオールアデニン又はグアニン、８−チオアルキルアデニン又はグアニン、８−ヒドロキシルアデニン又はグアニン、５−ハロ置換ウラシル又はシトシン、７−メチルグアニン、７−メチルアデニン、８−アザグアニン、８−アザアデニン、７−デアザグアニン、７−デアザアデニン、３−デアザグアニン、３−デアザアデニンなどを含むが、これらに限定されない。米国特許第５，６８１，７０２号明細書に概説されているように、特定の実施形態は、非特異的ハイブリダイゼーションを減少させるために核酸中にイソシトシン及びイソグアニンを利用することができる。

本明細書で使用される場合、用語「プライマー」は、一般に、例えば配列決定プライマーなど、ポリヌクレオチド鋳型と二本鎖を形成すると核酸合成の開始点として作用し、伸長した二本鎖が形成されるように鋳型に沿ってその３’末端から伸長することができる天然又は合成のオリゴヌクレオチドを含む。伸長過程中に付加されるヌクレオチドの配列は、鋳型ポリヌクレオチドの配列によって決定される。通常プライマーは、ＤＮＡポリメラーゼにより伸長される。プライマーは、通常、３〜３６ヌクレオチド、また５〜２４ヌクレオチド、また１４〜３６ヌクレオチドの範囲内の長さを有する。本発明の範囲内のプライマーは、直交プライマー、増幅プライマー、構築用プライマーなどを含む。一対のプライマーは、目的の配列又は目的の配列のセットに隣接し得る。プライマー及びプローブは、縮重配列又は準縮重配列であってもよい。本発明の範囲内のプライマーは標的配列に隣接して結合する。「プライマー」は、標的とハイブリダイズすることにより目的の試料中に潜在的に存在する標的又は鋳型に結合し、その後標的と相補的なポリヌクレオチドの重合を促進する、一般的に遊離３’−ＯＨ基を有する短いポリヌクレオチドと考えることができる。本発明のプライマーは、１７〜３０ヌクレオチドの範囲のヌクレオチドを含む。一態様では、プライマーは、少なくとも１７ヌクレオチド、あるいは少なくとも１８ヌクレオチド、あるいは少なくとも１９ヌクレオチド、あるいは少なくとも２０ヌクレオチド、あるいは少なくとも２１ヌクレオチド、あるいは少なくとも２２ヌクレオチド、あるいは少なくとも２３ヌクレオチド、あるいは少なくとも２４ヌクレオチド、あるいは少なくとも２５ヌクレオチド、あるいは少なくとも２６ヌクレオチド、あるいは少なくとも２７ヌクレオチド、あるいは少なくとも２８ヌクレオチド、あるいは、少なくとも２９ヌクレオチド、あるいは少なくとも３０ヌクレオチド、あるいは少なくとも５０ヌクレオチド、あるいは少なくとも７５ヌクレオチド、あるいは少なくとも１００ヌクレオチドである。

表現「増幅」又は「増幅する」は、それによって特定のポリヌクレオチドの余分なコピー又は複数のコピーが形成されるプロセスを指す。

本明細書に記載の方法に従って増幅されたＤＮＡは、当業者に公知の方法を用いて配列決定及び分析され得る。目的の核酸配列の配列決定は、ハイブリダイゼーションによる配列決定（ＳＢＨ）、ライゲーションによる配列決定（ＳＢＬ）（Ｓｈｅｎｄｕｒｅら（２００５）Ｓｃｉｅｎｃｅ３０９：１７２８）、定量的増分蛍光ヌクレオチド付加配列決定（ＱＩＦＮＡＳ）、段階的ライゲーション及び切断、蛍光共鳴エネルギー移動（ＦＲＥＴ）、分子ビーコン、ＴａｑＭａｎレポータープローブ消化、パイロシーケンシング、蛍光ｉｎｓｉｔｕ配列決定（ＦＩＳＳＥＱ）、ＦＩＳＳＥＱビーズ（米国特許第７，４２５，４３１号明細書）、ウォブル配列決定（ＰＣＴ／ＵＳ０５／２７６９５）、マルチプレックス配列決定（２００８年２月６日に出願された米国特許出願第１２／０２７，０３９号明細書、Ｐｏｒｒｅｃａら（２００７）Ｎａｔ．Ｍｅｔｈｏｄｓ４：９３１）、重合コロニー（ＰＯＬＯＮＹ）配列決定（米国特許第６，４３２，３６０号明細書、同第６，４８５，９４４号明細書及び同第６，５１１，８０３号明細書、並びにＰＣＴ／ＵＳ０５／０６４２５）、ナノグリッドローリングサークル配列決定（ＲＯＬＯＮＹ）（２００８年５月１４日に出願された米国特許出願第１２／１２０，５４１号明細書）、対立遺伝子特異的オリゴライゲーションアッセイ（例えば、オリゴライゲーションアッセイ（ＯＬＡ）、ライゲーションされた線形プローブとローリングサークル増幅（ＲＣＡ）読み出しを用いる単一鋳型分子ＯＬＡ、ライゲーションされたパドロックプローブ、及び／又はライゲーションされた円形パドロックプローブとローリングサークル増幅（ＲＣＡ）読み出しを用いた単一鋳型分子ＯＬＡ）などを含むがこれらに限定されない、当技術分野において公知の様々な配列決定方法を使用して実行することができる。例えば、Ｒｏｃｈｅ４５４、ＩｌｌｕｍｉｎａＳｏｌｅｘａ、ＡＢ−ＳＯＬｉＤ、Ｈｅｌｉｃｏｓ、Ｐｏｌｏｎａｔｏｒプラットフォームなどのプラットフォームを使用するハイスループット配列決定法も利用され得る。様々な光に基づく配列決定技術が当技術分野において公知である（Ｌａｎｄｅｇｒｅｎら（１９９８）ＧｅｎｏｍｅＲｅｓ．８：７６９〜７６、Ｋｗｏｋ（２０００）Ｐｈａｒｍａｃｏｇｅｎｏｍｉｃｓ１：９５〜１００、及びＳｈｉ（２００１）Ｃｌｉｎ．Ｃｈｅｍ．４７：１６４〜１７２）。

増幅されたＤＮＡは、任意の適切な方法により配列決定され得る。特に、増幅されたＤＮＡは、ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓのＳＯＬｉＤ配列決定技術やＩｌｌｕｍｉｎａのＧｅｎｏｍｅＡｎａｌｙｚｅｒなどのハイスループットスクリーニング法を使用して配列決定され得る。本発明の一態様では、増幅されたＤＮＡは、ショットガン配列決定され得る。リード数は、少なくとも１０，０００、少なくとも１００万、少なくとも１０００万、少なくとも１億、又は少なくとも１０億であってもよい。別の態様では、リード数は、１０，０００〜１００，０００、あるいは１００，０００〜１００万、あるいは１００万〜１０００万、あるいは１０００万〜１億、あるいは１億〜１０億であってもよい。「リード」は、配列決定反応によって得られたある長さの連続核酸配列である。

「ショットガン配列決定」は、非常に大量のＤＮＡ（全ゲノムなど）を配列決定するために使用される方法を指す。この方法では、配列決定されるＤＮＡは、最初に個々の配列決定が可能なより小さな断片に細断される。次に、これらの断片の配列がそれらの重複する配列に基づいてそれらの元の順序に再アセンブルされ、それにより完全な配列が得られる。ＤＮＡの「細断」は、制限酵素消化又は機械的剪断を含む種々の異なる技術を用いて行うことができる。重複配列は、典型的には適切にプログラムされたコンピュータにより整列される。ｃＤＮＡライブラリーのショットガン配列決定のための方法及びプログラムは、当技術分野において周知である。

増幅及び配列決定方法は、診断アッセイ、予後アッセイ、薬理ゲノミクス、及びモニタリング臨床試験が予後（予測）目的に使用され、それによって個体を予防的に治療する予測医学の分野において有用である。したがって、本発明の一態様は、個体が障害及び／又は疾患を発症する危険性があるかどうかを判定するためにゲノムＤＮＡを決定するための診断アッセイに関する。そのようなアッセイは、それによって障害及び／又は疾患の発生前に個体を予防的に治療するための予後又は予測目的に使用することができる。したがって、ある特定の例示的な実施形態において、本明細書に記載の１又は複数の発現プロファイリング方法を用いて１又は複数の疾患及び／又は障害を診断及び／又は予後診断する方法が提供される。

本明細書で使用される場合、「生物学的試料」という用語は、対象から単離された組織、細胞、生物学的流体及びそれらの単離物、並びに対象内に存在する組織、細胞及び液体を含むが、これらに限定されない。

ある特定の例示的な実施形態では、本明細書に記載の１つ又は複数のゲノムＤＮＡ配列を含む電子装置可読媒体が提供される。本明細書で使用される場合、「電子装置可読媒体」は、電子装置によって直接読み取られアクセスされ得るデータ又は情報を記憶、保持、又は含有するための任意の適切な媒体を指す。そのような媒体は、フロッピーディスク、ハードディスク記憶媒体、及び磁気テープなどの磁気記憶媒体；コンパクトディスクなどの光記憶媒体；ＲＡＭ、ＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭなどの電子記憶媒体；一般的なハードディスク、及び磁気／光記憶媒体などのこれらのカテゴリのハイブリッドが含まれるが、これらに限定されない。媒体は、本明細書に記載の１又は複数の発現プロファイルが記録されているように適合又は構成されている。

本明細書で使用される場合、「電子装置」という用語は、データ又は情報を記憶するように構成又は適合された任意の適切な演算若しくは処理装置又は他のデバイスを含むことを意図している。本発明と共に使用するのに適した電子装置の例には、スタンドアロン演算装置；ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）インターネット、イントラネット、及びエクストラネットを含むネットワーク；携帯情報端末（ＰＤＡ）、携帯電話、ポケットベルなどの電子機器；並びにローカル及び分散処理システムが含まれる。

本明細書で使用される場合、「記録された」とは、電子装置可読媒体上に情報を記憶又は符号化するためのプロセスを指す。当業者は、既知の媒体に情報を記録するための現在知られている任意の方法を容易に採用して、本明細書に記載の１又は複数の発現プロファイルを含む製品を製造することができる。

本発明のゲノムＤＮＡ情報を電子装置可読媒体に記憶させるために、様々なソフトウェアプログラム及びフォーマットが使用され得る。例えば、核酸配列は、ＷｏｒｄＰｅｒｆｅｃｔ及びＭｉｃｒｏＳｏｆｔＷｏｒｄなどの市販のソフトウェアでフォーマットされたワープロテキストファイル、又はＤＢ２、Ｓｙｂａｓｅ、Ｏｒａｃｌｅなどのデータベースアプリケーションに記憶されたＡＳＣＩＩファイルの形式、及びその他の形式で表現され得る。本明細書に記載の１又は複数の発現プロファイルを記録した媒体を取得又は作製するために、任意の数のデータプロセッサ構造化フォーマット（例えば、テキストファイル又はデータベース）が使用され得る。

説明された本発明の実施形態は、本発明の原理のいくつかの用途の単なる例示であることが理解されるべきである。本発明の真の精神及び範囲から逸脱することなく、本明細書に提示された教示に基づいて当業者によって多数の修正がなされ得る。本出願を通して引用された全ての参考文献、特許及び公開特許出願の内容は、参照することにより全ての目的においてその全体が本明細書に組み込まれる。

以下の実施例は、本発明の代表例として記載される。これらの実施形態及び他の同等の実施形態は、本開示、図面及び添付の特許請求の範囲を考慮して明らかになるため、これらの実施例は本発明の範囲を限定するものとして解釈されるべきではない。

［実施例１］
一般的プロトコル
以下の一般的プロトコルは、全ゲノム増幅に有用である。単一細胞を溶解緩衝液中に溶解する。固有のバーコード対などの特定のバーコード対を有するトランスポソームを含むトランスポソームライブラリー、及び転位緩衝液を細胞溶解液に添加し、これをよく混合して、５５℃で１０分間インキュベートする。転位の後に１ｍｇ／ｍｌのプロテアーゼを添加して、トランスポザーゼを単一細胞ゲノムＤＮＡへの結合から除去する。Ｄｅｅｐｖｅｎｔｅｘｏ− ＤＮＡポリメラーゼ、ｄＮＴＰ、ＰＣＲ反応緩衝液及びプライマーを反応混合物に添加し、トランスポゾン挿入から生じたギャップを埋めるために１０分間７２℃に加熱する。反応混合物を微小流体デバイスに投入して微小液滴を形成する。単一細胞ゲノムＤＮＡ鋳型、ＤＮＡポリメラーゼ、ｄＮＴＰ、反応緩衝液及びプライマーを含有する液滴を、ＰＣＲ管に収集する。単一細胞ゲノムＤＮＡを増幅するために、４０〜６０サイクルのＰＣＲ反応を行う。サイクル数は、液滴内の増幅反応を飽和まで推進するように選択される。液滴を溶解し、増幅産物を、ハイスループット深部配列決定などのさらなる分析のために精製する。

［実施例２］
トランスポゾンＤＮＡホモ二量体を有するトランスポソームの作製
トランスポゾンＤＮＡホモ二量体を有するトランスポソーム（すなわち、各トランスポゾンＤＮＡ上に同じバーコード配列を有するトランスポソーム）、及び、これにより、固有に紐付けされたバーコードを有するトランスポソームのライブラリーを作製するために、切断部位（例えば、ＤＮＡヌクレアーゼ切断部位）、プライミング部位、固有のバーコード配列及びトランスポザーゼ結合部位を含む複数のトランスポゾンＤＮＡを、単一の微粒子が同じ固有のバーコード配列を有し他のバーコードを有さない複数のトランスポゾンＤＮＡを含むように、単一の微粒子又はビーズに結合させる。

図６に示されるように、図１に示されるような複数のバーコード化トランスポゾンＤＮＡは、リンカーを介してビーズなどの微粒子に結合する。トランスポゾンＤＮＡが微粒子から切断され得る、又は別の方法で除去され得るように、切断部分又は部位もまた備えられる。

例示的な図７に示されるように、それ自身の固有のバーコード配列を有する複数のトランスポゾンＤＮＡが結合しているライブラリー内の各微粒子を用いて、微粒子のライブラリーが作製される。各微粒子がそれ自身の固有の紐付けされたバーコード配列を有する何百万もの微粒子が企図される。本明細書に記載の方法は、何百万もの対称的に索引付けされたトランスポソームを別々ではなく同時に作製することを提供する。すなわち、トランスポソームの各トランスポゾンＤＮＡが同一であり、単一の反応容積中に産生されるトランスポソームの数が数百万程度であるため、各トランスポソームはそれ自身の固有の紐付けされたバーコード配列を有する。バーコード化トランスポソームを作製する方法は、ＷＯ２０１２／２０６１８３２に記載されているが、そのような材料及び方法は、本明細書に記載のものとは異なり、作製され得るトランスポソームの数が制限される。一態様によれば、ライブラリーの同じ単一微粒子上のトランスポゾンＤＮＡは全て同じバーコード配列を有するが、ライブラリー内の各微粒子又は実質的に各微粒子は、それ自身の固有の紐付けされたバーコード配列を有する、すなわち各微粒子はライブラリー内の残りの各微粒子とは異なるバーコード配列を有するトランスポゾンＤＮＡを含む。一態様によれば、特定の微粒子上のトランスポゾンＤＮＡ分子の数は、トランスポソームを形成するためにトランスポゾンＤＮＡ分子と接触するトランスポザーゼ分子の数を超える。このようにして、各トランスポソームは２つの同一のトランスポゾンＤＮＡ分子を有することになり、したがって２つのトランスポゾンＤＮＡ分子のそれぞれに同じバーコード配列を有することにもなる。トランスポザーゼ分子よりも多くのトランスポゾンＤＮＡ分子を有することは、例えば、微小液滴内のトランスポソームの形成中にトランスポソームがトランスポゾンＤＮＡ分子を欠いていないことを確実にする。したがって、２つの異なるトランスポゾンＤＮＡ分子（したがって２つの異なるバーコード配列）とのトランスポソーム複合体の存在は、減少又は排除される。

次いで、各微小液滴が１つのビーズのみを含み、したがって１つの固有のバーコードのみを含むように、ビーズをトランスポザーゼ及びヌクレアーゼと共に微小液滴内に投入する。微小液滴内で、トランスポゾンＤＮＡはビーズから切断され、同じ固有のバーコード配列を有するトランスポソーム（すなわちトランスポゾンＤＮＡホモ二量体）が形成される。次いで、液滴を溶解又は破壊した後、ホモ二量体トランスポゾンＤＮＡを有するトランスポソームは収集され、トランスポソームのライブラリーが形成される。

特に、各々がそれ自身の固有に紐付けされたバーコード配列を有する１，０００を超えるトランスポソームを作製するためには、微粒子又はビーズ及び液滴マイクロ流体工学が利用される。固有のバーコードを有するＤＮＡ鎖をそれぞれ有するＭ個の微粒子又はビーズは、参照することによりその全体が本明細書に組み込まれるＭａｃｏｓｋｏら、Ｃｅｌｌ１６１（５）、２０１５に記載の方法に従って合成され、その結果、各微粒子又はビーズ上に、その微粒子又はビーズに特異的に紐付けされた同じバーコードを共有するトランスポゾンＤＮＡ鎖が平均ｎ個存在し、各微粒子又はビーズは、他の微粒子又はビーズとは異なるそれ自身の固有のバーコード配列を有する。各トランスポゾンＤＮＡ鎖はリンカー分子を介して微粒子又はビーズに結合しており、その配列は切断部位（例えば、ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓのＵＳＥＲ（商標）Ｅｎｚｙｍｅによって切断され得る単一のウラシルヌクレオチド）、プライミング部位、固有のバーコード配列及びトランスポザーゼ結合部位を含み、全てのビーズ又は微粒子上の全てのＤＮＡ鎖は、切断部位について同じ配列、プライミング部位について同じ配列、及びトランスポザーゼ結合部位について同じ配列を共有する。次いで、全ての微粒子又はビーズが、ビーズ又は微粒子上のＤＮＡ鎖上のトランスポザーゼ結合部位に相補的である同じ配列の一本鎖ＤＮＡ分子と混合され、その結果、図６に示されるように、ビーズ又は微粒子上に部分的に二本鎖であり部分的に一本鎖であるＤＮＡ分子が形成され得る。トランスポソームは、一本鎖ＤＮＡよりも二本鎖ＤＮＡにより効率的に挿入されるため、この部分的に一本鎖のＤＮＡ構造は、トランスポソーム分子間の挿入を妨げ得る。

固有にバーコード化されたトランスポソームを作製するために、それぞれ参照することによりその全体が本明細書に組み込まれるＭａｃｏｓｋｏら、Ｃｅｌｌ、２０１５、１６１（５）：ｐ．１２０２〜１４及びＫｌｅｉｎら、Ｃｅｌｌ、２０１５、１６１（５）：ｐ．１１８７〜１２０１に記載のデバイスなどの流動重点的なマイクロ流体デバイスを使用して、各液滴が０〜１個のビーズ又は微粒子を含有するように、各微粒子又はビーズが、トランスポザーゼ酵素及び切断酵素（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓのＵＳＥＲ（商標）酵素など）の混合物と共に液滴に同時カプセル化される。
マイクロチャネルを介した流体連通において、水相酵素混合物入口、水相ビーズ入口、疎水性液体入口（油入口という）、酵素混合物をビーズと合わせるための組み合わせ領域、及びマイクロチャネルによってエマルション液滴出口領域にさらに流体連通している、水相を油相と合わせるための組み合わせ領域を含む、例示的な流動回路を図８に示す。酵素混合物はビーズと合わせられ、次いでその組み合わせが、微小液滴当たり１個のビーズを有する微小液滴に形成される。

適切な疎水性相は、水性媒体が疎水性相に導入されたときに水性液滴を生成するものである。適切な油相は当業者に知られており、水相は自発的に油相に囲まれた水滴又は孤立した体積若しくは区画をもたらす。例示的な疎水性相は、３−エトキシペルフルオロ（２−メチルヘキサン）などのフッ素化油などの油などの疎水性液体、及び界面活性剤を含む。界面活性剤は当業者に周知である。適切な油及び界面活性剤を含む例示的な疎水性相としては、水溶液と混合しない、又は水溶液中で生化学反応に悪影響を及ぼさない疎水性界面活性剤含有液体であるＥｖａｇｒｅｅｎ用ＱＸ２００（商標）ＤｒｏｐｌｅｔＧｅｎｅｒａｔｉｏｎＯｉｌ（Ｂｉｏ−Ｒａｄ）、ＨＦＥ７５００中の００８−ＦｌｕｏｒｏＳｕｒｆａｃｔａｎｔ（ＲＡＮＢｉｏｔｅｃｈｎｏｌｏｇｉｅｓ）、Ｐｉｃｏ−Ｓｕｒｆ（商標）１（ＤｏｌｏｍｉｔｅＭｉｃｒｏｆｌｕｉｄｉｃｓ）、ＰｒｏｐｒｉｅｔａｒｙＯｉｌＳｕｒｆａｃｔａｎｔｓ（ＲａｉｎＤａｎｃｅＴｅｃｈｎｏｌｏｇｉｅｓ）、Ｍａｚｕｔｉｓ，Ｌ．ら、Ｓｉｎｇｌｅ−ｃｅｌｌａｎａｌｙｓｉｓａｎｄｓｏｒｔｉｎｇｕｓｉｎｇｄｒｏｐｌｅｔ−ｂａｓｅｄｍｉｃｒｏｆｌｕｉｄｉｃｓ、ＮａｔｕｒｅＰｒｏｔｏｃｏｌｓ、２０１３、８、ｐ．８７０〜８９１において議論されているフッ素化油中として説明されるフッ素系界面活性剤、及びＢａｒｅｔ，Ｊ．−Ｃ．、ＬａｂｏｎａＣｈｉｐ、２０１２、１２、ｐ．４２２〜４３３に記載の他の界面活性剤が挙げられ、これらはそれぞれ、参照することによりその全体が本明細書に組み込まれる。

油相及び水相が組み合わせ領域又はエマルション液滴出口領域で合わされると、水相は油相によって囲まれた液滴を自発的に形成する。一態様によれば、デッドボリュームを占有し得るような任意の水相を置き換えて、マイクロ流体チップ設計内に導入された元の水相の損失を最小限にするため、マイクロ流体設計内又は水性ビーズ相若しくは水性酵素混合物相をマイクロ流体設計内に入れるために使用されるシリンジ若しくはインジェクタ内の水相の上流側の、油などの疎水性流体のフラッシュ体積（フラッシュ体積には必要とされないため、界面活性剤を含まなくてもよい）が、使用される。有用なマイクロ流体チップ設計は、ＡｕｔｏＣＡＤソフトウェア（ＡｕｔｏｄｅｓｋＩｎｃ．）を使用して作成することができ、ＣＡＤＡｒｔＳｅｒｖｉｃｅｓＩｎｃ．によってマイクロ流体製造用のフォトマスクに印刷することができる。金型又はマスターは、参照することによりその全体が本明細書に組み込まれるＭａｚｕｔｉｓら、ＮａｔｕｒｅＰｒｏｔｏｃｏｌｓ８（５）、２０１３に記載のような従来の技術を使用して作製することができる。マイクロ流体チップは、マスター上に注がれた未硬化ポリジメチルシロキサン（ＰＤＭＳ）（ＤｏｗＣｏｒｎｉｎｇＳｙｌｇａｒｄ１８４）を硬化させることによってマスターから作製することができ、溝又は回路を有する表面を形成するために硬化するまで加熱される。入口及び出口穴が形成され、回路を有する硬化表面がスライドガラスに対して配置され、固定されてマイクロチャネル及びマイクロ流体チップを形成する。使用前に、マイクロ流体チップの内部を、マイクロ流体チップの内部の疎水性を改善するための化合物で処理し、洗浄して潜在的な汚染を除去することができる。

一態様によれば、各液滴が単一のビーズを含むか、又はビーズを含まない液滴を形成するために、当業者に知られている一般的な方法が使用される。水性媒体中の酵素混合物及び水性媒体中のビーズを合わせ、その組み合わせを油中に導入すると、単一のビーズが十分な酵素と共に単一の液滴内に隔離されるように、液滴の数がビーズの数を超える液滴が得られる。

各液滴内で、微粒子に結合したｎ個のトランスポゾンＤＮＡ分子は、切断酵素によって微粒子又はビーズから切断され、微粒子内のトランスポザーゼ単量体と自発的にアセンブルして約ｎ／２個のトランスポソームとなり、それぞれが、図７に示されるように、同じバーコードを有する２つのトランスポザーゼ一量体及び２つのトランスポゾンＤＮＡ分子で構成される。カプセル化された微粒子又はビーズの数（すなわちＭ）であるバーコードの数、及び各微粒子又はビーズ上のＤＮＡ鎖の平均数の半分（すなわちｎの半分）である液滴中のトランスポソームの平均数は、切断部位での、すなわち隣接ゲノムＤＮＡ断片の各末端へのトランスポゾンＤＮＡの切断及び挿入又は付加のために、統計的に固有のバーコードを有するトランスポソームを得ることができるようにスケールされる。

効果的に固有のバーコードを有するトランスポソームは、液滴を溶解、すなわち解乳化してトランスポソームを収集することで、Ｍ×ｎ／２の数のトランスポソームを全てプールすること、及び、同じバーコードを有する２つ以上のトランスポソームがゲノムに挿入される可能性を統計的にわずかなものとするために、トランスポソームのプールの合計量（Ｍ個のバーコード及び各バーコードの平均ｎ／２個のコピーを有する）の１／（ｎ／２）より大幅に少ないわずかな部分がゲノムに挿入されるようにすることよって得られる。液滴の溶解又は解乳化は、液滴にペルフルオロオクタノール（ＴＣＩＣｈｅｍｉｃａｌｓ）を添加することにより達成することができ、手動での振盪又はボルテックス及び遠心の後に、全ての液滴が溶解され、トランスポソームを含有する水溶液が収集される。

限定されない例として、約６，０００，０００，０００塩基対を有するヒトゲノムをアセンブルするために、６０００ｂｐの平均挿入長を仮定すると、固有のバーコードを有する１，０００，０００のトランスポソームがゲノムへの挿入に必要とされ、したがってＭは少なくとも１０^６であり、これは例えば１０^７となり得る。Ｍａｃｏｓｋｏら、Ｃｅｌｌ１６１（５）、２０１５において説明されているように、典型的な微粒子又はビーズが約１０^８のＤＮＡ分子を保持すると仮定すると、ｎ＝１０^８が妥当な推定値である。その結果、Ｍ＝１０^７個の微粒子又はビーズを用いて５×１０^１４（Ｍ×ｎ／２）個のバーコード化トランスポソームを作製する場合、トランスポソームの全プールの１／１６６６６７を取り出してゲノムＤＮＡに添加することができ、また添加されたトランスポソームの約１／３０００がゲノムに挿入され得るため、ゲノムに挿入されるトランスポソームの最終的な数は、５×１０^１４×１／１６６６６７×１／３０００と推定され、これはおよそ１，０００，０００である。この例では、ゲノムに挿入されるトランスポソームは約１／５００，０００，０００（１／１６６６６７×１／３０００）であり、これは１／（ｎ／２）より大幅に小さいため、ゲノムに挿入される２つの同一のバーコードを有する可能性は、統計的にわずかである。すなわち、６０００ｂｐの平均挿入長を用いてヒトゲノムをアセンブルするためには、１０００万個の固有にバーコード化されたビーズをバーコード化トランスポソームの作製に用いることができ、この例では、全トランスポソームの１／１６６６６７を挿入のためにゲノムＤＮＡに添加する必要がある。

一実施形態では、微粒子又はビーズ上の各ＤＮＡ鎖の切断部位は、参照することによりその全体が本明細書に組み込まれるＫｌｅｉｎ，Ａ．Ｍ．ら、Ｄｒｏｐｌｅｔｂａｒｃｏｄｉｎｇｆｏｒｓｉｎｇｌｅ−ｃｅｌｌｔｒａｎｓｃｒｉｐｔｏｍｉｃｓａｐｐｌｉｅｄｔｏｅｍｂｒｙｏｎｉｃｓｔｅｍｃｅｌｌｓ．Ｃｅｌｌ、２０１５．１６１（５）：ｐ．１１８７〜１２０１に記載の切断部位などの、ＵＶ光曝露により切断され得る部位であってもよい。この例における酵素混合物のための水相は、微粒子又はビーズからＤＮＡ鎖を切断するための切断酵素を含まなくてもよい。

別の実施形態では、バーコード化ビーズ（又は粒子若しくは微粒子）は、ＤＮＡ分子が材料上又は材料の多孔質ネットワーク内に結合することができるような多孔質ビーズであってもよい。酵素混合物用の緩衝液は、一旦ビーズが酵素混合物と一緒に液滴に封入されると、ビーズ上又はビーズの細孔内に結合したＤＮＡがビーズから解放され、続いて液滴内でトランスポザーゼ一量体と共にトランスポソームにアセンブルするように選択され得る。緩衝液条件に応じて制御された方法でＤＮＡを運搬及び解放することができる材料及び方法の例には、ＧｅｍＣｏｄｅ（商標）粒子（１０ＸＧｅｎｏｍｉｃｓ）が含まれ、ＤＮＡＣｌｅａｎ＆Ｃｏｎｃｅｎｔｒａｔｏｒ（商標）−５（ＺｙｍｏＲｅｓｅａｒｃｈ）、ＭｏｎａｒｃｈＮｕｃｌｅｉｃＡｃｉｄＰｕｒｉｆｉｃａｔｉｏｎＫｉｔｓ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）、及びＱＩＡｑｕｉｃｋＰＣＲＰｕｒｉｆｉｃａｔｉｏｎＫｉｔ（Ｑｉａｇｅｎ）などの核酸精製キット内のスピンカラムが含まれ、またそれぞれ参照することによりその全体が本明細書に組み込まれる、Ｂｏｏｍ，Ｒ．ら、Ｒａｐｉｄａｎｄｓｉｍｐｌｅｍｅｔｈｏｄｆｏｒｐｕｒｉｆｉｃａｔｉｏｎｏｆｎｕｃｌｅｉｃａｃｉｄｓ．ＪｏｕｒｎａｌｏｆＣｌｉｎｉｃａｌＭｉｃｒｏｂｉｏｌｏｇｙ、１９９０、２８（３）、ｐ．４９５〜５０３；Ｃｈｅｎ，Ｃ．Ｗ．及びＴｈｏｍａｓＪｒ．、Ｃ．Ａ．ＲｅｃｏｖｅｒｙｏｆＤＮＡｓｅｇｍｅｎｔｓｆｒｏｍａｇａｒｏｓｅｇｅｌｓ．ＡｎａｌｙｔｉｃａｌＢｉｏｃｈｅｍｉｓｔｒｙ、１９８０、１０１（２）、ｐ．３３９〜３４１；及びＴｉａｎ，Ｈ．ら、ＥｖａｌｕａｔｉｏｎｏｆｓｉｌｉｃａｒｅｓｉｎｓｆｏｒｄｉｒｅｃｔａｎｄｅｆｆｉｃｉｅｎｔｅｘｔｒａｃｔｉｏｎｏｆＤＮＡｆｒｏｍｃｏｍｐｌｅｘｂｉｏｌｏｇｉｃａｌｍａｔｒｉｃｅｓｉｎａｍｉｎｉａｔｕｒｉｚｅｄｆｏｒｍａｔ．ＡｎａｌｙｔｉｃａｌＢｉｏｃｈｅｍｉｓｔｒｙ、２０００、２８３、ｐ．１７５〜１９１に記載の材料及び方法が含まれる。

いくつかの態様では、バーコード化粒子は、参照によりその全体が本明細書に組み込まれる、Ｌａｎ，Ｆ．ら、Ｄｒｏｐｌｅｔｂａｒｃｏｄｉｎｇｆｏｒｍａｓｓｉｖｅｌｙｐａｒａｌｌｅｌｓｉｎｇｌｅ−ｍｏｌｅｃｕｌｅｄｅｅｐｓｅｑｕｅｎｃｉｎｇ．ＮａｔｕｒｅＣｏｍｍｕｎｉｃａｔｉｏｎｓ、２０１６、７：１１７８４において例示及び説明されているバーコード化液滴によって置き換えられてもよい。次いで、酵素混合物は、それぞれ参照することによりその全体が本明細書に組み込まれる、Ａｂａｔｅ，Ａ．ら、Ｈｉｇｈ−ｔｈｒｏｕｇｈｐｕｔｉｎｊｅｃｔｉｏｎｗｉｔｈｍｉｃｒｏｆｌｕｉｄｉｃｓｕｓｉｎｇｐｉｃｏｉｎｊｅｃｔｏｒｓ．ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＮａｔｉｏｎａｌＡｃａｄｅｍｙｏｆＳｃｉｅｎｃｅｓｏｆｔｈｅｕｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ、２０１０、１０７（４５）、ｐ．１９１６３〜１９１６６；Ｌａｎ，Ｆ．ら、Ｄｒｏｐｌｅｔｂａｒｃｏｄｉｎｇｆｏｒｍａｓｓｉｖｅｌｙｐａｒａｌｌｅｌｓｉｎｇｌｅ−ｍｏｌｅｃｕｌｅｄｅｅｐｓｅｑｕｅｎｃｉｎｇ．ＮａｔｕｒｅＣｏｍｍｕｎｉｃａｔｉｏｎｓ、２０１６、７：１１７８４；及びＲｈｅｅ，Ｍ．ら、Ｐｒｅｓｓｕｒｅｓｔａｂｉｌｉｚｅｒｆｏｒｒｅｐｒｏｄｕｃｉｂｌｅｐｉｃｏｉｎｊｅｃｔｉｏｎｉｎｄｒｏｐｌｅｔｍｉｃｒｏｆｌｕｉｄｉｃｓｙｓｔｅｍｓ．ＬａｂｏｎａＣｈｉｐ、２０１４，１４（２３）、ｐ．４５３３〜４５３９に記載のピコインジェクション又は液滴合体法を用いて、バーコード化液滴内に導入され得る。次いで、各液滴内で、導入されたトランスポザーゼ一量体は、液滴特異的バーコードを有するトランスポゾンＤＮＡ分子と共にトランスポソームへとアセンブルされ得る。次いで、バーコード化トランスポソームがバーコード化アノテーション付きのゲノムＤＮＡへの挿入のためにプールされ得るように、全ての液滴が溶解され得る。

一態様によれば、本明細書に記載のトランスポゾンＤＮＡ配列を有するトランスポソームは、液滴マイクロ流体工学を使用して作製されたものではない別々の区画で合成されてもよい。そのようなプラットフォーム、機器、材料又は方法の例には、マルチウェルプレート、ハイスループットシンセサイザー、マイクロアレイ、マイクロウェル、マイクロリアクター、又は他の区画化方法、例えば、それぞれ参照することによりその全体が本明細書に組み込まれる、Ｓｉｍｓ，Ｐ．Ａ．ら、ＦｌｕｏｒｏｇｅｎｉｃＤＮＡｓｅｑｕｅｎｃｉｎｇｉｎＰＤＭＳｍｉｃｒｏｒｅａｃｔｏｒｓ．ＮａｔｕｒｅＭｅｔｈｏｄｓ、２０１１、８（７）、ｐ．５７５〜５８０；Ｇｏｌｅ，Ｊ．ら、Ｍａｓｓｉｖｅｌｙｐａｒａｌｌｅｌｐｏｌｙｍｅｒａｓｅｃｌｏｎｉｎｇａｎｄｇｅｎｏｍｅｓｅｑｕｅｎｃｉｎｇｏｆｓｉｎｇｌｅｃｅｌｌｓｕｓｉｎｇｎａｎｏｌｉｔｅｒｍｉｃｒｏｗｅｌｌｓ．ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ、２０１３、３１（１２）、ｐ．１１２６〜１１３２；ＬｅｕｎｇＫ．ら、Ｒｏｂｕｓｔｈｉｇｈ−ｐｅｒｆｏｒｍａｎｃｅｎａｎｏｌｉｔｅｒ−ｖｏｌｕｍｅｓｉｎｇｌｅ−ｃｅｌｌｍｕｌｔｉｐｌｅｄｉｓｐｌａｃｅｍｅｎｔａｍｐｌｉｆｉｃａｔｉｏｎｏｎｐｌａｎａｒｓｕｂｓｔｒａｔｅｓ．ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＮａｔｉｏｎａｌＡｃａｄｅｍｙｏｆＳｃｉｅｎｃｅｓｏｆｔｈｅＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ．２０１６、１１３（３０）、ｐ．８４８４〜８４８９；及びＺａｒｚａｒ，Ｌ．Ｄ．ら、Ｄｙｎａｍｉｃａｌｌｙｒｅｃｏｎｆｉｇｕｒａｂｌｅｃｏｍｐｌｅｘｅｍｕｌｓｉｏｎｓｖｉａｔｕｎａｂｌｅｉｎｔｅｒｆａｃｅｔｅｎｓｉｏｎｓ．Ｎａｔｕｒｅ、２０１５、５１８、ｐ．５２０〜５２４に記載のものなどが含まれる。

［実施例３］
細胞溶解
以下のように細胞を選択し、培養皿から切り出し、レーザー解剖顕微鏡（ＬＭＤ−６５００、Ｌｅｉｃａ）を使用して管内に分配する。細胞を膜コート培養皿にプレーティングし、１０倍対物レンズ（Ｌｅｉｃａ）を有する明視野顕微鏡を用いて観察する。次に、ＵＶレーザーを使用して、ＰＣＲ管のキャップに入るように、個々に選択された細胞の周囲の膜を切断する。管を短時間遠心分離して細胞を管の底に移動させる。３〜５μｌの溶解緩衝液（３０ｍＭのＴｒｉｓ−ＣｌＰＨ７．８、２ｍＭのＥＤＴＡ、２０ｍＭのＫＣｌ、０．２％のＴｒｉｔｏｎＸ−１００、５００μｇ／ｍｌのＱｉａｇｅｎＰｒｏｔｅａｓｅ）をＰＣＲ管の側面に加え、遠沈させる。次いで、捕捉した細胞をＰＣＲ機で以下の温度スケジュールを使用して熱的に溶解する：５０℃で３時間、７５℃で３０分。あるいは、ＥＤＴＡ及びプロテアーゼ、例えばＱＩＡＧＥＮプロテアーゼ（ＱＩＡＧＥＮ）を１０〜５０００μｇ／ｍＬの濃度で含有する低塩溶解緩衝液中に単一細胞をピペットで移す。インキュベーション条件は、使用されるプロテアーゼによって異なる。ＱＩＡＧＥＮプロテアーゼの場合、インキュベーションは３７〜５５℃で１〜４時間である。次いで、プロテアーゼを８０℃まで熱不活性化し、さらに４−（２−アミノエチル）ベンゼンスルホニルフルオリド塩酸塩（ＡＥＢＳＦ）又はフェニルメタンスルホニルフルオリド（ＰＭＳＦ）（ＳｉｇｍａＡｌｄｒｉｃｈ）などの特定のプロテアーゼ阻害剤によって不活性化する。細胞溶解物を−８０℃で保存する。

［実施例４］
転位
単一細胞溶解物及びトランスポソームライブラリーを、１〜１００ｍＭのＭｇ^２＋及び所望により１〜１００ｍＭのＭｎ^２＋又はＣｏ^２＋又はＣａ^２＋を含有する緩衝系中で混合し、３７〜５５℃で５〜２４０分間インキュベートする。反応量は、細胞溶解量によって異なる。反応に添加されるトランスポソームライブラリーの量は、所望の断片化サイズに応じて容易に調整可能である。転位反応は、ＥＤＴＡ及び所望によりＥＧＴＡ又は他のイオン用キレート剤を用いてＭｇ^２＋をキレート化することにより停止される。所望により、短い二本鎖ＤＮＡをスパイクインとして混合物に添加することができる。残留トランスポソームを、最終濃度１〜５００μｇ／ｍＬで３７〜５５℃で１０〜６０分間のＱＩＡＧＥＮプロテアーゼなどのプロテアーゼ消化によって不活性化する。その後、プロテアーゼを、熱及び／又はＡＥＢＳＦなどのプロテアーゼ阻害剤によって不活性化する。

［実施例５］
ギャップフィリング
転位及びトランスポザーゼ除去の後、Ｍｇ^２＋、ｄＮＴＰ混合物、プライマー及びＤｅｅｐｖｅｎｔｅｘｏ−ＤＮＡポリメラーゼ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）などの熱安定性ＤＮＡポリメラーゼを含むＰＣＲ反応混合物を、適切な温度で適切な期間にわたり溶液に添加し、転位反応によって残された９ｂｐギャップを埋める。ギャップフィリングのインキュベーション温度及び時間は、使用される特定のＤＮＡポリメラーゼに依存する。反応後、ＤＮＡポリメラーゼを所望により加熱及び／又はＱＩＡＧＥＮプロテアーゼなどのプロテアーゼ処理により不活性化する。プロテアーゼを使用する場合は、プロテアーゼを次いで熱及び／又はプロテアーゼ阻害剤によって不活性化する。

［実施例６］
ＤＮＡ断片増幅
一態様によれば、当業者に公知の一般的な方法を使用してＤＮＡ断片が増幅される。プライマー結合部位を有するＤＮＡ断片を含む上記の実施例からのギャップが埋められた二本鎖産生成物を、水性媒体中のＰＣＲ反応試薬に添加する。次いで、水性媒体をＰＣＲ条件に供して各ＤＮＡ断片をＰＣＲ増幅する。

［実施例７］
ＤＮＡ断片アンプリコンの配列決定、及びバーコードを用いたデノボゲノムアセンブリ
一態様によれば、断片は当業者に公知の方法を用いて配列決定され、配列はコンピュータ可読メモリーに記憶される。次いで、配列を比較することができ、マッチするバーコード配列を有する断片を同定することができる。次いで、マッチするバーコード配列を有する断片は、元のゲノムＤＮＡ配列において互いに隣接していた配列であると同定される。次いで、２つ以上の隣接する配列を計算的に、すなわちコンピュータソフトウェアを使用してインシリコで、相互に連結して、元のゲノムＤＮＡより長い配列断片を形成することができる。この態様では、本開示は、トランスポソームバーコードを使用して形成されたゲノムＤＮＡの断片をデノボアセンブリしてより長い断片を形成する方法を提供する。

一態様によれば、あらゆるゲノムＤＮＡ断片の各末端は、トランスポザーゼ結合部位配列、バーコード配列及びプライミング配列に加えてギャップが埋められた部分の配列を有する。ギャップが埋められた部分の配列は、トランスポソームによって切断された２つの断片に共通する重複配列であるため、異なる断片をより長いゲノム配列に連鎖させるための第２の組のバーコードとして機能し得る。例えば、Ｔｎ５トランスポソームが二本鎖ゲノムＤＮＡ鋳型に挿入されると、図３に示されるように、挿入部位の２つの末端のそれぞれに一本鎖の９ｂｐギャップが残り、同じ挿入部位にわたる両方の９ｂｐギャップは、図４に示されるギャップフィリング工程（ギャップ伸長工程としても知られる）の後に同じ配列を共有する。挿入部位にわたり複製されるそのような９ｂｐ配列は、デノボアセンブリのために断片を連鎖させるための追加のバーコードとして機能し得、これは同じバーコード配列を有する２つのトランスポソームの挿入が生じる場合に非常に有用である。

一態様によれば、断片は、全ゲノムＤＮＡなどの元のゲノムＤＮＡ配列を再形成するためにバーコード配列をマッチングすることによってインシリコでデノボアセンブリされる。バーコード情報を使用して全ての断片を連鎖させた後、断片から構成される連鎖、連結、又はアセンブルされた連続又は隣接ゲノム配列（「コンティグ」としても知られる）を、相同染色体からの類似又は同一の配列を共有する別のコンティグと比較又はマッチングすることができ、相同染色体からのコンティグをマッチングすることによって、ゲノム配列又はコンティグは、最終的にゲノム全体にアセンブルされる、より長い配列又はコンティグにさらに連結することができる。当業者に公知のデノボアセンブリ方法には、オーバーラップ−レイアウト−コンセンサス（ｏｖｅｒｌａｐ−ｌａｙｏｕｔ−ｃｏｎｓｅｎｓｕｓ、ＯＬＣ）、ｄｅＢｒｕｉｊｎ、ストリンググラフ法、及び参照することによりその全体が本明細書に組み込まれるＣｈａｉｓｓｏｎ、Ｍ．Ｊ．Ｐ．ら、Ｇｅｎｅｔｉｃｖａｒｉａｔｉｏｎａｎｄｔｈｅｄｅｎｏｖｏａｓｓｅｍｂｌｙｏｆｈｕｍａｎｇｅｎｏｍｅｓ．ＮａｔｕｒｅＲｅｖｉｅｗＧｅｎｅｔｉｃｓ、２０１５．１６：ｐ．６２７〜６４０に概説されている他のアセンブリアルゴリズムが含まれる。

一態様によれば、固有のデノボアセンブリされたゲノムマップに到達するために、２、３、４又はそれ以上の娘細胞又は同一細胞からのゲノムが、バーコード化アノテーションにより個々に断片化及び増幅され、配列決定され、上述の方法を用いて別々にアセンブルされて、相互参照するための実質的な相同染色体対を効果的に提供することができる。これらの方法は、高品質の全ゲノムデノボアセンブリのための実質的な相同重複を提供するために、Ｍｉｌｌｅｒら、Ｇｅｎｏｍｉｃｓ、９５（６）、２０１０に概説されているＳＳＡＫＥ、ＳＨＡＲＣＧＳ、ＶＣＡＫＥ、Ｎｅｗｂｌｅｒ、ＣｅｌｅｒａＡｓｓｅｍｂｌｅｒ、Ｅｕｌｅｒ、Ｖｅｌｖｅｔ、ＡＢｙＳＳ、ＡｌｌＰａｔｈ、及びＳＯＡＰｄｅｎｏｖｏ；並びに、Ｃｈａｉｓｓｏｎら、ＮａｔｕｒｅＲｅｖｉｅｗｓＧｅｎｅｔｉｃｓ、１６、２０１５に記載のアルゴリズムなどの相同体間の重複領域を利用するデノボアセンブリ手法と組み合わされてもよく、これらの文献はそれぞれ、参照することによりその全体が本明細書に組み込まれる。

標的ゲノムＤＮＡが２つ以上の倍数性を有する単一細胞に由来する場合、ゲノムのデノボアセンブリはまた、図９に示されるようにハプロタイピングを達成し得る。倍数性は、細胞内の染色体のセット数である。例えば、ヒト体細胞は、各染色体の２組の相同コピーを有する。この２つのコピー、又は対立遺伝子は、父親及び母親から別々に由来し、細胞中の２つの物理的に別々のＤＮＡ分子である。２つのコピーは互いに結合せず、また転位のためのトランスポソームの使用、すなわちトランスポゾンＤＮＡの挿入及び断片の産生は別々の各コピーに対して独立して生じるため、一方のコピーのどの部分も、もう一方のコピーのどの部分とも同じ挿入部位を共有しない。したがって１つのコピーからの断片は、もう一方のコピーの断片上の任意のバーコードとマッチし得るバーコードを含まず、よって一方のコピーからの断片はもう一方のコピーからの断片と連結又は連鎖することはない。例えば、図９に示されるように、トランスポソーム１及び２は、トランスポゾンＤＮＡを第１の対立遺伝子に挿入し、トランスポソーム３及び４は、トランスポゾンＤＮＡを第２の対立遺伝子に挿入する。独立したトランスポソームが各別々の対立遺伝子についてトランスポゾンＤＮＡの挿入を開始した後、及び本明細書に記載の方法を用いた増幅、配列決定、及びデノボアセンブリの後、２つの対立遺伝子は別々にアセンブルされ、最終アセンブル産物は、ハプロタイプ分解されたゲノムである。これは、対立遺伝子１の断片が対立遺伝子２からの任意の断片と同じバーコードを共有していないためである。したがって、対立遺伝子１からの断片は対立遺伝子２の断片に連結又は連鎖されず、各対立遺伝子内の断片は、対立遺伝子２のいかなる情報とも無関係に連結又は連鎖され得、またその逆も同様である。したがって、結果的なデノボアセンブリは、連鎖された配列内のより長い鎖及び同じ対立遺伝子からの全染色体アセンブリをもたらし、よってゲノムＤＮＡはハプロタイプ分解される。対照的に、ヒトゲノムがショットガン配列決定によってアセンブルされる場合、２つの対立遺伝子がほぼ同一であり、区別することができないため、これは一倍体ゲノムとみなされる。本明細書に記載のトランスポソーム法を使用すると、図９に示されるように、各対立遺伝子に紐付けされた固有のバーコード配列によって、２組の染色体が別々にアセンブルされる。この方法は、バーコードをマッチングすることによって全ての対立遺伝子１断片を１つずつ連結することにより、またバーコードをマッチングすることによって全ての対立遺伝子２断片を１つずつ連結することにより、対立遺伝子２から対立遺伝子１を区別することを可能にする。固有のバーコードのアセンブルは別々の対立遺伝子のデノボアセンブリをもたらし、その結果ハプロタイプ分解がもたらされる。

［実施例１１］
キット
開示された増幅方法に必要な材料及び試薬は、キットとしてまとめられてもよい。本開示のキットは、一般に、少なくともトランスポソーム（トランスポザーゼ酵素及びトランスポゾンＤＮＡからなる）、ヌクレオチド、並びに必要に応じて、プライマーセットと共に、特許請求された方法を実践するのに必要なＤＮＡポリメラーゼを含む。好ましい実施形態では、キットはまた、ＤＮＡ試料からＤＮＡを増幅するための説明書を含む。例示的なキットとして、全ゲノムＤＮＡの増幅における使用に適したものが挙げられる。それぞれの場合において、キットは、好ましくはそれぞれ個々の試薬、酵素又は反応物のための、異なる容器を有する。各薬剤は、一般にそれらのそれぞれの容器に適切に分けられる。キットの容器の手段としては、一般には少なくとも１つのバイアル又は試験管が挙げられる。試薬を入れて分けるためのフラスコ、ボトル、及び他の容器の手段も可能である。キットの個々の容器は、商業的販売のために厳密に密閉されて維持されることが好ましい。適切なより大きな容器としては、所望のバイアルが中に保持される射出成形又はブロー成形プラスチック容器が挙げられる。説明書は、好ましくはキットと共に提供される。

［実施例１２］
実施形態
本開示は、複数のトランスポゾンＤＮＡを複数の微粒子のそれぞれに結合させる工程、ここで、単一の微粒子に結合した全てのトランスポゾンＤＮＡは、前記複数の微粒子における各微粒子が固有の紐付けされたバーコード配列を有するように、前記単一の微粒子に紐付けされた共通の固有のバーコード配列を含む；前記トランスポゾンＤＮＡが結合した前記複数の微粒子を、トランスポザーゼ及び切断酵素と一緒にして、水性混合物を形成する工程；複数の微小液滴が形成されるように前記水性混合物を油相と合わせる工程、ここで、前記複数の微粒子における各微粒子は、前記トランスポザーゼ及び前記切断酵素と共に、対応する単一の微小液滴内に単離される；対応する単一微小液滴ごとに、前記対応する単一微小液滴内の前記微粒子から前記複数のトランスポゾンＤＮＡを切断し、前記微小液滴内に複数のトランスポソームを形成する工程、ここで、前記微小液滴内の各トランスポソームは、共通の固有のバーコード配列を有する２つのトランスポゾンＤＮＡを有する；前記複数の微小液滴の各微小液滴を溶解する工程；並びに前記トランスポソームを収集して、トランスポソームライブラリーを生成する工程、を含む、トランスポソームライブラリーの作製方法を提供する。一態様によれば、前記トランスポソームライブラリーは、１，０００を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、１０，０００を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、１００，０００を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、１，０００，０００を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、２，０００，０００を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、３，０００，０００を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、４，０００，０００を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、５，０００，０００を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、１０，０００，０００を超えるトランスポソームを含む。一態様によれば、前記方法は、前記トランスポソームライブラリーの一部を採取して試薬トランスポソームライブラリーを形成することをさらに含み、前記試薬トランスポソームライブラリーの各トランスポソームは、固有の紐付けされたバーコード配列を有する。一態様によれば、前記方法は、前記トランスポソームライブラリーの一部を採取して試薬トランスポソームライブラリーを形成することをさらに含み、前記試薬トランスポソームライブラリー内の実質的に全てのトランスポソームは、固有の紐付けされたバーコード配列を有する。一態様によれば、各トランスポゾンＤＮＡは、特異的プライマー結合部位及び二本鎖トランスポザーゼ結合部位を含む。一態様によれば、前記トランスポゾンＤＮＡは、二本鎖トランスポザーゼ結合部位及びオーバーハングを含み、前記オーバーハングは、バーコード配列及び前記オーバーハングの５’末端のプライマー結合部位を含む。一態様によれば、各トランスポゾンＤＮＡは、リンカー及び切断部位によって、対応する微粒子に結合している。一態様によれば、各トランスポゾンＤＮＡは、５’オーバーハングを含み、その対応する５’末端で、リンカー及び切断部位によって、対応する微粒子に結合している。一態様によれば、前記トランスポザーゼは、Ｔｎ５トランスポザーゼ、Ｍｕトランスポザーゼ、Ｔｎ７トランスポザーゼ又はＩＳ５トランスポザーゼである。一態様によれば、前記油相は、界面活性剤を含む。一態様によれば、前記油相内の前記複数の微小液滴は、存在する微粒子よりも多くの微小液滴を生成するように前記水性混合物を前記油相と合わせることによって生成される。一態様によれば、前記油相内の前記複数の微小液滴は、存在する微粒子よりも多くの微小液滴を生成するように前記水性混合物を前記油相と合わせることによって生成され、前記複数の微小液滴は、自発的に生成される。一態様によれば、前記油相内の前記複数の微小液滴は、マイクロ流体チップ内で前記油相と前記水性媒体とを合わせることによって生成される。一態様によれば、前記複数の微小液滴は、解乳化剤によって溶解される。

本開示は、ゲノムＤＮＡをトランスポソームのライブラリーと接触させる工程、ここで、前記ライブラリーの各トランスポソームはそれ自身の固有の紐付けされたバーコード配列を有し、前記ライブラリーの各トランスポソームは、トランスポザーゼ及びトランスポゾンＤＮＡホモ二量体を含み、前記ホモ二量体の各トランスポゾンＤＮＡは、トランスポザーゼ結合部位、固有のバーコード配列及びプライマー結合部位を含み、前記トランスポソームのライブラリーは、前記ゲノムＤＮＡに沿って並ぶ標的位置群に結合し、前記トランスポザーゼは、前記ゲノムＤＮＡを、ゲノムＤＮＡ断片ライブラリーを表す複数の二本鎖ゲノムＤＮＡ断片に切断し、各二本鎖ゲノムＤＮＡ断片は、前記ゲノムＤＮＡ断片の各末端に固有のバーコード配列対のうちの一方を含む；前記トランスポゾンＤＮＡと前記ゲノムＤＮＡ断片との間のギャップをギャップフィリングし、各末端にプライマー結合部位を有する二本鎖ゲノムＤＮＡ断片伸長産物のライブラリーを形成する工程；前記二本鎖ゲノムＤＮＡ断片伸長産物を増幅して、アンプリコンを生成する工程；前記アンプリコンを配列決定する工程；並びに前記ゲノムＤＮＡをデノボアセンブリするために、バーコードをマッチングさせることによって前記アンプリコン同士を計算的に連結する工程、を含む、デノボゲノムＤＮＡアセンブリの方法を提供する。一態様によれば、前記ゲノムＤＮＡは、単一細胞から得られた全ゲノムＤＮＡである。一態様によれば、前記トランスポザーゼは、Ｔｎ５トランスポザーゼ、Ｍｕトランスポザーゼ、Ｔｎ７トランスポザーゼ又はＩＳ５トランスポザーゼである。一態様によれば、前記トランスポゾンＤＮＡは、二本鎖１９ｂｐＴｎｐ結合部位及びオーバーハングを含み、前記オーバーハングは、バーコード配列及び前記オーバーハングの５’末端のプライマー結合部位を含む。一態様によれば、前記二本鎖ゲノムＤＮＡ断片のギャップフィリング及び伸長の前に、結合したトランスポザーゼが前記二本鎖断片から除去される。一態様によれば、前記トランスポザーゼは、トランスポゾンＤＮＡとそれぞれ複合体を形成したＴｎ５トランスポザーゼであり、前記トランスポゾンＤＮＡは、二本鎖１９ｂｐＴｎｐ結合部位及びオーバーハングを含み、前記オーバーハングは、バーコード配列及びプライマー結合部位を含む。一態様によれば、前記ゲノムＤＮＡは、出生前細胞に由来する。一態様によれば、前記ゲノムＤＮＡは、癌細胞に由来する。一態様によれば、前記ゲノムＤＮＡは、循環腫瘍細胞に由来する。一態様によれば、前記ゲノムＤＮＡは、単一の出生前細胞に由来する。一態様によれば、前記ゲノムＤＮＡは、単一の癌細胞に由来する。一態様によれば、前記ゲノムＤＮＡは、単一の循環腫瘍細胞に由来する。一態様によれば、前記プライマー結合部位は、特異的ＰＣＲプライマー結合部位である。一態様によれば、前記デノボアセンブリは、ハプロタイプ分解デノボアセンブリである。一態様によれば、前記ハプロタイプ分解デノボアセンブリは、ヒト単一細胞の、ヒト白血球抗原領域、Ｖ（Ｄ）Ｊ組換え領域、又は他の領域上にある。

本開示は、非水相中に複数の水性微小液滴を生成する工程、ここで、各微小液滴は、前記微小液滴内に形成された複数のトランスポソームを含み、全てのトランスポソームは、２つのトランスポザーゼ及び２つの同一のトランスポゾンＤＮＡを有し、各トランスポゾンＤＮＡは、トランスポザーゼ結合部位、バーコード配列及びプライマー結合部位を有する；各微小液滴から前記複数のトランスポソームを放出し、放出されたトランスポソームを収集してトランスポソームライブラリーとする工程；反応容積内の試薬トランスポソームライブラリーを形成する工程、ここで、前記試薬トランスポソームライブラリー内の実質的に全て又は全てのトランスポソームは、固有の紐付けされたバーコード配列を有する；ゲノムＤＮＡを前記反応容積内の前記試薬トランスポソームライブラリーと接触させる工程、ここで、前記トランスポソームは、前記ゲノムＤＮＡに沿って並ぶ標的位置群に結合し、前記トランスポザーゼは、前記ゲノムＤＮＡを、ゲノムＤＮＡ断片ライブラリーを表す複数の二本鎖ゲノムＤＮＡ断片に切断し、各二本鎖ゲノムＤＮＡ断片は、前記ゲノムＤＮＡ断片の各末端に固有のバーコード配列対のうちの一方を含む；前記トランスポゾンＤＮＡと前記ゲノムＤＮＡ断片との間のギャップをギャップフィリングし、前記反応容積内で、各末端にプライマー結合部位を有する二本鎖ゲノムＤＮＡ断片伸長産物のライブラリーを形成する工程；前記二本鎖ゲノムＤＮＡ断片伸長産物を増幅して、前記反応容積内にアンプリコンを生成する工程；前記反応容積内の前記アンプリコンを配列決定する工程；並びに前記ゲノムＤＮＡをデノボアセンブルするために、バーコードをマッチングさせることによって前記アンプリコン同士を計算的に連結する工程、を含む、デノボゲノムＤＮＡアセンブリの方法を提供する。一態様によれば、前記試薬トランスポソームライブラリーは、１，０００を超えるトランスポソームを含む。一態様によれば、前記試薬トランスポソームライブラリーは、１０，０００を超えるトランスポソームを含む。一態様によれば、前記試薬トランスポソームライブラリーは、１００，０００を超えるトランスポソームを含む。一態様によれば、前記試薬トランスポソームライブラリーは、１，０００，０００を超えるトランスポソームを含む。一態様によれば、前記試薬トランスポソームライブラリーは、２，０００，０００を超えるトランスポソームを含む。一態様によれば、前記試薬トランスポソームライブラリーは、３，０００，０００を超えるトランスポソームを含む。一態様によれば、前記試薬トランスポソームライブラリーは、４，０００，０００を超えるトランスポソームを含む。一態様によれば、前記試薬トランスポソームライブラリーは、５，０００，０００を超えるトランスポソームを含む。一態様によれば、前記試薬トランスポソームライブラリーは、１０，０００，０００を超えるトランスポソームを含む。一態様によれば、前記ゲノムＤＮＡは、単一細胞から得られた全ゲノムＤＮＡである。一態様によれば、前記トランスポザーゼは、Ｔｎ５トランスポザーゼ、Ｍｕトランスポザーゼ、Ｔｎ７トランスポザーゼ又はＩＳ５トランスポザーゼである。一態様によれば、前記トランスポゾンＤＮＡは、二本鎖１９ｂｐＴｎｐ結合部位及びオーバーハングを含み、前記オーバーハングは、バーコード配列及び前記オーバーハングの５’末端のプライマー結合部位を含む。一態様によれば、前記二本鎖ゲノムＤＮＡ断片のギャップフィリング及び伸長の前に、結合したトランスポザーゼが前記二本鎖断片から除去される。一態様によれば、前記トランスポザーゼは、トランスポゾンＤＮＡとそれぞれ複合体を形成したＴｎ５トランスポザーゼであり、前記トランスポゾンＤＮＡは、二本鎖１９ｂｐＴｎｐ結合部位及びオーバーハングを含み、前記オーバーハングは、バーコード配列及びプライマー結合部位を含む。一態様によれば、前記ゲノムＤＮＡは、出生前細胞に由来する。一態様によれば、前記ゲノムＤＮＡは、癌細胞に由来する。一態様によれば、前記ゲノムＤＮＡは、循環腫瘍細胞に由来する。一態様によれば、前記ゲノムＤＮＡは、単一の出生前細胞に由来する。一態様によれば、前記ゲノムＤＮＡは、単一の癌細胞に由来する。一態様によれば、前記ゲノムＤＮＡは、単一の循環腫瘍細胞に由来する。一態様によれば、前記プライマー結合部位は、特異的ＰＣＲプライマー結合部位である。

本開示は、物理的に分離した複数の反応チャンバ内で、トランスポザーゼを複数のトランスポゾンＤＮＡと接触させ、それぞれの物理的に分離した反応チャンバ内でトランスポソームを形成する工程、ここで、各トランスポゾンＤＮＡは、共通のトランスポザーゼ結合部位、共通のプライマー結合部位及びバーコード配列を含み、前記バーコード配列は、同じ反応チャンバ内の全てのトランスポゾンＤＮＡに対して同じであるが、他の反応チャンバ内のトランスポゾンＤＮＡとは異なる；各反応チャンバから前記トランスポソームを集め、全ての前記トランスポソームを混合してトランスポソームライブラリーを形成する工程；反応容積内の試薬トランスポソームライブラリーを形成する工程、ここで、前記試薬トランスポソームライブラリー内の実質的に全て又は全てのトランスポソームは、固有の紐付けされたバーコード配列を有する；ゲノムＤＮＡを前記反応容積内の前記試薬トランスポソームライブラリーと接触させる工程、ここで、前記トランスポソームは、前記ゲノムＤＮＡに沿って並ぶ標的位置群に結合し、前記トランスポザーゼは、前記ゲノムＤＮＡを、ゲノムＤＮＡ断片ライブラリーを表す複数の二本鎖ゲノムＤＮＡ断片に切断し、各二本鎖ゲノムＤＮＡ断片は、前記ゲノムＤＮＡ断片の各末端に固有のバーコード配列対のうちの一方を含む；前記トランスポゾンＤＮＡと前記ゲノムＤＮＡ断片との間のギャップをギャップフィリングし、前記反応容積内で、各末端にプライマー結合部位を有する二本鎖ゲノムＤＮＡ断片伸長産物のライブラリーを形成する工程；前記二本鎖ゲノムＤＮＡ断片伸長産物を増幅して、前記反応容積内にアンプリコンを生成する工程；前記反応容積内の前記アンプリコンを配列決定する工程；並びに前記ゲノムＤＮＡをデノボアセンブルするために、バーコードをマッチングさせることによって前記アンプリコン同士を計算的に連結する工程、を含む、デノボゲノムＤＮＡアセンブリの方法を提供する。一態様によれば、前記反応チャンバは、管、マルチウェルプレート、マイクロアレイチップ、マイクロウェル、マイクロリアクター、微小液滴、微粒子ヒドロゲル、又は他の区画化方法である。

Claims

複数のトランスポゾンＤＮＡを複数の微粒子のそれぞれに結合させること、ここで、単一の微粒子に結合した全てのトランスポゾンＤＮＡは、前記複数の微粒子における各微粒子が固有の紐付けされたバーコード配列を有するように、前記単一の微粒子に紐付けされた共通の固有のバーコード配列を含む；
前記トランスポゾンＤＮＡが結合した前記複数の微粒子を、トランスポザーゼ及び切断酵素と一緒にして、水性混合物を形成すること；
複数の微小液滴が形成されるように前記水性混合物を油相と合わせること、ここで、前記複数の微粒子における各微粒子は、前記トランスポザーゼ及び前記切断酵素と共に、対応する単一の微小液滴内に単離される；
対応する単一微小液滴ごとに、前記対応する単一微小液滴内の前記微粒子から前記複数のトランスポゾンＤＮＡを切断し、前記微小液滴内に複数のトランスポソームを形成すること、ここで、前記微小液滴内の各トランスポソームは、共通の固有のバーコード配列を有する２つのトランスポゾンＤＮＡを有する；
前記複数の微小液滴の各微小液滴を溶解すること；並びに
前記トランスポソームを収集して、トランスポソームライブラリーを生成すること、
を含む、トランスポソームライブラリーの作製方法。
前記トランスポソームライブラリーが、１，０００を超えるトランスポソームを含む、請求項１に記載の方法。
前記トランスポソームライブラリーが、１０，０００を超えるトランスポソームを含む、請求項１に記載の方法。
前記トランスポソームライブラリーが、１００，０００を超えるトランスポソームを含む、請求項１に記載の方法。
前記トランスポソームライブラリーが、１，０００，０００を超えるトランスポソームを含む、請求項１に記載の方法。
前記トランスポソームライブラリーが、２，０００，０００を超えるトランスポソームを含む、請求項１に記載の方法。
前記トランスポソームライブラリーが、３，０００，０００を超えるトランスポソームを含む、請求項１に記載の方法。
前記トランスポソームライブラリーが、４，０００，０００を超えるトランスポソームを含む、請求項１に記載の方法。
前記トランスポソームライブラリーが、５，０００，０００を超えるトランスポソームを含む、請求項１に記載の方法。
前記トランスポソームライブラリーが、１０，０００，０００を超えるトランスポソームを含む、請求項１に記載の方法。
前記トランスポソームライブラリーの一部を採取して試薬トランスポソームライブラリーを形成することをさらに含み、前記試薬トランスポソームライブラリーの各トランスポソームは、固有の紐付けされたバーコード配列を有する、請求項１に記載の方法。
前記トランスポソームライブラリーの一部を採取して試薬トランスポソームライブラリーを形成することをさらに含み、前記試薬トランスポソームライブラリー内の実質的に全てのトランスポソームは、固有の紐付けされたバーコード配列を有する、請求項１に記載の方法。
各トランスポゾンＤＮＡが特異的プライマー結合部位及び二本鎖トランスポザーゼ結合部位を含む、請求項１に記載の方法。
前記トランスポゾンＤＮＡが二本鎖トランスポザーゼ結合部位及びオーバーハングを含み、前記オーバーハングは、バーコード配列及び前記オーバーハングの５’末端のプライマー結合部位を含む、請求項１に記載の方法。
各トランスポゾンＤＮＡが、リンカー及び切断部位によって、対応する微粒子に結合している、請求項１に記載の方法。
各トランスポゾンＤＮＡが５’オーバーハングを含み、その対応する５’末端で、リンカー及び切断部位によって、対応する微粒子に結合している、請求項１に記載の方法。
前記トランスポザーゼが、Ｔｎ５トランスポザーゼ、Ｍｕトランスポザーゼ、Ｔｎ７トランスポザーゼ又はＩＳ５トランスポザーゼである、請求項１に記載の方法。
前記油相が界面活性剤を含む、請求項１に記載の方法。
前記油相内の前記複数の微小液滴が、存在する微粒子よりも多くの微小液滴を生成するように前記水性混合物を前記油相と合わせることによって生成される、請求項１に記載の方法。
前記油相内の前記複数の微小液滴が、存在する微粒子よりも多くの微小液滴を生成するように前記水性混合物を前記油相と合わせることによって生成され、前記複数の微小液滴が、自発的に生成される、請求項１に記載の方法。
前記油相内の前記複数の微小液滴が、マイクロ流体チップ内で前記油相と水性媒体とを合わせることによって生成される、請求項１に記載の方法。
前記複数の微小液滴が解乳化剤によって溶解される、請求項１に記載の方法。
ゲノムＤＮＡをトランスポソームのライブラリーと接触させること、ここで、前記ライブラリーの各トランスポソームはそれ自身の固有の紐付けされたバーコード配列を有し、前記ライブラリーの各トランスポソームは、トランスポザーゼ及びトランスポゾンＤＮＡホモ二量体を含み、前記ホモ二量体の各トランスポゾンＤＮＡは、トランスポザーゼ結合部位、固有のバーコード配列及びプライマー結合部位を含み、前記トランスポソームのライブラリーは、前記ゲノムＤＮＡに沿って並ぶ標的位置群に結合し、前記トランスポザーゼは、前記ゲノムＤＮＡを、ゲノムＤＮＡ断片ライブラリーを表す複数の二本鎖ゲノムＤＮＡ断片に切断し、各二本鎖ゲノムＤＮＡ断片は、前記ゲノムＤＮＡ断片の各末端に固有のバーコード配列対のうちの一方を含む；
前記トランスポゾンＤＮＡと前記ゲノムＤＮＡ断片との間のギャップをギャップフィリングし、各末端にプライマー結合部位を有する二本鎖ゲノムＤＮＡ断片伸長産物のライブラリーを形成すること；
前記二本鎖ゲノムＤＮＡ断片伸長産物を増幅して、アンプリコンを生成すること；
前記アンプリコンを配列決定すること；並びに
前記ゲノムＤＮＡをデノボアセンブリするために、バーコードをマッチングさせることによって前記アンプリコン同士を計算的に連結すること、
を含む、デノボゲノムＤＮＡアセンブリの方法。
前記ゲノムＤＮＡが、単一細胞から得られた全ゲノムＤＮＡである、請求項２３に記載の方法。
前記トランスポザーゼが、Ｔｎ５トランスポザーゼ、Ｍｕトランスポザーゼ、Ｔｎ７トランスポザーゼ又はＩＳ５トランスポザーゼである、請求項２３に記載の方法。
前記トランスポゾンＤＮＡが、二本鎖１９ｂｐＴｎｐ結合部位及びオーバーハングを含み、前記オーバーハングは、バーコード配列及び前記オーバーハングの５’末端のプライマー結合部位を含む、請求項２３に記載の方法。
前記二本鎖ゲノムＤＮＡ断片のギャップフィリング及び伸長の前に、結合したトランスポザーゼが前記二本鎖断片から除去される、請求項２３に記載の方法。
前記トランスポザーゼが、トランスポゾンＤＮＡとそれぞれ複合体を形成したＴｎ５トランスポザーゼであり、前記トランスポゾンＤＮＡは、二本鎖１９ｂｐＴｎｐ結合部位及びオーバーハングを含み、前記オーバーハングは、バーコード配列及びプライマー結合部位を含む、請求項２３に記載の方法。
前記ゲノムＤＮＡが、出生前細胞に由来する、請求項２３に記載の方法。
前記ゲノムＤＮＡが、癌細胞に由来する、請求項２３に記載の方法。
前記ゲノムＤＮＡが、循環腫瘍細胞に由来する、請求項２３に記載の方法。
前記ゲノムＤＮＡが、単一の出生前細胞に由来する、請求項２３に記載の方法。
前記ゲノムＤＮＡが、単一の癌細胞に由来する、請求項２３に記載の方法。
前記ゲノムＤＮＡが、単一の循環腫瘍細胞に由来する、請求項２３に記載の方法。
前記プライマー結合部位が、特異的ＰＣＲプライマー結合部位である、請求項２３に記載の方法。
前記デノボアセンブリが、ハプロタイプ分解デノボアセンブリである、請求項２３に記載の方法。
非水相中に複数の水性微小液滴を生成すること、ここで、各微小液滴は、前記微小液滴内に形成された複数のトランスポソームを含み、全てのトランスポソームは、２つのトランスポザーゼ及び２つの同一のトランスポゾンＤＮＡを有し、各トランスポゾンＤＮＡは、トランスポザーゼ結合部位、バーコード配列及びプライマー結合部位を有する；
各微小液滴から前記複数のトランスポソームを放出し、放出されたトランスポソームを収集してトランスポソームライブラリーとすること；
反応容積内の試薬トランスポソームライブラリーを形成すること、ここで、前記試薬トランスポソームライブラリー内の実質的に全て又は全てのトランスポソームは、固有の紐付けされたバーコード配列を有する；
ゲノムＤＮＡを前記反応容積内の前記試薬トランスポソームライブラリーと接触させること、ここで、前記トランスポソームは、前記ゲノムＤＮＡに沿って並ぶ標的位置群に結合し、前記トランスポザーゼは、前記ゲノムＤＮＡを、ゲノムＤＮＡ断片ライブラリーを表す複数の二本鎖ゲノムＤＮＡ断片に切断し、各二本鎖ゲノムＤＮＡ断片は、前記ゲノムＤＮＡ断片の各末端に固有のバーコード配列対のうちの一方を含む；
前記トランスポゾンＤＮＡと前記ゲノムＤＮＡ断片との間のギャップをギャップフィリングし、前記反応容積内で、各末端にプライマー結合部位を有する二本鎖ゲノムＤＮＡ断片伸長産物のライブラリーを形成すること；
前記二本鎖ゲノムＤＮＡ断片伸長産物を増幅して、前記反応容積内にアンプリコンを生成すること；
前記反応容積内の前記アンプリコンを配列決定すること；並びに
前記ゲノムＤＮＡをデノボアセンブルするために、バーコードをマッチングさせることによって前記アンプリコン同士を計算的に連結すること、
を含む、デノボゲノムＤＮＡアセンブリの方法。
前記試薬トランスポソームライブラリーが、１，０００を超えるトランスポソームを含む、請求項３７に記載の方法。
前記試薬トランスポソームライブラリーが、１０，０００を超えるトランスポソームを含む、請求項３７に記載の方法。
前記試薬トランスポソームライブラリーが、１００，０００を超えるトランスポソームを含む、請求項３７に記載の方法。
前記試薬トランスポソームライブラリーが、１，０００，０００を超えるトランスポソームを含む、請求項３７に記載の方法。
前記試薬トランスポソームライブラリーが、２，０００，０００を超えるトランスポソームを含む、請求項３７に記載の方法。
前記試薬トランスポソームライブラリーが、３，０００，０００を超えるトランスポソームを含む、請求項３７に記載の方法。
前記試薬トランスポソームライブラリーが、４，０００，０００を超えるトランスポソームを含む、請求項３７に記載の方法。
前記試薬トランスポソームライブラリーが、５，０００，０００を超えるトランスポソームを含む、請求項３７に記載の方法。
前記試薬トランスポソームライブラリーが、１０，０００，０００を超えるトランスポソームを含む、請求項３７に記載の方法。
前記ゲノムＤＮＡが、単一細胞から得られた全ゲノムＤＮＡである、請求項３７に記載の方法。
前記トランスポザーゼが、Ｔｎ５トランスポザーゼ、Ｍｕトランスポザーゼ、Ｔｎ７トランスポザーゼ又はＩＳ５トランスポザーゼである、請求項３７に記載の方法。
前記トランスポゾンＤＮＡが、二本鎖１９ｂｐＴｎｐ結合部位及びオーバーハングを含み、前記オーバーハングは、バーコード配列及び前記オーバーハングの５’末端のプライマー結合部位を含む、請求項３７に記載の方法。
前記二本鎖ゲノムＤＮＡ断片のギャップフィリング及び伸長の前に、結合したトランスポザーゼが前記二本鎖断片から除去される、請求項３７に記載の方法。
前記トランスポザーゼが、トランスポゾンＤＮＡとそれぞれ複合体を形成したＴｎ５トランスポザーゼであり、前記トランスポゾンＤＮＡは、二本鎖１９ｂｐＴｎｐ結合部位及びオーバーハングを含み、前記オーバーハングは、バーコード配列及びプライマー結合部位を含む、請求項３７に記載の方法。
前記ゲノムＤＮＡが、出生前細胞に由来する、請求項３７に記載の方法。
前記ゲノムＤＮＡが、癌細胞に由来する、請求項３７に記載の方法。
前記ゲノムＤＮＡが、循環腫瘍細胞に由来する、請求項３７に記載の方法。
前記ゲノムＤＮＡが、単一の出生前細胞に由来する、請求項３７に記載の方法。
前記ゲノムＤＮＡが、単一の癌細胞に由来する、請求項３７に記載の方法。
前記ゲノムＤＮＡが、単一の循環腫瘍細胞に由来する、請求項３７に記載の方法。
前記プライマー結合部位が、特異的ＰＣＲプライマー結合部位である、請求項３７に記載の方法。
物理的に分離した複数の反応チャンバ内で、トランスポザーゼを複数のトランスポゾンＤＮＡと接触させ、それぞれの物理的に分離した反応チャンバ内でトランスポソームを形成すること、ここで、各トランスポゾンＤＮＡは、共通のトランスポザーゼ結合部位、共通のプライマー結合部位及びバーコード配列を含み、前記バーコード配列は、同じ反応チャンバ内の全てのトランスポゾンＤＮＡに対して同じであるが、他の反応チャンバ内のトランスポゾンＤＮＡとは異なる；
各反応チャンバから前記トランスポソームを集め、全ての前記トランスポソームを混合してトランスポソームライブラリーを形成すること；
反応容積内の試薬トランスポソームライブラリーを形成すること、ここで、前記試薬トランスポソームライブラリー内の実質的に全て又は全てのトランスポソームは、固有の紐付けされたバーコード配列を有する；
ゲノムＤＮＡを前記反応容積内の前記試薬トランスポソームライブラリーと接触させること、ここで、前記トランスポソームは、前記ゲノムＤＮＡに沿って並ぶ標的位置群に結合し、前記トランスポザーゼは、前記ゲノムＤＮＡを、ゲノムＤＮＡ断片ライブラリーを表す複数の二本鎖ゲノムＤＮＡ断片に切断し、各二本鎖ゲノムＤＮＡ断片は、前記ゲノムＤＮＡ断片の各末端に固有のバーコード配列対のうちの一方を含む；
前記トランスポゾンＤＮＡと前記ゲノムＤＮＡ断片との間のギャップをギャップフィリングし、前記反応容積内で、各末端にプライマー結合部位を有する二本鎖ゲノムＤＮＡ断片伸長産物のライブラリーを形成すること；
前記二本鎖ゲノムＤＮＡ断片伸長産物を増幅して、前記反応容積内にアンプリコンを生成すること；
前記反応容積内の前記アンプリコンを配列決定すること；並びに
前記ゲノムＤＮＡをデノボアセンブルするために、バーコードをマッチングさせることによって前記アンプリコン同士を計算的に連結すること、
を含む、デノボゲノムＤＮＡアセンブリの方法。
前記反応チャンバが、管、マルチウェルプレート、マイクロアレイチップ、マイクロウェル、マイクロリアクター、微小液滴、微粒子ヒドロゲル、又は他の区画化方法である、請求項５９に記載の方法。
前記ハプロタイプ分解デノボアセンブリが、ヒト単一細胞の、ヒト白血球抗原領域、Ｖ（Ｄ）Ｊ組換え領域、又は他の領域上にある、請求項２３に記載の方法。