Nothing Special   »   [go: up one dir, main page]

JP7071341B2 - 試料を識別する方法 - Google Patents

試料を識別する方法 Download PDF

Info

Publication number
JP7071341B2
JP7071341B2 JP2019513484A JP2019513484A JP7071341B2 JP 7071341 B2 JP7071341 B2 JP 7071341B2 JP 2019513484 A JP2019513484 A JP 2019513484A JP 2019513484 A JP2019513484 A JP 2019513484A JP 7071341 B2 JP7071341 B2 JP 7071341B2
Authority
JP
Japan
Prior art keywords
sequence
barcode
nucleotide
nucleotide barcode
sequences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019513484A
Other languages
English (en)
Other versions
JP2019523652A (ja
JP2019523652A5 (ja
Inventor
コペンズ,ハリー
Original Assignee
ディーネーム-アイティー エンフェー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP16169997.0A external-priority patent/EP3246412A1/en
Priority claimed from GBGB1701908.4A external-priority patent/GB201701908D0/en
Application filed by ディーネーム-アイティー エンフェー filed Critical ディーネーム-アイティー エンフェー
Publication of JP2019523652A publication Critical patent/JP2019523652A/ja
Publication of JP2019523652A5 publication Critical patent/JP2019523652A5/ja
Application granted granted Critical
Publication of JP7071341B2 publication Critical patent/JP7071341B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01LCHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
    • B01L3/00Containers or dishes for laboratory use, e.g. laboratory glassware; Droppers
    • B01L3/54Labware with identification means
    • B01L3/545Labware with identification means for laboratory containers
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01LCHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
    • B01L2300/00Additional constructional details
    • B01L2300/02Identification, exchange or storage of information
    • B01L2300/021Identification, e.g. bar codes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/179Modifications characterised by incorporating arbitrary or random nucleotide sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2545/00Reactions characterised by their quantitative nature
    • C12Q2545/10Reactions characterised by their quantitative nature the purpose being quantitative analysis
    • C12Q2545/101Reactions characterised by their quantitative nature the purpose being quantitative analysis with an internal standard/control
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/185Nucleic acid dedicated to use as a hidden marker/bar code, e.g. inclusion of nucleic acids to mark art objects or animals

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Clinical Laboratory Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Description

本発明は、多数の、独自(unique)の移動可能な分子識別バーコードを生成する方法、並びに生体試料等の物品の識別及び/又はそれらの処理におけるそれらのバーコードの使用に関する。本発明は、試料の入れ替わり及び試料の相互汚染、試料のトレーサビリティ等の問題をモニターする方法に関し、処理工程に対する内部対照を提供する。
DNA分子の添加による試料の内部識別のアイデアは、既に時代遅れとなって久しい。例えば、特許文献1は、試料の内部識別に対する方法及び組成物を記載する。
特許文献1は、経済的な方法で独自のDNAコードを得るためにDNA分子のミックスを使用する力を認める。DNAコードの特性決定に対して、サンガーシーケンシングに基づくPharmacia ALFの自動シーケンサーが使用される。
特許文献2は、赤外線(IR)マーカーで更に標識されたバイオマーカーとしてカプセル化DNAを利用して製品流用及び製品偽造に対抗するために製品を標識するラベリング/マーキング技術を記載する。セキュリティに関して、実際のDNAバイオマーカー配列は副次的な考察事項であった。
特許文献3は、複数の異なる一本鎖DNA配列の使用を認める。ここでは、現金輸送ボックスに対するセキュリティマーカーとしてDNAバーコードが使用される。しかしながら、種々の一本鎖型のDNA配列は、産生の間、開始時から混合されない。利用可能な異なる種類のオリゴヌクレオチドからDNAオリゴヌクレオチドを1種類だけ選択して、1個のカセットのインクリザーバに挿入するにすぎない。
特許文献4は、ゲノム中に存在することが知られていない1以上のオリゴヌクレオチドを含む基準マーカーを生体試料に添加する方法を開示する。添加される基準マーカーは、単一の配列であるか、又は種々の配列のミックスである。しかしながら、種々の配列のミックスを使用する目的は、更に高いレベルの特異性及び/又はセキュリティを提供するためであり、したがって、経済的な方法で多数の独自の基準マーカーを産生するためではない。
特許文献5は、セキュリティマーキングにおいてオリゴヌクレオチド又はバーコードの混合物を使用する。ここで混合物を使用する目的は、より短いオリゴヌクレオチドを使用して、単一のより大きな合成オリゴヌクレオチドを使用する場合に得ることができる独自のコードの数に匹敵し得る、十分数の多い独自のコードを生成することを可能とするために過ぎない。
特許文献6は、3個毎のDNA塩基が文字又は記号のいずれかを表す秘密のメッセージを暗号化するためにDNAフラグメントを使用する。その後、秘密のDNAは、DNAを隠している混合物中に隠される。秘密のDNAコードはプライマー配列で挟まれるため、増幅及び配列決定によって混合物を隠している複合体から特異的に呼び出すことができる。その後、コード化されたメッセージをセキュリティマーカー中のDNAフラグメントを配列決定し、解読のための暗号化参照表を使用して解読する。
特許文献7は、遺伝物質の検出及び識別の方法をモニターするためのヌクレオチド配列に基づくコードの使用を記載する。ヌクレオチド配列に基づくコードは、種々のDNA配列を利用するが、いずれも単一のより大きなDNA分子に配置される。したがって、その方法は、DNAコードの経済的な産生に対するDNA配列の混合物を使用する利益を有しない。
特許文献8は、種々の核酸の混合物を使用する識別又はマーキングの方法を開示する。しかしながら、特性決定のため、それらの方法は、配列決定するのではなく、異なる核酸タグ配列間を区別する根拠となる種々のサイズの複数の増幅産物をもたらす。
特許文献9は、複数のセキュリティマーカーの生成及びその検出に対する方法及びシステムを記載する。各セキュリティマーカーは、DNAテンプレートに対するプライマーとして使用されるオリゴヌクレオチドの混合物である。したがって、オリゴヌクレオチドは、rtDNA(リバーステンプレートDNA)オリゴヌクレオチドと称される。
特許文献10は、単一のDNA分子ではなく、移動可能な分子識別バーコードの根拠として、種々のDNA分子の混合物を使用する力を認める。
米国特許第5776737号 米国特許第6030657号 欧州特許第1488039号 米国特許出願公開第20120115154号 米国特許出願公開第20120135413号 米国特許第6312911号 米国特許第8785130号 国際公開第2014005184号 米国特許出願公開第20100285985号 欧州特許第2201143号
多様な製品及びサービスを含む産業界全体が、ラベルを中心として構築される。小売り産業では、ほとんどの製品が1D(線)及び2Dバーコードのラベルで標識され、小売り会社における製品在庫管理及びレジ管理を容易にしている。宅配サービスでは、パッケージをバーコードラベルで標識することで、世界中のパッケージの輸送を自動化することができ、顧客がパッケージの位置をリアルタイムに追跡することさえも可能である。また、検査室でも、調査される試料チューブはバーコードラベルで標識される。
しかしながら、これらの物品(製品、パッケージ、試料チューブ等)はいずれもその物品の外部(outside exterior)に標識される。その物品が開封され、物品の中身が取り出されると、物品の中身とバーコードとの結び付きが失われる。食料品及び輸送用パッケージについては、物品の包みを解くことは、通常(ほとんど)物品のライフサイクルの最終段階であるため、外部バーコードとの結び付きの喪失は問題ではない。しかしながら、生体試料が入った試料チューブ等の特定の物品については、実際の処理はその後にしか始まらない。
本発明者らは本明細書にて、物品の外部とその内容物の両方をバーコードで標識する解決策を提供する。物品の外側部分を物理的で巨視的なバーコードラベル(例えば、光学バーコード紙、又はRFID)で標識するのに対し、物品の内容物を移動可能な分子識別バーコードラベルで標識する。物理的ラベル及び移動可能な分子識別バーコードラベルはいずれも独自のものであり、1対1の関係を持つ。いずれか一方のバーコードラベルがわかっている場合、他方のバーコードもまたこの1対1の関連性に基づいてわかる。いずれか1つのバーコードラベル(例えば、物理的バーコードラベル)が更に第3のバーコードラベルと関連付けられる場合、他のバーコードラベル(この例では、移動可能な分子識別バーコード)もまたこの第3のバーコードラベルと関連付けられる。物理的バーコードラベルとは対照的に、移動可能な分子標識バーコードラベルを、物品の内容物の完全に下流の処理系統(processing chain)に移し、処理の終わりに読み取って、再度、全ての他の関連付けられたバーコードラベルと関連付けることができる。
ほとんどのプロセス、特に移動工程がある時はエラーが起こりやすい。これは、Vacutainer(商標)チューブ中の血液試料等の受取り器中の患者由来の生体試料の単離によって始まる診断検査にも当てはまる。印刷されたGS1バーコードラベル及びバーコードスキャナの使用はエラーを最小化し得るが、常にエラーを防止するものではない。実際、物品によっては、印刷されたバーコードラベルで標識することができないものもある。例えば、生体試料から単離されたDNAをポリメラーゼ連鎖反応(PCR)によって増幅する必要がある場合、DNAは小さいPCRチューブへと移される。印刷されたバーコードラベルは、かかる小さいチューブに貼るにはサイズが大きすぎ、及び/又はPCRプロセスに悪影響を及ぼす可能性がある。実際、PCRチューブの外壁に紙面ラベルを固定することは、PCRチューブの壁を通る効率的な熱伝達を妨げる場合があり、PCRに悪影響を及ぼし、更にはPCR増幅を妨げる可能性がある。そこで、PCRチューブは、単純に鉛筆で標識される。それでも、PCRチューブ上に記載が可能な場所は限られるため、独自のコードをチューブに記載することはとてもできない。処理の間に鉛筆で標識されたチューブから鉛筆で記載されたコードが消える時もある。多くの検査室は、標準業務手順(SOP:standard operating procedures)を使用し、LIMS(Laboratory Information ManagementSystem:実験室情報管理システム)を利用する。これらは、実際にエラーの可能性を減少させる、検査の種々の工程の間に行われる必要がある行為を詳細に記載し、またその行為を追跡するものであるが、これらの記載される行為が正しく実行され、試料が正しく操作されて入れ替わりがないことを常に保証するものではない。試料が入れ替わった場合、最終的に誤った検査結果が所与の患者に報告される。特に診断において、これらのエラーを許容することはできない。かかる試料の手違いによる混同は、病院及び検査室において時々起こる。18955名の妊婦からの血液試料の非侵襲性出生前検査の所見を報告した研究では、384名の血液試料(2%)に血液収集又は標識のエラーがあった(Norton et al., (2015)N. Engl. J. Med 372:1589-1597)。これらの試料が更に検査されることはなかったため、結果として誤った検査結果をもたらす可能性はなかった。しかしながら、かかる場合において、検査結果がなおも必要である場合には新たな血液試料を請求しなければならず、更に時間を要し、検査結果を遅延させ、結局は、その後に検査結果に基づいて措置が講じられ得る時間を超過し得ることさえある。新たな血液試料を請求することができなければ、何らの検査結果も与えることができない。しかしながら、検査が実際に行われる検査室では、検査プロセスの下流であってもエラーは起こる。消費者直結型の検査会社は、96名の顧客が検査室での手違いによって混同され、彼ら自身のものではない遺伝子データを再検討したと報告した。手違いによる混同は、試料を処理する間に1つの96ウェルプレートが誤って置かれるというヒューマンエラーによって引き起こされた(http://blog.23andme.com/23andme-and-you/update-from-23andme/)。
試料入れ替わりとは別に、試料又はその処理された試料派生物は、別の生体試料又はその処理された試料派生物によって汚染される可能性があり、ここでも誤った試験結果をもたらす場合がある。例えば、遺伝子検査では、所与の遺伝子座における所与の突然変異に対してホモ接合型である所与の試料は、その所与の遺伝子座の野生型アレルに対してホモ接合型、又は更にはヘテロ接合型である試料によって汚染されると、その所与の遺伝子座における突然変異に対してヘテロ接合状態であると、誤って結論付けられて報告される可能性がある。母体血液中の循環胎児のDNAを分析する検査では、胎児画分は少なくとも4%~10%であり、この画分において、全DNAバックグラウンドに対するDNAアノマリー(DNA anomaly)を検出しなければならない。したがって、全試料のわずかな汚染でさえ、検査を妨害するか、又は誤った試験結果をもたらすことさえあり得る。血液試料又は他の生体試料における循環腫瘍DNAを分析する検査についても同じことが当てはまる。217個の完全ゲノムを配列決定した研究では、7個の試料(3.2%)が汚染DNAを含有することがわかった(Taylor et al., 2015)。したがって、試料の汚染又は混合のトレーサビリティに対する要求も明らかに存在する。
また、商業及びセキュリティの分野においても物品に印をつけること及び/又は追跡することは非常に興味がもたれている。例えば、多くの製品は、製品のアイデンティティ(identity)又はソースの特定を可能とするタグで印がつけられる。他の状況では、製品のトラッキングを可能とするための手段としてタグで製品に印をつける。また、かかるマーキング及び追跡のシステムは、対象が或る場所から他へと移る際に、その経路及び/又はタイミングを追跡するためにも使用され得る。
また、マーキングシステムは、純正品を識別し、純正品と模造品とを区別するため、又は並行輸入の場合を識別するために使用され得る。
また、食品産業界等で、物質が別の製品又は環境を汚染する状況で生じ得るような、製品の供給源を識別することを必要とし得る状況も存在する。
本発明では、分子の混合物は、物品の独自の内部可溶性標識(soluble labelling)に使用され、それは、これらの物品及び/又はそれらの処理の明白な識別を可能とし、以下の基準の1以上を満たす。
DNA分子の混合物が内部標識に使用される場合、
本明細書で移動可能な分子識別バーコードと称される独自のDNAコードの経済的な産生を可能とするため、単一のDNA分子ではなくDNA分子の混合物を使用する。この方法では、ごく限られた数のDNA分子が、優先的に一度だけ使用される多数の独自DNAコードの経済的な産生を可能とする。
かかる移動可能な分子識別バーコードは物品又は試料の独自の識別に使用されることから、それらのバーコード自体が最も厳密な品質条件下で産生されることが重要である。産生される移動可能な分子識別バーコード、又はかかる移動可能な分子識別バーコードを含む収集器の品質管理は、そのバーコードがそれ以上使用され得ないように、その移動可能な分子識別バーコード/収集器の破壊をもたらす。上記バーコードが更に使用される場合、実際に2回以上使用されれば、移動可能な分子識別バーコードは一意的に使用されない。したがって、移動可能な分子識別バーコードとしての単一の独自DNA分子は、産生後の品質管理を可能としない。移動可能な分子識別バーコード混合物が限定された数のDNA分子から開始して産生される場合、ごく少数の移動可能な分子識別バーコードチューブを品質管理のために産生後に犠牲にする。予想される配列がこれらの犠牲にされた移動可能な分子識別バーコードに見られる場合、他の犠牲にされていない移動可能な分子識別バーコード中の配列もまた、正しいと結論付けることができる。
DNA分子対を使用して、移動可能な分子識別バーコードを生成する。DNA分子の混合物を、少数のDNA分子から開始する独自の移動可能な分子識別バーコードの産生に使用する場合、幾つかの移動可能な分子識別バーコードは共通して特定のDNA分子を保有する。実際、移動可能な分子識別バーコードは、なおも独自の混合物となるように、1つを除き全てのDNA分子を共有し得る。移動可能な分子標識バーコードの処理の間に混合物の1以上のDNA分子の処理に失敗したため検出されない場合は、移動可能な分子識別バーコードを、処理されたDNA分子を共有する他の全ての移動可能な分子識別バーコードと区別することはできない。この問題は、DNA分子対、又は更にはトリプレット若しくはそれ以上のDNA分子の使用により回避される。
移動可能な分子識別バーコードは、場合によっては他の標的核酸と共に、並行法によって処理され、特性決定されるため、DNA群が処理の間に完全に分離される又は分割されることがない。そうでない場合には、独立した移動工程は処理の間に隣り合って開始し、入れ替わりやすいため、隣り合って開始された各工程の結果が再度結果と結び付けられる際に、移動可能な分子識別バーコード及び/又は試料の誤った特性決定をもたらす可能性がある。配列決定が使用される場合、並行配列決定法を使用しなければならない。
各移動可能な分子識別バーコード中の全てのDNA分子は、配列が十分異なっていなければならない。実際、高度並行配列決定法を使用する場合、シーケンシングエラーは単一の読取りレベルで1%~15%で変動する。混合物が、ヌクレオチド1個のみが異なる2以上のDNA分子を含む場合、増幅及び/又は配列決定のエラーは、移動可能な分子識別バーコードを別の移動可能な分子識別バーコードに誤って分類する。
本発明の或る一つの態様は、核酸を含む複数の生体試料のアイデンティティを識別する方法に関し、
核酸を含む生体試料を各々含む複数の担体を準備する工程であって、
各担体が、該担体を標識するための少なくとも2つの核酸を含み、
少なくともこの核酸の各々が少なくとも4ヌクレオチド長の異なるヌクレオチドバーコード配列を含み、
これらの異なるヌクレオチドバーコード配列の組み合わせが移動可能な分子識別バーコードを生成することによって、各移動可能な分子識別バーコードが収集物中の担体の各々に対して異なり、
ヌクレオチドバーコード配列の片側又は両側に、1以上のヌクレオチドバーコード配列識別子配列が隣接することを特徴とし、これが上記ヌクレオチドバーコード配列の識別を可能として、
各担体が、上記担体に貼り付けられた移動可能な分子識別バーコードに対応するバーコードラベルを含む、工程と、
上記試料の核酸配列中の1以上の標的配列を配列決定するとともに上記ヌクレオチドバーコード配列を含む核酸の一部を配列決定する工程と、
核酸中の上記配列決定されたヌクレオチドバーコード配列から各担体の移動可能な分子識別バーコードを特定する工程であって、
上記配列データ内で、ヌクレオチドバーコード配列を含むそれらの配列を選択する工程を含み、
ここで、上記選択工程が、規定の距離でヌクレオチドバーコード配列に隣接する定常配列に基づいて、ヌクレオチドバーコード配列を含む所定の長さの配列の存在を識別すること、及び選択された配列データ内の上記ヌクレオチドバーコード配列を特定することを含む、工程と、
上記特定された移動可能な分子識別バーコードと、上記担体によって提供されるバーコードラベルとを照合して、上記試料のアイデンティティを識別する工程と、
を含む、方法に関する。
その実施の形態では、上記核酸を含む試料は、胎児DNA又は腫瘍DNA等の循環DNAを含む。
上記方法の実施の形態は、上記試料中の上記標的配列又はそのフラグメントに対して、及び上記ヌクレオチドバーコード配列を含む上記核酸に対してアダプターを連結する工程を含むとともに、上記標的配列及び上記ヌクレオチドバーコード配列を、上記連結アダプターを配列決定テンプレートとして使用して配列決定する工程を含む。
上記方法の実施の形態は、上記核酸試料中の標的配列の濃縮工程を行うとともに、上記バーコード配列の濃縮工程を行う工程を含む。
本発明の方法は、多重アッセイを包含する。
上記方法の実施の形態は、試料の上記標的配列に対して、試料特異的タグを付着させる工程であって、任意に、添加された上記試料中のヌクレオチドバーコード配列を含む上記核酸に対しても、同じ試料特異的タグを付着させる、工程を含む。
上記方法の実施の形態では、濃縮されたヌクレオチドバーコード配列及び濃縮された標的配列の配列決定は、並行配列決定法によって行われる。
上記方法の実施の形態では、上記並行配列決定法は、異なる試料に由来する濃縮されたヌクレオチドバーコード配列及び濃縮された標的配列をプールすることによって進められる。
上記方法の実施の形態では、更に異なる移動可能な分子識別バーコードを定義する、更に異なるヌクレオチドバーコード配列のセットを、上記方法の後の工程においてポリヌクレオチド試料に添加する。
上記方法の実施の形態では、標的配列の濃縮のためのオリゴヌクレオチドは、バーコードの増幅のための濃縮のための移動可能な分子識別バーコードヌクレオチドに対して過剰である、又は上記方法の実施の形態では、バーコードの増幅のための濃縮のための上記移動可能な分子識別バーコードオリゴヌクレオチドは、標的配列の濃縮のためのオリゴヌクレオチドに対して過剰である。
上記方法の実施の形態では、ヌクレオチドバーコード配列を含む核酸は、配列決定される標的DNAに類似する長さを有する。
上記方法の実施の形態では、担体中の上記ヌクレオチドバーコード配列は、それらを配列決定する前には上記担体のユーザーに対して未知であり、特定された移動可能な分子識別バーコードと、提供されるバーコードラベルとを照合する工程は、移動可能な分子識別バーコードとバーコードラベルとの関係を含むデータベースを調べることによって行われる。
本発明の別の態様は、物品において標識するための核酸を含む担体の収集物に関し、
各担体が標識するための少なくとも2つの核酸を含み、
各核酸が少なくとも4ヌクレオチド長の異なるヌクレオチドバーコード配列を含み、
これらの異なるヌクレオチドバーコード配列の組み合わせが、移動可能な分子識別バーコードを生成することによって、各移動可能な分子識別バーコードが上記収集物中の担体の各々に対して異なり、
上記ヌクレオチドバーコード配列の片側又は両側に、1以上のヌクレオチドバーコード配列識別子配列が隣接することを特徴とし、これが上記ヌクレオチドバーコード配列の識別を可能として、
各担体が、上記担体上に貼り付けられた移動可能な分子識別バーコードに対応するバーコードラベルを含む。
特定の実施の形態では、担体の収集物は、上記担体上への又は上記担体内へのDNA含有試料等の生体試料の塗布(application)に適している。
その実施の形態では、上記担体は、1以上の安定剤、防腐剤、洗浄剤、中和剤、ヌクレアーゼ阻害剤、還元剤、又は失活剤(quenchingagent)を含む。
特定の実施の形態では、各担体は、少なくとも3つの上記核酸を含む。
特定の実施の形態では、上記ヌクレオチドバーコード配列は、捕捉又は増幅によってヌクレオチドバーコード配列を濃縮するためのオリゴヌクレオチド配列と隣接する。
特定の実施の形態では、上記ヌクレオチドバーコード配列を濃縮するためのオリゴヌクレオチド配列は、プライマー伸長に続くライゲーション等の1段階PCR、又はプライマー伸長に続くPCR等の2段階PCR、環状化に基づく増幅、及びナノポアシーケンシングからなる群から選択される方法に対するものである。
特定の実施の形態では、上記ヌクレオチドバーコード配列の片側又は両側に、1以上のオリゴヌクレオチド結合配列が隣接し、ヌクレオチドバーコード配列中の片方又は両方のオリゴヌクレオチド結合配列のハイブリダイゼーションに基づく配列捕捉を可能とする。
特定の実施の形態では、上記ヌクレオチドバーコード配列に、PCRプライマーに対するプライマー結合配列が隣接し、それが上記バーコードの増幅及び配列決定を可能とする。
特定の実施の形態では、上記バーコードの配列決定のためのヌクレオチドバーコード配列に、プライマー結合配列が隣接している。
特定の実施の形態では、バーコード配列を含む核酸は、例えば上記ベクターの断片化又は消化によって得られる、クローニングベクターのフラグメントに含まれる。
典型的な実施の形態では、担体は生体試料を受け取るための容器である。
典型的な実施の形態では、担体は、生体試料を塗布する及び/又は固定化するための基体である。
上に記載される担体の収集物は、100個~100万個の担体、1000万個までの担体、1億個までの担体、1億個超の担体を含む。
別の態様は、移動可能な分子識別バーコードを含む担体の収集物を作製する方法であって、
a)バーコード配列が上記収集物中の核酸の間で異なり、1以上のヌクレオチドバーコード配列識別子配列を有して、これが核酸中のヌクレオチドバーコード配列の存在の識別を可能とする、少なくとも4ヌクレオチド長のヌクレオチドバーコード配列を含む種々の核酸の第1の収集物を準備する工程と、
b)各担体に対して、工程a)の少なくとも2つの核酸の組み合わせを添加して、ヌクレオチドバーコード配列における相違によって定義される独自の移動可能な分子識別バーコードを各々有する担体の収集物を得る工程と、
c)各担体を、異なるヌクレオチドバーコード配列によって定義される移動可能な分子識別バーコードに対応するラベルで標識する工程と、
d)上記ラベルと、移動可能な分子識別バーコード中の上記ヌクレオチドバーコード配列の配列との関係を保存する工程と、
を含む、方法に関する。
これらの方法の実施の形態では、工程c)における標識、及び工程d)における保存は、担体の後のユーザーが、種々のヌクレオチドバーコード配列が特定されるまで、上記ラベルと移動可能な分子識別バーコードとの関係を推測することができないように行われる。
これらの方法の実施の形態では、種々のヌクレオチドバーコード配列で複数の核酸を定義することによって、核酸の第2の収集物は工程b)に先立って作製され、工程b)において、少なくとも3つの複数の核酸の独自の組み合わせが各担体に添加される。
これらの方法の実施の形態では、上記第2の収集物は、複数の核酸を共に添加することによって調製される。
これらの方法の実施の形態では、複数とは2つの核酸の対である。
本発明の別の態様は、移動可能な分子識別バーコードを含むベクターを有する宿主の収集物を作製する方法であって、
a)宿主において核酸ベクターの第1の収集物を準備する工程であって、
ここで、上記ベクターが、上記収集物における核酸ベクター間で異なる少なくとも4ヌクレオチド長のヌクレオチドバーコード配列を含み、
ヌクレオチドバーコード配列の片側又は両側に、上記バーコードの識別を可能とする1以上のヌクレオチドバーコード配列識別子配列を含む、工程と、
b)上記宿主の個々のコロニーを準備するとともに複数のコロニーに対する核酸ベクター中のバーコードを配列決定して、単離されたコロニーの第2の収集物を得る工程であって、
ここで、各コロニーが異なるヌクレオチドバーコード配列を有する核酸ベクターを含む、工程と、
を含む、方法に関する。
本発明の別の態様は、移動可能な分子識別バーコードを含む担体の収集物を作製する方法であって、
a)前述の項に記載の宿主の収集物を準備する工程と、
b)コロニーの選択のため、上記コロニーから上記ベクターを単離する工程と、
c)上記担体の収集物中の各担体に、工程b)の異なるヌクレオチドバーコード配列を有する少なくとも2つの核酸ベクターの組み合わせを添加し、
担体間において、ヌクレオチドバーコード配列における相違によって定義される、独自の移動可能な分子識別バーコードを各々有する担体の収集物を得る工程と、
d)各担体を、異なるヌクレオチドバーコード配列によって定義される、上記移動可能な分子識別バーコードに対応するラベルで標識する工程と、
e)上記ラベルと、上記移動可能な分子識別バーコード中の上記ヌクレオチドバーコード配列の配列との関係を保存する工程と、
を含む、方法に関する。
これらの方法の実施の形態では、工程c)の後、ベクターを制限酵素によって断片化する。
これらの方法の実施の形態では、工程d)における標識、及び工程e)における保存は、担体の後のユーザーが、種々のヌクレオチドバーコード配列が特定されるまで、上記ラベルと移動可能な分子識別バーコードとの関係を推測することができないように行われる。
これらの方法の実施の形態では、工程c)に先立って、ベクターの更なる収集物は、複数の単離された核酸ベクターを定義することによって工程b)の収集物から調製され、ここで複数の各ベクターは異なるヌクレオチドバーコード配列を有する。
本発明は、以下の記載を更に含む:
1.核酸を含む複数の生体試料のアイデンティティを識別する方法であって、
基体又は容器である、核酸を含む生体試料を各々が含有する複数の担体を準備する工程であって、
ここで、各担体が、上記核酸を含む試料に加えて、上記担体を標識するための少なくとも2つのヌクレオチドバーコード核酸を含み、
これらの少なくとも2つのヌクレオチドバーコード核酸の各々が、少なくとも4ヌクレオチド長の異なる最小ヌクレオチドバーコード配列を含み、
これらの異なるヌクレオチドバーコード核酸の組み合わせが、移動可能な分子識別バーコードを生成することによって、各移動可能な分子識別バーコードが上記担体の各々に対して異なり、
上記少なくとも2つのヌクレオチドバーコード核酸中の上記最小ヌクレオチドバーコード配列の片側又は両側に、全てのヌクレオチドバーコード核酸において同一である非ウイルス性及び非細菌性のヌクレオチドバーコード配列識別子配列が隣接し、
片側又は両側に全てのヌクレオチドバーコード核酸において同一である非ウイルス性及び非細菌性の抽出配列が隣接することを特徴とし、これらが上記最小ヌクレオチドバーコード配列の識別を可能として、
各担体が、上記担体に貼り付けられた移動可能な分子識別バーコードに対応する巨視的なバーコードラベルを含む、工程と、
上記生体試料の上記核酸中の1以上の標的配列を配列決定するとともに、上記最小ヌクレオチドバーコード配列を含む上記ヌクレオチドバーコード核酸中の標的配列を配列決定する工程であって、
上記生体試料の上記核酸中の上記標的配列の配列決定、及び上記最小ヌクレオチドバーコード配列を含む上記ヌクレオチドバーコード核酸の標的配列の配列決定が並行配列決定法によって行われ、
上記並行配列決定法が、任意に、異なる試料に由来する、上記生体試料の上記核酸中の標的配列、及び上記最小ヌクレオチドバーコード配列を含む上記ヌクレオチドバーコード核酸の標的配列をプールすることによって進められる、工程と、
上記得られた配列データから、ヌクレオチドバーコード核酸に由来する上記配列を特定し、選択する工程であって、上記得られた配列データから、ヌクレオチドバーコード核酸に由来するそれらの配列を選択する工程を含み、
上記選択工程が、上記最小ヌクレオチドバーコード配列に近接した1以上のヌクレオチドバーコード配列識別子配列を有する配列の識別を含む、工程と、
ヌクレオチドバーコード配列識別子配列を有する上記単離された配列内の上記最小ヌクレオチドバーコード配列を特定し、選択する工程であって、
規定の長さで2つの抽出配列間に存在する上記配列を選択し、又は規定の長さで1つの抽出配列に近接して存在する上記配列を選択し、
これらの選択された配列を最小ヌクレオチドバーコード配列として特定する工程を含む、工程と、
上記特定された最小ヌクレオチドバーコード配列と、上記予想される最小ヌクレオチドバーコード配列とを、上記担体によって提供される巨視的なバーコードラベルに基づいて照合することにより、上記試料のアイデンティティ及び/又は汚染を識別する工程と、
を含む、方法。
2.上記試料中の上記標的核酸に対して、及び上記ヌクレオチドバーコード配列を含む上記核酸に対してアダプターを連結する工程を含むとともに、
上記標的配列及び上記ヌクレオチドバーコード配列を、上記連結生成物を配列決定テンプレートとして使用して配列決定する工程を含む、記載1に記載の方法。
3.上記核酸試料中の標的配列の濃縮工程を行うとともに、上記ヌクレオチドバーコード配列の濃縮工程を行う工程を含む、記載1又は2に記載の方法。
4.試料の上記標的配列に対して、試料特異的プール化バーコードを付着させる工程であって、任意に、上記試料中の上記ヌクレオチドバーコード配列を含む上記核酸に対しても、同じ試料プール化バーコードを付着させる、工程を含む、記載1~3のいずれか1つに記載の方法。
5.上記ヌクレオチドバーコード配列が、上記標的核酸又は配列決定される濃縮された標的ヌクレオチド配列に類似する長さを有する、記載1~4のいずれか1つに記載の方法。
6.試料を収集する工程と、上記試料から核酸を単離する工程とを含む方法であって、
標識のための少なくとも2つのヌクレオチドバーコード核酸の第1のセットが上記収集された試料に添加され、
標識のための少なくとも2つのヌクレオチドバーコード核酸の第2のセットが上記単離された核酸に添加される、記載1~5のいずれか1つに記載の方法。
7.物品を標識するための核酸を含む、基体又は容器である担体の収集物であって、
各担体が、標識のため、試料核酸以外に、少なくとも2つのヌクレオチドバーコード核酸を含み、
各ヌクレオチドバーコード核酸が少なくとも4ヌクレオチド長の異なる最小ヌクレオチドバーコード配列を含み、
ここで、上記異なるヌクレオチドバーコード核酸の少なくとも2つが同じ長さの最小ヌクレオチドバーコード配列を有し、
これらの異なるヌクレオチドバーコード核酸の組み合わせが移動可能な分子識別バーコードを生成することによって、かかる各移動可能な分子識別バーコードが上記収集物における上記担体の各々に対して異なり、
上記少なくとも2つのヌクレオチドバーコード核酸中の上記最小ヌクレオチドバーコード配列の片側若しくは両側に、全てのヌクレオチドバーコード核酸において同一である非ウイルス性及び非細菌性のヌクレオチドバーコード配列識別子配列が隣接する、及び/又は片側若しくは両側に、全てのヌクレオチドバーコード核酸において同一である非ウイルス性及び非細菌性の抽出配列が隣接することを特徴とし、これらが上記ヌクレオチドバーコード配列の識別を可能とし、
各担体が、上記担体に貼り付けられた上記移動可能な分子識別バーコードに対応する巨視的なバーコードラベルを含む、担体の収集物。
8.標識のための上記ヌクレオチドバーコード核酸が核酸をRNAに転写するための配列を含まない、記載7に記載の収集物。
9.上記担体が、上記担体上又は上記担体中での生体試料の適用に適している、記載7又は8に記載の担体の収集物。
10.上記試料がDNA含有試料である、記載7~9のいずれか1つに記載の担体の収集物。
11.上記試料がRNA含有試料である、記載7~9のいずれか1つに記載の担体の収集物。
12.上記最小ヌクレオチドバーコード配列に、増幅によって上記最小ヌクレオチドバーコード配列を濃縮するためのオリゴヌクレオチド配列が隣接し、又は、
上記最小ヌクレオチドバーコード配列の片側若しくは両側に1以上のオリゴヌクレオチド結合配列が隣接し、
これらが上記ヌクレオチドバーコード配列中の片方又は両方のオリゴヌクレオチド結合配列におけるハイブリダイゼーションに基づく配列捕捉を可能とする、記載7~11のいずれか1つに記載の担体の収集物。
13.上記少なくとも2つのヌクレオチドバーコード核酸中の上記最小ヌクレオチドバーコード配列の片側若しくは両側に、全てのヌクレオチドバーコード核酸において同一である非ウイルス性及び非細菌性のヌクレオチドバーコード配列識別子配列が隣接する、及び/又は片側若しくは両側に、全てのヌクレオチドバーコード核酸において同一である非ウイルス性及び非細菌性の抽出配列が隣接する、記載12に記載の収集物。
14.上記増幅が、1段階PCR、2段階PCR、プライマー伸長に続くライゲーション及びPCR、環状化に基づく増幅、並びにナノポアシーケンシングからなる群から選択される、記載7~13のいずれか1つに記載の担体の収集物。
15.上記最小ヌクレオチドバーコード配列にPCRプライマーに対するプライマー結合配列が隣接し、それが上記最小ヌクレオチドバーコード配列の増幅及び配列決定を可能とし、任意に、ヌクレオチドバーコード配列識別子配列及び抽出配列の増幅及び配列決定を可能とする、記載7~14のいずれか1つに記載の担体の収集物。
16.上記ヌクレオチドバーコード核酸がクローニングベクターのフラグメント中に含まれる、記載7~15のいずれか1つに記載の担体の収集物。
17.上記ヌクレオチドバーコード核酸が、上記ベクターの断片化又は消化によって得られるフラグメントである、記載7~16のいずれか1つに記載の担体の収集物。
18.上記ベクター又はベクターフラグメントが、配列番号1~配列番号20からなる群から選択される配列を含む、記載16又は17に記載の担体の収集物。
19.上記ベクター又はベクターフラグメントが、配列番号1及び配列番号11の配列を含む、記載16又は17に記載の担体の収集物。
20.上記ヌクレオチドバーコード配列を含む核酸を捕捉するため、1以上のプライマーを更に含む、記載7~19のいずれか1つに記載の担体の収集物。
21.上記ヌクレオチドバーコード配列を含む核酸を増幅するため、1以上のプライマーを更に含む、記載7~20のいずれか1つに記載の担体の収集物。
22.移動可能な分子識別バーコードを含む、基体又は容器である担体の収集物を作製する方法であって、
a)少なくとも4ヌクレオチドの最小ヌクレオチドバーコード配列を含む、異なるヌクレオチドバーコード核酸の第1の収集物を準備する工程であって、
上記異なるヌクレオチドバーコード核酸の少なくとも2つが同じ長さの最小ヌクレオチドバーコード配列を有し、
その上記最小ヌクレオチドバーコード配列が、上記収集物中の上記ヌクレオチドバーコード核酸の間で、並びに1以上の非ウイルス性及び非細菌性のヌクレオチドバーコード配列識別子配列及び/又は1以上の非ウイルス性及び非細菌性の抽出配列で異なり、これらがヌクレオチドバーコード核酸中の上記最小ヌクレオチドバーコード配列の識別を可能とする、工程と、
b)工程a)の上記ヌクレオチドバーコード核酸の少なくとも2つの組み合わせを各担体に添加して、最小ヌクレオチドバーコード配列のミックスにおける相違によって定義される独自の移動可能な分子識別バーコードを各々有する担体の収集物を得る工程と、
c)各担体を、上記最小ヌクレオチドバーコード配列の異なるミックスによって定義される上記移動可能な分子識別バーコードに対応する巨視的なバーコードラベルで標識する工程と、
d)上記巨視的なラベルと、上記移動可能な分子識別バーコード中の最小ヌクレオチドバーコード配列のミックスとの関係を保存する工程と、
を含む、方法。
23.上記少なくとも2つのヌクレオチドバーコード核酸中の上記最小ヌクレオチドバーコード配列の片側若しくは両側に、全てのヌクレオチドバーコード核酸において同一である非ウイルス性及び非細菌性のヌクレオチドバーコード配列識別子配列が隣接する、及び/又は片側若しくは両側に、全てのヌクレオチドバーコード核酸において同一である非ウイルス性及び非細菌性の抽出配列が隣接する、記載22に記載の方法。
24.上記異なる核酸の第1の収集物が核酸をRNAに転写するための配列を含まない、記載22又は23に記載の方法。
25.ヌクレオチドバーコード核酸が配列番号1~配列番号20からなる群から選択される配列を含む、記載22~24のいずれか1つに記載の方法。
26.上記ヌクレオチドバーコード核酸が配列番号1及び配列番号11の配列を含む、記載22~25のいずれか1つに記載の方法。
27.工程c)における標識及び工程d)における保存が、上記担体の後のユーザーが、上記巨視的なバーコードラベルと移動可能な分子識別バーコードとの関係を、上記異なるヌクレオチドバーコード配列が特定されるまで推測することができないように行われる、記載22~26のいずれか1つに記載の方法。
28.ヌクレオチドバーコード配列を含むベクターを有する宿主の収集物を作製する方法であって、
a)宿主において核酸ベクターの第1の収集物を準備する工程であって、
上記ベクターが、上記収集物中のヌクレオチドバーコード核酸ベクター間で異なる少なくとも4ヌクレオチド長の最小ヌクレオチドバーコード配列を有するヌクレオチドバーコード配列を含み、
上記異なるヌクレオチドバーコード配列の少なくとも2つが、同じ長さの最小ヌクレオチドバーコード配列を有して、上記最小ヌクレオチドバーコード配列の片側又は両側に、1以上の非ウイルス性及び非細菌性のヌクレオチドバーコード配列識別子配列、及び/又は1以上の非ウイルス性及び非細菌性の抽出配列を含み、これらが上記最小ヌクレオチドバーコード配列の識別を可能とする、工程と、
b)上記宿主の個々のコロニーを準備し、複数のコロニーに対して、上記核酸ベクター中の上記ヌクレオチドバーコード配列を配列決定して、単離されたコロニーの第2の収集物を得る工程であって、
各コロニーが異なるヌクレオチドバーコード配列を有する核酸ベクターを含む、工程と、
を含む、方法。
29.上記核酸ベクターが、核酸をRNAに転写するための配列を含まない、記載28に記載の方法。
30.上記ベクターが配列番号1~配列番号20からなる群から選択される配列を含む、記載28又は29に記載の方法。
31.上記ベクターが配列番号1及び配列番号11の配列を含む、記載28又は29に記載の方法。
32.移動可能な分子識別バーコードを含む、基体又は容器である担体の収集物を作製する方法であって、
a)記載28に記載の宿主の収集物を準備する工程と、
b)コロニーの選択のため、上記コロニーから上記ベクターを単離する工程と、
c)上記担体の収集物中の各担体に、異なるヌクレオチドバーコード配列を有する少なくとも2つの核酸ベクターの組み合わせを添加する工程であって、
上記核酸ベクターの少なくとも2つが、担体間において、最小ヌクレオチドバーコード配列のミックスにおける相違によって定義される、独自の移動可能な分子識別バーコードを各々有する担体の収集物を得るため、工程b)の同じ長さの最小ヌクレオチドバーコード配列を有し、
任意に、制限酵素によって上記ベクターを断片化する、工程と、
d)各担体を、上記異なる最小ヌクレオチドバーコード配列のミックスによって定義される、上記移動可能な分子識別バーコードに対応する巨視的なバーコードラベルで標識する工程と、
e)上記巨視的なバーコードラベルと、上記移動可能な分子識別バーコード中の上記最小ヌクレオチドバーコード配列の配列との関係を保存する工程と、
を含む、方法。
33.担体のセットにおいてヌクレオチドバーコード核酸を追跡する方法であって、
上記担体を標識するための少なくとも2つのヌクレオチドバーコード核酸を含み、ゲノムDNA又はRNAを含まない、複数の担体を準備する工程であって、
これらの少なくとも2つのヌクレオチドバーコード核酸の各々が、少なくとも4ヌクレオチド長の異なる最小ヌクレオチドバーコード配列を含み、
これらの異なるヌクレオチドバーコード核酸の組み合わせが、移動可能な分子識別バーコードを生成することによって、各移動可能な分子識別バーコードが上記担体の各々に対して異なり、
上記少なくとも2つのヌクレオチドバーコード核酸中の上記最小ヌクレオチドバーコード配列の片側又は両側に、全てのヌクレオチドバーコード核酸において同一である非ウイルス性及び非細菌性のヌクレオチドバーコード配列識別子配列が隣接し、片側又は両側に、全てのヌクレオチドバーコード核酸において同一である非ウイルス性及び非細菌性の抽出配列が隣接することを特徴とし、これらが上記最小ヌクレオチドバーコード配列の識別を可能として、
各担体が、上記担体に貼り付けられた上記移動可能な分子識別バーコードに対応する巨視的なバーコードラベルを含む、工程と、
上記最小ヌクレオチドバーコード配列を含む、上記ヌクレオチドバーコード核酸中の標的配列を、並行配列決定法によって配列決定する工程であって、
上記並行配列決定法が、任意に、上記最小ヌクレオチドバーコード配列を含む上記ヌクレオチドバーコード核酸の標的配列をプールすることによって進められる、工程と、
上記得られた配列データから、ヌクレオチドバーコード核酸に由来する上記配列を特定し、選択する工程であって、上記得られた配列データから、ヌクレオチドバーコード核酸に由来するそれらの配列を選択する工程を含み、
上記選択工程が、上記最小ヌクレオチドバーコード配列に近接した1以上のヌクレオチドバーコード配列識別子配列を有する配列の識別を含む、工程と、
ヌクレオチドバーコード配列識別子配列を有する上記単離された配列内の上記最小ヌクレオチドバーコード配列を特定し、選択する工程であって、
規定の長さで2つの抽出配列間に存在する上記配列を選択し、又は規定の長さで1つの抽出配列に近接して存在する上記配列を選択し、これらの選択された配列を最小ヌクレオチドバーコード配列として特定する工程を含む、工程と、
上記特定された最小ヌクレオチドバーコード配列と、上記予想される最小ヌクレオチドバーコード配列とを、上記担体によって提供される上記巨視的なバーコードラベルに基づいて照合する工程と、
を含む、方法。
34.核酸を含む複数の生体試料のアイデンティティを識別する方法であって、
基体又は容器である、核酸を含む生体試料を各々が含有する複数の担体を準備する工程であって、
ここで、各担体が、核酸を含む試料に加えて、上記担体を標識するための少なくとも2つのヌクレオチドバーコード核酸を含み、
これらの少なくとも2つのヌクレオチドバーコード核酸の各々が、少なくとも4ヌクレオチド長の異なる最小ヌクレオチドバーコード配列を含み、
これらの異なるヌクレオチドバーコード核酸の組み合わせが移動可能な分子標識バーコードを生成することによって、各移動可能な分子識別バーコードが担体の各々に対して異なり、
上記少なくとも2つのヌクレオチドバーコード核酸中の上記最小ヌクレオチドバーコード配列の片側又は両側に、全てのヌクレオチドバーコード核酸において同一である非ウイルス性及び非細菌性の抽出配列が隣接することを特徴とし、
各担体が、上記担体に貼り付けられた移動可能な分子識別バーコードに対応する巨視的なバーコードラベルを含む、工程と、
上記生体試料における核酸中の1以上の標的配列を配列決定するとともに、最小ヌクレオチドバーコード配列を含むヌクレオチドバーコード核酸中の標的配列を配列決定する工程であって、
上記生体試料の核酸中の標的配列の配列決定、及び上記最小ヌクレオチドバーコード配列を含むヌクレオチドバーコード核酸の標的配列の配列決定が、並行配列決定法によって行われ、
上記並行配列決定法が、任意に、上記生体試料の核酸中の濃縮された標的配列、及び異なる試料に由来する最小ヌクレオチドバーコード配列を含むヌクレオチドバーコード核酸の標的配列をプールすることによって進められる、工程と、
得られた配列データから、最小ヌクレオチドバーコード配列を特定し、選択する工程であって、規定の長さにおける2つの抽出配列間に存在する配列を選択し、又は既定の長さにおける1つの抽出配列に隣接して存在する配列を選択し、
これらの選択された配列を最小ヌクレオチドバーコード配列として特定する工程を含む、工程と、
上記特定された最小ヌクレオチドバーコード配列と、上記予想される最小ヌクレオチドバーコード配列とを、担体によって提供される巨視的なバーコードラベルに基づいて照合することにより、上記試料のアイデンティティを識別する及び/又は上記試料が汚染されていないと識別する工程と、
を含む、方法。
NGS配列決定にて特徴付けられる一本鎖ヌクレオチドバーコードオリゴヌクレオチドの作製を示す図である。 一本鎖オリゴヌクレオチドからの二本鎖ヌクレオチドバーコードの作製を示す図である。 一本鎖又は二本鎖のヌクレオチドバーコード配列の例を示す図である。 ヌクレオチドバーコードプラスミド及びそれを直線化したものを示す図である。 A.2工程のPCRプロトコルにおける;B.プライマー伸長ライゲーション/PCRプロトコルにおける;C.断片化DNAのライゲーション法に続くバーコードヌクレオチド配列のハイブリダイゼーションによる捕捉における、高度並行配列決定のための直線化ヌクレオチドバーコードプラスミドからの配列決定テンプレートの調製を示す図である。 同上 同上 スプリット多重反応を使用するアッセイにおける移動可能なヌクレオチドバーコードの使用を示す図である。この実施例では、2つのスプリット多重反応を行う。多重PCR反応の各々に添加されたヌクレオチドバーコード配列に対する2つのプライマーのうち少なくとも1つは、最小バーコード配列に隣接する配列(複数の場合もある)中に異なるプライマー結合部位を有する。各多重反応で得られるヌクレオチドバーコードアンプリコンは、それらの起源が特定され得るように異なる長さを有し、及び/又は最小バーコード領域に隣接する配列の片方又は両方に隣接配列組成(flanking sequence composition)を有する。アッセイ終了時に予想されるバーコードが観察される場合、また正しい長さの両方のアンプリコン及び/又は隣接配列組成が観察される場合、試料間及びスプリット反応間で試料入れ替わりは起こらなかった。予想されるバーコードが全く観察されない場合、両方の多重反応物(multiplexes)が別の試料の2つの多重反応物と入れ替わった(wereswitched)。予想されるバーコード以外に別のバーコードが観察されるが、予想される長さ及び/又は1つの多重反応物の隣接配列組成のみに予想されるバーコードが観察され、また正しい長さのアンプリコン及び/又は第2の多重反応物の隣接配列組成のみに予想されないバーコードが観察される場合、第2の多重反応物のみが別の試料の第2の多重反応物と入れ替わった。 調査対象の標的領域の濃縮に対する2段階PCRプロトコルを使用するNGSアッセイにおける移動可能な分子識別バーコードの使用を示す図である;7A.試料入れ替わりなし、汚染なし、7B.試料入れ替わり、7C.試料汚染。 同上 同上 移動可能な分子識別バーコードを含有する血液収集チューブから開始し、最終の有効な遺伝子検査レポートまでの遺伝子検査において可能なワークフローを示す図である。ヌクレオチドバーコード配列に由来する配列決定された配列と、調査対象の標的核酸に由来する配列決定された配列の両方のバイオインフォマティクス処理を並行して行う。 生体試料へと移される移動可能な分子識別バーコードを含有するマイクロチューブから開始し、最終の有効な遺伝子検査レポートまでの遺伝子検査において可能なワークフローを示す図である。 移動可能な分子識別バーコードを含有する血液収集チューブから開始し、最終の有効な遺伝子検査レポートまでの遺伝子検査において可能なワークフローであるが、上記ワークフローにおいて、ヌクレオチドバーコード配列に由来する配列決定された配列のバイオインフォマティクス処理を最初に行い、調査対象の標的核酸に由来する配列決定された配列のバイオインフォマティクス処理を、ヌクレオチドバーコードに由来する配列の読取りの結果分析、すなわち、試料入れ替わり及び/又は汚染がないかどうかに応じてのみ開始するワークフローを示す図である。 全プロセスのサブプロセスを品質管理するため、生体試料、又はその派生物を、全検査プロセスの2つの異なる工程において異なる移動可能な分子識別バーコードで2回スパイクする、遺伝子検査において可能なワークフローを示す図である。
定義
明細書及び特許請求の範囲を含む本出願で使用される用語は、別段の指示がない限り以下に述べるように定義される。これらの用語は明確化のため具体的に定義されるが、いずれの定義も、当業者がどのようにこれらの用語を理解し得るかということと矛盾しない。
数量を特定していないもの(the singular forms "a", "an," and"the")は、文脈上別段の明らかな指示がない限り、複数の指示対象を含むことに注意しなければならない。
変項に言及する場合、「本明細書で使用される」、「本明細書に定義されるもの」、及び「上に定義されるもの」の用語は、変項の幅広い定義と並んで、存在する場合には好ましい定義、より好ましい定義及び最も好ましい定義も参照することによって組み込む。
本明細書で使用される「核酸」の用語は、ヌクレオチド、例えばデオキシリボヌクレオチド又はリボヌクレオチドで構成される高分子を指す。また、核酸は、合成により産生された化合物を含むが、それらの化合物は、変異糖-リン酸骨格(ポリアミド(例えばペプチド核酸(PNA)、連結された核酸(LNA:linkednucleic acids)、ポリモルフォリノポリマー)、及び/又は1以上の塩基の変異体を有し、2つの天然起源の核酸のハイブリダイゼーションに類似する配列特異的な方法で天然起源の核酸となおもハイブリダイズすることができ、すなわち、ワトソン-クリック塩基対合相互作用、Wobble型相互作用等のハイブリダイゼーション反応、パイ電子スタッキングによる協同的相互作用及び水素結合に関与し得る。核酸は一本鎖若しくは二本鎖であってもよく、又はトリプレットDNA若しくは更に複雑な構造であってもよい。「核酸」の用語は、指定の核酸若しくは該核酸の相補体であるヌクレオチド配列を含む核酸、指定の核酸に対して50%超、55%超、60%超、65%超、70%超、75%超、80%超、85%超、90%超若しくは95%超の配列同一性を有するヌクレオチド配列を含む核酸、又は指定の核酸の相補体に対して50%超、55%超、60%超、65%超、70%超、75%超、80%超、85%超、90%超若しくは95%超の配列同一性を有するヌクレオチド配列を含む核酸であってもよい。
核酸は、天然起源の核酸、ゲノム起源の核酸、ミトコンドリアの核酸、cDNA起源の核酸(mRNAに由来する)、細菌、ウイルス、真菌に由来する核酸、合成起源の核酸、非天然起源の核酸、DNA及び/又はRNAの類縁体、及び/又は誘導体、及び/又は上述のいずれかの組み合わせであってもよい。核酸修飾は、個々の核酸塩基又は全体としての核酸に対して、更なる電荷、分極性、水素結合、静電的相互作用及び官能性を組み込む化学基の付加を含み得る。かかる修飾として、例えば安定性を改善するための5'及び/又は3'末端の保護基、2'位糖修飾等の塩基修飾、5位ピリミジン修飾、8位プリン修飾、シトシン環外アミンにおける修飾、5-ブロモウラシルの置換、骨格修飾、イソ塩基であるイソシチジン(isocytidine)及びイソグアニジン(isoguanidine)等の異常な塩基対合の組み合わせ、メチル化等が挙げられ得る。他の種類の核酸が考慮される。
核酸(複数の場合もある)は、固相媒介化学合成等の完全に化学合成プロセスに由来してもよく、核酸を産生する任意の種からの単離等によって生物学的供給源に由来してもよく、若しくは分子生物学的手法による核酸の操作を含むプロセスに由来してもよく(DNA複製、ライゲーション、PCR増幅、逆転写、又はそれらのプロセスの組み合わせ等から)、又はそれらの組み合わせであってもよい。
核酸修飾は、別の分子によって、直接又は間接のいずれかで単離及び/又は検出を促進させてもよく、この分子に他の分子が結合され得る。かかる修飾は、ストレプトアビジンと相互作用し得る、1以上のビオチン基であってもよい。他のかかる目的で相互作用する分子は、ビオチン/アビジン、ビオチン/ビオチン結合分子(例えばNEUTRAVIDINT改変アビジン(イリノイ州ロックフォードのPierceChemicals))、グルタチオンS-トランスフェラーゼ(GST)/グルタチオン、抗体/抗原、抗体/抗体結合分子、ジゴキシゲニン(digoxigenin)/抗ジゴキシゲニン、DNP(2,4-ジニトロフェニル)/抗DNP抗体、マルトース結合タンパク質/マルトース、キレート化(例えば(Co2+、Ni2+)/ポリヒスチジン)、プルロニックカップリング技術であってもよい。
本明細書で使用される「デオキシリボ核酸」及び本明細書で使用される「DNA」の用語は、デオキシリボヌクレオチドで構成される高分子を意味する。
本明細書で使用される「リボ核酸」及び本明細書で使用される「RNA」の用語は、リボヌクレオチドで構成される高分子を意味する。
本明細書で使用される「オリゴヌクレオチド」の用語は、比較的短い、一般的には200ヌクレオチドより短い、より具体的には100ヌクレオチドより短い、最も詳しくは50ヌクレオチドより短いが、一般的には5ヌクレオチドより大きい長さの核酸を指す。典型的には、オリゴヌクレオチドは一本鎖DNA分子である。かかるオリゴヌクレオチドは、例えばビオチン化、5'リン酸化等の修飾を伴ってもよい。「オリゴヌクレオチド」の同義語は「オリゴ」である。
本明細書で使用される「標的核酸」の用語は、特性決定される生体試料等の物品に存在する、核酸若しくはその部分(複数の場合もある)、又は核酸(複数の場合もある)若しくはその部分である。ほとんどの例において、核酸(複数の場合もある)のこの部分(単数又は複数)は特性決定プロセスの標的である。
本明細書で使用される「標的ヌクレオチド配列」の用語は、例えば標的核酸を増幅することにより得られる増幅産物、標的核酸を配列決定することにより得られる配列決定産物、RNA標的核酸の逆転写の際に産生されるcDNA等の標的核酸のヌクレオチド配列を含む分子を指す。
本明細書で使用される「ヌクレオチドバーコード」の用語は、バーコード又は識別の手段として使用される特定の配列を有する標的核酸又はその部分を指す。異なるヌクレオチドバーコードは、異なるバーコード配列を有し、異なる種類のヌクレオチドバーコードと称される。ヌクレオチドバーコードがDNAで構築される場合、「DNA型ヌクレオチドバーコード」と称され、ヌクレオチドバーコードがRNAで構築される場合、「RNA型ヌクレオチドバーコード」と称される。本明細書で使用される、実際のバーコード配列である、「最小ヌクレオチドバーコード」の用語は、所与の種類のヌクレオチドバーコードにおいて同一である定常配列によって挟まれてもよい。これらの隣接定常配列は、いかなる天然起源のゲノム、細菌DNA若しくはウイルスDNAにもコードされないか(したがって、クローニングベクター、又はより具体的にはクローニングベクター骨格に見られない)、又は任意の天然起源のゲノム、ウイルスDNA、細菌DNAにコードされる配列に対して、1%未満、2%未満、3%未満、4%未満、5%未満、10%未満、15%未満、20%未満、25%未満、30%未満、40%未満、50%未満相同である配列を有する。
本明細書で使用される「移動可能な分子識別バーコード」の用語は、単一の種類のヌクレオチドバーコード、又は異なる種類のヌクレオチドバーコードの混合物を指す。異なる種類のヌクレオチドバーコードの混合物で構築される移動可能な分子識別バーコードでは、移動可能な分子識別バーコードは、なおも独自の移動可能な分子識別バーコードとなるように、1つを除き全てのヌクレオチドバーコードを他の移動可能な分子識別バーコードと共通して保有し得る。バーコードの同義語はインデックス、タグ、MID(分子識別子)であってもよい。また、「移動可能な分子識別バーコード」の用語は、所与の時点に不溶性相にあるが、処理中には(再び)可溶性となる1以上のヌクレオチドバーコードを指す。移動可能な分子識別バーコードがDNAで構成される場合、「DNA型の移動可能な分子識別バーコード」と称され、移動可能な分子識別バーコードがRNAで構築される場合、「RNA型の移動可能な分子識別バーコード」と称される。
本明細書で使用される「巨視的なバーコードラベル」の用語は、例えば、物品(例えば、受取り手ホルダー)の標識に使用される、印刷されたバーコード紙面ラベル(例えば、光学1D(線)又は2Dバーコード紙面ラベル)又はRFID(無線周波数識別バーコード)バーコードラベルを指す。かかる標識は、受取り手ホルダーの壁の外側における独自の紙面バーコードの付着等の種々の手段によって行われ得る。受取り手ホルダーが独自の移動可能な分子識別バーコードを含む場合、独自の巨視的バーコードラベルは、対応する移動可能な分子識別バーコードに明白に関連付けられ、紐付けられ得る。
本明細書で使用される「相補的な」の用語は、2つのヌクレオチド間の正確な対合に対する能力を指す。核酸の所与の位置のヌクレオチドが、別の核酸のヌクレオチドと水素結合することができる場合であれば、その2つの核酸はその位置において互いに相補的であるとされる。2つの一本鎖核酸分子間の相補性は、ヌクレオチドのうち幾つかのみが結合する「部分的」であってもよく、又は全相補性(total complementarity)が一本鎖分子間に存在する場合には完全となり得る。核酸鎖間の相補性の程度は、核酸鎖間のハイブリダイゼーションの効率及び強度に対して著しい効果を有する。
本明細書で使用される「特異的ハイブリダイゼーション」の用語は、規定されるストリンジェンシー条件のもと、ハイブリダイゼーション混合物中に存在する他の核酸又はヌクレオチド配列への実質的な結合のない状態での、標的核酸又は標的ヌクレオチド配列に対する核酸の結合を指す。当業者は、ハイブリダイゼーション条件のストリンジェンシーを緩めることによって配列ミスマッチが許容されることを認識する。ハイブリダイゼーションは、ストリンジェントなハイブリダイゼーション条件下で行われる。「ストリンジェントなハイブリダイゼーション条件」の句は、一般的には、規定のイオン強度及びpHでの特定の配列について融解温度(Tm)を約5℃から約20℃又は25℃下回る範囲の温度を指す。本明細書で使用されるTmは、二本鎖核酸分子の集団が一本鎖へ半分分離されるようになる温度である。核酸のTmを計算する方法は、当該技術分野でよく知られている(ALaboratory Manual, by Sambrook and Russel, 3rd Edition, Cold Spring HarborLaboratory Press, 2001)。ハイブリッドの融解温度(したがって、ストリンジェントなハイブリダイゼーションに対する条件)は、溶液中に存在する又は固定化された、プライマー又はプローブの長さ及び性質(DNA、RNA、塩基組成)、並びに標的核酸の性質(DNA、RNA、塩基組成)等と並んで、塩及び他の成分の濃度(例えばホルムアミド、硫酸デキストラン、ポリエチレングリコールの有無)等の様々な要因によって影響を受ける。
本明細書で使用される「プライマー」の用語は、核酸とハイブリダイズし(「アニーリング」とも呼ばれる)、適切なバッファー中、好適な温度にて、適切な条件下で(すなわち、4つの異なるヌクレオシド3リン酸、及びDNA若しくはRNAのポリメラーゼ、又は逆転写酵素等の重合のための物質の存在下で)ヌクレオチド(DNA又はRNA)重合に対する開始部位としてはたらくことができるオリゴヌクレオチドを指す。
本明細書で使用される「プライマー結合部位」又は「プライマー部位」の用語は、標的核酸のセグメント又は標的ヌクレオチド配列を指し、そこにプライマーがハイブリダイズして、そこからヌクレオチド合成をプライムする。移動可能な分子識別バーコード中のプライマー結合部位は、いかなる天然起源のゲノム、細菌DNA若しくはウイルスDNAにもコードされないか(したがって、クローニングベクター、又はより具体的にはクローニングベクター骨格に見られない)、又は任意の天然起源のゲノム、ウイルスDNA、細菌DNAにコードされる配列に対して1%未満、2%未満、3%未満、4%未満、5%未満、10%未満、15%未満、20%未満、25%未満、30%未満、40%未満、50%未満相同である配列を有する。上記プライマーが結合する標的核酸のセグメント又は標的ヌクレオチド配列も、本明細書ではオリゴヌクレオチド結合配列と称される場合がある。プライマー結合部位は、典型的には少なくとも5ヌクレオチド長であり、より典型的には10個~30個のヌクレオチド、又はそれよりも多くのヌクレオチドに及ぶ。より短いプライマー結合部位は、一般にプライマーとテンプレートとの間で十分安定なハイブリッド複合体を形成するためにより低い温度を必要とする。プライマーは、テンプレートの完全な配列を反映する必要はないが、テンプレートとハイブリダイズするのに十分に相補的でなければならない。プライマーは、そのプライマー又はその部分が核酸内のヌクレオチド配列にハイブリダイズする場合、別の核酸にアニールすると言われる。プライマーが特定のヌクレオチド配列にハイブリダイズするという記述は、プライマーがそのヌクレオチド配列に完全に又は独占的のいずれかでハイブリダイズすることを念頭に置くものではない。
本明細書で使用される「プライマー対」の用語は、増幅されるDNA配列の5'末端の相補体とハイブリダイズする5'「上流プライマー」と、増幅される配列の3'末端とハイブリダイズする3'「下流プライマー」を含むプライマーとのセットを指す。ヌクレオチドバーコード配列にハイブリダイズするプライマーは、いかなる天然起源のゲノム、細菌DNA若しくはウイルスDNAにもコードされていない(したがって、クローニングベクター、又はより具体的にはクローニングベクター骨格に見られない)配列を有するか、又は任意の天然起源のゲノム、ウイルスDNA、細菌DNAにコードされる配列に対して1%未満、2%未満、3%未満、4%未満、5%未満、10%未満、15%未満、20%未満、25%未満、30%未満、40%未満、50%未満相同である配列を有する。
当業者によって認識されるように、「上流」及び「下流」の用語は、限定ではなく、例示の方向を提供することが意図される。同義語は、フォワードプライマー及びリバースプライマー、左プライマー及び右プライマー、+(プラス)プライマー及び-(マイナス)プライマー、5'プライマー及び3'プライマーである。1つのプライマーがプラスDNA鎖中にプライマー結合部位を有し、第2のプライマーが標的核酸のマイナスDNA鎖中にプライマー結合部位を有する「プライマー対」は、PCR反応をプライムすることができる。また、「プライマー対」は、ライゲーション連鎖反応アッセイ又はプライマー伸長ライゲーションアッセイにおいて使用されるプライマー対等の両方のプライマーが標的核酸の同じDNA鎖(プラス又はマイナスのDNA鎖)中にプライマー結合部位を有する一対のプライマーを指す場合もある。
予想される長さとは異なる長さのアンプリコンを産生する、標的核酸内にプライミングすることから得られるアンプリコンとは対照的に、それらのプライマーが標的核酸の各末端における予想される部位でプライミングすることによって得られるという意味で、プライマーは、増幅後に検出されるアンプリコンの大半が「予想される長さ」を有するように選択される。様々な実施形態において、プライマーは、得られるアンプリコンの少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%又は少なくとも99%が予想される長さを有するように選択される。
本明細書で使用される「アダプター」の用語は、標的ヌクレオチド配列に付加されて、更には標的ヌクレオチド配列の一部となり得る、1以上の所定の機能を有する所定のヌクレオチド配列を指す。アダプターを、標的核酸又は標的ヌクレオチド配列の片方の末端に付加してもよく、又は両方の末端に付加してもよい。アダプターが両方の末端に付加される(areadded)場合、配列に関してそれらのアダプターは同一であってもよく又は異なってもよい。両方の部位でアダプターによって挟まれる標的ヌクレオチド配列は、直鎖又は環状化のいずれかの形態を有し得る。付加されたアダプターは、1以上の特定の種類の所定の機能を有し得る。したがって、本明細書で使用される「アダプター」の用語は、1つのアダプター又は複数のアダプターを指す場合がある。2以上の機能が含まれる場合、その機能は、同じ種類であってもよく、又は異なる種類(複数の場合もある)であってもよい。異なる種類のアダプターが、アダプター全体の任意の位置に組み込まれ得る。アダプターの同義語は、例えば、ヌクレオチドアダプター、ユニバーサルアダプター、タグ、ヌクレオチドタグ、ユニバーサルタグである。
所定のアダプター又はアダプター機能の種類の例は、限定されないが、プライマー配列、DNA合成に対するプライミング結合若しくはアニーリング部位、配列決定に対するプライミング結合若しくはアニーリング部位、オリゴヌクレオチドに対するハイブリダイゼーション部位、1以上の制限酵素に対する認識部位、バーコード配列、固定化配列、ナノポアシーケンシング(OxfordNanopore Technologies)に対する運動性タンパク質に対するリーダーアダプター、又は後の処理に有用な他の認識若しくは結合配列、上に記載される1以上のアダプターを連結するリンカー若しくはスペーサー機能であってもよい。さらに、本明細書で使用されるように、相補的複製に際して特定の記載される配列が得られることから、特定のアダプター配列への言及は任意のかかる配列に対する相補体も指す。
アダプター全体に異なるアダプターが存在する場合、かかる異なるアダプターを構築するヌクレオチド配列単位は、重複しない異なる近隣配列単位及び/又は重複配列単位として位置付けられ得る。例えば、DNA合成反応に対するプライマー結合部位として使用される20ヌクレオチド長のアダプター機能、及び所与の標的ヌクレオチド配列の捕捉/単離に使用される20ヌクレオチド長のアダプター機能は重複する場合があり、例えば、両アダプターの合わせた配列が40ヌクレオチドではなく30ヌクレオチド長であるように、共通して10個のヌクレオチド配列を有する場合がある。
本明細書で使用される「ライゲーションアダプター」の用語は、完全に又は一部が二本鎖のDNA分子を指す。一般に、ライゲーションアダプターは、他のDNA分子に対するそれらのライゲーションに使用される。ライゲーションアダプターは、ほとんどが、2つの、場合によっては部分的に相補的にハイブリダイズするオリゴヌクレオチドの混合物から作製される。部分的に二本鎖のライゲーションアダプターはヘアピンアダプターを有し得る。ヘアピンアダプターの機能は、ライゲーション後にDNA分子がそれらの5'末端でハイブリダイズしないことを防止すること、例えば鎖状体形成(concatenation)を防止することである。別のヘアピン機能は、ヘアピン-タンパク質がヘアピンアダプターに結合してナノポアシーケンシング(Oxford Nanopore Technologies)を促進することである。また、ライゲーションアダプターは、米国特許第7803550号に記載されるように、逆方向反復及びループを含む単一のステムループオリゴヌクレオチドから産生され得る。これらのライゲーションアダプターの全てが、実際のライゲーション部位に、定方向ライゲーションを促進し得る及び/又は可能とし得る、1以上の非相補性ヌクレオチドを有する場合がある。例えば、ライゲーションアダプターは、ライゲーションを促進するため、二本鎖標識ヌクレオチド配列の3'Aオーバーハングとハイブリダイズし得る、3'Tオーバーハングを有する場合がある。
本明細書で使用される「プール化バーコード」の用語は、より効率的な(より手間がかからない)及び/又は経済的な異なる処理がされたDNA試料のプール化のため、標的ヌクレオチド配列に印を付けるバーコードを指す。大抵は、プール化バーコードは、ライゲーションアダプター又はDNA合成若しくは増幅に使用されるプライマー中に存在する。したがって、プール化バーコードは、産生された標的ヌクレオチド配列に関する情報を後にコードする標的ヌクレオチド配列に対してアダプター機能を付加する。例えば、異なるプール化バーコード(異なるバーコード配列を有する)を使用して、異なる個体に由来する多数の異なる試料の各々から1以上の標的核酸を増幅することができる。例えば、異なるプール化バーコード(異なるバーコード配列を有する)を使用して、生体試料に由来する多数の異なる個別の細胞の各々から1以上の標的核酸を増幅することができる。したがって、プール化バーコードヌクレオチド配列は、それぞれ、得られた標的ヌクレオチド配列の試料又は細胞の起源を示す。これは、下流の処理において種々の試料に由来するプール化バーコードが付された異なる種類の標的ヌクレオチド配列を組み合わせることを可能とする。これは、一旦そのプール化が行われると、全てのプール化試料に対してたった一回のワークフローにまで各試料に対するワークフローの総数を単純化する。或る一つの適用は、高度並行配列決定による異なる標的ヌクレオチド配列の配列決定であろう。高度並行配列決定の方法及び装置の配列決定アウトプットは莫大であり、多くの適用について、単一の試料には高度すぎる。高度並行配列決定の装置の全能力は、異なる試料/個体に由来する、異なるプール化バーコードが付与された標的ヌクレオチド配列を組み合わせることによって最も経済的な方法で使用され得る。配列決定の後、標的ヌクレオチド配列から得られた種々の配列は、存在するプール化バーコード配列に従ってグループ化され得て、したがって本来の試料に割り当てられ、更に再び、下流のワークフローにおいて別々に処理され、分析される。これらのプール化バーコードは、本発明の基礎となる「移動可能な分子識別バーコード」とは異なる。バーコードの同義語は、インデックス、タグ、ヌクレオチドタグ、MID(分子識別子)であってもよい。
プール化バーコードを、移動可能な分子識別バーコードそれ自体を含む、任意の標的核酸又は標的ヌクレオチド配列に付加してもよく、又は個体のゲノムDNA等の(に由来する)他の標的核酸若しくは標的ヌクレオチド配列と組み合わせてもよい。そうすれば、移動可能な分子識別バーコードに由来する標的ヌクレオチド配列は、2つのバーコード配列と、移動可能な分子識別バーコード配列に由来する最小バーコード配列と、プール化バーコード配列に由来する配列とを有することになる。プール化バーコードは、片方の末端で標的ヌクレオチド配列に隣接する1つのバーコードであってもよく、又は各末端で標的ヌクレオチド配列に隣接する2つのスプリットバーコード(split barcodes)であってもよい。後者について、2つのスプリットバーコードは、同一であってもよく、又は異なってもよい(デュアルインデックス(dual indexing))。後者について、2つのバーコード末端は、組み合わされた1つのプール化バーコードを特定し、その組み合わせは独自のものである。
本明細書で使用される「増幅」の用語は、それによって少なくとも1つの標的核酸の少なくも一部が典型的にはテンプレート依存的に再生産される、(例えば、直線的な、指数関数的な、等温の、サーモサイクリングの(thermocycling))任意の手段を指し、この手段には、限定されないが、核酸配列を増幅する幅広い技術が含まれる。増幅工程を行なうための実例となる手段として、DNAポリメラーゼ反応、プライマー伸長、逆転写、PCR、リガーゼ連鎖反応(LCR)、オリゴヌクレオチドライゲーションアッセイ(OLA)、リガーゼ検出反応(LDR)、ライゲーションに続くQレプリカーゼ増幅、環状化に基づくDNA合成又は増幅(HaloPlex(商標))、分子反転プローブ(MIP)DNA合成、鎖置換増幅(SDA)、多分岐鎖置換増幅、多重置換増幅(MDA)、ローリングサークル増幅(RCA)、ループ介在等温増幅(LAMP)、スマート増幅プロセス(SMAP)、等温キメラプライマー核酸増幅(ICAN(商標):isothermal and chimeric primer-initiated amplification of nucleicacids)、核酸鎖増幅(NASBA:nucleic acidstrand-based amplification)、転写介在増幅(TMA)等が挙げられ、これには、それらの多重バージョン及び組み合わせ、例えば、限定されないが、PCR/PCR(2段階PCR)、プライマー伸長/OLA、プライマー伸長/OLA/PCR、OLA/PCR、MIP/PCR、LDR/PCR、PCR/PCR/PCR(例えばPCR/(ネステッド)PCR/(プーリング)PCR)、PCR/PCR/LDR、PCR/LDR、LCR/PCR、PCR/LCR(併用連鎖反応--CCR(combined chain reaction)としても知られる)等が含まれる。かかる技術の説明は、幾つかあるソースの中でも特に、Ausbel et al.、PCR Primer: A LaboratoryManual, Diffenbach, Ed., Cold Spring Harbor Press (1995)、The Nucleic Acid Protocols Handbook, R. Rapley, ed., Humana Press,Totowa, N.J. (2002)、Innis et al., PCR Protocols: AGuide to Methods and Applications, Academic Press (1990)に見られる。
DNA又はRNAの増幅及びプロセッシングに使用され得る、DNAポリメラーゼ、DNAリガーゼ、逆転写酵素、並びにそれらの突然変異体及び変異体の例は、限定されないが、DNAポリメラーゼI、DNAポリメラーゼIラージクレノウフラグメント、T4 DNAポリメラーゼ、T7 DNAポリメラーゼ、末端デオキシヌクレオチドトランスフェラーゼ、T4 DNAリガーゼ、Taq DNAポリメラーゼ、AmpliTaq Gold(商標)、TaqDNAポリメラーゼHigh Fidelity、Tfl DNAポリメラーゼ、Tli DNAポリメラーゼ、Tth DNAポリメラーゼ、Vent(商標)DNAポリメラーゼ、phi29 DNAポリメラーゼ、Bst DNAポリメラーゼ、Taq DNAリガーゼ、Pfu DNAリガーゼ、AMV逆転写酵素、MMLV逆転写酵素である。
本明細書で使用される「アンプリコン」の用語は、例えばPCR等の核酸増幅技術によって特定の核酸配列を増幅することによって得られた標的ヌクレオチド配列又はその収集物(集団)を指す。「アンプリコン」の用語は、任意の増幅方法によって産生された任意の分子の収集物を広く含む。
本明細書で使用される「配列決定テンプレートの作製」の用語は、標的核酸(複数の場合もある)又は標的ヌクレオチド配列(複数の場合もある)を配列決定のため作製する方法及び反応を指す。一般に、かかる作製の終わりに、1以上のアダプターによって挟まれた、直鎖又は環状のいずれかの標的ヌクレオチド配列を得る。幾つかのアダプターは、配列決定テンプレートの作製にのみ必要であるが、その他のアダプターは、実際の配列決定にのみ必要であるか、又はそれらの組み合わせである。この時点で、ほとんどの高度並行配列決定技術は、それらの各配列決定プラットフォームについて配列決定を行うために、特異的な各アダプター配列を必要とする。
かかるアダプターは、所与の工程での増幅法によって、例えば、少なくとも1つのプライマーが標的特異的結合部位及び標的特異的部分に対して5'末端に位置するアダプターを含み、第2のプライマーが標的特異的部分のみを含むか、又は標的特異的部分及び標的特異的部分に対して5'末端に位置するアダプターを含むかのいずれかである、PCRによって付加され得る。プライマーの部分を指して本明細書で使用される「標的特異的」ヌクレオチド配列の用語は、好適なアニーリング条件下で標的核酸又は標的ヌクレオチド配列中のプライマー結合部位に特異的にアニールし得る配列を指す。
また代替的には、1以上のアダプターは、例えば、ライゲーションアダプターのライゲーション反応によって標的核酸又は標的ヌクレオチドの配列の片方又は両方の末端に付加され得る。ほとんどの適用において、標的核酸は、例えば物理的手段(例えば、超音波処理、温度)、酵素的手段、タグメンテーション(tagmentation)によって最初に断片化される。
配列決定テンプレートを作製するために使用されるアダプターは、環状標的ヌクレオチド配列テンプレートを作製するために大きな5'及び3'のオーバーハングを有することさえあり得る。HaloPlex(商標)アッセイでは、より大きな5'及び3'のオーバーハングは、標的化DNA制限フラグメントの両末端にハイブリダイズすることにより、標的化フラグメントを誘導して環状DNA分子を形成する。アダプターは、配列決定テンプレートの更なる処理及び調製、及び/又は実際の配列決定を実施するのに必要であり、環状化の後に標的ヌクレオチド配列に隣接する、1以上の他のアダプター機能を含み得る。
種々の配列決定テンプレートを作製する方法(アッセイ、パネル、キット)は、例えば、限定されないが、TruSeq(商標)DNA試料作製(Illumina)、Nextera(商標)DNA試料作製(Illumina)、プライマー伸長ライゲーションによるTruSeqアンプリコン作製(Illumina)、TruSeq鎖mRNAライブラリ作製(Illumina)、TruSeq RNAアクセスライブラリ作製(Illumina)、TruSeq標的化RNA発現(Illumina)、Ion Xpress(商標)とフラグメントライブラリ作製(Ion Torrent、Thermo Fisher Scientific)、Ion AmpliSeq(商標)DNA及びRNAライブラリ作製(Ion Torrent, Thermo FisherScientific)、SOLiD(商標)フラグメントライブラリ作製(Thermo Fisher Scientific)、Titanimumライブラリ作製(454 Life Sciences、Roche)、DNAナノボール(DNB)ライブラリ作製(Complete Genomics、BGI)、SMRTbellテンプレート作製(Pacific Biosciences)、MinIONライブラリ作製(Oxford Nanopore Technologies)、GeneReadライブラリ作製(Qiagen)、GeneRead DNAseq遺伝子ライブラリ作製(Qiagen)、SureSelectXTライブラリ作製(AgilentTechnologies)、オリゴヌクレオチド選択的シーケンシング(OS-Seq(商標);Blueprint Genetics)、NEBNext(商標)ライブラリ作製(New England BioLabs)、Access Array(商標)標的化ライブラリ濃縮(Fluidigm)、SmartChip(商標)ライブラリ作製(Wafergen Biosystems)、再配列決定に対する特異的標的のマルチプレックス増幅(MASTR:Multiplex Amplification of SpecificTargets for Resequencing)(Multiplicom)、DevyserマルチプレックスPCR NGSアッセイ(Devyser)、HEAT-Seq標的濃縮(Roche)、KAPAライブラリ作製(並びにHyper Prep及びHyper Plus)(Kapabiosystems)、ThruPLEX(商標)、PicoPLEX(商標)、TransPLEX(商標)ライブラリ作製(Rubicon Genomics)、Accel-NGS DNAライブラリ作製(Swift Biosciences)、Accel-amplicon(商標)パネル作製(Swift Biosciences)、Archer FusionPlex(商標)及びVariantPlex(商標)ライブラリ作製(Archerdx)、Immunoseq(商標)及びClonoseqライブラリ作製(Adaptive biotechnologies)、単一プライマー濃縮技術(SPET)によるライブラリ作製(NuGEN)、QuantSeq-Flex標的化RNA作製(Lexogen)である。
配列決定テンプレートの作製のため、移動可能な分子識別バーコードは、標的核酸それ自体であってもよく、又は個体若しくは患者、動物、植物、細菌、ウイルス、若しくは真菌に由来するDNA若しくはRNA等の他の標的核酸と混合されてもよい。移動可能な分子識別バーコードは、標的核酸から配列決定テンプレートを作製することができる、あらゆる方法、アッセイ、又はキットに適用を見出すことが当業者に十分理解される。
本明細書で使用される「プローブ」の用語は、1以上の種類の化学結合によって、一般的には相補的塩基対合によって、通常水素結合の形成、したがって二本鎖構造の形成によって相補的配列の標的核酸に結合することができる核酸を指す。プローブは、プローブ結合部位に対して結合又はハイブリダイズする。プローブは、特に一旦そのプローブがその相補的な標的にハイブリダイズすると、そのプローブの検出を容易にし得るため検出可能なラベルで標識され得る。代替的には、プローブは標識されていなくてもよいが、直接又は間接のいずれかで標識されるリガンドとの特異的結合によって検出可能であってもよい。プローブは、サイズが著しく変化してもよい。一般的には、プローブは少なくとも7ヌクレオチド長~15ヌクレオチド長である。他のプローブは少なくとも20ヌクレオチド長、30ヌクレオチド長、又は40ヌクレオチド長である。更に他のプローブはそれよりも幾分長く、少なくとも50ヌクレオチド長、60ヌクレオチド長、70ヌクレオチド長、80ヌクレオチド長、又は90ヌクレオチド長である。更に他のプローブは、更に長く、少なくとも100ヌクレオチド長、150ヌクレオチド長、200ヌクレオチド長又はそれ以上である。また、プローブは、上の値のいずれかによって結び付いた任意の範囲に含まれる任意の長さであってもよい(例えば、15ヌクレオチド長~20ヌクレオチド長)。
プローブは、標的核酸配列に完全に相補的であってもよいか、又は完全に相補的とは言えないものでもよい。特定の実施形態では、プライマーは、少なくとも7個のヌクレオチドの配列に対して、より典型的には10個~30個のヌクレオチドの範囲の配列に対して、しばしば少なくとも14個~25個のヌクレオチドの配列に対して標的核酸配列の相補体に対する少なくとも50%同一性を有し、より頻繁には、少なくとも65%の同一性、少なくとも75%の同一性、少なくとも85%の同一性、少なくとも90%の同一性又は少なくとも95%、96%、97%、98%若しくは99%の同一性を有する。特定の塩基(例えば、プライマーの3'塩基)は、一般的に、標的核酸配列の対応する塩基に完全に相補的であることが望ましいことが理解される。プライマー及びプローブは、典型的にはストリンジェントなハイブリダイゼーション条件下で標的配列にアニールする。
本明細書で使用される「捕捉オリゴヌクレオチド」の用語は、より複雑な核酸の混合物からのみ処理される標的核酸又は標的ヌクレオチド配列の目的の特定の標的にハイブリダイズする1以上のオリゴヌクレオチド又はプローブを指す。また、捕捉オリゴヌクレオチドが結合する標的の特定の配列は、本明細書では、オリゴヌクレオチド結合配列と称される場合がある。
この方法で目的のゲノム領域のみが、捕捉オリゴヌクレオチドによるハイブリダイゼーションに基づく配列捕捉によって目的のゲノムのDNA領域を単離することにより、配列決定等の処理がされる。標的核酸中のオリゴヌクレオチド結合部位は、「捕捉配列」と称される。ヌクレオチドバーコード配列中の捕捉配列は、いかなる天然起源のゲノム、細菌DNA、若しくはウイルスDNAにもコードされない(したがって、クローニングベクター、又はより具体的にはクローニングベクター骨格に見られない)配列であるか、又は任意の天然起源のゲノム、ウイルスDNA、細菌DNAにコードされる配列に対して1%未満、2%未満、3%未満、4%未満、5%未満、10%未満、15%未満、20%未満、25%未満、30%未満、40%未満、50%未満相同な配列を有する。
捕捉プローブは、単離を容易にするための修飾を含み得る。ほとんどの場合、これらのプローブはビオチン化される。例えば、目的の核酸の標的は1以上の遺伝子のエクソン配列であってもよく、或いはエクソームとして知られているゲノムの全ての遺伝子の大多数のエクソン配列であってもよい。標的ヌクレオチド配列は、標的ヌクレオチド配列が、例えば全ヌクレオチド配列の1%未満~3%未満を表す配列決定テンプレートライブラリの作製方法によって作製されたものでもよい。全配列決定テンプレートライブラリが配列決定される場合、得られる配列の1%未満~3%未満のみが目的とされ、使用される。全ライブラリに由来する目的の標的ヌクレオチド配列は、配列決定の前に、目的の領域のこれらのヌクレオチド配列に対する捕捉オリゴヌクレオチドを使用する特異的ハイブリダイゼーションによって選択的に濃縮され得る。捕捉は、溶液中、又は物理的な支持体(アレイ)上のいずれかで行われ得る。捕捉オリゴヌクレオチドがビオチン化される場合、ハイブリダイズされた目的のフラグメントは、ストレプトアビジン被覆ビーズの使用によって目的のものではないハイブリダイズしていないフラグメントから容易に単離され得る。また、特異的核酸標的は、移動可能な分子識別バーコードに由来するヌクレオチドバーコードであってもよく、それに対して移動可能な分子識別バーコード中の定常配列領域に対するシグナル捕捉オリゴヌクレオチドを設計し、作製することができ、そうすることで、存在する種々の最小バーコード配列にかかわらず、全ての種類のヌクレオチドバーコードを単離し、特性決定することができる。移動可能な分子識別バーコードが個体又は患者のDNA等の他の核酸標的と混合される場合、移動可能な分子識別バーコードはそれ自体が捕捉され得て、他の標的核酸と組み合わせられる。
本明細書で使用される、DNA混合物(例えば、ゲノム、移動可能な分子識別バーコードと混合されたゲノム)中の特定の領域(複数の場合もある)の「濃縮」の用語は、増幅又は(ハイブリダイゼーションに基づく配列)捕捉による核酸中の標的核酸からの標的ヌクレオチド配列の生成及び/又は単離を指す。
種々の捕捉の方法、アッセイ、キットは、例えば、限定されないが、TruSight配列決定パネル(Illumina)、Nextera迅速捕捉キット(Illumina)、TargetSeq(商標)エクソーム濃縮(Thermo FisherScientific)、HaloPlex(商標)濃縮(AgilentTechnologies)、SureSelect標的濃縮(AgilentTechnologies)、SeqCap EZ濃縮(RocheNimbleGen)、xGEN(商標)標的の捕捉(Integrated DNATechnologies)である。
本明細書で使用される「等化オリゴヌクレオチド(equalizing oligonucleotide)」の用語は、特定の又は全ての標的ヌクレオチド配列中に見られる定常配列に特異的にハイブリダイズするオリゴヌクレオチド又はプローブを指す。標的核酸中の等化オリゴヌクレオチドが結合し得る配列は、「等化配列」と称される。等化配列は、いかなる天然起源のゲノム、細菌DNA、若しくはウイルスDNAにもコードされない(したがって、クローニングベクター、又はより具体的にはクローニングベクター骨格に見られない)配列であるか、又は任意の天然起源のゲノム、ウイルスDNA、細菌DNAにコードされる配列に対して1%未満、2%未満、3%未満、4%未満、5%未満、10%未満、15%未満、20%未満、25%未満、30%未満、40%未満、50%未満相同な配列を有する。
等化オリゴヌクレオチドは、種々の処理された試料中の標的ヌクレオチド配列をより等しいレベルに正規化するため使用される。移動可能な分子識別バーコード中のヌクレオチドバーコード配列は、それ自体が等化され得るか、又は移動可能な分子識別バーコードが個体若しくは患者のDNA等の他の核酸標的と混合された場合には、他の標的ヌクレオチド配列によって等化され得る。ヌクレオチドバーコード配列は、他の標的ヌクレオチド配列に由来するヌクレオチドバーコード配列の等化を別のやり方で可能とするため、また(and)更に他のヌクレオチド配列に由来するヌクレオチドバーコード配列の等化を微調整するため、例えば、ヌクレオチドバーコード配列中の定常配列領域に存在する等化配列によって、他の付加された核酸に由来するヌクレオチド配列中に存在しない第2の等化配列を持つことさえあり得る。等化オリゴヌクレオチドを、ストレプトアビジン被覆ビーズによる単離等の容易な更なる処理を促進するためにビオチン化してもよい。
本明細書で使用される「高度並行配列決定」の用語は、大規模な並列処理の概念を使用するDNA配列決定のハイスループットアプローチを指す。多くの高度並行配列決定プラットフォームは、配置の操作及び配列決定の化学において異なる。それらの大半は、フローセルにおいて空間的に分離され、クローン的に増幅されたDNAテンプレート又は単一のDNA分子による大規模並行配列決定の技術的パラダイムを共有する。使用される同義語は、例えば、次世代シーケンシング(NGS)、第二世代シーケンシング、第三世代シーケンシング、大規模並列シーケンシング(massiveparallel sequencing)、大規模な並列シーケンシング(massively parallelsequencing)である。
種々の高度並行配列決定の化学及びプラットフォームは、例えば、限定されないが、ピロシーケンシング、GS FLX(454 Life Sciences、Roche);合成による配列決定、可逆的ダイターミネーター、HiSeq、MiSeq(Illumina);オリゴヌクレオチド連鎖ライゲーション、SOLiD(ThermoFisher Scientific)、陽子検出に基づくイオン半導体配列決定、Ion PGM(商標)、Ion Proton(商標)、イオンS5(商標)(Ion Torrent、Thermo Fisher Scientific)及びGenapSys、フォトダイオードによる蛍光検出に基づくイオン半導体配列決定、Firefly(Illumina)、オリゴヌクレオチド非連鎖ライゲーション(Complete Genomics、BGI)、可逆的ダイターミネーター、Heliscope(Helicos Biosciences)、リン酸連結蛍光ヌクレオチド、リアルタイムSMRT(商標)DNA配列決定、Pacbio RS(PacificBiosciences)、ナノポアシーケンシング、MinION(商標)、PromethION(商標)、GridION(商標)(Oxford Nanopores Technologies)、NanoTagナノポア系シーケンシング(Genia Technologies/Roche)、Xpansionによる配列決定(SBX、Stratos Genomics)である。移動可能な分子識別バーコードは、核酸又はその副生成物の検出が任意の物理的、化学的、及び/又は酵素的な(enzymatic)処理又はその特性に基づく核酸の任意の並行配列決定法に適用を見出すことが当業者に十分理解される。
本明細書で使用される「ヌクレオチドバーコード配列識別子配列」は、「識別子配列」とも略記され、DNA分子、又はその配列決定された配列をヌクレオチドバーコード配列として識別するためのヌクレオチドバーコード配列の片方又は両方の隣接定常配列中の1以上のアダプター配列を指す。ヌクレオチドバーコード配列識別子配列は、いかなる天然起源のゲノム、細菌DNA、若しくはウイルスDNAにもコードされない(したがって、クローニングベクター、又はより具体的にはクローニングベクター骨格に見られない)配列であるか、又は任意の天然起源のゲノム、ウイルスDNA、細菌DNAにコードされる配列に対して1%未満、2%未満、3%未満、4%未満、5%未満、10%未満、15%未満、20%未満、25%未満、30%未満、40%未満、50%未満相同な配列を有する。
異なるバッチの移動可能な分子識別バーコードは、異なるヌクレオチドバーコード配列識別子配列を有する場合があり、ヌクレオチドバーコード配列識別子配列が異なるバッチ、したがって適用及び/又は適用における工程を識別するように、異なる適用及び/又は同じ適用の異なる段階においてそれぞれ使用される。
本明細書で使用される「抽出配列」の用語は、実際の最小バーコード配列を抽出するため、ヌクレオチドバーコード配列中の最小バーコード配列に対する一方又は両方の隣接配列中の1以上のアダプター配列を指す。抽出配列は、いかなる天然起源のゲノム、細菌DNA、若しくはウイルスDNAにもコードされない(したがって、クローニングベクター、又はより具体的にはクローニングベクター骨格に見られない)配列であるか、又は任意の天然起源のゲノム、ウイルスDNA、細菌DNAにコードされる配列に対して1%未満、2%未満、3%未満、4%未満、5%未満、10%未満、15%未満、20%未満、25%未満、30%未満、40%未満、50%未満相同な配列を有する。
抽出配列は、ヌクレオチドバーコード配列識別子配列と同一であってもよく、又はそれと重複していてもよい。典型的には、配列決定されたヌクレオチドバーコード配列のバイオインフォマティクス分析は、2工程、或いは2つのインフォマティクスパイプライン又はプログラムを必要とする。第1のプログラムは、ヌクレオチドバーコード配列識別子配列によって全ての配列決定された配列から配列決定されたヌクレオチドバーコード配列を単離し、第2のプログラムは、抽出配列によってこれらの配列決定されたヌクレオチドバーコード配列の最小ヌクレオチドバーコード配列を抽出する。異なるバッチの移動可能な分子識別バーコード間で抽出配列は同一であるが、ヌクレオチドバーコード配列識別子配列が異なる場合、識別子配列に応じて、各バッチの移動可能な分子識別バーコードに対し、異なる第1のバイオインフォマティクスプログラム(プログラムにおいて異なる設定である)を使用しなければならないが、異なるバッチの移動可能な分子識別バーコード(異なるヌクレオチドバーコード配列識別子配列を有する)からの全ての最小ヌクレオチドバーコード配列の抽出には同じ第2のインフォマティクスプログラム(プログラムにおいて同じ設定である)が使用され得る。
本明細書で使用される「担体(複数の場合もある)」の用語は、移動可能な分子識別バーコードを含む基体及び容器を指す。担体は生体試料の収集に使用され得る。担体は、生体試料を収集する別の担体へとその内容物を移すために使用され得る。
本発明の一部は、遺伝暗号(核酸中に存在する塩基、すなわち、それぞれアデニン、シトシン、チロシン、グアニン及びウラシルを表すA、C、T、G、Uの配列)を利用して、本明細書ではヌクレオチドバーコードと称される独自の暗号を作り出す。これらは、ヒト、動物、植物、細菌、ウイルス又は真菌を起源とする生体試料等の特定の種類、起源、処理又は治療の物品の識別子に使用され得て、移動可能な分子識別バーコードとして使用される。かかる生体試料は、生物、全細胞、単一細胞、細胞調製物、及び任意の生物、組織、細胞又は環境に由来する細胞不含組成物を含む、任意の好適な場所から得られてもよい。また、生体試料は、血液中の循環腫瘍DNA、又は妊婦の血液中の循環胎児DNA等の循環核酸(例えば、DNA、RNA)のように細胞不含であってもよい。生体試料は、環境生検試料、穿刺液、ホルマリン固定された包埋組織、空気、農業試料、土壌試料、石油試料、水試料、又は粉塵試料から得られてもよい。幾つかの例では、試料は、血液、尿、糞便、血清、リンパ、唾液、粘膜分泌物、汗、脳脊髄液(central nervous system fluid)、膣液又は精液を含み得る、体液から得られてもよい。また、試料は、化粧料、食品(肉、乳、ワイン、オリーブオイル等)、パーソナルケア製品等の工業生産品から得られてもよい。試料は、組み換えクローニング、ポリヌクレオチド増幅、ポリメラーゼ連鎖反応(PCR)増幅、精製法(ゲノムDNA又はRNAの精製等)、及び合成反応を含む実験操作の生成物であってもよい。
短いDNA分子又はオリゴヌクレオチドを、遺伝暗号の「文字」の任意の所望の配列を有するように作製することができ、DNA分子のそれらの文字の特定の組み合わせを、特定の意味を有するように指定することができる。
小さいオリゴヌクレオチドの産生に好ましい一つの方法は、天然若しくは化学的に改変されたヌクレオシド、又は比較的少ないが非ヌクレオシド化合物の保護されたホスホラミダイトである構成要素を使用する、化学合成による。オリゴヌクレオチド鎖集合は、3'末端から5'末端方向に合成中に進行し、その後、合成サイクルと称される通例の手順が続く。単一の合成サイクルの完了は、成長している鎖への1個のヌクレオチド残基の付加をもたらす。各合成工程の100%未満の収率及び副反応の発生は、プロセスの効率の実用限界を定めるため、合成オリゴヌクレオチドの最大長が200個のヌクレオチド残基を超過しそうにない。この手順によって、オリゴヌクレオチドは1つずつ産生される。
また、オリゴヌクレオチドは、予め作製されたマスクを使用するフォトリソグラフィ、動的マイクロミラー装置を使用するフォトリソグラフィ、インクジェット印刷、微小電極アレイ上での電気化学等の様々な技術を使用してマイクロアレイ上で同時に産生され得る。
合成することができる種々のオリゴヌクレオチドの数は莫大である。例えば、5ヌクレオチド長のオリゴヌクレオチドが産生される場合、合計1024(45)個の異なるオリゴヌクレオチドを生成することができる。10ヌクレオチド長のオリゴヌクレオチドが産生される場合、100万個超(410)の異なるオリゴヌクレオチドが産生され得る(表1)。
表1.DNA配列の長さに応じた種々のヌクレオチド配列の数。
Figure 0007071341000001
かかるヌクレオチドバーコード配列の各々を、生体試料等の単一の物品を標識するための移動可能な分子識別バーコードとして使用することができた。しかしながら、かかる多数のヌクレオチドバーコードの合成は、非常に(quite)時間を要し、コストがかかる。
より経済的に好都合な方法は、試料又は物品に印を付けるために使用され得る移動可能な分子識別バーコードを構成するための2以上のDNA分子の使用であってもよい。1つの移動可能な分子識別バーコード当たり3個のヌクレオチドバーコードを使用する場合、30個の異なるヌクレオチドバーコードが1000個の異なる独自の移動可能な分子識別バーコードの生成を可能とする。1つの移動可能な分子識別バーコード当たり6個のヌクレオチドバーコードを使用する場合、60個の異なるヌクレオチドバーコードが100万個の異なる独自の移動可能な分子識別バーコードの生成等を可能とする(表2)。
表2.1つの移動可能な分子識別バーコード当たりに使用されるヌクレオチドバーコードの数の関数で作製され得る異なる移動可能な分子識別バーコードの数
Figure 0007071341000002
(a)10個のヌクレオチドバーコードのセットを使用する。各ヌクレオチドバーコードに対して、10個のヌクレオチドバーコード間で選択することができる。
したがって、移動可能な分子識別バーコードの生成のためのヌクレオチドバーコードの混合物の使用は、最も経済的である。1つの移動可能な分子識別バーコード当たりに使用するヌクレオチドバーコードが多いほど、そのプロセスはより経済的なものとなる。それぞれ6個のヌクレオチドバーコードからなる多くの移動可能な分子識別バーコードを産生するため、6個のヌクレオチドバーコードの全ての組み合わせで構築される、100万個の異なる移動可能な分子識別バーコードの生成にわずか60個の異なるヌクレオチドバーコードが必要となる。これは、わずか3個のDNA分子で構築される100万個の異なる移動可能な分子識別バーコードの構築に必要となる30000個の異なるヌクレオチドバーコードとは対照的である(表3)。
表3.移動可能な分子識別バーコード中のヌクレオチドバーコードの数に応じた所与の100万個の移動可能な分子識別バーコードを産生するのに必要な異なる移動可能な分子識別バーコードの数
Figure 0007071341000003
(a)10個のヌクレオチドバーコードのセットを使用する。各ヌクレオチドバーコードに対して、10個のヌクレオチドバーコード間で選択することができる。
したがって、独自の移動可能な分子識別バーコードを作製及び使用する技術的及び経済的な実現可能性は、異なるヌクレオチドバーコードの組み合わせ効果による。その場合、1つの移動可能な分子識別バーコードは、種々のヌクレオチドバーコードの混合物である。移動可能な分子識別バーコードは、ヌクレオチドバーコードの組み合わされた混合物が独自である限り独自のものである。移動可能な分子識別バーコードがx個のヌクレオチドバーコードで構築される場合、2つの移動可能な分子識別バーコードは、x-1個のヌクレオチドバーコードが共通するが、x番目のヌクレオチドバーコードについて異なる場合でも独自のものとなり得る。
移動可能な分子識別バーコードを利用するため、最終的に、移動可能な分子識別バーコード中のヌクレオチドバーコードを検出、識別及び/又は特性決定するべきである。移動可能な分子識別バーコードがそれ自体で使用される場合、ヌクレオチドバーコードのみを特性決定する必要がある。移動可能な分子識別バーコードが、遺伝子検査等のより複雑な適用において使用される場合、ヌクレオチドバーコードと検査対象の他の核酸標的の両方を特性決定する必要がある。これは、当業者に知られており、またMolecular Cloning: A Laboratory Manual, by Sambrook and Russel, 3rdEdition, Cold Spring Harbor Laboratory Press, 2001(その開示は引用することにより本明細書の一部をなす)に記載される、DNAの合成、重合、ライゲーション、PCR、RT-PCR、配列決定等の分子技術によって行われ得る。
特性決定の目的で一本鎖オリゴヌクレオチドバーコードを処理することは、幾つかの段階では、二本鎖DNA分子へのそれらの変換を必要とする。図1に記載される或る一つの好ましい方法は、2つの少なくとも部分的には二本鎖のライゲーションアダプターのライゲーションである。二本鎖アダプターは、特定の下流処理に対して他のアダプター配列を保有し得る。また、部分的に二本鎖のアダプターは、ヘアピン構造及びループ化構造等の他の特徴を保有し得る。ヌクレオチドバーコードは、最初にリン酸化される。代替的には、移動可能な分子識別バーコードの作製に対して、既にリン酸化されたヌクレオチドバーコードを使用する。1つの二本鎖アダプターは、一本鎖ヌクレオチドバーコードの片方の末端に結合することができる5'ヌクレオチドオーバーハングを有し、第2の二本鎖アダプターは、ヌクレオチドバーコードの他方の末端に結合することができる3'ヌクレオチドオーバーハングを有する。前者の二本鎖アダプターでは、5'ヌクレオチドオーバーハングを有するDNA鎖はその5'末端でリン酸化される。3'オーバーハングを有する後者の二本鎖アダプターでは、3'オーバーハングを有しない反対側の鎖がその5'末端でリン酸化される。これらの二本鎖アダプターの一本鎖ヌクレオチドバーコード配列に対するハイブリダイゼーションの後、DNAポリメラーゼによって新たな相補的なDNA鎖が合成され得て、ここでは、3'オーバーハングアダプター中の3'ヌクレオチドオーバーハングを有するDNA鎖が、他方の末端のアダプターの5''ヌクレオチドオーバーハングにそれが到達するまで、テンプレートとして結合されたヌクレオチドバーコードを使用して伸長される。その後、完全な二本鎖ヌクレオチドバーコードが得られるように、3つのオープンニックを結合するため、DNAリガーゼが使用される。両方の二本鎖アダプター中のオーバーハングは、1以上のヌクレオチド長となり得る。両方のアダプターのオーバーハングの長さは、同じ長さであってもよく、又は異なる長さであってもよい。1ヌクレオチドのオーバーハングのみを有する二本鎖ライゲーションアダプターを使用する場合、4個の異なるアダプター、すなわちAオーバーハングを有するもの、Cオーバーハングを有するもの、Gオーバーハングを有するもの、及びTオーバーハングを有するものが必要である。それらは当然ながら混合されてもよい。したがって、5'と3'の両方のオーバーハング二本鎖ライゲーションアダプターが1ヌクレオチドオーバーハングを有する場合、任意の配列の二本鎖を有する任意のヌクレオチドバーコードを作製するため、8個の異なるアダプターの混合物を必要とする。
移動可能な分子識別バーコードの生成に一本鎖ヌクレオチドバーコードを使用するのではなく、移動可能な分子識別バーコードの産生の開始から二本鎖ヌクレオチドバーコードを使用する。移動可能な分子識別バーコードは、特定の下流の処理機能及び適用に対するアダプター配列を保有し得る。その利点は、処理、特性決定及び/又は識別のための幾つかの又は全ての必要な特徴が、それらの特性決定に対する処理の間、後でこれらの特徴をライゲーションによって付着させるのではなく、ヌクレオチドバーコード分子中に既に存在することである。
図2は、二本鎖ヌクレオチドバーコードを構築する3つの好ましい方法を記載する。第1の戦略(図2a)では、各オリゴヌクレオチドに共通する定常配列によって挟まれる異なる独自の最小ヌクレオチドバーコード配列Nx(Nは任意のヌクレオチドであり、xはヌクレオチドの数である)を保有する、より長い一本鎖オリゴヌクレオチドが使用される。各オリゴヌクレオチドにおいて、独自の配列は、最終的には最小ヌクレオチドバーコード配列となる。定常配列又はその部分は、特定の下流の処理機能に対して他のアダプター機能を有し得る。その後、これらのオリゴヌクレオチドは、Nx配列に対して3'の隣接定常配列領域中にプライマー結合部位を有するプライマーを使用するDNA合成反応によって二本鎖とされ得ることから、他の第2の定常配列領域の末端までのNx配列に対して新たな相補的なDNA鎖が合成される。プライマーが3'定常配列領域の完全な末端にちょうど結合する場合、完全な二本鎖DNA分子が得られ、そうでなければ、得られる二本鎖ヌクレオチドバーコード分子は片方の末端で粘着性となる。第2の戦略(図2b)では、最小バーコード配列領域が、1つ(3')の部位でのみ定常配列領域と隣接するように、各種類のオリゴヌクレオチド(その後に定常配列が続く)に対して異なる独自の最小ヌクレオチドバーコード配列Nx特性を保有する一本鎖オリゴヌクレオチドを使用する。再びここで、定常配列又はその部分は、特定の下流の処理機能に対して他のアダプター機能を有し得る。これらのオリゴヌクレオチドは、その後、最小バーコード配列に対して3'の隣接定常配列領域中にプライマー結合部位を有するプライマーを使用するDNA合成反応によって二本鎖となり得ることから、最小バーコード配列単独及びその(thereof)末端に対して新たな相補的なDNA鎖が合成される。プライマーが3'定常配列領域の完全な末端にちょうど結合する場合には完全な二本鎖DNA分子が得られ、そうでなければ、得られる二本鎖ヌクレオチドバーコード分子は片方の末端で粘着性となる。おそらく、かかる二本鎖DNA分子は、最終的に、二本鎖ライゲーションアダプターによって定常配列領域が本来は存在していない部位の定常配列も付加するためのライゲーション工程等の下流の処理をなおも必要とする。第3の戦略(図2c)は、ここでも、各オリゴヌクレオチドに共通の定常配列によって挟まれる、異なる独自の最小ヌクレオチドバーコード配列Nxを保有する、より長い一本鎖オリゴヌクレオチドを使用する、第1の戦略の代替案である。各オリゴヌクレオチドにおいて、独自配列Nxは最小ヌクレオチドバーコード配列となる。3'定常配列は、5'定常配列と比較して、別のオリゴヌクレオチドとのハイブリダイゼーションに十分な、より小さい又はより大きいサイズを有し得る。その3'末端に定常配列領域に対して相補的な配列を保有する、又は第1の一本鎖オリゴヌクレオチドの最小バーコード配列領域に対して3'のその部分を保有するが、追加の5'定常配列を保有する、第2の一本鎖オリゴヌクレオチドを組み合わせる。再びここで、一本鎖オリゴヌクレオチド又はその部分のいずれかにおける定常配列は、特定の下流の処理に対する他のアダプター機能を有し得る。それらの相補的に共有される定常3'配列領域において両方の種類の一本鎖オリゴヌクレオチドのハイブリダイゼーションの後、他のハイブリダイズするオリゴヌクレオチドをテンプレートとして使用して、各オリゴヌクレオチドから伸長する新たなDNA鎖が合成され、完全な二本鎖ヌクレオチドバーコードが得られる。任意に、特定の下流の処理に対するアダプター機能を保有し得る、先の回に生成されたDNA分子の3'に位置する定常配列領域に相補的な配列をその3'末端に保有する定常配列を有する追加のオリゴヌクレオチド(複数の場合もある)によって、1回以上の追加のDNA合成反応が行われ得る。この方法で、ヌクレオチドバーコードは、単一のオリゴヌクレオチドの典型的な長さを超える場合がある長い定常アダプター領域によって生成され得る。各新たなオリゴヌクレオチドを連続する新たな反応に添加するのではなく、全てのかかるオリゴヌクレオチドを単一の反応において混合してもよく、熱安定性DNAポリメラーゼを用いて多くのサイクルにてDNA合成を行うことができる。最小バーコード配列及び完全な隣接配列を含む二本鎖バーコードもまた、gBlocks(商標)Gene Fragments (Integrated DNA Technologies)等の合成生物学で使用される方法を使用して1回の実行で合成され得る。
この方法で得られる異なるアダプター機能を有する一本鎖又は二本鎖のヌクレオチドバーコードの例は、限定されないが、図3に示される。
片方又は両方の隣接定常配列は、分子生物学のプロトコル及び手法に使用される天然に見られない(ヒト、動物、植物、細菌、ウイルス、真菌には見られず、クローニングベクター(ベクター骨格)にも見られない)人工配列である。配列決定の適用では、ヌクレオチド配列が定常隣接配列又はその部分(複数の場合もある)と同一であることがわかる場合、そのヌクレオチドがヌクレオチドバーコード配列を起源とし、この方法でヌクレオチドバーコード配列を識別することができると結論付けられる。特に、移動可能な分子識別バーコードが他の標的核酸と混合される場合、ヌクレオチドバーコード配列を起源とする配列読取りを識別することができる。実際に、ヌクレオチドバーコードから得られた配列読取りは、その後、例えば、種々のバイオインフォマティクスパイプライン(例えば、ヌクレオチドバーコードの識別及び定量のためのパイプライン、他の標的核酸を起源とする配列読取りのマッピング及び変異体呼び出しのためのパイプライン)によって、異なって処理され得る。定常隣接配列は、少ない、優先的には35%~65%の範囲のGC%含有量の変異を優先的に有する。例えば、この隣接配列のXヌクレオチドの任意の連続する配列(Xヌクレオチドは18個、19個、20個、21個、22個、23個、24個、25個、30個、35個、40個、45個及び/又は50個である)は、35%~(between)60%、40%~60%、45%~60%、50%~60%、55%~65%の優先的なGC含有量を有する(has)。例えば、この隣接配列のXヌクレオチドの任意の連続する配列(Xヌクレオチドは18個、19個、20個、21個、22個、23個、24個、25個、30個、35個、40個、45個及び/又は50個である)は、50℃~75℃、55℃~75℃、60℃~75℃、60℃~70℃の優先的なTmを有する。この方法で、任意の所望のオリゴヌクレオチド結合部位(例えば、増幅又は捕捉のためのプライマーに対する)を最も柔軟で効率的な方法で設計することができる。実際に、多くの種類の遺伝子NGS検査(種々の会社による)が、例えばマルチプレックスPCR、プライマー伸長ライゲーション等の目的のゲノムの標的領域を配列決定のために濃縮する種々の技術を使用して利用可能である。各種類の検査は、それらの特異的な検査条件を使用する。例えば、或る種類の検査は、全てのプライマーが所与のほぼ同じTmを有するマルチプレックス増幅を使用し得るのに対し、別の業者は別のTmを有するプライマーを使用する。また、検査において得られたアンプリコンは所与の特定のサイズ範囲を有し得ることから、全てのアンプリコンはほぼ等しく増幅され、選択されるサイズは異なる検査間で変化し得る。実際に、より小さいアンプリコンは、一般に、より大きなアンプリコンよりも効率的に増幅されることから、得られるアンプリコンの長さもまた、所与の検査の具体的な特徴となり得る特定の範囲に保持される。これらの検査が品質管理のため移動可能な分子識別バーコードを利用しようとする場合、ヌクレオチドバーコード配列を濃縮するプライマーをそれらのアッセイに添加するか、又はそこに含めなければならない。所与のアッセイにおけるヌクレオチドバーコードの濃縮に使用されるプライマー(複数の場合もある)は、その後、それらのアッセイにおける他のプライマーと同じTm等の特性を優先的に有しなければならない。定常隣接領域中により連続的なGC含有量の範囲を有することにより、移動可能な分子識別バーコードの濃縮を可能とするプライマー(複数の場合もある)の選択及び付加は任意の検査において最も容易に統合される。GC判定基準が非常に低い(20%未満)又は非常に高い(70%超)配列ブロックがある場合には、所与のTm(ほとんどは30℃~55℃の範囲にある)及び所与の特定のサイズ範囲のアンプリコンが得られるような位置を有するプライマー(複数の場合もある)結合部位を見つける判定基準は、得ることが難しい場合がある、或いは幾つかの検査については不可能である。
例えば、図3及び図4に記載されるように、制限酵素認識部位RE1から開始し、最小ヌクレオチドバーコード配列の前で終了する単離された上流定常隣接配列の例は、[配列番号1]、[配列番号2]、[配列番号3]、[配列番号4]、[配列番号5]、[配列番号6]、[配列番号7]、[配列番号8]、[配列番号9]、[配列番号10]の配列である。
例えば、図3及び図4に記載されるように、最小ヌクレオチドバーコード配列後から開始し、制限酵素認識部位RE2で終了する単離された下流定常隣接配列の例は、[配列番号11]、[配列番号12]、[配列番号13]、[配列番号14]、[配列番号15]、[配列番号16]、[配列番号17]、[配列番号18]、[配列番号19]、[配列番号20]の配列である。
[配列番号1]~[配列番号20]の配列の変異体は、ベクター中のクローニング部位に応じて、代替の制限酵素部位認識配列を有する。代替的には、[配列番号1]~[配列番号10]は下流定常隣接配列であり、[配列番号11]~[配列番号20]は上流定常隣接配列である。
代替的には、1以上の[配列番号1]~[配列番号20]の配列は、それぞれ[配列番号1]~[配列番号20]の配列の逆相補配列であってもよい。
代替的には、上流及び/又は下流の定常隣接配列は、[配列番号1]~[配列番号20]の配列であり、[配列番号1]~[配列番号20]の各配列の配列同一性と70%超、80%超、90%超、95%超、97%超、又は99%超の配列同一性を示す配列である。配列同一性の差は、例えば制限酵素に対する認識部位の付加又は欠失による結果であってもよい。
さらに代替的には、上流及び/又は下流の定常隣接配列は、指定の制限酵素認識配列と定常配列との間、及び/又は定常配列と最小ヌクレオチドバーコード配列との間の追加のヌクレオチド配列の存在による、[配列番号1]~[配列番号20]の配列を含む(comprise)。
さらに代替的には、上流及び/又は下流の定常隣接配列は[配列番号1]~[配列番号20]の配列のフラグメント、すなわち、少なくとも200ヌクレオチドの、少なくとも300ヌクレオチドの、少なくとも350ヌクレオチドの、少なくとも375ヌクレオチドの、又は少なくとも390ヌクレオチドのフラグメントを含む、又はそれからなる。
また、これらの二本鎖DNA分子は、プラスミド中又は他の複製コンストラクト中に更にクローニングされ得る。これらの二本鎖DNA分子の定常隣接配列中の制限酵素に対する認識部位を持つアダプターは、プラスミドにおけるこれらの二本鎖DNA分子のクローニングを促進し得る。例えば、両方の定常隣接配列は、同じ制限酵素に対する、又は2つの異なる制限酵素に対する認識部位を持つ場合がある。プラスミドにおける二本鎖DNA分子の効率的な定方向クローニングを可能とし得ることから、消化後に粘着性のDNA末端を生じる、各隣接部位における2つの異なる制限酵素に対する認識部位が好ましい。
移動可能な分子識別バーコードを産生するためのプラスミドの使用は、完全な数多くの移動可能な分子識別バーコードがわずか1つのオリゴヌクレオチド又は1つの合成DNAフラグメントから開始することができるという利点を有する。実際に、所与の独自のヌクレオチドバーコード配列を有する単一のオリゴヌクレオチド、又は所与のヌクレオチドバーコード配列を有する二本鎖ヌクレオチドバーコード分子の構築に使用されるオリゴヌクレオチドが同じ定常配列によって挟まれる場合、これらの異なるオリゴヌクレオチドを1つずつ合成する必要がある。これは、プラスミド等の複製分子中で移動可能な分子識別バーコードを使用する場合に回避することができ、より経済的となる。その時には、わずか1つのオリゴヌクレオチド合成反応が必要である。オリゴヌクレオチド合成反応の間、2以上のヌクレオチド、或いは4個全ての可能性のあるヌクレオチドが、合成工程の所与のサイクルの間に付加され得て、オリゴヌクレオチドに組み込まれ得る。4つ全ての構成要素(N)が連続的なサイクル数に亘って付加される場合、これらのサイクルの数に等しい長さ(x)の全ての可能性のある配列が合成され、したがって、長さがNxの全ての可能性のある無作為な配列を有するオリゴヌクレオチドが単一の合成反応において得られる。2以上のヌクレオチドが付加されたサイクルに先行する及び後続するサイクルの間にシグナルヌクレオチドが付加され、組み込まれる場合、オリゴヌクレオチドの混合物は、いずれも同じ定常配列と隣接する、ランダムヌクレオチドバーコード配列(Nx)を含む単一のチューブに得られる。同様に、異なる最小バーコード配列及び同じ完全な隣接配列を含む、gBlocks(商標)Gene Fragment(Integrated DNA Technologies)等の合成DNAフラグメントの完全な混合物が産生され得る。
実際の最小のヌクレオチドバーコードの長さは、適用に応じて任意の好適な長さとなり得る。全ての可能性のあるヌクレオチドが10サイクルの伸長(stretch)に対して許容される場合、410(1048576)個の異なるヌクレオチドバーコード配列が単一のオリゴヌクレオチド合成反応で合成され得る。全ての可能性のあるヌクレオチドが25サイクルの伸長に対して許容される場合、425(1125899906842620)個の異なるヌクレオチドバーコード配列が単一のオリゴヌクレオチド合成反応で合成され得る(表1)。幾つかの場合、実際の最小バーコード配列は、約2ヌクレオチド長~約500ヌクレオチド長、約2ヌクレオチド長~約100ヌクレオチド長、約2ヌクレオチド長~約50ヌクレオチド長、約2ヌクレオチド長~約25ヌクレオチド長、約6ヌクレオチド長~約25ヌクレオチド長、又は約4ヌクレオチド長~25ヌクレオチド長であってもよい。幾つかの場合、最小バーコード配列は、約10を超える、20を超える、100を超える、500を超える、750を超える、1000を超える、5000を超える又は10000を超えるヌクレオチド長である。
一本鎖オリゴヌクレオチドのかかる混合物の最小バーコードNx配列と同じ、定常隣接配列領域中に位置するアダプターは、上に記載されるように、限定的な数の反応において、或いは単一の反応において二本鎖DNA分子へのそれらの変換を可能とする。理論上全ての可能性のある最小バーコードNx配列を有するこの二本鎖DNA分子の混合物又はライブラリから、上に記載されるように、これら全ての可能性のある最小バーコードNx配列を含むプラスミドライブラリを作製することができる。その後、これら全ての可能性のある最小バーコードNx配列を有するこれらの異なるプラスミドを保有する細菌ライブラリが得られるように、これら全ての可能性のある最小バーコードNx配列を保有し、含むかかるプラスミドライブラリを、細菌細胞の形質転換に使用することができる。かかる細菌ライブラリから、グリセロールストックを将来的な使用のため生成することができる。各レベルにおいて、すなわち任意の可能性のある最小バーコードNx配列を有するオリゴヌクレオチド、その二本鎖DNA分子、そのプラスミド、その細菌培養物を、当業者に知られ、Molecular Cloning: A Laboratory Manual, by Sambrook and Russel, 3rdEdition, Cold Spring Harbor Laboratory Press, 2001に記載される簡単な方法で、終身的な使用(lifetime use)のために単一のチューブに得る。ヌクレオチドバーコード組成物フォーマットの各々を、移動可能な分子識別バーコードの生成に使用することができる。ヌクレオチドバーコードを保有する細菌細胞であっても、移動可能な分子識別バーコードを産生するのに使用し、適用においてそれ自体を使用することができる。ここではプラスミドで形質転換された細菌が記載されるが、任意の複製コンストラクト及び複製コンストラクトに対する宿主を使用することができる。
全ての利用可能なNxランダム配列の1つの所与の最小ヌクレオチドバーコード配列を保有する個々のプラスミドを、いつでも必要な時に、寒天プレート培養後にかかる細菌培養物から容易に得ることができ、該細菌培養物からは、その後、個々のコロニーを取って、当業者に知られている方法を使用して、所与の最小ヌクレオチドバーコード配列を保有するプラスミドを十分な量採取するため、更に成長させることができる。各移動可能な分子識別バーコードが6個の異なるヌクレオチドバーコードプラスミドで構築される場合、わずか60個の細菌コロニーを取って、単離し、成長させて、100万個の異なる移動可能な分子識別バーコードを生成するためプラスミドをプレップする(表2を参照されたい)。
移動可能な分子識別バーコードの適用において、ヌクレオチドバーコード(barcode)配列は、最後に特性決定され、識別されなければならない。高度並行配列決定は、これらの配列の特性決定方法となり得る。最小バーコード配列は、定常隣接配列間のその位置によって識別可能となる。現在最も使用される商業的な高度並行配列決定技術によって得られる典型的な配列読取り長さは、100ヌクレオチド長~150ヌクレオチド長、或いはそれ以上の長さである。また、ヌクレオチドバーコード配列を識別して処理するため、特に配列決定のため他の標的核酸を含む混合物中にヌクレオチドバーコード配列が存在する場合、最小バーコード配列領域の隣接配列の少なくとも幾つかの部分が配列決定されなければならない。また恐らくは、プール化バーコード配列も配列決定されなければならない。典型的には100ヌクレオチド長~150ヌクレオチド長である配列読取りにおけるこれらの配列の減算の後、これは、まだ50ヌクレオチド長~100ヌクレオチド長の最小ヌクレオチドバーコード配列を許容し、すなわち、最大450個~4100個の特有のヌクレオチドバーコード配列を許容する。実践上の理由のため、比較的低い長さ範囲を有する最小ヌクレオチドバーコード配列を使用することを目的とする場合がある。第1に、25ヌクレオチド長の最小ヌクレオチドバーコード配列によって既に得ることができる異なる独自のヌクレオチドバーコード配列の数は、既に、従来は必要とされ得るヌクレオチドバーコード配列の数を超過している。次に、特定の高度並行配列の適用は、100ヌクレオチド長~150ヌクレオチド長の配列読取りさえも必要としない。例えば、高度並行配列決定のトランスクリプトーム研究では、転写物の識別を可能とするために、25ヌクレオチド長~35ヌクレオチド長の短い配列読取りのみが必要とされ得る。今までどおりかかる適用では、より長い最小ヌクレオチドバーコード配列を使用することができるが、最小ヌクレオチドバーコード配列の最初の25ヌクレオチドは既に非常に特有となる可能性があることから、ヌクレオチド25位~35位を越えて得られるヌクレオチドバーコード配列を単に無視することによって、かかるデータの分析はより複雑となる場合があり、追加の(バイオ)インフォマティクス処理の手法を必要とする。25ヌクレオチドである最小ヌクレオチドバーコード配列によって既に得ることができている既に十分な数の異なるヌクレオチドバーコードを考慮すれば、追加の(バイオ)インフォマティクス処理は、不必要な付加的な負担である。
例えば片方又は両方の定常隣接配列中に位置するヌクレオチドバーコード配列識別子配列によって、どのヌクレオチド配列がヌクレオチドバーコードに由来するかを単に識別するのではなく、定性(アイデンティティ)及び/又は定量(数)の目的、例えば品質管理のため移動可能なDNAバーコードが、突然変異に関して分析される他の核酸と混合される遺伝子検査等のため実際の最小バーコード配列が識別される必要がある場合がある。
最小ヌクレオチドバーコード配列は、両方の定常隣接配列中に位置する抽出配列における/抽出配列の間の、又は1つの定常隣接配列中に位置する抽出配列から開始する若しくはそこで終了する場所によって識別され得る。
定常隣接配列中の任意配列が使用され得るが、最も効率的なものは、最小ヌクレオチドバーコード配列に直接隣接するヌクレオチドである。例えば、最小バーコード配列は25ヌクレオチド配列長である場合、先行する7ヌクレオチドを第1の抽出配列として使用することができ、後続する7ヌクレオチドを第2の抽出配列として使用することができる。より具体的には、全ての配列読取りを、25ヌクレオチドによって分離される2つの抽出配列について確認し、その後、25ヌクレオチドの配列を抽出し、最小バーコード配列として特定する。当然ながら、混合された標的核酸に由来する他の標的ヌクレオチド配列の中にもこれらの基準を満たし得るものがあり、誤った最小バーコード配列が抽出される。7ヌクレオチド長の2つの所与の抽出配列が25ヌクレオチドによって分離される確率は、16807個中1個である(表4)。
表4.片側又は両側のいずれかで最小バーコード配列に隣接する場合、その長さに基づいて、所与の抽出配列が見出される可能性。
Figure 0007071341000004
これらの偽陽性を有する可能性は、抽出配列の長さを増加させることにより減少する。かかる偽陽性を防止するため、より長い抽出配列が好ましく(表4)、完全な定常隣接配列が最も良好である。
誤った最小バーコード配列の知見は、他の混合された標的核酸との複雑性に伴って、また抽出配列のサイズの減少に伴って増加する。混合された標的核酸が複雑であればあるほど(例えば、1個又は数個の遺伝子の標的濃縮に対して、移動可能な分子識別バーコードが断片化された完全なゲノムと混合される場合)、特定のフラグメントが抽出配列の判定基準を満たし得る確立が高くなる。当然ながら、ヌクレオチドバーコード配列及び他の標的ヌクレオチド配列の混合物において、ヌクレオチドバーコード配列に由来する標的ヌクレオチド配列は、ヌクレオチドバーコード配列識別子配列によって最初に単離され得て(抽出配列に対して同一である可能性がある)、第2相では、単離されたヌクレオチドバーコード配列においてのみ、実際の最小バーコード配列を特性決定/処理する。この方法では、より小さな抽出配列が使用される場合、偽性の最小バーコード配列の抽出を防止することもできる可能性がある。
最小バーコード配列の抽出は抽出配列(複数の場合もある)の正確な配列に基づく可能性があるため、定常隣接配列決定(constant flanking sequencing)に、より具体的には抽出配列領域に導入されるDNAの合成、増幅及び配列決定のエラーは、結果として完全な一致を生じないため、したがって最小バーコード配列は抽出され得ない。ここでは、抽出配列の長さが短いほど、抽出配列の領域において増幅及び/又は配列決定のエラーが起こる確率が低下する。配列中の配列決定された塩基の質はフラグメントの末端に向けて減少するため、配列決定されたフラグメントの末端において、シグナルの低いヌクレオチドは切り取られる。検査対象のゲノムDNAは、したがって試料に添加されたヌクレオチドバーコードもまた、配列決定ライブラリの作製のため断片化される(例えば、アダプターのライゲーションによって)場合、ヌクレオチドバーコード配列に由来する配列決定フラグメントの関連する開始及び終了は変化する。末端が最小バーコード配列中に位置する場合、最小バーコード配列は完全には配列決定されないことから、特定することもできない。配列の末端が最小バーコード配列のわずか数ヌクレオチド後に位置する場合、定常隣接配列のごく一部のみが特定される。抽出配列の長さが最終的に得られる配列より大きい場合、最小ヌクレオチドバーコード配列が完全に配列決定されるが、抽出配列が認識されないことから、ここでも最小バーコード配列を特定することができない。またこれは、抽出配列が、最小バーコード配列のすぐ隣、すなわち最小バーコード配列の直前及び直後に位置することが最良であることを意味する。
したがって、長すぎる抽出配列は、増殖及び配列決定のエラー、及び/又は配列決定されたヌクレオチドの品質が悪いため、最小バーコード配列の識別を逸する可能性がある。短すぎる抽出配列は、結果として偽陽性最小バーコード配列を見出すことになり得る。結局、両方の落とし所として、したがって使用される抽出ヌクレオチド配列の長さにバランスを見出さなければならない。
また、左右の定常抽出配列における/その間のその位置によって最小ヌクレオチドバーコード配列を特定するのではなく、1つの定常抽出配列のみを使用し得る。上流の抽出配列が使用される場合、所与の長さの下流のこの抽出配列を用いて、最小ヌクレオチドバーコード配列を特定し、下流抽出配列が使用される場合、所与の長さの上流のこの抽出配列を用いて、最小ヌクレオチドバーコード配列を特定する。実際に、最小ヌクレオチドバーコード配列に対して7ヌクレオチド長の上流及び7ヌクレオチド長の下流の抽出配列の上の例では、最小ヌクレオチドバーコード配列の特定のため、14ヌクレオチド長の1つのみの(上流又は下流の)抽出配列を使用する場合(1/414=1/268435456)、検査対象の試料中の他の核酸に由来する配列決定された配列の非特異性の分析に対して、ヌクレオチドバーコード配列に由来する配列決定された配列の特異的分析の同じストリンジェンシー/精度が得られる。
直線化が行なわれる場所は、同じ量/濃度の移動可能な分子識別バーコードが使用される場合であっても、所与の配列決定実験でより多くの最小ヌクレオチドバーコード配列を回復するということを意味し得る。例えば、DNAフラグメントの末端は、内部フラグメントよりも超音波処理によって断片化されにくい。標的配列決定テンプレートが捕捉によって作製され、捕捉オリゴがフラグメントに対して内部に位置する場合、捕捉オリゴが向けられるヌクレオチド及びその隣接配列における読取り深さ(read depth)はガウス分布を有する。標的配列決定テンプレートが捕捉によって作製され、捕捉オリゴが(例えば制限酵素による直線化のため)かかるフラグメントの末端に位置する場合、捕捉オリゴが向けられるヌクレオチド及びその隣接配列における読取り深さはガウス分布を有しない。したがって、直線化点から開始してより深い読取り深さが得られ、最小ヌクレオチドバーコード配列がこの開始点の近くに配置される場合、より大きな数の最小ヌクレオチド配列が同じ量のヌクレオチドバーコード、したがって同じ量の移動可能な分子識別バーコードに対して得られる。
優先的には、移動可能な分子識別バーコード中の異なる最小のヌクレオチドバーコード配列は、同じ長さ(例えば25ヌクレオチド長)を有する。全ての最小のヌクレオチドバーコード配列が同じ長さを有する場合、それらの下流の(バイオ)インフォマティクス処理はより単純である。しかしながら、移動可能な分子識別バーコード中の最小ヌクレオチドバーコード配列は異なる長さを有してもよく、より複雑な適用のみならず、より複雑な下流の処理を可能とする。移動可能な分子識別バーコードが異なる長さの最小ヌクレオチドバーコード配列を含む場合であるが、それらの最も小さいものが制限のない数の異なる最小分子識別バーコード(minimal molecular identification of barcodes)の生成を可能とするのにそれでも十分長い場合、より長い最小分子バーコード中のヌクレオチドを無視することによって、それほど複雑でない(バイオ)インフォマティクス処理がなおも使用され得る。例えば、移動可能な分子識別バーコードが25 nt長~30 nt長の最小ヌクレオチドバーコードを含む場合、25ヌクレオチドのみ(したがって、25 ntの最小ヌクレオチドバーコード配列中の全てのヌクレオチド、及び30 nt最小ヌクレオチドバーコード配列中の最初の25ヌクレオチドのみ)を分析してもよい。同じ長さ及び異なる長さの最小ヌクレオチドバーコード配列を有するヌクレオチドバーコードの混合物が使用される場合、より長い最小ヌクレオチドバーコード配列の長さが(バイオ)インフォマティクス手段によって切り取られ、少なくとも2つの最小ヌクレオチドバーコード配列が同じ長さを有する時点から、(並行)配列決定のみを使用して、同じ長さの最小ヌクレオチドバーコード配列を区別及び識別することができる。
移動可能な分子識別バーコードの生成のための2つの異なる最小ヌクレオチドバーコード配列は、それらが1つのヌクレオチド位置のみでヌクレオチドについて異なる場合、理論上異なる配列である。しかしながら、DNA配列の特性決定に使用されるほとんどのDNAの合成、増幅及び配列決定の技術は、エラーを起こしやすい。高度並行配列決定技術は、最大0.1%~15%のシーケンシングエラー率を有する。例えば、所与の多くの移動可能な分子識別バーコードが、2つの最小のヌクレオチドバーコード配列が1つのヌクレオチド位置のヌクレオチドのみが異なるヌクレオチドバーコードで構築される場合であれば、2つの最小ヌクレオチドバーコード配列が異なるヌクレオチド位置における配列決定エラーのため、これらのヌクレオチドバーコード配列のうち1つは、他のヌクレオチドバーコード配列として誤って分類され得て、他の最小ヌクレオチドバーコード配列の配列が誤って結論付けられる。
したがって、所与のロットの移動可能な分子識別バーコードの生成に使用される異なるヌクレオチドバーコードは、それらの最小ヌクレオチドバーコード配列が十分異なっている必要があるため、1個のヌクレオチドバーコード配列が、増幅及び/又は配列決定のエラーのために別のヌクレオチドバーコード配列に変換される可能性は非常に低い。一本鎖オリゴヌクレオチド、又はその二本鎖コンストラクトが上に記載されるようにそれら自体で使用される場合、かかる距離的に無関係の(distantly unrelated)配列は、各オリゴヌクレオチドの実際の合成の前に、開始直後から設計されなくてはならない。例えば、ヌクレオチドバーコードプラスミドが使用される場合であれば、十分に距離的に無関係の配列を有するヌクレオチドバーコードプラスミドは、全ての可能性のあるヌクレオチドバーコード配列を保有するプラスミドのライブラリから選択されなければならない。
したがって、例えば、100万個の移動可能な分子識別バーコードのロットを産生するために60個のヌクレオチドバーコードプラスミドを必要とする場合、十分に異なった配列を有する最良の60個のプラスミドが選択され得るように、実施の際には、60個よりも多いプラスミドが必要となる。
最も異なる配列の選択は、例えば、系統解析によって得ることができる(De Bruyn et al., 2014)。系統樹は、それらの物理的又は遺伝的な特性の類似性及び差に基づく1セットの配列間の推測される関係を示す分岐図又は木である。かかる進化系統樹より、最多の遺伝変化を有する、又は最も高い遺伝距離を有する配列を選択することができる。
十分に異なるヌクレオチドバーコード配列を選択することとは別に、増幅に起因するエラー及び/又は配列決定のエラーが補正され得る配列が選択され得る。これは、エラー補正のアルゴリズム及びコードの使用によって達成され得る。エラー補正コードの2つの一般的なセットは、ハミング符号(Hamady et al., 2008)及びレーベンシュタイン符号(Buschmann and Bystrykh, 2013)である。
したがって、ヌクレオチドバーコード配列は、高度並行配列決定によって識別され得る。移動可能な分子識別バーコードが6個のヌクレオチドバーコード配列で構築される場合、配列決定は、それらの6個のヌクレオチドバーコード配列と並んで、増幅及び/又は配列決定のエラーのためにこれらの6個のヌクレオチドバーコード配列から逸脱した他の配列を明らかにしなければならない。各配列が見つかる回数が(例えば、ヒストグラムにおいて)特定される場合、真の6個のヌクレオチドバーコード配列は、配列決定エラーを伴う配列よりもはるかに高い頻度で見つかる。頻度に対する閾値レベルは、ヌクレオチドバーコード配列を保持する又は廃棄するために設定され得る。配列決定エラーを伴う配列は閾値レベルを下回る頻度で見つかるため、それらの配列を無視し、ヌクレオチドバーコードを特定する更なる分析では廃棄して、それによって実際に存在する移動可能な分子識別バーコードのみを断定する。
増幅及び/又は配列決定のエラーを保有することから、利用可能な配列では、配列のごく一部分が分析で失われる。しかしながら、高度並行配列決定による配列読取り数のアウトプットは莫大であることから、それでも増幅及び配列決定のエラーを伴うことなく十分な配列読取りが得られ、なおも実際のヌクレオチド及び移動可能な分子識別バーコードが特定され得る。
エラー補正を行うことができる移動可能な分子識別バーコードの1つのロットを生成するためにヌクレオチドバーコード配列が選択された場合、配列決定エラーを有する配列は、おそらくはエラー補正アルゴリズムによって補正され得るため、増幅及び/又は配列決定のエラーによる配列の喪失はわずかにすぎない。
所与のロットの移動可能な分子識別バーコードの生成のためのヌクレオチドバーコード配列がエラーの補正を可能とし得る方法によって選択されなかった場合であっても、増幅及び/又は配列決定のエラーを伴う配列は、分析の際になおも回復可能である。例えば、配列が低カウント(count)で観察されるが、高カウントの近隣の配列を有する場合、低カウントの配列は、推定される突然変異率に基づく高カウントの配列の増幅及び/又は配列決定のエラーを介して生じている可能性が非常に高く、その際、それほど豊富でない配列のカウントは、より豊富な近隣の配列に起因し、それに変換され、それがカウントされ得る(Akmaev and Wang, 2004)。
所与のロットの移動可能な分子識別バーコードの産生に使用されるヌクレオチドバーコードプラスミドは、任意に、産生後に直線化され、実用化において直線化形態で使用される。この方法では、プラスミドの偶発的な複製を防止する。さらに、直鎖ヌクレオチドバーコード配列で構築される移動可能な分子識別バーコードの使用は、環状化された、おそらくはスーパーコイル化されたヌクレオチドバーコード配列よりも、試料バーコードの適用においてより効率的となり得る。後に産生されるヌクレオチドバーコードミックスからなる莫大な数の移動可能な分子識別バーコードを直線化するのではなく、移動可能な分子識別バーコードに対してヌクレオチドバーコードプラスミドを混合する前に、限られた数のヌクレオチドバーコードプラスミドを直線化する方が経済的である。ヌクレオチドバーコードプラスミドの直線化は、プラスミド中ではあるが、最小ヌクレオチドバーコード配列及びその(部分的な)隣接ヌクレオチドの外にある1以上の部位で切断する1以上の制限酵素による消化によって得ることができる(図4)。プラスミドが、プラスミド中の1つのみの部位で切断する1つの制限酵素によってのみ切断され得る場合、切断されなかった微量のプラスミドは環状のまま存在する。これは、プラスミド中で2以上の部位を切断するように、1以上の制限酵素を使用することによって防止される。その時に単一のプラスミドにおいて全ての部位で切断に失敗する確率は、極めて低い。優先的には、制限酵素(複数の場合もある)は、消化の後、熱不活性化される。実際に、移動可能な分子識別バーコードが遺伝子検査で使用され、ゲノムDNAと混合される場合、その時点でも活性な制限酵素が、なおもゲノムDNAを消化し得る。ヌクレオチドバーコードプラスミドが2以上の部位で切断される場合、異なる直鎖フラグメントが得られ、そのうち1つのみのフラグメントが実際の最小ヌクレオチドバーコード配列を含む。ヌクレオチドバーコードプラスミドの全ての消化フラグメントは、適用においてそれ自体で使用され得る。代替的には、最小ヌクレオチドバーコード配列を含む消化フラグメントのみが単離され得て、適用において使用され得る。優先的には、消化の前又は後のいずれかにヌクレオチドバーコード分子のDNA濃度が特定されるため、ヌクレオチドバーコードを同じ濃度に標準化することができ、異なるヌクレオチドバーコードがより等モルレベルで見られる移動可能な分子識別バーコードが産生される。制限酵素は、ヌクレオチドバーコードプラスミドの消化の後に、実際の最小ヌクレオチドバーコードが大、中、又は小サイズのフラグメント中に配置されるように選択され得る。例えば、移動可能な分子識別バーコードが、遺伝子検査において使用するためにゲノムDNAが単離される血液試料を標識するのに使用される場合、実際の最小ヌクレオチドバーコード配列は、より大きなDNAフラグメント中に配置されることが好ましい場合がある。実際に、かかる生体試料のゲノムは、ゲノムDNA抽出キットによってより効率的に抽出され得る、より大きなゲノムDNAフラグメントにおいて示される。より短いフラグメントはDNA抽出プロトコルにおいて排除される断片化DNAとみなされることから、より小さなフラグメントは、かかるゲノムDNA抽出キットによって効率的に保持され得ない。Real-Time SMRT(商標)DNAシーケンシング及びナノポアシーケンシング等によって、より長い配列読取りを生成するため高度並行配列決定技術を使用する場合、最小バーコード配列もまた、これらの各DNA配列テンプレート調製物とより適合性であるように、より長い直線化フラグメント中に優先的に配置される。移動可能な分子識別バーコードが、例えば21番染色体トリソミーに対する非侵襲的出生前診断(NIPT:non-invasive prenatal testing)のため妊婦から得られた血液試料を標識するのに使用される場合、胎児循環DNAが単離される。遊離の循環DNAは胎児に由来するサイズの小さい断片化されたDNAであることから、最小ヌクレオチドバーコード配列は、胎児DNAと共に抽出され得るように、小さな消化生成物上に優先的に配置され得る。同じ考慮が循環腫瘍DNAを分析する検査に必要とされる。また、ホルマリン固定パラフィン包埋組織(FFPE)から得られるDNAは、むしろ小さなサイズの増幅可能なDNAフラグメントを含むことから、この適用では、最小ヌクレオチドバーコード配列もまた、FFPEのDNAと共に抽出され得るように、小さな消化生成物上に優先的に配置され得る。したがって、移動可能な分子識別バーコードを産生するのに使用されるヌクレオチドバーコードプラスミドは、適用に基づいて異なって消化され得ることから、所与のロットの移動可能な分子識別バーコードは、所与のセットの適用、更には1つの所与の適用のみに対して産生される。図5は、NGSを配列決定するためのテンプレートとして、分子のヌクレオチド配列をどのように作製するかという例を示す。
したがって、移動可能な分子識別バーコードの重要な適用は、遺伝子検査が行われる生体試料の標識である。試料は、1以上の生物学的物質の初期の形態、例えば血液、血漿、血清、尿、唾液、喀痰、糞便、粘膜分泌物、涙、関節液、脳脊髄液、腹腔液又は他の体液に由来するか、又はその形態であってもよい。試料は、細胞を含んでもよく、又は細胞を含まなくてもよい。移動可能な分子識別バーコードは、試料の入れ替わり及び汚染を防止するため、遺伝子検査の絶対的な品質保証を可能とする。より具体的には、試料の入れ替わり及び汚染は防止されないが、移動可能な分子識別バーコードが、試料の入れ替わり及び汚染が発生した場合に検出することを可能とする。移動可能な分子識別バーコードは、遺伝子検査プロセスにできるだけ早期に添加されることが好ましい。移動可能な分子識別バーコード配列は、全プロセスの最後に見つけられなければならず、これが品質保証を担保する。この方法では、移動可能な分子識別バーコードが添加された時点からプロセス全体の品質が保証される。最も早い可能性のある時点は、分析用の標本が収集される時であってもよく、例えば、移動可能な分子識別バーコードが収集チューブ(例えば、血液試料用の収集チューブ)に既に存在する。品質保証の他に、かかる移動可能な分子識別バーコードは、検査室及び報告のプロトコルの自動化を可能とする。実際に、配列決定装置は、調査対象の標的ヌクレオチド酸(nucleotide acids)中の突然変異を読み取るのみならず、移動可能な分子識別バーコードを含む物品上の物理的バーコードが、試料の全ての情報を保存するLIMSシステムに紐付けられる際に、試料に添加され関連付けられた移動可能な分子識別バーコードに対するこの突然変異を保有する患者の氏名も読み取る。
上記方法は、試料を移動可能な分子識別バーコードと接触させながら、生体試料が採取された場所から、試料分析が行われる臨床検査室(例えば、生体試料が採取された場所から少なくとも100メートル、1000メートル、10000メートル、100000メートルの場所にある)へと輸送する工程を含み得る。この方法では、顧客が、その時でも得られた自身の試料のデータを完全に管理していることから、実際の検査は、問題なく集中化された検査室へ外部委託することができる。顧客がかかる集中化された検査室の配列決定データを受け取る際には、顧客は、どのヌクレオチドバーコード配列がその試料の配列決定データになくてはならないかを分かっているため、外部委託された又は集中化された検査室に送られた自身の試料からのデータを顧客が確実に受け取ることになる。任意の他のヌクレオチドバーコード配列の発見は、配列決定データが自身の試料に由来しない、及び/又は配列決定データが別の試料に由来する配列によって汚染されたと断定する。
DNA試料が配列決定に移る前であっても、別の試料に由来するDNAによって既に汚染されている可能性がある。217個の完全なゲノムを配列決定した研究では、7個の試料(3.2%)が汚染DNAを含んでいるとわかった(Taylor et al., 2015)。循環胎児DNA又は腫瘍DNA等の全DNAの所与のDNA画分における突然変異を探すだけの検査において、かかる汚染は、検査結果に負に干渉する可能性があり、誤った検査結果をもたらすことさえある。DNA抽出は、Chemagic(商標)機器(PerkinElmer)、QIAcube機器(Qiagen)等の自動化システムで行われることが多い。DNA抽出の間、試料及び/又は処理チューブは或る時点では開いているか、又はかかるDNA抽出システムにおいて全てのプロセスを通して開いていることさえある。溶液は、これらのチューブ間で移され、撹拌され、試料間を汚染し得るエアロゾルを生成する可能性がある。これらのプロセスはいずれも、使用中以外であっても環境から隔離されたシステムの小さいチャンバーに限局される。かかるシステムが遠心分離器を利用する場合、エアロゾルは限局されたチャンバーで拡散されることさえある。チャンバーの限局される容量を考慮すれば、汚染エアロゾルの割合は、開放型の検査室ではより一層高くなる可能性がある。したがって、これらの機器の数年にわたる継続的な使用は、限局されたチャンバーにおいて汚染DNAを徐々に構築し、新たに処理する試料を汚染する可能性がある。したがって、移動可能な分子識別バーコードの使用は、抽出されたDNA試料の定量及び品質の採点を可能とし得る。したがって、特に循環胎児DNA又は腫瘍DNA等の標的DNAのごく一部を分析する検査では、移動可能な分子識別バーコードは、最終的には、検査したDNAの品質スコア、ひいては検査全体に関する品質スコアを提供し得る。
品質管理又は品質保証の適用に使用される移動可能な分子識別バーコードは、移動可能な分子識別バーコードそれら自体が最良の品質保証された条件下で産生されることを必要とする。最大100万個以上の独自の移動可能な分子識別バーコードを産生するためにごくわずかな数のヌクレオチドバーコード配列が必要とされるという事実を考慮すると、これらのヌクレオチドバーコード分子を含む、わずかな数のチューブ及び/又はプレートを操作するのみでよい。さらに、それらのチューブ及び/又はプレートは、生産中に巨視的な紙面の1D又は2Dのバーコードラベルで容易に標識可能であり、生産中、スキャニングによって識別され得る。ヌクレオチドバーコードを含むこの少数のチューブ及び/又はプレートから作製される、移動可能な分子識別バーコードを含むチューブ、又は任意の受取り容器の作製は、むしろ基本的なロボットシステムによって行われ得る。この全産生プロセスもLIMSシステムに接続される場合、移動可能な分子識別バーコードの異なる受取りチューブ又は容器は、非常に低いエラーリスクで生産され得る。
例えば、異なる移動可能な分子識別バーコードを含む100万個の異なる受取り器が限られた数の60個のヌクレオチドバーコードから産生されるという事実は、産生後の移動可能な分子識別バーコードの品質検査さえも可能とする。実際に、100万個の移動可能な分子識別バーコードの各ロットにおいて、100万個の移動可能な分子識別バーコードの全ての組み合わせの産生は、固定された手順の所定のプロセスで行われ、予想されるヌクレオチドバーコードが選択されたチューブに存在するかどうかを確認するため、全部のロット又はバッチのうち特定のチューブを選択し、その後、最終的には、60個のヌクレオチドバーコードの全てが個別に、予想される100万個の各々の異なるチューブ又は受取り容器となったと結論付けることができる。
単一のヌクレオチドバーコード配列が移動可能な分子識別バーコードとして使用された場合であれば、産生後の品質管理は、正確なヌクレオチドバーコード配列が存在することを確かめるために単一のヌクレオチドバーコード配列を含む全てのチューブを検査しなければならないことを意味し、このことは、それぞれの移動可能な分子識別バーコードの容器を犠牲にする必要があるためもはや使用できないことから、すなわち使用した場合には、移動可能な分子識別バーコードが二度と使用されないことを意味するため、産生後にかかる品質管理を行うことができなくなる。限られた数のヌクレオチドバーコードから移動可能な分子識別バーコードを産生するためにヌクレオチドバーコードの混合物を使用することにより、品質管理のため、移動可能な分子識別バーコードの最小限のチューブ又は受取り容器のみを犠牲にする必要がある。60個のヌクレオチドバーコードが100万個の異なる可溶性バーコードの生成に使用される場合、各容器が6個のヌクレオチドバーコード配列を含むことから、更には60個未満の移動可能な分子識別バーコードのチューブ又は受取り容器を犠牲にする必要があり、そうすることによって1個の移動可能な分子識別バーコードの容器を犠牲にするだけで6個のヌクレオチドバーコード配列の情報を提供する。実施では、100万個の移動可能な分子識別バーコードのチューブ又は受取り容器のロットを一度に産生することはできないが、より少ない数、例えば1回の産生当たり10000個のチューブが産生される。したがって、所与の数の移動可能な分子識別バーコードの容器は、各産生回から検査される可能性が高いため、全ての産生回を合わせた検査される移動可能な分子識別バーコードの総数は、実施の際には60の数を超え、その結果、冗長性、ひいては産生された移動可能な分子識別バーコードのより良好な品質管理検査を更に増加させる。100万個の移動可能な分子識別バーコードのチューブ又は受取り器の産生のため100×100の移動可能な分子識別バーコードの合計100個のより少ないロットを産生する場合、各々のより小さいロットの40個の移動可能な分子識別バーコードを産生後に確認し、その後、4000個の移動可能な分子識別バーコードを、100万個の移動可能な分子識別バーコードの全ロットの産生後に確認する。それでもこれは、100万個の移動可能な分子識別バーコードのそのロットの産生プロセスの非常に完全で冗長な品質管理プロセスを得るための、産生後にだけ確認され、犠牲にされる全ロットの全ての移動可能な分子識別バーコードのごく一部である。
この例では、したがって、60個のヌクレオチドバーコードのセットは、6個のヌクレオチドバーコードで各々構築される100万の移動可能な分子識別バーコードの生成を可能とする。これはまた、100個の移動可能な分子識別バーコードに60個のヌクレオチドバーコードの各々が見られるということを意味する。これはまた、5つの所与のヌクレオチドバーコードの任意の組み合わせが100個の移動可能な分子識別バーコードに見られるが、後者の100個の移動可能な分子識別バーコードの各々は6番目のヌクレオチドバーコードについて異なることを意味する。移動可能な分子識別バーコードを特性決定する必要があり、そのために例えばPCR等の増幅を必要とする場合、移動可能な分子識別バーコード中の所与のヌクレオチドバーコードは増幅されない場合があるため、そのヌクレオチドバーコードに由来する対応する標的ヌクレオチド配列(アンプリコン)は見られず、この現象はアンプリコンドロップアウトとして知られている。上の例では、6番目のヌクレオチドバーコードが増幅及び/又は配列決定に失敗すると、5個のヌクレオチドバーコード配列のみが特性決定され得て、可能性のある100個の移動可能な分子識別バーコードのうちどれが存在するのかを特定することができない場合がある。この潜在的な課題は全てのヌクレオチドバーコードに当てはまり、すなわち、アンプリコンドロップアウトのため特定のヌクレオチドバーコードの検出に失敗する場合、どの移動可能な分子識別バーコードが実際に存在するのかを断定できない100個の可能性のある移動可能な分子識別バーコードが存在する。エラー補正ツールの使用等の上に記載される増幅及び/又は配列決定のエラーの寛容は、アンプリコンドロップアウトを補正することはできない。
移動可能な分子識別バーコードミックスを産生するために単一のヌクレオチドバーコードに代えてヌクレオチドバーコード対を用いて作業することにより、アンプリコンドロップアウトのために正確な移動可能な分子識別バーコードを特性決定及び識別に失敗することが回避され得て、システムをより冗長にする。1対のヌクレオチドバーコードの1つのヌクレオチドバーコードが増幅及び/又は配列決定に失敗する場合であっても、その所与の対の他方のヌクレオチドバーコードは特性決定され、識別され得る。所与の対のヌクレオチドバーコードのいずれか片方のヌクレオチドバーコード又はその所与の対のヌクレオチドバーコードの両方のヌクレオチドバーコードを見つけることは、どのヌクレオチドバーコード対が存在するかを明解に特定することを可能とする。各々が6対のヌクレオチドバーコード(合計12個のヌクレオチドバーコード)で構築される100万個の独自の試料バーコードの生成のため、100万個の異なる独自の移動可能な分子識別バーコードの全ロットを構築するには120個のヌクレオチドバーコードを必要とする(表5を参照されたい)。100万個の移動可能な分子識別バーコードの生成のための120個のヌクレオチドバーコード(すなわち、プラスミドプレップ)の使用及び作製は、60個のヌクレオチドバーコードを作製する必要がある場合に必要な労力と比べて、著しい追加の労力ではない。
表5.1つの移動可能な分子識別バーコード当たりの使用されるヌクレオチドバーコード対の数に応じて作製され得る、異なる移動可能な分子識別バーコードの数
Figure 0007071341000005
(a)10対のヌクレオチドバーコードセットが使用される;各ヌクレオチドバーコード対に対して、10個のヌクレオチドバーコード対の間で選択することができる。
ヌクレオチドバーコード配列の対を使用する更なる利点は、はるかに高い、更には完全な確実性で汚染を断定することが可能なことである。実際に、非常に低い汚染が存在し、それが見つかる場合、ヌクレオチドバーコード配列対の両方の最小ヌクレオチドバーコード配列を見つけることによって汚染の検出において互いを確認する。
試料の入れ替わりが高い割合の予想されていないヌクレオチドバーコード(及びより高い割合で存在するはずの予想されるヌクレオチドバーコードの消失)を生じ、汚染が、典型的には予想されるヌクレオチドバーコードよりもはるかに低い割合の予想されていないヌクレオチドバーコードを生じることから、高い割合で見つかるヌクレオチドバーコードを「ノンペアモード(non-pair mode)」で分析して、アンプリコンドロップアウトを検出することができる一方で、低い割合で見つかるヌクレオチドバーコードをペアモード(pair-mode)で分析し、汚染を断定するのにヌクレオチドバーコード対の両方の最小ヌクレオチドバーコード配列を検出する必要があるように情報パイプライン(informatic pipelines)をプログラム化し得る。
ヌクレオチドバーコード対を用いて作業する代わりに、システムを更に冗長でロバストにするため、3倍、4倍の組み合わせ又はそれ以上のヌクレオチドバーコード配列を使用してもよい。
Nxランダムライブラリからヌクレオチドバーコードプラスミドプレップを使用する場合、最小ヌクレオチドバーコード配列を識別するために、最初にヌクレオチドバーコードを配列決定する必要がある。個々のヌクレオチドバーコードの増幅及び配列決定の工程は、事実上既に、増幅及び/又は配列決定が困難な可能性があって、適用時に移動可能な分子識別バーコードを特性決定する場合にアンプリコンドロップアウトをもたらし得るヌクレオチドバーコードに対して、移動可能な分子識別バーコードの産生に適したヌクレオチドバーコードを得る最初の選択工程となる。
この選択基準に合格したヌクレオチドバーコードに対して、更なる選択基準を使用してもよい。例えば、選ばれて、高GC及び/又はAT含有量を有すると特性決定されるヌクレオチドバーコード配列が、移動可能な分子識別バーコードの更なる産生に含まれない可能性がある。実際に、かかる配列は増幅が困難であるか、又は増幅不可能であり、アンプリコンドロップアウトを生じ得る及び/又は配列決定に失敗する可能性があることが知られている。上に記載される第1の判定基準の間に所与のヌクレオチドバーコードが既に増幅及び/又は配列決定の管理工程に合格していたとしても、1つのみのヌクレオチドバーコードを高濃度で含む均質なDNAプレップ中に存在したことからそのようになったに過ぎない可能性があり、他のヌクレオチドバーコードと組み合わされる及び/又はより低濃度で使用される適用で実用上使用される場合にはもはやそうではない。適用のその後者の真の環境において、所与のヌクレオチドバーコードは、なおも増幅及び/又は配列決定に失敗する可能性がある。
移動可能な分子識別バーコードの産生に関する特定のヌクレオチドバーコード配列に対する他の選択基準は、同一のヌクレオチド、例えば、同一のヌクレオチドの行(6、7以上;或いは5、4、3又は2)の伸長を保有する配列であってもよい。実際に、ピロシーケンシング、及びイオン半導体シーケンシング等の移動可能な分子識別バーコード中のヌクレオチドバーコードの特性決定に使用され得る特定の高度並行配列決定技術は、同一のヌクレオチドの伸長中のヌクレオチドの正確な数を、必ずしも正確に決定することができるとは限らない。かかる配列は2種類以上の配列、すなわち、上に記載されるように補正され得る配列決定エラーを伴う配列を生成してもよいが、最多のヌクレオチドバーコードが選択され得るヌクレオチドバーコードのプールの生成のため幾つかの追加のヌクレオチドバーコードを選ぶことにより最小の労力でこれを行う場合には、移動可能な分子識別バーコードの産生のため、ロット中にかかるヌクレオチドバーコードを含まないことが好ましい場合がある。
任意の移動可能な分子識別バーコードは、防水性が保証された標識システムを得るため、各物品又は試料が独自に標識されるように、物品又は試料の標識に1回のみ使用される。その1000000個の移動可能な分子識別バーコードのチューブ又は受取り容器が一旦産生されれば、移動可能な分子識別バーコードの次のロットの産生には、120個の新たなヌクレオチドバーコードプラスミドプレップを選択し、作製するには最小の労力ですむ。
また、全ての移動可能な分子識別バーコードは、下流の処理において使用され、データベースに保存される、識別名及び識別コードを得る必要がある。このデータベースは、任意に中心部に配置され、クラウドベースでアクセス可能である。所与のロットが1000000個の移動可能な分子識別バーコードを含む場合、このデータベースは、100万個の異なる行を含み、したがって少し大きい。たいていは、ソフトウエアプログラム(アルゴリズム等)は下流の処理で使用される。実際のヌクレオチドバーコード配列又は移動可能な分子識別バーコードは、その時、これらのソフトウェアプログラムによって処理され、及び/又はこれらのデータベースに紐付けられる必要がある。この目的のため、例えば、各ロット番号に対して、120個のヌクレオチドバーコードの名称及び最小ヌクレオチドバーコード配列を列挙するファイル(txt.file、csv.file等)が作成され得る。所与のロットの1000000個の移動可能な分子識別バーコードは全て同じ固定された所定の順で産生されることから、任意の移動可能な分子識別バーコード中の12個のヌクレオチドバーコード配列は、そのファイル名に所与のロット番号を保有し、同じ所定の順でそのロット番号の移動可能な分子識別バーコードの産生に対して使用された120個のヌクレオチドバーコードの名称及び最小ヌクレオチドバーコード配列を列挙するこの小さなファイルを使用する、ソフトウェアアルゴリズムによって推測され得る。1000000個の移動可能な分子識別バーコードの各々に存在する実際の最小ヌクレオチドバーコード配列を推測することができるアルゴリズムと組み合わせて120行を有する、かかるより小さなデータベースは、各行が、100万個の移動可能な分子識別バーコードの各々の12個の分子ヌクレオチドバーコードを記載する100万の行の表を各ロットに対して作成し、使用するよりも実用的である。1つのロットに対して1つの表を使用することに代えて、全てのロット番号で用いられる全ての最小ヌクレオチドバーコード配列を列挙する単一の表(txt.file、csv.file等)を使用してもよい。その際、かかる単一の表は名称及び各最小ヌクレオチドバーコード配列を列挙する列の他に、最小ヌクレオチドバーコード配列の各々が使用される、各ロット番号を記載する3つ目の列を必要とする。定常隣接配列中のアダプター情報(例えば、ヌクレオチドバーコード配列識別子配列、抽出配列)等の追加の列が追加されてもよい。(表に余分な行及び余分な列を作成する)ロット番号の情報、あるいは(表に余分な列を作成する)追加の情報が単一の表に組み合わされる場合であっても、この単一の表は、それでも全ての移動可能な分子識別バーコード及びそれらの関連付けられた最小ヌクレオチドバーコード配列を列挙する表よりもはるかに小さい。
例えば、最も異なる最小ヌクレオチドバーコード配列、したがって最も無関係の配列を有する120個のヌクレオチドバーコードを選択する必要がある場合、選択するためにより大きな数のヌクレオチドバーコードを必要とする。選択することができる最小ヌクレオチドバーコード配列の数が大きいほど、より多くの完全で最適な無関係の配列を選択することができる。しかしながら、より多くの配列が、選択される最小のヌクレオチドバーコード配列のプールに添加される場合、選択において最も無関係な配列の獲得数(gain)は減少する。マンハッタン距離及びm-メドイド(m-medoid)クラスタリングに基づくシミュレーション分析は、各々が12個のヌクレオチドバーコードで構築される、所与のロットの100万個の移動可能な分子識別バーコードの産生のため可能な限り配列が異なる25ヌクレオチド長の120個の最小ヌクレオチドバーコード配列の選択に対して、実際には選択されるのに約400個のヌクレオチドバーコードが必要となると結論付けた。更に最小ヌクレオチドバーコード配列を選択するプールに添加することは、最適な無関係の配列を得ることにおいて何らの更なる改善ももたらさなかった。
120個のヌクレオチドバーコードではなく、400個のヌクレオチドバーコードの作製は、特に、余分な労力が、100万個の移動可能な分子識別バーコードの1つ目のロットの産生にのみ必要とされることから、約100万個の独自の移動可能な分子識別バーコードの作製に対して、なおも限定的な労力である。実際に、100万個の移動可能な分子識別バーコードが産生された場合、100万個の移動可能な分子識別バーコードの次のロットを産生する必要がある。1つ目の産生ロットの産生に使用された同じ120個のヌクレオチドバーコードが、100万個の試料バーコードの2つ目のロットに対して産生され得る。しかしながら、その場合、同一の移動可能な分子識別バーコードが異なるロットを越えて産生され、2回以上使用されることから好ましくない。同じヌクレオチドバーコードが2つ目のロットの産生に対して産生され得るとしても、先のロットにおける産生に使用されるそれらのプレップは、使い尽くされている可能性が非常に高いため、いずれにしても新たなプラスミドプレップを作製する必要がある。新たなロットの移動可能な分子識別バーコードの産生には、120個の新たなヌクレオチドバーコードが好ましい。したがって、細菌グリセロールストックのプレートコロニー及びコロニー採取を行う追加の労力は最小である。さらに、新たなヌクレオチドバーコードを有する新たなロットの移動可能な分子識別バーコードの産生のため、400個の新たなヌクレオチドバーコードは必要ではない。先のロットのヌクレオチドバーコードの産生に対して選択されなかった280個のヌクレオチドバーコードプラスミドに添加される、120個の新たなヌクレオチドバーコードだけが必要となる。これらの280個+120個のヌクレオチドバーコードから、再度120個の最も無関係のヌクレオチドバーコードを新たなロットの移動可能な分子識別バーコードの産生に対して選択等する。
他の標的核酸と組み合わせてもよい移動可能な分子識別バーコードの並行配列決定処理法は、絶対的な品質管理を得るために条件付きである。これは、1種類の配列のみを配列決定するサンガーシーケンシングとは対照的である。各ヌクレオチドバーコード、及び可能な場合は1以上の遺伝子の1以上のエクソン等の他の標的核酸(複数の場合もある)(の各々)のサンガーシーケンシングは、別々の配列決定反応を必要とする。異なる単独のサンガーシーケンシングの分割は、特に、多くの移動可能な分子識別バーコード及び/又は試料が同時に処理される場合に正しく行われるという保証はない。実際に、最終的には、異なる分割されたサンガーシーケンシング処理、又はその得られた特性決定データを再度組み合わせる必要がある。各サンガーシーケンシング反応もまた、PCR等の配列決定テンプレートの濃縮を必要とし、分割されたプロセスの開始は、全部のプロセスで実際の配列決定よりもはるかに早い時点で既に開始していることから、入れ替わり及び汚染のエラーが起こり得る各分割されたプロセスにおいて更に多くの工程が含まれる。プロセスの分割が正しく行われない場合には、誤って再度組み合わされたプロセス及び/又は結果が得られることになる。
100万個の異なる移動可能な分子識別バーコードが60個の異なるヌクレオチドバーコードから構築される本発明者らの例では、全てのヌクレオチドバーコード配列が、そのロットの100個の移動可能な分子識別バーコードに見つかる。これらの移動可能な分子識別バーコードの特性決定に非並行配列決定法が使用される場合、分割されたプロセス間での入れ替わりは、最終的には、異なる分割された配列決定反応の結果を合わせた後にヌクレオチドバーコード配列の有効な組み合わせ、したがって正確ではない移動可能な分子識別バーコードを除く、有効な移動可能な分子識別バーコードをもたらすことができる。
他方で、本明細書に記載され、並行配列決定処理法で使用される移動可能な分子識別バーコードは、それでも全体のプロセスの中の特定のプロセスを分割して、なおも絶対的な品質管理を得ることを可能とする。しかしながら、分割プロセスは、順に(同じ)並列処理の特徴(例えば、マルチプレックスフォーマット)を有し、1つの共通する特徴(最小バーコード配列)を有する必要がある。例えば、IonAmpliSeq(商標)エキソームアッセイ(ThermoFisher Scientific)は、12個のプライマープールにわたって約300000のプライマー対を使用する。幾つかのGeneRead DNAseq標的化アッセイ(Qiagen)は、4つのプライマープールにわたって2000を超えるプライマー対を使用する。これらの分割されたプールの各々は、なおも複雑なマルチプレックス増幅であり、したがってなおも並列の特徴を有する。これらのプールの各々に対してヌクレオチドバーコードの濃縮のため2つのプライマーが添加される場合、また6個のヌクレオチドバーコードで構築される移動可能な分子識別バーコードが元の生体試料に存在した場合、検査結果は、最終的に全ての予想される6個のヌクレオチドバーコード配列が見つかった場合にのみ有効である。アッセイに対する所与のセットの多重反応における1以上の多重反応が、処理される異なる生体試料間で入れ替わると、6個より多い予想されるヌクレオチドバーコード配列が見つかるため、その検査は有効ではないと印をつけることができる。4つのマルチプレックス増幅のプールを使用するアッセイでは、1つのマルチプレックスが、それらの移動可能な分子識別バーコード中にいかなるヌクレオチドバーコードも共有しない異なる生体試料間で入れ替わった場合、予想される6個のヌクレオチドバーコードは、得られたヌクレオチドバーコード配列全体の約75%となるのに対し、最大6個の追加のヌクレオチドバーコードは、得られたヌクレオチドバーコード配列全体の約25%となる。(配列決定前の)増幅濃縮工程の後、予想される最大6個のヌクレオチドバーコード配列は、その入れ替わったプールには見られないが、最大6個の予想されないヌクレオチドバーコード配列が入れ替わったプールにおいて100%となる。配列決定の前に4つ全てのプールが等しく混合され、3つの入れ替わっていないプールにおいて予想される6個のヌクレオチドバーコードがそれぞれ100%の分率で存在することから、全体で最大6個の予想されていないヌクレオチドバーコードは最終的に約25%となる。かかる単一プールの入れ替わりを、1つの試料の別の試料による約25%のDNA汚染等の全試料のより全体的な汚染と区別することはできない。その場合、4つ全ての増幅濃縮プールにおいて、最大6個の予想されないヌクレオチドバーコードが約25%となり、したがって、4つ全ての増幅濃縮プールが配列決定の前に合わされる場合も約25%となる。NGSアッセイが2つのプールのみを使用する場合、それらの移動可能な分子識別バーコード中にいかなるヌクレオチドバーコード、すなわち予想される及び予想されないヌクレオチドバーコードのいずれも共有しない、2つの生体試料間の単一のプールの入れ替わりは、全てのヌクレオチドバーコード配列読取りの約50%となる。所与の全体的なアッセイにおいてより多くのプールが使用されると、汚染検出は、おそらくは、分子ヌクレオチドバーコードが、汚染検出に関してもはや絶対的な品質管理を保証しない程度まで感受性でなくなる。これは、比例的なより高い濃縮、したがって、他の核酸標的配列に対するヌクレオチドバーコードの相対的により深い配列決定によって克服され得る。
また、これは、標的濃縮に異なるプールを使用するアッセイに対して、ヌクレオチドバーコードの濃縮のため同じではない2つのプライマーをプールの各々に添加する場合に克服され得る。実際の最小ヌクレオチドバーコード配列は、定常配列によって挟まれる。マルチプレックス増幅アッセイでは、所与のプールに添加される、隣接定常配列中の異なる結合部位に対してプライマーの片方又は両方を標的化することによって、各プールに由来するヌクレオチドバーコード配列の各々が、その所与の特徴的な所与の異なる長さの隣接配列及び/又は配列構成を有する(図6)。4つのプライマー濃縮プールを使用するNGS検査の終わりに、所与の6個のヌクレオチドバーコード配列が見つかり、全ての予想される4種類の隣接配列がこれらのヌクレオチドバーコード配列の全てに見つかる場合、予想される6個のヌクレオチドバーコードが4つの分割されたプールの各々に確かに存在したと断定することができるため、異なる試料間での単一のプールの入れ替わりも排除され得る。所与のプールで使用される2つのプライマーのうち1つが、異なるプール間で共有されることさえあり得る。他のプールと区別され得る所与のプールで濃縮される組み合わされた隣接配列の程度を特定するのは、プライマーの所与の組み合わせである。
このフォーマットは、標的の濃縮にプライマープールを使用するNGSアッセイにおいてより感度の高い汚染検出を可能とするのみならず、全DNA試料中の全体的な汚染と、異なる試料間だけの分割された検査プロセスにおける1以上のプールの入れ替わりとを区別することを可能とする。
移動可能な分子識別バーコードは、医学的及び法医学的な適用において試料収集に使用されるキットの収集基体等の固形基体又は容器に添加され得る。より良好には、移動可能な分子識別バーコードは、かかる回収容器において既に産生されている。移動可能な分子識別バーコードは、核酸配列を受け取るのに適したキットの構成要素に直接添加され得る。この構成要素は、一般的には、分析されている未知のDNA試料も受け取る構成要素と同じであるか、又はそれに類似する。移動可能な分子識別バーコードは、水溶液、粉体、ゲル、樹脂、ラミネート、スプレー、若しくはカプセル、ゼオライトに捕捉された形態で、又は任意の他の好適な形態で適用され得る。当然ながら、水溶液として適用されない場合には、ヌクレオチドバーコードは、所与の時点で可溶性ではない。しかしながら、ヌクレオチドバーコードは、処理の間に再び可溶性で移動可能となる。また、移動可能な分子識別バーコードは、収集容器の壁に被覆され若しくはスポット(spotted)されてもよく、又は綿球若しくはキットの他の構成要素にしみ込ませてもよい。例えば、移動可能な分子識別バーコードは、血液収集に使用されるVacutainer(商標)(Becton Dickinson)等の容器、マイクロチューブ、マイクロタイタープレートのウェルに添加されてもよい。また、移動可能な分子識別バーコードは、Whatman PLCによって製造されるFTA(商標)クラッシックカード等のカード上にスポットされてもよい。この種のキットは、製造中に、又は後に試料収集に使用される際のいずれかに移動可能な分子識別バーコードが添加され得る、FTA(商標)紙を備える。同様に、ガスリーカード(Guthrie card)上にスポットされてもよい。この段落で言及される基体及び容器は「担体(複数の場合もある)」と称される。
移動可能な分子識別バーコードは、安定化剤(複数の場合もある)、防腐剤(複数の場合もある)、洗浄剤(複数の場合もある)、中和剤(複数の場合もある)、阻害剤(複数の場合もある)、還元剤(複数の場合もある)、失活剤(複数の場合もある)又はそれらの組み合わせを含む溶液(複数の場合もある)等の薬剤又は試料の作製、保管、若しくは処理に使用されるプロセスと組み合わされ得る。これらの成分は、その核酸等の生体試料との直接(一次)相互作用によって、又はこの一次相互作用の結果である二次生成物、或いは二次若しくは三次の相互作用のため生成された成分(複数の場合もある)等のより下流の相互作用に影響を及ぼし得る。
例えば、かかる化合物は、全血細胞の凝固を予防し、白血球細胞集団からのDNA放出を減少すると考えられている、ヘパリン、エチレンジアミン四酢酸(EDTA)、クエン酸塩、シュウ酸塩、ヘパリン及びそれらの任意の組み合わせからなる群から選択される抗凝血剤であってもよい。
例えば、かかる化合物は、ピロ炭酸ジエチル、エタノール、オーリントリカルボン酸(ATA)、ホルムアミド、バナジル-リボヌクレオシド複合体、マカロイド(macaloid)、2-アミノ-2-ヒドロキシメチル-プロパン-1,3-ジオール(TRIS)、エチレンジアミン四酢酸(EDTA)、プロテイナーゼK、ヘパリン、ヒドロキシルアミン-酸素-第二銅イオン、ベントナイト、硫酸アンモニウム、ジチオスレイトール(DTT)、ベータ-メルカプトエタノール、システイン、ジチオエリスリトール、トリス(2-カルボキシエチル)ホスフェン塩酸塩、Mg+2、Mn+2、Zn+2、Fe+2、Ca+2、Cu+2等の二価陽イオン、及びそれらの任意の組み合わせからなる群から選択されるヌクレアーゼ阻害剤であってもよい。
例えば、かかる化合物は、ホルムアルデヒド放出(formaldehyde releaser)防腐剤であってもよく、ジアゾリジニル尿素、イミダゾリジニル尿素、ジメチロール(dimethylol)-5,5-ジメチルヒダントイン、ジメチロール尿素、2-ブロモ-2.-ニトロプロパン-1,3-ジオール、オキサゾリジン、ヒドロキシメチルグリシン酸ナトリウム、5-ヒドロキシメトキシメチル-1-1アザ-3,7-ジオキサビシクロ[3.3.0]オクタン、5-ヒドロキシメチル-1-1アザ-3,7-ジオキサビシクロ[3.3.0]オクタン、5-ヒドロキシポリ[メチレンオキシ]メチル-1-1アザ-3,7-ジオキサビシクロ[3.3.0]オクタン、第四級アダマンタン、及びそれらの任意の組み合わせからなる群から選択されるもの等が使用され得る(米国特許第5459073号)。ホルムアルデヒドは、細胞膜を安定化させるためにしばしば使用され、その使用は、したがって、細胞溶解を減少し得る。また、ホルムアルデヒドは、DNase及びRNaseを阻害し、それによって無細胞核酸の保存及び安定性を増加させると考えられている。
例えば、失活化合物は、ホルムアルデヒドの電子不足の官能基と反応することができる少なくとも1つの官能基を含む化合物(例えば、ホルムアルデヒドと反応してメチロール及び/又はイミンシッフ塩基を形成するアミン化合物、又はホルムアルデヒドと反応して環状アセタールを形成するシス-ジオール化合物)であってもよい。かかる失活化合物は、アミノ酸、アルキルアミン、ポリアミン、第一級アミン、第二級アミン、アンモニウム塩又はそれらの組み合わせから選択される原料であってもよい。より具体的には、グリシン、リジン、エチレンジアミン、アルギニン、尿素、アデニン(adenine)、グアニン、シトシン、チミン、スペルミジン又はそれらの任意の組み合わせから選択される。かかる失活化合物は、任意の遊離ホルムアルデヒドの除去に有用である。
移動可能な分子識別バーコードは、防腐剤、抗凝血剤及び失活化合物の組み合わせに添加され得る。
ここでも、移動可能な分子識別バーコードは、安定化溶液を含む収集溶液で既に産生されていてもよい。例えば、移動可能な分子識別バーコードは、試料の有核血球を安定化させ、循環胎児DNA又は腫瘍DNAを分析する検査で使用される、血液試料の収集に使用されるCell-Free DNA BCT(商標)血液収集チューブ(Streck又はCFGenome)、PAXgene Blood ccfDNAチューブ(PreAnalytiX)、RNAが安定化されるPAXgene Blood RNA収集チューブ(PreAnalytiX)、唾液のDNAが安定化されるOragene-DNA唾液収集システム(DNA Genotek Inc.)等において産生され得る。
移動可能な分子識別バーコードと共に、試料の入れ替わり及び/又は汚染の検出以外の品質の目的で他の分子が存在し得る。また、移動可能な分子識別バーコードを含む担体は、例えば、NIPT検査でのトリソミーに対する検査用のトリソミー対照(例えばCFGenome製Trizo21)、例えば、RNA検査で使用されるSpike-in RNA Variant(SIRV)対照(Lexogen)を含み得る。
移動可能な分子識別バーコードを含む容器又は受取り器は、実際の移動可能な分子識別バーコードに対して、したがってそのヌクレオチドバーコード配列に対しても1対1で紐付けられるコードと共に付着された独自の光学的で巨視的な1D又は2Dのバーコード紙面ラベルを優先的に有する。実用上の理由で、例えば12個の25ヌクレオチド長の配列の実際の配列を、より小さな紙面ラベルに印刷することができない。この実用上の理由とは別に、公平なプロセスで移動可能な分子識別バーコードが使用されるように、プロセスの少なくとも特定の段階の間に試料を処理している人はこの情報を知らないことを目的とし得る。かかるフォーマットは、試料及びそのプロセスの操作に十分な余地を残す。プロセスの最後にのみ、ヌクレオチドバーコードの実際の配列が解釈のため、すなわちそのプロセスの確認に必要とされる。
付着された光学的で巨視的なバーコードラベルは、異なるフォーマットを有してもよい。ラベルは、例えば、ミシン目を入れられてもよく、除去可能であってもよく、1つの部分が除去可能な2つの(部分的に)同一の部分に印刷されてもよい。除去可能なラベルであれば、試料が収集される時に患者の試料の容器又は受取り器に入れられてもよく、試料容器が使用される場合、移動可能な分子識別バーコードはまだ含まれていない。
移動可能な分子識別バーコードの実際の配列の情報を産生サイトから適用(顧客)サイトに輸送する種々のプロトコルが考えられ得る。可能性のある方法は、顧客がどこかの時点で、おそらくは移動可能な分子識別バーコードを産生する実体に位置する、クラウドを通じてサーバーに接触しなければならない。優先的には、移動可能な分子識別バーコード、したがって、関連付けられたヌクレオチドバーコード配列は、例えば、OWASP(The Open Web Application SecurityProject)の推奨に従って、クラウド中において、データ転送の間、保証される。また、おそらくは、それらは医療情報を保護するデータ機密性及びセキュリティの条件を提供するHIPAA(医療保険の携行性と責任に関する法律)の法令に従うべきである。しかしながら、移動可能な分子識別バーコードサーバーがいかなる患者の情報又はローカルの顧客(例えば病院)のコード若しくは情報も必要としないことから、上に記載される移動可能な分子識別バーコードシステムの特性を考慮すると、患者のプライバシー情報は既に保証されていることに注目すべきである。例えば、顧客サイトで得られるヌクレオチドバーコード配列と並んで顧客が受け取る紙面の識別バーコードのみが、中央のヌクレオチドバーコードデータベースにおける検証のため顧客サイトから移動可能な分子識別バーコードの産生及び/又は管理サイト若しくは会社に輸送され、その後、移動可能な分子識別バーコードの産生及び/又は管理サイトは、紙面コードと得られたヌクレオチド配列の読取りとの間に一致があるか否の情報を顧客へと送り返す。或いは、得られた紙面の識別コードが顧客によって移動可能な分子識別バーコードの産生及び/又は管理サイト若しくは会社に送られ、その後、産生サイトが、例えば、その紙面識別コードと関連付けられた実際の最小ヌクレオチドバーコード配列を顧客に送り、顧客サイトで一致するか否かの判定を行う。したがって、患者情報、顧客サイトでの患者のコード及び移動可能な分子識別バーコードとの関連は、もっぱら病院等の顧客サイトに留まる。
クラウドサーバーからかかる情報を得ることは、自由であってもよく、又は制限されてもよい。チューブ上の光学的で巨視的なバーコードラベルは、正確な移動可能な分子識別バーコード配列を提供するため、サーバーに対して十分な情報を提供する。このコードは、かかるクラウドサーバーに対するアクセスを得るために既に十分であり得る。しかしながら、移動可能な分子識別バーコードの実際の配列の取得に対する更なるセキュリティレベルが実施されるように、アクセスを得るための追加のコード、すなわち再び全ての移動可能な分子識別バーコードに対して独自のコードが顧客に与えられ、必要とされてもよい。実際に、全てのロットの移動可能な分子識別バーコードが、各ロットに対して同じ固定された所定のプロトコルで産生され、コードされる、限られた数のヌクレオチドバーコード配列で構築されることから、或るロットに由来する所与の数の移動可能な分子識別バーコード及び関連付けられたコード名が使用され、したがって、所与の顧客に対して知られた場合、その所与のロットの任意の移動可能な分子識別バーコードの配列を特定することが可能となり得る。かかる追加のコードにより、顧客の請求は、所与の巨視的バーコードラベル及び移動可能な分子識別バーコード(組み合わせ)の保持者及び所有者による請求通りに、確かに識別され得る。
1つずつ一覧にある請求に応じて移動可能な分子識別バーコードのヌクレオチドバーコードの配列情報を得るのではなく、別の選択肢は、移動可能な分子識別バーコードの元となる、その所与のロットの産生に使用されたヌクレオチドバーコードの全ての異なる配列及びそれらの関連付けられた名称をクラウドサーバーから得ることであってもよい。実際に、各移動可能な分子識別バーコードを含む容器の命名を含む、各ロットの移動可能な分子識別バーコードが固定された順序で固定された所定のプロトコルで少数の個々のヌクレオチドバーコード分子から構築されるという事実を考慮すると、おそらくはソフトウェアパッケージにおいて又はその部分のこの所定のプロトコルにカスタマイズされたアルゴリズムもまた、ユーザーに提供され得る。次いで、このアルゴリズムは、所与のロットに対するヌクレオチドバーコードの配列及びそれらの紐付けられた名称を含むファイル(例えば、csv又はtxtのファイル)と組み合わせて、所与の移動可能な分子識別バーコードのヌクレオチドバーコードの実際の配列を得るため、顧客によって使用され得る。しかしながら、そうすると顧客は、その同じロットの全ての移動可能な分子識別バーコードのヌクレオチドバーコードの配列を推測することも可能となり得る。当然ながら、その試料に使用されなかった追加のヌクレオチドバーコード又は移動可能な分子識別バーコードの配列を提供することは、当業者が、その移動可能な分子識別バーコードの容器に付着されている光学的で巨視的なバーコードラベルに基づいて、移動可能な分子識別バーコードを含む所与の容器に存在する配列を容易に推測することができるため、そうなると、より安全性の低いフォーマットプラットフォームを提供する。
したがって、単一の移動可能な分子識別バーコードの情報のみが得られる、所与の移動可能な分子識別バーコードのロットの幾つか若しくは全ての移動可能な分子識別バーコードの情報が得られる、或いは移動可能な分子識別バーコードの全てのロットの全ての移動可能な分子識別バーコードの情報が得られる、顧客によって使用される独立型のツール、又はクラウドサーバーツールの一部のいずれかとして、移動可能な分子識別バーコードの使用に対して異なるソフトウェアツールが開発され得る。所与の試料において実際には使用されていない移動可能な分子識別バーコードの情報を持つことは、確かに、特定の適用では目的となり得る。かかる適用の例は、汚染の検出である。12個のバーコード配列で構築される移動可能な分子識別バーコードのコードが使用される場合、追加のバーコード配列の識別は、ソフトウェアツールによる汚染の検出及びレポートを可能とし得る。試料が、例えば、12個のヌクレオチドバーコード配列のいずれも共有しない別の試料によって汚染される場合、また汚染が概ね50%である場合、移動可能な分子識別バーコードの各々に属する追加のバーコードが特定され得る。例えば、他のヌクレオチドバーコードと比較して、約1%の頻度で追加のバーコードが見つかる場合、これらは、汚染している移動可能な分子識別バーコードに属する可能性が非常に高い。したがって、ヌクレオチドバーコードが観察される割合は、汚染の程度に関する追加の情報を提供する。実施の際、2つの異なる移動可能な分子識別バーコードは、幾つかのヌクレオチドバーコードを共有し得る。実際に、2つの異なる移動可能な分子識別バーコードは独自であり、それらが全てではなく1つの最小バーコード配列を共有する場合に異なる。そのとき、汚染は共有されていない最小バーコード配列によってのみ検出される。したがって、顧客は、かかる汚染が将来起こらないように、顧客の試料の処理及びアッセイを改善するため、汚染源について関心を持っている可能性がある。別のソフトウェアツールは、配列が異なるロットの一部として観察される場合であっても、汚染された配列に関する情報を提供し得る。そうすると(then)、この目的のため顧客は、その各試料に対して使用されない又はおそらくその顧客のどの試料にも使用されない移動可能な分子識別バーコードの配列を得ることができなければならず、したがって、外部の汚濁源が含まれる。
物品又は生体試料の容器が試料の外部にラベルでのみ、例えば法医学分析の目的に対する血液収集チューブ、又はドーピング分析の目的に対する尿収集容器に収集容器の外壁に対して紙面ラベルで標識される場合、ラベルの除去、或いは別のラベルとの置き換え等、ラベルを容易に操作することができる。これは試料を提供する人々の側の、エラー又は悪意のある意図で試料が誤って扱われることに結び付く可能性があり、したがって不正行為又は犯罪行為にそれらを関係付けるという懸念をもたらした。法医学分析用の生体試料中のDNAがドナーの個別の身元証明としての役割を果たすとしても、その試料がどのようにいつ得られたのかは何もわからない。かかる「内部」標識は、後のラベルの操作がより一層困難であり、或いはもはや不可能である、法医学検査、親子鑑定、ドーピング検査等において非常に価値がある。「内部」ラベルは、実際のドーピング検査が「内部」ラベルを検出し得る検査とは異なり、疑義がある場合にのみ「内部ラベル」を特定するドーピングテスト等の検査それ自体の時に特定される必要もない。試料検査の結果が疑問視される場合、裁判前のように、実際の検査が行われた時よりもはるかに後であったとしても、試料が得られ輸送された方法及び/又は時に関して、「内部ラベル」のアイデンティティを検査し直してもよい。
任意の2つの異なる分子の識別バーコードは、更には同じ時点に添加されてもよく、更なるセキュリティ対策を提供することさえある。例えば、試料を単離した団体を表す、受取り器に存在する分子識別バーコード、及び受取り器において生体試料を提供した人を表す追加の分子識別バーコードが使用される。これは、分子識別バーコードがドーピング検査に使用される試料に添加される場合、高い関心がもたれる可能性があり、ここでは、スポーツ選手も、試料を提供する際に、単離された生体試料に添加する分子識別バーコード(例えばチューブ中の溶液として)を所有する。この方法では、移動可能な分子識別バーコードは、(分子)署名手段として使用され、ここでは、スポーツ選手は、採取された生体試料に署名、したがって分子識別バーコードの形態の署名である承認を記す。
異なる種類の情報、又は異なる種類の情報の組み合わせを、移動可能な分子識別バーコード、例えば、個体、患者、医師、顧客、病院、提供者の情報;電話番号、電子メールアドレス、空間情報(移動可能な分子識別バーコードが物品に添加された場所)、時間(移動可能な分子識別バーコードが物品に添加された時間)、試料の種類(血液、唾液、尿、便)、指示された検査、検査の識別に対して割り当てることができる。
また、移動可能な分子識別バーコードは、DNA又はRNAに基づく検査に対するバイオインフォマティクス処理パイプライン等の標的核酸の分析に使用される処理パイプラインに対して割り当てられ得て、自動(バイオインフォマティクス)プロトコルのきっかけを作ることさえある。全ゲノムのバイオインフォマティクス分析は、高容量ハードウェアを用いても、1つの試料当たり何時間ものCPU時間を要し、したがって非常に手間がかかる。より小さなより迅速な配列決定システムの開発により、全ゲノムではなく、単一の遺伝子又は遺伝子セット等の標的部位のみを分析する多くの適用が存在する。より小さな標的領域のバイオインフォマティクス分析は、より負担が少ない。しかしながら、典型的な真核生物のゲノムには、少なくとも20000個の異なる遺伝子がある。したがって、どの遺伝子に対して得られた配列決定の読取りが分析されなければならないのかを特定する必要がある。移動可能な分子識別バーコードがこれらの遺伝子の各々に割り当てられる場合、バイオインフォマティクスパイプラインは、そのシステムが、そのとき分析される必要がある遺伝子又は遺伝子セット等の標的DNAの情報も読み取ることから、より一層自動化されたものとなる。本質的には、DNAの移動可能な分子識別バーコードは、そのとき配列決定のハードウェア及びソフトウェアの他に必要とされるDNAwareと称することができるものとなる。特に、NGSシーケンサーは、配列決定を行うため、より最小化され、最終的にはノート型パソコン又はスマートフォンに搭載される必要がある小さなハードウェアとなる場合、DNAware等の任意の追加の層は、配列決定アッセイをより自動化され、アクセス可能なものとする。
異なる移動可能な分子識別バーコードは異なる機能を有し得て、単一のアッセイにおいて使用され得ることから組み合わせられ得る。例えば、試料の入れ替わり及び汚染を検出するため試料を標識する移動可能な分子識別バーコードと、どのバイオインフォマティクスパイプラインをアッセイにおいて使用するかの情報を提供する別の種類の移動可能な分子識別バーコードとを組み合わせてもよい。
1つの最小バーコード配列に代えて2以上の最小バーコード配列を含む移動可能な分子識別バーコードの構築にヌクレオチドバーコード分子を使用した場合、移動可能な分子識別バーコードが構築される配列を得るより確実な形態を得ることができる。これら2つの最小バーコード配列は、同じ長さであってもよく、異なる長さであってもよい。2つの独自の配列を有するかかるヌクレオチドバーコードは、互いに近接してもよく、リンカーによって分離されてもよく、又は重複してもよい。1つの最小ヌクレオチドバーコード配列を有するヌクレオチドバーコードは大部分が、定常のアダプター及び配列によって両方の部位で挟まれる。これらのアダプターは、最終的には、ヌクレオチドバーコードの増幅及び/又は配列決定に必要とされる。したがって、全ての異なるヌクレオチドバーコードは、同じアダプターを保有する。そうすると、これらのアダプターを有する任意のヌクレオチドバーコードの実際の最小バーコード配列は、当業者によって容易に特定され得る。これは、ヌクレオチドバーコード中の2つの独自のバーコード配列を使用することによって回避され得る。1つのバーコード配列は、第2のバーコード配列を特性決定し識別するための増幅及び/又は配列決定プライマーに対する結合部位として使用され得る。所与の移動可能な分子識別バーコードの作製に対して、異なるヌクレオチドバーコードは同一の第1のバーコード配列を保有するが、第2のバーコードは定常ではなく、1つのみのバーコードを保有するヌクレオチドバーコードについて上に記載される最小バーコード配列と等価である。そこで、(第2の)最小バーコード配列の特性決定に必要なプライマーを知るため、ユーザーは、増幅及び/又は配列決定のためのプライマー結合部位として使用される第1のバーコード配列の正確な配列を知る必要がある。これは、第1のバーコード配列の配列がわかっている場合にのみ特定され得る。第1のバーコード配列(この場合、プライマー配列)の情報は、そのとき、特定の人及び/又は適用に限定され、保証され得る。2つの最小バーコード配列を含むかかるコンストラクトがプラスミド中に構築される場合、それでも当業者は、プラスミドのベクター骨格中等の第1のバーコード配列領域にも隣接する増幅及び/又は配列決定のためのプライマーを構築することによって実際の第1のバーコード配列を解明し得る。所与の確実な第1のバーコード配列及び異なる可能性のある第2のバーコード配列を有する、かかるヌクレオチドバーコードが、第1と第2の両方のバーコード領域にランダム配列を有するプラスミドの混合物内に隠される場合、特に、これらのコンストラクトが、ランダムな第1の配列を含む異なるプラスミドの各々の濃度で存在すれば、第1のバーコードは、当業者であったとしてもほぼ解明が不可能である。
2つの独自の最小バーコード配列を含むヌクレオチドバーコード配列を使用する別の適用は、第1の所与の独自配列を所与の適用に使用するのに対し、別の所与の第1の配列を別の適用に使用する適用となり得る。
移動可能な分子識別バーコードは、産生され、提供されて、これらの異なるレベルの適用、アクセス可能性、及び/又はセキュリティのいずれか1つを有する適用において使用され得る。実際に、異なるロットが産生される場合、異なる適用、アクセス可能性、及び/又はセキュリティのレベルが所与のロットに対して割り当てられ得る。
物品、試料及び/又はプロセスは、移動可能な分子識別バーコードが添加される時点から完全に品質保証される。移動可能な分子識別バーコードがプロセスに添加されるのが早いほど、そのプロセスがより早期に、ひいてはより完全に品質保証される。別の移動可能な分子識別バーコード、又は移動可能な分子識別バーコードのミックスがプロセスの終わりに見つかる場合、試料の入れ替わり及び/又は汚染が、全プロセスのどこかで断定される。しかしながら、試料の入れ替わり及び/又は汚染が起こったプロセスの正確な場所はわからない。再度移動可能な分子識別バーコードによって、異なる時点で処理された物品又は試料をスパイキングすることによって、試料の入れ替わり及び/又は汚染が起こったプロセスにおける正確な場所の探索を絞ることが可能な場合がある。したがって、全プロセスの2以上の時点において物品/試料、及びその処理に移動可能な分子識別バーコードを添加する。例えば、移動可能な分子識別バーコードを開始時に物品又は試料に添加し、別の移動可能な分子識別バーコードをそのプロセスの中間でその処理された物品又は試料に添加し、正しい第2の移動可能な分子識別バーコードがプロセスの終わりに見つかるが、第1の移動可能な分子識別バーコードが見つからない場合、プロセスの第2段階で入れ替わりは起こらなかったと断定することができる。典型的な遺伝子検査は、幾つかのサブプロセスで構築され、一般的には各々が異なる工程で構築される。第1のプロセスでは、DNAを血液等の生体試料から抽出し、第2段階では標的領域を濃縮し配列決定することによってDNAの突然変異の探索を行う。DNAの抽出及び配列決定は、しばしば、検査室の異なる場所、或いは同じ施設/会社の異なる検査室、或いは異なる施設/会社の異なる検査室で行われる。異なる検査室の各々において、異なる人が関与し、責任を負う。移動可能な分子識別バーコードを、(処理された)試料が異なる検査室に到着した際等に、プロセスの異なる工程で添加することは、所与のサブプロセス及び検査室に対して、試料の入れ替わり又は汚染の追跡を可能とする。この方法では、どこでエラーが起こり、どの検査室が責任を負い、例えば新たな検査の実施を担当するのかについて議論はない。これは、多くの検査室が配列決定を外注するNGSシーケンスのコア施設/会社にとって非常に価値のあるものとなる。
移動可能な分子識別バーコードが6対のヌクレオチドバーコードで構築される場合、12個のヌクレオチドバーコードの各々は、約8.3%(汚染が存在しない場合)の割合を有する。2個の移動可能な分子識別バーコードがいかなるヌクレオチドバーコード配列も共有しない所与のプロセスに添加される場合、24個のヌクレオチドバーコードの各々はわずか約4.15%の割合で見られる。より多くの移動可能な分子識別バーコードが所与のプロセスに添加される場合、各ヌクレオチドバーコードの割合は更に小さくなる。プロセスの終わりに見られる各ヌクレオチドバーコードの割合が小さいほど、汚染検出の感度も小さくなる。全プロセスのそれぞれ異なった工程で添加される、異なるバッチ産生に由来する移動可能な分子識別バーコードの使用はこの課題を克服し得て、ここで、移動可能な分子識別バーコードは、1つのバッチ当たりの異なるヌクレオチドバーコード配列識別子配列の存在のように、片方又は両方の定常隣接配列が部分的に又は完全にバッチ間で異なる。その場合、プロセスの所与の時点で添加される各移動可能な分子識別バーコードに関して、各ヌクレオチドバーコードの割合は、プロセスの終わりで8.3%のままであろう。
異なる定常隣接配列を有する異なる移動可能な分子識別バーコードが所与のプロセスの異なる工程で使用されるのではなく、異なる定常隣接配列を有するかかる異なる移動可能な分子識別バーコードが同じ時点で試料に添加されてもよい。例えば、採取される血液試料が、異なる定常隣接配列を有する異なる移動可能な分子識別バーコードを使用する異なる検査において使用されてもよい。これらの検査の各々は、所与の定常隣接配列を有する所与の移動可能な分子識別バーコードを使用してもよい。その場合、異なる定常隣接配列を有する移動可能な分子識別バーコードの混合物が使用される。例えば、次世代シーケンシングの検査室は、検出したい汚染のレベルについて、異なる視野、ワークフロー、及びプロトコルを有する可能性がある。例えば、この情報は、血液試料が医師によって採取される時点ではわからない場合がある。例えば、試料のDNAが抽出され、品質がわかるまで、この情報は、わからない場合がある。その場合、所与の定常隣接配列を有し、多量のヌクレオチドバーコードにより非常に高感度な汚染検出を可能とする移動可能な分子識別バーコード、及び他の所与の定常隣接配列を有し、少量のヌクレオチドバーコードを使用して、より感度の低い汚染検出を可能とする移動可能な分子識別バーコードが生体試料に添加される。別の例は、DNA及びRNAの分析に血液試料が使用されるものであってもよい。その場合、DNA型の移動可能な分子識別バーコードとRNA型の移動可能な分子識別バーコードの混合物が、血液等の生体試料に添加され得る。
移動可能な分子識別バーコードが試料に添付される場合、ヌクレオチドバーコードは、その(処理された)試料中の調査対象の他の標的核酸を圧倒するものであってはならない。実際に、突然変異の検出に対する最も高感度及び最低コストを得るために、最も大きい標的核酸の配列読取り数を得たい。一方、各ヌクレオチドバーコードが優先的に調査対象の標的核酸(複数の場合もある)に対して等モル量で存在しなければならないことから、移動可能な分子識別バーコード中の各ヌクレオチドバーコードの数が少なすぎると、正しい移動可能な分子識別バーコードを検出又は推測することができない。真核生物を起源とする生体試料は二倍体(2N)である。6対のヌクレオチドバーコードで構築される移動可能な分子識別バーコードが使用される場合、それらは、標的核酸に対して等モルとなるように、実質上は6Nで存在するはずである。血液試料が10 mlのVacutainer(商標)チューブに採取される場合、採取される血液の体積は常に10 mlとは限らない。より重要なことには、血液試料中のDNAの供給源である白血球の数は、1 ml当たりの細胞数で測定された場合に個体間で変化する。したがって、個体間で全く同じ体積の血液が採取されたとしても、最終的に利用可能なDNA及び抽出されるDNAの量は、試料間で大きく変化し得る。したがって、或る固定量の移動可能な分子識別バーコードは、全ての試料に対して最適な量とはならない。例えば、血液試料の血漿中の循環DNAの量は、その血液試料に由来する白血球中のDNAの量よりもはるかに少ない。したがって、優先的には、ゲノムDNAの収集に使用される担体に対するよりも少量の移動可能な分子識別バーコードが、cfDNAの収集に使用される担体に添加される。
試料の配列決定に対するほとんどのテンプレートの作製は、オリゴの捕捉を介した標的核酸の捕捉による、又はオリゴヌクレオチドを使用する増幅技術による濃縮を必要とする。また、そのとき、ヌクレオチドバーコードは濃縮される必要があり、それぞれ、ヌクレオチドバーコードに対する捕捉オリゴ、又はヌクレオチドバーコードの増幅に対するプライマーによって濃縮される。濃縮されるヌクレオチドバーコードの数は、これらの捕捉オリゴヌクレオチド若しくはプライマーによって、又はより具体的にはこれらの捕捉オリゴヌクレオチド若しくはプライマーの濃縮によって最適量に標準化され得る。例えば捕捉オリゴヌクレオチドがそれらのヌクレオチドバーコード標的より低い濃度で存在する場合、一旦これらのオリゴヌクレオチドの全てがヌクレオチドバーコードを見つけると、未反応のヌクレオチドバーコードは捕捉されず、洗い流される。この方法では、他の標的核酸に対して過剰なヌクレオチドバーコード配列は除去され得る。同様に、他の標的核酸の増幅に対するプライマーと比較して、増幅濃縮プロトコルにおけるヌクレオチドバーコード配列の増幅に対する限られた量のプライマーは、全てではない、すなわち過剰な標的ヌクレオチドバーコードがそれらのプライマーを見つけて増幅に関与しないという事実をもたらす。この方法では、ヌクレオチドバーコードに対する固定された濃度のオリゴヌクレオチドは、過剰なヌクレオチドバーコードを取り除く(skim off)。
実施の際、標準的な捕捉又は増幅のプロトコルにおいて、オリゴヌクレオチドの濃度は、既に、捕捉又は増幅する必要のある標的の濃度よりもはるかに高い。実際に、オリゴヌクレオチド及びそれらの各DNA標的は、1対1の分子の関係で存在しない。過剰なヌクレオチドバーコードを取り除くため、捕捉又は増幅のためのこれらのヌクレオチドバーコード配列に対するオリゴヌクレオチドの濃度は、他の標的ヌクレオチド酸に対するオリゴヌクレオチドの濃度と比較して減少される。そうして、他の標的ヌクレオチド配列に対するヌクレオチドバーコード配列の相対的な等化は、濃縮に関与する標的ヌクレオチドバーコードの数を限定することによって達成されるのではなく、ヌクレオチドバーコード配列の発見を動的にそれほど好都合でなくすることによって達成される。
存在する移動可能な分子識別バーコードを推測するため、配列決定の後に十分なヌクレオチドバーコード配列が得られないというリスクと共に、ヌクレオチドバーコード配列が他の標的ヌクレオチド配列よりも低い濃度で存在する場合、最適なヌクレオチドバーコード配列対標的核酸の比は、ヌクレオチドバーコード配列の濃縮に使用されるオリゴヌクレオチド(捕捉オリゴヌクレオチド又は増幅プライマー)の濃度を相対的に増加させることによって得ることができる。
汚染の検出に対して非常に高感度の配列決定プロトコルを開発したい場合、より多くの量(濃度)の移動可能な分子識別バーコードを含む生体試料用の他の試料容器を使用するといった、移動可能な分子識別バーコードの濃度の量を増すことなくヌクレオチドバーコード配列を濃縮するため、捕捉又は増幅によってオリゴヌクレオチドの濃度を増加させることによってこれを達成することができる。
全ゲノム配列決定及び非侵襲的出生前診断、循環腫瘍DNAに対する検査等の全ゲノムが配列決定される場合、捕捉又は増幅による濃縮のためオリゴヌクレオチドが添加されることはない。それにもかかわらず、ヌクレオチドバーコード配列に対する捕捉オリゴヌクレオチドは、全ゲノム配列に対しておそらくは過剰なヌクレオチドバーコード配列を取り除くため使用され得る。
移動可能な分子識別バーコードは、NGSテンプレート作製アッセイにおいて作製することなく、高度並行配列決定の適用で使用されることさえある。これは、高度並行配列決定による増幅及び/又は配列決定に対する全てのプライマー結合部位が、移動可能な分子識別バーコードの定常隣接配列中に既に存在するため、NGSテンプレートの作製中に付着させる必要がない場合に達成され得る。その時、単一の実験において異なる試料を分析するためのプール化インデックスの組み込み等の最小のテンプレート作製アッセイのみが行われてもよい。
多くの適用において、特に標的化配列決定では、異なる試料/ライブラリを単一の配列決定実験においてプール化する。かかるプール化されたライブラリでは、ライブラリ間の変動はできる限り低くなくてはならない。或るライブラリがより少ない濃度で存在する場合、かかる試料/ライブラリに対してより少ない量の配列決定データ(最悪の場合には不十分な読取り深度をもたらす)が得られるため、その試料中の突然変異が見過ごされるため、更なる配列決定読取りを得ることで所望の読取り深度を得るには(in orderto)、その試料は再度の配列決定を必要とする可能性がある。また、これは、その試料の配列決定に対する費用を増加させる。或る試料/ライブラリに対して、必要とされるよりも多すぎる配列決定データ(したがって、高すぎる読取り深度)が得られる場合、より多くの配列決定された配列が得られ、必要でないものに支払うため、検査にはより費用がかかる。したがって、プール化された試料/ライブラリは、等化されるべきである。配列決定されるDNAフラグメントの分子量が考慮される場合、又は各ライブラリについて推定される場合には、これは、濃度つまりDNA分子の数の特定によって行われ得る。異なるライブラリが異なる標的核酸(したがって、配列決定されるDNAフラグメントのサイズが異なる可能性が非常に高い)を有する場合、分子の数を標的のサイズに合わせて補正する必要がある。したがって、各ライブラリのこれらの濃度の測定、計算、及びその後の希釈実験、並びに後のライブラリの混合は、非常に手間がかかる。
また、プールされる異なる配列決定ライブラリの等化は、等化オリゴヌクレオチド(複数の場合もある)によって達成され得る。これは、任意の次世代シーケンシングのワークフローに必要とされるライブラリ正規化(library normalization)のためのライブラリの定量及びライブラリの希釈に対するニーズを置き換える、単純で継ぎ目のないビーズベースの解決策であり、ライブラリ間の変動を最小化する。等化オリゴヌクレオチドは、全ての標的ヌクレオチド配列に結合し得る。ほとんどの適用において、等化プローブに対するかかる結合部位は、プライマーが等化オリゴに対するかかる結合部位を有するアダプターを保有する、増幅による標的核酸の濃縮中に、又はアダプターが等化オリゴに対する結合部位を保有する、アダプターの断片化及びライゲーションによる配列決定ライブラリの作製の間に組み込まれる。等化結合部位は、増幅及び/又は配列決定プライマーに対する結合部位と同一であってもよい。等化配列がプライマー又はライゲーションアダプター中に存在した場合、真の配列決定テンプレートのみが等化されるように、未反応のプライマー又はライゲーションアダプターを最初に取り除く必要がある。試料が移動可能な分子識別バーコードに由来する標的ヌクレオチド配列及び他の標的核酸を含む場合、移動可能な分子識別バーコードに由来する標的ヌクレオチド配列の単独の等化は、ヌクレオチドバーコードの定常隣接配列に対する等化オリゴヌクレオチドによって達成され得る。等化オリゴヌクレオチドの組み合わせ、すなわち、ヌクレオチドバーコード配列中の定常配列に対する第1の等化オリゴヌクレオチドと、プライマーによって増幅中に、又はライゲーションアダプターによってライゲーション中に組み込まれる配列に対する第2の等化オリゴヌクレオチドとが、調査対象の他の標的核酸に由来する他の標的ヌクレオチド配列に対する、ヌクレオチドバーコード配列に由来する標的ヌクレオチド配列の相対的な割合を更に微調整することを可能とし得る。等化オリゴヌクレオチドがビオチン化される場合、配列決定ライブラリの各々に同じ数のかかる等化オリゴヌクレオチド(複数の場合もある)を添加することによって、ライブラリ間の変動が最小化された配列決定ライブラリを得るため、簡単なビーズベースの解決策を行うことができ、この等化オリゴヌクレオチドの数が、得ることができる標的ヌクレオチド配列の数を下回る場合、各配列決定ライブラリ中の過剰な数の配列決定テンプレート分子は取り除かれて、この方法で、配列決定実験においてプールされた異なる配列決定ライブラリをより最適な方法で等化する。
また、Oxfordナノポアシーケンシングに適用されるように、リアルタイムのRead Untilシーケンシングは、他の標的ヌクレオチド配列に対するヌクレオチドバーコード配列の配列読取りの最適な比率を得るための別の方法となり得る。Read Untilシーケンシングでは、各ポアにおいて何が配列決定されているかをモニターして、ユーザーに配列決定を続けるか終わらせるかの選択肢を与える。各ナノポアチャネルが個別に対処可能であることから、各ポアにおける配列決定反応を単に停止させて、新たなDNA鎖は配列決定用のそのポアにアクセスすることができる。各最小バーコード配列が定常隣接アダプター配列によって挟まれることから、Read Untilシーケンシングは、ヌクレオチドバーコード配列の定常アダプター配列の存在又は不在をモニターして、配列決定されるヌクレオチドバーコード配列の数を記録することができる。
ライブラリ作製プロトコルにおいて、ヌクレオチドバーコード配列を捕捉若しくは増幅するためのオリゴヌクレオチドの濃度を調整することにより、又は選択的シーケンシングによって、各々が異なる量の、所与の適用又は技術に対して最適化された移動可能な分子識別バーコードを有する生体試料の収集物に対して、過剰に容器を生産する必要がない場合がある。それでも特定の下流の処理に対して異なる濃度の移動可能な分子識別バーコードを有する容器を生産する必要がある場合、この数は、2つ(高又は低)又は3つ(高、中、低)の濃度タイプに限定されることが想定される。
したがって、移動可能な分子識別バーコードは、検出される必要がある汚染レベルに応じて、異なる量で作製され、使用され得る。実際に、検出したい汚染レベルが低いほど、必要とされるNGS配列決定は深くなり、したがって、物品又は試料に添加すべきヌクレオチドバーコードの量も多くなる。
移動可能な分子識別バーコードが遺伝子検査において汚染を検出する場合、汚染は、その検査で使用される任意の物質に起因し得る。実際に、生体試料(血液試料、DNA試料、又は検査プロセスにおいて処理されたそれらの生成物)間の汚染の他に、汚染は、その検査(DNA抽出、NGSテンプレート作製、及び/又は配列決定反応)で使用される任意の産物にも起因し得る。例えば、プール化バーコードの使用により異なる試料を単一の配列決定実験において合わせる場合、プール化バーコードもまた、互いに汚染され得る。プール化バーコードは、オリゴヌクレオチドプライマーの使用によって配列決定テンプレートに組み込まれ得る。一連の異なるプール化バーコードプライマーが産生される場合、先のプール化バーコードオリゴヌクレオチドに由来する任意のわずかなレムナントが、後続のプール化バーコードオリゴヌクレオチドにおける合成、可溶化の間に汚染された(例えば、プール化バーコードプライマー2が、プール化バーコードプライマー1で汚染された)プール化バーコードプライマーを生じる。試料1に対してプール化バーコードプライマー1及び試料2に対してプール化バーコードプライマー2を使用して2つの異なる試料が1つの実験において処理され、配列決定される場合、ここではプール化バーコードプライマー2はプール化バーコードプライマー1で汚染された。配列決定の後、2つの試料の各々に対して異なる配列決定された配列はグループ化され、バイオインフォマティクス処理において各プール化バーコードに従って処理されて、それらが汚染されたプール化バーコード1と紐付けられたために、試料2の幾つかの読取りが試料1の読取りを含むファイルに現れる。したがって、分析の後、処理の間に試料1が試料2によって汚染されたように見えるが、実際にプール化バーコードが汚染されていても、技術者による作製の間に両方の試料が正しく処理されて、試料間で汚染が起こっていない可能性も十分にあり得る。したがって、移動可能な分子識別バーコードは、DNA抽出キット、NGSテンプレート作製キット、製造プロセス及び最終製品の品質管理のためのオリゴヌクレオチドの製造業者によっても使用され得る。
また、ヌクレオチドバーコード配列に対する捕捉オリゴヌクレオチドは、全生体試料に対してDNA抽出が行われないプロトコルで必要とされる可能性が非常に高い。ここでは、生体試料の細胞に存在するゲノムDNAである任意のDNAと並んで、添加されたDNAヌクレオチドバーコードを分析する。(微小流体)システム等のアッセイを小型化する場合、全生体試料に対してDNA単離を行わなくてもよい。例えば、DNA抽出が単離された細胞、病原体(細菌、ウイルス)に対してのみ行われてもよい。移動可能な分子識別バーコードがかかる生体試料中に存在する場合、それらは、細胞単離の工程で保持されない可能性がある。ヌクレオチドバーコードに対する、したがってそれを捕捉するための捕捉オリゴヌクレオチドを、ヌクレオチドバーコードもまた保持されるように、病原体又は細胞の大きさのビーズ(-構造)に結合させることができる。例えば、かかる細胞、細菌、又はウイルスが磁性ビーズに結合したポリクローナル抗体によって捕捉される場合、これらのビーズは、ヌクレオチドバーコードに対する捕捉オリゴヌクレオチドが結合される磁性ビーズと容易に混合され得ることから、かかるアッセイにおける移動可能な分子識別バーコードの使用を可能とするためにプロトコル又はアッセイを変更する必要はほとんどない。
また、DNA型の移動可能な分子識別バーコードは、RNAがcDNAに変換された時点からRNA検査において使用可能である。実際に、生体試料からの多くのRNA抽出プロトコルが、例えばDNaseによって(残留)DNAを破壊するため、DNA型の移動可能な分子識別バーコードは、生体試料中に存在する場合には破壊され得て、RNAがcDNAへと変換された場合にのみ添加され得る。RNA検査においてRNAのcDNAへの変換を進める上流の処理工程の品質を保証するため、RNA型ヌクレオチドバーコードのミックスで構築されるRNA型の移動可能な分子識別バーコードを使用しなければならない。
DNA型ヌクレオチドバーコード中の最小ヌクレオチドバーコード領域に対して上流の定常隣接配列がRNA合成をプライムするプロモーターを含む場合、RNA型ヌクレオチドバーコードは、DNA型ヌクレオチドバーコードから作製されることも可能である。かかるアダプターは、例えば、T7プロモーターであってもよい。RNA型ヌクレオチドバーコード中の最小ヌクレオチドバーコード領域に対して下流の定常隣接配列がA残基の伸長(例えば、20個、25個、50個、75個、100個、150個、200個以上のA残基)も含む場合、RNA型の移動可能な分子識別バーコードのRNA型ヌクレオチドバーコードも、mRNA単離工程においてmRNAと共にRNA型ヌクレオチドバーコードが単離されるように、mRNAの単離を必要とするRNA検査で処理され得る。
診断検査での適用とは別に、移動可能な分子識別バーコードは研究試験、例えば、発現ベクターによってトランスフェクトされ、高度並行配列決定アッセイによって研究される生体試料(例えば細胞系統)を使用する研究プロジェクトでも使用され得る。これは、隣接定常配列が細菌DNA若しくはウイルスDNAによってコードされてはならない(したがって、クローニングベクター、又はより具体的にはクローニングベクター骨格に見られてはならない)、又は任意の天然起源のゲノム、細菌DNA若しくはウイルスDNAにコードされる配列に対して、1%未満、2%未満、3%未満、4%未満、5%未満、10%未満、15%未満、20%未満、25%未満、30%未満、40%未満、50%未満相同な配列を有しなければならない別の理由である。そうでなければ、移動可能な分子識別バーコードは高度並行配列決定において干渉し、また配列決定されて、希望する数の配列決定された配列を得るためにより多くの配列決定を必要とすることから、分析を希望する配列決定された配列及び費用を犠牲にして不要な発現ベクターから配列決定された配列が生成される。
また、ゲノム及び/又はトランスクリプトームのレベルでの検査におけるそれらの適用とは別に、移動可能な分子識別バーコードは、任意の種の検査における適用に見られる場合がある。例は、肉、植物、細菌、真菌の含有量に関する、食品、更には完全な製造チェーンの品質及び組成を特定する検査である。これは、例えば、食料品に示される所与の動物の肉と混ぜ合わされた別の動物の肉が存在する偽物の検出を可能とし得る。これは、種間で高度に異なるため、種間の区別、ひいては種の検出を可能とする、ゲノム及び/又はミトコンドリアDNA領域の配列分析によって分子レベルで行われ得る。ここでもまた、食品試料をかかる分子配列決定検査のため採取する場合に、移動可能な分子識別バーコードの使用(添加)によって、食品試料の入れ替わり及び/又は食品試料間での汚染を同様に予防/モニターすることができる。
また、移動可能な分子識別バーコードは、工業製品、芸術品、アンティーク、証券(securities)及び環境汚染物、工業生産プロセスの品質管理等の標識に使用され得る。より高濃度で使用される移動可能な分子識別バーコードは、増幅の必要性を排除するため、移動可能な分子識別バーコードは、単独の分子配列決定装置で直接配列決定され得て、配列決定テンプレートを作製する必要はほぼない。このフォーマットは、ポータブル及び携帯型の単独の分子配列決定装置において非常に魅力的となり得る。かかる移動可能な分子識別バーコードは、移動可能な分子識別バーコードが容易に(複雑な)混合物から単離され得るように、ビオチン基の付着等の容易な単離及び/又は精製を促すための追加の特性を有する場合がある。
また、調査対象のタンパク質(複数の場合もある)を検出するアプタマー(複数の場合もある)が利用可能である場合、分子識別DNAバーコードは、タンパク質アッセイにおいても使用され得る。
実施例1.NGSにおける移動可能な分子識別バーコードの使用
例示のため、図7は、調査対象の核酸の標的領域の濃縮のため2段階PCRプロトコルを使用するNGSアッセイにおける移動可能な分子識別バーコードの使用が、どのように試料入れ替わり又は汚染を検出するかを示す。
患者試料の2つの標的核酸領域A及びBを対象とする移動可能な分子識別バーコードを患者試料に添加した。2段階多重PCRプロトコルにより、2つの標的核酸領域、並びに最小ヌクレオチドバーコード及び移動可能な分子識別バーコードのその隣接配列が増幅される。この目的で、3つ全ての標的核酸領域に隣接するプライマー結合部位に対するアンプリコン特異的プライマーが増幅される。全てのアンプリコン特異的プライマーは、5'ユニバーサルアダプター配列(フォワードプライマーに対する或る1種類のユニバーサルアダプター配列、及びリバースプライマーに対する別の種類のユニバーサルアダプター配列)を保有する。第2のPCR工程では、プール化バーコードを、第1のPCR工程で得られる全てのアンプリコンに組み込む。一対の異なるプール化バーコードプライマーのみが1つの試料当たりに使用される。プール化バーコードプライマーは、第1のPCR工程の後、3種類のアンプリコンに組み込まれたユニバーサルアダプター配列中にプライマー結合部位、インデックス配列、及びNGS配列決定のために更に試料を処理するのに必要な5'アダプター配列を有する。各試料に対して、異なるプール化バーコードを使用する。3つ全てのアンプリコン(調査対象の2つの標的核酸、及び移動可能な分子識別バーコードに由来する)において、同じインデックスを所与の試料に組み込む。その後、シーケンシングのチップ及び試薬を十分経済的に利用するため、種々の試料を全て混合し、配列決定する。配列決定の後、全ての配列決定された配列を1又は少数の大きなファイルに得る。(バイオ)インフォマティクス手段により、全ての配列決定された配列をプール化バーコード配列に従って異なるファイルに分離する。そのようにして各患者試料に特異的な同じプール化バーコード配列を有する全ての配列をグループ化し、別々のファイルに保存し、個別に更に処理する。各インデックス/患者ファイルに対して、最小ヌクレオチドバーコード配列を、試料入れ替わり及び(and)汚染がないかどうかを見るため(in orderto see)特性決定する。試料入れ替わり及び/又は汚染が見られない場合、遺伝子検査、すなわち、その試料中の2つの標的ヌクレオチド配列に見られる突然変異は有効である。
4名の患者の試料が示される。第1の(first)試料に移動可能な分子識別バーコードIを添加して、プール化バーコード1を使用し、第2の試料に移動可能な分子識別バーコードIIを添加して、プール化バーコード2を使用し、第3の試料に移動可能な分子識別バーコードIIIを添加して、プール化バーコード3を使用し、第4の試料に移動可能な分子識別バーコードIVを添加して、プール化バーコード4を使用した。図7Aでは、試料の入れ替わりも汚染も観察されず、図7Bでは第1の試料と第4の試料との間で処理中に試料入れ替わりが起こり、図7Cでは、処理中に第4の試料が第1の試料で汚染される。
実施例2.遺伝子検査ワークフロー
図8は、移動可能な分子識別バーコードを含有する血液収集チューブから開始して、最終の有効な遺伝子検査レポートまでの遺伝子検査におけるワークフローを示す。
血液収集チューブは、独自の移動可能な分子識別バーコード及び1対1で関連する光学巨視的バーコードラベルを含む。独自の分子識別バーコード及び光学バーコード、並びにそれらの1対1の関連を、クラウドを通してアクセス可能なデータベースに保存する。患者から、この血液収集チューブに血液を収集する。血液収集チューブは、ここで、付着した2枚の光学バーコード紙面ラベルを有するように、この血液収集チューブに患者からの(例えば、病院によって作成された)別の(第2の)光学バーコード紙面ラベルを付着させる。患者の光学バーコードラベルがLIMSシステムに関連付けられる際に、また両方の光学バーコード紙面ラベルがスキャンされる際に、第1の光学バーコードラベルの情報もLIMSに接続され、移動可能な分子識別バーコードとのその1対1の関連、またその移動可能な分子識別バーコードも与えられるようになる。したがって、移動可能な分子識別バーコード中の最小バーコード配列は、患者の氏名に対する移動可能なエイリアス(alias)である。その後、この試料を配列決定のため処理し、より具体的にはDNA抽出を行い、目的の標的核酸領域(調査対象のゲノムのDNA領域及びヌクレオチドバーコード配列)を濃縮し、濃縮された配列を配列決定テンプレートとして調製する。全ゲノム配列決定又は環状DNA配列決定が行われる場合、濃縮は行われない。各試料の配列テンプレートを調製する間、プール化バーコードを組み込む。その後、全ての配列決定テンプレートをプールし、配列決定する。配列の後、同じプール化バーコードを有する全ての配列を単一のファイルにグループ化し、更に分析する。移動可能な分子識別バーコードに由来する配列読取りを、ヌクレオチドバーコード配列識別子配列の存在によって識別することができる。これらの配列読取りをサブグループ化し、最小ヌクレオチドバーコード配列を、例えば、それらの「抽出」配列によって特性決定することができる。調査対象の標的核酸に由来する他の配列を、マッピング及び変異体呼び出し(variant calling)によって突然変異について特性決定することで遺伝子検査結果を得る。その後、元の第1の光学バーコードラベル紙面コードを提示することによってクラウドデータベースにコンタクトし、その後、クラウドサーバーが関連付けられた最小ヌクレオチドバーコード配列を顧客の検査室に送る。これらの送られた最小ヌクレオチドバーコード配列は、配列読取りから得られた最小バーコード配列によって確認される。予想される最小バーコード配列が配列読取りに見られ、追加の最小バーコード配列が見られない場合、試料の処理中に試料入れ替わり又は汚染は起こらなかったことから、その遺伝子検査の結果は有効である。患者情報、更には病院が作成した患者の光学紙面ラベルコードさえも検査室/病院の外に移されることはなく、患者の血液が収集された元の血液収集チューブに付着された光学バーコード紙面ラベルコードのみが検査質/病院の外に移されることに注目すべきである。
図9は、移動可能な分子識別バーコードを含有するマイクロチューブから開始して、最終の有効な遺伝子検査レポートまでの遺伝子検査におけるワークフローを示す。
マイクロチューブは、独自の移動可能な分子識別バーコード及び1対1で関連する光学巨視的バーコードラベルを含む。血液試料を標準的なVacutainerに採取する。直後に、又はVacutainerが遺伝子検査室に到着した際に、マイクロチューブの移動可能な分子識別バーコード溶液、及び関連付けられた巨視的なバーコードラベルを、血液試料を含むVacutainerに移す。代替案として、関連付けられた巨視的なバーコードラベルを移さず、すぐにスキャンする。その後、図8に記載されるのと同様に検査を進める。
図10は、図8に記載されるものに類似するが、配列決定された配列の処理が異なるワークフローを示す。ヌクレオチドバーコードに由来する配列決定された配列、及び標的試料核酸の配列決定された配列は、図8及び図9において記載されるように並行して分析されない。ヌクレオチドバーコードの配列決定された配列のみが分析され、しかも完全にクラウド上で分析され、また試料入れ替わりが検出されない場合のみ、標的試料核酸の配列決定された配列のバイオインフォマティクス分析が開始される。また、汚染が検出される場合、標的試料核酸の配列決定された配列のバイオインフォマティクス分析が開始され、結果が検出されて分析されるが、これは検出される汚染レベルの状況で判断される。バイオインフォマティクスパイプラインは、異なる連続ステップ及び/又は並列ステップ(アルゴリズム)で処理され得て、最小ヌクレオチドバーコード配列を提供する施設の又は顧客サイト(例えば病院)におけるクラウド上で部分的又は完全のいずれかで行われ得ることが明らかである。
実施例3.異なるサブプロセスにおいて試料検査プロセスを移動可能な分子識別バーコードでスパイクする
図11は血液が採取される際に、移動可能な分子識別バーコードで標識される2つの試料を示す。血液試料1は移動可能な分子識別バーコード1で標識され、血液試料2は移動可能な分子識別バーコード2で標識され、両方の試料のDNAがDNA抽出設備で抽出される。その後、抽出されたDNA試料を再度、移動可能な分子識別バーコードで標識する。DNA試料1は移動可能な分子識別バーコードAで標識され、DNA試料2は移動可能な分子識別バーコードBで標識される。次いで、DNA試料を次世代シーケンシング設備に送る。血液又はDNAを標識するためにそれぞれ使用した移動可能な分子識別バーコードは、ヌクレオチドバーコードを区別することができる異なるヌクレオチドバーコード配列識別子配列をそれぞれ有するヌクレオチドバーコードで構成される。試料入れ替わり及び/又は汚染が起こった場合には、試料入れ替わり及び/又は汚染が起こったサブプロセス(及び検査室)を追跡することができる。
試料入れ替わり又は汚染が試料1及び試料2において/それらの間で起こらなかった場合、最小ヌクレオチドバーコード配列1及びAが試料1に見られ、最小ヌクレオチドバーコード配列2及びBが試料2に見られる。
DNA抽出の間に試料1が試料2で汚染された場合、最小ヌクレオチドバーコード配列1、2及びAが試料1に見られる。
NGSテンプレートの調製及び配列決定の間に試料1が試料2で汚染された場合、最小ヌクレオチドバーコード配列1、2、A、及びBが試料1に見られる。
実施例4.上流及び下流の定常配列
実施例は、本出願に記載され、例えば図3及び図4に示される単離された上流及び下流の定常配列の実施形態を示す。
図4を参照して、以下に示される上流定常「配列1」[配列番号1]は、制限酵素部位RE1(下線)から黒で示される最小バーコード配列に亘る配列を示す。
図4を参照して、以下に示される下流「配列2」[配列番号11]は、黒で示される最小バーコード配列から制限酵素部位RE2(下線)に亘る配列を示す。
配列番号2及び配列番号12は、ポリA尾部を持たない変異体である。
その変異体は、ベクター中のクローニング部位に応じて、代わりの制限酵素部位認識配列を有する。
代替的には、「配列1」が下流配列であり、「配列2」が上流配列である。
代替的には、下流配列の一方又は両方が、以下に示される配列の逆相補配列であってもよい。
代替的な実施形態では、示される下流及び/上流の配列は、上記配列と70%超、80%超、90%超、95%超、97%超、又は99%超の配列同一性を示す配列である。配列同一性の違いは、例えば、制限酵素に対する認識部位の付加又は欠失の結果による結果であってもよい。
更に代替的な実施形態は、示される制限酵素部位と定常配列との間及び/又は定常配列と最小バーコード配列との間の追加のヌクレオチド配列の存在によって、以下に示される配列を含む定常配列である。
更に他の実施形態は、示される「配列1」及び「配列2」のフラグメント、すなわち少なくとも200ヌクレオチドの、少なくとも300ヌクレオチドの、少なくとも350ヌクレオチドの、少なくとも375ヌクレオチドの、又は少なくとも390ヌクレオチドのフラグメントを含む又はそれからなる定常配列である。
これらの配列及び代替配列の非限定的なセットは、配列番号1~配列番号20に示される。「配列番号1」及び「配列番号2」[配列番号1及び1]について明確に述べる上の明細書は、他の示される配列に対しても同じく適用され得る。
[配列番号1]
aagctttgtggatgtacaagtccacaccatgtacactagacgcagcctgtacagatatccatccagtgtactcactgtcgacacggatccaatgcccgggttctgatagacgaacgacgagatgtgcagtgacttcgaggatcccagatgtgcacgtagtgcaggtagcttgaatgactactacgcctgtagcatcatcacgtagactcgtacagctacatgacggtagctagattgacgactcaagcatgctagtgtcgttactgacctgatgacacagtcgatgcgaccttaatacgactcactatagggtcaacaagaccctgcagatcccgggatccgcctcttaagctgcgcaggccaggaattgcacgtcagagcactaaggccgccaccatggc
[配列番号2]
aagctttgtggatgtacaagtccacaccatgtacactagacgcagcctgtacagatatccatccagtgtactcactgtcgacacggatccaatgcccgggttctgatagacgaacgacgagatgtgcagtgacttcgaggatcccagatgtgcacgtagtgcaggtagcttgaatgactactacgcctgtagcatcatcacgtagactcgtacagctacatgacggtagctagattgacgactcaagcatgctagtgtcgttactgacctgatgacacagtcgatgcgaccttaaatgctgagagattagggtcaacaagaccctgcagatcccgggatccgcctcttaagctgcgcaggccaggaattgcacgtcagagcactaaggccgccaccatggc
[配列番号3]
aagcttctctcgccagctatttaaagtacgagtcgggaggccttagcacgaactgatttttccagcctgagtgctgttcttgcatgtaccttctatctaacgacgtccgtaataggaagtataccaggtcgaactaacgactcctttgccgtagcgagtgtttcgccaaaagtgtctgggtctactggccaccgtccagcatttctatgcccgtaccaggacccttcgtgtaatcccccatggattttcaagaattgaggaaaagtcacgtctccaaggccctacagggccagcggatactttgaaagcgacgataatatggtcgcttatttcatccaagccccgcgctaaacatggattttgggatgctatcccgaaagtacgacttggctccaaaggcc
[配列番号4]
aagcttaacttcagctgaagacccgttttcgatccgcggcgagcccggagtgtaaaacgatagacgtgatgcttcggtcttctcaccccttcgaggtcataacatttttgtcatgattgccgtagtgctgatagtcctgagtctaaggcattcaatacaacgtacctcaggtcaattagactgtccatgactcatcttccgaagcgcagaatgatacgcagttctcactagttgggacctgctcgacgtccggttaaggcggatttaactaagcatagggtaccgtcacctgggcaactgaaaatggcctctgtgacgcaagatgcatgttcggtcagctcgttcaaagacggtatgaaatagagtagacatcagtacatcactcggacaggagcacctat
[配列番号5]
aagcttgcgcaactttgacgaaatgttggccaatagcatacccgaacaccgcagggttaatgcctacagctagtgttagtcgttccggtagacatctgttaaagccggaagctcgcccgactgtacgaaatcacatctaactatacaactgcgccactttgcaaatcgagtcacgacgacctgtcccttacggtgcccatttgcgctgtaatgccgatcacttcacacaaacaaggcgcttgagagctcgaacttaggcgatgagggacaagtggtacccaagctccaatagtagaatgtgtaccatagggccgcggcgagccgcctttgtatcctgaaaaaattctcatcggcagcgcagtttattatttagttggaagcattagtgaacataacagcgc
[配列番号6]
aagcttccgtggtgggcagaagagcctagcttactctttatttaaaaacgccagtagaatttggtcgggaggatacgatccactgtccaacataaataacccgctgtagcctttacacattcacgggttaagtgtagtgcgtgttctgtgtttctggtttgaataactgttcccactgtcttgaggatcgattctggccaaaatgtatgaccctctacataggatgtacccctggggtaggacggaatcgattacgacccctgatgataatgaccaatcgtgacggtcggtgtctactgacttcgcctacatccgacgatcctggctaggcgggttgagaacatcacggtattggggatcgggatgcgcgatcgcgataatgtggacttcgcaggtagtag
[配列番号7]
aagcttggtggagcgcaaattctatttctgagttgcggcgtcagttgccattgaagtgcccgagctgcatagtctcacggtgagtcctcttgtacgaccactagatgcaatgaagcgtgcatggagcgccactctgcaataaaagccgaaacgctctgtaaacaagattaatgtctcgtgatgctctgaaaccgtttacctaacacgaacgataagacgcaacatcttccagagatgattacccgacacgctaatgaccgttatcactccccgcacatctgagcgtactttttgaagtcccgaggattgtcacggactaaatacctcgaatatcctgaactacctttgccaatggagggaaggacagggacacgctgtcggtactttgtaggcatttgggt
[配列番号8]
aagcttagctcgacgcacaatccaacaagtagcactgctgtctactaagcaacgtaatgatccattcagacgagtttggaatgatctgcctcacccaaagcattaggcagccccctagctttctataggagaccgaaagagcatgagagagaactccctgatgacttactgactgcgtgatggttggctccgggacgcgcaacgcaacactttgtgtggcacgtaacttgtcgcacatatgtaatagcttcaaacccgcctcgtcttctggtgtgcgctcgttcatttaatcgaatagattcctctctctactgctggtcaagggcgtattggaaataacaagcaagctcctccgagctgagctacgagtcgatccgcccatgttccctcattatcgtctg
[配列番号9]
aagcttgacctgtagcaccgcaaataatcattgctaatacgattcaagaatcgccctcgttatttgtattcacaggtgacccttggcttctactctaacacctaaggctgatccaactcagacttaagcggcgcagccgcaaatgtaatatgttcactgagagagagacgacggctccgtaggtcgaacattcaggtagctggagagatcattgcttagcatggcgctcgcggatctgttactgcaaatggcaacagactagaaaacaggcctaatatgatctcggaattttcgcctaacacgctcctttgactggctgtgaggcctaagcgattctggcagcgctgtgacttatcaagacacgcatgtcactacttgaccggcatcgtgccactctacgc
[配列番号10]
aagcttttctctgcaacaggcgactatcggggccgggtgccaatctttcaaaagtgtgtaaacgtgcgaccgccagatgtcatgattcaatgtcttacctcgggctatcgtcataataagtttctaccgtaaggcacgccctaaggacgttccgaataaacacgcacccccccgtcgtttcagaaatctcattaccggctgacatgcctttagatacctcagagaaatctaaccacgtgtgttacgactgacgtctcaaagagacgagctgctcctagctttcctattggagtatctgtgcctcttgtgtcgggatttagtggatcaatatgctcccctacgataggtaagatttacccgttcgtcaattagagagccgggttttattattcggtcggcag
[配列番号11]
catcatcaccatcaccattgatctcccagctgtgacacaaataagctagcccggggcagcatggaggttaaaattgtgcatccgaccggccaggatacgtaatattaatgcgcaccgcgcactgaagaatatgatcgaggctcgctgtagcagcactcagaaaaaaaaaaaaaaaaaaaaaaaaagagtgaataacactcagatctcgggggcgtgaatgctaaacatacacagagcacgcggtgatgtataccgctatgtcggtcatgtgctacctacagaagagctaggagtggatgagcactacacggtttcgggctaagaccatactctcacacgtgtggatgactcgagacagcagtgtcagagcatgtagctctagagatgacacgatgaattc
[配列番号12]
catcatcaccatcaccattgatctcccagctgtgacacaaataagctagcccggggcagcatggaggttaaaattgtgcatccgaccggccaggatacgtaatattaatgcgcaccgcgcactgaagaatatgatcgaggctcgctgtagcagcactcagaaccgtaataggaagtataccaaaagagtgaataacactcagatctcgggggcgtgaatgctaaacatacacagagcacgcggtgatgtataccgctatgtcggtcatgtgctacctacagaagagctaggagtggatgagcactacacggtttcgggctaagaccatactctcacacgtgtggatgactcgagacagcagtgtcagagcatgtagctctagagatgacacgatgaattc
[配列番号13]
cctctacggctccgtatcttaagacaaatgcgttctcgtaggtttgcttctacgtgatcatccggggtggtaatccgccctcgatctcctaaggatgaaaagggttagttgggccgaatttagttgatcgataagctgacggaaatctttactagcggataagctcatcccttcctgggtcaagatgcgagctagtacggccgcgtcgctaatctcaatgaccattaactttgcgtagccatgtgtgctgctgcggagcgatactattaattgccctttcagttctggttccattgcactctgaaggatctccagtttgtcggaatatcacgtaagaacgcttggcagaaaaagtctctatgctgtaacgcctcgacgtgaaactcgacaatgtgaattc
[配列番号14]
cgtgaggggcacggcgagggagatcacaatatactgtcgtcgtttgatttcggaacagagccaacgggttcgggtgtcttgtgtgcttcactacatgacctcggtaaccagcagatttggtccaccgggtttgtgctggatttaggacaaggcgaaatatcatgatatacacagcatcgctttgccgttacatttttggcagccaaatggatcagaggctggtggggattacaccaccttgcccttacattggctaacgttttcaacacgtgttcctaaaatgtcagtcatgtccccccacacactatagcgctgagtcgatggagatcaaatgaggaatcgaccggaaaccttggtgtcactgcctatgcgccggcaatgaacaaaccgaagtgaattc
[配列番号15]
aagctggtagcatatggatagctggcatgttcagataattgctatctggtatccccacggatgctgatggctgatctttaaggtaaatgacattcgttgtctttacgcgccacagtgttgggccaagcagtctagtcatccagggtcatgctgagtctgcctcgtagcttaaactgttctaccattacgcggtcacgagccgtgacatctcctatttacctggcacggttgcggtggcttgtaccgctccagatattataggagtcaagtctaatgtcttatttatgcgagcgtcataggaccttgtccaataaattgaaaggatacgcccgagctgtggtagctgttagtgacggcatattgccgagggagccatcgaatgcaatgttgattcgaattc
[配列番号16]
gtgctgttttgttcctcagttcgatacgacctaggaactgatggcgggctacccggatgatctcgatttgttctctcatgatagcaacggcgtcaagcgtcagtcttgtctcgatggagggtcgagtagatttggcttggatctttctcgtgtaaagtaaatccctgccagaggaccgagctggacggcgaagaagtttttttatctctgcacttcgaacgataagcgtcgtctccctggtcgcaaacatgggcccaaattggcttgcgattgttaaactaccggagtttttaatcgcctaaaccgcggagttaatccatgcaaccaagccagtaggatgaagaagtgcgtccagtcgatcgttagtgcctggaatttctcttatcggcatcaagaattc
[配列番号17]
tgtccgctctctagcagaagttgtaagttttaactcagtaggctgctactgaggggattgaacgcatgttatttgggttagtggtaataaatgactgtctcaggcgccatgctagagaacaattttgctggtttgcttacatggagacactagtctggtaccgcaccactcatggaatcaagcgtggtaggcccattgtttacgtacgagccggctgcatgagggcacatagcatctggataaggcccgagagacagaggtctgccgagttttacgataccatagctgttgcgccttgcattgctatcggttttacctgtcgtctccggcagacggtttattcctcactcaattaattggctagtgcggctggttatccaacaagcgcattagtgaattc
[配列番号18]
ccggtaacttgctcctgggacgcttaaatggcaattttaaaggaggcgaccgacccccctaacctaaggatggtacttggtgaatactatcaaccacctccgtgacggcggccaattcaatcctgtaacgcgtgtcgtaaaagttcagtttgtcgcagggtcgagttacccgtaatcctgggaacgcccccccaatccgcttcagggctatatgccacacttgaaatcggaagtatcttggcttgagtatagtctggcgtggtaccacacatctacagtgaggtgaaaggcgcttctggcaaggtacgttctgcctgacagaattattcgcattagtggatgcgtccctggagtgcgtaaagcacactcggcagatgagtgctcggagcggactgaattc
[配列番号19]
tagatgttgtacctgacaaccttctccctgcaaagcgggtgcctaaagatgttgttacatactccaggcctcgatatggtccaatcaaaatcccatcggaccagcgttggaaagtagcacataagcgtgagacctcaggagatccgtgtataagtgaatactggcattgggggtagttactagtgccgttcaatcggggaatgactcgggacataacgtctctaatctatatgagggtaccatattcaccgtaaaagactagagtccaatttggcctttcctcttagggaagagagtacaaaccgaaaacctggcgatcacgcctgcacagcagaatcttgcctcgtttgtgtatcattgtggcagaggagcctttaagacatgcgaatagatcgaattc
[配列番号20]
gattttgtcgtaaaacgatcatcatgagatcaagttcgtagaagccctgtcatatttaggagtttgatgatcggcgcgagtgtaagtagcacaccgtattccaccgtgtttacctaacgcgactgcacagtactggcaggtaacgtacaaactcatacaagggtttccacctctggcatgcttcttcggtatctcgttcgatgtcgcattaatgcgttgaggaatggggttcatctggtcagggtctgaccgtttgtaaactaggtgacgagcctgcggacctgatgtttaatctagcgccctttatggaaatctgttacgcgcagccagatgtgttgtatcgagggatgtctaggtcctacacgcgacgatgaaacgggttcgtgtcggataggaattc
参照文献
先に引用される全ての特許及び出版物は、それらの全体を引用することにより本明細書の一部をなす。
23andMe. http://blog.23andme.com/23andme-and-you/update-from-23andme/
Akmaev VR, WangCJ. (2004) Bioinformatics 20:1254-1263.
De Bruyn A,Martin DP, Lefeuvre P. (2014) Methods Mol. Biol. 1115:257-277.
Hamady M, WalkerJJ, Harris JK, Gold NJ, Knight R. (2008) Nat Methods 5:235-237.
Buschmann T,Bystrykh LV. (2013) BMC Bioinformatics 14:272.
Sambrook andRussel: 'Molecular Cloning: A Laboratory Manual', 3rd Edition, 2001, ColdSpring Harbor Laboratory Press.
Norton et al.,(2015) N. Engl. J. Med 372:1589-1597.
Taylor et al.(2015) Nat. Genetics 47:717-726.
図面訳
図1
HYBRIDIZATION ハイブリダイゼーション
DNA SYNTHESIS DNA合成
LIGATION ライゲーション

図2
Constant flankingsequence 定常隣接配列
Minimalnucleotide barcode sequence 最小ヌクレオチドバーコード配列
PRIMERHYBRIDIZATION+DNA POLYMERIZATION プライマーハイブリダイゼーション+DNA重合
OLIGONUCLEOTIDEHYBRIDIZATION オリゴヌクレオチドハイブリダイゼーション
DNAPOLYMERIZATION DNA重合

図3
Constant FlankingSequence 定常隣接配列
CapturingSequence 捕捉配列
ExtractingSequence 抽出配列
Linker Sequence リンカー配列
MinimalNucleotide Barcode sequence 最小ヌクレオチドバーコード配列
AmplificationPrimer binding site 増幅プライマー結合部位
Amplification andSequencing Primer binding site 増幅及び配列決定プライマー結合部位
NucleotideBarcode Sequence Identifier Sequence ヌクレオチドバーコード配列識別子配列

図4
Upstream constantflanking sequence 上流定常隣接配列
Minimalnucleotide barcode sequence 最小ヌクレオチドバーコード配列
Downstreamconstant flanking sequence 下流定常隣接配列
Recognition sitefor restriction enzyme 3 制限酵素に対する認識部位3
Circularnucleotide barcode plasmid 環状ヌクレオチドバーコードプラスミド
RE3 linearizednucleotide barcode sequence RE3直線化ヌクレオチドバーコード配列

図5A
Minimalnucleotide barcode sequence 最小ヌクレオチドバーコード配列
Upstream constantflanking sequence 上流定常隣接配列
Downstreamconstant flanking sequence 下流定常隣接配列
First PCR step 第1のPCR工程
Second PCR step 第2のPCR工程
Amplicon-specificsequence 1 アンプリコン特異的配列1
Constant Sequence1 定常配列1
Pooling Barcode 1 プール化バーコード1
binding site foramplification and sequencing primer 1 増幅及び配列決定プライマー1に対する結合部位

図5B
Minimalnucleotide barcode sequence 最小ヌクレオチドバーコード配列
Upstream constantsequence 上流定常配列
Downstreamconstant sequence 下流定常配列
Primer-extension-ligation プライマー伸長ライゲーション
PCR step PCR工程
Amplicon-specificsequence 1 アンプリコン特異的配列1
constant sequence1 定常配列1
pooling barcode 1 プール化バーコード1
binding site forsequencing primer 1 配列決定プライマー1に対する結合部位

図5C
Minimalnucleotide barcode sequence 最小ヌクレオチドバーコード配列
Upstream constantflanking sequence 上流定常隣接配列
Downstreamconstant flanking sequence 下流定常隣接配列
fragment フラグメント
ligate ライゲート
Hybridizationwith biotinylated oligonucleotide with binding site in constant sequenceflanking the minimal nucleotide barcode sequence 最小ヌクレオチドバーコード配列に隣接する定常配列中の結合部位を含むビオチン化オリゴヌクレオチドとのハイブリダイゼーション
Bead capture(streptavidin-coated magnetic beads) and washing ビーズ捕捉(ストレプトアビジン被覆磁性ビーズ)及び洗浄
Amplicon-specificsequence 1 アンプリコン特異的配列1
Constant Sequence1 定常配列1
Pooling Barcode 1 プール化バーコード1
bindingsite for amplification and sequencing primer 1 増幅及び配列決定プライマー1に対する結合部位

図6
MultiplexReaction 多重反応
Minimalnucleotide barcode sequence 最小ヌクレオチドバーコード配列
genomicDNA ゲノムDNA
+andother primers for amplifying target regions in genomic DNA +及びゲノムDNA中の標的領域を増幅するための他のプライマー
other multiplex 1target amplicons 他の多重1標的アンプリコン
other multiplex 2target amplicons 他の多重2標的アンプリコン
Amplicon-specificsequence 1a アンプリコン特異的配列1a
Constant Sequence1 定常配列1
Pooling Barcode 1 プール化バーコード1
binding site foramplification en sequencing primer 1 増幅及び(and)配列決定プライマー1に対する結合部位

図7A
No sample switch,no contamination 試料入れ替わりなし、汚染なし
Patient 患者
molecularidentification barcode 分子識別バーコード
Target DNA region 標的DNA領域
Genome ゲノム
Nucleotidebarcode sequence ヌクレオチドバーコード配列

図7B
Sample switchoccurred in the workflows between samples 1 and 4 試料1と試料4との間のワークフローで生じた試料入れ替わり
Patient 患者
molecularidentification barcode 分子識別バーコード
Target DNA region 標的DNA領域
Genome ゲノム
Nucleotidebarcode sequence ヌクレオチドバーコード配列

図7C
Sample 4 became contaminatedwith sample 1 somewhere in the workflow ワークフローのどこかで試料4が試料1で汚染された
Patient 患者
molecular identificationbarcode 分子識別バーコード
Target DNA region 標的DNA領域
Genome ゲノム
Nucleotidebarcode sequence ヌクレオチドバーコード配列

図8
Macroscopicbarcode label associated with transferable molecular identification barcode 移動可能な分子識別バーコードと関連付けられた巨視的なバーコードラベル
Take blood sample 血液試料の採取
MacroscopicPatient (hospital) label 巨視的な患者(病院)ラベル
Solution withtransferable molecular identification barcode 移動可能な分子識別バーコードを含む溶液
Scan bothmacroscopic barcode labels 両方の巨視的なバーコードラベルをスキャンする
Also transferablemolecular identification barcode (through the associated macroscopic paperbarcode) is now connected to patient information in local (hospital) LIMSsystem また、移動可能な分子識別バーコード(関連付けられた巨視的な紙面バーコードによって)がここで地方(病院)のLIMSシステムにおける患者情報と接続される
Manymanipulations and transfer steps 多くの操作及び移動工程
DNA extraction DNA抽出
+enrichment oligo's(amplification or capturing) +オリゴ濃縮(増幅又は捕捉)
DNA targetenrichment DNA標的の濃縮
Highly ParallelSequencing 高度並行配列決定
Sequence reads 配列の読取り
Cloud serverdatabase クラウドサーバーデータベース
Submitmacroscopic barcode label of used transferable molecular barcode 使用した移動可能な分子バーコードの巨視的なバーコードラベルを提示
No patientprivacy issues: 患者のプライバシーの問題はない:
Cloud serverreceives no hospital patient code or information クラウドサーバーは病院患者コードも情報も受け取らない
Associatedminimal nucleotide barcode sequences 関連付けられた最小ヌクレオチドバーコード配列
Nucleotidebarcode reads ヌクレオチドバーコードの読取り
Compare/verify: 照合/確認:
Expectedsequences: yes 予想配列:あり
Additionalsequences: no 追加配列:なし
no sample switch,no contamination 試料入れ替わりなし、汚染なし
DNA target reads DNA標的の読取り
Genetic testresult 遺伝子検査の結果
Genetic testresult is valid 遺伝子検査の結果は有効である
Genetic Report 遺伝子レポート
Automatic sinceall barcodes are LIMS connected 全てのバーコードがLIMS接続されているため自動

図9
Vacutainer with bloodsample with macroscopic patient (hospital) label 巨視的な患者(病院)ラベルを有する、血液試料を含むVacutainer
Transfer barcodesolution and macroscopic barcode label バーコード溶液及び巨視的なバーコードラベルを移す
Microtube withtransferable molecular identification barcode solution and associatedmacroscopic barcode label 移動可能な分子識別バーコード溶液を含み、関連付けられた巨視的なバーコードラベルを有する、マイクロチューブ
Scan bothmacroscopic barcode labels 両方の巨視的なバーコードラベルをスキャンする
Also transferablemolecular identification barcode (through the associated macroscopic paperbarcode) is now connected to patient information in local (hospital) LIMSsystem また、移動可能な分子識別バーコード(関連付けられた巨視的な紙面バーコードによって)がここで地方(病院)のLIMSシステムにおける患者情報と接続される
Manymanipulations and transfer steps 多くの操作及び移動工程
DNA extraction DNA抽出
+enrichment oligo's(amplification or capturing) +オリゴ濃縮(増幅又は捕捉)
DNA targetenrichment DNA標的の濃縮
Highly ParallelSequencing 高度並行配列決定
Sequence reads 配列の読取り
Cloud serverdatabase クラウドサーバーデータベース
Submitmacroscopic barcode label of used transferable molecular barcode 使用した移動可能な分子バーコードの巨視的なバーコードラベルを提示
Associatedminimal nucleotide barcode sequences 関連付けられた最小ヌクレオチドバーコード配列
Nucleotidebarcode reads ヌクレオチドバーコードの読取り
Compare/verify: 照合/確認:
Expectedsequences: yes 予想配列:あり
Additionalsequences: no 追加配列:なし
no sample switch,no contamination 試料入れ替わりなし、汚染なし
DNA target reads DNA標的の読取り
Genetic testresult 遺伝子検査の結果
Genetic testresult is valid 遺伝子検査の結果は有効である
Genetic Report 遺伝子レポート
Automatic sinceall barcodes are LIMS connected 全てのバーコードがLIMS接続されているため自動

図10
Take blood sample 血液試料の採取
Patient(hospital) label 患者(病院)ラベル
Scan bothmacroscopic barcode labels 両方の巨視的なバーコードラベルをスキャンする
Also transferablemolecular identification barcode (through the associated macroscopic paperbarcode) is now connected to patient information in local (hospital) LIMSsystem また、移動可能な分子識別バーコード(関連付けられた巨視的な紙面バーコードによって)がここで地方(病院)のLIMSシステムにおける患者情報と接続される
Manymanipulations and transfer steps 多くの操作及び移動工程
DNA extraction DNA抽出
+enrichment oligo's(amplification or capturing) +オリゴ濃縮(増幅又は捕捉)
DNA targetenrichment DNA標的の濃縮
Highly ParallelSequencing 高度並行配列決定
Sequence reads 配列の読取り
Cloud serverdatabase クラウドサーバーデータベース
Present withmacroscopic barcode label of used transferable molecular barcode 使用した移動可能な分子バーコードの巨視的なバーコードラベルと共に提示
Nucleotidebarcode reads ヌクレオチドバーコードの読取り
Compare/verify: 照合/確認:
Expectedsequences: yes 予想配列:あり
Additionalsequences: no 追加配列:なし
no sample switch,no contamination 試料入れ替わりなし、汚染なし
No sample switch 試料入れ替わりなし
Proceed withactual bioinformatic analysis of sequence reads of patient sample 患者試料の配列読取りの実際のバイオインフォマティクス分析を進める
Bioinformaticanalysis of sequence reads under investigation 調査対象の配列読取りのバイオインフォマティクス分析
Genetic testresult 遺伝子検査の結果

図11
DNA extractionfacility DNA抽出設備
NGS facility NGS設備
Contamination 汚染
No 無
Blood 血液
Sample 試料
During DNAextraction DNA抽出の間
During NGSpreparation/sequencing NGS調製/配列決定の間

Claims (19)

  1. 核酸を含む複数の生体試料のアイデンティティを識別する方法であって、
    基体又は容器である、核酸を含む生体試料を各々が含有する複数の担体を準備する工程であって、
    ここで、各担体が、前記核酸を含む試料に加えて、前記担体を標識するための少なくとも2つのヌクレオチドバーコード核酸を含み、
    これらの少なくとも2つのヌクレオチドバーコード核酸の各々が、少なくとも4ヌクレオチド長の異なる最小ヌクレオチドバーコード配列を含み、
    ここで前記異なるヌクレオチドバーコード核酸の少なくとも2つが同じ長さの最小ヌクレオチドバーコード配列を有し、
    これらの異なるヌクレオチドバーコード核酸の組み合わせが、前記核酸を含む生体試料を各々が含有する担体の独自の識別のための移動可能な分子識別バーコードによって、各移動可能な分子識別バーコードが前記担体の各々に対して異なり、
    前記少なくとも2つのヌクレオチドバーコード核酸中の前記最小ヌクレオチドバーコード配列の片側又は両側に全てのヌクレオチドバーコード核酸において同一である非ウイルス性及び非細菌性のヌクレオチドバーコード配列識別子配列が隣接し、
    片側又は両側に全てのヌクレオチドバーコード核酸において同一である非ウイルス性及び非細菌性の抽出配列が隣接することを特徴とし、これらが前記最小ヌクレオチドバーコード配列の識別を可能として、
    各担体が、前記担体に貼り付けられた移動可能な分子識別バーコードに対応する巨視的なバーコードラベルを含む、工程と、
    前記生体試料の前記核酸中の1以上の標的配列を配列決定するとともに、前記最小ヌクレオチドバーコード配列を含む前記ヌクレオチドバーコード核酸中の標的配列を配列決定する工程であって、
    前記生体試料の前記核酸中の前記標的配列の配列決定、及び前記最小ヌクレオチドバーコード配列を含む前記ヌクレオチドバーコード核酸の標的配列の配列決定が並行配列決定法によって行われ、
    前記並行配列決定法が、前記生体試料の前記核酸中の標的配列、及び前記最小ヌクレオチドバーコード配列を含む前記ヌクレオチドバーコード核酸の標的配列をプールすることによって進められる、工程、又は異なる試料に由来する、前記生体試料の前記核酸中の標的配列、及び前記最小ヌクレオチドバーコード配列を含む前記ヌクレオチドバーコード核酸の標的配列をプールすることによって進められる、工程と、
    られた配列データから、ヌクレオチドバーコード核酸に由来する前記配列を特定し、選択する工程であって、前記得られた配列データから、ヌクレオチドバーコード核酸に由来するそれらの配列を選択する工程を含み、
    前記選択工程が、前記最小ヌクレオチドバーコード配列に近接した1以上のヌクレオチドバーコード配列識別子配列を有する配列の識別を含む、工程と、
    ヌクレオチドバーコード配列識別子配列を有する離された配列内の前記最小ヌクレオチドバーコード配列を特定し、選択する工程であって、
    規定の長さで2つの抽出配列間に存在する前記配列を選択し、又は規定の長さで1つの抽出配列に近接して存在する前記配列を選択し、
    これらの選択された配列を最小ヌクレオチドバーコード配列として特定する工程を含む、工程と、
    前記特定された最小ヌクレオチドバーコード配列と、想される最小ヌクレオチドバーコード配列とを、前記担体によって提供される巨視的なバーコードラベルに基づいて照合することにより、前記試料のアイデンティティ及び/又は汚染を識別する工程と、
    を含む、方法。
  2. 前記試料中の的核酸に対して、及び前記最小ヌクレオチドバーコード配列を含む前記核酸に対してアダプターを連結する工程を含むとともに、
    前記標的配列及び前記最小ヌクレオチドバーコード配列を、結生成物を配列決定テンプレートとして使用して配列決定する工程を含む、請求項1に記載の方法。
  3. 前記核酸試料中の標的配列の濃縮工程を行うとともに、前記最小ヌクレオチドバーコード配列の濃縮工程を行う工程を含む、請求項1又は2に記載の方法。
  4. 前記濃縮工程が捕捉又は増幅を用いて行われる工程であって、前記増幅が、1段階PCR、2段階PCR、プライマー伸長に続くライゲーション及びPCR、並びに環状化に基づく増幅ら選択される、請求項3に記載の方法。
  5. 試料の前記標的配列に対して、試料特異的プール化バーコードを付着させる工程、又は試料特異的プール化バーコードを付着させる工程であって、前記試料中の前記最小ヌクレオチドバーコード配列を含む前記核酸に対しても、同じ試料特異的プール化バーコードを付着させる、工程を含む、請求項1~4のいずれか一項に記載の方法。
  6. 物品を標識するための核酸を含む、基体又は容器である担体の収集物であって、
    各担体が、標識のため、試料核酸以外に、少なくとも2つのヌクレオチドバーコード核酸を含み、
    各ヌクレオチドバーコード核酸が少なくとも4ヌクレオチド長の異なる最小ヌクレオチドバーコード配列を含み、
    ここで、前記異なるヌクレオチドバーコード核酸の少なくとも2つが同じ長さの最小ヌクレオチドバーコード配列を有し、
    これらの異なるヌクレオチドバーコード核酸の組み合わせが、前記核酸を含む生体試料を各々が含有する担体の固有の識別のための移動可能な分子識別バーコードよって、かかる各移動可能な分子識別バーコードが前記収集物における前記担体の各々に対して異なり、
    前記少なくとも2つのヌクレオチドバーコード核酸中の前記最小ヌクレオチドバーコード配列の片側若しくは両側に、全てのヌクレオチドバーコード核酸において同一である非ウイルス性及び非細菌性のヌクレオチドバーコード配列識別子配列が隣接する、及び/又は片側若しくは両側に、全てのヌクレオチドバーコード核酸において同一である非ウイルス性及び非細菌性の抽出配列が隣接することを特徴とし、これらが前記最小ヌクレオチドバーコード配列の識別を可能とし、
    各担体が、前記担体に貼り付けられた前記移動可能な分子識別バーコードに対応する巨視的なバーコードラベルを含む、担体の収集物。
  7. 前記収集物が少なくとも100個の担体、又は少なくとも10000個の担体を含んでなる、請求項6に記載の担体の収集物。
  8. 標識のための前記ヌクレオチドバーコード核酸が核酸をRNAに転写するための配列を含まない、請求項6又は7に記載の収集物。
  9. 前記試料がDNA含有試料又はRNA含有試料である、請求項6~8のいずれか一項に記載の担体の収集物。
  10. 前記最小ヌクレオチドバーコード配列に、増幅によって前記最小ヌクレオチドバーコード配列を濃縮するためのオリゴヌクレオチド配列が隣接し、又は、
    前記最小ヌクレオチドバーコード配列の片側若しくは両側に1以上のオリゴヌクレオチド結合配列が隣接し、
    これらが前記最小ヌクレオチドバーコード配列中の片方又は両方のオリゴヌクレオチド結合配列におけるハイブリダイゼーションに基づく配列捕捉を可能とする、請求項6~9のいずれか一項に記載の担体の収集物。
  11. 前記ヌクレオチドバーコード核酸がクローニングベクターのフラグメント中に含まれる、請求項6~10のいずれか一項に記載の担体の収集物。
  12. 前記ベクター又はベクターフラグメントが、配列番号1~配列番号20からなる群から選択される配列を含む、又は前記ベクター又はベクターフラグメントが、配列番号1及び配列番号11の配列を含む、請求項11に記載の担体の収集物。
  13. 前記最小ヌクレオチドバーコード配列を含む核酸を捕捉および/又は増幅するため、1以上のプライマーを更に含む、請求項6~12のいずれか一項に記載の担体の収集物。
  14. 移動可能な分子識別バーコードを含む、基体又は容器である担体の収集物を作製する方法であって、
    a)少なくとも4ヌクレオチドの最小ヌクレオチドバーコード配列を含む、異なるヌクレオチドバーコード核酸の第1の収集物を準備する工程であって、
    前記異なるヌクレオチドバーコード核酸の少なくとも2つが同じ長さの最小ヌクレオチドバーコード配列を有し、
    その前記最小ヌクレオチドバーコード配列が、前記収集物中の前記ヌクレオチドバーコード核酸の間で、並びに1以上の非ウイルス性及び非細菌性のヌクレオチドバーコード配列識別子配列及び/又は1以上の非ウイルス性及び非細菌性の抽出配列で異なり、これらがヌクレオチドバーコード核酸中の前記最小ヌクレオチドバーコード配列の識別を可能とする、工程と、
    b)工程a)の前記ヌクレオチドバーコード核酸の少なくとも2つの組み合わせを各担体に添加して、最小ヌクレオチドバーコード配列のミックスにおける相違によって定義される独自の移動可能な分子識別バーコードを各々有する担体の収集物を得る工程と、
    c)各担体を、前記最小ヌクレオチドバーコード配列の異なるミックスによって定義される前記移動可能な分子識別バーコードに対応する巨視的なバーコードラベルで標識する工程と、
    d)前記巨視的なラベルと、前記小ヌクレオチドバーコード配列のミックスを含む前記移動可能な分子識別バーコードの関係を保存する工程と、
    を含む、方法。
  15. 前記少なくとも2つのヌクレオチドバーコード核酸中の前記最小ヌクレオチドバーコード配列の片側若しくは両側に、全てのヌクレオチドバーコード核酸において同一である非ウイルス性及び非細菌性のヌクレオチドバーコード配列識別子配列が隣接する、及び/又は片側若しくは両側に、全てのヌクレオチドバーコード核酸において同一である非ウイルス性及び非細菌性の抽出配列が隣接する、請求項14に記載の方法。
  16. 前記ヌクレオチドバーコード核酸が配列番号1~配列番号20からなる群から選択される配列を含む、又は前記ヌクレオチドバーコード核酸が配列番号1及び配列番号11の配列を含む、請求項14又は15に記載の方法。
  17. 移動可能な分子識別バーコードを含む、基体又は容器である担体の収集物を作製する方法であって、
    a)宿主において核酸ベクターの第1の収集物を準備する工程によってヌクレオチドバーコード配列を含むベクターを有する宿主の収集物を作製する工程であって、
    前記ベクターが、前記収集物中のヌクレオチドバーコード核酸ベクター間で異なる少なくとも4ヌクレオチド長の最小ヌクレオチドバーコード配列を有するヌクレオチドバーコード配列を含み、
    前記異なるヌクレオチドバーコード配列の少なくとも2つが、同じ長さの最小ヌクレオチドバーコード配列を有して、前記最小ヌクレオチドバーコード配列の片側又は両側に、1以上の非ウイルス性及び非細菌性のヌクレオチドバーコード配列識別子配列、及び/又は1以上の非ウイルス性及び非細菌性の抽出配列を含み、これらが前記最小ヌクレオチドバーコード配列の識別を可能とする、工程と、
    前記宿主の個々のコロニーを準備し、複数のコロニーに対して、前記核酸ベクター中の前記ヌクレオチドバーコード配列を配列決定して、単離されたコロニーの第2の収集物を得る工程であって、
    各コロニーが異なるヌクレオチドバーコード配列を有する核酸ベクターを含む、工程と、
    b)コロニーの選択のため、前記コロニーから前記ベクターを単離する工程と、
    c)前記担体の収集物中の各担体に、異なるヌクレオチドバーコード配列を有する少なくとも2つの核酸ベクターの組み合わせを添加する工程であって、
    前記核酸ベクターの少なくとも2つが、担体間において、最小ヌクレオチドバーコード配列のミックスにおける相違によって定義される、独自の移動可能な分子識別バーコードを各々有する担体の収集物を得るため、工程b)の同じ長さの最小ヌクレオチドバーコード配列を有し、
    制限酵素によって前記ベクターを断片化する、工程又は制限酵素によって前記ベクターを断片化しない工程と、
    d)各担体を、前記異なる最小ヌクレオチドバーコード配列のミックスによって定義される、前記移動可能な分子識別バーコードに対応する巨視的なバーコードラベルで標識する工程と、
    e)前記巨視的なバーコードラベルと、記最小ヌクレオチドバーコード配列を含む前記移動可能な分子識別バーコードとの関係を保存する工程と、
    を含む、方法。
  18. 前記ベクターが配列番号1~配列番号20からなる群から選択される配列、又は前記ベクターが配列番号1及び配列番号11の配列を含む、請求項17に記載の方法。
  19. 基体又は容器である、担体のセットにおいてヌクレオチドバーコード核酸を追跡する方法であって、
    前記担体を標識するための少なくとも2つのヌクレオチドバーコード核酸を含み、ゲノムDNA又はRNAを含まない、複数の担体を準備する工程であって、
    これらの少なくとも2つのヌクレオチドバーコード核酸の各々が、少なくとも4ヌクレオチド長の異なる最小ヌクレオチドバーコード配列を含み、
    ここで前記異なるヌクレオチドバーコード核酸の少なくとも2つが同じ長さの最小ヌクレオチドバーコード配列を有し、
    これらの異なるヌクレオチドバーコード核酸の組み合わせが、前記核酸を含む生体試料を各々が含有する担体の固有の識別のための移動可能な分子識別バーコードよって、各移動可能な分子識別バーコードが前記担体の各々に対して異なり、
    前記少なくとも2つのヌクレオチドバーコード核酸中の前記最小ヌクレオチドバーコード配列の片側又は両側に、全てのヌクレオチドバーコード核酸において同一である非ウイルス性及び非細菌性のヌクレオチドバーコード配列識別子配列が隣接し、片側又は両側に、全てのヌクレオチドバーコード核酸において同一である非ウイルス性及び非細菌性の抽出配列が隣接することを特徴とし、これらが前記最小ヌクレオチドバーコード配列の識別を可能として、
    各担体が、前記担体に貼り付けられた前記移動可能な分子識別バーコードに対応する巨視的なバーコードラベルを含む、工程と、
    前記最小ヌクレオチドバーコード配列を含む、前記ヌクレオチドバーコード核酸中の標的配列を、並行配列決定法によって配列決定する工程であって、
    前記並行配列決定法が、前記ヌクレオチドバーコード核酸の標的配列をプールすることによって進められる、工程又は、前記最小ヌクレオチドバーコード配列を含む前記ヌクレオチドバーコード核酸の標的配列をプールすることによって進められる、工程と、
    られた配列データから、ヌクレオチドバーコード核酸に由来する前記配列を特定し、選択する工程であって、前記得られた配列データから、ヌクレオチドバーコード核酸に由来するそれらの配列を選択する工程を含み、
    前記選択工程が、前記最小ヌクレオチドバーコード配列に近接した1以上のヌクレオチドバーコード配列識別子配列を有する配列の識別を含む、工程と、
    ヌクレオチドバーコード配列識別子配列を有する離された配列内の前記最小ヌクレオチドバーコード配列を特定し、選択する工程であって、
    規定の長さで2つの抽出配列間に存在する前記配列を選択し、又は規定の長さで1つの抽出配列に近接して存在する前記配列を選択し、これらの選択された配列を最小ヌクレオチドバーコード配列として特定する工程を含む、工程と、
    前記特定された最小ヌクレオチドバーコード配列と、想される最小ヌクレオチドバーコード配列とを、前記担体によって提供される前記巨視的なバーコードラベルに基づいて照合する工程と、
    を含む、方法
JP2019513484A 2016-05-17 2017-05-17 試料を識別する方法 Active JP7071341B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP16169997.0 2016-05-17
EP16169997.0A EP3246412A1 (en) 2016-05-17 2016-05-17 Methods for identification of samples
GBGB1701908.4A GB201701908D0 (en) 2017-02-06 2017-02-06 Methods for identification of samples
GB1701908.4 2017-02-06
PCT/EP2017/061902 WO2017198742A1 (en) 2016-05-17 2017-05-17 Methods for identification of samples

Publications (3)

Publication Number Publication Date
JP2019523652A JP2019523652A (ja) 2019-08-29
JP2019523652A5 JP2019523652A5 (ja) 2020-06-25
JP7071341B2 true JP7071341B2 (ja) 2022-05-18

Family

ID=58992806

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019513484A Active JP7071341B2 (ja) 2016-05-17 2017-05-17 試料を識別する方法

Country Status (8)

Country Link
US (1) US20190300948A1 (ja)
EP (1) EP3458606A1 (ja)
JP (1) JP7071341B2 (ja)
KR (2) KR20230065357A (ja)
CN (1) CN109477141B (ja)
AU (2) AU2017266299A1 (ja)
CA (1) CA3024355A1 (ja)
WO (1) WO2017198742A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT201600103909A1 (it) * 2016-10-17 2018-04-17 Marco Flavio Michele Vismara Sistema e metodo di acquisizione, trasmissione ed elaborazione di dati ematochimici
US11702653B2 (en) 2018-05-21 2023-07-18 Battelle Memorial Institute Control compositions and methods for sequencing
WO2020124003A1 (en) * 2018-12-13 2020-06-18 Battelle Memorial Institute Methods and control compositions for a quantitative polymerase chain reaction
CN117136241A (zh) * 2020-10-06 2023-11-28 核素示踪有限公司 表示数字数据的寡核苷酸
EP4305205A1 (en) * 2021-03-10 2024-01-17 Factorial Diagnostics, Inc. Cell barcoding compositions and methods
GB202108684D0 (en) * 2021-06-17 2021-08-04 Salmotrace As Method of tagging fish and other animals

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003052101A1 (en) 2001-12-14 2003-06-26 Rosetta Inpharmatics, Inc. Sample tracking using molecular barcodes
US20090298049A1 (en) 2003-02-10 2009-12-03 Handylab, Inc. Methods for sample tracking
US20120115154A1 (en) 2004-12-23 2012-05-10 Greg Hampikian Reference markers for biological samples
US20150322508A1 (en) 2012-12-28 2015-11-12 Fleury S.A. Method for complete tracking of a set of biological samples containing dna or rna through molecular barcode identification during laboratorial workflow and kit for collecting biological samples containing dna or rna

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5459073A (en) 1991-05-08 1995-10-17 Streck Laboratories, Inc. Method and composition for preserving antigens and process for utilizing cytological material produced by same
US6030657A (en) 1994-11-01 2000-02-29 Dna Technologies, Inc. Labeling technique for countering product diversion and product counterfeiting
US5776737A (en) 1994-12-22 1998-07-07 Visible Genetics Inc. Method and composition for internal identification of samples
EP1242618B1 (en) 1999-05-06 2006-12-06 Mount Sinai School of Medicine of New York University DNA-based steganography
EP1515267A2 (en) * 2001-03-01 2005-03-16 NTT Data Technology Corporation Method and system for individual authentication and digital signature utilizing article having DNA based ID information mark
GB2390055B (en) 2002-03-22 2005-09-07 Cypher Science Internat Ltd A marking apparatus
US20100285985A1 (en) 2003-04-15 2010-11-11 Applied Dna Sciences, Inc. Methods and Systems for the Generation of Plurality of Security Markers and the Detection Therof
WO2005093641A1 (en) * 2004-03-26 2005-10-06 Universite Libre De Bruxelles Biological samples localisation, identification and tracking, system and method using electronic tag
US20150141264A1 (en) * 2005-05-20 2015-05-21 Apdn (B.V.I.) Inc. In-field dna extraction, detection and authentication methods and systems therefor
US8785130B2 (en) 2005-07-07 2014-07-22 Bio-Id Diagnostic Inc. Use of markers including nucleotide sequence based codes to monitor methods of detection and identification of genetic material
ATE510930T1 (de) 2005-08-02 2011-06-15 Rubicon Genomics Inc Zusammensetzungen und verfahren zur bearbeitung und amplifikation von dna mit verwendung mehrerer enzyme in einer einzigen reaktion
CN101479750A (zh) * 2006-05-11 2009-07-08 奇异编号有限公司 识别目标物的方法,识别标签,适于被识别的目标物以及相关装置和系统
US20080101666A1 (en) * 2006-10-30 2008-05-01 Cytyc Corporation Automated imaging system with slide marking
EP2201143B2 (en) * 2007-09-21 2016-08-24 Katholieke Universiteit Leuven Tools and methods for genetic tests using next generation sequencing
AU2007254626A1 (en) * 2007-12-21 2009-07-09 Canon Kabushiki Kaisha Data encoding and decoding using circular configurations of marks
GB2472371B (en) 2009-04-24 2011-10-26 Selectamark Security Systems Plc Synthetic nucleotide containing compositions for use in security marking of property and/or for marking a thief or attacker
WO2012019765A1 (en) * 2010-08-10 2012-02-16 European Molecular Biology Laboratory (Embl) Methods and systems for tracking samples and sample combinations
GB201100152D0 (en) * 2011-01-06 2011-02-23 Epistem Ltd Genedrive RFID
EP2670863B1 (en) * 2011-01-31 2018-06-27 H. Hoffnabb-La Roche Ag Methods of identifying multiple epitopes in cells
CN103582887B (zh) * 2011-06-07 2017-07-04 皇家飞利浦有限公司 提供核苷酸序列数据的方法和测序装置
EP2847712A4 (en) * 2012-05-09 2015-12-30 Apdn Bvi Inc REVIEW OF PHYSICAL ENDURANCE TAGGANTS USING DIGITAL REPRESENTATIVES AND AUTHENTICATIONS THEREOF
ES2905448T3 (es) * 2012-05-10 2022-04-08 Massachusetts Gen Hospital Métodos para determinar una secuencia nucleotídica
EP2852687A4 (en) * 2012-05-21 2016-10-05 Scripps Research Inst METHODS FOR PREPARING A SAMPLE
WO2014005184A1 (en) 2012-07-06 2014-01-09 Geneworks Technologies Pty Ltd Method of identification using nucleic acid tags
WO2014152775A2 (en) * 2013-03-14 2014-09-25 Certirx Corporation Nucleic acid-based authentication and identification codes
US20150141257A1 (en) * 2013-08-02 2015-05-21 Roche Nimblegen, Inc. Sequence capture method using specialized capture probes (heatseq)
CN105200530A (zh) * 2015-10-13 2015-12-30 北京百迈客生物科技有限公司 一种适用于高通量全基因组测序的多样品混合文库的构建方法
JP2019500856A (ja) * 2015-11-18 2019-01-17 タカラ バイオ ユーエスエー, インコーポレイテッド マルチウェルデバイスから試料をプールするための装置及び方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003052101A1 (en) 2001-12-14 2003-06-26 Rosetta Inpharmatics, Inc. Sample tracking using molecular barcodes
US20090298049A1 (en) 2003-02-10 2009-12-03 Handylab, Inc. Methods for sample tracking
US20120115154A1 (en) 2004-12-23 2012-05-10 Greg Hampikian Reference markers for biological samples
US20150322508A1 (en) 2012-12-28 2015-11-12 Fleury S.A. Method for complete tracking of a set of biological samples containing dna or rna through molecular barcode identification during laboratorial workflow and kit for collecting biological samples containing dna or rna

Also Published As

Publication number Publication date
JP2019523652A (ja) 2019-08-29
WO2017198742A1 (en) 2017-11-23
KR20230065357A (ko) 2023-05-11
CA3024355A1 (en) 2017-11-23
CN109477141A (zh) 2019-03-15
CN109477141B (zh) 2022-07-12
EP3458606A1 (en) 2019-03-27
AU2017266299A1 (en) 2018-12-20
KR20190037203A (ko) 2019-04-05
US20190300948A1 (en) 2019-10-03
AU2023229558A1 (en) 2023-09-28

Similar Documents

Publication Publication Date Title
JP7071341B2 (ja) 試料を識別する方法
JP6803327B2 (ja) 標的化されたシークエンシングからのデジタル測定値
JP2020521486A (ja) シングルセルトランスクリプトームの増幅法
US9809840B2 (en) Reference markers for biological samples
JP7332733B2 (ja) 次世代シークエンシングのための高分子量dnaサンプル追跡タグ
Leboldus et al. Genotype‐by‐sequencing of the plant‐pathogenic fungi P yrenophora teres and S phaerulina musiva utilizing I on T orrent sequence technology
US20230124718A1 (en) Novel adaptor for nucleic acid sequencing and method of use
US20180223350A1 (en) Duplex adapters and duplex sequencing
US20190241946A1 (en) Single end duplex dna sequencing
CN110869515B (zh) 用于基因组重排检测的测序方法
EP3246412A1 (en) Methods for identification of samples
JP2016520326A (ja) マルチプレックス配列決定のための分子バーコード化
JP2019509724A (ja) ヌクレアーゼ保護を使用する直接標的シーケンシングの方法
US11655510B2 (en) Experimentally validated sets of gene specific primers for use in multiplex applications
US10927405B2 (en) Molecular tag attachment and transfer
Song et al. Unexpected Mechanism and Inhibition Effect for Nonspecific Amplification Involving Dynamic Binding of Primers with Background DNA

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200515

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210629

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210928

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20211129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211223

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220413

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220506

R150 Certificate of patent or registration of utility model

Ref document number: 7071341

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150