JP2023519496A

JP2023519496A - 核酸シーケンスのインクリメンタル二次解析

Info

Publication number: JP2023519496A
Application number: JP2022550209A
Authority: JP
Inventors: マイケル・ジェイ・カーニー; ジェイコブス・デ・ビール; スー－リン・ツァオ; パーサ・ムケルジー; ダニエル・ジョセフ・トレイシー
Original assignee: イルミナインコーポレイテッド
Priority date: 2020-03-11
Filing date: 2021-03-11
Publication date: 2023-05-11
Also published as: BR112022015194A2; US20210285043A1; KR20220153007A; AU2021233015A1; WO2021183833A1; CA3167358A1; IL294741A; MX2022010905A; CN115210815A; EP4118656A1

Abstract

核酸シーケンスリードのインクリメンタル二次解析を実行するための、コンピュータプログラムを含む、方法、システム、及び装置。方法は、（ｉ）第１のリード間隔中に核酸シーケンシングデバイスによって生成された複数の第１のリードを記述する第１のデータを取得することと、（ｉｉ）第１のリード間隔の後に実行される第２のリード間隔中に核酸シーケンシングデバイスによって生成された複数の第２のリードを記述する第２のデータを取得することと、第２のデータが取得されている間に、（ａ）核酸シーケンシングデバイスによって、第１のデータをマッピング及びアラインメントユニットに入力として提供することと、（ｂ）マッピング及びアラインメントユニットからアラインメント結果を受け取ることと、（ｃ）受け取られたアラインメント結果を格納することと、その後、（ｉｉｉ）マッピング及びアラインメントユニットに、第２の複数のリードを表す第２のデータの参照シーケンスへのアラインメントを開始するように命令することと、を含む。

Description

関連出願の相互参照
本出願は、２０２０年３月１１日に出願された米国仮特許出願第６２／９８８，３７４号の利益を主張し、その全内容は参照によりその全体が本明細書に組み込まれる。

本開示は、核酸シーケンス解析に関する。

核酸シーケンサは、核酸シーケンシングのプロセスを自動化するように構成された器具である。核酸シーケンシングは、核酸シーケンス中のヌクレオチドの順序を決定するプロセスである。核酸は、デオキシリボ核酸（ｄｅｏｘｙｒｉｂｏｎｕｃｌｅｉｃａｃｉｄ、ＤＮＡ）又はリボ核酸（ｒｉｂｏｎｕｃｌｅｉｃａｃｉｄ、ＲＮＡ）を含み得る。

核酸シーケンサは、核酸サンプルを受け取り、核酸サンプル中のヌクレオチドの順序を表す１つ以上の「リード」と呼ばれる出力データを生成するように構成されている。ＤＮＡサンプル中のヌクレオチドは、グアニン（Ｇ）、シトシン（Ｃ）、アデニン（Ａ）、及びチミン（Ｔ）を任意の組み合わせで含む１つ以上の塩基を含むことができる。ＲＮＡサンプル中のヌクレオチドは、Ｇ、Ｃ、Ａ、及びウラシル（Ｕ）を任意の組み合わせで含む１つ以上の塩基を含むことができる。

ＤＮＡシーケンサによって生成されたリードは、マッピング及びアライニングエンジンを使用して、参照ゲノムのヌクレオチドの既知のシーケンスにマッピングできる。参照ゲノムのヌクレオチドの既知のシーケンスに対するリードのマッピングは、ハッシュテーブルインデックスを使用してマッピング及びアラインメントエンジンによって達成できる。

本開示は、インクリメンタル二次解析を実行するためのシステム、方法、及びコンピュータプログラムに関する。インクリメンタル二次解析は、サンプルの核酸シーケンシングが核酸シーケンサによって完了する前に、サンプルの核酸リードに対して１つ以上の二次解析動作を実行するプロセスに関する。１つ以上の二次解析動作は、核酸リードマッピング、核酸リードアラインメント、バリアントコール、又はこれらの任意の組み合わせを含み得る。

本開示の１つの革新的な態様によれば、核酸シーケンスリードのインクリメンタル二次解析を実行するための方法が開示される。一態様では、方法は、（ｉ）第１のリード間隔中に核酸シーケンシングデバイスによって生成された複数の第１のリードを記述する第１のデータを取得することであって、第１のリードのそれぞれは、ヌクレオチドの第１の順序付けられたシーケンスを表す、ことと、（ｉｉ）第１のリード間隔の後に実行される第２のリード間隔中に核酸シーケンシングデバイスによって生成された複数の第２のリードを記述する第２のデータを取得することであって、第２のリードのそれぞれは、ヌクレオチドの第２の順序付けられたシーケンスを表す、ことと、第２のデータが取得されている間に、（ａ）核酸シーケンシングデバイスによって、第１のデータをマッピング及びアラインメントユニットに入力として提供することと、（ｂ）マッピング及びアラインメントユニットからアラインメント結果を受け取ることと、（ｃ）受け取られたアラインメント結果を格納することと、その後、（ｉｉｉ）マッピング及びアラインメントユニットに、第２の複数のリードを表す第２のデータの参照シーケンスへのアラインメントを開始するように命令することと、のアクションを含む。

他のバージョンは、コンピュータ可読記憶デバイス上に符号化された命令によって定義される方法のアクションを実行するための、対応するシステム、装置、及びコンピュータプログラムを含む。

これらの及び他のバージョンは、任意選択で、以下の特徴のうちの１つ以上を含んでもよい。例えば、いくつかの実装形態では、マッピング及びアラインメントユニットの少なくとも一部は、プログラマブル論理デバイスを使用して実装される。

いくつかの実装形態では、プログラマブル回路は、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）である。

いくつかの実装形態では、マッピング及びアラインメントユニットの少なくとも一部は、特定用途向け集積回路（ＡＳＩＣ）を使用して実装される。

いくつかの実装形態では、マッピング及びアラインメントユニットは、核酸シーケンシングデバイス内に含まれる。

いくつかの実装形態では、第１のリードのうちの１つ以上は、第１のサンプル識別子を表すデータを含み、第２のリードのうちの１つ以上は、第２のサンプル識別子を表すデータを含む。

いくつかの実装形態では、方法は、第２のデータが取得されている間に、少なくとも第１のサンプル識別子又は第２のサンプル識別子に基づいて、１つ以上の第１のリードをそれぞれの群に組織化することと、組織統計を生成することであって、組織統計は、各サンプル識別子に対応する第１のリードの数を示す、ことと、を更に含み得る。

いくつかの実装形態では、方法は、リードのクラスタの第２の部分をアラインメントする前に、又はリードのクラスタの第２の部分をアラインメントする間に、複数の第１のリードに対応する格納されたアラインメント結果を表す出力データを提供することを更に含むことができる。

いくつかの実装形態では、方法は、マッピング及びアラインメントモジュールに、第１の複数のリードを表すデータの参照シーケンスへの後続のアラインメントを開始するように命令することを更に含み得る。

いくつかの実装形態では、方法は、第２のデータを取得している間に、参照シーケンスにアラインメントされた第１の複数のリードを表す第１のデータの可能性のあるバリアントのセットを決定することを更に含み得る。

いくつかの実装形態では、第２の複数のリードを表す第２のデータの少なくとも一部は、第２の複数のリードを表す第２のデータの少なくとも異なる部分を取得している間にアラインメントされる。

いくつかの実装形態では、マッピング及びアラインメントユニットは、第２のデータを完全に取得する前に、所定の数のシーケンシングサイクルで、第２の複数のリードを表す第２のデータのアラインメントを開始するように命令される。

本開示の別の革新的な態様によれば、核酸シーケンスリードのインクリメンタル二次解析を実行するための別の方法が開示される。一態様では、方法は、（ｉ）複数の第１の実体識別子を生成することであって、各実体の第１の識別子は、第１のリード間隔中に生成される特定のリードに対応する、ことと、（ｉｉ）複数の第２の実体識別子を生成することであって、各第２の実体識別子は、第２のリード間隔中に生成される特定のリードに対応する、ことと、（ｉｉｉ）第１のリード間隔中に、複数の異なるサンプルに基づいて、核酸シーケンシングデバイスによって生成された複数の第１のリードを記述する第１のデータを取得することであって、複数の第１のリードのそれぞれは、少なくとも第１の実体識別子又は第２の実体識別子に対応し、第１のデータが取得されている間に、方法は、複数の第１のリードを、第１のリードのそれぞれに関連する第１の実体識別子又は第２の実体識別子に基づいて、組織化された群に組織化することと、核酸シーケンシングデバイスによって、組織化された複数のリードを、ベースコールを参照シーケンスにアラインメントさせるように構成されたマッピング及びアラインメントユニットに提供することと、マッピング及びアラインメントユニットから、アラインメント結果を受け取ることと、受け取られたアラインメント結果を格納することと、を更に含む、ことと、（ｉｖ）第１のリード間隔の後に実行される第２のリード間隔中に、複数の異なるサンプルに基づいて、核酸シーケンシングデバイスによって生成された複数の第２のリードを記述する第２のデータを取得することであって、複数の第２のリードのそれぞれは、少なくとも第１の実体識別子又は第２の実体識別子に対応する、ことと、（ｖ）核酸シーケンシングデバイスによって、第２のデータを、第２のデータを参照シーケンスにアラインメントするように構成されたマッピング及びアラインメントユニットに提供することと、のアクションを含むことができる。

いくつかの実装形態では、複数の第１のリードを組織化することは、各実体識別子に対応するリード数を示すデータを生成することを含む。

いくつかの実装形態では、第２のデータを取得している間に、第１のリードの各組織化されたセットについて、参照シーケンスにアラインメントされた第１のリードの組織化されたセットの可能性のあるバリアントのセットを決定する。

本開示の別の革新的な態様によれば、核酸シーケンスリードのインクリメンタル二次解析を実行するための別の方法が開示される。一態様では、本方法は、第１のシーケンシングランの第１のリード間隔中に、核酸シーケンシングデバイスによって生成された複数の第１のリードを記述する第１のデータを取得することと、第１のリード間隔の後に実行される第１のシーケンシングランの第２のリード間隔中に、核酸シーケンシングデバイスによって生成された複数の第２のリードを記述する第２のデータを取得することと、第２のデータの少なくとも一部を取得している間に、第１のデータ又は第２のデータに対する１つ以上の二次解析動作の実行を開始することと、核酸シーケンシングデバイスを使用して、第２のシーケンシングランを実行することと、核酸シーケンシングデバイスを使用して、第２のシーケンシングランを実行している間に、少なくとも第１のデータ又は第２のデータに対する１つ以上の二次解析動作の実行を継続することと、二次解析動作の結果を表す結果データを格納することと、のアクションを含むことができる。

本開示の別の革新的な態様によれば、核酸シーケンスリードの二次解析を実行するための方法が開示される。一態様では、方法は、１つ以上のゲノムワークフロー属性を取得することと、１つ以上のゲノムワークフロー属性に基づいて、プログラマブル回路のワークフローコンテクストスイッチングタイプを決定することであって、ワークフローコンテクストスイッチングタイプは、プログラマブル回路の再構成サイクルを定義する、ことと、決定されたコンテクストスイッチングタイプを使用して、プログラマブル回路のコントローラに二次解析を実行するように命令することと、のアクションを含むことができる。

別途定義されない限り、本明細書で使用されるすべての技術用語及び科学用語は、本発明が属する技術分野の当業者によって一般的に理解されるものと同じ意味を有する。本明細書に記載されるものと同様又は同等の方法及び材料を本発明の実施又は試験に使用することができるが、好適な方法及び材料が、以下に記載されている。本明細書で言及されるすべての刊行物、特許出願、特許、及び他の参考文献は、参照によりその全体が本明細書に組み込まれる。矛盾が生じる場合、本明細書が、定義を含めて優先する。加えて、材料、方法、及び実施例は、単なる例示であり、限定することを意図するものではない。

本発明の他の特徴及び利点は、以下の発明を実行するための形態、及び特許請求の範囲から明らかとなるであろう。

二次解析動作の線形シーケンスを説明する従来技術のワークフローの一例を示す概略図である。核酸シーケンサ内に位置する二次解析ユニットを使用して、１つ以上のサンプルに対してインクリメンタル二次解析を実行するためのシステムの一例のコンテクスト図である。図１Ｂのワークフロー図に従って、インクリメンタル二次解析を実行するためのプロセスの一例のフローチャートである。核酸シーケンサから離れて位置する二次解析ユニットを使用して、１つ以上のサンプルのインクリメンタル二次解析を実行するためのシステムの一例のコンテクスト図である。図３のワークフロー図に従って、インクリメンタル二次解析を実行するためのプロセスの一例のフローチャートである。核酸シーケンサ内の二次解析ユニットを使用して、１つ以上のサンプルのインクリメンタル二次解析を実行するためのシステムの一例のコンテクスト図である。図５のワークフロー図に従って、インクリメンタル二次解析を実行するためのプロセスの一例のフローチャートである。二次解析ユニットを使用してインクリメンタル二次解析を実行するためのプロセス中に実行される動作のワークフローを説明するワークフロー図の一例である。図７のワークフロー図に従って、インクリメンタル二次解析を実行するためのプロセスの一例のフローチャートである。動的プログラマブル回路コンテクストスイッチングを実行するためのプロセスの一例のフローチャートである。インクリメンタル二次解析を実行するためのシステムを実装するために使用することができるシステム構成要素の一例のブロック図である。

核酸シーケンサによる生体サンプルの核酸シーケンシングは、時間とコストがかかるタスクである。従来のシステムは、図１Ａに示す線形ワークフローなどの線形ワークフローを用いていた。そのような従来のワークフローは、（ｉ）核酸シーケンスリードを生成するための一次解析と、（ｉｉ）アラインメントされたリードとバリアントを生成するための生成された核酸シーケンシングリードの二次解析と、いくつかの場合には、（ｉｉｉ）バリアントコールの間に同定されたバリアントなどの二次解析の結果を用いた三次解析と、を含む動作を、直線的に順番に実行する。三次解析としては、例えば、同定されたバリアントの分類、同定されたバリアントの関連性を決定すること、同定されたバリアントに基づく診断を決定すること、同定されたバリアントに基づく治療を決定すること、などが挙げられる。

図１Ａを参照すると、１つ以上のサンプルのシーケンシングラン１７２Ａを実行する従来のワークフロー１７０Ａが記載されている。シーケンシングラン１７２Ａは、時間Ｔ１中のクラスタリング動作と、時間Ｔ２Ａ中にサンプルの第１のリードを生成するためのシーケンシング動作を含む第１のリード間隔「リード１」と、別の時間Ｔ２Ｂ中にサンプルの第２のリードを生成するためのシーケンシング動作を含む第２のリード間隔「リード２」と、を含む。シーケンシングラン１７２Ａの間、第１の一次解析１００Ａは、データを処理して、第１のリード及び第２のリードを生成する。一次解析１００Ａは、例えば、リードのそれぞれのヌクレオチド又は塩基のシーケンスを生成するための画像の処理を含むことができる。第１の一次解析１００Ａの完了後、二次解析１００Ｂが始まる。図１Ａのこの例では、二次解析１００Ｂは、核酸シーケンサのソフトウェアリソースを使用して実行され、第１のシーケンシングラン１７２Ａの一次解析１００Ａ中に生成されたリードをデマルチプレックスする（ｄｅｍｕｌｔｉｐｌｅｘ）ことと、デマルチプレックスしたリードをマッピング及びアラインメントすることと、その後にバリアントコールすることと、を含み、これらはすべて時間Ｔ３の間に行う。二次解析の完了後にのみ、次の一次解析１００Ｃは核酸シーケンサによって実行することができる。したがって、核酸シーケンサによって従来の二次解析ソフトウェアを使用して従来のワークフローを使用することにより、第１のシーケンシングラン１７２Ａの第１の一次解析１００Ａを開始してから、第２のシーケンシングラン１７２Ｂの第２の一次解析１００Ｃを実行できるまで、少なくともＴＳＵＭ＝Ｔ１＋Ｔ２Ａ＋Ｔ２Ｂ＋Ｔ３、場合により約５６～９９時間、を要する。更に、これにより、シーケンサのダウンタイムが生じ、場合によっては少なくとも３０～４８時間、シーケンサが二次解析を行わず、試薬を消費するため、装置のスループット（一定時間内に処理されるヌクレオチドの数）が低下し、試薬販売による収入源にマイナスの影響を及ぼす。

従来の核酸シーケンサは、一次解析動作及び二次解析動作を並行して実行するための計算リソースを欠くため、従来のシステムはこのように動作する。代わりに、従来の核酸シーケンサのソフトウェア計算リソースは、一次解析中のシーケンシング動作専用であり、その後、これらの同じ計算リソースは、二次解析中のデマルチプレックス、マッピング、アラインメント、及びバリアントコール動作専用となる。いくつかの実装形態では、デマルチプレックスは、ソート動作を含むことができる。

本開示は、ハードウェア回路を使用して１つ以上の二次解析動作を実行するように構成されたハードワイヤードデジタル論理を有するプログラマブル論理ユニットに、二次解析動作の態様をオフロードすることによって、これらの問題に対処する。これは、二次解析動作を実行するために必要な時間、Ｔ３、を劇的に低減させる。更に、本開示は、クラスタリング、一次解析、他のシーケンシング動作、又はこれらの組み合わせ、及び本明細書に記載の二次解析などのシーケンシング動作を並列化し、従来の核酸シーケンシングデバイスを改造して本明細書に記載の並列化ワークフロー動作を実行することにより、第１のシーケンシングラン１７２Ａの開始から第２のシーケンシングラン１７２Ｂの開始までの全体処理時間ＴＳＵＭを削減する。

本開示の技術を使用して、複数の他の利点が得られる。最初に、本開示は、シーケンシングラン中に核酸シーケンサによって使用される試薬を節約するために使用され得る。例えば、シーケンシングラン中に二次解析動作を開始し、シーケンシングが完了する前に二次解析動作の少なくとも一部を完了することによって、本開示は、アラインメント統計、デマルチプレックス統計などの統計を生成し、生成された統計を評価して、一次解析中に生成されたリードの品質を測定することができる。統計が、核酸シーケンサによって生成されたリードの品質が不十分であることを示す場合、そこで一次解析を終了することができ、シーケンサへの入力を再構成することができ、核酸シーケンサを使用した別のシーケンシングランを再度開始することができる。したがって、このプロセスは、低品質のシーケンシングランを完了するためにすべての試薬を使用せずに一次解析シーケンシングランを停止することによって、最初の一次解析シーケンシングラン全体を完了するために費やされたであろう試薬の少なくとも一部を節約することができる。

次に、本開示の並列化されたワークフローは、従来のシステムよりも速く三次解析を開始することを可能にし、それによって特定の診断及び治療をより速く同定することができる。例えば、従来の計算アーキテクチャを使用した従来のワークフローは、場合によっては、三次解析を開始するまでにＴＳＵＭ＝約５６～９９時間かかる。しかしながら、本開示のいくつかの実装形態では、シーケンシングが完了した後、三次解析は、わずか２～１２時間、又は数時間で開始することができる。場合によっては、これは、例えば、患者の症状がウイルス又は細菌に関連するかどうかのより速い決定を提供するなど、特に有利であり得る。しかしながら、場合によっては３～４日掛かるのに対して数時間で治療を決定することが、かなりの効果を提供することができるシナリオは複数存在し、例えば、感染症（又は、他の病気）が不可逆的な損傷を引き起こす前に、患者に抗生物質（又は、他の種類の薬剤や治療）を投与する機会を可能にすることである。

これら及び他の利点は、本開示に記載されている特徴から明らかになるであろう。

図１Ｂは、核酸シーケンサ内に位置する二次解析ユニット１４０を使用して、１つのサンプル１０５に対するインクリメンタル二次解析を実行するためのシステム１００の一例のコンテクスト図である。システム１００は、核酸シーケンサ１１０と、１つ以上のフローセル１２０と、１つ以上の二次解析ユニット１４０と、１つ以上の処理ユニット１５０と、１つ以上のメモリ１６０と、を含む。図１Ｂの例では、二次解析ユニット１４０は、シーケンサ１１０内に位置する。ただし、本開示は、そのように限定されない。代わりに、二次解析ユニット１４０は、ＬＡＮ、ＷＡＮ、セルラネットワーク、インターネット若しくはこれらの任意の組み合わせなどの１つ以上の有線又は無線ネットワークを使用してシーケンサ１１０に通信可能に結合された１つ以上のリモートコンピュータ内に配置することができる。二次解析ユニット１４０は、メモリ１４０、プログラマブル回路１４２、処理ユニット１５０、メモリ１６０、又はこれらの任意の組み合わせを含むことができる。本明細書の目的のために、二次解析は、マッピング動作、アラインメント動作、バリアントコール動作、又はこれらの任意のサブセット若しくは組み合わせを含み得る。いくつかの実装形態では、処理ユニット１５０、メモリ１６０、又はその両方は、二次解析に関連しない他の動作を実行するために、核酸シーケンサによって使用され得る。

核酸シーケンサ１１０の１つ以上の処理ユニット１５０は、ソフトウェア命令によって定義された機能性を実現するために、ソフトウェア命令を実行するように構成された１つ以上のプロセッサを含むことができる。例えば、１つ以上の処理ユニット１５０は、デマルチプレックスユニット１６２の機能を実現するために、メモリ１６０に格納されたデマルチプレックスユニット１６２を定義するソフトウェア命令を取得し実行することができる。１つ以上の処理ユニット１５０は、１つ以上の中央処理ユニット（ｃｅｎｔｒａｌｐｒｏｃｅｓｓｉｎｇｕｎｉｔ、ＣＰＵ）、１つ以上のグラフィック処理ユニット（ｇｒａｐｈｉｃａｌｐｒｏｃｅｓｓｉｎｇｕｎｉｔ、ＧＰＵ）、又はこれらの任意の組み合わせを含むことができる。

「ユニット」という用語は、本明細書では、指定された機能を実行するために使用されるソフトウェアモジュール、ハードウェアモジュール、又は両方の組み合わせを説明するために使用される。本明細書に記載の特定の「ユニット」がハードウェア、ソフトウェア、又は両方の組み合わせであるかどうかの判定は、その使用の文脈に基づいて行うことができる。例えば、プログラマブル回路１４２に常駐する「マッピング及びアラインメントユニット」１４２ａは、ハードウェアユニットであり、その機能は、ハードワイヤードデジタル論理ゲート又はハードワイヤードデジタル論理ブロックによって実現される。別の例として、メモリ１６０に常駐する「デマルチプレックスユニット」１６２は、「デマルチプレックスユニット」１６２を定義するソフトウェア命令を実行する処理ユニット１５０によって機能が実現されるソフトウェアユニットである。別の例として、「処理ユニット」１５０は、ソフトウェア命令を処理することによって機能を実現するハードウェアデバイスであり、したがって、その「処理ユニット」１５０の機能は、ハードウェアとソフトウェアとの組み合わせである。同様に、「二次解析ユニット」１４０は、ハードワイヤードプログラマブル回路１４２ａと相互作用するために使用されるハードウェアとソフトウェアの組み合わせを含むことができる。

核酸シーケンサ１１０は、一次解析などのシーケンシング動作を実行するように構成されているデバイスである。一次解析は、核酸シーケンサ１１０によって、血液サンプル、組織サンプル、又は痰などの生体サンプル１０５を受け取ることと、核酸シーケンサ１１０によって、それぞれが受け取った生体サンプルの核酸シーケンスのヌクレオチドの順序を表す１つ以上のリード１３０－１、１３０－２、１３０－３、１３０－４、１３２－１、１３２－２、１３２－３、１３２－４、１３４－１、１３４－２、１３４－３、１３４－４などの出力データを生成することと、を含み得る。核酸シーケンサ１１０によるシーケンシングは、複数のリード間隔で実行することができ、第１のリード間隔「リード１」は、フローセル１２０に結合したテンプレート核酸断片のクローン群にクローン的に増幅された核酸シーケンス断片（又は、鎖）の第１の部分、又は末端からのヌクレオチドの順序を表す１つ以上の第１のリードを生成し、第２のリード間隔「リード２」は、フローセル１２０に結合したテンプレート核酸断片のクローン群にクローン的に増幅された核酸シーケンス断片の第２の部分、例えば、他端からのヌクレオチドの順序をそれぞれ表す１つ以上の第２のリードを生成する。フローセル１２０に結合したテンプレート核酸断片のそれぞれのクローン群は、本明細書では、クラスタ１１２２－１、クラスタ２１２２－２、クラスタ３１２２－３、クラスタ４１２２－４、クラスタ５１２２－５、クラスタＮ１２２－Ｎなどのクラスタと称され得る。

その結果、各リード間隔中に、単一のリードが、それぞれのクラスタでクローン的に増幅された核酸断片の各末端について、核酸シーケンシングデバイス１１０によって生成されることになる。すなわち、シーケンシングサイクルの第１のリード間隔は、「リード１」を生成し、シーケンシングサイクルの第２のリード間隔は、「リード２」を生成する。いくつかの実装形態では、核酸シーケンスは、リードシーケンスをイメージングする、及びリード配列を決定する、又はリード配列を同定するために同じクラスタ内の核酸断片の複数のクローンをシーケンシングし得る。

したがって、各リードは、特定の核酸シーケンス断片の一部を表す。例えば、約６００ヌクレオチドの短い核酸シーケンス断片を想定すると、第１のリードは、核酸シーケンス断片の第１の末端の１５０の順序付けられたヌクレオチドを表し得、第２のリードは、核酸シーケンス断片のもう一方の末端の１５０の順序付けられたヌクレオチドを表し得る。しかしながら、これらの数は単なる例であり、核酸シーケンサ１１０は、本明細書で言及されるものよりも短い核酸シーケンス、及び異なる長さのそれぞれのリードを生成する本開示の趣旨及び範囲と一致する様式で構成され得る。本開示の原理を当業者に伝えるために、この概念の単純なバージョンを図１Ｂ、図３、及び図５を参照して示す。具体的には、これらの図は、核酸テンプレートがフローセル１２０に結合し、クローン的に増幅されたクラスタ化核酸シーケンス断片のそれぞれの末端の、核酸シーケンサ１１０によって生成されたリードを示す。

いくつかの実装形態では、生体サンプルは、ＤＮＡサンプルを含むことができ、核酸シーケンサ１１０は、ＤＮＡを処理できる。そのような実装形態では、核酸シーケンサによって生成されたリード１３０－１、１３０－２、１３０－３、１３０－４、１３２－１、１３２－２、１３２－３、１３２－４、１３４－１、１３４－２、１３４－３、１３４－４のシーケンシングしたヌクレオチドの順序は、グアニン（Ｇ）、シトシン（Ｃ）、アデニン（Ａ）、及びチミン（Ｔ）のうちの１つ以上を任意の組み合わせで含み得る。他の実装形態では、核酸シーケンサ１１０は、ＲＮＡを処理することができ、生体サンプルは、ＲＮＡサンプルを含むことができる。このようなＲＮＡの実装形態では、核酸シーケンサによって生成されるリード中のシーケンシングされたヌクレオチドの順序は、Ｇ、Ｃ、Ａ、及びウラシル（Ｕ）のうちの１つ以上を任意の組み合わせで含むことができる。したがって、図１の例は、ＤＮＡサンプルに基づいているＧ、Ｃ、Ａ及びＴからなるリードを処理することを記載しているが、本開示はそのように限定されない。代わりに、他の実装形態は、ＲＮＡサンプルに基づいているＣ、Ｇ、Ａ、及びＵからなるリードを処理することができる。

しかしながら、ＲＮＡシーケンシングは、ＲＮＡシーケンサの使用を必要としない。例えば、いくつかの実装形態では、核酸シーケンサ１１０は、Ｇ、Ｃ、Ａ、及びＴのうちの１つ以上を有するサンプル及び生成されたリードをシーケンシングするＤＮＡシーケンサであり得る。そうして、そのような実装形態では、核酸シーケンサ１１０は、生成されたリードをｃＤＮＡに転写して、シーケンシングされたサンプルのＲＮＡを表すことができる。そのような実装形態では、リードは、Ｇ、Ｃ、Ａ、及びウラシル（Ｕ）を任意の組み合わせで含む塩基を使用して表される。

いくつかの実装形態では、核酸シーケンサ１１０は、超並列シーケンシング技術の使用による超高スループット、スケーラビリティ、及び速度を達成する手法で、所与のサンプルについてのリード１３０－１、１３０－２、１３０－３、１３０－４、１３２－１、１３２－２、１３２－３、１３２－４、１３４－１、１３４－２、１３４－３、１３４－４などのシーケンスリードを生成するように構成された次世代シーケンサ（ｎｅｘｔｇｅｎｅｒａｔｉｏｎｓｅｑｕｅｎｃｅｒ、ＮＧＳ）を含むことができる。ＮＧＳは、ゲノム全体の迅速なシーケンシングと、深くシーケンシングされた標的領域にズームするか、ＲＮＡシーケンシング（ＲＮＡ－Ｓｅｑ）を利用して、新規ＲＮＡ変異体及びスプライス部位を発見するか、又は遺伝子発現解析、ゲノムワイドＤＮＡメチル化及びＤＮＡ－タンパク質相互作用などのエピジェネティック因子の解析、希少体変異体及び腫瘍サブクローンを研究するための癌サンプルのシーケンシング、並びにヒト又は環境における微生物多様性の研究のためのｍＲＮＡを定量化する能力と、を可能にする。

核酸シーケンシングリードを生成するプロセスは、サンプル調製、クラスタ生成、及びシーケンシングの段階を含む。第１の段階は、各ＤＮＡ断片の末端にアダプタ配列を付加することを含む、サンプル調製を含む。サイクル増幅の減少により、リードが由来するサンプル、及びフローセル１２０のオリゴに相補的な領域を同定するために使用することができる、任意の必要なインデックスなどの追加のモチーフが導入される。固体支持体上でのサンプル調製の１つ以上の例は、参照によりその全体が本明細書に組み込まれる米国特許第９，６８３，２３０号に記載されている。第２の段階はクラスタリングを含み、各ＤＮＡ断片は、例えば、増幅試薬を使用して等温増幅される。固体支持体上の核酸の等温増幅の１つ以上の例は、参照によりその全体が本明細書に組み込まれる米国特許第７，９７２，８２０号により詳細に記載されている。フローセル１２０は、複数のレーンを有するスライドガラスを含むことができ、各レーンは、２種類のオリゴの芝（ｌａｗｎ）を含む。ハイブリダイゼーションは、２種類のオリゴのうち最初のオリゴがフローセル表面の相補的なオリゴに付着することで可能となる。ポリメラーゼは、ハイブリダイズされた断片の相補体を形成する。ＤＮＡ断片は、架橋増幅などの技術を使用してクローン的に増幅することができる。システム１００及びワークフロー１７０Ｂの実装形態では、クラスタリング段階は、ワークフロー１７０Ｂの時間Ｔ１中に生じる。ただし、本開示は、そのように限定されない。代わりに、いくつかの実装形態では、クラスタリングは、時間Ｔ１の前に開始され実行される、オフ・インスツルメントで実行される、又はその両方であってよい。そのような実装形態では、時間Ｔ１を実行時間計算から除去することができ、シーケンシングランは、例えば、Ｔ２Ａで開始することができる。そのような前Ｔ１及び／又はオフ・インスツルメントでのクラスタリングは、図１のシステム１００、図３のシステム３００、図５のシステム５００、図７のシステム７００、又は本開示の任意の他の実装形態で実装することができる。ブリッジ増幅後、逆断片を切断し、順方向断片のみを残す。

第３の段階は、核酸シーケンサ１１０による時間Ｔ２Ａ及び時間Ｔ２Ｂ中のシーケンシング動作の実行を含む。時間Ｔ２Ａ中、核酸シーケンサ１１０は、第１のリード間隔「リード１」に関してＸサイクルのシーケンシング動作を行い、それぞれのクラスタ１２２－１、１２２－２、１２２－３、１２２－４、１２２－５、１２２－Ｎでクローン的に増幅されたそれぞれの核酸シーケンス断片の第１の末端に対応する第１のリードを生成し、Ｘ及びＮは、ゼロより大きい任意の正の整数であり得る。各ＤＮＡクラスタの第１のリードは、特定のクラスタに関連するそれぞれのＤＮＡの一部に対応するベースコールのストリングを含む。例えば、リード１３０－１は、クラスタ１１２２－１に関連する核酸断片の第１の末端に対応するベースコールのストリングを含み、リード１３０－３は、クラスタ２１２２－２に関連する核酸断片の第１の末端に対応するベースコールのストリングを含み、リード１３２－１は、クラスタ３１２２－３に関連する核酸断片の第１の末端に対応するベースコールのストリングを含み、リード１３２－３は、クラスタ４１２２－４に関連する核酸断片の第１の末端に対応するベースコールのストリングを含み、リード１３４－１は、クラスタ５１２２－５に関連する核酸断片の第１の末端に対応するベースコールのストリングを含み、リード１３４－３は、クラスタＮ１２２－Ｎに関連する核酸断片の第１の末端に対応するベースコールのストリングを含む。各ベースコールは、ヌクレオチドに対応する、又はヌクレオチドを表す。これらのリードは、合成によるシーケンシングなどのシーケンシングプロセスを使用して生成することができる。リード１３０－１、１３０－３、１３２－１、１３２－３、１３４－１、及び１３４－３を表すデータは、核酸シーケンサ１１０のメモリ１６０への出力、二次解析ユニット１４０のメモリ１４４への入力、又はその両方であり得る。

システム１００及び図１Ｂの実装形態では、ワークフロー１７０Ｂの第１のリード間隔の時間Ｔ２Ａ中にシーケンシングされたこれらの第１のリード１３０－１、１３０－３、１３２－１、１３２－３、１３４－１、及び１３４－３は、各クラスタに関連するＤＮＡ断片の第１の末端のヌクレオチドの数を表す。例えば、いくつかの実装形態では、核酸シーケンサ１１０によってシーケンシングされたＤＮＡ断片は、６００のヌクレオチドを含み得る。第１のリード１３０－１、１３０－３、１３２－１、１３２－３、１３４－１、及び１３４－３クラスタは、例えば、それぞれのクラスタで増幅された６００のヌクレオチドＤＮＡ断片の第１の末端の最初の１５０のヌクレオチドを表し得る。各リード間隔は、数百万個のＤＮＡ断片のクラスタのうちの数百個を同時にシーケンシングする、大規模並行プロセスである。第１のリード間隔がＴ２Ａの終了時に完了すると、核酸シーケンサ１１０は、各クラスタの各ＤＮＡ断片の反対側の末端をシーケンシングする時間Ｔ２Ｂの間に第２のリード間隔を開始し、第２のリード１３０－２、１３０－４、１３２－２、１３２－４、１３４－２、１３４－４を生成することができる。例として、リード１３０－２は、クラスタ１１２２－１に関連する核酸断片の第２の末端に対応するベースコールのストリングを含み、リード１３０－４は、クラスタ２１２２－２に関連する核酸断片の第２の末端に対応するベースコールのストリングを含み、リード１３２－２は、クラスタ３１２２－３に関連する核酸断片の第２の末端に対応するベースコールのストリングを含み、リード１３２－４は、クラスタ４１２２－４に関連する核酸断片の第２の末端に対応するベースコールのストリングを含み、リード１３４－２は、クラスタ５１２２－５に関連する核酸断片の第２の末端に対応するベースコールのストリングを含み、リード１３４－４は、クラスタＮ１２２－Ｎに関連する核酸断片の第２の末端に対応するベースコールのストリングを含む。システム１００及び図１のこの実装形態では、第２のリード間隔は、ワークフロー１７０Ｂのおよそ時間＝Ｔ１＋Ｔ２Ａで開始される。

図１Ａを参照して説明した従来のシステムでは、第１のリード１３０－１、１３０－３、１３２－１、１３２－３、１３４－１、及び１３４－３のマッピング及びアライニングなどの二次解析動作は、時間＝Ｔ１＋Ｔ２Ａ＋Ｔ２Ｂの終了時で第２のリード間隔「リード２」が終了する後まで生じない。しかしながら、本開示によって説明される図１Ｂのシステム１００は、時間＝Ｔ１＋Ｔ２Ａにて、第１のリード１３０－１、１３０－３、１３２－１、１３２－３、１３４－１、１３４－３の二次解析動作を開始するように構成され、第２のリード間隔「リード２」の間に、第１のリード１３０－１、１３０－３、１３２－１、１３２－３、１３４－１、１３４－３の二次解析が始まって実行され、一方で核酸シーケンサ１１０は、第２のリード間隔「リード２」のシーケンシング動作を行い、第２のリード１３０－２、１３０－４、１３２－２、１３２－４、１３４－２、１３４－４を生成する。

システム１００は、第１のリードの二次解析動作を二次解析ユニット１４０のプログラマブル回路１４２ａにオフロードすることによって、この並列処理の利点を得る。二次解析ユニット１４０に二次解析動作をオフロードすることで、核酸シーケンサ１１０の処理ユニット１５０、メモリ１６０、又はその両方を解放し、第２のリード間隔「リード２」の一次解析動作の実行を継続して、第１のリードのうちの１つ以上の二次解析が実行されている間に、ＤＮＡクラスタの反対側の末端をシーケンシングすることにより、第２のリード１３０－２、１３０－４、１３２－２、１３２－４、１３４－２、１３４－４を生成する。したがって、本開示は、一次解析などのシーケンシング動作を、１つ以上の二次解析動作と並行して行うことを可能にする。

二次解析ユニット１４０は、１つ以上の二次解析動作を実行するために、マッピング及びアラインメントユニット１４２ａなどの１つ以上の二次解析動作ユニットを含むように動的に構成され得るプログラマブル回路１４２を含む。マッピング及びアラインメントユニット１４２ａなどの二次解析動作ユニットを含むように、プログラマブル回路１４２を動的に構成することは、例えば、プログラマブル回路１４２に１つ以上の命令を提供することを含むことができ、この１つ以上の命令は、プログラマブル回路１４２に、プログラマブル回路１４２のハードウェア論理ゲートを、マッピング及びアラインメントユニット１４２ａの機能をハードウェア論理で実現するように構成されたハードワイヤードデジタル論理構成として構成させる。プログラマブル回路１４２のハードウェア論理ゲートは、コンパイルしたハードウェア記述言語コードなどを使用して実現され得る。プログラマブル回路１４２の初期構成及びプログラマブル回路１４２のその後の再構成は、プログラマブル回路１４２のホストである核酸シーケンサ１１０又は他のコンピュータによって満たされるソフトウェアトリガの実行によって開始することができる。例えば、図１Ｂのシステム１００の実装形態では、リード１間隔サイクルの終了時に、核酸シーケンサ１１０又はプログラマブル回路１４２のホストである他のコンピュータは、プログラマブル回路の再構成をトリガしてマッピング及びアラインメント動作を実行するソフトウェア命令を実行することができる。前述のソフトウェアトリガのそのような実行は、例えば、プログラマブル回路制御によって実行され、プログラマブル回路１４２の論理ゲートの再構成を引き起こし得るプログラマブル回路１４２のメモリへのコンパイルされたハードウェア記述言語コードのロードを引き起こすことができる。マッピング及びアラインメントユニット１４２ａの構成された機能は、第１リード１３０－１、１３０－３、１Ｓ３２－１、１３２－３、１３４－１、１３４－３などの１つ以上のリードを取得することと、得られた第１のリード１３０－１、１３０－３、１３２－１、１３２－３、１３４－１、１３４－３を１つ以上の参照シーケンス位置にマッピングすることと、次に、マッピングされた第１のリード１３０－１、１３０－３、１３２－１、１３２－３、１３４－１、１３４－３を１つ以上の参照シーケンス位置にアラインメントさせることと、を含むことができる。参照シーケンスは、既知のゲノムに対応する組織化された一連のヌクレオチドを含むことができる。

１つ以上の命令に応答して、プログラマブル回路１４２のハードウェア論理ゲートを構成することは、マッピング及びアラインメントユニット１４２ａのデジタル論理機能を実行するために、ＡＮＤゲート、ＯＲゲート、ＮＯＲゲート、ＸＯＲゲート、又はこれらの任意の組み合わせなどの論理ゲートを構成すること、を含むことができる。マッピング及びアラインメントユニットの機能を実行するためのＦＰＧＡなどのプログラマブル論理回路の使用の例は、例えば、米国特許第９，６７９，１０４号、又は米国特許出願公開第２０２０／０３７２０３１号により詳細に記載されており、これらのそれぞれは、その全体が参照により本明細書に組み込まれる。あるいは、又は加えて、ハードウェア論理ゲートを構成することは、加算、乗算、比較などを含む複雑な計算動作を実行するためのカスタマイズ可能なハードウェア論理ユニットを含む動的に構成された論理ブロックを含むことができる。ハードウェア論理ゲート、論理ブロック、又はこれらの組み合わせの正確な構成は、受け取られた命令によって定義される。受け取られた命令は、エンティティによって書かれ、プログラムされる二次解析動作ユニットの概略レイアウトを定義するコンパイルされたハードウェア記述言語（ｈａｒｄｗａｒｅｄｅｓｃｒｉｐｔｉｏｎｌａｎｇｕａｇｅ、ＨＤＬ）プログラムコードを含むことができるか、又はコンパイルされたハードウェア記述言語プログラムコードから生成され得る。ＨＤＬプログラムコードは、超高速集積回路ハードウェア記述言語（ＶｅｒｙＨｉｇｈＳｐｅｅｄＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔＨａｒｄｗａｒｅＤｅｓｃｒｉｐｔｉｏｎＬａｎｇｕａｇｅ、ＶＨＤＬ）、Ｖｅｒｉｌｏｇなどの言語で書かれたプログラムコードを含むことができる。エンティティは、ＨＤＬプログラムコードをドラフトした１人以上のヒトユーザ、ＨＤＬプログラムコードを生成した１つ以上の人工知能エージェント、又はこれらの組み合わせを含むことができる。

いくつかの実装形態では、プログラマブル回路１４２は、１つ以上のフィールドプログラマブルゲートアレイ（ｆｉｅｌｄｐｒｏｇｒａｍｍａｂｌｅｇａｔｅａｒｒａｙ、ＦＰＧＡ）、複合プログラマブル論理デバイス（ｃｏｍｐｌｅｘｐｒｏｇｒａｍｍａｂｌｅｌｏｇｉｃｄｅｖｉｃｅ、ＣＰＬＤ）若しくはプログラマブル論理アレイ（ｐｒｏｇｒａｍｍａｂｌｅｌｏｇｉｃａｒｒａｙ、ＰＬＡ）、又はこれらの組み合わせを含むことができ、これらは、特定のワークフローを実行するために、必要に応じて、核酸シーケンサ１１０によって動的に構成可能かつ再構成可能である。例えば、いくつかの実装形態では、上述のように、マッピング及びアラインメントユニット１４２ａとしてプログラマブル論理回路１４２を使用することが望ましい場合がある。しかしながら、他の実装形態では、プログラマブル回路１４２を使用して、バリアントコール機能、又は隠れマルコフモデル（ＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌ、ＨＭＭ）ユニットなどのバリアントコールを補助するための機能を実行することが望ましい場合がある。更に他の実装形態では、プログラマブル回路１４２は、圧縮（ｃｏｍｐｒｅｓｓｉｏｎ）及び復元（ｄｅｃｏｍｐｒｅｓｓｉｏｎ）などの一般的な計算タスクをサポートするように動的に構成されることもでき、これは、プログラマブル回路１４２のハードウェア論理が、一般的な計算タスク、及び上記で特定された他のタスクを、１つ以上の処理ユニット１５０によって実行されるソフトウェア命令を使用した同じタスクの実行よりもはるかに速く実行することができるためである。

プログラマブル回路１４２は、本明細書に記載の本開示の利点を提供することができる、集積回路の一種の一例である。しかしながら、他のタイプの集積回路を、核酸シーケンサ１１０の二次解析をオフロードして、一次解析のために核酸シーケンサ１１０のリソースを解放することができる、二次解析ユニット１４０のハードワイヤードデジタル論理として使用することもできる。例えば、いくつかの実装形態では、二次解析ユニット１４０は、１つ以上の特定用途向け集積回路（Ａｐｐｌｉｃａｔｉｏｎ－ＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ、ＡＳＩＣ）を使用するように構成することができる。１つ以上のＡＳＩＣは、再プログラム可能ではないが、二次解析動作の実行を加速かつ並列化するために、マッピング及びアラインメントユニット、バリアントコールユニット、バリアントコール計算支援ユニットなどの１つ以上の二次解析動作ユニットのカスタムハードウェア論理を用いて設計することができる。いくつかの実装形態では、１つ以上の二次解析動作ユニットの機能性を実現する二次解析ユニット１４０のハードワイヤード論理回路としてのＡＳＩＣを使用することにより、プログラマブル回路を使用するよりも更に速くすることができる。したがって、当業者であれば、ＡＳＩＣが本明細書に記載の実装形態のいずれかにおいてＦＰＧＡの代わりに使用され得ることを理解するであろう。

例として、いくつかの実装形態では、プログラマブル論理回路１４２は、復元ユニットとして動的に構成されるＦＰＧＡを用いて実装されてよく、核酸シーケンサから受け取った第１のリード１３０－１、１３０－３、１３２－１、１３２－３、１３４－１、１３４－３を表すデータにアクセスし、第１のリードを表すデータを復元する（例えば、核酸シーケンサから受け取ったリードが圧縮されている場合）。復元ユニットは、メモリ１４４又はメモリ１６０に格納された復元リードを格納することができる。そのような実装形態では、ＦＰＧＡは、それからマッピング及びアラインメントユニット１４２ａとして動的に再構成されて、メモリ１４４又はメモリ１６０に格納された復元された第１のリードのマッピング及びアラインメントを実行することができる。そうして、マッピング及びアラインメントユニット１４２ａは、メモリ１４４又はメモリ１６０にマッピング及びアラインメントされたリードを表すデータを格納することができる。次に、ＦＧＰＡは、バリアントコールユニット、又はソフトウェアバリアントコールユニット（例えば、ＨＭＭユニット）を補助する機能を実行するように構成されたユニットに動的に再構成され得、バリアントコール動作を実行して、シーケンシングシステム１００によって使用され得る出力データを生成し、マッピング及びアラインメントされたリードを表す格納データに基づいてバリアントコールフォーマット（Variant Calling Format、ＶＣＦ）ファイルを生成することができる。ＦＰＧＡを使用して実行されるこれらのハードウェアモジュールの高速の実行速度により、リードの二次解析が、従来の方法の３０時間～４８時間から短縮され、数分で実行できるようになる。復元、マッピング、アラインメント、及びバリアントコール動作を含む一連の動作が説明されているが、本開示は、これらの動作のすべてを実行することに限定されない。代わりに、プログラマブル回路１４２は、核酸シーケンサ１１０からオフロードされた二次解析を並列化するために、必要に応じて、任意の順序で任意の動作ユニットを実行するように動的に構成することができる。

図１Ａの例を参照すると、核酸シーケンサ１１０は、マッピング及びアラインメントユニット１４２ａを含むように、二次解析ユニット１４０のプログラマブル回路１４２を構成することができる。核酸シーケンサ１１０は、ヒト、非ヒト動物、又は植物などの実体の核酸などのサンプル１０５を受け取ることができる。核酸シーケンサ１１０は、サンプル１０５を調製し、ワークフロー１７０Ｂの時間Ｔ１中にクラスタ生成を実行することができる。核酸シーケンサ１１０は、第１のリード間隔中に合成によるシーケンシング（ｓｅｑｕｅｎｃｉｎｇ－ｂｙ－ｓｙｎｔｈｅｓｉｓ）などのシーケンシング動作を実行して、時間Ｔ１に続いて生じる時間Ｔ２Ａ中に第１のリード１３０－１、１３０－３、１３２－１、１３２－３、１３４－１、１３４－３を生成することができる。時間Ｔ１＋Ｔ２Ａの終了時に、核酸シーケンサ１１０は、第１のリード１３０－１、１３０－３、１３２－１、１３２－３、１３４－１、１３４－３のシーケンシングを完了し、第２のリード１３０－２、１３０－４、１３２－２、１３２－４、１３４－２、１３４－４のシーケンシングを開始する。

核酸シーケンサ１１０は、第１のリード１３０－１、１３０－３、１３２－１、１３２－３、１３４－１、１３４－３のマッピング及びアラインメントなどの二次解析動作と、時間Ｔ２Ｂ中の第２のリード１３０－２、１３０－４、１３２－２、１３２－４、１３４－２、１３４－４を生成するための第２のリード間隔の合成によるシーケンシングなどのシーケンシング動作を並列化するように構成されている。マッピング及びアラインメントユニット１４２ａは、マッピング及びアラインメント結果１４９を生成し、マッピング及びアラインメント結果を、核酸シーケンサ１１０のメモリ１６０、メモリ１４４、核酸シーケンサ１１０にアクセス可能ないくつかの他のメモリ、核酸シーケンサ１１０のユーザにアクセス可能な他のメモリ、又はこれらの組み合わせに格納することができる。結果１４９は、例えば、マッピング品質の指標、アラインメント品質の指標を提供するアラインメントスコアなどを提供するマッピング品質（ＭａｐｐｉｎｇＱｕａｌｉｔｙ、ＭＡＰＱ）スコアなどのマッピング及びアラインメント統計を記述するデータを含むことができる。

図１Ａの例では、プログラマブル回路１４２のハードワイヤードデジタル論理を使用して実装されたマッピング及びアラインメントユニット１４２ａの超高速実行時間は、マッピング及びアラインメントユニット１４２ａが、核酸シーケンサ１１０によって、必要とされる時間のほんの一部で、第１のリード１３０－１、１３０－３、１３２－１、１３２－３、１３４－１、１３４－３のマッピング及びアラインメントを実行して、第２のリード間隔を実行することを可能にする。例えば、いくつかの実装形態では、プログラマブル回路１４２は、第１のリード１３０－１、１３０－３、１３２－１、１３２－３、１３４－１、１３４－３のマッピング及びアラインメントをほんの数分で実行することができ、第２のリード１３０－２、１３０－４、１３２－２、１３２－４、１３４－２、１３４－４のシーケンシングは、１２～２４時間であり得る。したがって、マッピング及びアラインメント結果１４９は、核酸シーケンサ１１０、核酸シーケンサ１１０のユーザ、又はその両方によって評価することができ、マッピング及びアラインメント統計によって示されるように、第１のリード１３０－１、１３０－３、１３２－１、１３２－３、１３４－１、１３４－３のマッピング及びアラインメントの品質に基づいて、核酸シーケンサ１１０が第２のリード１３０－２、１３０－４、１３２－２、１３２－４、１３４－２、１３４－４のシーケンシングを継続すべきかどうかの決定を行うことができる。

第２のリード１３０－２、１３０－４、１３２－２、１３２－４、１３４－２、１３４－４のシーケンシングを継続すべきかどうかに関するこの決定は、核酸シーケンサ１１０によって自動的に、核酸シーケンサ１１０のユーザによって手動で、又は両方からの決定を記述するデータに基づいて行うことができる。例として、核酸シーケンサ１１０は、第１のリード１３０－１、１３０－３、１３２－１、１３２－３、１３４－１及び１３４－３のアラインメントスコアなどのマッピング及びアラインメント統計が、所定の閾値を満たすかどうかを決定するように構成することができる。１つ以上のアラインメントスコアが所定の閾値を満たす場合、次に、核酸シーケンサ１１０は、第２のリード１３０－２、１３０－４、１３２－２、１３２－４、１３４－２、１３４－４のシーケンシングを継続することができる。あるいは、１つ以上のアラインメントスコアが所定の閾値を満たさないと判定された場合、核酸シーケンサ１１０は、第２のリード１３０－２、１３０－４、１３２－２、１３２－４、１３４－２、１３４－４のシーケンシングを終了することができる。

異なる例として、いくつかの実装形態では、マッピング及びアラインメント結果１４９は、核酸シーケンサ１１０のユーザによって手動でレビューされ得る。そのような例では、ユーザは、アラインメントスコアによって示される第１のリード１３０－１、１３０－３、１３２－１、１３２－３、１３４－１、１３４－３のアラインメントの質に基づいて、核酸シーケンサ１１０が、第２のリード１３０－２、１３０－４、１３２－２、１３２－４、１３４－２、１３４－４のシーケンシングを継続するかどうかを判定することができる。

更に別の例として、核酸シーケンサ１１０及びユーザの両方が、マッピング及びアラインメント結果１４９によって示されるアラインメントスコアによって示される第１のリードのアラインメントの質に基づいて、第２のリードのシーケンシングが継続されるべきかどうか判定を行うこともできる。そのような実装形態では、核酸シーケンサ１１０及びユーザの決定を記述するデータを取得することができ、いくつかの実装形態では、核酸シーケンサ１１０は、核酸シーケンサ１１０及びユーザの両方が、第２のリード間隔が終了すべきであると同意した場合にのみ、第２のリード間隔を終了する。

更に他の実装形態では、２つの判定の加重平均を計算して、核酸シーケンサ１１０及びユーザの両方の判定を表す総スコアを生成することができる。そのような実装形態では、核酸シーケンサ１１０は、総スコアが所定の品質閾値を満たすことができない場合にのみ終了することができる。更に他の実装形態では、アラインメント統計を表すデータ、第２のリード間隔のシーケンシングを継続すべきかどうかに関するユーザ判定を表すデータ、第１のリードのうちの１つ以上を表すデータ、サンプル１０５の特徴を表すデータなどの他のデータ、又はこれらの組み合わせをベクトル化して、核酸シーケンサ１１０が第２のリード間隔の一次解析を継続すべきかどうかを決定するように訓練されている機械学習モデルなどの人工知能エージェントに入力できる。そのような実装形態では、機械学習モデルは、「第２のリード間隔を終了」若しくは「第２のリード間隔で継続」、又はこれらのそれぞれの同義語としてタグ付けされた、ラベル付けされた訓練データに基づいて予め訓練され得る。ラベル付けされた訓練データは、実行時に機械学習モデルに提供される同じ入力タイプを表すデータを含むことができる。そのような入力タイプは、アラインメント統計を表すデータ、第２のリード間隔のシーケンシングが継続されるべきかどうかに関するユーザ判定を表すデータ、第１のリードのうちの１つ以上を表すデータ、サンプル１０５の特徴を表すデータなどの他のデータ、又はこれらの組み合わせを含むことができる。

１つ以上の参照シーケンスへの第１のリード１３０－１、１３０－３、１３２－１、１３２－３、１３４－１、１３４－３のマッピング及びアラインメントに基づいて生成されたマッピング及びアラインメント結果１４９を使用することにより、第２のリード１３０－２、１３０－４、１３２－２、１３２－４、１３４－２、１３４－４を生成する第２のリード間隔中に、核酸シーケンサ１１０によって使用する試薬の節約（ｃｏｎｓｅｒｖａｔｉｏｎ）を可能にする。例えば、第１のリード１３０－１、１３０－３、１３２－１、１３２－３、１３４－１、１３４－３の不十分なアラインメントスコアは、汚染されたサンプル１０５、シーケンシングエラー、これらの組み合わせなどの多くの問題の存在を示すことができる。したがって、そのような例では、非常に高価であり得る試薬を使用して、第２のリード間隔中に第２のリードをシーケンシングし、一次解析の別のラウンドの実行を開始するのにかかる時間を更に遅らせる代わりに、核酸シーケンサ１１０にその低品質なシーケンシングランを完遂させるのにかかる時間のほんの一部で、核酸シーケンサ１１０をシャットダウンし、再構成してから、別のサンプルの一次解析を開始するために使用することができる。いくつかの実装形態では、第１のリードのマッピング及びアラインメントの質が満足のいくものとして決定されると、核酸シーケンサ１１０は、マッピング及びアラインメント結果１４９を廃棄することができる。他の実装形態では、第２のリード間隔と並行して実行される第１のリードのマッピング及びアラインメントは、第１のリードの最終データランのマッピング及びアラインメント結果として使用され得る。

図１Ｂの例を続けると、マッピング及びアラインメント結果が満足できると判定された後、核酸シーケンサ１１０は、第２のリード間隔の実行を継続して、第２のリードを生成することができる。第２のリード１３０－２、１３０－４、１３２－２、１３２－４、１３４－２、１３４－４が生成されると、核酸シーケンサ１１０は、二次解析ユニット１４０に、二次解析ユニット１４０の最終的な二次解析データランを開始するように命令することができる。最終的な二次解析データランは、二次解析ユニット１４０を使用して、第１のリード１３０－１、１３０－３、１３２－１、１３２－３、１３４－１、１３４－３、及び第２のリード１３０－２、１３０－４、１３２－２、１３２－４、１３４－２、１３４－４をマッピング及びアラインメントすることを含み得る。これらの二次解析動作は、プログラマブル回路１４２ａを使用して実装されるため、これらの二次解析動作は、第２のシーケンシングランと並行して、第２のシーケンシングランを実行するために必要な時間のほんの一部で実行され得る。

これは、先行するシーケンシングランのリードの二次解析が実行されている間に、後続のシーケンシングランに移動することができる、従来のシステムに対する利点を提供する。すなわち、図１Ａに示すように、従来の核酸シーケンサであれば、第１のシーケンシングランの完了後、第２のシーケンシングランを開始する前に、約２４～４８時間待つ必要があるところ、核酸シーケンサ１１０は、プログラマブル回路１４２に実装されたマッピング及びアラインメントユニット１４２ａを使用して、第１のシーケンシングランのリードの二次解析と第２のシーケンシングランの実行を並行化することができる。したがって、図１Ｂの核酸シーケンサ１１０は、図１Ａに記載のシステム及びワークフローを使用する従来のシステムよりも短期間でより多くのシーケンシングランを実行するために使用することができる。したがって、二次解析計算タスクを二次解析ユニット１４０のプログラマブル回路１４２にオフロードすることによるシーケンシングラン及び二次解析の並列化は、追加の試薬販売からの収益の増加を生み出すことができる。

いくつかの実装形態では、核酸シーケンサ１１０はまた、メモリ１６０に格納されたデマルチプレックスユニット１６２及びバリアントコールユニット１６４などのソフトウェアプログラムを有することができる。核酸シーケンサの１つ以上のプロセッサ１５０は、これらのユニットの機能を実現するために、これらのユニットのソフトウェア命令を処理することができる。例えば、いくつかの実装形態では、複数のサンプルのＤＮＡ断片は、核酸シーケンサ１１０を使用して同時にシーケンシングされ得る。そのような例では、デマルチプレックスユニット１６２を使用して、生成されたリードのそれぞれに追加されたバーコードなどのインデックスに基づいてリードを組織化し、各リードに関連付けられたサンプルを同定するデマルチプレックス技術を実装することができる。別の例として、プロセッサ１５０を使用して、マッピング及びアラインメントされたリードを解析して、一塩基多型（ｓｉｎｇｌｅｎｕｃｌｅｏｔｉｄｅｐｏｌｙｍｏｒｐｈｉｓｍ、ＳＮＰ）、挿入／欠失（ｉｎｓｅｒｔｉｏｎｓ／ｄｅｌｅｔｉｏｎｓ、インデル）、構造多型などの任意のバリアントの発生を同定することができるバリアントコールユニット１６４を実行することができる。いくつかの実装形態では、プログラマブル回路１４２は、バリアントコール処理を補助するために動的に再構成することができる。例えば、プログラマブル回路１４２は、マッピング及びアラインメントされたリードの１つ以上の参照位置におけるバリアントが発生する可能性に対して確率計算を実行するために使用され得るＨＭＭユニットを含むように動的に再構成することができる。いくつかの実装形態では、バリアントコールユニット１６４は、第２のシーケンシングランのシーケンシング動作と並行してリード１の間隔からマッピング及びアラインメントされたリードのバリアントコール動作を実行するように構成することができる。

図１Ｂの例は、８のヌクレオチドを有するリードを有する例を記載している。ただし、本開示は、そのように限定されない。代わりに、この簡単な例は、本開示の特徴を理解しやすい方法で説明するために提示されている。実際には、本開示のＤＮＡ断片はそれぞれ、いくつかの実装形態では、例えば、最大６００のヌクレオチド、最大１０００のヌクレオチド、又はそれ以上を有し得、断片の各リードは、例えば、ＤＮＡ断片の各末端から５０のヌクレオチド、７５のヌクレオチド、１５０のヌクレオチド、２００のヌクレオチド、３００のヌクレオチド、５００のヌクレオチド、又はそれ以上を有し得る。しかしながら、異なる長さのＤＮＡ断片及び異なる長さのリードを有する本開示の実装形態を用いることができる。同様に、図１Ｂ又は他の任意の図も、断片のクラスタの数を限定するものとして解釈されるべきではない。例えば、核酸シーケンサ１１０は、複数の断片の数百万個のクラスタが同時にシーケンシングされる、大規模並列シーケンシングを実行することができる。

図２は、図１Ｂのワークフロー図に従って、インクリメンタル二次解析を実行するためのプロセス２００の一例のフローチャートである。一般に、プロセス２００は、第１のリード間隔中に核酸シーケンシングデバイスによって生成された複数の第１のリードを表す第１のデータを取得することと（２１０）、第１のリード間隔の後に実行される第２のリード間隔中に核酸シーケンシングデバイスによって生成された複数の第２のリードを表す第２のデータを取得することと（２２０）、段階２２０で第２のデータが取得されている間に、（Ｉ）核酸シーケンサによって生成された複数の第１のリードを表す第１のデータに対して１つ以上の二次解析動作を実行することと、（ＩＩ）第１の複数のリードの二次解析の結果を格納することと（２３０）、その後、参照データへの第２の複数のリードを表す得られた第２のデータの二次解析を実行することと、を含む。便宜上、これらの段階は、図１Ｂのシステム１００などのシーケンシングシステムによって実行されるものとして以下でより詳細に説明される。

シーケンシングシステムは、第１のリード間隔中に核酸シーケンシングデバイスによって生成された複数の第１のリードを表す第１のデータを取得すること２１０によって、プロセス２００の実行を開始することができる。第１のデータを取得することは、第１のデータが核酸シーケンシングデバイスによって生成された後に、二次解析ユニットのメモリデバイスなどのメモリデバイス内に複数の第１のリードを表す第１のデータを格納することを含むことができる。二次解析ユニットのメモリデバイスは、二次解析動作を実行するように構成された二次解析ユニットの集積回路によってアクセス可能なメモリユニットであり得る。集積回路は、１つ以上のプログラマブル回路、１つ以上のＡＳＩＣ、又はこれらの組み合わせを含むことができる。複数の第１のリードの各リードは、ヌクレオチドの順序付けられたシーケンスからなり得る。いくつかの実装形態では、ヌクレオチドの順序付けられたシーケンスは、核酸断片の第１の末端のヌクレオチドに対応し得る。核酸シーケンシングデバイスは、ＤＮＡ又はＲＮＡのいずれかをシーケンシングすることができるシーケンサを含む任意の核酸シーケンシングデバイスを含むことができる。

シーケンシングシステムは、第１のリード間隔の後に実行される第２のリード間隔中に、核酸シーケンシングデバイスによって生成された複数の第２のリードを表す第２のデータを取得すること２２０によって、プロセス２００の実行を継続することができる。第２のデータを取得することは、第２のデータがシーケンシングデバイスによって生成された後に、二次解析ユニットのメモリに複数の第２のリードを表す第２のデータを格納することを含むことができる。二次解析ユニットのメモリデバイスは、二次解析動作を実行するように構成された二次解析ユニットの集積回路によってアクセス可能なメモリユニットであり得る。集積回路は、１つ以上のプログラマブル回路、１つ以上のＡＳＩＣ、又はこれらの組み合わせを含むことができる。いくつかの実装形態では、第２のデータの少なくとも一部は、第２のデータの別の部分が核酸シーケンシングデバイスによって生成されている間に、取得される。複数の第２のリードの各リードは、ヌクレオチドの順序付けられたシーケンスからなり得る。いくつかの実装形態では、ヌクレオチドの順序付けられたシーケンスは、核酸断片の第１の末端とは反対の核酸断片の第２の末端のヌクレオチドに対応し得る。

シーケンシングシステムが段階２２０で第２のデータを取得している間、シーケンシングシステムは、段階２３０で、複数の第１のリードを表す第１のデータに対して１つ以上の二次解析動作を実行することができる。いくつかの実装形態では、複数の第１のリードを表す第１のデータに対して１つ以上の二次解析動作を実行することは、（ｉ）核酸シーケンシングデバイスによって、マッピング及びアラインメントユニットに第１のデータを提供して、複数の第１のリードを表す第１のデータを参照シーケンスにアラインメントすることと、（ｉｉ）マッピング及びアラインメントユニットを使用して、参照シーケンスに、複数の第１のリードを表す第１のデータをアラインメントすることと、（ｉｉｉ）マッピング及びアラインメントユニットからアラインメント結果を受け取ることと、（ｉｖ）段階２０４で第２のデータの取得が完了する前に、複数の第１のリードを表す第１のデータの参照シーケンスへのアラインメントの受け取ったアラインメント結果を格納することと、を含むことができる。アラインメント結果は、第１の複数のリードを表す第１のデータの参照シーケンスへのアラインメントの質を記述するアラインメント統計を含むことができる。アラインメント統計は、例えば、ＭＡＰＱスコア、アラインメントスコアなどのうちの１つ以上を含むことができる。他の実装形態では、アラインメント結果は、潜在的なバリアントの決定のためのバリアントコールへの入力として提供され得るマッピング及びアラインメントされたリードを含み得る。

いくつかの実装形態では、アラインメント結果を記述する出力データは、１人以上のヒトユーザによるレビューのために提供され得る。例えば、アラインメント結果を記述する出力データは、例えば、核酸シーケンシングデバイスに接続されるか、又は別の部屋若しくは建物に提供されるディスプレイ上に出力され得る。あるいは、又は加えて、アラインメント結果を記述する出力データは、例えば、核酸シーケンシングデバイスに直接的又は間接的に通信可能に接続されたプリンタを使用して、アラインメント結果を記述するレポートを印刷するように出力することができる。

いくつかの実装形態では、マッピング及びアラインメントユニットの少なくとも一部は、核酸シーケンシングデバイスに組み込まれたプログラマブル回路又はＡＳＩＣなどの集積回路に実装される。例えば、プログラマブル回路又はＡＳＩＣは、テーブルルックアップ機能、Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎアルゴリズム、又は品質スコア判定を実装し得る。しかしながら、他の実装形態では、マッピング及びアラインメントユニットのうちの１つ以上の動作は、核酸シーケンシングデバイスによって実行されるソフトウェアにおいて実行され得る。例えば、プログラマブル回路及びアラインメント結果のソートを制御することは、ソフトウェアに実装され得る。更に他の実装形態では、マッピング及びアラインメントユニットは、１つ以上のネットワークを使用して核酸シーケンシングデバイスに通信可能に接続された１つ以上のリモートコンピュータのプログラマブル回路、ＡＳＩＣ、実行可能ソフトウェア、又はこれらの組み合わせに実装され得る。そのような実装形態では、リード、アラインメント結果などを表すデータは、核酸シーケンシングデバイスと、１つ以上のネットワークを使用してマッピング及びアラインメントユニットのホストである１つ以上のリモートコンピュータとの間で通信することができる。

シーケンシングシステム、他の処理システム、又は１人以上のヒトユーザは、第２のデータが段階２２０で取得されている間に、アラインメント結果を評価することができる。例えば、アラインメント結果を評価して、アラインメントが段階２２０で第２のデータを取得することを継続するのに十分な品質であるかどうかを判定することができる。いくつかの実装形態では、第１の複数のリードのアラインメント結果が所定の閾値を満たすことができない場合、核酸シーケンサは、段階２２０で第２のデータを取得することを停止するように命令され得る。あるいは、第１の複数のリードのアラインメント結果が所定の閾値を満たすと判定された場合、そこで核酸シーケンサは、段階２２０で第２のデータを取得することを継続することが許可され得る。

他の実装形態では、マッピング及びアラインメントされた第１のリードは、第２のデータが段階２２０で取得されている間に、マッピング及びアラインメントされた第１のリードと１つ以上の参照シーケンスとの間の潜在的なバリアントの検出について評価され得る。そのような実装形態は、マッピング及びアラインメントされた第１のリードの三次解析を、第１のリード間隔及び第２のリード間隔の両方が完了する後まで三次解析の開始を禁止する従来の方法よりも、迅速に達成することを可能とする。したがって、三次解析に進む前に第２のリード間隔が完了するのを待つ必要がないことから、１２～２４時間又はそれ以上早く初めの診断を取得して治療を開始し得る。

シーケンスシステムは、段階２４０で第２データに対する二次解析動作の実行を指示することによって、例えば、第２の複数のリードを表す第２のデータの参照シーケンスへのアラインメントを開始するようマッピング及びアラインメントユニットに指示することによって、プロセス２００の実行を継続することができる。いくつかの実装形態では、シーケンシングシステム２００は、常に段階２４０に進むことができる。そのような実装形態は、三次解析を促進し、核酸シーケンシングデバイスのダウンタイムを低減する技術的利点を更に提供する。しかしながら、他の実装形態では、プロセス２００の実行は、複数の第１のリードを表す第１のデータのアラインメントの質を記述する受け取られたアラインメント結果が所定の品質閾値を満たすと決定された場合にのみ、第２の複数のリードを表す第２のデータの参照シーケンスへのアラインメントを開始するように、マッピング及びアラインメントユニットに命令することによって継続してもよい。

いくつかの実装形態では、シーケンシングシステムは、第２のデータが取得されている間に、段階２２０で実行される第１のデータのマッピング及びアラインメント、バリアントコール、又はその両方の二次解析結果に依存し得る。他の実装形態では、段階２３０で実行された第１のデータに関連するこれらの初めの二次解析結果は、それらが評価されて第１のリード間隔の品質を決定した後に廃棄され得る。そのような例では、シーケンシングシステムは、第２のデータの二次解析を段階２４０で実行する前又は後のいずれかで、第１のデータの二次解析の第２のイテレーションを開始することができる。

図３は、核酸シーケンサ３１０から離れて位置する二次解析ユニット３４０を使用して、１つ以上のサンプルのインクリメンタル二次解析を実行するためのシステム３００の一例のコンテクスト図である。システム３００は、概して、図１Ｂを参照して説明したシステム１００と同じであり、いくつかの変更が加えてある。１つの変更は、二次解析ユニット３４０が、核酸シーケンサ３１０から離れている１つ以上のコンピュータ３２０に位置することである。明示的に述べられていない図３の任意の参照番号に関して、参照番号によって識別される構成要素は、図１の対応する特徴と同じ特徴を有する。例えば、それぞれのクラスタ３２２－１、３２２－２、３２２－３、３２２－４、３２２－５、３２２－Ｎは、図３を参照して追加の又は異なる特徴が記載されない限り、図１のそれぞれのクラスタ１２２－１、１２２－２、１２２－３、１２２－４、１２２－５、１２２－Ｎと同じ意味を有する。

図３の例と図１Ｂの例との間の別の違いは、図３の例では、複数のサンプルが処理されることである。その結果、システム３００の核酸シーケンサ３１０によって生成されたリードは、各リードについて生成されるインデックスを有する。このインデックスは、各リードに取り付けられたラベルＳ１、Ｓ２、及びＳ３によって図３で表される。この例では、Ｓ２、Ｓ２、Ｓ３は、それぞれ第１のサンプル、第２のサンプル、又は第３のサンプルに基づいて生成されたリードを同定するために使用されるストリングである。インデックスは、Ｓ１、Ｓ２、Ｓ３という用語を使用して本明細書に記載されているが、これらの用語は、インデックスの概念を説明するために例として使用されているため、本開示は、テキストストリングのサンプル識別子としての使用に限定されない。代わりに、いくつかの実装形態では、バーコード又は他のデータを、リードのサンプル識別子として使用することができる。いくつかの実装形態では、サンプル識別子は、インデックスを表す合成ヌクレオチドを、各生成されたリードに追加することによって生成することができる。

図３の例を参照すると、核酸シーケンサ３１０又はリモートコンピュータ３２０は、マッピング及びアラインメントユニット３４２ａを含むように二次解析ユニット３４０のプログラマブル回路３４２を構成することができる。核酸シーケンサ３１０は、複数のサンプル１０５、サンプル１０６、サンプル１０７を受け取ることができる。サンプル１０５、サンプル１０６、サンプル１０７は、例えば、異なる実体からの核酸サンプルを含むことができる。異なる実体は、異なるヒト、異なる動物、異なる植物などであり得る。核酸シーケンサ３１０は、サンプル１０５、サンプル１０６、サンプル１０７を調製し、ワークフロー３７０の時間Ｔ１中にクラスタ生成を実行することができる。核酸シーケンサ３１０は、第１のリード間隔の合成によるシーケンシングなどのシーケンシング動作を実行して、時間Ｔ１に続いて生じる時間Ｔ２Ａ中に第１のリード３３０－１、３３０－３、３３２－１、３３２－３、３３４－１、３３４－３を生成することができる。時間Ｔ１＋Ｔ２Ａの終了時に、核酸シーケンサ３１０は、第１のリード３３０－１、３３０－３、３３２－１、３３２－３、３３４－１、３３４－３のシーケンシングを完了し、時間Ｔ３Ａ中、第１のリード間隔中に生成された第１のリードについてインデックス生成を開始する。時間Ｔ１＋Ｔ２Ａ＋Ｔ３Ａの終了時に、核酸シーケンサ３１０は、第１のリードサイクルについてインデックス生成を完了し、時間Ｔ３Ｂ中、第２のリード間隔中に生成される第２のリードについてインデックス生成を開始する。時間Ｔ１＋Ｔ２Ａ＋Ｔ３Ａ＋Ｔ３Ｂの終了時に、核酸シーケンサ３１０は、第２のリード３３０－２、３３０－４、３３２－２、３３２－４、３３４－２、３３４－４のシーケンシングを開始する。

核酸シーケンサ３１０は、核酸シーケンサ３１０が、第２のリード間隔の合成によるシーケンシングなどのシーケンシング動作を実行して、時間Ｔ２Ｂ中に第２のリード３３０－２、３３０－４、３３２－２、３３２－４、３３４－２、３３４－４を生成する間に、第１のリード３３０－１、３３０－３、３３２－１、３３２－３、３３４－１、３３４－３のマッピング及びアラインメントなどの二次解析動作を並列化するように構成されている。このプロセスは、図１Ｂの例を参照して説明したものと同様である。しかしながら、図３の例では、複数のサンプルがシーケンシングされている。したがって、複数の第１のリードは、マッピング及びアラインメント及びバリアントコールなどの他の二次解析動作に進む前に、各リードのインデックスに基づいて、群にデマルチプレックスされる必要がある。複数の第１のリードがデマルチプレックスされると、第１のリードのデマルチプレックスした群に対して１つ以上の二次解析動作を実行することができる。いくつかの実装形態では、システム３００は、デマルチプレックス動作に基づいてデマルチプレックス統計を生成することができ、格納された統計を評価して、シーケンシングされたリードの品質を決定することができる。

図３の例では、時間Ｔ３Ａ及びＴ３Ｂ中のインデックス化動作が完了するまで、デマルチプレックスされた群への第１のリードの組織化が起こり得ないため、時間Ｔ１＋Ｔ２Ａ＋Ｔ３Ａ＋Ｔ３Ｂの終了時まで、第１のリードの二次解析を開始することができない。時間Ｔ１＋Ｔ２Ａ＋Ｔ３Ａ＋Ｔ３Ｂの終了時に第２のインデックスが完了すると、核酸シーケンサ３１０は、ネットワーク１１２上のリモートコンピュータ３２０に複数の第１のリードを提供することができる。リモートコンピュータ３２０は、複数の第１のリードを受け取り、メモリ３４４内に複数の第１のリードを格納することができる。核酸シーケンサ３１０は、時間Ｔ２Ｂ中に第２のリード間隔を実行しているが、二次解析ユニット３４０は、処理ユニット３５０を使用して、メモリ３４４内の複数の第１のリードにアクセスし、デマルチプレックスユニット３６２を使用して、複数の第１のリード３３０－１、３３０－３、３３２－１、３３２－３、３３４－１、３３４－３を、各リードのインデックス又はサンプル識別子に基づいて群にデマルチプレックスすることができる。デマルチプレックスは、インデックスに基づいて第１のリードを組織化するために、デマルチプレックス動作を使用して達成することができる。デマルチプレックスされた第１のリードは、メモリ３４４に格納することができる。次いで、マッピング及びアラインメントユニット３４２ａは、メモリ３４４に格納されたリードにアクセスし、第２のリード間隔中に、デマルチプレックスされた第１のリードに対するマッピング及びアラインメント動作を実行することができる。

二次解析ユニット３４０は、核酸シーケンサによって生成されたリードの品質を評価するために使用され得る統計を生成することができる。いくつかの実装形態では、二次解析ユニットは、デマルチプレックス動作に基づいて、デマルチプレックス統計を生成することができる。マッピング及びアラインメントユニット３４２ａは、メモリ３４４に格納された各第１のリードの群についてマッピング及びアラインメント結果並びに統計を生成することができる。マッピング及びアラインメントユニット３４２ａは、結果３５９をメモリ３６０に格納するか、又は結果３５９を核酸シーケンサ３１０に戻すことができる。

結果３５９は、デマルチプレックス統計、マッピング及びアラインメント結果、マッピング及びアラインメント統計、バリアントコール統計、又はこれらの任意の組み合わせを含むことができる。デマルチプレックス統計は、各サンプル識別子に対応するリードの数を含むことができる。マッピング及びアラインメント結果は、参照シーケンスへの１つ以上のマッピングされたリードを表すデータを含み得る。マッピング及びアラインメント統計は、例えば、マッピング品質の指標を提供するＭＡＰＱスコア、アラインメント品質の指標を提供するアラインメントスコアなどを記述するデータを含み得る。核酸シーケンサ３１０は、結果３５９を受け取り、受け取った結果をメモリ１６０に格納することができる。

図３の例では、プログラマブル回路３４２のハードワイヤード論理を使用して実装されたマッピング及びアラインメントユニット３４２ａの超高速実行時間は、マッピング及びアラインメントユニット３４２ａが、第２のリード間隔を実行するために核酸シーケンサ３１０によって必要とされる時間のほんの一部で第１のリード３３０－１、３３０－３、３３２－１、３３２－３、３３４－１、３３４－３のそれぞれのデマルチプレックスされた群のマッピング及びアラインメントを実行することを可能にする。例えば、いくつかの実装形態では、プログラマブル回路３４２ａは、第１のリード３３０－１、３３０－３、３３２－１、３３２－３、３３４－１、３３４－３のデマルチプレックスされた群のマッピング及びアラインメントをほんの数分で行うことができ、一方で、第２のリード間隔中の第２のリード３３０－２、３３０－４、３３２－２、３３２－４、３３４－２、３３４－４のシーケンシングは、１２～２４時間であり得る。したがって、結果３５９は、核酸シーケンサ３１０、リモートコンピュータ３２０、核酸シーケンサ３１０のユーザ若しくはリモートコンピュータ３２０のユーザ、人工知能エージェント若しくはモデル、又はこれらの組み合わせによって評価することができ、第１のリード３３０－１、３３０－３、３３２－１、３３２－３、３３４－１、３３４－３のデマルチプレックスの品質、第１のリード３３０－１、３３０－３、３３２－１、３３２－３、３３４－１、３３４－３のデマルチプレックスした群のマッピング及びアラインメントの品質、又はその両方に基づいて、核酸シーケンサ３１０が、第２のリード間隔中にシーケンシング動作を継続して、第２のリード３３０－２、３３０－４、３３２－２、３３２－４、３３４－２、３３４－４を生成すべきかどうかの判断を行うことができる。

第２のリード３３０－２、３３０－４、３３２－２、３３２－４、３３４－２、３３４－４を生成するために第２のリード間隔中のシーケンシング動作を継続すべきかどうかの判断は、図１Ｂの例を参照して説明したように、核酸シーケンサ３１０によって自動的に、核酸シーケンサのユーザによって手動で、人工知能エージェント若しくはモデルによって自動的に、又はこれらの組み合わせからの判定を記述するデータに基づいて行うことができる。あるいは、又は加えて、リモートコンピュータ３２０、コンピュータ３２０のユーザ、若しくは人工知能エージェント若しくはモデル、又はこれらの組み合わせは、結果３５９に基づいて、第２のリード３３０－２、３３０－４、３３２－２、３３２－４、３３４－２、３３４－４を生成するために第２のリード間隔中のシーケンシングを継続するべきかどうかを判断することができる。結果３５９のそのような解析は、図１Ｂの説明で核酸シーケンサ３１０、核酸シーケンサ３１０のユーザ、又は人工知能エージェント若しくはモデル、又はこれらの組み合わせによる結果１４９の評価に関して記載されたのと同様に、リモートコンピュータ３２０、リモートコンピュータ３２０のユーザ、人工知能エージェント若しくはモデル、又はこれらの組み合わせによって評価することができる。人工知能エージェント又はモデルの場合、人工知能モデルはまた、図１Ｂの説明に記載されている他の入力データタイプに加えて、デマルチプレックス特性を含む入力データタイプで訓練され得る。

いくつかの実装形態では、デマルチプレックス統計は、マッピング及びアラインメント統計とは別に、又はマッピング及びアラインメント統計と共に評価されて、核酸シーケンサ３１０によって生成されるリードの品質を決定することができる。例えば、核酸シーケンサ３１０又はリモートコンピュータ３２０は、各サンプル識別子について予想される数のリードを表すデータを格納することができる。次いで、核酸シーケンサ３１０、リモートコンピュータ３２０、ユーザ、人工知能エージェント、又はこれらの組み合わせは、デマルチプレックス統計が、各サンプル識別子について予想されるリード数の誤差の閾値量内にある各サンプル識別子に対応するリード数を含むかどうかを判定することができる。デマルチプレックス統計が、各サンプル識別子について予想されるリード数の誤差の閾値量内にある場合、核酸シーケンサ３１０、リモートコンピュータ３２０、ヒトユーザ、人工知能エージェント、又はこれらの組み合わせは、シーケンシング動作を継続すべきか決定することができる。あるいは、デマルチプレックス統計が、各サンプル識別子について予想されるリード数の誤差の閾値量内にないと判定された場合、核酸シーケンサ３１０、リモートコンピュータ３２０、ユーザ、人工知能エージェント若しくはモデル、又はこれらの組み合わせは、シーケンシングランを終了することを決定することができる。

いくつかの実装形態では、結果３５９が、リモートコンピュータ３２０から核酸シーケンサ３１０に送り返される必要はない場合がある。代わりに、リモートコンピュータ３２０、リモートコンピュータ３２０のユーザ、又は人工知能エージェント若しくはモデルは、結果３５９のコンピュータ３２０の解析、コンピュータ３２０のユーザの解析、又は人工知能エージェント若しくはモデルの解析に基づいて、核酸シーケンサ３１０が第２のリード３３０－２、３３０－４、３３２－２、３３２－４、３３４－２、３３４－４の生成を継続するべきかどうかを示すデータを、核酸シーケンサ３１０に送り返すことができる。そうして核酸シーケンサは、実際に結果３５９を受け取ることなく、リモートコンピュータ３２０から受け取ったデータに基づいて、第２のリード間隔を継続するか、又は終了するかを判定することができる。

更に別の実装形態では、核酸シーケンサは、図１Ｂを参照して説明したものと同様に、複数の決定を考慮することもできる。例えば、いくつかの実装形態では、核酸シーケンサ３１０、核酸シーケンサ３１０のユーザ、リモートコンピュータ３２０、リモートコンピュータ３２０のユーザ、人工知能エージェント若しくはモデル、又はこれらの任意の組み合わせの判定を記述するデータを取得することができ、そのような実装形態では、核酸シーケンサ３１０、核酸シーケンサ３１０のユーザ、リモートコンピュータ３２０、リモートコンピュータ３２０のユーザ、人工知能エージェント若しくはモデル、又はこれらの任意の組み合わせが、第２のリード間隔は終了すべきであると同意した場合のみ、核酸シーケンサ３１０は、第２のリード間隔を終了する。他の実装形態では、総スコアは、核酸シーケンサ３１０、核酸シーケンサ３１０のユーザ、リモートコンピュータ３２０、リモートコンピュータ３２０のユーザ、人工知能エージェント、又はこれらの任意の組み合わせのうちの１つ以上の決定の加重平均に基づいて生成され、総スコアに基づいて、第２のリード間隔が終了されるべきかどうか決定され得る。そのような実装形態では、総スコアが所定の閾値を下回る場合、第２のリード間隔を終了させることができる。あるいは、総スコアが所定の閾値を超える場合、第２のリード間隔は継続され得る。

これらの技術を使用して、図３のシステム３００は、図１Ｂを参照して説明した同様の技術的利点を提供する。すなわち、システム３００は、第１のリードのアラインメントが低品質のアラインメントであることを結果３５９が示す場合、第２のリードを生成するために使用される試薬を節約することができる。デマルチプレックス統計の質、マッピング及びアラインメントの結果の質、マッピング及びアラインメント統計の質、又はこれらの組み合わせが十分であると判定されると、核酸シーケンサ３１０は、結果３５９を廃棄することができる。他の実装形態では、第２のリードと並行して実行される第１のリードのマッピング及びアラインメントは、最終データランのための第１のリードのマッピング及びアラインメントとして使用され得る。

図３の例を続けると、結果３５９が満足のいくものであると判定した後、核酸シーケンサ３１０は、第２のリードの実行を継続することができる。第２のリード３３０－２、３３０－４、３３２－２、３３２－４、３３４－２、３３４－４が生成されると、核酸シーケンサ３１０は、二次解析ユニット３４０に最終的な二次解析データランを開始するように命令する命令を、ネットワーク１１２を使用して、リモートコンピュータ３２０に送信できる。最終データランは、二次解析ユニット３４０を使用して、各第２のリードのサンプル識別子に基づいて第２のリード３３０－２、３３０－４、３３２－２、３３２－４、３３４－２、３３４－４を第２のリードの組織化した群にデマルチプレックスすることと、それから第２のリード３３０－２、３３０－４、３３２－２、３３２－４、３３４－２、３３４－４をマッピング及びアラインメントすることと、を含むことができる。いくつかの実装形態では、第１のリードの組織化されたセットのマッピング及びアラインメント結果が廃棄された場合、最終データランは、第１のリード及び第２のリードの両方に対するマッピング及びアラインメント動作を実行することができる。これらの動作は、プログラマブル回路３４２ａを使用して実装されるため、これらの動作は、第２のシーケンシングラン３７４と並行して、第２のシーケンシングラン３７４を実行するために必要な時間のほんの一部で実行され得る。これは、前のシーケンシングラン３７２の二次解析を実行しながら、後続のシーケンシングランを継続することができることにより、図１Ａに示される従来のシステムで発生するシーケンサのダウンタイムが低減するという、従来のシステムに対する利点を提供する。

デマルチプレックス並びにマッピング及びアラインメントに加えて、二次解析ユニット３４０はまた、バリアントコール動作を実行することができる。例として、処理ユニット３５０を使用して、マッピング及びアラインメントされたリードを解析して、一塩基多型（ＳＮＰ）、挿入／欠失（インデル）、構造多型などの任意のバリアントの発生を同定することができるバリアントコールユニット３６４を実行することができる。いくつかの実装形態では、プログラマブル回路３４２は、例えば、リモートコンピュータ３２０によって、バリアントコール処理を補助するために動的に再構成することができる。例えば、プログラマブル回路３４２は、マッピング及びアラインメントされたリードの１つ以上の参照位置におけるバリアントが発生する可能性に対して確率計算を実行するために使用され得るＨＭＭユニットを含むように動的に再構成することができる。バリアントコール動作を実行するためのＦＰＧＡなどのプログラマブル回路の使用の例は、例えば、米国特許出願公開第２０１６／０１８００１９号、米国特許出願公開第２０１６／０３０６９２２号、及び米国特許出願公開第２０１９－０２５９４６８号に更に詳細に記載されており、これらのそれぞれの全内容は、その全体が参照により本明細書に組み込まれる。

図３の例は、８のヌクレオチド及び３のサンプルを有するリードを有する例を記載している。ただし、本開示は、そのように限定されない。代わりに、この簡単な例は、本開示の特徴を理解しやすい方法で説明するために提示されている。実際には、本開示のＤＮＡ断片は、いくつかの実装形態では、例えば、最大６００のヌクレオチド、最大８００のヌクレオチド、最大１，０００のヌクレオチド、又はそれ以上を有し得、断片の各リードは、例えば、ヌクレオチドＤＮＡ断片の各末端から５０のヌクレオチド、７５のヌクレオチド、１５０のヌクレオチド、２００のヌクレオチド、３００のヌクレオチド、５００のヌクレオチド、又はそれ以上を有し得る。同様に、図３又は他の任意の図も、断片のクラスタの数を限定するものとして解釈されるべきではない。例えば、核酸シーケンサ３１０は、複数の断片の数百万個のクラスタが同時にシーケンシングされる、大規模並列シーケンシングを実行することができる。

図３の例は、インデックス又はサンプル識別子を有するリードを生成するために使用される複数のサンプルに関するが、本開示はそのように限定されない。代わりに、システム３００はまた、すべてのリードが同じサンプルに属するためにインデックス付けされないリードを生成する単一サンプルの処理を行うためにも使用され得る。そのような実装形態では、同じ処理が、いかなるインデックスも生成することなく、第１のリード間隔「リード１」の直後に開始される、第２のリード間隔「リード２」を用いて実行され得る。次に、第１のリード間隔「リード１」が完了すると、第１のリードの二次解析を第２のリード間隔と並列化しながら、第２のリード間隔「リード２」を開始することができる。単一のサンプル実装と複数のサンプル実装との間の唯一の実質的な違いは、インデックス生成及びデマルチプレックス段階が単一のサンプルで実行される必要がないことであり、なぜなら、すべてのリードが同じサンプルに関連付けられるためである。

図４は、図３のワークフロー図に従って、インクリメンタル二次解析を実行するためのプロセス４００の一例のフローチャートである。一般に、プロセス４００は、第１のリード間隔中に、複数の異なるサンプルから核酸シーケンシングデバイスによって生成された複数の第１のリードを記述する第１のデータを取得することと（４１０）、第１のリード間隔（４１０）の後に実行される第２のリード間隔中に、複数の異なるサンプルから核酸シーケンシングデバイスによって生成された複数の第２のリードを記述する第２のデータを取得することと（４２０）、第２のデータを段階４２０で取得している間に、（Ｉ）複数の第１のリードを、第１のリードのそれぞれに関連付けられた少なくとも第１のサンプル識別子又は第２のサンプル識別子に基づいて組織化された群に組織化することと、（ＩＩ）各第１のリードの組織化された群について、第１のリードの組織化された群に対して二次解析動作を実行することと、（ＩＩＩ）各第１のリードの群の二次解析の結果を格納することと（４３０）、その後、二次解析ユニットに命令して、（Ａ）少なくとも第１のサンプル識別子又は第２のサンプル識別子に基づいて、複数の第２のリードを複数の組織化された群に組織化することと（４４０）、（Ｂ）各第２のリードの組織化された群について、第２のリードの組織化された群、又は第１のリード及び第２のリードの組織化された群に対して二次解析動作を実行することと（４５０）、を開始させることと、を含む。便宜上、限定されないが、これらの段階は、図３のシステム３００などのシーケンシングシステムによって実行されるように、以下でより詳細に説明される。

シーケンシングシステムは、第１のリード間隔中に、複数の異なるサンプルから、核酸シーケンシングデバイスによって生成された複数の第１のリードを記述する第１のデータを取得する４１０ことによって、プロセス４００の実行を開始することができる。第１のデータを取得することは、第１のデータがシーケンシングデバイスによって生成された後に、複数の第１のリードを表す第１のデータを二次解析ユニットのメモリデバイスなどのメモリデバイス内に格納することを含むことができる。二次解析ユニットのメモリデバイスは、二次解析動作を実行するように構成された二次解析ユニットの集積回路によってアクセス可能なメモリユニットであり得る。集積回路は、１つ以上のプログラマブル回路、１つ以上のＡＳＩＣ、又はこれらの組み合わせを含むことができる。

複数の第１のリードの各リードは、ヌクレオチドの順序付けられたシーケンスからなり得る。いくつかの実装形態では、ヌクレオチドの順序付けられたシーケンスは、核酸断片の第１の末端のヌクレオチドに対応し得る。核酸断片は、シーケンシングを促進するためにクローン的に増幅されていてもよく、そのような実装形態では、ヌクレオチドの順序付けられたシーケンスは、核酸断片の複数のクローンを解析することによって決定され、リードのヌクレオチドを生成し得る。各第１のリードは、第１のリードを生成するために使用するサンプルを同定するデータを含むことができる。いくつかの実装形態では、サンプルを同定するデータは、バーコードを含むことができる。核酸シーケンシングデバイスは、ＤＮＡシーケンサ又はＲＮＡシーケンサを含む任意の核酸シーケンシングデバイスを含み得る。

シーケンシングシステムは、第１のリード間隔の後に実行される第２のリード間隔中に、複数の異なるサンプルから、核酸シーケンシングデバイスによって生成された複数の第２のリードを記述する第２のデータを取得すること４２０によって、プロセス４００の実行を継続することができる。第２のデータを取得することは、第２のデータがシーケンシングデバイスによって生成された後に、二次解析ユニットのメモリに複数の第１のリードを表す第２のデータを格納することを含むことができる。二次解析ユニットのメモリデバイスは、二次解析動作を実行するように構成された二次解析ユニットの集積回路によってアクセス可能なメモリユニットであり得る。集積回路は、１つ以上のプログラマブル回路、１つ以上のＡＳＩＣ、又はこれらの組み合わせを含むことができる。

いくつかの実装形態では、第２のデータの少なくとも一部は、第２のデータの別の部分が核酸シーケンシングデバイスによって生成されている間に、取得される。複数の第２のリードの各リードは、ヌクレオチドの順序付けられたシーケンスからなり得る。いくつかの実装形態では、ヌクレオチドの順序付けられたシーケンスは、核酸断片の第１の末端の反対側の核酸断片の第２の末端のヌクレオチドに対応し得る。核酸断片は、シーケンシングを促進するためにクローン的に増幅されていてもよく、そのような実装形態では、ヌクレオチドの順序付けられたシーケンスは、核酸断片の複数のクローンを解析することによって決定され、リードのヌクレオチドを生成し得る。各第２のリードは、第２のリードが発生したサンプルを同定するデータを含むことができる。いくつかの実装形態では、サンプルを同定するデータは、バーコードを含むことができる。

第２のデータは段階４２０で取得されているが、シーケンシングシステムは、二次解析ユニットを使用して、複数の第１のリードの追加の処理を並列化することができる。いくつかの実装形態では、追加の並列化処理は、（Ｉ）複数の第１のリードを表すデータを、第１のリードのそれぞれに関連する少なくとも第１のサンプル識別子又は第２のサンプル識別子に基づいて組織化された群に組織化することと、（ＩＩ）各第１のリードの組織化された群について、第１のリードの組織化された群に対して二次解析動作を実行することと、（ＩＩＩ）各第１のリードの群の二次解析結果を格納することと（４３０）、を含むことができる。

サンプル識別子に基づいて、複数の第１のリードを組織化された群に組織化することは、シーケンシングされている複数のサンプルがあるときに関連する二次解析処理を取得する必要がある。これは、１つ以上のデマルチプレックス動作を実行して、異なる第１のサンプル識別子を有する第１のリードのセットをそれぞれの組織化された群にマッピングすることを含み得、各第１のリードの組織化された群は、同じサンプル識別子を有する。デマルチプレックス動作の品質を記述するデマルチプレックス統計を生成することができる。例えば、デマルチプレックス統計は、各サンプル識別子に対応する第１のリードの数を示すことができる。いくつかの実装形態では、二次解析ユニットは、結果データを核酸シーケンサに戻すか、結果データを１つ以上の人工知能エージェント若しくはモデルに提供するか、又は結果データをデマルチプレックス統計を記述する１人以上のヒトユーザに出力することができる。そのような例では、シーケンシングシステムは、デマルチプレックス統計によって記述されるデマルチプレックス動作の質に基づいて、プロセス４００を継続するか、又はこの時点でプロセス４００を終了するかどうかを判定することができる。あるいは、以下に説明するように、マッピング及びアラインメント動作が実行された後、そのようなデマルチプレックス統計を結果データとして戻すことができる。

複数の第１のリードが組織化されると、シーケンシングシステムは、各第１のリードの組織化された群について、第１のリードの組織化された群に対する１つ以上の二次解析動作を実行することができる。第１のリードの組織化された群に対して二次解析動作を実行することは、各第１のリードの組織化された群について、（Ｉ）核酸シーケンシングデバイスによって、第１のリードの組織化された群をマッピング及びアラインメントユニットに提供し、第１のリードの組織化された群を参照シーケンスにアラインメントすることと、（ＩＩ）マッピング及びアラインメントユニットを用いて、第１のリードの組織化された群を参照シーケンスにアラインメントすることと、（ｉｉｉ）マッピング及びアラインメントユニットから結果を受け取ることと、（ｉｖ）段階４２０で第２のデータの取得が完了する前に、受け取った結果データを格納することと、を含むことができる。

結果データは、デマルチプレックス統計、又はマッピング及びアラインメント統計を含むことができる。デマルチプレックス統計は、各サンプル識別子に対応する第１のリードの数などのデマルチプレックス動作の質を記述するデータを含むことができる。マッピング及びアラインメント統計は、各第１のリードの組織化された群のそれぞれの参照シーケンスへのアラインメントの質を記述するデータを含むことができる。マッピング及びアラインメント統計は、例えば、ＭＡＰＱスコア、アラインメントスコアなどのうちの１つ以上を含むことができる。他の実装形態では、マッピング及びアラインメント結果は、各第１リードの組織化された群のマッピング及びアラインメントされたリードとそれぞれの参照シーケンス間の潜在的バリアントを決定するためのバリアントコーラーへの入力として提供され得る、各第１リードの組織化された群のマッピング及びアラインメントされたリードを含むことができる。

いくつかの実装形態では、各第１のリードの組織化された群についての結果データを記述する出力データは、１人以上のヒトユーザによるレビューのために提供され得る。例えば、各第１のリードの組織化された群についての結果データを記述する出力データは、例えば、核酸シーケンシングデバイスに結合された、又は別の部屋若しくは建物に提供されたディスプレイ上に出力され得る。あるいは、又は加えて、各第１のリードの組織化された群についての結果データを記述する出力データは、例えば、核酸シーケンシングデバイスに直接的又は間接的に通信可能に接続されたプリンタを使用して出力され、各第１のリードの組織化された群についてのアラインメント結果を記述するレポートを印刷することができる。

いくつかの実装形態では、シーケンシングシステム、リモートコンピュータ、１人以上のヒトユーザ、人工知能エージェント若しくはモデル、又はこれらの組み合わせは、第２のデータが段階４２０で取得されている間、結果データを評価することができる。例えば、結果データを評価して、デマルチプレックスされた第１のリード、第１のリードのマッピング及びアラインメント、又はその両方が、段階４２０で第２のデータを取得するのを継続するのに十分な品質であるかどうかを判定することができる。いくつかの実装形態では、第１のリードの組織化された群の結果データが１つ以上の所定のルール又は閾値を満たさない場合、核酸シーケンサは、段階４２０で第２のデータを取得することを停止するように命令され得る。あるいは、第１のリードの組織化された群の結果データが１つ以上の所定のルール又は閾値を満たすと判定された場合、核酸シーケンサは、段階４２０で第２のデータの取得を継続することが許可され得る。

いくつかの実装形態では、マッピング及びアラインメントされた第１のリードの各組織化された群は、第２のデータが段階４２０で取得されている間に、潜在的なバリアントの検出について評価することができる。そのような実装形態は、各群について同定されたバリアントの三次解析を、第１のリード間隔及び第２のリード間隔の両方が完了する後まで三次解析の開始を禁止する従来の方法よりも、迅速に達成することを可能にする。したがって、初めの診断は、三次解析に進む前に第２のリード間隔を完了するのを待つ必要がないことから、従来の方法よりも１２～２４時間早く治療を開始するために取得され得る。

シーケンシングシステムは、段階４３０で、少なくとも第１のサンプル識別子又は第２のサンプル識別子に基づいて、複数の第２のリードを、第２のリードの複数の組織化された群に組織化することを開始するようにマッピング及びアラインメントユニットに命令することによって、プロセス４００の実行を継続することができる。第２のサンプル識別子に基づいて、複数の第２のリードを組織化された群に組織化することは、第２のリードの関連する二次解析処理を取得するために必要である。これは、１つ以上のデマルチプレックス動作を実行して、異なるサンプル識別子を有する第２のリードのセットを異なる組織化された群にマッピングすることを含み得、各第２のリードの組織化された群は、同じ第２のサンプル識別子を有する。シーケンシングシステムは、各第２のリードの組織化された群について、第２のリードの組織化された群に対する二次解析動作を実行する（段階４４０）プロセス４００の実行を継続することができる。いくつかの実装形態では、二次解析動作は、第１のリードと第２のリードとの組み合わせで実行することができる。

いくつかの実装形態では、シーケンシングシステムは、段階４３０及び段階４４０に進むことができる。そのような実装形態は、三次解析を促進し、核酸シーケンサのダウンタイムを低減する技術的利点を更に提供する。しかしながら、他の実装形態では、第１のリードの組織化された群のそれぞれについて、第１のリードのデマルチプレックス品質、第１のリードのマッピング及びアラインメント品質、又はその両方を記述する、受け取られた結果データが、１つ以上の所定の品質ルール又は閾値を満たすと判断される場合にのみ、シーケンシングシステムによるプロセス４００の実行は、複数の第２のリードを複数の組織化された群に組織化すること（４３０）を継続することができ、マッピング及びアラインメント、バリアントコール、又はその両方などの二次解析動作を実行することができる。

いくつかの実装形態では、シーケンシングシステムは、第２のデータが取得されている間、段階４２０で実行される第１のリードの組織化された群のマッピング及びアラインメント、バリアントコール、又はその両方の二次解析結果に依存し得る。他の実装形態では、段階４２０で実行される第１のリードの組織化された群に関連するこれらの初めの二次解析結果は、それらが評価されて第１のリード間隔の品質を決定した後に廃棄され得る。そのような例では、シーケンシングシステムは、段階４３０及び段階４４０で第２のリードの組織化された群の二次解析が完了する前又は完了した後のいずれかで、第１のリードの組織化された群の二次解析の第２のイテレーションを開始することができる。

図５は、核酸シーケンサ内の二次解析ユニットを使用して、１つ以上のサンプルのインクリメンタル二次解析を実行するためのシステム５００の一例のコンテクスト図である。システム５００は、概して、図３を参照して説明したシステム３００と同じであり、いくつかの違いがある。１つの違いは、二次解析ユニット５４０が、核酸シーケンサ５１０内に位置することである。明示的に述べられていない図５の任意の参照番号に関して、参照番号によって識別される構成要素は、図１又は図３の対応する特徴と同じ特徴を有する。例として、それぞれのクラスタ５２２－１、５２２－２、５２２－３、５２２－４、５２２－５、５２２－Ｎは、図５を参照して追加の又は異なる特徴が記載されない限り、図１のそれぞれクラスタ１２２－１、１２２－２、１２２－３、１２２－４、１２２－５、１２２－Ｎと同じ意味を有する。

図５の例と図３の例との間の別の違いは、核酸シーケンサが、第１のリード間隔の前に、各リードについてサンプル識別子又はインデックスを生成するように構成されていることである。このことは、ワークフロー５７０に示されており、ワークフロー５７０は、ＩＮＤ１及びＩＮＤ２がクラスタリング段階に続いて、ワークフロー５７０の第１のリード間隔の第１のリード「リード１」の前に生成されることを示す。図３のインデックスが第１のリード間隔の後に生成されるため、これは、図３の例におけるサンプル識別子又はインデックスの生成とは異なる。図５及び図６の実装形態は、「リード１」及び「リード２」に対する生成された別個のサンプル識別子又はインデックスとして説明されているが、本開示はそのように限定されない。代わりに、本開示の実装形態は、特定の断片の「リード１」及び「リード２」の両方を指す単一のサンプル識別子又はインデックス識別子のみを生成し得る。

第１のリード間隔の前にサンプル識別子を生成する利点は、リードが生成される際に、同じサンプル識別子を有するデマルチプレックスされた群にリードを組織化することが実行時に実行され得ることである。すべてのサンプル識別子の生成、及び実行時でのサンプル識別子に基づくリードを組織化する能力を考慮すると、システム５００は、第１のリード間隔中に第１のリードの組織化された群の二次解析を開始することができる。そのようなシナリオでは、各第１のリードの組織化された群について、デマルチプレックス統計、マッピング及びアラインメント統計、又はその両方を含む二次解析結果データは、第１のリード間隔中に取得及び評価することができ、そのため、結果データが満足のいく結果を示していない場合、第１のリード間隔を終了するオプションを可能にし、それによって試薬を節約する。

更に、第１のリード間隔中に第１のリードの組織化された群の二次解析の実行を開始する能力は、図１Ｂ及び図３を参照して説明したシステムの例よりも、三次解析動作への更に速い移行を可能にする。図５のシステムは、マッピング及びアラインメントされた第１のリードに基づき、かつ三次解析のための入力として使用されるバリアントの最初のセットが第１のリード間隔中に同定可能であることから、図１Ｂ及び図３のシステムよりも速く三次解析に移行することができる。これにより、第１のリード間隔の開始から約数時間以内に三次解析の開始が可能になる。これは、図１Ｂ及び図３の例とは対照的であり、これらはシーケンシングが完了する後まで、入力としてマッピング及びアラインメントされたリードの同定されたバリアントをそれぞれ使用する三次解析を開始しない可能性がある。

図５の例を参照すると、核酸シーケンサ５１０は、マッピング及びアラインメントユニット５４２ａを含むように、二次解析ユニット５４０のプログラマブル回路５４２を構成することができる。核酸シーケンサ５１０は、複数のサンプル１０５、サンプル１０６、サンプル１０７を受け取ることができる。サンプル１０５、サンプル１０６、サンプル１０７は、例えば、異なる種からの核酸サンプルを含むことができる。異なる種は、異なるヒト、異なる動物、異なる植物などであり得る。核酸シーケンサ５１０は、サンプル１０５、サンプル１０６、サンプル１０７を調製し、ワークフロー５７０の時間Ｔ１中にクラスタ生成を実行することができる。

クラスタ段階の終わりに、核酸シーケンサ５１０は、時間Ｔ２Ａ中に核酸シーケンサ５１０によって生成される各第１のリードについて、インデックス、又はサンプル識別子を生成することを開始する。時間Ｔ２Ａの終了時に、核酸シーケンサ５１０は、時間Ｔ２Ｂ中に核酸シーケンサ５１０によって生成される各第２のリードの生成インデックス又はサンプル識別子を開始する。各リードのインデックス又はサンプル識別子は、リードとサンプルとの間の論理的関係を作成するために使用され得る任意のデータを含むことができる。したがって、図５の例における時間Ｔ１＋Ｔ２Ａ＋Ｔ２Ｂの終了時に、インデックス又はサンプル識別子、インデックスは、第１のリード間隔中に核酸シーケンサ５１０によって生成される各第１のリードに対して作成されているか、又はインデックス又はサンプル識別子はまた、第２のリード間隔中に核酸シーケンサ５１０によって生成される各第２のリードに対して作成されている。

核酸シーケンサ５１０は、第１のリード５３０－１、５３０－３、５３２－１、５３２－３、５３４－１、５３４－３の少なくとも一部のマッピング及びアラインメントなどの二次解析動作を並列化するように構成されており、一方、核酸シーケンサ５１０は、時間Ｔ３中の第１のリード間隔の合成によるシーケンシングなどのシーケンシング動作を実行することを継続する。第１のリード間隔中の第１のリードの少なくとも一部分の二次解析を開始することは、各リードのインデックス又はサンプル識別子が、第１のリード間隔が完了した後まで生成されなかったため、図３の例では達成され得ない。対照的に、図５の例では、核酸シーケンサ５１０によって生成されるべき各リードのインデックス又はサンプル識別子インデックスは、事前に作成される。

図５の例では、第１のリード間隔は、ワークフロー５７０の時間Ｔ１＋Ｔ２Ａ＋Ｔ２Ｂの完了の後まで開始しない。Ｔ１＋Ｔ２Ａ＋Ｔ２Ｂの終了後、核酸シーケンサ５７０は、第１のリード間隔を開始することができる。第１のリード間隔を開始することは、１つ以上の第１のリード５３０－１、５３０－３、５３２－１、５３２－３、５３４－１、５３４－３を生成するための合成によるシーケンシングなどの一次解析シーケンシング動作を開始することを含み得る。第１のリード間隔「リード１」の開始から時間ＴＸの後、時間ＴＸ中に生成された１つ以上の第１のリード５３０－１、５３０－３、５３２－１は、次いで二次解析ユニット５４０のメモリ５４４、又は二次解析ユニット５４０、処理ユニット１５０、又はその両方によってアクセス可能な他のメモリに格納することができる。

核酸シーケンサ５１０は複数のサンプルをシーケンシングしているため、核酸シーケンサ５１０は、１つ以上の第１のリード５３０－１、５３０－３、５３２－１を第１のリードの１つ以上の組織化された群に組織化するために組織化動作を実行する必要がある。第１のリードを組織化することは、デマルチプレックスユニット５６２を使用して達成することができる。例えば、処理ユニット５５０は、メモリ５４４、メモリ５６０、又は他のメモリに格納された１つ以上のリードにアクセスし、デマルチプレックスユニット５６２のプログラムされた機能を実行して、１つ以上の第１のリード５３０－１、５３０－３、５３２－１を第１のリードの１つ以上の組織化された群にデマルチプレックスすることができる。デマルチプレックスすることは、それぞれの第１のリードについて、インデックス又はサンプル識別子に基づいて１つ以上の第１のリード５３０－１、５３０－３、５３２－１を組織化するために１つ以上のデマルチプレックス動作を使用して、達成することができる。デマルチプレックスされた第１のリードは、メモリ５４４、又はマッピング及びアラインメントユニット５４２ａにアクセス可能な他のメモリに格納することができる。

マッピング及びアラインメントユニット５４２ａは、メモリ５４４に格納した組織化された第１のリードにアクセスし、第１のリード間隔中に、デマルチプレックスされた第１のリードに対するリアルタイムマッピング及びアラインメント動作を実行することができる。二次解析ユニット５４０は、メモリ５４４に格納した第１のリードの各群について結果５４９を生成することができる。結果５４９は、デマルチプレックス統計、マッピング及びアラインメント統計、マッピング及びアラインメント結果、又はこれらの組み合わせを含むことができる。二次解析ユニット５４０は、受け取った結果をメモリ５６０に格納することができる。デマルチプレックス統計は、各サンプル識別子に対応するレコードの数などのデマルチプレックス品質を記述するデータを含むことができる。例えば、第１のリードの各グループのマッピング品質の指標を提供するＭＡＰＱスコア、各第１のリードの群のアラインメント品質の指標を提供するアラインメントスコアなどのマッピング及びアラインメント統計である。マッピング及びアラインメント結果５４９は、マッピング及びアラインメントされたリードを記述するデータを含むことができる。いくつかの実装形態では、これらのマッピング及びアラインメント結果は、より多くの第１のリードが生成され、それぞれの参照シーケンスにマッピング及びアラインメントされると動的に更新され得る。

図５の例では、プログラマブル回路５４２のハードワイヤード論理を使用して実装されたマッピング及びアラインメントユニット５４２ａの超高速実行時間は、マッピング及びアラインメントユニット５４２ａが、第１のリード間隔を実行するために核酸シーケンサ５１０によって必要とされる時間のほんの一部で第１のリード５３０－１、５３０－３、５３２－１、５３２－３、５３４－１、５３４－３のそれぞれのデマルチプレックスされた群のマッピング及びアラインメントを実行することを可能にする。例えば、いくつかの実装形態では、プログラマブル回路５４２ａは、第１のリード間隔「リード１」中に、ハードワイヤード論理における時間ＴＸの間に生成された第１のリードのデマルチプレックスした群のマッピング及びアラインメントを数分で又はそれ未満の時間で実行することができ、一方で、処理ユニット１５０によって実行されるソフトウェアを用いた第１のリード間隔全体の実行は、１２時間～２４時間かかり得る。したがって、核酸シーケンサ５１０又は１人以上のヒトユーザは、時間ＴＸ中に生成された第１のリードなどの第１のリードの二次解析の結果５４９を評価することができ、一方で、第１のリードの残りは、時間Ｔ３中に核酸シーケンサ５１０によって生成される。それから核酸シーケンサ５１０、核酸シーケンサ５１０のユーザ、人工知能エージェント若しくはモデル、又はこれらの組み合わせは、デマルチプレックス動作の品質、マッピング及びアラインメント動作の品質、又はこれらの両方に基づいて、結果５４９により、核酸シーケンサ５１０が第１のリード間隔中にシーケンシング動作の実行を継続するべきかどうか判定を行うことができる。第１のリード間隔中のシーケンシング動作を継続すべきかどうかに関するこの判定は、核酸シーケンサ５１０によって自動的に、人工知能エージェント又はモデルによって自動的に、核酸シーケンサのユーザ、又は図１Ｂの例を参照して説明したようにこれらの実体のそれぞれからの判定を記述するデータに基づいて行うことができる。

これらの技術を使用して、図５のシステム５００は、図１Ｂを参照して説明したより良好な技術的利点を提供する。すなわち、結果５４９が、第１のリード間隔中に既に生成された第１のリードの少なくとも一部のデマルチプレックス、第１のリード間隔中に既に生成された第１のリードの一部のアラインメント、又はその両方が、低品質であることを示す場合、システム５００は、第１のリード間隔中に追加のリードの生成を継続するために使用される試薬を節約することができる。既に生成された第１のリードのデマルチプレックス品質、既に生成された第１のリードのマッピング及びアラインメント品質、又はその両方が満足のいくものであるという判定がなされると、核酸シーケンサ５１０は、マッピング及びアラインメント結果５４９を廃棄することができる。他の実装形態では、第１のリード間隔と並行して実行される既に生成された第１のリードのマッピング及びアラインメントは、第１のリードの最終データランのマッピング及びアラインメントとして使用され得る。

デマルチプレックス並びにマッピング及びアラインメントに加えて、二次解析ユニット５４０はまた、第１のリード間隔「リード１」中にマッピング及びアラインメントされた第１のリードのうちの１つ以上の群のバリアントコール動作を実行することができる。例として、処理ユニット５５０を使用して、マッピング及びアラインメントされたリードを解析して、一塩基多型（ＳＮＰ）、挿入／欠失（インデル）、構造多型などの任意のバリアントの発生を同定することができるバリアントコールユニット５６４を実行することができる。いくつかの実装形態では、プログラマブル回路５４２は、例えば、核酸シーケンサ５１０によって、バリアントコール処理を補助するために動的に再構成することができる。例えば、プログラマブル回路５４２は、マッピング及びアラインメントされたリードの１つ以上の参照位置におけるバリアントが発生する可能性に対して確率計算を実行するために使用され得るＨＭＭユニットを含むように動的に再構成することができる。続いて、核酸シーケンサ５１０、又は他のコンピュータデバイスは、任意の同定されたバリアントを使用して、第１のリード間隔「リード１」中に１つ以上の三次解析動作を実行することができる。これは、三次解析に基づいて、実体への治療を促進するのに役立ち得る。実体は、患者、ヒト、対象、植物、動物などを含むことができる。

システム５００の例では、デマルチプレックス統計、マッピング及びアラインメント統計、又はその両方が低品質であるという判定に基づいて第１のリード間隔を終了する判定がなされる場合、システム５００はまた、第２のリード間隔「リード２」を終了し得る。したがって、システム５００は、低品質のデマルチプレックス結果、マッピング及びアラインメント結果、又はその両方が検出された場合に、更により多くの試薬を節約することができるという点で、図１Ｂ又は図３のシステムの例よりも優れた追加の利点を提供する。

しかしながら、システム５００の例を参照すると、デマルチプレックス結果、マッピング及びアラインメント結果、又はその両方が品質の閾値レベルを満たすと判定された場合、システム５００は、ワークフロー５７０で示すように、第２のリード間隔「リード２」の実行を開始することができる。いくつかの実装形態では、システム５００は、第２のリードの二次解析を並列化することなく、第２のリード間隔「リード２」を生成することができる。例えば、システム５００は、第１のリード間隔「リード１」中にシーケンシング品質を既に評価しているため、そのような実行が好ましい場合がある。しかしながら、他の実装形態では、システム５００は、第１のリードの二次解析が第１のリード間隔と並列化されたのと同じ方法で、第２のリードの二次解析を並列化することができる。

図５の例は、８のヌクレオチド及び３のサンプルを有するリードを有する例を記載している。ただし、本開示は、そのように限定されない。代わりに、この簡単な例は、本開示の特徴を理解しやすい方法で説明するために提示されている。実際には、本開示のＤＮＡ断片は、いくつかの実装形態では、例えば、最大６００のヌクレオチド、最大８００のヌクレオチド、最大１，０００のヌクレオチド、又はそれ以上を有し得、断片の各リードは、例えば、ＤＮＡ断片の各末端から５０のヌクレオチド、７５のヌクレオチド、１５０のヌクレオチド、２００のヌクレオチド、３００のヌクレオチド、５００のヌクレオチド、又はそれ以上を有し得る。同様に、図５又は他の任意の図も、断片のクラスタの数を限定するものとして解釈されるべきではない。例えば、核酸シーケンサ５１０は、複数の断片の数百万個のクラスタが同時にシーケンシングされる、大規模並列シーケンシングを実行することができる。

図５の例は、インデックス又はサンプル識別子を有するリードを生成するために使用される複数のサンプルに関するが、本開示はそのように限定されない。代わりに、システム５００はまた、すべてのリードが同じサンプルに属するためにインデックス付けされないリードを生成する単一サンプルの処理を行うためにも使用され得る。そのような実装形態では、同じプロセスが実行され得、第１のリード間隔は、クラスタリング段階の直後に開始される。そうして第１のリードの一部が第１のリード間隔「リード１」の間に生成されると、システム５００は、第１のリードの生成された部分をマッピング及びアラインメントユニット５４２ａにマッピング及びアラインメントのために提供してもよく、一方で、第１のリードの残りの部分は、デマルチプレックス段階を実行する必要なく、第１のリード間隔中に生成される。この実装形態では、第１のリードは、同じサンプルにすべて関連付けられているため、デマルチプレックスされる必要はない。次に同様に、マッピング及びアラインメントされた第１のリードの一部は、上述のように、第１のリード間隔「リード１」を使用してバリアントについて解析され得る。同様の判定は、例示的な図５に関して説明したように、第１のリード間隔及び第２のリード間隔を継続するかどうかに関して行うことができる。要するに、図５のシステム５００の単一のサンプル実装形態と図５の複数のサンプル実装形態との間の実質的な差は、単一のサンプル実装形態ではデマルチプレックス段階を実行する必要がないことである。

図６は、図５のワークフロー図に従って、インクリメンタル二次解析を実行するためのプロセス６００の一例のフローチャートである。一般に、プロセス６００は、複数の第１のサンプル識別子を生成することであって、各第１のサンプル識別子は、第１のリード間隔中に生成される特定のリードに対応する、ことと（６１０）、複数の第２サンプル識別子を生成することであって、各第２サンプルは、第２リード間隔中に生成される特定のリードに対応する、ことと（６２０）、第１のリード間隔中に複数の異なるサンプルから核酸シーケンシングデバイスによって生成された複数の第１のリードを記述する第１のデータを取得することであって、複数の第１のリードのそれぞれは、第１のサンプル識別子又は第２のサンプル識別子のうちの少なくとも１つに対応する、ことと（６３０）、段階６３０で第１のデータを取得している間に、（Ｉ）複数の第１のリードを、第１のリードのそれぞれに関連する少なくとも第１のサンプル識別子又は第２のサンプル識別子に基づいて組織化された群に組織化することと、（ＩＩ）各第１のリードの組織化された群について、第１のリードの組織化された群に対して二次解析動作を実行することと、（ＩＩＩ）各第１のリードの群の二次解析結果を格納することと（６４０）、第１のリード間隔の後に実行される第２のリード間隔中に複数の異なるサンプルから、核酸シーケンシングデバイスによって生成された複数の第２のリードを記述する第２のデータを取得することであって、複数の第２のリードのそれぞれは、第１のサンプル識別子又は第２のサンプル識別子のうちの少なくとも１つに対応する、ことと（６５０）、得られた第２のデータに対して二次解析を実行することと（６６０）、を含む。便宜上、限定されないが、これらの段階は、図５のシステム５００などのシーケンシングシステムによって実行されるように、以下でより詳細に説明される。

シーケンシングシステムは、複数の第１のサンプル識別子を生成する６１０ことによってプロセス６００の実行を開始することができ、各第１のサンプル識別子は、第１のリード間隔中に生成される特定のリードに対応する。いくつかの実装形態では、各第１のサンプル識別子は、インデックスタグシーケンスを含むことができる。インデックスタグシーケンスは、それぞれのサンプルがシーケンシングのために固定化される前に、各サンプルの標的ポリヌクレオチドに結合され得る。インデックスタグは、テンプレート調製工程の一部として標的に添加されるヌクレオチドの合成シーケンスであり得る。したがって、ライブラリ特異的インデックスタグは、サンプルの標的分子のそれぞれに結合した核酸シーケンスタグであり、その存在は、標的分子が単離された実体を示すか、又は同定するために使用される。いくつかの実装形態では、インデックスタグシーケンスは、合成シーケンスに埋め込まれたバーコードを含むことができる。

シーケンシングシステムは、段階６２０で、複数の第２のサンプル識別子を生成することによって、プロセス６００の実行を継続することができ、各第２のサンプル識別子は、第１のリード間隔の後に生じる第２のリード間隔中に生成される特定のリードに対応する。いくつかの実装形態では、各第２のサンプル識別子は、インデックスタグシーケンスを含むことができる。インデックスタグシーケンスは、それぞれのサンプルがシーケンシングのために固定化される前に、各サンプルの標的ポリヌクレオチドに結合され得る。インデックスタグは、テンプレート調製工程の一部として標的に添加されるヌクレオチドの合成シーケンスであり得る。したがって、ライブラリ特異的インデックスタグは、サンプルの標的分子のそれぞれに結合した核酸シーケンスタグであり、その存在は、標的分子が単離された実体を示すか、又は同定するために使用される。いくつかの実装形態では、インデックスタグシーケンスは、合成シーケンスに埋め込まれたバーコードを含むことができる。

シーケンシングシステムは、段階６３０で、核酸シーケンシングデバイスによって生成された複数の第１のリードを記述する第１のデータを、第１のリード間隔中に、複数の異なるサンプルから取得することによって、プロセス６００の実行を継続することができ、複数の第１のリードのそれぞれは、第１のサンプル識別子のうちの１つに対応する。第１のデータを取得することは、第１のデータがシーケンシングデバイスによって生成された後に、二次解析ユニットのメモリに１つ以上の第１のリードを表す第１のデータを格納することを含むことができる。二次解析ユニットのメモリデバイスは、二次解析動作を実行するように構成された二次解析ユニットの集積回路によってアクセス可能なメモリユニットであり得る。集積回路は、１つ以上のプログラマブル回路、１つ以上のＡＳＩＣ、又はこれらの組み合わせを含むことができる。いくつかの実装形態では、第１のデータの少なくとも一部は、第１のデータの別の部分が核酸シーケンシングデバイスによって生成されている間に、取得される。すなわち、１つ以上のリードの第１のセットを表すデータを取得し、二次解析ユニットのメモリに格納することができ、一方で、１つ以上の他の第１のリードは、第１のリード間隔中に核酸シーケンシングデバイスによって生成される。

複数の第１のリードの各リードは、ヌクレオチドの順序付けられたシーケンスからなり得る。いくつかの実装形態では、ヌクレオチドの順序付けられたシーケンスは、核酸断片の第１の末端のヌクレオチドに対応し得る。核酸断片は、シーケンシングを促進するためにクローン的に増幅されていてもよく、そのような実装形態では、ヌクレオチドの順序付けられたシーケンスは、核酸断片の複数のクローンを解析することによって決定され、リードのヌクレオチドを生成し得る。第１のリード間隔の前に生成された各第１のリードの各第１のサンプル識別子は、それぞれ、第１のリードが発生した特定のサンプルに対応する。第１のサンプル識別子は、シーケンシングシステムによって使用され、任意の特定の第１のリードに関連するサンプルを決定することができる。いくつかの実装形態では、サンプルを同定するデータは、バーコードを含むことができる。

第１のリード間隔中に段階６３０で第１のデータを取得する間に、シーケンシングシステムは、二次解析ユニットを使用して、既に核酸シーケンサによって生成された第１のリードのうちの１つ以上の追加の処理をリアルタイムで並列化することができる。いくつかの実装形態では、追加の処理は、（Ｉ）複数の第１のリードを、第１のリードのそれぞれに関連する少なくとも第１のサンプル識別子又は第２のサンプル識別子に基づいて組織化された群に組織化することと、（ＩＩ）各第１のリードの組織化された群について、第１のリードの組織化された群に対して二次解析動作を実行することと、（ＩＩＩ）各第１のリードの群の二次解析結果を格納することと（段階６４０）、を含むことができる。

サンプル識別子に基づいて１つ以上の第１のリードを組織化された群に組織化することは、複数のサンプルがシーケンシングされたときに関連する二次解析処理を取得するために必要である。これは、１つ以上のデマルチプレックス動作を実行して、異なる第１のサンプル識別子を有する１つ以上の第１のリードをそれぞれの組織化された群にマッピングすることを含み得、各第１のリードの組織化された群は、同じサンプル識別子を有する。デマルチプレックス動作の品質を記述するデマルチプレックス統計を生成することができる。例えば、デマルチプレックス統計は、各サンプル識別子に対応する第１のリードの数を示すことができる。いくつかの実装形態では、二次解析ユニットは、結果データを核酸シーケンサに戻し、結果データを１つ以上の人工知能エージェント若しくはモデルに提供するか、又は結果データをデマルチプレックス統計を記述する１人以上のヒトユーザに出力することができる。そのような例では、シーケンシングシステムは、デマルチプレックス統計によって記述されるデマルチプレックス動作の質に基づいて、プロセス６００を継続するか、又はこの時点でプロセス６００を終了するかどうかを判定することができる。あるいは、以下に説明するように、マッピング及びアラインメント動作が実行された後、そのようなデマルチプレックス統計を結果データとして戻すことができる。

１つ以上の第１のリードが組織化されると、シーケンシングシステムは、各第１のリードの組織化された群について、第１のリードの組織化された群に対する１つ以上の二次解析動作を、二次解析ユニットを使用して第１のリード間隔の残りの部分と並行して実行することができる。第１のリードの組織化された群に対して二次解析動作を実行することは、各第１のリードの組織化された群について、（Ｉ）核酸シーケンシングデバイスによって、第１のリードの組織化された群をマッピング及びアラインメントユニットに提供し、第１のリードの組織化された群を参照シーケンスにアラインメントすることと、（ＩＩ）マッピング及びアラインメントユニットを用いて、第１のリードの組織化された群を参照シーケンスにアラインメントすることと、（ＩＩＩ）マッピング及びアラインメントユニットから結果データを受け取ることと、（ＩＶ）段階６３０で第１のデータの取得が完了する前に、受け取ったアラインメント結果データを格納することと、を含むことができる。

いくつかの実装形態では、各第１のリードの組織化された群についての結果データを記述する出力データは、１人以上のヒトユーザによるレビューのために提供され得る。例えば、各第１のリードの組織化された群についての結果データを記述する出力データは、例えば、核酸シーケンシングデバイスに結合された、又は別の部屋若しくは建物に提供されたディスプレイ上に出力され得る。あるいは、又は加えて、各第１のリードの組織化された群についてのアラインメント結果を記述する出力データは、例えば、核酸シーケンシングデバイスに直接的又は間接的に通信可能に接続されたプリンタを使用して出力され、各第１のリードの組織化された群についてのアラインメント結果を記述するレポートを印刷することができる。

いくつかの実装形態では、シーケンシングシステム、１人以上のヒトユーザ、１つ以上の人工知能エージェント又はモデル、又はこれらの組み合わせは、第１のデータが段階６３０で取得されている間に、アラインメント結果を評価することができる。例えば、結果データは、取得された第１のリードのデマルチプレックス、取得された第１のリードのマッピング及びアラインメント、又は両方の組み合わせが、段階６３０で第１のデータの取得を継続するのに十分な品質であるかどうかを判定するために評価され得る。いくつかの実装形態では、第１のリードの組織化された群の結果データが１つ以上の所定のルール又は閾値を満たさない場合、核酸シーケンサは、段階６３０で第１のリード間隔中に第１のデータを取得することを停止するように命令され得る。あるいは、第１のリードの組織化された群の結果データが１つ以上の所定のルール又は閾値を満たすと判定された場合、核酸シーケンサは、段階６３０で第１のリード間隔中に第１のデータの取得を継続することが許可され得る。

いくつかの実装形態では、マッピング及びアラインメントされた第１のリードの各組織化された群は、第１のデータが段階６３０で取得されている間に、潜在的なバリアントの検出について評価することができる。そのような実装形態は、各群について同定されたバリアントの三次解析を、段階６３０の第１のリード間隔及び段階６５０の第２のリード間隔の両方が完了する後まで三次解析の開始を禁止する従来の方法よりも、迅速に達成することを可能にする。したがって、初めの診断は、三次解析に進む前に、第１のリード間隔、第２のリード間隔、第１のリード及び第２のリードのマッピング並びにアラインメントの完了を待つ必要がないことで、図１Ａに示される従来の方法より早く治療日を開始するために取得することができる。

段階６３０の終わりに、シーケンシングシステムは、第１のリード間隔の後に実行される第２のリード間隔中に、複数の異なるサンプルから、核酸シーケンシングデバイスによって生成された複数の第２のリードを記述する第２のデータを取得すること６５０によって、プロセス６００の実行を継続することができ、複数の第２のリードのそれぞれは、少なくとも第１のサンプル識別子又は第２のサンプル識別子のうちの１つに対応する。第２のデータを取得することは、第２のデータがシーケンシングデバイスによって生成された後に、第２のリード間隔中に生成された１つ以上の第２のリードを表す第２のデータを二次解析ユニットのデバイスのメモリに格納することを含むことができる。二次解析ユニットのメモリデバイスは、二次解析動作を実行するように構成された二次解析ユニットの集積回路によってアクセス可能なメモリユニットであり得る。集積回路は、１つ以上のプログラマブル回路、１つ以上のＡＳＩＣ、又はこれらの組み合わせを含むことができる。いくつかの実装形態では、第２のデータの少なくとも一部は、第２のデータの別の部分が核酸シーケンシングデバイスによって生成されている間に、取得される。すなわち、１つ以上のリードの第２のセットを表すデータを取得し、シーケンシングデバイスのメモリに格納することができ、一方で、１つ以上の他の第２のリードは、第２のリード間隔中に核酸シーケンシングデバイスによって生成される。

複数の第２のリードの各リードは、ヌクレオチドの順序付けられたシーケンスからなり得る。いくつかの実装形態では、ヌクレオチドの順序付けられたシーケンスは、核酸断片の第１の末端の反対側の核酸断片の第２の末端のヌクレオチドに対応し得る。核酸断片は、シーケンシングを促進するためにクローン的に増幅されていてもよく、そのような実装形態では、ヌクレオチドの順序付けられたシーケンスは、核酸断片の複数のクローンを解析することによって決定され、リードのヌクレオチドを生成し得る。第２のリード間隔の前に生成された各第２のリードの各第２のサンプル識別子は、それぞれ、第２のリードの特定の識別子に対応する。第２のサンプル識別子は、シーケンシングシステムによって使用され、任意の特定の第２のリードに関連するサンプルを決定することができる。いくつかの実装形態では、サンプルを同定するデータは、バーコードを含むことができる。

シーケンシングシステムは、得られた第２のデータの二次解析を実行すること６６０によって、プロセス６００の実行を継続することができる。いくつかの実装形態では、シーケンシングシステムは、段階６５０の完了後に段階６６０に進むことができる。プロセス６００の文脈において、これは、段階６４０の第１のリード間隔中にシーケンシング品質を評価することが可能であることによる迅速な三次解析及び核酸シーケンサのダウンタイムの低減などの本開示の利点の少なくともいくつかを達成したままで生じ得る。ただし、本開示は、そのように限定されない。代わりに、いくつかの実装形態では、シーケンシングシステムは、第１のリードの二次解析が第１のリード間隔と並列化されたのと同じ方法で、第２のリードの二次解析を並列化することができる。

いくつかの実装形態では、シーケンシングシステムは、第１のデータが第１のリード間隔中に取得されている間に、段階６４０で実行される第１のリードの組織化された群のマッピング及びアラインメント、バリアントコール、又はその両方の二次解析結果に依存し得る。他の実装形態では、段階６４０で実行される第１のリードの組織化された群に関連するこれらの初めの二次解析結果は、それらが評価されて第１のリード間隔の品質を決定した後に廃棄され得る。そのような例では、シーケンシングシステムは、段階６６０で第２のリードの組織化された群の二次解析が完了する前又は完了した後のいずれかで、第１のリードの組織化された群の二次解析の第２のイテレーションを開始することができる。

図７は、二次解析ユニットを使用してインクリメンタル二次解析を実行するためのプロセス中に実行される動作のワークフローを説明するワークフロー図７７０の一例である。ワークフロー図７７０は、図３に示すワークフロー図３７０と同じである。しかしながら、図７では、最終データラン中に実行される追加の動作のシーケンス７１０は、ワークフロー図７７０に重ねて示されている。

いくつかの実装形態では、最終データランは、二次解析、又は信頼性の閾値レベルを有する二次解析結果をもたらす他の追加の処理を含むことができる。従来のシーケンシングシステムでは、最終データランは、第１のリード間隔及び第２のリード間隔の両方が完了するまで、従来のシーケンシングシステムによって達成することができない。更に、そのような従来のシステムはまた、図１Ａに示されるように、第１のシーケンシングランの終了と第２のシーケンシングランの開始との間のシーケンサダウンタイムを有する。信頼性の閾値レベルを使用する例示的な実装形態が記載されているが、そのような閾値を利用しない他の実装形態を用いることもできる。

図７の例では、図３又は図５のシーケンシングシステムなどのシーケンシングシステムは、第２のリード間隔の終了前に時間ＴＹで最終データランを開始するように構成され得る。時間ＴＹは、例えば、第２のリード間隔の終了からの所定の数の１つ以上のシーケンシングサイクルであり得、サイクルとは、リードから単一の核酸を生成するのに必要な時間を指す。いくつかの実装形態では、核酸シーケンサは、第２のリード間隔「リード２」の終了から所定の数のシーケンシングサイクルであるときを検出し、第１のリード間隔「リード１」中に生成された１つ以上の第１のリードに対する二次解析の実行を開始するように構成することができる。第１のリードは、図７のワークフローにおける時間Ｔ３Ｂの終わりに以前にデマルチプレックスされた１つ以上の組織化されたリードのセットを含むことができる。二次解析の実行の開始は、例えば、マッピング及びアラインメント、マッピング及びアラインメントしたリードのバリアントコール、又はその両方を実行するように二次解析ユニットに命令することを含み得る。

開始されると、二次解析ユニットは、トリガされた二次解析動作が完了するまで、第１のシーケンシングランの第１のリード間隔及び第２のリード間隔中に生成するリードの二次解析動作の実行を継続することができる。図７に示すように、二次解析ユニットを使用した二次解析動作の実行は、第１のシーケンシングラン中に開始し、第１のシーケンシングランの完了後に始まる第２のシーケンシングラン中に実行を継続することができる。第１のシーケンシングラン中に生成されたリードに対する二次解析動作は、第２のシーケンシングラン中に完了する。したがって、第１のシーケンシングランに対応する二次解析の第２のシーケンシングランの動作へのこの並列化により、核酸シーケンサがシーケンシングランを継続するのを可能にし、シーケンサのダウンタイムがほとんど又は全くないため、試薬消費及びそれから生じる収益が増加する。第１のシーケンシングランの二次解析とオーバーラップする第２のシーケンシングランの動作としては、第２のシーケンシングランのセットアップ、クラスタリング、又は一次解析が挙げられ得るが、これらに限定されない。

図７の例では、第１のシーケンシングランの二次解析と第２のシーケンシングランの動作の並列化は、核酸シーケンサによって生成されたリードの品質を評価し、第２のリード間隔を継続すべきかどうかを判断するために実行されているのではない。代わりに、二次解析と第２のシーケンシングランの動作の並列化は、最終的なデータランの一部として実行され、三次解析中などの後続の動作での使用に適した最終結果データを作成する。

図８は、図７のワークフロー図に従って、インクリメンタル二次解析を実行するためのプロセス８００の一例のフローチャートである。一般に、第１のシーケンシングランの第１のリード間隔中に核酸シーケンシングデバイスによって生成された複数の第１のリードを記述する第１のデータを取得することと（８１０）、第１のリード間隔の後に実行される第１のシーケンシングランの第２のリード間隔中に核酸シーケンシングデバイスによって生成された複数の第２のリードを記述する第２のデータを取得することと（８２０）、段階８２０で第２のデータの少なくとも一部を取得する間に、少なくとも第１のデータ又は第２のデータに対して１つ以上の二次解析動作の実行を開始することと（８３０）、核酸シーケンシングデバイスを用いて、第２のシーケンシングランを実行することと（８４０）、段階８４０で核酸シーケンシングデバイスを使用して第２のシーケンシングランを実行する間に、（Ｉ）第１のデータ又は第２のデータに対して１つ以上の二次解析動作の実行を継続することと、（ＩＩ）二次解析動作の結果を表す結果データを格納すること（８５０）。便宜上、限定されないが、これらの段階は、それぞれ図１Ａのシステム１００、図３のシステム３００、又は図５のシステム５００などのシーケンシングシステムによって実行されるように、以下でより詳細に説明される。

シーケンシングシステムは、第１のシーケンシングランの第１のリード間隔中に、核酸シーケンシングデバイスによって生成された複数の第１のリードを記述する第１のデータを取得することによって、段階８１０でプロセス８００の実行を開始することができる。第１のデータを取得することは、第１のデータが核酸シーケンシングデバイスによって生成された後に、二次解析ユニットのメモリデバイスなどのメモリデバイス内に複数の第１のリードを記述する第１のデータを格納することを含むことができる。二次解析ユニットのメモリデバイスは、二次解析動作を実行するように構成された二次解析ユニットの集積回路によってアクセス可能なメモリユニットであり得る。集積回路は、１つ以上のプログラマブル回路、１つ以上のＡＳＩＣ、又はこれらの組み合わせを含むことができる。

複数の第１のリードの各リードは、ヌクレオチドの順序付けられたシーケンスからなり得る。いくつかの実装形態では、ヌクレオチドの順序付けられたシーケンスは、核酸断片の第１の末端のヌクレオチドに対応し得る。核酸断片は、シーケンシングを促進するためにクローン的に増幅されていてもよく、そのような実装形態では、ヌクレオチドの順序付けられたシーケンスは、核酸断片の複数のクローンを解析することによって決定され、リードのヌクレオチドを生成し得る。核酸シーケンシングデバイスは、ＤＮＡシーケンサ又はＲＮＡシーケンサを含む任意の核酸シーケンシングデバイスを含み得る。第１のシーケンシングランは、核酸シーケンシングデバイスによる１つ以上の生物学的サンプルの一次解析の完全な実行を含み得る。完全な第１のシーケンシングランの段階の例を図７に示し、それは、クラスタリング段階、第１のリード間隔、及び第２のリード間隔を含む。図７に示されるものなどのいくつかの実装形態では、一次解析はまた、１つ以上のインデックス化段階を含むことができる。

シーケンシングシステムは、段階８２０で、第１のリード間隔の後に実行される第１のシーケンシングランの第２のリード間隔中に、核酸シーケンシングデバイスによって生成された複数の第２のリードを記述する第２のデータを取得することによって、プロセス８００の実行を継続することができる。第２のデータを取得することは、第２のデータがシーケンシングデバイスによって生成された後に、二次解析ユニットのメモリに複数の第２のリードを表す第２のデータを格納することを含むことができる。二次解析ユニットのメモリデバイスは、二次解析動作を実行するように構成された二次解析ユニットの集積回路によってアクセス可能なメモリユニットであり得る。集積回路は、１つ以上のプログラマブル回路、１つ以上のＡＳＩＣ、又はこれらの組み合わせを含むことができる。いくつかの実装形態では、第２のデータの少なくとも一部は、第２のデータの別の部分が核酸シーケンシングデバイスによって生成されている間に、取得される。複数の第２のリードの各リードは、ヌクレオチドの順序付けられたシーケンスからなり得る。いくつかの実装形態では、ヌクレオチドの順序付けられたシーケンスは、核酸断片の第１の末端の反対側の核酸断片の第２の末端のヌクレオチドに対応し得る。核酸断片は、シーケンシングを促進するためにクローン的に増幅されていてもよく、そのような実装形態では、ヌクレオチドの順序付けられたシーケンスは、核酸断片の複数のクローンを解析することによって決定され、リードのヌクレオチドを生成し得る。

段階８２０で第２のデータの少なくとも一部を取得する間に、シーケンシングシステムは、段階８３０で、第１のデータ又は第２のデータに対する１つ以上の二次解析動作の実行を開始することによって、プロセス８００の実行を継続することができる。１つ以上の二次解析動作の実行を開始することは、二次解析動作を実行するためのハードワイヤード論理を含むプログラマブル回路を動的に構成することと、その後第１のシーケンシングラン中に生成された１つ以上のリードについて少なくとも１つの二次解析動作を実行することと、を含むことができる。例えば、シーケンシングシステムは、プログラマブル回路をマッピング及びアラインメントユニットとして動的に構成し、次いでマッピング及びアラインメントユニットのハードワイヤード論理を使用して、第１のシーケンシングラン中に生成された少なくとも１つのリードのマッピング及びアラインメントを実行することができる。他の実装形態では、１つ以上の二次解析動作の実行を開始することは、ＡＳＩＣに、第１のシーケンシングラン中に生成された１つ以上のリードに対する二次解析動作を実行するためにハードワイヤードデジタル論理を実行するように命令することを含み得る。

第１のシーケンシングラン中に複数のサンプルがシーケンシングされた場合などのいくつかの実装形態では、第１のリード又は第２のリードは、マッピング及びアラインメントの前に、デマルチプレックスされた群に組織化される必要があり得る。そのような実装形態では、第１のリード、第２のリード、又はその両方の組織化の少なくとも一部もまた、段階８２０中に実行され得る。

シーケンシングシステムは、第２のシーケンシングランを実行するために核酸シーケンシングデバイスを使用することによって、段階８４０で、プロセス８００の実行を継続することができる。第２のシーケンシングランは、核酸シーケンシングデバイスによる１つ以上の生物学的サンプルの一次解析の完全な実行を含むことができる。いくつかの実装形態では、第２のシーケンシングランは、第１のシーケンシングラン中にシーケンシングされたこれらの生物学的サンプルとは異なる、１つ以上の生物学的サンプルをシーケンシングすることができる。第２のシーケンシングランは、クラスタリング段階、第１のリード間隔、及び第２のリード間隔を含むことができる。いくつかの実装形態では、一次解析はまた、１つ以上のインデックス化段階を含み得る。

核酸シーケンシングデバイスを使用して、段階８４０で第２のシーケンシングランを実行する間に、（Ｉ）第１のデータ又は第２のデータに対して、１つ以上の二次解析動作の実行を継続することと８５０、（ＩＩ）二次解析動作の結果を表す結果データを格納することと、を含む。段階８１０又は段階８２０中に生成された第１のデータ又は第２のデータに対するそれぞれ１つ以上の二次解析動作の実行を継続することは、第１のデータ及び第２のデータに対する二次解析が完了するまで、第１のデータ及び第２のデータに対する二次解析の実行を継続することを含むことができる。例えば、第１のシーケンシングラン中に段階８３０で構成され得るハードワイヤードマッピング及びアラインメントユニットは、第１のリード、第２のリード、又はその両方のマッピング及びアラインメント動作が完了するまで、第２のシーケンシングラン中に、第１のリード、第２のリード、又はその両方のマッピング及びアラインメント動作を実行することを継続することができる。

図９は、動的プログラマブル回路コンテクストスイッチングを実行するためのプロセス９００の一例のフローチャートである。一般に、プロセス９００は、１つ以上のゲノムワークフロー属性を取得することと（９１０）、１つ以上のゲノムワークフロー属性に基づいて、プログラマブル回路のワークフローコンテクストスイッチングタイプを決定することであって、ワークフローコンテクストスイッチングタイプは、プログラマブル回路の再構成を定義する、ことと（９２０）、決定されたコンテクストスイッチングタイプを使用して、プログラマブル回路コントローラに二次解析を実行するように命令することと（９３０）、を含むことができる。便宜上、限定されないが、これらの段階は、それぞれ図１Ａのシステム１００、図３のシステム３００、又は図５のシステム５００などのシーケンシングシステムによって実行されるように、以下でより詳細に説明される。

シーケンシングシステムは、１つ以上のゲノムワークフロー属性を取得することによって、段階９１０で、プロセス９００の実行を開始することができる。いくつかの実装形態では、１つ以上のワークフロー属性は、核酸シーケンサのユーザによって選択されたワークフローを同定するワークフロー識別子を含むことができる。ゲノムワークフローは、例えば、全ゲノムシーケンシングワークフロー、エンリッチメントワークフロー、ＲＮＡワークフロー、アンプリコンワークフロー、シングルセルＲＮＡワークフローなどを含み得る。あるいは、又は加えて、１つ以上のワークフロー属性は、核酸シーケンサによってシーケンシングされるサンプルの数を記述するデータを含み得る。あるいは、又は加えて、１つ以上のワークフロー属性は、ワークフローの実行のための所定の時間閾値を含むことができる。あるいは、又は加えて、１つ以上のワークフロー属性は、核酸シーケンサに利用可能な利用可能計算リソースの量を含むことができる。

シーケンシングシステムは、段階９２０で、１つ以上のゲノムワークフロー属性に基づいて、プログラマブル回路のワークフローコンテクストスイッチングタイプを決定することによって、プロセス９００の実行を継続することができ、ワークフローコンテクストスイッチングタイプは、プログラマブル回路の再構成を定義する。ワークフローコンテクストスイッチングタイプを決定することは、１つ以上のワークフロー属性に基づいて、複数のコンテクストスイッチングタイプから特定のワークフローコンテクストスイッチングタイプを選択することを含み得る。

コンテクストスイッチングタイプは、プログラマブル回路が実行時に動的に再構成される方法を定義する。例として、第１のプログラマブル回路コンテクストは、プログラマブル回路インターレーシングアラインメント及びバリアントコール動作を含むことができる。そのような実装形態では、プログラマブル回路は、第１のサンプルに対応するリードを参照シーケンスにアラインメントするマッピング及びアラインメントとして構成されること、第１のアラインメントされたサンプルに対応するリードに対してバリアントコール動作を実行するバリアントコールユニットとして動的に再構成されること、第２サンプルに対応するリードを参照シーケンスにマッピング及びアラインメントするように動的に再構成されること、第２のアラインメントされたサンプルに対応するリードに対してバリアントコール動作を実行するバリアントコールユニットとして動的に再構成されること、などが可能である。この文脈において、プログラマブル回路は、マッピング及びアラインメントとバリアントコール動作との間で双方向に動的に切り替わることができる。この第１のプログラマブル回路コンテクストは、１つのみのサンプル、又は少数のサンプルが存在する場合に好ましい。

別の例として、第２のプログラマブル回路コンテクストは、すべての必要なアラインメントを実行し、次いで、アラインメントしたリードに対してすべての必要なバリアントコール動作を実行するプログラマブル回路を含むことができる。そのような実装形態では、プログラマブル回路は、すべてのサンプルがアラインメントされるまで、マッピング及びアラインメントユニットとして構成され、第１のサンプルをアラインメントさせ、第２のサンプルをアラインメントさせ、第３のものをアラインメントさせるなどすることができ、その後、アラインメントされた第１のサンプルに対してバリアントコール動作を実行するバリアントコールユニットとして動的に再構成され、第２のアラインメントされたサンプルにバリアントコール動作を実行し、第３のアラインメントされたサンプルにバリアントコール動作を実行するなどすることができる。コンテクストスイッチングは計算負荷が高いため、ワークフローのサンプル数が多い場合は、この第２のプログラマブル回路のコンテクストを選択することができる。

いくつかの実装形態では、シーケンシングシステムは、いくつかの方法で前述のコンテクストスイッチングタイプ間で決定することができる。例えば、いくつかの実装形態では、シーケンシングシステムは、核酸シーケンサのユーザによるワークフロー選択を示すワークフロー識別子などのデータを取得することができる。いくつかの実装形態では、シーケンシングシステムは、取得されたワークフロー識別子に論理的に関連する特定のコンテクストスイッチングタイプを自動的に選択するようにプログラムされ得る。論理関係は、例えば、ワークフロー識別子とコンテクストスイッチングタイプとの間の１対１のマッピングを含むことができる。

あるいは、又は加えて、シーケンシングシステムは、サンプルの数に基づいて前述のコンテクストスイッチングタイプ間で決定することができる。例えば、サンプルの所定の閾値数を設定することができる。そうして、核酸シーケンサが、特定のワークフローがサンプルの閾値数を超えると判定した場合、核酸シーケンサは、第２のプログラマブルコンテクストを選択することができる。あるいは、核酸シーケンスがサンプルの数がサンプルの閾値数を超えないと判定した場合、核酸シーケンサは、第１のプログラマブルコンテクストを選択することができる。

あるいは、又は加えて、シーケンシングシステムは、推定される二次解析実行時間に基づいて、前述のコンテクストスイッチングタイプ間で決定することができる。例えば、核酸シーケンサは、受け取ったワークフローを記述するデータを解析し、デフォルトのプログラマブル回路コンテクストを使用して推定される二次解析実行時間を推定するようにプログラムされ得、デフォルトのプログラマブル回路コンテクストは、第１のプログラマブル回路コンテクストである。そのような実装形態では、推定される二次解析実行時間が所定の閾値時間未満である場合、核酸シーケンサは、第１のプログラマブル回路コンテクストを選択することができる。あるいは、推定される二次解析実行時間が所定の閾値時間よりも多い場合、核酸シーケンサは、第２のプログラマブル回路コンテクストを選択することができる。

これらの前述の実装形態は、本開示によって使用され得るプログラマブル回路コンテクストタイプ及びコンテクストスイッチングの単なる例である。これらの例のいずれも、本開示の範囲を限定するものとして見なされるべきではない。代わりに、他のプログラマブル回路コンテクストタイプ及びコンテクストスイッチングタイプは、本開示の範囲内にある。

シーケンシングシステムは、プログラマブル回路コントローラに、決定されたコンテクストスイッチングタイプを使用して二次解析を実行するように命令することによって、段階９３０でプロセス９００の実行を継続することができる。プログラマブル回路コントローラは、プログラマブル回路のプログラマブル論理を構成するソフトウェア、ハードウェア、又は両方の組み合わせを含むことができる。受け取られた命令に基づいて、プログラマブル回路コントローラは、命令によって同定されたコンテクストスイッチングタイプを実行するように構成されたハードワイヤードデジタル論理を含むように、プログラマブル回路を動的に構成することができる。

図１０は、インクリメンタル二次解析を実行するためのシステムを実装するために使用することができるシステム構成要素の一例のブロック図である。

計算デバイス１０００は、デジタルコンピュータ（例えば、ラップトップ、デスクトップ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレーム及び他の適切なコンピュータ）の種々の形を表すことを意図する。いくつかの実装形態では、計算デバイス１０００は、図１、図３、又は図５の核酸シーケンサなどの核酸シーケンサであり得る。モバイル計算デバイス１０５０は、モバイル機器（例えば、パーソナルデジタルアシスタント、セルラー電話、スマートフォン、移動内蔵型無線システム、無線診断計算デバイス、及び他の類似の計算デバイス）の種々の形を表すことを意図とする。本明細書で示す構成要素、その接続及び関係、並びにその機能は、単なる例を意図しており、制限することを意図したものではない。

計算デバイス１０００は、プロセッサ１００２、メモリ１００４、格納デバイス１００６、メモリ１００４及び複数の高速拡張ポート１０１０に接続する高速インタフェース１００８、並びに低速拡張ポート１０１４及び格納デバイス１００６に接続する低速インタフェース１０１２を含む。プロセッサ１００２、メモリ１００４、格納デバイス１００６、高速インタフェース１００８、高速拡張ポート１０１０及び低速インタフェース１０１２のそれぞれは、種々のバスを使用して相互に接続され、一般のマザーボード上に又は必要に応じて他の方法で載置されてよい。プロセッサ１００２は、メモリ１００４内に又は格納デバイス１００６上に記憶した命令を含む、計算デバイス１０００内での実行のための命令を処理して、高速インタフェース１００８に連結されたディスプレイ１０１６などの外部入力／出力デバイス上でＧＵＩ用のグラフィカル情報を表示することができる。他の実装形態では、複数のプロセッサ及び／又は複数のバスを、適宜、複数のメモリ及び複数種類のメモリと共に使用できる。更に複数の計算デバイスを接続することができ、各デバイスは動作の一部（例えば、サーババンク、一群のブレードサーバ又はマルチプロセッサシステムとして）を提供する。いくつかの実装形態では、プロセッサ１００２は、シングルスレッドプロセッサである。いくつかの実装形態では、プロセッサ１００２は、マルチスレッドプロセッサである。いくつかの実装形態では、プロセッサ１００２は、量子コンピュータである。

メモリ１００４は、計算デバイス１０００内に情報を格納する。いくつかの実装形態で、メモリ１００４は、揮発性メモリユニット（複数可）である。別の実装形態では、メモリ１００４は、不揮発性メモリユニット（複数可）である。メモリ１００４はまた、磁気ディスク又は光ディスクなどの別の形態のコンピュータ可読媒体であり得る。

格納デバイス１００６は、計算デバイス１０００のための大容量ストレージを提供することができる。一実装形態では、格納デバイス１００６は、フロッピーディスクデバイス、ハードディスクデバイス、光ディスクデバイス、若しくはテープデバイス、フラッシュメモリ若しくは他の類似のソリッドステートメモリデバイス、又はストレージエリアネットワーク若しくは他の構成内のデバイスを含むデバイスのアレイなど、コンピュータ可読媒体とすることができるか、又はそれを内包することができる。命令は、情報媒体に格納することができる。命令は、１つ以上の処理デバイス（例えば、プロセッサ１００２）により実行されるとき、上述のような１つ以上の方法を実行する。命令はまた、コンピュータ又は機械可読媒体（例えば、メモリ１００４、格納デバイス１００６、又はプロセッサ１００２上のメモリ）などの１つ以上の格納デバイスによって格納することができる。高速インタフェース１００８は、計算デバイス１０００の帯域幅集約動作を管理するが、低速インタフェース１０１２は、より低い帯域幅集約動作を管理する。このような機能の割り当ては、一例にすぎない。いくつかの実装形態にて、高速インタフェース１００８は、メモリ１００４、ディスプレイ１０１６（例えば、グラフィックプロセッサ又はアクセラレータによって）に連結し、及び種々の拡張カード（図示せず）を利用できる高速拡張ポート１０１０に連結する。この実装形態では、低速コントローラ１０１２は、格納デバイス１００６及び低速拡張ポート１０１４に連結されている。低速拡張ポート１０１４（それは、種々通信ポート（例えば、ＵＳＢ、Ｂｌｕｅｔｏｏｔｈ、イーサネット、無線イーサネット）を含むことができる）は、１つ以上の入力／出力デバイス（例えば、キーボード、ポインティングデバイス、スキャナ、又はネットワークデバイス（例えば、スイッチ、又はルータ））に連結できる（例えばネットワークアダプタによって）。

計算デバイス１０００は、図に示すように多くの異なる形態で実装することができる。例えば、計算デバイスは、標準サーバ１０２０として実装され得る、又はこのようなサーバの群にて複数回実装され得る。加えて、計算デバイスは、ラップトップコンピュータ１０２２などのパーソナルコンピュータに実装できる。計算デバイスはまた、ラックサーバシステム１０２４の一部として実装できる。あるいは、計算デバイス１０００の構成要素は、モバイルデバイス（例えば、モバイル計算デバイス１０５０）の他の構成要素と組み合わせることができる。このようなデバイスのそれぞれは、計算デバイス１０００及びモバイル計算デバイス１０５０のうちの１つ以上を含むことができ、全システムは、互いに通信する複数の計算デバイスから構成され得る。

モバイル計算デバイス１０５０は、他の構成要素の中でも、プロセッサ１０５２、メモリ１０６４、入力／出力デバイス（例えば、ディスプレイ１０５４）、通信インタフェース１０６６、及びトランシーバ１０６８を含む。モバイル計算デバイス１０５０は、格納デバイス（例えば、マイクロドライブ又は他のデバイス）を備えて、追加の格納デバイスを提供することができる。プロセッサ１０５２、メモリ１０６４、ディスプレイ１０５４、通信インタフェース１０６６及びトランシーバ１０６８のそれぞれは、種々のバスを用いて相互に接続することができ、構成要素のいくつかは、一般のマザーボード上に又は必要に応じて他の方法で載置される。

プロセッサ１０５２は、メモリ１０６４に格納される命令を含む、モバイル計算デバイス１０５０内の命令を実行できる。プロセッサ１０５２は、別個の及び複数のアナログ並びにデジタルプロセッサを含む、チップのチップセットとして実装され得る。プロセッサ１０５２は、例えば、モバイル計算デバイス１０５０の他の構成要素の調整（例えば、ユーザインタフェースの制御、モバイル計算デバイス１０５０によるアプリケーションの実行、及びモバイル計算デバイス１０５０による無線通信）を提供できる。

プロセッサ１０５２は、ディスプレイ１０５４と連結した制御インタフェース１０５８及び表示インタフェース１０５６を通してユーザと通信できる。ディスプレイ１０５４は、例えば、ＴＦＴ（薄膜トランジスタ液晶）ディスプレイ、若しくはＯＬＥＤ（有機発光ダイオード）ディスプレイ、又は他の適切なディスプレイ技術でもよい。ディスプレイインタフェース１０５６は、ディスプレイ１０５４を駆動して、グラフィック及び他の情報をユーザに示す、適切な回路を含むことができる。制御インタフェース１０５８は、ユーザからコマンドを受け取り、それをプロセッサ１０５２への転送のために変換できる。そのうえ、外部インタフェース１０６２は、他のデバイスとモバイル計算デバイス１０５０との近距離領域の通信を可能にするように、プロセッサ１０５２との通信を提供できる。例えば、外部インタフェース１０６２は、いくつかの実装形態で有線通信を提供でき、又は他の実装形態で無線通信を提供でき、複数のインタフェースも使用できる。

メモリ１０６４は、モバイル計算デバイス１０５０内に情報を格納する。メモリ１０６４は、コンピュータ可読媒体（複数可）、揮発性メモリユニット（複数可）、又は不揮発性メモリユニット（複数可）のうちの１つ以上として実装され得る。また拡張メモリ１０７４も提供することができ、例えば、ＳＩＭＭ（ＳｉｎｇｌｅＩｎＬｉｎｅＭｅｍｏｒｙＭｏｄｕｌｅ、シングルインラインメモリモジュール）カードインタフェースを含むことができる、拡張インタフェース１０７２を介してモバイル計算デバイス１０５０に接続することができる。拡張メモリ１０７４は、増設格納空間をモバイル計算デバイス１０５０に提供できるか、又はモバイル計算デバイス１０５０のためのアプリケーション、若しくは他の情報を格納することもできる。具体的には、拡張メモリ１０７４は、上述のプロセスを実行する、又は補完する命令を含むことができ、セキュアな情報も含み得る。したがって、例えば、拡張メモリ１０７４は、モバイル計算デバイス１０５０のためのセキュリティモジュールとして提供されてもよく、モバイル計算デバイス１０５０のセキュアな使用を可能にする命令を用いてプログラムされてもよい。加えて、セキュアなアプリケーションは、ＳＩＭＭカードを介して、ハッキング不能な手法でＳＩＭＭカード上に識別情報を配置するなど、追加情報と共に提供され得る。

メモリは、例えば、後述するように、フラッシュメモリ及び／又はＮＶＲＡＭメモリ（不揮発性ランダムアクセスメモリ（ｎｏｎｖｏｌａｔｉｌｅｒａｎｄｏｍａｃｃｅｓｓｍｅｍｏｒｙ））を含むことができる。いくつかの実装形態では、命令は、１つ以上の処理デバイス（例えば、プロセッサ１０５２）によって実行されたときに、命令が上述のような１つ以上の方法を実行するように、情報キャリアに格納される。命令はまた、１つ以上のコンピュータ又は機械可読媒体などの１つ以上の格納デバイス（例えば、メモリ１０６４、拡張メモリ１０７４、又はプロセッサ１０５２上のメモリ）によって格納され得る。いくつかの実装形態では、命令は、例えば、トランシーバ１０６８、又は外部インタフェース１０６２の伝搬信号で受け取られ得る。

モバイル計算デバイス１０５０は、いくつかの場合、デジタル信号処理回路を含むことができる、通信インタフェース１０６６を介して無線で通信され得る。通信インタフェース１０６６は、とりわけ、ＧＳＭ音声電話（グローバル・システム・フォー・モバイル・コミュニケーションズ）、ＳＭＳ（ＳｈｏｒｔＭｅｓｓａｇｅＳｅｒｖｉｃｅ、ショートメッセージサービス）、ＥＭＳ（ＥｎｈａｎｃｅｄＭｅｓｓａｇｉｎｇＳｅｒｖｉｃｅ、拡大メッセージングサービス）、若しくはＭＭＳメッセージング（ＭｕｌｔｉｍｅｄｉａＭｅｓｓａｇｉｎｇＳｅｒｖｉｃｅ、マルチメディアメッセージングサービス）、ＣＤＭＡ（ｃｏｄｅｄｉｖｉｓｉｏｎｍｕｌｔｉｐｌｅａｃｃｅｓｓ、符号分割多元接続）、ＴＤＭＡ（ｔｉｍｅｄｉｖｉｓｉｏｎｍｕｌｔｉｐｌｅａｃｃｅｓｓ、時分割多元接続）、ＰＤＣ（ＰｅｒｓｏｎａｌＤｉｇｉｔａｌＣｅｌｌｕｌａｒ、パーソナルデジタルセルラ）、ＷＣＤＭＡ(登録商標)（ＷｉｄｅｂａｎｄＣｏｄｅＤｉｖｉｓｉｏｎＭｕｌｔｉｐｌｅＡｃｃｅｓｓ、広帯域符号分割多重接続）、ＣＤＭＡ２０００、若しくはＧＰＲＳ（ＧｅｎｅｒａｌＰａｃｋｅｔＲａｄｉｏＳｅｒｖｉｃｅ、汎用パケット無線サービス）、ＬＴＥ、５Ｇ／６Ｇセルラーなどの、様々なモード又はプロトコルの下での通信を提供することができる。そのような通信は、例えば、無線周波数を使用してトランシーバ１０６８を介して起こり得る。そのうえ、近距離通信は、Ｂｌｕｅｔｏｏｔｈ、Ｗｉ－Ｆｉ、又は他のこのような送受信機（図示せず）を使用するなどして行われることが可能である。更に、ＧＰＳ（ＧｌｏｂａｌＰｏｓｉｔｉｏｎｉｎｇＳｙｓｔｅｍ、全地球測位システム）受信器モジュール１０７０は、モバイル計算デバイス１０５０に対して追加のナビゲーション関連及び位置関連の無線データを提供することができ、モバイル計算デバイス１０５０上で作動するアプリケーションによって必要に応じて使用され得る。

モバイル計算デバイス１０５０はまた、ユーザから音声情報を受け取って、それを使用可能なデジタル情報に変換し得るオーディオコーデック１０６０を使用して、可聴的に通信できる。オーディオコーデック１０６０は同様に、例えば、モバイル計算デバイス１０５０のハンドセット内の、スピーカを介するなどして、ユーザのために可聴音を生成することができる。このような音は、音声電話通話からの音を含むことができ、録音された音（例えば、とりわけ、音声メッセージ、音楽ファイル）を含むことができ、また、モバイル計算デバイス１０５０上で作動するアプリケーションによって生成される音を含むこともできる。

モバイル計算デバイス１０５０は、図に示すようにいくつかの異なる形態で実装され得る。例えば、計算デバイスは、セルラー電話１０８０として実装され得る。また、計算デバイスを、スマートフォン１０８２、パーソナルデジタルアシスタント、又は他の同様のモバイルデバイスの一部として実装することもできる。

いくつかの実装形態を記載してきた。しかしながら、本開示の趣旨及び範囲を逸脱することなく、様々な変更を行い得ることが理解されるであろう。例えば、上述のフローの様々な形態を使用してもよく、工程を再順序付けし、追加し、又は除去してもよい。

本明細書に記載の本発明の実施形態、及び機能動作のすべては、本明細書に開示されている構造、及びこれらの構造的同等物を含む、デジタル電子回路、若しくはコンピュータソフトウェア、ファームウェア若しくはハードウェア、又はこれらのうちの１つ以上の組み合わせに実装することができる。本発明の実施形態は、１つ以上のコンピュータプログラム製品、例えば、データ処理装置による実行のために、又はデータ処理装置の動作を制御するためにコンピュータ可読媒体にコード化されるコンピュータプログラム命令のうちの１つ以上のモジュールとして実装することができる。コンピュータ可読媒体は、機械可読格納デバイス、機械可読格納基板、メモリデバイス、機械可読伝搬信号に影響を及ぼす組成物（ｃｏｍｐｏｓｉｔｉｏｎｏｆｍａｔｔｅｒ）、又はこれらのうちの１つ以上の組み合わせであり得る。「データ処理装置」という用語は、例としてプログラマブルプロセッサ、コンピュータ、又は複数のプロセッサ若しくはコンピュータを含む、データを処理するためのすべての装置、デバイス、及び機械を包含することができる。装置は、ハードウェアに加えて、問題のコンピュータプログラムのための実行環境を作り出すコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、又はこれらのうちの１つ以上の組み合わせを構成するコードを含むことができる。伝播信号は、人工的に生成された信号、例えば、適切な受信装置への伝送のための情報をコード化するために生成される機械生成された電気、光学、又は電磁信号である。

コンピュータプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、又はコードとしても知られる）は、コンパイル型言語又はインタープリタ型言語を含む任意の形式のプログラミング言語で記述することができ、スタンドアロンプログラムとして、又はモジュール、コンポーネント、サブルーチンとして、又は計算環境での使用に適した他のユニットとしてを含む任意の形態で展開することができる。コンピュータプログラムは、必ずしもファイルシステム内のファイルに対応しない。プログラムを、他のプログラム若しくはデータを保持するファイルの一部（例えば、マークアップ言語のドキュメントに格納される１つ以上のスクリプト）に、問題のプログラム専用の単一のファイルに、又は複数の連携ファイル（例えば、１つ以上のモジュール、サブプログラム又はコードの一部を保存するファイル）に格納できる。コンピュータプログラムを展開して、１つの場所にある、若しくは複数の場所に分散して、通信網によって相互接続される、１つのコンピュータ又は複数のコンピュータ上で実行することができる。

本明細書に記載のプロセス及び論理フローは、入力データを処理して出力を生成することによって機能を実行するために、１つ以上のコンピュータプログラムを実行する１つ以上のプログラマブルプロセッサによって実行され得る。プロセス及び論理フローはまた、特殊用途論理回路、例えば、ＦＰＧＡ（フィールドプログラマブルゲートアレイ）、又はＡＳＩＣ（特定用途向け集積回路）によって実行され得、及び装置はまた、特殊用途論理回路、例えば、ＦＰＧＡ（フィールドプログラマブルゲートアレイ）、又はＡＳＩＣ（特定用途向け集積回路）として実装され得る。

コンピュータプログラムの実行に適しているプロセッサは、例えば汎用及び特殊用途両方のマイクロプロセッサ、並びに任意の種類のデジタルコンピュータのうちの１つ以上の任意のプロセッサを含む。一般にプロセッサは、命令及びデータを、読み取り専用メモリ若しくはランダムアクセスメモリ、又は両方から受け取る。コンピュータの必須の要素は、命令を実行するためのプロセッサ、並びに命令及びデータを格納するための１つ以上のメモリデバイスである。一般に、コンピュータはまた、データを格納するための１つ以上の大容量記憶デバイス、例えば、磁気、光磁気ディスク若しくは光ディスクからデータを受け取る、大容量記憶デバイスへデータを送信する、若しくは両方のために、大容量記憶デバイスを含む、又は大容量記憶デバイスに動作可能に連結される。しかし、コンピュータはこのようなデバイスを備えている必要はない。更にコンピュータは、別のデバイス、例えば、いくつか例を挙げてみると、タブレットコンピュータ、携帯電話、パーソナルデジタルアシスタント（ＰＤＡ）、携帯オーディオプレーヤ、全地球測位システム（ＧＰＳ）受信器に組み込むことができる。コンピュータプログラム命令及びデータを格納するのに適したコンピュータ可読媒体には、不揮発性メモリ、媒体、及びメモリデバイスのすべての形態が含まれ、例えば、ＥＰＲＯＭ、ＥＥＰＲＯＭ、及びフラッシュメモリデバイスなどの半導体メモリデバイス、例えば、内部ハードディスク又は取り外し可能なディスクなどの磁気ディスク、磁気光学ディスク、並びにＣＤＲＯＭ及びＤＶＤ－ＲＯＭディスクなどが含まれる。プロセッサ及びメモリは、特殊用途論理回路により補うことができる、又は特殊用途論理回路に組み込むことができる。

ユーザとのインタラクションを提供するために、本発明の実施形態は、ユーザに情報を表示するためのディスプレイデバイス、例えば、ＣＲＴ（ｃａｔｈｏｄｅｒａｙｔｕｂｅ、陰極線管）又はＬＣＤ（ｌｉｑｕｉｄｃｒｙｓｔａｌｄｉｓｐｌａｙ、液晶ディスプレイ）モニタ、並びにユーザがコンピュータに入力を提供することができるキーボード及びポインティングデバイス、例えばマウス又はトラックボールを有するコンピュータ上に実装することができる。他の種類のデバイスを使用して、ユーザとのインタラクションを提供することもでき、例えば、ユーザに提供されるフィードバックは、任意の形態の感覚フィードバック、例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバックとすることができ、ユーザからの入力は、音響入力、発話入力、又は触覚入力を含む任意の形態で受信することができる。

本発明の実施形態は、例えばデータサーバとしての、バックエンド構成要素を含む計算システムで、又はミドルウェア構成要素、例えば、アプリケーションサーバを含む計算システムで、又はフロントエンド構成要素、例えばユーザが本発明の実装形態とインタラクションできるグラフィカルユーザインタフェース若しくはウェブブラウザを有するクライアントコンピュータを含む計算システムで、又はこのようなバックエンド、ミドルウェア、若しくはフロントエンドの構成要素の任意の組み合わせで、実装できる。システムの構成要素は、デジタルデータ通信、例えば通信ネットワークの任意の形態又は媒体によって相互接続できる。通信ネットワークの例として、ローカルエリアネットワーク（ｌｏｃａｌａｒｅａｎｅｔｗｏｒｋ、「ＬＡＮ」）、及び広域ネットワーク（ｗｉｄｅａｒｅａｎｅｔｗｏｒｋ、「ＷＡＮ」）、例えば、インターネットが挙げられる。

計算システムは、クライアント及びサーバを含むことができる。クライアント及びサーバは一般に、互いにリモートであり、通常、通信ネットワークを介してインタラクトする。クライアントとサーバとの関係は、それぞれのコンピュータ上で作動し、かつ互いにクライアント－サーバ関係を有するコンピュータプログラムによって生じる。

本明細書は多くの詳細を含むが、これらは、本発明の、又は特許請求され得るものの範囲を制限するとして解釈されてはならず、むしろ本発明の特定の実施形態に特有の特徴の説明として解釈されるべきである。別個の実施形態の文脈において本明細書に記載されている特定の特徴はまた、単一の実施形態において組み合わせて実装され得る。逆に、単一の実施形態の文脈で説明される様々な特徴はまた、複数の実施形態で別々に、又は任意の好適な部分組み合わせで実装され得る。更に、特徴が特定の組み合わせで機能するものと上述される場合があり、最初にそのように特許請求されていたとしても、特許請求された組み合わせからの１つ以上の特徴は、場合によっては組み合わせから削除することができ、特許請求された組み合わせは、部分的組み合わせ、又は部分的組み合わせの変形に関し得る。

同様に、動作は、特定の順序で図面に表されるが、このような動作が、所望の結果を得るために、示される特定の順序で若しくは順次実行される、又はすべての例示の動作が実行される必要があると理解されるべきではない。特定の状況では、マルチタスク及び並列処理が有利であり得る。更に、上述の実施形態の種々のシステム構成要素の分離は、すべての実施形態でこのような分離を必要とするとして理解されてはならず、記載したプログラムコンポーネント及びシステムは通常、単一のソフトウェア製品に一緒に統合することができる、又は複数のソフトウェア製品内にパッケージ化することができることを理解すべきである。

特定のファイル形式が言及されている各例では、他のファイルタイプ又はフォーマットで置換され得る。例えば、ＨＴＭＬファイルは、ＸＭＬ、ＪＳＯＮ、プレーンテキスト、又は他のタイプのファイルによって置き換えられ得る。更に、テーブル又はハッシュテーブルなどの特定のデータ構造が言及される場合、言及されたデータ構造の代わりに、他のデータ構造（スプレッドシート、リレーショナルデータベース、又は構造ファイルなど）を使用することができる。

他の実施形態
本発明をその詳細な説明と併せて記載してきたが、上述の説明は、添付の特許請求の範囲によって定義される本発明の範囲を例示し、限定しないように意図されていることが理解されるべきである。他の態様、利点、及び改変も、以下の特許請求の範囲の範囲内である。

本発明の特定の実施形態を記載してきた。他の実施形態は、以下の特許請求の範囲内にある。例えば、特許請求の範囲に列挙される工程は、異なる順序で実行することができ、それでも望ましい結果を達成することができる。

いくつかの実施形態を記載してきた。しかしながら、本発明の趣旨及び範囲から逸脱することなく、様々な変更を行うことができることが理解されるであろう。加えて、図に描示される論理フローは、所望の結果を達成するために、示される特定の順序、又は連続的な順序を必要としない。加えて、他の工程を提供することができ、又は記載されたフローから工程を排除することができ、記載されたシステムに他の構成要素を追加するか、又は記載されたシステムから除去することができる。したがって、他の実施形態は、以下の特許請求の範囲内にある。

１０５サンプル
１０６サンプル
１０７サンプル
１１０核酸シーケンサ
１１２ネットワーク
１２０フローセル
１４０二次解析ユニット
１４２プログラマブル回路
１４４メモリ
１４９結果
１５０処理ユニット
１６０メモリ
１６２デマルチプレックスユニット
１６４バリアントコールユニット
１７０ワークフロー
１７２シーケンシングラン
３１０核酸シーケンサ
３２０リモートコンピュータ
３４０二次解析ユニット
３４２プログラマブル回路
３４４メモリ
３５０処理ユニット
３５９結果
３６０メモリ
３６２デマルチプレックスユニット
３６４バリアントコールユニット
５１０核酸シーケンサ
５４０二次解析ユニット
５４２プログラマブル回路
５４４メモリ
５４９結果
５５０処理ユニット
５６０メモリ
５６２デマルチプレックスユニット
５６４バリアントコールユニット
１０００計算デバイス
１００２プロセッサ
１００４メモリ
１００６格納デバイス
１００８高速インタフェース
１０１０高速拡張ポート
１０１２低速インタフェース
１０１４低速拡張ポート
１０１６ディスプレイ
１０２０標準サーバ
１０２２ラップトップコンピュータ
１０２４ラックサーバシステム
１０５０モバイル計算デバイス
１０５２プロセッサ
１０５４ディスプレイ
１０５６ディスプレイインタフェース
１０５８制御インタフェース
１０６０オーディオコーデック
１０６２外部インタフェース
１０６４メモリ
１０６６通信インタフェース
１０６８トランシーバ
１０７０（ＧｌｏｂａｌＰｏｓｉｔｉｏｎｉｎｇＳｙｓｔｅｍ、全地球測位システム）受信器モジュール
１０７２拡張インタフェース
１０７４拡張メモリ
１０８０セルラー電話
１０８２スマートフォン

Claims

核酸シーケンスリードのインクリメンタル二次解析を実行するための方法であって、前記方法は、
（ｉ）第１のリード間隔中に核酸シーケンシングデバイスによって生成された複数の第１のリードを記述する第１のデータを取得することであって、前記第１のリードのそれぞれは、ヌクレオチドの第１の順序付けられたシーケンスを表す、ことと、
（ｉｉ）前記第１のリード間隔の後に実行される第２のリード間隔中に前記核酸シーケンシングデバイスによって生成された複数の第２のリードを記述する第２のデータを取得することであって、前記第２のリードのそれぞれは、ヌクレオチドの第２の順序付けられたシーケンスを表す、ことと、前記第２のデータが取得されている間に、
（ａ）前記核酸シーケンシングデバイスによって、前記第１のデータをマッピング及びアラインメントユニットに入力として提供することと、
（ｂ）前記マッピング及びアラインメントユニットからアラインメント結果を受け取ることと、
（ｃ）前記受け取られたアラインメント結果を格納することと、
その後、
（ｉｉｉ）前記マッピング及びアラインメントユニットに、前記複数の第２のリードを表す前記第２のデータの参照シーケンスへのアラインメントを開始するように命令することと、
を含む、方法。
前記マッピング及びアラインメントユニットの少なくとも一部が、プログラマブル論理デバイスを使用して実装される、請求項１に記載の方法。
前記プログラマブル回路が、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）である、請求項２に記載の方法。
前記マッピング及びアラインメントユニットの少なくとも一部が、特定用途向け集積回路（ＡＳＩＣ）を使用して実装される、請求項１に記載の方法。
前記マッピング及びアラインメントユニットが、前記核酸シーケンシングデバイス内に含まれる、請求項１に記載の方法。
前記第１のリードのうちの１つ以上が、第１のサンプル識別子を表すデータを含み、
前記第２のリードのうちの１つ以上が、第２のサンプル識別子を表すデータを含む、請求項１に記載の方法。
前記第２のデータが取得されている間に、
少なくとも第１のサンプル識別子又は第２のサンプル識別子に基づいて、前記１つ以上の第１のリードをそれぞれの群に組織化することと、
組織統計を生成することであって、前記組織統計は、各サンプル識別子に対応する第１のリードの数を示す、ことと、を更に含む、請求項６に記載の方法。
リードのクラスタの第２の部分をアラインメントする前に、又は前記リードのクラスタの前記第２の部分をアラインメントする間に、前記複数の第１のリードに対応する前記格納されたアラインメント結果を表す出力データを提供すること、を更に含む、請求項１に記載の方法。
前記マッピング及びアラインメントモジュールに、前記複数の第１のリードを表す前記データの前記参照シーケンスへの後続のアラインメントを開始するように命令すること、を更に含む、請求項１に記載の方法。
前記第２のデータを取得している間に、前記参照シーケンスにアラインメントされた前記複数の第１のリードを表す前記第１のデータの可能性のあるバリアントのセットを決定すること、を更に含む、請求項１に記載の方法。
前記複数の第２のリードを表す前記第２のデータの少なくとも一部が、前記複数の第２のリードを表す第２のデータの少なくとも異なる部分を取得している間にアラインメントされる、請求項１に記載の方法。
前記マッピング及びアラインメントユニットが、前記第２のデータを完全に取得する前に、所定の数のシーケンシングサイクルで、前記複数の第２のリードを表す前記第２のデータのアラインメントを開始するように命令される、請求項１に記載の方法。
核酸シーケンスリードのインクリメンタル二次解析を実行するためのシステムであって、前記システムは、
核酸シーケンシングデバイスと、
前記核酸シーケンシングデバイスの１つ以上のプロセッサによって実行されると、前記核酸シーケンシングデバイスに動作を実行させる命令を格納する１つ以上のメモリデバイスと、を含み、前記動作は、
（ｉ）第１のリード間隔中に核酸シーケンシングデバイスによって生成された複数の第１のリードを記述する第１のデータを取得することであって、前記第１のリードのそれぞれは、ヌクレオチドの第１の順序付けられたシーケンスを表す、ことと、
（ｉｉ）前記第１のリード間隔の後に実行される第２のリード間隔中に前記核酸シーケンシングデバイスによって生成された複数の第２のリードを記述する第２のデータを取得することであって、前記第２のリードのそれぞれは、ヌクレオチドの第２の順序付けられたシーケンスを表す、ことと、前記第２のデータが取得されている間に、
（ａ）前記核酸シーケンシングデバイスによって、前記第１のデータをマッピング及びアラインメントユニットに入力として提供することと、
（ｂ）前記マッピング及びアラインメントユニットからアラインメント結果を受け取ることと、
（ｃ）前記受け取られたアラインメント結果を格納することと、
その後、
（ｉｉｉ）前記マッピング及びアラインメントユニットに、前記複数の第２のリードを表す前記第２のデータの参照シーケンスへのアラインメントを開始するように命令することと、を含む、システム。
前記マッピング及びアラインメントユニットの少なくとも一部が、プログラマブル論理デバイスを使用して実装される、請求項１３に記載のシステム。
前記プログラマブル回路が、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）である、請求項１４に記載のシステム。
前記マッピング及びアラインメントユニットの少なくとも一部が、特定用途向け集積回路（ＡＳＩＣ）を使用して実装される、請求項１３に記載のシステム。
前記マッピング及びアラインメントユニットが、前記核酸シーケンシングデバイス内に含まれる、請求項１３に記載のシステム。
前記第１のリードのうちの１つ以上が、第１のサンプル識別子を表すデータを含み、
前記第２のリードのうちの１つ以上が、第２のサンプル識別子を表すデータを含む、請求項１３に記載のシステム。
前記動作が、
前記第２のデータが取得されている間に、
少なくとも第１のサンプル識別子又は第２のサンプル識別子に基づいて、前記１つ以上の第１のリードをそれぞれの群に組織化することと、
組織統計を生成することであって、前記組織統計は、各サンプル識別子に対応する第１のリードの数を示す、ことと、を更に含む、請求項１８に記載のシステム。
前記動作が、
リードのクラスタの第２の部分をアラインメントする前に、又は前記リードのクラスタの前記第２の部分をアラインメントする間に、前記複数の第１のリードに対応する前記格納されたアラインメント結果を表す出力データを提供すること、を更に含む、請求項１３に記載のシステム。
前記動作が、
前記マッピング及びアラインメントモジュールに、前記複数の第１のリードを表す前記データの前記参照シーケンスへの後続のアラインメントを開始するように命令すること、を更に含む、請求項１３に記載のシステム。
前記動作が、
前記第２のデータを取得している間に、前記参照シーケンスにアラインメントされた前記複数の第１のリードを表す前記第１のデータの可能性のあるバリアントのセットを決定すること、を更に含む、請求項１３に記載のシステム。
前記複数の第２のリードを表す前記第２のデータの少なくとも一部が、前記複数の第２のリードを表す第２のデータの少なくとも異なる部分を取得している間にアラインメントされる、請求項１３に記載のシステム。
前記マッピング及びアラインメントユニットが、前記第２のデータを完全に取得する前に、所定の数のシーケンシングサイクルで、前記複数の第２のリードを表す前記第２のデータのアラインメントを開始するように命令される、請求項１３に記載のシステム。
１つ以上のコンピュータによって実行されると、前記１つ以上のコンピュータに動作を実行させる命令を格納するコンピュータ可読記憶媒体であって、前記動作は、
（ｉ）第１のリード間隔中に核酸シーケンシングデバイスによって生成された複数の第１のリードを記述する第１のデータを取得することであって、前記第１のリードのそれぞれは、ヌクレオチドの第１の順序付けられたシーケンスを表す、ことと、
（ｉｉ）前記第１のリード間隔の後に実行される第２のリード間隔中に前記核酸シーケンシングデバイスによって生成された複数の第２のリードを記述する第２のデータを取得することであって、前記第２のリードのそれぞれは、ヌクレオチドの第２の順序付けられたシーケンスを表す、ことと、前記第２のデータが取得されている間に、
（ａ）前記核酸シーケンシングデバイスによって、前記第１のデータをマッピング及びアラインメントユニットに入力として提供することと、
（ｂ）前記マッピング及びアラインメントユニットからアラインメント結果を受け取ることと、
（ｃ）前記受け取られたアラインメント結果を格納することと、
その後、
（ｉｉｉ）前記マッピング及びアラインメントユニットに、前記複数の第２のリードを表す前記第２のデータの参照シーケンスへのアラインメントを開始するように命令することと、を含む、コンピュータ可読記憶媒体。
前記第１のリードのうちの１つ以上が、第１のサンプル識別子を表すデータを含み、
前記第２のリードのうちの１つ以上が、第２のサンプル識別子を表すデータを含む、請求項２５に記載のコンピュータ可読記憶媒体。
前記動作が、
前記第２のデータが取得されている間に、
少なくとも第１のサンプル識別子又は第２のサンプル識別子に基づいて、前記１つ以上の第１のリードをそれぞれの群に組織化することと、
組織統計を生成することであって、前記組織統計は、各サンプル識別子に対応する第１のリードの数を示す、ことと、を含む、請求項２６に記載のコンピュータ可読記憶媒体。
前記動作が、
リードのクラスタの第２の部分をアラインメントする前に、又は前記リードのクラスタの前記第２の部分をアラインメントする間に、前記複数の第１のリードに対応する前記格納されたアラインメント結果を表す出力データを提供すること、を更に含む、請求項２５に記載のコンピュータ可読記憶媒体。
前記動作が、
前記マッピング及びアラインメントモジュールに、前記複数の第１のリードを表す前記データの前記参照シーケンスへの後続のアラインメントを開始するように命令すること、を更に含む、請求項２５に記載のコンピュータ可読記憶媒体。
前記動作が、
前記第２のデータを取得している間に、前記参照シーケンスにアラインメントされた前記複数の第１のリードを表す前記第１のデータの可能性のあるバリアントのセットを決定すること、を更に含む、請求項２５に記載のコンピュータ可読記憶媒体。
前記複数の第２のリードを表す前記第２のデータの少なくとも一部が、前記複数の第２のリードを表す第２のデータの少なくとも異なる部分を取得している間にアラインメントされる、請求項２５に記載のコンピュータ可読記憶媒体。
前記マッピング及びアラインメントユニットが、前記第２のデータを完全に取得する前に、所定の数のシーケンシングサイクルで、前記複数の第２のリードを表す前記第２のデータのアラインメントを開始するように命令される、請求項２５に記載のコンピュータ可読記憶媒体。
核酸シーケンスリードのインクリメンタル二次解析を実行するための方法であって、前記方法は、
（ｉ）複数の第１の実体識別子を生成することであって、各実体の第１の識別子は、第１のリード間隔中に生成される特定のリードに対応する、ことと、
（ｉｉ）複数の第２の実体識別子を生成することであって、各第２の実体識別子は、第２のリード間隔中に生成される特定のリードに対応する、ことと、
（ｉｉｉ）第１のリード間隔中に、複数の異なるサンプルに基づいて、核酸シーケンシングデバイスによって生成された複数の第１のリードを記述する第１のデータを取得することであって、前記複数の第１のリードのそれぞれは、少なくとも前記第１の実体識別子又は前記第２の実体識別子に対応し、前記第１のデータが取得されている間に、前記方法は、
前記複数の第１のリードを、前記第１のリードのそれぞれに関連する第１の実体識別子又は第２の実体識別子に基づいて、組織化された群に組織化することと、
前記核酸シーケンシングデバイスによって、前記組織化された複数のリードを、ベースコールを参照シーケンスにアラインメントさせるように構成されたマッピング及びアラインメントユニットに提供することと、
前記マッピング及びアラインメントユニットから、アラインメント結果を受け取ることと、
前記受け取られたアラインメント結果を格納することと、を更に含む、ことと、
（ｉｖ）前記第１のリード間隔の後に実行される前記第２のリード間隔中に、複数の異なるサンプルに基づいて、前記核酸シーケンシングデバイスによって生成された複数の第２のリードを記述する第２のデータを取得することであって、前記複数の第２のリードのそれぞれは、少なくとも前記第１の実体識別子又は前記第２の実体識別子に対応する、ことと、
（ｖ）前記核酸シーケンシングデバイスによって、前記第２のデータを、前記第２のデータを参照シーケンスにアラインメントするように構成されたマッピング及びアラインメントユニットに提供することと、を含む、方法。
前記マッピング及びアラインメントユニットの少なくとも一部が、プログラマブル論理デバイスを使用して実装される、請求項３３に記載の方法。
前記プログラマブル回路が、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）である、請求項３４に記載の方法。
前記マッピング及びアラインメントユニットの少なくとも一部が、特定用途向け集積回路（ＡＳＩＣ）を使用して実装される、請求項３３に記載の方法。
前記マッピング及びアラインメントユニットが、前記核酸シーケンシングデバイス内に含まれる、請求項３３に記載の方法。
前記複数の第１のリードを組織化することが、各実体識別子に対応するリード数を示すデータを生成することを含む、請求項３３に記載の方法。
前記第２のデータを取得している間に、第１のリードの各組織化されたセットについて、前記参照シーケンスにアラインメントされた前記第１のリードの組織化されたセットの可能性のあるバリアントのセットを決定すること、を更に含む、請求項３３に記載の方法。
核酸シーケンスリードのインクリメンタル二次解析を実行するためのシステムであって、前記システムは、
核酸シーケンシングデバイスと、
前記核酸シーケンシングデバイスの１つ以上のプロセッサによって実行されると、前記核酸シーケンシングデバイスに動作を実行させる命令を格納する１つ以上のメモリデバイスと、を含み、前記動作は、
（ｉ）複数の第１の実体識別子を生成することであって、各実体の第１の識別子は、第１のリード間隔中に生成される特定のリードに対応する、ことと、
（ｉｉ）複数の第２の実体識別子を生成することであって、各第２の実体識別子は、第２のリード間隔中に生成される特定のリードに対応する、ことと、
（ｉｉｉ）第１のリード間隔中に、複数の異なるサンプルに基づいて、核酸シーケンシングデバイスによって生成された複数の第１のリードを記述する第１のデータを取得することであって、前記複数の第１のリードのそれぞれは、少なくとも前記第１の実体識別子又は前記第２の実体識別子に対応し、前記第１のデータが取得されている間に、前記方法は、
前記複数の第１のリードを、前記第１のリードのそれぞれに関連する第１の実体識別子又は第２の実体識別子に基づいて、組織化された群に組織化することと、
前記核酸シーケンシングデバイスによって、前記組織化された複数のリードを、ベースコールを参照シーケンスにアラインメントさせるように構成されたマッピング及びアラインメントユニットに提供することと、
前記マッピング及びアラインメントユニットから、アラインメント結果を受け取ることと、
前記受け取られたアラインメント結果を格納することと、を更に含む、ことと、
（ｉｖ）前記第１のリード間隔の後に実施される前記第２のリード間隔中に、複数の異なるサンプルに基づいて、前記核酸シーケンシングデバイスによって生成された複数の第２のリードを記述する第２のデータを取得することであって、前記複数の第２のリードのそれぞれは、少なくとも前記第１の実体識別子又は前記第２の実体識別子に対応する、ことと、
（ｖ）前記核酸シーケンシングデバイスによって、前記第２のデータを、前記第２のデータを参照シーケンスにアラインメントするように構成されたマッピング及びアラインメントユニットに提供することと、を含む、システム。
前記マッピング及びアラインメントユニットの少なくとも一部が、プログラマブル論理デバイスを使用して実装される、請求項４０に記載のシステム。
前記プログラマブル回路が、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）である、請求項４１に記載のシステム。
前記マッピング及びアラインメントユニットの少なくとも一部が、特定用途向け集積回路（ＡＳＩＣ）を使用して実装される、請求項４０に記載のシステム。
前記マッピング及びアラインメントユニットが、前記核酸シーケンシングデバイス内に含まれる、請求項４０に記載のシステム。
前記複数の第１のリードを組織化することが、各実体識別子に対応するリード数を示すデータを生成することを含む、請求項４０に記載のシステム。
前記動作が、
前記第２のデータを取得している間に、第１のリードの各組織化されたセットについて、前記参照シーケンスにアラインメントされた前記第１のリードの組織化されたセットの可能性のあるバリアントのセットを決定すること、を更に含む、請求項４０に記載のシステム。
１つ以上のコンピュータによって実行されると、前記１つ以上のコンピュータに動作を実行させる命令を格納するコンピュータ可読記憶媒体であって、前記動作は、
（ｉ）複数の第１の実体識別子を生成することであって、各実体の第１の識別子は、第１のリード間隔中に生成される特定のリードに対応する、ことと、
（ｉｉ）複数の第２の実体識別子を生成することであって、各第２の実体識別子は、第２のリード間隔中に生成される特定のリードに対応する、ことと、
（ｉｉｉ）第１のリード間隔中に、複数の異なるサンプルに基づいて、核酸シーケンシングデバイスによって生成された複数の第１のリードを記述する第１のデータを取得することであって、前記複数の第１のリードのそれぞれは、少なくとも前記第１の実体識別子又は前記第２の実体識別子に対応し、前記第１のデータが取得されている間に、前記方法は、
前記複数の第１のリードを、前記第１のリードのそれぞれに関連する第１の実体識別子又は第２の実体識別子に基づいて、組織化された群に組織化することと、
前記核酸シーケンシングデバイスによって、前記組織化された複数のリードを、ベースコールを参照シーケンスにアラインメントさせるように構成されたマッピング及びアラインメントユニットに提供することと、
前記マッピング及びアラインメントユニットから、アラインメント結果を受け取ることと、
前記受け取られたアラインメント結果を格納することと、を更に含む、ことと、
（ｉｖ）前記第１のリード間隔の後に実行される前記第２のリード間隔中に、複数の異なるサンプルに基づいて、前記核酸シーケンシングデバイスによって生成された複数の第２のリードを記述する第２のデータを取得することであって、前記複数の第２のリードのそれぞれは、少なくとも前記第１の実体識別子又は前記第２の実体識別子に対応する、ことと、
（ｖ）前記核酸シーケンシングデバイスによって、前記第２のデータを、前記第２のデータを参照シーケンスにアラインメントするように構成されたマッピング及びアラインメントユニットに提供することと、を含む、コンピュータ可読記憶媒体。
前記マッピング及びアラインメントユニットの少なくとも一部が、プログラマブル論理デバイスを使用して実装される、請求項４７に記載のコンピュータ可読記憶媒体。
前記プログラマブル回路が、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）である、請求項４８に記載のコンピュータ可読記憶媒体。
前記マッピング及びアラインメントユニットの少なくとも一部が、特定用途向け集積回路（ＡＳＩＣ）を使用して実装される、請求項４７に記載のコンピュータ可読記憶媒体。
前記マッピング及びアラインメントユニットが、前記核酸シーケンシングデバイス内に含まれる、請求項４７に記載のコンピュータ可読記憶媒体。
前記複数の第１のリードを組織化することが、各実体識別子に対応するリード数を示すデータを生成することを含む、請求項４７に記載のコンピュータ可読記憶媒体。
前記動作が、
前記第２のデータを取得している間に、第１のリードの各組織化されたセットについて、前記参照シーケンスにアラインメントされた前記第１のリードの組織化されたセットの可能性のあるバリアントのセットを決定すること、を更に含む、請求項４７に記載のコンピュータ可読記憶媒体。
核酸シーケンスリードのインクリメンタル二次解析を実行するための方法であって、前記方法は、
第１のシーケンシングランの第１のリード間隔中に、核酸シーケンシングデバイスによって生成された複数の第１のリードを記述する第１のデータを取得することと、
前記第１のリード間隔の後に実行される第１のシーケンシングランの第２のリード間隔中に、前記核酸シーケンシングデバイスによって生成された複数の第２のリードを記述する第２のデータを取得することと、前記第２のデータの少なくとも一部を取得している間に、
前記第１のデータ又は前記第２のデータに対する１つ以上の二次解析動作の実行を開始することと、
前記核酸シーケンシングデバイスを使用して、第２のシーケンシングランを実行することと、前記核酸シーケンシングデバイスを使用して、前記第２のシーケンシングランを実行している間に、
少なくとも前記第１のデータ又は前記第２のデータに対する前記１つ以上の二次解析動作の実行を継続することと、
前記二次解析動作の結果を表す結果データを格納することと、を含む、方法。
核酸シーケンスリードのインクリメンタル二次解析を実行するためのシステムであって、前記システムは、
核酸シーケンシングデバイスと、
前記核酸シーケンシングデバイスの１つ以上のプロセッサによって実行されると、前記核酸シーケンシングデバイスに動作を実行させる命令を格納する１つ以上のメモリデバイスと、を含み、前記動作は、
第１のシーケンシングランの第１のリード間隔中に、核酸シーケンシングデバイスによって生成された複数の第１のリードを記述する第１のデータを取得することと、
前記第１のリード間隔の後に実行される第１のシーケンシングランの第２のリード間隔中に、前記核酸シーケンシングデバイスによって生成された複数の第２のリードを記述する第２のデータを取得することと、前記第２のデータの少なくとも一部を取得している間に、
前記第１のデータ又は前記第２のデータに対する１つ以上の二次解析動作の実行を開始することと、
前記核酸シーケンシングデバイスを使用して、第２のシーケンシングランを実行することと、前記核酸シーケンシングデバイスを使用して、前記第２のシーケンシングランを実行している間に、
少なくとも前記第１のデータ又は前記第２のデータに対する前記１つ以上の二次解析動作の実行を継続することと、
前記二次解析動作の結果を表す結果データを格納することと、を含む、システム。
１つ以上のコンピュータによって実行されると、前記１つ以上のコンピュータに動作を実行させる命令を格納するコンピュータ可読記憶媒体であって、前記動作は、
第１のシーケンシングランの第１のリード間隔中に、核酸シーケンシングデバイスによって生成された複数の第１のリードを記述する第１のデータを取得することと、
前記第１のリード間隔の後に実行される第１のシーケンシングランの第２のリード間隔中に、前記核酸シーケンシングデバイスによって生成された複数の第２のリードを記述する第２のデータを取得することと、前記第２のデータの少なくとも一部を取得している間に、
前記第１のデータ又は前記第２のデータに対する１つ以上の二次解析動作の実行を開始することと、
前記核酸シーケンシングデバイスを使用して、第２のシーケンシングランを実行することと、前記核酸シーケンシングデバイスを使用して、前記第２のシーケンシングランを実行している間に、
少なくとも前記第１のデータ又は前記第２のデータに対する前記１つ以上の二次解析動作の実行を継続することと、
前記二次解析動作の結果を表す結果データを格納することと、を含む、コンピュータ可読記憶媒体。
核酸シーケンスリードの二次解析を実行するための方法であって、前記方法は、
１つ以上のゲノムワークフロー属性を取得することと、
前記１つ以上のゲノムワークフロー属性に基づいて、プログラマブル回路のワークフローコンテクストスイッチングタイプを決定することであって、前記ワークフローコンテクストスイッチングタイプは、前記プログラマブル回路の再構成サイクルを定義する、ことと、
前記決定されたコンテクストスイッチングタイプを使用して、前記プログラマブル回路のコントローラに二次解析を実行するように命令することと、を含む、方法。
核酸シーケンスリードの二次解析を実行するためのシステムであって、前記システムは、
１つ以上のコンピュータと、
１つ以上のプロセッサによって実行されると、前記１つ以上のコンピュータに動作を実行させる命令を格納する１つ以上のメモリデバイスと、を含み、前記動作は、
１つ以上のゲノムワークフロー属性を取得することと、
前記１つ以上のゲノムワークフロー属性に基づいて、プログラマブル回路のワークフローコンテクストスイッチングタイプを決定することであって、前記ワークフローコンテクストスイッチングタイプは、前記プログラマブル回路の再構成サイクルを定義する、ことと、
前記決定されたコンテクストスイッチングタイプを使用して、前記プログラマブル回路のコントローラに二次解析を実行するように命令することと、を含む、システム。
１つ以上のコンピュータによって実行されると、前記１つ以上のコンピュータに動作を実行させる命令を格納するコンピュータ可読記憶媒体であって、前記動作は、
１つ以上のゲノムワークフロー属性を取得することと、
前記１つ以上のゲノムワークフロー属性に基づいて、プログラマブル回路のワークフローコンテクストスイッチングタイプを決定することであって、前記ワークフローコンテクストスイッチングタイプは、前記プログラマブル回路の再構成サイクルを定義する、ことと、
前記決定されたコンテクストスイッチングタイプを使用して、前記プログラマブル回路のコントローラに二次解析を実行するように命令することと、を含む、コンピュータ可読記憶媒体。