JP2016526380A5

JP2016526380A5 -

Info

Publication number: JP2016526380A5
Application number: JP2016521519A
Authority: JP
Filing date: 2014-06-17
Publication date: 2017-07-27
Anticipated expiration: 2034-06-17

Description

本明細書における例はヒトに関し、かつ言葉は主にヒト関係事項に向けられているが、本明細書において記載される概念は、任意の植物または動物由来のゲノムに適用可能である。
[本発明1001]
検査サンプルにおけるY染色体のコピー数の評価のための、1つまたは複数のプロセッサーおよびシステムメモリーを含むコンピューターシステムで実践される方法であって、
コンピューターシステム上で、第1の複数の雌性個体の核酸サンプルから測定されたゲノム読み取りを含むトレーニングセットを提供する工程；
コンピューターシステムによって、該トレーニングセットの1個体あたり少なくとも約100,000個のゲノム読み取りを、Y染色体の参照配列を含む参照ゲノムにアラインメントし、それによって、アラインメントされたゲノム読み取りを含むトレーニング配列タグ、およびY染色体の参照配列上でのそれらの位置を提供する工程；
コンピューターシステムによって、Y染色体の参照配列を複数のビンに分割する工程；
コンピューターシステムによって、各ビンに位置するトレーニング配列タグの計数を決定する工程；
コンピューターシステムによって、各ビンにおけるトレーニング配列タグの計数に基づくマスキング閾値を超えるビンをマスキングする工程であって、それによって、検査サンプルにおけるY染色体のコピー数の評価のための、Y染色体のマスキングされた参照配列を提供する、工程
を含む、方法。
[本発明1002]
検査サンプルは胎児および母体の無細胞核酸を含む、本発明1001の方法。
[本発明1003]
シーケンサーを用いて、胎児および母体の無細胞核酸を含む検査サンプル由来の無細胞核酸をシーケンシングし、それによって検査サンプルのゲノム読み取りを生成する工程；ならびに
コンピューターシステムによって、検査サンプルのゲノム読み取りを参照配列にアラインメントし、それによって、アラインメントされたゲノム読み取りを含む検査配列タグおよびそれらの位置を提供する工程
をさらに含む、本発明1002の方法。
[本発明1004]
コンピューターシステムによって、Y染色体のマスキングされた参照配列上の検査配列タグの計数を測定する工程；
コンピューターシステムによって、Y染色体のマスキングされた参照配列上の検査配列タグの計数に基づき、検査サンプルにおけるY染色体のコピー数を評価する工程
をさらに含む、本発明1003の方法。
[本発明1005]
検査サンプルにおけるY染色体のコピー数を評価する工程は、
Y染色体のマスキングされた参照配列上の検査配列タグの計数から染色体量を算出する工程；ならびに
該染色体量および対照サンプルからのデータに基づき、検査サンプルにおけるY染色体のコピー数を評価する工程
を含む、本発明1004の方法。
[本発明1006]
染色体量は、（a）Y染色体のマスキングされた参照配列上での検査配列タグの網羅率と、（b）1種または複数種の正規化配列の網羅率との間の比として算出される、本発明1005の方法。
[本発明1007]
染色体量および対照サンプルからのデータから、正規化された染色体値を算出する工程；ならびに
該正規化された染色体値に基づき、検査サンプルにおけるY染色体のコピー数を評価する工程
をさらに含む、本発明1005の方法。
[本発明1008]
検査サンプルにおけるY染色体のコピー数を評価する工程は、胎児無細胞核酸のゲノムにおけるY染色体の有無を判定する工程を含む、本発明1004の方法。
[本発明1009]
検査サンプルにおけるY染色体のコピー数を評価する工程は、少なくとも1種の胎児異数性の有無を判定する工程を含む、本発明1004の方法。
[本発明1010]
マスキング閾値は、
コンピューターシステム上で、2つまたはそれ以上のマスキング閾値候補を提供する工程；
コンピューターシステムによって、該マスキング閾値候補を超えるビンをマスキングし、それによって2つまたはそれ以上のマスキングされた参照配列を提供する工程；
コンピューターシステムによって、該2つまたはそれ以上のマスキングされた参照配列のそれぞれに基づき、関心対象の遺伝子配列のコピー数の評価のための閾値評価指標を算出する工程；および
コンピューターシステム上で、最高の閾値評価指標を有する候補をマスキング閾値として選択する工程
によって決定される、本発明1001の方法。
[本発明1011]
閾値評価指標を算出する工程は、（a）トレーニングセットの雌性個体とは異なる雌性個体、および（b）Y染色体を有することが知られる雄性個体、の核酸サンプルに対してY染色体のコピー数を評価する工程を含む、本発明1010の方法。
[本発明1012]
閾値評価指標は、（a）の標準偏差で割った、（a）および（b）の平均間の差として算出される、本発明1011の方法。
[本発明1013]
複数のビンのそれぞれのサイズは、
コンピューターシステムによって、Y染色体の参照配列を候補ビンサイズのビンに分割する工程；
コンピューターシステムによって、該候補ビンサイズに基づき、ビン評価指標を算出する工程；
コンピューターシステム上で、種々の候補ビンサイズを用いて、本発明の先行工程を繰り返し反復し、それによって2つまたはそれ以上の異なる評価指標を産出する工程；および
コンピューターシステム上で、最高のビン評価指標を産出する候補ビンサイズをビンのサイズとして選択する工程
によって決定される、本発明1001の方法。
[本発明1014]
トレーニングセットの雌性個体は、Y染色体の参照配列上でのゲノム読み取りの異なる分布を特徴とする多様なアラインメントプロファイルを有する、本発明1001の方法。
[本発明1015]
トレーニングセットを提供する工程は、第2の複数の雌性個体を2つまたはそれ以上のクラスターに分割する工程、および第1の複数の雌性個体を形成するために該2つまたはそれ以上のクラスターのそれぞれにおいていくつかの個体を選択する工程を含む、本発明1014の方法。
[本発明1016]
2つまたはそれ以上のクラスターのそれぞれにおいていくつかの個体を選択する工程は、該2つまたはそれ以上のクラスターのそれぞれにおいて、等しい数の個体を選択する工程を含む、本発明1015の方法。
[本発明1017]
第2の複数の雌性個体を2つまたはそれ以上のクラスターに分割する工程は、階層型順序付き分割および縮小のハイブリッド（hierarchical ordered partitioning and collapsing hybrid）（HOPACH）クラスタリングを含む、本発明1015の方法。
[本発明1018]
ゲノム読み取りは、個体の全ゲノムにおけるいずれかの箇所由来の約20〜50bpの配列を含む、本発明1001の方法。
[本発明1019]
ビンサイズは約2000bpよりも小さい、本発明1001の方法。
[本発明1020]
マスキング閾値は、配列タグ計数の少なくとも約90パーセンタイルである、本発明1001の方法。
[本発明1021]
コンピューターシステムによって、トレーニングセットの1個体あたり少なくとも約10,000個のゲノム読み取りを、Y染色体の参照配列にアラインメントする工程を含む、本発明1001の方法。
[本発明1022]
検査サンプルにおける関心対象の遺伝子配列のコピー数の評価のためのシステムであって、
サンプルからの核酸配列情報を提供する、検査サンプル由来の核酸を受け取るためのシーケンサー；
プロセッサー；および
本発明1001の方法によって得られたマスキングされた参照配列を用いて、検査サンプルにおけるコピー数を評価する、該プロセッサーでの実行のための命令をそこに保存している1つまたは複数のコンピューター可読記憶媒体
を含む、システム。
[本発明1023]
検査サンプルにおける関心対象の遺伝子配列のコピー数の評価のためのシステムであって、該システムは、
サンプルからの核酸配列情報を提供する、検査サンプル由来の核酸を受け取るためのシーケンサー；
プロセッサー；および
マスクによってフィルタリングされたY染色体の参照配列を用いて、検査サンプルにおけるY染色体のコピー数を評価する、該プロセッサーでの実行のための命令をそこに保存している1つまたは複数のコンピューター可読記憶媒体
を含み、
該マスクは、Y染色体の参照配列上に特定のサイズのビンを含み、
該ビンは、そこにアラインメントされた、閾値を上回る数のトレーニング配列タグを有し、かつ
該トレーニング配列タグは、Y染色体の参照配列にアラインメントされた、第1の複数の雌性個体からのゲノム読み取りを含む、システム。
[本発明1024]
第1の複数の雌性個体は、Y染色体の参照配列にアラインメントされたゲノム読み取りの異なる分布を特徴とする多様なアラインメントプロファイルを有する、本発明1023のシステム。
[本発明1025]
第2の複数の雌性個体を2つまたはそれ以上のクラスターに分割し、かつ該2つまたはそれ以上のクラスターのそれぞれにおいて、等しい数の個体を第1の複数の雌性個体のメンバーとして選択することによって、第1の複数の雌性個体が選択された、本発明1024のシステム。
[本発明1026]
コンピューターシステムの1つまたは複数のプロセッサーによって実行される場合、胎児および母体の無細胞核酸を含む検査サンプルにおけるY染色体のコピー数の評価のための方法を該コンピューターシステムに実践させる、コンピューター実行可能な命令をそこに保存している1つまたは複数の非一時的なコンピューター可読記憶媒体を含むコンピュータープログラム製品であって、該方法は、
コンピューターシステム上で、第1の複数の雌性個体の核酸サンプルから測定されたゲノム読み取りを含むトレーニングセットを提供する工程；
コンピューターシステムによって、該トレーニングセットの1個体あたり少なくとも約100,000個のゲノム読み取りを、Y染色体の参照配列にアラインメントし、それによって、アラインメントされたゲノム読み取りを含むトレーニング配列タグ、およびY染色体の参照配列上でのそれらの位置を提供する工程；
コンピューターシステムによって、Y染色体の参照配列を特定のサイズのビンに分割する工程；
コンピューターシステムによって、各ビンに位置するトレーニング配列タグの計数を決定する工程；
コンピューターシステムによって、各ビンにおけるトレーニング配列タグの計数に基づくマスキング閾値を超えるビンをマスキングし、それによって、胎児および母体の無細胞核酸を含む検査サンプルにおけるY染色体のコピー数の評価のための、Y染色体のマスキングされた参照配列を提供する工程
を含む、コンピュータープログラム製品。

Claims

検査サンプルにおけるY染色体のコピー数の評価のための、1つまたは複数のプロセッサーおよびシステムメモリーを含むコンピューターシステムで実践される方法であって、
コンピューターシステム上で、第1の複数の雌性個体の核酸サンプルから測定されたゲノム読み取りを含むトレーニングセットを提供する工程；
コンピューターシステムによって、該トレーニングセットのゲノム読み取りを、Y染色体の参照配列を含む参照ゲノムにアラインメントし、それによって、アラインメントされたゲノム読み取りを含むトレーニング配列タグ、およびY染色体の参照配列上でのそれらの位置を提供する工程；
コンピューターシステムによって、Y染色体の参照配列を複数のビンに分割する工程；
コンピューターシステムによって、各ビンに位置するトレーニング配列タグの計数を決定する工程；
コンピューターシステムによって、各ビンにおけるトレーニング配列タグの計数に基づくマスキング閾値を超えるビンをマスキングする工程であって、それによって、検査サンプルにおけるY染色体のコピー数の評価のための、Y染色体のマスキングされた参照配列を提供する、工程
を含む、方法。
検査サンプルは胎児および母体の無細胞核酸を含む、請求項1記載の方法。
シーケンサーを用いて、胎児および母体の無細胞核酸を含む検査サンプル由来の無細胞核酸をシーケンシングし、それによって検査サンプルのゲノム読み取りを生成する工程；ならびに
コンピューターシステムによって、検査サンプルのゲノム読み取りを参照配列にアラインメントし、それによって、アラインメントされたゲノム読み取りを含む検査配列タグおよびそれらの位置を提供する工程
をさらに含む、請求項2記載の方法。
コンピューターシステムによって、Y染色体のマスキングされた参照配列上の検査配列タグの計数を測定する工程；
コンピューターシステムによって、Y染色体のマスキングされた参照配列上の検査配列タグの計数に基づき、検査サンプルにおけるY染色体のコピー数を評価する工程
をさらに含む、請求項3記載の方法。
検査サンプルにおけるY染色体のコピー数を評価する工程は、
Y染色体のマスキングされた参照配列上の検査配列タグの計数から染色体量を算出する工程；ならびに
該染色体量および対照サンプルからのデータに基づき、検査サンプルにおけるY染色体のコピー数を評価する工程
を含む、請求項4記載の方法。
染色体量は、（a）Y染色体のマスキングされた参照配列上での検査配列タグの網羅率と、（b）1種または複数種の正規化配列の網羅率との間の比として算出される、請求項5記載の方法。
染色体量および対照サンプルからのデータから、正規化された染色体値を算出する工程；ならびに
該正規化された染色体値に基づき、検査サンプルにおけるY染色体のコピー数を評価する工程
をさらに含む、請求項5記載の方法。
検査サンプルにおけるY染色体のコピー数を評価する工程は、胎児無細胞核酸のゲノムにおけるY染色体の有無を判定する工程を含む、請求項4記載の方法。
検査サンプルにおけるY染色体のコピー数を評価する工程は、少なくとも1種の胎児異数性の有無を判定する工程を含む、請求項4記載の方法。
マスキング閾値は、
コンピューターシステム上で、2つまたはそれ以上のマスキング閾値候補を提供する工程；
コンピューターシステムによって、該マスキング閾値候補を超えるビンをマスキングし、それによって2つまたはそれ以上のマスキングされた参照配列を提供する工程；
コンピューターシステムによって、該2つまたはそれ以上のマスキングされた参照配列のそれぞれに基づき、関心対象の遺伝子配列のコピー数の評価のための閾値評価指標を算出する工程；および
コンピューターシステム上で、最高の閾値評価指標を有する候補をマスキング閾値として選択する工程
によって決定される、請求項1記載の方法。
閾値評価指標を算出する工程は、（a）トレーニングセットの雌性個体とは異なる雌性個体、および（b）Y染色体を有することが知られる雄性個体、の核酸サンプルに対してY染色体のコピー数を評価する工程を含む、請求項10記載の方法。
閾値評価指標は、（a）の標準偏差で割った、（a）および（b）の平均間の差として算出される、請求項11記載の方法。
複数のビンのそれぞれのサイズは、
コンピューターシステムによって、Y染色体の参照配列を候補ビンサイズのビンに分割する工程；
コンピューターシステムによって、該候補ビンサイズに基づき、ビン評価指標を算出する工程；
コンピューターシステム上で、種々の候補ビンサイズを用いて、本請求項の先行工程を繰り返し反復し、それによって2つまたはそれ以上の異なる評価指標を産出する工程；および
コンピューターシステム上で、最高のビン評価指標を産出する候補ビンサイズをビンのサイズとして選択する工程
によって決定される、請求項1記載の方法。
トレーニングセットの雌性個体は、Y染色体の参照配列上でのゲノム読み取りの異なる分布を特徴とする多様なアラインメントプロファイルを有する、請求項1記載の方法。
トレーニングセットを提供する工程は、第2の複数の雌性個体を2つまたはそれ以上のクラスターに分割する工程、および第1の複数の雌性個体を形成するために該2つまたはそれ以上のクラスターのそれぞれにおいていくつかの個体を選択する工程を含む、請求項14記載の方法。
2つまたはそれ以上のクラスターのそれぞれにおいていくつかの個体を選択する工程は、該2つまたはそれ以上のクラスターのそれぞれにおいて、等しい数の個体を選択する工程を含む、請求項15記載の方法。
第2の複数の雌性個体を2つまたはそれ以上のクラスターに分割する工程は、階層型順序付き分割および縮小のハイブリッド（hierarchical ordered partitioning and collapsing hybrid）（HOPACH）クラスタリングを含む、請求項15記載の方法。
ゲノム読み取りは、個体の全ゲノムにおけるいずれかの箇所由来の約20〜50bpの配列を含む、請求項1記載の方法。
ビンサイズは約2000bpよりも小さい、請求項1記載の方法。
マスキング閾値は、配列タグ計数の少なくとも約90パーセンタイルである、請求項1記載の方法。
コンピューターシステムによって、トレーニングセットの1個体あたり少なくとも約10,000個のゲノム読み取りを、Y染色体の参照配列にアラインメントする工程を含む、請求項1記載の方法。
検査サンプルにおける関心対象の遺伝子配列のコピー数の評価のためのシステムであって、
サンプルからの核酸配列情報を提供する、検査サンプル由来の核酸を受け取るためのシーケンサー；
プロセッサー；および
請求項1記載の方法によって得られたマスキングされた参照配列を用いて、検査サンプルにおけるコピー数を評価する、該プロセッサーでの実行のための命令をそこに保存している1つまたは複数のコンピューター可読記憶媒体
を含む、システム。
検査サンプルにおける関心対象の遺伝子配列のコピー数の評価のためのシステムであって、該システムは、
サンプルからの核酸配列情報を提供する、検査サンプル由来の核酸を受け取るためのシーケンサー；
プロセッサー；および
マスクによってフィルタリングされたY染色体の参照配列を用いて、検査サンプルにおけるY染色体のコピー数を評価する、該プロセッサーでの実行のための命令をそこに保存している1つまたは複数のコンピューター可読記憶媒体
を含み、
該マスクは、Y染色体の参照配列上に特定のサイズのビンを含み、
該ビンは、そこにアラインメントされた、閾値を上回る数のトレーニング配列タグを有し、かつ
該トレーニング配列タグは、Y染色体の参照配列にアラインメントされた、第1の複数の雌性個体からのゲノム読み取りを含む、システム。
第1の複数の雌性個体は、Y染色体の参照配列にアラインメントされたゲノム読み取りの異なる分布を特徴とする多様なアラインメントプロファイルを有する、請求項23記載のシステム。
第2の複数の雌性個体を2つまたはそれ以上のクラスターに分割し、かつ該2つまたはそれ以上のクラスターのそれぞれにおいて、等しい数の個体を第1の複数の雌性個体のメンバーとして選択することによって、第1の複数の雌性個体が選択された、請求項24記載のシステム。
コンピューターシステムの1つまたは複数のプロセッサーによって実行される場合、胎児および母体の無細胞核酸を含む検査サンプルにおけるY染色体のコピー数の評価のための方法を該コンピューターシステムに実践させる、コンピューター実行可能な命令をそこに保存している1つまたは複数の非一時的なコンピューター可読記憶媒体を含むコンピュータープログラム製品であって、該方法は、
コンピューターシステム上で、第1の複数の雌性個体の核酸サンプルから測定されたゲノム読み取りを含むトレーニングセットを提供する工程；
コンピューターシステムによって、該トレーニングセットのゲノム読み取りを、Y染色体の参照配列にアラインメントし、それによって、アラインメントされたゲノム読み取りを含むトレーニング配列タグ、およびY染色体の参照配列上でのそれらの位置を提供する工程；
コンピューターシステムによって、Y染色体の参照配列を特定のサイズのビンに分割する工程；
コンピューターシステムによって、各ビンに位置するトレーニング配列タグの計数を決定する工程；
コンピューターシステムによって、各ビンにおけるトレーニング配列タグの計数に基づくマスキング閾値を超えるビンをマスキングし、それによって、胎児および母体の無細胞核酸を含む検査サンプルにおけるY染色体のコピー数の評価のための、Y染色体のマスキングされた参照配列を提供する工程
を含む、コンピュータープログラム製品。