JP2016526380A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2016526380A5 JP2016526380A5 JP2016521519A JP2016521519A JP2016526380A5 JP 2016526380 A5 JP2016526380 A5 JP 2016526380A5 JP 2016521519 A JP2016521519 A JP 2016521519A JP 2016521519 A JP2016521519 A JP 2016521519A JP 2016526380 A5 JP2016526380 A5 JP 2016526380A5
- Authority
- JP
- Japan
- Prior art keywords
- chromosome
- computer system
- sequence
- test sample
- reference sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 210000002593 Y Chromosome Anatomy 0.000 claims description 62
- 150000007523 nucleic acids Chemical class 0.000 claims description 24
- 230000000873 masking Effects 0.000 claims description 20
- 108020004707 nucleic acids Proteins 0.000 claims description 20
- 238000011156 evaluation Methods 0.000 claims description 12
- 230000001605 fetal Effects 0.000 claims description 12
- 210000000349 Chromosomes Anatomy 0.000 claims description 10
- 229920001850 Nucleic acid sequence Polymers 0.000 claims description 4
- 230000002759 chromosomal Effects 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 4
- 230000015654 memory Effects 0.000 claims description 3
- 238000000638 solvent extraction Methods 0.000 claims description 3
- 231100001075 aneuploidy Toxicity 0.000 claims description 2
- 238000000034 method Methods 0.000 claims description 2
Description
本明細書における例はヒトに関し、かつ言葉は主にヒト関係事項に向けられているが、本明細書において記載される概念は、任意の植物または動物由来のゲノムに適用可能である。
[本発明1001]
検査サンプルにおけるY染色体のコピー数の評価のための、1つまたは複数のプロセッサーおよびシステムメモリーを含むコンピューターシステムで実践される方法であって、
コンピューターシステム上で、第1の複数の雌性個体の核酸サンプルから測定されたゲノム読み取りを含むトレーニングセットを提供する工程;
コンピューターシステムによって、該トレーニングセットの1個体あたり少なくとも約100,000個のゲノム読み取りを、Y染色体の参照配列を含む参照ゲノムにアラインメントし、それによって、アラインメントされたゲノム読み取りを含むトレーニング配列タグ、およびY染色体の参照配列上でのそれらの位置を提供する工程;
コンピューターシステムによって、Y染色体の参照配列を複数のビンに分割する工程;
コンピューターシステムによって、各ビンに位置するトレーニング配列タグの計数を決定する工程;
コンピューターシステムによって、各ビンにおけるトレーニング配列タグの計数に基づくマスキング閾値を超えるビンをマスキングする工程であって、それによって、検査サンプルにおけるY染色体のコピー数の評価のための、Y染色体のマスキングされた参照配列を提供する、工程
を含む、方法。
[本発明1002]
検査サンプルは胎児および母体の無細胞核酸を含む、本発明1001の方法。
[本発明1003]
シーケンサーを用いて、胎児および母体の無細胞核酸を含む検査サンプル由来の無細胞核酸をシーケンシングし、それによって検査サンプルのゲノム読み取りを生成する工程;ならびに
コンピューターシステムによって、検査サンプルのゲノム読み取りを参照配列にアラインメントし、それによって、アラインメントされたゲノム読み取りを含む検査配列タグおよびそれらの位置を提供する工程
をさらに含む、本発明1002の方法。
[本発明1004]
コンピューターシステムによって、Y染色体のマスキングされた参照配列上の検査配列タグの計数を測定する工程;
コンピューターシステムによって、Y染色体のマスキングされた参照配列上の検査配列タグの計数に基づき、検査サンプルにおけるY染色体のコピー数を評価する工程
をさらに含む、本発明1003の方法。
[本発明1005]
検査サンプルにおけるY染色体のコピー数を評価する工程は、
Y染色体のマスキングされた参照配列上の検査配列タグの計数から染色体量を算出する工程;ならびに
該染色体量および対照サンプルからのデータに基づき、検査サンプルにおけるY染色体のコピー数を評価する工程
を含む、本発明1004の方法。
[本発明1006]
染色体量は、(a)Y染色体のマスキングされた参照配列上での検査配列タグの網羅率と、(b)1種または複数種の正規化配列の網羅率との間の比として算出される、本発明1005の方法。
[本発明1007]
染色体量および対照サンプルからのデータから、正規化された染色体値を算出する工程;ならびに
該正規化された染色体値に基づき、検査サンプルにおけるY染色体のコピー数を評価する工程
をさらに含む、本発明1005の方法。
[本発明1008]
検査サンプルにおけるY染色体のコピー数を評価する工程は、胎児無細胞核酸のゲノムにおけるY染色体の有無を判定する工程を含む、本発明1004の方法。
[本発明1009]
検査サンプルにおけるY染色体のコピー数を評価する工程は、少なくとも1種の胎児異数性の有無を判定する工程を含む、本発明1004の方法。
[本発明1010]
マスキング閾値は、
コンピューターシステム上で、2つまたはそれ以上のマスキング閾値候補を提供する工程;
コンピューターシステムによって、該マスキング閾値候補を超えるビンをマスキングし、それによって2つまたはそれ以上のマスキングされた参照配列を提供する工程;
コンピューターシステムによって、該2つまたはそれ以上のマスキングされた参照配列のそれぞれに基づき、関心対象の遺伝子配列のコピー数の評価のための閾値評価指標を算出する工程;および
コンピューターシステム上で、最高の閾値評価指標を有する候補をマスキング閾値として選択する工程
によって決定される、本発明1001の方法。
[本発明1011]
閾値評価指標を算出する工程は、(a)トレーニングセットの雌性個体とは異なる雌性個体、および(b)Y染色体を有することが知られる雄性個体、の核酸サンプルに対してY染色体のコピー数を評価する工程を含む、本発明1010の方法。
[本発明1012]
閾値評価指標は、(a)の標準偏差で割った、(a)および(b)の平均間の差として算出される、本発明1011の方法。
[本発明1013]
複数のビンのそれぞれのサイズは、
コンピューターシステムによって、Y染色体の参照配列を候補ビンサイズのビンに分割する工程;
コンピューターシステムによって、該候補ビンサイズに基づき、ビン評価指標を算出する工程;
コンピューターシステム上で、種々の候補ビンサイズを用いて、本発明の先行工程を繰り返し反復し、それによって2つまたはそれ以上の異なる評価指標を産出する工程;および
コンピューターシステム上で、最高のビン評価指標を産出する候補ビンサイズをビンのサイズとして選択する工程
によって決定される、本発明1001の方法。
[本発明1014]
トレーニングセットの雌性個体は、Y染色体の参照配列上でのゲノム読み取りの異なる分布を特徴とする多様なアラインメントプロファイルを有する、本発明1001の方法。
[本発明1015]
トレーニングセットを提供する工程は、第2の複数の雌性個体を2つまたはそれ以上のクラスターに分割する工程、および第1の複数の雌性個体を形成するために該2つまたはそれ以上のクラスターのそれぞれにおいていくつかの個体を選択する工程を含む、本発明1014の方法。
[本発明1016]
2つまたはそれ以上のクラスターのそれぞれにおいていくつかの個体を選択する工程は、該2つまたはそれ以上のクラスターのそれぞれにおいて、等しい数の個体を選択する工程を含む、本発明1015の方法。
[本発明1017]
第2の複数の雌性個体を2つまたはそれ以上のクラスターに分割する工程は、階層型順序付き分割および縮小のハイブリッド(hierarchical ordered partitioning and collapsing hybrid)(HOPACH)クラスタリングを含む、本発明1015の方法。
[本発明1018]
ゲノム読み取りは、個体の全ゲノムにおけるいずれかの箇所由来の約20〜50bpの配列を含む、本発明1001の方法。
[本発明1019]
ビンサイズは約2000bpよりも小さい、本発明1001の方法。
[本発明1020]
マスキング閾値は、配列タグ計数の少なくとも約90パーセンタイルである、本発明1001の方法。
[本発明1021]
コンピューターシステムによって、トレーニングセットの1個体あたり少なくとも約10,000個のゲノム読み取りを、Y染色体の参照配列にアラインメントする工程を含む、本発明1001の方法。
[本発明1022]
検査サンプルにおける関心対象の遺伝子配列のコピー数の評価のためのシステムであって、
サンプルからの核酸配列情報を提供する、検査サンプル由来の核酸を受け取るためのシーケンサー;
プロセッサー;および
本発明1001の方法によって得られたマスキングされた参照配列を用いて、検査サンプルにおけるコピー数を評価する、該プロセッサーでの実行のための命令をそこに保存している1つまたは複数のコンピューター可読記憶媒体
を含む、システム。
[本発明1023]
検査サンプルにおける関心対象の遺伝子配列のコピー数の評価のためのシステムであって、該システムは、
サンプルからの核酸配列情報を提供する、検査サンプル由来の核酸を受け取るためのシーケンサー;
プロセッサー;および
マスクによってフィルタリングされたY染色体の参照配列を用いて、検査サンプルにおけるY染色体のコピー数を評価する、該プロセッサーでの実行のための命令をそこに保存している1つまたは複数のコンピューター可読記憶媒体
を含み、
該マスクは、Y染色体の参照配列上に特定のサイズのビンを含み、
該ビンは、そこにアラインメントされた、閾値を上回る数のトレーニング配列タグを有し、かつ
該トレーニング配列タグは、Y染色体の参照配列にアラインメントされた、第1の複数の雌性個体からのゲノム読み取りを含む、システム。
[本発明1024]
第1の複数の雌性個体は、Y染色体の参照配列にアラインメントされたゲノム読み取りの異なる分布を特徴とする多様なアラインメントプロファイルを有する、本発明1023のシステム。
[本発明1025]
第2の複数の雌性個体を2つまたはそれ以上のクラスターに分割し、かつ該2つまたはそれ以上のクラスターのそれぞれにおいて、等しい数の個体を第1の複数の雌性個体のメンバーとして選択することによって、第1の複数の雌性個体が選択された、本発明1024のシステム。
[本発明1026]
コンピューターシステムの1つまたは複数のプロセッサーによって実行される場合、胎児および母体の無細胞核酸を含む検査サンプルにおけるY染色体のコピー数の評価のための方法を該コンピューターシステムに実践させる、コンピューター実行可能な命令をそこに保存している1つまたは複数の非一時的なコンピューター可読記憶媒体を含むコンピュータープログラム製品であって、該方法は、
コンピューターシステム上で、第1の複数の雌性個体の核酸サンプルから測定されたゲノム読み取りを含むトレーニングセットを提供する工程;
コンピューターシステムによって、該トレーニングセットの1個体あたり少なくとも約100,000個のゲノム読み取りを、Y染色体の参照配列にアラインメントし、それによって、アラインメントされたゲノム読み取りを含むトレーニング配列タグ、およびY染色体の参照配列上でのそれらの位置を提供する工程;
コンピューターシステムによって、Y染色体の参照配列を特定のサイズのビンに分割する工程;
コンピューターシステムによって、各ビンに位置するトレーニング配列タグの計数を決定する工程;
コンピューターシステムによって、各ビンにおけるトレーニング配列タグの計数に基づくマスキング閾値を超えるビンをマスキングし、それによって、胎児および母体の無細胞核酸を含む検査サンプルにおけるY染色体のコピー数の評価のための、Y染色体のマスキングされた参照配列を提供する工程
を含む、コンピュータープログラム製品。
[本発明1001]
検査サンプルにおけるY染色体のコピー数の評価のための、1つまたは複数のプロセッサーおよびシステムメモリーを含むコンピューターシステムで実践される方法であって、
コンピューターシステム上で、第1の複数の雌性個体の核酸サンプルから測定されたゲノム読み取りを含むトレーニングセットを提供する工程;
コンピューターシステムによって、該トレーニングセットの1個体あたり少なくとも約100,000個のゲノム読み取りを、Y染色体の参照配列を含む参照ゲノムにアラインメントし、それによって、アラインメントされたゲノム読み取りを含むトレーニング配列タグ、およびY染色体の参照配列上でのそれらの位置を提供する工程;
コンピューターシステムによって、Y染色体の参照配列を複数のビンに分割する工程;
コンピューターシステムによって、各ビンに位置するトレーニング配列タグの計数を決定する工程;
コンピューターシステムによって、各ビンにおけるトレーニング配列タグの計数に基づくマスキング閾値を超えるビンをマスキングする工程であって、それによって、検査サンプルにおけるY染色体のコピー数の評価のための、Y染色体のマスキングされた参照配列を提供する、工程
を含む、方法。
[本発明1002]
検査サンプルは胎児および母体の無細胞核酸を含む、本発明1001の方法。
[本発明1003]
シーケンサーを用いて、胎児および母体の無細胞核酸を含む検査サンプル由来の無細胞核酸をシーケンシングし、それによって検査サンプルのゲノム読み取りを生成する工程;ならびに
コンピューターシステムによって、検査サンプルのゲノム読み取りを参照配列にアラインメントし、それによって、アラインメントされたゲノム読み取りを含む検査配列タグおよびそれらの位置を提供する工程
をさらに含む、本発明1002の方法。
[本発明1004]
コンピューターシステムによって、Y染色体のマスキングされた参照配列上の検査配列タグの計数を測定する工程;
コンピューターシステムによって、Y染色体のマスキングされた参照配列上の検査配列タグの計数に基づき、検査サンプルにおけるY染色体のコピー数を評価する工程
をさらに含む、本発明1003の方法。
[本発明1005]
検査サンプルにおけるY染色体のコピー数を評価する工程は、
Y染色体のマスキングされた参照配列上の検査配列タグの計数から染色体量を算出する工程;ならびに
該染色体量および対照サンプルからのデータに基づき、検査サンプルにおけるY染色体のコピー数を評価する工程
を含む、本発明1004の方法。
[本発明1006]
染色体量は、(a)Y染色体のマスキングされた参照配列上での検査配列タグの網羅率と、(b)1種または複数種の正規化配列の網羅率との間の比として算出される、本発明1005の方法。
[本発明1007]
染色体量および対照サンプルからのデータから、正規化された染色体値を算出する工程;ならびに
該正規化された染色体値に基づき、検査サンプルにおけるY染色体のコピー数を評価する工程
をさらに含む、本発明1005の方法。
[本発明1008]
検査サンプルにおけるY染色体のコピー数を評価する工程は、胎児無細胞核酸のゲノムにおけるY染色体の有無を判定する工程を含む、本発明1004の方法。
[本発明1009]
検査サンプルにおけるY染色体のコピー数を評価する工程は、少なくとも1種の胎児異数性の有無を判定する工程を含む、本発明1004の方法。
[本発明1010]
マスキング閾値は、
コンピューターシステム上で、2つまたはそれ以上のマスキング閾値候補を提供する工程;
コンピューターシステムによって、該マスキング閾値候補を超えるビンをマスキングし、それによって2つまたはそれ以上のマスキングされた参照配列を提供する工程;
コンピューターシステムによって、該2つまたはそれ以上のマスキングされた参照配列のそれぞれに基づき、関心対象の遺伝子配列のコピー数の評価のための閾値評価指標を算出する工程;および
コンピューターシステム上で、最高の閾値評価指標を有する候補をマスキング閾値として選択する工程
によって決定される、本発明1001の方法。
[本発明1011]
閾値評価指標を算出する工程は、(a)トレーニングセットの雌性個体とは異なる雌性個体、および(b)Y染色体を有することが知られる雄性個体、の核酸サンプルに対してY染色体のコピー数を評価する工程を含む、本発明1010の方法。
[本発明1012]
閾値評価指標は、(a)の標準偏差で割った、(a)および(b)の平均間の差として算出される、本発明1011の方法。
[本発明1013]
複数のビンのそれぞれのサイズは、
コンピューターシステムによって、Y染色体の参照配列を候補ビンサイズのビンに分割する工程;
コンピューターシステムによって、該候補ビンサイズに基づき、ビン評価指標を算出する工程;
コンピューターシステム上で、種々の候補ビンサイズを用いて、本発明の先行工程を繰り返し反復し、それによって2つまたはそれ以上の異なる評価指標を産出する工程;および
コンピューターシステム上で、最高のビン評価指標を産出する候補ビンサイズをビンのサイズとして選択する工程
によって決定される、本発明1001の方法。
[本発明1014]
トレーニングセットの雌性個体は、Y染色体の参照配列上でのゲノム読み取りの異なる分布を特徴とする多様なアラインメントプロファイルを有する、本発明1001の方法。
[本発明1015]
トレーニングセットを提供する工程は、第2の複数の雌性個体を2つまたはそれ以上のクラスターに分割する工程、および第1の複数の雌性個体を形成するために該2つまたはそれ以上のクラスターのそれぞれにおいていくつかの個体を選択する工程を含む、本発明1014の方法。
[本発明1016]
2つまたはそれ以上のクラスターのそれぞれにおいていくつかの個体を選択する工程は、該2つまたはそれ以上のクラスターのそれぞれにおいて、等しい数の個体を選択する工程を含む、本発明1015の方法。
[本発明1017]
第2の複数の雌性個体を2つまたはそれ以上のクラスターに分割する工程は、階層型順序付き分割および縮小のハイブリッド(hierarchical ordered partitioning and collapsing hybrid)(HOPACH)クラスタリングを含む、本発明1015の方法。
[本発明1018]
ゲノム読み取りは、個体の全ゲノムにおけるいずれかの箇所由来の約20〜50bpの配列を含む、本発明1001の方法。
[本発明1019]
ビンサイズは約2000bpよりも小さい、本発明1001の方法。
[本発明1020]
マスキング閾値は、配列タグ計数の少なくとも約90パーセンタイルである、本発明1001の方法。
[本発明1021]
コンピューターシステムによって、トレーニングセットの1個体あたり少なくとも約10,000個のゲノム読み取りを、Y染色体の参照配列にアラインメントする工程を含む、本発明1001の方法。
[本発明1022]
検査サンプルにおける関心対象の遺伝子配列のコピー数の評価のためのシステムであって、
サンプルからの核酸配列情報を提供する、検査サンプル由来の核酸を受け取るためのシーケンサー;
プロセッサー;および
本発明1001の方法によって得られたマスキングされた参照配列を用いて、検査サンプルにおけるコピー数を評価する、該プロセッサーでの実行のための命令をそこに保存している1つまたは複数のコンピューター可読記憶媒体
を含む、システム。
[本発明1023]
検査サンプルにおける関心対象の遺伝子配列のコピー数の評価のためのシステムであって、該システムは、
サンプルからの核酸配列情報を提供する、検査サンプル由来の核酸を受け取るためのシーケンサー;
プロセッサー;および
マスクによってフィルタリングされたY染色体の参照配列を用いて、検査サンプルにおけるY染色体のコピー数を評価する、該プロセッサーでの実行のための命令をそこに保存している1つまたは複数のコンピューター可読記憶媒体
を含み、
該マスクは、Y染色体の参照配列上に特定のサイズのビンを含み、
該ビンは、そこにアラインメントされた、閾値を上回る数のトレーニング配列タグを有し、かつ
該トレーニング配列タグは、Y染色体の参照配列にアラインメントされた、第1の複数の雌性個体からのゲノム読み取りを含む、システム。
[本発明1024]
第1の複数の雌性個体は、Y染色体の参照配列にアラインメントされたゲノム読み取りの異なる分布を特徴とする多様なアラインメントプロファイルを有する、本発明1023のシステム。
[本発明1025]
第2の複数の雌性個体を2つまたはそれ以上のクラスターに分割し、かつ該2つまたはそれ以上のクラスターのそれぞれにおいて、等しい数の個体を第1の複数の雌性個体のメンバーとして選択することによって、第1の複数の雌性個体が選択された、本発明1024のシステム。
[本発明1026]
コンピューターシステムの1つまたは複数のプロセッサーによって実行される場合、胎児および母体の無細胞核酸を含む検査サンプルにおけるY染色体のコピー数の評価のための方法を該コンピューターシステムに実践させる、コンピューター実行可能な命令をそこに保存している1つまたは複数の非一時的なコンピューター可読記憶媒体を含むコンピュータープログラム製品であって、該方法は、
コンピューターシステム上で、第1の複数の雌性個体の核酸サンプルから測定されたゲノム読み取りを含むトレーニングセットを提供する工程;
コンピューターシステムによって、該トレーニングセットの1個体あたり少なくとも約100,000個のゲノム読み取りを、Y染色体の参照配列にアラインメントし、それによって、アラインメントされたゲノム読み取りを含むトレーニング配列タグ、およびY染色体の参照配列上でのそれらの位置を提供する工程;
コンピューターシステムによって、Y染色体の参照配列を特定のサイズのビンに分割する工程;
コンピューターシステムによって、各ビンに位置するトレーニング配列タグの計数を決定する工程;
コンピューターシステムによって、各ビンにおけるトレーニング配列タグの計数に基づくマスキング閾値を超えるビンをマスキングし、それによって、胎児および母体の無細胞核酸を含む検査サンプルにおけるY染色体のコピー数の評価のための、Y染色体のマスキングされた参照配列を提供する工程
を含む、コンピュータープログラム製品。
Claims (26)
- 検査サンプルにおけるY染色体のコピー数の評価のための、1つまたは複数のプロセッサーおよびシステムメモリーを含むコンピューターシステムで実践される方法であって、
コンピューターシステム上で、第1の複数の雌性個体の核酸サンプルから測定されたゲノム読み取りを含むトレーニングセットを提供する工程;
コンピューターシステムによって、該トレーニングセットのゲノム読み取りを、Y染色体の参照配列を含む参照ゲノムにアラインメントし、それによって、アラインメントされたゲノム読み取りを含むトレーニング配列タグ、およびY染色体の参照配列上でのそれらの位置を提供する工程;
コンピューターシステムによって、Y染色体の参照配列を複数のビンに分割する工程;
コンピューターシステムによって、各ビンに位置するトレーニング配列タグの計数を決定する工程;
コンピューターシステムによって、各ビンにおけるトレーニング配列タグの計数に基づくマスキング閾値を超えるビンをマスキングする工程であって、それによって、検査サンプルにおけるY染色体のコピー数の評価のための、Y染色体のマスキングされた参照配列を提供する、工程
を含む、方法。 - 検査サンプルは胎児および母体の無細胞核酸を含む、請求項1記載の方法。
- シーケンサーを用いて、胎児および母体の無細胞核酸を含む検査サンプル由来の無細胞核酸をシーケンシングし、それによって検査サンプルのゲノム読み取りを生成する工程;ならびに
コンピューターシステムによって、検査サンプルのゲノム読み取りを参照配列にアラインメントし、それによって、アラインメントされたゲノム読み取りを含む検査配列タグおよびそれらの位置を提供する工程
をさらに含む、請求項2記載の方法。 - コンピューターシステムによって、Y染色体のマスキングされた参照配列上の検査配列タグの計数を測定する工程;
コンピューターシステムによって、Y染色体のマスキングされた参照配列上の検査配列タグの計数に基づき、検査サンプルにおけるY染色体のコピー数を評価する工程
をさらに含む、請求項3記載の方法。 - 検査サンプルにおけるY染色体のコピー数を評価する工程は、
Y染色体のマスキングされた参照配列上の検査配列タグの計数から染色体量を算出する工程;ならびに
該染色体量および対照サンプルからのデータに基づき、検査サンプルにおけるY染色体のコピー数を評価する工程
を含む、請求項4記載の方法。 - 染色体量は、(a)Y染色体のマスキングされた参照配列上での検査配列タグの網羅率と、(b)1種または複数種の正規化配列の網羅率との間の比として算出される、請求項5記載の方法。
- 染色体量および対照サンプルからのデータから、正規化された染色体値を算出する工程;ならびに
該正規化された染色体値に基づき、検査サンプルにおけるY染色体のコピー数を評価する工程
をさらに含む、請求項5記載の方法。 - 検査サンプルにおけるY染色体のコピー数を評価する工程は、胎児無細胞核酸のゲノムにおけるY染色体の有無を判定する工程を含む、請求項4記載の方法。
- 検査サンプルにおけるY染色体のコピー数を評価する工程は、少なくとも1種の胎児異数性の有無を判定する工程を含む、請求項4記載の方法。
- マスキング閾値は、
コンピューターシステム上で、2つまたはそれ以上のマスキング閾値候補を提供する工程;
コンピューターシステムによって、該マスキング閾値候補を超えるビンをマスキングし、それによって2つまたはそれ以上のマスキングされた参照配列を提供する工程;
コンピューターシステムによって、該2つまたはそれ以上のマスキングされた参照配列のそれぞれに基づき、関心対象の遺伝子配列のコピー数の評価のための閾値評価指標を算出する工程;および
コンピューターシステム上で、最高の閾値評価指標を有する候補をマスキング閾値として選択する工程
によって決定される、請求項1記載の方法。 - 閾値評価指標を算出する工程は、(a)トレーニングセットの雌性個体とは異なる雌性個体、および(b)Y染色体を有することが知られる雄性個体、の核酸サンプルに対してY染色体のコピー数を評価する工程を含む、請求項10記載の方法。
- 閾値評価指標は、(a)の標準偏差で割った、(a)および(b)の平均間の差として算出される、請求項11記載の方法。
- 複数のビンのそれぞれのサイズは、
コンピューターシステムによって、Y染色体の参照配列を候補ビンサイズのビンに分割する工程;
コンピューターシステムによって、該候補ビンサイズに基づき、ビン評価指標を算出する工程;
コンピューターシステム上で、種々の候補ビンサイズを用いて、本請求項の先行工程を繰り返し反復し、それによって2つまたはそれ以上の異なる評価指標を産出する工程;および
コンピューターシステム上で、最高のビン評価指標を産出する候補ビンサイズをビンのサイズとして選択する工程
によって決定される、請求項1記載の方法。 - トレーニングセットの雌性個体は、Y染色体の参照配列上でのゲノム読み取りの異なる分布を特徴とする多様なアラインメントプロファイルを有する、請求項1記載の方法。
- トレーニングセットを提供する工程は、第2の複数の雌性個体を2つまたはそれ以上のクラスターに分割する工程、および第1の複数の雌性個体を形成するために該2つまたはそれ以上のクラスターのそれぞれにおいていくつかの個体を選択する工程を含む、請求項14記載の方法。
- 2つまたはそれ以上のクラスターのそれぞれにおいていくつかの個体を選択する工程は、該2つまたはそれ以上のクラスターのそれぞれにおいて、等しい数の個体を選択する工程を含む、請求項15記載の方法。
- 第2の複数の雌性個体を2つまたはそれ以上のクラスターに分割する工程は、階層型順序付き分割および縮小のハイブリッド(hierarchical ordered partitioning and collapsing hybrid)(HOPACH)クラスタリングを含む、請求項15記載の方法。
- ゲノム読み取りは、個体の全ゲノムにおけるいずれかの箇所由来の約20〜50bpの配列を含む、請求項1記載の方法。
- ビンサイズは約2000bpよりも小さい、請求項1記載の方法。
- マスキング閾値は、配列タグ計数の少なくとも約90パーセンタイルである、請求項1記載の方法。
- コンピューターシステムによって、トレーニングセットの1個体あたり少なくとも約10,000個のゲノム読み取りを、Y染色体の参照配列にアラインメントする工程を含む、請求項1記載の方法。
- 検査サンプルにおける関心対象の遺伝子配列のコピー数の評価のためのシステムであって、
サンプルからの核酸配列情報を提供する、検査サンプル由来の核酸を受け取るためのシーケンサー;
プロセッサー;および
請求項1記載の方法によって得られたマスキングされた参照配列を用いて、検査サンプルにおけるコピー数を評価する、該プロセッサーでの実行のための命令をそこに保存している1つまたは複数のコンピューター可読記憶媒体
を含む、システム。 - 検査サンプルにおける関心対象の遺伝子配列のコピー数の評価のためのシステムであって、該システムは、
サンプルからの核酸配列情報を提供する、検査サンプル由来の核酸を受け取るためのシーケンサー;
プロセッサー;および
マスクによってフィルタリングされたY染色体の参照配列を用いて、検査サンプルにおけるY染色体のコピー数を評価する、該プロセッサーでの実行のための命令をそこに保存している1つまたは複数のコンピューター可読記憶媒体
を含み、
該マスクは、Y染色体の参照配列上に特定のサイズのビンを含み、
該ビンは、そこにアラインメントされた、閾値を上回る数のトレーニング配列タグを有し、かつ
該トレーニング配列タグは、Y染色体の参照配列にアラインメントされた、第1の複数の雌性個体からのゲノム読み取りを含む、システム。 - 第1の複数の雌性個体は、Y染色体の参照配列にアラインメントされたゲノム読み取りの異なる分布を特徴とする多様なアラインメントプロファイルを有する、請求項23記載のシステム。
- 第2の複数の雌性個体を2つまたはそれ以上のクラスターに分割し、かつ該2つまたはそれ以上のクラスターのそれぞれにおいて、等しい数の個体を第1の複数の雌性個体のメンバーとして選択することによって、第1の複数の雌性個体が選択された、請求項24記載のシステム。
- コンピューターシステムの1つまたは複数のプロセッサーによって実行される場合、胎児および母体の無細胞核酸を含む検査サンプルにおけるY染色体のコピー数の評価のための方法を該コンピューターシステムに実践させる、コンピューター実行可能な命令をそこに保存している1つまたは複数の非一時的なコンピューター可読記憶媒体を含むコンピュータープログラム製品であって、該方法は、
コンピューターシステム上で、第1の複数の雌性個体の核酸サンプルから測定されたゲノム読み取りを含むトレーニングセットを提供する工程;
コンピューターシステムによって、該トレーニングセットのゲノム読み取りを、Y染色体の参照配列にアラインメントし、それによって、アラインメントされたゲノム読み取りを含むトレーニング配列タグ、およびY染色体の参照配列上でのそれらの位置を提供する工程;
コンピューターシステムによって、Y染色体の参照配列を特定のサイズのビンに分割する工程;
コンピューターシステムによって、各ビンに位置するトレーニング配列タグの計数を決定する工程;
コンピューターシステムによって、各ビンにおけるトレーニング配列タグの計数に基づくマスキング閾値を超えるビンをマスキングし、それによって、胎児および母体の無細胞核酸を含む検査サンプルにおけるY染色体のコピー数の評価のための、Y染色体のマスキングされた参照配列を提供する工程
を含む、コンピュータープログラム製品。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361836057P | 2013-06-17 | 2013-06-17 | |
US61/836,057 | 2013-06-17 | ||
PCT/US2014/042785 WO2014204991A1 (en) | 2013-06-17 | 2014-06-17 | Method for determining copy number variations in sex chromosomes |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019081704A Division JP7021148B2 (ja) | 2013-06-17 | 2019-04-23 | 性染色体におけるコピー数変異を判定するための方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016526380A JP2016526380A (ja) | 2016-09-05 |
JP2016526380A5 true JP2016526380A5 (ja) | 2017-07-27 |
JP6521956B2 JP6521956B2 (ja) | 2019-05-29 |
Family
ID=51205579
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016521519A Active JP6521956B2 (ja) | 2013-06-17 | 2014-06-17 | 性染色体におけるコピー数変異を判定するための方法 |
JP2019081704A Active JP7021148B2 (ja) | 2013-06-17 | 2019-04-23 | 性染色体におけるコピー数変異を判定するための方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019081704A Active JP7021148B2 (ja) | 2013-06-17 | 2019-04-23 | 性染色体におけるコピー数変異を判定するための方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20140371078A1 (ja) |
EP (2) | EP3011052B1 (ja) |
JP (2) | JP6521956B2 (ja) |
CN (1) | CN105722994B (ja) |
AU (1) | AU2014281635B2 (ja) |
CA (1) | CA2915626A1 (ja) |
HK (1) | HK1223988A1 (ja) |
IL (1) | IL242956B (ja) |
WO (1) | WO2014204991A1 (ja) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102429186B1 (ko) * | 2013-10-21 | 2022-08-03 | 베리나타 헬스, 인코포레이티드 | 사본수 변동을 결정함에 있어서 검출의 감수성을 향상시키기 위한 방법 |
CA2970501C (en) | 2014-12-12 | 2020-09-15 | Verinata Health, Inc. | Using cell-free dna fragment size to determine copy number variations |
CA2970345A1 (en) * | 2014-12-29 | 2016-07-07 | Counsyl, Inc. | Method for determining genotypes in regions of high homology |
CA2985135A1 (en) * | 2015-05-06 | 2016-11-10 | Seracare Life Sciences, Inc. | Liposomal preparations for non-invasive-prenatal or cancer screening |
JP2019500901A (ja) * | 2015-12-04 | 2019-01-17 | グリーン クロス ゲノム コーポレーションGreen Cross Genome Corporation | 核酸の混合物を含むサンプルでコピー数異常を決定する方法 |
EP3408376A1 (en) * | 2016-01-31 | 2018-12-05 | Hadasit Medical Research Services and Development Ltd. | Autosomal-identical pluripotent stem cell populations having non-identical sex chromosomal composition and uses thereof |
US10095831B2 (en) * | 2016-02-03 | 2018-10-09 | Verinata Health, Inc. | Using cell-free DNA fragment size to determine copy number variations |
CA3030038A1 (en) * | 2016-07-06 | 2018-01-11 | Guardant Health, Inc. | Methods for fragmentome profiling of cell-free nucleic acids |
EP4074824A1 (en) * | 2016-08-08 | 2022-10-19 | Karius, Inc. | Reduction of signal from contaminant nucleic acids |
MX2019003344A (es) * | 2016-09-22 | 2019-09-04 | Illumina Inc | Deteccion de variacion de numero de copias somaticas. |
TWI603082B (zh) * | 2016-09-30 | 2017-10-21 | 有勁生物科技股份有限公司 | 非侵入式胎兒性徵異常檢測系統及其方法與非侵入式胎兒性徵檢測系統及其方法 |
US20180142299A1 (en) * | 2016-11-17 | 2018-05-24 | SeraCare Life Sciences,Inc | Methods for preparing dna reference materials and controls |
CN106845154B (zh) * | 2016-12-29 | 2022-04-08 | 浙江安诺优达生物科技有限公司 | 一种用于ffpe样本拷贝数变异检测的装置 |
US11342047B2 (en) | 2017-04-21 | 2022-05-24 | Illumina, Inc. | Using cell-free DNA fragment size to detect tumor-associated variant |
CN107119145A (zh) * | 2017-07-13 | 2017-09-01 | 深圳瑞科生物科技有限公司 | 一种基于ddPCR定量检测ctDNA的方法 |
CN109390039B (zh) * | 2017-08-11 | 2020-10-16 | 深圳华大基因股份有限公司 | 一种统计dna拷贝数信息的方法、装置及存储介质 |
CN111052249B (zh) * | 2017-09-15 | 2024-04-05 | 深圳华大智造科技股份有限公司 | 确定预定染色体保守区域的方法、确定样本基因组中是否存在拷贝数变异的方法、系统和计算机可读介质 |
CN108427864B (zh) * | 2018-02-14 | 2019-01-29 | 南京世和基因生物技术有限公司 | 一种拷贝数变异的检测方法、装置以及计算机可读介质 |
US20190295684A1 (en) * | 2018-03-22 | 2019-09-26 | The Regents Of The University Of Michigan | Method and apparatus for analysis of chromatin interaction data |
CN112888459B (zh) * | 2018-06-01 | 2023-05-23 | 格里尔公司 | 卷积神经网络系统及数据分类方法 |
CN109136371B (zh) * | 2018-07-25 | 2019-11-01 | 南京世和基因生物技术有限公司 | 一种放疗疗效和毒性反应相关基因组合、检测探针库以及检测试剂盒 |
KR102405245B1 (ko) * | 2018-07-27 | 2022-06-07 | 주식회사 지씨지놈 | 전장유전체 시퀀싱 기반의 염색체 이상 검출 방법 및 그 용도 |
US11581062B2 (en) | 2018-12-10 | 2023-02-14 | Grail, Llc | Systems and methods for classifying patients with respect to multiple cancer classes |
EP3939047A4 (en) * | 2019-03-10 | 2022-11-30 | Ultima Genomics, Inc. | METHODS AND SYSTEMS FOR SEQUENCE CALLING |
CN111755066B (zh) * | 2019-03-27 | 2022-10-18 | 欧蒙医学诊断(中国)有限公司 | 一种拷贝数变异的检测方法和实施该方法的设备 |
CN110534202A (zh) * | 2019-08-21 | 2019-12-03 | 江南大学附属医院(无锡市第四人民医院) | 一种针对Sox10在三阴性乳腺癌中的表达进行分析的系统 |
WO2021236993A1 (en) * | 2020-05-22 | 2021-11-25 | Bloodq, Inc. | Methods for characterizing cell-free nucleic acid fragments |
CN113409885B (zh) * | 2021-06-21 | 2022-09-20 | 天津金域医学检验实验室有限公司 | 一种自动化数据处理以及作图方法及系统 |
CN114420208B (zh) * | 2022-02-28 | 2023-04-18 | 上海亿康医学检验所有限公司 | 一种用于鉴定核酸样本中cnv的方法和装置 |
CN115273984B (zh) * | 2022-09-30 | 2022-11-29 | 北京诺禾致源科技股份有限公司 | 鉴定基因组串联重复区域的方法及装置 |
CN115394359B (zh) * | 2022-10-27 | 2023-03-24 | 北京大学第三医院(北京大学第三临床医学院) | 一种通过转录组检测单细胞染色体拷贝数变异方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7235358B2 (en) * | 2001-06-08 | 2007-06-26 | Expression Diagnostics, Inc. | Methods and compositions for diagnosing and monitoring transplant rejection |
ES2588227T3 (es) | 2006-10-10 | 2016-10-31 | Trovagene, Inc. | Composiciones, métodos y kits para aislar ácidos nucleicos de fluidos corporales usando medios de intercambio aniónico |
US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
MX2010003724A (es) | 2007-10-04 | 2010-09-14 | Halcyon Molecular | Secuenciacion de polimeros de acido nucleico con microscopia electronica. |
GB0811500D0 (en) * | 2008-06-20 | 2008-07-30 | Univ Cardiff | Method of determining DNA copy number |
WO2011050341A1 (en) * | 2009-10-22 | 2011-04-28 | National Center For Genome Resources | Methods and systems for medical sequencing analysis |
WO2011090556A1 (en) | 2010-01-19 | 2011-07-28 | Verinata Health, Inc. | Methods for determining fraction of fetal nucleic acid in maternal samples |
US9260745B2 (en) | 2010-01-19 | 2016-02-16 | Verinata Health, Inc. | Detecting and classifying copy number variation |
EP3006573B1 (en) | 2010-01-19 | 2018-03-07 | Verinata Health, Inc | Methods for determining fraction of fetal nucleic acids in maternal samples |
US20120046877A1 (en) * | 2010-07-06 | 2012-02-23 | Life Technologies Corporation | Systems and methods to detect copy number variation |
US20120034603A1 (en) * | 2010-08-06 | 2012-02-09 | Tandem Diagnostics, Inc. | Ligation-based detection of genetic variants |
CA2824387C (en) * | 2011-02-09 | 2019-09-24 | Natera, Inc. | Methods for non-invasive prenatal ploidy calling |
EP2563937A1 (en) * | 2011-07-26 | 2013-03-06 | Verinata Health, Inc | Method for determining the presence or absence of different aneuploidies in a sample |
US8688388B2 (en) * | 2011-10-11 | 2014-04-01 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US9538439B2 (en) * | 2013-05-10 | 2017-01-03 | Qualcomm Incorporated | Method and apparatus for estimating an achievable link throughput based on assistance information |
-
2014
- 2014-06-17 EP EP14739612.1A patent/EP3011052B1/en active Active
- 2014-06-17 JP JP2016521519A patent/JP6521956B2/ja active Active
- 2014-06-17 CN CN201480045591.2A patent/CN105722994B/zh active Active
- 2014-06-17 AU AU2014281635A patent/AU2014281635B2/en active Active
- 2014-06-17 CA CA2915626A patent/CA2915626A1/en active Pending
- 2014-06-17 WO PCT/US2014/042785 patent/WO2014204991A1/en active Application Filing
- 2014-06-17 US US14/307,143 patent/US20140371078A1/en active Pending
- 2014-06-17 EP EP19172284.2A patent/EP3543354B1/en active Active
-
2015
- 2015-12-06 IL IL24295615A patent/IL242956B/en active IP Right Grant
-
2016
- 2016-10-26 HK HK16112335.1A patent/HK1223988A1/zh unknown
-
2019
- 2019-04-23 JP JP2019081704A patent/JP7021148B2/ja active Active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2016526380A5 (ja) | ||
Ay et al. | Statistical confidence estimation for Hi-C data reveals regulatory chromatin contacts | |
CN111328419B (zh) | 基于神经网络实现的方法和系统 | |
JP2016539630A5 (ja) | ||
US20200185055A1 (en) | Methods and Systems for Nucleic Acid Variant Detection and Analysis | |
US20180225416A1 (en) | Systems and methods for visualizing a pattern in a dataset | |
JP2017524374A5 (ja) | ||
CN110892484B (zh) | 用于识别引起序列特异性错误(sse)的序列图案的基于深度学习的框架 | |
Lu et al. | DELTA: a distal enhancer locating tool based on AdaBoost algorithm and shape features of chromatin modifications | |
RU2019110756A (ru) | Классификация генов на основе фенотипа/заболевания с использованием библиотеки генов и структур данных на основе сети | |
JP2016507759A5 (ja) | ||
US20230343410A1 (en) | Methods for predicting transcription factor activity | |
US20210332354A1 (en) | Systems and methods for identifying differential accessibility of gene regulatory elements at single cell resolution | |
Bhattacharyya et al. | MicroRNA transcription start site prediction with multi-objective feature selection | |
RU2018109529A (ru) | Многоуровневая архитектура распознавания паттернов в биологических данных | |
CN103955630A (zh) | 制备参考数据库及对待测游离核酸样本进行目标区域序列比对的方法 | |
CN103984879A (zh) | 一种测定待测基因组区域表达水平的方法及系统 | |
Zwiessele et al. | Topslam: Waddington landscape recovery for single cell experiments | |
CN105408909A (zh) | 转录本确定方法 | |
CN104462817B (zh) | 基于蒙特卡洛和非负矩阵因子分解的基因选择和癌症分类方法 | |
Niu et al. | Statistical models for detecting differential chromatin interactions mediated by a protein | |
JP2016184185A5 (ja) | ||
Brandenburg et al. | Inverse folding based pre-training for the reliable identification of intrinsic transcription terminators | |
CN106021998A (zh) | 单通多变体识别计算流水线 | |
CN105550538B (zh) | 一种人类基因启动子识别方法和系统 |