WO2023084787A1

WO2023084787A1 - 変化点検知装置、変化点検知方法及びプログラム

Info

Publication number: WO2023084787A1
Application number: PCT/JP2021/041966
Authority: WO
Inventors: 彰子高橋; 恵竹下
Original assignee: 日本電信電話株式会社
Priority date: 2021-11-15
Filing date: 2021-11-15
Publication date: 2023-05-19
Also published as: JPWO2023084787A1; US20240411780A1

Abstract

本開示は、周期変動を示すなど定常性制約やiid制約を満たさないデータも含めた時系列データを対象に、周期変動の変化など時間変化パターンの変化も含め何らかの変化が発生した際に、その発生時点を変化点として検知することを目的とする。　そこで、本開示内容は、１つ又は複数の装置で構成されるシステムの各時点におけるシステム状態を表す時系列データであって、前記システムを構成する装置数×前記装置の状態を表す項目数の次元のデータで構成される時系列データを入力する入力部と、前記各時点における前記時系列データを装置数×項目数の次元のデータから、装置数×項目数×時間窓長の次元のデータに変換することで変換データを生成する時間窓生成部と、前記各時点における前記変換データに基づいて算出された前記システム状態の変化点スコアがあらかじめ設定された閾値を超えた場合に変化点として検知する検知部と、を有する変化点検知装置である。

Description

変化点検知装置、変化点検知方法及びプログラム

　本開示内容は、変化点検知装置、変化点検知方法及びプログラムに関する。

　１つ又は複数の装置で構成されるシステムの各時点におけるシステム状態を表す時系列データを用いて、当該システムのシステム状態の変化点を検知する技術が従来から知られている。ここで、「システム状態」とは、「アクセス数」や「ユーザ数」などの量的変数により表されるシステムの稼働状態のことである。

　変化点の発生位置に関する正解ラベルが付与されていない時系列データを対象に変化点を検知する技術としては、非特許文献１乃至４に記載されている技術が知られている。

　非特許文献１は、部分空間法を用いて部分時系列で構成される部分空間同士の距離を評価することで変化度を計算する方法を提案している。これは、過去期間と現在期間のそれぞれについて、部分時系列（時系列から切り出した時間窓）を束ねた行列を生成し、特異値分解により特徴的なパターンを抽出し、この特徴的なパターン間の距離を評価する方法である。

　非特許文献２は、確率モデルを用いて前の変化点以降に観測されたデータに基づき新たな区間の確率分布を推定する方法を提案している。これは、ベイズ理論に基づき、最後の変化点からの連長（次の変化点までの経過時間）の確率分布を推定することによって変化点を検知する方法である。なお、「ベイズ理論」は、「何かが起こる可能性は、その事柄の過去の発生頻度を使ってほぼ推測ができる」ということを示す理論である。

　非特許文献３は、クラスタリングを用いて時系列データを状態分類し、新たな観測値がいずれの既存クラスタにも適合しない場合に変化が発生したものと判断する方法を提案している。これは、新たな観測値と既存クラスタのセントロイドの間のユークリッド距離が当該クラスタの半径を上回るか否かをすべての既存クラスタについて判定し、すべて上回る場合に変化点として検知する方法である。

　非特許文献４にある二段階学習に基づくオンライン変化検知は、２つの連続する区間の確率密度に有意差があるか否かを尤度比に基づき判定する尤度比検定の一種であり、自己回帰モデルを二段階学習することにより外れ値を除去しつつ変化点スコアを計算する方法を提案している。これは、具体的に、まず１段階目の学習として、直前時点までに観測された時系列から自己回帰モデルに基づく確率密度関数を学習し、新たに観測されたデータについて前記確率密度関数の下での対数損失関数を外れスコアとして算出する方法である。さらに、これは、この外れスコア系列を平滑化した上で、次に２段階目の学習として、直前時点までに算出された平滑化済みの外れスコア系列から同じく自己回帰モデルに基づく確率密度関数を学習し、新たに観測されたデータから算出された外れスコアについて前記確率密度関数の下での対数損失関数を算出し、さらに平滑化したものを変化点スコアとする方法である。

　また、類似する技術として、１つ又は複数の装置で構成されるシステムの各時点におけるシステム状態を表す時系列データを用いて、当該システムの非定常変動を検知する技術が知られており、この技術が非特許文献５に記載されている。これは、具体的には、クラスタリングを用いて時系列データを状態分類した上で、各時点に割り当てられたクラスタを時間軸方向に追跡して異なるクラスタ間におけるクラスタ遷移を抽出する方法である。さらにこれは、過去一定期間におけるクラスタ遷移パターンごとの出現頻度を算出しておき、あらたに観測されたクラスタ遷移パターンの過去期間における出現頻度があらかじめ設定した閾値を下回る場合に非定常変動として検知する方法である。

T. Ide and K. Tsuda, "Change-Point Detection Using Krylov Subspace Learning," in Procs. of the SIAM International Conference on Data Mining, Apr. 2007. R. P. Adams and D. J. C. MacKay, "Bayesian Online Changepoint Detection," arXiv:0710.3742, Oct. 2007. D. H. Tran, "Automated Change Detection and Reactive Clustering in Multivariate Streaming Data," arXiv:1311.0505, Nov. 2013. 山西, "異常検知：外れ値検知と変化検知," REAJ誌2015 Vol.37, No. 3, 2015. 高橋, 池上, "多次元時系列データにおける非定常変動検知技術の提案," 信学技報, CQ2020-32, pp.57-62, July 2020.

　ところが、非特許文献１が提案する部分空間法による変化点検知技術は、検知対象とする時系列が定常過程でなければならないという制約がある。すなわち、対象時系列の期待値と自己共分散が時間によらず一定であるという弱定常性を満たす必要がある。

　また、非特許文献２が提案するベイズ理論に基づく変化点検知技術は、検知対象とする時系列が独立同分布（iid: independently and identically distributed）でなければならないという制約がある。すなわち、時系列を構成する各時点のデータが互いに独立に同一の確率分布に従っている必要がある。しかし、ネットワークシステムに代表される多くのシステムで観測される時系列データは、時間帯変動、曜日変動、月変動などの周期変動を示すものが多く、さらに周期の異なる複数種類の周期変動が混在しているものも多いため、前記の定常性制約やiid制約などの制約を受ける変化点検知技術を適用することができない。

　一方、非特許文献３が提案するクラスタリングによる変化点検知技術と非特許文献４が提案する二段階学習に基づくオンライン変化検知技術は、対象時系列が定常性制約やiid制約などの制約を受けない点で有望と考えられる。しかし、非特許文献３が提案するクラスタリングによる変化点検知技術は、時系列データから切り出した時点ごとのスナップショットのデータを状態分類し、分類された状態が既存の状態と異なるか否かの判定を行っており、時間軸を考慮していない。すなわち、多くのシステムで観測される周期変動を示す時系列データのように、状態の時間変化が一定のパターンに従うような時系列データにおいて、この時間変化パターンがある瞬間を境に変化するような場合にこの変化点を検知することができない。

　さらに、非特許文献４が提案する二段階学習に基づくオンライン変化検知技術は、自己回帰モデルに基づく方法であるため、時間軸を考慮していると言える。したがって、時間変化パターンがある瞬間を境に変化するような時系列データに対しても有望と考えられる。しかし、時間帯変動、曜日変動、月変動など周期の異なる複数種類の周期変動が混在しているような時系列データについては、自己回帰モデルによる対応は困難である。

　また、非特許文献５が提案する非定常変動検知技術は、対象時系列が制約を受けないクラスタリングをベースとしており、かつ時間軸方向にクラスタ遷移を追跡する方法により時間軸を考慮している技術である。しかし、当該技術は過去一定期間において算出された出現頻度があらかじめ設定された閾値を下回るクラスタ遷移パターンを非定常変動として検知する技術であり、個別のクラスタ遷移が過去実績と比べて異常状態である（出現頻度が低い）か否かを判定するに過ぎず、継続的な異常状態のはじまりとも言える変化点を検知するものではない。

　本発明は上記の点を鑑みてなされたものであり、周期変動を示すなど定常性制約やiid制約を満たさないデータも含めた時系列データを対象に、周期変動の変化など時間変化パターンの変化も含め何らかの変化が発生した際に、その発生時点を変化点として検知することを目的とする。

　上記目的を達成するため、請求項１に係る発明は、１つ又は複数の装置で構成されるシステムの各時点におけるシステム状態を表す時系列データであって、前記システムを構成する装置数×前記装置の状態を表す項目数の次元のデータで構成される時系列データを入力する入力部と、前記各時点における前記時系列データを装置数×項目数の次元のデータから、装置数×項目数×時間窓長の次元のデータに変換することで変換データを生成する時間窓生成部と、前記各時点における前記変換データに基づいて算出された前記システム状態の変化点スコアがあらかじめ設定された閾値を超えた場合に変化点として検知する検知部と、を有する変化点検知装置である。

　以上説明したように本発明によれば、周期変動を示すなど定常性制約やiid制約を満たさない時系列データに対しても、周期変動の変化など時間変化パターンの変化も含め何らかの変化が発生した際に、その発生時点を変化点として検知することができるという効果を奏する。

本実施形態に係る変化点検知装置の機能構成の一例を示す図である。本実施形態に係る変化点検知処理の一例を示すフローチャートである。本実施形態に係る変化点検知装置のハードウェア構成の一例を示す図である。

　以下、本発明の一実施形態について説明する。本実施形態では、１つ又は複数の装置で構成されるシステム（Ｓ）の各時点におけるシステム状態を表す時系列データを用いて、システム状態に何らかの変化が発生した際に、その発生時点を変化点として検知することが可能な変化点検知装置１０について説明する。ここで、「システム状態」とは、「アクセス数」や「ユーザ数」などの量的変数により表されるシステムの稼働状態のことである。

　〔機能構成〕
　まず、本実施形態に係る変化点検知装置１０の機能構成について、図１を参照しながら説明する。図１は、本実施形態に係る変化点検知装置の機能構成の一例を示す図である。

　図１に示すように、本実施形態に係る変化点検知装置１０は、入力部１１と、時間窓生成部１２と、期間設定部１３と、クラスタリング部１４と、クラスタ遷移系列作成部１５と、クラスタ遷移テンソル算出部１６と、変化点スコア算出部１７と、検知部１８と、出力部１９とを有する。なお、以下に示されている「装置数」及び「装置の状態」の「装置」は変化点検知装置１０によって変化点の検知対象となるシステムを構成する装置を示す。

　入力部１１は、１つ又は複数の装置で構成されるシステム（Ｓ）の各時点におけるシステム状態を表す時系列データであって、システム（Ｓ）を構成する（装置数×装置の状態を表す項目数）次元のデータで構成される時系列データを入力する。

　時間窓生成部１２は、入力部１１により入力された時系列データを固定長の時間窓で区切り、各時点のデータを（装置数×項目数）次元のデータから、（装置数×項目数×時間窓長）次元のデータに変換して変換データを生成し、中間出力を行う。

　期間設定部１３は、時間窓生成部１２により生成された（装置数×項目数×時間窓長）次元の時系列データから、あらかじめ設定された過去期間と現在期間の時系列データを抽出して、中間出力を行う。

　クラスタリング部１４は、期間設定部１３により抽出された過去期間と現在期間の時系列データを構成する各時点の（装置数×項目数×時間窓長）次元のデータをクラスタリング手法により状態分類して、中間出力を行う。

　クラスタ遷移系列作成部１５は、過去期間と現在期間の各時点における（装置数×項目数×時間窓長）次元のデータに対しクラスタリング部１４が割り当てたクラスタを時間軸方向に追跡し、過去期間と現在期間のそれぞれについて、異なるクラスタ間におけるクラスタ遷移の系列を作成すると同時に、このクラスタ遷移系列を構成する各クラスタに対し当該クラスタにおける滞在期間を付与して、中間出力を行う。

　クラスタ遷移テンソル算出部１６は、クラスタ遷移系列作成部１５により作成されたクラスタ遷移系列から、あらかじめ設定された固定長のクラスタ遷移を抽出した上で、過去期間と現在期間における各クラスタ遷移パターンの出現確率を算出し、上記クラスタ遷移長（クラスタ遷移の長さ）を階数（即ち、次元）とし、過去期間と現在期間に出現したすべてのクラスタのユニーク値を各次元のインデックスに持ち、クラスタ遷移パターンの出現確率を値に持つクラスタ遷移テンソルを過去期間と現在期間のそれぞれについて算出して、中間出力を行う。

　変化点スコア算出部１７は、クラスタ遷移テンソル算出部１６により算出された過去期間と現在期間それぞれのクラスタ遷移テンソルに基づき、過去期間から現在期間にかけての変化度として、過去期間におけるクラスタ遷移テンソルと現在期間におけるクラスタ遷移テンソルの距離を算出して、中間出力を行う。

　検知部１８は、変化点スコア算出部１７により算出された変化点スコアがあらかじめ設定された閾値を超えた場合に変化点として検知する。即ち、検知部１８は、各時点におけるデータ（変換データ）に基づいて算出されたシステム状態の変化点スコアがあらかじめ設定された閾値を超えた場合に変化点として検知する。

　出力部１９は、検知部１８により検知された変化点を出力する。

　〔変化点検知処理〕
　次に、本実施形態に係る変化点検知処理（手順）について、図２を参照しながら説明する。図２は、本実施形態に係る変化点検知処理の一例を示すフローチャートである。

　以降では、システム（Ｓ）を構成する装置数をＭ、各時点におけるシステム状態を表すデータの項目数をＫ、時系列データの観測時点数をＮとして、Ｎ個のＭ×Ｋ次元データで時系列データが構成されているものとする。

　なお、各時点におけるＭ×Ｋ次元データの各要素は、当該時点におけるＭ個の装置の状態を表すＫ個の観測値である。具体的には、或る時点におけるＭ×Ｋ次元データを［ｘ_１，・・・，ｘ_Ｋ，ｘ_Ｋ＋１，・・・，ｘ_２Ｋ，・・・，ｘ_{（Ｍ－１）Ｋ＋１}，・・・，ｘ_ＭＫ］とした場合、例えば、ｍ＝１，・・・，Ｍに対してｘ_{（ｍ－１）Ｋ＋１}，・・・，ｘ_ｍＫは当該時点におけるｍ番目の装置のＫ個の観測値である。

　ステップＳ１１：まず、入力部１１は、Ｎ個のＭ×Ｋ（装置数×項目数）次元データで構成される時系列データを入力する。すなわち、時点ｎにおけるＭ×Ｋ次元データをＸ_ｎとすれば、入力部１１は、時系列データ｛Ｘ_１，・・・，Ｘ_Ｎ｝を入力する。

　ステップＳ１２：次に、時間窓生成部１２は、ステップＳ１１で入力された時系列データを固定長Ｗの時間窓で区切ることによって、各時点のデータをＭ×Ｋ（装置数×項目数）次元のデータからＭ×Ｋ×Ｗ（装置数×項目数×時間窓長）次元のデータに変換して変換データを生成し、中間出力を行う。具体的には、時点ｎ－（Ｗ－１），ｎ－（Ｗ－２），・・・，ｎそれぞれのＭ×Ｋ次元データＸ_{ｎ－（Ｗ－１）}，Ｘ_{ｎ－（Ｗ－２）}，・・・，Ｘ_ｎで構成されるＭ×Ｋ×Ｗ次元ベクトルＹ_ｎ＝（Ｘ_{ｎ－（Ｗ－１）}，Ｘ_{ｎ－（Ｗ－２）}，・・・，Ｘ_ｎ）を時点ｎのＭ×Ｋ×Ｗ次元データとする。なお、元のＭ×Ｋ次元データＸ_ｎが時点ｎ＝１，・・・，Ｎについて観測されている場合、変換後のＭ×Ｋ×Ｗ次元データＹ_ｎは時点ｎ＝Ｗ，・・・，Ｎについて得られることになる。

　ステップＳ１３：次に、期間設定部１３は、ステップＳ１２で生成されたＭ×Ｋ×Ｗ（装置数×項目数×時間窓長）次元の時系列データから、あらかじめ設定された過去期間と現在期間の時系列データを抽出する。具体的には、過去期間を［ｓ１，ｅ１］、現在期間を［ｓ２，ｅ２］とした場合、時点ｎ＝Ｗ，・・・，ＮのＭ×Ｋ×Ｗ次元データＹ_ｎから過去期間のデータ｛Ｙ_ｓ１，・・・，Ｙ_ｅ１｝と現在期間のデータ｛Ｙ_ｓ２，・・・，Ｙ_ｅ２｝を抽出する。

　ステップＳ１４：次に、クラスタリング部１４は、ステップＳ１３で抽出された長さ（ｅ１－ｓ１＋１）時点の過去期間と長さ（ｅ２－ｓ２＋１）時点の現在期間の時系列データを構成する（ｅ１－ｓ１＋ｅ２－ｓ２＋２）個のＭ×Ｋ×Ｗ（装置数×項目数×時間窓長）次元データをクラスタリング手法により状態分類することで、当該時系列データに対応するクラスタ系列を得る。具体的には、クラスタリング部１４は、時点ｎのＭ×Ｋ×Ｗ次元データＹ_ｎが属するクラスタをＣ_ｎとした場合、過去期間の時系列データ｛Ｙ_ｓ１，・・・，Ｙ_ｅ１｝からクラスタ系列｛Ｃ_ｓ１，・・・，Ｃ_ｅ１｝、現在期間の時系列データ｛Ｙ_ｓ２，・・・，Ｙ_ｅ２｝からクラスタ系列｛Ｃ_ｓ２，・・・，Ｃ_ｅ２｝が得られる。なお、クラスタリングは、（ｅ１－ｓ１＋ｅ２－ｓ２＋２）個のＭ×Ｋ×Ｗ次元データを互いの距離に基づいて近いデータ同士を同一クラスタに分類する処理である。各Ｍ×Ｋ×Ｗ次元データに割り当てられたクラスタを時系列順に並べることでクラスタ系列が得られる。クラスタリング手法としては、階層的手法（例えば、最短距離法、最長距離法、群平均法、ウォード法等）が用いられてもよいし、非階層的手法（例えば、Ｋ－Ｍｅａｎｓ法等）が用いられてもよい。

　ステップＳ１５：次に、クラスタ遷移系列作成部１５は、過去期間［ｓ１，ｅ１］と現在期間［ｓ２，ｅ２］の各時点におけるＭ×Ｋ×Ｗ（装置数×項目数×時間窓長）次元データに対しステップＳ１４で割り当てたクラスタを時間軸方向に追跡し、過去期間と現在期間のそれぞれについて、異なるクラスタ間におけるクラスタ遷移の系列を作成すると共に、このクラスタ遷移系列を構成する各クラスタに対し当該クラスタにおける滞在期間を付与する。具体的に過去期間［ｓ１，ｅ１］の時系列データ｛Ｙ_ｓ１，・・・，Ｙ_ｅ１｝から得られたクラスタ系列｛Ｃ_ｓ１，・・・，Ｃ_ｅ１｝を例にとり説明すると、区間［ｓ１，ｅ１］で異なるクラスタ間におけるクラスタ遷移が発生した時点をτ_ｉ（ｉ＝１，２，・・・，Ｉ）（ただし、τ_１＝ｓ１）、時点τ_ｉにおける遷移後クラスタのクラスタをｃ（τ_ｉ）とした場合、これを時系列順に並べることで長さＩのクラスタ遷移系列ｃ（τ_１）→ｃ（τ_２）→・・・→ｃ（τ_Ｉ）が得られる。また、このクラスタ遷移系列を構成する各クラスタｃ（τ_ｉ）に対し、当該クラスタｃ（τ_ｉ）における滞在期間ｄ（τ_ｉ）＝τ_ｉ＋１－τ_ｉ（ただし、τ_Ｉ＋１＝ｅ１）を付与することにより、滞在期間つきクラスタ遷移系列ｃ（τ_１）｜ｄ（τ_１）→ｃ（τ_２）｜ｄ（τ_２）→・・・→ｃ（τ_Ｉ）｜ｄ（τ_Ｉ）が得られる。

　ステップＳ１６：次に、クラスタ遷移テンソル算出部１６は、ステップＳ１５で作成されたクラスタ遷移系列から、あらかじめ設定された固定長Ｌのクラスタ遷移を抽出した上で、過去期間と現在期間における各クラスタ遷移パターンの出現確率を算出し、上記クラスタ遷移長Ｌを階数（次元）とし、過去期間と現在期間に出現したすべてのクラスタのユニーク値を各次元のインデックスに持ち、クラスタ遷移パターンの出現確率を値に持つクラスタ遷移テンソルを過去期間と現在期間のそれぞれについて算出する。具体的に過去期間［ｓ１，ｅ１］の時系列データ｛Ｙ_ｓ１，・・・，Ｙ_ｅ１｝から得られた長さＩのクラスタ遷移系列ｃ（τ_１）→ｃ（τ_２）→・・・→ｃ（τ_Ｉ）を例にとり説明すると、このクラスタ遷移系列から長さＬ（ただし、Ｌ≦Ｉ）のクラスタ遷移は（Ｉ－（Ｌ－１））本抽出することができ、ｃ（τ_{ｉ－（Ｌ－１）}）→ｃ（τ_{ｉ－（Ｌ－２）}）→・・・→ｃ（τ_ｉ）（ｉ＝Ｌ，・・・，Ｉ）で表される。クラスタ遷移テンソル算出部１６は、この（Ｉ－（Ｌ－１））本のクラスタ遷移をパターンごとにまとめて出現確率を算出し、これに基づきＬ次元のクラスタ遷移テンソルを算出する。ここで、クラスタ遷移パターンの出現確率とは、当該クラスタ遷移パターンの出現度数をすべてのクラスタ遷移パターンの出現度数合計で割った値である。

　なお、クラスタ遷移パターンの出現度数は、当該クラスタ遷移パターンの滞在期間で重みづけした値を用いても良い。以下、クラスタ遷移パターンの出現確率をテンソルに格納する方法について、簡単のため、Ｌ＝２、過去期間と現在期間を通じて出現したすべてのクラスタのユニーク値がα、β、γだった場合の例で説明する。このとき、クラスタ遷移テンソルは２次元で、各次元のインデックスは３つの値α、β、γをとる。クラスタ遷移テンソルは３×３の配列により表すことができ、クラスタ遷移パターンα→βの出現確率が０．１だった場合、第１軸のインデックス（クラスタ遷移パターンの第１要素）が値α、第２軸のインデックス（クラスタ遷移パターンの第２要素）が値βをとる配列要素に出現確率０．１を格納する。

　ステップＳ１７：次に、変化点スコア算出部１７は、ステップＳ１６で算出された過去期間と現在期間それぞれのクラスタ遷移テンソルに基づき、過去期間から現在期間にかけての変化度として、過去期間におけるクラスタ遷移テンソルと現在期間におけるクラスタ遷移テンソルの距離を算出する。過去期間のクラスタ遷移テンソルＤ_１の要素をｄ_１ ^{ｉ１，・・・，ｉＬ}、現在期間のクラスタ遷移テンソルＤ_２の要素をｄ_２ ^{ｉ１，・・・，ｉＬ}とした場合、両者間の距離はたとえば以下の平均平方二乗誤差により表すことができる。
（Σ_ｌ＝１ ^ＬΣ_ｍ＝１ ^Ｍ（ｄ_２ ^{ｉ１，・・・，ｉＬ}－ｄ_１ ^{ｉ１，・・・，ｉＬ}）^２／Ｍ^Ｌ）^１／２
　なお、下記テンソル間距離におけるＭは、過去期間と現在期間を通じて出現したすべてのクラスタのユニーク値の個数である。

　ステップＳ１８：次に、検知部１８は、ステップＳ１７で算出された変化点スコアがあらかじめ設定された閾値を超えた場合に変化点として検知する。即ち、検知部１８は、各時点におけるデータ（変換データ）に基づいて算出されたシステム状態の変化点スコアがあらかじめ設定された閾値を超えた場合に変化点として検知する。

　ステップＳ１９：最後に、出力部１９は、ステップＳ１８で検知された変化点を出力する。

　〔ハードウェア構成〕
　続いて、図３を用いて、変化点検知装置１０のハードウェア構成について説明する。図３は、変化点検知装置のハードウェア構成図である。

　図３に示されているように、変化点検知装置１０は、プロセッサ１０１、メモリ１０２、補助記憶装置１０３、接続装置１０４、通信装置１０５、ドライブ装置１０６を有する。なお、変化点検知装置１０を構成する各ハードウェアは、バス１０７を介して相互に接続される。

　プロセッサ１０１は、変化点検知装置１０全体の制御を行う制御部の役割を果たし、ＣＰＵ（Central Processing Unit）等の各種演算デバイスを有する。プロセッサ１０１は、各種プログラムをメモリ１０２上に読み出して実行する。なお、プロセッサ１０１には、ＧＰＧＰＵ(General-purpose computing on graphics processing units)が含まれていてもよい。

　メモリ１０２は、ＲＯＭ（Read Only Memory）、ＲＡＭ（Random Access Memory）等の主記憶デバイスを有する。プロセッサ１０１とメモリ１０２とは、いわゆるコンピュータを形成し、プロセッサ１０１が、メモリ１０２上に読み出した各種プログラムを実行することで、当該コンピュータは各種機能を実現する。

　補助記憶装置１０３は、各種プログラムや、各種プログラムがプロセッサ１０１によって実行される際に用いられる各種情報を格納する。

　接続装置１０４は、外部装置（例えば、表示装置１１０、操作装置１１１）と変化点検知装置１０とを接続する接続デバイスである。

　通信装置１０５は、他の装置との間で各種情報を送受信するための通信デバイスである。

　ドライブ装置１０６は記録媒体１３０をセットするためのデバイスである。ここでいう記録媒体１３０には、ＣＤ－ＲＯＭ(Compact Disc Read-Only Memory)、フレキシブルディスク、光磁気ディスク等のように情報を光学的、電気的あるいは磁気的に記録する媒体が含まれる。また、記録媒体１３０には、ＲＯＭ(Read Only Memory)、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等が含まれていてもよい。

　なお、補助記憶装置１０３にインストールされる各種プログラムは、例えば、配布された記録媒体１３０がドライブ装置１０６にセットされ、当該記録媒体１３０に記録された各種プログラムがドライブ装置１０６により読み出されることでインストールされる。あるいは、補助記憶装置１０３にインストールされる各種プログラムは、通信装置１０５を介してネットワークからダウンロードされることで、インストールされてもよい。

　〔実施形態の主な効果〕
　以上のように、本実施形態に係る変化点検知装置１０は、１つ又は複数の装置で構成されるシステム（Ｓ）の各時点におけるシステム状態を表す時系列データを用いて、システム状態に何らかの変化が発生した際に、その発生時点を変化点として検知することができる。

　しかも、本実施形態に係る変化点検知装置１０は、各時点におけるシステム状態をクラスタリング手法により状態分類する方法を前提としていることで、周期変動を示すなど定常性制約やiid制約を満たさないデータも含めた時系列データを対象とすることができる。さらに、本実施形態に係る変化点検知装置１０は、時間経過に伴うシステム（Ｓ）の状態遷移（つまり、各時点でシステム状態が属するクラスタとその滞在期間の遷移）を考慮することでシステム（Ｓ）の周期変動をモデル化しており、周期変動の変化など時間変化パターンの変化も含めた変化を検知することができる。

　〔補足〕
　本発明は上述の実施形態に限定されるものではなく、以下に示すような構成又は処理（動作）であってもよい。

　変化点検知装置１０はコンピュータとプログラムによっても実現できるが、このプログラムを（非一時的）記録媒体に記録することも、インターネット等のネットワークを通して提供することも可能である。

　〔付記項〕
　本実施形態は、以下に示すように表現することが可能である。

　〔付記項１〕
　プロセッサを有する変化点検知装置であって、
　前記プロセッサは、
　１つ又は複数の装置で構成されるシステムの各時点におけるシステム状態を表す時系列データであって、前記システムを構成する装置数×前記装置の状態を表す項目数の次元のデータで構成される時系列データを入力する入力ステップと、
　前記各時点における前記時系列データを装置数×項目数の次元のデータから、装置数×項目数×時間窓長の次元のデータに変換することで変換データを生成する時間窓生成ステップと、
　前記各時点における前記変換データに基づいて算出された前記システム状態の変化点スコアがあらかじめ設定された閾値を超えた場合に変化点として検知する検知ステップと、
　を実行する変化点検知装置。

　〔付記項２〕
　付記項１に記載の変化点検知装置であって、
　前記プロセッサは、
　あらかじめ設定された過去期間と現在期間の前記時系列データを構成する各時点の装置数×項目数×時間窓長の次元データをクラスタリング手法により状態分類するクラスタリングステップと、
　前記装置数×項目数×時間窓長の次元データに対し割り当てられたクラスタを時間軸方向に追跡し、過去期間と現在期間のそれぞれについて、異なるクラスタ間におけるクラスタ遷移の系列を作成すると共に、当該クラスタ遷移の系列を構成する各クラスタに対し当該クラスタにおける滞在期間を付与するクラスタ遷移系列作成ステップと、
　前記クラスタ遷移の系列から、あらかじめ設定された固定長のクラスタ遷移を抽出した上で、過去期間と現在期間における各クラスタ遷移パターンの出現確率を算出し、前記クラスタ遷移の長さを次元とし、過去期間と現在期間に出現したすべてのクラスタのユニーク値を各次元のインデックスに持ち、前記各クラスタ遷移パターンの出現確率を値に持つクラスタ遷移テンソルを過去期間と現在期間のそれぞれについて算出するクラスタ遷移テンソル算出ステップと、
　過去期間と現在期間それぞれについて算出された前記クラスタ遷移テンソルに基づき、過去期間から現在期間にかけての変化度として、過去期間における前記クラスタ遷移テンソルと現在期間における前記クラスタ遷移テンソルの距離を算出する変化点スコア算出ステップと、
　を実行する変化点検知装置。

　〔付記項３〕
　１つ又は複数の装置で構成されるシステムの各時点におけるシステム状態を表す時系列データであって、前記システムを構成する装置数×前記装置の状態を表す項目数の次元のデータで構成される時系列データを入力する入力手順と、
　前記各時点における前記時系列データを装置数×項目数の次元のデータから、装置数×項目数×時間窓長の次元のデータに変換することで変換データを生成する時間窓生成手順と、
　前記各時点における前記変換データに基づいて算出された前記システム状態の変化点スコアがあらかじめ設定された閾値を超えた場合に変化点として検知する検知手順と、
　をコンピュータが実行する変化点検知方法。

　〔付記項４〕
　コンピュータに、付記項３に記載の方法を実行させるプログラムが記録された非一時的記録媒体。

１０　変化点検知装置
１１　入力部
１２　時間窓生成部
１３　期間設定部
１４　クラスタリング部
１５　クラスタ遷移系列作成部
１６　クラスタ遷移テンソル算出部
１７　変化点スコア算出部
１８　検知部
１９　出力部

Claims

　１つ又は複数の装置で構成されるシステムの各時点におけるシステム状態を表す時系列データであって、前記システムを構成する装置数×前記装置の状態を表す項目数の次元のデータで構成される時系列データを入力する入力部と、
　前記各時点における前記時系列データを装置数×項目数の次元のデータから、装置数×項目数×時間窓長の次元のデータに変換することで変換データを生成する時間窓生成部と、
　前記各時点における前記変換データに基づいて算出された前記システム状態の変化点スコアがあらかじめ設定された閾値を超えた場合に変化点として検知する検知部と、
　を有する変化点検知装置。
　請求項１に記載の変化点検知装置であって、
　あらかじめ設定された過去期間と現在期間の前記時系列データを構成する各時点の装置数×項目数×時間窓長の次元データをクラスタリング手法により状態分類するクラスタリング部と、
　前記装置数×項目数×時間窓長の次元データに対し割り当てられたクラスタを時間軸方向に追跡し、過去期間と現在期間のそれぞれについて、異なるクラスタ間におけるクラスタ遷移の系列を作成すると共に、当該クラスタ遷移の系列を構成する各クラスタに対し当該クラスタにおける滞在期間を付与するクラスタ遷移系列作成部と、
　前記クラスタ遷移の系列から、あらかじめ設定された固定長のクラスタ遷移を抽出した上で、過去期間と現在期間における各クラスタ遷移パターンの出現確率を算出し、前記クラスタ遷移の長さを次元とし、過去期間と現在期間に出現したすべてのクラスタのユニーク値を各次元のインデックスに持ち、前記各クラスタ遷移パターンの出現確率を値に持つクラスタ遷移テンソルを過去期間と現在期間のそれぞれについて算出するクラスタ遷移テンソル算出部と、
　過去期間と現在期間それぞれについて算出された前記クラスタ遷移テンソルに基づき、過去期間から現在期間にかけての変化度として、過去期間における前記クラスタ遷移テンソルと現在期間における前記クラスタ遷移テンソルの距離を算出する変化点スコア算出部と、
　を有する変化点検知装置。
　１つ又は複数の装置で構成されるシステムの各時点におけるシステム状態を表す時系列データであって、前記システムを構成する装置数×前記装置の状態を表す項目数の次元のデータで構成される時系列データを入力する入力手順と、
　前記各時点における前記時系列データを装置数×項目数の次元のデータから、装置数×項目数×時間窓長の次元のデータに変換することで変換データを生成する時間窓生成手順と、
　前記各時点における前記変換データに基づいて算出された前記システム状態の変化点スコアがあらかじめ設定された閾値を超えた場合に変化点として検知する検知手順と、
　をコンピュータが実行する変化点検知方法。
　コンピュータに、請求項３に記載の方法を実行させるプログラム。