JP2016170518A - 情報処理装置、情報処理方法及びプログラム - Google Patents
情報処理装置、情報処理方法及びプログラム Download PDFInfo
- Publication number
- JP2016170518A JP2016170518A JP2015048517A JP2015048517A JP2016170518A JP 2016170518 A JP2016170518 A JP 2016170518A JP 2015048517 A JP2015048517 A JP 2015048517A JP 2015048517 A JP2015048517 A JP 2015048517A JP 2016170518 A JP2016170518 A JP 2016170518A
- Authority
- JP
- Japan
- Prior art keywords
- feature
- information processing
- group
- processing apparatus
- occurrence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】精度よく異常判定を行うための情報を生成することを目的とする。
【解決手段】未知のデータが、特定のクラスに属するか否かを判定するための情報を生成する情報処理装置であって、特定のクラスに属する学習データ群を受け付ける受付手段と、学習データ群から、複数の特徴量それぞれに対応する特徴グループ間の共起性に基づいて、共起する複数の特徴グループを含む組を生成する第1の生成手段とを有する。
【選択図】図1
【解決手段】未知のデータが、特定のクラスに属するか否かを判定するための情報を生成する情報処理装置であって、特定のクラスに属する学習データ群を受け付ける受付手段と、学習データ群から、複数の特徴量それぞれに対応する特徴グループ間の共起性に基づいて、共起する複数の特徴グループを含む組を生成する第1の生成手段とを有する。
【選択図】図1
Description
本発明は、情報処理装置、情報処理方法及びプログラムに関する。
従来、監視カメラや製造現場での部品の品質チェック等において正常と異なる対象を検出する異常検知技術が知られており、異常検知技術について、これまで多くの研究がなされている(特許文献1、特許文献2参照)。異常検知技術には大きく分けて2つの方式が考えられ、異常データを豊富に用意できる場合には、サポートベクトルマシンやブースティングを用いた識別モデルによる異常−正常分離問題と捉えることができる。
しかし、現実の異常検知の現場においては豊富な異常サンプルが取得できることは稀で、大量の正常データに対してごく少量の異常データサンプルしか存在しない場合が多い。さらに、異常データサンプルが存在しない未知の異常も存在し得る場合もある。このような問題を解決すべく、異常検知では正常データのみから正常モデルを生成し、この正常モデルから逸脱する入力データを異常と判定することによって、未知の異常データを検出する技術が知られている。このような正常モデルベースの手法として、sparse codingを用いた手法(非特許文献1参照)や1クラスSVMを用いた手法(非特許文献2参照)が挙げられる。
"Online Detection of Unusual Events in Videos via Dynamic Sparse Coding", B. Zhao,Li Fei-Fei CVPR2011
"SVM and Boosting:One Class", G. Ratsch, B. Scholkopf, S. Mika, K. Muller, 2000
しかしながら、例えば監視カメラの映像を異常判定の対象とする場合等においては、状況に応じて正常モデルのバリエーションが大きく、複数の傾向の異なる正常分布の混合によって表現されるクラスが存在する。そのため、ある状況において異常判定を行う場合に、判定対象となるテストデータの状況と無関係な状況が異常判別に影響を与え、正しい異常判別を行えない場合があるという問題があった。
本発明はこのような問題点に鑑みなされたもので、精度よく異常判定を行うための情報を生成することを目的とする。
そこで、本発明は、未知のデータが、特定のクラスに属するか否かを判定するための情報を生成する情報処理装置であって、前記特定のクラスに属する学習データ群を受け付ける受付手段と、前記学習データ群から、複数の特徴量それぞれに対応する特徴グループ間の共起性に基づいて、共起する複数の特徴グループを含む組を生成する第1の生成手段とを有することを特徴とする。
本発明によれば、精度よく異常判定を行うための情報を生成することができる。
以下、本発明の実施形態について図面に基づいて説明する。
(第1の実施形態)
第1の実施形態に係る情報処理装置は、未知のデータに対し異常判定を行う装置であり、また、未知のデータが特定のクラスに属するか否かを判定する際に利用する情報の生成も行う。本実施形態においては、監視カメラにより撮影された動画を未知のデータ群とし、未知のデータ群が特定のクラスとしての、正常クラスに属するか否かの異常判定を行う場合を例に説明する。本実施形態に係る情報処理装置は、正常クラスに属するデータ群を学習データ群として用いて、異常判定に利用する情報を生成する。
以下、未知のデータ群をテストデータセットと称することとする。また、正常クラスに属する学習データ群を正常データセットと称することとする。ここで、正常データセットは、複数のフレームを含む動画であり、正常データは、動画を構成する各フレームである。同様に、テストデータセットは、複数のフレームを含む動画であり、テストデータは、動画を構成する各フレームである。正常データには、すべての時間帯、あらゆる性別、年齢の人物、場所等の画像が含まれているものとする。
正常データセットが「朝」、「昼」、「夜」の3つの時間帯及び「男性」、「女性」の2つの性別のデータを含むのに対し、テストデータセットが、時間帯「朝」、「昼」、性別「女性」しか含まない場合がある。このような状況で、正常データから異常判定のためのデータを生成し、テストデータセットの異常判定を行った場合、テストデータセットに存在しない「夜」、「男性」の正常データに起因した誤検出の可能性が高くなる。
これに対し、本実施形態に係る情報処理装置100は、「朝」、「昼」、「夜」、「男性」、「女性」といった属性毎に定まる特徴量のグループ(特徴グループ)を設定する。そして、情報処理装置100は、共起性の高い複数の特徴グループを特定し、これらを含む組を生成する。そして、情報処理装置100は、テストデータセットの対応する特徴量と、組に含まれる特徴グループとに基づいて、テストデータセットの異常判定を行う。ここで、共起とは、ある事象Aが発生するときに、事象Bが同時に発生することであり、例えば「昼」という属性と、「女性」という属性は両立し得る。したがって、属性「昼」と「女性」の共起性は高くなる。
本実施形態に係る情報処理装置100は、特徴量として確率変数を用いることとし、確率分布の相互情報量が大きい場合に共起性が高いと判断することとする。相互情報量は、(式1)で表現される。
ここで、I(X;Y)は相互情報量であり、I(X;Y)=0の時、確率変数XとYは独立となりI(X;Y)が十分大きい場合、2つの確率分布は相互依存性が高く同時発生する。したがって、情報処理装置100は、I(X;Y)が十分大きい場合、すなわち閾値以上である場合に、共起性が高いと判断することとする。
図1は、情報処理装置100のソフトウェア構成を示す図である。本実施形態においては、正常データに、撮影時刻が示されたタグが付与されている場合について説明することとする。情報処理装置100は、確率変数設定部101と、第1の分布生成部102と、評価部103と、組生成部104と、第2の分布生成部105と、異常判定部106とを有している。
確率変数設定部101は、正常データセットが入力されると、正常データセットの特徴量として、確率変数を設定する。第1の分布生成部102は、確率変数設定部101により設定された確率変数毎の分布、すなわち確率分布を生成する。ここで、確率分布は、特徴量に対応する特徴グループの一例である。評価部103は、確率分布間の共起性を評価する。組生成部104は、評価部103の評価結果に基づいて、共起性の高い確率分布の組を生成する。第2の分布生成部105は、テストデータセットが入力されると、組生成部104により生成された確率分布の組に対応する確率分布(テスト分布)を生成する。異常判定部106は、正常データセットから生成された確率分布と、テスト分布とに基づいて、テストデータセットが正常データであるか異常データであるかの異常判定を行う。
図2は、情報処理装置100による、学習処理のフローチャートである。S200において、確率変数設定部101は、正常データセットの入力を受け付ける。ここで、S200の処理は、特定クラスに属する学習データ群を受け付ける受付処理の一例である。次に、S201において、確率変数設定部101は、正常データセットの確率変数を設定する。具体的には、確率変数設定部101は、正常データセットのタグから撮影時刻を抽出し、撮影時刻に基づいて、時間帯を示す3つの属性「朝」、「昼」、「夜」を基準属性として特定する(特定処理)。そして、確率変数設定部101は、正常データを基準属性に対して適切に分離することのできる確率変数を設定する。
図3は、確率変数設定処理(S201)の説明図である。例えば、特徴Aに対する正常データセットの分布が図3に示すように、3つの範囲に分かれ、各範囲の分布301、302、303がそれぞれ、属性「朝」、「昼」、「夜」の正常データの分布に相当するものとする。この場合、確率変数設定部101は、特徴Aに対する確率変数を、属性「朝」、「昼」、「夜」を適切に分離できる確率変数として設定する。
S201において、確率変数設定部101はさらに、基準属性と異なる他の属性に対応する確率変数を設定する。なお、確率変数設定部101は、他の属性に対応する確率変数については、ランダムに選出してもよく、また他の例としては、タグに示される情報から恣意的に特定してもよい。例えば、タグに性別が示されている場合には、確率変数設定部101は、「男性」、「女性」の属性に対する確率変数を設定してもよい。ここで、確率変数は、属性の特徴量に対応する特徴グループの一例であり、S200の処理は、特徴グループを設定するグループ設定処理の一例である。
次に、S202において、第1の分布生成部102は、S201において設定した各確率変数の分布を生成する。図4は、分布生成処理(S202)の説明図である。ステップS201において、属性「朝」、「昼」、「夜」、「男性」、「女性」に対応する確率変数が設定されていた場合、これら5つの確率変数に対する確率分布401〜405を生成する。なお、確率分布404,405は、それぞれ特徴量Bに対応する確率変数に対応する確率分布であるものとする。また、特徴量Bに対応する確率変数は、属性「男性」、「女性」を適切に分離できる確率変数であるものとする。
次に、S203において、評価部103は、確率分布間の共起性を評価する。ここで、S203の処理は、特徴グループ間の共起性を評価する評価処理の一例である。評価部103は、具体的には、確率密度比を用いた相互情報量算出法を用いることにより、(式2)、(式3)により相互情報量を算出する。
ここで、x,yは、確率変数、
は、相互情報量である。なお、確率密度比を用いた相互情報量算出法については、以下の文献を参照することができる。
"Mutual Information Approximation via Maximum Likelihood Estimation of Density Ratio", T. Suzuki, M. Sugiyama & T. Tanaka, 2009
"Mutual Information Approximation via Maximum Likelihood Estimation of Density Ratio", T. Suzuki, M. Sugiyama & T. Tanaka, 2009
次に、S204において、組生成部104は、確率分布間の相互情報量に基づいて、共起性の高い複数の確率分布を含む第1の組と、共起性の低い複数の確率分布を含む第2の組と、を生成する。まず、第1の組を生成する処理について説明する。組生成部104は、基準属性に対応する確率分布との共起性が高い順に2つの確率分布を特定する。そして、組生成部104は、特定した2つの確率分布と、基準属性の確率分布とを、共起性の高い複数の確率分布として含む第1の組を生成する。なお、第1の組に含める確率分布の数は実施形態に限定されるものではなく、組生成部104は共起性が高い順に所定の数の確率分布を含む第1の組を生成すればよい。以上で学習処理が完了する。なお、共起性の高い複数の確率分布は、共起する複数の特徴グループの一例であり、S204の処理は、共起性に基づいて、共起する複数の特徴グループを含む組を生成する生成処理の一例である。また、他の例としては、組生成部104は、基準属性の確率分布との共起性が閾値以上の確率分布と、基準属性の確率分布とを、共起性の高い複数の確率分布として含む第1の組を生成してもよい。次に、第2の組を生成する処理について説明する。組生成部104は、共起性が閾値未満の複数の確率分布を特定する。そして、組生成部104は、特定した複数の確率分布を共起性の低い複数の確率分布として含む第2の組を生成する。
本処理により、例えば、図4に示す同じ特徴Aに対する確率分布401,402,403が共起性の低い複数の確率分布として特定され、これらを含む第2の組が生成される。また、同じ特徴Bに対する確率分布404,405が共起性の低い複数の確率分布として特定され、これらを含む第2の組が生成される。一方で、図4に示す異なる特徴に対する確率分布401,405を含む第1の組が生成される。また、確率分布403,404を含む第1の組が生成される。このように、第1の組には、属性、すなわち特徴の異なる複数の確率分布が含まれるのに対し、第2の組には、属性、すなわち特徴が等しい複数の確率分布が含まれる。
こうして生成された第1の組及び第2の組の情報がテストデータセットの異常判定において利用される。上記学習処理において生成された第1の組は、共起性の高い複数の確率分布を含んでいる。したがって、この組の情報を利用してテストデータセットの異常判定を行うことにより、テストデータセットが正常データセットの複数の確率分布のうち一部の確率分布しか含まない場合においても、精度よく異常判定処理を行うことができる。
図5は、異常判定処理を示すフローチャートである。S500において、第2の分布生成部105は、テストデータセットを受け付ける。次に、S501において、第2の分布生成部105は、テストデータセットに対し、学習処理(図2)において生成された第2の組に含まれる確率分布に対応する属性の確率分布を生成する。次に、S502において、異常判定部106は、第2の組及び第1の組に含まれる確率分布と、分布生成処理(S501)で生成されたテストデータセットのテスト分布と、に基づいて、テストデータセットの異常判定を行う(判定処理)。以上で、異常判定処理が完了する。
ここで、以下の前提で異常判定処理をより具体的に説明する。すなわち、学習処理において、属性「朝」の確率分布401と、属性「女性」の確率分布405とを含む第1の組が生成されているものとする。また、学習処理において、属性「夜」の確率分布403と、属性「男性」の確率分布404とを含む第1の組が生成されているものとする。さらに、学習処理において、「朝」、「昼」、「夜」の確率分布401〜403を含む第2の組と、「男性」、「女性」の確率分布404〜405を含む第2の組が生成されているものとする。
以上の前提の場合において、S501において、分布生成部105は、テストデータに対し、確率分布401〜403に対応する特徴Aに対する特徴量の分布、すなわちテスト分布を生成する。分布生成部105はまた、確率分布404,405に対応する特徴Bに対する特徴量の分布、すなわちテスト分布を生成する。
次に、S502において、異常判定部106は、密度比推定を用いた方法により、対応する特徴に対するテスト分布と確率分布と間の異常判定を行う。密度比推定については、以下の文献を参照することができる。
"Inlier-based Outlier Detection via Direct Density Ratio Estimation", S. Hido, Y. Tsuboi, H. Kashima, M. Sugiyama and T. Kanamori, 2008
"Inlier-based Outlier Detection via Direct Density Ratio Estimation", S. Hido, Y. Tsuboi, H. Kashima, M. Sugiyama and T. Kanamori, 2008
具体的には、異常判定部106は、第2の組に含まれる時間帯の確率分布401〜403それぞれと、これらの確率分布に対応する特徴Aに対するテスト分布との間の異常判定を行う。本処理において、異常判定部106は、テスト分布が確率分布401〜403のいずれかの確率分布に対応する場合に、テストデータセットが正常データであると判定する。また、異常判定部106は、いずれの確率分布にも対応しない場合に、テストデータセットが異常データであると判定する。異常判定部106はさらに、第2の組に含まれる性別の確率分布404,405それぞれと、これらの確率分布に対応する特徴Bに対するテスト分布と間の異常判定を行う。異常判定部106は、テスト分布が確率分布404,405のいずれかの確率分布に対応する場合に、テストデータセットが正常データであると判定する。また、異常判定部106は、いずれの確率分布にも対応しない場合に、テストデータセットが異常データであると判定する。
なお、時間帯の確率分布とテスト分布との間の異常判定処理と、性別の確率分布とテスト分布との間の異常判定処理と、は、互いに独立した処理なので、異常判定部106は、これらの処理を並列に実行してもよい。これにより、処理の高速化を図ることができる。
最後に、異常判定部106は、2つ判定結果を統合して、異常判定を行う。上記2つの判定において、テストデータが正常データであるという2つの判定結果が得られたとする。この場合、異常判定部106は、さらに、特徴Aに対応するテスト分布と特徴Bに対応するテスト分布がいずれかの第1の組に含まれる確率分布に対応するか否かを確認する。そして、異常判定部106は、いずれかの第1の組に含まれる確率分布に対応すると判定された場合に、テストデータセットは正常データであると判定する。なお、異常判定部106は、テスト分布がいずれの第1の組に含まれる確率分布にも対応しない場合には、テストデータセットは異常データであると判定する。
例えばテストデータセットに対し、属性「朝」の確率分布401に対応すると判定され、且つ属性「男性」の確率分布404に対応すると判定されたとする。この場合、各判定において正常データであると判定されている。しかしながら、第1の組において、属性「朝」の確率分布401は、属性「女性」の確率分布405と共起性が高いものとして設定されており、テストデータに対する判定結果の組み合わせが、第1の組の確率分布の組み合わせに対応していない。このため、異常判定部106は、この場合には、テストデータセットは異常データであると判定する。なお、異常判定部106は確率分布とテスト分布とに基づいて異常判定を行えばよい、異常判定における具体的な処理は、実施形態に限定されるものではない。
図6は、情報処理装置100のハードウェア構成を示す図である。情報処理装置100は、CPU601と、ROM602と、RAM603と、HDD604と、表示部605と、入力部606と、ネットワークI/F部607とを有している。CPU601は、ROM602に記憶された制御プログラムを読み出して各種処理を実行する。RAM603は、CPU601の主メモリ、ワークエリア等の一時記憶領域として用いられる。HDD604は、画像データや各種プログラム等各種情報を記憶する。表示部605は、各種情報を表示する。入力部606は、キーボードやマウスを有し、ユーザによる各種操作を受け付ける。ネットワークI/F部607は、ネットワークを介して画像形成装置等の外部装置との通信処理を行う。なお、ネットワークとしては、イーサネット(登録商標)が挙げられる。また、他の例としては、ネットワークI/F部607は、無線により外部装置との通信を行ってもよい。
なお、情報処理装置100の機能や処理は、CPU601がROM602又はHDD604に格納されているプログラムを読み出し、このプログラムを実行することにより実現されるものである。
以上のように、本実施形態に係る情報処理装置100は、共起性の高い確率変数に着目して、テストデータセットの異常判定を行うことにより、精度よく異常判定を行うための情報を生成することができる。さらに、情報処理装置100は、共起性の低い確率変数に着目して、これらの排他的関係を利用して異常判定を行うことにより、処理の高速化を図ることができる。
第1の実施形態に係る情報処理装置100の第1の変更例として、図2を参照しつつ説明した確率変数設定処理(S201)における具体的な処理は実施形態に限定されるものではない。例えば、正常データセットに属性となり得る情報が示されたタグが付与されていない場合には、確率変数設定部101は、確率密度比を用いた独立成分分析(ICA)により、相互情報量の小さい確率変数を算出する。なお、確率密度比を用いたICAについては、以下の文献を参照することができる。
"Web上からの人間関係ネットワークの抽出"、 松尾豊、 友部博教、 橋田浩一、 中島秀之、 石塚満、 2005
"Web上からの人間関係ネットワークの抽出"、 松尾豊、 友部博教、 橋田浩一、 中島秀之、 石塚満、 2005
確率変数設定部101は、例えば、性別に関する確率分布に対してICAを適用する場合、まず主成分分析(PCA)をかけて次元削減を行い、有効な次元数を算出する。そして、確率変数設定部101は、算出した次元に基づいてICAを適用することで、タグ等の情報がなくとも適切な分離を行うことができる。例えば、正常データに被写体として映る人物の性別をすべて人手で特定することが困難な場合や、動きの種類や時間帯等正常データを明確に分離可能な基準がない場合もある。確率変数設定部101は、このような場合であっても、ICAにより独立性を指標として分離することができる。この場合、確率変数設定部101は、例えば、時間帯に対し「朝」、「昼」、「夜」という排他的な関係にある3つの確率変数を設定することができる。監視カメラにより撮影された映像等では、時間等の自動で付与できるタグ以外にタグを付けることは事実上不可能である。本変更例に係る確率変数設定部101は、このような場合においても、共起性の高い関係の分布を求めて、確率変数を設定することができる。
第2の変更例としては、図2を参照しつつ説明した共起性評価処理(S203)における具体的な処理は実施形態に限定されるものではない。例えば、評価部103は、Fast-ICAやinfomax、JADEのような手法により、共起性を評価してもよい。また、他の例としては、評価部103は、相関・正準相関分析を用いた方法、結合エントロピーを用いた手法等により、共起性を評価してもよい。また、他の例としては、評価部103は、言語の共起性の評価方法と同様に頻度を用いて共起性を評価してもよい。評価部103は、例えば、共起頻度二つの状況X、Yが共起する頻度を共起頻度とし、共起頻度を|X∩Y|で表される指標で算出してもよい。
他にも、評価部103は、|X∩Y|/|X∪Y|で表されるJaccard係数、|X∩Y|/min(|X∪Y|)で表されるsimpson係数、|X∩Y|/√(|X||Y|)で表されるコサイン距離等により共起性を評価してもよい。なお、タグが存在する場合には、タグ情報を元に上記の係数を算出することが可能であり、上記のような指数を用いて共起性を評価することができることは言うまでもない。
第3の変更例としては、情報処理装置100は、テストデータ単体に対し、異常判定を行ってもよい。この場合には、異常判定部106は、テストデータが学習処理において生成された第1の組に含まれるすべての確率分布に含まれる場合に、正常データであると判定し、これ以外の場合には、異常データであると判定すればよい。
(第2の実施形態)
次に、第2の実施形態に係る情報処理装置について説明する。第2の実施形態に係る情報処理装置は、正常データセットの特徴空間及び特徴ベクトルに基づいて、正準相関分析(CCA)を拡張することにより、テストデータの異常判定を行う。本実施形態においては、正常データセットに属性となり得る情報が示されたタグが付与されていない場合を例に説明する。
次に、第2の実施形態に係る情報処理装置について説明する。第2の実施形態に係る情報処理装置は、正常データセットの特徴空間及び特徴ベクトルに基づいて、正準相関分析(CCA)を拡張することにより、テストデータの異常判定を行う。本実施形態においては、正常データセットに属性となり得る情報が示されたタグが付与されていない場合を例に説明する。
図7は、第2の実施形態に係る情報処理装置700のソフトウェア構成を示す図である。情報処理装置700は、特徴空間生成部701と、射影部702と、異常判定部703とを有している。特徴空間生成部701は、CCAを利用して、正常データセットから、共起性の高い複数の特徴空間の組を生成する。射影部702は、テストデータを特徴空間生成部701により生成された組に含まれる特徴空間に射影する。異常判定部703は、射影されたテストデータが特徴空間に含まれるか否かに基づいて、異常判定を行う。
図8は、第2の実施形態に係る情報処理装置700による、学習処理を示すフローチャートである。S800において、特徴空間生成部701は、正常データセットの入力を受け付ける(受付処理)。次に、S801において、特徴空間生成部701は、共起性の高い複数の特徴空間の組を生成する。具体的には、特徴空間生成部701は、(式4)により、CCAに基づく特徴量の分離を行う。
ここで、Cxxは、(式5)の通りである。
なお、本処理については、以下の2つの文献を参照することができる。
"Canonical Correlation a Tutorial", M. Borga, 2001
"A variable selection method in principal canonical correlation analysis", T. Ogura, 2010
"Canonical Correlation a Tutorial", M. Borga, 2001
"A variable selection method in principal canonical correlation analysis", T. Ogura, 2010
本実施形態に係る情報処理装置700は、異常判定に利用すべく、共起性の高い特徴空間の組を生成するが、共起性最大化は正準相関係数最大化問題として置き換えることができる。すなわち、(式4)のρを最大可するWx,Wyを求める問題と考えることができる。(式4)の右辺第1項では、通常のCCAと同様で特徴ベクトル間の正準相関係数の大きいものを評価することになる。しかしこの場合には近傍で少数の特徴ベクトルが入れ替わっただけのものが選択される可能性もある。そこで右辺第2項にL1ノルムによるスパース項を加えることによって、相互相関(相関量)が大きくスパースな関係にある部分空間を抽出することが可能となる。
上式ρを最大化する特徴ベクトルWx,Wyを求める式は以下のようになる。
さらに、(式6)をKuhn−Tucker条件に当てはめて解くことを考えると、(式7)、(式8)が得られる。
ここで、Lagrange Dualityから(式9)が得られ、(式10)を満たすWx,Wyを求めればよいこととなる。
この方法により、タグ等の事前情報を要することなく、相互関係が大きくスパースな特徴空間を抽出することができる。
本実施形態に係る特徴空間生成部701は、(式10)により正常データセットから特徴ベクトルWx,Wyを算出する。そして、特徴空間生成部701は、特徴ベクトルWx,Wyそれぞれにより形成される部分空間(特徴空間)を設定する。ここで、特徴ベクトルは、特徴量の一例であり、特徴空間は特徴グループの一例である。さらに、本処理は、共起性に基づいて、共起する複数の特徴グループを含む組を生成する生成処理の一例である。なお、ここでは、2つの特徴ベクトルを算出する場合を例に説明したが、特徴空間生成部701は、CCAの拡張により、3以上の特徴ベクトルを算出し、これらに対応する3以上の特徴空間を設定してもよい。以上で学習処理が完了する。
図9は、異常判定処理を示すフローチャートである。S900において、射影部702は、テストデータを受け付ける。次に、S901において、射影部702は、テストデータを学習処理(図8)において生成された組に含まれる各特徴空間に射影する。次に、S902において、異常判定部703は、射影されたテストデータが各特徴空間に含まれるか否かに基づいて、異常判定を行う。異常判定部703は、具体的には、テストデータが組に含まれるすべての特徴空間に属する場合に、テストデータは正常データであると判定し、これ以外の場合には、テストデータは異常データであると判定することとする。これにより、誤検出の少ない異常判定が可能となる。
なお、異常判定方法は、実施形態に限定されるものではない。異常判定部703は、例えば、部分空間法を用いた異常検知や、One-Class SVMを用いた異常検知、sparse codingを用いた異常検知を用いてもよい。部分空間を用いた異常検知については、以下の文献を参照することができる。
"複数人動画像からの異常動作検出"、 南里卓也、 大津展之、 2005
また、One-Class SVMを用いた異常検知及びsparse codingを用いた異常検知については、それぞれ非特許文献2及び非特許文献1を参照することができる。なお、第2の実施形態に係る情報処理装置のこれ以外の構成及び処理は、第1の実施形態に係る情報処理装置の構成及び処理と同様である。
"複数人動画像からの異常動作検出"、 南里卓也、 大津展之、 2005
また、One-Class SVMを用いた異常検知及びsparse codingを用いた異常検知については、それぞれ非特許文献2及び非特許文献1を参照することができる。なお、第2の実施形態に係る情報処理装置のこれ以外の構成及び処理は、第1の実施形態に係る情報処理装置の構成及び処理と同様である。
以上、上述した各実施形態によれば、精度よく異常判定を行うための情報を生成することができる。
<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
100 情報処理装置
101 確率変数設定部
102 第1の分布生成部
103 評価部
104 組生成部
101 確率変数設定部
102 第1の分布生成部
103 評価部
104 組生成部
Claims (12)
- 未知のデータが、特定のクラスに属するか否かを判定するための情報を生成する情報処理装置であって、
前記特定のクラスに属する学習データ群を受け付ける受付手段と、
前記学習データ群から、複数の特徴量それぞれに対応する特徴グループ間の共起性に基づいて、共起する複数の特徴グループを含む組を生成する第1の生成手段と
を有することを特徴とする情報処理装置。 - 前記学習データ群に基づいて、複数の属性それぞれの特徴量に対応する前記特徴グループを設定するグループ設定手段と、
前記特徴グループ間の共起性を評価する評価手段と
をさらに有し、
前記第1の生成手段は、前記評価手段による評価結果に基づいて、共起する複数の特徴グループの組を生成することを特徴とする請求項1に記載の情報処理装置。 - 前記第1の生成手段は、確率変数を前記特徴量とし、確率変数毎の確率分布を前記特徴グループとして、前記組を生成することを特徴とする請求項1又は2に記載の情報処理装置。
- 前記第1の生成手段は、特徴ベクトルを前記特徴量とし、特徴ベクトルの特徴空間を前記特徴グループとして、前記組を生成することを特徴とする請求項1又は2に記載の情報処理装置。
- 前記学習データ群に対して設定されている情報に基づいて、基準属性を特定する特定手段をさらに有し、
前記グループ設定手段は、前記特定手段により特定された前記基準属性を含む複数の属性それぞれの前記特徴グループを設定し、
前記評価手段は、前記特定手段により特定された前記基準属性と異なる他の属性の前記特徴グループと、前記基準属性の前記特徴グループの間の共起性を評価し、
前記第1の生成手段は、前記基準属性の特徴グループを含む、共起する複数の特徴グループの組を生成することを特徴とする請求項2に記載の情報処理装置。 - 前記評価手段は、相互情報量を用いて共起性を評価することを特徴とする請求項2に記載の情報処理装置。
- 前記評価手段は、相関量を用いて共起性を評価することを特徴とする請求項2に記載の情報処理装置。
- 前記第1の生成手段は、前記基準属性に対応する特徴グループとの共起性が高い順に所定の数の特徴グループと、前記基準属性の特徴グループとを、共起する複数の特徴グループとして含む組を生成することを特徴とする請求項5に記載の情報処理装置。
- 前記第1の生成手段は、前記基準属性の特徴グループとの共起性が閾値以上の特徴グループと、前記基準属性の特徴グループとを、共起する複数の特徴グループとして含む組を生成することを特徴とする請求項5に記載の情報処理装置。
- 前記組に含まれる各特徴グループと、前記特徴グループに対応する、前記未知のデータの特徴量と、に基づいて、前記未知のデータが前記特定のクラスに属するか否かを判定する判定手段をさらに有することを特徴とする請求項1乃至9何れか1項に記載の情報処理装置。
- 未知のデータが、特定のクラスに属するか否かを判定するための情報を生成する情報処理装置が実行する情報処理方法であって、
前記特定のクラスに属する学習データ群を受け付ける受付ステップと、
前記学習データ群から、複数の特徴量それぞれに対応する特徴グループ間の共起性に基づいて、共起する複数の特徴グループを含む組を生成する第1の生成ステップと
を含むことを特徴とする情報処理方法。 - コンピュータを、
特定のクラスに属する学習データ群を受け付ける受付手段と、
前記学習データ群から、複数の特徴量それぞれに対応する特徴グループ間の共起性に基づいて、共起する複数の特徴グループを含む組を、未知のデータが前記特定のクラスに属するか否かを判定するための情報として生成する生成手段と
して機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015048517A JP2016170518A (ja) | 2015-03-11 | 2015-03-11 | 情報処理装置、情報処理方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015048517A JP2016170518A (ja) | 2015-03-11 | 2015-03-11 | 情報処理装置、情報処理方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016170518A true JP2016170518A (ja) | 2016-09-23 |
Family
ID=56983769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015048517A Pending JP2016170518A (ja) | 2015-03-11 | 2015-03-11 | 情報処理装置、情報処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016170518A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019153279A (ja) * | 2017-12-25 | 2019-09-12 | ダッソー システムズDassault Systemes | 物理的システムに影響を与えるイベントの予測 |
CN110766079A (zh) * | 2019-10-24 | 2020-02-07 | 南京纳贝信息技术有限公司 | 用于屏幕异常画面检测的训练数据的生成方法与装置 |
JP2020140572A (ja) * | 2019-02-28 | 2020-09-03 | 富士通株式会社 | 配分方法、抽出方法、配分プログラム、抽出プログラム、配分装置及び抽出装置 |
JP2020154406A (ja) * | 2019-03-18 | 2020-09-24 | 富士電機株式会社 | 情報処理装置、判定装置、モデルの学習方法 |
CN116327152A (zh) * | 2022-12-14 | 2023-06-27 | 重庆理工大学 | 一种远程非接触式心率检测系统及方法 |
-
2015
- 2015-03-11 JP JP2015048517A patent/JP2016170518A/ja active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019153279A (ja) * | 2017-12-25 | 2019-09-12 | ダッソー システムズDassault Systemes | 物理的システムに影響を与えるイベントの予測 |
JP7495777B2 (ja) | 2017-12-25 | 2024-06-05 | ダッソー システムズ | 物理的システムに影響を与えるイベントの予測 |
JP2020140572A (ja) * | 2019-02-28 | 2020-09-03 | 富士通株式会社 | 配分方法、抽出方法、配分プログラム、抽出プログラム、配分装置及び抽出装置 |
JP7310171B2 (ja) | 2019-02-28 | 2023-07-19 | 富士通株式会社 | 配分方法、抽出方法、配分プログラム、抽出プログラム、配分装置及び抽出装置 |
JP2020154406A (ja) * | 2019-03-18 | 2020-09-24 | 富士電機株式会社 | 情報処理装置、判定装置、モデルの学習方法 |
JP7423898B2 (ja) | 2019-03-18 | 2024-01-30 | 富士電機株式会社 | 情報処理装置、判定装置、モデルの学習方法 |
JP7435866B2 (ja) | 2019-03-18 | 2024-02-21 | 富士電機株式会社 | 情報処理装置、判定装置、モデルの学習方法 |
CN110766079A (zh) * | 2019-10-24 | 2020-02-07 | 南京纳贝信息技术有限公司 | 用于屏幕异常画面检测的训练数据的生成方法与装置 |
CN116327152A (zh) * | 2022-12-14 | 2023-06-27 | 重庆理工大学 | 一种远程非接触式心率检测系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Soheily-Khah et al. | Generalized k-means-based clustering for temporal data under weighted and kernel time warp | |
US20200034656A1 (en) | Information recommendation method, computer device, and storage medium | |
AU2017209231B2 (en) | Method, system, device and readable storage medium for realizing insurance claim fraud prevention based on consistency between multiple images | |
US10657281B2 (en) | Information processing apparatus and method for specifying learning data | |
US9355306B2 (en) | Method and system for recognition of abnormal behavior | |
US9489570B2 (en) | Method and system for emotion and behavior recognition | |
US20190012553A1 (en) | Diagnostic device, diagnosis method and computer program | |
JP5889019B2 (ja) | ラベル付加装置、ラベル付加方法及びプログラム | |
JP2016170518A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2009086901A (ja) | 年齢推定システム及び年齢推定方法 | |
JP2017102906A (ja) | 情報処理装置、情報処理方法及びプログラム | |
US20220083814A1 (en) | Associating a population descriptor with a trained model | |
CN108228684B (zh) | 聚类模型的训练方法、装置、电子设备和计算机存储介质 | |
JP2015207179A (ja) | 行動理解システムおよびプログラム | |
US9721162B2 (en) | Fusion-based object-recognition | |
JP7120590B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN105528620A (zh) | 一种联合鲁棒主成分特征学习与视觉分类方法及系统 | |
JP2017102865A (ja) | 情報処理装置、情報処理方法及びプログラム | |
Zhu | Pain expression recognition based on pLSA model | |
Jung et al. | Uncertainty estimation for multi-view data: The power of seeing the whole picture | |
JP2021018466A (ja) | ルール抽出装置、情報処理装置、ルール抽出方法及びルール抽出プログラム | |
US10007842B2 (en) | Same person determination device and method, and control program therefor | |
JP2019149028A (ja) | 情報処理装置、情報処理装置の制御方法及びプログラム | |
US20220092361A1 (en) | System Improvement For Deep Neural Networks | |
JP2015219756A (ja) | 画像比較方法、装置並びにプログラム |