WO2022168274A1

WO2022168274A1 - 情報処理装置、選択出力方法、及び選択出力プログラム

Info

Publication number: WO2022168274A1
Application number: PCT/JP2021/004388
Authority: WO
Inventors: 佳曲; 彰一清水
Original assignee: 三菱電機株式会社
Priority date: 2021-02-05
Filing date: 2021-02-05
Publication date: 2022-08-11
Also published as: JP7511690B2; JPWO2022168274A1; US20240119723A1; DE112021006984T5; CN116802651A

Abstract

情報処理装置（１００）は、それぞれ異なる方法で物体検出を行う学習済モデル（２００ａ，２００ｂ）と、物体を含む複数の画像である複数のラベルなし学習データとを取得する取得部（１２０）と、複数のラベルなし学習データのそれぞれに対して、学習済モデル（２００ａ，２００ｂ）を用いて、物体検出を行う物体検出部（１４０）と、複数の物体検出結果に基づいて、複数のラベルなし学習データの価値を示す複数の情報量スコアを算出する算出部（１５０）と、複数の情報量スコアに基づいて、複数のラベルなし学習データの中から、予め設定された数のラベルなし学習データを選択し、選択されたラベルなし学習データを出力する選択出力部（１６０）と、を有する。

Description

情報処理装置、選択出力方法、及び選択出力プログラム

　本開示は、情報処理装置、選択出力方法、及び選択出力プログラムに関する。

　一般的に学習済モデルを用いた装置で良好な性能を実現させるために、装置は、大量の教師データ（例えば、学習データセットとも言う。）を用いて深層学習を行う。例えば、入力された画像内の物体を検出する学習済モデルを生成する場合、教師データには、画像内における検出対象の物体の領域と、当該物体の種別を示すラベルとが含まれる。当該教師データは、ラベリング作業者によって作成される。ラベリング作業者による作成作業は、ラベリングと呼ばれる。ラベリング作業者がラベリングを行うことは、ラベリング作業者の負担を増大させる。そこで、ラベリング作業者の負担を軽減させるために、能動学習が考案されている。能動学習では、ラベリングされた、学習効果の高い画像が、教師データとして、用いられる。

　ここで、能動学習に用いられるデータを選択する技術が提案されている（特許文献１を参照）。能動学習装置は、ラベルあり学習データによって学習した識別器を用いて、ラベルなし学習データに対する識別スコアを算出する。能動学習装置は、ラベルなし学習データをクラスタリングすることで複数のクラスタを生成する。能動学習装置は、複数のクラスタと識別スコアとに基づいて、ラベルなし学習データの中から能動学習に用いる学習データを選択する。

特開２０１７－１６７８３４号公報

　上記の技術では、ある方法でラベルあり学習データを用いて学習することで得られた識別器とラベルなし学習データとを用いて、学習データが選択される。ここで、以下、識別器は、学習済モデルと呼ぶ。選択された学習データは、当該方法を用いて学習が行われる場合、学習効果の高い学習データである。一方、異なる方法を用いる学習済モデルを生成する場合、選択された学習データは、必ずしも学習効果の高い学習データと言えない。そのため、上記の技術を用いる方法は、必ずしも好ましいと言えない。よって、学習効果の高い学習データをどのように選択するのかが問題である。

　本開示の目的は、学習効果の高い学習データを選択することである。

　本開示の一態様に係る情報処理装置が提供される。情報処理装置は、それぞれ異なる方法で物体検出を行う複数の学習済モデルと、物体を含む複数の画像である複数のラベルなし学習データとを取得する取得部と、前記複数のラベルなし学習データのそれぞれに対して、前記複数の学習済モデルを用いて、物体検出を行う物体検出部と、複数の物体検出結果に基づいて、前記複数のラベルなし学習データの価値を示す複数の情報量スコアを算出する算出部と、前記複数の情報量スコアに基づいて、前記複数のラベルなし学習データの中から、予め設定された数のラベルなし学習データを選択し、選択されたラベルなし学習データを出力する選択出力部と、を有する。

　本開示によれば、学習効果の高い学習データを選択することができる。

実施の形態１の情報処理装置の機能を示すブロック図である。実施の形態１の情報処理装置が有するハードウェアを示す図である。（Ａ），（Ｂ）は、実施の形態１のＩｏＵを説明するための図である。実施の形態１のＰｒｅｃｉｓｉｏｎ、Ｒｅｃａｌｌ、及びＡＰの関係を示す図である。（Ａ），（Ｂ）は、選択された画像の出力の例を示す図（その１）である。（Ａ），（Ｂ）は、選択された画像の出力の例を示す図（その２）である。実施の形態２の情報処理装置の機能を示すブロック図である。実施の形態２の情報処理装置が実行する処理の例を示すフローチャートである。

　以下、図面を参照しながら実施の形態を説明する。以下の実施の形態は、例にすぎず、本開示の範囲内で種々の変更が可能である。

実施の形態１．
　図１は、実施の形態１の情報処理装置の機能を示すブロック図である。情報処理装置１００は、選択出力方法を実行する装置である。情報処理装置１００は、第１の記憶部１１１、第２の記憶部１１２、取得部１２０、学習部１３０ａ，１３０ｂ、物体検出部１４０、算出部１５０、及び選択出力部１６０を有する。

　ここで、情報処理装置１００が有するハードウェアを説明する。
　図２は、実施の形態１の情報処理装置が有するハードウェアを示す図である。情報処理装置１００は、プロセッサ１０１、揮発性記憶装置１０２、及び不揮発性記憶装置１０３を有する。

　プロセッサ１０１は、情報処理装置１００全体を制御する。例えば、プロセッサ１０１は、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）などである。プロセッサ１０１は、マルチプロセッサでもよい。また、情報処理装置１００は、処理回路を有してもよい。処理回路は、単一回路又は複合回路でもよい。

　揮発性記憶装置１０２は、情報処理装置１００の主記憶装置である。例えば、揮発性記憶装置１０２は、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）である。不揮発性記憶装置１０３は、情報処理装置１００の補助記憶装置である。例えば、不揮発性記憶装置１０３は、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）、又はＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）である。
　図１に戻って、情報処理装置１００の機能を説明する。

　第１の記憶部１１１及び第２の記憶部１１２は、揮発性記憶装置１０２又は不揮発性記憶装置１０３に確保した記憶領域として実現してもよい。
　取得部１２０、学習部１３０ａ，１３０ｂ、物体検出部１４０、算出部１５０、及び選択出力部１６０の一部又は全部は、処理回路によって実現してもよい。また、取得部１２０、学習部１３０ａ，１３０ｂ、物体検出部１４０、算出部１５０、及び選択出力部１６０の一部又は全部は、プロセッサ１０１が実行するプログラムのモジュールとして実現してもよい。例えば、プロセッサ１０１が実行するプログラムは、選択出力プログラムとも言う。例えば、選択出力プログラムは、記録媒体に記録されている。

　情報処理装置１００は、学習済モデル２００ａ，２００ｂを生成する。学習済モデル２００ａ，２００ｂが生成されるまでを説明する。
　まず、第１の記憶部１１１を説明する。第１の記憶部１１１は、ラベルあり学習データを記憶してもよい。ラベルあり学習データは、画像と、当該画像内における１以上の検出対象の物体の領域と、当該物体の種別を示すラベルとを含む。なお、当該物体の領域と当該ラベルと含む情報は、ラベル情報とも言う。また、例えば、当該画像が道路を含む画像である場合、当該種別は、四輪車、二輪車、トラックなどである。

　取得部１２０は、ラベルあり学習データを取得する。例えば、取得部１２０は、ラベルあり学習データを第１の記憶部１１１から取得する。また、例えば、取得部１２０は、ラベルあり学習データを外部装置（例えば、クラウドサーバ）から取得する。

　学習部１３０ａ，１３０ｂは、ラベルあり学習データを用いて、それぞれ異なる方法で物体の検出学習を行うことで、学習済モデル２００ａ，２００ｂを生成する。例えば、当該方法は、Ｆａｓｔｅｒ　Ｒ－ＣＮＮ（Ｒｅｇｉｏｎｓ　ｗｉｔｈ　Ｃｏｎｖｏｌｕｔｉｏｎａｌ　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋｓ）、ＹＯＬＯ（Ｙｏｕ　Ｌｏｏｋ　Ｏｎｌｙ　Ｏｎｃｅ）、ＳＳＤ（Ｓｉｎｇｌｅ　Ｓｈｏｔ　ＭｕｌｔｉＢｏｘ　Ｄｅｔｅｃｔｏｒ）などである。なお、当該方法は、アルゴリズムと呼んでもよい。

　このように、学習部１３０ａ，１３０ｂにより、それぞれ異なる方法で物体検出を行う学習済モデル２００ａ，２００ｂが、生成される。例えば、学習済モデル２００ａは、Ｆａｓｔｅｒ　Ｒ－ＣＮＮを用いて、物体検出を行う学習済モデルである。また、例えば、学習済モデル２００ｂは、ＹＯＬＯを用いて、物体検出を行う学習済モデルである。

　ここで、図１は、２つの学習部を示している。学習部の数は、２つに限らない。そして、学習部と同じ数の学習済モデルが、生成される。よって、学習済モデルの数は、２つに限らない。また、学習済モデルは、検出器又は検出器情報と呼んでもよい。

　また、生成された学習済モデル２００ａ，２００ｂは、揮発性記憶装置１０２又は不揮発性記憶装置１０３に格納されてもよいし、外部装置に格納されてもよい。

　次に、学習済モデル２００ａ，２００ｂが生成された後に情報処理装置１００が実行する処理を説明する。
　まず、第２の記憶部１１２を説明する。第２の記憶部１１２は、複数のラベルなし学習データを記憶してもよい。複数のラベルなし学習データのそれぞれには、ラベル情報が含まれていない。複数のラベルなし学習データは、複数の画像である。複数の画像のそれぞれは、物体を含む。例えば、物体は、人間、動物などである。

　取得部１２０は、複数のラベルなし学習データを取得する。例えば、取得部１２０は、複数のラベルなし学習データを第２の記憶部１１２から取得する。また、例えば、取得部１２０は、複数のラベルなし学習データを外部装置から取得する。
　取得部１２０は、学習済モデル２００ａ，２００ｂを取得する。例えば、取得部１２０は、学習済モデル２００ａ，２００ｂを揮発性記憶装置１０２又は不揮発性記憶装置１０３から取得する。また、例えば、取得部１２０は、学習済モデル２００ａ，２００ｂを外部装置から取得する。

　物体検出部１４０は、複数のラベルなし学習データのそれぞれに対して、学習済モデル２００ａ，２００ｂを用いて、物体検出を行う。例えば、ラベルなし学習データの数が２つである場合、物体検出部１４０は、複数のラベルなし学習データのうちの第１のラベルなし学習データに対して、学習済モデル２００ａ，２００ｂを用いて、物体検出を行う。言い換えれば、物体検出部１４０は、当該第１のラベルなし学習データと学習済モデル２００ａ，２００ｂとを用いて、物体検出を行う。また、例えば、物体検出部１４０は、複数のラベルなし学習データのうちの第２のラベルなし学習データに対して、学習済モデル２００ａ，２００ｂを用いて、物体検出を行う。
　このように、物体検出部１４０は、複数のラベルなし学習データのそれぞれに対して、学習済モデル２００ａ，２００ｂを用いて、物体検出を行う。

　まず、１つのラベルなし学習データと学習済モデル２００ａ，２００ｂとを用いて、物体検出が行われる場合を説明する。また、当該１つのラベルなし学習データに対応する情報量スコアの算出方法も説明する。
　物体検出部１４０は、当該１つのラベルなし学習データと学習済モデル２００ａ，２００ｂとを用いて、物体検出を行う。例えば、物体検出部１４０は、当該ラベルなし学習データと学習済モデル２００ａとを用いて、物体検出を行う。また、例えば、物体検出部１４０は、当該ラベルなし学習データと学習済モデル２００ｂとを用いて、物体検出を行う。これにより、それぞれ異なる方法で、物体検出が行われる。学習済モデルごとに、物体検出結果が、出力される。物体検出結果は、Ｄ_ｉと表記する。なお、ｉは、１～Ｎの整数である。また、物体検出結果Ｄ_ｉは、推論ラベルＲ_ｉとも言う。推論ラベルＲ_ｉは、“（ｃ，ｘ，ｙ，ｗ，ｈ）”で表現される。ｃは、物体の種別を示す。ｘとｙは、物体の画像領域中心の座標（ｘ，ｙ）を示す。ｗは、物体の幅を示す。ｈは、物体の高さを示す。

　算出部１５０は、物体検出結果Ｄ_ｉを用いて、情報量スコアを算出する。情報量スコアは、ラベルなし学習データの価値を示す。そのため、情報量スコアは、値が大きいほど、学習データとして価値が高いことを意味する。言い換えれば、情報量スコアは、類似性が高い画像領域における種別の結果に大きな違いがある。または、情報量スコアは、同じ種別の結果で画像領域に大きな違いがある。

　情報量スコアの算出方法を説明する。情報量スコアの算出では、それぞれの物体の画像領域の類似性と、それぞれの物体の種別結果の差異とを考慮した検出精度指標であるｍＡＰ（ｍｅａｎ　Ａｖｅｒａｇｅ　Ｐｒｅｃｉｓｉｏｎ）＠０．５が、用いられる。なお、“０．５”は、後述するＩｏＵ（Ｉｎｔｅｒｓｅｃｔｉｏｎ　ｏｖｅｒ　Ｕｎｉｏｎ）の閾値を示している。

　学習済モデルが２つである場合、情報量スコアは、式（１）を用いて算出される。ここで、学習済モデル２００ａから出力される物体検出結果は、Ｄ_１とする。学習済モデル２００ｂから出力される物体検出結果は、Ｄ_２とする。

　また、ｍＡＰ＠０．５は、物体検出における評価手法の１つであり、評価する上で用いられる概念として、ＩｏＵが知られている。ＩｏＵは、ラベルあり学習データを用いて物体検出が行われた場合、式（２）を用いて表される。Ｒ_ｇｔは、真値の領域を示す。Ｒ_ｄは、検出領域を示す。Ａは、エリアを示している。

　真値の領域Ｒ_ｇｔと検出領域Ｒ_ｄとの具体例を示す。
　図３（Ａ），（Ｂ）は、実施の形態１のＩｏＵを説明するための図である。図３（Ａ）は、真値の領域Ｒ_ｇｔと検出領域Ｒ_ｄとの具体例を示している。また、図３（Ａ）は、真値の領域Ｒ_ｇｔと検出領域Ｒ_ｄとがどれだけ重なっているかを示している。

　ここで、ラベルなし学習データには、ラベルがない。そのため、真値がない。そのため、ＩｏＵは、式（２）をそのまま用いて表すことができない。そこで、ＩｏＵは、次のように、表される。１つの物体検出結果が示す領域を真値の領域とする。そして、もう一つの物体検出結果が示す領域を検出領域とする。例えば、図３（Ｂ）では、物体検出結果Ｄ_１が示す検出領域Ｒ_ｇｔ１が、真値の領域とされる。物体検出結果Ｄ_２が示す検出領域Ｒ_ｄ１が、検出領域とされる。図３（Ｂ）の例を用いた場合、ＩｏＵは、式（３）を用いて表される。

　ＩｏＵを用いて、ＴＰ（Ｔｒｕｅ　Ｐｏｓｉｔｉｖｅ）、ＦＰ（Ｆａｌｓｅ　Ｐｏｓｉｔｉｖｅ）、及びＦＮ（Ｆａｌｓｅ　Ｎｅｇａｔｉｖｅ）が算出される。

　なお、検出領域Ｒ_ｄ１に対する検出領域Ｒ_ｇｔ１のＩｏＵが、閾値以上である場合、ＴＰは、ラベルなし学習データの画像内に存在する物体を学習済モデルが検出したことを示している。言い換えれば、検出領域Ｒ_ｄ１と検出領域Ｒ_ｇｔ１とがほぼ同じ位置に存在するため、学習済モデルが、真値を検出したことを示す。

　検出領域Ｒ_ｄ１に対する検出領域Ｒ_ｇｔ１のＩｏＵが、閾値未満である場合、ＦＰは、ラベルなし学習データの画像内に存在しない物体を学習済モデルが検出したことを示している。言い換えれば、検出領域Ｒ_ｇｔ１が外れた位置に存在するため、学習済モデルが、誤検出したことを示す。

　検出領域Ｒ_ｇｔ１に対する検出領域Ｒ_ｄ１のＩｏＵが、閾値未満である場合、ＦＮは、ラベルなし学習データの画像内に存在する物体を学習済モデルが検出しなかったことを示している。言い換えれば、検出領域Ｒ_ｇｔ１が外れた位置に存在するため、学習済モデルが、検出しなかったことを示す。

　また、ＴＰとＦＰを用いて、Ｐｒｅｃｉｓｉｏｎが表される。具体的には、Ｐｒｅｃｉｓｉｏｎは、式（４）を用いて、表される。なお、Ｐｒｅｃｉｓｉｏｎは、正と予測したデータのうち、実際に正であるものの割合を示す。なお、Ｐｒｅｃｉｓｉｏｎは、適合率とも言う。

　ＴＰとＦＰを用いて、Ｒｅｃａｌｌが表される。具体的には、Ｒｅｃａｌｌは、式（５）を用いて、表される。なお、Ｒｅｃａｌｌは、実際に正であるもののうち、正であると予測されたものの割合を示す。なお、Ｒｅｃａｌｌは、再現率とも言う。

　Ｐｒｅｃｉｓｉｏｎ、Ｒｅｃａｌｌ、及びＡＰの関係を例示する。
　図４は、実施の形態１のＰｒｅｃｉｓｉｏｎ、Ｒｅｃａｌｌ、及びＡＰの関係を示す図である。縦軸は、Ｐｒｅｃｉｓｉｏｎを示している。横軸は、Ｒｅｃａｌｌを示している。ＰｒｅｃｉｓｉｏｎとＲｅｃａｌｌとを用いて、ＡＰ（Ａｖｅｒａｇｅ　Ｐｒｅｃｉｓｉｏｎ）が算出される。すなわち、図４の“ＡＰ”の面積が、ＡＰとして算出される。

　例えば、ラベルなし学習データの画像内に複数の物体が存在する場合、算出部１５０は、複数の物体のそれぞれのＴＰ、ＦＰ、及びＦＮを算出する。算出部１５０は、式（４）及び式（５）を用いて、複数の物体のそれぞれのＰｒｅｃｉｓｉｏｎとＲｅｃａｌｌとを算出する。算出部１５０は、複数の物体のそれぞれのＰｒｅｃｉｓｉｏｎとＲｅｃａｌｌとに基づいて、物体（すなわち、クラス）ごとのＡＰを算出する。例えば、当該複数の物体が、猫と犬である場合、猫のＡＰ“０．４”と、犬のＡＰ“０．６”とが、算出される。算出部１５０は、物体ごとのＡＰの平均を、ｍＡＰとして算出する。例えば、猫のＡＰが“０．４”であり、犬のＡＰが“０．６”である場合、算出部１５０は、ｍＡＰ“０．５”を算出する。なお、ラベルなし学習データの画像内に１つの物体のみが存在する場合、１つのＡＰが算出される。そして、１つのＡＰが、ｍＡＰとなる。

　このように、ｍＡＰが、算出される。算出部１５０は、ｍＡＰと式（１）とを用いて、情報量スコアを算出する。すなわち、算出部１５０は、“１－ｍＡＰ”により、情報量スコアを算出する。これにより、情報量スコアが、算出される。

　学習済モデルがＮ個（すなわち、３つ以上）である場合、情報量スコアは、式（６）を用いて算出される。すなわち、算出部１５０は、Ｎ個の学習済モデルを用いて、２つの学習済モデルの組合せを複数個作成し、組合せごとに式（１）を用いて値を算出し、算出された値の合計値をＮで除算することで、情報量スコアを算出する。

　このように、算出部１５０は、当該１つのラベルなし学習データに対応する情報量スコアを算出する。そして、情報処理装置１００（すなわち、物体検出部１４０と算出部１５０）は、複数のラベルなし学習データのそれぞれに対しても同様の処理を行う。これにより、情報処理装置１００は、複数のラベルなし学習データのそれぞれの情報量スコアを得られる。言い換えれば、情報処理装置１００は、複数のラベルなし学習データに対応する複数の情報量スコアを得られる。このように、情報処理装置１００は、複数の物体検出結果に基づいて、複数の情報量スコアを算出する。また、詳細には、情報処理装置１００は、ｍＡＰと複数の物体検出結果とを用いて、複数の情報量スコアを算出する。

　選択出力部１６０は、複数の情報量スコアに基づいて、複数のラベルなし学習データの中から、予め設定された数のラベルなし学習データを選択する。言い換えれば、選択出力部１６０は、複数の情報量スコアに基づいて、複数の情報量スコアに対応する複数のラベルなし学習データの中から、学習効果の高いラベルなし学習データを選択する。この文章は、次のように表現してもよい。選択出力部１６０は、複数のラベルなし学習データの中から、学習への貢献が予測されるラベルなし学習データを選択する。

　当該選択の方法の一例を説明する。まず、情報量スコアは、０から１の範囲の値である。情報量スコアが“０”である場合、学習済モデル２００ａ，２００ｂによる検出結果は、ほぼ一致する。そのため、“０”の情報量スコアに対応するラベルなし学習データは、学習データとして充当する必要性が低いので、利用価値が少ないと考えられる。一方、情報量スコアが“１”である場合、学習済モデル２００ａ，２００ｂによる検出結果は、大きく異なる。しかし、“１”の情報量スコアに対応するラベルなし学習データは、非常に検出しにくい特殊例とも言える。そのため、学習データが少ない段階で多くの特殊例を学習データに加えることは、検出性能の向上に寄与しないと考えられる。よって、選択出力部１６０は、複数の情報量スコアに対応する複数のラベルなし学習データの中から、“０”と“１”の情報量スコアに対応するラベルなし学習データを除外する。除外した後、選択出力部１６０は、複数のラベルなし学習データの中から、上位ｎ（ｎは、正の整数）個のラベルなし学習データを学習効果の高いラベルなし学習データとして、選択する。

　選択出力部１６０は、選択されたラベルなし学習データを出力する。また、選択出力部１６０は、選択されたラベルなし学習データ（以下、選択された画像）に対して、物体検出を行った結果である物体検出結果を、推論ラベルとして、出力してもよい。ここで、選択された画像の出力の一例を説明する。

　図５（Ａ），（Ｂ）は、選択された画像の出力の例を示す図（その１）である。図５（Ａ）は、選択された画像が揮発性記憶装置１０２又は不揮発性記憶装置１０３に出力される場合を示している。例えば、ラベリング作業者は、情報処理装置１００を用いて、選択された画像に対してラベリングを行う。

　図５（Ｂ）は、選択された画像と推論ラベルとが揮発性記憶装置１０２又は不揮発性記憶装置１０３に出力される場合を示している。例えば、ラベリング作業者は、情報処理装置１００と推論ラベルとを用いて、選択された画像に対してラベリングを行う。また、推論ラベルが出力されることで、ラベリング作業者のラベリング作業が軽減される。

　図６（Ａ），（Ｂ）は、選択された画像の出力の例を示す図（その２）である。図６（Ａ）は、選択された画像がラベリングツールに出力される場合を示している。このように、選択された画像がラベリングツールに出力されることで、ラベリング作業者のラベリング作業が軽減される。

　図６（Ｂ）は、選択された画像と推論ラベルとがラベリングツールに出力される場合を示している。ラベリング作業者は、ラベリングツールを用いて、推論ラベルを修正しながら、選択された画像にラベリングを行う。

　ここで、選択出力部１６０によって選択された画像は、それぞれ異なる方法で物体を検出する学習済モデルを用いて、選択された画像である。そのため、選択された画像は、ある方法で学習する際に用いられる学習データとして適しているだけでなく、他の方法で学習する際に用いられる学習データとしても適している。よって、選択された画像は、学習効果の高い学習データと言える。実施の形態１によれば、情報処理装置１００は、学習効果の高い学習データを選択することができる。

　また、学習効果の高い学習データは、情報処理装置１００によって、自動的に選択される。よって、情報処理装置１００は、学習効果の高い学習データを効率的に選択することができる。

実施の形態２．
　次に、実施の形態２を説明する。実施の形態２では、実施の形態１と相違する事項を主に説明する。そして、実施の形態２では、実施の形態１と共通する事項の説明を省略する。

　図７は、実施の形態２の情報処理装置の機能を示すブロック図である。図１に示される構成と同じ図７の構成は、図１に示される符号と同じ符号を付している。
　情報処理装置１００は、学習済モデル２００ａ，２００ｂを再学習する。再学習の詳細は、後で説明する。

　次に、情報処理装置１００が実行する処理を、フローチャートを用いて説明する。
　図８は、実施の形態２の情報処理装置が実行する処理の例を示すフローチャートである。
　（ステップＳ１１）取得部１２０は、ラベルあり学習データを取得する。なお、当該ラベルあり学習データのデータ量は、少量でもよい。
　学習部１３０ａ，１３０ｂは、ラベルあり学習データを用いて、それぞれ異なる方法で物体の検出学習を行うことで、学習済モデル２００ａ，２００ｂを生成する。

　（ステップＳ１２）取得部１２０は、複数のラベルなし学習データを取得する。
　物体検出部１４０は、複数のラベルなし学習データと学習済モデル２００ａ，２００ｂとを用いて、物体検出を行う。
　（ステップＳ１３）算出部１５０は、複数の物体検出結果に基づいて、複数のラベルなし学習データに対応する複数の情報量スコアを算出する。
　（ステップＳ１４）選択出力部１６０は、複数の情報量スコアに基づいて、複数のラベルなし学習データの中から、学習効果の高いラベルなし学習データを選択する。
　（ステップＳ１５）選択出力部１６０は、選択されたラベルなし学習データ（すなわち、選択された画像）を出力する。例えば、選択出力部１６０は、図５又は図６で例示したように、選択された画像を出力する。

　ここで、ラベリング作業者は、選択された画像を用いて、ラベリングする。これにより、ラベルあり学習データが生成される。ラベルあり学習データは、選択された画像と、当該画像内における１以上の検出対象の物体の領域と、当該物体の種別を示すラベルとを含む。ラベルあり学習データは、第１の記憶部１１１に格納されてもよい。なお、ラベリング作業は、外部装置で行われてもよい。

　（ステップＳ１６）取得部１２０は、ラベルあり学習データを取得する。例えば、取得部１２０は、ラベルあり学習データを第１の記憶部１１１から取得する。また、例えば、取得部１２０は、ラベルあり学習データを外部装置から取得する。
　（ステップＳ１７）学習部１３０ａ，１３０ｂは、ラベルあり学習データを用いて、学習済モデル２００ａ，２００ｂを再学習する。

　（ステップＳ１８）情報処理装置１００は、学習の終了条件を満たすか否かを判定する。なお、例えば、当該終了条件は、不揮発性記憶装置１０３に格納されている。当該終了条件を満たす場合、処理は、終了する。当該終了条件を満たさない場合、処理は、ステップＳ１２に進む。

　実施の形態２によれば、情報処理装置１００は、ラベルあり学習データの追加と、再学習とを繰り返すことで、学習済モデルの物体検出精度を向上させることができる。

　以上に説明した各実施の形態における特徴は、互いに適宜組み合わせることができる。

　１００　情報処理装置、　１０１　プロセッサ、　１０２　揮発性記憶装置、　１０３　不揮発性記憶装置、　１１１　第１の記憶部、　１１２　第２の記憶部、　１２０　取得部、　１３０ａ，１３０ｂ　学習部、　１４０　物体検出部、　１５０　算出部、　１６０　選択出力部、　２００ａ，２００ｂ　学習済モデル。

Claims

　それぞれ異なる方法で物体検出を行う複数の学習済モデルと、物体を含む複数の画像である複数のラベルなし学習データとを取得する取得部と、
　前記複数のラベルなし学習データのそれぞれに対して、前記複数の学習済モデルを用いて、物体検出を行う物体検出部と、
　複数の物体検出結果に基づいて、前記複数のラベルなし学習データの価値を示す複数の情報量スコアを算出する算出部と、
　前記複数の情報量スコアに基づいて、前記複数のラベルなし学習データの中から、予め設定された数のラベルなし学習データを選択し、選択されたラベルなし学習データを出力する選択出力部と、
　を有する情報処理装置。
　前記選択出力部は、選択されたラベルなし学習データに対して、物体検出を行った結果である物体検出結果を、推論ラベルとして、出力する、
　請求項１に記載の情報処理装置。
　前記算出部は、ｍｅａｎ　Ａｖｅｒａｇｅ　Ｐｒｅｃｉｓｉｏｎと前記複数の物体検出結果とを用いて、前記複数の情報量スコアを算出する、
　請求項１又は２に記載の情報処理装置。
　複数の学習部をさらに有し、
　前記取得部は、選択されたラベルなし学習データを含むラベルあり学習データを取得し、
　前記複数の学習部は、前記ラベルあり学習データを用いて、前記複数の学習済モデルを再学習する、
　請求項１から３のいずれか１項に記載の情報処理装置。
　情報処理装置が、
　それぞれ異なる方法で物体検出を行う複数の学習済モデルと、物体を含む複数の画像である複数のラベルなし学習データとを取得し、
　前記複数のラベルなし学習データのそれぞれに対して、前記複数の学習済モデルを用いて、物体検出を行い、
　複数の物体検出結果に基づいて、前記複数のラベルなし学習データの価値を示す複数の情報量スコアを算出し、
　前記複数の情報量スコアに基づいて、前記複数のラベルなし学習データの中から、予め設定された数のラベルなし学習データを選択し、
　選択されたラベルなし学習データを出力する、
　選択出力方法。
　情報処理装置に、
　それぞれ異なる方法で物体検出を行う複数の学習済モデルと、物体を含む複数の画像である複数のラベルなし学習データとを取得し、
　前記複数のラベルなし学習データのそれぞれに対して、前記複数の学習済モデルを用いて、物体検出を行い、
　複数の物体検出結果に基づいて、前記複数のラベルなし学習データの価値を示す複数の情報量スコアを算出し、
　前記複数の情報量スコアに基づいて、前記複数のラベルなし学習データの中から、予め設定された数のラベルなし学習データを選択し、
　選択されたラベルなし学習データを出力する、
　処理を実行させる選択出力プログラム。