JP2005071125A - 被写体検出装置、被写体検出方法、被写体データ選定プログラムおよび被写体位置検出プログラム - Google Patents
被写体検出装置、被写体検出方法、被写体データ選定プログラムおよび被写体位置検出プログラム Download PDFInfo
- Publication number
- JP2005071125A JP2005071125A JP2003300912A JP2003300912A JP2005071125A JP 2005071125 A JP2005071125 A JP 2005071125A JP 2003300912 A JP2003300912 A JP 2003300912A JP 2003300912 A JP2003300912 A JP 2003300912A JP 2005071125 A JP2005071125 A JP 2005071125A
- Authority
- JP
- Japan
- Prior art keywords
- subject
- data
- analysis
- reliability value
- captured image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
【課題】 1つの撮像画像について複数の被写体検出手法により解析を行い、その解析結果の信頼度に基づいて解析結果を選定することで、高精度で、かつ高速に被写体の検出を行うことを可能にした被写体検出装置を提供する。
【解決手段】 被写体検出装置1は、撮像画像内における被写体の位置を解析し、被写体位置情報とする被写体解析手段51,61,71と、この解析結果に対する信頼度を表す信頼度値を算出する信頼度値算出手段52,62,72と、信頼度値と、被写体位置情報とを含む被写体データを生成する被写体データ生成手段53,63,73とを有する、複数の被写体位置検出手段50,60,70と、信頼度値に基づいて被写体データを選定するデータ選定手段81とを備えることを特徴とする。
【選択図】 図1
【解決手段】 被写体検出装置1は、撮像画像内における被写体の位置を解析し、被写体位置情報とする被写体解析手段51,61,71と、この解析結果に対する信頼度を表す信頼度値を算出する信頼度値算出手段52,62,72と、信頼度値と、被写体位置情報とを含む被写体データを生成する被写体データ生成手段53,63,73とを有する、複数の被写体位置検出手段50,60,70と、信頼度値に基づいて被写体データを選定するデータ選定手段81とを備えることを特徴とする。
【選択図】 図1
Description
本発明は、撮像画像内の被写体の位置を検出する技術に関し、特に複数の被写体検出手法により被写体の位置の解析を行い、その解析結果から最適な結果を選定する被写体検出装置、被写体検出方法、被写体データ選定プログラムおよび被写体位置検出プログラムに関する。
従来、画像から人物などの被写体を検出する方法は、数多く提案されている。例えば、画像から人物の顔の特徴を検出して、人物の位置を特定する方法が提案されている(非特許文献1参照)。この方法では、入力した画像から複数の所定サイズの画像をサンプリングし、予め記憶された人物の顔の画像データを参照して、この所定サイズの画像が人物の顔の画像であるかを判別して、入力画像内における人物の顔を検出するものである。
さらに、背景画像と撮像画像の差分を計算し、差分画像を解析することで、人物の位置を検出する方法が提案されている(非特許文献2参照)。この方法は、予め背景画像を取得し、撮像画像と背景画像との差分画像の色情報から人物を検出して、画像内における位置を解析するものである。
また一般的に、移動する被写体を連続して撮像した画像を解析する場合に、撮像された全ての画像について画像全体を解析して被写体を検出する方法と、直前に撮像された画像の被写体の検出部付近に解析範囲を限定して、被写体の検出を行う方法とが行われている。
H. A. Rowley, et al, "Neural network-based face detection", IEEE Trans. on Pattern Analysis and Machine Intelligence, Vol. 20, No. 1, pp. 23-38, 1998 C. Wren, et al, "Pfinder: Real-time tracking of the human body" International Conference on Automatic Face and Gesture Recognition, pp. 51-60, 1996
H. A. Rowley, et al, "Neural network-based face detection", IEEE Trans. on Pattern Analysis and Machine Intelligence, Vol. 20, No. 1, pp. 23-38, 1998 C. Wren, et al, "Pfinder: Real-time tracking of the human body" International Conference on Automatic Face and Gesture Recognition, pp. 51-60, 1996
しかし、撮像画像から被写体を検出する際に、各々の被写体検出手法は撮像条件や被写体の状態などによって検出精度が異なり、1種類の被写体検出手法のみで検出すると、特定の条件において被写体の検出精度が著しく低下することがある。例えば、非特許文献1に記載の被写体検出手法は、撮像画像内での被写体の大きさに対してサンプリングする画像のサイズが適切でないと、人物の検出精度が低下するという問題がある。また、撮像時の光源などの原因により顔の特徴があいまいに撮像された画像についても、検出精度が低下することがある。
また、非特許文献2に記載の方法は、例えば、撮像するカメラの位置や角度が変化した場合には、予め撮像した背景画像と実際の背景とが異なるため、検出精度が低下するという問題がある。さらに、複数の人物が隣接して存在する場合には、人物を個々に検出しにくいという問題がある。
一方、移動する被写体を連続して撮像した画像を解析する場合に、全ての撮像画像について画像全体を解析する方法では、処理データ量が多いため時間がかかり、高速に処理することができないという問題がある。また、直前に撮像された画像の被写体の検出部付近に解析範囲を限定して検出する方法では、一度誤った検出をすると、それ以降に撮像された画像では不適切な範囲について解析を行うため、被写体の検出が不可能になるという問題がある。
本発明は、前記従来技術の課題を解決するために成されたもので、1つの撮像画像について複数の被写体検出手法による解析を同時に行い、1種類の被写体検出手法では特定の条件において検出精度が低下するところを、他の被写体検出手法による解析結果で補うことで、高精度で、かつ高速に被写体の検出を行うことを可能にした被写体検出装置、被写体検出方法、被写体データ選定プログラムおよび被写体位置検出プログラムを提供することを目的とする。
前記課題を解決するため、請求項1に記載の被写体検出装置は、撮像画像から被写体を検出する被写体検出装置であって、被写体解析手段と、信頼度値算出手段と、被写体データ生成手段とを有する被写体位置検出手段を複数備えるとともに、データ選定手段を備える構成とした。
かかる構成によれば、被写体検出装置は、複数の被写体位置検出手段で、各々の被写体解析手段によって、撮像画像内における被写体の位置を解析し、解析結果を被写体位置情報とする。そして、信頼度値算出手段によって、この被写体解析手段で解析した解析結果に対する信頼度を表す信頼度値を算出する。また、被写体データ生成手段によって、この信頼度値で算出した信頼度値、および被写体解析手段の解析結果である被写体位置情報を含む被写体データを生成する。このように、複数の被写体位置検出手段で被写体解析を行うため、ある被写体位置検出手段で検出を失敗しても、他の被写体位置検出手段で検出した被写体位置で補うことが可能になる。そして、被写体検出装置は、データ選定手段によって、複数の被写体位置検出手段で生成された被写体データの中から信頼度値が最も高い被写体データを選定する。このように、最も信頼度値が高い被写体データを選定するため、被写体検出装置は、精度良く被写体を検出することが可能になる。
なお、被写体解析手段における被写体を解析する方法には、例えば、入力した撮像画像をウェーブレット変換し、この変換した画像を区分し、予め記憶された被写体のサンプルの画像に基づいて、各区分の画像が被写体の画像である確率と、被写体の画像でない確率とを求めることで、被写体の画像である部分を検出する顔検出手法や、被写体の画像の色ヒストグラムを予め記憶し、その色ヒストグラムと近い色ヒストグラムを有する画像の領域を被写体の画像として検出する色領域追跡手法や、予め背景画像を記憶しておき、解析する画像と背景画像との差分画像を被写体の画像として検出する背景差分法などの、様々な被写体検出手法を用いることができる。
また、信頼度値は、被写体として検出した画像が被写体の画像であるかの信頼度を表すもので、被写体解析手段によって被写体の検出を行う際に、解析対象が被写体であるかの判別を行う基準としたものを用いることができる。この信頼度値の算出方法としては、例えば、予め記憶された被写体の画像の特徴と、被写体解析手段によって検出した領域の画像の特徴とを比較して、検出した領域の画像が被写体の画像である確率を求め、この確率から信頼度値を算出する方法や、予め記憶された被写体の画像の特徴と、被写体解析手段によって検出した領域の画像の特徴との差を算出し、その差の大きさから信頼度値を算出する方法などがある。
また、ここで、被写体位置情報は、被写体解析手段により解析された解析結果であり、撮像画像内における被写体の位置を表すものである。被写体位置情報は、例えば、撮像画像フレーム内における、被写体が検出された領域の中心座標などで表すことができる。
また、請求項2に記載の被写体検出装置は、請求項1に記載の被写体検出装置において、前記被写体解析手段は、前記データ選定手段により選定された被写体データの被写体位置情報に基づいて、新たに入力された撮像画像の解析範囲を限定して前記被写体の位置を解析する構成とした。
かかる構成によれば、被写体検出装置は、データ選定手段によって選定された被写体データの被写体位置情報に基づいて、新たに入力された撮像画像の解析範囲を設定し、その解析範囲内の画像について解析を行う。このデータ選定手段によって選定された被写体データは、複数の被写体位置検出手段で解析した結果から信頼度に基づいて選定されたものであるので、誤検出が排除された高精度の検出結果となる。そのため、移動する被写体を連続して撮像した場合において、新たに入力される撮像画像の解析範囲を、この被写体データの被写体位置情報に基づいて限定しても、被写体が高い確率で存在する範囲の画像について解析することができる。そして、入力された撮像画像全てを解析するのではなく、解析範囲を限定して解析することができる。
さらに、請求項3に記載の被写体検出装置は、請求項1または請求項2に記載の被写体検出装置において、前記被写体解析手段は、前記撮像画像内における前記被写体の位置における当該被写体の大きさをさらに解析し、前記被写体データ生成手段は、前記被写体解析手段で解析された前記解析結果であり、前記被写体の大きさを表す被写体大きさ情報をさらに含む被写体データを生成する構成とした。
かかる構成によれば、被写体検出装置は被写体解析手段によって、撮像画像内において被写体の少なくとも一部が含まれる領域を解析し、撮像画像内におけるその領域の位置と大きさとを解析する。ここで、被写体の大きさを解析する方法は、被写体の位置を解析する方法と同様の手法を用いて実現することができる。そして被写体データ生成手段によって、この被写体が含まれる領域の大きさを表す被写体大きさ情報をさらに含む被写体データを生成する。ここで、被写体大きさ情報は、例えば、被写体解析手段によって、人物の顔の特徴に基づいて撮像画像内の人物の顔を検出した場合に、人物の顔の特徴を満たす領域を長方形で区画し、その長方形の幅と高さなどで表すことができる。
また、請求項4に記載の被写体検出装置は、請求項1から請求項3のいずれか1項に記載の被写体検出装置であって、前記被写体データ生成手段は、前記被写体解析手段を識別する被写体解析手段IDをさらに含む被写体データを生成し、前記信頼度値の重要度を表す重み係数を、前記被写体解析手段IDに対応させて予め記憶する重み係数記憶手段を備え、前記データ選定手段が、前記被写体解析手段IDに対応する前記重み係数と前記信頼度値とに基づいて、複数の前記被写体データから前記撮像画像内の被写体ごとに1つの被写体データを選定する構成とした。
かかる構成によれば、被写体データ生成手段によって被写体解析手段IDをさらに含む被写体データを生成する。また、被写体検出装置は、信頼度値の重要度を表す重み係数を被写体解析手段IDに対応させて、重み係数記憶手段に予め記憶している。そして、データ選定手段によって、被写体解析手段IDに対応する重み係数を重み係数記憶手段から取得し、この重み係数により重み付けした信頼度値に基づいて、複数の被写体データから撮像画像内の被写体ごとに1つの被写体データを選定し、この被写体位置情報を撮像画像内の被写体の位置の検出結果とする。
ここで、重み係数は、信頼度値の重要度を表すもので、被写体解析手段IDとを対応させて重み係数記憶手段に予め記憶されている。この重み係数は、各々の被写体解析手段によって解析した解析結果の信頼度値を補正するためのものである。そして、それぞれの被写体解析手段で行う被写体検出手法によって信頼度値の算出方法が異なる場合には、同じ信頼度値であっても検出精度は異なることがあるが、適切な重み係数を予め定めておくことによってこれを補正することができる。
さらに、請求項5に記載の被写体検出方法は、撮像画像内における被写体の位置を解析して、この解析結果を含む被写体データを生成する、複数の被写体位置検出装置と、複数の被写体データから撮像画像内の被写体ごとに1つの被写体データを選定するデータ選定装置とを用いて、撮像画像から被写体を検出する被写体検出方法であって、前記複数の被写体位置検出装置において、前記撮像画像内における前記被写体の位置を解析する被写体解析ステップと、この被写体解析ステップで解析された解析結果に対する信頼度を表す信頼度値を算出する信頼度値算出ステップと、この信頼度値算出ステップで算出された信頼度値、および前記解析結果である被写体位置情報を含む被写体データを生成する被写体データ生成ステップとを含み、前記データ選定装置において、前記信頼度値に基づいて、複数の前記被写体データから前記撮像画像内の被写体ごとに1つの被写体データを選定するデータ選定ステップを含むことを特徴とする。
この方法によれば、被写体検出方法は、被写体解析ステップにおいて、撮像画像から被写体の位置を解析し、信頼度値算出ステップにおいて、この解析結果に対する信頼度を表す信頼度値を算出する。続いて、被写体データ生成ステップにおいて、この信頼度値と、被写体解析ステップにおいて解析した解析結果である被写体位置情報とを含む被写体データを生成する。そして、この被写体解析ステップ、信頼度値算出ステップおよび被写体データ生成ステップを、複数の種類の被写体検出手法について行う。そして、データ選定ステップにおいて、信頼度値に基づいて、複数の被写体データから撮像画像内の被写体ごとに1つの被写体データを選定することができる。
また、請求項6に記載の被写体データ選定プログラムは、撮像画像内における被写体の位置を解析して被写体位置情報とし、この解析結果に対する信頼度を表す信頼度値を算出して、前記信頼度値と、前記被写体位置情報とを含む被写体データを生成する、複数の被写体位置検出装置から、複数の前記被写体データを入力し、複数の前記被写体データから1つの被写体データを選定するために、コンピュータを、前記信頼度値に基づいて、複数の前記被写体データから前記撮像画像内の被写体ごとに1つの被写体データを選定するデータ選定手段として機能させることとした。
かかる構成によれば、被写体データ選定プログラムは、データ選定手段によって、被写体データに含まれる信頼度値に基づいて、複数の被写体データから撮像画像内の被写体ごとに1つの被写体データを選定する。
また、請求項7に記載の被写体位置検出プログラムは、撮像画像内における被写体の位置を表す被写体位置情報と、前記被写体位置情報の信頼度を表す信頼度値とを含む、複数の被写体データから撮像画像内の被写体ごとに1つの被写体データを選定するデータ選定装置から、選定された被写体データの前記被写体位置情報を入力し、前記被写体位置情報に基づいて、新たに入力された撮像画像の解析範囲を限定して被写体の位置を解析するために、コンピュータを、前記被写体位置情報に基づいて、新たに入力された撮像画像の解析範囲を限定して被写体の位置を解析する被写体解析手段、この被写体解析手段により解析された解析結果の信頼度値を算出する信頼度値算出手段、前記信頼度値と、前記解析結果である被写体位置情報とを含む被写体データを生成する被写体データ生成手段として機能させることとした。
かかる構成によれば、被写体位置検出プログラムは、被写体解析手段によって、被写体位置情報に基づいて解析範囲を限定し、その解析範囲の撮像画像内の被写体の位置を解析する。そして、信頼度値算出手段によって、被写体解析手段の解析結果に対する信頼度を表す信頼度値を算出する。そして、被写体データ生成手段によって、この信頼度値と、被写体解析手段の解析結果である、撮像画像内の被写体の位置を表す被写体位置情報とを含む被写体データを生成する。
本発明に係る被写体検出装置、被写体検出方法、被写体データ選定プログラムおよび被写体位置検出プログラムでは、以下のような優れた効果を奏する。
請求項1または請求項5に記載の発明によれば、被写体検出装置は入力された撮像画像から複数の被写体検出手法によって被写体の位置を検出し、それぞれの被写体検出手法について被写体位置情報とその信頼度値とを含む被写体データを生成する。そして信頼度値に基づいて被写体データを選定するため、最も信頼度の高い結果を選定することができる。また、例えば、撮像条件などによって1つの被写体検出手法で検出精度が低下した場合においても、他の被写体検出手法によって検出した、信頼度の高い検出結果を選定するため、誤った検出結果を排除することができる。そのため、撮像条件等に影響されず高精度に被写体の検出を行うことが可能になる。
請求項2に記載の発明によれば、被写体検出装置は、データ選定手段によって複数の被写体検出手法で解析して得られた被写体データから最も信頼性の高い被写体データを選定するため、撮像条件等の影響を受けず高精度な検出結果となる。そして移動する被写体を連続して撮像した撮像画像を解析する場合に、この被写体データに基づいて、新たに入力された撮像画像の解析範囲を設定することで、被写体が高い確率で存在する範囲の画像について解析することができる。そして、入力された撮像画像の全ての範囲を解析せずに、被写体が高い確率で存在する範囲に解析範囲を限定することができるので、被写体解析手段によって解析するデータ量を少なくすることができる。そのため、被写体の検出を高速にかつ高精度に行うことが可能になる。さらに、高速かつ高精度に被写体の検出ができるので、例えば、ロボットカメラにおける被写体の自動追尾撮影に応用することで、ロボットカメラによる自動撮影が可能となる。
請求項3に記載の発明によれば、撮像画像内において被写体の少なくとも一部が含まれる領域を解析し、撮像画像内におけるその領域の位置と大きさとを解析することができる。これによって撮像画像内の被写体の位置と、被写体の大まかな大きさを解析することができる。そのため、例えば、ロボットカメラにおける被写体の自動追尾撮影に応用した場合に、被写体の位置の情報に基づいてカメラの位置や角度を調整することで、被写体が常にフレーム内に収まるように撮影できるだけでなく、解析した被写体の撮像画像内における大きさの情報に基づいて自動でカメラのズームの調整等をする構成とすることで、被写体が常にフレーム内で適切な大きさになるように撮影することが可能になる。
請求項4に記載の発明によれば、それぞれの被写体解析手段で行う被写体検出手法によって算出方法が異なるために、同じ信頼度値であっても検出精度が異なることがあるが、このような場合に、重み係数によって重み付けをすることでこれを補正し、検出精度の高い被写体データを選定することができる。また、信頼度値に重み付けをすることで、例えば、特定の条件で撮像する場合に、その条件に適した被写体検出手法で解析した解析結果の信頼度値に多く重み付けして、特にその被写体検出手法によって解析した被写体データを選定しやすくするなど、特定の被写体検出手法によって解析した被写体データの選定のされやすさを予め設定することが可能になる。
請求項6に記載の発明によれば、入力した被写体データの信頼度値に基づいて被写体データを選定するので、信頼度値の最も高い被写体検出結果を選定することができる。そのため、例えば、撮像条件などによって1つの被写体検出手法で検出精度が低下した場合においても、他の被写体検出手法によって検出した、信頼度の高い検出結果を選定するため、誤った検出結果を排除することができ、撮像条件等に影響されず高精度に被写体の検出を行うことが可能になる。
請求項7に記載の発明によれば、例えば、移動する被写体を連続して撮像した撮像画像を解析する場合に、この被写体データに基づいて、新たに入力された撮像画像の解析範囲を設定することで、被写体が高い確率で存在する範囲の画像について解析することができる。そして、入力された撮像画像の全ての範囲を解析せずに、被写体が高い確率で存在する範囲に解析範囲を限定することができるので、被写体解析手段によって解析するデータ量を少なくすることができる。そのため、被写体の検出を高速にかつ高精度に行うことが可能になる。
以下、本発明の実施の形態について図面を参照して説明する。ここでは本発明を、人物を連続して撮像した画像から、画像ごとに人物の顔(頭部)を検出する場合を一例として説明する。
[被写体検出装置の構成]
図1は本発明における被写体検出装置の構成を示したブロック図である。被写体検出装置1は、入力された撮像画像から顔検出手法、色領域追跡手法および背景差分を用いた頭部検出手法により人物の顔を検出し、その3つの手法によって解析された解析結果のうち最も信頼度の高い結果を選定して、この選定した結果に基づいて次に入力される撮像画像の解析範囲を設定するものである。ここでは、被写体検出装置1は、顔検出手段(被写体位置検出手段)50と、色領域追跡手段(被写体位置検出手段)60と、頭部検出手段(被写体位置検出手段)70と、被写体データ処理部80と、出力手段90とを備えている。また、被写体検出装置1は、撮像した画像を入力するカメラ2を外部に接続している。
図1は本発明における被写体検出装置の構成を示したブロック図である。被写体検出装置1は、入力された撮像画像から顔検出手法、色領域追跡手法および背景差分を用いた頭部検出手法により人物の顔を検出し、その3つの手法によって解析された解析結果のうち最も信頼度の高い結果を選定して、この選定した結果に基づいて次に入力される撮像画像の解析範囲を設定するものである。ここでは、被写体検出装置1は、顔検出手段(被写体位置検出手段)50と、色領域追跡手段(被写体位置検出手段)60と、頭部検出手段(被写体位置検出手段)70と、被写体データ処理部80と、出力手段90とを備えている。また、被写体検出装置1は、撮像した画像を入力するカメラ2を外部に接続している。
顔検出手段50(被写体位置検出手段)は、顔検出手法により、カメラ2から入力される撮像画像から人物の顔を検出し、被写体データを生成するものである。この顔検出手段50は、被写体解析部51、信頼度値算出部52、被写体データ生成部53および顔検出データ記憶手段54とを備えている。
被写体解析部51(被写体解析手段)は、カメラ2から入力される撮像画像について、人物の顔を解析する解析範囲を設定し、その解析範囲内の画像を顔検出手法により解析して人物の顔を検出するものである。この被写体解析部51は、解析範囲設定部51aと、解析実行部51bとを備えている。
解析範囲設定部51aは、後記する被写体データ処理部80から入力された選定データに基づいて、カメラ2から入力された撮像画像の解析範囲を設定するものである。被写体データ処理部80から入力される選定データには、カメラ2から入力される撮像画像内の領域の位置と大きさの情報が含まれている。この情報は、被写体データ処理部80によって選定された、被写体の顔(頭部)の少なくとも一部が存在する画像内の領域の位置と大きさを表すもので、ここでは、被写体の顔が含まれる、長方形で区画した領域の中心座標と、この領域の幅と高さとで表すが、領域の形状や位置と大きさを表す方法はこれに限定されるものではなく、例えば、正方形で区画した領域の左下隅の座標と正方形の一辺の長さで表すこととしても良い。そして、解析範囲設定部51aは、選定データに含まれる位置と大きさの情報に基づいて、新たにカメラ2から入力される撮像画像の解析範囲を設定する。
例えば、640×480画素の撮像画像を入力し、この撮像画像内の長方形の領域の位置を、撮像画像の左下隅を原点としたときの、原点からこの領域の中心までの、横方向(x軸方向)と縦方向(y軸方向)の画素数で表し、この領域の大きさを、領域の幅と高さの画素数で表す場合において、選定データには、中心座標(x,y)として“112,238”と、幅と高さ(w,h)として“27,27”とが含まれているとする。このとき、解析範囲設定部51aはこの選定データの基づいて、新たに入力された撮像画像の解析範囲を、例えば、中心座標は、選定データの中心座標と同じ(x,y)=(112,238)に、幅と高さは、選定データの幅と高さの値をそれぞれ3倍にした(w,h)=(81,81)の範囲に設定する。この場合、640×480画素の撮像画像内の(x,y)=(112,238)を中心座標とする81×81画素の範囲が解析範囲となる。
このように、選定データに含まれる中心座標と幅と高さの情報に基づいて解析範囲を設定することで、撮像画像内での被写体の位置と大きさに適した解析範囲を設定することができる。さらに、撮像画像全てについて解析する必要がなくなるので、解析を高速に行うことが可能になる。また、例えば、解析範囲の幅と高さを(w,h)=(96,72)のように、予め解析範囲の幅と高さを所定値に設定しておき、選定データの中心座標に基づいてこの幅と高さの範囲を解析領域と設定するようにしても良い。この際、例えば、所定の時間おきに連続して入力される撮像画像について解析する場合に、リアルタイムでの検出が維持できるデータ量になるように、予め解析範囲を所定の大きさに定めておくことで、常に適正な解析速度を維持できるようになる。
また、解析範囲設定部51aは、撮像画像内に2以上の被写体が存在し、選定データから2以上の領域の位置と大きさの情報を取得した場合には、この位置と大きさの情報に基づいて、2以上の解析範囲を設定する。
さらに、解析範囲設定部51aは、被写体データ処理部80で選定した選定データが無い場合、つまり連続して撮像した画像が順次入力される際の最初に入力される撮像画像を解析する場合には、解析範囲を撮像画像全体に設定する。そして、解析範囲設定部51aは、設定した解析範囲内の画像を解析実行部51bに出力する。
解析実行部51bは、解析範囲設定部51aから入力された画像について解析し、人物の顔の検出を行うものである。解析実行部51bでは、顔検出手法により画像から人物の顔の検出を行う。この顔検出手法は、例えば、「A Statistical method for 3D object detection applied to faces and cars」(H. Schneiderman, et al, CVPR 2000)に記載された技術等を用いて実現することができる。ここでは前記の文献に記載された技術を適用して、被写体の位置と大きさの解析を行う。
ここで、図2を参照(適宜図1参照)して、顔検出手法によって被写体を検出する手法について説明する。図2は、顔検出手法によって撮像画像から被写体を検出する例を説明するための説明図である。
解析実行部51bに、解析範囲設定部51aから解析範囲内の画像が入力されると、解析実行部51bは、解析範囲内の画像をウェーブレット変換する。そして、解析範囲内の画像に所定サイズの領域を設定する。具体的には、図2(a)に示すように、解析実行部51bは、入力された画像に所定サイズの領域r1を設定する。そして、この領域r1内をさらに細かい区分に分け、各区分にウェーブレット係数により分類されたパターン番号patternkを付加する。例えば、図2(b)に示すように、領域r1内をさらに細かい区分c1、c2、…、ckに分け、各区分にウェーブレット係数により分類されたパターン番号patternk(図2の例では、#5761など)を付加する。さらに、各区分の画像について、それぞれその画像が人物の顔である確率Pk(patternk,x,y|face)と、人物の顔でない確率Pk(patternk,x,y|non-face)を、顔検出データ記憶手段54に予め記憶された、様々な顔の画像データに基づいて算出する。
そして、以下に示す(1)式に基づいて前記領域内の全ての区分についての、顔である確率の顔でない確率に対する比を統合し、この値aを顔であるかを判別するための基準値aとして、この基準値aが予め定めたしきい値λよりも大きければ、その領域が顔の画像であると判別する。ここで、(1)式の“region”は、前記の確率を算出する区分を含む、入力された画像に設定した所定サイズの領域(範囲)を表し、図2の例では、領域r1の占める範囲を表す。そして、この領域を、解析範囲の画像の全体にわたって、様々なサイズで設定して、前記の方法により、それぞれの領域が被写体の画像であるかを判別することで、解析範囲の画像から被写体を検出する。
そして、以下に示す(1)式に基づいて前記領域内の全ての区分についての、顔である確率の顔でない確率に対する比を統合し、この値aを顔であるかを判別するための基準値aとして、この基準値aが予め定めたしきい値λよりも大きければ、その領域が顔の画像であると判別する。ここで、(1)式の“region”は、前記の確率を算出する区分を含む、入力された画像に設定した所定サイズの領域(範囲)を表し、図2の例では、領域r1の占める範囲を表す。そして、この領域を、解析範囲の画像の全体にわたって、様々なサイズで設定して、前記の方法により、それぞれの領域が被写体の画像であるかを判別することで、解析範囲の画像から被写体を検出する。
そして、カメラ2から入力された撮像画像における、人物の顔の画像と判断された領域の中心座標(以下、被写体位置情報という)と、この領域の幅と高さ(以下、被写体大きさ情報という)とを算出して人物の顔の位置および大きさとする。そして、(1)式に基づいて算出したこの領域の基準値aと、解析結果である被写体位置情報と被写体大きさ情報とを信頼度値算出部52に出力する。
図1に戻って説明を続ける。信頼度値算出部52(信頼度値算出手段)は、解析実行部51bの解析結果の信頼度を表す信頼度値を算出するものである。ここでは、解析実行部51bで顔が存在するかを判別する基準とした基準値aに基づいて、信頼度値を算出する。ここでは、この信頼度値が、後記する色領域追跡手段60の信頼度値算出部62および頭部検出手段70の信頼度値算出部72よって算出される、それぞれの解析結果に対する信頼度値と、解析結果の信頼度を示す基準が同一になるように信頼度値の算出方法を設定し、信頼度値が、解析実行部51b、61b、71bで検出した領域の画像が被写体の画像である確率を0〜1の範囲で表し、信頼度値が1に近づくほど被写体の画像である確率が高くなり、0に近づくほど被写体の画像である確率が低くなるように、信頼度値を算出する。
なお、それぞれの被写体検出手段の解析結果の重要度に応じて信頼度値の算出方法を適宜設定しても良く、例えば、顔検出手段の解析結果の信頼度値には、前記の(1)式の算出方法で算出した基準値aを用い、後記する色領域追跡手段60と頭部検出手段70の信頼度値は、解析実行部61b、71bで検出した領域の画像が被写体の画像である確率を0〜1の範囲で表したものとしても良い。この場合、顔検出手段50の解析結果の信頼度値は1以上の値となることもあるため、顔検出手段50の解析実行部51bで検出した結果が、後記する被写体データ処理部80のデータ選定手段81でより選定されやすくなり、これによって顔検出手段50の解析結果に重要度をもたせた算出方法とすることができる。そして、信頼度値算出部52は、被写体位置情報、被写体大きさ情報および信頼度値を被写体データ生成部53に出力する。
被写体データ生成部53(被写体データ生成手段)は、信頼度値算出部52から入力された情報に基づいて被写体データを生成するものである。被写体データには、被写体解析部ID、被写体位置情報、被写体大きさ情報および信頼度値が含まれている。ここで、被写体解析部ID(被写体解析手段ID)は、各被写体解析部51,61,71を識別するための識別子である。そして、被写体データ生成部53は、被写体データを被写体データ処理部80のデータ選定手段81に出力する。
顔検出データ記憶手段54は、被写体解析部51による画像の解析に必要となる種々のデータを記憶するもので、半導体メモリ、ハードディスク等の一般的な記録媒体である。顔検出データ記憶手段54には様々な顔の画像データが予め記憶されている。そしてこの顔検出データ記憶手段54は、被写体解析部51によって、解析する画像が人物の顔である確率と人物の顔でない確率とを算出する際に参照されて用いられる。
色領域追跡手段60(被写体位置検出手段)は、色領域追跡手法により、カメラ2から入力される撮像画像から人物の顔(頭部)を検出し、被写体データを生成するものである。この色領域追跡手段60は、被写体解析部61、信頼度値算出部62、被写体データ生成部63および色領域追跡データ記憶手段64とを備えている。
被写体解析部61(被写体解析手段)は、カメラ2から入力される撮像画像について人物の顔を解析する解析範囲を設定し、その解析範囲内の画像を色領域追跡手法により解析して人物の顔を検出するものである。この被写体解析部61は、解析範囲設定部61aと、解析実行部61bとを備えている。
解析範囲設定部61aは、顔検出手段50の解析範囲設定部51aと同様の方法で、被写体データ処理部80から入力された選定データに基づいて、カメラ2から入力される撮像画像の解析範囲を設定するものである。そして、設定した解析範囲内の画像を解析実行部61bに出力する。
解析実行部61bは、解析範囲設定部61aから入力された画像について解析し、人物の顔の検出を行うものである。解析実行部61bでは、色領域追跡手法により画像から人物の顔の検出を行う。
ここで、図3を参照(適宜図1参照)して、色領域追跡手法によって被写体を検出する手法について説明する。図3は、色領域追跡手法によって撮像画像から被写体を検出する例を説明するための説明図である。
解析実行部61bは、まず、最初に入力された撮像画像から人物の顔(頭部)の領域の色ヒストグラムを取得して、色領域追跡データ記憶手段64に記憶する。具体的には、図3(a)に示すように、最初に入力された撮像画像の人物の頭部を含む領域Sの色ヒストグラムを取得する。そして、その後新たに入力される撮像画像の解析範囲内の画像と、色領域追跡データ記憶手段64に記憶されている色ヒストグラムとを比較して、色ヒストグラムのパターンが類似する領域を解析する。つまり、解析範囲内の画像に所定サイズの領域を設定し、その領域の色ヒストグラムと、色領域追跡データ記憶手段64に記憶されている色ヒストグラムのパターンの差を算出し、この値が予め定めたしきい値よりも低ければ、その領域を顔の画像と判定する。そして、解析範囲の画像全体に様々なサイズでこの領域を設定し、前記の方法によって、それぞれの領域内の画像が顔の画像であるかを判断することで、解析範囲内の画像から人物の顔を検出する。
そして、撮像画像全体において、人物の顔であると判断された領域の中心座標(被写体位置情報)と幅と高さ(被写体大きさ情報)とを算出する。また、この領域の色ヒストグラムと色領域追跡データ記憶手段64に記憶されている色ヒストグラムのパターンの差の値と、解析結果である被写体位置情報と被写体大きさ情報とを信頼度値算出部62に出力する。
図1に戻って説明を続ける。信頼度値算出部62(信頼度値算出手段)は、解析実行部61bで顔が存在すると判断した領域の色ヒストグラムと、色領域追跡データ記憶手段64に記憶されている画像の色ヒストグラムのパターンの差の値に基づいて、解析結果の信頼度値を算出するものである。ここでは、この信頼度値は、顔検出手段50の信頼度値算出部52、および、後記する頭部検出手段70の信頼度値算出部72よって算出される、それぞれの解析結果に対する信頼度値と、解析結果の信頼度を示す基準が同一になるように算出する。そして、信頼度値算出部62は、被写体位置情報、被写体大きさ情報および信頼度値を被写体データ生成部63に出力する。
被写体データ生成部63(被写体データ生成手段)は、信頼度値算出部62から入力された情報に基づいて被写体データを生成するものである。被写体データには、被写体解析部ID、被写体位置情報、被写体大きさ情報および信頼度値が含まれている。そして、被写体データ生成部63は、被写体データを被写体データ処理部80のデータ選定手段81に出力する。
色領域追跡データ記憶手段64は、被写体解析部61による画像の解析に必要となる種々のデータを記憶するもので、半導体メモリ、ハードディスク等の一般的な記録媒体である。色領域追跡データ記憶手段64は、被写体解析部61によって取得した色ヒストグラムを記憶し、被写体解析部61によって、解析する画像から人物の顔(頭部)の領域を検出する際に参照されて用いられる。
頭部検出手段70(被写体位置検出手段)は、背景差分を用いた頭部検出手法により、カメラ2から入力される撮像画像から人物の顔(頭部)を検出し、被写体データを生成するものである。この頭部検出手段70は、被写体解析部71、信頼度値算出部72、被写体データ生成部73および頭部検出データ記憶手段74とを備えている。
被写体解析部71は、カメラ2から入力される撮像画像について人物の顔を解析する解析範囲を設定し、その解析範囲内の画像を、背景差分を用いた頭部検出手法により解析して人物の顔(頭部)を検出するものである。この被写体解析部71は、解析範囲設定部71aと、解析実行部71bとを備えている。
解析範囲設定部71aは、顔検出手段50の解析範囲設定部51aと同様の方法で、被写体データ処理部80から入力された選定データに基づいて、カメラ2から入力される撮像画像の解析範囲を設定するものである。そして、設定した解析範囲内の画像を解析実行部71bに出力する。
解析実行部71bは、解析範囲設定部71aから入力された画像について解析し、人物の頭部の検出を行うものである。解析実行部71bは、背景差分を用いた頭部検出手法により画像から人物の頭部の検出を行う。
ここで、図4を参照(適宜図1参照)して、背景差分を用いた頭部検出手法によって被写体を検出する手法について説明する。図4は、背景差分を用いた頭部検出手法によって撮像画像から被写体を検出する例を説明するための説明図である。
解析実行部71bは、まず、最初に入力された、人物が撮像された撮像画像と、頭部検出データ記憶手段74に予め記憶された背景画像との差分画像を解析することで、人物の画像のみを抽出する。具体的には、図4(a)に示すように、人物が撮像された撮像画像t1と、予め記憶されている背景画像t2との差分画像t3を解析する。そしてその上部の形状、つまり人物の頭部の形状を取得し、頭部テンプレートt4として頭部検出データ記憶手段74に記憶する。
そして、その後新たに入力される撮像画像の解析範囲内の画像から背景差分を解析し、差分画像と頭部テンプレートとが一致する領域を解析する。例えば、図4(b)に示すように、解析実行部71bには解析範囲設定部71aによって撮像画像t5内に設定された解析範囲の画像が入力されると、解析実行部71bは入力された解析範囲の画像と背景画像との差分画像t6を抽出する。そして、解析実行部71bは、解析範囲の差分画像t6と頭部テンプレートt4とを照合し、上部の形状が類似する領域を解析する。つまり、抽出された差分画像t6の上部の形状とテンプレートの頭部の形状との差を算出し、この値が予め定めたしきい値よりも小さければ、その領域を頭部の画像と判断する。
そして、解析実行部71bは、この頭部の領域に基づいて、顔と頭部の画像の領域を設定し、撮像画像全体におけるこの領域の中心座標(被写体位置情報)と、幅と高さ(被写体大きさ情報)とを算出する。また、この領域の上部の形状と頭部テンプレートとの差の値と、解析結果である被写体位置情報および被写体大きさ情報を信頼度値算出部72に出力する。
図1に戻って説明を続ける。信頼度値算出部72は、解析実行部71bから入力した頭部の形状の差の値に基づいて、解析結果の信頼度値を算出するものである。そして、信頼度値算出部72は、被写体位置情報、被写体大きさ情報および信頼度値を被写体データ生成部73に出力する。ここでは、この信頼度値は、顔検出手段50の信頼度値算出部52および色領域追跡手段60の信頼度値算出部62よって算出される、それぞれの解析結果に対する信頼度値と、解析結果の信頼度を示す基準が同一になるように算出する。
被写体データ生成部73は、信頼度値算出部72から入力された情報に基づいて被写体データを生成するものである。被写体データには、被写体解析部ID、被写体位置情報、被写体大きさ情報および信頼度値が含まれている。そして、被写体データ生成部73は、被写体データを被写体データ処理部80のデータ選定手段81に出力する。
頭部検出データ記憶手段74は、被写体解析部71による画像の解析に必要となる種々のデータを記憶するもので、半導体メモリ、ハードディスク等の一般的な記録媒体である。頭部検出データ記憶手段74は、被写体解析部71によって取得した頭部の形状を頭部テンプレートとして記憶し、被写体解析部71によって、解析する画像から人物の頭部(顔)の領域を検出する際に参照されて用いられる。
被写体データ処理部80は、顔検出手段50、色領域追跡手段60および頭部検出手段70から入力された被写体データから、撮像画像内の被写体ごとに1つの被写体データを選定し、選定したデータを平滑化して、選定データを生成するものである。この被写体データ処理部80は、データ選定手段81、データ補正部82、選定データ生成部83および重み係数記憶手段84とを備えている。
データ選定手段81は、顔検出手段50の被写体データ生成部53、色領域追跡手段60の被写体データ生成部63および頭部検出手段70の被写体データ生成部73から入力された被写体データから、その信頼度値と重み係数とに基づいて撮像画像内の被写体ごとに1つの被写体データを選定するものである。重み係数とは、それぞれの被写体位置検出手段の解析結果の信頼度値に重み付けをするため係数で、被写体解析部IDに対応させて予め重み係数記憶手段84に記憶されている。データ選定手段81は、被写体解析部IDに対応する重み係数を取得し、この重み係数に基づいて信頼度値を重み付けする。そしてその重み付けした信頼度値に基づいて1つの被写体データを選定する。そして、この選定した被写体データをデータ補正部82に出力する。
ここで、図5を参照(適宜図1参照)して、データ選定手段81が信頼度値に重み付けをする手法について具体的に説明する。図5は、顔検出手段から入力された被写体データから、信頼度値に重み付けする例を説明するための説明図である。
図5では、データ選定手段81に、顔検出手段50の被写体データ生成部53で生成された被写体データD1が入力されている。ここで、データ選定手段81は、被写体データD1の解析を行い、被写体解析部ID、被写体位置情報、被写体大きさ情報、信頼度値を認識する。具体的には、図5(a)に示すように、被写体データ生成部53から被写体データD1として“qmop,1,123,221,23,23,0.87”が入力された場合に、データ選定手段81は、図5(b)に示すように、被写体データD1から、被写体解析部IDとして“1”を、被写体位置情報(x,y)として“123,221”を、被写体大きさ情報(w,h)として“23,23”を、信頼度値として“0.87”を認識する。ここで、“qmop”は、被写体データであることを識別するための識別コマンドである。
そして、データ選定手段81は、重み係数記憶手段84から、認識した被写体解析部IDに対応する重み係数を取得する。例えば、重み係数記憶手段84に、被写体解析部ID“1”(ID1)に対応する重み係数“1.05”(w1)が予め記憶されているとする。そこで、図5(c)に示すように、データ選定手段81は、重み係数記憶手段84から重み係数として“1.05”を取得する。
そして、データ選定手段81は、信頼度値の重み付けを行う。具体的には、図5(d)に示すように、被写体データD1から認識した信頼度値“0.87”と、重み係数“1.05”との積“0.9135”を、重み付けした信頼度値b1とする。
同様に、色領域追跡手段60の被写体データ生成部63から入力された被写体データと、頭部検出手段70の被写体データ生成部73から入力された被写体データについても、それぞれ被写体解析部ID、被写体位置情報、被写体大きさ情報、信頼度値を認識し、重み係数記憶手段84から、認識した被写体解析部IDに対応する重み係数を取得し、信頼度値の重み付けを行う。
そして、各被写体データの重み付けした信頼度値を比較して、重み付けした信頼度値の値が最も大きい被写体データを選定する。例えば、被写体データ生成部53、63、73から入力された3つの被写体データの重み付けした信頼度値の中で、被写体データ生成部53から入力された被写体データD1の重み付けした信頼度値b1が最も大きい値であるとすると、データ選定手段81は、被写体データD1を選定し、この選定した被写体データD1をデータ補正部82に出力する。
図1に戻って説明を続ける。データ補正部82は、データ選定手段81から入力された、選定された被写体データに対して平滑化の処理を行うものである。データ補正部82は、これまでにデータ選定手段81が選定した被写体データを記憶しておき、それに基づいて新たに入力された被写体データの平滑化を行う。そして、平滑化した被写体データを選定データ生成部83に出力する。
選定データ生成部83は、データ補正部82から入力された、平滑化された被写体データから、選定データを生成するものである。この選定データは、被写体位置情報と被写体大きさ情報とを含み、選定データ生成部83は、この選定データを各被写体位置検出手段(顔検出手段50、色領域追跡手段60および頭部検出手段70)の解析範囲設定部51a、61aおよび71aに出力する。また、この選定データを出力手段90に出力する。
例えば、データ補正部82から入力された、平滑化された被写体データに、被写体解析部IDとして“1”と、被写体位置情報(x,y)として“123,221”と、被写体大きさ情報(w,h)として“23,23”と、信頼度値として“0.87”とが含まれている場合に、選定データ生成部83は、被写体位置情報(x,y)として“123,221”と、被写体大きさ情報(w,h)として“23,23”とを含む選定データを生成する。
重み係数記憶手段84は、信頼度値に重み付けをするための重み係数を被写体解析部IDに対応させて記憶するもので、半導体メモリ、ハードディスク等の一般的な記録媒体である。重み係数記憶手段84は、データ選定手段81によって、信頼度値に重み付けする際に参照されて用いられる。
出力手段90は、選定データ生成部83から入力された選定データを、被写体の検出結果として外部へ出力するものである。
以上、本発明に係る被写体検出装置1の構成について説明したが、本発明はこれに限定されるものではない。例えば、被写体検出手法には、顔検出手法、色領域追跡手法および背景差分を用いた頭部検出手法を適用したが、これらの手法に付加して、あるいは置き換えて、他の被写体検出手法を適用しても良い。また、検出する被写体は人物の顔に限定されることはなく、例えば車などを検出するものとしても良い。そして、目的とする被写体に合わせた被写体検出手法を適宜選択して適用しても良い。さらに、被写体検出手法に基づいて、信頼度値の算出方法も適宜変更しても良い。また、本実施の形態では、被写体検出装置1は、被写体位置検出手段を3つ備えるものであるが、異なる被写体検出手法によって処理を行う被写体位置検出手段を、2つ以上備える構成であれば良い。
さらに、本発明に係る被写体検出装置1は、コンピュータ1台に全ての構成を持たせても良く、あるいは、複数の被写体位置検出手段とデータ選定手段とをコンピュータ数台に分けて持たせ、ネットワークを介してデータを移動させ、全体で被写体検出装置1として機能させる構成としても良い。また、顔検出手段50の顔検出データ記憶手段54、色領域追跡手段60の色領域追跡データ記憶手段64、頭部検出手段70の頭部検出データ記憶手段74および被写体データ処理部80の重み係数記憶手段84に記憶したデータは、1つの記憶手段に記憶しても良く、あるいは、複数の記憶手段に記憶することとしても良い。
なお、被写体検出装置1の被写体位置検出手段50,60,70は、一般的なコンピュータにプログラム(被写体位置検出プログラム)を実行させ、コンピュータ内の演算装置や記憶装置を動作させることで実現することができる。また、被写体検出装置1のデータ選定手段81は、一般的なコンピュータにプログラム(被写体データ選定プログラム)を実行させ、コンピュータ内の演算装置や記憶装置を動作させることで実現することができる。この被写体位置検出プログラムと被写体データ選定プログラムは、通信回線を介して配布することもできるし、また、CD−ROM等の記録媒体に記録して配布することも可能である。
[被写体検出装置の動作]
次に、図6を参照(適宜図1参照)して、本発明における被写体検出装置1の動作について説明する。図6は、本発明における被写体検出装置が撮像画像から被写体を検出する動作を示したフローチャートである。
次に、図6を参照(適宜図1参照)して、本発明における被写体検出装置1の動作について説明する。図6は、本発明における被写体検出装置が撮像画像から被写体を検出する動作を示したフローチャートである。
図6を参照(適宜図1参照)して、被写体検出装置1が、入力された撮像画像を複数の被写体位置検出手段(顔検出手段50、色領域追跡手段60および頭部検出手段70)によって解析して被写体を検出し、複数の解析結果から撮像画像内の被写体ごとに1つの検出結果を選定する動作について説明する。
まず、最初に入力された撮像画像から顔検出手段50が被写体を検出し、それに基づいて、色領域追跡手段60と頭部検出手段70とが、それ以降に入力された撮像画像から被写体を解析する際に参照する初期データを取得する動作(ステップS10〜14)について説明する。なお、最初に入力された撮像画像から被写体を検出する被写体位置検出手段は顔検出手段50に限定される必要は無く、予め色領域追跡手段60の色領域追跡データ記憶手段64、あるいは頭部検出手段70の頭部検出データ記憶手段74に被写体のサンプルの画像データを記憶しておき、それに基づいて、色領域追跡手段60あるいは頭部検出手段70によって、最初に入力された画像の被写体の検出を行い、それに基づいて、他の被写体位置検出手段が初期データを取得するようにしても良い。また、全ての被写体検出位置手段に、予め被写体のサンプルの画像データを記憶しておき、それに基づいて、後記するステップS15以降の動作と同様に、初めに入力された撮像画像についても、顔検出手段50、色領域追跡手段60および頭部検出手段70によって被写体の検出を行い、3つの被写体データから1つの被写体データを選定する構成としても良い。
被写体検出装置1は、カメラ2から撮像画像を入力する(ステップS10)。そして、顔検出手段50の解析範囲設定部51aは、解析範囲をカメラ2から入力した撮像画像の全範囲に設定する。さらに、解析実行部51bは、全範囲の撮像画像について解析し、被写体の位置と大きさの検出を行う(ステップS11)。
さらに、顔検出手段50の信頼度値算出部52は、ステップS11で解析した解析結果の信頼度値を算出し(ステップS12)、被写体データ生成部53は、被写体解析部を識別する被写体解析部IDと、ステップS12で算出した信頼度値と、ステップS11で解析した解析結果である、被写体の位置を表す被写体位置情報と被写体の大きさを表す被写体大きさ情報とを含む被写体データを生成する(ステップS13)。そして、被写体データ処理部80の選定データ生成部83は、この被写体データから被写体位置情報と被写体大きさ情報とを含む選定データを生成する。
そして、色領域追跡手段60の被写体解析部61と、頭部検出手段70の被写体解析部71は、入力された選定データの被写体位置情報と被写体大きさ情報とに基づいて、ステップS10で入力された撮像画像から、初期データとして、被写体解析部61は被写体(人物の顔)の存在する領域の色ヒストグラムを取得し、被写体解析部71は人物の頭部の形状を取得する(ステップS14)。つまり、色領域追跡手段60の解析範囲設定部61aは、選定データの被写体位置情報と被写体大きさ情報とに基づいて、ステップS10で入力された撮像画像内の被写体(人物の顔)の存在する領域を特定する。そして、解析実行部61bは、その領域の色ヒストグラムを取得して、色領域追跡データ記憶手段64に記憶する。同様に、頭部検出手段70の解析範囲設定部71aは、選定データの被写体位置情報と被写体大きさ情報とに基づいて、ステップS10で入力された撮像画像内の被写体(人物の顔)の存在する領域を特定する。そして、解析実行部71bは、その領域の画像と頭部検出データ記憶手段74に予め記憶された背景画像との差分画像を解析し、その領域内の人物の画像のみを抽出する。そして、その領域内の被写体の上部の形状、つまり人物の頭部の形状を取得し、頭部テンプレートとして頭部検出データ記憶手段74に記憶する。この初期データは、後記するステップS17で、色領域追跡手段60の被写体解析部61と、頭部検出手段70の被写体解析部71によって、被写体の位置と大きさの解析をする際に参照される。以上で、最初に入力された撮像画像から被写体を検出して、色領域追跡手段60と頭部検出手段70とが初期データを取得する動作は終了する。
次に、初期データの取得後に、入力された撮像画像から被写体を検出する動作(ステップS15〜24)について説明する。初期データの取得後に入力された撮像画像については、顔検出手段50、色領域追跡手段60および頭部検出手段70によって同時に被写体の検出を行い、ここで生成された3つの被写体データから1つの被写体データを選定し、検出結果として出力する。
被写体検出装置1は、カメラ2から次の新たな撮像画像を入力する(ステップS15)。そして、顔検出手段50の解析範囲設定部51a、色領域追跡手段60の解析範囲設定部61aおよび頭部検出手段70の解析範囲設定部71aは、前の撮像画像の選定データに基づいて、ステップS15でカメラ2から入力した撮像画像の解析範囲を設定する(ステップS16)。さらに、顔検出手段50の解析実行部51b、色領域追跡手段60の解析実行部61bおよび頭部検出手段70の解析実行部71bは、ステップS16で設定した解析範囲の画像について、それぞれ顔解析手法、色領域追跡手法および背景差分を用いた頭部検出手法によって解析し、被写体の位置と大きさの検出を行う(ステップS17、被写体解析ステップ)。
さらに、顔検出手段50の信頼度値算出部52、色領域追跡手段60の信頼度値算出部62および頭部検出手段70の信頼度値算出部72は、ステップS17で各々の被写体位置検出手段で解析した解析結果について信頼度値を算出し(ステップS18、信頼度値算出ステップ)、顔検出手段50の被写体データ生成部53、色領域追跡手段60の被写体データ生成部63および頭部検出手段70の被写体データ生成部73は、被写体解析部を識別する被写体解析部IDと、ステップS18で算出した信頼度値と、ステップS17で解析した被写体位置情報と被写体大きさ情報とを含む被写体データを、それぞれの被写体位置検出手段で生成する(ステップS19、被写体データ生成ステップ)。
そして、被写体データ処理部80のデータ選定手段81は、顔検出手段50の被写体データ生成部53、色領域追跡手段60の被写体データ生成部63および頭部検出手段70の被写体データ生成部73で生成した、被写体データの被写体解析部IDに対応した重み係数を、重み係数記憶手段84から取得して、信頼度値の重み付けを行い、重み付けした信頼度値の最も大きい被写体データを選定する(ステップS20、データ選定ステップ)。さらに、データ補正部82は、これまでにデータ選定手段81が選定した被写体データを記憶しておき、それに基づいてステップS20で選定した被写体データの平滑化を行う(ステップS21)。
そして、選定データ生成部83はステップS21で平滑化した被写体データから、被写体位置情報と被写体大きさ情報とを含む選定データを生成する(ステップS22)。さらに、出力手段90は選定データを被写体の検出結果として外部に出力する(ステップS23)。
そして、カメラ2からの新たな撮像画像の入力がある場合(ステップS24でYes)は、ステップS15に戻り、撮像画像を入力する動作以降の操作を行う。一方、カメラ2からの新たな撮像画像の入力がない場合(ステップS24でNo)は、動作を終了する。
以上の動作によって、被写体検出装置1は、入力した撮像画像から、複数の被写体位置検出手段によって被写体の検出を行うことができる。そして、各々の被写体位置検出手段での解析結果の信頼度値を算出して被写体データを生成し、その信頼度値に重み付けし、この重み付けした信頼度値の基づいて、撮像画像内の被写体ごとに1つの被写体データを選定することができる。そのため、例えば、1つの被写体位置検出手段で誤検出をした場合においても、複数の被写体位置検出手段によって解析した複数の解析結果から精度の高い解析結果を選定することで、常に精度の高い解析結果を得ることができる。さらに、被写体検出装置1は、被写体データ処理部80で生成した選定データに基づいて、カメラ2から入力された新たな撮像画像の解析範囲を設定し、その解析範囲内の画像から被写体の検出を行うことができる。そのため、移動する被写体を連続して撮像した画像から被写体の検出を行う場合に、撮像画像の解析範囲を限定して、被写体が高い確率で存在する範囲の画像について解析することができると同時に、解析実行部51b、61b、71bによって解析するデータ量を少なくすることができ、被写体の検出を高速で、かつ高精度に行うことが可能になる。
1 被写体検出装置
50 顔検出手段(被写体位置検出手段、被写体位置検出装置)
60 色領域追跡手段(被写体位置検出手段、被写体位置検出装置)
70 頭部検出手段(被写体位置検出手段、被写体位置検出装置)
51、61、71 被写体解析部(被写体解析手段)
52、62、72 信頼度値算出部(信頼度値算出手段)
53、63、73 被写体データ生成部(被写体データ生成手段)
81 データ選定手段(データ選定装置)
84 重み係数記憶手段
50 顔検出手段(被写体位置検出手段、被写体位置検出装置)
60 色領域追跡手段(被写体位置検出手段、被写体位置検出装置)
70 頭部検出手段(被写体位置検出手段、被写体位置検出装置)
51、61、71 被写体解析部(被写体解析手段)
52、62、72 信頼度値算出部(信頼度値算出手段)
53、63、73 被写体データ生成部(被写体データ生成手段)
81 データ選定手段(データ選定装置)
84 重み係数記憶手段
Claims (7)
- 撮像画像から被写体を検出する被写体検出装置であって、
前記撮像画像内における前記被写体の位置を解析し、被写体位置情報とする被写体解析手段と、
この被写体解析手段により解析された解析結果に対する信頼度を表す信頼度値を算出する信頼度値算出手段と、
この信頼度値算出手段で算出された信頼度値、および前記解析結果である被写体位置情報を含む被写体データを生成する被写体データ生成手段と、
を有する被写体位置検出手段を複数備えるとともに、
前記信頼度値に基づいて、複数の前記被写体データから前記撮像画像内の被写体ごとに1つの被写体データを選定するデータ選定手段を備えることを特徴とする被写体検出装置。 - 前記被写体解析手段は、前記データ選定手段により選定された被写体データの被写体位置情報に基づいて、新たに入力された撮像画像の解析範囲を限定して前記被写体の位置を解析することを特徴とする請求項1に記載の被写体検出装置。
- 前記被写体解析手段は、前記撮像画像内における前記被写体の位置における当該被写体の大きさをさらに解析し、
前記被写体データ生成手段は、前記被写体解析手段で解析された前記解析結果であり、前記被写体の大きさを表す被写体大きさ情報をさらに含む被写体データを生成することを特徴とする請求項1または請求項2に記載の被写体検出装置。 - 前記被写体データ生成手段は、前記被写体解析手段を識別する被写体解析手段IDをさらに含む被写体データを生成し、
前記信頼度値の重要度を表す重み係数を、前記被写体解析手段IDに対応させて予め記憶する重み係数記憶手段を備え、
前記データ選定手段が、前記被写体解析手段IDに対応する前記重み係数と前記信頼度値とに基づいて、複数の前記被写体データから前記撮像画像内の被写体ごとに1つの被写体データを選定することを特徴とする請求項1から請求項3のいずれか1項に記載の被写体検出装置。 - 撮像画像内における被写体の位置を解析して、この解析結果を含む被写体データを生成する、複数の被写体位置検出装置と、複数の被写体データから撮像画像内の被写体ごとに1つの被写体データを選定するデータ選定装置とを用いて、撮像画像から被写体を検出する被写体検出方法であって、
前記複数の被写体位置検出装置において、
前記撮像画像内における前記被写体の位置を解析する被写体解析ステップと、
この被写体解析ステップで解析された解析結果に対する信頼度を表す信頼度値を算出する信頼度値算出ステップと、
この信頼度値算出ステップで算出された信頼度値、および前記解析結果である被写体位置情報を含む被写体データを生成する被写体データ生成ステップとを含み、
前記データ選定装置において、
前記信頼度値に基づいて、複数の前記被写体データから前記撮像画像内の被写体ごとに1つの被写体データを選定するデータ選定ステップを含むことを特徴とする被写体検出方法。 - 撮像画像内における被写体の位置を解析して被写体位置情報とし、この解析結果に対する信頼度を表す信頼度値を算出して、前記信頼度値と、前記被写体位置情報とを含む被写体データを生成する、複数の被写体位置検出装置から、複数の前記被写体データを入力し、複数の前記被写体データから1つの被写体データを選定するために、コンピュータを、
前記信頼度値に基づいて、複数の前記被写体データから前記撮像画像内の被写体ごとに1つの被写体データを選定するデータ選定手段として機能させることを特徴とする被写体データ選定プログラム。 - 撮像画像内における被写体の位置を表す被写体位置情報と、前記被写体位置情報の信頼度を表す信頼度値とを含む、複数の被写体データから撮像画像内の被写体ごとに1つの被写体データを選定するデータ選定装置から、選定された被写体データの前記被写体位置情報を入力し、前記被写体位置情報に基づいて、新たに入力された撮像画像の解析範囲を限定して被写体の位置を解析するために、コンピュータを、
前記被写体位置情報に基づいて、新たに入力された撮像画像の解析範囲を限定して被写体の位置を解析する被写体解析手段、
この被写体解析手段により解析された解析結果の信頼度値を算出する信頼度値算出手段、
前記信頼度値と、前記解析結果である被写体位置情報とを含む被写体データを生成する被写体データ生成手段として機能させることを特徴とする被写体位置検出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003300912A JP2005071125A (ja) | 2003-08-26 | 2003-08-26 | 被写体検出装置、被写体検出方法、被写体データ選定プログラムおよび被写体位置検出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003300912A JP2005071125A (ja) | 2003-08-26 | 2003-08-26 | 被写体検出装置、被写体検出方法、被写体データ選定プログラムおよび被写体位置検出プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005071125A true JP2005071125A (ja) | 2005-03-17 |
Family
ID=34405684
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003300912A Pending JP2005071125A (ja) | 2003-08-26 | 2003-08-26 | 被写体検出装置、被写体検出方法、被写体データ選定プログラムおよび被写体位置検出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005071125A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006332752A (ja) * | 2005-05-23 | 2006-12-07 | Sony Corp | 画像情報処理システム、画像情報処理装置および方法、記録媒体並びにプログラム |
JP2008005083A (ja) * | 2006-06-21 | 2008-01-10 | Mitsubishi Electric Corp | 撮像装置 |
JP2012185846A (ja) * | 2007-06-18 | 2012-09-27 | Fujifilm Corp | 顔検出方法 |
JP2021026599A (ja) * | 2019-08-07 | 2021-02-22 | ファナック株式会社 | 画像処理システム |
JP2021082136A (ja) * | 2019-11-21 | 2021-05-27 | キヤノン株式会社 | 画像処理装置および画像処理方法、ならびに撮像装置 |
-
2003
- 2003-08-26 JP JP2003300912A patent/JP2005071125A/ja active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006332752A (ja) * | 2005-05-23 | 2006-12-07 | Sony Corp | 画像情報処理システム、画像情報処理装置および方法、記録媒体並びにプログラム |
JP4600149B2 (ja) * | 2005-05-23 | 2010-12-15 | ソニー株式会社 | 画像情報処理システム、画像情報処理装置および方法、記録媒体並びにプログラム |
JP2008005083A (ja) * | 2006-06-21 | 2008-01-10 | Mitsubishi Electric Corp | 撮像装置 |
JP4629002B2 (ja) * | 2006-06-21 | 2011-02-09 | 三菱電機株式会社 | 撮像装置 |
JP2012185846A (ja) * | 2007-06-18 | 2012-09-27 | Fujifilm Corp | 顔検出方法 |
JP2021026599A (ja) * | 2019-08-07 | 2021-02-22 | ファナック株式会社 | 画像処理システム |
JP7372076B2 (ja) | 2019-08-07 | 2023-10-31 | ファナック株式会社 | 画像処理システム |
US11989928B2 (en) | 2019-08-07 | 2024-05-21 | Fanuc Corporation | Image processing system |
JP2021082136A (ja) * | 2019-11-21 | 2021-05-27 | キヤノン株式会社 | 画像処理装置および画像処理方法、ならびに撮像装置 |
JP7377078B2 (ja) | 2019-11-21 | 2023-11-09 | キヤノン株式会社 | 画像処理装置および画像処理方法、ならびに撮像装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11360571B2 (en) | Information processing device and method, program and recording medium for identifying a gesture of a person from captured image data | |
US8331619B2 (en) | Image processing apparatus and image processing method | |
JP5213486B2 (ja) | 対象物追跡装置および対象物追跡方法 | |
US7995805B2 (en) | Image matching apparatus, image matching method, computer program and computer-readable storage medium | |
US9092662B2 (en) | Pattern recognition method and pattern recognition apparatus | |
JP4216668B2 (ja) | 映像視覚情報を結合してリアルタイムで複数の顔を検出して追跡する顔検出・追跡システム及びその方法 | |
JP4597391B2 (ja) | 顔領域検出装置およびその方法並びにコンピュータ読み取り可能な記録媒体 | |
JP2012226745A (ja) | 奥行き画像内の物体を検出する方法およびシステム | |
CN111178252A (zh) | 多特征融合的身份识别方法 | |
JP2021503139A (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
CN112308879A (zh) | 图像处理设备、追踪对象物体的方法和存储介质 | |
JP5791373B2 (ja) | 特徴点位置決定装置、特徴点位置決定方法及びプログラム | |
JP5217917B2 (ja) | 物体検知追跡装置,物体検知追跡方法および物体検知追跡プログラム | |
JP2005071125A (ja) | 被写体検出装置、被写体検出方法、被写体データ選定プログラムおよび被写体位置検出プログラム | |
CN117152417A (zh) | 芯片管壳的缺陷检测方法、存储介质及检测设备 | |
JP5625196B2 (ja) | 特徴点検出装置、特徴点検出方法、特徴点検出プログラム及び記録媒体 | |
JP2007025902A (ja) | 画像処理装置、画像処理方法 | |
JP2006323779A (ja) | 画像処理方法、画像処理装置 | |
JP4449483B2 (ja) | 画像解析装置、および画像解析方法、並びにコンピュータ・プログラム | |
CN108985216A (zh) | 一种基于多元logistic回归特征融合的行人头部检测方法 | |
CN118429388B (zh) | 基于图像处理的视觉追踪方法及装置 | |
JP2007025899A (ja) | 画像処理装置、画像処理方法 | |
CN118781512A (zh) | 一种基于互联网的临床教学管理方法以及系统 | |
CN113989701A (zh) | 一种适用于四足机器人巡检的人体目标识别跟踪方法 |