JP2019176261A - 画像処理装置 - Google Patents
画像処理装置 Download PDFInfo
- Publication number
- JP2019176261A JP2019176261A JP2018060468A JP2018060468A JP2019176261A JP 2019176261 A JP2019176261 A JP 2019176261A JP 2018060468 A JP2018060468 A JP 2018060468A JP 2018060468 A JP2018060468 A JP 2018060468A JP 2019176261 A JP2019176261 A JP 2019176261A
- Authority
- JP
- Japan
- Prior art keywords
- resizing
- movement amount
- motion vector
- image
- target object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
- Adjustment Of Camera Lenses (AREA)
- Studio Devices (AREA)
Abstract
【課題】背景や主被写体の動きが激しいダイナミックな撮影シーンにおいて、着目対象に対する動きベクトルを、精度を維持しながら、途切れることなく安定的に検出する。【解決手段】本発明は、カメラ情報を取得するカメラ情報取得手段と、カメラ情報に基づいて撮影時の着目対象を推定する着目対象推定手段と、着目対象の移動量を予測する移動量予測手段と、入力画像に対して着目点座標を設定する着目点設定手段と、リサイズ率を決定するリサイズ率決定手段と、入力画像および着目点座標を前記リサイズ率でリサイズするリサイズ手段と、リサイズ手段によりリサイズされた入力画像と着目点座標とに基づいて、動きベクトルを検出する動きベクトル検出手段とを有し、移動量予測手段は、着目対象推定手段の推定結果に基づいて、着目対象の移動量を予測し、リサイズ率決定手段は、着目対象の移動量の予測結果に基づいて、リサイズ率を決定する。【選択図】図1
Description
本発明は、複数のフレーム画像間で動きベクトルを検出する画像処理装置に関する。
デジタルカメラ等の撮像装置による画像撮像時に、カメラ本体部を保持するユーザの手振れ等で被写体像に振れ(像振れ)が生ずる場合がある。手振れによる像振れを補正するためには、撮像装置の位置姿勢変化を検出する必要があり、例えば角速度センサや加速度センサ等のセンシングデバイスが用いられる。
また、センシングデバイスの代わりに、撮像画像に基づいて撮像装置の位置姿勢変化を検出する動きベクトル検出手法を用いることもできる。動きベクトル検出手法を用いた場合には、撮像画像から手振れに伴う「背景の動き」だけでなく、「主被写体の動き」も検出することができる。「主被写体の動き」が分かれば、主被写体像の位置が撮影画像内の特定の位置に留まるように主被写体を追尾する動作(主被写体追尾動作)などにも応用できる。
動きベクトル検出手法を、背景や主被写体の動きが激しいダイナミックな撮影シーンに適用する場合、フレーム画像間の動き量が検出可能な範囲(サーチ領域)を超えてしまうと、検出が途絶えてしまう問題がある。
そこで、例えば特許文献1では、動きベクトル検出に用いる画像をリサイズ(縮小)することで、相対的にサーチ領域を広げるようにしている。
画像を小さくリサイズするほどサーチ領域は広がるが、画像の解像度が低下することで、動きベクトルの検出精度も低下してしまう。特許文献1では、動きベクトル検出に用いる画像のリサイズ率を撮像装置の振れ量に応じて制御する技術が開示されている。これにより、撮像装置の振れ量が小さい場合には、サーチ領域は狭くても構わないため、画像のリサイズを控えることで、検出精度を高く保つことができる。
一方、撮像装置の振れ量が大きい場合には、サーチ領域を広げるため、画像を小さくリサイズすることで、安定的に動きベクトルを検出できるようになる。
しかしながら、特許文献1に開示された技術では、撮像装置の振れしか考慮しておらず、画像内の主被写体の動きには言及していない。そのため、前述の主被写体追尾動作のように主被写体の動きベクトルが必要な場面において、主被写体の動きベクトルを安定的に検出することはできない。
本発明は、カメラ情報等の撮像装置の情報に基づいて着目対象を推定し、着目対象の動き量に応じてベクトル検出に用いる画像をリサイズすることで、背景や主被写体の動きが激しいダイナミックな撮影シーンにおいても、着目対象に対しても安定的に動きベクトルを検出できるようにした画像処理装置を提供することを目的とする。
上記の課題を解決するために本発明は、撮像装置情報を取得する撮像装置情報取得手段と、前記撮像装置情報に基づいて撮影時の着目対象を推定する着目対象推定手段と、前記着目対象の移動量を予測する移動量予測手段と、入力画像に対して着目点座標を設定する着目点設定手段と、リサイズ率を決定するリサイズ率決定手段と、前記入力画像および前記着目点座標を前記リサイズ率でリサイズするリサイズ手段と、前記リサイズ手段によりリサイズされた前記入力画像および前記着目点座標に基づいて、動きベクトルを検出する動きベクトル検出手段とを有し、前記移動量予測手段は、前記着目対象推定手段の推定結果に基づいて、前記着目対象の移動量を予測し、前記リサイズ率決定手段は、前記着目対象の移動量に基づいて、前記リサイズ率を決定することを特徴とする。
本発明によれば、背景や主被写体の動きが激しいダイナミックな撮影シーンにおいても、着目対象に対する動きベクトルを、精度を維持しながら、途切れることなく安定的に検出することができる。
以下、本発明の実施例について撮像装置をカメラを例として、図面を参照しながら説明する。
[第1の実施形態]
図1に、本発明の第1の実施形態である画像処理装置の構成を示す。
図1に、本発明の第1の実施形態である画像処理装置の構成を示す。
画像入力部101は画像を入力する。
着目点設定部102は、画像入力部101からの入力画像データに対して、所定数の着目点の座標を設定する。
着目点設定部102は、画像入力部101からの入力画像データに対して、所定数の着目点の座標を設定する。
画像メモリ103は、画像入力部101からの入力画像データを1フレームまたは複数のフレーム分、一時的に記憶保持する。
リサイズ部104は、リサイズ率決定部109により決定されるリサイズ率に基づいて、画像入力部101および画像メモリ103からの入力画像、および着目点設定部102からの着目点座標をリサイズする。
動きベクトル検出部105は、リサイズ部104でリサイズされた着目点設定部102からの着目点座標に基づいて、同じくリサイズ部104でリサイズされた画像入力部101および画像メモリ103からの入力画像データに対して動きベクトルを検出する。動きベクトル検出には、例えばテンプレートマッチングを使用する。
撮像装置情報取得部106は、撮影状況を推定するために必要な撮像装置情報を取得する。撮像装置情報とは、例えば撮影モード、主被写体情報、シャッタースピード、焦点距離、奥行き情報、慣性センサ情報、ユーザ指示情報である。
着目対象推定部107は、撮像装置情報取得部106が取得した撮像装置情報に基づいて、撮影時に背景と主被写体のいずれに着目して動きベクトル検出を行うべきかを推定する。
移動量予測部108は、着目対象推定部107の推定結果に基づいて、動きベクトル検出部105により検出すべき移動量を予測する。
リサイズ率決定部109は、移動量予測部108からの移動量に基づいて、動きベクトル検出に用いる画像および着目点座標に対するリサイズ率を決定し、リサイズ部104に出力する。
これらの構成要素101〜109を含む画像処理装置100の動作について、図2に示すフローチャートを用いて詳細に説明する。
ステップS201において、撮像装置情報取得部106は、撮影状況を推定するために必要な撮像装置情報を取得する。撮像装置情報の例として、撮影モード、主被写体情報、シャッタースピード、焦点距離、奥行き情報、慣性センサ情報、ユーザ指示情報を用いるものとする。
主被写体情報は例えば、主被写体の人物らしさ、主被写体の大きさ、主被写体の動きである。主被写体の人物らしさおよび大きさは、例えば主被写体を人物の顔とする場合、主被写体の色や輪郭の情報を用いる公知の顔検出技術によって得る事ができる。主被写体の動きは、顔検出位置の変化量か、あるいは、画像フレーム間で後述の動きベクトル検出技術により検出される動きベクトルから得る事ができる。
また、奥行き情報は、例えば測距センサを用いるか、あるいは、撮像画像から公知のSfM(Structure from Motion)により推定できる。
ステップS202において、着目対象推定部107は、ステップS201で取得した撮像装置情報に基づいて、撮影状況を推定し、背景と主被写体のいずれに着目して動きベクトル検出を行うべきかを推定する。
撮像装置情報に基づいて、着目対象を推定する方法について説明する。ここでは、まず撮像装置情報ごとに着目対象が背景である度合いを表す背景度合いと、着目対象が主被写体である度合いを表す主被写体度合いを算出する。ここでは、背景度合いと主被写体度合いを合計して1になる数値として表現する。なお、背景度合いと主被写体度合いのいずれか一方だけを算出するようにしても良い。
撮影モードについては、例えば、ポートレートモードの場合には人物(=主被写体)に着目して撮影している可能性が高いので、主被写体度合を高く(例えば0.9)、背景度合いを低く(例えば0.1)する。一方、風景モードの場合には風景に着目して撮影している可能性が高いため、主被写体度合いを低く(例えば0.1)、背景度合いを高く(例えば0.9)する。このように、撮影モードによって可能性の高い撮影状況を想定することで、背景度合いおよび主被写体度合いを決められる。
主被写体の人物らしさについては、主被写体がより人物らしいほど、主被写体に着目して撮影している可能性が高いので、主被写体度合いを高く(例えば0.7)、背景度合いを低く(例えば0.3)する。
主被写体の大きさについては、主被写体が大きいほど、主被写体に着目して撮影している可能性が高いので、主被写体度合いを高く(例えば0.8)、背景度合いを低く(例えば0.2)する。
主被写体の動きについては、主被写体の動きが小さいほど、主被写体を捉えようとカメラを構えていることが想定され、主被写体に着目して撮影している可能性が高いので、主被写体度合いを高く(例えば0.6)、背景度合いを低く(例えば0.4)する。
シャッタースピードについては、シャッタースピードが速いほど、高速に移動する主被写体に着目して撮影している可能性が高いので、主被写体度合いを高く(例えば0.7)、背景度合いを低く(例えば0.3)する。
以上までの撮像装置情報と着目対象の関係について表1にまとめた。( )内の数値は、前述した背景度合い/主被写体度合いの一例を示している。
次に、焦点距離と奥行き情報については、それぞれ単独では撮影者の意図を汲み取ることが難しい。そこで、両者を組み合わせて着目対象を推定する方法の一例を説明する。
焦点距離f[mm]と、主被写体までの距離(奥行き情報)d[mm]が与えられている場合、撮像面上での主被写体の大きさをm[mm]とすれば、実際の主被写体の大きさM[mm]は、以下の式(1)で算出できる。
実際の主被写体の大きさが分かれば、像面上での主被写体の大きさや焦点距離との関係から、撮影者の意図を汲み取ることができる。例えば、実際の主被写体の大きさは小さいが、像面上での主被写体の大きさが大きく、焦点距離が長い場合は、主被写体に非常に着目していることになる。そのため、実際の主被写体の大きさが小さい、かつ、像面上での主被写体の大きさが大きい、かつ、焦点距離が長いほど主被写体度合いを高く、背景度合いを低くする。
慣性センサ情報についても、単独では撮影者の意図を汲み取ることが難しい。そこで、慣性センサ情報と主被写体の動き情報を組み合わせて着目対象を推定する方法の一例を説明する。撮影者の着目対象が主被写体である場合、主被写体を画面の定位置に収めようとカメラを動かすため、主被写体の動きはカメラの動きに比べて相対的に小さくなる。
よって、慣性センサ情報により得られるフレーム画像間のカメラの移動量に対して、主被写体の移動量が小さくなるほど、主被写体を捉えようとカメラを構えていることが想定される。この場合は、主被写体に着目して撮影している可能性が高いので、主被写体度合いを高く、背景度合いを低くする。
着目対象の推定に利用できる撮像装置情報が複数ある場合、撮像装置情報ごとに得られる背景度合いおよび主被写体度合いに対してそれぞれ重み付け加算を行い、最終的な背景度合いおよび主被写体度合いを算出すれば良い。重みは、例えば各情報源の確からしさに基づいて設定すれば良い。
表1の例で説明する。撮影モード、主被写体の人物らしさ、主被写体の大きさ、主被写体の動き、シャッタースピードのそれぞれから得られる背景度合いをDa、Db、Dc、Dd、De、重みをGa、Gb、Gc、Gd、Geとする。最終的な背景度合いDは、以下の式(2)で計算できる。
例えば、重みをGa=0.3、Gb=0.2、Gc=0.2、Gd=0.1、Ge=0.2とする。ここで、重みは合計が1になるよう正規化した。いま撮影モードが風景モード(Da=0.9)、主被写体の人物らしさが高い(Db=0.3)、主被写体の大きさが小さい(Dc=0.8)、主被写体の動きが小さい(Dd=0.4)、シャッタースピードが遅い(De=0.7)とすれば、式(2)よりD=0.6となる。最終的な主被写体度合いについても同じように算出できる。
各情報源の確からしさが同一または不明の場合は、全ての重みを同じにすれば良い。
各情報源の確からしさが同一または不明の場合は、全ての重みを同じにすれば良い。
なお、撮像装置情報としてユーザ指示情報を用いる場合、例えば背景と主被写体の着目度合いをユーザに指示させることで、推定することなく背景度合いと主被写体度合いを決めることができる。
ステップS203では、移動量予測部108は、ステップS202で得られた背景度合いおよび主被写体度合いに基づいて、動きベクトル検出部105により検出すべき移動量を予測する。
移動量予測部108は、最初にステップS201で得られた撮像装置情報を用いて、背景および主被写体の移動量をそれぞれ予測する。
背景の移動量には、例えば、慣性センサ情報から得られる振れ角度θと、焦点距離fを用いることで、撮像面上での背景の移動量をftanθとして予測できる。
一方、主被写体の移動量には、例えば、前述の主被写体情報のうち主被写体の動き量を予測値として用いることができる。
次に移動量予測部108は、ステップS202で得られた背景度合いおよび主被写体度合いに基づいて、最終的な予測移動量を算出する。
背景度合いをα(このとき前述の通り主被写体度合いは1−α)、背景の予測移動量をA、主被写体の予測移動量をBとすれば、最終的な予測移動量Xは、例えば式(3)のように求められる。
式(3)より、α=1のときX=A、α=0のときX=Bとなる。よって、着目対象が背景であれば背景の予測移動量、着目対象が主被写体であれば主被写体の予測移動量が支配的になり、着目対象を考慮した上で必要な移動量を算出できる。
ステップS204において、リサイズ率決定部109は、ステップS203で得られた移動量に基づいて、リサイズ部104のリサイズ率を決定する。
移動量Xとリサイズ率Rの関係を図3に示す。Xthは画像をリサイズしない場合(=リサイズ率が1.0の場合)のサーチ領域を表す。
図3に示すように、移動量XがXth以下の場合は、画像をリサイズしなくてもサーチ領域が足りるため、リサイズ率R=1.0とすれば良い。一方、移動量XがXthを上回る場合は、サーチ領域が不足するため、リサイズ率Rを移動量Xに反比例するよう小さくすれば良い。これらの関係は式(4)のように表現できる。
よって、ステップS203で得られた移動量をX0(>Xth)とすれば、そのときに必要なリサイズ率R0はXth/X0と決定される。
次にステップS201〜S204と並行して、ステップS205において、着目点設定部102は、画像入力部101により入力された画像を分割し、この分割された複数の画像領域ごとに所定数の着目点を設定する。着目点としては、例えば各領域における特徴点を用いれば良い。
図4(a)において、白い矩形領域が特徴点抽出を行う特徴抽出領域であり、特徴点抽出領域の周辺には斜線で示す周辺領域を設けている。これは、抽出される特徴点401の位置によっては、後述する動きベクトル検出に用いるテンプレート領域およびサーチ領域が特徴抽出領域をはみ出すため、そのはみ出し分だけ設けた余剰の画像領域である。
図4(b)は格子状に分割された画像領域ごとに1個の特徴点401を抽出する様子を示している。
特徴点401の抽出方法としては、公知の特徴子でよく、例えばHarris corner検出器もしくはShi and Tomasiの手法で説明する。これらの手法では、画像の画素(x,y)における輝度値をI(x,y)と表現し、画像に対して水平および垂直の1次微分フィルタを適用した結果Ix,Iyから、式(5)で示す自己相関行列Hを作成する。
式(5)において、Gは式(6)に示すガウス分布による平滑化を表し、σは標準偏差を表す。
Harris検出器は、式(7)に示す特徴評価式により、特徴量が大きくなる画素を特徴点401として抽出する。
式(7)において、detは行列式を、trは対角成分の和を表す。また、αは定数であり、実験的に0.04〜0.15の値が良いとされている。
一方、Shi and Tomasiは、式(8)に示す特徴評価式を用いる。
式(8)は、式(5)の自己相関行列Hの固有値λ1,λ2のうち小さい方の固有値を特徴量とすることを表す。Shi and Tomasiを用いる場合でも、特徴量が大きくなる画素を特徴点401として抽出する。
分割された画像領域ごとに、式(7)または式(8)により画素の特徴量を算出し、特徴量が高い方から所定数の画素を特徴点として抽出し、着目点として設定する。
ステップS206において、リサイズ部104は、画像入力部101および画像メモリ103から入力される画像と、ステップS205で設定された着目点の座標に対して、ステップS204で決定されたリサイズ率に基づいて、リサイズ処理を行う。
ステップS207において、動きベクトル検出部105は、ステップS206でリサイズされた画像および着目点を用いて、テンプレートマッチングにより動きベクトルを検出する。
図5には、テンプレートマッチングの概要を示している。図5(a)は2つのベクトル検出画像のうち一方である基準画像を示し、図5(b)は他方である参照画像を示している。ここでは、基準画像として画像メモリ103からリサイズ部104を通じて入力されるフレーム画像、参照画像として画像入力部101からリサイズ部104を通じて入力される画像データを用いる。これらを対比することにより、過去のフレーム画像から現在のフレーム画像への動きベクトルを算出する。
なお、基準画像と参照画像は逆に入れ替えてもよく、その場合は現在のフレーム画像から過去のフレーム画像への動きベクトルを算出することを意味する。
動きベクトル検出部105は、基準画像にテンプレート領域501を、参照画像にサーチ領域502を配置し、該テンプレート領域501と該サーチ領域502との相関値を算出する。ここで、テンプレート領域501は、ステップS206でリサイズされた着目点の座標を中心に配置し、サーチ領域はテンプレート領域を上下左右均等に包含するように所定の大きさで配置すれば良い。
本実施形態では、相関値の算出方法として、差分絶対値和(Sum of Absolute Difference:以下、SADと略す)を使用する。SADの計算式を式(9)に示す。
式(9)において、f(i,j)はテンプレート領域501内の座標(i,j)での輝度値を示している。また、g(i,j)はサーチ領域502内において相関値の算出対象となる領域(以下、相関値算出領域という)503内の各座標での輝度値を示す。SADでは、サーチ領域502および相関値算出領域503内の輝度値f(i,j),g(i,j)の差の絶対値を計算し、その総和を求めることで相関値S_SADを得る。相関値S_SADの値が小さいほど、テンプレート領域501と相関値算出領域503のテクスチャの類似度が高いことを表す。
なお、相関値の算出にSAD以外の方法を用いてもよく、例えば差分二乗和(SSD)や正規化相互相関(NCC)を用いてもよい。
動きベクトル検出部105は、サーチ領域502の全域にて相関値算出領域503を移動させて相関値を算出する。これにより、サーチ領域502に対して図6に示すような相関値マップを作成する。
図6(a)はサーチ領域502の座標系で算出した相関値マップを示しており、X軸とY軸は相関値マップ座標、Z軸は各座標での相関値の大きさを表している。また図6(b)は、図6(a)の等高線を示したものである。
図6(a)および図6(b)において、相関値が最も小さいのは極小値601であり、サーチ領域502内で極小値601が算出された領域にはテンプレート領域501と非常に類似したテクスチャが存在していると判定できる。602は二番目の極小値、603は三番目の極小値を表わしており、これらは601に次いで類似したテクスチャが存在していることを意味する。
このように、動きベクトル検出部105は、テンプレート領域501とサーチ領域502との間で相関値を算出し、その値が最も小さくなる相関値算出領域503の位置を判定する。これにより、基準画像上のテンプレート領域501の参照画像上での移動先を特定することができる。そして、基準画像上でのテンプレート領域の位置を基準とした参照画像上での移動先への方向および移動量を方向および大きさとした動きベクトルを検出することができる。
なお、ここでの動きベクトルは、ステップS206でリサイズされた画像および着目点に対して検出されている。リサイズ前の元の状態での動きベクトルが必要な場合は、本ステップS207で検出された動きベクトルに対してリサイズ率の逆数を乗算すれば良い。
最後のステップS208では、画像処理装置100は、最終フレームまで処理が完了したかどうかを判定する。最終フレームまで処理が完了していない場合はステップS201に移行する。
以上説明したように、本実施形態では、カメラ情報に基づいて着目対象を推定し、着目対象の予測移動量に応じてベクトル検出に用いる画像をリサイズすることで、背景だけでなく主被写体に対しても安定的に動きベクトルを検出することができる。
[第2の実施形態]
図7に、本発明の第2の実施形態である画像処理装置の構成を示す。同図において、図1に示した構成要素と共通するものについては、図1と同符号を付す。
図7に、本発明の第2の実施形態である画像処理装置の構成を示す。同図において、図1に示した構成要素と共通するものについては、図1と同符号を付す。
本実施形態の画像処理装置は、図1に示した構成に加えて、予測誤差推定部701を有する。本実施形態では、第1の実施形態と異なる処理を行う部分についてのみ説明する。
本実施形態が第1の実施形態と異なるのは、予測誤差推定部701が着目対象の予測移動量の誤差を推定し、その推定結果に基づいて、リサイズ率決定部109が1つ以上のリサイズ率を決定する点である。
第1の実施形態では、着目対象の予測移動量に基づいて1つのリサイズ率を決定した。しかしながら、移動量の予測には誤差が生じる場合がある。例えば、人物のような主被写体では、フレーム画像間で人物が不規則な運動を行うことで、予測した移動量が大幅にずれてしまう場合が考えられる。また、カメラ情報から推定したユーザの意図が実際と異なり、所望の着目対象の移動量を予測できていない場合も考えられる。
そこで、本実施形態では、移動量の予測誤差を考慮して、1つ以上のリサイズ率を決定し、1つ以上のリサイズ率に基づいて動きベクトル検出を行うことで、移動量の予測誤差が大きい場合でも、安定的に動きベクトルを検出することを目的とする。
図8に示すフローチャートを用いて実施形態2について詳細に説明する。同図において図2に示したステップと共通するものについては、図2と同符号を付し説明を割愛する。
ステップS801では、予測誤差推定部701が、ステップS201で得られたカメラ情報を用いて、ステップS203で得られた着目対象の移動量の予測誤差を推定する。
予測誤差の要因としては、前述の通り、主被写体の不規則な動きやユーザ意図の誤推定が挙げられる。
前者に関しては、例えば、フレーム間の主被写体の動きの相関が低いほど、主被写体が不規則に動いていることを表すため、予測誤差が大きくなると考えられる(図9(a))。相関は、例えば、フレーム間の動きベクトルの大きさと向きの変化から算出できる。また、主被写体の人物らしさが高くなるほど、主被写体が不規則に動く可能性が高くなるため、予測誤差が大きくなると考えられる(図9(b))。
後者に関しては、例えば、推定される着目対象の変化頻度が高くなるほど、ユーザ意図が正しく推定できていない可能性が高まるため、予測誤差が大きくなると考えられる(図9(c))。また、背景度合いと主被写体度合いの差分が小さいほど、両者が拮抗しており、ユーザの意図が明確に推定できていないことを示しているため、予測誤差が大きくなると考えられる(図9(d))。
ステップS204aにおいて、リサイズ率決定部109は、ステップS203で予測された移動量および、ステップS801で推定された予測誤差に基づいて、リサイズ部104のリサイズ率を1つ以上決定する。
決定するリサイズ率の個数は、例えば予測誤差の大きさに基づいて決めれば良い。例えば、予測誤差が大きくなるほど、リサイズ率の個数を多くする。
1つ以上のリサイズ率の決定方法について、図10を用いて説明する。
図3と同様に、Xthは画像をリサイズしない場合(=リサイズ率が1.0の場合)のサーチ領域、X0はステップS203で予測された移動量、R0は移動量X0に対して必要なリサイズ率を表す。
図3と同様に、Xthは画像をリサイズしない場合(=リサイズ率が1.0の場合)のサーチ領域、X0はステップS203で予測された移動量、R0は移動量X0に対して必要なリサイズ率を表す。
図10では移動量X0に基づいて、2つのリサイズ率R1およびR2を決定することを考える。移動量X0に予測誤差ΔXが含まれるとすれば、移動量の下限X1および上限X2を、例えば、式(10)のように設定できる。
ここで、kは移動量X0に対する予測誤差ΔXの偏り度合いを表し、0≦k≦1である。k=0.5の場合、移動量X0に対して予測誤差は偏りがなく均等であることを意味する。kは、例えば、ステップS203で移動量X0の予測に用いた撮像装置情報に応じて変更しても良い。
リサイズ率R1、R2は、式(10)のX1、X2をそれぞれ式(4)に代入することで、式(11)のように決定できる。
ここで、各リサイズ率の関係はR2<R0<R1である。R2はR0よりも小さい(画像がより縮小される)ため、動きベクトルの検出精度は低下するが、より大きな移動量に対応することができる。一方、R1はR0よりも大きい(画像がより拡大される)ため、対応できる移動量は小さくなるが、動きベクトルの検出精度は向上する。
以上のようにして、移動量X0に対して予測誤差を考慮し、移動量と検出精度が両立するように複数のリサイズ率を決定することができる。
なお、図10では2つのリサイズ率を決定する例を説明したが、3つ以上のリサイズ率を決定しても良い。その場合は、例えば、移動量の下限X1と上限X2に加え、中間の値X3を設定して、それに対応するリサイズ率R3を求めれば良い。
ステップS206aでは、リサイズ部104は、画像入力部101および画像メモリ103から入力される画像と、ステップS205で設定された着目点の座標に対して、ステップS204aで決定された複数のリサイズ率に基づいて、複数のリサイズ処理を行う。その結果、複数のリサイズ率の画像および着目点の座標が得られる。
ステップS207aでは、動きベクトル検出部105は、ステップS206aで複数のリサイズ率によりリサイズされた画像および着目点を用いて、テンプレートマッチングにより動きベクトルを検出する。
ここでは、リサイズ率R1でリサイズされた画像と着目点、リサイズ率R2でリサイズされた画像と着目点の組をそれぞれ順次または並列に処理して動きベクトル検出を行う。
検出された動きベクトルは、それぞれ異なるリサイズ率の画像および着目点に対するものなので、各リサイズ率の逆数を乗じることで、リサイズ前の元の状態での動きベクトルに換算できる。
以上説明したように、本実施形態では、移動量の予測誤差を考慮して、複数のリサイズ率を決定し、複数のリサイズ率に基づいて動きベクトル検出を行うことで、第1の実施形態よりもさらに安定的に動きベクトルを検出できる効果が得られる。
100 画像処理装置
101 画像入力部
102 着目点設定部
103 画像メモリ
104 リサイズ部
105 動きベクトル検出部
106 撮像装置情報取得部
107 着目対象推定部
108 移動量予測部
109 リサイズ率決定部
101 画像入力部
102 着目点設定部
103 画像メモリ
104 リサイズ部
105 動きベクトル検出部
106 撮像装置情報取得部
107 着目対象推定部
108 移動量予測部
109 リサイズ率決定部
Claims (7)
- 撮像装置情報を取得する撮像装置情報取得手段と、
前記撮像装置情報に基づいて撮影時の着目対象を推定する着目対象推定手段と、
前記着目対象の移動量を予測する移動量予測手段と、
入力画像に対して着目点座標を設定する着目点設定手段と、
リサイズ率を決定するリサイズ率決定手段と、
前記入力画像および前記着目点座標を前記リサイズ率でリサイズするリサイズ手段と、
前記リサイズ手段によりリサイズされた前記入力画像および前記着目点座標に基づいて、動きベクトルを検出する動きベクトル検出手段とを有し、
前記移動量予測手段は、前記着目対象推定手段の推定結果に基づいて、前記着目対象の移動量を予測し、
前記リサイズ率決定手段は、前記着目対象の移動量に基づいて、前記リサイズ率を決定することを特徴とする画像処理装置。 - 前記撮像装置情報は、撮影モード、主被写体情報、シャッタースピード、焦点距離、奥行き情報、慣性センサ情報、ユーザ指示情報の少なくともいずれかを含むことを特徴とする請求項1に記載の画像処理装置。
- さらに前記撮像装置情報に基づいて、前記着目対象の移動量の予測誤差を推定する予測誤差推定手段を有することを特徴とする請求項1に記載の画像処理装置。
- 前記リサイズ率決定手段は、前記予測誤差推定手段による前記着目対象の移動量の予測誤差に応じて、前記リサイズ率を決定することを特徴とする請求項3に記載の画像処理装置。
- 前記リサイズ率決定手段は、前記予測誤差推定手段による前記着目対象の移動量の予測誤差が小さいほど、前記動きベクトル検出手段によって検出可能な移動量が、予測された前記着目対象の移動量に近づくよう、前記リサイズ率を決定することを特徴とする請求項3に記載の画像処理装置。
- 前記リサイズ率決定手段は、前記予測誤差推定手段による予測誤差が大きいほど、リサイズ率の個数を多くすることを特徴とする請求項3に記載の画像処理装置。
- 前記リサイズ手段および前記動きベクトル検出手段は、前記リサイズ率決定手段により複数のリサイズ率が決定された場合に、各リサイズ率に対して順次もしくは並列に処理を行うことを特徴とする請求項6に記載の画像処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018060468A JP2019176261A (ja) | 2018-03-27 | 2018-03-27 | 画像処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018060468A JP2019176261A (ja) | 2018-03-27 | 2018-03-27 | 画像処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019176261A true JP2019176261A (ja) | 2019-10-10 |
Family
ID=68169766
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018060468A Pending JP2019176261A (ja) | 2018-03-27 | 2018-03-27 | 画像処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2019176261A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112672058A (zh) * | 2020-12-26 | 2021-04-16 | 维沃移动通信有限公司 | 拍摄方法及装置 |
-
2018
- 2018-03-27 JP JP2018060468A patent/JP2019176261A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112672058A (zh) * | 2020-12-26 | 2021-04-16 | 维沃移动通信有限公司 | 拍摄方法及装置 |
CN112672058B (zh) * | 2020-12-26 | 2022-05-03 | 维沃移动通信有限公司 | 拍摄方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11037325B2 (en) | Information processing apparatus and method of controlling the same | |
JP5284048B2 (ja) | 画像処理装置、撮像装置及び画像処理方法 | |
JP6894725B2 (ja) | 画像処理装置及びその制御方法、プログラム、記憶媒体 | |
KR101071352B1 (ko) | 좌표맵을 이용한 팬틸트줌 카메라 기반의 객체 추적 장치 및 방법 | |
US10839529B2 (en) | Image processing apparatus and image processing method, and storage medium | |
JP4373840B2 (ja) | 動物体追跡方法、動物体追跡プログラムおよびその記録媒体、ならびに、動物体追跡装置 | |
KR20120130788A (ko) | 멀티-카메라 교정을 위한 방법 및 장치 | |
JP7272024B2 (ja) | 物体追跡装置、監視システムおよび物体追跡方法 | |
JP2009187397A (ja) | 画像処理装置及び画像処理プログラム | |
CN108369739B (zh) | 物体检测装置和物体检测方法 | |
JP2012181710A (ja) | オブジェクト追跡装置、方法、及びプログラム | |
JP6579816B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP6178646B2 (ja) | 撮像装置及び像振れ補正処理方法 | |
JP2019176261A (ja) | 画像処理装置 | |
CN116883897A (zh) | 一种低分辨率目标识别方法 | |
JP2017016592A (ja) | 主被写体検出装置、主被写体検出方法及びプログラム | |
JP2022099120A5 (ja) | ||
JP2022099120A (ja) | 被写体追尾装置およびその制御方法 | |
JP7341712B2 (ja) | 画像処理装置、画像処理方法、撮像装置、およびプログラム | |
JP2016072924A (ja) | 画像処理装置及び画像処理方法 | |
JP2019192048A (ja) | 撮像装置 | |
JP6381212B2 (ja) | 撮像装置及びその制御方法 | |
JP2018072941A (ja) | 画像処理装置、画像処理方法、プログラム、記憶媒体 | |
JP2018072942A (ja) | 画像処理装置、画像処理方法、プログラム、記憶媒体 | |
JP6525693B2 (ja) | 画像処理装置及び画像処理方法 |