Nothing Special   »   [go: up one dir, main page]

JP5500024B2 - 画像認識方法及び装置並びにプログラム - Google Patents

画像認識方法及び装置並びにプログラム Download PDF

Info

Publication number
JP5500024B2
JP5500024B2 JP2010216148A JP2010216148A JP5500024B2 JP 5500024 B2 JP5500024 B2 JP 5500024B2 JP 2010216148 A JP2010216148 A JP 2010216148A JP 2010216148 A JP2010216148 A JP 2010216148A JP 5500024 B2 JP5500024 B2 JP 5500024B2
Authority
JP
Japan
Prior art keywords
image
histogram
gradient vector
recognition target
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010216148A
Other languages
English (en)
Other versions
JP2012073684A (ja
Inventor
直之 沢崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2010216148A priority Critical patent/JP5500024B2/ja
Publication of JP2012073684A publication Critical patent/JP2012073684A/ja
Application granted granted Critical
Publication of JP5500024B2 publication Critical patent/JP5500024B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Description

本発明は、画像認識方法及び装置並びにプログラムに関する。本発明は、コンピュータに画像認識処理を実行させるプログラムを格納したコンピュータ読み取り可能な記憶媒体にも関する。
画像認識や計測の分野では、画像に含まれる特定の画像パターンを検出する機能が用いられる。画像の回転やスケールの変化にかかわらず類似な形状を検出する従来技術としては、画像のスケール又は回転に応じた複数のテンプレートを用意しておきテンプレートマッチングを行う方法、画像の位置、スケール、回転のパラメータ空間への変換を行うハフ変換等がある。しかし、これらの類似な形状を検出する従来技術は、いずれも画像の水平及び垂直位置、回転角及びスケールの全てのパラメータ空間で画像パターンの探索処理を行うものであり、データ処理量が膨大なものになってしまう。
これに対して、近年、スケールスペース理論による画像特徴のスケールパラメータを推定する技術や、画像パターンの輝度勾配のヒストグラムから画像パターンの方向パラメータを推定する技術が提案されている。これらの提案されている技術によれば、画像パターンのスケールや回転をある程度正規化することが可能であるが、微小なスケール、回転の違い、局所的な画像パターンの変形やコントラストの変動に対しては、頑健な画像パターンのマッチングを行うことは難しい。
そこで、特に顔や人といった幾何学的な特徴の定式化が困難な一般の対象を画像中から検出する技術として、認識対象と非対象の多数サンプル画像について特定の画像特徴量の分布の差を学習することにより認識対象のみを高い認識率で検出する技術が注目されている、このような技術は、顔認識等に応用されている。しかし、人、車等の、顔に比べてパターンのバリエーションが多い対象の認識については、効果的に学習する技術は確立されていない。現在、この目的のために、HOG(Histogram of Oriented Gradient)特徴を用いた学習アルゴリズムが提案されているが、必要となる計算量が比較的多く、認識率が比較的低い。
図1は、HOG特徴の計算方法の一例を説明する図である。HOG特徴量を計算するためには、画像から輝度勾配を算出し、算出された輝度勾配の勾配強度と勾配方向から輝度の勾配方向ヒストグラムを作成し、勾配方向ヒストグラムを正規化する。具体的には、画素座標を(u,v)、図1(a)における水平方向の輝度勾配をf、図1(a)における垂直方向の輝度勾配をf、画素座標(u,v)における輝度をI(u,v)で表すと、次式に従って計算された勾配強度mと勾配方向θを用いて、例えば図1(a)のように、5×5画素で形成された領域を1セルとして図1(b)に示す輝度の勾配方向ヒストグラムを作成する。
m(u,v)={f(u,v)+f(u,v)1/2
θ(u,v)=tan−1{f(u,v)/f(u,v)}
(u,v)=I(u+1,v)−I(u−1,v)
(u,v)=I(u,v+1)−I(u,v−1)
輝度の勾配方向ヒストグラムは、例えば0°〜180°の範囲を20°毎に分割した9方向について、勾配強度mで重みを付けた頻度を累積することで作成する。次に、各セルで作成した勾配方向ヒストグラムを2×2セルで形成された領域を1ブロックとして正規化する。i行j列のセル(i,j)の特徴量(9次元)をH(i,j)={h1,h2,...、h9}とすると、k番目のブロックの特徴量(36次元)はv(k)=〔H(i,j),H(i+1,j),H(i,j+1),H(i+1,j+1)〕と表すことができる。正規化後の特徴をV(k)とした時、特徴量v(k)の正規化は次のような計算式により表すことができる。
V(k)=v(k)/{‖v(k)‖+ε1/2 (ε=1)
特徴量v(k)は、図1(c)に示すようにブロックを1セルずつ移動させることにより正規化する。このため、特徴量H(i,j)は、異なるブロックにより何度も正規化される。入力画像を30×60画素とした場合、横方向に4ブロック、縦方向に7ブロック、合計40ブロックに対して正規化を行う。各ブロック毎に正規化されたHOG特徴量は40ブロック×36次元=1440次元となる。認識対象と非認識対象の多数のサンプル画像について、上記のHOG特徴量を夫々計算し、認識対象と非認識対象を識別するための識別器を学習させることで特定対象の検出を可能とする。識別器の学習には、サポートベクタマシン(Support Vector Machine)、アダブースト(Adaptive Boosting: AdaBoost)等で行った学習アルゴリズムを用いることができる。しかし、HOG特徴を用いた画像認識では、先ず特徴量を計算するための計算量、特に正規化処理の計算量が多く、特徴ベクトルの次元数に対する識別率の効率が悪い。
特開2009−301104号公報 特開2009−151445号公報 特開平8−147469号公報
山下隆義,藤吉弘亘、「特定物体認識に有効な特徴量」、情報処理学会 研究報告 CVIM 165、pp.221-236、2008年11月
従来の認識方法では、比較的少ない計算量で効率良く認識対象を認識することは難しいという問題があった。
そこで、本発明は、比較的少ない計算量で効率良く認識対象を認識することができる画像認識方法及び装置並びにプログラムを提供することを目的とする。
本発明の一観点によれば、コンピュータによる画像認識方法であって、入力画像を複数の領域に分割し、各領域について輝度勾配ベクトルの方向を複数の区間に分割して各方向の区間について、予め複数のサンプル画像から取得済みの輝度勾配ベクトルの大きさの出現頻度に関する特徴量に基づいて、各領域の輝度勾配ベクトルの方向毎に輝度勾配ベクトルの大きさの出現頻度から得られるエントロピーを累積したヒストグラムを計算する工程と、前記ヒストグラムを認識対象と非認識対象を識別する識別器により評価して、入力画像が認識対象であるか非認識対象であるかを識別する工程を前記コンピュータに実行させることを特徴とする画像認識方法が提供される。
本発明の一観点によれば、予め複数のサンプル画像から取得済みの輝度勾配ベクトルの大きさの出現頻度に関する特徴量を記録した記憶手段と、入力画像を複数の領域に分割し、各領域について輝度勾配ベクトルの方向を複数の区間に分割して各方向の区間について、前記特徴量に基づいて、各領域の輝度勾配ベクトルの方向毎に輝度勾配ベクトルの大きさの出現頻度から得られるエントロピーを累積したヒストグラムを計算する計算手段と、前記ヒストグラムを認識対象と非認識対象を識別する識別器により評価して、入力画像が認識対象であるか非認識対象であるかを識別する識別手段を備えたことを特徴とする画像認識装置が提供される。
本発明の一観点によれば、コンピュータに画像認識処理を行わせるプログラムであって、入力画像を複数の領域に分割し、各領域について輝度勾配ベクトルの方向を複数の区間に分割して各方向の区間について、記憶部に記録された予め複数のサンプル画像から取得済みの輝度勾配ベクトルの大きさの出現頻度に関する特徴量に基づいて、各領域の輝度勾配ベクトルの方向毎に輝度勾配ベクトルの大きさの出現頻度から得られるエントロピーを累積したヒストグラムを計算する手順と、前記ヒストグラムを認識対象と非認識対象を識別する識別器により評価して、入力画像が認識対象であるか非認識対象であるかを識別する手順を前記コンピュータに実行させることを特徴とするプログラムが提供される。
開示の画像認識方法及び装置並びにプログラムによれば、比較的少ない計算量で効率良く認識対象を認識することが可能となる。
HOG特徴の計算方法の一例を説明する図である。 本発明の一実施例における画像認識装置のハードウェア構成の一例を示す図である。 一実施例におけるCPUが実行する機能を説明する機能ブロック図である。 輝度勾配ベクトルの大きさの出現頻度に関するデータの取得を説明する図である。 変換テーブルの一例を示す図である。 輝度勾配の方向ヒストグラムの生成を説明する図である。 エントロピーの累積値の一例を示す図である。 画像特徴の位置関係の拘束例を示す図である。 一実施例における画像認識処理を説明するフローチャートである。
開示の画像認識方法及び装置並びにプログラムは、入力画像を複数の領域に分割し、各領域について輝度勾配ベクトルの方向を複数の区間に分割して各方向の区間について、予め複数のサンプル画像から取得済みの輝度勾配ベクトルの大きさの出現頻度に関する特徴量に基づいて、各領域の輝度勾配ベクトルの方向毎に輝度勾配ベクトルの大きさの出現頻度から得られるエントロピーを累積したヒストグラムを計算する。計算したヒストグラムは、認識対象と非認識対象を識別する識別器により評価して、入力画像が認識対象であるか非認識対象であるかを識別する。
以下に、開示の画像認識方法及び装置並びにプログラムの各実施例を図面と共に説明する。
図2は、本発明の一実施例における画像認識装置のハードウェア構成の一例を示す図である。
画像認識装置10は、画像認識装置10全体の動作を制御するプロセッサの一例を形成するCPU(Central Processing Unit)101を有する。CPU101には、バス108を介してRAM(Random Access Memory)102、ハードディスクドライブ(HDD:Hard Disk Drive)103、グラフィック処理装置104、入力インタフェース105、補助記憶装置106、通信インタフェース107及び画像入力インタフェース(I/F:Interface)109が接続されている。
RAM102には、CPU101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。又、RAM102には、CPU101が実行する処理に必要な各種データや、CPU101が実行する演算の中間データ等が格納される。HDD103には、OSやアプリケーションプログラムが格納される。
グラフィック処理装置104には、モニタ104aが接続されている。グラフィック処理装置104は、CPU101からの命令に従って、画像をモニタ104aの画面に表示させる。入力インタフェース105には、キーボード105aとマウス105bが接続されている。入力インタフェース105は、キーボード105aやマウス105bから送られてくる命令やデータを、バス108を介してCPU101に送信する。
補助記憶装置106は、記録媒体に書き込まれた情報を読み取ったり、記録媒体に情報を書き込んだりする。補助記憶装置106で読み書きが可能な記録媒体としては、例えば、磁気記録媒体、光ディスク、光磁気記録媒体、半導体メモリ等が挙げられる。磁気記録媒体としては、例えば、ハードディスク、フレキシブルディスク、磁気テープ等が挙げられる。光ディスクとしては、例えば、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(Re-Writable)等が挙げられる。光磁気記録媒体としては、例えば、MOディスク(Magneto-Optical disk)等が挙げられる。補助記憶装置106は、図2に示すように画像認識装置10内に接続されていても、画像認識装置10の外部に接続されていても良い。
RAM102、HDD103内のディスク媒体、或いは、補助記憶装置106が読み取る記録媒体は、CPU101等のコンピュータに画像認識処理を実行させるプログラムを格納したコンピュータ読み取り可能な記憶媒体を形成する。
通信インタフェース107は、ネットワーク30に接続されている。通信インタフェース107は、ネットワーク30を介して、他のコンピュータ(図示せず)との間でデータの送受信を行うことができる。
画像入力I/F109には、カメラ(図示せず)により撮影された画像の画像データが直接、或いは、バス108を介して入力される。
図3は、本実施例におけるCPU101が実行する機能を説明する機能ブロック図である。図3に示すように、CPU101が実行する機能には、テーブル作成部21、認識対象サンプル画像記録部22、輝度勾配ベクトル計算部23、ヒストグラム計算部24、非対象サンプル画像記録部25、輝度勾配ベクトル計算部26、ヒストグラム計算部27、ヒストグラム類似度分散計算部28、認識対象サンプル特徴選択部29、非対象サンプル特徴選択部30、対象/非対象識別器学習部31、画像入力部32、入力画像記録部33、領域画像抽出部34、起動勾配ベクトル計算部35、ヒストグラム計算部36、入力画像特徴選択部37、及び対象/非対象識別部38の機能が含まれる。
図4は、輝度勾配ベクトルの大きさの出現頻度に関するデータの取得を説明する図であり、図5は、変換テーブルの一例を示す図である。
輝度勾配ベクトル大きさ変換テーブル作成部21では、先ず、図4(a)に示す如き多くのサンプル画像から図4(b)に示す如き輝度勾配ベクトルの大きさのヒストグラムを作成して記憶部に格納する。記憶部は、RAM102、HDD103内のディスク媒体、或いは、補助記憶装置106が読み取る記録媒体により形成可能である。次に、変換テーブル作成部21では、図5に示すように、図4(b)に示すヒストグラムから各輝度勾配ベクトルの大きさの情報量(以下、エントロピーと言う)Eiを計算して変換テーブル50を作成し、記憶部に格納する。エントロピーEiは、図4(b)のヒストグラムにおいて、輝度勾配ベクトルの大きさiの出現数をNiとし、ヒストグラムの輝度勾配ベクトルの総数をNとした時、次式で計算される量である。
認識対象サンプル画像記録部22では、認識対象のサンプル画像を記憶部に記録する。認識対象とは、画像認識処理の対象となる人物(例えば、顔)、車両等を指す。輝度勾配ベクトル計算部23では、認識対象サンプル画像記録部22が記憶部に記録した認識対象のサンプル画像に対して微分処理を行い、各画素の輝度勾配ベクトルを計算する。ヒストグラム計算部24では、認識対象の各サンプル画像を複数の領域(又は、セル)に分割し、各領域について、輝度勾配ベクトルの方向を複数の区間(又は、ビン)分割し、各方向のビンについて、変換テーブル50から得られる輝度勾配ベクトルの大きさのエントロピーを累積したヒストグラムを計算して記憶部に記録する。
図6は、輝度勾配の方向ヒストグラムの生成を説明する図である。図6に示す例では、図6(c)に示す認識対象の画像パターンを9個の同じ大きさの矩形領域(以下、セルと言う)R00〜R02,R10〜R12,R20〜R22に分割し、各セルR00〜R22について、輝度勾配ベクトルの方向について方向ヒストグラムHCR00〜HCAR22を作成するものとする。この際、図6(d)に示すように、0°〜180°の範囲を20°毎に分割して各方向(この例では9方向)のビンについて、当該方向を含む輝度勾配ベクトルの大きさを重みとして頻度を算出する。
先ず、図6(a)に示す複数の認識対象のサンプル画像から、予め輝度勾配ベクトルの大きさの出現頻度に関する図6(b)に示す如きデータを取得しておく。図6(b)中、縦軸は輝度勾配ベクトルの大きさの出現頻度(又は、度数)を任意単位で示し、横軸は輝度勾配ベクトルの大きさを任意単位で示す。図6(b)において、大きさmの輝度勾配ベクトルの出現頻度から得られる出現確率をPで示すと、輝度勾配ベクトルの大きさのエントロピーは−log(Pm)で表される。取得したデータに基づいて、輝度勾配ベクトルの大きさからヒストグラムのビンへの変換を行うための変換テーブルを作成しておき、変換テーブルを用いてヒストグラムを求めるようにしても良い。次に、図6(c)に示す画像パターンと、入力画像内の画像パターンと同じ大きさの各画像領域、即ち、各候補画像パターンとの間の類似性を判定するために、画像パターンを複数のセルR00〜R22に分割し、夫々のセルR00〜R22についての輝度勾配ベクトルの方向毎に輝度勾配ベクトルの大きさの出現頻度(又は、出現確率)から得られるエントロピーを累積した図6(d)に示す如きヒストグラムHR00〜HR22を各候補画像パターンのセルR00〜R22に対するヒストグラムと照合する。図6(d)中、縦軸は輝度勾配ベクトルの大きさのエントロピー−log(Pm)を任意単位で示し、横軸は輝度勾配ベクトルの大きさを任意単位で示す。
図7は、画像パターンのセルR00〜R22についての輝度勾配ベクトルの方向毎に輝度勾配ベクトルの大きさの出現頻度(又は、出現確率)から得られるエントロピーの累積値の一例を示す図である。この例では、輝度勾配ベクトルの方向毎に輝度勾配ベクトルの大きさのエントロピーを累積したヒストグラムHR00〜HR22の類似度を、このヒストグラムHR00〜HR22をエントロピーの確率分布として2つの確率分布の絶対的なバタチャリア(Bhattacharyya)類似度Bを判別する方式を用いて、絶対的な類似度として算出する。画像パターンについて1次元化したヒストグラムの各ビンの値をp(i)、候補画像パターンについて1次元化したヒストグラムの各ビンの値をq(i)、総ビン数をNで示すと、バタチャリア類似度Bは次式により求めることができる。
一方、非対象サンプル画像記録部25では、学習のための、認識対象ではないサンプル画像(以下、非認識対象のサンプル画像、或いは、非対象サンプル画像と言う)を記憶部に記録する。非認識対象とは、認識対象以外の、画像認識処理の対象とならない背景等を指す。輝度勾配ベクトル計算部26では、非対象サンプル画像記録部25が記憶部に記録した非認識対象のサンプル画像に対して微分処理を行い、各画素の輝度勾配ベクトルを計算する。ヒストグラム計算部27では、非認識対象の各サンプル画像に対して、ヒストグラム計算部24と同様に、画像を複数のセルに分割し、各セルについて、輝度勾配ベクトルの方向を複数の区間(ビン)分割し、各方向のビンについて、変換テーブル50から得られる輝度勾配ベクトルの大きさのエントロピーを累積したヒストグラムを計算して記憶部に記録する。
ヒストグラム類似度分布計算部28では、ヒストグラム計算部24が計算して記憶部に記録した認識対象の各サンプル画像の各セルのヒストグラムを用いて、先ず、各サンプル画像の対応するセルの平均ヒストグラムを計算し、次に、各サンプル画像の対応するセルのヒストグラムと平均ヒストグラムとの類似度を計算し、類似度の分散を計算して記憶部に記録する。
認識対象サンプル特徴選択部29では、ヒストグラム計算部24で計算された認識対象の各サンプル画像に対応するセルのヒストグラムから、ヒストグラム類似度分布計算部28で計算された認識対象の各サンプル画像に対応するセルの類似度の分散が一定閾値以下となるセルのヒストグラムを特徴量として選択する。更に、認識対象サンプル特徴選択部29では、選択したセルを組み合わせて平均化したヒストグラムを特徴量として追加して記憶部に記録する。
非対象サンプル特徴選択部30では、ヒストグラム計算部27で計算された非認識対象の各サンプル画像に対応するセルのヒストグラムから、ヒストグラム類似分散計算部28で計算された非認識対象の各サンプル画像に対応するセルの類似度の分散が一定閾値以下となるセルのヒストグラムを特徴量として選択する。更に、非対象サンプル特徴選択部30では、選択したセルを組み合わせて平均化したヒストグラムを特徴量として追加して記憶部に記録する。
対象/非対象識別器学習部31では、認識対象サンプル特徴選択部29で得られた認識対象のサンプル画像の特徴量と、非対象サンプル特徴選択部30で得られた非認識対象のサンプル画像の特徴量を用いて、アダブースト等のアルゴリズムに基づいて認識対象及び非認識対象を識別するための識別器を学習させる。この例では、識別器は対象/非対象識別器学習部31内に設けられているものとするが、対象/非対象識別器学習部31外に設けられてCPU101により実現されるものであっても良い。
一方、画像入力部32では、カメラ12からの入力画像をデジタルデータに変換する。入力画像記録部33では、入力画像のデジタルデータを記憶部に記録する。領域画像抽出部34では、入力画像記録部33が記憶部に記録した全画面の画像データを指定倍率で拡大又は縮小した画像内の指定された場所から、認識対象のサンプル画像と同じ大きさの画像領域を候補領域として抽出する。
輝度勾配ベクトル計算部35では、領域画像抽出装置34で抽出された候補領域の画像に対して微分処理を行い、各画素の輝度勾配ベクトルを計算する。ヒストグラム計算部36では、ヒストグラム計算部24と同様に、輝度勾配ベクトル計算部35で抽出された候補領域の画像を分割して輝度勾配ベクトルの方向毎に輝度勾配ベクトルの大きさのエントロピーを累積したヒストグラムを計算して記憶部に記録する。
入力画像特徴選択部37では、ヒストグラム計算部36で計算された非認識対象の各セルのヒストグラムから、ヒストグラム類似度分散計算部28で得られた各セルの類似度の分散が一定閾値以下となるセルのヒストグラムを特徴量として選択する。更に、入力画像特徴選択部37では、選択したセルを組み合わせて平均化したヒストグラムを特徴量として追加する。
対象/非対象識別部38では、入力画像特徴選択部37で得られた候補領域の特徴量を対象/非対象識別器学習部31で学習した識別器を用いて評価し、候補領域の画像が認識対象か否かを識別する。
例えば、変換テーブル作成部21〜対象/非対象識別器学習部31までの処理を予め実行しておけば、画像認識時には画像入力装置32〜対象/非対象識別部38までの処理を実行することで、カメラ12からの入力画像に対する画像認識処理を行うことができる。
この例では、先ず、予め任意の多数のサンプル画像から輝度勾配ベクトルの大きさの出現頻度に関するデータを取得しておく。具体的には、認識対象と非認識対象の多数の画像サンプルを用いて識別器を学習させる際に、認識対象と非認識対象の双方の各サンプル画像を複数のセルに分割し、夫々のセルについての輝度勾配ベクトルの方向毎に、輝度勾配ベクトルの大きさの出現頻度(又は、出現確率)から得られるエントロピーを累積したヒストグラムを作成する。そして、各セルについてのヒストグラムを列挙したデータを画像特徴量として用いる。このため、従来技術で必要とされるブロック毎の正規化が不要になり、特徴量の計算量と次元を大幅に削減することが可能になる。
認識対象の各サンプル画像の対応する各セルについての輝度勾配ベクトルの方向毎に、輝度勾配ベクトルの大きさの出現頻度(又は、出現確率)から得られるエントロピーを累積して作成したヒストグラムに対して、平均ヒストグラムに対する類似度の分散を算出し、類似度の分散の小さいセルのヒストグラムを選択して画像特徴量として識別器を学習させるようにしても良い。この場合、ヒストグラムの類似度の計算には、バタチャリア類似度B等を利用できる。類似度の分散が一定閾値以下で小さいセルは、認識対象のサンプル画像について、共通性の高い特徴を有するセルを意味するため、より少ない特徴量での効率的な識別器の学習が可能になる。
画像特徴量として、平均ヒストグラムに対する類似度の分散が小さいセルのヒストグラムに加えて、更にこれらのヒストグラムの類似度の分散が小さいセルを組み合わせて平均化したヒストグラムも画像特徴量として識別器を学習させても良い。ヒストグラムの類似度の分散が小さいセルを組み合わせて平均化したヒストグラムも画像特徴量として用いることで、平均ヒストグラムに対する類似度の分散が小さいセルの組み合わせは、例えば図8に示すように、認識対象の画像特徴の位置関係の拘束条件を表す特徴となるため、認識対象又は非認識対象の識別性能を向上することが可能となる。図8は、画像特徴の位置関係の拘束例を示す図であり、図6(c)と同一部分には同一符号を付し、その説明は省略する。この例では、図8中、セルR01,R10,R12が平均ヒストグラムに対する類似度の分散が小さいセルである。
図9は、本実施例における画像認識処理を説明するフローチャートである。画像認識処理は、CPU101が本実施例における画像認識方法に従って実行する。図9に示す画像認識処理は、以下のステップS1〜S13を含む。図9に示すように、先ず以下の手順で識別器を学習させる。
ステップS1では、変換テーブル作成部21が、多くのサンプル画像から図4(b)に示す如き輝度勾配ベクトルの大きさのヒストグラムを作成し、図5に示すようにヒストグラムから各輝度勾配ベクトルの大きさの情報量(エントロピー)Eiを計算して変換テーブル50を作成し、記憶部に格納する。ステップS2では、輝度勾配ベクトル計算部23,26が、サンプル画像記録部22,25が記憶部に記録した認識対象及び非認識対象のサンプル画像に対して微分処理を行い各画素の輝度勾配ベクトルを計算すると共に、ヒストグラム計算部24,27が、認識対象及び非認識対象の各サンプル画像を複数の領域(セル)に分割し、各領域について輝度勾配ベクトルの方向を複数の区間(ビン)分割して、各方向のビンについて変換テーブル50から得られる輝度勾配ベクトルの大きさのエントロピーを累積したヒストグラムを計算して記憶部に記録する。
ステップS3では、ヒストグラム類似度分布計算部28が、ヒストグラム計算部24が計算して記憶部に記録した認識対象の各サンプル画像の各セルのヒストグラムを用いて、先ず、各サンプル画像の対応するセルの平均ヒストグラムを計算し、次に、各サンプル画像の対応するセルのヒストグラムと平均ヒストグラムとの類似度を計算し、類似度の分散を計算して記憶部に記録する。又、ステップS3では、認識対象サンプル特徴選択部29が、ヒストグラム計算部24で計算された認識対象の各サンプル画像に対応するセルのヒストグラムから、ヒストグラム類似度分布計算部28で計算された認識対象の各サンプル画像に対応するセルの類似度の分散が一定閾値以下となるセルのヒストグラムを特徴量として選択すると共に、選択したセルを組み合わせて平均化したヒストグラムを特徴量として追加して記憶部に記録する。更に、ステップS3では、非対象サンプル特徴選択部30が、ヒストグラム計算部27で計算された非認識対象の各サンプル画像に対応するセルのヒストグラムから、ヒストグラム類似分散計算部28で計算された非認識対象の各サンプル画像に対応するセルの類似度の分散が一定閾値以下となるセルのヒストグラムを特徴量として選択すると共に、選択したセルを組み合わせて平均化したヒストグラムを特徴量として追加して記憶部に記録する。このようにして、ステップS3では、認識対象のサンプル画像の対応するセルのヒストグラムの類似度の分散を計算し、計算された分散に基づいて、学習に利用するセルとその組み合わせを決定する。
ステップS4では、対象/非対象識別器学習部31が、認識対象サンプル特徴選択部29で得られた認識対象のサンプル画像の特徴量と、非対象サンプル特徴選択部30で得られた非認識対象のサンプル画像の特徴量を用いて、アダブースト等のアルゴリズムに基づいて認識対象及び非認識対象を識別するための識別器を学習させる。つまり、ステップS4では、認識対象及び非認識対象のサンプル画像から選択したセルとその組み合わせに対応するヒストグラムを選択、算出し、それらのヒストグラムを用いて識別器を学習させる。
ステップS5では、画像入力部32が、カメラ12からの入力画像をデジタルデータに変換する。ステップS6では、入力画像記録部33が、入力画像のデジタルデータを記憶部に記録する。
ステップS7では、領域画像抽出部34が、入力画像記録部33が記憶部に記録した全画面の画像データを指定倍率で拡大又は縮小した画像内の指定された場所から、認識対象のサンプル画像と同じ大きさの画像領域を候補領域として抽出する。ステップS8では、輝度勾配ベクトル計算部35が、領域画像抽出装置34で抽出された候補領域の画像に対して微分処理を行い、各画素の輝度勾配ベクトルを計算する。ステップS9では、ヒストグラム計算部36が、ヒストグラム計算部24と同様に、輝度勾配ベクトル計算部35で抽出された候補領域の画像を分割して輝度勾配ベクトルの方向毎に輝度勾配ベクトルの大きさのエントロピーを累積したヒストグラムを計算して記憶部に記録する。
ステップS10では、入力画像特徴選択部37が、ヒストグラム計算部36で計算された非認識対象の各セルのヒストグラムから、ヒストグラム類似度分散計算部28で得られた各セルの類似度の分散が一定閾値以下となるセルのヒストグラムを特徴量として選択すると共に、選択したセルを組み合わせて平均化したヒストグラムを特徴量として追加する。又、ステップS10では、対象/非対象識別部38が、入力画像特徴選択部37で得られた候補領域の特徴量を対象/非対象識別器学習部31で学習した識別器を用いて評価し、候補領域の画像が認識対象か否かを識別する。このように、ステップS10では、得られたヒストグラムから、学習の段階で記憶部に記録しておいたセルの選択及び組み合わせの情報を用いて特徴量を選択し、その特徴量を識別器により評価する。
ステップS11では、識別器により評価された特徴量の尤度が閾値より大きいか否かを判定し、判定結果がYESであると処理はステップS12へ進み、判定結果がNOであると処理はステップS13へ進む。ステップS12では、特徴量の尤度が閾値より大きく認識対象であると判定されたセルの位置及び大きさを記憶部に記録し、処理はステップS13へ進む。ステップS13では、全ての候補領域の処理が完了したか否かを判定し、判定結果がNOであると、書ルはステップS7へ戻る。
このように、ステップS7〜S13では、識別器の出力により評価対象となるセルが認識対象であるか否かを判断し、認識対象であると判定された場合にはそのセルの位置と大きさを記録し、ステップS7からの処理を全ての候補領域について繰り返す。ステップS13の判定結果がYESになると、処理は終了する。
本実施例によれば、エントロピーを累積したヒストグラムを作成することにより、従来技術ではHOG特徴で必要とされるブロック毎の正規化が不要になり、特徴量の計算量と次元を大幅に削減することが可能になる。又、認識対象のサンプルについて共通性の高いセルのヒストグラムを選択することにより、更に特徴量の次元を削減することが可能になる。認識対象のサンプルについて共通性の高いセルの組み合わせたセルのヒストグラムを追加することにより、認識性能を向上させることも可能になる。
上記実施例では、画像の類似度を判定するのに画像の輝度勾配ベクトルのヒストグラムを用いているが、輝度以外の画像情報の勾配ベクトルのヒストグラムを用いるようにしても良い。例えば、画像の三原色等の色成分の強度勾配ベクトルのヒストグラムを用いることもできる。この場合、画像認識装置のハードウェア構成及び機能ブロックは、図2及び図3に示した上記実施例の場合と同様で良く、異なるのは、画像の類似度を判定するのに画像のR(赤)、G(緑)、B(青)の各色成分の強度勾配ベクトルのヒストグラムを用いる点である。又、図6(c)と同様の画像パターンのセルR00〜R22についての各色成分の強度勾配ベクトルの方向毎に強度勾配ベクトルの大きさの出現頻度(又は、出現確率)から得られるエントロピーの累積値を求める。この際、強度勾配ベクトルの方向毎にR,G,Bの色成分の強度勾配ベクトルの大きさのエントロピーを累積したヒストグラムHR00−R〜HR22−R,HR00−G〜HR22−G,HR00−B〜HR22−Bの類似度を、これらのヒストグラムHR00−R〜HR22−R,HR00−G〜HR22−G,HR00−B〜HR22−Bをエントロピーの確率分布として各色成分について2つの確率分布のバタチャリア(Bhattacharyya)類似度Bを判別する方式を用いて類似度を算出すれば良い。画像パターンについて1次元化したヒストグラムの各ビンの値をp(i)、候補画像パターンについて1次元化したヒストグラムの各ビンの値をq(i)、総ビン数をNで示すと、バタチャリア類似度Bは、色成分の共同勾配ベクトルのヒストグラムを用いる場合も上記と同様の式により求めることができる。
尚、この場合、輝度勾配ベクトルの大きさをエントロピーに変換するための変換テーブル50の代わりに、色成分の強度勾配ベクトルの大きさをエントロピーに変換するための変換テーブルを用いれば良いことは言うまでもない。
以上の実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
コンピュータによる画像認識方法であって、
入力画像を複数の領域に分割し、各領域について輝度勾配ベクトルの方向を複数の区間に分割して各方向の区間について、予め複数のサンプル画像から取得済みの輝度勾配ベクトルの大きさの出現頻度に関する特徴量に基づいて、各領域の輝度勾配ベクトルの方向毎に輝度勾配ベクトルの大きさの出現頻度から得られるエントロピーを累積したヒストグラムを計算する工程と、
前記ヒストグラムを認識対象と非認識対象を識別する識別器により評価して、入力画像が認識対象であるか非認識対象であるかを識別する工程
を前記コンピュータに実行させることを特徴とする、画像認識方法。
(付記2)
認識対象のサンプル画像の特徴量と、非認識対象のサンプル画像の特徴量を用いて、所定のアルゴリズムに基づいて前記識別器を学習させる工程
を前記コンピュータに実行させることを特徴とする、付記1記載の画像認識方法。
(付記3)
前記学習させる工程は、計算されたヒストグラムの平均に対する各ヒストグラムの類似度の分散を算出し、類似度の分散が閾値以下の領域のヒストグラムに基づいて前記識別器を学習させることを特徴とする、付記2記載の画像認識方法。
(付記4)
前記学習させる工程は、計算されたヒストグラムの平均に対する各ヒストグラムの類似度の分散を算出し、類似度の分散が閾値以下の領域のヒストグラムの平均に基づいて前記識別器を学習させることを特徴とする、付記2記載の画像認識方法。
(付記5)
予め複数のサンプル画像から取得済みの輝度勾配ベクトルの大きさの出現頻度に関する特徴量を記録した記憶手段と、
入力画像を複数の領域に分割し、各領域について輝度勾配ベクトルの方向を複数の区間に分割して各方向の区間について、前記特徴量に基づいて、各領域の輝度勾配ベクトルの方向毎に輝度勾配ベクトルの大きさの出現頻度から得られるエントロピーを累積したヒストグラムを計算する計算手段と、
前記ヒストグラムを認識対象と非認識対象を識別する識別器により評価して、入力画像が認識対象であるか非認識対象であるかを識別する識別手段
を備えたことを特徴とする、画像認識装置。
(付記6)
認識対象のサンプル画像の特徴量と、非認識対象のサンプル画像の特徴量を用いて、所定のアルゴリズムに基づいて前記識別器を学習させる手段
を更に備えたことを特徴とする、付記5記載の画像認識装置。
(付記7)
計算されたヒストグラムの平均に対する各ヒストグラムの類似度の分散を算出する手段を更に備え、
前記学習させる手段は、類似度の分散が閾値以下の領域のヒストグラムに基づいて前記識別器を学習させることを特徴とする、付記6記載の画像認識装置。
(付記8)
計算されたヒストグラムの平均に対する各ヒストグラムの類似度の分散を算出する手段を更に備え、
前記学習させる手段は、類似度の分散が閾値以下の領域のヒストグラムの平均に基づいて前記識別器を学習させることを特徴とする、付記6記載の画像認識装置。
(付記9)
コンピュータに画像認識処理を行わせるプログラムであって、
入力画像を複数の領域に分割し、各領域について輝度勾配ベクトルの方向を複数の区間に分割して各方向の区間について、記憶部に記録された予め複数のサンプル画像から取得済みの輝度勾配ベクトルの大きさの出現頻度に関する特徴量に基づいて、各領域の輝度勾配ベクトルの方向毎に輝度勾配ベクトルの大きさの出現頻度から得られるエントロピーを累積したヒストグラムを計算する手順と、
前記ヒストグラムを認識対象と非認識対象を識別する識別器により評価して、入力画像が認識対象であるか非認識対象であるかを識別する手順
を前記コンピュータに実行させることを特徴とする、プログラム。
(付記10)
認識対象のサンプル画像の特徴量と、非認識対象のサンプル画像の特徴量を用いて、所定のアルゴリズムに基づいて前記識別器を学習させる手順
を前記コンピュータに実行させることを特徴とする、付記9記載のプログラム。
(付記11)
計算されたヒストグラムの平均に対する各ヒストグラムの類似度の分散を算出する手順
を前記コンピュータに実行させ、
前記学習させる手順は、類似度の分散が閾値以下の領域のヒストグラムに基づいて前記識別器を学習させることを特徴とする、付記10記載のプログラム。
(付記12)
計算されたヒストグラムの平均に対する各ヒストグラムの類似度の分散を算出する手順
を前記コンピュータに実行させ、
前記学習させる手順は、類似度の分散が閾値以下の領域のヒストグラムの平均に基づいて前記識別器を学習させることを特徴とする、付記10記載のプログラム。
以上、開示の画像認識方法及び装置、プログラム及びコンピュータ読み取り可能な記憶媒体を実施例により説明したが、本発明は上記実施例に限定されるものではなく、本発明の範囲内で種々の変形及び改良が可能であることは言うまでもない。
12 カメラ
10 画像認識装置
101 CPU
102 RAM
103 HDD
105 入力インタフェース
106 補助記憶装置
107 通信インタフェース
109 画像入力I/F

Claims (5)

  1. コンピュータによる画像認識方法であって、
    入力画像を複数の領域に分割し、各領域について輝度勾配ベクトルの方向を複数の区間に分割して各方向の区間について、予め複数のサンプル画像から取得済みの輝度勾配ベクトルの大きさの出現頻度に関する特徴量に基づいて、各領域の輝度勾配ベクトルの方向毎に輝度勾配ベクトルの大きさの出現頻度から得られるエントロピーを累積したヒストグラムを計算する工程と、
    前記ヒストグラムを認識対象と非認識対象を識別する識別器により評価して、入力画像が認識対象であるか非認識対象であるかを識別する工程
    を前記コンピュータに実行させることを特徴とする、画像認識方法。
  2. 認識対象のサンプル画像の特徴量と、非認識対象のサンプル画像の特徴量を用いて、所定のアルゴリズムに基づいて前記識別器を学習させる工程
    を前記コンピュータに実行させることを特徴とする、請求項1記載の画像認識方法。
  3. 前記学習させる工程は、計算されたヒストグラムの平均に対する各ヒストグラムの類似度の分散を算出し、類似度の分散が閾値以下の領域のヒストグラムに基づいて前記識別器を学習させることを特徴とする、請求項2記載の画像認識方法。
  4. 予め複数のサンプル画像から取得済みの輝度勾配ベクトルの大きさの出現頻度に関する特徴量を記録した記憶手段と、
    入力画像を複数の領域に分割し、各領域について輝度勾配ベクトルの方向を複数の区間に分割して各方向の区間について、前記特徴量に基づいて、各領域の輝度勾配ベクトルの方向毎に輝度勾配ベクトルの大きさの出現頻度から得られるエントロピーを累積したヒストグラムを計算する計算手段と、
    前記ヒストグラムを認識対象と非認識対象を識別する識別器により評価して、入力画像が認識対象であるか非認識対象であるかを識別する識別手段
    を備えたことを特徴とする、画像認識装置。
  5. コンピュータに画像認識処理を行わせるプログラムであって、
    入力画像を複数の領域に分割し、各領域について輝度勾配ベクトルの方向を複数の区間に分割して各方向の区間について、記憶部に記録された予め複数のサンプル画像から取得済みの輝度勾配ベクトルの大きさの出現頻度に関する特徴量に基づいて、各領域の輝度勾配ベクトルの方向毎に輝度勾配ベクトルの大きさの出現頻度から得られるエントロピーを累積したヒストグラムを計算する手順と、
    前記ヒストグラムを認識対象と非認識対象を識別する識別器により評価して、入力画像が認識対象であるか非認識対象であるかを識別する手順
    を前記コンピュータに実行させることを特徴とする、プログラム。
JP2010216148A 2010-09-27 2010-09-27 画像認識方法及び装置並びにプログラム Expired - Fee Related JP5500024B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010216148A JP5500024B2 (ja) 2010-09-27 2010-09-27 画像認識方法及び装置並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010216148A JP5500024B2 (ja) 2010-09-27 2010-09-27 画像認識方法及び装置並びにプログラム

Publications (2)

Publication Number Publication Date
JP2012073684A JP2012073684A (ja) 2012-04-12
JP5500024B2 true JP5500024B2 (ja) 2014-05-21

Family

ID=46169817

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010216148A Expired - Fee Related JP5500024B2 (ja) 2010-09-27 2010-09-27 画像認識方法及び装置並びにプログラム

Country Status (1)

Country Link
JP (1) JP5500024B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6080580B2 (ja) * 2013-02-07 2017-02-15 三菱電機株式会社 パターン認識装置
JP6069582B2 (ja) 2014-03-25 2017-02-01 富士通フロンテック株式会社 生体認証装置、生体認証方法、及びプログラム
EP3125192B1 (en) 2014-03-25 2023-05-10 Fujitsu Frontech Limited Biometric authentication device, biometric authentication method, and program
JP6431044B2 (ja) * 2014-03-25 2018-11-28 富士通フロンテック株式会社 生体認証装置、生体認証方法、及びプログラム
WO2015145590A1 (ja) * 2014-03-25 2015-10-01 富士通フロンテック株式会社 生体認証装置、生体認証方法、及びプログラム
KR102172321B1 (ko) 2014-05-20 2020-10-30 삼성전자주식회사 데이터 중복 제거 방법
KR101646689B1 (ko) * 2015-01-29 2016-08-08 국민대학교산학협력단 상대적 독립성을 이용한 누적 엔트로피 평가 장치 및 방법
JP6527421B2 (ja) * 2015-08-04 2019-06-05 日本放送協会 人物認識装置及びそのプログラム
JP6332702B2 (ja) * 2016-02-15 2018-05-30 セコム株式会社 空間認識装置
JP6332704B2 (ja) * 2016-02-29 2018-05-30 セコム株式会社 物体検出装置
CA3024562A1 (fr) * 2016-05-17 2017-11-23 Kerquest Procede d'authentification augmentee d'un sujet materiel
CN114897797A (zh) * 2022-04-24 2022-08-12 武汉海微科技有限公司 印刷电路板的缺陷检测方法、装置、设备及存储介质
CN114577191B (zh) * 2022-05-06 2022-07-12 成都纵横通达信息工程有限公司 基于地理空间信息数据的测绘数据采集方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006098152A (ja) * 2004-09-29 2006-04-13 Dainippon Screen Mfg Co Ltd 欠陥検出装置および欠陥検出方法
JP5396960B2 (ja) * 2009-03-27 2014-01-22 富士通株式会社 画像処理プログラム、画像処理方法および画像処理装置
JP5310485B2 (ja) * 2009-10-30 2013-10-09 富士通株式会社 画像処理方法及び装置並びにプログラム

Also Published As

Publication number Publication date
JP2012073684A (ja) 2012-04-12

Similar Documents

Publication Publication Date Title
JP5500024B2 (ja) 画像認識方法及び装置並びにプログラム
JP4166253B2 (ja) 物体検出装置、物体検出方法、および物体検出用プログラム
US8718324B2 (en) Method, apparatus and computer program product for providing object tracking using template switching and feature adaptation
US6961466B2 (en) Method and apparatus for object recognition
JP4991923B2 (ja) 画像処理方法及び装置
JP6075190B2 (ja) 画像処理方法及び装置
US20140029855A1 (en) Image processing apparatus, image processing method, and program
JP2012032370A (ja) 欠陥検出方法、欠陥検出装置、学習方法、プログラム、及び記録媒体
WO2009095168A1 (en) Detecting facial expressions in digital images
CN110533039B (zh) 一种车牌的真伪检测方法、装置及设备
JP6095817B1 (ja) 物体検出装置
JP2017138989A (ja) 画像に含まれるテキストを検出する方法、装置及びコンピュータ読み取り可能な記録媒体
JP2008102611A (ja) 画像処理装置
JP5310485B2 (ja) 画像処理方法及び装置並びにプログラム
JP2008003749A (ja) 特徴点検出装置および方法並びにプログラム
US8731326B2 (en) Object recognition system and method
JP2010165052A (ja) 画像処理装置及び画像処理方法
CN102314591A (zh) 静止前景物体的检测方法和设备
WO2019188458A1 (en) Method, system, and computer readable medium for performance modeling of crowd estimation techniques
JP2011165170A (ja) 対象物検出装置及びプログラム
CN113129332A (zh) 执行目标对象跟踪的方法和装置
CN112926463B (zh) 一种目标检测方法和装置
KR101521136B1 (ko) 얼굴 인식 방법 및 얼굴 인식 장치
JP5027201B2 (ja) テロップ文字領域検出方法,テロップ文字領域検出装置およびテロップ文字領域検出プログラム
JP2014010633A (ja) 画像認識装置、画像認識方法、及び画像認識プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130702

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140225

R150 Certificate of patent or registration of utility model

Ref document number: 5500024

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees