Nothing Special   »   [go: up one dir, main page]

JP4612477B2 - パターン認識装置、パターン認識方法、パターン認識プログラム、及びパターン認識プログラムの記録媒体 - Google Patents

パターン認識装置、パターン認識方法、パターン認識プログラム、及びパターン認識プログラムの記録媒体 Download PDF

Info

Publication number
JP4612477B2
JP4612477B2 JP2005163719A JP2005163719A JP4612477B2 JP 4612477 B2 JP4612477 B2 JP 4612477B2 JP 2005163719 A JP2005163719 A JP 2005163719A JP 2005163719 A JP2005163719 A JP 2005163719A JP 4612477 B2 JP4612477 B2 JP 4612477B2
Authority
JP
Japan
Prior art keywords
recognition
distribution
principal component
component vector
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005163719A
Other languages
English (en)
Other versions
JP2006252504A (ja
Inventor
慎吾 安藤
良規 草地
章 鈴木
賢一 荒川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005163719A priority Critical patent/JP4612477B2/ja
Publication of JP2006252504A publication Critical patent/JP2006252504A/ja
Application granted granted Critical
Publication of JP4612477B2 publication Critical patent/JP4612477B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Description

本発明は、自然画像中に含まれる、複雑に変形する物体を精度よく識別するためのパターン認識技術に関するものである。
近年、携帯電話にカメラ機能が搭載され、いつでも手軽に写真データを取得、保存することができるようになった。この機能をさらに活用する手段として、写真データからそこに写る物体を認識し、その物体に関連したデータを提供するというサービスが考えられる。
ここで、認識の対象となる物体には剛体と非剛体が存在する。例えば、袋詰めの商品や本、雑誌、ポスターなどは非剛体である。非剛体物体は、その変形が複雑多岐にわたるため、画像から認識することが大変難しい。従来、このような物体を認識するには、色ヒストグラムなど、空間情報を排除した特徴量が用いられてきた(例えば、非特許文献1参照。)。
村瀬 洋,V.V.Vinod、「局所色情報を用いた高速物体探索−アクティブ探索法」、信学論(D−II),Vol.J81−D−II,no.9,pp.2035−2042,1998
色ヒストグラムを用いるためには、物体がどの範囲に存在するかをあらかじめ知っておく必要がある。この情報が既知でない場合、画像全体でヒストグラムを集計するか、又は矩形等の探索窓を設けてこの探索窓をスキャンさせることなどで対応する必要がある。
しかし、これらの方法だと、矩形領域内に背景成分が混在してしまうおそれがある。そして、この背景混在により特徴量にノイズ成分が付加され、識別性能を大きく損ねてしまうことになる。特に非剛体物体を対象にした場合、背景混在の可能性は著しく高くなると考えられる。
また、色ヒストグラムは空間情報を全く持たないため、識別に用いる情報として必ずしも十分でなく、汎用性があまり高くないという問題点も有している。
本発明は上記の問題点に鑑みてなされたものであり、非剛体物体のような複雑に変形する物体をより高精度に認識できるパターン認識技術を提供することを目的とする。
上記目的を達成するために、本発明では、図1のように、対象物体の局所領域に注目できるような比較的小さな窓を設け、局所パターン情報の集合体として物体の特徴を表現する。
一般的には、パターン認識は物体の登録をする登録過程と、新たに入力された未知の物体と登録された物体とのマッチングを行う認識過程とに分けられる。登録過程においては、対象物体の全ての局所領域に対してそれぞれ特徴抽出し、特徴空間にプロットする。そして、その時できあがる特徴空間上の分布に関する情報をメモリに蓄積する。一方、認識過程においては、登録した物体と同様の方法で特徴空間上の分布を求め、それら分布どうしの類似度を計算することで物体の認識又は識別を行う。
登録過程で対象物体の領域を(例えば、背景差分や手入力のマニュアル切り出しによって)指定することは簡単だが、認識過程での領域指定は基本的に困難である。このため、登録過程で得られる分布は、純粋に対象物体に関する分布と考えてよいが、認識過程で得られる分布は、原則として背景ノイズも混在した分布と考えるべきである。したがって、背景ノイズに影響されるような類似度算出法は使用できない。
そこで本発明では、登録過程で得られる分布を主成分分析する。この算出される主成分ベクトルは、物体の特徴を表現していると考えられる。さらに、認識過程で得られる分布(ベクトル集合)とその主成分ベクトルとの内積の最大値(及び最小値の絶対値)は、背景混合に対して影響を受ける可能性は極めて低いと考えられる。なぜなら、背景は対象物体の主成分ベクトルとはまったく独立した存在なので、その相関は常に0に近いと考えられるからである。このため、この指標を利用すれば、背景が変化しても安定して物体を認識することができる。
また、この方法は局所情報の集合を特徴空間上の分布という形で表現していることから、空間情報を完全には潰していないと考えられる。
さらに、局所情報を得るための窓の大きさを等比級数的に何種類か設け、多重解像度構造にすることで、より空間情報を増やすこともできる。したがって、認識の汎用性を高めることが可能である。
具体的には、請求項1に記載の発明は、画像データに含まれる物体を識別するパターン認識装置であって、登録デジタル画像データを入力する登録画像データ入力手段と、前記入力された登録デジタル画像データから対象物を切り出し、当該切り出した対象物画像の大きさを正規化する登録前処理手段と、前記登録前処理手段によって正規化した画像から特徴量を抽出する登録特徴量抽出手段と、探索窓を設定して当該探索窓を前記登録特徴量抽出手段によって特徴量が抽出された画像に対してスキャンさせながら当該探索窓内の特徴量を集計しベクトル化して特徴空間にプロットすることで分布を作成する登録分布作成手段と、前記分布を主成分分析して主成分ベクトルを算出する主成分ベクトル算出手段と、認識デジタル画像データを入力する認識画像データ入力手段と、前記入力された認識デジタル画像データの大きさを正規化する認識前処理手段と、前記認識前処理手段によって正規化した画像から特徴量を抽出する認識特徴量抽出手段と、探索窓を設定して当該探索窓を前記認識特徴量抽出手段によって特徴量が抽出された画像に対してスキャンさせながら当該探索窓内の特徴量を集計しベクトル化して特徴空間にプロットすることで分布を作成する認識分布作成手段と、前記認識分布作成手段によって作成された分布と前記主成分ベクトル算出手段によって算出された主成分ベクトルとの類似度を算出し、当該類似度に基づいて識別結果を決定する識別手段と、前記識別結果を出力する出力手段と、を有する。
また、請求項2に記載の発明は、前記登録特徴量抽出手段及び前記認識特徴量抽出手段では、隣接する画素との色の輝度の比を利用した特徴量を用いることを特徴とする。
また、請求項3に記載の発明は、前記登録分布作成手段及び前記認識分布作成手段は、大きさの異なる複数の探索窓を用いたスキャンにより当該探索窓と同数の分布を作成することを特徴とする。
また、請求項4に記載の発明は、前記識別手段で算出する類似度は、前記認識分布作成手段によって作成された分布前記主成分ベクトル算出手段によって算出された主成分ベクトルとの内積の最大値及び最小値から計算されるものであることを特徴とする。
また、請求項5に記載の発明は、前記主成分ベクトル算出手段において、前記入力された登録デジタル画像データより得られた特徴空間内での分布を主成分ベクトルに射影したときの密度分布を計算してテーブル化し、前記識別手段において、前記主成分ベクトル及びこれに対応する密度分布テーブルを用いて類似度を算出することを特徴とする。
また、請求項6に記載の発明は、画像データに含まれる物体を識別するパターン認識装置におけるパターン認識方法であって、登録画像データ入力手段が、登録デジタル画像データを入力する登録画像データ入力ステップと、登録前処理手段が、前記入力された登録デジタル画像データから対象物を切り出し、当該切り出した対象物画像の大きさを正規化する登録前処理ステップと、登録特徴量抽出手段が、前記登録前処理ステップで正規化した画像から特徴量を抽出する登録特徴量抽出ステップと、登録分布作成手段が、探索窓を設定して当該探索窓を前記登録特徴量抽出ステップで特徴量が抽出された画像に対してスキャンさせながら当該探索窓内の特徴量を集計しベクトル化して特徴空間にプロットすることで分布を作成する登録分布作成ステップと、主成分ベクトル算出手段が、前記分布を主成分分析して主成分ベクトルを算出する主成分ベクトル算出ステップと、認識画像データ入力手段が、認識デジタル画像データを入力する認識画像データ入力ステップと、認識前処理手段が、前記入力された認識デジタル画像データの大きさを正規化する認識前処理ステップと、認識特徴量抽出手段が、前記認識前処理ステップで正規化した画像から特徴量を抽出する認識特徴量抽出ステップと、認識分布作成手段が、探索窓を設定して当該探索窓を前記認識特徴量抽出ステップで特徴量が抽出された画像に対してスキャンさせながら当該探索窓内の特徴量を集計しベクトル化して特徴空間にプロットすることで分布を作成する認識分布作成ステップと、識別手段が、前記認識分布作成ステップで作成された分布と前記主成分ベクトル算出ステップで算出された主成分ベクトルとの類似度を算出し、当該類似度に基づいて識別結果を決定する識別ステップと、出力手段が、前記識別結果を出力する出力ステップと、を有することを特徴とする。
また、請求項7に記載の発明は、前記登録特徴量抽出ステップ、及び前記認識特徴量抽出ステップでは、隣接する画素との色の輝度の比を利用した特徴量を用いることを特徴とする。
また、請求項8に記載の発明は、前記登録分布作成ステップ及び前記認識分布作成ステップでは、大きさの異なる複数の探索窓を用いたスキャンにより当該探索窓と同数の分布を作成することを特徴とする。
また、請求項9に記載の発明は、前記識別ステップで算出する類似度は、前記認識分布作成ステップで作成された分布前記主成分ベクトル算出ステップで算出された主成分ベクトルとの内積の最大値及び最小値から計算されるものであることを特徴とする。
また、請求項10に記載の発明は、前記主成分ベクトル算出ステップでは前記主成分ベクトル算出手段が前記入力された登録デジタル画像データより得られた特徴空間内での分布を主成分ベクトルに射影したときの密度分布を計算してテーブル化し、前記識別ステップでは前記認識手段が前記主成分ベクトル及びこれに対応する密度分布テーブルを用いて類似度を算出することを特徴とする。
また、請求項11に記載の発明は、請求項1からいずれかに記載のパターン認識装置を構成する各手段としてコンピュータを機能させることを特徴とするプログラムである。
また、請求項12に記載の発明は、請求項11に記載のプログラムを記録したことを特徴とする記録媒体である。
請求項1〜12に記載の発明によれば、複雑な背景を有する認識画像であっても、安定してパターン認識を行うことが可能である。
さらに、請求項4及び9に記載の発明によれば、探索窓のスケールを多重化することで空間情報をより多く表現することが可能となり、より汎用性の高いパターン認識を実現できる。
以下、本発明の実施形態について図面を用いて詳細に説明する。
(実施形態1)
図2は、本実施形態のパターン認識装置の構成を示すブロック図であり、図3は、本実施形態のパターン認識方法のフローチャートである。以下、登録過程と、認識過程とに分けて説明を行う。
(登録過程)
登録用画像データ入力部11は認識対象の登録に用いるため、デジタルカメラ等で撮像された自然画像データを入力し、前処理部12に伝送する(S101)。
前処理部12は、まず、画像データから登録物体の占める領域のみを切り出す。この方法は、例えば背景差分や手作業によるマニュアル切り出しが考えられる。その後、切り出された画像領域を適当な大きさに正規化し、場合によってはローパスフィルタ等をかけて高周波ノイズを低減した上で特徴抽出部13へ伝送する(S102)。
特徴抽出部13は入力された切り出し画像データから特徴量を抽出する(S103)。特徴量には色空間のスカラ量子化によるインデクシング、エッジ特徴などさまざまなものが考えられるが、ここではCCCI(Color Constant Color Indexing)(Brian V. Funt, and Graham D. Finlayson:”Color Constant Color Indexing”, IEEE Trans.Patt. Anal. and Mach. Intell、 Vol. 17、 No.5、 May 1995.)による特徴抽出を利用した場合で説明する。CCCIは、隣接画素との色の比を利用したヒストグラムである。下記の数式1によって、RGBの色情報を変換する。
ここで、mはチャネルの種類(R or G or B)、(x,y)は画像の位置、ρは輝度値をあらわす。これにより、各画素に対し、(CR,CG,CB)という3次元のベクトルが計算される。
次に、切り出し画像内の全画素の(CR,CG,CB)をもとにベクトル量子化(Allen Gersho, Robert M. Gray:”ベクトル量子化と情報圧縮”, コロナ社、 1998.)を行う。ベクトル量子化を行うと、切り出し画像内の各画素に対し、インデックスが付与される。
分布作成部14は、決められた大きさ(aとする)の探索窓を用意して、画像の左上から右上へとスキャンさせる。そうすると、探索窓内に収まる画素からインデックス値が集計できる。この集計したヒストグラムを一つのベクトル(ベクトル量子化によるインデックスの総数nが次元数となる)と考える。このベクトルのノルムは1に正規化する。これを、窓をスキャンさせながら繰り返すと、n次元の空間の中で、ベクトル集合がある一つの分布を形成する(S104)。この分布が、登録物体の画像から抽出された特徴を示す。
主成分ベクトル計算部15では、分布作成部14で得られた分布を主成分分析する(S105)。このとき、重心周りではなく、原点周りの主成分ベクトルを計算する。それにより、第1〜第d主成分ベクトルが得られる。ここで、dは寄与度が100%未満で、ある値を超える最小値とする。さらに分布作成部14で得られた分布をこの主成分ベクトルに投影したときの密度分布を算出する。具体的には、投影したときの値域である-1から1の間を何等分かに分割し、それによってできる各部分範囲の中に分布を構成するベクトルがいくつ含まれるかを計算して頻度分布テーブルp1(x)〜pd(x)を作成する。ここで、xは分布を構成するベクトルと主成分ベクトルとの内積値を表し、-1から1の間の離散値になる。p1(x)〜pd(x)は、識別において用いる場合のみを算出すればよい。
主成分ベクトル記憶部16は、計算された主成分ベクトルをメモリに蓄積する(S106)。また、識別においてp1(x)〜pd(x)を用いる場合はそれも同時に蓄積する。
(認識過程)
認識用画像データ入力部17は、認識したい物体を撮像した画像データを入力して前処理部18に伝送する(S107)。
前処理部18は、画像を適当な大きさに正規化し、場合によってはローパスフィルタ等をかけて高周波ノイズを低減した上で特徴抽出部19へ伝送する(S108)。
特徴抽出部19は、画像データから特徴量を抽出する(S109)。画像全体に対し、各画素でのCCCIを算出し、特徴抽出部13にて得られたベクトル量子化に基づきインデクシングする。
分布作成部20は、局所探索窓を設けてこの窓内の特徴量を集計し、局所探索窓をスキャンさせながら特徴空間にプロットしていくことで特徴空間内での分布を作成する(S110)。
識別部21は、主成分ベクトル記憶部16に格納されている、物体の特徴を表す主成分ベクトルを呼び出し、以下の式で各登録物体との類似度を計算する。
ここで、Xは特徴抽出部19で作成される画像のインデクシング結果、xはこの結果から任意の位置で大きさaの探索窓を設定したときのインデックスヒストグラムを集計し、ベクトル化してノルム1に正規化したものを表す。また、Yは特徴抽出部13で作成される画像のインデクシング結果、yはこの結果から任意の位置で大きさaの探索窓を設定したときのインデックスヒストグラムを集計し、ベクトル化したものを表す。そして、νkは主成分ベクトル記憶部16から呼び出された第k主成分ベクトルである。また、類似度としてp1(x)〜pd(x)を利用する場合は、以下のような式になる。
この類似度は、認識したい物体の画像を登録した物体の特徴を表す部分空間(主成分ベクトルが張る空間)に射影したときの分布の広がり具合を示す。この指標は、たとえ画像に複雑な背景が含まれていたとしてもその数値に影響を与えないので、背景の変化に頑健な認識手法になり得る。
この類似度Sを全ての登録物体において計算したかを判断し(S112)、全ての登録物体において計算した場合には最も類似度の高い物体を識別物体と判定して、これを出力部22へ伝送する。
出力部22は、識別部21で演算された識別結果を出力する(S113)。
(実施形態2)
以上の方法は、探索窓の大きさaを一つの固定値として指定する方法であったが、これを多重化する方法も考えられる。この場合の本発明に係る実施形態のパターン認識方法のフローチャートを図4に示す。実施形態のパターン認識装置の構成は図2と変わらない。
(登録過程)
登録用画像データ入力部11は認識対象の登録に用いるため、デジタルカメラ等で撮像された自然画像データを入力し、前処理部12に伝送する(S201)。
前処理部12は、まず、画像データから登録物体の占める領域のみを切り出す。この方法は、例えば背景差分や手作業によるマニュアル切り出しが考えられる。その後、切り出された画像領域を適当な大きさに正規化し、場合によってはローパスフィルタ等をかけて高周波ノイズを低減した上で特徴抽出部13へ伝送する(S202)。
特徴抽出部13は入力された切り出し画像データから特徴量を抽出する(S203)。ここでもCCCIによる特徴抽出を例に挙げて説明する。まず、数式(1)によって、RGBの色情報を変換する。これにより、各画素に対し、(CR,CG,CB)という3次元のベクトルが計算される。次に、切り出し画像内の全画素の(CR,CG,CB)をもとにベクトル量子化を行う。ベクトル量子化を行うと、切り出し画像内の各画素に対し、インデックスが付与される。
分布作成部14は、大きさaの異なる探索窓を下記の数式4
を用いて何種類か用意する(その数をsとする。また、astartは初期値、εは1より小さな値としてそれぞれあらかじめ設定する)(S204)。そして、それぞれの探索窓を用いて画像の左上から右下へとスキャンさせ、探索窓内に収まる画素からインデックス値を集計する。この集計したヒストグラムを一つのベクトル(ベクトル量子化によるインデックスの総数nが次元数となる)と考え、このベクトルのノルムを1に正規化する。これを、窓をスキャンさせながら繰り返すと、n次元の空間の中で、ベクトル集合がある一つの分布を形成する(S205)。この分布は、s個算出でき、これらを主成分ベクトル計算部15に伝送する。
主成分ベクトル計算部15は、分布作成部14で得られた複数の分布をそれぞれ主成分分析する(S206)。このとき、重心周りではなく、原点周りの主成分ベクトルを計算する。これにより、第1〜第d主成分ベクトルの組がs組得られる。ここで、dは寄与度が100%未満で、ある値を超える最小値とする。dはそれぞれの大きさの探索窓に対し異なる数にしても良いし、同一数に揃えても良い。以下では同一数とした場合で説明する。さらに、分布作成部14で得られた分布をこの主成分ベクトルに投影したときの密度分布を算出する。具体的には、投影したときの値域である-1から1の間を何等分かに分割し、それによってできる各部分範囲の中に分布を構成するベクトルがいくつ含まれるかを計算して頻度分布テーブルp11(x)〜psd(x)を作成する。ここで、xは分布を構成するベクトルと主成分ベクトルとの内積値を表し、-1から1の間の離散値になる。p11(x)〜psd(x)は、識別において用いる場合のみ算出すればよい。
主成分ベクトル記憶部16は、計算された主成分ベクトルをメモリに蓄積する(S207)。また、識別においてp11(x)〜psd(x)を用いる場合はそれも同時に蓄積する。
なお、用意した各探索窓について分布作成(S205)、主成分ベクトル計算(S206)、及び主成分ベクトル記憶(S207)を行い(S208)、s個全ての各分布についてS205〜S207の処理が終了したかを判断して(S209)、S205〜S207の処理が終了している場合には登録過程を終了する。
(認識過程)
認識用画像データ入力部17は、認識したい物体を撮像した画像データを前処理部18に伝送する(S210)。
前処理部18は、画像を適当な大きさに正規化し、場合によってはローパスフィルタ等をかけて高周波ノイズを低減した上で特徴抽出部19へ伝送する(S211)。
特徴抽出部19は、画像データから特徴量を抽出する(S212)。まず画像全体に対して各画素でのCCCIを算出し、特徴抽出部13にて得られたベクトル量子化に基づきインデクシングする。
分布作成部20は、大きさaの異なる探索窓を上記の数式3を用いて何種類か用意する(その数をsとする。また、astartは初期値、εは1より小さな値としてそれぞれあらかじめ設定する)(S213)。そして各探索窓内の特徴量を集計し、局所探索窓をスキャンさせながら特徴空間にプロットしていくことで特徴空間内での分布を作成する(S214)。この分布は、s個算出でき、これらを識別部21に伝送する。
識別部21は、主成分ベクトル記憶部16に格納されている、物体の特徴を表す主成分ベクトルを呼び出し、下記の数式5で各登録物体との類似度を計算する(215)。
ここで、Xは特徴抽出部19で作成される画像のインデクシング結果、xlはその結果から大きさalの探索窓を設定したときのインデックスヒストグラムを集計し、ベクトル化してノルム1に正規化したものを表す。また、Yは特徴抽出部13で作成される画像のインデクシング結果、ylはその結果から任意の位置で大きさalの探索窓を設定したときのインデックスヒストグラムを集計し、ベクトル化したものを表す。そして、νkは主成分ベクトル記憶部16から呼び出された第k主成分ベクトルである。また、類似度としてp11(x)〜psd(x)を利用する場合は、以下のような式になる。
この指標は、たとえ画像に複雑な背景が含まれていたとしてもその数値に影響を与えないので、背景の変化に頑健な認識手法になり得る。さらに、多重解像度化したことによって、画像パターンの表現能力が向上し、認識装置としての汎用性を高めることができる。
なお、用意した各探索窓について分布作成(S214)、及び類似度計算(S215)を行い(S216)、s個全ての各分布についてS214〜S215の処理が終了したかを判断して(S217)、S214〜S215の処理が終了している場合には、類似度Sを全ての登録物体において計算したかを判断し(S218)、全ての登録物体において計算した場合には最も類似度の高い物体を識別物体と判定して、これを出力部22へ伝送する。
出力部22は、識別部21で演算された識別結果を出力する(S219)。
なお、上記実施形態において、パターン認識装置は、例えば、パターン認識装置を構成するコンピュータ装置が有するCPUによって実現され、必要とする画像データ入力処理、前処理、特徴抽出処理、分布作成処理、主成分ベクトル計算処理などをアプリケーションプログラムとして搭載することができる。
また、コンピュータ装置には上記説明したパターン認識装置を構成するコンピュータ装置が有するCPUによって実現され、必要とする画像データ入力処理、前処理、特徴抽出処理、分布作成処理、主成分ベクトル計算処理など、行った処理結果や計算結果等のデータを内部メモリや外部記憶装置等に書き込み・読み出しができるようにしてもよい。
また、本実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体を、システム又は装置に供給し、そのシステム又は装置のCPU(MPU)が記憶媒体に格納されたプログラムコードを読み出し実行することも可能である。この場合、記憶媒体から読み出されたプログラムコード自体が上記実施形態の機能を実現することになり、このプログラムコードを記憶した記憶媒体としては、例えば、CD−ROM、DVD−ROM、CD−R、CD−RW、MO、HDD等がある。
登録過程及び認識過程の概念図。 パターン認識装置の構成図。 パターン認識のフローチャート。 パターン認識のフローチャート。
符号の説明
11…登録用画像データ入力部
12…前処理部
13…特徴抽出部
14…分布作成部
15…主成分ベクトル計算部
16…主成分ベクトル記憶部
17…認識用画像データ入力部
18…前処理部
19…特徴抽出部
20…分布作成部
21…識別部
22…出力部

Claims (12)

  1. 画像データに含まれる物体を識別するパターン認識装置であって、
    登録デジタル画像データを入力する登録画像データ入力手段と、
    前記入力された登録デジタル画像データから対象物を切り出し、当該切り出した対象物画像の大きさを正規化する登録前処理手段と、
    前記登録前処理手段によって正規化した画像から特徴量を抽出する登録特徴量抽出手段と、
    探索窓を設定して当該探索窓を前記登録特徴量抽出手段によって特徴量が抽出された画像に対してスキャンさせながら当該探索窓内の特徴量を集計しベクトル化して特徴空間にプロットすることで分布を作成する登録分布作成手段と、
    前記分布を主成分分析して主成分ベクトルを算出する主成分ベクトル算出手段と、
    認識デジタル画像データを入力する認識画像データ入力手段と、
    前記入力された認識デジタル画像データの大きさを正規化する認識前処理手段と、
    前記認識前処理手段によって正規化した画像から特徴量を抽出する認識特徴量抽出手段と、
    探索窓を設定して当該探索窓を前記認識特徴量抽出手段によって特徴量が抽出された画像に対してスキャンさせながら当該探索窓内の特徴量を集計しベクトル化して特徴空間にプロットすることで分布を作成する認識分布作成手段と、
    前記認識分布作成手段によって作成された分布と前記主成分ベクトル算出手段によって算出された主成分ベクトルとの類似度を算出し、当該類似度に基づいて識別結果を決定する識別手段と、
    前記識別結果を出力する出力手段と、
    を有すること
    を特徴とするパターン認識装置。
  2. 前記登録特徴量抽出手段及び前記認識特徴量抽出手段では、隣接する画素との色の輝度の比を利用した特徴量を用いること
    を特徴とする請求項1に記載のパターン認識装置。
  3. 前記登録分布作成手段及び前記認識分布作成手段は、大きさの異なる複数の探索窓を用いたスキャンにより当該探索窓と同数の分布を作成すること
    を特徴とする請求項1又は2に記載のパターン認識装置。
  4. 前記識別手段で算出する類似度は、前記認識分布作成手段によって作成された分布前記主成分ベクトル算出手段によって算出された主成分ベクトルとの内積の最大値及び最小値から計算されるものであること
    を特徴とする請求項1〜3いずれかに記載のパターン認識装置。
  5. 前記主成分ベクトル算出手段において、前記入力された登録デジタル画像データより得られた特徴空間内での分布を主成分ベクトルに射影したときの密度分布を計算してテーブル化し、
    前記識別手段において、前記主成分ベクトル及びこれに対応する密度分布テーブルを用いて類似度を算出すること
    を特徴とする請求項1〜4いずれかに記載のパターン認識装置。
  6. 画像データに含まれる物体を識別するパターン認識装置におけるパターン認識方法であって、
    登録画像データ入力手段が、登録デジタル画像データを入力する登録画像データ入力ステップと、
    登録前処理手段が、前記入力された登録デジタル画像データから対象物を切り出し、当該切り出した対象物画像の大きさを正規化する登録前処理ステップと、
    登録特徴量抽出手段が、前記登録前処理ステップで正規化した画像から特徴量を抽出する登録特徴量抽出ステップと、
    登録分布作成手段が、探索窓を設定して当該探索窓を前記登録特徴量抽出ステップで特徴量が抽出された画像に対してスキャンさせながら当該探索窓内の特徴量を集計しベクトル化して特徴空間にプロットすることで分布を作成する登録分布作成ステップと、
    主成分ベクトル算出手段が、前記分布を主成分分析して主成分ベクトルを算出する主成分ベクトル算出ステップと、
    認識画像データ入力手段が、認識デジタル画像データを入力する認識画像データ入力ステップと、
    認識前処理手段が、前記入力された認識デジタル画像データの大きさを正規化する認識前処理ステップと、
    認識特徴量抽出手段が、前記認識前処理ステップで正規化した画像から特徴量を抽出する認識特徴量抽出ステップと、
    認識分布作成手段が、探索窓を設定して当該探索窓を前記認識特徴量抽出ステップで特徴量が抽出された画像に対してスキャンさせながら当該探索窓内の特徴量を集計しベクトル化して特徴空間にプロットすることで分布を作成する認識分布作成ステップと、
    識別手段が、前記認識分布作成ステップで作成された分布と前記主成分ベクトル算出ステップで算出された主成分ベクトルとの類似度を算出し、当該類似度に基づいて識別結果を決定する識別ステップと、
    出力手段が、前記識別結果を出力する出力ステップと、
    を有することを特徴とするパターン認識方法。
  7. 前記登録特徴量抽出ステップ及び前記認識特徴量抽出ステップでは、隣接する画素との色の輝度の比を利用した特徴量を用いること
    を特徴とする請求項6に記載のパターン認識方法。
  8. 前記登録分布作成ステップ、及び前記認識分布作成ステップでは、大きさの異なる複数の探索窓を用いたスキャンにより当該探索窓と同数の分布を作成すること
    を特徴とする請求項6又は7に記載のパターン認識方法。
  9. 前記識別ステップで算出する類似度は、前記認識分布作成ステップで作成された分布前記主成分ベクトル算出ステップで算出された主成分ベクトルとの内積の最大値及び最小値から計算されるものであること
    を特徴とする請求項6〜8いずれかに記載のパターン認識方法。
  10. 前記主成分ベクトル算出ステップでは前記主成分ベクトル算出手段が前記入力された登録デジタル画像データより得られた特徴空間内での分布を主成分ベクトルに射影したときの密度分布を計算してテーブル化し、
    前記識別ステップでは前記認識手段が前記主成分ベクトル及びこれに対応する密度分布テーブルを用いて類似度を算出すること
    を特徴とする請求項6〜9いずれかに記載のパターン認識方法。
  11. 請求項1からいずれかに記載のパターン認識装置を構成する各手段としてコンピュータを機能させるプログラム。
  12. 請求項11に記載のプログラムを記録したことを特徴とする記録媒体。
JP2005163719A 2005-02-14 2005-06-03 パターン認識装置、パターン認識方法、パターン認識プログラム、及びパターン認識プログラムの記録媒体 Expired - Fee Related JP4612477B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005163719A JP4612477B2 (ja) 2005-02-14 2005-06-03 パターン認識装置、パターン認識方法、パターン認識プログラム、及びパターン認識プログラムの記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005035442 2005-02-14
JP2005163719A JP4612477B2 (ja) 2005-02-14 2005-06-03 パターン認識装置、パターン認識方法、パターン認識プログラム、及びパターン認識プログラムの記録媒体

Publications (2)

Publication Number Publication Date
JP2006252504A JP2006252504A (ja) 2006-09-21
JP4612477B2 true JP4612477B2 (ja) 2011-01-12

Family

ID=37092891

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005163719A Expired - Fee Related JP4612477B2 (ja) 2005-02-14 2005-06-03 パターン認識装置、パターン認識方法、パターン認識プログラム、及びパターン認識プログラムの記録媒体

Country Status (1)

Country Link
JP (1) JP4612477B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102169992B1 (ko) * 2014-03-17 2020-10-26 삼성전자주식회사 문서의 미 회수를 통지하는 방법 및 장치
JP2016162072A (ja) 2015-02-27 2016-09-05 株式会社東芝 特徴量抽出装置
JP6427534B2 (ja) * 2016-05-31 2018-11-21 日本電信電話株式会社 パターン識別装置、方法、及びプログラム
JP7176719B2 (ja) * 2018-06-11 2022-11-22 日本電気通信システム株式会社 検出装置、検出システム、検出方法及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0353512B2 (ja) * 1987-06-25 1991-08-15 Kawasaki Seitetsu Kk
JPH10247246A (ja) * 1997-03-05 1998-09-14 Nippon Telegr & Teleph Corp <Ntt> 物体検出方法
JPH1153547A (ja) * 1997-07-31 1999-02-26 Tokyo Electric Power Co Inc:The 認識対象物体の物体領域抽出装置および物体領域抽出方法
JP2003141542A (ja) * 2001-11-06 2003-05-16 Toshiba Corp 顔画像照合装置、顔画像照合システム及び顔画像照合方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0353512B2 (ja) * 1987-06-25 1991-08-15 Kawasaki Seitetsu Kk
JPH10247246A (ja) * 1997-03-05 1998-09-14 Nippon Telegr & Teleph Corp <Ntt> 物体検出方法
JPH1153547A (ja) * 1997-07-31 1999-02-26 Tokyo Electric Power Co Inc:The 認識対象物体の物体領域抽出装置および物体領域抽出方法
JP2003141542A (ja) * 2001-11-06 2003-05-16 Toshiba Corp 顔画像照合装置、顔画像照合システム及び顔画像照合方法

Also Published As

Publication number Publication date
JP2006252504A (ja) 2006-09-21

Similar Documents

Publication Publication Date Title
US11694456B2 (en) Object detection and image cropping using a multi-detector approach
US8103115B2 (en) Information processing apparatus, method, and program
JP5202148B2 (ja) 画像処理装置、画像処理方法、及びコンピュータプログラム
US8620087B2 (en) Feature selection device
US20070041638A1 (en) Systems and methods for real-time object recognition
TW201437925A (zh) 物體識別裝置、方法及電腦程式產品
JP2004265407A (ja) デジタル画像におけるカラーオブジェクトの検出方法
US9489566B2 (en) Image recognition apparatus and image recognition method for identifying object
AU2017201281B2 (en) Identifying matching images
JP6945253B2 (ja) 分類装置、分類方法、プログラム、ならびに、情報記録媒体
JP4300098B2 (ja) オブジェクト識別方法とその装置、プログラム及び記録媒体
Özgen et al. Text detection in natural and computer-generated images
Tuna et al. Image description using a multiplier-less operator
US20230093474A1 (en) Efficient location and identification of documents in images
KR100924690B1 (ko) 디지털 영상 특징 관리 시스템 및 그 방법
JP4588575B2 (ja) デジタル画像の複数対象物検出方法および装置並びにプログラム
JP4612477B2 (ja) パターン認識装置、パターン認識方法、パターン認識プログラム、及びパターン認識プログラムの記録媒体
CN114863431A (zh) 一种文本检测方法、装置及设备
Ghandour et al. Building shadow detection based on multi-thresholding segmentation
JP2017084006A (ja) 画像処理装置およびその方法
CN108154107A (zh) 一种确定遥感图像归属的场景类别的方法
CN114241580A (zh) 一种基于局部二值特征的人脸识别方法及相关装置
Kanjanawattana et al. Extraction and identification of bar graph components by automatic epsilon estimation
JP4231375B2 (ja) パターン認識装置、パターン認識方法、パターン認識プログラムおよびパターン認識プログラムを記録した記録媒体。
Nazarbakhsh et al. Image pre-processing techniques for enhancing the performance of real-time face recognition system using PCA

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070814

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090529

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20100514

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100713

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100720

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100921

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101012

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101015

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131022

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees