JP4348202B2 - 顔画像認識装置及び顔画像認識プログラム - Google Patents
顔画像認識装置及び顔画像認識プログラム Download PDFInfo
- Publication number
- JP4348202B2 JP4348202B2 JP2004013589A JP2004013589A JP4348202B2 JP 4348202 B2 JP4348202 B2 JP 4348202B2 JP 2004013589 A JP2004013589 A JP 2004013589A JP 2004013589 A JP2004013589 A JP 2004013589A JP 4348202 B2 JP4348202 B2 JP 4348202B2
- Authority
- JP
- Japan
- Prior art keywords
- face image
- face
- probability distribution
- image
- person
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Collating Specific Patterns (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Description
サイモン・クリピングデル他,"動画像の顔検出・追跡・認識への統一されたアプローチ",PRMU講演発表予稿集,1999年1月。
本発明は、ベイズ統計を数学的根拠とする評価基準と統計的サンプリング手法によるアルゴリズムによって、各パラメータの最適化の問題を解決する。また、本発明は、新たに学習の要素を加えることで、顔画像の変動に対する頑健性を改善する。
次に、本発明の顔画像認識における発明の原理について説明する。本発明は、ある人物の顔画像(以下,「登録顔画像」という)と人物を特定するID等の識別情報が予め与えられた場合に、未知の顔画像(以下,「テスト画像」という)に対して,最も類似する登録顔画像を複数の候補の中から探し出し,その人物を出力するものである。
本発明では、特徴点の座標xとパラメータαを、夫々確率変数と捉えた上で、それらの同時事後確率分布をベイズ統計に基づいて定式化し、モンテカルロ法と呼ばれる統計的手法を用いて、その確率分布に関する期待値計算を実現する。
次に、上述した特徴を有する本発明における顔画像認識装置及び顔画像認識プログラムを好適に実施した形態について、図面を用いて説明する。なお、以下に示す図面において、同一符号は同一又は相当部分を示す。
図1は、顔画像認識装置の第1の実施の形態における構成例を示す図である。図1の顔画像認識装置1は、顔データ作成装置10と、顔画像認識特定装置20とを有するよう構成されている。また、顔データ作成装置10は、顔画像登録部11と、事前確率分布推定部11と、学習用顔画像検出部13と、事後確率分布学習部14と、記録部15とを有するよう構成されている。また、顔画像認識特定装置20は、入力顔画像検出部21と、顔画像認識部22とを有するよう構成されている。
顔データ作成装置10は、画像データ又はその画像データのリスト等によって与えられる登録顔画像、表情サンプル画像、及びユーザが画像データ表示手段等を用いて表示される内容を参照しながら生成される登録顔画像の特徴点配置情報や人物ID、表情サンプル画像の特徴点配置情報から、顔テンプレート及び事後確率分布サンプルを作成する。
図3は、本発明における顔画像登録手順の一例を示すフローチャートである。まず、顔画像登録部11は、上述した登録顔画像、特徴点配置情報x−、及び人物IDを入力する(S01)。具体的には、例えばユーザにより顔データ作成装置10が具備する画像データ表示部等を参照しながら登録が行われる。
次に、事前確率分布推定部12における処理手順についてフローチャートを用いて説明する。図5は、本発明における事前確率分布推定手順の一例を示すフローチャートである。
次に、学習用顔画像検出部13における処理手順についてフローチャートを用いて説明する。図7は、本発明における学習用顔画像検出手順の一例を示すフローチャートである。
次に、事後確率分布学習部14における処理手順についてフローチャートを用いて説明する。図9は、本発明における学習用顔画像検出手順の一例を示すフローチャートである。
ここで、単純メトロポリス法を用いて事後確率分布サンプルの抽出例についてフローチャートを用いて説明する。図10は、事後確率分布サンプルの抽出例を示す図である。
次に、記録部15の処理内容について説明する。記録部15は、顔画像登録部11から顔テンプレートを入力し、事後確率分布学習部13から事後確率分布サンプルを入力する。また、記録部15は、入力した顔テンプレート及び事後確率分布サンプルを記録する。
<顔画像認識特定装置20>
顔画像認識特定装置20は、記録部15に保存されている顔テンプレート及び事後確率分布パラメータに基づいて、上述の(21)式等の計算を実行し、新たに与えられた顔画像データに対する顔認識結果を出力する。ここで、顔画像認識特定装置20において入力顔画像検出部21にて行う処理手順と、顔画像認識部22にて行う処理手順とを分けて説明する。
入力顔画像検出部21の顔画像検出手順について、フローチャートを用いて説明する。図12は、入力顔画像検出手順の一例を示すフローチャートである。まず、入力顔画像検出部21は、テスト画像を入力する(S61)。ここで、テスト画像とは、未知の顔画像データのことであり、本発明を適用することで、顔画像に対応する人物が特定されるものである。
次に、顔画像認識部22における顔画像認識手順について、フローチャートを用いて説明する。図13は、第1の実施の形態における顔画像認識手順の一例を示すフローチャートである。
ここで、本発明における顔画像認識装置の第2の実施の形態として、上述のフィルタ手段を有する顔画像認識装置の構成について図を用いて説明する。
顔データ作成装置60は、画像データ又はその画像データのリスト等によって与えられる登録顔画像、表情サンプル画像、及びユーザが画像データ表示手段等を用いて表示される内容を参照しながら生成される登録顔画像の特徴点配置情報や人物ID、表情サンプル画像の特徴点配置情報から、顔テンプレート及び事後確率分布サンプルを作成する。なお、顔データ作成装置10に含まれる各構成における処理手順は上述した第1の実施の形態と同様である。ただし、記録部65においては、顔画像認識部72により入力される顔データ要求信号に対して顔テンプレートを顔画像認識部72に出力し、事後確率分布サンプルをフィルタ部73へ出力する。
顔画像認識特定装置70は、記録部15に保存されている顔テンプレート及び事後確率分布パラメータに基づいて、上述の(21)式等の計算を実行し、新たに与えられた顔画像データに対する顔認識結果を出力する。ここで、上述の図1を用いて説明した内容と相違する部分について具体的に説明する。
顔画像認識部72における顔画像認識手順について、フローチャートを用いて説明する。図15は、第2の実施の形態における顔画像認識手順の一例を示すフローチャートである。
フィルタ部73は、顔画像認識部72からのフィルタ条件に基づいて、記録部15から入力した事後確率分布サンプルをフィルタリングする。ここで、フィルタの条件としては、事後確率分布サンプルを所定の間隔毎に間引くか、学習画像毎のサンプル数に対応させた間隔毎に間引く等、間隔を調整してフィルタを行う。
10,60 顔データ作成装置
11 顔画像登録部
12 事前確率分布推定部
13 学習用顔画像検出部
14 事後確率分布学習部
15,65 記録部
20,70 顔画像認識特定装置
21 入力顔画像検出部
22,72 顔画像認識部
30 特徴点
40 表情サンプル画像
51,52 画像
73 フィルタ部
81 入力装置
82 出力装置
83 ドライブ装置
84 補助記憶装置
85 メモリ装置
86 CPU
87 ネットワーク接続装置
88 記録媒体
Claims (7)
- 予め登録される登録顔画像と前記登録顔画像の人物とは異なる人物の表情の異なる複数のサンプル画像と前記登録顔画像の人物の表情の異なる複数の学習画像を用いて、入力される画像中に含まれる顔画像の人物を特定するための顔画像認識装置であって、
前記登録顔画像にプロットされた特徴点の近傍の画像の情報と、前記登録顔画像の特徴点配置情報と、人物識別情報とを、前記登録顔画像に対応付けて顔テンプレートとして登録する顔画像登録部と、
前記複数のサンプル画像と各サンプル画像の特徴点配置情報とに基づいて、顔変形データの確率分布パラメータを生成する確率分布推定部と、
前記顔画像登録部により予め登録される前記登録顔画像の各人物毎に撮影した表情の異なる複数の顔画像データである学習画像から、前記学習画像に映っている人の顔を検出し、顔の大きさを一定の大きさに正規化した学習用顔画像を出力する顔画像検出部と、
前記顔画像登録部において得られる複数の顔テンプレートと前記確率分布パラメータと前記学習用顔画像とに基づいて、モンテカルロ法によって学習した各人物毎の表情変化に伴う各特徴点の配置の変化の統計的性質を確率分布サンプルデータとして抽出する確率分布学習部と、
前記複数の顔テンプレートにおける前記特徴点の近傍の画像の情報及び前記特徴点配置情報と前記確率分布サンプルデータにおける各特徴点の配置の確率分布とに基づいて、前記入力される画像中に含まれる顔画像の夫々の登録顔画像に対応する人物が出現する確率値をベイズ統計に基づく評価基準を用いて算出し、算出された確率値が最大となる前記顔テンプレートに対応する人物を特定する顔画像認識部とを有し、
前記確率分布推定部は、
全ての特徴点配置情報の夫々の特徴点の座標についての分散・共分散行列を生成し、生成した前記分散・共分散行列の逆行列を前記確率分布パラメータとすることを特徴とする顔画像認識装置。 - 前記顔画像認識部は、
前記ベイズ統計に基づく評価基準を用いて算出された顔テンプレートの出現に関する統合的な確率値である事後確率が最大となる顔テンプレートに含まれる前記人物識別情報を出力することを特徴とする請求項1に記載の顔画像認識装置。 - 前記確率分布サンプルデータを予め設定されるフィルタ条件に基づいてフィルタリングするフィルタ部を有することを特徴とする請求項1又は2に記載の顔画像認識装置。
- 前記フィルタ部は、
入力した確率分布サンプルデータを予め設定される間隔毎に間引くことを特徴とする請求項3に記載の顔画像認識装置。 - 前記顔画像認識部は、
前記顔テンプレートと前記フィルタ部から得られる前記確率分布サンプルデータとに基づいて、前記入力される画像中に含まれる顔画像の人物を特定することを特徴とする請求項3又は4に記載の顔画像認識装置。 - 予め登録される登録顔画像と前記登録顔画像の人物とは異なる人物の表情の異なる複数のサンプル画像と前記登録顔画像の人物の表情の異なる複数の学習画像を用いて、入力される画像中に含まれる顔画像の人物を特定するための顔画像認識をコンピュータに実行させるための顔画像認識プログラムであって、
コンピュータに、
前記登録顔画像にプロットされた特徴点の近傍の画像の情報と、前記登録顔画像の特徴点配置情報と、人物識別情報とを、前記登録顔画像に対応付けて顔テンプレートとして登録する顔画像登録処理、
前記複数のサンプル画像と各サンプル画像の特徴点配置情報とに基づいて、顔変形データの確率分布パラメータを生成する確率分布推定処理、
前記顔画像登録処理により予め登録される前記登録顔画像の各人物毎に撮影した表情の異なる複数の顔画像データである学習画像から、前記学習画像に映っている人の顔を検出し、顔の大きさを一定の大きさに正規化した学習用顔画像を出力する顔画像検出処理、
前記顔画像登録処理において得られる複数の顔テンプレートと前記確率分布パラメータと前記学習用顔画像とに基づいて、モンテカルロ法によって学習した各人物毎の表情変化に伴う各特徴点の配置の変化の統計的性質を確率分布サンプルデータとして抽出する確率分布学習処理、及び、
前記複数の顔テンプレートにおける前記特徴点の近傍の画像の情報及び前記特徴点配置情報と前記確率分布サンプルデータにおける各特徴点の配置の確率分布とに基づいて、前記入力される画像中に含まれる顔画像の夫々の登録顔画像に対応する人物が出現する確率値をベイズ統計に基づく評価基準を用いて算出し、算出された確率値が最大となる前記顔テンプレートに対応する人物を特定する顔画像認識処理を実行させ、
前記確率分布推定処理は、
全ての特徴点配置情報の夫々の特徴点の座標についての分散・共分散行列を生成し、生成した前記分散・共分散行列の逆行列を前記確率分布パラメータとすることを特徴とする顔画像認識プログラム。 - 前記顔画像認識処理は、
前記ベイズ統計に基づく評価基準を用いて算出された顔テンプレートの出現に関する統合的な確率値である事後確率が最大となる顔テンプレートに含まれる前記人物識別情報を出力することを特徴とする請求項6に記載の顔画像認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004013589A JP4348202B2 (ja) | 2004-01-21 | 2004-01-21 | 顔画像認識装置及び顔画像認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004013589A JP4348202B2 (ja) | 2004-01-21 | 2004-01-21 | 顔画像認識装置及び顔画像認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005208850A JP2005208850A (ja) | 2005-08-04 |
JP4348202B2 true JP4348202B2 (ja) | 2009-10-21 |
Family
ID=34899602
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004013589A Expired - Fee Related JP4348202B2 (ja) | 2004-01-21 | 2004-01-21 | 顔画像認識装置及び顔画像認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4348202B2 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4372051B2 (ja) * | 2005-06-13 | 2009-11-25 | 株式会社東芝 | 手形状認識装置及びその方法 |
US7450736B2 (en) * | 2005-10-28 | 2008-11-11 | Honda Motor Co., Ltd. | Monocular tracking of 3D human motion with a coordinated mixture of factor analyzers |
JP4928193B2 (ja) * | 2006-08-16 | 2012-05-09 | 日本放送協会 | 顔画像認識装置及び顔画像認識プログラム |
JP5121681B2 (ja) * | 2008-04-30 | 2013-01-16 | 株式会社日立製作所 | 生体認証システム、認証クライアント端末、及び生体認証方法 |
WO2013145496A1 (ja) * | 2012-03-27 | 2013-10-03 | 日本電気株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP6039942B2 (ja) | 2012-07-09 | 2016-12-07 | キヤノン株式会社 | 情報処理装置及びその制御方法及びプログラム |
CN105095911B (zh) * | 2015-07-31 | 2019-02-12 | 小米科技有限责任公司 | 敏感图片识别方法、装置以及服务器 |
CN109522778A (zh) * | 2017-09-20 | 2019-03-26 | 顾泽苍 | 一种可达到图像理解水平的图像识别方法 |
KR102174345B1 (ko) | 2018-06-12 | 2020-11-04 | 영남대학교 산학협력단 | 몰입도 측정장치 및 방법 |
JP7438690B2 (ja) * | 2019-08-09 | 2024-02-27 | 日本テレビ放送網株式会社 | 情報処理装置、画像認識方法及び学習モデル生成方法 |
JP7457809B2 (ja) * | 2020-07-03 | 2024-03-28 | 株式会社ソニー・インタラクティブエンタテインメント | 追加撮影要否通知装置、追加撮影要否通知方法及びプログラム |
CN112146764B (zh) * | 2020-09-25 | 2022-05-24 | 杭州海康威视数字技术股份有限公司 | 一种提高基于热成像温度测量准确性的方法、热成像设备 |
JP2023053734A (ja) * | 2021-10-01 | 2023-04-13 | パナソニックIpマネジメント株式会社 | 顔タイプ診断装置、顔タイプ診断方法及びプログラム |
CN117788720B (zh) * | 2024-02-26 | 2024-05-17 | 山东齐鲁壹点传媒有限公司 | 一种生成用户人脸模型的方法、存储介质及终端 |
-
2004
- 2004-01-21 JP JP2004013589A patent/JP4348202B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005208850A (ja) | 2005-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cohen et al. | Facial expression recognition from video sequences: temporal and static modeling | |
US11816888B2 (en) | Accurate tag relevance prediction for image search | |
EP2893491B1 (en) | Image processing apparatus and method for fitting a deformable shape model to an image using random forest regression voting | |
JP4589625B2 (ja) | カーネルフィッシャーフェイスを使用した顔認識 | |
JP4348202B2 (ja) | 顔画像認識装置及び顔画像認識プログラム | |
JP2005512201A5 (ja) | ||
CN110069129B (zh) | 确定系统和确定方法 | |
Wang et al. | Sparse observation (so) alignment for sign language recognition | |
EP1649408B1 (en) | Systems and methods for training component-based object identification systems | |
JP6620882B2 (ja) | ドメイン適応を用いたパターン認識装置、方法およびプログラム | |
CN113255557B (zh) | 一种基于深度学习的视频人群情绪分析方法及系统 | |
Jachimski et al. | A comparative study of English viseme recognition methods and algorithms | |
Elakkiya et al. | Extricating manual and non-manual features for subunit level medical sign modelling in automatic sign language classification and recognition | |
CN110516638B (zh) | 一种基于轨迹和随机森林的手语识别方法 | |
Perronnin et al. | A probabilistic model of face mapping with local transformations and its application to person recognition | |
JP4928193B2 (ja) | 顔画像認識装置及び顔画像認識プログラム | |
Saabni | Facial expression recognition using multi Radial Bases Function Networks and 2-D Gabor filters | |
EP2781991B1 (en) | Signal processing device and signal processing method | |
JP2007249394A (ja) | 顔画像認識装置及び顔画像認識プログラム | |
JP2004178569A (ja) | データ分類装置、物体認識装置、データ分類方法及び物体認識方法 | |
US20240249416A1 (en) | Deep learning model optimization method and apparatus for medical image segmentation | |
Mayer et al. | Adjusted pixel features for robust facial component classification | |
Liu et al. | Human action recognition using manifold learning and hidden conditional random fields | |
Gervasi et al. | A method for predicting words by interpreting labial movements | |
Lu et al. | Automatic lipreading based on optimized OLSDA and HMM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060324 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090317 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090515 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090623 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090717 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4348202 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120724 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120724 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130724 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140724 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |