JP3977291B2 - 画像再生方法及び画像処理装置 - Google Patents
画像再生方法及び画像処理装置 Download PDFInfo
- Publication number
- JP3977291B2 JP3977291B2 JP2003183219A JP2003183219A JP3977291B2 JP 3977291 B2 JP3977291 B2 JP 3977291B2 JP 2003183219 A JP2003183219 A JP 2003183219A JP 2003183219 A JP2003183219 A JP 2003183219A JP 3977291 B2 JP3977291 B2 JP 3977291B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- correction
- detection
- data
- chromaticity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Image Analysis (AREA)
Description
【発明の属する技術分野】
本発明は画像領域の抽出及び画像の再生、特に圧縮画像からの注目画像領域の抽出と圧縮画像の再生方法及びその装置、又その処理に関連するコンピュータプログラム及びコンピュータ読み取り可能な記録媒体に係わり、特に、圧縮された画像データ形式である例えばJPEGファイル画像から注目画像領域を抽出して所望の再生をするために用いて好適なものである。
【0002】
【従来の技術】
デジタルカメラなどで撮影して圧縮された例えばJPEGファイル画像をパーソナルコンピュータ(PC)などで再生して、表示を行う場合又はPCプリンタもしくはダイレクトプリンタなどから印刷を行う場合や、DPEでプリントを行う場合がある。この時に、撮影画像データが良質な場合は忠実に再生して表示又はプリントすればよいので問題は生じない。
【0003】
しかしながら、撮影画像データによっては色被り、コントラスト不足、露出の不適切などがあり、良質な印刷結果を得るためには画像補正を施す必要がある。特に、人物を撮影した画像の場合には、一般に、人の顔の色が適正になるように再生してプリントすると写真を見た人に与える感じが良くなり、写真の質を高めることになる。風景や物を撮影した場合でも、目標とする撮影対象物の色が適正になるように再生してプリントすることが望まれる。
【0004】
例えば、銀塩写真の場合、質の良い写真を得るためには原画像ごとに焼き付け時の露光量を変更することが好ましく、この焼付け時の露光量を決めるのに、人物が入った写真の場合には、人の顔の色に着目するのが便利である。何故ならば、人の顔は肌色であることが分かっているために、焼き付けられた写真における人の顔の色が肌色になるように露光量を決めることが可能であるからである。
【0005】
従来、デジタルデータの画像ファイルから画像認識する方法としては、例えば特許文献1、特許文献2、特許文献3など知られている。
【0006】
これらの方法は、指定画像との類似度や一致度を検出するもので、特許文献1の場合は、直流成分によるブロック単位での粗一致を求め、その後、候補画像領域に対して復元処理を行い、非圧縮データとして微一致を求める方式である。
【0007】
また、特許文献2の場合は、検索データを入力作成し、このデータと複数の画像データの類似度を判定する画像処理装置である。さらに、特許文献3の場合は、検索対象画像をウェーブレット変換して圧縮画像を作成する。また、指定された画像にもウェーブレット変換を施し、各々の特徴データを比較することで、類似度を判定するようにしている。
【0008】
一方、画像を補正する方法としては、デジタルカメラで撮影した画像をプリントする際に、アプリケーションやプリンタドライバのアプリケーションにより、撮影データをヒストグラムなどで解析し、コントラスト、ホワイトバランス、露出補正、シャープネスなど画像補正を一様に施すものが知られている。
【0009】
【特許文献1】
特開平8-161497号公報
【特許文献2】
特開2000-48036号公報
【特許文献3】
特開平11-238067号公報
【0010】
【発明が解決しようとする課題】
しかしながら、上記従来の方法では補正対象の注目画像領域を正確に見付け出して、その注目画像領域を所望の色に補正することが出来ない。
【0011】
すなわち、デジタルカメラなどで撮影した例えばJPEGファイル画像を再生して表示又はプリントする場合に、銀塩写真のプリント処理のように、人物など注目画像が、より良く表示又はプリント出来るように必要に応じて補正を行えるように、上記JPEGファイル画像の中に注目画像領域を見つけ出す方法を決める必要がある。
一方、デジタルカメラからプリンタへ直接プリントを行うダイレクトプリントなどデータ処理能力の低い機器でも使用出来るように、検出処理は出来うるだけ軽く済む方法が求められている。
本出願人は、上述の問題点に鑑み、画像ファイルの中の注目画像領域を処理不可の少ない方法で抽出できる、また、入力画像サイズに関係なしに画像ファイルの中の注目画像領域を処理不可の少ない方法で抽出できる方法を提案した(特願2002-193620)。
【0012】
ところが、注目画像領域抽出に用いられる色度比率判定やDCTのAC成分による特徴量判定の判定方法が、必ずしも最適化されていないことによる注目画像領域のより欠損の少ない完全な抽出が出来ない画像などが存在する。
【0013】
また、注目画像検出の判定に用いられるDCTのAC成分の特徴量判定においては、画像サイズごとに、検出サイズクラスにより判定テーブルを持つ必要があったが、判定テーブルの複雑さを招く。
【0014】
本出願人は、また、特徴量判定の判定方法を最適化し、注目画像領域のより欠損の少ない完全な抽出する方法を提案した(特願2002-193621)。
【0015】
また、JPEGによる圧縮画像の圧縮比率に関わる量子化テーブルの値が、撮影時やアプリケーションによる編集後の再保存により一様ではなく、高圧縮の量子化テーブルを使用すると、画像中の空間周波数が極端に変化してしまい、注目画像領域における周波数特徴量も影響を受け、上記検出精度が落ちてしまう可能性もある。
本出願人は、更に、画像ファイルの中の注目画像領域を抽出する際に量子化テーブルの特性を利用した判定を行うようにして、処理負荷の少ない方法で注目画像領域を抽出できる技術を提案した(特願2002-193622)。
【0016】
しかしながら、更に、画像の輝度によって注目画像領域抽出に用いられる色度比率判定が不正確となったり、上記注目画像領域抽出による取得データにおいて露出補正などへの応用が考えられたが、人物顔画像がボケたようなものにおいては、適正な補正への情報を取得できているとは言えない部分が生まれる。
【0017】
本発明は、上記問題点に鑑み、画像の輝度によって注目画像領域抽出に用いられる色度比率判定を適正化して、安定した注目画像領域の抽出及び画像の再生を行うことを目的とする。
【0018】
又、人物顔画像などがボケたようなものにおいては、適正な補正への情報を取得できるようにすることを目的とする。
【0021】
【課題を解決するための手段】
この課題を解決するために、本発明の画像再生方法は、圧縮符号化された画像データを復号して画像を再生する画像再生方法であって、復号した前記画像データから所定の色度範囲の連続するブロックを抽出するブロック抽出ステップと、前記連続するブロックの空間周波数の平均値に基づいて、前記連続するブロックを注目画像領域とするか否かを判定する判定ステップと、前記注目画像領域から特徴部位を抽出する特徴部位抽出ステップと、前記抽出された特徴部位の画素数と前記圧縮符号化に利用した量子化フィルタ値とに基づいて、前記特徴部位のボケの補正強度を決定する決定ステップと、前記決定ステップで決定された補正強度に応じて前記特徴部位のボケを補正するボケ補正ステップと、前記補正ステップでボケが補正された画像を再生する再生ステップとを有することを特徴とする。
【0022】
ここで、前記決定ステップでは、前記特徴部位の画素数が少なく前記量子化フィルタ値の値が大きいほど、ボケをより強く補正する補正強度に決定する。また、前記所定の色度範囲を、前記復号した画像データの輝度値に基づいて設定する。また、前記圧縮符号化された画像データを復号して前記復号した画像データを生成する復号ステップと、前記復号した画像データから色度、空間周波数、輝度を求めるステップとを更に有する。また、前記圧縮符号化された画像データはJPEG画像データであり、前記復号した画像データはDCT係数と逆DCT変換されたビットマップデータとを含む。また、前記ブロック抽出ステップで抽出された前記連続するブロックの数に基づいて、注目画像領域となる候補を選別する選別ステップを更に有する。また、前記ボケの補正は、アンシャープマスク処理により行われる。
【0023】
又、本発明は、上記方法のステップをコンピュータに実行させるためのコンピュータプログラム及び該コンピュータプログラムを記憶したコンピュータ読み取り可能な記憶媒体をも提供する。
【0025】
又、本発明の画像処理装置は、圧縮符号化された画像データを復号して画像を再生する画像処理装置であって、復号した前記画像データから所定の色度範囲の連続するブロックを抽出するブロック抽出手段と、前記連続するブロックの空間周波数の平均値に基づいて、前記連続するブロックを注目画像領域とするか否かを判定する判定手段と、前記注目画像領域から特徴部位を抽出する特徴部位抽出手段と、前記抽出された特徴部位の画素数と前記圧縮符号化に利用した量子化フィルタ値とに基づいて、前記特徴部位のボケの補正強度を決定する決定手段と、前記決定手段により決定された補正強度に応じて前記特徴部位のボケを補正するボケ補正手段と、前記補正手段によりボケが補正された画像を再生する再生手段とを有することを特徴とする。
【0026】
ここで、前記決定手段は、前記特徴部位の画素数が少なく前記量子化フィルタ値の値が大きいほど、ボケをより強く補正する補正強度に決定することを特徴とする。また、前記圧縮符号化された画像データを復号して前記復号した画像データを生成する復号手段と、前記復号した画像データから色度、空間周波数、輝度を求める手段とを更に有する。また、前記圧縮符号化された画像データはJPEG画像データであり、前記復号した画像データはDCT係数と逆DCT変換されたビットマップデータとを含む。また、前記ブロック抽出手段により抽出された前記連続するブロックの数に基づいて、注目画像領域となる候補を選別する選別手段を更に有する。また、前記ボケの補正は、アンシャープマスク処理により行われる。
【0027】
【発明の実施の形態】
次に、添付図面を参照しながら本発明の注目画像領域の抽出方法、圧縮画像の再生方法及びその装置、又その処理に関連するコンピュータプログラム及びコンピュータ読み取り可能な記録媒体の実施形態を説明する。
【0028】
以下、本実施形態では、例えば、圧縮された画像データ形式であるJPEGファイル画像から注目画像領域を抽出して所望の再生を行う例を説明するが、JPEGによる圧縮に限定されることはなく、本発明のように圧縮過程でシンボルデータ(本例ではDCT係数)から画像の空間周波数を抽出可能な圧縮技術において広く適用が可能であり、本発明はこれらも含むものである。又、本例では、特にJPEGファイル画像を再生してプリントする例を中心に説明するが、本発明は圧縮画像の再生出力(表示、プリントを含む)の技術であり、これらも含まれる。
【0029】
更に、本発明の注目画像領域の抽出方法は、圧縮画像からの注目画像領域の抽出に限定されることなく、圧縮されていない画像からの所望の注目画像領域の抽出にも適用される技術であってこれらも含み、同様の効果を奏するものである。
【0030】
<本実施形態の復号再生の対象である圧縮符号化データの例>
最初に、現在、最も一般的な画像圧縮ファイルの"JPEGファイル"の情報省略と符号化・復号化について、図2及び図3を参照して説明する。
【0031】
まず、符号化であるが、通常、デジタルカメラやデジタルビデオなどでは、静止画をJPEG ファイルにて保存することが一般的になっている。この場合、入力機器の受光素子であるCCDなどの入った信号をA/D変換した後、フレームメモリーに取り込み、RGBもしくはCMYフィルタの情報を輝度と色度情報とに変換する。その後、8*8(64個)正方画素ブロックに分割する。
【0032】
図3の▲1▼は、輝度データのビットマップを8*8ブロックに分割したうちの1ブロックのデータ例を示している。また、図3の▲2▼においては、0〜255の画素値をレベルシフトして−128〜127の信号に変換する例を示している。さらに、図3の▲3▼においては、DCT(離散コサイン変換)によりDCT係数を求める例を示している。
【0033】
また、図3の▲4▼は、視覚特性を考慮した高周波成分の省略を大きくした量子化テーブルであり、このテーブルを用いて、上記図3の▲3▼の結果であるDCT係数に対して量子化する例を示している。
【0034】
図3の▲5▼は、量子化を行った結果である。この値をエントロピー符号化してハフマン符号で表すことにより符号化信号である圧縮データを生成する。
【0035】
次に、復号化においては、上述した符号化の逆の工程を行う。つまり、符号化信号を復号して、量子化DCT係数の値を復号する。次に、逆量子化を行うために量子化テーブルを乗ずることでDCT係数を得る。その後、逆DCTを行うことでレベルシフトした画像が復元され、更に逆レベルシフトの値128を加算することで1ブロックの画像が復号される。
【0036】
上記の説明では、輝度情報と色度情報とに分割したデータを合成してRGB画像に変換することを省略したが、符号化における流れとしては、図2に示すように、カラー画像を輝度成分(Y)と2つの色度成分(Cb、Cr)とに変換し、その各々を符号化して合成することで、圧縮画像データを生成している。
【0037】
以上のような、圧縮された画像データファイルであるJPEG画像をプリントする方法としては、入力機器からの圧縮画像データをUSBや記憶メディアによって、パーソナルコンピュータ(以下、PCとする)に取り込んで画像を展開し、必要に応じて画像補正を加えた後プリンタへデータを送る場合や、入力機器からの画像データを直接プリンタへ入力し、プリンタの中で、画像を解凍し、必要に応じて画像補正を加えた後で印刷を行うなど、幾種類かの選択肢がある。
【0038】
いずれにしても、良好な画像をプリントするためには、撮影画像データが良質な撮影画像であるか、あるいは補正が必要な画像であるのかを判断して、忠実に印刷すべき良質な画像と、補正を行うことにより良質な画像に近付けた後に印刷を行うもとをより分ける必要がある。
【0039】
良好な画像とは、下記のようなことが考えられる。
1)ホワイトバランスが良好である。
2)コントラストが適切である。
3)必要な部分の階調が割り当てられている。つまり、露出設定が良好である。4)彩度が適正である。
5)銀塩写真のような仕上がりである。
6)人物など注目される画像が中心に補正されている。
【0040】
現在市販のPCプリンタやPCを経由しないダイレクトプリンタなどにおいても上記1)〜5)の項目においては、程度の差も有るが行われている。また、上記6)の注目画像に対する補正が行われていないのは、その検出に多大な処理が必要であることと、その方法が確立されていないことによる。
【0041】
特に、処理能力のひ弱なダイレクトプリンタなどにおいては実施が難しいとされているが、本発明はこれを解決するものである。その手段としては、JPEG画像ファイルに注目画像の存在の検出と、その検出した画像に対する補正の必要等の確認を経て、全体画像補正へ受け渡す方法となる。
【0042】
<第1の実施形態の画像処理装置の構成例>
以下に、第1の実施形態の画像処理装置の構成例をブロック図で示す。
【0043】
図1Aは、JPEG ファイルを解凍する過程とその際に取得する情報について表した復号部10のブロック図である。
【0044】
JPEG ファイルをRGBのビットマップデータへ変換する過程においては、まず、符号テーブル2を用いてエントロピー復号化部1にてエントロピー復号を行う。次に、逆量子化部3において、逆量子化に使用する量子化テーブル4を、逆量子化を行う他にデータとして記憶する。
【0045】
この逆量子化されたデータは、ブロック単位のデータとして周波数変換されたものであり、このデータを、画像周波数特性を得るためのデータとして取得する。その後、逆DCT部5において、逆DCT処理と逆レベルシフトとを行いYcc−RGB変換することで、通常のRGBビットマップデータに展開する。
【0046】
図1Bは、上記復号部10を含む本実施形態の画像処理装置の構成例を示すブロック図である。
【0047】
本実施形態の画像処理装置は、復号部10と復号部10から取得したデータに基づいて補正対象の画像領域を認識する画像認識部(第1画像抽出を実行)100と、画像認識部100からの認識領域を所望の色に補正する色調補正部20とから構成される。色調補正部20から出力される再生され補正された画像(BMP)は、プリンタに送られてプリントされる。
【0048】
画像認識部100は、復号部10から復号画像(BMP)を受信して指定された対象色(本例では肌色)の領域を検出する対象色検出部101と、復号部10から復号DCTデータを受信して、対象色検出部101で検出された対象色の候補領域における空間周波数を生成する空間周波数生成部102と、対象色検出部101で検出された対象色の候補領域から空間周波数に基づいて、色調補正の対象領域を選別する対象色領域選別部103を有する。対象色検出部101は復号画像を記憶する復号画像記憶部101aを有するが、この復号画像記憶部101aは対象色検出部101にある必要はなく他の処理部と兼用されてよい。又、対象色領域選別部103は、選別のための判別テーブル103aを有している。かかる判別テーブル103は、画像のサイズに対応して複数の判別テーブルを有してもよい。
【0049】
画像認識部100は、更に、本実施形態の処理を改善するために、復号部10から量子化テーブル値を受信して、禁止するためのしきい値104aに基づく判定から色調補正処理を禁止する色調補正禁止部104を有する。
【0050】
色調補正部20は、画像認識部100で選別された選別領域の色を補正対象色(本例では肌色)に、例えば色補正テーブル20aなどを使用して既知の色補正処理を行う。この色調補正の処理は、所定の条件で対象色領域選別部103あるいは色調補正禁止部104からの色調補正禁止信号により禁止される。この補正処理は簡素化のためには画像全体に施しても良いが、画質を高めることが目的であれば領域によって異なる補正、あるいは部分的な補正であってもよい。本発明の特徴は、かかる色調補正の方法にはないので、本実施形態の説明では簡単に済ますことにする。
【0051】
図1Cは、本実施形態の画像処理を実現するハードウエア及びソフトウエアの構成例を示す図である。尚、図1Cは、本実施形態の特徴部分である画像認識部100を中心に説明している。この装置は汎用のコンピュータでも実現できるし、専用のコンピュータにより実現してもよい。
【0052】
110は演算処理のCPU、120はCPU110が使用する固定のデータ及びプログラム(OSやBIOSなどはここに有るとする)を格納するROM、130は本実施形態でCPU110が使用するデータやプログラムを一時格納するRAMである。ここで、本例では、アプリケーションプログラムは、後述の外部記憶部140からRAM130のプログラムロード領域132にロードされて、CPU110により実行されるとしている。
【0053】
RAM130がデータ記憶領域131に記憶するデータには、復号部10が復号した復号画像あるいは色調補正された再生画像を記憶する復号画像データ領域13a、補正対象色(本例では肌色)データを記憶する補正対象色領域13b、検出された対象色領域を記憶する候補領域の記憶領域13c、候補領域から形成される候補グループを記憶する候補グループ領域13d、最終的に選別された領域を記憶する選別領域の記憶領域13e、復号部10からの復号DCTデータを記憶する復号DCTデータ記憶領域13f、生成された空間周波数を記憶する空間周波数領域13g、対象色領域を選別するために使用する判別テーブルを記憶する判別テーブル領域13h、復号部10からの量子化テーブルを記憶する量子化テーブル領域13i、量子化テーブルの係数を加算した値を記憶する量子化係数加算値の記憶領域13j、色調補正の禁止などに使用するしきい値群を記憶する領域13kを含んでいる。
【0054】
140は、ディスクやメモリカードなどの大容量あるいは抜き差し可能な媒体からなる外部記憶部であり、フロッピー(登録商標)ディスクやCDなどを含む。
【0055】
外部記憶部140のデータ記憶領域141には、判別テーブル1〜n14aやしきい値群14bが格納されている。又、他のパラメータや画像データなどを蓄積するデータベースが記憶されてもよい。プログラム格納領域142には、大まかに分類すると、対象色領域検出モジュール14c、空間周波数生成モジュール14d、対象色領域選別モジュール14e、色調補正禁止モジュール14f、そして後述の第2の実施形態で実行される特徴部位抽出モジュール14gが格納されている。
【0056】
更に、図1Cの装置は、復号部10及び/又は色調補正部20を兼ねてもよく、その場合には、更にデータとしてし色調補正テーブル14f、プログラムとして色調補正モジュール14i、後述の第2の実施形態で使用されるボケ補正モジュール14jを格納してもよい。
【0057】
150は入力インターフェースであって、本例では復号部10からの復号データ(BMP)、復号DCTデータ、量子化テーブル値、また装置固有のあるいは外部から指定可能な対象色データを入力する。160は出力インターフェースであって、選別領域や色調補正禁止信号を出力する。尚、本装置が色調補正部も兼用するのであれば、出力は色調補正画像データ(BMP)となる。更に、本装置が復号部10も兼ねてもよく、その場合はJPEGデータが入力され色調補正画像データ(BMP)が出力される。その場合には、さらにデータ及びプログラムが準備されることになる。
【0058】
<第1の実施形態の画像処理装置の動作手順例>
次に、この画像処理において、最も重要と思われる注目画像検出である人物検出のフローチャートを図6に示す。
【0059】
尚、図6に示される検出工程は、大きく分けて2段階あり、1段階目はステップS601からS608を含み、画像全体から、圧縮単位である8*8ブロックの画素単位での色度比率が検出対象の定義色度に対応している領域とそれ以外の領域に分離し、該当ブロックの長手方向(図10や図14のような横長の画像では横方向を示す)に隣接する物をまとめることで、候補を作成する段階であり、2段階目はステップS609からS613を含み、定義した色度比率に該当する候補がDCTのAC成分の平均値において、検出対象の定義した特徴量範囲に該当しているかを判定して、該当する候補に基づき注目画像を判別する段階である。
【0060】
<1段階目の処理例>
最初のステップS601において、8*8画素のブロック単位のDCTデータと量子化テーブルとを取得すると同時に、画像ファイルはRGBビットマップデータに展開する。
【0061】
(肌色色度のブロック検出例)
次に、ステップS602に進んで、RGBビットマップデータにおいて、8*8画素のブロック単位に本実施形態における注目画像である人の肌色の色度に対応するか検索を行う。
【0062】
この場合、入力画像サイズにより8*8画素ブロックの画像が全画像に対して占める割合が違うので、入力画像サイズに比例した端部の設定を行う。例えばVGA(640*480)では8ブロック分(長手方向4×短い方向2)で、UXGA(1600*1200)画像においては20ブロック分(長手方向5×短い方向4)とする。
色度の検索方法としては、複数の方法がある。知られているものとしては、
1)B(青)/G(緑)の比率が0.7〜0.8の範囲に収まり、R(赤)/G(緑)の比率が1.4〜1.8の範囲に収まる色度を持つもの。
2)図5の概念図に示すように、肌色を確率楕円にて表すことができる。求める式としては下記の式(1)〜式(3)になる。
【0063】
【数1】
【0064】
本実施形態においては、処理の簡便さを考慮に入れた下記式(4)である色度分布範囲を肌色の色度範囲とした。この範囲を表したのが図20である。
【0065】
【数2】
【0066】
本実施形態においては、画像における周波数成分の特徴を検出する単位として8*8画素単位のブロックで行っている関係で、構造的論理的な簡単さより色度判定においても8*8画素単位にて実行する。
【0067】
図7は、本実施形態で用いている色度検出ポイントを図示したものである。これによると「8*8画素」単位のブロックの四隅の色度の全てが色度範囲に入っているか否かを確認し、全てが範囲に入っている時は、そのブロックを適合色度と判定している。
【0068】
図7においては、上段の左から2番目と下段の左から1,2,3ブロックが該当する。上段の一番左のブロックは4ポイントのうち左上の式度は非肌色ピクセルと判定されるので、これを含むブロックは肌色の範囲外と判定される。同じように上段の右側1,2ブロックと下段の一番右のブロックが範囲外となる。
【0069】
図8は、「8*8画素」単位のブロック全体の平均色度による判定である。このブロック内の平均色度の求め方としては、8*8ブロック全ての画素値の平均値を取る方法の他に、解凍中の逆DCTを行う前の色度データ(Cb,Cr)の中のDC成分から求めることも可能である。この方式の利点としては、ブロック全体の色調にて判定できるので、検出点の少ないものに比べて精度が高い期待ができる。ここで、自然画における色度のみの検出についての内容を見ることにする。
【0070】
図9は、図7と同じ考えの中ではあるが、全体画像における検出間隔を等分化するためのものである。
【0071】
図10は、一般的なポートレート写真であり、図14は人物の肌色色度と同様な色度範囲を有する枯木の林の写真である。図10と図14に対して、それぞれの画素に色度の適合だけで検出を行った結果を図11と図15に示す。
【0072】
図11のポートレートでの検出結果としては人物の肌色部分をよく検出しているが、その他に柵や背景の中で、ごみのような細かい部分においても適合色度を満たすものが検出されていることがわかる。このため、色度のみでは注目画像を特定できないことがわかる。
【0073】
図14においては、人物の肌色を検出する目的にもかかわらず同じ色度を持つ枯れ木の林が全面検出されている。このように、画素レベルでの色度判定を行った場合、注目画像を特定することは不可能である。
【0074】
検出をブロックレベルにすることにより、特定のまとまりを持った状態が対象になるので、外来ノイズの影響は受けずらくなる。
【0075】
(肌色色度のブロック検出の改善例)
図35は、デジタルカメラで撮影された複数の人物肌領域の平均色度比率をプロットしたグラフである。横軸は、赤色成分の色度比率で、“R/R+G+B”の計算により各8*8ブロック単位で求めた物を、検出全領域において平均値を出した物である。縦軸は、緑色成分の色度比率で、“G/R+G+B”の計算により各8*8ブロック単位で求めた物を、検出全領域において平均値を出した物である。また、このグラフにおいては、領域の色度比率に関連付けて領域の平均輝度も8等分して分類をしている。
【0076】
前記実施例においては、適合色度比率範囲を、下記のように設定している
赤色成分の色度比率“0.35〜0.44”
緑色成分の色度比率“0.29〜0.33”
このグラフの結果を見ると、定義に大半は適合するが、人物の肌の色は、反射光の為光源により定義に入らない物も存在する。その中で、注目すべきは輝度が160以上の分布である。特に223〜255の採光輝度に分類される領域においては、分布が前記定義より左上方向である白色方向へシフトしていることが認識できる。
【0077】
図38は、高輝度領域を人物肌に持った物の画像サンプルである。この画像の輝度分布を示した物が図42である。
【0078】
図42においては、横軸は0〜255階調に表された輝度範囲で有り。左端が0、右端が255である。縦軸は、画像内の輝度成分を持った画素の分布である。左側の小さい山は輝度の低いコート部分。真中やや右目の大きい山は舗装道路であり面積占有率が一番大きい。最右部に人物の顔の輝度情報が分布している物である。
【0079】
この画像図38に対して、先の実施例の定義で一次抽出における色度比率によるグループ検出を行うと、図39のような結果になる。図38の人物肌の領域を考えると輝度の上昇により赤色成分がオーバーフローして色度比率の適応範囲から白飛びしてしまっている事が確認できる。この領域だけでも、露出補正などへ利用する情報としてなら利用可能であるが、前記ボケ補正などに利用するには、人物肌の顔領域の検出が不十分である。
【0080】
図40は、適応色度比率の範囲を下記のように広げただけの場合の結果である。
赤色成分の色度比率“0.33〜0.46”
緑色成分の色度比率“0.27〜0.35”
適応色度比率の範囲を広げるだけでは、人物の肌領域は検出できるが、舗装道路の色度比率も適応化してしまい、注目画像以外の領域についても検出してしまい、結果的に効果を上げることは出来ない。
【0081】
図48は、この状態を鑑みて人物肌の色度比率適応範囲の定義を入力画像のレンジを考え、輝度クラスにより定義した物である。
【0082】
上記定義は、輝度160までは前記定義と同じ色度比率範囲としているが、輝度が上がるにつれ検出した人物肌の色度範囲が移動しているのに対応した物で、輝度220以上に付いては下記の範囲とする。
赤色成分の色度比率“0.33〜0.42”
緑色成分の色度比率“0.30〜0.34”
また、輝度レンジが161〜219までの間は一次式による算出により範囲を規定する。
【0083】
この方式を用いて、図38に対して検出した結果が図41である。
【0084】
本実施例においては、色度比率範囲を高輝度においても適応領域の範囲に変化は無いようにしているが、色度比率が白色に近くなるにつれ人物肌以外においても自然界に存在する物が多くなるので、誤検出を防ぐ為に高輝度域の適応領域の範囲は狭めても良い。
【0085】
(肌色ブロックの連続範囲による候補検出例)
ステップS602での8*8画素のブロックの人物肌抽出が適正なまとまりの大きさとは言えず、色度によるブロック検出においても縦方向及び横方向に隣接したブロックの連続検出という、制約を付けた検出を行うことで更に精度を上げる。
【0086】
人の肌色であってもプリントにおいて顔を認識できるデータ量を満たさないものにおいても適応外としてはじいてもよいと言う概念でノイズと判定する連続範囲を設定する。
【0087】
この部分を表したのが、図6のステップS603以降の処理である。すなわち、ステップS603においては、画像に対して長手方向(図10や図14のような横長の画像では横方向を示す)にブロックごとに色度検出を行い、連続検出ブロック数の多い順に候補を策定する。
【0088】
次に、ステップS604において、その連続量が、注目画像としての適応する連続量に入っているか否かを比較する。本例では、VGAで2ブロック、UXGAで4ブロックとしている。この比較の結果、該当する連続ブロックがある場合はステップS605に進み、短い方向のブロック連続検出設定を満たすデータが画像に存在するか否かの、検索を行う。本例では、VGAで2ブロック、UXGAで4ブロックとしている。
【0089】
次に、ステップS606において、検出データが有るか否かを判断し、検出データが有る場合にはステップS608に進んで、この過程で残ったものの中から長手方向の連続ブロック量が大きいデータから順に候補番号を付ける。
【0090】
また、ステップS606の判断の結果、検出データが無い場合にはステップS607に進み、「目的領域無し」をセットして処理を終了する。
【0091】
<2段階目の処理例>
まず、連続ブロックにて色度判定を施した場合の効果について、図12と図16で示す。
【0092】
図12においては、図10のポートレート画像に対して検出を行った結果である。図12において、検出候補の優先順位が高い方から(検出ブロック長が長い方から)カラーコード(1=茶、2=赤、3=橙、4=黄、5=緑、6=青、7=紫、8=灰)順に配置され、それ以外で検出されているのは色度のみ適性範囲に入っているものである。連続ブロック検出により画素レベルの色度検出と比べるとかなりの背景などの非該当候補を削除できていることが判る。
【0093】
図16においては、図14の枯木の林に対して検出を行った結果で、連続ブロック検出においても注目画像以外を検出してしまうことがわかる。
【0094】
(候補領域からの目標領域の選別例)
(VGAサイズの判別テーブル例)
次に、VGA(video graphics array)サイズ(640*480画素)の複数の画像サンプルを用いて人物肌と枯れ木の林の部分において、検出された適合色度連続ブロックにおける周波数特性を算出した。
【0095】
図18は、画像内に撮影されている人物肌の連続ブロック検出されたブロックのDCTデータを周波数の低い順に並べたものを、周波数の低い方から10個単位で加算し、連続ブロック数で除したもので、連続検出されたブロックの1個あたりの平均周波数成分をまとめたものである。
【0096】
したがって、図面において横軸は、AC成分63個の周波数成分をまとめたもので、10個単位のまとまりが6グループと最も周波数の高いデータは3個分のデータとなる。縦軸は、各周波数成分の要素を加算した値である。
【0097】
これにより、値が大きいほどそのブロックにおいて、該当周波数成分が高いことがわかる。また、検出した連続ブロック数ごとに色分けしたデータ線で表されている。例えば"B2"は連続ブロックが2個検出されているデータの平均した値を表し、"B15"は連続ブロックが15個検出されているデータの平均した値を表している。以下同じで、"B2〜B15"までの複数画像からの平均的な人物肌色部分の連続検出値ごとの空間周波数特性を表している。
【0098】
検出結果を見ると、
1)低い周波数成分の値が大きく低い周波数成分の下から3グループ以降は、連続ブロック数に係わり無く50以下となっている。
2)連続ブロックの連続値が大きいほど周波数特性が低くなっている。
【0099】
これらの結果から言えることは、人物の肌色部分の周波数特性は比較的低い周波数で構成されていることと、検出された連続ブロックの値が大きいことは、被写体の撮影された大きさが大きいことを示していて、この連続ブロックとしての平均値を出すことによって周波数成分が下がっていることがわかる。
【0100】
連続ブロックの連続値により、同じ注目画像の色度を持っているものでも、その連続ブロックを1つの代表値にすること(例えば、B6のブロックの時は検出した6個のブロックの値を、各々周波数の低い順に10個単位のグループとして加算したものをグループごとに加算した後、その連続値である6で除して平均を出している。)により、空間周波数特性の値が変わるので、連続検出値により適当な該当周波数特性が違うことが判る。
【0101】
図19は、人物の肌色色度と同様な色度範囲を有する枯木の林の写真を複数用意して、検出を行った結果を図18と同じように表したものである。
【0102】
検出結果を見ると、
1)人物の肌の空間周波数特性と比べると高い周波数成分にデータ多くあることが確認できる。
2)一番低い周波数成分のグループは人物の肌の結果と大きくは違わない。
【0103】
これらのことから、連続ブロックにおける周波数成分を検出することで、同じ色度を持った検出物体を周波数特性により区別することが可能であることがわかる。
【0104】
図4は、本実施形態において使用したもので、注目画像である人物肌の空間周波数特性を表したものである。上の段がVGA(640*480)画像における周波数特性の適正範囲である。
【0105】
連続ブロック値を2〜8個のグループ(〜L8)と9〜20個のグループ(L9〜20)と21個以上のグループ(L21〜)の3グループにまとめて、グループごとに周波数の適正範囲を設定したものである。周波数の適正範囲も先に示した10個単位の7グループによる周波数特性を用いた。これは、処理の簡略化と検出精度のバランスで行ったもので、これに縛られる必要は無い。
【0106】
(VGAサイズ/UXGAサイズの判別テーブルの選択例)
次に、画像サイズがデジタルカメラで普及している200万画素相当のUXGA(1600*1200)画像について同じ撮影条件でVGA画像と比較してみる。
図25は、図18で使用したデータと同じシーンを対象にUXGAサイズにて撮影したものを検出した結果を、図18と同じように周波数特性量と各レンジにおけるデータ量の平均を用いて表したものである。
VGA画像との検出特性の差を見ると、
1)連続検出ブロックの検出範囲が大きくなっている。具体的にはVGA画像検出での連続値は2から15ブロックの連続検出である。それに対して、UXGA画像検出では検出値が4から40の連続ブロックを検出している。
2)UXGAの方がブロック内の周波数特性が低い。例えば、1〜10のブロック平均を見ると、VGA画像では300〜100のデータ量に分布しているのに対し、UXGA画像では200〜30の範囲にデータが分布している。一枚の画像に収まる中で、注目画像になりうるものは、全画像に対する大きさとしては、特定の比率の範囲に入っているのが一般的な考え方である。
すなわち、画像全体における画像補正の対象となりうる検出すべき対象画像が、検出したい画像であり、たとえ人物の顔が検出できても豆粒程度なら、そのために、そこを中心に補正を行うことは、他の領域とのバランスを考えた時、好ましいとわ言えない。この考えに基づいた例として画像に占める割合が100分の1程度以下では検出する意味が少ないと言える。
【0107】
例えば、画像全体の中で注目画像が長手方向で100分の1しか占めない場合はどうであろうか、一般のプリントを考えた場合、その注目画像に対して最適な補正を掛けても、出力後の補正を行われた注目画像は、ほとんど紙面を占めておらず、特定の注目画像を補正するよりは画像全体を補正する方がその画像においては効果的と考えられ、注目の定義から外れると考えられる。
本実施形態においても、各画像サイズに適したそれぞれの注目画像の適正範囲を持っている、この範囲以下でも以上でも補正対象とする注目画像の検出候補から外れる。
したがって、この例においては、UXGA画像における長手方向の100分の1は1600割る100なので、16pixelで2ブロック(8*8)分になり、色度と周波数成分が合致してもレングスの意味合いから候補の対象から外している。ちなみに、UXGA画像においては、検出連続範囲としては4〜62ブロックと設定している。
VGA画像においては、同じ考えで100分の1は6.4pixel となり、1ブロック分にも満たない。VGA画像においては、検出連続範囲としては2〜25ブロックと設定している。この違いは、画像サイズによる1ブロック(8*8)分の全画像に対する占有比率の差によるものが発生している。
画像全体中の一定の比率範囲に注目画像が入っていると考えると、画像サイズにより8*8画素のブロックの空間周波数における意味合いは変わる。このため、同じ撮影画像でも画像サイズにより検出ロック数も違えば周波数特性も違ってくる。
本実施形態では画像ごとに検出連続範囲を上記のように設定しているが、数式に置き換えることも可能である。 例えば、下記式(5)の様に最低連続数を設定することができる。
【0108】
【数3】
次に、図26を示す。図26は、人物の肌色色度と同様な色度範囲を有する枯木の林の写真であり、図19においてはVGA画像としてのデータを処理したが、UXGAの画像としてデータをまとめたものである。
図19との比較においては、先述の図18と図25の比較と同じ傾向がある。AC成分の20以上のグループではかなり高周波成分が低減していることがわかる。しかしながら、人物肌とのデータとは分布が極端に違うので、周波数帯域ごとに適応範囲を設定することで、分離することが可能である。
このために設定したものが図27のUXGA画像用判定テーブルである。構成は図4のVGA画像用判定テーブルと同じであり、画像サイズの違いによる平均ブロックの空間周波数特性の違いのみである。
【0109】
(VGA/UXGAでの判別テーブルの共有例)
図43はUXGA(1600*1200)サイズで人物を撮影した画像サンプルである。また、同じ人物の顔をVGA(640*480)サイズで撮影した画像サンプルが図45である。
【0110】
この2サンプル画像に対して先の実施例の定義で一次抽出における人物肌領域検出を行うと、検出領域の結果は、図44、図46のようになる。
【0111】
人物の顔の部分に注目すると、検出領域における検出ブロック数はUXGA画像(図44)が719ブロックであり、VGA画像(図46)では639とほぼ同じであり、この時のDCTのAC成分平均値による特徴量も下記表のようにほぼ同じになる。
【0112】
【表1】
【0113】
つまり、人物肌の検出領域におけるDCTのAC成分平均値による特徴量は、入力画像サイズに依存するよりも、検出した領域を構成する画素数(8*8のブロック数)に依存することがわかる。
【0114】
この考えを元に、複数の画像についてUXGA画像とVGA画像に対して検出した8*8ブロック数とDCTのAC成分平均値との関係をまとめた物が、図36(UXGA)、図37(VGA)である。
【0115】
図36及び図37の横軸は、DCT値のAC成分の平均値を空間周波数成分の低い領域から10個単位でまとめたものである。縦軸は、DCTのコード量(10個単位の和である。但し7グループ目は3個分の和になる。)
同じ画像でも、画素数が違う為全画像に占める人物肌領域の占有率は同じでも、検出した8*8ブロック数が違うので、図36と図37では、検出ブロック数の値が違う部分があるが、その中で共通な100〜199を見るとほぼ一致している特性を示していることが確認できる。
【0116】
上記結果より、検出画像サイズである8*8ブロック数と検出領域のDCT値AC成分の平均値特徴量を規定したものが図47である。
【0117】
先の実施例では、画像サイズにより特徴量判定テーブルを持つ必要があったが、本方式を用いることで、判定テーブルの簡素化を図ることが出来る。
【0118】
本実施例を利用した一次抽出のフローチャートを図49に示す。
【0119】
ステップS5901においては、1段階目の図48で規定した適合色度比率のブロック判定を行う。
【0120】
ステップS5902においては、上記ステップにおいて適合したブロックの隣接状況を検出し、グループ化する。
【0121】
ステップS5903においては、グループ化した候補において、グループの構成ブロック数の多い順に候補番号を発行する。
【0122】
ステップS5904においては、候補番号順にDCTのAC成分特徴量による判定を実行する。
【0123】
ステップS5905においては、判定に適合した最終検出した結果を画像補正へ渡せるように必要事項をセットする。
【0124】
(目標領域の選別手順例)
図6の説明に戻る。上述したように、色度により検出された長手方向の連続量が大きいデータから順に注目画像の候補番号1〜n(本実施形態においてはn=8)を付ける(ステップS608)。n以降の検出したものについては候補番号は付けられない。
【0125】
次に、ステップS609に進み、上記候補1〜nに対して、ステップS609からS612を実行して、図4で示した連続ブロック数に対する空間周波数特性適正範囲判定表の範囲に適合するか逐次比較する。この結果、適合する候補が存在しない場合は注目画像が存在しないと判断する。
【0126】
この候補1〜nに対して、画像サイズがVGA(640*480)である時は、図4で示した連続ブロック数に対する空間周波数特性適正範囲判定表の範囲に適合するか逐次比較する。最初の連続検出ブロックから周波数特性の特徴量について、適合範囲内であるか比較を行う。
【0127】
この時、上述したように入力画像サイズが違う画像、例えばUXGA(1600*1200)画像においては適合判定に図27のUXGAテーブルを使用して比較判定を行うのが好ましい。
この場合、本実施形態においては、画像サイズごと、もしくは、画像サイズ範囲(例えばVGA〜XGAとSXGA〜QXGAまでなど特定の画像範囲において共通のテーブル)ごとに設定した適応周波数特性判別テーブルにて周波数特性の比較判定を行ったが、数式を用いた判定基準を代わりに用意してもよい。
例えば、数式の作成方法としては、既に適正化テーブルがあるVGAとUXGAのテーブルを元にこの2点間の画像のサイズと周波数成分の値による変化量を対応付け、1次式にて近似して使用することができる。
(注目画像と補正値強度の決定例)
空間周波数による判定の結果、適合する候補が存在しない場合は注目画像が存在しないと判断する(図6には図示せず)。また、適合する候補が存在する場合には、ステップS613で候補グループを形成し、その1つを注目画像として補正量強度を決定する。
図22に、そのフローチャートを示す。
【0128】
最初のステップS2201において、候補の数を確認する(1〜m)。
【0129】
次に、ステップS2202に進み、候補グループを形成する。この場合、候補に隣接する色度適合ブロックを候補グループとする。この時、候補グループに複数の候補が含まれた場合は、候補番号の若い方を候補グループ番号とする。
【0130】
次に、ステップS2203に進み、候補グループが複数グループあるか否かを判断する。この判断の結果、候補グループが1つであれば、ステップS2205でその候補グループを注目画像として以下に示すポイントを算出する。
【0131】
一方、候補グループが複数グループあれば、ステップS2204に進み、各候補グループに対して、どちらのグループが補正対象となる注目画像としての重みが大きいかを判断するために、グループ内の確からしさをポイント換算で、比較を行い、よりポイントが高い候補グループが最終注目画像と設定される。もし同じポイントであれば、候補グループ番号の若い方を最終注目画像とする。
【0132】
ポイントの方法としては、候補が"m"個存在する場合、候補1のポイントは"m"。候補2のポイントは"m−1"以下同様に候補mのポイントは"1"となる。
【0133】
このようにして、候補グループ間の優位性を判断した結果の実例を図23に示す。検出した候補グループは2グループあり、そのうち右のグループのポイントが左の候補グループのポイントを上回ったので、最終候補となっている。
【0134】
また、ポイント数の絶対値は、対象となる候補グループの注目画像としての信頼度を表しているので、このポイントにより注目画像に対する補正強度を決定する。補正強度決定方法としては、ポイントによる閾値を設け、閾値の上下関係で強度の指定を行う。
【0135】
但し、このようなポイントによる注目画像の検出ではなく、より軽い処理として、一番長い検出値の候補が入るグループもしくは、検出値そのものを注目画像としてもよい。この場合、本実施形態より検出確率に多少の差は発生するが、処理能力の低い機器ではこの方式のほうが適合する場合もある。
<本実施形態の処理結果例>
先の、図10と図14に対する結果を図13と図17に示す。
【0136】
図13においては、注目画像である人物の顔の肌を検出している。また、図17においては、各候補が周波数特性に適合せず候補部分が黒塗りの状態で表している。これは、注目画像が検出されなかった状態を表し、注目画像に重みを置いた画像補正の対象にならないことを示し意している。
【0137】
こうして注目画像を検出することができる。通常の画像補正は、画像全体のバランスに亘って補正が行われるので、逆光などで本来注目したい画像の画質を落としてしまう場合が存在しているが、本実施形態による注目画像検出により、補正項目として輝度の最適化のための露出、及び好ましい肌色のための色バランスや彩度補正を注目画像のデータを基に補正を行うことで、より高品質な画像を得ることができる。
【0138】
図24に、一般画像補正を行った結果と、本実施形態の注目画像検出を利用して画像補正を行った結果の一例を示す。図24に示したように、本実施形態の注目画像検出を利用して画像補正を行った場合は、人物などの注目画像をより良くプリントすることができる。
【0139】
<第1画像抽出の処理手順の改善例1>
次に、復号部の量子化テーブルによる画像への特性を説明する。
【0140】
図28〜図30は、代表的画像アプリケーションがJPEGファイルを作成する時の画像圧縮比率を決定する為の13種類の量子化テーブルである。図28〜図30において、テーブル"00"は最も画像圧縮率を高めたものであり、テーブル"12"は保存画質を高め、画像圧縮率を低めたものである。
【0141】
テーブルについて説明すると、図3の▲3▼〜▲4▼で説明した8*8画像のDCT後のデータをさらに圧縮するために使用するもので、画像における64個の各空間周波数に対応した値に対して、同じ位置の位の値で量子化を行う。
【0142】
テーブル"00"の場合で、図3の▲3▼を量子化する時は、例えば8*8ブロックの左上の"224"の値をテーブル"00"の同じ位置の左上の値"32"で量子化し"7"となす。また、最も周波数成分の高い8*8ブロックの右下では"−1"を"12"で量子化し"0"となる。
【0143】
図31に、図28,29,30のテーブル"00"〜"12"の特性及び市販のデジタルスチルカメラの記憶部で使用している量子化テーブルを示す。
【0144】
横軸は、量子化テーブルAC分64個を10個単位でまとめたものであり、縦軸は、その10個単位の値の平均値である。したがって、どの空間周波数成分を多く量子化しているかを確認することができる。
【0145】
テーブル"00"〜"04"においては、低周波成分の量子化比率が大きくなっている。市販のデジタルスチルカメラでは、低周波成分での量子化量は少なく、高周波成分域においても"15"未満である。これに対応する量子化比率は、アプリケーションにおけるテーブル"10"以上であり、画像の量子化としては低圧縮率の分類になる。
【0146】
ポートレートである図10と、人物肌色度に一致する枯れ林である図14の画像に対して、上記テーブルを1個飛びに用いて量子化を行った後の画像に対して、それぞれ注目画像検出を行った結果を、図32及び図33に示す。
【0147】
図32の場合、テーブル"00"を使用した時は低周波成分の量子化の大きさにより判定テーブル(図4)による人物特性から外れてしまっている。テーブル"02"では、人物を検出したが、検出ポイントは低い。テーブル"06"以上で安定した検出ができている。
【0148】
図33の場合、テーブル"00"を使用した時は、本来人物肌判定テーブル(図4)より高周波域で、外れてしまう検出値が量子化による誤差で、"検出判定"となり、誤判定になってしまっている。こちらの場合でも、テーブル"08"以上で安定した検出ができている。
【0149】
したがって、量子化テーブルの値により、判定の精度が変わるので、このための量子化テーブル判定を行う。すなわち、圧縮画像のDCTのAC成分を特徴量として画像の中の特徴抽出を行う為、量子化テーブルの値があまりに大きいと、画像の中のAC成分が欠落してしまい、検出時に判定から外れてしまう可能性がある。そこで、一般のデジタルカメラや、Adobe PhotoShopでのJPEGで高品位と考えられる画像では問題なく検出対象とする為に、実データより推測して設定した値として、量子化テーブルの値の総和が”630”を超えない程度と言うことになっている。
【0150】
本実施形態においては、判定を簡単化するために量子化テーブルの各項目を加算し、その合計が"630"以下の場合のみ判定への使用を可能とする対応画像と判断することとした。
【0151】
量子化テーブルの判定方法は、この他に、低周波成分での値などに注目する方法、低域30までの総和を"150"とする方法など、検出する注目画像の空間周波数特性により幾つも考えることができるが、量子化テーブルの特性を使用するようにしてもよい。
【0152】
本例の処理を2段階目の前に実行する場合は、取得した量子化テーブルから図34のフローチャートに示した処理を行い、AC成分特性判定テーブルを設定する。
【0153】
処理としては、まずステップS3401で量子化テーブル内のすべての値を加算する。この値が、量子化の程度をあらわすことになる。ステップS3402でこの加算値が所定値以上か否かが判定され、例えば、この値が630以上である場合は、注目画像の空間周波数特性が変わってしまっていると考えられるので、注目画像検出は中断して終了する。630未満の場合は、注目画像の空間周波数特性に影響は無いと判断され、ステップS3403で(入力画像サイズによる)AC成分特性判定用テーブルの選択を行い、空間周波数による選別処理に進む。
【0154】
又、本例の処理を1段階目の前に実行してもよく、その場合はステップS3403では、図6の処理を実行する。
【0155】
<第1画像抽出の処理手順の改善例2>
上記第1画像抽出の処理手順では、1段階目では、短い方向には予め決められたブロック数(VGAでは2ブロック、UXGAでは4ブロック)で、長手方向に肌色ブロックが長く連続する場合を候補として抽出し、2段階目で空間周波数による選別と短い方向に隣り合う候補のグループ化を行った。
【0156】
しかし、1段階目で、抽出した候補から短い方向に隣り合う候補グループを作成して、候補グループに例えば上述のポイント数に基づいて番号を振りなおし、2段階目では、各候補グループの空間周波数による選別を行って、注目画像を抽出してもよい。
【0157】
この処理により、2段階目の処理が簡素化されると共に、空間周波数による選別をより安定的に実行することが可能になる。
【0158】
本実施形態においては、プリントのための最適画像処理用に注目画像を検出する方法を示しているが、表示用などにも使用できることは言うまでも無い。
【0159】
また、本実施形態においては、検出画像の周波数成分特性を見るために周波数情報を10個単位で加算して周波数成分の63個を7グループとして、画像の特性を判断したが、グループ化という発想をなくし、63個全ての周波数をそのまま利用してもよいことは言うまでも無い。
【0160】
更に、画像の長手方向からの連続量の検出後短い方向の検出を行ったが、この順序も逆になっても可能であり、この他、検出ブロックを一列のグループとして検出する方法以外にも色度で検出したグループにおける全ての方向に隣接したブロックグループという、とらえ方で空間周波数特性を確認する方法など、色度と周波数特性を組み合わせた検出方法はいくらでもあり、これら一連の検出方法は本発明に含まれることは言うまでも無い。
【0161】
本実施形態においては、図4や図27のように、連続検出値を3グループに分け周波数特性の適正範囲との比較を行い周波数特性の合否を判定したが、連続検出を3グループ化したのは、実施形態を簡単化するためで、連続値ごとに適正範囲を設定してもよいし、連続値には相関関係が有るので、テーブル方式ではなく理論式による方法を用いてもよい。また、周波数特性も7グループ値を使用したが、63個の周波数のすべてにて行ってもよいし、更には特定の周波数に注目して判定してもよい。
【0162】
本実施形態においては、検出の目的になっている注目画像は人物の肌の領域に設定して説明しているが、周波数成分、もしくは周波数成分と色度により検出可能なものは、人物の肌色に限らず、空、海、木々の緑なども存在する。
【0163】
本実施形態においては、8*8ブロック単位データの周波数成分を周波数の低い順から10個単位でまとめた値を用いて、その10個の和によるグループ(最も高い周波数グループは3個の和)の特性から周波数特性を代表させているが、JPEG ファイルの場合、DC成分1個に対し、AC成分63個の構成で、周波数特性を表しているので、10個の集合体として特性を見なくてもよい。
【0164】
また、63個の個々の特性より判断してもよいし、もっとグループ化してもよい。また、特定の周波数成分のみの利用により特性を導き出してもよい。このように、周波数特性を利用した特性を導くのにAC成分の利用方法はいくらでもある。
【0165】
更に、本実施形態では8*8ブロックの連結と言う概念で縦方向と横方向について注目画像を検出するために色度該当ブロックの連続性において、候補を抽出しているが、この時のブロック集合体の判定方法も、この方法に限られてものではないことは言うまでも無い。
【0166】
本実施形態では連続検出した色度ブロックに対して検出した連続値により、端のブロックを削除した値を特性利用しているが、周波数成分による適合から色度ブロックの境界を設定したり(図21)、予め特定以上の周波数特性のあるブロックを、色度検索を行う前に除外してから行うようにしたりなど、ブロックの集合体を決定するための色度と周波数成分による分離の仕方は、複数の方法と組み合わせがあるが、本願特許の範囲に包含される。
【0167】
上記図21について説明する。図21の左側は元画像であり、このJPEG ファイル画像の圧縮単位である8*8画素ブロックの周波成分における高周波成分の総データ値が閾値を超えるか超えないかで判定したのが右側の画像になる。明るい部分が高周波成分を持つ領域で、暗い部分が高周波成分の少ない領域である。この領域を境に設けた色度判定による注目画像検出も可能である。
【0168】
また、本実施形態は、画像圧縮ファイルとして、"JPEGファイル"を利用した方法を開示したが、"JPEG2000 ファイル"など、周波数成分への変換を利用した他のファイルに対しても同様な考え方で、注目画像の検出を簡単な処理で実現できることは、言うまでもない。
【0169】
上記実施形態においては、周波数成分と色度を中心に配置情報などを入れて注目画像検出を行ったが、このねらいは、注目画像を中心とした画像補正を行う為である。したがって、検出された注目画像領域の輝度を含むデータが補正を行うことが有効でない状態として検出された時、例えば暗過ぎる値でつぶれている時などは、補正として無理に諧調性を持たそうとすると、ノイズだらけになってしまう場合がある。
【0170】
この不都合を回避するために、図6の検出結果に対して、検出された部分領域の各ブロック直流成分データを利用して輝度平均を出し、補正に適した輝度範囲に入っているかを比較することで、更に精度の良い注目画像における画像補正を行うことができる。
<第2の実施形態の画像処理装置の構成例>
注目画像として人物の顔が撮影された場合が、図51の画像サンプルである。この画像サンプルは、画素数が30万画素と、近年の入力機器の能力としては低いクラスのジャンルに入る物で、画像ファイルサイズも60Kバイトと圧縮率の高い物である。このような画像に対しては、上記構成の注目画像検出を行って露出補正を行っても画質の向上は大きくは期待できない。このような画像に対しては、有効な補正としては、通常アンシャープマスクによる補正を行うことで、ボケを排除し、メリハリの利いた補正を行う事が知られているが、この欠点として、画像全体にアンシャープマスク補正を利かせた場合は、肌領域においては肌がざらついた状態になりやすいので、画像全体に行う場合は補正強度を低くするしかなく、また、効果的である目や口の領域のみに利かせるには、領域指定を自動化することが難しい状態であった。
【0171】
図50は、第2の実施形態の画像処理装置の構成例を示すブロックである。図50では、第1の実施形態の構成要素はブラックボックスで図示されている。この構成要素は基本的に第1の実施形態と同様である。第2の実施形態の特徴ある構成は第2画像抽出部100bとボケ補正処理部30の追加である。
【0172】
第2画像抽出部100bは、第1の実施形態の第1画像抽出部100aと共に、画像認識部100を形成する。第2画像抽出部100bは、画像の縦横比しきい値301aにもとづいて候補領域を選別する候補領域選別部310と、特徴部位しきい値302aに基づいて選別された候補領域内にある特徴部位(本例では、顔領域中の目や鼻、口、眉等)を抽出する特徴部位抽出部302とを有する。本例では、顔の論客の縦横比により顔領域を選択する。
【0173】
特徴部位抽出部302から出力された特徴部位の情報に基づき、復号部10から出力される復号画像は、第1の実施形態での色調補正に先立って、ボケ補正値算出部30aが算出した値に従ってボケ補正処理部30でボケ補正処理が行われる。
【0174】
尚、ハードウエア及びソフトウエア構成は、図1Cと類似であるので図示及び説明を省く。
【0175】
<第2の実施形態の画像処理装置の動作手順例>
上記構成の人物肌領域の検出機能を利用した本発明の概略のフローチャートを図60に示す。
【0176】
フローチャートの説明を行う。
このフローチャートは、本発明における入力画像の中に人物の顔領域の検出と、その構成画素数や量子化フィルターの値により、その人物顔の肌領域内の目や口等の検出と補正処理の適正強度設定及び実行の流れを表している。
ステップS5601においては、対象画像の画素数及び量子化テーブルを基本に、印刷時の拡大倍率と解像度情報を元に、二次画像抽出が必要な物かの判定用情報取得を行う。前記図51のような画素数の少ない画像は二次画像抽出の対象となりうる。
【0177】
ステップS5602においては、前記図6で開示したフローによる注目画像抽出処理を行う。この実施例においては、人物顔の肌領域の特徴量を持つ領域の検出を行う。図51の画像に対しては、図52で表すような領域を抽出することになる。図52における白い部分の領域が人物顔の肌の特徴量を持つ領域と判定され、黒い部分はそれ以外の部分である。この検出において、肌領域部分の特徴量の他に、平均輝度などの算出も行う。
【0178】
ステップS5603においては、ステップS5601とS5602の検出結果の論理和により、判定を行う。二次画像抽出が必要ない場合はステップS5607の従来処理へ進み。二次画像抽出が必要な場合はステップS5604へ進む。
【0179】
ステップS5604においては、二次画像抽出処理を行う。具体的には図52の検出した人物肌色領域内にある、一次抽出の色度比率範囲外にある目とか口の候補となる領域を検出し判定を行う。詳細は後述する。
【0180】
ステップS5605においては、二次画像抽出が成功したか判定を行う。失敗した場合は、ステップS5607の従来処理へ進み。成功した場合は、ステップS5606に進む。ステップS5606においては、ボケ補正処理を実行する。その後、ステップS5607の注目画像検出の抽出結果を画像補正へ渡す為にセットする。ステップS5608において、抽出結果を反映した画像補正を行う。
【0181】
次に、二次抽出処理に部分をより詳細に説明する為のフローチャートを図61に示し、その説明を行う。
【0182】
ステップS5701においては、ステップS5602からの情報から一次画像抽出の候補画像領域の縦横比を算出する。
【0183】
ステップS5702においては、候補画像が人物の顔の縦横比定義に適応する物か判定を行う。一次抽出による候補画像が抽出画像定義に適応しない場合はステップS5709に進む。適応する場合は、ステップS5703に進む。
【0184】
ステップS5703においては、候補領域内にある、一次抽出の色度比率範囲外の領域を検出する。図52においては、人物肌領域である白色領域内に独立して残された黒色の領域になる。この領域の各々の構成画素数(ブロック数)と平均色度及びDCTのAC成分の平均値などを算出する。
【0185】
本実施例においては、人物顔の肌色以外の構成要素として、目、口、眉毛、眼鏡など考えられるが、そのなかで、目に付いて説明を行う。
【0186】
目の画像サンプルとして図54、図56、図58を示す。
【0187】
図54は、目を表す構成の画素数を縦12画素、横22画素とした物で、この画像に対して図28及び29で示した画像圧縮の為の量子化テーブルを使用して画像圧縮を行ったものである。テーブル11を使用した物はF12で、テーブル08を使用した物はF9で、テーブル06を使用した物はF7で、テーブル03を使用した物はF4である。
【0188】
図55は、目を表す構成の画素数を縦24画素、横44画素とした物で、この画像に対して図28及び29で示した画像圧縮の為の量子化テーブルを使用して画像圧縮を行ったものである。テーブル11を使用した物はF12で、テーブル08を使用した物はF9で、テーブル06を使用した物はF7で、テーブル03を使用した物はF4である。
【0189】
図56は、目を表す構成の画素数を縦48画素、横88画素とした物で、この画像に対して図28及び29で示した画像圧縮の為の量子化テーブルを使用して画像圧縮を行ったものである。テーブル11を使用した物はF12で、テーブル08を使用した物はF9で、テーブル06を使用した物はF7で、テーブル03を使用した物はF4である。
【0190】
ステップS5704においては、目となりえる設定した色度比率に収まっているかを判定する。口などの色度比率設定も可能である。候補として不適当と判定した場合はステップS5709に進む。適応する場合は、ステップS5705に進む。
【0191】
ステップS5705においては、ステップS5703で検出した領域が目の候補として、ステップS5701で検出した人物顔の肌領域との面積比率として適正なサイズかを算出する。
【0192】
ステップS5706においては、ステップS5703で検出した領域が目の候補として、適正な外形比率に収まっているか確認する為に縦横比率を算出する。
【0193】
ステップS5707においては、ステップS5705及びS5706での算出した結果が目としての候補領域になるか判定を行う。候補として不適当と判定した場合はステップS5709に進む。適応する場合は、ステップS5708に進む。
【0194】
ステップS5708においては、画像のボケ量の判定と判定結果から補正の強度の確定を行い、補正を実行する。
【0195】
まず、ボケ量の判定であるが、まず、先述の目領域の画像サンプルである図54、図56、図58に対して一定のアンシャープマスク処理を加えた画像を図55、図57、図59に示す。
【0196】
そして、この画像に関するDCTのAC成分平均値の特徴量を図62,図63,図64に示す。
【0197】
図62は、目を表す構成の画素数を縦12画素、横22画素とした物で、横軸は対象画像全領域におけるDCT値のAC成分の平均値を前述の要領で空間周波数成分の低い領域から10個単位でまとめたものである。縦軸は、DCTのコード量(10個単位の和である。但し7グループ目は3個分の和になる。)上記内容から、量子化フィルターによるデータ量の差は空間周波数の高域成分に現れるが、目である対象領域においての差はあまり大きくない。アンシャープマスク処理で低域分の空間周波数特性が上がっているので、メリハリがついていることがわかる。
【0198】
図63は、目を表す構成の画素数を縦24画素、横44画素とした物で、グラフの構成は図62と同じである。上記内容から、量子化フィルターによるデータ量の差は空間周波数の高域成分に現れるが、目である対象領域においての差はあまり大きくない。アンシャープマスク処理で低域分の空間周波数特性が上がっているので、メリハリがついていることがわかる。
【0199】
図64は、目を表す構成の画素数を縦48画素、横88画素とした物で、グラフの構成は図62と同じである。上記内容から、量子化フィルターによるデータ量の差は空間周波数の高域成分に現れるが、目である対象領域においての差はあまり大きくない。アンシャープマスク処理で低域分の空間周波数特性が上がっているので、メリハリがついていることがわかる。
【0200】
画像サイズによる違いとしては、構成画素が多いほどDCT値のAC成分の平均値である特徴量は小さくなる。また、AC成分の分布状況は同じである。
【0201】
上記、目の画像の画素数と量子化フィルター値によるアンシャープマスク処理の効果を補正へ反映する為、検出した二次抽出領域の大きさと量子化フィルター値により図65に示すようなアンシャープマスクの補正強度指定を行う。
【0202】
また、一次抽出により検出した肌色領域の輝度分布により分布の範囲が大きい場合、例えば、野外において、太陽光を直接浴びて人物顔肌領域の明暗の輝度幅が大きい時はシャープにする補正の効果が少ないので、図66に示すように一次抽出により検出した肌色領域の輝度分布範囲により、輝度表現が0〜255の場合、150以上の輝度範囲データを持つ一次抽出により検出した肌色領域に対する二次抽出領域へのアンシャープマスク処理の強度を強めに設定する。
【0203】
ステップS5709においては、抽出結果の値を反映した画像補正を実行する。
【0204】
図51に対して上記処理を行った結果が図53である。ボケ画像に対して、領域を特定して補正が適度に加えられたことが確認できる。
【0205】
上述したように、本発明によれば、画像圧縮ファイルを解凍する過程で空間周波数データと量子化テーブルとを取得し、上記空間周波数データ及び量子化データ特性を組み合わせて画像ファイル中の注目画像を検索するために利用するようにしたので、高度な計算をすることなく画像データブロックごとの交流成分情報を含む情報を取得して、画像ファイルの中の注目画像を検索することができる。
【0206】
また、本発明の他の特徴によれば、デジタルカメラから直接プリントする場合などのように、パーソナルコンピュータと比べて処理能力が低い組み込み式の機器においても、製品として使用可能な範囲の処理で、印刷する圧縮画像ファイルに補正の対象となる注目画像の有無、及びその値の適正度を検出することができ、必要に応じて注目画像を重視した画像補正を施すようにすることができる。
なお、以上に説明した本実施形態の画像認識装置は、コンピュータのCPUあるいはMPU、RAM、ROMなどで構成されるものであり、RAMやROMに記憶されたプログラムが動作することによって実現できる。
【0207】
したがって、コンピュータが上記機能を果たすように動作させるプログラムを、例えばCD−ROMのような記録媒体に記録し、コンピュータに読み込ませることによって実現できるものである。上記プログラムを記録する記録媒体としては、CD−ROM以外に、フレキシブルディスク、ハードディスク、磁気テープ、光磁気ディスク、不揮発性メモリカード等を用いることができる。
【0208】
また、コンピュータが供給されたプログラムを実行することにより上述の実施形態の機能が実現されるだけでなく、そのプログラムがコンピュータにおいて稼働しているOS(オペレーティングシステム)あるいは他のアプリケーションソフト等と共同して上述の実施形態の機能が実現される場合や、供給されたプログラムの処理の全てあるいは一部がコンピュータの機能拡張ボードや機能拡張ユニットにより行われて上述の実施形態の機能が実現される場合も、かかるプログラムは本発明の実施形態に含まれる。
【0209】
また、本発明をネットワーク環境で利用するべく、全部あるいは一部のプログラムが他のコンピュータで実行されるようになっていてもよい。例えば、画面入力処理は、遠隔端末コンピュータで行われ、各種判断、ログ記録等は他のセンターコンピュータ等で行われるようにしてもよい。
【0210】
【発明の効果】
本発明により、画像の輝度によって注目画像領域抽出に用いられる色度比率判定を適正化して、安定した注目画像領域の抽出及び画像の再生を行うことができる。
【0211】
又、人物顔画像などがボケたようなものにおいては、適正な補正への情報を取得できる。
【図面の簡単な説明】
【図1A】本発明の実施形態に係わるJPEG画像解凍時に必要なデータを取得する流れを示す概念図である。
【図1B】第1の実施形態に係わる画像処理装置の構成例を示すブロック図である。
【図1C】実施形態に係わる画像処理装置のハードウエア及びソフトウエアの構成例を示すブロック図である。
【図2】実施形態の画像データをJPEG形式へ変換する処理過程の流れを示す概念図である。
【図3】実施形態のJPEGの画像圧縮単位である8*8ブロックを例にしたJPEG形式へ変換する処理過程を示す図である。
【図4】実施形態のJPEGファイル画像圧縮単位である8*8ブロックのAC成分特性を利用した判別テーブルを示す図である。
【図5】実施形態の他にある肌色のRG色度分布例を示す図である。
【図6】実施形態のJPEG画像解凍からの注目画像検出フローチャートである。
【図7】実施形態のJPEGファイル画像圧縮単位である8*8ブロックにおける、色度検出方法を示す図である。
【図8】実施形態のJPEGファイル画像圧縮単位である8*8ブロックでのDC成分を利用した色度検出方法を示す図である。
【図9】実施形態の色度検出において、3ビット間引きを利用して検出をした場合の8*8ブロックにおける検出状況を示す図である。
【図10】実施形態の検出用JPEG画像サンプルの第1の例を示す図である。
【図11】第1の画像サンプルを色度のみによる検出を行った結果のBMP ファイルの一例を示す図である。
【図12】第1の画像サンプルを8*8ブロック単位の色度検出を元に配置と連続ブロック検出を行った結果のBMP ファイルの一例を示す図である。
【図13】実施形態の注目画像検出により、第1の画像サンプルを8*8ブロック単位の色度検出を元に配置と連続ブロックとAC成分による検出を行った結果のBMPファイルの一例を示す図である。
【図14】実施形態の検出用JPEG画像サンプルの第2の例を示す図である。
【図15】第2の画像サンプルを色度のみによる検出を行った結果のBMPファイルの一例を示す図である。
【図16】第2の画像サンプルを8*8ブロック単位の色度検出を元に配置と連続ブロック検出を行った結果のBMP ファイルの一例を示す図である。
【図17】実施形態の注目画像検出により、第2の画像サンプルを8*8ブロック単位の色度検出を元に配置と連続ブロックとAC成分による検出を行った結果のBMP ファイルの一例を示す図である。
【図18】実施形態の人物肌検出において、人物肌検出データの連続色度検出値におけるAC成分の周波数特性を示す図である。
【図19】実施形態の人物肌検出において、枯れ林の検出データの連続色度検出値におけるAC成分の周波数特性の表を示す図である。
【図20】実施形態の肌色のRG色度分布を示す図である。
【図21】周波数特性による境界作成のための検出方法の一例を示す図である。
【図22】実施形態の候補グループの判定手順を示すフローチャートである。
【図23】実施形態の候補グループ判定の検出結果画像の一例を示す図である。
【図24】実施形態の注目画像検出を利用した画像補正の比較結果の一例を示す図である。
【図25】本実施形態の人物肌検出において、UXGA(1600*1200)画像における人物肌検出データの連続色度検出値におけるAC成分の周波数特性を示す特性図である。
【図26】本実施形態の人物肌検出において、UXGA(1600*1200)画像における枯れ林の検出データの連続色度検出値におけるAC成分の周波数特性の表を示す図である。
【図27】本実施形態のJPEGファイル画像圧縮単位である8*8ブロックのAC成分特性を利用したUXGA(1600*1200)画像に対する判別テーブルの一例を示す図である。
【図28】既存のアプリケーションで使用している量子化テーブルの一例を示す図である。
【図29】既存のアプリケーションで使用している量子化テーブルの一例を示す図である。
【図30】既存のアプリケーションで使用している量子化テーブルの一例を示す図である。
【図31】量子化テーブルにおける圧縮比率と周波数特性との関係を示す図である。
【図32】注目画像検出を行った結果の一例を示す図である。
【図33】注目画像検出を行った結果の一例を示す図である。
【図34】取得した量子化テーブルからAC成分特性判定テーブルを設定する手順の一例を示すフローチャートである。
【図35】本実施形態において、複数画像中の人物肌領域色度比率を検出領域の平均輝度で分類して分布状況を表した図である。
【図36】本実施形態において、UXGA(1600*1200画素)サイズの画像ファイルに存在する人物肌領域を検出し、その人物肌領域内におけるJPEG圧縮での8*8ブロックにおけるDCTのAC成分の平均値を、検出した画素数(JPEG圧縮での8*8ブロック数)で分類した表を示す図である。
【図37】本実施形態において、VGA(640*480画素)サイズの画像ファイルに存在する人物肌領域を検出し、その人物肌領域内におけるJPEG圧縮での8*8ブロックにおけるDCTのAC成分の平均値を、検出した画素数(JPEG圧縮での8*8ブロック数)で分類した表を示す図である。
【図38】本実施形態においては、人物の顔領域内で、白跳びが発生している画像サンプルを示す図である。
【図39】本実施形態においては、図38の画像サンプルに対して、固定の色度比率範囲で人物肌領域検出を行い検出した領域を示す図である
【図40】本実施形態においては、図38の画像サンプルに対して、適合色度比率範囲を拡大した定義を用いて人物肌領域検出を行った結果を示す図である。
【図41】本実施形態において、図38の画像サンプルに対して、輝度値に依存する適合色度比率範囲の定義を用いて人物肌領域検出を行った結果を示す図である。
【図42】本実施形態において、図38の画像サンプル全体の輝度ヒストグラムを示す図である。
【図43】本実施形態において、UXGA(1600*1200)サイズにて撮影した被写体が人物の画像サンプルを示す図である。
【図44】本実施形態において、図43の画像サンプルに対して、人物肌領域検出を行い検出した領域を示す図である。
【図45】本実施形態において、VGA(640*480)サイズにて撮影した被写体が人物の画像サンプルを示す図である。
【図46】本実施形態において、図45の画像サンプルに対して、人物肌領域検出を行い検出した領域を示す図である。
【図47】本実施形態において、候補領域のサイズによるDCTのAC成分である空間周波数特徴量の判定テーブルを示す図である。
【図48】本実施形態において、抽出候補領域の判定用色度比率範囲テーブル2を示す図である。
【図49】本実施形態において、色度比率による抽出領域の画素数(ブロック数)によるDCT特徴量判定方式の処理手順を示すフローチャートである。
【図50】第2の実施形態に係わる画像処理装置の構成例を示すブロック図である。
【図51】本実施形態において、CCD30万画素の携帯電話で人物の顔を撮影した画像サンプルを示す図である。
【図52】本実施形態において、図51の画像サンプルに対して人物肌領域検出を行い、検出された領域(白い部分)を示す図示である。
【図53】本実施形態において、図51の画像サンプルに対して人物肌(顔)領域内の目や鼻候補を選定し、その領域のみにアンシャープマスク処理を行った結果を示す図である。
【図54】本実施形態において、22*12画素で撮影された“目”の画像である。JPEGの量子化テーブルの値を変えた物で、高圧縮の“F4”から低圧縮の“F12"の4種類の保存をかけた画像を示す図である。
【図55】本実施形態において、図54の各画像に対してアンシャープマスク画像処理を行った結果を示す図である。
【図56】本実施形態において、44*24画素で撮影された“目”の画像である。JPEGの量子化テーブルの値を変えた物で、高圧縮の“F4”から低圧縮の“F12"の4種類の保存をかけた画像を示す図である。
【図57】本実施形態において、図56の各画像に対してアンシャープマスク画像処理を行った結果を示す図である。
【図58】本実施形態において、88*48画素で撮影された“目”の画像である。JPEGの量子化テーブルの値を変えた物で、高圧縮の“F4”から低圧縮の“F12"の4種類の保存をかけた画像を示す図である。
【図59】本実施形態において、図58の各画像に対してアンシャープマスク画像処理を行った結果を示す図である。
【図60】本実施形態において、補正処理も含めた拡張画像抽出処理のフローチャート1である。
【図61】本実施形態において、補正処理も含めた拡張画像抽出処理のフローチャート2である。
【図62】本実施形態において、量子化フィルター値とアンシャープマスク処理のDCT特性比較(22*12 サイズ)のグラフを表す図である。
【図63】本実施形態において、量子化フィルター値とアンシャープマスク処理のDCT特性比較(44*24 サイズ)のグラフを表す図である。
【図64】本実施形態において、量子化フィルター値とアンシャープマスク処理のDCT特性比較(88*48 サイズ)のグラフを表す図である。
【図65】本実施形態において、画像量子化フィルターの値と検出領域サイズによるアンシャープマスクの強度対応表を現す図である。
【図66】本実施形態において、人物肌色領域の輝度分布とその内部領域である目領域へのアンシャープマスク強度設定の関係を表す図である。
Claims (15)
- 圧縮符号化された画像データを復号して画像を再生する画像再生方法であって、
復号した前記画像データから所定の色度範囲の連続するブロックを抽出するブロック抽出ステップと、
前記連続するブロックの空間周波数の平均値に基づいて、前記連続するブロックを注目画像領域とするか否かを判定する判定ステップと、
前記注目画像領域から特徴部位を抽出する特徴部位抽出ステップと、
前記抽出された特徴部位の画素数と前記圧縮符号化に利用した量子化フィルタ値とに基づいて、前記特徴部位のボケの補正強度を決定する決定ステップと、
前記決定ステップで決定された補正強度に応じて前記特徴部位のボケを補正するボケ補正ステップと、
前記補正ステップでボケが補正された画像を再生する再生ステップとを有することを特徴とする画像再生方法。 - 前記決定ステップでは、前記特徴部位の画素数が少なく前記量子化フィルタ値の値が大きいほど、ボケをより強く補正する補正強度に決定することを特徴とする請求項1記載の画像再生方法。
- 前記所定の色度範囲を、前記復号した画像データの輝度値に基づいて設定することを特徴とする請求項1記載の画像再生方法。
- 前記圧縮符号化された画像データを復号して前記復号した画像データを生成する復号ステップと、
前記復号した画像データから色度、空間周波数、輝度を求めるステップとを更に有することを特徴とする請求項1記載の画像再生方法。 - 前記圧縮符号化された画像データはJPEG画像データであり、前記復号した画像データはDCT係数と逆DCT変換されたビットマップデータとを含むことを特徴とする請求項4記載の画像再生方法。
- 前記ブロック抽出ステップで抽出された前記連続するブロックの数に基づいて、注目画像領域となる候補を選別する選別ステップを更に有することを特徴とする請求項1記載の画像再生方法。
- 前記ボケの補正は、アンシャープマスク処理により行われることを特徴とする請求項1記載の画像再生方法。
- 請求項1乃至7のいずれか1項に記載の画像再生方法のステップをコンピュータに実行させるためのコンピュータプログラム。
- 請求項8に記載のコンピュータプログラムを記憶したコンピュータ読み取り可能な記憶媒体。
- 圧縮符号化された画像データを復号して画像を再生する画像処理装置であって、
復号した前記画像データから所定の色度範囲の連続するブロックを抽出するブロック抽出手段と、
前記連続するブロックの空間周波数の平均値に基づいて、前記連続するブロックを注目画像領域とするか否かを判定する判定手段と、
前記注目画像領域から特徴部位を抽出する特徴部位抽出手段と、
前記抽出された特徴部位の画素数と前記圧縮符号化に利用した量子化フィルタ値とに基づいて、前記特徴部位のボケの補正強度を決定する決定手段と、
前記決定手段により決定された補正強度に応じて前記特徴部位のボケを補正するボケ補正手段と、
前記補正手段によりボケが補正された画像を再生する再生手段とを有することを特徴とする画像処理装置。 - 前記決定手段は、前記特徴部位の画素数が少なく前記量子化フィルタ値の値が大きいほど、ボケをより強く補正する補正強度に決定することを特徴とする請 求項10記載の画像処理装置。
- 前記圧縮符号化された画像データを復号して前記復号した画像データを生成する復号手段と、
前記復号した画像データから色度、空間周波数、輝度を求める手段とを更に有することを特徴とする請求項10記載の画像処理装置。 - 前記圧縮符号化された画像データはJPEG画像データであり、前記復号した画像データはDCT係数と逆DCT変換されたビットマップデータとを含むことを特徴とする請求項12記載の画像処理装置。
- 前記ブロック抽出手段により抽出された前記連続するブロックの数に基づいて、注目画像領域となる候補を選別する選別手段を更に有することを特徴とする請求項10記載の画像処理装置。
- 前記ボケの補正は、アンシャープマスク処理により行われることを特徴とする請求項10記載の画像処理装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003183219A JP3977291B2 (ja) | 2003-06-26 | 2003-06-26 | 画像再生方法及び画像処理装置 |
US10/608,001 US7356190B2 (en) | 2002-07-02 | 2003-06-30 | Image area extraction method, image reconstruction method using the extraction result and apparatus thereof |
US11/970,359 US7542615B2 (en) | 2002-07-02 | 2008-01-07 | Image area extraction method, image reconstruction method using the extraction result and apparatus thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003183219A JP3977291B2 (ja) | 2003-06-26 | 2003-06-26 | 画像再生方法及び画像処理装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2005018466A JP2005018466A (ja) | 2005-01-20 |
JP2005018466A5 JP2005018466A5 (ja) | 2005-07-28 |
JP3977291B2 true JP3977291B2 (ja) | 2007-09-19 |
Family
ID=34183387
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003183219A Expired - Fee Related JP3977291B2 (ja) | 2002-07-02 | 2003-06-26 | 画像再生方法及び画像処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3977291B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005190435A (ja) * | 2003-12-26 | 2005-07-14 | Konica Minolta Photo Imaging Inc | 画像処理方法、画像処理装置及び画像記録装置 |
JP4779536B2 (ja) * | 2005-09-27 | 2011-09-28 | ソニー株式会社 | 撮像装置 |
JP2021043914A (ja) | 2019-09-13 | 2021-03-18 | 富士通株式会社 | 画像処理装置、画像処理方法、及び画像処理プログラム |
EP4261773A1 (en) * | 2020-12-10 | 2023-10-18 | Fujitsu Limited | Determination method, determination program, and information processing device |
-
2003
- 2003-06-26 JP JP2003183219A patent/JP3977291B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005018466A (ja) | 2005-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7542615B2 (en) | Image area extraction method, image reconstruction method using the extraction result and apparatus thereof | |
US8064710B2 (en) | Image processing apparatus, method of controlling thereof, and program | |
JP3373008B2 (ja) | 画像像域分離装置 | |
TWI426774B (zh) | 用於針對jpeg壓縮歷史紀錄分類為壓縮影像的方法、及用於針對影像是否已經過jpeg壓縮而分類影像的設備及影像分類方法 | |
US8442262B2 (en) | Method and system to process a digital image | |
JP5958023B2 (ja) | 画像処理装置および画像処理プログラム | |
US7386168B2 (en) | Image processing apparatus | |
JP2003153007A (ja) | 画像重要度に基づく画像圧縮制御システム及び方法 | |
JP2004523933A (ja) | デジタル画像を圧縮する方法 | |
US9106892B2 (en) | Image compression based on parameter-assisted inpainting | |
EP2645697A2 (en) | Image processing apparatus and method | |
US20090208125A1 (en) | Image encoding apparatus and method of controlling the same | |
JP2008059546A (ja) | 画像処理装置、画像読取装置、画像形成装置、画像処理方法、コンピュータプログラム、及び記録媒体 | |
KR20040058323A (ko) | 화상 부호화 장치, 화상 부호화 방법, 및 화상 처리 장치 | |
US7027646B2 (en) | Scaled image generating apparatus and method, image feature calculating apparatus and method, computer programs therefor, and image data structure | |
JP2019092027A (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
JP2009027385A (ja) | 画像処理装置とその方法およびコンピュータプログラム | |
US8275198B2 (en) | Image processing apparatus, image processing method and computer readable medium with compression processing for each color | |
JP3977291B2 (ja) | 画像再生方法及び画像処理装置 | |
US6917704B2 (en) | Image processing method, image processing apparatus and image processing system | |
US20150186373A1 (en) | Method for sorting a group of images of a database and method for color correcting an image, corresponding devices, computer program and non-transitory computer readable medium | |
CN106717006B (zh) | 用于根据图像类型选择压缩算法的方法 | |
JP2000013605A (ja) | 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体 | |
JP4078136B2 (ja) | 画像認識方法、画像認識装置及びコンピュータプログラム | |
JP4006276B2 (ja) | 画像認識方法、画像認識装置及びコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041215 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041215 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20061124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061201 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070309 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070508 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070601 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070620 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100629 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110629 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120629 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120629 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130629 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |