JP4135045B2 - データ処理装置およびデータ処理方法、並びに媒体 - Google Patents
データ処理装置およびデータ処理方法、並びに媒体 Download PDFInfo
- Publication number
- JP4135045B2 JP4135045B2 JP16052899A JP16052899A JP4135045B2 JP 4135045 B2 JP4135045 B2 JP 4135045B2 JP 16052899 A JP16052899 A JP 16052899A JP 16052899 A JP16052899 A JP 16052899A JP 4135045 B2 JP4135045 B2 JP 4135045B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- distance
- value
- teacher
- distances
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000003672 processing method Methods 0.000 title claims description 14
- 238000000605 extraction Methods 0.000 claims description 118
- 238000000034 method Methods 0.000 claims description 67
- 238000004364 calculation method Methods 0.000 claims description 38
- 230000002093 peripheral effect Effects 0.000 claims description 32
- 239000000284 extract Substances 0.000 claims description 16
- 230000008878 coupling Effects 0.000 claims 1
- 238000010168 coupling process Methods 0.000 claims 1
- 238000005859 coupling reaction Methods 0.000 claims 1
- 230000015654 memory Effects 0.000 description 68
- 230000003044 adaptive effect Effects 0.000 description 18
- RRLHMJHRFMHVNM-BQVXCWBNSA-N [(2s,3r,6r)-6-[5-[5-hydroxy-3-(4-hydroxyphenyl)-4-oxochromen-7-yl]oxypentoxy]-2-methyl-3,6-dihydro-2h-pyran-3-yl] acetate Chemical compound C1=C[C@@H](OC(C)=O)[C@H](C)O[C@H]1OCCCCCOC1=CC(O)=C2C(=O)C(C=3C=CC(O)=CC=3)=COC2=C1 RRLHMJHRFMHVNM-BQVXCWBNSA-N 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 239000011159 matrix material Substances 0.000 description 7
- 230000002123 temporal effect Effects 0.000 description 6
- 230000006978 adaptation Effects 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
Images
Landscapes
- Complex Calculations (AREA)
- Image Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
【発明の属する技術分野】
本発明は、データ処理装置およびデータ処理方法、並びに媒体に関し、例えば、画像データ等のデータ処理を行う際の、その処理性能を向上させることができるようにするデータ処理装置およびデータ処理方法、並びに媒体に関する。
【0002】
【従来の技術】
本件出願人は、例えば、画像の画質等の向上その他の画像の改善を行うための処理として、クラス分類適応処理を、先に提案している。
【0003】
クラス分類適応処理は、クラス分類処理と適応処理とからなり、クラス分類処理によって、データを、その性質に基づいてクラス分けし、各クラスごとに適応処理を施すものであり、適応処理とは、以下のような手法の処理である。
【0004】
即ち、適応処理では、例えば、入力画像(クラス分類適応処理の処理対象の画像)を構成する画素(以下、適宜、入力画素という)と、所定の予測係数との線形結合により、原画像(例えば、ノイズを含まない画像や、ぼけのない画像等)の画素の予測値を求めることで、その入力画像に含まれるノイズを除去した画像や、入力画像に生じているぼけを改善した画像等が得られるようになっている。
【0005】
そこで、例えば、いま、原画像を教師データとするとともに、その原画像にノイズを重畳したり、あるいはぼかしを付加した画像を生徒データとして、原画像を構成する画素(以下、適宜、原画素という)の画素値yの予測値E[y]を、幾つかの生徒データ(画素値)x1,x2,・・・の集合と、所定の予測係数w1,w2,・・・の線形結合により規定される線形1次結合モデルにより求めることを考える。この場合、予測値E[y]は、次式で表すことができる。
【0006】
式(1)を一般化するために、予測係数wの集合でなる行列W、生徒データの集合でなる行列X、および予測値E[y]の集合でなる行列Y’を、
【0007】
【数1】
で定義すると、次のような観測方程式が成立する。
【0008】
ここで、行列Xの成分xijは、i件目の生徒データの集合(i件目の教師データyiの予測に用いる生徒データの集合)の中のj番目の生徒データを意味し、行列Wの成分wjは、生徒データの集合の中のj番目の生徒データとの積が演算される予測係数を表す。また、yjは、j件目の教師データを表し、従って、E[yj]は、j件目の教師データの予測値を表す。
【0009】
そして、この観測方程式に最小自乗法を適用して、原画素の画素値yに近い予測値E[y]を求めることを考える。この場合、教師データとなる原画素の真の画素値yの集合でなる行列Y、および原画素の画素値yに対する予測値E[y]の残差eの集合でなる行列Eを、
【0010】
【数2】
で定義すると、式(2)から、次のような残差方程式が成立する。
【0011】
この場合、原画素の画素値yに近い予測値E[y]を求めるための予測係数wiは、自乗誤差
【0012】
【数3】
を最小にすることで求めることができる。
【0013】
従って、上述の自乗誤差を予測係数wiで微分したものが0になる場合、即ち、次式を満たす予測係数wiが、原画素の画素値yに近い予測値E[y]を求めるため最適値ということになる。
【0014】
【数4】
そこで、まず、式(3)を、予測係数wiで微分することにより、次式が成立する。
【0015】
【数5】
式(4)および(5)より、式(6)が得られる。
【0016】
【数6】
さらに、式(3)の残差方程式における生徒データx、予測係数w、教師データy、および残差eの関係を考慮すると、式(6)から、次のような正規方程式を得ることができる。
【0017】
【数7】
式(7)の正規方程式を構成する各式は、生徒データxおよび教師データyを、ある程度の数だけ用意することで、求めるべき予測係数wの数と同じ数だけたてることができ、従って、式(7)を解くことで(但し、式(7)を解くには、式(7)において、予測係数wにかかる係数で構成される行列が正則である必要がある)、最適な予測係数wを求めることができる。なお、式(7)を解くにあたっては、例えば、掃き出し法(Gauss-Jordanの消去法)などを用いることが可能である。
【0018】
以上のようにして、最適な予測係数wを求めておき、さらに、その予測係数wを用い、式(1)により、原画素の画素値yに近い予測値E[y]を求めるのが適応処理である。
【0019】
なお、適応処理は、入力画像には含まれていないが、原画像に含まれる成分が再現される点で、例えば、単なる補間処理等とは異なる。即ち、適応処理では、式(1)だけを見る限りは、いわゆる補間フィルタを用いての補間処理と同一であるが、その補間フィルタのタップ係数に相当する予測係数wが、教師データyを用いての、いわば学習により求められるため、原画像に含まれる成分を再現することができる。即ち、容易に、高S/Nの画像を得ることができる。このことから、適応処理は、いわば画像の創造(解像度想像)作用がある処理ということができ、従って、入力画像からノイズやぼけを除去した原画像の予測値を求める他、例えば、低解像度または標準解像度の画像を、高解像度の画像に変換するような場合にも用いることができる。
【0020】
【発明が解決しようとする課題】
上述したように、クラス分類適応処理では、各クラスごとに適応処理が施されるが、その前段で行われるクラス分類では、予測値を求めようとする原画素(以下、適宜、注目原画素という)の位置の周辺にある複数の入力画素が抽出され、その性質(例えば、その複数の入力画素の画素値のパターンや、画素値の傾斜等)に基づいて、注目原画素がクラス分けされる。そして、このクラス分類に用いられる複数の入力画素としては、注目原画素から見て、固定の位置にある入力画素が抽出される。
【0021】
しかしながら、クラス分類適応処理によって、例えば、ぼけのある入力画像を、そのぼけを改善した画像に変換する場合等において、その入力画像のぼけの度合いに関係なく、注目原画素から見て、固定の位置にある入力画素を、注目原画素のクラス分類に用いたのでは、その注目原画素の性質を十分に反映したクラス分けが困難となることがある。
【0022】
即ち、例えば、ぼけ度(ぼけの度合い)の小さい入力画像を対象にクラス分類適応処理を行う場合においては、画像の相関性の観点から、注目原画素から見て、比較的近い位置にある入力画素を用いてクラス分類を行う方が、注目原画素の性質を反映したクラス分けを行うことができる。また、ぼけ度の大きい入力画像を対象にクラス分類適応処理を行う場合においては、そのぼけの影響の観点から、注目原画素から見て、比較的遠い位置にある入力画素を用いてクラス分類を行う方が、その性質を反映したクラス分けを行うことができる。
【0023】
従って、注目原画素から見て、固定の位置にある入力画素を、注目原画素のクラス分類に用いたのでは、その注目原画素の性質を反映したクラス分けができないことがあり、その結果、クラス分類適応処理の処理性能が劣化すること、即ち、クラス分類処理によって、入力画像を十分に改善した画像(ここでは、ぼけを十分に改善した画像)が得られないことがある。
【0024】
本発明は、このような状況に鑑みてなされたものであり、例えば、クラス分類適応処理等の処理性能を向上させることができるようにするものである。
【0025】
【課題を解決するための手段】
本発明のデータ処理装置は、入力データから、予測値を求めようとする出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、距離を変えながらそれぞれ読み出し、複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、所定の基準値に最も近い統計量が得られる距離を、入力データより複数のデータを抽出する抽出距離として決定する決定手段と、予測値を求めようとする出力データである注目出力データについて、決定手段により決定された抽出距離に対応する複数のデータを、入力データから抽出する抽出手段と、抽出手段において抽出された複数のデータの値のパターンに基づき、注目出力データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力するクラス分類手段と、所定の基準値に最も近い統計量が得られる距離に対応する複数のデータとしての、入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数が、距離に対応する複数のデータに基づくクラスコード毎に予め学習されており、抽出手段において抽出された複数のデータとクラスコードに対応する予測係数との線形一次結合により、注目出力データの予測値を求める予測手段とを備え、予測係数の学習のための教師となる教師データに対して、入力データに応じた特定の処理を施し、生徒となる生徒データを生成し、入力データから、予測値を求めようとする出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、距離を変えながらそれぞれ読み出し、複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、所定の基準値に最も近い統計量が得られる距離を、入力データより複数のデータを抽出する抽出距離として決定し、予測値を求めようとする教師データである注目教師データについて、決定された抽出距離に対応する複数のデータを、生徒データから抽出し、抽出された複数のデータの値のパターンに基づき、注目教師データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力し、抽出された複数のデータを用いて、所定の基準値に最も近い統計量が得られる距離に対応する複数のデータとしての、入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数を、距離に対応する複数のデータに基づくクラスコード毎に求めることにより、予測係数は予め学習されていることを特徴とする。
【0027】
決定手段には、それぞれの距離に応じた複数のデータの値の標準偏差を統計量として求め、所定の基準値に最も近い標準偏差が得られる距離に基づいて、入力データより複数のデータを抽出する抽出距離を決定させることができる。また、決定手段には、前記出力データを、それぞれに複数の注目出力データを有するブロック単位とし、所定のブロック内にある前記複数の注目出力データそれぞれについて得られる前記複数のデータの前記標準偏差の平均を前記統計量とし、当該統計量と前記所定の基準値とを比較することにより、そのブロック内の注目出力データについて前記入力データより前記複数のデータを抽出する抽出距離を決定させることができる。また、所定の基準値は、複数種類の距離に対応する複数のデータのそれぞれについて、生徒データと教師データとの間でクラスコードに対応する所定の予測係数を学習し、学習された予測係数で教師データを予測した結果、最適に予測できる距離に対応する複数のデータより求められる統計量とすることができる。
【0028】
本発明のデータ処理装置には、所定の基準値を記憶している基準値記憶手段をさらに設けることができる。
【0030】
本発明のデータ処理装置には、クラスコードごとに、予測係数を記憶している予測係数記憶手段をさらに設けることができる。
【0031】
入力データおよび出力データは、画像データとすることができる。さらに、この場合、抽出手段には、入力データとしての画像データから、注目出力データとしての画素に対して、空間的または時間的に周辺にある画素を抽出させることができる。
【0032】
本発明のデータ処理方法は、データ処理装置が、入力データから、予測値を求めようとする出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、距離を変えながらそれぞれ読み出し、複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、所定の基準値に最も近い統計量が得られる距離を、入力データより複数のデータを抽出する抽出距離として決定する決定手段と、予測値を求めようとする出力データである注目出力データについて、決定手段により決定された抽出距離に対応する複数のデータを、入力データから抽出する抽出手段と、抽出手段において抽出された複数のデータの値のパターンに基づき、注目出力データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力するクラス分類手段と、所定の基準値に最も近い統計量が得られる距離に対応する複数のデータとしての、入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数が、距離に対応する複数のデータに基づくクラスコード毎に予め学習されており、抽出手段において抽出された複数のデータとクラスコードに対応する予測係数との線形一次結合により、注目出力データの予測値を求める予測手段とを備え、決定手段は、入力データから、予測値を求めようとする出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、距離を変えながらそれぞれ読み出し、複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、所定の基準値に最も近い統計量が得られる距離を、入力データより複数のデータを抽出する抽出距離として決定し、抽出手段は、予測値を求めようとする出力データである注目出力データについて、決定手段により決定された抽出距離に対応する複数のデータを、入力データから抽出し、クラス分類手段は、抽出手段において抽出された複数のデータの値のパターンに基づき、注目出力データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力し、予測手段は、所定の基準値に最も近い統計量が得られる距離に対応する複数のデータとしての、入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数が、距離に対応する複数のデータに基づくクラスコード毎に予め学習されており、抽出手段において抽出された複数のデータとクラスコードに対応する予測係数との線形一次結合により、注目出力データの予測値を求めるステップを含み、予測係数の学習のための教師となる教師データに対して、入力データに応じた特定の処理を施し、生徒となる生徒データを生成し、入力データから、予測値を求めようとする出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、距離を変えながらそれぞれ読み出し、複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、所定の基準値に最も近い統計量が得られる距離を、入力データより複数のデータを抽出する抽出距離として決定し、予測値を求めようとする教師データである注目教師データについて、決定された抽出距離に対応する複数のデータを、生徒データから抽出し、抽出された複数のデータの値のパターンに基づき、注目教師データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力し、抽出された複数のデータを用いて、所定の基準値に最も近い統計量が得られる距離に対応する複数のデータとしての、入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数を、距離に対応する複数のデータに基づくクラスコード毎に求めることにより、予測係 数は予め学習されていることを特徴とする。
【0033】
本発明の媒体がコンピュータに実行させるプログラムは、入力データから、予測値を求めようとする出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、距離を変えながらそれぞれ読み出し、複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、所定の基準値に最も近い統計量が得られる距離を、入力データより複数のデータを抽出する抽出距離として決定する決定ステップと、予測値を求めようとする出力データである注目出力データについて、決定手段により決定された抽出距離に対応する複数のデータを、入力データから抽出する抽出ステップと、抽出ステップにおいて抽出された複数のデータの値のパターンに基づき、注目出力データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力するクラス分類ステップと、所定の基準値に最も近い統計量が得られる距離に対応する複数のデータとしての、入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数が、距離に対応する複数のデータに基づくクラスコード毎に予め学習されており、抽出ステップにおいて抽出された複数のデータとクラスコードに対応する予測係数との線形一次結合により、注目出力データの予測値を求める予測ステップとを含み、予測係数の学習のための教師となる教師データに対して、入力データに応じた特定の処理を施し、生徒となる生徒データを生成し、入力データから、予測値を求めようとする出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、距離を変えながらそれぞれ読み出し、複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、所定の基準値に最も近い統計量が得られる距離を、入力データより複数のデータを抽出する抽出距離として決定し、予測値を求めようとする教師データである注目教師データについて、決定された抽出距離に対応する複数のデータを、生徒データから抽出し、抽出された複数のデータの値のパターンに基づき、注目教師データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力し、抽出された複数のデータを用いて、所定の基準値に最も近い統計量が得られる距離に対応する複数のデータとしての、入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数を、距離に対応する複数のデータに基づくクラスコード毎に求めることにより、予測係数は予め学習されていることを特徴とする。
【0034】
本発明の他のデータ処理装置は、予測係数の学習のための教師となる教師データに対して、入力データに応じた特定の処理を施し、生徒となる生徒データを生成する生成手段と、入力データから、予測値を求めようとする出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、距離を変えながらそれぞれ読み出し、複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、所定の基準値に最も近い統計量が得られる距離を、入力データより複数のデータを抽出する抽出距離として決定する決定手段と、予測値を求めようとする教師データである注目教師データについて、決定手段により決定された抽出距離に対応する複数のデータを、生徒データから抽出する抽出手段と、抽出手段において抽出された複数のデータの値のパターンに基づき、注目教師データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力するクラス分類手段と、抽出手段において抽出された複数のデータを用いて、所定の基準値に最も近い統計量が得られる距離に対応する複数のデータとしての、入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数を、距離に対応する複数のデータに基づくクラスコード毎に求める演算手段とを含むことを特徴とする。
【0036】
決定手段には、それぞれの距離に応じた複数のデータの値の標準偏差を統計量として求め、所定の基準値に最も近い標準偏差が得られる距離に基づいて、入力データより複数のデータを抽出する抽出距離を決定させることができる。また、決定手段には、出力データを、それぞれに複数の注目教師データを有するブロック単位とし、所定のブロック内にある複数の注目教師データそれぞれについて得られる複数のデータの標準偏差の平均を統計量とし、当該統計量と所定の基準値とを比較することにより、そのブロック内の注目教師データについて生徒データより複数のデータを抽出する抽出距離を決定させることができる。
【0037】
本発明の他のデータ処理装置には、所定の基準値を求める基準値算出手段をさらに設けることができる。この場合、基準値算出手段には、複数種類の距離に対応する複数のデータに対応するクラスコードについて得られる予測係数で教師データを予測した結果、最適に予測できる距離に対応する複数のデータより求められる統計量を、所定の基準値として求めさせることができる。
【0039】
教師データおよび生徒データは、画像データとすることができる。この場合、抽出手段には、生徒データとしての画像データから、注目教師データとしての画素に対して、空間的または時間的に周辺にある画素を抽出させることができる。
【0040】
本発明の他のデータ処理方法は、データ処理装置が、予測係数の学習のための教師となる教師データに対して、入力データに応じた特定の処理を施し、生徒となる生徒データを生成する生成手段と、入力データから、予測値を求めようとする出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、距離を変えながらそれぞれ読み出し、複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、所定の基準値に最も近い統計量が得られる距離を、入力データより複数のデータを抽出する抽出距離として決定する決定手段と、予測値を求めようとする教師データである注目教師データについて、決定手段により決定された抽出距離に対応する複数のデータを、生徒データから抽出する抽出手段と、抽出手段において抽出された複数のデータの値のパターンに基づき、注目教師データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力するクラス分類手段と、抽出手段において抽出された複数のデータを用いて、所定の基準値に最も近い統計量が得られる距離に対応する複数のデータとしての、入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数を、距離に対応する複数のデータに基づくクラスコード毎に求める演算手段とを含み、生成手段は、予測係数の学習のための教師となる教師データに対して、入力データに応じた特定の処理を施し、生徒となる生徒データを生成し、決定手段は、入力データから、予測値を求めようとする出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、距離を変えながらそれぞれ読み出し、複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、所定の基準値に最も近い統計量が得られる距離を、入力データより複数のデータを抽出する抽出距離として決定し、抽出手段は、予測値を求めようとする教師データである注目教師データについて、決定手段により決定された抽出距離に対応する複数のデータを、生徒データから抽出し、クラス分類手段は、抽出手段において抽出された複数のデータの値のパターンに基づき、注目教師データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力し、演算手段は、抽出手段において抽出された複数のデータを用いて、所定の基準値に最も近い統計量が得られる距離に対応する複数のデータとしての、入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数を、距離に対応する複数のデータに基づくクラスコード毎に求めるステップを含むことを特徴とする。
【0041】
本発明の他の媒体がコンピュータに実行させるプログラムは、予測係数の学習のための教師となる教師データに対して、入力データに応じた特定の処理を施し、生徒となる生徒データを生成する生成ステップと、入力データから、入力データから、予測値を求めようとする出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、距離を変えながらそれぞれ読み出し、複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、所定の基準値に最も近い統計量が得られる距離を、入力データより複数のデータを抽出する抽出距離として決定する決定ステップと、予測値を求めようとする教師データである注目教師データについて、決定ステップにより決定された抽出距離に対応する複数のデータを、生徒データから抽出する抽出ステップと、抽出ステップにおいて抽出された複数のデータの値のパターンに基づき、注目教師データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力するクラス分類ステップと、抽出ステップにおいて抽出された複数のデータを用いて、所定の基準値に最も近い統計量が得られる距離に対応する複数のデータとしての、入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数を、距離に対応する複数のデータに基づくクラスコード毎に求める演算ステップとを含むことを特徴とする。
【0042】
本発明の、さらに他のデータ処理装置は、入力データから、予測値を求めようとする出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、距離を変えながらそれぞれ読み出し、複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、所定の基準値に最も近い統計量が得られる距離を、入力データより複数のデータを抽出する抽出距離として決定する第1の決定手段と、予測値を求めようとする出力データである注目出力データについて、第1の決定手段により決定された抽出距離に対応する複数のデータを、入力データから抽出する第1の抽出手段と、第1の抽出手段において抽出された複数のデータの値のパターンに基づき、注目出力データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力する第1のクラス分類手段と、所定の基準値に最も近い統計量が得られる距離に対応する複数のデータとしての、入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数が、距離に対応する複数のデータに基づくクラスコード毎に予め学習されており、第1の抽出手段において抽出された第1の複数のデータとクラスコードに対応する予測係数との線形一次結合により、注目出力データの予測値を求める予測手段と、予測係数の学習のための教師となる教師データに対して、入力データに応じた特定の処理を施し、生徒となる生徒データを生成する生成手段と、入力データから、予測値を求めようとする出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、距離を変えながらそれぞれ読み出し、複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、所定の基準値に最も近い統計量が得られる距離を、入力データより複数のデータを抽出する抽出距離として決定する第2の決定手段と、予測値を求めようとする教師データである注目教師データについて、第2の決定手段により決定された抽出距離に対応する第2の複数のデータを、生徒データから抽出する第2の抽出手段と、第2の抽出手段において抽出された複数のデータの値のパターンに基づき、注目教師データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力する第2のクラス分類手段と、第2の抽出手段において抽出された第2の複数のデータを用いて、所定の基準値に最も近い統計量が得られる距離に対応する複数のデータとしての、入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数を、距離に対応する複数のデータに基づくクラスコード毎に求める演算手段とを備え、注目出力データの予測値を求めるのに用いられる予測係数は、予め学習されていることを特徴とする。
【0043】
本発明のデータ処理装置およびデータ処理方法、並びに媒体においては、入力データから、予測値を求めようとする出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、距離を変えながらそれぞれ読み出し、複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、所定の基準値に最も近い統計量が得られる距離が、入力データより複数のデータを抽出する抽出距離として決定される。また、予測値を求めようとする出力データである注目出力データについて、抽出距離に対応する複数のデータが、入力データから抽出される。そして、その抽出された複数のデータの値のパターンに基づき、注目出力データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードが出力され、所定の基準値に最も近い統計量が得られる距離に対応する複数のデータとしての、入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数が、距離に対応する複数のデータに基づくクラスコード毎に予め学習されており、抽出ステップにおいて抽出された複数のデータとクラスコードに対応する予測係数との線形一次結合により、注目出力データの予測値が求められる。また、予測係数の学習のための教師となる教師データに対して、入力データに応じた特定の処理を施し、生徒となる生徒データを生成し、入力データから、予測値を求めようとする出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、距離を変えながらそれぞれ読み出し、複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、所定の基準値に最も近い統計量が得られる距離を、入力データより複数のデータを抽出する抽出距離として決定し、予測値を求めようとする教師データである注目教師データについて、決定された抽出距離に対応する複数のデータを、生徒データから抽出し、抽出された複数のデータの値のパターンに基づき、注目教師データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力し、抽出された複数のデータを用いて、所定の基準値に最も近い統計量が得られる距離に対応する複数のデータとしての、入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数を、距離に対応する複数のデータに基づくクラスコード毎に求めることにより、予測係数が予め学習されている。
【0044】
本発明の他のデータ処理装置およびデータ処理方法、並びに媒体においては、予測係数の学習のための教師となる教師データに対して、入力データに応じた特定の処理を施し、生徒となる生徒データが生成され、入力データから、予測値を求めようとする出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、距離を変えながらそれぞれ読み出し、複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、所定の基準値に最も近い統計量が得られる距離が、入力データより複数のデータを抽出する抽出距離として決定される。そして、予測値を求めようとする前記教師データである注目教師データについて、前記決定ステップにより決定された抽出距離に対応する複数のデータが、前記生徒データから抽出され、その抽出された複数のデータの値のパターンに基づき、注目教師データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力され、その抽出された複数のデータを用いて、所定の基準値に最も近い統計量が得られる距離に対応する複数のデータとしての、入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数が、距離に対応する複数のデータに基づくクラスコード毎に求められる。
【0045】
本発明の、さらに他のデータ処理装置においては、入力データから、予測値を求めようとする出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、距離を変えながらそれぞれ読み出し、複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、所定の基準値に最も近い統計量が得られる距離が、入力データより複数のデータを抽出する抽出距離として決定される。また、予測値を求めようとする出力データである注目出力データについて、抽出距離に対応する複数のデータが、入力データから抽出される。そして、その抽出された複数のデータの値のパターンに基づき、注目出力データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードが出力され、所定の基準値に最も近い統計量が得られる距離に対応する複数のデータとしての、入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数が、距離に対応する複数のデータに基づくクラスコード毎に予め学習されており、抽出ステップにおいて抽出された複数のデータとクラスコードに対応する予測係数との線形一次結合により、注目出力データの予測値が求められる。一方、予測係数の学習のための教師となる教師データに対して、入力データに応じた特定の処理を施し、生徒となる生徒データが生成され、入力データから、予測値を求めようとする出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、距離を変えながらそれぞれ読み出し、複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、所定の基準値に最も近い統計量が得られる距離が、入力データより複数のデータを抽出する抽出距離として決定される。そして、予測値を求めようとする前記教師データである注目教師データについて、前記決定ステップにより決定された抽出距離に対応する複数のデータが、前記生徒データから抽出され、その抽出された複数のデータの値のパターンに基づき、注目教師データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力され、その抽出された複数のデータを用いて、所定の基準値に最も近い統計量が得られる距離に対応する複数のデータとしての、入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数が、距離に対応する複数のデータに基づくクラスコード毎に求められる。このようにして求められた予測係数が、注目出力データの予測値を求めるのに用いられる。
【0046】
【発明の実施の形態】
図1は、本発明を適用した画像処理装置の一実施の形態の構成例を示している。
【0047】
この画像処理装置においては、例えば、ぼけた画像が、入力画像として入力されると、その入力画像に対して、クラス分類適応処理が施されることにより、図2に示すように、入力画像のぼけ度にかかわらず、そのぼけが十分に改善された画像(ぼけ改善画像)が出力されるようになっている。
【0048】
即ち、この画像処理装置は、フレームメモリ1、クラスタップ生成回路2、予測タップ生成回路3、クラス分類回路4、係数RAM(Random Access Memory)5、予測演算回路6、およびタップ決定回路7から構成され、そこには、ぼけの改善を行う対象となる入力画像が入力されるようになっている。
【0049】
フレームメモリ1は、画像処理装置に入力される入力画像を、例えば、フレーム単位で一時記憶するようになされている。なお、本実施の形態では、フレームメモリ1は、複数フレームの入力画像を、バンク切換によって記憶することができるようになっており、これにより、画像処理装置に入力される入力画像が動画であっても、その処理をリアルタイムで行うことができるようになっている。
【0050】
クラスタップ生成回路2は、クラス分類適応処理により、予測値を求めようとする原画素(ここでは、入力画素からぼけを完全に排除した、ぼけのない理想的な画素)を、注目原画素として、その注目原画素についてのクラス分類に用いる入力画素を、タップ決定回路7からのタップ情報にしたがい、フレームメモリ1に記憶された入力画像から抽出し、これを、クラスタップとして、クラス分類回路4に出力するようになっている。
【0051】
予測タップ生成回路3は、予測演算回路6において注目原画素の予測値を求めるのに用いる入力画素を、タップ決定回路7からのタップ情報にしたがい、フレームメモリ1に記憶された入力画像から抽出し、これを予測タップとして、予測演算回路6に供給するようになされている。
【0052】
クラス分類回路4は、クラスタップ生成回路2からのクラスタップに基づいて、注目原画素をクラス分類し、その結果得られるクラスに対応するクラスコードを、係数RAM5に対して、アドレスとして与えるようになされている。即ち、クラス分類回路4は、クラスタップ生成回路2からクラスタップを、例えば、1ビットADRC(Adaptive Dynamic Range Coding)処理し、その結果得られるADRCコードを、クラスコードとして、係数RAM5に出力するようになっている。
【0053】
ここで、KビットADRC処理においては、クラスタップを構成する入力画素の画素値の最大値MAXと最小値MINが検出され、DR=MAX-MINを、集合の局所的なダイナミックレンジとし、このダイナミックレンジDRに基づいて、クラスタップを構成する入力画素がKビットに再量子化される。即ち、クラスタップを構成する画素の画素値の中から、最小値MINが減算され、その減算値がDR/2Kで除算(量子化)される。従って、クラスタップが、1ビットADRC処理された場合には、そのクラスタップを構成する各入力画素の画素値は1ビットとされることになる。そして、この場合、以上のようにして得られる、クラスタップを構成する各画素についての1ビットの画素値を、所定の順番で並べたビット列が、ADRCコードとして出力される。
【0054】
係数RAM5は、後述する学習装置において学習が行われることにより得られるクラスごとの予測係数を記憶しており、クラス分類回路4からクラスコードが供給されると、そのクラスコードに対応するアドレスに記憶されている予測係数を読み出し、予測演算回路6に供給するようになっている。
【0055】
予測演算回路6は、係数RAM5から供給される、注目原画素のクラスについての予測係数w,w2,・・・と、予測タップ生成回路3からの予測タップ(を構成する各画素の画素値)x1,x2,・・・とを用いて、式(1)に示した演算を行うことにより、注目原画素yの予測値E[y]を求め、これを、ぼけを改善した画素の画素値として出力するようになっている。
【0056】
タップ決定回路7は、フレームメモリ1に記憶された入力画像の統計量に基づいて、クラスタップおよび予測タップを構成させる複数の入力画素を決定し、そのクラスタップおよび予測タップを構成させる複数の入力画素に関する情報(以下、適宜、タップ情報という)を、クラスタップ生成回路2および予測タップ生成回路3に供給するようになっている。
【0057】
即ち、タップ決定回路7は、基本的に、例えば、注目原画素の位置にある入力画素を中心画素として、例えば、横×縦が3×3画素でなる正方形状のクラスタップおよび予測タップ(以下、適宜、両者をまとめて、単に、タップという)を、クラスタップ生成回路2および予測タップ生成回路3に構成させるようなタップ情報を出力するようになっている。但し、そのタップ情報は、タップを構成する画素どうしの間隔(以下、適宜、タップ幅という)が、入力画像の統計量によって、異なるものとなるようになっている。
【0058】
具体的には、例えば、入力画像の統計量が、ある値である場合には、タップ決定回路7は、図3(A)に示すように、中心画素を中心とする3×3画素でなる、タップ幅が0(タップを構成する画素どうしの間隔が0)のタップを構成するためのタップ情報を出力する。また、例えば、入力画像の統計量が、他の値である場合には、タップ決定回路7は、図3(B)に示すように、中心画素を中心とする3×3画素でなる、タップ幅が1(タップを構成する画素どうしの間隔が1画素または1フレーム)のタップを構成するためのタップ情報を出力する。
【0059】
次に、図4のフローチャートを参照して、図1の画像処理装置において行われる、入力画像のぼけを改善するぼけ改善処理について説明する。
【0060】
フレームメモリ1には、ぼけ改善処理の対象としての入力画像(動画像)が、フレーム単位で順次供給され、フレームメモリ1では、そのようにフレーム単位で供給される入力画像が順次記憶されていく。
【0061】
そして、ステップS1において、タップ決定回路7は、フレームメモリ1に記憶された入力画像の統計量に基づいて、タップを構成させる複数の入力画素を決定し、その複数の入力画素に関するタップ情報を、クラスタップ生成回路2および予測タップ生成回路3に出力する。
【0062】
クラスタップ生成回路2または予測タップ生成回路3は、タップ決定回路7からタップ情報を受信すると、ステップS2において、そのタップ情報にしたがい、予測値を求めようとする注目原画素についてのクラスタップまたは予測タップを構成させる複数の入力画素を、フレームメモリ1から読み出し、クラスタップまたは予測タップをそれぞれ構成する。このクラスタップまたは予測タップは、クラス分類回路4または予測演算回路6にそれぞれ供給される。
【0063】
クラス分類回路4は、クラスタップ生成回路2からクラスタップを受信すると、ステップS3において、そのクラスタップに基づき、注目原画素についてクラス分類を行い、その結果得られるクラスコードを、係数RAM5に対して、アドレスとして出力する。係数RAM5は、ステップS4において、クラス分類回路4からのクラスコードに対応するアドレスに記憶されている予測係数を読み出し、予測演算回路6に供給する。
【0064】
予測演算回路6では、ステップS5において、予測タップ生成回路3からの予測タップと、係数RAM5からの予測係数とを用いて、式(1)に示した演算が行われることにより、注目原画素yの予測値E[y]、即ち、ここでは、ぼけを改善した画素が求められ、ステップS6に進む。ステップS6では、予測演算回路6が、ステップS5で求めた注目原画素yの予測値E[y]を、その注目原画素と同一位置にある入力画素におけるぼけを改善した画素値として出力し、ステップS7に進む。
【0065】
ステップS7では、後述する所定のブロック内にある原画素すべてを、注目原画素として処理を行ったか否かが判定され、まだ行っていないと判定された場合、ステップS2に戻り、ブロック内の原画素のうち、まだ注目原画素としていない原画素を、新たに注目原画素として、以下、同様の処理が繰り返される。従って、本実施の形態では、同一ブロック内にある原画素については、同一のタップ情報に基づいてタップが構成される。即ち、同一ブロック内の原画素については、各原画素から見て同一の位置にある入力画素からタップが構成される。
【0066】
また、ステップS7において、所定のブロック内にある原画素すべてを、注目原画素として処理を行ったと判定された場合、ステップS8に進み、次に処理すべきブロックがあるか否か、即ち、フレームメモリ1に、次に処理すべきブロックに対応する入力画像が記憶されているかどうかが判定される。ステップS8において、フレームメモリ1に、次に処理すべきブロックに対応する入力画像が記憶されていると判定された場合、ステップS1に戻り、以下、同様の処理が繰り返される。従って、次に処理すべきブロックには、新たに、タップ情報が決定され、そのタップ情報に従ってタップが構成される。
【0067】
一方、ステップS8において、フレームメモリ1に、次に処理すべきブロックに対応する入力画素が記憶されていないと判定された場合、ぼけ改善処理を終了する。
【0068】
次に、図5は、図1のタップ決定回路7の構成例を示している。
【0069】
読み出し部11は、所定のブロック内にある原画素が注目原画素とされたときに、その注目原画素についてのタップとなる入力画素を、フレームメモリ1(図1)から読み出し、標準偏差算出部12に供給するようになっている。
【0070】
即ち、ここでは、例えば、原画像の1フレームや、その1フレームを幾つかの領域に分割したもの、あるいは、数フレーム(例えば、シーンチェンジ直後のフレームから、次のシーンチェンジの直前のフレームまで)を1ブロックとして、そのブロック単位で、タップ情報を決定するようになっており、読み出し部11は、あるブロック内にある各原画素が注目原画素とされたときに、その各原画素について、判定部13の制御にしたがったタップ幅のタップを構成する入力画素を、フレームメモリ1から読み出し、標準偏差算出部12に供給するようになっている。
【0071】
標準偏差算出部12は、読み出し部11からのタップの統計量として、そのタップを構成する入力画素の画素値の標準偏差を算出するようになっている。さらに、標準偏差算出部12は、ブロックごとに、タップ幅が同一のタップについての標準偏差の平均値scoreを演算し、その平均値scoreを、各ブロックについての各タップ幅の評価値として、判定部13に供給するようになっている。即ち、ブロックをiで、タップ幅をjで、それぞれ表すとすると、標準偏差算出部12は、ブロック#i内にある各原画素について構成されるタップ幅jのタップの評価値として、次式で表されるscore(i,j)を計算し、判定部13に供給するようになっている。
【0072】
【数8】
ここで、式(8)において、Mは、ブロック#i内にある原画素の個数を表し、Kは、タップを構成する入力画素の個数を表す。さらに、Vm,j,kは、ブロック#i内にあるm番目の原画素について構成される、タップ幅jのタップの中のk番目の入力画素の画素値を表す。また、meanm,jは、ブロック#i内にあるm番目の原画素について構成される、タップ幅jのタップの平均値(タップを構成する入力画素の画素値の平均値)を表す。従って、meanm,jは、(Vm,j,1+Vm,j,2+・・・+Vm,j,K)/Kを演算することで求めることができる。
【0073】
判定部13は、標準偏差算出部12からの評価値score(i,j)と、基準値設定部14に設定されている所定の基準値とを比較し、その比較結果に基づいて、読み出し部11を制御するようになっている。さらに、判定部13は、その比較結果に基づいて、注目原画素を含むブロック(以下、適宜、注目ブロックという)内の原画素についてタップを構成するときのタップ幅を決定し、そのタップ幅を、タップ情報として出力するようになっている。
【0074】
基準値設定部14は、入力画像のぼけが最も改善される場合(入力画素のクラス分類処理結果が、その入力画素に対応する原画素に最も近づく場合)の、タップを構成する入力画素(生徒データ)の画素値の標準偏差が、標準偏差算出部12の出力と比較する基準値として設定されている。なお、この基準値の求め方については、後述する。
【0075】
次に、図6のフローチャートを参照して、図5のタップ決定回路7において行われる、タップの構造を決定するタップ決定処理について説明する。
【0076】
タップ決定処理では、注目ブロック内の原画素のいずれかが、初めて注目原画素とされると、ステップS11において、読み出し部11は、その注目ブロックの注目原画素とされた原画素について、例えば、タップ幅0のタップを構成するための入力画素を、フレームメモリ1(図1)から読み出し、標準偏差算出部12に供給する。
【0077】
そして、ステップS12に進み、標準偏差算出部12において、読み出し部11からの入力画素で構成されるタップの標準偏差が求められ、ステップS13に進む。ステップS13では、注目ブロック内のすべての原画素を注目原画素として処理を行ったかどうかが判定され、行っていないと判定された場合、ステップS11に戻り、注目ブロック内の原画素のうち、まだ注目原画素とされていないものを、新たに注目原画素として、以下、同様の処理が繰り返される。
【0078】
また、ステップS13において、注目ブロック内のすべての原画素を注目原画素として処理を行ったと判定された場合、ステップS14に進み、標準偏差算出部12は、注目ブロックの各原画素について得られたタップの標準偏差の平均値を算出する。
【0079】
即ち、いま、注目ブロックが、ブロック#iで表され、その注目ブロック#iの各原画素について構成されたタップのタップ幅がjで表されるとすると、ステップS14では、式(8)で示されるscore(i,j)が算出される。このscore(i,j)は、判定部13に供給される。
【0080】
判定部13では、ステップS15において、標準偏差算出部12からのscore(i,j)が、基準値設定部14に設定された基準値に近いかどうかが判定され、近くないと判定された場合、即ち、注目ブロック#iの各原画素について構成されたタップ幅jのタップの標準偏差の平均値が、基準値に近くない場合、ステップS16に進み、判定部13は、タップ幅jを変更するように、読み出し部11を制御し、ステップS11に戻る。
【0081】
この場合、ステップS11では、読み出し部11において、注目ブロックのある原画素を注目原画素として、その注目原画素について、タップ幅j+1のタップを構成するための入力画素が、フレームメモリ1から読み出され、以下、同様の処理が繰り返される。
【0082】
一方、ステップS15において、標準偏差算出部12からのscore(i,j)が、基準値設定部14に設定された基準値に近いと判定された場合、即ち、注目ブロック#iの各原画素について構成されたタップ幅jのタップの標準偏差の平均値が、基準値に近い場合、ステップS17に進み、判定部13は、そのタップ幅jを、タップ情報として出力し、リターンする。
【0083】
上述したように、図1のクラスタップ生成回路2および予測タップ生成回路3では、タップ決定回路7がブロックごとに出力するタップ情報にしたがって、そのブロックの原画素が注目原画素とされた場合のタップが構成されるから、タップ幅jのタップ情報が出力された場合には、注目ブロックを構成する原画素については、そのようなタップ幅jのタップが構成されることになる。
【0084】
次に、図7は、図1の係数RAM5に記憶させるクラスごとの予測係数を求めるとともに、図5の基準値設定部14に設定する所定の基準値を求める学習装置の一実施の形態の構成例を示している。
【0085】
フレームメモリ61には、教師データyとなる原画像(ここでは、ぼけのない画像)が、例えば、フレーム単位で供給されるようになっており、フレームメモリ61は、その原画像を、一時記憶するようになっている。ぼけ付加回路62は、フレームメモリ61に記憶された、予測係数の学習において教師データyとなる原画像を読み出し、その原画像を構成する原画素に対してぼかしを付加し(例えば、ローパスフィルタでフィルタリングし)、生徒データとしての、ぼけのある画像(以下、適宜、ぼけ画像という)を生成するようになっている。このぼけ画像は、フレームメモリ63に供給されるようになっている。
【0086】
フレームメモリ63は、ぼけ付加回路62からのぼけ画像を一時記憶するようになっている。
【0087】
なお、フレームメモリ61および63は、図1のフレームメモリ1と同様に構成されている。
【0088】
クラスタップ生成回路64または予測タップ生成回路65は、フレームメモリ63に記憶されたぼけ画像を構成する画素(以下、適宜、ぼけ画素という)を用い、図1のクラスタップ生成回路2または予測タップ生成回路3と同様に、タップ決定回路72からのタップ情報にしたがって、注目原画素について、クラスタップまたは予測タップを構成し、クラス分類回路66または加算回路67にそれぞれ供給するようになっている。
【0089】
クラス分類回路66は、図1のクラス分類回路4と同様に構成され、クラスタップ生成回路64からのクラスタップに基づいて、注目原画素をクラス分類し、対応するクラスコードを、予測タップメモリ68および教師データメモリ70に対して、アドレスとして与えるようになっている。
【0090】
加算回路67は、クラス分類回路66が出力するクラスコードに対応するアドレスの記憶値を、予測タップメモリ68から読み出し、その記憶値と、予測タップ生成回路65からの予測タップを構成するぼけ画素(の画素値)とを加算することで、式(7)の正規方程式の左辺における、予測係数wの乗数となっているサメーション(Σ)に相当する演算を行う。そして、加算回路67は、その演算結果を、クラス分類回路66が出力するクラスコードに対応する、予測タップメモリ68のアドレスに、上書きする形で記憶させるようになっている。
【0091】
予測タップメモリ68は、クラス分類回路66が出力するクラスに対応するアドレスの記憶値を読み出し、加算回路67に供給するとともに、そのアドレスに、加算回路67の出力値を記憶するようになっている。
【0092】
加算回路69は、フレームメモリ61に記憶された原画像を構成する原画素のうちの、注目原画素を、教師データyとして読み出すとともに、クラス分類回路66が出力するクラスコードに対応するアドレスの記憶値を、教師データメモリ70から読み出し、その記憶値と、フレームメモリ61から読み出した教師データ(原画素)yとを加算することで、式(7)の正規方程式の右辺におけるサメーション(Σ)に相当する演算を行う。そして、加算回路69は、その演算結果を、クラス分類回路66が出力するクラスコードに対応する、教師データメモリ70のアドレスに、上書きする形で記憶させるようになっている。
【0093】
なお、加算回路67および69では、式(7)における乗算も行われる。即ち、加算器67では、予測タップを構成するぼけ画素xどうしの乗算も行われ、また、加算器69では、予測タップを構成するぼけ画素xと、教師データyとの乗算も行われる。従って、加算器69では、ぼけ画素xが必要となるが、これは、フレームメモリ63から読み出されるようになっている。
【0094】
教師データメモリ70は、クラス分類回路66が出力するクラスコードに対応するアドレスの記憶値を読み出し、加算回路69に供給するとともに、そのアドレスに、加算回路69の出力値を記憶するようになっている。
【0095】
演算回路71は、予測タップメモリ68または教師データメモリ70それぞれから、各クラスコードに対応するアドレスに記憶されている記憶値を順次読み出し、式(7)に示した正規方程式をたてて、これを解くことにより、クラスごとの予測係数を求めるようになっている。即ち、演算回路71は、予測タップメモリ68または教師データメモリ70それぞれの、各クラスコードに対応するアドレスに記憶されている記憶値から、式(7)の正規方程式をたて、これを解くことにより、クラスごとの予測係数を求めるようになっている。
【0096】
タップ決定回路72は、図1のタップ決定回路7と同様のタップ決定処理を行うことで、クラスタップ生成回路64および予測タップ生成回路65に生成させるタップに関するタップ情報を決定し、クラスタップ生成回路64および予測タップ生成回路65に供給するようになっている。さらに、タップ決定回路72は、タップ決定処理において用いる所定の基準値の算出も行うようになっている。
【0097】
次に、図8のフローチャートを参照して、図7の学習装置において行われる、クラスごとの予測係数および所定の基準値を求める学習処理について説明する。
【0098】
学習装置には、教師データとしての原画像(動画像)が、フレーム単位で供給されるようになっており、その原画像は、フレームメモリ61において順次記憶されていく。また、フレームメモリ61に記憶された原画像は、ぼけ付加回路62に供給され、そこで、ぼけ画像とされる。なお、ぼけ付加回路62では、例えば、フレームごと等に、ぼけ度の異なるぼけ画像が生成されるようになっている。
【0099】
ぼけ付加回路62で得られたぼけ画像は、生徒データとして、フレームメモリ63に順次供給されて記憶される。
【0100】
以上のようにして、学習処理のために用意されたすべての原画像に対応するぼけ画像が、フレームメモリ63に記憶されると、タップ決定回路72は、ステップS21において、タップ決定処理に用いる基準値を、後述するようにして求め、ステップS22に進む。
【0101】
ステップS22では、タップ決定回路72において、図1のタップ決定回路7における場合と同様にして、タップを構成させるぼけ画素が決定され、そのぼけ画素に関するタップ情報が、クラスタップ生成回路64および予測タップ生成回路65に出力される。
【0102】
クラスタップ生成回路64または予測タップ生成回路65では、ステップS23において、タップ決定回路72からのタップ情報にしたがい、予測値を求めようとする注目原画素についてのクラスタップまたは予測タップを構成させるぼけ画素が、フレームメモリ63から読み出され、クラスタップまたは予測タップがそれぞれ構成される。このクラスタップまたは予測タップは、クラス分類回路66または加算回路67にそれぞれ供給される。
【0103】
クラス分類回路66では、ステップS24において、図1のクラス分類回路4における場合と同様にして、クラスタップ生成回路64からのクラスタップを用いて、注目原画素がクラス分類され、そのクラス分類結果としてのクラスコードが、予測タップメモリ68および教師データメモリ70に対して、アドレスとして与えられる。
【0104】
そして、ステップS25に進み、予測タップ(生徒データ)または教師データそれぞれの足し込みが行われる。
【0105】
即ち、ステップS25において、予測タップメモリ68は、クラス分類回路66が出力するクラスコードに対応するアドレスの記憶値を読み出し、加算回路67に供給する。加算回路67は、予測タップメモリ68から供給される記憶値と、予測タップ生成回路65から供給されるの予測タップを構成するぼけ画素とを用いて、式(7)の正規方程式の左辺における、予測係数の乗数となっているサメーション(Σ)に相当する演算を行う。そして、加算回路67は、その演算結果を、クラス分類回路66が出力するクラスコードに対応する、予測タップメモリ68のアドレスに、上書きする形で記憶させる。
【0106】
さらに、ステップS25では、教師データメモリ70は、クラス分類回路66が出力するクラスコードに対応するアドレスの記憶値を読み出し、加算回路69に供給する。加算回路69は、フレームメモリ61から、注目原画素を読み出すとともに、フレームメモリ63から、必要なぼけ画素を読み出し、その読み出した画素と、教師データメモリ70から供給された記憶値とを用いて、式(7)の正規方程式の右辺におけるサメーション(Σ)に相当する演算を行う。そして、加算回路69は、その演算結果を、クラス分類回路66が出力するクラスコードに対応する、教師データメモリ70のアドレスに、上書きする形で記憶させる。
【0107】
その後、ステップS26に進み、いま注目している注目ブロック内にある原画素すべてを、注目原画素として処理を行ったか否かが判定され、まだ行っていないと判定された場合、ステップS23に戻り、注目ブロック内の原画素のうち、まだ注目原画素とされていない原画素を、新たに注目原画素として、以下、同様の処理が繰り返される。
【0108】
また、ステップS26において、注目ブロック内にある原画素すべてを、注目原画素として処理を行ったと判定された場合、ステップS27に進み、次に処理すべきブロックがあるか否か、即ち、フレームメモリ63に、次に処理すべきブロックに対応するぼけ画像が記憶されているかどうかが判定される。ステップS27において、フレームメモリ63に、次に処理すべきブロックに対応するぼけ画像が記憶されていると判定された場合、ステップS22に戻り、そのブロックを新たに注目ブロックとし、さらに、その注目ブロック内の原画素のうちの1つを、新たに注目原画素として、以下、同様の処理が繰り返される。
【0109】
一方、ステップS27において、フレームメモリ63に、次に処理すべきブロックに対応するぼけ画素が記憶されていないと判定された場合、即ち、あらかじめ学習用に用意しておいたすべての原画像を用いて処理を行った場合、ステップS28に進み、演算回路71は、予測タップメモリ68または教師データメモリ70それぞれから、各クラスコードに対応するアドレスに記憶されている記憶値を順次読み出し、式(7)に示した正規方程式をたてて、これを解くことにより、クラスごとの予測係数を求める。さらに、演算回路71は、ステップS29において、その求めたクラスごとの予測係数を出力して、学習処理を終了する。
【0110】
なお、以上のような予測係数の学習処理において、予測係数を求めるのに必要な数の正規方程式が得られないクラスが生じる場合があり得るが、そのようなクラスについては、例えば、デフォルトの予測係数を出力するようにすること等が可能である。
【0111】
次に、図9は、図8のタップ決定回路72の構成例を示している。
【0112】
同図に示すように、タップ決定回路72は、読み出し部81、標準偏差算出部82、判定部83、および基準値作成部84で構成されており、このうち、読み出し部81、標準偏差算出部82、または判定部83は、図5の読み出し部11、標準偏差算出部12、または判定部13とそれぞれ同様に構成されている。従って、タップ決定回路72は、基準値設定部14に替えて、基準値作成部84が設けられている他は、図5のタップ決定回路7と同様に構成されている。
【0113】
基準値作成部84は、図8のステップS21において、タップ決定処理に用いる基準値を求め、判定部83に供給するようになっている。
【0114】
以上のように構成されるタップ決定回路72では、図10のフローチャートに示すように、ステップS31乃至S37において、図6のステップS11乃至S17における場合とそれぞれ同様の処理が行われることで、各ブロックごとに、タップ情報が決定される。
【0115】
次に、図11および図12を参照して、図9の基準値作成部84において行われる基準値の算出の方法について説明する。
【0116】
基準値作成部84では、学習処理のために用意されたすべての原画像(教師データ)が、フレームメモリ61から読み出されるとともに、その原画像に、ぼけが付加されたぼけ画像(生徒データ)が、フレームメモリ63から読み出される。さらに、基準値作成部84は、ぼけ画像に対する原画像を、上述したようなブロックに分割し、各ブロックの原画素それぞれについて、タップ幅の異なるタップを構成し、タップ幅と、タップを構成するぼけ画素の標準偏差の平均値との関係を求める。
【0117】
即ち、あるブロックに注目した場合に、基準値作成部84は、そのブロックの各原画素を、順次、注目原画素として、タップ幅がjのタップを構成する。さらに、基準値作成部84は、各原画素について構成されたタップの標準偏差を求め、その標準偏差の、ブロックにおける平均値を演算する。具体的には、ブロック#iの原画素の総数をMで、タップを構成するぼけ画素の総数をKで、ブロック#iにおけるm番目の原画素について構成される、タップ幅jのタップの中のk番目のぼけ画素の画素値をVm,j,kで、ブロック#iにおけるm番目の原画素について構成される、タップ幅jのタップの平均値(タップを構成するぼけ画素の平均値)をmeanm,jで、それぞれ表すとすると、基準値作成部84では、上述した式(8)にしたがって、score(i,j)が演算される。
【0118】
基準値作成部84は、タップ幅jを、幾つかの値に変えて、ブロック#iにおける各原画素についてタップを構成し、順次、各タップ幅jのタップの標準偏差の平均値score(i,j)を計算していく。
【0119】
さらに、基準値作成部84は、その他のブロック#iについても、同様に、各タップ幅jのタップの標準偏差の平均値score(i,j)を計算していく。
【0120】
以上のようにして、基準値作成部84では、図11に示すような、各ブロック#iについて、タップ幅jと、そのタップ幅jのタップの標準偏差の平均値score(i,j)との関係が求められる。
【0121】
なお、図11は、4つブロック#1乃至#4それぞれについての、タップ幅jと、タップの標準偏差の平均値score(i,j)との関係を示しており、○印がブロック#1についてのものを、×印がブロック#2についてのものを、△印がブロック#3についてのものを、□印がブロック#4についてのものを、それぞれ表している。
【0122】
また、図11は、タップ幅jを、0乃至10それぞれとしたときのタップの標準偏差の平均値score(i,j)を示している。
【0123】
ブロック#iの各原画素について構成されるタップの標準偏差の平均値score(i,j)は、そのブロック#iに対するぼけ画像の画素値の変化のし具合、即ち、ぼけの程度を表しており、従って、score(i,j)が大きいほど(小さいほど)、ぼけ度は小さい(大きい)ことを表す。
【0124】
基準値作成部84は、上述のようにして、タップの標準偏差の平均値score(i,j)を求めるのと同時に、各タップ幅jのタップを用いて、クラス分類適応処理により、原画素の予測値を求める。
【0125】
即ち、基準値作成部84は、ブロック#iにおける原画素と、ぼけ画像とを用い、タップ幅jをある値に固定して、式(7)の正規方程式を生成し、それを解くことで、クラスごとの予測係数を求める。さらに、基準値作成部84は、そのクラスごとの予測係数を用い、タップ幅jを、上述のある値に固定して、式(1)の線形予測式を計算することで、ブロック#iにおける各原画像の予測値を求める。
【0126】
基準値作成部84は、タップ幅jを、順次変えて同様の処理を行い、さらに、他のブロックについても、同様の処理を行う。これにより、各ブロック#iの原画素について、各タップ幅jのタップを用いたときの、その予測値e(i,j)が求められる。即ち、各ブロック#iの原画素について、その原画素の予測に用いるタップのタップ幅jと、原画素の予測値e(i,j)との関係が求められる。
【0127】
そして、基準値作成部84は、以上のようにして求められた予測値e(i,j)が、原画像にどの程度近いかを判定する。即ち、基準値作成部84は、例えば、ブロック#iについて、原画素と、タップ幅jのタップを用いて求めた予測値e(i,j)との絶対値差分和の逆数等を、予測値e(i,j)のS/N(Signal to Noise Ratio)として求める。ここで、図11に示した4つのブロック#iについて得られた予測値e(i,j)のS/Nを、図12に示す。
【0128】
図12においては、ブロック#1について、タップ幅jが0のタップを用いて得られた予測値e(1,0)のS/Nが最も良くなっており、即ち、その予測値e(1,0)が、原画像に最も近くなっており、基準値作成部84では、そのように、原画像に最も近くなっている予測値e(i,j)が得られたブロック#iと、タップ幅jとが検出される。ここで、以上のようにして検出されたブロック#iまたはタップ幅jを、以下、適宜、それぞれ、最適ブロックまたは最適タップ幅という。
【0129】
最適ブロックについて、タップ幅jが最適タップ幅のタップを構成して得られたときの予測値e(i,j)が原画像に最も近くなっているということは、最適ブロックについて、最適タップ幅のタップを構成したときの、そのタップの標準偏差(以下、適宜、最適標準偏差という)が、他のブロックについて構成されるタップの標準偏差としても、最も適した値であると考えられる。
【0130】
即ち、統計的な観点から、他のブロックについても、その標準偏差が、最適標準偏差となるようなタップ幅のタップを構成した場合に、原画像に最も近い予測値が得られると考えられる。
【0131】
そこで、基準値作成部84では、最適標準偏差が求められ、これが、所定の基準値として、判定部83に供給される。
【0132】
ここで、図12では、ブロック#1について、タップ幅jが0のタップを用いて得られた予測値e(1,0)のS/Nが最も良くなっているから、基準値作成部84では、図11において、ブロック#1について得られたscore(1,j)(図11で○印で示す)のうち、タップ幅jが0のときの値である20が、最適標準偏差として求められる。
【0133】
さらに、この場合、他のブロックについては、図11において、太線の矢印で示す値が、最適標準偏差に一致する標準偏差が得られるタップ幅jであり、従って、図6や図10のタップ決定処理では、そのような値がタップ幅jとして決定されることになる。
【0134】
なお、タップ幅jは整数値をとるものであるが、最適標準偏差に一致する標準偏差が得られるタップ幅(図11において太線の矢印で示す値)は、図11から明らかなように、整数値をとるとは限らない(むしろ、整数値とならない場合が多い)。そこで、図6や図10のタップ決定処理では、最適標準偏差に一致する標準偏差が得られるタップ幅が整数値とならない場合には、例えば、その整数値でないタップ幅に最も近い整数値が、最終的なタップ幅として決定されるようになっている。
【0135】
即ち、図6のタップ決定処理では(図10においても同様)、上述したように、標準偏差算出部12からのscore(i,j)が、基準値設定部14に設定された基準値に近いかどうかが判定され(ステップS15)、近いと判定された場合、そのときのタップ幅jが、タップ情報として出力される(ステップS17)ようになっているが、ここで言っている「score(i,j)が基準値に近い」というのは、整数値をとるタップ幅jのタップを構成したときの、そのタップの標準偏差(本実施の形態では、ブロックについて得られる標準偏差の平均値)score(i,j)が、基準値に最も近いことを意味している。
【0136】
なお、図6や図10のタップ決定処理では、最適標準偏差に一致する標準偏差が得られるタップ幅を求め、そのタップ幅が整数値でない場合には、タップ幅の平均値が、その整数値でないタップ幅となるタップを構成するようにすることも可能である。即ち、最適標準偏差に一致する標準偏差が得られるタップ幅が、例えば、1.5である場合には、ある画素どうしのタップ幅を1とするとともに、他の画素どうしのタップ幅を2としてタップを構成し、そのタップにおけるタップ幅の平均が1.5となるようにすることが可能である。
【0137】
以上のように、最適標準偏差を求め、その最適標準偏差に一致するような標準偏差が得られるタップ幅のタップを構成して、学習処理およびぼけ改善処理を行うようにしたので、それらの処理性能を向上させることができる。
【0138】
即ち、学習処理においては、画像のぼけ度に適したクラス分けが行われ、さらに、そのぼけ度に適した予測タップが構成される。その結果、画像のぼけ度に適したクラスごとの予測係数を得ることができる。また、ぼけ改善処理においても、画像のぼけ度に適したクラス分けが行われるとともに、そのぼけ度に適した予測タップが構成され、さらに、ぼけ度に適したクラスごとの予測係数を用いて、原画素の予測値が求められる。その結果、画像のぼけ度にかかわらず、鮮明な画像(ぼけが、より改善された画像)を得ることができる。
【0139】
具体的には、例えば、前述したように、ぼけ度の小さい入力画像を対象にクラス分類適応処理を行う場合においては、注目原画素から見て、比較的近い位置にある入力画素を用いてクラス分類を行う方が、注目原画素の性質を反映したクラス分けを行うことができ、また、ぼけ度の大きい入力画像を対象にクラス分類適応処理を行う場合においては、注目原画素から見て、比較的遠い位置にある入力画素を用いてクラス分類を行う方が、その性質を反映したクラス分けを行うことができるが、図11に示した場合には、そのようなクラス分類が行われる。
【0140】
即ち、図11に示した場合においては、上述したように、score(i,j)が大きいブロックほど、ぼけ度は小さいから、ブロック#1,#2,#3,#4の順で、ぼけ度は大きくなっている。そして、図11に示した場合には、上述したことから、ブロック#1,#2,#3,#4それぞれについては、タップ幅が0,1,3,8のタップが構成される。
【0141】
従って、本願手法によれば、ぼけ度が大きくなるほど、注目原画素から見て遠い位置にある入力画素を用いてクラスタップが構成されるので、画像の性質を十分に反映したクラス分けが行われることになる。
【0142】
次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアとしての画像処理装置や学習装置に組み込まれているコンピュータ、または各種のプログラムをインストールすることで各種の処理を行う汎用のコンピュータ等にインストールされる。
【0143】
そこで、図13を参照して、上述した一連の処理を実行するプログラムをコンピュータにインストールし、コンピュータによって実行可能な状態とするために用いられる媒体について説明する。
【0144】
プログラムは、図13(A)に示すように、コンピュータ101に内蔵されている記録媒体としてのハードディスク102に予めインストールした状態でユーザに提供することができる。
【0145】
あるいはまた、プログラムは、図13(B)に示すように、フロッピーディスク111、CD-ROM(Compact Disc Read Only Memory)112,MO(Magneto optical)ディスク113,DVD(Digital Versatile Disc)114、磁気ディスク115、半導体メモリ116などの記録媒体に、一時的あるいは永続的に格納し、パッケージソフトウエアとして提供することができる。
【0146】
さらに、プログラムは、図13(C)に示すように、ダウンロードサイト121から、ディジタル衛星放送用の人工衛星122を介して、コンピュータ123に無線で転送したり、LAN(Local Area Network)、インターネットといったネットワーク111を介して、コンピュータ123に有線で転送し、コンピュータ123において、内蔵するハードディスクなどに格納させるようにすることができる。
【0147】
本明細書における媒体とは、これら全ての媒体を含む広義の概念を意味するものである。
【0148】
また、本明細書において、媒体により提供されるプログラムを記述するステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含むものである。
【0149】
なお、クラス分類適用処理は、教師データと生徒データとを用いて、クラスごとに予測係数を求める学習を行い、その予測係数と入力データとを用いた線形一次予測により、入力データから、教師データの予測値を求めるものであるから、学習に用いる教師データおよび生徒データによって、所望の予測値を求めるための予測係数を得ることが可能となる。即ち、例えば、教師データとして、高解像度の画像を用いるとともに、生徒データとして、その画像の解像度を落とした画像を用いることで、解像度を向上させる予測係数を得ることができる。また、例えば、教師データとして、ノイズを含まない画像を用いるとともに、生徒データとして、その画像にノイズを付加した画像を用いることで、ノイズの除去を行う予測係数を得ることができる。従って、本発明は、上述したようなぼけを改善する場合の他、ノイズを除去する場合や、解像度を向上させる場合、その他、例えば波形等化を行う場合等に適用可能である。
【0150】
また、本実施の形態では、動画像を、クラス分類適用処理の対象としたが、動画像の他、静止画、さらには、音声や、記録媒体から再生された信号(RF(Radio
Frequency)信号)等を対象とすることも可能である。
【0151】
さらに、本実施の形態では、クラスタップおよび予測タップは、同一のタップ情報にしたがって構成されることから、同一の画素で構成されることになるが、クラスタップと予測タップとは、異なる構成とすること、即ち、異なるタップ情報にしたがって構成することも可能である。
【0152】
また、本実施の形態では、クラスタップおよび予測タップのいずれもタップ情報にしたがって構成することにより、タップ幅を可変とするようにしたが、クラスタップまたは予測タップのうちのいずれか一方は、固定のタップ幅とすることが可能である。
【0153】
さらに、本実施の形態では、タップの標準偏差に基づいて、タップ情報を決定するようにしたが、タップ情報は、タップの標準偏差以外の統計量に基づいて決定することも可能である。即ち、タップ情報は、例えば、タップを構成する画素の分散や、その画素どうしの差分絶対値和、2次差分絶対値和(画素どうしの差分値どうしの差分の絶対値和)等に基づいて決定することが可能である。
【0154】
また、本実施の形態では、複数の画素でなるブロックごとに、タップ幅を変更するようにしたが、タップ幅は、例えば、画素単位で変更するようにすることも可能である。
【0155】
さらに、本実施の形態では、画像処理装置と、その画像処理装置で用いるクラスごとの予測係数および基準値を学習する学習装置とを、別々の装置として構成するようにしたが、画像処理装置と学習装置とは一体的に構成することも可能である。そして、この場合、学習装置には、リアルタイムで学習を行わせ、画像処理装置で用いる予測係数を、リアルタイムで更新させるようにすることが可能である。
【0156】
また、本実施の形態では、係数RAM5に、あらかじめクラスごとの予測係数を記憶させておくようにしたが、この予測係数は、例えば、入力画像とともに、画像処理装置に供給するようにすることも可能である。同様に、基準値についても、基準値設定部14(図5)に設定しておくのではなく、入力画像とともに、画像処理装置に供給するようにすることが可能である。
【0157】
さらに、クラスタップおよび予測タップは、空間方向および時間方向のいずれの方向にある画素を用いて構成しても良い。
【0158】
また、本実施の形態では、入力画像の統計量に基づいて、タップ幅を変えることで、タップの構成(タップを構成する画素)を変更するようにしたが、タップの構成は、その他、例えば、タップを構成させる画素の位置等を変えることで変更することが可能である。
【0159】
さらに、本実施の形態では、一次式によって、原画素の予測値を求めるようにしたが、予測値は、二次以上の式によって、求めるようにすることも可能である。
【0160】
なお、学習処理では、上述したように、予測タップを用いて、式(7)のサメーション(Σ)に相当する足し込みが行われるが、タップ幅の異なる予測タップを用いた足し込みは、それらの予測タップの、対応する画素どうしを対象に行われる。
【0161】
即ち、図3に示したように、予測タップを、中心画素を中心とする3×3画素の9画素で構成するとすると、本実施の形態では、タップ幅が0の予測タップ(図3(A))が構成されたり、タップ幅が1の予測タップ(図3(B))が構成されたりする。この場合、タップ幅が0の予測タップの、例えば、最も左上の画素については、タップ幅が1の予測タップの最も左上の画素との足し込みが行われる。
【0162】
また、タップ幅の異なるクラスタップのクラス分類も、同様の手法で行われる。従って、例えば、図3(A)に示したタップ幅が0の予測タップを構成する各画素の画素値が、図3(B)に示したタップ幅が1の予測タップを構成する、対応する画素の画素値とそれぞれ等しい場合には、図3(A)および図3(B)のクラスタップを用いたクラス分類結果は、同一になる(同一のクラスに分類される)。
【0163】
【発明の効果】
本発明のデータ処理装置およびデータ処理方法、並びに媒体によれば、注目出力データに近い予測値を求めることが可能となる。
【0164】
本発明の他のデータ処理装置およびデータ処理方法、並びに媒体によれば、教師データに近い予測値を求めることが可能な予測係数を得ることが可能となる。
【0165】
本発明の、さらに他のデータ処理装置によれば、注目出力データに近い予測値を求めることが可能となる。
【図面の簡単な説明】
【図1】本発明を適用した画像処理装置の一実施の形態の構成例を示すブロック図である。
【図2】図1の画像処理装置の処理の概要を示す図である。
【図3】図1のタップ決定回路7の処理を説明するための図である。
【図4】図1の画像処理装置によるぼけ改善処理を説明するためのフローチャートである。
【図5】図1のタップ決定回路7の構成例を示すブロック図である。
【図6】図5のタップ決定回路7によるタップ決定処理を説明するためのフローチャートである。
【図7】本発明を適用した学習装置の一実施の形態の構成例を示すブロック図である。
【図8】図7の学習装置による学習処理を説明するためのフローチャートである。
【図9】図7のタップ決定回路72の構成例を示すブロック図である。
【図10】図9のタップ決定回路72によるタップ決定処理を説明するためのフローチャートである。
【図11】図9の基準値作成部84の処理を説明するための図である。
【図12】図9の基準値作成部84の処理を説明するための図である。
【図13】本発明を適用した媒体を説明するための図である。
【符号の説明】
1 フレームメモリ, 2 クラスタップ生成回路, 3 予測タップ生成回路, 4 クラス分類回路, 5 係数RAM, 6 予測演算回路, 7 タップ決定回路, 11 読み出し部, 12 標準偏差算出部, 13 判定部,14 基準値設定部, 61 フレームメモリ, 62 ぼけ付加回路, 63 フレームメモリ, 64 クラスタップ生成回路, 65 予測タップ生成回路, 66 クラス分類回路, 67 加算回路, 68 予測タップメモリ, 69 加算回路, 70 教師データメモリ, 71 演算回路, 72 タップ決定回路, 81 読み出し部, 82 標準偏差算出部, 83 判定部, 84 基準値作成部, 101 コンピュータ, 102 ハードディスク, 103 半導体メモリ, 111 フロッピーディスク, 112 CD-ROM, 113 MOディスク, 114 DVD, 115 磁気ディスク, 116 半導体メモリ, 121 ダウンロードサイト, 122 衛星, 123コンピュータ, 131 ネットワーク
Claims (20)
- 入力データを処理して、その入力データに対する出力データを予測するデータ処理装置であって、
前記入力データから、予測値を求めようとする前記出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、前記距離を変えながらそれぞれ読み出し、前記複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、前記複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、前記所定の基準値に最も近い統計量が得られる前記距離を、前記入力データより複数のデータを抽出する抽出距離として決定する決定手段と、
予測値を求めようとする前記出力データである注目出力データについて、前記決定手段により決定された抽出距離に対応する複数のデータを、前記入力データから抽出する抽出手段と、
前記抽出手段において抽出された複数のデータの値のパターンに基づき、前記注目出力データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力するクラス分類手段と、
前記所定の基準値に最も近い統計量が得られる前記距離に対応する複数のデータとしての、前記入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数が、前記距離に対応する複数のデータに基づくクラスコード毎に予め学習されており、前記抽出手段において抽出された複数のデータと前記クラスコードに対応する予測係数との線形一次結合により、前記注目出力データの予測値を求める予測手段とを備え、
前記予測係数の学習のための教師となる教師データに対して、前記入力データに応じた特定の処理を施し、生徒となる生徒データを生成し、
前記入力データから、予測値を求めようとする前記出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、前記距離を変えながらそれぞれ読み出し、前記複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、前記複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、前記所定の基準値に最も近い統計量が得られる前記距離を、前記入力データより複数のデータを抽出する抽出距離として決定し、
予測値を求めようとする前記教師データである注目教師データについて、決定された前記抽出距離に対応する複数のデータを、前記生徒データから抽出し、
抽出された複数のデータの値のパターンに基づき、前記注目教師データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力し、
抽出された複数のデータを用いて、前記所定の基準値に最も近い統計量が得られる前記距離に対応する複数のデータとしての、前記入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数を、前記距離に対応する複数のデータに基づくクラスコード毎に求める
ことにより、前記予測係数は予め学習されている
ことを特徴とするデータ処理装置。 - 前記決定手段は、それぞれの前記距離に応じた前記複数のデータの値の標準偏差を前記統計量として求め、前記所定の基準値に最も近い標準偏差が得られる前記距離に基づいて、前記入力データより複数のデータを抽出する抽出距離を決定する
ことを特徴とする請求項1に記載のデータ処理装置。 - 前記決定手段は、前記出力データを、それぞれに複数の注目出力データを有するブロック単位とし、所定のブロック内にある前記複数の注目出力データそれぞれについて得られる前記複数のデータの前記標準偏差の平均を前記統計量とし、当該統計量と前記所定の基準値とを比較することにより、そのブロック内の注目出力データについて前記入力データより前記複数のデータを抽出する抽出距離を決定する
ことを特徴とする請求項2に記載のデータ処理装置。 - 前記所定の基準値は、前記複数種類の距離に対応する複数のデータのそれぞれについて、生徒データと教師データとの間で前記クラスコードに対応する所定の予測係数を学習し、学習された予測係数で前記教師データを予測した結果、最適に予測できる前記距離に対応する複数のデータより求められる統計量である
ことを特徴とする請求項1に記載のデータ処理装置。 - 前記所定の基準値を記憶している基準値記憶手段をさらに含む
ことを特徴とする請求項1に記載のデータ処理装置。 - 前記クラスコードごとに、前記予測係数を記憶している予測係数記憶手段をさらに含む
ことを特徴とする請求項1に記載のデータ処理装置。 - 前記入力データおよび出力データは、画像データである
ことを特徴とする請求項1に記載のデータ処理装置。 - 前記抽出手段は、前記入力データとしての画像データから、前記注目出力データとしての画素に対して、空間的または時間的に周辺にある画素を抽出する
ことを特徴とする請求項7に記載のデータ処理装置。 - 入力データを処理して、その入力データに対する出力データを予測するデータ処理装置のデータ処理方法であって、
前記データ処理装置は、
前記入力データから、予測値を求めようとする前記出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、前記距離を変えながらそれぞれ読み出し、前記複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、前記複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、前記所定の基準値に最も近い統計量が得られる前記距離を、前記入力データより複数のデータを抽出する抽出距離として決定する決定手段と、
予測値を求めようとする前記出力データである注目出力データについて、前記決定手段により決定された抽出距離に対応する複数のデータを、前記入力データから抽出する抽出手段と、
前記抽出手段において抽出された複数のデータの値のパターンに基づき、前記注目出力データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力するクラス分類手段と、
前記所定の基準値に最も近い統計量が得られる前記距離に対応する複数のデータとしての、前記入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数が、前記距離に対応する複数のデータに基づくクラスコード毎に予め学習されており、前記抽出手段において抽出された複数のデータと前記クラスコードに対応する予測係数との線形一次結合により、前記注目出力データの予測値を求める予測手段と
を備え、
前記決定手段は、前記入力データから、予測値を求めようとする前記出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、前記距離を変えながらそれぞれ読み出し、前記複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、前記複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、前記所定の基準値に最も近い統計量が得られる前記距離を、前記入力データより複数のデータを抽出する抽出距離として決定し、
前記抽出手段は、予測値を求めようとする前記出力データである注目出力データについて、前記決定手段により決定された抽出距離に対応する複数のデータを、前記入力データから抽出し、
前記クラス分類手段は、前記抽出手段において抽出された複数のデータの値のパターンに基づき、前記注目出力データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力し、
前記予測手段は、前記所定の基準値に最も近い統計量が得られる前記距離に対応する複数のデータとしての、前記入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数が、前記距離に対応する複数のデータに基づくクラスコード毎に予め学習されており、前記抽出手段において抽出された複数のデータと前記クラスコードに対応する予測係数との線形一次結合により、前記注目出力データの予測値を求める
ステップを含み、
前記予測係数の学習のための教師となる教師データに対して、前記入力データに応じた特定の処理を施し、生徒となる生徒データを生成し、
前記入力データから、予測値を求めようとする前記出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、前記距離を変えながらそれぞれ読み出し、前記複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、前記複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、前記所定の基準値に最も近い統計量が得られる前記距離を、前記入力データより複数のデータを抽出する抽出距離として決定し、
予測値を求めようとする前記教師データである注目教師データについて、決定された前記抽出距離に対応する複数のデータを、前記生徒データから抽出し、
抽出された複数のデータの値のパターンに基づき、前記注目教師データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力し、
抽出された複数のデータを用いて、前記所定の基準値に最も近い統計量が得られる前記距離に対応する複数のデータとしての、前記入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数を、前記距離に対応する複数のデータに基づくクラスコード毎に求める
ことにより、前記予測係数は予め学習されている
ことを特徴とするデータ処理方法。 - 入力データを処理して、その入力データに対する出力データを予測するデータ処理を行うためのプログラムを、コンピュータに実行させる媒体であって、
前記入力データから、予測値を求めようとする前記出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、前記距離を変えながらそれぞれ読み出し、前記複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、前記複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、前記所定の基準値に最も近い統計量が得られる前記距離を、前記入力データより複数のデータを抽出する抽出距離として決定する決定ステップと、
予測値を求めようとする前記出力データである注目出力データについて、前記決定手段により決定された抽出距離に対応する複数のデータを、前記入力データから抽出する抽出ステップと、
前記抽出ステップにおいて抽出された複数のデータの値のパターンに基づき、前記注目出力データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力するクラス分類ステップと、
前記所定の基準値に最も近い統計量が得られる前記距離に対応する複数のデータとしての、前記入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数が、前記距離に対応する複数のデータに基づくクラスコード毎に予め学習されており、前記抽出ステップにおいて抽出された複数のデータと前記クラスコードに対応する予測係数との線形一次結合により、前記注目出力データの予測値を求める予測ステップと
を含み、
前記予測係数の学習のための教師となる教師データに対して、前記入力データに応じた特定の処理を施し、生徒となる生徒データを生成し、
前記入力データから、予測値を求めようとする前記出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、前記距離を変えながらそれぞれ読み出し、前記複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、前記複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、前記所定の基準値に最も近い統計量が得られる前記距離を、前記入力データより複数のデータを抽出する抽出距離として決定し、
予測値を求めようとする前記教師データである注目教師データについて、決定された前記抽出距離に対応する複数のデータを、前記生徒データから抽出し、
抽出された複数のデータの値のパターンに基づき、前記注目教師データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力し、
抽出された複数のデータを用いて、前記所定の基準値に最も近い統計量が得られる前記距離に対応する複数のデータとしての、前記入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数を、前記距離に対応する複数のデータに基づくクラスコード毎に求める
ことにより、前記予測係数は予め学習されている
ことを特徴とするプログラムを、前記コンピュータに実行させる媒体。 - 入力データを処理し、その入力データに対する出力データを予測するのに用いる予測係数を学習するデータ処理装置であって、
前記予測係数の学習のための教師となる教師データに対して、前記入力データに応じた特定の処理を施し、生徒となる生徒データを生成する生成手段と、
前記入力データから、予測値を求めようとする前記出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、前記距離を変えながらそれぞれ読み出し、前記複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、前記複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、前記所定の基準値に最も近い統計量が得られる前記距離を、前記入力データより複数のデータを抽出する抽出距離として決定する決定手段と、
予測値を求めようとする前記教師データである注目教師データについて、前記決定手段により決定された抽出距離に対応する複数のデータを、前記生徒データから抽出する抽出手段と、
前記抽出手段において抽出された複数のデータの値のパターンに基づき、前記注目教師データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力するクラス分類手段と、
前記抽出手段において抽出された複数のデータを用いて、前記所定の基準値に最も近い統計量が得られる前記距離に対応する複数のデータとしての、前記入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数を、前記距離に対応する複数のデータに基づくクラスコード毎に求める演算手段と
を含むことを特徴とするデータ処理装置。 - 前記決定手段は、それぞれの前記距離に応じた前記複数のデータの値の標準偏差を前記統計量として求め、前記所定の基準値に最も近い標準偏差が得られる前記距離に基づいて、前記入力データより複数のデータを抽出する抽出距離を決定する
ことを特徴とする請求項11に記載のデータ処理装置。 - 前記決定手段は、前記出力データを、それぞれに複数の注目教師データを有するブロック単位とし、所定のブロック内にある前記複数の注目教師データそれぞれについて得られる前記複数のデータの前記標準偏差の平均を前記統計量とし、当該統計量と前記所定の基準値とを比較することにより、そのブロック内の注目教師データについて前記生徒データより前記複数のデータを抽出する抽出距離を決定する
ことを特徴とする請求項12に記載のデータ処理装置。 - 前記所定の基準値を求める基準値算出手段をさらに含む
ことを特徴とする請求項11に記載のデータ処理装置。 - 前記基準値算出手段は、前記複数種類の距離に対応する前記複数のデータに対応するクラスコードについて得られる前記予測係数で前記教師データを予測した結果、最適に予測できる前記距離に対応する複数のデータより求められる統計量を、前記所定の基準値として求める
ことを特徴とする請求項14に記載のデータ処理装置。 - 前記教師データおよび生徒データは、画像データである
ことを特徴とする請求項11記載のデータ処理装置。 - 前記抽出手段は、前記生徒データとしての画像データから、前記注目教師データとしての画素に対して、空間的または時間的に周辺にある画素を抽出する
ことを特徴とする請求項11に記載のデータ処理装置。 - 入力データを処理し、その入力データに対する出力データを予測するのに用いる予測係数を学習するデータ処理装置のデータ処理方法であって、
前記データ処理装置は、
前記予測係数の学習のための教師となる教師データに対して、前記入力データに応じた特定の処理を施し、生徒となる生徒データを生成する生成手段と、
前記入力データから、予測値を求めようとする前記出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、前記距離を変えながらそれぞれ読み出し、前記複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、前記複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、前記所定の基準値に最も近い統計量が得られる前記距離を、前記入力データより複数のデータを抽出する抽出距離として決定する決定手段と、
予測値を求めようとする前記教師データである注目教師データについて、前記決定手段により決定された抽出距離に対応する複数のデータを、前記生徒データから抽出する抽出手段と、
前記抽出手段において抽出された複数のデータの値のパターンに基づき、前記注目教師データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力するクラス分類手段と、
前記抽出手段において抽出された複数のデータを用いて、前記所定の基準値に最も近い統計量が得られる前記距離に対応する複数のデータとしての、前記入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数を、前記距離に対応する複数のデータに基づくクラスコード毎に求める演算手段と
を含み、
前記生成手段は、前記予測係数の学習のための教師となる教師データに対して、前記入力データに応じた特定の処理を施し、生徒となる生徒データを生成し、
前記決定手段は、前記入力データから、予測値を求めようとする前記出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、前記距離を変えながらそれぞれ読み出し、前記複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、前記複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、前記所定の基準値に最も近い統計量が得られる前記距離を、前記入力データより複数のデータを抽出する抽出距離として決定し、
前記抽出手段は、予測値を求めようとする前記教師データである注目教師データについて、前記決定手段により決定された抽出距離に対応する複数のデータを、前記生徒データから抽出し、
前記クラス分類手段は、前記抽出手段において抽出された複数のデータの値のパターンに基づき、前記注目教師データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力し、
前記演算手段は、前記抽出手段において抽出された複数のデータを用いて、前記所定の基準値に最も近い統計量が得られる前記距離に対応する複数のデータとしての、前記入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数を、前記距離に対応する複数のデータに基づくクラスコード毎に求める
ステップを含むことを特徴とするデータ処理方法。 - 入力データを処理し、その入力データに対する出力データを予測するのに用いる予測係数を学習するデータ処理を行うためのプログラムを、コンピュータに実行させる媒体であって、
前記予測係数の学習のための教師となる教師データに対して、前記入力データに応じた特定の処理を施し、生徒となる生徒データを生成する生成ステップと、
前記入力データから、予測値を求めようとする前記出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、前記距離を変えながらそれぞれ読み出し、前記複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、前記複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、前記所定の基準値に最も近い統計量が得られる前記距離を、前記入力データより複数のデータを抽出する抽出距離として決定する決定ステップと、
予測値を求めようとする前記教師データである注目教師データについて、前記決定ステップにより決定された抽出距離に対応する複数のデータを、前記生徒データから抽出する抽出ステップと、
前記抽出ステップにおいて抽出された複数のデータの値のパターンに基づき、前記注目教師データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力するクラス分類ステップと、
前記抽出ステップにおいて抽出された複数のデータを用いて、前記所定の基準値に最も近い統計量が得られる前記距離に対応する複数のデータとしての、前記入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数を、前記距離に対応する複数のデータに基づくクラスコード毎に求める演算ステップと
を含むことを特徴とするプログラムを、前記コンピュータに実行させる媒体。 - 入力データを処理して、その入力データに対する出力データを予測する第1の装置と、
前記出力データを予測するのに用いる予測係数を学習する第2の装置と
を備えるデータ処理装置であって、
前記第1の装置は、
前記入力データから、予測値を求めようとする前記出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、前記距離を変えながらそれぞれ読み出し、前記複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、前記複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、前記所定の基準値に最も近い統計量が得られる前記距離を、前記入力データより複数のデータを抽出する抽出距離として決定する第1の決定手段と、
予測値を求めようとする前記出力データである注目出力データについて、前記第1の決定手段により決定された抽出距離に対応する複数のデータを、前記入力データから抽出する第1の抽出手段と、
前記第1の抽出手段において抽出された複数のデータの値のパターンに基づき、前記注目出力データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力する第1のクラス分類手段と、
前記所定の基準値に最も近い統計量が得られる前記距離に対応する複数のデータとしての、前記入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数が、前記距離に対応する複数のデータに基づくクラスコード毎に予め学習されており、前記第1の抽出手段において抽出された第1の複数のデータと前記クラスコードに対応する予測係数との線形一次結合により、前記注目出力データの予測値を求める予測手段と
を備え、
前記第2の装置は、
前記予測係数の学習のための教師となる教師データに対して、前記入力データに応じた特定の処理を施し、生徒となる生徒データを生成する生成手段と、
前記入力データから、予測値を求めようとする前記出力データである注目出力データに対応する中心データと、当該中心データから空間方向または時間方向において予め設定される複数種類の距離のうちの一の距離に対応する複数の周辺データとを有する複数のデータを、前記距離を変えながらそれぞれ読み出し、前記複数種類の距離のそれぞれに対応する複数のデータの値の平均値に対するそれぞれの値のばらつき、又は、前記複数のデータの値同士の差分に基づく統計量と所定の基準値とを比較することにより、前記所定の基準値に最も近い統計量が得られる前記距離を、前記入力データより複数のデータを抽出する抽出距離として決定する第2の決定手段と、
予測値を求めようとする前記教師データである注目教師データについて、前記第2の決定手段により決定された抽出距離に対応する第2の複数のデータを、前記生徒データから抽出する第2の抽出手段と、
前記第2の抽出手段において抽出された複数のデータの値のパターンに基づき、前記注目教師データを、複数のクラスのうちのいずれかのクラスにクラス分けするクラス分類を行い、対応するクラスコードを出力する第2のクラス分類手段と、
前記第2の抽出手段において抽出された第2の複数のデータを用いて、前記所定の基準値に最も近い統計量が得られる前記距離に対応する複数のデータとしての、前記入力データに相当する生徒データとの線形一次結合により当該生徒データよりも高質な教師データを予測する予測係数を、前記距離に対応する複数のデータに基づくクラスコード毎に求める演算手段と
を備え、
前記第1の装置において前記注目出力データの予測値を求めるのに用いられる予測係数は、前記第2の装置により予め学習されている
ことを特徴とするデータ処理装置。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16052899A JP4135045B2 (ja) | 1999-06-08 | 1999-06-08 | データ処理装置およびデータ処理方法、並びに媒体 |
US09/587,865 US6678405B1 (en) | 1999-06-08 | 2000-06-06 | Data processing apparatus, data processing method, learning apparatus, learning method, and medium |
EP00304812A EP1061473A1 (en) | 1999-06-08 | 2000-06-07 | Method and apparatus for classification-adaptive data processing |
KR1020000031365A KR100746839B1 (ko) | 1999-06-08 | 2000-06-08 | 데이터 처리 장치, 데이터 처리 방법, 학습 장치, 학습방법, 및 매체 |
CNB001264370A CN1190963C (zh) | 1999-06-08 | 2000-06-08 | 数据处理装置和方法,学习装置和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16052899A JP4135045B2 (ja) | 1999-06-08 | 1999-06-08 | データ処理装置およびデータ処理方法、並びに媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000348019A JP2000348019A (ja) | 2000-12-15 |
JP4135045B2 true JP4135045B2 (ja) | 2008-08-20 |
Family
ID=15716925
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP16052899A Expired - Fee Related JP4135045B2 (ja) | 1999-06-08 | 1999-06-08 | データ処理装置およびデータ処理方法、並びに媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4135045B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4038812B2 (ja) | 2001-12-27 | 2008-01-30 | ソニー株式会社 | データ処理装置およびデータ処理方法、プログラムおよび記録媒体、並びにデータ処理システム |
JP4066146B2 (ja) | 2002-04-26 | 2008-03-26 | ソニー株式会社 | データ変換装置およびデータ変換方法、学習装置および学習方法、並びにプログラムおよび記録媒体 |
US7164807B2 (en) * | 2003-04-24 | 2007-01-16 | Eastman Kodak Company | Method and system for automatically reducing aliasing artifacts |
JP4872862B2 (ja) * | 2006-09-28 | 2012-02-08 | ソニー株式会社 | 画像データ演算装置および方法、プログラム、並びに記録媒体 |
JP4825748B2 (ja) * | 2007-07-13 | 2011-11-30 | 株式会社モルフォ | 画像データ処理方法および撮像装置 |
JP4882999B2 (ja) * | 2007-12-21 | 2012-02-22 | ソニー株式会社 | 画像処理装置、画像処理方法、プログラム、および学習装置 |
-
1999
- 1999-06-08 JP JP16052899A patent/JP4135045B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000348019A (ja) | 2000-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100746839B1 (ko) | 데이터 처리 장치, 데이터 처리 방법, 학습 장치, 학습방법, 및 매체 | |
JP4362895B2 (ja) | データ処理装置およびデータ処理方法、並びに記録媒体 | |
US20100202711A1 (en) | Image processing apparatus, image processing method, and program | |
EP1421554A2 (en) | Image enhancement and data loss recovery using wavelet transforms | |
US20120321214A1 (en) | Image processing apparatus and method, program, and recording medium | |
JPH0944657A (ja) | 画像処理方法および装置 | |
JP4517409B2 (ja) | データ処理装置およびデータ処理方法 | |
JP4611535B2 (ja) | 符号化された画像を評価するための処理、装置及び、使用 | |
JPH09212650A (ja) | 動きベクトル検出装置および検出方法 | |
JP4324825B2 (ja) | データ処理装置およびデータ処理方法、並びに媒体 | |
JP4135045B2 (ja) | データ処理装置およびデータ処理方法、並びに媒体 | |
JP2003526233A (ja) | 分類適応誤り回復方法及び装置 | |
JP3702464B2 (ja) | データ変換装置およびデータ変換方法、学習装置および学習方法、並びにプログラムおよび記録媒体 | |
JP4238516B2 (ja) | データ変換装置およびデータ変換方法、学習装置および学習方法、並びにプログラムおよび記録媒体 | |
KR100816593B1 (ko) | 화상 처리 장치, 화상 처리 방법, 및 기록 매체 | |
JP3849817B2 (ja) | 画像処理装置および画像処理方法 | |
JP4035895B2 (ja) | 画像変換装置および方法、並びに記録媒体 | |
JP2001222702A (ja) | 画像処理装置および画像処理方法、並びに記録媒体 | |
JP2002536935A (ja) | 複合分類に基づく適応分類タップ選択方法及び装置 | |
JP4442076B2 (ja) | データ変換装置およびデータ変換方法、学習装置および学習方法、並びにプログラムおよび記録媒体 | |
US20040234160A1 (en) | Data converting apparatus and data converting method, learning device and learning method, and recording medium | |
JP4096281B2 (ja) | 画像処理装置および画像処理方法、並びに媒体 | |
EP1583030A1 (en) | Image magnification device and image magnification method | |
JP4240674B2 (ja) | 動き検出装置および動き検出方法、並びに記録媒体 | |
JP2007251690A (ja) | 画像処理装置および方法、学習装置および方法、並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070413 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070424 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070625 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20071119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080118 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20080124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080414 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080508 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080521 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110613 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120613 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130613 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |