Nothing Special   »   [go: up one dir, main page]

JP4247680B2 - 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体 - Google Patents

符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP4247680B2
JP4247680B2 JP2004200255A JP2004200255A JP4247680B2 JP 4247680 B2 JP4247680 B2 JP 4247680B2 JP 2004200255 A JP2004200255 A JP 2004200255A JP 2004200255 A JP2004200255 A JP 2004200255A JP 4247680 B2 JP4247680 B2 JP 4247680B2
Authority
JP
Japan
Prior art keywords
rate control
prediction
variable
encoding
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004200255A
Other languages
English (en)
Other versions
JP2006025077A (ja
Inventor
数史 佐藤
イーウェン ズー
陽一 矢ケ崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2004200255A priority Critical patent/JP4247680B2/ja
Priority to US11/155,687 priority patent/US20060013299A1/en
Priority to CNB2005100833232A priority patent/CN100417229C/zh
Publication of JP2006025077A publication Critical patent/JP2006025077A/ja
Application granted granted Critical
Publication of JP4247680B2 publication Critical patent/JP4247680B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体に関し、例えば衛星放送、ケーブルテレビ、インターネット、携帯電話等による動画の伝送、光ディスク、光磁気ディスク、フラッシュメモリ等の記録媒体への動画の記録等に適用することができる。本発明は、符号化の処理に先行してイントラ予測及びインター予測に係る最適な予測モードを検出すると共に、この検出した最適な予測モードによる差分データの大きさを示す変数を検出し、この変数により各ピクチャの目標符号量を設定することにより、復号化装置と共に画像変換装置として機能するように符号化装置を構成するような場合に、全体構成を簡略化することができるようにする。
近年、放送局、一般家庭等に係る動画の伝送、記録においては、画像データの冗長性を有効に利用して効率良く画像データを伝送、蓄積する装置が普及しつつあり、このような装置は、例えばMPEG(Moving Picture Experts Group)等の方式に準拠して、離散コサイン変換等の直交変換と動き補償とにより画像データをデータ圧縮するようになされている。
ここでこのような方式の1つであるMPEG2は、汎用の画像符号化方式として定義された方式であり、飛び越し走査方式、順次走査方式の双方に対応できるように、また標準解像度画像、高精細画像の双方に対応できるように定義され、これらにより現在、プロフェッショナル用途及びコンシューマー用途の広範なアプリケーションに広く用いられるようになされている。具体的にMPEG2によれば、例えば720×480画素による標準解像度、飛び越し走査方式の画像データを4〜8〔Mbps〕のビットレートにデータ圧縮して、また1920×1088画素による高解像度、飛び越し走査方式の画像データを18〜22〔Mbps〕のビットレートにデータ圧縮して、高画質で高い圧縮率を確保することができるようになされている。
しかしながらMPEG2は、放送用に適合した高画質符号化方式であり、MPEG1より符号量の少ない高圧縮率の符号化方式には対応していない。これに対して近年の携帯端末の普及により、このようなMPEG1より符号量の少ない高圧縮率の符号化方式のニーズの高まりが予測される。このためMPEG4による符号化方式の規格が、ISO/IEC(International 0rganization for Standardization/International Electrotechnical Commission )14496−2により1998年12月に国際標準に承認された。
またこのような方式にあっては、当初はテレビ会議用の画像符号化を目的としたものであったH26L(ITU-T Q6/16 VCEG)の規格化が進み、MPEG2、MPEG4に比して演算量が増大するものの、MPEG2、MPEG4に比して高い符号化効率を確保できるようになされ、またMPEG4の活動の一環として、このH26Lをベースにして各種機能を取り入れ、さらに一段と高い符号化効率を確保する符号化方式の標準化が、Joint Model of Enhanced-Compression Video Codingとして進められ、これらの方式にあっては、2003年3月に、H264及びMPEG−4 Part10(AVC:Advanced Video Coding )との名称により国際標準に設定された。
ここで図3は、このAVCに基づく符号化装置を示すブロック図である。この符号化装置1は、複数のイントラ予測モードと複数のインター予測モードとから最適な予測モードを選択し、この選択した予測モードによる予測値を画像データから減算して差分データを生成し、この差分データを直交変換処理、量子化処理、可変長符号化処理することにより、この画像データをイントラ符号化、インター符号化により符号化処理する。
すなわちこの符号化装置1において、アナログディジタル変換装置(A/D)2は、ビデオ信号S1をアナログディジタル変換処理して画像データD1を出力する。画面並べ替えバッファ3は、このアナログディジタル変換装置2から出力される画像データD1を入力し、この符号化装置1の符号化処理に係るGOP(Group of Pictures )構造に応じて、この画像データD1のフレームを並べ替えて出力する。
減算器4は、この画面並べ替えバッファ3から出力される画像データD1を受け、イントラ符号化においては、イントラ予測装置5で生成される予測値との差分データD2を生成して出力するのに対し、インター符号化においては、動き予測・補償装置6で生成される予測値との差分データD2を生成して出力する。直交変換装置7は、減算器4の出力データD2を入力し、離散コサイン変換、カルーネン・レーベ変換等の直交変換処理を実行し、その処理結果による変換係数データD3を出力する。
量子化装置8は、レート制御装置9のレート制御による量子化スケールにより、この変換係数データD3を量子化して出力し、可逆符号化装置10は、この量子化装置8の出力データを可変長符号化、算術符号化等により可逆符号化処理して出力する。また可逆符号化装置10は、イントラ符号化に係るイントラ予測モードに関する情報、インター符号化に係る動きベクトルに関する情報等をイントラ予測装置5、動き予測・補償装置6から取得し、これらの情報を出力データD4のヘッダ情報に設定して出力する。
蓄積バッファ11は、この可逆符号化装置10の出力データD4を蓄積して続く伝送路の伝送速度により出力する。レート制御装置9は、この蓄積バッファ11の空き容量の監視により符号化処理による発生符号量を監視すると共に、この監視結果により量子化装置8における量子化スケールを切り換え、これによりこの符号化装置1による発生符号量を制御する。
逆量子化装置13は、量子化装置8の出力データを逆量子化処理し、これにより量子化装置8の入力データを再生する。逆直交変換装置14は、逆量子化装置13の出力データを逆直交変換処理し、これにより直交変換装置7の入力データを再生する。デブロックフィルタ15は、この逆直交変換装置14の出力データよりブロック歪を除去して出力する。フレームメモリ16は、このデブロックフィルタ15の出力データに、適宜、イントラ予測装置5又は動き予測・補償装置6により生成される予測値を加算して参照画像情報として記録する。
しかして動き予測・補償装置6は、インター符号化において、このフレームメモリ16に保持された参照画像情報による予測フレームより画像並べ替えバッファ3から出力される画像データの動きベクトルを検出し、またこの検出した動きベクトルによりフレームメモリ16に保持した参照画像情報を動き補償して予測画像情報を生成し、この予測画像情報による予測値を減算器4に出力する。
イントラ予測装置5は、イントラ符号化において、フレームメモリ16に蓄積された参照画像情報に基づいてイントラ予測モードを判定し、この判定結果により参照画像情報から予測画像情報の予測値を生成して減算器4に出力する。
これらによりこの符号化方式においては、インター符号化とイントラ符号化とでそれぞれインター予測に係る動き補償による差分データD2とイントラ予測による差分データD2とを生成し、これらの差分データD2を直交変換処理、量子化処理、可変長符号化処理して伝送するようになされている。
図4は、このようにして符号化処理されてなる符号化データD4を復号化処理する復号化装置を示すブロック図である。この復号化装置20において、蓄積バッファ21は、伝送路を介して入力される符号化データD4を一時蓄積して出力し、可逆復号化装置22は、この蓄積バッファ21の出力データを可変長復号化、算術復号化等により復号化処理し、符号化装置1における可逆符号化装置10の入力データを再生する。またこのときこの出力データがイントラ符号化されたものである場合、ヘッダに格納されたイントラ予測モードの情報を復号化してイントラ予測装置23に伝送するのに対し、この出力データがインター符号化されたものである場合、ヘッダに格納された動きベクトルに関する情報を復号化して動き予測・補償装置24へ転送する。
逆量子化装置25は、可逆復号化装置22の出力データを逆量子化処理し、これにより符号化装置1の量子化装置8に入力される変換係数データD3を再生する。逆直交変換装置26は、この逆量子化装置25から出力される変換係数データを受け、4次の逆直交変換処理を実行し、これにより符号化装置1の直交変換装置7に入力される差分データD2を再生する。
加算器27は、逆直交変換装置26から出力される差分データD2を受け、イントラ符号化において、イントラ予測装置23で生成される予測画像による予測値を加算して出力するのに対し、インター符号化において、動き予測・補償装置24から出力される予測画像による予測値を加算して出力する。これにより加算器27は、符号化装置1における減算器4の入力データを再生する。
デブロックフィルタ28は、この加算器27の出力データよりブロック歪を除去して出力し、画面並べ替えバッファ29は、このデブロックフィルタ28から出力される画像データのフレームをGOP構造に応じて並べ替えて出力する。ディジタルアナログ変換装置(D/A)30は、この画面並べ替えバッファ29の出力データをディジタルアナログ変換処理して出力する。
フレームメモリ31は、デブロックフィルタ28の出力データを参照画像情報として記録して保持する。動き予測・補償装置24は、インター符号化において、可逆復号化装置22から通知される動きベクトルの情報によりフレームメモリ31に保持された参照画像情報を動き補償して予測画像による予測値を生成し、この予測値を加算器27に出力する。またイントラ予測装置23は、イントラ符号化において、可逆復号化装置22から通知されるイントラ予測モードによりフレームメモリ31に保持された参照画像情報より予測画像による予測値を生成し、この予測値を加算器27に出力する。
しかしてこのような符号化処理に係るイントラ符号化においては、イントラ4×4予測モードとイントラ16×16予測モードとが用意されるようになされている。ここでAVCでは4×4画素のブロック単位で差分データD2を直交変換処理するようになされており、イントラ4×4予測モードは、この直交変換処理のブロック単位で、イントラ予測に係る予測値を生成するモードである。これに対して16×16予測モードは、この直交変換処理のブロックの複数個を単位にしてイントラ予測に係る予測値を生成するモードであり、この複数個が水平方向及び垂直方向にそれぞれ2個に設定されるようになされている。
このうちイントラ4×4予測モードでは、図5に示すように、予測値を生成する4×4画素a〜pによるブロックに対して、近傍13個の画素A〜Mの一部が予測値の生成に供する予測画素に設定され、この予測画素より予測値が生成される。なおここでこの13個の画素A〜Mは、このブロックの走査開始端側、垂直方向に隣接する4個の画素A〜Dと、この4個の画素A〜Dの走査終了端側の画素Dに続く4個の画素E〜Fと、このブロックの走査開始端側、水平方向に隣接する4個の画素I〜Lと、この水平方向に隣接する4個の画素I〜Lのうちの走査開始端側の画素Iの上方に位置する画素Mとにより形成される。
イントラ4×4予測モードでは、これら13個の画素A〜Mと、予測値の生成に供する4×4個の画素a〜pとの相対的な関係により、図6及び図7に示すように、モード0〜モード8の予測モードが定義されるようになされている。すなわち図6に示すように、例えばモード0及び1では、予測値の生成に使用する13個の画素A〜Mのうち、それぞれ垂直方向及び水平方向に隣接する画素A〜D及びI〜Lにより予測値を生成する。
より具体的には、図8(A)において矢印により示すように、モード0は、垂直方向に隣接する画素A〜Dより予測値を生成するモードであり、予測値を生成する4×4個の画素a〜pのうち、垂直方向に連続する1列目の画素a、e、i、mは、その上方向の画素Aが予測画素に設定される。また続く2列目の画素b、f、j、nは、その上方向の画素Bが予測画素に設定され、続く3列目及び4列目の画素c、g、k、o及びd、h、l、pは、それぞれ上方の画素C及びDが予測画素に設定され、これら予測画素A〜Dの画素値がそれぞれ対応する画素a〜pの予測値に設定される。なおモード0は、このモードにおける予測画素A〜Dが有意である場合にのみ適用される。
また図8(B)に同様に示すように、モード1は、水平方向に隣接する画素I〜Lより予測値を生成するモードであり、予測値を生成する4×4個の画素a〜pのうち、水平方向に連続する1ラインの画素a〜dは、その左方の画素Iが予測画素に設定される。また続く2ライン目の画素e〜hは、その左方の画素Jが予測画素に設定され、続く3ライン目及び4ライン目の画素i〜l及びm〜pは、それぞれ左方の画素K及びLが予測画素に設定され、これら予測画素I〜Lの画素値がそれぞれ対応する画素a〜pの予測値に設定される。なおモード1は、このモードにおける予測画素I〜Lが有意である場合にのみ適用される。
これに対してモード2は、図8(C)に示すように、13個の画素A〜Mのうち、このブロックの垂直方向及び水平方向に隣接する画素A〜D及びI〜Lより予測値を生成するモードであり、これらの画素A〜D及びI〜Lが全て有意な場合に、次式により各画素a〜pの予測値が生成される。
Figure 0004247680
なおモード2においては、画素A〜Dが全て有意でない場合、予測値は、(2)式により生成され、画素I〜Lが全て有意でない場合、予測値は、(3)式により生成され、画素A〜D及びI〜Lが全て有意でない場合、予測値は値128に設定される。
Figure 0004247680
Figure 0004247680
これに対してモード3は、図8(D)に示すように、13個の画素A〜Mのうち、水平方向に連続する画素A〜Hより予測値を生成するモードであり、これらの画素A〜Hのうちの画素A〜Dと画素I〜Mとが全て有意な場合にのみ適用されて、次式により各画素a〜pの予測値が生成される。
Figure 0004247680
これに対してモード4は、図8(E)に示すように、13個の画素A〜Mのうち、4×4個の画素a〜pによるブロックに隣接する画素A〜D、I〜Mとにより予測値を生成するモードであり、これらの画素A〜D、I〜Mが全て有意な場合にのみ適用されて、次式により各画素a〜pの予測値が生成される。
Figure 0004247680
これに対してモード5は、図8(F)に示すように、モード4と同様に、13個の画素A〜Mのうち、4×4個の画素a〜pによるブロックに隣接する画素A〜D、I〜Mとにより予測値を生成するモードであり、これらの画素A〜D、I〜Mが全て有意な場合にのみ適用されて、次式により各画素a〜pの予測値が生成される。
Figure 0004247680
これに対してモード6は、図8(G)に示すように、モード4及びモード5と同様に、13個の画素A〜Mのうち、4×4個の画素a〜pによるブロックに隣接する画素A〜D、I〜Mとにより予測値を生成するモードであり、これらの画素A〜D、I〜Mが全て有意な場合にのみ適用されて、次式により各画素a〜pの予測値が生成される。
Figure 0004247680
これに対してモード7は、図8(H)に示すように、13個の画素A〜Mのうち、4×4個の画素a〜pによるブロックの上方に隣接する4個の画素A〜Dと、この4個の画素A〜Dに続く4個の画素E〜Gとにより予測値を生成するモードであり、これらのうちの画素A〜D及び画素I〜Mが全て有意な場合にのみ適用されて、次式により各画素a〜pの予測値が生成される。
Figure 0004247680
これに対してモード8は、図8(I)に示すように、13個の画素A〜Mのうち、4×4個の画素によるブロックの左方に隣接する4個の画素I〜Lにより予測値を生成するモードであり、画素A〜D及び画素I〜Mが全て有意な場合にのみ適用されて、次式により各画素a〜pの予測値が生成される。
Figure 0004247680
これに対してイントラ16×16予測モードでは、図9に示すように、予測値を生成する16×16個の画素P(0,15)〜P(15,15)によるブロックBに対して、このブロックを構成する画素P(0,15)〜P(15,15)と、このブロックMBの上方及び左方に隣接する画素P(0,−1)〜P(15,−1)及びP(−1,0)〜P(−1,15)が予測画素に設定され、これらの予測画素により予測値が生成される。
イントラ16×16予測モードでは、図10に示すように、モード0〜モード3の予測モードが定義されるようになされ、このうちモード0は、マクロブロックMBの上方に隣接する画素P(0,−1)〜P(15,−1)(P(x,−1);x,y=−1〜15)が有意な場合にのみ適用されて、次式により示すように、ブロックBを構成する各画素P(0,15)〜P(15,15)の予測値が生成され、これにより図11(A)に示すように、ブロックBに隣接する各画素P(0,−1)〜P(15,−1)の画素値によりブロックBの垂直方向に連続する各画素の予測値が生成される。
Figure 0004247680
これに対してモード1は、ブロックBの左方に隣接する画素P(−1,0)〜P(−1,15)(P(−1,y);x,y=−1〜15)が有意な場合にのみ適用されて、次式により示すように、ブロックBを構成する各画素P(0,15)〜P(15,15)の予測値が生成され、これにより図11(B)に示すように、ブロックBに隣接する各画素P(−1,0)〜P(−1,15)の画素値によりブロックBの水平方向に連続する各画素の予測値が生成される。
Figure 0004247680
これに対してモード2は、ブロックBの上方及び左方に隣接する画素P(0,−1)〜P(15,−1)及びP(−1,0)〜P(−1,15)が全て有意な場合には、次式により予測値が求められ、これにより図11(C)に示すように、これらの画素P(0,−1)〜P(15,−1)及びP(−1,0)〜P(−1,15)による画素値の平均値によりブロックBを構成する各画素の予測値が生成される。
Figure 0004247680
なおモード2においては、これらブロックBの上方及び左方に隣接する画素P(0,−1)〜P(15,−1)及びP(−1,0)〜P(−1,15)のうち、上方に隣接する画素P(−1,0)〜P(−1,15)が有意でない場合、(13)式が適用されて有意な側の隣接画素の平均値により各画素の予測値が生成される。また左方に隣接する画素P(−1,0)〜P(−1,15)が有意でない場合、(14)式が適用され、この場合も有意な側の隣接画素の平均値によりブロックBを構成する各画素の予測値が生成される。またブロックBの上方及び左方に隣接する画素P(0,−1)〜P(15,−1)及びP(−1,0)〜P(−1,15)の全てが有意でない場合、値128に予測値が設定される。
Figure 0004247680
Figure 0004247680
これに対してモード3は、ブロックBの上方及び左方に隣接する画素P(0,−1)〜P(15,−1)及びP(−1,0)〜P(−1,15)が全て有意な場合にのみ適用され、次式により予測値が求められ、これにより図11(D)に示すように、斜め方向の演算処理により各画素の予測値が生成される。
Figure 0004247680
これらにより符号化装置1のイントラ予測装置5においては、Iピクチャ、Pピクチャ、Bピクチャにおいて、画面並べ替えバッファ3より出力される画像データD1を入力してフレームメモリ16に保持した参照画像情報によりいわゆるイントラ予測して最適な予測モードを選択する。またこの選択した予測モードによりイントラ符号化する場合、この選択した予測モードによる予測値を参照画像情報より生成して減算器4に出力し、またこの予測モードを可逆符号化装置10に通知して符号化データD4と共に伝送するようになされている。これに対して復号化装置20のイントラ予測装置23においては、この符号化データD4と共に伝送された予測モードの情報により予測値を計算して加算器27に出力するようになされている。
これに対してインター符号化においては、Multiple Reference Frames により、図12に示すように、処理対象のフレームOrgに対して、複数の参照フレームRefの何れかを選択して動き補償できるようになされ、これにより直前のフレームにおいて動き補償のブロックに対応する部位が隠れている場合、さらにはフラッシュにより直前のフレームで一時的に全体の画素値が変動した場合等にあっても、高い精度により動き補償してデータ圧縮効率を高めることができるようになされている。
また動き補償に係るブロックにおいては、図13(A1)に示すように、16画素×16画素によるブロックを基準にして動き補償するようになされているものの、variable MCBlock Sizeによりtree-structured motion compensation がサポートされており、これにより図13(A2)〜(A4)に示すように、16画素×16画素によるブロックを水平方向及び又は垂直方向に2分割して、16画素×8画素、8画素×16画素、8画素×8画素によるサブマクロブロックによりそれぞれ独立に動きベクトル、参照フレームを設定して動き補償できるようになされている。また8画素×8画素によるサブマクロブロックについては、図13(B1)〜(B4)に示すように、8画素×8画素、8画素×4画素、4画素×8画素、4画素×4画素によるブロックにさらに分割して、それぞれ独立に動きベクトル、参照フレームを設定して動き補償できるようになされている。なお以下において、この動き補償に係る最も大きさの大きな16画素×16画素による基本のブロックをマクロブロックと呼ぶ。
また動き補償においては、6タップのFIRフィルタを用いて1/4画素精度により動き補償できるようになされている。これにより図14において、符号Aにより1画素精度の画素値、符号b〜dにより1/2画素精度の画素値、符号e1〜e3により1/4画素精度の画素値を示すように、この場合、始めに、6タップのFIRフィルタの各タップ入力を値1、−5、20、20、−5、1により重み付けして次式の演算処理を実行することにより、水平方向又は垂直方向の連続する画素間に1/2画素精度による画素値b又はdを計算するようになされている。
Figure 0004247680
またこのようにして計算した1/2画素精度による画素値b又はdを用いて、6タップのFIRフィルタの各タップ入力を値1、−5、20、20、−5、1により重み付けして次式の演算処理を実行することにより、水平方向及び垂直方向の連続する画素間の1/2画素精度による画素値cを計算するようになされている。
Figure 0004247680
またこのようにして計算した1/2画素精度により画素値b〜dを用いて、直線補間による次式の演算処理を実行することにより、1/4画素精度による画素値e1〜e3を計算するようになされている。なおこのようにして(16)式及び(17)式の重み付け加算に係る正規化の処理においては、垂直方向及び水平方向の全ての補間処理が完了して実行される。
Figure 0004247680
これらにより符号化装置1における動き予測・補償装置6は、Pピクチャ及びBピクチャにおいて、フレームメモリ16に保持された参照画像情報による符号化処理のレベル及びプロファイルにより定義される複数の予測フレームを用いて、マクロブロック、各サブマックロブロックにより1/4画素精度による動きベクトルを検出し、最も予測誤差の少ない参照フレーム、ブロックによる動きベクトルを検出する。またこのようにして検出した参照フレーム、ブロックによりフレームメモリ16に保持した参照画像情報を1/4画素精度により動き補償していわゆるインター予測の処理を実行する。またこのインター予測によりインター符号化処理する場合、動き補償による画素値を予測値として減算器4に出力すると共に、これら参照フレーム、ブロック、動きベクトルを可逆符号化装置10に通知して符号化データD4と共に伝送するようになされている。これに対して復号化装置20の動き予測・補償装置24においては、この符号化データD4と共に伝送された参照フレーム、ブロック、動きベクトルによりフレームメモリ16に保持した参照画像情報を1/4画素精度により動き補償して予測値を生成し、この予測値を加算器27に出力するようになされている。しかして符号化装置1において、Pピクチャ及びBピクチャにおいては、例えばイントラ予測装置5によるイントラ予測結果、動き予測・補償装置6によるインター予測結果に基づいてイントラ符号化、インター符号化を選択するようになされ、イントラ予測装置5、動き予測・補償装置6は、この選択結果によりそれぞれイントラ予測、インター予測による予測値を出力するようになされている。
これに対してレート制御装置9によるレート制御においては、例えばTM5(MPEG−2 Test Model 5)による手法が適用される。ここでTM5によるレート制御は、図15に示す処理手順の実行により量子化装置8の量子化スケールを制御することにより実行される。すなわちレート制御装置9においては、処理を開始すると、ステップSP1からステップSP2に移り、1GOPを構成するピクチャにおいて、未だ符号化処理されていないピクチャへの目標符号量を計算し、これによりピクチャへのビット配分を行う。ここでTM5では、以下の2つの仮定に基づいて、各ピクチャへの符号量割当量を計算する。
ここで第1の仮定は、各ピクチャを符号化する際に用いる平均量子化スケールと、発生符号量との積は、画面が変化しない限り、ピクチャタイプ毎に一定値であるとの仮定である。これによりこのレート制御においては、各ピクチャを符号化処理した後、各ピクチャタイプ毎に、画面の複雑さを表すパラメータXi、Xp、Xb(global complexity measure ) を次式により更新する。これによりTM5によるレート制御においては、これらのパラメータXi、Xp、Xbにより、次のピクチャを符号化処理する際の量子化スケールコードと発生符号量との関係を推定するようになされている。
Figure 0004247680
ここで(19)式の各変数の添え字は、それぞれIピクチャ、Pピクチャ、Bピクチャを示す添え字である。またSi、Sp、Sbは、各ピクチャの符号化処理による発生符号ビット量であり、Qi、Qp、Qbは、各ピクチャの符号化時における平均量子化スケールコードである。またパラメータXi、Xp、Xbの初期値は、目標符号量bit rate〔bit/sec 〕を用いて、次式により与えられる。
Figure 0004247680
また第2の仮定は、Iピクチャの量子化スケールに対するPピクチャの量子化スケールコードの比率Kp、Iピクチャの量子化スケールに対するBピクチャの量子化スケールコードの比率Kbが、次式の関係に保持されている場合に、常に全体の画質が最良となるとの仮定である。
Figure 0004247680
すなわちこの仮定は、Iピクチャ、Pピクチャの量子化スケールに対してBピクチャの量子化スケールを常に1.4倍に設定することにより全体の画質が最良となることを意味するものであり、Iピクチャ、Pピクチャに比してBピクチャを粗く量子化してBピクチャに割り当てる符号量を節約し、その分、Iピクチャ、Pピクチャに多くの符号量を振り分けてIピクチャ、Pピクチャの画質を向上すると共に、Iピクチャ、Pピクチャを参照するBピクチャの画質も併せて向上し、これらにより全体的に見た画質を最良とするものである。
これらによりレート制御装置9は、次式の演算処理により、各ピクチャへの割当ビット量Ti、Tp、Tbを計算する。なおここでNp、Nbは、処理対象であるGOP内で、未だ符号化されていないPピクチャ、Bピクチャの枚数である。
Figure 0004247680
これによりレート制御装置9は、上述した2つの仮定に基づいて、各ピクチャの発生符号量を推定する。このとき符号割り当て対象とは異なるピクチャタイプのピクチャについては、画質最適化条件の下で、そのピクチャの発生する符号量が、割当対象ピクチャの発生符号量の何倍となるかを推定する。またこの推定により、GOP内の未符号化ピクチャが、符号割り当て対象のピクチャタイプにおける何枚分のピクチャに相当するかを推計し、この推計結果より各ピクチャへの割り当てビット量を計算する。なおこの場合に、レート制御装置9は、ヘッダ等の固定的に必要となる符号量を考慮して、その値に下限を設定して割り当てビット量を計算する。
続いてTM5のレート制御においては、ステップSP3に移り、仮想バッファ制御を用いたレート制御の処理を実行する。ここでこのレート制御においては、ステップSP2で求められた各ピクチャへの割当ビット量Ti、Tp、Tbと、実際の発生符号量とを一致させるため、各ピクチャタイプ毎に独立に3種類の仮想バッファを設定し、この仮想バッファの容量に基づいて量子化装置8の量子化スケールをマクロブロック単位のフィードバック制御により計算する。
ここで始めに、これら3種類の仮想バッファの占有率を、次式の演算式により計算する。なおここでd0 i、d0 p、d0 bは、各仮想バッファの初期占有量、Bjは、ピクチャ先頭からj番目のマクロブロックまでの発生ビット量、MB_cntは、1ピクチャ内でのマクロブロック数である。
Figure 0004247680
この(23)式により計算結果に基づいてj番目のマクロブロックに対する量子化スケールを、次式により計算する。
Figure 0004247680
なおここでrは、リアクションパラメータであり、フィードバックの応答を制御するパラメータである。TM5において、リアクションパラメータr及び初期値d0 i、d0 p、d0 bは、次式により与えられる。
Figure 0004247680
続いてTM5のレート制御においては、ステップSP4に移り、視覚特性を考慮してステップSP3で求めた量子化スケールを補正し、これにより視覚特性を考慮した最適量子化の処理を実行する。ここでこの最適量子化の処理においては、視覚的に劣化の目立ちやすい平坦部ではより細かく量子化するように、また劣化の比較的目立ちにくい絵柄の複雑な部分でより粗く量子化するように、各マクロブロックのアクティビティにより、ステップSP3で求めた量子化スケールを補正して実行される。
ここでアクティビティは、16×16画素の大きさによるマクロブロック毎に、このマクロブロックを構成する8×8画素による4個のブロックについて、フレームDCTモードにおける4個のブロックと、フィールドDCTモードにおける4個のブロックとによる計8個のブロックの画素値を用いて、次式により算出され、これにより該当マクロブロックにおける輝度レベルの平滑度を示すようになされている。
Figure 0004247680
なおここでPkは、原画の輝度信号ブロック内画素値である。この(26)式において最小値を取るのは、このマクロブロック内の一部だけでも平坦部分のある場合には量子化ステップを細かくして画質劣化を防止するためである。
レート制御装置9は、この計算式により求めたアクティビティを次式により正規化し、これにより0.5〜2の範囲で値を取る正規化アクティビティNactjを求める。なおここでavg_actは、直前に符号化したピクチャにおけるアクティビティactjの平均値である。
Figure 0004247680
またこの正規化アクティビティNactjにより次式の演算処理を実行し、ステップSP3で計算した量子化スケールQjを補正して量子化装置8を制御する。
Figure 0004247680
これらによりTM5によるレート制御においては、上述した2つの仮定に基づいて、各ピクチャ、さらには各マクロブロックに符号量を配分し、この配分した符号量を実際の発生符号量により逐次補正するフィードバック制御により量子化スケールを制御して逐次符号化処理するようになされている。
しかしながらこのようなフィードバック方式を前提としたレート制御は、過去に符号化されたフレームの特性を用いた符号量制御であることにより、画質の安定性の妨げとなる場合がある。また目標としているIピクチャ、Pピクチャ、Bピクチャに対する量子化スケールの比にあっても、固定値とされているが、この比にあっては、シーケンスによって最適値が異なることになる。
これによりフィードフォワード制御が可能であるとして、最適なレート制御について、以下に考察する。ここで歪みDと量子化スケールの間に、次式の関係が存在すると仮定する。
Figure 0004247680
ここでコスト関数Fを次式により定義する。なおここでNは、当該GOPに含まれるフレームの枚数であり、1≦i≦Nである。
Figure 0004247680
これにより未符号化フレーム全体への符号割り当て量をRとおいて、次式の拘束条件の元でこのコスト関数Fを解くと最適な割当符号量Riを算出することが可能となる。
Figure 0004247680
このような計算は、一般的に、ラグランジュの未定乗数法を用いて次式により求めることができる。
Figure 0004247680
但し、R=f(Q)、Q=g(R)において、コスト関数Fは、以下の条件のとき、最小値となる。
Figure 0004247680
これによりこれらの連立方程式を解くと、最適割当符号量Riを求めることができる。ここでMPEG2 TM5における複雑さ(Complexity)のパラメータXが次式により表されることにより、量子化スケールQと符号量Rとの間には、(35)式の関係式が成立する。
Figure 0004247680
Figure 0004247680
なおここでαは、量子化装置8における量子化の特性(Rate-Quantization 特性)を決めるパラメータである。ここでαが固定値であると仮定すると、(32)式は、次式により表すことができ、これを解いて(37)式を得ることができる。
Figure 0004247680
Figure 0004247680
ここでこの(37)式は、MPEG2 TM5による符号量割当を一般化した解であり、各ピクチャタイプにおける量子化の特性が一定であると仮定して、次式と置けば、(21)式の関係式を導き出すことができる。これによりTM5によるレート制御においては、比率Kp及びKbをそれぞれ値1.0及び値1.4による固定値に設定しているものの、フィードフォワード制御により複雑さ(Complexity)のパラメータXを前もって検出することにより、さらに一段と適切に、符号量を割り当てることが可能となる。
Figure 0004247680
このような符号化装置に関しては、例えば特開2004−56827号公報等に復号化処理等の利便を図る工夫が種々に提案されるようになされている。
ところでこのような符号化装置1においては、各種の記録装置に適用してベースバンドにより入力される画像データだけでなく、ネットワークメディア、パッケージメディアによる画像データを処理する場合も考えられる。しかしてこのようなネットワークメディア、パッケージメディアによる画像データにおいては、MPEG2等によりデータ圧縮されていることにより、このような画像データを処理する場合、符号化装置は、これらデータ圧縮された画像データを復号化する復号化装置と共に、データ圧縮フォーマットを変換する画像変換装置として機能することになる。
しかしてこのように復号化装置と共に画像変換装置として機能するように構成する場合にあっては、当然のことながら、全体構成を簡略化することが望まれる。
特開2004−56827号公報
本発明は以上の点を考慮してなされたもので、復号化装置と共に画像変換装置として機能するように符号化装置を構成するような場合に、全体構成を簡略化することができる符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体を提案しようとするものである。
かかる課題を解決するため請求項1の発明においては、画像データをイントラ符号化、インター符号化により符号化処理する符号化装置において、画像データを直交変換処理、量子化処理、可変長符号化処理して生成された符号化データを入力して、前記画像データを復号化する復号化手段と、複数のイントラ予測モードと複数のインター予測モードとから最適な予測モードを選択し、該選択した予測モードによる予測値を画像データから減算して差分データを生成し、前記差分データを直交変換処理、量子化処理、可変長符号化処理する符号化手段と、前記符号化手段による符号化処理に対して少なくとも1GOP分だけ先行して、符号化手段に入力される画像データを用いたイントラ予測により、レート制御用にイントラ予測における最適な予測モードを選択し、対応する前記差分データの大きさを示すレート制御用のイントラ予測の変数を検出するイントラ予測手段と、前記符号化手段による符号化処理に対して少なくとも1GOP分だけ先行して、前記符号化手段に入力される画像データを用いたインター予測により、レート制御用にインター予測における最適な予測モードを選択し、対応する前記差分データの大きさを示すレート制御用のインター予測の変数を検出するインター予測手段と、前記レート制御用のイントラ予測の変数と前記レート制御用のインター予測の変数との比較により、ピクチャ単位で、レート制御用にイントラ予測及びインター予測における最適な予測モードを検出し、対応する前記差分データの大きさを示す第1の変数を算出する第1の変数算出手段と、前記符号化データにおける前記量子化処理の量子化スケールと、前記符号化データにおけるデータ量との乗算値を前記復号化手段より出力される画像データのピクチャ単位で検出して第2の変数を算出する第2の変数算出手段と、レート制御の変数により1GOPに割り振るデータ量を各ピクチャに分配して各ピクチャの目標符号量を計算し、前記目標符号量により前記符号化手段による符号化処理をレート制御するレート制御手段とを備え、前記符号化手段は、前記復号化手段から出力される画像データ又は所定のアナログディジタル変換回路で生成された画像データを選択的に入力して処理し、前記レート制御手段は、前記符号化手段で処理する画像データに応じて前記レート制御の変数の生成方法を切り換え、前記所定のアナログディジタル変換回路で生成された画像データを前記符号化手段で処理する場合、前記第1の変数を前記レート制御の変数に適用してレート制御し、前記復号化手段から出力される画像データを前記符号化手段で処理する場合、前記第2の変数を前記レート制御の変数に適用してレート制御する。ここで前記複数のイントラ予測モード及び前記複数のインター予測モードが、大きさの異なる2種類以上のブロックにおいて、各ブロック単位でそれぞれ複数の手法により前記予測値を生成する予測モードであり、前記イントラ予測手段は、前記2種類以上のブロックのうちで最も大きさの小さいブロックに係る前記予測モードについて、レート制御用に最適な予測モードを選択して前記レート制御用のイントラ予測の変数を検出し、前記インター予測手段は、前記2種類以上のブロックのうちで最も大きさの大きいブロックに係る前記予測モードについて、レート制御用に最適な予測モードを選択して前記レート制御用のインター予測の変数を検出する
また請求項の発明においては、画像データをイントラ符号化、インター符号化により符号化処理する符号化方法において、画像データを直交変換処理、量子化処理、可変長符号化処理して生成された符号化データを入力して、前記画像データを復号化する復号化ステップと、複数のイントラ予測モードと複数のインター予測モードとから最適な予測モードを選択し、該選択した予測モードによる予測値を画像データから減算して差分データを生成し、前記差分データを直交変換処理、量子化処理、可変長符号化処理する符号化ステップと、前記符号化ステップによる符号化処理に対して少なくとも1GOP分だけ先行して前記符号化ステップで処理する画像データを用いたイントラ予測により、レート制御用にイントラ予測における最適な予測モードを選択し、対応する前記差分データの大きさを示すレート制御用のイントラ予測の変数を検出するイントラ予測のステップと、前記符号化ステップによる符号化処理に対して少なくとも1GOP分だけ先行して前記符号化ステップで処理する画像データを用いたインター予測により、レート制御用にインター予測における最適な予測モードを選択し、対応する前記差分データの大きさを示すレート制御用のインター予測の変数を検出するインター予測のステップと、前記レート制御用のイントラ予測の変数と前記レート制御用のインター予測の変数との比較により、ピクチャ単位で、レート制御用にイントラ予測及びインター予測における最適な予測モードを検出し、対応する前記差分データの大きさを示す第1の変数を算出する第1の変数算出ステップと、前記符号化データにおける前記量子化処理の量子化スケールと、前記符号化データにおけるデータ量との乗算値を前記復号化ステップより出力される画像データのピクチャ単位で検出して第2の変数を算出する第2の変数算出ステップと、レート制御の変数により1GOPに割り振るデータ量を各ピクチャに分配して各ピクチャの目標符号量を計算し、前記目標符号量により前記符号化ステップによる符号化処理をレート制御するレート制御のステップとを備え、前記符号化ステップは、前記復号化ステップから出力される画像データ又は所定のアナログディジタル変換回路で生成された画像データを選択的に入力して処理し、前記レート制御ステップは、前記符号化ステップで処理する画像データに応じて前記レート制御の変数の生成方法を切り換え、前記所定のアナログディジタル変換回路で生成された画像データを前記符号化ステップで処理する場合、前記第1の変数を前記レート制御の変数に適用してレート制御し、前記復号化ステップから出力される画像データを前記符号化ステップで処理する場合、前記第2の変数を前記レート制御の変数に適用してレート制御する。ここで前記複数のイントラ予測モード及び前記複数のインター予測モードが、大きさの異なる2種類以上のブロックにおいて、各ブロック単位でそれぞれ複数の手法により前記予測値を生成する予測モードであり、前記イントラ予測ステップは、前記2種類以上のブロックのうちで最も大きさの小さいブロックに係る前記予測モードについて、レート制御用に最適な予測モードを選択して前記レート制御用のイントラ予測の変数を検出し、前記インター予測ステップは、前記2種類以上のブロックのうちで最も大きさの大きいブロックに係る前記予測モードについて、レート制御用に最適な予測モードを選択して前記レート制御用のインター予測の変数を検出する。
また請求項の発明においては、演算処理手段により実行して符号化手段の動作を制御する符号化方法のプログラムに適用して、前記符号化手段は、複数のイントラ予測モードと複数のインター予測モードとから最適な予測モードを選択し、該選択した予測モードによる予測値を画像データから減算して差分データを生成し、前記差分データを直交変換処理、量子化処理、可変長符号化処理することにより、前記画像データをイントラ符号化、インター符号化により符号化処理し、前記符号化方法のプログラムは、画像データを直交変換処理、量子化処理、可変長符号化処理して生成された符号化データを入力して、前記画像データを復号化する復号化ステップと、前記符号化手段による符号化処理に対して少なくとも1GOP分だけ先行して前記符号化手段で処理する画像データを用いたイントラ予測により、レート制御用にイントラ予測における最適な予測モードを選択し、対応する前記差分データの大きさを示すレート制御用のイントラ予測の変数を検出するイントラ予測のステップと、前記符号化手段による符号化処理に対して少なくとも1GOP分だけ先行して前記符号化手段で処理する画像データを用いたインター予測により、レート制御用にインター予測における最適な予測モードを選択し、対応する前記差分データの大きさを示すレート制御用のインター予測の変数を検出するインター予測のステップと、前記レート制御用のイントラ予測の変数と前記レート制御用のインター予測の変数との比較により、ピクチャ単位で、レート制御用にイントラ予測及びインター予測における最適な予測モードを検出し、対応する前記差分データの大きさを示す第1の変数を算出する第1の変数算出ステップと、前記符号化データにおける前記量子化処理の量子化スケールと、前記符号化データにおけるデータ量との乗算値を前記復号化ステップより出力される画像データのピクチャ単位で検出して第2の変数を算出する第2の変数算出ステップと、レート制御の変数により1GOPに割り振るデータ量を各ピクチャに分配して各ピクチャの目標符号量を計算し、前記目標符号量により前記符号化手段による符号化処理をレート制御するレート制御のステップとを備え、前記符号化手段は、前記復号化ステップから出力される画像データ又は所定のアナログディジタル変換回路で生成された画像データを選択的に入力して処理し、前記レート制御ステップは、前記符号化手段で処理する画像データに応じて前記レート制御の変数の生成方法を切り換え、前記所定のアナログディジタル変換回路で生成された画像データを前記符号化手段で処理する場合、前記第1の変数を前記レート制御の変数に適用してレート制御し、前記復号化ステップから出力される画像データを前記符号化手段で処理する場合、前記第2の変数を前記レート制御の変数に適用してレート制御する。ここで前記複数のイントラ予測モード及び前記複数のインター予測モードが、大きさの異なる2種類以上のブロックにおいて、各ブロック単位でそれぞれ複数の手法により前記予測値を生成する予測モードであり、前記イントラ予測ステップは、前記2種類以上のブロックのうちで最も大きさの小さいブロックに係る前記予測モードについて、レート制御用に最適な予測モードを選択して前記レート制御用のイントラ予測の変数を検出し、前記インター予測ステップは、前記2種類以上のブロックのうちで最も大きさの大きいブロックに係る前記予測モードについて、レート制御用に最適な予測モードを選択して前記レート制御用のインター予測の変数を検出する。
また請求項の発明においては、演算処理手段により実行して符号化手段の動作を制御する符号化方法のプログラムを記録した記録媒体に適用して、前記符号化手段は、複数のイントラ予測モードと複数のインター予測モードとから最適な予測モードを選択し、該選択した予測モードによる予測値を画像データから減算して差分データを生成し、前記差分データを直交変換処理、量子化処理、可変長符号化処理することにより、前記画像データをイントラ符号化、インター符号化により符号化処理し、前記符号化方法のプログラムは、画像データを直交変換処理、量子化処理、可変長符号化処理して生成された符号化データを入力して、前記画像データを復号化する復号化ステップと、前記符号化手段による符号化処理に対して少なくとも1GOP分だけ先行して前記符号化手段で処理する画像データを用いたイントラ予測により、レート制御用にイントラ予測における最適な予測モードを選択し、対応する前記差分データの大きさを示すレート制御用のイントラ予測の変数を検出するイントラ予測のステップと、前記符号化手段による符号化処理に対して少なくとも1GOP分だけ先行して前記符号化手段で処理する画像データを用いたインター予測により、レート制御用にインター予測における最適な予測モードを選択し、対応する前記差分データの大きさを示すレート制御用のインター予測の変数を検出するインター予測のステップと、前記レート制御用のイントラ予測の変数と前記レート制御用のインター予測の変数との比較により、ピクチャ単位で、レート制御用にイントラ予測及びインター予測における最適な予測モードを検出し、対応する前記差分データの大きさを示す第1の変数を算出する第1の変数算出ステップと、前記符号化データにおける前記量子化処理の量子化スケールと、前記符号化データにおけるデータ量との乗算値を前記復号化ステップより出力される画像データのピクチャ単位で検出して第2の変数を算出する第2の変数算出ステップと、レート制御の変数により1GOPに割り振るデータ量を各ピクチャに分配して各ピクチャの目標符号量を計算し、前記目標符号量により前記符号化手段による符号化処理をレート制御するレート制御のステップとを備え、前記符号化手段は、前記復号化ステップから出力される画像データ又は所定のアナログディジタル変換回路で生成された画像データを選択的に入力して処理し、前記レート制御ステップは、前記符号化手段で処理する画像データに応じて前記レート制御の変数の生成方法を切り換え、前記所定のアナログディジタル変換回路で生成された画像データを前記符号化手段で処理する場合、前記第1の変数を前記レート制御の変数に適用してレート制御し、前記復号化ステップから出力される画像データを前記符号化手段で処理する場合、前記第2の変数を前記レート制御の変数に適用してレート制御する。ここで前記複数のイントラ予測モード及び前記複数のインター予測モードが、大きさの異なる2種類以上のブロックにおいて、各ブロック単位でそれぞれ複数の手法により前記予測値を生成する予測モードであり、前記イントラ予測ステップは、前記2種類以上のブロックのうちで最も大きさの小さいブロックに係る前記予測モードについて、レート制御用に最適な予測モードを選択して前記レート制御用のイントラ予測の変数を検出し、前記インター予測ステップは、前記2種類以上のブロックのうちで最も大きさの大きいブロックに係る前記予測モードについて、レート制御用に最適な予測モードを選択して前記レート制御用のインター予測の変数を検出する。

請求項1、請求項11、請求項12、又は請求項13の構成によれば、復号化装置と共に画像変換装置として機能するように符号化装置を構成する場合には、差分データの大きさを示す第1の変数に代えて、処理対象の符号化データより得られる各ピクチャの量子化スケールと符号量との乗算値による第2の変数を使用して、復号化処理で検出される各種の情報を有効に利用してレート制御することができ、構成を簡略化して画像変換装置としての機能を確保することができる。
本発明によれば、復号化装置と共に画像変換装置として機能するように符号化装置を構成する場合に、全体構成を簡略化することができる。
以下、適宜図面を参照しながら本発明の実施例を詳述する。
(1)実施例の構成
図1は、本発明の実施例に係る符号化装置を示すブロック図である。この符号化装置41においては、例えばDVDプレイヤー等より再生されるMPEG2によるデータ圧縮された符号化データDMPEG、テレビジョンチュナーから出力されるアナログ信号によるビデオ信号S1を光ディスク等の記録媒体に記録する記録再生装置に適用され、これら符号化データDMPEG、ビデオ信号S1をAVCによりデータ圧縮して符号化データD4を出力する。
この符号化装置41において、A/D変換装置(A/D)42は、ビデオ信号S1をアナログディジタル変換処理し、画像データD11を出力する。
復号化装置43は、MPEG2による符号化データDMPEGを入力し、この符号化データDMPEGを復号化処理してベースバンドによる画像データD12を出力する。この処理において、復号化装置43は、この符号化データDMPEGの各ヘッダに設定されてなる制御コードにより検出される量子化スケールq、発生符号量bをComplexity算出装置44に通知する。
Complexity算出装置44は、この復号化装置43からの通知により、符号化データDMPEGにおける各フレームの平均量子化スケールQを計算し、また各フレームの発生符号量Bを計算する。またこれら平均量子化スケールQ、発生符号量Bを用いて次式の演算処理を実行し、これにより符号化データDMPEGを復号化処理して得られる画像データD12について、AVCによる符号化処理の困難度を示す複雑さ(Complexity)のパラメータXを計算し、この複雑さ(Complexity)のパラメータXを符号化部45に通知する。
Figure 0004247680
ビデオメモリ46は、図示しないコントローラの制御によりA/D変換装置42から出力される画像データD11、又は復号化装置43から出力される画像データD12を選択的に入力して一定期間保持し、保持した画像データを符号化部45に出力する。この処理において、ビデオメモリ46は、この復号化装置43への画像データ出力より少なくとも1GOP相当の期間だけ先行して、保持した画像データをイントラ予測装置47、インター予測装置48に出力し、これにより復号化装置43における符号化処理に先立って、イントラ予測装置47、インター予測装置48により1GOP分の画像データを処理できるようにする。なおここでこのビデオメモリ46に入力して符号化部45に出力する画像データが復号化装置43から出力される画像データD12の場合、この先行した出力に係る1GOPの期間にあっては、画像データD12に係る符号化データDMPEGの1GOPの期間に設定される。
イントラ予測装置47は、このビデオメモリ46から入力される画像データをイントラ予測する。ここで本来のイントラ予測においては、復号化処理された参照画像情報を基準にして実行されるが、イントラ予測装置47は、復号化処理された参照画像情報に代えて、原画像の画像情報を用いてイントラ予測の処理を実行する。また本来のイントラ予測においては、イントラ4×4予測モードとイントラ16×16予測モードとで最適な予測モードを選択するようになされているが、このイントラ予測装置47においては、イントラ4×4予測モードのみにより最適な予測モードを選択する。
すなわちここで順次入力される画像データにおける4×4画素によるブロックについて、このブロックを構成する原画像による画像データの画素値を次式により表す。
Figure 0004247680
イントラ予測装置47は、復号化処理された画像データに代えて、このブロックの周辺画素を用いた図8(A)〜(I)について説明した演算処理により、次式により表される予測値を計算する。但し、Mode=0,……8である。
Figure 0004247680
さらにこれら原画像による画像データの画素値と予測値により次式の演算処理を実行し、これにより各モード毎に、イントラ符号化時、各ブロックで発生する差分データD2(図3参照)の絶対値和SAD(mode)を計算する。イントラ予測装置47は、これら各モード毎の絶対値和SAD(mode)より最小値を計算し、この最小値に係るモードの検出によりイントラ4×4予測モードにおける最適モードを検出する。なおこれらの演算処理において、いわゆる碁の目サンプリングの手法を適用して、例えば奇数ライン及び偶数ラインでそれぞれ奇数番目及び偶数番目のサンプリング点についてのみ演算処理し、その分、演算量を削減するようにしてもよい。
Figure 0004247680
イントラ予測装置47は、16×16画素のブロックによりマクロブロックを構成する4×4画素のブロックの全てについて、この演算処理を繰り返してそれぞれ最適モードを検出し、これらの最適モードに係る(41)式の演算結果SAD(mode)(SAD(Block, Best Mode(Block ))を用いて次式の演算処理を実行し、最適モードに係る差分データD2の絶対値和SAD(mode)を加算する。これによりイントラ予測装置47は、4×4予測モードより計算した残差の大きさを示す変数を集計して16×16画素のマクロブロックにおける残差の大きさを示す変数IntraSADを生成し、この変数IntraSADをDifficulty算出装置49に出力する。
Figure 0004247680
これに対してインター予測装置48は、ビデオメモリ46から入力される画像データをインター予測する。ここで本来、インター予測においては、復号化処理された参照画像情報を基準にして実行されるが、インター予測装置48は、復号化処理された参照画像情報に代えて、原画像の画像情報を用いてインター予測の処理を実行する。またサブマクロブロックに係る動きベクトル検出、動き補償については処理を省略し、これにより16×16画素によるマクロブロックについてのみ、参照フレーム、動きベクトルを検出してインター予測の処理を実行する。また1画素精度により動きを検出する。
すなわち順次入力される画像データにおける16×16画素によるブロックについて、インター予測装置48は、次式の演算処理を各参照フレーム毎に実行する。但し、参照フレームのフレーム番号Refは、0≦Ref≦N−1である。
Figure 0004247680
インター予測装置48は、この演算結果より参照フレーム毎に最小値を検出し、この最小値により各参照フレームに係る16×16動きベクトルmv16×16(Ref)を検出する。なおこれらの演算処理においては、階層動き探索により各参照フレームに対して16×16動きベクトルを検出するようにしてもよく、碁の目サンプリングにより処理して演算量を削減するようにしてもよい。因みに、階層動き探索による動きベクトルの検出においては、例えば4画素ピッチにより動きベクトルを検出し、この検出した動きベクトルにより動きベクトル検出範囲を狭い範囲に設定し直して動きベクトルを検出し直し、これらの処理を順次繰り返すことにより実行される。なおここで16×16動きベクトルmv16×16は、水平方向及び垂直方向に±8画素の動きベクトル探索範囲で検出される1画素精度による動きベクトルである。
またこのような各参照フレームに係る16×16動きベクトルmv16×16(Ref)による(43)式の演算結果SAD(mv16x16(Ref))により次式の演算処理を実行することにより、最適な参照フレーム、この最適な参照フレームに係る動きベクトルによりイントラ符号化処理した場合の残差の大きさを示す変数InterSADを計算し、この変数InterSADをDifficulty算出装置49に出力する。
Figure 0004247680
Difficulty算出装置49は、イントラ予測装置47、インター予測装置48から通知される変数IntraSAD、InterSADにより次式の演算処理を実行し、これにより値の小さい側の変数を選択する。しかしてこの選択された変数の側が、この場合、最適な符号化方式である。なおDifficulty算出装置49は、符号化部45の符号化処理に係るGOP構造により、予測対象のピクチャがPピクチャ、Bピクチャの場合、次式の演算処理を実行し、予測対象のピクチャがIピクチャの場合、次式の演算処理を中止してイントラ予測装置47から出力される変数IntraSADを変数BD(m)に割り当てる。
Figure 0004247680
Difficulty算出装置49は、マクロブロック毎に変数BD(m)を検出して、さらに次式の演算処理を実行することにより、変数BD(m)をピクチャ毎に集計する。なおここでΩは、1つのピクチャに含まれるマクロブロック全体の集合である。
Figure 0004247680
これによりDifficulty算出装置49は、ビデオメモリ46から出力される画像データD1について、AVCによる符号化処理の困難度を示す困難度(Difficulty)のパラメータXを計算し、この困難度(Difficulty)のパラメータXを符号化部45に通知する。しかしてComplexity算出装置44で計算される複雑さ(Complexity)のパラメータXにあっては、各フレームの平均量子化スケールQと発生符号量Bとの乗算値により形成され、いわば符号化データD4を生成する符号化処理で実際に検出される符号化処理の困難度を示す情報であるのに対し、このDifficulty算出装置49により複雑さ(Complexity)のパラメータXにあっては、AVCにより符号化する際に発生する差分データの絶対値和であり、AVCにより符号化する際に予測される符号化処理の困難度を示す情報であると言える。
符号化部45は、これらComplexity算出装置44、Difficulty算出装置49から出力されるパラメータXによりレート制御装置45Aでレート制御の処理を実行して、ビデオメモリ46から出力される画像データD1をAVCにより符号化処理して出力する。
ここで符号化部45は、アナログディジタル変換装置2が省略されて、ビデオメモリ46から出力される画像データD1が並べ替えバッファ3に直接入力される点、レート制御装置9に代えてレート制御装置45Aが適用される点、順次入力される画像データD1が符号化データDMPEGによるものの場合、この符号化データDMPEGにおけるI、P、Bピクチャの設定に対応してI、P、Bピクチャを設定して画像データD1を符号化処理する点を除いて、図3について上述した符号化装置1と同一に構成される。これにより符号化部45は、順次入力される画像データD1をAVCによりインター符号化、イントラ符号化して符号化データD4を出力するようになされている。
レート制御装置45Aは、符号化対象の画像データD1がビデオ信号S1によるものの場合、Difficulty算出装置49から出力されるパラメータXを用いて、また符号化対象の画像データD1が符号化データDMPEGによるものの場合、Complexity算出装置44から出力されるパラメータXを用いて、次式の演算処理を実行することにより、各ピクチャへの符号割り当て量Riを計算する。なおここでRは、未符号化フレーム(0≦i≦N−1)全体への符号割り当て量である。
Figure 0004247680
しかしてレート制御装置45Aは、この符号割り当て量Riに係る初期値を各GOPの先頭で計算し、1フレーム符号化が終了する毎に、蓄積バッファ11のデータ量より実際の発生符号量を検出して未符号化フレーム全体への符号割り当て量Rを補正し、続くフレームへの符号割り当て量Riを計算し、これらの処理を各GOPで繰り返す。また各フレーム内においては、各フレームへの符号割り当て量より検出される各マクロブロックへの符号割り当て量を、実際に発生した符号量により逐次補正し、これらにより検出される符号割り当て量により量子化装置8の量子化スケールを設定する。またこれらの処理において、アクティビティにより量子化装置8の量子化スケールを補正する。
図2は、このようなレート制御装置45Aのレート制御に係る処理手順をComplexity算出装置44、Difficulty算出装置49の関連する処理と共に示すフローチャートである。すなわちレート制御装置45Aは、この処理手順を開始すると、ステップSP11からステップSP12に移り、処理対象の画像データD1がアナログ信号によるビデオ信号S1によるものか否か判断する。ここで肯定結果が得られると、レート制御装置45Aは、ステップSP13に移り、Difficulty算出装置49からパラメータXを取得する。
しかしてこのステップSP13においては、ステップSP13−1において、Difficulty算出装置49でパラメータXが値0に初期化された後、ステップSP13−2及び13−3において、それぞれイントラ予測装置47、インター予測装置48で変数IntraSAD、InterSADが計算され、続くステップSP13−4において、Difficulty算出装置49でこれら変数IntraSAD、InterSADが比較される。
ここでイントラ予測装置47による変数IntraSADの値が小さい場合、ステップSP13−5において、このイントラ予測装置47による変数IntraSADが選択されるのに対し、インター予測装置48による変数InterSADの値が小さい場合、ステップSP13−6において、このインター予測装置48による変数InterSADが選択される。これにより1つのマクロブロックについて、変数SADがDifficulty算出装置49で検出され、この処理を1フレーム分、繰り返して、ステップSP13−7において累積加算することにより、GOPを構成する1フレームについてパラメータXが検出される。またこのパラメータXの検出が1GOP分、繰り返される。
これにより1GOP分のパラメータXをDifficulty算出装置49から取得すると、レート制御装置45Aは、ステップSP13からステップSP14に移り、(48)式の演算処理により1つのピクチャへの符号割り当て量を計算する。また続くステップSP15において、図15のステップSP3について上述したと同様にして量子化装置8の量子化スケールを決定する。また続くステップSP16において、図15のステップSP4について上述したと同様にして、アクティビティにより量子化装置8の量子化スケールを補正し、ステップSP17に移ってこの処理手順を終了する。しかしてレート制御装置45Aは、この処理手順をGOP単位で繰り返してレート制御の処理を実行する。
これに対してステップSP12で否定結果が得られると、この場合、レート制御装置45Aは、ステップSP12からステップSP18に移り、Complexity算出装置44から1GOP分のパラメータXを取得し、続くステップSP14において、このComplexity算出装置44から取得したパラメータXにより符号割り当て量を計算してレート制御の処理を実行する。しかしてこのステップSP18においては、Complexity算出装置44において、ピクチャ単位で変数Xの計算を繰り返すようになされている。
(2)実施例の動作
以上の構成において、この符号化装置41(図1)においては、アナログ信号によるビデオ信号S1を符号化処理する場合、このビデオ信号S1がアナログディジタル変換装置42により画像データD1に変換された後、ビデオメモリ46を介して符号化部45に入力される。画像データD1は(図3参照)、この符号化部45において、画面並べ替えバッファ3により符号化処理に係るGOP構造によりフレームの順序が並べ替えられた後、イントラ予測装置5、動き予測・補償装置6に入力され、ここで各ピクチャに応じて、複数のイントラ予測モードと複数のインター予測モードとから最適な予測モードが選択され、この選択された予測モードによる予測値が減算器4で画像データD1から減算されて差分データD2が生成される。画像データD1は、これにより連続するフレーム間、水平方向、垂直方向の相関を有効に利用してデータ量が低減され、このデータ量が低減されてなる差分データD2が直交変換処理、量子化処理、可変長符号化処理されてさらにデータ量が低減されて符号化データD4が生成される。これによりビデオ信号S1においては、イントラ符号化、インター符号化により符号化処理されて記録媒体に記録される。
これら一連の処理において、画像データD1は、このような符号化部45における処理に対して、少なくとも1GOP分だけ先行してイントラ予測装置47、インター予測装置48に入力され(図1)、ここでそれぞれイントラ予測、インター予測に係る最適な予測モードが選択され、この最適な予測モードで発生する差分データD2の大きさを示す変数IntraSAD、InterSADが差分データD2の絶対値和により計算される。またこれらの変数IntraSAD、InterSADのDifficulty算出装置49における比較により、これらイントラ予測とインター予測とによる最適な予測モードが検出され、この最適な予測モードにおいて発生する差分データD2の大きさを示す変数BD(m)が検出される。
画像データD1は、この変数BD(m)がピクチャ単位により計算されて変数Xが生成され、レート制御装置45Aにおいて、この変数Xにより1GOPに割り振るデータ量が各ピクチャに分配されて各ピクチャの目標符号量が計算され、この目標符号量によりレート制御の処理が実行される。
これにより画像データD1は、1GOPだけ先行して検出される変数Xによるフィードフォワード制御によりレート制御されて符号化処理され、その分、各ピクチャに適切に符号量を配分して符号化処理することができ、高い画質により符号化処理することができる。
またこのように差分データD2の大きさを示すピクチャ単位の変数Xにより1GOPに割り振るデータ量を分配して各ピクチャの目標符号量を計算し、この目標符号量によりレート制御の処理を実行することにより、復号化手段と一体化して、同様の符号化方法により符号化処理された符号化データのフォーマットを変換する場合にあっても、この符号化データの情報を有効に利用してレート制御することができ、その分、全体構成を簡略化することができる。
すなわち符号化装置41において、MPEG2による符号化データDMPEGをAVCによる符号化データD4にフォーマット変換する場合、MPEG2による符号化データDMPEGは、復号化装置43により復号化処理されて画像データD12に変換された後、この画像データD12が符号化部45に入力されてAVCによる符号化データD4に符号化処理される。
この一連の処理において、符号化データDMPEGは、量子化スケールq、データ量bが各マクロブロック毎に検出され、この検出結果がComplexity算出装置44で集計され、フレーム単位で、平均量子化スケールQとデータ量Bとの乗算値Xが検出される。ここでこの乗算値Xにおいては、符号化処理に係る複雑さを示し、これにより符号化データDMPEGによる画像データD12を符号化処理する場合、符号化装置41では、Difficulty算出装置49から出力される変数Xに代えて、このComplexity算出装置44から出力される変数Xが使用されて、1GOPに割り振るデータ量が各ピクチャに分配されて各ピクチャの目標符号量が計算され、この目標符号量によりレート制御の処理が実行される。
これにより符号化データDMPEGにおいて、符号化装置41では、復号化処理で検出される各種の情報を有効に利用してレート制御することができ、これにより構成を簡略化して画像変換装置としての機能を確保することができる。
またこの場合も、結局、過去のMPEG2による符号化結果を利用してレート制御していることにより、フィードフォワード制御によるレート制御により画像データD12を符号化処理することができ、その分、画像データD12をイントラ予測、インター予測してフィードバック制御によりレート制御する場合に比して、各ピクチャに適切に符号量を配分して符号化処理することができ、高い画質により符号化処理することができる。
しかしてこのようにしてイントラ予測装置47、インター予測装置48を用いて変数Xを検出するようにして、符号化装置41では、これらイントラ予測装置47、インター予測装置48におけるイントラ予測、インター予測が、符号化部45におけるイントラ予測、インター予測に比して格段的に簡易な構成により実行され、これによっても全体として簡易な構成により画像データD1を符号化処理できるようになされている。
すなわち符号化部45のイントラ予測に係るイントラ予測モードが、大きさの異なる2種類以上のブロックにおいて、各ブロック単位でそれぞれ複数の手法により差分データD2の生成に供する予測値を生成する予測モードであるのに対し、イントラ予測装置47においては、これら2種類以上のブロックのうちで最も大きさの小さいブロックに係る予測モードについて、最適な予測モードを選択してイントラ予測の変数IntraSADを検出することにより、簡易な処理により実用上十分な精度により最適な予測モードを検出してイントラ予測の変数IntraSADを検出することができるようになされている。
具体的に、符号化装置41ではこの2種類以上のブロックが、4画素×4画素及び16画素×16画素のブロックであることにより、イントラ予測装置47においては、4画素×4画素のブロックによる4×4予測モードについてのみ、画像データを処理し、これにより処理を簡略化することができるようになされている。
また符号化部45のイントラ予測に係る処理が、出力データを復号化した画像データを基準にして、最適な予測モードを選択する処理であるのに対し、イントラ予測装置47においては、ビデオメモリ46から1GOP分だけ先行して出力される、いわゆる原画像に係る画像データD1を基準にして最適な予測モードを選択することにより、フィードフォワード制御によりレート制御するように構成して、復号化手段、この復号化手段により復号化結果を保持するメモリ等の構成を省略し得、実用上十分な精度を確保して全体構成を簡略化することができる。
また符号化部45のインター予測に係るインター予測モードにおいても、大きさの異なる2種類以上のブロックにおいて、各ブロック単位でそれぞれ複数の手法により差分データD2の生成に供する予測値を生成する予測モードであるのに対し、インター予測装置48においては、これら2種類以上のブロックのうちで最も大きさの大きいブロックに係る予測モードについて、最適な予測モードを選択してインター予測の変数InterSADを検出し、これによっても簡易な処理により実用上十分な精度により最適な予測モードを検出してインター予測の変数InterSADを検出することができるようになされている。
具体的に、符号化装置41ではこの2種類以上のブロックが、4画素×4画素、4画素×8画素、8画素×4画素、8画素×8画素、8画素×16画素及び16画素×8画素によるサブマクロブロックと、16画素×16画素のブロックであるマクロブロックであることにより、インター予測装置48においては、16画素×16画素のマクロブロックについてのみ、画像データを処理し、これにより処理を簡略化することができるようになされている。
またこのようにして大きさの異なるブロックによりイントラ予測装置47及びインター予測装置48により変数を検出するようにして、イントラ予測装置47において、イントラ予測の変数を、インター予測装置48に係るブロックの大きさに対応するように集計して出力することにより、このように構成の簡略化を目的に処理に係るブロックの大きさを異ならせるようにして、対応する変数により最適な予測モードを検出することができる。
また符号化部45のインター予測に係るインター予測モードにおいては、複数の参照フレームよりそれぞれ1画素より小さな1/4画素精度で動きベクトルを検出することにより実行されるのに対し、インター予測装置48おいては、1画素精度により動きベクトルを検出するようになされ、これによっても簡易な処理により実用上十分な精度で最適な予測モードを検出してインター予測の変数InterSADを検出することができるようになされている。
(3)実施例の効果
以上の構成によれば、符号化の処理に先行してイントラ予測及びインター予測に係る最適な予測モードを検出すると共に、この検出した最適な予測モードによる差分データの大きさを示す変数を検出し、この変数により各ピクチャの目標符号量を設定することにより、復号化装置と共に画像変換装置として機能するように符号化装置を構成するような場合に、全体構成を簡略化することができる。
すなわち画像データを直交変換処理、量子化処理、可変長符号化処理して生成された符号化データDMPEGを処理する場合に、この符号化データDMPEGの量子化スケール、データ量の乗算値Xを用いて1GOPに割り振るデータ量を各ピクチャに分配してレート制御の処理を実行することにより、構成を簡略化して画像変換装置としての機能を確保することができる。
また符号化処理に係る複数のイントラ予測モードが、大きさの異なる2種類以上のブロックにおいて、各ブロック単位でそれぞれ複数の手法により予測値を生成する予測モードである場合に、イントラ予測手段であるイントラ予測装置47においては、これら2種類以上のブロックのうちで最も大きさの小さいブロックに係る予測モードについて、最適な予測モードを選択してイントラ予測の変数を検出することにより、簡易な処理により実用上十分な精度により最適な予測モードを検出してイントラ予測の変数を検出することができる。
より具体的に、この2種類以上のブロックが、4画素×4画素及び16画素×16画素のブロックであることにより、イントラ予測手段においては、4画素×4画素のブロックによる4×4予測モードについてのみ、画像データを処理し得、これにより処理を簡略化することができる。
また符号化手段においては、復号化した画像データを基準にして、最適な予測モードを選択する場合に、イントラ予測手段では、原画像データを基準にして、最適な予測モードを選択することにより、実用上十分な精度を確保して全体構成を簡略化することができる。
また複数のインター予測モードが、大きさの異なる2種類以上のブロックにおいて、各ブロック単位でそれぞれ複数の手法により予測値を生成する予測モードであるのに対し、インター予測手段であるインター予測装置48においては、これら2種類以上のブロックのうちで最も大きさの大きなブロックに係る予測モードについて、最適な予測モードを選択してインター予測の変数を検出することにより、簡易な処理により実用上十分な精度により最適な予測モードを検出してインター予測の変数を検出することができる。
具体的に、この2種類以上のブロックが、4画素×4画素、4画素×8画素、8画素×4画素、8画素×8画素、8画素×16画素、16画素×8画素及び16画素×16画素のブロックであることにより、インター予測手段は、16画素×16画素によるマクロブロックについてのみ、画像データを処理し得、これにより処理を簡略化することができる。
またイントラ予測の変数を、インター予測手段に係るブロックの大きさに対応するように集計して出力することにより、このように構成の簡略化を目的に処理に係るブロックの大きさを異ならせるようにして、対応する変数により最適な予測モードを検出することができる。
また符号化手段による複数のインター予測モードが、複数の参照フレームよりそれぞれ1画素より小さな画素精度で検出した動きベクトルにより、対応する参照フレームを動き補償して予測値を生成する予測モードであるのに対し、インター予測手段は、1画素精度により動きベクトルを検出して最適な予測モードを検出することにより、簡易な処理により実用上十分な精度で最適な予測モードを検出してインター予測の変数を検出することができる。
この実施例においては、コンピュータによる符号化処理プログラムの実行により、実施例1について上述した符号化装置41の各ブロックに対応する機能ブロックをこのコンピュータにより構成し、このコンピュータにより符号化装置41と同様の処理を実行する。なおこのような符号化処理プログラムにおいては、コンピュータに事前にインストールして提供する場合の他、インターネット等のネットワークを介したダウンロードにより提供するようにしてもよく、また記録媒体に記録して提供するようにしてもよい。またこのような記録媒体においては、光ディスク、光磁気ディスク等、種々の記録媒体を広く適用することができる。
この実施例のように、コンピュータによる処理プログラムの実行により、実施例1に係る符号化装置41と同様の機能ブロックを構成して符号化処理するようにしても、実施例1と同様の効果を得ることができる。
なお上述の実施例においては、差分データの絶対値和によりイントラ予測及びインター予測に係る変数を検出する場合について述べたが、本発明はこれに限らず、差分データの絶対値和に代えて例えば差分データの二乗和を適用する場合等、必要に応じて種々のパラメータを広く適用することができる。
また上述の実施例においては、参照画像情報、動き補償に係る精度、予測モードに係るブロックの種類に関して、符号化手段におけるイントラ予測、インター予測に対して、イントラ予測手段、インター予測手段における処理を簡略化する場合について述べたが、本発明はこれに限らず、実用上十分な処理能力を確保することができる場合、符号化手段におけるイントラ予測、インター予測と同一の処理をイントラ予測手段、インター予測手段で実行するようにしてもよい。
また上述の実施例においては、アナログ信号によるビデオ信号及びMPEG2による符号化データをAVCによる符号化データに符号化処理する場合について述べたが、本発明はこれに限らず、各種の画像データ、符号化データをAVCによる符号化データに符号化処理する場合、さらにはAVCと同様の符号化データに符号化処理する場合に広く適用することができる。
また上述の実施例においては、本発明を記録装置に適用する場合について述べたが、本発明はこれに限らず、例えば画像データの伝送等にも広く適用することができる。
本発明は、例えば衛星放送、ケーブルテレビ、インターネット、携帯電話等による動画の伝送、光ディスク、光磁気ディスク、フラッシュメモリ等の記録媒体への動画の記録等に適用することができる。
本発明の実施例1に係る符号化装置を示すブロック図である。 図1の符号化装置におけるレート制御装置の処理手順を示すフローチャートである。 AVC方式の符号化装置を示すブロック図である。 AVC方式の復号化装置を示すブロック図である。 イントラ4×4予測モードに係る予測画素の説明に供する図表である。 イントラ4×4予測モードにおける予測モードの説明に供する略線図である。 イントラ4×4予測モードを示す図表である。 イントラ4×4予測モードの各モードの説明に供する略線図である。 イントラ16×16予測モードの予測画素の説明に供する略線図である。 イントラ16×16予測モードを示す図表である。 イントラ16×16予測モードにおける予測モードの説明に供する略線図である。 AVC方式の参照フレームの説明に供する略線図である。 AVC方式の動き補償の説明に供する略線図である。 AVC方式の動き補償精度の説明に供する略線図である。 TM5によるレート制御の説明に供するフローチャートである。
符号の説明
1、41……符号化装置、4……減算器、5、23、47……イントラ予測装置、6、24……動き予測・補償装置、7……直交変換装置、8……量子化装置、10……可逆符号化装置、9、45A……レート制御装置、20、43……復号化装置、44……Complexity算出装置、45……符号化部、48……インター予測装置、49……Difficulty算出装置

Claims (9)

  1. 画像データをイントラ符号化、インター符号化により符号化処理する符号化装置において、
    画像データを直交変換処理、量子化処理、可変長符号化処理して生成された符号化データを入力して、前記画像データを復号化する復号化手段と、
    複数のイントラ予測モードと複数のインター予測モードとから最適な予測モードを選択し、該選択した予測モードによる予測値を画像データから減算して差分データを生成し、前記差分データを直交変換処理、量子化処理、可変長符号化処理する符号化手段と、
    前記符号化手段による符号化処理に対して少なくとも1GOP分だけ先行して、前記符号化手段に入力される画像データを用いたイントラ予測により、レート制御用にイントラ予測における最適な予測モードを選択し、対応する前記差分データの大きさを示すレート制御用のイントラ予測の変数を検出するイントラ予測手段と、
    前記符号化手段による符号化処理に対して少なくとも1GOP分だけ先行して、前記符号化手段に入力される画像データを用いたインター予測により、レート制御用にインター予測における最適な予測モードを選択し、対応する前記差分データの大きさを示すレート制御用のインター予測の変数を検出するインター予測手段と、
    前記レート制御用のイントラ予測の変数と前記レート制御用のインター予測の変数との比較により、ピクチャ単位で、レート制御用にイントラ予測及びインター予測における最適な予測モードを検出し、対応する前記差分データの大きさを示す第1の変数を算出する第1の変数算出手段と、
    前記符号化データにおける前記量子化処理の量子化スケールと、前記符号化データにおけるデータ量との乗算値を前記復号化手段より出力される画像データのピクチャ単位で検出して第2の変数を算出する第2の変数算出手段と、
    レート制御の変数により1GOPに割り振るデータ量を各ピクチャに分配して各ピクチャの目標符号量を計算し、前記目標符号量により前記符号化手段による符号化処理をレート制御するレート制御手段とを備え、
    前記符号化手段は、
    前記復号化手段から出力される画像データ又は所定のアナログディジタル変換回路で生成された画像データを選択的に入力して処理し、
    前記レート制御手段は、
    前記符号化手段で処理する画像データに応じて前記レート制御の変数の生成方法を切り換え、
    前記所定のアナログディジタル変換回路で生成された画像データを前記符号化手段で処理する場合、前記第1の変数を前記レート制御の変数に適用してレート制御し、
    前記復号化手段から出力される画像データを前記符号化手段で処理する場合、前記第2の変数を前記レート制御の変数に適用してレート制御し、
    前記複数のイントラ予測モード及び前記複数のインター予測モードが、
    大きさの異なる2種類以上のブロックにおいて、各ブロック単位でそれぞれ複数の手法により前記予測値を生成する予測モードであり、
    前記イントラ予測手段は、
    前記2種類以上のブロックのうちで最も大きさの小さいブロックに係る前記予測モードについて、レート制御用に最適な予測モードを選択して前記レート制御用のイントラ予測の変数を検出し、
    前記インター予測手段は、
    前記2種類以上のブロックのうちで最も大きさの大きいブロックに係る前記予測モードについて、レート制御用に最適な予測モードを選択して前記レート制御用のインター予測の変数を検出する
    号化装置。
  2. 前記イントラ予測モードにおける2種類以上のブロックが、4画素×4画素及び16画素×16画素のブロックであ
    求項に記載の符号化装置。
  3. 前記符号化手段は、
    前記符号化手段の出力データを復号化した画像データを基準にして、前記最適な予測モードを選択し、
    前記イントラ予測手段は、
    前記符号化手段による符号化処理に対して少なくとも1GOP分だけ先行した、前記符号化手段に入力される前記画像データを基準にして、前記レート制御用のイントラ予測における最適な予測モードを選択する
    求項1に記載の符号化装置。
  4. 前記インター予測モードにおける2種類以上のブロックが、4画素×4画素、4画素×8画素、8画素×4画素、8画素×8画素、8画素×16画素、16画素×8画素及び16画素×16画素のブロックであ
    求項に記載の符号化装置。
  5. 前記イントラ予測手段は、
    前記レート制御用のイントラ予測の変数を、前記インター予測手段に係るブロックの大きさに対応するように集計して出力す
    求項に記載の符号化装置。
  6. 前記符号化手段による前記複数のインター予測モードが、
    複数の参照フレームよりそれぞれ1画素より小さな画素精度で検出した動きベクトルにより、対応する参照フレームを動き補償して前記予測値を生成する予測モードであり、
    前記インター予測手段は、
    画素精度により動きベクトルを検出して前記インター予測における最適な予測モードを検出す
    求項1に記載の符号化装置。
  7. 画像データをイントラ符号化、インター符号化により符号化処理する符号化方法において、
    画像データを直交変換処理、量子化処理、可変長符号化処理して生成された符号化データを入力して、前記画像データを復号化する復号化ステップと、
    複数のイントラ予測モードと複数のインター予測モードとから最適な予測モードを選択し、該選択した予測モードによる予測値を画像データから減算して差分データを生成し、前記差分データを直交変換処理、量子化処理、可変長符号化処理する符号化ステップと、
    前記符号化ステップによる符号化処理に対して少なくとも1GOP分だけ先行して前記符号化ステップで処理する画像データを用いたイントラ予測により、レート制御用にイントラ予測における最適な予測モードを選択し、対応する前記差分データの大きさを示すレート制御用のイントラ予測の変数を検出するイントラ予測のステップと、
    前記符号化ステップによる符号化処理に対して少なくとも1GOP分だけ先行して前記符号化ステップで処理する画像データを用いたインター予測により、レート制御用にインター予測における最適な予測モードを選択し、対応する前記差分データの大きさを示すレート制御用のインター予測の変数を検出するインター予測のステップと、
    前記レート制御用のイントラ予測の変数と前記レート制御用のインター予測の変数との比較により、ピクチャ単位で、レート制御用にイントラ予測及びインター予測における最適な予測モードを検出し、対応する前記差分データの大きさを示す第1の変数を算出する第1の変数算出ステップと、
    前記符号化データにおける前記量子化処理の量子化スケールと、前記符号化データにおけるデータ量との乗算値を前記復号化ステップより出力される画像データのピクチャ単位で検出して第2の変数を算出する第2の変数算出ステップと、
    レート制御の変数により1GOPに割り振るデータ量を各ピクチャに分配して各ピクチャの目標符号量を計算し、前記目標符号量により前記符号化ステップによる符号化処理をレート制御するレート制御のステップとを備え、
    前記符号化ステップは、
    前記復号化ステップから出力される画像データ又は所定のアナログディジタル変換回路で生成された画像データを選択的に入力して処理し、
    前記レート制御ステップは、
    前記符号化ステップで処理する画像データに応じて前記レート制御の変数の生成方法を切り換え、
    前記所定のアナログディジタル変換回路で生成された画像データを前記符号化ステップで処理する場合、前記第1の変数を前記レート制御の変数に適用してレート制御し、
    前記復号化ステップから出力される画像データを前記符号化ステップで処理する場合、前記第2の変数を前記レート制御の変数に適用してレート制御
    前記複数のイントラ予測モード及び前記複数のインター予測モードが、
    大きさの異なる2種類以上のブロックにおいて、各ブロック単位でそれぞれ複数の手法により前記予測値を生成する予測モードであり、
    前記イントラ予測ステップは、
    前記2種類以上のブロックのうちで最も大きさの小さいブロックに係る前記予測モードについて、レート制御用に最適な予測モードを選択して前記レート制御用のイントラ予測の変数を検出し、
    前記インター予測ステップは、
    前記2種類以上のブロックのうちで最も大きさの大きいブロックに係る前記予測モードについて、レート制御用に最適な予測モードを選択して前記レート制御用のインター予測の変数を検出する
    号化方法。
  8. 演算処理手段により実行して符号化手段の動作を制御する符号化方法のプログラムにおいて、
    前記符号化手段は、
    複数のイントラ予測モードと複数のインター予測モードとから最適な予測モードを選択し、該選択した予測モードによる予測値を画像データから減算して差分データを生成し、前記差分データを直交変換処理、量子化処理、可変長符号化処理することにより、前記画像データをイントラ符号化、インター符号化により符号化処理し、
    前記符号化方法のプログラムは、
    画像データを直交変換処理、量子化処理、可変長符号化処理して生成された符号化データを入力して、前記画像データを復号化する復号化ステップと、
    前記符号化手段による符号化処理に対して少なくとも1GOP分だけ先行して前記符号化手段で処理する画像データを用いたイントラ予測により、レート制御用にイントラ予測における最適な予測モードを選択し、対応する前記差分データの大きさを示すレート制御用のイントラ予測の変数を検出するイントラ予測のステップと、
    前記符号化手段による符号化処理に対して少なくとも1GOP分だけ先行して前記符号化手段で処理する画像データを用いたインター予測により、レート制御用にインター予測における最適な予測モードを選択し、対応する前記差分データの大きさを示すレート制御用のインター予測の変数を検出するインター予測のステップと、
    前記レート制御用のイントラ予測の変数と前記レート制御用のインター予測の変数との比較により、ピクチャ単位で、レート制御用にイントラ予測及びインター予測における最適な予測モードを検出し、対応する前記差分データの大きさを示す第1の変数を算出する第1の変数算出ステップと、
    前記符号化データにおける前記量子化処理の量子化スケールと、前記符号化データにおけるデータ量との乗算値を前記復号化ステップより出力される画像データのピクチャ単位で検出して第2の変数を算出する第2の変数算出ステップと、
    レート制御の変数により1GOPに割り振るデータ量を各ピクチャに分配して各ピクチャの目標符号量を計算し、前記目標符号量により前記符号化手段による符号化処理をレート制御するレート制御のステップとを備え、
    前記符号化手段は、
    前記復号化ステップから出力される画像データ又は所定のアナログディジタル変換回路で生成された画像データを選択的に入力して処理し、
    前記レート制御ステップは、
    前記符号化手段で処理する画像データに応じて前記レート制御の変数の生成方法を切り換え、
    前記所定のアナログディジタル変換回路で生成された画像データを前記符号化手段で処理する場合、前記第1の変数を前記レート制御の変数に適用してレート制御し、
    前記復号化ステップから出力される画像データを前記符号化手段で処理する場合、前記第2の変数を前記レート制御の変数に適用してレート制御
    前記複数のイントラ予測モード及び前記複数のインター予測モードが、
    大きさの異なる2種類以上のブロックにおいて、各ブロック単位でそれぞれ複数の手法により前記予測値を生成する予測モードであり、
    前記イントラ予測ステップは、
    前記2種類以上のブロックのうちで最も大きさの小さいブロックに係る前記予測モードについて、レート制御用に最適な予測モードを選択して前記レート制御用のインター予測の変数を検出し、
    前記インター予測ステップは、
    前記2種類以上のブロックのうちで最も大きさの大きいブロックに係る前記予測モードについて、レート制御用に最適な予測モードを選択して前記レート制御用のインター予測の変数を検出する
    号化方法のプログラム。
  9. 演算処理手段により実行して符号化手段の動作を制御する符号化方法のプログラムを記録した記録媒体において、
    前記符号化手段は、
    複数のイントラ予測モードと複数のインター予測モードとから最適な予測モードを選択し、該選択した予測モードによる予測値を画像データから減算して差分データを生成し、前記差分データを直交変換処理、量子化処理、可変長符号化処理することにより、前記画像データをイントラ符号化、インター符号化により符号化処理し、
    前記符号化方法のプログラムは、
    画像データを直交変換処理、量子化処理、可変長符号化処理して生成された符号化データを入力して、前記画像データを復号化する復号化ステップと、
    前記符号化手段による符号化処理に対して少なくとも1GOP分だけ先行して前記符号化手段で処理する画像データを用いたイントラ予測により、レート制御用にイントラ予測における最適な予測モードを選択し、対応する前記差分データの大きさを示すレート制御用のイントラ予測の変数を検出するイントラ予測のステップと、
    前記符号化手段による符号化処理に対して少なくとも1GOP分だけ先行して前記符号化手段で処理する画像データを用いたインター予測により、レート制御用にインター予測における最適な予測モードを選択し、対応する前記差分データの大きさを示すレート制御用のインター予測の変数を検出するインター予測のステップと、
    前記レート制御用のイントラ予測の変数と前記レート制御用のインター予測の変数との比較により、ピクチャ単位で、レート制御用にイントラ予測及びインター予測における最適な予測モードを検出し、対応する前記差分データの大きさを示す第1の変数を算出する第1の変数算出ステップと、
    前記符号化データにおける前記量子化処理の量子化スケールと、前記符号化データにおけるデータ量との乗算値を前記復号化ステップより出力される画像データのピクチャ単位で検出して第2の変数を算出する第2の変数算出ステップと、
    レート制御の変数により1GOPに割り振るデータ量を各ピクチャに分配して各ピクチャの目標符号量を計算し、前記目標符号量により前記符号化手段による符号化処理をレート制御するレート制御のステップとを備え、
    前記符号化手段は、
    前記復号化ステップから出力される画像データ又は所定のアナログディジタル変換回路で生成された画像データを選択的に入力して処理し、
    前記レート制御ステップは、
    前記符号化手段で処理する画像データに応じて前記レート制御の変数の生成方法を切り換え、
    前記所定のアナログディジタル変換回路で生成された画像データを前記符号化手段で処理する場合、前記第1の変数を前記レート制御の変数に適用してレート制御し、
    前記復号化ステップから出力される画像データを前記符号化手段で処理する場合、前記第2の変数を前記レート制御の変数に適用してレート制御
    前記複数のイントラ予測モード及び前記複数のインター予測モードが、
    大きさの異なる2種類以上のブロックにおいて、各ブロック単位でそれぞれ複数の手法により前記予測値を生成する予測モードであり、
    前記イントラ予測ステップは、
    前記2種類以上のブロックのうちで最も大きさの小さいブロックに係る前記予測モードについて、レート制御用に最適な予測モードを選択して前記レート制御用のイントラ予測の変数を検出し、
    前記インター予測ステップは、
    前記2種類以上のブロックのうちで最も大きさの大きいブロックに係る前記予測モードについて、レート制御用に最適な予測モードを選択して前記レート制御用のインター予測の変数を検出する
    号化方法のプログラムを記録した記録媒体。
JP2004200255A 2004-07-07 2004-07-07 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体 Expired - Fee Related JP4247680B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2004200255A JP4247680B2 (ja) 2004-07-07 2004-07-07 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体
US11/155,687 US20060013299A1 (en) 2004-07-07 2005-06-20 Coding apparatus, coding method, coding method program, and recording medium recording the coding method program
CNB2005100833232A CN100417229C (zh) 2004-07-07 2005-07-07 编码装置和编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004200255A JP4247680B2 (ja) 2004-07-07 2004-07-07 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2006025077A JP2006025077A (ja) 2006-01-26
JP4247680B2 true JP4247680B2 (ja) 2009-04-02

Family

ID=35599373

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004200255A Expired - Fee Related JP4247680B2 (ja) 2004-07-07 2004-07-07 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体

Country Status (3)

Country Link
US (1) US20060013299A1 (ja)
JP (1) JP4247680B2 (ja)
CN (1) CN100417229C (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100667815B1 (ko) * 2005-09-22 2007-01-12 삼성전자주식회사 영상 부호화 및 복호화 장치와, 그 방법, 및 이를 수행하기위한 프로그램이 기록된 기록 매체
JP4534935B2 (ja) * 2005-10-04 2010-09-01 株式会社日立製作所 トランスコーダ、記録装置及びトランスコード方法
US8155189B2 (en) * 2005-10-19 2012-04-10 Freescale Semiconductor, Inc. System and method of coding mode decision for video encoding
US8605797B2 (en) * 2006-02-15 2013-12-10 Samsung Electronics Co., Ltd. Method and system for partitioning and encoding of uncompressed video for transmission over wireless medium
JP2008022405A (ja) * 2006-07-14 2008-01-31 Sony Corp 画像処理装置および方法、並びに、プログラム
JP4747975B2 (ja) * 2006-07-14 2011-08-17 ソニー株式会社 画像処理装置および方法、プログラム、並びに、記録媒体
JP4635016B2 (ja) 2007-02-16 2011-02-16 株式会社東芝 情報処理装置およびインター予測モード判定方法
US20090016631A1 (en) * 2007-07-10 2009-01-15 Texas Instruments Incorporated Video Coding Rate Control
US8842739B2 (en) * 2007-07-20 2014-09-23 Samsung Electronics Co., Ltd. Method and system for communication of uncompressed video information in wireless systems
CN101637026B (zh) * 2007-09-12 2012-03-28 索尼株式会社 图像处理装置和方法
EP2220869A1 (en) * 2007-12-21 2010-08-25 Telefonaktiebolaget LM Ericsson (publ) Improved pixel prediction for video coding
KR20210064398A (ko) 2009-01-27 2021-06-02 인터디지털 브이씨 홀딩스 인코포레이티드 비디오 인코딩 및 디코딩에서 변환 선택을 위한 방법 및 장치
JP2010183162A (ja) * 2009-02-03 2010-08-19 Mitsubishi Electric Corp 動画像符号化装置
US9369759B2 (en) * 2009-04-15 2016-06-14 Samsung Electronics Co., Ltd. Method and system for progressive rate adaptation for uncompressed video communication in wireless systems
JP5257215B2 (ja) * 2009-04-16 2013-08-07 ソニー株式会社 画像符号化装置と画像符号化方法
US9635368B2 (en) 2009-06-07 2017-04-25 Lg Electronics Inc. Method and apparatus for decoding a video signal
JP5183573B2 (ja) * 2009-06-08 2013-04-17 三菱電機株式会社 動画像符号化装置
KR20120052267A (ko) 2009-07-01 2012-05-23 톰슨 라이센싱 비디오 인코더 및 디코더용 대형 블록에 대한 인트라 예측을 시그널링하기 위한 방법 및 장치
US8705623B2 (en) * 2009-10-02 2014-04-22 Texas Instruments Incorporated Line-based compression for digital image data
WO2011125211A1 (ja) 2010-04-08 2011-10-13 株式会社 東芝 画像符号化方法及び画像復号化方法
KR101969362B1 (ko) 2011-01-13 2019-04-16 캐논 가부시끼가이샤 화상 부호화장치, 화상 부호화방법, 화상복호장치, 화상복호방법 및 기억매체
CN106534872B (zh) * 2011-03-11 2019-05-17 索尼公司 图像处理装置和方法
HRP20240457T1 (hr) * 2011-03-21 2024-07-05 Lg Electronics Inc. Metoda dekodiranja videozapisa, metoda kodiranja videozapisa, računalno-čitljiv digitalni medij za pohranu i metoda prijenosa podataka za videozapis
US9787989B2 (en) * 2013-06-11 2017-10-10 Blackberry Limited Intra-coding mode-dependent quantization tuning
WO2015053594A1 (ko) * 2013-10-12 2015-04-16 삼성전자 주식회사 인트라 블록 복사 예측을 이용한 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치
CN104601988B (zh) * 2014-06-10 2018-02-02 腾讯科技(北京)有限公司 视频编码器、方法和装置及其帧间模式选择方法和装置
EP3023983B1 (en) * 2014-11-21 2017-10-18 AKG Acoustics GmbH Method of packet loss concealment in ADPCM codec and ADPCM decoder with PLC circuit
CN114125451B (zh) * 2021-12-01 2022-12-06 锐宸微(上海)科技有限公司 视频编码方法、视频编码装置及影像处理装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5317397A (en) * 1991-05-31 1994-05-31 Kabushiki Kaisha Toshiba Predictive coding using spatial-temporal filtering and plural motion vectors
US6192081B1 (en) * 1995-10-26 2001-02-20 Sarnoff Corporation Apparatus and method for selecting a coding mode in a block-based coding system
KR100188701B1 (ko) * 1996-01-08 1999-06-01 윤종용 가변속 고속 재생기능을 갖는 가변 비트율 동화상복호화장치
KR100468726B1 (ko) * 2002-04-18 2005-01-29 삼성전자주식회사 실시간 가변 비트율 제어를 수행하는 부호화 장치 및 방법
JP4806888B2 (ja) * 2002-07-19 2011-11-02 ソニー株式会社 復号化装置及び復号化方法
BRPI0406625A (pt) * 2003-01-07 2005-12-06 Thomson Licensing Sa Inter / intra vìdeo-codificação mista de partições de macroblocos

Also Published As

Publication number Publication date
JP2006025077A (ja) 2006-01-26
US20060013299A1 (en) 2006-01-19
CN100417229C (zh) 2008-09-03
CN1719905A (zh) 2006-01-11

Similar Documents

Publication Publication Date Title
JP4247680B2 (ja) 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体
JP4529615B2 (ja) 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体
CN1949877B (zh) 自适应量化控制器及其方法
JP3861698B2 (ja) 画像情報符号化装置及び方法、画像情報復号装置及び方法、並びにプログラム
JP4391809B2 (ja) 画像のシーケンスを適応的に符号化するシステムおよび方法
KR101608426B1 (ko) 영상의 인트라 예측 부호화/복호화 방법 및 그 장치
JP4650461B2 (ja) 符号化装置、符号化方法、プログラム、及び記録媒体
KR101362590B1 (ko) 화상 처리 장치 및 방법
US8149918B2 (en) Method of estimating coded block pattern and method of determining block mode using the same for moving picture encoder
JP4650173B2 (ja) 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体
CN102077595A (zh) 图像处理装置和方法
KR101648070B1 (ko) 고정밀 필터를 이용한 영상 부호화/복호화 방법 및 장치
US20120147960A1 (en) Image Processing Apparatus and Method
JP2001145113A (ja) 画像情報変換装置及び方法
JP4391810B2 (ja) 画像のシーケンスを適応的に符号化するシステムおよび方法
JP2009089332A (ja) 動き予測方法及び動き予測装置
JP4360093B2 (ja) 画像処理装置および符号化装置とそれらの方法
KR100949475B1 (ko) 스캔 패턴 결정 장치 및 이를 이용한 영상 데이터 부호화방법과 그 장치, 그리고, 이를 이용한 영상 데이터 복호화방법과 그 장치
KR20050074286A (ko) 화상 부호화 장치, 화상 부호화 방법 및 화상 부호화프로그램
JP2006100871A (ja) 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体
KR20070037532A (ko) 영상의 인트라 예측 부호화 방법 및 그 방법을 사용하는부호화 장치
KR101204385B1 (ko) 인트라 예측 모드에서의 영상 복호화 방법
KR101432779B1 (ko) 움직임 보상 프레임의 선택적 필터링을 이용한 영상 부호화/복호화 방법 및 장치와 그를 위한 인터 예측 방법 및 장치
JP4277530B2 (ja) 画像処理装置および符号化装置とそれらの方法
JP4407249B2 (ja) データ処理装置およびその方法と符号化装置、その方法及びプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070910

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080821

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080911

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081218

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081231

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120123

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120123

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees