JP3911768B2 - 画像符号化方法及び画像符号化装置 - Google Patents
画像符号化方法及び画像符号化装置 Download PDFInfo
- Publication number
- JP3911768B2 JP3911768B2 JP14430697A JP14430697A JP3911768B2 JP 3911768 B2 JP3911768 B2 JP 3911768B2 JP 14430697 A JP14430697 A JP 14430697A JP 14430697 A JP14430697 A JP 14430697A JP 3911768 B2 JP3911768 B2 JP 3911768B2
- Authority
- JP
- Japan
- Prior art keywords
- fade
- encoding
- image
- picture
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/147—Scene change detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/114—Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/115—Selection of the code volume for a coding unit prior to coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/142—Detection of scene cut or scene change
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/152—Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/162—User input
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/177—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/192—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/196—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
- H04N19/197—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
【発明の属する技術分野】
本発明は、画像フレームの符号化難易度に応じて画像を符号化する画像符号化方法及び画像符号化装置に関する。
【0002】
【従来の技術】
ビデオ情報をディジタルビデオディスク(Digital Video Disk:DVD)やビデオCDのようなパッケージメディアに蓄積する際、上記ビデオ情報に圧縮符号化処理を施すエンコードシステムでは、最初に素材の画像の符号化難易度(Difficulty)を測定し、その符号化難易度を元に、パッケージメディアの記録容量内の与えられたバイト数に収まるように、各ビデオ情報のフレームごとにビット配分(以下、Bit assign)処理を行ってエンコードするという方法が一般に採用されている。以下、このエンコード方法を2パスエンコーディング方法という。
【0003】
例えば、上記ディジタルビデオディスク用に、上記2パスエンコーディング方法を採用して、ビデオ情報を圧縮符号化するビデオエンコードシステムの具体例を図16に示す。
【0004】
図16において、ビデオエンコードの制御を行うビデオエンコードコントローラ10は、システム全体を管理するスーパーバイザコントローラ1に、ネットワーク2を介して接続されている。
【0005】
スーパーバイザコントローラ1はオペレーティングシステムを構成するプログラムの内、特にシステム全体の動きを監視し、効率的に制御するプログラムであるスーパーバイザを実行するコントローラである。このビデオエンコードシステムにおいてはDVDのオーサリングシステム全体の管理を行い、ビデオ、オーディオ、字幕やメニューといった各エンコードシステムにエンコード条件を与え、エンコード結果の報告を受ける。
【0006】
このビデオエンコードシステムの具体例に対しては、例えばv.enc というファイルによってビデオエンコード条件を指定している。そして、ビデオエンコードコントローラ10側からは、RAID16(Redundant Arrays of Inexpensive Diskes)上に書き込まれたアドレスv.adrと、エンコード結果のビットストリームがオーディオや字幕,メニュー等のサブピクチャとマルチプレックスされる際に必要とされるデータ(vxxx.aui)を報告している。ここで、RAID16は、エンコード結果のビットストリームを記録する大容量記録媒体であり、ハードディスクドライブ(HDD)等を複数並列に接続して記録容量と転送速度性能を向上させている。
【0007】
ビデオエンコードコントローラ10は、グラフィカルユーザインターフェース(Graphical User Interfece:GUI)11と、後述するビット配分計算処理プログラム(Bit_Assign)を格納しているビット配分計算部12と、このビット配分計算部12内部のビット配分計算処理プログラム(Bit_Assign)を実行するMPEGエンコーダコントローラ13と、ディジタルVTRコントローラ14とを備えている。
【0008】
ユーザは、グラフィカルユーザインターフェース11を用い、ビット配分計算部12の上記ビット配分計算処理プログラム(BIT_ASSIGN)と、MPEGエンコーダコントローラ13の3つのプログラムを管理することができる。また、DVTRコントローラ14も管理できる。
【0009】
MPEGエンコーダコントローラ13は、上記ビット配分計算部12内部の上記ビット配分計算処理プログラム(BIT_ASSIGN)を実行すると共に、MPEGエンコーダ15を制御する。また、DVTRコントローラ14はDVTR17を制御する。このDVTR17はMPEGエンコーダ15に接続しており、MPEGエンコーダ15はエンコードした結果を表示するためにモニタ18に接続している。さらに、MPEGエンコーダ15は、エンコード結果を記録するために上記RAID16にも接続している。
【0010】
MPEGエンコーダ15では、動き補償予測による時間方向の冗長度の除去を行って、ビデオ情報を圧縮している。また、MPEGエンコーダ15では、フレーム内だけで符号化されるフレーム内符号化画像をIピクチャ(Intra Coded)、過去の画面から現在を予測することによって符号化されるフレーム間順方向予測符号化画像をPピクチャ(Predictive Coded)、過去、未来の両方向の画像から現在を予測することによって符号化される双方向予測符号化画像をBピクチャ(Bidirectionaly Predictive Coded)として用い、ビデオ情報を圧縮符号化している。ここでは、必ずIピクチャを1つ含むピクチャーのまとまりを図17に示すようなGOP(Group of Pictures)としている。この図17において、GOPのフレーム数Nは15であり、表示順のGOPの先頭は、Iピクチャの前で、P又はIピクチャの次のBピクチャーである。GOPの最後は、次のIピクチャの前の最初のPピクチャである。
【0011】
このビデオエンコードシステムの動作について図18のフローチャートを参照して説明する。先ず、ステップS1で、スーパーバイザコントローラ1からネットワーク2経由でビデオに割り当てるビット総量や最大レートなどのエンコード条件v.encが与えられ、MPEGエンコーダコントローラ13はエンコード条件を設定する。その後、ステップS2でMPEGエンコーダコントローラ13の制御の基にMPEGエンコーダ15がエンコード素材の符号化難易度を測定する。ここでは、各画素のDC値や動きベクトル量MEも読んでおく。そして、これらの測定結果により、ファイルを作成しておく。
【0012】
実際の符号化難易度の測定は以下のように行う。エンコード素材となるビデオ情報はDVTR17によってマスターテープであるディジタルビデオカセットから再生される。MPEGエンコードコントローラ13は、MPEGエンコーダ15を介して、DVTR17によって再生されたビデオ情報の符号化難易度を測定する。
【0013】
ここでは、符号化の際に量子化ステップ数を固定値に設定した条件で発生ビット量を測定する。動きが多く、高い周波数成分が大きい画像では発生ビット量が大きくなり、静止画や平坦な部分が多い画像では発生ビット量が少なくなる。この発生ビット量の大きさを上記符号化難易度としている。
【0014】
次に、ステップS3では、ステップS1で設定されたエンコード条件を元に、ステップS2で測定された各ピクチャーの符号化難易度の大きさに応じて、MPEGエンコードコントローラ13がビット配分計算部12内部のビット配分計算プログラム(BIT_ASSIGN)を実行し、割り当てビット量(ターゲット量 :target)の配分計算を行う。
【0015】
そして、このステップS3でのビット配分計算による結果を使ってエンコードを実行するかどうかをMPEGエンコーダ15に内蔵されているローカルデコーダ出力の画質によってユーザに判断させる。
【0016】
実際には、ステップS4で、上記ビット配分によるビットストリームをRAID16に出力しないで、任意の処理範囲を指定できるプレビユーモード(Preview)を行って、ユーザーが画質をチェックする。
【0017】
ステップS5の画質評価で画質に問題がない場合にはステップS6に進み、MPEGエンコーダ15によるエンコード処理を実行するが、画質に問題がある場合には、ステップS8に進み、問題のある部分のレートを上げるとか、フィルターレベルを調整するといった画質調整のためのカスタマイズ作業を行ってから、ステップS9で再びビット配分計算部12内部のビット配分計算処理プログラム(BIT_ASSIGN)を実行し、ビット再配分計算を行う。
【0018】
その後、ステップS4に戻り、カスタマイズした部分をプレビューして、ステップS5で画質を確認し、すべての部分が良ければステップS6に進み、全体のエンコードをMPEGエンコーダ15に実行させる。エンコード結果であるビットストリームは、ステップS7でSCSI(Small Computer System Interface)経由で直接、RAID16に書き込まれる。
【0019】
ステップS6でのエンコード後、ビデオエンコードコントローラ10は上述したようなエンコード結果情報をネットワーク経由でスーパーバイザコントローラ1に報告する。
【0020】
この図18のフローチャートにおいて、ステップS2,ステップS4及びステップS6を除いた各ステップの処理はオフライン処理を意味している。
【0021】
以下、特に、ステップS3でMPEGエンコードコントローラ13によって実行されるビット配分計算部12内のビット配分計算処理について詳細に説明する。先ず、スーパーバイザコントローラ1から上記ビット総量(QTY_BYTES)と、最大ビットレート(MAXRATE)が指定されると、これに対して、MPEGエンコーダコントローラ13は、最大ビットレート(MAXRATE)以下になるように制限を加えた総ビット数 (USB_BYTES)を求め、この値からGOPのヘッダ(GOP header)に必要なビット数(TOTAL_HEADER)を引いた値と、全体のフレーム総数からターゲット数の総和の目標値となるSUPPLY_BYTESを算出する。
【0022】
そして、このSUPPLY_BYTESの大きさに収まるようにビット配分計算部12内部のビット配分計算処理プログラムを実行し、各ピクチャーへの割り当てビット量(以下、ターゲット量:target)を配分する。
【0023】
このステップS3でのビット配分計算処理を詳細に示したのが図19のフローチャートである。
【0024】
先ず、ステップS11で上述したように、スーパーバイザコントローラ1から送られた上記ビット総量(QTY_BYTES)と、最大ビットレート(MAXRATE)が入力されると、MPEGエンコーダコントローラ13は、上述したようにSUPPLY_BYTESを算出する。
【0025】
次に、上記図18のステップS2の符号化難易度の測定で作成された測定ファイルをステップS12でそのまま読み込み、符号化難易度の測定の際に、併せて測定された各画像のDC値や動きベクトル量MEの大きさのパラメータの変化量から、ステップS13でシーンが変化するポイントを見つける。
【0026】
このステップS13でのシーンチェンジ検出/処理は、本件出願人が既に特願平8-274094号明細書及び図面にて開示した「映像信号処理装置」に応じてシーンチェンジ点を検出する処理である。
【0027】
この「映像信号処理装置」は、映像信号の各フレームの直流レベルを検出し、この直流レベルを曲線近似して得られる誤差値より、上記映像信号のシーンチェンジのフレームを検出して、シーンチェンジ点を明らかにする。
【0028】
そして、図20に示すように、シーンがチェンジしたとして検出したポイントは、PピクチャーをIピクチャーに変更して、画質改善を計る。
【0029】
次に、ステップS14でチャプター(CHAPTER)境界処理を行う。DVD再生装置でのチャプターサーチ時には、特定されないピクチャーからジャンプしてくることになるが、その場合でも再生画像の乱れがないようにするため、図20に示すようにチャプターの位置が必ずGOPの先頭になるようにピクチャータイプを変更する。図21ではPピクチャをIピクチャに変更している。
【0030】
このようなステップS12,ステップS13での一連の作業の結果、ピクチャータイプ(I,P,Bピクチャ)の変更処理が実行されると、符号化難易度測定時のピクチャータイプが変更されるため、ステップS15で変更後のピクチャータイプに合わせた符号化難易度の値に補間/補正する。
【0031】
ステップS15での符号化難易度の補間/補正によって得られた符号化難易度と、全体に与えられたビット数(SUPPLY_BYTES)に応じて、ステップS16で各ピクチャーごとのターゲットビット数を計算する。
【0032】
そして、ステップS17でRAID16にエンコード結果のビットストリームを書き込む際のアドレスの計算を行った上で、ステップS18に進み、エンコーダ用のコントロールファイルを作成する。
【0033】
例えば、ビット配分計算の具体例として、先ずGOP単位にビット量を配分してから、各GOP内で各ピクチャーの符号化難易度に応じたビット配分を行う場合を説明する。ここでは、各GOP毎の符号化難易度の和であるGOP_DIFFに応じて、エンコードする際のGOP単位のビット割り当て量(GOP_TARGET)を配分している。このGOP_DIFFとGOP_TARGETとを変換するもっとも簡単な関数の例を図22に図示する。
【0034】
この例では、縦軸YをGOP_TARGET、横軸XをGOP_DIFFとして、Y=AX+Bという評価関数を用いている。なお、全てのピクチャーの符号化難易度の総和(DIFFICULTY_SUM)を算出しておく。
【0035】
先ず、最大ビットレート以下になるように制限を加えた総ビット数USB_BYTESを、スーパーバイザコントローラ1から与えられたビット総量QTY_BYTESと、最大ビットレートMAXRATEを使って、
USB_BYTES = min (QTY_BYTES,MAXRATE × KT × total_frame_number)・・・(1)
のように求める。
【0036】
ここで、NTSCの場合 KT=1/8(bits)/30(Hz), PALの場合1/8(bits)/25(Hz)である。また、total_frame_number はエンコードする素材のフレーム総数、min(s,t)は s,t の内で小さい方を選択する関数である。
【0037】
また、SUPPLY_BYTESは、上記(1)式で求めたUSB_BYTESからGOPのヘッダに必要なビット数TOTAL_HEADERを引いて、
SUPPLY_BYTES = USB_BYTES - TOTAL_HEADER ・・・(2)
のように求める。
【0038】
次に、全てのピクチャの符号化難易度の総和は、
DIFFICULTY_SUM = Σdifficulty ・・・(3)
と表せる。
【0039】
また、GOP_TARGETの最小値を次の(4)式のように、
B = GOP_MINBYTES ・・・(4)
とする。
【0040】
すると、図22に示した評価関数のような
Σy = A×Σx + B×n
が得られる。
【0041】
ここで、Σy = SUPPLY_BYTES, Σx = DIFFICULTY_SUM 、n は GOP の総数である。
【0042】
よって A = (SUPPLY_BYTES - B×n)/ DIFFICULTY_SUM となる。すると、各GOP毎のターゲット量は、
GOP_TARGET = A × GOP_DIFF + B ・・・(5)
と表せる。
【0043】
その後、各GOP内で各ピクチャーの符号化難易度に応じたビット配分を行う。GOP内での各ピクチャーの配分を符号化難易度 の大きさに比例させた場合には、各ピクチャーのターゲット量は以下の(6)式で求められる。
【0044】
target(k) = GOP_TARGET × diffuculty(k)/GOP_DIFF ・・・(6)
(1 ≦ k ≦ GOP 内の picture 数)
この場合、素材の中に極端に難しい(GOP_DIFFが大きい)ピクチャーがあると、非常に大きいGOP_TARGET量となってしまい、システムで許容されている最大レートを越えてしまうため、GOP_MAXBYTESといった固定量でリミッタをかけることが必要である。また、最小のターゲット量もGOP_MINBYTESで制限する。具体的には、以下に説明するアルゴリズムによっている。
【0045】
MPEGビデオのエンコード時には、仮想デコーダのバッファ残量を考慮しながらビット配分することが義務付けられている。この仮想バッファ残量の計算をVBV(Video buffering Verifier) という。
【0046】
先ず、図23を用いてVBV計算方法を説明する。この計算の最初のOCCUPANCY_UP(0)は次の(7)式に示すように、固定値(この例では VBVMAX * 2/3 )からスタートする。
【0047】
OCCUPANCY_UP(0) = VBVMAX * 2/3 ・・・(7)
以下の OCCUPANCY_UPはグラフ上の各ピクチャーの上側のポイント、OCCUPANCY_DOWNはグラフ上の各ピクチャーの下側のポイントを意味している。
【0048】
DVDのバッファサイズVBVMAX(1.75Mbits)に対して、k番目のピクチャーのバッファーのスタート点をOccupancy_up(k), k 番目のピクチャーのターゲット量をtarget(k)とすると、ピクチャーにビットを吐き出したあとのバッファー残量 OCCUPANCY_DOWN(k)は後述する(8)式で表される。このバッファーには、デコーダーのピックアップからビデオのデータ量に応じたビットレートのデータ量(SYSTEM_SUPPLY)が蓄積される。この供給後のバッファー残量 OCCUPANCY_UP(k+1) は次の(9)式で表される。
【0049】
OCCUPANCY_DOWN(k) = OCCUPANCY_UP(k) - target(k) ・・・(8)
OCCUPANCY_UP(k+1) = OCCUPANCY_DOWN(k) + SYSTEM_SUPPLY ・・・(9)
この供給後のバッファ残量は、図23の図中の右上に上がる量に相当する。供給されるビットレートが大きいほど傾きは大きくなり、バッファーにデータがたまりやすくなる。バッファがいっぱいになった場合には、ピックアップからバッファーへの供給がストップするため、バッファーのオーバーフローに関しては考慮する必要はない。このことは、ある設定値ちょうどに制御する必要はなく、設定値以上になるように制御すれば良いことを意味している。
【0050】
逆に、各ピクチャーのデータ量が大きいと、バッファにたまったデータは減少する。このバッファー残量が一定値以下にならないようにターゲットビット量を計算する。そして、ビデオのデータ量に応じたビットレートのデータ量のSYSTEM_SUPPLYを、
SYSTEM_SUPPLY = MAXRATE(bps) * KT ・・・(10)
のように求める。
【0051】
図24にGOP単位でのターゲットビット配分計算をおこなった例を示す。図24の(A)は評価関数とGOP_MAXRATE制限を考慮して求めたターゲット量に対して上記VBVバッファ計算をおこなった場合である。ここで、図24の(A)での[1],[4」,「7」のピクチャーでVBVバッファーの下限であるVBVMINの値を下回っている。そこで、VBVがVBVMINを下回ったピクチャーを含むGOPのターゲット量を削減させる。GOP内でVBV制限を加える前のターゲット量でVBV計算を実行したときのOCCUPANCYの最小値をOcc_minとすると調整量は以下の式であらわされる。ここで、制限をおこなうスタート点kstartは、OCCUPANCY_UP(k)が基準値(VBVLINE : たとえば VBVMAX * 3/4) 以上のkの値で、このときのOCCUPANCY_UP(k)の値をOcc_startとする。
OCCUPANCY_MIN< VBVMIN の時
r = (Occ_start - VBVMIN)/ (VBVSTART - Occ_min) ・・・(11)
各ターゲットに対して target(j) = target(j) × r (kstart ≦ j ≦ k) とする。
【0052】
このようにして求められたターゲット量を用いて作成されたコントロールファイルによるエンコード処理を行うことで、素材の画像の難しさに応じた可変ビットレートエンコーディングが実行される。
【0053】
ところで、編集されたビデオ素材では、だんだんと画面を暗くしていき、黒い画面から再びだんだんと画面を明るくして異なるシーンを接続するフェードアウト/フェードインの手法が良く用いられる。
【0054】
図25は、暗い画面からフェードインする場合の説明図である。この内、図25の(a)には、輝度のフレーム単位での平均値DCの変化を示す。例えば、DCは0〜255までの256段階で表され、大きい値ほど明るい状態を示し、小さいほど暗い状態を示す。図25の(b)には、仮エンコードによって測定されたk番目のフレームの符号化難易度(Difficulty)の値gen_bit(k)を示す。画像が難しいほどこの値gen_bit(k)が大きい。例えば、黒い静止画面では、画像が簡単なため、Iピクチャのgen_bitは小さくなる。また、動きがないことと、フレーム相関が非常に大きいため、Pピクチャ、Bピクチャのgen_bitも非常に小さい値となる。
【0055】
図25の(a)に示したフェードインの区間では時間的に前にあるIピクチャより、後ろにあるP,Bピクチャは、DCレベルが異なることからフレーム相関が少なくなるため、図25の(b)に示すように、P,Bピクチャのgen_bitの値は相対的に大きくなる。
【0056】
図25の(e)には、図25の(b)に示したgen_bitによって、I,B,Pピクチャに配分されるターゲットビット量target(k)を示す。また、図25の(f)には、図25の(e)のターゲットビット量target(k)に応じたフェードイン区間のビットレート配分を示す。
【0057】
暗いシーンでは、通常の動画のシーンよりも画像の難しさが小さいため、符号化難易度は、平均的な符号化難易度よりも低い値となる。全体のビットレートの配分は、符号化難易度の値によって決定されるので、このような暗いフェードイン/フェードアウト点でのビットレートは小さくなる。
【0058】
【発明が解決しようとする課題】
しかし、暗い部分での人の視覚感度は高いため、暗い動画でのノイズは知覚されやすく、暗いフェードイン/アウト点でのビットレートの大きさが十分でないとノイズが目立ってしまい問題となってくる。
【0059】
本発明は、上記実情に鑑みてなされたものであり、レート配分計算時に通常処理よりも多くレートを割り当て、フェードイン/フェードアウトポイントの画質を改善できる画像符号化方法及び画像符号化装置の提供を目的とする。
【0060】
【課題を解決するための手段】
本発明に係る画像符号化方法は、上記課題を解決するために、画像フレームの符号化難易度に応じて割り当てビット量を決定する画像符号化方法において、フェードインする区間又はフェードアウトする区間を上記フレーム内の平均輝度のレベルの時間変化に基づいて検出する検出工程と、上記検出工程で検出したフェードインする区間又はフェードアウトする区間にあっては上記符号化難易度を高く補正する補正工程と、上記補正工程で補正した符号化難易度に応じて上記割り当てビット量を演算するビット量演算工程とを備える。
【0061】
本発明に係る画像符号化装置は、上記課題を解決するために、画像フレームの符号化難易度に応じて割り当てビット量を決定する画像符号化装置において、フェードインする区間又はフェードアウトする区間を上記フレーム内の平均輝度のレベルの時間変化に基づいて検出する検出手段と、上記検出手段で検出したフェードインする区間又はフェードアウトする区間にあっては上記符号化難易度を高く補正する補正手段と、上記補正手段で補正した符号化難易度に応じて上記割り当てビット量を演算するビット量演算手段とを備える。
【0069】
【発明の実施の形態】
以下、本発明に係る画像符号化方法及び装置の実施の形態について図面を参照しながら説明する。
【0070】
この実施の形態は、例えばディジタルビデオカセットテープに記録されたビデオ素材をディジタルビデオディスク(Digital Video Disk:DVD)用に、2パスエンコーディング方法を採用してエンコードするためのビデオエンコードシステムであり、図1に示すような構成である。
【0071】
このビデオエンコードシステムは、上記図16に示したビデオエンコードシステムと基本的に構成を同じにしているが、ビデオエンコードコントーローラ20内部でのビット配分計算処理動作を従来と異ならせている。
【0072】
この図1に示したビデオエンコードシステムは、ビデオ素材のフレーム内平均輝度のレベルと時間変化量から、暗い部分を介して明暗が変化する区間、例えばフェードイン/フェードアウト区間を検出し、これらの区間の画像の難しさを表す符号化難易度の値に重み係数を乗じて符号化難易度を補正し、この補正した符号化難易度に応じて全体のビットレートを割り当てる画像符号化方法を適用したプログラムに従って、図2に示すようなビット配分計算処理を行う。このビット配分計算処理は、MPEGエンコーダコントローラ23によって制御されて、ビット配分計算部22で実行される。
【0073】
このビット配分計算処理を図2のフローチャートにしたがって以下に説明する。
【0074】
この図2に示すビット配分計算処理は、上記図19に示したフローチャートのステップS15とステップS16との間に、ステップS20としてフェードイン/フェードアウト点でのDifficultyの重み付け処理工程を設けている。
【0075】
以下、このステップS20でのフェードイン/フェードアウト点でのDifficultyの重み付け処理工程を説明する。
【0076】
このステップS20では、ビデオ素材である入力画像の平均輝度のレベルの時間変化、GOP内のIピクチャの符号化難易度Difficultyの割合によってフェードイン/フェードアウトの区間を検出し、この区間の符号化難易度に重み係数を乗じて符号化難易度を補正している。
【0077】
そして、次のステップS16で、この補正した符号化難易度に応じて、ターゲットビット量を計算し、全体のビットレートを割り当ててビットレートが極端に小さくならないように保護する。
【0078】
このステップS20とステップS16での処理手順について暗い画面からフェードインする場合を具体例として図3を用いて説明する。
【0079】
図3の(a)には、DC値の変化を示す。図3の(b)には、仮エンコードによって測定されたk番目のフレームの符号化難易度(Difficulty)の値のgen_bit(k)を示す。図3の(c)には、重み付け係数rate_ctlを示す。図3の(d)には、上記重み付け係数rate_ctlによって補正されたk番目のフレームの符号化難易度の値gen_bit(k)を示す。図3の(e)には、図3の(d)に示した補正後のgen_bit(k)によって、I,B,Pピクチャに配分されるターゲットビット量target(k)を示す。また、図3の(f)には、図3の(e)のターゲットビット量target(k)に応じたフェードイン区間のビットレート配分を示す。
【0080】
図2のステップS20で、フレーム内平均輝度のレベルと時間変化量から、図3の(a)に示したフェードイン区間を検出し、図3の(b)に示した画像の難しさを表す符号化難易度の値gen_bit(k)に、図3の(c)に示す重み係数rate_ctlを乗じて、符号化難易度値を補正して図3の(d)に示すような補正符号化難易度値gen_bit(k)を求める。ここでは、フェードイン区間の重み係数rate_ctlを初期値(1)より大きくして補正符号化難易度値gen_bit(k)を求めている。
【0081】
そして、図2のステップS16で、図3の(d)に示した補正符号化難易度値gen_bit(k)を基にターゲット量を割り当ててやれば、図3の(f)に示すように平均ビットレートに十分近いビットレートを確保できる。
【0082】
上記ステップS20のフェードイン/フェードアウト点でのdifficultyの重み付け処理工程は、図4に示すようなステップS21〜ステップS24となる。
【0083】
ステップS21では、GOP単位の各パラメータの測定や、重み係数の初期化を行う。後述するステップS22でのフェードイン点の検出や、ステップS23でのフェードアウト点の検出には、平均輝度としてGOP単位でのDC値の平均値avr_dcと、GOP内のIピクチャの符号化難易度の割合としてBピクチャとIピクチャの符号化難易度の比率b_rateを用いている。これらavr_dcや、b_rateを求めるため、予めGOP単位の各パラメータを測定しておく必要がある。
【0084】
例えば、j(1≦j≦total_gopnb)番目のGOPのDC値の平均値を表すavr_dc[j]は、gop_dcをGOP単位のDC値の和とし、gop_pcntをGOP内のピクチャ数とするとき、avr_dc=gop_dc/gop_pcntで表せる。ここで、total_gopnbはGOPの総数を表す。
【0085】
また、j番目のGOPのBピクチャとIピクチャの符号化難易度difficultyの比率を表すb_rate[j]は、b_bitsをGOP内のBピクチャのdifficultyの値の和とし、b_nbをGOP内のBピクチャの数とし、i_bitsをGOP内のIピクチャのdifficultyの値とするとき、b_rate=b_bits/b_nb/i_bitsで表せる。
【0086】
また、仮エンコードによって測定されたdifficultyのGOP単位での和の平均値である後述するavr_gop_genbitは、gop_genbit[j]をj番目のGOPの仮エンコードによって測定されたdifficultyのGOP単位での和とするとき、avr_gop_genbit=Σgop_genbit/total_gopnbで表せる。
【0087】
また、j番目のGOPのdifficultyの重み係数を表すrate_ctl[j]は、初期値の際に1.0に設定される。
【0088】
また、GOPのスタートを表すgop_start[k]は、最初からk番目のフレームがGOPの先頭の場合“1”とし、それ以外は“0”とする。
【0089】
次ぎに、ステップS22ではフェードイン点の検出と重み係数rate_ctl[j]の算出を行い、ステップS23では、フェードアウト点の検出と重み係数rate_ctl[j]の算出を行う。
【0090】
そして、ステップS24では、GOPの仮エンコードによって測定されたgop_genbitに上記それぞれの重み係数rate_ctl[j]を乗算してdifficultyの重み付けを行い、GOPの補正符号化難易度値gop_genbitを求める。
【0091】
ステップS22のフェードイン点の検出、重み係数の算出処理工程や、ステップS23でのフェードアウト点の検出、重み係数の算出処理工程では、一般的にフェードイン、フェードアウトの速度が一定ではないので、例えばゆっくりと変化する場合と、通常の早さで変化する場合とで、各点の検出方法を異ならせる。
【0092】
実際のビデオ素材の編集時には、例えば黒い画面からタイトルをゆっくり表示したり、夕陽をゆっくり沈ませて暗くするような、ゆっくりなだらかに暗い部分を介して明暗を変化させる場合と、場面を変えるのに短時間で明るい画面から暗い画面にし、さらに次の明るい画面に変化させるような通常に明暗を変化させる場合がある。
【0093】
以下、このなだらかに暗い部分を介して明暗を変化させる場合と、通常に明暗を変化させる場合とに分けて、上記フェードイン区間及び上記フェードアウト区間でのフェードイン点及びフェードアウト点の検出と、重み係数の算出処理を説明する。
【0094】
図5には、ステップS34になだらかに変化するフェードイン点の検出処理工程と、ステップS35に通常の速度で変化するフェードイン点の検出処理工程とを併せ持つフェードイン点の検出処理のフローチャートを示す。
【0095】
先ず、ステップS31では、入力するビデオ素材の初期設定をk=j=0、fstart=j、fmode=0として行う。そして、ステップS32で、GOPの始まりを検出した時点から、ステップS34のなだらかに変化するフェードイン点の検出処理工程と、ステップS35の通常に変化するフェードイン点の検出処理工程を実行する。そして、これらの検出処理工程を、ステップS36及びステップS37での処理及び判定を介して繰り返す。
【0096】
上記ステップS34に示したなだらかなフェードイン点の検出処理工程を、サブルーチンを示す図6とタイミングチャートを示す図7を用いて説明する。
【0097】
ここでは、例えば、DC_LOW=25、DC_HIGH=70、第1のしきい値DELTA1=-5、第2のしきい値DELTA2=10、定数k1=0.8、定数k2=1.0、RATE_UP=3.0、BR_DELTA=50と設定する。
【0098】
図7のタイミングチャートでは、(a)が平均輝度のレベルDCの変化を示す。また(b)がGOPのDC値の平均値AVR_DCの変化を示す。この(b)にはDC_LOWと、DC_HIGHとが破線で記されている。また、(c)がGOPのBピクチャとIピクチャの比率b_rate(図中B/Iと記す)の変化を示す。また、(d)がGOP単位のモードfmodeの変化を示す。
【0099】
このようなゆっくりと立ち上がるフェードインの区間のGOPでは、隣接するGOPとの画像の差が小さいため、上記図7の(c)に示すようなb_rateの大きさも急激には変化しない。そこで、このような場合には、上記図7の(c)に示すようなb_rateを用いずに、図7の(b)に示すようなavr_dcの値の変化だけで上記フェードイン区間を検出する。
【0100】
先ず、図6のステップS41で、連続する2つのGOPのavr_dcの値が、DC_LOW以下であるか否かを判定し、共に以下であればステップS42に進みfmode=1とし、この位置のGOP番号(j)をフェードイン点fstart=jとする。
【0101】
また、ステップS43では1つ前のGOPのavr_dcとの変化量が予め設定されている第1のしきい値DELTA1以下であるか否かを判定し、以下であればステップS42に進みfmode=1とし、この位置のGOP番号(j)をフェードイン点fstart=jとする。
【0102】
また、ステップS44では1つ前のGOPのavr_dcとの変化量が上記第1のしきい値DELTA1と第2のしきい値DELTA2との間にあるか否かを判定し、間にあればステップS45に進みfmodeを2とする。
【0103】
そうでない場合には、fmode=1とし、その位置のGOP番号(j)に対してfstart=jとする。
【0104】
ステップS46及びステップS47を通して、fmodeが2の時に、avr_dcがDC_HIGH以上になったか否かを判定し、以上になればステップS48及びステップS49を通して、fstartからその位置までのGOPの重み係数rate_ctl[i]をavr_gop_genbit/gop_genbit[i]*k1として求める。重み係数rate_ctl[i]の大きさはステップS50〜ステップS53を介して1.0〜RATE_UPの範囲に制限される。
【0105】
そして、これらの処理は、ステップS54及びステップS55を通して繰り返され、j番目までいったら、ステップS56でfmode=1として、図5のステップS35に進む。
【0106】
この図6に示したゆっくりしたフェードイン点の検出処理では、重み係数rate_ctlは、初期設定値を1としたときに、ステップS49に示したように、GOP単位のdifficultyと、平均値との比率に定数k1を乗じた値となる。
【0107】
もし、重み係数の値を2倍といった固定値に設定すると、補正されたdifficultyが大きくなりすぎ、不必要な大きさまでビットレートが配分される可能性がある。また、全体のdifficultyの分布によっては、2倍では不十分なこともあり得る。
【0108】
そこで、本発明の画像符号化方法によって重み係数を決定することで、補正されて配分されたレートは平均ビットレートの近傍の値になるため、過小、過度にレートが補正されることがなくなる。
【0109】
次ぎに、上記図5のステップS35に示した通常に変化するフェードイン点の検出処理工程を、サブルーチンを示す図8とタイミングチャートを示す図9を用いて説明する。
【0110】
ここでも、例えば、DC_LOW=25、DC_HIGH=70、第1のしきい値DELTA1=-5、第2のしきい値DELTA2=10、定数k1=0.8、定数k2=1.0、RATE_UP=3.0、BR_DELTA=50と設定する。
【0111】
図9のタイミングチャートでも、(a)が平均輝度のレベルDCの変化を示す。また(b)がGOPのDC値の平均値AVR_DCの変化を示す。この(b)にはDC_LOWと、DC_HIGHとが破線で記されている。また、(c)がGOPのBピクチャとIピクチャの比率b_rate(図中B/Iと記す)の変化を示す。
【0112】
このような通常の速度で立ち上がるフェードイン区間のGOPでは、隣接するGOPとの画像の差が大きい。図9の(b)に示したavr_dcがDC_LOWを下回るような、黒い静止画面では、動きがないことと、フレーム相関が非常に大きいため、P,Bピクチャのgen_bitも非常に小さくなることから図9の(c)に示すようにb_rateの値が非常に小さくなる。また、フェードインの区間では、時間的に前にあるIピクチャと、後ろにあるP,BピクチャとのDCレベルが異なることからフレーム相関が少なくなり、P,Bピクチャのgen_bitの値は相対的に大きくなる。よって、b_rateの値が非常に大きくなる。このため、図9の(c)に示すb_rateの変化量と、図9の(b)に示すavr_dcの値でフェードイン区間を決定することができる。
【0113】
先ず、図8のステップS61で、現在のGOPのb_rateと1つ前のGOPのb_rateの差がBRのしきい値BR_DELTAより大きく、かつ1つ前のGOPのavr_dcの値がDC_LOW以下であるか否かを判定し、YESのときにはその位置からのGOPの区間の重み係数rate_ctlを、ステップS62を介したステップS63で、rate_ctl[i]=avr_gop_genbit/gop_genbit[i]*k2として求める。
【0114】
重み係数の大きさは、ステップS64〜ステップS67を通して、1.0〜RATE_UPの範囲に制限される。そして、ステップS68及びステップS69の処理及び判定を通して、上記重み係数をフェードイン点から2個後ろまでのGOPの区間で計算する。
【0115】
次ぎに、図10には、ステップS74になだらかに変化するフェードアウト点の検出処理工程と、ステップS75に通常の速度で変化するフェードアウト点の検出処理工程とを併せ持つフェードアウト点の検出処理のフローチャートを示す。
【0116】
先ず、ステップS71では、入力するビデオ素材の初期設定をk=kend、j=gop_pcnt、fstart=j、i_flag=fmode=0として行う。そして、ステップS72で、GOPの始まりを検出した時点から、jを時間的に後ろから見ていき、ステップS74のなだらかに変化するフェードアウト点の検出処理工程と、ステップS75の通常に変化するフェードアウト点の検出処理工程を実行する。そして、これらの検出処理工程を、ステップS76及びステップS77での処理及び判定を介して繰り返す。
【0117】
上記ステップS74に示したなだらかなフェードアウト点の検出処理工程を、サブルーチンを示す図11とタイミングチャートを示す図11を用いて説明する。
【0118】
ここでも、例えば、DC_LOW=25、DC_HIGH=70、第1のしきい値DELTA1=-5、第2のしきい値DELTA2=10、定数k1=0.8、定数k2=1.0、RATE_UP=3.0、BR_DELTA=50と設定する。
【0119】
図12のタイミングチャートでは、(a)が平均輝度のレベルDCの変化を示す。また(b)がGOPのDC値の平均値AVR_DCの変化を示す。この(b)にはDC_LOWと、DC_HIGHとが破線で記されている。また、(c)がGOPのBピクチャとIピクチャの比率b_rate(図中B/Iと記す)の変化を示す。また、(d)がGOP単位のモードfmodeの変化を示す。
【0120】
このようなゆっくりと立ち下がるフェードアウトの区間のGOPでは、隣接するGOPとの画像の差が小さいため、上記図12の(c)に示すようなb_rateの大きさも急激には変化しない。そこで、このような場合には、上記図12の(c)に示すようなb_rateを用いずに、図12の(b)に示すようなavr_dcの値の変化だけで上記フェードアウト区間を検出する。
【0121】
先ず、図11のステップS81では、時間的に後ろのGOPから順にサーチしていき、連続する2つのGOPのavr_dcの値、すなわち現在のGOPのavr_dcと一つ後ろのGOPのavr_dcが共に、DC_LOW以下であるか否かを判定し、共に以下であればステップS82に進み現在のGOPのfmode=1とし、この位置のGOP番号(j)をfstart=jとする。
【0122】
また、ステップS83では1つ後ろのGOPのavr_dcとの変化量が予め設定されている第1のしきい値DELTA1以下であるか否かを判定し、以下であればステップS82に進みfmode=1とし、この位置のGOP番号(j)をfstart=jとする。
【0123】
また、ステップS84では1つ後ろGOPのavr_dcとの変化量が上記第1のしきい値DELTA1と第2のしきい値DELTA2との間にあるか否かを判定し、間にあればステップS85に進みfmodeを2とする。
【0124】
そうでない場合には、fmode=1とし、その位置のGOP番号(j)に対してfstart=jとする。
【0125】
ステップS86及びステップS87を通して、fmodeが2の時に、avr_dcがDC_HIGH以上になったか否かを判定し、以上になればステップS88及びステップS89を通して、fstartからその位置までのGOPの重み係数rate_ctl[i]をavr_gop_genbit/gop_genbit[i]*k1として求める。重み係数rate_ctl[i]の大きさはステップS90〜ステップS93を介して1.0〜RATE_UPの範囲に制限される。
【0126】
そして、これらの処理は、ステップS94及びステップS95を通して繰り返され、j番目までいったら、ステップS96でfmode=1として、図10のステップS75に進む。
【0127】
この図11に示したゆっくりしたフェードアウト点の検出処理では、重み係数rate_ctlは、初期設定値を1としたときに、ステップS89に示したように、GOP単位のdifficultyと、平均値との比率に定数k1を乗じた値とする。
【0128】
もし、重み係数の値を2倍といった固定値に設定すると、補正されたdifficultyが大きくなりすぎ、不必要な大きさまでビットレートが配分される可能性がある。また、全体のdifficultyの分布によっては、2倍では不十分なこともあり得る。
【0129】
そこで、本発明の画像符号化方法によって重み係数を決定することで、補正されて配分されたレートは平均ビットレートの近傍の値になるため、過小、過度にレートが補正されることがなくなる。
【0130】
次ぎに、上記図10のステップS75に示した通常に変化するフェードアウト点の検出処理工程を、サブルーチンを示す図13とタイミングチャートを示す図14を用いて説明する。
【0131】
ここでも、例えば、DC_LOW=25、DC_HIGH=70、第1のしきい値DELTA1=-5、第2のしきい値DELTA2=10、定数k1=0.8、定数k2=1.0、RATE_UP=3.0、BR_DELTA=50と設定する。
【0132】
図14のタイミングチャートでも、(a)が平均輝度のレベルDCの変化を示す。また(b)がGOPのDC値の平均値AVR_DCの変化を示す。この(b)にはDC_LOWと、DC_HIGHとが破線で記されている。また、(c)がGOPのBピクチャとIピクチャの比率b_rate(図中B/Iと記す)の変化を示す。また、(d)がGOP単位のモードfmodeの変化を示す。
【0133】
このような通常の速度で立ち下がるフェードアウトの場合には、フェードインの区間での場合と異なり、フェードアウト点では、図14の(c)に示すb_rateの変化量がそれほど大きくならないため、フェードインの場合と同じ方法では検出が難しい。
【0134】
そこで、先ず、図14の(b)に示すavr_dc値と図14の(c)に示すb_rateの変化量からフェードインの位置を検出し、そこから時間的に最も近い位置で、図14の(b)に示すavr_dcの変化量が第2のしきい値DELTA2以上になったところをフェードアウト点としている。
【0135】
先ず、図13のステップS101で、一つ後ろのGOPのb_rateと現在のGOPのb_rateとの差がBRのしきい値BR_DELTAより大きく、かつ現在のGOPのavr_dcの値がDC_LOW以下であるか否かを判定し、YESのときにはその位置がフェードイン点であるとしてステップS102でi_flag=1とする。
【0136】
ステップS103では、i_flag=1である1つ後ろのGOPのavr_dcとの変化量が第2のしきい値DELTA2より大きいか否かを判定し、YESのときにはステップS104及びステップS105を通して、その位置をフェードアウト点であると判断し、GOPの重み係数rate_ctlを、rate_ctl[i]=avr_gop_genbit/gop_genbit[i]*k2として求める。
【0137】
重み係数の大きさは、ステップS106〜ステップS109を通して、1.0〜RATE_UPの範囲に制限される。そして、ステップS110及びステップS111の処理及び判定を通して、フェードアウト点から3個前までのGOPの区間の重み係数を計算する。
【0138】
このように、図4に示した、ステップS22でのフェードイン点の検出、重み係数の算出処理工程、及びステップS23でのフェードアウト点の検出、重み係数の算出処理工程により、上記図5〜図14を参照して説明したようにして、各重み係数が算出された後には、各重み係数を用いてステップS24でdifficultyの重み付けが行われる。
【0139】
このdifficultyの重み付け処理工程のサブルーチンを図15に示す。先ず、ステップS121でk=j=0としてから、ステップS122でgop_start[k]が1になったか否かを判定してGOPの先頭を検出する。
【0140】
そして、ステップS123及びステップS124を通して、仮エンコードによって得られたgop_genbitに上記各重み付け係数rate_ctlを乗算し、重み付けしたdifficultyを算出する。そして、ステップS125及びステップS126を通して、この算出処理が繰り返され、ステップS127を介したステップS128での判定により最後のフレームまで処理が繰り返されたのが分かると終了する。
【0141】
その後、上記図2のステップS16に進み、上記図4のステップS24で得られた補正符号化難易度に応じて、ターゲットビット量を計算し、全体のビットレートを割り当ててビットレートが極端に小さくならないように保護する。
【0142】
なお、上記画像符号化方法による圧縮画像信号が記録された記録媒体は、暗い部分を介して明暗が変化する区間を上記フレーム内の平均輝度のレベルの変化に基づいて検出し、上記明暗が変化する区間における上記符号化難易度を補正し、上記補正した符号化難易度に応じて上記割り当てビット量を決定した画像を記録しているので、フェードイン/アウト時でも画質の劣化を生じさせない。
【0143】
また、上記画像符号化方法により符号化された画像情報を記録媒体に記録するのではなく、例えば有線回線などの伝送路を用いて伝送する画像伝送方法においては、少なくとも一つのフレーム内符号化画像と、フレーム間順方向予測符号化画像及び双方向予測符号化画像を含んで構成される画像符号化グループ単位での平均輝度の時間変化に基づいて、暗い部分を介して明暗が変化する区間を検出し、この区間における上記符号化難易度を補正し、この補正した符号化難易度に応じて上記割り当てビット量を決定するので、フェードイン/アウト時でも画質の劣化を生じさせないで伝送できる。
【0144】
【発明の効果】
本発明に係る画像符号化方法及び装置は、例えばDVD等の圧縮されたビデオ信号をパッケージメディアに蓄積させるエンコードシステムにおいて、エンコード素材からフェードイン/フェードアウト点を検出して重み付けすることで、レート配分時に通常処理よりも多くのレートを割り当て、フェードイン/フェードアウトポイントの画質を改善することができる。
【図面の簡単な説明】
【図1】本発明に係る画像符号化方法及び装置の実施の形態となるビデオエンコードシステムの具体例のブロック図である。
【図2】上記ビデオエンコードシステムに使われるビデオエンコードコントローラ内部のビット配分計算部の実行するビット配分計算処理プログラムを説明するためのフローチャートである。
【図3】 上記実施の形態となるビデオエンコードシステムの全体的な動作を説明するためのタイミングチャートである。
【図4】上記ビデオエンコードシステムにおけるフェードイン/フェードアウト点でのDIFFICULTYの重み付け処理を説明するためのフローチャートである。
【図5】上記ビデオエンコードシステムによるフェードイン点の検出処理工程を説明するためのフローチャートである。
【図6】上記ビデオエンコードシステムによるゆっくりとしたフェードインポイント検出処理工程を説明するためのフローチャートである。
【図7】ゆっくりと立ち上がるフェードイン点の検出処理を説明するためのタイミングチャートである。
【図8】上記ビデオエンコードシステムによる通常のフェードインポイント検出処理工程を説明するためのフローチャートである。
【図9】通常のフェードイン点の検出処理を説明するためのタイミングチャートである。
【図10】上記ビデオエンコードシステムによるフェードアウト点の検出処理工程を示すフローチャートである。
【図11】ゆっくりとしたフェードアウトポイント検出処理工程を説明するためのフローチャートである。
【図12】ゆっくりと立ち下がるフェードアウト点の検出処理工程を説明するためのフローチャートである。
【図13】通常のフェードアウトポイント検出処理を説明するためのフローチャートである。
【図14】通常のフェードアウトポイントの検出処理を説明するためのタイミングチャートである。
【図15】フェードイン/フェードアウト点でのdifficultyの重み付け処理工程を説明するためのフローチャートである。
【図16】従来のビデオエンコードシステムの具体例のブロック図である。
【図17】GOP構造を説明するための図である。
【図18】上記従来のビデオエンコードシステムにおけるエンコード処理を説明するためのフローチャートである。
【図19】上記図18に示したエンコード処理におけるビット配分計算処理を説明するためのフローチャートである。
【図20】シーンチェンジ指定によるピクチャタイプの変更を説明するための図である。
【図21】チャプター指定によるピクチャタイプの変更を説明するための図である。
【図22】GOP単位の評価関数の例を示す特性図である。
【図23】VBVの計算方法を説明するための特性図である。
【図24】ターゲットビット配分の具体例を示す図である。
【図25】従来のビデオエンコードシステムによるフェードイン区間でのレート配分処理を説明するためのタイミングチャートである。
【符号の説明】
1 スーパーバイザコントローラ、20 ビデオエンコードコントローラ、22 ビット配分計算部、23 MPEGエンコーダコントローラ、25 MPEGエンコーダ
Claims (24)
- 画像フレームの符号化難易度に応じて割り当てビット量を決定する画像符号化方法において、
フェードインする区間又はフェードアウトする区間を上記フレーム内の平均輝度のレベルの時間変化に基づいて検出する検出工程と、
上記検出工程で検出したフェードインする区間又はフェードアウトする区間にあっては上記符号化難易度を高く補正する補正工程と、
上記補正工程で補正した符号化難易度に応じて上記割り当てビット量を演算するビット量演算工程と
を備えることを特徴とする画像符号化方法。 - 上記補正工程は、上記検出工程で検出したフェードインする区間又はフェードアウトする区間にあっては初期値より大きい重み係数を上記符号化難易度に乗じて当該符号化難易度を高く補正することを特徴とする請求項1記載の画像符号化方法。
- 上記検出工程が検出するフェードインする区間又はフェードアウトする区間は、複数の画像フレームからなる画像符号化グループの数個分のゆっくりとした時間であることを特徴とする請求項1記載の画像符号化方法。
- 上記検出工程は、少なくとも一つのIピクチャと、Pピクチャ及びBピクチャを含んで構成される画像符号化グループ単位での平均輝度の時間変化に基づいて、フェードインする区間又はフェードアウトする区間を検出する
ことを特徴とする請求項1記載の画像符号化方法。 - 上記補正工程は、上記検出工程で検出したフェードインする区間又はフェードアウトする区間にあっては初期値より大きい重み係数を上記符号化難易度に乗じて当該符号化難易度を高く補正することを特徴とする請求項4記載の画像符号化方法。
- 上記補正工程は、上記重み係数の大きさを、対象となる上記画像符号化グループ単位の符号化難易度の和と、全体の画像符号化グループでの符号化難易度の和の平均値との比を基にして算出することを特徴とする請求項5記載の画像符号化方法。
- 上記検出工程が検出するフェードインする区間又はフェードアウトする区間は、上記画像符号化グループの時間長さの数倍程度の時間であることを特徴とする請求項4記載の画像符号化方法。
- 上記検出工程は、少なくとも一つのIピクチャと、Pピクチャ及びBピクチャを含んで構成される画像符号化グループであって相互に隣接する画像符号化グループ間の画像の差が小さいときに画像符号化グループ単位での平均輝度の時間変化に基づいて上記フェードインする区間又はフェードアウトする区間を検出することを特徴とする請求項1記載の画像符号化方法。
- 上記検出工程は、少なくとも一つのIピクチャと、Pピクチャ及びBピクチャを含んで構成される画像符号化グループであって相互に隣接する画像符号化グループ間の画像の差が大きいときには画像符号化グループ単位での平均輝度の時間変化と、画像符号化グループ単位でのIピクチャの符号化難易度の比率の時間変化とに基づいて上記フェードインする区間又はフェードアウトする区間を検出することを特徴とする請求項1記載の画像符号化方法。
- 上記補正工程は、上記検出工程で検出したフェードインする区間又はフェードアウトする区間にあっては初期値より大きい重み係数を上記符号化難易度に乗じて当該符号化難易度を高く補正することを特徴とする請求項9記載の画像符号化方法。
- 上記補正工程は、上記重み係数の大きさを、対象となる上記画像符号化グループ単位の符号化難易度の和と、全体の画像符号化グループでの符号化難易度の和の平均値との比を基にして算出することを特徴とする請求項10記載の画像符号化方法。
- 上記検出工程が検出するフェードインする区間又はフェードアウトする区間は、上記画像符号化グループの時間長さの数倍程度の時間であることを特徴とする請求項8記載の画像符号化方法。
- 画像フレームの符号化難易度に応じて割り当てビット量を決定する画像符号化装置において、
フェードインする区間又はフェードアウトする区間を上記フレーム内の平均輝度のレベルの時間変化に基づいて検出する検出手段と、
上記検出手段で検出したフェードインする区間又はフェードアウトする区間にあっては上記符号化難易度を高く補正する補正手段と、
上記補正手段で補正した符号化難易度に応じて上記割り当てビット量を演算するビット量演算手段と
を備えることを特徴とする画像符号化装置。 - 上記補正手段は、上記検出手段で検出したフェードインする区間又はフェードアウトする区間にあっては初期値より大きい重み係数を上記符号化難易度に乗じて当該符号化難易度を高く補正することを特徴とする請求項13記載の画像符号化装置。
- 上記検出手段が検出するフェードインする区間又はフェードアウトする区間は、複数の画像フレームからなる画像符号化グループの数個分のゆっくりとした時間であることを特徴とする請求項13記載の画像符号化装置。
- 上記検出手段は、少なくとも一つのIピクチャと、Pピクチャ及びBピクチャを含んで構成される画像符号化グループ単位での平均輝度の時間変化に基づいて、フェードインする区間又はフェードアウトする区間を検出する
ことを特徴とする請求項13記載の画像符号化装置。 - 上記補正手段は、上記検出手段で検出したフェードインする区間又はフェードアウトする区間にあっては初期値より大きい重み係数を上記符号化難易度に乗じて当該符号化難易度を高く補正することを特徴とする請求項16記載の画像符号化装置。
- 上記補正手段は、上記重み係数の大きさを、対象となる上記画像符号化グループ単位の符号化難易度の和と、全体の画像符号化グループでの符号化難易度の和の平均値との比を基にして算出することを特長とする請求項17記載の画像符号化装置。
- 上記検出手段が検出するフェードインする区間又はフェードアウトする区間は、上記画像符号化グループの時間長さの数倍程度の時間であることを特徴とする請求項16記載の画像符号化装置。
- 上記検出手段は、少なくとも一つのIピクチャと、Pピクチャ及びBピクチャを含んで構成される画像符号化グループであって相互に隣接する画像符号化グループ間の画像の差が小さいときに画像符号化グループ単位での平均輝度の時間変化に基づいて上記フェードインする区間又はフェードアウトする区間を検出することを特徴とする請求項13記載の画像符号化装置。
- 上記検出手段は、少なくとも一つのIピクチャと、Pピクチャ及びBピクチャを含んで構成される画像符号化グループであって相互に隣接する画像符号化グループ間の画像の差が大きいときには画像符号化グループ単位での平均輝度の時間変化と、画像符号化グループ単位でのIピクチャの符号化難易度の比率の時間変化とに基づいて上記フェードインする区間又はフェードアウトする区間を検出することを特徴とする請求項13記載の画像符号化装置。
- 上記補正手段は、上記検出手段で検出したフェードインする区間又はフェードアウトする区間にあっては初期値より大きい重み係数を上記符号化難易度に乗じて当該符号化難易度を高く補正することを特徴とする請求項21記載の画像符号化装置。
- 上記補正手段は、上記重み係数の大きさを、対象となる上記画像符号化グループ単位の符号化難易度の和と、全体の画像符号化グループでの符号化難易度の和の平均値との比を基にして算出することを特徴とする請求項22記載の画像符号化装置。
- 上記検出手段が検出するフェードインする区間又はフェードアウトする区間は、上記画像符号化グループの時間長さの数倍程度の時間であることを特徴とする請求項21記載の画像符号化装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14430697A JP3911768B2 (ja) | 1997-06-02 | 1997-06-02 | 画像符号化方法及び画像符号化装置 |
US09/950,764 US20020031178A1 (en) | 1997-06-02 | 2001-09-12 | Video encoding method and apparatus, recording medium, and video transmission method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14430697A JP3911768B2 (ja) | 1997-06-02 | 1997-06-02 | 画像符号化方法及び画像符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10336641A JPH10336641A (ja) | 1998-12-18 |
JP3911768B2 true JP3911768B2 (ja) | 2007-05-09 |
Family
ID=15359021
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP14430697A Expired - Fee Related JP3911768B2 (ja) | 1997-06-02 | 1997-06-02 | 画像符号化方法及び画像符号化装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20020031178A1 (ja) |
JP (1) | JP3911768B2 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001245303A (ja) | 2000-02-29 | 2001-09-07 | Toshiba Corp | 動画像符号化装置および動画像符号化方法 |
US7609767B2 (en) | 2002-05-03 | 2009-10-27 | Microsoft Corporation | Signaling for fading compensation |
US7277486B2 (en) * | 2002-05-03 | 2007-10-02 | Microsoft Corporation | Parameterization for fading compensation |
US7463684B2 (en) * | 2002-05-03 | 2008-12-09 | Microsoft Corporation | Fading estimation/compensation |
US7940843B1 (en) * | 2002-12-16 | 2011-05-10 | Apple Inc. | Method of implementing improved rate control for a multimedia compression and encoding system |
JP3873917B2 (ja) * | 2003-03-14 | 2007-01-31 | セイコーエプソン株式会社 | 画像処理装置、画像処理方法、及び画像処理プログラム |
CN100479511C (zh) | 2003-04-04 | 2009-04-15 | 日本胜利株式会社 | 音频/视频记录装置、记录方法、再现装置、再现方法 |
US8009739B2 (en) * | 2003-09-07 | 2011-08-30 | Microsoft Corporation | Intensity estimation/compensation for interlaced forward-predicted fields |
JP3894948B2 (ja) * | 2004-06-21 | 2007-03-22 | 三菱電機株式会社 | 動画像符号化装置及び動画像記録装置 |
JP5023780B2 (ja) * | 2007-04-13 | 2012-09-12 | ソニー株式会社 | 画像処理装置および画像処理方法、並びにプログラム |
US8269885B2 (en) * | 2009-04-03 | 2012-09-18 | Samsung Electronics Co., Ltd. | Fade in/fade-out fallback in frame rate conversion and motion judder cancellation |
JP2011254240A (ja) * | 2010-06-01 | 2011-12-15 | Sony Corp | 画像処理装置、画像処理方法およびプログラム |
KR101601788B1 (ko) * | 2011-10-11 | 2016-03-21 | 텔레호낙티에볼라게트 엘엠 에릭슨(피유비엘) | 비디오 시퀀스들에서 인지 품질 평가를 위한 장면 변경 검출 |
US10942816B1 (en) * | 2018-09-06 | 2021-03-09 | NortonLifeLock Inc. | Systems and methods for dynamically adjusting a backup policy |
KR102352077B1 (ko) * | 2020-08-31 | 2022-01-18 | 주식회사 핀그램 | 고속 동영상 부호화 방법 및 시스템 |
-
1997
- 1997-06-02 JP JP14430697A patent/JP3911768B2/ja not_active Expired - Fee Related
-
2001
- 2001-09-12 US US09/950,764 patent/US20020031178A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20020031178A1 (en) | 2002-03-14 |
JPH10336641A (ja) | 1998-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3911768B2 (ja) | 画像符号化方法及び画像符号化装置 | |
JP3465272B2 (ja) | デジタルデータ記録装置および記録方法 | |
JP3953574B2 (ja) | 番組符号化装置及び記録装置 | |
JP3740813B2 (ja) | 画像符号化方法および画像符号化装置 | |
JP3529599B2 (ja) | 符号化装置における編集可能点挿入方法および符号化装置 | |
JP3837889B2 (ja) | エンコード方法およびエンコード装置 | |
US20060153539A1 (en) | Motion image recording device | |
US20080232784A1 (en) | Method and Apparatus for Controlling the Insertion of Additional Fields or Frames Into a First Format Picture Sequence in Order to Construct Therefrom a Second Format Picture Sequence | |
JP4650454B2 (ja) | 符号化装置及び符号化方法 | |
JP3951152B2 (ja) | 画像符号化装置および方法 | |
JPH10304372A (ja) | 画像符号化方法および装置、画像伝送方法 | |
JP4710108B2 (ja) | 画像信号符号化方法及び装置 | |
JPH08223530A (ja) | 映像記録/再生方法および映像再生装置 | |
JPH10304375A (ja) | 画像符号化方法及び装置並びに記録媒体並びに画像伝送方法 | |
JP4161385B2 (ja) | 画像符号化方法及び装置並びに画像処理装置及び画像処理方法 | |
JP4423216B2 (ja) | 画像処理装置 | |
JP3089990B2 (ja) | 高速サーチ画像再生装置及びその方法 | |
JP3558384B2 (ja) | 映像記録再生方法 | |
JP4423215B2 (ja) | 画像処理装置 | |
JPH1198499A (ja) | 画像符号化装置および画質予測方法 | |
JP3307367B2 (ja) | 可変転送レート符号化装置 | |
JP4423214B2 (ja) | 画像処理装置 | |
JPH08331556A (ja) | 画像符号化装置および画像符号化方法 | |
JP3804155B2 (ja) | 画像検出装置及び画像検出方法 | |
JP4207098B2 (ja) | 符号化制御装置及び符号化制御方法、符号化装置及び符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040420 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060915 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060926 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061127 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070122 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100209 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110209 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110209 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120209 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120209 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130209 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |