Nothing Special   »   [go: up one dir, main page]

JP5422124B2 - 参照ピクチャ選択方法、画像符号化方法、プログラム、画像符号化装置および半導体装置 - Google Patents

参照ピクチャ選択方法、画像符号化方法、プログラム、画像符号化装置および半導体装置 Download PDF

Info

Publication number
JP5422124B2
JP5422124B2 JP2007538753A JP2007538753A JP5422124B2 JP 5422124 B2 JP5422124 B2 JP 5422124B2 JP 2007538753 A JP2007538753 A JP 2007538753A JP 2007538753 A JP2007538753 A JP 2007538753A JP 5422124 B2 JP5422124 B2 JP 5422124B2
Authority
JP
Japan
Prior art keywords
field
reference picture
encoding
bottom field
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007538753A
Other languages
English (en)
Other versions
JPWO2007040197A1 (ja
Inventor
ワーダニア ヴィクター
スーン リム チョン
陽司 柴原
眞也 角野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Publication of JPWO2007040197A1 publication Critical patent/JPWO2007040197A1/ja
Application granted granted Critical
Publication of JP5422124B2 publication Critical patent/JP5422124B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/16Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter for a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、あらゆるマルチメデイア符号化に用いることができ、特にインターレースビデオソースの動き予測フィールド符号化のための複数参照ピクチャに対応するビデオ符号化に用いられる。
圧縮されていないビデオソースは、プログレッシブ又はインターレース・スキャンフォーマットのいずれかのフォーマットでキャプチャーすることができる。プログレッシブ・スキャンフォーマットでは、サンプルラインすべてが同じ時刻にキャプチャーされる。一方、インターレース・スキャンフォーマットは、サンプルラインが交互に異なる時刻にキャプチャーされる。図1は、フィールドピクチャペアを示す説明図である。同図のように、早い時刻tにキャプチャーされたサンプルラインは、トップフィールドピクチャを構成する。遅い時刻t+1にキャプチャーされたサンプルラインは、ボトムフィールドピクチャを構成する。トップフィールドピクチャとそれに対応するボトムフィールドピクチャは、フィールドピクチャペアと呼ばれる。圧縮されていないフィールドピクチャはフレーム符号化またはフィールド符号化を用いて符号化できる。フレーム符号化では、トップフィールドピクチャとボトムフィールドピクチャの2つで1枚のピクチャとして符号化される。フィールド符号化では、トップフィールドピクチャは、ボトムフィールドピクチャとは別のピクチャとして符号化される。なお、以下、フィールドピクチャを単にフィールドと呼ぶ。
一般的に、ISO/IEC14496-2 Part 10 International Standard等のビデオ符号化アルゴリズムのほとんどは主に2つの符号化タイプを用いる。画面内符号化は1つのピクチャ内で他のピクチャを用いずに行われる。よって、画面内符号化されたサンプル画素のみを含むピクチャは画面内ピクチャまたは単にIピクチャと呼ばれる。一方、画面間符号化では、他のピクチャからのサンプル画素を参照することによって、ビデオピクチャ間の時間相関を用いる。単予測画面間ピクチャ(以下Pピクチャと呼ぶ。)は他の1枚のピクチャから予測し、双予測画面間ピクチャ(以下Bピクチャと呼ぶ。)は2枚の他のピクチャから予測する。
3つのピクチャのタイプ(画面内、単予測、双予測)がビデオエンコーダによって、用途における必要に応じて柔軟に用いられる。符号化及び復号化処理の順序(以下、符号化順序とよぶ)は、通常、ソースピクチャのキャプチャー順序や表示のためのデコーダからの出力順序(以下、表示順序とよぶ)と同じではない。画面間ピクチャの符号化及び復号化処理が、その符号化及び復号化処理で参照された他の符号化済みピクチャ(以下、参照ピクチャとよぶ)よりも後に行われるように符号化順序が配列される。
ISO/IEC14496-2 Part 10 International Standard
ところで、H.264(MPEG-4 AVC)では、画面間符号化の符号化効率を改善するため、符号化処理中により多くの参照ピクチャが使用可能になっている。つまり、MPEG−2では参照ピクチャとして使用可能なピクチャはIピクチャおよびPピクチャであるのに対して、H.264ではIピクチャおよびPピクチャに加えてBピクチャも参照ピクチャとして使用可能になっている。また、エンコーダは、ピクチャ内の異なるブロックを符号化する際に、異なる参照ピクチャを使用してもよい。「ブロック」という言葉は、画素の集まりである矩形を示し、4x4、8x4及び8x16などのブロックサイズがある。エンコーダは、多くの使用可能な参照ピクチャの中からブロック毎に最適な参照ピクチャを選択することによって、符号化効率を高めることが可能である。
しかしながら、使用可能な参照ピクチャの全てを調査して、ブロック毎に最適な参照ピクチャを選択することは、符号化効率の点からは好ましいが、処理量の点からは好ましくない。特に、インターレース・スキャンフォーマットでは、2つ目以降のBピクチャ、つまり、符号化済のBピクチャ(特にボトムフィールド)を参照可能なBピクチャは、参照可能なピクチャが多数あるので、最適な参照ピクチャを選択する処理量が多く、そのための参照メモリの管理も複雑である。
図2Aは、ピクチャの符号化順序の一例を示している。図2Bは、その同じピクチャの表示順序を示している。フィールドペア200及び206は、IピクチャかPピクチャのいずれかである。フィールドペア212及び218は、Bピクチャである。これらのフィールド中、ボトムフィールド222の符号化において参照可能なフィールドの数は、先行して符号化されるフィールド202、204、・・・216、220よりも多い。ボトムフィールド222の各ブロックの符号化には、フィールド202、204、214、216又は220のうちの1つを第1の方向の参照に、フィールド208または210のうちの1つを第2の方向の参照に用いることができる。ビデオエンコーダは、ボトムフィールド222の符号化処理において、1枚の参照フィールド(単予測符号化の場合)か、2枚の参照フィールド(双予測符号化の場合)を各ブロックの予測参照として選択する。
ボトムフィールド222の符号化における参照ピクチャの選択は、良質なビデオ画質を維持しながら符号化効率が最適であるように行われなければならない。この選択の方法の1つに、上述したように、使用可能な参照ピクチャすべてを調べる方法がある。残念ながら、この方法は、繰り返しやメモリーアクセスが多く非常に複雑である。よって、処理量の観点および参照メモリの管理の観点からは、この方法を適用するのは好ましくない。
処理量を低減するために、エンコーダによっては、すべての利用可能な参照ピクチャのうちの1つの適切なサブセットのみを調べる方法がある。このサブセットに属するピクチャを、以下、参照ピクチャ候補と呼ぶ。たとえば、図2Bに示すように、符号化対象のボトムフィールド222の参照ピクチャとして使用可能な全てのピクチャからトップフィールド220を除外したサブセットを参照ピクチャ候補とする。こうすれば、最適な参照ピクチャを選択するための処理量を低減することができる。しかしその反面、もし、除外されたピクチャが最適な参照ピクチャであったなら、符号化効率を十分に向上させることが出来ない。サブセットのみを調べる方法は、所領低減の観点からは好ましいが、符号化効率の観点からは好ましいとはいえない。
本発明は、参照ピクチャを決定する処理量の削減し、かつ、参照ピクチャ候補の制限がない場合と同程度の符号化効率を達成する参照ピクチャ選択方法、および装置を提供することを目的とする。
上記課題を解決するため本発明の参照ピクチャ選択方法は、インターレースビデオの符号化において、符号化対象のボトムフィールドのための参照ピクチャを選択する方法であって、前記符号化対象のボトムフィールドよりも符号化順で先行する特定フィールドを用いて、前記符号化対象のボトムフィールドの動きの大きさを予測し、予測した動きの大きさに応じて、前記インターレースビデオに含まれる複数のピクチャの中から、前記符号化対象のボトムフィールドの符号化に適したピクチャのみを選択して、選択されたピクチャを参照ピクチャ候補として設定するとともに、前記符号化対象のボトムフィールドの符号化に適していないピクチャを前記参照ピクチャ候補から排除し、設定された参照ピクチャ候補の中から、前記符号化対象のボトムフィールドの参照ピクチャを選択し、前記動きの大きさの予測結果に応じて、前記符号化対象のボトムフィールドよりも符号化順で直前の双予測符号化フィールドペア内のボトムフィールドである空間的直近フィールドを前記参照ピクチャ候補に含める
この構成によれば、第1に、参照可能な全てのピクチャを調査する必要がなく、参照ピクチャ候補のみを調査すればよいので、参照ピクチャを決定する処理量を削減することができる。しかも、第2に、予測した動きの大きさに応じて、符号化対象のボトムフィールドの符号化に適した参照ピクチャ候補が設定されるので、参照ピクチャ候補の制限がない場合と同程度の符号化効率を達成することができる。
また、この構成によれば、空間的直近フィールドを動きの大きさに応じて適応的に参照ピクチャ候補として設定することができる。
ここで、前記特定フィールドは、前記符号化対象のボトムフィールドよりも符号化順で先行するフィールドペア内のボトムフィールドであり、第1参照ピクチャは、前記特定フィールドと同じフィールドペア内のトップフィールドであり、第2参照ピクチャは、前記特定フィールドよりも符号化順で直前のフィールドペア内のボトムフィールドであり、前記動きの大きさの予測において、前記特定フィールドの符号化において、前記第1参照ピクチャを用いたブロックの個数である第1カウント数と、前記第2参照ピクチャを用いたブロックの個数である第2カウント数とをカウントし、前記符号化対象のボトムフィールドの動きの大きさとして、前記第1カウント数と前記第2カウント数との比または差分を算出するようにしてもよい。
この構成によれば、符号化対象のボトムフィールドの動きの大きさを、特定フィールド(ここでは、前記符号化対象のボトムフィールドよりも符号化順で先行するフィールドペア内のボトムフィールド)の符号化のプロセスから容易に取得可能な情報(参照ピクチャを示す情報)から第1および第2カウント数をカウントすることによって、簡単な処理で予測することができる。動きの大きさは、第1カウント数と第2カウント数との比(又は差分)、つまり、第1参照ピクチャを参照した回数と第2参照ピクチャを参照した回数との比(又は差分)として、適切に予測することができる。つまり、この比又は差分が大きいほど動きが大きいと予測できる。
ここで、前記参照ピクチャ候補の設定において、前記第1カウント数と前記第2カウント数との比または差分としきい値とを比較し、前記比較結果に応じて、前記空間的直近フィールドを前記参照ピクチャ候補に含めるようにしてもよい。
この構成によれば、しきい値を用いた比較処理という簡単な処理で、参照ピクチャ候補を適切に設定することができる。
ここで、前記特定フィールドは、前記符号化対象のボトムフィールドの属するフィールドペアから符号化順でN個前のフィールドペア内のボトムフィールドであり、前記Nは1ないし3から選ばれるようにしてもよい。
この構成によれば、符号化対象のボトムフィールドの属するフィールドペアから符号化順でN個前のフィールドペア内のボトムフィールドを用いることにより、符号化対象のボトムフィールドの動きを簡単に予測することができる。
ここで、前記特定フィールドは、前記符号化対象のボトムフィールドよりも符号化順で先行するトップフィールドであり、前記動きの大きさの予測において、前記特定フィールドの符号化において、イントラ符号化されたブロックの個数である第1カウント数と、イントラ以外で符号化されたブロックの個数である第2カウント数とをカウントし、前記符号化対象のボトムフィールドの動きの大きさとして、前記第1カウント数と前記第2カウント数との比または差分を算出するようにしてもよい。
この構成によれば、符号化対象のボトムフィールドの動きの大きさを、特定フィールド(ここでは、前記符号化対象のボトムフィールドよりも符号化順で先行するトップフィールド)の符号化のプロセスから容易に取得可能な情報(イントラ符号化か否かを示す情報)から第1および第2カウント数をカウントすることによって、簡単な処理で予測することができる。動きの大きさは、第1カウント数と第2カウント数との比(又は差分)、つまり、イントラ符号化されたブロックの個数とそうでないブロックの個数との比(又は差分)として、適切に予測することができる。
ここで、前記参照ピクチャ候補の設定において、前記第1カウント数と前記第2カウント数との比または差分としきい値とを比較し、前記比較結果に応じて、前記空間的直近フィールドを前記参照ピクチャ候補に含めるようにしてもよい。
この構成によれば、しきい値を用いた比較処理という簡単な処理で、参照ピクチャ候補を適切に設定することができる。
ここで、前記特定フィールドは、前記符号化対象のボトムフィールドの属するフィールドペアから符号化順でN個前のフィールドペア内のボトムフィールドであり、前記Nは0ないし3から選ばれるようにしてもよい。
この構成によれば、符号化対象のボトムフィールドの属するフィールドペアから符号化順でN個前のフィールドペア内のトップフィールドを用いることにより、符号化対象のボトムフィールドの動きを簡単に予測することができる。
ここで、前記特定フィールドは第1のフィールド、第2のフィールドの一方であり、前記第1のフィールドは前記符号化対象のボトムフィールドよりも符号化順で先行するフィールドペア内のボトムフィールドであり、前記第2のフィールドは当該フィールドペア内のトップフィールドであり、前記動きの大きさの予測において、前記動きの大きさとして、第1および第2の相関性を算出し、第1の相関性は、前記符号化対象のボトムフィールドと前記第1のフィールドとの相関性であり、第2の相関性は、前記符号化対象のボトムフィールドと前記第2のフィールドとの相関性であり、前記参照ピクチャ候補の設定において、第1の相関性と第2の相関性との比または差分に応じて、前記参照ピクチャ候補に設定するようにしてもよい。
この構成によれば、符号化対象のボトムフィールドの動きの大きさを、第1の相関性と第2の相関性と算出することによって、予測することができる。
ここで、前記参照ピクチャ候補の設定において、第1の相関性と第2の相関性との比または差分に応じて、前記空間的直近フィールドを前記参照ピクチャ候補に含めるようにしてもよい。
この構成によれば、2つの相関性の比較という簡単な処理で、参照ピクチャ候補を適切に設定することができる。
ここで、前記特定フィールドは第1のフィールド、第2のフィールドの一方であり、前記第1のフィールドは前記符号化対象のボトムフィールドよりも符号化順で先行するフィールドペア内のトップフィールドであり、前記第2のフィールドは当該フィールドペア内のボトムフィールドであり、前記動きの大きさの予測において、前記第1のフィールド、前記第2のフィールドおよび前記符号化対象のボトムフィールドそれぞれの縮小画像を生成し、縮小画像を用いて、前記第1のフィールドに対する符号化対象のボトムフィールドの動きを検出し、縮小画像を用いて、前記第2のフィールドに対する符号化対象のボトムフィールドの動きを検出するようにしてもよい。
この構成によれば、符号化対象のボトムフィールドの動きの大きさを、第1、第2のフィールドおよび前記符号化対象のボトムフィールドそれぞれの縮小画像を用いて検出することによって、予測することができる。
ここで、前記参照ピクチャ候補の設定において、検出された2つの動きに基づいて、前記空間的直近フィールドを前記参照ピクチャ候補に含めるようにしてもよい。
この構成によれば、縮小画像から得られた動きの比較という簡単な処理で、参照ピクチャ候補を適切に設定することができる。
ここで、前記符号化対象のボトムフィールドは双予測画面間符号化されたピクチャを参照可能なフィールドペアに属し、前記参照ピクチャ候補の設定において、予測された動きに応じて、参照可能な全てのピクチャから選ばれた参照ピクチャ候補からなる第1のサブセットおよび第2のサブセットの一方を選択し、前記第1のサブセットは、前記符号化対象フィールドと同じフィールドペア内のトップフィールドである時間的直近フィールドを含み、前記空間的直近フィールドを含まず、前記第2のサブセットは前記空間的直近フィールドを含み前記時間的直近フィールドを含まないようにしてもよい。
この構成によれば、予測された動きに応じて第1のサブセットと第2のサブセットからより適切なサブセットを適応的に参照ピクチャ候補として設定することができる。
ここで、前記参照ピクチャ選択方法は、さらに、参照ピクチャ候補に前記空間的直近フィールドが含まれているとき、当該空間的直近フィールドに最小のビット数で表される参照インデックスを付与するようにしてもよい。
この構成によれば、参照ピクチャ候補のうち最も使用されるであろう空間的直近フィールドには、最小ビット数の参照インデックスが割り当てられるので、符号化効率を向上させることができる。
また、本発明の画像符号化方法、プログラム、半導体装置、画像符号化装置、ストリームデータは、上記と同様に構成され、同様の作用効果を奏する。
本発明によれば、インターレースビデオの符号化において参照ピクチャを決定する処理量を削減することができ、かつ、参照ピクチャ候補の制限がない場合と同程度の符号化効率を達成することができる。
(実施の形態1)
本発明の参照ピクチャ選択方法は、符号化対象のボトムフィールドよりも符号化順で先行する特定フィールドを用いて、符号化対象のボトムフィールドの動きの大きさを予測し、予測した動きの大きさに応じて、符号化対象のボトムフィールドの符号化に適した参照ピクチャ候補を設定し、設定された参照ピクチャ候補の中から、符号化対象のボトムフィールドの参照ピクチャを選択する。参照ピクチャを選択する処理は、参照可能な全てのピクチャを調査する必要がなく、参照ピクチャ候補のみを調査すればよい。これにより参照ピクチャを決定する処理量を削減することができる。また、予測した動きの大きさに応じて、符号化対象のボトムフィールドの符号化に適した参照ピクチャ候補が設定されるので、参照ピクチャ候補の制限がない場合と同程度の符号化効率を達成することができる。
上記の特定フィールドは実施の形態によって異なるピクチャが定義される。実施の形態1では、特定フィールドとは、符号化対象のボトムフィールドよりも符号化順で先行するフィールドペア内のボトムフィールドをいう。例えば、図5のボトムフィールド316が符号化対象フィールドである場合、ボトムフィールド310が特定フィールドである。前記特定フィールドと同じフィールドペア内のトップフィールドを第2参照ピクチャと呼ぶ。特定フィールドよりも符号化順で直前のフィールドペア内のボトムフィールドを第1参照ピクチャと呼ぶ。例えば、図5のボトムフィールド310が特定フィールドである場合、トップフィールド308が第2参照ピクチャであり、ボトムフィールド304が第1参照ピクチャである。
また、上記の符号化対象のボトムフィールドの動きの大きさの予測は、間接的に行なわれる。つまり、上記の予測では、特定フィールドの符号化において、第1参照ピクチャを用いたブロックの個数である第1カウント数と、前記第2参照ピクチャを用いたブロックの個数である第2カウント数とをカウントし、符号化対象のボトムフィールドの動きの大きさとして、前記第1カウント数と前記第2カウント数との比または差分を算出する。この比又は差分が小さい程動きが大きいことを意味する。
なお、図5における第1、第2参照ピクチャの呼称は請求項中の第1、第2参照ピクチャとは逆になっている。この場合、第1カウント数と第2カウント数との比または差分の意味が逆になる点に注意すべきである。つまり、第1、第2参照ピクチャの呼称を逆にすることによって、比または差分が大きいほど、動きが小さいか大きいかが異なる。第1、第2参照ピクチャの呼称を逆でも、動きを予測できる点では同じ効果を奏する。
図3A、図3Bは、参照ピクチャ候補からなる第1、第2のサブセットの一例を示す図である。図3Aにおいて、実線の矢線は、符号化対象のボトムフィールド316の符号化に用いられる参照ピクチャ候補からなる第1のサブセットを示している。図3Bにおいて、実線の矢線は、符号化対象のボトムフィールド316の符号化に用いられる参照ピクチャ候補からなる第2のサブセットを示している。上記の参照ピクチャ候補の設定において、予測した動きの大きさに応じて第1のサブセットまたは第2のサブセットが設定される。
トップフィールド314は、符号化対象のボトムフィールド316と時間的に最も近いフィールドである(時間的直近フィールドと呼ぶ。)。予測した動きが大きいときは、時間的直近フィールドを参照ピクチャの候補とすることが望ましい。ボトムフィールド310は、符号化対象のボトムフィールド316と空間的に最も近いフィールドである(空間的直近フィールドと呼ぶ。)。予測した動きが小さいときは、空間的直近フィールドを参照ピクチャの候補とすることが望ましい。
図3A、図3Bの例では、第1のサブセットは空間的直近フィールドを含み時間的直近フィールドを含まない。第2のサブセットは時間的直近フィールドを含み空間的直近フィールドを含まない。なお、図3A、図3Bにおいて破線の矢線は、トップフィールド314の符号化に用いられる参照ピクチャ候補からなるサブセットを示している。同図のように、トップフィールド314の符号化用のサブセットは、ボトムフィールドの第1、第2のサブセットと連動して選択してもよい。
図3Cは、第2サブセットにおいて参照ピクチャ候補から排除されるピクチャの一例を示す図である。図中のNGを付した実線の矢線は、第2サブセットからフィールド308、310を排除することが望ましいことを意味する。これにより、符号化対象のボトムフィールドの符号化において、フィールドペア306は、もはや参照ピクチャとして不要となるので、参照ピクチャメモリから削除することができる。また、図中のNGを付した破線の矢線は、トップフィールド314の符号化用のサブセットからフィールド308、310を排除するようにしてもよい。こうすれば、トップフィールド314の符号化においてもフィールドペア306を参照ピクチャメモリから削除することができる。
なお、第1、第2のサブセット中の参照ピクチャ候補の数は2つ以上であってもよい。また、空間的直近フィールドが両方のサブセットに含まれ、かつ時間的直近フィールドが一方のサブセットに含まれるようにしてもよい。
以下、実施の形態1における参照ピクチャ選択方法を行なう画像符号化装置について説明する。
図4は、実施の形態1における画像符号化装置の主要部の構成を示すブロック図である。同図のように、画像符号化装置は、入力ピクチャメモリ101、減算器102、直交変換・量子化部103、可変長符号化部104、逆直交変換・逆量子化部107、参照ピクチャ生成部108、参照ピクチャメモリ109、画面間予測部110、制御部111を備える。
入力ピクチャメモリ101は、インターレースビデオ信号が入力され、少なくとも1つのフィールドペアを一時的に保持する。
減算器102は、入力ピクチャメモリ101からの符号化対象ブロックと、画面間予測部110からの予測画像との差分を求め、その差分を予測残差として直交変換・量子化部103出力する。
直交変換・量子化部103は、減算器102からの予測残差を直交変換することによって周波数係数からなる係数ブロックを求め、さらに係数ブロックを量子化する。
可変長符号化部104は、量子化された係数ブロックを可変長符号化することによってビデオストリームを出力する。
逆直交変換・逆量子化部107は、量子化された係数ブロックを逆量子化して逆直交変換することによって、予測残差を求める。
参照ピクチャ生成部108は、逆直交変換・逆量子化部107と画面間予測部110からの予測画像とを加算することによって、符号化対象ピクチャを再構成する。
参照ピクチャメモリ109は、再構成された符号化対象ピクチャを、参照ピクチャとして一時的に記憶する。
画面間予測部110は、符号化対象ピクチャをブロック毎に、参照ピクチャ109中の参照ピクチャを用いた単予測または双予測によって予測画像を生成する。その際、画面間予測部110は、上記の参照ピクチャ選択方法を用いて制御部111によって設定された参照ピクチャ候補の中から、1つまたは2つの参照ピクチャをブロック毎に選択する。
制御部111は、画像符号化装置全体を制御し、特に、参照ピクチャ選択方法による参照ピクチャの候補を設定する。
図5は、参照ピクチャ選択方法および画像符号化装置に関するピクチャ(符号化順)の例を示す図である。フィールドペア300、306、312および318は、単予測または双予測ピクチャである。例えば、フィールドペア300、306、312および318の符号化タイプは、P、B、B、Bである。フィールドペア300および306は、符号化済であり、参照ピクチャとして参照ピクチャメモリ109にすでに格納されているものとする。フィールドペア312は、現在の符号化対象とする。フィールドペア300および306との間、またはフィールドペア306および312の間に、1以上の非参照フィールドペアが存在してもよい。
符号化対象フィールドの動きの大きさを間接的に予測するために、符号化順で直前の参照フィールドペア306のボトムフィールド310からの予測情報を分析する。この分析結果は、符号化対象フィールドの動きの大きさを示し、空間的直近フィールドと時間的直近フィールドのうち、どちらが対象フィールドペア312のボトムフィールド316を符号化するためにより適当であるかを決定するのに用いられる。
直前の参照フィールドペア306のボトムフィールド310の符号化において、以下の第1、第2参照ピクチャが参照ピクチャ候補として利用可能であるものとする。符号化順の直前の参照フィールドペア306に先行する参照フィールドペア300のボトムフィールド304(第1参照ピクチャ)、および直前の参照フィールドペア306のトップフィールド308(以下、第2参照ピクチャと称する)。上述の空間的−時間的決定は、対象フィールドペア312のボトムフィールド316の符号化のための参照ピクチャ候補として、対象フィールドペア312のトップフィールド314を含めるまたは除外するために用いられる。
なお、上記の決定は、符号化順で対象フィールドペア312に後続するフィールドペア(フィールドペア318など)の符号化のために、後で用いられてもよい。
図6は、画像符号化装置における符号化および参照ピクチャ設定処理を示すフローチャートである。同図では、図5に示したフィールド308、310、314、316の符号化処理と、符号化対象フィールドの動きを間接的に予測して参照ピクチャ候補を設定する処理とを示している。
まず、モジュール400にて、符号化順で直前のフィールドペア306のトップフィールド308を符号化する。次に、モジュール402にて、参照ピクチャ候補として第1および第2の参照ピクチャを用いて、符号化順で直前のフィールドペア306のボトムフィールド310を符号化する。ボトムフィールド310の予測情報は、符号化モジュール402から分析ジュール404へ渡される。この予測情報は、各マクロブロック符号化後、各スライスを符号化後、または全フィールド符号化後に、渡されてもよい。
モジュール404では、空間的直近フィールドと時間的直近フィールドのうち、どちらがより適切であるか否か、空間的−時間的決定を行う。モジュール404の空間的−時間的決定に基づいて、モジュール406にて、対象フィールドペア312のトップフィールド314(すなわち時間的直近フィールド)を、対象フィールドペア312のボトムフィールド316を符号化のための参照ピクチャ候補として、含むかまたは除外する。そして、モジュール406にて設定された参照ピクチャ候補を用いて、モジュール408では、対象フィールドペア312のトップフィールド314を符号化し、一方、モジュール410にて、対象フィールドペア312のボトムフィールド316を符号化する。この符号化において、参照ピクチャ候補の中から最適な参照ピクチャをブロック毎に選択する。
図7は、図6中のモジュール404の分析処理を詳細に示すフローチャートである。
まず、モジュール500にて、第1参照カウンタおよび第2参照カウンタの値をゼロに設定する。次に、入力されたスライス/ピクチャの各マクロブロックの符号化タイプを、モジュール504にて判断する。符号化タイプが画面間符号化でない場合、モジュール518に示すように、ピクチャにおける次のマクロブロックのループ処理を続ける。符号化タイプが画面間符号化である場合(単予測または双予測である場合)、マクロブロック内のブロックごとに用いられる参照ピクチャを判断する。4x4または8x8のような固定サイズが、ブロックのサイズとして選択される。
モジュール508では、ブロックが第1参照フィールドから予測されるか否かを判断する。そうである場合は、モジュール510にて第1参照カウンタを1増加し、マクロブロック内の次のブロックのループ処理を続ける。一方、ブロックが第1参照ピクチャから予測されない場合は、モジュール512にて当ブロックが第2参照ピクチャから予測されるか否かを判断する。そうである場合は、モジュール514にて第2参照カウンタを1増加し、マクロブロック内の次のブロックのループ処理を続ける。モジュール518に示すように、本判断処理は、入力されたスライス/ピクチャの複数のマクロブロック内の全てのブロックについて繰り返される。
全マクロブロックが判断されると、モジュール520にて、第2参照カウンタの値に対する第1参照カウンタの値の比率を閾値(第1の閾値と呼ぶ)と比較する。この比率は、符号化対象ボトムフィールドの動きの大きさの予測結果を意味する。すなわち、比率が小さいほど、符号化対象ボトムフィールドの動きが大きいと予測され、比率が大きいほど、符号化対象ボトムフィールドの動きが小さいと予測される。比率が第1の閾値より小さい場合は、時間的直近フィールドは空間的直近フィールドよりも参照ピクチャ候補として適当であると決定する。一方、比率が第1の閾値以上である場合は、空間的直近フィールドが時間的直近フィールドよりも参照ピクチャ候補として適当であると決定する。本決定後、分析処理を終了する。
なお、モジュール520において、上記比率の代わりに、第1参照カウンタの値と第2参照カウンタの値との差分を用いてもよい。この場合、差分が小さいほど、符号化対象ボトムフィールドの動きが大きいと予測され、差分が大きいほど、符号化対象ボトムフィールドの動きが小さいと予測される。差分が第2の閾値(上記比率用の第1の閾値とは異なる)より小さい場合は、時間的直近フィールドは空間的直近フィールドよりも参照ピクチャ候補として適当であると決定する。一方、差分が第2の閾値以上である場合は、空間的直近フィールドが時間的直近フィールドよりも参照ピクチャ候補として適当であると決定する。
また、上記モジュール520において、第2参照カウンタの値に対する第1参照カウンタの値の比率の代わりに、第1参照カウンタの値に対する第2参照カウンタの値の比率を用いてもよい。この場合、(第2参照カウンタの値/第1参照カウンタの値)の比率が所定の閾値よりも大きい場合は、時間的直近フィールドの方が適切と決定し、所定の閾値よりも小さい場合は、空間的直近フィールドの方が適切と決定すればよい。
図8は、図6中のモジュール406の参照ピクチャ候補設定処理を詳細に示すフローチャートである。
まず、モジュール600にて、符号化順で直前のフィールドペア306のボトムフィールド310(すなわち空間的直近フィールド)を、対象フィールドペア312のボトムフィールド316を符号化のためのデフォルトの参照ピクチャ候補として設定する。対象フィールドペア312の直前のフィールドペアが参照フィールドペアでない時(図5例のフィールドペア306として示すように)、符号化順で対象フィールドペア312の直前の最も近い参照フィールドペアのボトムフィールドは、空間的直近フィールドとみなされ、モジュール600にてデフォルトの参照ピクチャ候補として設定される。
次に、モジュール602において空間的−時間的決定を判断する。時間的直近フィールドがより適当でない場合は、参照用ピクチャ選択方法を終了する。そうでない場合は(時間的直近フィールドより適当である場合は)、対象フィールドペア312のトップフィールド314(すなわち時間的直近フィールド)は、モジュール604にて参照ピクチャ候補として設定される。
そして、モジュール606にて、空間的直近フィールドおよび時間的直近フィールド両方が、画像処理装置の仕様、処理能力または設定上の観点から、同時に参照ピクチャ候補として可能であるか否かを判断する。そうである場合は、参照ピクチャ選択方法を終了する。そうでない場合は、モジュール608にて、符号化順で直前のフィールドペア306のボトムフィールド310(すなわち空間的直近フィールド)を参照ピクチャ候補のサブセットから除外し、参照ピクチャ候補設定方法を終了する。
以上説明したように、本実施の形態における参照ピクチャ選択方法によれば、符号化対象のボトムフィールドの動きの大きさを、特定フィールド(ここでは、前記符号化対象のボトムフィールドよりも符号化順で先行するフィールドペア内のボトムフィールド)の符号化のプロセスから容易に取得可能な予測情報(参照ピクチャを示す情報)から第1および第2カウント数をカウントすることによって、簡単な処理で予測することができる。
動きの大きさは、第1カウント数と第2カウント数との比(又は差分)、つまり、第1参照ピクチャを参照した回数と第2参照ピクチャを参照した回数との比(又は差分)として、適切に予測することができる。つまり、この比または差分が小さいほど動きが大きいことを意味する。また、しきい値を用いた比較処理という簡単な処理で、参照ピクチャ候補を適切に設定することができる。
これにより、参照ピクチャ選択の処理量を削減し、かつ参照ピクチャ候補が制限されていない場合と同程度の符号化効率を実現することができる。
なお、図6のモジュール406において、図3A、図3Bに示した第1サブセットまたは第2サブセットを設定するようにしてもよい。
また、図5における第1参照ピクチャと第2参照ピクチャを逆にしてもよい。つまり、トップフィールド308を第1参照ピクチャ、ボトムフィールド3042を第2参照ピクチャとしてもよい。このとき、図7に示したモジュール520のYとNは逆にすればよい。この場合のモジュール520の比率(第1参照カウンタの値/第2参照カウンタの値の)は大きいほど、符号化対象ボトムフィールドの動きが大きいと予測され、比率が小さいほど符号化対象ボトムフィールドの動きが小さいと予測される。
(実施の形態2)
本実施の形態では、実施の形態1と比較して、特定フィールドが異なるピクチャである点と、予測情報が異なる情報である点とが異なっている。同じ点は説明を省略して、以下異なる点を中心に説明する。
本実施の形態における特定フィールドは、符号化対象のボトムフィールドの直前のフィールドペアに属するトップフィールドをいう。また、予測情報は、実施の形態1では、特定フィールドの各ブロックの符号化において、参照ピクチャが第1/第2参照ピクチャであるか示す情報であるが、実施の形態2では、特定フィールドの各ブロックの符号化において、イントラ符号化されたか否かを示す情報を用いる。
実施の形態2の画像符号化装置の概略構成は図4と同じである。また、適応的参照ピクチャ選択方法及び画像符号化装置に用いられる符号化順のピクチャの一例を、実施の形態1と同様に、図5に示す。対象フィールドペア312のボトムフィールド316の動きの大きさを間接的に予測するために、符号化順で前の参照フィールドペア306のトップフィールド308(つまり特定フィールド)の符号化過程で得られる予測情報を分析する。この予測情報は、特定フィールドの各ブロックの符号化において、イントラ符号化されたか否かを示す。分析結果は、符号化対象ボトムフィールドの動きの大きさを間接的に示し、空間的−時間的(spatial-temporal)決定に利用される。この空間的−時間的決定は、次に対象フィールドペア312のボトムフィールド316を符号化するための参照ピクチャ候補として、対象フィールドペア312のトップフィールド314(つまり時間的直近フィールド)を含むか含まないかの判定に用いられる。なお、同一の決定が、後に、符号化順で対象フィールドペア312に後続するフィールドペア(例えば、フィールドペア318)の符号化に用いられてもよい。
図9は、実施の形態2における画像符号化装置における符号化および参照ピクチャ設定処理を示すフローチャートである。同図では、図5に示したフィールド308、310、314、316の符号化処理と、符号化対象フィールドの動きを間接的に予測して参照ピクチャ候補を設定する処理とを示している。モジュール400、402、406、408、及び410は、実施の形態1の図6に示されるものと同一である。
まず、モジュール400において、符号化順で前のフィールドペア306のトップフィールド308を符号化する。トップフィールド308の予測情報は符号化モジュール400から分析モジュール700に転送される。この予測情報は、特定フィールドの各ブロックの符号化において、イントラ符号化されたか否かを示し、マクロブロックごと、スライスごと、又はフィールド全体の符号化後に転送されてもよい。モジュール700は、空間的直近フィールドか時間的直近フィールドのどちらがより適切であるかに関する空間的−時間的決定を行う。モジュール700の空間的−時間的決定に基づき、モジュール406は、対象フィールドペア312のボトムフィールド316を符号化するための参照ピクチャ候補として、対象フィールドペア312のトップフィールド314(つまり、時間的直近フィールド)を含めるかは含めないかを決定し、決定に従って参照ピクチャ候補(または図3A、3Bのようなサブセット)を設定する。
モジュール402では符号化順で前のフィールドペア306のボトムフィールド310を符号化し、モジュール408では対象フィールドペア312のトップフィールド314を符号化する。最後に、モジュール410は、モジュール406によって設定された参照ピクチャ候補を用いて、対象フィールドペア312のボトムフィールド316を符号化する。
図10は、図9中のモジュール700の分析処理を詳細に示すフローチャートである。
まず、モジュール800は、第1カウンタ及び第2カウンタの値をゼロに設定する。次に、モジュール806において、入力スライス/ピクチャにおけるマクロブロックの各ブロックの符号化タイプを確認する。4×4や8×8のような固定サイズがブロックサイズとして選択される。符号化タイプが画面内符号化である場合、モジュール808において、第1カウンタを1増加し、モジュール812に示されるように、マクロブロックにおける次のブロックのブロックループ処理を続ける。符号化タイプが画面内符号化でない場合、モジュール810において、第1カウンタを1増加し、モジュール812に示されるように、マクロブロックにおける次のブロックのブロックループ処理を続ける。マクロブロックの全てのブロックについて確認処理を行った後、モジュール814に示されるように、スライス/ピクチャにおける次のマクロブロックのループ処理を続ける。全てのマクロブロックについて確認処理が行われた後、モジュール816において、第1カウンタと第2カウンタの比率が閾値(第3の閾値と呼ぶ)と比較される。この比率は、符号化対象ボトムフィールドの動きの大きさの予測結果を意味する。すなわち、比率が大きいほど、符号化対象ボトムフィールドの動きが大きいと予測され、比率が小さいほど、符号化対象ボトムフィールドの動きが小さいと予測される。第3の閾値は、実施の形態1におけるモジュール520の第1の閾値とは異なる値である。比率が第3の閾値より大きい場合、時間的直近フィールドが空間的直近フィールドより適切であると判定する。一方、比率が第3の閾値以下である場合、空間的直近フィールドが時間的直近フィールドより適切であると判定する。判定結果が出された後、分析処理を終了する。
なお、モジュール816において、上記比率の代わりに、第1カウンタの値と第2カウンタの値との差分を用いてもよい。この差分は符号化対象ボトムフィールドの動きの大きさの予測結果を意味する。つまり、差分が大きいほど、符号化対象ボトムフィールドの動きが大きいと予測され、差分が小さいほど、符号化対象ボトムフィールドの動きが小さいと予測される。差分が第4の閾値(上記比率用の第3の閾値とは異なる)より大きい場合は、時間的直近フィールドは空間的直近フィールドよりも参照ピクチャ候補として適当であると決定する。一方、差分が第4の閾値より以下である場合は、空間的直近フィールドが時間的直近フィールドよりも参照ピクチャ候補として適当であると決定する。
以上説明したように本実施の形態における参照ピクチャ選択方法によれば、符号化対象のボトムフィールドの動きの大きさを、特定フィールド(ここでは、符号化対象のボトムフィールドの直前のフィールドペア内のトップフィールド)の符号化のプロセスで容易に利用可能な予測情報(イントラ符号化か否かを示す情報)を利用して、符号化対象のボトムフィールドの動きの大きさを間接的に予測している。これにより、簡単な処理で、参照ピクチャ候補を適切に設定することができる。
(実施の形態3)
本実施の形態では、実施の形態2と比較して、特定フィールドが異なるピクチャである点が異なっている。同じ点は説明を省略して、以下異なる点を中心に説明する。
本実施の形態における特定フィールドは、符号化対象のボトムフィールドと同じフィールドペアに属するトップフィールドをいう。
実施の形態3の画像符号化装置の概略構成は図4と同じである。また、適応的参照ピクチャ選択方法及び画像符号化装置に用いられる符号化順のピクチャの一例を、実施の形態1、2と同様に、図5に示す。
符号化対象のボトムフィールド316の動きの大きさを間接的に予測するために、対象参照フィールドペア312のトップフィールド314(つまり特定フィールド)の符号化過程で得られる予測情報を分析する。予測情報は、特定フィールドの各ブロックの符号化において、イントラ符号化されたか否かを示す。分析結果は、符号化対象のボトムフィールド316の動きの大きさを間接的に示し、空間的直近フィールドと時間的直近フィールドのどちらが参照ピクチャ候補として適しているかの判定(空間的−時間的決定)に利用される。
なお、同一の決定が、後に、符号化順で対象フィールドペア312に後続するフィールドペア(例えば、フィールドペア318)の符号化に用いられてもよい。
図11は、実施の形態3における画像符号化装置における符号化および参照ピクチャ設定処理を示すフローチャートである。同図では、図5に示したフィールド314、316の符号化処理と、符号化対象フィールドの動きを間接的に予測して参照ピクチャ候補を設定する処理とを示している。モジュール408及び410は、実施の形態1および2の図6および9に示されるものと同じである。モジュール700は、実施の形態2の図9、図10と同じである。
まず、モジュール408において、対象フィールドペア312のトップフィールド314を符号化する。トップフィールド314の予測情報は符号化モジュール408から分析モジュール700に転送される。この予測情報は、マクロブロックごと、スライスごと、又はフィールド全体の符号化後に転送されてもよい。
モジュール700は、空間的直近フィールドと時間的直近フィールドのどちらがより適切であるかに関する空間的−時間的決定を行う。モジュール700の空間的−時間的決定に基づき、モジュール900は、対象フィールドペア312のボトムフィールド316を符号化するためのトップフィールド314として、対象フィールドペア312のトップフィールド314(つまり、時間的直近フィールド)を含むもしくは含まない。次に、モジュール410は、モジュール900によって設定された参照ピクチャ候補を用いて、対象フィールドペア312のボトムフィールド316を符号化する。
図12は、図11のモジュール900の参照ピクチャ候補設定処理を詳細に示すフローチャートである。
まず、モジュール600は、符号化順で前のフィールドペア306のボトムフィールド310(つまり、空間的直近フィールド)を対象フィールドペア312のボトムフィールド316の符号化のための参照ピクチャ候補として設定する。対象フィールドペア312の直前にあるフィールドペアが参照フィールドペア(図5の例において、フィールドペア306と示す)でない場合、符号化順で対象フィールドペア312の直前にある最も近い参照フィールドペアのボトムフィールドを空間的直近フィールドとみなし、モジュール600において、参照ピクチャ候補として設定する。
次に、モジュール602において、空間的−時間的決定を確認する。時間的直近フィールドが適切でない場合は、参照ピクチャ選択処理を終了する。そうでない場合(時間的直近フィールドが適切である場合)は、モジュール604において、対象フィールドペア312のトップフィールド314(つまり、時間的直近フィールド)を参照ピクチャ候補として設定する。そして参照ピクチャ候補設定処理を終了する。モジュール600、602、及び604は、実施の形態1の図8に記載の内容と同一である。図12は、図8と異なり、モジュール606および608を行なっていないので、空間的直近ピクチャと参照ピクチャ候補から除外していない。そのため、最終的な参照ピクチャ候補は、時間的直近ピクチャを含むか除外するかが異なることになる。
なお、図11のモジュール900において、図12の処理の代わりに図8と同じ処理を行なってもよい。
以上説明したように本実施の形態における参照ピクチャ選択方法によれば、符号化対象のボトムフィールドの動きの大きさを、特定フィールド(ここでは、符号化対象のボトムフィールドと同じフィールドペア内のトップフィールド)の符号化のプロセスで容易に利用可能な予測情報(イントラ符号化か否かを示す情報)を利用して、符号化対象のボトムフィールドの動きの大きさを間接的に予測している。これにより、簡単な処理で、参照ピクチャ候補を適切に設定することができる。
(実施の形態4)
本実施の形態では、実施の形態1から3のそれぞれの参照ピクチャ選択方法に対して、さらに、参照インデックスを付与する処理が追加した構成について説明する。ここで、参照インデックスとは、参照可能なピクチャの全てまたは参照ピクチャ候補の全てに割り当てられる符号であり、ストリーム中に参照ピクチャとして実際に用いられたピクチャを指定するために使用される。また、参照インデックスは、符号化対象のピクチャ毎に参照可能なピクチャの全てまたは参照ピクチャ候補の全てに割り当てられる。
参照インデックスを付与する処理では、参照ピクチャ候補に時間的直近フィールドが含まれているとき、当該時間的直近フィールドに最小のビット数で表される参照インデックスを付与し、参照ピクチャ候補に空間的直近フィールドが含まれているとき、当該空間的直近フィールドに最小のビット数で表される参照インデックスを付与するようにしている。つまり、参照ピクチャ候補のうち参照ピクチャとして最も使用されるであろう時間的直近フィールドまたは空間的直近フィールドには、最小ビット数の参照インデックスが割り当てられる。ストリームは、各ブロックの参照ピクチャを指す参照インデックスを含むので、ストリームのビット数を短縮し符号化効率をさらに向上させることができる。
図13は、実施の形態4における符号化および参照ピクチャ設定処理を示すフローチャートであり、実施の形態1の図6に対して参照インデックス付与処理を追加したフローチャートである。図13は、図6と比較して、モジュール1100が追加されている点が異なる。同じ点は説明を省略し異なる点を中心に説明する。参照ピクチャ候補が設定された後、モジュール1100では、符号化対象ボトムフィールドの参照ピクチャ候補のそれぞれに対して参照インデックスを付与する。その際、参照ピクチャ候補のうち時間的直近フィールドまたは空間的直近フィールドに最小のビット数で表される参照インデックスを付与する。
図14A、図14Bは、付与された参照インデックスref_idxの例を示す図である。図14Aでは、符号化対象のボトムフィールド316の参照ピクチャ候補のうち、空間的直近フィールド310には、ref_idx=0が割り当てられている。この例では、ref_idx=0は最小のビット数で表される参照インデックスである。空間的直近フィールド310以外の参照ピクチャ候補には、他の値ref_idx=1、2、等が割り当てられる。これに対して図14Bでは、符号化対象のボトムフィールド316の参照ピクチャ候補のうち、時間的直近フィールド314には、ref_idx=0が割り当てられている。
図15は、図13のモジュール1100における参照インテックス設定処理の詳細を示すフローチャートである。
まず、モジュール1400において、空間的−時間的決定が確認される。時間的直近ピクチャが適切である場合、モジュール1402は、最小ビット数の参照インデックスを時間的直近ピクチャ(つまり、対象フィールドペア312のトップフィールド314)を指すように、複数の参照ピクチャ候補の参照インデックスを変更又は再配置する(例えば図14B)。時間的直近ピクチャが適切でない場合、モジュール1404は、最小ビット数の参照インデックスが空間的直近ピクチャを参照するように、符号化順で前の参照フィールドペア306のボトムフィールド310のような、複数の参照ピクチャ候補のインデックスを変更又は再配置する(例えば図14A)。
図16は、実施の形態4における符号化および参照ピクチャ設定処理の他の例を示すフローチャートであり、実施の形態2の図9に対して参照インデックス付与処理を追加したフローチャートである。図16は、図9と比較して、モジュール1100が追加されている点が異なる。モジュール1100は上述の通りである。
図17は、実施の形態4における符号化および参照ピクチャ設定処理のさらに他の例を示すフローチャートであり、実施の形態3の図11に対して参照インデックス付与処理を追加したフローチャートである。図17は、図11と比較して、モジュール1100が追加されている点が異なる。モジュール1100は上述の通りである。
以上説明したように本実施の形態における、参照ピクチャ選択方法によれば、参照ピクチャ候補のうち参照ピクチャとして最も使用され得る時間的直近フィールドまたは空間的直近フィールドには、最小ビット数の参照インデックスが割り当てられる。ストリームは、各ブロックの参照ピクチャを指す参照インデックスを含むので、ストリームのビット数を短縮し符号化効率をさらに向上させることができる。
(実施の形態5)
本実施の形態では、実施の形態1と比較して、特定フィールドが異なるピクチャである点が異なっている。同じ点は説明を省略して、以下異なる点を中心に説明する。
本実施の形態における特定フィールドは、符号化対象のボトムフィールドの直々前(2つ前)のフィールドペアに属するボトムフィールドをいう。
本実施の形態の画像符号化装置の概略構成は図4と同じである。
図18は、実施の形態5における参照ピクチャ選択方法及び画像符号化方法に用いられる符号化順のピクチャの一例を示す。フィールドペア294、300、306、312は、例えば順にIまたはPピクチャ、Pピクチャ、Bピクチャ、Bピクチャである。符号化対象のボトムフィールド316に対して、特定フィールドはボトムフィールド304になる。特定フィールドと同じフィールドペア内のトップフィールド302は、第2参照ピクチャと呼ぶ。特定フィールド304よりも符号化順で直前のフィールドペア294内のボトムフィールド298は、第1参照ピクチャと呼ぶ。
図19は、画像符号化装置における符号化および参照ピクチャ設定処理を示すフローチャートである。同図では、図18に示したフィールド302、304、308、310、314、316の符号化処理と、符号化対象フィールドの動きを間接的に予測して参照ピクチャ候補を設定する処理とを示している。図19は、図6に示した実施の形態1の参照ピクチャ設定処理と比較して、モジュール396、398を明記している点と、モジュール404がモジュール398から予測情報を得ている点が異なっている。図19のモジュール400〜410は図6と同じ処理を行なう。以下同じ点は省略して異なる点を中心に説明する。
モジュール396では、直々前(2つ前)のフィールドペア300内のトップフィールド302の符号化を行なう。モジュール398では、直々前(2つ前)のフィールドペア300内のボトムフィールド304の符号化を行なう。ボトムフィールド304の予測情報は符号化モジュール398から分析モジュール404に転送される。この予測情報は、ブロック毎の実際に符号化に用いられた参照ピクチャを示す情報であり、マクロブロックごと、スライスごと、又はフィールド全体の符号化後に転送されてもよい。
モジュール404では、モジュール398から得られた予測情報を分析する。モジュール404、406の詳細については既に説明した図7、8と同じである。
以上説明したように本実施の形態における参照ピクチャ選択方法によれば、実施の形態1と同様に、符号化対象のボトムフィールド316の動きの大きさを、特定フィールド(ここでは、前記符号化対象のボトムフィールドよりも符号化順で先行するフィールドペア内のボトムフィールド304)の符号化のプロセスから容易に取得可能な予測情報(参照ピクチャを示す情報)から第1および第2カウント数をカウントすることによって、簡単な処理で予測することができる。
動きの大きさは、第1カウント数と第2カウント数との比(又は差分)、つまり、第1参照ピクチャを参照した回数と第2参照ピクチャを参照した回数との比(又は差分)として、適切に予測することができる。この比または差分が小さいほど動きが大きいことを意味する。また、しきい値を用いた比較処理という簡単な処理で、参照ピクチャ候補を適切に設定することができる。
これにより、参照ピクチャ選択の処理量を削減し、かつ参照ピクチャ候補が制限されていない場合と同程度の符号化効率を実現することができる。
(実施の形態6)
本実施の形態では、実施の形態2と比較して、特定フィールドが異なるピクチャである点が異なっている。同じ点は説明を省略して、以下異なる点を中心に説明する。
本実施の形態における特定フィールドは、符号化対象のボトムフィールドの直々前(2つ前)のフィールドペアに属するトップフィールドをいう。
本実施の形態の画像符号化装置の概略構成は図4と同じである。本実施形態においても図18に示した符号化順のピクチャの一例を用いて説明する。
図20は、実施の形態6における画像符号化装置における符号化および参照ピクチャ設定処理を示すフローチャートである。同図では、図18に示したフィールド302、304、308、310、314、316の符号化処理と、符号化対象フィールドの動きを間接的に予測して参照ピクチャ候補を設定する処理とを示している。図20は、図9に示した実施の形態2の参照ピクチャ設定処理と比較して、モジュール396、398を明記している点と、モジュール700がモジュール396から予測情報を得ている点が異なっている。図20のモジュール400〜410、700は図9と同じ処理を行なう。以下同じ点は省略して異なる点を中心に説明する。
モジュール396では、直々前(2つ前)のフィールドペア300内のトップフィールド302の符号化を行なう。トップフィールド302の予測情報は符号化モジュール398から分析モジュール700に転送される。この予測情報は、ブロック毎にイントラ符号化がなされたか否かを示す情報であり、マクロブロックごと、スライスごと、又はフィールド全体の符号化後に転送されてもよい。モジュール398では、直々前(2つ前)のフィールドペア300内のボトムフィールド302の符号化を行なう。
モジュール700では、モジュール396から得られた予測情報を分析する。モジュール700、406の詳細については既に説明した図10、図8と同じである。
以上説明したように本実施の形態における参照ピクチャ選択方法によれば、実施の形態2と同様に、符号化対象のボトムフィールド316の動きの大きさを、特定フィールド(ここでは、前記符号化対象のボトムフィールドよりも符号化順で先行するフィールドペア内のトップフィールド302)の符号化のプロセスから容易に取得可能な予測情報(イントラ符号化ブロックか否かを示す情報)から第1および第2カウント数をカウントすることによって、簡単な処理で予測することができる。
動きの大きさは、第1カウント数と第2カウント数との比(又は差分)、つまり、第1参照ピクチャを参照した回数と第2参照ピクチャを参照した回数との比(又は差分)として、適切に予測することができる。この比または差分が小さいほど動きが大きいことを意味する。また、しきい値を用いた比較処理という簡単な処理で、参照ピクチャ候補を適切に設定することができる。
これにより、参照ピクチャ選択の処理量を削減し、かつ参照ピクチャ候補が制限されていない場合と同程度の符号化効率を実現することができる。
(実施の形態7)
本実施の形態では、実施の形態5と比較して、特定フィールドが異なるピクチャである点が異なっている。同じ点は説明を省略して、以下異なる点を中心に説明する。
本実施の形態における特定フィールドは、符号化対象のボトムフィールドの直々々前(3つ前)のフィールドペアに属するボトムフィールドをいう。
図21は、実施の形態7における参照ピクチャ選択方法及び画像符号化方法に用いられる符号化順のピクチャの一例を示す。フィールドペア288、294、300、306、312は、例えば順にIまたはPピクチャ、Pピクチャ、Pピクチャ、Bピクチャ、Bピクチャである。符号化対象のボトムフィールド316に対して、特定フィールドはボトムフィールド298になる。特定フィールド298と同じフィールドペア294内のトップフィールド296は、第2参照ピクチャと呼ぶ。特定フィールド298よりも符号化順で直前のフィールドペア288内のボトムフィールド292は、第1参照ピクチャと呼ぶ。
図22は、実施の形態7における画像符号化装置における符号化および参照ピクチャ設定処理を示すフローチャートである。同図では、図21に示したフィールド290、292、302、304、308、310、314、316の符号化処理と、符号化対象フィールドの動きを間接的に予測して参照ピクチャ候補を設定する処理とを示している。図22は、図19に示した実施の形態5の参照ピクチャ設定処理と比較して、モジュール392、394を明記している点と、モジュール404がモジュール394から予測情報を得ている点が異なっている。図22のモジュール396〜410は図19と同じ処理を行なう。以下同じ点は省略して異なる点を中心に説明する。
ボトムフィールド298の予測情報は符号化モジュール394から分析モジュール404に転送される。この予測情報は、ブロック毎の実際に符号化に用いられた参照ピクチャを示す情報であり、マクロブロックごと、スライスごと、又はフィールド全体の符号化後に転送されてもよい。
モジュール404では、モジュール394から得られた予測情報を分析する。モジュール404、406の詳細については既に説明した図7、8と同じである。
以上説明したように、本実施の形態における参照ピクチャ選択方法によれば、上記各実施の形態と同様の効果を、異なる特定フィールドを用いて得ることができる。
(実施の形態8)
本実施の形態では、実施の形態6と比較して、特定フィールドが異なるピクチャである点が異なっている。同じ点は説明を省略して、以下異なる点を中心に説明する。
本実施の形態における特定フィールドは、符号化対象のボトムフィールドの直々々前(3つ前)のフィールドペアに属するトップフィールドをいう。本実施形態においても、図21に示したピクチャ例を用いて説明する。
図23は、実施の形態8における画像符号化装置における符号化および参照ピクチャ設定処理を示すフローチャートである。図23は、図20に示した実施の形態2の参照ピクチャ設定処理と比較して、モジュール392、394を明記している点と、モジュール700がモジュール392から予測情報を得ている点が異なっている。この点以外は、実施の形態6と同様である。
以上説明したように、本実施の形態における参照ピクチャ選択方法によれば、上記各実施の形態と同様の効果を、異なる特定フィールドを用いて得ることができる。
(実施の形態9)
上記各実施の形態では、符号化対象ボトムフィールドの動きの大きさを、特定フィールドの予測情報を用いて間接的に簡易に予測あるいは推定している。これに対して、本実施の形態では、符号化対象ボトムフィールドが、時間的直近フィールドおよび空間的直近フィールドのうち、どちらと相関性が高いかを調べることにより、符号化対象ボトムフィールドの動きの大きさを予測する参照ピクチャ選択方法について説明する。
図24は、実施の形態9における参照ピクチャ選択方法及び画像符号化方法に用いられる符号化順のピクチャの一例を示す。フィールドペア306、312は、例えば順にBピクチャである。符号化対象ボトムフィールド316と時間的直近フィールド314との相関性は、それらの差分により簡易に算出することができる。同様に、符号化対象ボトムフィールド316と空間的直近フィールド310との相関性は、それらの差分により簡易に算出することができる。
図25は、実施の形態9における画像符号化装置における符号化および参照ピクチャ設定処理を示すフローチャートである。同図では、図24に示したフィールド308、310、314、316の符号化処理と、符号化対象フィールドの動きを間接的に予測して参照ピクチャ候補を設定する処理(モジュール720〜724、406)とを示している。モジュール400、402、406、408、及び410は、実施の形態1の図6に示されるものと同一である。
モジュール720は、直前のボトムフィールド(空間的直近フィールド)310と符号化対象ボトムフィールド316との相関性(以下、空間的相関性と呼ぶ。)を算出する。ここでは、2つのフィールド間で対応する画素同士の差分を算出し、それらの総和を相関性として算出する。この算出に際して、符号化対象ボトムフィールド316の各画素値は入力ピクチャメモリ101から読み出され、空間的直近フィールド310の各画素値は参照ピクチャメモリ109または入力ピクチャメモリ101から読み出される。空間的相関性は、上記の差分の総和が小さいほど高い相関性を表す。
モジュール722は、トップフィールド(時間的直近フィールド)314と符号化対象ボトムフィールド316との相関性(以下、時間的相関性と呼ぶ。)を算出する。この算出は、モジュール720と同様である。空間的相関性は、差分の総和が小さいほど高い相関性を表す。
モジュール724は、2つの相関性に従って空間的−時間的決定を行なう。すなわち、空間的相関性が時間的相関性よりも高い場合には、空間的直近フィールドが時間的直近フィールドよりも参照ピクチャ候補として適していると決定する。逆に、時間的相関性が空間的相関性よりも高い場合には、時間的直近フィールドが空間的直近フィールドよりも参照ピクチャ候補として適していると決定する。
モジュール406は、既に図8で説明した通りであり、モジュール724の決定に応じて、空間的直近フィールド又は空間的直近フィールドを参照ピクチャ候補として設定する。
以上説明したように、本実施の形態における参照ピクチャ選択方法中の、符号化対象ボトムフィールドの動きの大きさは、空間的相関性と時間的相関性とを求めることによって適切に予測することができる。しかも、差分の総和を求めるというに簡易な計算により実現することができる。
(実施の形態10)
実施の形態9では2つの相関性を算出することにより、符号化対象ボトムフィールドの動きの大きさを予測した。これに対して、本実施の形態では、符号化対象ボトムフィールドの縮小画像の動きが、時間的直近フィールドの縮小画像および空間的直近フィールドの縮小画像のうち、どちらに対して大きいかを調べることにより、符号化対象ボトムフィールドの動きの大きさを予測する参照ピクチャ選択方法について説明する。
図26は、実施の形態10における画像符号化装置における符号化および参照ピクチャ設定処理を示すフローチャートである。同図では、図24に示したフィールド308、310、314、316の符号化処理と、符号化対象フィールドの動きを間接的に予測して参照ピクチャ候補を設定する処理(モジュール730〜734、406)とを示している。モジュール400、402、406、408、及び410は、実施の形態1の図6に示されるものと同一である。
モジュール730は、直前のボトムフィールド(空間的直近フィールド)310の縮小画像を生成し、符号化対象ボトムフィールド316の縮小画像を生成し、2つの縮小画像から符号化対象ボトムフィールド316の動きの大きさ(以下、第1の動きの大きさと呼ぶ。)を予測する。縮小画像は、例えば、縦横各1/2、1/3、1/4・・・などでよい。動きの大きさの予測では、縮小画像中のブロック毎に動きベクトルを検出してもよいし、幾つかの代表的なブロックをサンプルして動きベクトルを検出してもよい。このように検出された複数のブロックの動きベクトルの総和、または動きベクトルの絶対値の総和に基づいて「動きの大きさ」を予測する。
モジュール732は、直前のトップフィールド(時間的直近フィールド)314の縮小画像を生成し、その縮小画像と符号化対象ボトムフィールド316の縮小画像とから符号化対象ボトムフィールド316の動きの大きさを予測する(以下、第2の動きの大きさと呼ぶ。)。動きの予測は、上記と同じでよい。
モジュール734は、第1および第2の動きの大きさに従って空間的−時間的決定を行なう。すなわち、第1の動きの大きさの方が第2の動きの大きさよりも大きい場合には、空間的直近フィールドが時間的直近フィールドよりも参照ピクチャ候補として適していると決定する。逆に、第2の動きの大きさの方が第1の動きの大きさよりも大きい場合には、時間的直近フィールドが空間的直近フィールドよりも参照ピクチャ候補として適していると決定する。
モジュール406は、既に図8で説明した通りであり、モジュール734の決定に応じて、空間的直近フィールド又は空間的直近フィールドを参照ピクチャ候補として設定する。
以上説明したように、本実施の形態における参照ピクチャ選択方法では、縮小画像を用いることによって、符号化対象ボトムフィールドの動きの大きさを適切に予測することができる。しかも、縮小画像の動きベクトルの検出というに簡易な計算により実現することができる。
なお、上記各実施の形態に示したブロック図の各機能ブロックおよびフローチャートの各モジュールは典型的には集積回路装置であるLSIとして実現される。このLSIは1チップ化されても良いし、複数チップ化されても良い(例えばメモリ以外の機能ブロックが1チップ化されていても良い。)。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
また、各機能ブロックのうち、データを格納するユニットだけ1チップ化せずに、記録媒体やDRAMなど別構成としても良い。
なお、上記各実施の形態に示したフローチャートにおいて主要な部分はプロセッサおよびプログラムによっても実現される。
このように、上記実施の形態で示した画像符号化方法あるいは画像復号化方法を上述したいずれの機器・システムに用いることは可能であり、そうすることで、上記実施の形態で説明した効果を得ることができる。
また、本発明はかかる上記実施形態に限定されるものではなく、本発明の範囲を逸脱することなく種々の変形または修正が可能である。
なお、実施の形態5から10の各参照ピクチャ設定処理に対して、さらに、参照ピクチャ候補のうち時間的直近フィールドまたは空間的直近フィールドに最小のビット数で表される参照インデックスを付与する参照インテックス設定処理(図15)を追加してもよい。
上記各実施の形態の、参照ピクチャ選択方法では、符号化対象のボトムフィールドの参照ピクチャ候補を設定しているが、加えて、符号化対象トップフィールドの参照ピクチャ候補の設定を行なってもよい。例えば、図3Aの破線矢印で示す参照ピクチャ候補のサブセットと、図3Bの破線矢印で示す参照ピクチャ候補のサブセットの何れかを符号化対象トップフィールドの動きの大きさに応じて設定するようにしてもよい。
上記実施の形態1、4、5、7において、図7に示したモジュール404において、第1参照ピクチャを用いたブロックの個数である第1カウント数と、前記第2参照ピクチャを用いたブロックの個数である第2カウント数とをカウントしているが(モジュール508〜514)、これの代わりに、イントラ符号化されたブロックの個数である第2カウント数と、イントラ以外で符号化されたブロックの個数である第1カウント数とをカウントするようにしてもよい。
上記実施の形態2、3、4、6において、図10に示したモジュール700において、イントラ符号化されたブロックの個数である第1カウント数と、イントラ以外で符号化されたブロックの個数である第2カウント数とをカウントしているが(モジュール816〜810)、この代わりに、第1参照ピクチャを用いたブロックの個数である第1カウント数と、前記第2参照ピクチャを用いたブロックの個数である第2カウント数とをカウントするようにしてもよい。この場合、第1参照ピクチャは、特定フィールドより先行するボトムフィールドとし、第2参照ピクチャは、第1参照ピクチャと同じフィールドペア内のトップフィールドとすればよい。
また、図18、図21における第1参照ピクチャと第2参照ピクチャを逆にしてもよい。つまり、トップフィールド302、296を第1参照ピクチャ、ボトムフィールド298、292を第2参照ピクチャとしてもよい。このとき、図7に示したモジュール520のYとNを逆にすればよい。この場合のモジュール520の比率(第1参照カウンタの値/第2参照カウンタの値の)は大きいほど、符号化対象ボトムフィールドの動きが大きいと予測され、比率が小さいほど符号化対象ボトムフィールドの動きが小さいと予測される。
本発明は、画像を符号化又は復号化する符号化装置、復号化装置に適しており、動画配信するウェブサーバー、それを受信するネットワーク端末、動画の記録再生可能なデジタルカメラ、カメラ付き携帯電話機、DVD録画/再生機、PDA、パーソナルコンピュータ等に適している。
図1は、フィールドピクチャペアを示す説明図である。 図2Aは、ピクチャの符号化順序の一例を示す図である。 図2Bは、図2Aのピクチャの表示順序を示す図である。 図3Aは、参照ピクチャ候補からなる第1のサブセットの一例を示す図である。 図3Bは、参照ピクチャ候補からなる第2のサブセットの一例を示す図である。 図3Cは、第2サブセットにおいて参照ピクチャ候補から排除されるピクチャの一例を示す図である。 図4は、実施の形態1における画像符号化装置の主要部の構成を示すブロック図である。 図5は、参照ピクチャ選択方法および画像符号化装置に関するピクチャ(符号化順)の例を示す図である。 図6は、画像符号化装置における符号化および参照ピクチャ設定処理を示すフローチャートである。 図7は、図6中の分析処理を詳細に示すフローチャートである。 図8は、図6中の参照ピクチャ候補設定処理を詳細に示すフローチャートである。 図9は、実施の形態2における画像符号化装置における符号化および参照ピクチャ設定処理を示すフローチャートである。 図10は、図9中の分析処理を詳細に示すフローチャートである。 図11は、実施の形態3における画像符号化装置における符号化および参照ピクチャ設定処理を示すフローチャートである。 図12は、図11中の参照ピクチャ候補設定処理を詳細に示すフローチャートである。 図13は、実施の形態4における符号化および参照ピクチャ設定処理を示すフローチャートである。 図14Aは、空間的直近フィールド付与された参照インデックスref_idxの例を示す図である。 図14Bは、時間的直近フィールド付与された参照インデックスref_idxの例を示す図である。 図15は、図13中の参照インテックス設定処理の詳細を示すフローチャートである。 図16は、実施の形態4における符号化および参照ピクチャ設定処理の他の例を示すフローチャートである。 図17は、実施の形態4における符号化および参照ピクチャ設定処理のさらに他の例を示すフローチャートである。 図18は、実施の形態5における参照ピクチャ選択方法及び画像符号化方法に用いられる符号化順のピクチャの一例を示す図である。 図19は、実施の形態5における画像符号化装置における符号化および参照ピクチャ設定処理を示すフローチャートである。 図20は、実施の形態6における画像符号化装置における符号化および参照ピクチャ設定処理を示すフローチャートである。 図21は、実施の形態7における参照ピクチャ選択方法及び画像符号化方法に用いられる符号化順のピクチャの一例を示す図である。 図22は、実施の形態7における画像符号化装置における符号化および参照ピクチャ設定処理を示すフローチャートである。 図23は、実施の形態8における画像符号化装置における符号化および参照ピクチャ設定処理を示すフローチャートである。 図24は、実施の形態9における参照ピクチャ選択方法及び画像符号化方法に用いられる符号化順のピクチャの一例を示す図である。 図25は、実施の形態9における画像符号化装置における符号化および参照ピクチャ設定処理を示すフローチャートである。 図26は、実施の形態10における画像符号化装置における符号化および参照ピクチャ設定処理を示すフローチャートである。
符号の説明
101 入力ピクチャメモリ
102 減算器
103 直交変換・量子化部
104 可変長符号化部
107 逆直交変換・逆量子化部
108 参照ピクチャ生成部
109 参照ピクチャメモリ
110 画面間予測部
111 制御部
304、298、292 第1参照ピクチャ
308、302、296 第2参照ピクチャ
310 空間的直近フィールド
314 時間的直近フィールド
316 符号化対象ボトムフィールド

Claims (17)

  1. インターレースビデオの符号化において、符号化対象のボトムフィールドのための参照ピクチャを選択する方法であって、
    前記符号化対象のボトムフィールドよりも符号化順で先行する特定フィールドを用いて、前記符号化対象のボトムフィールドの動きの大きさを予測し、
    予測した動きの大きさに応じて、前記インターレースビデオに含まれる複数のピクチャの中から、前記符号化対象のボトムフィールドの符号化に適したピクチャのみを選択して、選択されたピクチャを参照ピクチャ候補として設定するとともに、前記符号化対象のボトムフィールドの符号化に適していないピクチャを前記参照ピクチャ候補から排除し、
    設定された参照ピクチャ候補の中から、前記符号化対象のボトムフィールドの参照ピクチャを選択し、
    前記動きの大きさの予測結果に応じて、前記符号化対象のボトムフィールドよりも符号化順で直前の双予測符号化フィールドペア内のボトムフィールドである空間的直近フィールドを前記参照ピクチャ候補に含める
    ことを特徴とする参照ピクチャ選択方法。
  2. 前記特定フィールドは、前記符号化対象のボトムフィールドよりも符号化順で先行するフィールドペア内のボトムフィールドであり、
    第1参照ピクチャは、前記特定フィールドと同じフィールドペア内のトップフィールドであり、
    第2参照ピクチャは、前記特定フィールドよりも符号化順で直前のフィールドペア内のボトムフィールドであり、
    前記動きの大きさの予測において、
    前記特定フィールドの符号化において、前記第1参照ピクチャを用いたブロックの個数である第1カウント数と、前記第2参照ピクチャを用いたブロックの個数である第2カウント数とをカウントし、
    前記符号化対象のボトムフィールドの動きの大きさとして、前記第1カウント数と前記第2カウント数との比または差分を算出する
    ことを特徴とする請求項記載の参照ピクチャ選択方法。
  3. 前記参照ピクチャ候補の設定において、
    前記第1カウント数と前記第2カウント数との比または差分としきい値とを比較し、
    前記比較結果に応じて、前記空間的直近フィールドを前記参照ピクチャ候補に含める
    ことを特徴とする請求項記載の参照ピクチャ選択方法。
  4. 前記特定フィールドは、前記符号化対象のボトムフィールドの属するフィールドペアから符号化順でN個前のフィールドペア内のボトムフィールドであり、
    前記Nは1ないし3から選ばれる
    ことを特徴とする請求項記載の参照ピクチャ選択方法。
  5. 前記特定フィールドは、前記符号化対象のボトムフィールドよりも符号化順で先行するトップフィールドであり、
    前記動きの大きさの予測において、
    前記特定フィールドの符号化において、イントラ符号化されたブロックの個数である第1カウント数と、イントラ以外で符号化されたブロックの個数である第2カウント数とをカウントし、
    前記符号化対象のボトムフィールドの動きの大きさとして、前記第1カウント数と前記第2カウント数との比または差分を算出する
    ことを特徴とする請求項記載の参照ピクチャ選択方法。
  6. 前記参照ピクチャ候補の設定において、
    前記第1カウント数と前記第2カウント数との比または差分としきい値とを比較し、
    前記比較結果に応じて、前記空間的直近フィールドを前記参照ピクチャ候補に含める
    ことを特徴とする請求項記載の参照ピクチャ選択方法。
  7. 前記特定フィールドは、前記符号化対象のボトムフィールドの属するフィールドペアから符号化順でN個前のフィールドペア内のボトムフィールドであり、
    前記Nは0ないし3から選ばれる
    ことを特徴とする請求項記載の参照ピクチャ選択方法。
  8. 前記特定フィールドは第1のフィールド、第2のフィールドの一方であり、
    前記第1のフィールドは前記符号化対象のボトムフィールドよりも符号化順で先行するフィールドペア内のボトムフィールドであり、
    前記第2のフィールドは当該フィールドペア内のトップフィールドであり、
    前記動きの大きさの予測において、
    前記動きの大きさとして、第1および第2の相関性を算出し、
    第1の相関性は、前記符号化対象のボトムフィールドと前記第1のフィールドとの相関性であり、第2の相関性は、前記符号化対象のボトムフィールドと前記第2のフィールドとの相関性であり、
    前記参照ピクチャ候補の設定において、
    第1の相関性と第2の相関性との比または差分に応じて、前記参照ピクチャ候補に設定
    する
    ことを特徴とする請求項記載の参照ピクチャ選択方法。
  9. 前記参照ピクチャ候補の設定において、
    第1の相関性と第2の相関性との比または差分に応じて、前記空間的直近フィールドを前記参照ピクチャ候補に含める
    ことを特徴とする請求項記載の参照ピクチャ選択方法。
  10. 前記特定フィールドは第1のフィールド、第2のフィールドの一方であり、
    前記第1のフィールドは前記符号化対象のボトムフィールドよりも符号化順で先行するフィールドペア内のトップフィールドであり、
    前記第2のフィールドは当該フィールドペア内のボトムフィールドであり、
    前記動きの大きさの予測において、
    前記第1のフィールド、前記第2のフィールドおよび前記符号化対象のボトムフィールドそれぞれの縮小画像を生成し、
    縮小画像を用いて、前記第1のフィールドに対する符号化対象のボトムフィールドの動きを検出し、
    縮小画像を用いて、前記第2のフィールドに対する符号化対象のボトムフィールドの動きを検出する
    ことを特徴とする請求項記載の参照ピクチャ選択方法。
  11. 前記参照ピクチャ候補の設定において、
    検出された2つの動きに基づいて、前記空間的直近フィールドを前記参照ピクチャ候補に含める
    ことを特徴とする請求項10記載の参照ピクチャ選択方法。
  12. 前記符号化対象のボトムフィールドは双予測画面間符号化されたピクチャを参照可能なフィールドペアに属し、
    前記参照ピクチャ候補の設定において、
    予測された動きに応じて、参照可能な全てのピクチャから選ばれた参照ピクチャ候補からなる第1のサブセットおよび第2のサブセットの一方を選択し、
    前記第1のサブセットは、前記符号化対象フィールドと同じフィールドペア内のトップフィールドである時間的直近フィールドを含み、前記空間的直近フィールドを含まず、
    前記第2のサブセットは前記空間的直近フィールドを含み前記時間的直近フィールドを含まない
    ことを特徴とする請求項1記載の参照ピクチャ選択方法。
  13. 前記参照ピクチャ選択方法は、さらに
    参照ピクチャ候補に前記空間的直近フィールドが含まれているとき、当該空間的直近フィールドに最小のビット数で表される参照インデックスを付与する
    ことを特徴とする請求項1記載の参照ピクチャ選択方法。
  14. 請求項1記載の参照ピクチャ選択方法を含むことを特徴とする画像符号化方法。
  15. 請求項1記載の参照ピクチャ選択方法をコンピュータに実行させることを特徴とするプログラム。
  16. インターレースビデオを符号化する画像符号化装置であって、
    符号化対象のボトムフィールドよりも符号化順で先行する特定フィールドを用いて、前記符号化対象のボトムフィールドの動きの大きさを予測する予測手段と、
    予測した動きの大きさに応じて、前記インターレースビデオに含まれる複数のピクチャの中から、前記符号化対象のボトムフィールドの符号化に適したピクチャのみを選択して、選択されたピクチャを参照ピクチャ候補として設定するとともに、前記符号化対象のボトムフィールドの符号化に適していないピクチャを前記参照ピクチャ候補から排除する設定手段と、
    設定された参照ピクチャ候補の中から、前記符号化対象のボトムフィールドの参照ピクチャを選択する選択手段と、
    選択された参照ピクチャを用いて符号化対象のボトムフィールドを符号化する符号化手段とを備え、
    前記設定手段は、前記動きの大きさの予測結果に応じて、前記符号化対象のボトムフィールドよりも符号化順で直前の双予測符号化フィールドペア内のボトムフィールドである空間的直近フィールドを前記参照ピクチャ候補に含める
    とを特徴とする画像符号化装置。
  17. インターレースビデオを符号化する半導体装置であって、
    符号化対象のボトムフィールドよりも符号化順で先行する特定フィールドを用いて、前記符号化対象のボトムフィールドの動きの大きさを予測する予測手段と、
    予測した動きの大きさに応じて、前記インターレースビデオに含まれる複数のピクチャの中から、前記符号化対象のボトムフィールドの符号化に適したピクチャのみを選択して、選択されたピクチャを参照ピクチャ候補として設定するとともに、前記符号化対象のボトムフィールドの符号化に適していないピクチャを前記参照ピクチャ候補から排除する設定手段と、
    設定された参照ピクチャ候補の中から、前記符号化対象のボトムフィールドの参照ピクチャを選択する選択手段と、
    選択された参照ピクチャを用いて符号化対象のボトムフィールドを符号化する符号化手段とを備え、
    前記設定手段は、前記動きの大きさの予測結果に応じて、前記符号化対象のボトムフィールドよりも符号化順で直前の双予測符号化フィールドペア内のボトムフィールドである空間的直近フィールドを前記参照ピクチャ候補に含める
    とを特徴とする半導体装置。
JP2007538753A 2005-10-05 2006-10-02 参照ピクチャ選択方法、画像符号化方法、プログラム、画像符号化装置および半導体装置 Expired - Fee Related JP5422124B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US72347305P 2005-10-05 2005-10-05
US60/723,473 2005-10-05
PCT/JP2006/319686 WO2007040197A1 (ja) 2005-10-05 2006-10-02 参照画像選択方法および装置

Publications (2)

Publication Number Publication Date
JPWO2007040197A1 JPWO2007040197A1 (ja) 2009-04-16
JP5422124B2 true JP5422124B2 (ja) 2014-02-19

Family

ID=37906238

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007538753A Expired - Fee Related JP5422124B2 (ja) 2005-10-05 2006-10-02 参照ピクチャ選択方法、画像符号化方法、プログラム、画像符号化装置および半導体装置

Country Status (5)

Country Link
US (1) US8687694B2 (ja)
EP (1) EP1933570A4 (ja)
JP (1) JP5422124B2 (ja)
CN (1) CN101283600B (ja)
WO (1) WO2007040197A1 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5173613B2 (ja) * 2007-07-03 2013-04-03 キヤノン株式会社 動画像符号化装置及びその制御方法
JP4892450B2 (ja) 2007-10-17 2012-03-07 パナソニック株式会社 画像符号化装置および画像符号化方法
US8270472B2 (en) * 2007-11-09 2012-09-18 Thomson Licensing Methods and apparatus for adaptive reference filtering (ARF) of bi-predictive pictures in multi-view coded video
US20100303155A1 (en) * 2008-01-29 2010-12-02 Yuki Maruyama Image coding device, image coding method, image coding integrated circuit and image coding program
KR100939917B1 (ko) * 2008-03-07 2010-02-03 에스케이 텔레콤주식회사 움직임 예측을 통한 부호화 시스템 및 움직임 예측을 통한부호화 방법
US8861598B2 (en) * 2008-03-19 2014-10-14 Cisco Technology, Inc. Video compression using search techniques of long-term reference memory
KR101445791B1 (ko) * 2008-05-10 2014-10-02 삼성전자주식회사 움직임 벡터 변환을 이용한 비월 주사 영상 부호화/복호화방법 및 장치
JP2010063092A (ja) * 2008-08-05 2010-03-18 Panasonic Corp 画像符号化装置、画像符号化方法、画像符号化集積回路およびカメラ
JP2010232734A (ja) * 2009-03-25 2010-10-14 Panasonic Corp 画像符号化装置及び画像符号化方法
JP5489557B2 (ja) 2009-07-01 2014-05-14 パナソニック株式会社 画像符号化装置及び画像符号化方法
US8699778B2 (en) * 2009-07-29 2014-04-15 Panasonic Corporation Image coding method, image coding apparatus, program, and integrated circuit
CN102823247B (zh) * 2010-03-30 2015-04-08 富士通株式会社 图像处理装置和图像处理方法
KR101444691B1 (ko) * 2010-05-17 2014-09-30 에스케이텔레콤 주식회사 참조영상 구성 및 인덱싱 장치 및 방법
JP5625512B2 (ja) * 2010-06-09 2014-11-19 ソニー株式会社 符号化装置、符号化方法、プログラム、および記録媒体
JP2012023652A (ja) * 2010-07-16 2012-02-02 Sony Corp 画像処理装置と画像処理方法
WO2013057782A1 (ja) * 2011-10-17 2013-04-25 株式会社東芝 符号化方法及び復号方法
BR112014031502A2 (pt) * 2012-06-21 2017-06-27 Ericsson Telefon Ab L M aparelho e método para codificar um sinal de vídeo
CN103873872B (zh) * 2012-12-13 2017-07-07 联发科技(新加坡)私人有限公司 参考图像管理方法及装置
JP2014112952A (ja) * 2014-02-25 2014-06-19 Panasonic Corp 画像符号化装置
CN114501020A (zh) * 2016-08-21 2022-05-13 上海天荷电子信息有限公司 使用最近运动矢量和邻近运动矢量的图像压缩方法和装置
CN106303570B (zh) * 2016-08-22 2019-07-05 北京奇艺世纪科技有限公司 一种视频编码参考帧选择方法和装置
CN107820095B (zh) * 2016-09-14 2020-01-03 北京金山云网络技术有限公司 一种长期参考图像选择方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0541861A (ja) * 1991-05-31 1993-02-19 Toshiba Corp 動画像符号化装置
JP2002330443A (ja) * 2001-03-16 2002-11-15 Sharp Corp ディジタル動画システムにおける画像の位置変化を効率的に推定する方法
US20050053147A1 (en) * 2003-09-07 2005-03-10 Microsoft Corporation Motion vector prediction in bi-directionally predicted interlaced field-coded pictures
US20050053144A1 (en) * 2003-09-07 2005-03-10 Microsoft Corporation Selecting between dominant and non-dominant motion vector predictor polarities
JP2005260588A (ja) * 2004-03-11 2005-09-22 Canon Inc 符号化装置、符号化方法、復号装置、復号方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1422946A4 (en) 2002-07-26 2008-04-02 Matsushita Electric Ind Co Ltd MOVING IMAGE PROCEDURE, MOVABLE IMAGE DECODING METHOD AND RECORD MEDIUM
AU2005203096B2 (en) * 2003-03-03 2007-11-29 Lg Electronics Inc. Method of selecting a reference picture
KR100693669B1 (ko) * 2003-03-03 2007-03-09 엘지전자 주식회사 피일드 매크로 블록의 레퍼런스 픽쳐 결정 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0541861A (ja) * 1991-05-31 1993-02-19 Toshiba Corp 動画像符号化装置
JP2002330443A (ja) * 2001-03-16 2002-11-15 Sharp Corp ディジタル動画システムにおける画像の位置変化を効率的に推定する方法
US20050053147A1 (en) * 2003-09-07 2005-03-10 Microsoft Corporation Motion vector prediction in bi-directionally predicted interlaced field-coded pictures
US20050053144A1 (en) * 2003-09-07 2005-03-10 Microsoft Corporation Selecting between dominant and non-dominant motion vector predictor polarities
JP2005260588A (ja) * 2004-03-11 2005-09-22 Canon Inc 符号化装置、符号化方法、復号装置、復号方法

Also Published As

Publication number Publication date
WO2007040197A1 (ja) 2007-04-12
EP1933570A1 (en) 2008-06-18
JPWO2007040197A1 (ja) 2009-04-16
US20100150240A1 (en) 2010-06-17
EP1933570A4 (en) 2010-09-29
CN101283600B (zh) 2012-10-03
CN101283600A (zh) 2008-10-08
US8687694B2 (en) 2014-04-01

Similar Documents

Publication Publication Date Title
JP5422124B2 (ja) 参照ピクチャ選択方法、画像符号化方法、プログラム、画像符号化装置および半導体装置
US20190014328A1 (en) Moving picture coding method, moving picture decoding method, and apparatuses of the same
KR100774296B1 (ko) 움직임 벡터 부호화 방법, 복호화 방법 및 그 장치
JP5188875B2 (ja) 画像予測符号化装置、画像予測復号装置、画像予測符号化方法、画像予測復号方法、画像予測符号化プログラム、及び画像予測復号プログラム
KR100739281B1 (ko) 움직임 추정 방법 및 장치
US20120057631A1 (en) Method and device for motion estimation of video data coded according to a scalable coding structure
US20120076207A1 (en) Multiple-candidate motion estimation with advanced spatial filtering of differential motion vectors
US9699451B2 (en) Motion estimation compatible with multiple standards
KR20200002036A (ko) 비디오 코딩에서 모션 보상 예측을 위한 광흐름 추정
EP2076046A2 (en) Configurable performance motion estimation for video encoding
JP2007329693A (ja) 画像符号化装置、及び画像符号化方法
JP2007053561A (ja) 画像符号化装置および画像符号化方法
JP4694903B2 (ja) 符号化方法およびこの方法を実施するための回路装置
JP2004032355A (ja) 動画像符号化方法,動画像復号方法,動画像符号化装置および動画像復号装置
CN113225558B (zh) 平滑定向和dc帧内预测
US10148954B2 (en) Method and system for determining intra mode decision in H.264 video coding
JP2005268879A (ja) 画像符号化方法およびその装置
JP7485809B2 (ja) インター予測方法及び装置、ビデオエンコーダ、並びにビデオデコーダ
CN110677645A (zh) 一种图像预测方法及装置
KR100774297B1 (ko) 움직임 벡터 복호화 방법 및 그 장치
JP2008099175A (ja) 動画符号化装置および動画符号化方法
CN118715777A (zh) 采用由直接mv投影(dmvp)生成的虚拟参考帧的预测视频编码
WO2024253771A1 (en) Adaptive motion field generation for video coding
KR100774300B1 (ko) 움직임 벡터 복호화 방법 및 그 장치
JP5274181B2 (ja) 動画像符号化装置および動画像符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090803

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120403

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120524

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130328

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131125

LAPS Cancellation because of no payment of annual fees