JP2012105128A - 画像符号化装置 - Google Patents
画像符号化装置 Download PDFInfo
- Publication number
- JP2012105128A JP2012105128A JP2010252718A JP2010252718A JP2012105128A JP 2012105128 A JP2012105128 A JP 2012105128A JP 2010252718 A JP2010252718 A JP 2010252718A JP 2010252718 A JP2010252718 A JP 2010252718A JP 2012105128 A JP2012105128 A JP 2012105128A
- Authority
- JP
- Japan
- Prior art keywords
- motion vector
- image
- unit
- distribution
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【解決手段】現時点の原画像と現時点以前の原画像との間で動き探索処理を実施して動きベクトルを探索する原画ピクチャ間動きベクトル算出部2と、原画ピクチャ間動きベクトル算出部2により探索された動きベクトルの分布を算出するベクトル分布算出部3とを設け、フレームレート制御部4が、動きベクトルの分布の状態に基づいてピクチャのコマ落としを行うべきであるか否かを判定し、コマ落としを行うべきであると判定すれば、ピクチャのコマ落とし指示を出力して、可変長符号化のフレームレートを下げる。
【選択図】図1
Description
これらの圧縮符号化方式では、動画像に含まれる画素データのピクチャ内での空間的な相関やピクチャ間での時間的な相関を利用してデータサイズを圧縮する手法が用いられている。
また、動画像の画像信号を複数の周波数成分に区分して、各周波数成分に重み付けを行い、歪みが発生しても人が感知し難い高周波数成分を優先的に削減し、低周波数成分を極力劣化させないようにすることで、動画像を低ビットレートに圧縮した場合でも高画質を維持できるような工夫がなされている。
そのため、伝送ビットレートに合わせて動画像を圧縮した結果、圧縮による画質劣化が人の感知できるレベルに達するケースも多い。一般に、圧縮による画質劣化は伝送ビットレートを下げるほど顕著になる。
例えば、フレームレート(単位時間当りの動画像のコマ数)を維持して、量子化の精度が粗い符号化を行う場合、滑らかな動きを維持することができるが、画像のボケやブロックノイズが発生するなどコンテンツの精細感が失われる。
一方、量子化の精度を維持して、フレームレートを落とすことでも伝送ビットレートを低減することができるが、この場合、コンテンツの精細感は維持することができるが、動きの滑らかさが損なわれ、符号化画像の再生時に動きがギクシャクしている違和感のある見え方となる。
例えば、動きの少ないコンテンツでは、精細感を維持する方が画像の見栄えが良いケースが多く、動きの多いコンテンツでは、精細感よりも動きの滑らかさが画質に影響することが多い。
以上のように、動画像を低ビットレートに圧縮する際には、精細感と動きの滑らかさの間でトレードオフの関係が生じるケースがあるが、そのどちらを優先するかをコンテンツの動き量に応じて切り替えることで、主観画質を高く保ったまま動画像を圧縮することが可能である。
ただし、この画像符号化装置では、動きベクトル等の画像特徴量を算出する目的で1回目の符号化を実施してから、その画像特徴量を用いて2回目の符号化を実施する2パスの処理構成となっている。
この2パスの処理構成を実現するには、2つの符号化器を搭載するか、あるいは、1つの符号化器で同じ画像を複数回符号化する仕組みが必要になる。
図1はこの発明の実施の形態1による画像符号化装置を示す構成図である。
図1において、フレームメモリ1は符号化対象の動画像(原画像)をピクチャ単位で格納し、所定の符号化条件に応じてピクチャの並べ替え処理を実施して、マクロブロック単位(例えば、16×16画素単位)の画像データを出力する。
ただし、この実施の形態1では、説明の簡単化のため、ピクチャの並べ替え処理を実施しない符号化条件で符号化する例を説明する。
なお、原画ピクチャ間動きベクトル算出部2は動きベクトル探索手段を構成している。
即ち、ベクトル分布算出部3は原画ピクチャ間動きベクトル算出部2により探索された動きベクトルをピクチャやGOPの単位、あるいはピクチャを複数の小画面に細分化した単位で集計することで、動きベクトル値の区分に基づく度数分布(ヒストグラム)を算出する処理を実施する。
ただし、度数分布は、例えば、動きベクトルの値を一定範囲毎に区切り、各範囲に含まれる動きベクトルがピクチャ内又はGOP内で、何本生成されたかをカウントしたものである。度数分布は、動きベクトルの水平成分と垂直成分毎に算出することが望ましい。
なお、ベクトル分布算出部3はベクトル分布算出手段を構成している。
また、フレームレート制御部4は利用可能な1以上の符号化モード(1以上のイントラ符号化モード、1以上のインター符号化モード)の中から、符号化対象のマクロブロックに適する符号化モードを選択する処理を実施する。
また、フレームレート制御部4は後述する差分画像が圧縮される際に用いられる量子化パラメータ及び変換ブロックサイズを決定するとともに、予測処理が実施される際に用いられるイントラ予測パラメータ又はインター予測パラメータを決定し、その量子化パラメータを量子化部12及び逆量子化部14に出力し、その変換ブロックサイズを直交変換部11及び逆直交変換部15に出力し、そのイントラ予測パラメータをイントラ予測部7及び可変長符号化部19に出力し、そのインター予測パラメータをインター予測部6及び可変長符号化部19に出力する処理を実施する(これらの出力については、図面上では省略している)。
なお、フレームレート制御部4はフレームレート制御手段を構成している。
即ち、動きベクトル補正部5は、原画ピクチャ間動きベクトル算出部2による動き探索処理対象の現時点の原画像がコマ落とし対象のピクチャではないが、現時点より1つ前の時点の原画像がコマ落とし対象のピクチャである場合、原画ピクチャ間動きベクトル算出部2により探索された1つ前の時点の動きベクトルを用いて、原画ピクチャ間動きベクトル算出部2により探索された現時点の動きベクトルを補正する処理を実施する。
ただし、現時点より1つ前の時点の原画像がコマ落とし対象のピクチャでない場合、原画ピクチャ間動きベクトル算出部2により探索された現時点の動きベクトルを補正せずに、その動きベクトルをインター予測部6に出力する。
なお、動きベクトル補正部5は動きベクトル補正手段を構成している。
イントラ予測部7はフレーム内の符号化済みの画像信号を参照しながら、フレームレート制御部4から出力されたイントラ予測パラメータにしたがって、フレームメモリ1から出力されたマクロブロックに対するフレーム内予測処理を実施することで予測画像を生成する処理を実施する。
なお、インター予測部6、イントラ予測部7及び切替スイッチ8から予測画像生成手段が構成されている。
直交変換部11は減算部10により生成された差分画像をフレームレート制御部4により決定された変換ブロックサイズのブロック(例えば、4×4画素または8×8画素単位のブロック)に細分化し、各ブロックに対してDCT(離散コサイン変換)などの直交変換処理を実施して、その変換結果である直交変換係数を出力する処理を実施する。
0係数置換部13はフレームレート制御部4からピクチャのコマ落とし指示が出力されていなければ、量子化部12から出力された量子化後の直交変換係数をそのまま可変長符号化部19及び逆量子化部14に出力するが、フレームレート制御部4からピクチャのコマ落とし指示が出力されると、コマ落とし対象ピクチャ内の全てのマクロブロックに係る直交変換係数を0に置換し、0の直交変換係数を可変長符号化部19及び逆量子化部14に出力する処理を実施する。
逆直交変換部15はフレームレート制御部4により決定された変換ブロックサイズ単位で、逆量子化部14から出力された直交変換係数の逆DCT(逆離散コサイン変換)を実施することで、減算部10により生成された差分画像に相当するマクロブロック単位の画像(局部復号差分画像)を出力する処理を実施する。
ループ内フィルタ部17は加算部16により生成された局部復号画像に含まれている符号化歪みを補償し、符号化歪み補償後の局部復号画像を参照画像としてフレームメモリ18に出力する処理を実施する。
フレームメモリ18はインター予測部6により次回の動き補償予測処理で用いられる参照画像として、ループ内フィルタ部17によるフィルタリング処理後の局部復号画像を格納するRAMなどの記録媒体である。
なお、減算部10、直交変換部11、量子化部12、0係数置換部13、可変長符号化部19及び符号化データ消去部20から可変長符号化手段が構成されている。
送信バッファ21は可変長符号化部19により生成されたビットストリームが出力される前に、そのビットストリームを一時的に蓄積するメモリである。
図2において、マクロブロックアドレス管理部31は原画ピクチャ間動きベクトル算出部2により探索された動きベクトルの画面ポジション(m,n)を把握し、その画面ポジション(m,n)に対応する補正ベクトルが格納されている補正ベクトル格納部32上のメモリアドレスを指定する処理を実施する。
補正ベクトル格納部32は動きベクトルの画面ポジション(m,n)毎に、補正ベクトルを格納しているメモリである。
セレクタ34はフレームレート制御部4からピクチャのコマ落とし指示が出力されていなければ、画面ポジション(m,n)の新たな補正ベクトルとして、0ベクトルを補正ベクトル格納部32に格納し、フレームレート制御部4からピクチャのコマ落とし指示が出力されると、画面ポジション(m,n)の新たな補正ベクトルとして、ベクトル加算部33により補正された動きベクトルを補正ベクトル格納部32に格納する処理を実施する。
ただし、画像符号化装置の構成要素であるフレームメモリ1、インター予測部6、イントラ予測部7、切替スイッチ8、減算部10、直交変換部11、量子化部12、逆量子化部14、逆直交変換部15、加算部16、ループ内フィルタ部17、可変長符号化部19及び送信バッファ21は、例えば、H.264に規定されている処理内容を行うものであるため、詳細な処理内容は省略する。
ただし、この実施の形態1では、説明の簡単化のため、ピクチャの並べ替え処理を実施しない符号化条件で符号化する例を説明する。
即ち、原画ピクチャ間動きベクトル算出部2は、フレームメモリ1から符号化対象のマクロブロック単位の画像データ(現時点の原画像を示す画像データ)と、参照ピクチャに相当するマクロブロック単位の画像データ(現時点以前の原画像を示す画像データ)とを取り出し、例えば、ブロックマッチング法などの既知の動き探索手法を用いて、現時点の原画像と現時点以前の原画像との間で動き探索処理を実施することで、動きベクトルを探索する。
原画像を用いる理由は、後述するピクチャのコマ落とし処理の影響を受けず、常に固定の予測距離で動きベクトルを探索することができるようにするためである。
ここで、図3は動きベクトルの探索処理を示す説明図である。
局部復号画像を用いて、動きベクトルを探索する場合、コマ落としの対象となるピクチャは、参照ピクチャになり得ないため、図3(a)に示すように、コマ落とし対象のピクチャよりも過去に符号化されたコマ落とし対象でないピクチャを参照する必要がある。
このため、コマ落とし対象のピクチャが直前に何枚存在するかで参照ピクチャとの予測距離が広がり、その結果、探索される動きベクトルも変化する。
この実施の形態1では、参照ピクチャとの予測距離を固定にして、安定的なフレームレートの制御を行うことができるようにするため、図3(b)に示すように、原画像(原画像は、復号画像がピクチャのコマ落としの対象になっても、コマ落としが行われる訳ではないので、ピクチャのコマ落とし処理の影響を受けない)を用いて、動きベクトルを探索するようにしている。
例えば、H.264の場合、マクロブロックを最小で4×4画素の予測ブロックに細分化し、各予測ブロックにつき1本の動きベクトルを設定することが可能である。その場合、マクロブロック(16×16画素)につき最大16本の動きベクトルを生成する必要がある。
ただし、予測ブロックをどこまで細分化するかは、運用条件やエンコーダ開発者の裁量によって決めればよく、例えば、予測ブロックの最小単位を8×8画素、16×8画素、8×16画素、あるいは、16×16画素というように、4×4画素よりも大きなサイズに制限しても構わない。
即ち、ベクトル分布算出部3は、原画ピクチャ間動きベクトル算出部2により探索された動きベクトルをピクチャやGOPの単位で集計することで、動きベクトル値の区分に基づく度数分布(ヒストグラム)を算出する。
ただし、度数分布は、例えば、動きベクトルの値を一定範囲毎に区切り、各範囲に含まれる動きベクトルがピクチャ内又はGOP内で、何本生成されたかをカウントしたものである。度数分布は、動きベクトルの水平成分と垂直成分毎に算出することが望ましい。
フレームレート制御部4は、コマ落としを行うべきであると判定すると、ピクチャのコマ落とし指示を0ベクトル予測強制部9、0係数置換部13及び符号化データ消去部20に出力して、可変長符号化のフレームレートが下がるようにする。
例えば、フレームレートが30fps(Frame Per Second)の入力画像に対して、2ピクチャに1枚の頻度でコマ落としを行えば、フレームレートが15fpsになり、3ピクチャに2枚の頻度でコマ落としを行えば、フレームレートが10fpsになり、15ピクチャに1枚の頻度でコマ落としを行えば、フレームレートが2fpsになる。
なお、フレームレート制御部4は、符号化対象のマクロブロックに適する符号化モードの選択処理等を実施するが、これらの処理はH.264のリファレンスソフトウェアなどで開示されている処理内容であるため説明を省略する。
以下、フレームレートの制御例を具体的に説明する。
ケース1:
図4(a)のように、ベクトル値がヒストグラムのある部分に偏っており、偏りの中心点がある指定範囲に含まれる場合は高いフレームレートを維持する。
このような分布は、例えば、カメラを一定速度で動かしながら撮像した場合に発生し、一定速度で滑らかに動作するような動画像に対してフレームレートを落とすと、動きがギクシャクして、再生画像に違和感が生じるので、高いフレームレートを維持する。
あるいは、ヒストグラムのY軸(動きベクトルの本数)の最大値を所定の閾値と比較することで判断することができる。ヒストグラムのY軸の最大値が所定の閾値より大きければ、ヒストグラムにベクトル値の偏りが存在すると判断される。
また、偏りの中心点については、ヒストグラムを構成するベクトル値の平均値や中央値(メディアン)によって求められる。
指定範囲については、フレームレートの低下と人間の視覚感度の関係を表す実験データ等から事前に決定した値を用いる。
例えば、動きベクトルの絶対値が32〜256の範囲は、フレームレートに対する視覚特性が高いという実験データに基づき、その範囲では高フレームレートが維持される指定範囲を設定する。
図4(b)のように、ベクトル値がヒストグラムのゼロ座標近くに偏っている場合は、フレームレートを低下させる。
このような分布は、例えば、静止画に近い画像が入力された場合に発生するが、動きが極端に少ない画像では、一般にフレームレートの低下に対する視覚感度が鈍く、積極的にフレームレートを落としても画質への影響が少ないので、フレームレートを低下させる。
図4(c)のように、ベクトル値がヒストグラムの非常に大きな値のエリアに偏っている場合は、ややフレームレートを低下させる。
このような分布は、カメラを非常に高速に動かした場合などに発生する。
人の目が追いつかないくらい高速な動きは着目点とならない場合が多く、そのような動画像に対して高いフレームレートを設定して画質を維持しても、画質に対する印象が向上する可能性が低い。
したがって、この場合、違和感のない程度にフレームレートを落とし、データサイズを抑えた方が有利と判断される。また、人の目が追いつかないような高速な動きに対してフレームレートを低下させることで、ピクチャの1枚1枚に対する見易さを向上させる効果も期待できる。
図4(d)のように、ヒストグラムに偏りがない場合にも、フレームレートを低下させる。
このような分布は、画像にランダムノイズなどが重畳している場合や、画面全体に様々な動きが入り乱れている場合に発生する。
このような画像は視聴者の着目点が定まり難いため、フレームレートに対する視覚感度が低下する傾向がある。
なお、ヒストグラムに偏りがあるか否かの判断は、ケース1と同様に、ベクトル値の分散値や一次ノルム値が所定の閾値以下であるか否か、あるいは、ヒストグラムのY軸の最大値が所定の閾値以上であるか否かによって判断することができる。
しかし、実際には、必ずしも三択である必要はなく、指定範囲を複数の区分に細分化し、分布の中心点がどの区分に属するかでフレームレートを定義してもよい。
また、動きベクトルの水平成分と垂直成分に対して、それぞれ個別に指定範囲の区分を設け、水平成分と垂直成分のそれぞれで求めた分布の中心点が、各々どの区分に属するかの組合せでフレームレートを定義してもよい。
図5の例では、偏りの中心点とフレームレートの関係を二次元グラフの形式で表しているが、例えば、動きベクトルの水平成分と垂直成分のそれぞれの偏りの中心点の組合せに対して、最適なフレームレートを定義する三次元グラフの形式であってもよい。
即ち、動きベクトル補正部5のマクロブロックアドレス管理部31は、原画ピクチャ間動きベクトル算出部2が動きベクトルを探索すると、その動きベクトルの画面ポジション(m,n)を把握し、その画面ポジション(m,n)に対応する補正ベクトルが格納されている補正ベクトル格納部32上のメモリアドレスを指定する。
補正ベクトル格納部32は、マクロブロックアドレス管理部31により指定されたアドレスに格納している画面ポジション(m,n)の補正ベクトルをベクトル加算部33に出力する。
セレクタ34は、フレームレート制御部4からピクチャのコマ落とし指示が出力されていなければ、画面ポジション(m,n)の新たな補正ベクトルとして、0ベクトルを補正ベクトル格納部32に格納する。
一方、フレームレート制御部4からピクチャのコマ落とし指示が出力されると、画面ポジション(m,n)の新たな補正ベクトルとして、ベクトル加算部33から出力された補正後の動きベクトルを補正ベクトル格納部32に格納する。
図6では、コマ落とし対象のピクチャが2枚連続した後に、コマ落とし非対象のピクチャの動き補償予測処理に用いられる動きベクトルの補正例を示している。
コマ落とし非対象のピクチャ(n+2)の動き補償予測処理に用いられる動きベクトルは、ピクチャの入力順において、それよりも前方に位置する全てのコマ落とし対象のピクチャ(n)、(n+1)における同一画面ポジションの動きベクトルが加算されたものである。
図6の例では、コマ落とし対象のピクチャが2枚であるが、任意の枚数であっても同一の処理を行う。コマ落とし対象のピクチャが0枚や1枚の場合も、同様に扱うことができる。
この実施の形態1では、上述したとおり、原画ピクチャ間動きベクトル算出部2が、コマ落としの実施状況によらず固定の予測距離で動きベクトルを探索するが(図3(b)を参照)、実際の符号化においては、コマ落とし非対象のピクチャは、それよりも前方のコマ落とし非対象のピクチャとの間(図3(a)の例では、ピクチャ1とピクチャ3との間)で動き補償予測処理が実施されて予測画像が生成され、その予測画像と原画像の差分画像が符号化される。
一方、この実施の形態1では、コマ落とし対象のピクチャも含む固定の予測距離のピクチャ間で動きベクトルが生成されるため、図3のピクチャ1とピクチャ3の間では、動きベクトルが直接探索されない。
そこで、ピクチャ1とピクチャ2の間で探索された動きベクトルと、ピクチャ2とピクチャ3の間で探索された動きベクトルを加算することで、ピクチャ1とピクチャ3の間の動きベクトルを生成するようにしている。
イントラ予測部7は、フレームレート制御部4から出力された符号化モードがイントラ符号化モードである場合、フレーム内の符号化済みの画像信号を参照しながら、フレームレート制御部4から出力されたイントラ予測パラメータにしたがって、フレームメモリ1から出力されたマクロブロックに対するフレーム内予測処理を実施することで予測画像を生成する。
一方、フレームレート制御部4からピクチャのコマ落とし指示が出力されると、コマ落とし対象ピクチャ内の全てのマクロブロックの符号化モードをインター符号化モードとして、当該ピクチャ内の全てのマクロブロックの動き補償予測処理に用いる動きベクトルを0ベクトルに置換し、その0ベクトルを用いて、当該マクロブロックに対する動き補償予測処理を実施することで予測画像を生成する。
そして、その予測画像を減算部10及び加算部16に出力する。
直交変換部11は、減算部10が差分画像を生成すると、その差分画像をフレームレート制御部4により決定された変換ブロックサイズのブロック(例えば、4×4画素または8×8画素単位のブロック)に細分化し、各ブロックに対してDCTなどの直交変換処理を実施して、その変換結果である直交変換係数を量子化部12に出力する。
0係数置換部13は、フレームレート制御部4からピクチャのコマ落とし指示が出力されていなければ、量子化部12から出力された量子化後の直交変換係数をそのまま可変長符号化部19及び逆量子化部14に出力する。
一方、フレームレート制御部4からピクチャのコマ落とし指示が出力されると、コマ落とし対象ピクチャ内の全てのマクロブロックに係る直交変換係数を0に置換し、0の直交変換係数を可変長符号化部19及び逆量子化部14に出力する。
逆直交変換部15は、逆量子化部14から逆量子化後の直交変換係数を受けると、フレームレート制御部4により決定された変換ブロックサイズ単位で、逆量子化後の直交変換係数の逆DCTを実施することで、減算部10により生成された差分画像に相当するマクロブロック単位の画像(局部復号差分画像)を加算部16に出力する。
ループ内フィルタ部17は、加算部16が局部復号画像を生成すると、その局部復号画像に含まれている符号化歪みを補償し、符号化歪み補償後の局部復号画像を参照画像としてフレームメモリ18に格納する。
一方、フレームレート制御部4からピクチャのコマ落とし指示が出力されると、コマ落とし対象ピクチャ内の全てのマクロブロックに係る符号化データを消去して、その符号化データを送信バッファ21に格納しないようにする。
フレームレート制御部4は、上記の通り、動きベクトルの分布に応じて可変長符号化のフレームレートを決定しているが、送信バッファ21のバッファ残量を監視し、そのバッファ残量に応じてフレームレートを補正することで、より安定的な圧縮性能を実現するようにしてもよい。
ここで、図7はバッファ残量とフレームレート補正の関係を示す説明図である。
逆にバッファ残量が少なくなるにしたがって、段階的にフレームレートを上げていくように補正する。
これにより、送信バッファ21のオーバーフローや、画像符号化装置から出力される符号量が所望のビットレートを下回って、無駄に画質が低下することを防ぐことができる。
例えば、指定されたビットレートの2倍の符号量が数秒〜数十秒の期間継続して発生しても、送信バッファ21に蓄えることで吸収し、その後、フレームレートを低下させたときに、バッファ残量を定常状態に戻すことができれば、数秒〜数十秒といった長時間にわたって画質を均一化することができる。
これにより、コマ落とし実施後の画像符号化の状態と、復号器が当該コマ落としを含むビットストリームを復号した後の状態とで、ミスマッチが発生することを防ぐことができる。
ここで、図8は可変長符号化部19により生成されたビットストリームの復号処理と符号化処理での参照ピクチャの相違を示す説明図である。
一方、符号化処理では、コマ落とし対象のピクチャP4も一旦は符号化されるため、フレームメモリ18には参照ピクチャとしてピクチャP4の局部復号画像が蓄積される。
ただし、ピクチャP3とピクチャP4の局部復号画像は完全に一致するため、ピクチャP5の符号化において、ピクチャP3の代わりにピクチャP4を参照ピクチャとして使用しても状態は同じになる。
その場合、0ベクトル予測強制部9と0係数置換部13は不要となる。0ベクトル予測強制部9と0係数置換部13を設けるか、フレームメモリ18に書込み禁止の仕組みを設けるかは、実装のし易さなどの基準で判断すればよい。
図9はこの発明の実施の形態2による画像符号化装置の原画ピクチャ間動きベクトル算出部2を示す構成図である。
図9の例では、原画ピクチャ間動きベクトル算出部2が1次動きベクトル算出部41と2次動きベクトル算出部43を実装しており、動きベクトルの探索が1次処理と2次処理で行われる2段構成になっている。
1次動きベクトル算出部41はピクチャ内の代表点の動きベクトルを探索する1次探索処理部を構成している。
メモリ42は1次動きベクトル算出部41により探索された代表点の動きベクトルを格納する記録媒体である。
2次動きベクトル算出部43はピクチャ内の全ての動きベクトルを探索する2次探索処理部を構成している。
1次動きベクトル算出部41は、現在の符号化ピクチャと、その参照ピクチャの2つの原画データを入力し、ピクチャ内のN個の代表点における動きベクトルを算出する。Nは画像符号化装置毎に定める任意の整数である。
1次動きベクトル算出部41では、定義している全ての代表点における動きベクトルを各ピクチャの符号化が行われる前に探索し、当該ベクトル群をメモリ42に格納しておくとともに、ベクトル分布の集計対象とする。
2次動きベクトル算出部43で探索された動きベクトルについてもベクトル分布の集計対象としてもよいが、後述のとおり、それらは動きベクトルが探索されたピクチャでのコマ落とし判定には使用できないというタイミング的な制約が課される。
図10は1次動きベクトル算出部41及び2次動きベクトル算出部43の処理内容を示す説明図である。
インター予測部6の動き補償予測処理において、代表点の予測ブロックの動きベクトルはメモリ42に格納されたものを使用し、代表点の予測ブロック以外の予測ブロックの動きベクトルは2次動きベクトル算出部43により探索されたものを使用する。
即ち、1次動きベクトル算出部41では、比較的広範囲で動きベクトルを探索し、2次動きベクトル算出部43では、1次動きベクトル算出部41で探索された動きベクトルの周囲を中心に狭範囲で動きベクトルを探索している。
そのため、コマ落とし判定において、過去のピクチャで集計された分布情報を用いて行うなど処理タイミングのずれが生じることがある。
一方、この実施の形態2では、原画ピクチャ間動きベクトル算出部2が、動きベクトルの探索を1次処理と2次処理で行う2段構成としており、1次動きベクトル算出部41が各ピクチャの符号化開始前に、1次処理として、代表点の動きベクトルを探索しているので、代表点の動きベクトルを用いて、コマ落とし判定を実施することができる。
代表点の動きベクトルは、個数が限定されており、予測ブロック単位の細やかな動きベクトルとは異なるが、予測ブロック単位のベクトルと同一ピクチャ内の動きベクトルである。
そのため、コマ落とし判定に用いる動きベクトルとして有用であり、精度が高いフレームレートの制御を実現することができる。
なお、代表点の動きベクトルは個数が限定されているため、その動きベクトルの探索処理は、例えば、画像信号のブランキング期間に実行するなど、符号化処理の合間に行えばよい。
1次動きベクトル算出部41から2次動きベクトル算出部43に対する動きベクトル情報を通知するための処理量のオーバーヘッドとメモリが必要となるが、従来の2パス構成と比べて増加分はごく僅かである。
図11はこの発明の実施の形態3による画像符号化装置を示す構成図であり、図において、図1と同一符号は同一または相当部分を示すので説明を省略する。
原画ピクチャ間動きベクトル算出部50は図1の原画ピクチャ間動きベクトル算出部2と同様に、フレームメモリ1から符号化対象のマクロブロック単位の画像データ(現時点の原画像を示す画像データ)と、参照ピクチャに相当するマクロブロック単位の画像データ(現時点以前の原画像を示す画像データ)とを取り出し、例えば、ブロックマッチング法などの既知の動き探索手法を用いて、現時点の原画像と現時点以前の原画像との間で動き探索処理を実施することで、動きベクトルを探索する。また、現時点の原画像とフレームメモリ18に格納されている局部復号画像間で動き探索処理を実施することで、動きベクトルを探索する。
なお、原画ピクチャ間動きベクトル算出部50は動きベクトル探索手段を構成している。
2次動きベクトル算出部44は図9の2次動きベクトル算出部43と同様に、ピクチャ内の全ての動きベクトルを探索する2次探索処理部を構成しているが、2次動きベクトル算出部44は現時点の原画像とフレームメモリ18に格納されている局部復号画像間で動き探索処理を実施することで、動きベクトルを探索する点で、図9の2次動きベクトル算出部43と相違している。
動きベクトルの分布の集計対象は、1次動きベクトル算出部41により探索された動きベクトルであり、2次動きベクトル算出部44により探索された動きベクトルは、分布の集計対象外である。
2次動きベクトル算出部44により探索された動きベクトルは、インター予測部6の動き補償予測処理に用いられるだけである。
このため、2次動きベクトル算出部44の動きベクトルの探索対象の画像として、現時点以前の原画像を使用する意味がなく、むしろ局部復号画像を用いる方が、圧縮性能の観点で良好な動きベクトルを探索することができる。
この実施の形態3では、動きベクトル補正部5が補正する動きベクトルは、図10(a)に示される方式で動きベクトルが探索される場合において、1次動きベクトル算出部41により探索された動きベクトルだけである。
2次動きベクトル算出部44により探索された動きベクトルは、現時点の原画像と局部復号画像間で動き探索処理が実施されているため、補正が不要である。
Claims (14)
- 符号化対象の原画像に対する予測処理を実施して予測画像を生成する予測画像生成手段と、上記原画像と上記予測画像生成手段により生成された予測画像との差分画像を圧縮し、圧縮後の差分画像を可変長符号化して符号化データを生成する可変長符号化手段と、現時点の原画像と現時点以前の原画像との間で動き探索処理を実施して動きベクトルを探索する動きベクトル探索手段と、上記動きベクトル探索手段により探索された動きベクトルの分布を算出するベクトル分布算出手段と、上記ベクトル分布算出手段により算出された分布の状態に基づいてピクチャのコマ落としを行うべきであるか否かを判定し、コマ落としを行うべきであると判定すれば、ピクチャのコマ落とし指示を上記可変長符号化手段に出力して、可変長符号化のフレームレートを下げるフレームレート制御手段とを備えた画像符号化装置。
- 動きベクトル探索手段による動き探索処理対象の現時点の原画像がコマ落とし対象のピクチャではないが、現時点より1つ前の時点の原画像がコマ落とし対象のピクチャである場合、上記動きベクトル探索手段により探索された1つ前の時点の動きベクトルを用いて、上記動きベクトル探索手段により探索された現時点の動きベクトルを補正する動きベクトル補正手段を設け、
予測画像生成手段が動き補償予測処理を実施して予測画像を生成する場合、上記動きベクトル補正手段により補正された動きベクトルを用いて、予測画像を生成する
ことを特徴とする請求項1記載の画像符号化装置。 - 動きベクトル補正手段は、現時点より複数前の時点の原画像から1つ前の時点の原画像まで連続してコマ落とし対象のピクチャである場合、複数前の時点から1つ前の時点の動きベクトルを累積し、上記動きベクトルの累積結果を現時点の動きベクトルに加算することで、現時点の動きベクトルを補正することを特徴とする請求項2記載の画像符号化装置。
- ベクトル分布算出手段は、動きベクトル探索手段により探索された動きベクトルの分布として、ベクトル値による度数分布を算出し、
フレームレート制御手段は、上記ベクトル分布算出手段により算出された度数分布から動きベクトルの分布の偏り状況を認識し、上記分布の偏り状況に基づいてピクチャのコマ落としを行うべきであるか否かを判定する
ことを特徴とする請求項1から請求項3のうちのいずれか1項記載の画像符号化装置。 - フレームレート制御手段は、動きベクトルの分布に偏りがあり、その偏りの中心点が特定の範囲の外側である場合、または、上記動きベクトルの分布に偏りがない場合、コマ落としを行うべきであると判定することを特徴とする請求項4記載の画像符号化装置。
- フレームレート制御手段は、ベクトル分布算出手段により算出された度数分布における動きベクトルの分散値又は一次ノルム値が所定の閾値より小さい場合、動きベクトルの分布に偏りがあると判断することを特徴とする請求項5記載の画像符号化装置。
- フレームレート制御手段は、ベクトル分布算出手段により算出された度数分布における動きベクトルの本数の最大値が所定の閾値より大きい場合、動きベクトルの分布に偏りがあると判断することを特徴とする請求項5記載の画像符号化装置。
- フレームレート制御手段は、ベクトル分布算出手段により算出された度数分布を構成する動きベクトルの平均値又は中央値から偏りの中心点を求めることを特徴とする請求項5記載の画像符号化装置。
- ベクトル分布算出手段は、動きベクトル探索手段により探索された動きベクトルの水平成分及び垂直成分の分布として、水平成分及び垂直成分の度数分布を算出し、
フレームレート制御手段は、ベクトル分布算出手段により算出された度数分布から動きベクトルの水平成分及び垂直成分の分布の偏り状況を認識し、水平成分及び垂直成分の分布の偏り状況に基づいてピクチャのコマ落としを行うべきであるか否かを判定する
ことを特徴とする請求項1から請求項3のうちのいずれか1項記載の画像符号化装置。 - フレームレート制御手段は、可変長符号化手段により生成された符号化データが出力される前に一時的に蓄積される送信バッファのバッファ残量を監視し、上記バッファ残量が増加すれば、上記可変長符号化手段における可変長符号化のフレームレートを下げる一方、上記バッファ残量が減少すれば、上記可変長符号化手段における可変長符号化のフレームレートを上げることを特徴とする請求項1から請求項9のうちのいずれか1項記載の画像符号化装置。
- 可変長符号化手段は、フレームレート制御手段からピクチャのコマ落とし指示が出力された場合、コマ落とし対象のピクチャに係る符号化データを破棄することを特徴とする請求項1から請求項10のうちのいずれか1項記載の画像符号化装置。
- 可変長符号化手段は、フレームレート制御手段からピクチャのコマ落とし指示が出力された場合、圧縮後の差分画像を示す直交変換係数を0に置換して、0の直交変換係数を可変長符号化することを特徴とする請求項1から請求項11のうちのいずれか1項記載の画像符号化装置。
- 動きベクトル探索手段は、ピクチャ内の代表点の動きベクトルを探索する1次探索処理部と、ピクチャ内の全ての動きベクトルを探索する2次探索処理部とから構成されており、上記1次探索処理部については、可変長符号化手段により符号化データが生成される前に動きベクトルを探索することを特徴とする請求項1から請求項12のうちのいずれか1項記載の画像符号化装置。
- 2次探索処理部は、現時点の原画像と可変長符号化手段により圧縮された差分画像が復号された局部復号画像との間で動き探索処理を実施して動きベクトルを探索することを特徴とする請求項13記載の画像符号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010252718A JP5656575B2 (ja) | 2010-11-11 | 2010-11-11 | 画像符号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010252718A JP5656575B2 (ja) | 2010-11-11 | 2010-11-11 | 画像符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012105128A true JP2012105128A (ja) | 2012-05-31 |
JP5656575B2 JP5656575B2 (ja) | 2015-01-21 |
Family
ID=46395005
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010252718A Expired - Fee Related JP5656575B2 (ja) | 2010-11-11 | 2010-11-11 | 画像符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5656575B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160091392A (ko) * | 2013-11-29 | 2016-08-02 | 오렌지 | 이미지를 인코딩하고 디코딩하기 위한 방법, 이미지를 인코딩하고 디코딩하기 위한 디바이스 및 상응하는 컴퓨터 프로그램 |
JP2017517940A (ja) * | 2014-05-02 | 2017-06-29 | サムスン エレクトロニクス カンパニー リミテッド | 適応的映像データ圧縮方法及びその装置 |
CN118200490A (zh) * | 2024-05-14 | 2024-06-14 | 中芯科技(哈尔滨)有限公司 | 一种5g物联网远程监控视频传输方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0923423A (ja) * | 1995-05-02 | 1997-01-21 | Sony Corp | 信号符号化方法、信号符号化装置及び信号記録媒体 |
JP2006115470A (ja) * | 2004-09-16 | 2006-04-27 | Ntt Docomo Inc | 映像評価装置、フレームレート決定装置、映像処理装置、映像評価方法、および映像評価プログラム |
JP2009296443A (ja) * | 2008-06-06 | 2009-12-17 | Mitsubishi Electric Corp | ベクトル探索範囲制限装置および動画像符号化装置 |
-
2010
- 2010-11-11 JP JP2010252718A patent/JP5656575B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0923423A (ja) * | 1995-05-02 | 1997-01-21 | Sony Corp | 信号符号化方法、信号符号化装置及び信号記録媒体 |
JP2006115470A (ja) * | 2004-09-16 | 2006-04-27 | Ntt Docomo Inc | 映像評価装置、フレームレート決定装置、映像処理装置、映像評価方法、および映像評価プログラム |
JP2009296443A (ja) * | 2008-06-06 | 2009-12-17 | Mitsubishi Electric Corp | ベクトル探索範囲制限装置および動画像符号化装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160091392A (ko) * | 2013-11-29 | 2016-08-02 | 오렌지 | 이미지를 인코딩하고 디코딩하기 위한 방법, 이미지를 인코딩하고 디코딩하기 위한 디바이스 및 상응하는 컴퓨터 프로그램 |
KR102279101B1 (ko) | 2013-11-29 | 2021-07-16 | 오렌지 | 이미지를 인코딩하고 디코딩하기 위한 방법, 이미지를 인코딩하고 디코딩하기 위한 디바이스 및 상응하는 컴퓨터 프로그램 |
KR20210090738A (ko) * | 2013-11-29 | 2021-07-20 | 오렌지 | 이미지를 인코딩하고 디코딩하기 위한 방법, 이미지를 인코딩하고 디코딩하기 위한 디바이스 및 상응하는 컴퓨터 프로그램 |
KR102391402B1 (ko) | 2013-11-29 | 2022-04-26 | 오렌지 | 이미지를 인코딩하고 디코딩하기 위한 방법, 이미지를 인코딩하고 디코딩하기 위한 디바이스 및 상응하는 컴퓨터 프로그램 |
JP2017517940A (ja) * | 2014-05-02 | 2017-06-29 | サムスン エレクトロニクス カンパニー リミテッド | 適応的映像データ圧縮方法及びその装置 |
US10757416B2 (en) | 2014-05-02 | 2020-08-25 | Samsung Electronics Co., Ltd. | Method and device for adaptively compressing image data |
CN118200490A (zh) * | 2024-05-14 | 2024-06-14 | 中芯科技(哈尔滨)有限公司 | 一种5g物联网远程监控视频传输方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5656575B2 (ja) | 2015-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4723025B2 (ja) | 画像符号化方法および画像符号化装置 | |
TWI399097B (zh) | 用於編碼視訊之系統及方法,以及電腦可讀取媒體 | |
US20070025442A1 (en) | Coding method for coding moving images | |
US20070025444A1 (en) | Coding Method | |
JPH118855A (ja) | デジタル・ビデオ信号エンコーダ及び符号化方法 | |
JP2006519565A (ja) | ビデオ符号化 | |
WO2014139396A1 (en) | Video coding method using at least evaluated visual quality and related video coding apparatus | |
US20070064809A1 (en) | Coding method for coding moving images | |
TW201347549A (zh) | 經物體偵測所告知的編碼 | |
US9565404B2 (en) | Encoding techniques for banding reduction | |
US20190014332A1 (en) | Content-aware video coding | |
EP0949822A2 (en) | Video coding control method and apparatus | |
JP7343817B2 (ja) | 符号化装置、符号化方法、及び符号化プログラム | |
JP4401336B2 (ja) | 符号化方法 | |
JP5656575B2 (ja) | 画像符号化装置 | |
US9930352B2 (en) | Reducing noise in an intraframe appearance cycle | |
US20070147515A1 (en) | Information processing apparatus | |
WO2021007702A1 (en) | Video encoding method, video decoding method, video encoding device, and video decoding device | |
JP2005295215A (ja) | 動画像符号化装置 | |
KR100930344B1 (ko) | 초기 양자화 파라미터 결정 방법 | |
JPH10108197A (ja) | 画像符号化装置、画像符号化制御方法および画像符号化制御用プログラムを記録した媒体 | |
JP4857243B2 (ja) | 画像符号化装置及びその制御方法、コンピュータプログラム | |
JP4936557B2 (ja) | 符号化装置 | |
JP4243286B2 (ja) | 符号化方法 | |
JP2007036889A (ja) | 符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130903 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140521 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140624 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140808 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141028 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141125 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5656575 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |