Nothing Special   »   [go: up one dir, main page]

JP2009508388A - 多視点動映像を符号化及び復号化する装置及び方法 - Google Patents

多視点動映像を符号化及び復号化する装置及び方法 Download PDF

Info

Publication number
JP2009508388A
JP2009508388A JP2008529927A JP2008529927A JP2009508388A JP 2009508388 A JP2009508388 A JP 2009508388A JP 2008529927 A JP2008529927 A JP 2008529927A JP 2008529927 A JP2008529927 A JP 2008529927A JP 2009508388 A JP2009508388 A JP 2009508388A
Authority
JP
Japan
Prior art keywords
deviation
view video
disparity
vectors
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008529927A
Other languages
English (en)
Other versions
JP4663792B2 (ja
Inventor
ハ,テ−ヒョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020060030147A external-priority patent/KR101261577B1/ko
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2009508388A publication Critical patent/JP2009508388A/ja
Application granted granted Critical
Publication of JP4663792B2 publication Critical patent/JP4663792B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

多視点動映像を符号化及び復号化する方法及び装置を提供する。該多視点動映像の符号化装置は、現在のフレームと参照フレームとを受信してフレーム間の視差ベクトルを所定のブロック単位で予測する視差予測部と、予測された視差ベクトル間の偏差または偏差の偏差を計算する視差偏差計算部と、計算された視差ベクトル間の偏差または偏差の偏差を利用して多視点動映像を符号化する符号化部とを備える。これにより、多視点動映像の圧縮率を向上させることができる。

Description

本発明は、多視点動映像を符号化及び復号化する方法及び装置に係り、多視点動映像符号化の圧縮率を向上させるための多視点動映像の符号化方法及び装置、そして多視点動映像の復号化方法及び装置に関する。
最近、新しいH.264ビデオコーディング標準が、以前の標準に比べ、高い符号化効率によって注目を受けている。該新しい標準は、一般的な双方向(B)予測スライスを考慮するだけではなく、16×16から4×4にわたった可変ブロックサイズ、及びループデブロッキングフィルタでの動き補償のための四分木(quadtree)構造、多重参照フレーム、イントラ予測、コンテクスト適応性エントロピーコーディングを考慮するように、さまざまな新しい特性に依存する。MPEG−2及びMPEG−4パート2のような標準と異なり、Bスライスは、同じ方向(順方向または逆方向)から出てくる映像から多重予測を利用しつつ、それらは、異なるスライスの参照映像に利用されうる。しかし、この標準に係る前述のような特徴は、予測モード、動きベクトル及び/または参照映像を含む動き情報を符号化するのに、多くのビット量が要求されるという問題点がある。
この問題を緩和するために、スキップ(SKIP)及び直接(DIRECT)モードがPスライスとBスライスからにそれぞれ導入された。それらのモードは、以前に符号化された動きベクトル情報を利用し、現在符号化しようとするピクチャの任意ブロックの動き予測を可能にする。従って、マクロブロックまたはブロックについてのいかなる付加的な動きデータも符号化しない。それらモードのための動きは、隣接したMB(MacroBlock)またはピクチャの動きの空間的(SKIP)または時間的(DIRECT)関連性を利用して獲得される。
図1は、Bピクチャのディレクトモードについて説明する図である。ディレクトモードは、現在符号化しようとするBピクチャの任意のブロックの動きを予測するにおいて、時間的に次のピクチャであるPピクチャの対応ブロック(co-located block)の動きベクトルを利用し、順方向動きベクトル及び逆方向動きベクトルを求めるのである。
Bピクチャ110での動きを予測しようとするディレクトモードブロック102の順方向動きベクトルMVLO及び逆方向動きベクトルMVL1を計算するために、時間的に次のピクチャである参照リスト1ピクチャ120でのディレクトモードブロック102と同じ位置のブロックである対応ブロック(co-located block)104が動きベクトルによって参照している参照リスト0ピクチャ130に対する動きベクトルMVを探す。それにより、Bピクチャ110のディレクトモードブロック102の順方向動きベクトルMVLO及び逆方向動きベクトルMVL1は、次の式(1)及び式(2)によって計算される。
Figure 2009508388
Figure 2009508388
ここで、MVは、参照リスト1ピクチャ120の対応ブロック104の動きベクトルを示す。TRは、参照リスト0ピクチャ130から参照リスト1ピクチャ120までの距離を示し、TRは、Bピクチャ110から参照リストピクチャ0130までの距離を示す。
図2は、空間領域で動きベクトルを予測する方法について説明する図である。動映像データを符号化するために使われるH.264標準によれば、1つのフレームを所定大きさのブロックに分け、すでに符号化が終わった隣接したフレームを参照し、最も類似したブロックを検索する動き検索を遂行する。すなわち、現在マクロブロックcの左側4と上端2、そして上端右側3の3つのマクロブロックの動きベクトルのうち、中間値を動きベクトルの予測値として定める。かような動きベクトル予測は、式(3)で示すことができる。
Figure 2009508388
このように、時間的な関連性だけではなく、空間的関連性も利用して動映像を符号化する方法が提示されており、一般的な動映像より情報量がはるかに多い多視点動映像についての圧縮率を向上させ、処理速度を速める方法が必要である実情である。
本発明がなそうとする技術的課題は、多視点カメラによって撮影された多視点動映像に係る視差ベクトル間の関連性を利用し、多視点動映像の圧縮率を向上させるための多視点動映像の符号化方法及び装置を提供するところにある。
本発明がなそうとする他の技術的課題は、多視点動映像に係る視差ベクトル間の関連性を利用し、符号化された多視点動映像を復号化するための多視点動映像の復号化方法及び装置を提供するところにある。
本発明は、前記の技術的課題を解決するためのものであり、本発明の一特徴による多視点動映像の符号化装置は、現在のフレームと参照フレームとを受信してフレーム間の視差ベクトルを所定のブロック単位で予測する視差予測部と、予測された視差ベクトル間の偏差または偏差の偏差を計算する視差偏差計算部と、計算された視差ベクトル間の偏差または偏差の偏差を利用して多視点動映像を符号化する符号化部とを備える。
望ましくは、予測された視差ベクトル間の偏差は、一定である。
望ましくは、所定の基準によって視差の偏差を利用して多視点動映像を符号化するか否か、偏差の偏差を利用して多視点動映像を符号化するか否かを選択し、選択された符号化モードによるモード情報を設定する符号化モード選択部をさらに備え、符号化部は、設定されたモード情報に基づいて設定されたモード情報と共に多視点動映像を符号化する。
望ましくは、視差偏差計算部は、予測された視差ベクトルを保存する第1バッファと、第1バッファに保存された視差ベクトル間の偏差を計算する第1次演算遂行部と、偏差を保存する第2バッファと、偏差の偏差を計算する第2次演算遂行部とを備える。
前記の技術的課題を解決するために、本発明の他の特徴による多視点動映像の符号化方法は、現在のフレームと参照フレームとを受信してフレーム間の視差ベクトルを所定のブロック単位で予測する段階と、予測された視差ベクトル間の偏差または偏差の偏差を計算する段階と、視差ベクトル間の偏差または偏差の偏差を利用して多視点動映像を符号化する段階とを含む。
前記の技術的課題を解決するために、本発明のさらに他の特徴による多視点動映像の復号化装置は、符号化された多視点動映像に含まれる多視点動映像符号化モードを示すモード情報を確認する符号化モード確認部と、確認されたモード情報によって多視点動映像に係る視差ベクトルを決定する視差ベクトル決定部と、決定された視差ベクトルを利用して多視点動映像を復号化する復号化部とを備え、多視点動映像符号化モードを示すモード情報は、多視点動映像が視差ベクトル間の偏差を利用して符号化されているか否か、偏差の偏差を利用して符号化されているか否かを示す。
望ましくは、視差ベクトル決定部は、モード情報が視差ベクトル間の偏差を利用して符号化されていることを示す場合、現在i位置のブロックの視差ベクトル間の偏差をdDVとするとき、以前ブロックの視差ベクトルDVi−1と視差ベクトル間の偏差dDVとを加えて現在i位置のブロックの視差ベクトルDVを決定する。
望ましくは、視差ベクトル決定部は、モード情報が視差ベクトル間の偏差の偏差を利用して符号化されていることを示す場合、現在i位置のブロックの視差ベクトル間の偏差の偏差をddDVとするとき、以前ブロックの視差ベクトル間の偏差dDVi−1と視差ベクトル間の偏差の偏差ddDVとを加えて現在i位置のブロックの視差ベクトル間の偏差dDVを決定し、以前ブロックの視差ベクトルDVi−1と決定された視差ベクトル間の偏差dDVとを加えて現在i位置のブロックの視差ベクトルDVを決定する。
前記の技術的課題を解決するために、本発明のさらに他の特徴による多視点動映像の復号化方法は、符号化された多視点動映像に含まれる多視点動映像符号化モードを示すモード情報を確認する段階と、確認されたモード情報によって多視点動映像に係る視差ベクトルを決定する段階と、決定された視差ベクトルを利用して多視点動映像を復号化する段階とを含み、多視点動映像符号化モードを示すモード情報は、多視点動映像が視差ベクトル間の偏差を利用して符号化されているか否か、偏差の偏差を利用して符号化されているか否かを示す。
本発明によれば、視差ベクトル間の関連性を利用し、それぞれのブロックに係る視差ベクトルに係る偏差またはその偏差の偏差を符号化するので、多視点動映像の圧縮率を向上させることができる。
また本発明によれば、多視点動映像に係る視差ベクトル間の関連性を利用し、符号化された多視点動映像を復号化するための多視点動映像の復号化方法及び装置を提供できる。
以下、添付した図面を参照しつつ、本発明の望ましい実施形態について詳細に説明する。
図3は、本発明の一実施形態による多視点動映像符号化装置の構成を示すブロック図である。
本発明の一実施形態による多視点動映像の符号化装置は、多視点映像バッファ310、予測部320、視差/動き補償部330、差映像符号化部340及びエントロピー符号化部350を有する。
図3で、提案された多視点動映像の符号化装置は、多数のカメラシステムまたは他の可能な方法から通常獲得される多視点ビデオソースを受信する。入力された多視点ビデオは、多視点映像バッファ310に保存される。多視点映像バッファ310は、保存された多視点動映像ソースデータを予測部320及び差映像符号化部340に提供する。
予測部320は、視差予測部322及び動き予測部324を備え、保存された多視点ビデオソースに対して動き予測及び視差予測を実行する。
視差/動き補償部330で、視差及び動き補償は、視差予測部322及び動き予測部324で予測された動きベクトル及び視差ベクトルを利用して実行される。視差/動き補償部330は、予測された動き及び視差ベクトルを利用して復元された映像を差映像符号化部340に提供する。
差映像符号化部340は、多視点映像バッファ310から提供される原映像と、視差/動き補償部330によって補償された復元映像との差情報を、さらに良好な画質と立体感とを提供するために差映像符号化を遂行し、エントロピー符号化部350に提供する。
エントロピー符号化部350は、予測部320で生成された視差ベクトル及び動きベクトルについての情報と差映像符号化部340からの残差映像とを入力され、多視点動映像ソースデータに係るビットストリームを生成する。
H.264及びMPEG2/4のような従来のコーデックで利用される動き予測及び動き補償のための動き情報と共に、図3の視差予測部322で予測される視差情報は、視差補償のために利用される。H.264で、動き情報を減らして符号化効率を上昇させるための試みがなされたように、MVC(Multi-view Video Coding)でも視差情報を減らして符号化効率を上昇させるための試みがなされねばならない。
本発明の一実施形態によれば、視差予測部322は、所定のブロック単位で視差を予測し、符号化効率を改善するために、予測された視差ベクトル間の偏差または該偏差の偏差を計算する。そして、本発明の多視点動映像符号化は、計算された偏差または偏差の偏差を利用してなされる。
図4は、多視点カメラによって撮影されたフレームシーケンスを示す図である。水平軸は視点軸であって、多視点映像を撮影するためのカメラの個数を示す。垂直軸は時間軸であって、タイムシーケンスの個数を示す。多視点カメラが平行するように配列されれば、同じタイムシーケンスにある多視点フレーム間には、高い関連性が存在するであろう。多視点カメラが平行に配列されていなくても、多視点カメラから撮影された映像を平行に配列された多視点カメラで撮影したのと同じ状態で補正(rectify)できる。従って、多視点フレーム間の関連性を利用して多視点動映像を符号化できる。
図5は、本発明の視差ベクトル間の偏差が一定である場合について説明するための図であり、図6は、図5に図示されているように、視差ベクトル間の偏差が一定である場合、視差ベクトル間の関連性を示すグラフである。
図5で、V及びVは、同じタイムシーケンスにある任意のフレームでのMBの1ラインである。Vは、すでに符号化された参照視点フレームであり、Vは、現在符号化するためにVを利用して予測されるフレームである。図6は、各MBの視差ベクトルDVによるDVの大きさの変化を示したものである。図6で、縦軸はDVの大きさを示す。
図5で、現在のMBがiの位置にあるとき、以前のMBは、現在のMBの左側に位置するi−1位置にある。図5及び図6に図示されているように、MBラインで連続的なMBのグループのDVが線形的に変化すると仮定すれば、所定位置のMBのDVとそのMBの以前MBのDVi−1との差であるdDVは一定である。
例えば、図6で、dDV=DV−DVであり、dDV=DV−DVであり、dDV=DV−DVであり、dDV=DV−DVn−1になり、計算されたdDVは、一定値になる。従って、最初のDV値とdDV値とを利用して視差ベクトルを符号化すれば、復号化装置では、該値を利用して各MBのDVを予測できる。
隣接MBの視差偏差であるdDV間の関係は、視差偏差の偏差であるddDVでもって示すことができる。現在i位置のMBの視差偏差の偏差をddDVとするとき、ddDV=dDV−dDVi−1の関係があるので、図5及び図6に図示されているような場合には、あらゆる視差偏差の偏差ddDVは、0になる。従って、ddDVを利用して多視点動映像を符号化すれば、復号化装置では、ddDVと現在MBの以前MBのdDVi−1を利用し、dDVを計算できる。すなわち、現在位置iのマクロブロックの視差ベクトル間の偏差dDVは、次のような式(4)のように計算できる。
dDV=dDVi−1+ddDV (4)
dDVが計算されれば、現在位置iのマクロブロックの視差ベクトルDVも、式(5)によって計算されうる。
DV=DVi−1+dDV (5)
前述のように、視差ベクトルDVの偏差dDVまたは視差ベクトルの偏差dDVの偏差ddDVを利用し、多視点動映像を符号化して多視点動映像の符号化効率を高めることができる。また、ddDVを符号化すれば、dDVを符号化するのに比べ、圧縮効率がさらに改善されうる。また、式(4)及び(5)を利用すれば、dDVまたはddDVを利用し、符号化された多視点動映像を復戸するときに必要なDVを決定できる。
図7は、本発明の一実施形態による多視点動映像の符号化装置の構成を示すブロック図である。
本発明の一実施形態による多視点動映像の符号化装置は、視差予測部710、視差偏差計算部720、符号化モード選択部730及び符号化部740を備える。視差偏差計算部720は、視差ベクトルを一時保存する第1バッファ721、視差ベクトル間の偏差を計算する第1次演算遂行部722、視差ベクトル間の偏差を一時保存する第2バッファ723及びその偏差の偏差を計算する第2次演算遂行部724を備える。
連続するフレームの現在フレームと参照フレームとが視差予測部710に入力される。視差予測部710は、2つのフレーム間の所定のブロック単位、例えばマクロブロック単位で視差ベクトルDVを予測する。このとき、ブロック単位の視差ベクトル間の偏差は、一定でありえる。
視差偏差計算部720は、予測された視差ベクトル間の偏差または偏差の偏差を計算する。さらに詳細に説明すれば、まず予測されたブロック単位の視差は、視差偏差計算部720の第1バッファ721に入力され、第1バッファ721に臨時保存される。その後、ブロック単位の視差ベクトルは、第1次演算遂行部722に入力され、現在i位置のブロックの視差ベクトルをDVとするとき、視差ベクトルDVと以前の視差ベクトルDVi−1との差である視差ベクトル間の偏差dDVが計算される。
計算された視差ベクトル間の偏差dDVは、第2バッファ723に入力されて臨時保存される。第2バッファ723に臨時保存された視差ベクトル間の偏差dDVは、さらに第2次演算遂行部724に入力され、dDVと以前の視差ベクトル間の偏差dDVi−1との差である視差ベクトル間の偏差の偏差ddDVが計算される。
符号化部740は、視差偏差計算部720によって計算された視差ベクトル間の偏差または偏差の偏差を利用して多視点動映像を符号化する。
符号化モード選択部730は、dDVを利用して多視点動映像を符号化するか否か、ddDVを利用して多視点動映像を符号化するか否かを所定の基準によって選択する。符号化モード選択部730は、dDVを利用して多視点動映像を符号化する場合と、ddDVを利用して多視点動映像を符号化する場合とを区別するためのモード情報Flag_ddDVを設定して符号化部740に伝達する。
モード情報は、符号化モードについての情報を含み、情報のタイプに制限されるものではない。多視点動映像が視差ベクトルDVの偏差dDVを利用して符号化されたときと、多視点動映像が視差ベクトルDVの偏差dDVの偏差ddDVを利用して符号化されたときとを区別できる他の任意の方法を使用することも可能である。
符号化モード選択部730は、dDVを利用して多視点動映像を符号化する符号化モードを選択する場合、モード情報Flag_ddDVを0に設定して符号化部740に伝達できる。また、符号化モード選択部730は、ddDVを利用して多視点動映像を符号化する符号化モードを選択する場合、モード情報Flag_ddDVを1に設定して符号化部740に伝達できる。
符号化部740は、符号化モード選択部730から伝えられたモード情報値によって多視点動映像符号化を遂行することも可能である。符号化部740は、Flag_ddDVが0に設定されたときには、モード情報と共にdDVを利用して多視点動映像を符号化する。符号化部740は、Flag_ddDVが1に設定されたときには、モード情報と共にddDVを利用して多視点動映像を符号化する。
図8は、本発明の一実施形態による多視点動映像の符号化方法を示す図である。現在のフレームと参照フレームとを受信し、フレーム間の視差ベクトルを所定のブロック単位で予測する(S810)。予測された視差ベクトル間の偏差または視差ベクトル間の偏差の偏差を計算する(S820)。視差ベクトル間の偏差または視差ベクトル間の偏差の偏差を利用して多視点動映像を符号化する(S830)。段階S820と段階S830との間に、視差ベクトル間の偏差を利用して符号化するか否か、前記の偏差の偏差を利用して符号化するか否かを所定の基準によって選択する段階を含むことができ、段階S830を遂行するとき、選択された符号化モードによって多視点動映像を符号化できる。
図9は、本発明の一実施形態による多視点動映像復号化装置の構成を示すブロック図である。
本発明の一実施形態による多視点動映像の復号化装置は、符号化モード確認部910、視差ベクトル決定部920及び復号化部930を備える。
符号化モード確認部910は、受信される符号化された多視点動映像に含まれる多視点動映像符号化モードを示すモード情報を確認する。
視差ベクトル決定部920は、確認されたモード情報によって多視点動映像に係る視差ベクトルを決定する。
以下では、視差ベクトル決定部920が視差ベクトルを決定する過程について説明する。モード情報が視差ベクトル間の偏差を利用して符号化されており、現在i位置の所定のブロック、例えばマクロブロックの視差ベクトル間の偏差をdDVであると仮定する。このとき、以前のマクロブロックの視差ベクトルDVi−1と視差ベクトル間の偏差dDVとを加え、現在i位置のマクロブロックの視差ベクトルDVを決定する。
そして、モード情報が視差ベクトル間の偏差の偏差を利用して符号化されていることを示す場合は、次の通り視差ベクトルを決定する。まず、現在i位置のマクロブロックの視差ベクトル間の偏差の偏差をddDVとするとき、以前のマクロブロックの視差ベクトル間の偏差dDVi−1と視差ベクトル間の偏差の偏差ddDVとを加え、現在i位置のマクロブロックの視差ベクトル間の偏差dDVを決定する。その後、以前のマクロブロックの視差ベクトルDVi−1と決定された視差ベクトル間の偏差dDVとを加え、現在i位置のマクロブロックの視差ベクトルDVを決定する。
復号化部930は、前述のように、確認されたモード情報、すなわち符号化モードによって決定された視差ベクトルを利用して多視点動映像を復号化する。
本発明による方法は、コンピュータで読み取り可能な記録媒体にコンピュータで読み取り可能なコードとして具現できる。前記のプログラムを具現するコード及びコードセグメントは、当分野のコンピュータプログラマによって容易に推論されうる。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取り可能なデータが保存されるあらゆる種類の記録装置を含む。コンピュータで読み取り可能な記録媒体の例としては、ROM(Read-Only Memory)、RAM(Random-Access Memory)、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光ディスクなどがあり、またキャリアウェーブ(例えば、インターネットを介した伝送)の形態で具現されるものも含む。また、コンピュータで読み取り可能な記録媒体は、ネットワークに連結されたコンピュータシステムに分散され、分散方式でコンピュータで読み取り可能なコードで保存されて実行されうる。
以上の説明は、本発明の一実施形態に過ぎず、本発明の属する技術分野で当業者は、本発明の本質的特性から外れない範囲で変形された形態に具現できるであろう。従って、本発明の範囲は、前述の実施形態に限定されるものではなく、特許請求の範囲に記載された内容と同等な範囲内にある多様な実施形態が含まれるものと解釈されるのである。
Bピクチャのディレクトモードについて説明する図である。 空間領域で動きベクトルを予測する方法について説明する図である。 本発明の一実施形態による多視点動映像の符号化装置の構成を示すブロック図である。 多視点カメラによって撮影されたフレームシーケンスを示す図である。 本発明の視差ベクトル間の偏差が一定である場合について説明するための図である。 図5に図示されているように、視差ベクトル間の偏差が一定である場合、視差ベクトル間の関連性を示すグラフである。 本発明の一実施形態による多視点動映像の符号化装置の構成を示すブロック図である。 本発明の一実施形態による多視点動映像の符号化方法を示す図である。 本発明の一実施形態による多視点動映像の復号化装置の構成を示すブロック図である。

Claims (18)

  1. 現在のフレームと参照フレームとを受信し、前記フレーム間の視差ベクトルを予測する視差予測部と、
    前記予測された視差ベクトル間の偏差または前記偏差の偏差を計算する視差偏差計算部と、
    前記視差ベクトル間の偏差または前記偏差の偏差を利用して多視点動映像を符号化する符号化部とを備えることを特徴とする多視点動映像の符号化装置。
  2. 前記視差予測部は、前記現在フレームと前記参照フレームとの間の前記視差ベクトルを所定数のブロック単位で予測することを特徴とする請求項1に記載の多視点動映像の符号化装置。
  3. 前記予測された視差ベクトル間の偏差は、一定であることを特徴とする請求項1に記載の多視点動映像の符号化装置。
  4. 所定の基準によって視差の偏差を利用して多視点動映像を符号化するか否か、前記偏差の偏差を利用して多視点動映像を符号化するか否かを選択し、前記選択結果に基づいてモード情報を設定する符号化モード選択部をさらに備え、
    前記符号化部は、前記モード情報に基づいて多視点動映像を符号化することを特徴とする請求項1に記載の多視点動映像の符号化装置。
  5. 前記視差偏差計算部は、
    前記予測された視差ベクトルを保存する第1バッファと、
    前記第1バッファに保存された視差ベクトル間の偏差を計算する第1次演算遂行部と、
    前記偏差を保存する第2バッファと、
    前記偏差の偏差を計算する第2次演算遂行部とを備えることを特徴とする請求項1に記載の多視点動映像の符号化装置。
  6. 現在のフレームと参照フレームとを受信し、前記フレーム間の視差ベクトルを予測する段階と、
    前記予測された視差ベクトル間の偏差または前記偏差の偏差を計算する段階と、
    前記視差ベクトル間の偏差または前記偏差の偏差を利用して多視点動映像を符号化する段階とを含むことを特徴とする多視点動映像の符号化方法。
  7. 前記現在フレームと前記参照フレームとの間の視差ベクトルを所定数のブロック単位で予測することを特徴とする請求項6に記載の多視点動映像の符号化方法。
  8. 前記視差ベクトル間の偏差は、一定であることを特徴とする請求項6に記載の多視点動映像の符号化方法。
  9. 前記視差の偏差を利用して多視点動映像を符号化するか否か、前記偏差の偏差を利用して多視点動映像を符号化するか否かを選択する段階と、
    前記選択結果によってモード情報を設定する段階とをさらに含み、
    前記多視点動映像を符号化する段階は、前記設定されたモード情報に基づいて多視点動映像を符号化することを特徴とする請求項6に記載の多視点動映像の符号化方法。
  10. 前記視差ベクトル間の偏差または前記偏差の偏差を計算する段階は、
    前記視差ベクトルを保存する段階と、
    前記視差ベクトル間の偏差を計算する段階と、
    前記偏差を保存する段階と、
    前記偏差の偏差を計算する段階とを含むことを特徴とする請求項6に記載の多視点動映像の符号化方法。
  11. 符号化された多視点動映像に含まれる多視点動映像符号化モードを表すモード情報を確認する符号化モード確認部と、
    前記確認されたモード情報によって、前記多視点動映像に対する視差ベクトルを決定する視差ベクトル決定部と、
    前記決定された視差ベクトルを利用して多視点動映像を復号化する復号化部とを備え、
    前記多視点動映像符号化モードを表すモード情報は、前記多視点動映像が視差ベクトル間の偏差を利用して符号化されているか否か、前記偏差の偏差を利用して符号化されているか否かを表すことを特徴とする多視点動映像の復号化装置。
  12. 前記視差ベクトル決定部は、
    前記モード情報が前記視差ベクトル間の偏差を利用して符号化されていることを示す場合、現在i位置のブロックの視差ベクトル間の偏差をdDVとするとき、以前ブロックの視差ベクトルDVi−1と前記視差ベクトル間の偏差dDVとを加え、現在i位置のブロックの視差ベクトルDVを決定することを特徴とする請求項11に記載の多視点動映像の復号化装置。
  13. 前記視差ベクトル決定部は、
    前記モード情報が前記視差ベクトル間の偏差の偏差を利用して符号化されていることを示す場合、現在i位置のブロックの視差ベクトル間の偏差の偏差をddDVとするとき、以前ブロックの視差ベクトル間の偏差dDVi−1と前記視差ベクトル間の偏差の偏差ddDVとを加えて現在i位置のブロックの視差ベクトル間の偏差dDVを決定し、
    以前ブロックの視差ベクトルDVi−1と前記決定された視差ベクトル間の偏差dDVとを加えて現在i位置のブロックの視差ベクトルDVを決定することを特徴とする請求項11に記載の多視点動映像の復号化装置。
  14. 符号化された多視点動映像に含まれる多視点動映像符号化モードを示すモード情報を確認する段階と、
    前記モード情報の確認結果によって、前記多視点動映像に対する視差ベクトルを決定する段階と、
    前記決定された視差ベクトルを利用して多視点動映像を復号化する段階とを含み、
    前記多視点動映像符号化モードを示すモード情報は、前記多視点動映像が視差ベクトル間の偏差を利用して符号化されているか否か、前記偏差の偏差を利用して符号化されているか否かを示すことを特徴とする多視点動映像の復号化方法。
  15. 前記視差ベクトルを決定する段階は、
    前記モード情報が前記視差ベクトル間の偏差を利用して符号化されていることを示す場合、現在i位置のブロックの視差ベクトル間の偏差をdDVとするとき、
    以前ブロックの視差ベクトルDVi−1と前記視差ベクトル間の偏差dDVとを加えて現在i位置のブロックの視差ベクトルDVを決定する段階を含むことを特徴とする請求項14に記載の多視点動映像の復号化方法。
  16. 前記視差ベクトルを決定する段階は、
    前記モード情報が前記視差ベクトル間の偏差の偏差を利用して符号化されていることを示す場合、現在i位置のブロックの視差ベクトル間の偏差の偏差をddDVとするとき、
    以前ブロックの視差ベクトル間の偏差dDVi−1と前記視差ベクトル間の偏差の偏差ddDVとを加えて現在i位置のブロックの視差ベクトル間の偏差dDVを決定する段階と、
    以前ブロックの視差ベクトルDVi−1と前記決定された視差ベクトル間の偏差dDVとを加えて現在i位置のブロックの視差ベクトルDVを決定する段階とを含むことを特徴とする請求項14に記載の多視点動映像の復号化方法。
  17. 現在のフレームと参照フレームとを受信し、前記フレーム間の視差ベクトルを予測する段階と、
    前記予測された視差ベクトル間の偏差または前記偏差の偏差を計算する段階と、
    前記視差ベクトル間の偏差または前記偏差の偏差を利用して多視点動映像を符号化する段階とを含む多視点動映像の符号化方法を遂行するためのプログラムが記録されたコンピュータで読み取り可能な記録媒体。
  18. 符号化された多視点動映像に含まれる多視点動映像符号化モードを示すモード情報を確認する段階と、
    前記モード情報の確認結果によって、前記多視点動映像に対する視差ベクトルを決定する段階と、
    前記決定された視差ベクトルを利用して多視点動映像を復号化する段階とを含み、
    前記多視点動映像符号化モードを示すモード情報は、前記多視点動映像が視差ベクトル間の偏差を利用して符号化されているか否か、前記偏差の偏差を利用して符号化されているか否かを示す多視点動映像の復号化方法を遂行するためのプログラムが記録されたコンピュータで読み取り可能な記録媒体。
JP2008529927A 2005-09-21 2006-09-21 多視点動映像を符号化及び復号化する装置及び方法 Expired - Fee Related JP4663792B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US71874005P 2005-09-21 2005-09-21
KR1020060030147A KR101261577B1 (ko) 2005-09-21 2006-04-03 다시점 동영상을 부호화 및 복호화하는 장치 및 방법
PCT/KR2006/003750 WO2007035042A1 (en) 2005-09-21 2006-09-21 Apparatus and method for encoding and decoding multi-view video

Publications (2)

Publication Number Publication Date
JP2009508388A true JP2009508388A (ja) 2009-02-26
JP4663792B2 JP4663792B2 (ja) 2011-04-06

Family

ID=37889054

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008529927A Expired - Fee Related JP4663792B2 (ja) 2005-09-21 2006-09-21 多視点動映像を符号化及び復号化する装置及び方法

Country Status (4)

Country Link
EP (1) EP1927249B1 (ja)
JP (1) JP4663792B2 (ja)
CN (1) CN101248669B (ja)
WO (1) WO2007035042A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011125625A1 (ja) * 2010-04-06 2011-10-13 ソニー株式会社 画像処理装置および方法
JP2013507055A (ja) * 2009-10-01 2013-02-28 株式会社エヌ・ティ・ティ・ドコモ ビデオ符号化における動きベクトル予測
JP2015046920A (ja) * 2014-10-15 2015-03-12 富士通株式会社 動画像復号方法、動画像符号化方法、動画像復号装置及び動画像復号プログラム

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007037645A1 (en) * 2005-09-29 2007-04-05 Samsung Electronics Co., Ltd. Method of estimating disparity vector using camera parameters, apparatus for encoding and decoding multi-view picture using the disparity vectors estimation method, and computer-redadable recording medium storing a program for executing the method
KR101276720B1 (ko) 2005-09-29 2013-06-19 삼성전자주식회사 카메라 파라미터를 이용하여 시차 벡터를 예측하는 방법,그 방법을 이용하여 다시점 영상을 부호화 및 복호화하는장치 및 이를 수행하기 위한 프로그램이 기록된 기록 매체
CN101415116B (zh) * 2007-10-15 2011-08-03 华为技术有限公司 一种确定对应宏块的方法和系统
CN101867813B (zh) * 2010-04-23 2012-05-09 南京邮电大学 面向交互式应用的多视点视频编码方法
CN102098516B (zh) * 2011-03-07 2012-10-31 上海大学 多视点视频解码端去块滤波方法
CN103597837B (zh) * 2011-06-15 2018-05-04 寰发股份有限公司 推导运动和视差矢量的方法及装置
TWI508533B (zh) 2011-11-08 2015-11-11 Samsung Electronics Co Ltd 解碼影像的裝置
KR102641723B1 (ko) 2011-11-11 2024-02-29 지이 비디오 컴프레션, 엘엘씨 깊이-맵 추정 및 업데이트를 사용한 효율적인 멀티-뷰 코딩
WO2013068548A2 (en) 2011-11-11 2013-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient multi-view coding using depth-map estimate for a dependent view
EP3739886A1 (en) 2011-11-18 2020-11-18 GE Video Compression, LLC Multi-view coding with efficient residual handling
KR102379609B1 (ko) 2012-10-01 2022-03-28 지이 비디오 컴프레션, 엘엘씨 향상 레이어 모션 파라미터들에 대한 베이스-레이어 힌트들을 이용한 스케일러블 비디오 코딩

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10191394A (ja) * 1996-12-24 1998-07-21 Sharp Corp 多視点画像符号化装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5619256A (en) * 1995-05-26 1997-04-08 Lucent Technologies Inc. Digital 3D/stereoscopic video compression technique utilizing disparity and motion compensated predictions
KR100481732B1 (ko) * 2002-04-20 2005-04-11 전자부품연구원 다 시점 동영상 부호화 장치
KR100523052B1 (ko) * 2002-08-30 2005-10-24 한국전자통신연구원 다중 디스플레이 방식을 지원하는 다시점 동영상의 객체 기반 부호화 장치 및 그 방법과 그를 이용한 객체 기반 송수신 시스템 및 그 방법
KR100828353B1 (ko) * 2003-02-05 2008-05-08 삼성전자주식회사 영상 블록 분할 방법 및 그 장치
CN1258925C (zh) * 2003-06-27 2006-06-07 中国科学院计算技术研究所 多视角视频编解码预测补偿方法及装置
KR100532105B1 (ko) * 2003-08-05 2005-11-29 삼성전자주식회사 공간분할방식 3차원 영상 신호 발생 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10191394A (ja) * 1996-12-24 1998-07-21 Sharp Corp 多視点画像符号化装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013507055A (ja) * 2009-10-01 2013-02-28 株式会社エヌ・ティ・ティ・ドコモ ビデオ符号化における動きベクトル予測
JP2015180073A (ja) * 2009-10-01 2015-10-08 株式会社Nttドコモ ビデオ符号化における動きベクトル予測
WO2011125625A1 (ja) * 2010-04-06 2011-10-13 ソニー株式会社 画像処理装置および方法
JP2015046920A (ja) * 2014-10-15 2015-03-12 富士通株式会社 動画像復号方法、動画像符号化方法、動画像復号装置及び動画像復号プログラム

Also Published As

Publication number Publication date
EP1927249B1 (en) 2018-07-18
EP1927249A4 (en) 2014-09-17
EP1927249A1 (en) 2008-06-04
WO2007035042A1 (en) 2007-03-29
CN101248669A (zh) 2008-08-20
JP4663792B2 (ja) 2011-04-06
CN101248669B (zh) 2011-01-12

Similar Documents

Publication Publication Date Title
JP4663792B2 (ja) 多視点動映像を符号化及び復号化する装置及び方法
RU2769146C1 (ru) Способ и устройство для обработки сигналов видео с использованием интер-предсказания
JP5268645B2 (ja) カメラパラメータを利用して視差ベクトルを予測する方法、その方法を利用して多視点映像を符号化及び復号化する装置、及びそれを行うためのプログラムが記録された記録媒体
US8559515B2 (en) Apparatus and method for encoding and decoding multi-view video
JP5021739B2 (ja) 信号処理方法及び装置
JP2022123085A (ja) 部分的コスト計算
JP6100240B2 (ja) 多視点ビデオの動きベクトル符号化方法及び装置、その復号化方法及び装置
JP5580453B2 (ja) 直接モード符号化及び復号化装置
JP5059766B2 (ja) 視差ベクトルの予測方法、その方法を利用して多視点動画を符号化及び復号化する方法及び装置
KR101227601B1 (ko) 시차 벡터 예측 방법, 그 방법을 이용하여 다시점 동영상을부호화 및 복호화하는 방법 및 장치
JP5197591B2 (ja) 映像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体
US11792419B2 (en) Image encoding/decoding method and device for performing prediction, and method for transmitting bitstream involving weighted prediction and bidirectional optical flow
JP2004040785A (ja) 双方向予測(b)ピクチャの時空間予測および複数ピクチャ参照動き補償の動きベクトル予測
JP6039178B2 (ja) 画像符号化装置、画像復号装置、並びにそれらの方法及びプログラム
US20220159291A1 (en) Video signal processing method and device for processing motion vector difference information for inter prediction in video signal
KR20120095611A (ko) 다시점 비디오 부호화/복호화 방법 및 장치
KR20220110284A (ko) 머지 후보들의 최대 개수 정보를 포함하는 시퀀스 파라미터 세트를 이용한 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법
JP2024125405A (ja) Bdofを行う画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
KR101261577B1 (ko) 다시점 동영상을 부호화 및 복호화하는 장치 및 방법
RU2787882C2 (ru) Способ и устройство для обработки сигналов видео с использованием интер-предсказания
JP6232117B2 (ja) 画像符号化方法、画像復号方法、及び記録媒体
JP5911982B2 (ja) 画像復号化方法
JP5750191B2 (ja) 画像復号化方法
JP2016158306A (ja) 画像復号化方法
JP2016119726A (ja) 画像復号化方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101214

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110105

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4663792

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140114

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees