TWI508533B - 解碼影像的裝置 - Google Patents
解碼影像的裝置 Download PDFInfo
- Publication number
- TWI508533B TWI508533B TW104114742A TW104114742A TWI508533B TW I508533 B TWI508533 B TW I508533B TW 104114742 A TW104114742 A TW 104114742A TW 104114742 A TW104114742 A TW 104114742A TW I508533 B TWI508533 B TW I508533B
- Authority
- TW
- Taiwan
- Prior art keywords
- unit
- motion vector
- image
- current
- candidate
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/56—Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/573—Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/58—Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本發明是一種關於視訊編碼及解碼,且更特別是關於一種執行畫面間預測及/或移動補償的視訊編碼及解碼。
隨著用於再生以及儲存高解析度或高品質視訊內容的硬體正被開發以及供應,對用於有效地對高解析度或高品質視訊內容做編碼或解碼的視訊編解碼器的需要增加。根據習知視訊編解碼器,基於具有預定大小的巨集區塊而根據有限編碼方法來對視訊做編碼。
經由頻率變換而將空間區域的影像資料變換為頻率區域的係數。根據視訊編解碼器,將影像分割為具有預定大小的區塊,對每一各別區塊執行離散餘弦變換(discrete cosine transformation,DCT),並以區塊為單位來對頻率係數做編碼,以實現頻率變換的快速計算。相比空間區域的影像資料,容易壓縮頻率區域的係數。特別是,由於經由視訊編解碼器的畫面間預測或畫面內預測根據預測誤差來表達空間區域的影像像素值,因此在對預測誤差執行頻率變換時,可將大量資料變換為0。根據視訊
編解碼器,可藉由將連續且重複產生的資料替換為較小大小的資料而減少資料量。
根據多視角視訊編碼,對基礎視角視訊以及一或多個額外視角視訊做編碼以及解碼。藉由移除基礎視角視訊與額外視角視訊之間的時間/空間冗餘(temporal/spatail redundancy)以及多個視角之間的冗餘,可減少基礎視角視訊以及額外視角視訊的資料量。
本發明提供一種經由移動向量預測來執行的移動向量決定方法及裝置;一種用於藉由經由移動向量預測來執行畫面間預測以及移動補償來對視訊做編碼的方法及裝置;以及一種用於藉由經由移動向量預測來執行移動補償來對視訊做解碼的方法及裝置。
根據本發明的態樣為提供一種用於畫面間預測的移動向量決定方法,所述移動向量決定方法包含以下操作:決定候選移動向量清單,其包括經參考以便預測當前區塊的移動向量的多個候選區塊的移動向量;當多個候選區塊中的第一候選區塊的參考影像不同於所述當前區塊的參考影像時,基於所述當前區塊的參考影像以及所述第一候選區塊的參考影像中的每一者為短期參考
影像還是長期參考影像,決定是否使用所述候選移動向量清單中的第一候選區塊的移動向量;以及藉由使用選自所述候選移動向量清單中所包括的所述移動向量的候選移動向量來決定所述當前區塊的移動向量。
當執行根據本發明的一或多個實施例的決定移動向量的方法時,在由候選區塊的參考索引指示的參考影像不同於當前區塊的參考影像,而且所述當前區塊以及所述候選區塊的參考影像中的至少一者為長期參考影像的狀況下,可跳過縮放所述候選區塊的移動向量的大小的程序或參考所述候選區塊的移動向量的程序,並可控制所述當前區塊參考具有相對高預測準確度的另一候選區塊的移動向量,藉此可改良移動向量預測程序的效率。
10‧‧‧移動向量決定裝置
12‧‧‧候選者清單決定單元
14‧‧‧移動向量決定單元
21‧‧‧操作
23‧‧‧操作
25‧‧‧操作
30‧‧‧當前影像
31‧‧‧當前區塊
32‧‧‧搭配索引
33‧‧‧當前參考影像
34‧‧‧移動向量
35‧‧‧搭配影像
36‧‧‧搭配區塊
37‧‧‧移動向量
38‧‧‧搭配參考影像
40‧‧‧當前影像
41‧‧‧當前區塊
43‧‧‧參考影像
44‧‧‧移動向量
46‧‧‧相鄰區塊
47‧‧‧移動向量
48‧‧‧相鄰參考影像
51‧‧‧操作
53‧‧‧操作
55‧‧‧操作
61‧‧‧操作
63‧‧‧操作
65‧‧‧操作
67‧‧‧操作
70‧‧‧視訊編碼單元
71‧‧‧畫面間預測單元
73‧‧‧殘餘產生單元
75‧‧‧變換及量化單元
80‧‧‧視訊解碼單元
81‧‧‧逆量化及逆變換單元
83‧‧‧移動補償單元
85‧‧‧區塊復原單元
100‧‧‧視訊編碼裝置
110‧‧‧最大編碼單元分割單元
120‧‧‧編碼單元決定器
130‧‧‧輸出單元
200‧‧‧視訊解碼裝置
210‧‧‧接收器
220‧‧‧影像資料以及編碼資訊提取器
230‧‧‧影像資料解碼器
310‧‧‧視訊資料
315‧‧‧編碼單元
320‧‧‧視訊資料
325‧‧‧編碼單元
330‧‧‧視訊資料
335‧‧‧編碼單元
400‧‧‧影像編碼器
405‧‧‧當前畫面
410‧‧‧畫面內預測器
420‧‧‧移動估計器
425‧‧‧移動補償器
430‧‧‧變換器
440‧‧‧量化器
450‧‧‧熵編碼器
455‧‧‧位元串流
460‧‧‧逆量化器
470‧‧‧逆變換器
480‧‧‧解區塊單元
490‧‧‧迴路濾波單元
495‧‧‧參考畫面
500‧‧‧影像解碼器
505‧‧‧位元串流
510‧‧‧剖析器
520‧‧‧熵解碼器
530‧‧‧逆量化器
540‧‧‧逆變換器
550‧‧‧畫面內預測器
560‧‧‧移動補償器
570‧‧‧解區塊單元
580‧‧‧迴路濾波單元
585‧‧‧參考畫面
595‧‧‧所復原的畫面
600‧‧‧階層式結構
610‧‧‧編碼單元/分區/最大編碼單元/編碼單元
612‧‧‧分區
614‧‧‧分區
616‧‧‧分區
620‧‧‧編碼單元/分區
622‧‧‧分區
624‧‧‧分區
626‧‧‧分區
630‧‧‧編碼單元/分區
632‧‧‧分區
634‧‧‧分區
636‧‧‧分區
640‧‧‧編碼單元/分區
642‧‧‧分區
644‧‧‧分區
646‧‧‧分區
710‧‧‧編碼單元
720‧‧‧變換單元
800‧‧‧資訊
802‧‧‧分區
804‧‧‧分區
806‧‧‧分區
808‧‧‧分區
810‧‧‧資訊
812‧‧‧畫面內模式
814‧‧‧畫面間模式
816‧‧‧跳過模式
820‧‧‧資訊
822‧‧‧第一畫面內變換單元
824‧‧‧第二畫面內變換單元
826‧‧‧第一畫面間變換單元
828‧‧‧第二畫面內變換單元
900‧‧‧編碼單元/當前最大編碼單元
910‧‧‧預測單元
912‧‧‧分區類型/編碼單元/分區
914‧‧‧分區類型
916‧‧‧分區類型
918‧‧‧分區類型
920‧‧‧操作
930‧‧‧編碼單元
940‧‧‧預測單元
942‧‧‧分區類型
944‧‧‧分區類型
946‧‧‧分區類型
948‧‧‧分區類型
950‧‧‧操作
960‧‧‧編碼單元
970‧‧‧操作
980‧‧‧編碼單元
990‧‧‧預測單元
992‧‧‧分區類型
994‧‧‧分區類型
996‧‧‧分區類型
998‧‧‧分區類型
999‧‧‧資料單元
1010‧‧‧編碼單元/編碼單元
1012‧‧‧編碼單元
1014‧‧‧編碼單元/編碼單元
1016‧‧‧編碼單元/編碼單元
1018‧‧‧編碼單元
1020‧‧‧編碼單元
1022‧‧‧編碼單元/編碼單元
1024‧‧‧編碼單元
1026‧‧‧編碼單元
1028‧‧‧編碼單元
1030‧‧‧編碼單元
1032‧‧‧編碼單元/編碼單元
1040‧‧‧編碼單元
1042‧‧‧編碼單元
1044‧‧‧編碼單元
1046‧‧‧編碼單元
1048‧‧‧編碼單元/編碼單元
1050‧‧‧編碼單元/編碼單元
1052‧‧‧編碼單元/編碼單元
1054‧‧‧編碼單元/編碼單元
1060‧‧‧預測單元
1070‧‧‧變換單元
1300‧‧‧最大編碼單元
1302‧‧‧編碼單元
1304‧‧‧編碼單元
1306‧‧‧編碼單元
1312‧‧‧編碼單元
1314‧‧‧編碼單元
1316‧‧‧編碼單元
1318‧‧‧編碼單元
1322‧‧‧分區類型
1324‧‧‧分區類型
1326‧‧‧分區類型
1328‧‧‧分區類型
1332‧‧‧分區類型
1334‧‧‧分區類型
1336‧‧‧分區類型
1338‧‧‧分區類型
1342‧‧‧變換單元
1344‧‧‧變換單元
1352‧‧‧變換單元
1354‧‧‧變換單元
11000‧‧‧內容供應系統
11100‧‧‧網際網路
11200‧‧‧網際網路服務提供商
11300‧‧‧串流伺服器
11400‧‧‧通信網路
11700‧‧‧無線基地台
11800‧‧‧無線基地台
11900‧‧‧無線基地台
12000‧‧‧無線基地台
12100‧‧‧電腦
12200‧‧‧個人數位助理
12300‧‧‧視訊攝影機
12500‧‧‧行動電話
12510‧‧‧內部天線
12520‧‧‧顯示螢幕
12530‧‧‧相機
12540‧‧‧操作面板
12550‧‧‧麥克風
12560‧‧‧插槽
12570‧‧‧儲存媒體
12580‧‧‧揚聲器
12600‧‧‧相機
12610‧‧‧通信電路
12620‧‧‧LCD控制器
12630‧‧‧相機介面
12640‧‧‧操作輸入控制器
12650‧‧‧聲音處理器
12660‧‧‧調變/解調變單元
12670‧‧‧記錄/讀取單元
12680‧‧‧多工器/解多工器
12690‧‧‧影像解碼單元
12700‧‧‧電力供應電路
12710‧‧‧中央控制器
12720‧‧‧影像編碼單元
12730‧‧‧同步匯流排
12810‧‧‧TV接收器
12820‧‧‧儲存媒體
12830‧‧‧再生裝置
12840‧‧‧監視器
12850‧‧‧電纜天線
12860‧‧‧天線
12870‧‧‧機上盒
12880‧‧‧TV監視器
12890‧‧‧廣播站
12900‧‧‧廣播衛星
12910‧‧‧天線
12920‧‧‧汽車
12930‧‧‧汽車導航系統
12950‧‧‧硬碟記錄器
12960‧‧‧DVD光碟
12970‧‧‧SD卡
14000‧‧‧雲端計算伺服器
14100‧‧‧使用者資料庫
14200‧‧‧計算資源
14300‧‧‧桌上型PC
14400‧‧‧智慧型TV
14500‧‧‧智慧型電話
14600‧‧‧筆記型電腦
14700‧‧‧攜帶型多媒體播放器
14800‧‧‧平板型PC
26000‧‧‧光碟
26700‧‧‧電腦系統
26800‧‧‧光碟機
CU‧‧‧編碼單元
CU_0‧‧‧當前編碼單元
CU_1‧‧‧編碼單元
CU_(d-1)‧‧‧編碼單元
PU‧‧‧預測單元
Se‧‧‧磁區
Tb‧‧‧距離
Td‧‧‧距離
Tr‧‧‧磁軌
Tr‧‧‧差
TU‧‧‧變換單元
圖1為根據本發明的實施例的移動向量決定裝置的方塊圖。
圖2為根據本發明的實施例的移動向量決定方法的流程圖。
圖3說明根據本發明的實施例的候選區塊為另一影像的搭配區塊的實例。
圖4說明根據本發明的實施例的候選區塊為同一影像的相鄰區塊的實例。
圖5為根據本發明的實施例的包含移動向量決定方法的視訊
編碼方法的流程圖。
圖6為根據本發明的實施例的包含移動向量決定方法的視訊解碼方法的流程圖。
圖7為根據本發明的實施例的包含移動向量決定裝置的視訊編碼單元的方塊圖。
圖8為根據本發明的實施例的包含移動向量決定裝置的視訊解碼單元的方塊圖。
圖9為根據本發明的實施例的基於根據樹狀結構的編碼單元的視訊編碼裝置的方塊圖。
圖10為根據本發明的實施例的基於根據樹狀結構的編碼單元的視訊解碼裝置的方塊圖。
圖11為用於描述根據本發明的實施例的編碼單元的概念的圖式。
圖12為根據本發明的實施例的基於編碼單元的影像編碼器的方塊圖。
圖13為根據本發明的實施例的基於編碼單元的影像解碼器的方塊圖。
圖14為說明根據本發明的實施例的根據深度的較深編碼單元以及分區的圖式。
圖15為用於描述根據本發明的實施例的編碼單元與變換單元之間的關係的圖式。
圖16為用於描述根據本發明的實施例的對應於經編碼的深
度的編碼單元的編碼資訊的圖式。
圖17為根據本發明的實施例的根據深度的較深編碼單元的圖式。
圖18至圖20為用於描述根據本發明的實施例的編碼單元、預測單元與變換單元之間的關係的圖式。
圖21為用於描述根據表1的編碼模式資訊的編碼單元、預測單元或分區與變換單元之間的關係的圖式。
圖22說明根據本發明的實施例的儲存程式的光碟的實體結構。
圖23說明藉由使用光碟而記錄以及讀取程式的光碟機。
圖24說明提供內容散佈服務的內容供應系統的整體結構。
圖25以及圖26說明根據本發明的實施例的應用了視訊編碼方法以及視訊解碼方法的行動電話的外部結構以及內部結構。
圖27說明根據本發明的實施例的使用通信系統的數位廣播系統。
圖28說明根據本發明的實施例的使用視訊編碼裝置以及視訊解碼裝置的雲端計算系統的網路結構。
根據本發明的態樣為提供一種用於畫面間預測的移動向量決定方法,所述移動向量決定方法包含以下操作:決定候選移動向量清單,其包括經參考以便預測當前區塊的移動向量的多個
候選區塊的移動向量;當所述多個候選區塊中的第一候選區塊的參考影像不同於所述當前區塊的參考影像時,基於所述當前區塊的參考影像以及所述第一候選區塊述參考影像中的每一者為短期參考影像還是長期參考影像,決定是否使用所述候選移動向量清單中的第一候選區塊的移動向量;以及藉由使用選自所述候選移動向量清單中所包括的移動向量的候選移動向量來決定所述當前區塊的移動向量。
所述第一候選區塊可為所述當前區塊的當前影像中的所述當前區塊的相鄰區塊或可為在早於所述當前影像復原的影像中的與所述當前區塊處於相同位置的搭配區塊。
當所述當前區塊的參考影像以及所述第一候選區塊的參考影像全部為長期參考影像時,所述決定是否使用移動向量的操作可包含將所述第一候選區塊的移動向量維持於所述候選移動向量清單中的操作。
當所述當前區塊的參考影像以及所述第一候選區塊的參考影像中的一者為短期參考影像,而所述當前區塊的參考影像以及所述第一候選區塊的參考影像中的另一者為長期參考影像時,所述決定是否使用所述移動向量的操作可包含決定不使用所述候選移動向量清單中的所述第一候選區塊的所述移動向量的操作。
根據本發明的另一態樣,提供一種用於畫面間預測的移動向量決定裝置,所述移動向量決定裝置包含:候選者清單決定單元,用於決定候選移動向量清單,其包括經參考以便預測當前
區塊的移動向量的多個候選區塊的移動向量,而且當多個候選區塊中的第一候選區塊的參考影像不同於所述當前區塊的參考影像時,用於基於所述當前區塊的參考影像以及所述第一候選區塊的參考影像中的每一者為短期參考影像還是長期參考影像,決定是否使用所述候選移動向量清單中的第一候選區塊的移動向量;以及移動向量決定單元,用於藉由使用選自所述候選移動向量清單中所包括的移動向量的候選移動向量來決定所述當前區塊的移動向量。
根據本發明的另一態樣,提供一種電腦可讀記錄媒體,其上記錄有用於執行所述移動向量決定方法的電腦程式。
本發明的模式
下文中,將參照圖1至圖4來描述移動向量決定裝置10以及移動向量決定方法。而且,將參照圖5以及圖8來描述用於藉由執行移動向量決定方法來對視訊做編碼以及解碼的方法及裝置。另外,將參照圖9至圖21來描述基於具有樹狀結構的編碼單元的包含移動向量決定方法的視訊編碼以及解碼方案。下文中,術語「影像」可指靜態影像或動態圖像(即,視訊自身)。
首先,將參照圖1至圖4來描述移動向量決定裝置10以及移動向量決定方法。而且,將參照圖5以及圖8來描述用於藉由執行移動向量決定方法來對視訊做編碼以及解碼的方法及裝置。
圖1為根據本發明的實施例的移動向量決定裝置10的方
塊圖。
移動向量決定裝置10包含候選者清單決定單元12以及移動向量決定單元14。
藉由使用當前影像與另一影像之間的相似性來執行畫面間預測。在早於當前影像復原的參考影像中,偵測類似於當前影像的當前區域的參考區域。當前區域的坐標與參考區域的坐標之間的距離表示為移動向量,而且當前區域的像素值與參考區域的像素值之間的差表示為殘餘資料。因此,藉由對當前區域執行畫面間預測,可輸出指示參考影像、移動向量以及殘餘資料的索引,而非直接輸出關於當前區域的影像資訊。
移動向量決定裝置10可針對每一各別區塊對每一視訊影像執行畫面間預測。區塊可具有正方形形狀、矩形形狀或任何幾何形狀而且不限於具有預定大小的資料單元。根據本發明的實施例,區塊可為根據樹狀結構的編碼單元中的最大編碼單元、編碼單元、預測單元、變換單元或其類似者。下文將參照圖9至圖21來描述基於根據樹狀結構的編碼單元的視訊編碼以及解碼方法。
用於當前影像的畫面間預測的參考影像必須為早於當前影像解碼的影像。在本實施例中,用於畫面間預測的參考影像可分類為短期參考影像以及長期參考影像。經解碼圖像緩衝器(decoded picture buffer,DPB(未繪示))儲存經由對先前影像的移動補償而產生的所復原的影像。先前產生的所復原的影像可用作用於其他影像的畫面間預測的參考影像。因此,為了執行當前
影像的畫面間預測,至少一短期參考影像或至少一長期參考影像可選自儲存於經解碼圖像緩衝器中的所復原的影像。短期參考影像可為包含當前影像的按解碼次序剛剛或最近解碼的影像,而長期參考影像可為遠早於當前影像解碼、被選擇為用作用於其他影像的畫面間預測的參考影像,也因此儲存於經解碼圖像緩衝器中的影像。
對於移動向量預測、PU合併或進階移動向量預測(advanced motion vector prediction,AMVP),可藉由參考另一區塊的移動向量來決定當前區塊的移動向量預測。
移動向量決定裝置10可藉由參考時間上或空間上鄰近於當前區塊的另一區塊的移動向量來決定移動向量。移動向量決定裝置10可決定候選移動向量清單,其包含可變成當前區塊的移動向量的參考目標的多個候選區塊的移動向量。移動向量決定裝置10可藉由參考選自候選移動向量清單的移動向量來決定當前區塊的移動向量。
在本實施例中,候選區塊可指示當前影像中的當前區塊的相鄰區塊或可為在早於當前影像復原的影像中的與當前區塊處於相同位置的搭配區塊。
候選者清單決定單元12可縮放滿足預定條件並處於候選移動向量清單中的候選移動向量的大小,所述候選移動向量清單包含經參考以用於當前區塊的移動向量的預測的候選區塊的移動向量;或可將候選移動向量排除於候選移動向量清單以外。
當候選移動向量清單中所包含的候選區塊中的第一候選區塊的參考影像不同於當前區塊的參考影像時,候選者清單決定單元12可決定當前區塊的參考影像以及第一候選區塊的參考影像中的每一者為短期參考影像還是長期參考影像。候選者清單決定單元12可基於當前區塊的參考影像以及第一候選區塊的參考影像中的每一者為短期參考影像還是長期參考影像來決定如何使用候選移動向量清單中的第一候選區塊的移動向量。
在當前區塊的參考影像以及第一候選區塊的參考影像全部為長期參考影像時,候選者清單決定單元12可將第一候選區塊的移動向量維持於候選移動向量清單中。亦即,可將第一候選區塊包含於候選移動向量清單中,而不縮放第一候選區塊的移動向量的大小。
在當前區塊的參考影像以及第一候選區塊的參考影像中的一者為短期參考影像,而當前區塊的參考影像以及第一候選區塊的參考影像中的另一者為長期參考影像時,候選者清單決定單元12可決定不使用候選移動向量清單中的第一候選區塊的移動向量。接著,可將第一候選區塊的移動向量宣告為不可使用的移動向量。
在當前區塊的參考影像以及第一候選區塊的參考影像全部為短期參考影像時,候選者清單決定單元12可縮放第一候選區塊的移動向量的大小並可將第一候選區塊的經縮放的移動向量包含於候選移動向量清單中。在此狀況下,候選者清單決定單元12
可基於當前區塊的當前影像與參考影像之間的距離對第一候選區塊的影像與第一候選區塊的參考影像之間的距離的比來縮放第一候選區塊的移動向量的大小,並可在候選移動向量清單中將第一候選區塊的移動向量的值更新為經縮放的值。
移動向量決定單元14可自候選移動向量清單中所包含的移動向量選擇候選移動向量,並可藉由使用所選擇的候選移動向量來決定當前區塊的移動向量。移動向量決定單元14可藉由在不改變的情況下,複製候選移動向量或藉由修改候選移動向量來決定當前區塊的移動向量。
圖2為根據本發明的實施例的移動向量決定方法的流程圖。
移動向量決定裝置10可藉由使用時間上或空間上靠近當前區塊的區塊的移動向量來預測當前區塊的移動向量。而且,移動向量決定裝置10可決定具有可預測移動向量的多個候選區塊,可自所述候選區塊選擇一候選區塊,可參考所選擇的候選區塊的移動向量,也因此可決定當前區塊的移動向量。
然而,當由多個候選區塊中的一候選區塊的參考索引指示的參考影像不同於當前區塊的參考影像時,若移動向量決定裝置10藉由參考所述候選區塊的移動向量來預測當前區塊的移動向量,則雖然縮放了候選區塊的移動向量的大小並接著參考了候選區塊的移動向量,但會降低所預測的移動向量的準確度。因此,在當前區塊的參考影像不同於候選區塊的參考影像時,移動向量
決定裝置10可決定是否參考在縮放候選區塊的移動向量的大小之後的候選區塊或可決定不參考候選區塊。
下文中,在當前區塊的參考影像不同於候選區塊的參考影像時,參照操作21、23以及25詳細描述藉由移動向量決定裝置10自候選區塊的移動向量預測當前區塊的移動向量的方法。
在操作21中,移動向量決定裝置10決定候選移動向量清單,其包含用於當前區塊的多個候選區塊的移動向量。
在操作23中,當候選區塊中的第一候選區塊的參考影像不同於當前區塊的參考影像時,移動向量決定裝置10基於當前區塊的參考影像以及第一候選區塊的參考影像中的每一者為短期參考影像還是長期參考影像來決定是否使用候選移動向量清單中的第一候選區塊的移動向量。
移動向量決定裝置10可藉由使用指示當前區塊的參考影像是否為長期參考影像的長期參考索引來決定當前區塊的參考影像是否為長期參考影像。類似地,移動向量決定裝置10可藉由使用第一候選區塊的長期參考索引來決定第一候選區塊的參考影像是否為長期參考影像。
在另一實施例中,在當前區塊的參考影像的圖像次序號(picture order count,POC)與第一候選區塊的參考影像的POC之間的差的值大於第一臨限值時,移動向量決定裝置10可決定第一候選區塊的參考影像為長期參考影像。類似地,在當前區塊的參考影像的POC與第一候選區塊的參考影像的POC之間的差的值
大於第二臨限值時,移動向量決定裝置10可決定當前區塊的參考影像為長期參考影像。
在操作25中,移動向量決定裝置10藉由使用選自候選移動向量清單中所包含的移動向量的候選移動向量來決定當前區塊的移動向量。
在操作25中,不管當前區塊的參考影像為短期參考影像還是長期參考影像,移動向量決定裝置10可決定由當前區塊的移動向量指示的參考區塊,所述參考區塊是被決定在當前區塊的參考影像中,所述參考影像是根據由當前區塊的參考索引指示的POC。
在操作23中,在當前區塊的參考影像以及第一候選區塊的參考影像全部為長期參考影像時,移動向量決定裝置10可將第一候選區塊的移動向量維持於候選移動向量清單中,而不縮放第一候選區塊的移動向量的大小。在當前區塊的參考影像以及第一候選區塊的參考影像中的一者為短期參考影像,而當前區塊的參考影像以及第一候選區塊的參考影像中的另一者為長期參考影像時,移動向量決定裝置10可決定不使用候選移動向量清單中的第一候選區塊的移動向量。在當前區塊的參考影像以及第一候選區塊的參考影像全部為短期參考影像時,移動向量決定裝置10可根據基於當前區塊的當前影像與參考影像之間的距離對第一候選區塊的影像與第一候選區塊的參考影像之間的距離的比而被縮放大小的第一候選區塊的移動向量,來更新候選移動向量清單中的第
一候選區塊的移動向量。
藉由執行操作21、23以及25,移動向量決定裝置10可重新決定候選移動向量清單。在當前區塊的參考影像以及第一候選區塊的參考影像中的僅一者為長期參考影像時,移動向量決定裝置10可將第一候選區塊的移動向量排除於候選移動向量清單以外也因此可不將第一候選區塊用作參考目標。因此,移動向量決定裝置10可藉由參考候選移動向量清單中所包含的另一移動向量來決定候選區塊的移動向量。
在當前區塊的參考影像以及第一候選區塊的參考影像全部為長期參考影像時,移動向量決定裝置10將第一候選區塊的移動向量包含於候選移動向量清單中,而不縮放第一候選區塊的移動向量的大小。因此,移動向量決定裝置10可自候選移動向量清單中所包含的其他候選移動向量以及第一候選區塊的移動向量選擇最佳參考移動向量,並可藉由使用所選擇的參考移動向量來決定當前區塊的移動向量。
在當前區塊的參考影像以及第一候選區塊的參考影像全部為短期參考影像時,移動向量決定裝置10可縮放第一候選區塊的移動向量的大小並可將第一候選區塊的移動向量包含於候選移動向量清單中。因此,移動向量決定裝置10可自候選移動向量清單中所包含的其他候選移動向量以及第一候選區塊的被縮放大小的移動向量選擇最佳參考移動向量,而且可藉由使用所選擇的參考移動向量來決定當前區塊的移動向量。
因此,根據上文參照圖1以及圖2描述的移動向量決定裝置10以及移動向量決定方法,當由候選區塊的參考索引指示的參考影像不同於當前區塊的參考影像,且當前區塊的參考影像以及候選區塊的參考影像中的至少一者為長期參考影像時,可跳過縮放候選區塊的移動向量的大小的程序或可跳過參考候選區塊的移動向量的程序。
亦即,在當前區塊的參考影像不同於候選區塊的參考影像,且當前區塊的參考影像以及候選區塊的參考影像中的至少一者為長期參考影像時,若藉由參考候選區塊的移動向量來預測當前區塊的移動向量,則所預測的移動向量的準確度會降低,也因此可跳過缺乏預測準確度的參考候選區塊的移動向量的程序並可藉由參考具有相對高準確度的另一候選區塊的移動向量來預測當前區塊。藉此,可改良移動向量預測程序的效率。
下文中,參照圖3以及圖4,詳細描述根據候選區塊的類型的移動向量預測方法。
圖3說明根據本發明的實施例的候選區塊為另一影像的搭配區塊的實例。
搭配影像35早於當前影像30復原並可經參考以用於當前影像30中的當前區塊31的畫面間預測。可根據當前區塊31的搭配索引32來決定搭配影像35。
在搭配影像35中,與當前影像30的當前區塊31處於相同位置的區塊可決定為搭配區塊36。移動向量決定裝置10可使用
搭配區塊36作為候選區塊,亦即,用以預測當前區塊31的移動向量34的參考目標。因此,可藉由參考搭配區塊36的移動向量37來預測當前區塊31的移動向量34。
可根據由搭配區塊36的參考索引指示的POC來決定搭配參考影像38。可根據由當前區塊31的參考索引指示的POC來決定當前參考影像33。
然而,當搭配參考影像38不同於當前參考影像33時,移動向量決定裝置10可重新決定是否參考搭配區塊36的移動向量37或如何參考搭配區塊36的移動向量37。
更詳細言之,當搭配區塊36的參考索引不同於當前區塊31的參考索引時,移動向量決定裝置10可藉由使用搭配區塊36的長期參考索引以及當前區塊31的長期參考索引來檢查搭配參考影像38以及當前參考影像33為短期參考影像還是長期參考影像。
當搭配參考影像38不同於當前參考影像33時,移動向量決定裝置10可重新決定是否參考搭配區塊36的移動向量37或如何參考搭配區塊36的移動向量37。
根據檢查的結果,當搭配參考影像38不同於當前參考影像33但當前參考影像33以及搭配參考影像38全部為短期參考影像時,可基於搭配影像35與搭配參考影像38之間的距離Td對當前影像30與當前參考影像33之間的距離Tb的比來縮放搭配區塊36的移動向量37的大小。此處,可根據搭配影像35的POC與搭配參考影像38的POC之間的差的值來決定搭配影像35與搭配參
考影像38之間的距離Td。類似地,可根據當前影像30的POC與當前參考影像33的POC之間的差的值來決定當前影像30與當前參考影像33之間的距離Tb。
亦即,在當前參考影像33以及搭配參考影像38全部為短期參考影像時,可按照藉由將搭配區塊36的移動向量37(MVcol)與搭配影像35與搭配參考影像38之間的距離Td對當前影像30與當前參考影像33之間的距離Tb的比相乘而獲得的值來更新候選移動向量MVcol'(MVcol'=MVcol * Tb/Td)。
因此,根據檢查的結果,當搭配參考影像38不同於當前參考影像33但當前參考影像33以及搭配參考影像38全部為短期參考影像時,移動向量決定裝置10可在候選移動向量清單中將搭配區塊36的移動向量37改變為值MVcol',其中值MVcol'是藉由將搭配區塊36的移動向量37與搭配影像35與搭配參考影像38之間的距離Td對當前影像30與當前參考影像33之間的距離Tb的比(Tb/Td)相乘而獲得。
在當前參考影像33以及搭配參考影像38中的一者為短期參考影像,且當前參考影像33以及搭配參考影像38中的另一者為長期參考影像時,可將「NOT-AVAILABLE」旗標分配至搭配區塊36的移動向量37。在此狀況下,可將配置區塊36的移動向量37排除於候選移動向量清單以外。
在當前參考影像33以及搭配參考影像38全部為長期參考影像時,可維持搭配區塊36的移動向量37。在此狀況下,可將
配置區塊36的移動向量37維持於候選移動向量清單中,而不縮放移動向量37的大小。
圖4說明根據本發明的實施例的候選區塊為同一影像的相鄰區塊46的實例。
移動向量決定裝置10可使用相鄰區塊46作為候選區塊,候選區塊為用於當前區塊41的移動向量44的預測的參考目標,其中相鄰區塊46鄰近於當前區塊41。因此,可藉由參考相鄰區塊46的移動向量47來預測當前區塊41的移動向量44。
可根據由相鄰區塊46的參考索引指示的POC來決定相鄰參考影像48。可根據由當前區塊41的參考索引指示的POC來決定當前參考影像43。
然而,當相鄰參考影像48不同於當前參考影像43時,移動向量決定裝置10可重新決定是否參考相鄰區塊46的移動向量47或如何參考相鄰區塊46的移動向量47。
更詳細言之,當相鄰區塊46的參考索引不同於當前區塊41的參考索引時,移動向量決定裝置10可藉由使用相鄰區塊46的長期參考索引以及當前區塊41的長期參考索引來檢查相鄰區塊46以及當前參考影像43為短期參考影像還是長期參考影像。
當相鄰參考影像48不同於當前參考影像43時,移動向量決定裝置10可重新決定是否參考相鄰區塊46的移動向量47或如何參考相鄰區塊46的移動向量47。
根據檢查的結果,在當前參考影像43不同於相鄰參考影
像48但當前參考影像43以及相鄰參考影像48全部為短期參考影像時,可基於當前影像40與相鄰參考影像48之間的距離Td對當前影像40與當前參考影像43之間的距離Tb的比來縮放相鄰區塊46的移動向量47的大小。可按照當前影像40的POC與相鄰參考影像48的POC之間的差的值來決定當前影像40與相鄰參考影像48之間的距離Td。類似地,可按照當前影像40的POC與當前參考影像43的POC之間的差的值來決定當前影像40與當前參考影像43之間的距離Tb。
亦即,在當前參考影像43以及相鄰參考影像48全部為短期參考影像時,可將候選移動向量MVne'更新為藉由將相鄰區塊46的移動向量47(MVne)與當前影像40與相鄰參考影像48之間的距離Td對當前影像40與當前參考影像43之間的距離Tb的比(Tb/Td)相乘而獲得的值(MVne'=MVne * Tb/Td)。
因此,根據檢查的結果,在當前參考影像43與相鄰參考影像48彼此不同但全部為短期參考影像時,移動向量決定裝置10可在候選移動向量清單中將相鄰區塊46的移動向量47改變為值MVne',其中值MVne'是藉由將相鄰區塊46的移動向量47(MVne)與相鄰參考影像48與當前影像40之間的距離Td對當前影像40與當前參考影像43之間的距離Tb的比(Tb/Td)相乘而獲得。
在當前參考影像43以及相鄰參考影像48中的一者為短期參考影像而另一者為長期參考影像時,可將「NON-USABLE」旗標分配至相鄰區塊46的移動向量47。在此狀況下,可將相鄰區
塊46的移動向量47排除於當前影像40的候選移動向量清單以外。
在當前參考影像43以及相鄰參考影像48全部為長期參考影像時,可維持相鄰區塊46的移動向量47。在此狀況下,可將相鄰區塊46的移動向量47維持於候選移動向量清單中,而不縮放移動向量47的大小。
在圖3以及圖4的實施例中,移動向量決定裝置10可藉由使用當前區塊(亦即,當前區塊31以及41)以及候選區塊(亦即,搭配區塊36以及相鄰區塊46)的長期參考索引來決定當前參考影像(亦即,當前參考影像33以及43)以及候選區塊的參考影像(亦即,搭配參考影像38以及相鄰參考影像48)中的每一者為短期參考影像還是長期參考影像,而且根據決定的結果,移動向量決定裝置10可決定是否參考候選區塊的移動向量(亦即,移動向量37以及47)或是否參考在縮放移動向量的大小之後的移動向量。
在另一實施例中,移動向量決定裝置10可藉由使用指示當前參考影像以及候選區塊的參考影像的POC的參考索引,而非使用當前區塊以及候選區塊的長期參考索引來決定是否參考候選區塊的移動向量或是否參考在縮放移動向量的大小之後的移動向量。
更詳細言之,根據參照圖3的另一實施例,移動向量決定裝置10可將搭配區塊36的參考索引與當前區塊31的參考索引之間的差Tr與第一臨限值THpocdiff1做比較,而且當參考索引之
間的差Tr大於第一臨限值THpocdiff1時,移動向量決定裝置10可決定搭配區塊36的移動向量37並非參考目標或可決定參考移動向量37,而不縮放移動向量37的大小。
類似地,根據參照圖4的另一實施例,移動向量決定裝置10可將相鄰區塊46的參考索引與當前區塊41的參考索引之間的差Tr與第一臨限值THpocdiff1做比較,而當參考索引之間的差Tr大於第一臨限值THpocdiff1時,移動向量決定裝置10可決定相鄰區塊46的移動向量47並非參考目標或可決定參考移動向量47,而不縮放移動向量47的大小。
在圖3以及圖4的其他實施例中,當候選區塊(亦即,候選區塊36以及46)的參考索引與當前區塊31的參考索引之間的差Tr大於第一臨限值THpocdiff1時,移動向量決定裝置10可決定由候選區塊(36以及46)的參考索引指示的候選參考影像(亦即,搭配參考影像38以及相鄰參考影像48)以及由當前區塊31的參考索引指示的當前參考影像(33以及43)中的至少一者為長期參考影像。
因此,當候選區塊(36以及46)的參考索引與當前區塊31的參考索引之間的差Tr大於第一臨限值THpocdiff1時,移動向量決定裝置10可能不需要藉由使用影像距離比(Tb/Td)來縮放候選區塊(36以及46)的移動向量(37以及47)的大小,但可決定候選區塊(36以及46)並非參考目標,也因此可將候選區塊(36以及46)的移動向量(37以及47)排除於候選移動向量
清單以外。或者,移動向量決定裝置10可決定藉由參考候選區塊(36以及46)的移動向量(37以及47)來預測當前區塊(31以及41)的移動向量(34以及44),而不縮放候選區塊(36以及46)的移動向量(37以及47)的大小。
在另一實施例中,移動向量決定裝置10可將當前影像(30以及40)的POC與當前參考影像(33以及43)的POC之間的差的值與第二臨限值THpocdiff2做比較,而且根據比較的結果,移動向量決定裝置10可決定是否參考候選區塊(36以及46)的移動向量(37以及47)或是否參考在縮放移動向量(37以及47)的大小之後的經縮放的移動向量。
因此,當由當前區塊(31以及41)的參考索引指示的當前參考影像(33以及43)的POC與當前影像(30以及40)的POC之間的差Tb大於第二臨限值THpocdiff2時,移動向量決定裝置10可能不需要藉由使用影像距離比(Tb/Td)來縮放候選區塊(36以及46)的移動向量(37以及47)的大小,但可決定候選區塊(36以及46)並非參考目標,也因此可將候選區塊(36以及46)的移動向量(37以及47)排除於候選移動向量清單以外。或者,移動向量決定裝置10可決定藉由參考候選區塊(36以及46)的移動向量(37以及47)來預測當前區塊(31以及41)的移動向量(34以及44),而不縮放候選區塊(36以及46)的移動向量(37以及47)的大小。
可將第一臨限值THpocdiff1或第二臨限值THpocdiff2設
定為以下值中的一者。i)參考影像的數目;ii)參考影像的數目的雙倍數目;iii)圖像群組(group of picture,GOP)的大小與參考影像的數目的雙倍數目的總和;iv)按解碼次序在當前影像之前而且按輸出次序連續的影像的最大允許數目max_num_reorder_pics與參考影像的數目的雙倍數目的總和;v)儲存於DPB中的所復原的影像的輸出最大限度地延遲的最大延遲時間max_output_delay與參考影像的數目的雙倍數目的總和;vi)GOP的大小的雙倍數目;vii)按解碼次序在當前影像之前而且按輸出次序連續的影像的最大允許數目max_num_reorder_pics的雙倍數目;以及viii)儲存於DPB中的所復原的影像的輸出最大限度地延遲的最大延遲時間max_output_delay的雙倍數目。
當候選區塊為搭配區塊36時,可根據當前影像30、當前參考影像33與搭配參考影像38的相對位置來改變第一臨限值THpocdiff1或第二臨限值THpocdiff2。舉例而言,可存在兩種狀況:i)搭配區塊36的參考索引以及當前區塊31的參考索引全部大於或小於當前影像30的POC(第一狀況),以及ii)當前影像30的POC處於搭配區塊36的參考索引與當前區塊31的參考索引之間(第二狀況)。在第一狀況以及第二狀況下,第一臨限值THpocdiff1或第二臨限值THpocdiff2可不同。
而且,可基於根據當前影像30的時間預測的階層式結構的時間深度來改變第一臨限值THpocdiff1或第二臨限值THpocdiff2。舉例而言,當階層式參考多個影像以用於當前影像
30的時間預測時,可根據在階層式結構中參考了多少階層來調整第一臨限值THpocdiff1或第二臨限值THpocdiff2。
或者,可根據包含當前影像30的GOP結構中的當前影像30的位置來改變第一臨限值THpocdiff1或第二臨限值THpocdiff2。
或者,可根據包含當前影像30的GOP結構中的當前影像30的POC來改變第一臨限值THpocdiff1或第二臨限值THpocdiff2。
可對用於視訊編碼中的當前影像30的第一臨限值THpocdiff1或第二臨限值THpocdiff2做編碼並將其傳送至視訊解碼器。舉例而言,可針對每一序列、每一圖像或每一片段決定第一臨限值THpocdiff1或第二臨限值THpocdiff2,或可根據圖像適應性地決定第一臨限值THpocdiff1或第二臨限值THpocdiff2。因此,序列參數集合(sequence parameter set,SPS)、圖像參數集合(picture parameter set,PPS)、片段標頭以及適應參數集合(adaptation parameter set,APS)可含有關於第一臨限值THpocdiff1或第二臨限值THpocdiff2的資訊。
在另一實施例中,視訊編碼器以及視訊解碼器可能不傳輸以及接收當前影像30的第一臨限值THpocdiff1或第二臨限值THpocdiff2,但可預測第一臨限值THpocdiff1或第二臨限值THpocdiff2。舉例而言,可基於隨機存取或低延遲來預測第一臨限值THpocdiff1或第二臨限值THpocdiff2,低延遲為當前影像30
的時間預測的階層式結構。或者,可基於當前影像30的POC來預測第一臨限值THpocdiff1或第二臨限值THpocdiff2。
下文中,參照圖5以及圖6,詳細描述包含移動向量決定方法的視訊編碼以及解碼方法。
圖5為根據本發明的實施例的包含移動向量決定方法的視訊編碼方法的流程圖。
在操作51中,根據移動向量決定方法,可決定候選移動向量清單,其包含經參考以便預測當前區塊的移動向量的多個候選區塊的移動向量。
當候選區塊中的第一候選區塊的參考影像不同於當前區塊的參考影像時,視訊編碼方法可基於當前區塊的參考影像以及第一候選區塊的參考影像中的每一者為短期參考影像還是長期參考影像來決定是否使用候選移動向量清單中的第一候選區塊的移動向量。
在當前區塊的參考影像以及第一候選區塊的參考影像全部為長期參考影像時,可將第一候選區塊的移動向量包含於候選移動向量清單中,而不縮放第一候選區塊的移動向量的大小。
在當前區塊的參考影像以及第一候選區塊的參考影像中的一者為短期參考影像而另一者為長期參考影像時,視訊編碼方法可決定不使用候選移動向量清單中的第一候選區塊的移動向量。
在當前區塊的參考影像以及第一候選區塊的參考影像全
部為短期參考影像時,可在縮放第一候選區塊的移動向量的大小之後將第一候選區塊的移動向量包含於候選移動向量清單中。
在操作53中,可選擇在操作51中決定處於候選移動向量清單中所包含的移動向量中的候選移動向量作為參考移動向量,並可藉由參考所選擇的參考移動向量來決定當前區塊的移動向量。可藉由在不改變的狀況下複製參考移動向量或藉由修改參考移動向量來決定當前區塊的移動向量。舉例而言,當存在關於移動向量的差異資訊時,可合成參考移動向量以及差異資訊,以使得可決定當前區塊的移動向量。
當決定被決定在當前區塊的參考影像中的由當前區塊的移動向量指示的參考區塊時,可產生參考區塊與當前區塊之間的殘餘資料。
在操作55中,可對在操作53中產生的殘餘資料執行變換以及量化,以使得可產生經量化的變換係數。
可對當前影像的每一區塊執行操作51、53以及55的畫面間預測、變換以及量化,以使得可在每一區塊中產生經量化的變換係數。而且,可對每一區塊的經量化的變換係數執行熵編碼(entropy coding),以使得可產生以及輸出位元串流。
根據圖5的實施例的視訊編碼方法可由視訊編碼裝置實施。用於實施根據圖5的實施例的視訊編碼方法的視訊編碼處理器可安裝於視訊編碼裝置中或可結合外部視訊編碼裝置驅動,以使得視訊編碼裝置可執行包含畫面間預測、變換以及量化的視訊
編碼操作。根據本發明的實施例,視訊編碼裝置的內部視訊編碼處理器可藉由將視訊編碼處理模組添加至視訊編碼元件、中央操作元件或圖形操作元件以及執行基本視訊編碼操作的獨立處理器來體現。
圖6為根據本發明的實施例的包含移動向量決定方法的視訊解碼方法的流程圖。
在操作61中,可接收當前區塊的參考索引以及經量化的變換係數,以及候選區塊的移動向量。
在操作63中,可對在操作61中接收的當前區塊的經量化的變換係數執行逆量化以及逆變換,以使得可復原當前區塊的殘餘資料。
在操作65中,可決定當前區塊的候選移動向量清單。當多個候選區塊中的第一候選區塊的參考影像不同於當前區塊的參考影像時,視訊解碼方法可基於當前區塊的參考影像以及第一候選區塊的參考影像中的每一者為短期參考影像還是長期參考影像來決定是否使用候選移動向量清單中的第一候選區塊的移動向量。
在當前區塊的參考影像以及第一候選區塊的參考影像全部為長期參考影像時,可將第一候選區塊的移動向量包含於候選移動向量清單中,而不縮放第一候選區塊的移動向量的大小。
在當前區塊的參考影像以及第一候選區塊的參考影像中的一者為短期參考影像而另一者為長期參考影像時,視訊解碼方
法可決定不使用候選移動向量清單中的第一候選區塊的移動向量。
在當前區塊的參考影像以及第一候選區塊的參考影像全部為短期參考影像時,可在縮放第一候選區塊的移動向量的大小之後,將第一候選區塊的移動向量包含於候選移動向量清單中。
在操作67中,可選擇在操作65中決定處於候選移動向量清單中所包含的移動向量中的候選移動向量作為參考移動向量,並可藉由參考所選擇的參考移動向量來決定當前區塊的移動向量。舉例而言,當接收到關於移動向量的差異資訊時,可合成參考移動向量以及差異資訊,以使得可決定當前區塊的移動向量。
可決定由當前區塊的移動向量在由當前區塊的參考索引指示的當前區塊的參考影像中指示的參考區塊。藉由合成所決定的參考區塊以及當前區塊的殘餘資料,可復原當前區塊。
可針對每一區塊執行操作61、63、65以及67,以使得可復原包含所復原的區塊的當前影像。當復原影像時,可復原包含所復原的影像的序列的視訊。
當藉由接收經編碼的視訊串流並接著對視訊串流做解碼來復原視訊時,可執行包含操作61、63、65以及67的視訊解碼程序。在此狀況下,在操作61中,可剖析所接收的視訊串流,也因此可自視訊串流提取當前區塊的參考索引的經量化的變換係數以及候選區塊的移動向量。
亦可執行包含操作61、63、65以及67的視訊解碼程序
以產生所復原的影像,所述所復原的影像在上述視訊編碼方法中被參考以用於另一影像的畫面間預測。在此狀況下,在操作61中,可接收經由畫面間預測、變換以及量化而產生的當前區塊的參考索引以及經量化的變換係數,以及候選區塊的移動向量,而且接著可逐步執行操作63、65以及67,以使得可將最終復原的當前影像用作為另一影像的畫面間預測的參考影像。
根據圖6的實施例的視訊解碼方法可由視訊解碼裝置實施。用於實施根據圖6的實施例的視訊解碼方法的視訊解碼處理器可安裝於視訊解碼裝置中或可結合外部視訊解碼裝置驅動,以使得視訊解碼裝置可執行包含逆量化、逆變換及畫面間預測以及移動補償的視訊解碼操作。根據本發明的實施例,視訊解碼裝置的內部視訊解碼處理器可藉由將視訊解碼處理模組添加至視訊解碼元件、中央操作元件或圖形操作元件以及執行基本視訊解碼操作的獨立處理器來體現。
圖7為根據本發明的實施例的包含移動向量決定裝置10的視訊編碼單元70的方塊圖。
視訊編碼單元70包含畫面間預測單元71以及變換及量化單元75。畫面間預測單元71可包含移動向量決定裝置10以及殘餘產生單元73。
移動向量決定裝置10決定每一區塊的移動向量。而且,對於移動向量預測、PU合併或AMVP,可藉由參考另一區塊的移動向量來預測當前區塊的移動向量。移動向量決定裝置10可決定
當前區塊的候選移動向量清單以便執行移動向量預測。可自候選移動向量清單中所包含的候選移動向量決定參考移動向量。
移動向量決定裝置10可藉由自候選移動向量清單中所包含的移動向量選擇最佳候選移動向量來決定參考移動向量,而且可藉由使用所選擇的參考移動向量來決定當前區塊的移動向量。
殘餘產生單元73可決定由當前區塊的移動向量在當前區塊的參考影像中指示的參考區塊,而且可產生參考區塊與當前區塊之間的殘餘資料。
因此,畫面間預測單元71可針對每一區塊執行畫面間預測並接著可輸出用於每一區塊的殘餘資料。
變換及量化單元75可對自畫面間預測單元71輸出的殘餘資料執行變換以及量化,也因此可產生經量化的變換係數。變換及量化單元75可對自畫面間預測單元71接收的每一區塊的殘餘資料執行變換以及量化,也因此可產生用於每一區塊的經量化的變換係數。
視訊編碼單元70可對由變換及量化單元75產生的經量化的變換係數執行熵編碼,也因此可輸出經編碼的位元串流。而且,當參考索引、移動向量、長期參考索引或類似者自畫面間預測單元71輸出時,視訊編碼單元70可不僅對經量化的變換係數,亦對參考索引、移動向量以及長期參考索引執行熵編碼,也因此可輸出位元串流。
圖8為根據本發明的實施例的包含移動向量決定裝置10
的視訊解碼單元80的方塊圖。
視訊解碼單元80包含逆量化及逆變換單元81以及移動補償單元83。移動補償單元83可包含移動向量決定裝置10以及區塊復原單元85。
視訊解碼單元80可接收當前區塊的參考索引以及經量化的變換係數,以及候選區塊的移動向量。逆量化及逆變換單元81可對當前區塊的經量化的變換係數執行逆量化以及逆變換,也因此可復原當前區塊的殘餘資料。
移動補償單元83可對經由畫面間預測而編碼的當前區塊執行移動補償,也因此可復原當前區塊。
移動向量決定裝置10決定每一區塊的移動向量。移動向量決定裝置10可決定當前區塊的候選移動向量清單以便預測移動向量。候選區塊可包含搭配區塊或相鄰區塊。移動向量決定裝置10可自候選移動向量清單中所包含的候選移動向量決定參考移動向量。
在當前區塊的候選移動向量清單中所包含的候選區塊中的第一候選區塊的參考影像不同於當前區塊的參考影像時,移動向量決定裝置10可基於當前區塊的參考影像以及第一候選區塊的參考影像中的每一者為短期參考影像還是長期參考影像來決定是否使用候選移動向量清單中的第一候選區塊的參考影像。
移動向量決定裝置10可藉由自候選移動向量清單中所包含的候選移動向量選擇最佳候選移動向量來決定參考移動向量,
可藉由使用參考移動向量來預測當前區塊的移動向量,並接著可決定當前區塊的移動向量。
區塊復原單元85可決定由視訊解碼單元80接收的由當前區塊的參考索引指示的當前區塊的參考影像。可決定在移動向量決定裝置10中決定的當前區塊的移動向量在參考影像中指示的參考區塊,可合成參考區塊以及當前區塊的殘餘資料,也因此可復原當前區塊。
移動補償單元83可針對每一區塊執行移動補償,可復原每一區塊,也因此可復原包含所復原的區塊的當前影像。以此方式,視訊解碼單元80可復原影像,也因此可復原包含影像序列的視訊。
視訊解碼單元80可更包含迴路內濾波單元(未圖示),其在區塊被復原時對包含當前區塊以及所復原的區塊的所復原的影像執行解區塊濾波。
視訊解碼單元80可接收經編碼的視訊串流,可解碼視訊串流,也因此可復原視訊。在此狀況下,視訊解碼單元80可剖析視訊串流,也因此可自視訊串流提取當前區塊的參考索引以及經量化的變換係數以及候選區塊的移動向量。而且,視訊解碼單元80可更包含接收單元(未圖示),其接收位元串流,對位元串流執行熵解碼,而剖析位元串流並自位元串流提取當前區塊的參考索引以及經量化的變換係數以及候選區塊的移動向量。
為了產生經參考以用於由上文參照圖7描述的視訊編碼
單元70進行的另一影像的畫面間預測的所復原的影像,視訊解碼單元80可與視訊編碼單元70組合。在此狀況下,視訊解碼單元80可接收經由畫面間預測、變換以及量化而產生,並接著自視訊編碼單元70輸出的當前區塊的參考索引以及經量化的變換係數,可接收候選區塊的移動向量,並可輸出最終由逆量化及逆變換單元81以及移動補償單元83復原的當前影像。自視訊解碼單元80輸出的所復原的影像可用作用於由視訊編碼單元70進行的另一影像的畫面間預測的參考影像。
如上所述,在移動向量決定裝置10中,藉由分割視訊資料而獲得的區塊分割為根據樹狀結構的編碼單元,而且預測編碼單元用於編碼單元的畫面間預測。下文中,參照圖9至圖22,將描述基於根據樹狀結構的編碼單元以及變換單元的用於對視訊做編碼的方法及裝置以及用於對視訊做解碼的方法及裝置。
圖9為根據本發明的實施例的基於根據樹狀結構的編碼單元的視訊編碼裝置100的方塊圖。
採用基於根據樹狀結構的編碼單元的視訊預測的視訊編碼裝置100包含最大編碼單元分割單元110、編碼單元決定器120以及輸出單元130。下文中,為便於描述,採用基於根據樹狀結構的編碼單元的視訊預測的視訊編碼裝置100被稱為「視訊編碼裝置100」。
最大編碼單元分割單元110可基於影像的當前圖像的最大編碼單元來分割當前圖像。若當前圖像大於最大編碼單元,則
當前圖像的影像資料可分割為至少一最大編碼單元。根據本發明的實施例的最大編碼單元可為大小為32×32、64×64、128×128、256×256等的資料單元,其中資料單元的形狀是寬度以及長度為2的平方的正方形。影像資料可按照至少一最大編碼單元而輸出至編碼單元決定器120。
根據本發明的實施例的編碼單元可藉由最大大小以及深度來表徵。深度表示編碼單元自最大編碼單元在空間上分割的次數,而且隨著深度加深,根據深度的較深編碼單元可自最大編碼單元分割為最小編碼單元。最大編碼單元的深度為最上層深度,而且最小編碼單元的深度為最下層深度。由於對應於每一深度的編碼單元的大小隨著最大編碼單元的深度加深而減小,因此對應於較上層深度的編碼單元可包含對應於較下層深度的多個編碼單元。
如上所述,當前圖像的影像資料根據編碼單元的最大大小而分割為最大編碼單元,而且最大編碼單元中的每一者可包含根據深度而分割的較深編碼單元。由於根據本發明的實施例的最大編碼單元是根據深度來分割,因此包含於最大編碼單元中的空間域的影像資料可根據深度而階層式分類。
限制最大編碼單元的高度以及寬度階層式分割的總次數的編碼單元的最大深度以及最大大小可為預定的。
編碼單元決定器120對藉由根據深度來分割最大編碼單元的區域而獲得的至少一分割區域做編碼,而決定深度以根據所
述至少一分割區域來輸出最終編碼的影像資料。換言之,編碼單元決定器120藉由根據當前圖像的最大編碼單元來對根據深度的較深編碼單元中的影像資料做編碼以及選擇具有最小編碼誤差的深度來決定經編碼的深度。因此,最終輸出對應於所決定的經編碼的深度的編碼單元的經編碼的影像資料。而且,可將對應於經編碼的深度的編碼單元視為經編碼的編碼單元。所決定的經編碼的深度以及根據所決定的經編碼的深度的經編碼的影像資料輸出至輸出單元130。
基於對應於等於或低於最大深度的至少一深度的較深編碼單元而對最大編碼單元中的影像資料做編碼,並基於較深編碼單元中的每一者而比較對影像資料做編碼的結果。可在比較較深編碼單元的編碼誤差之後選擇具有最小編碼誤差的深度。可針對每一最大編碼單元選擇至少一經編碼的深度。
隨著編碼單元根據深度而階層式分割,並隨著編碼單元的數目增大,最大編碼單元的大小被分割。而且,即使編碼單元對應於一最大編碼單元中的同一深度,仍藉由單獨量測每一編碼單元的影像資料的編碼誤差而決定是否將對應於同一深度的編碼單元中的每一者分割為較下層深度。因此,即使當影像資料包含於一最大編碼單元中時,影像資料仍根據深度分割為區域而編碼誤差仍可根據所述一最大編碼單元中的區域而不同,也因此經編碼的深度可根據影像資料中的區域而不同。因此,可在一最大編碼單元中決定一或多個經編碼的深度,並可根據至少一經編碼的
深度的編碼單元而劃分最大編碼單元的影像資料。
因此,編碼單元決定器120可決定包含於最大編碼單元中的具有樹狀結構的編碼單元。根據本發明的實施例的「具有樹狀結構的編碼單元」包含最大編碼單元中所包含的所有較深編碼單元中的對應於決定為經編碼的深度的深度的編碼單元。可根據最大編碼單元的同一區域中的深度而階層式決定經編碼的深度的編碼單元,而且可在不同區域中獨立地進行決定。類似地,可獨立於另一區域中的經編碼的深度而決定當前區域中的經編碼的深度。
根據本發明的實施例的最大深度為與自最大編碼單元至最小編碼單元執行的分割次數相關的索引。根據本發明的實施例的第一最大深度可表示自最大編碼單元至最小編碼單元執行的總分割次數。根據本發明的實施例的第二最大深度可表示自最大編碼單元至最小編碼單元的總深度層級數。舉例而言,當最大編碼單元的深度為0時,最大編碼單元被分割一次的編碼單元的深度可設定為1,而最大編碼單元被分割兩次的編碼單元的深度可設定為2。此處,若最小編碼單元為最大編碼單元被分割四次的編碼單元,則存在深度0、1、2、3以及4的5個深度層級,也因此第一最大深度可設定為4,而第二最大深度可設定為5。
可根據最大編碼單元執行預測編碼以及變換。根據最大編碼單元,亦基於根據等於最大深度的深度或小於最大深度的深度的較深編碼單元來執行預測編碼以及變換。可根據正交變換或
整數變換的方法而執行變換。
由於每當根據深度來分割最大編碼單元,較深編碼單元的數目便增大,因此對隨著深度加深而產生的所有較深編碼單元執行包含預測編碼以及變換的編碼。為便於描述,在最大編碼單元中,現將基於當前深度的編碼單元來描述預測編碼以及變換。
視訊編碼裝置100可按各種方式選擇用於對影像資料做編碼的資料單元的大小或形狀。為了對影像資料做編碼,執行諸如預測編碼、變換以及熵編碼的操作,而此時,同一資料單元可用於所有操作或不同資料單元可用於每一操作。
舉例而言,視訊編碼裝置100可不僅選擇用於對影像資料做編碼的編碼單元,而且選擇不同於編碼單元的資料單元,以便對編碼單元中的影像資料執行預測編碼。
為了對最大編碼單元執行預測編碼,可基於對應於經編碼的深度的編碼單元(亦即,基於不再分割為對應於較下層深度的編碼單元的編碼單元)來執行預測編碼。下文中,不再分割並變為用於預測編碼的基礎單元的編碼單元現將被稱為「預測單元」。藉由分割預測單元而獲得的分區可包含藉由分割預測單元的高度以及寬度中的至少一者而獲得的預測單元或資料單元。分區為藉由劃分編碼單元的預測單元而獲得的資料單元,而預測單元可為大小與編碼單元相同的分區。
舉例而言,當2N×2N(其中N為正整數)的編碼單元不再分割而變為2N×2N的預測單元時,分區的大小可為2N×2N、2N
×N、N×2N或N×N。分區類型的實例包含藉由對稱地分割預測單元的高度或寬度而獲得的對稱分區、藉由非對稱地分割預測單元的高度或寬度(諸如,1:n或n:1)而獲得的分區、藉由用幾何方式分割預測單元而獲得的分區,以及具有任意形狀的分區。
預測單元的預測模式可為畫面內模式、畫面間模式以及跳過模式中的至少一者。舉例而言,可對2N×2N、2N×N、N×2N或N×N的分區執行畫面內模式或畫面間模式。而且,可僅對2N×2N的分區執行跳過模式。在編碼單元中對一預測單元獨立地執行編碼,藉此選擇具有最小編碼誤差的預測模式。
視訊編碼裝置100亦可不僅基於用於對影像資料做編碼的編碼單元而且基於不同於編碼單元的變換單元而對編碼單元中的影像資料執行變換。為了在編碼單元中執行變換,可基於具有小於或等於編碼單元的大小的資料單元來執行變換。舉例而言,用於變換的變換單元可包含用於畫面內模式的變換單元以及用於畫面間模式的資料單元。
類似於根據本實施例的根據樹狀結構的編碼單元,可按遞迴方式將編碼單元中的變換單元分割為較小大小的區域,而且可根據具有根據變換深度的樹狀結構的變換而劃分編碼單元中的殘餘資料。
根據本發明的實施例,亦可在變換單元中設定指示藉由分割編碼單元的高度以及寬度而達到變換單元所執行的分割次數的變換深度。舉例而言,在當前編碼單元的變換單元的大小為2N
×2N時,可將變換深度設定為0。在變換單元的大小為N×N時,可將變換深度設定為1。此外,在變換單元的大小為N/2×N/2時,可將變換深度設定為2。亦即,亦可根據變換深度而設定根據樹狀結構的變換單元。
根據對應於經編碼的深度的編碼單元的編碼資訊不僅需要關於經編碼的深度的資訊,而且需要與預測編碼以及變換相關的資訊。因此,編碼單元決定器120不僅決定具有最小編碼誤差的經編碼的深度,而且決定預測單元中的分區類型、根據預測單元的預測模式,以及用於變換的變換單元的大小。
稍後將參照圖11至圖22詳細描述根據本發明的實施例的最大編碼單元中的根據樹狀結構的編碼單元及預測單元/分區以及決定變換單元的方法。
編碼單元決定器120可藉由基於拉格朗日乘數(Lagrangian multiplier)使用位元率-失真最佳化(Rate-Distortion Optimization)來量測根據深度的較深編碼單元的編碼誤差。
輸出單元130按照位元串流的形式輸出基於由編碼單元決定器120決定的至少一經編碼的深度而編碼的最大編碼單元的影像資料,以及根據經編碼的深度關於編碼模式的資訊。
可藉由對影像的殘餘資料做編碼來獲得經編碼的影像資料。
根據經編碼的深度關於編碼模式的資訊可包含關於經編碼的深度、關於預測單元中的分區類型、預測模式以及變換單元
的大小的資訊。
可藉由使用根據深度的分割資訊來定義關於經編碼的深度的資訊,根據深度的分割資訊指示是否對較下層深度而非當前深度的編碼單元執行編碼。若當前編碼單元的當前深度為經編碼的深度,則對當前編碼單元中的影像資料做編碼並輸出,也因此,分割資訊可定義為不將當前編碼單元分割為較下層深度。或者,若當前編碼單元的當前深度並非經編碼的深度,則對較下層深度的編碼單元執行編碼,也因此分割資訊可定義為分割當前編碼單元以獲得較下層深度的編碼單元。
若當前深度並非經編碼的深度,則對分割為較下層深度的編碼單元的編碼單元執行編碼。由於較下層深度的至少一編碼單元存在於當前深度的一編碼單元中,因此對較下層深度的每一編碼單元重複地執行編碼,也因此可對具有同一深度的編碼單元按遞迴方式執行編碼。
由於針對一最大編碼單元而決定具有樹狀結構的編碼單元,並針對經編碼的深度的編碼單元而決定關於至少一編碼模式的資訊,因此可針對一最大編碼單元而決定關於至少一編碼模式的資訊。而且,最大編碼單元的影像資料的經編碼的深度可根據位置而不同,此是因為根據深度而階層式分割影像資料,也因此可針對影像資料而設定關於經編碼的深度以及編碼模式的資訊。
因此,輸出單元130可將關於相應經編碼的深度以及編碼模式的編碼資訊指派給包含於最大編碼單元中的編碼單元、預
測單元以及最小單元中的至少一者。
根據本發明的實施例的最小單元為藉由將構成最下層深度的最小編碼單元分割為4份而獲得的矩形資料單元。或者,最小單元可為包含於最大編碼單元中所包含的所有編碼單元、預測單元、分區單元以及變換單元中的具有最大大小的最大矩形資料單元。
舉例而言,經由輸出單元130而輸出的編碼資訊可分類為根據編碼單元的編碼資訊,以及根據預測單元的編碼資訊。根據編碼單元的編碼資訊可包含關於預測模式以及關於分區的大小的資訊。根據預測單元的編碼資訊可包含關於畫面間模式的估計方向、關於畫面間模式的參考影像索引、關於移動向量、關於畫面內模式的色度分量(chroma component)以及關於畫面內模式的內插方法(interpolation method)的資訊。
而且,關於根據圖像、片段或GOP而定義的編碼單元的最大大小的資訊,以及關於最大深度的資訊可插入至位元串流的標頭、序列參數集合(SPS)或圖像參數集合(PPS)中。
此外,當前視訊可接受的關於變換單元的最大大小的資訊以及關於變換的最小大小的資訊亦可經由位元串流的標頭、SPS或PPS而輸出。輸出單元130可對與參照圖1至圖8而描述的預測有關的參考資訊、預測資訊、單方向預測資訊以及關於片段類型(包含第四片段類型)的資訊做編碼以及輸出。
在視訊編碼裝置100中,較深編碼單元可為藉由將較上
層深度的編碼單元(其為上一層)的高度或寬度劃分為2份而獲得的編碼單元。換言之,在當前深度的編碼單元的大小為2N×2N時,較下層深度的編碼單元的大小為N×N。而且,大小為2N×2N的當前深度的編碼單元可包含較下層深度的最多4個編碼單元。
因此,視訊編碼裝置100可藉由基於考慮當前圖像的特性而決定的最大編碼單元的大小以及最大深度,藉由針對每一最大編碼單元決定具有最佳形狀以及最佳大小的編碼單元而形成具有樹狀結構的編碼單元。而且,由於藉由使用各種預測模式以及變換中的任一者對每一最大編碼單元執行編碼,因此可考慮各種影像大小的編碼單元的特性來決定最佳編碼模式。
因此,若在習知巨集區塊(mocro block)中對具有高解析度或大資料量的影像做編碼,則每圖像的巨集區塊的數目過度地增大。因此,針對每一巨集區塊產生的壓縮資訊的段數增大,也因此難以傳輸壓縮資訊,而且資料壓縮效率降低。然而,藉由使用視訊編碼裝置100,因為在考慮影像的大小的而增大編碼單元的最大大小的同時考慮影像的特性而調整編碼單元,所以影像壓縮效率可提高。
圖9的視訊編碼裝置100可藉由上文參照圖1描述的移動向量決定裝置10以及視訊編碼單元70執行操作。
編碼單元決定器120可決定預測單元,其包含用於每一最大編碼單元的根據樹狀結構的每一各別編碼單元的畫面間預測的分區;並可針對每一各別預測單元執行畫面間預測。
編碼單元決定器120決定用於每一各別預測單元的移動向量。而且,對於移動向量預測、PU合併或AMVP,可藉由參考另一預測單元的移動向量來預測當前預測單元(分區)的移動向量。編碼單元決定器120可決定當前預測單元的候選移動向量清單以便執行移動向量預測。可自候選移動向量清單中所包含的候選移動向量決定參考移動向量。第一候選預測單元可為鄰近於當前影像中的當前預測單元的相鄰預測單元或可為搭配影像中的搭配預測單元。
在當前預測單元的候選移動向量清單中的候選預測單元中的第一候選預測單元的參考影像不同於當前預測單元的參考影像時,編碼單元決定器120基於當前預測單元的參考影像以及第一候選預測單元的參考影像中的每一者為短期參考影像還是長期參考影像來決定是否使用候選移動向量清單中的第一候選預測單元的移動向量。
或者,可基於當前預測單元以及第一候選預測單元的長期參考索引來決定當前預測單元的參考影像以及第一候選預測單元的參考影像中的每一者為短期參考影像還是長期參考影像。
在當前預測單元的參考影像以及第一候選預測單元的參考影像全部為長期參考影像時,可將第一候選預測單元的移動向量維持於候選移動向量清單中,而不縮放第一候選預測單元的移動向量的大小。
在當前預測單元的參考影像以及第一候選區塊的參考影
像中的一者為短期參考影像,而當前預測單元的參考影像以及第一候選區塊的參考影像中的另一者為長期參考影像時,可決定不使用候選移動向量清單中的第一候選預測單元的移動向量。
在當前預測單元的參考影像以及第一候選預測單元的參考影像全部為短期參考影像時,可縮放第一候選預測單元的移動向量的大小並接著將第一候選預測單元的移動向量包含於候選移動向量清單中。
編碼單元決定器120可藉由自候選移動向量清單中所包含的移動向量選擇最佳參考移動向量來決定參考移動向量,而可藉由使用所選擇的參考移動向量來預測並決定當前預測單元的移動向量。
編碼單元決定器120可根據由當前預測單元的參考索引指示的POC來決定當前預測單元的參考影像。不管當前預測單元的參考影像為短期參考影像還是長期參考影像,參考索引可指示POC而編碼單元決定器120可將由POC指示的影像決定為參考影像。
編碼單元決定器120可決定由當前預測單元的移動向量在當前預測單元的參考影像中指示的參考區塊,而且可產生參考預測單元與當前預測單元之間的殘餘資料。
因此,編碼單元決定器120可針對每一預測單元執行畫面間預測並接著可輸出用於每一預測單元的殘餘資料。
編碼單元決定器120可對包含用於每一預測單元的殘餘
資料的編碼單元的變換單元執行變換以及量化,也因此可產生經量化的變換係數。因此,編碼單元決定器120可產生用於每一變換單元的經量化的變換係數。
而且,編碼單元決定器120可執行上文參照圖8描述的視訊解碼單元80的操作,以便產生用於預測單元的畫面間預測的參考影像。
編碼單元決定器120可對當前預測單元的經量化的變換係數執行逆量化以及逆變換,也因此可復原當前區塊的殘餘資料。
編碼單元決定器120可決定當前預測單元的候選移動向量清單,而且在當前預測單元的候選移動向量清單中的候選預測單元中的第一候選預測單元的參考影像不同於當前預測單元的參考影像時,編碼單元決定器120可基於當前預測單元的參考影像以及第一候選預測單元的參考影像中的每一者為短期參考影像還是長期參考影像來決定是否使用候選移動向量清單中的第一候選預測單元的移動向量。
編碼單元決定器120可藉由自候選移動向量清單中所包含的移動向量選擇最佳參考移動向量來決定參考移動向量,而可藉由使用所選擇的參考移動向量來預測並決定當前預測單元的移動向量。
編碼單元決定器120可決定由當前預測單元的參考索引指示的當前預測單元的參考影像。亦即,可根據由當前預測單元的參考索引指示的POC來決定當前預測單元的參考影像。不管當
前預測單元的參考影像為短期參考影像還是長期參考影像,參考索引可指示POC並由POC指示的影像可被決定為參考影像。
因此,編碼單元決定器120可針對每一預測單元執行移動補償,可復原每一預測單元,也因此可復原包含所復原的預測單元的當前影像。所復原的預測單元以及影像可變成另一預測單元以及另一影像的參考目標。
圖10為根據本發明的實施例的基於根據樹狀結構的編碼單元的視訊解碼裝置200的方塊圖。
基於根據樹狀結構的編碼單元的視訊解碼裝置200包含接收器210、影像資料以及編碼資訊提取器220以及影像資料解碼器230。下文中,為便於描述,使用基於根據樹狀結構的編碼單元的視訊預測的視訊解碼裝置200將被稱為「視訊解碼裝置200」。
用於視訊解碼裝置200的解碼操作的各種術語(諸如,編碼單元、深度、預測單元、變換單元以及關於各種編碼模式的資訊)的定義與參照圖9以及參考視訊編碼裝置100所述的術語相同。
接收器210接收並剖析經編碼的視訊的位元串流。影像資料以及編碼資訊提取器220自所剖析的位元串流提取每一編碼單元的經編碼的影像資料,其中編碼單元具有根據每一最大編碼單元的樹狀結構,並將所提取的影像資料輸出至影像資料解碼器230。影像資料以及編碼資訊提取器220可自關於當前圖像的標頭、SPS或PPS提取關於當前圖像的編碼單元的最大大小的資訊。
而且,影像資料以及編碼資訊提取器220自所剖析的位元串流針對具有根據每一最大編碼單元的樹狀結構的編碼單元提取關於經編碼的深度以及編碼模式的資訊。關於經編碼的深度以及編碼模式的所提取的資訊輸出至影像資料解碼器230。換言之,位元串流中的影像資料分割為最大編碼單元,使得影像資料解碼器230對每一最大編碼單元的影像資料做解碼。
可針對關於對應於經編碼的深度的至少一編碼單元的資訊而設定根據最大編碼單元關於經編碼的深度以及編碼模式的資訊,而關於編碼模式的資訊可包含關於對應於經編碼的深度的相應編碼單元的分區類型、關於預測模式以及變換單元的大小的資訊。而且,可將根據深度的分割資訊作為關於經編碼的深度的資訊來提取。
由影像資料以及編碼資訊提取器220提取的根據每一最大編碼單元關於經編碼的深度以及編碼模式的資訊為關於經決定以在諸如視訊編碼裝置100的編碼器根據每一最大編碼單元對根據深度的每一較深編碼單元重複地執行編碼時產生最小編碼誤差的經編碼的深度以及編碼模式的資訊。因此,視訊解碼裝置200可藉由根據產生最小編碼誤差的經編碼的深度以及編碼模式來對影像資料做解碼而復原影像。
由於關於經編碼的深度以及編碼模式的編碼資訊可指派給相應編碼單元、預測單元以及最小單元中的預定資料單元,因此影像資料以及編碼資訊提取器220可提取根據預定資料單元關
於經編碼的深度以及編碼模式的資訊。被指派關於經編碼的深度以及編碼模式的相同資訊的預定資料單元可推斷為包含於同一最大編碼單元中的資料單元。
影像資料解碼器230可藉由基於根據最大編碼單元關於經編碼的深度以及編碼模式的資訊對每一最大編碼單元中的影像資料做解碼來復原當前圖像。換言之,影像資料解碼器230可基於關於每一最大編碼單元中所包含的具有樹狀結構的編碼單元中的每一編碼單元的分區類型、預測模式以及變換單元的所提取的資訊而對經編碼的影像資料做解碼。解碼程序可包含:包含畫面內預測以及移動補償的預測;以及逆變換。可根據逆正交變換或逆整數變換的方法而執行逆變換。
影像資料解碼器230可基於根據經編碼的深度關於每一編碼單元的預測單元的分區類型以及預測模式的資訊根據所述編碼單元的分區以及預測模式來執行畫面內預測或移動補償。
此外,影像資料解碼器230可針對每一編碼單元根據樹狀結構來讀取變換單元資訊以便決定每一編碼單元的變換單元,而且基於每一編碼單元的變換單元來執行逆變換,以實現每一最大編碼單元的逆變換。經由逆變換,可復原編碼單元的空間區域的像素值。
影像資料解碼器230可藉由使用根據深度的分割資訊而決定當前最大編碼單元的至少一經編碼的深度。若分割資訊指示影像資料在當前深度中不再分割,則當前深度為經編碼的深度。
因此,影像資料解碼器230可藉由使用關於對應於經編碼的深度的每一編碼單元的預測單元的分區類型、預測模式以及變換單元的大小的資訊來對對應於當前最大編碼單元中的每一經編碼的深度的至少一編碼單元的經編碼的資料做解碼,並輸出當前最大編碼單元的影像資料。
換言之,可藉由觀測針對編碼單元、預測單元以及最小單元中的預定資料單元而指派的編碼資訊集合來收集含有包含相同分割資訊的編碼資訊的資料單元,並可將所收集的資料單元視為待由影像資料解碼器230在同一編碼模式中解碼的一資料單元。針對如上所述而決定的每一編碼單元,可獲得關於編碼模式的資訊,以便對當前編碼單元做解碼。
而且,圖10所示的視訊解碼裝置200的影像資料解碼器230可執行上文參照圖1描述的移動向量決定裝置10以及視訊解碼單元80的操作。
影像資料解碼器230可決定用於移動補償的預測單元,並可對用於每一最大編碼單元中的根據樹狀結構的每一各別編碼單元的各別預測單元執行移動補償。影像資料解碼器230可對當前預測單元的經量化的變換係數執行逆量化以及逆變換,也因此可復原當前區塊的殘餘資料。影像資料解碼器230可對經由畫面間預測而編碼的當前預測單元執行移動補償,也因此可復原當前預測單元。
影像資料解碼器230可決定當前預測單元的候選移動向
量清單,而當候選移動向量清單中的候選預測單元中的第一候選預測單元的參考影像不同於當前預測單元的參考影像時,影像資料解碼器230可基於當前預測單元的參考影像以及第一候選預測單元的參考影像中的每一者為短期參考影像還是長期參考影像來決定是否使用候選移動向量清單中的第一候選預測單元的移動向量。第一候選預測單元可為鄰近於當前影像中的當前預測單元的相鄰預測單元或可為搭配影像中的搭配預測單元。
可基於當前預測單元以及第一候選預測單元的長期參考索引來決定當前預測單元的參考影像以及第一候選預測單元的參考影像中的每一者為短期參考影像還是長期參考影像。
在當前預測單元的參考影像以及第一候選預測單元的參考影像全部為長期參考影像時,可將第一候選預測單元的移動向量維持於候選移動向量清單中,而不縮放第一候選預測單元的移動向量的大小。
在當前預測單元的參考影像以及第一候選區塊的參考影像中的一者為短期參考影像,而當前預測單元的參考影像以及第一候選區塊的參考影像中的另一者為長期參考影像時,可決定不使用候選移動向量清單中的第一候選預測單元的移動向量。
在當前預測單元的參考影像以及第一候選預測單元的參考影像全部為短期參考影像時,可縮放第一候選預測單元的移動向量的大小並接著將第一候選預測單元的移動向量包含於候選移動向量清單中。
影像資料解碼器230可藉由自候選移動向量清單中所包含的移動向量選擇最佳參考移動向量來決定參考移動向量,而可藉由使用所選擇的參考移動向量來預測並決定當前預測單元的移動向量。
影像資料解碼器230可根據由當前預測單元的參考索引指示的POC來決定當前預測單元的參考影像。不管當前預測單元的參考影像為短期參考影像還是長期參考影像,參考索引可指示POC而影像資料解碼器230可將由POC指示的影像決定為參考影像。
可決定由當前預測單元的移動向量在當前預測單元的參考影像中指示的參考預測單元,並可合成參考預測單元以及當前預測單元的殘餘資料,以使得可復原當前預測單元。
因此,影像資料解碼器230可針對每一預測單元執行移動補償,可復原每一預測單元,也因此可復原包含所復原的預測單元的當前影像。當以上述方式復原影像時,可復原包含所復原的影像的序列的視訊。而且,所復原的預測單元以及影像可變成另一預測單元以及另一影像的參考目標。
視訊解碼裝置200可獲得關於在對每一最大編碼單元按遞迴方式執行編碼時產生最小編碼誤差的至少一編碼單元的資訊,並可使用所述資訊來對當前圖像做解碼。換言之,可對決定為每一最大編碼單元中的最佳編碼單元的具有樹狀結構的編碼單元做解碼。而且,考慮影像資料的解析度以及量來決定編碼單元
的最大大小。
因此,即使影像資料具有高解析度以及大量資料,仍可藉由使用自編碼器接收的關於最佳編碼模式的資訊藉由使用根據影像資料的特性而適應性地決定的編碼單元的大小以及編碼模式來有效地對影像資料做解碼以及復原。
圖11為用於描述根據本發明的實施例的編碼單元的概念的圖式。
編碼單元的大小可用寬度×高度來表達,而且可包含64×64、32×32、16×16以及8×8。64×64的編碼單元可分割為64×64、64×32、32×64或32×32的分區,而32×32的編碼單元可分割為32×32、32×16、16×32或16×16的分區,16×16的編碼單元可分割為16×16、16×8、8×16或8×8的分區,而8×8的編碼單元可分割為8×8、8×4、4×8或4×4的分區。
在視訊資料310中,解析度為1920×1080,編碼單元的最大大小為64,而最大深度為2。在視訊資料320中,解析度為1920×1080,編碼單元的最大大小為64,而最大深度為3。在視訊資料330中,解析度為352×288,編碼單元的最大大小為16,而最大深度為1。圖11所示的最大深度表示自最大編碼單元至最小解碼單元的總分割次數。
若解析度高或資料量大,則編碼單元的最大大小可為大的,以便不僅提高編碼效率而且準確地反映影像的特性。因此,具有高於視訊資料330的解析度的視訊資料310以及320的編碼
單元的最大大小可為64。
由於視訊資料310的最大深度為2,因此視訊資料310的編碼單元315可包含長軸大小為64的最大編碼單元,以及長軸大小為32以及16的編碼單元,此是因為深度藉由分割最大編碼單元兩次而加深為兩層。同時,由於視訊資料330的最大深度為1,因此視訊資料330的編碼單元335可包含長軸大小為16的最大編碼單元,以及長軸大小為8的編碼單元,此是因為深度藉由分割最大編碼單元一次而加深為一層。
由於視訊資料320的最大深度為3,因此視訊資料320的編碼單元325可包含長軸大小為64的最大編碼單元,以及長軸大小為32、16以及8的編碼單元,此是因為深度藉由分割最大編碼單元三次而加深為三層。隨著深度加深,可精確地表達詳細資訊。
圖12為根據本發明的實施例的基於編碼單元的影像編碼器400的方塊圖。
影像編碼器400執行視訊編碼裝置100的編碼單元決定器120的操作以對影像資料做編碼。換言之,畫面內預測器410對當前畫面405中的處於畫面內模式中的編碼單元執行畫面內預測,而移動估計器420以及移動補償器425藉由使用當前畫面405以及參考畫面495而對當前畫面405中的處於畫面間模式中的編碼單元執行畫面間估計以及移動補償。
自畫面內預測器410、移動估計器420以及移動補償器
425輸出的資料經由變換器430以及量化器440作為經量化的變換係數而輸出。經量化的變換係數經由逆量化器460以及逆變換器470復原為空間域中的資料,而空間域中的所復原的資料在經由解區塊單元480以及迴路濾波單元490後處理之後作為參考畫面495輸出。經量化的變換係數可經由熵編碼器450作為位元串流455輸出。
為了使影像編碼器400應用於視訊編碼裝置100中,影像編碼器400的所有部件(亦即,畫面內預測器410、移動估計器420、移動補償器425、變換器430、量化器440、熵編碼器450、逆量化器460、逆變換器470、解區塊單元480以及迴路濾波單元490)在考慮每一最大編碼單元的最大深度的同時基於具有樹狀結構的編碼單元中的每一編碼單元來執行操作。
具體言之,畫面內預測器410、移動估計器420以及移動補償器425在考慮當前最大編碼單元的最大大小以及最大深度的同時決定具有樹狀結構的編碼單元中的每一編碼單元的分區以及預測模式,而變換器430決定具有樹狀結構的編碼單元中的每一編碼單元中的變換單元的大小。
具體言之,對於移動向量預測、PU合併或AMVP,移動估計器420可藉由參考另一預測單元的移動向量來預測當前預測單元(分區)的移動向量。
在當前預測單元的候選移動向量清單中的候選預測單元中的第一候選預測單元的參考影像不同於當前預測單元的參考畫
面495時,移動估計器420基於當前預測單元的參考畫面495以及第一候選預測單元的參考影像中的每一者為短期參考影像還是長期參考影像來決定是否使用候選移動向量清單中的第一候選預測單元的移動向量。
在當前預測單元的參考影像以及第一候選預測單元的參考影像中的至少一者為長期參考影像時,移動估計器420可決定將第一候選區塊的移動向量包含於候選移動向量清單中,而不縮放第一候選區塊的移動向量的大小,或可決定不使用候選移動向量清單中的第一候選區塊的移動向量。
移動估計器420可藉由自候選移動向量清單中所包含的移動向量選擇最佳參考移動向量來決定參考移動向量,而可藉由使用所選擇的參考移動向量來預測並決定當前預測單元的移動向量。移動估計器420可決定由當前區塊的移動向量在當前預測單元的參考畫面495中指示的參考區塊,並可產生參考預測單元與當前預測單元之間的殘餘資料。因此,移動估計器420可輸出用於每一預測單元的殘餘資料。
而且,在當前預測單元的候選移動向量清單中的候選預測單元中的第一候選預測單元的參考影像不同於當前預測單元的參考畫面495時,移動補償器425亦可基於當前預測單元的參考畫面495以及第一候選預測單元的參考影像中的至少一者是否為長期參考影像來決定是否使用候選移動向量清單中的第一候選預測單元的移動向量或是否將第一候選預測單元的移動向量排除於
候選移動向量清單以外。
移動補償器425可藉由自候選移動向量清單中所包含的移動向量選擇最佳參考移動向量來決定參考移動向量,而可藉由使用所選擇的參考移動向量來預測並決定當前預測單元的移動向量。
移動補償器425可決定由當前預測單元的移動向量在參考畫面495中指示的參考預測單元,可合成參考預測單元以及當前預測單元的殘餘資料,也因此可復原當前預測單元。
因此,移動補償器425可針對每一預測單元執行移動補償,可復原每一預測單元,也因此可復原包含所復原的預測單元的當前影像。所復原的預測單元以及影像可變成另一預測單元以及另一影像的參考目標。
圖13為根據本發明的實施例的基於編碼單元的影像解碼器500的方塊圖。
剖析器510自位元串流505剖析待解碼的經編碼的影像資料以及解碼所需的關於編碼的資訊。經編碼的影像資料經由熵解碼器520以及逆量化器530作為經逆量化的資料而輸出,經逆量化的資料經由逆變換器540而復原為空間域中的影像資料。
畫面內預測器550關於空間域中的影像資料對處於畫面內模式中的編碼單元執行畫面內預測,而移動補償器560藉由使用參考畫面585對處於畫面間模式中的編碼單元執行移動補償。
通過畫面內預測器550以及移動補償器560的空間域中
的影像資料可在經由解區塊單元570以及迴路濾波單元580後處理之後作為所復原的畫面595輸出。而且,經由解區塊單元570以及迴路濾波單元580後處理的影像資料可作為參考畫面585輸出。
為了在視訊解碼裝置200的影像資料解碼器230中對影像資料做解碼,影像解碼器500可執行在剖析器510執行操作之後執行的操作。
為了使影像解碼器500應用於視訊解碼裝置200中,影像解碼器500的所有部件(亦即,剖析器510、熵解碼器520、逆量化器530、逆變換器540、畫面內預測器550、移動補償器560、解區塊單元570以及迴路濾波單元580)針對每一最大編碼單元基於具有樹狀結構的編碼單元來執行操作。
具體言之,畫面內預測550以及移動補償器560針對具有樹狀結構的編碼單元中的每一者基於分區以及預測模式而執行操作,而且逆變換器540針對每一編碼單元基於變換單元的大小而執行操作。
具體言之,在當前預測單元的候選移動向量清單中的候選預測單元中的第一候選預測單元的參考影像不同於當前預測單元的參考畫面585時,移動補償器560可基於當前預測單元的參考畫面585以及第一候選預測單元的參考影像中的至少一者是否為長期參考影像來決定是否使用候選移動向量清單中的第一候選預測單元的移動向量或是否將第一候選預測單元的移動向量排除
於候選移動向量清單以外。
移動補償器560可藉由自候選移動向量清單中所包含的移動向量選擇最佳參考移動向量來決定參考移動向量,而可藉由使用所選擇的參考移動向量來預測並決定當前預測單元的移動向量。
移動補償器560可決定由根據當前預測單元的參考索引的POC指示的參考畫面585,可決定由當前預測單元的移動向量在參考畫面585中指示的參考預測單元,可合成參考預測單元以及當前預測單元的殘餘資料,也因此可復原當前預測單元。
因此,移動補償器560可針對每一預測單元執行移動補償,可復原每一預測單元,也因此可復原包含所復原的預測單元的當前影像。所復原的預測單元以及影像可變成另一預測單元以及另一影像的參考目標。
圖14為說明根據本發明的實施例的根據深度的較深編碼單元以及分區的圖式。
視訊編碼裝置100以及視訊解碼裝置200使用階層式編碼單元以便考慮影像的特性。可根據影像的特性來適應性地決定編碼單元的最大高度、最大寬度以及最大深度,或可由使用者不同地進行設定。可根據編碼單元的預定最大大小決定根據深度的較深編碼單元的大小。
在根據本發明的實施例的編碼單元的階層式結構600中,編碼單元的最大高度以及最大寬度各為64,而最大深度為4。
在此狀況下,最大深度指編碼單元自最大編碼單元分割至最小編碼單元的總分割次數。由於深度沿著階層式結構600的垂直軸加深,因此將較深編碼單元的高度以及寬度各自分割。而且,沿著階層式結構600的水平軸展示作為用於每一較深編碼單元的預測編碼的基礎的預測單元以及分區。
換言之,編碼單元610為階層式結構600中的最大編碼單元,其中深度為0而大小(亦即,高度乘寬度)為64×64。深度沿著垂直軸而加深,而且存在大小為32×32而深度為1的編碼單元620、大小為16×16而深度為2的編碼單元630以及大小為8×8而深度為3的編碼單元640。大小為8×8而深度為3的編碼單元640為具有最下層深度的最小編碼單元。
編碼單元的預測單元以及分區根據每一深度沿著水平軸而配置。換言之,若大小為64×64而深度為0的編碼單元610為預測單元,則預測單元可分割為包含於編碼單元610中的分區,亦即,大小為64×64的分區610、大小為64×32的分區612、大小為32×64的分區614或大小為32×32的分區616。
類似地,大小為32×32而深度為1的編碼單元620的預測單元可分割為包含於編碼單元620中的分區,亦即,大小為32×32的分區620、大小為32×16的分區622、大小為16×32的分區624以及大小為16×16的分區626。
類似地,大小為16×16而深度為2的編碼單元630的預測單元可分割為包含於編碼單元630中的分區,亦即,包含於編
碼單元中的大小為16×16的分區630、大小為16×8的分區632、大小為8×16的分區634以及大小為8×8的分區636。
類似地,大小為8×8而深度為3的編碼單元640的預測單元可分割為包含於編碼單元640中的分區,亦即,包含於編碼單元中的大小為8×8的分區640、大小為8×4的分區642、大小為4×8的分區644以及大小為4×4的分區646。
為了決定構成最大編碼單元610的編碼單元的至少一經編碼的深度,視訊編碼裝置100的編碼單元決定器120對包含於最大編碼單元610中的對應於每一深度的編碼單元執行編碼。
隨著深度加深,包含相同範圍中的資料以及相同大小的根據深度的較深編碼單元的數目增大。舉例而言,需要對應於深度2的四個編碼單元來涵蓋包含於對應於深度1的一編碼單元中的資料。因此,為了比較根據深度的相同資料的編碼結果,將對應於深度1的編碼單元以及對應於深度2的四個編碼單元各自編碼。
為了針對深度中的當前深度執行編碼,沿著階層式結構600的水平軸,可藉由針對對應於當前深度的編碼單元中的每一預測單元執行編碼而針對當前深度選擇最小編碼誤差。或者,可藉由比較根據深度的最小編碼誤差、藉由隨著深度沿著階層式結構600的垂直軸加深而針對每一深度執行編碼來搜尋最小編碼誤差。可選擇編碼單元610中具有最小編碼誤差的深度以及分區作為編碼單元610的經編碼的深度以及分區類型。
圖15為用於描述根據本發明的實施例的編碼單元710與變換單元720之間的關係的圖式。
視訊編碼裝置100或200針對每一最大編碼單元根據具有小於或等於最大編碼單元的大小的編碼單元來對影像做編碼或解碼。可基於不大於相應編碼單元的資料單元而選擇在編碼期間用於變換的變換單元的大小。
舉例而言,在視訊編碼裝置100或200中,若編碼單元710的大小為64×64,則可藉由使用大小為32×32的變換單元720來執行變換。
而且,可藉由對大小為小於64×64的32×32、16×16、8×8以及4×4的變換單元中的每一者執行變換而對大小為64×64的編碼單元710的資料做編碼,並接著可選擇具有最小編碼誤差的變換單元。
圖16為用於描述根據本發明的實施例的對應於經編碼的深度的編碼單元的編碼資訊的圖式。
視訊編碼裝置100的輸出單元130可對關於分區類型的資訊800、關於預測模式的資訊810,以及關於對應於經編碼的深度的每一編碼單元的變換單元的大小的資訊820做編碼並作為關於編碼模式的資訊而傳輸。
資訊800指示關於藉由分割當前編碼單元的預測單元而獲得的分區的形狀的資訊,其中分區為用於當前編碼單元的預測編碼的資料單元。舉例而言,大小為2N×2N的當前編碼單元CU_0
可分割為大小為2N×2N的分區802、大小為2N×N的分區804、大小為N×2N的分區806以及大小為N×N的分區808中的任一者。此處,關於分區類型的資訊800設定為指示大小為2N×N的分區804、大小為N×2N的分區806以及大小為N×N的分區808中的一者。
資訊810指示每一分區的預測模式。舉例而言,資訊810可指示對由資訊800指示的分區執行的預測編碼的模式,亦即,畫面內模式812、畫面間模式814或跳過模式816。
資訊820指示待基於何時對當前編碼單元執行變換的變換單元。舉例而言,變換單元可為第一畫面內變換單元822、第二畫面內變換單元824、第一畫面間變換單元826或第二畫面內變換單元828。
根據每一較深編碼單元,視訊解碼裝置200的影像資料以及編碼資訊提取器220可提取而使用資訊800、810以及820以用於解碼。
圖17為根據本發明的實施例的根據深度的較深編碼單元的圖式。
分割資訊可用以指示深度的改變。分割資訊指示當前深度的編碼單元是否分割為較下層深度的編碼單元。
用於深度為0而大小為2N_0×2N_0的編碼單元900的預測編碼的預測單元910可包含大小為2N_0×2N_0的分區類型912、大小為2N_0×N_0的分區類型914、大小為N_0×2N_0的分
區類型916以及大小為N_0×N_0的分區類型918的分區。圖17僅說明藉由對稱地分割預測單元910而獲得的分區類型912至918,但分區類型不限於此,而且預測單元910的分區可包含非對稱分區、具有預定形狀的分區以及具有幾何形狀的分區。
根據每一分區類型,對大小為2N_0×2N_0的一分區、大小為2N_0×N_0的兩個分區、大小為N_0×2N_0的兩個分區以及大小為N_0×N_0的四個分區重複地執行預測編碼。可對大小為2N_0×2N_0、N_0×2N_0、2N_0×N_0以及N_0×N_0的分區執行在畫面內模式以及畫面間模式中的預測編碼。僅對大小為2N_0×2N_0的分區執行在跳過模式中的預測編碼。
比較包含分區類型912至918中的預測編碼的編碼的誤差,而自分區類型中決定最小編碼誤差。若編碼誤差在分區類型912至916中的一者中最小,則預測單元910可能不分割為較下層深度。
若編碼誤差在分區類型918中最小,則深度自0改變為1以在操作920中分割分區類型918,對深度為2而大小為N_0×N_0的編碼單元930重複地執行編碼以搜尋最小編碼誤差。
用於深度為1而大小為2N_1×2N_1(=N_0×N_0)的編碼單元930的預測編碼的預測單元940可包含大小為2N_1×2N_1的分區類型942、大小為2N_1×N_1的分區類型944、大小為N_1×2N_1的分區類型946以及大小為N_1×N_1的分區類型948的分區。
若編碼誤差在分區類型948中最小,則深度自1改變為2以在操作950中分割分區類型948,對深度為2而大小為N_2×N_2的編碼單元960重複地執行編碼以搜尋最小編碼誤差。
當最大深度為d時,可執行根據每一深度的分割操作直至深度變為d-1時,而可對分割資訊做編碼直至深度為0至d-2中的一者時。換言之,當執行編碼直至在對應於深度d-2的編碼單元在操作970中分割之後深度為d-1時,用於深度為d-1而大小為2N_(d-1)×2N_(d-1)的編碼單元980的預測編碼的預測單元990可包含大小為2N_(d-1)×2N_(d-1)的分區類型992、大小為2N_(d-1)×N_(d-1)的分區類型994、大小為N_(d-1)×2N_(d-1)的分區類型996以及大小為N_(d-1)×N_(d-1)的分區類型998的分區。
可對分區類型992至998中的大小為2N_(d-1)×2N_(d-1)的一分區、大小為2N_(d-1)×N_(d-1)的兩個分區、大小為N_(d-1)×2N_(d-1)的兩個分區、大小為N_(d-1)×N_(d-1)的四個分區重複地執行預測編碼以搜尋具有最小編碼誤差的分區類型。
即使當分區類型998具有最小編碼誤差時,由於最大深度為d,因此不再將深度為d-1的編碼單元CU_(d-1)分割為較下層深度,而將構成當前最大編碼單元900的編碼單元的經編碼的深度決定為d-1,並可將當前最大編碼單元900的分區類型決定為N_(d-1)×N_(d-1)。而且,由於最大深度為d而且具有最下層深度d-1的最小編碼單元980不再分割為較下層深度,因此不設定用於最小編碼單元980的分割資訊。
資料單元999可為當前最大編碼單元的「最小單元」。根據本發明的實施例的最小單元可為藉由將最小編碼單元980分割為4份而獲得的矩形資料單元。藉由重複地執行編碼,視訊編碼裝置100可藉由根據編碼單元900的深度比較編碼誤差而選擇具有最小編碼誤差的深度以決定經編碼的深度,並將相應分區類型以及預測模式設定為經編碼的深度的編碼模式。
因而,在所有深度1至d中比較根據深度的最小編碼誤差,並可將具有最小編碼誤差的深度決定為經編碼的深度。可對經編碼的深度、預測單元的分區類型以及預測模式做編碼並作為關於編碼模式的資訊而傳輸。而且,由於編碼單元自深度0分割為經編碼的深度,因此僅經編碼的深度的分割資訊設定為0,而排除經編碼的深度的深度的分割資訊設定為1。
視訊解碼裝置200的影像資料以及編碼資訊提取器220可提取並使用關於編碼單元900的經編碼的深度以及預測單元的資訊以對分區912做解碼。視訊解碼裝置200可藉由使用根據深度的分割資訊而將分割資訊為0的深度決定為經編碼的深度,並使用關於相應深度的編碼模式的資訊以用於解碼。
圖18至圖20為用於描述根據本發明的實施例的編碼單元1010、預測單元1060與變換單元1070之間的關係的圖式。
編碼單元1010為在最大編碼單元中對應於由視訊編碼裝置100決定的經編碼的深度的具有樹狀結構的編碼單元。預測單元1060為編碼單元1010中的每一者的預測單元的分區,而變換
單元1070為編碼單元1010中的每一者的變換單元。
當最大編碼單元的深度在編碼單元1010中為0時,編碼單元1012以及1054的深度為1,編碼單元1014、1016、1018、1028、1050以及1052的深度為2,編碼單元1020、1022、1024、1026、1030、1032以及1048的深度為3,而編碼單元1040、1042、1044以及1046的深度為4。
在預測單元1060中,藉由在編碼單元1010中分割編碼單元而獲得一些編碼單元1014、1016、1022、1032、1048、1050、1052以及1054。換言之,編碼單元1014、1022、1050以及1054中的分區類型的大小為2N×N,編碼單元1016、1048以及1052中的分區類型的大小為N×2N,而編碼單元1032的分區類型的大小為N×N。編碼單元1010的預測單元以及分區小於或等於每一編碼單元。
對小於編碼單元1052的資料單元中的變換單元1070中的編碼單元1052的影像資料執行變換或逆變換。而且,變換單元1070中的編碼單元1014、1016、1022、1032、1048、1050以及1052的大小以及形狀不同於預測單元1060中的編碼單元。換言之,視訊編碼裝置100以及視訊解碼裝置200可對同一編碼單元中的資料單元個別地執行畫面內預測、移動估計、移動補償、變換以及逆變換。
因此,對在最大編碼單元的每一區域中具有階層式結構的編碼單元中的每一者以遞迴方式執行編碼以決定最佳編碼單
元,也因此可獲得具有遞迴樹狀結構的編碼單元。編碼資訊可包含關於編碼單元的分割資訊、關於分區類型的資訊、關於預測模式的資訊,以及關於變換單元的大小的資訊。表1展示可由視訊編碼裝置100以及視訊解碼裝置200設定的編碼資訊。
視訊編碼裝置100的輸出單元130可輸出關於具有樹狀結構的編碼單元的編碼資訊,而視訊解碼裝置200的影像資料以及編碼資訊提取器220可自所接收的位元串流提取關於具有樹狀
結構的編碼單元的編碼資訊。
分割資訊指示當前編碼單元是否分割為較下層深度的編碼單元。若當前深度d的分割資訊為0,則當前編碼單元不再分割為較下層深度的深度為經編碼的深度,也因此可針對經編碼的深度而定義關於分區類型、預測模式以及變換單元的大小的資訊。若根據分割資訊進一步分割當前編碼單元,則對較下層深度的四個分割編碼單元獨立地執行編碼。
預測模式可為畫面內模式、畫面間模式以及跳過模式中的一者。可在所有分區類型中定義畫面內模式以及畫面間模式,而僅在大小為2N×2N的分區類型中定義跳過模式。
關於分區類型的資訊可指示:大小為2N×2N、2N×N、N×2N以及N×N的對稱分區類型,其是藉由對稱地分割預測單元的高度或寬度而獲得;以及大小為2N×nU、2N×nD、nL×2N以及nR×2N的非對稱分區類型,其是藉由非對稱地分割預測單元的高度或寬度而獲得。可藉由以1:3以及3:1分割預測單元的高度而分別獲得大小為2N×nU以及2N×nD的非對稱分區類型,而可藉由以1:3以及3:1分割預測單元的寬度而分別獲得大小為nL×2N以及nR×2N的非對稱分區類型。
變換單元的大小可在畫面內模式中設定為兩種類型並在畫面間模式中設定為兩種類型。換言之,若變換單元的分割資訊為0,則變換單元的大小可為2N×2N,此為當前編碼單元的大小。若變換單元的分割資訊為1,則可藉由分割當前編碼單元而獲得變
換單元。而且,若大小為2N×2N的當前編碼單元的分區類型為對稱分區類型,則變換單元的大小可為N×N,而若當前編碼單元的分區類型為非對稱分區類型,則變換單元的大小可為N/2×N/2。
關於具有樹狀結構的編碼單元的編碼資訊可包含對應於經編碼的深度的編碼單元、預測單元以及最小單元中的至少一者。對應於經編碼的深度的編碼單元可包含含有相同編碼資訊的預測單元以及最小單元中的至少一者。
因此,藉由比較鄰近資料單元的編碼資訊而決定鄰近資料單元是否包含於對應於經編碼的深度的同一編碼單元中。而且,藉由使用資料單元的編碼資訊而決定對應於經編碼的深度的相應編碼單元,也因此可決定最大編碼單元中的經編碼的深度的分佈。
因此,若基於鄰近資料單元的編碼資訊而預測當前編碼單元,則可直接參考並使用鄰近於當前編碼單元的較深編碼單元中的資料單元的編碼資訊。
或者,若基於鄰近資料單元的編碼資訊而預測當前編碼單元,則使用資料單元的經編碼的資訊而搜尋鄰近於當前編碼單元的資料單元,並可參考所搜尋的鄰近編碼單元以用於預測當前編碼單元。
圖21為用於描述根據表1的編碼模式資訊的編碼單元、預測單元或分區與變換單元之間的關係的圖式。
最大編碼單元1300包含經編碼的深度的編碼單元
1302、1304、1306、1312、1314、1316以及1318。此處,由於編碼單元1318為經編碼的深度的編碼單元,因此分割資訊可設定為0。關於大小為2N×2N的編碼單元1318的分區類型的資訊可設定為大小為2N×2N的分區類型1322、大小為2N×N的分區類型1324、大小為N×2N的分區類型1326、大小為N×N的分區類型1328、大小為2N×nU的分區類型1332、大小為2N×nD的分區類型1334、大小為nL×2N的分區類型1336以及大小為nR×2N的分區類型1338中的一者。
變換單元的分割資訊(變換單元(TU)大小旗標)為一種類型的變換索引。對應於變換索引的變換單元的大小可根據編碼單元的預測單元類型或分區類型而改變。
舉例而言,在分區類型設定為對稱(亦即,分區類型1322、1324、1326或1328)時,若變換單元的分割資訊(TU大小旗標)為0,則設定大小為2N×2N的變換單元1342,而若TU大小旗標為1,則設定大小為N×N的變換單元1344。
當分區類型設定為非對稱(亦即,分區類型1332、1334、1336或1338)時,若TU大小旗標為0,則設定大小為2N×2N的變換單元1352,而若TU大小旗標為1,則設定大小為N/2×N/2的變換單元1354。
參照圖21,TU大小旗標為具有值0或1的旗標,但TU大小旗標不限於1個位元,而變換單元可在TU大小旗標自0增大時階層式分割為具有樹狀結構。變換單元的分割資訊(TU大小旗
標)可為變換索引的實例。
在此狀況下,藉由將根據本發明的實施例的變換單元的TU大小旗標與變換單元的最大大小及最小大小一起使用,可表達已實際使用的變換單元大小。根據本發明的實施例,視訊編碼裝置100能夠對最大變換單元大小資訊、最小變換單元大小資訊以及最大TU大小旗標做編碼。對最大變換單元大小資訊、最小變換單元大小資訊以及最大TU大小旗標做編碼的結果可插入至SPS中。根據本發明的實施例,視訊解碼裝置200可藉由使用最大變換單元大小資訊、最小變換單元大小資訊以及最大TU大小旗標來對視訊做解碼。
舉例而言,(a)若當前編碼單元的大小為64×64而且最大變換單元大小為32×32,則(a-1)當TU大小旗標為0時,變換單元的大小可為32×32,(a-2)當TU大小旗標為1時,變換單元的大小可為16×16,而(a-3)當TU大小旗標為2時,變換單元的大小可為8×8。
作為另一實例,(b)若當前編碼單元的大小為32×32而最小變換單元大小為32×32,則(b-1)當TU大小旗標為0時,變換單元的大小可為32×32。此時,TU大小旗標無法設定為除0之外的值,此是因為變換單元的大小無法小於32×32。
作為另一實例,(c)若當前編碼單元的大小為64×64而最大TU大小旗標為1,則TU大小旗標可為0或1。此時,TU大小旗標無法設定為除0或1之外的值。
因此,若定義最大TU大小旗標為「MaxTransformSizeIndex」、最小變換單元大小為「MinTransformSize」而在TU大小旗標為0時的變換單元大小為「RootTuSize」,則可在當前編碼單元中決定的當前最小變換單元大小「CurrMinTuSize」可由公式(1)來定義:CurrMinTuSize=max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex))...(1)
與可在當前編碼單元中決定的當前最小變換單元大小「CurrMinTuSize」相比,在TU大小旗標為0時的變換單元大小「RootTuSize」可表示可在系統中選擇的最大變換單元大小。在公式(1)中,「RootTuSize/(2^MaxTransformSizeIndex)」表示在TU大小旗標為0時的變換單元大小「RootTuSize」分割對應於最大TU大小旗標的次數時的變換單元大小,而「MinTransformSize」表示最小變換大小。因此,「RootTuSize/(2^MaxTransformSizeIndex)」以及「MinTransformSize」中的較小值可為可在當前編碼單元中決定的當前最小變換單元大小「CurrMinTuSize」。
根據本發明的實施例,最大變換單元大小RootTuSize可根據預測模式的類型而變化。
舉例而言,若當前預測模式為畫面間模式,則可藉由使用下文公式(2)來決定「RootTuSize」。在公式(2)中,
MaxTransformSize」表示最大變換單元大小,而「PUSize」表示當前預測單元大小。
RootTuSize=min(MaxTransformSize,PUSize).........(2)
亦即,若當前預測模式為畫面間模式,則在TU大小旗標為0時的變換單元大小「RootTuSize」可為最大變換單元大小以及當前預測單元大小中的較小值。
若當前預測單元的預測模式為畫面內模式,則可藉由使用下文公式(3)來決定「RootTuSize」。在公式(3)中,「PartitionSize」表示當前分區單元的大小。
RootTuSize=min(MaxTransformSize,PartitionSize)...........(3)
亦即,若當前預測模式為畫面內模式,則在TU大小旗標為0時的變換單元大小「RootTuSize」可為最大變換單元大小以及當前分區單元的大小中的較小值。
然而,根據分區單元的預測模式的類型而變化的當前最大變換單元大小「RootTuSize」僅為一實例,而本發明不限於此。
根據如參照圖9至圖21而描述的基於具有樹狀結構的編碼單元的視訊編碼方法,針對樹狀結構的每一編碼單元來對空間區域的影像資料做編碼。根據基於具有樹狀結構的編碼單元的視訊解碼方法,針對每一最大編碼單元來執行解碼以復原空間區域的影像資料。因此,可復原圖像以及視訊(其為圖像序列)。所復原的視訊可由再生裝置再生,儲存於儲存媒體中或經由網路而傳
輸。
根據本發明的實施例可寫為電腦程式,並可在使用電腦可讀記錄媒體執行程式的通用數位電腦中實施。電腦可讀記錄媒體的實例包含磁性儲存媒體(例如,ROM、軟碟、硬碟等)以及光學記錄媒體(例如,CD-ROM或DVD)。
為便於描述,已參照圖1至圖21而描述的根據移動向量決定方法的視訊編碼方法將統稱為「根據本發明的視訊編碼方法」。此外,已參照圖1至圖21而描述的根據移動向量決定方法的視訊解碼方法將稱為「根據本發明的視訊解碼方法」。
已參照圖1至圖21而描述的包含移動向量決定裝置10、視訊編碼單元70、視訊解碼單元80以及視訊編碼裝置100或影像編碼器400的視訊編碼裝置將稱為「根據本發明的視訊編碼裝置」。此外,已參照圖1至圖21而描述的包含移動向量決定裝置10、視訊解碼單元80、視訊解碼裝置200或影像解碼器500的視訊解碼裝置將稱為「根據本發明的視訊解碼裝置」。
現將詳細描述根據本發明的實施例的儲存程式的電腦可讀記錄媒體(例如,光碟26000)。
圖22說明根據本發明的實施例的儲存程式的光碟26000的實體結構。光碟26000(其為儲存媒體)可為硬碟機(hard drive)、緊密光碟-唯讀記憶體(compact disc-read only memory,CD-ROM)光碟、藍光光碟(Blu-ray disc)或數位多功能光碟(digital versatile disc,DVD)。光碟26000包含多個同心磁軌Tr,其各自劃分為在
光碟26000的圓周方向上的具體數目的磁區Se。在光碟26000的具體區域中,可指派並儲存執行如上所述的移動向量決定方法、視訊編碼方法以及視訊解碼方法的程式。
現將參照圖23描述電腦系統,所述電腦系統是使用儲存媒體來體現的,所述儲存媒體儲存用於執行如上所述的視訊編碼方法以及視訊解碼方法的程式。
圖23說明藉由使用光碟26000而記錄以及讀取程式的光碟機26800。電腦系統26700可經由光碟機26800在光碟26000中儲存程式,所述程式執行根據本發明的實施例的視訊編碼方法以及視訊解碼方法中的至少一者。為了在電腦系統26700中執行儲存於光碟26000中的程式,可藉由使用光碟機26800而自光碟26000讀取程式,並將其傳輸至電腦系統26700。
執行根據本發明的實施例的視訊編碼方法以及視訊解碼方法中的至少一者的程式可不僅儲存於圖22或圖23所說明的光碟26000中,而且儲存於記憶卡、ROM卡匣(ROM cassette)或固態磁碟(solid state drive,SSD)中。
下文將描述應用了上述視訊編碼方法以及視訊解碼方法的系統。
圖24說明提供內容散佈服務的內容供應系統11000的整體結構。通信系統的服務區域劃分為預定大小的小區,而無線基地台11700、11800、11900以及12000分別安裝於此等小區中。
內容供應系統11000包含多個獨立元件。舉例而言,諸
如電腦12100、個人數位助理(personal digital assistant,PDA)12200、視訊攝影機12300以及行動電話12500的所述多個獨立元件經由網際網路服務提供商11200、通信網路11400以及無線基地台11700、11800、11900以及12000而連接至網際網路11100。
然而,內容供應系統11000不限於如圖24所說明的內容供應系統,而且多個元件可選擇性連接至所述內容供應系統。多個獨立元件可直接連接至通信網路11400,而不是經由無線基地台11700、11800、11900以及12000來連接。
視訊攝影機12300為能夠攝取視訊影像的成像元件,例如,數位視訊攝影機。行動電話12500可使用各種協定中的至少一種通信方法,例如,個人數位通信(Personal Digital Communications,PDC)、分碼多重存取(Code Division Multiple Access,CDMA)、寬頻分碼多重存取(Wideband-Code Division Multiple Acces,W-CDMA)、全球行動通信系統(Global System for Mobile Communications,GSM)以及個人手持電話系統(Personal Handyphone System,PHS)。
視訊攝影機12300可經由無線基地台11900以及通信網路11400而連接至串流伺服器11300。串流伺服器11300允許經由視訊攝影機12300自使用者接收的內容經由即時廣播(real-time broadcast)而串流傳輸。可使用視訊攝影機12300或串流伺服器11300來對自視訊攝影機12300接收的內容做編碼。可將由視訊攝影機12300攝取的視訊資料經由電腦12100傳輸至串流伺服器
11300。
亦可將由相機12600攝取的視訊資料經由電腦12100傳輸至串流伺服器11300。相機12600為類似於數位相機能夠攝取靜態影像與視訊影像兩者的成像元件。可使用相機12600或電腦12100來對由相機12600攝取的視訊資料做編碼。執行視訊編碼以及解碼的軟體可儲存於可由電腦12100存取的電腦可讀記錄媒體中,電腦可讀記錄媒體例如為CD-ROM光碟、軟碟(floppy disc)、硬碟機、SSD或記憶卡。
若視訊資料是由內建於行動電話12500中的相機攝取,則可自行動電話12500接收視訊資料。
視訊資料亦可由安裝於視訊攝影機12300、行動電話12500或相機12600中的大型積體電路(large scale integrated circuit,LSI)系統編碼。
根據本發明的實施例,內容供應系統11000可對由使用者使用視訊攝影機12300、相機12600、行動電話12500或另一成像元件記錄的內容資料(例如,在音樂會期間記錄的內容)做編碼,並將經編碼的內容資料傳輸至串流伺服器11300。串流伺服器11300可將經編碼的內容資料以串流內容的類型傳輸至請求內容資料的其他用戶端。
用戶端為能夠對經編碼的內容資料做解碼的元件,例如,電腦12100、PDA 12200、視訊攝影機12300或行動電話12500。因此,內容供應系統11000允許用戶端接收並再生經編碼的內容
資料。而且,內容供應系統11000允許用戶端接收經編碼的內容資料並即時地對經編碼的內容資料做解碼以及再生,藉此實現個人廣播。
內容供應系統11000中所包含的多個獨立元件的編碼以及解碼操作可類似於根據本發明的實施例的視訊編碼裝置以及視訊解碼裝置的編碼以及解碼操作。
現將參照圖25及圖26更詳細地描述根據本發明的實施例的內容供應系統11000中所包含的行動電話12500。
圖25說明根據本發明的實施例的應用了視訊編碼方法以及視訊解碼方法的行動電話12500的外部結構。行動電話12500可為智慧型電話,其功能不受限制,而且其大部分功能可被改變或擴展。
行動電話12500包含內部天線12510,可經由內部天線12520而與圖25的無線基地台12000交換射頻(radio-frequency,RF)信號,而行動電話12500包含用於顯示由相機12530攝取的影像或經由天線12510而接收並被解碼的影像的顯示螢幕12520,例如,液晶顯示器(liquid crystal display,LCD)或有機發光二極體(organic light-emitting diode,OLED)螢幕。智慧型電話12500包含操作面板12540,其包含控制按鈕以及觸控面板。若顯示螢幕12520為觸控螢幕,則操作面板12540更包含顯示螢幕12520的觸摸感測面板。智慧型電話12500包含用於輸出語音以及聲音的揚聲器12580或另一類型的聲音輸出單元,以及用於
輸入語音以及聲音的麥克風12550或另一類型的聲音輸入單元。智慧型電話12500更包含相機12530(諸如,電荷耦合元件(charge-coupled device,CCD)相機)以攝取視訊以及靜態影像。智慧型電話12500可更包含:儲存媒體12570,其用於儲存經編碼/經解碼的資料,例如,由相機12530攝取、經由電子郵件而接收或根據各種方式而獲得的視訊或靜態影像;以及插槽12560,儲存媒體12570經由插槽12560而裝載至行動電話12500中。儲存媒體12570可為快閃記憶體,例如,安全數位(secure digital,SD)卡或包含於塑膠外殼中的電可抹除可程式化唯讀記憶體(electrically erasable and programmable read only memory;EEPROM)。
圖26說明根據本發明的實施例的行動電話12500的內部結構。為了系統地控制包含顯示螢幕12520以及操作面板12540的行動電話12500的多個部分,電力供應電路12700、操作輸入控制器12640、影像編碼單元12720、相機介面12630、LCD控制器12620、影像解碼單元12690、多工器/解多工器(multiplexer/demultiplexer)12680、記錄/讀取單元12670、調變/解調變單元12660以及聲音處理器12650經由同步匯流排12730而連接至中央控制器12710。
若使用者操作電源按鈕自「電源關閉」狀態設定至「電源開啟」狀態,則電力供應電路12700將電力自電池組(battery pack)供應至行動電話12500的所有部分,藉此將行動電話12500
設定於操作模式。
中央控制器12710包含中央處理單元(central processing unit;CPU)、ROM以及隨機存取記憶體(random access memory;RAM)。
雖然行動電話12500將通信資料傳輸至外部,但數位資料在中央控制器的控制下產生於行動電話12500中。舉例而言,聲音處理器12650可產生數位聲音信號,影像編碼單元12720可產生數位影像信號,而訊息的文字資料可經由操作面板12540以及操作輸入控制器12640而產生。在數位信號在中央控制器12710的控制下遞送至調變/解調變單元12660時,調變/解調變單元12660調變數位信號的頻帶,而通信電路12610對經頻帶調變的數位聲音信號執行數位至類比轉換(Digital-to-Analog conversion,DAC)以及頻率轉換。自通信電路12610輸出的傳輸信號可經由天線12510而傳輸至語音通信基地台或無線基地台12000。
舉例而言,在行動電話12500處於交談模式時,經由麥克風12550而獲得的聲音信號在中央控制器12710的控制下由聲音處理器12650變換為數位聲音信號。數位聲音信號可經由調變/解調變單元12660以及通信電路12610而變換為變換信號,並可經由天線12510而傳輸。
當在資料通信模式中傳輸文字訊息(例如,電子郵件)時,文字訊息的文字資料經由操作面板12540而輸入,而經由操作輸入控制器12640而傳輸至中央控制器12710。在中央控制器
12710的控制下,文字資料經由調變/解調變單元12660以及通信電路12610變換為傳輸信號,而經由天線12510而傳輸至無線基地台12000。
為了在資料通信模式中傳輸影像資料,由相機12530攝取的影像資料經由相機介面12630而提供至影像編碼單元12720。所攝取的影像資料可經由相機介面12630以及LCD控制器12620直接顯示在顯示螢幕12520上。
影像編碼單元12720的結構可對應於上述影像編碼裝置100的結構。影像編碼單元12720可根據由上述視訊編碼裝置100或影像編碼器400使用的視訊編碼方法而將自相機12530接收的影像資料變換為經壓縮並編碼的影像資料,而接著將經編碼的影像資料輸出至多工器/解多工器12680。在相機12530的記錄操作期間,由行動電話12500的麥克風12550獲得的聲音信號可經由聲音處理器12650而變換為數位聲音資料,而且所述數位聲音資料可遞送至多工器/解多工器12680。
多工器/解多工器12680將自影像編碼單元12720接收的經編碼的影像資料以及自聲音處理器12650接收的聲音資料一起多工。對資料進行多工的結果可經由調變/解調變單元12660以及通信電路12610而變換為變換信號,並可接著經由天線12510而傳輸。
雖然行動電話12500自外部接收通信信號,但對經由天線12510而接收的信號執行頻率恢復以及(Analog-to-Digital
conversion,ADC),以將信號變換為數位信號。調變/解調變單元12660調變數位信號的頻帶。經頻帶調變的數位信號根據數位信號的類型而傳輸至視訊解碼單元12690、聲音處理器12650或LCD控制器12620。
在交談模式中,行動電話12500放大經由天線12510而接收的信號,並藉由對經放大的信號執行頻率轉換以及ADC而獲得數位聲音信號。在中央控制器12710的控制下,所接收的數位聲音信號經由調變/解調變單元12660以及聲音處理器12650而變換為類比聲音信號,所述類比聲音信號經由揚聲器12580而輸出。
在處於資料通信模式時,接收在網際網路網站處存取的視訊檔案的資料,並將經由天線12510而自無線基地台12000接收的信號經由調變/解調變單元12660作為經多工的資料而輸出,並將經多工的資料傳輸至多工器/解多工器12680。
為了對經由天線12510而接收的經多工的資料做解碼,多工器/解多工器12680將經多工的資料解多工為經編碼的視訊資料串流以及經編碼的音訊資料串流。經由同步匯流排12730而分別將經編碼的視訊資料串流以及經編碼的音訊資料串流提供至視訊解碼單元12690以及聲音處理器12650。
影像解碼單元12690的結構可對應於上述影像解碼裝置200的結構。根據由上述視訊解碼裝置200或影像解碼器500使用的視訊解碼方法,影像解碼單元12690可對經編碼的視訊資料做解碼以獲得所復原的視訊資料,並經由LCD控制器12620而將所
復原的視訊資料提供至顯示螢幕12520。
因此,在網際網路網站處存取的視訊檔案的資料可顯示於顯示螢幕12520上。同時,聲音處理器12650可將音訊資料變換為類比聲音信號,並將類比聲音信號提供至揚聲器12580。因此,在網際網路網站處存取的視訊檔案中所含有的音訊資料亦可經由揚聲器12580而再生。
行動電話12500或另一類型的通信終端機可為包含根據本發明的實施例的視訊編碼裝置與視訊解碼裝置兩者的收發終端機,可為僅包含視訊編碼裝置的收發終端機,或可為僅包含視訊解碼裝置收發終端機。
根據本發明的通信系統不限於上文參照圖25所描述的通信系統。舉例而言,圖27說明根據本發明的實施例的使用通信系統的數位廣播系統。圖27的數位廣播系統可藉由使用根據本發明的實施例的視訊編碼裝置以及視訊解碼裝置而接收經由衛星或地面網路傳輸的數位廣播。
具體言之,廣播站12890藉由使用無線電波而將視訊資料串流傳輸至通信衛星或廣播衛星12900。廣播衛星12900傳輸廣播信號,而廣播信號經由家用天線12860傳輸至衛星廣播接收器。在每個家庭中,經編碼的視訊串流可由TV接收器12810、機上盒(set-top box)12870或另一元件解碼並再生。
在根據本發明的實施例的視訊解碼裝置實施於再生裝置12830中時,再生裝置12830可對記錄於儲存媒體12820(諸如,
光碟或記憶卡)上的經編碼的視訊串流進行剖析以及解碼以復原數位信號。因此,所復原的視訊信號可再生於(例如)監視器12840上。
在連接至用於衛星/地面廣播的天線12860或用於接收有線電視(TV)廣播的電纜天線12850的機上盒12870中,可安裝有根據本發明的實施例的視訊解碼裝置。自機上盒12870輸出的資料亦可再生於TV監視器12880上。
作為另一實例,根據本發明的實施例的視訊解碼裝置可安裝於TV接收器12810,而非機上盒12870上。
包含合適天線12910的汽車12920可接收自衛星12900或無線基地台11700傳輸的信號。經解碼的視訊可再生於內建於汽車12920中的汽車導航系統12930的顯示螢幕上。
視訊信號可由根據本發明的實施例的視訊編碼裝置編碼並可接著儲存於儲存媒體中。具體言之,影像信號可由DVD記錄器儲存於DVD光碟12960中或可由硬碟記錄器12950儲存於硬碟中。作為另一實例,視訊信號可儲存於SD卡12970中。若硬碟記錄器12950包含根據本發明的實施例的視訊解碼裝置,則DVD光碟12960、SD卡12970或另一儲存媒體上所記錄的視訊信號可再生於TV監視器12880上。
汽車導航系統12930可能不包含圖27的相機12530、相機介面12630以及影像編碼單元12720。舉例而言,電腦12100以及TV接收器12810可能不包含於圖27的相機12530、相機介
面12630以及影像編碼單元12720中。
圖28說明根據本發明的實施例的使用視訊編碼裝置以及視訊解碼裝置的雲端計算系統的網路結構。
雲端計算系統可包含雲端計算伺服器14000、使用者資料庫(DB)14100、多個計算資源14200以及使用者終端機。
雲端計算系統回應於來自使用者終端機的請求而經由資料通信網路(例如,網際網路)提供多個計算資源14200的應需委外服務(on-demand outsourcing service)。在雲端計算環境下,服務提供商藉由使用虛擬化技術來組合位於實體上不同位置處的資料中心的計算資源而向使用者提供所要服務。服務使用者並不需要將計算資源(例如,應用程式、儲存器、作業系統(OS)或安全機制)安裝於其自身的終端機上以便進行使用,而是可在所要時間點自經由虛擬化技術而產生的虛擬空間中的服務選擇所要服務並進行使用。
指定服務使用者的使用者終端機經由資料通信網路(包含網際網路以及行動電信網路)而連接至雲端計算伺服器14000。可自雲端計算伺服器14000對使用者終端機提供雲端計算服務而且特別是視訊再生服務。使用者終端機可為能夠連接至網際網路的各種類型的電子元件,例如,桌上型PC 14300、智慧型TV 14400、智慧型電話14500、筆記型電腦14600、攜帶型多媒體播放器(Portable multimedia player,PMP)14700、平板型PC 14800及其類似者。
雲端計算伺服器14000可組合雲端網路中所分散的多個計算資源14200並向使用者終端機提供所述組合的結果。多個計算資源14200可包含各種資料服務,並可包含自使用者終端機上傳的資料。如上所述,雲端計算伺服器14000可藉由根據虛擬化技術來組合不同區域中所分散的視訊資料庫而向使用者終端機提供所要服務。
關於已預訂雲端計算服務的使用者的使用者資訊儲存於使用者DB 14100中。使用者資訊可包含使用者的登錄資訊、地址、姓名以及個人信用資訊。使用者資訊可更包含視訊的索引。此處,索引可包含已再生的視訊的清單、正再生的視訊的清單、再生的視訊的暫停點(pausing point)以及其類似者。
關於儲存於使用者DB 14100中的視訊的資訊可在使用者元件之間共用。舉例而言,在視訊服務回應於來自筆記型電腦14600的請求而提供至筆記型電腦14600時,視訊服務的再生歷史儲存於使用者DB 14100中。在自智慧型電話14500接收到對再生此視訊服務的請求時,雲端計算伺服器14000基於使用者DB 14100而搜尋並再生此視訊服務。在智慧型電話14500自雲端計算伺服器14000接收視訊資料串流時,藉由對視訊資料串流做解碼而再生視訊的程序類似於上文參照圖27所描述的行動電話12500的操作。
雲端計算伺服器14000可參考儲存於使用者DB 14100中的所要視訊服務的再生歷史。舉例而言,雲端計算伺服器14000
自使用者終端機接收對再生儲存於使用者DB 14100中的視訊的請求。若正再生此視訊,則由雲端計算伺服器14000執行的串流傳輸此視訊的方法可根據來自使用者終端機的請求(亦即,根據將始於視訊的開始還是其暫停點而再生視訊)而變化。舉例而言,若使用者終端機請求始於視訊的開始而再生視訊,則雲端計算伺服器14000始於視訊的第一畫面而將視訊的資料串流傳輸至使用者終端機。舉例而言,若使用者終端機請求始於視訊的暫停點而再生視訊,則雲端計算伺服器14000始於對應於暫停點的畫面而將視訊的資料串流傳輸至使用者終端機。
在此狀況下,使用者終端機可包含如上文參照圖1至圖23而描述的視訊解碼裝置。作為另一實例,使用者終端機可包含如上文參照圖1至圖23而描述的視訊編碼裝置。或者,使用者終端機可包含如上文參照圖1至圖23而描述的視訊解碼裝置與視訊編碼裝置兩者。
上文已參照圖22至圖28而描述上文參照圖1至圖21所描述的根據本發明的實施例的視訊編碼方法、視訊解碼方法、視訊編碼裝置以及視訊解碼裝置的各種應用。然而,根據本發明的各種實施例的將視訊編碼方法以及視訊解碼方法儲存於儲存媒體中的方法或將視訊編碼裝置以及視訊解碼裝置實施在元件中的方法不限於上文參照圖22至圖28而描述的實施例。
儘管已參考本發明的例示性實施例特定地展示而且描述了本發明,但一般熟習此項技術者將理解,在不脫離如由所附申
請專利範圍界定的本發明的精神以及範疇的情況下,可對本發明進行形式以及細節上的各種改變。
10‧‧‧量子化參數決定裝置
12‧‧‧轉換單元決定器
14‧‧‧量子化參數決定器
Claims (1)
- 一種解碼影像的裝置,所述裝置包括:參考影像比較單元,用以決定當前區塊的參考影像是否等於鄰近於所述當前區塊的多個候選區塊中的候選區塊的參考影像,以及當所述候選區塊的參考影像不等於所述當前區塊的參考影像時,決定所述候選區塊的參考影像及所述當前區塊的參考影像是否皆為長期參考影像;以及移動向量決定器,用以當所述候選區塊的參考影像及所述當前區塊的參考影像皆為長期參考影像時,取得空間移動向量預測候選而不縮放所述候選區塊的移動向量,自具有所述空間移動向量預測候選的移動向量預測候選中決定所述當前區塊的移動向量預測,並藉由使用所述移動向量預測產生所述當前區塊的移動向量。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161557133P | 2011-11-08 | 2011-11-08 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201536036A TW201536036A (zh) | 2015-09-16 |
TWI508533B true TWI508533B (zh) | 2015-11-11 |
Family
ID=48290288
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW104114742A TWI508533B (zh) | 2011-11-08 | 2012-11-08 | 解碼影像的裝置 |
TW104114740A TWI528792B (zh) | 2011-11-08 | 2012-11-08 | 解碼影像的裝置 |
TW104114746A TWI505696B (zh) | 2011-11-08 | 2012-11-08 | 解碼影像的方法 |
TW104114733A TWI532370B (zh) | 2011-11-08 | 2012-11-08 | 解碼影像的方法 |
TW101141663A TWI556648B (zh) | 2011-11-08 | 2012-11-08 | 解碼影像的方法 |
Family Applications After (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW104114740A TWI528792B (zh) | 2011-11-08 | 2012-11-08 | 解碼影像的裝置 |
TW104114746A TWI505696B (zh) | 2011-11-08 | 2012-11-08 | 解碼影像的方法 |
TW104114733A TWI532370B (zh) | 2011-11-08 | 2012-11-08 | 解碼影像的方法 |
TW101141663A TWI556648B (zh) | 2011-11-08 | 2012-11-08 | 解碼影像的方法 |
Country Status (16)
Country | Link |
---|---|
US (6) | US20140307783A1 (zh) |
EP (7) | EP2916552A3 (zh) |
JP (7) | JP2014535239A (zh) |
KR (6) | KR101493698B1 (zh) |
CN (7) | CN104796724B (zh) |
AU (1) | AU2012336572B2 (zh) |
BR (5) | BR122015021736A2 (zh) |
CA (5) | CA2883363C (zh) |
MX (5) | MX2014005643A (zh) |
MY (5) | MY169355A (zh) |
PH (5) | PH12014500945A1 (zh) |
RU (5) | RU2586001C2 (zh) |
SG (5) | SG10201502731VA (zh) |
TW (5) | TWI508533B (zh) |
WO (1) | WO2013069990A1 (zh) |
ZA (5) | ZA201403267B (zh) |
Families Citing this family (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MY170743A (en) | 2011-06-30 | 2019-08-27 | Sony Corp | Image processing device and image processing method |
RU2646328C1 (ru) | 2011-10-28 | 2018-03-02 | Сан Пэтент Траст | Способ кодирования изображений, способ декодирования изображений, устройство кодирования изображений и устройство декодирования изображений |
ES2780186T3 (es) * | 2011-10-28 | 2020-08-24 | Sun Patent Trust | Procedimiento de codificación de imágenes, procedimiento de decodificación de imágenes, dispositivo de codificación de imágenes, y dispositivo de decodificación de imágenes |
US20130177084A1 (en) * | 2012-01-10 | 2013-07-11 | Qualcomm Incorporated | Motion vector scaling in video coding |
US9602831B2 (en) * | 2012-03-07 | 2017-03-21 | Lg Electronics Inc. | Method and apparatus for processing video signals |
CN104170389B (zh) * | 2012-04-24 | 2018-10-26 | 联发科技股份有限公司 | 运动向量预测器的产生方法和装置及视点间运动向量预测器候选的产生方法 |
CN104704819B (zh) * | 2012-10-03 | 2016-12-21 | 联发科技股份有限公司 | 3d视频编码的视差矢量推导和视图间运动矢量预测的方法及装置 |
WO2014166068A1 (en) * | 2013-04-09 | 2014-10-16 | Mediatek Inc. | Refinement of view synthesis prediction for 3-d video coding |
WO2015034303A1 (ko) * | 2013-09-04 | 2015-03-12 | 삼성전자 주식회사 | 스크린 영상 부호화 방법 및 그 장치, 스크린 영상 복호화 방법 및 그 장치 |
ES2906182T3 (es) * | 2014-01-02 | 2022-04-13 | Dolby Laboratories Licensing Corp | Método para decodificar vídeo multivista |
KR102466902B1 (ko) | 2014-10-31 | 2022-11-14 | 삼성전자주식회사 | 움직임 벡터 부복호화 방법 및 장치 |
CN111491165B (zh) * | 2014-12-26 | 2024-03-15 | 索尼公司 | 影像处理设备和影像处理方法 |
CN104811721B (zh) * | 2015-05-26 | 2017-09-22 | 珠海全志科技股份有限公司 | 视频解码数据存储方法及运动向量数据的计算方法 |
US10555002B2 (en) * | 2016-01-21 | 2020-02-04 | Intel Corporation | Long term reference picture coding |
CN109089119B (zh) * | 2017-06-13 | 2021-08-13 | 浙江大学 | 一种运动矢量预测的方法及设备 |
KR102360412B1 (ko) | 2017-08-25 | 2022-02-09 | 엘지디스플레이 주식회사 | 영상 생성 방법과 이를 이용한 표시장치 |
BR112020001579A2 (pt) * | 2017-09-26 | 2020-07-21 | Panasonic Intellectual Property Corporation Of America | codificador, decodificador, método de codificação, método de decodificação |
WO2019191890A1 (zh) | 2018-04-02 | 2019-10-10 | 深圳市大疆创新科技有限公司 | 用于图像处理的方法和图像处理装置 |
TWI728388B (zh) | 2018-06-29 | 2021-05-21 | 大陸商北京字節跳動網絡技術有限公司 | Lut中的運動候選的檢查順序 |
CN110662053B (zh) | 2018-06-29 | 2022-03-25 | 北京字节跳动网络技术有限公司 | 使用查找表的视频处理方法、装置和存储介质 |
JP7460617B2 (ja) | 2018-06-29 | 2024-04-02 | 北京字節跳動網絡技術有限公司 | Lut更新条件 |
AU2019293670B2 (en) | 2018-06-29 | 2023-06-08 | Beijing Bytedance Network Technology Co., Ltd. | Update of look up table: FIFO, constrained FIFO |
JP7295231B2 (ja) | 2018-06-29 | 2023-06-20 | 北京字節跳動網絡技術有限公司 | Lutとamvpの間の相互作用 |
EP3791589A1 (en) | 2018-06-29 | 2021-03-17 | Beijing Bytedance Network Technology Co. Ltd. | Which lut to be updated or no updating |
KR20210024502A (ko) | 2018-06-29 | 2021-03-05 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | Hmvp 후보를 병합/amvp에 추가할 때의 부분/풀 프루닝 |
EP3791586A1 (en) | 2018-06-29 | 2021-03-17 | Beijing Bytedance Network Technology Co. Ltd. | Concept of using one or multiple look up tables to store motion information of previously coded in order and use them to code following blocks |
TWI731365B (zh) | 2018-07-02 | 2021-06-21 | 大陸商北京字節跳動網絡技術有限公司 | Merge索引編碼 |
US10284432B1 (en) * | 2018-07-03 | 2019-05-07 | Kabushiki Kaisha Ubitus | Method for enhancing quality of media transmitted via network |
CN112585976A (zh) | 2018-08-06 | 2021-03-30 | 韩国电子通信研究院 | 用于对图像进行编码/解码的方法和设备以及用于存储比特流的记录介质 |
CN110868613B (zh) * | 2018-08-28 | 2021-10-01 | 华为技术有限公司 | 基于历史候选列表的图像编码方法、图像解码方法及装置 |
CN110868601B (zh) * | 2018-08-28 | 2024-03-15 | 华为技术有限公司 | 帧间预测方法、装置以及视频编码器和视频解码器 |
CN110876058B (zh) * | 2018-08-30 | 2021-09-21 | 华为技术有限公司 | 一种历史候选列表更新方法与装置 |
CN111064961B (zh) | 2018-09-12 | 2023-06-09 | 北京字节跳动网络技术有限公司 | 视频处理方法和装置 |
CN116684589A (zh) * | 2018-12-12 | 2023-09-01 | Lg电子株式会社 | 图像编解码设备和视频信号发送设备 |
CN111279693B (zh) * | 2018-12-29 | 2021-11-12 | 北京大学 | 视频处理方法和设备 |
WO2020133518A1 (zh) | 2018-12-29 | 2020-07-02 | 深圳市大疆创新科技有限公司 | 视频处理方法和设备 |
JP7275286B2 (ja) | 2019-01-10 | 2023-05-17 | 北京字節跳動網絡技術有限公司 | Lut更新の起動 |
CN113383554B (zh) | 2019-01-13 | 2022-12-16 | 北京字节跳动网络技术有限公司 | LUT和共享Merge列表之间的交互 |
CN113330739A (zh) | 2019-01-16 | 2021-08-31 | 北京字节跳动网络技术有限公司 | Lut中的运动候选的插入顺序 |
CN117041556B (zh) * | 2019-02-20 | 2024-03-26 | 北京达佳互联信息技术有限公司 | 用于视频编码的方法、计算设备、存储介质和程序产品 |
WO2020184922A1 (ko) * | 2019-03-08 | 2020-09-17 | 한국전자통신연구원 | 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체 |
US11350074B2 (en) * | 2019-03-20 | 2022-05-31 | Electronics And Telecommunications Research Institute | Method for processing immersive video and method for producing immersive video |
WO2020197038A1 (ko) | 2019-03-22 | 2020-10-01 | 엘지전자 주식회사 | 영상 코딩 시스템에서 인트라 서브 파티션 기반의 인트라 예측 방법 및 장치 |
WO2020192611A1 (en) | 2019-03-22 | 2020-10-01 | Beijing Bytedance Network Technology Co., Ltd. | Interaction between merge list construction and other tools |
US10638130B1 (en) * | 2019-04-09 | 2020-04-28 | Google Llc | Entropy-inspired directional filtering for image coding |
CN111953997B (zh) | 2019-05-15 | 2024-08-09 | 华为技术有限公司 | 候选运动矢量列表获取方法、装置及编解码器 |
US12034961B2 (en) | 2019-06-13 | 2024-07-09 | Lg Electronics Inc. | Motion vector prediction-based image/video coding method and device |
AU2020292097B2 (en) * | 2019-06-14 | 2023-11-30 | Lg Electronics Inc. | Method and device for image coding using motion vector differences |
EP3952314B1 (en) | 2019-09-24 | 2024-07-17 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | Inter-frame prediction method and apparatus, device and storage medium |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5926225A (en) * | 1995-11-02 | 1999-07-20 | Mitsubishi Denki Kabushiki Kaisha | Image coder which includes both a short-term frame memory and long-term frame memory in the local decoding loop |
US20040136461A1 (en) * | 2002-04-19 | 2004-07-15 | Satoshi Kondo | Motion vector calculating method |
US7394853B2 (en) * | 2002-04-23 | 2008-07-01 | Matsushita Electric Industrial Co., Ltd. | Motion vector coding method and motion vector decoding method |
US7643556B2 (en) * | 2002-10-04 | 2010-01-05 | Lg Electronics Inc. | Method of deriving a motion vector of a bi-predictive block based on scaling a motion vector of a co-located block in a reference picture |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6594313B1 (en) * | 1998-12-23 | 2003-07-15 | Intel Corporation | Increased video playback framerate in low bit-rate video applications |
ES2725714T3 (es) | 2001-11-06 | 2019-09-26 | Panasonic Ip Corp America | Procedimiento de codificación de imágenes en movimiento y procedimiento de decodificación de imágenes en movimiento |
CN101656881B (zh) * | 2001-11-06 | 2012-03-28 | 松下电器产业株式会社 | 运动图像编码方法及运动图像解码方法 |
CN1992895B (zh) | 2002-04-19 | 2010-12-08 | 松下电器产业株式会社 | 图像编码方法及图像编码装置 |
KR100491530B1 (ko) * | 2002-05-03 | 2005-05-27 | 엘지전자 주식회사 | 모션 벡터 결정 방법 |
US8824553B2 (en) * | 2003-05-12 | 2014-09-02 | Google Inc. | Video compression method |
US20050013498A1 (en) | 2003-07-18 | 2005-01-20 | Microsoft Corporation | Coding of motion vector information |
CN1784008B (zh) | 2004-12-02 | 2010-04-28 | 北京凯诚高清电子技术有限公司 | 高清晰视频超强压缩编码方法及解码方法 |
KR100668463B1 (ko) * | 2004-12-31 | 2007-01-12 | 엠큐브웍스(주) | 동영상 데이터의 인코딩을 위한 다중 참조 프레임 선택 방법 |
KR100763182B1 (ko) | 2005-05-02 | 2007-10-05 | 삼성전자주식회사 | 다계층 기반의 가중 예측을 이용한 비디오 코딩 방법 및장치 |
US8559515B2 (en) | 2005-09-21 | 2013-10-15 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-view video |
WO2007035042A1 (en) | 2005-09-21 | 2007-03-29 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-view video |
CN101375594B (zh) * | 2006-01-12 | 2011-09-07 | Lg电子株式会社 | 处理多视图视频 |
KR100934677B1 (ko) | 2006-01-12 | 2009-12-31 | 엘지전자 주식회사 | 다시점 비디오의 처리 |
RU2395174C1 (ru) * | 2006-03-30 | 2010-07-20 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для декодирования/кодирования сигнала видео |
KR101380580B1 (ko) * | 2006-08-02 | 2014-04-02 | 톰슨 라이센싱 | 비디오 인코딩을 위한 적응형 기하학적 파티셔닝 방법 및 장치 |
EP2123042A4 (en) | 2007-01-24 | 2010-03-10 | Lg Electronics Inc | METHOD AND APPARATUS FOR PROCESSING A VIDEO SIGNAL |
JP2008245016A (ja) * | 2007-03-28 | 2008-10-09 | Canon Inc | 画像符号化装置、画像符号化方法、及びプログラム |
US8494049B2 (en) * | 2007-04-09 | 2013-07-23 | Cisco Technology, Inc. | Long term reference frame management with error video feedback for compressed video communication |
US9648325B2 (en) | 2007-06-30 | 2017-05-09 | Microsoft Technology Licensing, Llc | Video decoding implementations for a graphics processing unit |
HUE037450T2 (hu) | 2007-09-28 | 2018-09-28 | Dolby Laboratories Licensing Corp | Videó információ kezelése |
BRPI0818444A2 (pt) * | 2007-10-12 | 2016-10-11 | Qualcomm Inc | codificação adaptativa de informação de cabeçalho de bloco de vídeo |
KR100901642B1 (ko) | 2008-01-25 | 2009-06-09 | 엘지전자 주식회사 | 모션 벡터 결정 방법 |
KR100985263B1 (ko) * | 2008-07-18 | 2010-10-04 | 엘지전자 주식회사 | 모션벡터 결정방법 |
CN102210152A (zh) | 2008-10-06 | 2011-10-05 | Lg电子株式会社 | 用于处理视频信号的方法和设备 |
KR101377527B1 (ko) * | 2008-10-14 | 2014-03-25 | 에스케이 텔레콤주식회사 | 복수 개의 참조 픽처의 움직임 벡터 부호화/복호화 방법 및장치와 그를 이용한 영상 부호화/복호화 장치 및 방법 |
KR20110008653A (ko) * | 2009-07-20 | 2011-01-27 | 삼성전자주식회사 | 움직임 벡터 예측 방법과 이를 이용한 영상 부호화/복호화 장치 및 방법 |
KR101452859B1 (ko) | 2009-08-13 | 2014-10-23 | 삼성전자주식회사 | 움직임 벡터를 부호화 및 복호화하는 방법 및 장치 |
JP2011082683A (ja) * | 2009-10-05 | 2011-04-21 | Sony Corp | 画像処理装置、画像処理方法、及び、プログラム |
CN102045557B (zh) * | 2009-10-20 | 2012-09-19 | 鸿富锦精密工业(深圳)有限公司 | 视频编解码方法及使用其的视频编码、解码装置 |
KR101457418B1 (ko) * | 2009-10-23 | 2014-11-04 | 삼성전자주식회사 | 계층적 부호화 단위의 크기에 따른 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
CN102104781B (zh) * | 2009-12-18 | 2013-03-20 | 联咏科技股份有限公司 | 图像解码器 |
US20110217994A1 (en) | 2010-03-03 | 2011-09-08 | Boku, Inc. | Systems and Methods to Automate Transactions via Mobile Devices |
US20110310976A1 (en) * | 2010-06-17 | 2011-12-22 | Qualcomm Incorporated | Joint Coding of Partition Information in Video Coding |
US8848779B2 (en) * | 2010-07-15 | 2014-09-30 | Sharp Laboratories Of America, Inc. | Method of parallel video coding based on block size |
US8526495B2 (en) * | 2010-11-22 | 2013-09-03 | Mediatek Singapore Pte. Ltd. | Apparatus and method of constrained partition size for high efficiency video coding |
WO2013061551A1 (ja) * | 2011-10-27 | 2013-05-02 | パナソニック株式会社 | 画像符号化方法、画像復号方法、画像符号化装置および画像復号装置 |
ES2780186T3 (es) * | 2011-10-28 | 2020-08-24 | Sun Patent Trust | Procedimiento de codificación de imágenes, procedimiento de decodificación de imágenes, dispositivo de codificación de imágenes, y dispositivo de decodificación de imágenes |
US10200709B2 (en) * | 2012-03-16 | 2019-02-05 | Qualcomm Incorporated | High-level syntax extensions for high efficiency video coding |
-
2012
- 2012-11-08 TW TW104114742A patent/TWI508533B/zh active
- 2012-11-08 RU RU2014117652/08A patent/RU2586001C2/ru active
- 2012-11-08 MX MX2014005643A patent/MX2014005643A/es active IP Right Grant
- 2012-11-08 EP EP15164428.3A patent/EP2916552A3/en not_active Ceased
- 2012-11-08 EP EP15164430.9A patent/EP2916553A3/en not_active Ceased
- 2012-11-08 RU RU2015114980/08A patent/RU2566956C2/ru active
- 2012-11-08 BR BR122015021736A patent/BR122015021736A2/pt not_active Application Discontinuation
- 2012-11-08 SG SG10201502731VA patent/SG10201502731VA/en unknown
- 2012-11-08 BR BR122015021735A patent/BR122015021735A2/pt not_active Application Discontinuation
- 2012-11-08 SG SG10201502739QA patent/SG10201502739QA/en unknown
- 2012-11-08 CN CN201510161074.8A patent/CN104796724B/zh active Active
- 2012-11-08 US US14/357,043 patent/US20140307783A1/en not_active Abandoned
- 2012-11-08 RU RU2015115002/08A patent/RU2566973C2/ru active
- 2012-11-08 CN CN201510162074.XA patent/CN104768010B/zh active Active
- 2012-11-08 CA CA2883363A patent/CA2883363C/en active Active
- 2012-11-08 MY MYPI2014001213A patent/MY169355A/en unknown
- 2012-11-08 EP EP17185127.2A patent/EP3264770A1/en not_active Ceased
- 2012-11-08 SG SG10201502738XA patent/SG10201502738XA/en unknown
- 2012-11-08 BR BR122015021739A patent/BR122015021739A2/pt not_active Application Discontinuation
- 2012-11-08 TW TW104114740A patent/TWI528792B/zh active
- 2012-11-08 AU AU2012336572A patent/AU2012336572B2/en active Active
- 2012-11-08 MX MX2015004579A patent/MX336650B/es unknown
- 2012-11-08 CN CN201510161048.5A patent/CN104796723B/zh active Active
- 2012-11-08 MX MX2015004569A patent/MX336649B/es unknown
- 2012-11-08 EP EP15163868.1A patent/EP2916550A3/en not_active Ceased
- 2012-11-08 EP EP15164427.5A patent/EP2916551A3/en not_active Ceased
- 2012-11-08 WO PCT/KR2012/009408 patent/WO2013069990A1/ko active Application Filing
- 2012-11-08 CN CN201810167672.XA patent/CN108259915B/zh active Active
- 2012-11-08 MY MYPI2015000872A patent/MY179745A/en unknown
- 2012-11-08 CA CA2883368A patent/CA2883368C/en active Active
- 2012-11-08 CA CA2883050A patent/CA2883050C/en active Active
- 2012-11-08 MY MYPI2015000861A patent/MY177794A/en unknown
- 2012-11-08 MX MX2015004571A patent/MX337403B/es unknown
- 2012-11-08 BR BR122015021741A patent/BR122015021741A2/pt not_active Application Discontinuation
- 2012-11-08 SG SG11201402160XA patent/SG11201402160XA/en unknown
- 2012-11-08 TW TW104114746A patent/TWI505696B/zh active
- 2012-11-08 MY MYPI2015000871A patent/MY174659A/en unknown
- 2012-11-08 CN CN201510194833.0A patent/CN104811727B/zh active Active
- 2012-11-08 MY MYPI2015000865A patent/MY179763A/en unknown
- 2012-11-08 RU RU2015114988/08A patent/RU2566957C2/ru active
- 2012-11-08 TW TW104114733A patent/TWI532370B/zh active
- 2012-11-08 BR BR112014010966A patent/BR112014010966A2/pt not_active Application Discontinuation
- 2012-11-08 CA CA2854887A patent/CA2854887C/en active Active
- 2012-11-08 CA CA2883047A patent/CA2883047C/en active Active
- 2012-11-08 MX MX2015004567A patent/MX336648B/es unknown
- 2012-11-08 CN CN201280054956.9A patent/CN103931192B/zh active Active
- 2012-11-08 JP JP2014540946A patent/JP2014535239A/ja active Pending
- 2012-11-08 EP EP12848529.9A patent/EP2763416A4/en not_active Ceased
- 2012-11-08 RU RU2015114969/08A patent/RU2566955C9/ru active
- 2012-11-08 SG SG10201502735PA patent/SG10201502735PA/en unknown
- 2012-11-08 KR KR1020120126170A patent/KR101493698B1/ko active IP Right Grant
- 2012-11-08 TW TW101141663A patent/TWI556648B/zh active
- 2012-11-08 CN CN201510161050.2A patent/CN104754356B/zh active Active
- 2012-11-08 EP EP15163909.3A patent/EP2953367A1/en not_active Ceased
-
2014
- 2014-04-29 PH PH12014500945A patent/PH12014500945A1/en unknown
- 2014-05-06 ZA ZA2014/03267A patent/ZA201403267B/en unknown
- 2014-05-07 KR KR20140054461A patent/KR101493699B1/ko active IP Right Grant
- 2014-10-29 KR KR1020140148740A patent/KR101575004B1/ko active IP Right Grant
-
2015
- 2015-01-22 US US14/603,112 patent/US9204163B2/en active Active
- 2015-01-22 US US14/603,164 patent/US9225995B2/en active Active
- 2015-02-24 KR KR1020150025921A patent/KR101575006B1/ko active IP Right Grant
- 2015-02-24 KR KR1020150025920A patent/KR101575005B1/ko active IP Right Grant
- 2015-02-26 US US14/632,673 patent/US9451282B2/en active Active
- 2015-02-26 US US14/632,717 patent/US9332273B2/en active Active
- 2015-03-25 PH PH12015500671A patent/PH12015500671B1/en unknown
- 2015-03-25 PH PH12015500673A patent/PH12015500673A1/en unknown
- 2015-03-25 PH PH12015500669A patent/PH12015500669A1/en unknown
- 2015-03-25 PH PH12015500672A patent/PH12015500672B1/en unknown
- 2015-04-07 KR KR1020150049072A patent/KR101881551B1/ko active IP Right Grant
- 2015-04-08 JP JP2015079406A patent/JP6120902B2/ja active Active
- 2015-04-08 JP JP2015079405A patent/JP6120901B2/ja active Active
- 2015-04-08 JP JP2015079403A patent/JP2015159586A/ja active Pending
- 2015-04-08 JP JP2015079404A patent/JP6122056B2/ja active Active
- 2015-06-29 ZA ZA2015/04683A patent/ZA201504683B/en unknown
- 2015-06-29 ZA ZA2015/04682A patent/ZA201504682B/en unknown
- 2015-06-29 ZA ZA2015/04684A patent/ZA201504684B/en unknown
- 2015-06-29 ZA ZA2015/04681A patent/ZA201504681B/en unknown
-
2017
- 2017-03-30 JP JP2017066507A patent/JP6466986B2/ja active Active
-
2018
- 2018-02-22 US US15/902,519 patent/US20180184114A1/en not_active Abandoned
-
2019
- 2019-01-10 JP JP2019002964A patent/JP2019071662A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5926225A (en) * | 1995-11-02 | 1999-07-20 | Mitsubishi Denki Kabushiki Kaisha | Image coder which includes both a short-term frame memory and long-term frame memory in the local decoding loop |
US20040136461A1 (en) * | 2002-04-19 | 2004-07-15 | Satoshi Kondo | Motion vector calculating method |
US7394853B2 (en) * | 2002-04-23 | 2008-07-01 | Matsushita Electric Industrial Co., Ltd. | Motion vector coding method and motion vector decoding method |
US7643556B2 (en) * | 2002-10-04 | 2010-01-05 | Lg Electronics Inc. | Method of deriving a motion vector of a bi-predictive block based on scaling a motion vector of a co-located block in a reference picture |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI508533B (zh) | 解碼影像的裝置 | |
TWI604721B (zh) | 畫面間預測的運動向量預測方法與裝置 | |
TWI575944B (zh) | 視訊解碼裝置 | |
TWI605702B (zh) | 視訊解碼裝置 | |
AU2015201549B2 (en) | Method and device for determining motion vector for video coding or video decoding |