CN102204264A - 用于编码3d图像信号的方法和系统、编码的3d图像信号、用于译码3d图像信号的方法和系统 - Google Patents
用于编码3d图像信号的方法和系统、编码的3d图像信号、用于译码3d图像信号的方法和系统 Download PDFInfo
- Publication number
- CN102204264A CN102204264A CN2009801439776A CN200980143977A CN102204264A CN 102204264 A CN102204264 A CN 102204264A CN 2009801439776 A CN2009801439776 A CN 2009801439776A CN 200980143977 A CN200980143977 A CN 200980143977A CN 102204264 A CN102204264 A CN 102204264A
- Authority
- CN
- China
- Prior art keywords
- layer
- data
- ken
- view
- data layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/87—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/114—Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
在用于编码包括分层的深度图像的3D信号的方法中,使另外的层(背景层)的视域在尺寸和/或形状上不同于参考视图(前景层)的视域,以及该3D图像信号被提供以适当的缩放数据,该缩放数据表达在所述参考视图视域与所述一个或更多个另外的层的视域之间的关系。
Description
技术领域
本发明涉及3D图像编码和译码的领域。本发明给出用于编码3D图像信号的方法和系统。本发明还涉及用于译码3D图像信号的方法和系统。本发明还涉及编码的3D图像信号。
背景技术
近来,对于在3D图像显示器上提供3D图像有很大兴趣。据信,3D成像将是在彩色成像之后在成像方面的下一个重大创新。我们现在正处在即将为消费者市场引入3D显示器的时刻。
3D显示设备通常具有在其上显示图像的显示屏幕。基本上,可以通过使用立体图像--即被对准观看者的两个眼睛的两个稍微不同的图像--而产生三维印象。这样的设备的一个例子是自动立体显示器。在其它设备中,图像是在所有的方向上发送,但使用眼镜来阻挡某些图像,以便给出3D感觉。
无论使用哪种类型的3D显示器,都必须向显示设备提供3D图像信息。这通常是以包括数字数据的3D图像信号的形式完成的。
3D图像的生成在传统上是通过添加深度图而完成的,所述深度图提供关于图像内像素的深度方面的信息,从而提供3D信息。通过使用用于图像的深度图,可以构建左图像和右图像来提供3D图像,正如在题目为“Real-time rendering with layered depth images”的美国专利No.6466207中公开的。替换地,例如,当使用多视图自动立体显示器时,可以构建两个以上的视图,以便在显现三维场景时使用。
当在显示器上显示内容时,必须呈现多个视图,且这些视图在不同的方向上被发送。观看者在两个眼睛上将有不同的图像,且这些图像被呈现得使观看者感觉到深度。不同的视图代表不同的观看位置。然而,关于输入数据,常常有一个视角是可看见的。所以,呈现的视图将缺少在例如前景物体后面的区域中的信息或有关物体侧面的信息。存在有不同的方法来应对这种缺少的信息。一个解决方案是以另外的数据层的形式向信号中添加数据,代表被隐藏在前景物体后面的3D图像的各个部分。这个背景信息从相同的视角被存储。如果在3D图像中有许多物体位于彼此的后面,则可以有一个以上的背景信息层。
在这样的方法中,用于3D显示的内容以多层表示被存储。这种多层表示从单个照相机的视点捕获场景,并借助于各个层来描述第三维。这样的层可包含透明性。通常,每个层被提供以对应的深度图。在前景层后面的层通常被称为“遮挡层”。
本发明人发现,在当前的方法中,对于精确构建3D图像有用的部分遮挡信息不能在遮挡层中被表示。这降低了3D成像的质量,因为缺少的信息必须通过某种其它方式被呈现,通常导致用某种方法来估计该缺少的信息的内容。无论这样的方法可以有多智能,缺少的信息通常仅仅是实际内容的近似,从而导致了图像误差和不完美的3D图像的可能性。
因此,本发明的一个目的是提供用于编码3D图像数据的方法,其允许改进的3D成像。
另一个目的是提供用于编码3D图像信号的改进的系统、用于译码3D图像信号的系统以及3D图像信号。
发明内容
为此,按照本发明的、用于编码的方法的特征在于,对3D图像信号进行编码,编码的3D图像信号包括参考视图数据层和用于参考视图数据层的一个或更多个另外的数据层,其中被该一个或更多个另外的数据层和参考视图覆盖的视域在尺寸和/或形状上是不同的,并且生成表达在参考视图视域与该一个或更多个另外的层的视域之间的关系的缩放数据(scaling data)。
在按照本发明的、用于编码的系统中,包括参考视图数据层和一个或更多个另外的数据层的3D图像信号被编码,其中被参考视图数据层和该一个或更多个另外的数据层覆盖的视域的尺寸和/或形状是不同的,并且生成表达在参考视图视域和/或形状与该一个或更多个另外的层的视域之间的关系的缩放数据。
按照本发明的3D图像信号包括这样的3D图像信号,该3D图像信号包括参考视图数据层和一个或更多个另外的数据层,其中被参考视图数据层和该一个或更多个另外的数据层覆盖的视域在尺寸和/或形状上是不同的,以及该3D图像信号包括表达在参考视图视域与该一个或更多个另外的层的视域之间的关系的缩放数据。
按照本发明的、用于译码的系统包括用于3D图像的输入端,该3D图像包括参考视图数据层和一个或更多个另外的数据层,其中被各种数据层覆盖的视域的尺寸和/或形状是不同的,该3D图像信号包括表达在参考视图视域与该一个或更多个另外的层的视域之间的关系的缩放数据,所述用于译码的系统包括用于根据缩放数据来控制被两个或更多个数据层覆盖的视域的装置。
在当前的2D+深度(2D plus Depth)格式中,遮挡层以及深度图具有与前景层相同的高宽比和位置,即,参考视图数据层是前景数据层。另外的数据层是背景数据层。另外的数据层包括具有数据层形式的、允许构建3D图像的信息。在当前的方法中,各种层覆盖相同的视域。
当从场景的2D+深度表示来呈现3D视图时,出现在屏幕后面的物体沿一个方向被移位,而出现在屏幕前面的物体沿相反的方向被移位。至于是哪个方向,则取决于呈现的视图是在中心视图的左面还是右面。典型地,虽然不是必然地,出现在屏幕平面的前面或靠近屏幕平面的物体是在前景层中,以及背景层包含在前景物体后面的每件东西。通常,前景物体不会由于呈现而移位,因为它应当出现在屏幕平面处。整个背景然后被移位到一个方向中,导致在一侧的‘空白(gap)’或缺少的信息,例如,如果背景向左移动16个像素,则缺少有关在背景层右边的16个像素的信息。缺少的信息不能被恢复。
本发明用以下的方式解决所述问题:
被另外的层和参考视图层覆盖的视域的尺寸和/或形状是不同的,并且生成用来表达在所覆盖的视域之间的关系的缩放数据。
所以,例如对于在参考视图后面的遮挡层,可以生成具有比前景层的视域更大的视域的遮挡层,以及在两个数据层的视域的尺寸和/或形状之间的关系例如用适当的元数据来指示。对于大多数当前的呈现方法,增加遮挡层的宽度是足够的,因为只有水平像素移位。增加量对于各种遮挡层可以是不同的,因此缩放数据可以是不同的。缩放数据表达两个层可以如何匹配。优选地,缩放数据还指示相匹配的两个层。
在优选实施例中,另外层的数据具有与参考视图数据相同的分辨率和形状,因为对于兼容性而言通常坚持标准分辨率是最好的。所以,例如参考视图层和遮挡层可以都是1280×720,但对应于参考视图视域的那部分遮挡层例如可以是在遮挡层图像中居中的1200×720,以便在遮挡层的左边和右边的视域中给出更多的边界。遮挡层的视域大于参考视图层的视域,在本例中,在水平方向上大至1280/1200倍。
在更完善的呈现方法中,可能能够移动被使用来以更大的自由度呈现非中心视图的虚拟照相机。在这样的方法中,垂直像素移位--即在垂直方向上的尺寸和/或形状差别--可变为有利的。于是遮挡层的视域在垂直方向上与参考视图的视域不同。本领域技术人员将会清楚,既在水平方向又在垂直方向上组合编码更大的视域是可能的,可选地,在水平方向和垂直方向上具有不同数目的附加像素。
在简单的实施例中,元数据用对应于参考视图数据层的、遮挡层中的矩形来实现。这具有以下优点:遮挡层可以以不同的分辨率和高宽比被自动存储。
附图说明
将通过例子且参照附图来更详细地说明本发明的这些和其它方面,其中:
图1图示自动立体显示设备的例子,
图2和3图示遮挡问题,
图4图示本发明的第一例子,
图5图示本发明的第二例子,
图6到11图示实施例,其中非矩形形状被使用来描述对应于前景层的、在另外层中的区域。
图12到14图示本发明的另外的例子。
图15图示按照本发明的编码系统和译码系统。
这些附图不是按比例画出的。通常,相同的部件在图上用相同的参考数字表示。
具体实施方式
要注意的是,在以下给出的、显示图像的例子中,对于图像数据层所显示的东西同样可应用于深度图。
图1图示一种类型的自动立体显示设备的基本原理。显示设备包括透镜状屏幕分裂3,用于形成两个立体图像5和6。两个立体图像的垂直线(vertical lines)被用背光1(在空间上)交替地显示在例如空间光调制器2(例如,LCD)上。背光和空间光调制器一起形成像素阵列。透镜状屏幕3的透镜结构把立体图像引导到观看者的适当的眼睛。
在图2和3上图示了遮挡问题。在这个图上用‘背景’指示的线是背景,以及用‘前景’指示的线代表位于背景的前面的物体。‘左’和‘右’代表这个场景的两个视图。这两个视图例如可以是用于立体建立的左视图和右视图,或是对于使用多视图显示器的情形下的两个最外侧的视图。被表示为L+R的线可以被两个视图都观察到,而L部分只能从左视图观察到,以及R部分只能从右视图观察到。因此,R部分不能从左视图观察到,且类似地,L部分不能从右视图观察到。在图3上,中心指示中心视图。正如从这个图可以看到的,在图3上指示的背景的L和R部分的组成部分(分别是L1和R1)可以从中心视图看到。然而,L和R部分的一部分是从中心视图看不到的,因为它被隐藏在前景物体的后面。用Oc指示的这些区域对于中心视图来说是被遮挡的区域,但它们是从其它视图可看见的。正如从图上可看到的,遮挡区域典型地出现在前景物体的边缘。
仅仅从中心视图和深度图生成3D数据对于遮挡的区域提出了一个问题。被隐藏在前景物体后面的图像的各部分数据是未知的。
在已知的方法中,这是通过在分层结构中生成3D图像数据而被解决的,在分层结构中除了参考视图数据--在本例中是中心视图--以外,还生成另外的数据层。代表被隐藏在前景物体后面的3D图像各部分的数据以另外的数据层的形式被添加到3D图像信号。这个背景信息从相同的视角被存储。如果在3D图像中,许多物体位于彼此的后面,则可以有一个以上的背景信息层。
正如本领域技术人员将清楚的,分层的3D图像可以为中心视图而被编码,但不是必须,替代地,如果可以,则例如也编码一个立体对(stereo pair)中的左图像和相关联的深度信息,以便能够呈现右图像。
本发明人发现,在当前的方法中,部分所需要的信息不能在遮挡层中被表示。这降低了3D成像的质量,因为丢失的信息必须通过某种其它方式被呈现,通常导致用某种方法猜想所缺少的信息的内容。然而,无论这样的方法可以有多智能,未被表示的信息实际上根本不能被恢复,从而导致了图像误差和不完美的3D图像的可能性。
在当前的2D+深度格式中,遮挡层的视域以及深度图具有与前景层--其可被看作为参考视图--相同的高宽比和位置,即在视域上有相同的尺寸和形状。当从场景的2D+深度表示来呈现3D视图时,出现在屏幕后面的物体沿一个方向被移位,而出现在屏幕前面的物体沿相反的方向被移位。至于是哪个方向,则取决于呈现的视图是在中心视图的左面还是右面。典型地,虽然不是必然地,但出现在屏幕平面的前面或靠近屏幕平面的物体是在前景层上,以及背景层包含在前景物体后面的每件东西。通常,前景物体不会由于呈现而被移位,因为它应当出现在屏幕平面处。于是整个背景被移位到一个方向中,导致在一侧上的‘空白’或未表示的信息,例如,如果背景被向左移动16个像素,则关于在背景层右边的16个像素的信息在遮挡数据层中未被表示。未被表示的信息不能被恢复。
本发明的基本洞察是使得另外的层的视域在尺寸和/或形状上与参考视图--例如前景层--的视域不同,以及在3D图像信号中用适当的元数据指示这一点。对于许多情形,增加遮挡层的视域的宽度是足够的,因为我们仅仅具有水平像素移位。更复杂的呈现方法将能够移动被使用来以更高的自由度呈现非中心视图的虚拟照相机。在那些情形下,还可能需要垂直像素移位。在编码期间,尺寸或形状上的差异例如可以从与各种层和视角相关联的各种深度图进行计算。
图4图示本发明的第一例子。
在这个简单的例子中,假设传输系统、视频容器(video container)或视频编译码器对于所有的层只允许固定的分辨率。图4示意地图示前景层F和多个遮挡层OC1、OC2。在每个遮挡层OC1、OC2中,矩形指示遮挡层的视域的哪个区域对应于前景层F的视域。典型地,在另一个遮挡层OC1后面的遮挡层OC2需要在视域上更大,因为在呈现期间的像素移位更大。在这种情形下意味着:对应于前景层F的视域的矩形变得更小。元数据可以由对应于前景层的、遮挡层中的矩形来实现。这具有以下优点:遮挡层可以以不同的分辨率和高宽比被自动存储。
即使视频编译码器强迫对于所有的层存储固定的分辨率,信息仍可以通过把遮挡层“挤压”到给定的分辨率而被添加到遮挡层的左边和右边。在获得关于左边缘和右边缘的信息的同时,丢失了背景中的某些水平分辨率。没有缩放数据,则对于有与前景层相同分辨率的背景层,将例如不可能区分开没有任何扩展的、与前景层有相同分辨率的背景层和被缩小但具有扩展的背景层,所述扩展把总的背景层再次放大到原先的尺寸。缩放数据可以作为元数据被存储。
即使当前景本身在边缘处具有和屏幕深度不同的深度的情形下,更大的背景层也是有帮助的,因为我们现在可以使用背景层来编码缺少的信息。即使该内容原先只是“单个层”(从而背景层不是必须的),背景层仍可以被用作为对左边和右边的扩展,这是例如通过内容创建软件来进行的,在其中边缘被人工地或半自动地填充,或者边缘是从内容创建过程可得到的。
图5图示本发明的第二例子。
在这个例子中,遮挡层被以这样一种方式编码,即与前景层匹配的区域具有与前景层本身相同数目的像素。这对于大多数算法是有用的,因为对于呈现不需要重新缩放(且没有由此引起的精度丢失)。
另外的图图示了本发明的另外的例子。
A. 非矩形形状,图6-11
图6-10显示这样的例子,其中使用非矩形形状来描述对应于前景层视域的区域是有利的。假设我们具有进入地平线的道路的场景(图6)。前景层可能包含在这条道路上行驶的汽车、在空中飞翔的鸟等等。图6仅仅描绘了对于这样的场景的背景层。当从侧面观看时(图7和8),变暗的区域显示其中需要来自原始图像之外的背景信息的地方。这个信息可能是可提供的(例如,从多视图数据,图6-8)。把这些添加到背景层导致图9。为了能够把这个信息存储到矩形视频区域中,图像的行必须被水平地挤压(在顶部比在底部更多地挤压),导致图10。图11以粗线显示对应于前景层的区域(例如,具有前景物体的图6)。
B. 非线性缩放(图12和13)
假设我们具有如图12所示的背景层(以粗线表示对应的前景图像区域)。可以是这样的情形,即在图像的中部我们想要有在背景与前景之间非常精确的对应性。一个选项是把背景图像划分成三个区域:中间区域,它具有与前景的1:1的对应性,和旁边区域(在图13上用灰色表示),它们例如必须被扩展2倍(在底部用箭头表示),以便把背景拉伸到完全前景宽度和该宽度以外的延伸部分。这样,用来创建背景层的数据的压缩仅仅在边上进行,而中间部分保持不改变。
这个简单的办法可能在新引入的过渡处导致伪像,其中背景放大倍率在1到2之间跳跃, 所以可以意识到,也可以应用缩放因子的更平滑的过渡(例如,通过使用样条)。
通常,在前景与从属层之间的坐标的映射可以是具有任意的更高阶内插的控制点的网格。
C. 其它层类型/尺寸,图14
图14显示更高级的例子:我们具有在右上端的前景透明数据层、在中间行的前景合成颜色和深度数据层、以及在底部行的背景颜色和深度数据层。透明层不需要是全尺寸的,而是可被减小到正好具有幽灵(ghost)的区域。在这个案例中,对于背景层是同样的情形(图像和深度)。替换的例子(未绘出)仍旧可以具有在所有柱子后面的背景信息,这需要背景图像和深度仍旧(几乎)具有前景/合成图像的全尺寸,而透明层仍旧可以具有以上例子的减小的尺寸。在从其取得这个图像的视频中,幽灵从右移到左,所以其中需要透明性的区域保持为较小,即透明数据层的视域,但随着时间过去其确实相对于参考视图数据层--在本例中是前景合成颜色数据层--的视域而移动(即,缩放的元数据可以随着时间过去而被动画化(animated))。
在某些情形下,情形可以是:对于许多的解除遮挡而言,对于深度的像素重复可提供足够的质量,这样使得对于那些区域,可以仅仅需要存储遮挡图像数据(因为像素重复可以对于深度在接收机/呈现侧被执行)。这将导致以下情形,其中需要为背景图像存储的区域将不同于用于背景深度的区域。
D. 不同的层作为参考视图层。
有可能使用与前景/合成层不同的层作为参考,对其而言,对于所述另外的层,是以缩放数据来描述对应的视域。例如,如果我们具有通过钥匙孔看到的场景,则对于背景层只需要很小的区域。我们可以指明在该背景区域中的矩形,它比实际的背景图像大得多,以表示对应的前景区域。但替换地,我们也可以指明在前景层中哪个区域是背景图像有效的区域。
有几种生成缩放数据的方式,优选地是以元数据的形式。下面是一些实施例。
当合成各层时,背景层可以仅仅大于最后的合成,以及附加信息和它的位置可以从原始层信息、这些层如何彼此相对地放置、以及哪个“裁剪选择”被用作为最后的(前景)视口(viewport)而被查明。
替换地,图6-11显示可以如何从多视图信息查明额外的信息和视域描述。
替换地,当分割要在vidi墙(类似例如Philips 3D解决方案的“WOWzone”产品)上显示的视频时,由该视频划分成的平铺块(tile)的背景层可以以与前景层裁剪不同的方式从总体图像中裁剪(到平铺块的背景层甚至可以重叠的程度)。
替换地,在用于计算机图形呈现系统(诸如3D Studio Max, Blender, Maya)的插件中,其在不同的呈现轮次(rendering pass)中呈现不同的层,视口和/或输出分辨率在呈现轮次之间可被改变,以及那些改变作为元数据连同不同的层一起被存储,以表示在这些层之间的对应性。
替换地,合成器可以分析输入层,且例如对于前述的钥匙孔例子,注意:将只需要小部分的背景层,以及仅仅存储那个部分和描述哪个部分被选择的元数据。
替换地,合成器可以使用纹理去瑕疵(texture inpaint)方法来当原始背景信息不够多时填充背景和创建适当的元数据。高质量纹理去瑕疵方法较慢,当前不适合在显示器中实施,所以离线地应用它们较有意义。
图15示意地图示按照本发明的实施例的编码系统以及按照本发明的实施例的译码系统。编码器输入EI包括前景数据图像FG和有不定尺寸的多个背景图像BG1到BG3。按照本发明的编码系统包括编码器/编码处理器E,其被安排来把编码器输入编码成编码器输出信号EO。编码器输出信号包括对应于前景数据图像FG的前景数据层FG以及缩放的背景层BG1’到BG3’和相关联的缩放数据,每个缩放的背景层对应于背景图像BG1到BG3的各自背景图像。
编码器输出EO进而又可被用作为译码系统的输入图像数据信号DI。输入数据信号DI包括分层的数据结构,在本例中,包括前景数据层FG和多个背景数据层BG1’到BG3’。图像输入数据信号DI还包括缩放数据s,其包括提供在各种数据层的视域之间的缩放的缩放数据s。译码处理器/译码器D的输出提供各种数据层,包括对于背景层的矩形,其指示对应于前景层的视域的背景层的区域。译码器对背景数据层进行缩放,以使得对应于前景层的视域的、在背景层中的区域具有与前景层相同的尺寸。
本领域技术人员将会清楚,对于其中不需要缩放数据的实施例,也就是对于其中编码的输出信号/用于译码的输入信号包括如原始提供的未缩放的层FG、BG1、BG2和BG3的实施例,编码处理器E和编码处理器D也可以被安排来生成编码器输出信号EO/译码器输入信号DI。
应意识到,为了清晰起见,以上的说明参照单个译码/编码处理器描述了本发明的实施例。然而,将会清楚的是,在不会有损于本发明的情况下,可以使用在不同的功能单元或处理器之间的任何适当的功能性分布。因此,对译码/编码处理器的参考,仅仅要被看作为对于适当的、用于提供所描述的功能性的装置的参考,而不是用来表示严格的逻辑的或物理的结构或组织。
本发明可以以任何适当的形式被实施,包括硬件、软件、固件或它们的任何组合。可选地,本发明可以至少部分地被实施为在一个或更多个数据处理器和/或数字信号处理器上运行的计算机软件。本发明的实施例的单元和部件可以以任何适当的方式在物理上、在功能上和在逻辑上被实施。实际上,所述功能性可以在单个单元中、在多个单元中、或作为其它功能单元的一部分被实施。这样,本发明可以在单个单元中被实施,或者可以在物理上和在功能上被分布在不同的单元和处理器之间。
虽然本发明是结合某些实施例描述的,但不打算将本发明限制于这里阐述的特定的形式。而是,本发明的范围仅仅由所附权利要求限制。另外,虽然特征可以看起来是结合具体的实施例描述的,但本领域技术人员将认识到,所描述的实施例的各种特征可以按照本发明进行组合。在权利要求中,术语‘包括’不排除其它单元或步骤的存在。
此外,虽然是一个个地列出的,但多个装置、单元或方法步骤可以例如由单个单元或处理器实施。另外,虽然一个个特征可被包括在不同的权利要求中,但这些特征有可能有利地被组合,以及被包括在不同的权利要求中并不意味着特征的组合是不可行的和/或不是有利的。另外,特征被包括在一种类别的权利要求中并不意味着限制于这个类别,而是表示如果适当的话该特征同样地可应用于其它权利要求类别。此外,特征在权利要求中的次序并不意味着所述特征必须按此工作的任何特定的次序,具体地,在方法权利要求中的各个步骤的次序并不意味着这些步骤必须以这个次序被执行。而是,这些步骤可以以任何适当的次序被执行。另外,单数的提及并不排除多个。因此,对“一”、“一个”、“第一”、“第二”等等的提及并不排除多个。在权利要求中的参考符号仅仅作为澄清的例子而被提供,无论如何不应当被解释为限制权利要求的范围。
Claims (15)
1.用于编码的方法,其特征在于,3D图像信号被编码,被编码的3D图像信号包括参考视图数据层和用于该参考视图数据层的一个或更多个另外的数据层,其中被所述一个或更多个另外的层和所述参考视图覆盖的视域在尺寸和/或形状上是不同的,并且生成表达在参考视图视域与所述一个或更多个另外的层的视域之间的关系的缩放数据。
2.如在权利要求1中要求的用于编码的方法,其中缩放数据作为元数据被生成。
3.如在权利要求1中要求的用于编码的方法,其中缩放数据描述:所述参考视图的尺寸和所述一个或更多个另外的层尺寸仅仅在水平方向上是不同的。
4.如在权利要求1中要求的用于编码的方法,其中缩放数据描述非矩形形状。
5.如在权利要求1中要求的用于编码的方法,其中缩放数据描述非线性缩放。
6.如在权利要求1-5中要求的用于编码的方法,其中参考视图是前景数据层。
7.用于编码3D图像信号的系统,所述3D图像信号包括参考视图数据层和一个或更多个另外的数据层,其中被所述参考视图数据层和所述一个或更多个另外的数据层覆盖的视域的尺寸和/或形状是不同的,并且生成表达在参考视图数据层的视域与所述一个或更多个另外的层的视域之间的关系的缩放数据。
8.3D图像信号,包括参考视图数据层和一个或更多个另外的数据层,其中被所述参考视图数据层和所述一个或更多个另外的数据层覆盖的视域在尺寸和/或形状上是不同的,以及该3D图像信号包括表达在所述参考视图数据层的视域与所述一个或更多个另外的层的视域之间的关系的缩放数据。
9.如在权利要求8中要求的3D图像信号,其中缩放数据具有元数据的形式。
10.用于译码3D图像信号的方法,所述3D图像信号包括参考视图数据层和一个或更多个另外的数据层,其中各种数据层的视域是不同的,该3D图像信号包括表达在参考视图视域与所述一个或更多个另外的层的视域之间的关系的缩放数据,所述用于译码的方法包括根据缩放数据使得两个或更多个数据层的尺寸和/或形状相匹配。
11.用于译码的系统,包括用于3D图像信号的输入端,所述3D图像信号包括参考视图数据层和一个或更多个另外的数据层,其中各种数据层的视域的尺寸和/或形状是不同的,该3D图像信号包括表达在参考视图视域与所述一个或更多个另外的层的视域之间的关系的缩放数据,所述用于译码的系统包括用于根据缩放数据使得被两个或更多个数据层覆盖的视域相匹配的装置。
12.计算机程序,包括程序代码装置,用于当所述程序在计算机上运行时执行如在权利要求1到6的任一项中要求的、用于编码的方法。
13.计算机程序,包括程序代码装置,用于当所述程序在计算机上运行时执行如在权利要求10中要求的、用于译码的方法。
14.计算机程序产品,包括被存储在计算机可读的介质上的程序代码装置,用于执行如在权利要求1到6的任一项中要求的编码方法。
15.计算机程序产品,包括被存储在计算机可读的介质上的程序代码装置,用于执行如在权利要求10中要求的译码方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP08168233.8 | 2008-11-04 | ||
EP08168233 | 2008-11-04 | ||
PCT/IB2009/054869 WO2010052637A1 (en) | 2008-11-04 | 2009-11-03 | Method and system for encoding a 3d image signal, encoded 3d image signal, method and system for decoding a 3d image signal |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102204264A true CN102204264A (zh) | 2011-09-28 |
CN102204264B CN102204264B (zh) | 2014-07-23 |
Family
ID=41537728
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200980143977.6A Active CN102204264B (zh) | 2008-11-04 | 2009-11-03 | 用于编码3d图像信号的方法和系统、用于译码3d图像信号的方法和系统 |
Country Status (8)
Country | Link |
---|---|
US (1) | US9185432B2 (zh) |
EP (1) | EP2347597B1 (zh) |
JP (1) | JP5706826B2 (zh) |
KR (1) | KR101595993B1 (zh) |
CN (1) | CN102204264B (zh) |
TR (1) | TR201819481T4 (zh) |
TW (1) | TWI542190B (zh) |
WO (1) | WO2010052637A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105165008A (zh) * | 2013-05-10 | 2015-12-16 | 皇家飞利浦有限公司 | 对与多视图再现设备一起使用的视频数据信号进行编码的方法 |
CN107925752A (zh) * | 2015-07-31 | 2018-04-17 | 港大科桥有限公司 | 用于图像变形和视图合成的基于多覆盖层可变支持和阶次核的表示 |
TWI688264B (zh) * | 2017-06-23 | 2020-03-11 | 聯發科技股份有限公司 | 用軌道分組獲取合成軌道之方法及裝置 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101902657B (zh) * | 2010-07-16 | 2011-12-21 | 浙江大学 | 一种基于深度图分层的虚拟多视点图像的生成方法 |
KR101676830B1 (ko) * | 2010-08-16 | 2016-11-17 | 삼성전자주식회사 | 영상 처리 장치 및 방법 |
EP2458877A1 (en) * | 2010-11-26 | 2012-05-30 | Thomson Licensing | Occlusion layer extension |
KR102062765B1 (ko) * | 2012-09-18 | 2020-02-11 | 삼성전자주식회사 | 이미지 변환 메커니즘을 갖춘 3d 이미지 캡쳐 시스템과 그 사용 방법 |
KR101901184B1 (ko) | 2012-09-20 | 2018-09-21 | 삼성전자주식회사 | 깊이 영상을 사용한 컬러 영상 처리 장치 및 방법 |
US9418469B1 (en) * | 2013-07-19 | 2016-08-16 | Outward, Inc. | Generating video content |
US20150235408A1 (en) * | 2014-02-14 | 2015-08-20 | Apple Inc. | Parallax Depth Rendering |
CN106688231A (zh) * | 2014-09-09 | 2017-05-17 | 诺基亚技术有限公司 | 立体图像记录和回放 |
AU2016308731A1 (en) * | 2015-08-18 | 2018-03-15 | Magic Leap, Inc. | Virtual and augmented reality systems and methods |
WO2018069215A1 (en) * | 2016-10-12 | 2018-04-19 | Thomson Licensing | Method, apparatus and stream for coding transparency and shadow information of immersive video format |
EP3310053A1 (en) * | 2016-10-12 | 2018-04-18 | Thomson Licensing | Method and apparatus for coding transparency information of immersive video format |
EP3310057A1 (en) * | 2016-10-12 | 2018-04-18 | Thomson Licensing | Method, apparatus and stream for coding transparency and shadow information of immersive video format |
US10735649B2 (en) | 2018-02-22 | 2020-08-04 | Magic Leap, Inc. | Virtual and augmented reality systems and methods using display system control information embedded in image data |
US11457197B2 (en) * | 2019-02-22 | 2022-09-27 | Avalon Holographics Inc. | Layered scene decomposition CODEC with view independent rasterization |
EP3979644A1 (en) * | 2020-10-02 | 2022-04-06 | Koninklijke Philips N.V. | A method and apparatus for encoding and decoding one or more views of a scene |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5706417A (en) * | 1992-05-27 | 1998-01-06 | Massachusetts Institute Of Technology | Layered representation for image coding |
CN1427630A (zh) * | 2001-12-20 | 2003-07-02 | 皇家菲利浦电子有限公司 | 对编码视频信号进行解码的方法 |
WO2006041261A1 (en) * | 2004-10-16 | 2006-04-20 | Electronics And Telecommunications Research Institute | Method and system for encoding/decoding multi-view video based on layered-depth image |
WO2007113725A2 (en) * | 2006-03-31 | 2007-10-11 | Koninklijke Philips Electronics N.V. | Efficient encoding of multiple views |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6466207B1 (en) * | 1998-03-18 | 2002-10-15 | Microsoft Corporation | Real-time image rendering with layered depth images |
US6348918B1 (en) * | 1998-03-20 | 2002-02-19 | Microsoft Corporation | Stereo reconstruction employing a layered approach |
EP1418766A3 (en) * | 1998-08-28 | 2010-03-24 | Imax Corporation | Method and apparatus for processing images |
US6611268B1 (en) | 2000-05-30 | 2003-08-26 | Microsoft Corporation | System and process for generating 3D video textures using video-based rendering techniques |
JP2006191357A (ja) * | 2005-01-06 | 2006-07-20 | Victor Co Of Japan Ltd | 再生装置および再生プログラム |
JP4904692B2 (ja) * | 2005-01-28 | 2012-03-28 | 株式会社ニコン | 画像再生装置、及び画像再生プログラム |
TWI450264B (zh) | 2006-07-19 | 2014-08-21 | World Golf Tour Inc | 用於模擬中之圖像對映的方法及電腦程式產品 |
US20080036763A1 (en) * | 2006-08-09 | 2008-02-14 | Mediatek Inc. | Method and system for computer graphics with out-of-band (oob) background |
JP2010503101A (ja) | 2006-09-11 | 2010-01-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 画像のコラージュを生成するための方法及び電子装置 |
EP2064300A4 (en) | 2006-09-20 | 2013-05-22 | Pneumrx Inc | ADHESIVE FABRIC COMPOSITIONS AND RELATED METHODS |
US8345751B2 (en) * | 2007-06-26 | 2013-01-01 | Koninklijke Philips Electronics N.V. | Method and system for encoding a 3D video signal, enclosed 3D video signal, method and system for decoder for a 3D video signal |
-
2009
- 2009-11-02 TW TW098137138A patent/TWI542190B/zh active
- 2009-11-03 KR KR1020117012656A patent/KR101595993B1/ko active IP Right Grant
- 2009-11-03 TR TR2018/19481T patent/TR201819481T4/tr unknown
- 2009-11-03 US US13/127,267 patent/US9185432B2/en active Active
- 2009-11-03 WO PCT/IB2009/054869 patent/WO2010052637A1/en active Application Filing
- 2009-11-03 CN CN200980143977.6A patent/CN102204264B/zh active Active
- 2009-11-03 JP JP2011533918A patent/JP5706826B2/ja active Active
- 2009-11-03 EP EP09756183.1A patent/EP2347597B1/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5706417A (en) * | 1992-05-27 | 1998-01-06 | Massachusetts Institute Of Technology | Layered representation for image coding |
CN1427630A (zh) * | 2001-12-20 | 2003-07-02 | 皇家菲利浦电子有限公司 | 对编码视频信号进行解码的方法 |
WO2006041261A1 (en) * | 2004-10-16 | 2006-04-20 | Electronics And Telecommunications Research Institute | Method and system for encoding/decoding multi-view video based on layered-depth image |
WO2007113725A2 (en) * | 2006-03-31 | 2007-10-11 | Koninklijke Philips Electronics N.V. | Efficient encoding of multiple views |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105165008A (zh) * | 2013-05-10 | 2015-12-16 | 皇家飞利浦有限公司 | 对与多视图再现设备一起使用的视频数据信号进行编码的方法 |
CN105165008B (zh) * | 2013-05-10 | 2017-11-21 | 皇家飞利浦有限公司 | 对与多视图再现设备一起使用的视频数据信号进行编码的方法 |
CN107925752A (zh) * | 2015-07-31 | 2018-04-17 | 港大科桥有限公司 | 用于图像变形和视图合成的基于多覆盖层可变支持和阶次核的表示 |
TWI688264B (zh) * | 2017-06-23 | 2020-03-11 | 聯發科技股份有限公司 | 用軌道分組獲取合成軌道之方法及裝置 |
Also Published As
Publication number | Publication date |
---|---|
WO2010052637A1 (en) | 2010-05-14 |
WO2010052637A8 (en) | 2011-04-28 |
EP2347597B1 (en) | 2018-10-17 |
CN102204264B (zh) | 2014-07-23 |
EP2347597A1 (en) | 2011-07-27 |
TW201023619A (en) | 2010-06-16 |
JP2012507908A (ja) | 2012-03-29 |
TWI542190B (zh) | 2016-07-11 |
JP5706826B2 (ja) | 2015-04-22 |
KR20110093828A (ko) | 2011-08-18 |
KR101595993B1 (ko) | 2016-02-22 |
TR201819481T4 (tr) | 2019-01-21 |
US9185432B2 (en) | 2015-11-10 |
US20110211043A1 (en) | 2011-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102204264B (zh) | 用于编码3d图像信号的方法和系统、用于译码3d图像信号的方法和系统 | |
CN102197415B (zh) | 用于提供场景的分层深度模型的方法和装置 | |
US9083963B2 (en) | Method and device for the creation of pseudo-holographic images | |
Muller et al. | Reliability-based generation and view synthesis in layered depth video | |
CN1942902B (zh) | 用于2.5维图像再现的重影虚像的削减 | |
Schmidt et al. | Multiviewpoint autostereoscopic dispays from 4D-Vision GmbH | |
Smolic et al. | Intermediate view interpolation based on multiview video plus depth for advanced 3D video systems | |
KR101648206B1 (ko) | 3차원 이미지 데이터 처리 | |
CN1745589B (zh) | 用于立体图像的视频滤波 | |
KR101749893B1 (ko) | 다목적 3―d 화상 포맷 | |
EP1143747B1 (en) | Processing of images for autostereoscopic display | |
JP5544361B2 (ja) | 三次元ビデオ信号を符号化するための方法及びシステム、三次元ビデオ信号を符号化するための符号器、三次元ビデオ信号を復号するための方法及びシステム、三次元ビデオ信号を復号するための復号器、およびコンピュータ・プログラム | |
US10368046B2 (en) | Method and apparatus for generating a three dimensional image | |
EP1897056A1 (en) | Combined exchange of image and related data | |
EP1991963A2 (en) | Rendering an output image | |
CN1853200A (zh) | 用于在3-d图像显示屏上显示3-d图像的系统和方法 | |
CN102047669A (zh) | 具有深度信息的视频信号 | |
TW201215102A (en) | Signaling for multiview 3D video | |
WO2006136978A1 (en) | Method and system for rendering image data on a 3d display | |
JP2024527209A (ja) | 表示パネルの表示方法及びその表示制御装置、表示装置 | |
Boev et al. | GPU-based algorithms for optimized visualization and crosstalk mitigation on a multiview display |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |