CN101427581B - 基于视觉的压缩 - Google Patents
基于视觉的压缩 Download PDFInfo
- Publication number
- CN101427581B CN101427581B CN200780014072XA CN200780014072A CN101427581B CN 101427581 B CN101427581 B CN 101427581B CN 200780014072X A CN200780014072X A CN 200780014072XA CN 200780014072 A CN200780014072 A CN 200780014072A CN 101427581 B CN101427581 B CN 101427581B
- Authority
- CN
- China
- Prior art keywords
- pixel
- edge
- image
- information
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
各种系统和方法提供了基于视觉的图像压缩。在一个实现中,内部涂色是被选为扩充常规的基于信号处理技术的基于视觉技术。对于源图像的某些区域,示例性系统高效地提取并组织结构边缘信息而不是压缩这些区域。在一个实现中,该系统应用二进制曲线拟合以捕捉该边缘信息。解码器中的知晓结构的内部涂色器然后能够通过该边缘信息来恢复这些区域,这占用非常少的数据空间或从编码器发送至解码器的比特流中的最少带宽。该图像的关键视觉分量仍然能够按常规压缩。提取某些区域的边缘信息而不是压缩它们相当程度上增加了整体图像压缩。
Description
技术领域
本发明涉及用于基于视觉的图像压缩的示例性系统和方法。
背景技术
已试图通过标识和利用图像中的视觉特征来开发图像压缩技术以实现更高的编码效率。此外,对人类视觉系统(HVS)如何察觉各种图像特征的认识以被结合到用于移除图像中固有的某些视觉冗余和用于提高所得图像的视觉质量的编码方法中。然而,这些编码方案的开发极大地受到边缘检测和分段工具的有效性的影响。
同时,也已对常规的基于信号处理的压缩方法做出了极大的改进。这些主流编码方案设法利用像素之间的统计冗余以追求高编码效率。最新的JPEG2000和MPEG-4 AVC/H.264是在编码效率方面大大胜过先前几代的两个这样的示例。然而,感知质量在算法设计期间几乎被完全忽略。此外,在这些方案的当前开发中,甚至连小的改进也是以增加编码复杂度为高昂代价的。
图像内部涂色(image inpainting)(也被称为图像填充)是以视觉上似乎真实的方式恢复图像的指定区域中的丢失数据的过程。当前结果示出内部涂色甚至当存在特定种类的有限结构时也能够以看上去自然的方式恢复同质区域。然而,常规的图像内部涂色在重新生成重要的视觉结构(例如,结构边缘)方面并不有效,尤其是在它们是唯一的或在图像中具有特殊的、确切的方位的情况下。这些结构边缘常规上被移交给常规压缩-使得它们将可靠地重新出现在重新生成的图像中。
然而,结构数据,尤其是边缘,具有比其对整个图像的能量贡献的数值更重大的感知重要性。因此,如果可以适当地利用结构信息,则能够提高图像编码技术的编码效率和视频质量。所需的是高效地捕捉和组织从源图像提取的边缘信息以使得解码器中的内部涂色器能够在占用非常少的数据空间/从编码器发送至解码器的最少比特流带宽的指导下恢复该图像的相对较大的结构区域。
发明内容
各种系统和方法提供了基于视觉的图像压缩。在一个实现中,内部涂色(inpainting)是被选为扩充常规的基于信号处理的技术的基于视觉的技术。对于源图像的某些区域,一示例性系统高效地提取并组织结构边缘信息而不是压缩这些区域。在一个实现中,该系统应用二进制曲线拟合(binary curve fitting)以捕捉该边缘信息。解码器中知晓结构的内部涂色器(inpainter)然后能够通过该边缘信息恢复这些区域,这占用非常少的数据空间或从编码器发送至解码器的比特流中的最少带宽。该图像的关键视觉分量仍然能够按常规压缩。提取某些区域的边缘信息而不是压缩它们相当程度上增加了总体图像压缩。
本发明提供了一种用于视觉压缩的方法,包括:将图像分割成将要压缩的第一区域和将通过内部涂色来合成的第二区域;从所述第二区域中提取视觉边缘信息,所述视觉边缘信息将用于在所述内部涂色期间传播所述第二区域的结构边缘;压缩所述第一区域和所述视觉边缘信息;以及将所压缩的第一区域和所压缩的视觉边缘信息组合成比特流。
本发明还提供了一种图像压缩系统,包括:编码器,其包括:图像分析器,用于将图像划分成视觉上重要的区域和剩余区域;边缘提取器,用于从所述剩余区域收集边缘信息;至少一个压缩器,用于压缩所述视觉上重要的区域并压缩所述剩余区域的边缘信息;以及混合器,用于将所压缩的视觉上重要的区域和所压缩的边缘信息组合成比特流。
提供本概述以便介绍将在以下的详细描述中进一步描述的示例性的基于视觉的压缩。本概述并不旨在标识所要求保护的主题的本质特征,也不旨在用于帮助确定所要求保护的主题的范围。
附图说明
图1是被分割成将要压缩的区域和将在解码器处合成的区域的图像的图示。
图2是用于基于视觉的图像压缩的示例性系统的图示。
图3是示例性编码器和解码器的框图。
图4是图3的示例性辅助信息生成器的更详细的框图。
图5是图3的示例性丢弃区域生成器的更详细的框图。
图6是在知晓结构的内部涂色期间的示例性结构传播的图示。
图7是基于视觉压缩的示例性方法的流程图。
图8是重新生成经受基于视觉的压缩的图像的示例性方法的流程图。
具体实施方式
概览
此处所描述的是用于基于视觉的图像压缩(例如,基于知晓结构的内部涂色的压缩)的示例性系统和方法。这些系统和方法显著地提高了图像(和视频)压缩和编码效率。如图1所示,在一典型的实现中,图像100被划分成块或“区域”。诸如区102中的区域等包含关键视觉分量的区域由常规的基于信号处理的压缩技术来压缩。诸如区104中的区域等可能仍然包含重要结构的剩余区域从正使用的编码器处的压缩中被丢弃。该示例性系统从这些剩余区域中提取视觉边缘信息而不是压缩。在一个实现中,该系统应用二进制曲线拟合来表示边缘。该边缘信息具有相比于相同区域的压缩版本更小的数据大小。可进而压缩该边缘信息(即,代替压缩该文字图像内容)以表示丢弃的块。
在解码器处,丢弃的区域基于该边缘信息来进行内部涂色。在一个实现中,内部涂色器通过首先找到附近的已知结构元素来传播每个未知区域中的结构。例如,从突然在未知区域的边框处终止的已知结构边缘的末端开始,内部涂色器应用所接收到的边缘信息来传播该边缘作为穿过未知区域的数学构造或一个像素宽的曲线-使得该边缘对于相邻区域以及对于从所接收到的边缘信息中导出的形状或路径是连续的。该内部涂色器然后应用像素分类器以将在传播边缘上或靠近其的每个像素标记或者为结构像素或者为属于在传播边缘的任一侧(边缘固有地描绘两个对象)的对象中的一个的像素。
然后该内部涂色器通过示例性的基于距离的配对技术来填充每个像素。对于结构像素,取决于与相邻像素的距离和像素对之间的位置相似性,给定像素用基于其相邻像素中的一个的值来填充。对于在距离阈值之内靠近传播的结构边缘的对象像素,使用类似的配对技术来填充这些对象像素,不同之处在于该对中的每个像素与该结构边缘的距离在计算时也被考虑在内。
一旦已填充传播结构和附近的像素,纹理合成器就使用适于每个对象的纹理来填充每个未知区域。每个对象都包括由像素分类器分配给它的那些像素。
使用辅助边缘信息的总体结果是比常规技术更高的压缩率,尤其是对于具有某些冗余视觉结构和对于原始图像的高感知保真度的图像。
示例性系统
图2示出了用于执行由所提取的边缘信息协助的示例性的基于视觉的图像压缩和知晓结构的内部涂色的示例性系统200。第一计算设备202主存图像编码器204。第一计算设备202通过诸如网络等传输信道206来耦合到第二计算设备208。第二计算设备208主存图像解码器210。
在第一计算设备202处,图像编码器204编码图像100(或视频)。在通过传输信道206传输已编码图像(例如,作为比特流)之后,图像100在第二计算设备208处由图像解码器210来恢复。在典型的设置中,每个计算设备可同时具有图像编码器204和图像解码器210两者以在计算设备之间来回发送已编码图像。
图3更详细地示出了图2的示例性编码器204和解码器210。编码器204和解码器210的所示实现只是出于描述目的的一种示例配置。所示组件或甚至构成这些组件的不同组件的许多其他安排在本主题范围内也是可能的。示例性编码器204和解码器210可用硬件、软件或硬件、软件、固件的组合等来执行。
编码器204包括图像分析器302、关键分量编码器304、辅助信息生成器306、辅助信息编码器308和混合器310。图像分析器302将图像100划分成具有关键分量的区域(诸如图1的区102中的那些区域)和可能包含大量结构的剩余区域(诸如图1的区104中的那些区域)。关键分量编码器304可以是常规的基于信号处理/基于变换的压缩技术中的一种,诸如JPEG技术等。将在以下更详细描述的辅助信息生成器306从将在压缩阶段被丢弃或跳过的图像的区域(诸如104中的区域)(即,将不经受关键分量编码器304的区域)中提取边缘信息。辅助信息编码器308压缩所提取的边缘信息-代替从中提取边缘信息的区域的文字内容。混合器310将所压缩的关键分量区域和所压缩的边缘信息(“辅助信息”)组合成单个比特流312以供传输。
示例性解码器210包括用于从比特流312中获得所压缩的关键分量和所压缩的辅助信息的挑选器314、关键分量解码器316、辅助信息解码器318、丢弃区域生成器320和区域混合器322。关键分量解码器316将常规地压缩的区域解压回包含关键视觉分量的区域。辅助信息解码器318解压边缘信息。将在以下更详细描述的丢弃区域生成器320如由来自辅助信息解码器318的解压缩的边缘信息所引导地重新生成包括传播的结构边缘的丢弃区域。区域混合器322集成解压的关键分量和重新生成或重新合成的丢弃区域以重构图像100。
图4更详细地示出了编码器204的示例性辅助信息生成器306。所示实现只是出于描述目的的一种示例配置。甚至包括不同组件的辅助信息生成器306的其他安排在本主题范围内也是可能的。这一示例性辅助信息生成器306可以用硬件、软件或硬件、软件、固件的组合等来执行。
示例性辅助信息生成器306包括图像边缘提取器402,其进而包括边缘检测器404、可移除比长度阈值408短的所检测到的边缘的剪除引擎406和二进制曲线拟合器410。辅助信息生成器306还可包括产生辅助边缘信息414的二进制轮廓组织器412。辅助信息生成器306将在以下在示例性系统200的操作下更详细地描述。
图5更详细地示出了图3的丢弃区域生成器320。所示实现只是出于描述目的的一种示例配置。包含组件中的变化的丢弃区域生成器320的其他安排在本主题范围内也是可能的。这一示例性丢弃区域生成器320可以用硬件、软件或硬件、软件、固件的组合等来执行。
所示的丢弃区域生成器320接收辅助边缘信息414(例如,在比特流312中),并调用结构传播器502以便为将从辅助边缘信息414中重新生成的未知区域合成视觉结构。一旦传播了结构边缘并且填充了在结构边缘中和周围的像素,丢弃区域生成器320中的知晓对象的纹理合成器504就用适合对象的纹理来充实每个未知区域。
结构传播器502还可包括已知结构管理器506和(基于距离的)内部涂色器508。内部涂色器508进而包括用于将像素指定为边缘像素512或对象像素514(例如作为在传播的结构边缘的任一侧的“左”和“右”对象的像素)的像素分类器510。内部涂色器508还包括“结构像素”传播器516和“非结构像素”传播器518。结构像素传播器516填充正通过像素配对器520传播的边缘中的像素并且还可包括不可恢复像素内插器522。“非结构像素”传播器518包括知晓对象的像素配对器524和用于确定到配对器524使用的每个像素的结构边缘的距离的距离计算器526。
示例性图像压缩系统的操作
在以下操作的描述中,关键视觉分量有时被称为图像的“已知区域”,而可丢弃区域(将在编码器的数据压缩器处跳过的区域)被称为“未知区域”。
泛言之,在编码器204处,给定一些关键视觉分量和一些辅助边缘信息,具有关键分量的区域按常规编码且辅助边缘信息414被组织成二进制结构曲线信息并由例如二进制算术编码来编码。
在解码器210处,关键分量和辅助边缘信息414首先从比特流312中挑选出并由相应的解码器316和318来解码。然后,内部涂色器508恢复从编码器204处的压缩中丢弃的区域。最后,区域混合器322集成所恢复的丢弃区域和解压的关键分量以重构整个图像100。
知晓结构的内部涂色
在常规内部涂色中存在的一常见假设是未知区域中的结构和纹理信息可直接或间接地从周围/相邻的已知区域导出。但对于更一般的情况,未知区域可包含甚至连人类智能也难以推导出的结构信息。在典型的常规内部涂色应用(例如,退化和元素恢复)中,由于缺乏关于丢失结构的相关信息,现有方法都不能够解决再现丢失结构特征的问题。
再生退化图像与示例性图像压缩之间的显著差异是在压缩情形中整个图像可在开始时获得。因此,许多类型的辅助信息可从源图像中提取以引导和通知内部涂色。辅助信息本身可被进一步压缩。
示例性的知晓结构的内部涂色器508在其像素填充能力方面是基于距离的,并解决至少两个主要问题:第一,什么应从源图像100中提取作为辅助结构信息414?第二,给定来自源图像100的辅助二进制结构信息414,未知区域应如何合成?
提取结构
在一个实现中,图像边缘提取器402使用来自计算机视觉科学的原理来将视觉结构表示为一个像素宽的二进制曲线。辅助信息编码器308能够进而通过算术编码来高效地压缩这些曲线。
出于保持未知区域中的语义保真度的目的,所提取的结构信息应当是对象的二进制轮廓。因此,由诸如Sobel算子或Laplacian算子等常规边缘检测器提取的局部特性在这种情况下不是非常有用。仍然存在用于从图像100中提取拓扑结构的许多现有方法,这些方法可以在示例性系统200中用于帮助提取结构信息。
然而,存在由边缘检测器404生成的小边缘片段和短分支,其不属于通常与示例性内部涂色器508兼容的所期望的二进制结构曲线的类型。因此,在一个实现中,剪除引擎406丢弃短于合理长度阈值408的边缘,并且还在连接到主结构时移除短分支。在剪除引擎406移除这些非结构边缘之后,所得边缘信息一般对知晓结构的内部涂色器508非常友好。
未知区域填充
参考图6(以及图3、4和5的组件),给定辅助边缘信息414(即,二进制结构信息),内部涂色器508沿着从接收到的结构信息414导出的路径传播结构602。然后,未知区域604的剩余部分由纹理合成器503来恢复。为了方便和计算起见,在下文中,未知和已知区域分别由F’和F来表示;而(F’和F中的)结构信息分别由St′和St来表示。
在一个实现中,图像边缘提取器402提取已知区域(F)中在未知区域F’604附近的已知结构(St)以供内部涂色器508在未知区域F’604中传播未知结构St’602。由于编码器204的图像分析器302完全控制未知区域选择,因此解码器210中的已知结构管理器506能够容易地假设可找到来自附近已知区域并且与未知结构St’602相连接的两个已知结构(在图6中被标记为St1和St2)中的至少一个。在不损失通用性的情况下,本说明书现在将集中于已知结构St1和St2都可获得的情况。
像素分类
由于位于跨越传播结构602的像素通常属于不同的对象,因此丢弃区域生成器320的结构传播器502能够首先根据可用的结构信息414来将在附近的已知区域F和未知区域F’604中的像素分类到不同的对象。如图6所示,已知区域F和未知区域F’604中的所有像素都可被分类到三个子集″L″、″R″和″E″中。L是该区域上的传播结构602的左边;R是传播结构602的右边;E是在传播结构602本身之内,其中根据像素对于由结构信息414定义的路径的相对位置,E≡St1∪St2∪St′。因此,在图6中,L和R表示由传播结构602分割的两个对象。
对于一个像素p∈F∪F’,其在一网格中的8个邻居的集合被表示为N(p)。图6的像素p和q之间的最短(欧几里得)距离被表示为d(p,q)。在一个实现中,当任意地将像素p0分配给对象L时,像素分类器510如下处理每个像素:
·情况一606:当1<D(p)≤T,如果且q∈L(或R),则p∈L(or R),(如图6(a)的606所示);
·情况二608:当D(p)=1,如果d(p,q)=1且q∈L(或R),则p∈L(或R),(如图6(b)的608所示);
结构传播
在像素分类器510标记像素之后,“结构像素”传播器516恢复结构602内的像素并且然后“非结构像素”传播器518填充靠近传播结构602的像素。在不损失通用性的情况下,结构信息414可被描述为定向的,诸如从St1到St2(如图6所示)。
配对器520填充结构602中的像素。例如,考虑以下情形。x1和x2是已知区域中的两个像素,x3是具有可用信息的像素(该像素是已知的或已经被填充),且x4是将由配对器520生成的未知像素。配对器520将配对功能公式化为等式(1):
x1-x2=x3-x4,如果d(x1,x2)=(x3,x4)且sim(x1,x2)=TRUE (1)
在等式(1)中,式d(x,y)是结构602中的x和y之间的距离,且sim(x,y)表示x和y之间的相似性。
更详细而言,再次参考图6,假设p是正被恢复的当前未知结构像素,q是结构602中的已知像素且q和p之间的距离(d(p,q))是1。如果结构602中存在等于q的已知像素q’,并且q’和p’之间的距离是1,则结构602中的已知像素p’被选为供填充p的候选像素。换言之,如果结构602中的第二对像素的成员之一类似于其在结构602中的第一对像素中的相应成员,则第一对像素之间的已知关系可被传播到第二对像素。
当应用示例性配对时,在结构602中可能存在一个以上的候选像素。配对器520任意选择候选像素中的一个以恢复像素p。否则,如果在距离为1处没有候选像素可用,则结构像素传播器516检查更长距离处的候选像素直到考虑了最长距离。如果填充了未知像素p,则其被标记为可用像素并且然后可被用作候选像素而不是已知像素。
此外,某些未知像素不可由配对器520来恢复是可能的。因此,不可恢复像素内插器522应用基于距离的内插以填充这些像素。在这种情况下,结构602中的未知像素p根据等式(2)来恢复:
其中d(x,y)是沿着结构602从x到y的距离,且a和b是结构602中具有在不同方向上与p的最短距离的两个已知像素。如果只有一个已知像素可用,则p直接被设置成该已知像素。
第二,靠近结构602的像素由非结构像素传播器518来处理。在像素分类期间,像素分类器510根据其对从结构信息414导出的结构边缘602的相对位置来将已知和未知区域中的所有像素分成对象L和对象R。执行配对以分别填充这两个对象的像素。
从像素x到结构602的最短距离被表示为D(x)。被认为靠近结构602的像素p应满足D(p)≤R,其中R是限制配对区的阈值。靠近结构602的像素的恢复非常类似于结构602中的配对过程,不同之处在于距离计算器526考虑到结构602的相关距离。即,等式(1)和(2)中的距离d(x,y)由D(x,y)来代替,如等式(3)所指示:
D(x,y)={d(x,y),D(x)-D(y)} (3)
纹理合成
在结构传播之后,知晓对象的纹理合成器504恢复由编码器204从未知区域604中丢弃的纹理。基于片的内部涂色技术可容易地应用于恢复缺少的纹理。此时,已知和未知区域604已被像素分类器510划分成多个对象。纹理合成器504应用已与来自已知区域的每个对象相关联的纹理。将在未知区域604的未填充部分上传播的纹理的候选片只从相同对象中的纹理片中选出。
示例性方法
图7示出了基于基于视觉的图像压缩的示例性方法700。在该流程图中,操作被概括成单独的框。示例性方法700可以由硬件、软件或硬件、软件、固件的组合等来执行,例如由示例性的基于视觉的压缩系统200的组件来执行。
在框702处,将图像分割成将要压缩的视觉分量和将通过解码器处的内部涂色来合成的剩余区域。将要压缩的视觉分量可以是图像中不值得试图用辅助信息来概括并通过内部涂色在解码器处合成的处理工作的那些关键视觉分量。太复杂从而无法在解码器处合成或逼近的视觉分量最好留给常规压缩。方法700的给定实现可将图像划分成相等的块并然后决定哪些块应经受常规压缩,或者方法700可以将关键视觉分量从图像中分出以进行常规压缩并使得剩余“背景”区域通过辅助内部涂色来合成。
在框704处,从将要合成的区域中提取视觉边缘信息以在其通过内部涂色的重新生成期间将边缘传播回到该区域中。捕捉图像区域中的视觉边缘信息的优雅方式是检测结构边缘并然后通过应用二进制曲线拟合来概括或逼近这些边缘。检测到的边缘可通过剪除来略微修改以使得二进制曲线信息更合乎知晓结构的内部涂色的需要。辅助二进制曲线信息可在传送至解码器之前按照区域或按照坐标等来组织。
在框706处,压缩视觉分量和所提取的视觉边缘信息。视觉分量经受常规图像压缩,而边缘信息可由诸如二进制算术压缩等不同的技术来压缩。
在框708处,将所压缩的视觉分量和所压缩的边缘信息组合成比特流。该比特流可被传送至解码器或转换/存储为将在稍后检索和解码的数据文件。
图8示出了重新生成已经受基于视觉的压缩的图像的示例性方法800。在该流程图中,操作被概括成单独的框。示例性方法800可以由硬件、软件或硬件、软件、固件的组合等来执行,例如由示例性的基于视觉的压缩系统200的组件来执行。
在框802处,所压缩的视觉分量和所压缩的边缘信息用对应于其压缩方法的技术来解压。如果所压缩的数据是作为比特流来接收的,则首先挑选出该比特流的分量。
在框804处,内部涂色由解压的边缘信息来引导以在区域合成期间传播结构。在正通过内部涂色合成来重新生成的未知区域中,首先使用辅助边缘信息来将像素分类为结构边缘像素、或结构边缘像素左边的对象像素、或结构边缘像素右边的对象像素。像素然后通过配对来填充。在将要恢复的每个像素的距离内找到一“模型”像素对。如果另一对中的另一像素也相配,则正被恢复的像素可区其在该另一对中的相应像素的值。换言之,如果像素对满足相似性条件,则四个像素可具有其中信息可以是“叉乘”的成比例关系以求解未知像素。例如,在像素对R:G/R:x中,其中x是未知像素,如果条件正确,则x=G。非结构像素也以类似的方式填充,不同之处在于考虑与结构边缘的距离以限制从中提取候选像素对的区。
在框806处,将解压的视觉分量和通过内部涂色来合成的区域混合成重新生成的图像。即,将解压的视觉分量和已使用辅助结构边缘信息来合成的剩余图像组合回原始图像的重构版本。
结论
尽管已用对结构特征和/或方法动作专用的语言描述了示例性系统和方法,但可以理解,所附权利要求书中定义的主题不必限于所述具体特征或动作。相反,上述具体特征和动作是作为实现所要求保护的方法、设备、系统等的示例性形式而公开的。
Claims (17)
1.一种图像压缩方法(700),包括:
将图像(100)分割成将要压缩的第一区域(102)和将通过内部涂色(508)来合成的第二区域(104);
从所述第二区域(104)中提取视觉边缘信息(414),所述视觉边缘信息(414)将用于在所述内部涂色(508)期间传播所述第二区域(104)的结构边缘;
压缩(304、308)所述第一区域(102)和所述视觉边缘信息(414);以及
将所压缩的第一区域和所压缩的视觉边缘信息组合(310)成比特流(312)。
2.如权利要求1所述的方法,其特征在于,压缩所述第一区域包括通过基于变换的图像编码技术来编码所述第一区域。
3.如权利要求1所述的方法,其特征在于,提取所述视觉边缘信息包括检测所述图像中的边缘并将所述边缘表示为二进制曲线。
4.如权利要求3所述的方法,其特征在于,压缩所述视觉边缘信息包括通过二进制算术编码来编码所述二进制曲线。
5.如权利要求1所述的方法,其特征在于,提取所述视觉边缘信息包括检测边缘并剪除低于长度阈值的边缘。
6.如权利要求1所述的方法,其特征在于,提取视觉边缘信息包括检测表示所述图像中的主要视觉结构的视觉边缘并在附连到所述主要视觉结构的短边缘低于长度阈值时剪除所述短边缘。
7.如权利要求1所述的方法,其特征在于,还包括:
接收所述比特流;
解压所压缩的第一区域;
解压所压缩的视觉边缘信息;
用所解压的视觉边缘信息来引导所述内部涂色以在合成所述第二区域期间传播所述结构边缘;以及
混合所解压的第一区域和所恢复的第二区域以重新生成所述图像。
8.如权利要求7所述的方法,其特征在于,引导所述内部涂色包括使用所解压的视觉边缘信息来将从相邻的已知区域的边框处开始的已知结构传播到当前未知区域中。
9.如权利要求7所述的方法,其特征在于,引导所述内部涂色包括将像素分类为或者是结构像素或者是属于在所述结构像素的任一侧的第一和第二对象的的对象像素。
10.如权利要求9所述的方法,其特征在于,还包括首先恢复所述结构像素,并然后恢复所述对象像素。
11.如权利要求10所述的方法,其特征在于,恢复所述结构像素包括基于像素对之间的距离来配对,其中所述结构中的第一对已知像素之间的已知关系在所述结构中的第二对像素中的一个像素等于所述第一对中的相应成员时被传播到所述第二对像素。
12.如权利要求10所述的方法,其特征在于,恢复所述对象像素包括配对,其中所述配对是相对于每个像素对与所述结构的距离来执行的。
13.如权利要求10所述的方法,其特征在于,还包括当所述结构像素或对象像素中的一个是不可恢复的时候,应用基于距离的内插以填充所述不可恢复的像素。
14.如权利要求7所述的方法,其特征在于,还包括合成纹理以便对所述第二区域的除所述结构边缘外的剩余部分进行内部涂色,其中所述合成包括为在每个结构边缘的不同侧的不同对象创建相应纹理,并且其中用于合成对象的纹理的每个模型纹理片从正被纹理化的相同对象导出。
15.一种图像压缩系统(200),包括:
编码器(204),其包括:
图像分析器(302),用于将图像划分成视觉上重要的区域(102)和剩余区域(104);
边缘提取器(402),用于从所述剩余区域(104)收集边缘信息(414);
至少一个压缩器(304、308),用于压缩所述视觉上重要的区域(102)并压缩所述剩余区域(104)的边缘信息(414);以及
混合器(310),用于将所压缩的视觉上重要的区域和所压缩的边缘信息组合成比特流(312)。
16.如权利要求15所述的图像压缩系统,其特征在于,所述边缘提取器检测所述剩余区域中的视觉边缘并将所述视觉边缘表示为二进制曲线。
17.如权利要求15所述的图像压缩系统,其特征在于,还包括:
用于接收所述比特流的解码器,其包括:
用于恢复所述视觉上重要的区域的第一解码器;
用于恢复所述边缘信息的第二解码器;
用于合成所述剩余区域的区域生成器;以及
用于根据所述边缘信息来传播结构的所述区域生成器中的知晓结构的内部涂色器。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US74516906P | 2006-04-19 | 2006-04-19 | |
US60/745,169 | 2006-04-19 | ||
US11/736,900 | 2007-04-18 | ||
US11/736,900 US8019171B2 (en) | 2006-04-19 | 2007-04-18 | Vision-based compression |
PCT/US2007/009702 WO2007124084A1 (en) | 2006-04-19 | 2007-04-19 | Vision-based compression |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101427581A CN101427581A (zh) | 2009-05-06 |
CN101427581B true CN101427581B (zh) | 2011-03-30 |
Family
ID=38619527
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200780014072XA Active CN101427581B (zh) | 2006-04-19 | 2007-04-19 | 基于视觉的压缩 |
Country Status (4)
Country | Link |
---|---|
US (2) | US8019171B2 (zh) |
KR (1) | KR101344186B1 (zh) |
CN (1) | CN101427581B (zh) |
WO (1) | WO2007124084A1 (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8019171B2 (en) | 2006-04-19 | 2011-09-13 | Microsoft Corporation | Vision-based compression |
KR101379255B1 (ko) * | 2007-04-06 | 2014-03-28 | 삼성전자주식회사 | 미분 방정식을 이용한 인트라 예측 부호화, 복호화 방법 및장치 |
KR101378338B1 (ko) * | 2007-06-14 | 2014-03-28 | 삼성전자주식회사 | 영상 복구를 이용한 인트라 예측 부호화, 복호화 방법 및장치 |
US9837013B2 (en) * | 2008-07-09 | 2017-12-05 | Sharp Laboratories Of America, Inc. | Methods and systems for display correction |
JP2011040970A (ja) * | 2009-08-10 | 2011-02-24 | Canon Inc | データ処理装置、および、データ処理方法 |
CN102823242B (zh) | 2010-01-22 | 2016-08-10 | 汤姆森特许公司 | 基于取样超分辨率视频编码和解码的方法和装置 |
US9813707B2 (en) | 2010-01-22 | 2017-11-07 | Thomson Licensing Dtv | Data pruning for video compression using example-based super-resolution |
WO2012033972A1 (en) | 2010-09-10 | 2012-03-15 | Thomson Licensing | Methods and apparatus for pruning decision optimization in example-based data pruning compression |
US20130170564A1 (en) | 2010-09-10 | 2013-07-04 | Thomson Licensing | Encoding of a picture in a video sequence by example-based data pruning using intra-frame patch similarity |
US9576347B2 (en) * | 2015-01-26 | 2017-02-21 | Sony Corporation | Structure analysis method for recovering missing structures in an image after object removal |
US10623775B1 (en) * | 2016-11-04 | 2020-04-14 | Twitter, Inc. | End-to-end video and image compression |
WO2018150083A1 (en) * | 2017-02-16 | 2018-08-23 | Nokia Technologies Oy | A method and technical equipment for video processing |
CN109829867B (zh) * | 2019-02-12 | 2022-09-09 | 西南石油大学 | 一种针对稳定填充的球形收敛样本块修复方法 |
CN111968059B (zh) * | 2020-08-27 | 2024-03-08 | 李松涛 | 一种多补丁匹配的金相图修复方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1130846A (zh) * | 1994-12-29 | 1996-09-11 | 大宇电子株式会社 | 用于对视频信号特征点估算运动矢量的装置 |
CN1131374A (zh) * | 1994-10-31 | 1996-09-18 | 大宇电子株式会社 | 采用分段技术的视频信号编码系统 |
CN1159275A (zh) * | 1995-07-24 | 1997-09-10 | 摩托罗拉公司 | 检测遮挡的方法和装置 |
CN1322445A (zh) * | 1999-08-09 | 2001-11-14 | 索尼公司 | 发送、接收及发送和接收的设备及方法、记录介质和信号 |
CN1522073A (zh) * | 2003-02-10 | 2004-08-18 | ���ǵ�����ʽ���� | 视频编码器和使用视频编码器的压缩视频信号的方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5172227A (en) * | 1990-12-10 | 1992-12-15 | Eastman Kodak Company | Image compression with color interpolation for a single sensor image system |
US5696842A (en) * | 1991-07-04 | 1997-12-09 | Ricoh Company, Ltd. | Image processing system for adaptive coding of color document images |
EP0757334A3 (en) * | 1995-07-07 | 1997-07-02 | Imec Vzw | Data compression method and apparatus |
DE19958553A1 (de) * | 1999-12-04 | 2001-06-07 | Luratech Ges Fuer Luft Und Rau | Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten |
US6879717B2 (en) * | 2001-02-13 | 2005-04-12 | International Business Machines Corporation | Automatic coloring of pixels exposed during manipulation of image regions |
US7085401B2 (en) * | 2001-10-31 | 2006-08-01 | Infowrap Systems Ltd. | Automatic object extraction |
US7194143B2 (en) * | 2002-04-26 | 2007-03-20 | Pegasus Imaging Corporation | Method of enhancement of the visual display of images and other visual data records |
DE602004026291D1 (de) * | 2004-07-30 | 2010-05-12 | St Microelectronics Srl | Farbinterpolation mit datenabhängiger Triangulation |
US7840086B2 (en) * | 2005-10-12 | 2010-11-23 | The Regents Of The University Of California | Method for inpainting of images |
US8019171B2 (en) | 2006-04-19 | 2011-09-13 | Microsoft Corporation | Vision-based compression |
US7907791B2 (en) * | 2006-11-27 | 2011-03-15 | Tessera International, Inc. | Processing of mosaic images |
KR101367284B1 (ko) * | 2008-01-28 | 2014-02-26 | 삼성전자주식회사 | 시점 변화에 따른 영상 복원 방법 및 장치 |
-
2007
- 2007-04-18 US US11/736,900 patent/US8019171B2/en active Active
- 2007-04-19 CN CN200780014072XA patent/CN101427581B/zh active Active
- 2007-04-19 WO PCT/US2007/009702 patent/WO2007124084A1/en active Application Filing
-
2008
- 2008-10-15 KR KR1020087025161A patent/KR101344186B1/ko active IP Right Grant
-
2011
- 2011-07-06 US US13/177,434 patent/US8396312B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1131374A (zh) * | 1994-10-31 | 1996-09-18 | 大宇电子株式会社 | 采用分段技术的视频信号编码系统 |
CN1130846A (zh) * | 1994-12-29 | 1996-09-11 | 大宇电子株式会社 | 用于对视频信号特征点估算运动矢量的装置 |
CN1159275A (zh) * | 1995-07-24 | 1997-09-10 | 摩托罗拉公司 | 检测遮挡的方法和装置 |
CN1322445A (zh) * | 1999-08-09 | 2001-11-14 | 索尼公司 | 发送、接收及发送和接收的设备及方法、记录介质和信号 |
CN1522073A (zh) * | 2003-02-10 | 2004-08-18 | ���ǵ�����ʽ���� | 视频编码器和使用视频编码器的压缩视频信号的方法 |
Also Published As
Publication number | Publication date |
---|---|
US8019171B2 (en) | 2011-09-13 |
US20070248272A1 (en) | 2007-10-25 |
KR20090007328A (ko) | 2009-01-16 |
US20110262049A1 (en) | 2011-10-27 |
KR101344186B1 (ko) | 2013-12-20 |
US8396312B2 (en) | 2013-03-12 |
WO2007124084A1 (en) | 2007-11-01 |
CN101427581A (zh) | 2009-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101427581B (zh) | 基于视觉的压缩 | |
Liu et al. | Image compression with edge-based inpainting | |
USRE37668E1 (en) | Image encoding/decoding device | |
CN103069802B (zh) | 重构图像的当前块的方法和对应的编码方法、对应的装置 | |
US6600786B1 (en) | Method and apparatus for efficient video processing | |
CN111355956B (zh) | 一种hevc帧内编码中基于深度学习的率失真优化快速决策系统及其方法 | |
CN100469142C (zh) | 视频编码和解码方法以及相应的设备 | |
CN106162195B (zh) | 一种基于单深度帧内模式的3d‑hevc深度视频信息隐藏方法 | |
CN100479526C (zh) | 显示设备中补偿图像的装置和方法 | |
CN101883284B (zh) | 基于背景建模和可选差分模式的视频编/解码方法及系统 | |
EP0734167A2 (en) | Apparatus for encoding/decoding an image signal having a still object | |
CN106170093A (zh) | 一种帧内预测性能提升编码方法 | |
CN105723709A (zh) | 用于编码和解码图像的方法、用于编码和解码图像的装置及对应计算机程序 | |
EP0985318B1 (en) | System for extracting coding parameters from video data | |
CN103489170A (zh) | 一种jpeg图片合成、叠加osd信息方法及装置 | |
Wang et al. | Segmentation-based motion-compensated video coding using morphological filters | |
Liu et al. | Edge-based inpainting and texture synthesis for image compression | |
CN103828366A (zh) | 基于图样信息的自适应滤波 | |
CN1926879A (zh) | 视频信号编码器、视频信号处理器、视频信号分发系统及其操作方法 | |
KR20060063608A (ko) | 영상신호의 엔코딩/디코딩시에 영상블록에 대한 레지듀얼예측을 수행하는 방법 및 장치 | |
JP2002199401A (ja) | 画像符号化装置、画像復号化装置、電子カメラ、および記録媒体 | |
Tiwari et al. | A comparative study on image and video compression techniques | |
Scharcanski | Lossless and near-lossless compression for mammographic digital images | |
Nihal et al. | A Survey and Study of Image Compression Methods | |
CN102724494B (zh) | 一种嵌入可逆水印的方法、提取方法以及装置和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
ASS | Succession or assignment of patent right |
Owner name: MICROSOFT TECHNOLOGY LICENSING LLC Free format text: FORMER OWNER: MICROSOFT CORP. Effective date: 20150429 |
|
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20150429 Address after: Washington State Patentee after: Micro soft technique license Co., Ltd Address before: Washington State Patentee before: Microsoft Corp. |