CN101479729A

CN101479729A - 提取关键帧的系统和方法

Info

Publication number: CN101479729A
Application number: CNA2007800246067A
Authority: CN
Inventors: 王进
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2006-06-29
Filing date: 2007-06-26
Publication date: 2009-07-08
Also published as: EP2038774A2; WO2008001305A2; JP2009543410A; KR20090028788A; US20090225169A1; WO2008001305A3

Abstract

本发明提供了一种从视频中提取关键帧的方法，所述视频包括一系列视频帧，所述方法包括步骤：计算所述一系列视频帧的每一帧的错误率；比较所述错误率与一个预定的阀值；鉴别具有错误率小于所述阀值的候选帧；以及从所述候选帧中选择一些帧来得出所述关键帧。依靠剔除具有太多错误的帧，本发明提高了关键帧提取的准确度。

Description

提取关键帧的系统和方法

技术领域

本发明涉及一种在视频中提取关键帧的系统和方法。本发明可应用在视频处理领域中。

背景技术

数字视频正在成为成为信息时代重要源头随着视频数据量的增加，需要一种技术来在短时间内有效地浏览视频数据，而不会丢掉内容。一个视频可以包括一系列的视频帧，每个视频帧包含一个图像场景的快照。关键帧被典型地定义为代表一个视频视觉内容一个无序的子集。关键帧在视频摘要，编辑，标注以及检索等应用中是有用的。某些关键帧方法已经出现在包括MPEG-4和MPEG-7的新标准中，这两个新标准提供给了用户基于内容的视频表示，编码以及描述的灵活性。

关键帧提取的一种方法是基于视频中镜头的安排。一个镜头可被定义为连续拍摄的一系列图像帧。例如，一个职业制作的视频可以被安排成一系列仔细选择的镜头。

另外一种方法适合于从短的视频段或者未仔细安排的业余制作的视频中提取关键帧，就像美国专利US2005/0228849A1批露的那样。这种方法包括对一个视频中一系列视频帧中的每一帧进行一系列的分析，从而选择选择一系列候选帧。每个分析是检测一个相应类型的有意义的内容。候选帧然后形成一系列类组合，从每个类中根据描述有意义的内容的相关重要性选择一个关键帧。

不幸的是，通讯系统的一个内在问题是由于在传输过程中信道噪音引入从而使信息可能改变或者丢失。因此，在与广播或者存储相关的应用中，随机错误会对图像数据产生负面影响。当这些错误存在在图像帧中或者甚至这些错误已被恢复，如果使用常规的关键帧提取方法，被恢复的帧将对关键帧的提取有负面的影响。当一些像素损坏或者没有正确地恢复时，这些像素是不应该被考虑的。

发明内容

本发明的目的之一是提供一种更有效地从一个视频中提取关键帧的方法。

出于这种目的，本发明提供了一种从一个视频中提取关键帧的方法，所述视频包括一系列视频帧，所述方法包括步骤：计算所述一系列视频帧的每一帧的错误率；比较所述错误率与一个预定的阀值；鉴别具有错误率小于所述阀值的候选帧；以及从所述候选帧中选择(104)一些帧来得出所述关键帧。

本发明也提供了一种系统，该系统包括其功能已被根据本发明的方法特征定义的单元。依靠剔除具有太多错误的帧，本发明提高了关键帧提取的准确度。因此本发明提供了一种更准确的关键帧提取方法。

附图说明

图1示出了根据从一个视频中提取关键帧的发明的第一种方法的流程图。

图2示出了根据从一个视频中提取关键帧的发明的第二种方法的流程图。

图3示出了根据从一个视频中提取关键帧的发明的第三种方法的流程图。

图4表示带有预定区域的视频的一个例子。

图5描绘了根据从一个视频中提取关键帧的发明的系统的示意图。

具体实施方式

下面将参照附图通过实施方式详细描述本发明的技术措施。

本发明提供了一种从一个视频中提取关键帧的方法，所述视频包括一系列视频帧，所述方法包括计算所述一系列视频帧的每一帧的错误率的步骤(101)。首先检测错误，然后计算所检测错误的数量。错误检测的方法是已知的。例如，基于语法的错误检测器(SBED)能被用来检测错误。如果固定长度码字(FLC)的值未被定义或被禁止，根据它的码字表，它的错误可以被检测出来。如果它不包括在码字表中或者超过64位DCT(离散余弦转换)系数出现在一个块上，在可变长度码字(VLC)的错误也可以被检测出来。检测到的错误可以形成一个错误图，所述错误率可以根据这个图被计算出来。

本方法还包括一个比较所述错误率与一个预定的阀值的步骤(102)。所述阀值，例如，根据本发明的一个试验结果，可以为30％。

在步骤101中提到的错误率，例如，可以是发生错误的宏块数和每一帧的总宏块数的比率。另外，它也可以是每一帧的总的错误数量。相应的前者的阀值是一个比率而后者的阀值是一个数量值。

本方法还包括一个鉴别具有错误率小于所述阀值的候选帧的步骤(103)。

具有太多错误的帧应该被剔除。例如，错误率低于某一预定阀值的候选帧在错误图中被标记为“0”，这些帧，作为候选帧，在选择关键帧的过程中将会被考虑。

最后，本方法还包括一个从所述候选帧中选择一些帧来得出所述关键帧的步骤(104)。例如，仅仅从那些标记为“0”的帧中选择关键帧。从一些帧中提取关键帧的方法是已知的，例如，如前所述，美国专利US20050228849批露了一种从一个视频中智能提取关键帧，该关键帧描绘了视频的有意义的内容。

图2是在图1的基础上增加了一个步骤(201)。

本方法在所述选择步骤(104)之前，进一步包括一个剔除步骤(201)，用于剔除候选帧，该候选帧已经经过先前的错误恢复而仍然包含视觉缺陷。

对那些错误率低于预定阀值的帧，仍然需要剔出一些错误恢复得不好的帧。

帧可以按照三种类型来编码：内帧：I帧(I-frames)，向前预测帧：P帧(P-frames)，双向预测帧：B帧(B-frames)。I帧是按照一个单独的图像来编码的，不用参考任何过去的或者将来的帧。P帧是相对于过去的参考帧来编码的。B帧是相对于过去的，将来的或者两者均有的参考帧来编码。

对I帧，不同的恢复方法可以被应用到不同的宏块。恢复之后，一些帧可能仍然包含视觉缺陷。视觉缺陷是由于量化误差，硬件或者软件上(例如JPEG和MPEG)的限制或者故障而导致的一种图像上的歪曲。

对I帧宏快的纹理部分，如果空间插值的错误恢复方法被应用了，这种恢复的质量对关键帧的提取来说是不好的。具有这种视觉缺陷的帧是应该被剔除出去的。对于I帧宏块的边缘部分，如果基于边缘的如果空间插值的错误恢复方法被应用了，这种恢复的质量对关键帧的提取来说是不好的。具有这种视觉缺陷的帧是应该被剔除出去的。

对于P帧和B帧来说：在大多数情况下，暂时错误隐藏的方法被应用。错误恢复得较好。这些被恢复的像素在关键帧的提取中是可以考虑的。

被剔除的帧可以被标记为“1”。

图3也是在图1的基础上增加了一个步骤(301)。

本方法在所述选择步骤(104)之前，进一步包括一个剔除步骤(301)，用于剔除候选帧，该候选帧的错误位于一个预定区域。

图4表示带有预定区域的视频的一个例子。

所述的预定区域，在图4中用“PA”表示，可以包括一个文本信息，图4中内容区域用“CA”表示。

在一个包含文本的区域内具有错误会对关键帧提取具有负面的效果。

如果错误发生在一个预定区域(PA)，比方说一个字幕区，该字幕区被起始点(X₀，Y_o)/宽度(W)/高度(H)定义，包含这种错误的帧应该被剔除。

被剔除的帧可以被标记为“1”。

本发明还提供了一种用于从一个视频中提取关键帧的系统，所述视频包括一系列视频帧，所述系统包括一个计算单元(501)，用于计算计算所述一系列视频帧的每一帧的错误率。这个计算单元(501)可以是一个处理器，比方说，处理被解压缩的一系列视频帧(图5中用VF)表示，对象基于语法的错误检测器所监测到的错误求和，并计算出错误率。

本系统还包括一个比较单元(502)，用于比较所述错误率与一个预定的阀值。比较单元(502)可以是一个处理器也可以包括一个存储预定阀值的存储器。

本系统还包括一个鉴别单元(503)，用于鉴别具有错误率小于所述阀值的候选帧。所述鉴别单元(503)可以是一个处理器。所述鉴别单元(503)可以，比方说，对错误率小于所述预定阀值的候选帧标记上“0”。

本系统还包括一个选择单元(504)，用于从所述候选帧中选择一些帧来得出所述关键帧。例如关键帧(在图5中用“KF”表示)可以从标记为“0”的候选帧中选择出来。选择单元(504)可以是一个处理器。

本系统还包括一个第一个剔除单元(505)，用于剔除候选帧，该候选帧已经经过先前的错误恢复而仍然包含视觉缺陷。例如这个剔除单元(505)可以对这些候选帧标记为“1”。

本系统还包括一个第二个剔除单元(506)，用于剔除候选帧，用于剔除候选帧，该候选帧的错误位于一个预定区域。例如这个剔除单元(506)可以对这些候选帧标记为“1”。

本系统可以被整合进一个解码器来帮助提高关键帧提取的性能。事实上，它也可以独立于解码器，例如，错误图可以被保存在存储器里。在关键帧提取过程中，可以访问错误图来提高关键帧提取的精度。

尽管已经在附图和前述描述中详细地说明和描述了本发明，但是这些说明和描述都应被理解为是说明性的或者示例性的而非限制性的；本发明不限于所公开的实施方式。

通过研究附图、公开的内容和所附权利要求，在实施本所要求保护的发明时，本领域的技术人员可以理解和实施对所公开的实施方式的其他变型。在权利要求中，措辞“包括”并不排除其他元件或步骤，并且措辞“一个”不排除多个。单个处理器或其他单元可以履行权利要求中陈述的多个项的功能。在多个不同的从属权利要求中描述的方法并不意味着这些方法的组合不可以被利用。权利要求中的任何参考标记不应理解为是对范围的限制。

Claims

1.一种从视频中提取关键帧的方法，所述视频包括一系列视频帧，所述方法包括步骤：

- 计算(101)所述一系列视频帧的每一帧的错误率；

- 比较(102)所述错误率与一个预定的阀值；

- 鉴别(103)具有错误率小于所述阀值的候选帧；以及

- 从所述候选帧中选择(104)一些帧来得出所述关键帧。

2.如权利要求1所述的方法，在所述选择步骤(104)之前，进一步包括一个剔除步骤(201)，用于剔除候选帧，该候选帧已经经过先前的错误恢复而仍然包含视觉缺陷。

3.如权利要求2所述的方法，其中所述一系列视频帧是I帧，所述先前错误恢复与空间插值错误恢复有关，所述视觉缺陷位于一个宏块的纹理部分。

4.如权利要求2所述的方法，其中所述一系列视频帧是I帧，所述先前错误恢复与空间插值错误恢复有关，所述视觉缺陷位于一个宏块的边缘部分。

5.如权利要求1所述的方法，在所述选择步骤(104)之前，进一步包括一个剔除步骤(301)，用于剔除候选帧，该候选帧的错误位于一个预定区域。

6.如权利要求5所述的方法，其中所述预定区域包含文本信息。

7.如权利要求1所述的方法，其中所述错误率是具有错误的宏块数和所述视频帧的总宏块数的比率，所述阀值大约是30％。

8.一种用于从一个视频中提取关键帧的系统，所述视频包括一系列视频帧，所述系统包括：

一个计算单元(501)，用于计算计算所述一系列视频帧的每一帧的错误率；

一个比较单元(502)，用于比较所述错误率与一个预定的阀值；

一个鉴别单元(503)，用于鉴别具有错误率小于所述阀值的候选帧；以及

一个选择单元(504)，用于从所述候选帧中选择一些帧来得出所述关键帧。

9.如权利要求8所述的系统，进一步包括第一个剔出单元(505)，用于剔除候选帧，该候选帧已经经过先前的错误恢复而仍然包含视觉缺陷。

10.如权利要求8所述的系统，其中所述一系列视频帧是I帧，其中所述先前错误恢复与空间插值错误恢复有关，所述视觉缺陷位于一个宏块的纹理部分。

11.如权利要求8所述的系统，其中所述一系列视频帧是I帧，所述先前错误恢复与空间插值错误恢复有关，所述视觉缺陷位于一个宏块的边缘部分。

12.如权利要求8所述的系统，进一步包括第二个剔出单元(506)，用于剔除候选帧，该候选帧的错误位于一个预定区域。

13.如权利要求12所述的，其中所述预定区域包含文本信息。