CN111046235B

CN111046235B - 基于人脸识别的声像档案搜索方法、系统、设备及介质

Info

Publication number: CN111046235B
Application number: CN201911193171.XA
Authority: CN
Inventors: 庄莉; 梁懿; 林振天; 张望华; 黄敬林; 蔡清远; 张均成; 袁宝峰
Original assignee: State Grid Information and Telecommunication Co Ltd; Fujian Yirong Information Technology Co Ltd; Great Power Science and Technology Co of State Grid Information and Telecommunication Co Ltd
Current assignee: State Grid Information and Telecommunication Co Ltd; Fujian Yirong Information Technology Co Ltd; Great Power Science and Technology Co of State Grid Information and Telecommunication Co Ltd
Priority date: 2019-11-28
Filing date: 2019-11-28
Publication date: 2022-06-14
Anticipated expiration: 2039-11-28
Also published as: CN111046235A

Abstract

本发明提供一种基于人脸识别的声像档案搜索方法、系统、设备及介质，方法包括：1、对一声像档案中的每一个视频数据进行切图处理，对每一张图片进行命名并存储至缓存目录中；2、读取每一张图片进行人脸识别检测，如果图片中存在人脸，则提取该图片中的条目信息；3、将所有声像档案的视频数据重复步骤1和步骤2，根据每一个条目信息建立人脸特征信息库；4、获取关键人物的基本信息及照片信息，建立关键人物信息库；5、选择检索方式并输入，找到目标人物并提取人脸特征信息，根据人脸特征信息在人脸特征库中进行比对，返回符合条件的条目信息；6、根据条目信息找到相匹配的视频文件并输出，再播放对应视频片段。本发明提高了档案检索效率。

Description

基于人脸识别的声像档案搜索方法、系统、设备及介质

技术领域

本发明涉及声像档案利用技术领域，尤其涉及一种基于人脸识别的声像档案搜索方法、系统、设备及介质。

背景技术

视频数据是声像档案中占比最多的数据，在视频数据中，找到与某人物相关的视频片段是声像档案利用的重要场景。现有的方式主要通过人工播放观看视频数据，在海量声像档案视频数据中查找符合条件的视频片段，效率低，人力成本高。

在2016年3月30日申请的申请号为201610189755.X的中国发明，公开了一种基于人脸识别的视频通信方法，其包括如下步骤：S1、预存渲染动态图像，将渲染动态图像划分为不同的应用场景；S2、通过摄像头获取视频图像信息；判断视频图像信息中是否包括用户人脸，如果检测到人脸，跳转到步骤S3；如果没有检测到人脸，跳转到步骤S1；S3、对检测到的用户人脸进行动态跟踪；对动态跟踪的用户人脸在面像库中进行目标搜索进行人脸识别；并通过利用自适应增强分离器AdaBoost检测人脸关键点；根据人脸关键点判断用户此刻心情状态信息，心情状态包括积极情绪、消极情绪、中立情绪任一种；S4、根据步骤S3种的心情状态信息选择相应的应用场景，从应用场景中获取渲染动态图像并将其叠加到人脸关键点上；跳转到步骤S2直至视频通信结束。

在2018年11月22日申请的申请号为201811400352.0的中国发明，提供了一种面向监控视频的人脸检测与搜索方法，首先训练人脸检测器；将输入待进行人脸识别与搜索的监控视频帧，利用人脸检测器对其进行检测，得到监控视频帧中的人脸区域，在人脸区域中进行五官定位，得到监控视频人脸五官定位结果；确定目标人脸图像，对目标人脸图像进行五官定位，得到目标人脸五官定位结果；然后前面步骤获得的监控视频人脸图像的五官定位结果和目标人脸图像的五官定位结果，计算两者全脸及局部五官相似度。最后计算监控视频人脸图像和目标人脸图像的概率融合相似度，得到搜索匹配结果。利用该发明使得搜索结果更为准确。

发明内容

本发明要解决的技术问题，在于提供一种基于人脸识别的声像档案搜索方法、系统、设备和介质，一方面提升档案工作者、档案利用者从海量的声像档案视频数据中检索与某一目标人物相关的视频数据的效率，另一方面也提升了声像档案本身的被利用的价值。

第一方面，本发明提供了一种基于人脸识别的声像档案搜索方法，包括如下步骤：

步骤1、对一声像档案中的每一个视频数据进行切图处理以切成一张一张图片，对每一张图片进行命名并依次存储至缓存目录中；

步骤2、读取所述缓存目录中的每一张图片，进行人脸识别检测，如果图片中存在人脸，则输出并记录该图片中的条目信息，所述条目信息包括人脸特征信息、人脸坐标信息及相关属性信息，所述相关属性信息包括该图片对应的视频文件名及该图片在视频文件中的播放时间点；如果图片中不存在人脸，则直接丢弃；

步骤3、将所有声像档案的视频数据重复步骤1和步骤2，根据每一个条目信息建立人脸特征信息库；

步骤4、获取关键人物的基本信息及照片信息，根据关键人物的基本信息及照片信息建立关键人物信息库；

步骤5、选择检索方式并输入，找到目标人物，提取该目标人物的人脸特征信息，根据该目标人物的人脸特征信息，在人脸特征库中进行比对，若匹配成功，则返回符合条件的条目信息；若匹配失败，则结束流程；

步骤6、根据返回的条目信息找到与该目标人物相匹配的视频文件并输出，再播放相匹配的视频文件中与该目标人物相匹配的视频片段。

进一步地，所述步骤1具体为：

对声像档案中的每一个视频数据进行切图处理，按用户自行设定的播放帧率切成一张一张图片，以视频文件名加上该图片在视频文件中的播放时间点的形式对每一张图片进行命名，并依次存储至缓存目录中。

进一步地，所述步骤4具体为：

通过人工收集、梳理和核实方式获取关键人物的基本信息及照片信息，根据关键人物的基本信息及照片信息建立关键人物信息库。

进一步地，所述步骤5具体为：

当选择的检索方式是人名，则输入人名，检索服务根据该人名在关键人物信息库中查找符合条件的目标人物，找到该目标人物后提取该目标人物的照片信息中的人脸特征信息，根据该目标人物的人脸特征信息，在人脸特征库中进行比对，判断该目标人物的人脸特征信息与人脸特征库中的人脸特征信息是否匹配，若匹配，则说明人脸特征库中存在该目标人物对应的图片，返回符合条件的条目信息，返回的条目信息包括该目标人物的所有视频文件名、该目标人物在对应视频文件中的播放时间点、该目标人物的人脸坐标信息及该目标人物的人脸特征信息；若不匹配，则说明人脸特征库中不存在该目标人物对应的图片，结束流程。

进一步地，所述步骤5具体为：

当选择的检索方式是目标人物的照片，则输入目标人物的照片，检索服务提取该照片中的人脸特征信息，根据该目标人物的人脸特征信息，在人脸特征库中进行比对，判断该目标人物的人脸特征信息与人脸特征库中的人脸特征信息是否匹配，若匹配，则说明人脸特征库中存在该目标人物对应的图片，返回符合条件的条目信息，返回的条目信息包括该目标人物的所有视频文件名、该目标人物在对应视频文件中的播放时间点、该目标人物的人脸坐标信息及该目标人物的人脸特征信息；若不匹配，则说明人脸特征库中不存在该目标人物对应的图片，结束流程。

进一步地，所述步骤6具体为：

根据返回的条目信息中的该目标人物的所有视频文件名找到与该目标人物相匹配的视频文件，并对匹配的视频文件进行输出；再根据返回的条目信息中的该目标人物在对应视频文件中的播放时间点，提取每一个匹配的视频文件中与该目标人物相匹配的视频片段并播放。

第二方面，本发明提供了一种基于人脸识别的声像档案搜索系统，包括：

视频切图模块，用于对一声像档案中的每一个视频数据进行切图处理以切成一张一张图片，对每一张图片进行命名并依次存储至缓存目录中；

人脸检测模块，用于读取所述缓存目录中的每一张图片，进行人脸识别检测，如果图片中存在人脸，则输出并记录该图片中的条目信息，所述条目信息包括人脸特征信息、人脸坐标信息及相关属性信息，所述相关属性信息包括该图片对应的视频文件名及该图片在视频文件中的播放时间点；如果图片中不存在人脸，则直接丢弃；

人脸建库模块，用于将所有声像档案的视频数据重复视频切图模块和人脸检测模块，根据每一个条目信息建立人脸特征信息库；

人物建库模块，用于获取关键人物的基本信息及照片信息，根据关键人物的基本信息及照片信息建立关键人物信息库；

检索比对模块，用于选择检索方式并输入，找到目标人物，提取该目标人物的人脸特征信息，根据该目标人物的人脸特征信息，在人脸特征库中进行比对，若匹配成功，则返回符合条件的条目信息；若匹配失败，则结束流程；

视频播放模块，用于根据返回的条目信息找到与该目标人物相匹配的视频文件并输出，再播放相匹配的视频文件中与该目标人物相匹配的视频片段。

第三方面，本发明提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现第一方面所述的方法。

第四方面，本发明提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现第一方面所述的方法。

本发明实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点：

本申请实施例提供的一种基于人脸识别的声像档案搜索方法、系统、设备和介质，本发明是利用人脸识别技术，对声像档案中的视频数据进行加工处理，识别并提取视频数据中出现的人脸特征信息，建立人脸特征信息库，并基于该人脸特征信息库，构建检索服务，实现对人物相关视频片段的高效检索；一方面提升档案工作者、档案利用者从海量的声像档案视频数据中检索与某一特定人物相关的视频数据的效率，另一方面也提升了声像档案本身的被利用的价值。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

下面参照附图结合实施例对本发明作进一步的说明。

图1为本发明的总体框架图。

图2为本发明实施例一中方法中的流程图。

图3为本发明实施例二中系统的结构示意图。

图4为本发明实施例三中电子设备的结构示意图。

图5为本发明实施例四中介质的结构示意图。

具体实施方式

为使得本发明更明显易懂，现以一优选实施例，并配合附图作详细说明如下。

本申请实施例通过提供一种基于人脸识别的声像档案搜索方法、系统、设备和介质，一方面提升档案工作者、档案利用者从海量的声像档案视频数据中检索与某一目标人物相关的视频数据的效率，另一方面也提升了声像档案本身的被利用的价值。

本申请实施例中的技术方案，总体思路如下：

在介绍具体实施例之前，先介绍本申请实施例方法所对应的框架，如图1所示，大概分六个部分：视频切图服务、人脸检测服务、人脸特征信息库、关键人物信息库、检索服务和结果输出与展示，对海量的声像档案的视频数据进行切图处理形成多个图片，从图片中检测出人脸特征信息，建立人脸特征信息库，然后再创建关键人物信息库，输入检索条件进行检索服务，最后将检索结果输出并展示。

实施例一

本实施例提供一种基于人脸识别的声像档案搜索方法，如图2所示，包括如下步骤：

步骤1、对一声像档案中的每一个视频数据进行切图处理以切成一张一张图片，对每一张图片进行命名并依次存储至缓存目录中；该步骤具体为：

对声像档案中的每一个视频数据进行切图处理，按用户自行设定的播放帧率切成一张一张图片，以视频文件名加上该图片在视频文件中的播放时间点的形式对每一张图片进行命名，方便后期查找图片，并依次存储至缓存目录中；

步骤4、获取关键人物的基本信息及照片信息，根据关键人物的基本信息及照片信息建立关键人物信息库；该步骤具体为：

通过人工收集、梳理和核实方式获取关键人物的基本信息及照片信息，根据关键人物的基本信息及照片信息建立关键人物信息库；

步骤5、选择检索方式并输入，找到目标人物，提取该目标人物的人脸特征信息，根据该目标人物的人脸特征信息，在人脸特征库中进行比对，若匹配成功，则返回符合条件的条目信息；若匹配失败，则结束流程；该步骤具体为：

当选择的检索方式是目标人物的照片，则输入目标人物的照片，检索服务提取该照片中的人脸特征信息，根据该目标人物的人脸特征信息，在人脸特征库中进行比对，判断该目标人物的人脸特征信息与人脸特征库中的人脸特征信息是否匹配，若匹配，则说明人脸特征库中存在该目标人物对应的图片，返回符合条件的条目信息，返回的条目信息包括该目标人物的所有视频文件名、该目标人物在对应视频文件中的播放时间点、该目标人物的人脸坐标信息及该目标人物的人脸特征信息；若不匹配，则说明人脸特征库中不存在该目标人物对应的图片，结束流程；

步骤6、根据返回的条目信息找到与该目标人物相匹配的视频文件并输出，再播放相匹配的视频文件中与该目标人物相匹配的视频片段；该步骤具体为：

基于同一发明构思，本申请还提供了与实施例一中的方法对应的系统，详见实施例二。

实施例二

在本实施例中提供了一种基于人脸识别的声像档案搜索系统，如图3所示，包括：

视频切图模块，用于对一声像档案中的每一个视频数据进行切图处理以切成一张一张图片，对每一张图片进行命名并依次存储至缓存目录中；该步骤具体为：

人物建库模块，用于获取关键人物的基本信息及照片信息，根据关键人物的基本信息及照片信息建立关键人物信息库；该步骤具体为：

检索比对模块，用于选择检索方式并输入，找到目标人物，提取该目标人物的人脸特征信息，根据该目标人物的人脸特征信息，在人脸特征库中进行比对，若匹配成功，则返回符合条件的条目信息；若匹配失败，则结束流程；该步骤具体为：

视频播放模块，用于根据返回的条目信息找到与该目标人物相匹配的视频文件并输出，再播放相匹配的视频文件中与该目标人物相匹配的视频片段；该步骤具体为：

由于本发明实施例二所介绍的系统，为实施本发明实施例一的方法所采用的系统，故而基于本发明实施例一所介绍的方法，本领域所属人员能够了解该系统的具体结构及变形，故而在此不再赘述。凡是本发明实施例一的方法所采用的系统都属于本发明所欲保护的范围。

基于同一发明构思，本申请提供了实施例一对应的电子设备实施例，详见实施例三。

实施例三

本实施例提供了一种电子设备，如图4所示，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时，可以实现实施例一中任一实施方式。

由于本实施例所介绍的电子设备为实施本申请实施例一中方法所采用的设备，故而基于本申请实施例一中所介绍的方法，本领域所属技术人员能够了解本实施例的电子设备的具体实施方式以及其各种变化形式，所以在此对于该电子设备如何实现本申请实施例中的方法不再详细介绍。只要本领域所属技术人员实施本申请实施例中的方法所采用的设备，都属于本申请所欲保护的范围。

基于同一发明构思，本申请提供了实施例一对应的存储介质，详见实施例四。

实施例四

本实施例提供一种计算机可读存储介质，如图5所示，其上存储有计算机程序，该计算机程序被处理器执行时，可以实现实施例一中任一实施方式。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

虽然以上描述了本发明的具体实施方式，但是熟悉本技术领域的技术人员应当理解，我们所描述的具体的实施例只是说明性的，而不是用于对本发明的范围的限定，熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化，都应当涵盖在本发明的权利要求所保护的范围内。

Claims

1.一种基于人脸识别的声像档案搜索方法，其特征在于：包括如下步骤：

步骤3、将所有声像档案的视频数据重复步骤1和步骤2，根据每一个条目信息建立人脸特征库；

所述步骤5具体为：

当选择的检索方式是人名，则输入人名，检索服务根据该人名在关键人物信息库中查找符合条件的目标人物，找到该目标人物后提取该目标人物的照片信息中的人脸特征信息，根据该目标人物的人脸特征信息，在人脸特征库中进行比对，判断该目标人物的人脸特征信息与人脸特征库中的人脸特征信息是否匹配，若匹配，则说明人脸特征库中存在该目标人物对应的图片，返回符合条件的条目信息，返回的条目信息包括该目标人物的所有视频文件名、该目标人物在对应视频文件中的播放时间点、该目标人物的人脸坐标信息及该目标人物的人脸特征信息；若不匹配，则说明人脸特征库中不存在该目标人物对应的图片，结束流程；

2.如权利要求1所述的一种基于人脸识别的声像档案搜索方法，其特征在于：所述步骤1具体为：

3.如权利要求1所述的一种基于人脸识别的声像档案搜索方法，其特征在于：所述步骤4具体为：

4.如权利要求1所述的一种基于人脸识别的声像档案搜索方法，其特征在于：所述步骤6具体为：

5.一种基于人脸识别的声像档案搜索系统，其特征在于：包括：

人脸建库模块，用于将所有声像档案的视频数据重复执行视频切图模块和人脸检测模块，根据每一个条目信息建立人脸特征库；

检索比对模块，用于选择检索方式并输入，找到目标人物，提取该目标人物的人脸特征信息，根据该目标人物的人脸特征信息，在人脸特征库中进行比对，若匹配成功，则返回符合条件的条目信息；若匹配失败，则结束流程；该模块具体为：

6.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至4任一项所述的方法。

7.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1至4任一项所述的方法。