CN112766176B - 轻量化卷积神经网络的训练方法及人脸属性识别方法 - Google Patents
轻量化卷积神经网络的训练方法及人脸属性识别方法 Download PDFInfo
- Publication number
- CN112766176B CN112766176B CN202110085271.1A CN202110085271A CN112766176B CN 112766176 B CN112766176 B CN 112766176B CN 202110085271 A CN202110085271 A CN 202110085271A CN 112766176 B CN112766176 B CN 112766176B
- Authority
- CN
- China
- Prior art keywords
- face attribute
- channel
- feature
- layer
- feature map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 112
- 238000012549 training Methods 0.000 title claims abstract description 89
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000009467 reduction Effects 0.000 claims abstract description 131
- 230000004927 fusion Effects 0.000 claims abstract description 89
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 44
- 238000000926 separation method Methods 0.000 claims abstract description 43
- 238000012545 processing Methods 0.000 claims description 44
- 238000011176 pooling Methods 0.000 claims description 31
- 238000010586 diagram Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012935 Averaging Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 8
- 238000003491 array Methods 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 6
- 238000010606 normalization Methods 0.000 description 6
- 210000002569 neuron Anatomy 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 210000001508 eye Anatomy 0.000 description 2
- 210000004709 eyebrow Anatomy 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 210000001747 pupil Anatomy 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Molecular Biology (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及图像识别技术领域,提供一轻量化卷积神经网络的训练方法及人脸属性识别方法,训练方法包括:采集人脸属性数据集;构建卷积神经网络,所述卷积神经网络包括特征降维结构、通道混合结构及特征分类结构,所述特征分类结构包括通道分隔算法层;将所述人脸属性数据进行标准卷积,处理后得到的人脸属性特征图输入到所述特征降维结构进行特征降维训练;将训练输出的所述人脸属性降维特征图输入到所述通道混合结构进行各通道间维度的融合;将输出的人脸属性通道融合特征图输入到所述通道分隔算法层对通道维度进行拆分,并根据拆分结果设置全连接层,以得到目标卷积神经网络模型。本发明能够提高属性识别准确率,且自身参数小,运行速度快。
Description
技术领域
本发明涉及图像识别技术领域,尤其涉及一种轻量化卷积神经网络的训练方法及人脸属性识别方法。
背景技术
近年来,人脸属性识别在多个领域中越来越得到广泛的应用,准确、高效的人脸属性识别结果在协助执法人员侦破案件、改进人机交互体验等方面有重要的辅助作用。
在基于卷积神经网络的多类别识别中,如何提高各个类别间有用信息的高效共享、降低无效信息的干扰始终是一个有待解决的技术问题。通常而言,在标准卷积中,卷积核与图像像素值的矩阵运算是在各个通道上同时进行的,但是在采用分组卷积后,各通道上的卷积核与图像像素值的矩阵运算则在各自通道上进行,即各通道间的信息交流是阻塞的,这将有利于维持某种人脸属性的特征。但是通道间信息持续的阻塞将会对最终用于判别各类属性信息的总特征产生不利影响,会对多类别人脸属性的识别结果的准确度造成影响。可见,现有技术中存在,识别结果的准确率低的问题。
发明内容
本发明实施例提供一种轻量化卷积神经网络的训练方法,能够提高属性识别结果的准确度,并降低构建模型参数,提高模型的运行速度。
第一方面,本发明实施例提供一种轻量化卷积神经网络的训练方法,所述方法包括以下步骤:
采集人脸属性数据集,所述人脸属性数据集中包括人脸属性数据;
构建卷积神经网络,所述卷积神经网络包括特征降维结构、通道混合结构及特征分类结构,所述特征分类结构包括通道分隔算法层;
将所述人脸属性数据集中的所述人脸属性数据进行标准卷积,并将标准卷积处理后得到的人脸属性特征图输入到所述特征降维结构进行特征降维训练,以输出人脸属性降维特征图;
将所述人脸属性降维特征图输入到已构建的所述通道混合结构进行各通道间维度的融合,输出人脸属性通道融合特征图;
将所述人脸属性通道融合特征图输入到所述特征分类结构,通过所述通道分隔算法层对通道维度进行拆分,并根据拆分结果设置全连接层,以得到目标卷积神经网络模型。
第二方面,本发明实施例提供一种人脸属性识别方法,包括步骤:
获取待检测数据,所述待检测数据包括人脸属性数据;
将所述待检测数据中的所述人脸属性数据输入到任一实施例中所述的目标卷积神经网络模型进行人脸属性识别;
将人脸属性识别结果进行输出。
第三方面,本发明实施例提供一种轻量化卷积神经网络的训练装置,包括:
采集模块,用于采集人脸属性数据集,所述人脸属性数据集中包括人脸属性数据;
构建模块,用于构建卷积神经网络,所述卷积神经网络包括特征降维结构、通道混合结构及特征分类结构,所述特征分类结构包括通道分隔算法层;
特征降维模块,用于将所述人脸属性数据集中的所述人脸属性数据进行标准卷积,并将标准卷积处理后得到的人脸属性特征图输入到所述特征降维结构进行特征降维训练,以输出人脸属性降维特征图;
通道融合模块,用于将所述人脸属性降维特征图输入到已构建的所述通道混合结构进行各通道间维度的融合,输出人脸属性通道融合特征图;
特征分类模块,用于将所述人脸属性通道融合特征图输入到所述特征分类结构,通过所述通道分隔算法层对通道维度进行拆分,并根据拆分结果设置全连接层,以得到目标卷积神经网络模型。
第四方面,本发明实施例提供一种人脸属性识别装置,包括:
获取模块,用于获取待检测数据,所述待检测数据包括人脸属性数据;
识别模块,用于将所述待检测数据中的所述人脸属性数据输入到任一实施例中所述的目标卷积神经网络模型进行人脸属性识别;
输出模块,用于将人脸属性识别结果进行输出。
第五方面,本发明实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述任一实施例提供的轻量化卷积神经网络的训练方法中的步骤。
第六方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述任一实施例提供的轻量化卷积神经网络的训练方法中的步骤。
在本发明实施例中,通过采集人脸属性数据集,所述人脸属性数据集中包括人脸属性数据;构建卷积神经网络,所述卷积神经网络包括特征降维结构、通道混合结构及特征分类结构,所述特征分类结构包括通道分隔算法层;将所述人脸属性数据集中的所述人脸属性数据进行标准卷积,并将标准卷积处理后得到的人脸属性特征图输入到所述特征降维结构进行特征降维训练,以输出人脸属性降维特征图;将所述人脸属性降维特征图输入到已构建的所述通道混合结构进行各通道间维度的融合,输出人脸属性通道融合特征图;将所述人脸属性通道融合特征图输入到所述特征分类结构,通过所述通道分隔算法层对通道维度进行拆分,并根据拆分结果设置全连接层,以得到目标卷积神经网络模型。由于本发明构建的特征分类结构中构建了通道分隔算法层,通过所述通道分隔算法层对人脸属性通道融合特征图可以进行通道维度拆分,有利于把融合了多个属性的特征重新分配给多个属性任务以支持其最后的决策分类,使得多类属性的提取更加细化的特征以支持各属性任务的判别,得到的目标卷积神经网络模型能够提高人脸属性识别的准确率;同时构建的卷积神经网络网络结构自身的参数量小,能够提高运行速度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种轻量化卷积神经网络的训练方法的流程图;
图2是本发明实施例提供的另一种轻量化卷积神经网络的训练方法的流程图;
图2a是本发明实施例提供的采集人脸属性数据集的流程图;
图2b是本发明实施例提供的特征降维结构处理的流程图;
图3是本发明实施例提供的另一种轻量化卷积神经网络的训练方法的流程图;
图3a是本发明实施例提供的通道混合结构处理的流程图;
图3b是本发明实施例提供的特征分类结构处理的流程图;
图4是本发明实施例提供的一种轻量化卷积神经网络的训练装置的结构示意图;
图5是本发明实施例提供的另一种轻量化卷积神经网络的训练装置的结构示意图;
图6是本发明实施例提供的另一种轻量化卷积神经网络的训练装置的结构示意图;
图7是本发明实施例提供的另一种轻量化卷积神经网络的训练装置的结构示意图;
图8是本发明实施例提供的另一种轻量化卷积神经网络的训练装置的结构示意图;
图9是本发明实施例提供的另一种轻量化卷积神经网络的训练装置的结构示意图;
图10是本实施例提供的一种人脸属性识别方法的流程图;
图11是本实施例提供的一种人脸属性识别装置的结构示意图;
图12是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请的说明书和权利要求书及附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
如图1所示,图1是本发明实施例提供的一种轻量化卷积神经网络的训练方法的流程图,该轻量化卷积神经网络的训练方法包括以下步骤:
101、采集人脸属性数据集,人脸属性数据集中包括人脸属性数据。
在本实施例中,所提供的轻量化卷积神经网络的训练方法可以是多类别人脸属性识别,且可以运用在案件侦查、人员检测、人机交互体验等场景中。针对使用卷积神经网络方法构建多任务分类模型,均可以使用本发明提供的轻量化卷积神经网络的训练方法。上述轻量化卷积神经网络的训练方法运行于其上的电子设备可以通过有线连接方式或者无线连接方式进行网络连接,实现对人脸属性数据的采集以及通信传输。上述无线连接方式可以包括但不限于3G/4G连接、WiFi(Wireless-Fidelity)连接、蓝牙连接、WiMAX(Worldwide Interoperability for Microwave Access)连接、Zigbee(低功耗局域网协议,又称紫峰协议)连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
其中,人脸属性数据集中,包括有多种类型的人脸属性数据,例如:胡子、眉毛、眼睛、瞳孔等。采集方式可以是通过摄像头进行视频录制,对视频数据进行视频帧图像进行提取,也可以是使用已经离线获取到的人脸属性数据,还可以是实时采集。采集到的人脸属性数据集中可以包括多种类型的子分类数据集,也即是可以对不同类型的数据进行分别存储,便于区分识别。
102、构建卷积神经网络,卷积神经网络包括特征降维结构、通道混合结构及特征分类结构,特征分类结构包括通道分隔算法层。
其中,卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。由于CNN避免了对图像的复杂前期预处理,可以直接输入原始图像,因此特别是在模式分类识别等领域有着广泛的运用。
在构建卷积神经网络时,可以包括构建三个部分:分别为特征降维结构、通道混合结构及特征分类结构,且在特征分类结构中构建通道分隔算法层。其中,上述的特征降维结构可以用于提升特征的通道;上述通道混合结构可以用于进行各通道间特征信息的融合;上述特征分类结构可以用于按通道维度对融合后得到的结果进行拆分。因人脸属性识别相对人形属性识别而言,人脸的各个属性任务具有更加明确的属性间的相关性或者无关性,例如:胡子与性别。通道分隔算法在通道维度上的拆分,有利于把融合各属性的特征重新分配给每个具体的属性任务以支持其最后的决策分类。
103、将人脸属性数据集中的人脸属性数据进行标准卷积,并将标准卷积处理后得到的人脸属性特征图输入到特征降维结构进行特征降维训练,以输出人脸属性降维特征图。
其中,上述进行标准卷积可以是输入到第一标准卷积层进行卷积。卷积核为3×3的卷积,在进行特征降维处理前进行一次标准卷积可以提升输入图像(人脸属性数据)的通道数。对输入图像进行卷积核为3×3的标准卷积后,可以输出人脸属性特征图到特征降维结构中进行特征降维处理。特征降维结构包括有多个层次,并且在进行特征降维处理的过程中,需要反复多次执行,例如:执行3次。上一次特征降维结构的输出可以作为下一次特征降维结构的输入。经过多次特征降维操作后,最终可以输出人脸属性降维特征图,且输出后的人脸属性降维特征图的通道数得到了提升,例如:将人脸属性降维特征图的特征维度由1×1的标准卷积经48通道提升为96通道。
104、将人脸属性降维特征图输入到已构建的通道混合结构进行各通道间维度的融合,输出人脸属性通道融合特征图。
其中,完成通道提升后,可以将人脸属性降维特征图继续输入到通道混合结构中。此时,通道混合结构可以将已提升通道的人脸属性降维特征图进行各通道之间的特征融合。上述的通道融合结构同样可以包括多个层次,且进行多次的通道融合结构处理,在本实施例中,通道融合结构设置有3次,即通过通道混合结构对人脸属性降维特征图进行3次各通道间维度的融合。此时输出的人脸属性通道融合特征图中的每个通道中融合了其他各个通道中的特征。
具体的,上述通道混合结构中采用的通道混合算法原理为:假设输入m组特征,每组特征的通道数为n,先将每组特征reshape(重组)为m×n的特征图F1,特征图F1的每行特征对应原始m组特征中的某一组,然后对特征图F1进行转置运算,得到特征图F2,则在特征图F2中的每列对应原始m组特征中的某一组,最后对特征图F2重新按行拆分为m组,该m组中的特征向量就包括了原始输入的m组中每组的特征信息,从而实现各通道之间的特征融合。
105、将人脸属性通道融合特征图输入到特征分类结构,通过通道分隔算法层对通道维度进行拆分,并根据拆分结果设置全连接层,以得到目标卷积神经网络模型。
其中,上述的特征分类结构可以实现对特征进行拆分,将拆分后得到的结果分配到各属性任务中。其属性任务可以是用于对接收到的结果进行分类识别所创建的任务。其中,特征分类结构可以包括有多个层次,每个层次执行不同的功能。特别的,在特征分类结构中构建了通道分离算法层。通道分离算法层可以按照通道维度对人脸属性通道融合特征图进行拆分,然后可以根据拆分结果输出到多个全连接层,对全连接层分类器进行设置,最终输出的模型为目标卷积神经网络模型,以进行人脸属性类别预测。
其中,上述的全连接层的每一个结点都与上一层的所有结点相连,用来把前边提取到的特征属性综合起来。在CNN结构中,经多个卷积层和池化层后,连接着1个或1个以上的全连接层。全连接层中的每个神经元与其前一层的所有神经元进行全连接。全连接层可以整合卷积层或者池化层中具有类别区分性的特征属性。为了提升CNN网络性能,全连接层每个神经元的激励函数可以采用ReLU函数。全连接层的最后一层输出值被传递给一个输出,该输出值也即是上述人脸属性类别预测的值,且可以采用softmax逻辑回归(softmaxregression)进行分类,当然还可以是其他分类方式。多个全连接层可以标识序号进行区分,例如:将全连接层标记为全连接层1、全连接层2,…,全连接层n。
在本发明实施例中,通过采集人脸属性数据集,人脸属性数据集中包括人脸属性数据;构建卷积神经网络,卷积神经网络包括特征降维结构、通道混合结构及特征分类结构,特征分类结构包括通道分隔算法层;将人脸属性数据集中的人脸属性数据进行标准卷积,并将标准卷积处理后得到的人脸属性特征图输入到特征降维结构进行特征降维训练,以输出人脸属性降维特征图;将人脸属性降维特征图输入到已构建的通道混合结构进行各通道间维度的融合,输出人脸属性通道融合特征图;将人脸属性通道融合特征图输入到特征分类结构,通过通道分隔算法层对通道维度进行拆分,并根据拆分结果设置全连接层,以得到目标卷积神经网络模型。由于本发明构建的特征分类结构中构建了通道分隔算法层,通过通道分隔算法层对人脸属性通道融合特征图可以进行通道维度拆分,有利于把融合了多个属性的特征重新分配给多个属性任务以支持其最后的决策分类,使得多类属性的提取更加细化的特征以支持各属性任务的判别,得到的目标卷积神经网络模型能够提高人脸属性识别的准确率;同时构建的卷积神经网络网络结构自身的参数量小,能够提高运行速度。
如图2所示,图2是本发明实施例提供的另一种轻量化卷积神经网络的训练方法的流程图,具体包括以下步骤:
201、采集人脸属性数据集,人脸属性数据集中包括人脸属性数据。
其中,可以通过图像采集设备采集行人数据,然后提取出行人的人脸属性数据对应的人脸属性数据,将所采集到多个人的人脸属性数据进行分类集合,以生成人脸属性数据集。
可选的,参照图2a所示,步骤201具体可以包括:
通过图像采集设备获取视频数据,并对视频数据进行视频帧抽取。
其中,图像采集设备可以是摄像头,或者是带有摄像头的相机等等可以实现图像采集的电子设备。上述的视频数据中可以包括有行人、道路等图像数据。视频由一帧一帧的图像组成,因此可以采取视频帧抽取的方式实现对需要抓取的图像数据进行抓取。
识别视频帧中的行人,并对行人的行人属性图像进行标记,行人属性图像包括人脸属性数据。
其中,抽取出视频帧后,可以对视频帧进行识别,检测出视频帧中的行人。该行人可以是上层锁定的需要标记的行人。同时会对视频帧中该行人的行人属性进行标记,具体的,可以是对行人属性中的人脸属性进行标记(标记需要的行人属性),例如:对鼻子、眼睛、嘴巴、眉毛、脸颊等人脸属性进行标记。标记可以是机器自动标记,也可以是标记人员进行标记。
对标记后的人脸属性数据进行划分,得到人脸属性数据集。
其中,完成标记之后,可以将不同类型的人脸属性数据进行分类,将每一类的人脸属性数据作为一个类,这样便会得到多个类,将所有类汇集起来便得到上述的人脸属性数据集。且在人脸属性数据集中,可以将其不同的类划分为训练集、验证集以及测试集。在本实施例的CNN模型中,将人脸属性数据极划分训练集、验证集和测试集,可以实现在训练集上训练模型,在验证集上评估模型,且考虑到需要对CNN模型的层数、每层的神经元个数进行参数设置,当一旦找到的最佳的参数,就可以在测试集上最后测试一次,测试集上的误差作为泛化误差的近似,使CNN模型具有更强的识别能力。
202、构建卷积神经网络,卷积神经网络包括特征降维结构、通道混合结构及特征分类结构,特征分类结构包括通道分隔算法层。
203、将人脸属性数据集中的人脸属性数据进行标准化处理。
其中,进行标准化处理可以包括对人脸属性数据的大小进行标准处理,在本实施例中,上述输入到特征降维结构中的人脸属性数据的大小需要标准化为112×112,也即是图像的分辨率大小。
204、将标准化处理后的人脸属性数据通过预设的第一标准卷积层进行标准卷积计算,得到人脸属性特征图。
其中,得到112×112的人脸属性数据后,将其经过一层卷积核为3×3的标准卷积运算,以提升其通道数。上述第一标准卷积层输出的通道数可以为特征降维结构中第一层的第一分组卷积层的分组数的整数倍。经过第一标准卷积层进行通道提升后,输出的特征图为上述的人脸属性特征图。在本实施例中,以12为例,经过上述第一标准卷积层进行标准卷积后输出人脸属性特征图为12通道,且分辨率为112×112。
205、将人脸属性特征图输入到特征降维结构进行多次特征降维训练,以输出人脸属性降维特征图。
在本实施例中,上述特征降维结构可以包括3层,进行多次特征降维训练也即是进行3次特征降维训练。上一层的输出作为下一层的输入,完成3层特征降维之后输出人脸属性降维特征图到通道融合结构中作为输入。
可选的,参考图2b所示,特征降维结构包括第一分组卷积层、第二标准卷积层与第一平均池化层,上述步骤205具体包括:
将人脸属性特征图依次输入到第一分组卷积层、第二标准卷积层及第一平均池化层进行特征降维训练;并重复执行将人脸属性特征图依次输入到第一分组卷积层、第二标准卷积层及第一平均池化层进行特征降维训练的步骤,直到输出人脸属性降维特征图。
其中,上述特征降维结构包括第一分组卷积层、1×1的第二标准卷积层及第一平均池化层。重复执行3次将人脸属性特征图依次输入到第一分组卷积层、第二标准卷积层及第一平均池化层进行特征降维训练之后,便可以输出上述人脸属性降维特征图。其中,人脸属性特征图作为1×1的第二标准卷积层的输入图像,进行卷积操作后可以用于提升输入图像的特征维度,且每次输出的特征维度数设为24、48、96,且第二标准卷积层输出的通道数为特征降维结构中第一分组卷积层的分组数的整数倍,因此每次分组数为12,24,48。输出的人脸属性降维特征图的特征维度由1×1的标准卷积经48通道提升为96通道,每个通道上的特征图的分辨率是14×14,也即是人脸属性降维特征图输出为96×14×14。
206、将人脸属性降维特征图输入到已构建的通道混合结构进行各通道间维度的融合,输出人脸属性通道融合特征图。
207、将人脸属性通道融合特征图输入到特征分类结构,通过通道分隔算法层对通道维度进行拆分,并根据拆分结果设置全连接层,以得到目标卷积神经网络模型。
在本实施例中,对输入的人脸属性数据的大小进行标准化处理后经过一层卷积核为3×3的第一标准卷积层可以提升通道数;并且经过多次的特征降维结构处理后实现了通道提升。此外,在特征降维结构中构建第一分组卷积层、1×1的第二标准卷积层及第一平均池化层,通过第一分组卷积层可以控制多个属性任务自身特征的独立性,并且使用1×1的卷积核可以控制信息间的共享。
如图3所示,图3是本发明实施例提供的另一种轻量化卷积神经网络的训练方法的流程图,具体包括以下步骤:
301、采集人脸属性数据集,人脸属性数据集中包括人脸属性数据。
302、构建卷积神经网络,卷积神经网络包括特征降维结构、通道混合结构及特征分类结构,特征分类结构包括通道分隔算法层。
303、将人脸属性数据集中的人脸属性数据进行标准卷积,并将标准卷积处理后得到的人脸属性特征图输入到特征降维结构进行特征降维训练,以输出人脸属性降维特征图。
304、通道混合结构包括多层第二分组卷积层以及通道混合层,将人脸属性降维特征图依次输入到多层第二分组卷积层,以依次提取人脸属性降维特征图的人脸属性特征,通过通道混合层对人脸属性特征进行各通道间维度的融合。
在本实施例中,参考图3a所示,通道混合结构共设置有3组,在每一组通道混合结构中构建有2层第二分组卷积层以及1层通道混合层,2组第二分组卷积层对应的分组数一致,均设置为12组。上述人脸属性降维特征图输出为96×14×14作为通道混合结构的输入图像,且首先输入到通道混合结构第一层的第二分组卷积层,第一层的第二分组卷积层的输出作为第二层的第二分组卷积层的输入,通过2层分组卷积可以用于提取各组组内的特征信息,且这些特征信息可以是没有组间信息共享的信息。上述第二层的第二分组卷积层的输出作为通道混合层的输入,可以对相对独立的各组信息进行通道维度上的混合,以实现通道间的信息共享。此外,为了避免在训练过程中出现梯度消失的问题,在通道混合结构中可以设置有残差支路。
305、重复执行将人脸属性降维特征图依次输入到多层第二分组卷积层,以依次提取人脸属性降维特征图的人脸属性特征,通过通道混合层对人脸属性特征进行各通道间维度的融合的步骤,直到输出人脸属性通道融合特征图。
其中,第一层通道混合层的输出作为第二组通道混合结构中的第一层的第二分组卷积层的输出,依次执行,直到完成3组通道混合结构的训练,最后输出人脸属性通道融合特征图。
306、特征分类结构还包括第三分组卷积层与第二平均池化层,将人脸属性通道融合特征图输入到第二平均池化层,降低人脸属性通道融合特征图的分辨率。
其中,参考图3b所示,特征分类结构中除了通道分隔算法层之外,还包括第三分组卷积层与第二平均池化层。人脸属性通道融合特征图作为第二平均池化层的输入图像,通过一层第二平均池化层处理以降低其分辨率。
307、将降低分辨率后的人脸属性通道融合特征图输入第三分组卷积层进行分组卷积处理,重新将通道间维度融合后的人脸属性通道融合特征图拆分给多个属性识别任务。
308、通过通道分隔算法层对分组卷积处理后的人脸属性通道融合特征图在通道维度上进行拆分,并根据拆分结果设置全连接层,以得到目标卷积神经网络模型。
其中,在第三分组卷积层之后设置有通道分离算法层,可以把分组卷积的结果按通道维度进行拆分。具体的,分组卷积处理后的人脸属性通道融合特征图为一堆数组,且包括有多个通道维度,每个维度可以表示不同的参数,例如:第一维度为图片数量,第二维度为分组卷积输出的层数,第三维度为图片的长,第四维度为图片的宽,其分组卷积后的每一层上都有数组。上述通过通道分隔算法对人脸属性通道融合特征图根据通道维度进行拆分可以是指将一堆完整的数组在不同的通道维度上进行拆分,完整的数组可以是一个立方体数组。拆分之后会得到多个拆分结果,每个拆分结果中包含完整数组中的部分数据,例如:对完整的数组按照指定拆分方向以及指定拆分维度数进行拆分,当一个完整的数组有6层,指定按一层一层切分则得到6个数组;指定两层两层进行拆分得到3个数组,指定三层三层切分得到2个数组。其中,进行拆分时,指定拆分方向以及指定拆分维度在模型训练时预先设置,可以是横向拆分、纵向拆分等。且每个拆分结果对应一个全连接层,全连接层可以根据对应的拆分结果设置全连接层的分类器,
具体的,通道分隔算法层在通道维度上对分组卷积处理后的人脸属性通道融合特征图的拆分,有利于把融合各属性的人脸属性特征重新分配给每个具体的属性任务。考虑到完整的数组中并非每一个维度上的数据都会对每一个具体的属性任务起到有效作用,因此进行通道维度上的拆分。且拆分后的拆分结果中包括多个数组,每个拆分后的数组可以对应到一个具体的属性任务,无需受到完整的数组中其他不相关的数据的干扰。最后,可以针对各个通道分隔的结果和属性任务设置多个全连接层分类器,最终得到识别准确率更高的目标卷积神经网络模型。目标卷积神经网络模型以实现人脸属性类别预测,经过数据测试,在自行构建的7类人脸属性的测试集上,可以实现92%的平均识别准确率。
在本发明实施例中,通过在通道混合结构中设置两层第二分组卷积层以及通道混合层,对人脸属性降维特征图中的各特征进行融合,实现人脸属性信息间的共享。此外,在特征分类结构中还构建第三分组卷积层与第二平均池化层,通过第二平均池化层降低人脸属性通道融合特征图的分辨率,输入到第三分组卷积层,重新将通道间维度融合后的人脸属性通道融合特征图拆分,并且在第三分组卷积层之后设置有通道分离算法层,可以把分组卷积的结果按通道维度进行拆分,最终分配给多个属性识别任务,有利于把融合各属性的人脸属性特征重新分配给每个具体的属性任务以支持其最后的决策分类,使得多类属性的提取更加细化的特征以支持各属性任务的判别,得到的目标卷积神经网络模型可以提高属性识别的准确率;同时构建的卷积神经网络网络结构自身的参数量小,运行速度快。
如图4所示,图4是本发明实施例提供的一种轻量化卷积神经网络的训练装置的结构示意图,轻量化卷积神经网络的训练装置400包括:
采集模块401,用于采集人脸属性数据集,人脸属性数据集中包括人脸属性数据;
构建模块402,用于构建卷积神经网络,卷积神经网络包括特征降维结构、通道混合结构及特征分类结构,特征分类结构包括通道分隔算法层;
特征降维模块403,用于将人脸属性数据集中的人脸属性数据进行标准卷积,并将标准卷积处理后得到的人脸属性特征图输入到特征降维结构进行特征降维训练,以输出人脸属性降维特征图;
通道融合模块404,用于将人脸属性降维特征图输入到已构建的通道混合结构进行各通道间维度的融合,输出人脸属性通道融合特征图;
特征分类模块405,用于将人脸属性通道融合特征图输入到特征分类结构,通过通道分隔算法层对通道维度进行拆分,并根据拆分结果设置全连接层,以得到目标卷积神经网络模型。
可选的,如图5所示,图5是本发明实施例提供的另一种轻量化卷积神经网络的训练装置的结构示意图,采集模块401包括:
获取单元4011,用于通过图像采集设备获取视频数据,并对视频数据进行视频帧抽取;
标记单元4012,用于识别视频帧中的行人,并对行人的行人属性图像进行标记,行人属性图像包括人脸属性数据;
划分单元4013,用于对标记后的人脸属性数据进行划分,得到人脸属性数据集。
可选的,如图6所示,图6是本发明实施例提供的另一种轻量化卷积神经网络的训练装置的结构示意图,特征降维模块403包括:
标准化处理单元4031,用于将人脸属性数据集中的人脸属性数据进行标准化处理;
通道卷积单元4032,用于将标准化处理后的人脸属性数据通过预设的第一标准卷积层进行标准卷积计算,得到人脸属性特征图;
降维训练单元4033,用于将人脸属性特征图输入到特征降维结构进行多次特征降维训练,以输出人脸属性降维特征图。
可选的,特征降维结构包括第一分组卷积层、第二标准卷积层与第一平均池化层,如图7所示,图7是本发明实施例提供的另一种轻量化卷积神经网络的训练装置的结构示意图,降维训练单元4033包括:
降维训练子单元40331,用于将人脸属性特征图依次输入到第一分组卷积层、第二标准卷积层及第一平均池化层进行特征降维训练;
重复降维子单元40332,用于并重复执行将人脸属性特征图依次输入到第一分组卷积层、第二标准卷积层及第一平均池化层进行特征降维训练的步骤,直到输出人脸属性降维特征图。
可选的,通道混合结构包括多层第二分组卷积层以及通道混合层,如图8所示,图8是本发明实施例提供的另一种轻量化卷积神经网络的训练装置的结构示意图,通道融合模块404包括:
提取单元4041,用于将人脸属性降维特征图依次输入到多层第二分组卷积层,以依次提取所述人脸属性降维特征图的人脸属性特征,通过通道混合层对人脸属性特征进行各通道间维度的融合,其中,多层第二分组卷积层对应的分组数一致;
重复融合单元4042,用于并重复执行将人脸属性降维特征图依次输入到多层第二分组卷积层,以依次提取所述人脸属性降维特征图的人脸属性特征,通过通道混合层对人脸属性特征进行各通道间维度的融合的步骤,直到输出人脸属性通道融合特征图。
可选的,特征分类结构还包括第三分组卷积层与第二平均池化层,如图9所示,图9是本发明实施例提供的另一种轻量化卷积神经网络的训练装置的结构示意图,特征分类模块405包括:
分辨率处理单元4051,用于将人脸属性通道融合特征图输入到第二平均池化层,降低人脸属性通道融合特征图的分辨率;
分配单元4052,用于将降低分辨率后的人脸属性通道融合特征图输入第三分组卷积层进行分组卷积处理,重新将通道间维度融合后的人脸属性通道融合特征图拆分给多个属性识别任务;
维度拆分单元4053,用于通过通道分隔算法层对分组卷积处理后的人脸属性通道融合特征图在通道维度上进行拆分。
本发明实施例提供的一种轻量化卷积神经网络的训练装置能够实现轻量化卷积神经网络的训练方法实施例中的各个实施方式,以及相应有益效果,为避免重复,这里不再赘述。
如图10所示,图10为本实施例提供的一种人脸属性识别方法的流程图,一种人脸属性识别方法,包括步骤:
1001、获取待检测数据,待检测数据包括人脸属性数据。
其中,上述的待检测数据可以是通过摄像头采集到的行人数据,也可以是上层输入的行人数据。待检测数据可以是人脸图像,人脸图像可以包括有多个人脸属性。
1002、将待检测数据中的人脸属性数据输入到上述任一实施例中的目标卷积神经网络模型进行人脸属性识别。
其中,目标卷积神经网络模型为已经训练完成的具有高识别率的模型,将待检测数据输入到上述任一实施例中的目标卷积神经网络模型进行人脸属性识别,可以对待检测数据的人脸属性进行细致的分析,判断出对应待检测数据的行人是否为需要查找的行人。
1003、将人脸属性识别结果进行输出。
其中,将人脸属性识别结果输出后,便可以判断出对应待检测数据的行人是否为需要查找的行人。
本发明实施例提供的一种人脸属性识别方法能够运用上述提供的一种轻量化卷积神经网络的训练方法,且能够实现轻量化卷积神经网络的训练方法实施例中的各个实施方式以及相应有益效果,为避免重复,这里不再赘述。
如图11所示,图11为本实施例提供的一种人脸属性识别装置的流程图,一种人脸属性识别装置1100,包括:
获取模块1101,用于获取待检测数据,待检测数据包括人脸属性数据;
识别模块1102,用于将待检测数据中的人脸属性数据输入到任一实施例中的目标卷积神经网络模型进行人脸属性识别;
输出模块1103,用于将人脸属性识别结果进行输出。
如图12所示,图12是本发明实施例提供的一种电子设备的结构示意图,该电子设备1200包括:处理器1201、存储器1202、网络接口1203及存储在存储器1202上并可在处理器1201上运行的计算机程序,处理器1201执行计算机程序时实现实施例提供的轻量化卷积神经网络的训练方法中的步骤。
具体的,处理器1201用于执行以下步骤:
采集人脸属性数据集,人脸属性数据集中包括人脸属性数据;
构建卷积神经网络,卷积神经网络包括特征降维结构、通道混合结构及特征分类结构,特征分类结构包括通道分隔算法层;
将人脸属性数据集中的人脸属性数据进行标准卷积,并将标准卷积处理后得到的人脸属性特征图输入到特征降维结构进行特征降维训练,以输出人脸属性降维特征图;
将人脸属性降维特征图输入到已构建的通道混合结构进行各通道间维度的融合,输出人脸属性通道融合特征图;
将人脸属性通道融合特征图输入到特征分类结构,通过通道分隔算法层对通道维度进行拆分,并根据拆分结果设置全连接层,以得到目标卷积神经网络模型。
可选的,处理器1201执行的采集人脸属性数据集的步骤包括:
通过图像采集设备获取视频数据,并对视频数据进行视频帧抽取;
识别视频帧中的行人,并对行人的行人属性图像进行标记,行人属性图像包括人脸属性数据;
对标记后的人脸属性数据进行划分,得到人脸属性数据集。
可选的,处理器1201执行的将人脸属性数据集中的人脸属性数据进行标准卷积,并将标准卷积处理后得到的人脸属性特征图输入到特征降维结构进行特征降维训练的步骤包括:
将人脸属性数据集中的人脸属性数据进行标准化处理;
将标准化处理后的人脸属性数据通过预设的第一标准卷积层进行标准卷积计算,得到人脸属性特征图;
将人脸属性特征图输入到特征降维结构进行多次特征降维训练,以输出人脸属性降维特征图。
可选的,特征降维结构包括第一分组卷积层、第二标准卷积层与第一平均池化层,处理器1201执行的将人脸属性特征图输入到特征降维结构进行多次特征降维训练的步骤包括:
将人脸属性特征图依次输入到第一分组卷积层、第二标准卷积层及第一平均池化层进行特征降维训练;
并重复执行将人脸属性特征图依次输入到第一分组卷积层、第二标准卷积层及第一平均池化层进行特征降维训练的步骤,直到输出人脸属性降维特征图。
可选的,通道混合结构包括多层第二分组卷积层以及通道混合层,处理器1201执行的将人脸属性降维特征图输入到已构建的通道混合结构进行各通道间维度的融合的步骤包括:
将人脸属性降维特征图依次输入到多层第二分组卷积层,以依次提取所述人脸属性降维特征图的人脸属性特征,通过通道混合层对人脸属性特征进行各通道间维度的融合,其中,多层第二分组卷积层对应的分组数一致;
并重复执行将人脸属性降维特征图依次输入到多层第二分组卷积层,以依次提取所述人脸属性降维特征图的人脸属性特征,通过通道混合层对人脸属性特征进行各通道间维度的融合的步骤,直到输出人脸属性通道融合特征图。
可选的,特征分类结构还包括第三分组卷积层与第二平均池化层,处理器1201执行的将人脸属性通道融合特征图输入到特征分类结构,通过通道分隔算法层对通道维度进行拆分的步骤包括:
将人脸属性通道融合特征图输入到第二平均池化层,降低人脸属性通道融合特征图的分辨率;
将降低分辨率后的人脸属性通道融合特征图输入第三分组卷积层进行分组卷积处理,重新将通道间维度融合后的人脸属性通道融合特征图拆分给多个属性识别任务;
通过通道分隔算法层对分组卷积处理后的人脸属性通道融合特征图在通道维度上进行拆分。
本发明实施例提供的电子设备1200能够实现轻量化卷积神经网络的训练方法实施例中的各个实施方式,以及相应有益效果,为避免重复,这里不再赘述。
需要指出的是,图中仅示出了具有组件的1201-1203,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的电子设备1200是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable GateArray,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
存储器1202至少包括一种类型的可读存储介质,可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器1202可以是电子设备1200的内部存储单元,例如该电子设备1200的硬盘或内存。在另一些实施例中,存储器1202也可以是电子设备1200的外部存储设备,例如该电子设备1200上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器1202还可以既包括电子设备1200的内部存储单元也包括其外部存储设备。本实施例中,存储器1202通常用于存储安装于电子设备1200的操作系统和各类应用软件,例如轻量化卷积神经网络的训练方法的程序代码等。此外,存储器1202还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器1201在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器1201通常用于控制电子设备1200的总体操作。本实施例中,处理器1201用于运行存储器1202中存储的程序代码或者处理数据,例如运行轻量化卷积神经网络的训练方法的程序代码。
网络接口1203可包括无线网络接口或有线网络接口,该网络接口1203通常用于在电子设备1200与其他电子设备之间建立通信连接。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器1201执行时实现实施例提供的轻量化卷积神经网络的训练方法中的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本领域普通技术人员可以理解实现实施例轻量化卷积神经网络的训练方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如各方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存取存储器(RandomAccess Memory,简称RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (8)
1.一种轻量化卷积神经网络的训练方法,其特征在于,包括以下步骤:
采集人脸属性数据集,所述人脸属性数据集中包括人脸属性数据;
构建卷积神经网络,所述卷积神经网络包括特征降维结构、通道混合结构及特征分类结构,所述特征分类结构包括通道分隔算法层;
将所述人脸属性数据集中的所述人脸属性数据进行标准卷积,并将标准卷积处理后得到的人脸属性特征图输入到所述特征降维结构进行特征降维训练,以输出人脸属性降维特征图;
将所述人脸属性降维特征图输入到已构建的所述通道混合结构进行各通道间维度的融合,输出人脸属性通道融合特征图;
将所述人脸属性通道融合特征图输入到所述特征分类结构,通过所述通道分隔算法层对通道维度进行拆分,并根据拆分结果设置全连接层,以得到目标卷积神经网络模型;
其中,所述通道混合结构包括多层第二分组卷积层以及通道混合层,将所述人脸属性降维特征图输入到已构建的所述通道混合结构进行各通道间维度的融合的步骤包括:将所述人脸属性降维特征图依次输入到多层所述第二分组卷积层,以依次提取所述人脸属性降维特征图的人脸属性特征,通过所述通道混合层对所述人脸属性特征进行各通道间维度的融合,其中,多层所述第二分组卷积层对应的分组数一致;重复执行所述将所述人脸属性降维特征图依次输入到多层所述第二分组卷积层,以依次提取所述人脸属性降维特征图的人脸属性特征,通过所述通道混合层对所述人脸属性特征进行各通道间维度的融合的步骤,直到输出所述人脸属性通道融合特征图;
所述特征分类结构还包括第三分组卷积层与第二平均池化层,将所述人脸属性通道融合特征图输入到所述特征分类结构,通过所述通道分隔算法层对通道维度进行拆分的步骤包括:将所述人脸属性通道融合特征图输入到所述第二平均池化层,降低所述人脸属性通道融合特征图的分辨率;将降低分辨率后的所述人脸属性通道融合特征图输入到所述第三分组卷积层进行分组卷积处理,重新将通道间维度融合后的人脸属性通道融合特征图拆分给多个属性识别任务;通过所述通道分隔算法层对所述分组卷积处理后的所述人脸属性通道融合特征图在通道维度上进行拆分。
2.如权利要求1所述的轻量化卷积神经网络的训练方法,其特征在于,所述采集人脸属性数据集的步骤包括:
通过图像采集设备获取视频数据,并对所述视频数据进行视频帧抽取;
识别所述视频帧中的行人,并对行人的行人属性图像进行标记,所述行人属性图像包括所述人脸属性数据;
对标记后的所述人脸属性数据进行划分,得到所述人脸属性数据集。
3.如权利要求1所述的轻量化卷积神经网络的训练方法,其特征在于,所述将所述人脸属性数据集中的所述人脸属性数据进行标准卷积,并将标准卷积处理后得到的人脸属性特征图输入到所述特征降维结构进行特征降维训练的步骤包括:
将所述人脸属性数据集中的所述人脸属性数据进行标准化处理;
将标准化处理后的所述人脸属性数据通过预设的第一标准卷积层进行标准卷积计算,得到所述人脸属性特征图;
将所述人脸属性特征图输入到所述特征降维结构进行多次特征降维训练,以输出所述人脸属性降维特征图。
4.如权利要求3所述的轻量化卷积神经网络的训练方法,其特征在于,所述特征降维结构包括第一分组卷积层、第二标准卷积层与第一平均池化层,所述将所述人脸属性特征图输入到所述特征降维结构进行多次特征降维训练的步骤包括:
将所述人脸属性特征图依次输入到所述第一分组卷积层、所述第二标准卷积层及所述第一平均池化层进行特征降维训练;
重复执行所述将所述人脸属性特征图依次输入到所述第一分组卷积层、所述第二标准卷积层及所述第一平均池化层进行特征降维训练的步骤,直到输出所述人脸属性降维特征图。
5.一种人脸属性识别方法,其特征在于,包括步骤:
获取待检测数据,所述待检测数据包括人脸属性数据;
将所述待检测数据中的所述人脸属性数据输入到如权利要求1-4任一项所述的目标卷积神经网络模型进行人脸属性识别;
将人脸属性识别结果进行输出。
6.一种轻量化卷积神经网络的训练装置,其特征在于,包括:
采集模块,用于采集人脸属性数据集,所述人脸属性数据集中包括人脸属性数据;
构建模块,用于构建卷积神经网络,所述卷积神经网络包括特征降维结构、通道混合结构及特征分类结构,所述特征分类结构包括通道分隔算法层;
特征降维模块,用于将所述人脸属性数据集中的所述人脸属性数据进行标准卷积,并将标准卷积处理后得到的人脸属性特征图输入到所述特征降维结构进行特征降维训练,以输出人脸属性降维特征图;
通道融合模块,用于将所述人脸属性降维特征图输入到已构建的所述通道混合结构进行各通道间维度的融合,输出人脸属性通道融合特征图;
特征分类模块,用于将所述人脸属性通道融合特征图输入到所述特征分类结构,通过所述通道分隔算法层对通道维度进行拆分,并根据拆分结果设置全连接层,以得到目标卷积神经网络模型;
其中,所述通道混合结构包括多层第二分组卷积层以及通道混合层,所述通道融合模块包括:提取单元,用于将所述人脸属性降维特征图依次输入到多层所述第二分组卷积层,以依次提取所述人脸属性降维特征图的人脸属性特征,通过所述通道混合层对所述人脸属性特征进行各通道间维度的融合,其中,多层所述第二分组卷积层对应的分组数一致;重复融合单元,用于重复执行所述将所述人脸属性降维特征图依次输入到多层所述第二分组卷积层,以依次提取所述人脸属性降维特征图的人脸属性特征,通过所述通道混合层对所述人脸属性特征进行各通道间维度的融合的步骤,直到输出所述人脸属性通道融合特征图;
所述特征分类结构还包括第三分组卷积层与第二平均池化层,所述特征分类模块包括:分辨率处理单元,用于将所述人脸属性通道融合特征图输入到所述第二平均池化层,降低所述人脸属性通道融合特征图的分辨率;分配单元,用于将降低分辨率后的所述人脸属性通道融合特征图输入到所述第三分组卷积层进行分组卷积处理,重新将通道间维度融合后的人脸属性通道融合特征图拆分给多个属性识别任务;维度拆分单元,用于通过所述通道分隔算法层对所述分组卷积处理后的所述人脸属性通道融合特征图在通道维度上进行拆分。
7.一种人脸属性识别装置,其特征在于,包括:
获取模块,用于获取待检测数据,所述待检测数据包括人脸属性数据;
识别模块,用于将所述待检测数据中的所述人脸属性数据输入到如权利要求1-4任一项所述的目标卷积神经网络模型进行人脸属性识别;
输出模块,用于将人脸属性识别结果进行输出。
8.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述的轻量化卷积神经网络的训练方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110085271.1A CN112766176B (zh) | 2021-01-21 | 2021-01-21 | 轻量化卷积神经网络的训练方法及人脸属性识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110085271.1A CN112766176B (zh) | 2021-01-21 | 2021-01-21 | 轻量化卷积神经网络的训练方法及人脸属性识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112766176A CN112766176A (zh) | 2021-05-07 |
CN112766176B true CN112766176B (zh) | 2023-12-01 |
Family
ID=75702594
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110085271.1A Active CN112766176B (zh) | 2021-01-21 | 2021-01-21 | 轻量化卷积神经网络的训练方法及人脸属性识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112766176B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114511909A (zh) * | 2022-02-25 | 2022-05-17 | 支付宝(杭州)信息技术有限公司 | 一种刷脸支付意愿识别方法、装置以及设备 |
CN115565051B (zh) * | 2022-11-15 | 2023-04-18 | 浙江芯昇电子技术有限公司 | 轻量级人脸属性识别模型训练方法、识别方法及设备 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015177268A1 (en) * | 2014-05-23 | 2015-11-26 | Ventana Medical Systems, Inc. | Systems and methods for detection of biological structures and/or patterns in images |
CN107784654A (zh) * | 2016-08-26 | 2018-03-09 | 杭州海康威视数字技术股份有限公司 | 图像分割方法、装置及全卷积网络系统 |
CN108647668A (zh) * | 2018-05-21 | 2018-10-12 | 北京亮亮视野科技有限公司 | 多尺度轻量级人脸检测模型的构建方法及基于该模型的人脸检测方法 |
CN108830252A (zh) * | 2018-06-26 | 2018-11-16 | 哈尔滨工业大学 | 一种融合全局时空特征的卷积神经网络人体动作识别方法 |
CN109063666A (zh) * | 2018-08-14 | 2018-12-21 | 电子科技大学 | 基于深度可分离卷积的轻量化人脸识别方法及系统 |
CN109446953A (zh) * | 2018-10-17 | 2019-03-08 | 福州大学 | 一种基于轻量化卷积神经网络的行人重识别方法 |
CN109961034A (zh) * | 2019-03-18 | 2019-07-02 | 西安电子科技大学 | 基于卷积门控循环神经单元的视频目标检测方法 |
CN109977812A (zh) * | 2019-03-12 | 2019-07-05 | 南京邮电大学 | 一种基于深度学习的车载视频目标检测方法 |
CN110827260A (zh) * | 2019-11-04 | 2020-02-21 | 燕山大学 | 一种基于lbp特征与卷积神经网络的布匹缺陷分类方法 |
CN110929602A (zh) * | 2019-11-09 | 2020-03-27 | 北京工业大学 | 一种基于卷积神经网络的地基云图云状识别方法 |
CN111582044A (zh) * | 2020-04-15 | 2020-08-25 | 华南理工大学 | 基于卷积神经网络和注意力模型的人脸识别方法 |
CN112183295A (zh) * | 2020-09-23 | 2021-01-05 | 上海眼控科技股份有限公司 | 行人重识别方法、装置、计算机设备及存储介质 |
WO2021003125A1 (en) * | 2019-07-01 | 2021-01-07 | Optimum Semiconductor Technologies Inc. | Feedbackward decoder for parameter efficient semantic image segmentation |
-
2021
- 2021-01-21 CN CN202110085271.1A patent/CN112766176B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015177268A1 (en) * | 2014-05-23 | 2015-11-26 | Ventana Medical Systems, Inc. | Systems and methods for detection of biological structures and/or patterns in images |
CN107784654A (zh) * | 2016-08-26 | 2018-03-09 | 杭州海康威视数字技术股份有限公司 | 图像分割方法、装置及全卷积网络系统 |
CN108647668A (zh) * | 2018-05-21 | 2018-10-12 | 北京亮亮视野科技有限公司 | 多尺度轻量级人脸检测模型的构建方法及基于该模型的人脸检测方法 |
CN108830252A (zh) * | 2018-06-26 | 2018-11-16 | 哈尔滨工业大学 | 一种融合全局时空特征的卷积神经网络人体动作识别方法 |
CN109063666A (zh) * | 2018-08-14 | 2018-12-21 | 电子科技大学 | 基于深度可分离卷积的轻量化人脸识别方法及系统 |
CN109446953A (zh) * | 2018-10-17 | 2019-03-08 | 福州大学 | 一种基于轻量化卷积神经网络的行人重识别方法 |
CN109977812A (zh) * | 2019-03-12 | 2019-07-05 | 南京邮电大学 | 一种基于深度学习的车载视频目标检测方法 |
CN109961034A (zh) * | 2019-03-18 | 2019-07-02 | 西安电子科技大学 | 基于卷积门控循环神经单元的视频目标检测方法 |
WO2021003125A1 (en) * | 2019-07-01 | 2021-01-07 | Optimum Semiconductor Technologies Inc. | Feedbackward decoder for parameter efficient semantic image segmentation |
CN110827260A (zh) * | 2019-11-04 | 2020-02-21 | 燕山大学 | 一种基于lbp特征与卷积神经网络的布匹缺陷分类方法 |
CN110929602A (zh) * | 2019-11-09 | 2020-03-27 | 北京工业大学 | 一种基于卷积神经网络的地基云图云状识别方法 |
CN111582044A (zh) * | 2020-04-15 | 2020-08-25 | 华南理工大学 | 基于卷积神经网络和注意力模型的人脸识别方法 |
CN112183295A (zh) * | 2020-09-23 | 2021-01-05 | 上海眼控科技股份有限公司 | 行人重识别方法、装置、计算机设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
一种新的正则化图像重建算法及参数优化;陈晓艳;《天津科技大学学报》;第29卷(第6期);第74-77页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112766176A (zh) | 2021-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112418360B (zh) | 卷积神经网络的训练方法、行人属性识别方法及相关设备 | |
US20220215227A1 (en) | Neural Architecture Search Method, Image Processing Method And Apparatus, And Storage Medium | |
CN108875624B (zh) | 基于多尺度的级联稠密连接神经网络的人脸检测方法 | |
CN112990211B (zh) | 一种神经网络的训练方法、图像处理方法以及装置 | |
CN109711281A (zh) | 一种基于深度学习的行人重识别与特征识别融合方法 | |
CN109410184B (zh) | 基于稠密对抗网络半监督学习的直播色情图像检测方法 | |
EP3627379A1 (en) | Methods for generating a deep neural net and for localising an object in an input image, deep neural net, computer program product, and computer-readable storage medium | |
CN110222718B (zh) | 图像处理的方法及装置 | |
CN111291809A (zh) | 一种处理装置、方法及存储介质 | |
CN108960167A (zh) | 发型识别方法、装置、计算机可读存储介质和计算机设备 | |
CN104134364B (zh) | 具有自我学习能力的实时交通标记识别方法及系统 | |
US20100111375A1 (en) | Method for Determining Atributes of Faces in Images | |
WO2020238353A1 (zh) | 数据处理方法和装置、存储介质及电子装置 | |
CN113128308B (zh) | 一种港口场景下的行人检测方法、装置、设备及介质 | |
CN112766176B (zh) | 轻量化卷积神经网络的训练方法及人脸属性识别方法 | |
CN112464930A (zh) | 目标检测网络构建方法、目标检测方法、装置和存储介质 | |
CN113095199B (zh) | 一种高速行人识别方法及装置 | |
Diyasa et al. | Multi-face Recognition for the Detection of Prisoners in Jail using a Modified Cascade Classifier and CNN | |
CN112052816A (zh) | 基于自适应图卷积对抗网络的人体行为预测方法及系统 | |
Shanthakumari et al. | Image Detection and Recognition of different species of animals using Deep Learning | |
CN104598898A (zh) | 一种基于多任务拓扑学习的航拍图像快速识别系统及其快速识别方法 | |
CN115565146A (zh) | 基于自编码器获取鸟瞰图特征的感知模型训练方法及系统 | |
CN113450297A (zh) | 红外图像和可见光图像的融合模型构建方法及系统 | |
Jewel et al. | Bengali ethnicity recognition and gender classification using CNN & transfer learning | |
Zhong et al. | A dbn-crf for spectral-spatial classification of hyperspectral data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PP01 | Preservation of patent right |
Effective date of registration: 20240109 Granted publication date: 20231201 |
|
PP01 | Preservation of patent right |