CN112070019B - 一种人脸识别方法、装置、电子设备和存储介质 - Google Patents
一种人脸识别方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN112070019B CN112070019B CN202010936828.3A CN202010936828A CN112070019B CN 112070019 B CN112070019 B CN 112070019B CN 202010936828 A CN202010936828 A CN 202010936828A CN 112070019 B CN112070019 B CN 112070019B
- Authority
- CN
- China
- Prior art keywords
- layer
- convolution
- channel
- dimension
- branch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 230000004044 response Effects 0.000 claims abstract description 12
- 238000013135 deep learning Methods 0.000 claims abstract description 11
- 230000006870 function Effects 0.000 claims description 33
- 230000004913 activation Effects 0.000 claims description 31
- 238000011176 pooling Methods 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 16
- 238000010276 construction Methods 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 10
- 230000003044 adaptive effect Effects 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 5
- 230000004927 fusion Effects 0.000 claims description 4
- 230000002779 inactivation Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 7
- 238000012549 training Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 238000012937 correction Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- OFCCYDUUBNUJIB-UHFFFAOYSA-N n,n-diethylcarbamoyl chloride Chemical compound CCN(CC)C(Cl)=O OFCCYDUUBNUJIB-UHFFFAOYSA-N 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/32—Indexing scheme for image data processing or generation, in general involving image mosaicing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及人脸识别技术领域,具体涉及一种人脸识别方法、装置、电子设备和存储介质,该人脸识别方法采用深度学习网络模型识别样本图像中的人脸信息,其特征在于,该识别方法包括以下步骤:分别为多个通道组构建对应的概率分布张量,所述多个通道组是按照预设的组数在通道维度上分割得到的,每个通道组的权重不同;选择最大通道组所对应的卷积核,自适应地调节不同所述样本图像上提取的特征信息;其中,所述最大通道组为所构建的每个所述概率分布张量中响应最高的通道组;根据所述卷积核对每个所述通道组进行卷积得到卷积特征,将所得到的多个所述卷积特征进行拼接。本发明实施例提升网络模型的特征表达能力,而且不会增加整个网络结构的复杂度。
Description
技术领域
本发明涉及人脸识别技术领域,具体涉及一种人脸识别方法、装置、电子设备和存储介质。
背景技术
人脸识别技术是计算机视觉领域的重要研究方向之一,主要通过分析对比人脸特征达到识别身份的目的。因其人脸特征可以通过非接触的方式进行采集,具有简单、便捷等优势,这些优势让人脸识别技术在众多生物识别技术中脱颖而出,落地产品市场占比大,广泛应用在安全、经济等领域里。
2012年AlexNet网络模型被提出,展示了深度神经网络在图像分类方向上惊人的精度优势,让国内外研究者看到了新的方向,不断提出了各种深度神经网络的变种,并应用到人脸识别技术上,使人脸识别技术开始迅猛发展。
基于深度学习的人脸识别方法在精度和速度方面都有非常大的优势,具有良好的泛化性和鲁棒性,能应用于不同场景中,改进方式主要分为优化网络结构和优化损失函数两方面。网络结构被国内外学者不断地重构优化,里程碑的网络模型有VGGNet、DeepFace、GoogleNet、VGGFace、SphereFace、SENet等,利用网络模型提高特征的表达能力,可以大大地增加模型的泛化性。其次,就是优化损失函数方面,最开始人脸识别算法都是使用Softmax损失函数指导模型训练,但是研究者们发现Softmax损失函数存在许多不足,不能减小类内距离和增大类间距离,随后出现Triplet Loss、L-Softmax、CenterLoss、A-Softmax、AM-Softmax等变种损失函数,通过增加损失函数的判别性,提高网络模型的识别能力,使类内特征分布紧凑,类间特征分布疏远。
目前,基于深度学习的人脸识别算法的网络结构中都采用卷积层提高特征信息的表达能力,这是由于不同的卷积核能提取到不同层次的抽象信息。但是卷积操作在网络结构中是参数共享的,如果想在不同样本上获取到更丰富的特征信息,需增加卷积层的数量,这样不仅增加参数计算量,并且难以优化网络模型。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种人脸识别方法、装置、电子设备和存储介质,所采用的技术方案具体如下:
第一方面,本发明一个实施例提供了一种人脸识别方法,该人脸识别方法采用深度学习网络模型识别样本图像中的人脸信息,其特征在于,该识别方法包括以下步骤:
分别为多个通道组构建对应的概率分布张量,所述多个通道组是按照预设的组数在通道维度上分割得到的,每个通道组的权重不同;
选择最大通道组所对应的卷积核,自适应的调节不同所述样本图像上提取的特征信息;其中,所述最大通道组为所构建的每个所述概率分布张量中响应最高的通道组;
根据所述卷积核对每个所述通道组进行卷积得到卷积特征,将所得到的多个所述卷积特征进行拼接。
第二方面,本发明另一个实施例提供了一种人脸识别装置,该人脸识别装置采用深度学习网络模型识别样本图像中的人脸信息,其特征在于,该识别装置包括:
概率分布张量构建单元,用于分别为多个通道组构建对应的概率分布张量,所述多个通道组是按照预设的组数在通道维度上分割得到的,每个通道组的权重不同;
卷积核选择单元,用于选择最大通道组所对应的卷积核,以调节不同所述样本图像上提取的特征信息;其中,所述最大通道组为所述概率分布张量中响应最高的通道组;以及
特征拼接单元,用于根据所述卷积核对每个所述通道组进行卷积得到卷积特征,并将所得到的多个所述卷积特征进行拼接。
第三方面,本发明另一个实施例提供了一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:执行上述所述的方法。
第四方面,本发明另一个实施例提供了一种存储介质,该存储介质中存储有计算机可读的程序指令,所述程序指令被处理器执行时实现上述所述的方法。
本发明具有如下有益效果:
本发明实施例通过为不同重要程度的通道组构建对应的概率分布张量,并选择概率分布张量中响应最高的通道组对应的卷积核做卷积操作,强化高重要性的通道特征,提升网络模型的特征表达能力,而且不会增加整个网络结构的复杂度。动态激活通道卷积的人脸识别模型通过根据不同的样本自动调节特征信息,加强有效的特征信息,抑制冗余、不重要的特征信息,而且网络结构简单、易搭建,识别精度得到大大提高。
附图说明
图1为本发明一个实施例所提供的整体网络模型的网络结构示意图;
图2为本发明一个实施例所提供的关于残差模块的网络结构示意图;
图3为本发明一个实施例所提供的关于动态激活通道卷积模块的网络结构示意图;
图4为本发明一个实施例所提供的一种人脸识别方法的流程图;
图5为本发明一个实施例所提供的一种人脸识别装置的结构框图;
图6为本发明一个实施例所提供的关于概率分布张量构建单元的结构框图;
图7为本发明一个实施例所提供的关于卷积核选择单元的结构框图;
图8为本发明一个实施例所提供的一种电子设备的结构示意图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种人脸识别方法、装置、电子设备和存储介质,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,“第一”、“第二”、仅用于区分,方便描述,并不代表相关特征的偏重程度或主次之分。不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的属于只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
下面结合附图具体的说明本发明所提供的一种人脸识别方法、装置、电子设备和存储介质。
目前,主流的卷积层操作提取表达能力强的特征信息,主要通过不同卷积核提取的不同层次的抽象信息。但是因卷积操作是参数共享的,为了在不同的样本上提取到强语义的信息,以增加特征信息的表达能力,需进行多次卷积。该方法会增加参数计算量,加大优化网络结构的难度。
为了克服上述缺陷,本发明实施例通过搭建基于动态激活通道卷积的人脸识别模型,自动为不同重要程度的通道生成对应的卷积核,调节不同样本上提取的特征信息,强化高重要性的通道特征,提升网络模型的特征表达能力,提高人脸的识别精度。
按照数据处理的顺序,以卷积层、批归一化层、激活函数层和残差模块作为一个网络块。
按照数据处理的顺序,该网络结构的主干网络包括依次堆放的网络块,按照预设的网络块的数量搭建主干网络之后,处理后的数据依次经过全连接层、随机失活层、带正则化的全连接层处理之后利用附加间隔柔性最大值损失函数计算预测类别与真实类别之间的损失值。
其中,附加间隔柔性最大值损失函数
其中,N参数表示批处理样本的大小;表示第i个训练样本的预测值;参数s用于缩放余弦值;能提高网络模型训练时的收敛速度,参数m用于调整类间距离;参数c为类别的总数;j为类别的标号。
最后,用优化器优化缩小损失值,调优网络模型的权重参数。
优选的,请参阅图1,其示出了本发明实施例所搭建的完整的网络结构。图中,C表示卷积层,为了方便表述,其中C1表示第一卷积层、C2表示第二卷积层,C3表示第三卷积层,C4表示第四卷积层以此类推。BN表示批正则化层,PR表示参数修正线性单元层,Res_Block表示残差模块,D表示全连接层,DP表示随机失活层,ND表示带正则化的全连接层,AM-Softmax-Loss表示柔性最大值损失函数。具体到本实施例中,批归一化层采用批正则化层,激活函数层采用参数修正线性单元层。
按照数据处理的方向,残差模块包括动态激活通道卷积层、激活函数层、批归一化层和特征相加融合层。
优选的,请参阅图2,图2示出了本实施例所采用的残差模块的网络架构图,图中DECC表示动态激活通道卷积层,PE表示参数修正线性单元,Add表示特征相加融合层。其中,激活函数层采用参数修正线性单元,批归一化层采用批正则化层。
按照数据处理的方向,动态激活通道卷积层包括全局平均池化层、自适应平均池化层、卷积层、激活函数层和批归一化层。该动态激活通道卷积层包括第一分支和第二分支,第一分支主要生成通道维度上的概率分布张量,第二分支主要用于生成卷积核。
主要流程是将特征块在通道维度上分成m组,然后根据第一分支生成概率分布张量中概率最大值对应的通道组选择对应的卷积核,最后分组进行卷积再将特征信息拼接起来,其中m设为4。
具体的,每个通道组对应一个概率分布张量,通道组做卷积的依据是:对应的概率分布张量中响应值最高对应的卷积核,再与对应的通道组做卷积,每个概率分布张量里都有一个响应最高的值。
作为一个示例:标号为1的通道组对应标号为1的概率分布张量,而标号为1的概率分布张量里最高响应值对应的是标号为2的卷积核,所以选出标号为2的卷积核与标号为1的通道组做卷积。
请参阅图3,图3示出了本实施例所采用的动态激活通道卷积层的网络架构图,图中GAP表示全局平均池化层,R表示维度变化层,S表示柔性最大值激活函数层。第一分支依次包括全局平均池化层、卷积层、维度变化层和柔性最大值激活函数层。第二分支包括自适应平均池化层、第一卷积层和第二卷积层。图中虚线部分展示特征块维度变化。
具体的,第一分支首先利用全局平均池化层将维度为的特征块每个通道上的空间特征编码成维度为 />的全局特征,然后使用一个卷积核大小为的卷积层升高特征块的维度,变为维度为/>的特征块,降低特征块的维度变为/>,最后在m维上使用柔性最大值激活函数映射成概率分布张量,作为选择卷积核的依据。
第二分支首先利用自适应平均池化层将维度为的特征块下采样成维度为/>的特征块,然后依次使用两个卷积核大小为/>的卷积层改变维度,最后将特征块分组,得到m个大小为/>的卷积核。如图所示,得到的卷积核为/>。
请参阅图4,基于上述所构建的网络模型,本发明实施例所提供的识别方法包括以下步骤:
步骤S001,分别为多个通道组构建对应的概率分布张量,所述多个通道组是按照预设的组数在通道维度上分割得到的,每个通道组的权重不同。
需要说明的是,对每个通道组构建一个概率分布张量,也即通道组与概率分布张量是一一对应的关系。
步骤S002,选择最大通道组所对应的卷积核,自适应的调节不同所述样本图像上提取的特征信息;其中,所述最大通道组为所构建的每个所述概率分布张量中响应最高的通道组。
步骤S003,根据所述卷积核对每个所述通道组进行卷积得到卷积特征,将所得到的多个所述卷积特征进行拼接。
在引入了动态激活通道卷积层之后,网络模型对人脸识别的性能大大提高。
综上所述,本发明实施例通过为不同重要程度的通道组构建对应的概率分布张量,并选择概率分布张量中响应最高的通道组对应的卷积核做卷积操作,强化高重要性的通道特征,提升网络模型的特征表达能力,而且不会增加整个网络结构的复杂度。动态激活通道卷积的人脸识别模型通过根据不同的样本自动调节特征信息,加强有效的特征信息,抑制冗余、不重要的特征信息,而且网络结构简单、易搭建,识别精度得到大大提高。
在利用该网络模型进行训练和测试的过程中,首先,将需识别的人脸图像输入到网络模型中,输出得到高维度的特征张量,并计算其与人脸数据库中用户人脸特征张量的余弦相似度。然后,将所述余弦相似度大于预设阈值的人脸图像识别为同一人。其中,该网络模型是预先经过训练的网络模型,该网络模型的训练过程包括:首先,对收集到的任意大小的人脸图像进行裁剪对齐等系列预处理操作。然后,将预处理后的人脸图像分为训练集和测试集,并将训练集和测试集转化成固定格式的数据存储方式输入到搭建的人脸识别网络模型中进行训练。最后,利用附加间隔柔性最大值损失函数计算损失值,调节相关超参数,制定优化策略,迭代计算,直至得到最优的人脸识别模型。
具体到本实施例中,该附加间隔柔性最大值损失函数中的超参数s设为35,主要能控制模型收敛速度;超参数m设为0.4,用来调节类间距离。
具体到本实施例中,该网络模型的主干部分结构是由4个网络块依次堆叠构成的,其中,按照数据流的方向,依次对每个网络块命名为:第一网络块、第二网络块、第三网络块和第四网络块,其中第三个网络块包含两个残差模块,第一个网络块、第二个网络块和第四个网络块分别包含一个残差模块。每个残差块包含2个动态激活通道卷积模块。
优选的,步骤S03中的优化策略可以采用预热余弦下降法衰减学习率,使用随机梯度下降法作为优化器。
优选的,将学习率设为0.01,批处理大小设为256,最后全连接层输入通道数为256,批归一化层的动量参数设为0.975,总迭代次数设为200000。
根据本发明提出的实施步骤在LFW数据集上训练并测试模型,LFW数据集由各种环境下采集的人脸图像数据集构成,主要用来研究人脸识别问题,共有13233张图像,包含5749个人。由实验结果可得,利用本发明提出的人脸识别方法可以对特征块中权重不同的通道生成对应的卷积核,能根据不同的样本自动调节特征信息,加强有效的特征信息,抑制冗余、不重要的特征信息,提升网络模型的特征表达能力,大大地提高人脸识别精度。
第二方面,基于与上述方法实施例相同的发明构思,本发明另一个实施例提供了一种人脸识别装置。
请参阅图5,其示出了一种人脸识别装置的结构框图,该人脸识别装置采用深度学习网络模型识别样本图像中的人脸信息,该识别装置包括概率分布张量构建单元501、卷积核选择单元502和特征拼接单元503。
具体的,概率分布张量构建单元用于分别为多个通道组构建对应的概率分布张量,多个通道组是按照预设的组数在通道维度上分割得到的,每个通道组的权重不同。卷积核选择单元用于选择最大通道组所对应的卷积核,自适应的调节不同样本图像上提取的特征信息;其中,最大通道组为所构建的每个概率分布张量中响应最高的通道组。特征拼接单元用于根据卷积核对每个通道组进行卷积得到卷积特征,并将所得到的多个卷积特征进行拼接。
请参阅图6,概率分布张量构建单元501包括特征编码单元5011、升维单元5012、第一降维单元5013和映射单元5014。特征编码单元用于将维度为的特征块每个通道上的空间特征编码成维度为/>的全局特征。升维单元用于将特征块的维度升高为/>的特征块。第一降维单元用于将特征块的维度降低为/>。映射单元用于在m维上使用柔性最大值激活函数映射成概率分布张量。
请参阅图7,卷积核选择单元502包括下采样单元5021、第二降维单元5022和分组单元5023。下采样单元用于将维度为的特征块下采样成维度为/>的特征块。第二降维单元用于依次使用两个卷积核大小为/>的卷积层改变维度。分组单元用于将特征块分组,得到m个大小为/>的卷积核。
优选的,深度学习网络模型包括动态激活通道卷积层,动态激活通道卷积层包括生成概率分布张量的第一分支和用于生成卷积核的第二分支,第一分支按照数据流的处理方向依次包括全局平均池化层、卷积层、维度变化层和柔性最大值激活函数层,第二分支包括按照数据流的处理方向依次包括自适应平均池化层、第一卷积层和第二卷积层。
第三方面,请参阅图8,图8示出了上述实施例中所涉及的电子设备的一种可能的结构示意图。该电子设备可以包括处理单元801、存储单元802和通信单元803。处理单元801可以设置为与存储单元802通信。存储单元802用于保存处理单元801可执行程序代码和数据等,其中,处理单元执行程序时实现上述任意一个方法实施例所提供的一种人脸识别方法。该通信单元803用于支持该电子设备与其他网络实体的通信,以实现数据交互等功能,如该通信模块803支持电子设备与其他智能终端的通信,以实现数据交互功能。
其中,处理单元801可以是处理器或控制器。通信模块803可以是收发器、RF电路或通信接口等。存储模块802可以是存储器。
图8仅仅是本申请实施例的一种可能的实现方式,在实际应用中,该电子设备还可以包括更多或更少的部件,这里不作限制。
需要说明的是,该电子设备可以是服务器,也可以是智能终端,该智能终端可以是计算机、平板电脑或者智能手机等。
第四方面,本发明实施例还提供了一种存储介质,该存储介质中存储有计算机可读的程序指令,所述程序指令被处理单元执行时实现上述任意一个实施例中所提供的一种人脸识别方法。例如,该计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、只读光盘(Compact Disc Read-OnlyMemory,CD-ROM)、磁带、软盘和光数据存储设备等。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (4)
1.一种人脸识别方法,该人脸识别方法采用深度学习网络模型识别样本图像中的人脸信息,其特征在于,该识别方法包括以下步骤:
分别为多个通道组构建对应的概率分布张量,所述多个通道组是按照预设的组数在通道维度上分割得到的,每个通道组的权重不同;
选择最大通道组所对应的卷积核,自适应的调节不同所述样本图像上提取的特征信息;其中,所述最大通道组为所构建的每个所述概率分布张量中响应最高的通道组;
根据所述卷积核对每个所述通道组进行卷积得到卷积特征,将所得到的多个所述卷积特征进行拼接;
其中,所述深度学习网络模型包括:按照数据处理的顺序,以卷积层、批归一化层、激活函数层和残差模块作为一个网络块;网络结构的主干网络包括依次堆放的网络块,按照预设的网络块的数量搭建主干网络之后,处理后的数据依次经过全连接层、随机失活层、带正则化的全连接层处理之后利用附加间隔柔性最大值损失函数计算预测类别与真实类别之间的损失值;按照数据处理的方向,残差模块包括动态激活通道卷积层、激活函数层、批归一化层和特征相加融合层;所述动态激活通道卷积层包括第一分支和第二分支,第一分支生成通道维度上的概率分布张量,第二分支用于生成卷积核;所述第一分支依次包括全局平均池化层、卷积层、维度变化层和柔性最大值激活函数层;第二分支包括自适应平均池化层、第一卷积层和第二卷积层;
其中,所述概率分布张量的构建方法包括以下步骤:所述第一分支首先利用全局平均池化层将维度为的特征块每个通道上的空间特征编码成维度为/>的全局特征,然后使用一个卷积核大小为/>的卷积层升高特征块的维度,变为维度为的特征块,降低特征块的维度变为/>,最后在m维上使用柔性最大值激活函数映射成概率分布张量,作为选择卷积核的依据;
其中,所述卷积核的获得包括以下步骤:第二分支首先利用自适应平均池化层将维度为的特征块下采样成维度为/>的特征块,然后依次使用两个卷积核大小为/>的卷积层改变维度,最后将特征块分组,得到m个大小为/>的卷积核。
2.一种人脸识别装置,该人脸识别装置采用深度学习网络模型识别样本图像中的人脸信息,其特征在于,该识别装置包括:
概率分布张量构建单元,用于分别为多个通道组构建对应的概率分布张量,多个所述通道组是按照预设的组数在通道维度上分割得到的,每个通道组的权重不同;
卷积核选择单元,用于选择最大通道组所对应的卷积核,自适应的调节不同所述样本图像上提取的特征信息;其中,所述最大通道组为所构建的每个所述概率分布张量中响应最高的通道组;以及
特征拼接单元,用于根据所述卷积核对每个所述通道组进行卷积得到卷积特征,并将所得到的多个所述卷积特征进行拼接;
其中,所述深度学习网络模型包括:按照数据处理的顺序,以卷积层、批归一化层、激活函数层和残差模块作为一个网络块;网络结构的主干网络包括依次堆放的网络块,按照预设的网络块的数量搭建主干网络之后,处理后的数据依次经过全连接层、随机失活层、带正则化的全连接层处理之后利用附加间隔柔性最大值损失函数计算预测类别与真实类别之间的损失值;按照数据处理的方向,残差模块包括动态激活通道卷积层、激活函数层、批归一化层和特征相加融合层;所述动态激活通道卷积层包括第一分支和第二分支,第一分支生成通道维度上的概率分布张量,第二分支用于生成卷积核;所述第一分支依次包括全局平均池化层、卷积层、维度变化层和柔性最大值激活函数层;第二分支包括自适应平均池化层、第一卷积层和第二卷积层;
其中,所述概率分布张量的构建方法包括以下步骤:所述第一分支首先利用全局平均池化层将维度为的特征块每个通道上的空间特征编码成维度为/>的全局特征,然后使用一个卷积核大小为/>的卷积层升高特征块的维度,变为维度为的特征块,降低特征块的维度变为/>,最后在m维上使用柔性最大值激活函数映射成概率分布张量,作为选择卷积核的依据;
其中,所述卷积核的获得包括以下步骤:第二分支首先利用自适应平均池化层将维度为的特征块下采样成维度为/>的特征块,然后依次使用两个卷积核大小为/>的卷积层改变维度,最后将特征块分组,得到m个大小为/>的卷积核。
3.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:执行权利要求1中任意一项所述的方法。
4.一种存储介质,该存储介质中存储有计算机可读的程序指令,其特征在于,所述程序指令被处理器执行时实现权利要求1中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010936828.3A CN112070019B (zh) | 2020-09-08 | 2020-09-08 | 一种人脸识别方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010936828.3A CN112070019B (zh) | 2020-09-08 | 2020-09-08 | 一种人脸识别方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112070019A CN112070019A (zh) | 2020-12-11 |
CN112070019B true CN112070019B (zh) | 2024-05-28 |
Family
ID=73664485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010936828.3A Active CN112070019B (zh) | 2020-09-08 | 2020-09-08 | 一种人脸识别方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112070019B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113159185A (zh) * | 2021-04-23 | 2021-07-23 | 山东交通学院 | 一种基于嵌套网络模型的相似图像检索方法及系统 |
CN112949618A (zh) * | 2021-05-17 | 2021-06-11 | 成都市威虎科技有限公司 | 一种人脸特征码转换方法及装置和电子设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8594423B1 (en) * | 2012-01-12 | 2013-11-26 | Google Inc. | Automatic background identification in video images |
CN110672343A (zh) * | 2019-09-29 | 2020-01-10 | 电子科技大学 | 基于多注意力卷积神经网络的旋转机械故障诊断方法 |
CN110782001A (zh) * | 2019-09-11 | 2020-02-11 | 东南大学 | 一种基于组卷积神经网络使用共享卷积核的改进方法 |
CN110796177A (zh) * | 2019-10-10 | 2020-02-14 | 温州大学 | 一种有效减少图像分类任务中神经网络过拟合的方法 |
CN111126258A (zh) * | 2019-12-23 | 2020-05-08 | 深圳市华尊科技股份有限公司 | 图像识别方法及相关装置 |
CN111209883A (zh) * | 2020-01-13 | 2020-05-29 | 南京大学 | 一种基于多源运动特征融合的时序自适应视频分类方法 |
CN111339931A (zh) * | 2020-02-25 | 2020-06-26 | 四川翼飞视科技有限公司 | 一种联合性别属性训练的人脸识别网络模型构建方法 |
CN111401292A (zh) * | 2020-03-25 | 2020-07-10 | 成都东方天呈智能科技有限公司 | 一种融合红外图像训练的人脸识别网络构建方法 |
CN111400535A (zh) * | 2020-03-11 | 2020-07-10 | 广东宜教通教育有限公司 | 轻量级人脸识别方法、系统、计算机设备及存储介质 |
CN111814744A (zh) * | 2020-07-30 | 2020-10-23 | 河南威虎智能科技有限公司 | 一种人脸检测方法、装置、电子设备和计算机存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9787676B2 (en) * | 2015-09-29 | 2017-10-10 | Anhui Huami Information Technology Co., Ltd. | Multi-modal biometric identification |
US10706267B2 (en) * | 2018-01-12 | 2020-07-07 | Qualcomm Incorporated | Compact models for object recognition |
-
2020
- 2020-09-08 CN CN202010936828.3A patent/CN112070019B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8594423B1 (en) * | 2012-01-12 | 2013-11-26 | Google Inc. | Automatic background identification in video images |
CN110782001A (zh) * | 2019-09-11 | 2020-02-11 | 东南大学 | 一种基于组卷积神经网络使用共享卷积核的改进方法 |
CN110672343A (zh) * | 2019-09-29 | 2020-01-10 | 电子科技大学 | 基于多注意力卷积神经网络的旋转机械故障诊断方法 |
CN110796177A (zh) * | 2019-10-10 | 2020-02-14 | 温州大学 | 一种有效减少图像分类任务中神经网络过拟合的方法 |
CN111126258A (zh) * | 2019-12-23 | 2020-05-08 | 深圳市华尊科技股份有限公司 | 图像识别方法及相关装置 |
CN111209883A (zh) * | 2020-01-13 | 2020-05-29 | 南京大学 | 一种基于多源运动特征融合的时序自适应视频分类方法 |
CN111339931A (zh) * | 2020-02-25 | 2020-06-26 | 四川翼飞视科技有限公司 | 一种联合性别属性训练的人脸识别网络模型构建方法 |
CN111400535A (zh) * | 2020-03-11 | 2020-07-10 | 广东宜教通教育有限公司 | 轻量级人脸识别方法、系统、计算机设备及存储介质 |
CN111401292A (zh) * | 2020-03-25 | 2020-07-10 | 成都东方天呈智能科技有限公司 | 一种融合红外图像训练的人脸识别网络构建方法 |
CN111814744A (zh) * | 2020-07-30 | 2020-10-23 | 河南威虎智能科技有限公司 | 一种人脸检测方法、装置、电子设备和计算机存储介质 |
Non-Patent Citations (4)
Title |
---|
Accelerating Convolutional Neural Networks with Dynamic Channel Pruning;Z. Chiliang 等;2019 Data Compression Conference (DCC);20190503;563-563 * |
Dynamic Convolution: Attention over Convolution Kernels;Chen, Yinpeng等;arXiv:1912.03458 [cs.CV];20191207;1-10 * |
基于深层神经网络的图像识别算法研究;连自锋;中国博士学位论文全文数据库 (信息科技辑);20180215(第(2018)02期);I138-82 * |
结合深度可分离卷积与通道加权的全卷积神经网络视网膜图像血管分割;耿磊 等;生物医学工程学杂志;20190225;第36卷(第1期);107-115 * |
Also Published As
Publication number | Publication date |
---|---|
CN112070019A (zh) | 2020-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107330446B (zh) | 一种面向图像分类的深度卷积神经网络的优化方法 | |
CN113221969A (zh) | 一种基于物联网感知的双特征融合的语义分割系统及方法 | |
CN112257794A (zh) | 一种基于yolo的轻量级的目标检测方法 | |
CN112016450B (zh) | 机器学习模型的训练方法、装置和电子设备 | |
CN110135460B (zh) | 基于vlad卷积模块的图像信息强化方法 | |
CN108520213B (zh) | 一种基于多尺度深度的人脸美丽预测方法 | |
CN111695375B (zh) | 基于模型蒸馏的人脸识别模型压缩方法、介质及终端 | |
CN112070019B (zh) | 一种人脸识别方法、装置、电子设备和存储介质 | |
CN115203442B (zh) | 基于联合注意力的跨模态深度哈希检索方法、系统及介质 | |
CN110598552A (zh) | 基于改进粒子群算法优化卷积神经网络的表情识别方法 | |
CN112732864A (zh) | 一种基于稠密伪查询向量表示的文档检索方法 | |
CN111357051A (zh) | 语音情感识别方法、智能装置和计算机可读存储介质 | |
CN114529982A (zh) | 基于流式注意力的轻量级人体姿态估计方法及系统 | |
CN108197707A (zh) | 基于全局误差重建的卷积神经网络的压缩方法 | |
CN111694977A (zh) | 一种基于数据增强的车辆图像检索方法 | |
CN117033985A (zh) | 一种基于ResCNN-BiGRU的运动想象脑电分类方法 | |
CN113011253A (zh) | 基于ResNeXt网络的人脸表情识别方法、装置、设备及存储介质 | |
CN116127298A (zh) | 基于三元组损失的小样本射频指纹识别方法 | |
CN114677545B (zh) | 一种基于相似性剪枝和高效模块的轻量化图像分类方法 | |
CN118247821A (zh) | 一种基于混合注意力机制和多尺度特征融合的人员情绪识别方法 | |
CN112733810A (zh) | 一种特征码转换网络模型的构建方法 | |
CN115080699B (zh) | 基于模态特异自适应缩放与注意力网络的跨模态检索方法 | |
CN117009674A (zh) | 融合数据增强和对比学习的云原生api推荐方法 | |
CN117034030A (zh) | 基于正反双向信息融合的脑电图数据对齐算法 | |
CN110826726B (zh) | 目标处理方法、目标处理装置、目标处理设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |