CN110378262A - 基于加性高斯核的核非负矩阵分解人脸识别方法、装置、系统及存储介质 - Google Patents
基于加性高斯核的核非负矩阵分解人脸识别方法、装置、系统及存储介质 Download PDFInfo
- Publication number
- CN110378262A CN110378262A CN201910610652.XA CN201910610652A CN110378262A CN 110378262 A CN110378262 A CN 110378262A CN 201910610652 A CN201910610652 A CN 201910610652A CN 110378262 A CN110378262 A CN 110378262A
- Authority
- CN
- China
- Prior art keywords
- matrix
- module
- base image
- training sample
- column
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 196
- 238000000034 method Methods 0.000 title claims abstract description 53
- 239000000654 additive Substances 0.000 title claims abstract description 43
- 230000000996 additive effect Effects 0.000 title claims abstract description 43
- 238000012549 training Methods 0.000 claims abstract description 59
- 230000006870 function Effects 0.000 claims description 80
- 239000013598 vector Substances 0.000 claims description 52
- 238000004590 computer program Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 abstract description 53
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 238000000354 decomposition reaction Methods 0.000 description 11
- 238000013507 mapping Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 6
- 238000010276 construction Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000000513 principal component analysis Methods 0.000 description 4
- 235000002566 Capsicum Nutrition 0.000 description 3
- 239000006002 Pepper Substances 0.000 description 3
- 241000722363 Piper Species 0.000 description 3
- 235000016761 Piper aduncum Nutrition 0.000 description 3
- 235000017804 Piper guineense Nutrition 0.000 description 3
- 235000008184 Piper nigrum Nutrition 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000011478 gradient descent method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明提供了一种基于加性高斯核的核非负矩阵分解人脸识别方法、系统及存储介质,该核非负矩阵分解人脸识别方法包括训练步骤和识别步骤。本发明的有益效果是:本发明的基于加性高斯核的核非负矩阵分解人脸识别方法对噪声具有鲁棒性,具有较快的收敛速度,并且本发明同现有的相关算法比较可知,本发明具有一定的优越性和鲁棒性。
Description
技术领域
本发明涉及人脸识别技术领域,尤其一种基于加性高斯核的核非负矩阵分解人脸识别方法、装置、系统及存储介质。
背景技术
随着信息化时代的到来,利用人体固有的生理特征和行为特征进行个人身份鉴定的生物识别技术成为了一个最活跃的研究领域之一。在生物识别技术的众多分支中,最容易被人们接受的一个技术是人脸识别技术,这是由于相对于其他生物识别技术而言,人脸识别具有无侵害性、非强制性、非接触性和并发性。
人脸识别技术包含两个阶段,第一阶段是特征提取,也就是提取人脸图像中的人脸特征信息,这一阶段直接决定了人脸识别技术的好坏;第二阶段是身份鉴定,根据提取出的特征信息进行个人身份鉴定。主成分分析(PCA)与奇异值分解(SVD)都是较为经典的特征提取方法,但是这两种方法提出的特征向量通常含有负元素,因此在原始样本为非负数据下,这些方法不具有合理性与可解释性。非负矩阵分解(NMF)是一种处理非负数据的特征提取方法,它的应用非常广泛,比如高光谱数据处理、人脸图像识别等。NMF算法在原始样本非负数据矩阵分解过程中,对提取的特征具有非负性限制,即分解后的所有分量都是非负的,因而可以提取非负的稀疏特征。NMF算法的实质也就是将非负矩阵X近似分解为基图像矩阵W和系数矩阵H的乘积,即X≈WH,且W和H都是非负矩阵。这样矩阵X的每一列就可以表示成矩阵W列向量的非负线性组合,这也符合NMF算法的构造依据——对整体的感知是由对组成整体的部分的感知构成的(纯加性)。近年来,学者们提出了许多对NMF变形的算法,例如,增强算法鲁棒性的鲁棒NMF算法(RNMF)、保持局部特征的图NMF算法(GNMF)、引入正交限制的正交NMF算法(ONMF)。然而,这些NMF算法都是线性方法。在人脸识别过程中,由于包含遮挡,光照,表情等干扰因素,导致脸部图像变得十分复杂。此时的人脸识别问题变成了一个非线性的问题,故线性方法不再适用。
对于处理非线性问题,核方法是一种有效方法,它为将线性算法拓展为非线性算法提供了一个精美的理论框架。核方法的基本思想是通过使用一个非线性映射函数将原始数据映射到高维特征空间中,使得被映射后的数据线性可分,然后将线性算法应用到被映射后的数据上。在核方法中,最关键的部分是核技巧的使用,通过利用核函数取代被映射数据的内积,因而不需要知道非线性映射函数的具体解析式。核技巧的使用降低了将映射扩展到功能空间即再生核希尔伯特空间(RKHS)的难度。多项式核与高斯核是两个常用的核函数。利用核方法,可以将线性算法NMF推广为核NMF算法(KNMF)。KNMF算法的主要思路是是通过非线性映射函数φ将矩阵X映射到高维特征空间中,并在这个特征空间中,利用NMF算法,将矩阵φ(X)近似分解为两个矩阵φ(W)与H的乘积,即φ(X)≈φ(W)H,且W和H为非负矩阵。
现存的KNMF算法有多项式核非负矩阵分解算法(PNMF)和高斯核非负矩阵分解算法(RBFNMF),这两种核函数对噪声和异常值十分敏感,故稳定性较差。
相关的技术方案:
1.核方法:
设{x1,x2,…,xn}是原始样本空间中的一组数据。核方法的主要思想是通过一个非线性映射函数φ(·)将样本从原始空间映射到一个更高维的特征空间,使得样本在这个特征空间内线性可分,且只要原始空间是有限维的,那么一定存在一个这样的高维特征空间。在这个特征空间内,就可以采用线性方法进行处理样本数据。但是特征空间维数可能很高,甚至是无穷维的,非线性映射的具体形式也很难确定。为了避开这些障碍,可以巧妙地利用核函数:
k(xi,xj)=<φ(xi),φ(xj)>=φ(xi)Τφ(xj),
即xi与xj在特征空间中的内积可以通过利用它们在原始样本空间中函数k(·,·)来计算。这样不仅解决了这些问题,还简化了计算过程。
常用的核函数有多项式核函数和高斯核函数(RBF)k(xi,xj)=exp(-||xi-xj||2/(2δ2))。
2.核非负矩阵分解算法(KNMF)
KNMF的主要目的是利用核方法解决NMF在非线性问题中的应用。首先将原始空间中的样本数据通过映射函数φ(·),映射到一个高维特征空间中,得到被映射的样本数据φ(X)=[φ(x1),φ(x2),…,φ(xn)],使得样本数据线性可分。然后,在高维特征空间中利用NMF算法处理被映射的数据,将φ(X)近似分解为两个矩阵φ(W)与H的乘积,即
φ(X)≈φ(W)H,
其中是基图像矩阵,是系数矩阵。为了衡量在矩阵分解过程中的损失,我们需要构建损失函数F(W,H),损失函数的值越小,分解出的矩阵越具有合理性。因此,KNMF的需要解决的最优化问题为:
这里损失函数F(W,H)定义如下:
在KNMF算法中,最主要的影响因素是核函数k(·,·)的选择,核函数隐式地定义了高维特征空间,若核函数选择不合适,那么意味着将样本数据映射到了一个不合适的特征空间,很可能导致性能不佳。.
3.基于多项式核的非线性非负矩阵分解算法(PNMF)
多项式核非负矩阵分解算法(PNMF)的损失函数为F(W,H),它基于多项式核函数求解优化问题(1),得到W和H的更新迭代公式为:
其中B是一个对角矩阵,其对角元素为
相关技术方案的缺点:
1、非负矩阵分解算法是一种线性的算法,而现实生活中许多问题都是非线性的,故难以取得让人满意的效果。
2、目前核非负矩阵分解算法大部分都是基于多项式核函数或者高斯核函数,这两种核函数不能消除异常值的影响,这使得算法的稳定性较差。
发明内容
本发明提供了一种基于加性高斯核的核非负矩阵分解人脸识别方法,包括训练步骤,所述训练步骤包括如下步骤:
第一步骤:将训练样本图像转化为训练样本矩阵V,设置误差阈值ε、最大迭代次数Imax,并输入训练样本矩阵V、误差阈值ε和最大迭代次数Imax
第二步骤:对基图像矩阵W和系数矩阵H进行初始化;
第三步骤:设置迭代次数n=0;
第四步骤:根据公式(12)更新基图像矩阵W和系数矩阵H;
第五步骤:使n=n+1;
第六步骤:判断目标函数F(W,H)≤ε或迭代次数n是否达到最大迭代次数Imax,如果是,那么输出基图像矩阵W和系数矩阵H,否则执行第四步骤;
在第四步骤中,公式(12)如下:
在公式(12)中,W表示基图像矩阵,H表示系数矩阵,wk是W的第k列,和H(t)表示wk和H的第t次迭代值,和H(t+1)分别表示wk和H的第t+1次迭代值;核矩阵其中元素kij=K(wi,xj),K为加性高斯核函数,wi,xj分别为基图像矩阵W的第i列和训练样本矩阵X的第j列;核矩阵其中元素kij=K(wi,wj),K为加性高斯核函数,wi,wj分别为基图像矩阵W的第i和第j列;s中的元素表示W对应列的列和,即s=(slk)且 和定义如下:
其中,xi是训练样本矩阵X的第i列,是W(t)的第i列,是矩阵H(t)的位于(k,i)的元素,是矩阵(HHT)(t)的位于(k,i)的元素。
作为本发明的进一步改进:该核非负矩阵分解人脸识别方法还包括在训练步骤之后再执行识别步骤,所述识别步骤包括:
第七步骤:计算训练样本中每类的平均特征向量mj(j=1,…,c),C为不同人脸类别数,j为第j类的标记数;
第八步骤:输入待识别人脸图像y,计算其特征向量hy=W+y,其中W+为W的Moore-Penrose逆;
第九步骤:计算待识别人脸图像的特征向量hy到第j类平均特征向量mj的距离dj=||hy-mj||F,j=1,…,c,||·||F为Frobenius范数,若hy与第p类样本的平均特征向量mp的距离dp最小,即则将待识别人脸图像y归于第p类;
第十步骤:输出类别P,从而完成人脸识别。
本发明还提供了一种基于加性高斯核的核非负矩阵分解人脸识别装置,包括训练模块,所述训练模块包括:
输入模块:用于将训练样本图像转化为训练样本矩阵V,设置误差阈值ε、最大迭代次数Imax,并输入训练样本矩阵V、误差阈值ε和最大迭代次数Imax;
初始化模块:用于对基图像矩阵W和系数矩阵H进行初始化;
赋值模块:用于设置迭代次数n=0;
更新模块:用于根据公式(6)更新基图像矩阵W和系数矩阵H;
计数模块:使n=n+1;
判断模块:判断目标函数F(W,H)≤ε或迭代次数n是否达到最大迭代次数Imax,如果是,那么输出基图像矩阵W和系数矩阵H,否则执行更新模块;
在更新模块中,公式(12)如下:
在公式(12)中,W表示基图像矩阵,H表示系数矩阵,wk是W的第k列,和H(t)表示wk和H的第t次迭代值,和H(t+1)分别表示wk和H的第t+1次迭代值;核矩阵其中元素kij=K(wi,xj),K为加性高斯核函数,wi,xj分别为基图像矩阵W的第i列和训练样本矩阵X的第j列;核矩阵其中元素kij=K(wi,wj),K为加性高斯核函数,wi,wj分别为基图像矩阵W的第i和第j列;s中的元素表示W对应列的列和,即s=(slk)且 和定义如下:
其中,xi是训练样本矩阵X的第i列,是W(t)的第i列,是矩阵H(t)的位于(k,i)的元素,是矩阵(HHT)(t)的位于(k,i)的元素。
作为本发明的进一步改进:该核非负矩阵分解人脸识别装置还包括在训练模块之后再执行识别模块,所述识别模块包括:
平均特征向量计算模块:用于计算训练样本中每类的平均特征向量mj(j=1,…,c),j为第j类的标记数,c为不同的人脸类别数;
特征向量计算模块:用于输入待识别人脸图像y,计算其特征向量hy=W+y,其中W+为W的Moore-Penrose逆,W表示基图像矩阵;
距离计算模块:计算待识别人脸图像的特征向量hy到第j类平均特征向量mj的距离dj=||hy-mj||F,j=1,…,c,||·||F为Frobenius范数,若hy与第p类样本的平均特征向量mp的距离dp最小,即则将待识别人脸图像y归于第p类;
输出模块:用于输出类别P,从而完成人脸识别。
本发明还公开了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序配置为由处理器调用时实现本发明所述的方法的步骤。
本发明还公开了一种基于加性高斯核的核非负矩阵分解人脸识别系统,包括:存储器、处理器以及存储在所述存储器上的计算机程序,所述计算机程序配置为由所述处理器调用时实现本发明所述的方法的步骤。
本发明的有益效果是:本发明的基于加性高斯核的核非负矩阵分解人脸识别方法对噪声具有鲁棒性,具有较快的收敛速度,并且本发明同现有的相关算法比较可知,本发明具有一定的优越性和鲁棒性。
附图说明
图1是本发明的算法构造过程流程图;
图2是本发明的方法流程图;
图3是本发明提出的基于加性高斯核的核非负矩阵分解人脸识别方法与相关算法(NMF,KPCA,PNMF)在Caltech 101人脸数据库上的识别率比较图;
图4是本发明提出的基于加性高斯核的核非负矩阵分解人脸识别方法与相关算法(NMF,KPCA,PNMF)在添加椒盐噪声的Caltech 101人脸数据库上的识别率比较图;
图5是本发明基于加性高斯核的核非负矩阵分解人脸识别方法的收敛曲线图。
具体实施方式
为了解决背景技术中的问题,本发明提出了一种具有鲁棒性的核函数,并将其应用于NMF算法中,得到了一种新奇的,具有鲁棒性的核NMF算法。实验结果表明,这种新的核NMF算法具有优越的性能。
本发明公开了一种基于加性高斯核的核非负矩阵分解人脸识别方法,本发明的主要目的有:
1.克服多项式核函数和传统高斯核函数鲁棒性较差的问题;
2.构建了一种具有抗噪性的加性高斯核函数。
3.构建一个能够抵抗噪声且具有高识别性能的核非负矩阵分解人脸识别方法。
一.关键词解释:
1.符号说明
X 矩阵
xj 矩阵X的第j列
x.^2 向量x中元素的平方
xij 矩阵X的第ij个元素
A⊙B 矩阵A与B中对应元素的积
矩阵A与B中对应元素的商
2.非负矩阵分解(Non-negative Matrix Factorization,NMF)
NMF的基本思想是将一个非负样本矩阵近似分解为两个非负矩阵的乘积,即:
X≈WH,
其中,和分别被称为基图像矩阵和系数矩阵。并且,通过构建损失函数度量X与WH之间的逼近程度,通常损失函数是基于F-范数被定义的,为:
3.核函数(Kernel Function)
令χ为输入空间,k(·,·)是定义在χ×χ上的对称函数,则k是核函数当且仅当对于任意数据D={x1,x2,…,xn},核矩阵K总是半正定的:
二.具体技术方案:
为了克服现存核非负矩阵分解算法稳健性较差的问题,我们构建了一种新奇的加性高斯核函数。
定义1:对于任意的向量函数k被定义为:
那么,可以证明k是一个核函数。我们称此函数为加性高斯核函数。核函数的值刻画了两个样本之间的相似程度。其值越大则相似度越大,反之则小。
上述加性核函数对噪声不敏感,而传统的高斯核函数是一种乘性核,即其对噪声不具有鲁棒性。因此,我们利用所构建的加性高斯核函数来开发核非负矩阵分解人脸识别算法,可以有效克服噪声的影响,增强算法的鲁棒性。
1.新KNMF的提出
目标函数的构建
新KNMF的目标函数定义如下:
为了利用新构建的加性高斯核函数求解目标函数(2)中的两个未知非负矩阵W和H,我们将目标函数转化为两个子目标函数,分别为:
f1(H)=F(W,H)其中W固定
f2(W)=F(W,H)其中H固定
则,问题(2)也演变成了两个子问题,分别为:
minf1(H)s.t.H≥0, (3)
minf2(W)s.t.W≥0. (4)
对系数矩阵H的学习
对于子问题(3),采用梯度下降法对系数矩阵H进行求解,有:
其中是关于hk的步长向量,是f1(H)关于hk的梯度,可以计算得:
将公式(6)带入公式(5)中有
为了保证hk的非负性,令:
因此,选择步长向量为:
将梯度与步长向量带入公式(5)中,得到hk的更新迭代公式为:
可将此更新迭代公式转化为矩阵形式,且有以下定理。
定理2:固定矩阵W,目标函数f1(H)是非增的,当子问题(3)中的系数矩阵H按以下迭代方式更新:
对基图像矩阵W的学习
对于子问题(4),固定矩阵H,对基图像矩阵W进行学习。我们定义f2(W)为目标函数F(W,H)中至于变量W有关的矩阵,则有
采用梯度下降法对基图像矩阵W进行求解,有:
其中是关于wk的步长向量,是f2(W)关于wk的梯度,可以计算得:
为了保证wk的非负性,我们选择步长为:
将梯度与步长向量带入公式(8)中,可以求出关于wk的迭代公式为:
且有如下定理。
定理3:固定矩阵H,目标函数f2(W)是非增的,当子问题(4)中的基图像矩阵W按迭代公式(11)更新。
综上所述,通过定理1和定理2,可以得到本专利提出的分数次幂内积核非负矩阵分解的更新迭代公式,为:
其中s=(slk)且
2.收敛性证明
迭代公式(7)的收敛性在其它文献中已有证明,这里我们主要讨论迭代公式(11)的收敛性。为此需要利用辅助函数的定义和性质:
定义1:对于任意的向量w和w(t),若满足条件
G(w,w(t))≥f(w),且G(w(t),w(t))=f(w(t)),
则称G(w,w(t))为函数f(w)的一个辅助函数。
引理1:如果G(w,w(t))是f(w)的一个辅助函数,那么f(w)在如下的更新法则下是单调不增的,
接下来,我们通过构造辅助函数证明定理3的成立性,也就是证明本专利构造的新算法具有收敛性。
定理4:是一个对角矩阵,且对角元素为
那么当σ≥8时,有
是f2(wk)的辅助函数。这里表示为:
证明:显然,当时,有因此我们只需要证明f2(wk)在列的二阶泰勒展开式如下:
这里表示为:
为了证明不等式这等价于证明:
即我们只需要证明矩阵是半正定的即可.对于都有:
显然由wai∈[0,1],我们有:
所以只需证明:
即证明:
这里又有
又因为
所以有
即
易知在R+单调递增,单调递减,当σ=8时,所以只要σ≥8,即可保证矩阵M半正定的.
综上所述,我们证明了不等式
根据定义1与引理1,我们可知函数是函数f2(wk)的一个上限,且为了得到的最小值,我们求解它的导数并令其为0,有
则可得:
其中:
由辅助函数的性质可知,我们的算法是收敛的。
3.特征提取
假设y是一个测试样本,非线性映射φ将其映射到特征空间中为,且φ(y)可以被表示为被映射后的基图像矩阵φ(W)的列向量的线性组合,为:
φ(y)=φ(W)hy,
其中hy为φ(y)的特征向量。上式两边同乘φ(W)Τ,可得
φ(W)Τφ(y)=φ(W)Τφ(W)hy,
即,
KWy=KWWhy,
其中KWy为一个核向量。因此,特征hy可以求出为
其中,是矩阵KWW的广义逆。类似的,我们可以得到训练样本的平均特征向量。假设原始空间中有c类样本,其中第j类的训练样本数为nj(j=1,2,…,c),训练样本矩阵为Xj,那么第j类的平均特征向量可以表示为:
其中,是一个维数为nj×1维的全一列向量。
综上,本发明基于加性高斯核的核非负矩阵分解人脸识别方法具体构建过程如下:
1.在本专利的算法中引入我们构建的具有较强鲁棒性的加性高斯核函数;
2.通过利用梯度下降法及推导出本专利算法的更新迭代公式;
3.通过构造辅助函数,证明了本专利算法的收敛性,从理论上保证了算法的合理性。
如图2所示,本发明提供了一种基于加性高斯核的核非负矩阵分解人脸识别方法,包括训练步骤,所述训练步骤包括如下步骤:
第一步骤:将训练样本图像转化为训练样本矩阵V,设置误差阈值ε、最大迭代次数Imax,并输入训练样本矩阵V、误差阈值ε和最大迭代次数Imax;
第二步骤:对基图像矩阵W和系数矩阵H进行初始化;
第三步骤:设置迭代次数n=0;
第四步骤:根据公式(12)更新基图像矩阵W和系数矩阵H;
第五步骤:使n=n+1;
第六步骤:判断目标函数F(W,H)≤ε或迭代次数n是否达到最大迭代次数Imax,如果是,那么输出基图像矩阵W和系数矩阵H,否则执行第四步骤;
在第四步骤中,公式(12)如下:
在公式(12)中,W表示基图像矩阵,H表示系数矩阵,wk是W的第k列,和H(t)表示wk和H的第t次迭代值,和H(t+1)分别表示wk和H的第t+1次迭代值;核矩阵其中元素kij=K(wi,xj),K为加性高斯核函数,wi,xj分别为基图像矩阵W的第i列和训练样本矩阵X的第j列;核矩阵其中元素kij=K(wi,wj),K为加性高斯核函数,wi,wj分别为基图像矩阵W的第i和第j列;s中的元素表示W对应列的列和,即s=(slk)且 和定义如下:
其中,xi是训练样本矩阵X的第i列,是W(t)的第i列,是矩阵H(t)的位于(k,i)的元素,是矩阵(HHT)(t)的位于(k,i)的元素。
该核非负矩阵分解人脸识别方法还包括在训练步骤之后再执行识别步骤,所述识别步骤包括:
第七步骤:计算训练样本中每类的平均特征向量mj(j=1,…,c),j为第j类的标记数,c为不同人脸类别数;
第八步骤:输入待识别人脸图像y,计算其特征向量hy=W+y,其中W+为W的Moore-Penrose逆,W表示基图像矩阵;
第九步骤:计算待识别人脸图像的特征向量hy到第j类平均特征向量mj的距离dj=||hy-mj||F,j=1,…,c,||·||F为Frobenius范数,若hy与第p类样本的平均特征向量mp的距离dp最小,即则将待识别人脸图像y归于第p类;
第十步骤:输出类别P,从而完成人脸识别。
输出类别P,表示待识别人脸图像y被识别为第P个人脸类别,所以输出类别P后,人脸识别就完成了。
本发明还提供了一种基于加性高斯核的核非负矩阵分解人脸识别装置,包括训练模块,所述训练模块包括:
输入模块:用于将训练样本图像转化为训练样本矩阵V,设置误差阈值ε、最大迭代次数Imax,并输入训练样本矩阵V、误差阈值ε和最大迭代次数Imax;
初始化模块:用于对基图像矩阵W和系数矩阵H进行初始化;
赋值模块:用于设置迭代次数n=0;
更新模块:用于根据公式(12)更新基图像矩阵W和系数矩阵H;
计数模块:使n=n+1;
判断模块:判断目标函数F(W,H)≤ε或迭代次数n是否达到最大迭代次数Imax,如果是,那么输出基图像矩阵W和系数矩阵H,否则执行更新模块;
在更新模块中,公式(12)如下:
在公式(12)中,W表示基图像矩阵,H表示系数矩阵,wk是W的第k列,和H(t)表示wk和H的第t次迭代值,和H(t+1)分别表示wk和H的第t+1次迭代值;核矩阵其中元素kij=K(wi,xj),K为加性高斯核函数,wi,xj分别为基图像矩阵W的第i列和训练样本矩阵X的第j列;核矩阵其中元素kij=K(wi,wj),K为加性高斯核函数,wi,wj分别为基图像矩阵W的第i和第j列;s中的元素表示W对应列的列和,即s=(slk)且 和定义如下:
其中,xi是训练样本矩阵X的第i列,是W(t)的第i列,是矩阵H(t)的位于(k,i)的元素,是矩阵(HHT)(t)的位于(k,i)的元素。
该核非负矩阵分解人脸识别装置还包括在训练模块之后再执行识别模块,所述识别模块包括:
平均特征向量计算模块:用于计算训练样本中每类的平均特征向量mj(j=1,…,c),j为第j类的标记数,c为不同的人脸类别数;
特征向量计算模块:用于输入待识别人脸图像y,计算其特征向量hy=W+y,其中W+为W的Moore-Penrose逆,W表示基图像矩阵;
距离计算模块:计算待识别人脸图像的特征向量hy到第j类平均特征向量mj的距离dj=||hy-mj||F,j=1,…,c,||·||F为Frobenius范数,若hy与第p类样本的平均特征向量mp的距离dp最小,即则将待识别人脸图像y归于第p类;
输出模块:用于输出类别P,从而完成人脸识别。
本发明还公开了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序配置为由处理器调用时实现本发明所述的方法的步骤。
本发明还公开了一种基于加性高斯核的核非负矩阵分解人脸识别系统,包括:存储器、处理器以及存储在所述存储器上的计算机程序,所述计算机程序配置为由所述处理器调用时实现本发明所述的方法的步骤。
表1是本发明提出的基于加性高斯核的核非负矩阵分解人脸识别方法(OurMethod)与非负矩阵分解(NMF)、核主成分分析(KPCA)和多项式核非负矩阵分解(PNMF)在Caltech101人脸数据库上的识别率(%)比较(TN表示每一类的训练样本数)
TN | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
NMF | 70.00 | 74.01 | 76.45 | 78.66 | 79.74 | 79.65 | 84.01 |
KPCA | 59.36 | 63.77 | 65.18 | 66.27 | 68.16 | 70.94 | 72.04 |
PNMF | 65.56 | 68.58 | 73.29 | 75.36 | 75.26 | 79.01 | 78.62 |
Our Method | 73.23 | 75.83 | 79.21 | 80.10 | 82.00 | 83.80 | 85.39 |
表1
表2是本发明提出的基于加性高斯核的核非负矩阵分解人脸识别方法(OurMethod)与非负矩阵分解(NMF)、核主成分分析(KPCA)和多项式核非负矩阵分解(PNMF)在添加椒盐噪声的Caltech101人脸数据库上的
识别率(%)比较(d表示椒盐噪声密度)
d | 0 | 0.05 | 0.1 | 0.15 | 0.2 | 0.25 | 0.3 |
NMF | 79.42 | 80.00 | 78.95 | 77.66 | 75.56 | 72.63 | 70.88 |
KPCA | 70.41 | 69.30 | 71.05 | 67.02 | 62.05 | 59.65 | 54.09 |
PNMF | 75.26 | 76.96 | 76.96 | 73.10 | 72.98 | 71.99 | 68.01 |
Our Method | 81.93 | 82.11 | 82.92 | 81.75 | 79.77 | 79.24 | 77.36 |
表2
本发明的有益效果:
1.通过构建的具有抗噪性的加性高斯核函数,得到了一种具有抗噪性的核非负矩阵分解算法。实验结果表明,本发明的算法对噪声具有鲁棒性。
2.本发明所提出的算法的收敛性,不仅通过利用辅助函数在理论上进行了证明,而且在实验中也得到了验证,本发明的算法具有较快的收敛速度。
3.通过在公开的人脸数据库中与相关算法进行实验比较,结果表明本专利开发的算法具有一定的优越性。
4.通过在添加噪声的人脸数据库中与相关算法进行实验比较,结果表明本发明开发的算法具有很好的鲁棒性。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (6)
1.一种基于加性高斯核的核非负矩阵分解人脸识别方法,其特征在于,包括训练步骤,所述训练步骤包括如下步骤:
第一步骤:将训练样本图像转化为训练样本矩阵V,设置误差阈值ε、最大迭代次数Imax,并输入训练样本矩阵V、误差阈值ε和最大迭代次数Imax;
第二步骤:对基图像矩阵W和系数矩阵H进行初始化;
第三步骤:设置迭代次数n=0;
第四步骤:根据公式(12)更新基图像矩阵W和系数矩阵H;
第五步骤:使n=n+1;
第六步骤:判断目标函数F(W,H)≤ε或迭代次数n是否达到最大迭代次数Imax,如果是,那么输出基图像矩阵W和系数矩阵H,否则执行第四步骤;
在第四步骤中,公式(12)如下:
在公式(12)中,W表示基图像矩阵,H表示系数矩阵,wk是W的第k列,和H(t)表示wk和H的第t次迭代值,和H(t+1)分别表示wk和H的第t+1次迭代值;核矩阵其中元素kij=K(wi,xj),K为加性高斯核函数,wi,xj分别为基图像矩阵W的第i列和训练样本矩阵X的第j列;核矩阵其中元素kij=K(wi,wj),K为加性高斯核函数,wi,wj分别为基图像矩阵W的第i和第j列;s中的元素表示W对应列的列和,即s=(slk)且 和定义如下:
其中,xi是训练样本矩阵X的第i列,是W(t)的第i列,是矩阵H(t)的位于(k,i)的元素,是矩阵(HHT)(t)的位于(k,i)的元素。
2.根据权利要求1所述的核非负矩阵分解人脸识别方法,其特征在于,该核非负矩阵分解人脸识别方法还包括在训练步骤之后再执行识别步骤,所述识别步骤包括:
第七步骤:计算训练样本中每类的平均特征向量mj(j=1,…,c),c为不同人脸类别数,j为第j类的标记数;
第八步骤:输入待识别人脸图像y,计算其特征向量hy=W+y,其中W+为W的Moore-Penrose逆,W表示基图像矩阵;
第九步骤:计算待识别人脸图像的特征向量hy到第j类平均特征向量mj的距离dj=||hy-mj||F,j=1,…,c,||·||F为Frobenius范数,若hy与第p类样本的平均特征向量mp的距离dp最小,即则将待识别人脸图像y归于第p类;
第十步骤:输出类别P,从而完成人脸识别。
3.一种基于加性高斯核的核非负矩阵分解人脸识别装置,其特征在于,包括训练模块,所述训练模块包括:
输入模块:用于将训练样本图像转化为训练样本矩阵V,设置误差阈值ε、最大迭代次数Imax,并输入训练样本矩阵V、误差阈值ε和最大迭代次数Imax;
初始化模块:用于对基图像矩阵W和系数矩阵H进行初始化;
赋值模块:用于设置迭代次数n=0;
更新模块:用于根据公式(12)更新基图像矩阵W和系数矩阵H;
计数模块:使n=n+1;
判断模块:判断目标函数F(W,H)≤ε或迭代次数n是否达到最大迭代次数Imax,如果是,那么输出基图像矩阵W和系数矩阵H,否则执行更新模块;
在更新模块中,公式(12)如下:
在公式(12)中,W表示基图像矩阵,H表示系数矩阵,wk是W的第k列,和H(t)表示wk和H的第t次迭代值,和H(t+1)分别表示wk和H的第t+1次迭代值;核矩阵其中元素kij=K(wi,xj),K为加性高斯核函数,wi,xj分别为基图像矩阵W的第i列和训练样本矩阵X的第j列;核矩阵其中元素kij=K(wi,wj),K为加性高斯核函数,wi,wj分别为基图像矩阵W的第i和第j列;s中的元素表示W对应列的列和,即s=(slk)且 和定义如下:
其中,xi是训练样本矩阵X的第i列,是W(t)的第i列,是矩阵H(t)的位于(k,i)的元素,是矩阵(HHT)(t)的位于(k,i)的元素。
4.根据权利要求3所述的核非负矩阵分解人脸识别装置,其特征在于,该核非负矩阵分解人脸识别装置还包括在训练模块之后再执行识别模块,所述识别模块包括:
平均特征向量计算模块:用于计算训练样本中每类的平均特征向量mj(j=1,…,c),c为不同的人脸类别数,j为第j类的标记数;
特征向量计算模块:用于输入待识别人脸图像y,计算其特征向量hy=W+y,其中W+为W的Moore-Penrose逆,W表示基图像矩阵;
距离计算模块:计算待识别人脸图像的特征向量hy到第j类平均特征向量mj的距离dj=||hy-mj||F,j=1,…,c,||·||F为Frobenius范数,若hy与第p类样本的平均特征向量mp的距离dp最小,即则将待识别人脸图像y归于第p类;
输出模块:用于输出类别P,从而完成人脸识别。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序配置为由处理器调用时实现权利要求1-2中任一项所述的方法的步骤。
6.一种基于加性高斯核的核非负矩阵分解人脸识别系统,其特征在于,包括:存储器、处理器以及存储在所述存储器上的计算机程序,所述计算机程序配置为由所述处理器调用时实现权利要求1-2中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910610652.XA CN110378262B (zh) | 2019-07-08 | 2019-07-08 | 基于加性高斯核的核非负矩阵分解人脸识别方法、装置、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910610652.XA CN110378262B (zh) | 2019-07-08 | 2019-07-08 | 基于加性高斯核的核非负矩阵分解人脸识别方法、装置、系统及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110378262A true CN110378262A (zh) | 2019-10-25 |
CN110378262B CN110378262B (zh) | 2022-12-13 |
Family
ID=68252338
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910610652.XA Active CN110378262B (zh) | 2019-07-08 | 2019-07-08 | 基于加性高斯核的核非负矩阵分解人脸识别方法、装置、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110378262B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111126169A (zh) * | 2019-12-03 | 2020-05-08 | 重庆邮电大学 | 基于正交化的图正则非负矩阵分解的人脸识别方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050071300A1 (en) * | 2001-05-07 | 2005-03-31 | Bartlett Peter L | Kernels and methods for selecting kernels for use in learning machines |
CN105095835A (zh) * | 2014-05-12 | 2015-11-25 | 比亚迪股份有限公司 | 行人检测方法及系统 |
CN106169073A (zh) * | 2016-07-11 | 2016-11-30 | 北京科技大学 | 一种表情识别方法及系统 |
US20160371563A1 (en) * | 2015-06-22 | 2016-12-22 | The Johns Hopkins University | System and method for structured low-rank matrix factorization: optimality, algorithm, and applications to image processing |
CN107330364A (zh) * | 2017-05-27 | 2017-11-07 | 上海交通大学 | 一种基于cGAN网络的人群计数方法及系统 |
CN107480636A (zh) * | 2017-08-15 | 2017-12-15 | 深圳大学 | 基于核非负矩阵分解的人脸识别方法、系统及存储介质 |
CN107784293A (zh) * | 2017-11-13 | 2018-03-09 | 中国矿业大学(北京) | 一种基于全局特征和稀疏表示分类的人体行为识别方法 |
WO2018126638A1 (zh) * | 2017-01-03 | 2018-07-12 | 京东方科技集团股份有限公司 | 检测图像中的特征点的方法、设备和计算机可读存储介质 |
CN109508697A (zh) * | 2018-12-14 | 2019-03-22 | 深圳大学 | 基于e辅助函数的半非负矩阵分解的人脸识别方法、系统及存储介质 |
-
2019
- 2019-07-08 CN CN201910610652.XA patent/CN110378262B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050071300A1 (en) * | 2001-05-07 | 2005-03-31 | Bartlett Peter L | Kernels and methods for selecting kernels for use in learning machines |
CN105095835A (zh) * | 2014-05-12 | 2015-11-25 | 比亚迪股份有限公司 | 行人检测方法及系统 |
US20160371563A1 (en) * | 2015-06-22 | 2016-12-22 | The Johns Hopkins University | System and method for structured low-rank matrix factorization: optimality, algorithm, and applications to image processing |
CN106169073A (zh) * | 2016-07-11 | 2016-11-30 | 北京科技大学 | 一种表情识别方法及系统 |
WO2018126638A1 (zh) * | 2017-01-03 | 2018-07-12 | 京东方科技集团股份有限公司 | 检测图像中的特征点的方法、设备和计算机可读存储介质 |
CN107330364A (zh) * | 2017-05-27 | 2017-11-07 | 上海交通大学 | 一种基于cGAN网络的人群计数方法及系统 |
CN107480636A (zh) * | 2017-08-15 | 2017-12-15 | 深圳大学 | 基于核非负矩阵分解的人脸识别方法、系统及存储介质 |
CN107784293A (zh) * | 2017-11-13 | 2018-03-09 | 中国矿业大学(北京) | 一种基于全局特征和稀疏表示分类的人体行为识别方法 |
CN109508697A (zh) * | 2018-12-14 | 2019-03-22 | 深圳大学 | 基于e辅助函数的半非负矩阵分解的人脸识别方法、系统及存储介质 |
Non-Patent Citations (5)
Title |
---|
HAITAO CHEN,ET AL.: "A Novel Enhanced Nonnegative Feature Extraction Approach", 《2018 14TH INTERNATIONAL CONFERENCE ON COMPUTATIONAL INTELLIGENCE AND SECURITY》 * |
HE BINSHENG: "Human Microbe-Disease Association Prediction With Graph Regularized Non-Negative Matrix Factorization", 《FRONTIERS IN MICROBIOLOGY》 * |
WEN-SHENG CHEN,ET AL.: "KERNEL NONNEGATIVE MATRIX FACTORIZATION WITH RBF KERNEL FUNCTION FOR FACE RECOGNITION", 《PROCEEDINGS OF THE 2017 INTERNATIONAL CONFERENCE ON MACHINE LEARNING AND CYBERNETICS》 * |
孙锐等: "基于显著性检测与HOG-NMF特征的快速行人检测方法", 《电子与信息学报》 * |
李育高: "基于非负矩阵分解的人脸识别算法研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111126169A (zh) * | 2019-12-03 | 2020-05-08 | 重庆邮电大学 | 基于正交化的图正则非负矩阵分解的人脸识别方法及系统 |
CN111126169B (zh) * | 2019-12-03 | 2022-08-30 | 重庆邮电大学 | 基于正交化的图正则非负矩阵分解的人脸识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110378262B (zh) | 2022-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Brbić et al. | Multi-view low-rank sparse subspace clustering | |
Zhang et al. | Robust non-negative matrix factorization | |
CN109063698B (zh) | 一种非负特征提取及人脸识别应用方法、系统及存储介质 | |
Saegusa et al. | Joint estimation of precision matrices in heterogeneous populations | |
Zhang et al. | Unsupervised nonnegative adaptive feature extraction for data representation | |
Pei et al. | Concept factorization with adaptive neighbors for document clustering | |
Zhang et al. | Binary-and multi-class group sparse canonical correlation analysis for feature extraction and classification | |
CN108415883B (zh) | 基于子空间聚类的凸非负矩阵分解方法 | |
Zhang et al. | Kernel-induced label propagation by mapping for semi-supervised classification | |
Shrivastava et al. | Learning discriminative dictionaries with partially labeled data | |
CN105469063B (zh) | 鲁棒的人脸图像主成分特征提取方法及识别装置 | |
WO2020010602A1 (zh) | 一种非线性非负矩阵分解人脸识别构建方法、系统及存储介质 | |
CN109002794B (zh) | 一种非线性非负矩阵分解人脸识别构建方法、系统及存储介质 | |
CN110070028B (zh) | 基于共轭梯度法的人脸图像非负特征表示与识别方法、系统及存储介质 | |
CN109508697B (zh) | 基于e辅助函数的半非负矩阵分解的人脸识别方法、系统及存储介质 | |
CN105740912A (zh) | 基于核范数正则化的低秩图像特征提取的识别方法及系统 | |
WO2021003637A1 (zh) | 基于加性高斯核的核非负矩阵分解人脸识别方法、装置、系统及存储介质 | |
CN109063555B (zh) | 基于低秩分解和稀疏表示残差对比的多姿态人脸识别方法 | |
Khouja et al. | Tensor decomposition for learning Gaussian mixtures from moments | |
CN114743058A (zh) | 基于混合范数正则约束的宽度学习图像分类方法及装置 | |
CN110378262B (zh) | 基于加性高斯核的核非负矩阵分解人脸识别方法、装置、系统及存储介质 | |
CN106650769A (zh) | 基于线性表示多视图鉴别字典学习的分类方法 | |
CN108009586B (zh) | 封顶概念分解方法及图像聚类方法 | |
Escolano et al. | From points to nodes: Inverse graph embedding through a lagrangian formulation | |
Zhang et al. | Low‐rank constrained weighted discriminative regression for multi‐view feature learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |