CN110378262A

CN110378262A - 基于加性高斯核的核非负矩阵分解人脸识别方法、装置、系统及存储介质

Info

Publication number: CN110378262A
Application number: CN201910610652.XA
Authority: CN
Inventors: 陈文胜; 陈海涛; 黄显坤
Original assignee: Shenzhen University
Current assignee: Shenzhen University
Priority date: 2019-07-08
Filing date: 2019-07-08
Publication date: 2019-10-25
Anticipated expiration: 2039-07-08
Also published as: CN110378262B

Abstract

本发明提供了一种基于加性高斯核的核非负矩阵分解人脸识别方法、系统及存储介质，该核非负矩阵分解人脸识别方法包括训练步骤和识别步骤。本发明的有益效果是：本发明的基于加性高斯核的核非负矩阵分解人脸识别方法对噪声具有鲁棒性，具有较快的收敛速度，并且本发明同现有的相关算法比较可知，本发明具有一定的优越性和鲁棒性。

Description

基于加性高斯核的核非负矩阵分解人脸识别方法、装置、系统及存储介质

技术领域

本发明涉及人脸识别技术领域，尤其一种基于加性高斯核的核非负矩阵分解人脸识别方法、装置、系统及存储介质。

背景技术

随着信息化时代的到来，利用人体固有的生理特征和行为特征进行个人身份鉴定的生物识别技术成为了一个最活跃的研究领域之一。在生物识别技术的众多分支中，最容易被人们接受的一个技术是人脸识别技术，这是由于相对于其他生物识别技术而言，人脸识别具有无侵害性、非强制性、非接触性和并发性。

人脸识别技术包含两个阶段，第一阶段是特征提取，也就是提取人脸图像中的人脸特征信息，这一阶段直接决定了人脸识别技术的好坏；第二阶段是身份鉴定，根据提取出的特征信息进行个人身份鉴定。主成分分析(PCA)与奇异值分解(SVD)都是较为经典的特征提取方法，但是这两种方法提出的特征向量通常含有负元素，因此在原始样本为非负数据下，这些方法不具有合理性与可解释性。非负矩阵分解(NMF)是一种处理非负数据的特征提取方法，它的应用非常广泛，比如高光谱数据处理、人脸图像识别等。NMF算法在原始样本非负数据矩阵分解过程中，对提取的特征具有非负性限制，即分解后的所有分量都是非负的，因而可以提取非负的稀疏特征。NMF算法的实质也就是将非负矩阵X近似分解为基图像矩阵W和系数矩阵H的乘积，即X≈WH，且W和H都是非负矩阵。这样矩阵X的每一列就可以表示成矩阵W列向量的非负线性组合，这也符合NMF算法的构造依据——对整体的感知是由对组成整体的部分的感知构成的(纯加性)。近年来，学者们提出了许多对NMF变形的算法，例如，增强算法鲁棒性的鲁棒NMF算法(RNMF)、保持局部特征的图NMF算法(GNMF)、引入正交限制的正交NMF算法(ONMF)。然而，这些NMF算法都是线性方法。在人脸识别过程中，由于包含遮挡，光照，表情等干扰因素，导致脸部图像变得十分复杂。此时的人脸识别问题变成了一个非线性的问题，故线性方法不再适用。

对于处理非线性问题，核方法是一种有效方法，它为将线性算法拓展为非线性算法提供了一个精美的理论框架。核方法的基本思想是通过使用一个非线性映射函数将原始数据映射到高维特征空间中，使得被映射后的数据线性可分，然后将线性算法应用到被映射后的数据上。在核方法中，最关键的部分是核技巧的使用，通过利用核函数取代被映射数据的内积，因而不需要知道非线性映射函数的具体解析式。核技巧的使用降低了将映射扩展到功能空间即再生核希尔伯特空间(RKHS)的难度。多项式核与高斯核是两个常用的核函数。利用核方法，可以将线性算法NMF推广为核NMF算法(KNMF)。KNMF算法的主要思路是是通过非线性映射函数φ将矩阵X映射到高维特征空间中，并在这个特征空间中，利用NMF算法，将矩阵φ(X)近似分解为两个矩阵φ(W)与H的乘积，即φ(X)≈φ(W)H，且W和H为非负矩阵。

现存的KNMF算法有多项式核非负矩阵分解算法(PNMF)和高斯核非负矩阵分解算法(RBFNMF)，这两种核函数对噪声和异常值十分敏感，故稳定性较差。

相关技术方案的缺点：

1、非负矩阵分解算法是一种线性的算法，而现实生活中许多问题都是非线性的，故难以取得让人满意的效果。

2、目前核非负矩阵分解算法大部分都是基于多项式核函数或者高斯核函数，这两种核函数不能消除异常值的影响，这使得算法的稳定性较差。

发明内容

本发明提供了一种基于加性高斯核的核非负矩阵分解人脸识别方法，包括训练步骤，所述训练步骤包括如下步骤：

第一步骤：将训练样本图像转化为训练样本矩阵V，设置误差阈值ε、最大迭代次数I_max，并输入训练样本矩阵V、误差阈值ε和最大迭代次数I_max

第二步骤：对基图像矩阵W和系数矩阵H进行初始化；

第三步骤：设置迭代次数n＝0；

第四步骤：根据公式(12)更新基图像矩阵W和系数矩阵H；

第五步骤：使n＝n+1；

第六步骤：判断目标函数F(W,H)≤ε或迭代次数n是否达到最大迭代次数I_max，如果是，那么输出基图像矩阵W和系数矩阵H，否则执行第四步骤；

在第四步骤中，公式(12)如下：

在公式(12)中，W表示基图像矩阵，H表示系数矩阵，w_k是W的第k列，和H^(t)表示w_k和H的第t次迭代值，和H^(t+1)分别表示w_k和H的第t+1次迭代值；核矩阵其中元素k_ij＝K(w_i,x_j)，K为加性高斯核函数，w_i,x_j分别为基图像矩阵W的第i列和训练样本矩阵X的第j列；核矩阵其中元素k_ij＝K(w_i,w_j)，K为加性高斯核函数，w_i,w_j分别为基图像矩阵W的第i和第j列；s中的元素表示W对应列的列和，即s＝(s_lk)且和定义如下：

其中，x_i是训练样本矩阵X的第i列，是W^(t)的第i列，是矩阵H^(t)的位于(k,i)的元素，是矩阵(HH^T)^(t)的位于(k,i)的元素。

作为本发明的进一步改进：该核非负矩阵分解人脸识别方法还包括在训练步骤之后再执行识别步骤，所述识别步骤包括：

第七步骤：计算训练样本中每类的平均特征向量m_j(j＝1,…,c)，C为不同人脸类别数，j为第j类的标记数；

第八步骤:输入待识别人脸图像y，计算其特征向量h_y＝W⁺y,其中W⁺为W的Moore-Penrose逆；

第九步骤:计算待识别人脸图像的特征向量h_y到第j类平均特征向量m_j的距离d_j＝||h_y-m_j||_F，j＝1,…,c,||·||_F为Frobenius范数，若h_y与第p类样本的平均特征向量m_p的距离d_p最小，即则将待识别人脸图像y归于第p类；

第十步骤：输出类别P，从而完成人脸识别。

本发明还提供了一种基于加性高斯核的核非负矩阵分解人脸识别装置，包括训练模块，所述训练模块包括：

输入模块：用于将训练样本图像转化为训练样本矩阵V，设置误差阈值ε、最大迭代次数I_max，并输入训练样本矩阵V、误差阈值ε和最大迭代次数I_max；

初始化模块：用于对基图像矩阵W和系数矩阵H进行初始化；

赋值模块：用于设置迭代次数n＝0；

更新模块：用于根据公式(6)更新基图像矩阵W和系数矩阵H；

计数模块：使n＝n+1；

判断模块：判断目标函数F(W,H)≤ε或迭代次数n是否达到最大迭代次数I_max，如果是，那么输出基图像矩阵W和系数矩阵H，否则执行更新模块；

在更新模块中，公式(12)如下：

作为本发明的进一步改进：该核非负矩阵分解人脸识别装置还包括在训练模块之后再执行识别模块，所述识别模块包括：

平均特征向量计算模块：用于计算训练样本中每类的平均特征向量m_j(j＝1,…,c)，j为第j类的标记数，c为不同的人脸类别数；

特征向量计算模块:用于输入待识别人脸图像y，计算其特征向量h_y＝W⁺y,其中W⁺为W的Moore-Penrose逆，W表示基图像矩阵；

距离计算模块:计算待识别人脸图像的特征向量h_y到第j类平均特征向量m_j的距离d_j＝||h_y-m_j||_F，j＝1,…,c,||·||_F为Frobenius范数，若h_y与第p类样本的平均特征向量m_p的距离d_p最小，即则将待识别人脸图像y归于第p类；

输出模块：用于输出类别P，从而完成人脸识别。

本发明还公开了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序配置为由处理器调用时实现本发明所述的方法的步骤。

本发明还公开了一种基于加性高斯核的核非负矩阵分解人脸识别系统，包括：存储器、处理器以及存储在所述存储器上的计算机程序，所述计算机程序配置为由所述处理器调用时实现本发明所述的方法的步骤。

本发明的有益效果是：本发明的基于加性高斯核的核非负矩阵分解人脸识别方法对噪声具有鲁棒性，具有较快的收敛速度，并且本发明同现有的相关算法比较可知，本发明具有一定的优越性和鲁棒性。

附图说明

图1是本发明的算法构造过程流程图；

图2是本发明的方法流程图；

图3是本发明提出的基于加性高斯核的核非负矩阵分解人脸识别方法与相关算法(NMF，KPCA，PNMF)在Caltech 101人脸数据库上的识别率比较图；

图4是本发明提出的基于加性高斯核的核非负矩阵分解人脸识别方法与相关算法(NMF，KPCA，PNMF)在添加椒盐噪声的Caltech 101人脸数据库上的识别率比较图；

图5是本发明基于加性高斯核的核非负矩阵分解人脸识别方法的收敛曲线图。

具体实施方式

为了解决背景技术中的问题，本发明提出了一种具有鲁棒性的核函数，并将其应用于NMF算法中，得到了一种新奇的，具有鲁棒性的核NMF算法。实验结果表明，这种新的核NMF算法具有优越的性能。

本发明公开了一种基于加性高斯核的核非负矩阵分解人脸识别方法，本发明的主要目的有：

1.克服多项式核函数和传统高斯核函数鲁棒性较差的问题；

2.构建了一种具有抗噪性的加性高斯核函数。

3.构建一个能够抵抗噪声且具有高识别性能的核非负矩阵分解人脸识别方法。

一.关键词解释：

1.符号说明

X 矩阵

x_j 矩阵X的第j列

x^{.^2} 向量x中元素的平方

x_ij 矩阵X的第ij个元素

A⊙B 矩阵A与B中对应元素的积

矩阵A与B中对应元素的商

2.非负矩阵分解(Non-negative Matrix Factorization，NMF)

NMF的基本思想是将一个非负样本矩阵近似分解为两个非负矩阵的乘积，即：

X≈WH,

其中，和分别被称为基图像矩阵和系数矩阵。并且，通过构建损失函数度量X与WH之间的逼近程度,通常损失函数是基于F-范数被定义的，为：

3.核函数(Kernel Function)

令χ为输入空间，k(·,·)是定义在χ×χ上的对称函数，则k是核函数当且仅当对于任意数据D＝{x₁,x₂,…,x_n}，核矩阵K总是半正定的：

二.具体技术方案：

为了克服现存核非负矩阵分解算法稳健性较差的问题，我们构建了一种新奇的加性高斯核函数。

定义1：对于任意的向量函数k被定义为：

那么，可以证明k是一个核函数。我们称此函数为加性高斯核函数。核函数的值刻画了两个样本之间的相似程度。其值越大则相似度越大，反之则小。

上述加性核函数对噪声不敏感，而传统的高斯核函数是一种乘性核，即其对噪声不具有鲁棒性。因此，我们利用所构建的加性高斯核函数来开发核非负矩阵分解人脸识别算法，可以有效克服噪声的影响，增强算法的鲁棒性。

1.新KNMF的提出

目标函数的构建

新KNMF的目标函数定义如下：

为了利用新构建的加性高斯核函数求解目标函数(2)中的两个未知非负矩阵W和H，我们将目标函数转化为两个子目标函数，分别为：

f₁(H)＝F(W,H)其中W固定

f₂(W)＝F(W,H)其中H固定

则，问题(2)也演变成了两个子问题，分别为：

minf₁(H)s.t.H≥0， (3)

minf₂(W)s.t.W≥0. (4)

对系数矩阵H的学习

对于子问题(3)，采用梯度下降法对系数矩阵H进行求解，有：

其中是关于h_k的步长向量，是f₁(H)关于h_k的梯度，可以计算得：

将公式(6)带入公式(5)中有

为了保证h_k的非负性，令：

因此，选择步长向量为：

将梯度与步长向量带入公式(5)中，得到h_k的更新迭代公式为：

可将此更新迭代公式转化为矩阵形式，且有以下定理。

定理2：固定矩阵W，目标函数f₁(H)是非增的，当子问题(3)中的系数矩阵H按以下迭代方式更新：

对基图像矩阵W的学习

对于子问题(4)，固定矩阵H，对基图像矩阵W进行学习。我们定义f₂(W)为目标函数F(W,H)中至于变量W有关的矩阵，则有

采用梯度下降法对基图像矩阵W进行求解，有：

其中是关于w_k的步长向量，是f₂(W)关于w_k的梯度，可以计算得：

为了保证w_k的非负性，我们选择步长为：

将梯度与步长向量带入公式(8)中，可以求出关于w_k的迭代公式为：

且有如下定理。

定理3：固定矩阵H，目标函数f₂(W)是非增的，当子问题(4)中的基图像矩阵W按迭代公式(11)更新。

综上所述，通过定理1和定理2，可以得到本专利提出的分数次幂内积核非负矩阵分解的更新迭代公式，为：

其中s＝(s_lk)且

2.收敛性证明

迭代公式(7)的收敛性在其它文献中已有证明，这里我们主要讨论迭代公式(11)的收敛性。为此需要利用辅助函数的定义和性质：

定义1：对于任意的向量w和w^(t)，若满足条件

G(w,w^(t))≥f(w)，且G(w^(t),w^(t))＝f(w^(t))，

则称G(w,w^(t))为函数f(w)的一个辅助函数。

引理1：如果G(w,w^(t))是f(w)的一个辅助函数，那么f(w)在如下的更新法则下是单调不增的，

接下来，我们通过构造辅助函数证明定理3的成立性，也就是证明本专利构造的新算法具有收敛性。

定理4：是一个对角矩阵，且对角元素为

那么当σ≥8时，有

是f₂(w_k)的辅助函数。这里表示为：

证明：显然，当时，有因此我们只需要证明f₂(w_k)在列的二阶泰勒展开式如下：

这里表示为：

为了证明不等式这等价于证明：

即我们只需要证明矩阵是半正定的即可.对于都有：

显然由w_ai∈[0,1]，我们有：

所以只需证明：

即证明：

这里又有

又因为

所以有

即

易知在R⁺单调递增，单调递减，当σ＝8时，所以只要σ≥8,即可保证矩阵M半正定的.

综上所述，我们证明了不等式

根据定义1与引理1，我们可知函数是函数f₂(w_k)的一个上限，且为了得到的最小值，我们求解它的导数并令其为0，有

则可得：

其中：

由辅助函数的性质可知，我们的算法是收敛的。

3.特征提取

假设y是一个测试样本，非线性映射φ将其映射到特征空间中为，且φ(y)可以被表示为被映射后的基图像矩阵φ(W)的列向量的线性组合，为：

φ(y)＝φ(W)h_y，

其中h_y为φ(y)的特征向量。上式两边同乘φ(W)^Τ，可得

φ(W)^Τφ(y)＝φ(W)^Τφ(W)h_y，

即，

K_Wy＝K_WWh_y,

其中K_Wy为一个核向量。因此，特征h_y可以求出为

其中，是矩阵K_WW的广义逆。类似的，我们可以得到训练样本的平均特征向量。假设原始空间中有c类样本，其中第j类的训练样本数为n_j(j＝1,2,…,c)，训练样本矩阵为X_j，那么第j类的平均特征向量可以表示为：

其中，是一个维数为n_j×1维的全一列向量。

综上，本发明基于加性高斯核的核非负矩阵分解人脸识别方法具体构建过程如下：

1.在本专利的算法中引入我们构建的具有较强鲁棒性的加性高斯核函数；

2.通过利用梯度下降法及推导出本专利算法的更新迭代公式；

3.通过构造辅助函数，证明了本专利算法的收敛性，从理论上保证了算法的合理性。

如图2所示，本发明提供了一种基于加性高斯核的核非负矩阵分解人脸识别方法，包括训练步骤，所述训练步骤包括如下步骤：

第一步骤：将训练样本图像转化为训练样本矩阵V，设置误差阈值ε、最大迭代次数I_max，并输入训练样本矩阵V、误差阈值ε和最大迭代次数I_max；

第二步骤：对基图像矩阵W和系数矩阵H进行初始化；

第三步骤：设置迭代次数n＝0；

第四步骤：根据公式(12)更新基图像矩阵W和系数矩阵H；

第五步骤：使n＝n+1；

在第四步骤中，公式(12)如下：

该核非负矩阵分解人脸识别方法还包括在训练步骤之后再执行识别步骤，所述识别步骤包括：

第七步骤：计算训练样本中每类的平均特征向量m_j(j＝1,…,c)，j为第j类的标记数，c为不同人脸类别数；

第八步骤:输入待识别人脸图像y，计算其特征向量h_y＝W⁺y,其中W⁺为W的Moore-Penrose逆，W表示基图像矩阵；

第十步骤：输出类别P，从而完成人脸识别。

输出类别P，表示待识别人脸图像y被识别为第P个人脸类别，所以输出类别P后，人脸识别就完成了。

初始化模块：用于对基图像矩阵W和系数矩阵H进行初始化；

赋值模块：用于设置迭代次数n＝0；

更新模块：用于根据公式(12)更新基图像矩阵W和系数矩阵H；

计数模块：使n＝n+1；

在更新模块中，公式(12)如下：

该核非负矩阵分解人脸识别装置还包括在训练模块之后再执行识别模块，所述识别模块包括：

特征向量计算模块:用于输入待识别人脸图像y，计算其特征向量h_y＝W+y,其中W⁺为W的Moore-Penrose逆，W表示基图像矩阵；

输出模块：用于输出类别P，从而完成人脸识别。

表1是本发明提出的基于加性高斯核的核非负矩阵分解人脸识别方法(OurMethod)与非负矩阵分解(NMF)、核主成分分析(KPCA)和多项式核非负矩阵分解(PNMF)在Caltech101人脸数据库上的识别率(％)比较(TN表示每一类的训练样本数)

TN	4	5	6	7	8	9	10
								NMF	70.00	74.01	76.45	78.66	79.74	79.65	84.01
KPCA	59.36	63.77	65.18	66.27	68.16	70.94	72.04
								PNMF	65.56	68.58	73.29	75.36	75.26	79.01	78.62
Our Method	73.23	75.83	79.21	80.10	82.00	83.80	85.39

表1

表2是本发明提出的基于加性高斯核的核非负矩阵分解人脸识别方法(OurMethod)与非负矩阵分解(NMF)、核主成分分析(KPCA)和多项式核非负矩阵分解(PNMF)在添加椒盐噪声的Caltech101人脸数据库上的

识别率(％)比较(d表示椒盐噪声密度)

d	0	0.05	0.1	0.15	0.2	0.25	0.3
								NMF	79.42	80.00	78.95	77.66	75.56	72.63	70.88
KPCA	70.41	69.30	71.05	67.02	62.05	59.65	54.09
								PNMF	75.26	76.96	76.96	73.10	72.98	71.99	68.01
Our Method	81.93	82.11	82.92	81.75	79.77	79.24	77.36

表2

本发明的有益效果：

1.通过构建的具有抗噪性的加性高斯核函数，得到了一种具有抗噪性的核非负矩阵分解算法。实验结果表明，本发明的算法对噪声具有鲁棒性。

2.本发明所提出的算法的收敛性，不仅通过利用辅助函数在理论上进行了证明，而且在实验中也得到了验证，本发明的算法具有较快的收敛速度。

3.通过在公开的人脸数据库中与相关算法进行实验比较，结果表明本专利开发的算法具有一定的优越性。

4.通过在添加噪声的人脸数据库中与相关算法进行实验比较，结果表明本发明开发的算法具有很好的鲁棒性。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种基于加性高斯核的核非负矩阵分解人脸识别方法，其特征在于，包括训练步骤，所述训练步骤包括如下步骤：

第二步骤：对基图像矩阵W和系数矩阵H进行初始化；

第三步骤：设置迭代次数n＝0；

第四步骤：根据公式(12)更新基图像矩阵W和系数矩阵H；

第五步骤：使n＝n+1；

在第四步骤中，公式(12)如下：

2.根据权利要求1所述的核非负矩阵分解人脸识别方法，其特征在于，该核非负矩阵分解人脸识别方法还包括在训练步骤之后再执行识别步骤，所述识别步骤包括：

第十步骤：输出类别P，从而完成人脸识别。

3.一种基于加性高斯核的核非负矩阵分解人脸识别装置，其特征在于，包括训练模块，所述训练模块包括：

初始化模块：用于对基图像矩阵W和系数矩阵H进行初始化；

赋值模块：用于设置迭代次数n＝0；

更新模块：用于根据公式(12)更新基图像矩阵W和系数矩阵H；

计数模块：使n＝n+1；

在更新模块中，公式(12)如下：

4.根据权利要求3所述的核非负矩阵分解人脸识别装置，其特征在于，该核非负矩阵分解人脸识别装置还包括在训练模块之后再执行识别模块，所述识别模块包括：

平均特征向量计算模块：用于计算训练样本中每类的平均特征向量m_j(j＝1,…,c)，c为不同的人脸类别数，j为第j类的标记数；

输出模块：用于输出类别P，从而完成人脸识别。

5.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序配置为由处理器调用时实现权利要求1-2中任一项所述的方法的步骤。

6.一种基于加性高斯核的核非负矩阵分解人脸识别系统，其特征在于，包括：存储器、处理器以及存储在所述存储器上的计算机程序，所述计算机程序配置为由所述处理器调用时实现权利要求1-2中任一项所述的方法的步骤。