Nothing Special   »   [go: up one dir, main page]

CN110334679A - 人脸点处理方法及装置 - Google Patents

人脸点处理方法及装置 Download PDF

Info

Publication number
CN110334679A
CN110334679A CN201910627394.6A CN201910627394A CN110334679A CN 110334679 A CN110334679 A CN 110334679A CN 201910627394 A CN201910627394 A CN 201910627394A CN 110334679 A CN110334679 A CN 110334679A
Authority
CN
China
Prior art keywords
face
face point
network
sense
loss function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910627394.6A
Other languages
English (en)
Other versions
CN110334679B (zh
Inventor
陈良
余清洲
苏晋展
张伟
许清泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Meitu Technology Co Ltd
Original Assignee
Xiamen Meitu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Meitu Technology Co Ltd filed Critical Xiamen Meitu Technology Co Ltd
Priority to CN201910627394.6A priority Critical patent/CN110334679B/zh
Publication of CN110334679A publication Critical patent/CN110334679A/zh
Application granted granted Critical
Publication of CN110334679B publication Critical patent/CN110334679B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Geometry (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本公开提供一种人脸点处理方法及装置,涉及图像处理技术领域。本公开提供的人脸点处理方法及装置,基于人脸点拟合网络,对待检测的人脸五官图像进行降采样,提取人脸点特征信息,得到人脸点数据,基于分割网络,对人脸点特征信息进行升采样,得到人脸五官掩模。本公开提供的人脸点处理方法及装置,通过将人脸点拟合网络和分割网络进行结合,对人脸五官图像进行处理,实现人脸点数据以及五官掩模的输出,节约了时间成本并提高了精度。

Description

人脸点处理方法及装置
技术领域
本公开涉及图像处理技术领域,具体而言,涉及一种人脸点处理方法及装置。
背景技术
人脸点对齐在生产中有十分广泛的应用场景,可以为人的脸部添加AR(AugmentedReality,增强现实)素材、上妆,甚至辅助建立人脸的3D(三维,3Dimensions)模型。在实际应用场景中,大多采用每帧回归的方式得到人脸点,然后根据每帧的人脸点差值拟合出一个掩模,根据掩模对人脸五官各部分进行上妆等处理。但是,以这种方式拟合掩模,其时间成本较高且精度较低。
发明内容
基于上述研究,本公开提供了一种人脸点处理方法及装置。
本公开的实施例可以这样实现:
第一方面,本公开实施例提供一种人脸点处理方法,应用于电子设备,所述电子设备存储有人脸点拟合网络以及分割网络;所述方法包括:
基于所述人脸点拟合网络,对待检测的人脸五官图像进行降采样,提取人脸点特征信息,得到人脸点数据;
基于所述分割网络,对所述人脸点特征信息进行升采样,得到人脸五官掩模。
进一步地,所述人脸点拟合网络以及分割网络通过以下步骤训练得到:
基于待训练的人脸点拟合网络,对人脸五官图片进行降采样,提取第一人脸点特征信息,得到第一人脸点数据;
基于待训练的分割网络,对所述第一人脸点特征信息进行升采样,得到第一人脸五官掩模;
根据所述第一人脸五官掩模和所述第一人脸点数据,结合预先得到的样本数据,基于预设损失函数,通过反向传播算法对所述待训练的人脸点拟合网络的权值和所述待训练的分割网络的权值进行调整,直至所述预设损失函数的输出小于预设阈值。
进一步地,所述预设损失函数包括预设第一损失函数和预设第二损失函数,所述根据所述第一人脸五官掩模和所述第一人脸点数据,结合预先得到的样本数据,基于预设损失函数,通过反向传播算法对所述待训练的人脸点拟合网络的权值和所述待训练的分割网络的权值进行调整的步骤包括:
根据所述第一人脸五官掩模、所述第一人脸点数据以及所述样本数据,基于所述预设第一损失函数,通过反向传播算法对所述待训练的人脸点拟合网络的权值进行调整;
基于调整后的人脸点拟合网络,得到第二人脸点特征信息,根据所述第二人脸点特征信息,得到第二人脸五官掩模;
根据所述第二人脸五官掩模,基于所述预设第二损失函数,通过反向传播算法对所述待训练的分割网络的权值进行调整。
进一步地,所述预设第二损失函数为交叉熵损失函数,所述预设第一损失函数为:
其中,li为人脸点数据中每个人脸点的坐标;Li为样本数据中每个人脸点的坐标;Ixi,yi为人脸五官掩模的像素点;r为判断该像素点是否可见的阈值;N为样本数据的数量,i为样本数据中的任意一个样本。
进一步地,所述人脸点拟合网络包括多个降采样单元,每个所述降采样单元的输出尺寸为上一个降采样单元的输出尺寸的1/C,C为正整数。
进一步地,所述分割网络包括多个升采样单元,每个所述升采样单元与每个所述降采样单元对称设置,每个所述升采样单元的输出尺寸为上一个升采样单元的输出尺寸的C倍,C为正整数。
进一步地,所述基于所述分割网络,对所述人脸点特征信息进行升采样,得到人脸五官掩模的步骤包括:
针对每一个升采样单元,将该升采样单元的输出与对应的降采样单元的输出进行融合,得到融合特征信息;
针对每一个升采样单元,将该升采样单元在上一个升采样单元输出的融合特征信息上进行升采样。
第二方面,本公开实施例提供一种人脸点处理装置,应用于电子设备,所述电子设备存储有人脸点拟合网络以及分割网络;所述人脸点处理装置包括提取模块以及分割模块;
所述提取模块用于基于所述人脸点拟合网络,对待检测的人脸五官图像进行降采样,提取人脸点特征信息,得到人脸点数据;
所述分割模块用于基于所述分割网络,对所述人脸点特征信息进行升采样,得到人脸五官掩模。
进一步地,所述人脸点处理装置还包括训练模块,所述训练模块用于:
基于待训练的人脸点拟合网络,对人脸五官图片进行降采样,提取第一人脸点特征信息,得到第一人脸点数据;
基于待训练的分割网络,对所述第一人脸点特征信息进行升采样,得到第一人脸五官掩模;
根据所述第一人脸五官掩模和所述第一人脸点数据,结合预先得到的样本数据,基于预设损失函数,通过反向传播算法对所述待训练的人脸点拟合网络的权值和所述待训练的分割网络的权值进行调整,直至所述预设损失函数的输出小于预设阈值。
进一步地,所述预设损失函数包括预设第一损失函数和预设第二损失函数,所述训练模块还用于:
根据所述第一人脸五官掩模、所述第一人脸点数据以及所述样本数据,基于所述预设第一损失函数,通过反向传播算法对所述待训练的人脸点拟合网络的权值进行调整;
基于调整后的人脸点拟合网络,得到第二人脸点特征信息,根据所述第二人脸点特征信息,得到第二人脸五官掩模;
根据所述第二人脸五官掩模,基于所述预设第二损失函数,通过反向传播算法对所述待训练的分割网络的权值进行调整。
本公开提供的人脸点处理方法及装置,通过将人脸点拟合网络和分割网络进行结合,对人脸五官图像进行处理,实现了人脸点数据以及五官掩模的输出,节约了时间成本,相较于现有技术中根据每帧的人脸点差值拟合得到掩模,采用人脸点拟合网络和分割网络能够提高人脸五官掩模的精度。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本公开所提供的电子设备的一种方框示意图。
图2为本公开所提供的人脸点处理方法的一种流程示意图。
图3为本公开所提供的人脸点处理方法的另一种流程示意图。
图4为本公开所提供的人脸点处理方法的一种原理示意图。
图5为本公开所提供的人脸点处理方法的又一种流程示意图。
图6为本公开所提供的人脸点处理方法的网络训练过程示意图。
图7为本公开所提供的人脸点处理方法的又一种流程示意图。
图8为本公开所提供的人脸点处理装置的一种方框示意图。
图标:100-电子设备;10-人脸点处理装置;11-提取模块;12-分割模块;13-训练模块;20-存储器;30-处理器;40-通信模块。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
此外,若出现术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在不冲突的情况下,本公开的实施例中的特征可以相互结合。
人脸点对齐在生产中有十分广泛的应用场景,可以为人的脸部添加AR素材、上妆,甚至辅助建立人脸的3D模型。如今,卷积神经网络在各类任务场景中都有着十分广泛的应用,对于人脸点对齐也不例外。
在实时场景中,大多采用每帧回归的方式得到人脸点,并将人脸点提供给下一帧裁图,以达到跟踪的目的,同时根据每帧的人脸点差值拟合出一个掩模用于人脸五官各部分的上妆等处理。但是,因为人脸点具有离散的特点,因此在上妆等实际应用中具有局限性,同时以这种方式拟合出来的掩模无法正确处理人脸五官部分被遮挡的情况,精度较低,同时,时间成本和计算成本也较高。
基于上述研究,本公开提供一种人脸点处理方法及装置,以改善上述问题。
请结合参阅图1,本公开提供的人脸点处理方法应用于电子设备100,由所述电子设备100执行本公开所提供的人脸点处理方法。
所述电子设备100包括图1所示的人脸点处理装置10、存储器20、处理器30以及通信模块40,所述存储器20、处理器30以及通信模块40各个元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互直接可通过一条或多条通讯总线或信号线实现电性连接。所述人脸点处理装置10包括至少一个可以软件或固件(Firmware)的形式存储于所述存储器20中的软件功能模块,所述处理器30通过运行存储在存储器20内的软件程序以及模块,从而执行各种功能应用以及数据处理。
所述存储器20可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
所述处理器30可以是一种集成电路芯片,具有信号的处理能力。所述处理器30可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等。
所述通信模块40用于通过网络建立所述电子设备100与其他外部设备之间的通信连接,并通过所述网络进行数据传输。
可以理解,图1所示的结构仅为示意,所述电子设备100还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
在本公开中,所述电子设备100可以是,但不限于,个人电脑(Personal Computer,PC)、笔记本电脑、个人数字助理(Personal Digital Assistant,PDA)或服务器等具有处理能力的设备。
请结合参阅图2,本公开提供一种可应用于上述电子设备100的人脸点处理方法。其中,所述方法有关的流程所定义的方法步骤可以由所述处理器30实现。下面将对图2所示的具体流程进行详细阐述。
步骤S10:基于所述人脸点拟合网络,对待检测的人脸五官图像进行降采样,提取人脸点特征信息,得到人脸点数据。
步骤S20:基于所述分割网络,对所述人脸点特征信息进行升采样,得到人脸五官掩模。
其中,待检测的人脸五官图像是基于人脸对齐的五官级联模型得到的,首先将全脸图片输入到五官级联模型中,得到全脸的人脸点,即人脸关键点,再根据全脸的人脸点进行定位剪裁,得到人脸五官图像,例如人脸嘴巴图像、人脸眼睛图像等。根据全脸的人脸点定位剪裁得到的人脸五官图像即为待检测的人脸五官图像。
在得到待检测的人脸五官图像后,将待检测的人脸五官图像输入人脸点拟合网络中,基于人脸点拟合网络对待检测的人脸五官图像进行降采样处理,提取人脸点特征信息,以得到人脸点数据。同时,基于分割网络,对降采样输出的人脸点特征信息进行升采样,恢复图像信息,以得到人脸五官掩模,其中,人脸五官掩模与待检测的人脸五官图像的尺寸相同。
进一步的,在本公开中,所述人脸点拟合网络包括多个降采样单元,每个所述降采样单元的输出尺寸为上一个降采样单元的输出尺寸的1/C,C为正整数。
其中,人脸点拟合网络的降采样部分可以根据主流的网络设计经验,采用ShortCut的结构组成多个降采样单元,每个降采样单元的输出是在上一个降采样单元的输出的基础上进行降采样得到的,例如,将某五官图片输入至降采样单元A1进行降采样后,输出第一特征信息,将该第一特征信息作为降采样单元A2的输入,对该第一特征信息进行降采样,输出第二特征信息,将该第二特征信息作为降采样单元A3的输入,对该第二特征信息进行降采样,以此类推,在经过所有降采样单元降采样后,得到该五官图片的人脸点特征信息。
为了便于得到人脸点数据以及人脸五官掩模,在本公开中,每个降采样单元的输出尺寸需设计为上一个降采样单元的输出尺寸的1/C,例如,在人脸点拟合网络的降采样过程中,将某五官图片经过降采样单元A1降采样后,得到第一特征信息,该第一特征信息经过降采样单元A2降采样后,得到第二特征信息,降采样单元A2的输出尺寸设计为降采样单元A1的输出尺寸的1/C,因此,第二特征信息的尺寸缩小为第一特征信息的1/C。可选的,在本公开,C为2。
本公开中,采用ShortCut的结构组成多个降采样单元,每个降采样单元通过卷积操作完成降采样过程。其中,具体的卷积操作可以根据实际情况设定卷积核数量、大小等,本公开不做限制。将待检测的人脸五官图像经过各个降采样单元的卷积操作后,在人脸点拟合网络的全连接层回归出人脸点数据。
进一步的,所述分割网络包括多个升采样单元,每个所述升采样单元与每个所述降采样单元对称设置,每个所述升采样单元的输出尺寸为上一个升采样单元的输出尺寸的C倍,C为正整数。
其中,分割网络同样采用ShortCut的结构组成多个升采样单元,每个升采样单元与每个降采样单元对称设置,每个升采样单元的输出尺寸为上一个升采样单元的输出尺寸的C倍。若人脸点拟合网络进行n次降采样,则分割网络则进行n次升采样,若每个降采样单元的输出尺寸为上一个降采样单元的输出尺寸的1/2,则每个升采样单元的输出尺寸为上一个升采样单元的输出尺寸的2倍。
进一步的,请结合参阅图3,所述基于所述分割网络,对所述人脸点特征信息进行升采样,得到人脸五官掩模的步骤包括步骤S21至步骤S22。
步骤S21:针对每一个升采样单元,将该升采样单元的输出与对应的降采样单元的输出进行融合,得到融合特征信息。
步骤S22:针对每一个升采样单元,将该升采样单元在上一个升采样单元输出的融合特征信息上进行升采样。
其中,由于人脸五官图像在经过降采样后,损失了较多的浅层信息,不利于升采样部分的学习,因此,需要将每个降采样单元与对应的升采样单元进行特征融合,达到浅层信息的流通。
针对每一个升采样单元,将该升采样单元对应的降采样单元的输出经过尺寸不变的卷积后,与该升采样单元的输出进行融合,从而得到融合特征信息。在得到融合特征信息后,将该融合特征信息作为下一个升采样单元的输入,对该融合特征信息进行升采样。例如,图4,升采样单元B3与降采样单元A3对应,升采样单元B2与降采样单元A2对应,升采样单元B1与降采样单元A1对应。降采样单元A3的输出作为升采样单元B3的输入,通过升采样单元B3进行升采样,将降采样单元A3的输出进行尺寸不变的卷积后,与升采样单元B3的输出进行融合,得到融合特征信息b1,将融合特征信息b1作为升采样单元B2的输入,通过升采样单元B3进行升采样,将降采样单元A2的输出进行尺寸不变的卷积后,与升采样单元B2的输出进行融合,得到融合特征信息b2,将融合特征信息b2作为升采样单元B1的输入,以此类推,在经过最后一个升采样单元升采样后,将最后一个升采样单元融合后的特征输入至分割网络的softmax层进行分类,从而得到人脸五官掩模。
可选的,特征融合的方式可采用Concat融合或Alpha融合。
本公开提供的人脸点处理方法及装置,在人脸对齐的五官级联模型的基础上,不改变人脸点拟合网络的结构,将分割网络与人脸点拟合网络进行结合,在对人脸五官图像进行处理时,可同时输出人脸点数据以及五官掩模,节约了时间和计算成本,极大提升了实时分割的性能。
进一步的,请结合参阅图5和图6,图6为本公开所提供的网络训练的一种训练过程示意图,图6所展示的仅为人脸嘴巴部分训练过程的示意图,可以理解的,人脸其他五官部分的训练过程,也可以参照图6所示的训练过程示意图。所述人脸点拟合网络以及分割网络通过以下步骤训练得到:
步骤S30:基于待训练的人脸点拟合网络,对人脸五官图片进行降采样,提取第一人脸点特征信息,得到第一人脸点数据。
步骤S40:基于待训练的分割网络,对所述第一人脸点特征信息进行升采样,得到第一人脸五官掩模。
其中,得到第一人脸点数据和第一人脸五官掩模的过程可参照前述步骤S10至步骤S22的过程。
步骤S50:根据所述第一人脸五官掩模和所述第一人脸点数据,结合预先得到的样本数据,基于预设损失函数,通过反向传播算法对所述待训练的人脸点拟合网络的权值和所述待训练的分割网络的权值进行调整,直至所述预设损失函数的输出小于预设阈值。
进一步的,请结合参阅图7,所述预设损失函数包括预设第一损失函数和预设第二损失函数,所述根据所述第一人脸五官掩模和所述第一人脸点数据,结合预先得到的样本数据,基于预设损失函数,通过反向传播算法对所述待训练的人脸点拟合网络的权值和所述待训练的分割网络的权值进行调整的步骤包括步骤S51至步骤S53。
步骤S51:根据所述第一人脸五官掩模、所述第一人脸点数据以及所述样本数据,基于所述预设第一损失函数,通过反向传播算法对所述待训练的人脸点拟合网络的权值进行调整。
其中,预设第一损失函数为:
其中,li为人脸点数据中每个人脸点的坐标;Li为样本数据中每个人脸点的坐标;Ixi,yi为人脸五官掩模的像素点;r为判断该像素点是否可见的阈值;N为样本数据的数量,i为样本数据中的任意一个样本,Loss(l,L)为样本数据和人脸点数据的损失值,Euclidean为欧几里得距离函数。
根据第一人脸五官掩模中每个像素点是否可见,赋予预设第一损失函数相应的权重,例如,若第一人脸五官掩模中像素点Ixi,yi小于可见的阈值,则赋予的权重为0,若第一人脸五官掩模中像素点Ixi,yi大于可见的阈值,则赋予的权重为1。
在通过第一人脸五官掩模赋予预设第一损失函数相应的权重后,根据欧几里得距离函数Euclidean计算样本数据与人脸点数据损失值loss,通过反向传播算法,将损失值反向传播,进而对待训练的人脸点拟合网络的权值进行调整。
在本公开中,样本数据中每个人脸点的坐标为预先标注得到,样本数据为图6中的Ground truth,第一人脸点数据为图6中的Prediction,图6中的Loss Func为预设第一损失函数。本公开通过第一人脸五官掩模赋予预设第一损失函数相应的权重,在计算样本数据与人脸点数据损失值时,在一定程度上屏蔽了人脸点被遮挡部分产生的损失,提高了人脸点的精度和遮挡时的鲁棒性。
步骤S52:基于调整后的人脸点拟合网络,得到第二人脸点特征信息,根据所述第二人脸点特征信息,得到第二人脸五官掩模。
步骤S53:根据所述第二人脸五官掩模,基于所述预设第二损失函数,通过反向传播算法对所述待训练的分割网络的权值进行调整。
其中,人脸点拟合网络的权值调整后,提取到人脸点特征信息也会相应调整,根据调整后的人脸点特征信息得到的人脸五官掩模也会相应调整。因此,基于调整后的人脸点拟合网络,提取得到第二人脸点特征信息,根据第二人脸点特征信息,得到第二人脸五官掩模,第二人脸五官掩模即调整的人脸五官掩模。
得到第二人脸五官掩模后,基于预设第二损失函数,通过反向传播算法对待训练的分割网络的权值进行调整,直至预设第一损失函数的输出和预设第二损失函数的输出都小于预设阈值。
可选的,在本公开中,预设第二损失函数为交叉熵损失函数。
本公开通过将人脸点拟合网络与分割网络进行联合训练,利用第一人脸五官掩模赋予预设第一损失函数相应的权重,屏蔽了在人脸点被遮挡部分产生的损失,提高了人脸点、人脸五官掩模的精度和遮挡时的鲁棒性。人脸点拟合网络与分割网络训练完成后,通过将人脸点拟合网络和分割网络进行结合,对人脸五官图像进行处理,可同时输出人脸点数据以及五官掩模,节约时间成本和计算成本,极大提升了实时分割的性能。
在上述基础上,请结合参阅图8,本公开实施例提供一种人脸点处理装置10,应用于电子设备100,所述电子设备100存储有人脸点拟合网络以及分割网络;所述人脸点处理装置10包括提取模块11以及分割模块12。
所述提取模块11用于基于所述人脸点拟合网络,对待检测的人脸五官图像进行降采样,提取人脸点特征信息,得到人脸点数据。
所述分割模块12用于基于所述分割网络,对所述人脸点特征信息进行升采样,得到人脸五官掩模。
进一步地,所述人脸点处理装置10还包括训练模块13,所述训练模块13用于:
基于待训练的人脸点拟合网络,对人脸五官图片进行降采样,提取第一人脸点特征信息,得到第一人脸点数据。
基于待训练的分割网络,对所述第一人脸点特征信息进行升采样,得到第一人脸五官掩模。
根据所述第一人脸五官掩模和所述第一人脸点数据,结合预先得到的样本数据,基于预设损失函数,通过反向传播算法对所述待训练的人脸点拟合网络和所述待训练的分割网络的权值进行调整,直至所述预设损失函数的输出小于预设阈值。
进一步地,所述预设损失函数包括预设第一损失函数和预设第二损失函数,所述训练模块13还用于:
根据所述第一人脸五官掩模、所述第一人脸点数据以及所述样本数据,基于所述预设第一损失函数,通过反向传播算法对所述待训练的人脸点拟合网络的权值进行调整。
基于调整后的人脸点拟合网络,得到第二人脸点特征信息,根据所述第二人脸点特征信息,得到第二人脸五官掩模。
根据所述第二人脸五官掩模,基于所述预设第二损失函数,通过反向传播算法对所述待训练的分割网络的权值进行调整。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的人脸点处理装置10的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。
综上,本公开提供的人脸点处理方法及装置,基于人脸点拟合网络,对待检测的人脸五官图像进行降采样,提取人脸点特征信息,得到人脸点数据,基于分割网络,对人脸点特征信息进行升采样,得到人脸五官掩模,实现了人脸点数据以及五官掩模的同时输出,节约了时间成本并提高了精度。
以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种人脸点处理方法,其特征在于,应用于电子设备,所述电子设备存储有人脸点拟合网络以及分割网络;所述方法包括:
基于所述人脸点拟合网络,对待检测的人脸五官图像进行降采样,提取人脸点特征信息,得到人脸点数据;
基于所述分割网络,对所述人脸点特征信息进行升采样,得到人脸五官掩模。
2.根据权利要求1所述的人脸点处理方法,其特征在于,所述人脸点拟合网络以及分割网络通过以下步骤训练得到:
基于待训练的人脸点拟合网络,对人脸五官图片进行降采样,提取第一人脸点特征信息,得到第一人脸点数据;
基于待训练的分割网络,对所述第一人脸点特征信息进行升采样,得到第一人脸五官掩模;
根据所述第一人脸五官掩模和所述第一人脸点数据,结合预先得到的样本数据,基于预设损失函数,通过反向传播算法对所述待训练的人脸点拟合网络的权值和所述待训练的分割网络的权值进行调整,直至所述预设损失函数的输出小于预设阈值。
3.根据权利要求2所述的人脸点处理方法,其特征在于,所述预设损失函数包括预设第一损失函数和预设第二损失函数,所述根据所述第一人脸五官掩模和所述第一人脸点数据,结合预先得到的样本数据,基于预设损失函数,通过反向传播算法对所述待训练的人脸点拟合网络的权值和所述待训练的分割网络的权值进行调整的步骤包括:
根据所述第一人脸五官掩模、所述第一人脸点数据以及所述样本数据,基于所述预设第一损失函数,通过反向传播算法对所述待训练的人脸点拟合网络的权值进行调整;
基于调整后的人脸点拟合网络,得到第二人脸点特征信息,根据所述第二人脸点特征信息,得到第二人脸五官掩模;
根据所述第二人脸五官掩模,基于所述预设第二损失函数,通过反向传播算法对所述待训练的分割网络的权值进行调整。
4.根据权利要求3所述的人脸点处理方法,其特征在于,所述预设第二损失函数为交叉熵损失函数,所述预设第一损失函数为:
其中,li为人脸点数据中每个人脸点的坐标;Li为样本数据中每个人脸点的坐标;Ixi,yi为人脸五官掩模的像素点;r为判断该像素点是否可见的阈值;N为样本数据的数量,i为样本数据中的任意一个样本。
5.根据权利要求1所述的人脸点处理方法,其特征在于,所述人脸点拟合网络包括多个降采样单元,每个所述降采样单元的输出尺寸为上一个降采样单元的输出尺寸的1/C,C为正整数。
6.根据权利要求5所述的人脸点处理方法,其特征在于,所述分割网络包括多个升采样单元,每个所述升采样单元与每个所述降采样单元对称设置,每个所述升采样单元的输出尺寸为上一个升采样单元的输出尺寸的C倍,C为正整数。
7.根据权利要求6所述的人脸点处理方法,其特征在于,所述基于所述分割网络,对所述人脸点特征信息进行升采样,得到人脸五官掩模的步骤包括:
针对每一个升采样单元,将该升采样单元的输出与对应的降采样单元的输出进行融合,得到融合特征信息;
针对每一个升采样单元,将该升采样单元在上一个升采样单元输出的融合特征信息上进行升采样。
8.一种人脸点处理装置,其特征在于,应用于电子设备,所述电子设备存储有人脸点拟合网络以及分割网络;所述人脸点处理装置包括提取模块以及分割模块;
所述提取模块用于基于所述人脸点拟合网络,对待检测的人脸五官图像进行降采样,提取人脸点特征信息,得到人脸点数据;
所述分割模块用于基于所述分割网络,对所述人脸点特征信息进行升采样,得到人脸五官掩模。
9.根据权利要求8所述的人脸点处理装置,其特征在于,所述人脸点处理装置还包括训练模块,所述训练模块用于:
基于待训练的人脸点拟合网络,对人脸五官图片进行降采样,提取第一人脸点特征信息,得到第一人脸点数据;
基于待训练的分割网络,对所述第一人脸点特征信息进行升采样,得到第一人脸五官掩模;
根据所述第一人脸五官掩模和所述第一人脸点数据,结合预先得到的样本数据,基于预设损失函数,通过反向传播算法对所述待训练的人脸点拟合网络的权值和所述待训练的分割网络的权值进行调整,直至所述预设损失函数的输出小于预设阈值。
10.根据权利要求9所述的人脸点处理装置,其特征在于,所述预设损失函数包括预设第一损失函数和预设第二损失函数,所述训练模块用于:
根据所述第一人脸五官掩模、所述第一人脸点数据以及所述样本数据,基于所述预设第一损失函数,通过反向传播算法对所述待训练的人脸点拟合网络的权值进行调整;
基于调整后的人脸点拟合网络,得到第二人脸点特征信息,根据所述第二人脸点特征信息,得到第二人脸五官掩模;
根据所述第二人脸五官掩模,基于所述预设第二损失函数,通过反向传播算法对所述待训练的分割网络的权值进行调整。
CN201910627394.6A 2019-07-11 2019-07-11 人脸点处理方法及装置 Active CN110334679B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910627394.6A CN110334679B (zh) 2019-07-11 2019-07-11 人脸点处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910627394.6A CN110334679B (zh) 2019-07-11 2019-07-11 人脸点处理方法及装置

Publications (2)

Publication Number Publication Date
CN110334679A true CN110334679A (zh) 2019-10-15
CN110334679B CN110334679B (zh) 2021-11-26

Family

ID=68146483

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910627394.6A Active CN110334679B (zh) 2019-07-11 2019-07-11 人脸点处理方法及装置

Country Status (1)

Country Link
CN (1) CN110334679B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110827371A (zh) * 2019-11-05 2020-02-21 厦门美图之家科技有限公司 证件照生成方法、装置、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106485214A (zh) * 2016-09-28 2017-03-08 天津工业大学 一种基于卷积神经网络的眼睛和嘴部状态识别方法
CN108062543A (zh) * 2018-01-16 2018-05-22 中车工业研究院有限公司 一种面部识别方法及装置
CN109410240A (zh) * 2018-10-09 2019-03-01 电子科技大学中山学院 一种量体特征点定位方法、装置及其存储介质
CN109410220A (zh) * 2018-10-16 2019-03-01 腾讯科技(深圳)有限公司 图像分割方法、装置、计算机设备及存储介质
CN109598261A (zh) * 2019-01-18 2019-04-09 嘉兴学院 一种基于区域分割的三维人脸识别方法
CN109727240A (zh) * 2018-12-27 2019-05-07 深圳开立生物医疗科技股份有限公司 一种三维超声图像的遮挡组织剥离方法及相关装置
US10304193B1 (en) * 2018-08-17 2019-05-28 12 Sigma Technologies Image segmentation and object detection using fully convolutional neural network
CN109978930A (zh) * 2019-03-27 2019-07-05 杭州相芯科技有限公司 一种基于单幅图像的风格化人脸三维模型自动生成方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106485214A (zh) * 2016-09-28 2017-03-08 天津工业大学 一种基于卷积神经网络的眼睛和嘴部状态识别方法
CN108062543A (zh) * 2018-01-16 2018-05-22 中车工业研究院有限公司 一种面部识别方法及装置
US10304193B1 (en) * 2018-08-17 2019-05-28 12 Sigma Technologies Image segmentation and object detection using fully convolutional neural network
CN109410240A (zh) * 2018-10-09 2019-03-01 电子科技大学中山学院 一种量体特征点定位方法、装置及其存储介质
CN109410220A (zh) * 2018-10-16 2019-03-01 腾讯科技(深圳)有限公司 图像分割方法、装置、计算机设备及存储介质
CN109727240A (zh) * 2018-12-27 2019-05-07 深圳开立生物医疗科技股份有限公司 一种三维超声图像的遮挡组织剥离方法及相关装置
CN109598261A (zh) * 2019-01-18 2019-04-09 嘉兴学院 一种基于区域分割的三维人脸识别方法
CN109978930A (zh) * 2019-03-27 2019-07-05 杭州相芯科技有限公司 一种基于单幅图像的风格化人脸三维模型自动生成方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110827371A (zh) * 2019-11-05 2020-02-21 厦门美图之家科技有限公司 证件照生成方法、装置、电子设备及存储介质
CN110827371B (zh) * 2019-11-05 2023-04-28 厦门美图之家科技有限公司 证件照生成方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN110334679B (zh) 2021-11-26

Similar Documents

Publication Publication Date Title
CN112052789B (zh) 人脸识别方法、装置、电子设备及存储介质
CN111598818B (zh) 人脸融合模型训练方法、装置及电子设备
CN107248169B (zh) 图像定位方法及装置
CN108229504B (zh) 图像解析方法及装置
CN109146892A (zh) 一种基于美学的图像裁剪方法及装置
US11170528B2 (en) Object pose tracking method and apparatus
CN111783605A (zh) 一种人脸图像识别方法、装置、设备及存储介质
CN107219925A (zh) 姿势检测方法、装置及服务器
CN112560753A (zh) 基于特征融合的人脸识别方法、装置、设备及存储介质
CN110399764A (zh) 人脸识别方法、装置及计算机可读介质
JP7282474B2 (ja) 暗号化マスク確定方法、暗号化マスク確定装置、電子機器、記憶媒体およびコンピュータプログラム
CN110147708A (zh) 一种图像数据处理方法和相关装置
CN108121951A (zh) 特征点定位方法及装置
CN110334679A (zh) 人脸点处理方法及装置
CN112991274A (zh) 一种人群计数方法、装置、计算机设备及存储介质
CN109242868A (zh) 图像处理方法、装置、电子设备及储存介质
CN114333038B (zh) 对象识别模型的训练方法和对象识别方法、装置、设备
Tan et al. Local context attention for salient object segmentation
CN114078270A (zh) 基于遮挡环境下人脸身份验证方法、装置、设备和介质
CN113706428A (zh) 一种图像生成方法及装置
Liu-Jimenez et al. FPGA implementation for an iris biometric processor
CN113283318A (zh) 图像处理方法、装置、电子设备及存储介质
CN113961962A (zh) 一种基于隐私保护的模型训练方法、系统及计算机设备
CN113505736B (zh) 对象的识别方法及装置、存储介质、电子装置
CN116612168B (zh) 图像处理方法、装置、电子设备、图像处理系统及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant