CN110555821B - 模型训练方法、装置和存储介质 - Google Patents
模型训练方法、装置和存储介质 Download PDFInfo
- Publication number
- CN110555821B CN110555821B CN201910833116.6A CN201910833116A CN110555821B CN 110555821 B CN110555821 B CN 110555821B CN 201910833116 A CN201910833116 A CN 201910833116A CN 110555821 B CN110555821 B CN 110555821B
- Authority
- CN
- China
- Prior art keywords
- image
- sample
- stage
- conversion
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 192
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000006243 chemical reaction Methods 0.000 claims abstract description 663
- 230000002441 reversible effect Effects 0.000 claims abstract description 188
- 238000011084 recovery Methods 0.000 claims abstract description 182
- 239000011159 matrix material Substances 0.000 claims description 220
- 230000009466 transformation Effects 0.000 claims description 105
- 238000004590 computer program Methods 0.000 claims description 22
- 238000005070 sampling Methods 0.000 claims description 20
- 230000004927 fusion Effects 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 abstract description 25
- 230000000694 effects Effects 0.000 abstract description 7
- 230000008569 process Effects 0.000 description 26
- 238000012545 processing Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 16
- 238000003672 processing method Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 13
- 238000013507 mapping Methods 0.000 description 9
- 241000220225 Malus Species 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 6
- 238000013519 translation Methods 0.000 description 4
- 230000003042 antagnostic effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 235000021016 apples Nutrition 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000010428 oil painting Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/001—Texturing; Colouring; Generation of texture or colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种模型训练方法、装置和存储介质,包括:获取属于第一图像类别的第一样本和属于第二图像类别的第二样本;将所述第一样本依次经过第一阶段图像转化模型和第一阶段图像逆向转化模型,得到第一样本单阶段恢复图像;将所述第二样本依次经过所述第一阶段图像逆向转化模型和所述第一阶段图像转化模型,得到第二样本单阶段恢复图像;按照所述第一样本与所述第一样本单阶段恢复图像的差异,及所述第二样本与所述第二样本单阶段恢复图像的差异,调整所述第一阶段图像转化模型和所述第一阶段图像逆向转化模型,直至满足训练停止条件时结束训练。通过本发明提供的方案训练得到的机器学习模型,提高了对任意两种图像类别的图像之间转化的图像转化效果。
Description
本申请是于2018年01月26日提交中国专利局,申请号为201810078544.8,发明名称为“图像处理方法、装置、存储介质和计算机设备”的分案申请,其全部内容通过引用结合在本申请中。
技术领域
本发明涉及计算机技术领域,特别是涉及一种模型训练方法、装置和存储介质。
背景技术
随着计算机技术的发展和图像处理技术的进步,基于图像的处理方式变得越来越多样。目前常用的图像处理技术如图像的特征转化处理,比如图像颜色特征转化、图像光影特征转化或者图像风格特征转化等。
然而,传统的图像处理过程中,主要是通过基于纹理合成的方式,将目标特征的图像纹理扩散到待处理图像的图像区域,来实现图像特征转化处理。但在采用该方式处理时容易出现误匹配的情况,从而导致得到的图像产生失真。
发明内容
基于此,有必要针对目前处理得到的图像失真的问题,提供一种模型训练方法、装置、存储介质和计算机设备。
一种模型训练方法,包括:
获取属于第一图像类别的第一样本和属于第二图像类别的第二样本;
将所述第一样本依次经过第一阶段图像转化模型和第一阶段图像逆向转化模型,得到第一样本单阶段恢复图像;
将所述第二样本依次经过所述第一阶段图像逆向转化模型和所述第一阶段图像转化模型,得到第二样本单阶段恢复图像;
按照所述第一样本与所述第一样本单阶段恢复图像的差异,及所述第二样本与所述第二样本单阶段恢复图像的差异,调整所述第一阶段图像转化模型和所述第一阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
一种模型训练装置,包括:
第一阶段模型训练模块,用于获取属于第一图像类别的第一样本和属于第二图像类别的第二样本;将所述第一样本依次经过所述第一阶段图像转化模型和第一阶段图像逆向转化模型,得到第一样本单阶段恢复图像;将所述第二样本依次经过所述第一阶段图像逆向转化模型和所述第一阶段图像转化模型,得到第二样本单阶段恢复图像;按照所述第一样本与所述第一样本单阶段恢复图像的差异,及所述第二样本与所述第二样本单阶段恢复图像的差异,调整所述第一阶段图像转化模型和所述第一阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取属于第一图像类别的第一样本和属于第二图像类别的第二样本;
将所述第一样本依次经过第一阶段图像转化模型和第一阶段图像逆向转化模型,得到第一样本单阶段恢复图像;
将所述第二样本依次经过所述第一阶段图像逆向转化模型和所述第一阶段图像转化模型,得到第二样本单阶段恢复图像;
按照所述第一样本与所述第一样本单阶段恢复图像的差异,及所述第二样本与所述第二样本单阶段恢复图像的差异,调整所述第一阶段图像转化模型和所述第一阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
一种计算机设备,包括存储器和处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取属于第一图像类别的第一样本和属于第二图像类别的第二样本;
将所述第一样本依次经过第一阶段图像转化模型和第一阶段图像逆向转化模型,得到第一样本单阶段恢复图像;
将所述第二样本依次经过所述第一阶段图像逆向转化模型和所述第一阶段图像转化模型,得到第二样本单阶段恢复图像;
按照所述第一样本与所述第一样本单阶段恢复图像的差异,及所述第二样本与所述第二样本单阶段恢复图像的差异,调整所述第一阶段图像转化模型和所述第一阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
上述模型训练方法、装置、存储介质和计算机设备,利用了循环一致性约束非监督地训练机器学习模型,从而实现训练得到任意两种图像类别的图像之间转化的机器学习模型,不再受限于传统监督地训练机器学习模型时对样本标签的依赖,扩展了图像处理应用场景。
附图说明
图1为一个实施例中图像处理方法的流程示意图;
图2为一个实施例中第一阶段图像转化模型的模型示意图;
图3为一个实施例中图像处理过程的逻辑示意图;
图4为一个实施例中训练第一阶段图像转化模型的逻辑示意图;
图5为一个实施例中训练第二阶段图像转化模型的逻辑示意图;
图6为一个实施例中图像转化前后的图像示意图;
图7为一个实施例中图像处理装置的模块结构图;
图8为另一个实施例中图像处理装置的模块结构图;
图9为一个实施例中计算机设备的内部结构图;
图10为另一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1为一个实施例中图像处理方法的流程示意图。本实施例主要以该方法应用于计算机设备来举例说明。参照图1,该图像处理方法具体包括如下步骤:
S102,获取属于第一图像类别的待处理图像。
其中,图像类别是图像所反映的图像特征所属的类别。图像特征具体可以是颜色特征、风格特征或者内容特征等。相应地,根据颜色特征分类得到的图像类别比如黑白图像类别或者彩色图像类别等;根据风格特征分类得到的图像类别比如素描图像类别或者油画图像类别等;根据内容特征分类得到的图像类别比如苹果图像类别或者橘子图像类别等。
具体地,待处理图像是待进行图像类别转化的图像。其中,计算机设备可以是用户终端,用户终端可直接获取用户上传的属于某一图像类别的待处理图像,也可接受其他用户终端传递的属于某一图像类别的待处理图像。计算机设备也可以是服务器,服务器可接收用户终端上传的属于某一图像类别的待处理图像。
S104,将待处理图像输入第一阶段图像转化模型,得到第一中间图像。
其中,图像转化是指将一种图像类别的图像转化为另一种图像类别的图像。图像转化模型是经过训练后具有图像转化能力的机器学习模型。机器学习英文全称为MachineLearning,简称ML。该机器学习模型可采用神经网络模型,支持向量机(Support VectorMachine,SVM)或者逻辑回归模型等。
第一阶段图像转化模型用于将第一图像类别的图像初步转化为第二图像类别的图像。通过第一阶段图像转化模型转化得到的图像允许与意图转化为的第二图像类别的图像存在一定程度上的误差。可以理解,这里不对第一阶段图像转化模型的图像细节特征转化能力作限定,在图像整体特征上完成转化即可。
具体地,计算机设备可事先根据属于第一图像类别的第一样本和属于第二图像类别的第二样本训练得到第一阶段图像转化模型。在本实施例中,第一阶段图像转化模型具体地可采用卷积神经网络模型。该卷积神经网络模型的结构具体可以是编码器-解码器结构。编码器可由多层卷积层构成,解码器则可由多层反卷积层构成。其中,编码器部分将输入图像转化为分辨率低但通道数目更多的特征图,该特征图可以看作是对原图像的一种编码。解码器部分则将特征图解码为第二图像类别的图像。
举例说明,图2示出了一个实施例中第一阶段图像转化模型的模型示意图。参考图2,该第一阶段图像转化模型为编码器-解码器结构。编码器结构210包括三层卷积层211,解码器结构220包括三层反卷积层221。
在一个实施例中,在训练第一阶段图像转化模型时,当属于第一图像类别的第一样本和属于第二图像类别的第二样本一一对应时,则将与第一样本对应的第二样本作为该第一样本的训练标签,从而根据第一样本和相应的训练标签有监督地训练得到第一阶段图像转化模型。
在一个实施例中,在训练第一阶段图像转化模型时,当不存在与第一样本和对应的第二样本,也不存在与第二样本对应的第一样本时,则构建将第一图像类别的图像转换为第二图像类别的图像的第一阶段图像转化模型,和将第二图像类别的图像转换为第一图像类别的图像的第一阶段图像逆向转化模型。将第一样本依次经过第一阶段图像转化模型和第一阶段图像逆向转化模型形成闭环,将第二样本依次经过第一阶段图像逆向转化模型和第一阶段图像转化模型形成闭环,从而利用循环一致性约束无监督地训练得到第一阶段图像转化模型。
可以理解,这里的第一样本和第二样本对应是指第一样本与第二样本除用以区分类别的图像特征外,其他图像特征均相同。举例说明,比如第一图像类别为黑白图像类别,第二图像类别为彩色图像类别,对于苹果图像,第一样本与第二样本中的苹果仅颜色不同,大小形状或者位置均相同。
图3示出了一个实施例中图像处理过程的逻辑示意图。参考图3,计算机设备可将属于第一图像类别A的待处理图像x输入第一阶段图像转化模型G1,得到第一阶段图像转化模型G1输出的第一中间图像y1。
在本实施例中,图像转换可以是非图像内容的转化,比如图像风格转化、图像颜色转化或者图像景深转化等。图像转换也可以是图像内容的转化,比如修改图像中的物体等。具体地,将苹果图像类别的苹果图像修改为橘子图像类别的橘子图像。
S106,通过第二阶段图像转化模型将第一中间图像转化为第二中间图像。
其中,第二阶段图像转化模型用于将第一阶段图像转化模型输出的图像进一步转化为第二图像类别的图像。可以理解,这里要求第二阶段图像转化模型在图像细节特征上完成转化。
具体地,计算机设备可事先根据第一阶段图像转化模型输出的第一中间图像和属于第二图像类别的第二样本训练得到第二阶段图像转化模型。在本实施例中,第二阶段图像转化模型具体地可采用卷积神经网络模型。卷积神经网络模型的结构具体可以是编码器-解码器结构。编码器可由多层卷积层构成,解码器可由多层反卷积层构成。
在一个实施例中,在训练第二阶段图像转化模型时,当属于第一图像类别的第一样本和属于第二图像类别的第二样本一一对应时,则将与第一样本对应的第二样本作为该第一样本所对应的第一中间图像的训练标签,从而根据第一中间图像和相应的训练标签有监督地训练得到第二阶段图像转化模型。
在一个实施例中,在训练第一阶段图像转化模型时,当不存在与第一样本和对应的第二样本,也不存在与第二样本对应的第一样本时,则构建将第一中间图像转换为第二图像类别的图像的第二阶段图像转化模型,和将第二图像类别的图像转换为第一中间图像的第二阶段图像逆向转化模型。将第一样本依次经过第一阶段图像转化模型、第二阶段图像转化模型、第一阶段图像逆向转化模型和第二阶段图像逆向转化模型形成闭环,将第二样本依次经过第一阶段图像逆向转化模型、第二阶段图像逆向转化模型、第一阶段图像转化模型和第二阶段图像转化模型形成闭环,从而利用循环一致性约束无监督地训练得到第二阶段图像转化模型。
继续参考图3,计算机设备得到第一阶段图像转化模型G1输出的第一中间图像y1后,可继续将第一中间图像y1输入第二阶段图像转化模型G2,得到第二阶段图像转化模型G2输出的第二中间图像y2。
S108,确定第二中间图像对应的第二权重矩阵。
其中,权重是针对某一对象而言相对的概念。某一对象的权重反映的是该对象在整体评价中的相对重要程度。由于计算机设备在处理图像时,通常是以矩阵形式的数字图像数据进行处理,故图像的权重则也是矩阵的形式。
在一个实施例中,计算机设备可预先设置权重映射函数,从而通过该权重映射函数映射得到第二中间图像对应的权重矩阵。具体地,计算机设备可预先设置的权重映射函数可以有多种。计算机设备可将待处理图像和第二中间图像作为权重映射函数的自变量,得到该作为自变量的中间图像所对应的权重矩阵。
S110,确定第一中间图像对应的第一权重矩阵。
具体地,计算机设备可将待处理图像和第一中间图像作为权重映射函数的自变量,得到该作为自变量的中间图像所对应的权重矩阵。
在一个实施例中,计算机设备也可将待处理图像、第一中间图像和第二中间图像作为权重映射函数的自变量,得到其中一个中间图像所对应的权重矩阵,进而根据该权重矩阵得到另一个中间图像所对应的权重矩阵。计算机设备还可将第一中间图像与第二中间图像作为权重映射函数的自变量,得到其中一个中间图像所对应的权重矩阵,进而根据该权重矩阵得到另一个中间图像所对应的权重矩阵。这里的其中一个中间图像可以是第一中间图像,也可以是第二中间图像。可以理解,这里对S108与S110的执行先后顺序不作限定。S108可在S110之前执行,也可在S110之后执行,还可与S110同步执行。S108与S110的执行先后顺序依赖于计算机设备事先设置的权重映射函数。
在一个实施例中,S108包括:将待处理图像、第一中间图像与第二中间图像共同输入第一权重预测模型,得到与第二中间图像对应的第二权重矩阵。S110包括:根据第二权重矩阵,得到与第一中间图像对应的第一权重矩阵;第一权重矩阵与第二权重矩阵之和为预设矩阵。
其中,权重预测模型是经过训练后具有权重预测能力的机器学习模型。在本实施例中,权重预测模型具体可采用浅层卷积神经网络模型。比如,该浅层卷积神经网络模型具体可以由三层卷积层构成。前两层卷积层的结构均为Convolution(卷积)-InstanceNorm(归一化)-ReLU(激活函数)结构,最后一层卷积层的结构则为Convolution(卷积)-Sigmoid(激活函数)结构。
第一权重预测模型是将第一图像类别的图像转化为第二图像类别的图像时进行权重预测的机器学习模型。下文中提到的第二权重预测模型则是将第二图像类别的图像转化为第一图像类别的图像时进行权重预测的机器学习模型。
第一权重预测模型的输入是待处理图像、第一中间图像与第二中间图像,这三帧图像的图像尺寸相同。第一权重预测模型的输出是与输入图像大小一致的权重矩阵,权重矩阵的每个元素代表第二中间图像在相应像素位置的像素值的权重。第一权重矩阵与第二权重矩阵是大小和维数均相同的矩阵,而且第一权重矩阵与第二权重矩阵之和为预设矩阵,预设矩阵具体可以是大小和维数均与第二权重矩阵相同的全一矩阵。全一矩阵的各矩阵元素均为1。
具体地,计算机设备可将待处理图像、第一中间图像与第二中间图像共同输入第一权重预测模型,得到第一权重预测模型输出的与第二中间图像对应的第二权重矩阵。这里,第一中间图像对应的第一权重矩阵与第二中间图像对应的第二权重矩阵之和为预设矩阵。计算机设备可通过该预设矩阵减去第二中间图像对应的第二权重矩阵,得到与第一中间图像对应的第一权重矩阵。
再参考图3,计算机设备将第一阶段图像转化模型G1输出的第一中间图像y1与第二阶段图像转化模型G2输出的第二中间图像y2共同输入第一权重预测模型Gf,得到第一权重预测模型Gf输出的与第二中间图像y2对应的权重矩阵αx,进而得到第一中间图像y1对应的权重矩阵(1-αx)。
在本实施例中,利用机器学习模型强大的学习和表示能力进行权重预测学习,所训练得到的机器学习模型对权重进行预测,较传统方法对权重进程预测的效果更好。
S112,将第一中间图像、第二中间图像按照对应的第一权重矩阵、第二权重矩阵进行融合,得到与待处理图像对应、且属于第二图像类别的目标图像。
具体地,计算机设备可将第一中间图像和第二中间图像按照各自对应的权重矩阵加权求和得到与待处理图像对应、且属于第二图像类别的目标图像。
在一个实施例中通过自适应融合层将第一中间图像和第二中间图像按照各自对应的权重矩阵融合,得到目标与待处理图像对应、且属于第二图像类别的目标图像。
在一个实施例中,S112包括:将第一中间图像的各像素值与第一权重矩阵的各矩阵元素按位相乘,得到属于第二图像类别的第一目标图像;将第二中间图像的各像素值与第二权重矩阵的各矩阵元素按位相乘,得到属于第二图像类别第二目标图像;根据第一目标图像与第二目标图像,得到与待处理图像对应、且属于第二图像类别的目标图像。
其中,各中间图像的像素点所形成的像素点矩阵的大小与该中间图像所对应的权重矩阵的大小相同。那么,像素点矩阵中各像素点元素均在权重矩阵存在一一对应的权重元素,也就是说,权重矩阵的每个权重元素代表相应中间图像中相应像素点元素的像素值的权重。
具体地,计算机设备将第一中间图像的各像素值与第一权重矩阵的各矩阵元素按位相乘,得到属于第二图像类别的第一目标图像,然后将第二中间图像的各像素值与第二权重矩阵的各矩阵元素按位相乘,得到属于第二图像类别第二目标图像,再将第一目标图像与第二目标图像的各像素值按位相加,得到与待处理图像对应、且属于第二图像类别的目标图像。
在本实施例中,最终得到的目标图像融合了多个阶段模型的输出,能够极大程度上克服图像失真的问题,提高图像转化效果。
上述图像处理方法,在意图将属于第一图像类别的待处理图像转化为属于第二图像类别的图像时,自动将待处理图像依次经过第一阶段图像转化模型和第二阶段图像转化模型,并在分别确定两个阶段的模型的输出各自所对应的权重矩阵后,即根据相应的权重矩阵自适应融合两个模型的输出得到目标图像。这样待处理图像经过了多个阶段的模型处理,而且最终得到的目标图像融合了多个阶段模型的输出,能够极大程度上克服图像失真的问题,提高由待处理图像转化得到的目标图像的转化效果。
在一个实施例中,S104包括:对待处理图像进行下采样,得到图像尺寸缩小后的压缩图像;将压缩图像输入第一阶段图像转化模型,输出图像尺寸与压缩图像的图像尺寸相同的第一中间图像。S106包括:对第一中间图像进行上采样,得到图像尺寸与待处理图像的图像尺寸相同的放大图像;将放大图像输入第二阶段图像转化模型,输出图像尺寸与放大图像的图像尺寸相同的第二中间图像。
其中,下采样或称为降采样,是进行图像压缩的一种处理方式。经过下采样操作后的图像的图像尺寸会缩小,缩小的程度与下采样的采样周期相关。上采样或称为图像插值,是将图像放大的一种处理方式。经过上采样操作后的图像的图像尺寸会放大,放大的程度与上采样的采样周期相关。
具体地,计算机设备可对待处理图像进行下采样操作。下采样的方式具体可以是均值采样或者极值采样。比如,下采样的方式为对2*2像素区域进行均值,那么其中一个2*2像素区域对应的像素值矩阵为[1,2,3,4],那么下采样得到的像素值为:(1+2+3+4)/4=2.5。下采样操作后得到的图像的分辨率减小为待处理图像分辨率的1/4。
计算机设备进而将下采样后图像尺寸缩小的压缩图像输入第一阶段图像转化模型,得到第一阶段图像转化模型输出的图像尺寸与压缩图像的图像尺寸相同的第一中间图像。由于此时第一中间图像的图像尺寸小于待处理图像的尺寸,故计算机设备需在将第一中间图像输入第二阶段图像转化模型之前,对第一中间图像执行与在前的下采样操作相应的上采样操作,使得上采样操作后得到的特征图的分辨率增大为上采样操作前的特征图的分辨率的4倍,以保证第二阶段图像转化模型输出的第二中间图像与待处理图像的分辨率一致。
在本实施例中,在第一阶段的图像转化时,将图像压缩后进行转化,使得模型处理的图像数据量小,这样在图像转换精度要求不高时,既可以保证图像转化效果,又能提高图像转化时间。
在一个实施例中,该图像处理方法还包括训练模型的步骤。其中,训练第一阶段图像转化模型的步骤具体如下:获取属于第一图像类别的第一样本和属于第二图像类别的第二样本;将第一样本依次经过第一阶段图像转化模型和第一阶段图像逆向转化模型,得到第一样本单阶段恢复图像;将第二样本依次经过第一阶段图像逆向转化模型和第一阶段图像转化模型,得到第二样本单阶段恢复图像;按照第一样本与第一样本单阶段恢复图像的差异,及第二样本与第二样本单阶段恢复图像的差异,调整第一阶段图像转化模型和第一阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
其中,第一样本是属于第一图像类别的图像,用于训练第一阶段图像转化模型和第一阶段图像逆向转化模型。第二样本是属于第二图像类别的图像,也用于训练第一阶段图像转化模型和第一阶段图像逆向转化模型。第一阶段图像转化模型是将第一图像类别的图像转化为第二图像类别的图像的机器学习模型,第一阶段图像逆向转化模型是将第二图像类别的图像转化为第一图像类别的图像的机器学习模型。
第一样本单阶段恢复图像是属于第一图像类别的图像,是第一样本经过第一阶段图像转化模型转化为第二图像类别的图像后,又经过第一阶段图像逆向转化模型恢复得到的属于第一图像类别的图像。第二样本单阶段恢复图像是属于第二图像类别的图像,是第二样本经过第一阶段图像逆向转化模型转化为第一图像类别的图像后,又经过第一阶段图像转化模型恢复得到的属于第二图像类别的图像。
可以理解,本实施例所应用的场景是不存在与第一样本和对应的第二样本,也不存在与第二样本对应的第一样本的场景,也就是实际并没有可以作为第一样本的训练标签的属于第二图像类别的图像,及没有可以作为第二样本的训练标签的属于第一图像类别的图像的模型训练场景。所以在本实施例中利用循环一致性,将第一样本作为其经过图像转化与图像逆向转化后恢复的图像的优化目标,将第二样本作为其经过图像逆向转化与图像转化后恢复的图像的优化目标。
具体地,计算机设备可获取属于第一图像类别的第一样本,将第一样本依次经过第一阶段图像转化模型和第一阶段图像逆向转化模型,得到第一样本单阶段恢复图像。此时,依据循环一致性约束,第一样本单阶段恢复图像即为意图恢复至第一样本的图像,那么可以理解的是,第一阶段图像转化模型和第一阶段图像逆向转化模型的训练目的即为最小化第一样本与第一样本单阶段恢复图像之间的差异的过程。
进一步地,为了防止多个第一样本在经过第一阶段图像转化模型的转化时均转化为相同的图像,计算机设备可获取属于第二图像类别的第二样本,将第二样本依次经过第一阶段图像逆向转化模型和第一阶段图像转化模型,得到第二样本单阶段恢复图像。此时第二样本单阶段恢复图像即为意图恢复至第二样本的图像,那么可以理解的是,第一阶段图像转化模型和第一阶段图像逆向转化模型的训练目的即为最小化第一样本与第一样本单阶段恢复图像之间的差异,以及第二样本与第二样本单阶段恢复图像之间的差异的过程。
其中,第一样本与第一样本单阶段恢复图像之间的差异,以及第二样本与第二样本单阶段恢复图像之间的差异具体可以是图像像素点差值的1范数或者2范数等。
举例说明,图4示出了一个实施例中训练第一阶段图像转化模型的逻辑示意图。参考图4,计算机设备可获取属于第一图像类别A的第一样本x′,将x′依次输入第一阶段图像转化模型G1和第一阶段图像逆向转化模型F1后得到第一样本单阶段恢复图像F1(G1(x′))。此时F1(G1(x′))即为意图恢复至x′的图像,那么可以理解的是模型的训练目的即为最小化F1(G1(x′))与x′的差异。计算机设备可再获取属于第二图像类别B的第二样本y′,将y′依次输入第一阶段图像逆向转化模型F1和第一阶段图像转化模型G1后得到第二样本单阶段恢复图像G1(F1(y′))。此时G1(F1(y′))即为意图恢复至y′的图像,那么可以理解的是模型的训练目的即为最小化G1(F1(y′))与y′的差异。
那么第一阶段的模型训练中,循环一致性约束表达为:
Lcyc1=||F1(G1(x′))-x′||1+||G1(F1(y′))-y′||1 (1)
其中,Lcyc1为基于循环一致性的损失函数。模型训练的过程可以包括调整第一阶段图像转化模型与第一阶段图像逆向转化模型的模型参数以最小化Lcyc1的过程。
在本实施例中,利用了循环一致性约束非监督地训练机器学习模型,从而实现训练得到任意两种图像类别的图像之间转化的机器学习模型,不再受限于传统监督地训练机器学习模型时对样本标签的依赖,扩展了图像处理应用场景。
在一个实施例中,训练结束条件可以是对模型的训练次数达到预设训练次数。计算机设备可在对模型进行训练时,对训练次数进行计数,当计数达到预设训练次数时,判定模型满足训练结束条件,并结束对模型的训练。
在一个实施例中,训练结束条件也可以是调整后的鉴别模型的鉴别性能指标达到预设指标,调整后的图像转化模型的图像转化性能指标达到预设指标。
在一个实施例中,该图像处理方法还包括优化第一阶段图像转化模型的步骤。其中,优化第一阶段图像转化模型的步骤具体如下:获取第一样本经过第一阶段图像转化模型后,由第一阶段图像转化模型输出的第一样本单阶段转化图像;获取第二样本经过第一阶段图像逆向转化模型后,由第一阶段图像逆向转化模型输出的第二样本单阶段转化图像;将第一样本和第二样本单阶段转化图像分别输入第一阶段图像逆向转化鉴别模型,分别得到第一样本的鉴别置信度和第二样本单阶段转化图像的鉴别置信度;将第二样本和第一样本单阶段转化图像分别输入第一阶段图像转化鉴别模型,分别得到第二样本的鉴别置信度和第一样本单阶段转化图像的鉴别置信度;按照第一样本与第一样本单阶段恢复图像的差异,及第二样本与第二样本单阶段恢复图像的差异,调整第一阶段图像转化模型和第一阶段图像逆向转化模型,直至满足训练停止条件时结束训练,包括:按照最大化第一样本的鉴别置信度和第二样本的鉴别置信度的方向、最小化第二样本单阶段转化图像的鉴别置信度、第一样本单阶段转化图像的鉴别置信度、第一样本与第一样本单阶段恢复图像的差异,及第二样本与第二样本单阶段恢复图像的差异的方向,调整第一阶段图像转化鉴别模型、第一阶段图像逆向转化鉴别模型、第一阶段图像转化模型和第一阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
其中,鉴别模型是经过训练后具有鉴别能力的机器学习模型。在本实施例中,第一阶段图像转化鉴别模型,用于鉴别输入的图像是否为原始属于第二图像类别的图像,并输出鉴别结果的鉴别置信度,即第一阶段图像转化鉴别置信度。第一阶段图像逆向转化鉴别模型,用于鉴别输入的图像是否为原始属于第一图像类别的图像,并输出鉴别结果的鉴别置信度,即第一阶段图像逆向转化鉴别置信度。
第一阶段图像转化鉴别置信度与输入图像一一对应,是表示输入图像是原始属于第二图像类别的图像的可信程度。鉴别置信度越高,表示输入图像是原始属于第二图像类别的图像的可能性越高。第一阶段图像逆向转化鉴别置信度与输入图像一一对应,是表示输入图像是原始属于第一图像类别的图像的可信程度。鉴别置信度越高,表示输入图像是原始属于第一图像类别的图像的可能性越高。
可以理解,本实施例中采用对抗学习的方式,第一阶段图像转化模型希望学习如何把输入的第一图像类别的图像转化为第二图像类别的图像,并使得生成的图像能够欺骗第一阶段图像转化鉴别模型,使得第一阶段图像转化鉴别模型以为输入的是原始属于第二图像类别的图像。第一阶段图像逆向转化模型则希望学习如何把输入的第二图像类别的图像转化为第一图像类别的图像,并使得生成的图像能够欺骗第一阶段图像逆向转化鉴别模型,使得第一阶段图像逆向转化鉴别模型以为输入的是原始属于第二图像类别的图像。
继续参考图4,计算机设备可将x′与F1(y′)输入第一阶段图像逆向转化鉴别模型Dx1,得到x′的鉴别置信度Dx1(x′),F1(y′)的鉴别置信度Dx1(F1(y′)),将y′与G1(x′)输入第一阶段图像逆向转化鉴别模型Dy1,得到y′的鉴别置信度Dy1(y′),G1(x′)的鉴别置信度Dy1(G1(x′))。
那么第一阶段的模型训练中,对抗学习约束表达为:
Ladv1=log(Dy1(y′))+log(1-Dy1(G1(x′)))+log(Dx1(x′))+log(1-Dx1(F1(y′)))(2)
其中,Ladv1为基于对抗学习约束的损失函数。模型训练的过程可以包括调整第一阶段图像转化鉴别模型与第一阶段图像逆向转化鉴别模型的模型参数以最大化Ladv1的过程。最大化Ladv1也就是最大化Dx1(x′)与Dy1(y′),最小化Dx1(F1(y′))与Dy1(G1(x′))的过程。
那么在训练过程中,对抗地优化图像转化模型和鉴别模型表达为:
其中,λ1为循环一致性约束权重。最大化Ladv1与最小化Lcyc1的过程可以轮换进行。即在一个样本训练时先最大化Ladv1再最小化Lcyc1,在下一个样本训练时先最小化Lcyc1再最大化Ladv1。
在本实施例中,包括图像转化模型和鉴别模型两个模型的训练。其中,训练图像转化模型的过程在于学习如何将一种类别的图像转化为另一种类别的图像,训练鉴别模型的过程在于学习判断输入的图像是原始图像还是通过图像转化模型生成的图像。这样图像转化模型学习生成与原始图像更相似的图像,以干扰鉴别模型的判断,鉴别模型学习更加精准地进行原始图像和生成图像的判断,两个模型相互对抗,相互促进,使得训练得到的模型性能更优,从而在使用训练得到的图像转化模型进行图像转化时,能够极大程度上克服图像失真的问题,提高图像转化效果。
在一个实施例中,本领域技术人员可以理解,有监督地训练第一阶段图像转化模型和第一阶段图像逆向转化模型时,也可结合第一阶段图像转化鉴别模型和第一阶段图像逆向转化鉴别模型进行对抗式训练。
在一个实施例中,训练第二阶段图像转化模型的步骤具体如下:将第一样本依次经过第一阶段图像转化模型和第二阶段图像转化模型,得到第一阶段图像转化模型输出的第一样本一阶转化图像,和第二阶段图像转化模型输出的第一样本二阶转化图像;根据第一样本一阶转化图像和第一样本二阶转化图像,得到与第一样本对应、且属于第二图像类别的第一样本转化图像;将第一样本转化图像依次经过第一阶段图像逆向转化模型和第二阶段图像逆向转化模型,得到第一阶段图像逆向转化模型输出的第一样本一阶恢复图像,和第二阶段图像逆向转化模型输出的第一样本二阶恢复图像;根据第一样本一阶恢复图像和第一样本二阶恢复图像,得到与第一样本对应、且属于第一图像类别的第一样本恢复图像;将第二样本依次经过第一阶段图像逆向转化模型和第二阶段图像逆向转化模型,得到第一阶段图像逆向转化模型输出的第二样本一阶转化图像,和第二阶段图像逆向转化模型输出的第二样本二阶转化图像;根据第二样本一阶转化图像和第二样本二阶转化图像,得到与第二样本对应、且属于第一图像类别的第二样本转化图像;将第二样本转化图像依次经过第一阶段图像转化模型和第二阶段图像转化模型,得到第一阶段图像转化模型输出的第二样本一阶恢复图像,和第二阶段图像转化模型输出的第二样本二阶恢复图像;根据第二样本一阶恢复图像和第二样本二阶恢复图像,得到与第二样本对应、且属于第二图像类别的第二样本恢复图像;按照第一样本与第一样本恢复图像的差异,及第二样本与第二样本恢复图像的差异,调整第二阶段图像转化模型和第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
可以理解,在训练第二阶段图像转化模型时,第一阶段图像转化模型已经训练完成,可以直接使用。
举例说明,图5示出了一个实施例中训练第二阶段图像转化模型的逻辑示意图。参考图5,计算机设备可获取属于第一图像类别A的第一样本x′,将x′依次输入第一阶段图像转化模型G1得到第一样本一阶转化图像y1=G1(x′),然后将y1输入第二阶段图像转化模型G2得到第一样本二阶转化图像y2=G2(y1),再根据y1和y2即可得到与第一样本对应、且属于第二图像类别的第一样本转化图像计算机设备再将输入第一阶段图像逆向转化模型F1得到第一样本一阶恢复图像然后将输入第二阶段图像逆向转化模型F2得到第一样本二阶恢复图像再根据和即可得到与第一样本对应、且属于第一图像类别的第一样本恢复图像此时x″即为意图恢复至x′的图像,那么可以理解的是模型的训练目的即为最小化x″与x′的差异。
计算机设备可再获取属于第二图像类别B的第二样本y′,将y′依次输入第一阶段图像逆向转化模型F1得到第二样本一阶转化图像x1=F1(y′),然后将x1输入第二阶段图像逆向转化模型F2得到第二样本二阶转化图像x2=F2(x1),再根据x1和x2即可得到与第二样本对应、且属于第一图像类别的第二样本转化图像计算机设备再将输入第一阶段图像转化模型G1得到第二样本一阶恢复图像然后将输入第二阶段图像转化模型G2得到第二样本二阶恢复图像再根据和即可得到与第二样本对应、且属于第二图像类别的第二样本恢复图像此时y″即为意图恢复至y′的图像,那么可以理解的是模型的训练目的即为最小化y″与y′的差异。
那么第二阶段的模型训练中,循环一致性约束表达为:
其中,Lcyc2为基于循环一致性的损失函数。模型训练的过程可以包括调整第二阶段图像转化模型与第二阶段图像逆向转化模型的模型参数以最小化Lcyc2的过程。
在本实施例中,利用了循环一致性约束非监督地训练机器学习模型,从而实现训练得到任意两种图像类别的图像之间转化的机器学习模型,不再受限于传统监督地训练机器学习模型时对样本标签的依赖,扩展了图像处理应用场景。
在一个实施例中,该图像处理方法还包括优化第二阶段图像转化模型的步骤。其中,优化第二阶段图像转化模型的步骤具体如下:将第一样本和第二样本转化图像分别输入第二阶段图像逆向转化鉴别模型,分别得到第一样本的鉴别置信度和第二样本转化图像的鉴别置信度;将第二样本和第一样本转化图像分别输入第二阶段图像转化鉴别模型,分别得到第二样本的鉴别置信度和第一样本转化图像的鉴别置信度。按照第一样本与第一样本恢复图像的差异,及第二样本与第二样本恢复图像的差异,调整第二阶段图像转化模型和第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练,包括:按照最大化第一样本的鉴别置信度和第二样本的鉴别置信度的方向、最小化第二样本转化图像的鉴别置信度、第一样本转化图像的鉴别置信度、第一样本与第一样本恢复图像的差异,及第二样本与第二样本恢复图像的差异的方向,调整第二阶段图像转化鉴别模型、第二阶段图像逆向转化鉴别模型、第二阶段图像转化模型和第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
继续参考图5,计算机设备可将x′与输入第二阶段图像逆向转化鉴别模型Dx2,得到x′的鉴别置信度Dx2(x′),的鉴别置信度将y′与输入第二阶段图像转化鉴别模型Dy2,得到y′的鉴别置信度Dy2(y′),的鉴别置信度
那么第二阶段的模型训练中,对抗学习约束表达为:
其中,Ladv2为基于对抗学习约束的损失函数。模型训练的过程可以包括调整第二阶段图像转化鉴别模型与第二阶段图像逆向转化鉴别模型的模型参数以最大化Ladv2的过程。最大化Ladv2也就是最大化Dx2(x′)与Dy2(y′),最小化与的过程。
那么在第二阶段的训练过程中,对抗地优化图像转化模型和鉴别模型表达为:
其中,λ2为循环一致性约束权重。最大化Ladv2与最小化Lcyc2的过程可以轮换进行。即在一个样本训练时先最大化Ladv2再最小化Lcyc2,在下一个样本训练时先最小化Lcyc2再最大化Ladv2。
在本实施例中,包括图像转化模型和鉴别模型两个模型的训练。其中,训练图像转化模型的过程在于学习如何将一种类别的图像转化为另一种类别的图像,训练鉴别模型的过程在于学习判断输入的图像是原始图像还是通过图像转化模型生成的图像。这样图像转化模型学习生成与原始图像更相似的图像,以干扰鉴别模型的判断,鉴别模型学习更加精准地进行原始图像和生成图像的判断,两个模型相互对抗,相互促进,使得训练得到的模型性能更优,从而在使用训练得到的图像转化模型进行图像转化时,能够极大程度上克服图像失真的问题,提高图像转化效果。
在一个实施例中,本领域技术人员可以理解,有监督地训练第二阶段图像转化模型和第二阶段图像逆向转化模型时,也可结合第二阶段图像转化鉴别模型和第二阶段图像逆向转化鉴别模型进行对抗式训练。
在一个实施例中,根据第一样本一阶转化图像和第一样本二阶转化图像,得到与第一样本对应、且属于第二图像类别的第一样本转化图像,包括:将第一样本、第一样本一阶转化图像和第一样本二阶转化图像共同输入第一权重预测模型,得到与第一样本二阶转化图像对应的权重矩阵;根据权重矩阵,得到与第一样本一阶转化图像对应的权重矩阵;将第一样本一阶转化图像和第一样本二阶转化图像按照各自对应的权重矩阵融合,得到与第一样本对应、且属于第二图像类别的第一样本转化图像。
根据第一样本一阶恢复图像和第一样本二阶恢复图像,得到与第一样本对应、且属于第一图像类别的第一样本恢复图像,包括:将第一样本转化图像、第一样本一阶恢复图像和第一样本二阶恢复图像共同输入第二权重预测模型,得到与第一样本二阶恢复图像对应的权重矩阵;根据权重矩阵,得到与第一样本一阶恢复图像对应的权重矩阵;将第一样本一阶恢复图像和第一样本二阶恢复图像按照各自对应的权重矩阵融合,得到与第一样本对应、且属于第一图像类别的第一样本恢复图像。
根据第二样本一阶转化图像和第二样本二阶转化图像,得到与第二样本对应、且属于第一图像类别的第二样本转化图像,包括:将第二样本、第二样本一阶转化图像和第二样本二阶转化图像共同输入第二权重预测模型,得到与第二样本二阶转化图像对应的权重矩阵;根据权重矩阵,得到与第二样本一阶转化图像对应的权重矩阵;将第二样本一阶转化图像和第二样本二阶转化图像按照各自对应的权重矩阵融合,得到与第二样本对应、且属于第一图像类别的第二样本转化图像。
根据第二样本一阶恢复图像和第二样本二阶恢复图像,得到与第二样本对应、且属于第二图像类别的第二样本恢复图像,包括:将第二样本转化图像、第二样本一阶恢复图像和第二样本二阶恢复图像共同输入第一权重预测模型,得到与第二样本二阶恢复图像对应的权重矩阵;根据权重矩阵,得到与第二样本一阶恢复图像对应的权重矩阵;将第二样本一阶恢复图像和第二样本二阶恢复图像按照各自对应的权重矩阵融合,得到与第二样本对应、且属于第二图像类别的第二样本恢复图像。
按照第一样本与第一样本恢复图像的差异,及第二样本与第二样本恢复图像的差异,调整第二阶段图像转化模型和第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练,包括:按照第一样本与第一样本恢复图像的差异,及第二样本与第二样本恢复图像的差异,调整第一权重预测模型、第二权重预测模型、第二阶段图像转化模型和第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
继续参考图5,计算机设备可将x′、y1和y2共同输入第一权重预测模型Gf,得到Gf输出的y2的权重矩阵αx′,继而得到y1的权重矩阵(1-αx′),那么第一样本转化图像即为计算机设备再可将 和共同输入第二权重预测模型Ff,得到Ff输出的的权重矩阵继而得到的权重矩阵那么第一样本恢复图像即为
计算机设备可将y′、x1和x2共同输入第二权重预测模型Ff,得到Ff输出的x2的权重矩阵αy′,继而得到x1的权重矩阵(1-αy′),那么第二样本转化图像即为计算机设备再可将和共同输入第一权重预测模型Gf,得到Gf输出的的权重矩阵继而得到的权重矩阵那么第二样本恢复图像即为
在本实施例中,利用了循环一致性约束非监督地训练机器学习模型,从而实现训练得到任意两种图像类别的图像之间转化的机器学习模型,不再受限于传统监督地训练机器学习模型时对样本标签的依赖,扩展了图像处理应用场景。
图6示出了一个实施例中图像转化前后的图像示意图。参考图6,可以看到输入图像为第一图像类别的图像,输入图像中的马为单一颜色的马。输出图像为第二图像类别的图像,输出图像中的马则为多种颜色的马。
应该理解的是,虽然上述各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
如图7所示,在一个实施例中,提供了一种图像处理装置700。参照图7,该图像处理装置700包括:获取模块701、第一阶段转化模块702、第二阶段转化模块703、确定模块704和融合模块705。
获取模块701,用于获取属于第一图像类别的待处理图像。
第一阶段转化模块702,用于将待处理图像输入第一阶段图像转化模型,得到第一中间图像。
第二阶段转化模块703,用于通过第二阶段图像转化模型将第一中间图像转化为第二中间图像。
确定模块704,用于确定第二中间图像对应的第二权重矩阵;确定第一中间图像对应的第一权重矩阵。
融合模块705,用于将第一中间图像、第二中间图像按照对应的第一权重矩阵、第二权重矩阵进行融合,得到与待处理图像对应、且属于第二图像类别的目标图像。
在一个实施例中,第一阶段转化模块702还用于对待处理图像进行下采样,得到图像尺寸缩小后的压缩图像;将压缩图像输入第一阶段图像转化模型,输出图像尺寸与压缩图像的图像尺寸相同的第一中间图像。第二阶段转化模块703还用于对第一中间图像进行上采样,得到图像尺寸与待处理图像的图像尺寸相同的放大图像;将放大图像输入第二阶段图像转化模型,输出图像尺寸与放大图像的图像尺寸相同的第二中间图像。
在一个实施例中,确定模块704还用于将待处理图像、第一中间图像与第二中间图像共同输入第一权重预测模型,得到与第二中间图像对应的第二权重矩阵;根据第二权重矩阵,得到与第一中间图像对应的第一权重矩阵;第一权重矩阵与第二权重矩阵之和为预设矩阵。
在一个实施例中,融合模块705还用于将第一中间图像的各像素值与第一权重矩阵的各矩阵元素按位相乘,得到属于第二图像类别的第一目标图像;将第二中间图像的各像素值与第二权重矩阵的各矩阵元素按位相乘,得到属于第二图像类别第二目标图像;根据第一目标图像与第二目标图像,得到与待处理图像对应、且属于第二图像类别的目标图像。
在一个实施例中,图像处理装置700还包括:第一阶段模型训练模块706,用于获取属于第一图像类别的第一样本和属于第二图像类别的第二样本;将第一样本依次经过第一阶段图像转化模型和第一阶段图像逆向转化模型,得到第一样本单阶段恢复图像;将第二样本依次经过第一阶段图像逆向转化模型和第一阶段图像转化模型,得到第二样本单阶段恢复图像;按照第一样本与第一样本单阶段恢复图像的差异,及第二样本与第二样本单阶段恢复图像的差异,调整第一阶段图像转化模型和第一阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
在一个实施例中,第一阶段模型训练模块706还用于获取第一样本经过第一阶段图像转化模型后,由第一阶段图像转化模型输出的第一样本单阶段转化图像;获取第二样本经过第一阶段图像逆向转化模型后,由第一阶段图像逆向转化模型输出的第二样本单阶段转化图像;将第一样本和第二样本单阶段转化图像分别输入第一阶段图像逆向转化鉴别模型,分别得到第一样本的鉴别置信度和第二样本单阶段转化图像的鉴别置信度;将第二样本和第一样本单阶段转化图像分别输入第一阶段图像转化鉴别模型,分别得到第二样本的鉴别置信度和第一样本单阶段转化图像的鉴别置信度;按照最大化第一样本的鉴别置信度和第二样本的鉴别置信度的方向、最小化第二样本单阶段转化图像的鉴别置信度、第一样本单阶段转化图像的鉴别置信度、第一样本与第一样本单阶段恢复图像的差异,及第二样本与第二样本单阶段恢复图像的差异的方向,调整第一阶段图像转化鉴别模型、第一阶段图像逆向转化鉴别模型、第一阶段图像转化模型和第一阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
如图8所示,在一个实施例中,图像处理装置700还包括:第一阶段模型训练模块706和第二阶段模型训练模块707。
第二阶段模型训练模块707,用于将第一样本依次经过第一阶段图像转化模型和第二阶段图像转化模型,得到第一阶段图像转化模型输出的第一样本一阶转化图像,和第二阶段图像转化模型输出的第一样本二阶转化图像;根据第一样本一阶转化图像和第一样本二阶转化图像,得到与第一样本对应、且属于第二图像类别的第一样本转化图像;将第一样本转化图像依次经过第一阶段图像逆向转化模型和第二阶段图像逆向转化模型,得到第一阶段图像逆向转化模型输出的第一样本一阶恢复图像,和第二阶段图像逆向转化模型输出的第一样本二阶恢复图像;根据第一样本一阶恢复图像和第一样本二阶恢复图像,得到与第一样本对应、且属于第一图像类别的第一样本恢复图像;将第二样本依次经过第一阶段图像逆向转化模型和第二阶段图像逆向转化模型,得到第一阶段图像逆向转化模型输出的第二样本一阶转化图像,和第二阶段图像逆向转化模型输出的第二样本二阶转化图像;根据第二样本一阶转化图像和第二样本二阶转化图像,得到与第二样本对应、且属于第一图像类别的第二样本转化图像;将第二样本转化图像依次经过第一阶段图像转化模型和第二阶段图像转化模型,得到第一阶段图像转化模型输出的第二样本一阶恢复图像,和第二阶段图像转化模型输出的第二样本二阶恢复图像;根据第二样本一阶恢复图像和第二样本二阶恢复图像,得到与第二样本对应、且属于第二图像类别的第二样本恢复图像;按照第一样本与第一样本恢复图像的差异,及第二样本与第二样本恢复图像的差异,调整第二阶段图像转化模型和第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
在一个实施例中,第二阶段模型训练模块707还用于将第一样本和第二样本转化图像分别输入第二阶段图像逆向转化鉴别模型,分别得到第一样本的鉴别置信度和第二样本转化图像的鉴别置信度;将第二样本和第一样本转化图像分别输入第二阶段图像转化鉴别模型,分别得到第二样本的鉴别置信度和第一样本转化图像的鉴别置信度;按照最大化第一样本的鉴别置信度和第二样本的鉴别置信度的方向、最小化第二样本转化图像的鉴别置信度、第一样本转化图像的鉴别置信度、第一样本与第一样本恢复图像的差异,及第二样本与第二样本恢复图像的差异的方向,调整第二阶段图像转化鉴别模型、第二阶段图像逆向转化鉴别模型、第二阶段图像转化模型和第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
在一个实施例中,第二阶段模型训练模块707还用于将第一样本、第一样本一阶转化图像和第一样本二阶转化图像共同输入第一权重预测模型,得到与第一样本二阶转化图像对应的权重矩阵;根据权重矩阵,得到与第一样本一阶转化图像对应的权重矩阵;将第一样本一阶转化图像和第一样本二阶转化图像按照各自对应的权重矩阵融合,得到与第一样本对应、且属于第二图像类别的第一样本转化图像。将第一样本转化图像、第一样本一阶恢复图像和第一样本二阶恢复图像共同输入第二权重预测模型,得到与第一样本二阶恢复图像对应的权重矩阵;根据权重矩阵,得到与第一样本一阶恢复图像对应的权重矩阵;将第一样本一阶恢复图像和第一样本二阶恢复图像按照各自对应的权重矩阵融合,得到与第一样本对应、且属于第一图像类别的第一样本恢复图像。将第二样本、第二样本一阶转化图像和第二样本二阶转化图像共同输入第二权重预测模型,得到与第二样本二阶转化图像对应的权重矩阵;根据权重矩阵,得到与第二样本一阶转化图像对应的权重矩阵;将第二样本一阶转化图像和第二样本二阶转化图像按照各自对应的权重矩阵融合,得到与第二样本对应、且属于第一图像类别的第二样本转化图像。将第二样本转化图像、第二样本一阶恢复图像和第二样本二阶恢复图像共同输入第一权重预测模型,得到与第二样本二阶恢复图像对应的权重矩阵;根据权重矩阵,得到与第二样本一阶恢复图像对应的权重矩阵;将第二样本一阶恢复图像和第二样本二阶恢复图像按照各自对应的权重矩阵融合,得到与第二样本对应、且属于第二图像类别的第二样本恢复图像。按照第一样本与第一样本恢复图像的差异,及第二样本与第二样本恢复图像的差异,调整第一权重预测模型、第二权重预测模型、第二阶段图像转化模型和第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
图9示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是用户终端。如图9所示,该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入设备和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现图像处理方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行图像处理方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏等,输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,也可以是外接的键盘、触控板或鼠标等。本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
图10示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是服务器。如图10所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现图像处理方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行图像处理方法。本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的图像处理装置可以实现为一种计算机程序的形式,计算机程序可在如图9或图10所示的计算机设备上运行,计算机设备的非易失性存储介质可存储组成该图像处理装置的各个程序模块,比如,图7所示的获取模块701、第一阶段转化模块702、第二阶段转化模块703、确定模块704和融合模块705等。各个程序模块组成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的图像处理方法中的步骤。
例如,图9或图10所示的计算机设备可以通过如图7所示的图像处理装置700中的获取模块701获取属于第一图像类别的待处理图像。通过第一阶段转化模块702将待处理图像输入第一阶段图像转化模型,得到第一中间图像。通过第二阶段转化模块703通过第二阶段图像转化模型将第一中间图像转化为第二中间图像。通过确定模块704分别确定第一中间图像与第二中间图像各自对应的权重矩阵。通过融合模块705将第一中间图像和第二中间图像按照各自对应的权重矩阵融合,得到与待处理图像对应、且属于第二图像类别的目标图像。
在一个实施例中,提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时,使得处理器执行以下步骤:获取属于第一图像类别的待处理图像;将待处理图像输入第一阶段图像转化模型,得到第一中间图像;通过第二阶段图像转化模型将第一中间图像转化为第二中间图像;确定第二中间图像对应的第二权重矩阵;确定第一中间图像对应的第一权重矩阵;将第一中间图像、第二中间图像按照对应的第一权重矩阵、第二权重矩阵进行融合,得到与待处理图像对应、且属于第二图像类别的目标图像。
在一个实施例中,将待处理图像输入第一阶段图像转化模型,得到第一中间图像,包括:对待处理图像进行下采样,得到图像尺寸缩小后的压缩图像;将压缩图像输入第一阶段图像转化模型,输出图像尺寸与压缩图像的图像尺寸相同的第一中间图像。通过第二阶段图像转化模型将第一中间图像转化为第二中间图像,包括:对第一中间图像进行上采样,得到图像尺寸与待处理图像的图像尺寸相同的放大图像;将放大图像输入第二阶段图像转化模型,输出图像尺寸与放大图像的图像尺寸相同的第二中间图像。
在一个实施例中,确定第二中间图像对应的第二权重矩阵,包括:将待处理图像、第一中间图像与第二中间图像共同输入第一权重预测模型,得到与第二中间图像对应的第二权重矩阵。确定第一中间图像对应的第一权重矩阵,包括:根据第二权重矩阵,得到与第一中间图像对应的第一权重矩阵;第一权重矩阵与第二权重矩阵之和为预设矩阵。
在一个实施例中,将第一中间图像、第二中间图像按照对应的第一权重矩阵、第二权重矩阵进行融合,得到与待处理图像对应、且属于第二图像类别的目标图像,包括:将第一中间图像的各像素值与第一权重矩阵的各矩阵元素按位相乘,得到属于第二图像类别的第一目标图像;将第二中间图像的各像素值与第二权重矩阵的各矩阵元素按位相乘,得到属于第二图像类别第二目标图像;根据第一目标图像与第二目标图像,得到与待处理图像对应、且属于第二图像类别的目标图像。
在一个实施例中,该计算机程序被处理器执行时,还使得处理器执行以下步骤:获取属于第一图像类别的第一样本和属于第二图像类别的第二样本;将第一样本依次经过第一阶段图像转化模型和第一阶段图像逆向转化模型,得到第一样本单阶段恢复图像;将第二样本依次经过第一阶段图像逆向转化模型和第一阶段图像转化模型,得到第二样本单阶段恢复图像;按照第一样本与第一样本单阶段恢复图像的差异,及第二样本与第二样本单阶段恢复图像的差异,调整第一阶段图像转化模型和第一阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
在一个实施例中,该计算机程序被处理器执行时,还使得处理器执行以下步骤:获取第一样本经过第一阶段图像转化模型后,由第一阶段图像转化模型输出的第一样本单阶段转化图像;获取第二样本经过第一阶段图像逆向转化模型后,由第一阶段图像逆向转化模型输出的第二样本单阶段转化图像;将第一样本和第二样本单阶段转化图像分别输入第一阶段图像逆向转化鉴别模型,分别得到第一样本的鉴别置信度和第二样本单阶段转化图像的鉴别置信度;将第二样本和第一样本单阶段转化图像分别输入第一阶段图像转化鉴别模型,分别得到第二样本的鉴别置信度和第一样本单阶段转化图像的鉴别置信度。按照第一样本与第一样本单阶段恢复图像的差异,及第二样本与第二样本单阶段恢复图像的差异,调整第一阶段图像转化模型和第一阶段图像逆向转化模型,直至满足训练停止条件时结束训练,包括:按照最大化第一样本的鉴别置信度和第二样本的鉴别置信度的方向、最小化第二样本单阶段转化图像的鉴别置信度、第一样本单阶段转化图像的鉴别置信度、第一样本与第一样本单阶段恢复图像的差异,及第二样本与第二样本单阶段恢复图像的差异的方向,调整第一阶段图像转化鉴别模型、第一阶段图像逆向转化鉴别模型、第一阶段图像转化模型和第一阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
在一个实施例中,该计算机程序被处理器执行时,还使得处理器执行以下步骤:将第一样本依次经过第一阶段图像转化模型和第二阶段图像转化模型,得到第一阶段图像转化模型输出的第一样本一阶转化图像,和第二阶段图像转化模型输出的第一样本二阶转化图像;根据第一样本一阶转化图像和第一样本二阶转化图像,得到与第一样本对应、且属于第二图像类别的第一样本转化图像;将第一样本转化图像依次经过第一阶段图像逆向转化模型和第二阶段图像逆向转化模型,得到第一阶段图像逆向转化模型输出的第一样本一阶恢复图像,和第二阶段图像逆向转化模型输出的第一样本二阶恢复图像;根据第一样本一阶恢复图像和第一样本二阶恢复图像,得到与第一样本对应、且属于第一图像类别的第一样本恢复图像;将第二样本依次经过第一阶段图像逆向转化模型和第二阶段图像逆向转化模型,得到第一阶段图像逆向转化模型输出的第二样本一阶转化图像,和第二阶段图像逆向转化模型输出的第二样本二阶转化图像;根据第二样本一阶转化图像和第二样本二阶转化图像,得到与第二样本对应、且属于第一图像类别的第二样本转化图像;将第二样本转化图像依次经过第一阶段图像转化模型和第二阶段图像转化模型,得到第一阶段图像转化模型输出的第二样本一阶恢复图像,和第二阶段图像转化模型输出的第二样本二阶恢复图像;根据第二样本一阶恢复图像和第二样本二阶恢复图像,得到与第二样本对应、且属于第二图像类别的第二样本恢复图像;按照第一样本与第一样本恢复图像的差异,及第二样本与第二样本恢复图像的差异,调整第二阶段图像转化模型和第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
在一个实施例中,该计算机程序被处理器执行时,还使得处理器执行以下步骤:将第一样本和第二样本转化图像分别输入第二阶段图像逆向转化鉴别模型,分别得到第一样本的鉴别置信度和第二样本转化图像的鉴别置信度;将第二样本和第一样本转化图像分别输入第二阶段图像转化鉴别模型,分别得到第二样本的鉴别置信度和第一样本转化图像的鉴别置信度。按照第一样本与第一样本恢复图像的差异,及第二样本与第二样本恢复图像的差异,调整第二阶段图像转化模型和第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练,包括:按照最大化第一样本的鉴别置信度和第二样本的鉴别置信度的方向、最小化第二样本转化图像的鉴别置信度、第一样本转化图像的鉴别置信度、第一样本与第一样本恢复图像的差异,及第二样本与第二样本恢复图像的差异的方向,调整第二阶段图像转化鉴别模型、第二阶段图像逆向转化鉴别模型、第二阶段图像转化模型和第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
在一个实施例中,根据第一样本一阶转化图像和第一样本二阶转化图像,得到与第一样本对应、且属于第二图像类别的第一样本转化图像,包括:将第一样本、第一样本一阶转化图像和第一样本二阶转化图像共同输入第一权重预测模型,得到与第一样本二阶转化图像对应的权重矩阵;根据权重矩阵,得到与第一样本一阶转化图像对应的权重矩阵;将第一样本一阶转化图像和第一样本二阶转化图像按照各自对应的权重矩阵融合,得到与第一样本对应、且属于第二图像类别的第一样本转化图像。
根据第一样本一阶恢复图像和第一样本二阶恢复图像,得到与第一样本对应、且属于第一图像类别的第一样本恢复图像,包括:将第一样本转化图像、第一样本一阶恢复图像和第一样本二阶恢复图像共同输入第二权重预测模型,得到与第一样本二阶恢复图像对应的权重矩阵;根据权重矩阵,得到与第一样本一阶恢复图像对应的权重矩阵;将第一样本一阶恢复图像和第一样本二阶恢复图像按照各自对应的权重矩阵融合,得到与第一样本对应、且属于第一图像类别的第一样本恢复图像。
根据第二样本一阶转化图像和第二样本二阶转化图像,得到与第二样本对应、且属于第一图像类别的第二样本转化图像,包括:将第二样本、第二样本一阶转化图像和第二样本二阶转化图像共同输入第二权重预测模型,得到与第二样本二阶转化图像对应的权重矩阵;根据权重矩阵,得到与第二样本一阶转化图像对应的权重矩阵;将第二样本一阶转化图像和第二样本二阶转化图像按照各自对应的权重矩阵融合,得到与第二样本对应、且属于第一图像类别的第二样本转化图像。
根据第二样本一阶恢复图像和第二样本二阶恢复图像,得到与第二样本对应、且属于第二图像类别的第二样本恢复图像,包括:将第二样本转化图像、第二样本一阶恢复图像和第二样本二阶恢复图像共同输入第一权重预测模型,得到与第二样本二阶恢复图像对应的权重矩阵;根据权重矩阵,得到与第二样本一阶恢复图像对应的权重矩阵;将第二样本一阶恢复图像和第二样本二阶恢复图像按照各自对应的权重矩阵融合,得到与第二样本对应、且属于第二图像类别的第二样本恢复图像。
按照第一样本与第一样本恢复图像的差异,及第二样本与第二样本恢复图像的差异,调整第二阶段图像转化模型和第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练,包括:按照第一样本与第一样本恢复图像的差异,及第二样本与第二样本恢复图像的差异,调整第一权重预测模型、第二权重预测模型、第二阶段图像转化模型和第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中储存有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:获取属于第一图像类别的待处理图像;将待处理图像输入第一阶段图像转化模型,得到第一中间图像;通过第二阶段图像转化模型将第一中间图像转化为第二中间图像;确定第二中间图像对应的第二权重矩阵;确定第一中间图像对应的第一权重矩阵;将第一中间图像、第二中间图像按照对应的第一权重矩阵、第二权重矩阵进行融合,得到与待处理图像对应、且属于第二图像类别的目标图像。
在一个实施例中,将待处理图像输入第一阶段图像转化模型,得到第一中间图像,包括:对待处理图像进行下采样,得到图像尺寸缩小后的压缩图像;将压缩图像输入第一阶段图像转化模型,输出图像尺寸与压缩图像的图像尺寸相同的第一中间图像。通过第二阶段图像转化模型将第一中间图像转化为第二中间图像,包括:对第一中间图像进行上采样,得到图像尺寸与待处理图像的图像尺寸相同的放大图像;将放大图像输入第二阶段图像转化模型,输出图像尺寸与放大图像的图像尺寸相同的第二中间图像。
在一个实施例中,确定第二中间图像对应的第二权重矩阵,包括:将待处理图像、第一中间图像与第二中间图像共同输入第一权重预测模型,得到与第二中间图像对应的第二权重矩阵。确定第一中间图像对应的第一权重矩阵,包括:根据第二权重矩阵,得到与第一中间图像对应的第一权重矩阵;第一权重矩阵与第二权重矩阵之和为预设矩阵。
在一个实施例中,将第一中间图像、第二中间图像按照对应的第一权重矩阵、第二权重矩阵进行融合,得到与待处理图像对应、且属于第二图像类别的目标图像,包括:将第一中间图像的各像素值与第一权重矩阵的各矩阵元素按位相乘,得到属于第二图像类别的第一目标图像;将第二中间图像的各像素值与第二权重矩阵的各矩阵元素按位相乘,得到属于第二图像类别第二目标图像;根据第一目标图像与第二目标图像,得到与待处理图像对应、且属于第二图像类别的目标图像。
在一个实施例中,该计算机程序被处理器执行时,还使得处理器执行以下步骤:获取属于第一图像类别的第一样本和属于第二图像类别的第二样本;将第一样本依次经过第一阶段图像转化模型和第一阶段图像逆向转化模型,得到第一样本单阶段恢复图像;将第二样本依次经过第一阶段图像逆向转化模型和第一阶段图像转化模型,得到第二样本单阶段恢复图像;按照第一样本与第一样本单阶段恢复图像的差异,及第二样本与第二样本单阶段恢复图像的差异,调整第一阶段图像转化模型和第一阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
在一个实施例中,该计算机程序被处理器执行时,还使得处理器执行以下步骤:获取第一样本经过第一阶段图像转化模型后,由第一阶段图像转化模型输出的第一样本单阶段转化图像;获取第二样本经过第一阶段图像逆向转化模型后,由第一阶段图像逆向转化模型输出的第二样本单阶段转化图像;将第一样本和第二样本单阶段转化图像分别输入第一阶段图像逆向转化鉴别模型,分别得到第一样本的鉴别置信度和第二样本单阶段转化图像的鉴别置信度;将第二样本和第一样本单阶段转化图像分别输入第一阶段图像转化鉴别模型,分别得到第二样本的鉴别置信度和第一样本单阶段转化图像的鉴别置信度。按照第一样本与第一样本单阶段恢复图像的差异,及第二样本与第二样本单阶段恢复图像的差异,调整第一阶段图像转化模型和第一阶段图像逆向转化模型,直至满足训练停止条件时结束训练,包括:按照最大化第一样本的鉴别置信度和第二样本的鉴别置信度的方向、最小化第二样本单阶段转化图像的鉴别置信度、第一样本单阶段转化图像的鉴别置信度、第一样本与第一样本单阶段恢复图像的差异,及第二样本与第二样本单阶段恢复图像的差异的方向,调整第一阶段图像转化鉴别模型、第一阶段图像逆向转化鉴别模型、第一阶段图像转化模型和第一阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
在一个实施例中,该计算机程序被处理器执行时,还使得处理器执行以下步骤:将第一样本依次经过第一阶段图像转化模型和第二阶段图像转化模型,得到第一阶段图像转化模型输出的第一样本一阶转化图像,和第二阶段图像转化模型输出的第一样本二阶转化图像;根据第一样本一阶转化图像和第一样本二阶转化图像,得到与第一样本对应、且属于第二图像类别的第一样本转化图像;将第一样本转化图像依次经过第一阶段图像逆向转化模型和第二阶段图像逆向转化模型,得到第一阶段图像逆向转化模型输出的第一样本一阶恢复图像,和第二阶段图像逆向转化模型输出的第一样本二阶恢复图像;根据第一样本一阶恢复图像和第一样本二阶恢复图像,得到与第一样本对应、且属于第一图像类别的第一样本恢复图像;将第二样本依次经过第一阶段图像逆向转化模型和第二阶段图像逆向转化模型,得到第一阶段图像逆向转化模型输出的第二样本一阶转化图像,和第二阶段图像逆向转化模型输出的第二样本二阶转化图像;根据第二样本一阶转化图像和第二样本二阶转化图像,得到与第二样本对应、且属于第一图像类别的第二样本转化图像;将第二样本转化图像依次经过第一阶段图像转化模型和第二阶段图像转化模型,得到第一阶段图像转化模型输出的第二样本一阶恢复图像,和第二阶段图像转化模型输出的第二样本二阶恢复图像;根据第二样本一阶恢复图像和第二样本二阶恢复图像,得到与第二样本对应、且属于第二图像类别的第二样本恢复图像;按照第一样本与第一样本恢复图像的差异,及第二样本与第二样本恢复图像的差异,调整第二阶段图像转化模型和第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
在一个实施例中,该计算机程序被处理器执行时,还使得处理器执行以下步骤:将第一样本和第二样本转化图像分别输入第二阶段图像逆向转化鉴别模型,分别得到第一样本的鉴别置信度和第二样本转化图像的鉴别置信度;将第二样本和第一样本转化图像分别输入第二阶段图像转化鉴别模型,分别得到第二样本的鉴别置信度和第一样本转化图像的鉴别置信度。按照第一样本与第一样本恢复图像的差异,及第二样本与第二样本恢复图像的差异,调整第二阶段图像转化模型和第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练,包括:按照最大化第一样本的鉴别置信度和第二样本的鉴别置信度的方向、最小化第二样本转化图像的鉴别置信度、第一样本转化图像的鉴别置信度、第一样本与第一样本恢复图像的差异,及第二样本与第二样本恢复图像的差异的方向,调整第二阶段图像转化鉴别模型、第二阶段图像逆向转化鉴别模型、第二阶段图像转化模型和第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
在一个实施例中,根据第一样本一阶转化图像和第一样本二阶转化图像,得到与第一样本对应、且属于第二图像类别的第一样本转化图像,包括:将第一样本、第一样本一阶转化图像和第一样本二阶转化图像共同输入第一权重预测模型,得到与第一样本二阶转化图像对应的权重矩阵;根据权重矩阵,得到与第一样本一阶转化图像对应的权重矩阵;将第一样本一阶转化图像和第一样本二阶转化图像按照各自对应的权重矩阵融合,得到与第一样本对应、且属于第二图像类别的第一样本转化图像。
根据第一样本一阶恢复图像和第一样本二阶恢复图像,得到与第一样本对应、且属于第一图像类别的第一样本恢复图像,包括:将第一样本转化图像、第一样本一阶恢复图像和第一样本二阶恢复图像共同输入第二权重预测模型,得到与第一样本二阶恢复图像对应的权重矩阵;根据权重矩阵,得到与第一样本一阶恢复图像对应的权重矩阵;将第一样本一阶恢复图像和第一样本二阶恢复图像按照各自对应的权重矩阵融合,得到与第一样本对应、且属于第一图像类别的第一样本恢复图像。
根据第二样本一阶转化图像和第二样本二阶转化图像,得到与第二样本对应、且属于第一图像类别的第二样本转化图像,包括:将第二样本、第二样本一阶转化图像和第二样本二阶转化图像共同输入第二权重预测模型,得到与第二样本二阶转化图像对应的权重矩阵;根据权重矩阵,得到与第二样本一阶转化图像对应的权重矩阵;将第二样本一阶转化图像和第二样本二阶转化图像按照各自对应的权重矩阵融合,得到与第二样本对应、且属于第一图像类别的第二样本转化图像。
根据第二样本一阶恢复图像和第二样本二阶恢复图像,得到与第二样本对应、且属于第二图像类别的第二样本恢复图像,包括:将第二样本转化图像、第二样本一阶恢复图像和第二样本二阶恢复图像共同输入第一权重预测模型,得到与第二样本二阶恢复图像对应的权重矩阵;根据权重矩阵,得到与第二样本一阶恢复图像对应的权重矩阵;将第二样本一阶恢复图像和第二样本二阶恢复图像按照各自对应的权重矩阵融合,得到与第二样本对应、且属于第二图像类别的第二样本恢复图像。
按照第一样本与第一样本恢复图像的差异,及第二样本与第二样本恢复图像的差异,调整第二阶段图像转化模型和第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练,包括:按照第一样本与第一样本恢复图像的差异,及第二样本与第二样本恢复图像的差异,调整第一权重预测模型、第二权重预测模型、第二阶段图像转化模型和第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (26)
1.一种模型训练方法,包括:
获取属于第一图像类别的第一样本和属于第二图像类别的第二样本;
将所述第一样本依次经过第一阶段图像转化模型和第一阶段图像逆向转化模型,得到第一样本单阶段恢复图像;
将所述第二样本依次经过所述第一阶段图像逆向转化模型和所述第一阶段图像转化模型,得到第二样本单阶段恢复图像;
按照所述第一样本与所述第一样本单阶段恢复图像的差异,及所述第二样本与所述第二样本单阶段恢复图像的差异,调整所述第一阶段图像转化模型和所述第一阶段图像逆向转化模型,直至满足训练停止条件时结束训练;
将所述第一样本依次经过所述第一阶段图像转化模型和第二阶段图像转化模型,根据所述第一阶段图像转化模型输出的第一样本一阶转化图像,和所述第二阶段图像转化模型输出的第一样本二阶转化图像,得到与所述第一样本对应、且属于所述第二图像类别的第一样本转化图像;
将所述第一样本转化图像依次经过所述第一阶段图像逆向转化模型和第二阶段图像逆向转化模型,根据所述第一阶段图像逆向转化模型输出的第一样本一阶恢复图像,和所述第二阶段图像逆向转化模型输出的第一样本二阶恢复图像,得到与所述第一样本对应、且属于所述第一图像类别的第一样本恢复图像;
将所述第二样本依次经过所述第一阶段图像逆向转化模型和第二阶段图像逆向转化模型,根据所述第一阶段图像逆向转化模型输出的第二样本一阶转化图像,和所述第二阶段图像逆向转化模型输出的第二样本二阶转化图像,得到与所述第二样本对应、且属于所述第一图像类别的第二样本转化图像;
将所述第二样本转化图像依次经过所述第一阶段图像转化模型和第二阶段图像转化模型,根据所述第一阶段图像转化模型输出的第二样本一阶恢复图像,和所述第二阶段图像转化模型输出的第二样本二阶恢复图像,得到与所述第二样本对应、且属于所述第二图像类别的第二样本恢复图像;
按照所述第一样本与所述第一样本恢复图像的差异,及所述第二样本与所述第二样本恢复图像的差异,调整所述第二阶段图像转化模型和所述第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述第一样本经过所述第一阶段图像转化模型后,由所述第一阶段图像转化模型输出的第一样本单阶段转化图像;
获取所述第二样本经过所述第一阶段图像逆向转化模型后,由所述第一阶段图像逆向转化模型输出的第二样本单阶段转化图像;
将所述第一样本和所述第二样本单阶段转化图像分别输入第一阶段图像逆向转化鉴别模型,分别得到所述第一样本的鉴别置信度和所述第二样本单阶段转化图像的鉴别置信度;
将所述第二样本和所述第一样本单阶段转化图像分别输入第一阶段图像转化鉴别模型,分别得到所述第二样本的鉴别置信度和所述第一样本单阶段转化图像的鉴别置信度;
所述按照所述第一样本与所述第一样本单阶段恢复图像的差异,及所述第二样本与所述第二样本单阶段恢复图像的差异,调整所述第一阶段图像转化模型和所述第一阶段图像逆向转化模型,直至满足训练停止条件时结束训练,包括:
按照最大化所述第一样本的鉴别置信度和所述第二样本的鉴别置信度的方向、最小化所述第二样本单阶段转化图像的鉴别置信度、所述第一样本单阶段转化图像的鉴别置信度、所述第一样本与所述第一样本单阶段恢复图像的差异,及所述第二样本与所述第二样本单阶段恢复图像的差异的方向,调整所述第一阶段图像转化鉴别模型、所述第一阶段图像逆向转化鉴别模型、所述第一阶段图像转化模型和所述第一阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述第一样本和所述第二样本转化图像分别输入第二阶段图像逆向转化鉴别模型,分别得到所述第一样本的鉴别置信度和所述第二样本转化图像的鉴别置信度;
将所述第二样本和所述第一样本转化图像分别输入第二阶段图像转化鉴别模型,分别得到所述第二样本的鉴别置信度和所述第一样本转化图像的鉴别置信度;
所述按照所述第一样本与所述第一样本恢复图像的差异,及所述第二样本与所述第二样本恢复图像的差异,调整所述第二阶段图像转化模型和所述第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练,包括:
按照最大化所述第一样本的鉴别置信度和所述第二样本的鉴别置信度的方向、最小化所述第二样本转化图像的鉴别置信度、所述第一样本转化图像的鉴别置信度、所述第一样本与所述第一样本恢复图像的差异,及所述第二样本与所述第二样本恢复图像的差异的方向,调整所述第二阶段图像转化鉴别模型、所述第二阶段图像逆向转化鉴别模型、所述第二阶段图像转化模型和所述第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一样本一阶转化图像和所述第一样本二阶转化图像,得到与所述第一样本对应、且属于所述第二图像类别的第一样本转化图像,包括:
将所述第一样本、所述第一样本一阶转化图像和所述第一样本二阶转化图像共同输入第一权重预测模型,得到与所述第一样本二阶转化图像对应的权重矩阵;
根据所述权重矩阵,得到与所述第一样本一阶转化图像对应的权重矩阵;
将所述第一样本一阶转化图像和所述第一样本二阶转化图像按照各自对应的权重矩阵融合,得到与所述第一样本对应、且属于第二图像类别的第一样本转化图像。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一样本一阶恢复图像和所述第一样本二阶恢复图像,得到与所述第一样本对应、且属于所述第一图像类别的第一样本恢复图像,包括:
将所述第一样本转化图像、所述第一样本一阶恢复图像和所述第一样本二阶恢复图像共同输入第二权重预测模型,得到与所述第一样本二阶恢复图像对应的权重矩阵;
根据所述权重矩阵,得到与所述第一样本一阶恢复图像对应的权重矩阵;
将所述第一样本一阶恢复图像和所述第一样本二阶恢复图像按照各自对应的权重矩阵融合,得到与所述第一样本对应、且属于第一图像类别的第一样本恢复图像。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第二样本一阶转化图像和所述第二样本二阶转化图像,得到与所述第二样本对应、且属于所述第一图像类别的第二样本转化图像,包括:
将所述第二样本、所述第二样本一阶转化图像和所述第二样本二阶转化图像共同输入所述第二权重预测模型,得到与所述第二样本二阶转化图像对应的权重矩阵;
根据所述权重矩阵,得到与所述第二样本一阶转化图像对应的权重矩阵;
将所述第二样本一阶转化图像和所述第二样本二阶转化图像按照各自对应的权重矩阵融合,得到与所述第二样本对应、且属于第一图像类别的第二样本转化图像。
7.根据权利要求6所述的方法,其特征在于,所述根据所述第二样本一阶恢复图像和所述第二样本二阶恢复图像,得到与所述第二样本对应、且属于所述第二图像类别的第二样本恢复图像,包括:
将所述第二样本转化图像、所述第二样本一阶恢复图像和所述第二样本二阶恢复图像共同输入所述第一权重预测模型,得到与所述第二样本二阶恢复图像对应的权重矩阵;
根据所述权重矩阵,得到与所述第二样本一阶恢复图像对应的权重矩阵;
将所述第二样本一阶恢复图像和所述第二样本二阶恢复图像按照各自对应的权重矩阵融合,得到与所述第二样本对应、且属于第二图像类别的第二样本恢复图像。
8.根据权利要求7所述的方法,其特征在于,所述按照所述第一样本与所述第一样本恢复图像的差异,及所述第二样本与所述第二样本恢复图像的差异,调整所述第二阶段图像转化模型和所述第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练,包括:
按照所述第一样本与所述第一样本恢复图像的差异,及所述第二样本与所述第二样本恢复图像的差异,调整所述第一权重预测模型、所述第二权重预测模型、所述第二阶段图像转化模型和所述第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
9.根据权利要求1至8中任一项所述的方法,其特征在于,所述方法还包括:
获取属于第一图像类别的待处理图像;
将所述待处理图像输入训练好的第一阶段图像转化模型,得到第一中间图像;
通过训练好的第二阶段图像转化模型将所述第一中间图像转化为第二中间图像;
确定所述第二中间图像对应的第二权重矩阵;
确定所述第一中间图像对应的第一权重矩阵;
将所述第一中间图像、所述第二中间图像按照对应的第一权重矩阵、第二权重矩阵进行加权求和,得到与所述待处理图像对应、且属于第二图像类别的目标图像。
10.根据权利要求9所述的方法,其特征在于,所述将所述待处理图像输入第一阶段图像转化模型,得到第一中间图像,包括:
对所述待处理图像进行下采样,得到图像尺寸缩小后的压缩图像;
将所述压缩图像输入第一阶段图像转化模型,输出图像尺寸与所述压缩图像的图像尺寸相同的第一中间图像;
所述通过第二阶段图像转化模型将所述第一中间图像转化为第二中间图像,包括:
对所述第一中间图像进行上采样,得到图像尺寸与所述待处理图像的图像尺寸相同的放大图像;
将所述放大图像输入第二阶段图像转化模型,输出图像尺寸与所述放大图像的图像尺寸相同的第二中间图像。
11.根据权利要求9所述的方法,其特征在于,所述确定所述第二中间图像对应的第二权重矩阵,包括:
将所述待处理图像、所述第一中间图像与所述第二中间图像共同输入第一权重预测模型,得到与所述第二中间图像对应的第二权重矩阵;
所述确定所述第一中间图像对应的第一权重矩阵,包括:
根据所述第二权重矩阵,得到与所述第一中间图像对应的第一权重矩阵;所述第一权重矩阵与所述第二权重矩阵之和为预设矩阵。
12.根据权利要求11所述的方法,其特征在于,所述将所述第一中间图像、所述第二中间图像按照对应的第一权重矩阵、第二权重矩阵进行加权求和,得到与所述待处理图像对应、且属于第二图像类别的目标图像,包括:
将所述第一中间图像的各像素值与所述第一权重矩阵的各矩阵元素按位相乘,得到属于第二图像类别的第一目标图像;
将所述第二中间图像的各像素值与所述第二权重矩阵的各矩阵元素按位相乘,得到属于第二图像类别第二目标图像;
根据所述第一目标图像与所述第二目标图像,得到与所述待处理图像对应、且属于第二图像类别的目标图像。
13.一种模型训练装置,包括:
第一阶段模型训练模块,用于获取属于第一图像类别的第一样本和属于第二图像类别的第二样本;将所述第一样本依次经过所述第一阶段图像转化模型和第一阶段图像逆向转化模型,得到第一样本单阶段恢复图像;将所述第二样本依次经过所述第一阶段图像逆向转化模型和所述第一阶段图像转化模型,得到第二样本单阶段恢复图像;按照所述第一样本与所述第一样本单阶段恢复图像的差异,及所述第二样本与所述第二样本单阶段恢复图像的差异,调整所述第一阶段图像转化模型和所述第一阶段图像逆向转化模型,直至满足训练停止条件时结束训练;
第二阶段模型训练模块,用于将所述第一样本依次经过所述第一阶段图像转化模型和第二阶段图像转化模型,根据所述第一阶段图像转化模型输出的第一样本一阶转化图像,和所述第二阶段图像转化模型输出的第一样本二阶转化图像,得到与所述第一样本对应、且属于所述第二图像类别的第一样本转化图像;将所述第一样本转化图像依次经过所述第一阶段图像逆向转化模型和第二阶段图像逆向转化模型,根据所述第一阶段图像逆向转化模型输出的第一样本一阶恢复图像,和所述第二阶段图像逆向转化模型输出的第一样本二阶恢复图像,得到与所述第一样本对应、且属于所述第一图像类别的第一样本恢复图像;将所述第二样本依次经过所述第一阶段图像逆向转化模型和第二阶段图像逆向转化模型,根据所述第一阶段图像逆向转化模型输出的第二样本一阶转化图像,和所述第二阶段图像逆向转化模型输出的第二样本二阶转化图像,得到与所述第二样本对应、且属于所述第一图像类别的第二样本转化图像;将所述第二样本转化图像依次经过所述第一阶段图像转化模型和第二阶段图像转化模型,根据所述第一阶段图像转化模型输出的第二样本一阶恢复图像,和所述第二阶段图像转化模型输出的第二样本二阶恢复图像,得到与所述第二样本对应、且属于所述第二图像类别的第二样本恢复图像;按照所述第一样本与所述第一样本恢复图像的差异,及所述第二样本与所述第二样本恢复图像的差异,调整所述第二阶段图像转化模型和所述第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
14.根据权利要求13所述的装置,其特征在于,所述第一阶段模型训练模块,还用于获取所述第一样本经过所述第一阶段图像转化模型后,由所述第一阶段图像转化模型输出的第一样本单阶段转化图像;获取所述第二样本经过所述第一阶段图像逆向转化模型后,由所述第一阶段图像逆向转化模型输出的第二样本单阶段转化图像;将所述第一样本和所述第二样本单阶段转化图像分别输入第一阶段图像逆向转化鉴别模型,分别得到所述第一样本的鉴别置信度和所述第二样本单阶段转化图像的鉴别置信度;将所述第二样本和所述第一样本单阶段转化图像分别输入第一阶段图像转化鉴别模型,分别得到所述第二样本的鉴别置信度和所述第一样本单阶段转化图像的鉴别置信度;按照最大化所述第一样本的鉴别置信度和所述第二样本的鉴别置信度的方向、最小化所述第二样本单阶段转化图像的鉴别置信度、所述第一样本单阶段转化图像的鉴别置信度、所述第一样本与所述第一样本单阶段恢复图像的差异,及所述第二样本与所述第二样本单阶段恢复图像的差异的方向,调整所述第一阶段图像转化鉴别模型、所述第一阶段图像逆向转化鉴别模型、所述第一阶段图像转化模型和所述第一阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
15.根据权利要求13所述的装置,其特征在于,所述第二阶段模型训练模块,还用于将所述第一样本和所述第二样本转化图像分别输入第二阶段图像逆向转化鉴别模型,分别得到所述第一样本的鉴别置信度和所述第二样本转化图像的鉴别置信度;将所述第二样本和所述第一样本转化图像分别输入第二阶段图像转化鉴别模型,分别得到所述第二样本的鉴别置信度和所述第一样本转化图像的鉴别置信度;按照最大化所述第一样本的鉴别置信度和所述第二样本的鉴别置信度的方向、最小化所述第二样本转化图像的鉴别置信度、所述第一样本转化图像的鉴别置信度、所述第一样本与所述第一样本恢复图像的差异,及所述第二样本与所述第二样本恢复图像的差异的方向,调整所述第二阶段图像转化鉴别模型、所述第二阶段图像逆向转化鉴别模型、所述第二阶段图像转化模型和所述第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
16.根据权利要求13所述的装置,其特征在于,所述第二阶段模型训练模块,还用于将所述第一样本、所述第一样本一阶转化图像和所述第一样本二阶转化图像共同输入第一权重预测模型,得到与所述第一样本二阶转化图像对应的权重矩阵;根据所述权重矩阵,得到与所述第一样本一阶转化图像对应的权重矩阵;将所述第一样本一阶转化图像和所述第一样本二阶转化图像按照各自对应的权重矩阵融合,得到与所述第一样本对应、且属于第二图像类别的第一样本转化图像。
17.根据权利要求16所述的装置,其特征在于,所述第二阶段模型训练模块,还用于将所述第一样本转化图像、所述第一样本一阶恢复图像和所述第一样本二阶恢复图像共同输入第二权重预测模型,得到与所述第一样本二阶恢复图像对应的权重矩阵;根据所述权重矩阵,得到与所述第一样本一阶恢复图像对应的权重矩阵;将所述第一样本一阶恢复图像和所述第一样本二阶恢复图像按照各自对应的权重矩阵融合,得到与所述第一样本对应、且属于第一图像类别的第一样本恢复图像。
18.根据权利要求17所述的装置,其特征在于,所述第二阶段模型训练模块,还用于将所述第二样本、所述第二样本一阶转化图像和所述第二样本二阶转化图像共同输入所述第二权重预测模型,得到与所述第二样本二阶转化图像对应的权重矩阵;根据所述权重矩阵,得到与所述第二样本一阶转化图像对应的权重矩阵;将所述第二样本一阶转化图像和所述第二样本二阶转化图像按照各自对应的权重矩阵融合,得到与所述第二样本对应、且属于第一图像类别的第二样本转化图像。
19.根据权利要求18所述的装置,其特征在于,所述第二阶段模型训练模块,还用于将所述第二样本转化图像、所述第二样本一阶恢复图像和所述第二样本二阶恢复图像共同输入所述第一权重预测模型,得到与所述第二样本二阶恢复图像对应的权重矩阵;根据所述权重矩阵,得到与所述第二样本一阶恢复图像对应的权重矩阵;将所述第二样本一阶恢复图像和所述第二样本二阶恢复图像按照各自对应的权重矩阵融合,得到与所述第二样本对应、且属于第二图像类别的第二样本恢复图像。
20.根据权利要求19所述的装置,其特征在于,所述第二阶段模型训练模块,还用于按照所述第一样本与所述第一样本恢复图像的差异,及所述第二样本与所述第二样本恢复图像的差异,调整所述第一权重预测模型、所述第二权重预测模型、所述第二阶段图像转化模型和所述第二阶段图像逆向转化模型,直至满足训练停止条件时结束训练。
21.根据权利要求13至20中任一项所述的装置,其特征在于,所述装置还包括:
获取模块,用于获取属于第一图像类别的待处理图像;
第一阶段转化模块,用于将所述待处理图像输入训练好的第一阶段图像转化模型,得到第一中间图像;
第二阶段转化模块,用于通过训练好的第二阶段图像转化模型将所述第一中间图像转化为第二中间图像;
确定模块,用于确定所述第二中间图像对应的第二权重矩阵,确定所述第一中间图像对应的第一权重矩阵;
融合模块,用于将所述第一中间图像、所述第二中间图像按照对应的第一权重矩阵、第二权重矩阵进行加权求和,得到与所述待处理图像对应、且属于第二图像类别的目标图像。
22.根据权利要求21所述的装置,其特征在于,所述第一阶段转化模块,还用于对所述待处理图像进行下采样,得到图像尺寸缩小后的压缩图像;将所述压缩图像输入第一阶段图像转化模型,输出图像尺寸与所述压缩图像的图像尺寸相同的第一中间图像;
所述第二阶段转化模块,还用于对所述第一中间图像进行上采样,得到图像尺寸与所述待处理图像的图像尺寸相同的放大图像;将所述放大图像输入第二阶段图像转化模型,输出图像尺寸与所述放大图像的图像尺寸相同的第二中间图像。
23.根据权利要求21所述的装置,其特征在于,所述确定模块,还用于将所述待处理图像、所述第一中间图像与所述第二中间图像共同输入第一权重预测模型,得到与所述第二中间图像对应的第二权重矩阵;根据所述第二权重矩阵,得到与所述第一中间图像对应的第一权重矩阵;所述第一权重矩阵与所述第二权重矩阵之和为预设矩阵。
24.根据权利要求23所述的装置,其特征在于,所述融合模块,还用于将所述第一中间图像的各像素值与所述第一权重矩阵的各矩阵元素按位相乘,得到属于第二图像类别的第一目标图像;将所述第二中间图像的各像素值与所述第二权重矩阵的各矩阵元素按位相乘,得到属于第二图像类别第二目标图像;根据所述第一目标图像与所述第二目标图像,得到与所述待处理图像对应、且属于第二图像类别的目标图像。
25.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至12中任一项所述的方法的步骤。
26.一种计算机设备,包括存储器和处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至12中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910833116.6A CN110555821B (zh) | 2018-01-26 | 2018-01-26 | 模型训练方法、装置和存储介质 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810078544.8A CN108305238B (zh) | 2018-01-26 | 2018-01-26 | 图像处理方法、装置、存储介质和计算机设备 |
CN201910833116.6A CN110555821B (zh) | 2018-01-26 | 2018-01-26 | 模型训练方法、装置和存储介质 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810078544.8A Division CN108305238B (zh) | 2018-01-26 | 2018-01-26 | 图像处理方法、装置、存储介质和计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110555821A CN110555821A (zh) | 2019-12-10 |
CN110555821B true CN110555821B (zh) | 2022-04-05 |
Family
ID=62866445
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910833116.6A Active CN110555821B (zh) | 2018-01-26 | 2018-01-26 | 模型训练方法、装置和存储介质 |
CN201810078544.8A Active CN108305238B (zh) | 2018-01-26 | 2018-01-26 | 图像处理方法、装置、存储介质和计算机设备 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810078544.8A Active CN108305238B (zh) | 2018-01-26 | 2018-01-26 | 图像处理方法、装置、存储介质和计算机设备 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11276207B2 (zh) |
EP (1) | EP3745349B1 (zh) |
CN (2) | CN110555821B (zh) |
WO (1) | WO2019144855A1 (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110555821B (zh) * | 2018-01-26 | 2022-04-05 | 腾讯科技(深圳)有限公司 | 模型训练方法、装置和存储介质 |
US11164067B2 (en) * | 2018-08-29 | 2021-11-02 | Arizona Board Of Regents On Behalf Of Arizona State University | Systems, methods, and apparatuses for implementing a multi-resolution neural network for use with imaging intensive applications including medical imaging |
CN113902921B (zh) * | 2018-11-30 | 2022-11-25 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、设备及存储介质 |
CN109859152B (zh) * | 2018-12-25 | 2021-05-25 | 北京奇艺世纪科技有限公司 | 模型生成方法、图像增强方法、装置及计算机可读存储介质 |
CN109902723A (zh) * | 2019-01-31 | 2019-06-18 | 北京市商汤科技开发有限公司 | 图像处理方法及装置 |
KR102675806B1 (ko) * | 2019-05-03 | 2024-06-18 | 삼성전자주식회사 | 영상 처리 장치 및 그 영상 처리 방법 |
CN110473151B (zh) * | 2019-07-04 | 2022-05-03 | 北京航空航天大学 | 基于分区卷积和关联损失的双阶段图像补全方法及系统 |
US11416998B2 (en) * | 2019-07-30 | 2022-08-16 | Microsoft Technology Licensing, Llc | Pixel classification to reduce depth-estimation error |
US11080833B2 (en) * | 2019-11-22 | 2021-08-03 | Adobe Inc. | Image manipulation using deep learning techniques in a patch matching operation |
CN113496234B (zh) * | 2020-03-19 | 2024-07-26 | 中移(上海)信息通信科技有限公司 | 图像分类模型训练方法、图像分类方法、装置及电子设备 |
GB2595696B (en) * | 2020-06-04 | 2022-12-28 | Envisics Ltd | Forming a hologram of a target image for projection using data streaming |
CN112561792B (zh) * | 2020-12-25 | 2023-10-03 | 北京百度网讯科技有限公司 | 图像风格迁移方法、装置、电子设备及存储介质 |
CN115731588B (zh) * | 2021-08-27 | 2024-07-09 | 腾讯科技(深圳)有限公司 | 模型处理方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2950306A1 (en) * | 2014-05-29 | 2015-12-02 | Samsung Electronics Polska Spolka z organiczona odpowiedzialnoscia | A method and system for building a language model |
CN106211196A (zh) * | 2016-06-22 | 2016-12-07 | 西北工业大学 | 基于马尔科夫随机场的多无人航行体协同一致性方法 |
CN107220929A (zh) * | 2017-06-23 | 2017-09-29 | 深圳市唯特视科技有限公司 | 一种使用循环一致对抗网络的非成对图像转化方法 |
CN107577985A (zh) * | 2017-07-18 | 2018-01-12 | 南京邮电大学 | 基于循环生成对抗网络的人脸头像卡通化的实现方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8885976B1 (en) * | 2013-06-20 | 2014-11-11 | Cyberlink Corp. | Systems and methods for performing image fusion |
US9053558B2 (en) * | 2013-07-26 | 2015-06-09 | Rui Shen | Method and system for fusing multiple images |
CN103617596A (zh) * | 2013-10-12 | 2014-03-05 | 中山大学 | 一种基于流型转换的图像色彩风格变换方法 |
US9734143B2 (en) * | 2015-12-17 | 2017-08-15 | Facebook, Inc. | Multi-media context language processing |
CN106373109B (zh) * | 2016-08-31 | 2018-10-26 | 南方医科大学 | 一种医学图像模态合成的方法 |
CN106651766A (zh) * | 2016-12-30 | 2017-05-10 | 深圳市唯特视科技有限公司 | 一种基于深度卷积神经网络的图像风格迁移方法 |
CN107516290B (zh) * | 2017-07-14 | 2021-03-19 | 北京奇虎科技有限公司 | 图像转换网络获取方法、装置、计算设备及存储介质 |
AU2017101166A4 (en) * | 2017-08-25 | 2017-11-02 | Lai, Haodong MR | A Method For Real-Time Image Style Transfer Based On Conditional Generative Adversarial Networks |
CN110555821B (zh) * | 2018-01-26 | 2022-04-05 | 腾讯科技(深圳)有限公司 | 模型训练方法、装置和存储介质 |
-
2018
- 2018-01-26 CN CN201910833116.6A patent/CN110555821B/zh active Active
- 2018-01-26 CN CN201810078544.8A patent/CN108305238B/zh active Active
-
2019
- 2019-01-21 WO PCT/CN2019/072491 patent/WO2019144855A1/zh unknown
- 2019-01-21 EP EP19743676.9A patent/EP3745349B1/en active Active
-
2020
- 2020-05-21 US US16/880,883 patent/US11276207B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2950306A1 (en) * | 2014-05-29 | 2015-12-02 | Samsung Electronics Polska Spolka z organiczona odpowiedzialnoscia | A method and system for building a language model |
CN106211196A (zh) * | 2016-06-22 | 2016-12-07 | 西北工业大学 | 基于马尔科夫随机场的多无人航行体协同一致性方法 |
CN107220929A (zh) * | 2017-06-23 | 2017-09-29 | 深圳市唯特视科技有限公司 | 一种使用循环一致对抗网络的非成对图像转化方法 |
CN107577985A (zh) * | 2017-07-18 | 2018-01-12 | 南京邮电大学 | 基于循环生成对抗网络的人脸头像卡通化的实现方法 |
Non-Patent Citations (2)
Title |
---|
Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks;Jun-Yan Zhu等;《arXiv》;20171124;第1-20页 * |
基于瞬时转速分析的坦克柴油机失缸故障诊断方法;乔新勇等;《装甲兵工程学院学报》;20140630;第36-41页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110555821A (zh) | 2019-12-10 |
US11276207B2 (en) | 2022-03-15 |
EP3745349A1 (en) | 2020-12-02 |
CN108305238A (zh) | 2018-07-20 |
EP3745349A4 (en) | 2021-10-20 |
US20200286263A1 (en) | 2020-09-10 |
CN108305238B (zh) | 2022-03-29 |
EP3745349B1 (en) | 2024-08-21 |
WO2019144855A1 (zh) | 2019-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110555821B (zh) | 模型训练方法、装置和存储介质 | |
Kim et al. | Deep convolutional neural models for picture-quality prediction: Challenges and solutions to data-driven image quality assessment | |
CN108564127B (zh) | 图像转换方法、装置、计算机设备及存储介质 | |
CN109886330B (zh) | 文本检测方法、装置、计算机可读存储介质和计算机设备 | |
CN110490082B (zh) | 一种有效融合神经网络特征的道路场景语义分割方法 | |
CN112541864A (zh) | 一种基于多尺度生成式对抗网络模型的图像修复方法 | |
KR20200073267A (ko) | 생성 적대 네트워크를 위한 트레이닝 방법, 이미지 처리 방법, 디바이스 및 저장 매체 | |
JP6232982B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
CN110516541B (zh) | 文本定位方法、装置、计算机可读存储介质和计算机设备 | |
CN113269787A (zh) | 一种基于门控融合的遥感图像语义分割方法 | |
CN113128527B (zh) | 基于变换器模型和卷积神经网络的图像场景分类方法 | |
CN112785542B (zh) | 遥感影像转换网络地图方法、装置、计算机设备和介质 | |
CN113674191A (zh) | 一种基于条件对抗网络的弱光图像增强方法和装置 | |
CN112001931A (zh) | 图像分割方法、装置、设备及存储介质 | |
CN114648787A (zh) | 人脸图像的处理方法及相关设备 | |
CN116778165A (zh) | 基于多尺度自适应语义分割的遥感影像灾害检测方法 | |
CN116188929A (zh) | 小目标检测方法、小目标检测系统 | |
CN115936992A (zh) | 一种轻量级Transformer的垃圾图像超分辨方法及系统 | |
CN111881920A (zh) | 一种大分辨率图像的网络适配方法及神经网络训练装置 | |
CN117315241A (zh) | 一种基于transformer结构的场景图像语义分割方法 | |
CN111724309B (zh) | 图像处理方法及装置、神经网络的训练方法、存储介质 | |
CN116246064A (zh) | 一种多尺度空间特征增强方法及装置 | |
CN116188652A (zh) | 一种基于双尺度循环生成对抗的人脸灰度图像着色方法 | |
CN116994024A (zh) | 集装箱图像中的部件识别方法、装置、设备、介质及产品 | |
CN115908592A (zh) | 特征图的处理方法和相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40019345 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |