CN112381707B - 图像生成方法、装置、设备以及存储介质 - Google Patents
图像生成方法、装置、设备以及存储介质 Download PDFInfo
- Publication number
- CN112381707B CN112381707B CN202011203549.2A CN202011203549A CN112381707B CN 112381707 B CN112381707 B CN 112381707B CN 202011203549 A CN202011203549 A CN 202011203549A CN 112381707 B CN112381707 B CN 112381707B
- Authority
- CN
- China
- Prior art keywords
- image
- style
- target
- sample
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 109
- 238000012545 processing Methods 0.000 claims abstract description 131
- 239000011159 matrix material Substances 0.000 claims description 61
- 238000010606 normalization Methods 0.000 claims description 30
- 238000004590 computer program Methods 0.000 claims description 19
- 230000015654 memory Effects 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 19
- 238000011176 pooling Methods 0.000 claims description 18
- 230000004044 response Effects 0.000 claims description 7
- 239000002131 composite material Substances 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 abstract description 43
- 230000008859 change Effects 0.000 abstract description 9
- 239000013598 vector Substances 0.000 description 106
- 238000013473 artificial intelligence Methods 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 230000002093 peripheral effect Effects 0.000 description 10
- 241001465754 Metazoa Species 0.000 description 9
- 239000000284 extract Substances 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 230000001133 acceleration Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010428 oil painting Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 238000010429 water colour painting Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Abstract
本申请公开了一种图像生成方法、装置、设备以及存储介质,属于图像处理领域。通过本申请实施例提供的技术方案,终端能够通过至少两个第二图像的风格特征和第一图像,得到至少两个第二图像的图像风格融合后的目标图像。在这个过程中,目标对象也就由第一图像中的风格转变为了目标图像中的风格。若用户想要改变目标对象在目标图像中的风格,终端只需调整至少两个第二图像对应的权重大小,或者增加其他图像的风格特征进行融合即可。相较于相关技术中一个图像生成器只能生成一种特定风格的图像来说,本申请实施例提供的技术方案的能够同时生成多种风格的图像,图像生成的成本较低。
Description
技术领域
本申请涉及图像处理领域,特别涉及一种图像生成方法、装置、设备以及存储介质。
背景技术
随着基于人工智能的图像处理技术的发展,一些用户想通过图像处理技术将自己拍摄的图像转化为不同风格的图像。比如,一些用户想将自己的证件照转化为漫画风格的图像。
相关技术中,用户可以通过图像生成器,来将自己拍摄的图像转化为不同风格的图像。但是,一个图像生成器往往只能生成一种风格的图像,若用户想要生成多种风格的图像,那么需要借助多个图像生成器来进行图像生成,导致图像生成的成本较高。
发明内容
本申请实施例提供了一种图像生成方法、装置、设备以及存储介质,可以提升图像生成效果。所述技术方案如下:
一方面,提供了一种图像生成方法,所述方法包括:
获取第一图像和至少两个第二图像,所述第一图像包括目标对象,所述第一图像和所述至少两个第二图像属于不同的图像风格;
获取所述第一图像中所述目标对象的多个图像特征和所述至少两个第二图像的风格特征;
基于所述至少两个第二图像分别对应的权重,对所述至少两个第二图像的风格特征进行融合,得到目标风格特征;
基于所述目标风格特征,对所述多个图像特征进行调整;
基于调整后的所述多个图像特征,生成包括所述目标对象的目标图像,所述目标图像的图像风格与所述至少两个第二图像的图像风格相关联。
在一种可能的实施方式中,所述基于所述均值调整参数和所述方差调整参数,对所述多个图像特征进行调整包括:
获取所述多个图像特征的特征均值和特征方差;
基于所述特征均值和所述特征方差,对所述多个图像特征进行归一化处理;
基于所述均值调整参数和所述方差调整参数,对归一化处理后的所述多个图像特征进行调整。
一方面,提供了一种图像生成方法,所述方法包括:
显示图像获取界面,所述图像获取界面用于获取包括目标对象的第一图像和至少两个第二图像,所述第一图像和所述至少两个第二图像属于不同的图像风格;
获取与所述至少两个第二图像分别对应的权重;
响应于图像生成指令,基于所述第一图像、所述至少两个第二图像以及与所述至少两个第二图像分别对应的权重,生成包括所述目标对象的目标图像,所述目标图像的图像风格与所述至少两个第二图像的图像风格相关联。
一方面,提供了一种图像生成装置,所述装置包括:
图像获取模块,用于获取获取第一图像和至少两个第二图像,所述第一图像包括目标对象,所述第一图像和所述至少两个第二图像属于不同的图像风格;
特征获取模块,用于获取所述第一图像中所述目标对象的多个图像特征和所述至少两个第二图像的风格特征;
特征融合模块,用于基于所述至少两个第二图像分别对应的权重,对所述至少两个第二图像的风格特征进行融合,得到目标风格特征;
特征调整模块,用于基于所述目标风格特征,对所述多个图像特征进行调整;
第一目标图像生成模块,用于基于调整后的所述多个图像特征,生成包括所述目标对象的目标图像,所述目标图像的图像风格与所述至少两个第二图像的图像风格相关联。
在一种可能的实施方式中,所述特征获取模块,用于将所述第一图像输入图像生成模型,通过所述图像生成模型,对所述第一图像进行卷积处理,得到所述第一图像中所述目标对象的多个图像特征;将所述至少两个第二图像输入风格确定模型,通过所述风格确定模型,对所述第二图像进行卷积处理、反卷积处理和池化处理,得到所述至少两个第二图像的风格特征。
在一种可能的实施方式中,所述第一目标图像生成模块,用于将所述调整后的所述多个图像特征输入所述图像生成模型,通过所述图像生成模型,对所述调整后的所述多个图像特征进行反卷积处理,生成所述包括所述目标对象的目标图像。
在一种可能的实施方式中,所述图像生成模型的训练装置包括:
第一输入模块,用于将包括样本对象的第一样本图像和第二样本图像的样本风格特征输入待训练图像生成模型,通过所述待训练图像生成模型,生成包括所述样本对象的样本目标图像,所述样本目标图像的图像风格与所述第二样本图像的图像风格相关联;
第二输入模块,用于将所述样本目标图像输入判别器,由所述判别器输出所述样本目标图像的类型,所述类型用于表示所述样本目标图像为原生图像还是合成图像;
参数调整模块,用于根据所述类型,对所述待训练图像生成模型的模型参数进行调整。
在一种可能的实施方式中,所述第一输入模块,用于通过所述待训练图像生成模型对所述第一样本图像进行卷积处理,得到所述第一样本图像中样本对象的多个样本图像特征;基于所述第二样本图像的样本风格特征,对所述多个样本图像特征进行调整;通过所述待训练图像生成模型,基于调整后的所述多个样本图像特征,生成所述样本目标图像。
在一种可能的实施方式中,所述第二输入模块,用于将所述样本目标图像输入所述判别器,通过所述判别器对所述样本目标图像进行卷积处理和反卷积处理,得到所述样本目标图像的分类矩阵,所述分类矩阵中的数值表示所述样本目标图像中对应区域的类型。
在一种可能的实施方式中,所述装置还包括下述至少一个模块:
缩放处理模块,用于对所述第一图像进行缩放处理;
归一化处理模块,用于对所述第一图像的像素值进行归一化处理;
其中,缩放处理后的所述第一图像的尺寸符合目标尺寸条件,归一化处理后的所述第一图像的像素值处于目标像素值区间。
在一种可能的实施方式中,所述缩放处理模块还用于将所述目标图像的尺寸调整为所述第一图像相同;
所述归一化处理模块,还用于对所述目标图像的像素值进行归一化处理;
其中,归一化处理后的所述目标图像的像素值与所述第一图像的像素值处于相同的像素值区间。
在一种可能的实施方式中,所述特征调整模块,用于对所述目标风格特征进行全连接处理,得到所述目标风格特征对应的风格调整参数;基于所述风格调整参数,对所述多个图像特征进行调整。
在一种可能的实施方式中,所述特征调整模块,用于将所述风格调整参数的前半部分作为均值调整参数,将所述风格调整参数的后半部分作为方差调整参数,所述均值调整参数用于调整所述多个图像特征的特征均值,所述方差调整参数用于调整所述多个图像特征的特征方差;基于所述均值调整参数和所述方差调整参数,对所述多个图像特征进行调整。
在一种可能的实施方式中,所述特征调整模块,用于获取所述多个图像特征的特征均值和特征方差;基于所述特征均值和所述特征方差,对所述多个图像特征进行归一化处理;基于所述均值调整参数和所述方差调整参数,对归一化处理后的所述多个图像特征进行调整。
一方面,提供了一种图像生成装置,所述装置包括:
显示模块,用于显示图像获取界面,所述图像获取界面用于获取包括目标对象的第一图像和至少两个第二图像,所述第一图像和所述至少两个第二图像属于不同的图像风格;
权重获取模块,用于获取与所述至少两个第二图像分别对应的权重;
第二目标图像生成模块,用于响应于图像生成指令,基于所述第一图像、所述至少两个第二图像以及与所述至少两个第二图像分别对应的权重,生成包括所述目标对象的目标图像,所述目标图像的图像风格与所述至少两个第二图像的图像风格相关联。
一方面,提供了一种计算机设备,所述计算机设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条计算机程序,所述计算机程序由所述一个或多个处理器加载并执行以实现所述图像生成方法。
一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述计算机程序由处理器加载并执行以实现所述图像生成方法。
一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括程序代码,该程序代码存储在计算机可读存储介质中,计算机设备的处理器从计算机可读存储介质读取该程序代码,处理器执行该程序代码,使得该计算机设备执行上述图像生成方法。
通过本申请实施例提供的技术方案,终端能够通过至少两个第二图像的风格特征和第一图像,得到至少两个第二图像的图像风格融合后的目标图像。在这个过程中,目标对象也就由第一图像中的风格转变为了目标图像中的风格。若用户想要改变目标对象在目标图像中的风格,终端只需调整至少两个第二图像对应的权重大小,或者增加其他图像的风格特征进行融合即可。相较于相关技术中一个图像生成器只能生成一种特定风格的图像来说,本申请实施例提供的技术方案的能够同时生成多种风格的图像,图像生成的成本较低。
附图说明
为例更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种图像生成方法的实施环境的示意图;
图2是本申请实施例提供的一种模型的结构示意图;
图3是本申请实施例提供的一种风格确定模型的结构示意图;
图4是本申请实施例提供的一种图像生成模型的训练方法的流程图;
图5是本申请实施例提供的一种图像生成方法的流程图;
图6是本申请实施例提供的一种图像生成方法的流程图;
图7是本申请实施例提供的一种图像生成方法的流程图;
图8是本申请实施例提供的一种界面示意图;
图9是本申请实施例提供的一种界面示意图;
图10是本申请实施例提供的一种图像生成装置的结构示意图;
图11是本申请实施例提供的一种图像生成装置的结构示意图;
图12是本申请实施例提供的一种终端的结构示意图;
图13是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请中术语“第一”“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分,应理解,“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系,也不对数量和执行顺序进行限定。
本申请中术语“至少一个”是指一个或多个,“多个”的含义是指两个或两个以上,例如,多个参照人脸图像是指两个或两个以上的参照人脸图像。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识子模型使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
图1是本申请实施例提供的一种图像生成方法的实施环境示意图,参见图1,该实施环境中可以包括终端110和服务器140。
终端110通过无线网络或有线网络与服务器140相连。可选地,终端110是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端110安装和运行有支持图像显示的应用程序。
可选地,服务器是独立的物理服务器,或者是多个物理服务器构成的服务器集群或者分布式系统,或者是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
可选地,终端110泛指多个终端中的一个,本申请实施例仅以终端110来举例说明。
本领域技术人员可以知晓,上述终端的数量可以更多或更少。比如上述终端仅为一个,或者上述终端为几十个或几百个,或者更多数量,此时上述实施环境中还包括其他终端。本申请实施例对终端的数量和设备类型不加以限定。
介绍完本申请实施例的实施环境以后,下面对本申请实施例提供的技术方案的应用场景进行说明。本申请实施例提供的技术方案能够应用在多种场景下,比如应用在人像动漫化的场景下,或者应用在动物、车辆以及建筑物动漫化的场景下,本申请实施例对此不作限定。
在人像动漫化的场景下,当用户想要将某张带有人脸的图像转化为动漫风格的图像时,用户能够在终端上选择该图像以及动漫风格的预览图像,终端提取用户选择图像中人脸的多个图像特征。终端根据动漫风格的预览图像对应的风格特征,对多个图像特征进行调整,基于调整后的多个图像特征生成动漫化后的人脸图像。终端将动漫化后的人脸图像呈现给用户,用户可以选择存储动漫化后的人脸图像,也可以将该动漫化后的人脸图像分享给其他用户。
在动物动漫化的场景下,当用户想要将某张带有动物的图像转化为动漫风格的图像时,用户能够在终端上选择该图像以及动漫风格的预览图像,终端提取用户选择图像中动物的多个图像特征。终端根据动漫风格的预览图像对应的风格特征,对多个图像特征进行调整,基于调整后的多个图像特征生成动漫化后的动物图像。终端将动漫化后的动物图像呈现给用户,用户可以选择存储动漫化后的动物图像,也可以将该动漫化后的动物图像分享给其他用户。
在车辆动漫化的场景下,当用户想要将某张带有车辆的图像转化为动漫风格的图像时,用户能够在终端上选择该图像以及动漫风格的预览图像,终端提取用户选择图像中车辆的多个图像特征。终端根据动漫风格的预览图像对应的风格特征,对多个图像特征进行调整,基于调整后的多个图像特征生成动漫化后的车辆图像。终端将动漫化后的车辆图像呈现给用户,用户可以选择存储动漫化后的车辆图像,也可以将该动漫化后的车辆图像分享给其他用户。
在建筑物动漫化的场景下,当用户想要将某张带有建筑物的图像转化为动漫风格的图像时,用户能够在终端上选择该图像以及动漫风格的预览图像,终端提取用户选择图像中建筑物的多个图像特征。终端根据动漫风格的预览图像对应的风格特征,对多个图像特征进行调整,基于调整后的多个图像特征生成动漫化后的建筑物图像。终端将动漫化后的建筑物图像呈现给用户,用户可以选择存储动漫化后的建筑物图像,也可以将该动漫化后的建筑物图像分享给其他用户。
需要说明的是,采用本申请实施例提供的技术方案之后,终端除了能够对上述几类图像进行动漫化之外,也能够对其他类型的图像进行动漫化,本申请实施例对此不作限定。
在本申请实施例中,终端能够通过一个图像生成模型来生成目标图像,通过一个判别器来对图像生成模型进行训练,通过一个风格确定模型来得到动漫图像的风格特征,为了更加清楚的对本申请实施例提供的技术方案进行说明,下面将结合图2,以模型的训练过程为例,首先对图像生成模型、判别器以及风格确定模型之间的配合方式进行说明。
在图2中,包括图像生成模型201、风格确定模型202以及判别器203。图像生成模型201包括多个编码层2011以及多个解码层2012。
在模型的训练的一次迭代过程中,终端将包含样本对象的第一样本图像204输入图像生成模型,通过图像生成模型的编码层2011对第一样本图像204进行编码,提取第一样本图像204中样本对象的多个样本图像特征。终端将动漫图像205输入风格确定模型202,通过风格确定模型202提取动漫图像205的样本风格特征,其中,风格确定模型202的结构参见图3,风格确定模型包括基干网络301和多个分支网络302,基干网络301包括多个卷积层和激活层,分支网络302为一个全卷积网络,用于输出图像对应的风格特征。终端将动漫图像205的样本风格特征输入图像生成模型201,通过图像生成模型201基于动漫图像205的样本风格特征,对样本对象的多个样本图像特征进行调整。终端将调整后的多个样本图像特征输入图像生成模型201的解码层2012,通过解码层2012生成样本目标图像206,样本目标图像206也即是动漫化后的图像。终端将样本目标图像206输入判别器203,通过判别器203输出样本目标图像206的类型,该类型用于指示样本目标图像206为原生图像还是合成图像,其中,判别器203的结构与风格确定模型202的结构类似,都包括基干网络和多个分支网络,不同的是,判别器的分支网络用于输出不同风格图像的类型。终端根据判别器203输出的类型,对图像生成模型201的模型参数进行调整。终端反复执行上述迭代过程,即可完成对图像生成模型201的训练。
下面基于上述图像生成模型201、风格确定模型202以及判别器203的结构,对图像生成模型的训练方法进行说明。
图4是本申请实施例提供的一种图像生成模型的训练方法,参见图4,方法包括:
401、终端将包括样本对象的第一样本图像和第二样本图像的样本风格特征输入待训练图像生成模型,通过待训练图像生成模型,生成包括样本对象的样本目标图像,样本目标图像的图像风格与第二样本图像的图像风格相关联。
在一种可能的实施方式中,终端通过待训练图像生成模型对第一样本图像进行卷积处理,得到第一样本图像中样本对象的多个第一样本图像特征。终端基于第二样本图像的样本风格特征,对多个第一样本图像特征进行调整。终端通过待训练图像生成模型,基于调整后的多个第一样本图像特征,生成样本目标图像。
举例来说,若终端采用第一样本图像特征向量和样本风格特征向量来表示第一样本图像特征和样本风格特征,那么终端能够将第一样本图像对应的第一样本像素值矩阵输入待训练图像生成模型,通过待训练图像生成模型的多个卷积层,对第一样本像素值矩阵进行多次卷积处理,得到第一样本图像中样本对象的多个第一样本图像特征向量,其中,待训练图像生成模型对第一样本像素值矩阵进行多次卷积处理的过程,也可以称为图像的编码过程。终端对第二样本图像的样本风格特征向量进行全连接处理,得到风格特征向量对应的样本风格调整参数。终端基于样本风格调整参数,对多个第一样本图像特征向量进行调整。终端通过待训练图像生成模型,对多个调整后的第一样本图像特征向量进行反卷积处理,生成包括样本对象的样本目标图像,其中,待训练图像生成模型对调整后的第一样本图像特征向量进行多次反卷积处理的过程,也可以称为图像的解码过程。
另外,在步骤401之前,终端能够通过风格确定模型来获取第二样本图像的样本风格特征,方法如下。
在一种可能的实施方中,若终端采用样本风格特征向量来表示样本风格特征,那么终端能够将第二样本图像对应的像素值矩阵输入风格确定模型,通过风格确定模型的基干网络,对该像素值矩阵进行卷积处理,得到第二样本图像的多个第二样本图像特征。终端将多个第二样本图像特征输入与第二样本图像的图像风格对应的分支网络,通过分支网络对多个第二样本图像特征进行多次卷积处理、反卷积处理以及池化处理,得到第二样本图像的样本风格特征向量,该样本风格特征向量也就能够反映第二样本图像的风格。
402、终端将样本目标图像输入判别器,由判别器输出样本目标图像的类型,该类型用于表示样本目标图像为原生图像还是合成图像。
在一种可能的实施方式中,终端将样本目标图像输入判别器,通过判别器对样本目标图像进行卷积处理和反卷积处理,得到样本目标图像的分类矩阵,分类矩阵中的数值表示样本目标图像中对应区域的类型。
举例来说,若终端采用样本目标图像特征向量来表示样本目标图像特征,那么终端能够将样本目标图像对应的样本目标像素值矩阵输入判别器,通过判别器基干网络的多个卷积层,对样本目标像素值矩阵进行多次卷积处理,得到样本目标图像的多个样本目标特征矩阵。终端将多个样本目标特征矩阵输入与第二样本图像的图像风格对应的分支网络,通过分支网络的多个卷积层,对多个样本目标特征矩阵进行卷积处理,得到分类矩阵,分类矩阵中的数值对应于样本目标图像中的一个区域的类型,该类型能够表示该区域为原生图像还是合成图像。
下面再通过一个例子对上述实施方式进行说明。
在一种可能的实施方式中,样本目标图像的尺寸为256×256,颜色通道的数量为3。终端将样本目标图像对应的样本目标像素值矩阵输入判别器,通过判别器基干网络的5个卷积层和5个激活层,对样本目标像素值矩阵进行卷积处理和激活处理,其中,样本目标像素值矩阵包括3个颜色通道值矩阵,颜色通道值矩阵中的数值为第一图像上对应位置的像素点的颜色通道值。终端通过判别器的5个卷积层和5个激活层,将3个256×256颜色通道矩阵转换成512个8×8的样本目标特征矩阵。终端根据第二样本图像的类型,确定与第二样本图像对应的分支网络,将512个8×8的样本目标特征矩阵输入该分支网络,通过该分支网络的多个卷积层,对512个8×8的样本目标特征矩阵进行卷积处理,得到尺寸为8×8的分类矩阵,分类矩阵中的每个数值,对应于样本目标图像中尺寸为32×32的一个区域的类型。在一些实施例中,分类矩阵中的数值为1,则表示对应区域为原生图像,分类矩阵中的数值为0,则表示对应区域为合成图像。
403、终端根据该类型,对待训练图像生成模型的模型参数进行调整。
在一种可能的实施方式中,终端根据样本目标图像中不同区域的类型,确定待训练图像生成模型的损失函数的变化方向。根据待训练图像生成模型的损失函数,来对待训练图像生成模型的模型参数进行调整。响应于待训练图像生成模型的损失函数收敛至目标数值,或者待训练生成模型的训练次数达到目标次数,将此时的待训练图像生成模型获取为训练完毕的图像生成模型。
需要说明的是,在上述步骤401-403中,是以终端对图像生成模型进行训练为例进行说明的,在其他可能的实施方式中,为了提高训练效率,也可以由服务器来对图像生成模型进行训练,服务器将训练完成的图像生成模型发送给终端使用,或者作为一种图像生成的云服务提供的终端调用,本申请实施例对此不作限定。
在实验过程中,采用小批量(Mini-Batch)数据进行前向计算,得到相应的循环重建误差(Cycle Reconstruction Error)以及对抗网络误差(Adversarial Error),其中,循环重建误差和对抗网络误差也即是待训练图像生成模型的损失函数。随后基于误差通过亚当(Adam)算法对待训练图像生成模型的模型参数进行更新,不断重复迭代,直到模型收敛。在训练过程中,整个待训练图像生成模型采用端到端的训练方式进行训练。训练时的数据量的大小为128,训练到40万次迭代会大致收敛。
在本申请实施例中,可以由服务器或终端作为执行主体来实施本申请实施例提供的技术方案,也可以通过终端和服务器之间的交互来实施本申请提供的技术方法,本申请实施例对此不作限定。下面将以执行主体为终端为例进行说明。
图5是本申请实施例提供的一种图像生成方法的流程图,参见图5,方法包括:
501、终端获取第一图像和至少两个第二图像,第一图像包括目标对象,第一图像和至少两个第二图像属于不同的图像风格。
可选地,目标对象为人脸、动物、车辆或者建筑物,本申请实施例对此不作限定。图像风格用于标识一类图像的特征,比如在同一部漫画作品中,不同的漫画图像就属于同一个图像风格。
502、终端获取第一图像中目标对象的多个图像特征和至少两个第二图像的风格特征。
可选地,第一图像中目标对象的多个图像特征为目标对象的多个不同类型的特征。第二图像的风格特征为从整体上反映第二图像风格的特征。
503、终端基于至少两个第二图像分别对应的权重,对至少两个第二图像的风格特征进行融合,得到目标风格特征。
可选地,第二图像分别对应的权重由用户进行设置,或者由技术人员根据实际情况进行设置,本申请实施例对此不作限定。
504、终端基于目标风格特征,对多个图像特征进行调整。
可选地,若终端采用目标风格特征向量和图像特征向量来表示目标风格特征和图像特征,那么终端也就能够基于目标风格特征向量对多个图像特征向量的数值进行调整。
505、终端基于调整后的多个图像特征,生成包括目标对象的目标图像,目标图像的图像风格与至少两个第二图像的图像风格相关联。
通过本申请实施例提供的技术方案,终端能够通过至少两个第二图像的风格特征和第一图像,得到至少两个第二图像的图像风格融合后的目标图像。在这个过程中,目标对象也就由第一图像中的风格转变为了目标图像中的风格,若用户想要改变目标对象在目标图像中的风格,终端只需调整至少两个第二图像对应的权重大小,或者增加其他图像的风格特征进行融合即可。相较于相关技术中一个图像生成器只能生成一种特定风格的图像来说,本申请实施例提供的技术方案的能够同时生成多种风格的图像,图像生成的成本较低。
图6是本申请实施例提供的一种图像生成方法的流程图,参见图6,方法包括:
601、终端获取第一图像和至少两个第二图像,第一图像包括目标对象,第一图像和至少两个第二图像属于不同的图像风格。
其中,目标对象的类型参见步骤501的描述,在此不再赘述。
602、终端将第一图像输入图像生成模型,通过图像生成模型,对第一图像进行卷积处理,得到第一图像中目标对象的多个图像特征。
在一种可能的实施方式中,若终端采用图像特征向量来表示图像特征,那么终端能够将第一图像对应的第一像素值矩阵输入图像生成模型,通过图像生成模型的多个卷积层,对第一像素值矩阵进行多次卷积处理,得到第一图像中目标对象的多个图像特征向量,其中,图像生成模型对第一像素值矩阵进行多次卷积处理的过程,也可以称为图像的编码过程。
举例来说,若第一图像的尺寸为256×256,颜色通道的数量为3。终端将第一图像对应的第一像素值矩阵输入图像生成模型,其中,第一像素值矩阵包括3个颜色通道值矩阵,每个颜色通道值矩阵中的数值为第一图像上对应位置的像素点的颜色通道值。由于第一图像的尺寸为256×256,也就标识第一图像中存在256×256个像素点,且每个像素点对应于3个颜色通道值,在上述过程中,终端向图像生成模型输入了3×256×256个数值。终端通过图像生成模型的多个卷积层,对3个颜色通道值矩阵进行卷积处理,得到第一图像中目标对象多个图像特征矩阵。在一些实施例中,终端通过图像生成模型的5个卷积层,得到512个尺寸为8×8的图像特征矩阵。终端将多个图像特征矩阵转化为多个图像特征向量。以终端通过图像生成模型得到512个尺寸为8×8的图像特征矩阵为例,终端将512个尺寸为8×8的图像特征矩阵在空间上从二维拉成一维,得到512个图像特征向量。
其中,终端将尺寸为8×8的图像特征矩阵在空间上从二维拉成一维的过程,也就是将尺寸为8×8的图像特征矩阵中的数字,按照顺序进行排列的过程。为了更加清楚的进行说明,下面以终端将尺寸为2×2的图像特征矩阵在空间上从二维拉成一维的过程为例进行说明。若一个图像特征矩阵为终端对图像特征矩阵中的数字,按照从上至下,从左至右的顺序进行排列,得到图像特征向量(1,3,2,4)。若终端按照从左至右,从上至下的顺序对图像特征矩阵中的数字进行排列,得到图像特征向量(1,2,3,4),本申请实施例对于图像特征矩阵中数字的排列方式不作限定。
可选地,在步骤602之前,终端还能够对第一图像进行预处理,以提高通过图像处理模型获取图像特征的效率。终端能够通过以下至少一种方式对第一图像进行预处理。
在一种可能的实施方式中,终端对第一图像进行缩放处理,缩放处理后的第一图像的尺寸符合目标尺寸条件。
其中,目标尺寸条件与训练图像生成模型时采用的样本图像的尺寸相关联,比如训练图像生成模型时采用的样本图像的尺寸为256×256,那么第一图像的尺寸符合目标尺寸条件也就是指第一图像的尺寸为256×256,也就是说,终端向图像生成模型输入第一图像之前,可以将第一图像的尺寸调整为256×256。通过将第一图像的尺寸缩放为与样本图像相同,能够提高图像生成模型提取图像特征的效率。同时,还能够避免第一图像尺寸不一致导致的图像特征提取错误。
在一种可能的实施方式中,终端对第一图像的像素值进行归一化处理,归一化处理后的第一图像的像素值处于目标像素值区间。
其中,目标像素值区间的区间长度由技术人员根据实际情况进行设置,本申请实施例对此不作限定。
以目标像素值区间为(-1,1)为例,终端对第一图像的三个颜色通道的颜色通道值进行归一化处理,将处于区间(0,255)上的颜色通道值归一化至目标像素值区间(-1,1)上。比如,区间(0,255)上的颜色通道值0和255,归一化至目标像素值区间(-1,1)后就变成了-1和1,区间(0,255)上的颜色通道值100,归一化至目标像素值区间(-1,1)后就变成了-1+(100/255)×2=-0.21。
603、终端将至少两个第二图像输入风格确定模型,通过风格确定模型,对至少两个第二图像进行卷积处理、反卷积处理和池化处理,得到至少两个第二图像的风格特征,第二图像与第一图像属于不同的图像风格。
可选地,第二图像为动漫图像,或者为油画图像,水彩画图像等类型的图像,本申请实施例对此不作限定。
在一种可能的实施方式中,若终端采用风格特征向量来表示风格特征,那么终端能够将至少两个第二图像对应的像素值矩阵输入风格确定模型,通过风格确定模型的多个卷积层、反卷积层以及池化层,对像素值矩阵进行多次卷积处理、反卷积处理以及池化处理,得到至少两个第二图像的风格特征向量,风格特征向量也就能够反映至少两个第二图像的风格。
举例来说,若至少两个第二图像的尺寸均为256×256,颜色通道的数量均为3。终端对至少两个第二图像中的每个第二图像的处理方式属于同一发明构思,下面以终端对至少两个第二图像中的一个第二图像进行处理的过程为例说明。终端将第二图像对应的第二像素值矩阵输入风格确定模型,其中,第二像素值矩阵包括3个颜色通道值矩阵,每个颜色通道值矩阵中的数值对应于第二图像上对应位置的颜色通道值。由于第二图像的尺寸均为256×256,也就表示第二图像中存在256×256个像素点,且每个像素点对应于3个颜色通道值,在上述过程中,终端向风格确定模型输入了3×256×256个数值。终端通过风格确定模型的多个卷积层,对3个颜色通道值矩阵进行卷积处理,得到第二图像中目标对象多个图像特征矩阵。在一些实施例中,终端通过风格确定模型的5个卷积层,得到512个尺寸为8×8的图像特征矩阵。终端通过风格确定模型的反卷积层,对512个尺寸为8×8的图像特征矩进行反卷积处理,得到64个尺寸为8×8的图像特征矩阵,其中,卷积处理也可以称为下采样过程,反卷积处理也可以称为上采样过程。终端通过风格确定模型的池化层,对64个尺寸为8×8的图像特征矩进行全局池化处理,得到64个尺寸为1×1的图像特征矩阵。终端将64个尺寸为1×1的图像特征矩阵转化为一个1维的风格特征向量。
可选地,上述过程中的池化处理为最大化池化处理和平均池化处理中的任一项。
以池化处理为最大化池化处理为例,终端能够通过风格确定模型的池化层,分别获取每个8×8的图像特征矩阵中的最大数值,将该最大数值作为尺寸为1×1的图像特征矩阵。终端将64个尺寸为1×1的图像特征矩阵中的数值进行拼接,得到一个1维的风格特征向量。
以池化处理为平均池化处理为例,终端能够通过风格确定模型的池化层,分别获取每个8×8的图像特征矩阵中64个数值的平均数值,将该平均数值作为尺寸为1×1的图像特征矩阵。终端将64个尺寸为1×1的图像特征矩阵中的数值进行拼接,得到一个1维的风格特征向量。
需要说明的是,在步骤601之后,终端除了能够先执行步骤602,再执行步骤603之外,也能够先执行步骤603,再执行步骤602,或者同时执行步骤602和603,本申请实施例对于终端执行上述步骤602和603的顺序不作限定,在本申请实施例中,仅以终端先执行步骤602,再执行步骤603为例进行说明。
604、终端基于至少两个第二图像分别对应的权重,对至少两个第二图像的风格特征进行融合,得到目标风格特征。
可选地,权重用于表示目标风格特征与对应第二图像的风格特征的相似程度。其中,权重由用户根据实际需要进行设置,若一个第二图像的风格特征对应的权重大于另一个第二图像的风格特征对应的权重,那么后续生成的目标图像的图像风格也就更类似于对应权重较大的第二图像。另外,上述至少两个权重的和为1。
在这种实现方式下,终端能够将至少两个第二图像的风格特征进行融合,从而实现至少两个第二图像的图像风格的融合,生成的目标风格特征既与至少两个第二图像相关联,又不同于任一个第二图像。通过这样的方式,能够提高后续生成目标图像的多样性。
举例来说,若终端采用风格特征向量和图像特征向量来表示风格特征和图像特征,那么终端能够基于每个风格特征向量对应的权重,对至少两个第二图像的风格特征向量进行加权求和,得到目标风格特征向量。
605、终端对目标风格特征进行全连接处理,得到目标风格特征对应的风格调整参数,基于风格调整参数,对多个图像特征进行调整。
在一种可能的实施方式中,终端对目标风格特征进行全连接处理,得到风格特征对应的风格调整参数。终端将风格调整参数的前半部分作为均值调整参数,将风格调整参数的后半部分作为方差调整参数,均值调整参数用于调整多个图像特征的特征均值,方差调整参数用于调整多个图像特征的特征方差。终端基于均值调整参数和方差调整参数,对多个图像特征进行调整。
在上述实施方式的基础上,下面对终端基于均值调整参数和方差调整参数,对多个图像特征进行调整的方法进行说明。
在一种可能的实施方式中,终端获取多个图像特征的特征均值和特征方差。终端基于特征均值和特征方差,对多个图像特征进行归一化处理。终端基于均值调整参数和方差调整参数,对归一化处理后的多个图像特征进行调整。
下面结合上述两种实施方式对步骤603进行说明。
在一种可能的实施方式中,以终端采用目标风格特征向量和图像特征向量来表示目标风格特征和图像特征为例进行说明,终端将目标风格特征向量与全连接处理的权重矩阵相乘,得到风格调整参数对应的风格调整向量。终端将风格调整向量前半部分的数值获取为均值调整参数对应的均值调整向量,将风格调整向量的后半部分的数值获取为方差调整参数对应的方差调整向量。终端获取多个图像特征向量的特征均值向量和特征方差向量,基于特征均值向量和特征方差向量对多个图像特征向量进行归一化,得到归一化后的多个图像特征向量。
其中,基于特征均值向量和特征方差向量对多个图像特征向量进行归一化的过程,包括终端获取每个图像特征向量与特征均值向量的差值向量,以及终端获取每个差值向量中每个数值与特征方差向量中对应数值的比值向量两个过程,其中,比值向量也即是归一化后的图像特征向量。终端将每个归一化后的图像特征向量中每个数值与方差调整向量中对应数值相乘,再将每个与方差调整向量中对应数值相乘后的向量与均值调整向量相加,实现对多个图像特征向量的调整过程。
举例来说,若目标目标风格特征向量为一个64×1的向量,终端对目标风格特征向量进行全连接处理,也即是将64×1的目标风格特征向量与一个权重矩阵相乘,其中,权重矩阵行数与目标风格特征向量的列数相同,权重矩阵的列数为图像特征向量的列数的二倍。在一些实施例中,该权重矩阵为一个128×64的矩阵。终端将64×1的目标风格特征向量与128×64的矩阵相乘之后,得到一个128×1的风格调整参数对应的风格调整向量。终端从128×1的风格调整向量中将前64个数值获取为均值调整向量,将后64个数值获取为方差调整向量。终端分别获取多个64×1的图像特征向量特征均值向量和特征方差向量。在一些实施例中,终端获取特征均值向量可以基于下述公式(1)来实现,终端获取特征方差向量可以基于下述公式(2)来实现。终端基于特征均值向量和特征方差向量,对多个图像特征向量进行归一化处理,归一化处理可以基于下述公式(3)来实现。终端基于均值调整向量和方差调整向量对归一化后的图像特征向量进行调整的过程参见下述公式(4)。
(fc)i,j=(ft)i,j·σt 2+μi (4)
其中,μi为特征均值向量,M为图像特征向量的数量,(fenc)i,j为图像特征向量,σi 2为特征方差向量,(ft)i,j为归一化后的图像特征向量,(fc)i,j为调整后的图像特征向量。
606、终端将调整后的多个图像特征输入图像生成模型,通过图像生成模型,对调整后的多个图像特征进行反卷积处理,生成包括目标对象的目标图像,目标图像的图像风格与至少两个第二图像的图像风格相关联。
在一种可能的实施方式中,若终端采用图像特征向量来表示图像特征,那么终端能够通过图像生成模型的反卷积层,对调整后的图像特征向量进行多次反卷积处理,生成目标对象的第三像素值矩阵,终端通过第三像素值矩阵,对目标图像进行显示,在一些实施例中,图像生成模型对调整后的图像特征向量进行多次反卷积处理的过程,也可以称为图像的解码过程。
举例来说,若调整后的图像特征向量的尺寸为64×1,那么终端基于调整后的图像特征向量,生成调整后的图像特征矩阵,调整后的图像特征矩阵的尺寸为8×8,其中,调整后的图像特征矩阵也就是将调整后的图像特征向量中的数值按顺序填充后得到的。在一些实施例中,调整后的图像特征矩阵的数量为512,终端通过图像生成模型的5个反卷积层,对512个调整后的图像特征矩阵进行5次反卷积处理,得到三个尺寸为256×256的颜色通道值矩阵,其中,三个尺寸为256×256的颜色通道值矩阵也即是第三像素值矩阵。终端基于三个尺寸为256×256的颜色通道值矩阵就能够显示尺寸为256×256的目标图像。
可选地,若终端在步骤602之前,对第一图像进行了预处理,那么在步骤606之后,终端还能够对生成的目标图像进行后处理,使得目标图像能够正常的进行显示。终端能够通过以下至少一种方式对目标图像进行后处理。
在一种可能的实施方式中,终端将目标图像的尺寸调整为第一图像相同。
在这种实施方式下,若终端在将第一图像输入图像生成模型之前对第一图像进行了缩放处理,那么能够在生成目标图像后,将目标图像的尺寸调整为与第一图像相同,这样能够保证目标图像中目标对象的显示比例与第一图像相同,还原目标图像的显示效果。
在一种可能的实施方式中,终端对目标图像的像素值进行归一化处理,其中,归一化处理后的目标图像的像素值与第一图像的像素值处于相同的像素值区间。
在这种实现方式下,若终端在将第一图像输入图像生成模型对第一图像的像素值进行了归一化处理,那么终端在生成目标图像之后,还需要对目标图像的像素值再次进行归一化处理,使得目标图像的像素值能够落符合颜色通道值取值范围的区间上,从而使得终端能够正常显示目标图像。
需要说明的是,上述步骤601-606是以终端执行本申请实施例提供的技术方案为例进行说明的,在其他可能的实施方式中,也可以由服务器来执行上述步骤601-606,也即是服务器将本申请实施例提供的技术方案作为一种云服务提供给终端,举例来说,用户能够在终端上选择第一图像,终端将第一图像上传给服务器,服务器通过该云服务来生成目标图像,将目标图像发送给终端,终端将目标图像展现给用户。
在上述步骤601-606中,提供了一种图像生成的方法,以人像动漫化的场景为例,也即是用户提供多张不同动漫域的动漫图片,然后将它们输入风格确定模型,得到多个动漫域的各自风格特征向量,接下来按一定比例线性组合这些风格特征向量,也就是基于权重来进行加权就和,得到一个目标风格特征向量。那么使用这个新得到的目标风格特征向量就可以产生多风格融合的动漫化结果,同时具备不同动漫域的特点。用户可以调节不同动漫图片的风格特征向量的权重,来生成不同的图片,某个风格特征向量的权重越大,则生成的图片越像这个动漫域的风格。该策略趣味性更强,可以让用户有互动的感觉。
通过本申请实施例提供的技术方案,终端能够通过至少两个第二图像的风格特征和第一图像,得到至少两个第二图像的图像风格融合后的目标图像。在这个过程中,目标对象也就由第一图像中的风格转变为了目标图像中的风格。若用户想要改变目标对象在目标图像中的风格,终端只需调整至少两个第二图像对应的权重大小,或者增加其他图像的风格特征进行融合即可。相较于相关技术中一个图像生成器只能生成一种特定风格的图像来说,本申请实施例提供的技术方案的能够同时生成多种风格的图像,图像生成的成本较低。
除此之外,本申请实施例还提供了另一种图像生成方法,参见图7,方法包括:
701、终端显示图像获取界面,图像获取界面用于获取包括目标对象的第一图像和至少两个第二图像,第一图像和至少两个第二图像属于不同的图像风格。
在一种可能的实施方式中,若用户想要改变某张第一图像的图像风格,那么可以启动终端上安装的图像处理应用程序,启动该图像处理应用程序之后,终端能够显示图像获取界面。用户能够通过图像处理应用程序来选择该第一图像和至少两个第二图像,其中,图像处理应用程序为能够执行上述步骤601-606的应用程序。
下面以两个例子对上述实施方式进行说明:
例1、若第二图像的数量为2,参见图8,终端能够为用户提供如图8所示的图像获取界面801,用户能够在图像获取界面801上选择想要进行风格转化的图像802,选择完毕之后,用户还能够选择两个图像803和804作为获取风格特征向量的图像。可选地,图像802为用户自己拍摄的图像,比如为用户的自拍图像,或者为用户从网络上下载的图像,本申请实施例对此不作限定。图像803和图像804为终端为用户提供的多个图像中的任意两个图像,用户可以通过点击图像803或图像804来更换不同的图像。
例2、若第二图像的数量为大于或等于2,比如为3个,那么终端能够为用户提供如图9所示的图像获取界面901,用户能够在图像获取界面901上选择想要进行风格转化的图像902。选择完毕之后,用户还能够选择至少两个图像,以图像为3个为例,用户能够自行选择图像获取界面901中的图像903、图像904以及图像905。
702、终端获取与至少两个第二图像分别对应的权重。
下面以两个例子对上述步骤702进行说明。
例1、参见图8,用户能够通过拖动图像803和图像804下方的权重调整方块805来调整图像803和图像804对应的权重,在一些实施例中,方块的位置越靠近左侧,表示图像803对应的权重更高。方块的位置越靠近右侧,表示图像804对应的权重更高。
例2、参见图9,用户能够在图像903、图像904以及图像905分别对应的权重输入区域906中,输入图像903、图像904以及图像905对应的权重。
703、响应于图像生成指令,终端基于第一图像、至少两个第二图像以及与至少两个第二图像分别对应的权重,生成包括目标对象的目标图像,目标图像的图像风格与至少两个第二图像的图像风格相关联。
在一种可能的实施方式中,图像获取界面上显示有图像获取控件,响应于对图像获取控件的点击操作,终端触发图像生成指令。响应于图像生成指令,终端基于第一图像、至少两个第二图像以及与至少两个第二图像分别对应的权重,生成包括目标对象的目标图像,其中,终端基于第一图像、至少两个第二图像以及与至少两个第二图像分别对应的权重,生成包括目标对象的目标图像的过程,参见上述步骤602-606,在此不再赘述。
下面以两个例子对上述实施方式进行说明。
例1、参见图8,用户拖动权重调整方块805到想要的位置之后,点击图像生成按钮806就能够得到目标图像。
例2、参见图8,用户填写完图像903、图像904以及图像905对应的权重之后,点击图像生成按钮907就能够得到目标图像。
通过本申请实施例提供的技术方案,终端能够通过至少两个第二图像的风格特征和第一图像,得到至少两个第二图像的图像风格融合后的目标图像。在这个过程中,目标对象也就由第一图像中的风格转变为了目标图像中的风格。若用户想要改变目标对象在目标图像中的风格,终端只需调整至少两个第二图像对应的权重大小,或者增加其他图像的风格特征进行融合即可。相较于相关技术中一个图像生成器只能生成一种特定风格的图像来说,本申请实施例提供的技术方案的能够同时生成多种风格的图像,图像生成的成本较低。
图10是本申请实施例提供的一种图像生成装置的结构示意图,参见图10,装置包括:图像获取模块1001、特征获取模块1002、特征融合模块1003、特征调整模块1004以及第一目标图像生成模块1005。
图像获取模块1001,用于获取获取第一图像和至少两个第二图像,第一图像包括目标对象,第一图像和至少两个第二图像属于不同的图像风格。
特征获取模块1002,用于获取第一图像中目标对象的多个图像特征和至少两个第二图像的风格特征。
特征融合模块1003,用于基于至少两个第二图像分别对应的权重,对至少两个第二图像的风格特征进行融合,得到目标风格特征。
特征调整模块1004,用于基于目标风格特征,对多个图像特征进行调整。
第一目标图像生成模块1005,用于基于调整后的多个图像特征,生成包括目标对象的目标图像,目标图像的图像风格与至少两个第二图像的图像风格相关联。
在一种可能的实施方式中,特征获取模块,用于将第一图像输入图像生成模型,通过图像生成模型,对第一图像进行卷积处理,得到第一图像中目标对象的多个图像特征。将至少两个第二图像输入风格确定模型,通过风格确定模型,对第二图像进行卷积处理、反卷积处理和池化处理,得到至少两个第二图像的风格特征。
在一种可能的实施方式中,第一目标图像生成模块,用于将调整后的多个图像特征输入图像生成模型,通过图像生成模型,对调整后的多个图像特征进行反卷积处理,生成包括目标对象的目标图像。
在一种可能的实施方式中,图像生成模型的训练装置包括:
第一输入模块,用于将包括样本对象的第一样本图像和第二样本图像的样本风格特征输入待训练图像生成模型,通过待训练图像生成模型,生成包括样本对象的样本目标图像,样本目标图像的图像风格与第二样本图像的图像风格相关联。
第二输入模块,用于将样本目标图像输入判别器,由判别器输出样本目标图像的类型,类型用于表示样本目标图像为原生图像还是合成图像。
参数调整模块,用于根据类型,对待训练图像生成模型的模型参数进行调整。
在一种可能的实施方式中,第一输入模块,用于通过待训练图像生成模型对第一样本图像进行卷积处理,得到第一样本图像中样本对象的多个样本图像特征。基于第二样本图像的样本风格特征,对多个样本图像特征进行调整。通过待训练图像生成模型,基于调整后的多个样本图像特征,生成样本目标图像。
在一种可能的实施方式中,第二输入模块,用于将样本目标图像输入判别器,通过判别器对样本目标图像进行卷积处理和反卷积处理,得到样本目标图像的分类矩阵,分类矩阵中的数值表示样本目标图像中对应区域的类型。
在一种可能的实施方式中,装置还包括下述至少一个模块:
缩放处理模块,用于对第一图像进行缩放处理。
归一化处理模块,用于对第一图像的像素值进行归一化处理。
其中,缩放处理后的第一图像的尺寸符合目标尺寸条件,归一化处理后的第一图像的像素值处于目标像素值区间。
在一种可能的实施方式中,缩放处理模块还用于将目标图像的尺寸调整为第一图像相同。
归一化处理模块,还用于对目标图像的像素值进行归一化处理。
其中,归一化处理后的目标图像的像素值与第一图像的像素值处于相同的像素值区间。
在一种可能的实施方式中,特征调整模块,用于对目标风格特征进行全连接处理,得到目标风格特征对应的风格调整参数。基于风格调整参数,对多个图像特征进行调整。
在一种可能的实施方式中,特征调整模块,用于将风格调整参数的前半部分作为均值调整参数,将风格调整参数的后半部分作为方差调整参数,均值调整参数用于调整多个图像特征的特征均值,方差调整参数用于调整多个图像特征的特征方差。基于均值调整参数和方差调整参数,对多个图像特征进行调整。
在一种可能的实施方式中,特征调整模块,用于获取多个图像特征的特征均值和特征方差。基于特征均值和特征方差,对多个图像特征进行归一化处理。基于均值调整参数和方差调整参数,对归一化处理后的多个图像特征进行调整。
需要说明的是:上述实施例提供的图像生成装置在生成图像时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将计算机设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的图像生成装置与图像生成方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
通过本申请实施例提供的技术方案,终端能够通过至少两个第二图像的风格特征和第一图像,得到至少两个第二图像的图像风格融合后的目标图像。在这个过程中,目标对象也就由第一图像中的风格转变为了目标图像中的风格。若用户想要改变目标对象在目标图像中的风格,终端只需调整至少两个第二图像对应的权重大小,或者增加其他图像的风格特征进行融合即可。相较于相关技术中一个图像生成器只能生成一种特定风格的图像来说,本申请实施例提供的技术方案的能够同时生成多种风格的图像,图像生成的成本较低。
图11是本申请实施例提供的一种图像生成装置的结构示意图,参见图11,装置包括:显示模块1101、权重获取模块1102以及第二目标图像生成模块1103。
显示模块1101,用于显示图像获取界面,图像获取界面用于获取包括目标对象的第一图像和至少两个第二图像,第一图像和至少两个第二图像属于不同的图像风格。
权重获取模块1102,用于获取与至少两个第二图像分别对应的权重。
第二目标图像生成模块1103,用于响应于图像生成指令,基于第一图像、至少两个第二图像以及与至少两个第二图像分别对应的权重,生成包括目标对象的目标图像,目标图像的图像风格与至少两个第二图像的图像风格相关联。
需要说明的是:上述实施例提供的图像生成装置在生成图像时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将计算机设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的图像生成装置与图像生成方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
通过本申请实施例提供的技术方案,终端能够通过至少两个第二图像的风格特征和第一图像,得到至少两个第二图像的图像风格融合后的目标图像。在这个过程中,目标对象也就由第一图像中的风格转变为了目标图像中的风格。若用户想要改变目标对象在目标图像中的风格,终端只需调整至少两个第二图像对应的权重大小,或者增加其他图像的风格特征进行融合即可。相较于相关技术中一个图像生成器只能生成一种特定风格的图像来说,本申请实施例提供的技术方案的能够同时生成多种风格的图像,图像生成的成本较低。
本申请实施例提供了一种计算机设备,用于执行上述方法,该计算机设备可以实现为终端或者服务器,下面先对终端的结构进行介绍:
图12是本申请实施例提供的一种终端的结构示意图。该终端1200可以是:智能手机、平板电脑、笔记本电脑或台式电脑。终端1200还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端1200包括有:一个或多个处理器1201和一个或多个存储器1202。
处理器1201可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1201可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1201也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1201可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1201还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1202可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1202还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1202中的非暂态的计算机可读存储介质用于存储至少一个计算机程序,该至少一个计算机程序用于被处理器1201所执行以实现本申请中方法实施例提供的图像生成方法。
在一些实施例中,终端1200还可选包括有:外围设备接口1203和至少一个外围设备。处理器1201、存储器1202和外围设备接口1203之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1203相连。具体地,外围设备包括:射频电路1204、显示屏1205、摄像头组件1206、音频电路1207和电源1209中的至少一种。
外围设备接口1203可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器1201和存储器1202。在一些实施例中,处理器1201、存储器1202和外围设备接口1203被集成在同一芯片或电路板上;在一些其他实施例中,处理器1201、存储器1202和外围设备接口1203中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路1204用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1204通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1204将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1204包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。
显示屏1205用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1205是触摸显示屏时,显示屏1205还具有采集在显示屏1205的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1201进行处理。此时,显示屏1205还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。
摄像头组件1206用于采集图像或视频。可选地,摄像头组件1206包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。
音频电路1207可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1201进行处理,或者输入至射频电路1204以实现语音通信。
电源1209用于为终端1200中的各个组件进行供电。电源1209可以是交流电、直流电、一次性电池或可充电电池。
在一些实施例中,终端1200还包括有一个或多个传感器1210。该一个或多个传感器1210包括但不限于:加速度传感器1211、陀螺仪传感器1212、压力传感器1213、光学传感器1215以及接近传感器1216。
加速度传感器1211可以检测以终端1200建立的坐标系的三个坐标轴上的加速度大小。
陀螺仪传感器1212可以终端1200的机体方向及转动角度,陀螺仪传感器1212可以与加速度传感器1211协同采集用户对终端1200的3D动作。
压力传感器1213可以设置在终端1200的侧边框和/或显示屏1205的下层。当压力传感器1213设置在终端1200的侧边框时,可以检测用户对终端1200的握持信号,由处理器1201根据压力传感器1213采集的握持信号进行左右手识别或快捷操作。当压力传感器1213设置在显示屏1205的下层时,由处理器1201根据用户对显示屏1205的压力操作,实现对UI界面上的可操作性控件进行控制。
光学传感器1215用于采集环境光强度。在一个实施例中,处理器1201可以根据光学传感器1215采集的环境光强度,控制显示屏1205的显示亮度。
接近传感器1216用于采集用户与终端1200的正面之间的距离。
本领域技术人员可以理解,图12中示出的结构并不构成对终端1200的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
上述计算机设备还可以实现为服务器,下面对服务器的结构进行介绍:
图13是本申请实施例提供的一种服务器的结构示意图,该服务器1300可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器(Central Processing Units,CPU)1301和一个或多个的存储器1302,其中,所述一个或多个存储器1302中存储有至少一条计算机程序,所述至少一条计算机程序由所述一个或多个处理器1301加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器1300还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器1300还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括计算机程序的存储器,上述计算机程序可由处理器执行以完成上述实施例中的图像生成方法。例如,该计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括程序代码,该程序存储在计算机可读存储介质中,计算机设备的处理器从计算机可读存储介质读取该程序代码,处理器执行该程序代码,使得该计算机设备执行上述图像生成方法。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
上述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (20)
1.一种图像生成方法,其特征在于,所述方法包括:
获取第一图像和至少两个第二图像,所述第一图像包括目标对象,所述第一图像和所述至少两个第二图像属于不同的图像风格;
获取所述第一图像中所述目标对象的多个图像特征和所述至少两个第二图像的风格特征;
基于所述至少两个第二图像分别对应的权重,对所述至少两个第二图像的风格特征进行融合,得到目标风格特征;
对所述目标风格特征进行全连接处理,得到所述目标风格特征对应的风格调整参数;
将所述风格调整参数的前半部分作为均值调整参数,将所述风格调整参数的后半部分作为方差调整参数,所述均值调整参数用于调整所述多个图像特征的特征均值,所述方差调整参数用于调整所述多个图像特征的特征方差;
基于所述均值调整参数和所述方差调整参数,对所述多个图像特征进行调整;
基于调整后的所述多个图像特征,生成包括所述目标对象的目标图像,所述目标图像的图像风格与所述至少两个第二图像的图像风格相关联。
2.根据权利要求1所述的方法,其特征在于,所述获取所述第一图像中所述目标对象的多个图像特征和所述至少两个第二图像的风格特征包括:
将所述第一图像输入图像生成模型,通过所述图像生成模型,对所述第一图像进行卷积处理,得到所述第一图像中所述目标对象的多个图像特征;
将所述至少两个第二图像输入风格确定模型,通过所述风格确定模型,对所述第二图像进行卷积处理、反卷积处理和池化处理,得到所述至少两个第二图像的风格特征。
3.根据权利要求2所述的方法,其特征在于,所述基于调整后的所述多个图像特征,生成包括所述目标对象的目标图像包括:
将所述调整后的所述多个图像特征输入所述图像生成模型,通过所述图像生成模型,对所述调整后的所述多个图像特征进行反卷积处理,生成所述包括所述目标对象的目标图像。
4.根据权利要求2或3任一项所述的方法,其特征在于,所述图像生成模型的训练方法包括:
将包括样本对象的第一样本图像和第二样本图像的样本风格特征输入待训练图像生成模型,通过所述待训练图像生成模型,生成包括所述样本对象的样本目标图像,所述样本目标图像的图像风格与所述第二样本图像的图像风格相关联;
将所述样本目标图像输入判别器,由所述判别器输出所述样本目标图像的类型,所述类型用于表示所述样本目标图像为原生图像还是合成图像;
根据所述类型,对所述待训练图像生成模型的模型参数进行调整。
5.根据权利要求4所述的方法,其特征在于,所述通过所述待训练图像生成模型,生成包括所述样本对象的样本目标图像包括:
通过所述待训练图像生成模型对所述第一样本图像进行卷积处理,得到所述第一样本图像中样本对象的多个样本图像特征;
基于所述第二样本图像的样本风格特征,对所述多个样本图像特征进行调整;
通过所述待训练图像生成模型,基于调整后的所述多个样本图像特征,生成所述样本目标图像。
6.根据权利要求4所述的方法,其特征在于,所述将所述样本目标图像输入判别器,由所述判别器输出所述样本目标图像的类型包括:
将所述样本目标图像输入所述判别器,通过所述判别器对所述样本目标图像进行卷积处理和反卷积处理,得到所述样本目标图像的分类矩阵,所述分类矩阵中的数值表示所述样本目标图像中对应区域的类型。
7.根据权利要求2所述的方法,其特征在于,所述将所述第一图像输入图像生成模型之前,所述方法还包括下述至少一项:
对所述第一图像进行缩放处理;
对所述第一图像的像素值进行归一化处理;
其中,缩放处理后的所述第一图像的尺寸符合目标尺寸条件,归一化处理后的所述第一图像的像素值处于目标像素值区间。
8.根据权利要求7所述的方法,其特征在于,所述生成包括所述目标对象的目标图像之后,所述方法还包括下述至少一项:
将所述目标图像的尺寸调整为所述第一图像相同;
对所述目标图像的像素值进行归一化处理;
其中,归一化处理后的所述目标图像的像素值与所述第一图像的像素值处于相同的像素值区间。
9.一种图像生成方法,其特征在于,所述方法包括:
显示图像获取界面,所述图像获取界面用于获取包括目标对象的第一图像和至少两个第二图像,所述第一图像和所述至少两个第二图像属于不同的图像风格;
获取与所述至少两个第二图像分别对应的权重;
响应于图像生成指令,基于所述第一图像、所述至少两个第二图像以及与所述至少两个第二图像分别对应的权重,生成包括所述目标对象的目标图像,所述目标图像的图像风格与所述至少两个第二图像的图像风格相关联;其中,所述目标对象对应的目标图像基于调整后的多个图像特征生成,对所述多个图像特征进行调整包括:基于均值调整参数调整所述多个图像特征的特征均值、基于方差调整参数调整所述多个图像特征的特征方差;所述均值调整参数为目标风格特征对应的风格调整参数的前半部分,所述方差调整参数为所述风格调整参数的后半部分,所述风格调整参数通过对所述风格特征进行全连接处理得到,所述目标风格特征基于所述至少两个第二图像分别对应的权重,对所述至少两个第二图像的风格进行融合得到。
10.一种图像生成装置,其特征在于,所述装置包括:
图像获取模块,用于获取第一图像和至少两个第二图像,所述第一图像包括目标对象,所述第一图像和所述至少两个第二图像属于不同的图像风格;
特征获取模块,用于获取所述第一图像中所述目标对象的多个图像特征和所述至少两个第二图像的风格特征;
特征融合模块,用于基于所述至少两个第二图像分别对应的权重,对所述至少两个第二图像的风格特征进行融合,得到目标风格特征;
特征调整模块,用于对所述目标风格特征进行全连接处理,得到所述目标风格特征对应的风格调整参数;将所述风格调整参数的前半部分作为均值调整参数,将所述风格调整参数的后半部分作为方差调整参数,所述均值调整参数用于调整所述多个图像特征的特征均值,所述方差调整参数用于调整所述多个图像特征的特征方差;基于所述均值调整参数和所述方差调整参数,对所述多个图像特征进行调整;
第一目标图像生成模块,用于基于调整后的所述多个图像特征,生成包括所述目标对象的目标图像,所述目标图像的图像风格与所述至少两个第二图像的图像风格相关联。
11.根据权利要求10所述的装置,其特征在于,所述特征获取模块,用于:
将所述第一图像输入图像生成模型,通过所述图像生成模型,对所述第一图像进行卷积处理,得到所述第一图像中所述目标对象的多个图像特征;
将所述至少两个第二图像输入风格确定模型,通过所述风格确定模型,对所述第二图像进行卷积处理、反卷积处理和池化处理,得到所述至少两个第二图像的风格特征。
12.根据权利要求11所述的装置,其特征在于,所述第一目标图像生成模块,用于将所述调整后的所述多个图像特征输入所述图像生成模型,通过所述图像生成模型,对所述调整后的所述多个图像特征进行反卷积处理,生成所述包括所述目标对象的目标图像。
13.根据权利要求11或12任一项所述的装置,其特征在于,所述图像生成模型的训练装置包括:
第一输入模块,用于将包括样本对象的第一样本图像和第二样本图像的样本风格特征输入待训练图像生成模型,通过所述待训练图像生成模型,生成包括所述样本对象的样本目标图像,所述样本目标图像的图像风格与所述第二样本图像的图像风格相关联;
第二输入模块,用于将所述样本目标图像输入判别器,由所述判别器输出所述样本目标图像的类型,所述类型用于表示所述样本目标图像为原生图像还是合成图像;
参数调整模块,用于根据所述类型,对所述待训练图像生成模型的模型参数进行调整。
14.根据权利要求13所述的装置,其特征在于,所述第一输入模块,用于:
通过所述待训练图像生成模型对所述第一样本图像进行卷积处理,得到所述第一样本图像中样本对象的多个样本图像特征;
基于所述第二样本图像的样本风格特征,对所述多个样本图像特征进行调整;
通过所述待训练图像生成模型,基于调整后的所述多个样本图像特征,生成所述样本目标图像。
15.根据权利要求13所述的装置,其特征在于,所述第二输入模块,用于将所述样本目标图像输入所述判别器,通过所述判别器对所述样本目标图像进行卷积处理和反卷积处理,得到所述样本目标图像的分类矩阵,所述分类矩阵中的数值表示所述样本目标图像中对应区域的类型。
16.根据权利要求11所述的装置,其特征在于,所述装置还包括下述至少一项:
缩放处理模块,用于对所述第一图像进行缩放处理;
归一化处理模块,用于对所述第一图像的像素值进行归一化处理;
其中,缩放处理后的所述第一图像的尺寸符合目标尺寸条件,归一化处理后的所述第一图像的像素值处于目标像素值区间。
17.根据权利要求16所述的装置,其特征在于,所述缩放处理模块还用于将所述目标图像的尺寸调整为所述第一图像相同;
所述归一化处理模块,还用于对所述目标图像的像素值进行归一化处理;
其中,归一化处理后的所述目标图像的像素值与所述第一图像的像素值处于相同的像素值区间。
18.一种图像生成装置,其特征在于,所述装置包括:
显示模块,用于显示图像获取界面,所述图像获取界面用于获取包括目标对象的第一图像和至少两个第二图像,所述第一图像和所述至少两个第二图像属于不同的图像风格;
权重获取模块,用于获取与所述至少两个第二图像分别对应的权重;
第二目标图像生成模块,用于响应于图像生成指令,基于所述第一图像、所述至少两个第二图像以及与所述至少两个第二图像分别对应的权重,生成包括所述目标对象的目标图像,所述目标图像的图像风格与所述至少两个第二图像的图像风格相关联;其中,所述目标对象对应的目标图像基于调整后的多个图像特征生成,对所述多个图像特征进行调整包括:基于均值调整参数调整所述多个图像特征的特征均值、基于方差调整参数调整所述多个图像特征的特征方差;所述均值调整参数为目标风格特征对应的风格调整参数的前半部分,所述方差调整参数为所述风格调整参数的后半部分,所述风格调整参数通过对所述风格特征进行全连接处理得到,所述目标风格特征基于所述至少两个第二图像分别对应的权重,对所述至少两个第二图像的风格进行融合得到。
19.一种计算机设备,其特征在于,所述计算机设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条计算机程序,所述计算机程序由所述一个或多个处理器加载并执行以实现如权利要求1至权利要求8任一项所述的图像生成方法,或实现如权利要求9所述的图像生成方法。
20.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条计算机程序,所述计算机程序由处理器加载并执行以实现如权利要求1至权利要求8任一项所述的图像生成方法,或实现如权利要求9所述的图像生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011203549.2A CN112381707B (zh) | 2020-11-02 | 2020-11-02 | 图像生成方法、装置、设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011203549.2A CN112381707B (zh) | 2020-11-02 | 2020-11-02 | 图像生成方法、装置、设备以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112381707A CN112381707A (zh) | 2021-02-19 |
CN112381707B true CN112381707B (zh) | 2023-06-20 |
Family
ID=74577181
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011203549.2A Active CN112381707B (zh) | 2020-11-02 | 2020-11-02 | 图像生成方法、装置、设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112381707B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113256750B (zh) * | 2021-05-26 | 2023-06-23 | 武汉中科医疗科技工业技术研究院有限公司 | 医疗图像风格重建方法、装置、计算机设备和存储介质 |
CN113850712A (zh) * | 2021-09-03 | 2021-12-28 | 北京达佳互联信息技术有限公司 | 图像风格转换模型的训练方法、图像风格转换方法及装置 |
CN114004910A (zh) * | 2021-11-03 | 2022-02-01 | 北京达佳互联信息技术有限公司 | 风格素材处理方法、装置、电子设备及存储介质 |
CN116597039B (zh) * | 2023-05-22 | 2023-12-26 | 阿里巴巴(中国)有限公司 | 图像生成的方法和服务器 |
CN116860145B (zh) * | 2023-08-31 | 2023-11-24 | 小舟科技有限公司 | 一种基于用户bci信息的aigc个性化图像生成方法及相关装置 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107767328A (zh) * | 2017-10-13 | 2018-03-06 | 上海交通大学 | 基于少量样本生成的任意风格和内容的迁移方法和系统 |
CN109218134A (zh) * | 2018-09-27 | 2019-01-15 | 华东师范大学 | 一种基于神经风格迁移的测试用例生成系统 |
CN109472270A (zh) * | 2018-10-31 | 2019-03-15 | 京东方科技集团股份有限公司 | 图像风格转换方法、装置及设备 |
CN109863537A (zh) * | 2016-10-21 | 2019-06-07 | 谷歌有限责任公司 | 风格化输入图像 |
CN110555896A (zh) * | 2019-09-05 | 2019-12-10 | 腾讯科技(深圳)有限公司 | 一种图像生成方法、装置以及存储介质 |
CN110909790A (zh) * | 2019-11-20 | 2020-03-24 | Oppo广东移动通信有限公司 | 图像的风格迁移方法、装置、终端及存储介质 |
CN111127378A (zh) * | 2019-12-23 | 2020-05-08 | Oppo广东移动通信有限公司 | 图像处理方法、装置、计算机设备及存储介质 |
US10685057B1 (en) * | 2016-12-30 | 2020-06-16 | Shutterstock, Inc. | Style modification of images in search results |
CN111325252A (zh) * | 2020-02-12 | 2020-06-23 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、设备、介质 |
CN111583165A (zh) * | 2019-02-19 | 2020-08-25 | 京东方科技集团股份有限公司 | 图像处理方法、装置、设备及存储介质 |
CN111583100A (zh) * | 2020-05-12 | 2020-08-25 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN111784565A (zh) * | 2020-07-01 | 2020-10-16 | 北京字节跳动网络技术有限公司 | 图像处理方法、迁移模型训练方法、装置、介质及设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109636886B (zh) * | 2018-12-19 | 2020-05-12 | 网易(杭州)网络有限公司 | 图像的处理方法、装置、存储介质和电子装置 |
-
2020
- 2020-11-02 CN CN202011203549.2A patent/CN112381707B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109863537A (zh) * | 2016-10-21 | 2019-06-07 | 谷歌有限责任公司 | 风格化输入图像 |
US10685057B1 (en) * | 2016-12-30 | 2020-06-16 | Shutterstock, Inc. | Style modification of images in search results |
CN107767328A (zh) * | 2017-10-13 | 2018-03-06 | 上海交通大学 | 基于少量样本生成的任意风格和内容的迁移方法和系统 |
CN109218134A (zh) * | 2018-09-27 | 2019-01-15 | 华东师范大学 | 一种基于神经风格迁移的测试用例生成系统 |
CN109472270A (zh) * | 2018-10-31 | 2019-03-15 | 京东方科技集团股份有限公司 | 图像风格转换方法、装置及设备 |
CN111583165A (zh) * | 2019-02-19 | 2020-08-25 | 京东方科技集团股份有限公司 | 图像处理方法、装置、设备及存储介质 |
CN110555896A (zh) * | 2019-09-05 | 2019-12-10 | 腾讯科技(深圳)有限公司 | 一种图像生成方法、装置以及存储介质 |
CN110909790A (zh) * | 2019-11-20 | 2020-03-24 | Oppo广东移动通信有限公司 | 图像的风格迁移方法、装置、终端及存储介质 |
CN111127378A (zh) * | 2019-12-23 | 2020-05-08 | Oppo广东移动通信有限公司 | 图像处理方法、装置、计算机设备及存储介质 |
CN111325252A (zh) * | 2020-02-12 | 2020-06-23 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、设备、介质 |
CN111583100A (zh) * | 2020-05-12 | 2020-08-25 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN111784565A (zh) * | 2020-07-01 | 2020-10-16 | 北京字节跳动网络技术有限公司 | 图像处理方法、迁移模型训练方法、装置、介质及设备 |
Non-Patent Citations (2)
Title |
---|
基于VGG-16的图像风格迁移;刘明昊;;电子制作(第12期);全文 * |
基于深度学习的图像风格转换研究;朱海峰;邵清;;软件(第03期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112381707A (zh) | 2021-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112381707B (zh) | 图像生成方法、装置、设备以及存储介质 | |
CN110473141B (zh) | 图像处理方法、装置、存储介质及电子设备 | |
CN111091166B (zh) | 图像处理模型训练方法、图像处理方法、设备及存储介质 | |
CN112562019A (zh) | 图像色彩调整方法及装置、计算机可读介质和电子设备 | |
CN112990053B (zh) | 图像处理方法、装置、设备及存储介质 | |
CN111753498B (zh) | 文本处理方法、装置、设备及存储介质 | |
CN111860485A (zh) | 图像识别模型的训练方法、图像的识别方法、装置、设备 | |
CN114283050A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN112115900B (zh) | 图像处理方法、装置、设备及存储介质 | |
CN113705302A (zh) | 图像生成模型的训练方法、装置、计算机设备及存储介质 | |
CN113569052A (zh) | 知识图谱的表示学习方法及装置 | |
CN113515994A (zh) | 视频特征提取方法、装置、设备以及存储介质 | |
CN112037305B (zh) | 对图像中的树状组织进行重建的方法、设备及存储介质 | |
CN112989134B (zh) | 节点关系图的处理方法、装置、设备及存储介质 | |
CN115115724A (zh) | 图像处理方法、装置、计算机设备及存储介质 | |
CN115131464A (zh) | 图像生成方法、装置、设备以及存储介质 | |
CN116757970B (zh) | 视频重建模型的训练方法、视频重建方法、装置及设备 | |
CN113570510A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN112527104A (zh) | 确定参数确定方法、装置、设备及存储介质 | |
CN115168643B (zh) | 音频处理方法、装置、设备及计算机可读存储介质 | |
CN117789306A (zh) | 图像处理方法、装置及存储介质 | |
CN114418835B (zh) | 图像处理方法、装置、设备及介质 | |
CN115131635A (zh) | 图像生成模型的训练方法、图像生成方法、装置及设备 | |
CN117009878A (zh) | 基于超图的分类方法、装置、计算机设备及存储介质 | |
CN114462580A (zh) | 文本识别模型的训练方法、文本识别方法、装置和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40038797 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |