CN111062862A - 基于颜色的数据增强方法和系统及计算机设备和存储介质 - Google Patents
基于颜色的数据增强方法和系统及计算机设备和存储介质 Download PDFInfo
- Publication number
- CN111062862A CN111062862A CN201911318909.0A CN201911318909A CN111062862A CN 111062862 A CN111062862 A CN 111062862A CN 201911318909 A CN201911318909 A CN 201911318909A CN 111062862 A CN111062862 A CN 111062862A
- Authority
- CN
- China
- Prior art keywords
- image
- color
- texture
- module
- input image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000006243 chemical reaction Methods 0.000 claims abstract description 58
- 239000003086 colorant Substances 0.000 claims abstract description 44
- 230000011218 segmentation Effects 0.000 claims abstract description 41
- 238000010606 normalization Methods 0.000 claims abstract description 24
- 238000012545 processing Methods 0.000 claims description 11
- 238000012935 Averaging Methods 0.000 claims description 2
- 230000002708 enhancing effect Effects 0.000 abstract description 3
- 238000013136 deep learning model Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 14
- 238000012549 training Methods 0.000 description 14
- 238000013528 artificial neural network Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000002372 labelling Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003416 augmentation Effects 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013434 data augmentation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004438 eyesight Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000001429 visible spectrum Methods 0.000 description 1
- 230000016776 visual perception Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/187—Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
本公开的实施例提供了一种基于颜色的数据增强方法和系统及装置。方法包括:获取输入图像;对所述输入图像进行ROI分割,提取目标物图像;通过基于RGB规则的颜色转换,将所述目标物图像从源色转换为一种或多种不同目标颜色的纯色图像;以及,将所述输入图像转换为保持纹理的灰度图像;将所述灰度图像的纹理特征添加到所述纯色图像中,进行纹理归一化,生成一个或多个具有不同目标颜色的输出图像。本公开实施例所提供的数据增强方法将图像中目标物的源色扩增为多种目标颜色,从而在保持原始图像质量的情况下对图像样本数量进行扩充,同时,降低生成新图像的时间,降低收集新数据的成本,以此提高深度学习模型的性能。
Description
技术领域
本公开涉及计算机视觉技术领域,具体涉及一种基于颜色的数据增强方法和系统及计算机设备和存储介质。
背景技术
当前,基于神经网络的深度学习技术已经在诸如物体分类、图像识别、文本处理、、面部识别、自动驾驶、人机对话等领域取得了巨大进展。随着神经网络结构的加深和算法的提升,对用于训练神经网络的数据样本的需求量越来越大。尤其是在与图像相关的神经网络中,较差的图像或较少的图像数量,可能导致所训练出的神经网络模型仅在训练域上理想的泛化能力,而在实际使用中不理想,进而导致最终产品(例如监视系统)的工作性能受到不利影响。
发明内容
第一方面,本公开的实施例提供一种基于颜色的数据增强方法,包括:获取输入图像;对所述输入图像进行ROI分割,提取目标物图像;通过基于RGB规则的颜色转换,将所述目标物图像从源色转换为一种或多种不同目标颜色的纯色图像;以及,将所述输入图像转换为保持纹理的灰度图像;将所述灰度图像的纹理特征添加到所述纯色图像中,进行纹理归一化,生成一个或多个具有不同目标颜色的输出图像。
在一些实施例中,所述的对所述输入图像进行ROI分割,包括:基于输入图像的形状和颜色值,使用语义分割方法进行ROI分割。
在一些实施例中,所述的基于RGB规则的颜色转换,包括:在RGB规则的搜索空间中,通过调整各个色彩通道的值实现颜色转换。
在一些实施例中,所述的将所述灰度图像的纹理特征添加到所述纯色图像中,进行纹理归一化,包括:将纯色图像与灰度图像进行叠加平均处理。
第二方面,本公开的实施例提供一种基于颜色的数据增强系统,包括:图像输入模块,用于获取输入图像;ROI分割模块,用于对所述输入图像进行ROI分割,提取目标物图像;颜色转换模块,用于通过基于RGB规则的颜色转换,将所述目标物图像从源色转换为一种或多种不同目标颜色的纯色图像;灰度转换模块,用于将所述输入图像转换为保持纹理的灰度图像;纹理归一化模块,用于将所述灰度图像的纹理特征添加到所述纯色图像中,进行纹理归一化,生成一个或多个具有不同目标颜色的输出图像;图像输出模块,用于输出所述输出图像。
在一些实施例中,所述ROI分割模块,具体用于基于输入图像的形状和颜色值,使用语义分割方法进行ROI分割。
在一些实施例中,所述颜色转换模块,具体用于在RGB规则的搜索空间中,通过调整各个色彩通道的值实现颜色转换。
在一些实施例中,所述纹理归一化模块,具体用于将纯色图像与灰度图像进行叠加平均处理。
第三方面,本公开的实施例提供一种计算机设备,包括
存储器,用于非暂时性存储计算机可读指令;以及
处理器,用于运行所述计算机可读指令,所述计算机可读指令被所述处理器运行时执行上述任一项实施例所述的方法。
第四方面,本公开的实施例提供一种存储介质,非暂时性地存储计算机可读指令,当所述计算机可读指令由计算机执行时可以执行上述任一项实施例所述的方法。
在本公开的一些可行的实施方式中,至少部分地取得了以下有益效果:
1.无需识别目标物的颜色,能够通过灰度值在保留原目标物的纹理的前提下,改变目标物的颜色;
2.通过基于RGB规则的搜索空间,能够将目标物的源色变成多种期望的目标颜色;
3.在无需人工交互或标注的情况下,能够提供多组可用于训练的图像样本;
4.基于本公开方案所提供的输出图像能够极大限度地接近真实图像,显著适用于训练深度神经网络。
附图说明
为了更清楚地说明本公开实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。
图1是本公开一个实施例提供的基于颜色的数据增强方法的流程示意图;
图2是本公开一个应用场景例中对输入图像进行ROI分割的示意图;
图3是本公开一个应用场景例中转换得到纯色图像的示意图;
图4是本公开一个应用场景例中转换得到纯色图像的示意图;
图5是本公开一个应用场景例中进行纹理归一化的示意图;
图6是本公开一个实施例提供的基于颜色的数据增强系统的机构示意图;
图7是本公开一个实施例提供的计算机设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本公开方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。
本公开的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在神经网络中,通过对用于训练的样本进行人工标注,或对机器生成的样本进行人工复查,或人工收集用于扩充训练样本的新图像来改善样本的质量。人工标注是通过人进行数据标注和复查,这样的过程繁琐耗时。机器生成数据使用一些预训练的模型对数据进行标注,然后由人进行检查,但预训练模型往往产生大量的假阳性使得这种方式在实际中比人工标注数据更加繁琐。此外,雇佣标注员进行人工复查和收集用于扩充训练样本的新图像成本是很昂贵的。
为了解决上述问题,相关技术中使用数据增强的方法提高图像分类等用途的准确性。数据增强的作用包括:增加训练的数据量,提高模型的泛化能力;增加噪声数据,提升模型的鲁棒性。已知的数据增强技术包括图像翻转、旋转、缩放、扩充、裁剪、平移、添加噪声等。申请人发现,上述数据增强方式效果有限,其中有些实现方式时间耗用高、质量低,有些实现方式是非自然的,例如对图像进行扩充操作的结果与现实情况偏差过大。
请参考图1,本公开一个实施例提供一种基于颜色的数据增强方法,该方法可包括:
步骤101:获取输入图像;
步骤102:对所述输入图像进行ROI分割,提取目标物图像;
步骤103:通过基于RGB规则的颜色转换,将所述目标物图像从源色转换为一种或多种不同目标颜色的纯色图像;
步骤104:将所述输入图像转换为保持纹理的灰度图像;
步骤105:将所述灰度图像的纹理特征添加到所述纯色图像中,进行纹理归一化,生成一个或多个具有不同目标颜色的输出图像;
步骤106:输出所述输出图像。
如上所述,本公开实施例提供了一种简单有效的、基于颜色的数据增强(Dataaugmentation)的方法,该方法可以用来扩充机器学习或深度学习中所用的训练图像。举例来说,假设输入的原始图像(即输入图像)中,伞是感兴趣的对象(即目标物),其原始颜色(或者说源色)例如是灰色。本实施例提供的方法可以将伞的颜色改变为一组预定义的目标颜色,如黑色、白色、橙色、黄色、绿色、蓝色、紫色、粉红色、红色、棕色等。这样做的效果是将具有灰色伞的输入图像扩充为具有不同目标颜色的伞的多个新图像(即输出图像)。从而,将图像的数量扩增了N倍,N为自然数,N取决于预设目标颜色个数。如果N等于100,可以将图像数扩充100倍。简而言之,本实施例公开的技术方案可以在保持原始图像质量例如照度的情况下对图像样本数进行扩充,同时,降低了生成新图像的时间,还降低了收集新数据的成本。
下面,对本公开实施例方法的各个步骤进行详细说明:
步骤101:获取输入图像。
本公开实施例方法可以由计算机系统执行。计算机系统包括有输入模块,用来获取单个或多个输入图像。输入图像是输入的原始图像的简称。
在本公开的实施例中,图像可以包括一个或多个静态图像,也可以包括动态图像如视频帧等。
步骤102:对所述输入图像进行ROI分割,提取目标物图像。
对原始图像或视频帧产生真实扩充所面临的挑战是确定ROI(region ofinterest,感兴趣区域),因为图像中可能含有大量不同的对象(或者说目标物)。
可选的,可以通过人工标注或者语义分割(Semantic Segmentation)等方法确定图像中的不同目标物,通过深神经网络在像素级水平上分离不同区域。本实施例提供准确地分割图像或视频帧内的不同目标物的技术手段,例如,可基于图像的形状和颜色值来确定图像内的不同ROI。
计算机系统可包括ROI分割模块,ROI分割模块例如可以使用语义分割卷积神经网络(CNN)确定图像内的像素水平上的对象形状,进而确定ROI。语义分割卷积神经网络例如可以是通过FCN语义分割(例如,U-net是FCN语义分割的一个实现)、SegNet、DeconvNet、Deeplab v3等。
进一步地,还可以结合超像素更好的确定分割的边界。图像内一系列位置相邻且颜色、亮度、纹理等特征相似的像素点组成的小区域构成超像素。基于每个超像素中的平均颜色(例如,包括图像内的一组像素)可以将类似(例如,低于预设阈值的平均颜色值)的相邻超像素合并在一起。重复执行该过程直到没有相邻的超像素(或合并的超像素)具有小于阈值的加权差。迭代合并之后保留的超像素可以表示图像的ROI。
准确识别图像中的目标物或区域可能无法保证准确的增强真实感。在该过程中面临的另一个挑战是区域边界的归一化。语义分割CNN可以产生完美的区域边界或生成更小的区域或更大的区域,但可能导致边界像素周围伪影或噪声。为解决上述问题,本公开的实施例可以使用泊松图像插值法或其它任何边缘增强方法来去除伪影,其中的一种方法是对边界中的相似像素进行分组或平均,将边界与其周围像素进行归一化。
可选的,可以利用ROI Mask(区域掩码,或图像掩码,或掩模)对图像进行处理,将感兴趣的目标区域或者说目标物图像从图像全局中分割标记出来。这样处理以后得到的输出图像看起来更加真实自然。
步骤103:通过基于RGB规则的颜色转换,将所述目标物图像从源色转换为一种或多种不同目标颜色的纯色图像。
通常,颜色转换需要定义源色与目标颜色的对应关系,有多种方法实现诸如1到1、1到N、M到N的颜色转换,其中M和N为自然数。在1到1的转换中,将一种单一的源色转换为一种单一的目标颜色,如果源色和目标颜色是随时间变化的,这种方法可行性较差。在1到N的转换中,单一的源色转换为N种目标颜色,当然这种转换依旧受限于单一源色。在M到N转换中,M种源色转换为N种目标颜色。但是,如上所述的如1到1、1到N、M到N的颜色转换,均需要预先对源色进行识别,而在整个转换过程中,对源色的颜色识别可能会引入额外噪声,因此转换过程并不十分理想。
在本公开的一些实施例中,可以通过使用诸如RGB,HSV等颜色模型来尽可能真实地增强具有源色的原始图像(或视频帧)。RGB(红色,绿色和蓝色)是指在计算机显示器上使用的颜色表示系统。红色,绿色和蓝色可以以各种比例组合形成可见光谱中的任何颜色。HSV(色调,饱和度,值)是RGB颜色模型的替代表示,其适用于印刷制作领域更贴近人类视觉感知。
本公开一些实施方式中,提供一种源色到目标颜色的准确转换方法。该转换方法有利于克服上述局限。本实施例中,该颜色转换操作可以由计算机系统中的颜色转换模块来实现。颜色转换模块可在无需使用色彩识别的情况下,通过基于RGB规则的颜色转换,将目标物转换为具有多种目标颜色的纯色图像。
基于RGB规则的颜色转换,是指通过RGB规则的搜索空间(RGB tree-based searchspace)进行颜色转换。在RGB规则的搜索空间中,色彩通道是RGB,可以通过将其各个色彩通道的值调整为预设值如n1-n6,实现颜色转换。例如,如果希望目标颜色是红色,将目标物雨伞的所有值设置为R=255,G=0,B=0,以获得红色雨伞。同样的,如果需要其它目标颜色,例如蓝色,相应修改RGB值。通过这种方式,将源色转换为任意所需的目标颜色,例如N种目标颜色,而无需对原始图像中目标物颜色进行识别。
步骤104:将所述输入图像转换为保持纹理的灰度图像。
为了使最终的输出图像保持纹理,本步骤中,将输入的原始图像转换为灰度图像,转换方法可以使用常见的开源转换软件,例如OpenCV中的cvtColor,转换后的灰度图像能够保持原始图像的纹理特征。该步骤可以由计算机系统中的灰度转换模块来实施。
步骤105:将所述灰度图像的纹理特征添加到所述纯色图像中,进行纹理归一化(texture normalization),生成一个或多个具有不同目标颜色的输出图像。
步骤103中转换后的纯色图像失去了原始图像的纹理特征,而步骤104中转换后的灰色图像则保持了原始图像的纹理特征,本步骤中进行纹理归一化,将灰度图像的纹理特征添加到纯色图像中,生成一个或多个具有不同目标颜色的输出图像。该步骤可以由计算机系统中的纹理归一化模块来实施。其中,将灰度图像的纹理特征添加到纯色图像中,例如可以通过将纯色图像与灰度图像进行叠加平均处理。
值得说明的是,假设原始图像包括M种源色,则,步骤104中转换为灰度图像是M-1的转换,而步骤103中转换为N种目标颜色是M-N的转换,经过步骤105纹理归一化之后,得到输出图像,是为M-1-N的转换方法。
该M-1-N的转换方法有利于克服现有的转换方法需要对源色进行颜色识别所存在的诸多局限。在该方法中,图像输入模块所获得的原始图像可以具有多种源色,颜色转换模块可在无需使用色彩识别的情况下,通过基于RGB规则的颜色转换,将目标物转换为具有多种目标颜色的纯色图像。
如上,本公开实施例中,基于ROI分割模块,通过Mask分割的方法,提取目标物图像;基于颜色转换模块,通过基于RGB规则的搜索空间,将感兴趣的目标ROI,即目标物图像,转换成多种不同颜色;并且,对于图像输入模块所输入的任意颜色的原始图像,灰度转换模块将其转换为灰度图像,这样做能够获得依旧保持丰富的纹理的灰度图像;然后,通过纹理归一化模块,生成具有纹理特征和不同目标颜色的多个输出图像。
可以理解,本公开实施例上述方案例如可以在计算机设备具体实施。
为便于更好的理解本公开实施例提供的技术方案,下面通过一个具体场景下的实施方式为例进行介绍。
如图2所示,对于步骤101获取的单个或多个输入图像,在步骤102中使用语义分割方法进行ROI分割。图2示出了一种使用UNet神经网络进行ROI分割的方式,图中201所示为ROI Mask(区域掩码),经Mask处理提取目标物图像。
如图3所示,在步骤103中通过RGB规则的搜索空间对目标物图像进行颜色转换。在其输入中,RGB分别代表红、绿、蓝,n1-6代表修改RGB值后所形成的不同目标颜色,图中301所示是转换得到的纯色图像。
如图4所示,对于步骤101获取的单个或多个输入图像,在步骤104中通过诸如OpenCV、PIL等库将彩色图像转换为灰度图像,图中401所示是转换得到的灰度图像。
如图5所示,对于上述步骤得到的纯色图像301和灰度图像401进行归一化处理,将具有纹理特征的灰度图像添加到纯色图像中,使纯色图像具备纹理。在纹理归一化过程中,灰度图像和纯色图像可以进行叠加平均处理,以形成多个输出图像,并在步骤106中输出转换得到的灰度图像。
由上可见,在本公开的一些可行的实施方式中,公开了一种基于颜色的数据增强方法,该方法通过使用灰度通道,利用M-1-N转换方法,自动化实现将多个源色转换为目标颜色并保持纹理特征,将原始图像扩充为N个输出图像,可以提高用于机器学习或深度学习的训练样本的图像数量和图像质量,且无需人工介入或额外的人力将多种源色转换为目标颜色。
为了更好的实施本公开实施例的上述方案,下面还提供用于配合实施上述方案的相关装置。
请参考图6,本公开实施例提供一种基于颜色的数据增强系统,可包括:
图像输入模块601,用于获取单个或多个输入图像;
ROI分割模块602,用于对所述输入图像进行ROI分割,提取目标物图像;
颜色转换模块603,用于通过基于RGB规则的颜色转换,将所述目标物图像从源色转换为一种或多种不同目标颜色的纯色图像;
灰度转换模块604,用于将所述输入图像转换为保持纹理的灰度图像;
纹理归一化模块605,用于将所述灰度图像的纹理特征添加到所述纯色图像中,进行纹理归一化,生成一个或多个具有不同目标颜色的输出图像;
图像输出模块606,用于输出所述输出图像。
可选的,所述ROI分割模块602,具体用于基于输入图像的形状和颜色值,使用语义分割方法进行ROI分割。
可选的,所述颜色转换模块603,具体用于在RGB规则的搜索空间中,通过调整各个色彩通道的值实现颜色转换。
可选的,所述纹理归一化模块605,具体用于将纯色图像与灰度图像进行叠加平均处理。
本领域技术人员能够理解,图6以及上述实施例中所描述的模块是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用处理器执行相应功能软件的形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
例如,处理器可以是通用的具有数据处理能力和/或程序执行能力的逻辑运算器件,诸如中央处理单元(CPU)、图像处理器(GPU)、微处理器(MCU)等,处理器执行对应功能的计算机指令以实现对应的功能。计算机指令包括了一个或多个由对应于处理器的指令集架构定义的处理器操作,这些计算机指令可以被一个或多个计算机程序在逻辑上包含和表示。
例如,处理器可以是具有可被编程调整功能以执行相应功能的硬件实体,诸如现场可编程逻辑阵列(FPGA)或者专用集成电路(ASIC)等。
例如,处理器可以是专门设计用来执行对应功能的硬件电路,如张量处理器(TPU)或神经网络处理器(NPU)等。
可以理解,本公开实施例的基于颜色的数据增强系统的各个功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可参照上述方法实施例中的相关描述,此处不再赘述。
本公开的实施例还提供了一种计算机设备,包括:
存储器,用于非暂时性存储计算机可读指令;以及
处理器,用于运行所述计算机可读指令,所述计算机可读指令被所述处理器运行时执行前述实施例任一所述的方法。
请参考图7,提供了上述计算机设备的一个具体实现。本公开该计算机设备700,可包括:处理器701,存储器702,通信接口703,总线704;所述处理器701,存储器702,通信接口703通过所述总线704相互的通信;所述通信接口703,用于接收和发送数据;所述存储器702用于存储计算机执行指令,所述处理器701与所述存储器702通过所述总线704连接,当所述计算机设备运行时,所述处理器701执行所述存储器702存储的所述计算机执行指令,以使所述计算机设备执行如图1实施例所述的基于颜色的数据增强方法。
本公开实施例还提供一种存储介质,非暂时性地存储计算机可读指令,当所述计算机可读指令由计算机执行时可以执行如上述实施例任一所述的方法。
在本公开的实施例中,所称的存储器、存储介质等,可以是本地的实体物理存储设备,还可以是远程通讯连接的虚拟存储设备,例如VPS、云存储等。
容易理解,计算机设备可以从服务器、云进行通讯获得执行本公开所用的图像、视频等样本,这些数据也可以在多个计算机设备组成的网络中共享。通讯连接可以是无线网络、有线网络、和/或无线网络和有线网络的任意组合。网络可以包括局域网、互联网、电信网、基于互联网和/或电信网的物联网(Internet of Things)、和/或以上网络的任意组合等。有线网络例如可以采用双绞线、同轴电缆或光纤传输等方式进行通信,无线网络例如可以采用无线广域通信网络(WWAN)、蓝牙、Zigbee或者Wi-Fi等进行通信。
综上,本公开实施例公开了一种基于颜色的数据增强方法和系统及装置,取得了以下有益效果:1.无需不识别目标物的颜色,能够通过灰度值(grayscale channel)在保留原目标物的纹理的前提下,改变目标物的颜色;2.通过基于RGB规则的搜索空间,能够将目标物的源色变成多种期望的目标颜色;3.在无需人工交互或标注的情况下,能够提供多组可用于训练的图像样本;4.基于本公开方案所提供的输出图像能够极大限度地接近真实图像,显著适用于训练深度神经网络。
本公开技术方案简单有效,可以将深度学习所用的训练图像中目标物的源色扩增为多种目标颜色,从而,可以在保持原始图像质量的情况下对图像样本数量进行扩充,同时,降低生成新图像的时间和降低收集新数据的成本,以此,提高深度学习模型的性能。采用本公开技术方案,可以简单的将训练图像数量扩增为N倍,N为预设的目标颜色的个数。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其它实施例的相关描述。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开并不受所描述动作顺序的限制,因为依据本公开,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本公开所必须的。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例方法的全部或部分步骤。而前述的存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的)包括:具有一个或多个导线的电连接、便携式优盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上对本公开进行了详细介绍,本文中应用了具体实施例对本公开的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本公开的方法及其核心思想;同时,对于本领域的一般技术人员,依据本公开的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本公开的限制。
Claims (10)
1.一种基于颜色的数据增强方法,其特征在于,包括:
获取输入图像;
对所述输入图像进行ROI分割,提取目标物图像;
通过基于RGB规则的颜色转换,将所述目标物图像从源色转换为一种或多种不同目标颜色的纯色图像;
以及,将所述输入图像转换为保持纹理的灰度图像;
将所述灰度图像的纹理特征添加到所述纯色图像中,进行纹理归一化,生成一个或多个具有不同目标颜色的输出图像。
2.根据权利要求1所述的方法,其特征在于,所述的对所述输入图像进行ROI分割,包括:
基于输入图像的形状和颜色值,使用语义分割方法进行ROI分割。
3.根据权利要求1所述的方法,其特征在于,所述的基于RGB规则的颜色转换,包括:
在RGB规则的搜索空间中,通过调整各个色彩通道的值实现颜色转换。
4.根据权利要求1所述的方法,其特征在于,所述的将所述灰度图像的纹理特征添加到所述纯色图像中,进行纹理归一化,包括:
将纯色图像与灰度图像进行叠加平均处理。
5.一种基于颜色的数据增强系统,其特征在于,包括:
图像输入模块,用于获取输入图像;
ROI分割模块,用于对所述输入图像进行ROI分割,提取目标物图像;
颜色转换模块,用于通过基于RGB规则的颜色转换,将所述目标物图像从源色转换为一种或多种不同目标颜色的纯色图像;
灰度转换模块,用于将所述输入图像转换为保持纹理的灰度图像;
纹理归一化模块,用于将所述灰度图像的纹理特征添加到所述纯色图像中,进行纹理归一化,生成一个或多个具有不同目标颜色的输出图像;
图像输出模块,用于输出所述输出图像。
6.根据权利要求5所述的系统,其特征在于,
所述ROI分割模块,具体用于基于输入图像的形状和颜色值,使用语义分割方法进行ROI分割。
7.根据权利要求5所述的系统,其特征在于,
所述颜色转换模块,具体用于在RGB规则的搜索空间中,通过调整各个色彩通道的值实现颜色转换。
8.根据权利要求5所述的系统,其特征在于,
所述纹理归一化模块,具体用于将纯色图像与灰度图像进行叠加平均处理。
9.一种计算机设备,其特征在于,包括
存储器,用于非暂时性存储计算机可读指令;以及
处理器,用于运行所述计算机可读指令,所述计算机可读指令被所述处理器运行时执行根据权利要求1-4任一项所述的方法。
10.一种存储介质,非暂时性地存储计算机可读指令,当所述计算机可读指令由计算机执行时可以执行根据权利要求1-4任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911318909.0A CN111062862A (zh) | 2019-12-19 | 2019-12-19 | 基于颜色的数据增强方法和系统及计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911318909.0A CN111062862A (zh) | 2019-12-19 | 2019-12-19 | 基于颜色的数据增强方法和系统及计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111062862A true CN111062862A (zh) | 2020-04-24 |
Family
ID=70300810
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911318909.0A Pending CN111062862A (zh) | 2019-12-19 | 2019-12-19 | 基于颜色的数据增强方法和系统及计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111062862A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113642372A (zh) * | 2020-04-27 | 2021-11-12 | 百度(美国)有限责任公司 | 在自主驾驶车辆的操作中基于灰度图像识别对象的方法和系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130236091A1 (en) * | 2012-03-06 | 2013-09-12 | Apple Inc. | Method and interface for converting images to grayscale |
CN106898035A (zh) * | 2017-01-19 | 2017-06-27 | 博康智能信息技术有限公司 | 一种服饰样本集生成方法和装置 |
CN108492343A (zh) * | 2018-03-28 | 2018-09-04 | 东北大学 | 一种扩充目标识别的训练数据的图像合成方法 |
CN109544529A (zh) * | 2018-11-19 | 2019-03-29 | 南京信息工程大学 | 面向深度学习模型训练和学习的病理图像数据增强方法 |
CN110176054A (zh) * | 2018-02-14 | 2019-08-27 | 辉达公司 | 用于训练神经网络模型的合成图像的生成 |
CN110322396A (zh) * | 2019-06-19 | 2019-10-11 | 怀光智能科技(武汉)有限公司 | 一种病理切片颜色归一化方法及系统 |
CN110458173A (zh) * | 2019-08-16 | 2019-11-15 | 京东数字科技控股有限公司 | 用于生成物品颜色值的方法和装置 |
-
2019
- 2019-12-19 CN CN201911318909.0A patent/CN111062862A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130236091A1 (en) * | 2012-03-06 | 2013-09-12 | Apple Inc. | Method and interface for converting images to grayscale |
CN106898035A (zh) * | 2017-01-19 | 2017-06-27 | 博康智能信息技术有限公司 | 一种服饰样本集生成方法和装置 |
CN110176054A (zh) * | 2018-02-14 | 2019-08-27 | 辉达公司 | 用于训练神经网络模型的合成图像的生成 |
CN108492343A (zh) * | 2018-03-28 | 2018-09-04 | 东北大学 | 一种扩充目标识别的训练数据的图像合成方法 |
CN109544529A (zh) * | 2018-11-19 | 2019-03-29 | 南京信息工程大学 | 面向深度学习模型训练和学习的病理图像数据增强方法 |
CN110322396A (zh) * | 2019-06-19 | 2019-10-11 | 怀光智能科技(武汉)有限公司 | 一种病理切片颜色归一化方法及系统 |
CN110458173A (zh) * | 2019-08-16 | 2019-11-15 | 京东数字科技控股有限公司 | 用于生成物品颜色值的方法和装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113642372A (zh) * | 2020-04-27 | 2021-11-12 | 百度(美国)有限责任公司 | 在自主驾驶车辆的操作中基于灰度图像识别对象的方法和系统 |
CN113642372B (zh) * | 2020-04-27 | 2024-02-20 | 百度(美国)有限责任公司 | 在自主驾驶车辆的操作中基于灰度图像识别对象的方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10614574B2 (en) | Generating image segmentation data using a multi-branch neural network | |
CN110969631B (zh) | 一种精细化照片染发方法及系统 | |
Li et al. | Globally and locally semantic colorization via exemplar-based broad-GAN | |
Feng et al. | URNet: A U-Net based residual network for image dehazing | |
CN112614060A (zh) | 人脸图像头发渲染方法、装置、电子设备和介质 | |
CN109359527B (zh) | 基于神经网络的头发区域提取方法及系统 | |
CN108280426B (zh) | 基于迁移学习的暗光源表情识别方法及装置 | |
CN107292307B (zh) | 一种倒置汉字验证码自动识别方法及系统 | |
CN107169508B (zh) | 一种基于融合特征的旗袍图像情感语义识别方法 | |
CN108985201A (zh) | 图像处理方法、介质、装置和计算设备 | |
CN116681636A (zh) | 基于卷积神经网络的轻量化红外与可见光图像融合方法 | |
Cai et al. | Perception preserving decolorization | |
CN112839167B (zh) | 图像处理方法、装置、电子设备及计算机可读介质 | |
CN108647696B (zh) | 图片颜值确定方法及装置、电子设备、存储介质 | |
WO2018151043A1 (ja) | 画像処理方法、及びコンピュータプログラム | |
CN113610720A (zh) | 视频去噪方法及装置、计算机可读介质和电子设备 | |
Bugeau et al. | Influence of color spaces for deep learning image colorization | |
CN108711160A (zh) | 一种基于hsi增强性模型的目标分割方法 | |
CN113052783A (zh) | 一种基于人脸关键点的人脸图像融合方法 | |
CN114202723A (zh) | 一种通过画面识别的智能剪辑应用方法、装置、设备及介质 | |
CN111062862A (zh) | 基于颜色的数据增强方法和系统及计算机设备和存储介质 | |
CN114359030B (zh) | 一种人脸逆光图片的合成方法 | |
CN115967823A (zh) | 视频封面生成方法、装置、电子设备及可读介质 | |
Wu et al. | Color transfer with salient features mapping via attention maps between images | |
Jimenez-Arredondo et al. | Multilevel color transfer on images for providing an artistic sight of the world |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200424 |
|
WD01 | Invention patent application deemed withdrawn after publication |