CN111914863A - 目标检测方法、装置、终端设备及计算机可读存储介质 - Google Patents
目标检测方法、装置、终端设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111914863A CN111914863A CN201910384207.6A CN201910384207A CN111914863A CN 111914863 A CN111914863 A CN 111914863A CN 201910384207 A CN201910384207 A CN 201910384207A CN 111914863 A CN111914863 A CN 111914863A
- Authority
- CN
- China
- Prior art keywords
- target
- image
- learning
- candidate frame
- detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 90
- 238000000034 method Methods 0.000 claims abstract description 27
- 238000012549 training Methods 0.000 claims abstract description 18
- 238000002156 mixing Methods 0.000 claims abstract description 6
- 238000004590 computer program Methods 0.000 claims description 17
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 239000004576 sand Substances 0.000 description 4
- 230000009471 action Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000739 chaotic effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请提供目标检测方法、装置、终端设备和计算机可读存储介质,方法包括:获取多个含有检测目标的第一图像;第一图像中设有标记检测目标的第一学习区;获取多个含有误检目标的第二图像;第二图像中设有第二学习区;将第一图像和第二图像混合,形成混合图像集;从混合图像集中提取与第一学习区近似的特征,得到目标正样本;从混合图像集中提取与第一学习区不近似的特征,得到目标负样本;用目标正样本和目标负样本训练学习模型中的目标分类器,得到目标检测器;用目标检测器检测待检图像,以检测出待检图像中是否含有检测目标。本申请提高了目标分类器的精度,降低了误检率。
Description
技术领域
本发明涉及图像处理技术领域,具体涉及目标检测技术领域,尤其涉及一种目标检测方法、装置、设备及计算机可读存储介质。
背景技术
随着深度学习理论和研究的不断发展,目标检测不管在精度上还是在时间性能上都取得了巨大的突破。当前主流的基于深度学习的目标检测算法(包括Faster R-CNN系列、SSD、YOLO等)在对应的数据集上都取得了很好的实验效果,但它们都没有解决如何学习负样本的问题。比如训练好了一个行人检测模型,它能准确地定位出图片中的行人,然而,它也很可能错误地将人体雕像(或者其它类似行人的物体)定位出来。
现有技术中目标检测是很常用的技术,目标检测模型有很多,他们的训练方式按照“样本集”的不同划分为以下两种:
第一种目标检测模型是提供检测环境下的含有检测目标的图片,作为正样本,还提供不含有检测目标的图片,作为负样本,分别用正样本和负样本训练一个分类器或回归器。这样被训练后的分类器或回归器即可识别出含有待检目标。该方案的缺陷是:需要人为地挑选出正样本和负样本,进而分别去学习正样本和负样本的特征,从而得以训练分类器(回归器);而人为挑选的负样本是有限的,因此学习模型学习的特征也是有限的,从而导致学习模型的识别精度不够;
第二种目标检测模型是只用提供检测环境下的含有检测目标的图片,检测目标被标记,学习模型预先提取标记区的特征,作为正样本;进而提取其他区域的和标记区类似的特征,作为负样本;用学习模型自主学习到的正样本和负样本来训练分类器或者回归器,这种目标检测模型的优点是,负样本是机器学习得到的,不用人为挑选,这样就解决了第一种方案中负样本的局限性的问题,检测环境下的大多数负样本都是可以被学习到的,有效地提高了检测模型的检测精度。但是在实际应用中发现,对于一些特殊的负样本-和检测目标及其类似的物体,在该模型下却会被误检。原因是该种负样本很少出现在检测环境下,即使出现也可能是单独出现,而其只有在和检测目标同时出现时,其才有被学习到的可能。例如,被检测目标是行人,则“雕像”就是“行人”的特殊负样本,在训练中,单独提供只含有“雕像”的图片,将被学习模型忽略,而同时含有“行人”和“雕像”的图片又少之又少,也导致学习模型不能很好地学习到“行人”和“雕像”的差别。
因此上述第二种方式,由于网络不能很好地学习到行人和人体雕像两种目标间模式的差异,经常导致误检。
发明内容
本发明的目的是针对以上问题,提供一种目标检测方法、装置、设备及计算机可读存储介质。
第一方面本申请提供一种目标检测方法,所述方法包括以下步骤:获取多个含有检测目标的第一图像;所述第一图像中设有标记所述检测目标的第一学习区;
获取多个含有误检目标的第二图像;所述第二图像中设有第二学习区;
将所述第一图像和所述第二图像混合,形成混合图像集;
从混合图像集中提取与所述第一学习区近似的特征,得到目标正样本;
从混合图像集中提取与所述第一学习区不近似的特征,得到目标负样本;
用所述目标正样本和目标负样本训练学习模型中的目标分类器,得到目标检测器;用所述目标检测器检测待检图像,以检测出所述待检图像中是否含有所述检测目标。
根据本申请实施例提供的技术方案,所述从混合图像集中提取与所述
第一学习区近似的特征,得到目标正样本,具体包括以下步骤:
从第一图像中提名第一设定个数的第一候选框;所述第一候选框与所述第一学习区大小及形状一致;
将与所述第一学习区的重叠率大于等于设定值的第一候选框作为目标正样本。
根据本申请实施例提供的技术方案,从混合图像集中提取与所述第一学习区不近似的特征,得到目标负样本具体包括以下步骤:
从第二图像中提名第二设定个数的第二候选框;所述第二候选框与所述第一学习区大小及形状一致;
将所述第二候选框及,与所述第一学习区的重叠率小于设定值的第一候选框作为目标负样本。
根据本申请实施例提供的技术方案,所述学习模型还具有辅助分类器;
所述目标检测方法还包括:
从混合图像集中提取与所述第二学习区近似的特征,得到辅助正样本;
从混合图像集中提取与所述第二学习区大小一致且不近似的特征,得到辅助负样本;
用所述辅助正样本和辅助负样本训练所述辅助分类器。
根据本申请实施例提供的技术方案,所述第二学习区为文本框、符号框、图画框中的任意一种。
第二方面,本申请提供一种目标检测装置,包括:
输入模块,配置用于输入混合图像集,所述混合图像集包括多个含有检测目标的第一图像和多个含有误检目标的第二图像;所述第一图像中设有标记所述检测目标的第一学习区;
学习模型,具有目标分类器和辅助分类器,配置用于:
从混合图像集中提取与所述第一学习区近似的特征,得到目标正样本;从混合图像集中提取与所述第一学习区不近似的特征,得到目标负样本;
以所述目标正样本和目标负样本训练所述目标分类器,得到目标检测器;
目标检测器,用于检测待检图像,以检测出所述待检图像中是否含有所述检测目标。
根据本申请实施例提供的技术方案,所述学习模型具体配置用于:
从第一图像中提名第一设定个数的第一候选框;所述第一候选框与所述第一学习区大小及形状一致;
将与所述第一学习区的重叠率大于等于设定值的第一候选框作为目标正样本。
根据本申请实施例提供的技术方案,所述学习模型具体配置用于:
从第二图像中提名第二设定个数的第二候选框;所述第二候选框与所述第一学习区大小及形状一致;
将所述第二候选框及,与所述第一学习区的重叠率小于设定值的第一候选框作为目标负样本。
第三方面,本申请还提供一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上述任意一项目所述目标检测方法的步骤。
第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述任意一项所述目标检测方法的步骤。
本发明的有益效果:通过给学习模型提供多个含有检测目标的第一图像;所述第一图像中设有标记所述检测目标的第一学习区和,多个含有误检目标的第二图像;在所述第二图像中设有第二学习区,用于辅助第二图像被学习模型学习;这样就实现了不仅可以学习到第一图像中的目标负样本,还可学习到第二图像中的目标负样本;使得学习模型得以学习到含有误检目标的图像,并且可以把和被检测目标极其类似的误检目标当成目标负样本来学习,从而提高了目标分类器的精度,降低了误检率。
附图说明
图1为本发明第一种实施例的流程图;
图2为实施例一中第一图像的示例图;
图3为实施例一中第二图像的第一种示例图;
图4为实施例一中第二图像的第二种示例图;
图5为实施例一中第二图像的第三种示例图;
图6为实施例一的详细流程图;
图7为本申请第二种实施例的原理框图;
图8为本申请第四种实施例的原理框图。
图中所述文字标注表示为:
100、输入模块;200、学习模型;300、目标检测器;400、第一图像;410、第一学习区;600、第二图像;610、第二学习区。
具体实施方式
为了使本领域技术人员更好地理解本发明的技术方案,下面结合附图对本发明进行详细描述,本部分的描述仅是示范性和解释性,不应对本发明的保护范围有任何的限制作用。
实施例一:
本实施例基于现有技术中的第二种检测模型,提供以下目标检测方法,本实施例中的目标检测方法用于检测“行人”,也即“行人”为本实施例中的检测目标,在其他实施例中,本实施例也可以用于其他检测目标,例如小狗,或树木等等。
如图1所示,所述方法包括以下步骤:
s100、获取多个含有检测目标的第一图像,例如获取1000张含有“行人”的第一图像;所述第一图像中设有标记所述检测目标的第一学习区;在本实施例中,第一学习区为将检测目标“行人”框选住的一个方框区域;
s200、获取多个含有误检目标的第二图像;例如,获取100张含有和“行人”很像的“雕像”的第二图像;所述第二图像中设有第二学习区,用于辅助所述第二图像被学习模型学习;在本实施例中,第二学习区例如为标记在图像右上角的一个文本框,里面写有内容“NEED TO TEST”;第一学习区和第二学习区统称为标记区;
s300、将所述第一图像和所述第二图像混合,形成混合图像集;本实施例中的“混合”并不限定第一图像和第二图像必须是打乱顺序的、错乱分布的;例如混合图像集中,可以是1000张第一图像排在前面,100张第二图像排在后面;也可以是100张第二图像放在前面,1000张第一图像放在后面;优选地,100张第二图像均匀插入在1000张第一图像之间。
s400、从混合图像集中提取与所述第一学习区近似的特征,得到目标正样本;
在本实施例中,具体通过以下步骤确定目标正样本:
s410、从第一图像中提名第一设定个数的第一候选框;所述第一候选框与所述第一学习区大小及形状一致;
s420、将与所述第一学习区的重叠率大于等于设定值的第一候选框作为目标正样本;重叠率例如可以通过第一候选框与第一学习区的交集面积与并集面积的商来确定;
s500、从混合图像集中提取与所述第一学习区不近似的特征,得到目标负样本;
在本实施例中,具体通过以下步骤确定目标正样本:
s510、从第二图像中提名第二设定个数的第二候选框;所述第二候选框与所述第一学习区大小及形状一致;
s520、将所述第二候选框及,与所述第一学习区的重叠率小于设定值的第一候选框作为目标负样本,也即重叠率小于设定值即为认为该第二候选框与第一学习区不近似。
s600、用所述目标正样本和目标负样本训练目标分类器,得到目标检测器;
s700、用所述目标检测器检测待检图像,以检测出所述待检图像中是否含有所述检测目标。
在本实施例中,学习模型还具有辅助分类器;因此本实施例的方法还包括以下步骤:
s810、从混合图像集中提取与所述第二学习区近似的特征,得到辅助正样本;和目标正样本的获取一样的原理,在本实施例中,辅助正样本通过以下步骤获取:
s811、从第二图像中提名第三设定个数的第三候选框;所述第三候选框与所述第二学习区大小及形状一致;
s812、将与所述第二学习区的重叠率大于等于设定值的第三候选框作为目标正样本;重叠率例如可以通过第三候选框与第二学习区的交集面积与并集面积的商来确定;
s820、从混合图像集中提取与所述第二学习区大小一致且不近似的特征,得到辅助负样本;
和目标负样本的获取一样的原理,在本实施例中,辅助正样本通过以下步骤获取:
s821、从第一图像中提名第四设定个数的第四候选框;所述第四候选框与所述第二学习区大小及形状一致;
s822、将所述第四候选框及,与所述第二学习区的重叠率小于设定值的第三候选框作为辅助负样本,也即重叠率小于设定值即为认为该第三候选框与第二学习区不近似。
s830、用所述辅助正样本和辅助负样本训练所述辅助分类器,得到辅助分类器。
在本实施例中,由于在学习模型中设置两个分类器,分别为目标分类器和辅助分类器,在学习过程中,借助辅助正样本和辅助负样本的学习,以及对介质分离器器的训练,实现了共用混合图像,同时训练目标分类器和辅助分类器,这样就实现了不仅可以学习到第一图像中的目标负样本,还可学习到第二图像中的目标负样本。
下面结合详细说明学习模型的学习过程:
在学习之前,先触发学习模型的第一分类器和第二分类器并设定一些参数的初始值;例如设定第一中间轮廓尺寸数据H1平=0;设定第二中间轮廓尺寸数据H2平=0;
如图2所示,在本实施例中,第一图像400为若干包含“行人”的图片,其中第一学习区410-“行人”用长方形的框标记出;如图3所示,在本实施例中,第二图像为若干包含“雕像”的图片,第二图像600的第二学习区610为标记在右上角的文本框-“NEED TO TEST”;如图4所示,在其他实施例中,第二图像600的第二学习区610也可以是标记在任何位置的符号框,或者如图5所示,第二图像600的第二学习区610也可以是为图画框;
如图6所示,下面详细说明本实施例中学习模型的学习过程:
s901、读取第i张图片,在本实施例中,混合图像集中图像的总数量为1100张,则i就是1-1100中的数值;例如首先读取第1张图像;
s902、读取第i张图片的标记区的特征,得到轮廓尺寸数据Hi,例如第i张图片为第一图像时候,读取的标记区的特征就是读取的第一学习区的特征,也即得到第一图像的轮廓尺寸数据;当第i张图像为第二图像时候,读取的标记区的特征就是读取的第二学习区的特征,也即得到第二图像的轮廓尺寸数据;
轮廓尺寸数据的表征可以通过标记区的长度和宽度来表征;例如用轮廓尺寸数据Hi=(5,10)表示长为5个单位,宽为10个单位的标记区。
s903、判断i是否等于1,若是则执行步骤s904;若不等于则执行步骤s905;
s904、将第一中间轮廓尺寸数据H1平设为等于Hi;例如读取的第1张图像为第一图像时,第一中间轮廓尺寸数据H1平为第一图像的轮廓尺寸数据;例如读取的第1张图像为第二图像时,第一中间轮廓尺寸数据H1平为第二图像的轮廓尺寸数据;
s905、判断Hi是否等于H1平;若等于,则再次执行一次步骤s904后执行步骤s906;若不等于则执行步骤s913。
s906、从第i张图片中提名第一设定个数的候选区;例如在本实施例中,第一设定个数为1000个;
s907、确定各个候选区与第i张图片的标记区的重叠面积S交和并集面积S并,得到各个侯选区的相关系数;例如第1个侯选区与图i的标记区的重叠面积S交为100,第1个侯选区与图i的标记区的并集面积S并为200,则第1个侯选区的相关系数为S交与S并的商,也即为0.5。
s908、将相关系数小于等于设定相关系数的侯选区作为第一正样本,将相关系数大于设定相关系数的侯选区作为第一负样本。例如设定相关系数为0.9,从提名的1000个候选区中选出了10个相关系数小于等于0.9的侯选区,该10个侯选区作为第一正样本,则剩余的990个都为第一负样本;
s909、用第一正样本和第一负样本训练第一分类器;
s910、判断H2平是否为0,若不为0则执行步骤s911;若为0则执行步骤s912;
s911、从第i张图片中提名第二设定个数的候选区,提名的侯选区的轮廓尺寸数据等于H2平;用提名的所述侯选区作为第二负样本训练第二分类器;
s912、将i加1,再循环从步骤s901开始执行;
s913、将第二中间轮廓尺寸数据H2平设为等于Hi
s914、从第i张图片中提名第一设定个数的候选区,例如提名1000个侯选区;
s915、确定各个候选区与第i张图片的标记区的重叠面积S交和并集面积S并,得到各个侯选区的相关系数;例如第1个侯选区与图i的标记区的重叠面积S交为180,第1个侯选区与图i的标记区的并集面积S并为200,则第1个侯选区的相关系数为S交与S并的商,也即为0.9。
s916、将相关系数小于等于设定相关系数的侯选区作为第二正样本,将相关系数大于设定相关系数的侯选区作为第二负样本
s917、用第二正样本和第二负样本训练第二分类器;
s918、判断H1平是否为0;若不为0则执行步骤s919;若为0则执行步骤s912;
s919、从第i张图片中提名第二设定个数的候选区,提名的侯选区的轮廓持续数据等于H1平;用提名的所述侯选区作为第一负样本训练第一分类器
上述学习过程中,如果学习的第1张图像是第一图像,则第一正样本就是目标正样本,第一负样本就是目标负样,第二正样本就是辅助正样本,第二负样本就是辅助负样本;如果学习的第1张图像是第二图像,则第一正样本就是辅助正样本,第一负样本就是辅助负样本,第二正样本就是目标样本,第二负样本就是目标负样本。
上述第一分类器和第二分类器例如均为SVM分类器。
若第一正样本是目标样本,则训练后的第一分类器将得到目标检测器;若第二正样本是目标样本,则训练后的第二分类器将得到目标检测器。
本实施例的上述技术方案中,通过在第二图像中设计第二学习区,使得单独含有“雕像”的第二图像可以输入到学习模型中被学习;通过在学习过程中学习第二图像中的“雕像”的特征,使得“雕像”可以被学习成为目标负样本;当目标检测器用于检测带有“雕像”的图像时,“雕像”可以被识别,不再会被误检。
实施例二:
如图2所示,本申请提供一种目标检测装置,包括:
输入模块100,配置用于输入混合图像集,所述混合图像集包括多个含有检测目标的第一图像和多个含有误检目标的第二图像;所述第一图像中设有标记所述检测目标的第一学习区;所述第二学习区与所述误检目标不重合;学习模型200,具有目标分类器和辅助分类器,配置用于:从混合图像集中提取与所述第一学习区近似的特征,得到目标正样本;从混合图像集中提取与所述第一学习区不近似的特征,得到目标负样本;以所述目标正样本和目标负样本训练所述目标分类器,得到目标检测器;
目标检测器300,用于检测待检图像,以检测出所述待检图像中是否含有所述检测目标。
所述学习模型具体配置用于:采用实施例一所述的步骤s901至S919中的方法训练学习模型,得到目标检测器。
所述学习模型还具体配置用于:
从第二图像中提名第二设定数量的第二候选框;所述第二候选框与所述第一学习区大小及形状一致;
将所述第二候选框及,与所述第一学习区的重叠率小于设定值的第一候选框作为目标负样本。
实施例三:
本实施例提供一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任意一项目所述目标检测方法的步骤。如图5所示,终端设备例如为计算机,计算机系统包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM503中,还存储有系统操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本发明的实施例,上文参考流程图1至图2描述的过程可以被实现为计算机软件程序。例如,本发明的实施例一包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例二的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种处理器包括第一生成模块、获取模块、查找模块、第二生成模块及合并模块。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定,例如,输入模块还可以被描述为“用于在该基础表中获取多个待探测实例的获取模块”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中所述的目标检测方法。
例如,所述电子设备可以实现如图1中所示的:s100、获取多个含有检测目标的第一图像;s200、获取多个含有误检目标的第二图像;s300、将所述第一图像和所述第二图像混合,形成混合图像集;s400、用所述混合图像集训练学习模型得到目标检测器;s500、用所述目标检测器检测待检图像,以检测出所述待检图像中是否含有所述检测目标。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实例的说明只是用于帮助理解本发明的方法及其核心思想。以上所述仅是本发明的优选实施方式,应当指出,由于文字表达的有限性,而客观上存在无限的具体结构,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进、润饰或变化,也可以将上述技术特征以适当的方式进行组合;这些改进润饰、变化或组合,或未经改进将发明的构思和技术方案直接应用于其它场合的,均应视为本发明的保护范围。
Claims (10)
1.一种目标检测方法,其特征在于,所述方法包括:
获取多个含有检测目标的第一图像;所述第一图像中设有标记所述检测目标的第一学习区;
获取多个含有误检目标的第二图像;所述第二图像中设有第二学习区,用于辅助所述第二图像被学习模型学习;
将所述第一图像和所述第二图像混合,形成混合图像集;
从混合图像集中提取与所述第一学习区近似的特征,得到目标正样本;
从混合图像集中提取与所述第一学习区不近似的特征,得到目标负样本;
用所述目标正样本和目标负样本训练学习模型中的目标分类器,得到目标检测器;用所述目标检测器检测待检图像,以检测出所述待检图像中是否含有所述检测目标。
2.根据权利要求1所述的目标检测方法,其特征在于,所述从混合图像集中提取与所述第一学习区近似的特征,得到目标正样本,具体包括以下步骤:
从第一图像中提名第一设定个数的第一候选框;所述第一候选框与所述第一学习区大小及形状一致;
将与所述第一学习区的重叠率大于等于设定值的第一候选框作为目标正样本。
3.根据权利要求2所述的目标检测方法,其特征在于,从混合图像集中提取与所述第一学习区不近似的特征,得到目标负样本具体包括以下步骤:
从第二图像中提名第二设定个数的第二候选框;所述第二候选框与所述第一学习区大小及形状一致;
将所述第二候选框及,与所述第一学习区的重叠率小于设定值的第一候选框作为目标负样本。
4.根据权利要求1至3任意一项所述的目标检测方法,其特征在于,所述学习模型还具有辅助分类器;
所述目标检测方法还包括:
从混合图像集中提取与所述第二学习区近似的特征,得到辅助正样本;
从混合图像集中提取与所述第二学习区大小一致且不近似的特征,得到辅助负样本;
用所述辅助正样本和辅助负样本训练所述辅助分类器。
5.根据权利要求1至3任意一项所述的目标检测方法,其特征在于,
所述第二学习区为文本框、符号框、图画框中的任意一种。
6.一种目标检测装置,其特征在于,包括:
输入模块,配置用于输入混合图像集,所述混合图像集包括多个含有检测目标的第一图像和多个含有误检目标的第二图像;所述第一图像中设有标记所述检测目标的第一学习区;
学习模型,具有目标分类器和辅助分类器,配置用于:
从混合图像集中提取与所述第一学习区近似的特征,得到目标正样本;从混合图像集中提取与所述第一学习区不近似的特征,得到目标负样本;
以所述目标正样本和目标负样本训练所述目标分类器,得到目标检测器;
目标检测器,用于检测待检图像,以检测出所述待检图像中是否含有所述检测目标。
7.根据权利要求6所述的目标检测装置,其特征在于,所述学习模型具体配置用于:
从第一图像中提名第一设定个数的第一候选框;所述第一候选框与所述第一学习区大小及形状一致;
将与所述第一学习区的重叠率大于等于设定值的第一候选框作为目标正样本。
8.根据权利要求7所述的目标检测装置,其特征在于,所述学习模型具体配置用于:
从第二图像中提名第二设定个数的第二候选框;所述第二候选框与所述第一学习区大小及形状一致;
将所述第二候选框及,与所述第一学习区的重叠率小于设定值的第一候选框作为目标负样本。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-4任意一项目所述目标检测方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任意一项所述目标检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910384207.6A CN111914863B (zh) | 2019-05-09 | 2019-05-09 | 目标检测方法、装置、终端设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910384207.6A CN111914863B (zh) | 2019-05-09 | 2019-05-09 | 目标检测方法、装置、终端设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111914863A true CN111914863A (zh) | 2020-11-10 |
CN111914863B CN111914863B (zh) | 2024-08-02 |
Family
ID=73242827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910384207.6A Active CN111914863B (zh) | 2019-05-09 | 2019-05-09 | 目标检测方法、装置、终端设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111914863B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112906789A (zh) * | 2021-02-19 | 2021-06-04 | 阳光保险集团股份有限公司 | 区域生成网络负例选择方法、装置和计算机设备 |
CN114445682A (zh) * | 2022-01-28 | 2022-05-06 | 北京百度网讯科技有限公司 | 训练模型的方法、装置、电子设备、存储介质及产品 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106355188A (zh) * | 2015-07-13 | 2017-01-25 | 阿里巴巴集团控股有限公司 | 图像检测方法及装置 |
WO2017059576A1 (en) * | 2015-10-09 | 2017-04-13 | Beijing Sensetime Technology Development Co., Ltd | Apparatus and method for pedestrian detection |
US20180018524A1 (en) * | 2015-12-16 | 2018-01-18 | Intel Corporation | Fully convolutional pyramid networks for pedestrian detection |
CN107657279A (zh) * | 2017-09-26 | 2018-02-02 | 中国科学院大学 | 一种基于少量样本的遥感目标检测方法 |
CN109190635A (zh) * | 2018-07-25 | 2019-01-11 | 北京飞搜科技有限公司 | 基于分类cnn的目标追踪方法、装置及电子设备 |
CN109359558A (zh) * | 2018-09-26 | 2019-02-19 | 腾讯科技(深圳)有限公司 | 图像标注方法、目标检测方法、装置及存储介质 |
-
2019
- 2019-05-09 CN CN201910384207.6A patent/CN111914863B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106355188A (zh) * | 2015-07-13 | 2017-01-25 | 阿里巴巴集团控股有限公司 | 图像检测方法及装置 |
WO2017059576A1 (en) * | 2015-10-09 | 2017-04-13 | Beijing Sensetime Technology Development Co., Ltd | Apparatus and method for pedestrian detection |
US20180018524A1 (en) * | 2015-12-16 | 2018-01-18 | Intel Corporation | Fully convolutional pyramid networks for pedestrian detection |
CN107657279A (zh) * | 2017-09-26 | 2018-02-02 | 中国科学院大学 | 一种基于少量样本的遥感目标检测方法 |
CN109190635A (zh) * | 2018-07-25 | 2019-01-11 | 北京飞搜科技有限公司 | 基于分类cnn的目标追踪方法、装置及电子设备 |
CN109359558A (zh) * | 2018-09-26 | 2019-02-19 | 腾讯科技(深圳)有限公司 | 图像标注方法、目标检测方法、装置及存储介质 |
Non-Patent Citations (1)
Title |
---|
罗大鹏;罗琛;魏龙生;韩家宝;王勇;马丽;: "基于在线随机蕨分类器的实时视觉感知系统", 电子学报, no. 05 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112906789A (zh) * | 2021-02-19 | 2021-06-04 | 阳光保险集团股份有限公司 | 区域生成网络负例选择方法、装置和计算机设备 |
CN114445682A (zh) * | 2022-01-28 | 2022-05-06 | 北京百度网讯科技有限公司 | 训练模型的方法、装置、电子设备、存储介质及产品 |
Also Published As
Publication number | Publication date |
---|---|
CN111914863B (zh) | 2024-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109508681B (zh) | 生成人体关键点检测模型的方法和装置 | |
US11093698B2 (en) | Method and apparatus and computer device for automatic semantic annotation for an image | |
CN108073910B (zh) | 用于生成人脸特征的方法和装置 | |
CN113191256B (zh) | 车道线检测模型的训练方法、装置、电子设备及存储介质 | |
CN108197618B (zh) | 用于生成人脸检测模型的方法和装置 | |
CN109308681B (zh) | 图像处理方法和装置 | |
CN109034069B (zh) | 用于生成信息的方法和装置 | |
CN110363220B (zh) | 行为类别检测方法、装置、电子设备和计算机可读介质 | |
CN111488873B (zh) | 一种基于弱监督学习的字符级场景文字检测方法和装置 | |
EP4177836A1 (en) | Target detection method and apparatus, and computer-readable medium and electronic device | |
CN111079638A (zh) | 基于卷积神经网络的目标检测模型训练方法、设备和介质 | |
CN106462572A (zh) | 用于分布式光学字符识别和分布式机器语言翻译的技术 | |
CN109285181B (zh) | 用于识别图像的方法和装置 | |
CN114648681B (zh) | 一种图像生成方法、装置、设备及介质 | |
CN112214707A (zh) | 网页内容表征方法、分类方法、装置及设备 | |
CN115861462B (zh) | 图像生成模型的训练方法、装置、电子设备及存储介质 | |
CN113936195A (zh) | 敏感图像识别模型的训练方法、训练装置和电子设备 | |
CN111914863B (zh) | 目标检测方法、装置、终端设备及计算机可读存储介质 | |
CN114972910B (zh) | 图文识别模型的训练方法、装置、电子设备及存储介质 | |
CN114332809A (zh) | 一种图像识别方法、装置、电子设备和存储介质 | |
CN118115932A (zh) | 图像回归器训练方法与相关方法、装置、设备及介质 | |
CN114387600B (zh) | 文本特征识别方法、装置、计算机设备和存储介质 | |
CN111428724B (zh) | 一种试卷手写统分方法、装置及存储介质 | |
CN116977692A (zh) | 一种数据处理方法、设备以及计算机可读存储介质 | |
CN113705432A (zh) | 一种模型训练、三维目标检测方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |