CN117372813A - 一种基于预标注的目标检测方法及装置 - Google Patents
一种基于预标注的目标检测方法及装置 Download PDFInfo
- Publication number
- CN117372813A CN117372813A CN202311416735.8A CN202311416735A CN117372813A CN 117372813 A CN117372813 A CN 117372813A CN 202311416735 A CN202311416735 A CN 202311416735A CN 117372813 A CN117372813 A CN 117372813A
- Authority
- CN
- China
- Prior art keywords
- data set
- target detection
- target
- labeling
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 216
- 238000002372 labelling Methods 0.000 claims abstract description 69
- 238000012549 training Methods 0.000 claims abstract description 61
- 238000001914 filtration Methods 0.000 claims abstract description 45
- 238000000034 method Methods 0.000 claims abstract description 22
- 230000001629 suppression Effects 0.000 claims abstract description 15
- 238000011897 real-time detection Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 8
- 238000012216 screening Methods 0.000 description 2
- 238000011895 specific detection Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
- G06V10/225—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了基于预标注的目标检测方法及装置,方法包括:获取第一数据集;对第一数据集进行标注以获得第二数据集;根据预设配置参数将第二数据集输入第一目标检测模型进行训练以得到第二目标检测模型;将第三数据集输入第二目标检测模型进行检测以得到第四数据集;对第四数据集中检测结果进行置信度阈值过滤和非极大值抑制过滤得到第五数据集;对第五数据集中的检测结果进行调整以得到第六数据集;将第二数据集和第六数据集作为训练数据集输入第二目标检测模型进行训练以得到第三目标检测模型。本发明提供的基于预标注的目标检测方法及装置,通过预标注极大地减轻了用户的标注工作量,并降低了用户的使用成本。
Description
技术领域
本发明实施例涉及图像识别技术领域,特别是涉及一种基于预标注的目标检测方法及装置。
背景技术
目前,人工智能技术已经深入生产生活的诸多行业和领域,基于深度卷积神经网络的目标检测应用范围日渐广泛。
现有的目标检测应用的方案大致有两种。其一是由开发人员提供完整的软硬件方案,这种方法的项目工期长,项目成本高,对于体量较小、用途单一的用户难以承担;其二是由用户提供训练数据,将训练数据交由深度学习平台进行训练,这种方法的数据安全较差,对于数据安全敏感的用户难以使用。
例如,申请号为201910759146.7的发明专利公开了一种自动生成训练数据集的图像分类模型训练方法及系统,方法包括:步骤1、搭建一个关键特征学习模型,利用只标注了物体关键特征的图片所组成的原始训练集对特征学习模型进行训练;步骤2、对原始训练集中的每张图片进行目标特征抓取,并将抓取的特征按其分类进行自动标注,生成关键特征数据;步骤3、对关键特征数据进行训练;步骤4、对关键特征数据进行训练完成后,并将分类错误的图片反馈给特征学习模型,将分类错误的图片放入特征学习模型的训练集进行迭代升级;所述步骤1具体为:1)利用WideResNet网络对图像进行卷积操作提取图像特征,该图像特征用于后续的候选区域筛选和分类;2)通过3*3卷积层和softmax全链接层基于WideResNet提取的图像特征,筛选概率最大的前景候选区域;3)利用第1)步提取的图像特征对候选区域进行分类;4)对候选区域的位置通过线性回归的方式完成修正;所述步骤2具体为:1)自动生成:特征学习模型返回关键特征区域相对于原图像的左上角(x1 ,y1)和右下角(x2 ,y2)的坐标轴,并据此自动生成一张局部关键特征图片;2)自动标注:根据识别出的关键特征类别对该原始图片和局部关键特征图片自动进行标注,实现训练数据的自动标注;3)自动数据扩充:根据生成的各种类训练数据的数量对比情况,对数据少的分类进行自动数据扩充,以达到各种类数据1:1的均衡比例,自动数据扩充是对原始图片以随机裁剪的方式进行。然而上述方法较为复杂,系统需要耗费大量的计算时间。
为此,有必要提供一种基于预标注的目标检测方法及装置,以解决上述问题。
发明内容
在本申请实施例的目的在于提供一种基于预标注的目标检测方法及装置,通过预标注极大地减轻了用户的标注工作量,并降低了用户的使用成本。
根据本发明的一个方面,提供一种基于预标注的目标检测方法,包括:
获取第一数据集,所述第一数据集为第一数量图片;
对所述第一数据集进行标注以获得第二数据集,所述对第一数据集进行标注包括对所述第一数量图片中待检测目标使用最大外接矩形框进行标注,所述第二数据集为图片文件与相应标注信息文件的集合;
根据预设配置参数将所述第二数据集作为训练数据集输入第一目标检测模型进行训练以得到第二目标检测模型;
将第三数据集输入所述第二目标检测模型进行检测以得到第四数据集,所述第三数据集与第一数据集是同一分布的第二数量图片数据,所述第四数据集包含图片文件及其相应的检测结果信息文件的集合;
对第四数据集中检测结果进行置信度阈值过滤和非极大值抑制过滤得到第五数据集;
对所述第五数据集中的检测结果进行调整以得到第六数据集,所述调整包括新增所述第二目标检测模型未检测到的待检测目标、修改所述第二目标检测模型检测不准确的待检测目标以及删除所述第二目标检测模型检测错误的待检测目标,所述第六数据集为预标注结果;
将所述第二数据集和所述第六数据集作为训练数据集输入所述第二目标检测模型进行训练以得到第三目标检测模型,所述第三目标检测模型对第七数据集进行检测得到第八数据集,所述第七数据集是实时获取的图片,所述第八数据集是实时检测结果。
优选地,将图片数据输入第一目标检测模型,经过前向推理获得所述待检测目标的检测结果,使用所述检测结果与相应的标注文件中人工标注结果计算误差;若所述计算误差关于所述第一目标检测模型中权重参数的偏导数,则根据梯度下降算法利用所述偏导数对相应权重参数进行更新。
优选地,所述模型训练是对所述模型中的权重参数进行更新包括使用前向推理、反向传播和梯度下降算法。
优选地,所述第四数据集和所述第八数据集包括所述检测结果的类别、概率、位置和尺寸。
优选地,使用置信度阈值对所述第八数据集进行过滤得到第九数据集,保留所述第八数据集中预测概率大于所述置信度阈值的结果。
优选地,使用非极大值抑制方法对所述第九数据集进行过滤得到第十数据集,根据所述第九数据集中检测结果的位置和尺寸计算所述第九数据集中检测结果之间的重叠度,重叠度大于第一预设阈值的多个检测结果中保留概率最大的检测结果。
优选地,使用尺寸过滤对所述第十数据集进行过滤得到第十一数据集,将所述第十数据集中尺寸大于或小于第二预设阈值的所述检测结果进行过滤。
优选地,使用数量过滤对所述第十一数据集进行过滤得到第十二数据集,将所述第十一数据集检测结果中类别数量小于第三预设阈值的所述检测结果的类别进行过滤。
优选地,当所述第十二数据集中的包含所述待检测目标的图片数量和所述第七数据集为实时获取的多张现场图片数量的比值超过第四预设阈值时发出报警。
根据本发明的另一个方面,提供一种基于预标注的目标检测装置,包括:
数据集获取模块,其用于获取第一数据集,所述第一数据集为第一数量图片;
数据集标注模块,其用于对所述第一数据集进行标注以获得第二数据集,所述对第一数据集进行标注包括对所述第一数量图片中待检测目标使用最大外接矩形框进行标注,所述第二数据集为图片文件与相应标注信息文件的集合;
模型预训练模块,其用于根据预设配置参数将所述第二数据集作为训练数据集输入第一目标检测模型进行训练以得到第二目标检测模型;
模型预标注模块,其用于将第三数据集输入所述第二目标检测模型进行检测以得到第四数据集,所述第三数据集与第一数据集是同一分布的第二数量图片,所述第四数据集包含图片文件及其相应的检测结果信息文件的集合,对第四数据集中检测结果进行置信度阈值过滤和非极大值抑制过滤得到第五数据集;
数据集调整模块,其用于对所述第五数据集中的检测结果进行调整以得到第六数据集,所述调整包括新增所述第二目标检测模型未检测到的待检测目标、修改所述第二目标检测模型检测不准确的待检测目标以及删除所述第二目标检测模型检测错误的待检测目标,所述第六数据集为预标注结果;
模型再训练模块,其用于将所述第二数据集和所述第六数据集作为训练数据集输入所述第二目标检测模型进行重新训练以得到第三目标检测模型,所述第三目标检测模型对第七数据集进行检测得到第八数据集,所述第七数据集是实时获取的图片,所述第八数据集是实时检测结果。
本申请公开的一种基于预标注的目标检测方法,包括:获取第一数据集,所述第一数据集为第一数量图片;对所述第一数据集进行标注以获得第二数据集,所述对第一数据集进行标注包括对所述第一数量图片中待检测目标使用最大外接矩形框进行标注,所述第二数据集为图片文件与相应标注信息文件的集合;根据预设配置参数将所述第二数据集作为训练数据集输入第一目标检测模型进行训练以得到第二目标检测模型;将第三数据集输入所述第二目标检测模型进行检测以得到第四数据集,所述第三数据集与第一数据集是同一分布的第二数量图片数据,所述第四数据集包含图片文件及其相应的检测结果信息文件的集合;对第四数据集中检测结果进行置信度阈值过滤和非极大值抑制过滤得到第五数据集;对所述第五数据集中的检测结果进行调整以得到第六数据集,所述调整包括新增所述第二目标检测模型未检测到的待检测目标、修改所述第二目标检测模型检测不准确的待检测目标以及删除所述第二目标检测模型检测错误的待检测目标,所述第六数据集为预标注结果;将所述第二数据集和所述第六数据集作为训练数据集输入所述第二目标检测模型进行训练以得到第三目标检测模型,所述第三目标检测模型对第七数据集进行检测得到第八数据集,所述第七数据集是实时获取的图片,所述第八数据集是实时检测结果,通过对数据集进行调整以获得预标注结果,从而不断优化目标检测模型,以提高目标检测精度;
进一步地,使用置信度阈值、非极大值抑制方法、尺寸过滤、数量过滤等方法对数据进行优化,从而进一步提高目标检测精度;
进一步地,当所述第十二数据集中的包含所述待检测目标的图片数量和所述第七数据集为实时获取的多张现场图片数量的比值超过第四预设阈值时发出报警,从而实现当实时获取的现场图片中包含待检测目标的图片数量过多时,及时发出报警以对现场工作进行警示。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,而不是全部实施例。对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施方式的基于预标注的目标检测方法的流程示意图;
图2是根据本发明实施方式的基于预标注的目标检测方法的人工标注的流程示意图;
图3是根据本发明实施方式的基于预标注的目标检测方法的模型预标注的流程示意图;
图4是根据本发明实施方式的基于预标注的目标检测方法的人工调整的流程示意图;
图5是根据本发明实施方式的基于预标注的目标检测方法的第三目标检测模型的训练的流程示意图;
图6是根据本发明实施方式的基于预标注的目标检测方法进行具体检测的流程示意图;
图7是根据本发明实施方式的基于预标注的目标检测装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。根据本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面以具体的实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
根据现有技术存在的问题,本发明实施例提供一种基于预标注的目标检测方法及装置,通过预标注极大地减轻了用户的标注工作量,并降低了用户的使用成本。
图1是根据本发明实施方式的基于预标注的目标检测方法的流程示意图;图2是根据本发明实施方式的基于预标注的目标检测方法的人工标注的流程示意图;图3是根据本发明实施方式的基于预标注的目标检测方法的模型预标注的流程示意图;图4是根据本发明实施方式的基于预标注的目标检测方法的人工调整的流程示意图;图5是根据本发明实施方式的基于预标注的目标检测方法的第三目标检测模型的训练的流程示意图;图6是根据本发明实施方式的基于预标注的目标检测方法进行具体检测的流程示意图。
如图1至图6所示,本发明实施例提供一种基于预标注的目标检测方法,包括:
步骤S101:获取第一数据集,所述第一数据集为第一数量图片;
步骤S102:对所述第一数据集进行标注以获得第二数据集,所述对第一数据集进行标注包括对所述第一数量图片中待检测目标使用最大外接矩形框进行标注,所述第二数据集为图片文件与相应标注信息文件的集合;
步骤S103:根据预设配置参数将所述第二数据集作为训练数据集输入第一目标检测模型进行训练以得到第二目标检测模型;
所述预设配置参数包括训练时优化器初始学习率、学习率衰减方法、学习率更新方法;训练时输入图片尺寸的大小;训练时图像增强的方法;训练时计算损失值的各部分系数;训练时训练数据集遍历的轮数。
步骤S104:将第三数据集输入所述第二目标检测模型进行检测以得到第四数据集,所述第三数据集与第一数据集是同一分布的第二数量图片数据,所述第四数据集包含图片文件及其相应的检测结果信息文件的集合;
步骤S105:对第四数据集中检测结果进行置信度阈值过滤和非极大值抑制过滤得到第五数据集;
步骤S106:对所述第五数据集中的检测结果进行调整以得到第六数据集,所述调整包括新增所述第二目标检测模型未检测到的待检测目标、修改所述第二目标检测模型检测不准确的待检测目标以及删除所述第二目标检测模型检测错误的待检测目标,所述第六数据集为预标注结果;
步骤S107:将所述第二数据集和所述第六数据集作为训练数据集输入所述第二目标检测模型进行训练以得到第三目标检测模型,所述第三目标检测模型对第七数据集进行检测得到第八数据集,所述第七数据集是实时获取的图片,所述第八数据集是实时检测结果。
具体地,第一数量图片为少量图片,第二数量图片为大量图片。
首先通过对少量图片进行标注以获得第二数据集,将第二数据集作为训练数据集输入第一目标检测模型以初步得到一个第二目标检测模型。
其次,将大量图片输入第二目标检测模型进行检测以得到第四数据集,第四数据集中的数据进行置信度阈值过滤和非极大值抑制过滤得到第五数据集,将第五数据集进行调整得到第六数据,包括新增第二目标检测模型未检测到的待检测目标、修改所述第二目标检测模型检测不准确的待检测目标以及删除第二目标检测模型检测错误的待检测目标。
最后将第二数据集和第六数据集一起作为训练数据集输入第二目标检测模型进行训练后得到一个检测更为精准的第三目标检测模型。
在具体实施中,将图片数据输入第一目标检测模型,经过前向推理获得所述待检测目标的检测结果,使用所述检测结果与相应的标注文件中人工标注结果计算误差;若所述计算误差关于所述第一目标检测模型中权重参数的偏导数,则根据梯度下降算法利用所述偏导数对相应权重参数进行更新。
在具体实施中,所述模型训练是对所述模型中的权重参数进行更新包括使用前向推理、反向传播和梯度下降算法。
前向推理是指将第三数据集输入第二目标检测模型后,经过第二目标检测模型中每个模块的逐一运算,得到第四数据集的过程。反向传播是指将第二目标检测模型的输出的第四数据集与人工的标注结果计算偏差,利用偏差对第二目标检测模型中每个模块中的可学习参数计算偏导数,梯度下降是指利用所述偏导数对相应的可学习参数进行更新。
在具体实施中,所述第四数据集和所述第八数据集包括所述检测结果的类别、概率、位置和尺寸。
其中,类别是指所述检测结果的所属类别,概率是指所述检测结果是正确的可能性,位置和尺寸是指所述检测结果的边框在图片中的位置及大小。第三数据集输入第二目标检测模型之后,会得到相应的xml格式文件,其中包含第二目标检测模型对第三数据集中待检测目标的预测。第四数据集是将第三数据集中的图片逐个输入第二目标检测模型后得到的xml文件与相应输入图片文件集合。
在具体实施中,使用置信度阈值对所述第八数据集进行过滤得到第九数据集,保留所述第八数据集中预测概率大于所述置信度阈值的结果。
在具体实施中,使用非极大值抑制方法对所述第九数据集进行过滤得到第十数据集,根据所述第九数据集中检测结果的位置和尺寸计算所述第九数据集中检测结果之间的重叠度,重叠度大于第一预设阈值的多个检测结果中保留概率最大的检测结果。
在具体实施中,使用尺寸过滤对所述第十数据集进行过滤得到第十一数据集,将所述第十数据集中尺寸大于或小于第二预设阈值的所述检测结果进行过滤。
在具体实施中,使用数量过滤对所述第十一数据集进行过滤得到第十二数据集,将所述第十一数据集检测结果中类别数量小于第三预设阈值的所述检测结果的类别进行过滤。
在具体实施中,当所述第十二数据集中的包含所述待检测目标的图片数量和所述第七数据集为实时获取的多张现场图片数量的比值超过第四预设阈值时发出报警。
图7是根据本发明实施方式的基于预标注的目标检测装置的结构示意图,如图7所示,本发明实施例提供一种基于预标注的目标检测装置,包括:
数据集获取模块71,其用于获取第一数据集,所述第一数据集为第一数量图片;
数据集标注模块72,其用于对所述第一数据集进行标注以获得第二数据集,所述对第一数据集进行标注包括对所述第一数量图片中待检测目标使用最大外接矩形框进行标注,所述第二数据集为图片文件与相应标注信息文件的集合;
模型预训练模块73,其用于根据预设配置参数将所述第二数据集作为训练数据集输入第一目标检测模型进行训练以得到第二目标检测模型;
模型预标注模块74,其用于将第三数据集输入所述第二目标检测模型进行检测以得到第四数据集,所述第三数据集与第一数据集是同一分布的第二数量图片,所述第四数据集包含图片文件及其相应的检测结果信息文件的集合,对第四数据集中检测结果进行置信度阈值过滤和非极大值抑制过滤得到第五数据集;
数据集调整模块75,其用于对所述第五数据集中的检测结果进行调整以得到第六数据集,所述调整包括新增所述第二目标检测模型未检测到的待检测目标、修改所述第二目标检测模型检测不准确的待检测目标以及删除所述第二目标检测模型检测错误的待检测目标,所述第六数据集为预标注结果;
模型再训练模块76,其用于将所述第二数据集和所述第六数据集作为训练数据集输入所述第二目标检测模型进行重新训练以得到第三目标检测模型,所述第三目标检测模型对第七数据集进行检测得到第八数据集,所述第七数据集是实时获取的图片,所述第八数据集是实时检测结果。
综上所述,本申请公开的一种基于预标注的目标检测方法,包括:获取第一数据集,所述第一数据集为第一数量图片;对所述第一数据集进行标注以获得第二数据集,所述对第一数据集进行标注包括对所述第一数量图片中待检测目标使用最大外接矩形框进行标注,所述第二数据集为图片文件与相应标注信息文件的集合;根据预设配置参数将所述第二数据集作为训练数据集输入第一目标检测模型进行训练以得到第二目标检测模型;将第三数据集输入所述第二目标检测模型进行检测以得到第四数据集,所述第三数据集与第一数据集是同一分布的第二数量图片数据,所述第四数据集包含图片文件及其相应的检测结果信息文件的集合;对第四数据集中检测结果进行置信度阈值过滤和非极大值抑制过滤得到第五数据集;对所述第五数据集中的检测结果进行调整以得到第六数据集,所述调整包括新增所述第二目标检测模型未检测到的待检测目标、修改所述第二目标检测模型检测不准确的待检测目标以及删除所述第二目标检测模型检测错误的待检测目标,所述第六数据集为预标注结果;将所述第二数据集和所述第六数据集作为训练数据集输入所述第二目标检测模型进行训练以得到第三目标检测模型,所述第三目标检测模型对第七数据集进行检测得到第八数据集,所述第七数据集是实时获取的图片,所述第八数据集是实时检测结果,通过对数据集进行调整以获得预标注结果,从而不断优化目标检测模型,以提高目标检测精度;
进一步地,使用置信度阈值、非极大值抑制方法、尺寸过滤、数量过滤等方法对数据进行优化,从而进一步提高目标检测精度;
进一步地,当所述第十二数据集中的包含所述待检测目标的图片数量和所述第七数据集为实时获取的多张现场图片数量的比值超过第四预设阈值时发出报警,从而实现当实时获取的现场图片中包含待检测目标的图片数量过多时,及时发出报警以对现场工作进行警示。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种基于预标注的目标检测方法,其特征在于,包括:
获取第一数据集,所述第一数据集为第一数量图片;
对所述第一数据集进行标注以获得第二数据集,所述对第一数据集进行标注包括对所述第一数量图片中待检测目标使用最大外接矩形框进行标注,所述第二数据集为图片文件与相应标注信息文件的集合;
根据预设配置参数将所述第二数据集作为训练数据集输入第一目标检测模型进行训练以得到第二目标检测模型;
将第三数据集输入所述第二目标检测模型进行检测以得到第四数据集,所述第三数据集与第一数据集是同一分布的第二数量图片数据,所述第四数据集包含图片文件及其相应的检测结果信息文件的集合;
对第四数据集中检测结果进行置信度阈值过滤和非极大值抑制过滤得到第五数据集;
对所述第五数据集中的检测结果进行调整以得到第六数据集,所述调整包括新增所述第二目标检测模型未检测到的待检测目标、修改所述第二目标检测模型检测不准确的待检测目标以及删除所述第二目标检测模型检测错误的待检测目标,所述第六数据集为预标注结果;
将所述第二数据集和所述第六数据集作为训练数据集输入所述第二目标检测模型进行训练以得到第三目标检测模型,所述第三目标检测模型对第七数据集进行检测得到第八数据集,所述第七数据集是实时获取的图片,所述第八数据集是实时检测结果。
2.根据权利要求1所述的基于预标注的目标检测方法,其特征在于,将图片数据输入第一目标检测模型,经过前向推理获得所述待检测目标的检测结果,使用所述检测结果与相应的标注文件中人工标注结果计算误差;若所述计算误差关于所述第一目标检测模型中权重参数的偏导数,则根据梯度下降算法利用所述偏导数对相应权重参数进行更新。
3.根据权利要求2所述的基于预标注的目标检测方法,其特征在于,所述模型训练是对所述模型中的权重参数进行更新包括使用前向推理、反向传播和梯度下降算法。
4.根据权利要求1所述的基于预标注的目标检测方法,其特征在于,所述第四数据集和所述第八数据集包括检测结果的类别、概率、位置和尺寸。
5.根据权利要求4所述的基于预标注的目标检测方法,其特征在于,使用置信度阈值对所述第八数据集进行过滤得到第九数据集,保留所述第八数据集中预测概率大于所述置信度阈值的结果。
6.根据权利要求5所述的基于预标注的目标检测方法,其特征在于,使用非极大值抑制方法对所述第九数据集进行过滤得到第十数据集,根据所述第九数据集中检测结果的位置和尺寸计算所述第九数据集中检测结果之间的重叠度,重叠度大于第一预设阈值的多个检测结果中保留概率最大的检测结果。
7.根据权利要求6所述的基于预标注的目标检测方法,其特征在于,使用尺寸过滤对所述第十数据集进行过滤得到第十一数据集,将所述第十数据集中尺寸大于或小于第二预设阈值的所述检测结果进行过滤。
8.根据权利要求7所述的基于预标注的目标检测方法,其特征在于,使用数量过滤对所述第十一数据集进行过滤得到第十二数据集,将所述第十一数据集检测结果中类别数量小于第三预设阈值的所述检测结果的类别进行过滤。
9.根据权利要求1所述的基于预标注的目标检测方法,其特征在于,当所述第十二数据集中的包含所述待检测目标的图片数量和所述第七数据集为实时获取的多张现场图片数量的比值超过第四预设阈值时发出报警。
10.一种基于预标注的目标检测装置,其特征在于,包括:
数据集获取模块,其用于获取第一数据集,所述第一数据集为第一数量图片;
数据集标注模块,其用于对所述第一数据集进行标注以获得第二数据集,所述对第一数据集进行标注包括对所述第一数量图片中待检测目标使用最大外接矩形框进行标注,所述第二数据集为图片文件与相应标注信息文件的集合;
模型预训练模块,其用于根据预设配置参数将所述第二数据集作为训练数据集输入第一目标检测模型进行训练以得到第二目标检测模型;
模型预标注模块,其用于将第三数据集输入所述第二目标检测模型进行检测以得到第四数据集,所述第三数据集与第一数据集是同一分布的第二数量图片数据,所述第四数据集包含图片文件及其相应的检测结果信息文件的集合,对第四数据集中检测结果进行置信度阈值过滤和非极大值抑制过滤得到第五数据集;
数据集调整模块,其用于对所述第五数据集中的检测结果进行调整以得到第六数据集,所述调整包括新增所述第二目标检测模型未检测到的待检测目标、修改所述第二目标检测模型检测不准确的待检测目标以及删除所述第二目标检测模型检测错误的待检测目标,所述第六数据集为预标注结果;
模型再训练模块,其用于将所述第二数据集和所述第六数据集作为训练数据集输入所述第二目标检测模型进行重新训练以得到第三目标检测模型,所述第三目标检测模型对第七数据集进行检测得到第八数据集,所述第七数据集是实时获取的图片,所述第八数据集是实时检测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311416735.8A CN117372813A (zh) | 2023-10-30 | 2023-10-30 | 一种基于预标注的目标检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311416735.8A CN117372813A (zh) | 2023-10-30 | 2023-10-30 | 一种基于预标注的目标检测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117372813A true CN117372813A (zh) | 2024-01-09 |
Family
ID=89400153
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311416735.8A Pending CN117372813A (zh) | 2023-10-30 | 2023-10-30 | 一种基于预标注的目标检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117372813A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112861959A (zh) * | 2021-02-02 | 2021-05-28 | 南京天创电子技术有限公司 | 一种目标检测图像的自动标注方法 |
CN112966772A (zh) * | 2021-03-23 | 2021-06-15 | 之江实验室 | 一种多人在线的图像半自动标注方法及系统 |
CN113420790A (zh) * | 2021-06-02 | 2021-09-21 | 深圳海翼智新科技有限公司 | 用于目标检测的自动标注方法和装置 |
CN115761391A (zh) * | 2022-10-12 | 2023-03-07 | 电子科技大学长三角研究院(湖州) | 一种基于yolo的数据集半自动标注方法 |
CN116109812A (zh) * | 2023-03-29 | 2023-05-12 | 湖南大学 | 一种基于非极大值抑制阈值优化的目标检测方法 |
CN116824241A (zh) * | 2023-06-20 | 2023-09-29 | 北京邮电大学 | 一种基于迭代学习的马铃薯病害多分类和检测方法 |
-
2023
- 2023-10-30 CN CN202311416735.8A patent/CN117372813A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112861959A (zh) * | 2021-02-02 | 2021-05-28 | 南京天创电子技术有限公司 | 一种目标检测图像的自动标注方法 |
CN112966772A (zh) * | 2021-03-23 | 2021-06-15 | 之江实验室 | 一种多人在线的图像半自动标注方法及系统 |
CN113420790A (zh) * | 2021-06-02 | 2021-09-21 | 深圳海翼智新科技有限公司 | 用于目标检测的自动标注方法和装置 |
CN115761391A (zh) * | 2022-10-12 | 2023-03-07 | 电子科技大学长三角研究院(湖州) | 一种基于yolo的数据集半自动标注方法 |
CN116109812A (zh) * | 2023-03-29 | 2023-05-12 | 湖南大学 | 一种基于非极大值抑制阈值优化的目标检测方法 |
CN116824241A (zh) * | 2023-06-20 | 2023-09-29 | 北京邮电大学 | 一种基于迭代学习的马铃薯病害多分类和检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11961227B2 (en) | Method and device for detecting and locating lesion in medical image, equipment and storage medium | |
JP6831480B2 (ja) | テキスト検出分析方法、装置及びデバイス | |
CN106971152B (zh) | 一种基于航拍图像的检测输电线路中鸟巢的方法 | |
CN112634170B (zh) | 一种模糊图像修正的方法、装置、计算机设备及存储介质 | |
CN112001407A (zh) | 一种基于自动化标注的模型迭代训练方法及系统 | |
CN111340041B (zh) | 一种基于深度学习的车牌识别方法及装置 | |
CN112836820B (zh) | 用于图像分类任务的深度卷积网络训练方法、装置及系统 | |
CN112507924B (zh) | 一种3d手势识别方法、装置及系统 | |
CN115810133B (zh) | 基于图像处理和点云处理的焊接控制方法及相关设备 | |
CN112396042A (zh) | 实时更新的目标检测方法及系统、计算机可读存储介质 | |
US20240185590A1 (en) | Method for training object detection model, object detection method and apparatus | |
CN114708472A (zh) | 面向ai实训的多模态数据集标注方法、装置及电子设备 | |
CN114241411A (zh) | 基于目标检测的计数模型处理方法、装置及计算机设备 | |
CN116630367B (zh) | 目标跟踪方法、装置、电子设备及存储介质 | |
CN117372813A (zh) | 一种基于预标注的目标检测方法及装置 | |
CN113313179A (zh) | 一种基于l2p范数鲁棒最小二乘法的噪声图像分类方法 | |
CN118097326A (zh) | 目标检测模型训练方法、装置、电子设备及存储介质 | |
CN117390207A (zh) | 基于自监督学习的遥感影像建筑物样本库构建方法及系统 | |
CN116597244A (zh) | 一种基于元学习方法的小样本目标检测方法 | |
CN116579409A (zh) | 基于重参数化的智能相机模型剪枝加速方法及加速系统 | |
CN116777767A (zh) | 图像处理方法、电子设备及存储介质 | |
US20230071291A1 (en) | System and method for a precise semantic segmentation | |
CN114387590A (zh) | 物料信息录入方法、装置、存储介质及电子设备 | |
CN116246161A (zh) | 领域知识引导下的遥感图像目标精细类型识别方法及装置 | |
CN112686851B (zh) | 一种图像检测方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |