CN117372813A

CN117372813A - 一种基于预标注的目标检测方法及装置

Info

Publication number: CN117372813A
Application number: CN202311416735.8A
Authority: CN
Inventors: 杨云聪; 李俊杰; 魏茂敏; 廖洪波
Original assignee: Shanghai Dingge Information Technology Co ltd
Current assignee: Shanghai Dingge Information Technology Co ltd
Priority date: 2023-10-30
Filing date: 2023-10-30
Publication date: 2024-01-09

Abstract

本发明公开了基于预标注的目标检测方法及装置，方法包括：获取第一数据集；对第一数据集进行标注以获得第二数据集；根据预设配置参数将第二数据集输入第一目标检测模型进行训练以得到第二目标检测模型；将第三数据集输入第二目标检测模型进行检测以得到第四数据集；对第四数据集中检测结果进行置信度阈值过滤和非极大值抑制过滤得到第五数据集；对第五数据集中的检测结果进行调整以得到第六数据集；将第二数据集和第六数据集作为训练数据集输入第二目标检测模型进行训练以得到第三目标检测模型。本发明提供的基于预标注的目标检测方法及装置，通过预标注极大地减轻了用户的标注工作量，并降低了用户的使用成本。

Description

一种基于预标注的目标检测方法及装置

技术领域

本发明实施例涉及图像识别技术领域，特别是涉及一种基于预标注的目标检测方法及装置。

背景技术

目前，人工智能技术已经深入生产生活的诸多行业和领域，基于深度卷积神经网络的目标检测应用范围日渐广泛。

现有的目标检测应用的方案大致有两种。其一是由开发人员提供完整的软硬件方案，这种方法的项目工期长，项目成本高，对于体量较小、用途单一的用户难以承担；其二是由用户提供训练数据，将训练数据交由深度学习平台进行训练，这种方法的数据安全较差，对于数据安全敏感的用户难以使用。

例如，申请号为201910759146.7的发明专利公开了一种自动生成训练数据集的图像分类模型训练方法及系统，方法包括：步骤1、搭建一个关键特征学习模型，利用只标注了物体关键特征的图片所组成的原始训练集对特征学习模型进行训练；步骤2、对原始训练集中的每张图片进行目标特征抓取，并将抓取的特征按其分类进行自动标注，生成关键特征数据；步骤3、对关键特征数据进行训练；步骤4、对关键特征数据进行训练完成后，并将分类错误的图片反馈给特征学习模型，将分类错误的图片放入特征学习模型的训练集进行迭代升级；所述步骤1具体为：1）利用WideResNet网络对图像进行卷积操作提取图像特征，该图像特征用于后续的候选区域筛选和分类；2）通过3*3卷积层和softmax全链接层基于WideResNet提取的图像特征，筛选概率最大的前景候选区域；3）利用第1）步提取的图像特征对候选区域进行分类；4）对候选区域的位置通过线性回归的方式完成修正；所述步骤2具体为：1）自动生成：特征学习模型返回关键特征区域相对于原图像的左上角（x1 ,y1）和右下角(x2 ,y2)的坐标轴，并据此自动生成一张局部关键特征图片；2）自动标注：根据识别出的关键特征类别对该原始图片和局部关键特征图片自动进行标注，实现训练数据的自动标注；3）自动数据扩充：根据生成的各种类训练数据的数量对比情况，对数据少的分类进行自动数据扩充，以达到各种类数据1：1的均衡比例，自动数据扩充是对原始图片以随机裁剪的方式进行。然而上述方法较为复杂，系统需要耗费大量的计算时间。

为此，有必要提供一种基于预标注的目标检测方法及装置，以解决上述问题。

发明内容

在本申请实施例的目的在于提供一种基于预标注的目标检测方法及装置，通过预标注极大地减轻了用户的标注工作量，并降低了用户的使用成本。

根据本发明的一个方面，提供一种基于预标注的目标检测方法，包括：

获取第一数据集，所述第一数据集为第一数量图片；

对所述第一数据集进行标注以获得第二数据集，所述对第一数据集进行标注包括对所述第一数量图片中待检测目标使用最大外接矩形框进行标注，所述第二数据集为图片文件与相应标注信息文件的集合；

根据预设配置参数将所述第二数据集作为训练数据集输入第一目标检测模型进行训练以得到第二目标检测模型；

将第三数据集输入所述第二目标检测模型进行检测以得到第四数据集，所述第三数据集与第一数据集是同一分布的第二数量图片数据，所述第四数据集包含图片文件及其相应的检测结果信息文件的集合；

对第四数据集中检测结果进行置信度阈值过滤和非极大值抑制过滤得到第五数据集；

对所述第五数据集中的检测结果进行调整以得到第六数据集，所述调整包括新增所述第二目标检测模型未检测到的待检测目标、修改所述第二目标检测模型检测不准确的待检测目标以及删除所述第二目标检测模型检测错误的待检测目标，所述第六数据集为预标注结果；

将所述第二数据集和所述第六数据集作为训练数据集输入所述第二目标检测模型进行训练以得到第三目标检测模型，所述第三目标检测模型对第七数据集进行检测得到第八数据集，所述第七数据集是实时获取的图片，所述第八数据集是实时检测结果。

优选地，将图片数据输入第一目标检测模型，经过前向推理获得所述待检测目标的检测结果，使用所述检测结果与相应的标注文件中人工标注结果计算误差；若所述计算误差关于所述第一目标检测模型中权重参数的偏导数，则根据梯度下降算法利用所述偏导数对相应权重参数进行更新。

优选地，所述模型训练是对所述模型中的权重参数进行更新包括使用前向推理、反向传播和梯度下降算法。

优选地，所述第四数据集和所述第八数据集包括所述检测结果的类别、概率、位置和尺寸。

优选地，使用置信度阈值对所述第八数据集进行过滤得到第九数据集，保留所述第八数据集中预测概率大于所述置信度阈值的结果。

优选地，使用非极大值抑制方法对所述第九数据集进行过滤得到第十数据集，根据所述第九数据集中检测结果的位置和尺寸计算所述第九数据集中检测结果之间的重叠度，重叠度大于第一预设阈值的多个检测结果中保留概率最大的检测结果。

优选地，使用尺寸过滤对所述第十数据集进行过滤得到第十一数据集，将所述第十数据集中尺寸大于或小于第二预设阈值的所述检测结果进行过滤。

优选地，使用数量过滤对所述第十一数据集进行过滤得到第十二数据集，将所述第十一数据集检测结果中类别数量小于第三预设阈值的所述检测结果的类别进行过滤。

优选地，当所述第十二数据集中的包含所述待检测目标的图片数量和所述第七数据集为实时获取的多张现场图片数量的比值超过第四预设阈值时发出报警。

根据本发明的另一个方面，提供一种基于预标注的目标检测装置，包括：

数据集获取模块，其用于获取第一数据集，所述第一数据集为第一数量图片；

数据集标注模块，其用于对所述第一数据集进行标注以获得第二数据集，所述对第一数据集进行标注包括对所述第一数量图片中待检测目标使用最大外接矩形框进行标注，所述第二数据集为图片文件与相应标注信息文件的集合；

模型预训练模块，其用于根据预设配置参数将所述第二数据集作为训练数据集输入第一目标检测模型进行训练以得到第二目标检测模型；

模型预标注模块，其用于将第三数据集输入所述第二目标检测模型进行检测以得到第四数据集，所述第三数据集与第一数据集是同一分布的第二数量图片，所述第四数据集包含图片文件及其相应的检测结果信息文件的集合，对第四数据集中检测结果进行置信度阈值过滤和非极大值抑制过滤得到第五数据集；

数据集调整模块，其用于对所述第五数据集中的检测结果进行调整以得到第六数据集，所述调整包括新增所述第二目标检测模型未检测到的待检测目标、修改所述第二目标检测模型检测不准确的待检测目标以及删除所述第二目标检测模型检测错误的待检测目标，所述第六数据集为预标注结果；

模型再训练模块，其用于将所述第二数据集和所述第六数据集作为训练数据集输入所述第二目标检测模型进行重新训练以得到第三目标检测模型，所述第三目标检测模型对第七数据集进行检测得到第八数据集，所述第七数据集是实时获取的图片，所述第八数据集是实时检测结果。

本申请公开的一种基于预标注的目标检测方法，包括：获取第一数据集，所述第一数据集为第一数量图片；对所述第一数据集进行标注以获得第二数据集，所述对第一数据集进行标注包括对所述第一数量图片中待检测目标使用最大外接矩形框进行标注，所述第二数据集为图片文件与相应标注信息文件的集合；根据预设配置参数将所述第二数据集作为训练数据集输入第一目标检测模型进行训练以得到第二目标检测模型；将第三数据集输入所述第二目标检测模型进行检测以得到第四数据集，所述第三数据集与第一数据集是同一分布的第二数量图片数据，所述第四数据集包含图片文件及其相应的检测结果信息文件的集合；对第四数据集中检测结果进行置信度阈值过滤和非极大值抑制过滤得到第五数据集；对所述第五数据集中的检测结果进行调整以得到第六数据集，所述调整包括新增所述第二目标检测模型未检测到的待检测目标、修改所述第二目标检测模型检测不准确的待检测目标以及删除所述第二目标检测模型检测错误的待检测目标，所述第六数据集为预标注结果；将所述第二数据集和所述第六数据集作为训练数据集输入所述第二目标检测模型进行训练以得到第三目标检测模型，所述第三目标检测模型对第七数据集进行检测得到第八数据集，所述第七数据集是实时获取的图片，所述第八数据集是实时检测结果，通过对数据集进行调整以获得预标注结果，从而不断优化目标检测模型，以提高目标检测精度；

进一步地，使用置信度阈值、非极大值抑制方法、尺寸过滤、数量过滤等方法对数据进行优化，从而进一步提高目标检测精度；

进一步地，当所述第十二数据集中的包含所述待检测目标的图片数量和所述第七数据集为实时获取的多张现场图片数量的比值超过第四预设阈值时发出报警，从而实现当实时获取的现场图片中包含待检测目标的图片数量过多时，及时发出报警以对现场工作进行警示。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图做一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，而不是全部实施例。对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施方式的基于预标注的目标检测方法的流程示意图；

图2是根据本发明实施方式的基于预标注的目标检测方法的人工标注的流程示意图；

图3是根据本发明实施方式的基于预标注的目标检测方法的模型预标注的流程示意图；

图4是根据本发明实施方式的基于预标注的目标检测方法的人工调整的流程示意图；

图5是根据本发明实施方式的基于预标注的目标检测方法的第三目标检测模型的训练的流程示意图；

图6是根据本发明实施方式的基于预标注的目标检测方法进行具体检测的流程示意图；

图7是根据本发明实施方式的基于预标注的目标检测装置的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。根据本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面以具体的实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。

根据现有技术存在的问题，本发明实施例提供一种基于预标注的目标检测方法及装置，通过预标注极大地减轻了用户的标注工作量，并降低了用户的使用成本。

图1是根据本发明实施方式的基于预标注的目标检测方法的流程示意图；图2是根据本发明实施方式的基于预标注的目标检测方法的人工标注的流程示意图；图3是根据本发明实施方式的基于预标注的目标检测方法的模型预标注的流程示意图；图4是根据本发明实施方式的基于预标注的目标检测方法的人工调整的流程示意图；图5是根据本发明实施方式的基于预标注的目标检测方法的第三目标检测模型的训练的流程示意图；图6是根据本发明实施方式的基于预标注的目标检测方法进行具体检测的流程示意图。

如图1至图6所示，本发明实施例提供一种基于预标注的目标检测方法，包括：

步骤S101：获取第一数据集，所述第一数据集为第一数量图片；

步骤S102：对所述第一数据集进行标注以获得第二数据集，所述对第一数据集进行标注包括对所述第一数量图片中待检测目标使用最大外接矩形框进行标注，所述第二数据集为图片文件与相应标注信息文件的集合；

步骤S103：根据预设配置参数将所述第二数据集作为训练数据集输入第一目标检测模型进行训练以得到第二目标检测模型；

所述预设配置参数包括训练时优化器初始学习率、学习率衰减方法、学习率更新方法；训练时输入图片尺寸的大小；训练时图像增强的方法；训练时计算损失值的各部分系数；训练时训练数据集遍历的轮数。

步骤S104：将第三数据集输入所述第二目标检测模型进行检测以得到第四数据集，所述第三数据集与第一数据集是同一分布的第二数量图片数据，所述第四数据集包含图片文件及其相应的检测结果信息文件的集合；

步骤S105：对第四数据集中检测结果进行置信度阈值过滤和非极大值抑制过滤得到第五数据集；

步骤S106：对所述第五数据集中的检测结果进行调整以得到第六数据集，所述调整包括新增所述第二目标检测模型未检测到的待检测目标、修改所述第二目标检测模型检测不准确的待检测目标以及删除所述第二目标检测模型检测错误的待检测目标，所述第六数据集为预标注结果；

步骤S107：将所述第二数据集和所述第六数据集作为训练数据集输入所述第二目标检测模型进行训练以得到第三目标检测模型，所述第三目标检测模型对第七数据集进行检测得到第八数据集，所述第七数据集是实时获取的图片，所述第八数据集是实时检测结果。

具体地，第一数量图片为少量图片，第二数量图片为大量图片。

首先通过对少量图片进行标注以获得第二数据集，将第二数据集作为训练数据集输入第一目标检测模型以初步得到一个第二目标检测模型。

其次，将大量图片输入第二目标检测模型进行检测以得到第四数据集，第四数据集中的数据进行置信度阈值过滤和非极大值抑制过滤得到第五数据集，将第五数据集进行调整得到第六数据，包括新增第二目标检测模型未检测到的待检测目标、修改所述第二目标检测模型检测不准确的待检测目标以及删除第二目标检测模型检测错误的待检测目标。

最后将第二数据集和第六数据集一起作为训练数据集输入第二目标检测模型进行训练后得到一个检测更为精准的第三目标检测模型。

在具体实施中，将图片数据输入第一目标检测模型，经过前向推理获得所述待检测目标的检测结果，使用所述检测结果与相应的标注文件中人工标注结果计算误差；若所述计算误差关于所述第一目标检测模型中权重参数的偏导数，则根据梯度下降算法利用所述偏导数对相应权重参数进行更新。

在具体实施中，所述模型训练是对所述模型中的权重参数进行更新包括使用前向推理、反向传播和梯度下降算法。

前向推理是指将第三数据集输入第二目标检测模型后，经过第二目标检测模型中每个模块的逐一运算，得到第四数据集的过程。反向传播是指将第二目标检测模型的输出的第四数据集与人工的标注结果计算偏差，利用偏差对第二目标检测模型中每个模块中的可学习参数计算偏导数，梯度下降是指利用所述偏导数对相应的可学习参数进行更新。

在具体实施中，所述第四数据集和所述第八数据集包括所述检测结果的类别、概率、位置和尺寸。

其中，类别是指所述检测结果的所属类别，概率是指所述检测结果是正确的可能性，位置和尺寸是指所述检测结果的边框在图片中的位置及大小。第三数据集输入第二目标检测模型之后，会得到相应的xml格式文件，其中包含第二目标检测模型对第三数据集中待检测目标的预测。第四数据集是将第三数据集中的图片逐个输入第二目标检测模型后得到的xml文件与相应输入图片文件集合。

在具体实施中，使用置信度阈值对所述第八数据集进行过滤得到第九数据集，保留所述第八数据集中预测概率大于所述置信度阈值的结果。

在具体实施中，使用非极大值抑制方法对所述第九数据集进行过滤得到第十数据集，根据所述第九数据集中检测结果的位置和尺寸计算所述第九数据集中检测结果之间的重叠度，重叠度大于第一预设阈值的多个检测结果中保留概率最大的检测结果。

在具体实施中，使用尺寸过滤对所述第十数据集进行过滤得到第十一数据集，将所述第十数据集中尺寸大于或小于第二预设阈值的所述检测结果进行过滤。

在具体实施中，使用数量过滤对所述第十一数据集进行过滤得到第十二数据集，将所述第十一数据集检测结果中类别数量小于第三预设阈值的所述检测结果的类别进行过滤。

在具体实施中，当所述第十二数据集中的包含所述待检测目标的图片数量和所述第七数据集为实时获取的多张现场图片数量的比值超过第四预设阈值时发出报警。

图7是根据本发明实施方式的基于预标注的目标检测装置的结构示意图，如图7所示，本发明实施例提供一种基于预标注的目标检测装置，包括：

数据集获取模块71，其用于获取第一数据集，所述第一数据集为第一数量图片；

数据集标注模块72，其用于对所述第一数据集进行标注以获得第二数据集，所述对第一数据集进行标注包括对所述第一数量图片中待检测目标使用最大外接矩形框进行标注，所述第二数据集为图片文件与相应标注信息文件的集合；

模型预训练模块73，其用于根据预设配置参数将所述第二数据集作为训练数据集输入第一目标检测模型进行训练以得到第二目标检测模型；

模型预标注模块74，其用于将第三数据集输入所述第二目标检测模型进行检测以得到第四数据集，所述第三数据集与第一数据集是同一分布的第二数量图片，所述第四数据集包含图片文件及其相应的检测结果信息文件的集合，对第四数据集中检测结果进行置信度阈值过滤和非极大值抑制过滤得到第五数据集；

数据集调整模块75，其用于对所述第五数据集中的检测结果进行调整以得到第六数据集，所述调整包括新增所述第二目标检测模型未检测到的待检测目标、修改所述第二目标检测模型检测不准确的待检测目标以及删除所述第二目标检测模型检测错误的待检测目标，所述第六数据集为预标注结果；

模型再训练模块76，其用于将所述第二数据集和所述第六数据集作为训练数据集输入所述第二目标检测模型进行重新训练以得到第三目标检测模型，所述第三目标检测模型对第七数据集进行检测得到第八数据集，所述第七数据集是实时获取的图片，所述第八数据集是实时检测结果。

综上所述，本申请公开的一种基于预标注的目标检测方法，包括：获取第一数据集，所述第一数据集为第一数量图片；对所述第一数据集进行标注以获得第二数据集，所述对第一数据集进行标注包括对所述第一数量图片中待检测目标使用最大外接矩形框进行标注，所述第二数据集为图片文件与相应标注信息文件的集合；根据预设配置参数将所述第二数据集作为训练数据集输入第一目标检测模型进行训练以得到第二目标检测模型；将第三数据集输入所述第二目标检测模型进行检测以得到第四数据集，所述第三数据集与第一数据集是同一分布的第二数量图片数据，所述第四数据集包含图片文件及其相应的检测结果信息文件的集合；对第四数据集中检测结果进行置信度阈值过滤和非极大值抑制过滤得到第五数据集；对所述第五数据集中的检测结果进行调整以得到第六数据集，所述调整包括新增所述第二目标检测模型未检测到的待检测目标、修改所述第二目标检测模型检测不准确的待检测目标以及删除所述第二目标检测模型检测错误的待检测目标，所述第六数据集为预标注结果；将所述第二数据集和所述第六数据集作为训练数据集输入所述第二目标检测模型进行训练以得到第三目标检测模型，所述第三目标检测模型对第七数据集进行检测得到第八数据集，所述第七数据集是实时获取的图片，所述第八数据集是实时检测结果，通过对数据集进行调整以获得预标注结果，从而不断优化目标检测模型，以提高目标检测精度；

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种基于预标注的目标检测方法，其特征在于，包括：

获取第一数据集，所述第一数据集为第一数量图片；

2.根据权利要求1所述的基于预标注的目标检测方法，其特征在于，将图片数据输入第一目标检测模型，经过前向推理获得所述待检测目标的检测结果，使用所述检测结果与相应的标注文件中人工标注结果计算误差；若所述计算误差关于所述第一目标检测模型中权重参数的偏导数，则根据梯度下降算法利用所述偏导数对相应权重参数进行更新。

3.根据权利要求2所述的基于预标注的目标检测方法，其特征在于，所述模型训练是对所述模型中的权重参数进行更新包括使用前向推理、反向传播和梯度下降算法。

4.根据权利要求1所述的基于预标注的目标检测方法，其特征在于，所述第四数据集和所述第八数据集包括检测结果的类别、概率、位置和尺寸。

5.根据权利要求4所述的基于预标注的目标检测方法，其特征在于，使用置信度阈值对所述第八数据集进行过滤得到第九数据集，保留所述第八数据集中预测概率大于所述置信度阈值的结果。

6.根据权利要求5所述的基于预标注的目标检测方法，其特征在于，使用非极大值抑制方法对所述第九数据集进行过滤得到第十数据集，根据所述第九数据集中检测结果的位置和尺寸计算所述第九数据集中检测结果之间的重叠度，重叠度大于第一预设阈值的多个检测结果中保留概率最大的检测结果。

7.根据权利要求6所述的基于预标注的目标检测方法，其特征在于，使用尺寸过滤对所述第十数据集进行过滤得到第十一数据集，将所述第十数据集中尺寸大于或小于第二预设阈值的所述检测结果进行过滤。

8.根据权利要求7所述的基于预标注的目标检测方法，其特征在于，使用数量过滤对所述第十一数据集进行过滤得到第十二数据集，将所述第十一数据集检测结果中类别数量小于第三预设阈值的所述检测结果的类别进行过滤。

9.根据权利要求1所述的基于预标注的目标检测方法，其特征在于，当所述第十二数据集中的包含所述待检测目标的图片数量和所述第七数据集为实时获取的多张现场图片数量的比值超过第四预设阈值时发出报警。

10.一种基于预标注的目标检测装置，其特征在于，包括：

模型预标注模块，其用于将第三数据集输入所述第二目标检测模型进行检测以得到第四数据集，所述第三数据集与第一数据集是同一分布的第二数量图片数据，所述第四数据集包含图片文件及其相应的检测结果信息文件的集合，对第四数据集中检测结果进行置信度阈值过滤和非极大值抑制过滤得到第五数据集；