CN112418264A - 检测模型的训练方法、装置、目标检测方法、设备和介质 - Google Patents
检测模型的训练方法、装置、目标检测方法、设备和介质 Download PDFInfo
- Publication number
- CN112418264A CN112418264A CN202011095394.5A CN202011095394A CN112418264A CN 112418264 A CN112418264 A CN 112418264A CN 202011095394 A CN202011095394 A CN 202011095394A CN 112418264 A CN112418264 A CN 112418264A
- Authority
- CN
- China
- Prior art keywords
- detection model
- image
- initial detection
- image set
- initial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 424
- 238000012549 training Methods 0.000 title claims abstract description 148
- 238000000034 method Methods 0.000 title claims abstract description 103
- 238000012512 characterization method Methods 0.000 claims abstract description 21
- 230000000052 comparative effect Effects 0.000 claims abstract description 5
- 239000013598 vector Substances 0.000 claims description 65
- 230000006870 function Effects 0.000 claims description 43
- 238000005457 optimization Methods 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 15
- 230000000694 effects Effects 0.000 description 8
- 238000005259 measurement Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 6
- 238000002372 labelling Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000016776 visual perception Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000004438 eyesight Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2155—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种检测模型的训练方法、装置、目标检测方法、设备和介质。所述检测模型的训练方法包括:获取第一图像集及第二图像集;第一图像集中的第一图像为带有目标标签的图像,第二图像集中的第二图像为无目标标签的图像;执行迭代训练操作;迭代训练操作:利用第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型,利用第一图像集和第二图像集,采用无监督的对比表征法对第一初始检测模型进行训练,得到第二初始检测模型;将第二初始检测模型作为新的初始检测模型,返回执行迭代训练操作,将达到预设的收敛条件时对应的第二初始检测模型确定为检测模型。采用本方法能够提高得到的检测模型的检测性能。
Description
技术领域
本申请涉及计算机视觉技术领域,特别是涉及一种检测模型的训练方法、装置、目标检测方法、设备和介质。
背景技术
目标检测是重要的视觉感知任务,通常目标检测具体可分为单阶段的有锚检测、双阶段的有锚检测以及单阶段的无锚检测,其中,单阶段的无锚检测实现简单,可以较快进行学习并部署,但是检测性能较低。
传统技术中,为了提升无锚检测的检测性能,通常是在分类任务上训练模型,由此得到性能较好的特征提取器,然后再在该特征提取器后连接相应的检测模块,实现目标检测。
然而,传统的提升无锚检测的检测性能的方法,存在目标检测准确度较低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高目标检测准确度的检测模型的训练方法、装置、目标检测方法、设备和介质。
一种检测模型的训练方法,所述方法包括:
获取第一图像集及第二图像集;所述第一图像集中的第一图像为带有目标标签的图像,所述第二图像集中的第二图像为无目标标签的图像;
执行迭代训练操作;所述迭代训练操作包括:利用所述第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型;
利用所述第一图像集和所述第二图像集,采用无监督的对比表征法对所述第一初始检测模型进行训练,得到第二初始检测模型;
将所述第二初始检测模型作为新的初始检测模型,返回执行所述迭代训练操作,直至达到预设的收敛条件,将达到所述预设的收敛条件时对应的第二初始检测模型确定为检测模型。
在其中一个实施例中,所述利用所述第一图像集和所述第二图像集,采用无监督的对比表征法对所述第一初始检测模型进行训练,得到第二初始检测模型,包括:
将所述第一图像以及所述第二图像同时输入所述第一初始检测模型,得到所述第一图像以及所述第二图像所对应的特征向量;
根据所述特征向量,得到所述第一初始检测模型的优化函数的值;
根据所述优化函数的值对所述第一初始检测模型进行训练,得到所述第二初始检测模型。
在其中一个实施例中,所述根据所述特征向量,得到所述第一初始检测模型的优化函数的值,包括:
根据所述特征向量,得到所述特征向量对应的度量向量;所述度量向量用于存储所述特征向量并更新所述特征向量;
根据所述特征向量和所述度量向量,得到所述第一初始检测模型的优化函数的值。
在其中一个实施例中,所述将所述第一图像以及所述第二图像同时输入所述第一初始检测模型,得到所述第一图像以及所述第二图像所对应的特征向量,包括:
将所述第一图像以及所述第二图像同时输入所述第一初始检测模型,得到所述第一图像以及所述第二图像对应的分类头热图;
统计所述分类头热图中峰值点的数量,根据所述分类头热图中峰值点的数量,得到所述第一图像以及所述第二图像所对应的特征向量。
在其中一个实施例中,所述利用所述第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型,包括:
将所述第一图像集中的图像输入所述初始检测模型,得到检测结果;
根据所述检测结果和所述第一图像集中各图像的目标标签,得到所述初始检测模型的损失函数的值;
根据所述损失函数的值对所述初始检测模型的参数进行调整,得到所述第一初始检测模型。
在其中一个实施例中,所述检测模型为无锚网络中的任一种网络。
一种目标检测方法,所述方法包括:
获取待检测图像;
将所述待检测图像输入检测模型,得到所述待检测图像中目标的检测结果;其中,所述检测模型为执行迭代训练操作得到的,所述迭代训练操作包括:利用带有目标标签的第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型,利用所述第一图像集和无目标标签的第二图像集,采用无监督的对比表征法对所述第一初始检测模型进行训练,得到第二初始检测模型,将第二初始检测模型作为新的初始检测模型,返回执行所述迭代训练操作,将达到预设的收敛条件时对应的第二初始检测模型确定为所述检测模型。
一种检测模型的训练装置,所述装置包括:
第一获取模块,用于获取第一图像集及第二图像集;所述第一图像集中的第一图像为带有目标标签的图像,所述第二图像集中的第二图像为无目标标签的图像;
操作模块,用于执行迭代训练操作;所述迭代训练操作包括:利用所述第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型,利用所述第一图像集和所述第二图像集,采用无监督的对比表征法对所述第一初始检测模型进行训练,得到第二初始检测模型;
确定模块,用于将所述第二初始检测模型作为新的初始检测模型,返回执行所述迭代训练操作,直至达到预设的收敛条件,将达到所述预设的收敛条件时对应的第二初始检测模型确定为检测模型。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取第一图像集及第二图像集;所述第一图像集中的第一图像为带有目标标签的图像,所述第二图像集中的第二图像为无目标标签的图像;
执行迭代训练操作;所述迭代训练操作包括:利用所述第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型,利用所述第一图像集和所述第二图像集,采用无监督的对比表征法对所述第一初始检测模型进行训练,得到第二初始检测模型;
将所述第二初始检测模型作为新的初始检测模型,返回执行所述迭代训练操作,直至达到预设的收敛条件,将达到所述预设的收敛条件时对应的第二初始检测模型确定为检测模型。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取第一图像集及第二图像集;所述第一图像集中的第一图像为带有目标标签的图像,所述第二图像集中的第二图像为无目标标签的图像;
执行迭代训练操作;所述迭代训练操作包括:利用所述第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型,利用所述第一图像集和所述第二图像集,采用无监督的对比表征法对所述第一初始检测模型进行训练,得到第二初始检测模型;
将所述第二初始检测模型作为新的初始检测模型,返回执行所述迭代训练操作,直至达到预设的收敛条件,将达到所述预设的收敛条件时对应的第二初始检测模型确定为检测模型。
上述检测模型的训练方法、装置、目标检测方法、设备和介质,通过获取带有目标标签的第一图像集和无目标标签的第二图像集,首先利用第一图像集采用监督学习的方法能够对预设的初始检测模型进行训练,得到第一初始检测模型,进而可以利用第一图像集和第二图像集,采用无监督的对比表征法对第一初始检测模型进行训练,得到第二初始检测模型,再将第二初始检测模型作为新的初始检测模型,通过重复执行该训练步骤,直至达到预设的收敛条件,将达到该预设的收敛条件时对应的第二初始检测模型确定为检测模型,这样在不改变计算量且无需额外的人工标注图像集的基础上,通过反复执行上述训练步骤,提高了得到的检测模型的检测性能,进而确保了利用该检测模型进行目标检测的准确度;另外,该训练方法是端到端并且是针对目标检测的训练方法,这样确保了得到的检测模型是针对目标检测的模型,进而可以利用得到的检测模型对目标进行准确地检测,提高了利用该检测模型进行目标检测的准确度。
附图说明
图1为一个实施例提供的计算机设备的内部结构示意图;
图2为一个实施例中检测模型的训练方法的流程示意图;
图3为另一个实施例中检测模型的训练方法的流程示意图;
图4为另一个实施例中检测模型的训练方法的流程示意图;
图5为一个实施例中目标检测方法的流程示意图;
图6为一个实施例中检测模型的训练装置的结构框图;
图7为一个实施例中目标检测装置的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的检测模型的训练方法、目标检测方法,可以适用于如图1所示的计算机设备。该计算机设备包括通过系统总线连接的处理器、存储器,该存储器中存储有计算机程序,处理器执行该计算机程序时可以执行下述方法实施例的步骤。可选的,该计算机设备还可以包括网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器,该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。可选的,该计算机设备可以是服务器,可以是个人计算机,还可以是个人数字助理,还可以是其他的终端设备,例如平板电脑、手机等等,还可以是云端或者远程服务器,本申请实施例对计算机设备的具体形式并不做限定。
目标检测是重要的视觉感知任务,具体可分为单阶段的有锚检测、双阶段的有锚检测以及单阶段的无锚检测,但是单阶段的有锚检测及双阶段的有锚检测需要大量的有标注的样本图像采用监督学习的方法对模型进行训练实现复杂,在应用中有一定困难,而单阶段的无锚检测实现简单,可以较快进行学习并部署,但是目标单阶段的无锚检测性能相较于有锚检测性能较低,最直接的提升模型性能的方法就是引入更多的训练数据,但是训练数据的标注成本较高,为了在低成本下提升检测模型的性能,通常采用无监督的训练方法对模型进行训练,但是,现有的无监督的训练方法都是在分类任务上训练模型,由此可以得到性能较好的特征提取器,然后再在该特征提取器后连接相应的检测模块,实现对目标的检测,但是该训练过程是分阶段的,不是端到端的,分类任务上通过无监督训练得到的特征提取器不一定是最适用于目标检测任务的,存在目标检测准确度较低的问题。为此,本申请提出一种检测模型的训练方法、装置、目标检测方法、设备和介质,旨在解决上述问题。
在一个实施例中,如图2所示,提供了一种检测模型的训练方法,以该方法应用于图1中的计算机设备为例进行说明,包括以下步骤:
S201,获取第一图像集及第二图像集;第一图像集中的第一图像为带有目标标签的图像,第二图像集中的第二图像为无目标标签的图像。
其中,第一图像集中的第一图像为带有目标标签的图像,也就是对第一图像集中的第一图像中的目标进行了标注,第一图像中的目标带有对应的目标标签;第二图像集中的第二图像为无目标标签的图像,也就是第二图像集中的第二图像中的目标无标注,第二图像中的目标没有对应的目标标签。具体地,计算机设备获取带有目标标签第一图像集和无目标标签的第二图像集。可选的,第一图像集可以为coco图像集,也可以为VOC图像集。可选的,计算机设备可以从网络上已公开的常用图像库中获取上述第一图像集和第二图像集。
S202,执行迭代训练操作;迭代训练操作包括:利用第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型,利用第一图像集和第二图像集,采用无监督的对比表征法对第一初始检测模型进行训练,得到第二初始检测模型。
具体地,计算机设备执行迭代训练操作,其中,该迭代训练操作包括:利用上述第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型,利用上述第一图像集和上述第二图像集,采用无监督的对比表征法对上述得到的第一初始检测模型进行训练,得到第二初始检测模型。可选的,初始检测模型可以为CenterNet模型。其中,采用监督学习的方法对预设的初始检测模型进行训练是指利用一组已知类别的样本调整初始检测模型的分类器的参数,使其达到所要求性能的过程;采用无监督的对比表征法对第一初始检测模型进行训练是指利用第二图像集中无目标标签的第二图像以及第一图像集中带有目标标签的第一图像对第一初始检测模型进行训练的过程。可以理解的是,上述迭代训练操作是利用第一图像集采用监督学习的方法对初始检测模型进行训练,得到第一初始检测模型,利用第一图像集和第二图像集,采用无监督的对比表征法对第一初始检测模型进行训练,得到第二初始检测模型是端到端的训练,并且该训练方法是直接在目标检测任务上进行,是适用于目标检测的。
S203,将第二初始检测模型作为新的初始检测模型,返回执行迭代训练操作,直至达到预设的收敛条件,将达到预设的收敛条件时对应的第二初始检测模型确定为检测模型。
具体地,计算机设备将上述得到的第二初始检测模型作为新的初始检测模型,返回执行上述迭代训练操作,直至达到预设的收敛条件,将达到预设的收敛条件时对应的第二初始检测模型确定为检测模型。可选的,预设的收敛条件可以为预设的迭代次数。可选的,检测模型为无锚网络中的任一种网络,可以理解的是,检测模型是采用监督学习的方法和无监督的对比表征法对初始检测模型共同训练得到的,因此,初始检测模型可以为无锚网络中的任一种网络,进而对初始检测模型进行训练得到的检测模型也为无锚网络中的任一种网络,示例性地,CenterNet即为无锚网络中的一种。
上述检测模型的训练方法中,计算机设备通过获取带有目标标签的第一图像集和无目标标签的第二图像集,首先利用第一图像集采用监督学习的方法能够对预设的初始检测模型进行训练,得到第一初始检测模型,进而可以利用第一图像集和第二图像集,采用无监督的对比表征法对第一初始检测模型进行训练,得到第二初始检测模型,再将第二初始检测模型作为新的初始检测模型,通过重复执行该训练步骤,直至达到预设的收敛条件,将达到该预设的收敛条件时对应的第二初始检测模型确定为检测模型,这样在不改变计算量且无需额外的人工标注图像集的基础上,通过反复执行上述训练步骤,提高了得到的检测模型的检测性能,进而确保了利用该检测模型进行目标检测的准确度;另外,该训练方法是端到端并且是针对目标检测的训练方法,这样确保了得到的检测模型是针对目标检测的模型,进而可以利用得到的检测模型对目标进行准确地检测,提高了利用该检测模型进行目标检测的准确度。
在上述计算机设备利用第一图像集和第二图像集,采用无监督的对比表征法对第一初始检测模型进行训练,得到第二初始检测模型的场景中,计算机设备可以根据得到的第一初始检测模型的优化函数对第一初始检测模型进行训练,得到第二初始检测模型,在一个实施例中,如图3所示,上述S202中利用第一图像集和第二图像集,采用无监督的对比表征法对第一初始检测模型进行训练,得到第二初始检测模型,包括:
S301,将第一图像以及第二图像同时输入第一初始检测模型,得到第一图像以及第二图像所对应的特征向量。
具体地,计算机设备将上述第一图像集中的第一图像以及第二图像集中的第二图像同时输入上述第一初始检测模型,得到第一图像以及第二图像所对应的特征向量。可选的,计算机设备可以将上述第一图像和第二图像同时输入上述第一初始检测模型,得到上述第一图像以及上述第二图像对应的分类头热图,统计该分类头热图中峰值点的数量,根据该分类头热图中峰值点的数量,得到第一图像以及第二图像所对应的特征向量。
S302,根据特征向量,得到第一初始检测模型的优化函数的值。
具体地,计算机设备根据上述得到的第一图像以及第二图像所对应的特征向量,得到上述第一初始检测模型的优化函数的值。可选的,计算机设备可以根据第一图像以及第二图像所对应的特征向量,得到该特征向量对应的度量向量,根据上述特征向量和得到的度量向量,得到第一初始检测模型的优化函数的值。其中,度量向量用于存储第一图像以及第二图像所对应的特征向量并更新该特征向量。示例性地,假设计算机设备将第一图像以及第二图像同时输入第一初始检测模型,得到第一图像以及第二图像对应的分类头热图上的峰值点,并由此得到该分类头热图在第一初始检测模型中特征图上对应的特征向量为[v1,v2,L,vN]N×C,其中,N为第一图像以及第二图像对应的分类头热图中峰值点的数量,C为特征图对应的通道数,则计算机设备首先利用该特征向量[v1,v2,L,vN]N×C更新度量向量(其中,度量向量中的元素初始值为0),然后对这些特征向量用对比表征损失进行差异最大化,得到优化函数为:式中,可选的,计算机设备可以采用下述公式更新度量向量:式中,β为衰减系数。
S303,根据优化函数的值对第一初始检测模型进行训练,得到第二初始检测模型。
具体地,计算机设备根据上述得到的第一初始检测模型的优化函数的值,对第一初始检测模型进行训练,得到第二初始检测模型。可以理解的是,第一初始检测模型的优化函数即为第一初始检测模型的损失函数,计算机设备可以将优化函数的值达到稳定值或最小值时将对应的第一初始检测模型确定为第二初始检测模型。
本实施例中,计算机设备通过将第一图像以及第二图像同时输入第一初始检测模型,能够得到第一图像以及第二图像所对应的特征向量,由于得到的特征向量是根据第一图像和第二图像共同得到的,这样得到的特征向量的准确度较高,进而计算机设备可以根据第一图像以及第二图像所对应的特征向量,准确地得到第一初始检测模型的优化函数的值,这样计算机设备可以根据得到的第一初始检测模型的优化函数的值对第一初始检测模型进行准确地训练,从而可以得到准确度较高的第二初始检测模型,提高了得到的第二初始检测模型的准确度。
在上述计算机设备利用第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型的场景中,计算机设备可以得到初始检测模型的损失函数的值对初始检测模型进行训练,得到第一初始检测模型,在一个实施例中,如图4所示,上述S202中利用第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型,包括:
S401,将第一图像集中的图像输入初始检测模型,得到检测结果。
具体地,计算机设备将上述第一图像集中的图像输入上述初始检测模型,得到对该第一图像集中的图像的检测结果。示例性地,第一图像集中的图像若为足球场上对应的图像,则计算机设备将该图像输入初始检测模型,得到的该图像的检测结果可以为足球,也可以为人。
S402,根据检测结果和第一图像集中各图像的目标标签,得到初始检测模型的损失函数的值。
具体地,计算机设备根据上述得到的检测结果和第一图像集中各图像的目标标签,得到初始检测模型的损失函数的值。可选的,计算机可以将上述得到的检测结果和第一图像集中各图像的目标标签进行比较,得到初始检测模型的损失函数的值。
S403,根据损失函数的值对初始检测模型的参数进行调整,得到第一初始检测模型。
具体地,计算机设备根据得到的初始检测模型的损失函数的值对上述初始检测模型的参数进行调整,得到第一初始检测模型。可选的,计算机设备可以根据初始检测模型的损失函数的值对初始检测模型的参数进行调整,当初始检测模型的损失函数的值达到稳定值或最小值时,得到上述第一初始检测模型。
本实施例中,计算机设备将第一图像集中的图像输入初始检测模型,能够通过该初始检测模型,准确地得到第一图像集中各图像的检测结果,进而可以根据该检测结果和第一图像集中各图像的目标标签,准确地得到初始检测模型的损失函数的值,这样可以根据初始检测模型的损失函数的值对初始检测模型的参数进行准确地调整,从而得到准确度较高的第一初始检测模型,提高了得到的第一初始检测模型的准确度。
在一个实施例中,如图5所示,提供了一种目标检测方法,以该方法应用于图1中的计算机设备为例进行说明,包括以下步骤:
S501,获取待检测图像。
具体地,计算机设备获取待检测图像。可选的,计算机设备可以实时采集待检测图像,也可以从预设的数据库中获取该待检测图像。可选的,待检测图像可以为十字路口的图像,也可以为足球场的图像等等。
S502,将待检测图像输入检测模型,得到待检测图像中目标的检测结果;其中,检测模型为执行迭代训练操作得到的,迭代训练操作包括:利用带有目标标签的第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型,利用第一图像集和无目标标签的第二图像集,采用无监督的对比表征法对第一初始检测模型进行训练,得到第二初始检测模型,将第二初始检测模型作为新的初始检测模型,返回执行迭代训练操作,将达到预设的收敛条件时对应的第二初始检测模型确定为检测模型。
具体地,计算机设备将上述待检测图像输入检测模型,得到上述待检测图像中目标的检测结果。其中,该检测模型为执行迭代训练操作得到的,迭代训练操作包括:利用带有目标标签的第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型,利用第一图像集和无目标标签的第二图像集,采用无监督的对比表征法对第一初始检测模型进行训练,得到第二初始检测模型,将第二初始检测模型作为新的初始检测模型,返回执行该迭代训练操作,将达到预设的收敛条件时对应的第二初始检测模型确定为上述检测模型。可选的,该检测模型可以为无锚网络中的任一种网络。其中,采用监督学习的方法对预设的初始检测模型进行训练是指利用一组已知类别的样本调整初始检测模型的分类器的参数,使其达到所要求性能的过程;利用第一图像集和无目标标签的第二图像集,采用无监督的对比表征法对第一初始检测模型进行训练是指利用第二图像集中无目标标签的第二图像以及第一图像集中带有目标标签的第一图像对第一初始检测模型进行训练的过程。
本实施例中,由于检测模型是通过迭代训练操作得到的,而迭代训练操作包括利用带有目标标签的第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型,利用第一图像集和无目标标签的第二图像集,采用无监督的对比表征法对第一初始检测模型进行训练,得到第二初始检测模型,将第二初始检测模型作为新的初始检测模型,返回执行迭代训练操作,将达到预设的收敛条件时对应的第二初始检测模型确定为检测模型,通过该训练过程,计算机设备能够得到准确度较高的检测模型,提高了得到的检测模型的准确度,进而可以利用该检测模型对待检测图像中的目标进行准确地检测,从而得到准确度较高的检测结果。
为了便于本领域技术人员的理解,以下对本申请提供的目标检测方法进行详细介绍,该方法可以包括:
S601,获取第一图像集及第二图像集;第一图像集中的第一图像为带有目标标签的图像,第二图像集中的第二图像为无目标标签的图像。
S602,将第一图像集中的图像输入初始检测模型,得到检测结果。
S603,根据检测结果和第一图像集中各图像的目标标签,得到初始检测模型的损失函数的值。
S604,根据损失函数的值对初始检测模型的参数进行调整,得到第一初始检测模型。
S605,将第一图像以及第二图像同时输入第一初始检测模型,得到第一图像以及第二图像对应的分类头热图。
S606,统计分类头热图中峰值点的数量,根据分类头热图中峰值点的数量,得到第一图像以及第二图像所对应的特征向量。
S607,根据特征向量,得到特征向量对应的度量向量;度量向量用于存储特征向量并更新特征向量。
S608,根据特征向量和度量向量,得到第一初始检测模型的优化函数的值,根据优化函数的值对第一初始检测模型进行训练,得到第二初始检测模型。
S609,将第二初始检测模型作为新的初始检测模型,返回执行上述S602-S608,直至达到预设的收敛条件,将达到预设的收敛条件时对应的第二初始检测模型确定为检测模型;其中,检测模型为无锚网络中的任一种网络。
S610,获取待检测图像。
S611,将待检测图像输入检测模型,得到待检测图像中目标的检测结果。
需要说明的是,针对上述S601-S611中的描述可以参见上述实施例中相关的描述,且其效果类似,本实施例在此不再赘述。
应该理解的是,虽然图2-5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-5中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图6所示,提供了一种检测模型的训练装置,包括:第一获取模块、操作模块和确定模块,其中:
第一获取模块,用于获取第一图像集及第二图像集;第一图像集中的第一图像为带有目标标签的图像,第二图像集中的第二图像为无目标标签的图像。
操作模块,用于执行迭代训练操作;迭代训练操作包括:利用第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型,利用第一图像集和第二图像集,采用无监督的对比表征法对第一初始检测模型进行训练,得到第二初始检测模型。
确定模块,用于将第二初始检测模型作为新的初始检测模型,返回执行迭代训练操作,直至达到预设的收敛条件,将达到预设的收敛条件时对应的第二初始检测模型确定为检测模型。
可选的,检测模型为无锚网络中的任一种网络。
本实施例提供的检测模型的训练装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
在上述实施例的基础上,可选的,上述操作模块包括:第一获取单元、第二获取单元和第一训练单元,其中:
第一获取单元,用于将第一图像以及第二图像同时输入第一初始检测模型,得到第一图像以及第二图像所对应的特征向量。
第二获取单元,用于根据特征向量,得到第一初始检测模型的优化函数的值。
第一训练单元,用于根据优化函数的值对第一初始检测模型进行训练,得到第二初始检测模型。
本实施例提供的检测模型的训练装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
在上述实施例的基础上,可选的,上述第二获取单元,具体用于根据特征向量,得到特征向量对应的度量向量;度量向量用于存储特征向量并更新特征向量;根据特征向量和度量向量,得到第一初始检测模型的优化函数的值。
本实施例提供的检测模型的训练装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
在上述实施例的基础上,可选的,上述第一获取单元,具体用于将第一图像以及第二图像同时输入第一初始检测模型,得到第一图像以及第二图像对应的分类头热图;统计分类头热图中峰值点的数量,根据分类头热图中峰值点的数量,得到第一图像以及第二图像所对应的特征向量。
本实施例提供的检测模型的训练装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
在上述实施例的基础上,可选的,上述操作模块还包括:第三获取单元、第四获取单元和第二训练单元,其中:
第三获取单元,用于将第一图像集中的图像输入初始检测模型,得到检测结果。
第四获取单元,用于根据检测结果和第一图像集中各图像的目标标签,得到初始检测模型的损失函数的值。
第二训练单元,用于根据损失函数的值对初始检测模型的参数进行调整,得到第一初始检测模型。
本实施例提供的检测模型的训练装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
关于检测模型的训练装置的具体限定可以参见上文中对于检测模型的训练方法的限定,在此不再赘述。上述检测模型的训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,如图7所示,提供了一种目标检测装置,包括:第二获取模块和检测模块,其中:
第二获取模块,用于获取待检测图像。
检测模块,用于将待检测图像输入检测模型,得到待检测图像中目标的检测结果;其中,检测模型为执行迭代训练操作得到的,迭代训练操作包括:利用带有目标标签的第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型,利用第一图像集和无目标标签的第二图像集,采用无监督的对比表征法对第一初始检测模型进行训练,得到第二初始检测模型,将第二初始检测模型作为新的初始检测模型,返回执行迭代训练操作,将达到预设的收敛条件时对应的第二初始检测模型确定为检测模型。
关于目标检测装置的具体限定可以参见上文中对于目标检测方法的限定,在此不再赘述。上述目标检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取第一图像集及第二图像集;第一图像集中的第一图像为带有目标标签的图像,第二图像集中的第二图像为无目标标签的图像;
执行迭代训练操作;迭代训练操作包括:利用第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型,利用第一图像集和第二图像集,采用无监督的对比表征法对第一初始检测模型进行训练,得到第二初始检测模型;
将第二初始检测模型作为新的初始检测模型,返回执行迭代训练操作,直至达到预设的收敛条件,将达到预设的收敛条件时对应的第二初始检测模型确定为检测模型。
上述实施例提供的计算机设备,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取第一图像集及第二图像集;第一图像集中的第一图像为带有目标标签的图像,第二图像集中的第二图像为无目标标签的图像;
执行迭代训练操作;迭代训练操作包括:利用第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型,利用第一图像集和第二图像集,采用无监督的对比表征法对第一初始检测模型进行训练,得到第二初始检测模型;
将第二初始检测模型作为新的初始检测模型,返回执行迭代训练操作,直至达到预设的收敛条件,将达到预设的收敛条件时对应的第二初始检测模型确定为检测模型。
上述实施例提供的计算机可读存储介质,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种检测模型的训练方法,其特征在于,所述方法包括:
获取第一图像集及第二图像集;所述第一图像集中的第一图像为带有目标标签的图像,所述第二图像集中的第二图像为无目标标签的图像;
执行迭代训练操作;所述迭代训练操作包括:利用所述第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型,利用所述第一图像集和所述第二图像集,采用无监督的对比表征法对所述第一初始检测模型进行训练,得到第二初始检测模型;
将所述第二初始检测模型作为新的初始检测模型,返回执行所述迭代训练操作,直至达到预设的收敛条件,将达到所述预设的收敛条件时对应的第二初始检测模型确定为检测模型。
2.根据权利要求1所述的方法,其特征在于,所述利用所述第一图像集和所述第二图像集,采用无监督的对比表征法对所述第一初始检测模型进行训练,得到第二初始检测模型,包括:
将所述第一图像以及所述第二图像同时输入所述第一初始检测模型,得到所述第一图像以及所述第二图像所对应的特征向量;
根据所述特征向量,得到所述第一初始检测模型的优化函数的值;
根据所述优化函数的值对所述第一初始检测模型进行训练,得到所述第二初始检测模型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述特征向量,得到所述第一初始检测模型的优化函数的值,包括:
根据所述特征向量,得到所述特征向量对应的度量向量;所述度量向量用于存储所述特征向量并更新所述特征向量;
根据所述特征向量和所述度量向量,得到所述第一初始检测模型的优化函数的值。
4.根据权利要求2所述的方法,其特征在于,所述将所述第一图像以及所述第二图像同时输入所述第一初始检测模型,得到所述第一图像以及所述第二图像所对应的特征向量,包括:
将所述第一图像以及所述第二图像同时输入所述第一初始检测模型,得到所述第一图像以及所述第二图像对应的分类头热图;
统计所述分类头热图中峰值点的数量,根据所述分类头热图中峰值点的数量,得到所述第一图像以及所述第二图像所对应的特征向量。
5.根据权利要求1所述的方法,其特征在于,所述利用所述第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型,包括:
将所述第一图像集中的图像输入所述初始检测模型,得到检测结果;
根据所述检测结果和所述第一图像集中各图像的目标标签,得到所述初始检测模型的损失函数的值;
根据所述损失函数的值对所述初始检测模型的参数进行调整,得到所述第一初始检测模型。
6.根据权利要求1所述的方法,其特征在于,所述检测模型为无锚网络中的任一种网络。
7.一种目标检测方法,其特征在于,所述方法包括:
获取待检测图像;
将所述待检测图像输入检测模型,得到所述待检测图像中目标的检测结果;其中,所述检测模型为执行迭代训练操作得到的,所述迭代训练操作包括:利用带有目标标签的第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型,利用所述第一图像集和无目标标签的第二图像集,采用无监督的对比表征法对所述第一初始检测模型进行训练,得到第二初始检测模型,将第二初始检测模型作为新的初始检测模型,返回执行所述迭代训练操作,将达到预设的收敛条件时对应的第二初始检测模型确定为所述检测模型。
8.一种检测模型的训练装置,其特征在于,所述装置包括:
第一获取模块,用于获取第一图像集及第二图像集;所述第一图像集中的第一图像为带有目标标签的图像,所述第二图像集中的第二图像为无目标标签的图像;
操作模块,用于执行迭代训练操作;所述迭代训练操作包括:利用所述第一图像集,采用监督学习的方法对预设的初始检测模型进行训练,得到第一初始检测模型,利用所述第一图像集和所述第二图像集,采用无监督的对比表征法对所述第一初始检测模型进行训练,得到第二初始检测模型;
确定模块,用于将所述第二初始检测模型作为新的初始检测模型,返回执行所述迭代训练操作,直至达到预设的收敛条件,将达到所述预设的收敛条件时对应的第二初始检测模型确定为检测模型。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011095394.5A CN112418264B (zh) | 2020-10-14 | 2020-10-14 | 检测模型的训练方法、装置、目标检测方法、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011095394.5A CN112418264B (zh) | 2020-10-14 | 2020-10-14 | 检测模型的训练方法、装置、目标检测方法、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112418264A true CN112418264A (zh) | 2021-02-26 |
CN112418264B CN112418264B (zh) | 2025-01-21 |
Family
ID=74854461
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011095394.5A Active CN112418264B (zh) | 2020-10-14 | 2020-10-14 | 检测模型的训练方法、装置、目标检测方法、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112418264B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113065609A (zh) * | 2021-04-22 | 2021-07-02 | 平安国际智慧城市科技股份有限公司 | 图像分类方法、装置、电子设备及可读存储介质 |
CN114445682A (zh) * | 2022-01-28 | 2022-05-06 | 北京百度网讯科技有限公司 | 训练模型的方法、装置、电子设备、存储介质及产品 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180053057A1 (en) * | 2016-08-18 | 2018-02-22 | Xerox Corporation | System and method for video classification using a hybrid unsupervised and supervised multi-layer architecture |
CN109598331A (zh) * | 2018-12-04 | 2019-04-09 | 北京芯盾时代科技有限公司 | 一种欺诈识别模型训练方法、欺诈识别方法及装置 |
CN111222648A (zh) * | 2020-01-15 | 2020-06-02 | 深圳前海微众银行股份有限公司 | 半监督机器学习优化方法、装置、设备及存储介质 |
CN111611880A (zh) * | 2020-04-30 | 2020-09-01 | 杭州电子科技大学 | 一种基于神经网络无监督对比学习的高效行人重识别方法 |
-
2020
- 2020-10-14 CN CN202011095394.5A patent/CN112418264B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180053057A1 (en) * | 2016-08-18 | 2018-02-22 | Xerox Corporation | System and method for video classification using a hybrid unsupervised and supervised multi-layer architecture |
CN109598331A (zh) * | 2018-12-04 | 2019-04-09 | 北京芯盾时代科技有限公司 | 一种欺诈识别模型训练方法、欺诈识别方法及装置 |
CN111222648A (zh) * | 2020-01-15 | 2020-06-02 | 深圳前海微众银行股份有限公司 | 半监督机器学习优化方法、装置、设备及存储介质 |
CN111611880A (zh) * | 2020-04-30 | 2020-09-01 | 杭州电子科技大学 | 一种基于神经网络无监督对比学习的高效行人重识别方法 |
Non-Patent Citations (1)
Title |
---|
苟泽中;许华;郑万泽;冯磊;白?远;: "基于半监督联合神经网络的调制识别算法", 信号处理, no. 02, 25 February 2020 (2020-02-25) * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113065609A (zh) * | 2021-04-22 | 2021-07-02 | 平安国际智慧城市科技股份有限公司 | 图像分类方法、装置、电子设备及可读存储介质 |
CN113065609B (zh) * | 2021-04-22 | 2024-04-09 | 深圳赛安特技术服务有限公司 | 图像分类方法、装置、电子设备及可读存储介质 |
CN114445682A (zh) * | 2022-01-28 | 2022-05-06 | 北京百度网讯科技有限公司 | 训练模型的方法、装置、电子设备、存储介质及产品 |
Also Published As
Publication number | Publication date |
---|---|
CN112418264B (zh) | 2025-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhao et al. | Alike: Accurate and lightweight keypoint detection and descriptor extraction | |
CN111667001B (zh) | 目标重识别方法、装置、计算机设备和存储介质 | |
CN110163889A (zh) | 目标跟踪方法、目标跟踪装置、目标跟踪设备 | |
CN110765882B (zh) | 一种视频标签确定方法、装置、服务器及存储介质 | |
CN111666922A (zh) | 视频匹配方法、装置、计算机设备和存储介质 | |
CN111612822B (zh) | 对象跟踪方法、装置、计算机设备和存储介质 | |
US11017296B2 (en) | Classifying time series image data | |
CN111322716B (zh) | 空调温度自动设置方法、空调、设备及存储介质 | |
CN113218537B (zh) | 温度异常检测模型的训练方法、装置、设备和存储介质 | |
CN110648363A (zh) | 相机姿态确定方法、装置、存储介质及电子设备 | |
CN110049309A (zh) | 视频流中图像帧的稳定性检测方法和装置 | |
WO2021253789A1 (zh) | 重定位效果的评价方法、装置、电子设备和存储介质 | |
CN112418264B (zh) | 检测模型的训练方法、装置、目标检测方法、设备和介质 | |
CN108198172A (zh) | 图像显著性检测方法和装置 | |
JP2021530773A (ja) | 画像に基づく関係分析の方法およびそのシステム | |
CN110738687A (zh) | 对象跟踪方法、装置、设备及存储介质 | |
CN110084155A (zh) | 一种密集人数计数的方法、装置、设备以及存储介质 | |
CN110111341B (zh) | 图像前景获取方法、装置及设备 | |
CN114549849A (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
CN111127432B (zh) | 一种医学图像检测方法、装置、设备及存储介质 | |
CN101894369A (zh) | 从图像序列中计算摄像机焦距的实时方法 | |
WO2022044297A1 (ja) | 情報処理方法、情報処理装置及び情報処理プログラム | |
CN112329916A (zh) | 模型训练方法、装置、计算机设备及存储介质 | |
CN112329915B (zh) | 模型训练方法、装置、计算机设备和存储介质 | |
CN116310899A (zh) | 基于YOLOv5改进的目标检测方法及装置、训练方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |