Nothing Special   »   [go: up one dir, main page]

CN115512391A - 数据自适应重采样的目标检测模型训练方法、装置及设备 - Google Patents

数据自适应重采样的目标检测模型训练方法、装置及设备 Download PDF

Info

Publication number
CN115512391A
CN115512391A CN202211201800.0A CN202211201800A CN115512391A CN 115512391 A CN115512391 A CN 115512391A CN 202211201800 A CN202211201800 A CN 202211201800A CN 115512391 A CN115512391 A CN 115512391A
Authority
CN
China
Prior art keywords
training
data set
target detection
detection model
sample data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211201800.0A
Other languages
English (en)
Other versions
CN115512391B (zh
Inventor
陈瑞斌
肖兵
李正国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Shixi Technology Co Ltd
Original Assignee
Zhuhai Shixi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Shixi Technology Co Ltd filed Critical Zhuhai Shixi Technology Co Ltd
Priority to CN202211201800.0A priority Critical patent/CN115512391B/zh
Publication of CN115512391A publication Critical patent/CN115512391A/zh
Application granted granted Critical
Publication of CN115512391B publication Critical patent/CN115512391B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/107Static hand or arm
    • G06V40/113Recognition of static hand signs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了数据自适应重采样的目标检测模型训练方法、装置及设备,所述方法包括:获取与预先根据业务场景建立的目标检测模型的基础样本数据集;从所述基础样本数据集中进行样本随机筛选得到第一训练数据集,利用所述第一训练数据集训练所述目标检测模型;基于所述基础样本数据集进行模型先验自适应采样得到第二训练数据集,利用所述第二训练数据集训练所述目标检测模型。本发明通过将目标检测模型的模型训练分为两个阶段,能够根据当前模型的预测效果自适应采样对其有益的训练数据,既能减少冗余训练数据,提升训练效率,又能保证训练精度,提升模型鲁棒性。

Description

数据自适应重采样的目标检测模型训练方法、装置及设备
技术领域
本发明涉及图像处理技术领域,特别是数据自适应重采样的目标检测模型训练方法、装置及设备。
背景技术
在深度学习分类任务中,经常遇到数据不均衡的问题。这会导致训练模型预测倾向于数据量多的类别。目前多采用以下两种方法:方法一:对量多的数据进行下采样,使其数量接近平均数。但是,下采样容易使部分数据丢失,如果丢失部分为重要数据,容易导致模型对局部数据过拟合。方法二,对量少的数据进行离线增广,使其数量接近平均数。常规的增广为:色域增广,空间增广和噪声增广。这些增广方法虽然能达到数据均衡,但具有以下缺点:1.离线增广增加整体训练数据量,使训练时间变长;2.如只采用离线增广,随机性不如在线增广。如采用离线与在线混合增广,多次增广可能导致增广过度;3.增广的数据并不能真正地丰富数据的多样性,可能导致模型对数据过拟合。
发明内容
鉴于上述问题,本发明提出一种克服上述问题或者至少部分地解决上述问题的数据自适应重采样的目标检测模型训练方法及装置。
根据本发明的第一方面,提供了一种数据自适应重采样的目标检测模型训练方法,所述方法包括:
获取与预先根据业务场景建立的目标检测模型的基础样本数据集;
从所述基础样本数据集中进行样本随机筛选得到第一训练数据集,利用所述第一训练数据集训练所述目标检测模型;
基于所述基础样本数据集进行模型先验自适应采样得到第二训练数据集,利用所述第二训练数据集训练所述目标检测模型。
可选地,所述利用所述第一训练数据集训练所述目标检测模型之后,所述方法还包括:
统计利用所述第一训练数据集训练所述目标检测模型的训练次数,若所述训练次数大于预先设置的固定迭代次数,则停止利用所述第一训练数据集训练所述目标检测模型;或,
获取所述目标检测模型的训练精度,若所述训练精度达到预先设置的目标精度,则停止利用所述第一训练数据集训练所述目标检测模型。
可选地,所述基于所述基础样本数据集进行模型先验自适应采样得到第二训练数据集,利用所述第二训练数据集训练所述目标检测模型包括:
利用经由所述第一训练数据集训练后的目标检测模型对所述基础样本数据集中各样本数据进行目标检测,并根据检测结果进行数据筛选得到第二训练数据集;
利用所述第二训练数据集训练所述目标检测模型;
依据所述目标检测模型的模型训练数据判断所述目标检测模型是否符合预设重采样条件;
若判断所述目标检测模型符合预设重采样条件,则基于所述基础样本数据集进行重采样以更新所述第二训练数据集;
利用更新后的所述第二训练数据集训练所述目标检测模型。
可选地,所述依据所述目标检测模型的模型训练数据判断所述目标检测模型是否符合预设重采样条件包括:
判断所述目标检测模型的训练轮数是否满足预设重采样周期,若是,则判断所述目标检测模型符合预设重采样条件;若否,则判断所述目标检测模型不符合预设重采样条件;或,
依据所述目标检测模型的精度波动程度是否稳定,若稳定,则判断所述目标检测模型符合预设重采样条件;若不稳定,则判断所述目标检测模型不符合预设重采样条件。
可选地,所述基于所述基础样本数据集进行重采样以更新所述第二训练数据集包括:
计算所述基础样本数据集中各样本数据对应的数据采样概率;
基于各样本数据对应的数据采样概率在所述基于所述基础样本数据集进行重采样以更新第二训练数据集。
可选地,所述计算所述基础样本数据集中各样本数据对应的数据采样概率包括:
获取所述目标检测模型对所述基础样本数据集中任一样本数据的预测结果;
计算各所述样本数据对应的数据采样概率的超参数;
基于所述预测结果和所述超参数计算各所述样本数据对应的数据采样概率。
可选地,基于所述预测结果和所述超参数计算各所述样本数据对应的数据采样概率包括:
获取所述基础样本数据集中各样本数据的预测结果;
获取采样总数的数学期望;
基于所述各样本数据的预测结果和所述采样总数的数学期望计算各所述样本数据对应的数据采样概率。
可选地,通过以下方式计算所述基础样本数据集中各样本数据对应的数据采样概率:
S=(1-P)γ
其中,S为样本的采样概率;P为样本的预测结果;γ为采样概率的超参数。
可选地,通过以下方式计算各所述样本数据对应的数据采样概率:
Figure BDA0003872677930000031
其中,Pi为第i个样本的采样概率,原样本总数为n,则Nexp(Nexp≤n)为数学期望。
可选地,所述获取所述基础样本数据集中各样本数据的预测结果包括:
获取所述基础样本数据集的样本总数,并将所述样本总数划分为多个样本组,计算各所述样本组对应的参考预测结果。
可选地,所述基于所述各样本数据的预测结果和所述采样总数的数学期望计算各所述样本数据对应的数据采样概率包括:
基于所述各所述样本组对应的参考预测结果和所述采样总数的数学期望计算各所述样本数据对应的数据采样概率。
根据本发明的第二方面,提供了一种数据自适应重采样的目标检测模型训练装置,所述装置包括:
数据集获取模块,用于获取与预先根据业务需求建立的目标检测模型的基础样本数据集;
第一训练模块,用于从所述基础样本数据集中进行样本随机筛选得到第一训练数据集,利用所述第一训练数据集训练所述目标检测模型;
第二训练模块,用于基于所述第一训练数据集进行自适应采样得到第二训练数据集,利用所述第二训练数据集训练所述目标检测模型。
根据本发明的第三方面,提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面中任一项所述的方法。
根据本发明的第四方面,提供了一种计算设备,所述计算设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面中任一项所述的方法。
根据本发明的第五方面,提供了一种图像采集设备,所述图像采集设备执行第一方面中任一项所述的方法,或包括第二方面所述的数据自适应重采样的目标检测模型训练装置,或具有根据第三方面所述的非暂时性计算机可读存储介质。
本发明提供了数据自适应重采样的目标检测模型训练方法、装置及设备,在获取到用于训练目标检测模型的基础样本数据集之后,先进行随机选取以得到第一训练数据集对目标检测模型第一阶段的模型训练,进而进行模型先验后再选取第二训练数据集对目标检测模型进行第二阶段的模型训练,通过将目标检测模型的模型训练分为两个阶段,能够根据当前模型的预测效果自适应采样对其有益的训练数据,既能减少冗余训练数据,提升训练效率,又能保证训练精度,提升模型鲁棒性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明实施例的数据自适应重采样的目标检测模型训练方法流程示意图;
图2示出了根据本发明实施例的,
图3示出了根据本发明实施例的目标检测模型的模型检测结果与数据采样概率关系示意图;
图4示出了根据本发明实施例的数据自适应重采样的目标检测模型训练装置结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种数据自适应重采样的目标检测模型训练方法,如图1所示,本发明实施例提供的数据自适应重采样的目标检测模型训练方法至少可以包括以下步骤S101~S103。
S101,获取与预先根据业务场景建立的目标检测模型的基础样本数据集。
本实施例的业务场景是类似于手势检测、人像检测等等具体的业务应用场景,根据业务场景的需求可以预先建立对应的目标检测模型,建立目标检测模型时,可以采用神经网络(如卷积神经网络CNN)进行建立。本实施例的基础样本数据集是用于训练目标检测模型的数据集,根据目标检测模型的应用场景不同,基础样本数据集中所包含的样本数据也不相同。本实施例中以目标检测模型为静态手势检测模型为例,基础样本数据集中包含了大量的采集图像作为样本数据,目标检测模型可以对样本数据中包含的手势进行分类识别。举例来讲:正类手势为one(手势1)、five(手势5)、yeah、three、heartSingle、ok、six、iloveyou、gun和thumbup,任何不属于以上类别的手势归类为负类手势others。
S102,从基础样本数据集中进行样本随机筛选得到第一训练数据集,利用第一训练数据集训练目标检测模型。
在本实施例中,在目标检测模型的训练初期,先基于基础样本数据集进行随机采样,随机采样结束后进行迭代训练,这一过程为目标检测模型的预热期(warmup),预热期训练结束后,会进入步骤S103的训练阶段,为精分期(refine)。本实施例中,基于基础样本数据集进行随机采样所生成的第一训练数据集的数据量可以预先设置,利用第一训练数据集进行目标检测模型训练时,可以采用交叉验证法,即将第一训练数据集划分为训练集和验证集,在训练集上进行训练;在验证集上进行验证;模型可以保存最优的权重,并读取权重;记录下训练集和验证集的精度,便于调参。
可选地,本实施例中可以采用以下两种方式确认利用第一训练数据集训练目标检测模型的结束时机。
第一种方式:
统计利用第一训练数据集训练目标检测模型的训练次数,若训练次数大于预先设置的固定迭代次数,则停止利用第一训练数据集训练目标检测模型。即,固定预热期迭代次数,训练次数大于预热期迭代次数则进入精分期
第二种方式:
获取目标检测模型的训练精度,若训练精度达到预先设置的目标精度,则停止利用第一训练数据集训练目标检测模型。即,设定预热期迭代精度,当预热期训练精度达到设定精度则进入精分期。如前文介绍,训练精度可以为目标检测模型的检测结果与真实值label_id相同的个数。
本实施例所设定的目标检测模型训练的预热期,可以理解为通过随机选取的方式对基础样本数据集中的样本数据进行迭代学习,在每次学习时,均可进行基于基础样本数据集进行随机采样以更新第一样本数据集,训练结束后先得到目标检测模型的基础模型,等目标检测模型的检测结果具备一定精度后以及具备一定的分辨能力,再进行后续的精分期的模型训练进程。
S103,基于基础样本数据集进行模型先验自适应采样得到第二训练数据集,利用第二训练数据集训练目标检测模型。
对智能分类模型执行为上述步骤S102的第一阶段的模型训练之后,可进入精分期,对目标检测模型进行进一步的模型训练。训练数据基于模型先验自适应采样,重采样后继续进行迭代训练,过程中会再次自适应重采样,如图2所示,具体如以下步骤S103-1~S103-6。
S103-1,利用经由第一训练数据集训练后的目标检测模型对基础样本数据集中各样本数据进行目标检测,并根据检测结果进行数据筛选得到第二训练数据集。针对目标检测模型的预热期训练过程结束后,由于目标检测模型已具备一定的准确性,因此,可以利用经过第一阶段训练的目标检测模型对基础样本数据集中各样本数据进行目标检测,以得到基于样本数据集中各样本数据对应的检测结果(本实施例中可以为手势检测结果)。
根据检测结果进行数据筛选时,可以将各样本数据的检测结果与真实标签进行对比,选取检测结果与真实标签差异较小的样本数据生成第二训练数据集。
S103-2,利用第二训练数据集训练目标检测模型。
S103-3,依据目标检测模型的模型训练数据判断目标检测模型是否符合预设重采样条件。
在本实施例中,是否重采样的判断方法有:
第一,判断所述目标检测模型的训练轮数是否满足预设重采样周期,若是,则判断所述目标检测模型符合预设重采样条件;若否,则判断所述目标检测模型不符合预设重采样条件。设置固定的重采样周期,即每训练N轮则重采样,N为重采样周期,可以根据不同的需求进行设置。
第二,依据所述目标检测模型的精度波动程度是否稳定,若稳定,则判断所述目标检测模型符合预设重采样条件;若不稳定,则判断所述目标检测模型不符合预设重采样条件。判断当前训练是否稳定,即测试精度波动程度,可用以下方差表征。
stable=std(acctrain)<thr (公式1)
其中std()是求方差函数,acctrain是训练集精度,thr是判断是否稳定的阈值(该阈值可以根据不同需求进行设置),如若不稳定则需要进行重采样。
S103-4,若判断所述目标检测模型符合预设重采样条件,则基于所述基础样本数据集进行重采样更新所述第二训练数据集。
S103-5,利用更新后的所述第二训练数据集训练所述目标检测模型。
本实施例提供的方法基于模型先验的数据自适应重采样训练方法,该方法能根据当前模型的预测效果自适应采样对其有益的训练数据,既能减少冗余训练数据,提升训练效率,又能保证训练精度,提升模型鲁棒性。
进一步地,如图2所示,在精分期的模型训练过程中,还可以包括步骤S103-6,判断是否满足预设训练结束的条件,与上述步骤S102介绍的结束条件类似,假设利用第二训练数据集训练步骤S102得到的目标检测模型大于设置固定的迭代次数,或是当精分期训练达到设定精度,则可以认为此次训练结束;如果迭代次数未能到达预设阈值,或者训练精度未能达到预设精度,则会继续利用第二训练数据集训练目标检测模型。步骤S102的第一训练阶段和步骤S103的第二训练阶段各自所对应的固定迭代次数以及训练精度可以根据不同的需求进行设置,本发明实施例对其具体值不做限定。
目标检测模型的模型检测结果与数据采样概率存在一定的关系,目标检测模型的检测结果与实际标签的差异应和采样率成正相关,即数据的预测结果与实际标签差异大时,数据采样率高;数据的预测结果与实际标签差异小时,数据采样率低。上述步骤S103-4基于所述基础样本数据集进行重采样更新所述第二训练数据集可以包括以下步骤A1~A2。
A1,计算所述基础样本数据集中各样本数据对应的数据采样概率;
本实施例中数据采样概率的计算公式如下:
S=(1-P)γ (公式2)
其中,S为样本的采样概率;P为样本的预测结果;γ为采样概率的超参数,越大采样概率越低;γ为0时为全采样(百分百采样)。如图3所示,横坐标为模型预测结果,纵坐标为样本采样概率,当P大于0.8时,样本属于简单样本,故采样概率低;当P小于0.2时,样本属于困难样本,故采样概率高。可选地,上述步骤A1中计算数据采样概率可以包括:
A1-1,获取所述目标检测模型对所述基础样本数据集中任一样本数据的预测结果;
A1-2,计算各所述样本数据对应的数据采样概率的超参数;本实施例的超参数为公式2中的γ。
A1-3,基于所述预测结果和所述超参数计算各所述样本数据对应的数据采样概率。
在本实施例中,通过将数据采样与预测结果相结合,起到数据下采样时避免丢失有效数据且降低冗余数据的作用。但单纯的下采样并不能缩小类别间数据分布不均衡的问题,如果要解决类别间的分布差异,应对不同的数量的类别采取不同的γ以达到最终下采样后的数据量均衡。
可选地,上述步骤A1-3基于所述预测结果和所述超参数计算各所述样本数据对应的数据采样概率包括:
A1-3-1,获取所述基础样本数据集中各样本数据的预测结果;
A1-3-2,获取采样总数的数学期望;
A1-3-3,基于所述各样本数据的预测结果和所述采样总数的数学期望计算各所述样本数据对应的数据采样概率。
下采样总数的数学表达式公式(3)所示,设Si为第i个样本的采样概率,原样本总数为n,则Nexp(Nexp≤n)为该类别的下采样总数的数学期望,也称为该类别的训练基数。
Figure BDA0003872677930000101
结合上述公式2可以得到:
Figure BDA0003872677930000102
公式4中Nexp为预设值,Pi为模型预测结果,求解式公式4的方程即可得到γ。
A2,基于各样本数据对应的数据采样概率在所述基于所述基础样本数据集进行重采样得到第二训练数据集。
本实施例中样本数据的数据采样概率大于等于0,具体值取决于图片数量和选择样本数据,对于每一个样本数据来讲均具有对应的样本数据采样概率,在进行重采样时,在0-~1范围内选取随机值,若样本数据的数据采样概率小于或等于该随机值,则该样本数据被采样;若样本数据的数据采样概率大于该随机值,则过滤该条样本数据。
实际应用中,上述公式4的复杂度与原样本总数n成正比,n越大计算时间越长。为了优化求解式4)的计算复杂度,现采用分块式求解。即,上述步骤A1-3-1还可以包括:获取所述基础样本数据集的样本总数,并将所述样本总数划分为多个样本组,计算各所述样本组对应的参考预测结果。上述步骤A1-3-3可以包括:基于所述各所述样本组对应的参考预测结果和所述采样总数的数学期望计算各所述样本数据对应的数据采样概率。
也就是说,把Pi按值域分成m块(即,m个分组),则第j块表示为公式5。
Figure BDA0003872677930000111
则第j块的预测均值为公式6,其中,nj为第j块的总数;Pi j为第j块第i个预测结果;eps=1e-j,起分母修正作用:
Figure BDA0003872677930000112
则上式公式4可开展为公式7:
Figure BDA0003872677930000113
公式4中为原样本总数,数量级别可达数千到数百万,公式7中为分块数量,一般为个位数量。由式公式4到公式7,即千万项级别的指数方程化简为个位数级别的指数方程。
本实施例提供的方法可以应用于静态手势分类,真实场景的数据采集受主观和客观因素影响,容易导致各类别数据量差异大,本方法训练数据如表1所示,正类手势为one、five、yearh、three、heartSingle、ok、six、iloveyou、gun和thumbup,任何不属于以上类别的手势归类为负类手势others,由于负类手势形态远丰富于正类手势,故采集到的others数据量远大于任一正类手势。如果不对数据进行下采样,则模型收敛速度缓慢。故以表1第三列作为下采样基数(如one,总数4865采样后数据量为3500),训练结果如表2)示。表2中,第一列为训练模型的名称,第二为只采用随机采样训练的top1精度、三列为采用本文方法的top1精度,由表中结果可知,自适应采样在不同模型下的精度要比随机采样高。
表1类别数量
类别 总数n 训练基数N<sub>exp</sub>
one 4865 3500
five 3749 3500
yearh 3521 3500
three 3364 3300
heartSingle 2830 2800
ok 3776 3500
six 3657 3500
iloveyou 3641 3500
gun 3000 3000
thumbup 3719 3500
others 104202 10000
表2训练结果
模型 随机采样 自适应重采样
resnet18 95.125% 96.737%
mobilenetv2 95.836% 97.337%
tinynet_c 96.232% 97.552%
本实施例提出的基于模型先验的数据自适应重采样在面对数据分布不均衡有较强的鲁棒性,在不同的模型下训练精度相对比随机采样有较大的提升。
基于同一发明构思,本发明实施例还提供了一种数据自适应重采样的目标检测模型训练装置,如图4所示,本实施例的一种数据自适应重采样的目标检测模型训练装置可以包括:
数据集获取模块410,用于获取与预先根据业务需求建立的目标检测模型的基础样本数据集;
第一训练模块420,用于从所述基础样本数据集中进行样本随机筛选得到第一训练数据集,利用所述第一训练数据集训练所述目标检测模型;
第二训练模块430,用于基于所述第一训练数据集进行自适应采样得到第二训练数据集,利用所述第二训练数据集训练所述目标检测模型。
在本发明一可选实施例中,第一训练模块420还可以用于:
统计利用所述第一训练数据集训练所述目标检测模型的训练次数,若所述训练次数大于预先设置的固定迭代次数,则停止利用所述第一训练数据集训练所述目标检测模型;或,
获取所述目标检测模型的训练精度,若所述训练精度达到预先设置的目标精度,则停止利用所述第一训练数据集训练所述目标检测模型。
在本发明一可选实施例中,第二训练模块430还可以用于:
利用经由所述第一训练数据集训练后的目标检测模型对所述基础样本数据集中各样本数据进行目标检测,并根据检测结果进行数据筛选得到第二训练数据集;
利用所述第二训练数据集训练所述目标检测模型;
依据所述目标检测模型的模型训练数据判断所述目标检测模型是否符合预设重采样条件;
若判断所述目标检测模型符合预设重采样条件,则基于所述基础样本数据集进行重采样以更新所述第二训练数据集;
利用更新后的所述第二训练数据集训练所述目标检测模型。
在本发明一可选实施例中,第二训练模块430还可以用于:
判断所述目标检测模型的训练轮数是否满足预设重采样周期,若是,则判断所述目标检测模型符合预设重采样条件;若否,则判断所述目标检测模型不符合预设重采样条件;或,
依据所述目标检测模型的精度波动程度是否稳定,若稳定,则判断所述目标检测模型符合预设重采样条件;若不稳定,则判断所述目标检测模型不符合预设重采样条件。
在本发明一可选实施例中,第二训练模块430还可以用于:
计算所述基础样本数据集中各样本数据对应的数据采样概率;
基于各样本数据对应的数据采样概率在所述基于所述基础样本数据集进行重采样以更新第二训练数据集。
在本发明一可选实施例中,第二训练模块430还可以用于:
获取所述目标检测模型对所述基础样本数据集中任一样本数据的预测结果;
计算各所述样本数据对应的数据采样概率的超参数;
基于所述预测结果和所述超参数计算各所述样本数据对应的数据采样概率。
在本发明一可选实施例中,第二训练模块430还可以用于:
获取所述基础样本数据集中各样本数据的预测结果;
获取采样总数的数学期望;
基于所述各样本数据的预测结果和所述采样总数的数学期望计算各所述样本数据对应的数据采样概率。
在本发明一可选实施例中,第二训练模块430还可以用于:
获取所述基础样本数据集的样本总数,并将所述样本总数划分为多个样本组,计算各所述样本组对应的参考预测结果;
基于所述各所述样本组对应的参考预测结果和所述采样总数的数学期望计算各所述样本数据对应的数据采样概率。
在本发明一可选实施例中,第二训练模块430还可以用于:通过以下方式计算所述基础样本数据集中各样本数据对应的数据采样概率:
S=(1-P)γ
其中,S为样本的采样概率;P为样本的预测结果;γ为采样概率的超参数。
在本发明一可选实施例中,第二训练模块430还可以用于:通过以下方式计算各所述样本数据对应的数据采样概率:
Figure BDA0003872677930000141
其中,Pi为第i个样本的采样概率,原样本总数为n,则Nexp(Nexp≤n)为数学期望。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行上述实施例所述的数据自适应重采样的目标检测模型训练方法。
本发明实施例还提供了一种计算设备,所述计算设备包括处理器以及存储器:所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;所述处理器用于根据所述程序代码中的指令执行上述实施例所述的数据自适应重采样的目标检测模型训练方法。
本发明实施例还提供了一种图像采集设备,所述图像采集设备执行上述实施例所述的数据自适应重采样的目标检测模型训练方法,或包括上述实施例所述的数据自适应重采样的目标检测模型训练装置,或具有上述实施例所述的非暂时性计算机可读存储介质。当然,图像采集设备除上述介绍的之外,还可以包括如光学机构、摄像器件、电路单元等组成部件。
所属领域的技术人员可以清楚地了解到,上述描述的系统、装置、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,为简洁起见,在此不另赘述。
另外,在本发明各个实施例中的各功能单元可以物理上相互独立,也可以两个或两个以上功能单元集成在一起,还可以全部功能单元都集成在一个处理单元中。上述集成的功能单元既可以采用硬件的形式实现,也可以采用软件或者固件的形式实现。
本领域普通技术人员可以理解:所述集成的功能单元如果以软件的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,其包括若干指令,用以使得一台计算设备(例如个人计算机,服务器,或者网络设备等)在运行所述指令时执行本发明各实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM)、随机存取存储器(RAM),磁碟或者光盘等各种可以存储程序代码的介质。
或者,实现前述方法实施例的全部或部分步骤可以通过程序指令相关的硬件(诸如个人计算机,服务器,或者网络设备等的计算设备)来完成,所述程序指令可以存储于一计算机可读取存储介质中,当所述程序指令被计算设备的处理器执行时,所述计算设备执行本发明各实施例所述方法的全部或部分步骤。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:在本发明的精神和原则之内,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案脱离本发明的保护范围。

Claims (14)

1.一种数据自适应重采样的目标检测模型训练方法,其特征在于,所述方法包括:
获取与预先根据业务场景建立的目标检测模型的基础样本数据集;
从所述基础样本数据集中进行样本随机筛选得到第一训练数据集,利用所述第一训练数据集训练所述目标检测模型;
基于所述基础样本数据集进行模型先验自适应采样得到第二训练数据集,利用所述第二训练数据集训练所述目标检测模型。
2.根据权利要求1所述的方法,其特征在于,所述利用所述第一训练数据集训练所述目标检测模型之后,所述方法还包括:
统计利用所述第一训练数据集训练所述目标检测模型的训练次数,若所述训练次数大于预先设置的固定迭代次数,则停止利用所述第一训练数据集训练所述目标检测模型;或,
获取所述目标检测模型的训练精度,若所述训练精度达到预先设置的目标精度,则停止利用所述第一训练数据集训练所述目标检测模型。
3.根据权利要求1所述的方法,其特征在于,所述基于所述基础样本数据集进行模型先验自适应采样得到第二训练数据集,利用所述第二训练数据集训练所述目标检测模型包括:
利用经由所述第一训练数据集训练后的目标检测模型对所述基础样本数据集中各样本数据进行目标检测,并根据检测结果进行数据筛选得到第二训练数据集;
利用所述第二训练数据集训练所述目标检测模型;
依据所述目标检测模型的模型训练数据判断所述目标检测模型是否符合预设重采样条件;
若判断所述目标检测模型符合预设重采样条件,则基于所述基础样本数据集进行重采样以更新所述第二训练数据集;
利用更新后的所述第二训练数据集训练所述目标检测模型。
4.根据权利要求3所述的方法,其特征在于,所述依据所述目标检测模型的模型训练数据判断所述目标检测模型是否符合预设重采样条件包括:
判断所述目标检测模型的训练轮数是否满足预设重采样周期,若是,则判断所述目标检测模型符合预设重采样条件;若否,则判断所述目标检测模型不符合预设重采样条件;或,
依据所述目标检测模型的精度波动程度是否稳定,若稳定,则判断所述目标检测模型符合预设重采样条件;若不稳定,则判断所述目标检测模型不符合预设重采样条件。
5.根据权利要求3所述的方法,其特征在于,所述基于所述基础样本数据集进行重采样以更新所述第二训练数据集包括:
计算所述基础样本数据集中各样本数据对应的数据采样概率;
基于各样本数据对应的数据采样概率在所述基于所述基础样本数据集进行重采样以更新第二训练数据集。
6.根据权利要求5所述的方法,其特征在于,所述计算所述基础样本数据集中各样本数据对应的数据采样概率包括:
获取所述目标检测模型对所述基础样本数据集中任一样本数据的预测结果;
计算各所述样本数据对应的数据采样概率的超参数;
基于所述预测结果和所述超参数计算各所述样本数据对应的数据采样概率。
7.根据权利要求6所述的方法,其特征在于,基于所述预测结果和所述超参数计算各所述样本数据对应的数据采样概率包括:
获取所述基础样本数据集中各样本数据的预测结果;
获取采样总数的数学期望;
基于所述各样本数据的预测结果和所述采样总数的数学期望计算各所述样本数据对应的数据采样概率。
8.根据权利要求6所述的方法,其特征在于,通过以下方式计算所述基础样本数据集中各样本数据对应的数据采样概率:
S=(1-P)γ
其中,S为样本的采样概率;P为样本的预测结果;γ为采样概率的超参数。
9.根据权利要求8所述的方法,其特征在于,通过以下方式计算各所述样本数据对应的数据采样概率:
Figure FDA0003872677920000031
其中,Pi为第i个样本的采样概率,原样本总数为n,则Nexp(Nexp≤n)为数学期望。
10.根据权利要求8所述的方法,其特征在于,所述获取所述基础样本数据集中各样本数据的预测结果包括:
获取所述基础样本数据集的样本总数,并将所述样本总数划分为多个样本组,计算各所述样本组对应的参考预测结果。
11.根据权利要求10所述的方法,其特征在于,所述基于所述各样本数据的预测结果和所述采样总数的数学期望计算各所述样本数据对应的数据采样概率包括:
基于所述各所述样本组对应的参考预测结果和所述采样总数的数学期望计算各所述样本数据对应的数据采样概率。
12.一种数据自适应重采样的目标检测模型训练装置,其特征在于,所述装置包括:
数据集获取模块,用于获取与预先根据业务需求建立的目标检测模型的基础样本数据集;
第一训练模块,用于从所述基础样本数据集中进行样本随机筛选得到第一训练数据集,利用所述第一训练数据集训练所述目标检测模型;
第二训练模块,用于基于所述第一训练数据集进行自适应采样得到第二训练数据集,利用所述第二训练数据集训练所述目标检测模型。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-11任一项所述的方法。
14.一种图像采集设备,其特征在于,所述图像采集设备执行权利要求1-11中任一项所述的方法,或包括权利要求12所述的数据自适应重采样的目标检测模型训练装置,或具有根据权利要求13所述的非暂时性计算机可读存储介质。
CN202211201800.0A 2022-09-29 2022-09-29 数据自适应重采样的目标检测模型训练方法、装置及设备 Active CN115512391B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211201800.0A CN115512391B (zh) 2022-09-29 2022-09-29 数据自适应重采样的目标检测模型训练方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211201800.0A CN115512391B (zh) 2022-09-29 2022-09-29 数据自适应重采样的目标检测模型训练方法、装置及设备

Publications (2)

Publication Number Publication Date
CN115512391A true CN115512391A (zh) 2022-12-23
CN115512391B CN115512391B (zh) 2023-07-21

Family

ID=84507685

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211201800.0A Active CN115512391B (zh) 2022-09-29 2022-09-29 数据自适应重采样的目标检测模型训练方法、装置及设备

Country Status (1)

Country Link
CN (1) CN115512391B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116644296A (zh) * 2023-07-27 2023-08-25 北京斯年智驾科技有限公司 一种数据增强方法及装置
CN116664846A (zh) * 2023-07-31 2023-08-29 华东交通大学 基于语义分割实现3d打印桥面施工质量监测方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107493124A (zh) * 2017-08-09 2017-12-19 深圳先进技术研究院 一种多天线微波无线充电的波束成形算法
CN108197697A (zh) * 2017-12-29 2018-06-22 汕头大学 一种训练深度神经网络的动态重采样方法
WO2021212737A1 (zh) * 2020-04-23 2021-10-28 苏州浪潮智能科技有限公司 一种行人重识别方法、系统、设备及计算机可读存储介质
CN113762579A (zh) * 2021-01-07 2021-12-07 北京沃东天骏信息技术有限公司 一种模型训练方法、装置、计算机存储介质及设备
CN113918884A (zh) * 2020-07-09 2022-01-11 顺丰科技有限公司 业务量预测模型构建方法和业务量预测方法
CN114004364A (zh) * 2021-10-29 2022-02-01 上海商汤科技开发有限公司 采样优化方法、装置、电子设备及存储介质
CN114358362A (zh) * 2021-11-10 2022-04-15 贵州电网有限责任公司 一种数据缺乏下电动汽车负荷预测方法
CN114383735A (zh) * 2021-12-17 2022-04-22 暨南大学 基于机器视觉的火电机组空冷阵列温度场监测方法及装置
CN114462465A (zh) * 2021-09-30 2022-05-10 马上消费金融股份有限公司 一种分类模型的训练方法、质检预测方法及对应装置
CN114547492A (zh) * 2022-02-18 2022-05-27 北京百度网讯科技有限公司 生成模型的训练方法、文案生成方法、装置、设备和介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107493124A (zh) * 2017-08-09 2017-12-19 深圳先进技术研究院 一种多天线微波无线充电的波束成形算法
CN108197697A (zh) * 2017-12-29 2018-06-22 汕头大学 一种训练深度神经网络的动态重采样方法
WO2021212737A1 (zh) * 2020-04-23 2021-10-28 苏州浪潮智能科技有限公司 一种行人重识别方法、系统、设备及计算机可读存储介质
CN113918884A (zh) * 2020-07-09 2022-01-11 顺丰科技有限公司 业务量预测模型构建方法和业务量预测方法
CN113762579A (zh) * 2021-01-07 2021-12-07 北京沃东天骏信息技术有限公司 一种模型训练方法、装置、计算机存储介质及设备
CN114462465A (zh) * 2021-09-30 2022-05-10 马上消费金融股份有限公司 一种分类模型的训练方法、质检预测方法及对应装置
CN114004364A (zh) * 2021-10-29 2022-02-01 上海商汤科技开发有限公司 采样优化方法、装置、电子设备及存储介质
CN114358362A (zh) * 2021-11-10 2022-04-15 贵州电网有限责任公司 一种数据缺乏下电动汽车负荷预测方法
CN114383735A (zh) * 2021-12-17 2022-04-22 暨南大学 基于机器视觉的火电机组空冷阵列温度场监测方法及装置
CN114547492A (zh) * 2022-02-18 2022-05-27 北京百度网讯科技有限公司 生成模型的训练方法、文案生成方法、装置、设备和介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HANG XU等: ""Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN"", pages 12492 - 12499 *
汪海涛等: ""基于大数据不平衡样本集的重采样方法及应用"", pages 26 - 29 *
王怡: ""基于卷积神经网络的航空图像目标检测算法研究"", pages 031 - 266 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116644296A (zh) * 2023-07-27 2023-08-25 北京斯年智驾科技有限公司 一种数据增强方法及装置
CN116644296B (zh) * 2023-07-27 2023-10-03 北京斯年智驾科技有限公司 一种数据增强方法及装置
CN116664846A (zh) * 2023-07-31 2023-08-29 华东交通大学 基于语义分割实现3d打印桥面施工质量监测方法及系统
CN116664846B (zh) * 2023-07-31 2023-10-13 华东交通大学 基于语义分割实现3d打印桥面施工质量监测方法及系统

Also Published As

Publication number Publication date
CN115512391B (zh) 2023-07-21

Similar Documents

Publication Publication Date Title
TWI769754B (zh) 基於隱私保護確定目標業務模型的方法及裝置
CN115512391A (zh) 数据自适应重采样的目标检测模型训练方法、装置及设备
CN109271958B (zh) 人脸年龄识别方法及装置
CN109726195B (zh) 一种数据增强方法及装置
CN110532950B (zh) 基于微表情视频的视频特征提取方法、微表情识别方法
US20210201201A1 (en) Method and apparatus for determining storage load of application
CN112350878A (zh) 一种压力测试系统
CN111783997A (zh) 一种数据处理方法、装置及设备
CN110956037A (zh) 多媒体内容重复判断方法及装置
CN111428639A (zh) 手势识别模型的训练方法、手势识别方法及装置
CN112150471B (zh) 基于少样本的语义分割方法及装置、电子设备、存储介质
CN118734460B (zh) 飞行器姿态控制的分布式仿真模型数据获取方法及系统
CN112434717A (zh) 一种模型训练方法及装置
CN117636086B (zh) 无源域适应目标检测方法及装置
CN113435464B (zh) 异常数据检测方法、装置、电子设备及计算机存储介质
CN111309706A (zh) 模型训练方法、装置、可读存储介质及电子设备
CN111783883A (zh) 一种异常数据的检测方法及装置
US20220351533A1 (en) Methods and systems for the automated quality assurance of annotated images
CN117372971A (zh) 对象识别方法、装置、计算机设备和存储介质
CN112580887B (zh) 多目标融合评价的权重确定方法、装置、设备及存储介质
CN112270269B (zh) 一种人脸图像质量的评估方法及装置
CN113128616A (zh) 确定黑盒攻击算法的方法、装置、计算机存储介质及终端
CN110852418A (zh) 神经网络模型的数据处理方法及装置、存储介质、终端
CN113362372B (zh) 一种单目标追踪方法及计算机可读介质
CN113822580B (zh) 一种设备工况评估方法以及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant