CN117009845A

CN117009845A - 一种类增量模型的训练方法、装置以及存储介质

Info

Publication number: CN117009845A
Application number: CN202211174893.2A
Authority: CN
Inventors: 刘夏雷; 李珂; 胡煜松; 曹续生; 程明明
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2022-09-26
Filing date: 2022-09-26
Publication date: 2023-11-07

Abstract

本申请公开了一种类增量模型的训练方法、装置以及存储介质，可应用于地图或车辆网领域。通过获取类增量模型和符合长尾分布的训练数据，以进行模型训练；然后对训练数据进行均匀采样，以得到各个分类器对应的采样数据；进而基于采样数据对第二类增量模型中配置的参数模块和目标类别对应的分类器进行训练。从而实现类增量模型的分阶段训练过程，由于在分阶段训练中对长尾分布的训练数据进行均匀采样，并针对性的进行样本数量维度的加权，减小了样本数量对于类增量模型训练过程的影响，提高了训练后类增量模型分类的准确性。

Description

一种类增量模型的训练方法、装置以及存储介质

技术领域

本申请涉及计算机技术领域，尤其涉及一种类增量模型的训练方法、装置以及存储介质。

背景技术

当前机器学习的方式主要集中在一次性的给定所有的数据集，算法在全部数据当中训练得到最终的模型。这种方式能够得到较好的训练效果，但是在实际生活当中，面对的场景可能是数据无法一次性的全部获取，或者在某一时间无法获取到全部的数据。

类增量学习可以很好的解决这样的问题，它要求模型在进行任务拓展的时候无法获取到先前训练所应用的数据，仅应用拓展部分所提供的数据，这就使这些模型在实际应用当中不需要完全保留先前得到过的所有数据，大大节省了存储开销，同时在拓展任务的训练上，只需要在原始模型的基础上进行针对新任务的训练，训练难度以及时间成本大幅度降低，能够更快速的实现模型的迭代。

但是，在一些场景当中各个任务的类别数量是不固定的，同时每个类别的样本数量也是不固定的，此时可能造成类增量模型对于样本数量多的类别过度表达，影响类增量模型分类的准确性。

发明内容

有鉴于此，本申请提供一种类增量模型的训练方法，可以有效提高训练后类增量模型分类的准确性。

本申请第一方面提供一种类增量模型的训练方法，可以应用于终端设备中包含类增量模型的训练功能的系统或程序中，具体包括：

获取第一类增量模型和符合长尾分布的训练数据，所述训练数据用于在所述第一类增量模型中增加对于目标类别进行分类的分类器；

基于所述训练数据对所述第一类增量模型进行训练，以得到第二类增量模型；

对所述训练数据进行均匀采样，以得到所述第二类增量模型中各个分类器对应的采样数据，各个所述分类器对应的采样数据的样本数量相同；

基于所述采样数据对所述第二类增量模型中配置的参数模块和所述目标类别对应的分类器进行训练，以对所述第二类增量模型进行参数更新得到第三类增量模型，训练后的所述参数模块用于确定权重参数，所述权重参数用于平衡所述第二类增量模型中各个分类器输出的分类参数，所述第三类增量模型用于根据所述分类参数输出分类结果。

可选的，在本申请一些可能的实现方式中，所述获取第一类增量模型和符合长尾分布的训练数据，包括：

获取所述第一类增量模型，并确定为所述第一类增量模型配置的所述目标类别；

获取所述目标类别对应的业务数据；

对所述业务数据进行样本数量的统计，以得到符合长尾分布的所述训练数据。

可选的，在本申请一些可能的实现方式中，所述对所述业务数据进行样本数量的统计，以得到符合长尾分布的所述训练数据，包括：

对所述业务数据按照所述目标类别的分类进行样本数量的统计，以得到类别序列；

将所述类别序列按照预设规则进行排列，以得到符合长尾分布的所述训练数据。

可选的，在本申请一些可能的实现方式中，所述基于所述训练数据对所述第一类增量模型进行训练，以得到第二类增量模型，包括：

确定所述第一类增量模型中的多个类别分支和特征提取网络；

基于所述训练数据分别获取对应于各个所述类别分支的类别数据；

根据所述特征提取网络分别提取所述类别数据对应的类别特征；

基于所述类别数据对应的类别标签与所述类别特征的对应关系对所述特征提取网络和各个所述类别分支的分类器进行训练，以得到所述第二类增量模型。

可选的，在本申请一些可能的实现方式中，所述对所述训练数据进行均匀采样，以得到所述第二类增量模型中各个分类器对应的采样数据，包括：

确定所述目标类别在所述训练数据中对应的样本数量分布；

基于样本数量分布确定样本数量中的最小值，以得到参考数量；

根据所述参考数量对所述训练数据中各个类别下的数据进行均匀采样，以得到所述第二类增量模型中各个分类器对应的采样数据。

可选的，在本申请一些可能的实现方式中，所述根据所述参考数量对所述训练数据中各个类别下的数据进行均匀采样，以得到所述第二类增量模型中各个分类器对应的采样数据，包括：

获取针对于所述目标类别配置的样本阈值；

若所述参考数量大于或等于所述样本阈值，则根据所述参考数量对所述训练数据中各个类别下的数据进行均匀采样，以得到所述第二类增量模型中各个分类器对应的采样数据。

可选的，在本申请一些可能的实现方式中，所述基于所述采样数据对所述第二类增量模型中配置的参数模块和所述目标类别对应的分类器进行训练，以对所述第二类增量模型进行参数更新得到第三类增量模型，包括：

对除去所述目标类别对应的分类器之外的分类器参数进行固定；

获取所述第二类增量模型对应的类别数目；

基于所述类别数目配置维度相同的所述参数模块；

根据所述第二类增量模型对应的各个类别的样本数量对所述参数模块进行权重参数的配置；

基于所述权重参数对所述第二类增量模型对应的各个分类器输出的分类参数进行加权，以得到加权分类参数；

基于所述加权分类参数与所述采样数据的标签进行损失函数的计算，以对所述第二类增量模型中配置的参数模块和所述目标类别对应的分类器进行训练；

根据训练过程对所述第二类增量模型进行参数更新，以得到所述第三类增量模型。

本申请第二方面提供一种类增量模型的训练装置，包括：

获取单元，用于获取第一类增量模型和符合长尾分布的训练数据，所述训练数据用于在所述第一类增量模型中增加对于目标类别进行分类的分类器；

训练单元，用于基于所述训练数据对所述第一类增量模型进行训练，以得到第二类增量模型；

采样单元，用于对所述训练数据进行均匀采样，以得到所述第二类增量模型中各个分类器对应的采样数据，各个所述分类器对应的采样数据的样本数量相同；

所述训练单元，还用于基于所述采样数据对所述第二类增量模型中配置的参数模块和所述目标类别对应的分类器进行训练，以对所述第二类增量模型进行参数更新得到第三类增量模型，训练后的所述参数模块用于确定权重参数，所述权重参数用于平衡所述第二类增量模型中各个分类器输出的分类参数，所述第三类增量模型用于根据所述分类参数输出分类结果。

可选的，在本申请一些可能的实现方式中，所述获取单元，具体用于获取所述第一类增量模型，并确定为所述第一类增量模型配置的所述目标类别；

所述获取单元，具体用于获取所述目标类别对应的业务数据；

所述获取单元，具体用于对所述业务数据进行样本数量的统计，以得到符合长尾分布的所述训练数据。

可选的，在本申请一些可能的实现方式中，所述获取单元，具体用于对所述业务数据按照所述目标类别的分类进行样本数量的统计，以得到类别序列；

所述获取单元，具体用于将所述类别序列按照预设规则进行排列，以得到符合长尾分布的所述训练数据。

可选的，在本申请一些可能的实现方式中，所述训练单元，具体用于确定所述第一类增量模型中的多个类别分支和特征提取网络；

所述训练单元，具体用于基于所述训练数据分别获取对应于各个所述类别分支的类别数据；

所述训练单元，具体用于根据所述特征提取网络分别提取所述类别数据对应的类别特征；

所述训练单元，具体用于基于所述类别数据对应的类别标签与所述类别特征的对应关系对所述特征提取网络和各个所述类别分支的分类器进行训练，以得到所述第二类增量模型。

可选的，在本申请一些可能的实现方式中，所述采样单元，具体用于确定所述目标类别在所述训练数据中对应的样本数量分布；

所述采样单元，具体用于基于样本数量分布确定样本数量中的最小值，以得到参考数量；

所述采样单元，具体用于根据所述参考数量对所述训练数据中各个类别下的数据进行均匀采样，以得到所述第二类增量模型中各个分类器对应的采样数据。

可选的，在本申请一些可能的实现方式中，所述采样单元，具体用于获取针对于所述目标类别配置的样本阈值；

所述采样单元，具体用于若所述参考数量大于或等于所述样本阈值，则根据所述参考数量对所述训练数据中各个类别下的数据进行均匀采样，以得到所述第二类增量模型中各个分类器对应的采样数据。

可选的，在本申请一些可能的实现方式中，所述训练单元，具体用于对除去所述目标类别对应的分类器之外的分类器参数进行固定；

所述训练单元，具体用于获取所述第二类增量模型对应的类别数目；

所述训练单元，具体用于基于所述类别数目配置维度相同的所述参数模块；

所述训练单元，具体用于根据所述第二类增量模型对应的各个类别的样本数量对所述参数模块进行权重参数的配置；

所述训练单元，具体用于基于所述权重参数对所述第二类增量模型对应的各个分类器输出的分类参数进行加权，以得到加权分类参数；

所述训练单元，具体用于基于所述加权分类参数与所述采样数据的标签进行损失函数的计算，以对所述第二类增量模型中配置的参数模块和所述目标类别对应的分类器进行训练；

所述训练单元，具体用于根据训练过程对所述第二类增量模型进行参数更新，以得到所述第三类增量模型。

本申请第三方面提供一种计算机设备，包括：存储器、处理器以及总线系统；所述存储器用于存储程序代码；所述处理器用于根据所述程序代码中的指令执行上述第一方面或第一方面任一项所述的类增量模型的训练方法。

本申请第四方面提供一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述第一方面或第一方面任一项所述的类增量模型的训练方法。

根据本申请的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述第一方面或者第一方面的各种可选实现方式中提供的类增量模型的训练方法。

从以上技术本实施例可以看出，本申请实施例具有以下优点：

通过获取第一类增量模型和符合长尾分布的训练数据，该训练数据用于在第一类增量模型中增加对于目标类别进行分类的分类器；然后基于训练数据对第一类增量模型进行训练，以得到第二类增量模型；进一步的对训练数据进行均匀采样，以得到第二类增量模型中各个分类器对应的采样数据，各个分类器对应的采样数据的样本数量相同；进而基于采样数据对第二类增量模型中配置的参数模块和目标类别对应的分类器进行训练，以对第二类增量模型进行参数更新得到第三类增量模型，该训练后的参数模块用于确定权重参数，权重参数用于平衡第二类增量模型中各个分类器输出的分类参数，其中第三类增量模型用于根据分类参数输出分类结果。从而实现类增量模型的分阶段训练过程，由于在分阶段训练中对长尾分布的训练数据进行均匀采样，并针对性的进行样本数量维度的加权，减小了样本数量对于类增量模型训练过程的影响，提高了训练后类增量模型分类的准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术本实施例，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为类增量模型的训练系统运行的网络架构图；

图2为本申请实施例提供的一种类增量模型的训练的流程架构图；

图3为本申请实施例提供的一种类增量模型的训练方法的流程图；

图4为本申请实施例提供的一种类增量模型的训练方法的场景示意图；

图5为本申请实施例提供的另一种类增量模型的训练方法的场景示意图；

图6为本申请实施例提供的另一种类增量模型的训练方法的场景示意图；

图7为本申请实施例提供的另一种类增量模型的训练方法的场景示意图；

图8为本申请实施例提供的一种类增量模型的训练装置的结构示意图；

图9为本申请实施例提供的一种终端设备的结构示意图；

图10为本申请实施例提供的一种服务器的结构示意图。

具体实施方式

本申请实施例提供了一种类增量模型的训练方法以及相关装置，可以应用于终端设备中包含类增量模型的训练功能的系统或程序中，通过获取第一类增量模型和符合长尾分布的训练数据，该训练数据用于在第一类增量模型中增加对于目标类别进行分类的分类器；然后基于训练数据对第一类增量模型进行训练，以得到第二类增量模型；进一步的对训练数据进行均匀采样，以得到第二类增量模型中各个分类器对应的采样数据，各个分类器对应的采样数据的样本数量相同；进而基于采样数据对第二类增量模型中配置的参数模块和目标类别对应的分类器进行训练，以对第二类增量模型进行参数更新得到第三类增量模型，该训练后的参数模块用于确定权重参数，权重参数用于平衡第二类增量模型中各个分类器输出的分类参数，其中第三类增量模型用于根据分类参数输出分类结果。从而实现类增量模型的分阶段训练过程，由于在分阶段训练中对长尾分布的训练数据进行均匀采样，并针对性的进行样本数量维度的加权，减小了样本数量对于类增量模型训练过程的影响，提高了训练后类增量模型分类的准确性。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“对应于”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

首先，对本申请实施例中可能出现的一些名词进行解释。

类增量学习(Class Incremental Learning，CIL)：指数据集按照不同类别被划分为连续的任务，每次训练仅提供当前任务所包含的类别的数据进行训练，模型需要识别先前所有任务出现的所有类上的分类任务。

应理解，本申请提供的类增量模型的训练方法可以应用于终端设备中包含类增量模型的训练功能的系统或程序中，例如模型管理，具体的，类增量模型的训练系统可以运行于如图1所示的网络架构中，如图1所示，是类增量模型的训练系统运行的网络架构图，如图可知，类增量模型的训练系统可以提供与多个信息源的类增量模型的训练过程，即通过终端侧的类别管理操作，触发服务器对相应的类增量模型进行训练，以适配于新增类别的识别任务；可以理解的是，图1中示出了多种终端设备，终端设备可以为计算机设备，在实际场景中可以有更多或更少种类的终端设备参与到类增量模型的训练的过程中，具体数量和种类因实际场景而定，此处不做限定，另外，图1中示出了一个服务器，但在实际场景中，也可以有多个服务器的参与，特别是在多模型训练交互的场景中，具体服务器数量因实际场景而定。

本实施例中，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能语音交互设备、智能家电、车载终端等，但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，终端以及服务器可以连接组成区块链网络，本申请在此不做限制。

可以理解的是，上述类增量模型的训练系统可以运行于个人移动终端，例如：作为模型管理这样的应用，也可以运行于服务器，还可以作为运行于第三方设备以提供类增量模型的训练，以得到信息源的类增量模型的训练处理结果；具体的类增量模型的训练系统可以是以一种程序的形式在上述设备中运行，也可以作为上述设备中的系统部件进行运行，还可以作为云端服务程序的一种，本实施例可应用于云技术、自动驾驶等场景，具体运作模式因实际场景而定，此处不做限定。

为了解决上述问题，本申请提出了一种类增量模型的训练方法，该方法应用于图2所示的类增量模型的训练的流程框架中，如图2所示，为本申请实施例提供的一种类增量模型的训练的流程架构图，对于终端的类别操作，在服务器进行类别数据的统计，即每个类当中所包含的样本的数量服从一个长尾分布，也就是说每个类别所包含的样本数量都不相同，且有些类包含的样本数量极少。然后进行基础的类增量模型训练，然后进行均匀采样，并进行加权条件下的二阶段训练，从而实现分阶段的类增量模型的训练过程。

可以理解的是，本申请所提供的方法可以为一种程序的写入，以作为硬件系统中的一种处理逻辑，也可以作为一种类增量模型的训练装置，采用集成或外接的方式实现上述处理逻辑。作为一种实现方式，该类增量模型的训练装置通过获取第一类增量模型和符合长尾分布的训练数据，该训练数据用于在第一类增量模型中增加对于目标类别进行分类的分类器；然后基于训练数据对第一类增量模型进行训练，以得到第二类增量模型；进一步的对训练数据进行均匀采样，以得到第二类增量模型中各个分类器对应的采样数据，各个分类器对应的采样数据的样本数量相同；进而基于采样数据对第二类增量模型中配置的参数模块和目标类别对应的分类器进行训练，以对第二类增量模型进行参数更新得到第三类增量模型，该训练后的参数模块用于确定权重参数，权重参数用于平衡第二类增量模型中各个分类器输出的分类参数，其中第三类增量模型用于根据分类参数输出分类结果。从而实现类增量模型的分阶段训练过程，由于在分阶段训练中对长尾分布的训练数据进行均匀采样，并针对性的进行样本数量维度的加权，减小了样本数量对于类增量模型训练过程的影响，提高了训练后类增量模型分类的准确性。

本申请实施例提供的本实施例涉及人工智能的机器学习技术，具体通过如下实施例进行说明：

结合上述流程架构，下面将对本申请中类增量模型的训练方法进行介绍，请参阅图3，图3为本申请实施例提供的一种类增量模型的训练方法的流程图，该管理方法可以是由终端或服务器执行的，本申请实施例至少包括以下步骤：

301、获取第一类增量模型和符合长尾分布的训练数据。

本实施例中，训练数据用于在第一类增量模型中增加对于目标类别进行分类的分类器；即需要在第一类增量模型中增加的分类类别，使得训练后的模型具有对目标类型的数据分类的能力。

具体的，由于每个类当中所包含的样本的数量服从一个长尾分布，也就是说每个类别所包含的样本数量都不相同，且有些类包含的样本数量极少。故对于训练数据的获取，可以进行样本类别维度的统计，即首先获取第一类增量模型，并确定为第一类增量模型配置的目标类别；然后获取目标类别对应的业务数据；进而对业务数据进行样本数量的统计，以得到符合长尾分布的训练数据。例如图4所示的场景，图4为本申请实施例提供的一种类增量模型的训练方法的场景示意图；图中示出了随机顺序的长尾场景则类似于一般业务应用实际数据的应用场景，即样本数量的分布不均匀。

另外，还可以按照标准的长尾类数据统计方式进行统计，即对业务数据按照目标类别的分类进行样本数量的统计，以得到类别序列；然后将类别序列按照预设规则进行排列，例如按照样本数量从大到小以得到符合长尾分布的训练数据。例如图5所示的场景，图5为本申请实施例提供的另一种类增量模型的训练方法的场景示意图；图中示出了标准的长尾类增量学习更类似于实际当中应用了一定数据进行预训练的类增量学习，与标准的类增量学习对比，上述两种设置都更加符合真实场景的情况。

进一步的，针对长尾分布的类增量学习任务，本实施例提出了如下的两阶段训练模型，该模型可以添加到任意模型的训练当中，以提高其在不均匀分布数据当中的连续学习的性能。

302、基于训练数据对第一类增量模型进行训练，以得到第二类增量模型。

本实施例中，第一类增量模型即为基础的类增量模型，基于训练数据对第一类增量模型进行训练的过程，即对其中的特征提取网络以及各个类别对应的分类器进行训练。

具体的，对于特征提取网络以及各个类别对应的分类器进行训练的过程，即首先确定第一类增量模型中的多个类别分支和特征提取网络；然后基于训练数据分别获取对应于各个类别分支的类别数据；并根据特征提取网络分别提取类别数据对应的类别特征；进而基于类别数据对应的类别标签与类别特征的对应关系对特征提取网络和各个类别分支的分类器进行训练，以得到第二类增量模型。

具体的，针对长尾分布的类增量学习，本实施例提出了一种能够直接应用于各种现有模型的训练范式，通过在模型分类器后加入一个可学习的参数缩放模块(即参数模块)，并在模型完成每个任务的学习后进行一次额外阶段的学习来更新分类器和参数缩放模块的参数。这种方式得到的模型在实际场景中能够更加适应不均衡的数据分布，进而提升在实际场景当中的分类效果。同时，将该训练流程应用到常规的类增量学习任务当中，也能够使原有的模型性能得到进一步提升。

结合上述训练过程，即为第一阶段的训练过程，分阶段的训练流程如图6所示，图6为本申请实施例提供的另一种类增量模型的训练方法的场景示意图；该模型主要分为两个阶段对模型进行训练，对于第一阶段，主要进行一般的类增量学习的训练，即进行原始模型在一般的连续学习任务当中的训练，该阶段与一般的类增量学习没有明显差异，即将新任务的数据与模型保留的此前见过的类的采样混合作为训练集对模型进行训练。

在此阶段，可以希望能够学习到一个良好的特征表达，为后续的分类器以及LWS层的训练提供一个稳定的特征提取器f_θ，对于输入x，此时得到的分类结果为：

其中，为先前的所有任务的分类器的组合，/>为当前任务训练的特征提取网络。

可以理解的是，上述训练过程可与不同的基础的连续学习方法进行结合，以减少特征方面的遗忘，利用该结果作为模型输出与标签进行损失函数的计算，以得到一个稳定的特征表达，进行接下来第二阶段的分类器以及参数模块(LWS)的训练。

303、对训练数据进行均匀采样，以得到第二类增量模型中各个分类器对应的采样数据。

本实施例中，各个分类器对应的采样数据的样本数量相同；即为第二阶段的采样过程；首先对数据进行均匀采样，使每次训练的批次当中的每个类的样本数量是相同的，利用均匀采样的数据进行训练能够降低单次训练所带来的模型偏差。利用均匀采样的训练数据集进行模型训练。二阶段的模型训练与一阶段的训练有所不同，二阶段加入了对额外加入的模块LWS(可学习的参数模块)的学习，该模块用于解决不同类别之间的数据不平衡问题，他通过为每一个分类结果训练一个进行缩放的权重参数来调整不同分类结果的表达。

具体的，对于对训练数据进行均匀采样的过程可以是基于样本数量中的最小值进行的，即首先确定目标类别在训练数据中对应的样本数量分布；然后基于样本数量分布确定样本数量中的最小值，以得到参考数量；进而根据参考数量对训练数据中各个类别下的数据进行均匀采样，以得到第二类增量模型中各个分类器对应的采样数据，从而保证每个类别均由足够的样本进行训练。

进一步的，为了保证各个分类器训练的有效性，还可以配置样本阈值，即样本的底线数量；首先获取针对于目标类别配置的样本阈值；若参考数量大于或等于样本阈值，则根据参考数量对训练数据中各个类别下的数据进行均匀采样，以得到第二类增量模型中各个分类器对应的采样数据。若参考数量小于样本阈值，则发出提醒，进行样本的补充，从而保证训练的有效性。

304、基于采样数据对第二类增量模型中配置的参数模块和目标类别对应的分类器进行训练，以对第二类增量模型进行参数更新得到第三类增量模型。

本实施例中，训练后的参数模块用于确定权重参数，权重参数用于平衡第二类增量模型中各个分类器输出的分类参数，即结合类别均衡的采样，缓解最终的分类结果对样本数量多的类别的过度表达，从而使得第三类增量模型用于根据分类参数输出分类结果。

具体的，对于第二阶段的训练过程，即选择性的参数更新，如图6所示，对除去目标类别对应的分类器之外的分类器参数以及特征提取网络的参数进行固定；然后获取第二类增量模型对应的类别数目；并基于类别数目配置维度相同的参数模块；进一步的根据第二类增量模型对应的各个类别的样本数量对参数模块进行权重参数的配置；然后基于权重参数对第二类增量模型对应的各个分类器输出的分类参数进行加权，以得到加权分类参数；并基于加权分类参数与采样数据的标签进行损失函数的计算，以对第二类增量模型中配置的参数模块和目标类别对应的分类器进行训练进而根据训练过程对第二类增量模型进行参数更新，以得到第三类增量模型。

可以理解的是，由于第一阶段可以已经进行了特征和分类器的学习，所以在第二阶段，不需要对其再进行重复的训练。经试验验证，如果在阶段二的训练更新以及将导致特征的遗忘增加，所以对于基础的网络，可以在第二阶段的训练当中只更新即当前任务新学习到的分类器。

相较于第一阶段的训练，在基础网络的基础上，可以在阶段二中还额外学习一个用来调整不同类别的特征表达的LWS层(参数模块)，该层由一个与类别数目相同长度的一维向量W组成，该层为每一个类别表达增加了一个额外的权重，且额外的可训练参数用全连接层代替。

进一步的，结合类别均衡的采样，缓解最终的分类结果对样本数量多的类别的过度表达。具体的，此时的网络输出为：

此时利用进行损失函数的计算，这里可以应用简单的交叉熵进行训练即可，经验证该模块能够有效提升样本不平衡情况下的分类精度。

因此，经过第二阶段的训练，可以得到的基础网络以及LWS层结合即为当前任务学习得到的模型，在进行分类时，对于输入x，输出为:

在一种可能的场景中，本实施例能够在两种不同的长尾分布场景下均取得较为优秀的表现，并且也能够在标准的CIL任务当中取得不错的性能，具体表现如图7所示，图7为本申请实施例提供的另一种类增量模型的训练方法的场景示意图；表中左侧表示三种不同的CIL场景，分别在CIFAR-100和ImageNet-Subset数据集上进行实验，分别进行十类每任务，共五个任务的实验和五类每任务，共十个任务的实验。基础的第一个任务的训练均采用50个类进行训练，可见每个任务均具有准确度上的提升。

结合上述实施例可知，通过获取第一类增量模型和符合长尾分布的训练数据，该训练数据用于在第一类增量模型中增加对于目标类别进行分类的分类器；然后基于训练数据对第一类增量模型进行训练，以得到第二类增量模型；进一步的对训练数据进行均匀采样，以得到第二类增量模型中各个分类器对应的采样数据，各个分类器对应的采样数据的样本数量相同；进而基于采样数据对第二类增量模型中配置的参数模块和目标类别对应的分类器进行训练，以对第二类增量模型进行参数更新得到第三类增量模型，该训练后的参数模块用于确定权重参数，权重参数用于平衡第二类增量模型中各个分类器输出的分类参数，其中第三类增量模型用于根据分类参数输出分类结果。从而实现类增量模型的分阶段训练过程，由于在分阶段训练中对长尾分布的训练数据进行均匀采样，并针对性的进行样本数量维度的加权，减小了样本数量对于类增量模型训练过程的影响，提高了训练后类增量模型分类的准确性。

为了更好的实施本申请实施例的上述本实施例，下面还提供用于实施上述本实施例的相关装置。请参阅图8，图8为本申请实施例提供的一种类增量模型的训练装置的结构示意图，类增量模型的训练装置800包括：

获取单元801，用于获取第一类增量模型和符合长尾分布的训练数据，所述训练数据用于在所述第一类增量模型中增加对于目标类别进行分类的分类器；

训练单元802，用于基于所述训练数据对所述第一类增量模型进行训练，以得到第二类增量模型；

采样单元803，用于对所述训练数据进行均匀采样，以得到所述第二类增量模型中各个分类器对应的采样数据，各个所述分类器对应的采样数据的样本数量相同；

所述训练单元802，还用于基于所述采样数据对所述第二类增量模型中配置的参数模块和所述目标类别对应的分类器进行训练，以对所述第二类增量模型进行参数更新得到第三类增量模型，训练后的所述参数模块用于确定权重参数，所述权重参数用于平衡所述第二类增量模型中各个分类器输出的分类参数，所述第三类增量模型用于根据所述分类参数输出分类结果。

可选的，在本申请一些可能的实现方式中，所述获取单元801，具体用于获取所述第一类增量模型，并确定为所述第一类增量模型配置的所述目标类别；

所述获取单元801，具体用于获取所述目标类别对应的业务数据；

所述获取单元801，具体用于对所述业务数据进行样本数量的统计，以得到符合长尾分布的所述训练数据。

可选的，在本申请一些可能的实现方式中，所述获取单元801，具体用于对所述业务数据按照所述目标类别的分类进行样本数量的统计，以得到类别序列；

所述获取单元801，具体用于将所述类别序列按照预设规则进行排列，以得到符合长尾分布的所述训练数据。

可选的，在本申请一些可能的实现方式中，所述训练单元802，具体用于确定所述第一类增量模型中的多个类别分支和特征提取网络；

所述训练单元802，具体用于基于所述训练数据分别获取对应于各个所述类别分支的类别数据；

所述训练单元802，具体用于根据所述特征提取网络分别提取所述类别数据对应的类别特征；

所述训练单元802，具体用于基于所述类别数据对应的类别标签与所述类别特征的对应关系对所述特征提取网络和各个所述类别分支的分类器进行训练，以得到所述第二类增量模型。

可选的，在本申请一些可能的实现方式中，所述采样单元803，具体用于确定所述目标类别在所述训练数据中对应的样本数量分布；

所述采样单元803，具体用于基于样本数量分布确定样本数量中的最小值，以得到参考数量；

所述采样单元803，具体用于根据所述参考数量对所述训练数据中各个类别下的数据进行均匀采样，以得到所述第二类增量模型中各个分类器对应的采样数据。

可选的，在本申请一些可能的实现方式中，所述采样单元803，具体用于获取针对于所述目标类别配置的样本阈值；

所述采样单元803，具体用于若所述参考数量大于或等于所述样本阈值，则根据所述参考数量对所述训练数据中各个类别下的数据进行均匀采样，以得到所述第二类增量模型中各个分类器对应的采样数据。

可选的，在本申请一些可能的实现方式中，所述训练单元802，具体用于对除去所述目标类别对应的分类器之外的分类器参数进行固定；

所述训练单元802，具体用于获取所述第二类增量模型对应的类别数目；

所述训练单元802，具体用于基于所述类别数目配置维度相同的所述参数模块；

所述训练单元802，具体用于根据所述第二类增量模型对应的各个类别的样本数量对所述参数模块进行权重参数的配置；

所述训练单元802，具体用于基于所述权重参数对所述第二类增量模型对应的各个分类器输出的分类参数进行加权，以得到加权分类参数；

所述训练单元802，具体用于基于所述加权分类参数与所述采样数据的标签进行损失函数的计算，以对所述第二类增量模型中配置的参数模块和所述目标类别对应的分类器进行训练；

所述训练单元802，具体用于根据训练过程对所述第二类增量模型进行参数更新，以得到所述第三类增量模型。

本申请实施例还提供了一种终端设备，如图9所示，是本申请实施例提供的另一种终端设备的结构示意图，为了便于说明，仅示出了与本申请实施例相关的部分，具体技术细节未揭示的，请参照本申请实施例方法部分。该终端可以为包括手机、平板电脑、个人数字助理(personal digital assistant，PDA)、销售终端(point of sales，POS)、车载电脑等任意终端设备，以终端为手机为例：

图9示出的是与本申请实施例提供的终端相关的手机的部分结构的框图。参考图9，手机包括：射频(radio frequency，RF)电路910、存储器920、输入单元930、显示单元940、传感器950、音频电路960、无线保真(wireless fidelity，WiFi)模块970、处理器980、以及电源990等部件。本领域技术人员可以理解，图9中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图9对手机的各个构成部件进行具体的介绍：

RF电路910可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器980处理；另外，将设计上行的数据发送给基站。通常，RF电路910包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(low noiseamplifier，LNA)、双工器等。此外，RF电路910还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统(globalsystem of mobile communication，GSM)、通用分组无线服务(general packet radioservice，GPRS)、码分多址(code division multiple access，CDMA)、宽带码分多址(wideband code division multiple access,WCDMA)、长期演进(long term evolution，LTE)、电子邮件、短消息服务(short messaging service，SMS)等。

存储器920可用于存储软件程序以及模块，处理器980通过运行存储在存储器920的软件程序以及模块，从而执行手机的各种功能应用以及数据处理。存储器920可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器920可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元930可用于接收输入的数字或字符信息，以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地，输入单元930可包括触控面板931以及其他输入设备932。触控面板931，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板931上或在触控面板931附近的操作，以及在触控面板931上一定范围内的隔空触控操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板931可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器980，并能接收处理器980发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板931。除了触控面板931，输入单元930还可以包括其他输入设备932。具体地，其他输入设备932可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元940可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元940可包括显示面板941，可选的，可以采用液晶显示器(liquid crystaldisplay，LCD)、有机发光二极管(organic light-emitting diode，OLED)等形式来配置显示面板941。进一步的，触控面板931可覆盖显示面板941，当触控面板931检测到在其上或附近的触摸操作后，传送给处理器980以确定触摸事件的类型，随后处理器980根据触摸事件的类型在显示面板941上提供相应的视觉输出。虽然在图9中，触控面板931与显示面板941是作为两个独立的部件来实现手机的输入和输入功能，但是在某些实施例中，可以将触控面板931与显示面板941集成而实现手机的输入和输出功能。

手机还可包括至少一种传感器950，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板941的亮度，接近传感器可在手机移动到耳边时，关闭显示面板941和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路960、扬声器961，传声器962可提供用户与手机之间的音频接口。音频电路960可将接收到的音频数据转换后的电信号，传输到扬声器961，由扬声器961转换为声音信号输出；另一方面，传声器962将收集的声音信号转换为电信号，由音频电路960接收后转换为音频数据，再将音频数据输出处理器980处理后，经RF电路910以发送给比如另一手机，或者将音频数据输出至存储器920以便进一步处理。

WiFi属于短距离无线传输技术，手机通过WiFi模块970可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图9示出了WiFi模块970，但是可以理解的是，其并不属于手机的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器980是手机的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器920内的软件程序和/或模块，以及调用存储在存储器920内的数据，执行手机的各种功能和处理数据，从而对手机进行整体检测。可选的，处理器980可包括一个或多个处理单元；可选的，处理器980可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器980中。

手机还包括给各个部件供电的电源990(比如电池)，可选的，电源可以通过电源管理系统与处理器980逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出，手机还可以包括摄像头、蓝牙模块等，在此不再赘述。

在本申请实施例中，该终端所包括的处理器980还具有执行如上述页面处理方法的各个步骤的功能。

本申请实施例还提供了一种服务器，请参阅图10，图10是本申请实施例提供的一种服务器的结构示意图，该服务器1000可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processing units，CPU)1022(例如，一个或一个以上处理器)和存储器1032，一个或一个以上存储应用程序1042或数据1044的存储介质1030(例如一个或一个以上海量存储设备)。其中，存储器1032和存储介质1030可以是短暂存储或持久存储。存储在存储介质1030的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1022可以设置为与存储介质1030通信，在服务器1000上执行存储介质1030中的一系列指令操作。

服务器1000还可以包括一个或一个以上电源1026，一个或一个以上有线或无线网络接口1050，一个或一个以上输入输出接口1058，和/或，一个或一个以上操作系统1041，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

上述实施例中由管理装置所执行的步骤可以基于该图10所示的服务器结构。

本申请实施例中还提供一种计算机可读存储介质，该计算机可读存储介质中存储有类增量模型的训练指令，当其在计算机上运行时，使得计算机执行如前述图3至图7所示实施例描述的方法中类增量模型的训练装置所执行的步骤。

本申请实施例中还提供一种包括类增量模型的训练指令的计算机程序产品，当其在计算机上运行时，使得计算机执行如前述图3至图7所示实施例描述的方法中类增量模型的训练装置所执行的步骤。

本申请实施例还提供了一种类增量模型的训练系统，所述类增量模型的训练系统可以包含图8所描述实施例中的类增量模型的训练装置，或图9所描述实施例中的终端设备，或者图10所描述的服务器。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例本实施例的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术本实施例本质上或者说对现有技术做出贡献的部分或者该技术本实施例的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，类增量模型的训练装置，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术本实施例，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术本实施例进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术本实施例的本质脱离本申请各实施例技术本实施例的精神和范围。

Claims

1.一种类增量模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述获取第一类增量模型和符合长尾分布的训练数据，包括：

获取所述目标类别对应的业务数据；

3.根据权利要求2所述的方法，其特征在于，所述对所述业务数据进行样本数量的统计，以得到符合长尾分布的所述训练数据，包括：

4.根据权利要求1所述的方法，其特征在于，所述基于所述训练数据对所述第一类增量模型进行训练，以得到第二类增量模型，包括：

5.根据权利要求1所述的方法，其特征在于，所述对所述训练数据进行均匀采样，以得到所述第二类增量模型中各个分类器对应的采样数据，包括：

确定所述目标类别在所述训练数据中对应的样本数量分布；

6.根据权利要求5所述的方法，其特征在于，所述根据所述参考数量对所述训练数据中各个类别下的数据进行均匀采样，以得到所述第二类增量模型中各个分类器对应的采样数据，包括：

获取针对于所述目标类别配置的样本阈值；

7.根据权利要求1所述的方法，其特征在于，所述基于所述采样数据对所述第二类增量模型中配置的参数模块和所述目标类别对应的分类器进行训练，以对所述第二类增量模型进行参数更新得到第三类增量模型，包括：

获取所述第二类增量模型对应的类别数目；

基于所述类别数目配置维度相同的所述参数模块；

8.一种类增量模型的训练装置，其特征在于，包括：

9.一种计算机设备，其特征在于，所述计算机设备包括处理器以及存储器：

所述存储器用于存储程序代码；所述处理器用于根据所述程序代码中的指令执行权利要求1至7任一项所述的类增量模型的训练方法。

10.一种计算机程序产品，包括计算机程序/指令，所述计算机程序/指令存储于计算机可读存储介质，其特征在于，所述计算机可读存储介质中的所述计算机程序/指令被处理器执行时实现上述权利要求1至7任一项所述的类增量模型的训练方法的步骤。