WO2018090545A1

WO2018090545A1 - 融合时间因素的协同过滤方法、装置、服务器和存储介质

Info

Publication number: WO2018090545A1
Application number: PCT/CN2017/079565
Authority: WO
Inventors: 曹路洋; 王建明; 肖京
Original assignee: 平安科技（深圳）有限公司
Priority date: 2016-11-15
Filing date: 2017-04-06
Publication date: 2018-05-24
Also published as: US10565525B2; JP6484730B2; CN106530010B; TWI658420B; JP2019507398A; AU2017101862A4; SG11201709930TA; KR20190084866A; US20180300648A1; CN106530010A; EP3543941A4; KR102251302B1; EP3543941A1; AU2017268629A1; TW201820231A

Abstract

一种融合时间因素的协同过滤方法，包括：建立指数平滑模型(202)；获取对所述指数平滑模型拟定的时间段，所述时间段包括多个时间周期(204)；获取多个用户标识以及用户标识在多个时间周期内对指定产品的用户喜好程度值(206)；利用所述指数平滑模型对所述用户喜好程度值进行迭代计算，得到与时间周期对应的平滑结果(208)；利用所述用户标识和所述与时间周期对应的平滑结果生成稀疏矩阵，所述稀疏矩阵包括多个待预测用户喜好程度(210)；获取协同过滤模型，将所述时间周期对应的平滑结果输入至所述协同过滤模型(212)；及通过所述协同过滤模型进行训练，计算得到所述稀疏矩阵中的多个待预测用户喜好程度的预测值(214)。

Description

融合时间因素的协同过滤方法、装置、服务器和存储介质

本申请要求于2016年11月15日提交中国专利局，申请号为2016110052001，发明名称为“融合时间因素的协同过滤方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及计算机技术领域，特别是涉及一种融合时间因素的协同过滤方法、装置、服务器和存储介质。

背景技术

收集用户对产品的喜好，通过进行数据分析和挖掘可以有效提高产品信息推送的准确度。在传统的方式中，用户某个产品的喜好程度通常是只是利用用户行为来构建的。例如，用户行为包括：点击、收藏和购买等。在对未知的用户喜好程度值进行预测时也就缺乏了时间因素的考虑。假设，用户在一年之前购买的某个产品，而在今年未再继续够买该产品。如果利用该用户对该产品在一年前的喜好程度来预测其他用户在今年对该产品的喜好程度，那么预测结果显然无法反映出实际状况。如何结合时间因素对指定产品的用户喜好程度值进行有效预测成为目前需要解决的一个技术问题。

发明内容

根据本申请的各种实施例，提供一种融合时间因素的协同过滤方法、装置、服务器和存储介质。

一种融合时间因素的协同过滤方法，包括：

建立指数平滑模型；

获取对所述指数平滑模型拟定的时间段，所述时间段包括多个时间周期；

获取多个用户标识以及用户标识在多个时间周期内对指定产品的用户喜好程度值；

利用所述指数平滑模型对所述用户喜好程度值进行迭代计算，得到与时间周期对应的平滑结果；

利用所述用户标识和所述与时间周期对应的平滑结果生成稀疏矩阵，所述稀疏矩阵包括多个待预测用户喜好程度；

获取协同过滤模型，将所述时间周期对应的平滑结果输入至所述协同过滤模型；及

通过所述协同过滤模型进行训练，计算得到所述稀疏矩阵中的多个待预测用户喜好程度的预测值。

一种融合时间因素的协同过滤装置，包括：

模型建立模块，用于建立指数平滑模型；

获取模块，用于获取对所述指数平滑模型拟定的时间段，所述时间段包括多个时间周期；获取多个用户标识以及用户标识在多个时间周期内对指定产品的用户喜好程度值；

平滑模块，用于利用所述指数平滑模型对所述用户喜好程度值进行迭代计算，得到与时间周期对应的平滑结果；

矩阵生成模块，用于利用所述用户标识和所述与时间周期对应的平滑结果生成稀疏矩阵，所述稀疏矩阵包括多个待预测用户喜好程度；

所述获取模块还用于获取协同过滤模型；及

第一训练模块，用于将所述时间周期对应的平滑结果输入至所述协同过滤模型；通过所述协同过滤模型进行训练，计算得到所述稀疏矩阵中的多个待预测用户喜好程度的预测值。

一种服务器，包括存储器和处理器，所述存储器中储存有计算机可执行指令，所述计算机可执行指令被所述处理器执行时时，使得所述处理器执行以下步骤：

建立指数平滑模型；

一个或多个存储有计算机可执行指令的非易失性可读存储介质，所述计算机可执行指令被一个或多个处理器执行时，使得所述一个或多个处理器执行以下步骤：

建立指数平滑模型；

本申请的一个或多个实施例的细节在下面的附图和描述中提出。本申请的其它特征、目的和优点将从说明书、附图以及权利要求书变得明显。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他实施例的附图。

图1为一个实施例中融合时间因素的协同过滤方法的应用场景图；

图2为一个实施例中融合时间因素的协同过滤方法的流程图；

图3为一个实施例中二维空间中记录点的示意图；

图4为一个实施例中服务器的框图；

图5为一个实施例中融合时间因素的协同过滤装置的框图；

图6为另一个实施例中融合时间因素的协同过滤装置的框图；

图7为再一个实施例中融合时间因素的协同过滤装置的框图；

图8为还一个实施例中融合时间因素的协同过滤装置的框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请实施例中提供的融合时间因素的协同过滤方法可以应用于如图1所示的应用场景中。终端102与服务器104通过网络连接。终端102可以有多个。终端102上安装了可以访问服务器的应用程序，用户通过该应用程序访问服务器104时，服务器104向终端102返回相应的页面。用户可以对页面展示的产品进行点击、收藏以及购买等。用户通过终端102进行操作时，服务器104可以采集用户标识以及上述用户行为。服务器104通过在预设的时间周期内对指定产品采集用户行为得到用户喜好程度值。服务器104建立指数平滑模型。服务器104可以对指数平滑模型拟定对应的时间段，时间段内可以有多个时间周期。服务器104获取多个用户标识以及用户标识在多个时间周期内对指定产品的用户喜好程度值。服务器104将多个时间周期对应的用户喜好程度值输入指数平滑模型，对多个时间周期的用户喜好程度值进行迭代计算，得到多个与时间周期对应的平滑结果。服务器104利用用户标识和时间周期对应的平滑结果生成用户标识与产品标识对应的稀疏矩阵，稀疏矩阵包括多个待预测用户喜好程度。服务器104获取协同过滤模型，将与时间周期对应的平滑结果输入至协同过滤模型。通过协同过滤模型进行训练，计算得到稀疏矩阵中的多个待预测用户喜好程度的预测值。

在一个实施例中，如图2所示，提供了一种融合时间因素的协同过滤方法，应该理解的是，虽然图2的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，图2中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。以该方法应用于服务器为例进行说明，具体包括：

步骤202，建立指数平滑模型。

步骤204，获取对指数平滑模型拟定的时间段，时间段包括多个时间周期。

用户喜好程度是指用户对指定产品的喜好程度。用户喜好程度可以采用数值来表示。服务器上预先存储了用户喜好数据。其中，用户喜好数据包括用户标识、产品标识和对应的用户喜好程度值等。用户喜好程度值可以是服务器在预设的时间周期内对指定产品采集用户行为来得到的，用户行为包括：点击、购买和收藏等。用户喜好程度可以是与时间周期相对应的。对于不同的指定产品，用户喜好程度对应的时间周期可以是相同的，也可以是不同的。例如，游戏产品，用户喜好程度对应的时间周期可以是一天。保险产品，用户喜好程度对应的时间周期可以是一个月或者一个月等。

为了将用户对指定产品的用户喜好程度与时间因素进行有效结合，服务器建立指数平滑模型。通过指数平滑模型将多个时间周期的用户喜好程度进行融合。

在其中一个实施例中，平滑模型的公式包括：P_t+1＝a*P_t+(1-a)*P_t-1；其中，a表示产品标识对应的指数系数；P_t+1表示下一个时间周期对应的用户喜好程度值；P_t表示当前时间周期对应的用户喜好程度值；P_t-1表示上一个时间周期对应的用户喜好程度值。

服务器可以对指数平滑模型拟定对应的时间段，时间段内可以有多个时间周期。时间段可以根据指定产品特性来拟定，不同的指定产品可以拟定不同的时间段。例如，对理财产品的指数平滑模型所拟定的时间段可以是一个月，该时间段内的时间周期可以是以天为单位。对保险产品的指数平滑模型所拟定的时间段可以是一年，该时间段内的时间周期可以是以月为单位。

不同的指定产品可以对应不同的指数系数。指数系数可以反映时间周期对用户喜好程度影响的重要性。指数系数越大，时间周期对用户喜好程度的影响的重要性就越高。时间周期彼此之间越接近，对用户喜好程度的影响也就越大。

步骤206，获取多个用户标识以及用户标识在多个时间周期内对指定产品的用户喜好程度值。

服务器对指数平滑模型拟定的时间段中包括多个时间周期，服务器获取多个用户标识以及用户标识在多个时间周期内对指定产品的用户喜好程度值。其中，多个时间周期内对指定产品的用户喜好程度值可以是用户对一个指定产品的用户喜好程度值，也可以是用户对多个指定产品的用户喜好程度值。

步骤208，利用指数平滑模型对用户喜好程度值进行迭代计算，得到时间周期对应的平滑结果。

服务器将多个时间周期对应的用户喜好程度值输入指数平滑模型，对多个时间周期的用户喜好程度值进行迭代计算，得到多个与时间周期对应的平滑结果。具体的，服务器根据产品标识获取指数平滑模型对应的指数系数。服务器将拟定的时间段中的第一个时间周期对应的用户喜好程度值与指数系数相乘，将乘积作为指数平滑模型的初始值，该初始值也可以称为第一时间周期对应的平滑结果。服务器利用第一时间周期对应的平滑结果、第二时间周期对应的用户喜好程度值、指数系数输入指数平滑模型进行迭代计算，得到第二时间周期对应的平滑结果。以此类推，服务器计算得到多个时间周期对应的平滑结果。

假设，指定产品为对产品1，时间周期为一天，平滑指数模型中的指数系数为0.3，拟定的时间段为4天，现在需要预测第5天的用户喜好程度值，那么首先需要利用指数平滑模型对前面4天的用户喜好程度值分别进行迭代计算，得到相应的平滑结果可以如表一所示：

表一：

其中，第一天的平滑结果为：0.3*8＝2.4；第二天的平滑结果为：0.3*9+(1-0.3)*2.4＝4.38；第三天的平滑结果为：0.3*5+(1-0.3)*4.38＝4.566；第四天的平滑结果为：0.3*3+(1-0.3)*4.566＝4.096。由此通过指数平滑模型将指定产品的用户喜好程度值与时间因素进行了融合。

步骤210，利用用户标识和与时间周期对应的平滑结果生成稀疏矩阵，稀疏矩阵包括多个待预测用户喜好程度。

服务器利用用户标识和时间周期对应的平滑结果生成用户标识与产品标识对应的稀疏矩阵。稀疏矩阵中可以包括多个用户标识和一个产品标识，也可以包括多个用户标识和多个产品标识。系数矩阵中包括已知的用户喜好程度值和未知的用户喜好程度值。其中，未知的用户喜好程度值也就是待预测用户喜好程度的预测值。

在稀疏矩阵中，待预测用户喜好程度的预测值可以用预设字符来表示。例如，用？来表示。举例，稀疏矩阵中的行表示产品标识，列表示用户标识，稀疏矩阵中的数值表示用户对产品的用户喜好程度值，如下表二所示：

由于稀疏矩阵中的用户喜好程度值采用的是与时间周期对应的平滑结果，因此稀疏矩阵也与时间因素进行了有效融合。当需要预测下一个时间周期内未知的用户喜好程度值时，服务器获取当前时间周期内的产品标识、用户标识以及用户喜好程度值在当前时间周期的平滑结果来生成用户标识与产品标识对应的稀疏矩阵。

步骤212，获取协同过滤模型，将与时间周期对应的平滑结果输入至协同过滤模型。

步骤214，通过协同过滤模型进行训练，计算得到稀疏矩阵中的多个待预测用户喜好程度的预测值。

协同过滤模型可以采用传统的协同过滤模型。服务器获取协同过滤模型，将与时间周期对应的平滑结果输入至协同过滤模型。通过协同过滤模型进行训练，计算得到稀疏矩阵中的多个待预测用户喜好程度的预测值。

具体的，当预测下一个时间周期内未知的用户喜好程度值时，服务器获取多个用户标识在上一个时间周期的平滑结果，将上一个时间周期的平滑处理结果输入至协同过滤模型。通过协同过滤模型进行训练，计算出用户标识与产品标识对应的稀疏矩阵中的待预测用户喜好程度在下一个时间周期的预测值。

本实施例中，通过建立指数平滑模型，将多个时间周期内的用户喜好程度值进行迭代计算，得到与时间周期对应的平滑结果，从而使得对指定产品的用户喜好程度值与时间因素进行了有效融合。当预测下一个时间周期内未知的用户喜好程度值时，可以利用用户标识和与时间周期对应的平滑结果生成稀疏矩阵，将与时间周期对应的平滑结果输入至协同过滤模型，通过协同过滤模型进行训练，从而计算得到稀疏矩阵中的多个待预测用户喜好程度的预测值。由于输入至协同过滤模型的平滑结果是与时间因素进行了融合的，由此能够预测出对指定产品与时间因素相关的用户喜好程度值。从而实现了结合时间因素对指定产品的用户喜好程度进行有效预测。

在一个实施例中，在计算得到稀疏矩阵中的多个待预测用户喜好程度的预测值的步骤之后，还包括：获取用户喜好程度值对应的维度；根据用户标识对多个维度的用户喜好程度值进行统计；对统计结果进行正则化处理，得到用户标识对应的多维向量；根据多维向量计算用户标识彼此之间的用户喜好的相似度。

本实施例中，服务器对稀疏矩阵中多个待预测用户喜好程度计算出相应的预测值之后，还可以对所有已知的和预测出的用户喜好程度值进行相似度计算，从而得到用户喜好程序相似的多个用户标识。

服务器可以将产品标识作为用户喜好程度值对应的维度。不同的产品标识也就是不同的维度。用户喜好程度值可以视为空间中散落的记录点。以空间为二维空间的地图为例，如图3所示，每个记录点可以用经度和纬度来表示。图3中的X轴可以表示维度，Y轴表示经度。假设，用户标识1的用户喜好程度值在图3中的记录点采用黑色点来表示，用户标识2的用户喜好程度值在图3中的记录点采用灰色点来表示。用户标识1的记录点有4个，用户标识2的记录点有3个。由于每个记录点的经度和纬度不同，无法直接进行相似度比较。如果利用经度均值和维度均值组成的均值点来进行比较，均值点显然已经严重偏离了用户的记录点，不能表达真实的用户喜好程度值。

为了对用户喜好程度值进行有效比较，服务器对所有的记录点进行聚类，例如，服务器可以采用KMeans算法(一种聚类算法)进行聚类得到多个类。每一类都可以有对应的维度。每一类中包括多个用户标识对应的用户喜好程度值的记录点。

服务器根据用户标识对多个维度的用户喜好程度值进行统计，得到用户喜好程度值的统计结果。服务器对统计结果进行正则化处理，得到用户标识对应的多维向量，根据多维向量计算用户标识彼此之间的相似距离，将相似距离作为用户喜好的相似度。

以图3中的用户标识1和用户标识2对应的记录点为例进行说明。服务器对图3中的记录点进行聚类，得到三个维度。其中，用户标识1在第一维度中有2个记录点，在第二维度中有1个记录点，在第三维度中有1个记录点。用户标识2在第一维度中有2个记录点，在第二维度中有1个记录点，在第三维度中有0个记录点。服务器统计用户标识1对应的用户喜好程度值的记录点总数为4个，用户标识2对应的用户喜好程度值的记录点总数为3个。服务器对统计结果进行正则化处理，得到用户标识1对应的多维向量(2/4，1/4，1/4)以及用户标识2对应的多维向量(2/4，1/4，1/4)。根据多维向量计算用户标识1与用户标识2之间的相似距离，将该相似距离作为用户喜好的相似度。相似距离的计算方法可以有多种，例如采用欧式距离的计算方法等来计算相似距离。

通过计算用户标识彼此之间用户喜好的相似度，由此可以在海量的用户中有效提取出用户喜好相似的用户。进而方便对用户喜好相似的用户进行消息推荐和消费倾向进行预测。

在一个实施例中，该方法还包括：根据产品标识和用户标识获取用户喜好程度值对应的正样本和负样本；将负样本进行拆分，得到多个拆分后的负样本，拆分后的负样本的数量与正样本的数量的差值在预设范围内；获取分类模型，利用正样本和拆分后的负样本对分类模型进行训练，得到多个训练后的分类模型；对多个训练后的分类模型进行拟合，计算得到每个训练后的分类模型对应的分类权重。

本实施例中，服务器还可以根据产品标识和用户标识获取用户喜好程度值对应的正样本和负样本。正样本表示用户喜欢某产品，负样本表示用户不喜欢某产品。例如，正样本为用户1喜欢iPhone7(一种手机)，负样本为用户2不喜欢iPhone7。用户喜好程度值包括已知的用户喜好程度值和预测出的用户喜好程度值。服务器可以采用已知的用户喜好程度值来进行分类训练，也可以采用已知的用户喜好程度值和预测出的用户喜好程度值进行分类训练。

正样本和负样本可以统称为样本。服务器上预先存储了相应的样本数据，样本数据包括用户特征数据和产品特征数据。其中，用户特征数据包括用户的年龄和性别等，产品特征数据包括产品标识和产品类型等。

通常在一个新产品推出时，喜好该新产品的用户数量要远远小于不喜欢该新产品的用户数量。由此造成用户对某个产品的正样本数量要小于负样本的数量。

传统的分类训练方式主要有两种。传统的方式一是通过在负样本进行欠抽样，得到与正样本数量相当的负样本，利用欠抽样的负样本与正样本进行分类训练。但是由于欠抽样的负样本只是负样本中的一小部分数据，没有完全利用所有样本数据，导致分类模型不够准确。传统的方式二是通过将正样本进行复制，使得正样本的数量与负样本的数量基本持平。虽然传统的方式二中没有增加额外的样本信息，但是由于负样本的数量要远远大于正样本的数量，正样本复制后，导致需要计算的数据量激增，加重了服务器的运算负担。

为了有效解决传统方式中出现的样本数据未充分利用以及样本数据被全部采用后导致服务器运算负担加重的问题，本实施例中提供了一种新的分类训练方式。

具体的，服务器根据产品标识和用户标识获取用户喜好程度值对应的正样本和负样本。服务器根据正样本的数量对负样本进行拆分。拆分后的负样本的数量与正样本的数量的差值在预设范围内。拆分后的负样本的数量与正样本的数量相等或持平。服务器获取分类模型，其中，分类模型可以采用传统的分类模型。服务器将每一份拆分后的负样本和正样本输入分类模型进行训练，得到与拆分后的负样本数量相同的训练后的分类模型。

服务器获取回归模型，其中，回归模型可以采用传统的回归模型。服务器将多个训练后的分类模型的输出结果输入至回归模型，通过回归模型对多个训练后的分类模型进行拟合，计算得到每个训练后的分类模型对应的分类权重。在整个过程中，不仅充分利用了所有的样本数据，而且需要计算的数据来也没有激增，有效缓解了服务器的运算负担。

在其中一个实施例中，在计算得到每个训练后的分类模型对应的分类权重的步骤之后，还包括：获取待分类样本数据；利用训练后的分类模型和分类权重对待分类样本数据进行分类。

服务器可以获取待分类的样本数据，将待分类样本数据分别输入至训练后的分类模型，利用每个训练后的分类模型和分类权重对待分类样本数据进行分类。由此可以对待分类样本数据进行快速有效的分类。

在一个实施例中，如图4所示，提供了一种服务器，包括通过系统总线连接的处理器、内存储器、非易失性存储介质和网络接口。其中，该服务器的非易失性存储介质中存储有操作系统和计算机可执行指令，该计算机可执行指令用于实现适用于服务器的一种融合时间因素的协同过滤方法。处理器用于提供计算和控制能力，支撑整个服务器的运行。网络接口用于据以与外部的终端通过网络连接通信。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本领域技术人员可以理解，图4中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的服务器的限定，具体的服务器可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，如图5所示，提供了一种融合时间因素的协同过滤装置，包括：模型建立模块502、获取模块504、平滑模块506、矩阵生成模块 508和第一训练模块510，其中：

模型建立模块502，用于建立指数平滑模型。

获取模块504，用于获取对指数平滑模型拟定的时间段，时间段包括多个时间周期；获取多个用户标识以及用户标识在多个时间周期内对指定产品的用户喜好程度值。

平滑模块506，用于利用指数平滑模型对用户喜好程度值进行迭代计算，得到与时间周期对应的平滑结果。

矩阵生成模块508，用于利用用户标识和与时间周期对应的平滑结果生成稀疏矩阵，稀疏矩阵包括多个待预测用户喜好程度。

获取模块504还用于获取协同过滤模型。

第一训练模块510，用于将时间周期对应的平滑结果输入至协同过滤模型；通过协同过滤模型进行训练，计算得到稀疏矩阵中的多个待预测用户喜好程度的预测值。

在一个实施例中，平滑模型的公式包括：

P_t+1＝a*P_t+(1-a)*P_t-1；

其中，a表示产品标识对应的指数系数；P_t+1表示下一个时间周期对应的用户喜好程度值；P_t表示当前时间周期对应的用户喜好程度值；P_t-1表示上一个时间周期对应的用户喜好程度值。

在一个实施例中，获取模块504还用于获取用户喜好程度值对应的维度；如图5所示，该装置还包括：统计模块512、正则化模块514和相似度计算模块516，其中：

统计模块512，用于根据用户标识对多个维度的用户喜好程度值进行统计。

正则化模块514，用于对统计结果进行正则化处理，得到用户标识对应的多维向量。

相似度计算模块516，用于根据多维向量计算用户标识彼此之间的用户喜好的相似度。

在一个实施例中，获取模块504还用于根据产品标识和用户标识获取用户喜好程度值对应的正样本和负样本；如图6所示，该装置还包括：拆分模块518、第二训练模块520和拟合模块522，其中：

拆分模块518，用于将负样本进行拆分，得到多个拆分后的负样本，拆分后的负样本的数量与正样本的数量的差值在预设范围内。

获取模块504还用于获取分类模型。

第二训练模块520，用于利用正样本和拆分后的负样本对分类模型进行训练，得到多个训练后的分类模型。

拟合模块522，用于对多个训练后的分类模型进行拟合，计算得到每个训练后的分类模型对应的分类权重。

在一个实施例中，获取模块504还用于获取待分类样本数据；如图7所示，该装置还包括：分类模块524，用于利用训练后的分类模型和分类权重对待分类样本数据进行分类。

上述融合时间因素的协同过滤装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于基站的处理器中，也可以以软件形式存储于基站的存储器中，以便于处理器调用执行以上各个模块对应的操作。其中，处理器可以为中央处理单元(CPU)或微处理器等。

在一个实施例中，提供了一个或多个存储有计算机可执行指令的非易失性可读存储介质，所述计算机可执行指令被一个或多个处理器执行时，使得所述一个或多个处理器执行以下步骤：

建立指数平滑模型；

在一个实施例中，所述平滑模型的公式包括：

P_t+1＝a*P_t+(1-a)*P_t-1；

在一个实施例中，在所述计算得到所述稀疏矩阵中的多个待预测用户喜好程度的预测值的步骤之后，所述计算机可执行指令被一个或多个处理器执行时，还使得所述一个或多个处理器执行以下步骤：获取用户喜好程度值对应的维度；根据用户标识对多个维度的用户喜好程度值进行统计；对统计结果进行正则化处理，得到用户标识对应的多维向量；及根据所述多维向量计算用户标识彼此之间的用户喜好的相似度。

在一个实施例中，所述计算机可执行指令被一个或多个处理器执行时，还使得所述一个或多个处理器执行以下步骤：根据产品标识和用户标识获取用户喜好程度值对应的正样本和负样本；将所述负样本进行拆分，得到多个拆分后的负样本，所述拆分后的负样本的数量与所述正样本的数量的差值在预设范围内；获取分类模型，利用所述正样本和所述拆分后的负样本对所述分类模型进行训练，得到多个训练后的分类模型；及对所述多个训练后的分类模型进行拟合，计算得到每个训练后的分类模型对应的分类权重。

在一个实施例中，在所述计算得到每个训练后的分类模型对应的分类权重的步骤之后，所述计算机可执行指令被一个或多个处理器执行时，还使得所述一个或多个处理器执行以下步骤：获取待分类样本数据；及利用所述训练后的分类模型和所述分类权重对所述待分类样本数据进行分类。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

一种融合时间因素的协同过滤方法，包括：

建立指数平滑模型；

获取对所述指数平滑模型拟定的时间段，所述时间段包括多个时间周期；

获取多个用户标识以及用户标识在多个时间周期内对指定产品的用户喜好程度值；

利用所述指数平滑模型对所述用户喜好程度值进行迭代计算，得到与时间周期对应的平滑结果；

利用所述用户标识和所述与时间周期对应的平滑结果生成稀疏矩阵，所述稀疏矩阵包括多个待预测用户喜好程度；

获取协同过滤模型，将所述时间周期对应的平滑结果输入至所述协同过滤模型；及

通过所述协同过滤模型进行训练，计算得到所述稀疏矩阵中的多个待预测用户喜好程度的预测值。
根据权利要求1所述的方法，其特征在于，所述平滑模型的公式包括：

P_t+1＝a*P_t+(1-a)*P_t-1；

其中，a表示产品标识对应的指数系数；P_t+1表示下一个时间周期对应的用户喜好程度值；P_t表示当前时间周期对应的用户喜好程度值；P_t-1表示上一个时间周期对应的用户喜好程度值。
根据权利要求1所述的方法，其特征在于，在所述计算得到所述稀疏矩阵中的多个待预测用户喜好程度的预测值的步骤之后，所述方法还包括：

获取用户喜好程度值对应的维度；

根据用户标识对多个维度的用户喜好程度值进行统计；

对统计结果进行正则化处理，得到用户标识对应的多维向量；及

根据所述多维向量计算用户标识彼此之间的用户喜好的相似度。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

根据产品标识和用户标识获取用户喜好程度值对应的正样本和负样本；

将所述负样本进行拆分，得到多个拆分后的负样本，所述拆分后的负样本的数量与所述正样本的数量的差值在预设范围内；

获取分类模型，利用所述正样本和所述拆分后的负样本对所述分类模型进行训练，得到多个训练后的分类模型；及

对所述多个训练后的分类模型进行拟合，计算得到每个训练后的分类模型对应的分类权重。
根据权利要求4所述的方法，其特征在于，在所述计算得到每个训练后的分类模型对应的分类权重的步骤之后，所述方法还包括：

获取待分类样本数据；及

利用所述训练后的分类模型和所述分类权重对所述待分类样本数据进行分类。
一种融合时间因素的协同过滤装置，包括：

模型建立模块，用于建立指数平滑模型；

获取模块，用于获取对所述指数平滑模型拟定的时间段，所述时间段包括多个时间周期；获取多个用户标识以及用户标识在多个时间周期内对指定产品的用户喜好程度值；

平滑模块，用于利用所述指数平滑模型对所述用户喜好程度值进行迭代计算，得到与时间周期对应的平滑结果；

矩阵生成模块，用于利用所述用户标识和所述与时间周期对应的平滑结果生成稀疏矩阵，所述稀疏矩阵包括多个待预测用户喜好程度；

所述获取模块还用于获取协同过滤模型；及

第一训练模块，用于将所述时间周期对应的平滑结果输入至所述协同过滤模型；通过所述协同过滤模型进行训练，计算得到所述稀疏矩阵中的多个待预测用户喜好程度的预测值。
根据权利要求6所述的装置，其特征在于，所述平滑模型的公式包括：

P_t+1＝a*P_t+(1-a)*P_t-1；

其中，a表示产品标识对应的指数系数；P_t+1表示下一个时间周期对应的用户喜好程度值；P_t表示当前时间周期对应的用户喜好程度值；P_t-1表示上一个时间周期对应的用户喜好程度值。
根据权利要求6所述的装置，其特征在于，所述获取模块还用于获取用户喜好程度值对应的维度；

所述装置还包括：

统计模块，用于根据用户标识对多个维度的用户喜好程度值进行统计；

正则化模块，用于对统计结果进行正则化处理，得到用户标识对应的多维向量；及

相似度计算模块，用于根据所述多维向量计算用户标识彼此之间的用户喜好的相似度。
根据权利要求6所述的装置，其特征在于，所述获取模块还用于根据产品标识和用户标识获取用户喜好程度值对应的正样本和负样本；

所述装置还包括：

拆分模块，用于将所述负样本进行拆分，得到多个拆分后的负样本，所述拆分后的负样本的数量与所述正样本的数量的差值在预设范围内；

所述获取模块还用于获取分类模型；

第二训练模块，用于利用所述正样本和所述拆分后的负样本对所述分类模型进行训练，得到多个训练后的分类模型；及

拟合模块，用于对所述多个训练后的分类模型进行拟合，计算得到每个训练后的分类模型对应的分类权重。
根据权利要求9所述的装置，其特征在于，所述获取模块还用于获取待分类样本数据；

所述装置还包括：

分类模块，用于利用所述训练后的分类模型和所述分类权重对所述待分类样本数据进行分类。
一种服务器，包括存储器和处理器，所述存储器中储存有计算机可执行指令，所述计算机可执行指令被所述处理器执行时时，使得所述处理器执行以下步骤：

建立指数平滑模型；

获取对所述指数平滑模型拟定的时间段，所述时间段包括多个时间周期；

获取多个用户标识以及用户标识在多个时间周期内对指定产品的用户喜好程度值；

利用所述指数平滑模型对所述用户喜好程度值进行迭代计算，得到与时间周期对应的平滑结果；

利用所述用户标识和所述与时间周期对应的平滑结果生成稀疏矩阵，所述稀疏矩阵包括多个待预测用户喜好程度；

获取协同过滤模型，将所述时间周期对应的平滑结果输入至所述协同过滤模型；及

通过所述协同过滤模型进行训练，计算得到所述稀疏矩阵中的多个待预测用户喜好程度的预测值。
根据权利要求11所述的服务器，其特征在于，所述平滑模型的公式包括：

P_t+1＝a*P_t+(1-a)*P_t-1；

其中，a表示产品标识对应的指数系数；P_t+1表示下一个时间周期对应的用户喜好程度值；P_t表示当前时间周期对应的用户喜好程度值；P_t-1表示上一个时间周期对应的用户喜好程度值。
根据权利要求11所述的服务器，其特征在于，在所述计算得到所述稀疏矩阵中的多个待预测用户喜好程度的预测值的步骤之后，还使得所述处理器执行以下步骤：

获取用户喜好程度值对应的维度；

根据用户标识对多个维度的用户喜好程度值进行统计；

对统计结果进行正则化处理，得到用户标识对应的多维向量；及

根据所述多维向量计算用户标识彼此之间的用户喜好的相似度。
根据权利要求11所述的服务器，其特征在于，还使得所述处理器执行以下步骤：

根据产品标识和用户标识获取用户喜好程度值对应的正样本和负样本；

将所述负样本进行拆分，得到多个拆分后的负样本，所述拆分后的负样本的数量与所述正样本的数量的差值在预设范围内；

获取分类模型，利用所述正样本和所述拆分后的负样本对所述分类模型进行训练，得到多个训练后的分类模型；及

对所述多个训练后的分类模型进行拟合，计算得到每个训练后的分类模型对应的分类权重。
根据权利要求14所述的服务器，其特征在于，在所述计算得到每个训练后的分类模型对应的分类权重的步骤之后，还使得所述处理器执行以下步骤：

获取待分类样本数据；及

利用所述训练后的分类模型和所述分类权重对所述待分类样本数据进行分类。
一个或多个存储有计算机可执行指令的非易失性可读存储介质，所述计算机可执行指令被一个或多个处理器执行时，使得所述一个或多个处理器执行以下步骤：

建立指数平滑模型；

获取对所述指数平滑模型拟定的时间段，所述时间段包括多个时间周期；

获取多个用户标识以及用户标识在多个时间周期内对指定产品的用户喜好程度值；

利用所述指数平滑模型对所述用户喜好程度值进行迭代计算，得到与时间周期对应的平滑结果；

利用所述用户标识和所述与时间周期对应的平滑结果生成稀疏矩阵，所述稀疏矩阵包括多个待预测用户喜好程度；

获取协同过滤模型，将所述时间周期对应的平滑结果输入至所述协同过滤模型；及

通过所述协同过滤模型进行训练，计算得到所述稀疏矩阵中的多个待预测用户喜好程度的预测值。
根据权利要求16所述的非易失性可读存储介质，其特征在于，所述平滑模型的公式包括：

P_t+1＝a*P_t+(1-a)*P_t-1；

其中，a表示产品标识对应的指数系数；P_t+1表示下一个时间周期对应的用户喜好程度值；P_t表示当前时间周期对应的用户喜好程度值；P_t-1表示上一个时间周期对应的用户喜好程度值。
根据权利要求16所述的非易失性可读存储介质，其特征在于，在所述计算得到所述稀疏矩阵中的多个待预测用户喜好程度的预测值的步骤之后，所述计算机可执行指令被一个或多个处理器执行时，还使得所述一个或多个处理器执行以下步骤：

获取用户喜好程度值对应的维度；

根据用户标识对多个维度的用户喜好程度值进行统计；

对统计结果进行正则化处理，得到用户标识对应的多维向量；及

根据所述多维向量计算用户标识彼此之间的用户喜好的相似度。
根据权利要求16所述的非易失性可读存储介质，其特征在于，所述计算机可执行指令被一个或多个处理器执行时，还使得所述一个或多个处理器执行以下步骤：

根据产品标识和用户标识获取用户喜好程度值对应的正样本和负样本；

将所述负样本进行拆分，得到多个拆分后的负样本，所述拆分后的负样本的数量与所述正样本的数量的差值在预设范围内；

获取分类模型，利用所述正样本和所述拆分后的负样本对所述分类模型进行训练，得到多个训练后的分类模型；及

对所述多个训练后的分类模型进行拟合，计算得到每个训练后的分类模型对应的分类权重。
根据权利要求19所述的非易失性可读存储介质，其特征在于，在所述计算得到每个训练后的分类模型对应的分类权重的步骤之后，所述计算机可执行指令被一个或多个处理器执行时，还使得所述一个或多个处理器执行以下步骤：

获取待分类样本数据；及

利用所述训练后的分类模型和所述分类权重对所述待分类样本数据进行分类。