CN111626832A

CN111626832A - 产品推荐方法、装置及计算机设备

Info

Publication number: CN111626832A
Application number: CN202010506871.6A
Authority: CN
Inventors: 李福洋; 栾英英; 童楚婕; 徐晓健; 严洁; 彭勃
Original assignee: Bank of China Ltd
Current assignee: Bank of China Ltd
Priority date: 2020-06-05
Filing date: 2020-06-05
Publication date: 2020-09-04
Anticipated expiration: 2040-06-05
Also published as: CN111626832B

Abstract

本申请提出了一种产品推荐方法、装置及计算机设备，通过对应用平台上的各应用属性信息和各产品信息进行向量化处理，得到具有特定长度的用户属性特征向量和产品特征向量后，可以将这些特征向量分别输入预先训练好的组合特征向量和神经网络模型，得到各用户关联的低维度特征对该用户点击每一产品的第一影响因子，及高维度特征对该用户点击每一产品的第二影响因子，基于各产品的第一影响因子和第二影响因子，确定该用户对各产品的推荐评分并存储，以便计算机设备能够据此为各用户有针对性推送该用户感兴趣的推荐产品，以增加用户粘性，有助于应用平台的推广。

Description

产品推荐方法、装置及计算机设备

技术领域

本申请涉及数据处理技术领域，更具体地说是涉及一种产品推荐方法、装置及计算机设备。

背景技术

随着电子商务规模的不断扩大及多元化，以各大商业银行推出的手机银行的应用平台为例，为了吸引更多客户关注，增加客户的粘性，在增加银行产品个数及种类的同时，也会针对推出的产品进行各种宣传活动，如广告、优惠券、积分换购等，而且还会引入第三方应用产品，如各种购物平台推出的商品等，丰富手机银行应用平台的内容。

然而，在实际应用中，由于第三方应用产品在其自己的应用平台上就可以方便购买或浏览，即使手机银行推出更加优惠活动，受推广力度和效率的影响，通常很难得到用户关注，无法为手机银行的推广提供很好助力。

发明内容

有鉴于此，为了解决上述技术问题，本申请提供了以下技术方案：

一方面，本申请提出了一种产品推荐方法，所述方法包括：

获取应用平台上的用户属性信息和产品信息；

对所述用户属性信息和所述产品信息进行向量化处理，得到具有特定长度的用户属性特征向量和产品特征向量；

将所述用户属性特征向量和所述产品特征向量分别输入组合特征模型和神经网络模型进行处理，得到低维度特征对用户点击各产品的第一影响因子，以及高维度特征对所述用户点击各产品的第二影响因子；

基于所述应用平台上各产品的所述第一影响因子和所述第二影响因子，确定并存储相应用户对所述各产品的推荐评分，所述推荐评分用于确定针对所述用户的推荐产品。

可选的，所述对所述用户属性信息和所述产品信息进行向量化处理，得到具有特定长度的用户属性特征向量和产品特征向量，包括：

对用户属性信息和所述产品信息进行预处理，检测预处理后所得信息的信息类型；

若包含连续型信息，采用分箱方式对所述连续型信息进行离散化处理，得到多个离散特征；

若包含离散型信息，采用独热编码方式对所述离散型信息进行编码处理，得到多个编码特征；

对所述多个离散特征和所述多个编码特征进行特征映射，得到具有特定长度的相应特征向量，所述特征向量包括由不同的用户属性特征组成的用户属性特征向量，以及与不同的产品特征组成的产品特征向量。

可选的，所述组合特征模型的训练过程包括：

获取不同用户的样本历史信息，所述样本历史信息包括相应用户的样本用户属性信息、样本产品信息以及样本行为信息；

对所述样本用户属性信息和所述样本产品信息进行向量化处理，得到具有特定长度的样本用户属性特征向量和样本产品特征向量；

基于所述样本行为信息，由所述样本用户属性特征向量和所述样本产品特征向量，构建用户属性-产品行为矩阵，所述用户属性-产品行为矩阵包含多个组合特征，所述组合特征是由两个样本用户属性特征、两个样本产品特征，或者一个样本用户属性特征与一个样本产品特征组合得到；

基于所述样本行为信息，利用所述样本用户属性特征向量、所述样本产品特征向量及所述用户属性-产品行为矩阵，构建第一样本特征-产品点击率矩阵；

基于二项式定理，按照随机梯度下降方式，对组成所述第一样本特征-产品点击率矩阵进行模型参数训练，得到组合特征模型；

其中，所述组合特征模型用于预测不同组合特征对所述应用平台上的各产品被用户点击的影响因子。

可选的，所述神经网络模型的训练过程包括：

基于所述样本行为信息，利用所述样本用户属性特征向量和样本产品特征向量，构建第二样本特征-产品点击率矩阵；

利用神经网络中的多层全链接层，对组成所述第二样本特征-产品点击率矩阵进行训练，得到神经网络模型；

其中，所述神经网络模型用于预测至少三个维度的特征组合，对所述应用平台上的各产品被用户点击的影响因子。

可选的，所述基于所述应用平台上各产品的所述第一影响因子和所述第二影响因子，确定相应用户对所述各产品的推荐评分，包括：

将所述应用平台上同一产品的所述第一影响因子和所述第二影响因子进行融合处理，得到相应产品的目标影响特征向量；

利用激活函数，对所述各产品的目标影响特征向量进行运算，得到不同用户对所述各产品的推荐评分。

可选的，所述方法还包括：

响应用户客户端对所述应用平台的访问请求，得到所述用户客户端的用户标识；

查询与所述用户标识对应的各产品的推荐评分；

选择推荐评分较大的预设数量个产品作为推荐产品；

将所述推荐产品推送至发起所述用户客户端进行展示。

又一方面，本申请还提出了一种产品推荐装置，所述装置包括：

信息获取模块，用于获取应用平台上的用户属性信息和产品信息；

特征向量得到模块，用于对所述用户属性信息和所述产品信息进行向量化处理，得到具有特定长度的用户属性特征向量和产品特征向量；

影响因子得到模块，用于将所述用户属性特征向量和所述产品特征向量分别输入组合特征模型和神经网络模型进行处理，得到低维度特征对用户点击各产品的第一影响因子，以及高维度特征对所述用户点击各产品的第二影响因子；

推荐评分确定模块，用于基于所述应用平台上各产品的所述第一影响因子和所述第二影响因子，确定相应用户对所述各产品的推荐评分，所述推荐评分用于确定针对所述用户的推荐产品；

推荐评分存储模块，用于存储确定的所述应用平台上不同用户对各产品的推荐评分。

可选的，所述装置还包括：

样本信息获取模块，用于获取不同用户的样本历史信息，所述样本历史信息包括相应用户的样本用户属性信息、样本产品信息以及样本行为信息；

样本特征向量化处理模块，用于对所述样本用户属性信息和所述样本产品信息进行向量化处理，得到具有特定长度的样本用户属性特征向量和样本产品特征向量；

第一矩阵构建模块，用于基于所述样本行为信息，由所述样本用户属性特征向量和所述样本产品特征向量，构建用户属性-产品行为矩阵，所述用户属性-产品行为矩阵包含多个组合特征，所述组合特征是由两个样本用户属性特征、两个样本产品特征，或者一个样本用户属性特征与一个样本产品特征组合得到；

第二矩阵构建模块，用于基于所述样本行为信息，利用所述样本用户属性特征向量、所述样本产品特征向量及所述用户属性-产品行为矩阵，构建第一样本特征-产品点击率矩阵；

组合特征模型训练模块，用于基于二项式定理，按照随机梯度下降方式，对组成所述第一样本特征-产品点击率矩阵进行模型参数训练，得到组合特征模型；

可选的，所述装置还包括：

第三矩阵构建模块，用于基于所述样本行为信息，利用所述样本用户属性特征向量和样本产品特征向量，构建第二样本特征-产品点击率矩阵；

神经网络模型训练模块，用于利用神经网络中的多层全链接层，对组成所述第二样本特征-产品点击率矩阵进行训练，得到神经网络模型；

又一方面，本申请还提出了一种计算机设备，所述计算机设备包括：

存储器，用于存储实现如上述的产品推荐方法的程序；

处理器，用于加载并执行所述存储器存储的所述程序，以实现如上述的产品推荐方法的各步骤。

由此可见，与现有技术相比，本申请提供一种产品推荐方法、装置及计算机设备，通过对应用平台上的各应用属性信息和各产品信息进行向量化处理，得到具有特定长度的用户属性特征向量和产品特征向量后，可以将这些特征向量作为模型输入，分别输入预先训练好的组合特征向量和神经网络模型，得到各用户关联的低维度特征对该用户点击每一产品的第一影响因子，以及高维度特征对该用户点击每一产品的第二影响因子，之后，可以结合各产品的第一影响因子和第二影响因子，确定该用户对各产品的推荐评分并存储，以便计算机设备能够据此有针对性地，为各用户推送该用户感兴趣的推荐产品，如手机银行推出的针对自身银行产品的各种优惠活动、第三方应用平台产品的活动等等，以增加用户粘性，有助于应用平台的推广。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1示出了实现本申请提出的产品推荐方法的一可选系统示例的结构示意图；

图2示出了本申请提出的产品推荐方法的一可选示例的流程示意图；

图3示出了本申请提出的产品推荐方法的又一可选示例的流程示意图；

图4示出了本申请提出的产品推荐方法的又一可选示例的流程示意图；

图5示出了本申请提出的产品推荐方法的又一可选示例的流程示意图；

图6示出了本申请提出的产品推荐装置的一可选示例的结构示意图；

图7示出了本申请提出的产品推荐装置的又一种可选示例的结构示意图；

图8示出适用于本申请提出的产品推荐方法的一种计算机设备实施例的硬件结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

应当理解，本申请中使用的“系统”、“装置”、“单元”和/或“模块”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而，如果其他词语可实现相同的目的，则可通过其他表达来替换该词语。

如本申请和权利要求书中所示，除非上下文明确提示例外情形，“一”、“一个”、“一种”和/或“该”等词并非特指单数，也可包括复数。一般说来，术语“包括”与“包含”仅提示包括已明确标识的步骤和元素，而这些步骤和元素不构成一个排它性的罗列，方法或者设备也可能包含其它的步骤或元素。由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

其中，在本申请实施例的描述中，除非另有说明，“/”表示或的意思，例如，A/B可以表示A或B；本文中的“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，在本申请实施例的描述中，“多个”是指两个或多于两个。以下术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。

另外，本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是，前面或后面操作不一定按照顺序来精确地执行。相反，可以按照倒序或同时处理各个步骤。同时，也可以将其他操作添加到这些过程中，或从这些过程移除某一步或数步操作。

参照图1，示出了适用于本申请提出的产品推荐方法的一可选系统的结构示意图，该系统可以包括：终端11、应用服务器12及数据库服务器13，其中：

终端11可以是用户使用的电子设备，如手机、台式电脑、笔记本电脑等用户终端，根据应用需求，其通常会安装各种应用程序(也可以称为客户端)，如各种购物应用程序、音视频播放应用程序、各大银行的手机银行应用程序、各种浏览器等等，本申请对终端11的设备类型及其安装有的应用程序数量及类型均不作限定，可以根据实际应用需求确定。

应用服务器12可以是为终端安装的相应类型的应用程序提供服务的服务设备，在本申请中，以应用程序包括手机银行应用程序为例进行说明，该应用服务器12可以包括为手机银行提供银行业务的服务设备，应该理解的是，若该手机银行除了提供自身银行所具有的银行业务外，还引入了第三方业务类型，那么，支持手机银行正常运行的应用服务器12，通常可以与该第三方的应用服务器通信，以使该第三方的应用服务器通过该应用服务器12，为手机银行提供第三方业务服务，具体实现过程本申请不做限定。

需要说明的是，对于提供其他业务服务的应用服务器12的工作过程类似，可以依据具体业务类型确定，本申请不做一一详述。

本申请中，仍以手机银行这一业务应用类型为例，为了能够为客户准确推荐适合其类型的银行产品，并采用如在具有客户绑定的手机号的用户终端弹窗消息、微银行消息、手机短信等方式，实现推荐银行产品的推送，提高手机银行用户粘性和影响力，可以由该应用服务器执行实现本申请下文实施例提出的产品推荐方法，具体实现过程可以参照下文各实施例的描述。

数据库服务器13可以是一种数据存储设备，可以由一个或多个服务器集成，本申请对该数据库服务器13的组成结构不做限定。在实际应用中，该数据库服务器13可以用来存储应用运行过程中产生的各种数据，如客户相关信息、产品相关信息、客户访问应用平台产生的各种历史数据，以及应用平台运行产生的日志信息等等，以便后续查看或维护等，本申请对该数据库服务器13中存储的数据内容，以及对各类数据的存储方式不做限定，可以根据实际需求进行灵活调整。

在一些实施例中，为了提高数据存储的安全性，尤其是对于如银行应用中客户的一些重要信息，如客户账户信息、客户身份信息等等，本申请可以采用区块链方式实现数据存储，具体实现过程本申请不做详述，但并不局限于这种数据存储方式。

应该理解的是，图1所示的系统结构并不构成对本申请实施例对系统组成的限定，在实际应用中，该系统可以包括比图1所示的更多或更少的部件，或者组合某些部件，本申请在此不做一一列举。

参照图2，为本申请提出的产品推荐方法的一可选示例的流程示意图，该方法可以适用于计算机设备，该计算机设备可以是上述系统中的服务器，也可以是具有一定数据存储能力的电子设备，本申请对该计算机设备的设备类型不做限定，如图2所示，本实施例提出的产品推荐方法可以包括：

步骤S11，获取应用平台上的用户属性信息和产品信息；

本实施例中，用户属性信息可以包括在应用平台注册的每一个用户的用户属性，如用户的年龄、性别、学历、职业等基本信息，但并不局限于此，可以根据实际需求确定。

相应地，产品信息可以包括应用平台推出的各种类型的产品的相关信息，且该产品并不局限于实体产品，如购物应用平台推出的各种商品，也可以是虚拟产品，如手机银行平台推出的各种银行业务、优惠活动等等，本申请对产品信息包含的信息内容不做限定，可以依据应用场景及其实际需求确定，本申请在此不做一一详述。

步骤S12，对用户属性信息和产品信息进行向量化处理，得到具有特定长度的用户属性特征向量和产品特征向量；

在实际应用中，对于不同类型的数据可以采用不同的向量化实现方式，如独热One-Hot编码，分箱方式等，但并不局限于本申请描述的几种向量化方法。具体应用中，可以将一些离散型信息变为数字型，对一些连续型取值做分箱处理，以减少特征取值个数，提高泛化能力。

其中，One-Hot编码也可以称为一位有效编码，通常是分类变量作为二进制向量的表示，具体是先将分类值映射到整数值，再将每个整数值表示为二进制向量。以用户性别这种离散型特征信息为例，性别特征:[“男”,“女”]，按照N(该举例中N＝2)位状态寄存器来对N个状态进行编码，得到的性别特征向量可以为[1001]，其中，10可以表示男性，01可以表示女性，对于其他离散型信息的向量化实现过程类似，本申请不做一一详述。

数据的分箱向量化实现方法主要是针对连续型信息的向量化方法，可以采用等宽分箱、等频分箱、基于K均值聚类的分箱等方式，实现连续信息的离散化，再对离散后的信息进行向量化，以使这种连续型信息具有更好的泛化能力。

之后，在实现对上述各用户属性信息和产品信息的向量化过程中，具体在采用如上述One-Hot编码或分箱处理后，可以对处理得到的各特征进行特征映射，以使各特征具有统一长度k，即为上述特定长度，从而使得向量化后所得的各特征向量的长度相同，有利于后续处理。

步骤S13，将用户属性特征向量和产品特征向量分别输入组合特征模型和神经网络模型进行处理，得到低维度特征对用户点击各产品的第一影响因子，以及高维度特征对该用户点击各产品的第二影响因子；

在本实施例中，按照上述处理方式，将应用平台上各用户的用户属性信息，映射为相应的用户属性特征，并由此构成用户属性特征向量，同时将应用平台上各产品的产品信息，映射为相应的产品特征，并由此构成产品特征向量后，可以将得到的各用户属性特征向量和产品特征向量作为模型输入向量，并将该模型输入向量输入预先训练好的组合特征模型，得到低维度特征(具体可以包括单个特征，以及两个特征组合构成的组合特征，如两个用户属性特征的组合、两个产品特征的组合，或者是一个用户属性特征和一个产品特征组合)对用户点击各产品的第一影响因子，其可以表明具有该低维度特征的用户，购买该应用平台上各产品的相应预测概率，也可以是从低维度特征考虑，用户对应用平台上各产品的评分。

需要说明的是，对于同一低维度特征，对不同产品的第一影响因子的数值可能不同，不同低维度特征，对同一产品的第一影响因子的数值也可能不同，本申请对不同情况下所得第一影响因子的具体数值不做限定。另外，关于上述组合特征模型的训练过程，可以参照下文实施例相应部分的描述，本实施例在此不做赘述。

本实施例中，按照上述方式得到模型输入向量后，还需要输入预先训练好的神经网络模型，以得到高维度特征对该用户点击各产品的第二影响因子，此处的高维度通常是指至少三个维度，可以结合神经网络的运算原理确定。所以说，本实施例利用神经网络模型，可以得到较多维度组合特征(如多个用户属性特征和多个产品特征)，对用户点击不同产品的影响因子，如上述对第一影响因子的分析，其也可以说是具有高维度组合特征的用户，购买各产品的相应预测概率，或者说，从高维度特征考虑，用户对应用平台上各产品的评分。

应该理解的是，上述不同高维度特征包含的维度数量可以不同，且对于同一高维度特征，对不同产品的第二影响因子的数值可能不同，不同高维度特征，对同一产品的第二影响因子的数值也可能不同，本申请对不同情况下所得第二影响因子的具体数值不做限定。另外，关于上述神经网络模型的训练过程，可以参照下文实施例相应部分的描述，本实施例在此不做赘述。

步骤S14，基于应用平台上各产品对应的第一影响因子和第二影响因子，确定相应用户对各产品的推荐评分；

可见，本实施例综合考虑上述各种特征的多种维度的组合，对用户点击应用平台上每一产品的影响因子，来确定相应用户对各产品的推荐评分，该推荐评分可以用于确定针对相应用户的推荐产品，关于该推荐评分的具体获取方法不做限定。

因此，本申请可以对上述两个不同模型输出的，针对同一产品的第一影响因子和第二影响因子进行加权求和(即一种融合处理方式)，以得到低维度特征和高维度特征综合起来，对用户点击该产品的总影响因子，进而利用一个激活函数，得到相应用户对该产品的推荐评分。

可见，在步骤S14的实现过程中，若将上述模型输出的针对每一产品的影响因子看作是一个特征，经过对两个模型输出的特征的融合处理后，可以利用激活函数(如sigmoid函数，但并不局限于此)，来计算应用平台上各用户对所有产品的推荐评分，如可以利用实现，

在一些实施例中，结合上述对影响因子的获取过程的描述，针对每一个用户对任一产品的推荐评分，可以将上述模型输出的针对该产品的影响因子看作是一个特征，无论是组合特征模型还是神经网络模型，针对这一个产品，均可以多个影响因子，即不同低维度特征或不同高维度特征对该产品的用户点击结果的影响，本实施例将每一个模型输出的针对该产品的多个影响因子构成一个影响特征向量，分别记为第一影响特征向量和第二影响特征向量。

低维度特征低维度特征高维度特征高维度特征

低维度特征高维度特征其中，本申请对上述得到的影响特征向量的表示形式不做限定，通常情况下，上述各影响因子可以是0到1之间的数值，且相应维度特征对用户点击该产品的影响越大，对应的影响因子数值越大。之后，在需要获取针对该产品的推荐评分时，可以将上述所得针对同一产品的第一影响特征向量与第二影响特征向量拼接融合(如加权方式，但并不局限于此)，得到融合特征向量，使其同时包含针对该产品的低维度特征和高维度特征，以及相应维度组合特征对用户点击该产品的影响因子，之后，可以利用如上述激活函数，对各融合特征向量进行处理，得到每个用户对应用平台上各产品的推荐评分，本申请对如何利用激活函数，得到上述推荐评分的实现过程不做限定。

步骤S15，存储应用平台上不同用户对各产品的推荐评分。

按照上述方式，得到应用平台上各用户对所有产品的推荐评分后，可以直接对其进行存储，具体存储方式不做限定，通常会与相应用户标识及产品标识关联存储，以便后续用户访问该应用平台时，计算机设备可以调用该用户对该应用平台上各产品的推荐评分，并选择出推荐评分较大的预设数量个产品作为推荐产品，推送至该用户客户端进行展示。

当然，计算机设备也可以基于上述得到的不同用户对各产品的推荐评分，来确定应用平台上各产品的受欢迎程度，以便据此实现对产品推新或改进等，更好地为用户提供服务，且有助于推广应用平台。

在一些实施例中，对于应用平台上的新用户，也可以调用其他用户对各产品的推荐评分，将其作为参考，选择所需产品等等，当然，应用平台上已注册用户，可以通过查到其他用户对各产品的评分，加深对产品的了解等等，本申请对所存储的各用户对所有产品的推荐评分的使用场景不做限定，并不局限于上文列举的几种应用场景。

综上所述，在本实施例中，通过对应用平台上的各应用属性信息和各产品信息进行向量化处理，得到具有特定长度的用户属性特征向量和产品特征向量后，可以将这些特征向量作为模型输入，分别输入预先训练好的组合特征向量和神经网络模型，得到各用户关联的低维度特征对该用户点击每一产品的第一影响因子，以及高维度特征对该用户点击每一产品的第二影响因子，之后，可以结合各产品的第一影响因子和第二影响因子，确定该用户对各产品的推荐评分并存储，以便计算机设备能够据此有针对性地，为各用户推送该用户感兴趣的推荐产品，如手机银行推出的针对自身银行产品的各种优惠活动、第三方应用平台产品的活动等等，以增加用户粘性，有助于应用平台的推广。

参照图3，为本申请提出的产品推荐方法的又一可选示例的流程示意图，本实施例可以是对上述实施例描述的产品推荐方法的一可选细化实现方式，但并不局限于本文描述的细化实现方式，可以根据实际需求灵活调整，如图3所示，该方法可以包括：

步骤S21，获取应用平台上的用户属性信息和产品信息；

步骤S22，对用户属性信息和产品信息进行预处理，检测预处理后所得信息的信息类型；

本实施例实际应用中，对直接从数据库获取的各种信息进行预处理的实现方法不做限定，通常可以依据所处理的信息内容及其类型等确定，如利用异常值清洗、数据填充等方式，实现对采集到的各种信息的数据预处理等。

具体的，在一些实施例中，对采集到的各种信息进行检测后，确定存在少量缺失值，可以根据连续、离散取值情况，采用均值或众数填充；对于大量空缺值或不符合规范、无法计算的异常值可以直接删除等等，本申请对上述数据预处理过程不做一一详述。

对于信息类型可以分为离散型信息，如用户性别、职业等，以及连续型信息，如年龄、资产等信息，关于信息类型的具体检测过程及结果不做详述。

步骤S23，采用分箱方式对连续型信息进行离散化处理，得到多个离散特征；

步骤S24，采用独热编码方式对离散型信息进行编码处理，得到多个编码特征；

步骤S25，对多个离散特征和多个编码特征进行特征映射，得到具有特定长度的相应用户属性特征向量和产品特征向量；

关于上述独热编码方式、分箱方式的信息处理方式，可以参照上述实施例相应部分的描述，本实施例不再赘述。在得到多个离散特征和多个编码特征之后，可以按照以下公式(1)的方式，对这些特征进行特征映射，以得到具有统一长度的特征向量。

(y₁,y₂,...y_k)＝α₀+α₁x₁+α₂x₂+...++α_nx_n (1)

其中，x_i可以表示OneHot编码或者分箱后得到的特征，i＝1、2、3…n，n表示特征长度，y为映射后的特征，经过这种特征映射后，可以将OneHot或者分箱后的高维稀疏特征变为低维向量，方便后续计算。

应该理解的是，对于上述得到的用户属性特征向量可以是由各用户的相应用户属性特征构成，由于用户属性特征类型通常为多个，因此，上述所得用户属性特征向量的数量可能是多个，具体可以依据用户属性类型确定。同理，对于上述产品特征向量可以由各用户的产品特征确定，具体内容可以依据采集到的产品信息内容确定，本申请不做一一详述。

步骤S26，将用户属性特征向量和产品特征向量输入组合特征模型，得到不同产品对应的第一影响特征向量；

结合上述实施例相应部分的描述，第一影响特征向量可以由多个低维度特征对用户点击每一产品的第一影响因子构成，关于各第一影响因子的获取过程及其所表达的含义，可以参照上文实施例相应部分的描述，本实施例不再赘述。

步骤S27，将用户属性特征向量和产品特征向量输入神经网络模型，得到不同产品对应的第二影响特征向量；

结合上述分析，该第二影响特征向量可以由多个高维度特征对用户点击每一产品的第二影响因子构成，关于各第二影响因子的获取过程及其所表达的含义，可以参照上文实施例相应部分的描述，本实施例不再赘述。

步骤S28，对针对同一产品的第一影响特征向量和第二影响特征向量进行加权处理，得到相应产品的目标影响特征向量；

需要说明，关于对同一产品的第一影响特征向量和第二影响特征向量的融合处理方式，并不局限于本实施例描述的这种加权处理方式。

步骤S29，利用激活函数，对各产品的目标影响特征向量进行运算，得到不同用户对各产品的推荐评分；

步骤S210，选择推荐评分较大的预设数量个产品作为相应用户的推荐产品；

步骤S211，输出各用户的推荐产品。

本申请对步骤S210的具体实现方法不做限定。在一些实施例中，针对每一个用户，可以依据该用户对各产品的推荐评分的大小，对各产品进行排序，利用排序结果，选择推荐评分较大的预设数量个产品作为该用户的推荐产品。

其中，根据实际需求，本申请也可以直接对得到的各用户的推荐产品进行存储，这样，后续用户客户端访问该应用平台的情况下，计算机设备可以直接调取该用户客户端对应的推荐产品，并推送至该用户客户端进行展示，不需要在线依据推荐评分，来选择针对该用户的推荐产品。

当然，如上述实施例描述，本申请也可以直接存储各用户对所有产品的推荐评分，计算机设备接收到用户客户端对应用平台的访问请求后，可以响应该访问请求，得到该用户客户端的用户标识，之后，可以查询与该用户标识对应的各产品的推荐评分，即预先存储的该用户对各产品的推荐评分，从而选择推荐较大的预设数量个产品作为该用户的推荐产品，并将其反馈至用户客户端进行展示。

另外，对于上述步骤S211中推荐产品的输出方式，可以采用列表方式输出，但并不局限于这种输出方式。在实际应用中，步骤S211具体可以是将所得各用户的推荐产品发送至数据库进行存储，也可以响应用户查询请求，反馈至请求用户的客户端进行展示，本申请对此不做限定。

综上，在本实施例中，对应用平台上各用户属性信息和产品信息进行预处理，并采用合适的方式进行向量化，得到相应的特征向量后，本实施例将所得的多个特征向量分别输入组合特征模型和神经网络模型，考虑各种维度组合特征对用户点击产品的影响因子，并将对应同一产品的影响因子拼接，得到目标影响特征向量，其相对于传统的神经网络模型输出的特征向量，兼顾了低维度特征对用户点击产品的影响情况，从而使得目标影响特征向量能够更加准确且全面地表征，各种维度特征组合对各产品的总影响情况，进而使得利用激活函数对该目标特征向量进行运算，得到的用户对各产品的推荐评分更加准确，后续能够更加高效且准确为各用户推送该用户可能感兴趣的推荐产品，提高用户服务质量，吸引用户对应用平台推出的各种产品的关注，且有利于应用平台的推广。

参照图4，为本申请提出的产品推荐方法的又一可选示例的流程示意图，本实施例主要对产品推荐方法中的组合特征模型的训练过程描述，但并不局限于本实施例描述的模型训练方法。如图4所示，该方法可以包括：

步骤S31，获取不同用户的样本历史信息；

其中，该样本历史信息可以包括不同用户的样本用户属性信息、样本产品信息以及样本行为信息等。

关于样本用户属性信息、样本产品信息的描述，可以参照上述实施例对用户属性信息和产品信息相应部分的描述，不作赘述。对于样本行为信息可以包括各样本用户对应用平台上的各产品的历史点击行为信息，如用户在应用平台上购买产品所产生的历史购买信息等等，其通常可以表明用户属性信息与产品信息之间的关联关系，本申请对该样本行为信息的内容不做限定。

步骤S32，对样本用户属性信息和样本产品信息进行向量化处理，得到具有特定长度的样本用户属性特征向量和样本产品特征向量；

关于步骤S32的具体实现过程，可以参照上述实施例对特性向量化处理过程的描述，本实施例不再赘述。

步骤S33，基于样本行为信息，由样本用户属性特征向量和样本产品特征向量，构建用户属性-产品行为矩阵；

本实施例中，该用户属性-产品行为矩阵是组合特征向量的矩阵表示形式，其可以包含多个组合特征，该组合特征可以是两个样本用户属性特征组合(如性别与年龄的组合)、两个样本产品特征组合(如视频和音乐的组合)，或者一个样本用户属性特征与一个样本产品特征组合(如年龄和音乐的组合等等)得到。可见，该组合特征可以是二维特征，本申请可以将其记为低维特征。

本实施例可以利用上述样本行为信息，来确定组合特征包含的两个特征之间关联关系，如用户c1，购买产品p1两次，那么，该用户c1的属性信息与该产品p1的产品信息之间就会存在一些关联关系，可以由该用户c1的属性信息与该产品p1的产品信息构成组合特征。

需要说明的是，本申请对上述步骤S33的具体实现方法不做限定，但构成的用户属性-产品行为矩阵包含的组合特征的类型，可以包含上述列举的三类，也可以只包含产品与用户之间的特征组合，本申请对该用户属性-产品行为矩阵所包含的具体内容不做限定。

步骤S34，基于样本行为信息，利用样本用户属性特征向量、样本产品特征向量及用户属性-产品行为矩阵，构建第一样本特征-产品点击率矩阵；

继上文对样本行为信息的描述，其包含了用户对产品的点击记录或者说是购买记录，因此，本实施例可以查询与上述得到的样本用户属性特征向量、样本产品特征向量，及用户属性-产品行为矩阵各自包含的特征关联的点击率(即单位时间内的点击次数)，进而在各特征向量中添加相应的点击率，构成第一样本特征-产品点击率矩阵，其可以表明不同样本特征与产品点击率之间的关系，如可以将上文得到的各样本特征向量(如样本用户属性特征向量、样本产品特征向量、样本组合特征向量)看作为自变量，产品点击率看作为因变量，通常情况下，因变量需要根据自变量求解，本申请所要训练的模型可以是训练自变量与因变量之间的关系，以便输入自变量后，能够得到可靠且准确的因变量。

需要说明的是，对于上述点击率可以替换为特定时间段内的点击次数，完成产品推荐，具体实现过程类似，本申请不做详述。

步骤S35，基于二项式定理，按照随机梯度下降方式，对组成第一样本特征-产品点击率矩阵进行模型参数训练，得到组合特征模型；

需要说明，本申请训练所得组合特征模型可以用于预测不同组合特征，对应用平台上的各产品被用户点击的影响因子，即用于获取上述第一影响因子。

在一些实施例中，本申请可以基于二项式定理，构建如下公式(2)来表达上述单个用户属性特征、产品特征，以及组合特征，对用户点击产品的点击率之间的关系，进而对按照上述方式得到的大量样本数据进行训练，得到该公式(2)中的未知参数，进而得到组合特征模型。

在上述公式(2)中，

可以表示相应特征下用户对产品的点击率；x_i、x_j可以表示不同特征，具体可以是上述用户属性特征或产品特征；w表示权重，w₀可以表示一个变量，具体数值不做限定，w_i可以表示特征x_i对结果(即用户对产品的点击率)的影响因子，w_ij可以表示特征x_i和特征x_j组合得到的组合特征对结果的影响因子。需要说明的是，xi*xj和xj*xi结果一样，因此，w_ij和w_ji的数值相等，因此，上述公式(2)中的w_ij可以为实对称矩阵。

可见，由公式(2)所示的组合特征模型可知，其能够表明低维度特征，即单个特征，或两个特征组合后的组合特征，对用户点击产品的影响关系，本申请可以利用按照上述方式构建的低维度的样本特征对公式(2)进行迭代学习，以确定其中的w₀、w_i和w_ij这三个参数数值。

然而，在实际应用中，由于用户属性特征与产品特征交互少，将导致上述所得特征矩阵稀疏，进而使得w_ij难以充分学习，且时间复杂度较大。为了简化上述参数的求解过程，本申请提出对上述公式(2)进行变形处理，主要是对其中的实对称矩阵进行简化，但并不局限于本申请下文描述的简化实现方法。

在一些实施例中，由于在线性代数中，实对称矩阵可以分解

v的第i列可以记为v_i，且v_i＝(v_i1,v_i2,v_i3,…,v_ik)，其可以表示第i维特征的隐向量。基于此，可以将实对称矩阵w_ij可以分解为：

在上述公式(3)中，v_j可以表示由采集到的信息得到原始特征x_j的第j维隐向量，相应地，v_i可以表示由采集到的信息得到原始特征x_i的第i维隐向量，k表示上述特性向量的特定长度，v_if、v_jf可以是隐向量的具体取值，其通常是通过对相应原始特征的变换得到，对于不同的原始特征，其隐向量不同，关于隐向量的具体获取过程不做详述。

将上述公式(3)代入公式(2)可以得到：

上述公式(4)中，<w,x>表示权重w和原始特征向量(即上述用户属性特征向量、产品特征向量)x的内积，v_i可以表示原始特征x_i的第i个低维特征向量，相应地，v_j可以表示原始特征x_j的第j个低维特征向量。

之后，本申请可以通过二项式展示，对上述公式(4)进行化简处理，可以更新为：

由上述公式(5)可知，本申请通过二项式展开，将交叉项之间的运算转为二阶运算，从而解决了因用户属性特征与产品特征交互少，导致特征矩阵稀疏，w_ij难以充分学习的问题，经过上述转换，将组合特征对结果的影响转变为，单个特征二阶形式对结果的影响，这样，在模型训练过程中，只需要考虑各特征自身对结果的影响，极大简化了模型训练过程，加快的训练效率，即减小了时间复杂度。

其中，在模型训练过程中，本申请可以采用随机梯度下降法SGD，实现对上述公式(5)的模型公式的参数的迭代更新，具体迭代更新公式如下：

关于如何通过随机梯度下降法，利用上述得到的样本训练数据，实现对上述模型公式(5)的模型参数的训练过程，本申请不做详述。

结合上述分析，本申请训练得到的组合特征模型可以用来预测不同组合特征对应用平台上的各产品被用户点击的影响因子，且在预测该影像因子过程中，可以直接将用户属性、产品等单个特征向量输入该组合模型即可得到，不需要基于用户行为信息，确定多个组合特征，再对多个组合特征进行影响因子的预测，提高了预测效率。

参照图5，为本申请提出的产品推荐方法的又一可选示例的流程示意图，本实施例主要对产品推荐方法中的神经网络模型的训练过程描述，但并不局限于本实施例描述的模型训练方法。如图5所示，该方法可以包括

步骤S41，获取不同用户的样本历史信息；

步骤S42，对样本用户属性信息和样本产品信息进行向量化处理，得到具有特定长度的样本用户属性特征向量和样本产品特征向量；

步骤S43，基于样本行为信息，利用样本用户属性特征向量和样本产品特征向量，构建第二样本特征-产品点击率矩阵；

结合上文对第一样本特征-产品点击率矩阵的描述，本实施例可以由样本用户属性特征向量或样本产品特征向量中的单维特征向量，与相应的点击率构成样本特征-产品点击率特征，进而由得到的多个样本特征-产品点击率特征，构成第二样本特征-产品点击率矩阵。

步骤S44，利用神经网络中的多层全链接层，对组成第二样本特征-产品点击率矩阵进行训练，得到神经网络模型。

本实施例中，将利用神经网络模型提取隐藏的高维特征，以提高模型泛化能力，因此，本申请训练的神经网络模型可以用于预测至少三个维度的特征组合，对应用平台上的各产品被用户点击的影响因子。

具体的，区别于传统的基于神经网络的模型训练过程，本申请不再使用卷积层，而是直接使用多层全链接层，如2层或3层全链接层实现模型训练，且每次节点数量可以根据特征数选择，完成一层全链接层的运算后，可以做一次批标准化(BatchNormalization)，使得神经网络每层输出保持同样的分布，求解输出结果的均值和方差，通过相应公式完成标准化，以防止梯度爆炸，提高模型的鲁棒性，具体实现过程不做详述。在该神经网络模型的训练过程中，本申请可以使用Flatten层将输入“压平”，以将多维的输入特征变为一维的特征向量，方便后续计算。本实施例可以将多维矩阵或向量降维为一维。

参照图6，为本申请提出的产品推荐装置的一可选示例的结构示意图，该装置可以适用于计算机设备，如图6所示，该装置可以包括：

信息获取模块21，用于获取应用平台上的用户属性信息和产品信息；

特征向量得到模块22，用于对所述用户属性信息和所述产品信息进行向量化处理，得到具有特定长度的用户属性特征向量和产品特征向量；

在一些实施例中，该特征向量得到模块22可以包括：

预处理单元，用于对用户属性信息和所述产品信息进行预处理，检测预处理后所得信息的信息类型；

离散特征得到单元，用于在包含连续型信息的情况下，采用分箱方式对所述连续型信息进行离散化处理，得到多个离散特征；

编码特征得到单元，用于在包含离散型信息的情况下，采用独热编码方式对所述离散型信息进行编码处理，得到多个编码特征；

特征映射单元，用于对所述多个离散特征和所述多个编码特征进行特征映射，得到具有特定长度的相应特征向量，所述特征向量包括由不同的用户属性特征组成的用户属性特征向量，以及与不同的产品特征组成的产品特征向量。

影响因子得到模块23，用于将所述用户属性特征向量和所述产品特征向量分别输入组合特征模型和神经网络模型进行处理，得到低维度特征对用户点击各产品的第一影响因子，以及高维度特征对所述用户点击各产品的第二影响因子；

推荐评分确定模块24，用于基于所述应用平台上各产品的所述第一影响因子和所述第二影响因子，确定相应用户对所述各产品的推荐评分，所述推荐评分用于确定针对所述用户的推荐产品；

推荐评分存储模块25，用于存储确定的所述应用平台上不同用户对各产品的推荐评分。

在一些实施例中，为了实现上述组合特征模型的训练，如图7所示，本申请提出的产品推荐装置还可以包括：

样本信息获取模块26，用于获取不同用户的样本历史信息，所述样本历史信息包括相应用户的样本用户属性信息、样本产品信息以及样本行为信息；

样本特征向量化处理模块27，用于对所述样本用户属性信息和所述样本产品信息进行向量化处理，得到具有特定长度的样本用户属性特征向量和样本产品特征向量；

第一矩阵构建模块28，用于基于所述样本行为信息，由所述样本用户属性特征向量和所述样本产品特征向量，构建用户属性-产品行为矩阵，所述用户属性-产品行为矩阵包含多个组合特征，所述组合特征是由两个样本用户属性特征、两个样本产品特征，或者一个样本用户属性特征与一个样本产品特征组合得到；

第二矩阵构建模块29，用于基于所述样本行为信息，利用所述样本用户属性特征向量、所述样本产品特征向量及所述用户属性-产品行为矩阵，构建第一样本特征-产品点击率矩阵；

组合特征模型训练模块210，用于基于二项式定理，按照随机梯度下降方式，对组成所述第一样本特征-产品点击率矩阵进行模型参数训练，得到组合特征模型；

相应地，为了实现上述神经网络模型的训练，参照图7，在上述实施例的基础上，本申请提出的产品推荐装置还可以包括：

第三矩阵构建模块211，用于基于所述样本行为信息，利用所述样本用户属性特征向量和样本产品特征向量，构建第二样本特征-产品点击率矩阵；

神经网络模型训练模块212，用于利用神经网络中的多层全链接层，对组成所述第二样本特征-产品点击率矩阵进行训练，得到神经网络模型；

其中，所述神经网络模型用于预测至少三个维度的特征组合，对所述应用平台上的各产品被用户点击的影响因子。对于上述各实施例描述的产品推荐装置中的推荐评分确定模块24，在一些实施例中，其可以包括：

融合处理单元，用于将所述应用平台上同一产品的所述第一影响因子和所述第二影响因子进行融合处理，得到相应产品的目标影响特征向量；

推荐评分得到单元，用于利用激活函数，对所述各产品的目标影响特征向量进行运算，得到不同用户对所述各产品的推荐评分。

在一些实施例中，在应用平台上的注册用户访问该应用平台过程中，应用平台可以直接为其推送该用户评分较高的一些产品，因此，本申请提出的产品推荐装置还可以包括：

访问请求响应模块，用于响应用户客户端对所述应用平台的访问请求，得到所述用户客户端的用户标识；

推荐评分查询模块，用于查询与所述用户标识对应的各产品的推荐评分；

推荐产品选择模块，用于选择推荐评分较大的预设数量个产品作为推荐产品；

推荐产品推送模块，用于将所述推荐产品推送至发起所述用户客户端进行展示。

应该理解，对于访问应用平台的新用户，计算设备可以获取该新用户的用户属性信息，结合该应用平台的产品信息，利用上述训练好的模型，为该新用户推送其可能评分较高的推荐产品，具体实现过程可以参照上实施例相应部分的描述，不再赘述。

需要说明的是，关于上述各装置实施例中的各种模块、单元等，均可以作为程序模块存储在存储器中，由处理器执行存储在存储器中的上述程序模块，以实现相应的功能，关于各程序模块及其组合所实现的功能，以及达到的技术效果，可以参照上述方法实施例相应部分的描述，本实施例不再赘述。

本申请还提供了一种存储介质，其上存储有程序，该程序被处理器执行时实现上述产品推荐方法的各步骤，具体实现过程可以参照上述方法实施例相应部分的描述。

参照图8，为本申请提出的一种适用于上述产品推荐方法的计算机设备的硬件结构示意图，该计算机设备可以包括存储器21和处理器22，其中：

存储器21和处理器22均可以连接通信总线，以实现相互之间的数据交互，本申请对计算机设备内部的线路连接关系不做一一详述。

存储器21可以用于存储实现本申请提出的产品推荐方法的程序。

本实施例中，该存储器21可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件或其他易失性固态存储器件等，本申请对该存储器21的类型及存储结构不做限定。

在一种可能的实现方式中，存储器21可以包括程序存储区和数据存储区，该程序存储区可以存储操作系统、以及至少一个功能(如标签查询)所需的应用程序、实现本申请提出的产品推荐方法的程序等；数据存储区可以存储计算机设备使用过程中所产生的数据。

处理器33，可以用于加载并执行存储器22中存储的程序，以实现本申请任一可选实施例提出的产品推荐方法的各个步骤，具体实现过程可以参照下文相应实施例相应部分的描述。

在一些实施例中，上述处理器22可以为中央处理器(Central Processing Unit，CPU)、特定应用集成电路(application-specific integrated circuit，ASIC)、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件等。

应该理解的是，图8所示的计算机设备的结构并不构成对本申请实施例中计算机设备的限定，在实际应用中，计算机设备可以包括比图8所示的更多或更少的部件，或者组合某些部件，本申请在此不做一一列举。

最后，需要说明的是，本说明书中各个实施例采用递进或并列的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、计算机设备而言，由于其与实施例公开的方法对应，所以描述的比较简单，相关之处参见方法部分说明即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种产品推荐方法，其特征在于，所述方法包括：

获取应用平台上的用户属性信息和产品信息；

2.根据权利要求1所述的方法，其特征在于，所述对所述用户属性信息和所述产品信息进行向量化处理，得到具有特定长度的用户属性特征向量和产品特征向量，包括：

3.根据权利要求1所述的方法，其特征在于，所述组合特征模型的训练过程包括：

4.根据权利要求3所述的方法，其特征在于，所述神经网络模型的训练过程包括：

5.根据权利要求1～4任一项所述的方法，其特征在于，所述基于所述应用平台上各产品的所述第一影响因子和所述第二影响因子，确定相应用户对所述各产品的推荐评分，包括：

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：

查询与所述用户标识对应的各产品的推荐评分；

选择推荐评分较大的预设数量个产品作为推荐产品；

将所述推荐产品推送至发起所述用户客户端进行展示。

7.一种产品推荐装置，其特征在于，所述装置包括：

8.根据权利要求7所述的装置，其特征在于，所述装置还包括：

9.根据权利要求8所述的装置，其特征在于，所述装置还包括：

10.一种计算机设备，其特征在于，所述计算机设备包括：

存储器，用于存储实现如权利要求1～6任一项所述的产品推荐方法的程序；

处理器，用于加载并执行所述存储器存储的所述程序，以实现如权利要求1～6任一项所述的产品推荐方法的各步骤。