CN111709754B

CN111709754B - 一种用户行为特征提取方法、装置、设备及系统

Info

Publication number: CN111709754B
Application number: CN202010534496.6A
Authority: CN
Inventors: 姜晓楠
Original assignee: China Construction Bank Corp
Current assignee: China Construction Bank Corp
Priority date: 2020-06-12
Filing date: 2020-06-12
Publication date: 2023-08-25
Anticipated expiration: 2040-06-12
Also published as: CN111709754A

Abstract

本说明书提供了一种用户行为特征提取方法、装置、设备及系统。所述方法包括采集目标用户的行为数据；将所述行为数据输入预设自编码网络模型进行学习；其中，所述预设自编码网络模型基于预设神经元结构训练获得，所述预设神经元结构中包括时间间隔序列和注意力机制，所述时间间隔序列用于反映操作时间间隔对神经元记忆更新的影响，所述注意力机制用于反映历史行为与当前行为的差异；将所述预设自编码网络模型中认知网络输出的结果作为所述目标用户的行为特征信息。利用本说明书实施例可以更准确的提取用户行为特征，降低反欺诈的检测难度。

Description

一种用户行为特征提取方法、装置、设备及系统

技术领域

本申请涉及特征挖掘技术领域，特别涉及一种用户行为特征提取方法、装置、设备及系统。

背景技术

当前，金融科技在大数据、人工智能、区块链等新兴前沿技术的驱动下，对传统金融行业的渗透已成为不可逆转的潮流。与此同时，金融欺诈的风险也不断扩大，反欺诈形势变得越来越严峻。

反欺诈在一定程度上可以等同于预测人的行为。目前业界在行为特征挖掘上的尝试主要包括基于人工衍生业务特征(特征工程)、专家经验及有监督模型。例如，金融机构在反欺诈业务中越来越多的趋向于深度挖掘自有数据，丰富用户行为数据埋点，以期从中挖掘出有效的欺诈特征。然而，随着金融欺诈形式不断更新、纷繁复杂，欺诈者不断采取新的技术来模仿正常用户的行为轨迹，用户行为数据的非结构化、噪声大等特性使得对用户行为特征的挖掘效率低、时效性差，从而加大了在线反欺诈的检测难度。因此，如何更精准的描述用户行为特征是一个难点。

发明内容

本说明书实施例提供了一种用户行为特征提取方法、装置、设备及系统，可以更准确的提取用户行为特征，降低反欺诈的检测难度。

本说明书提供的用户行为特征提取方法、装置、设备及系统是包括以下方式实现的。

一种用户行为特征提取方法，包括：采集目标用户的行为数据；将所述行为数据输入预设自编码网络模型进行学习；其中，所述预设自编码网络模型基于预设神经元结构训练获得，所述预设神经元结构中包括时间间隔序列和注意力机制，所述时间间隔序列用于反映操作时间间隔对神经元记忆更新的影响，所述注意力机制用于反映历史行为与当前行为的差异；将所述预设自编码网络模型中认知网络输出的结果作为所述目标用户的行为特征信息。

一种用户行为特征提取装置，包括：采集模块，用于采集目标用户的行为数据；学习模块，用于将所述行为数据输入预设自编码网络模型进行学习；其中，所述预设自编码网络模型基于预设神经元结构训练获得，所述预设神经元结构中包括时间间隔序列和注意力机制，所述时间间隔序列用于反映操作时间间隔对神经元记忆更新的影响，所述注意力机制用于反映历史行为与当前行为的差异；输出模块，用于将所述预设自编码网络模型中认知网络输出的结果作为所述目标用户的行为特征信息。

一种用户行为特征提取设备，包括处理器及用于存储处理器可执行指令的存储器，所述指令被所述处理器执行时实现包括以下步骤：

采集目标用户的行为数据；将所述行为数据输入预设自编码网络模型进行学习；其中，所述预设自编码网络模型基于预设神经元结构训练获得，所述预设神经元结构中包括时间间隔序列和注意力机制，所述时间间隔序列用于反映操作时间间隔对神经元记忆更新的影响，所述注意力机制用于反映历史行为与当前行为的差异；将所述预设自编码网络模型中认知网络输出的结果作为所述目标用户的行为特征信息。

一种用户行为特征提取系统，包括至少一个处理器以及存储计算机可执行指令的存储器，所述处理器执行所述指令时实现本说明书实施例中任意一个方法实施例方法的步骤。

本说明书提供的一种用户行为特征提取方法、装置、设备及系统。一些实施例中通过采集用户在全流程上的行为数据，输入预设自编码网络模型学习，由于预设自编码网络模型的神经元结构中加入了操作时间间隔序列，可以更精确的刻画出用户操作时间间隔对神经元记忆更新的影响，从而可以更高效精确的建立用户行为画像，深层挖掘用户行为特征。通过在神经元结构中加入注意力机制，可以有效捕获历史行为与当前行为的差异，挖掘重复性、周期性规律，输出更精准的用户行为数据特征表达。采用本说明书提供的实施方案，可以更准确的提取用户行为特征，有效减少特征挖掘人工成本的同时，降低反欺诈的检测难度。

附图说明

此处所说明的附图用来提供对本说明书的进一步理解，构成本说明书的一部分，并不构成对本说明书的限定。在附图中：

图1是本说明书提供的AutoEncoder的网络结构示意图；

图2是本说明书提供的用户行为特征提取方法的一个实施例的流程示意图；

图3是本说明书提供的一种将行为数据转化为多维矩阵的一个实施例的示意图；

图4是本说明书提供的一种预设神经元结构的一个实施例的示意图；

图5是本说明书提供的一种用户行为特征提取装置的一个实施例的模块结构示意图；

图6是本说明书提供的一种用户行为特征提取服务器的一个实施例的硬件结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书中的一部分实施例，而不是全部的实施例。基于本说明书中的一个或多个实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本说明书实施例保护的范围。

反欺诈在一定程度上可以等同于预测人的行为。随着金融欺诈形式不断更新、纷繁复杂，欺诈者能迅速改变欺诈模式。新型欺诈往往由许多复杂事件和步骤完成，欺诈者不断采取新的技术来模仿正常用户的行为轨迹，单靠专家经验及人工特征工程挖掘行为特征效率低、时效性差。此外，由于不同客群在操作时间间隔上的特征差异较明显，所以传统基于循环神经网络及其各种变种形式的模型均假定时序序列间的时间间隔固定，在相当程度上会影响对用户行为特征的挖掘。另外，金融产品的在线申请通常经历多个间断过程，用户可能反复操作多个业务步骤，所以历史行为与当前行为的差异也可能会影响用户行为特征的挖掘。因此，随着金融欺诈形式的不断更新、纷繁复杂，如何更精准的描述用户行为特征是一个难点。

本说明书提供的一种用户行为特征提取方法、装置、设备及系统，通过长短期记忆网络结合自编码网络，同时加入操作间隔特征用以表达操作的持续时间对网络中长短期记忆的影响，可以作为传统金融反欺诈特征衍生的有效补充，实现更精确刻画用户行为数据、预测欺诈概率的效果。

本说明书实施例中，自编码网络(AutoEncoder)是一种多层前馈神经网络，它的输入和输出相同，无需数据标签就可以实现无监督训练的效果。其中，AutoEncoder由两部分组成：一部分是Encoder(编码)，也可以称为认知网络；另一部分是Decoder(解码)，也可以称为生成网络。如图1所示，图1是本说明书提供的AutoEncoder的网络结构示意图，其输入数据通过Encoder逐层降维，相当于对原始数据的一个编码过程，形成原始数据的一个浓缩表示，到最低维度后，通过Decoder开始逐层增加神经元，相当于一个解码过程，解码输出要和原始数据尽量接近，即在大幅度压缩原始特征空间的前提下，尽量减少压缩的损失。其中，AutoEncoder网络的目的是更加清楚的认识数据，在这个优化目标的指导下，学习到的网络连接权重都是不同的嵌入向量，从而可以更好的表达数据的特征。

由于AutoEncoder网络中间的隐藏层有维度缩减的效果，因而强制网络学习到数据内部的模式，可以起到高效的对训练数据的记忆作用。此外，AutoEncoder中对称的网络结构也可以使得在编码和解码的训练中共享权重，从而大幅提高训练速度。

本说明书实施例中，长短期记忆神经网络(Long Short-Term Memory，LSTM)是一种被广泛使用的循环神经网络(Recurrent Neural Network，RNN)的变体，它可以解决传统循环神经网络无法学习到长期依赖的问题。LSTM模型是一个链式结构，核心在于它的神经元状态，通过一系列门限结构更新或删除神经元状态中的信息。门限是一种让信息选择性通过的方式，由Sigmoid神经网络层和逐点相乘器组成。LSTM通过三个门限结构和神经元状态之间的交互达到学习长距离依赖关系的效果。

下面以一个具体的应用场景为例对本说明书实施方案进行说明。具体的，图2是本说明书提供的用户行为特征提取方法的一个实施例的流程示意图。虽然本说明书提供了如下述实施例或附图所示的方法操作步骤或装置结构，但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者部分合并后更少的操作步骤或模块单元。在逻辑性上不存在必要因果关系的步骤或结构中，这些步骤的执行顺序或装置的模块结构不限于本说明书实施例或附图所示的执行顺序或模块结构。所述的方法或模块结构的在实际中的装置、服务器或终端产品应用时，可以按照实施例或者附图所示的方法或模块结构进行顺序执行或者并行执行(例如并行处理器或者多线程处理的环境、甚至包括分布式处理、服务器集群的实施环境)。

需要说明的是，下述实施例描述并不对基于本说明书的其他可扩展到的应用场景中的技术方案构成限制。具体的一种实施例如图2所示，本说明书提供的一种用户行为特征提取方法的一种实施例中，所述方法可以包括以下步骤。

S0：采集目标用户的行为数据。

本说明书实施例中，行为数据可以理解为用户对业务流程操作过程中产生的数据。行为数据可以包括操作行为、操作时间、操作时间间隔、操作行为序列、操作时间序列等。其中，业务流程可以包括借款流程、贷款流程等。操作行为可以包括用户的点击、申请、购买、浏览、点赞、评分、分享等行为。操作时间可以理解为操作行为对应的时间。操作行为序列可以理解为是由操作行为组成的序列。操作时间序列可以理解为是由操作时间组成的序列。序列可以理解为是被排成一列的对象(或事件)。目标用户可以理解为需要被提取行为特征信息的用户。行为特征信息可以通过对行为数据进行深度学习训练获得。行为特征信息可以理解为是机器学习到的一个隐含向量。相比行为数据，行为特征信息可以更精确的刻画用户行为，从而可以更有效的提高预测欺诈的概率。

本说明书一个实施例中，可以通过预先埋点主动采集用户的行为数据。其中，埋点的技术实质可以理解为先监听软件应用运行过程中的事件，当需要关注的事件发生时进行判断和捕获，然后获取必要的上下文信息，最后将信息整理后发送至服务器端。所监听的事件，通常由操作系统、浏览器、APP(Application)框架等平台提供，也可以在基础事件之上进行触发条件的自定义(如点击某一个特定按钮)。例如一些实施场景中，可以通过预先埋点主动采集用户在借贷APP客户端上浏览、点击、申请、购买等操作行为以及对应的时间和每个操作行为之间的时间间隔。一些实施场景中，在采集用户行为数据的基础上，也可以相应采集设备环境信息等相关数据，如设备当前状态、当前所处环境的温度等。

需要说明的是，为了便于理解，上述示例性的说明了用户行为数据的采集方式，本说明书还可以包括其他采集方式，对此不作限定。

本说明书一个实施例中，在采集目标用户的行为数据后，还可以对行为数据进行预处理。其中，预处理可以包括清洗、去噪、编码、对操作时间序列做傅里叶变换转换成频次序列等。数据清洗、去噪可以把冗杂、混乱、无效的“脏数据”清洗干净，让业务模型能够输入高质量的数据源。编码可以有效减少信息量，从而提高处理效率和精度。由于频域特征可以降低特征空间的维度，使特征更集中，所以可以通过对操作时间序列做傅里叶变换，从而提取频域时间序列的特征。

本说明书一个实施例中，在采集行为数据后，可以通过预设方式将其转换为多维矩阵。例如一些实施场景中，可以将行为数据中的操作行为表示为[浏览，点击，申请，购买，点击]，对应的时间间隔表示为[0，6，13，5，20]。另一些实施场景中，可以将行为数据中的操作行为表示为[浏览，点击，申请，购买，点击]，操作行为对应的时间表示为[1，7，20，25，45]，对应的时间间隔表示为[0，6，13，5，20]。

另一些实施场景中，可以将多个用户的操作行为表示为矩阵形式1，将多个用户的操作行为对应的时间间隔表示为矩阵2，然后将矩阵1、矩阵2对应组合成多维矩阵。如图3所示，图3是本说明书提供的一种将行为数据转化为多维矩阵的一个实施例的示意图。其中，矩阵1中每行表示一个用户，每列表示一个操作行为，矩阵2中每行表示一个用户，每列表示当前操作行为与前一个操作行为之间的时间间隔，将矩阵1和矩阵2组合可以获得用户的多维矩阵。虚线表示矩阵1与矩阵2之间的对应关系，例如，用户1申请操作与点击操作之间的时间间隔为12s，用户1的购买操作与申请操作之间的时间间隔为30s等。需要说明的是，本说明书对时间单位不不作限定。

需要说明的是，由于行为数据可以包括操作行为、操作时间、操作时间间隔、操作行为序列、操作时间序列等，所以可以根据实际场景将行为数据转化为对应的矩阵，上述只是进行示例性说明，对本说明书其它实施方案不构成限定。

S2：将所述行为数据输入预设自编码网络模型进行学习；其中，所述预设自编码网络模型基于预设神经元结构训练获得，所述预设神经元结构中包括时间间隔序列和注意力机制，所述时间间隔序列用于反映操作时间间隔对神经元记忆更新的影响，所述注意力机制用于反映历史行为与当前行为的差异。

本说明书实施例中，在获得目标用户的行为数据后，可以将行为数据输入预先获得的自编码网络模型进行学习，以便获得目标用户的行为特征信息。

本说明书一个实施例中，可以预先训练获得自编码网络模型，然后在获得目标用户的行为数据后，将所述行为数据输入该自编码网络模型，从而实现对目标用户行为特征的提取。

本说明书一个实施例中，所述预设自编码网络模型可以通过下述方式得到：构建长短期记忆神经网络；对所述长短期记忆神经网络的神经元结构进行优化处理，获得预设神经元结构；利用所述预设神经元结构对自编码网络进行训练，获得预设自编码网络模型。其中，长短期记忆神经网络的神经元结构包括遗忘门限、输入门限、输出门限，遗忘门限可以确定从神经元状态中丢弃哪些信息，输入门限可以确定哪些新信息可以加到神经元状态中，输出门限可以确定神经元状态中哪些信息可以输出。优化处理可以包括在神经元结构中添加时间间隔序列、衰减函数、注意力机制等。对神经元结构进行优化处理，可以使获得的预设自编码网络模型更新神经元状态时，考虑时间间隔对长短期记忆的影响和历史行为的影响。时间间隔序列可以用于反映操作时间间隔对神经元记忆更新的影响。衰减函数也可以称为惩罚项，其可以用于调整时间间隔序列对神经元记忆更新的权重，平衡长短期记忆，时间间隔越大，权重越小，对当前输出的影响越小。注意力机制可以用于反映历史行为与当前行为的差异。由于用户行为数据本身区分度较弱，采用深度学习方式挖掘出的历史行为关联及时序特征，在区分度及稳定性上有一定提升，从而可以作为专家规则及特征工程的补充，在一定程度上可以为发现新的欺诈模式提供方便。

本说明书一个实施例中，所述对所述长短期记忆神经网络的神经元结构进行优化处理，获得预设神经元结构，可以包括：在神经元结构的遗忘门限中添加时间间隔序列，获得第一神经元结构；在所述第一神经元结构中添加注意力机制，获得预设神经元结构。本说明书一个实施例中，所述利用所述预设神经元结构对自编码网络进行训练，包括：基于衰减函数和所述预设神经元结构，确定更新后神经元状态，所述衰减函数用于调整时间间隔序列对神经元记忆更新的权重。

例如一些实施场景中，可以先构建一个LSTM，然后获取LSTM的神经元结构，在该神经元结构的遗忘门限中添加时间间隔序列后，添加注意力机制，获得预设神经元结构，最后将预设神经元结构作为自编码网络中神经元进行训练，获得基于LSTM的自编码网络模型，即预设自编码网络模型。其中，训练过程中，由于在每个时间点，可以回溯之前预设数量个隐藏层输出，即通过加入注意力机制可以实现历史行为上下文信息的加入，从而使获得的预设自编码网络模型可以捕获历史行为与当前行为的差异度，挖掘重复性、周期性规律，输出更精准的用户行为序列特征表达。

一些实施场景中，在遗忘门限中加入时间间隔序列的同时，可以在当前神经元状态输出中添加衰减函数调节时间间隔对记忆单元更新的权重，使得时间间隔越长、影响越小，从而使获得的预设自编码网络模型可以实现网络模型对长短期记忆的平衡。

如图4所示，图4是本说明书提供的一种预设神经元结构的一个实施例的示意图，其中，在遗忘门限结构中加入时间间隔序列，同时在当前神经元状态输出中添加衰减函数调节时间间隔对记忆单元更新的权重。

本说明书一个实施例中，预设神经元结构中各个门限及神经元状态及更新通过下述公式计算：

遗忘门限计算公式如下：

f_t＝δ(W_f[h_t-1,x_t]+W_ft△T_t-1,t+b_f) (1)

输入门限计算公式如下：

i_t＝δ(W_i[h_t-1,x_t]+b_i) (2)

输出门限计算公式如下：

o_t＝δ(W_o[h_t-1,x_t]+b_o) (3)

候选状态计算公式如下：

更新后神经元状态计算公式如下：

其中，δ表示Sigmoid激活函数，x_t表示t时刻的输入，h_t-1表示t-1时刻的输出，ΔT_t-1,t表示相邻两操作的时间间隔，W表示待训练权重，b表示偏置项，C_t表示经遗忘门限和输入门限更新后神经元状态，即t时刻神经元状态，表示调整后的长期记忆，C_t-1表示t-1时刻神经元状态，/>表示短期记忆，/>表示衰减后的短期记忆，g(△t)表示衰减函数。

本说明书一个实施例中，利用预设神经元结构训练过程中，可以对每个时间步骤t加入前k个时间步骤对应的历史行为。其中，历史行为打分及注意力权重更新公式如下：

隐藏层候选输出计算公式如下：

历史行为打分计算公式如下：

历史行为向量计算公式如下：

隐藏层输出计算公式如下：

其中，t表示当前神经元对应的时刻，k表示t时刻前的第k个时刻，M表示t时刻前的第M个时刻，W表示待训练权重，b表示偏置项，h_k表示t时刻前第k个时刻的历史行为，softmax用于对数据进行归一化。

需要说明的是，W、b的下标只是用于区分不同权重和偏置项，并无实际含义。上述以t时刻预设神经元结构中各个门限及神经元状态及更新为例进行说明，其它时刻的类似，对此不作赘述。

本说明书一个实施例中，在每个时间点t，可以回溯之前k个隐藏层输出，通过公式(10)为每个历史状态打分，然后将所有历史行为分数归一化后，利用公式(11)进行加权平均作为历史行为向量，最后输出结合了历史状态及当前状态的行为向量。

本说明书一个实施例中，预设自编码网络模型可以包括认知网络和生成网络。其中，认知网络相当于自编码网络的Encoder，生成网络相当于自编码网络的Decoder。

本说明书一个实施例中，利用预设神经元结构对自编码网络进行训练，获得预设自编码网络模型过程中，Encoder部分将输入空间χ中的数据X通过编码函数φ映射到隐藏空间F，而Decoder部分将隐藏空间F通过解码函数ψ重构到输入空间χ，整体的优化目标为使得压缩及重构还原的均方误差尽量小。

其中，Autoencoder损失函数定义如下：

其中，→表示映射，中的小圆圈表示两个映射的复合映射。Encoder部分采用标准神经网络的假设函数，即线性函数的非线性映射：z＝σ(Wx+b)，有着对称结构的Decoder的假设函数也相类似：x′＝σ′(W′z+b′)。网络的优化目标为使得编码和解码后的输出尽可能接近原始输入空间：

其中，σ、σ′表示sigmoid函数，W、W′、b、b′分别表示待训练权重，x表示Encoder部分的原始输入向量，z表示Encoder部分的输出向量和Decoder部分的输入向量，x′表示Decoder部分的输出向量，表示x与x′的均方误差。训练过程与神经网络的训练过程相同，采用前向传递和后向反馈的方式不断迭代更新权重直至损失函数收敛，最后获得预设自编码网络模型。

本说明书实施例中，由于长短期记忆神经网络可以解决传统循环神经网络无法学习到长期依赖的问题，自编码网络中间的隐藏层有维度缩减的效果，而且可以起到高效的对训练数据的记忆作用，所以将长短期记忆神经网络的神经元结构进行优化处理后，对AutoEncoder进行训练获得的预设自编码网络模型可以更深层挖掘用户行为特征。

需要说明的是，由于LSTM具有一种重复神经网络模块的链式的形式，所以上述选择其中任意一个神经元结构(重复模块)进行示例性说明，其它神经元结构类似，本说明书对此不作赘述。

本说明书一个实施例中，在获得预设自编码网络模型后，可以将目标用户的行为数据输入所述预设自编码网络模型，从而实现对目标用户行为特征的提取。

本说明书一个实施例中，可以将采集的行为数据转化为多维矩阵，然后输入到预设自编码网络模型进行特征提取。例如一些实施场景中，可以将行为数据中操作行为和对应的操作时间间隔转化为三维向量[样本数量，时间，特征]，然后输入到预设自编码网络模型。

S4：将所述预设自编码网络模型中认知网络输出的结果作为所述目标用户的行为特征信息。

本说明书一个实施例中，预设自编码网络模型可以包括认知网络和生成网络。其中，认知网络相当于自编码网络的Encoder，生成网络相当于自编码网络的Decoder。本说明书一个实施例中，输入数据通过Encoder逐层降维，形成输入数据的一个浓缩表示，到最低维度后，通过Decoder开始逐层增加神经元，解码输出和输入数据尽量接近的数据，即在大幅度压缩原始特征空间的前提下，尽量减少压缩的损失。行为特征信息可以通过对行为数据进行深度学习训练获得。行为特征信息可以理解为是机器学习到的一个隐含向量。相比行为数据，行为特征可以更精确的刻画用户行为，从而可以更有效的提高预测欺诈的概率。

本说明书一个实施例中，在将行为数据输入预设自编码网络模型进行学习后，可以将预设自编码网络模型中认知网络输出的结果作为目标用户的行为特征信息。一些实施场景中，由于输入数据通过Encoder逐层降维可以形成输入数据的一个浓缩表示，所以在将行为数据输入预设自编码网络模型进行学习后，可以提取Encoder的中间层输出作为目标用户的行为特征信息。

本说明书提供的一种用户行为特征提取方法，通过在长短期记忆神经网络的神经元结构中加入操作时间间隔序列，可以更精确的刻画出用户操作时间间隔对神经元记忆更新的影响，解决循环神经网络中时间间隔固定的问题。通过在长短期记忆神经网络的神经元结构中加入注意力机制，可以有效捕获历史行为与当前行为的差异，挖掘重复性、周期性规律，输出更精准的用户行为特征表达。通过将改进的长短期记忆网络及自编码网络结合，可以更高效精确的建立用户行为画像的同时，实现自动化用户行为特征的提取。

本说明书中上述方法的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参加即可，每个实施例重点说明的都是与其他实施例的不同之处。相关之处参见方法实施例的部分说明即可。

基于上述所述的一种用户行为特征提取方法，本说明书一个或多个实施例还提供一种用户行为特征提取装置。所述的装置可以包括使用了本说明书实施例所述方法的系统(包括分布式系统)、软件(应用)、模块、组件、服务器、客户端等并结合必要的实施硬件的装置。基于同一创新构思，本说明书实施例提供的一个或多个实施例中的装置如下面的实施例所述。由于装置解决问题的实现方案与方法相似，因此本说明书实施例具体的装置的实施可以参见前述方法的实施，重复之处不再赘述。以下所使用的，术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

具体地，图5是本说明书提供的一种用户行为特征提取装置的一个实施例的模块结构示意图，如图5所示，本说明书提供的一种用户行为特征提取装置可以包括：采集模块120，学习模块122，输出模块124。

采集模块120，可以用于采集目标用户的行为数据；

学习模块122，可以用于将所述行为数据输入预设自编码网络模型进行学习；其中，所述预设自编码网络模型基于预设神经元结构训练获得，所述预设神经元结构中包括时间间隔序列和注意力机制，所述时间间隔序列用于反映操作时间间隔对神经元记忆更新的影响，所述注意力机制用于反映历史行为与当前行为的差异；

输出模块124，可以用于将所述预设自编码网络模型中认知网络输出的结果作为所述目标用户的行为特征信息。

基于前述方法所述实施例的描述，本说明书所述装置的另一个实施例中，所述预设自编码网络模型可以包括：

构建模块，可以用于构建长短期记忆神经网络；

优化模块，可以用于对所述长短期记忆神经网络的神经元结构进行优化处理，获得预设神经元结构；

训练模块，可以用于利用所述预设神经元结构对自编码网络进行训练，获得预设自编码网络模型。

基于前述方法所述实施例的描述，本说明书所述装置的另一个实施例中，所述优化模块，可以包括：

获得单元，可以用于在神经元结构的遗忘门限中添加时间间隔序列，获得第一神经元结构；

添加单元，可以用于在所述第一神经元结构中添加注意力机制，获得预设神经元结构。

基于前述方法所述实施例的描述，本说明书所述装置的另一个实施例中，所述训练模块，可以包括：

确定单元，可以用于基于衰减函数和所述预设神经元结构，确定更新后神经元状态，所述衰减函数用于调整时间间隔序列对神经元记忆更新的权重。

本说明书提供的一种用户行为特征提取装置，通过在长短期记忆神经网络的神经元结构中加入操作时间间隔序列，可以更精确的刻画出用户操作时间间隔对神经元记忆更新的影响，解决循环神经网络中时间间隔固定的问题。通过在长短期记忆神经网络的神经元结构中加入注意力机制，可以有效捕获历史行为与当前行为的差异，挖掘重复性、周期性规律，输出更精准的用户行为特征表达。通过将改进的长短期记忆网络及自编码网络结合，可以更高效精确的建立用户行为画像的同时，实现自动化用户行为特征的提取。

需要说明的，上述所述的装置根据方法实施例的描述还可以包括其他的实施方式，具体的实现方式可以参照相关方法实施例的描述，在此不作一一赘述。

本说明书还提供一种用户行为特征提取设备的实施例，包括处理器及用于存储处理器可执行指令的存储器，所述指令被所述处理器执行时实现包括以下步骤：

采集目标用户的行为数据；

将所述行为数据输入预设自编码网络模型进行学习；其中，所述预设自编码网络模型基于预设神经元结构训练获得，所述预设神经元结构中包括时间间隔序列和注意力机制，所述时间间隔序列用于反映操作时间间隔对神经元记忆更新的影响，所述注意力机制用于反映历史行为与当前行为的差异；

将所述预设自编码网络模型中认知网络输出的结果作为所述目标用户的行为特征信息。

需要说明的，上述所述的设备根据方法或装置实施例的描述还可以包括其他的实施方式。具体的实现方式可以参照相关方法实施例的描述，在此不作一一赘述。

本说明书还提供一种用户行为特征提取系统的实施例，包括至少一个处理器以及存储计算机可执行指令的存储器，所述处理器执行所述指令时实现上述任意一个或者多个实施例中所述方法的步骤，例如包括：采集目标用户的行为数据；将所述行为数据输入预设自编码网络模型进行学习；其中，所述预设自编码网络模型基于预设神经元结构训练获得，所述预设神经元结构中包括时间间隔序列和注意力机制，所述时间间隔序列用于反映操作时间间隔对神经元记忆更新的影响，所述注意力机制用于反映历史行为与当前行为的差异；将所述预设自编码网络模型中认知网络输出的结果作为所述目标用户的行为特征信息。所述的系统可以为单独的服务器，也可以包括使用了本说明书的一个或多个所述方法或一个或多个实施例装置的服务器集群、系统(包括分布式系统)、软件(应用)、实际操作装置、逻辑门电路装置、量子计算机等并结合必要的实施硬件的终端装置。

本说明书所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行。以运行在服务器上为例，图6是本说明书提供的一种用户行为特征提取服务器的一个实施例的硬件结构框图，该服务器可以是上述实施例中的用户行为特征提取装置或用户行为特征提取系统。如图6所示，服务器10可以包括一个或多个(图中仅示出一个)处理器100(处理器100可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器200、以及用于通信功能的传输模块300。本领域普通技术人员可以理解，图6所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，服务器10还可包括比图6中所示更多或者更少的组件，例如还可以包括其他的处理硬件，如数据库或多级缓存、GPU，或者具有与图6所示不同的配置。

存储器200可用于存储应用软件的软件程序以及模块，如本说明书实施例中的用户行为特征提取方法对应的程序指令/模块，处理器100通过运行存储在存储器200内的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器200可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器200可进一步包括相对于处理器100远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输模块300用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中，传输模块300包括一个网络适配器(Network Interface Controller，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输模块300可以为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本说明书提供的上述实施例所述的方法或装置可以通过计算机程序实现业务逻辑并记录在存储介质上，所述的存储介质可以计算机读取并执行，实现本说明书实施例所描述方案的效果。

所述存储介质可以包括用于存储信息的物理装置，通常是将信息数字化后再以利用电、磁或者光学等方式的媒体加以存储。所述存储介质有可以包括：利用电能方式存储信息的装置如，各式存储器，如RAM、ROM等；利用磁能方式存储信息的装置如，硬盘、软盘、磁带、磁芯存储器、磁泡存储器、U盘；利用光学方式存储信息的装置如，CD或DVD。当然，还有其他方式的可读存储介质，例如量子存储器、石墨烯存储器等等。

本说明书提供的上述用户行为特征提取方法或装置实施例可以在计算机中由处理器执行相应的程序指令来实现，如使用windows操作系统的c++语言在PC端实现、linux系统实现，或其他例如使用android、iOS系统程序设计语言在智能终端实现，以及基于量子计算机的处理逻辑实现等。

需要说明的是说明书上述所述的装置、计算机存储介质、系统根据相关方法实施例的描述还可以包括其他的实施方式，具体的实现方式可以参照对应方法实施例的描述，在此不作一一赘述。

本申请中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于硬件+程序类实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书实施例并不局限于必须是符合行业通信标准、标准计算机数据处理和数据存储规则或本说明书一个或多个实施例所描述的情况。某些行业标准或者使用自定义方式或实施例描述的实施基础上略加修改后的实施方案也可以实现上述实施例相同、等同或相近、或变形后可预料的实施效果。应用这些修改或变形后的数据获取、存储、判断、处理方式等获取的实施例，仍然可以属于本说明书实施例的可选实施方案范围之内。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device，PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元中的部分具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、平板电脑、智能手机等。

虽然本说明书一个或多个实施例提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的装置或设备产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境，甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、或者设备所固有的要素。在没有更多限制的情况下，并不排除在包括所述要素的过程、方法、或者设备中还存在另外的相同或等同要素。

为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本说明书一个或多个时可以把部分模块的功能在同一个或多个软件和/或硬件中实现，也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

本发明是参照根据本发明实施例的方法、装置(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储、石墨烯存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

本领域技术人员应明白，本说明书一个或多个实施例可提供为方法、系统或计算机程序产品。因此，本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”等的描述意指结合该实施例或示例描述的具体特征、结构、或者特点包含于本说明书的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

以上所述仅为本说明书一个或多个实施例的实施例而已，并不用于限制本本说明书一个或多个实施例。对于本领域技术人员来说，本说明书一个或多个实施例可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在权利要求范围之内。

Claims

1.一种用户行为特征提取方法，其特征在于，包括：

采集目标用户的行为数据；其中，所述行为数据为用户对业务流程操作过程中产生的数据，所述行为数据包括操作行为、操作时间、操作时间间隔、操作行为序列、操作时间序列，所述业务流程包括借款流程、贷款流程，所述操作行为包括用户的点击、申请、购买、浏览、点赞、评分、分享行为；

将所述预设自编码网络模型中认知网络输出的结果作为所述目标用户的行为特征信息；

其中，所述预设神经元结构中各个门限及神经元状态通过下述公式计算：

遗忘门限计算公式如下：

f_t＝δ(W_f[h_t-1,x_t]+W_ft△T_t-1,t+b_f)

输入门限计算公式如下：

i_t＝δ(W_i[h_t-1,x_t]+b_i)

输出门限计算公式如下：

o_t＝δ(W_o[h_t-1,x_t]+b_o)

候选状态计算公式如下：

更新后神经元状态计算公式如下：

隐藏层候选输出计算公式如下：

历史行为打分计算公式如下：

历史行为向量计算公式如下：

隐藏层输出计算公式如下：

其中，δ表示Sigmoid激活函数，x_t表示t时刻的输入，h_t-1表示t-1时刻的输出，ΔT_t-1,t表示相邻两操作的时间间隔，W_a表示待训练权重，b_a表示偏置项，C_t表示经遗忘门限和输入门限更新后神经元状态，表示调整后的长期记忆，C_t-1表示t-1时刻神经元状态，/>表示短期记忆，/>表示衰减后的短期记忆，g(△t)表示衰减函数，t表示当前神经元对应的时刻，k表示t时刻前的第k个时刻，M表示t时刻前的第M个时刻，h_k表示t时刻前的k个时刻的历史行为，softmax表示对数据进行归一化。

2.根据权利要求1所述的方法，其特征在于，所述预设自编码网络模型包括采用下述方式得到：

构建长短期记忆神经网络；

对所述长短期记忆神经网络的神经元结构进行优化处理，获得预设神经元结构；

利用所述预设神经元结构对自编码网络进行训练，获得预设自编码网络模型。

3.根据权利要求2所述的方法，其特征在于，所述对所述长短期记忆神经网络的神经元结构进行优化处理，获得预设神经元结构，包括：

在神经元结构的遗忘门限中添加时间间隔序列，获得第一神经元结构；

在所述第一神经元结构中添加注意力机制，获得预设神经元结构。

4.根据权利要求2所述的方法，其特征在于，所述利用所述预设神经元结构对自编码网络进行训练，包括：

基于衰减函数和所述预设神经元结构，确定更新后神经元状态，所述衰减函数用于调整时间间隔序列对神经元记忆更新的权重。

5.一种用户行为特征提取装置，其特征在于，包括：

采集模块，用于采集目标用户的行为数据；其中，所述行为数据为用户对业务流程操作过程中产生的数据，所述行为数据包括操作行为、操作时间、操作时间间隔、操作行为序列、操作时间序列，所述业务流程包括借款流程、贷款流程，所述操作行为包括用户的点击、申请、购买、浏览、点赞、评分、分享行为；

学习模块，用于将所述行为数据输入预设自编码网络模型进行学习；其中，所述预设自编码网络模型基于预设神经元结构训练获得，所述预设神经元结构中包括时间间隔序列和注意力机制，所述时间间隔序列用于反映操作时间间隔对神经元记忆更新的影响，所述注意力机制用于反映历史行为与当前行为的差异；

输出模块，用于将所述预设自编码网络模型中认知网络输出的结果作为所述目标用户的行为特征信息；

遗忘门限计算公式如下：

f_t＝δ(W_f[h_t-1,x_t]+W_ft△T_t-1,t+b_f)

输入门限计算公式如下：

i_t＝δ(W_i[h_t-1,x_t]+b_i)

输出门限计算公式如下：

o_t＝δ(W_o[h_t-1,x_t]+b_o)

候选状态计算公式如下：

更新后神经元状态计算公式如下：

隐藏层候选输出计算公式如下：

历史行为打分计算公式如下：

历史行为向量计算公式如下：

隐藏层输出计算公式如下：

6.根据权利要求5所述的装置，其特征在于，所述预设自编码网络模型包括：

构建模块，用于构建长短期记忆神经网络；

优化模块，用于对所述长短期记忆神经网络的神经元结构进行优化处理，获得预设神经元结构；

训练模块，用于利用所述预设神经元结构对自编码网络进行训练，获得预设自编码网络模型。

7.根据权利要求6所述的装置，其特征在于，所述优化模块，包括：

获得单元，用于在神经元结构的遗忘门限中添加时间间隔序列，获得第一神经元结构；

添加单元，用于在所述第一神经元结构中添加注意力机制，获得预设神经元结构。

8.根据权利要求6所述的装置，其特征在于，所述训练模块，包括：

确定单元，用于基于衰减函数和所述预设神经元结构，确定更新后神经元状态，所述衰减函数用于调整时间间隔序列对神经元记忆更新的权重。

9.一种用户行为特征提取设备，其特征在于，包括处理器及用于存储处理器可执行指令的存储器，所述指令被所述处理器执行时实现包括以下步骤：采集目标用户的行为数据；其中，所述行为数据为用户对业务流程操作过程中产生的数据，所述行为数据包括操作行为、操作时间、操作时间间隔、操作行为序列、操作时间序列，所述业务流程包括借款流程、贷款流程，所述操作行为包括用户的点击、申请、购买、浏览、点赞、评分、分享行为；将所述行为数据输入预设自编码网络模型进行学习；其中，所述预设自编码网络模型基于预设神经元结构训练获得，所述预设神经元结构中包括时间间隔序列和注意力机制，所述时间间隔序列用于反映操作时间间隔对神经元记忆更新的影响，所述注意力机制用于反映历史行为与当前行为的差异；将所述预设自编码网络模型中认知网络输出的结果作为所述目标用户的行为特征信息；

遗忘门限计算公式如下：

f_t＝δ(W_f[h_t-1,x_t]+W_ft△T_t-1,t+b_f)

输入门限计算公式如下：

i_t＝δ(W_i[h_t-1,x_t]+b_i)

输出门限计算公式如下：

o_t＝δ(W_o[h_t-1,x_t]+b_o)

候选状态计算公式如下：

更新后神经元状态计算公式如下：

隐藏层候选输出计算公式如下：

历史行为打分计算公式如下：

历史行为向量计算公式如下：

隐藏层输出计算公式如下：

10.一种用户行为特征提取系统，其特征在于，包括至少一个处理器以及存储计算机可执行指令的存储器，所述处理器执行所述指令时实现权利要求1-4中任意一项所述方法的步骤。