Nothing Special   »   [go: up one dir, main page]

CN117421199B - 一种行为确定方法及系统 - Google Patents

一种行为确定方法及系统 Download PDF

Info

Publication number
CN117421199B
CN117421199B CN202311745465.5A CN202311745465A CN117421199B CN 117421199 B CN117421199 B CN 117421199B CN 202311745465 A CN202311745465 A CN 202311745465A CN 117421199 B CN117421199 B CN 117421199B
Authority
CN
China
Prior art keywords
behavior
information
error
user behavior
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311745465.5A
Other languages
English (en)
Other versions
CN117421199A (zh
Inventor
孟椿植
邓日晓
谭林
杨良
王武杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Sanxiang Bank Co Ltd
Original Assignee
Hunan Sanxiang Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Sanxiang Bank Co Ltd filed Critical Hunan Sanxiang Bank Co Ltd
Priority to CN202311745465.5A priority Critical patent/CN117421199B/zh
Publication of CN117421199A publication Critical patent/CN117421199A/zh
Application granted granted Critical
Publication of CN117421199B publication Critical patent/CN117421199B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3438Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/70Type of the data to be coded, other than image and sound

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供了一种行为确定方法、系统、计算机可读存储介质及电子装置,涉及银行风险监控技术的技术领域。其方法包括:获取初始用户行为信息;按照预设的第一编码规则对行为序列进行编码压缩处理,以得到第一压缩数据;按照第一解码规则对所述第一压缩数据进行解码重构处理,以得到重构数据;将所述行为序列与所述重构数据进行匹配处理,在匹配处理结果不满足第一条件的情况下,确定所述初始用户行为信息存在异常。通过本发明,解决了用户行为识别精度低的问题,进而达到了提高用户行为识别精度及效率的效果。

Description

一种行为确定方法及系统
技术领域
本发明实施例涉及银行风险监控领域,具体而言,涉及一种行为确定方法、系统、存储介质及电子装置。
背景技术
随着银行业务的发展,身份伪冒一直是银行业务中信用反欺诈与交易反欺诈的重灾区。
虽然有各种手段进行防范但是都是以中断交易流程,增加客户操作难度等方式实现,这些方式对客户的满意度、业务的效率都有一定影响。
针对上述问题,目前并无较好的解决方案。
发明内容
本发明实施例提供了一种行为确定方法及系统,以至少解决相关技术中异常行为识别精度低的问题。
根据本发明的一个实施例,提供了一种行为确定方法,包括:
获取初始用户行为信息,其中,所述初始用户行为信息包括通过前端埋点进行采集,并进行非结构化数据转化处理得到的行为序列;
按照预设的第一编码规则对所述行为序列进行编码压缩处理,以得到第一压缩数据,其中,所述第一编码规则是基于所述行为序列的时序特征确定的;
按照第一解码规则对所述第一压缩数据进行解码重构处理,以得到重构数据,所述第一解码规则与所述第一编码规则相对应;
将所述行为序列与所述重构数据进行匹配处理,在匹配处理结果不满足第一条件的情况下,确定所述初始用户行为信息存在异常,其中,所述第一条件包括所述行为序列和所述重构数据之间的匹配误差与预设的第一阈值不匹配,所述匹配处理至少包括误差分布矩阵与预设的阈值分布矩阵的匹配。
在一个示例性实施例中,所述将所述行为序列与所述重构数据进行匹配处理,在匹配处理结果不满足第一条件的情况下,确定所述初始用户行为信息存在异常包括:
将所述行为序列与所述重构数据进行匹配处理,以得到所述行为序列以及所述重构数据之间的误差值,其中,所述匹配误差包括所述误差值;
基于所述误差值,确定所述误差值的误差分布信息;
将所述误差值分布矩阵与所述第一阈值组成的阈值分布矩阵进行第一比较处理,并对所述误差分布信息进行分布匹配处理;
在所述误差值分布矩阵与所述阈值分布矩阵不匹配,且所述误差分布信息不满足预设的目标误差分布的情况下,确定所述初始用户行为信息存在异常。
在一个示例性实施例中,在将所述行为序列与所述重构数据进行匹配处理,在匹配处理结果不满足第一条件的情况下,确定所述初始用户行为信息存在异常之后,所述方法还包括:
基于所述初始用户行为信息,确定用户行为特征信息;
对所述用户行为特征信息进行规则匹配处理,以确定所述用户行为特征信息对应的行为判断规则;
通过所述行为判断规则对所述初始用户行为信息进行行为判断处理;
在行为判断处理结果确定所述初始用户行为信息不符合所述行为判断规则的情况下,确定所述初始用户行为信息存在异常。
在一个示例性实施例中,在所述获取初始用户行为信息之后,所述方法还包括:
通过所述前端埋点确定目标客户的用户特征信息;
根据所述用户特征信息以及所述初始用户行为信息,确定用户操作异常特征,所述用户操作异常特征用于指示所述目标客户的执行第一操作的行为异常特征;
对所述用户操作异常特征进行异常预案匹配处理,以确定所述用户操作异常特征对应的操作信息;
基于所述操作信息执行目标操作。
在一个示例性实施例中,在所述通过所述前端埋点确定目标客户的用户特征信息之后,所述方法还包括:
基于所述用户特征信息,确定所述目标客户的历史行为特征信息;
对历史行为特征信息与用户行为特征信息进行行为特征匹配处理,以确定行为特征误差信息,其中,所述用户行为特征信息是基于初始用户行为信息确定的;
通过第一公式对所述特征误差信息进行特征误差计算,以确定所述用户行为特征信息与所述历史行为特征信息之间的特征误差,其中,所述第一公式包括:
式中,P为特征误差,为用户行为特征信息对应的行为评分,所述行为评分是通过大数据统计得到的,/>为用户行为特征信息,/>为历史行为特征信息,n为用户特征信息的数量;
在所述特征误差大于第二阈值的情况下,对所述特征误差进行高斯拟合处理,以确定所述特征误差的特征分布信息;
在所述特征分布信息不满足预设的特征分布情况下,确定所述初始用户行为信息存在异常。
根据本发明的另一个实施例,提供了一种行为确定系统,包括:
信息获取模块,用于获取初始用户行为信息,其中,所述初始用户行为信息包括通过前端埋点进行采集,并进行非结构化数据转化处理的得到的行为序列;
第一压缩模块,用于按照预设的第一编码规则对所述行为序列进行编码压缩处理,以得到第一压缩数据,其中,所述第一编码规则是基于所述行为序列的时序特征确定的;
第一重构模块,用于按照第一解码规则对所述第一压缩数据进行解码重构处理,以得到重构数据,所述第一解码规则与所述第一编码规则相对应;
行为确定模块,用于将所述行为序列与所述重构数据进行匹配处理,在匹配处理结果不满足第一条件的情况下,确定所述初始用户行为信息存在异常,其中,所述第一条件包括所述行为序列和所述重构数据之间的匹配误差与预设的第一阈值不匹配,所述匹配处理至少包括误差分布矩阵与预设的阈值分布矩阵的匹配。
根据本发明的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明,由于通过对用户的行为序列进行编解码,并基于解码重构后的结果与初始结果进行比对,由此可以将异常行为直观的进行表达,无需对异常行为本身进行判断,因此,可以解决异常行为识别精度低的问题,达到提高异常行为识别精度和效率的效果。
附图说明
图1是本发明实施例的一种行为确定方法的移动终端的硬件结构框图;
图2是根据本发明实施例的一种行为确定方法的流程图;
图3是根据本发明具体实施例的原理示意图;
图4是根据本发明实施例的一种行为确定系统的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明的实施例。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种行为确定方法的移动终端的硬件结构框图。如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,其中,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的一种行为确定方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种行为确定方法,图2是根据本发明实施例的一种行为确定的流程图,如图2所示,该流程包括如下步骤:
步骤S201,获取初始用户行为信息,其中,所述初始用户行为信息包括通过前端埋点进行采集,并进行非结构化数据转化处理得到的行为序列;
在本实施例中,对用户的行为信息进行非结构化处理是为了避免不同环境下其他信息对用户行为识别的干扰,从而提高用户行为识别的精确度,保证整体行为判断的精确性。
其中,前端埋点包括可视化界面上的可以进行行为操作感应或信息采集的埋点,通常包括传感器等装置设备,前端埋点主要关注用户行为,例如用户在页面上的浏览信息、点击操作信息等;初始用户行为信息包括(但不限于)用户在进行操作时的操作耗时、差错修改次数、停留时间、机器型号、是否越狱、电量、IP地址、是否有截屏行为、设备序列号、设备版本类型、基站信息等相关信息,行为序列如图3所示输入端X1~X10序列。
步骤S202,按照预设的第一编码规则对所述行为序列进行编码压缩处理,以得到第一压缩数据,其中,所述第一编码规则是基于所述行为序列的时序特征确定的;
在本实施例中,按照第一编码规则进行编码压缩是为了将行为数据进行统一化处理,即,使得不同类型的行为数据能够以相同的数据格式进行后续的处理,在这一过程中,如果行为数据存在异常,则在后续的处理过程中会因为无法正常编码而被快速识别,从而提高行为信息的识别精度。
其中,第一编码规则可以是通过大数据对神经网络模型进行学习训练得到的,该编码规则在被训练后可以用于对正常的操作行为进行编码,而无法对异常行为进行编码;第一压缩数据包括对行为序列进行编码压缩后的数据,该数据可以通过一个编码器来实现。
需要说明的是,由于行为序列具有地域性和时间性,因而可以预先根据行为序列的地域性和时间性分别预先配置不同的编码和解码规则,从而针对不同的数据进行形式的编解码,以增加用户行为冒充的成本,提高异常行为的识别能力;具体的,可以(但不限于)通过用户行为的地理特征(例如一段时间内的物理运动范围、操作地点的坐标(是否为同一个位置坐标或多个位置坐标)、位置的分布等)、一段时间内的操作频率或操作速度(具体反映为消息队列的数量以及队列之间的间隔)等设置对应的编解码规则。
步骤S203,按照第一解码规则对所述第一压缩数据进行解码重构处理,以得到重构数据,所述第一解码规则与所述第一编码规则相对应;
在本实施例中,通过对第一压缩数据进行解码重构是为了判断经过编码的数据是否能够正常重构,一般情况下,按照特定规则编解码的数据的误差是在一定范围内的,因而如果误差超出该范围,则可以说明该数据存在异常。
其中,第一解码规则与第一编码规则相对应,编码重构过程可以通过一个进行神经网络模型训练的解码器Autoencoder来实现,Autoencoder本质上使用了一个神经网络来产生一个高维输入的低维表示。根据正常数据训练出来的Autoencoder,能够将正常样本重建还原,但是却无法将异于正常分布的数据点较好地还原,此时将会产生若干误差,而产生误差才能方便进行后续处理。
步骤S204,将所述行为序列与所述重构数据进行匹配处理,在匹配处理结果不满足第一条件的情况下,确定所述初始用户行为信息存在异常,其中,所述第一条件包括所述行为序列和所述重构数据之间的匹配误差与预设的第一阈值不匹配,所述匹配处理至少包括误差分布矩阵与预设的阈值分布矩阵的匹配。
在本实施例中,在正常编解码过程中,会有少量数据失真,因而在解码过程中允许少量的解码异常,该解码异常通常在一定范围内,而如果解码异常超出该范围,则说明原先进行编码的数据存在异常,由此,通过将解码重构后的数据与原先的初始用户行为信息进行匹配比对,并根据比对结果判断初始用户行为信息是否存在异常。
其中,第一阈值可以是通过大数据进行编解码训练统计得到的允许异常的阈值范围。
通过上述步骤,通过对行为信息进行编解码,并根据编解码前后结果判断行为信息是否出现异常,无需对行为本身进行判断识别,避免复杂环境下对行为信息本身进行判断识别造成的识别结果精确度低的问题,解决了行为识别精度低的问题,提高了行为识别精度和效率。
其中,上述步骤的执行主体可以为基站、终端等,但不限于此。
在一个可选的实施例中,所述将所述行为序列与所述重构数据进行匹配处理,在匹配处理结果不满足第一条件的情况下,确定所述初始用户行为信息存在异常包括:
步骤S2041,将所述行为序列与所述重构数据进行匹配处理,以得到所述行为序列以及所述重构数据之间的误差值,其中,所述匹配误差包括所述误差值;
步骤S2042,基于所述误差值,确定所述误差值的误差分布信息;
步骤S2043,将所述误差值分布矩阵与所述第一阈值组成的阈值分布矩阵进行第一比较处理,并对所述误差分布信息进行分布匹配处理;
步骤S2044,在所述误差值分布矩阵与所述阈值分布矩阵不匹配,且所述误差分布信息不满足预设的目标误差分布的情况下,确定所述初始用户行为信息存在异常。
在本实施例中,确定误差值是为了确定编解码前后的行为信息的误差大小,确定误差分布是为了确定误差的分布情况,而误差的分布情况通常基于行为序列的时域进行分布,由此可以得到基于时域的序列-误差分布矩阵,由此可以基于分布矩阵进一步判断各个特征之间的关系,由此综合判断误差的是否属于合理误差。
其中,误差值可以是编解码前后的数据之间的差值,也可以是其他表达形式的差值,而匹配误差除了包括误差值,还可以包括其他在匹配过程中生成的误差数据;对应的,误差分布矩阵包括误差值在编解码前后的行为序列中的分布情况,例如,编码前的信息分布矩阵为[0,1,1,0],编码后的信息分布为[0,1,0,0],此时误差分布矩阵为[0,0,1,0],而预设的而与之分布矩阵为[0,1,0,0,],此时误差分布矩阵与阈值分布矩阵不相匹配,同时,正常的误差分布矩阵(即允许部分序列存在误差)应当为[0,1,1,0],明显的,当前的误差分布矩阵与正常的误差分布矩阵也不匹配,由此可知相关信息分布存在异常。
当然,也可以根据误差值的分布是否满足高斯分布或高斯分布峰值以及分布区间是否与预设的高斯分布以及预设的峰值和分布区间是否重合或重合率是否大于一定阈值来判断相关信息是否存在异常。
在一个可选的实施例中,在所述按照预设的第一编码规则对所述行为序列进行编码压缩处理,以得到第一压缩数据之前,所述方法还包括:
步骤S2021,获取训练数据集,其中所述训练数据集包括用户行为训练信息;
步骤S202,通过所述训练数据集对第一编码器的初始学习模型对进行规则训练,以得到用于执行第一编码规则的目标模型,其中所述目标模型用于按照预设的第一编码规则对所述行为序列进行编码压缩处理。
在本实施例中,在进行编码之前,需要先进行第一编码规则的训练,该过程通过神经网络进行海量数据的训练,以提高编码精度。
在一个可选的实施例中,在将所述行为序列与所述重构数据进行匹配处理,在匹配处理结果不满足第一条件的情况下,确定所述初始用户行为信息存在异常之后,所述方法还包括:
步骤S205,基于所述初始用户行为信息,确定用户行为特征信息;
步骤S206,对所述用户行为特征信息进行规则匹配处理,以确定所述用户行为特征信息对应的行为判断规则;
步骤S207,通过所述行为判断规则对所述初始用户行为信息进行行为判断处理;
步骤S208,在行为判断处理结果确定所述初始用户行为信息不符合所述行为判断规则的情况下,确定所述初始用户行为信息存在异常。
在本实施例中,针对不同的操作行为,通常可以在数据库预设对应的判断规则,以提高判断效率。
其中,用户行为特征信息包括用户进行某个操作的操作时间、IP地址、历史操作时间、历史IP地址等特征信息;行为判断规则包括预先存储在数据库的规则。
例如,通过在前端埋入行为数据采集点,能采集到客户在操作耗时、差错修改次数、停留时间、机器型号、是否越狱、电量、IP地址、是否有截屏行为、设备序列号、设备版本类型、基站信息等相关信息特征,随后通过对这些信息确定其判断规则,再根据信息特征与判断规则进行信息排查。
在一个可选的实施例中,在所述获取初始用户行为信息之后,所述方法还包括:
步骤S2011,通过所述前端埋点确定目标客户的用户特征信息;
步骤S2012,根据所述用户特征信息以及所述初始用户行为信息,确定用户操作异常特征,所述用户操作异常特征用于指示所述目标客户的执行第一操作的行为异常特征;
步骤S2013,对所述用户操作异常特征进行异常预案匹配处理,以确定所述用户操作异常特征对应的操作信息;
步骤S2014,基于所述操作信息执行目标操作。
在本实施例中,除了对用户行为进行排查识别之外,还可以对用户是否为本人进行排查识别,从而增强识别精度。
其中,用户特征信息包括用户的人脸特征、环境特征等与用户个人相关的特征信息;用户操作异常特征包括用户执行某个异常行为时的特征,例如异常行为的执行次数、异常行为的IP地址等;异常预案可以是预先存储在数据库的与异常操作相适应的预案操作,对应的,目标操作包括判断用户操作异常情况下执行的操作,如告警、账户封冻等操作,操作信息包括用于指示执行目标操作的操作指令等。
例如,通过前端数据采集用户的人脸特征,再由人脸特征识别出是否是客户本人操作,随后针对客户的异常操作特征,对于频繁的异常操作给予识别,并发出相应的告警,同时启动相应的应急预案措施,在无感中为客户挽回或降低经济损失,减少因伪冒、偷盗引起的客户交易损失,提升客户的满意度。
需要说明的是,先通过用户的用户特征信息判断是否为用户本人,随后再对操作行为进行判断的方式(即先确定本人再追踪操作),相较于根据操作行为的异常与否再判断是否为用户本人(即根据操作追踪是否为本人)能够更加精准的避免用户被盗用的情况,这是因为,用户本人的习惯相对更加容易被模仿,如果先追踪操作再追踪本人容易给盗用者留下反追踪的时间,从而增加系统风险。
在一个可选的实施例中,在所述通过所述前端埋点确定目标客户的用户特征信息之后,所述方法还包括:
步骤S20111,基于所述用户特征信息,确定所述目标客户的历史行为特征信息;
步骤S20112,对历史行为特征信息与用户行为特征信息进行行为特征匹配处理,以确定行为特征误差信息,其中,所述用户行为特征信息是基于初始用户行为信息确定的;
步骤S20113,通过第一公式对所述特征误差信息进行特征误差计算,以确定所述用户行为特征信息与所述历史行为特征信息之间的特征误差,其中,所述第一公式包括:
式中,P为特征误差,为用户行为特征信息对应的行为评分,所述行为评分是通过大数据统计得到的,/>为用户行为特征信息,/>为历史行为特征信息,n为用户特征信息的数量;
步骤S20114,在所述特征误差大于第二阈值的情况下,对所述特征误差进行高斯拟合处理,以确定所述特征误差的特征分布信息;
步骤S20115,在所述特征分布信息不满足预设的特征分布情况下,确定所述初始用户行为信息存在异常。
在本实施例中,在正常情况下,用户的活动范围、操作环境以及操作内容是固定的,因而用户进行操作时的行为特征通常在一定范围内进行变化,当出现异常行为时,行为特征会有较大的变化,因而此时的误差将会增大,由此可以判断用户行为是否存在异常。
其中,历史行为特征信息包括用户在过去时间段内执行相同操作时的行为特征,如操作耗时、差错修改次数、停留时间、机器型号、是否越狱、电量、IP地址、是否有截屏行为、设备序列号、设备版本类型、基站信息等信息;设置行为评分是为了避免工作人员的行为对用户行为的评估造成干扰;进行高斯拟合是为了确定特征误差的分布是否存在较大的变化,从而更加精确地判断异常行为是否为欺诈行为。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
在本实施例中还提供了一种行为确定系统,该系统用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4是根据本发明实施例的一种行为确定系统的结构框图,如图4所示,该系统包括:
信息获取模块31,用于获取初始用户行为信息,其中,所述初始用户行为信息包括通过前端埋点进行采集,并进行非结构化数据转化处理得到的行为序列;
第一压缩模块32,用于按照预设的第一编码规则对所述行为序列进行编码压缩处理,以得到第一压缩数据,其中,所述第一编码规则是基于所述行为序列的时序特征确定的;
第一重构模块33,用于按照第一解码规则对所述第一压缩数据进行解码重构处理,以得到重构数据,所述第一解码规则与所述第一编码规则相对应;
行为确定模块34,用于将所述行为序列与所述重构数据进行匹配处理,在匹配处理结果不满足第一条件的情况下,确定所述初始用户行为信息存在异常,其中,所述第一条件包括所述行为序列和所述重构数据之间的匹配误差与预设的第一阈值不匹配,所述匹配处理至少包括误差分布矩阵与预设的阈值分布矩阵的匹配。
在一个可选的实施例中,所述行为确定模块34包括:
误差值确定单元,用于将所述行为序列与所述重构数据进行匹配处理,以得到所述行为序列以及所述重构数据之间的误差值,所述匹配误差包括所述误差值;
误差分布确定单元,用于基于所述误差值,确定所述误差值的误差分布信息;
误差处理单元,用于将所述误差值分布矩阵与所述第一阈值组成的阈值分布矩阵进行第一比较处理,并对所述误差分布信息进行分布匹配处理;
异常确定单元,用于在所述误差值分布矩阵与所述阈值分布矩阵不匹配,且所述误差分布信息不满足预设的目标误差分布的情况下,确定所述初始用户行为信息存在异常。
在一个可选的实施例中,所述系统还包括:
训练数据采集模块,用于在所述按照预设的第一编码规则对所述行为序列进行编码压缩处理,以得到第一压缩数据之前,获取训练数据集,其中所述训练数据集包括用户行为训练信息;
模型训练模块,用于通过所述训练数据集对第一编码器的初始学习模型对进行规则训练,以得到用于执行第一编码规则的目标模型,其中所述目标模型用于按照预设的第一编码规则对所述行为序列进行编码压缩处理。
在一个可选的实施例中,所述系统还包括:
行为特征确定模块,用于在将所述行为序列与所述重构数据进行匹配处理,在匹配处理结果不满足第一条件的情况下,确定所述初始用户行为信息存在异常之后,基于所述初始用户行为信息,确定用户行为特征信息;
规则匹配模块,用于对所述用户行为特征信息进行规则匹配处理,以确定所述用户行为特征信息对应的行为判断规则;
行为判断模块,用于通过所述行为判断规则对所述初始用户行为信息进行行为判断处理;
异常判断模块,用于在行为判断处理结果确定所述初始用户行为信息不符合所述行为判断规则的情况下,确定所述初始用户行为信息存在异常。
在一个可选的实施例中,所述系统还包括:
在所述获取初始用户行为信息之后,通过所述前端埋点确定目标客户的用户特征信息;
根据所述用户特征信息以及所述初始用户行为信息,确定用户操作异常特征,所述用户操作异常特征用于指示所述目标客户的执行第一操作的行为异常特征;
对所述用户操作异常特征进行异常预案匹配处理,以确定所述用户操作异常特征对应的操作信息;
基于所述操作信息执行目标操作。
在一个可选的实施例中,所述系统还包括:
历史特征确定模块,用于在所述通过所述前端埋点确定目标客户的用户特征信息之后,基于所述用户特征信息,确定所述目标客户的历史行为特征信息;
行为特征匹配模块,用于对历史行为特征信息与用户行为特征信息进行行为特征匹配处理,以确定行为特征误差信息,其中,所述用户行为特征信息是基于初始用户行为信息确定的;
特征误差计算模块,用于通过第一公式对所述特征误差信息进行特征误差计算,以确定所述用户行为特征信息与所述历史行为特征信息之间的特征误差,其中,所述第一公式包括:
式中,P为特征误差,为用户行为特征信息对应的行为评分,所述行为评分是通过大数据统计得到的,/>为用户行为特征信息,/>为历史行为特征信息,n为用户特征信息的数量;
高斯拟合模块,用于在所述特征误差大于第二阈值的情况下,对所述特征误差进行高斯拟合处理,以确定所述特征误差的特征分布信息;
异常行为确定模块,用于在所述特征分布信息不满足预设的特征分布情况下,确定所述初始用户行为信息存在异常。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
本发明的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种行为确定方法,其特征在于,包括:
获取初始用户行为信息,其中,所述初始用户行为信息包括通过前端埋点进行采集,并进行非结构化数据转化处理得到的行为序列;
按照预设的第一编码规则对所述行为序列进行编码压缩处理,以得到第一压缩数据,其中,所述第一编码规则是基于所述行为序列的时序特征确定的;
按照第一解码规则对所述第一压缩数据进行解码重构处理,以得到重构数据,所述第一解码规则与所述第一编码规则相对应;
将所述行为序列与所述重构数据进行匹配处理,在匹配处理结果不满足第一条件的情况下,确定所述初始用户行为信息存在异常,其中,所述第一条件包括所述行为序列和所述重构数据之间的匹配误差与预设的第一阈值不匹配,所述匹配处理至少包括误差分布矩阵与预设的阈值分布矩阵的匹配;
其中,所述将所述行为序列与所述重构数据进行匹配处理,在匹配处理结果不满足第一条件的情况下,确定所述初始用户行为信息存在异常还包括:
将所述行为序列与所述重构数据进行匹配处理,以得到所述行为序列以及所述重构数据之间的误差值,其中,所述匹配误差包括所述误差值;
基于所述误差值,确定所述误差值的误差分布信息,其中所述误差分布信息包括误差值分布矩阵;
将所述误差值分布矩阵与所述第一阈值组成的阈值分布矩阵进行第一比较处理,并对所述误差分布信息进行分布匹配处理;
在所述误差值分布矩阵与所述阈值分布矩阵不匹配,且所述误差分布信息不满足预设的目标误差分布的情况下,确定所述初始用户行为信息存在异常。
2.根据权利要求1所述的方法,其特征在于,在将所述行为序列与所述重构数据进行匹配处理,在匹配处理结果不满足第一条件的情况下,确定所述初始用户行为信息存在异常之后,所述方法还包括:
基于所述初始用户行为信息,确定用户行为特征信息;
对所述用户行为特征信息进行规则匹配处理,以确定所述用户行为特征信息对应的行为判断规则;
通过所述行为判断规则对所述初始用户行为信息进行行为判断处理;
在行为判断处理结果确定所述初始用户行为信息不符合所述行为判断规则的情况下,确定所述初始用户行为信息存在异常。
3.根据权利要求1所述的方法,其特征在于,在所述获取初始用户行为信息之后,所述方法还包括:
通过所述前端埋点确定目标客户的用户特征信息;
根据所述用户特征信息以及所述初始用户行为信息,确定用户操作异常特征,所述用户操作异常特征用于指示所述目标客户的执行第一操作的行为异常特征;
对所述用户操作异常特征进行异常预案匹配处理,以确定所述用户操作异常特征对应的操作信息;
基于所述操作信息执行目标操作。
4.根据权利要求3所述的方法,其特征在于,在所述通过所述前端埋点确定目标客户的用户特征信息之后,所述方法还包括:
基于所述用户特征信息,确定所述目标客户的历史行为特征信息;
对历史行为特征信息与用户行为特征信息进行行为特征匹配处理,以确定行为特征误差信息,其中,所述用户行为特征信息是基于初始用户行为信息确定的;
通过第一公式对所述特征误差信息进行特征误差计算,以确定所述用户行为特征信息与所述历史行为特征信息之间的特征误差,其中,所述第一公式包括:
式中,P为特征误差,为用户行为特征信息对应的行为评分,所述行为评分是通过大数据统计得到的,/>为用户行为特征信息,/>为历史行为特征信息,n为用户特征信息的数量;
在所述特征误差大于第二阈值的情况下,对所述特征误差进行高斯拟合处理,以确定所述特征误差的特征分布信息;
在所述特征分布信息不满足预设的特征分布情况下,确定所述初始用户行为信息存在异常。
5.一种行为确定系统,其特征在于,包括:
信息获取模块,用于获取初始用户行为信息,其中,所述初始用户行为信息包括通过前端埋点进行采集,并进行非结构化数据转化处理得到的行为序列;
第一压缩模块,用于按照预设的第一编码规则对所述行为序列进行编码压缩处理,以得到第一压缩数据,其中,所述第一编码规则是基于所述行为序列的时序特征确定的;
第一重构模块,用于按照第一解码规则对所述第一压缩数据进行解码重构处理,以得到重构数据;
行为确定模块,用于将所述行为序列与所述重构数据进行匹配处理,在匹配处理结果不满足第一条件的情况下,确定所述初始用户行为信息存在异常,其中,所述第一条件包括所述行为序列和所述重构数据之间的匹配误差与预设的第一阈值不匹配,所述匹配处理至少包括误差分布矩阵与预设的阈值分布矩阵的匹配;
其中,所述行为确定模块包括:
误差值确定单元,用于将所述行为序列与所述重构数据进行匹配处理,以得到所述行为序列以及所述重构数据之间的误差值,其中,所述匹配误差包括所述误差值;
误差分布确定单元,用于基于所述误差值,确定所述误差值的误差分布信息;
误差处理单元,用于将所述误差值分布矩阵与所述第一阈值组成的阈值分布矩阵进行第一比较处理,并对所述误差分布信息进行分布匹配处理;
异常确定单元,用于在所述误差值分布矩阵与所述阈值分布矩阵不匹配,且所述误差分布信息不满足预设的目标误差分布的情况下,确定所述初始用户行为信息存在异常。
6.根据权利要求5所述的系统,其特征在于,所述系统还包括:
行为特征确定模块,用于在将所述行为序列与所述重构数据进行匹配处理,在匹配处理结果不满足第一条件的情况下,确定所述初始用户行为信息存在异常之后,基于所述初始用户行为信息,确定用户行为特征信息;
规则匹配模块,用于对所述用户行为特征信息进行规则匹配处理,以确定所述用户行为特征信息对应的行为判断规则;
行为判断模块,用于通过所述行为判断规则对所述初始用户行为信息进行行为判断处理;
异常判断模块,用于在行为判断处理结果确定所述初始用户行为信息不符合所述行为判断规则的情况下,确定所述初始用户行为信息存在异常。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至4任一项中所述的方法。
8.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至4任一项中所述的方法。
CN202311745465.5A 2023-12-19 2023-12-19 一种行为确定方法及系统 Active CN117421199B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311745465.5A CN117421199B (zh) 2023-12-19 2023-12-19 一种行为确定方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311745465.5A CN117421199B (zh) 2023-12-19 2023-12-19 一种行为确定方法及系统

Publications (2)

Publication Number Publication Date
CN117421199A CN117421199A (zh) 2024-01-19
CN117421199B true CN117421199B (zh) 2024-04-02

Family

ID=89528841

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311745465.5A Active CN117421199B (zh) 2023-12-19 2023-12-19 一种行为确定方法及系统

Country Status (1)

Country Link
CN (1) CN117421199B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108711085A (zh) * 2018-05-09 2018-10-26 平安普惠企业管理有限公司 一种交易请求的响应方法及其设备
CN109583161A (zh) * 2018-11-27 2019-04-05 咪咕文化科技有限公司 一种信息处理方法及装置、存储介质
CN111178523A (zh) * 2019-08-02 2020-05-19 腾讯科技(深圳)有限公司 一种行为检测方法、装置、电子设备及存储介质
CN112107866A (zh) * 2020-09-28 2020-12-22 腾讯科技(深圳)有限公司 用户行为数据处理方法、装置、设备及存储介质
CN113221104A (zh) * 2021-05-12 2021-08-06 北京百度网讯科技有限公司 用户异常行为的检测方法及用户行为重构模型的训练方法
CN114419528A (zh) * 2022-04-01 2022-04-29 浙江口碑网络技术有限公司 异常识别方法、装置、计算机设备及计算机可读存储介质
CN115795345A (zh) * 2022-11-30 2023-03-14 中国工商银行股份有限公司 信息处理方法、装置、设备及存储介质
CN116185694A (zh) * 2023-03-06 2023-05-30 重庆大学 一种基于相似度的多元时间序列异常检测与诊断方法
CN116258991A (zh) * 2023-02-03 2023-06-13 北京集度科技有限公司 一种异常检测装置、系统、方法、以及计算机程序产品
CN116614637A (zh) * 2023-07-19 2023-08-18 腾讯科技(深圳)有限公司 一种数据处理方法、装置、设备以及可读存储介质
CN116957049A (zh) * 2023-09-20 2023-10-27 南京邮电大学 基于对抗自编码器的无监督内部威胁检测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11205121B2 (en) * 2018-06-20 2021-12-21 Disney Enterprises, Inc. Efficient encoding and decoding sequences using variational autoencoders
US20220188601A1 (en) * 2020-12-15 2022-06-16 Cornell University System implementing encoder-decoder neural network adapted to prediction in behavioral and/or physiological contexts
US20220207326A1 (en) * 2020-12-31 2022-06-30 Intuit Inc. Anomaly detection, data prediction, and generation of human-interpretable explanations of anomalies
US20230325631A1 (en) * 2022-04-12 2023-10-12 Optum, Inc. Combined deep learning inference and compression using sensed data

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108711085A (zh) * 2018-05-09 2018-10-26 平安普惠企业管理有限公司 一种交易请求的响应方法及其设备
CN109583161A (zh) * 2018-11-27 2019-04-05 咪咕文化科技有限公司 一种信息处理方法及装置、存储介质
CN111178523A (zh) * 2019-08-02 2020-05-19 腾讯科技(深圳)有限公司 一种行为检测方法、装置、电子设备及存储介质
CN112107866A (zh) * 2020-09-28 2020-12-22 腾讯科技(深圳)有限公司 用户行为数据处理方法、装置、设备及存储介质
CN113221104A (zh) * 2021-05-12 2021-08-06 北京百度网讯科技有限公司 用户异常行为的检测方法及用户行为重构模型的训练方法
CN114419528A (zh) * 2022-04-01 2022-04-29 浙江口碑网络技术有限公司 异常识别方法、装置、计算机设备及计算机可读存储介质
CN115795345A (zh) * 2022-11-30 2023-03-14 中国工商银行股份有限公司 信息处理方法、装置、设备及存储介质
CN116258991A (zh) * 2023-02-03 2023-06-13 北京集度科技有限公司 一种异常检测装置、系统、方法、以及计算机程序产品
CN116185694A (zh) * 2023-03-06 2023-05-30 重庆大学 一种基于相似度的多元时间序列异常检测与诊断方法
CN116614637A (zh) * 2023-07-19 2023-08-18 腾讯科技(深圳)有限公司 一种数据处理方法、装置、设备以及可读存储介质
CN116957049A (zh) * 2023-09-20 2023-10-27 南京邮电大学 基于对抗自编码器的无监督内部威胁检测方法

Also Published As

Publication number Publication date
CN117421199A (zh) 2024-01-19

Similar Documents

Publication Publication Date Title
CN107316198B (zh) 账户风险识别方法及装置
CN110781433B (zh) 数据类型的确定方法和装置、存储介质及电子装置
CN111278014A (zh) 一种防诈骗系统、方法、服务器及存储介质
CN110827094A (zh) 广告投放的反作弊方法及系统
CN111260220B (zh) 群控设备识别方法、装置、电子设备和存储介质
CN110717542A (zh) 一种情绪识别方法、装置和设备
CN113946590B (zh) 积分数据更新方法、装置、设备及存储介质
CN110619527B (zh) 诈骗预警信息生成方法及装置
CN116311539B (zh) 基于毫米波的睡眠动作捕捉方法、装置、设备及存储介质
CN112669187B (zh) 身份识别方法、装置、电子设备及相关产品
CN110675252A (zh) 风险评估方法、装置、电子设备及存储介质
CN113065901A (zh) 积分业务体系的风控系统和风控方法
CN110457601B (zh) 社交账号的识别方法和装置、存储介质及电子装置
CN106998336A (zh) 渠道中的用户检测方法和装置
CN117421199B (zh) 一种行为确定方法及系统
CN110162957B (zh) 智能设备的鉴权方法和装置、存储介质、电子装置
CN115439928A (zh) 一种操作行为识别方法及装置
CN118154194A (zh) 一种基于云平台的数字支付身份安全验证方法及系统
CN111694969B (zh) 一种用户身份识别方法及装置
CN116302889A (zh) 功能模块的性能测试方法、装置和服务器
CN116151965A (zh) 一种风险特征提取方法、装置、电子设备及存储介质
CN114707420A (zh) 一种信贷欺诈行为识别方法、装置、设备及存储介质
CN118332360B (zh) 一种跨区块链交易地址追踪方法、系统、设备及介质
CN110647450B (zh) 业务流程断点修复方法、装置、计算机设备和存储介质
CN115811735A (zh) 信息识别方法、模型训练方法、相关装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant