CN111986027A - 基于人工智能的异常交易处理方法、装置 - Google Patents
基于人工智能的异常交易处理方法、装置 Download PDFInfo
- Publication number
- CN111986027A CN111986027A CN202010850857.8A CN202010850857A CN111986027A CN 111986027 A CN111986027 A CN 111986027A CN 202010850857 A CN202010850857 A CN 202010850857A CN 111986027 A CN111986027 A CN 111986027A
- Authority
- CN
- China
- Prior art keywords
- transaction
- product
- abnormal
- samples
- product transaction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 276
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 33
- 238000003672 processing method Methods 0.000 title claims abstract description 21
- 230000005856 abnormality Effects 0.000 claims abstract description 52
- 238000012545 processing Methods 0.000 claims abstract description 44
- 238000000034 method Methods 0.000 claims abstract description 40
- 238000012549 training Methods 0.000 claims abstract description 34
- 238000012216 screening Methods 0.000 claims abstract description 28
- 230000006870 function Effects 0.000 claims description 40
- 238000013507 mapping Methods 0.000 claims description 20
- 238000002372 labelling Methods 0.000 claims description 15
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 8
- 238000004140 cleaning Methods 0.000 claims description 7
- 238000005520 cutting process Methods 0.000 claims description 4
- 239000000203 mixture Substances 0.000 claims description 4
- 238000003860 storage Methods 0.000 abstract description 14
- 238000004422 calculation algorithm Methods 0.000 description 25
- 238000010586 diagram Methods 0.000 description 23
- 230000015654 memory Effects 0.000 description 21
- 230000008569 process Effects 0.000 description 10
- 238000009826 distribution Methods 0.000 description 9
- 238000001914 filtration Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000002547 anomalous effect Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 230000007123 defense Effects 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Human Resources & Organizations (AREA)
- Accounting & Taxation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Technology Law (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种基于人工智能的异常交易处理方法、装置、电子设备及计算机可读存储介质;方法包括:根据第一产品交易样本集合中每个产品交易样本的异常度,对所述第一产品交易样本集合中的产品交易样本进行筛选;将筛选得到的产品交易样本组成第二产品交易样本集合;获取所述第二产品交易样本集合中每个产品交易样本的类别标注数据,其中,所述类别标注数据用于表征所述产品交易样本正常或异常;以所述第二产品交易样本集合中的产品交易样本对异常交易识别模型进行训练,得到训练后的异常交易识别模型;根据所述训练后的异常交易识别模型识别异常交易。通过本申请,能够提高异常交易识别的准确率。
Description
技术领域
本申请涉及人工智能技术,尤其涉及一种基于人工智能的异常交易处理方法、装置、设备及计算机可读存储介质。
背景技术
人工智能(Artificial Intelligence,AI)是计算机科学的一个综合技术,通过研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
异常交易识别是人工智能领域的重要研究方向,异常交易识别是指从大量的交易数据中识别出异常交易的过程,广泛用于各种类型在线交易,例如网络购物、游戏道具交易等。
但是,相关技术提供的异常交易识别方法均是采用产品交易价格比对的方式,即,将待识别交易的产品交易价格和产品定价进行比对,使得异常交易识别的准确率较低,难以满足在线交易中海量交易识别的需求。
发明内容
本申请实施例提供一种基于人工智能的异常交易处理方法、装置及计算机可读存储介质,能够准确、高效的识别异常交易。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种基于人工智能的异常交易处理方法,包括:
根据第一产品交易样本集合中每个产品交易样本的异常度,对所述第一产品交易样本集合中的产品交易样本进行筛选;
将筛选得到的产品交易样本组成第二产品交易样本集合;
获取所述第二产品交易样本集合中每个产品交易样本的类别标注数据,其中,所述类别标注数据用于表征所述产品交易样本正常或异常;
以所述第二产品交易样本集合中的产品交易样本对异常交易识别模型进行训练,得到训练后的异常交易识别模型;
根据所述训练后的异常交易识别模型识别异常交易。
上述方案中,所述根据所述原始交易数据确定每种产品的正常交易价格之前,所述方法还包括:
根据所述原始交易数据,确定每种产品的交易的价格区间;
根据所述价格区间中的最大值和最小值,确定出所述价格区间的上四分位值和下四分位值;
确定所述上四分位值和所述下四分位值的间隔;
根据所述上四分位值、所述下四分位值以及所述间隔构建正常价格区间;
过滤掉所述原始交易数据中处于所述正常价格区间之外的交易数据。
上述方案中,所述以所述第二产品交易样本集合中的产品交易样本对异常交易识别模型进行训练之前,所述方法还包括:
对于每一个异常产品交易样本,根据所述异常产品交易样本和所述异常产品交易样本的邻近样本,生成新的异常产品交易样本;
将所述新的异常产品交易样本添加进所述第二产品交易样本集合中。
上述方案中,所述根据所述训练后的异常交易识别模型识别异常交易,包括:
当所述异常交易识别模型是神经网络时,通过所述训练后的异常交易识别模型提取待识别交易的隐层特征;
将所述隐层特征映射为所述待识别交易属于异常交易的概率;
当所述待识别交易属于异常交易的概率大于预定阈值时,将所述待识别交易确定为异常交易;
当所述异常交易识别模型是集成学习模型时,通过所述训练后的异常交易识别模型中的多个分类器,分别对待识别交易进行识别以获取分类分数;
根据多个分类器的分类分数确定分类结果,所述分类结果用于指示所述待识别交易正常或异常。
上述方案中,所述方法还包括:
生成异常交易的告警单据并显示,所述告警单据包括所述异常交易的交易信息、告警风险值明细、属于异常交易的概率和告警类型;
所述交易信息包括所述异常交易对应产品的价格分布区间和正常交易价格;
所述告警风险值明细包括所述异常交易的各特征值对应的局部异常度。
本申请实施例提供一种基于人工智能的异常交易处理装置,包括:
筛选模块,用于根据第一产品交易样本集合中每个产品交易样本的异常度,对所述第一产品交易样本集合中的产品交易样本进行筛选
组成模块,用于将筛选得到的产品交易样本组成第二产品交易样本集合;
标注模块,用于获取所述第二产品交易样本集合中每个产品交易样本的类别标注数据;
其中,所述类别标注数据用于表征所述产品交易样本正常或异常;
训练模块,用于以所述第二产品交易样本集合中的产品交易样本对异常交易识别模型进行训练,得到训练后的异常交易识别模型;
识别模块,用于根据所述训练后的异常交易识别模型识别异常交易。
上述方案中,所述装置还包括:
异常度确定模块,用于获取所述第一产品交易样本集合中每个产品交易样本的多个特征值;
根据所述多个特征值,确定所述第一产品交易样本集合中每个产品交易样本的整体的异常度;
其中,所述特征值的维度包括以下至少之一:用户维度、经济维度、社交维度和交易维度。
上述方案中,所述异常度确定模块,还用于在所述每个产品交易样本的多个特征值对应的维度中,将所述第一交易样本集合切分成多个单样本集合;
根据产品交易样本形成所述单样本集合的顺序,得到所述特征值对应的局部异常度;
结合所述多个特征值对应的局部异常度,确定所述每个产品交易样本的整体的异常度。
上述方案中,所述筛选模块,还用于对所述第一产品交易样本集合中的产品交易样本,按照异常度降序的方式进行排序;
筛选得到排序在前的N个产品交易样本,其中,N为大于1,且小于所述第一产品交易样本集合样本总数的正整数。
上述方案中,所述识别模块,还用于当所述异常交易识别模型是神经网络时,以所述第二产品交易样本集合中的产品交易样本作为所述异常交易识别模型的输入,得到针对所述第二产品交易样本集合中的产品交易样本的分类结果;
根据所述分类结果与所述类别标注数据的误差构建损失函数;
根据所述损失函数更新所述异常交易识别模型的参数,直至所述损失函数收敛;
将所述损失函数收敛时的异常交易识别模型的参数,确定为所述训练后的异常交易识别模型的参数。
上述方案中,所述识别模块,还用于当所述异常交易识别模型是集成学习模型时,遍历所述异常交易识别模型中的所有分类器,将遍历到的分类器作为候选分类器;
以所述第二产品交易样本集合中的产品交易样本作为所述候选分类器的输入,得到针对所述第二产品交易样本集合中的产品交易样本的分类分数;
根据最后遍历的分类器的分类分数构建正则项;
根据所述异常交易识别模型中所有分类器的分类分数,确定分类结果;
确定所述分类结果与所述类别标注数据的误差,根据所述误差和所述正则项构建损失函数;
根据所述损失函数更新所述异常交易识别模型的参数,直至所述损失函数收敛;
将所述损失函数收敛时的异常交易识别模型的参数,确定为所述训练后的异常交易识别模型的参数。
上述方案中,所述装置还包括:
第一样本集合构建模块,用于获取采样时段内的原始交易数据,并对所述原始交易数据进行清洗处理;
基于特定指标选择需要关注的用户,其中,所述特定指标包括以下至少之一:活跃度,用户等级和资源获取量;
从清洗处理后的所述原始交易数据中,获取所述需要关注的用户的交易数据;
从所述需要关注的用户的每个交易的交易数据中,提取用户维度、经济维度、社交维度和交易维度中至少之一的特征值;
基于所提取多个特征值构建对应所述每个交易的产品交易样本;
根据对应所述每个交易的产品交易样本,构建所述第一产品交易样本集合。
上述方案中,所述交易维度的特征包括产品价格,所述装置还包括:
正常交易价格获取模块,用于根据所述原始交易数据确定每种产品的正常交易价格;
将所述每种产品的实际交易价格与正常交易价格的比值,作为相应产品在交易维度的产品价格。
上述方案中,所述产品的类型包括普通产品和特殊产品,所述普通产品的属性具有固定的取值,所述特殊产品具有取值是动态变化的特殊属性;
所述正常价格获取模块,还用于针对所述普通产品,对所述原始交易数据中对应所述普通产品的交易价格进行聚类,得到多个价格簇;
从规模最大的所述价格簇中,任选一个价格作为所述普通产品的正常交易价格;
针对所述特殊产品,对所述原始交易数据中对应所述特殊产品的交易价格和所述特殊产品的特殊属性的取值进行拟合处理,得到所述特殊产品的特殊属性和所述特殊产品的正常交易价格之间的映射关系;
基于所述映射关系和所述特殊产品的特殊属性的取值,确定所述特殊产品的正常交易价格。
上述方案中,所述装置还包括:
异常价格过滤模块,用于根据所述原始交易数据,确定每种产品的交易的价格区间;
根据所述价格区间中的最大值和最小值,确定出所述价格区间的上四分位值和下四分位值;
确定所述上四分位值和所述下四分位值的间隔;
根据所述上四分位值、所述下四分位值以及所述间隔构建正常价格区间;
过滤掉所述原始交易数据中处于所述正常价格区间之外的交易数据。
上述方案中,所述装置还包括:
过采样模块,用于对于每一个异常产品交易样本,根据所述异常产品交易样本和所述异常产品交易样本的邻近样本,生成新的异常产品交易样本;
将所述新的异常产品交易样本添加进所述第二产品交易样本集合中。
上述方案中,所述识别模块,还用于当所述异常交易识别模型是神经网络时,通过所述训练后的异常交易识别模型提取待识别交易的隐层特征;
将所述隐层特征映射为所述待识别交易属于异常交易的概率;
当所述待识别交易属于异常交易的概率大于预定阈值时,将所述待识别交易确定为异常交易;
当所述异常交易识别模型是集成学习模型时,通过所述训练后的异常交易识别模型中的多个分类器,分别对待识别交易进行识别以获取分类分数;
根据多个分类器的分类分数确定分类结果,所述分类结果用于指示所述待识别交易正常或异常。
上述方案中,所述装置还包括:
生成模块,用于生成异常交易的告警单据并显示,所述告警单据包括所述异常交易的交易信息、告警风险值明细、属于异常交易的概率和告警类型;
所述交易信息包括所述异常交易对应产品的价格分布区间和正常交易价格;
所述告警风险值明细包括所述异常交易的各特征值对应的局部异常度。
本申请实施例提供一种用于异常交易处理的电子设备,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的异常交易处理方法。
本申请实施例提供一种计算机可读存储介质,存储有可执行指令,用于被处理器执行时,实现本申请实施例提供的基于人工智能的异常交易处理方法。
本申请实施例具有以下有益效果:
根据第一产品交易样本集合中每个产品交易样本的异常度来准确筛选产品交易样本,从而可以获取对应的类别标注数据对异常交易识别模型进行准确训练,进而提高了异常交易识别模型识别异常交易的效率和准确率。
附图说明
图1是本申请实施例提供的基于人工智能的异常交易处理系统100的架构示意图;
图2是本申请实施例提供的电子设备600的结构示意图;
图3是本申请实施例提供的基于人工智能的异常交易处理方法的流程示意图;
图4A-4B是本申请实施例提供的基于人工智能的异常交易处理方法的流程示意图;
图5是本申请实施例提供的基于人工智能的异常交易处理方法的流程示意图;
图6是本申请实施例提供的基于人工智能的异常交易处理方法的流程示意图;
图7是本申请实施例提供的游戏中价格分布情况示意图;
图8是本申请实施例提供的异常价格过滤原理示意图;
图9是本申请实施例提供的价格聚类示意图;
图10是本申请实施例提供的特殊道具的属性值与交易价格的关系图;
图11是本申请实施例提供的孤立森林算法的准确率和召回率示意图;
图12是本申请实施例提供的模型上线后的实际告警情况图;
图13是本申请实施例提供的异常交易单据展示示意图;
图14是本申请实施例提供的道具价格展示示意图;
图15是本申请实施例提供的告警风险值明细展示示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
1)异常交易:违反市场正常交易规律的交易,例如,通过不对称交易以与产品不相符的价格出售或购买产品。
2)异常度:在一个可接收的误差内,满足数据集内在规律的数据就是正常数据,而不满足数据集内在规律的数据就存在异常,异常度描述的就是数据的异常程度。
3)无监督学习:根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题。无监督学习算法主要有主成分分析方法、等距映射方法、局部线性嵌入方法、拉普拉斯特征映射方法、黑塞局部线性嵌入方法和局部切空间排列方法等。本申请实施例中的无监督学习为根据白样本(非作弊流量样本)训练无监督识别模型过程。
4)有监督学习:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程。在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。监督学习算法是分析该训练数据,并产生一个推断的功能,其可以用于映射出新的实例。有监督学习算法主要有神经网络传播算法、决策树学习算法等。本申请实施例中的有监督学习为根据白样本(非作弊流量样本)和黑样本(作弊流量样本)训练有监督识别模型的过程。
相关技术中,异常交易的判定是直接对比成交价格和产品定价,将交易价格与产品定价不符的交易判定为异常交易,其中,产品定价可以是由专业人员预先拟定的价格,也可以是通过产品估值系统根据产品固有属性估算得到的,无论是哪种方式,都未考虑到产品的价格是一个变化的值,不仅和产品固有属性有关,也会随着实时市场行情以及产品附带的特殊属性(属性值会改变)而变化。并且,一个交易是否异常不仅和交易价格有关,还和交易的用户身份、好友关系链等有关。因此,直接对比成交价格和产品定价来识别异常交易,会有极大的误差。
本申请实施例提供一种基于人工智能的异常交易处理方法、装置、电子设备和计算机可读存储介质,能够提高异常交易识别的准确率。
本申请实施例提供的用于异常交易处理的电子设备可以是服务器,可以是各种类型的终端设备或服务器,其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器;终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。下面,将说明电子设备实施为服务器时的示例性应用。
以进行异常交易处理的电子设备是服务器为例,说明包括服务器的一个示例性的交易处理系统架构。参见图1,图1是本申请实施例提供的基于人工智能的异常交易处理系统100的一个架构示意图,包括异常交易处理服务器200、应用服务器300、数据库400以及终端500-1、终端500-2。
在一些实施例中,终端500-1和终端500-2需要通过应用服务器300进行交易,应用服务器300提供交易的计算和记录功能,例如将交易数据存储到数据库400中。异常交易处理服务器200定期或不定期地从数据库400中采集原始的交易数据以作为交易样本,根据交易样本的异常度对交易样本进行筛选,并利用筛选后的交易样本及对应的类别标签训练异常交易识别模型,将筛选后的交易样本和训练后的异常交易识别模型存储到数据库400中。异常交易处理服务器200和/或应用服务器300根据训练后的异常交易识别模型对终端进行的交易进行识别,以确定待识别交易是否属于异常交易。
在一些实施例中,异常交易处理服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云确定、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云确定服务的云服务器,本申请实施例中不做限制。
下面,继续说明本申请实施例提供的用于异常交易处理的电子设备的结构。参见图2,图2是本申请实施例提供的电子设备600的结构示意图,能够适用于上文所述的异常交易处理服务器200。图2所示的电子设备600包括:至少一个处理器610、存储器650、至少一个网络接口620。电子设备600中的各个组件通过总线系统640耦合在一起。可理解,总线系统640用于实现这些组件之间的连接通信。总线系统640除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线系统640。
处理器610可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
存储器650可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器650可选地包括在物理位置上远离处理器610的一个或多个存储设备。
存储器650包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Memory),易失性存储器可以是随机存取存储器(RAM,Random Access Memory)。本申请实施例描述的存储器650旨在包括任意适合类型的存储器。
在一些实施例中,存储器650能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统651,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块652,用于经由一个或多个(有线或无线)网络接口620到达其他确定设备,示例性的网络接口620包括:蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB,Universal Serial Bus)等;
在一些实施例中,本申请实施例提供的基于人工智能的异常交易处理装置可以采用软件方式实现,图2示出了存储在存储器650中的基于人工智能的异常交易处理装置655,其可以是程序和插件等形式的软件,包括以下软件模块:筛选模块6551、组成模块6552、标注模块6553、训练模块6554和识别模块6555,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分。下面对基于人工智能的异常交易处理装置655的不同的软件实现方式进行举例说明。
示例一、异常交易处理装置可以是终端应用程序及模块
本申请实施例可提供为使用C/C++、Java等编程语言设计的软件模块,嵌入到基于Android或iOS等系统的各种终端Apps中(例如游戏应用等)(以可执行指令的存储在终端的存储介质中,由终端的处理器执行),从而直接使用终端自身的计算资源完成相关的机器模型训练,应用等任务,并且定期或不定期地通过各种网络通信方式将模型训练、应用等结果传送给远程的服务器,或者在移动端本地保存。
示例二、异常交易处理装置可以是服务器应用程序及平台
本申请实施例可提供使用C/C++、Java等编程语言设计的应用软件或大型软件系统中的专用软件模块,运行于服务器端(以可执行指令的方式在服务器端的存储介质中存储,并由服务器端的处理器运行),将接收到的来自其它设备的各种原始数据、各级中间数据和最终结果中的至少一种,与服务器上已有的某些数据或结果综合起来进行模型的训练、以及使用训练完成的模型识别交易,然后实时或非实时地输出模型或交易识别的结果给其他应用程序或模块使用,也可以写入服务器端数据库或文件进行存储。
本申请实施例还可以提供为在多台服务器构成的分布式、并行计算平台上,搭载定制的、易于交互的网络(Web)界面或其他各用户界面(UI,User Interface),形成供个人、群体或企业使用的UI界面设计平台等。使用者可以将已有的数据包批量上传给此平台以获得各种计算结果,也可以将实时的数据流传输给此平台来实时计算和刷新各级结果。
示例三、异常交易处理装置可以是服务器端应用程序接口(API,ApplicationProgram Interface)及插件
本申请实施例可提供为服务器端的实现模型训练功能、基于模型生成异常交易识别的API、软件开发套件(SDK,Software Development Toolkit)或插件,供其他的服务器端应用程序开发人员调用,并嵌入到各类应用程序中。
示例四、异常交易处理装置可以是终端设备客户端API及插件
本申请实施例还可提供为终端设备端的实现模型训练功能的、基于机器学习或深度学习模型生成异常交易识别的API、SDK或插件,供其他的终端应用程序开发人员调用,并嵌入到各类应用程序中。
示例五、异常交易处理装置可以是云端开放服务
本申请实施例可提供为基于人工智能的异常交易处理的UI界面设计云服务、本申请实施例还可提供为UI界面设计云服务的应用程序包(Android application package,API)、软件开发工具包(Software Development Kit,SDK)及插件等,打包封装成可供企业内外人员开放使用的云服务,或者将各种结果以适当形式展示在各种终端显示设备上,供个人、群体或企业使用。
下面说明本申请实施例提供的基于人工智能的异常交易处理方法。可以理解地,下述的方法可以由上文所述的终端或异常交易处理服务器执行。参见图3,图3是本申请实施例提供的基于人工智能的异常交易处理方法的一个流程示意图,将结合图3示出的步骤进行说明。
在步骤101中,根据第一产品交易样本集合中每个产品交易样本的异常度,对第一产品交易样本集合中的产品交易样本进行筛选。
例如,在各终端通过应用服务器300进行交易后,应用服务器300会将交易数据存储到数据库400,异常交易处理服务器200可以从数据库400中采集交易数据以构建第一产品交易样本集合。第一产品交易样本集合中每个产品交易样本都有相对于样本集合整体而言的异常度。异常交易处理服务器200可以根据第一产品交易样本集合中每个产品交易样本的异常度,对第一产品交易样本集合中的产品交易样本进行筛选。
作为示例,可以使用第一产品交易样本中的样本来训练无监督模型,通过无监督模型获取第一产品交易样本集合中每个产品交易样本的异常度,以便后续进行样本筛选。由于无监督模型训练不需要标注数据,也不需要人为介入,节省了人力,且能准确的获取每个产品交易样本的异常度。
在一些实施例中,参见图4A,图4A是本申请实施例提供基于人工智能的异常交易处理方法的一个可选的流程示意图,图4A示出在图3步骤101之前,还可以执行步骤106和步骤107:
在步骤106中,获取第一产品交易样本集合中每个产品交易样本的多个特征值。
在步骤107中,根据每个产品交易样本多个特征值,确定每个产品交易样本的整体的异常度。
其中,特征值的维度包括以下至少之一:用户维度、经济维度、社交维度和交易维度。
作为示例,可以将每个产品交易样本多个特征对应的局部异常度相加,以作为样本的整体的异常度。例如,获取第一产品交易样本集合的产品交易样本中,交易维度中的交易价格和社交维度中的熟悉程度这两个特征的特征值,当样本A的交易价格在集合中的异常度为xA,熟悉程度的在集合中的异常度为yA,则样本A的异常度整体的异常为xA+yA。
在一些实施例中,参见图4B,图4B是本申请实施例提供的基于人工智能的异常交易处理方法的一个可选的流程示意图,图4B中示出图4A中的步骤106可通过步骤1061-1063实现,下面说明。
在步骤1061中,根据每个产品交易样本的多个特征值对应的维度中,将第一交易样本集合切分成多个单样本集合。
在步骤1062中,根据所述第一产品交易样本集合中的产品交易样本形成单样本集合的顺序,得到特征值对应的局部异常度。
在步骤1063中,结合每个产品交易样本的多个特征值对应的局部异常度,确定每个产品交易样本的整体的异常度。
作为示例,对应每一个维度,可以用一个随机超平面对第一产品交易样本集合的数据空间进行切分,切分一次可以生成两个子空间。继续随机选取超平面,来切分得到的两个子空间,以此循环下去,直到每子空间里面只包含一个样本,即每一个样本形成了对应该子空间的一个单样本集合。在切分过程中,密度高的样本簇被切分很多次才会停止切割,分布稀疏的样本在切分次数较少时就形成了一个单样本集合。因此,对应每一个维度的切割,可以根据产品交易样本形成单样本集合的顺序来确定该维度特征值对应的局部异常度,综合多个特征值对应的局部异常度得到产品交易样本的整体的异常度。
在一些实施例中,在根据第一产品交易样本集合中每个产品交易样本的异常度,对第一产品交易样本集合中的产品交易样本进行筛选之前,需要获取原始交易数据,并从交易数据中获取满足条件的交易数据,然后基于满足条件的交易数据构建产品样本,并组成第一产品交易样本集合。参见图5,图5是本申请实施例提供基于人工智能的异常交易处理方法的一个可选的流程示意图,结合图5示出的步骤说明。
在步骤201中,获取采样时段内的原始交易数据,并对原始交易数据进行清洗处理。
在步骤202中,基于特定指标选择需要关注的用户,其中,所述特定指标包括以下至少之一:活跃度,用户等级和资源获取量。
在步骤203中,从清洗处理后的原始交易数据中,获取需要关注的用户的交易数据。
在步骤204中,从需要关注的用户的每个交易的交易数据中,提取用户维度、经济维度、社交维度和交易维度中至少之一的特征值。
在步骤205中,基于所提取多个特征值构建对应每个交易的产品交易样本。
在步骤206中,根据对应每个交易的产品交易样本,构建第一产品交易样本集合。
作为示例,对原始交易数据进行清洗,包括号码去重、重要字段缺失补全、删除严重离群值(可见的数值异常或数据类型异常),预先对数据进行清洗可以有效降低后续样本集合构建和模型训练的复杂度。
作为示例,在游戏道具交易场景中,低级别(低于级别阈值)和低活跃度(低于活跃度阈值)的用户在用户群体中占比较大,但这类用户的数据稀疏且价值较低,过滤这类用户的数据,仅保留需要关注的用户的交易数据,可以有效提高数据处理的效率。
作为示例,用户维度包括登录次数,登录时段,登录时长等特征。经济维度包括充值数据,货币获取,货币消费等特征。社交维度包括活动参与度,互动次数,好友数量,身份,特征等特征。交易维度包括产品价格,道具类别,交易对象,交易频次等特征。
在一些实施例中,交易维度的特征可以包括产品价格,可以通过以下方案确定:根据原始交易数据确定每种产品的正常交易价格;将每种产品的实际交易价格与正常交易价格的比值,作为相应产品在交易维度的产品价格。
作为示例,在识别异常交易时,虽然交易价格不是唯一决定性因素,但仍是判定一个交易是否异常的重要依据,选择交易维度中的产品价格作为特征值,可以帮助模型判定交易是否异常。在一些实施例中,根据一段时间内的原始交易数据可以获取每种产品在该时间段内的正常交易价格,并将每种产品的实际交易价格与正常交易价格的比值作为相应产品在交易维度的产品价格,可以直观体现实际交易的价格是否异常,也避免了不同产品交易价格差距过大影响模型的训练效果。
在一些实施例中,产品的类型包括普通产品和特殊产品,普通产品的属性具有固定的取值,特殊产品具有取值是动态变化的特殊属性;根据原始交易数据确定每种产品的正常交易价格,包括:针对普通产品,对原始交易数据中对应普通产品的交易价格进行聚类,得到多个价格簇;从规模最大的价格簇中,任选一个价格作为普通产品的正常交易价格;针对特殊产品,对原始交易数据中对应特殊产品的交易价格和特殊产品的特殊属性的取值进行拟合处理,得到特殊产品的特殊属性和特殊产品的正常交易价格之间的映射关系;基于映射关系和特殊产品的特殊属性的取值,确定特殊产品的正常交易价格。
作为示例,在游戏道具交易场景中,普通产品不具备特征属性,所有属性只具有固定的取值,在计算普通产品的正常交易价格时,可以使用k-平均聚类算法,将原始交易数据中对应普通产品的交易价格按相近值聚类,最集中的价格也就是玩家正常的交易价格,聚类后选择点数占比最大的簇,优选的从中选择上四分位处的值作为产品的正常交易价格,以用于后续计算产品交易样本中交易维度的特征值。
作为示例,在游戏道具交易场景中,对于特殊产品,比如同一个装备,一个防御加100,另外一个防御+1000,那么它们的属性值的高低会影响价格,而且这个价格的差异是呈指数特征。因此,使用指数回归算法,拟合出装备属性值与交易价格的映射关系:y=Aebx+C,其中y为交易价格,x为装备属性值。计算过程如下:根据原始交易数据获取大量特殊产品属性值和价格的训练样本,通过计算拟合出A、b、C三个参数的大小,获得特殊产品属性值与交易价格的映射关系。并基于每种特殊产品的属性值与交易价格的映射关系,可以确定每种特殊产品的正常交易价格。
在一些实施例中,根据原始交易数据确定每种产品的正常交易价格之前,还可以根据原始交易数据,确定每种产品的交易的价格区间;根据价格区间中的最大值和最小值,确定出价格区间的上四分位值和下四分位值;确定上四分位值和下四分位值的间隔;根据上四分位值、下四分位值以及间隔构建正常价格区间。
作为示例,确定一组价格数值的最小值,最大值,并根据最小值和最大值确定上下四分位数,分别表示为Q3和Q1,计算四分位间距Q3-Q1,分别计算上界Q3+k(Q3-Q1)和下界Q1-k(Q3-Q1),其中k值大小可根据实际情况调整,一般介于1.5-3之间,上界和下界之间的区间作为正常价格区间。
在一些实施例中,根据每个产品交易样本的异常度,对第一产品交易样本集合中的产品交易样本进行筛选,可以通过以下方式实现:对第一产品交易样本集合中的产品交易样本,按照异常度降序的方式进行排序;筛选得到排序在前的N个产品交易样本,其中,N为大于1,且小于第一产品交易样本集合样本总数的正整数。示例性的,可以获取第一产品交易样本集合中,按照异常度降序的方式进行排序后,排序在前5%的产品交易样本。
在步骤102中,将筛选得到的产品交易样本组成第二产品交易样本集合。
作为示例,异常交易处理服务器200可以将筛选得到的产品交易样本组成第二产品交易样本集合,并将第二产品交易样本集合存储备份在数据库400中。
在步骤103中,获取第二产品交易样本集合中每个产品交易样本的类别标注数据,其中,类别标注数据用于表征产品交易样本正常或异常。
作为示例,可以选择多名交易监控、处理等相关领域的人员,从数据库400中获取第二产品交易样本集合,然后进行人工对第二产品交易样本集合中的产品交易样本进行类别标注,将产品交易样本标注为正常或异常,并将多名人员的类别标注数据整理存储进数据库400,以使异常交易处理服务器200可以从数据库400中获取第二产品交易样本的类别标注数据。
作为示例,可以通过异常交易处理服务器、应用服务器或者第三方服务接口对第二产品交易样本集合中的样本进行机器标注,并将类比标注数据发送至数据库400,以使异常交易处理服务器200可以从数据库400中获取第二产品交易样本的类别标注数据。
在步骤104中,以第二产品交易样本集合中的产品交易样本对异常交易识别模型进行训练,得到训练后的异常交易识别模型。
在一些实施例中,当异常交易识别模型是神经网络时,以第二产品交易样本集合中的产品交易样本对异常交易识别模型进行训练,得到训练后的异常交易识别模型,包括:以第二产品交易样本集合中的产品交易样本作为异常交易识别模型的输入,得到针对第二产品交易样本集合中的产品交易样本的分类结果;根据分类结果与类别标注数据的误差构建损失函数;根据损失函数更新异常交易识别模型的参数,直至损失函数收敛;将损失函数收敛时的异常交易识别模型的参数,确定为训练后的异常交易识别模型的参数。
在一些实施例中,当异常交易识别模型是集成学习模型时,以第二产品交易样本集合中的产品交易样本对异常交易识别模型进行训练,得到训练后的异常交易识别模型,包括:遍历异常交易识别模型中的所有分类器,将遍历到的分类器作为候选分类器;以第二产品交易样本集合中的产品交易样本作为候选分类器的输入,得到针对第二产品交易样本集合中的产品交易样本的分类分数;根据最后遍历的分类器的分类分数构建正则项;根据异常交易识别模型中所有分类器的分类分数,确定分类结果;
确定分类结果与类别标注数据的误差,根据误差和正则项构建损失函数;
根据损失函数更新异常交易识别模型的参数,直至损失函数收敛;
将损失函数收敛时的异常交易识别模型的参数,确定为训练后的异常交易识别模型的参数。
示例性的,异常交易处理服务器200得到训练后的异常交易识别模型后,将模型以参数形式存储在异常交易处理服务器200服务器中或者数据库400中,并将模型运行环境配置以配置文件的形式存储在异常交易处理服务器200或者数据库400中,以供运维人员根据实际运行环境进行调整。
在一些实施例中,以第二产品交易样本集合中的产品交易样本对异常交易识别模型进行训练之前,还包括,对于每一个异常产品交易样本,根据异常产品交易样本和异常产品交易样本的邻近样本,生成新的异常产品交易样本;将新的异常产品交易样本添加进第二产品交易样本集合中。
示例性的,对于少数类中每一个样本x,以欧氏距离为标准计算它到少数类样本集Smin中所有样本的距离,得到其k近邻。根据样本不平衡比例设置一个采样比例以确定采样倍率N,对于每一个少数类样本x,从其k近邻中随机选择若干个样本,假设选择的近邻为xn。对于每一个随机选出的近邻xn,分别与原样本按照公式xnew=x+rand(0,1)*|x-xn|构建新的样本xn,公式中rand(0,1)表示选择0到1之间的随机值。
在步骤105中,根据训练后的异常交易识别模型识别异常交易。
在一些实施例中,当异常交易识别模型是神经网络时,通过训练后的异常交易识别模型提取待识别交易的隐层特征;将隐层特征映射为待识别交易属于异常交易的概率。
在一些实施例中,当异常交易识别模型是集成学习模型时,通过训练后的异常交易识别模型中的多个分类器,分别对待识别交易进行识别以获取分类分数;根据多个分类器的分类分数确定分类结果,分类结果用于指示待识别交易正常或异常。
作为示例,异常交易处理服务器200和/或应用服务器300通过训练后的异常交易识别模型,对待识别的交易进行识别,并对识别出的异常交易进行警告或冻结。
在一些实施例中,可以生成异常交易的告警单据并显示,告警单据包括异常交易的交易信息、告警风险值明细、属于异常交易的概率和告警类型;交易信息包括异常交易对应产品的价格分布区间和正常交易价格;告警风险值明细包括异常交易的各特征值对应的局部异常度。
下面,将说明本申请实施例在一个实际的应用场景中的示例性应用。在游戏道具交易场景中,参见图6,图6是本申请实施例提供的基于人工智能的异常交易处理方法的一个流程示意图,图6中涉及如下几个环节:步骤601-602,数据的预处理;步骤603,特征工程;步骤604,无监督学习;步骤605,数据标注;步骤606,过采样;步骤607,有监督学习;步骤604,预测评估。结合图6示出的步骤进行说明。
在步骤601中,采集某款游戏中一段时间内的游戏道具交易数据。
首先采集一段时间内产生的用户交易行为数据,包括拍卖行交易日志、后台日志、商城消费日志、道具价值库、玩家登录日志、玩家交易日志、活动日志等所有有涉及交易行为的场景。
在步骤602中,对采集的交易数据进行预处理。
在进行数据预处理时,需要做数据清洗,包括号码去重、重要字段缺失补全、严重离群值剔除(指肉眼可见的数值异常或数据类型异常),以及用户筛选,通过特定规则过滤用户,比如低活跃,低等级,低资源获取等用户,只保留需要关注的用户,游戏里低活跃度、低等级的用户数量太多,通过用户筛选可以提升数据质量。
在步骤603中,通过特征工程将原始数据转换为产品交易样本的特征向量,并根据产品交易样本构建第一产品交易样本集合。
特征工程的过程包括特征选择和特征构造两个阶段。
在特征选择阶段,按业务需求选择相关数据源的特征字段,包括拍卖行交易日志、发放日志、商城消费日志、道具价值库、玩家登录日志、登陆次数、玩家社交日志等。
在特征构造阶段,通过选择的特征字段构造出易于模型学习分辨异常样本的特征。在本申请实施例中,一个产品交易样本对应一条交易数据,从以下维度分别选取合适的特征构建产品交易样本:
用户维度:含登录次数,登录时段,登录时长等;
经济维度:含充值数据,货币获取,货币消费等;
社交维度:含活动参与度,互动次数,好友数量,身份,特征等;
交易维度:道具价格,道具类别,交易对象,交易频次等。
从以上维度构建数据时,不仅限于只构建数据绝对值,还可以依据分布特征构建各种占比,方差等统计数据。
其中,交易维度的特征可以包括产品价格,此时,需要根据原始交易数据确定每种产品的正常交易价格,将每种产品的实际交易价格与正常交易价格的比值,作为相应产品在交易维度的产品价格的特征值。
示例性的,可以通过挖掘近期一段时间(即在执行步骤603中执行特征工程的时刻,向前追溯一个预设时间段)道具的全量交易数据计算产品的正常交易价格。
参见图7,图7中示出的是游戏中价格分布情况,图7中横坐标表示道具价格,纵坐标表示交易次数,可见游戏中既有价格正常的交易,也存在价格异常的交易,可以使用箱式算法过滤异常的价格数据,箱式算法是一种用作显示一组数据分散情况的统计方法,因箱式算法统计图的形状如箱子而得名,此算法最大的优点就是不受异常值的影响,能够准确稳定地描绘出数据的离散分布情况,并快速识别价格异常值。
参见图8,图8中示出的是异常价格过滤原理示意图,计算原理如下:确定一组价格数值的最小值,最大值,并根据最小值和最大值确定上下四分位数,分别表示为Q3和Q1,如图8中所示,下四分位数Q1和最小值之间包含25%的数据。计算四分位间距Q3-Q1,分别计算上界(最大估计值)Q3+k(Q3-Q1)和下界(最小估计值)Q1-k(Q3-Q1),其中系数k的取值可根据实际情况调整,一般介于1.5-3之间,上界和下界之间的区间作为正常价格区间,去除正常价格区间之外的异常数据。
去除正常价格区间之外的异常数据之后,采用k-平均聚类算法,将价格按相近值聚类,最集中的价格也就是玩家正常的交易价格。聚类后选择点数占比最大的簇,并从中选择中间值或上四分位处的值作为产品的正常交易价格。参见图9,图9中示出的是价格聚类示意图,在图9的二维空间中,可以使用欧几里得距离来表示样本点之间的空间距离,样本集合经过k=3的k-平均聚类算法聚类后,分成了三个样本点簇,每个样本点簇具有重心,具体的计算原理如下:
已知观测集(x1,x2,…,xn),观测集中的每个观测x都是一个d维实向量,k-平均聚类算法把这个观测划分到k个集合中(k≤n),使得组内平方和最小,也就是找到使得下式满足的聚类Si:
其中μi是Si中所有点的均值。
对于普通道具(普通产品),用以上的方法可以精确的计算出合理的交易价格区间。对于某些的特殊道具(特殊产品),比如同一个装备战甲,一个防御加100,另外一个防御加1000,那么它们的属性值的高低会影响价格,它们就会卖出不同的价格,而且这个价格的差异是呈指数特征。这时候可以使用指数回归算法,拟合出装备属性值与交易价格的映射关系:y=Aebx+C,其中y为交易价格,x为装备属性值。
参见图10,图10中示出的是特殊道具的属性值与交易价格的关系图,如图10所示,可以使用曲线来拟合属性值与交易价格构成的样本点,特殊道具正常交易价格的计算原理如下:通过搜集装备的一段时间内的原始交易数据,获取大量装备属性值和价格的训练样本,通过计算拟合出A、b、C三个参数的大小,获得装备属性值与交易价格的映射关系。从而可以根据特殊道具的属性值、属性值和交易价格的映射关系,来获取特殊道具的正常交易价格。
在步骤604中,通过无监督学习过滤第一产品交易样本集合中的正样本,获取第二产品交易样本集合。
使用无监督学习可以在对训练集标注情况不了解的情况下,能够快速过滤掉大量正样本,若结果足够准确,可直接获得负样本。
本申请实施例中,可以采用孤立森林算法完成无监督学习的步骤,孤立森林算法是一个基于Ensemble的快速异常检测方法,具有线性时间复杂度和高精准度,是符合大数据处理要求的state-of-the-art算法。
参见图11,图11中示出的是孤立森林算法的准确率和召回率示意图,横坐标表示孤立森林算法输出值,纵坐标表示准确率和召回率的数值,当精确率等于召回率时,两者都达到了70%左右。算法原理如下:用一个随机超平面对一个数据空间进行切割,切一次可以生成两个子空间。接下来,继续随机选取超平面,来切割第一步得到的两个子空间,以此循环下去,直到每子空间里面只包含1个数据点为止。密度很高的簇要被切很多次才会停止切割,即每个点都单独存在于一个子空间内,但分布稀疏的点,大都很早就停到一个子空间内了。孤立森林每一个维度的切割,都量化成一个正负分值来表示异常度,综合所有维度得分得到一个整体的异常度,用百分比表示,按异常度从大到小的顺序进行排列,取前5%的产品交易样本构建第二产品交易样本集合。
在步骤605中,对第二产品交易样本集合中的产品交易样本集合进行人工标注,将产品交易样本标注为正常或异常。
在步骤606中,对第二产品交易样本进行过采样处理。
虽然经无监督学习过滤了大量的正常样本,但是在第二产品交易样本集合中,仍是正样本多而负样本比较少,是类别不平衡的样本集合,需要对第二产品交易样本集合进行类别平衡处理。
本申请实施例中,对于少数类中每一个样本x,以欧氏距离为标准计算它到少数类样本集Smin中所有样本的距离,得到其k近邻。根据样本不平衡比例设置一个采样比例以确定采样倍率N,对于每一个少数类样本x,从其k近邻中随机选择若干个样本,假设选择的近邻为xn。对于每一个随机选出的近邻xn,分别与原样本按照如下的公式构建新的样本xnew,rand(0,1)表示选择0到1之间的随机值:
xnew=x+rand(0,1)*|x-xn|
在步骤607中,以第二产品交易样本集合中的产品交易样本训练有监督学习模型,并将训练后的模型作为异常交易识别模型。
本申请实施例中,有监督学习模型为XGBoost,XGBoost是对GBDT的优化,GradientBoosting(梯度提升)就是通过加入新的弱学习器,来纠正前面所有弱学习器的残差,最终多个学习器相加在一起用来进行最终预测,准确率比单独的一个学习器高。称为Gradient(梯度),是因为在添加新模型时使用了梯度下降算法来最小化的损失。XGBoost在此基础上做出了改进,减小了过拟合的可能性,提升了分类精度。首先,XGBoost算法在基学习器损失函数中引入了正则项,控制减少训练过程当中的过拟合;其次,XGBoost算法不仅使用一阶导数计算伪残差,还计算二阶导数可近似快速剪枝的构建新的基学习器;此外,XGBoost算法还做了很多工程上的优化,例如支持并行计算、提高计算效率、处理稀疏训练数据等等。
在步骤608中,使用训练后的异常交易识别模型进行异常交易识别。
因为每个类型业务的特征和参数值,以及交易的细节特征有不同的差别,实际应用中将模型适配为几套类型,更好的匹配不同类别的游戏,同时进行准实时的指标计算和监控,并定期使用真实数据训练,以有效提升命中率。
另外,根据数据的复杂程度,小体量游戏不采用无监督学习,可以直接使用有监督学习。
值得说明的是,可以在管理后台可以显示异常交易告警单据,明确显示评分以及告警类型,显示的信息也可以包括,交易ID、时间、大区ID、买道具玩家OPENID、卖道具玩家OPENID、道具ID、道具名称、道具品级、珍品、交易金额、数量、状态描述、详细信息、告警级别和告警评分。可以在管理后台将道具价格进行展示,显示道具交易价格分布区间,数量,众数,平均价格,最高价格,合理价格等。有特殊属性的道具会计算评分以及最高合理价格。可以在管理后台展示各种明细特征的异常程度和本次交易风险值。
参见图12,图12中提供的是模型上线后的实际告警情况的示例(告警级别:一级),示出了2个月的告警准确率,可以发现,后一个月新模型上线以后,该游戏的异常单据开始减少,一级模型告警准确率达到了96%,大大超过了之前一个月原有的阈值模型的告警准确率50%,有效的对异常交易行为做出了准确的监测。
参见图13,图13提供的是异常交易单据展示示意图,在管理后台可以显示模型上线后异常交易识别中的异常交易告警单据,告警单据中的信息例如交易ID、时间、大区ID、买道具玩家OPENID、卖道具玩家OPENID、道具ID、道具名称、道具品级、珍品、交易金额(元)、数量、状态描述、详细、告警级别和告警评分等,可以明确显示评分以及告警类型。
参见图14,图14提供的是道具价格展示示意图,可以显示模型上线后异常交易识别中的道具交易价格分布区间,数量,众数,平均价格,最高价格,合理价格等。有特殊属性的道具会计算评分以及最高合理价格。
参见图15,图15提供的是告警风险值明细展示示意图,可以显示模型上线后异常交易识别中的行为模型中各种明细特征的异常程度,例如,通过训练后的XGBosot模型对交易进行识别时,得到该交易特征单月大额(大于800元)交易次数特征对应的异常值为-0.33,得到特征单月交易用户个数对应的特征值为-0.14,图15中只示例性的示出了部分特征对应的异常值,然后,对多个特征对应的异常值进行加和可以得到交易的整体异常值,根据交易整体的异常值判断交易是否为异常交易。
下面继续说明本申请实施例提供的基于人工智能的异常交易处理装置655的实施为软件模块的示例性结构,
在一些实施例中,如图2所示,存储在存储器650的基于人工智能的异常交易处理装置655中的软件模块可以包括:
筛选模块6551,用于根据第一产品交易样本集合中每个产品交易样本的异常度,对所述第一产品交易样本集合中的产品交易样本进行筛选
组成模块6552,用于将筛选得到的产品交易样本组成第二产品交易样本集合;
标注模块6553,用于获取所述第二产品交易样本集合中每个产品交易样本的类别标注数据;
其中,所述类别标注数据用于表征所述产品交易样本正常或异常;
训练模块6554,用于以所述第二产品交易样本集合中的产品交易样本对异常交易识别模型进行训练,得到训练后的异常交易识别模型;
识别模块6555,用于根据所述训练后的异常交易识别模型识别异常交易。
在一些实施例中,所述装置还包括:
异常度确定模块(图2中未示出),用于获取所述第一产品交易样本集合中每个产品交易样本的多个特征值;
根据所述多个特征值,确定所述第一产品交易样本集合中每个产品交易样本的整体的异常度;
其中,所述特征值的维度包括以下至少之一:用户维度、经济维度、社交维度和交易维度。
上述方案中,所述异常度确定模块,还用于在所述每个产品交易样本的多个特征值对应的维度中,将所述第一交易样本集合切分成多个单样本集合;
根据产品交易样本形成所述单样本集合的顺序,得到所述特征值对应的局部异常度;
结合所述多个特征值对应的局部异常度,确定所述每个产品交易样本的整体的异常度。
上述方案中,所述筛选模块,还用于对所述第一产品交易样本集合中的产品交易样本,按照异常度降序的方式进行排序;
筛选得到排序在前的N个产品交易样本,其中,N为大于1,且小于所述第一产品交易样本集合样本总数的正整数。
上述方案中,所述识别模块,还用于当所述异常交易识别模型是神经网络时,以所述第二产品交易样本集合中的产品交易样本作为所述异常交易识别模型的输入,得到针对所述第二产品交易样本集合中的产品交易样本的分类结果;
根据所述分类结果与所述类别标注数据的误差构建损失函数;
根据所述损失函数更新所述异常交易识别模型的参数,直至所述损失函数收敛;
将所述损失函数收敛时的异常交易识别模型的参数,确定为所述训练后的异常交易识别模型的参数。
上述方案中,所述识别模块,还用于当所述异常交易识别模型是集成学习模型时,遍历所述异常交易识别模型中的所有分类器,将遍历到的分类器作为候选分类器;
以所述第二产品交易样本集合中的产品交易样本作为所述候选分类器的输入,得到针对所述第二产品交易样本集合中的产品交易样本的分类分数;
根据最后遍历的分类器的分类分数构建正则项;
根据所述异常交易识别模型中所有分类器的分类分数,确定分类结果;
确定所述分类结果与所述类别标注数据的误差,根据所述误差和所述正则项构建损失函数;
根据所述损失函数更新所述异常交易识别模型的参数,直至所述损失函数收敛;
将所述损失函数收敛时的异常交易识别模型的参数,确定为所述训练后的异常交易识别模型的参数。
上述方案中,所述装置还包括:
第一样本集合构建模块,用于获取采样时段内的原始交易数据,并对所述原始交易数据进行清洗处理;
基于特定指标选择需要关注的用户,其中,所述特定指标包括以下至少之一:活跃度,用户等级和资源获取量;
从清洗处理后的所述原始交易数据中,获取所述需要关注的用户的交易数据;
从所述需要关注的用户的每个交易的交易数据中,提取用户维度、经济维度、社交维度和交易维度中至少之一的特征值;
基于所提取多个特征值构建对应所述每个交易的产品交易样本;
根据对应所述每个交易的产品交易样本,构建所述第一产品交易样本集合。
上述方案中,所述交易维度的特征包括产品价格,所述装置还包括:
正常交易价格获取模块,用于根据所述原始交易数据确定每种产品的正常交易价格;
将所述每种产品的实际交易价格与正常交易价格的比值,作为相应产品在交易维度的产品价格。
上述方案中,所述产品的类型包括普通产品和特殊产品,所述普通产品的属性具有固定的取值,所述特殊产品具有取值是动态变化的特殊属性;
所述正常价格获取模块,还用于针对所述普通产品,对所述原始交易数据中对应所述普通产品的交易价格进行聚类,得到多个价格簇;
从规模最大的所述价格簇中,任选一个价格作为所述普通产品的正常交易价格;
针对所述特殊产品,对所述原始交易数据中对应所述特殊产品的交易价格和所述特殊产品的特殊属性的取值进行拟合处理,得到所述特殊产品的特殊属性和所述特殊产品的正常交易价格之间的映射关系;
基于所述映射关系和所述特殊产品的特殊属性的取值,确定所述特殊产品的正常交易价格。
上述方案中,所述装置还包括:
异常价格过滤模块,用于根据所述原始交易数据,确定每种产品的交易的价格区间;
根据所述价格区间中的最大值和最小值,确定出所述价格区间的上四分位值和下四分位值;
确定所述上四分位值和所述下四分位值的间隔;
根据所述上四分位值、所述下四分位值以及所述间隔构建正常价格区间;
过滤掉所述原始交易数据中处于所述正常价格区间之外的交易数据。
上述方案中,所述装置还包括:
过采样模块,用于对于每一个异常产品交易样本,根据所述异常产品交易样本和所述异常产品交易样本的邻近样本,生成新的异常产品交易样本;
将所述新的异常产品交易样本添加进所述第二产品交易样本集合中。
上述方案中,所述识别模块,还用于当所述异常交易识别模型是神经网络时,通过所述训练后的异常交易识别模型提取待识别交易的隐层特征;
将所述隐层特征映射为所述待识别交易属于异常交易的概率;
当所述待识别交易属于异常交易的概率大于预定阈值时,将所述待识别交易确定为异常交易;
当所述异常交易识别模型是集成学习模型时,通过所述训练后的异常交易识别模型中的多个分类器,分别对待识别交易进行识别以获取分类分数;
根据多个分类器的分类分数确定分类结果,所述分类结果用于指示所述待识别交易正常或异常。
上述方案中,所述装置还包括:
生成模块,用于生成异常交易的告警单据并显示,所述告警单据包括所述异常交易的交易信息、告警风险值明细、属于异常交易的概率和告警类型;
所述交易信息包括所述异常交易对应产品的价格分布区间和正常交易价格;
所述告警风险值明细包括所述异常交易的各特征值对应的局部异常度。
本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例上述的基于人工智能的异常交易处理方法。
本申请实施例提供一种存储有可执行指令的计算机可读存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本申请实施例提供的方法。
在一些实施例中,计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在确定环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行指令可被部署为在一个确定设备上执行,或者在位于一个地点的多个确定设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个确定设备上执行。
综上所述,本申请实施例具有以下有益效果:
根据第一产品交易样本集合中每个产品交易样本的异常度来筛选产品交易样本,以将筛选得到的产品交易样本组成第二产品交易样本集合,使得不需要人工干预就可以有效的过滤掉大量正常的交易样本,节约了大量人力;然后,以所述第二产品交易样本集合中的产品交易样本和对应的类别标注数据对异常交易识别模型进行训练,提高了异常交易识别模型识别异常交易的准确率,并根据筛选得到的第二产品交易样本集合来训练异常交易识别模型,提高了异常交易识别模型的训练效率。
以上所述,仅为本申请的实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本申请的保护范围之内。
Claims (10)
1.一种异常交易处理方法,其特征在于,所述方法包括:
根据第一产品交易样本集合中每个产品交易样本的异常度,对所述第一产品交易样本集合中的产品交易样本进行筛选;
将筛选得到的产品交易样本组成第二产品交易样本集合;
获取所述第二产品交易样本集合中每个产品交易样本的类别标注数据,其中,所述类别标注数据用于表征产品交易样本正常或异常;
以所述第二产品交易样本集合中的产品交易样本对异常交易识别模型进行训练,得到训练后的异常交易识别模型;
根据所述训练后的异常交易识别模型识别异常交易。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述第一产品交易样本集合中每个产品交易样本的多个特征值;
根据所述每个产品交易样本的多个特征值,确定所述每个产品交易样本的整体的异常度;
其中,所述特征值的维度包括以下至少之一:用户维度、经济维度、社交维度和交易维度。
3.根据权利要求2所述的方法,其特征在于,所述确定所述每个产品交易样本的整体的异常度,包括:
根据所述每个产品交易样本的多个特征值对应的维度,将所述第一产品交易样本集合切分成多个单样本集合;
根据所述第一产品交易样本集合中的产品交易样本形成所述单样本集合的顺序,得到所述特征值对应的局部异常度;
结合所述每个产品交易样本的多个特征值对应的局部异常度,确定所述每个产品交易样本的整体的异常度。
4.根据权利要求1所述的方法,其特征在于,所述根据第一产品交易样本集合中每个所述产品交易样本的异常度,对所述第一产品交易样本集合中的产品交易样本进行筛选,包括:
对所述第一产品交易样本集合中的产品交易样本,按照异常度降序的方式进行排序;
筛选得到排序在前的N个产品交易样本,其中,N为大于1、且小于所述第一产品交易样本集合样本总数的正整数。
5.根据权利要求1所述的方法,其特征在于,
当所述异常交易识别模型是神经网络时,所述以所述第二产品交易样本集合中的产品交易样本对异常交易识别模型进行训练,得到训练后的异常交易识别模型,包括:
以所述第二产品交易样本集合中的产品交易样本作为所述异常交易识别模型的输入,得到针对所述第二产品交易样本集合中的产品交易样本的分类结果;
根据所述分类结果与所述类别标注数据的误差构建损失函数;
根据所述损失函数更新所述异常交易识别模型的参数,直至所述损失函数收敛;
将所述损失函数收敛时的异常交易识别模型的参数,确定为所述训练后的异常交易识别模型的参数。
6.根据权利要求1所述的方法,其特征在于,
当所述异常交易识别模型是包括多个分类器的集成学习模型时,所述以所述第二产品交易样本集合中的产品交易样本对异常交易识别模型进行训练,得到训练后的异常交易识别模型,包括:
遍历所述异常交易识别模型中的所有分类器,将遍历到的分类器作为候选分类器;
以所述第二产品交易样本集合中的产品交易样本作为所述候选分类器的输入,得到针对所述第二产品交易样本集合中的产品交易样本的分类分数;
根据最后遍历的分类器的分类分数构建正则项;
根据所述异常交易识别模型中所有分类器的分类分数,确定分类结果;
确定所述分类结果与所述类别标注数据的误差,根据所述误差和所述正则项构建损失函数;
根据所述损失函数更新所述异常交易识别模型的参数,直至所述损失函数收敛;
将所述损失函数收敛时的异常交易识别模型的参数,确定为所述训练后的异常交易识别模型的参数。
7.根据权利要求1所述的方法,其特征在于,所述根据第一产品交易样本集合中每个产品交易样本的异常度,对所述第一产品交易样本集合中的产品交易样本进行筛选之前,所述方法还包括:
获取采样时段内的原始交易数据,并对所述原始交易数据进行清洗处理;
基于特定指标选择需要关注的用户,其中,所述特定指标包括以下至少之一:活跃度,用户等级和资源获取量;
从清洗处理后的所述原始交易数据中,获取所述需要关注的用户的交易数据;
从所述需要关注的用户的每个交易的交易数据中,提取用户维度、经济维度、社交维度和交易维度中至少之一的特征值;
基于所提取多个特征值构建对应所述每个交易的产品交易样本;
根据对应所述每个交易的产品交易样本,构建所述第一产品交易样本集合。
8.根据权利要求7所述的方法,其特征在于,
所述交易维度的特征包括产品价格;
所述方法还包括:
根据所述原始交易数据确定每种产品的正常交易价格;
将所述每种产品的实际交易价格与正常交易价格的比值,作为相应产品在交易维度的产品价格。
9.根据权利要求8所述的方法,其特征在于,
所述产品的类型包括普通产品和特殊产品,所述普通产品的属性具有固定的取值,所述特殊产品具有取值是动态变化的特殊属性;
所述根据所述原始交易数据确定每种产品的正常交易价格,包括:
针对所述普通产品,对所述原始交易数据中对应所述普通产品的交易价格进行聚类,得到多个价格簇;
从规模最大的所述价格簇中,任选一个价格作为所述普通产品的正常交易价格;
针对所述特殊产品,对所述原始交易数据中对应所述特殊产品的交易价格和所述特殊产品的特殊属性的取值进行拟合处理,得到所述特殊产品的特殊属性和所述特殊产品的正常交易价格之间的映射关系;
基于所述映射关系和所述特殊产品的特殊属性的取值,确定所述特殊产品的正常交易价格。
10.一种基于人工智能的异常交易处理装置,其特征在于,包括:
筛选模块,用于根据第一产品交易样本集合中每个产品交易样本的异常度,对所述第一产品交易样本集合中的产品交易样本进行筛选
组成模块,用于将筛选得到的产品交易样本组成第二产品交易样本集合;
标注模块,用于获取所述第二产品交易样本集合中每个产品交易样本的类别标注数据;
其中,所述类别标注数据用于表征所述产品交易样本正常或异常;
训练模块,用于以所述第二产品交易样本集合中的产品交易样本对异常交易识别模型进行训练,得到训练后的异常交易识别模型;
识别模块,用于根据所述训练后的异常交易识别模型识别异常交易。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010850857.8A CN111986027A (zh) | 2020-08-21 | 2020-08-21 | 基于人工智能的异常交易处理方法、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010850857.8A CN111986027A (zh) | 2020-08-21 | 2020-08-21 | 基于人工智能的异常交易处理方法、装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111986027A true CN111986027A (zh) | 2020-11-24 |
Family
ID=73442897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010850857.8A Pending CN111986027A (zh) | 2020-08-21 | 2020-08-21 | 基于人工智能的异常交易处理方法、装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111986027A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112529575A (zh) * | 2020-12-14 | 2021-03-19 | 深圳市快付通金融网络科技服务有限公司 | 风险预警方法、设备、存储介质及装置 |
CN112884480A (zh) * | 2021-03-31 | 2021-06-01 | 中国工商银行股份有限公司 | 异常交易识别模型的构造方法、装置、计算机设备和介质 |
CN113448992A (zh) * | 2021-07-13 | 2021-09-28 | 中国银行股份有限公司 | 分布式系统中基于统计数据预测交易异常的方法及装置 |
CN114140238A (zh) * | 2021-12-02 | 2022-03-04 | 中国工商银行股份有限公司 | 异常交易数据识别方法、装置、计算机设备和存储介质 |
CN114140248A (zh) * | 2021-12-14 | 2022-03-04 | 重庆忽米网络科技有限公司 | 一种基于ai人工智能技术的异常交易识别方法 |
CN115672756A (zh) * | 2022-11-15 | 2023-02-03 | 艾信智慧医疗科技发展(苏州)有限公司 | 一种医用箱式物流分拣系统异常情况处理方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130232045A1 (en) * | 2012-03-04 | 2013-09-05 | Oracle International Corporation | Automatic Detection Of Fraud And Error Using A Vector-Cluster Model |
CN104091073A (zh) * | 2014-07-11 | 2014-10-08 | 中国人民解放军国防科学技术大学 | 虚拟资产不平衡交易数据的采样方法 |
CN107391569A (zh) * | 2017-06-16 | 2017-11-24 | 阿里巴巴集团控股有限公司 | 数据类型的识别、模型训练、风险识别方法、装置及设备 |
CN108537592A (zh) * | 2018-04-10 | 2018-09-14 | 网易(杭州)网络有限公司 | 交易检测方法、装置,存储介质和电子装置 |
CN110874778A (zh) * | 2018-08-31 | 2020-03-10 | 阿里巴巴集团控股有限公司 | 异常订单检测方法及装置 |
CN111259985A (zh) * | 2020-02-19 | 2020-06-09 | 腾讯科技(深圳)有限公司 | 基于业务安全的分类模型训练方法、装置和存储介质 |
-
2020
- 2020-08-21 CN CN202010850857.8A patent/CN111986027A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130232045A1 (en) * | 2012-03-04 | 2013-09-05 | Oracle International Corporation | Automatic Detection Of Fraud And Error Using A Vector-Cluster Model |
CN104091073A (zh) * | 2014-07-11 | 2014-10-08 | 中国人民解放军国防科学技术大学 | 虚拟资产不平衡交易数据的采样方法 |
CN107391569A (zh) * | 2017-06-16 | 2017-11-24 | 阿里巴巴集团控股有限公司 | 数据类型的识别、模型训练、风险识别方法、装置及设备 |
CN108537592A (zh) * | 2018-04-10 | 2018-09-14 | 网易(杭州)网络有限公司 | 交易检测方法、装置,存储介质和电子装置 |
CN110874778A (zh) * | 2018-08-31 | 2020-03-10 | 阿里巴巴集团控股有限公司 | 异常订单检测方法及装置 |
CN111259985A (zh) * | 2020-02-19 | 2020-06-09 | 腾讯科技(深圳)有限公司 | 基于业务安全的分类模型训练方法、装置和存储介质 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112529575A (zh) * | 2020-12-14 | 2021-03-19 | 深圳市快付通金融网络科技服务有限公司 | 风险预警方法、设备、存储介质及装置 |
CN112529575B (zh) * | 2020-12-14 | 2023-12-22 | 深圳市快付通金融网络科技服务有限公司 | 风险预警方法、设备、存储介质及装置 |
CN112884480A (zh) * | 2021-03-31 | 2021-06-01 | 中国工商银行股份有限公司 | 异常交易识别模型的构造方法、装置、计算机设备和介质 |
CN112884480B (zh) * | 2021-03-31 | 2024-02-02 | 中国工商银行股份有限公司 | 异常交易识别模型的构造方法、装置、计算机设备和介质 |
CN113448992A (zh) * | 2021-07-13 | 2021-09-28 | 中国银行股份有限公司 | 分布式系统中基于统计数据预测交易异常的方法及装置 |
CN113448992B (zh) * | 2021-07-13 | 2024-02-27 | 中国银行股份有限公司 | 分布式系统中基于统计数据预测交易异常的方法及装置 |
CN114140238A (zh) * | 2021-12-02 | 2022-03-04 | 中国工商银行股份有限公司 | 异常交易数据识别方法、装置、计算机设备和存储介质 |
CN114140248A (zh) * | 2021-12-14 | 2022-03-04 | 重庆忽米网络科技有限公司 | 一种基于ai人工智能技术的异常交易识别方法 |
CN115672756A (zh) * | 2022-11-15 | 2023-02-03 | 艾信智慧医疗科技发展(苏州)有限公司 | 一种医用箱式物流分拣系统异常情况处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111986027A (zh) | 基于人工智能的异常交易处理方法、装置 | |
CN108564286B (zh) | 一种基于大数据征信的人工智能金融风控授信评定方法和系统 | |
CN111754345B (zh) | 一种基于改进随机森林的比特币地址分类方法 | |
CN108711107A (zh) | 智能融资服务推荐方法及其系统 | |
CN113095927B (zh) | 一种反洗钱可疑交易识别方法及设备 | |
CN110163647A (zh) | 一种数据处理方法及装置 | |
CN111967971A (zh) | 银行客户数据处理方法及装置 | |
CN106952159A (zh) | 一种不动产抵押品风险控制方法、系统及存储介质 | |
CN112232833A (zh) | 流失会员客群数据预测方法、模型训练方法及装置 | |
CN112700324A (zh) | 基于CatBoost与受限玻尔兹曼机结合的用户借贷违约预测方法 | |
CN111882420A (zh) | 响应率的生成方法、营销方法、模型训练方法及装置 | |
CN107633455A (zh) | 基于数据模型的信用评估方法及装置 | |
CN111079937A (zh) | 一种快速建模的方法 | |
CN113256409A (zh) | 基于机器学习的银行零售客户流失预测方法 | |
CN115577152A (zh) | 基于数据分析的在线图书借阅管理系统 | |
CN113569162A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN112529319A (zh) | 基于多维特征的评分方法、装置、计算机设备及存储介质 | |
CN112950350B (zh) | 一种基于机器学习的贷款产品推荐方法及系统 | |
CN112926989B (zh) | 一种基于多视图集成学习的银行贷款风险评估方法及设备 | |
CN115907954A (zh) | 账户的识别方法、装置、计算机设备和存储介质 | |
CN116861226A (zh) | 一种数据处理的方法以及相关装置 | |
CN113589034A (zh) | 一种配电系统的窃电检测方法、装置、设备和介质 | |
CN111191688A (zh) | 一种用户分期期数管理方法、装置和电子设备 | |
CN115563555B (zh) | 一种数据驱动的互联网卡用户价值分类方法、设备及介质 | |
CN113435655B (zh) | 扇区动态管理决策方法、服务器及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201124 |