CN108182515B - 智能规则引擎规则输出方法、设备及计算机可读存储介质 - Google Patents
智能规则引擎规则输出方法、设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN108182515B CN108182515B CN201711331550.1A CN201711331550A CN108182515B CN 108182515 B CN108182515 B CN 108182515B CN 201711331550 A CN201711331550 A CN 201711331550A CN 108182515 B CN108182515 B CN 108182515B
- Authority
- CN
- China
- Prior art keywords
- model
- data
- processed data
- fraud detection
- current case
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Accounting & Taxation (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Technology Law (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种智能规则引擎规则输出方法、设备及存储介质,方法包括:接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子;将根据所选中欺诈检测的场景在模型因子库对应筛选得到的模型因子、及当前案件数据作为模型训练结果的输入,通过模型训练结果进行处理后输出适用于该场景的多组规则组合。本申请当接收到了案件数据后,就能进行训练,自动生成规则,而不是与现有技术一样需要人为的设定规则,实现了智能化的生产规则,有效的提高了欺诈检测的效率。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及智能规则引擎规则输出方法、设备及计算机可读存储介质。
背景技术
目前,保险公司的被保险人在进行保险索赔时,保险公司会基于被保险人和其索赔案件的一些信息,结合相应的规则去判断被保险人进行保险欺诈的可能性。然而,现在保险公司进行保险欺诈判断的各种规则都是业务人员根据经验总结出来的。随着时代的发展,保险欺诈的风险特征变化越来越快,根据经验总结生产的规则不能有效的紧跟上述风险的变化。
因此,现有技术还有待于改进和发展。
发明内容
鉴于上述现有技术的不足之处,本申请的目的在于提供一种智能规则引擎规则输出方法、设备及存储介质,旨在解决现有技术中司进行保险欺诈判断的各种规则都是业务人员根据经验总结出来,而保险欺诈的风险特征变化越来越快,根据经验总结生产的规则不能有效的紧跟上述风险的变化的问题。
为了达到上述目的,本申请采取了以下技术方案:
一种智能规则引擎规则输出方法,其中,所述方法包括以下步骤:
接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子;
将根据所选中欺诈检测的场景在模型因子库对应筛选得到的模型因子、及当前案件数据作为模型训练结果的输入,通过模型训练结果进行处理后输出适用于该场景的多组规则组合。
所述智能规则引擎规则输出方法,其中,所述接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子的步骤之前,还包括:
预先建立用于作为模型训练输入因子的模型因子库;
获取历史数据,对历史数据按预先设置的建模流程进行训练,得到模型训练结果;其中,预先设置的建模流程包括宽表搭建、数据探索、显著性分析、变量分箱、相关性分析、模型训练、模型测试、模型效果评价、及模型监控。
所述智能规则引擎规则输出方法,其中,所述将根据所选中欺诈检测的场景在模型因子库对应筛选得到的模型因子、及当前案件数据作为模型训练结果的输入,通过模型训练结果进行处理后输出适用于该场景的多组规则组合的步骤之后,还包括:
根据当前案件数据、及在多组规则组合中被选中的规则组合判断是否存在案件欺诈;
当存在案件欺诈,则进行调查提示;
当不存在案件欺诈,则进行理赔核算。
所述智能规则引擎规则输出方法,其中,所述当前案件数据包括报案时间、报案人姓名、及报案类型。
所述智能规则引擎规则输出方法,其中,所述接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子的步骤,包括:
接收由参数录入系统所传输查勘任务流,并接收与查勘任务流对应的调用函数请求;
根据调用函数请求获取查勘任务流流对应的当前案件数据;
通过Shell脚本调用Python进程;
根据当前案件数据中的报案类型对应设置欺诈检测的场景;
在Python进程中根据所述选中欺诈检测的场景在模型因子库中进行筛选,得到与欺诈检测的场景相对应模型因子。
所述智能规则引擎规则输出方法,其中,所述获取历史数据,对历史数据按预先设置的建模流程进行训练,得到模型训练结果的步骤中,包括:
将历史数据进行宽表搭建,得到第一处理数据;
将第一处理数据进行数据探索,得到第二处理数据;
将第二处理数据进行显著性分析,得到第三处理数据;
将第三处理数据进行变量分箱,得到第四处理数据;
将第四处理数据进行相关性分析,得到第五处理数据;
将第五处理数据进行模型训练,得到第六处理数据;
将第六处理数据进行模型测试,得到第七处理数据;
将第七处理数据进行模型效果评价,得到第八处理数据;
将第八处理数据进行模型监控,得到模型训练结果。
所述智能规则引擎规则输出方法,其中,所述将第一处理数据进行数据探索,得到第二处理数据的步骤中,对第一处理数据依次进行变量的识别、单变量的分析、双变量的分析、处理缺失值、处理异常值、及特征提取后,得到第二处理数据。
一种智能规则引擎规则输出设备,其中,所述绩效指标考核评估设备包括处理器、存储器及通信总线;
所述通信总线用于实现处理器和存储器之间的连接通信;
所述处理器用于执行存储器中存储的智能规则引擎规则输出程序,以实现以下的步骤:
接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子;
将根据所选中欺诈检测的场景在模型因子库对应筛选得到的将根据所选中欺诈检测的场景在模型因子库对应筛选得到的模型因子、及当前案件数据作为模型训练结果的输入,通过模型训练结果进行处理后输出适用于该场景的多组规则组合。
所述智能规则引擎规则输出设备,其中,所述接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子的步骤之前,还包括:
预先建立用于作为模型训练输入因子的模型因子库;
获取历史数据,对历史数据按预先设置的建模流程进行训练,得到模型训练结果;其中,预先设置的建模流程包括宽表搭建、数据探索、显著性分析、变量分箱、相关性分析、模型训练、模型测试、模型效果评价、及模型监控。
一种存储介质,其中,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现所述智能规则引擎规则输出方法的步骤。
本申请提供的智能规则引擎规则输出方法、设备及存储介质,在接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子,将根据所选中欺诈检测的场景在模型因子库对应筛选得到的模型因子、及当前案件数据作为模型训练结果的输入,通过模型训练结果进行处理后输出适用于该场景的多组规则组合。本申请中模型因子库覆盖报案、查勘、定损的理赔全流程,而且能基于案件数据通过算法生产有效的规则,而且生产出的规则随时间、风险特征的变化能做出及时的反应。
附图说明
图1为本申请所述的智能规则引擎规则输出方法较佳实施例的流程图。
图2为本申请所述的智能规则引擎规则输出方法具体实施例中步骤S100的流程图。
图3为本申请所述的智能规则引擎规则输出程序较佳实施例的运行环境示意图。
图4为本申请所述的智能规则引擎规则输出程序较佳实施例的功能模块图。
具体实施方式
本申请提供一种智能规则引擎规则输出方法、设备及存储介质,为使本申请的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本申请进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
请参阅图1,是本申请所述的智能规则引擎规则输出方法较佳实施例的流程图。如图1所示,所述智能规则引擎规则输出方法,包括以下步骤:
步骤S100、接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子。
本实施例中,当用户通过拨打报案电话或者登录APP自助式报案时,先是将当前案件数据(如车险报案时上报报案时间、地点、车型等数据信息)上报至服务器。服务器在接收到当前案件数据后,则坐席后台(也就是可对服务器进行人工操作或自动操作的角色)自动或手动的设置欺诈检测的场景,在完成欺诈检测的场景设置后,由所选中欺诈检测的场景在模型因子库对应筛选得到模型因子。通过获取当前案件数据,就能确定欺诈检测的场景及模型因子,获取了上述基础数据即可进一步对用于判断欺诈的规则进行准确、及时的输出。
步骤S200、将根据所选中欺诈检测的场景在模型因子库对应筛选得到的模型因子、及当前案件数据作为模型训练结果的输入,通过模型训练结果进行处理后输出适用于该场景的多组规则组合。
本实施例中,模型训练结果(模型训练结果可视为一种模型,如深度卷积神经网络模型、逻辑回归模型等)是通过模型训练得来,当将模型因子、及当前案件数据作为模型训练结果的输入,就能快速输出用于辅助判断是否存在案件欺诈的多组规则组合。
模型训练常用的方式有逻辑回归模型,逻辑回归模型简称为LR模型,是一个被广泛应用在实际场景中的算法。在确定使用LR模型并且选定了初始特征集,那么下一步就是如何获取最佳的评估参数,使得训练得到的LR模型可以获得最佳的分类效果。具体过程中,常使用损失函数(loss function)或者代价函数(cost function)来计算由LR模型得到的预测结果与真实值得匹配程度。
在本实施例中,逻辑回归模型的原理揭露如下:
逻辑回归是一种判别模型,表现为直接对条件概率P(y|x)建模,而不关心背后的数据分布P(x,y)。而高斯贝叶斯模型(Gaussian Naive Bayes)是一种生成模型,先对数据的联合分布建模,再通过贝叶斯公式来计算样本属于各个类别的后验概率,即:
\(p(y|x) = \frac{P(x|y)P(y)}{\sum{P(x|y)P(y)}}\)
通常假设P(x|y)是高斯分布,P(y)是多项式分布,相应的参数都可以通过最大似然估计得到。如果我们考虑二分类问题,通过简单的变化可以得到:
如果 \( \sigma_1 = \sigma_0 \),二次项会抵消,我们得到一个简单的线性关系:\(\log\frac{P(y=1|x)}{P(y=0|x)} = \theta^T x\)。
由上式进一步可以得到:\(P(y=1|x) = \frac{e^{\theta^Tx}}{1+e^{\theta^Tx}} = \frac{1}{1+e^{-\theta^T x}} \)。
可以看到,这个概率和逻辑回归中的形式是一样的。这种情况下GNB 和 LR 会学习到同一个模型。实际上,在更一般的假设(P(x|y)的分布属于指数分布族)下,我们都可以得到类似的结论。
如果 (y)不是在[0,1]中取值,而是在\(K\)个类别中取值,这时问题就变为一个多分类问题。有两种方式可以出处理该类问题:一种是我们对每个类别训练一个二元分类器(One-vs-all),当\(K\)个类别不是互斥的时候,比如用户会购买哪种品类,这种方法是合适的。如果\(K\)个类别是互斥的,即 \(y = i\) 的时候意味着 \(y\) 不能取其他的值,比如用户的年龄段,这种情况下 Softmax 回归更合适一些。Softmax 回归是直接对逻辑回归在多分类的推广,相应的模型也可以叫做多元逻辑回归(Multinomial LogisticRegression)。模型通过 softmax 函数来对概率建模,具体形式如下:
\(P(y=i|x, \theta) = \frac{e^{\theta_i^T x}}{\sum_j^K{e^{\theta_j^Tx}}}\);
而决策函数为:\(y^* = \textrm{argmax}_i P(y=i|x,\theta)\);
对应的损失函数为:\(J(\theta) = -\frac{1}{N} \sum_i^N \sum_j^K {1[y_i=j] \log{\frac{e^{\theta_i^T x}}{\sum {e^{\theta_k^T x}}}}}\)
类似的,也可以通过梯度下降或其他高阶方法来求解该问题,这里不再赘述。
在一个实施例中,所述步骤S100之前还包括:
步骤S10、预先建立用于作为模型训练输入因子的模型因子库。
本实施例中,所述当前案件数据包括报案时间、报案人姓名、及报案类型;所述模型因子库中包括主键信息、风险主体、时间维度及搭载环境;其中,所述主键信息包括身份证号、电话号、车牌号、及保单号;所述风险主体包括被保险人、投保人、行驶证车主、标的驾驶员、三者驾驶员、伤者、报案来电、标的车牌、及保单号;所述时间维度包括3个月、半年、1年、及2年;所述搭载环境包括分布式构架的Hadoop平台、及实时调用的Oracle数据库。
这些模型因子是根据大数据总结出来的,其可以是存储在专门用于存储因子库的一台机器上,以供在模型训练时被调用,模型因子库中的模型因子能定期输出高频异常的风险主体;还能直接作为建模的因子,减少建模耗时;还能作为理赔维度的主体风险因子,支持用户画像项目;还能日常分析需要,可以直接查询,确保了处理效率。
由于用户在报案的过程中,上报给后台的数据信息是有限的,如报案时间、报案人姓名、报案类型,但是仅仅基于这行信息输入到模型训练结果当做输入因子时,对于规则组合的输出可能会有影响,导致输出的规则不太准确。故为了更精准的输出规则组合,则除了获取报案过程中上报的案件数据,还需智能的根据报案数据从模型因子库中选择对应的模型因子,将模型因子和报案数据共同作为模型训练结果的输入,以更准确的输出判断规则。
为了实现更准确的输出判断规则,则在进行模型训练时,就需要输入大量的样本数据,如“张三、车牌XXXXXX、133XXXXXXXX、保单号XXXXX、投保年限1年、投保数据调用Oracle数据库”,……,“王五、车牌XYYXXX、134XXXXXXXX、保单号YYYXX、投保年限2年、投保数据调用Hadoop平台”,当搜集了投保样本数据或是投保历史数据后,让计算机学习如何输出判断规则就是一种训练过程。训练完成后,就将模型训练结果作为模型,该模型就能智能的根据输入数据来准确输出规则组合(可以理解成模型训练所训练的是模型里的参数,模型是一个从输入到输出的黑盒子,训练是为了让这个黑盒子更适应当前的任务)。
步骤S20、获取历史数据,对历史数据按预先设置的建模流程进行训练,得到模型训练结果;其中,预先设置的建模流程包括宽表搭建、数据探索、显著性分析、变量分箱、相关性分析、模型训练、模型测试、模型效果评价、及模型监控。
本实施例中,为了实现标准化的输入因子,则需对历史数据进行宽表搭建、数据探索、显著性分析、变量分箱、相关性分析、模型训练、模型测试、模型效果评价、及模型监控这9个步骤的标准建模流程,实现对历史数据的训练,从而得到模型训练结果。
在一个实施例中,所述步骤S20包括:
步骤S2001、将历史数据进行宽表搭建,得到第一处理数据。
其中,宽表通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库表。将历史数据进行宽表搭建的处理后,就得到第一处理数据。
步骤S2002、将第一处理数据进行数据探索,得到第二处理数据。
数据探索,就是通过检验数据集的数据质量、绘制图表、计算某些指定特征量等手段,对样本数据集的结构和规律进行分析的过程,具体过程一般如下:变量的识别、单变量的分析、双变量的分析、处理缺失值、处理异常值、特征提取(Feature Engineering)。即将第一处理数据进行数据探索,得到第二处理数据。
步骤S2003、将第二处理数据进行显著性分析,得到第三处理数据。
统计上的显著性通常用p来衡量,p的含义是在零假设H0成立的条件下,得到比实际测量所得的数据更加极端的数据(D)的概率,也就是p(D | H0。显著性分析也即显著性检测,也就是事先对总体(随机变量)的参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设(备择假设)是否合理,即判断总体的真实情况与原假设是否有显著性差异。将第二处理数据进行显著性分析,得到第三处理数据。
步骤S2004、将第三处理数据进行变量分箱,得到第四处理数据。
常用的数据分箱方法有:1.无监督分箱,其中无监督分箱又包括(1)等宽分箱:(2)等频分箱;(3)基于k均值聚类的分箱。2.有监督分箱,其中有监督分箱在分箱时考虑因变量的取值,使得分箱后达到最小熵(minimumentropy)或最小描述长度。将第三处理数据进行变量分箱,得到第四处理数。
步骤S2005、将第四处理数据进行相关性分析,得到第五处理数据。
相关性分析,是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。相关性分析具体有:(1)图表相关分析(2)协方差及协方差矩阵分析等方法。将第四处理数据进行相关性分析,得到第五处理数据。
步骤S2006、将第五处理数据进行模型训练,得到第六处理数据。
模型训练的常见方法有:逻辑回归模型训练等。更具体的,逻辑回归模型(LogicRegression, LR),以下简称为LR模型,是一个被广泛应用在实际场景中的算法。在确定使用LR模型并且选定了初始特征集,那么下一步就是如何获取最佳的评估参数,使得训练得到的LR模型可以获得最佳的分类效果。具体过程中,常使用损失函数(loss function)或者代价函数(cost function)来计算由LR模型得到的预测结果与真实值得匹配程度。
步骤S2007、将第六处理数据进行模型测试,得到第七处理数据。
其中,模型测试,是对模型的正确性进行测试。将第六处理数据进行模型测试,即可得到第七处理数据。
步骤S2008、将第七处理数据进行模型效果评价,得到第八处理数据。
其中,模型效果评价,可用受试者工作特征曲线 / 接收器操作特性曲线(receiver operating characteristic curve),也即常说的ROC曲线来进行评价。将第七处理数据进行模型效果评价,即可得到第八处理数据。
步骤S2009、将第八处理数据进行模型监控,得到模型训练结果。
模型监控的常见方法有:基于偏最小二乘法的遗传模拟退火算法等。
通过上述9个步骤完成了对历史数据的训练,得到了一个模型训练结果(也就是模型的参数,模型的参数用来作为模型因子及案件数据的运算函数)。
在一个实施例中,如图2所示,所述步骤S100包括:
步骤S101、接收由参数录入系统所传输查勘任务流,并接收与查勘任务流对应的调用函数请求;
步骤S102、根据调用函数请求获取查勘任务流流对应的当前案件数据;
步骤S103、通过Shell脚本调用Python进程;
步骤S104、根据当前案件数据中的报案类型对应设置欺诈检测的场景;
步骤S105、在Python进程根据所述选中欺诈检测的场景在模型因子库中进行筛选,得到与欺诈检测的场景相对应模型因子。
本实施例中,Shell脚本是利用shell的功能所写的一个程序,这个程序是使用纯文本文件,将一些shell的语法与指令写在里面,然后用正规表示法,管道命令以及数据流重导向等功能,以达所想要的处理目的。Python提供了实用的多进程包multiprocessing,只需要定义一个函数,Python会完成其他所有事情。借助这个多进程包,可以轻松完成从单进程到并发执行的转换。通过Shell脚本调用Python进程中的多进程包multiprocessing,即可进一步执行步骤S105。
例如,当接收由参数录入系统所传输的当前案件数据,并选择“驾驶员酒驾”场景,则模型因子库根据速所选择的场景在模型因子库中选择出符合“驾驶员酒驾”场景的模型因子,如“身份证号”、“投保时限1年”。
将案件数据和根据车险理赔场景对应适配选择模型因子输入模型训练结果进行处理后输出适用于该场景的多组规则组合,如规则组合1-“车是否在晚上17:00-24:00出险”、及“是否为高端车”;规则组合2-“车是否在晚上00:00-1:00出险”、及“是否为宝马品牌车”。 所输出适用于该场景的多组规则组合中有一组规则组合被选中时,则将被选中的规则组合移动至指定区域的首行显示。
在一个实施例中,所述步骤S200之后还包括:
步骤S301、根据当前案件数据、及在多组规则组合中被选中的规则组合判断是否存在案件欺诈;
步骤S302、当存在案件欺诈,则进行调查提示;
步骤S303、当不存在案件欺诈,则进行理赔核算。
本实施例中,当根据案件数据及生产的规则组合判断存在车险欺诈(即车主的报案信息落入自动生成的规则组合内),则启动下一步调查;当不存在欺诈,则可以走向理赔核算等流程。
基于上述智能规则引擎规则输出方法,本申请还提供了一种智能规则引擎规则输出设备。如图3所示,所述设备包括处理器11、存储器12及通信总线;
所述通信总线用于实现处理器和存储器之间的连接通信;
所述处理器用于执行存储器中存储的智能规则引擎规则输出程序10,以实现以下步骤:
接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子;
将根据所选中欺诈检测的场景在模型因子库对应筛选得到的模型因子、及当前案件数据作为模型训练结果的输入,通过模型训练结果进行处理后输出适用于该场景的多组规则组合。
在本实施例中,所述的智能规则引擎规则输出程序10安装并运行于电子装置中。所述电子装置可以是桌上型计算机、笔记本、掌上电脑及服务器等计算设备。该电子装置可包括,但不仅限于,存储器11、处理器12及显示器13。图3仅示出了具有组件11-13的电子装置(即智能规则引擎规则输出设备),但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
所述存储器11在一些实施例中可以是所述电子装置的内部存储单元,例如该电子装置的硬盘或内存。所述存储器11在另一些实施例中也可以是所述电子装置的外部存储设备,例如所述电子装置上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括所述电子装置的内部存储单元也包括外部存储设备。所述存储器11用于存储安装于所述电子装置的应用软件及各类数据,例如所述智能规则引擎规则输出程序10的程序代码等。所述存储器11还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行所述存储器11中存储的程序代码或处理数据,例如执行所述智能规则引擎规则输出程序10等。
所述显示器13在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。所述显示器13用于显示在所述电子装置中处理的信息以及用于显示可视化的用户界面,例如应用菜单界面、应用图标界面等。所述电子装置的部件11-13通过系统总线相互通信。
请参阅图4,是本申请智能规则引擎规则输出程序10较佳实施例的功能模块图。在本实施例中,所述的所述智能规则引擎规则输出程序10可以被分割成一个或多个模块,所述一个或者多个模块被存储于所述存储器11中,并由一个或多个处理器(本实施例为所述处理器12)所执行,以完成本申请。例如,在图4中,所述的智能规则引擎规则输出程序10可以被分割成案件数据处理模块21、及规则组合输出模块22。本申请所称的模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述所述智能规则引擎规则输出程序10在所述电子装置中的执行过程。以下描述将具体介绍所述模块21-22的功能。
案件数据处理模块21,用于接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子;
规则组合输出模块22,用于将根据所选中欺诈检测的场景在模型因子库对应筛选得到的模型因子、及当前案件数据作为模型训练结果的输入,通过模型训练结果进行处理后输出适用于该场景的多组规则组合。
在一个实施例中,在所述智能规则引擎规则输出设备中,所述接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子的步骤之前,还包括:
预先建立用于作为模型训练输入因子的模型因子库;
获取历史数据,对历史数据按预先设置的建模流程进行训练,得到模型训练结果;其中,预先设置的建模流程包括宽表搭建、数据探索、显著性分析、变量分箱、相关性分析、模型训练、模型测试、模型效果评价、及模型监控;具体实施请参考方法实施例,此处不再赘述。
在一个实施例中,在所述智能规则引擎规则输出设备中,所述将根据所选中欺诈检测的场景在模型因子库对应筛选得到的模型因子、及当前案件数据作为模型训练结果的输入,通过模型训练结果进行处理后输出适用于该场景的多组规则组合的步骤之后,还包括:
根据当前案件数据、及在多组规则组合中被选中的规则组合判断是否存在案件欺诈;
当存在案件欺诈,则进行调查提示;
当不存在案件欺诈,则进行理赔核算;具体实施请参考方法实施例,此处不再赘述。
在一个实施例中,在所述智能规则引擎规则输出设备中,所述当前案件数据包括报案时间、报案人姓名、及报案类型;具体实施请参考方法实施例,此处不再赘述。
在一个实施例中,在所述智能规则引擎规则输出设备中,所述接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子的步骤,包括:
接收由参数录入系统所传输查勘任务流,并接收与查勘任务流对应的调用函数请求;
根据调用函数请求获取查勘任务流流对应的当前案件数据;
通过Shell脚本调用Python进程;
根据当前案件数据中的报案类型对应设置欺诈检测的场景;
在Python进程中根据所述选中欺诈检测的场景在模型因子库中进行筛选,得到与欺诈检测的场景相对应模型因子;具体实施请参考方法实施例,此处不再赘述。
在一个实施例中,在所述智能规则引擎规则输出设备中,所述获取历史数据,对历史数据按预先设置的建模流程进行训练,得到模型训练结果的步骤中,包括:
将历史数据进行宽表搭建,得到第一处理数据;
将第一处理数据进行数据探索,得到第二处理数据;
将第二处理数据进行显著性分析,得到第三处理数据;
将第三处理数据进行变量分箱,得到第四处理数据;
将第四处理数据进行相关性分析,得到第五处理数据;
将第五处理数据进行模型训练,得到第六处理数据;
将第六处理数据进行模型测试,得到第七处理数据;
将第七处理数据进行模型效果评价,得到第八处理数据;
将第八处理数据进行模型监控,得到模型训练结果;具体实施请参考方法实施例,此处不再赘述。
在一个实施例中,在所述智能规则引擎规则输出设备中,所述将第一处理数据进行数据探索,得到第二处理数据的步骤中,对第一处理数据依次进行变量的识别、单变量的分析、双变量的分析、处理缺失值、处理异常值、及特征提取后,得到第二处理数据;具体实施请参考方法实施例,此处不再赘述。
基于上述智能规则引擎规则输出方法,本申请还提供了一种计算机可读存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现所述的智能规则引擎规则输出方法的步骤,具体包括以下的步骤:
接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子;
将根据所选中欺诈检测的场景在模型因子库对应筛选得到的模型因子、及当前案件数据作为模型训练结果的输入,通过模型训练结果进行处理后输出适用于该场景的多组规则组合。
在一个实施例中,计算机在执行所述存储介质中存储的智能规则引擎规则输出程序,以实现所述接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子的步骤之前,还包括:
预先建立用于作为模型训练输入因子的模型因子库;
获取历史数据,对历史数据按预先设置的建模流程进行训练,得到模型训练结果;其中,预先设置的建模流程包括宽表搭建、数据探索、显著性分析、变量分箱、相关性分析、模型训练、模型测试、模型效果评价、及模型监控。
在一个实施例中,计算机在执行所述存储介质中存储的智能规则引擎规则输出程序,以实现所述将根据所选中欺诈检测的场景在模型因子库对应筛选得到的模型因子、及当前案件数据作为模型训练结果的输入,通过模型训练结果进行处理后输出适用于该场景的多组规则组合的步骤之后,还包括:
根据当前案件数据、及在多组规则组合中被选中的规则组合判断是否存在案件欺诈;
当存在案件欺诈,则进行调查提示;
当不存在案件欺诈,则进行理赔核算。
在一个实施例中,计算机在执行所述存储介质中存储的智能规则引擎规则输出程序,以实现所述当前案件数据包括报案时间、报案人姓名、及报案类型。
在一个实施例中,计算机在执行所述存储介质中存储的智能规则引擎规则输出程序,以实现所述接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子的步骤,包括:
接收由参数录入系统所传输查勘任务流,并接收与查勘任务流对应的调用函数请求;
根据调用函数请求获取查勘任务流流对应的当前案件数据;
通过Shell脚本调用Python进程;
根据当前案件数据中的报案类型对应设置欺诈检测的场景;
在Python进程中根据所述选中欺诈检测的场景在模型因子库中进行筛选,得到与欺诈检测的场景相对应模型因子。
在一个实施例中,计算机在执行所述存储介质中存储的智能规则引擎规则输出程序,以实现所述获取历史数据,对历史数据按预先设置的建模流程进行训练,得到模型训练结果的步骤中,包括:
将历史数据进行宽表搭建,得到第一处理数据;
将第一处理数据进行数据探索,得到第二处理数据;
将第二处理数据进行显著性分析,得到第三处理数据;
将第三处理数据进行变量分箱,得到第四处理数据;
将第四处理数据进行相关性分析,得到第五处理数据;
将第五处理数据进行模型训练,得到第六处理数据;
将第六处理数据进行模型测试,得到第七处理数据;
将第七处理数据进行模型效果评价,得到第八处理数据;
将第八处理数据进行模型监控,得到模型训练结果。
在一个实施例中,计算机在执行所述存储介质中存储的智能规则引擎规则输出程序,以实现所述将第一处理数据进行数据探索,得到第二处理数据的步骤中,对第一处理数据依次进行变量的识别、单变量的分析、双变量的分析、处理缺失值、处理异常值、及特征提取后,得到第二处理数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,前述计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,前述计算机可读取存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质。
综上所述,本申请提供的智能规则引擎规则输出方法、设备及存储介质,方法包括:接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子;将根据所选中欺诈检测的场景在模型因子库对应筛选得到的模型因子、及当前案件数据作为模型训练结果的输入,通过模型训练结果进行处理后输出适用于该场景的多组规则组合。本申请当接收到了案件数据后,就能进行训练,自动生成规则,而不是与现有技术一样需要人为的设定规则,实现了智能化的生产规则,有效的提高了欺诈检测的效率。
可以理解的是,对本领域普通技术人员来说,可以根据本申请的技术方案及本申请构思加以等同替换或改变,而所有这些改变或替换都应属于本申请所附的权利要求的保护范围。
Claims (5)
1.一种智能规则引擎规则输出方法,其特征在于,所述方法包括:
接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子,所述模型因子包括主键信息、风险主体、时间维度及搭载环境,所述接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子的步骤,包括:
接收由参数录入系统所传输查勘任务流,并接收与查勘任务流对应的调用函数请求;
根据调用函数请求获取查勘任务流对应的当前案件数据;
通过Shell脚本调用Python进程;
根据当前案件数据中的报案类型对应设置欺诈检测的场景;
在Python进程中根据所述选中欺诈检测的场景在模型因子库中进行筛选,得到与欺诈检测的场景相对应模型因子;
将根据所选中欺诈检测的场景在模型因子库对应筛选得到的模型因子、及当前案件数据作为模型训练结果的输入,通过模型训练结果进行处理后输出适用于该场景的多组规则组合;
所述接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子的步骤之前,还包括:
预先建立用于作为模型训练输入因子的模型因子库;
获取历史数据,对历史数据按预先设置的建模流程进行训练,得到模型训练结果;其中,预先设置的建模流程包括宽表搭建、数据探索、显著性分析、变量分箱、相关性分析、模型训练、模型测试、模型效果评价、及模型监控;
所述获取历史数据,对历史数据按预先设置的建模流程进行训练,得到模型训练结果的步骤中,包括:
将历史数据进行宽表搭建,得到第一处理数据,所述宽表是指业务主题相关的指标、维度、属性关联在一起的一张数据库表;
将第一处理数据进行数据探索,得到第二处理数据,包括对第一处理数据依次进行:变量的识别、单变量的分析、双变量的分析、处理缺失值、处理异常值、特征提取后,得到第二处理数据;
将第二处理数据进行显著性分析,得到第三处理数据,所述显著性分析即判断总体的真实情况与原假设是否有显著性差异;
将第三处理数据进行变量分箱,得到第四处理数据,将第三处理数据进行变量分箱的方法包括无监督分箱和/或有监督分箱;
将第四处理数据进行相关性分析,得到第五处理数据,所述相关性分析,是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度;
将第五处理数据进行模型训练,得到第六处理数据;
将第六处理数据进行模型测试,得到第七处理数据;
将第七处理数据进行模型效果评价,得到第八处理数据;
将第八处理数据进行模型监控,得到模型训练结果,所述模型监控的方法包括:基于偏最小二乘法的遗传模拟退火算法。
2.根据权利要求1所述智能规则引擎规则输出方法,其特征在于,所述将根据所选中欺诈检测的场景在模型因子库对应筛选得到的模型因子、及当前案件数据作为模型训练结果的输入,通过模型训练结果进行处理后输出适用于该场景的多组规则组合的步骤之后,还包括:
根据当前案件数据、及在多组规则组合中被选中的规则组合判断是否存在案件欺诈;
当存在案件欺诈,则进行调查提示;
当不存在案件欺诈,则进行理赔核算。
3.根据权利要求1所述智能规则引擎规则输出方法,其特征在于,所述当前案件数据包括报案时间、报案人姓名、及报案类型。
4.一种智能规则引擎规则输出设备,其特征在于,所述设备包括处理器、存储器及通信总线;
所述通信总线用于实现处理器和存储器之间的连接通信;
所述处理器用于执行存储器中存储的智能规则引擎规则输出程序,以实现以下步骤:
接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子,所述模型因子包括主键信息、风险主体、时间维度及搭载环境,所述接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子的步骤,包括:接收由参数录入系统所传输查勘任务流,并接收与查勘任务流对应的调用函数请求;
根据调用函数请求获取查勘任务流对应的当前案件数据;
通过Shell脚本调用Python进程;
根据当前案件数据中的报案类型对应设置欺诈检测的场景;
在Python进程中根据所述选中欺诈检测的场景在模型因子库中进行筛选,得到与欺诈检测的场景相对应模型因子;
将根据所选中欺诈检测的场景在模型因子库对应筛选得到的模型因子、及当前案件数据作为模型训练结果的输入,通过模型训练结果进行处理后输出适用于该场景的多组规则组合;
所述接收由参数录入系统所传输的当前案件数据,并根据当前案件数据设置欺诈检测的场景,根据所选中欺诈检测的场景在模型因子库对应筛选得到模型因子的步骤之前,还包括:
预先建立用于作为模型训练输入因子的模型因子库;
获取历史数据,对历史数据按预先设置的建模流程进行训练,得到模型训练结果;其中,预先设置的建模流程包括宽表搭建、数据探索、显著性分析、变量分箱、相关性分析、模型训练、模型测试、模型效果评价、及模型监控;
所述获取历史数据,对历史数据按预先设置的建模流程进行训练,得到模型训练结果的步骤中,包括:
将历史数据进行宽表搭建,得到第一处理数据,所述宽表是指业务主题相关的指标、维度、属性关联在一起的一张数据库表;
将第一处理数据进行数据探索,得到第二处理数据,包括对第一处理数据依次进行:变量的识别、单变量的分析、双变量的分析、处理缺失值、处理异常值、特征提取后,得到第二处理数据;
将第二处理数据进行显著性分析,得到第三处理数据,所述显著性分析即判断总体的真实情况与原假设是否有显著性差异;
将第三处理数据进行变量分箱,得到第四处理数据,将第三处理数据进行变量分箱的方法包括无监督分箱和/或有监督分箱;
将第四处理数据进行相关性分析,得到第五处理数据,所述相关性分析,是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度;
将第五处理数据进行模型训练,得到第六处理数据;
将第六处理数据进行模型测试,得到第七处理数据;
将第七处理数据进行模型效果评价,得到第八处理数据;
将第八处理数据进行模型监控,得到模型训练结果,所述模型监控的方法包括:基于偏最小二乘法的遗传模拟退火算法。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1-3任一项所述智能规则引擎规则输出方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711331550.1A CN108182515B (zh) | 2017-12-13 | 2017-12-13 | 智能规则引擎规则输出方法、设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711331550.1A CN108182515B (zh) | 2017-12-13 | 2017-12-13 | 智能规则引擎规则输出方法、设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108182515A CN108182515A (zh) | 2018-06-19 |
CN108182515B true CN108182515B (zh) | 2021-06-25 |
Family
ID=62545915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711331550.1A Active CN108182515B (zh) | 2017-12-13 | 2017-12-13 | 智能规则引擎规则输出方法、设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108182515B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110018957B (zh) * | 2019-02-14 | 2024-04-09 | 创新先进技术有限公司 | 一种资损核对脚本检测方法及装置 |
CN109696529A (zh) * | 2019-02-27 | 2019-04-30 | 深圳测测科技有限公司 | 一种硝酸盐检测分析的运算方法及系统 |
CN109935338A (zh) * | 2019-03-07 | 2019-06-25 | 平安科技(深圳)有限公司 | 基于机器学习的数据预测处理方法、装置和计算机设备 |
CN110348669B (zh) * | 2019-05-23 | 2023-08-22 | 中国平安财产保险股份有限公司 | 智能规则生成方法、装置、计算机设备及存储介质 |
CN110348472B (zh) * | 2019-05-24 | 2023-08-15 | 中国平安财产保险股份有限公司 | 数据检测规则生成方法、装置、计算机设备及存储介质 |
CN111064849B (zh) * | 2019-12-25 | 2021-02-26 | 北京合力亿捷科技股份有限公司 | 一种基于呼叫中心系统线路资源的利用和管控分析方法 |
CN111242315A (zh) * | 2020-01-08 | 2020-06-05 | 中保车服科技服务股份有限公司 | 车险人伤反欺诈方法、装置、计算机设备及存储介质 |
CN111259061B (zh) * | 2020-01-09 | 2023-07-18 | 中国铁道科学研究院集团有限公司电子计算技术研究所 | 交通工具席位可视化查验登记方法与系统 |
CN111339168B (zh) * | 2020-03-06 | 2023-08-22 | 德联易控科技(北京)有限公司 | 数据处理方法、装置、系统、存储介质和处理器 |
CN112347235B (zh) * | 2020-11-05 | 2024-05-24 | 北京羽扇智信息科技有限公司 | 规则库生成方法及装置 |
CN114140259A (zh) * | 2021-11-29 | 2022-03-04 | 中国平安财产保险股份有限公司 | 基于人工智能的核保风控方法、装置、设备及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104537067A (zh) * | 2014-12-30 | 2015-04-22 | 广东电网有限责任公司信息中心 | 一种基于k-means聚类的分箱方法 |
WO2016210122A1 (en) * | 2015-06-24 | 2016-12-29 | IGATE Global Solutions Ltd. | Insurance fraud detection and prevention system |
CN104966239A (zh) * | 2015-06-30 | 2015-10-07 | 天津爱蔻科技有限公司 | 一种基于规则引擎的智能核保平台 |
CN107240024A (zh) * | 2017-05-22 | 2017-10-10 | 中国平安人寿保险股份有限公司 | 保险理赔的反欺诈识别方法及装置 |
-
2017
- 2017-12-13 CN CN201711331550.1A patent/CN108182515B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN108182515A (zh) | 2018-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108182515B (zh) | 智能规则引擎规则输出方法、设备及计算机可读存储介质 | |
CN108170909B (zh) | 一种智能建模的模型输出方法、设备及存储介质 | |
Jiang et al. | Personalized defect prediction | |
US10140343B2 (en) | System and method of reducing data in a storage system | |
CN109933984B (zh) | 一种最佳聚类结果筛选方法、装置和电子设备 | |
US20120066166A1 (en) | Predictive Analytics for Semi-Structured Case Oriented Processes | |
US20220129816A1 (en) | Methods and arrangements to manage requirements and controls, and data at the intersection thereof | |
CN108876213B (zh) | 基于区块链的产品管理方法、装置、介质及电子设备 | |
CN110852881A (zh) | 风险账户识别方法、装置、电子设备及介质 | |
CN113728321A (zh) | 利用训练表的集合来准确预测各种表内的错误 | |
CN109636212B (zh) | 作业实际运行时间的预测方法 | |
CN116257663A (zh) | 面向无人地面车辆的异常检测与关联分析方法及相关设备 | |
US8650180B2 (en) | Efficient optimization over uncertain data | |
CN111371581A (zh) | 物联网卡业务异常检测的方法、装置、设备和介质 | |
Geissler et al. | A low-cost strategic monitoring approach for scalable and interpretable error detection in deep neural networks | |
US20220245492A1 (en) | Constructing a statistical model and evaluating model performance | |
CN115860836A (zh) | 一种基于用户行为大数据分析的电商服务推送方法及系统 | |
CN115936895A (zh) | 基于人工智能的风险评估方法、装置、设备及存储介质 | |
WO2022245706A1 (en) | Fault detection and mitigation for aggregate models using artificial intelligence | |
CN110807489A (zh) | 二分类任务评价指标的确定方法、装置及电子设备 | |
CN113313463A (zh) | 应用于大数据云办公的数据分析方法及数据分析服务器 | |
CN113935034A (zh) | 基于图神经网络的恶意代码家族分类方法、装置和存储介质 | |
CN113282920A (zh) | 日志异常检测方法、装置、计算机设备和存储介质 | |
Awadid et al. | AI Systems Trustworthiness Assessment: State of the Art | |
CN111754103A (zh) | 企业风险画像方法、装置、计算机设备和可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |