Nothing Special   »   [go: up one dir, main page]

CN108038696B - 基于设备标识码和社交群组信息的刷单检测方法及系统 - Google Patents

基于设备标识码和社交群组信息的刷单检测方法及系统 Download PDF

Info

Publication number
CN108038696B
CN108038696B CN201711254621.2A CN201711254621A CN108038696B CN 108038696 B CN108038696 B CN 108038696B CN 201711254621 A CN201711254621 A CN 201711254621A CN 108038696 B CN108038696 B CN 108038696B
Authority
CN
China
Prior art keywords
social
account
transaction
interactive
identification code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711254621.2A
Other languages
English (en)
Other versions
CN108038696A (zh
Inventor
陈鹏
熊伟
陈宇
芦帅
汪宁
谢伟良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou ping pong Intelligent Technology Co.,Ltd.
Original Assignee
Hangzhou Ping Pong Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Ping Pong Intelligent Technology Co Ltd filed Critical Hangzhou Ping Pong Intelligent Technology Co Ltd
Priority to CN201711254621.2A priority Critical patent/CN108038696B/zh
Publication of CN108038696A publication Critical patent/CN108038696A/zh
Application granted granted Critical
Publication of CN108038696B publication Critical patent/CN108038696B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2101/00Indexing scheme associated with group H04L61/00
    • H04L2101/60Types of network addresses
    • H04L2101/618Details of network addresses
    • H04L2101/622Layer-2 addresses, e.g. medium access control [MAC] addresses
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2101/00Indexing scheme associated with group H04L61/00
    • H04L2101/60Types of network addresses
    • H04L2101/618Details of network addresses
    • H04L2101/654International mobile subscriber identity [IMSI] numbers

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出一种基于设备标识码和社交群组信息的刷单检测方法及系统,获取社交平台上的社交群组信息及电商平台上一定时间段内消费者与商品的交互信息;社交群组信息包括社交账号、社交账号所在群组、社交账号发生社交联系时所使用的设备标识码;交互信息包括交互账号、交互商品标识、交互账号发生交互时所使用的设备标识码;根据设备标识码之间的关联,将各个社交账号与交互账号进行匹配;获取一商品的待检测的若干交易记录,选取若干发生交易的交互账号对应的社交账号,判断是否存在群组关系,如果存在若干社交账号所在群组相同,则对应的交易被初判为刷单交易。可有效检测刷单组织通过社交平台软件进行的有组织刷单行为。

Description

基于设备标识码和社交群组信息的刷单检测方法及系统
技术领域
本发明涉及电子商务信息技术领域,尤其涉及的是一种基于设备标识码和社交群组信息的刷单检测方法及系统。
背景技术
在电子商务飞速发展的今天,网上购物已经变得十分普及,消费者在享受电子商务带来便捷的同时,也深受电子商务发展过快所带来的信誉欺诈问题的影响。目前,刷单问题已成为电商发展重要的障碍,尤其是刷单被骗事件的发生,更是破坏了电子商务的信任机制和公平竞争的市场秩序,严重阻碍了电子商务行业的健康发展。
电商刷单是指电商卖家采用虚假交易、评论作假等的方式,迅速提升销量、信誉度、好评率等数据指标,来赢得平台较好推广流量资源并吸引消费者注意的营销手段。
第三方刷单平台指通过互联网招募、培训并组织人员专门为电商卖家提供“刷单”服务,并向卖家收取佣金的第三方平台。目前的刷单流程一般为:第三方刷单平台接到刷单需求后,招募一大批刷单的水军通过账号的形式进入语音群组中,由管理员发布刷单通告,然后群员自行抢单,然后刷单者根据抢到的订单去相应的网络店铺模仿真实买家购买相应商品并对该交易进行支付。
长期以来,政府管理部门、各大电商平台及支付平台采用各种管理和技术手段,对虚假交易的行为和第三方刷单平台进行甄别和严厉打击。传统的虚假交易甄别方法往往基于某一商品的订单量在某段时间内的异常增长、大量相同访问IP及相同物流编号、大量购买地与收货地不是相同地点、订单确认及评价时效对刷单行为进行识别。然而,随着虚假交易产业链的形成,各种刷单行为更加隐蔽,也更加专业化,出现了各种专业刷单的组织和逃避刷单甄别系统的操作方法,网上大量第三方专业刷单平台刷单流程极为严格,几乎完全模仿真实网购购物流程,甚至安排刷单操作者与卖家进行“假聊”以逃避监管。同时其通过线上语音软件招募培训兼职刷单者,在接到需求刷单卖家订单后再分配任务,已形成完整严密的灰色产业链。传统的虚假交易甄别方法在应对这类有组织的新型虚假交易时,往往束手无策。
发明内容
本发明所要解决的技术问题是提供一种基于设备标识码和社交群组信息的刷单检测方法及系统,可有效检测刷单组织通过社交平台软件进行的有组织刷单行为。
为解决上述问题,本发明提出一种基于设备标识码和社交群组信息的刷单检测方法,包括以下步骤:
S1:获取社交平台上的社交群组信息及电商平台上一定时间段内消费者与商品的交互信息;所述社交群组信息包括社交账号、社交账号所在群组、社交账号发生社交联系时所使用的设备标识码;所述交互信息包括交互账号、交互商品标识、交互账号发生交互时所使用的设备标识码;
S2:根据所述社交账号发生社交联系时所使用的设备标识码与交互账号发生交互时所使用的设备标识码之间的关联,将各个社交账号与交互账号进行匹配;
S3:获取一商品的待检测的若干交易记录,选取若干发生交易的交互账号对应的社交账号,判断是否存在群组关系,如果存在若干社交账号所在群组相同,则对应的交易被初判为刷单交易。
根据本发明的一个实施例,所述步骤S2包括:
步骤S21:针对各个社交账号,将登陆过相同社交账号的各个社交设备的设备标识码与对应的社交账号之间相互绑定,或者,将登陆过相同社交账号的各个社交设备的设备标识码与对应的社交账号之间相互绑定、且各个社交设备的设备标识码之间也相互绑定;
步骤S22:针对各个交互账号,将登陆过相同交互账号的各个交互设备的设备标识码与对应的交互账号之间相互绑定,或者,将登陆过相同交互账号的各个交互设备的设备标识码与对应的交互账号之间相互绑定、且各个交互设备的设备标识码之间也相互绑定;
步骤S23:若社交设备的设备标识码与交互设备的设备标识码相同或者存在绑定关系,则将对应的社交账号与对应的交互账号进行匹配。
根据本发明的一个实施例,所述交互账号包括购物账号和/或支付账号;
在交互账号为购物账号和支付账号时,所述步骤S22中,还将所述购物账号与支付账号相互绑定,并将登陆过相同交互账号的各个交互设备的设备标识码与对应的购物账号或支付账号之间相互绑定。
根据本发明的一个实施例,所述设备标识码包括:手机号码、手机设备的IMEI码、个人电脑的MAC地址、平板电脑的MAC地址中的一种或几种。
根据本发明的一个实施例,所述步骤S3之后还包括步骤S4:
针对所述步骤S3中初判为刷单交易的交易,检测其对应的存在群组关系的社交账号之间是否存在好友关系,若该群组中存在好友关系的社交账号达到预设比率,则判定为非刷单交易,否则判定为刷单交易。
根据本发明的一个实施例,所述好友关系的判断包括:
根据最近一年社交关联发生频率γy和最近一个月社交发生频率γm计算社交账号之间的社交关联的强弱程度β=(γym);
若社交关联的强弱程度β达到预设程度值,则为好友关系,否则为非好友关系。
根据本发明的一个实施例,所述步骤S4之后还包括步骤S5:
针对所述步骤S4中被判定为刷单交易的交易,通过基于通用评价特征的决策树对其是否是刷单交易进行进一步的判定。
根据本发明的一个实施例,所述基于通用评价特征的决策树的构建步骤包括:
A1:设定刷单交易的判定标准,将具有以下特征的评价行为判定为群组刷单交易:评价率超过第一预设阈值、好评率超过第二预设阈值、且第一时间评价率超过第三预设阈值;
A2:从多笔刷单交易中提取属性特征并生成训练数据集,所述属性特征包括评价率、好评率、第一时间评价率;
A3:结合步骤A1的判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造所述基于通用评价特征的决策树。
根据本发明的一个实施例,所述步骤S5包括:
S51:针对所述步骤S4中被判定为刷单交易的交易,获取对应的商品评价信息,包括评价率、评价好坏、评价的及时程度;
S52:根据商品评价信息计算评价率、好评率、第一时间评价率,并根据计算结果通过所述基于通用评价特征的决策树判定该交易是否为刷单交易。
本发明还提供一种计算机装置,包括存储器和处理器以及存储在存储器上并可被处理器调用的计算机程序,所述处理器执行所述计算机程序时,实现如前述实施例中任意一项所述的基于设备标识码和社交群组信息的刷单检测方法。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现如前述实施例中任意一项所述的基于设备标识码和社交群组信息的刷单检测方法。
本发明还提供一种基于设备标识码和社交群组信息的刷单检测系统,包括:
信息获取模块,执行获取社交平台上的社交群组信息及电商平台上一定时间段内消费者与商品的交互信息;所述社交群组信息包括社交账号、社交账号所在群组、社交账号发生社交联系时所使用的设备标识码;所述交互信息包括交互账号、交互商品标识、交互账号发生交互时所使用的设备标识码;
账号匹配模块,执行根据所述社交账号发生社交联系时所使用的设备标识码与交互账号发生交互时所使用的设备标识码之间的关联,将各个社交账号与交互账号进行匹配;
刷单初判模块,执行获取一商品的待检测的若干交易记录,选取若干发生交易的交互账号对应的社交账号,判断是否存在群组关系,如果存在若干社交账号所在群组相同,则对应的交易被初判为刷单交易。
根据本发明的一个实施例,所述基于设备标识码和社交群组信息的刷单检测系统还包括:
刷单二判模块,执行针对所述刷单初判模块中初判为刷单交易的交易,检测其对应的存在群组关系的社交账号之间是否存在好友关系,若该群组中存在好友关系的社交账号达到预设比率,则判定为非刷单交易,否则判定为刷单交易。
根据本发明的一个实施例,所述基于设备标识码和社交群组信息的刷单检测系统还包括:
刷单三判模块,针对所述刷单二判模块中被判定为刷单交易的交易,通过基于通用评价特征的决策树对其是否是刷单交易进行进一步的判定。
采用上述技术方案后,本发明相比现有技术具有以下有益效果:
针对现有技术在面对新型有组织刷单时所表现出无法准确甄别高度拟真刷单行为的缺陷,引入社交群组的概念,通过判断交互账号所对应的社交账号是否存在群组关系,从而检测出大量通过社交软件之间的内在组织和关联模式实现的刷单行为;
可有效克服现有虚假交易甄别系统在新型虚假交易采用真实物流编号、真实交易行为、真实购买人和收件人信息掩盖虚假交易行为的情况下导致侦测失效的问题。
附图说明
图1为本发明一实施例的基于设备标识码和社交群组信息的刷单检测方法的流程示意图;
图2为本发明另一实施例的基于设备标识码和社交群组信息的刷单检测方法的流程示意图;
图3为本发明又一实施例的基于设备标识码和社交群组信息的刷单检测方法的流程示意图;
图4为本发明一实施例的基于通用评价特征的决策树的示意图;
图5为本发明一实施例的社交账号与交互账号的匹配关系示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施的限制。
参看图1,在一个实施例中,基于设备标识码和社交群组信息的刷单检测方法,包括以下步骤:
S1:获取社交平台上的社交群组信息及电商平台上一定时间段内消费者与商品的交互信息;所述社交群组信息包括社交账号、社交账号所在群组、社交账号发生社交联系时所使用的设备标识码;所述交互信息包括交互账号、交互商品标识、交互账号发生交互时所使用的设备标识码;
S2:根据所述社交账号发生社交联系时所使用的设备标识码与交互账号发生交互时所使用的设备标识码之间的关联,将各个社交账号与交互账号进行匹配;
S3:获取一商品的待检测的若干交易记录,选取若干发生交易的交互账号对应的社交账号,判断是否存在群组关系,如果存在若干社交账号所在群组相同,则对应的交易被初判为刷单交易。
下面对本发明实施例的基于设备标识码和社交群组信息的刷单检测方法进行更具体的描述,但不应以此为限。
在步骤S1中,获取社交平台上的社交群组信息及电商平台上一定时间段内消费者与商品的交互信息。社交平台可以不止一个,可以将多个社交平台均纳入本发明实施例中。电商平台具体不限,商品当然也不限,本发明中,每次可以仅针对一个商品进行该商品下的刷单交易判定,但是也不限于此,当然也可以多个商品并行进行判定等等。上述的一定时间段可以根据需要设定,例如是几天。可以通过大数据技术来实现上述这些信息的获取。
社交群组信息包括社交账号、社交账号所在群组、社交账号发生社交联系时所使用的设备标识码,当然不限于此。社交账号发生社交联系时使用的设备可以包括手机、电脑、平板等,其对应的设备标识码可以包括手机号码、手机设备IMEI码、个人电脑的MAC地址、平板电脑的MAC地址等。社交平台可以是YY平台、QT平台、QQ、微信等等,群组可以是语音群组、QQ群组、微信群等。
所述交互信息包括交互账号、交互商品标识、交互账号发生交互时所使用的设备标识码。当然,交互信息当然不限于此,电商平台上用户产生的交互信息,可以为用户浏览商品、购买商品以及对相应交易进行支付时提交的信息,交互信息可以包含购物平台的购物账号、所浏览商品的SKU编号(库存编号,可以作为交易商品标识)、所购买商品的SKU编号、支付平台的支付账号、交互时使用的设备以及相应的设备标识码。设备例如可以包括手机、电脑、平板等,相应的设备标识码可以包括手机号码、手机设备IMEI码、个人电脑的MAC地址、平板电脑的MAC地址。电商平台例如是淘宝、京东、聚美等等不限。交互信息可以包括消费者交易商品时产生的交易记录信息,还可以包括消费者在浏览商品是产生的商品浏览信息等。
将需要的信息获取收集之后,接着执行步骤S2,参看图5,根据所述社交账号发生社交联系时所使用的设备标识码与交互账号发生交互时所使用的设备标识码之间的关联,将各个社交账号与交互账号进行匹配。
可选的,设备标识码包括:手机号码、手机设备的IMEI码、个人电脑的MAC地址、平板电脑的MAC地址中的一种或几种。通常来说,用户可能拥有不同的设备或者更换新的设备使用等,因而会用不同的设备登录相同的社交账号或交互账号,在此情况下会有多个社交设备的设备标识码与对应的社交账号关联、及多个交互设备的设备标识码与对应的交互账号关联,可以将这些设备标识码均与对应的账号进行绑定或者这些设备标识码之间也可以相互绑定。在只有一个账号只关联设备标识码时,则将两者绑定即可。由于无论登录哪个平台,设备的设备标识码是不会变的,因而可以通过设备标识码来识别社交账号和交互账号是否为同一个用户,从而将两者匹配起来。
进一步的,步骤S2包括以下步骤:
步骤S21:针对各个社交账号,将登陆过相同社交账号的各个社交设备的设备标识码与对应的社交账号之间相互绑定,或者,将登陆过相同社交账号的各个社交设备的设备标识码与对应的社交账号之间相互绑定、且各个社交设备的设备标识码之间也相互绑定。登陆过相同社交账号的社交设备,包括手机、个人电脑、平板电脑等,为相关联的设备,例如用户用自己的手机和电脑以及平板电脑均登陆过同一个QQ账号,则获取到的社交信息中包含QQ账号、用户的手机号码、用户手机的IMEI码、用户电脑的MAC地址、平板电脑的MAC地址。将用户的手机号码、用户手机的IMEI码、用户电脑的MAC地址、平板电脑的MAC地址与该QQ账号绑定。
步骤S22:针对各个交互账号,将登陆过相同交互账号的各个交互设备的设备标识码与对应的交互账号之间相互绑定,或者,将登陆过相同交互账号的各个交互设备的设备标识码与对应的交互账号之间相互绑定、且各个交互设备的设备标识码之间也相互绑定。登陆过相同交互账号的设备例如手机、电脑、平板电脑,为相关联的设备。例如用户用自己的手机和电脑以及平板电脑均登陆过同一个购物账号(例如淘宝账号、京东账号等),则系统获取到的交互信息中包含用户的手机号码、购物账号、用户手机的IMEI码、用户电脑的MAC地址、平板电脑的MAC地址。
可选的,交互账号包括购物账号和/或支付账号。在交互账号为购物账号或支付账号时,只要将设备标志码与对应的账号绑定起来即可。在交互账号为购物账号和支付账号时,所述步骤S22中,还将所述购物账号与支付账号相互绑定,将登陆过相同交互账号的各个交互设备的设备标识码与对应的购物账号或支付账号之间相互绑定。换言之,若获取到的交互信息中还包括支付账号(如支付宝账号),则将购物账号与支付账号绑定,并将登陆过同一个支付账号的设备的设备标识码与登陆过购物账号的设备的设备标识码绑定。
步骤S23:若社交设备的设备标识码与交互设备的设备标识码相同或者存在绑定关系,则将对应的社交账号与对应的交互账号进行匹配。换言之,检测社交设备的设备标识码与交互设备的设备标识码,若社交设备的设备标识码和交互设备的设备标识码相同或存在绑定关系,则将相应的社交账号与相应的交互账号相对应匹配。存在绑定关系是指,两者之间直接绑定,或者两者与同一账号绑定。
这一步骤,基于用户的交互信息和社交信息,通过账号和设备的设备标识码之间的关联关系,找出了与交互账号对应的社交账号。
接着执行步骤S3,获取一商品的待检测的若干交易记录(购买记录),可以是最近一段时间内的全部或部分交易记录。从这些交易记录的交互账号中,选取若干发生交易的交互账号,可以是发生交易的全部或部分的交互账号,从而可以确定其对应的社交账号,继而通过社交群组信息判断这些社交账号之间是否存在群组关系,如果存在若干社交账号所在群组相同,则对应的交易被初判为刷单交易。该行为为刷单公司通过社交群组组织的刷单行为。
在一个实施例中,参看图2,步骤S3之后还包括步骤S4:
针对所述步骤S3中初判为刷单交易的交易,检测其对应的存在群组关系的社交账号之间是否存在好友关系,若该群组中存在好友关系的社交账号达到预设比率,则判定为非刷单交易,否则判定为刷单交易。
可以将步骤S3中初步判断为刷单的交易再进行与社交网络传播带来的真实购买行为进行甄别。
优选的,好友关系的判断包括:
根据最近一年社交关联发生频率γy和最近一个月社交发生频率γm计算社交账号之间的社交关联的强弱程度β=(γym);
若社交关联的强弱程度β达到预设程度值,则为好友关系,否则为非好友关系。
步骤S4具体可以是,分别用参数γy对最近一年关联发生的频率进行定义、γm对最近一月关联发生的频率进行定义。从获取到的社交软件上的社交群组信息按照评分规则对参数γy、γm进行取值,两个参数对应的评分规则可以如下表(1),但不作为限制。
Figure BDA0001491409140000101
Figure BDA0001491409140000111
表(1)
用户间社交关联的强弱程度β按下式计算:
β=(γym) (1)
按照预设规则并结合β的取值对账号间是否存在好友关系进行区分,其中预设的规则可以如下:
Figure BDA0001491409140000112
若存在群组关系的账号总数为m,其中存在至少一个好友关系的账号数为n,存在好友关系的账号数占群组中总账号数的比率:
Figure BDA0001491409140000113
Figure BDA0001491409140000114
在一个实施例中,参看图3,所述步骤S4之后还包括步骤S5:
针对所述步骤S4中被判定为刷单交易的交易,通过基于通用评价特征的决策树对其是否是刷单交易进行进一步的判定。
对于在步骤S4中被判为刷单的多笔交易,再基于通用评价特征的决策树对其是否是刷单进行进一步的判定,通用评价特征是指不分用户的评价特征,对于各个用户的以往评价数据均可作为特征的数据来源。
优选的,基于通用评价特征的决策树的构建步骤包括:
A1:设定刷单交易的判定标准,将具有以下特征的评价行为判定为群组刷单交易:评价率超过第一预设阈值、好评率超过第二预设阈值、且第一时间评价率超过第三预设阈值;评价率高、好评多且评价及时均可以进行设置,上述特征均可以通过设置的规则来划分确定。
A2:从多笔刷单交易中提取属性特征并生成训练数据集,所述属性特征包括评价率、好评率、第一时间评价率;评价率即评价笔数与成交笔数的比率,好评率即给出好评的笔数与总评价笔数的比率,第一时间评价率即第一时间给出评价的笔数与总评价笔数的比率,第一时间可以根据需要来设定。
A3:结合步骤A1的判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造所述基于通用评价特征的决策树。信息增益可以对属性特征进行一定的定量,可以通过信息学知识来计算信息增益,在此不再赘述。本发明实施例构成的决策树如图2所示。
优选的,步骤S5包括:
S51:针对所述步骤S4中被判定为刷单交易的交易,获取对应的商品评价信息,包括评价率、评价好坏、评价的及时程度;
S52:根据商品评价信息计算价率、好评率、第一时间评价率,并根据计算结果通过所述基于通用评价特征的决策树判定该交易是否为刷单交易。
根据获取到的商家某一商品中与所述交互账号相关的商品评价信息,包括评价率、评价好坏、评价的及时程度,通过该决策树对上述交易进行判定是刷单行为还是社交群传播购买行为(即非刷单行为)。
下面结合一个具体实施例对本发明进一步解释:
获取到YY语音平台上10个账号对应的历史社交信息如下表(2):
Figure BDA0001491409140000121
Figure BDA0001491409140000131
表(2)
将表(2)中登陆过同一个YY语音账号的设备及设备标识码(即表中的同一行的设备及设备标识码)互相绑定并与YY语音账号绑定。
获取到淘宝上100名用户的历史交易信息,将100名用户登陆过其淘宝账号的设备及设备标识码互相绑定并与淘宝账号绑定,下面以其中10个用户为例进行说明,10个用户的历史交互信息如下表(3):
Figure BDA0001491409140000132
Figure BDA0001491409140000141
表(3)
将表(3)中登陆过同一个淘宝账号的设备及设备标识码(即表中同一行的设备及设备标识码)互相绑定并与对应的淘宝账号绑定。
获取淘宝上某个店铺上某双鞋子一天内的10笔交易记录,详细信息如下表(4):
Figure BDA0001491409140000142
Figure BDA0001491409140000151
表(4)
①、对于第一笔交易:其使用设备为平板电脑,且MAC地址为3C:D0:F8:2C:99:A2,查找表(3)中与该MAC地址绑定的设备标识码为手机号码13205812397和手机IMEI码354717046702222,在表(2)中查找与3C:D0:F8:2C:99:A2和/或13205812397和/或354717046702222相同或者绑定的设备标识码,找到表(2)中序号为2那一行的设备标识码,包括手机IMEI码:354717046702222和平板电脑MAC地址:3C:D0:F8:2C:99:A2,其YY语音账号为lisi@qq.com
②、对于第二笔交易,其使用的设备为电脑,且电脑的MAC地址为00-01-6C-5D-46-93,查找表(3)中与该MAC地址绑定的设备标识码为手机号码:13100002345和手机IMEI码:866723019683291,在表(2)中查找与00-01-6C-5D-46-93和/或13100002345和/或866723019683291相同或绑定的设备标识码,找到表(2)中序号为1那一行的设备标识码,包括手机号码:13100002345和手机IMEI码866723019683291以及电脑MAC地址00-01-6C-5D-46-93,其YY语音账号为zhangsan@qq.com
③、对于第三笔交易,其使用的设备为电脑,且其电脑的MAC地址为00-0C-29-58-99-11,查找表(3)中没有其他设备标识码与该地址绑定,在表(2)中查找与00-0C-29-58-99-11相同或绑定的设备标识码,找到表(2)中序号为4那一行的设备标识码,包括电脑MAC地址:00-0C-29-58-99-11和平板电脑MAC地址4E:33:4B:33:AB:6H,其YY语音账号为xiaohong@126.com
④、对于第四笔交易,其使用的设备为手机,其对应的设备标识码包括手机号:15821052670和手机IMEI码:860859027401111,查找表(3)中与该手机号和手机IMEI码绑定的设备标识码为00-19-21-C4-BA-DB,查找表(2)中与手机号:15821052670和手机IMEI码:860859027401111以及MAC地址00-19-21-C4-BA-DB相同或绑定的设备标识码,找到序号为10的那一行中的设备标识码,包括手机IMEI码860859027401111和电脑MAC地址00-19-21-C4-BA-DB,其对应的YY语音账号为Abc1256@126.com
⑤对于第五笔交易,其使用的设备为平板电脑,且MAC地址为C8:33:4B:33:AB:D7,查找表(3)中与该MAC地址绑定的设备标识码为手机号13958013467和手机IMEI码012425003304271,查找表(2)中与C8:33:4B:33:AB:D7和/或012425003304271相同或绑定的设备标识码,找到表(2)中序号为3的那一行,其对应的YY语音账号为wangwu@163.com
⑥对于第六笔交易,其使用的设备为手机其手机IMEI码为863664000059021,查找表(3)中与其绑定的设备标识码,为平板电脑的MAC地址5B:3D:11:CD:5E:6C。查找表(2)中与863664000059021和/或5B:3D:11:CD:5E:6C相同或绑定的设备标识码,找到表(2)中序号为6的那一行,其对应的YY语音账号为xiaoming@qq.com
⑦同理,对于第7、8、9、10笔交易,第7笔交易对应的YY语音账号为23657890、第8笔交易对应的YY语音账号为xiaohua@163.com、第9笔交易对应的YY语音账号为78459944、第10笔交易对应的YY语音账号为654987321。
根据上述步骤找到的YY语音账号,结合表(2)中YY语音账号所在的群组信息,找到各个YY语音账号存在的群组关系。
将表(2)中的群组取交集,发现zhangsan@qq.comwangwu@163.comxiaohong@ 126.com、23657890、xiaoming@qq.com、78459944、xiaohua@163.com这7个YY语音账号存在群组关系,则将第1、3、4、5、6、7、9这7笔交易初步判定为刷单。
再考虑存在群组关系的这7个YY语音账号之间是否存在好友关系,本发明实施例中,可通过手机号码之间联系的信息和YY语音账号之间联系的信息来综合判断其用户间是否存在好友关系,具体信息如下表(5):
Figure BDA0001491409140000171
表(5)
基于上表(5)和计算β公式,计算用户间社交关联的强弱程度:
βAB=0.2;βBC=1.3;βCD=0.2;βDE=0.1;βEF=0.4;βFG=1.3;βAG=0.2……其中,βAB为用户A与用户B之间的社交关联强度,βAC为用户A与用户C之间的社交关联强度,依此类推。
并根据
Figure BDA0001491409140000172
判断,B与C之间为好友,F与G之间为好友,依次将各个好友关系计算出来。之后计算存在好友关系的账号数占群组中总账号数的比率
Figure BDA0001491409140000173
例如通过好友关系计算后,n为8,m为10,则p为0.8。
Figure BDA0001491409140000181
从而判定该交易为刷单交易。
对上述步骤中判定为刷单的交易再经过基于通用评价特征的决策树对其是否是刷单进行进一步的判定,具体步骤如下:获取被判为刷单的交易,假如上面那个步骤中判定出5笔交易为疑似刷单,则获取这5笔交易的评价记录信息,如下表(6):
Figure BDA0001491409140000182
表(6)
通过设置具体的评价率阈值例如0.8、好评率阈值0.9、第一时间评价率阈值0.5,第一时间可以设定为3小时以内,因为刷单一般都会非常及时给出评价。根据获取到的表(6)的信息再在决策树上过一遍,则可以将上述5笔被判为疑似刷单的交易进行最后的刷单还是非刷单的判断。
本发明还提供一种计算机装置,包括存储器和处理器以及存储在存储器上并可被处理器调用的计算机程序,所述处理器执行所述计算机程序时,实现如前述实施例中任意一项所述的基于设备标识码和社交群组信息的刷单检测方法。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现如前述实施例中任意一项所述的基于设备标识码和社交群组信息的刷单检测方法。
本发明还提供一种基于设备标识码和社交群组信息的刷单检测系统,包括:
信息获取模块,执行获取社交平台上的社交群组信息及电商平台上一定时间段内消费者与商品的交互信息;所述社交群组信息包括社交账号、社交账号所在群组、社交账号发生社交联系时所使用的设备标识码;所述交互信息包括交互账号、交互商品标识、交互账号发生交互时所使用的设备标识码;
账号匹配模块,执行根据所述社交账号发生社交联系时所使用的设备标识码与交互账号发生交互时所使用的设备标识码之间的关联,将各个社交账号与交互账号进行匹配;
刷单初判模块,执行获取一商品的待检测的若干交易记录,选取若干发生交易的交互账号对应的社交账号,判断是否存在群组关系,如果存在若干社交账号所在群组相同,则对应的交易被初判为刷单交易。
根据本发明的一个实施例,所述基于设备标识码和社交群组信息的刷单检测系统还包括:
刷单二判模块,执行针对所述刷单初判模块中初判为刷单交易的交易,检测其对应的存在群组关系的社交账号之间是否存在好友关系,若该群组中存在好友关系的社交账号达到预设比率,则判定为非刷单交易,否则判定为刷单交易。
根据本发明的一个实施例,所述基于设备标识码和社交群组信息的刷单检测系统还包括:
刷单三判模块,针对所述刷单二判模块中被判定为刷单交易的交易,通过基于通用评价特征的决策树对其是否是刷单交易进行进一步的判定。
关于本发明的基于设备标识码和社交群组信息的刷单检测系统的具体内容可以参看前述实施例中基于设备标识码和社交群组信息的刷单检测方法部分的描述,在此不再赘述。
本发明实施例可以通过获取交易信息和社交信息,基于电脑端软件(WEB页面等)或者手机端软件在不同设备相同/不同时刻的登录记录信息进行匹配,通过使用设备的设备标识码找到交互账号与社交账号之间的对应关系,再判断与交互账号对应的社交账号之间是否存在群组关系,从而检测出大量通过社交软件之间的内在组织和关联模式实现的刷单行为。
本发明实施例可有效克服现有虚假交易甄别系统采用传统刷单特征的识别方法无法甄别虚假交易产业链采用真实物流编号、真实交易行为、真实购买人和收件人信息进行的高度拟真特征刷单活动的缺陷,可有效检测刷单组织通过社交平台软件进行的有组织刷单行为。
本发明虽然以较佳实施例公开如上,但其并不是用来限定权利要求,任何本领域技术人员在不脱离本发明的精神和范围内,都可以做出可能的变动和修改,因此本发明的保护范围应当以本发明权利要求所界定的范围为准。

Claims (11)

1.一种基于设备标识码和社交群组信息的刷单检测方法,其特征在于,包括以下步骤:
S1:获取社交平台上的社交群组信息及电商平台上一定时间段内消费者与商品的交互信息;所述社交群组信息包括社交账号、社交账号所在群组、社交账号发生社交联系时所使用的设备标识码;所述交互信息包括交互账号、交互商品标识、交互账号发生交互时所使用的设备标识码;
S2:根据所述社交账号发生社交联系时所使用的设备标识码与交互账号发生交互时所使用的设备标识码之间的关联,将各个社交账号与交互账号进行匹配;
S3:获取一商品的待检测的若干交易记录,选取若干发生交易的交互账号对应的社交账号,判断是否存在群组关系,如果存在若干社交账号所在群组相同,则对应的交易被初判为刷单交易;
S4:针对所述步骤S3中初判为刷单交易的交易,检测其对应的存在群组关系的社交账号之间是否存在好友关系,若该群组中存在好友关系的社交账号达到预设比率,则判定为非刷单交易,否则判定为刷单交易;其中好友关系的判断包括:
根据最近一年社交关联发生频率
Figure 58590DEST_PATH_IMAGE002
和最近一个月社交发生频率
Figure 15876DEST_PATH_IMAGE004
计算社交账号之间的社交关联的强弱程度
Figure 467717DEST_PATH_IMAGE006
若社交关联的强弱程度
Figure 659664DEST_PATH_IMAGE008
达到预设程度值,则为好友关系,否则为非好友关系。
2.如权利要求1所述的基于设备标识码和社交群组信息的刷单检测方法,其特征在于,所述步骤S2包括:
步骤S21:针对各个社交账号,将登陆过相同社交账号的各个社交设备的设备标识码与对应的社交账号之间相互绑定,或者,将登陆过相同社交账号的各个社交设备的设备标识码与对应的社交账号之间相互绑定、且各个社交设备的设备标识码之间也相互绑定;
步骤S22:针对各个交互账号,将登陆过相同交互账号的各个交互设备的设备标识码与对应的交互账号之间相互绑定,或者,将登陆过相同交互账号的各个交互设备的设备标识码与对应的交互账号之间相互绑定、且各个交互设备的设备标识码之间也相互绑定;
步骤S23:若社交设备的设备标识码与交互设备的设备标识码相同或者存在绑定关系,则将对应的社交账号与对应的交互账号进行匹配。
3.如权利要求2所述的基于设备标识码和社交群组信息的刷单检测方法,其特征在于,所述交互账号包括购物账号和/或支付账号;
在交互账号为购物账号和支付账号时,所述步骤S22中,还将所述购物账号与支付账号相互绑定,并将登陆过相同交互账号的各个交互设备的设备标识码与对应的购物账号或支付账号之间相互绑定。
4.如权利要求1所述的基于设备标识码和社交群组信息的刷单检测方法,其特征在于,所述设备标识码包括:手机号码、手机设备的IMEI码、个人电脑的MAC地址、平板电脑的MAC地址中的一种或几种。
5.如权利要求1所述的基于设备标识码和社交群组信息的刷单检测方法,其特征在于,所述步骤S4之后还包括步骤S5:
针对所述步骤S4中被判定为刷单交易的交易,通过基于通用评价特征的决策树对其是否是刷单交易进行进一步的判定;其中,基于通用评价特征的决策树的构建步骤包括:
A1:设定刷单交易的判定标准,将具有以下特征的评价行为判定为群组刷单交易:评价率超过第一预设阈值、好评率超过第二预设阈值、且第一时间评价率超过第三预设阈值;
A2:从多笔刷单交易中提取属性特征并生成训练数据集,所述属性特征包括评价率、好评率、第一时间评价率;
A3:结合步骤A1的判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造所述基于通用评价特征的决策树。
6.如权利要求5所述的基于设备标识码和社交群组信息的刷单检测方法,其特征在于,所述步骤S5包括:
S51:针对所述步骤S4中被判定为刷单交易的交易,获取对应的商品评价信息,包括评价率、评价好坏、评价的及时程度;
S52:根据商品评价信息计算评价率、好评率、第一时间评价率,并根据计算结果通过所述基于通用评价特征的决策树判定该交易是否为刷单交易。
7.一种计算机装置,包括存储器和处理器以及存储在存储器上并可被处理器调用的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-6中任意一项所述的刷单检测方法。
8.一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现如权利要求1-6中任意一项所述的基于设备标识码和社交群组信息的刷单检测方法。
9.一种基于设备标识码和社交群组信息的刷单检测系统,其特征在于,包括:
信息获取模块,执行获取社交平台上的社交群组信息及电商平台上一定时间段内消费者与商品的交互信息;所述社交群组信息包括社交账号、社交账号所在群组、社交账号发生社交联系时所使用的设备标识码;所述交互信息包括交互账号、交互商品标识、交互账号发生交互时所使用的设备标识码;
账号匹配模块,执行根据所述社交账号发生社交联系时所使用的设备标识码与交互账号发生交互时所使用的设备标识码之间的关联,将各个社交账号与交互账号进行匹配;
刷单初判模块,执行获取一商品的待检测的若干交易记录,选取若干发生交易的交互账号对应的社交账号,判断是否存在群组关系,如果存在若干社交账号所在群组相同,则对应的交易被初判为刷单交易。
10.如权利要求9所述的基于设备标识码和社交群组信息的刷单检测系统,其特征在于,还包括:
刷单二判模块,执行针对所述刷单初判模块中初判为刷单交易的交易,检测其对应的存在群组关系的社交账号之间是否存在好友关系,若该群组中存在好友关系的社交账号达到预设比率,则判定为非刷单交易,否则判定为刷单交易。
11.如权利要求10所述的基于设备标识码和社交群组信息的刷单检测系统,其特征在于,还包括:
刷单三判模块,针对所述刷单二判模块中被判定为刷单交易的交易,通过基于通用评价特征的决策树对其是否是刷单交易进行进一步的判定;其中,基于通用评价特征的决策树的构建包括:
设定刷单交易的判定标准,将具有以下特征的评价行为判定为群组刷单交易:评价率超过第一预设阈值、好评率超过第二预设阈值、且第一时间评价率超过第三预设阈值;
从多笔刷单交易中提取属性特征并生成训练数据集,所述属性特征包括评价率、好评率、第一时间评价率;
结合设定刷单交易的判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造所述基于通用评价特征的决策树。
CN201711254621.2A 2017-12-01 2017-12-01 基于设备标识码和社交群组信息的刷单检测方法及系统 Active CN108038696B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711254621.2A CN108038696B (zh) 2017-12-01 2017-12-01 基于设备标识码和社交群组信息的刷单检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711254621.2A CN108038696B (zh) 2017-12-01 2017-12-01 基于设备标识码和社交群组信息的刷单检测方法及系统

Publications (2)

Publication Number Publication Date
CN108038696A CN108038696A (zh) 2018-05-15
CN108038696B true CN108038696B (zh) 2020-12-01

Family

ID=62095384

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711254621.2A Active CN108038696B (zh) 2017-12-01 2017-12-01 基于设备标识码和社交群组信息的刷单检测方法及系统

Country Status (1)

Country Link
CN (1) CN108038696B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109636413A (zh) * 2018-11-23 2019-04-16 杭州优行科技有限公司 一种存储介质、服务器、刷单行为识别方法及装置
CN111414406B (zh) * 2019-01-04 2021-06-04 上海嗨普智能信息科技股份有限公司 一种用于识别不同渠道事务中的相同用户的方法和系统
CN110175851B (zh) * 2019-02-28 2023-09-12 腾讯科技(深圳)有限公司 一种作弊行为检测方法及装置
CN110191378A (zh) * 2019-06-17 2019-08-30 深圳市慧智慧科技有限公司 一种对讲通讯方法、装置、系统、存储介质和对讲机
CN110225422A (zh) * 2019-06-17 2019-09-10 深圳市慧智慧科技有限公司 一种对讲通讯方法、装置、系统、存储介质和对讲机
CN110288358A (zh) * 2019-06-20 2019-09-27 武汉斗鱼网络科技有限公司 一种设备团体确定方法、装置、设备及介质
CN110533432B (zh) * 2019-07-19 2022-03-25 重庆小雨点小额贷款有限公司 一种业务处理方法、装置、服务器及客户端
CN112308352A (zh) * 2019-07-30 2021-02-02 阿里巴巴集团控股有限公司 一种订单识别方法、装置及电子设备
CN110795723A (zh) * 2019-11-08 2020-02-14 浙江执御信息技术有限公司 一种判断是否刷单的方法
WO2021253253A1 (zh) * 2020-06-17 2021-12-23 深圳市欢太科技有限公司 业务数据处理方法、装置、电子设备以及存储介质
CN114091837A (zh) * 2021-10-27 2022-02-25 浪潮卓数大数据产业发展有限公司 一种基于电商数据进行店铺评分的方法及系统
CN114626899B (zh) * 2022-05-13 2022-11-18 南京铋悠数据技术有限公司 基于大数据的产品销售数据采集方法和系统
CN116385029B (zh) * 2023-04-20 2024-01-30 深圳市天下房仓科技有限公司 酒店刷单检测方法、系统、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150061540A (ko) * 2013-11-26 2015-06-04 주식회사 씽크풀 허위판매 방지 시스템 및 그 제공방법
CN107146089A (zh) * 2017-03-29 2017-09-08 北京三快在线科技有限公司 一种刷单识别方法及装置,电子设备
CN107169768A (zh) * 2016-03-07 2017-09-15 阿里巴巴集团控股有限公司 异常交易数据的获取方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150061540A (ko) * 2013-11-26 2015-06-04 주식회사 씽크풀 허위판매 방지 시스템 및 그 제공방법
CN107169768A (zh) * 2016-03-07 2017-09-15 阿里巴巴集团控股有限公司 异常交易数据的获取方法和装置
CN107146089A (zh) * 2017-03-29 2017-09-08 北京三快在线科技有限公司 一种刷单识别方法及装置,电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
网络刷单行为的刑法规制研究;阴建峰等;《知与行》;20161031;正文第55页第3-5段 *
面向产品垃圾评论识别的特征工程;曾德胜等;《福建师范大学学报(自然科学版)》;20170430;参见正文第26页第2-3段,第27-29页 *

Also Published As

Publication number Publication date
CN108038696A (zh) 2018-05-15

Similar Documents

Publication Publication Date Title
CN108038696B (zh) 基于设备标识码和社交群组信息的刷单检测方法及系统
CN110009372B (zh) 一种用户风险识别方法和装置
US11030622B2 (en) Card systems and methods
CN108573432B (zh) 用于电子商务的交易监管系统和方法
CN109711955B (zh) 基于当前订单的差评预警方法、系统、黑名单库建立方法
CN108550052A (zh) 基于用户行为数据特征的刷单检测方法及系统
WO2017028735A1 (zh) 选择及推荐展示对象的方法及装置
CN103577988A (zh) 一种识别特定用户的方法和装置
TW201305944A (zh) 商品資訊投放方法和設備
CA2742395A1 (en) Evaluating public records of supply transactions
WO2013033236A2 (en) Rules suggestion engine
WO2002027610A1 (en) Score based decisioning
CN107305665A (zh) 一种鉴别虚假交易、防止刷单的方法及装置
US20130226920A1 (en) Systems, Methods and Apparatus for Identifying Links among Interactional Digital Data
CN109213936B (zh) 商品搜索方法和装置
CN108648038A (zh) 一种基于子图挖掘的信用炒作与恶意评价识别方法
Li et al. Research on product quality control in Chinese online shopping: based on the uncertainty mitigating factors of product quality
CN108429776A (zh) 网络对象的推送方法、装置、客户端、交互设备以及系统
CN117236996B (zh) 一种基于大数据分析的用户行为预测方法和系统
JP2022152483A (ja) ネットショップの信用情報提供システムにおける情報処理装置、処理方法、及びプログラム
CN116611796B (zh) 一种店铺交易数据的异常检测方法及装置
CN112435059A (zh) 物品价值实时评估方法、装置、电子设备及存储介质
CN110619546A (zh) 一种解决定向发券高吞吐量的实现方案
Ramli et al. Review of literatures on trust factors affecting customer's purchase intention on SOHO seller: S-commerce context
CN114626888A (zh) 网络购物平台的恶意刷单行为预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 310051 301-303 and 305-308 rooms, 2 Jiangling Road, Binjiang District, Hangzhou, Zhejiang, Jiangling, 567

Applicant after: Hangzhou ping pong Intelligent Technology Co., Ltd

Address before: Hangzhou City, Zhejiang province 310051 Binjiang District West Street No. 567 Jiangling Road, building 2, floor 5, FS13-FS18

Applicant before: HANGZHOU PINGPONG INTELLIGENT TECHNICAL Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: Room 301-303, 305-308, building 2, 567 Jiangling Road, Xixing street, Binjiang District, Hangzhou City, Zhejiang Province 310051

Patentee after: Hangzhou ping pong Intelligent Technology Co.,Ltd.

Address before: Room 301-303, 305-308, building 2, 567 Jiangling Road, Xixing street, Binjiang District, Hangzhou City, Zhejiang Province 310051

Patentee before: Hangzhou ping pong Intelligent Technology Co., Ltd