Nothing Special   »   [go: up one dir, main page]

CN103546446A - 一种钓鱼网站的检测方法、装置和终端 - Google Patents

一种钓鱼网站的检测方法、装置和终端 Download PDF

Info

Publication number
CN103546446A
CN103546446A CN201210247230.9A CN201210247230A CN103546446A CN 103546446 A CN103546446 A CN 103546446A CN 201210247230 A CN201210247230 A CN 201210247230A CN 103546446 A CN103546446 A CN 103546446A
Authority
CN
China
Prior art keywords
website
microblogging
url
feature
confidence level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210247230.9A
Other languages
English (en)
Other versions
CN103546446B (zh
Inventor
董文辉
邵付东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201210247230.9A priority Critical patent/CN103546446B/zh
Priority to KR1020157000809A priority patent/KR101530941B1/ko
Priority to PCT/CN2013/079376 priority patent/WO2014012471A1/en
Priority to US14/065,849 priority patent/US9210189B2/en
Publication of CN103546446A publication Critical patent/CN103546446A/zh
Application granted granted Critical
Publication of CN103546446B publication Critical patent/CN103546446B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • H04L63/1483Countermeasures against malicious traffic service impersonation, e.g. phishing, pharming or web spoofing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明适用于互联网技术领域,提供了一种钓鱼网站的检测方法、装置和终端,所述方法包括:获取内容中包含网站的统一资源定位符URL的微博的相关信息;对微博的相关信息进行分析,提取微博的特征;根据提取的微博的特征计算微博内容中包含的网站的URL的可信度;根据所述网站的URL的可信度确定所述网站的URL是否为钓鱼网站的URL。本发明解决了现有技术无法判断微博中包含的网站的URL是否是钓鱼网站的URL的问题,给用户带来了便利。

Description

一种钓鱼网站的检测方法、装置和终端
技术领域
本发明属于互联网技术领域,尤其涉及一种钓鱼网站的检测方法、装置和终端。
背景技术
随着互联网的普及,越来越多的用户开始通过互联网进行交流和商务交易,电子商务、电子银行等互联网业务也随之发展起来。用户访问网站时,需要输入账号和密码等信息,当输入的账号和密码等信息正确时,用户可以进入网站进行网上操作。用户的账号和密码是用户进入这些网站进行操作的唯一标识,如果有人盗用了用户的账号和密码,冒充用户进入网站,则可能对用户的利益造成损害。目前,有些不法分子通过钓鱼网站方式,显示给用户类似真实网站的页面,诱骗用户输入账号和密码,对用户的账号和密码进行盗用。钓鱼网站是指不法分子利用各种手段,仿冒真实网站的统一资源定位符(URL,UniformResource Locator)以及页面内容,以此来骗取用户账号和密码等私人资料的网站。
另外,据中国互联网络信息中心发布的《第29次中国互联网络发展状况统计报告》显示,截至2011年12月底,我国微博用户数已达2.5亿,在各网站注册的微博账号约8亿个,每日微博信息量达2亿条,微博已成为网络生活的重要服务之一,对社会生活的渗透已日益深入,已成为网民获取信息(例如网站的URL)的重要渠道。然而,微博中包含的网站的URL有可能是钓鱼网站的URL,而现有技术无法判断微博中包含的网站的URL是否是钓鱼网站的URL,因此给用户带来不便。
发明内容
本发明实施例的目的在于提供一种钓鱼网站的检测方法,旨在解决现有技术无法判断微博中包含的网站的URL是否是钓鱼网站的URL的问题。
本发明实施例是这样实现的,一种钓鱼网站的检测方法,所述方法包括:
获取内容中包含网站的统一资源定位符URL的微博的相关信息;
对微博的相关信息进行分析,提取微博的特征;
根据提取的微博的特征计算微博内容中包含的网站的URL的可信度;
根据所述网站的URL的可信度确定所述网站的URL是否为钓鱼网站的URL。
本发明实施例的另一目的在于提供一种钓鱼网站的检测装置,所述装置包括:
获取模块,用于获取内容中包含网站的统一资源定位符URL的微博的相关信息;
分析模块,用于对微博的相关信息进行分析,提取微博的特征;
计算模块,用于根据提取的微博的特征计算微博内容中包含的网站的URL的可信度;和
确定模块,用于根据所述网站的URL的可信度确定所述网站的URL是否为钓鱼网站的URL。
本发明实施例的再一目的在于提供一种终端,所述终端包括上述的钓鱼网站的检测装置。
在本发明实施例中,由于获取内容中包含网站的统一资源定位符URL的微博的相关信息,并从微博的相关信息中提取微博的特征,根据提取的微博的特征计算微博内容中包含的网站的URL的可信度,以确定所述网站的URL是否为钓鱼网站的URL。因此解决了现有技术无法判断微博中包含的网站的URL是否是钓鱼网站的URL的问题,给用户带来了便利。
附图说明
图1是本发明实施例一提供的钓鱼网站的检测方法流程图;
图2是本发明实施例二提供的钓鱼网站的检测装置的功能模块框图;
图3是本发明实施例三提供的钓鱼网站的检测方法流程图;
图4是本发明实施例四提供的钓鱼网站的检测装置的功能模块框图。
具体实施方式
为了使本发明的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1,本发明实施例一提供的钓鱼网站的检测方法包括以下步骤:
S101、获取内容中包含网站的URL的微博的相关信息;
在本发明实施例一中,微博的相关信息包括功能特征、社会网络特征和传播特征;
S102、对微博的相关信息进行分析,提取微博的特征;
在本发明实施例一中,微博的特征包括微博的功能特征、社会网络特征和传播特征。
S103、根据提取的微博的特征计算微博内容中包含的网站的URL的可信度;
S104、根据所述网站的URL的可信度确定所述网站的URL是否为钓鱼网站的URL。
请参阅图2,本发明实施例二提供的钓鱼网站的检测装置包括:
获取模块11,用于获取内容中包含网站的URL的微博的相关信息;在本发明实施例二中,微博的相关信息包括功能特征、社会网络特征和传播特征;
分析模块12,用于对微博的相关信息进行分析,提取微博的特征;在本发明实施例二中,微博的特征包括微博的功能特征、社会网络特征和传播特征。
计算模块13,用于根据提取的微博的特征计算微博内容中包含的网站的URL的可信度;
确定模块14,用于根据所述网站的URL的可信度确定所述网站的URL是否为钓鱼网站的URL。
请参阅图3,本发明实施例三提供的钓鱼网站的检测方法包括以下步骤:
S201、获取内容中包含网站的URL的微博的相关信息;
在本发明实施例三中,微博的相关信息包括功能特征、社会网络特征和传播特征,其中功能特征包括微博的长度、微博的内容等;社会网络特征包括微博发布者身份、是否实名认证、微博发布者的年龄、微博注册时间、微博等级、微博条数(包括原创条数和转发条数)、听众或粉丝的数量、听众或粉丝的情况、活跃度情况等;传播特征包括转发评论的数量、转发评论者的特征等。
S202、对微博的相关信息进行降噪处理;
S203、对降噪处理后的微博的相关信息进行分析,提取微博的特征;
在本发明实施例三中,微博的特征包括微博的功能特征、社会网络特征和传播特征。
S204、根据提取的微博的特征计算微博内容中包含的网站的URL的可信度;
假设网站的URL的可信度为c,则c由功能特征、社会网络特征和传播特征按照预定的权重配比综合确定,其中功能特征、社会网络特征和传播特征又分别由功能特征、社会网络特征和传播特征所属的多个不同的功能特征描述符按照预定的权重配比综合确定。
具体为c={(f,pf),(s,ps),(d,pd)},其中,
f为功能特征,f={(f1,pf1),(f2,pf2),(f3,pf3),...,(fn,pfn)},fi为功能特征描述符,i={1,2,3,...,n},n为功能特征描述符的个数,pfi为功能特征描述符fi的权重;
pf为功能特征f的权重;
例如f1为微博的长度、f2为包含某些文字或情绪词;pf1为微博的长度的权重、pf2为包含某些文字或情绪词的权重;
s为社会网络特征,s={(s1,ps1),(s2,ps2),(s3,ps3),...,(sn,psn)},si为社会网络特征描述符,i={1,2,3,...,n},n为社会网络特征描述符的个数,psi为社会网络特征描述符si的权重;
ps为社会网络特征s的权重;
例如S1为微博发布者身份、S2为实名认证、S3为年龄、S4为微博注册时间、S5为微博等级、S6为微博条数(原创和转发)、S7为听众或粉丝数、S8为听众或粉丝情况、S9为活跃度情况;
ps1为微博发布者身份的权重、ps2为实名认证的权重、ps3为年龄的权重、ps4为微博注册时间的权重、ps5为微博等级的权重、ps6为微博条数(原创和转发)的权重、ps7为听众或粉丝数的权重、ps8为听众或粉丝情况的权重、ps9为活跃度情况的权重;
d为传播特征,d={(d1,pd1),(d2,pd2),(d3,pd3),...,(dn,pdn)},di为传播特征描述符,i={1,2,3,...,n},n为传播特征描述符的个数,pdi为传播特征描述符di的权重;
pd为传播特征d的权重;
例如d1为转发评论数、d2为转发评论者特征;pd1为转发评论数的权重、pd2为转发评论者特征的权重。
S205、根据所述网站的URL的可信度确定所述网站的URL是否为钓鱼网站的URL。
当网站的URL的可信度c≥TW时,则认为网站的URL为可信的,其中,TW为预定的可信的阈值;
当网站的URL的可信度c≤TB时,则认为网站的URL为不可信的,则认为所述网站的URL为钓鱼网站的URL,其中,TB为预定的不可信的阈值;
当网站的URL的可信度c满足以下条件Tw>c>TB时,则认为网站的URL为未知的。
其中,预定的不可信的阈值的TB和预定的可信的阈值TW通过以下方式获得:
选取易被钓鱼的关键字(例如银行、淘宝),采集这些关键字下含有URL的微博构成数据集,对数据集进行分词、数据格式化、提取功能特征、社会网络特征和传播特征;
对数据集中URL的可信结果进行人工标注,并按4:1随机划分训练集和测试集;
使用交叉检验训练和测试分类模型,分类模型可选用SVM、决策树、贝叶斯网络等有监督学习的模型,根据Carlos Castillo等论文《Information Credibilityon Twitter》的实验,J48决策树能得到较高的准确率,从决策树根节点到不可信类别叶子节点的概率以及可信类别叶子节点的概率定义为不可信与之及可信阈值,据此可得出预定的不可信的阈值的TB和预定的可信的阈值Tw。
请参阅图4,本发明实施例四提供的钓鱼网站的检测装置包括:
获取模块21,用于获取内容中包含网站的URL的微博的相关信息;在本发明实施例四中,微博的相关信息包括功能特征、社会网络特征和传播特征,其中功能特征包括微博的长度、微博的内容等;社会网络特征包括微博发布者身份、是否实名认证、微博发布者的年龄、微博注册时间、微博等级、微博条数(包括原创条数和转发条数)、听众或粉丝的数量、听众或粉丝的情况、活跃度情况等;传播特征包括转发评论的数量、转发评论者的特征等。
降噪模块22,用于对微博的相关信息进行降噪处理;
分析模块23,用于对降噪处理后的微博的相关信息进行分析,提取微博的特征;在本发明实施例四中,微博的特征包括微博的功能特征、社会网络特征和传播特征。
计算模块24,用于根据提取的微博的特征计算微博内容中包含的网站的URL的可信度;
假设网站的URL的可信度为c,则c由功能特征、社会网络特征和传播特征按照预定的权重配比综合确定,其中功能特征、社会网络特征和传播特征又分别由功能特征、社会网络特征和传播特征所属的多个不同的功能特征描述符按照预定的权重配比综合确定。
具体为c={(f,pf),(s,ps),(d,pd)},其中,
f为功能特征,f={(f1,pf1),(f2,pf2),(f3,pf3),...,(fn,pfn)},fi为功能特征描述符,i={1,2,3,...,n},n为功能特征描述符的个数,pfi为功能特征描述符fi的权重;
pf为功能特征f的权重;
例如f1为微博的长度、f2为包含某些文字或情绪词;pf1为微博的长度的权重、pf2为包含某些文字或情绪词的权重;
s为社会网络特征,s={(s1,ps1),(s2,ps2),(s3,ps3),...,(sn,psn)},si为社会网络特征描述符,i={1,2,3,...,n},n为社会网络特征描述符的个数,psi为社会网络特征描述符si的权重;
ps为社会网络特征s的权重;
例如S1为微博发布者身份、S2为实名认证、S3为年龄、S4为微博注册时间、S5为微博等级、S6为微博条数(原创和转发)、S7为听众或粉丝数、S8为听众或粉丝情况、S9为活跃度情况;
ps1为微博发布者身份的权重、ps2为实名认证的权重、ps3为年龄的权重、ps4为微博注册时间的权重、ps5为微博等级的权重、ps6为微博条数(原创和转发)的权重、ps7为听众或粉丝数的权重、ps8为听众或粉丝情况的权重、ps9为活跃度情况的权重;
d为传播特征,d={(d1,pd1),(d2,pd2),(d3,pd3),...,(dn,pdn)},di为传播特征描述符,i={1,2,3,...,n},n为传播特征描述符的个数,pdi为传播特征描述符di的权重;
pd为传播特征d的权重;
例如d1为转发评论数、d2为转发评论者特征;pd1为转发评论数的权重、pd2为转发评论者特征的权重。
确定模块25,用于根据所述网站的URL的可信度确定所述网站的URL是否为钓鱼网站的URL。
当网站的URL的可信度c≥TW时,则认为网站的URL为可信的,其中,TW为预定的可信的阈值;
当网站的URL的可信度c≤TB时,则认为网站的URL为不可信的,则认为所述网站的URL为钓鱼网站的URL,其中,TB为预定的不可信的阈值;
当网站的URL的可信度c满足以下条件Tw>c>TB时,则认为网站的URL为未知的。
其中,预定的不可信的阈值的TB和预定的可信的阈值TW通过以下方式获得:
选取易被钓鱼的关键字(例如银行、淘宝),采集这些关键字下含有URL的微博构成数据集,对数据集进行分词、数据格式化、提取功能特征、社会网络特征和传播特征;
对数据集中URL的可信结果进行人工标注,并按4:1随机划分训练集和测试集;
使用交叉检验训练和测试分类模型,分类模型可选用SVM、决策树、贝叶斯网络等有监督学习的模型,根据Carlos Castillo等论文《Information Credibilityon Twitter》的实验,J48决策树能得到较高的准确率,从决策树根节点到不可信类别叶子节点的概率以及可信类别叶子节点的概率定义为不可信与之及可信阈值,据此可得出预定的不可信的阈值的TB和预定的可信的阈值Tw。
在本发明实施例中,由于获取内容中包含网站的统一资源定位符URL的微博的相关信息,并从微博的相关信息中提取微博的功能特征、社会网络特征和传播特征,根据提取的微博的功能特征、社会网络特征和传播特征计算微博内容中包含的网站的URL的可信度,以确定所述网站的URL是否为钓鱼网站的URL。因此解决了现有技术无法判断微博中包含的网站的URL是否是钓鱼网站的URL的问题,给用户带来了便利。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种钓鱼网站的检测方法,其特征在于,所述方法包括:
获取内容中包含网站的统一资源定位符URL的微博的相关信息;
对微博的相关信息进行分析,提取微博的特征;
根据提取的微博的特征计算微博内容中包含的网站的URL的可信度;
根据所述网站的URL的可信度确定所述网站的URL是否为钓鱼网站的URL。
2.如权利要求1所述的方法,其特征在于,所述微博的相关信息包括功能特征、社会网络特征和传播特征;所述微博的特征包括微博的功能特征、社会网络特征和传播特征。
3.如权利要求2所述的方法,其特征在于,所述功能特征包括微博的长度和/或微博的内容;所述社会网络特征包括微博发布者身份、是否实名认证、微博发布者的年龄、微博注册时间、微博等级、微博条数、听众或粉丝的数量、听众或粉丝的情况和/或活跃度情况;所述传播特征包括转发评论的数量和/或转发评论者的特征。
4.如权利要求1所述的方法,其特征在于,所述获取内容中包含网站的统一资源定位符URL的微博的相关信息之后,所述方法还包括:
对微博的相关信息进行降噪处理;
所述对微博的相关信息进行分析具体为:
对降噪处理后的微博的相关信息进行分析。
5.如权利要求2所述的方法,其特征在于,所述根据提取的微博的特征计算微博内容中包含的网站的URL的可信度具体为:
假设网站的URL的可信度为c,则c由功能特征、社会网络特征和传播特征按照预定的权重配比综合确定,其中功能特征、社会网络特征和传播特征分别由功能特征、社会网络特征和传播特征所属的多个不同的功能特征描述符按照预定的权重配比综合确定。
6.如权利要求5所述的方法,其特征在于,所述根据所述网站的URL的可信度确定所述网站的URL是否为钓鱼网站的URL具体为:
当网站的URL的可信度c≥TW时,则认为网站的URL为可信的,其中,TW为预定的可信的阈值;
当网站的URL的可信度c≤TB时,则认为网站的URL为不可信的,则认为所述网站的URL为钓鱼网站的URL,其中,TB为预定的不可信的阈值;
当网站的URL的可信度c满足以下条件Tw>c>TB时,则认为网站的URL为未知的。
7.一种钓鱼网站的检测装置,其特征在于,所述装置包括:
获取模块,用于获取内容中包含网站的统一资源定位符URL的微博的相关信息;
分析模块,用于对微博的相关信息进行分析,提取微博的特征;
计算模块,用于根据提取的微博的特征计算微博内容中包含的网站的URL的可信度;和
确定模块,用于根据所述网站的URL的可信度确定所述网站的URL是否为钓鱼网站的URL。
8.如权利要求7所述的装置,其特征在于,所述微博的相关信息包括功能特征、社会网络特征和传播特征;所述微博的特征包括微博的功能特征、社会网络特征和传播特征。
9.如权利要求7所述的装置,其特征在于,所述装置还包括:
降噪模块,用于对微博的相关信息进行降噪处理;
所述分析模块具体用于对降噪处理后的微博的相关信息进行分析,分别提取微博的功能特征、社会网络特征和传播特征。
10.如权利要求8所述的装置,其特征在于,所述计算模块具体用于:
假设网站的URL的可信度为c,则c由功能特征、社会网络特征和传播特征按照预定的权重配比综合确定,其中功能特征、社会网络特征和传播特征分别由功能特征、社会网络特征和传播特征所属的多个不同的功能特征描述符按照预定的权重配比综合确定。
11.如权利要求10所述的装置,其特征在于,所述确定模块具体用于:
当网站的URL的可信度c≥TW时,则认为网站的URL为可信的,其中,TW为预定的可信的阈值;
当网站的URL的可信度c≤TB时,则认为网站的URL为不可信的,则认为所述网站的URL为钓鱼网站的URL,其中,TB为预定的不可信的阈值;
当网站的URL的可信度c满足以下条件Tw>c>TB时,则认为网站的URL为未知的。
12.一种终端,其特征在于,所述终端包括权利要求7至11任一项所述的钓鱼网站的检测装置。
CN201210247230.9A 2012-07-17 2012-07-17 一种钓鱼网站的检测方法、装置和终端 Active CN103546446B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201210247230.9A CN103546446B (zh) 2012-07-17 2012-07-17 一种钓鱼网站的检测方法、装置和终端
KR1020157000809A KR101530941B1 (ko) 2012-07-17 2013-07-15 피싱 웹사이트들을 검출하기 위한 방법, 시스템 및 클라이언트 단말기
PCT/CN2013/079376 WO2014012471A1 (en) 2012-07-17 2013-07-15 Method, system and client terminal for detection of phishing websites
US14/065,849 US9210189B2 (en) 2012-07-17 2013-10-29 Method, system and client terminal for detection of phishing websites

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210247230.9A CN103546446B (zh) 2012-07-17 2012-07-17 一种钓鱼网站的检测方法、装置和终端

Publications (2)

Publication Number Publication Date
CN103546446A true CN103546446A (zh) 2014-01-29
CN103546446B CN103546446B (zh) 2015-03-25

Family

ID=49948279

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210247230.9A Active CN103546446B (zh) 2012-07-17 2012-07-17 一种钓鱼网站的检测方法、装置和终端

Country Status (4)

Country Link
US (1) US9210189B2 (zh)
KR (1) KR101530941B1 (zh)
CN (1) CN103546446B (zh)
WO (1) WO2014012471A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107508809A (zh) * 2017-08-17 2017-12-22 腾讯科技(深圳)有限公司 识别网址类型的方法及装置
CN112567710A (zh) * 2018-08-09 2021-03-26 微软技术许可有限责任公司 用于污染网络钓鱼活动响应的系统和方法
WO2021258838A1 (zh) * 2020-06-22 2021-12-30 杭州安恒信息技术股份有限公司 钓鱼网站的检测方法、装置、设备、计算机可读存储介质

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572807B (zh) * 2014-10-29 2018-02-06 中国科学院计算技术研究所 一种基于微博信息源的新闻认证方法及系统
US9398047B2 (en) 2014-11-17 2016-07-19 Vade Retro Technology, Inc. Methods and systems for phishing detection
CN106257886B (zh) * 2015-06-17 2020-06-23 腾讯科技(深圳)有限公司 一种信息处理方法、装置、终端及服务器
EP3125147B1 (en) * 2015-07-27 2020-06-03 Swisscom AG System and method for identifying a phishing website
WO2017039684A1 (en) * 2015-09-04 2017-03-09 Hewlett Packard Enterprise Development Lp Classifier
US10142366B2 (en) 2016-03-15 2018-11-27 Vade Secure, Inc. Methods, systems and devices to mitigate the effects of side effect URLs in legitimate and phishing electronic messages
CN106131016B (zh) * 2016-07-13 2019-05-03 北京知道创宇信息技术有限公司 恶意url检测干预方法、系统及装置
US10313352B2 (en) * 2016-10-26 2019-06-04 International Business Machines Corporation Phishing detection with machine learning
US11470113B1 (en) * 2018-02-15 2022-10-11 Comodo Security Solutions, Inc. Method to eliminate data theft through a phishing website
CN111556065A (zh) * 2020-05-08 2020-08-18 鹏城实验室 钓鱼网站检测方法、装置及计算机可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100042687A1 (en) * 2008-08-12 2010-02-18 Yahoo! Inc. System and method for combating phishing
CN102394798A (zh) * 2011-11-16 2012-03-28 北京交通大学 一种基于多元特征的微博信息传播行为预测方法及系统

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8145710B2 (en) * 2003-06-18 2012-03-27 Symantec Corporation System and method for filtering spam messages utilizing URL filtering module
US8176126B2 (en) * 2004-08-26 2012-05-08 International Business Machines Corporation System, method and program to limit rate of transferring messages from suspected spammers
US20060168066A1 (en) * 2004-11-10 2006-07-27 David Helsper Email anti-phishing inspector
KR100904311B1 (ko) * 2006-09-15 2009-06-23 인포섹(주) 트러스티드 네트워크를 이용한 파밍 방지 방법
CN101534306B (zh) 2009-04-14 2012-01-11 深圳市腾讯计算机系统有限公司 一种钓鱼网站的检测方法及装置
US8521667B2 (en) * 2010-12-15 2013-08-27 Microsoft Corporation Detection and categorization of malicious URLs
CN102170447A (zh) 2011-04-29 2011-08-31 南京邮电大学 一种基于最近邻及相似度测量检测钓鱼网页的方法
CN102279875B (zh) * 2011-06-24 2013-04-24 华为数字技术(成都)有限公司 钓鱼网站的识别方法和装置
CN102231745A (zh) * 2011-07-08 2011-11-02 盛大计算机(上海)有限公司 一种网络应用的安全系统及方法
CN102355469A (zh) * 2011-10-31 2012-02-15 北龙中网(北京)科技有限责任公司 在浏览器地址栏展示网站是否为可信验证的方法
US20130124644A1 (en) * 2011-11-11 2013-05-16 Mcafee, Inc. Reputation services for a social media identity
CN102571485B (zh) * 2011-12-14 2014-08-27 上海交通大学 一种在微博平台上识别机器人用户的方法
US8813239B2 (en) * 2012-01-17 2014-08-19 Bitdefender IPR Management Ltd. Online fraud detection dynamic scoring aggregation systems and methods
US8966582B1 (en) * 2012-03-20 2015-02-24 Google Inc. Automatic detection and warning regarding potentially malicious sites
US9253207B2 (en) * 2013-02-08 2016-02-02 PhishMe, Inc. Collaborative phishing attack detection
US8712907B1 (en) * 2013-03-14 2014-04-29 Credibility Corp. Multi-dimensional credibility scoring
US9178901B2 (en) * 2013-03-26 2015-11-03 Microsoft Technology Licensing, Llc Malicious uniform resource locator detection

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100042687A1 (en) * 2008-08-12 2010-02-18 Yahoo! Inc. System and method for combating phishing
CN102394798A (zh) * 2011-11-16 2012-03-28 北京交通大学 一种基于多元特征的微博信息传播行为预测方法及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107508809A (zh) * 2017-08-17 2017-12-22 腾讯科技(深圳)有限公司 识别网址类型的方法及装置
CN112567710A (zh) * 2018-08-09 2021-03-26 微软技术许可有限责任公司 用于污染网络钓鱼活动响应的系统和方法
CN112567710B (zh) * 2018-08-09 2023-08-18 微软技术许可有限责任公司 用于污染网络钓鱼活动响应的系统和方法
US12015639B2 (en) 2018-08-09 2024-06-18 Microsoft Technology Licensing, Llc Systems and methods for polluting phishing campaign responses
WO2021258838A1 (zh) * 2020-06-22 2021-12-30 杭州安恒信息技术股份有限公司 钓鱼网站的检测方法、装置、设备、计算机可读存储介质

Also Published As

Publication number Publication date
WO2014012471A1 (en) 2014-01-23
CN103546446B (zh) 2015-03-25
KR20150011849A (ko) 2015-02-02
KR101530941B1 (ko) 2015-06-23
US20140096242A1 (en) 2014-04-03
US9210189B2 (en) 2015-12-08

Similar Documents

Publication Publication Date Title
CN103546446B (zh) 一种钓鱼网站的检测方法、装置和终端
Rauchfleisch et al. The false positive problem of automatic bot detection in social science research
Goga et al. Exploiting innocuous activity for correlating users across sites
WO2018036272A1 (zh) 新闻内容的推送方法、电子装置及计算机可读存储介质
US20170337258A1 (en) Classifying uniform resource locators
US10825110B2 (en) Entity page recommendation based on post content
CN108881138B (zh) 一种网页请求识别方法及装置
US20140330760A1 (en) Content distribution
CN102664926B (zh) 用户信息共享方法及系统
US20140095308A1 (en) Advertisement distribution apparatus and advertisement distribution method
US11010687B2 (en) Detecting abusive language using character N-gram features
Pv et al. UbCadet: detection of compromised accounts in twitter based on user behavioural profiling
CN103336766A (zh) 短文本垃圾识别以及建模方法和装置
US20130179421A1 (en) System and Method for Collecting URL Information Using Retrieval Service of Social Network Service
US20150154287A1 (en) Method for providing recommend information for mobile terminal browser and system using the same
WO2014171925A1 (en) Event summarization
CN102891861A (zh) 一种基于客户端的钓鱼网站检测方法及其装置
TWI575391B (zh) 社群資料篩選系統、方法及其非揮發性電腦可讀取紀錄媒體
US20130230248A1 (en) Ensuring validity of the bookmark reference in a collaborative bookmarking system
Ma et al. “Hello, Fellow Villager!”: Perceptions and Impact of Displaying Users’ Locations on Weibo
CN109063015B (zh) 热点内容的提取方法、装置及设备
CN110287315A (zh) 舆情确定方法、装置、设备及存储介质
Comber et al. Semantic analysis of citizen sensing, crowdsourcing and VGI
Alessandra et al. Who tweets in Italian? Demographic characteristics of Twitter users
CN112559679B (zh) 政法新媒体传播力的检测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant