CN106095939B - 账户权限的获取方法和装置 - Google Patents
账户权限的获取方法和装置 Download PDFInfo
- Publication number
- CN106095939B CN106095939B CN201610414403.XA CN201610414403A CN106095939B CN 106095939 B CN106095939 B CN 106095939B CN 201610414403 A CN201610414403 A CN 201610414403A CN 106095939 B CN106095939 B CN 106095939B
- Authority
- CN
- China
- Prior art keywords
- text
- word
- classification
- target account
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种账户权限的获取方法和装置。其中,该方法包括:接收查询请求,其中,所述查询请求用于请求查询目标账户的权限标识,所述权限标识用于指示所述目标账户执行预定操作的权限;获取所述目标账户的阅读记录,其中,所述阅读记录用于指示所述目标账户已阅读的文本的文本属性;获取与所述阅读记录指示的所述文本属性对应的所述目标账户的权限标识;发送所述权限标识。本发明至少解决利用不全面的数据对用户权限进行评定,影响评定权限的准确度的技术问题。
Description
技术领域
本发明涉及信息处理领域,具体而言,涉及一种账户权限的获取方法和装置。
背景技术
权限评定平台可以采集和记录用户的行为信息,基于这些行为信息建立用户的权限报告,该权限评定平台可以利用用户的权限报告对外提供权限信息服务,如将用户的权限信息提供给第三方,以供第三方查询,例如,上述的权限可以执行资源转移操作的权限,则权限评定平台可以为征信平台,征信平台将用户的权限报告提供给银行、金融监管机构、以及司法部门等第三方,供这些机构查询用户的转移资源的权限。
目前,在评定用户的权限的过程中,主要基于用户历史的虚拟资源交换记录和虚拟资源持有量(如银行卡中的剩余数量)来确定,如银行卡流水、在电商平台上消费的记录、借贷记录等)。仅依靠虚拟资源交换记录和虚拟资源持有量来评定用户的权限,确定用户权限的数据是不全面的,利用不全面的数据对用户权限进行评定,影响评定权限的准确度。
发明内容
本发明实施例提供了一种账户权限的获取方法和装置,以至少解决利用不全面的数据对用户权限进行评定,影响评定权限的准确度的技术问题。
根据本发明实施例的一个方面,提供了一种账户权限的获取方法,该方法包括:接收查询请求,其中,所述查询请求用于请求查询目标账户的权限标识,所述权限标识用于指示所述目标账户执行预定操作的权限;获取所述目标账户的阅读记录,其中,所述阅读记录用于指示所述目标账户已阅读的文本的文本属性;获取与所述阅读记录指示的所述文本属性对应的所述目标账户的权限标识;发送所述权限标识。
根据本发明实施例的一个方面,提供了一种账户权限的获取装置,该装置包括:账户权限的获取装置,其特征在于,包括:第一接收单元,用于接收查询请求,其中,所述查询请求用于请求查询目标账户的权限标识,所述权限标识用于指示所述目标账户执行预定操作的权限;第一获取单元,用于获取所述目标账户的阅读记录,其中,所述阅读记录用于指示所述目标账户已阅读的文本的文本属性;第二获取单元,用于获取与所述阅读记录指示的所述文本属性对应的所述目标账户的权限标识;第一发送单元,用于发送所述权限标识。
在本发明实施例中,在接收到查询请求之后,获取目标账户的阅读记录,用于该目标账户的阅读记录指示的该账户已阅读的文本的属性,确定用户知识领域的兴趣倾向,并获取与阅读记录指示的文本属性对应的目标账户的权限标识,并将权限标识发送至请求方。通过上述实施例,在评定目标账户执行预定操作的权限时,增加了目标账户的阅读记录作,使用更加全面的数据对用户执行预定操作的权限进行评定,提高确定权限的准确度,解决了现有技术中利用不全面的数据对用户权限进行评定,影响评定权限的准确度的问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种账户权限的获取方法的硬件环境的示意图;
图2是根据本发明实施例的一种可选的账户权限的获取方法的流程图;
图3是根据本发明实施例的另一种可选的账户权限的获取方法的流程图;
图4是根据本发明实施例的再一种可选的账户权限的获取方法的流程图;
图5是根据本发明实施例的一种可选的账户权限的获取方法的另一流程图;
图6是根据本发明实施例的一种可选的账户权限的获取方法的示意图;
图7是根据本发明实施例的终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,提供了一种账户权限的获取方法,在本实施例中,上述账户权限的获取方法可以应用于如图1所示的硬件环境中,其中,硬件环境包括网络环境。
可选地,在本实施例中,上述账户权限的获取方法可以应用于如图1所示的服务器101和终端103所构成的硬件环境中。如图1所示,服务器101通过网络与终端103进行连接,上述网络包括但不限于:广域网、城域网或局域网。
其中,上述的终端103可以为个人计算机,也可以为移动终端,该移动终端可以为智能手机、平板电脑灯,该终端上可以安装有权限评定应用,如征信应用,用户可以通过该终端登录权限评定应用之后,主动录用户信息;或者在用户登录权限评定应用之后,采集用户的行为信息,以评定该用户的权限;可选地,在用户登录权限评定应用之后,可以通过第三方应用采集用户的行为信息,以评定该用户执行预定操作的权限。
上述的预定操作可以为请求获取虚拟资源的权限,如借贷等。
如图2所示,本申请实施例中的账户权限的获取方法,可以通过如下步骤实现:
步骤S202:接收查询请求,其中,查询请求用于请求查询目标账户的权限标识,权限标识用于指示目标账户执行预定操作的权限;
步骤S204:获取目标账户的阅读记录,其中,阅读记录用于指示目标账户已阅读的文本的文本属性;
步骤S206:获取与阅读记录指示的文本属性对应的目标账户的权限标识;
步骤S208:发送权限标识。
在上述实施例中,在接收到查询请求之后,获取目标账户的阅读记录,用于该目标账户的阅读记录指示的该账户已阅读的文本的属性,确定用户知识领域的兴趣倾向,并获取与阅读记录指示的文本属性对应的目标账户的权限标识,并将权限标识发送至请求方。通过上述实施例,在评定目标账户执行预定操作的权限时,增加了目标账户的阅读记录作,使用更加全面的数据对用户执行预定操作的权限进行评定,提高确定权限的准确度,解决了现有技术中利用不全面的数据对用户权限进行评定,影响评定权限的准确度的问题。
其中,上述实施例中的账户权限的获取方法可以应用在服务器或终端上,本申请实施例均以服务器为例,详述本申请的方案,具体地,服务器接收到查询请求之后,获取登录在第一终端的权限评定应用上的目标账户的阅读记录。
该第一终端上安装有权限评定应用,该权限评定应用可以为独立存在的应用,如第一终端上安装有该权限评定应用的客户端;该权限评定平台还可以为依托第三方应用存在的应用,如该权限评定平台可以通过浏览器应用提供的HTML页面进入,该权限评定平台还可以内嵌在第三方应用中,如权限评定平台可以通过微信应用的权限评定公众号进入。
用户可以在登录权限评定应用之后,请求查询自己的权限标识。以权限评定应用为独立的应用为例,用户启动权限评定客户端,使用账号和密码登录该客户端,登录客户端之后,在该客户端的页面上记录有查询权限的按键,用户点击该查询权限的按键之后,生成查询请求。
第三方账户可以在接收到目标账户执行预定操作的请求之后,生成查询请求,以查询目标账户执行该预定操作的权限。以权限评定应用为独立的应用为例,第三方账户启动权限评定客户端,使用账号和密码登录该客户端,登录客户端之后,接收到目标账户的用于请求执行预定操作的执行请求,第三方账户响应该执行请求,生成查询请求,并将该查询请求发送至服务器。
其中,查询请求中至少携带有预定操作的信息和目标账户的信息。
服务器接收到查询请求之后,可以从权限标识应用中的数据库中获取目标账户的阅读记录,为了获取更加完整的数据,服务器还可以从第三方应用中获取目标账户的阅读记录,该第三方应用可以与权限评定应用建立有关联关系,如权限评定应用与第三方应用已经绑定。
服务器可以实时记录该权限评定应用上的目标账户和与该权限评定应用关联的第三方应用上的账户行为,以获取完整的数据,该第三方应用可以为媒体文件应用,如,资讯应用、读书应用以及文档应用,其中,资讯应用上可以提供大量的图文资料,读书应用上可以提供电子书文件,文档应用可以用来阅读或编辑文档(如word文档和PDF文档等)。
在服务器获取阅读记录之后,获取与阅读记录指示的文本属性对应的目标账户的权限标识,以获取目标账户执行预定操作的权限。
其中,权限标识可以使用下述至少之一的方式表现:文字描述、数值、等级、级别、概率值和权重值,本申请对此不做限定。
在权限标识使用文字描述的方式表示时,识别文字,以确定目标账户执行预定操作的权限高低。例如,得到的权限标识为“目标账户无权查看文档A”,则可以得知目标账户的权限比较低;若得到的权限标识为“目标账户可以下载文档A”,则得知目标账户的权限比较高。
在权限标识使用等级的方式表示时,从预先设置的权限等级表中读取目标账户的权限。例如,请求对文档A执行查看操作,如表1示出的权限等级表中,等级1不具有对文档A执行任何操作的权限,等级2具有对文档A执行查看操作的权限,等级3具有对文档A执行查看和下载操作的权限。若得到的权限标识为3,则该权限标识指示目标账户具有对文档A执行查看和下载的权限。
表1
等级 | 权限 |
1 | 无权 |
2 | 查看 |
3 | 查看、下载 |
在权限标识使用级别的方式表示时,也可以从预先设置的级别权限表中读取目标账户的权限。在权限标识使用数值的方式表示时,可以从预先设置的等级表中读取该数值所在的数值范围指向的权限。在权限标识使用概率值和权重值的方式表示时,确定权限标识指示的权限的方式与上述实施例中的实现方式类似,在此不再赘述。
在获取权限标识之后,将该权限标识发送至请求方,在请求方接收到权限标识之后,可以在终端上对该权限标识按照上述方式解析权限标识对应的权限,并将权限标识和解析出来的权限显示在终端的屏幕上。
将上述实施例应用在目标账户的信用评定上,可以分析出用户知识领域的兴趣倾向以及变化,以往信用评定所注重的用户银行卡使用情况和贷款情况,该数据是一个重要的补充,可提高信用评分的准确度以及人群覆盖度。
根据本发明的上述实施例,获取与阅读记录指示的文本属性对应的目标账户的权限标识可以包括:根据目标账户在预设时长内已阅读的多个文本的文本属性,确定目标账户的属性汇总信息;对属性汇总信息进行映射处理,得到目标账户的权限标识。
由于用户的行为随着时间的流逝在不停的发生变化,每次对目标账户进行权限评定时,可以根据该目标账户在预定时长内的行为,评定用户在该时间段内的权限,可以不再参考距离当前时间久远的行为信息,从而可以使得对用户权限的评定更加准确。
具体地,文本属性用多个属性参数来表示,根据目标账户在预设时长内已阅读的多个文本的文本属性,确定目标账户的属性汇总信息包括:获取为各个属性参数预先配置的权重系数;按照权重系数,配置每个文本的每个属性参数,得到每个文本的属性参数值;汇总多个文本的各个属性参数的属性参数值,得到属性汇总信息。
在属性参数为文本的类别的属性参数时,属性参数的参数值可以为文本属于该类别的概率值,或基于该类别的词出现在在文本中的次数确定,如出现十次,则参数值为10。
在属性参数为文本的特征词的属性参数时,属性参数的参数值可以为特征词的特征向量,也可以为该特征词出现在文本中的概率值,还可以为基于该特征词出现在在文本中的次数确定,如出现十次,则参数值为10。
不同属性参数对最终确定权限标识的影响不同,在该实施例中,利用属性参数的权重系数,配置属性参数,得到每个属性参数的属性参数值,这里的配置可以利用乘积实现,如将属性参数的参数值和权重系数的乘积作为每个属性参数的属性参数值。在该实施例中,权重系数越大的属性参数对权限标识的影响越大。
例如,计算机类别的权重可以设置为0.9,赌博类别的权重可以设置为0.01,这样计算机类别的正能量文本的阅读记录在评价权限标识时占比较重,得到的权限标识的准确率也比较高。
需要说明的是,本申请实施例中同一维度的不同参数的权重系数之和不一定为预定值1,本申请中的权重系数用于表示不同属性参数对权限标识的准确率的影响大小。
上述实施例中,属性汇总信息包括至少一个维度的信息,其中,对属性汇总信息进行映射处理,得到目标账户的权限标识包括:获取预先设置的回归模型,其中,回归模型中记录有属性汇总信息与权限标识的映射关系;将至少一个维度的信息作为回归模型的输入,利用回归模型中记录的映射关系,得到目标账户的权限标识。
其中,上述实施例中的文本属性、和属性汇总信息的维度可以相同,均至少包括文本的类别和/或文本的特征词这两个维度。在上述实施例中,可以将文本类别的汇总结果和文本的特征词的汇总结果一并作为输入,也可以仅将文件类别的汇总结果或文本的特征词的汇总结果作为输入。
下面以执行虚拟资源操作为例,详述本申请实施例。
在一个可选的实施例中,服务器接收到查询请求,获取目标账户已阅读文本的类别的属性汇总信息(如,文章阅读标签分布),得到目标账户的权限标识。
具体地,当用户阅读一篇文章时,可以认为该文章反映了用户知识领域的兴趣倾向,可以用αmWm来表达类别的属性参数,其中Wm是该文章的标签(即类别),αm是对应Wm的权重系数。在第i个时间间隔下,用户所阅读的m篇文章所得到的标签分布vi可以为:vi=H(α1W1,…,αiWm)。累计m个时间间隔,可以得到用户在一段时间范围内(即上述的预设时长)的标签分布G(x)=F(vn,vn-1,…,v1),通过构建的回归模型对G(x)进行映射,可得到用户信用评分(即上述的权限标识)。
上述的H和F表示一定的函数关系,如H表示合集、加权计算、累加计算等,F表示合集、加权计算以及累加计算等。
在一个可选的实施例中,服务器接收到查询请求,获取目标账户已阅读文本的特征词的属性汇总信息(如,文章特征词分布),得到目标账户的权限标识。
具体地,当用户阅读一篇文章时,可以用βnDn来表达文本的特征词的属性参数,其中Dn表示文章的特征词的分布,βn是特征词Dn的权重系数。在第i个时间间隔下,用户所阅读的n篇文章所得到的特征词分布可以为:
vj=H(β1D1,…βnDn)。累计n个时间间隔,可以得到用户x在一段时间范围内的特征词分布P(x)=F(vn,vn-1,…,v1),将特征词分布P(x)作为神经网络的输入层,输入构建的回归模型中,可得到用户信用评分(即权限标识)。
其中,上述的H和F表示一定的函数关系,如H表示合集、加权计算、累加计算等,F表示合集、加权计算以及累加计算等。
在另一个可选的实施例中,服务器接收到查询请求,汇总目标账户已阅读文本的特征词的属性汇总信息(如,文章特征词分布)和目标账户已阅读文本的类别的属性汇总信息(如,文章阅读标签分布),得到目标账户的权限标识。
具体地,对用户的文章标签分布G(x)和特征词分布P(x)使用拼接的方式,得到新的分布H(x),构建回归模型,可得到用户信用评分(如权限标识)。
在上述可选的实施例中,可以用评分表示权限标识。
根据本发明的上述实施例,当文本属性包括文本的类别时,获取目标账户的阅读记录可以包括:获取预先生成的词库,词库中记录有预先获取的N个类别;对文本与预先获取的N个类别进行匹配处理,得到文本的至少一个类别;将文本属于每个类别的概率记录为对应类别的属性参数,其中,阅读记录包括至少一个类别的属性参数。
上述实施例中,对文本与预先获取的N个类别进行匹配处理,得到文本的至少一个类别可以包括:获取词库中保存的第i个类别的多个第一词语,其中,1≤i≤N;统计第一词语出现在文本中的词频和去重词数,其中,词频用于表示文本中出现第一词语的总次数,去重词数用于表述文本中出现第一词语的个数;若词频超过第一阈值、且去重词数超过第二阈值,则确定第i个类别为文本的类别。
进一步地,在获取预先生成的词库之前,方法还可以包括:提取样本中包含的第二词语;利用第二词语的词向量对第二词语进行聚类操作,以将第二词语划分至M个类别中;设置每个类别的标识信息;保存M个类别、每个类别的标识信息及每个类别包含的第二词语,生成词库。
为了保证词库的准确率,可以即时更新生成的词库,具体地,在生成词库之后,在检测到样本更新的情况下,获取更新样本的词库;对生成的词库和更新样本的词库进行合并,得到更新后的词库。
下面结合表2、图3和图4对本申请的上述实施例的更新词库的方式进行详细描述。如图3所示,该实施例可以通过如下步骤实现:
步骤S301:获取样本A。
步骤S302:对样本A进行预处理得到A包含的词语。
具体地,在获得大量文章的文本A之后,对文本进行分词、停用词处理,词性过滤等文本相关预处理,得到A包含的词语。
步骤S303:计算词语的词向量。
步骤S304:利用词向量对词语进行聚类得到N类词。
具体地,通过使用聚类算法,将文本A包含的词语分为N类。
步骤S305:对N类词进行标识,生成词库。
可选地,可以给出每一类词的标签含义,标签和一类词是一一对应的关系。如表2示出的对应关系,表2中的聚类后的类ID和标签均属于该类的标识信息。
表2
图4示出了词库的更新迭代过程,如图4所示该过程可以同如下步骤实现:
步骤S401:获取样本B。
步骤S402:对样本B进行预处理得到B包含的词语。
具体地,在获得大量文章的文本B之后,对文本进行分词、停用词处理,词性过滤等文本相关预处理,得到B包含的词语。
步骤S403:计算词语的词向量。
步骤S404:利用词向量对词语进行聚类得到N类词,生成词库。
具体地,通过使用聚类算法,将文本B包含的词语分为M类。
由上述步骤可知,获得另外一批大量文章的文本,进行同样的文本预处理,计算词向量以及聚类算法,得到新的N类词库B。
步骤S405:计算词库A和词库B各类之间的相似系数。
步骤S406:比较相似系数与阈值β的大小。
其中,当两类词的相似系数不小于阈值β时,则执行步骤S407:合并词库A和词库B为一个类,共用一个标签,这里的合并指的是保留一个词库删除一个词库,可以删除词总数或类别数量少的那个词库。
当两类词的相似系数小于阈值β时,则执行步骤S408:汇总词库B和词库。
步骤S409:对汇总后的词库进行去重。
需要说明的是,汇总后的新的词库C中没有标识信息的类别信息可以增加标识信息的配置。
步骤S410:计算文章的标签分布。
具体地,采用统计的方法,针对词库C中的第i个标签,对文章统计该标签的词频(只要出现第i个标签中的一个词就记一个数,最后得到的总数)和去重词数(第i个标签中的词出现在文本中的数量,不对词进行重复计数,如,词A出现十次,记一次),分别设定阈值Ci和Di,分别将词频和去重词数与上述的阈值Ci和Di作比较,保留词频和去重词数超过阈值的标签,最终得到该文章的文本标签分布Wj。
在另一个可选的实施例中,当文本属性包括文本的特征词时,获取目标账户的阅读记录可以包括:获取文本所包含的至少一个特征词;获取各个特征词的属性参数,其中,阅读记录包括特征词的属性参数。
不同特征词的属性参数对最终确定权限标识的影响不同,在该实施例中,利用特征词的属性参数指示特征词可以定量的对特征词进行分析。
具体地,获取文本所包含的至少一个特征词可以包括:对文本进行分词处理,得到多个关键词;对多个关键词进行停用词处理和过滤操作,得到目标关键词;利用目标关键词的词向量,从目标关键词中过滤出文本的至少一个特征词。
可选地,获取各个特征词的属性参数可以包括:统计各个特征词出现在文本中的词频;基于每个特征词的词频数和权重系数生成每个特征词的特征向量;将特征向量记录为特征词的属性参数。
这里的权重系数的作用与上述实施例中的权重系数作用相同,基于每个特征词的词频数和权重系数生成每个特征词的特征向量,可以利用乘积实现,如将特征词的参数值和权重系数的乘积作为每个属性参数的属性参数值。在该实施例中,权重系数越大的属性参数对权限标识的影响越大。
例如,计算机类别的权重可以设置为0.9,赌博类别的权重可以设置为0.01,这样计算机类别的正能量文本的阅读记录在评价权限标识时占比较重,得到的权限标识的准确率也比较高。
下面结合图5对本申请实施例做详细解释,如图5所示,该实施例可以通过如下步骤实现:
步骤S501:获取文本。
步骤S502:对文本进行预处理,得到多个关键词。
具体地,对文本进行分词、停用词处理,词性过滤等文本相关预处理,得到多个关键词。
步骤S503:确定关键词中的目标关键词。
通过词向量分布筛选N个词作为文章特征词,则可以用词数为N的词典表达所有文章的特征。
步骤S504:计算文章特征词的分布。
一篇文章可以用长度为N向量V表示,Vij表示第i个词在第j文章中的特征向量(如权重):Vij=F(Wi,Cij),其中,Cij为第i个词在第j篇文章的词频数,Wi为第i个词的权重系数。其中的,F表示预定的函数关系,如加权计算,累加计算,或者相乘计算。
现有技术中通过人工词典确定文本的文本属性,这样需要人工维护各个标签的词典,效率低。而使用本申请的词向量聚类方式,可以快速获得大量同属一类的词语,且可以动态更新,降低维护词典的难度。
本发明上述实施例,使用词向量聚类,将相似语义下的词聚合,结合较少人工标注,快速地获得各标签所包含的词,该方法可迭代更新,以便快速地识别新的文章标签。通过统计的方法,统计文章各标签下的词频等数据,以较低的计算性能要求获得该文章的准确的标签分布。
通过获得文章的标签分布可了解到该篇内容分布,通过统计文章作者的标签分布,则可以了解该作者创作的内容分布。通过统计用户的阅读文章的标签分布,则可以了解该用户的文章阅读标签分布,进而分析用户在不同兴趣标签分布下所反应出兴趣差异,行为差异,职业差异,从中得到信用差异,得到信用评分。
本发明使用互联网用户阅读文章时产生的文章标签分布及特征词分布获得用户的评分方式,比传统银行征信基于银行卡使用情况的用户基数更大,可补充更广泛的用户;本发明可及时收集用户的行为变化,对比银行卡刷卡记录及借贷行为记录,网络数据更为全面和及时,进而可以在银行征信基础上得到更准确的信用评分。
在通过上述实施例,得到目标账户的权限标识之后,按照权限标识指示的目标账户执行预定操作的权限,为目标账户提供服务。
如表1中,若得到的权限标识的等级为2,则确定权限查看权限,可以为目标账户提供的只读模式的文档。
本发明上述实施例提供的一种通过分析用户阅读文章时的文章标签分布而获得用户的权限标识的方法,对文本进行分词、停用词处理、词性过滤,对词进行词向量计算,对词向量进行聚类,通过人工对聚类结果进行标注,决定该类词的标签,并且结合迭代算法可以动态更新该词的标签,通过统计文本在不同标签的词频等手段获得该段文本的标签分布,通过文章词向量分布获取文章特征词,通过统计文本特征词的词频等手段获得一段文本的特征词分布。通过计算用户的文章阅读标签分布或特征词分布对用户信用进行评分。从而可扩大信用评分的覆盖用户量以及提高信用评分的准确度。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
根据本发明实施例,还提供了一种用于实施上述账户权限的获取方法的账户权限的获取装置,如图6所示,该装置可以包括:
第一接收单元61,用于接收查询请求,其中,查询请求用于请求查询目标账户的权限标识,权限标识用于指示目标账户执行预定操作的权限;
第一获取单元62,用于获取目标账户的阅读记录,其中,阅读记录用于指示目标账户已阅读的文本的文本属性;
第二获取单元63,用于获取与阅读记录指示的文本属性对应的目标账户的权限标识;
第一发送单元64,用于发送权限标识。
在上述实施例中,在接收到查询请求之后,获取目标账户的阅读记录,用于该目标账户的阅读记录指示的该账户已阅读的文本的属性,确定用户知识领域的兴趣倾向,并获取与阅读记录指示的文本属性对应的目标账户的权限标识,并将权限标识发送至请求方。通过上述实施例,在评定目标账户执行预定操作的权限时,增加了目标账户的阅读记录作,使用更加全面的数据对用户执行预定操作的权限进行评定,提高确定权限的准确度,解决了现有技术中利用不全面的数据对用户权限进行评定,影响评定权限的准确度的问题。
其中,上述实施例中的账户权限的获取方法可以应用在服务器或终端上,本申请实施例均以服务器为例,详述本申请的方案,具体地,服务器接收到查询请求之后,获取登录在第一终端的权限评定应用上的目标账户的阅读记录。
该第一终端上安装有权限评定应用,该权限评定应用可以为独立存在的应用,如第一终端上安装有该权限评定应用的客户端;该权限评定平台还可以为依托第三方应用存在的应用,如该权限评定平台可以通过浏览器应用提供的HTML页面进入,该权限评定平台还可以内嵌在第三方应用中,如权限评定平台可以通过微信应用的权限评定公众号进入。
用户可以在登录权限评定应用之后,请求查询自己的权限标识。以权限评定应用为独立的应用为例,用户启动权限评定客户端,使用账号和密码登录该客户端,登录客户端之后,在该客户端的页面上记录有查询权限的按键,用户点击该查询权限的按键之后,生成查询请求。
第三方账户可以在接收到目标账户执行预定操作的请求之后,生成查询请求,以查询目标账户执行该预定操作的权限。以权限评定应用为独立的应用为例,第三方账户启动权限评定客户端,使用账号和密码登录该客户端,登录客户端之后,接收到目标账户的用于请求执行预定操作的执行请求,第三方账户响应该执行请求,生成查询请求,并将该查询请求发送至服务器。
其中,查询请求中至少携带有预定操作的信息和目标账户的信息。
服务器接收到查询请求之后,可以从权限标识应用中的数据库中获取目标账户的阅读记录,为了获取更加完整的数据,服务器还可以从第三方应用中获取目标账户的阅读记录,该第三方应用可以与权限评定应用建立有关联关系,如权限评定应用与第三方应用已经绑定。
服务器可以实时记录该权限评定应用上的目标账户和与该权限评定应用关联的第三方应用上的账户行为,以获取完整的数据,该第三方应用可以为媒体文件应用,如,资讯应用、读书应用以及文档应用,其中,资讯应用上可以提供大量的图文资料,读书应用上可以提供电子书文件,文档应用可以用来阅读或编辑文档(如word文档和PDF文档等)。
在服务器获取阅读记录之后,获取与阅读记录指示的文本属性对应的目标账户的权限标识,以获取目标账户执行预定操作的权限。
其中,权限标识可以使用下述至少之一的方式表现:文字描述、数值、等级、级别、概率值和权重值,本申请对此不做限定。
在权限标识使用文字描述的方式表示时,识别文字,以确定目标账户执行预定操作的权限高低。例如,得到的权限标识为“目标账户无权查看文档A”,则可以得知目标账户的权限比较低;若得到的权限标识为“目标账户可以下载文档A”,则得知目标账户的权限比较高。
在权限标识使用等级的方式表示时,从预先设置的权限等级表中读取目标账户的权限。例如,请求对文档A执行查看操作,如表1示出的权限等级表中,等级1不具有对文档A执行任何操作的权限,等级2具有对文档A执行查看操作的权限,等级3具有对文档A执行查看和下载操作的权限。若得到的权限标识为3,则该权限标识指示目标账户具有对文档A执行查看和下载的权限。
在权限标识使用级别的方式表示时,也可以从预先设置的级别权限表中读取目标账户的权限。在权限标识使用数值的方式表示时,可以从预先设置的等级表中读取该数值所在的数值范围指向的权限。在权限标识使用概率值和权重值的方式表示时,确定权限标识指示的权限的方式与上述实施例中的实现方式类似,在此不再赘述。
在获取权限标识之后,将该权限标识发送至请求方,在请求方接收到权限标识之后,可以在终端上对该权限标识按照上述方式解析权限标识对应的权限,并将权限标识和解析出来的权限显示在终端的屏幕上。
将上述实施例应用在目标账户的信用评定上,可以分析出用户知识领域的兴趣倾向以及变化,以往信用评定所注重的用户银行卡使用情况和贷款情况,该数据是一个重要的补充,可提高信用评分的准确度以及人群覆盖度。
根据本发明的上述实施例,第二获取单元可以包括:第一确定模块,用于根据目标账户在预设时长内已阅读的多个文本的文本属性,确定目标账户的属性汇总信息;映射模块,用于对属性汇总信息进行映射处理,得到目标账户的权限标识。
可选地,文本属性用多个属性参数来表示,第一确定模块包括:第一获取子模块,用于获取为各个属性参数预先配置的权重系数;配置子模块,用于按照权重系数,配置每个文本的每个属性参数,得到每个文本的属性参数值;汇总子模块,用于汇总多个文本的各个属性参数的属性参数值,得到属性汇总信息。
具体地,属性汇总信息包括至少一个维度的信息,其中,映射模块包括:第二获取子模块,用于获取预先设置的回归模型,其中,回归模型中记录有属性汇总信息与权限标识的映射关系;第一处理子模块,用于将至少一个维度的信息作为回归模型的输入,利用回归模型中记录的映射关系,得到目标账户的权限标识。
根据本发明的上述实施例,当文本属性包括文本的类别时,第一获取单元包括:第一获取模块,用于获取预先生成的词库,词库中记录有预先获取的N个类别;匹配模块,用于对文本与预先获取的N个类别进行匹配处理,得到文本的至少一个类别;第一记录模块,用于将文本属于每个类别的概率记录为对应类别的属性参数,其中,阅读记录包括至少一个类别的属性参数。
具体地,匹配模块包括:第三获取子模块,用于获取词库中保存的第i个类别的多个第一词语,其中,1≤i≤N;第一统计子模块,用于统计第一词语出现在文本中的词频和去重词数,其中,词频用于表示文本中出现第一词语的总次数,去重词数用于表述文本中出现第一词语的个数;第一确定子模块,用于若词频超过第一阈值、且去重词数超过第二阈值,则确定第i个类别为文本的类别。
在上述实施例中,装置还可以包括:提取单元,用于在获取预先生成的词库之前,提取样本中包含的第二词语;聚类单元,用于利用第二词语的词向量对第二词语进行聚类操作,以将第二词语划分至M个类别中;设置单元,用于设置每个类别的标识信息;保存单元,用于保存M个类别、每个类别的标识信息及每个类别包含的第二词语,生成词库。
具体地,当文本属性包括文本的特征词时,第一获取单元包括:第二获取模块,用于获取文本所包含的至少一个特征词;第三获取模块,用于获取各个特征词的属性参数,其中,阅读记录包括特征词的属性参数。
在本发明的上述实施例中,第二获取模块包括:分词子模块,用于对文本进行分词处理,得到多个关键词;第二处理子模块,用于对多个关键词进行停用词处理和过滤操作,得到目标关键词;过滤子模块,用于利用目标关键词的词向量,从目标关键词中过滤出文本的至少一个特征词。
进一步地,第二获取模块包括:第二统计子模块,用于统计各个特征词出现在文本中的词频;生成子模块,用于基于每个特征词的词频数和权重系数生成每个特征词的特征向量;第二记录子模块,用于将特征向量记录为特征词的属性参数。
本实施例中所提供的各个模块与方法实施例对应步骤所提供的使用方法相同、应用场景也可以相同。当然,需要注意的是,上述模块涉及的方案可以不限于上述实施例中的内容和场景,且上述模块可以运行在计算机终端或移动终端,可以通过软件或硬件实现。
根据本发明实施例,还提供了一种用于实施上述账户权限的获取方法的终端,如图7所示,该终端包括:
如图7所示,该终端包括:一个或多个(图中仅示出一个)处理器701、存储器703、以及传输装置(如上述实施例中的用户接口),还可以包括如图7所示的输入输出装置。
其中,存储器703可用于存储软件程序以及模块,如本发明实施例中的账户权限的获取方法和装置对应的程序指令/模块,处理器701通过运行存储在存储器703内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的账户权限的获取方法。存储器703可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器703可进一步包括相对于处理器701远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置用于经由一个网络接收或者发送数据,还可以用于处理器与存储器之间的数据传输。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器703用于存储应用程序。
处理器701可以通过传输装置调用存储器703存储的应用程序,以执行下述步骤:接收查询请求,其中,查询请求用于请求查询目标账户的权限标识,权限标识用于指示目标账户执行预定操作的权限;获取目标账户的阅读记录,其中,阅读记录用于指示目标账户已阅读的文本的文本属性;获取与阅读记录指示的文本属性对应的目标账户的权限标识;发送权限标识。
处理器701可以通过传输装置调用存储器703存储的应用程序,以执行下述步骤:根据目标账户在预设时长内已阅读的多个文本的文本属性,确定目标账户的属性汇总信息;对属性汇总信息进行映射处理,得到目标账户的权限标识。
处理器701可以通过传输装置调用存储器703存储的应用程序,以执行下述步骤:文本属性用多个属性参数来表示,根据目标账户在预设时长内已阅读的多个文本的文本属性,确定目标账户的属性汇总信息包括:获取为各个属性参数预先配置的权重系数;按照权重系数,配置每个文本的每个属性参数,得到每个文本的属性参数值;汇总多个文本的各个属性参数的属性参数值,得到属性汇总信息。
处理器701可以通过传输装置调用存储器703存储的应用程序,以执行下述步骤:属性汇总信息包括至少一个维度的信息,其中,对属性汇总信息进行映射处理,得到目标账户的权限标识包括:获取预先设置的回归模型,其中,回归模型中记录有属性汇总信息与权限标识的映射关系;将至少一个维度的信息作为回归模型的输入,利用回归模型中记录的映射关系,得到目标账户的权限标识。
处理器701可以通过传输装置调用存储器703存储的应用程序,以执行下述步骤:当文本属性包括文本的类别时,获取目标账户的阅读记录包括:获取预先生成的词库,词库中记录有预先获取的N个类别;对文本与预先获取的N个类别进行匹配处理,得到文本的至少一个类别;将文本属于每个类别的概率记录为对应类别的属性参数,其中,阅读记录包括至少一个类别的属性参数。
处理器701可以通过传输装置调用存储器703存储的应用程序,以执行下述步骤:获取词库中保存的第i个类别的多个第一词语,其中,1≤i≤N;统计第一词语出现在文本中的词频和去重词数,其中,词频用于表示文本中出现第一词语的总次数,去重词数用于表述文本中出现第一词语的个数;若词频超过第一阈值、且去重词数超过第二阈值,则确定第i个类别为文本的类别。
处理器701可以通过传输装置调用存储器703存储的应用程序,以执行下述步骤:在获取预先生成的词库之前,提取样本中包含的第二词语;利用第二词语的词向量对第二词语进行聚类操作,以将第二词语划分至M个类别中;设置每个类别的标识信息;保存M个类别、每个类别的标识信息及每个类别包含的第二词语,生成词库。
处理器701可以通过传输装置调用存储器703存储的应用程序,以执行下述步骤:在生成词库之后,在检测到样本更新的情况下,获取更新样本的词库;对生成的词库和更新样本的词库进行合并,得到更新后的词库。
处理器701可以通过传输装置调用存储器703存储的应用程序,以执行下述步骤:当文本属性包括文本的特征词时,获取目标账户的阅读记录包括:获取文本所包含的至少一个特征词;获取各个特征词的属性参数,其中,阅读记录包括特征词的属性参数。
处理器701可以通过传输装置调用存储器703存储的应用程序,以执行下述步骤:对文本进行分词处理,得到多个关键词;对多个关键词进行停用词处理和过滤操作,得到目标关键词;利用目标关键词的词向量,从目标关键词中过滤出文本的至少一个特征词。
处理器701可以通过传输装置调用存储器703存储的应用程序,以执行下述步骤:统计各个特征词出现在文本中的词频;基于每个特征词的词频数和权重系数生成每个特征词的特征向量;将特征向量记录为特征词的属性参数。
需要进一步说明的是,寄存区域为系统的内存和系统处理器中的寄存器。
本领域普通技术人员可以理解,图7所示的结构仅为示意,终端可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile InternetDevices,MID)、PAD等终端设备。图7其并不对上述电子装置的结构造成限定。例如,终端还可包括比图7中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图7所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行上述信息推送方法的程序代码。
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行上述账户权限的获取方法的程序代码。
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
接收查询请求,其中,查询请求用于请求查询目标账户的权限标识,权限标识用于指示目标账户执行预定操作的权限;获取目标账户的阅读记录,其中,阅读记录用于指示目标账户已阅读的文本的文本属性;获取与阅读记录指示的文本属性对应的目标账户的权限标识;发送权限标识。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:根据目标账户在预设时长内已阅读的多个文本的文本属性,确定目标账户的属性汇总信息;对属性汇总信息进行映射处理,得到目标账户的权限标识。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:文本属性用多个属性参数来表示,根据目标账户在预设时长内已阅读的多个文本的文本属性,确定目标账户的属性汇总信息包括:获取为各个属性参数预先配置的权重系数;按照权重系数,配置每个文本的每个属性参数,得到每个文本的属性参数值;汇总多个文本的各个属性参数的属性参数值,得到属性汇总信息。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:属性汇总信息包括至少一个维度的信息,其中,对属性汇总信息进行映射处理,得到目标账户的权限标识包括:获取预先设置的回归模型,其中,回归模型中记录有属性汇总信息与权限标识的映射关系;将至少一个维度的信息作为回归模型的输入,利用回归模型中记录的映射关系,得到目标账户的权限标识。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:当文本属性包括文本的类别时,获取目标账户的阅读记录包括:获取预先生成的词库,词库中记录有预先获取的N个类别;对文本与预先获取的N个类别进行匹配处理,得到文本的至少一个类别;将文本属于每个类别的概率记录为对应类别的属性参数,其中,阅读记录包括至少一个类别的属性参数。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取词库中保存的第i个类别的多个第一词语,其中,1≤i≤N;统计第一词语出现在文本中的词频和去重词数,其中,词频用于表示文本中出现第一词语的总次数,去重词数用于表述文本中出现第一词语的个数;若词频超过第一阈值、且去重词数超过第二阈值,则确定第i个类别为文本的类别。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:在获取预先生成的词库之前,提取样本中包含的第二词语;利用第二词语的词向量对第二词语进行聚类操作,以将第二词语划分至M个类别中;设置每个类别的标识信息;保存M个类别、每个类别的标识信息及每个类别包含的第二词语,生成词库。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:在生成词库之后,在检测到样本更新的情况下,获取更新样本的词库;对生成的词库和更新样本的词库进行合并,得到更新后的词库。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:当文本属性包括文本的特征词时,获取目标账户的阅读记录包括:获取文本所包含的至少一个特征词;获取各个特征词的属性参数,其中,阅读记录包括特征词的属性参数。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:对文本进行分词处理,得到多个关键词;对多个关键词进行停用词处理和过滤操作,得到目标关键词;利用目标关键词的词向量,从目标关键词中过滤出文本的至少一个特征词。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:统计各个特征词出现在文本中的词频;基于每个特征词的词频数和权重系数生成每个特征词的特征向量;将特征向量记录为特征词的属性参数。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (19)
1.一种账户权限的获取方法,其特征在于,包括:
接收查询请求,其中,所述查询请求用于请求查询目标账户的权限标识,所述权限标识用于指示所述目标账户执行预定操作的权限;
获取所述目标账户的阅读记录,其中,所述阅读记录用于指示所述目标账户已阅读的文本的文本属性;
获取与所述阅读记录指示的所述文本属性对应的所述目标账户的权限标识;
发送所述权限标识;
其中,当所述文本属性包括文本的类别时,获取所述目标账户的阅读记录包括:获取预先生成的词库,所述词库中记录有预先获取的N个类别;对所述文本与预先获取的N个类别进行匹配处理,得到所述文本的至少一个类别;将所述文本属于每个所述类别的概率记录为对应所述类别的属性参数,其中,所述阅读记录包括所述至少一个类别的属性参数。
2.根据权利要求1所述的方法,其特征在于,获取与所述阅读记录指示的所述文本属性对应的所述目标账户的权限标识包括:
根据所述目标账户在预设时长内已阅读的多个所述文本的文本属性,确定所述目标账户的属性汇总信息;
对所述属性汇总信息进行映射处理,得到所述目标账户的权限标识。
3.根据权利要求2所述的方法,其特征在于,所述文本属性用多个属性参数来表示,根据所述目标账户在预设时长内已阅读的多个所述文本的文本属性,确定所述目标账户的属性汇总信息包括:
获取为各个属性参数预先配置的权重系数;
按照所述权重系数,配置每个所述文本的每个属性参数,得到每个所述文本的属性参数值;
汇总多个所述文本的各个属性参数的属性参数值,得到所述属性汇总信息。
4.根据权利要求2或3所述的方法,其特征在于,所述属性汇总信息包括至少一个维度的信息,其中,对所述属性汇总信息进行映射处理,得到所述目标账户的权限标识包括:
获取预先设置的回归模型,其中,所述回归模型中记录有所述属性汇总信息与权限标识的映射关系;
将所述至少一个维度的信息作为所述回归模型的输入,利用所述回归模型中记录的映射关系,得到所述目标账户的权限标识。
5.根据权利要求1所述的方法,其特征在于,对所述文本与预先获取的N个类别进行匹配处理,得到所述文本的至少一个类别包括:
获取所述词库中保存的第i个类别的多个第一词语,其中,1≤i≤N;
统计所述第一词语出现在所述文本中的词频和去重词数,其中,所述词频用于表示所述文本中出现所述第一词语的总次数,所述去重词数用于表述所述文本中出现所述第一词语的个数;
若所述词频超过第一阈值、且所述去重词数超过第二阈值,则确定所述第i个类别为所述文本的类别。
6.根据权利要求1所述的方法,其特征在于,在获取预先生成的词库之前,所述方法还包括:
提取样本中包含的第二词语;
利用所述第二词语的词向量对所述第二词语进行聚类操作,以将所述第二词语划分至M个类别中;
设置每个所述类别的标识信息;
保存所述M个类别、每个所述类别的标识信息及每个所述类别包含的第二词语,生成所述词库。
7.根据权利要求6所述的方法,其特征在于,在生成所述词库之后,所述方法还包括:
在检测到样本更新的情况下,获取更新样本的词库;
对生成的词库和所述更新样本的词库进行合并,得到更新后的词库。
8.根据权利要求1所述的方法,其特征在于,当所述文本属性包括所述文本的特征词时,获取所述目标账户的阅读记录包括:
获取所述文本所包含的至少一个特征词;
获取各个所述特征词的属性参数,其中,所述阅读记录包括所述特征词的属性参数。
9.根据权利要求8所述的方法,其特征在于,获取所述文本所包含的至少一个特征词包括:
对所述文本进行分词处理,得到多个关键词;
对所述多个关键词进行停用词处理和过滤操作,得到目标关键词;
利用所述目标关键词的词向量,从所述目标关键词中过滤出所述文本的至少一个特征词。
10.根据权利要求8所述的方法,其特征在于,获取各个所述特征词的属性参数包括:
统计各个所述特征词出现在所述文本中的词频;
基于每个所述特征词的词频数和权重系数生成每个所述特征词的特征向量;
将所述特征向量记录为所述特征词的属性参数。
11.一种账户权限的获取装置,其特征在于,包括:
第一接收单元,用于接收查询请求,其中,所述查询请求用于请求查询目标账户的权限标识,所述权限标识用于指示所述目标账户执行预定操作的权限;
第一获取单元,用于获取所述目标账户的阅读记录,其中,所述阅读记录用于指示所述目标账户已阅读的文本的文本属性;
第二获取单元,用于获取与所述阅读记录指示的所述文本属性对应的所述目标账户的权限标识;
第一发送单元,用于发送所述权限标识;
其中,当所述文本属性包括文本的类别时,所述第一获取单元包括:第一获取模块,用于获取预先生成的词库,所述词库中记录有预先获取的N个类别;匹配模块,用于对所述文本与预先获取的N个类别进行匹配处理,得到所述文本的至少一个类别;第一记录模块,用于将所述文本属于每个所述类别的概率记录为对应所述类别的属性参数,其中,所述阅读记录包括所述至少一个类别的属性参数。
12.根据权利要求11所述的装置,其特征在于,所述第二获取单元包括:
第一确定模块,用于根据所述目标账户在预设时长内已阅读的多个所述文本的文本属性,确定所述目标账户的属性汇总信息;
映射模块,用于对所述属性汇总信息进行映射处理,得到所述目标账户的权限标识。
13.根据权利要求12所述的装置,其特征在于,所述文本属性用多个属性参数来表示,所述第一确定模块包括:
第一获取子模块,用于获取为各个属性参数预先配置的权重系数;
配置子模块,用于按照所述权重系数,配置每个所述文本的每个属性参数,得到每个所述文本的属性参数值;
汇总子模块,用于汇总多个所述文本的各个属性参数的属性参数值,得到所述属性汇总信息。
14.根据权利要求12或13所述的装置,其特征在于,所述属性汇总信息包括至少一个维度的信息,其中,所述映射模块包括:
第二获取子模块,用于获取预先设置的回归模型,其中,所述回归模型中记录有所述属性汇总信息与权限标识的映射关系;
第一处理子模块,用于将所述至少一个维度的信息作为所述回归模型的输入,利用所述回归模型中记录的映射关系,得到所述目标账户的权限标识。
15.根据权利要求12所述的装置,其特征在于,所述匹配模块包括:
第三获取子模块,用于获取所述词库中保存的第i个类别的多个第一词语,其中,1≤i≤N;
第一统计子模块,用于统计所述第一词语出现在所述文本中的词频和去重词数,其中,所述词频用于表示所述文本中出现所述第一词语的总次数,所述去重词数用于表述所述文本中出现所述第一词语的个数;
第一确定子模块,用于若所述词频超过第一阈值、且所述去重词数超过第二阈值,则确定所述第i个类别为所述文本的类别。
16.根据权利要求12所述的装置,其特征在于,所述装置还包括:
提取单元,用于在获取预先生成的词库之前,提取样本中包含的第二词语;
聚类单元,用于利用所述第二词语的词向量对所述第二词语进行聚类操作,以将所述第二词语划分至M个类别中;
设置单元,用于设置每个所述类别的标识信息;
保存单元,用于保存所述M个类别、每个所述类别的标识信息及每个所述类别包含的第二词语,生成所述词库。
17.根据权利要求12所述的装置,其特征在于,当所述文本属性包括所述文本的特征词时,所述第一获取单元包括:
第二获取模块,用于获取所述文本所包含的至少一个特征词;
第三获取模块,用于获取各个所述特征词的属性参数,其中,所述阅读记录包括所述特征词的属性参数。
18.根据权利要求17所述的装置,其特征在于,所述第二获取模块包括:
分词子模块,用于对所述文本进行分词处理,得到多个关键词;
第二处理子模块,用于对所述多个关键词进行停用词处理和过滤操作,得到目标关键词;
过滤子模块,用于利用所述目标关键词的词向量,从所述目标关键词中过滤出所述文本的至少一个特征词。
19.根据权利要求17所述的装置,其特征在于,所述第二获取模块包括:
第二统计子模块,用于统计各个所述特征词出现在所述文本中的词频;
生成子模块,用于基于每个所述特征词的词频数和权重系数生成每个所述特征词的特征向量;
第二记录子模块,用于将所述特征向量记录为所述特征词的属性参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610414403.XA CN106095939B (zh) | 2016-06-12 | 2016-06-12 | 账户权限的获取方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610414403.XA CN106095939B (zh) | 2016-06-12 | 2016-06-12 | 账户权限的获取方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106095939A CN106095939A (zh) | 2016-11-09 |
CN106095939B true CN106095939B (zh) | 2018-04-20 |
Family
ID=57846586
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610414403.XA Active CN106095939B (zh) | 2016-06-12 | 2016-06-12 | 账户权限的获取方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106095939B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106789989B (zh) * | 2016-12-09 | 2019-08-02 | 武汉斗鱼网络科技有限公司 | 一种用户权限验证方法及装置 |
CN108629610B (zh) * | 2017-03-23 | 2022-02-08 | 腾讯科技(深圳)有限公司 | 推广信息曝光量的确定方法和装置 |
CN110363206B (zh) * | 2018-03-26 | 2023-06-27 | 阿里巴巴集团控股有限公司 | 数据对象的聚类、数据处理及数据识别方法 |
CN110244917B (zh) * | 2019-04-30 | 2022-11-11 | 厦门汉印电子技术有限公司 | 便携打印机权限信息指示方法、装置、终端及存储介质 |
CN110263248B (zh) * | 2019-05-21 | 2023-11-28 | 平安科技(深圳)有限公司 | 一种信息推送方法、装置、存储介质和服务器 |
CN112883390B (zh) * | 2021-02-18 | 2022-04-22 | 腾讯科技(深圳)有限公司 | 一种权限控制方法、装置及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101493913A (zh) * | 2008-01-23 | 2009-07-29 | 阿里巴巴集团控股有限公司 | 一种评估网上用户信用的方法及系统 |
CN102163310A (zh) * | 2010-02-22 | 2011-08-24 | 深圳市腾讯计算机系统有限公司 | 一种基于用户信用度等级的信息推送方法和装置 |
CN105138897B (zh) * | 2015-08-24 | 2019-04-16 | 百度在线网络技术(北京)有限公司 | 确定用户权限的方法及装置 |
CN105631732A (zh) * | 2015-12-31 | 2016-06-01 | 北京京东尚科信息技术有限公司 | 确定用户权限的方法和装置 |
-
2016
- 2016-06-12 CN CN201610414403.XA patent/CN106095939B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN106095939A (zh) | 2016-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106095939B (zh) | 账户权限的获取方法和装置 | |
CN112613501A (zh) | 信息审核分类模型的构建方法和信息审核方法 | |
CN107862022B (zh) | 文化资源推荐系统 | |
CN110516910A (zh) | 基于大数据的保单核保模型训练方法和核保风险评估方法 | |
WO2017097231A1 (zh) | 话题处理方法及装置 | |
CN103810162B (zh) | 推荐网络信息的方法和系统 | |
CN107563429A (zh) | 一种网络用户群体的分类方法及装置 | |
CN106682686A (zh) | 一种基于手机上网行为的用户性别预测方法 | |
CN110163647A (zh) | 一种数据处理方法及装置 | |
CN107545038B (zh) | 一种文本分类方法与设备 | |
CN107341183A (zh) | 一种基于暗网网站综合特征的网站分类方法 | |
CN106709370B (zh) | 一种基于文本内容的长词识别方法及系统 | |
CN108885624A (zh) | 信息推荐系统及方法 | |
CN112632405A (zh) | 一种推荐方法、装置、设备及存储介质 | |
CN107368856A (zh) | 恶意软件的聚类方法及装置、计算机装置及可读存储介质 | |
CN109948730A (zh) | 一种数据分类方法、装置、电子设备及存储介质 | |
CN109492093A (zh) | 基于高斯混合模型和em算法的文本分类方法及电子装置 | |
CN110309234A (zh) | 一种基于知识图谱的客户持仓预警方法、装置及存储介质 | |
CN104834739B (zh) | 互联网信息存储系统 | |
CN110399479A (zh) | 搜索数据处理方法、装置、电子设备及计算机可读介质 | |
CN114819967A (zh) | 数据处理方法、装置、电子设备及计算机可读存储介质 | |
CN112347254B (zh) | 新闻文本的分类方法、装置、计算机设备和存储介质 | |
CN105408894A (zh) | 一种用户身份类别确定方法以及装置 | |
CN109960719A (zh) | 一种文件处理方法和相关装置 | |
CN112801784A (zh) | 一种数字货币交易所的比特币地址挖掘方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |