Nothing Special   »   [go: up one dir, main page]

CN110347922A - 基于相似度的推荐方法、装置、设备和存储介质 - Google Patents

基于相似度的推荐方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN110347922A
CN110347922A CN201910608960.9A CN201910608960A CN110347922A CN 110347922 A CN110347922 A CN 110347922A CN 201910608960 A CN201910608960 A CN 201910608960A CN 110347922 A CN110347922 A CN 110347922A
Authority
CN
China
Prior art keywords
content
recommended
similarity
content item
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910608960.9A
Other languages
English (en)
Other versions
CN110347922B (zh
Inventor
胡志超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI ZHENGDA HIMALAYAN NETWORK TECHNOLOGY Co Ltd
Original Assignee
SHANGHAI ZHENGDA HIMALAYAN NETWORK TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI ZHENGDA HIMALAYAN NETWORK TECHNOLOGY Co Ltd filed Critical SHANGHAI ZHENGDA HIMALAYAN NETWORK TECHNOLOGY Co Ltd
Priority to CN201910608960.9A priority Critical patent/CN110347922B/zh
Publication of CN110347922A publication Critical patent/CN110347922A/zh
Application granted granted Critical
Publication of CN110347922B publication Critical patent/CN110347922B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种基于相似度的推荐方法、装置、设备和存储介质。该方法包括:当获取到推荐请求时确定目标内容,根据所述目标内容确定至少一个待推荐集合;查找相似度信息表,获得所述目标内容与各待推荐集合中待推荐内容的相似度,所述相似度信息表预先根据相似度生成规则生成;根据各所述相似度确定目标待推荐内容并将所述目标待推荐内容进行推荐。本发明实施例的技术方案,通过根据目标内容确定多个待推荐集合,丰富了推荐内容,可提高推荐准确度,增强用户体验程度。

Description

基于相似度的推荐方法、装置、设备和存储介质
技术领域
本发明实施例涉及计算机应用技术领域,尤其涉及一种基于相似度的推荐方法、装置、设备和存储介质。
背景技术
在大数据和互联网飞速发展的时代,许多电商和互联网企业广泛运用各种推荐技术,以主动推荐的形式将产品个性化的呈现给用户。
现有推荐方法中,仅能将的预设产品推荐给用户,例如用户观看电影,仅能将相似电影推荐给用户,收听专辑只能将相似专辑推荐给用户,表现的形式多为“收看该电影的人还收看了哪些电影”,无法实现丰富多样的推荐,不能根据收听的节目推荐相似电影和书籍,现有推荐方法存在推荐内容单一、无法根据用户使用数据进行准确推荐和用户使用体验程度差的问题。
发明内容
本发明提供一种基于相似度的推荐方法、装置、设备和存储介质,以实现丰富推荐内容,提升推荐准确度,可增强用户体验程度。
第一方面,本发明实施例提供了一种基于相似度的推荐方法,该方法包括:
当获取到推荐请求时确定目标内容,根据所述目标内容确定至少一个待推荐集合;
查找相似度信息表,获得所述目标内容与各待推荐集合中待推荐内容的相似度,所述相似度信息表预先根据相似度生成规则生成;
根据各所述相似度确定目标待推荐内容并将所述目标待推荐内容进行推荐。
第二方面,本发明实施例提供了一种基于相似度的推荐装置,该装置包括:
集合确定模块,用于当获取到推荐请求时确定目标内容,根据所述目标内容确定至少一个待推荐集合;
相似度获取模块,用于查找相似度信息表,获得所述目标内容与各待推荐集合中待推荐内容的相似度,所述相似度信息表预先根据相似度生成规则生成;
内容推荐模块,用于根据各所述相似度确定目标待推荐内容并将所述目标待推荐内容进行推荐。
第三方面,本发明实施例还提供了一种设备,该设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的基于相似度的推荐方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本发明实施例中任一所述的基于相似度的推荐方法。
本发明实施例的技术方案通过在获取到推荐请求时,根据目标内容确定待推荐集合,查找预先生成的相似度信息表获取到目标内容与待推荐集合中待推荐内容的相似度,根据各相似度确定目标待推荐内容,并推荐待目标待推荐内容,丰富了推荐内容,提高了推荐准确度,使得用户体验程度显著提升。
附图说明
图1是本发明实施例一提供的一种基于相似度的推荐方法的步骤流程图;
图2是本发明实施例二提供的一种基于相似度的推荐方法的步骤流程图;
图3是本发明实施例二提供的一种基于相似度的推荐方法的示例图;
图4是本发明实施例三提供的一种基于相似度的推荐装置的结构示意图;
图5是本发明实施例四提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构,此外,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一
图1是本发明实施例一提供的一种基于相似度的推荐方法的步骤流程图,本实施例可适用于内容推荐的情况,该方法可以由基于相似度的推荐装置来执行,该装置可以采用硬件和/或软件的方式来实现,参见图1,该方法具体包括如下步骤:
步骤101、当获取到推荐请求时确定目标内容,根据所述目标内容确定至少一个待推荐集合。
其中,推荐请求可以是用户需要获取推荐内容的请求,具体形式可以包括用户输入搜索词、点击电影简介、收听音乐专辑和购买阅读书籍等,目标内容可以是用户需要的直接内容,可以包括搜索词内容、电影简介内容、音乐专辑内容和书籍内容等,待推荐集合可以是与目标内容具有联系的内容集合,可以待推荐集合中的内容可以与目标内容相似或者相近,各待推荐集合中的内容可以属于不同类型,例如,待推荐集合可以分别为电影集合、音乐集合和图书集合等,不同待推荐集合中存储的具体内容对应类型不相同。
具体的,当用户进行输入搜索词、点击电影简介、收听音乐专辑和购买阅读书籍等行为时,将用户进行的行为可以作为推荐请求,可以根据推荐请求中的具体行为确定用户明确需要获取到的目标内容,可以根据目标内容获取包含相关或者相近的内容的待推荐集合,待推荐集合可以为一个也可以为多个,可以根据目标内容在预存的关系表中查找获取,关系表中可以将不同的目标内容与对应的待推荐集合关联存储,进一步的,根据目标内容确定待推荐集合的方式还可以包括使用目标内容在用户历史使用数据中进行查找,可以将查找到的内容作为待推荐集合。
步骤102、查找相似度信息表,获得所述目标内容与各待推荐集合中待推荐内容的相似度,所述相似度信息表预先根据相似度生成规则生成。
其中,相似度信息表可以是存储有不同内容之间相似度的存储文件,可以关联存储有相似度和对应的内容,示例性的,相似度可以三元信息的方式进行存储,第一参数可以为对应第一内容的标识号,第二参数可以为对应第二内容的标识号,第三参数为第一内容和第一内容对应的相似度值;待推荐内容可以是待推荐集合中的内容项,各待推荐集合中可以存储有多个待推荐内容;相似度生成规则可以是用于生成各内容间相似度的生成规则。
在本发明实施例中,可以对存储有各内容间相似度的相似度信息表进行查找,查找的依据可以为目标内容和各待推荐集合中各待推荐内容,可以分别获取到目标内容与各待推荐内容的相似度,可以理解的是,相似度信息表可以是预先生成的信息表,可以根据相似度生成规则生成,进一步的,相似度信息表还可以按照固定时间阈值对相似度信息表进行更新,例如,可以每天午夜12点对相似度信息表中的相似度值和内容项进行更改。
步骤103、根据各所述相似度确定目标待推荐内容并将所述目标待推荐内容进行推荐。
其中,目标待推荐内容可以是被确定用于进行推荐的内容,可以是与目标内容相似度最大的内容,也可以是与目标内容相似度最小的内容,可以通过反向选择相似度最小的内容作为目标待推荐内容以进一步增强内容推荐的丰富度,避免推荐内容单一化,目标待推荐内容可以为一个内容也可以为多个内容,可以具体根据用户推荐请求确定,例如,可以根据用户推荐请求不同的类型确定不同数量的目标待推荐内容。
具体的,可以根据获取到的目标内容与各待推荐内容的相似度数值大小进行排序,可以选取排序中固定阈值比例的待推荐内容作为目标待推荐内容,在排序中选取待推荐内容的方式可以包括按照相似度数值从大到小选取;也可是按照相似度数值从小到大选取;还可以根据选择一部分相似度数值较大的待推荐内容,再选取一部分相似度数值较小的待推荐内容。可以在确定目标待推荐内容后,对目标待推荐内容进行推荐,例如,可以在用户搜索框中显示“搜索该词语的用户还收看了哪些电影”。
本发明实施例的技术方案,通过在获取到推荐请求时确定目标内容,并根据目标内容确定待推荐集合,查找相似度信息表获取到目标内容与各待推荐集合中待推荐内容的相似度,相似度信息表可以根据相似度生成规则预先生成,基于相似度确定目标待推荐内容,并将目标待推荐内容进行展示,丰富了推荐内容的种类,提高了内容推荐的准确度,可显著提高用户的体验程度。
实施例二
图2是本发明实施例二提供的一种基于相似度的推荐方法的步骤流程图,本实施例以上述实施例为基础进行具体化,参见图2,本发明实施例的方法具体包括:
步骤201、根据用户的历史使用数据及筛选条件,形成第一内容集和第二内容集。
其中,用户可以是指可以获取到使用信息的所有用户的集合,历史使用数据可以是用户在使用过程中产生的数据,历史使用数据可以存储在服务器中,筛选条件可以是在历史使用数据中筛选出内容项的条件,可以包括内容项对应的属性类型和数据格式等,第一内容集与第二内容集可以是包含内容项的集合,第一内容集与第二内容集的属性类型不同,例如第一内容集为电影内容的集合,第二内容集为音乐内容的集合。
具体的,可以使用筛选条件在历史使用数据中进行筛选获取到内容项,可以根据不同的筛选条件筛选出的内容项分别作为第一内容集和第二内容集,例如,可以在历史使用数据中筛选出曾经搜索、点击、收听、购买和浏览过的内容项,可以将搜索过的内容项作为第一内容项,将购买过的内容项作为第二内容项;还可以根据筛选条件在历史使用数据中筛选出内容项,再根据内容项的属性类型进行分类,例如,可以将属于电影内容的内容项作为第一内容项,可以将属于音乐内容的内容项作为第二内容项。可以理解的是,筛选条件还可以包括用户类型、产生时间和用户所属地区等条件,可以根据筛选条件的不同确定出不同的内容项,以生成第一内容集和第二内容集。
步骤202、根据所述第一内容集和第二内容集确定第三内容集。
其中,第三内容集可以是由第一内容集和第二内容集中内容项确定的内容集,第三内容集中的内容项可以由第一内容集合和第二内容集中内容项组合生成,例如,第一内容集合中内容项为电影内容,第二内容集合中内容项为漫画内容,那么第三内容集中内容可以为电影内容和漫画内容,第三内容集可以通过第一内容集和第二内容集中内容项自由组合生成。
具体的,可以将第一内容集中内容项和第二内容集中的内容项进行组合生成新的内容项,可以将包含由新的内容项的集合作为第三内容项,组合的方式可以包括直接组合或者按照属性关系进行组合,例如,可以任意选择第一内容集中的内容项与第二内容集中的内容项组合,还可以将第一内容集中于第二内容集中存在属性关系的内容项组合,属性关系可以包括属于产地关系、出版公司关系和作者关系等。
步骤203、分别统计第一内容集、第二内容集以及第三内容集内所包括各内容项在所述历史使用数据中的出现频次。
其中,内容项可以是各内容集中具体的内容项,例如具体电影名称、专辑名称、图书名称和搜索词等。
具体的,可以获取第一内容集、第二内容集和第三内容集中的内容项,可以根据获取到的内容项再历史使用数据中进行查找并统计各内容项出现的频次,示例性的,在大数据框架下,可以将各第一内容集、第二内容集和第三内容集中的内容项进行分片,可以由大数据框架下的计算单元分别统计各分片中内容项在历史使用数据中的出现次数,在各计算单元计算完毕后,可以由管理节点将统计到的出现次数进行汇总生成各内容项对应的出现频次。
步骤204、根据各所述出现频次及预设相似度计算公式,生成第一内容集所包括各第一内容项与第二内容集所包括各第二内容项之间的相似度,形成相似度信息表。
其中,预设相似度计算公式可以提取设定好的用于确定各内容项间相似度的计算公式,示例性的,预设相似度计算公式可以为其中,S(AB)为内容项A与内容项B的相似度,F(AB)为内容项AB的出现频率,F(A)为内容项A的出现频率,F(B)为内容项B的出现频率,第一内容项可以用于表征第一内容集中的内容项,具体可以是各内容项对应的唯一标识号,第二内容项可以用于表征第二内容集中的内容项,具体可以是各内容项对应的唯一标识号。
具体的,可以将第一内容集、第二内容集和第三内容集中各内容项的出现频次,作为预设相似度计算公式的输入参数进行计算,可以将计算结果作为第一内容项与第二内容项间的相似度,例如,将第一内容集中的内容项A的出现频次、第二内容集中内容项B的出现频次和第三内容项中内容项AB的出现频次代入到预设相似度计算公式中生成内容项A与内容项B的相似度;可以在获取到相似度后将内容项及对应的相似度关联存储生成相似度信息表,可以理解的是,相似度表中可以存储有相似度和对应相似度的内容项。
可以理解的是,在本发明实施例的基础上,为了提高推荐方法的处理效率,步骤202和步骤203可以同时进行,示例性的,图3是本发明实施例二提供的一种基于相似度的推荐方法的示例图,在获取到第一内容集和第二内容集后,可以同时进行步骤213和步骤212,将统计第一内容集和第二内容集中各内容项的出现频次和根据第一内容集和第二内容集生成第三内容集同时进行,可以在生成第三内容集后,统计第三内容集中各内容项的出现频次,最后可以根据各所述出现频次及预设相似度计算公式,生成第一内容集所包括各第一内容项与第二内容集所包括各第二内容项之间的相似度。
步骤205、当获取到推荐请求时,在所述推荐请求中提取目标内容。
具体的,当用户进行输入搜索词、点击电影简介、收听音乐专辑和购买阅读书籍等行为时,可以将用户进行的行为作为推荐请求,可以根据推荐请求中的具体行为确定用户明确需要获取到的目标内容。
步骤206、根据所述目标内容在用户的历史使用数据中查找关联存储的待推荐内容。
其中,历史使用数据可以用户搜索、点击、收听、购买和浏览内容生成的数据,历史使用数据中可以存储有内容信息。
具体的,可以将目标内容作为查找依据,可以在历史用户使用数据中查找搜索、点击、收听、购买和浏览过目标内容的使用用户,可以在使用用户的数据中查找其他内容,可以将查找到的内容作为待推荐内容。
步骤207、根据所述待推荐内容的属性类型进行分类以生成至少一个待推荐集合。
其中,属性类型可以是待推荐内容的属性信息,可以用于标识待推荐内容的具体表现形式,属性类型可以包括:音乐、图书、电影、漫画和动漫等。
在本发明实施例中,可以将获取到的各待推荐内容根据对应的属性类型进行分类,可以将属于相同类型的待推荐内容分类到相同分类集合中,将分类后的各个分类集合可以作为待推荐集合,示例性的,查找到的待推荐内容包括:黑衣人、千与千寻、我们很好、可惜没如果、她说、江南、玩具总动员和绝杀慕尼黑等,可以根据待推荐内容的属性类别分为电影结合和音乐集合,电影集合可以包括黑衣人、千与千寻、玩具总动员和绝杀慕尼黑,音乐集合可以包括我们很好、可惜没如果、她说和江南等,可以将分类生成的电影集合和音乐集合作为待推荐集合,可以理解的是,待推荐集合中集合数量不唯一,可以根据待推荐内容的具体情况确定,待推荐集合的数量可以为一个、两个、或多个。
步骤208、获取所述目标内容的标识号记为第一查找内容项。
其中,标识号可以是目标内容在相似度信息表中的唯一标识号,不同内容之间的标识号可以不同,第一查找内容项,可以是在相似度信息表中进行查找的依据。
具体的,可以查找对应目标内容的唯一标识号,内容与标识号的对应关系可以预先存储在存储空间中,可以根据目标内容在存储空间内进行查找,可以将查找到的标识号记作第一查找内容项。
步骤209、获取各所述待推荐集合中待推荐内容的标识号分别记为第二查找内容项。
其中,标识号可以是各待推荐内容在相似度信息表中的唯一标识号,不同内容之间的标识号可以不同,第二查找内容项,可以是在相似度信息表中进行查找的依据,具体为各待推荐内容的标识号。
具体的,可以分别查找各待推荐集合中各待推荐内容的标识号,标识号和内容可以预先进行关联存储,可以根据各待推荐内容在存储空间内进行查找获取对应各待推荐内容的标识号,可以将获取到各标识号作为第二查找内容项,可以用于在相似度信息表中查找的依据。
步骤210、基于所述第一查找内容项和各所述第二查找内容项查找所述相似度信息表,将各查找结果作为对应所述目标内容与各所述待推荐内容的相似度。
在本发明实施例中,可以根据第一查找内容项和各第二查找内容项分别在相似度信息表中进行查找,可以将查找结果作为目标内容和待推荐内容对应的相似度,当各第二查找内容项均和第一查找内容项获取到对应的相似度后,可以将获取到的所有查找结果作为对应目标内容与各待推荐内容的相似度。
步骤211、根据各所述相似度确定目标待推荐内容并将所述目标待推荐内容进行推荐。
具体的,可以根据获取到的目标内容与各待推荐内容的相似度数值大小进行排序,可以选取排序中固定阈值比例的待推荐内容作为目标待推荐内容,可以在确定目标待推荐内容后,对目标待推荐内容进行推荐。
本发明实施例的技术方案,通过根据筛选条件在用户的历史使用数据筛选出第一内容集和第二内容集,根据第一内容集和第二内容集生成第三内容集,分别统计第一内容集、第二内容集和第三内容集各内容项的出现频次,根据各所述内容项的出现频次和预设相似度计算公式生成第一内容集所包括第一内容项和第二内容集所包括第二内容项之间的相似度,并形成相似度信息表,当获取到推荐请求时,根据推荐请求提取目标内容,根据目标内容在用户的历史使用数据中查找关联的待推荐内容,将各待推荐内容进行分类生成待推荐集合,将目标内容的标识号记为第一查找内容项,将各待推荐内容的标识号作为第二内容查找项,根据第一查找内容项和第二查找内容项查找相似度信息表,获取目标内容和待推荐内容对应的相似度,根据相似度确定目标待推荐内容并将目标待推荐内容推荐,根据用户的历史使用数据确定各内容的相似度,提高了内容推荐的准确度,更加贴切用户的使用习惯,丰富了推荐内容,可显著提高用户的使用体验程度。
在上述发明实施例的基础上,根据所述第一内容集和第二内容集确定第三内容集,包括:
提取所述第一内容集中的各第一内容项和第二内容集中的各第二内容项;将各所述第一内容项和各所述第二内容项使用笛卡儿积计算得到至少一个第三内容项,并基于第三内容项组合生成第三内容集。
其中,第一内容项可以是用于表征第一内容集中的内容项,第二内容项可以是用于表征第二内容集中的内容项,笛卡儿积可以是将各第一内容项与各第二内容项分别进行组合的计算,例如各第一内容项分别为a、b和c,各第二内容项可以分别为α和β,第一内容笛卡儿积可以通过计算后获得到组合aα、aβ、bα、bβ、cα和cβ,第三内容集可以是包含有各第三内容项的集合。
具体的,可以提取出第一内容集和第二内容集中的所有第一内容项和第二内容项,可以将提取到的各第一内容项和各第二内容项基于笛卡儿积进行计算生成由第一内容项和第二内容项组合生成的第三内容项,可以由第三内容项组合生成第三内容集。
在上述实施例的基础上,预设相似度计算公式包括:
其中,Similarity(AB)为第一内容项A与第二内容项B之间的相似度,F(AB)为第三内容项AB在历史使用数据中出现频次,F(A)为第一内容项A在历史使用数据中出现频次,F(B)为第二内容项B在历史使用数据中出现频次,α为热门内容项抑制参数,β为冷门内容项抑制参数,进一步的,为了抑制冷门内容和热门内容对相似度计算产生误差,可以将中的α设为20,β设为1000,可以将中的α设为0.8,β设为1000以降低冷门内容和热门内容对相似度计算的影响。
在上述发明实施例的基础上,目标内容的属性标签与目标待推荐内容的属性标签的不同。
其中,属性标签可以是目标内容或目标待推荐内容所属类型的标签,例如可以包括电影、电视剧、音乐专辑和图书等。
具体的,在本发明实施例的基础上,目标内容可以是与目标待推荐内容不为相同属性标签的内容,在根据目标内容选择目标待推荐内容时,除选择相同属性标签的内容外,还可以选择不同属性标签的内容以丰富推荐内容,提高用户使用体验度。
实施例三
图4是本发明实施例三提供的一种基于相似度的推荐装置的结构示意图,可执行本发明任意实施例所提供的基于相似度的推荐方法,具备执行方法相应的功能模块和有益效果。该装置可以由软件和/或硬件实现,具体包括:集合确定模块301、相似度获取模块302和内容推荐模块303。
其中,集合确定模块301,用于当获取到推荐请求时确定目标内容,根据所述目标内容确定至少一个待推荐集合;
相似度获取模块302,用于查找相似度信息表,获得所述目标内容与各待推荐集合中待推荐内容的相似度,所述相似度信息表预先根据相似度生成规则生成;
内容推荐模块303,用于根据各所述相似度确定目标待推荐内容并将所述目标待推荐内容进行推荐。
本发明实施例的技术方案,通过集合确定模块在获取到推荐请求时确定目标内容,并根据目标内容确定待推荐集合,相似度获取模块查找相似度信息表获取到目标内容与各待推荐集合中待推荐内容的相似度,相似度信息表可以根据相似度生成规则预先生成,内容推荐模块基于相似度确定目标待推荐内容,并将目标待推荐内容进行展示,丰富了推荐内容的种类,提高了内容推荐的准确度,可显著提高用户的体验程度。
在上述发明实施例的基础上,该装置还包括筛选模块、内容集生成模块、频次统计模块和信息表模块,具体用于生成相似度生成表;
其中,筛选模块,用于根据用户的历史使用数据及筛选条件,形成第一内容集和第二内容集。
内容集生成模块,用于根据所述第一内容集和第二内容集确定第三内容集。
频次统计模块,用于分别统计第一内容集、第二内容集以及第三内容集内所包括各内容项在所述历史使用数据中的出现频次。
信息表模块,用于根据各所述出现频次及预设相似度计算公式,生成第一内容集所包括各第一内容项与第二内容集所包括各第二内容项之间的相似度,形成相似度信息表。
在上述发明实施例的基础上,相似度获取模块包括:
第一标识单元,用于获取所述目标内容的标识号记为第一查找内容项。
第二标识单元,用于获取各所述待推荐集合中待推荐内容的标识号分别记为第二查找内容项。
查找单元,用于基于所述第一查找内容项和各所述第二查找内容项查找所述相似度信息表,将各查找结果作为对应所述目标内容与各所述待推荐内容的相似度。
在上述发明实施例的基础上,内容集生成模块,包括:
内容项提取单元,用于提取所述第一内容集中的各第一内容项和第二内容集中的各第二内容项。
内容集确定单元,用于将各所述第一内容项和各所述第二内容项使用笛卡儿积计算得到至少一个第三内容项,并基于第三内容项组合生成第三内容集。
在上述发明实施例的基础上,信息表模块中的预设相似度计算公式包括:
其中,Similarity(AB)为第一内容项A与第二内容项B之间的相似度,F(AB)为第三内容项AB在历史使用数据中出现频次,F(A)为第一内容项A在历史使用数据中出现频次,F(B)为第二内容项B在历史使用数据中出现频次,α为热门内容项抑制参数,β为冷门内容项抑制参数。
在上述发明实施例的基础上,集合确定模块包括:
内容获取单元,用于当获取到推荐请求时,在所述推荐请求中提取目标内容。
内容查找单元,用于根据所述目标内容在用户的历史使用数据中查找关联存储的待推荐内容。
内容分类单元,用于根据所述待推荐内容的属性类型进行分类以生成至少一个待推荐集合。
在上述发明实施例的基础上,该装置中的目标内容的属性标签与目标待推荐内容的属性标签的不同。
实施例四
图5是本发明实施例四提供的一种设备的结构示意图,如图5所示,该设备包括处理器40、存储器41、输入装置42和输出装置43;设备中处理器40的数量可以是一个或多个,图5中以一个处理器40为例;设备中的处理器40、存储器41、输入装置42和输出装置43可以通过总线或其他方式连接,图5中以通过总线连接为例。
存储器41作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的基于相似度的推荐方法对应的程序模块(例如,基于相似度的推荐装置中的集合确定模块301、相似度获取模块302和内容推荐模块303)。处理器40通过运行存储在存储器41中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的基于相似度的推荐方法。
存储器41可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器41可进一步包括相对于处理器40远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置42可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置73可包括显示屏等显示设备。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种基于相似度的推荐方法,该方法包括:
当获取到推荐请求时确定目标内容,根据所述目标内容确定至少一个待推荐集合;
查找相似度信息表,获得所述目标内容与各待推荐集合中待推荐内容的相似度,所述相似度信息表预先根据相似度生成规则生成;
根据各所述相似度确定目标待推荐内容并将所述目标待推荐内容进行推荐。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的基于相似度的推荐方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述基于相似度的推荐装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种基于相似度的推荐方法,其特征在于,包括:
当获取到推荐请求时确定目标内容,根据所述目标内容确定至少一个待推荐集合;
查找相似度信息表,获得所述目标内容与各待推荐集合中待推荐内容的相似度,所述相似度信息表预先根据相似度生成规则生成;
根据各所述相似度确定目标待推荐内容并将所述目标待推荐内容进行推荐。
2.根据权利要求1所述的方法,其特征在于,预先根据相似度生成规则生成相似度信息表包括:
根据用户的历史使用数据及筛选条件,形成第一内容集和第二内容集;
根据所述第一内容集和第二内容集确定第三内容集;
分别统计第一内容集、第二内容集以及第三内容集内所包括各内容项在所述历史使用数据中的出现频次;
根据各所述出现频次及预设相似度计算公式,生成第一内容集所包括各第一内容项与第二内容集所包括各第二内容项之间的相似度,形成相似度信息表。
3.根据权利要求1或2所述的方法,其特征在于,所述查找相似度信息表,获得所述目标内容与各待推荐集合中待推荐内容的相似度,包括:
获取所述目标内容的标识号记为第一查找内容项;
获取各所述待推荐集合中待推荐内容的标识号分别记为第二查找内容项;
基于所述第一查找内容项和各所述第二查找内容项查找所述相似度信息表,将各查找结果作为对应所述目标内容与各所述待推荐内容的相似度。
4.根据权利要2所述的方法,其特征在于,所述根据所述第一内容集和第二内容集确定第三内容集,包括:
提取所述第一内容集中的各第一内容项和第二内容集中的各第二内容项;
将各所述第一内容项和各所述第二内容项使用笛卡儿积计算得到至少一个第三内容项,并基于第三内容项组合生成第三内容集。
5.根据权利要求2所述的方法,其特征在于,所述预设相似度计算公式包括:
其中,Similarity(AB)为第一内容项A与第二内容项B之间的相似度,F(AB)为第三内容项AB在历史使用数据中出现频次,F(A)为第一内容项A在历史使用数据中出现频次,F(B)为第二内容项B在历史使用数据中出现频次,α为热门内容项抑制参数,β为冷门内容项抑制参数。
6.根据权利要求1所述的方法,其特征在于,所述当获取到推荐请求时确定目标内容,根据所述目标内容确定至少一个待推荐集合,包括:
当获取到推荐请求时,在所述推荐请求中提取目标内容;
根据所述目标内容在用户的历史使用数据中查找关联存储的待推荐内容;
根据所述待推荐内容的属性类型进行分类以生成至少一个待推荐集合。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述目标内容的属性标签与目标待推荐内容的属性标签的不同。
8.一种基于相似度的推荐装置,其特征在于,包括:
集合确定模块,用于当获取到推荐请求时确定目标内容,根据所述目标内容确定至少一个待推荐集合;
相似度获取模块,用于查找相似度信息表,获得所述目标内容与各待推荐集合中待推荐内容的相似度,所述相似度信息表预先根据相似度生成规则生成;
内容推荐模块,用于根据各所述相似度确定目标待推荐内容并将所述目标待推荐内容进行推荐。
9.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的基于相似度的推荐方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的基于相似度的推荐方法。
CN201910608960.9A 2019-07-08 2019-07-08 基于相似度的推荐方法、装置、设备和存储介质 Active CN110347922B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910608960.9A CN110347922B (zh) 2019-07-08 2019-07-08 基于相似度的推荐方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910608960.9A CN110347922B (zh) 2019-07-08 2019-07-08 基于相似度的推荐方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN110347922A true CN110347922A (zh) 2019-10-18
CN110347922B CN110347922B (zh) 2023-06-20

Family

ID=68178155

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910608960.9A Active CN110347922B (zh) 2019-07-08 2019-07-08 基于相似度的推荐方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN110347922B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111182332A (zh) * 2019-12-31 2020-05-19 广州华多网络科技有限公司 视频处理方法、装置、服务器及存储介质
CN111859156A (zh) * 2020-08-04 2020-10-30 上海风秩科技有限公司 发布人群的确定方法、装置、可读存储介质及电子设备
CN113836429A (zh) * 2021-10-13 2021-12-24 掌阅科技股份有限公司 书籍推荐方法、终端及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150106801A1 (en) * 2013-10-16 2015-04-16 Anand Agrawal Recommending applications to portable electronic devices
CN108829764A (zh) * 2018-05-28 2018-11-16 腾讯科技(深圳)有限公司 推荐信息获取方法、装置、系统、服务器及存储介质
CN109461012A (zh) * 2017-09-06 2019-03-12 中国移动通信有限公司研究院 一种产品推荐方法、装置及终端

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150106801A1 (en) * 2013-10-16 2015-04-16 Anand Agrawal Recommending applications to portable electronic devices
CN109461012A (zh) * 2017-09-06 2019-03-12 中国移动通信有限公司研究院 一种产品推荐方法、装置及终端
CN108829764A (zh) * 2018-05-28 2018-11-16 腾讯科技(深圳)有限公司 推荐信息获取方法、装置、系统、服务器及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111182332A (zh) * 2019-12-31 2020-05-19 广州华多网络科技有限公司 视频处理方法、装置、服务器及存储介质
CN111859156A (zh) * 2020-08-04 2020-10-30 上海风秩科技有限公司 发布人群的确定方法、装置、可读存储介质及电子设备
CN111859156B (zh) * 2020-08-04 2024-02-02 上海秒针网络科技有限公司 发布人群的确定方法、装置、可读存储介质及电子设备
CN113836429A (zh) * 2021-10-13 2021-12-24 掌阅科技股份有限公司 书籍推荐方法、终端及存储介质

Also Published As

Publication number Publication date
CN110347922B (zh) 2023-06-20

Similar Documents

Publication Publication Date Title
US8200667B2 (en) Method and apparatus for constructing user profile using content tag, and method for content recommendation using the constructed user profile
Tso-Sutter et al. Tag-aware recommender systems by fusion of collaborative filtering algorithms
JP4857333B2 (ja) 諸文書にわたる文脈要約情報の決定方法
CN104573054B (zh) 一种信息推送方法和设备
US8650094B2 (en) Music recommendation using emotional allocation modeling
WO2018072071A1 (zh) 知识图谱构建系统及方法
WO2018040069A1 (zh) 信息推荐系统及方法
CN110888990A (zh) 文本推荐方法、装置、设备及介质
CN101233516A (zh) 利用动态简档组织内容
WO2014183035A1 (en) Method and system for capturing and exploiting user intent in a conversational interaction based information retrieval system
JP2002245212A (ja) グループ形成システム、グループ形成装置、グループ形成方法、プログラム、及び媒体
CN110347922A (zh) 基于相似度的推荐方法、装置、设备和存储介质
CN106354867A (zh) 多媒体资源的推荐方法及装置
CN112836126A (zh) 基于知识图谱的推荐方法、装置、电子设备及存储介质
Sun et al. A hybrid approach for article recommendation in research social networks
Hoyt et al. PodcastRE Analytics: Using RSS to Study the Cultures and Norms of Podcasting.
WO2009054611A1 (en) System and method for managing information map
CN103226601A (zh) 一种图片搜索的方法和装置
Xu et al. Do adjective features from user reviews address sparsity and transparency in recommender systems?
CN112818195A (zh) 数据获取方法、装置、系统及计算机存储介质
CN110263318A (zh) 实体名称的处理方法、装置、计算机可读介质及电子设备
US10452710B2 (en) Selecting content items based on received term using topic model
WO2017135889A1 (en) Ontology determination methods and ontology determination devices
CN115827978A (zh) 一种信息推荐方法、装置、设备及计算机可读存储介质
JP2008225584A (ja) 物品推薦装置、物品推薦システム、物品推薦方法及び物品推薦プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Room 2062, Building No. 588 Zixing Road, Minhang District, Shanghai, 201203

Applicant after: Shanghai Himalaya Technology Co.,Ltd.

Address before: Room 2062, Building No. 588 Zixing Road, Minhang District, Shanghai, 201203

Applicant before: SHANGHAI ZHENGDA XIMALAYA NETWORK TECHNOLOGY CO.,LTD.

GR01 Patent grant
GR01 Patent grant