CN117216362A - 内容推荐方法、装置、设备、介质和程序产品 - Google Patents
内容推荐方法、装置、设备、介质和程序产品 Download PDFInfo
- Publication number
- CN117216362A CN117216362A CN202211516062.9A CN202211516062A CN117216362A CN 117216362 A CN117216362 A CN 117216362A CN 202211516062 A CN202211516062 A CN 202211516062A CN 117216362 A CN117216362 A CN 117216362A
- Authority
- CN
- China
- Prior art keywords
- cluster
- feature representation
- target object
- target
- mapping
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 89
- 238000013507 mapping Methods 0.000 claims abstract description 219
- 230000006870 function Effects 0.000 claims abstract description 138
- 230000003993 interaction Effects 0.000 claims abstract description 93
- 238000007621 cluster analysis Methods 0.000 claims abstract description 35
- 238000000605 extraction Methods 0.000 claims description 38
- 238000012549 training Methods 0.000 claims description 31
- 238000012545 processing Methods 0.000 claims description 28
- 238000004458 analytical method Methods 0.000 claims description 23
- 239000000203 mixture Substances 0.000 claims description 20
- 238000003860 storage Methods 0.000 claims description 18
- 230000002776 aggregation Effects 0.000 claims description 10
- 238000004220 aggregation Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 8
- 239000006185 dispersion Substances 0.000 claims description 6
- 230000000694 effects Effects 0.000 abstract description 13
- 238000010801 machine learning Methods 0.000 abstract description 5
- 238000005516 engineering process Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 12
- 238000011176 pooling Methods 0.000 description 12
- 238000013473 artificial intelligence Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000013508 migration Methods 0.000 description 5
- 230000005012 migration Effects 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 4
- 238000013475 authorization Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000013526 transfer learning Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000000547 structure data Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种内容推荐方法、装置、设备、介质和程序产品,涉及机器学习领域。该方法包括:基于目标对象在第一功能平台中的对象属性数据提取第一对象特征表示,将第一对象特征表示与其他对象的第二对象特征表示进行聚类分析,得到目标对象对应的聚类簇中心;基于目标对象在第二功能平台中的历史交互数据,提取域外特征表示;获取与聚类簇中心对应的映射关系函数对域外特征表示进行映射,得到域内特征表示,将域内特征表示和对象特征表示结合,得到目标特征表示,并基于目标特征表示对目标对象与候选内容推荐池进行匹配,向目标对象推送目标内容。能够针对目标对象提供个性化映射关系函数,提高映射结果的准确性,提高内容推荐的效果。
Description
技术领域
本申请实施例涉及机器学习领域,特别涉及一种内容推荐方法、装置、设备、介质和程序产品。
背景技术
用户基于网络在不同平台获取需要的信息内容,而平台中存在的信息内容量巨大,用户难以对其进行筛选,获得自己想要的信息内容。
相关技术中,个性化推荐系统通过获得授权后收集用户在平台上的属性和历史交互数据,捕捉用户的兴趣特征,利用设计好的推荐算法为用户生成特定的推荐列表,对用户进行个性化内容的推荐。
然而,在推荐系统中,存在数据稀疏问题和冷启动问题。数据稀疏问题是指用户的历史交互数据较少,冷启动问题是指新用户进入系统后,没有历史交互数据。推荐系统无法准确的分析出用户的兴趣和偏好,导致后续对用户进行个性化内容的推荐效果不佳。
发明内容
本申请实施例提供了一种内容推荐方法、装置、设备、介质和程序产品,能够对冷用户进行个性化内容推荐。所述技术方案如下:
一方面,提供了一种内容推荐方法,所述方法包括:
基于目标对象在第一功能平台中的对象属性数据提取所述目标对象的第一对象特征表示;
将所述第一对象特征表示与所述第一功能平台中的其他对象的第二对象特征表示进行聚类分析,得到所述目标对象对应的聚类簇中心;
基于所述目标对象在第二功能平台中的历史交互数据,提取所述目标对象的域外特征表示;
获取与所述聚类簇中心对应的映射关系函数对所述域外特征表示进行映射,得到所述目标对象的域内特征表示,其中,所述映射关系函数用于指示所述目标对象在所述第二功能平台和所述第一功能平台之间特征表示的映射关系;
将所述域内特征表示和所述第一对象特征表示结合,得到所述目标对象的目标特征表示,并基于所述目标特征表示对所述目标对象与候选内容推荐池进行匹配,向所述目标对象推送所述候选内容推荐池中的目标内容。
另一方面,提供了一种内容推荐装置,所述装置包括:
提取模块,基于目标对象在第一功能平台中的对象属性数据提取所述目标对象的第一对象特征表示;
聚类分析模块,将所述第一对象特征表示与所述第一功能平台中的其他对象的第二对象特征表示进行聚类分析,得到所述目标对象对应的聚类簇中心;
所述提取模块,基于所述目标对象在第二功能平台中的历史交互数据,提取所述目标对象的域外特征表示;
获取模块,获取与所述聚类簇中心对应的映射关系函数对所述域外特征表示进行映射,得到所述目标对象的域内特征表示,其中,所述映射关系函数用于指示所述目标对象在所述第二功能平台和所述第一功能平台之间特征表示的映射关系;
推荐模块,将所述域内特征表示和所述第一对象特征表示结合,得到所述目标对象的目标特征表示,并基于所述目标特征表示对所述目标对象与候选内容推荐池进行匹配,向所述目标对象推送所述候选内容推荐池中的目标内容。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述本申请实施例中任一所述的内容推荐方法。
另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述本申请实施例中任一所述的内容推荐方法。
另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中任一所述的内容推荐方法。
本申请实施例提供的技术方案带来的有益效果至少包括:
通过对第一功能平台中的所有对象进行聚类分析,得到每个对象所属于的聚类簇以及每个对象所对应的聚类簇中心,基于聚类簇中心获取个性化的映射关系函数,个性化的映射关系函数能够针对不同的对象,实现从域外特征表示到域内特征表示的映射过程,提高了映射结果的准确率。获取目标对象的第一对象特征表示以及,目标对象在第二功能平台的历史交互数据经过特征提取得到的域外特征表示,基于第一对象特征表示找到目标对象对应的聚类簇中心,根据目标对象对应的聚类簇中心获得与目标对象所对应的映射关系函数,将目标对象的域外特征表示输入至映射关系函数中,经过映射得到目标对象的域内特征表示,可以在目标对象仅在第二功能平台中存在历史交互数据、在第一功能平台中不存在历史交互数据时,得到目标对象在第一功能平台的交互特点,从而基于目标对象的域内特征表示和第一对象特征表示,对目标对象进行在第一功能平台上的个性化内容推荐,解决了冷用户问题和数据稀疏问题,使得推荐内容更加符合目标对象的真实兴趣,提高了推荐效果。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个示例性实施例提供的对指定用户进行个性化的内容推荐的示意图;
图2是本申请一个示例性实施例提供的实施环境示意图;
图3是本申请一个示例性实施例提供的内容推荐方法的流程图;
图4是本申请一个示例性实施例提供的基于域内特征对目标对象进行个性化内容推荐的示意图;
图5是本申请一个示例性实施例提供的个性化的映射关系函数的训练方法流程图;
图6是本申请一个示例性实施例提供的聚类分析的方法流程图;
图7是本申请一个示例性实施例提供的对第一聚类簇分布结果进行离散分析处理后获得第二聚类簇分布结果的示意图;
图8是本申请一个示例性实施例提供的获取目标对象的域外特征表示的方法流程图;
图9是本申请一个示例性实施例提供的异构图的示意图;
图10是本申请一个示例性实施例提供的基于元路径的异构图卷积示意图;
图11是本申请一个示例性实施例提供的内容推荐装置的结构框图;
图12是本申请另一个示例性实施例提供的内容推荐装置的结构框图;
图13是本申请一个示例性实施例提供的计算机设备的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大特征表示的提取技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
个性化推荐系统是互联网和电子商务发展的产物,它是建立在海量数据挖掘基础上的一种高级商务智能平台,向用户提供个性化的信息服务和决策支持。
个性化推荐系统通过收集用户的属性和历史的行为数据,利用设计好的推荐算法来构建用户兴趣模型,为每个用户生成其特定的推荐列表并推送给他们,从而达到个性化推荐的目的。
然而,在推荐系统中,有两个长期存在的问题:数据稀疏问题及冷启动问题。数据稀疏问题指的是用户和物品的交互记录很少,很难很好地捕捉用户的兴趣或者物品的特性;冷启动问题指的是新用户或者新物品刚进入系统,没有交互记录的情况。传统的推荐算法是基于用户和物品的交互数据来进行推荐的,在这两种情况下很难做出合适的推荐。
迁移学习(Transfer Learning,TL)是机器学习中的一个名词,是指一种学习对另一种学习的影响,或习得的经验对完成其他活动的影响。迁移广泛存在于各种知识、技能与社会规范的学习中。
迁移学习利用源域丰富的知识和信息来提升目标域的性能,减少目标域所需要的样本数量,在视觉领域和自然语言处理领域被广泛使用。比如:来辨识汽车的知识(或者是模型)也可以被用来提升识别卡车的能力。
其中,源域(Source Domain,SD)是指已有的知识领域,表示与目标样本不同的领域,通常具有丰富的监督信息和标签数据;目标域(Target Domain,TD)是指需要进行学习的领域,表示目标样本所在的领域,通常只有少量标签数据,或者无标签数据。
受到迁移学习的启发,在解决冷启动问题和数据稀疏问题时,可以通过获取用户在其他领域(源域)的交互信息,对交互信息进行分析,从而捕捉用户在一定方面的偏好,丰富目标域的数据;或者,在新用户启动时增加可供推荐系统利用的信息,缓解数据稀疏问题和冷启动问题,从而对用户进行跨域推荐个性化内容。
其中,跨域推荐旨在结合多个领域的数据,引入其它域(源域)的信息来进行辅助,使得在目标域甚至多个域上都能进行更好的推荐。不同域之间一般要存在一些重叠的信息,例如不同域的公共用户,或者不同域的相同物品等等都属于重叠信息的范畴,一般需要存在这样的重叠信息,才能进行不同域间信息的迁移。
针对用户冷启动问题,跨域推荐算法中有一个主流的分支:建立合适的映射函数迁移用户的兴趣,即建立从源域到目标域兴趣的映射。
这类方法的假设在于,用户在不同领域的兴趣存在一定的映射关系,则可以通过用户在源域的兴趣经过映射,得到目标域的兴趣。即使在目标域上没有行为的用户,也能通过在源域的兴趣经过映射函数得到目标域上的兴趣,从而进行合适的推荐,缓解用户冷启动问题。
然而,相关技术中,基于映射的跨域推荐算法对于所有的用户都共享同一个映射函数。每个用户之间存在个性化差异,从源域到目标域的兴趣映射差别很大,若所有用户共享同一个映射函数,则无法很好地建模这种复杂的映射关系,使得映射结果准确性较低,基于映射结果对用户进行个性化内容推荐的效果较差。
本申请实施例中,通过设计个性化映射函数,将冷用户在源域的域外特征,经过个性化映射函数,映射到目标域中,得到该冷用户的域内特征,基于域内特征对冷用户进行个性化的内容推荐。
示意性的,如图1所示,首先获取样本用户101在第一功能平台中的对象属性数据,对样本用户101的对象属性数据进行特征提取,得到样本用户的第二对象特征表示102,对样本用户的第二对象特征表示102进行聚类分析,得到聚类簇分布结果103,聚类簇分布结果103中包含多个聚类簇,每个聚类簇都对应各自的聚类中心。基于聚类中心对候选映射函数进行训练,得到映射模块104,其中,映射模块104中包含多种映射关系函数。其中,映射模块104中的每种映射关系函数都对应一个聚类簇,获取聚类簇的聚类中心,可以根据聚类中心索引到对应的映射关系函数。
获取指定用户111在第一功能平台中的对象属性数据,对指定用户111的对象属性数据数据进行特征提取,得到指定用户的第一对象特征表示112。其中,指定用户111可以是冷用户,即在第一功能平台中没有历史交互数据的用户;指定用户111也可以是回流用户,即在历史周期内,在第一功能平台中不存在历史交互数据,但最近周期内又存在历史交互数据的用户。
获取指定用户111在第二功能平台中的历史交互数据,对指定用户111的历史交互数据进行特征提取,得到指定用户的域外特征表示113。
计算指定用户的第一对象特征表示112与聚类簇分布结果103中聚类中心之间的相似度,基于相似度获取指定用户111对应的聚类中心。基于指定用户111对应的聚类中心在映射模块104中获取适用于指定用户111的目标映射关系函数114。
将指定用户的域外特征表示113输入至目标映射关系函数114中,映射得到指定用户111的域内特征115,将指定用户111的域内特征115和指定用户的第一对象特征表示112拼接到一起,形成指定用户的目标特征表示116。
基于指定用户的目标特征表示116,筛选出指定用户111可能感兴趣的个性化内容117,将个性化内容117推荐给指定用户111。
值得注意的是,上述用户的对象属性数据和历史交互数据等,为用户主动上传的数据;或者,为经过用户单独授权后获取的数据。
需要说明的是,本申请所涉及的信息(包括但不限于用户的对象属性信息、用户和第一功能平台、第二功能平台之间的历史交互信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户单独授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如,本申请中涉及到的对象属性数据是在充分授权的情况下获取的。
其次,对本申请实施例中涉及的实施环境进行说明,示意性的,请参考图2,该实施环境中涉及终端210、服务器220,终端210和服务器220之间通过通信网络230连接。
在一些实施例中,终端210用于向服务器220发送用户的对象特征表示和域外特征表示。在一些实施例中,终端210中安装有具有特征映射的功能(如:将域外特征表示映射成域内特征表示的功能)的应用程序,示意性的,终端210中安装有个性化映射功能的应用程序。如:终端210中安装有搜索引擎程序、旅游应用程序、生活辅助应用程序、即时通讯应用程序、视频类程序、游戏类程序、新闻类应用程序、内容推荐应用程序等,本申请实施例对此不加以限定。
服务器220中在获取用户的对象特征表示和域外特征表示后,通过对用户的对象特征表示和域外特征表示进行特征分析,得到用户的域内特征表示,并基于用户的域内特征表示筛选出用户可能感兴趣的个性化内容,从而应用于下游应用中,如:基于域内特征的用户聚合、用户个性化内容推荐等。
服务器220在获取用户的对象特征表示和域外特征表示后,对应用户的域内特征表示,将域内特征表示返回给终端210中,由终端210最终根据域内特征表示筛选出个性化内容,并对用户进行内容推荐。其中,个性化内容包括用可能感兴趣的域内信息流内容,如:信息流文章、视频、音乐等内容。
上述终端可以是手机、平板电脑、台式电脑、便携式笔记本电脑、智能电视、车载终端、智能家居设备等多种形式的终端设备,本申请实施例对此不加以限定。
值得注意的是,上述服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
其中,云技术(Cloud technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。云技术基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后盾支撑,只能通过云计算来实现。
在一些实施例中,上述服务器还可以实现为区块链系统中的节点。
结合上述名词简介和应用场景,对本申请提供的内容推荐方法进行说明,该方法可以由服务器或者终端执行,也可以由服务器和终端共同执行,本申请实施例中,以该方法由服务器执行为例进行说明,如图3所示,该方法包括如下步骤。
步骤310,基于目标对象在第一功能平台中的对象属性数据提取目标对象的第一对象特征表示。
第一功能平台中包含不同种类的平台元素,目标对象可以和第一功能平台中的平台元素进行交互。
可选地,第一功能平台的类型包括但不限于如下类型:(1)游戏平台;(2)社交平台;(3)购物平台。
可选地,第一功能平台中包含的平台元素种类包括但不限于以下几种中的至少一种:
(1)视频元素:影视剧、动画视频等;
(2)图像元素:包含信息流内容的图像;
(3)音乐元素:歌曲、伴奏等;
(4)文本元素:期刊文章、电子书籍等。
可选地,第一功能平台可提供的服务包括但不限于几种:(1)在线直播推送;(2)视频号内容推送;(3)订阅号文章推送;(4)交流社群推送。
可选地,目标对象和第一功能平台中的平台元素未进行有效交互,也即目标对象在第一功能平台中不存在有效历史交互数据,包括但不限于以下几种情况:
(1)目标对象是第一功能平台新注册的冷用户,没有历史交互数据;
(2)目标对象是第一功能平台的回流用户,超过预设时长未登陆第一功能平台,历史交互数据被清除;
(3)目标对象在第一功能平台登陆频率低于频率阈值,历史交互数据的数量低于阈值;
(4)目标对象在第一功能平台注册时长未达到时长阈值,在时长阈值内的历史交互数据有效性较低。
可选地,目标对象与第一功能平台进行交互,产生历史交互数据的方式包括但不限于以下几种:
(1)目标对象浏览第一功能平台推送的内容:文章、视频、直播内容等;
(2)目标对象在第一功能平台进行交易:购物、卖出商品;
(3)目标对象在第一功能平台主动上传内容:文章、视频等。
可选地,目标对象在第一功能平台中的对象属性数据,包括但不限于以下几种类型中的至少一种:
(1)目标对象的年龄信息;
(2)目标对象的IP地址(Internet Protocol Address);
(3)目标对象的性别信息;
(4)目标对象的设备型号。
示意性地,使用特征提取网络对目标对象在第一功能平台中的对象属性数据进行特征提取,得到目标对象的第一对象特征表示。
步骤320,将第一对象特征表示与第一功能平台中的其他对象的第二对象特征表示进行聚类分析,得到目标对象对应的聚类簇中心。
在第一功能平台中包括目标对象和至少一个其他对象,每个对象都具有各自对应的对象属性数据。
首先,基于其他对象在第一功能平台中的对象属性数据,提取其他对象的第二对象特征表示。
其中,其他对象的第二对象特征表示与目标对象的第一对象特征表示属于同类型特征表示,或者是通过相同特征提取网络提取得到的特征表示,用于表示对象在第一功能平台中的对象属性数据的特点。
基于其他对象的第二对象特征表示,对其他对象进行聚类分析,得到多个聚类簇。每个其他对象都对应各自的聚类簇,聚类簇的中心点为聚类簇中心,每个聚类簇都包含各自对应的聚类簇中心。
基于目标对象的第一对象特征表示和聚类簇中心之间的相似度,得到目标对象对应的聚类簇中心。至少包括下列两种方式:
(1)计算第一对象特征表示和每个聚类簇中心之间的距离,将与第一对象特征表示距离最小的聚类簇中心,作为目标对象对应的聚类簇中心;
(2)计算第一对象特征表示和每个聚类簇中心之间的相似度,基于相似度对应数值,得到目标对象属于每个聚类簇的概率,基于概率最大值得到目标对象对应的聚类簇中心。
步骤330,基于目标对象在第二功能平台中的历史交互数据,提取目标对象的域外特征表示。
第二功能平台中也包含不同种类的平台元素,目标对象可以和第二功能平台中的平台元素进行交互。
其中,第一功能平台和第二功能平台之间的关系包括但不限于:(1)同一个软件中的不同功能模块,目标对象为登录在该软件中的帐号;(2)同一个网站中的不同功能模块,目标对象为登录该网站的帐号,或者目标对象为与当前浏览网站的终端标识码对应的对象;(3)目标对象的账号在第一功能平台和第二功能平台相关联,如:目标对象采用第一帐号登录第一功能平台,并使用第二帐号登录第二功能平台,在第一功能平台和第二功能平台之间,第一帐号和第二帐号建立有绑定关系。
可选地,目标对象和第二功能平台中的平台元素存在有效交互行为,也即目标对象在第二功能平台中存在有效历史交互数据,包括但不限于以下几种情况。
(1)目标对象在第二功能平台注册的时长超过时长阈值;
(2)目标对象在第二功能平台登陆频率高于频率阈值;
(3)目标对象在第二功能平台的历史交互数据的数量超过阈值。
获取目标对象在第二功能平台中的历史交互数据,对历史交互数据进行特征提取处理,得到目标对象的域外特征表示。
其中,域外是指第一功能平台以外的范围,域外特征表示也即目标对象不在第一功能平台上,而在其他功能平台上生成的历史交互数据。
值得注意的是,目标对象可以与任意类型的功能平台中的平台元素进行交互,也即,目标对象可以在任意类型的功能平台中存在历史交互数据,目标对象在第一功能平台以外的区域和平台元素进行交互所产生的历史交互数据,经过特征提取处理后所得到的特征表示为域外特征表示,本实施例对此不加以限定。
步骤340,获取与聚类簇中心对应的映射关系函数对域外特征表示进行映射,得到目标对象的域内特征表示。
其中,映射关系函数用于指示目标对象在第二功能平台和第一功能平台之间特征表示的映射关系。
在对目标对象的域外特征表示进行映射时,可以基于目标对象对应的聚类簇中心,获取适合该聚类簇中心的映射关系函数,使用映射关系函数对目标对象的域外特征表示将进行映射。
基于目标对象对应的聚类簇中心,对含参映射函数进行参数替换,得到与聚类簇中心对应的映射关系函数;通过映射关系函数对域外特征表示进行映射,得到目标对象的域内特征表示。
值得注意的是,含参映射函数的种类可以是任意的,基于聚类簇中心对含参映射函数进行参数替换的方式可以是任意的,本实施例对此不加以限定。
步骤350,将域内特征表示和第一对象特征表示结合,得到目标对象的目标特征表示,并基于目标特征表示对目标对象与候选内容推荐池进行匹配,向目标对象推送候选内容推荐池中的目标内容。
通过上述步骤340所获得的目标对象的域内特征表示,可以用于表示在第一功能平台上不存在历史交互数据的目标对象,有可能发生的交互行为,也即,域内特征表示是指将目标对象在第二功能平台上和平台元素进行交互时的特点映射到第一功能平台上。
可选地,将域内特征表示和第一对象特征表示通过拼接的方式结合起来,得到目标对象的目标特征表示,目标特征表示用于给目标对象推荐个性化内容。
示意性的,如图4所示,获取目标对象401的目标对象特征表示402和域外特征表示403,构建图,以图的形式表现目标对象特征表示402和域外特征表示403,使用映射函数对域外特征表示403映射,得到目标对象401的域内特征表示404,获取候选内容推荐池405,将域内特征表示404和候选内容推荐池405中的元素进行相似度匹配,得到相似度匹配结果406,将相似度匹配结果406中相似度对应数值最高的K个内容作为目标内容407,将目标内容407推荐给目标对象401。
值得注意的是,将域内特征表示和第一对象特征表示结合起来的方式可以是任意的,候选内容推荐池中所包含的内容种类、数量可以是任意的;对域内特征表示和候选内容推荐池中的元素进行相似度匹配的方式可以是任意的,基于相似度匹配结果选取目标内容时,目标内容的数量、种类可以是任意的,本实施例对此不加以限定。
综上所述,本申请提供的方法,通过对第一功能平台中的所有对象进行聚类分析,得到每个对象所属于的聚类簇以及每个对象所对应的聚类簇中心,基于聚类簇中心获取个性化的映射关系函数,个性化的映射关系函数能够针对不同的对象,实现从域外特征表示到域内特征表示的映射过程,提高了映射结果的准确率。获取目标对象的第一对象特征表示以及,目标对象在第二功能平台的历史交互数据经过特征提取得到的域外特征表示,基于第一对象特征表示找到目标对象对应的聚类簇中心,根据目标对象对应的聚类簇中心获得与目标对象所对应的映射关系函数,将目标对象的域外特征表示输入至映射关系函数中,经过映射得到目标对象的域内特征表示,可以在目标对象仅在第二功能平台中存在历史交互数据、在第一功能平台中不存在历史交互数据时,得到目标对象在第一功能平台的交互特点,从而基于目标对象的域内特征表示和第一对象特征表示,对目标对象进行在第一功能平台上的个性化内容推荐,解决了冷用户问题和数据稀疏问题,使得推荐内容更加符合目标对象的真实兴趣,提高了推荐效果。
本实施例提供的方法,通过对含参映射函数进行参数替换,将含参映射函数中的参数替换为与目标对象所对应的聚类簇中心,找到符合目标对象映射要求的个性化映射关系函数,使用该映射关系函数对目标对象的域外特征表示进行映射,得到目标对象的域内特征表示,能够在目标对象在域内没有历史交互数据的情况下,了解目标对象在域内的特征,实现了目标对象的特征迁移,个性化的映射函数能够针对每个不同的目标对象进行特征映射,也提高了特征映射的准确率和效率。
本实施例提供的方法,通过获取在第一功能平台中所有其他对象的对象属性数据,并进行特征提取,得到能够代表每个其他对象的第二对象特征表示,基于第二对象特征表示对其他对象进行聚类分析,生成多个聚类簇,能够快速给第一功能平台中的其他对象进行分类,每个聚类簇都有其对应的聚类中心,基于目标对象的第一对象特征表示和聚类中心之间的相似度,能够得到目标对象所属的聚类簇以及对应的聚类中心,得到准确率较高的聚类分析结果。
将目标对象的域外特征表示映射为域内特征表示时,需要筛选适合该目标对象的个性化映射函数,如图5所示,图5示出了本申请一个示例性实施例提供的个性化的映射关系函数的训练方法流程图,该方法包括如下步骤。
步骤510,基于样本对象在第一功能平台中的历史交互数据,提取样本对象的域内特征表示。
其中,样本对象对应目标聚类中心。
在第一功能平台中包含至少一个样本对象,样本对象和第一功能平台中的平台元素之间存在交互行为,也即样本对象在第一功能平台中存在历史交互数据。
示意性地,使用特征提取网络对样本对象在第一功能平台中的历史交互数据进行特征提取,得到样本对象的域外特征表示。
步骤520,基于样本对象在第二功能平台中的历史交互数据,提取样本对象的域外特征表示。
同上述步骤510。
样本对象在第一功能平台和第二功能平台中都存在历史交互数据。
值得注意的是,在一些实施例中,对样本对象进行特征提取得到域内特征表示和域外特征表示的方式可以是任意的,包括但不限于上述使用特征提取网络的方式;当使用特征提取网络对样本对象的历史交互数据进行特征提取时,所使用的特征提取网络可以是任意的,本实施例对此不加以限定。
步骤530,将样本对象的域外特征表示输入至候选映射函数,经过映射得到与样本对象对应的域内映射特征。
对样本对象的对象属性数据进行特征分析,得到样本对象的样本对象特征表示。基于样本对象特征表示对样本对象进行聚类分析,得到多个聚类簇。
每个样本对象都对应各自的聚类簇,聚类簇的中心点为聚类簇中心,每个聚类簇都包含各自的聚类簇中心。
计算样本对象的样本对象特征表示和聚类簇中心之间的距离,将与样本对象特征表示距离最小的聚类簇中心,作为样本对象对应的目标聚类中心。
获取候选映射函数,候选映射函数是预设的函数,具备将样本对象的域外特征映射成为域内特征的能力,将样本对象的域外特征表示输入至候选映射函数,经过映射所得到的域内映射特征准确性较低。
域内映射特征和样本对象自身的域内特征表示之间存在差异。
值得注意的是,候选映射函数的种类可以是任意的,本实施例对此不加以限定。
步骤540,基于样本对象的域内特征表示和域内映射特征,得到重构损失。
基于样本对象的域内特征表示和域内映射特征之间的差异获得重构损失(Lreconstruction)。
示意性地,获得重构损失的方式采用均方误差损失(Mean Square Error,MSE),即计算样本对象的域内特征表示和域内映射特征之间的距离平方之和。
值得注意的是,在一些实施例中,获得重构损失的方式可以是任意的,包括但不限于上述均方误差损失的方式,本实施例对此不加以限定。
步骤550,基于重构损失对候选映射函数进行训练,得到目标聚类中心对应的映射关系函数。
对样本对象进行聚类分析,得到每个样本对象对应的目标聚类中心。
获取同一个目标聚类中心所对应的目标聚类簇,选取目标聚类簇中的样本对象,对候选映射函数进行训练。
将样本对象的域外特征表示输入至候选映射函数,输出得到样本对象的映射域内特征,并基于域内映射特征和样本对象的域内特征表示之间的重构损失对候选映射函数进行训练,所得到的候选映射函数对属于该目标聚类簇中所有样本对象进行特征映射时,准确率较高。
使用不同聚类簇中的样本对象训练得到的候选映射函数,也即含映射关系函数,与训练时所使用的样本对象对应的目标聚类中心存在对应关系。
将每个聚类簇训练得到的映射关系函数以表格形式记录,如下表1所示:
表1
Value | 第一映射函数 | 第二映射函数 |
训练样本所属聚类簇 | 第一聚类簇 | 第二聚类簇 |
Key | 第一目标聚类中心 | 第二目标聚类中心 |
其中,Value代表不同的映射关系函数,每个映射关系函数对应一个Key值,用于表示该映射关系函数对应的索引。
使用第一聚类簇中的样本对象对候选映射函数进行训练,其中,第一聚类簇的聚类中心是第一目标聚类中心,经过上述训练过程所得到的第一映射函数,适用于对应第一目标聚类中心的目标对象进行特征映射。基于重构损失,使映射得到的域内映射特征去逼近样本对象原有的域内特征表示,当重构损失满足以下任一条件时,停止训练。
(1)重构损失低于预设阈值;(2)重构损失收敛。
经过损失训练得到的含参映射函数中包括处于待填充状态的指定参数位置。指定参数位置所填充的内容不同时,所得到的含参映射函数的映射特点和映射效果也不同,也即,经过对指定参数位置中参数的调整,可以对应得到个性化的含参映射函数,不同的含参映射函数适用于不同类型的对象。
值得注意的是,基于重构损失对含参映射函数进行训练的方式可以是任意的,判定训练停止的条件可以使任意的,本实施例对此不加以限定。
步骤560,将聚类簇中心作为参数代入指定参数位置,得到聚类簇中心对应的映射关系函数。
其中,聚类簇中心用于作为检索关键字,对映射关系函数进行查询。
在表1中,每个映射关系函数对应一个用于索引的Key值,将当前聚类簇中心作为检索关键字,与表1中的Key值所对应的目标聚类簇中心分别进行匹配,匹配成功时,其目标聚类簇中心所对应的Value值即为当前聚类簇中心所对应的映射关系函数。
经过上述步骤510至550训练获得的含参映射函数,可以对其进行参数替换操作,得到不同类型的映射关系函数,这些不同种类的映射关系函数组成了映射模块。
每个聚类簇都有其对应的聚类中心,分别将每个聚类簇的聚类中心都作为参数带入含参映射函数中的指定参数位置,得到个性化的映射关系函数,在映射模块中,包含了与聚类中心数量相同的映射关系函数。
与聚类中心所对应的映射关系函数,可以对该聚类中心所属聚类簇中所有对象的域外特征表示进行特征映射,得到这些对象的域内映射特征。也即,要获得对象在第一功能平台上的域内特征时,可以基于对象所处的聚类簇,获取该聚类簇的聚类中心,并将该聚类中心作为索引,在映射模块中找到与该聚类中心对应的映射关系函数。
综上所述,本申请提供的方法,通过聚类簇中心获取个性化的映射关系函数,将聚类簇中心作为候选映射函数中指定位置的参数,得到的个性化的映射关系函数能够针对不同类型的对象,实现从域外特征表示到域内特征表示的映射过程,提高了映射结果的准确率。将对象的域外特征表示输入至映射关系函数中,经过映射得到对象的域内特征表示,可以在对象仅在第二功能平台中存在历史交互数据、在第一功能平台中不存在历史交互数据时,得到对象在第一功能平台的交互特点,从而基于对象的域内特征表示和第一对象特征表示,对对象进行在第一功能平台上的个性化内容推荐,解决了冷用户问题和数据稀疏问题,使得推荐内容更加符合对象的真实兴趣,提高了推荐效果。
本实施例提供的方法,通过获取在第一功能平台和第二功能平台都具有历史交互数据的多个样本对象,对历史交互数据进行特征分析,得到样本用户在第一功能平台的域内特征表示,以及样本用户在第二功能平台的域外特征表示,预设一个具有映射功能的候选映射函数,将域外特征表示输入至候选映射函数中,得到映射的域内映射特征,基于域内映射特征和域内特征表示之间的重构损失对候选映射函数进行训练,使域内映射特征逼近样本对象真实的域内特征表示,从而获得映射准确的含参映射函数,能够将样本对象在一个域的兴趣特征迁移到另一个域,提高了映射的准确率和效果。
本实施例提供的方法,通过对含参映射函数中指定位置的参数进行替换,将聚类簇中心作为参数带入指定参数位置,得到映射效果具有针对性的个性化映射关系函数,对不同类型的对象的域外特征表示进行映射时,所得到的域内映射特征接近对象真实的域内特征表示,能够准确的表示对象与第一功能平台中平台元素的交互特点,当对象在第一功能平台中不存在历史交互数据时也可以获得对象的域内特征表示,提高了映射的准确率,解决了冷用户问题和数据稀疏问题,基于域内映射特征进行内容推荐时,使得推荐内容更加符合对象的真实兴趣,提高了推荐效果。
第一功能平台上包含多个对象,对平台上的目标对象和其他对象进行聚类分析,使每个对象找到各自所属于的聚类簇并获得各自对应的聚类簇中心,如图6所示,图6是本申请一个示例性实施例提供的聚类分析的方法流程图,该方法包括如下步骤。
步骤610,获取聚类信息,聚类信息用于指示初始聚类簇中心的位置信息。
可选地,获取初始聚类中心的位置信息的方式包括但不限于如下几种方式:1、随机初始化;2、指定初始聚类中心的位置。
在基于初始聚类簇中心的位置信息,对第一功能平台中所有对象进行聚类分析时,采用batch训练的方式来学习聚类中心。
batch训练,又称批训练,是指把整套训练数据分成数个批次进行训练,每个批次从数据中选取n_num(总数据)/n_batch(批次)个数据,直到把整套数据训练完成。
示意性地,采用随机初始化的方式获得聚类中心μj,j=1、2、3……K。
其中,聚类中心的数量为K个,K为正整数。
值得注意的是,聚类中心的数量和聚类簇的数量对应,聚类中心的数量可以为任意的指定数值,本实施例对此不加以限定。
步骤620,基于第二对象特征表示和初始聚类簇中心之间的相似度,得到第一聚类簇分布结果。
其中,第一聚类簇分布结果中包括各初始聚类簇中心对应的特征分布。
经过步骤610,获得初始聚类中心后,基于初始聚类中心对平台中的其他对象进行聚类分析,找到每个对象所属的聚类簇。
示意性地,使用学生T分布的方式获得其他对象的第二对象特征表示和初始聚类簇中心之间的相似度,并基于相似度得到其他对象属于某个聚类簇的概率,将概率对应数值最高的聚类簇和初始聚类中心作为其他对象的初始分类结果,共同组成第一聚类簇分布结果。
在概率论和统计学中,学生t分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。
如下列公式一所示:
公式一:
其中,qij是指其他对象属于某个聚类簇的概率,hi是指其他对象的第二对象特征表示,μj是指初始聚类中心,α表示学生t分布的自由度,μj′是指任意一个初始聚类中心。
示意性地,以第一其他对象为例,第一其他对象对应的第二对象特征表示为h1,将第一其他对象对应的第二对象特征表示h1与初始聚类中心逐一进行相似度计算,得到第一其他对象对应的相似度数组array1[j],j=1、2、3……K。
对相似度数组array1[j]中的所有相似度数值求和,得到相似度和sum,将相似度数组array1[j]中每个相似度数值与相似度和sum相除,得到第一其他对象属于每个聚类簇的概率qi,将概率对应数值最大的聚类簇作为第一其他对象所对应的聚类簇,该聚类簇对应的初始聚类中心也是第一其他对象对应初始聚类中心。
对每个其他对象重复执行上述步骤,获得每个其他对象所属的聚类簇,共同组成第一聚类簇分布结果。
值得注意的是,在一些实施例中,获得其他对象的第二对象特征表示和初始概率簇中心之间的相似度的方式可以是任意的,包括但不限于上述基于学生t分布的方式;获得每个对象所属聚类簇的概率的方式可以的任意的,本实施例对此不加以限定。
步骤630,对第一聚类簇分布结果进行离散分析处理,得到第二聚类簇分布结果,并基于第二聚类簇分布结果得到多个聚类簇。
其中,第二聚类簇分布结果包含每个第二对象特征表示对应的聚类簇中心。
经过步骤620所获得的第一聚类簇分布结果置信度较低,每个其他对象属于对应聚类簇的概率较低,为了获得更加尖锐的聚类簇分布结果,也即让每个其他对象的第二对象特征表示更加靠近各自对应的初始聚类簇中心,则需要设置一个置信度更高的目标聚类簇分布结果,通过离散分析处理,使得第一聚类簇分布结果更加靠近目标聚类簇分布结果。
对第一聚类簇分布结果进行离散分析处理,包括如下步骤:
(1)对第一聚类簇分布结果中第i个初始聚类簇中心对应的特征分布进行离散度分析,得到第i个初始聚类簇中心对应的离散值;
(2)基于第i个初始聚类簇中心对应的离散值对第i个初始聚类簇中心进行更新,得到第二聚类簇分布结果;以及,对特征提取网络进行更新,其中,特征提取网络用于提取对象的特征表示;
(3)基于第二聚类簇分布结果和更新后的特征提取网络得到多个聚类簇。
示意性地,如下列公式二所示:
公式二:
其中,pij是指其他对象属于某个聚类簇的更新概率,也即目标聚类簇分布结果,fj=∑iqij表示其他对象属于第j个聚类簇中心的概率。
示意性地,采用KL散度使第一聚类簇分布结果更加靠近目标聚类簇分布结果,如下列公式三所示:
公式三:
其中,P表示目标聚类簇分布结果,Q表示第一聚类簇分布结果,Lclustering是指KL散度。
目标聚类簇分布结果即第二聚类簇分布结果,基于上述步骤获得第二聚类簇分布结果后,基于第二聚类簇分布结果得到多个聚类簇,每个聚类簇都对应各自的聚类簇中心。
示意性的,如图7所示,图7是对第一聚类簇分布结果进行离散分析处理后获得第二聚类簇分布结果的示意图。
第一聚类簇分布结果701中包含基于多个初始聚类簇中心形成的聚类簇,基于KL散度702,对第一聚类簇分布结果701进行离散度分析后,得到置信度更高的第二聚类簇分布结果703。
在第一聚类簇分布结果701中,包含初始聚类簇中心704和属于相同聚类簇的第二对象特征表示705,初始聚类簇中心704和第二对象特征表示705之间的距离较大,所形成的聚类簇较为分散。
在第二聚类簇分布结果703中,包含聚类簇中心706和更新后的属于相同聚类簇的第二对象特征表示707,聚类簇中心706和更新后的第二对象特征表示707之间的距离较近,所形成的聚类簇较为紧凑。
综上所述,本申请提供的方法,通过对第一功能平台中的所有对象进行聚类分析,得到每个对象所属于的聚类簇以及每个对象所对应的聚类簇中心,基于聚类簇中心获取个性化的映射关系函数,个性化的映射关系函数能够针对不同的对象,实现从域外特征表示到域内特征表示的映射过程,提高了映射结果的准确率。获取目标对象的第一对象特征表示以及,目标对象在第二功能平台的历史交互数据经过特征提取得到的域外特征表示,基于第一对象特征表示找到目标对象对应的聚类簇中心,根据目标对象对应的聚类簇中心获得与目标对象所对应的映射关系函数,将目标对象的域外特征表示输入至映射关系函数中,经过映射得到目标对象的域内特征表示,基于目标对象的域内特征表示和第一对象特征表示,对目标对象进行在第一功能平台上的个性化内容推荐,解决了冷用户问题和数据稀疏问题,使得推荐内容更加符合目标对象的真实兴趣,提高了推荐效果。
本实施例提供的方法,通过随机初始化的方式获得初始聚类簇中心的位置信息,基于初始聚类簇中心对第一功能平台中所有对象进行聚类分析,得到第一聚类分析结果,对第一聚类分析结果进行离散度分析,能够得到置信度更高的第二聚类簇分布结果,找到每个对象所属的聚类簇和对应的聚类簇中心,能够对所有对象进行准确的分类,进一步基于分类结果找到个性化的映射函数,使得映射结果更准确。
本实施例提供的方法,通过对第一聚类簇分布结果中每个聚类簇分别进行离散度分析,得到每个初始聚类簇中心对应的离散值,基于离散值对初始聚类簇中心进行更新,得到置信度更高的第二聚类簇分布结果,并对特征提取网络进行更新,得到更为准确的第二对象特征表示以及每个第二对象特征表示和所属聚类簇之间的关系。
基于对象在任意功能平台中的历史交互数据,提取对象的域外特征表示或者域内特征表示时,需要引入异构图获得历史交互数据,并进一步提取对象的域内或域外特征表示。如图8所示,图8是一个获取目标对象的域外特征表示的方法流程图,该方法包括如下步骤。
步骤810,基于目标对象在第二功能平台中的历史交互数据,获得目标异构图。
其中,目标异构图中包含多个元路径,目标异构图用于表示目标对象和第二功能平台中的元素之间的历史交互关系。
异构图又称异构网络,在异构图中,节点和边的类型不是单一的,而是多样化的。
元路径(Meta-Path)可以理解为连接不同类型节点的一条路径,不同的元路径会有不同的路径类型,而所谓路径类型通常都是用节点类型路径来表示。
示意性的,如图9所示,图9是一个异构图的示意图。
在异构图900中,存在目标域910、源域920和平台对象930。
在本申请实施例中,目标域910指代第一功能平台,源域920指代第二功能平台,平台对象930包括目标对象和其他对象,目标对象在异构图900中表现为目标对象节点931。
在目标域910中存在多个第一平台元素,第一平台元素在异构图900中表现为第一元素节点911,在源域920中也存在多个第二平台元素,第二平台元素在异构图900中表现为第二元素节点921。
其中,第一元素节点911、第二元素节点921和目标对象节点931的种类不同。
目标对象和第二功能平台中的第二平台元素之间存在历史交互数据,在异构图900中通过元路径表示:目标对象节点931和第二元素节点921之间通过直线连接,说明目标对象节点931和第二元素节点921之间存在交互关系,由直目标对象节点931、第二元素节点921以及之间用于连接的直线共同构成属于目标对象所在异构图900中的一条元路径。
其中,以目标对象节点931为中心,基于源域920之间的历史交互数据生成的元路径包括但不限于以下几条:
(1)u1-i2;
(2)u1-i2-u2;
(3)u1-i2-u2-i2-u3;
(4)u1-i2-u4;
(5)u1-i2-u2-i2-u5。
其中,u1是指目标对象节点931,i2是源域920中的第二元素节点921,u2、u3、u4和u5代表平台对象930中其他对象所对应的对象节点。
其中,i2是u1的一阶邻居、u2和u4是u1的二阶邻居,以此类推,u1到达目标节点所需要经过的节点数量为N,则目标节点为u1的(N-1)阶邻居。以u1为中心,通过元路径可以到达的目标节点,都是u1的邻居节点。
异构图900中,除了包含以目标对象节点931为中心的元路径,还包含以平台对象930中其他对象对应的对象节点为中心的元路径,以目标对象节点931为中心的元路径共同组成目标异构图,也即,目标异构图是异构图900中的一部分。
值得注意的是,异构图中所包含的元路径数量和种类可以是任意的,异构图中所包含的节点和边的数量可以是任意的,节点的种类可以是任意的,元路径中所包含的节点和边的数量可以是任意的,中心节点在元路径中的邻居节点的阶数和数量可以是任意的,本实施例对此不加以限定。
在一些实施例中,目标异构图中所包含的对象节点的数量和种类可以是任意,源域的数量和种类可以是任意的,目标域的数量和种类可以是任意的,可以作为源域的平台包括但不限于第二功能平台,第一功能平台中的第一元素节点的数量和种类可以是任意的,第二功能平台中的第二元素节点的数量和种类可以是任意的,本实施例对此不加以限定。
步骤820,提取目标异构图中元路径对应的路径特征表示。
提取元路径的路径特征表示,利用图注意力网络作为聚合机制,对目标异构图中的每个元路径进行特征提取。
图神经网络(Graph Neural Network,GNN)是指使用神经网络来学习图结构数据,提取和发掘图结构数据中的特征和模式,满足聚类、分类、预测、分割、生成等图学习任务需求的算法总称。
在本实施例中,利用图神经网络对目标异构图进行分析。
图注意力网络(Graph Attention Network,GAT)是一种图神经网络,该网络使用类似transformer里面self-attention的方式计算图里面某个节点相对于每个邻居节点的注意力,将节点本身的特征和注意力特征串联起来作为该节点的特征,在此基础上进行节点的分类等任务。
目标对象在第二功能平台中的历史交互数据,以元路径的形式在目标异构图中表现,每个元路径都具有语义信息,用于表示目标对象在第二功能平台进行交互的特点和兴趣偏向。
目标异构图中存在不同类型的元路径,对于不同类型的元路径,利用异构图卷积来捕捉每条元路径所包含的丰富的语义信息,并加入节点级别的注意力机制来区分每个邻居节点对于中心节点(目标对象节点)的重要性。
获取元路径中每个路径节点的节点注意力,路径节点用于表示与目标对象之间存在历史交互关系的元素;对元路径上的所有节点注意力进行聚合处理,得到元路径的路径特征表示。
示意性的,如图10所示,图10是基于元路径的异构图卷积示意图。
目标对象所对应的目标对象节点1000为中心,按照顺序依次在元路径中获取目标对象节点1000的一阶邻居节点1010和二阶邻居节点1020。
获取每个邻居节点的节点级别注意力的顺序与获取邻居节点的顺序相反。
基于图注意力网络1030首先获取二阶邻居节点1020的节点注意力,再获得一阶邻居节点1010的节点注意力,最后获得目标对象节点1000的节点注意力。
获得所有节点的节点注意力后,先对二阶邻居节点1020的节点注意力进行聚合处理,得到一阶邻居节点1010的嵌入,再对一阶邻居节点1010的节点注意力进行聚合处理,得到目标对象节点1000的嵌入。
其中,每个邻居节点(一阶邻居节点1010和二阶邻居节点1020)对中心节点(目标对象节点1000)都具有不同程度的重要性,将每个邻居节点的节点注意力进行聚合后,最终形成节点表示,如下列公式四所示:
公式四:
其中,其中,αui表示节点u和节点i的相关性,hu,hi表示节点u和节点i的表示,Νu表示节点u的邻居集合。
每条元路径都具有多个节点,则对应多个节点表示,将这条元路径上所有节点表示聚合起来,则得到该元路径的路径特征表示,如下列公式五所示:
公式五:
其中,h′u代表元路径的路径特征表示,σ(·)表示激活函数。
值得注意的是,上述举例中仅涉及一阶邻居节点和二阶邻居节点,在一些实施例中,元路径的节点阶数可以是任意的,对邻居节点进行注意力分析获得节点注意力时,可以只对指定的邻居节点进行注意力分析,也可以对所有的邻居节点进行注意力分析,在进行注意力分析并获得节点注意力时所使用的方法可以是任意的,包括但不限于上述图注意力网络的方式,本实施例对此不加以限定。
步骤830,对元路径对应的路径特征表示进行聚合处理,得到目标对象的域外特征表示。
根据目标对象在第二功能平台中的历史交互数据所获得的元路径,对元路径的路径特征表示进行聚合处理,得到的即为目标对象的域外特征表示,域外指源域,也即指代非第一功能平台的区域,在一些实施例中,域外可以是任意功能平台的区域,但是目标对象在源域一定存在历史交互数据,这些历史交互数据反映了目标对象在源域的交互特点和兴趣偏向。
目标对象对应的目标异构图中所包含的元路径的数量为至少一条,根据上述步骤820中的方法,对每个元路径都经过基于元路径的异构图卷积,进行特征提取,得到多个路径特征表示,将多个元路径的路径特征表示做平均池化处理后,得到该目标对象在第二功能平台的特征表示,也即目标对象的域外特征表示。
其中,池化(Pooling)的思想来自于视觉机制,是对信息进行抽象的过程。池化的本质是采样,池化层对于输入的Feature Map,选择某种方式对其进行降维压缩,以加快运算速度。
采用较多的几种池化过程包括:最大池化(Max Pooling)、平均池化(Mean-pooling)等。
其中,平均池化可以理解为对输入池化层的内容进行求均值处理。
示意性地,假设输入池化层的路径特征表示的数量为100个,表现为10*10的网格形式,每个路径特征表示都对应其中一个网格。将10*10的网格压缩为2*2的大网格,也即将100个网格分为4组,每组包括25个网格,将每组网格中的路径特征表示取均值,使用均值代表每个大网格对应的路径特征表示,即为平均池化过程。
值得注意的是,步骤810至步骤830以目标对象为例,获取目标对象的域外特征表示,在一些实施例中,目标对象在其他域,即其他功能平台上存在历史交互数据时,也可以根据上述步骤810至步骤830的方法得到目标对象在其他功能平台的域外特征表示或者域内特征表示。
任意的域都可以作为目标域,任意的域都可以作为源域,域内特征表示和域外特征表示的获得方法是相同的,针对每个对象都适用,包括但不限于目标对象和其他对象。
无论是域内特征表示还是域外特征表示,都是用于表现当前对象在某个域内的兴趣特征和交互特点。通常将与当前对象之间历史交互数据较为稀疏的域,或者不存在历史交互数据的域作为目标域;而存在历史交互数据,或者存在大量历史交互数据的域作为源域。
值得注意的是,本申请提出的内容推荐方法,共包括三个部分:
(1)目标域中为样本对象进行内容推荐的学习过程,涉及推荐损失(Lrec);
(2)基于样本对象的样本对象特征表示进行聚类的学习过程,涉及聚类损失(Lclustering);
(3)基于映射关系函数将样本对象的域外特征表示域内映射特征,使用域内映射特征逼近域内特征表示的学习过程,涉及重构损失(Lreconstruction)。
其中,为样本对象进行内容推荐的学习过程涉及个性化推荐模块。
在一些实施例中,基于相似度匹配结果对目标对象进行内容推荐之前,需要基于推荐的目标内容和对象真实感兴趣的内容之间的损失,对个性化推荐模块进行训练。如下列公式六所示:
公式六:
其中,hu是对象u的表示,hvi是对象u的正样本vi的表示,hvj是对象u的负样本vj的表示,σ表示激活函数,Lrec是推荐损失。
基于推荐损失对个性化推荐机制进行训练,使得基于目标对象的域内特征表示和候选内容推荐池中的元素进行相似度匹配时,相似度匹配结果能够准确的表示目标对象真正感兴趣的内容,并对目标对象进行内容推荐。
可选地,当推荐损失满足以下任一条件时,停止训练。
(1)重构损失低于预设阈值;(2)重构损失收敛。
上述三个环节采用联合训练的方式,也即基于推荐损失、聚类损失、重构损失对各过程进行训练是同步的。
值得注意的是,基于推荐损失对个性化推荐模块进行训练的方式可以是任意的,判定训练停止的条件可以使任意的,本实施例对此不加以限定。
综上所述,本申请提供的方法,通过将目标对象在第二功能平台的历史交互数据用异构图的形式表现,能够直观的观察的目标对象在第二功能平台之间进行交互的特点,并基于异构图中的元路径表示每条历史交互数据,根据元路径的路径特征表示,获得目标对象在第二功能平台上的兴趣偏向,进一步得到目标对象的域外特征表示,为特征映射提供了可靠的依据,提高了特征迁移的准确率以及基于域外特征表示获得域内特征表示,对目标对象进行个性化内容推荐的效果。
本实施例提供的方法,通过目标对象在第二功能平台中的历史交互数据,获得目标异构图,目标异构图中包含多个元路径,可以直观简洁的表示目标对象和第二功能平台中的元素之间的历史交互关系。提取目标异构图中元路径对应的路径特征表示并对元路径对应的路径特征表示进行聚合处理,得到目标对象的域外特征表示准确性较高。
本实施例提供的方法,通过图注意力网络,对异构图中每个元路径的路径节点进行注意力分析,得到每个路径节点的注意力表示,并基于路径节点的注意力表示,获得每个路径节点对于中心节点的重要程度,将元路径中每个路径节点的节点注意力聚合起来,得到整个元路径的路径特征表示,能够了解目标对象在第二功能平台上进行交互的特点,以及目标对象在第二功能平台上所表现出的兴趣偏向,使得基于元路径的路径特征表示所获得的域外特征表示更加准确的反映目标对象在第二功能平台的兴趣特点。
图11是本申请一个示例性实施例提供的内容推荐装置的结构框图,如图11所示,该装置包括:
提取模块1110,用于基于目标对象在第一功能平台中的对象属性数据提取所述目标对象的第一对象特征表示;
聚类分析模块1120,用于将所述第一对象特征表示与所述第一功能平台中的其他对象的第二对象特征表示进行聚类分析,得到所述目标对象对应的聚类簇中心;
所述提取模块1110,还用于基于所述目标对象在第二功能平台中的历史交互数据,提取所述目标对象的域外特征表示;
获取模块1130,用于获取与所述聚类簇中心对应的映射关系函数对所述域外特征表示进行映射,得到所述目标对象的域内特征表示,其中,所述映射关系函数用于指示所述目标对象在所述第二功能平台和所述第一功能平台之间特征表示的映射关系;
推荐模块1140,用于将所述域内特征表示和所述第一对象特征表示结合,得到所述目标对象的目标特征表示,并基于所述目标特征表示对所述目标对象与候选内容推荐池进行匹配,向所述目标对象推送所述候选内容推荐池中的目标内容。
在一个可选的实施例中,如图12所示,所述获取模块1130,还包括:
参数替换单元1131,用于基于所述目标对象对应的所述聚类簇中心,对含参映射函数进行参数替换,得到与所述聚类簇中心对应的映射关系函数;
映射单元1132,通过所述映射关系函数对所述域外特征表示进行映射,得到所述目标对象的所述域内特征表示。
在一个可选的实施例中,所述参数替换单元1131,还用于获取所述含参映射函数,所述含参映射函数中包括处于待填充状态的指定参数位置;将所述聚类簇中心作为参数代入所述指定参数位置,得到所述聚类簇中心对应的映射关系函数,其中,所述聚类簇中心用于作为检索关键字,对所述映射关系函数进行查询。
在一个可选的实施例中,所述获取模块1130,还用于基于样本对象在所述第一功能平台中的历史交互数据,提取所述样本对象的域内特征表示,所述样本对象对应目标聚类中心;基于所述样本对象在所述第二功能平台中的历史交互数据,提取所述样本对象的域外特征表示;将所述样本对象的域外特征表示输入至候选映射函数,经过映射得到与所述样本对象对应的域内映射特征;基于所述样本对象的域内特征表示和所述域内映射特征,得到重构损失;基于所述重构损失对所述候选映射函数进行训练,得到所述目标聚类中心对应的所述映射关系函数。
在一个可选的实施例中,所述聚类分析模块1120,还用于基于所述其他对象在所述第一功能平台中的对象属性数据提取所述其他对象的所述第二对象特征表示;基于所述第二对象特征表示对所述其他对象进行聚类分析,得到多个聚类簇,其中,每个所述聚类簇包含聚类簇中心;基于所述第一对象特征表示和所述聚类簇中心之间的相似度,得到所述目标对象对应的所述聚类簇中心。
在一个可选的实施例中,所述聚类分析模块1120,还用于获取聚类信息,所述聚类信息用于指示初始聚类簇中心的位置信息;基于所述第二对象特征表示和所述初始聚类簇中心之间的相似度,得到第一聚类簇分布结果,所述第一聚类簇分布结果中包括各初始聚类簇中心对应的特征分布;对所述第一聚类簇分布结果进行离散分析处理,得到第二聚类簇分布结果,并基于所述第二聚类簇分布结果得到多个聚类簇,所述第二聚类簇分布结果包含每个所述聚类特征表示对应的所述聚类簇中心。
在一个可选的实施例中,所述聚类分析模块1120,还用于对所述第一聚类簇分布结果中第i个初始聚类簇中心对应的特征分布进行离散度分析,得到所述第i个初始聚类簇中心对应的离散值;基于所述第i个初始聚类簇中心对应的离散值对所述第i个初始聚类簇中心进行更新,得到所述第二聚类簇分布结果;以及,对特征提取网络进行更新,其中,所述特征提取网络用于提取对象的特征表示;基于所述第二聚类簇分布结果和更新后的特征提取网络得到多个聚类簇。
在一个可选的实施例中,所述提取模块1110,还用于基于所述目标对象在所述第二功能平台中的历史交互数据,获得目标异构图,所述目标异构图中包含多个元路径,所述目标异构图用于表示所述目标对象和所述第二功能平台中的元素之间的历史交互关系;提取所述目标异构图中元路径对应的路径特征表示;对所述元路径对应的路径特征表示进行聚合处理,得到所述目标对象的域外特征表示。
在一个可选的实施例中,所述提取模块1110,还用于获取所述元路径中每个路径节点的节点注意力,所述路径节点用于表示与所述目标对象之间存在历史交互关系的所述元素;对所述节点注意力进行聚合处理,得到所述元路径的路径特征表示。
综上所述,本实施例提供的装置,通过对第一功能平台中的所有对象进行聚类分析,得到每个对象所属于的聚类簇以及每个对象所对应的聚类簇中心,基于聚类簇中心获取个性化的映射关系函数,个性化的映射关系函数能够针对不同的对象,实现从域外特征表示到域内特征表示的映射过程,提高了映射结果的准确率。获取目标对象的对象特征表示以及,目标对象在第二功能平台的历史交互数据经过特征提取得到的域外特征表示,基于对象特征表示找到目标对象对应的聚类簇中心,根据目标对象对应的聚类簇中心获得与目标对象所对应的映射关系函数,将目标对象的域外特征表示输入至映射关系函数中,经过映射得到目标对象的域内特征表示,可以在目标对象仅在第二功能平台中存在历史交互数据、在第一功能平台中不存在历史交互数据时,得到目标对象在第一功能平台的交互特点,从而基于目标对象的域内特征表示和对象特征表示,对目标对象进行在第一功能平台上的个性化内容推荐,解决了冷用户问题和数据稀疏问题,使得推荐内容更加符合目标对象的真实兴趣,提高了推荐效果。
需要说明的是:上述实施例提供的内容推荐装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
图13示出了本申请一个示例性实施例提供的计算机设备1300的结构框图。该计算机设备1300可以是:笔记本电脑或台式电脑。计算机设备1300还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,计算机设备1300包括有:处理器1301和存储器1302。
处理器1301可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1301可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1301也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1301可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1301还可以包括AI处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1302可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1302还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1302中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器1301所执行以实现本申请中方法实施例提供的内容推荐方法。
在一些实施例中,计算机设备1300还包括其他组件,本领域技术人员可以理解,图13中示出的结构并不构成对终端1300的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
本申请的实施例还提供了一种计算机设备,该计算机设备包括处理器和存储器,该存储器中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述各方法实施例提供的内容推荐方法。
本申请的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行,以实现上述各方法实施例提供的内容推荐方法。
本申请的实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中任一所述的内容推荐方法。
可选地,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、固态硬盘(SSD,Solid State Drives)或光盘等。其中,随机存取记忆体可以包括电阻式随机存取记忆体(ReRAM,Resistance RandomAccess Memory)和动态随机存取存储器(DRAM,Dynamic Random Access Memory)。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (13)
1.一种内容推荐方法,其特征在于,所述方法包括:
基于目标对象在第一功能平台中的对象属性数据提取所述目标对象的第一对象特征表示;
将所述第一对象特征表示与所述第一功能平台中的其他对象的第二对象特征表示进行聚类分析,得到所述目标对象对应的聚类簇中心;
基于所述目标对象在第二功能平台中的历史交互数据,提取所述目标对象的域外特征表示;
获取与所述聚类簇中心对应的映射关系函数对所述域外特征表示进行映射,得到所述目标对象的域内特征表示,其中,所述映射关系函数用于指示所述目标对象在所述第二功能平台和所述第一功能平台之间特征表示的映射关系;
将所述域内特征表示和所述第一对象特征表示结合,得到所述目标对象的目标特征表示,并基于所述目标特征表示对所述目标对象与候选内容推荐池进行匹配,向所述目标对象推送所述候选内容推荐池中的目标内容。
2.根据权利要求1所述的方法,其特征在于,所述获取与所述聚类簇中心对应的映射关系函数对所述域外特征表示进行映射,得到所述目标对象的域内特征表示,包括:
基于所述目标对象对应的所述聚类簇中心,对含参映射函数进行参数替换,得到与所述聚类簇中心对应的映射关系函数;
通过所述映射关系函数对所述域外特征表示进行映射,得到所述目标对象的所述域内特征表示。
3.根据权利要求2所述的方法,其特征在于,所述基于所述目标对象对应的所述聚类簇中心,对含参映射函数进行参数替换,得到与所述聚类簇中心对应的映射关系函数,包括:
获取所述含参映射函数,所述含参映射函数中包括处于待填充状态的指定参数位置;
将所述聚类簇中心作为参数代入所述指定参数位置,得到所述聚类簇中心对应的映射关系函数,其中,所述聚类簇中心用于作为检索关键字,对所述映射关系函数进行查询。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
基于样本对象在所述第一功能平台中的历史交互数据,提取所述样本对象的域内特征表示,所述样本对象对应目标聚类中心;
基于所述样本对象在所述第二功能平台中的历史交互数据,提取所述样本对象的域外特征表示;
将所述样本对象的域外特征表示输入至候选映射函数,经过映射得到与所述样本对象对应的域内映射特征;
基于所述样本对象的域内特征表示和所述域内映射特征,得到重构损失;
基于所述重构损失对所述候选映射函数进行训练,得到所述目标聚类中心对应的所述映射关系函数。
5.根据权利要求1所述的方法,其特征在于,所述将所述第一对象特征表示与所述第一功能平台中的其他对象进行聚类分析,得到所述目标对象对应的聚类簇中心,包括:
基于所述其他对象在所述第一功能平台中的对象属性数据提取所述其他对象的所述第二对象特征表示;
基于所述第二对象特征表示对所述其他对象进行聚类分析,得到多个聚类簇,其中,每个所述聚类簇包含聚类簇中心;
基于所述第一对象特征表示和所述聚类簇中心之间的相似度,得到所述目标对象对应的所述聚类簇中心。
6.根据权利要求5所述的方法,其特征在于,所述基于所述第二对象特征表示对所述其他对象进行聚类分析,得到多个聚类簇,包括:
获取聚类信息,所述聚类信息用于指示初始聚类簇中心的位置信息;
基于所述第二对象特征表示和所述初始聚类簇中心之间的相似度,得到第一聚类簇分布结果,所述第一聚类簇分布结果中包括各初始聚类簇中心对应的特征分布;
对所述第一聚类簇分布结果进行离散分析处理,得到第二聚类簇分布结果,并基于所述第二聚类簇分布结果得到多个聚类簇,所述第二聚类簇分布结果包含每个所述聚类特征表示对应的所述聚类簇中心。
7.根据权利要求6所述的方法,其特征在于,所述对所述第一聚类簇分布结果进行离散分析处理,得到第二聚类簇分布结果,并基于所述第二聚类簇分布结果得到多个聚类簇,包括:
对所述第一聚类簇分布结果中第i个初始聚类簇中心对应的特征分布进行离散度分析,得到所述第i个初始聚类簇中心对应的离散值;
基于所述第i个初始聚类簇中心对应的离散值对所述第i个初始聚类簇中心进行更新,得到所述第二聚类簇分布结果;以及,对特征提取网络进行更新,其中,所述特征提取网络用于提取对象的特征表示;
基于所述第二聚类簇分布结果和更新后的特征提取网络得到多个聚类簇。
8.根据权利要求1至7任一所述的方法,其特征在于,所述基于所述目标对象在第二功能平台中的历史交互数据,提取所述目标对象的域外特征表示,包括:
基于所述目标对象在所述第二功能平台中的历史交互数据,获得目标异构图,所述目标异构图中包含多个元路径,所述目标异构图用于表示所述目标对象和所述第二功能平台中的元素之间的历史交互关系;
提取所述目标异构图中元路径对应的路径特征表示;
对所述元路径对应的路径特征表示进行聚合处理,得到所述目标对象的域外特征表示。
9.根据权利要求8所述的方法,其特征在于,所述提取所述目标异构图中元路径对应的路径特征表示,包括:
获取所述元路径中每个路径节点的节点注意力,所述路径节点用于表示与所述目标对象之间存在历史交互关系的所述元素;
对所述节点注意力进行聚合处理,得到所述元路径的路径特征表示。
10.一种内容推荐装置,其特征在于,所述装置包括:
提取模块,基于目标对象在第一功能平台中的对象属性数据提取所述目标对象的第一对象特征表示;
聚类分析模块,将所述第一对象特征表示与所述第一功能平台中的其他对象的第二对象特征表示进行聚类分析,得到所述目标对象对应的聚类簇中心;
所述提取模块,基于所述目标对象在第二功能平台中的历史交互数据,提取所述目标对象的域外特征表示;
获取模块,获取与所述聚类簇中心对应的映射关系函数对所述域外特征表示进行映射,得到所述目标对象的域内特征表示,其中,所述映射关系函数用于指示所述目标对象在所述第二功能平台和所述第一功能平台之间特征表示的映射关系;
推荐模块,将所述域内特征表示和所述第一对象特征表示结合,得到所述目标对象的目标特征表示,并基于所述目标特征表示对所述目标对象与候选内容推荐池进行匹配,向所述目标对象推送所述候选内容推荐池中的目标内容。
11.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一段程序,所述至少一段程序由所述处理器加载并执行以实现如权利要求1至9任一所述的内容推荐方法。
12.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一段程序,所述至少一段程序由处理器加载并执行以实现如权利要求1至9任一所述的内容推荐方法。
13.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序被处理器执行时实现如权利要求1至9任一所述的内容推荐方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211516062.9A CN117216362A (zh) | 2022-11-29 | 2022-11-29 | 内容推荐方法、装置、设备、介质和程序产品 |
PCT/CN2023/118248 WO2024114034A1 (zh) | 2022-11-29 | 2023-09-12 | 内容推荐方法、装置、设备、介质和程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211516062.9A CN117216362A (zh) | 2022-11-29 | 2022-11-29 | 内容推荐方法、装置、设备、介质和程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117216362A true CN117216362A (zh) | 2023-12-12 |
Family
ID=89043145
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211516062.9A Pending CN117216362A (zh) | 2022-11-29 | 2022-11-29 | 内容推荐方法、装置、设备、介质和程序产品 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN117216362A (zh) |
WO (1) | WO2024114034A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117874355A (zh) * | 2024-02-07 | 2024-04-12 | 北京捷报金峰数据技术有限公司 | 跨域数据推荐方法、装置、电子设备和存储介质 |
CN118674017A (zh) * | 2024-08-19 | 2024-09-20 | 腾讯科技(深圳)有限公司 | 模型训练方法、内容推荐方法、装置及电子设备 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118396672B (zh) * | 2024-06-28 | 2024-09-27 | 深圳品阔信息技术有限公司 | 基于人工智能的数据分析方法及系统 |
CN118410362B (zh) * | 2024-07-02 | 2024-09-03 | 西安银信博锐信息科技有限公司 | 一种用户多维度指标数据的聚合方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2860672A3 (en) * | 2013-10-10 | 2015-08-12 | Deutsche Telekom AG | Scalable cross domain recommendation system |
CN108717654B (zh) * | 2018-05-17 | 2022-03-25 | 南京大学 | 一种基于聚类特征迁移的多电商交叉推荐方法 |
CN111966914B (zh) * | 2020-10-26 | 2021-01-15 | 腾讯科技(深圳)有限公司 | 基于人工智能的内容推荐方法、装置和计算机设备 |
CN114266317A (zh) * | 2021-12-28 | 2022-04-01 | 中国农业银行股份有限公司 | 聚类方法、装置和服务器 |
-
2022
- 2022-11-29 CN CN202211516062.9A patent/CN117216362A/zh active Pending
-
2023
- 2023-09-12 WO PCT/CN2023/118248 patent/WO2024114034A1/zh unknown
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117874355A (zh) * | 2024-02-07 | 2024-04-12 | 北京捷报金峰数据技术有限公司 | 跨域数据推荐方法、装置、电子设备和存储介质 |
CN118674017A (zh) * | 2024-08-19 | 2024-09-20 | 腾讯科技(深圳)有限公司 | 模型训练方法、内容推荐方法、装置及电子设备 |
CN118674017B (zh) * | 2024-08-19 | 2024-10-29 | 腾讯科技(深圳)有限公司 | 模型训练方法、内容推荐方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2024114034A1 (zh) | 2024-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111177575B (zh) | 一种内容推荐方法、装置、电子设备和存储介质 | |
CN111931062B (zh) | 一种信息推荐模型的训练方法和相关装置 | |
CN109033408B (zh) | 信息推送方法及装置、计算机可读存储介质、电子设备 | |
CN112052387B (zh) | 一种内容推荐方法、装置和计算机可读存储介质 | |
CN117216362A (zh) | 内容推荐方法、装置、设备、介质和程序产品 | |
CN106339507B (zh) | 流媒体消息推送方法和装置 | |
CN111949886B (zh) | 一种用于信息推荐的样本数据生成方法和相关装置 | |
CN108959323B (zh) | 视频分类方法和装置 | |
CN110413867B (zh) | 用于内容推荐的方法及系统 | |
CN112989169B (zh) | 目标对象识别方法、信息推荐方法、装置、设备及介质 | |
CN111783712A (zh) | 一种视频处理方法、装置、设备及介质 | |
CN113761359B (zh) | 数据包推荐方法、装置、电子设备和存储介质 | |
Sabet et al. | A multi-perspective approach for analyzing long-running live events on social media. A case study on the “Big Four” international fashion weeks | |
WO2023087933A1 (zh) | 内容推荐方法、装置、设备、存储介质及程序产品 | |
Roy et al. | Social multimedia signals | |
Xu et al. | Towards annotating media contents through social diffusion analysis | |
CN111597361B (zh) | 多媒体数据处理方法、装置、存储介质及设备 | |
CN114357301B (zh) | 数据处理方法、设备及可读存储介质 | |
CN116956183A (zh) | 多媒体资源推荐方法、模型训练方法、装置及存储介质 | |
CN117216361A (zh) | 推荐方法、装置、电子设备及计算机可读存储介质 | |
CN115168609A (zh) | 一种文本匹配方法、装置、计算机设备和存储介质 | |
CN114547440A (zh) | 基于互联网大数据的用户画像挖掘方法及人工智能云系统 | |
CN116091133A (zh) | 一种目标对象属性的识别方法、装置及存储介质 | |
CN113761272A (zh) | 一种数据处理方法、设备以及计算机可读存储介质 | |
Hassanpour et al. | Improving Accuracy of Recommender Systems using Social Network Information and Longitudinal Data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |