CN118069927A

CN118069927A - 基于知识感知和用户多兴趣特征表示的新闻推荐方法及系统

Info

Publication number: CN118069927A
Application number: CN202410273442.7A
Authority: CN
Inventors: 左宗; 陈静; 吴建萍; 谭磊; 张蕾; 王婧
Original assignee: Information Engineering University of PLA Strategic Support Force
Current assignee: Information Engineering University of PLA Strategic Support Force
Priority date: 2024-03-11
Filing date: 2024-03-11
Publication date: 2024-05-24

Abstract

本发明涉及人工智能新闻推荐技术领域，特别涉及一种基于知识感知和用户多兴趣特征表示的新闻推荐方法及系统，通过收集目标用户预设时间段内浏览的历史新闻集合和候选新闻集合，所述新闻集合中记录各新闻文本的文本标题、文本摘要和新闻实体；基于知识图谱并通过对各新闻文本中实体及语义的向量化处理获取历史新闻集合和候选新闻集合中多兴趣特征向量、新闻实体特征向量和新闻语义特征向量，并通过对三向量进行融合得到目标用户多兴趣特征表示和候选新闻特征表示；根据目标用户多兴趣特征表示和待推荐候选新闻特征表示，计算每个候选新闻被推荐给用户的概率，依据概率从候选新闻集合中选取目标用户感兴趣的候选新闻进行推荐。本发明能够准确表示用户偏好，提升新闻推荐性能，具有较好的应用前景。

Description

基于知识感知和用户多兴趣特征表示的新闻推荐方法及系统

技术领域

本发明涉及人工智能新闻推荐技术领域，特别涉及一种基于知识感知和用户多兴趣特征表示的新闻推荐方法及系统。

背景技术

随着互联网的兴起，人们虽然可以接收到更加多样化的信息，用户接收到更多泛滥的消息，如何将新闻或消息更准确地推荐给合适的用户是值得探索的问题。新闻文本推荐技术具有筛选和过滤新闻的能力，支持在海量信息中挖掘用户行为模式并予以个性化推荐，能够极大满足人们对于了解日常社会信息的需求。相较于商品推荐，新闻推荐具有如下特点：第一，用户需求具有时效性。新闻是对新近发生事实的报道，时间和内容都要新，历史报道的新闻一般不需要再被推荐，基于ID的协同过滤推荐算法在应用时有其局限性。第二，用户需求具有关联性。新闻中包含概念、事件等多样关键词，这些关键词往往存在协同、共现等关联，加强对新闻关键词以及其关联的理解将有利于对用户兴趣的表示。第三，用户需求具有多样性。新闻具有鲜明的话题特性，可以通过用户历史浏览新闻文本集合中的全局共性信息来表现，反映了用户对于新闻浏览的多样兴趣。因此，根据新闻文本数据特点，要实现满足用户多样兴趣的新闻文本推荐，就需要广泛建立新闻之间的关联、深入挖掘新闻关键词的全局共性特征。

由于知识图谱能够通过结构化的方式将物理世界中的各种概念、事件及其之间的关系进行表达，完成对知识的智能处理与应用，很多学者尝试将知识图谱引入新闻文本推荐，帮助建立新闻关键词的语义关联并提供背景知识，提升推荐算法性能。在引入知识图谱进行新闻推荐的工作中，比较有代表性的是DKN和KRED两个算法，DKN算法主要通过特定的模型架构Kim-CNN将多篇新闻文本中的单词和已有知识图谱中的实体建立映射关系，利用词向量、映射后的实体向量以及映射后的实体上下文向量完成对新闻特征的提取表示，考虑了新闻文本之间的实体关联。KRED算法考虑将BERT等预训练语言模型引入新闻推荐框架，同时完善构建了一个新闻领域知识图谱，利用文本向量、实体向量及其上下文向量完成了对新闻文本特征的提取表示，更加灵活地融入知识图谱完成了对于新闻文本特征的刻画。然而，以上方法和思路在建模用户兴趣特征时都忽略了用户历史浏览新闻文本集合中的全局共性信息，没有考虑到用户需求的多样性，从而影响新闻推荐准确度。

发明内容

为此，本发明提供一种基于知识感知和用户多兴趣特征表示的新闻推荐方法及系统，能够准确表示用户偏好，提升新闻推荐性能。

按照本发明所提供的设计方案，一方面，提供一种基于知识感知和用户多兴趣特征表示的新闻推荐方法，包含：

收集目标用户预设时间段内浏览的历史新闻集合和候选新闻集合，所述新闻集合中记录各新闻文本的文本标题、文本摘要和新闻实体；

基于知识图谱并通过对各新闻文本中实体及语义的向量化处理获取历史新闻集合和候选新闻集合中多兴趣特征向量、新闻实体特征向量和新闻语义特征向量，并通过对三向量进行融合得到目标用户多兴趣特征表示和候选新闻特征表示；

根据目标用户多兴趣特征表示和待推荐候选新闻特征表示，计算每个候选新闻被推荐给用户的概率，依据概率从候选新闻集合中选取目标用户感兴趣的候选新闻进行推荐。

作为本发明基于知识感知和用户多兴趣特征表示的新闻推荐方法，进一步地，通过对各新闻文本中实体及语义的向量化处理获取历史新闻集合中新闻语义特征向量，包含：

利用预训练语言模型获取新闻文本对应的新闻语义特征向量，并对历史新闻集合中目标用户预设时间段内浏览的各新闻语义特征向量进行聚合，以得到目标用户感兴趣的新闻语义特征向量。

作为本发明基于知识感知和用户多兴趣特征表示的新闻推荐方法，进一步地，通过对各新闻文本中实体及语义的向量化处理获取候选新闻集合中的新闻语义特征向量，包含：

利用预训练语言模型获取候选新闻集合中各新闻文本对应的新闻语义特征向量。

作为本发明基于知识感知和用户多兴趣特征表示的新闻推荐方法，进一步地，通过对各新闻文本中实体及语义的向量化处理获取多兴趣特征向量，包含：

基于各新闻文本构建对应知识图谱，并采用图注意力机制对知识图谱中每个实体的邻居节点信息进行聚合，以得到每个实体向量表示；

采用动态路由聚类算法将实体向量表示划分为若干簇，其中，划分过程包含：将实体向量表示作为动态路由聚类算法中的底层胶囊，簇作为算法中多兴趣特征向量表示的上层胶囊，基于向量映射矩阵获取底层胶囊和上层胶囊之间的权重，依据权重得到多兴趣特征向量表示，并通过非线性压缩函数获取最终的多兴趣特征向量。

作为本发明基于知识感知和用户多兴趣特征表示的新闻推荐方法，进一步地，通过对各新闻文本中实体及语义的向量化处理获取新闻实体特征向量，包含：

依据知识图谱中各实体特征获取各新闻文本对应初始实体向量，利用注意力机制计算各实体与对应新闻语义向量之间及该新闻文本所有实体之间的相关性；

依据实体与新闻语义向量相关性及实体与新闻文本所有实体之间的相关性设置该实体的权重，以基于各实体及其权重并利用注意力池化学习来获取对应的新闻实体特征向量。

作为本发明基于知识感知和用户多兴趣特征表示的新闻推荐方法，进一步地，通过对三向量进行融合得到目标用户多兴趣特征表示，包含：

将历史新闻集合对应的多兴趣特征向量和新闻实体特征向量进行拼接，得到目标用户实体角度特征描述；

结合新闻实体特征向量和新闻语义特征向量之间的关系并利用多头注意力机制对实体角度特征描述和新闻语义特征向量进行垂直拼接优化，以通过对优化后的向量进行聚合来获取对应的目标用户多兴趣特征表示。

作为本发明基于知识感知和用户多兴趣特征表示的新闻推荐方法，进一步地，通过对三向量进行融合得到候选新闻特征表示，包含：

将候选新闻集合对应的多兴趣特征向量和新闻实体特征向量进行拼接，得到候选新闻中实体角度特征描述；

结合新闻实体特征向量和新闻语义特征向量之间的关系并利用多头注意力机制对实体角度特征描述和新闻语义特征向量进行垂直拼接优化，以依据优化后的向量来获取对应的候选新闻特征表示。

作为本发明基于知识感知和用户多兴趣特征表示的新闻推荐方法，进一步地，计算每个候选新闻被推荐给用户的概率，依据概率从候选新闻集合中选取目标用户感兴趣的候选新闻进行推荐，还包含：

对目标用户多兴趣特征表示标注新闻文本推荐标签来生成训练样本，并采用负采样方法对新闻推荐模型进行迭代训练，直至新闻推荐模型收敛，利用训练后的新闻推荐模型来获取每个候选新闻被推荐给用户的概率分布，以依据概率分布选取目标用户感兴趣的候选新闻进行推荐。

作为本发明基于知识感知和用户多兴趣特征表示的新闻推荐方法，进一步地，采用负采样方法对新闻推荐模型进行迭代训练的损失函数表示为：

其中，i为用户，j为新闻文本，Θ表示训练样本，λ表示正则化系数，/>为用户i的历史新闻集合。

再一方面，本发明还提供一种基于知识感知和用户多兴趣特征表示的新闻推荐系统，包含：数据获取模块、向量处理模块和推荐确定模块，其中，

数据获取模块，用于收集目标用户预设时间段内浏览的历史新闻集合和候选新闻集合，所述新闻集合中记录各新闻文本的文本标题、文本摘要和新闻实体；

向量处理模块，用于基于知识图谱并通过对各新闻文本中实体及语义的向量化处理获取历史新闻集合和候选新闻集合中多兴趣特征向量、新闻实体特征向量和新闻语义特征向量，并通过对三向量进行融合得到目标用户多兴趣特征表示和候选新闻特征表示；

推荐确定模块，用于根据目标用户多兴趣特征表示和待推荐候选新闻特征表示，计算每个候选新闻被推荐给用户的概率，依据概率从候选新闻集合中选取目标用户感兴趣的候选新闻进行推荐。

本发明的有益效果：

本发明基于知识图谱从用户历史浏览新闻文本集合中提取全局共性信息作为用户的多兴趣特征，增强新闻文本的深层语义表达，进而实现对于用户关于新闻多样兴趣的细粒度刻画，将用户历史浏览新闻文本对应的实体看作所有文本的关键词，通过邻域信息的融合，并且基于动态路由算法聚类形成用户的多兴趣特征向量；利用注意力机制并基于知识图谱完成每篇新闻对应实体的特征建模和信息聚合，将多兴趣特征、实体特征、语义特征进行信息融合，构成用户最终的多兴趣特征表示，有效提升新闻推荐性能，具有较好的应用前景。

附图说明：

图1为实施例中基于知识感知和用户多兴趣特征表示的新闻推荐流程示意；

图2为实施例中新闻推荐算法架构示意；

图3为实施例中多兴趣编码器架构示意；

图4为实施例中新闻实体编码器架构示意。

具体实施方式：

为使本发明的目的、技术方案和优点更加清楚、明白，下面结合附图和技术方案对本发明作进一步详细的说明。

由于新闻对时效性要求高，基于协同过滤的推荐算法有其不适应之处，因此在构建新闻推荐系统时，本案实施例中，主要考虑基于内容的推荐算法，即仅通过分析用户自身历史行行为、主要考虑基于用户历史浏览新闻文本进行精准新闻推荐。参见图1所示，本案实施例中一种基于知识感知和用户多兴趣特征表示的新闻推荐方法，具体可包含：

S101、收集目标用户预设时间段内浏览的历史新闻集合和候选新闻集合，所述新闻集合中记录各新闻文本的文本标题、文本摘要和新闻实体。

基于知识图谱从用户历史浏览新闻文本集合中提取全局共性信息，增强用户历史浏览新闻的深层语义表示，主要面临知识图谱如何使用以及全局共性信息如何提取的问题。一般而言，文本中共性信息提取可以考虑利用文本中的单词基于聚类的思想实现。由于新闻文本中的关键词与知识图谱中的实体已经建立起一一映射关系，因此，本案实施例中，可以将用户历史浏览新闻文本集合对应的实体通过聚类来完成共性信息的提取。因此，在对用户历史浏览新闻文本集合对应的实体进行聚类操作之前，同样可以考虑基于知识图谱构成描述文本集合的全局子图，通过邻居节点信息聚合丰富实体信息，从而更加广泛地利用知识图谱提供的知识和关联。

通过构建用户和新闻/>的画像，用户画像和候选新闻画像之间匹配程度越高，则用户点击新闻的可能性越大。用于构建用户和新闻画像的数据包括用户历史点击的新闻和新闻相关的知识图谱数据。某个用户历史点击的新闻集合可以表示为m代表点击的新闻数量。其中，每一条新闻v都包含1条文本的标题和摘要，以及该新闻对应的若干个实体ε_v＝{e₁,e₂,…,e_n}，n代表新闻包含的实体数量。

S102、基于知识图谱并通过对各新闻文本中实体及语义的向量化处理获取历史新闻集合和候选新闻集合中多兴趣特征向量、新闻实体特征向量和新闻语义特征向量，并通过对三向量进行融合得到目标用户多兴趣特征表示和候选新闻特征表示。

用于新闻推荐的用户多兴趣特征表示算法架构可如图2所示，在构建用户画像时，利用用户历史浏览新闻对应的实体训练得到描述用户兴趣的多兴趣特征向量、实体特征向量，利用用户历史浏览新闻对应的单词得到描述用户兴趣的语义特征向量，最终聚合形成用户多兴趣特征向量并用于下一步推荐任务。

具体地，通过对各新闻文本中实体及语义的向量化处理获取历史新闻集合中新闻语义特征向量，可包含：

当给定一篇新闻的单词，通过Local text encoder(例如BERT等预训练语言模型)训练得到新闻的语义特征v_i。由于用户历史点击了多篇新闻文本，因此，采用一个聚合器(Aggregator)对特征v_i进行聚合得到描述用户的语义特征向量。

其中，通过对各新闻文本中实体及语义的向量化处理获取多兴趣特征向量，如图3所示，可设计为包含：

用户历史浏览新闻的所有实体都能关联知识图谱中的一组关联，用来表示，其中，每个三元组都代表从尾实体t到头实体h存在连接关系r。基于数据集提供的知识图谱，可以得到所有新闻对应实体和关系的向量。

由于知识图谱中的每个实体都与其邻居节点有关，因此，参见图3所示，本案实施例中可采用图注意力机制(KGAT)对每个实体的邻居信息进行聚合并且得到每个实体的向量表示，具体可表示为：

其中代表三元组的集合,e_h和e_t分别代表头实体和尾实体，/>表示向量拼接。π(h,r,t)描述了邻居节点对该实体的影响，主要通过一个全连接层学习表示。在计算得到所有实体的影响值之后，再通过Softmax函数进行数值归一化。

为了得到这些实体的共性特征，可进一步采用动态路由聚类算法将这些实体分成若干簇。这些实体向量被当作算法中的底层胶囊，形成的簇被当作算法中的上层胶囊，也就是多兴趣特征向量。当给定底层的实体向量和上层的多兴趣特征向量/>向量/>和向量/>之间的权重可以用w_i,j来表示，即可表示为：

其中j代表了多兴趣特征向量的个数，/>代表了动态路由算法中每一对底层实体向量和上层多兴趣特征向量的映射矩阵。第j个多兴趣特征向量能够通过w_i,j和所有的底层实体向量/>表示，并可表示为：

最终，动态路由算法通过一个非线性压缩函数(squash)得到多个多兴趣特征向量，最终拼接形成用户的多兴趣特征向量

其中，通过对各新闻文本中实体及语义的向量化处理获取新闻实体特征向量，可设计为包含：

在构建用户的实体特征时，首先要完成对单篇新闻对应实体特征建模。为了更好地利用知识图谱提供的背景知识和结构信息，参见图4所示，本案实施例中利用一个注意力机制(local entity encoder)，在得到新闻初始的多个实体向量后，首先通过KGAT算法挖掘高阶连通信息，然后对实体向量按照不同的权重进行信息聚合。受STCKA算法的启发，在对单篇新闻的多个实体向量进行信息聚合时，不仅需要衡量实体与文本的语义相似度，也要衡量每个实体相对于整个实体集的重要性，探索实体的相对重要性。具体过程可描述如下：

首先，计算新闻的第i个实体和语义向量v的相关性α_i。

然后，计算新闻的第i个实体和该新闻所有实体集ε_v的相关性β_i。

最终，新闻的第i个实体的权重a_i可以通过α_i和β_i计算，计算过程可表示为：

a_i＝softmax(μ₁α_i+μ₂β_i)

μ₁,μ₂是可训练的参数，代表了依据对应相关性进行自适应集成的权重，考虑到参数训练的复杂性，可通过设置参数集合μ＝{μ₁,μ₂}并对其中两个参数进行归一化操作来解决。

最后，单篇新闻的实体特征向量e′_j可以表示为：

如图4所示，在得到每篇新闻的实体特征向量之后，便能通过注意力池化学习得到关于用户的实体特征向量

进一步地，通过对三向量进行融合得到目标用户多兴趣特征表示，可包含：

对于每个用户，已经得到了其语义特征多兴趣特征/>和实体特征/>在进行信息聚合时，考虑到数据来源的不同，首先，将多兴趣特征/>和实体特征/>进行拼接，得到用户关于实体角度的描述u^ε。

然后，通过多头注意力机制综合考虑实体向量和文本向量之间的关系并对表示用户兴趣的实体和文本向量进行优化，优化过程可表示为：

x′_n＝MSA(x_n)＝Concat(head₁,head₂,…,head_h)·W^O

where head_i＝Att(x_n·W_i ^Q,x_n·W_i ^K,x_n·W_i ^V)

其中W^O是可训练的参数。对于每个头i，都使用权重W_i ^Q,W_i ^K,W_i ^V将x_n映射成Q、K、V向量。Concat(·)表示向量拼接，Att(·)表示缩放点积注意力机制，d_k表示K的维度。

接着，使用聚合器对x′_n进行聚合并最终得到用户的多兴趣特征表示。另外，在对候选新闻建模时，同样采用以上方法，将新闻特征建模数据来源分成语义特征、实体特征和多兴趣特征三个部分，并省略多篇新闻信息聚合的过程。

S103、根据目标用户多兴趣特征表示和待推荐候选新闻特征表示，计算每个候选新闻被推荐给用户的概率，依据概率从候选新闻集合中选取目标用户感兴趣的候选新闻进行推荐。

可通过对目标用户多兴趣特征表示标注新闻文本推荐标签来生成训练样本，并采用负采样方法对新闻推荐模型进行迭代训练，直至新闻推荐模型收敛，利用训练后的新闻推荐模型来获取每个候选新闻被推荐给用户的概率分布，以依据概率分布选取目标用户感兴趣的候选新闻进行推荐。

采用负采样的方法进行模型训练。对于训练集中的每个用户-新闻(i,j)作为正样本，通过随机选择N篇新闻组成负样本对(i,j')，然后通过内积计算用户点击每个项目的概率最终目标是要使得用户点击正样本对的概率最大。

最后，问题转化为最小化模型训练过程中的损失函数L_rec，损失函数可表示为：

其中，Θ表示了训练集，λ表示了正则化系数。

进一步地，基于以上的方法，本发明实施例还提供一种基于知识感知和用户多兴趣特征表示的新闻推荐系统，包含：数据获取模块、向量处理模块和推荐确定模块，其中，

通过以上案例也能够进一步表明，本案方案能够基于知识图谱捕捉用户历史浏览新闻文本集合中的全局共性特征，增强对用户多兴趣建模，提升目标用户新闻推荐准确度，便于实际场景中的应用。

除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本发明的范围。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

结合本文中所公开的实施例描述的各实例的单元及方法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已按照功能一般性地描述了各示例的组成及步骤。这些功能是以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。本领域普通技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不认为超出本发明的范围。

本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成，所述程序可以存储于计算机可读存储介质中，如：只读存储器、磁盘或光盘等。可选地，上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现，相应地，上述实施例中的各模块/单元可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种基于知识感知和用户多兴趣特征表示的新闻推荐方法，其特征在于，包含：

2.根据权利要求1所述的基于知识感知和用户多兴趣特征表示的新闻推荐方法，其特征在于，通过对各新闻文本中实体及语义的向量化处理获取历史新闻集合中新闻语义特征向量，包含：

3.根据权利要求2所述的基于知识感知和用户多兴趣特征表示的新闻推荐方法，其特征在于，通过对各新闻文本中实体及语义的向量化处理获取候选新闻集合中的新闻语义特征向量，包含：

4.根据权利要求1所述的基于知识感知和用户多兴趣特征表示的新闻推荐方法，其特征在于，通过对各新闻文本中实体及语义的向量化处理获取多兴趣特征向量，包含：

5.根据权利要求1所述的基于知识感知和用户多兴趣特征表示的新闻推荐方法，其特征在于，通过对各新闻文本中实体及语义的向量化处理获取新闻实体特征向量，包含：

6.根据权利要求1所述的基于知识感知和用户多兴趣特征表示的新闻推荐方法，其特征在于，通过对三向量进行融合得到目标用户多兴趣特征表示，包含：

7.根据权利要求1所述的基于知识感知和用户多兴趣特征表示的新闻推荐方法，其特征在于，通过对三向量进行融合得到候选新闻特征表示，包含：

8.根据权利要求1所述的基于知识感知和用户多兴趣特征表示的新闻推荐方法，其特征在于，计算每个候选新闻被推荐给用户的概率，依据概率从候选新闻集合中选取目标用户感兴趣的候选新闻进行推荐，还包含：

9.根据权利要求8所述的基于知识感知和用户多兴趣特征表示的新闻推荐方法，其特征在于，采用负采样方法对新闻推荐模型进行迭代训练的损失函数表示为：

其中，i为用户，j为新闻文本，Θ表示训练样本，λ表示正则化系数，v_u为用户i的历史新闻集合。

10.一种基于知识感知和用户多兴趣特征表示的新闻推荐系统，其特征在于，包含：数据获取模块、向量处理模块和推荐确定模块，其中，