CN113722431B

CN113722431B - 命名实体关系识别方法、装置、电子设备及存储介质

Info

Publication number: CN113722431B
Application number: CN202110973259.4A
Authority: CN
Inventors: 李建强; 赵慧凤; 张硕
Original assignee: Beijing University of Technology
Current assignee: Beijing University of Technology
Priority date: 2021-08-24
Filing date: 2021-08-24
Publication date: 2024-10-15
Anticipated expiration: 2041-08-24
Also published as: CN113722431A

Abstract

本发明提供一种命名实体关系识别方法、装置、电子设备及存储介质。所述方法包括：获取目标文本，将所述目标文本输入至命名实体关系识别模型中，得到命名实体关系识别结果；其中，所述命名实体关系识别模型由命名实体关系语言子模型、强化学习代理子模型和对比学习关系增强子模型组成。本发明通过经过对比学习训练的命名实体关系识别模型进行命名实体关系识别，可以有效去除远程监督产生的噪音，降低所收集的命名实体关系结果的不确定性。

Description

命名实体关系识别方法、装置、电子设备及存储介质

技术领域

本发明涉及计算机技术领域，尤其涉及一种命名实体关系识别方法、装置、电子设备及存储介质。

背景技术

在自然语言处理中，信息抽取能够快速、准确地从大型语料库中发现有价值的信息，提高自然语言处理的效率。

信息抽取包括概念抽取与关系抽取两方面，关系抽取的目标是自动识别相关三元组，该三元组由一对实体概念及其之间的关系构成。现有的关系抽取方法是利用容易获得的间接监督知识——通常将其称为远程监督。远程监督是将已有的知识库对应到丰富的非结构化数据中(例如医疗文本)生成大量的训练数据，通过训练一个关系抽取器来预测实体对的关系类型。远程监督提出这样的假设：如果一个句子中含有一个关系涉及的实体对，那这个句子就是描述的这个关系。然而这种假设会产生大量噪音，使得所收集的命名实体关系结果有较高的不确定性。

发明内容

本发明提供一种命名实体关系识别方法、装置、电子设备及存储介质。用以解决现有技术中无法有效降低远程监督在进行实体关系抽取时产生的噪音的缺陷，实现在无人工标注情况下可以快速收集大量准确的实体关系抽取数据集。

本发明提供一种命名实体关系识别方法，包括：

获取目标文本，将所述目标文本输入至命名实体关系识别模型中，得到命名实体关系识别结果；

其中，所述命名实体关系识别模型由命名实体关系语言子模型、强化学习代理子模型和对比学习关系增强子模型组成，所述命名实体关系识别模型基于以下步骤进行训练：

步骤1，根据预设知识库的远程监督，构建远程标记命名实体关系数据集；

步骤2，将所述远程标记命名实体关系数据集输入至命名实体关系语言子模型中，得到用于表征命名实体关系的词向量；所述命名实体关系语言子模型是指利用所述远程标记命名实体关系数据集和未标记语料库作为输入样本，以及利用表征命名实体关系的词向量作为输出样本，进行训练后得到的；

步骤3，对所述词向量对应的命名实体的实体类型分别进行标注后，输入至强化学习代理子模型中，得到包含假阳性命名实体关系实例的远程标记命名实体关系数据集；其中，所述强化学习代理子模型是指利用阳性命名实体关系实例作为正样本，以及利用假阳性命名实体关系实例作为负样本，基于交差熵代价函数进行训练后得到的；

步骤4，将包含假阳性命名实体关系实例的远程标记命名实体关系数据集输入至对比学习关系增强子模型中，得到命名实体关系增强的词向量；其中，所述命名实体关系增强的词向量用于更新所述强化学习代理子模型的状态属性，以增强所述强化学习代理子模型识别假阳性命名实体关系实例的能力；所述对比学习关系增强子模型是指利用强化学习代理子模型输出的假阳性命名实体关系实例作为负样本，以及强化学习代理子模型输出的除假阳性命名实体关系实例外的命名实体关系实例作为正样本，进行训练后得到的；

步骤5，将所述强化学习代理子模型输出的远程标记命名实体关系数据集输入至关系分类器，根据关系分类器的当前性能不断优化强化学习代理模型，直至输出去除噪音的远程标记命名实体关系数据集，所述命名实体关系识别模型训练结束。

根据本发明提供的一种命名实体关系识别方法，包括：

基于标注好的小型知识图谱，对预设知识库中的文本标注命名实体关系标签，构建远程标记命名实体关系数据集。

根据本发明提供的一种命名实体关系识别方法，包括：

所述交差熵代价函数j(θ)为：

其中，y_i为强化学习代理选择标签，a为动作，s_i为状态。

根据本发明提供的一种命名实体关系识别方法，包括：

所述对比学习关系增强子模型训练的损失函数为：

其中，t_A和t_B为通过线性采样的元组集，和为元组集，和为正样本的关系表示，X为正样本与负样本的余弦相似度，N为超参数，为从负样本集中采样的元组。

根据本发明提供的一种命名实体关系识别方法，包括：

所述关系分类器训练的损失函数j(θ)为：

其中，Ω为与上次迭代所移除的假阳性命名实体关系实例中不同的部分，a为动作，s为状态，R为强化学习代理子模型的奖励参数。

本发明还提供一种命名实体关系识别装置，包括：

处理模块，用于获取目标文本，将所述目标文本输入至命名实体关系识别模型中，得到命名实体关系识别结果；

根据预设知识库的远程监督，构建远程标记命名实体关系数据集；

将所述远程标记命名实体关系数据集输入至命名实体关系语言子模型中，得到用于表征命名实体关系的词向量；所述命名实体关系语言子模型是指利用所述远程标记命名实体关系数据集和未标记语料库作为输入样本，以及利用表征命名实体关系的词向量作为输出样本，进行训练后得到的；

对所述词向量对应的命名实体的实体类型分别进行标注后，输入至强化学习代理子模型中，得到包含假阳性命名实体关系实例的远程标记命名实体关系数据集；其中，所述强化学习代理子模型是指利用阳性命名实体关系实例作为正样本，以及利用假阳性命名实体关系实例作为负样本，基于交差熵代价函数进行训练后得到的；

将包含假阳性命名实体关系实例的远程标记命名实体关系数据集输入至对比学习关系增强子模型中，得到命名实体关系增强的词向量；其中，所述命名实体关系增强的词向量用于更新所述强化学习代理子模型的状态属性，以增强所述强化学习代理子模型识别假阳性命名实体关系实例的能力；所述对比学习关系增强子模型是指利用强化学习代理子模型输出的假阳性命名实体关系实例作为负样本，以及强化学习代理子模型输出的除假阳性命名实体关系实例外的命名实体关系实例作为正样本，进行训练后得到的；

将所述强化学习代理子模型输出的远程标记命名实体关系数据集输入至关系分类器，根据关系分类器的当前性能不断优化强化学习代理模型，直至输出去除噪音的远程标记命名实体关系数据集，所述命名实体关系识别模型训练结束。

根据本发明提供的一种命名实体关系识别装置，所述交差熵代价函数j(θ)为：

其中，y_i为强化学习代理选择标签，a为动作，s_i为状态。

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述命名实体关系识别方法的步骤。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述命名实体关系识别方法的步骤。

本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述命名实体关系识别方法的步骤。

本发明提供的命名实体关系识别方法、装置、电子设备及存储介质，通过将获取的目标文本输入至训练好的命名实体关系识别模型中，即可得到准确的命名实体关系识别结果。其中，所述命名实体关系识别模型由命名实体关系语言子模型、强化学习代理子模型和对比学习关系增强子模型组成，所述命名实体关系识别模型基于以下步骤进行训练：步骤1，根据预设知识库的远程监督，构建远程标记命名实体关系数据集；步骤2，将所述远程标记命名实体关系数据集输入至命名实体关系语言子模型中，得到用于表征命名实体关系的词向量；所述命名实体关系语言子模型是指利用所述远程标记命名实体关系数据集和未标记语料库作为输入样本，以及利用表征命名实体关系的词向量作为输出样本，进行训练后得到的；步骤3，对所述词向量对应的命名实体的实体类型分别进行标注后，输入至强化学习代理子模型中，得到包含假阳性命名实体关系实例的远程标记命名实体关系数据集；其中，所述强化学习代理子模型是指利用阳性命名实体关系实例作为正样本，以及利用假阳性命名实体关系实例作为负样本，基于交差熵代价函数进行训练后得到的；步骤4，将包含假阳性命名实体关系实例的远程标记命名实体关系数据集输入至对比学习关系增强子模型中，得到命名实体关系增强的词向量；其中，所述命名实体关系增强的词向量用于更新所述强化学习代理子模型的状态属性，以增强所述强化学习代理子模型识别假阳性命名实体关系实例的能力；所述对比学习关系增强子模型是指利用强化学习代理子模型输出的假阳性命名实体关系实例作为负样本，以及强化学习代理子模型输出的除假阳性命名实体关系实例外的命名实体关系实例作为正样本，进行训练后得到的；步骤5，将所述强化学习代理子模型输出的远程标记命名实体关系数据集输入至关系分类器，根据关系分类器的当前性能不断优化强化学习代理模型，直至输出去除噪音的远程标记命名实体关系数据集，所述命名实体关系识别模型训练结束。由此可知，本发明基于对比学习的思想对实体关系进行增强，使模型具有理解上下文语义信息和实体类型的能力，从而去除远程监督产生的噪音，降低所收集的命名实体关系结果的不确定性。可见，本发明在无人工标注情况下可以快速收集大量实体关系抽取数据集，减少所收集关系数据集的不确定性，为下游训练关系分类器、扩充数据集等任务提供数据帮助。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的命名实体关系识别方法的流程示意图之一；

图2是本发明提供的命名实体关系识别方法的流程示意图之二；

图3是本发明提供的命名实体关系识别装置的结构示意图；

图4是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1是本发明提供的命名实体关系识别方法的流程示意图之一，图2是本发明提供的命名实体关系识别方法的流程示意图之二。下面结合图1和图2描述本发明的命名实体关系识别方法，包括：

步骤101：获取目标文本，将所述目标文本输入至命名实体关系识别模型中，得到命名实体关系识别结果；

在本步骤中，以医疗文本为目标为本为例进行说明。首先获取目标文本，然后将目标文本输入至命名实体关系识别模型中，得到命名实体关系识别结果。其中，命名实体关系识别模型由命名实体关系语言子模型、强化学习代理子模型和对比学习关系增强子模型组成。命名实体关系识别模型的训练过程为：首先利用来自外部知识库的远程监督在大规模未标记语料库上进行训练。可选的，外部知识库可以为中文维基百科和维基数据。具体的，利用命名实体识别工具进行命名实体识别，将这些实体提及以及维基百科的提及与超链接链接到维基数据项，从而获得每个实体的维基数据ID。不同实体之间的关系通过查询维基数据进行远程注释。然后将远程标记命名实体关系数据集输入至命名实体关系语言子模型中，得到用于表征命名实体关系的词向量。具体的，对于每个文档s_i，首先使用命名实体关系语言子模型对其进行编码并获得一系列隐藏状态对提到e_ij的连续令牌应用池化操作以获得医疗文本实体表示，注意e_ij可能在s_i中出现多次，e_ij的第k次出现，包含从索引到的标记，表示为为了聚合有关e_ij的所有信息，本发明将每次出现的所有表示平均为全局实体表示e_ij，并将两个实体e_ij1和e_ij2的最终表示连接起来作为它们的关系表示，从而得到用于表征命名实体关系的词向量，例如：

在本步骤中，由于经远程监督得到的远程标记命名实体关系数据集中存在大量噪声，而本发明考虑真正的正样本(阳性命名实体关系实例)与远程标记命名实体关系数据集中的假阳性样本相比应该在数量上有明显的优势，因此，对于特定的关系类型，本发明利用阳性命名实体关系实例作为正样本，以及利用假阳性命名实体关系实例作为负样本，并基于交差熵代价函数训练一个二元分类器，也即强化学习代理子模型，以使训练后的强化学习代理子模型具有对明显的假阳性命名实体关系实例的识别能力。

在本步骤中，在得到用于表征命名实体关系的词向量后，首先对词向量对应的命名实体的实体类型分别进行标注，然后将其输入至训练好的强化学习代理子模型中，得到包含假阳性命名实体关系实例的远程标记命名实体关系数据集。可以理解的是，此时的远程标记命名实体关系数据集不包含明显的假阳性命名实体关系实例，但仍然包含少数强化学习代理子模型无法识别的错误标记命名实体关系实例。对此，为了使强化学习代理子模型能够更好的理解上下文信息以及实体的类型，提高对错误标记实例的识别能力，本发明采用对比学习的思想，通过拉近“邻居”，拉远“非邻居”对实体关系进行增强。具体的，将包含假阳性命名实体关系实例的远程标记命名实体关系数据集输入至对比学习关系增强子模型中，得到命名实体关系增强的词向量。其中，对比学习关系增强子模型用于进一步将远程标记命名实体关系数据集中的假阳性命名实体关系实例进行剔除。

在本步骤中，对比学习关系增强子模型是指利用强化学习代理子模型输出的假阳性命名实体关系实例作为负样本，以及强化学习代理子模型输出的除假阳性命名实体关系实例外的命名实体关系实例作为正样本，进行训练后得到的。具体的，首先对元组进行采样和其中r_A＝r_B，s_A表示句子，表示实体1，表示实体2，r_A表示两个实体的关系。将训练好的的强化学习代理子模型筛选出的假阳性命名实体关系实例作为负样本，剩余的实例作为正样本，并通过不断优化对比学习关系增强子模型的损失函数，直至对比学习关系增强子模型能够训练出更好的表示实体关系的词向量。由此在强化学习每一轮的迭代中，通过更新词向量，使得强化学习代理子模型在下一步的迭代中将上下文和实体类型作为学习依据，进一步提高强化学习代理子模型对错误标记实例的识别能力。

在本步骤中，将所述强化学习代理子模型输出的远程标记命名实体关系数据集输入至关系分类器，根据关系分类器的当前性能不断优化强化学习代理子模型，从而输出去除噪音的远程标记命名实体关系数据集。具体的，为了进一步评估强化学习代理子模型的一系列动作，本发明采用一个简单的卷积神经网络，将卷积神经网络关系分类的性能作为强化学习代理奖励参数的依据，当计算得到的奖励参数完成收敛时，结束强化学习代理子模型的优化。

由此可见，本发明提出了一种基于对比学习的命名实体关系识别方法，利用对比学习的思想对实体关系进行增强，并将上下文语义和实体类型考虑到关系的表示中。针对远程监督产生的大量不确定性，提出了一种基于强化学习的实例选择器来筛选关系数据集中的噪音关系标签。通过该方法的实践和应用，在无人工标注情况下可以快速收集大量医疗关系抽取数据集，减少所收集关系数据集的不确定性，为下游训练关系分类器、扩充数据集等任务提供数据帮助。利用这些医疗关系可以建立庞大的医疗知识图谱，帮助医生更好的梳理病例，辅助医生及时把控病人的状态。

本发明提供的命名实体关系识别方法，通过将获取的目标文本输入至训练好的命名实体关系识别模型中，即可得到准确的命名实体关系识别结果。其中，所述命名实体关系识别模型由命名实体关系语言子模型、强化学习代理子模型和对比学习关系增强子模型组成，所述命名实体关系识别模型基于以下步骤进行训练：步骤1，根据预设知识库的远程监督，构建远程标记命名实体关系数据集；步骤2，将所述远程标记命名实体关系数据集输入至命名实体关系语言子模型中，得到用于表征命名实体关系的词向量；所述命名实体关系语言子模型是指利用所述远程标记命名实体关系数据集和未标记语料库作为输入样本，以及利用表征命名实体关系的词向量作为输出样本，进行训练后得到的；步骤3，对所述词向量对应的命名实体的实体类型分别进行标注后，输入至强化学习代理子模型中，得到包含假阳性命名实体关系实例的远程标记命名实体关系数据集；其中，所述强化学习代理子模型是指利用阳性命名实体关系实例作为正样本，以及利用假阳性命名实体关系实例作为负样本，基于交差熵代价函数进行训练后得到的；步骤4，将包含假阳性命名实体关系实例的远程标记命名实体关系数据集输入至对比学习关系增强子模型中，得到命名实体关系增强的词向量；其中，所述命名实体关系增强的词向量用于更新所述强化学习代理子模型的状态属性，以增强所述强化学习代理子模型识别假阳性命名实体关系实例的能力；所述对比学习关系增强子模型是指利用强化学习代理子模型输出的假阳性命名实体关系实例作为负样本，以及强化学习代理子模型输出的除假阳性命名实体关系实例外的命名实体关系实例作为正样本，进行训练后得到的；步骤5，将所述强化学习代理子模型输出的远程标记命名实体关系数据集输入至关系分类器，根据关系分类器的当前性能不断优化强化学习代理模型，直至输出去除噪音的远程标记命名实体关系数据集，所述命名实体关系识别模型训练结束。由此可知，本发明基于对比学习的思想对实体关系进行增强，使模型具有理解上下文语义信息和实体类型的能力，从而去除远程监督产生的噪音，降低所收集的命名实体关系结果的不确定性。可见，本发明在无人工标注情况下可以快速收集大量实体关系抽取数据集，减少所收集关系数据集的不确定性，为下游训练关系分类器、扩充数据集等任务提供数据帮助。

基于上述实施例的内容，在本实施例中，所述根据预设知识库的远程监督，构建远程标记命名实体关系数据集，包括：

基于上述实施例的内容，在本实施例中，所述交差熵代价函数j(θ)为：

其中，y_i为强化学习代理选择标签，a为动作，s_i为状态。

基于上述实施例的内容，在本实施例中，所述对比学习关系增强子模型训练的损失函数为：

其中，t_A和t_B为通过线性采样的元组集，和为元组集，和为正样本的关系表示，Z为正样本与负样本的余弦相似度，N为超参数，为从负样本集中采样的元组。

基于上述实施例的内容，在本实施例中，所述关系分类器训练的损失函数j(θ)为：

下面对本发明提供的命名实体关系识别装置进行描述，下文描述的命名实体关系识别装置与上文描述的命名实体关系识别方法可相互对应参照。

如图3所示，本发明提供的一种命名实体关系识别装置，包括：

在本实施例中，首先获取目标文本，然后将目标文本输入至命名实体关系识别模型中，得到命名实体关系识别结果。其中，命名实体关系识别模型由命名实体关系语言子模型、强化学习代理子模型和对比学习关系增强子模型组成。命名实体关系识别模型的训练过程为：首先利用来自外部知识库的远程监督在大规模未标记语料库上进行训练。可选的，外部知识库可以为中文维基百科和维基数据。具体的，利用命名实体识别工具进行命名实体识别，将这些实体提及以及维基百科的提及与超链接链接到维基数据项，从而获得每个实体的维基数据ID。不同实体之间的关系通过查询维基数据进行远程注释。然后将远程标记命名实体关系数据集输入至命名实体关系语言子模型中，得到用于表征命名实体关系的词向量。具体的，对于每个文档s_i，首先使用命名实体关系语言子模型对其进行编码并获得一系列隐藏状态对提到e_ij的连续令牌应用池化操作以获得医疗文本实体表示，注意e_ij可能在s_i中出现多次，e_ij的第k次出现，包含从索引到的标记，表示为为了聚合有关e_ij的所有信息，本发明将每次出现的所有表示平均为全局实体表示e_ij，并将两个实体e_ij1和e_ij2的最终表示连接起来作为它们的关系表示，从而得到用于表征命名实体关系的词向量，例如：

在本实施例中，由于经远程监督得到的远程标记命名实体关系数据集中存在大量噪声，而本发明考虑真正的正样本(阳性命名实体关系实例)与远程标记命名实体关系数据集中的假阳性样本相比应该在数量上有明显的优势，因此，对于特定的关系类型，本发明利用阳性命名实体关系实例作为正样本，以及利用假阳性命名实体关系实例作为负样本，并基于交差熵代价函数训练一个二元分类器，也即强化学习代理子模型，以使训练后的强化学习代理子模型具有对明显的假阳性命名实体关系实例的识别能力。

在本实施例中，在得到用于表征命名实体关系的词向量后，首先对词向量对应的命名实体的实体类型分别进行标注，然后将其输入至训练好的强化学习代理子模型中，得到包含假阳性命名实体关系实例的远程标记命名实体关系数据集。可以理解的是，此时的远程标记命名实体关系数据集不包含明显的假阳性命名实体关系实例，但仍然包含少数强化学习代理子模型无法识别的错误标记命名实体关系实例。对此，为了使强化学习代理子模型能够更好的理解上下文信息以及实体的类型，提高对错误标记实例的识别能力，本发明采用对比学习的思想，通过拉近“邻居”，拉远“非邻居”对实体关系进行增强。具体的，将包含假阳性命名实体关系实例的远程标记命名实体关系数据集输入至对比学习关系增强子模型中，得到命名实体关系增强的词向量。其中，对比学习关系增强子模型用于进一步将远程标记命名实体关系数据集中的假阳性命名实体关系实例进行剔除。

在本实施例中，对比学习关系增强子模型是指利用强化学习代理子模型输出的假阳性命名实体关系实例作为负样本，以及强化学习代理子模型输出的除假阳性命名实体关系实例外的命名实体关系实例作为正样本，进行训练后得到的。具体的，首先对元组进行采样和其中r_A＝r_B，s_A表示句子，表示实体1，表示实体2，r_A表示两个实体的关系。将训练好的的强化学习代理子模型筛选出的假阳性命名实体关系实例作为负样本，剩余的实例作为正样本，并通过不断优化对比学习关系增强子模型的损失函数，直至对比学习关系增强子模型能够训练出更好的表示实体关系的词向量。由此在强化学习每一轮的迭代中，通过更新词向量，使得强化学习代理子模型在下一步的迭代中将上下文和实体类型作为学习依据，进一步提高强化学习代理子模型对错误标记实例的识别能力。

在本实施例中，将所述强化学习代理子模型输出的远程标记命名实体关系数据集输入至关系分类器，根据关系分类器的当前性能不断优化强化学习代理子模型，从而输出去除噪音的远程标记命名实体关系数据集。具体的，为了进一步评估强化学习代理子模型的一系列动作，本发明采用一个简单的卷积神经网络，将卷积神经网络关系分类的性能作为强化学习代理奖励参数的依据，当计算得到的奖励参数完成收敛时，结束强化学习代理子模型的优化。

本发明提供的命名实体关系识别装置，通过将获取的目标文本输入至训练好的命名实体关系识别模型中，即可得到准确的命名实体关系识别结果。其中，所述命名实体关系识别模型由命名实体关系语言子模型、强化学习代理子模型和对比学习关系增强子模型组成，所述命名实体关系识别模型基于以下步骤进行训练：步骤1，根据预设知识库的远程监督，构建远程标记命名实体关系数据集；步骤2，将所述远程标记命名实体关系数据集输入至命名实体关系语言子模型中，得到用于表征命名实体关系的词向量；所述命名实体关系语言子模型是指利用所述远程标记命名实体关系数据集和未标记语料库作为输入样本，以及利用表征命名实体关系的词向量作为输出样本，进行训练后得到的；步骤3，对所述词向量对应的命名实体的实体类型分别进行标注后，输入至强化学习代理子模型中，得到包含假阳性命名实体关系实例的远程标记命名实体关系数据集；其中，所述强化学习代理子模型是指利用阳性命名实体关系实例作为正样本，以及利用假阳性命名实体关系实例作为负样本，基于交差熵代价函数进行训练后得到的；步骤4，将包含假阳性命名实体关系实例的远程标记命名实体关系数据集输入至对比学习关系增强子模型中，得到命名实体关系增强的词向量；其中，所述命名实体关系增强的词向量用于更新所述强化学习代理子模型的状态属性，以增强所述强化学习代理子模型识别假阳性命名实体关系实例的能力；所述对比学习关系增强子模型是指利用强化学习代理子模型输出的假阳性命名实体关系实例作为负样本，以及强化学习代理子模型输出的除假阳性命名实体关系实例外的命名实体关系实例作为正样本，进行训练后得到的；步骤5，将所述强化学习代理子模型输出的远程标记命名实体关系数据集输入至关系分类器，根据关系分类器的当前性能不断优化强化学习代理模型，直至输出去除噪音的远程标记命名实体关系数据集，所述命名实体关系识别模型训练结束。由此可知，本发明基于对比学习的思想对实体关系进行增强，使模型具有理解上下文语义信息和实体类型的能力，从而去除远程监督产生的噪音，降低所收集的命名实体关系结果的不确定性。可见，本发明在无人工标注情况下可以快速收集大量实体关系抽取数据集，减少所收集关系数据集的不确定性，为下游训练关系分类器、扩充数据集等任务提供数据帮助。

图4示例了一种电子设备的实体结构示意图，如图4所示，该电子设备可以包括：处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440，其中，处理器410，通信接口420，存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令，以执行命名实体关系识别方法，该方法包括：获取目标文本，将所述目标文本输入至命名实体关系识别模型中，得到命名实体关系识别结果；其中，所述命名实体关系识别模型由命名实体关系语言子模型、强化学习代理子模型和对比学习关系增强子模型组成，所述命名实体关系识别模型基于以下步骤进行训练：步骤1，根据预设知识库的远程监督，构建远程标记命名实体关系数据集；步骤2，将所述远程标记命名实体关系数据集输入至命名实体关系语言子模型中，得到用于表征命名实体关系的词向量；所述命名实体关系语言子模型是指利用所述远程标记命名实体关系数据集和未标记语料库作为输入样本，以及利用表征命名实体关系的词向量作为输出样本，进行训练后得到的；步骤3，对所述词向量对应的命名实体的实体类型分别进行标注后，输入至强化学习代理子模型中，得到包含假阳性命名实体关系实例的远程标记命名实体关系数据集；其中，所述强化学习代理子模型是指利用阳性命名实体关系实例作为正样本，以及利用假阳性命名实体关系实例作为负样本，基于交差熵代价函数进行训练后得到的；步骤4，将包含假阳性命名实体关系实例的远程标记命名实体关系数据集输入至对比学习关系增强子模型中，得到命名实体关系增强的词向量；其中，所述命名实体关系增强的词向量用于更新所述强化学习代理子模型的状态属性，以增强所述强化学习代理子模型识别假阳性命名实体关系实例的能力；所述对比学习关系增强子模型是指利用强化学习代理子模型输出的假阳性命名实体关系实例作为负样本，以及强化学习代理子模型输出的除假阳性命名实体关系实例外的命名实体关系实例作为正样本，进行训练后得到的；步骤5，将所述强化学习代理子模型输出的远程标记命名实体关系数据集输入至关系分类器，根据关系分类器的当前性能不断优化强化学习代理模型，直至输出去除噪音的远程标记命名实体关系数据集，所述命名实体关系识别模型训练结束。

此外，上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的命名实体关系识别方法，该方法包括：获取目标文本，将所述目标文本输入至命名实体关系识别模型中，得到命名实体关系识别结果；其中，所述命名实体关系识别模型由命名实体关系语言子模型、强化学习代理子模型和对比学习关系增强子模型组成，所述命名实体关系识别模型基于以下步骤进行训练：步骤1，根据预设知识库的远程监督，构建远程标记命名实体关系数据集；步骤2，将所述远程标记命名实体关系数据集输入至命名实体关系语言子模型中，得到用于表征命名实体关系的词向量；所述命名实体关系语言子模型是指利用所述远程标记命名实体关系数据集和未标记语料库作为输入样本，以及利用表征命名实体关系的词向量作为输出样本，进行训练后得到的；步骤3，对所述词向量对应的命名实体的实体类型分别进行标注后，输入至强化学习代理子模型中，得到包含假阳性命名实体关系实例的远程标记命名实体关系数据集；其中，所述强化学习代理子模型是指利用阳性命名实体关系实例作为正样本，以及利用假阳性命名实体关系实例作为负样本，基于交差熵代价函数进行训练后得到的；步骤4，将包含假阳性命名实体关系实例的远程标记命名实体关系数据集输入至对比学习关系增强子模型中，得到命名实体关系增强的词向量；其中，所述命名实体关系增强的词向量用于更新所述强化学习代理子模型的状态属性，以增强所述强化学习代理子模型识别假阳性命名实体关系实例的能力；所述对比学习关系增强子模型是指利用强化学习代理子模型输出的假阳性命名实体关系实例作为负样本，以及强化学习代理子模型输出的除假阳性命名实体关系实例外的命名实体关系实例作为正样本，进行训练后得到的；步骤5，将所述强化学习代理子模型输出的远程标记命名实体关系数据集输入至关系分类器，根据关系分类器的当前性能不断优化强化学习代理模型，直至输出去除噪音的远程标记命名实体关系数据集，所述命名实体关系识别模型训练结束。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的命名实体关系识别方法，该方法包括：获取目标文本，将所述目标文本输入至命名实体关系识别模型中，得到命名实体关系识别结果；其中，所述命名实体关系识别模型由命名实体关系语言子模型、强化学习代理子模型和对比学习关系增强子模型组成，所述命名实体关系识别模型基于以下步骤进行训练：步骤1，根据预设知识库的远程监督，构建远程标记命名实体关系数据集；步骤2，将所述远程标记命名实体关系数据集输入至命名实体关系语言子模型中，得到用于表征命名实体关系的词向量；所述命名实体关系语言子模型是指利用所述远程标记命名实体关系数据集和未标记语料库作为输入样本，以及利用表征命名实体关系的词向量作为输出样本，进行训练后得到的；步骤3，对所述词向量对应的命名实体的实体类型分别进行标注后，输入至强化学习代理子模型中，得到包含假阳性命名实体关系实例的远程标记命名实体关系数据集；其中，所述强化学习代理子模型是指利用阳性命名实体关系实例作为正样本，以及利用假阳性命名实体关系实例作为负样本，基于交差熵代价函数进行训练后得到的；步骤4，将包含假阳性命名实体关系实例的远程标记命名实体关系数据集输入至对比学习关系增强子模型中，得到命名实体关系增强的词向量；其中，所述命名实体关系增强的词向量用于更新所述强化学习代理子模型的状态属性，以增强所述强化学习代理子模型识别假阳性命名实体关系实例的能力；所述对比学习关系增强子模型是指利用强化学习代理子模型输出的假阳性命名实体关系实例作为负样本，以及强化学习代理子模型输出的除假阳性命名实体关系实例外的命名实体关系实例作为正样本，进行训练后得到的；步骤5，将所述强化学习代理子模型输出的远程标记命名实体关系数据集输入至关系分类器，根据关系分类器的当前性能不断优化强化学习代理模型，直至输出去除噪音的远程标记命名实体关系数据集，所述命名实体关系识别模型训练结束。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种命名实体关系识别方法，其特征在于，包括：

步骤5，将所述强化学习代理子模型输出的远程标记命名实体关系数据集输入至关系分类器，根据关系分类器的当前性能不断优化强化学习代理模型，直至输出去除噪音的远程标记命名实体关系数据集，所述命名实体关系识别模型训练结束；

所述交差熵代价函数j(θ)为：

其中，y_i为强化学习代理选择的标签，保留为1，去除为0，a为动作，s_i为状态，θ是代价损失参数，i是从1到总元组集个数的区间取值；

所述对比学习关系增强子模型训练的损失函数为：

其中，t_A和t_B为通过线性采样的元组集，和为元组集，和为正样本的关系表示，Z为正样本与负样本的余弦相似度，N为超参数，为从负样本集中采样的元组，为总元组集，t_C是非线性采集的元组集；

所述关系分类器训练的损失函数j(θ)为：

2.根据权利要求1所述的命名实体关系识别方法，其特征在于，所述根据预设知识库的远程监督，构建远程标记命名实体关系数据集，包括：

3.一种命名实体关系识别装置，其特征在于，包括：

将所述强化学习代理子模型输出的远程标记命名实体关系数据集输入至关系分类器，根据关系分类器的当前性能不断优化强化学习代理模型，直至输出去除噪音的远程标记命名实体关系数据集，所述命名实体关系识别模型训练结束；

所述交差熵代价函数j(θ)为：

其中，y_i为强化学习代理子模型选择标签，a为动作，s_i为状态，θ是代价损失参数，i是从1到总元组集个数的区间取值；

所述对比学习关系增强子模型训练的损失函数为：

所述关系分类器训练的损失函数j(θ)为：

4.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至2任一项所述命名实体关系识别方法的步骤。

5.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至2任一项所述命名实体关系识别方法的步骤。

6.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至2任一项所述命名实体关系识别方法的步骤。