CN108536702A - 一种相关实体确定方法、装置及计算设备 - Google Patents
一种相关实体确定方法、装置及计算设备 Download PDFInfo
- Publication number
- CN108536702A CN108536702A CN201710120836.9A CN201710120836A CN108536702A CN 108536702 A CN108536702 A CN 108536702A CN 201710120836 A CN201710120836 A CN 201710120836A CN 108536702 A CN108536702 A CN 108536702A
- Authority
- CN
- China
- Prior art keywords
- related entities
- entity
- edges
- target entity
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供一种相关实体确定方法、装置及计算设备,该方法包括:获取目标知识图谱,所述目标知识图谱至少具有目标实体;确定所述目标知识图谱中,所述目标实体的候选实体集合;所述候选实体集合包括:可触达所述目标实体的各边数对应的候选实体;根据所述候选实体集合,确定所述目标实体的相关实体。本发明实施例可以提升相关实体确定结果的召回率。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种相关实体确定方法、装置及计算设备。
背景技术
相关实体可以认为是在同一查询中与查询到的目标实体共现的其他实体,对于用户获取查询到的目标实体的相关信息具有重要意义;比如用户在输入查询语句后,搜索引擎除了将搜索到的与该查询语句对应的目标实体(比如网页链接)展现给用户外,还会将查询过程中与该目标实体共现的相关实体推荐给用户,以引导用户进行再次搜索,提升用户获得相关信息的便利性;一种典型的场景是,搜索引擎在搜索到与查询语句对应的目标实体后,除在搜索结果页面显示所搜索到的目标实体,还可在搜索结果页面的设定区域(比如左侧区域)显示所推荐的相关实体,以便用户再次搜索。
本发明的发明人发现,目前主要是通过开放文本(比如新闻文本)来统计与一目标实体共现的其他实体,以确定一目标实体的相关实体;然而,开放文本录入的内容具有一定的局限性和时效性,这使得通过开放文本统计的相关实体确定结果不可控,导致相关实体确定结果的召回率较低(召回率表示确定的相关实体数量和相关实体总数量的比值,是确定结果全面性的一种体现)。
发明内容
有鉴于此,本发明实施例提供一种相关实体确定方法、装置及计算设备,以提升相关实体确定结果的召回率。
为实现上述目的,本发明实施例提供如下技术方案:
一种相关实体确定方法,包括:
获取目标知识图谱,所述目标知识图谱至少具有目标实体;
确定所述目标知识图谱中,所述目标实体的候选实体集合;所述候选实体集合包括:可触达所述目标实体的各边数对应的候选实体;
根据所述候选实体集合,确定所述目标实体的相关实体。
本发明实施例还提供一种相关实体确定装置,包括:
目标知识图谱获取模块,用于获取目标知识图谱,所述目标知识图谱至少具有目标实体;
候选实体集合确定模块,用于确定所述目标知识图谱中,所述目标实体的候选实体集合;所述候选实体集合包括:可触达所述目标实体的各边数对应的候选实体;
相关实体确定模块,用于根据所述候选实体集合,确定所述目标实体的相关实体。
本发明实施例还提供一种计算设备,包括上述所述的相关实体确定装置。
基于上述技术方案,本发明实施例提供的相关实体确定方法包括:获取目标知识图谱,所述目标知识图谱至少具有目标实体;确定所述目标知识图谱中,所述目标实体的候选实体集合;所述候选实体集合包括:可触达所述目标实体的各边数对应的候选实体;根据所述候选实体集合,确定所述目标实体的相关实体。可以看出,本发明实施例采用至少具有目标实体的目标知识图谱,挖掘目标知识图谱中可触达所述目标实体的候选实体集合,进而根据所述候选实体集合,确定所述目标实体的相关实体,由于目标知识图谱收录的目标实体的相关信息更为全面,因此可以极大概率的挖掘到目标实体历史以往全面的相关信息,使得所挖掘出的目标实体的相关实体结果较为全面,提升所确定的目标实体的相关实体结果的召回率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的相关实体确定方法的流程图;
图2为本发明实施例提供的获取目标知识图谱的方法流程图;
图3为本发明实施例提供的相关实体确定方法的另一流程图;
图4为目标知识图谱中实体间关系的示意图;
图5为根据候选实体集合,确定目标实体的相关实体的方法流程图;
图6为本发明实施例提供的相关实体确定方法的再一流程图;
图7为本发明实施例提供的确定相关实体的推荐排序的方法流程图;
图8为本发明实施例提供的确定相关实体的推荐排序的另一方法流程图;
图9为本发明实施例提供的确定相关实体的推荐排序的再一方法流程图;
图10为本发明实施例提供的相关实体确定装置的结构框图;
图11为本发明实施例提供的相关实体确定装置的另一结构框图;
图12为本发明实施例提供的计算设备的硬件结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的相关实体确定方法的流程图,该方法可应用于具有数据运算能力的计算设备,通过该计算设备执行图1所示方法对应的程序,可实现相关实体的确定;该计算设备可以选用网络侧的服务器,也可以选用用户侧的电脑等电子设备;
参照图1,本发明实施例提供的相关实体确定方法可以包括:
步骤S100、获取目标知识图谱,所述目标知识图谱至少具有目标实体。
目标实体是本发明实施例待确定出相关实体的实体,本发明实施例可指定需要确定出相关实体的目标实体,且目标知识图谱中具有该目标实体。
知识图谱旨在描述真实世界中存在的各种实体或概念;每个实体或概念可用一个全局唯一确定的ID(身份标识号)来标识,每个属性-值对(attribute-value pair)可用来刻画实体的内在特性,而关系(relation)用来连接两个实体,刻画它们之间的关联;因此,知识图谱主要由节点以及连接节点之间的边构成,其中,一个节点可以表示一个实体或概念,连接节点的边则可由所连接节点间的属性或关系构成;
本发明实施例中,知识图谱的数据源可通过收集来自百科类站点和各种垂直站点的结构化数据,以覆盖大部分常识性知识实现,这些数据普遍质量较高,但更新比较慢;而另一方面,知识图谱的数据来源也可通过从各种半结构化数据(形如HTML表格)抽取相关实体的属性-值实现,以此丰富实体的描述;此外,通过搜索日志(query log)发现新的实体或新的实体属性,也可不断扩展知识图谱的覆盖率;
在一种可能的实现中,本发明实施例可通过包含目标实体的数据源构建出目标知识图谱。
为提升后续相关实体确定结果的全面性,本发明实施例也可通过包含目标实体的数据源所构建的知识图谱,理解包含目标实体的输入文本的含义,使得目标实体的相关信息的理解更为全面;在实现上,本发明实施例可获取包含目标实体的输入文本,在通过包含目标实体的数据源构建出知识图谱后,将输入文本中给定的命名实体,映射到所构建的知识图谱的目标实体上,得到目标知识图谱。
步骤S110、确定所述目标知识图谱中,所述目标实体的候选实体集合;所述候选实体集合包括:可触达所述目标实体的各边数对应的候选实体。
目标知识图谱中,实体可以认为是一个节点,实体之间可通过边连接;目标实体可能通过一条边触达一候选实体,也可能通过多条边触达一候选实体,本发明实施例可从所述目标实体出发,确定目标实体通过一条边触达的实体,得到边数一对应的候选实体,从目标实体出发,确定目标实体通过两条边触达的实体,得到边数二对应的候选实体,以此类推,得到各边数对应的候选实体。
可选的,在一种实现上,本发明实施例可设定边数范围,该边数范围可以包括多个边数,则对于边数范围中的各边数,本发明实施例可确定从所述目标实体出发以相应边数触达的候选实体,得到可触达所述目标实体的各边数对应的候选实体;
比如,设定边数范围包括边数一至边数三,则对于边数一,本发明实施例可确定以一条边触达目标实体的候选实体,得到边数一对应的候选实体,对于边数二,本发明实施例可确定以二条边触达目标实体的候选实体,得到边数二对应的候选实体,对于边数三,本发明实施例可确定以三条边触达目标实体的候选实体,得到边数三对应的候选实体,从而得到该边数范围中各边数对应的候选实体。
需要说明的是,设定边数范围仅是确定可触达目标实体的各边数对应的候选实体的可选方式,本发明实施例也可确定目标知识图谱中,其他实体触达目标实体所涉及的所有边数,从而以此确定可触达目标实体的各边数对应的候选实体。
步骤S120、根据所述候选实体集合,确定所述目标实体的相关实体。
可选的,一方面,本发明实施例可将所确定的所述候选实体集合,作为所述目标实体的相关实体。
可选的,另一方面,所述候选实体集合中,可能存在对应不同边数的重复的候选实体,本发明实施例可对候选实体集合中重复的候选实体进行去重处理,以保留重复的候选实体中边数最小的候选实体,从而将去重处理后的候选实体集合所包括的候选实体,作为所述目标实体的相关实体。
本发明实施例采用至少具有目标实体的目标知识图谱,挖掘目标知识图谱中可触达所述目标实体的候选实体集合,进而根据所述候选实体集合,确定所述目标实体的相关实体,由于目标知识图谱收录的目标实体的相关信息更为全面,因此可以极大概率的挖掘到目标实体历史以往全面的相关信息,使得所挖掘出的目标实体的相关实体结果较为全面,提升所确定的目标实体的相关实体结果的召回率。
上文介绍了在获取目标知识图谱时,可获取包含目标实体的数据源,通过包含目标实体的数据源构建目标知识图谱,这种目标知识图谱的获取方式较为简便,且收录的目标实体的相关信息较为全面,可实现最终挖掘出的目标实体的相关实体结果具有较高的召回率。
而在另一种实现方式中,本发明实施例可通过数据源(包含目标实体)构建的知识图谱,理解包含目标实体的输入文本的含义,进而获取到目标知识图谱,使得目标知识图谱中关于目标实体的相关信息的理解更为全面;相应的,图2示出了本发明实施例提供的获取目标知识图谱的一种可选实现方法流程,参照图2,该方法可以包括:
步骤S200、获取输入文本,所述输入文本中预先给定有多个命名实体,所述命名实体至少包括所述目标实体。
可选的,输入文本可以是开放文本的一种,该输入文本至少记录有目标实体,同时也可能记录有其他实体;本发明实施例可在输入文本中预先给定有至少包括目标实体的命名实体,命名实体可以认为是在输入文本中给定的人名、机构名、地名以及其他以名称为标识的实体。
步骤S210、将输入文本中给定的命名实体,映射到知识图谱的目标实体上,得到目标知识图谱;所述知识图谱由包含目标实体的数据源构建。
在获取输入文本,并确定由包含目标实体的数据源构建的知识图谱后,本发明实施例可将输入文本中给定的命名实体,映射到该知识图谱的目标实体上,得到目标知识图谱;
将输入文本中给定的命名实体,映射到知识图谱的目标实体上,可以认识是一个将输入文本中给定的命名实体,链接到知识图谱中无歧义的目标实体的过程,这个过程可以包括同义实体的合并、歧义实体的消歧等处理;
可选的,在具体实现上,本发明实施例可以使用named entity linking(命名实体链接)技术将输入文本中给定的命名实体,映射到知识图谱的目标实体上,从而将输入文本中给定的命名实体链接到知识图谱中无歧义的目标实体上;命名实体链接技术主要可提升在线推荐系统、互联网搜索引擎等系统的信息过滤能力。
可选的,本发明实施例可设定目标知识图谱中挖掘目标实体的候选实体所使用的边数范围,以在获取到目标知识图谱后,通过该边数范围所对应的各边数,挖掘目标知识图谱中可触达所述目标实体的各边数对应的候选实体;可选的,图3示出了本发明实施例提供的相关实体确定方法的另一流程图,参照图3,该方法可以包括:
步骤S300、获取目标知识图谱,所述目标知识图谱至少具有目标实体。
可选的,步骤S300可以通过图2所示方法实现,也可以通过包含目标实体的数据源构建出目标知识图谱。
步骤S310、获取预设定的边数范围,所述边数范围包括多个边数。
步骤S320、根据所述边数范围所包括的各边数,确定所述目标知识图谱中,可触达所述目标实体的各边数对应的候选实体,得到所述目标实体的候选实体集合。
可选的,在设定边数范围后,对于边数范围中的各边数,本发明实施例可确定从所述目标实体出发以相应边数触达的候选实体,从而确定出可触达所述目标实体的各边数对应的候选实体,得到所述目标实体的候选实体集合。
为便于理解,如图4所示,在目标知识图谱中,“小明”为目标实体,以目标实体“小明”出发通过多种关系可延伸触达多个候选实体,且连接的实体之间具有一定的关系;
以设定边数范围包括边数一至三为例,如图4所示,从目标实体“小明”出发,边数一对应的候选实体包括:“小红”,“小强”和“电影A”;从目标实体“小明”出发,边数二对应的候选实体包括:“小强”和“小容”;从目标实体“小明”出发,边数三对应的候选实体包括:“小容”;据此,可确定出可触达目标实体“小明”的各边数对应的候选实体,得到目标知识图谱中,可触达所述目标实体的候选实体集合;该候选实体集合可以具体包括:
边数一:“小红”,“小强”和“电影A”;
边数二:“小强”和“小容”;
边数三:“小容”。
需要说明的是,设定边数范围可以不限于上述描述的边数一至三,而是可根据实际情况设定边数范围所包括的边数。
步骤S330、根据所述候选实体集合,确定所述目标实体的相关实体。
可选的,在得到所述候选实体集合后,本发明实施例可直接将候选实体集合中包括的候选实体,作为目标实体的相关实体,实现目标实体的相关实体的确定。
可选的,另一方面,候选实体集合中可能存在对应不同边数的重复的候选实体,即一候选实体可能存在于不同的边数中,如一候选实体可能存在于边数一对应的候选实体中,也可能存在于边数二对应的候选实体中;这种情况下,一候选实体与目标实际的关系可能是多种;基于此,为提升挖掘出的相关实体与目标实体的关系精度,本发明实施例可对候选实体集合中重复的候选实体进行去重处理,以保留重复的候选实体中边数最小的候选实体;
可选的,图5示出了根据候选实体集合,确定目标实体的相关实体的可选方法流程,参照图5,该方法可以包括:
步骤S400、若所述候选实体集合中,存在对应不同边数的重复的候选实体,将所述候选实体集合中重复的候选实体进行去重处理,以保留重复的候选实体中边数最小的候选实体。
在确定目标实体的候选实体集合后,本发明实施例可以确定出目标实体的各边数对应的候选实体,若其中存在重复的候选实体且重复的候选实体对应不同的边数,则按照保留边数最小的候选实体的原则,对候选实体集合中重复的候选实体进行去重处理,从而得到去重处理后的候选实体集合;
以边数一对应的候选实体与边数二对应的候选实体,存在重复的候选实体为例,则可将边数一与边数二对应的候选实体中,位于边数二的重复的候选实体进行去除,使得边数一与边数二对应的候选实体不同,实现对候选实体集合中重复的候选实体进行去重;
以图4所示为例,候选实体集合包括:
边数一:“小红”,“小强”和“电影A”;
边数二:“小强”和“小容”;
边数三:“小容”;
可以看出,边数一与边数二对应的候选实体中包括“小强”这一重复的候选实体,边数二和边数三对应的候选实体中包括“小容”这一重复的候选实体,则按照保留边数最小的候选实体的原则,对候选实体集合中重复的候选实体进行去重处理,可去除边数二中的候选实体“小强”,保留边数一中的候选实体“小强”,去除边数三中的候选实体“小容”,保留边数二中的候选实体“小容”,实现对候选实体集合中重复的候选实体的去重处理,得到如下去重处理后的候选实体集合:
边数一:“小红”,“小强”和“电影A”;
边数二:“小容”。
步骤S410、将去重处理后的候选实体集合所包括的候选实体,作为所述目标实体的相关实体。
去重处理后的候选实体集合包括:可触达所述目标实体的各边数对应的不重复的候选实体。
本发明实施例采用至少具有目标实体的目标知识图谱,挖掘目标知识图谱中可触达所述目标实体的候选实体集合,由于目标知识图谱收录的目标实体的相关信息更为全面,因此可以极大概率的挖掘到目标实体历史以往全面的相关信息,使得所挖掘出的目标实体的候选实体集合较为全面;进而再通过对所述候选实体集合中对应不同边数的重复的候选实体进行去重处理,得到目标实体的相关实体,可提升挖掘出的相关实体与目标实体的关系精度,最终得到召回率较高,且与目标实体的关系精度较高的相关实体确定结果。
优选的,图6示出了本发明实施例提供的相关实体确定方法的再一流程图,参照图6,该方法可以包括:
步骤S500、获取输入文本,所述输入文本中预先给定有多个命名实体,所述命名实体至少包括所述目标实体。
步骤S510、将输入文本中给定的命名实体,映射到知识图谱的目标实体上,得到目标知识图谱;所述知识图谱由包含目标实体的数据源构建。
步骤S520、获取预设定的边数范围,所述边数范围包括多个边数。
步骤S530、根据所述边数范围所包括的各边数,确定所述目标知识图谱中,可触达所述目标实体的各边数对应的候选实体,得到所述目标实体的候选实体集合。
步骤S540、若所述候选实体集合中,存在对应不同边数的重复的候选实体,将所述候选实体集合中重复的候选实体进行去重处理,以保留重复的候选实体中边数最小的候选实体。
步骤S550、将去重处理后的候选实体集合所包括的候选实体,作为所述目标实体的相关实体。
在一个可能的实施场景中,通过本发明实施例提供的相关实体确定方法,可确定电影明星“小明”的相关实体,即以电影明星“小明”为目标实体,本发明实施例确定其相关实体的实施过程可以如下:
服务器可从百科类站点、各种垂直站点的结构化数据,以及各种半结构化数据和搜索日志中抓取包含目标实体“小明”的数据源;
服务器通过包含目标实体“小明”的数据源构建知识图谱;具体构建时,可将数据源中的各实体作为节点,实体之间的关系作为边,通过实体之间的关系,以相应边连接各实体;
服务器获取包含目标实体“小明”的输入文本,该输入文本中除具有目标实体“小明”外,还可以记录有其他的实体;具体的,该输入文本中预先给定有多个命名实体,这些命名实体中至少包括目标实体“小明”;
服务器通过named entity linking技术,将输入文本中给定的命名实体,映射到知识图谱的目标实体上,得到目标知识图谱;具体可通过named entity linking技术,将输入文本中给定的命名实体,与目标知识图谱中的实体进行同义实体的合并、歧义实体的消歧等处理;
服务器调取预先设定的边数范围,确定所述边数范围中的各边数所对应的目标实体的候选实体,得到所述目标实体的候选实体集合;即对于所述边数范围中的各边数,服务器可确定在所述目标知识图谱中,从所述目标实体出发以相应边数触达的候选实体,得到所述候选实体集合;如图4所示,以边数范围包括边数一至边数三,则服务器可分别确定通过一条边、二条边和三条边触达目标实体的候选实体,确定出可触达所述目标实体的各边数对应的候选实体,得到候选实体集合;
如果候选实体集合中,存在对应不同边数的重复的候选实体,则服务器可将候选实体集合中重复的候选实体进行去重处理,从而对于在不同边数上重复的候选实体,仅保留其中的边数最小的候选实体;进而,服务器可将去重处理后的候选实体集合所包括的候选实体,作为目标实体的相关实体;
如果候选实体集合中不存在重复的候选实体,则可将候选实体集合所包括的候选实体,作为目标实体的相关实体。
通过上文描述的方案确定出目标实体的相关实体后,本发明实施例可在搜索推荐等需要推荐相关实体的场景下,对目标实体的相关实体进行推荐;如当用户搜索到目标实体时,可推荐目标实体的相关实体的搜索入口,以引导用户进行再次搜索,提升用户获得目标实体的相关信息的便利性;相应的,本发明实施例可以确定各相关实体的推荐排序,以根据各相关实体的推荐排序进行相关实体的推荐,下面将对此进行描述。
一种较为简单的推荐排序方式是随机的定义相关实体的推荐排序,以随机定义的推荐排序进行相应相关实体的推荐;这种方式虽然较为简便,但推荐排序的精度可能较低,在一些搜索推荐场景中并不适用,基于此,作为优选方案,本发明实施例提供至少如下三种相关实体的推荐排序确定方案。
一、在开放文本上计算相关实体与目标实体的相关程度分数,以相关程度分数确定相关实体的推荐排序,且相关程度越高,推荐排序越靠前;可选实现过程可如图7所示;
图7为本发明实施例提供的确定相关实体的推荐排序的方法流程,参照图7,该方法可以包括:
步骤S600、在开放文本中统计各相关实体与目标实体的相关程度分数。
在开放文本中统计相关实体与目标实体的相关程度分数是,本发明实施例离线在开放文本上计算同现语义网络的一种应用,一般认为如果2个实体(如目标实体与一相关实体)频繁出现在同一个句子、篇章中,那么就认为这2个实体是强相关的。
相关实体与目标实体的相关程度分数,可采用相关实体与目标实体的互信息衡量,互信息(Mutual Information)是信息论里一种有用的信息度量,它可以看成是一个随机变量中包含的关于另一个随机变量的信息量,或者说是一个随机变量由于已知另一个随机变量而减少的不肯定性;
对于一相关实体与目标实体的相关程度分数确定而言,本发明实施例可确定该相关实体与目标实体的互信息,以该互信息确定该相关实体与目标实体的相关程度分数;具体实现上,本发明实施例可确定同时出现该相关实体和目标实体的文本数量与文本总数量的第一比值,确定出现该相关实体的文本数量与文本总数量的第二比值,确定出现目标实体的文本数量与文本总数量的第三比值,从而根据该第一比值,第二比值和第三比值,确定该相关实体与目标实体的互信息,以所确定的互信息表示该相关实体与目标实体的相关程度分数;
在具体计算上,可以采用如下公式实现:
其中,大X可以认为是一个集合,小x理解为在集合中得到的具体数据,大Y和小y的定义相似;p(x,y)表示同时出现实体x和y的文本的数量与文本总数量的比值,p(x)表示出现x的文本的数量与文本总数量的比值,p(y)表示出现y的文本的数量与文本总数量的比值。
步骤S610、根据各相关实体与目标实体的相关程度分数,确定各相关实体的推荐排序,其中,相关程分数度越高,推荐排序越靠前。
二、根据目标知识图谱中的关系权重,确定各相关实体在目标知识图谱中对应的权重分数,以相关实体的权重分数确定推荐排序;
本发明的发明人发现,一些相关实体之间的关系由于很固定(成为常识),所以在开放文本里提及的概率较小,比如被人们公知的电影明星夫妻等;但是这些与目标实体的关系很固定的相关实体,与目标实体的相关程度又非常高,在相关实体推荐时又应该被推荐出来,这是通过前文的第一种通过同现语义网络的方式难以达到的;因此本发明的发明人考虑通过知识图谱,对实体之间重要的设定关系设置较大的权重,使得与目标实体的关系较为重要,但较少在开放文本中提及的相关实体能够被推荐出来;
可选的,图8示出了本发明实施例提供的确定相关实体的推荐排序的另一方法流程,参照图8,该方法可以包括:
步骤S700、以去重处理后的候选实体集合以及所述目标实体为范围,确定各相关实体可触达的最近实体。
以目标实体对应的相关实体(去重处理后的候选实体集合)以及目标实体本身为范围,本发明实施例需要确定各相关实体在该范围内可触达的最近实体;
可选的,一相关实体在目标知识图谱中可触达的最近实体,可能是目标实体(该相关实体与目标实体对应的边数为一),也可能是其他的相关实体(如该相关实体与目标实体对应的边数大于一,需要通过其他更为靠近目标实体的相关实体,过渡到目标实体);
如图4所示,对候选实体集合进行去除处理后,目标实体的相关实体包括:
边数一:“小红”,“小强”和“电影A”;
边数二:“小容”。
其中,相关实体“小红”,“小强”和“电影A”可直接触达目标实体“小明”,因此可触达的最近实体为目标实体,
而相关实体“小容”需要通过相关实体“小强”触达目标实体,因此相关实体“小容”可触达的最近实体为“小强”。
步骤S710、根据预设定的目标知识图谱中各关系相应的关系权重,确定各相关实体与可触达的最近实体的关系对应的关系权重,得到各相关实体对应的关系权重。
可选的,本发明实施例可利用经验知识,对知识图谱中实体间的不同关系设置针对性的关系权重,使得关系越重要的实体具有越高的关系权重;
例如对于科技领域实体的推荐,可将相应知识图谱中实体所在职位、所属公司、公司股东等设置较大的关系权重;对于体育领域的实体推荐,可将相应知识图谱中实体所在球队、队友等设置较大的关系权重;
在预先设定目标知识图谱中各关系相应的关系权重后,对于目标实体的各相关实体,本发明实施例可根据相关实体与可触达的最近实体的关系,确定各相关实体对应的关系权重;
如上文举例说明,相关实体“小红”,“小强”和“电影A”可直接触达目标实体“小明”,因此可触达的最近实体为目标实体,则相关实体“小红”对应的关系权重为“小红”与“小明”的关系对应的关系权重,相关实体“小强”对应的关系权重为“小强”与“小明”的关系对应的关系权重,相关实体“电影A”对应的关系权重为“电影A”与“小明”的关系对应的关系权重;
而相关实体“小容”需要通过相关实体“小强”触达目标实体,因此相关实体“小容”可触达的最近实体为“小强”,则相关实体“小容”对应的关系权重为“小容”与“小强”的关系对应的关系权重;
即对于一相关实体,本发明实施例可确定该相关实体可触达的最近实体,通过该相关实体与可触达的最近实体的关系对应的关系权重,确定该相关实体对应的关系权重。
步骤S720、对于各相关实体,将相关实体对应的边数的边数权重,与对应的关系权重相结合,得到各相关实体对应的权重分数;其中,边数越大,边数权重越小。
在确定各相关实体对应的关系权重后,本发明实施例可结合各相关实体与目标实体对应的边数的边数权重,确定出各相关实体的权重分数;一般认为,边数越大,边数权重越小,这是为了将与目标实体的边数较远的相关实体进行降权,可使得不应该扩展的一些相关实体能够被去掉;
如一相关实体与目标实体对应的边数为一(如去重处理后的候选实体集合中,或者候选实体集合中,该相关实体通过一条边触达目标实体),则认为该相关实体对应的边数的边数权重为一,如一相关实体与目标实体对应的边数大于一,则需对该相关实体的边数权重进行降权,使得该相关实体的边数权重小于1;
可选的,本发明实施例可设置相邻边数中,小边数的边数权重为大边数的边数权重的一倍,如可设置相关实体对应的边数为一,则对应的边数权重为一,相关实体对应的边数为二,则对应的边数权重为1/2=0.5,相关实体对应的边数为三,则对应的边数权重为0.5/2=0.25,以此类推。
在确定各边数的边数权重后,对于一相关实体,本发明实施例可将该相关实体对应的边数的边数权重,与对应的关系权重相乘,得到该相关实体对应的权重分数,对于各相关实体以此进行处理,则可得到各相关实体对应的权重分数。
如图4所示,对候选实体集合进行去除处理后,目标实体的相关实体包括:
边数一:“小红”,“小强”和“电影A”;
边数二:“小容”。
举例来说,“小红”与可触达的最近实体“小明”的关系为妻子,可设置对应的关系权重为1;“小强”与可触达的最近实体“小明”的关系为搭档,可设置对应的关系权重为0.5;“电影A”与可触达的最近实体“小明”的关系为主演,可设置对应的关系权重为0.7;“小容”与可触达的最近实体“小强”的关系为妻子,可设置对应的关系权重为1;
而“小红”,“小强”和“电影A”对应的边数均为一,可设置对应的边数权重均为1,“小容”对应的边数为二,可设置对应的边数权重为0.5;
相应的,相关实体“小红”的权重分数的计算为:关系权重乘以边数权重,即1*1=1;相关实体“小强”的权重分数的计算为:关系权重乘以边数权重,即0.5*1=0.5;相关实体“电影A”的权重分数的计算为:关系权重乘以边数权重,即0.7*1=0.7;相关实体“小容”的权重分数的计算为:关系权重乘以边数权重,即1*0.5=0.5;
相应的,各相关实体的权重分数示意可如下表1所示
相关实体 | 权重分数 |
小红 | 1 |
小强 | 0.5 |
电影A | 0.7 |
小容 | 0.5 |
表1
可以看出,虽然小容具有较高的关系权重,但由于与目标实体的边数较远,因此整体的权重分数被降权。
步骤S730、根据各相关实体对应的权重分数,确定各相关实体的推荐排序,其中,权重分数越高,推荐排序越靠前。
本发明实施例通过目标知识图谱本身关系权重的约束,可以将一些与目标实体的关系较为重要,但由于公知而极少提及的相关实体的推荐排序进行提升,使得推荐出的相关实体的排序具有较高的精度。
三、将上述的推荐排序确定方案一与二相结合,即通过方案一在开放文本上计算相关实体与目标实体的相关程度分数,通过方案二根据目标知识图谱中的关系权重,确定相关实体的权重分数后,将同一相关实体的相关程度分数与权重分数相加,得到该相关实体的排序分数,以相关实体的排序分数,确定相关实体的推荐排序;
可选的,图9示出了本发明实施例提供的确定相关实体的推荐排序的再一方法流程,参照图9,该方法可以包括:
步骤S800、在开放文本中统计各相关实体与目标实体的相关程度分数。
步骤S810、以去重处理后的候选实体集合以及所述目标实体为范围,确定各相关实体可触达的最近实体。
步骤S820、根据预设定的目标知识图谱中各关系相应的关系权重,确定各相关实体与可触达的最近实体的关系对应的关系权重,得到各相关实体对应的关系权重。
步骤S830、对于各相关实体,将相关实体对应的边数的边数权重,与对应的关系权重相结合,得到各相关实体对应的权重分数;其中,边数越大,边数权重越小。
步骤S840、对于各相关实体,将相关实体对应的相关程度分数与权重分数相加,得到各相关实体对应的排序分数。
步骤S850、根据各相关实体对应的排序分数,确定各相关实体的推荐排序,其中,排序分数越高,推荐排序越靠前。
图9所示可以认为是图7和图9方案的结合,对于每一个相关实体,本发明实施例可确定该相关实体与目标实体的相关程度分数,以及该相关实体对应的权重分数,从而该相关实体的相关程度分数与权重分数相加,得到该相关实体对应的排序分数,以此进行相关实体的推荐排序。
本发明实施例基于包含目标实体的目标知识图谱,实现目标实体的相关实体的挖掘,由于目标知识图谱收录的目标实体的相关信息更为全面,因此可以极大概率的挖掘到目标实体历史以往全面的相关信息,使得所挖掘出的目标实体的相关实体结果较为全面,提升所确定的目标实体的相关实体结果的召回率;
进一步,根据同现语义网络,和/或,目标知识图谱本身关系权重确定所挖掘的相关实体的推荐排序,可使得在进行相关实体的推荐时,所推荐的相关实体具有较高精度的排序,提升目标实体的相关信息被用户利用的概率,并提升目标实体的相关信息获取的便利性。
下面对本发明实施例提供的相关实体确定装置进行介绍,下文描述的相关实体确定装置可与上文描述的相关实体确定方法相互对应参照。下文描述的相关实体确定装置可以认为是计算设备为实现本发明实施例提供的相关实体确定方法,所需设置的功能模块架构。
图10为本发明实施例提供的相关实体确定装置的结构框图,该装置可应用于具有数据运算能力的计算设备,该计算设备可以选用网络侧的服务器,也可以选用用户侧的电脑等电子设备;
参照图10,本发明实施例提供的相关实体确定装置可以包括:
目标知识图谱获取模块100,用于获取目标知识图谱,所述目标知识图谱至少具有目标实体;
候选实体集合确定模块200,用于确定所述目标知识图谱中,所述目标实体的候选实体集合;所述候选实体集合包括:可触达所述目标实体的各边数对应的候选实体;
相关实体确定模块300,用于根据所述候选实体集合,确定所述目标实体的相关实体。
可选的,目标知识图谱获取模块100,用于获取目标知识图谱,具体包括:
获取输入文本,所述输入文本中预先给定有多个命名实体,所述命名实体至少包括所述目标实体;
将输入文本中给定的命名实体,映射到知识图谱的目标实体上,得到目标知识图谱;所述知识图谱由包含目标实体的数据源构建。
可选的,候选实体集合确定模块200,用于确定所述目标知识图谱中,所述目标实体的候选实体集合,具体包括:
获取预设定的边数范围,所述边数范围包括多个边数;
根据所述边数范围所包括的各边数,确定所述目标知识图谱中,可触达所述目标实体的各边数对应的候选实体,得到所述目标实体的候选实体集合。
可选的,相关实体确定模块300,用于根据所述候选实体集合,确定所述目标实体的相关实体,具体包括:
若所述候选实体集合中,存在对应不同边数的重复的候选实体,将所述候选实体集合中重复的候选实体进行去重处理,以保留重复的候选实体中边数最小的候选实体;
将去重处理后的候选实体集合所包括的候选实体,作为所述目标实体的相关实体。
可选的,图11示出了本发明实施例提供的相关实体确定装置的另一结构框图,结合图10和图11所示,该相关实体确定装置还可以包括:
推荐排序确定模块400,用于确定各相关实体的推荐排序,以根据各相关实体的推荐排序进行相关实体的推荐。
可选的,一方面,推荐排序确定模块400,用于确定各相关实体的推荐排序,具体包括:
在开放文本中统计各相关实体与目标实体的相关程度分数;
确定各相关实体在所述目标知识图谱中对应的权重分数;
对于各相关实体,将相关实体对应的相关程度分数与权重分数相加,得到各相关实体对应的排序分数;
根据各相关实体对应的排序分数,确定各相关实体的推荐排序,其中,排序分数越高,推荐排序越靠前。
具体的,推荐排序确定模块400,用于确定各相关实体在所述目标知识图谱中对应的权重分数,具体包括:
以去重处理后的候选实体集合以及所述目标实体为范围,确定各相关实体可触达的最近实体;
根据预设定的目标知识图谱中各关系相应的关系权重,确定各相关实体与可触达的最近实体的关系对应的关系权重,得到各相关实体对应的关系权重;
对于各相关实体,将相关实体对应的边数的边数权重,与对应的关系权重相结合,得到各相关实体对应的权重分数;其中,边数越大,边数权重越小。
而推荐排序确定模块400,用于在开放文本中统计各相关实体与目标实体的相关程度分数,具体包括:
对于一相关实体,确定同时出现该相关实体和目标实体的文本数量与文本总数量的第一比值,出现该相关实体的文本数量与文本总数量的第二比值,出现目标实体的文本数量与文本总数量的第三比值;
根据所述第一比值,第二比值和第三比值,确定该相关实体与目标实体的互信息,以所确定的互信息表示该相关实体与目标实体的相关程度分数。
另一方面,推荐排序确定模块400,用于确定各相关实体的推荐排序,具体包括:
在开放文本中统计各相关实体与目标实体的相关程度分数,根据各相关实体与目标实体的相关程度分数,确定各相关实体的推荐排序,其中,相关程分数度越高,推荐排序越靠前。
再一方面,推荐排序确定模块400,用于确定各相关实体的推荐排序,具体包括:
确定各相关实体在所述目标知识图谱中对应的权重分数,根据各相关实体对应的权重分数,确定各相关实体的推荐排序,其中,权重分数越高,推荐排序越靠前。
本发明实施例提供的相关实体确定装置可以提升所确定的目标实体的相关实体结果的召回率,且所推荐的相关实体具有较高精度的排序,可提升目标实体的相关信息被用户利用的概率。
可选的,本发明实施例还提供一种计算设备,该计算设备可以包括上述所述的相关实体确定装置。
可选的,图12示出了该计算设备的硬件结构框图,参照图12,该计算设备可以包括:处理器1,通信接口2,存储器3和通信总线4;
其中处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信;
可选的,通信接口2可以为通信模块的接口,如GSM模块的接口;
处理器1可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。
存储器3可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
其中,处理器1具体用于:
获取目标知识图谱,所述目标知识图谱至少具有目标实体;
确定所述目标知识图谱中,所述目标实体的候选实体集合;所述候选实体集合包括:可触达所述目标实体的各边数对应的候选实体;
根据所述候选实体集合,确定所述目标实体的相关实体。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的核心思想或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (16)
1.一种相关实体确定方法,其特征在于,包括:
获取目标知识图谱,所述目标知识图谱至少具有目标实体;
确定所述目标知识图谱中,所述目标实体的候选实体集合;所述候选实体集合包括:可触达所述目标实体的各边数对应的候选实体;
根据所述候选实体集合,确定所述目标实体的相关实体。
2.根据权利要求1所述的相关实体确定方法,其特征在于,所述获取目标知识图谱包括:
获取输入文本,所述输入文本中预先给定有多个命名实体,所述命名实体至少包括所述目标实体;
将输入文本中给定的命名实体,映射到知识图谱的目标实体上,得到目标知识图谱;所述知识图谱由包含目标实体的数据源构建。
3.根据权利要求1或2所述的相关实体确定方法,其特征在于,所述确定所述目标知识图谱中,所述目标实体的候选实体集合包括:
获取预设定的边数范围,所述边数范围包括多个边数;
根据所述边数范围所包括的各边数,确定所述目标知识图谱中,可触达所述目标实体的各边数对应的候选实体,得到所述目标实体的候选实体集合。
4.根据权利要求1所述的相关实体确定方法,其特征在于,所述根据所述候选实体集合,确定所述目标实体的相关实体包括:
若所述候选实体集合中,存在对应不同边数的重复的候选实体,将所述候选实体集合中重复的候选实体进行去重处理,以保留重复的候选实体中边数最小的候选实体;
将去重处理后的候选实体集合所包括的候选实体,作为所述目标实体的相关实体。
5.根据权利要求4所述的相关实体确定方法,其特征在于,还包括:
确定各相关实体的推荐排序,以根据各相关实体的推荐排序进行相关实体的推荐。
6.根据权利要求5所述的相关实体确定方法,其特征在于,所述确定各相关实体的推荐排序包括:
在开放文本中统计各相关实体与目标实体的相关程度分数;
确定各相关实体在所述目标知识图谱中对应的权重分数;
对于各相关实体,将相关实体对应的相关程度分数与权重分数相加,得到各相关实体对应的排序分数;
根据各相关实体对应的排序分数,确定各相关实体的推荐排序,其中,排序分数越高,推荐排序越靠前。
7.根据权利要求5所述的相关实体确定方法,其特征在于,所述确定各相关实体的推荐排序包括:
在开放文本中统计各相关实体与目标实体的相关程度分数,根据各相关实体与目标实体的相关程度分数,确定各相关实体的推荐排序,其中,相关程分数度越高,推荐排序越靠前;
或,确定各相关实体在所述目标知识图谱中对应的权重分数,根据各相关实体对应的权重分数,确定各相关实体的推荐排序,其中,权重分数越高,推荐排序越靠前。
8.根据权利要求6或7所述的相关实体确定方法,其特征在于,所述确定各相关实体在所述目标知识图谱中对应的权重分数包括:
以去重处理后的候选实体集合以及所述目标实体为范围,确定各相关实体可触达的最近实体;
根据预设定的目标知识图谱中各关系相应的关系权重,确定各相关实体与可触达的最近实体的关系对应的关系权重,得到各相关实体对应的关系权重;
对于各相关实体,将相关实体对应的边数的边数权重,与对应的关系权重相结合,得到各相关实体对应的权重分数;其中,边数越大,边数权重越小。
9.根据权利要求6或7所述的相关实体确定方法,其特征在于,所述在开放文本中统计各相关实体与目标实体的相关程度分数包括:
对于一相关实体,确定同时出现该相关实体和目标实体的文本数量与文本总数量的第一比值,出现该相关实体的文本数量与文本总数量的第二比值,出现目标实体的文本数量与文本总数量的第三比值;
根据所述第一比值,第二比值和第三比值,确定该相关实体与目标实体的互信息,以所确定的互信息表示该相关实体与目标实体的相关程度分数。
10.一种相关实体确定装置,其特征在于,包括:
目标知识图谱获取模块,用于获取目标知识图谱,所述目标知识图谱至少具有目标实体;
候选实体集合确定模块,用于确定所述目标知识图谱中,所述目标实体的候选实体集合;所述候选实体集合包括:可触达所述目标实体的各边数对应的候选实体;
相关实体确定模块,用于根据所述候选实体集合,确定所述目标实体的相关实体。
11.根据权利要求10所述的相关实体确定装置,其特征在于,所述目标知识图谱获取模块,用于获取目标知识图谱,具体包括:
获取输入文本,所述输入文本中预先给定有多个命名实体,所述命名实体至少包括所述目标实体;
将输入文本中给定的命名实体,映射到知识图谱的目标实体上,得到目标知识图谱;所述知识图谱由包含目标实体的数据源构建。
12.根据权利要求10所述的相关实体确定装置,其特征在于,所述相关实体确定模块,用于根据所述候选实体集合,确定所述目标实体的相关实体,具体包括:
若所述候选实体集合中,存在对应不同边数的重复的候选实体,将所述候选实体集合中重复的候选实体进行去重处理,以保留重复的候选实体中边数最小的候选实体;
将去重处理后的候选实体集合所包括的候选实体,作为所述目标实体的相关实体。
13.根据权利要求12所述的相关实体确定装置,其特征在于,还包括:
推荐排序确定模块,用于确定各相关实体的推荐排序,以根据各相关实体的推荐排序进行相关实体的推荐。
14.根据权利要求13所述的相关实体确定装置,其特征在于,所述推荐排序确定模块,用于确定各相关实体的推荐排序,具体包括:
在开放文本中统计各相关实体与目标实体的相关程度分数;
确定各相关实体在所述目标知识图谱中对应的权重分数;
对于各相关实体,将相关实体对应的相关程度分数与权重分数相加,得到各相关实体对应的排序分数;
根据各相关实体对应的排序分数,确定各相关实体的推荐排序,其中,排序分数越高,推荐排序越靠前。
15.根据权利要求14所述的相关实体确定装置,其特征在于,所述推荐排序确定模块,用于确定各相关实体在所述目标知识图谱中对应的权重分数,具体包括:
以去重处理后的候选实体集合以及所述目标实体为范围,确定各相关实体可触达的最近实体;
根据预设定的目标知识图谱中各关系相应的关系权重,确定各相关实体与可触达的最近实体的关系对应的关系权重,得到各相关实体对应的关系权重;
对于各相关实体,将相关实体对应的边数的边数权重,与对应的关系权重相结合,得到各相关实体对应的权重分数;其中,边数越大,边数权重越小;
所述推荐排序确定模块,用于在开放文本中统计各相关实体与目标实体的相关程度分数,具体包括:
对于一相关实体,确定同时出现该相关实体和目标实体的文本数量与文本总数量的第一比值,出现该相关实体的文本数量与文本总数量的第二比值,出现目标实体的文本数量与文本总数量的第三比值;
根据所述第一比值,第二比值和第三比值,确定该相关实体与目标实体的互信息,以所确定的互信息表示该相关实体与目标实体的相关程度分数。
16.一种计算设备,其特征在于,包括权利要求10-15任一项所述的相关实体确定装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710120836.9A CN108536702B (zh) | 2017-03-02 | 2017-03-02 | 一种相关实体确定方法、装置及计算设备 |
PCT/CN2018/077416 WO2018157790A1 (zh) | 2017-03-02 | 2018-02-27 | 一种相关实体确定方法、装置、计算设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710120836.9A CN108536702B (zh) | 2017-03-02 | 2017-03-02 | 一种相关实体确定方法、装置及计算设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108536702A true CN108536702A (zh) | 2018-09-14 |
CN108536702B CN108536702B (zh) | 2022-12-02 |
Family
ID=63369790
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710120836.9A Active CN108536702B (zh) | 2017-03-02 | 2017-03-02 | 一种相关实体确定方法、装置及计算设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108536702B (zh) |
WO (1) | WO2018157790A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110008352A (zh) * | 2019-03-28 | 2019-07-12 | 腾讯科技(深圳)有限公司 | 实体发现方法及装置 |
CN110825821A (zh) * | 2019-09-30 | 2020-02-21 | 深圳云天励飞技术有限公司 | 人员关系的查询方法、装置、电子设备及存储介质 |
CN112069323A (zh) * | 2020-08-04 | 2020-12-11 | 扬州制汇互联信息技术有限公司 | 一种基于工业知识图谱的推荐方法 |
CN113010769A (zh) * | 2019-12-19 | 2021-06-22 | 京东方科技集团股份有限公司 | 基于知识图谱的物品推荐方法、装置、电子设备及介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110134796B (zh) * | 2019-04-19 | 2023-06-02 | 平安科技(深圳)有限公司 | 基于知识图谱的临床试验检索方法、装置、计算机设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130346421A1 (en) * | 2012-06-22 | 2013-12-26 | Microsoft Corporation | Targeted disambiguation of named entities |
CN103593792A (zh) * | 2013-11-13 | 2014-02-19 | 复旦大学 | 一种基于中文知识图谱的个性化推荐方法与系统 |
CN104199872A (zh) * | 2014-08-19 | 2014-12-10 | 北京搜狗科技发展有限公司 | 一种信息推荐的方法以及装置 |
CN105095433A (zh) * | 2015-07-22 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 实体推荐方法及装置 |
CN106372118A (zh) * | 2016-08-24 | 2017-02-01 | 武汉烽火普天信息技术有限公司 | 面向大规模媒体文本数据的在线语义理解搜索系统及方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102591862A (zh) * | 2011-01-05 | 2012-07-18 | 华东师范大学 | 一种基于词共现的汉语实体关系提取的控制方法及装置 |
US9390174B2 (en) * | 2012-08-08 | 2016-07-12 | Google Inc. | Search result ranking and presentation |
CN104102713B (zh) * | 2014-07-16 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 推荐结果的展现方法和装置 |
CN104537065A (zh) * | 2014-12-29 | 2015-04-22 | 北京奇虎科技有限公司 | 一种搜索结果的推送方法及系统 |
US9547823B2 (en) * | 2014-12-31 | 2017-01-17 | Verizon Patent And Licensing Inc. | Systems and methods of using a knowledge graph to provide a media content recommendation |
CN106326211B (zh) * | 2016-08-17 | 2019-09-20 | 海信集团有限公司 | 交互语句的关键词间距离的确定方法和装置 |
-
2017
- 2017-03-02 CN CN201710120836.9A patent/CN108536702B/zh active Active
-
2018
- 2018-02-27 WO PCT/CN2018/077416 patent/WO2018157790A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130346421A1 (en) * | 2012-06-22 | 2013-12-26 | Microsoft Corporation | Targeted disambiguation of named entities |
CN103593792A (zh) * | 2013-11-13 | 2014-02-19 | 复旦大学 | 一种基于中文知识图谱的个性化推荐方法与系统 |
CN104199872A (zh) * | 2014-08-19 | 2014-12-10 | 北京搜狗科技发展有限公司 | 一种信息推荐的方法以及装置 |
CN105095433A (zh) * | 2015-07-22 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 实体推荐方法及装置 |
CN106372118A (zh) * | 2016-08-24 | 2017-02-01 | 武汉烽火普天信息技术有限公司 | 面向大规模媒体文本数据的在线语义理解搜索系统及方法 |
Non-Patent Citations (1)
Title |
---|
刘峤等: "基于图的中文集成实体链接算法", 《计算机研究与发展》, vol. 53, no. 02, 15 February 2016 (2016-02-15), pages 1 - 4 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110008352A (zh) * | 2019-03-28 | 2019-07-12 | 腾讯科技(深圳)有限公司 | 实体发现方法及装置 |
CN110008352B (zh) * | 2019-03-28 | 2022-12-20 | 腾讯科技(深圳)有限公司 | 实体发现方法及装置 |
CN110825821A (zh) * | 2019-09-30 | 2020-02-21 | 深圳云天励飞技术有限公司 | 人员关系的查询方法、装置、电子设备及存储介质 |
CN110825821B (zh) * | 2019-09-30 | 2022-11-22 | 深圳云天励飞技术有限公司 | 人员关系的查询方法、装置、电子设备及存储介质 |
CN113010769A (zh) * | 2019-12-19 | 2021-06-22 | 京东方科技集团股份有限公司 | 基于知识图谱的物品推荐方法、装置、电子设备及介质 |
CN112069323A (zh) * | 2020-08-04 | 2020-12-11 | 扬州制汇互联信息技术有限公司 | 一种基于工业知识图谱的推荐方法 |
CN112069323B (zh) * | 2020-08-04 | 2024-04-26 | 扬州制汇互联信息技术有限公司 | 一种基于工业知识图谱的推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2018157790A1 (zh) | 2018-09-07 |
CN108536702B (zh) | 2022-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108536702A (zh) | 一种相关实体确定方法、装置及计算设备 | |
US7343551B1 (en) | Autocompleting form fields based on previously entered values | |
US7647306B2 (en) | Using community annotations as anchortext | |
US20080313137A1 (en) | Behavioral WEB Graph | |
US20100241647A1 (en) | Context-Aware Query Recommendations | |
EP1225517A2 (en) | System and methods for computer based searching for relevant texts | |
US20030014399A1 (en) | Method for organizing records of database search activity by topical relevance | |
CN106126521A (zh) | 目标对象的社交账号挖掘方法及服务器 | |
US20130117287A1 (en) | Methods and systems for constructing personal profiles from contact data | |
JP2014513826A (ja) | コンピュータシステム、データベース及びそれらの使用 | |
CN107690637B (zh) | 使用大表语料库连接语义相关的数据 | |
CN104572889A (zh) | 一种搜索词推荐方法、装置和系统 | |
JP2005535039A (ja) | 地理的なテキスト検索システムを備えたデスクトップクライアントとの対話 | |
JP2008507792A (ja) | ネットワーク上に配置される、背景状況を利用するサーチエンジン | |
CN101911065A (zh) | 访问对象信息检索装置 | |
CN109726280A (zh) | 一种针对同名学者的排歧方法及装置 | |
EP4109293A1 (en) | Data query method and apparatus, electronic device, storage medium, and program product | |
Valkanas et al. | Location extraction from social networks with commodity software and online data | |
CN109376287B (zh) | 房产图谱构建方法、装置、计算机设备及存储介质 | |
Ozdikis et al. | Ontology-based recommendation for points of interest retrieved from multiple data sources | |
CN103262079B (zh) | 检索装置及检索方法 | |
CN110096646A (zh) | 品类关联信息的生成及其视频推送方法和相关设备 | |
CN101425981A (zh) | 一种根据互斥指示信息来发布信息的信息发布系统及方法 | |
CN102915313B (zh) | 网络搜索中的纠错关系生成方法及系统 | |
CN107451212A (zh) | 基于相关搜索的同义挖掘方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |