Nothing Special   »   [go: up one dir, main page]

CN106570144B - 推荐信息的方法和装置 - Google Patents

推荐信息的方法和装置 Download PDF

Info

Publication number
CN106570144B
CN106570144B CN201610966184.6A CN201610966184A CN106570144B CN 106570144 B CN106570144 B CN 106570144B CN 201610966184 A CN201610966184 A CN 201610966184A CN 106570144 B CN106570144 B CN 106570144B
Authority
CN
China
Prior art keywords
information
keyword
recommendation
information category
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610966184.6A
Other languages
English (en)
Other versions
CN106570144A (zh
Inventor
蒋宏飞
晋耀红
李德彦
杨凯程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dingfu Intelligent Technology Co., Ltd
Original Assignee
China Science And Technology (beijing) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Science And Technology (beijing) Co Ltd filed Critical China Science And Technology (beijing) Co Ltd
Publication of CN106570144A publication Critical patent/CN106570144A/zh
Application granted granted Critical
Publication of CN106570144B publication Critical patent/CN106570144B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种推荐信息的方法和装置,属于互联网技术领域。方法包括:根据用户输入或当前阅读的第一信息,确定第一关键词集合;根据所述第一关键词集合中的每个第一关键词,确定第一信息类别集合,所述第一信息类别集合中包括所述每个第一关键词所属的信息类别;根据所述第一关键词集合和所述第一信息类别集合,确定属性信息集合;根据所述第一关键词集合、所述第一信息类别集合和所述属性信息集合,确定一组推荐表达式;根据所述一组推荐表达式,为所述用户推荐信息。本发明可以为用户推荐与第一信息深度和广度相关的信息,从而提高了推荐准确性,降低了新闻从业者的搜集信息的时间成本。

Description

推荐信息的方法和装置
技术领域
本发明涉及互联网技术领域,特别涉及一种推荐信息的方法和装置。
背景技术
随着信息时代的到来,服务器中存储的信息越来越多;用户可以使用终端从服务器中获取用户感兴趣的信息。为了提高用户的阅读体验,服务器还可以为用户推荐用户感兴趣的信息。
目前,服务器基于用户当前阅读或者历史阅读的第一信息为用户推荐信息,具体过程可以为:服务器提取第一信息包括的关键词以及推荐信息库中的每个第二信息包括的关键字,根据第一信息包括的关键字和每个第二信息包括的关键字,分别计算第一信息与每个第二信息之间的匹配度;根据第一信息与每个第二信息之间的匹配度,从推荐信息库中选择匹配度最高的第二信息,向终端发送该选择的第二信息的链接。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
上述方法为用户推送的第二信息在关键字上与第一信息存在极大的相似性,甚至第一信息和第二信息是来自不同来源的互相转载;也即上述方法中并不能为用户推送与第一信息深度和广度相关的第二信息,从而导致推荐信息的准确性差。并且,当用户为专业的新闻从业者时,由于服务器无法为用户推送与该第一信息深度和广度相关的第二信息,此时用户就需要花费大量时间精力对与第一信息深度和广度相关的第二信息进行搜集挖掘,不仅浪费时间,还会造成新闻从业者这类工作对从业者经验积累以及知识广博程度的高要求,使得新闻从业者成本较高。
发明内容
为了解决现有技术的问题,本发明提供了一种推荐信息的方法和装置。技术方案如下:
第一方面,本发明实施例提供了一种推荐信息的方法,所述方法包括:
根据用户输入或当前阅读的第一信息,确定第一关键词集合;
根据所述第一关键词集合中的每个第一关键词,确定第一信息类别集合,所述第一信息类别集合中包括所述每个第一关键词所属的信息类别;
根据所述第一关键词集合和所述第一信息类别集合,确定属性信息集合,所述属性信息集合包括与所述每个第一关键词和所述第一信息类别集合中的每个第一信息类别满足预设关联度条件的实体的属性信息;
根据所述第一关键词集合、所述第一信息类别集合和所述属性信息集合,确定一组推荐表达式;
根据所述一组推荐表达式,为所述用户推荐信息。
可选的,所述根据所述第一关键词集合中的每个第一关键词,确定第一信息类别集合,包括:
对于所述第一关键词集合中的每个第一关键词,获取所述第一关键词的信息类别;
根据所述第一关键词的信息类别,从类别树中获取所述第一关键词的信息类别的祖先节点的信息类别;
将所述第一关键词的信息类别和所述祖先节点的信息类别组成所述第一信息类别集合。
可选的,根据所述第一关键词集合和所述第一信息类别集合,确定满足第一预设筛选条件的第二关键词集合,以及,根据所述第一信息类别集合,确定满足第二预设筛选条件的第二信息类别集合;
根据所述第二关键词集合和所述第二信息类别集合,确定实体集合,所述实体集合包括第一实体和与所述第一实体关联的第二实体,所述第一实体为所述第二关键词集合中的任一第二关键词和所述第二信息类别集合中的任一第二信息类别对应的实体;
根据所述实体集合,从知识图谱中获取所述实体集合中的每个实体的属性信息组成所述属性信息集合,所述知识图谱包括实体和属性信息的对应关系。可选的,所述根据所述第一关键词集合和所述第一信息类别集合,确定满足第一预设筛选条件的第二关键词集合,包括:
计算所述第一关键词集合中的每个第一关键词的影响度以及所述每个第一关键词所属的信息类别对所述每个第一关键词的权重增量;
根据所述每个第一关键词的影响度和所述每个第一关键词所属的信息类别对所述每个第一关键词的权重增量,计算所述每个第一关键词的推荐度;
根据所述每个第一关键词的推荐度,从所述第一关键词集合中选择推荐度最大的第一预设数目个第一关键词组成第二关键词集合。
可选的,所述根据所述第一关键词集合、所述第一信息类别集合和所述属性信息集合,确定一组推荐表达式,包括:
将所述第一关键词集合、所述第一信息类别集合和所述属性信息集合组成推荐词库;
根据预设选择规则及所述推荐词库中的推荐词,生成多个推荐表达式;
根据所述多个推荐表达式的推荐度,从所述多个推荐表达式中选择推荐度最高的第四预设数目个推荐表达式得到所述一组推荐表达式。
可选的,所述根据所述一组推荐表达式,为所述用户推荐信息,包括:
对于所述一组推荐表达式中的每个推荐表达式,根据所述推荐表达式包括的推荐词在推荐信息库中匹配第二信息,并确定匹配度;根据所述推荐表达式与匹配的每个第二信息之间的匹配度,针对每个所述推荐表达式,从所述推荐信息库中选择匹配度最高的第二预设数目个第二信息作为推荐信息推荐给所述用户。
第二方面,本发明实施例提供了一种推荐信息的装置,所述装置包括:
第一确定模块,用于根据用户输入或当前阅读的第一信息,确定第一关键词集合;
第二确定模块,用于根据所述第一关键词集合中的每个第一关键词,确定第一信息类别集合,所述第一信息类别集合中包括所述每个第一关键词所属的信息类别;
第三确定模块,用于根据所述第一关键词集合和所述第一信息类别集合,确定属性信息集合,所述属性信息集合包括与所述每个第一关键词和所述第一信息类别集合中的每个第一信息类别满足预设关联度条件的实体的属性信息;
第四确定模块,用于根据所述第一关键词集合、所述第一信息类别集合和所述属性信息集合,确定一组推荐表达式;
推荐模块,用于根据所述一组推荐表达式,为所述用户推荐信息。
可选的,所述第二确定模块,包括:
第一获取单元,用于对于所述第一关键词集合中的每个第一关键词,获取所述第一关键词的信息类别;
第二获取单元,用于根据所述第一关键词的信息类别,从类别树中获取所述第一关键词的信息类别的祖先节点的信息类别;
第一组成单元,用于将所述第一关键词的信息类别和所述祖先节点的信息类别组成所述第一信息类别集合。
可选的,所述第三确定模块,包括:
第一确定单元,用于根据所述第一关键词集合和所述第一信息类别集合,确定满足第一预设筛选条件的第二关键词集合;
第二确定单元,用于根据所述第一信息类别集合,确定满足第二预设筛选条件的第二信息类别集合;
第三确定单元,用于根据所述第二关键词集合和所述第二信息类别集合,确定实体集合,所述实体集合包括第一实体和与所述第一实体关联的第二实体,所述第一实体为所述第二关键词集合中的任一第二关键词和所述第二信息类别集合中的任一第二信息类别对应的实体;
第三获取单元,用于根据所述实体集合,从知识图谱中获取所述实体集合中的每个实体的属性信息组成所述属性信息集合,所述知识图谱包括实体和属性信息的对应关系。
可选的,所述第一确定单元,包括:
第一计算子单元,用于计算所述第一关键词集合中的每个第一关键词的影响度以及所述每个第一关键词所属的信息类别对所述每个第一关键词的权重增量;
第二计算子单元,用于根据所述每个第一关键词的影响度和所述每个第一关键词所属的信息类别对所述每个第一关键词的权重增量,计算所述每个第一关键词的推荐度;
选择子单元,用于根据所述每个第一关键词的推荐度,从所述第一关键词集合中选择推荐度最大的第一预设数目个第一关键词组成第二关键词集合。
可选的,所述第四确定模块,包括:
第二组成单元,用于将所述第一关键词集合、所述第一信息类别集合和所述属性信息集合组成推荐词库;
生成单元,用于根据预设选择规则及所述推荐词库中的推荐词,生成多个推荐表达式;
第一选择单元,用于根据所述多个推荐表达式的推荐度,从所述多个推荐表达式中选择推荐度最高的第四预设数目个推荐表达式得到所述一组推荐表达式。
可选的,所述推荐模块,包括:
第四确定单元,用于对于所述一组推荐表达式中的每个推荐表达式,根据所述推荐表达式包括的推荐词在推荐信息库中匹配第二信息,并确定匹配度;
第二选择单元,用于根据所述推荐表达式与匹配的每个第二信息之间的匹配度,针对每个所述推荐表达式,从所述推荐信息库中选择匹配度最高的第二预设数目个第二信息;
推荐单元,用于将所述第二预设数目个第二信息作为推荐信息推荐给所述用户。
在本发明实施例中,服务器根据第一关键词集合、第一信息类别集合和属性信息集合,确定一组推荐表达式,根据一组推荐表达式,为用户推荐信息。由于一组推荐表达式包括更丰富的内容,因此,根据一组推荐表达式可以为用户推荐与第一信息深度和广度相关的信息,从而提高了推荐准确性,尤其是如果用户是新闻从业者需要了解第一信息深度、广度相关信息时,用户只需要在终端输入一段文本或打开第一信息对应的文档阅读,用户就不需要花费大量时间手动搜集挖掘与第一信息深度和广度相关的信息,降低了新闻从业者的搜集信息的时间成本。
附图说明
图1是本发明实施例提供的一种推荐信息的方法流程图;
图2是本发明实施例提供的一种推荐信息的方法流程图;
图3是本发明实施例提供的一种本体树的示意图;
图4是本发明实施例提供的一种知识图谱的示意图;
图5是本发明实施例提供的一种实体之间关系的示意图;
图6是本发明实施例提供的一种推荐信息的装置结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
本发明实施例提供了一种推荐信息的方法,该方法应用在服务器中,参见图1,该方法包括:
步骤101:根据用户输入或当前阅读的第一信息,确定第一关键词集合。
步骤102:根据第一关键词集合中的每个第一关键词,确定第一信息类别集合,第一信息类别集合中包括每个第一关键词所属的信息类别。
步骤103:根据第一关键词集合和第一信息类别集合,确定属性信息集合,该属性信息集合包括与每个第一关键词和第一信息类别集合中的每个第一信息类别满足预设关联度条件的实体的属性信息。
步骤104:根据第一关键词集合、第一信息类别集合和属性信息集合,确定一组推荐表达式。
步骤105:根据一组推荐表达式,为用户推荐信息。
可选的,根据第一关键词集合中的每个第一关键词,确定第一信息类别集合,包括:
对于第一关键词集合中的每个第一关键词,获取第一关键词的信息类别;
根据第一关键词的信息类别,从类别树中获取第一关键词的信息类别的祖先节点的信息类别;
将第一关键词的信息类别和祖先节点的信息类别组成第一信息类别集合。
可选的,根据第一关键词集合和第一信息类别集合,确定属性信息集合,包括:
根据第一关键词集合和第一信息类别集合,确定满足第一预设筛选条件的第二关键词集合,以及,根据第一信息类别集合,确定满足第二预设筛选条件的第二信息类别集合;
根据第二关键词集合和第二信息类别集合,确定实体集合,实体集合包括第一实体和与第一实体关联的第二实体,第一实体为第二关键词集合中的任一第二关键词和第二信息类别集合中的任一第二信息类别对应的实体;
根据实体集合,从知识图谱中获取实体集合中的每个实体的属性信息组成属性信息集合,知识图谱包括实体和属性信息的对应关系。
可选的,根据第一关键词集合和第一信息类别集合,确定满足第一预设筛选条件的第二关键词集合和第二信息类别集合,包括:
计算第一关键词集合中的每个第一关键词的影响度以及每个第一关键词所属的信息类别对每个第一关键词的权重增量;
根据每个第一关键词的影响度和每个第一关键词所属的信息类别对每个第一关键词的权重增量,计算每个第一关键词的推荐度;
根据每个第一关键词的推荐度,从第一关键词集合中选择推荐度最大的第一预设数目个第一关键词组成第二关键词集合。
可选的,根据第一关键词集合、第一信息类别集合和属性信息集合,确定一组推荐表达式,包括:
将第一关键词集合、第一信息类别集合和属性信息集合组成推荐词库;
根据预设选择规则及推荐词库中的推荐词,生成多个推荐表达式;
根据多个推荐表达式的推荐度,从多个推荐表达式中选择推荐度最高的第四预设数目个推荐表达式得到一组推荐表达式。
可选的,根据一组推荐表达式,为用户推荐信息,包括:
对于所述一组推荐表达式中的每个推荐表达式,根据所述推荐表达式包括的推荐词在推荐信息库中匹配第二信息,并确定匹配度;根据所述推荐表达式与匹配的每个第二信息之间的匹配度,针对每个所述推荐表达式,从所述推荐信息库中选择匹配度最高的第二预设数目个第二信息作为推荐信息推荐给所述用户。
在本发明实施例中,服务器根据第一关键词集合、第一信息类别集合和属性信息集合,确定一组推荐表达式,根据一组推荐表达式,为用户推荐信息。由于推荐表达式包括更丰富的内容,因此,根据推荐表达式可以为用户推荐与第一信息深度和广度相关的信息,从而提高了推荐准确性,尤其是如果用户是新闻从业者需要了解第一信息深度、广度相关信息时,用户只需要在终端输入一段文本或打开第一信息对应的文档阅读,用户就不需要花费大量时间手动搜集挖掘与第一信息深度和广度相关的信息,降低了新闻从业者的搜集信息的时间成本。
本发明实施例提供了一种推荐信息的方法,该方法应用在服务器中,参见图2,该方法包括:
步骤201:服务器根据用户输入或当前阅读的第一信息,确定第一关键词集合,第一关键词集合中包括多个第一关键词。
当用户使用终端阅读信息时,服务器获取用户当前阅读的信息或者用户输入的信息,为了便于与后续推荐的信息进行区分,将服务器获取的该信息称为第一信息,根据第一信息为用户推荐与第一信息相关的第二信息。
获取获取第一信息之后,对第一信息进行断句处理,得到第一信息包括的每个句子;对第一信息包括的每个句子进行分词处理,得到每个句子包括的第一关键词,将每个句子包括的第一关键词组成第一关键词集合。
由于“的”、“了”、“么”、“吧”、“啊”之类的关键词对推荐信息起不到关键作用;因此,为了减少运算量以及提高推荐准确性,在本步骤中,服务器还可以将“的”、“了”、“么”、“吧”、“啊”这类的关键词去除。因此,服务器将每个句子包括的第一关键词组成第一关键词集合之后,还包括:
服务器标注第一关键词集合中的每个第一关键词的词性;根据每个第一关键词的词性,从第一关键词集合中查找预设词性的第一关键词,将预设词性的第一关键词从第一关键词集合中去除。其中,预设词性的第一关键词可以为语气词或者助词等。
为了提高推荐的深度和广度,在本步骤中,服务器还可以对第一关键词集合中的每个第一关键词进行扩展,具体过程可以为:
对于第一关键词集合中的每个第一关键词,服务器获取该第一关键词的同义词和/或近义词,将第一关键词的同义词和/或近义词添加到第一关键词集合中。
例如,第一关键词为“京城”,则服务器获取“京城”的同义词:“北京”和“首都”,将“北京”和“首都”添加到第一关键词集合中。再如,第一关键词为“遗失”,服务器获取“遗失”的同义词“丢失”和“失去”,将“丢失”和“失去”添加到第一关键词集合中。
需要说明的是,第一信息可以为网页内容、文本内容、电子书内容、本地文档或者半结构格式(例如,xml格式(可扩展标记语言))内容的文档信息,具体可以为用户当前打开的现有文档,也可以为用户输入的文本信息,特别是针对文档撰写者、编辑者用户,用户输入一段文本信息后,根据用户输入信息,进行深度、广度挖掘,推荐有价值信息供用户参考。第一信息也可以为视频信息。如果第一信息为视频信息时,服务器根据第一信息,确定第一关键词集合的步骤可以为:
服务器获取第一视频信息对应的文本内容,根据第一视频信息对应的文本内容,确定第一关键词集合。在本发明实施例中,对第一信息的数目也不作具体限定;例如,第一信息可以为一个文档或者多个文档的文档信息,也可以一个或多个视频片段对应的文本内容。
终端可以为手机终端、PAD(portable android device,平板电脑)终端或者电脑终端等。在本发明实施例中,对终端不作具体限定。服务器为任一具有推荐功能的服务器;例如,新闻推送服务器等。
步骤202:服务器根据第一关键词集合中的每个第一关键词,确定第一信息类别集合,第一信息类别集合中包括每个第一关键词所属的信息类别。
信息类别指信息所属的业务类别。当第一信息为新闻类信息时,第一关键词所属的信息类别可以为“新闻主题”、“新闻地域”或者“新闻事件”等。
本步骤可以通过以下步骤(1)至(3)实现,包括:
(1):对于第一关键词集合中的每个第一关键词,服务器获取该第一关键词的信息类别。
服务器中存储多个信息类别,对于每个第一关键词,服务器根据该第一关键词,通过正则表达式,从多个信息类别中选择与该第一关键词匹配的信息类别,将选择的信息类别作为该第一关键词的信息类别。
需要说明的是,在本步骤中,服务器中存储的多个信息类别为最底层的信息类别,也即服务器获取每个第一关键词的信息类别为最底层的信息类别。而第一关键词所属的信息类别是指第一关键词所属的所有信息类别,也即不仅包括该最底层的信息类别,还包括该最底层的信息类别所属的信息类别等。其中,信息类别也可以称为本体。
例如,第一关键词为“A国恐怖袭击”,则服务器获取该第一关键词的信息类别为“枪击事件”。
(2):服务器根据第一关键词的信息类别,从类别树中获取第一关键词的信息类别的祖先节点的信息类别。
类别树中包括多个节点以及多个节点之间的关系;类别树中的一个节点为一个信息类别,并且,第一关键词的信息类别为类别树中的叶子节点。在本步骤中,服务器根据第一关键词的信息类别,从类别树中获取该信息类别的父节点的信息类别,根据该信息类别的父节点的信息类别,获取父节点的父节点的信息类别,直到获取到根节点的信息类别,从而获取第一关键词的信息类别的祖先节点的信息类别。
例如,图3是本发明实施例提供的一种类别树,该类别树的第一层子节点包括“新闻主题”、“新闻地域”、“新闻事件”、“新闻人物”和“其他”;“新闻事件”又可以分为“延缓性事件”、“突发性事件”和“其他事件”;“突发事件”又可以分为:“突发信息安全事件”、“突发公共事件”和“经济安全事件”;“突发安全事件”又可以分为“自然灾害”、“事故灾害”、“公共卫生事件”和“社会安全事件”等;“社会安全事件”又可以分为“恐怖袭击”、“个人违法犯罪”、“群体事件”和“其他破坏事件”;“恐怖袭击”又可以分为“枪击事件”、“爆炸事件”、“人质事件”和“化学武器袭击”等。
例如,第一关键词的信息类别为“枪击事件”,则服务器从本体树中获取“枪击事件”的祖先节点的信息类别为“新闻事件->突发事件->突发安全事件->社会安全事件->恐怖袭击”。
(3):服务器将该第一关键词的信息类别和该祖先节点的信息类别组成第一信息类别集合。
在本步骤中,服务器将每个第一关键词的信息类别,以及每个关键词的信息类别的祖先节点的信息类别组成第一信息类别集合。
步骤203:服务器根据第一关键词集合和第一信息类别集合,确定属性信息集合,属性信息集合包括与每个第一关键词和第一信息类别集合中的每个第一信息类别满足预设关联度条件的实体的属性信息。
预设关联度条件的实体可以为与每个第一关键词和第一信息类别集合中的每个第一信息类别对应的实体,和/或与该实体关联的实体。
本步骤可以通过以下步骤(1)-(4)实现,包括:
(1):服务器根据第一关键词集合和第一信息类别集合,确定满足第一预设筛选条件的第二关键词集合。
由于第一关键词集合包括的第一关键词较多,并且,有些第一关键词是通用词;因此为了减少计算量,并提高推荐准确性,在本步骤中,服务器从第一关键词集合中提取满足第一预设筛选条件的第一关键词组成第二关键词集合。第一预设筛选条件可以为推荐度最大等。
本步骤具体可以通过以下步骤(1-1)至(1-3)实现,包括:
(1-1):服务器计算第一关键词集合中的每个第一关键词的影响度以及每个第一关键词所属的信息类别对每个第一关键词的权重增量。
对于每个第一关键词,服务器计算该第一关键词的影响度的步骤可以为:
服务器统计推荐信息库中包括该第一关键词的信息的第一数目,获取推荐信息库中包括的第二信息的第二数目,根据第一数目和第二数目,通过以下公式一计算该第一关键词的影响度:
公式一:
其中,TFIDF(t)为第一关键词的影响度,t为第一关键词,d为第一信息,n为第一数目,N为第二数目。推荐信息库用于存储多个待推荐的第二信息。
对于每个第一关键词所属的每个第一信息类别,服务器计算该第一信息类别对该第一关键词的权重增量的步骤可以为:
服务器计算该第一信息类别的影响度以及该第一关键词与该第一信息类别之间相差的层级数,根据该第一信息类别的影响度以及该层级数,计算该第一信息类别对该第一关键词的权重增量。
其中,服务器计算该第一信息类别的影响度的步骤可以为:
服务器统计推荐信息库中包括关键词属于该第一信息类别的信息的第三数目,根据第三数目和第二数目,通过以下公式二,计算该第一信息类别的影响度:
公式二:
其中,TFIDF(o)为该第一信息类别的影响度,o为该第一信息类别,d为第一信息,m为第三数目,N为第二数目。
例如,第一关键词为“A国恐怖袭击”,第一关键词所属的第一信息类别为“新闻事件->突发事件->突发公共安全事件->社会安全事件->恐怖袭击->枪击事件”,则“枪击事件”与“A国恐怖袭击”之间相差的层级数为1,“恐怖袭击”与“A国恐怖袭击”之间相差的层级数为2,以此类型。
其中,服务器根据该第一信息类别的影响度以及该层级数,计算该第一信息类别对该第一关键词的权重增量的步骤可以为:
服务器根据该第一信息类别的影响度以及该层级数,通过以下公式三,计算该第一信息类别对该第一关键词的权重增量:
公式三:
其中,Z(o)为该第一信息类别对该第一关键词的权重增量,lo为该层级数,TFIDF(o)为该第一信息类别的影响度。
例如,第一关键词为“A国恐怖袭击”,第一关键词所属的第一信息类别为“新闻事件->突发事件->突发公共安全事件->社会安全事件->恐怖袭击->枪击事件”,则“枪击事件”对“A国恐怖袭击”的增量权重为(枪击事件),“恐怖袭击”对“A国恐怖袭击”的增量权重为(恐怖袭击)。
在本发明实施例中,采用阶乘倒数作为加权的形式来确保随着信息类别的抽象程度升高其影响度下降,从而确定出第一关键词的推荐度更准确。并且,本发明实施例中,通过综合信息类别,来解决多词同义导致的统计量分散的问题,也可以从一定程度上考虑相同或者相近关键词的互相增益,以挖掘出更加合理的关键信息。
(1-2):服务器根据每个第一关键词的影响度和每个第一关键词所属的信息类别对每个第一关键词的权重增量,计算每个第一关键词的推荐度。
对于每个第一关键词,服务器根据第一预设权重、第二预设权重、该第一关键词的影响度和该第一关键词所属的每个信息类别对该第一关键词的权重增量,通过以下公式四,计算该第一关键词的推荐度:
公式四:
其中,termWeight(t)为该第一关键词的推荐度,α为第一预设权重,β为第二预设权重,o(t)为第一关键词所属的每个第一信息类别,Z(o)为每个第一信息类别的对第一关键词的权重增量。
第一预设权重和第二预设权重用于调整第一关键词的影响度和该第一信息类别的影响度之间的重要性;第一预设权重和第二预设权重之和为1,并且,第一预设权重和第二预设权重可以根据需要进行设置并更改,在本发明实施例中,对第一预设权重和第二预设权重不作具体限定;例如,第一预设权重和第二预设权重都为0.5。
(1-3):服务器根据每个第一关键词的推荐度,从第一关键词集合中选择推荐度最大的第一预设数目个第一关键词组成第二关键词集合。
第一预设数目可以根据需要进行设置并更改,在本发明实施例中,对第一预设数目不作具体限定;例如,第一预设数目可以为5或者8等。
(2):服务器根据第一信息类别集合,确定满足第二预设筛选条件的第二信息类别集合。
由于第一信息类别集合中包括的信息类别较多;并且,有些信息类别比较大,针对性不强;因此为了减少计算量,并提高推荐准确性,在本步骤中,服务器从第一信息类别集合中提取满足第二预设筛选条件的第一信息类别组成第二信息类别集合。第二预设筛选条件可以为推荐度最大等。
本步骤具体可以为:服务器计算第一信息类别集合中的每个第一信息类别的推荐度,根据每个第一信息类别的推荐度,从第一信息类别集合中选择推荐度最高的第三预设数目个第一信息类别组成第二信息类别集合。
对于每个第一信息类别,服务器可以直接将该第一信息类别的影响度作为该第一信息类别的推荐度。
第三预设数目可以根据需要进行设置并更改,在本发明实施例中,对第三预设数目不作具体限定;例如,第三预设数目可以为10或者15等。
(3):服务器根据第二关键词集合和第二信息类别集合,确定实体集合,实体集合包括第一实体和与第一实体关联的第二实体,第一实体为第二关键词集合中的任一第二关键词和第二信息类别集合中的任一第二信息类别对应的实体。
知识图谱中存储关键词、信息类别和实体的对应关系,以及实体与实体之间的关联关系;在本步骤中,对于第二关键词集合中的任一第二关键词,以及第二信息类别集合中的任一第二信息类别,服务器根据该第二关键词和该信息类别,从类别信息、关键词和实体的对应关系中获取该第二关键词和信息类别对应的第一实体,根据第一实体,获取与第一实体关联的第二实体。
由于知识图谱中还存储实体与实体之间的关系,根据第一实体获取与第一实体关联的第二实体,从而实现了对实体的扩展,获取到了更多的实体,从而后续可以获取更多的属性信息,进一步提高了推荐信息的深度和广度。
知识图谱中实体与实体之间的关系具体可以通过RDF(ResourceDescriptionFramework,资源描述框架)三元组(实体1,关系,实体2)进行描述。实体1和实体2可以为名实体(例如,人名、地名或机构名等),也可以为新闻事件。知识图谱的结构也可以类似于类别树的结构,按照信息类别对应的层次进行布局。
(4):服务器根据该实体集合,从知识图谱中获取该实体集合中的每个实体的属性信息组成属性信息集合,知识图谱包括实体和属性信息的对应关系。
对于该实体集合中的每个实体,服务器根据该实体,从实体和属性信息的对应关系中获取该实体对应的属性信息。
其中,实体的属性信息用于描述实体对应的关键点(事件要素);如果实体为新闻概念时,实体的属性信息可以为新闻概念在新闻报道时所关注的要点。例如,实体为“恐怖袭击”,则实体的属性信息可以为“袭击者”、“受害者”、“时间”和“地点”等。
例如,图4是本发明实施例提供的一个知识图谱,知识图谱中包括的实体分别为:A国、B国和C国。A国对应的属性信息包括主要民族:法兰西人和阿拉伯人,面积:105.4平方公里,重要事件:袭击事件;B国对应的属性信息包括主要民族:法兰西人、科西嘉人、布列塔尼人,袭击对象:C国;C国的属性信息包括主要民族:阿拉伯人,被轰炸国家:B国。
图5是本发明实施例提供的一个知识图谱中实体与实体之间的关系。其中,A国的属性信息包括主要民族:法兰西人和阿拉伯人,面积:105.4平方公里,重要事件:袭击事件;由于A国的重要事件是袭击事件,而B国也发生过袭击事件,则A国与B国存在关联关系,B国的属性信息包括主要民族:法兰西人、科西嘉人、布列塔尼人,袭击对象:C国;由于B国袭击的是C国,则B国和C国也存在关联关系,C国的属性信息包括主要民族:阿拉伯人,被轰炸国家:B国,时间:2015年9月,袭击方式:空袭轰炸,武器:航母戴高乐号。
例如,第一本体为A国,则根据第一本体,获取与第一本体关联的第二本体为B国;再如,第一本体为B国,则根据第一本体,获取与第一本体关联的第二本体为C国。
步骤204:服务器根据第一关键词集合、第一信息类别集合和属性信息集合,确定一组推荐表达式,一组推荐表达式中包括至少一个推荐表达式。
本步骤可以通过以下步骤(1)至(3)实现,包括:
(1):服务器将第一关键词集合、第一信息类别集合和属性信息集合组成推荐词库。
服务器将第一关键词集合中的第一关键词、第一信息类别集合中的每个第一信息类别和属性信息集合中的属性信息组成推荐词库。
由于第一关键词集合包括的第一关键词较多,且第一信息类别集合中包括的信息类别较多;并且,有些第一关键词是通用词,或者有些信息类别比较大,针对性不强;因此,在本步骤中,服务器可以获取筛选后的第二关键词集合和第二信息类别集合,将第二关键词集合、第二信息类别集合和属性信息集合组成推荐词库。
(2):服务器根据预设选择规则以及推荐词库中的推荐词,生成多个推荐表达式。
服务器根据预设选择规则,从推荐词库中选择多组推荐词,将多组推荐词中的每组推荐词组成一个推荐表达式,得到多个推荐表达式。其中,多个推荐表达式中的每个推荐表达式包括至少一个推荐词。
预设选择规则可以根据需要进行设置并更改,在本发明实施例中,对预设选择规则不作具体限定。例如,预设选择规则包括第一选择子规则、第二选择子规则、第三选择子规则和第四选择子规则。
第一选择子规则为从推荐词库中选择名实体。例如,推荐词库中包括人物名,则可以直接选择人物名作为推荐表达式。
第二选择子规则为从推荐词库中选择数目较多个推荐词。例如,推荐表达式“中国+恐怖袭击”优于“恐怖袭击”。
第三选择子规则为从推荐词库中选择异质属性的推荐词。例如,推荐表达式“新三板+体育产业”优于“新三板+增发”。其中,异质属性是指两个推荐词的类别不同,或者两个推荐词来自不同的集合。例如,两个推荐词分别来自关键词集合和信息类别集合等。
第四选择子规则为根据推荐词库中推荐词的推荐度,从推荐词库中选择推荐度最高的推荐词。
需要说明的是,推荐表达式的生成过程就是推荐词库中的推荐词进行组合的过程;为了防止组合过多,采用栈搜索策略进行剪枝,只保留推荐度最高的第四预设数目个推荐表达式,也即执行步骤(3)对推荐表达式进行筛选。
(3):服务器根据多个推荐表达式的推荐度,从多个推荐表达式中选择推荐度最高的第四预设数目个推荐表达式得到一组推荐表达式。
服务器分别计算多个推荐表达式中的每个推荐表达式的推荐度,根据每个推荐表达式的推荐度,从多个推荐表达式中选择推荐度最高的第四预设数目个推荐表达式,将该第四预设数目个推荐表达式组成一组推荐表达式。
第四预设数目可以根据需要进行设置并更改,在本发明实施例中,对第四预设数目不作具体限定;例如,第四预设数目可以为5或者6等。
步骤205:服务器根据一组推荐表达式,为用户推荐信息。
本步骤可以通过以下步骤(1)至(3)实现,包括:
(1):对于一组推荐表达式中的每个推荐表达式,服务器根据该推荐表达式包括的推荐词在推荐信息库中匹配第二信息,并确定匹配度。
对于推荐信息库中的每个第二信息以及一组推荐表达式中的每个推荐表达式,服务器计算该第二信息与该推荐表达式之间的匹配度的步骤可以为:
服务器根据该第二信息,确定该第二信息对应的第三关键词集合;确定该推荐表达式包含的每个推荐词在第三关键词集合中出现的次数,将每个推荐词在第三关键词集合中出现的次数作为该推荐表达式与该第二信息之间的匹配度。
(2):服务器根据该推荐表达式与匹配的每个第二信息之间的匹配度,针对每个推荐表达式,从推荐信息库中选择匹配度最高的第二预设数目个第二信息。
第二预设数目可以根据需要进行设置并更改,在本发明实施例中,对第二预设数目不作具体限定;例如,第二预设数目可以为10或者20等。
(3):服务器将该第二预设数目个第二信息作为推荐信息推荐给用户。
服务器向用户的终端发送该第二预设数目个第二信息中的每个第二信息的链接。
终端接收服务器发送的第二预设数目个第二信息中的每个第二信息的链接,分别显示第二预设数目个第二信息中的每个第二信息的链接,以便于用户可以通过点击该链接,从服务器中获取链接对应的第二信息。
进一步地,如果推荐表达式中包括名实体的推荐词时,服务器还可以从推荐信息库中获取该推荐词对应的第二信息。
在本发明实施例中,服务器根据第一关键词集合、第一信息类别集合和属性信息集合,确定一组推荐表达式,根据一组推荐表达式,为用户推荐信息。由于推荐表达式包括更丰富的内容,因此,根据推荐表达式可以为用户推荐与第一信息深度和广度相关的信息,从而提高了推荐准确性,尤其是如果用户是新闻从业者需要了解第一信息深度、广度相关信息时,用户只需要在终端输入一段文本或打开第一信息对应的文档阅读,用户就不需要花费大量时间手动搜集挖掘与第一信息深度和广度相关的信息,降低了新闻从业者的搜集信息的时间成本。
本发明实施例提供了一种推荐信息的装置,该装置可以应用在服务器中;用于执行以上推荐信息的方法,参见图6,该装置包括:
第一确定模块301,用于根据用户输入或当前阅读的第一信息,确定第一关键词集合;
第二确定模块302,用于根据第一关键词集合中的每个第一关键词,确定第一信息类别集合,第一信息类别集合中包括每个第一关键词所属的信息类别;
第三确定模块303,用于根据第一关键词集合和第一信息类别集合,确定属性信息集合,属性信息集合包括与每个第一关键词和第一信息类别集合中的每个第一信息类别满足预设关联度条件的实体的属性信息;
第四确定模块304,用于根据第一关键词集合、第一信息类别集合和属性信息集合,确定一组推荐表达式;
推荐模块305,用于根据一组推荐表达式,为用户推荐信息。
可选的,第二确定模块302,包括:
第一获取单元,用于对于第一关键词集合中的每个第一关键词,获取第一关键词的信息类别;
第二获取单元,用于根据第一关键词的信息类别,从类别树中获取第一关键词的信息类别的祖先节点的信息类别;
第一组成单元,用于将第一关键词的信息类别和祖先节点的信息类别组成第一信息类别集合。
可选的,第三确定模块303,包括:
第一确定单元,用于根据第一关键词集合和第一信息类别集合,确定满足第一预设筛选条件的第二关键词集合;
第二确定单元,用于根据第一信息类别集合,确定满足第二预设筛选条件的第二信息类别集合;
第三确定单元,用于根据第二关键词集合和第二信息类别集合,确定实体集合,实体集合包括第一实体和与第一实体关联的第二实体,第一实体为第二关键词集合中的任一第二关键词和第二信息类别集合中的任一第二信息类别对应的实体;
第三获取单元,用于根据实体集合,从知识图谱中获取实体集合中的每个实体的属性信息组成属性信息集合,知识图谱包括实体和属性信息的对应关系。
可选的,第一确定单元,包括:
第一计算子单元,用于计算第一关键词集合中的每个第一关键词的影响度以及每个第一关键词所属的信息类别对每个第一关键词的权重增量;
第二计算子单元,用于根据每个第一关键词的影响度和每个第一关键词所属的信息类别对每个第一关键词的权重增量,计算每个第一关键词的推荐度;
选择子单元,用于根据每个第一关键词的推荐度,从第一关键词集合中选择推荐度最大的第一预设数目个第一关键词组成第二关键词集合。
可选的,第四确定模块304,包括:
第二组成单元,用于将第一关键词集合、第一信息类别集合和属性信息集合组成推荐词库;
生成单元,用于根据预设选择规则及推荐词库中的推荐词,生成多个推荐表达式;
第一选择单元,用于根据多个推荐表达式的推荐度,从多个推荐表达式中选择推荐度最高的第四预设数目个推荐表达式得到一组推荐表达式。
可选的,推荐模块305,包括:
第四确定单元,用于对于一组推荐表达式中的每个推荐表达式,根据该推荐表达式包括的推荐词在推荐信息库中匹配第二信息,并确定匹配度;
第二选择单元,用于根据该推荐表达式与匹配的每个第二信息之间的匹配度,针对每个推荐表达式,从推荐信息库中选择匹配度最高的第二预设数目个第二信息;
推荐单元,用于将该第二预设数目个第二信息作为推荐信息推荐给用户。
在本发明实施例中,服务器根据第一关键词集合、第一信息类别集合和属性信息集合,确定一组推荐表达式,根据一组推荐表达式,为用户推荐信息。由于推荐表达式包括更丰富的内容,因此,根据推荐表达式可以为用户推荐与第一信息深度和广度相关的信息,从而提高了推荐准确性,尤其是如果用户是新闻从业者需要了解第一信息深度、广度相关信息时,用户只需要在终端输入一段文本或打开第一信息对应的文档阅读,用户就不需要花费大量时间手动搜集挖掘与第一信息深度和广度相关的信息,降低了新闻从业者的搜集信息的时间成本。
需要说明的是:上述实施例提供的推荐信息的装置在推荐信息时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的推荐信息的装置与推荐信息的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种推荐信息的方法,其特征在于,所述方法包括:
根据用户输入或当前阅读的第一信息,确定第一关键词集合,所述第一关键词集合包含多个第一关键词以及所述多个第一关键词的同义词和/或近义词;
根据所述第一关键词集合中的每个第一关键词,确定第一信息类别集合,所述第一信息类别集合中包括所述每个第一关键词所属的信息类别和所述每个第一关键词的信息类别的祖先节点的信息类别;
根据所述第一关键词集合和所述第一信息类别集合,确定属性信息集合,所述属性信息集合包括与所述每个第一关键词和所述第一信息类别集合中的每个第一信息类别满足预设关联度条件的实体的属性信息;
根据所述第一关键词集合、所述第一信息类别集合和所述属性信息集合,确定一组推荐表达式;
根据所述一组推荐表达式,从推荐信息库中为所述用户推荐信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一关键词集合中的每个第一关键词,确定第一信息类别集合,包括:
对于所述第一关键词集合中的每个第一关键词,获取所述第一关键词的信息类别;
根据所述第一关键词的信息类别,从类别树中获取所述第一关键词的信息类别的所述祖先节点的信息类别;
将所述第一关键词的信息类别和所述祖先节点的信息类别组成所述第一信息类别集合。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一关键词集合和所述第一信息类别集合,确定属性信息集合,包括:
根据所述第一关键词集合和所述第一信息类别集合,确定满足第一预设筛选条件的第二关键词集合,以及,根据所述第一信息类别集合,确定满足第二预设筛选条件的第二信息类别集合;
根据所述第二关键词集合和所述第二信息类别集合,确定实体集合,所述实体集合包括第一实体和与所述第一实体关联的第二实体,所述第一实体为所述第二关键词集合中的任一第二关键词和所述第二信息类别集合中的任一第二信息类别对应的实体;
根据所述实体集合,从知识图谱中获取所述实体集合中的每个实体的属性信息组成所述属性信息集合,所述知识图谱包括实体和属性信息的对应关系。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一关键词集合和所述第一信息类别集合,确定满足第一预设筛选条件的第二关键词集合,包括:
计算所述第一关键词集合中的每个第一关键词的影响度以及所述每个第一关键词所属的信息类别对所述每个第一关键词的权重增量;
根据所述每个第一关键词的影响度和所述每个第一关键词所属的信息类别对所述每个第一关键词的权重增量,计算所述每个第一关键词的推荐度;
根据所述每个第一关键词的推荐度,从所述第一关键词集合中选择推荐度最大的第一预设数目个第一关键词组成第二关键词集合。
5.根据权利要求1所述的方法,其特征在于,所述根据所述第一关键词集合、所述第一信息类别集合和所述属性信息集合,确定一组推荐表达式,包括:
将所述第一关键词集合、所述第一信息类别集合和所述属性信息集合组成推荐词库;
根据预设选择规则及所述推荐词库中的推荐词,生成多个推荐表达式;
根据所述多个推荐表达式的推荐度,从所述多个推荐表达式中选择推荐度最高的第四预设数目个推荐表达式得到所述一组推荐表达式。
6.根据权利要求1所述的方法,其特征在于,所述根据所述一组推荐表达式,从推荐信息库中为所述用户推荐信息,包括:
对于所述一组推荐表达式中的每个推荐表达式,根据所述推荐表达式包括的推荐词在所述推荐信息库中匹配第二信息,并确定匹配度;根据所述推荐表达式与匹配的每个第二信息之间的匹配度,针对每个所述推荐表达式,从所述推荐信息库中选择匹配度最高的第二预设数目个第二信息作为推荐信息推荐给所述用户。
7.一种推荐信息的装置,其特征在于,所述装置包括:
第一确定模块,用于根据用户输入或当前阅读的第一信息,确定第一关键词集合,所述第一关键词集合包含多个第一关键词以及所述多个第一关键词的同义词和/或近义词;
第二确定模块,用于根据所述第一关键词集合中的每个第一关键词,确定第一信息类别集合,所述第一信息类别集合中包括所述每个第一关键词所属的信息类别和所述每个第一关键词的信息类别的祖先节点的信息类别;
第三确定模块,用于根据所述第一关键词集合和所述第一信息类别集合,确定属性信息集合,所述属性信息集合包括与所述每个第一关键词和所述第一信息类别集合中的每个第一信息类别满足预设关联度条件的实体的属性信息;
第四确定模块,用于根据所述第一关键词集合、所述第一信息类别集合和所述属性信息集合,确定一组推荐表达式;
推荐模块,用于根据所述一组推荐表达式,从推荐信息库中为所述用户推荐信息。
8.根据权利要求7所述的装置,其特征在于,所述第二确定模块,包括:
第一获取单元,用于对于所述第一关键词集合中的每个第一关键词,获取所述第一关键词的信息类别;
第二获取单元,用于根据所述第一关键词的信息类别,从类别树中获取所述第一关键词的信息类别的所述祖先节点的信息类别;
第一组成单元,用于将所述第一关键词的信息类别和所述祖先节点的信息类别组成所述第一信息类别集合。
9.根据权利要求7所述的装置,其特征在于,所述第三确定模块,包括:
第一确定单元,用于根据所述第一关键词集合和所述第一信息类别集合,确定满足第一预设筛选条件的第二关键词集合;
第二确定单元,用于根据所述第一信息类别集合,确定满足第二预设筛选条件的第二信息类别集合;
第三确定单元,用于根据所述第二关键词集合和所述第二信息类别集合,确定实体集合,所述实体集合包括第一实体和与所述第一实体关联的第二实体,所述第一实体为所述第二关键词集合中的任一第二关键词和所述第二信息类别集合中的任一第二信息类别对应的实体;
第三获取单元,用于根据所述实体集合,从知识图谱中获取所述实体集合中的每个实体的属性信息组成所述属性信息集合,所述知识图谱包括实体和属性信息的对应关系。
10.根据权利要求7所述的装置,其特征在于,所述第四确定模块,包括:
第二组成单元,用于将所述第一关键词集合、所述第一信息类别集合和所述属性信息集合组成推荐词库;
生成单元,用于根据预设选择规则及所述推荐词库中的推荐词,生成多个推荐表达式;
第一选择单元,用于根据所述多个推荐表达式的推荐度,从所述多个推荐表达式中选择推荐度最高的第四预设数目个推荐表达式得到所述一组推荐表达式。
CN201610966184.6A 2016-02-05 2016-11-04 推荐信息的方法和装置 Active CN106570144B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201610081578.3A CN106095762A (zh) 2016-02-05 2016-02-05 一种基于本体模型库的新闻推荐方法及装置
CN2016100815783 2016-02-05

Publications (2)

Publication Number Publication Date
CN106570144A CN106570144A (zh) 2017-04-19
CN106570144B true CN106570144B (zh) 2018-07-27

Family

ID=58536015

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201610081578.3A Pending CN106095762A (zh) 2016-02-05 2016-02-05 一种基于本体模型库的新闻推荐方法及装置
CN201610966184.6A Active CN106570144B (zh) 2016-02-05 2016-11-04 推荐信息的方法和装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201610081578.3A Pending CN106095762A (zh) 2016-02-05 2016-02-05 一种基于本体模型库的新闻推荐方法及装置

Country Status (1)

Country Link
CN (2) CN106095762A (zh)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776862B (zh) * 2016-11-28 2021-07-23 北京奇艺世纪科技有限公司 一种游戏视频搜索方法及装置
CN106874345B (zh) * 2016-12-23 2024-02-27 中国科学院自动化研究所 基于规划-目标图的新闻事件信息抽取方法
CN108241621B (zh) * 2016-12-23 2019-12-10 北京国双科技有限公司 法律知识的检索方法及装置
CN106844322A (zh) * 2017-01-22 2017-06-13 百度在线网络技术(北京)有限公司 智能文章生成方法和装置
CN107391549B (zh) * 2017-06-05 2021-06-11 北京百度网讯科技有限公司 基于人工智能的新闻召回方法、装置、设备及存储介质
CN107330007A (zh) * 2017-06-12 2017-11-07 南京邮电大学 一种基于多数据源的本体学习方法
CN107633005B (zh) * 2017-08-09 2020-11-10 广州思涵信息科技有限公司 一种基于课堂教学内容的知识图谱构建、对比系统及方法
CN108121760A (zh) * 2017-11-23 2018-06-05 南京邮电大学 一种面向ogc地理信息服务数据的挖掘分析与推荐方法
CN107895056A (zh) * 2017-12-29 2018-04-10 百度在线网络技术(北京)有限公司 一种信息推荐方法、装置、电子设备和存储介质
CN108268450B (zh) * 2018-02-27 2022-04-22 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN108510110A (zh) * 2018-03-13 2018-09-07 浙江禹控科技有限公司 一种基于知识图谱的水位趋势分析方法
CN108491502B (zh) * 2018-03-21 2022-02-08 腾讯科技(深圳)有限公司 一种新闻追踪的方法、终端、服务器及存储介质
CN108600337A (zh) * 2018-03-30 2018-09-28 上海乂学教育科技有限公司 一种最佳学习内容自动推送方法
CN109145119A (zh) * 2018-07-02 2019-01-04 北京妙医佳信息技术有限公司 健康管理领域的知识图谱构建装置及构建方法
CN109033358B (zh) * 2018-07-26 2022-06-10 李辰洋 新闻聚合与智能实体关联的方法
CN109165350A (zh) * 2018-08-23 2019-01-08 成都品果科技有限公司 一种基于深度知识感知的信息推荐方法和系统
CN109101495A (zh) * 2018-08-27 2018-12-28 上海宝尊电子商务有限公司 一种基于图像识别和知识图谱的时尚领域文本生成方法
CN109285597A (zh) * 2018-10-08 2019-01-29 北京健康有益科技有限公司 一种食疗食谱推荐方法、装置和可读介质
CN109614603A (zh) * 2018-12-12 2019-04-12 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN109635194A (zh) * 2018-12-12 2019-04-16 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN109657043B (zh) * 2018-12-14 2022-01-04 北京百度网讯科技有限公司 自动生成文章的方法、装置、设备及存储介质
CN111353836B (zh) * 2018-12-20 2023-07-07 百度在线网络技术(北京)有限公司 商品推荐方法、装置及设备
CN109977291B (zh) * 2019-03-20 2021-03-02 武汉市软迅科技有限公司 基于物理知识图谱的检索方法、装置、设备及存储介质
CN110162710B (zh) * 2019-05-28 2022-06-21 北京搜狗科技发展有限公司 输入场景下信息推荐方法及装置
CN112035994A (zh) * 2019-06-03 2020-12-04 阿里巴巴集团控股有限公司 智能辅助设计的方法、装置及电子设备
CN110245243B (zh) * 2019-06-20 2022-02-01 北京百度网讯科技有限公司 新闻检索的方法和装置、电子设备、计算机可读介质
CN110427465B (zh) * 2019-08-14 2022-03-04 北京奇艺世纪科技有限公司 一种基于词语知识图谱的内容推荐方法及装置
CN110704743B (zh) * 2019-09-30 2022-02-18 北京科技大学 一种基于知识图谱的语义搜索方法及装置
CN111091454A (zh) * 2019-11-05 2020-05-01 新华智云科技有限公司 一种基于知识图谱的金融舆情推荐方法
CN111125372A (zh) * 2019-12-12 2020-05-08 中汇信息技术(上海)有限公司 文本信息发布方法、装置、可读存储介质和电子设备
CN111291265B (zh) * 2020-02-10 2023-10-03 青岛聚看云科技有限公司 一种推荐信息生成方法及装置
CN113590769B (zh) * 2020-04-30 2024-07-30 阿里巴巴集团控股有限公司 任务驱动型多轮对话系统中的状态追踪方法及装置
CN113761214B (zh) * 2020-06-05 2024-08-27 智慧芽信息科技(苏州)有限公司 一种信息流提取方法、装置及设备
CN112015908A (zh) * 2020-08-19 2020-12-01 新华智云科技有限公司 知识图谱的构建方法及系统、查询方法及系统
CN112559768B (zh) * 2020-12-11 2023-02-17 北京中科汇联科技股份有限公司 一种短文本图谱化及推荐方法
CN113032578B (zh) * 2021-03-23 2022-12-06 平安科技(深圳)有限公司 基于热点事件的信息推送方法、装置及计算机设备
CN118051604B (zh) * 2024-01-09 2024-10-29 海南大学 一种基于知识图谱的推荐新闻方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110070057A (ko) * 2009-12-18 2011-06-24 한국전자통신연구원 자연어 기반 여행 추천 장치 및 방법
CN103455487B (zh) * 2012-05-29 2018-07-06 腾讯科技(深圳)有限公司 一种搜索词的提取方法及装置
CN104573054B (zh) * 2015-01-21 2018-06-01 杭州朗和科技有限公司 一种信息推送方法和设备

Also Published As

Publication number Publication date
CN106570144A (zh) 2017-04-19
CN106095762A (zh) 2016-11-09

Similar Documents

Publication Publication Date Title
CN106570144B (zh) 推荐信息的方法和装置
CN107480549B (zh) 一种面向数据共享的敏感信息脱敏方法及系统
CN108073569B (zh) 一种基于多层级多维度语义理解的法律认知方法、装置和介质
US10109023B2 (en) Social media events detection and verification
US8225371B2 (en) Method and apparatus for creating an information security policy based on a pre-configured template
Ratkiewicz et al. Truthy: mapping the spread of astroturf in microblog streams
CN102171702B (zh) 机密信息的检测
US8402036B2 (en) Phrase based snippet generation
US10437867B2 (en) Scenario generating apparatus and computer program therefor
US20150095320A1 (en) Apparatus, systems and methods for scoring the reliability of online information
US20140013221A1 (en) Method and device for filtering harmful information
CN103577404B (zh) 一种面向微博的全新突发事件发现方法
CN106874253A (zh) 识别敏感信息的方法及装置
US20160379281A1 (en) Compliance violation early warning system
CN105893615B (zh) 基于手机取证数据的机主特征属性挖掘方法及其系统
CN104679825A (zh) 基于网络文本的地震宏观异常信息获取与筛选方法
CN104199938B (zh) 基于rss的农用土地信息发送方法和系统
Petroni et al. An extensible event extraction system with cross-media event resolution
CN106294473B (zh) 一种实体词挖掘方法、信息推荐方法及装置
CN110321707A (zh) 一种基于大数据算法的sql注入检测方法
WO2020155496A1 (zh) 视频文本组合数据的舆情跟踪方法、装置和计算机设备
CN106874448A (zh) 一种从微博中挖掘地震主题词的方法和装置
CN112492606A (zh) 垃圾短信的分类识别方法、装置、计算机设备及存储介质
Aamir et al. Trust in social-sensor cloud service
Wajid et al. Crimestand: Spatial tracking of criminal activity

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 230000 zone B, 19th floor, building A1, 3333 Xiyou Road, hi tech Zone, Hefei City, Anhui Province

Patentee after: Dingfu Intelligent Technology Co., Ltd

Address before: 100089 Haidian District East Road, No. three, floor 6, unit 25,

Patentee before: DINFO (BEIJING) SCIENCE DEVELOPMENT Co.,Ltd.