CN110598000A - 一种基于深度学习模型的关系抽取及知识图谱构建方法 - Google Patents
一种基于深度学习模型的关系抽取及知识图谱构建方法 Download PDFInfo
- Publication number
- CN110598000A CN110598000A CN201910707194.1A CN201910707194A CN110598000A CN 110598000 A CN110598000 A CN 110598000A CN 201910707194 A CN201910707194 A CN 201910707194A CN 110598000 A CN110598000 A CN 110598000A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- deep learning
- knowledge graph
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 41
- 238000013136 deep learning model Methods 0.000 title claims abstract description 19
- 238000010276 construction Methods 0.000 title claims abstract description 18
- 238000012360 testing method Methods 0.000 claims abstract description 16
- 238000012549 training Methods 0.000 claims abstract description 16
- 238000002372 labelling Methods 0.000 claims abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 7
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000000034 method Methods 0.000 abstract description 5
- 239000007787 solid Substances 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于深度学习模型的关系抽取及知识图谱构建方法,具体包括以下步骤:利用数据标注平台将语料数据处理成标注数据;将标注数据输入深度学习模型进行训练和测试,生成关系抽取模型;将待抽取文本数据输入关系抽取模型,提取出其实体关系对;利用图数据库,构建出待抽取文本的知识图谱。本发明基于BERT模型与双向长短期记忆网络模型及条件随机场算法构建出关系抽取模型,能够准确抽取出实体关系对,且通过对抽取出的实体关系对进行人工排查,确保了进入图数据库的实体关系对的正确性。
Description
技术领域
本发明涉及知识图谱构建技术领域,尤其涉及一种基于深度学习模型的关系抽取及知识图谱构建方法。
背景技术
目前,知识图谱的构建方法根据原始数据来源而异。原始数据来源主要分为三类:结构化数据、半结构化数据和非结构化数据。通常,结构化数据存储在关系型数据库及非关系型数据库中,可以通过D2R技术将结构化数据转化为RDF数据,以完成知识图谱的构建。半结构化数据指的是具有一定的数据结构、需要进一步分析才能获取的数据,比如百科数据、网页数据等。对于这类数据,可以定制化地分析数据结构,采用正则表达式或网页的爬取分析手段,将数据转化为结构化数据,从而形成知识图谱。而对于非结构数据,因为其数据的非结构化,一般不能直接通过简单地分析转化为结构化数据。通常,对于非结构化数据,可以提取出其中的实体,比如人名、地名、组织结构名、时间等,以及各个实体之间的关系,从而尝试着形成知识图谱。
目前知识图谱的构建过程一般为:对原始数据进行预处理,将其转化为结构化数据,再进行实体对齐,知识融合,知识推理等,构建形成一个完整的知识图谱。
目前针对非结构化数据构建知识图谱的理论研究虽然较多,但都没有给出一种真正可以落地的技术手段。
发明内容
有鉴于此,本发明提供了一种基于深度学习模型的关系抽取及知识图谱构建方法,用以解决上述背景技术中存在的问题。
一种基于深度学习模型的关系抽取及知识图谱构建方法,具体包括以下步骤:
S1,利用数据标注平台将语料数据处理成标注数据;
S2,将标注数据作为输入,进行深度学习模型的训练和测试,生成关系抽取模型;
S3,将待抽取文本数据输入关系抽取模型,提取出待抽取文本的实体关系对;
S4,将所述实体关系对导入图数据库,构建出待抽取文本的知识图谱。
优选地,步骤S1中利用数据标注平台将语料数据处理成标注数据的具体步骤为:
S11,通过爬虫系统从互联网中获取网络数据;
S12,将所述网络数据按句子进行切分,形成句子语料集;
S13,利用数据标注平台对句子语料集中的语料数据进行B,I,O标注,形成标注数据。
优选地,所述网络数据为爬虫系统从互联网的不同来源爬取到的多个领域的数据;
获取到网络数据后,按领域类别对网络数据进行人工分类。
优选地,所述网络数据为TXT文本、word文本、PDF文本中的一种或多种格式的非结构化数据。
优选地,所述数据标注平台为网页形式的可视化的数据标注平台。
优选地,步骤S2中生成关系抽取模型的具体步骤为:
S21,从标注数据中获取训练样本和测试样本;
S22,对训练样本进行预处理,将预处理后的数据输入BERT模型进行预训练,得到初始词向量;
S23,采用双向长短期记忆网络模型和条件随机场算法对初始词向量进行训练,直至神经网络收敛,得到初始关系抽取模型;
S24,将测试样本输入初始关系抽取模型进行测试,当测试样本的准确率达到设定值时,得到满足要求的关系抽取模型。
优选地,步骤S3中将待抽取文本数据输入关系抽取模型,提取出待抽取文本的实体关系对的具体步骤为:
S31,将待抽取文本数据切分为若干个句子;
S32,将切分得到的所有句子输入关系抽取模型中,提取出若干对实体关系对;
S33,对提取出的若干对实体关系对进行人工排查,剔除错误的实体关系对。
优选地,所述图数据库采用的是Neo4j图数据库。
本发明的有益效果是:
1、本申请采用的语料数据为各种格式、各种来源的语料,且语料的标注以句子为单位,不受语料格式及内容的限制。
2、本申请的关系抽取模型是基于BERT模型与双向长短期记忆网络模型及条件随机场算法的模型,能够准确抽取出实体关系对,且通过对抽取出的实体关系对进行人工排查,确保了进入图数据库的实体关系对的正确性,同时有丰富的可视化展示,能有效提升知识图谱的趣味性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明的结构示意图。
具体实施方式
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
下面通过具体的实施例并结合附图对本申请做进一步的详细描述。
一种基于深度学习模型的关系抽取及知识图谱构建方法,具体包括以下步骤:
S1,利用数据标注平台将语料数据处理成标注数据。
具体地,利用数据标注平台将语料数据处理成标注数据的步骤为:
S11,通过爬虫系统从互联网中获取网络数据;
网络数据可以为爬虫系统从新闻网站、贴吧、博客、小说网站等不同来源爬取到的多个领域的数据,比如新闻、体育、财经、科技、文学等领域的数据。
所述网络数据为TXT文本、word文本、PDF文本中的一种或多种格式的非结构化数据。
爬虫系统爬取到网络数据后,需要人工按领域类别对网络数据进行分类。
S12,将所述网络数据按句子进行切分,形成句子语料集,并将句子语料集中的数据存储在数据库中。
S13,将句子语料集中的语料数据输入数据标注平台,采用BIO标注方式手动标注出每个句子中的主语、谓语、宾语,数据标注平台输出每个句子的实体关系,形成标注数据,并将标注数据存储在相应的数据库中。通常一个句子中可能会存在多个主语、谓语、宾语,数据标注平台会将最邻近的主语、谓语、宾语作为一个三元组进行输出。
所述数据标注平台可以是以网页形式重新搭建而成的可视化的数据标注平台,也可以采用目前市场中现有的数据标注平台。数据标注平台可以对TXT、word、PDF等格式的文本进行标注。
S2,将标注数据作为输入,进行深度学习模型的训练和测试,生成关系抽取模型。
具体地,生成关系抽取模型的具体步骤为:
S21,从标注数据中获取训练样本和测试样本。
S22,对训练样本进行预处理,如去掉无关词语及句子、标点符号,将繁体文字转化为简体文字等,将预处理后的数据输入BERT模型进行预训练,得到初始词向量,形成模型的Embedding层。
S23,在Embedding层的基础上,采用双向长短期记忆网络模型和条件随机场算法(即BiLSTM+CRF结构)对初始词向量进行训练,直至神经网络收敛,得到初始关系抽取模型;
S24,将测试样本输入初始关系抽取模型进行测试,当测试样本的准确率达到设定值时,即得到满足要求的关系抽取模型。
S3,将待抽取文本数据输入关系抽取模型,提取出待抽取文本的实体关系对。
具体地,提取待抽取文本的实体关系对的步骤为:
S31,将待抽取文本数据切分为若干个句子;
S32,将切分得到的所有句子输入关系抽取模型中,得到每个句子中的主语、谓语、宾语,提取出若干对实体关系对;
S33,对提取出的若干对实体关系对进行人工排查,剔除错误或有疑问的实体关系对,以确保进入图数据库的实体关系对的准确性。
S4,将人工排查后的实体关系对导入图数据库,构建出待抽取文本的知识图谱。本实施例中,图数据库采用的是Neo4j图数据库。
提取出的知识图谱,可以进行一系列的应用,如人物关系分析,智能问答等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (8)
1.一种基于深度学习模型的关系抽取及知识图谱构建方法,其特征在于,具体包括以下步骤:
S1,利用数据标注平台将语料数据处理成标注数据;
S2,将标注数据作为输入,进行深度学习模型的训练和测试,生成关系抽取模型;
S3,将待抽取文本数据输入关系抽取模型,提取出待抽取文本的实体关系对;
S4,将所述实体关系对导入图数据库,构建出待抽取文本的知识图谱。
2.根据权利要求1所述的基于深度学习模型的关系抽取及知识图谱构建方法,其特征在于,步骤S1中利用数据标注平台将语料数据处理成标注数据的具体步骤为:
S11,通过爬虫系统从互联网中获取网络数据;
S12,将所述网络数据按句子进行切分,形成句子语料集;
S13,利用数据标注平台对句子语料集中的语料数据进行B,I,O标注,形成标注数据。
3.根据权利要求2所述的基于深度学习模型的关系抽取及知识图谱构建方法,其特征在于,所述网络数据为爬虫系统从互联网的不同来源爬取到的多个领域的数据;
获取到网络数据后,按领域类别对网络数据进行人工分类。
4.根据权利要求3所述的基于深度学习模型的关系抽取及知识图谱构建方法,其特征在于,所述网络数据为TXT文本、word文本、PDF文本中的一种或多种格式的非结构化数据。
5.根据权利要求2所述的基于深度学习模型的关系抽取及知识图谱构建方法,其特征在于,所述数据标注平台为网页形式的可视化的数据标注平台。
6.根据权利要求1所述的基于深度学习模型的关系抽取及知识图谱构建方法,其特征在于,步骤S2中生成关系抽取模型的具体步骤为:
S21,从标注数据中获取训练样本和测试样本;
S22,对训练样本进行预处理,将预处理后的数据输入BERT模型进行预训练,得到初始词向量;
S23,采用双向长短期记忆网络模型和条件随机场算法对初始词向量进行训练,直至神经网络收敛,得到初始关系抽取模型;
S24,将测试样本输入初始关系抽取模型进行测试,当测试样本的准确率达到设定值时,得到满足要求的关系抽取模型。
7.根据权利要求1所述的基于深度学习模型的关系抽取及知识图谱构建方法,其特征在于,步骤S3中将待抽取文本数据输入关系抽取模型,提取出待抽取文本的实体关系对的具体步骤为:
S31,将待抽取文本数据切分为若干个句子;
S32,将切分得到的所有句子输入关系抽取模型中,提取出若干对实体关系对;
S33,对提取出的若干对实体关系对进行人工排查,剔除错误的实体关系对。
8.根据权利要求1所述的基于深度学习模型的关系抽取及知识图谱构建方法,其特征在于,所述图数据库采用的是Neo4j图数据库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910707194.1A CN110598000B (zh) | 2019-08-01 | 2019-08-01 | 一种基于深度学习模型的关系抽取及知识图谱构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910707194.1A CN110598000B (zh) | 2019-08-01 | 2019-08-01 | 一种基于深度学习模型的关系抽取及知识图谱构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110598000A true CN110598000A (zh) | 2019-12-20 |
CN110598000B CN110598000B (zh) | 2023-06-09 |
Family
ID=68853349
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910707194.1A Active CN110598000B (zh) | 2019-08-01 | 2019-08-01 | 一种基于深度学习模型的关系抽取及知识图谱构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110598000B (zh) |
Cited By (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111339318A (zh) * | 2020-02-29 | 2020-06-26 | 西安理工大学 | 基于深度学习的大学计算机基础知识图谱构建方法 |
CN111368091A (zh) * | 2020-02-13 | 2020-07-03 | 中国工商银行股份有限公司 | 文档翻译方法及装置 |
CN111444704A (zh) * | 2020-03-27 | 2020-07-24 | 中南大学 | 基于深度神经网络的网络安全关键词抽取方法 |
CN111444353A (zh) * | 2020-04-03 | 2020-07-24 | 杭州叙简科技股份有限公司 | 一种警情知识图谱的构建及使用方法 |
CN111538849A (zh) * | 2020-04-29 | 2020-08-14 | 华中科技大学 | 一种基于深度学习的人物关系图谱构建方法及系统 |
CN111581376A (zh) * | 2020-04-17 | 2020-08-25 | 中国船舶重工集团公司第七一四研究所 | 一种知识图谱自动构建系统及方法 |
CN111753021A (zh) * | 2020-06-17 | 2020-10-09 | 第四范式(北京)技术有限公司 | 构建知识图谱的方法、装置、设备和可读存储介质 |
CN111753022A (zh) * | 2020-06-17 | 2020-10-09 | 第四范式(北京)技术有限公司 | 构建知识图谱的方法、装置、设备和可读存储介质 |
CN111814476A (zh) * | 2020-06-09 | 2020-10-23 | 北京捷通华声科技股份有限公司 | 一种实体关系的抽取方法和装置 |
CN111859922A (zh) * | 2020-07-31 | 2020-10-30 | 上海银行股份有限公司 | 实体关系抽取技术在银行风控中的应用方法 |
CN111931483A (zh) * | 2020-06-22 | 2020-11-13 | 中国电力科学研究院有限公司 | 一种用于电力设备信息结构化的提取方法及装置 |
CN111984770A (zh) * | 2020-07-17 | 2020-11-24 | 深思考人工智能科技(上海)有限公司 | 一种人机对话的方法及装置 |
CN112036570A (zh) * | 2020-07-30 | 2020-12-04 | 第四范式(北京)技术有限公司 | 标注任务的调度方法、装置和可读存储介质 |
CN112149423A (zh) * | 2020-10-16 | 2020-12-29 | 中国农业科学院农业信息研究所 | 一种面向领域实体关系联合抽取的语料标注方法及系统 |
CN112163097A (zh) * | 2020-09-23 | 2021-01-01 | 中国电子科技集团公司第十五研究所 | 一种军事知识图谱构建方法及系统 |
CN112308492A (zh) * | 2020-11-10 | 2021-02-02 | 济南浪潮高新科技投资发展有限公司 | 基于深度学习与知识图谱融合的仓库管理方法及系统 |
CN112365171A (zh) * | 2020-11-16 | 2021-02-12 | 广州杰赛科技股份有限公司 | 基于知识图谱的风险预测方法、装置、设备及存储介质 |
CN112613315A (zh) * | 2020-12-29 | 2021-04-06 | 重庆农村商业银行股份有限公司 | 一种文本知识自动抽取方法、装置、设备及存储介质 |
CN112818138A (zh) * | 2021-04-19 | 2021-05-18 | 中译语通科技股份有限公司 | 知识图谱本体构建方法、装置、终端设备及可读存储介质 |
CN112966053A (zh) * | 2020-09-18 | 2021-06-15 | 青岛海洋科学与技术国家实验室发展中心 | 一种基于知识图谱的海洋领域专家库构建方法及装置 |
CN113128227A (zh) * | 2020-01-14 | 2021-07-16 | 普天信息技术有限公司 | 实体抽取方法及装置 |
CN113220871A (zh) * | 2021-05-31 | 2021-08-06 | 北京语言大学 | 一种基于深度学习的文学人物关系识别方法 |
CN113254667A (zh) * | 2021-06-07 | 2021-08-13 | 成都工物科云科技有限公司 | 基于深度学习模型的科技人物知识图谱构建方法、装置及终端 |
CN113360678A (zh) * | 2021-07-08 | 2021-09-07 | 电子科技大学 | 一种基于Neo4j和大数据的初等数学知识图谱构建方法 |
CN113449915A (zh) * | 2021-06-28 | 2021-09-28 | 中国电子科技集团公司第二十八研究所 | 一种基于知识图谱的航班延误预测方法 |
CN113468335A (zh) * | 2020-03-30 | 2021-10-01 | 海信集团有限公司 | 实体隐含关系抽取方法及设备 |
CN113571184A (zh) * | 2021-07-20 | 2021-10-29 | 武汉情智感知科技有限公司 | 一种用于精神健康测评的对话交互设计方法及系统 |
CN113609305A (zh) * | 2021-07-27 | 2021-11-05 | 三峡大学 | 基于bert的影视作品地域知识图谱构建方法及系统 |
WO2021254457A1 (zh) * | 2020-06-17 | 2021-12-23 | 第四范式(北京)技术有限公司 | 构建知识图谱的方法及装置、计算机装置及存储介质 |
CN114169522A (zh) * | 2021-12-13 | 2022-03-11 | 福州数据技术研究院有限公司 | 一种实体关系联合抽取方法和存储设备 |
CN114218333A (zh) * | 2021-11-26 | 2022-03-22 | 西南交通大学 | 一种地质知识图谱构建方法、装置、电子设备及存储介质 |
CN114385809A (zh) * | 2020-10-22 | 2022-04-22 | 中移(成都)信息通信科技有限公司 | 实体文本提取模型的训练方法、装置及设备 |
CN114398492A (zh) * | 2021-12-24 | 2022-04-26 | 森纵艾数(北京)科技有限公司 | 一种在数字领域的知识图谱构建方法、终端及介质 |
CN114398498A (zh) * | 2022-01-21 | 2022-04-26 | 中国电子科技集团公司第十研究所 | 一种科技档案知识图谱构建方法及系统 |
CN114579541A (zh) * | 2022-03-11 | 2022-06-03 | 复旦大学附属金山医院(上海市金山区眼病防治所、上海市金山区核化伤害应急救治中心) | 一种智能化急救平台数据库及其建立方法 |
CN114595459A (zh) * | 2021-12-22 | 2022-06-07 | 中电信数智科技有限公司 | 基于深度学习的问题整改建议生成方法 |
CN114637846A (zh) * | 2022-03-11 | 2022-06-17 | 游密科技(深圳)有限公司 | 视频数据处理方法、装置、计算机设备和存储介质 |
CN114723059A (zh) * | 2022-06-07 | 2022-07-08 | 达而观数据(成都)有限公司 | 基于知识推理的故障归因系统及方法 |
CN115495593A (zh) * | 2022-10-13 | 2022-12-20 | 中原工学院 | 基于大数据的数学知识图谱构建方法 |
CN115510245A (zh) * | 2022-10-14 | 2022-12-23 | 北京理工大学 | 一种面向非结构化数据的领域知识抽取方法 |
US11669680B2 (en) | 2021-02-02 | 2023-06-06 | International Business Machines Corporation | Automated graph based information extraction |
CN116975313A (zh) * | 2023-09-25 | 2023-10-31 | 国网江苏省电力有限公司电力科学研究院 | 一种基于电力物资语料的语义标签生成方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018072563A1 (zh) * | 2016-10-18 | 2018-04-26 | 中兴通讯股份有限公司 | 一种知识图谱构建方法、装置及系统 |
CN109271529A (zh) * | 2018-10-10 | 2019-01-25 | 内蒙古大学 | 西里尔蒙古文和传统蒙古文双文种知识图谱构建方法 |
CN109871451A (zh) * | 2019-01-25 | 2019-06-11 | 中译语通科技股份有限公司 | 一种融入动态词向量的关系抽取方法和系统 |
-
2019
- 2019-08-01 CN CN201910707194.1A patent/CN110598000B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018072563A1 (zh) * | 2016-10-18 | 2018-04-26 | 中兴通讯股份有限公司 | 一种知识图谱构建方法、装置及系统 |
CN109271529A (zh) * | 2018-10-10 | 2019-01-25 | 内蒙古大学 | 西里尔蒙古文和传统蒙古文双文种知识图谱构建方法 |
CN109871451A (zh) * | 2019-01-25 | 2019-06-11 | 中译语通科技股份有限公司 | 一种融入动态词向量的关系抽取方法和系统 |
Non-Patent Citations (1)
Title |
---|
曹夏琳等: "国外数字故事研究分析――基于CiteSpace的可视化分析", 《电脑知识与技术》 * |
Cited By (66)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113128227A (zh) * | 2020-01-14 | 2021-07-16 | 普天信息技术有限公司 | 实体抽取方法及装置 |
CN111368091A (zh) * | 2020-02-13 | 2020-07-03 | 中国工商银行股份有限公司 | 文档翻译方法及装置 |
CN111368091B (zh) * | 2020-02-13 | 2023-09-22 | 中国工商银行股份有限公司 | 文档翻译方法及装置 |
CN111339318A (zh) * | 2020-02-29 | 2020-06-26 | 西安理工大学 | 基于深度学习的大学计算机基础知识图谱构建方法 |
CN111444704B (zh) * | 2020-03-27 | 2023-09-19 | 中南大学 | 基于深度神经网络的网络安全关键词抽取方法 |
CN111444704A (zh) * | 2020-03-27 | 2020-07-24 | 中南大学 | 基于深度神经网络的网络安全关键词抽取方法 |
CN113468335A (zh) * | 2020-03-30 | 2021-10-01 | 海信集团有限公司 | 实体隐含关系抽取方法及设备 |
CN111444353A (zh) * | 2020-04-03 | 2020-07-24 | 杭州叙简科技股份有限公司 | 一种警情知识图谱的构建及使用方法 |
CN111444353B (zh) * | 2020-04-03 | 2023-02-28 | 杭州叙简科技股份有限公司 | 一种警情知识图谱的构建及使用方法 |
CN111581376A (zh) * | 2020-04-17 | 2020-08-25 | 中国船舶重工集团公司第七一四研究所 | 一种知识图谱自动构建系统及方法 |
CN111581376B (zh) * | 2020-04-17 | 2024-04-19 | 中国船舶重工集团公司第七一四研究所 | 一种知识图谱自动构建系统及方法 |
CN111538849B (zh) * | 2020-04-29 | 2023-04-07 | 华中科技大学 | 一种基于深度学习的人物关系图谱构建方法及系统 |
CN111538849A (zh) * | 2020-04-29 | 2020-08-14 | 华中科技大学 | 一种基于深度学习的人物关系图谱构建方法及系统 |
CN111814476A (zh) * | 2020-06-09 | 2020-10-23 | 北京捷通华声科技股份有限公司 | 一种实体关系的抽取方法和装置 |
CN111814476B (zh) * | 2020-06-09 | 2024-04-16 | 北京捷通华声科技股份有限公司 | 一种实体关系的抽取方法和装置 |
EP4170520A4 (en) * | 2020-06-17 | 2023-11-29 | The 4th Paradigm Technology Co., Ltd | METHOD AND DEVICE FOR CONSTRUCTING A KNOWLEDGE GRAPH, COMPUTER DEVICE AND STORAGE MEDIUM |
CN111753021A (zh) * | 2020-06-17 | 2020-10-09 | 第四范式(北京)技术有限公司 | 构建知识图谱的方法、装置、设备和可读存储介质 |
CN111753022A (zh) * | 2020-06-17 | 2020-10-09 | 第四范式(北京)技术有限公司 | 构建知识图谱的方法、装置、设备和可读存储介质 |
WO2021254457A1 (zh) * | 2020-06-17 | 2021-12-23 | 第四范式(北京)技术有限公司 | 构建知识图谱的方法及装置、计算机装置及存储介质 |
CN111931483A (zh) * | 2020-06-22 | 2020-11-13 | 中国电力科学研究院有限公司 | 一种用于电力设备信息结构化的提取方法及装置 |
CN111984770B (zh) * | 2020-07-17 | 2023-10-20 | 深思考人工智能科技(上海)有限公司 | 一种人机对话的方法及装置 |
CN111984770A (zh) * | 2020-07-17 | 2020-11-24 | 深思考人工智能科技(上海)有限公司 | 一种人机对话的方法及装置 |
CN112036570A (zh) * | 2020-07-30 | 2020-12-04 | 第四范式(北京)技术有限公司 | 标注任务的调度方法、装置和可读存储介质 |
CN112036570B (zh) * | 2020-07-30 | 2024-07-26 | 第四范式(北京)技术有限公司 | 标注任务的调度方法、装置和可读存储介质 |
CN111859922B (zh) * | 2020-07-31 | 2023-12-01 | 上海银行股份有限公司 | 实体关系抽取技术在银行风控中的应用方法 |
CN111859922A (zh) * | 2020-07-31 | 2020-10-30 | 上海银行股份有限公司 | 实体关系抽取技术在银行风控中的应用方法 |
CN112966053A (zh) * | 2020-09-18 | 2021-06-15 | 青岛海洋科学与技术国家实验室发展中心 | 一种基于知识图谱的海洋领域专家库构建方法及装置 |
CN112966053B (zh) * | 2020-09-18 | 2023-04-18 | 青岛海洋科学与技术国家实验室发展中心 | 一种基于知识图谱的海洋领域专家库构建方法及装置 |
CN112163097A (zh) * | 2020-09-23 | 2021-01-01 | 中国电子科技集团公司第十五研究所 | 一种军事知识图谱构建方法及系统 |
CN112149423B (zh) * | 2020-10-16 | 2024-01-26 | 中国农业科学院农业信息研究所 | 一种面向领域实体关系联合抽取的语料标注方法及系统 |
CN112149423A (zh) * | 2020-10-16 | 2020-12-29 | 中国农业科学院农业信息研究所 | 一种面向领域实体关系联合抽取的语料标注方法及系统 |
CN114385809A (zh) * | 2020-10-22 | 2022-04-22 | 中移(成都)信息通信科技有限公司 | 实体文本提取模型的训练方法、装置及设备 |
CN112308492A (zh) * | 2020-11-10 | 2021-02-02 | 济南浪潮高新科技投资发展有限公司 | 基于深度学习与知识图谱融合的仓库管理方法及系统 |
CN112365171A (zh) * | 2020-11-16 | 2021-02-12 | 广州杰赛科技股份有限公司 | 基于知识图谱的风险预测方法、装置、设备及存储介质 |
CN112365171B (zh) * | 2020-11-16 | 2024-02-09 | 广州杰赛科技股份有限公司 | 基于知识图谱的风险预测方法、装置、设备及存储介质 |
CN112613315A (zh) * | 2020-12-29 | 2021-04-06 | 重庆农村商业银行股份有限公司 | 一种文本知识自动抽取方法、装置、设备及存储介质 |
CN112613315B (zh) * | 2020-12-29 | 2024-06-07 | 重庆农村商业银行股份有限公司 | 一种文本知识自动抽取方法、装置、设备及存储介质 |
US11669680B2 (en) | 2021-02-02 | 2023-06-06 | International Business Machines Corporation | Automated graph based information extraction |
CN112818138A (zh) * | 2021-04-19 | 2021-05-18 | 中译语通科技股份有限公司 | 知识图谱本体构建方法、装置、终端设备及可读存储介质 |
CN113220871A (zh) * | 2021-05-31 | 2021-08-06 | 北京语言大学 | 一种基于深度学习的文学人物关系识别方法 |
CN113220871B (zh) * | 2021-05-31 | 2023-10-20 | 山东外国语职业技术大学 | 一种基于深度学习的文学人物关系识别方法 |
CN113254667A (zh) * | 2021-06-07 | 2021-08-13 | 成都工物科云科技有限公司 | 基于深度学习模型的科技人物知识图谱构建方法、装置及终端 |
CN113449915B (zh) * | 2021-06-28 | 2023-10-27 | 中国电子科技集团公司第二十八研究所 | 一种基于知识图谱的航班延误预测方法 |
CN113449915A (zh) * | 2021-06-28 | 2021-09-28 | 中国电子科技集团公司第二十八研究所 | 一种基于知识图谱的航班延误预测方法 |
CN113360678B (zh) * | 2021-07-08 | 2022-07-15 | 电子科技大学 | 一种基于Neo4j和大数据的初等数学知识图谱构建方法 |
CN113360678A (zh) * | 2021-07-08 | 2021-09-07 | 电子科技大学 | 一种基于Neo4j和大数据的初等数学知识图谱构建方法 |
CN113571184B (zh) * | 2021-07-20 | 2023-10-31 | 武汉情智感知科技有限公司 | 一种用于精神健康测评的对话交互设计方法及系统 |
CN113571184A (zh) * | 2021-07-20 | 2021-10-29 | 武汉情智感知科技有限公司 | 一种用于精神健康测评的对话交互设计方法及系统 |
CN113609305B (zh) * | 2021-07-27 | 2024-04-26 | 三峡大学 | 基于bert的影视作品地域知识图谱构建方法及系统 |
CN113609305A (zh) * | 2021-07-27 | 2021-11-05 | 三峡大学 | 基于bert的影视作品地域知识图谱构建方法及系统 |
CN114218333A (zh) * | 2021-11-26 | 2022-03-22 | 西南交通大学 | 一种地质知识图谱构建方法、装置、电子设备及存储介质 |
CN114169522A (zh) * | 2021-12-13 | 2022-03-11 | 福州数据技术研究院有限公司 | 一种实体关系联合抽取方法和存储设备 |
CN114595459A (zh) * | 2021-12-22 | 2022-06-07 | 中电信数智科技有限公司 | 基于深度学习的问题整改建议生成方法 |
CN114595459B (zh) * | 2021-12-22 | 2022-08-16 | 中电信数智科技有限公司 | 基于深度学习的问题整改建议生成方法 |
CN114398492B (zh) * | 2021-12-24 | 2022-08-30 | 森纵艾数(北京)科技有限公司 | 一种在数字领域的知识图谱构建方法、终端及介质 |
CN114398492A (zh) * | 2021-12-24 | 2022-04-26 | 森纵艾数(北京)科技有限公司 | 一种在数字领域的知识图谱构建方法、终端及介质 |
CN114398498A (zh) * | 2022-01-21 | 2022-04-26 | 中国电子科技集团公司第十研究所 | 一种科技档案知识图谱构建方法及系统 |
CN114637846A (zh) * | 2022-03-11 | 2022-06-17 | 游密科技(深圳)有限公司 | 视频数据处理方法、装置、计算机设备和存储介质 |
CN114579541A (zh) * | 2022-03-11 | 2022-06-03 | 复旦大学附属金山医院(上海市金山区眼病防治所、上海市金山区核化伤害应急救治中心) | 一种智能化急救平台数据库及其建立方法 |
CN114723059A (zh) * | 2022-06-07 | 2022-07-08 | 达而观数据(成都)有限公司 | 基于知识推理的故障归因系统及方法 |
CN115495593A (zh) * | 2022-10-13 | 2022-12-20 | 中原工学院 | 基于大数据的数学知识图谱构建方法 |
CN115495593B (zh) * | 2022-10-13 | 2023-08-01 | 中原工学院 | 基于大数据的数学知识图谱构建方法 |
CN115510245A (zh) * | 2022-10-14 | 2022-12-23 | 北京理工大学 | 一种面向非结构化数据的领域知识抽取方法 |
CN115510245B (zh) * | 2022-10-14 | 2024-05-14 | 北京理工大学 | 一种面向非结构化数据的领域知识抽取方法 |
CN116975313B (zh) * | 2023-09-25 | 2023-12-05 | 国网江苏省电力有限公司电力科学研究院 | 一种基于电力物资语料的语义标签生成方法和装置 |
CN116975313A (zh) * | 2023-09-25 | 2023-10-31 | 国网江苏省电力有限公司电力科学研究院 | 一种基于电力物资语料的语义标签生成方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110598000B (zh) | 2023-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110598000B (zh) | 一种基于深度学习模型的关系抽取及知识图谱构建方法 | |
CN110287334B (zh) | 一种基于实体识别和属性抽取模型的学校领域知识图谱构建方法 | |
CN106874378B (zh) | 基于规则模型的实体抽取与关系挖掘构建知识图谱的方法 | |
CN111104789B (zh) | 文本评分方法、装置和系统 | |
CN106776711B (zh) | 一种基于深度学习的中文医学知识图谱构建方法 | |
WO2021114745A1 (zh) | 一种基于词缀感知的社交媒体命名实体识别方法 | |
US8301438B2 (en) | Method for processing natural language questions and apparatus thereof | |
CN113806563B (zh) | 面向多源异构建筑人文史料的建筑师知识图谱构建方法 | |
CN111581376B (zh) | 一种知识图谱自动构建系统及方法 | |
Gómez-Adorno et al. | Automatic authorship detection using textual patterns extracted from integrated syntactic graphs | |
CN110609983B (zh) | 一种政策文件结构化分解方法 | |
Chan et al. | Reproducible extraction of cross-lingual topics (rectr) | |
US20190171713A1 (en) | Semantic parsing method and apparatus | |
CN116561538A (zh) | 问答评分方法、问答评分装置、电子设备及存储介质 | |
CN114818717A (zh) | 融合词汇和句法信息的中文命名实体识别方法及系统 | |
CN111813874B (zh) | 太赫兹知识图谱构建方法及系统 | |
Kudi et al. | Online Examination with short text matching | |
CN115270746A (zh) | 问题样本生成方法和装置、电子设备及存储介质 | |
Barkschat | Semantic information extraction on domain specific data sheets | |
CN112241446A (zh) | 一种大数据下基于学生画像的精准资助系统 | |
He et al. | [Retracted] Application of Grammar Error Detection Method for English Composition Based on Machine Learning | |
CN114398492B (zh) | 一种在数字领域的知识图谱构建方法、终端及介质 | |
CN113609312A (zh) | 一种基于特征评估和关键词相似度的地理文本语料标注方法 | |
CN114897038B (zh) | 目标词语的检测方法、装置、电子设备及存储介质 | |
Yu | Research on Retrieval Method of Online English Grammar Questions Based on Natural Language Processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: Room 501, 502, and 503, No. 66 Boxia Road, Pudong New Area, Shanghai, March 2012 Patentee after: Daguan Data Co.,Ltd. Country or region after: China Address before: 201203 rooms 301, 303 and 304, block B, 112 liangxiu Road, Pudong New Area, Shanghai Patentee before: DATAGRAND INFORMATION TECHNOLOGY (SHANGHAI) Co.,Ltd. Country or region before: China |