CN105677640A - 一种面向开放文本的领域概念抽取方法 - Google Patents
一种面向开放文本的领域概念抽取方法 Download PDFInfo
- Publication number
- CN105677640A CN105677640A CN201610011936.3A CN201610011936A CN105677640A CN 105677640 A CN105677640 A CN 105677640A CN 201610011936 A CN201610011936 A CN 201610011936A CN 105677640 A CN105677640 A CN 105677640A
- Authority
- CN
- China
- Prior art keywords
- field
- candidate
- concept
- field concept
- correlation degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
Description
Claims (10)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610011936.3A CN105677640A (zh) | 2016-01-08 | 2016-01-08 | 一种面向开放文本的领域概念抽取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610011936.3A CN105677640A (zh) | 2016-01-08 | 2016-01-08 | 一种面向开放文本的领域概念抽取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105677640A true CN105677640A (zh) | 2016-06-15 |
Family
ID=56299640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610011936.3A Pending CN105677640A (zh) | 2016-01-08 | 2016-01-08 | 一种面向开放文本的领域概念抽取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105677640A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106126505A (zh) * | 2016-06-20 | 2016-11-16 | 清华大学 | 平行短语学习方法及装置 |
CN106407387A (zh) * | 2016-09-18 | 2017-02-15 | 华南师范大学 | 一种针对医疗诊断文本的概念连接方法 |
CN107436922A (zh) * | 2017-07-05 | 2017-12-05 | 北京百度网讯科技有限公司 | 文本标签生成方法和装置 |
CN107844608A (zh) * | 2017-12-06 | 2018-03-27 | 湖南大学 | 一种基于词向量的句子相似度比较方法 |
CN108763348A (zh) * | 2018-05-15 | 2018-11-06 | 南京邮电大学 | 一种扩展短文本词特征向量的分类改进方法 |
CN109726402A (zh) * | 2019-01-11 | 2019-05-07 | 中国电子科技集团公司第七研究所 | 一种文档主题词自动提取方法 |
WO2019119967A1 (zh) * | 2017-12-22 | 2019-06-27 | 齐鲁工业大学 | 基于wikipedia链接结构的中文概念向量生成方法和装置 |
CN110874395A (zh) * | 2019-10-14 | 2020-03-10 | 中国船舶重工集团公司第七0九研究所 | 一种基于上下文相关性的抽象概念实例化方法 |
CN111078885A (zh) * | 2019-12-18 | 2020-04-28 | 腾讯科技(深圳)有限公司 | 一种标签分类的方法、相关装置、设备以及存储介质 |
CN112487267A (zh) * | 2020-12-11 | 2021-03-12 | 北京明略软件系统有限公司 | 基于Word2vec和LPA的领域概念表达方法及系统 |
CN114492425A (zh) * | 2021-12-30 | 2022-05-13 | 中科大数据研究院 | 采用一套领域标签体系将多维度数据打通的方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010038540A1 (ja) * | 2008-10-02 | 2010-04-08 | インターナショナル・ビジネス・マシーンズ・コーポレーション | テキストセグメントを有する文書から用語を抽出するためのシステム |
CN101963989A (zh) * | 2010-09-30 | 2011-02-02 | 大连理工大学 | 提取领域本体概念的词语排除法 |
CN102169495A (zh) * | 2011-04-11 | 2011-08-31 | 趣拿开曼群岛有限公司 | 行业词典生成方法及装置 |
CN102646100A (zh) * | 2011-02-21 | 2012-08-22 | 腾讯科技(深圳)有限公司 | 领域词获取方法及系统 |
-
2016
- 2016-01-08 CN CN201610011936.3A patent/CN105677640A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010038540A1 (ja) * | 2008-10-02 | 2010-04-08 | インターナショナル・ビジネス・マシーンズ・コーポレーション | テキストセグメントを有する文書から用語を抽出するためのシステム |
CN101963989A (zh) * | 2010-09-30 | 2011-02-02 | 大连理工大学 | 提取领域本体概念的词语排除法 |
CN102646100A (zh) * | 2011-02-21 | 2012-08-22 | 腾讯科技(深圳)有限公司 | 领域词获取方法及系统 |
CN102169495A (zh) * | 2011-04-11 | 2011-08-31 | 趣拿开曼群岛有限公司 | 行业词典生成方法及装置 |
Non-Patent Citations (1)
Title |
---|
陈新蕾,等: "基于词向量的开放文本领域概念识别方法", 《山西大学学报(自然科学版)》 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106126505A (zh) * | 2016-06-20 | 2016-11-16 | 清华大学 | 平行短语学习方法及装置 |
CN106126505B (zh) * | 2016-06-20 | 2020-01-31 | 清华大学 | 平行短语学习方法及装置 |
CN106407387A (zh) * | 2016-09-18 | 2017-02-15 | 华南师范大学 | 一种针对医疗诊断文本的概念连接方法 |
CN107436922B (zh) * | 2017-07-05 | 2021-06-08 | 北京百度网讯科技有限公司 | 文本标签生成方法和装置 |
CN107436922A (zh) * | 2017-07-05 | 2017-12-05 | 北京百度网讯科技有限公司 | 文本标签生成方法和装置 |
CN107844608A (zh) * | 2017-12-06 | 2018-03-27 | 湖南大学 | 一种基于词向量的句子相似度比较方法 |
CN107844608B (zh) * | 2017-12-06 | 2021-11-30 | 湖南大学 | 一种基于词向量的句子相似度比较方法 |
WO2019119967A1 (zh) * | 2017-12-22 | 2019-06-27 | 齐鲁工业大学 | 基于wikipedia链接结构的中文概念向量生成方法和装置 |
CN108763348A (zh) * | 2018-05-15 | 2018-11-06 | 南京邮电大学 | 一种扩展短文本词特征向量的分类改进方法 |
CN108763348B (zh) * | 2018-05-15 | 2022-05-03 | 南京邮电大学 | 一种扩展短文本词特征向量的分类改进方法 |
CN109726402A (zh) * | 2019-01-11 | 2019-05-07 | 中国电子科技集团公司第七研究所 | 一种文档主题词自动提取方法 |
CN109726402B (zh) * | 2019-01-11 | 2022-12-23 | 中国电子科技集团公司第七研究所 | 一种文档主题词自动提取方法 |
CN110874395A (zh) * | 2019-10-14 | 2020-03-10 | 中国船舶重工集团公司第七0九研究所 | 一种基于上下文相关性的抽象概念实例化方法 |
CN110874395B (zh) * | 2019-10-14 | 2022-05-31 | 中国船舶重工集团公司第七0九研究所 | 一种基于上下文相关性的抽象概念实例化方法 |
CN111078885A (zh) * | 2019-12-18 | 2020-04-28 | 腾讯科技(深圳)有限公司 | 一种标签分类的方法、相关装置、设备以及存储介质 |
CN111078885B (zh) * | 2019-12-18 | 2023-04-07 | 腾讯科技(深圳)有限公司 | 一种标签分类的方法、相关装置、设备以及存储介质 |
CN112487267A (zh) * | 2020-12-11 | 2021-03-12 | 北京明略软件系统有限公司 | 基于Word2vec和LPA的领域概念表达方法及系统 |
CN112487267B (zh) * | 2020-12-11 | 2024-03-26 | 北京明略软件系统有限公司 | 基于Word2vec和LPA的领域概念表达方法及系统 |
CN114492425A (zh) * | 2021-12-30 | 2022-05-13 | 中科大数据研究院 | 采用一套领域标签体系将多维度数据打通的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105677640A (zh) | 一种面向开放文本的领域概念抽取方法 | |
CN112699246B (zh) | 基于知识图谱的领域知识推送方法 | |
CN103345528B (zh) | 一种基于关联分析和knn的文本分类方法 | |
CN105045875B (zh) | 个性化信息检索方法及装置 | |
CN108287858A (zh) | 自然语言的语义提取方法及装置 | |
CN104199972A (zh) | 一种基于深度学习的命名实体关系抽取与构建方法 | |
CN106126502B (zh) | 一种基于支持向量机的情感分类系统及方法 | |
CN110162591A (zh) | 一种面向数字教育资源的实体对齐方法及系统 | |
CN105975478A (zh) | 一种基于词向量分析的网络文章所属事件的检测方法和装置 | |
CN102722709A (zh) | 一种垃圾图片识别方法和装置 | |
CN107463548A (zh) | 短语挖掘方法及装置 | |
CN105740404A (zh) | 标签关联方法及装置 | |
CN105183715B (zh) | 一种基于词分布和文档特征的垃圾评论自动分类方法 | |
CN110287292B (zh) | 一种裁判量刑偏离度预测方法及装置 | |
CN104881458A (zh) | 一种网页主题的标注方法和装置 | |
CN110457579B (zh) | 基于模板和分类器协同工作的网页去噪方法及系统 | |
US20160170993A1 (en) | System and method for ranking news feeds | |
CN102567494A (zh) | 网站分类方法及装置 | |
CN110287329A (zh) | 一种基于商品文本分类的电商类目属性挖掘方法 | |
CN106875278A (zh) | 基于随机森林的社交网络用户画像方法 | |
CN105550169A (zh) | 一种基于字符长度识别兴趣点名称的方法和装置 | |
CN112836067B (zh) | 基于知识图谱的智能搜索方法 | |
CN104951478A (zh) | 信息处理方法和信息处理装置 | |
CN110110220B (zh) | 融合社交网络和用户评价的推荐模型 | |
CN103488741A (zh) | 一种基于url的中文多语义名词的在线语义挖掘系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information | ||
CB03 | Change of inventor or designer information |
Inventor after: Jia Yantao Inventor after: Chen Xinlei Inventor after: Wang Yuanzhuo Inventor after: Jin Xiaolong Inventor after: Xu Jun Inventor after: Cheng Xueqi Inventor before: Jia Yantao Inventor before: Chen Xinlei Inventor before: Wang Yuanzhuo Inventor before: Xu Jun Inventor before: Cheng Xueqi |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160615 |