CN102033950A - 电子产品命名实体自动识别系统的构建方法及识别方法 - Google Patents
电子产品命名实体自动识别系统的构建方法及识别方法 Download PDFInfo
- Publication number
- CN102033950A CN102033950A CN 201010602773 CN201010602773A CN102033950A CN 102033950 A CN102033950 A CN 102033950A CN 201010602773 CN201010602773 CN 201010602773 CN 201010602773 A CN201010602773 A CN 201010602773A CN 102033950 A CN102033950 A CN 102033950A
- Authority
- CN
- China
- Prior art keywords
- electronic product
- named entity
- product named
- identification
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
电子产品命名实体自动识别系统的构建方法及识别方法,本发明涉及自然语言处理中的命名实体识别系统的构建方法和识别方法,属于从相关信息中把电子产品的名称进行自动识别的技术。用于电子产品的名称识别。它解决了基于规则的识别系统在识别时召回率较低,而基于机器学习的识别系统识别时需要人工标注大量训练语料的问题。构建方法包括下述步骤:形成原始语料的知识库;构建一个标注语料库;基于条件随机域方法进行电子产品命名实体识别。识别方法包括下述步骤:把自由文本输入电子产品命名实体自动识别系统;系统首先利用特征模板提取特征,然后利用条件随机域模型得到每个特征对应的权重,把这些权重利用条件随机域方法进行运算得到识别结果。
Description
技术领域
本发明涉及自然语言处理中的命名实体识别系统的构建方法和识别方法,属于从相关信息中把电子产品的名称进行自动识别的技术。
背景技术
客观存在并可相互区别的事物称之为实体。实体可以是具体的人、事和物,也可以是抽象的概念或联系。命名实体识别任务是指识别文本中具有特定意义的实体。随着人类社会步入数字时代,越来越多的电子产品进入到了人们的生活中。关于电子产品的各种报道大量出现在电子文档中。互联网上更是充满了关于电子产品的广告、使用方法和用户评论。电子产品命名实体识别技术可以帮助人们更好的查询和管理自己感兴趣的电子产品信息,帮助企业更快地发现互联网上用户对自己产品的反馈以及更准确地投递广告,因此这项技术越来越受到工业界和学术界的关注。
目前的命名实体识别技术主要针对新闻语料中的人名、地名、机构名等这些传统命名实体。主要的技术可以分为两类:基于规则的技术和基于机器学习的技术。基于规则的技术主要利用命名实体的构成规则,采用人工构建知识库和规则库的方式来进行实体识别,这种技术准确率较高,但是召回率较低,而且很难移植。基于机器学习的技术主要采用机器学习算法和上下文特征来进行实体识别,其中比较重要的识别算法包括隐马尔科夫模型、最大熵模型、支持向量机模型、决策树模型等。这类方法需要人工标注大量训练语料,对于缺少标注语料的电子产品命名实体通常效果很差。
与传统的命名实体相比,电子产品命名实体具有如下特点:1)更新变化更快;2)构成复杂,并且通常混杂有大量的数字与跨语言字符;3)缺乏规范和标注语料。目前国内外对于电子产品命名实体识别的研究尚处于起步阶段,对电子产品命名实体的定义各执一词。而相应的识别方法也主要集中于直接套用传统的命名实体识别技术,缺乏针对性,因此识别准确率和召回率都难以达到实用水平。
发明内容
本发明的目的是提供一种电子产品命名实体自动识别系统的构建方法,以解决基于规则的识别系统在识别时召回率较低,而基于机器学习的识别系统识别时需要人工标注大量训练语料的问题。
它包括下述步骤:一、利用下载软件从互联网中收集多种体裁的电子产品网页信息,提取出网页信息的正文,从而形成原始语料的知识库;使用分词词性标注工具,对原始语料进行分词和词性标注处理,之后按照电子产品命名实体的定义,对分词和词性标注后的语料进行实体标注,构建一个标注语料库;所述对电子产品命名实体的定义是指按照一个电子产品命名实体的品牌名、系列名和型号三部分区分出电子产品命名实体;二、基于条件随机域方法,定义多个特征模板,特征模板利用标注语料和知识库具体化出特征,条件随机域方法在标注语料库上的运算结果可以为每个特征赋予一定的权重,特征和其对应的权重构成的条件随机域模型就能用来进行电子产品命名实体识别。
本发明还提供基于上述电子产品命名实体自动识别系统的识别方法,它包括下述步骤:一、把用于识别的自由文本输入所述电子产品命名实体自动识别系统;二、系统首先利用特征模板提取特征,然后利用条件随机域模型得到每个特征对应的权重,把这些权重利用条件随机域方法进行运算就得到最终的识别结果。
本发明的方法使用分词词性标注工具来对互联网中收集的电子产品网页信息进行处理,避免了由人工标注大量训练语料,基于条件随机域方法和知识库、标注语料库来处理自由文本,因此识别系统在识别时召回率高。本发明的方法可以有效地管理和组织互联网上海量的商务信息,提高人们查找、管理和利用信息的效率。本发明利用电子产品命名实体的构成规律,针对产品类命名实体变化快、形式多样化的特点,提出了基于知识库的条件随机域模型的电子产品命名实体识别方法,并实现了相应的系统,系统识别的准确率和召回率均达到86%以上。
附图说明
图1是本发明实施方式五的流程示意图,图2是实施方式五中一个识别的举例示意图。
具体实施方式
具体实施方式一:本实施方式的电子产品命名实体自动识别系统的构建方法包括下述步骤:一、利用下载软件从互联网中收集多种体裁的电子产品网页信息,提取出网页信息的正文,从而形成原始语料的知识库;使用分词词性标注工具,对原始语料进行分词(把句子中的词与词间拆分开)和词性标注处理(标注每个词的词性),之后按照电子产品命名实体的定义,对分词和词性标注后的语料进行实体标注,构建一个标注语料库;所述对电子产品命名实体的定义是指按照一个电子产品命名实体的品牌名、系列名和型号三部分区分出电子产品命名实体;二、基于条件随机域方法,定义多个特征模板,特征模板利用标注语料和知识库具体化出特征,条件随机域方法在标注语料库上的运算结果可以为每个特征赋予一定的权重,特征和其对应的权重构成的条件随机域模型就可以用来进行电子产品命名实体识别。
具体实施方式二:本实施方式与实施方式一的不同点是:知识库中的资源均是利用网络爬虫技术和信息抽取技术从互联网上自动获取的;所述知识库包括:针对电子产品具有品牌信息特性所构造的品牌名词典;针对一个品牌下的电子产品有系列之分所构造的系列名词典;或针对一些具有特定意义的短语所构造的特定词语知识库。
具体实施方式三:本实施方式的基于实施方式一的电子产品命名实体自动识别系统的识别方法,它包括下述步骤:一、把用于识别的自由文本输入所述电子产品命名实体自动识别系统;二、系统首先利用特征模板提取特征,然后利用条件随机域模型得到每个特征对应的权重,把这些权重利用条件随机域方法进行运算就得到最终的识别结果。
具体实施方式四:本实施方式与实施方式三的不同点是:它还包括步骤三、采用规则修正方法对识别后的电子产品命名实体进行修正,所述修正规则是通过基于错误驱动的方法获得的。
具体实施方式五:下面结合图1和图2,对本发明技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本实施例提供一种电子产品命名实体自动识别的方法,能够自动发现和识别网络自由文本中的相关电子产品命名实体。下面结合图1具体说明本发明的实施方式。本实施方式包括:1)语料库及知识库的构建;2)特征提取及特征模板的构建;3)将基于知识库的机器学习和规则修正的方法应用于电子产品命名实体识别中。
(一)电子产品命名实体定义及语料库构建。
在本发明中,根据产品组件更新频率的不同,将产品命名实体划分为三个部分,即产品的品牌(BRA)、系列(SER)、型号(TYP),而产品命名实体由这个三个组件及一些描述属性组成。其中,品牌指的是固有的名词——产品的商标,例如“诺基亚”;系列名是指一个品牌下的一系列,例如“EasyShare”就是柯达数码相机品牌下的一个系列;型号名指的是品牌或系列下的版本信息,由字母、数字及一些符号组成,例如“Nokia N70”中N70就是Nokia产品品牌下的一个型号。通常,在数码产品领域更新频率最高的部分为产品型号,而在本发明的定义中,型号名将作为单独的一个类别进行识别,在结合了统计与规则的方法之后,该类别可以被有效识别,并具有较高的更新容忍度与识别精度。
此外,在实际应用中,品牌名与公司名重名,这可能会产生歧义。例如“诺基亚公司最近推出了一款新型时尚的手机——诺基亚N70。”。语句中第一个“诺基亚”指的是诺基亚公司,而第二个“诺基亚”则代表品牌。还有的品牌名不仅会和公司名重名,在特定的环境下,它代表其他类别,例如“苹果”,可以为品牌名、公司名,也可以是水果,这就需要通过上下文的环境确定该类词正确的含义。也就是说,只有当一个名词性结构含有以下确定性产品信息,才可以构成产品命名实体。
1)含有产品品牌、系列或者型号实体任何一个、两个或三个,如“诺基亚5800”、“6300手机”是一个产品名实体,“诺基亚”是品牌名实体,“6300”是型号名实体,而“数码相机”则不是一个产品名实体;
2)尽管没有含有品牌、系列或者型号信息,但是含有某种品牌所特有的产品别称或者版本信息,如“小黑笔记本”是一个产品名实体,因为“小黑”是联想旗下Thinkpad系列的别称。而在“智能型手机”中“智能型”是所有品牌可共有的属性信息,所以它不是一个产品名实体。
在上述电子产品命名实体定义的基础上,利用网络爬虫从互联网中收集多种体裁的电子产品网络信息,提取出网页信息的正文构建成原始的语料库。然后利用品牌、系列知识库和分词词性标注工具,对原始语料进行分词和词性标注处理,之后按照电子产品命名实体的定义,对分词和词性标注后的语料进行实体标注。对原始语料库加工处理完之后,再运用相关方法对加工语料库进行一致性评测,对不达标的语料重新进行标注,直到评测指标达到一定程度。经过上述步骤,构建了一个信息量大、文本体裁多样的规范语料库。
(二)基于知识库的条件随机域模型的电子产品命名实体识别方法。
命名实体识别对于文本信息的后处理非常重要。在命名实体识别中,最常用的机器学习方法有最大熵模型、最大熵隐马可夫模型和条件随机域模型。这三类模型有非常相似的共同点,同属于判别式模型。本发明中运用了效果最好的条件随机域模型。机器学习模型都需要构建一个特征模板,用于在识别当前词时提取该词的上下文特征。因此,特征模板的构建尤为重要。
在本发明中,把产品名实体识别的过程看作为一个多分类的过程,其中需要识别的目标类别包括产品品牌名、系列名、型号名、及公司名和产品实体,把每一种类别的名实体又细分为开始部分、中间部分、和整体三种情况,把不属于以上类别中任何一种的词语都归为一类。为了解决产品命名实体识别中候选实体难触发的问题,引入了产品品牌库和系列库作为品牌实体和系列实体的触发条件,同时它们也可以变相的触发型号名实体的识别。模型中的特征由一系列的特征模板产生。定义了一共13个一元特征模板,然后利用这定义好的13个一元特征模板通过两两组合的方式,构建成二元特征模板集合,然后用信息增益进行二元特征模板的筛选。筛选完成之后,用一元特征模板和二元特征模板进行两两组合,构建成三元特征模板,再用同样的方法进行筛选,最后筛选了40多个特征模板构建特征模板集。
在建立特征模板集合之后,从标注的规范语料库中随机选出一定比例的语料构成训练集合,运用特征模板集和机器学习算法进行训练,通过对训练次数的调整,使训练出的模型能很好的拟合实际文本。再用规则学习算法,分析实验结果错误,提取出修正错误的规则,改进系统对电子产品命名实体识别的性能。
以上对本发明实施例所提供的电子产品命名实体自动识别方法及系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (4)
1.电子产品命名实体自动识别系统的构建方法,其特征在于它包括下述步骤:一、利用下载软件从互联网中收集多种体裁的电子产品网页信息,提取出网页信息的正文,从而形成原始语料的知识库;使用分词词性标注工具,对原始语料进行分词和词性标注处理,之后按照电子产品命名实体的定义,对分词和词性标注后的语料进行实体标注,构建一个标注语料库;所述对电子产品命名实体的定义是指按照一个电子产品命名实体的品牌名、系列名和型号三部分区分出电子产品命名实体;二、基于条件随机域方法,定义多个特征模板,特征模板利用标注语料和知识库具体化出特征,条件随机域方法在标注语料库上的运算结果可以为每个特征赋予一定的权重,特征和其对应的权重构成的条件随机域模型就能用来进行电子产品命名实体识别。
2.根据权利要求1所述的电子产品命名实体自动识别系统的构建方法,其特征在于知识库中的资源均是利用网络爬虫技术和信息抽取技术从互联网上自动获取的;所述知识库包括:针对电子产品具有品牌信息特性所构造的品牌名词典;针对一个品牌下的电子产品有系列之分所构造的系列名词典;或针对一些具有特定意义的短语所构造的特定词语知识库。
3.基于权利要求1所述方法构建的电子产品命名实体自动识别系统的识别方法,其特征在于它包括下述步骤:一、把用于识别的自由文本输入所述电子产品命名实体自动识别系统;二、系统首先利用特征模板提取特征,然后利用条件随机域模型得到每个特征对应的权重,把这些权重利用条件随机域方法进行运算就得到最终的识别结果。
4.根据权利要求3所述的电子产品命名实体自动识别方法,其特征在于它还包括步骤三、采用规则修正方法对识别后的电子产品命名实体进行修正,所述修正规则是通过基于错误驱动的方法获得的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010602773 CN102033950A (zh) | 2010-12-23 | 2010-12-23 | 电子产品命名实体自动识别系统的构建方法及识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010602773 CN102033950A (zh) | 2010-12-23 | 2010-12-23 | 电子产品命名实体自动识别系统的构建方法及识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102033950A true CN102033950A (zh) | 2011-04-27 |
Family
ID=43886843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201010602773 Pending CN102033950A (zh) | 2010-12-23 | 2010-12-23 | 电子产品命名实体自动识别系统的构建方法及识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102033950A (zh) |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609853A (zh) * | 2012-02-27 | 2012-07-25 | 蒋永 | 一种商品名称和型号智能识别系统及方法 |
CN103034693A (zh) * | 2012-12-03 | 2013-04-10 | 哈尔滨工业大学 | 开放式实体及其类型识别方法 |
CN103164426A (zh) * | 2011-12-13 | 2013-06-19 | 北大方正集团有限公司 | 一种命名实体识别的方法及装置 |
CN103678703A (zh) * | 2013-12-30 | 2014-03-26 | 中国科学院自动化研究所 | 一种借助图随机游走的开放类别命名实体抽取方法及装置 |
CN104331395A (zh) * | 2014-10-28 | 2015-02-04 | 北京京东尚科信息技术有限公司 | 从文本中识别中文商品名称的方法和装置 |
CN104572625A (zh) * | 2015-01-21 | 2015-04-29 | 北京云知声信息技术有限公司 | 命名实体的识别方法 |
CN105426358A (zh) * | 2015-11-09 | 2016-03-23 | 中国农业大学 | 一种疾病名词自动识别方法 |
CN105574111A (zh) * | 2015-12-10 | 2016-05-11 | 天津海量信息技术有限公司 | 基于企业属性库的企业实体认证方法 |
CN105812473A (zh) * | 2016-03-29 | 2016-07-27 | 成都小多科技有限公司 | 数据处理方法及装置 |
CN105868193A (zh) * | 2015-01-19 | 2016-08-17 | 富士通株式会社 | 用于检测电子文本中的产品相关信息的装置和方法 |
TWI554896B (zh) * | 2012-07-30 | 2016-10-21 | Alibaba Group Services Ltd | Information Classification Method and Information Classification System Based on Product Identification |
CN106407183A (zh) * | 2016-09-28 | 2017-02-15 | 医渡云(北京)技术有限公司 | 医疗命名实体识别系统生成方法及装置 |
WO2017028422A1 (zh) * | 2015-08-20 | 2017-02-23 | 小米科技有限责任公司 | 知识库的构建方法及装置 |
CN103678336B (zh) * | 2012-09-05 | 2017-04-12 | 阿里巴巴集团控股有限公司 | 实体词识别方法及装置 |
CN106776560A (zh) * | 2016-12-15 | 2017-05-31 | 昆明理工大学 | 一种柬埔寨语组织机构名识别方法 |
CN106897559A (zh) * | 2017-02-24 | 2017-06-27 | 黑龙江特士信息技术有限公司 | 一种面向多数据源的症状体征类实体识别方法及装置 |
CN106909656A (zh) * | 2017-02-27 | 2017-06-30 | 腾讯科技(深圳)有限公司 | 获取文本提取模型的方法及装置 |
CN107423264A (zh) * | 2017-07-10 | 2017-12-01 | 广东华联建设投资管理股份有限公司 | 一种工程材料专业特征提取方法 |
CN108009229A (zh) * | 2017-11-29 | 2018-05-08 | 厦门市美亚柏科信息股份有限公司 | 舆情事件数据发现的方法、终端设备及存储介质 |
CN108108344A (zh) * | 2016-11-24 | 2018-06-01 | 北京智能管家科技有限公司 | 一种联合识别和连接命名实体的方法及装置 |
CN110046978A (zh) * | 2019-03-19 | 2019-07-23 | 上海大学 | 智能报销方法 |
CN110704633A (zh) * | 2019-09-04 | 2020-01-17 | 平安科技(深圳)有限公司 | 命名实体识别方法、装置、计算机设备及存储介质 |
CN112818693A (zh) * | 2021-02-07 | 2021-05-18 | 深圳市世强元件网络有限公司 | 一种电子元器件型号词的自动提取方法及系统 |
CN114297990A (zh) * | 2021-12-22 | 2022-04-08 | 北京捷通华声科技股份有限公司 | 舆情监控方法、装置、计算机可读存储介质及处理器 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101261635A (zh) * | 2008-04-29 | 2008-09-10 | 哈尔滨工业大学深圳研究生院 | 一种被动式网络信息自动高效采集系统及方法 |
-
2010
- 2010-12-23 CN CN 201010602773 patent/CN102033950A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101261635A (zh) * | 2008-04-29 | 2008-09-10 | 哈尔滨工业大学深圳研究生院 | 一种被动式网络信息自动高效采集系统及方法 |
Non-Patent Citations (1)
Title |
---|
《郑州大学学报(理学版)》 20100331 梅丰等 面向网络文本的中文产品命名实体识别 论文62页倒数第7行-65页倒数第11行,表1-3 1-4 第42卷, 第1期 2 * |
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103164426A (zh) * | 2011-12-13 | 2013-06-19 | 北大方正集团有限公司 | 一种命名实体识别的方法及装置 |
CN103164426B (zh) * | 2011-12-13 | 2015-10-28 | 北大方正集团有限公司 | 一种命名实体识别的方法及装置 |
CN102609853A (zh) * | 2012-02-27 | 2012-07-25 | 蒋永 | 一种商品名称和型号智能识别系统及方法 |
TWI554896B (zh) * | 2012-07-30 | 2016-10-21 | Alibaba Group Services Ltd | Information Classification Method and Information Classification System Based on Product Identification |
CN103678336B (zh) * | 2012-09-05 | 2017-04-12 | 阿里巴巴集团控股有限公司 | 实体词识别方法及装置 |
CN103034693B (zh) * | 2012-12-03 | 2016-03-02 | 哈尔滨工业大学 | 开放式实体及其类型识别方法 |
CN103034693A (zh) * | 2012-12-03 | 2013-04-10 | 哈尔滨工业大学 | 开放式实体及其类型识别方法 |
CN103678703A (zh) * | 2013-12-30 | 2014-03-26 | 中国科学院自动化研究所 | 一种借助图随机游走的开放类别命名实体抽取方法及装置 |
CN103678703B (zh) * | 2013-12-30 | 2017-01-11 | 中国科学院自动化研究所 | 一种借助图随机游走的开放类别命名实体抽取方法及装置 |
CN104331395B (zh) * | 2014-10-28 | 2017-11-03 | 北京京东尚科信息技术有限公司 | 从文本中识别中文商品名称的方法和装置 |
CN104331395A (zh) * | 2014-10-28 | 2015-02-04 | 北京京东尚科信息技术有限公司 | 从文本中识别中文商品名称的方法和装置 |
CN105868193A (zh) * | 2015-01-19 | 2016-08-17 | 富士通株式会社 | 用于检测电子文本中的产品相关信息的装置和方法 |
CN104572625A (zh) * | 2015-01-21 | 2015-04-29 | 北京云知声信息技术有限公司 | 命名实体的识别方法 |
US10331648B2 (en) | 2015-08-20 | 2019-06-25 | Xiaomi Inc. | Method, device and medium for knowledge base construction |
WO2017028422A1 (zh) * | 2015-08-20 | 2017-02-23 | 小米科技有限责任公司 | 知识库的构建方法及装置 |
CN105426358A (zh) * | 2015-11-09 | 2016-03-23 | 中国农业大学 | 一种疾病名词自动识别方法 |
CN105426358B (zh) * | 2015-11-09 | 2018-08-31 | 中国农业大学 | 一种针对海量新闻的疾病名词自动识别方法 |
CN105574111A (zh) * | 2015-12-10 | 2016-05-11 | 天津海量信息技术有限公司 | 基于企业属性库的企业实体认证方法 |
CN105812473A (zh) * | 2016-03-29 | 2016-07-27 | 成都小多科技有限公司 | 数据处理方法及装置 |
CN105812473B (zh) * | 2016-03-29 | 2020-01-17 | 成都晓多科技有限公司 | 数据处理方法及装置 |
CN106407183A (zh) * | 2016-09-28 | 2017-02-15 | 医渡云(北京)技术有限公司 | 医疗命名实体识别系统生成方法及装置 |
CN106407183B (zh) * | 2016-09-28 | 2019-06-28 | 医渡云(北京)技术有限公司 | 医疗命名实体识别系统生成方法及装置 |
CN108108344A (zh) * | 2016-11-24 | 2018-06-01 | 北京智能管家科技有限公司 | 一种联合识别和连接命名实体的方法及装置 |
CN106776560A (zh) * | 2016-12-15 | 2017-05-31 | 昆明理工大学 | 一种柬埔寨语组织机构名识别方法 |
CN106897559A (zh) * | 2017-02-24 | 2017-06-27 | 黑龙江特士信息技术有限公司 | 一种面向多数据源的症状体征类实体识别方法及装置 |
CN106909656A (zh) * | 2017-02-27 | 2017-06-30 | 腾讯科技(深圳)有限公司 | 获取文本提取模型的方法及装置 |
CN107423264A (zh) * | 2017-07-10 | 2017-12-01 | 广东华联建设投资管理股份有限公司 | 一种工程材料专业特征提取方法 |
CN108009229A (zh) * | 2017-11-29 | 2018-05-08 | 厦门市美亚柏科信息股份有限公司 | 舆情事件数据发现的方法、终端设备及存储介质 |
CN110046978A (zh) * | 2019-03-19 | 2019-07-23 | 上海大学 | 智能报销方法 |
CN110704633A (zh) * | 2019-09-04 | 2020-01-17 | 平安科技(深圳)有限公司 | 命名实体识别方法、装置、计算机设备及存储介质 |
CN110704633B (zh) * | 2019-09-04 | 2023-07-21 | 平安科技(深圳)有限公司 | 命名实体识别方法、装置、计算机设备及存储介质 |
CN112818693A (zh) * | 2021-02-07 | 2021-05-18 | 深圳市世强元件网络有限公司 | 一种电子元器件型号词的自动提取方法及系统 |
CN114297990A (zh) * | 2021-12-22 | 2022-04-08 | 北京捷通华声科技股份有限公司 | 舆情监控方法、装置、计算机可读存储介质及处理器 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102033950A (zh) | 电子产品命名实体自动识别系统的构建方法及识别方法 | |
CN106649818B (zh) | 应用搜索意图的识别方法、装置、应用搜索方法和服务器 | |
CN105260356B (zh) | 基于多任务学习的中文交互文本情感与话题识别方法 | |
CN104572958B (zh) | 一种基于事件抽取的敏感信息监控方法 | |
CN107729468B (zh) | 基于深度学习的答案抽取方法及系统 | |
CN108664599B (zh) | 智能问答方法、装置、智能问答服务器及存储介质 | |
CN107169079B (zh) | 一种基于Deepdive的领域文本知识抽取方法 | |
CN106126502B (zh) | 一种基于支持向量机的情感分类系统及方法 | |
CN113505200B (zh) | 一种结合文档关键信息的句子级中文事件检测的方法 | |
Layton et al. | Recentred local profiles for authorship attribution | |
CN104471568A (zh) | 对自然语言问题的基于学习的处理 | |
CN105183715B (zh) | 一种基于词分布和文档特征的垃圾评论自动分类方法 | |
CN110910175B (zh) | 一种旅游门票产品画像生成方法 | |
CN104615608A (zh) | 一种数据挖掘处理系统及方法 | |
CN108038208B (zh) | 上下文信息识别模型的训练方法、装置和存储介质 | |
CN102662923A (zh) | 一种基于机器学习的本体实例学习方法 | |
CN104881458A (zh) | 一种网页主题的标注方法和装置 | |
CN109145301B (zh) | 信息分类方法及装置、计算机可读存储介质 | |
CN104346326A (zh) | 一种情绪文本的情绪特征确定方法及装置 | |
CN105447193A (zh) | 一种基于机器学习和协同过滤的音乐推荐系统 | |
CN102708164A (zh) | 电影期望值的计算方法及系统 | |
CN106055560A (zh) | 一种基于统计机器学习方法的分词字典数据采集方法 | |
CN103886020A (zh) | 一种房地产信息快速搜索方法 | |
CN105630890A (zh) | 基于智能问答系统会话历史的新词发现方法及系统 | |
CN111881283A (zh) | 一种业务关键词库创建方法、智能聊天引导方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20110427 |