CN108388608B - 基于文本感知的情感反馈方法、装置、计算机设备和存储介质 - Google Patents
基于文本感知的情感反馈方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN108388608B CN108388608B CN201810119475.0A CN201810119475A CN108388608B CN 108388608 B CN108388608 B CN 108388608B CN 201810119475 A CN201810119475 A CN 201810119475A CN 108388608 B CN108388608 B CN 108388608B
- Authority
- CN
- China
- Prior art keywords
- emotion
- text content
- fed back
- sample
- comment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种基于文本感知的情感反馈方法、装置、计算机设备和存储介质。该方法包括:通过文本内容感知器对获取到的待反馈文本内容计算得到第一权重分配比和第二权重分配比;将待反馈文本内容输入已训练的神经网络,得到情感分类结果;将待反馈文本内容中的情感词语根据预设词典中预设规则计算得到对应的情感指数结果;根据第一权重分配比、第二权重分配比对情感分类结果和情感指数结果进行加权,得到情感分析结果;获取待反馈文本内容对应的情感观点结果;根据情感分析结果和情感观点结果从预设评论回复关联库中选取与待反馈文本内容对应的目标情感反馈评论回复。采用本方法能够提高待反馈文本内容与目标情感反馈回复的匹配率。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种基于文本感知的情感反馈方法、装置、计算机设备和存储介质。
背景技术
情感交互一般是指分析诸如文档之类的内容源以确定由内容源所传达的特定反应或态度,再在情感分析接触基础上进行智能趣味情感反馈。例如,假如在淘宝客户端上网购物品觉得不满意,然后给了差评,此时电脑会自动给根据情感分析结果反馈带有趣味情感的回复,如亲,您说的情况确实存在我们在不断改进这个外观,请您开开心心过每一天哦!
目前,主流常用的文本情感倾向分析有基于神经网络特征分类或者基于情感词典的计算情感得分,然而基于神经网络特征分类在篇章段落级的情感文本内容判别上虽然有很大优势和准确度,但是不能得到对篇章段落进行具体评分以及提取情感词,而基于情感词典的算法虽然可以很准确的提取情感词并能有情感分类,但是在篇章段落的长文本上训练效果不佳。因此,在篇章段落级的情感文本内容的情感反馈,传统技术的基于神经网络特征分类或者基于情感词典的算法都无法识别,识别匹配率低,效果不佳。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高文本与对应反馈内容的匹配率的基于文本感知的情感反馈方法、装置、计算机设备和存储介质。
一种基于文本感知的情感反馈方法,该方法包括:
获取待反馈文本内容;
通过文本内容感知器对待反馈文本内容计算得到第一权重分配比和第二权重分配比;
将待反馈文本内容输入已训练的神经网络,得到情感分类结果;
对所述待反馈文本内容进行分割,得到所述待反馈文本内容中的多个情感词语;
将多个情感词语根据预设词典中预设规则计算得到对应的情感指数结果;
根据第一权重分配比、第二权重分配比对情感分类结果和情感指数结果进行加权,得到待反馈文本内容的情感分析结果;
获取待反馈文本内容对应的情感观点结果;
根据情感分析结果和情感观点结果从预设评论回复关联库中选取与待反馈文本内容对应的目标情感反馈评论回复。
一种基于文本感知的情感反馈装置,该装置包括:
待反馈文本内容获取模块,用于获取待反馈文本内容;
权重分配比计算模块,用于通过文本内容感知器对待反馈文本内容计算得到第一权重分配比和第二权重分配比;
情感分类结果获取模块,用于将待反馈文本内容输入已训练的神经网络,得到情感分类结果;
情感指数结果计算模块,用于对待反馈文本内容进行分割,得到待反馈文本内容中的多个情感词语,将多个情感词语根据预设词典中预设规则计算得到对应的情感指数结果;
情感分析结果分析模块,用于根据第一权重分配比、第二权重分配比对情感分类结果和情感指数结果进行加权,得到待反馈文本内容的情感分析结果;
情感观点结果获取模块,用于获取待反馈文本内容对应的情感观点结果;
反馈模块,用于根据情感分析结果和情感观点结果从预设评论回复关联库中选取与待反馈文本内容对应的目标情感反馈评论回复。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待反馈文本内容;
通过文本内容感知器对待反馈文本内容计算得到第一权重分配比和第二权重分配比;
将待反馈文本内容输入已训练的神经网络,得到情感分类结果;
对待反馈文本内容进行分割,得到待反馈文本内容中的多个情感词语;
将多个情感词语根据预设词典中预设规则计算得到对应的情感指数结果;
根据第一权重分配比、第二权重分配比对情感分类结果和情感指数结果进行加权,得到待反馈文本内容的情感分析结果;
获取待反馈文本内容对应的情感观点结果;
根据情感分析结果和情感观点结果从预设评论回复关联库中选取与待反馈文本内容对应的目标情感反馈评论回复。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待反馈文本内容;
通过文本内容感知器对待反馈文本内容计算得到第一权重分配比和第二权重分配比;
将待反馈文本内容输入已训练的神经网络,得到情感分类结果;
对待反馈文本内容进行分割,得到待反馈文本内容中的多个情感词语;
将多个情感词语根据预设词典中预设规则计算得到对应的情感指数结果;
根据第一权重分配比、第二权重分配比对情感分类结果和情感指数结果进行加权,得到待反馈文本内容的情感分析结果;
获取待反馈文本内容对应的情感观点结果;
根据情感分析结果和情感观点结果从预设评论回复关联库中选取与待反馈文本内容对应的目标情感反馈评论回复。
上述基于文本感知的情感反馈方法、装置、计算机设备和存储介质,通过文本内容感知器对获取到的待反馈文本内容智能计算得到第一权重分配比和第二权重分配比。将获取到的待反馈文本内容输入已训练的神经网络得到对应的情感分类结果,以及将获取到的待反馈文本内容中的多个情感词语根据预设词典中预设规则计算得到对应的情感指数结果。根据文本内容感知器对待反馈文本内容计算得到第一权重分配比和第二权重分配比对情感分配结果和情感指数结果进行加权,得到待反馈文本内容的情感分析结果。进一步获取待反馈文本内容对应的情感观点结果,将情感分析结果和情感观点结果作为一个整体结构化数据去预设评论回复关联库中匹配对应的目标情感评论回复,将目标情感评论回复中的回复作为待反馈文本内容的反馈内容。因此,通过文本内容感知器将神经网络的输出结果和词典的算法结果进行结合,最终自动得到目标情感反馈回复,提高待反馈文本内容与目标情感反馈回复的匹配率。
附图说明
图1为一个实施例中基于文本感知的情感反馈方法的流程示意图;
图2为一个实施例中对待反馈文本内容进行分割,得到待反馈文本内容中的多个情感词语,将多个情感词语根据预设词典中预设规则计算得到对应的情感指数结果的步骤的流程示意图;
图3为一个实施例中获取待反馈文本内容的应的情感观点结果的步骤的流程示意图;
图4为一个实施例中预设聚类观点库的生成步骤的流程示意图;
图5为一个实施例中神经网络的生成步骤的流程示意图;
图6为一个实施例中评论回复关联库的生成步骤的流程示意图;
图7为另一个实施例中基于文本感知的情感反馈方法的流程示意图;
图8为一个实施例中基于文本感知的情感反馈方法的原理示意图;
图9为一个实施例中基于文本感知的情感反馈方法的反馈结果示意图;
图10为一个实施例中基于文本感知的情感反馈装置的结构框图;
图11为一个实施例中情感观点结果获取模块的结构框图;
图12为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种基于文本感知的情感反馈方法,以该方法应用于服务器或终端为例进行说明,包括以下步骤:
步骤102,获取待反馈文本内容。
其中,这里的待反馈文本内容,包括但不限于各种文章、评论等。具体地,可以通过终端相关的应用程序上传文本内容,将上传的文本内容作为待反馈文本内容。这里的应用程序可以是但不限于各种能够发表待反馈文本内容的新闻应用、视频应用、社交网络应用、论坛应用等。
步骤104,通过文本内容感知器对待反馈文本内容计算得到第一权重分配比和第二权重分配比。
其中,文本内容感知器是用于线性可分数据集的二类分类器算法,也可以说是采用模拟多神经元传递的大脑感知能力模拟人类对于思考判断模式的自动化识别模拟器。通过文本内容感知器对终端获取到的待反馈文本内容进行计算得到第一权重分配比和第二权重分配比。所谓权重分配比是通过对其中一个指标在整体评价中的相对重要程度,可依照权重分配比数值越大相对应分配的权重越多的原则。具体地,在获取到待反馈文本内容后,文本内容感知器会对获取到的待反馈文本内容进行计算,分别得到第一权重分配比和第二权重分配比。
步骤106,将待反馈文本内容输入已训练的神经网络,得到情感分类结果。
其中,这里的神经网络是人工神经网络,是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。由于训练好的神经网络可自动对输入的内容进行分类,因此在获取到待反馈文本内容后,将待反馈文本内容输入到已训练好的神经网络,得到与神经网络的输入内容对应的分类结果,即与待反馈文本内容对应的输出结果为情感分类结果。其中,情感分类结果有预先设定的分数值。所谓情感分类结果是通过将待反馈文本内容输入至已训练好的神经网络得到的输出结果,包括但不限于积极、消极、赞扬、喜爱等。
步骤108,对待反馈文本内容进行分割,得到待反馈文本内容中的多个情感词语。
步骤110,将待反馈文本内容中的多个情感词语根据预设词典中预设规则计算得到对应的情感指数结果。
其中,这里预设词典是预先获得人工审核标注出的评论内容中的词语,由于评论内容是由多个词语组成的句子,因此对评论内容进行分割得到多个词语,将分割后的多个词语进行清理处理得到最终的词典。因此在获取到待反馈文本内容后,由于待反馈文本内容中存有能代表情感的情感词语,则需待反馈文本内容进行分割,得到待反馈文本内容中的多个情感词语。进一步地,将待反馈文本内容中的多个情感词语根据预设词典中的预设规则计算得到对应的情感指数结果。所谓预设规则是词典中预先设定的情感词语的权重规则。其中,这里的情感词语包括但不限于表示积极、消极、喜悦、悲伤的情感词语等。具体地,在获取到待反馈文本内容后,根据预设词典中的预先设定的情感词语的权重规则对获取到的待反馈文本内容中的多个情感词语的权重计算得到与待反馈文本内容对应的情感分数,即情感指数结果。
步骤112,根据第一权重分配比、第二权重分配比对情感分类结果和情感指数结果进行加权,得到待反馈文本内容的情感分析结果。
其中,情感分析结果是由情感分类结果以及情感指数结果组成。具体地,通过文本内容感知器对待反馈文本内容进行计算得到第一权重分配比和第二权重分配比,根据第一权重分配比和第二权重分配比对神经网络输出的情感分类结果对应的分数值或者预设词典计算得到的情感指数结果进行加权计算,得到待反馈文本内容对应的情感分析结果。所谓加权计算是对情感分类结果对应的分数值和情感指数结果赋予不同的权重进行计算。
步骤114,获取待反馈文本内容对应的情感观点结果。
其中,情感观点结果是将文本内容根据陈述事实概括为一个总观点,例如可将“送货快、物流神速、快递给力”等同一类描述物流迅速的文本内容归类为“物流神速”,即“物流神速”作为“送货快、物流神速、快递给力”等同一类描述的观点。具体地,根据待反馈文本内容陈述的内容获取与待反馈文本内容对应的情感观点结果。
步骤116,根据情感分析结果和情感观点结果从预设评论回复关联库中选取与待反馈文本内容对应的目标情感反馈评论回复。
其中,这里的预设评论回复关联库是将预先获得人工审核标注出的评论回复样本与对应的样本情感分析结果和样本观点结果进行关联,得到的评论回复关联库,其中样本评论回复包括评论样本以及对应的回复样本。例如,评论样本为:“物流神速、好评”,样本回复为:“谢谢您”,与评论回复样本对应的样本情感分析结果为:“喜欢赞扬、10分”,与评论回复样本对应的样本观点结果为:“物流神速”,将评论回复样本为:“物流神速、好评”、“谢谢您”与样本情感分析结果为“喜欢赞扬、10分”以及样本观点结果为“物流神速”进行关联,得到评论回复关联库。具体地,在获取到情感分析结果和情感观点结果后,将情感分析结果和情感观点结果作为结构化数据,根据结构化数据从预设评论回复关联库中选取与结构化数据对应的评论回复样本,将评论回复样本中的回复样本作为待反馈文本内容对应的目标情感反馈评论回复。
上述基于文本感知的情感反馈方法中,通过文本内容感知器对获取到的待反馈文本内容智能计算得到第一权重分配比和第二权重分配比。将获取到的待反馈文本内容输入已训练的神经网络得到对应的情感分类结果,以及将获取到的待反馈文本内容中的多个情感词语根据预设词典中预设规则计算得到对应的情感指数结果。根据文本内容感知器对待反馈文本内容计算得到第一权重分配比和第二权重分配比对情感分配结果和情感指数结果进行加权,得到待反馈文本内容的情感分析结果。进一步获取待反馈文本内容对应的情感观点结果,将情感分析结果和情感观点结果作为整体结构化数据从预设评论回复关联库中匹配对应的目标情感评论回复,将目标情感评论回复中的回复作为待反馈文本内容的反馈内容。因此,通过文本内容感知器将神经网络的输出结果和词典的算法结果进行结合,最终自动得到目标情感反馈回复,提高待反馈文本内容与目标情感反馈回复的匹配率。
在一个实施例中,如图2所示,对待反馈文本内容进行分割,得到待反馈文本内容中的多个情感词语,将多个情感词语根据预设词典中预设规则计算得到对应的情感指数结果,包括:
步骤202,对待反馈文本内容进行分割,得到多个句子。
由于获取到的待反馈文本内容一般是以段落形式的评论或者文章,因此需对待反馈文本内容进行分割,得到分割后的多个句子。具体地,在获取到待反馈文本内容后,会对待反馈文本内容按照一定的规则进行分割,得到多个句子。其中,分割规则以标点符号为分割标志,将单条待反馈文本内容分割为N个句子。
步骤204,根据特殊词语对每个句子进行加权,得到多个加权后的句子。
其中,特殊词语包括但不限于转折连词等,由于特殊词语能代表情感的程度,因此可根据特殊词语对所在的句子进行加权。所谓加权是赋予特殊词语所在的句子的权重程度更大些。具体地,在对获取的待反馈文本内容进行分割得到多个句子后,根据每个句子中的特殊词语赋予特殊词语所在的句子的权重更高些,即权重越高代表情感的程度越大。例如,将待反馈文本内容分割为多个句子为:“这个电脑外观相当不错,但是用了两天,有点耗电啊!”,由于“但是”是属于转折连词,即特殊词语,那么赋予“但是用了两天,有点耗电啊!”这个句子的权重为0.6,而“这个电脑外观相当不错”的权重为0.4。
步骤206,对每个句子进行分割,得到多个情感词语。
由于分割后的多个句子是以句子形式的评论或者文章,因此需要对分割后的多个句子进行分割,得到分割后的多个词语。具体地,在对待反馈文本内容进行分割得到多个句子后,会对每个句子按照一定的规则进行分割,得到多个词语,进一步从多个词语中提取得到多个情感词语。其中,分割规则可根据词语在句子中的成分、词语的词性以及词语的搭配习惯进行分割。
步骤208,根据预设词典中每个情感词语的加权分数计算得到多个情感词语对应的情感词语分数。
具体地,在提取每个句子中的情感词语后,根据预设词典中赋予每个情感词语的加权分数计算得到多个情感词语对应的情感词语分数。如:“这个电脑外观相当不错,但是用了两天,有点耗电啊!”其中,“不错”以及“耗电”分别作为积极的情感词语和消极的情感词语,由于预设词典中赋予“不错”的权重为2分,赋予“耗电”的权重为-1分,进一步能够计算分别得到“不错”和“耗电”的情感分数分别为“2分”和“-1分”。
步骤210,根据每个情感词语查找与情感词语相邻的预设词语。
步骤212,根据预设词典中预设词语的加权分数与情感词语分数计算得到每个句子对应的情感分数。
步骤214,根据每个句子的情感分数计算得到待反馈文本内容的情感指数结果。
其中,预设词语是以情感词语为基准,向前依次寻找程度副词、否定词等,将程度副词、否定词作为预设词语。进一步地,以每个情感词语为基准查找依次向前查找与情感词语相邻的程度副词、否定词等。当查找到程度副词、否定词等预设词语后,根据预设词典中对预设词语的加权分数计算得到与预设词语相应的分值。进一步地,在计算得到与预设词语相应的分值后,将预设词语的分值与情感词语的分数计算得到每个句子对应的情感分数,再根据每个句子对应的情感分数计算得到获取到的待反馈文本内容的情感指数结果。
例如:待反馈文本内容为:“这个电脑外观相当不错,但是用了两天,有点耗电啊!”,用逗号把待反馈文本内容分割成多个句子,通过对多个句子进行分割,提取每个句子中的情感词语。从预设词典中匹配得到代表积极的情感词语为:“不错”,预设词典对该情感词语的分数设定为1分。进一步地,以“不错”为基准依次向前寻找程度副词或者否定词等预设词语,查找得到程度副词为“相当”,根据预设词典对程度副词为“相当”的分数为2分权重,将情感词语的分数值与程度副词的分数值相乘得到情感词语所在句子的分数值,即“相当不错”所在“这个电脑外观相当不错”的分数值为2分。
由于“但是”为转折连词,预设词典中赋予“但是”的权重为0.6,其中在“但是用了两天,有点耗电啊!”句子中,查找到代表消极的情感词语“耗”,其中预设词典中对该表示消极的“耗”的分数设定为-1分。由于以“耗”为基准查找到程度副词为“有点”。由于预设词典对程度副词为“有点”的分数值设定为1.25分,因此在“但是”的后面“有点耗电”的分数值为-1.25,同时由于“但是”这个转折连词,后面的句子才是整个待反馈文本内容最重要想表达的情感,是比前半段表示赞扬的句子的情感程度更重要。所以再乘上“但是”前后句子的不同权重再相加,得到待反馈文本内容最后分数值为:2*0.4+-1.25*0.6,即待反馈文本内容的情感指数结果。
在一个实施例中,如图3所示,获取待反馈文本内容的应的情感观点结果,包括:
步骤302,对待反馈文本内容进行句法类型分析,得到待反馈文本内容对应的句法类型。
其中,句法类型是指词语与词语之间按照一定的规则组合构成的。而待反馈文本内容是由多个词语组成的句子,在实际情况中,由于词语间的组合方式有多种,那么多个词语组合形成的句子也会有多个。在这种情况下,就需要对待反馈文本内容进行句法类型分析。在进行句法类型分析时,会先将待反馈文本内容分割成多个词语,再对分割后的多个词语进行句法类型分析,得到对应的句法类型,其中,句法类型分析是指确定哪些词语构成一个短语,哪些词语是动词、形容词或者副词等等。如:待反馈文本内容为:“电脑屏幕有点大”,由于“电脑屏幕”为名词n,“大”为形容词a,“有点”为副词d,则对待反馈文本内容进行句法类型分析得到待反馈文本内容的句法类型为:“n+d+a”。
步骤304,当句法类型在预设聚类观点库中观点对应的观点句法类型时,根据词向量模型计算得到句法类型对应的匹配句法类型。
其中,预设聚类观点库是指预先根据将同一类文本内容陈述事实相同或者相似的概括为一个总观点,得到聚类观点库。由于观点一般也是以句子的形式呈现,而句子又是由多个词语组成,而词语与词语之间按照一定的规则组合构成的,即观点句法类型。因此,在得到待反馈文本内容的句法类型后,当待反馈文本内容的句法类型检测在预设观点库中的观点对应的观点句法类型时,根据词向量模型计算待反馈文本内容的句法类型与观点句法类型的相似度,当相似度大于预设相似度阈值时,则可将该观点句法类型作为待反馈文本内容的句法类型的匹配句法类型。这里的词向量模型是用于计算文本内容的句法类型与聚类观点库中的观点句法类型的相似度。
步骤306,根据匹配句法类型从观点句法类型中匹配得到与匹配句法类型对应的情感观点结果。
具体地,由于观点是以句子的形式呈现,句子是由多个词语组成,而词语与词语之间按照一定的规则组合构成的,即观点句法类型。也就是说每个观点都有对应的观点句法类型。在获取到待反馈文本内容的匹配句法类型后,根据匹配句法类型从聚类观点库中的观点对应的观点句法类型中进行匹配。当匹配成功时,将匹配句法类型对应的观点作为待反馈文本内容的情感观点结果。
在一个实施例中,如图4所示,预设聚类观点库的生成步骤包括:
步骤402,对多个评论样本进行分割,得到每个评论样本对应的多个词语。
其中,评论样本是利用分布式爬虫技术采集各大电商平台的几大分类(酒店、手机、家电、书籍等)商品的各上万条评论样本。所谓分布式爬虫,就是在不同地域部署数十台服务器,在每台服务器上使用Docker轻量级虚拟机技术创建数百个容器,在每个容器上装载Java开发的网页模拟点击爬虫模块,形成大型分布式爬虫网络。将一个大型爬虫任务划分为大量的小型子任务并构建任务队列,然后通过多地多容器协同的任务调度机制将子任务按需分配到各个容器上执行,从而实现超高并发的分布式爬虫。具体地,由于评论样本是由多个词语组成的句子,因此对评论样本进行分割得到多个词语,其中分割句子可根据词语在句子中的成分、词语的词性以及词语的搭配习惯进行分割。
步骤404,对每个评论样本对应的多个词语进行词性标注,得到每个评论样本对应的句法类型。
具体地,在对评论样本进行分割得到多个分割后的词语后,对分割后得到的多个词语进行词性标注,根据标注的词语在句子所在的位置对标注后的多个词语进行排序,得到由多个词语组成的评论样本对应的句法类型。如:评论样本为“电脑屏幕有点大”,对评论样本进行分割得到多个词语为:“电脑屏幕”、“有点”、“大”。由于“电脑屏幕”为名词n,“大”为形容词a,“有点”为副词d,则对评论样本为“电脑屏幕有点大”进行句法类型分析得到评论样本为“电脑屏幕有点大”的句法类型为:“n+d+a”。
步骤406,根据训练好的词向量模型计算得到每个评论样本对应的句法类型的相似度。
步骤408,当相似度大于预设相似度时,将相似度大于预设相似度的句法类型对应的多个评论样本进行合并,得到评论样本集合。
具体地,这里的已训练好的词向量模型是用于计算各个文本内容的句法类型之间的相似度。在获取到各个评论样本的句法类型后,根据训练好的词向量模型计算各个评论样本对应的句法类型的相似度。其中相似度是各个评论样本对应的句法类型之间的相似程度,相似程度越高表示越相似。进一步地,在得到每个评论样本对应的句法类型的相似度后,当相似度大于预设相似度时,将相似度大于预设相似度的句法类型对应的多个评论样本进行合并,得到评论样本集合。如:评论样本为:“物流神速”、“送货快”、“快递给力”,根据训练好的词向量模型计算得到各个评论样本对应的句法类型的相似度,由于评论样本为:“物流神速”、“送货快”、“快递给力”的句法类型的相似度大于预设相似度,则将“物流神速”、“送货快”、“快递给力”作为一个评论样本集合。
步骤410,获取评论样本集合的中心词,将中心词确定为评论样本集合的观点,将观点加入预设聚类观点库中,生成预设聚类观点库,其中中心词用于定义评论样本的类型。
具体地,由于评论样本集合中的元素都属于陈述同一类事实,因此在得到评论样本集合后,获取能够总结或者概括评论样本集合中的元素所陈述的事实的中心词,并将获取到的中心词确定为评论样本集合的观点,将该观点加入至预设聚类观点库中,生成预设聚类观点库。其中,中心词用于概括或者总结评论样本集合中的元素所陈述的事实的词语或者句子,也就是定义由同一类的多个评论样本组成的评论样本集合的类型。如:评论样本集合中元素为:“物流神速”、“送货快”、“快递给力”,由于评论样本集合元素都属于同一类描述物流很迅速的评论样本,因此获取评论样本集合的中心词为:“物流迅速”,将“物流迅速”作为该评论样本集合的观点,进一步将“物流迅速”加入观点库中。则预设聚类观点库中“物流迅速”观点是用于描述评论样本集合为:“物流神速”、“送货快”、“快递给力”。
在一个实施例中,如图5所示,神经网络的生成步骤包括:
步骤502,获取标注好的评论样本。
步骤504,将评论样本输入训练好的词向量分析模型word2Vec,得到评论样本对应的词向量。
步骤506,将词向量作为特征输入神经网络中,对神经网络进行训练,得到训练好的神经网络。
具体地,由于评论样本是利用分布式爬虫技术采集各大电商平台的几大分类商品的各上万条评论样本,再对爬取到的评论样本进行词性标注,得到标注好的评论样本。进一步地,将获取到标注好的评论样本输入到已训练好的词向量分析模型word2Vec,得到评论样本对应的词向量。其中,词向量分析模型word2Vec是用于将自然语言中的字词转为计算机可以理解的稠密向量的神经网络。稠密向量又可称为词向量。所谓词向量是代表词语的语义、可以用来做分类、聚类以及相似度计算的表示符号。在得到评论样本对应的词向量后,将词向量作为特征输入到神经网络中,对神经网络进行无监督训练以及有监督训练得到训练好的神经网络。
在一个实施例,如图6所示,评论回复关联库的生成步骤包括:
步骤602,获取已标注的评论回复样本,其中评论回复样本包括评论样本及对应的回复样本。
具体地,由于评论回复样本是利用分布式爬虫技术采集各大电商平台的几大分类商品的各上万条评论回复样本,再对爬取到的评论回复样本进行词性标注,得到标注好的评论回复样本。其中评论回复样本包括评论样本以及对应的回复样本,将评论样本以及对应的回复样本作为评论回复样本。
步骤604,通过文本内容感知器对评论回复样本计算得到第一样本权重分配比和第二样本权重分配比。
具体地,由于文本内容感知器是采用模拟多神经元传递的大脑感知能力模拟人类对于思考判断模式的自动化识别模拟器,是一种用于判断的机制。因此,在获取到已标注的评论回复样本后,文本内容感知器会对获取到评论回复样本进行计算,分别得到第一样本权重分配比和第二样本权重分配比。其中,权重分配比是通过对其中一个指标在整体评价中的相对重要程度,权重分配比越高对应的权重越大。
步骤606,将评论回复样本输入已训练好的神经网络,得到样本情感分类结果。
具体地,由于已训练好的神经网络可自动对输入的内容进行分类,因此获取到评论回复样本后,将评论回复样本输入到已训练好的神经网络中,得到与神经网络的输入内容对应的分类结果,即与评论回复样本对应的输出结果为情感分类结果。其中,情感分类结果包括但不限于积极、消极、赞扬、喜爱、批评等类型。如:评论回复样本为:“哇塞!物流神经,这屏幕好看,主要是它价格低”为评论样本,“这么高评价搞得人家不好意思”为回复样本,将该评论回复样本输入至已训练好的神经网络中,已训练好的神经网络可对输入的内容进行分类,得到该评论回复样本对应的情感分类结果为:“喜爱、赞扬”。进一步地,获取预先对情感分类结果为:“喜爱、赞扬”设定的分数为:10分。
步骤608,将评论回复样本中的多个情感词语根据预设词典中预设规则计算得到样本情感指数结果。
具体地,由于评论回复样本中包含多个情感词语,因此在获取到评论回复样本后,根据预设词典中的预先设定的情感词语的权重规则对获取到的待反馈文本内容的多个情感词语的权重计算得到与待反馈文本内容对应的情感分数,即情感指数结果。如:评论回复样本为:“哇塞!物流神速,这屏幕好看,主要是它价格低”为评论样本,“这么高评价搞得人家不好意思”为回复样本,提取评论样本中的情感词语为:“好看”,由于预设词典对该情感词语的分数设定为2分,且该情感词语所在的句子的权重为0.6,则该评论回复样本的情感指数结果为:2*0.6。
步骤610,根据第一样本权重分配比、第二样本权重分配比对样本情感分类结果和样本情感指数结果进行加权,得到评论回复样本的样本情感分析结果。
具体地,样本情感分析结果是由样本情感分类结果以及样本情感指数结果组成,因此通过文本内容感知器对评论回复样本进行计算得到第一样本权重分配比和第二样本权重分配比,根据第一样本权重分配比、第二样本权重分配比对样本情感分类结果对应分数值和样本情感指数结果进行加权计算,得到评论回复样本的样本情感分析结果。如:通过文本内容感知对评论回复样本进行计算得到的第一样本权重分配比为20%,第二样本权重分配比为80%,且第一样本权重分配与基于神经网络输出的样本情感分类结果对应的分数值进行相乘,以及第二样本权重分配比与预设词典计算得到的样本情感指数结果进行相乘,最终得到评论回复样本的样本情感分析结果。
步骤612,获取评论回复样本对应的样本情感观点结果。
步骤614,将样本情感分析结果和情感观点结果与将评论回复样本进行关联得到关联后的评论回复样本,根据关联后的评论回复样本生成评论回复关联库。
具体地,根据获取到的评论回复样本陈述的内容获取对应的样本情感观点结果,将获取到的样本情感观点结果与样本情感分析结果作为一个整体与评论回复样本进行关联,得到关联后的评论回复样本。进一步地,将关联后的评论回复样本加入评论回复关联库中。如:评论回复样本中的评论样本为:“你们这产品交互太麻烦了吧”,回复样本为:“遵命!小的马上去改成”,计算得到样本情感分析结果为:“消极,-5分”,获取到样本情感观点结果为:“产品交互麻烦”,因此,将评论样本为:“你们这产品交互太麻烦了吧”,回复样本为:“遵命!小的马上去改成”,样本情感分析结果为:“消极,-5分”,以及样本情感观点结果为:“产品交互麻烦”进行关联后,得到关联后的整体数据加入到评论回复关联库中。
图7示出一个实施例中基于文本感知的情感反馈方法的流程图,该方法以应用于服务器或终端为例进行说明,包括以下步骤:
步骤702,获取待反馈文本内容。
其中,这里的待反馈文本内容,包括但不限于各种文章、评论等。具体地,可以通过终端相关的应用程序上传文本内容,将上传的文本内容作为待反馈文本内容。这里的应用程序可以是但不限于各种能够发表待反馈文本内容的新闻应用、视频应用、社交网络应用、论坛应用等。
步骤704,通过文本内容感知器对待反馈文本内容计算得到第一权重分配比和第二权重分配比。
如图8所示,图8示出一个实施例中基于文本感知的情感反馈方法的原理示意图。在获取到待反馈文本内容后,通过文本内容感知器对待反馈文本内容进行权重计算,分别得到第一权重分配比和第二权重分配比。其中,第一权重分配比对应基于神经网络情感分析的情感分类结果,第二权重分配比对应基于词典的情感分析的情感指数结果。若第一权重分配比第二权重分配比大,则基于神经网络情感分析的情感分析结果占据的权重更大,反之,则基于词典的情感分析的情感指数结果占据的权重更大。
步骤706,将待反馈文本内容输入已训练的神经网络,得到情感分类结果。
由于训练好的神经网络可自动对输入的内容进行分类,如图8所示,在获取到待反馈文本内容后,将待反馈文本内容输入到已训练好的神经网络中,得到与神经网络的输入内容为待反馈文本内容对应的分类结果,即情感分类结果。如:获取到的待反馈文本内容为:“哇塞,这物流真快”,则将该待反馈文本内容输入至已训练好的神经网络中得到对应的情感分类结果为:“喜爱、赞扬”。进一步,获取预先设定的情感分类结果为:“喜爱、赞扬”对应的分数值。
步骤708,对待反馈文本内容进行分割,得到多个句子。
步骤710,根据特殊词语对每个句子进行加权,得到多个加权后的句子。
步骤712,对每个句子进行分割,得到多个情感词语。
具体地,由于待反馈文本内容一般是以段落形式的评论或者文章,因此需要对待反馈文本内容以标点符号为分割标识,将待反馈文本内容分割得到的多个句子。在对获取到的待反馈文本内容进行分割得到多个句子后,可根据每个句子中的转折连词等特殊词语对特殊词语所在的句子赋予更高点的权重,得到每个加权后的句子。由于每个加权后的句子是以句子形式的评论或者文章,因此可根据词语在句子中的成分、词语的词性以及词语的搭配习惯对加权后的句子进行分割,得到分割后的多个词语,进一步地从分割后的多个词语中提取多个情感词语。
步骤714,根据预设词典中每个情感词语的加权分数计算得到多个情感词语对应的情感词语分数。
步骤716,根据每个情感词语查找与情感词语相邻的预设词语。
步骤718,根据预设词典中预设词语的加权分数与情感词语分数计算得到每个句子对应的情感分数。
步骤720,根据每个句子的情感分数计算得到待反馈文本内容的情感指数结果。
具体地,在提取每个句子中的情感词语后,根据预设词典中赋予每个情感词语的加权分数计算得到多个情感词语对应的情感词语分数。进一步地,以每个情感词语为基准依次查找与情感词相邻的程度副词、否定词等预设词语。当查找到程度副词、否定词等预设词语后,根据预设词典中赋予对预设词语的加权分数计算得到与预设词语相应的分值。在计算得到与预设词语相应的分值后,将预设词语的分值与情感词语的分数计算得到每个句子对应的情感分数,再根据每个句子对应的情感分数计算得到获取到的待反馈文本内容的情感指数结果。
例如:待反馈文本内容为:“这个电脑外观相当不错,但是用了两天,有点耗电啊!”,用逗号把待反馈文本内容分割成多个句子,通过对多个句子进行分割,提取每个句子中的情感词语。从预设词典中匹配得到代表积极的情感词语为:“不错”,预设词典对该情感词语的分数设定为1分。进一步地,以“不错”为基准依次向前寻找程度副词或者否定词等预设词语,查找得到程度副词为“相当”,根据预设词典对程度副词为“相当”的分数为2分权重,将情感词语的分数值与程度副词的分数值相乘得到情感词语所在句子的分数值,即“相当不错”所在“这个电脑外观相当不错”的分数值为2分。
由于“但是”为转折连词,预设词典中赋予“但是”的权重为0.6,其中在“但是用了两天,有点耗电啊!”句子中,查找到代表消极的情感词语“耗”,其中预设词典中对该表示消极的“耗”的分数设定为-1分。由于以“耗”为基准查找到程度副词为“有点”。由于预设词典对程度副词为“有点”的分数值设定为1.25分,因此在“但是”的后面“有点耗电”的分数值为-1.25,同时由于“但是”这个转折连词,后面的句子才是整个待反馈文本内容最重要想表达的情感,是比前半段表示赞扬的句子的情感程度更重要。所以再乘上“但是”前后句子的不同权重再相加,得到待反馈文本内容最后分数值为:2*0.4+-1.25*0.6,即待反馈文本内容的情感指数结果。
步骤722,根据第一权重分配比、第二权重分配比对情感分类结果和情感指数结果进行加权,得到待反馈文本内容的情感分析结果。
具体地,通过文本内容感知器对待反馈文本内容进行计算得到第一权重分配比和第二权重分配比,根据第一权重分配比和第二权重分配比对神经网络输出的情感分类结果对应的分数值和基于词典算法分析得到的情感指数结果进行加权计算,得到待反馈文本内容对应的情感分析结果。
步骤724,对待反馈文本内容进行句法类型分析,得到待反馈文本内容对应的句法类型。
步骤726,当句法类型在预设聚类观点库中观点对应的观点句法类型时,根据词向量模型计算得到句法类型对应的匹配句法类型。
步骤728,根据匹配句法类型从观点句法类型中匹配得到与匹配句法类型对应的情感观点结果。
如图8所示,在获取到待反馈文本内容后,由于待反馈文本内容是由多个词语组成的句子或者文章,在实际情况中,由于词语间的组合方式有多种,那么多个词语组成形成的句子也会有多个。因此,需对获取到的待反馈文本内容进行句法类型分析,得到待反馈文本内容对应的句法类型。进一步地,在得到待反馈文本内容的句法类型后,当检测到待反馈文本内容的句法类型在预设观点库中的观点对应的观点句法类型时,根据词向量模型计算待反馈文本内容的句法类型与观点句法类型的相似度。当相似度大于预设相似度阈值时,则可将该观点句法类型作为待反馈文本内容的句法类型的匹配句法类型。因此在获取到待反馈文本内容的匹配句法类型后,根据匹配句法类型从聚类观点库中的观点中观点对应的观点句法类型中进行匹配。当匹配成功时,可将匹配句法类型对应的观点作为待反馈文本内容的情感观点结果。
步骤730,根据情感分析结果和情感观点结果从预设评论回复关联库中选取与待反馈文本内容对应的目标情感反馈评论回复。
如图8所示,在获取到情感分析结果和情感观点结果后,将情感分析结果和情感观点结果作为结构化数据,也就是说结构化数据由情感分析结果和情感观点结果组成。根据结构化数据从预设评论回复关联库中选取与结构化数据对应的评论回复样本,将评论回复样本中的回复样本作为待反馈文本内容对应的目标情感反馈评论回复。如图9所示,图9示出一个实施例中基于文本感知的情感反馈方法的反馈结果示意图。如:待反馈文本内容为:“哇塞!这物流神速,这屏幕真好看。主要是它价格低!”,待反馈文本内容作为训练好的神经网络的输入得到情感分类结果为:“喜爱、赞扬”,获取预先设定情感分类结果为:“喜爱、赞扬”的分数值为:“10分”。待反馈文本内容基于词典算法得到情感指数结果为:“5分”,那么通过文本感知器对情感分类结果以及情感指数结果进行加权得到的情感分析结果为:“喜爱、赞扬,5分”,其中基于词典得到的5分的权重比基于神经网络得到的喜爱赞扬对应的分数值的权重比更高些。进一步地,获取待反馈文本内容的情感观点结果为:“物流迅速”,根据情感分析结果和情感观点结果从预设评论回复关联库中选取与待反馈文本内容对应的目标情感反馈评论回复为:“这么高的评价搞得人家不好意思啦”,将目标情感反馈评论回复呈现至终端用户。
本实施例中,通过文本内容感知器对基于词典和神经网络的输出结果进行加权,得到情感分析结果;将情感分析结果和获取到的情感观点结果作为结构化数据从预设评论回复库中获取到目标文本内容反馈回复。支持实时分析输入的文本内容,以最快的速度获取与输入的文本内容的情感反馈内容。不仅提高了输入文本内容与情感反馈内容的匹配率,而且提高获取情感反馈内容的效率。
应该理解的是,虽然图1-7的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-7中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图10所示,提供了一种基于文本感知的情感反馈装置1000,包括:待反馈文本内容获取模块1002、权重分配比计算模块1004、情感分类结果获取模块1006、情感指数结果计算模块1008、情感分析结果分析模块1010、情感观点结果获取模块1012和反馈模块1014,其中:
待反馈文本内容获取模块1002,用于获取待反馈文本内容。
权重分配比计算模块1004,用于通过文本内容感知器对待反馈文本内容计算得到第一权重分配比和第二权重分配比。
情感分类结果获取模块1006,用于将待反馈文本内容输入已训练的神经网络,得到情感分类结果。
情感指数结果计算模块1008,用于将待反馈文本内容中的多个情感词语根据预设词典中预设规则计算得到对应的情感指数结果。
情感分析结果分析模块1010,用于根据第一权重分配比、第二权重分配比对情感分类结果和情感指数结果进行加权,得到待反馈文本内容的情感分析结果。
情感观点结果获取模块1012,用于获取待反馈文本内容对应的情感观点结果。
反馈模块1014,用于根据情感分析结果和情感观点结果从预设评论回复关联库中选取与待反馈文本内容对应的目标情感反馈评论回复。
在一个实施例中,如图11所示,情感观点结果获取模块1012包括:句法类型分析单元1102、匹配句法类型获取单元1104以及情感观点结果匹配单元1106,其中
句法类型分析单元1102,用于对待反馈文本内容进行句法类型分析,得到待反馈文本内容对应的句法类型。
匹配句法类型获取单元1104,用于当句法类型在预设聚类观点库中观点对应的观点句法类型时,根据词向量模型计算得到句法类型对应的匹配句法类型。
情感观点结果匹配单元1106,用于根据匹配句法类型从预设聚类观点库中观点对应的观点句法类型匹配得到待反馈文本内容对应的情感观点结果。
在一个实施例中,情感分类结果获取模块1006还用于对待反馈文本内容进行分割,得到多个句子;根据特殊词语对每个句子进行加权,得到多个加权后的句子;对每个句子进行分割,得到多个情感词语;根据预设词典中每个情感词语的加权分数计算得到多个情感词语对应的情感词语分数;根据每个情感词语查找与情感词语相邻的预设词语;根据预设词典中预设词语的加权分数与情感词语分数计算得到每个句子对应的情感分数;根据每个句子的情感分数计算得到待反馈文本内容的情感指数结果。
在一个实施例中,预设聚类观点库的生成步骤包括:对多个评论样本进行分割,得到每个评论样本对应的多个词语;对每个评论样本对应的多个词语进行词性标注,得到每个评论样本对应的句法类型;根据训练好的词向量模型计算得到每个评论样本对应的句法类型的相似度;当相似度大于预设相似度时,将相似度大于预设相似度的句法类型对应的多个评论样本进行合并,得到评论样本集合;获取评论样本集合的中心词,将中心词确定为评论样本集合的观点,将观点加入预设聚类观点库中,生成预设聚类观点库,其中中心词用于定义评论样本集合的类型。
在一个实施例中,神经网络的生成步骤包括:获取标注好的评论样本;将评论样本输入训练好的词向量分析模型word2Vec,得到评论样本对应的词向量;将词向量作为特征输入神经网络中,对神经网络进行训练,得到训练好的神经网络。
在一个实施例中,评论回复关联库的生成步骤包括:获取已标注的评论回复样本,其中评论回复样本包括评论样本及对应的回复样本;通过文本内容感知器对评论回复样本计算得到第一样本权重分配比和第二样本权重分配比;将评论回复样本输入已训练好的神经网络,得到样本情感分类结果;将评论回复样本中的多个情感词语根据预设词典中预设规则计算得到样本情感指数结果;根据第一样本权重分配比、第二样本权重分配比对样本情感分类结果和样本情感指数结果进行加权,得到评论回复样本的样本情感分析结果;获取评论回复样本对应的样本情感观点结果;将样本情感分析结果和情感观点结果与将评论回复样本进行关联得到关联后的评论回复样本,根据关联后的评论回复样本生成评论回复关联库。
关于基于文本感知的情感反馈装置的具体限定可以参见上文中对于基于文本感知的情感反馈方法的限定,在此不再赘述。上述基于文本感知的情感反馈装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图12所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于文本感知的情感反馈方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图12中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:获取待反馈文本内容;通过文本内容感知器对待反馈文本内容计算得到第一权重分配比和第二权重分配比;将待反馈文本内容输入已训练的神经网络,得到情感分类结果;将待反馈文本内容中的多个情感词语根据预设词典中预设规则计算得到对应的情感指数结果;根据第一权重分配比、第二权重分配比对情感分类结果和情感指数结果进行加权,得到待反馈文本内容的情感分析结果;获取待反馈文本内容对应的情感观点结果;根据情感分析结果和情感观点结果从预设评论回复关联库中选取与待反馈文本内容对应的目标情感反馈评论回复。
在一个实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:获取待反馈文本内容;通过文本内容感知器对待反馈文本内容计算得到第一权重分配比和第二权重分配比;将待反馈文本内容输入已训练的神经网络,得到情感分类结果;将待反馈文本内容中的多个情感词语根据预设词典中预设规则计算得到对应的情感指数结果;根据第一权重分配比、第二权重分配比对情感分类结果和情感指数结果进行加权,得到待反馈文本内容的情感分析结果;获取待反馈文本内容对应的情感观点结果;根据情感分析结果和情感观点结果从预设评论回复关联库中选取与待反馈文本内容对应的目标情感反馈评论回复。
在一个实施例中,将待反馈文本内容中的多个情感词语根据预设词典中预设规则计算得到对应的情感指数结果的步骤,包括:对待反馈文本内容进行分割,得到多个句子;根据特殊词语对每个句子进行加权,得到多个加权后的句子;对每个句子进行分割,得到多个情感词语;根据预设词典中每个情感词语的加权分数计算得到多个情感词语对应的情感词语分数;根据每个情感词语查找与情感词语相邻的预设词语;根据预设词典中预设词语的加权分数与情感词语分数计算得到每个句子对应的情感分数;根据每个句子的情感分数计算得到待反馈文本内容的情感指数结果。
在一个实施例中,获取待反馈文本内容的应的情感观点结果的步骤,包括:对待反馈文本内容进行句法类型分析,得到待反馈文本内容对应的句法类型;当句法类型在预设聚类观点库中观点对应的观点句法类型时,根据词向量模型计算得到句法类型对应的匹配句法类型;根据匹配句法类型从预设聚类观点库中观点对应的观点句法类型匹配得到待反馈文本内容对应的情感观点结果。
在一个实施例中,预设聚类观点库的生成步骤包括:对多个评论样本进行分割,得到每个评论样本对应的多个词语;对每个评论样本对应的多个词语进行词性标注,得到每个评论样本对应的句法类型;根据训练好的词向量模型计算得到每个评论样本对应的句法类型的相似度;当相似度大于预设相似度时,将相似度大于预设相似度的句法类型对应的多个评论样本进行合并,得到评论样本集合;获取评论样本集合的中心词,将中心词确定为评论样本集合的观点,将观点加入预设聚类观点库中,生成预设聚类观点库,其中中心词用于定义评论样本的类型。
在一个实施例中,神经网络的生成步骤包括:获取标注好的评论样本;将评论样本输入训练好的词向量分析模型word2Vec,得到评论样本对应的词向量;将词向量作为特征输入神经网络中,对神经网络进行训练,得到训练好的神经网络。
在一个实施例中,评论回复关联库的生成步骤包括:获取已标注的评论回复样本,其中评论回复样本包括评论样本及对应的回复样本;通过文本内容感知器对评论回复样本计算得到第一样本权重分配比和第二样本权重分配比;将评论回复样本输入已训练好的神经网络,得到样本情感分类结果;将评论回复样本中的多个情感词语根据预设词典中预设规则计算得到样本情感指数结果;根据第一样本权重分配比、第二权重分配比对样本情感分类结果和情感指数结果进行,得到评论回复样本的样本情感分析结果;获取评论回复样本对应的样本情感观点结果;将样本情感分析结果和情感观点结果与将评论回复样本进行关联得到关联后的评论回复样本,根据关联后的评论回复样本生成评论回复关联库。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种基于文本感知的情感反馈方法,所述方法包括:
获取待反馈文本内容;
通过文本内容感知器对所述待反馈文本内容计算得到第一权重分配比和第二权重分配比;
将所述待反馈文本内容输入已训练的神经网络,得到情感分类结果;
对所述待反馈文本内容进行分割,得到所述待反馈文本内容中的多个情感词语;
将所述多个情感词语根据预设词典中预设规则计算得到对应的情感指数结果;
根据所述第一权重分配比、第二权重分配比对所述情感分类结果和所述情感指数结果进行加权,得到所述待反馈文本内容的情感分析结果;
获取待反馈文本内容对应的情感观点结果;
根据所述情感分析结果和所述情感观点结果从预设评论回复关联库中选取与所述待反馈文本内容对应的目标情感反馈评论回复。
2.根据权利要求1所述的方法,其特征在于,所述对所述待反馈文本内容进行分割,得到所述待反馈文本内容中的多个情感词语,将所述多个情感词语根据预设词典中预设规则计算得到对应的情感指数结果,包括:
对所述待反馈文本内容进行分割,得到多个句子;
根据特殊词语对每个所述句子进行加权,得到多个加权后的句子;
对每个所述句子进行分割,得到多个情感词语;
根据所述预设词典中每个所述情感词语的加权分数计算得到多个所述情感词语对应的情感词语分数;
根据每个所述情感词语查找与所述情感词语相邻的预设词语;
根据所述预设词典中所述预设词语的加权分数与所述情感词语分数计算得到每个所述句子对应的情感分数;
根据每个所述句子的情感分数计算得到所述待反馈文本内容的情感指数结果。
3.根据权利要求1所述的方法,其特征在于,所述获取待反馈文本内容的应的情感观点结果,包括:
对所述待反馈文本内容进行句法类型分析,得到所述待反馈文本内容对应的句法类型;
当所述句法类型在预设聚类观点库中观点对应的观点句法类型时,根据词向量模型计算得到所述句法类型对应的匹配句法类型;
根据所述匹配句法类型从所述观点句法类型中匹配得到与所述匹配句法类型对应的情感观点结果。
4.根据权利要求3所述的方法,其特征在于,所述预设聚类观点库的生成步骤包括:
对多个评论样本进行分割,得到每个所述评论样本对应的多个词语;
对所述每个评论样本对应的所述多个词语进行词性标注,得到所述每个评论样本对应的句法类型;
根据训练好的词向量模型计算得到所述每个评论样本对应的所述句法类型的相似度;
当所述相似度大于预设相似度时,将所述相似度大于预设相似度的句法类型对应的多个所述评论样本进行合并,得到评论样本集合;
获取所述评论样本集合的中心词,将所述中心词确定为所述评论样本集合的观点,将所述观点加入所述预设聚类观点库中,生成所述预设聚类观点库,其中所述中心词用于定义所述评论样本集合的类型。
5.根据权利要求1所述的方法,其特征在于,所述神经网络的生成步骤包括:
获取标注好的评论样本;
将所述评论样本输入训练好的词向量分析模型word2Vec,得到所述评论样本对应的词向量;
将所述词向量作为特征输入神经网络中,对神经网络进行训练,得到训练好的神经网络。
6.根据权利要求1所述的方法,其特征在于,所述评论回复关联库的生成步骤包括:
获取已标注的评论回复样本,其中所述评论回复样本包括评论样本及对应的回复样本;
通过所述文本内容感知器对所述评论回复样本计算得到第一样本权重分配比和第二样本权重分配比;
将所述评论回复样本输入所述已训练好的神经网络,得到样本情感分类结果;
将所述评论回复样本中的多个情感词语根据所述预设词典中预设规则计算得到样本情感指数结果;
根据所述第一样本权重分配比、第二样本权重分配比对所述样本情感分类结果和所述样本情感指数结果进行加权,得到所述评论回复样本的样本情感分析结果;
获取所述评论回复样本对应的样本情感观点结果;
将所述样本情感分析结果和所述情感观点结果与将所述评论回复样本进行关联得到关联后的评论回复样本,根据关联后的所述评论回复样本生成所述评论回复关联库。
7.一种基于文本感知的情感反馈装置,所述装置包括:
待反馈文本内容获取模块,用于获取待反馈文本内容;
权重分配比计算模块,用于通过文本内容感知器对所述待反馈文本内容计算得到第一权重分配比和第二权重分配比;
情感分类结果获取模块,用于将所述待反馈文本内容输入已训练的神经网络,得到情感分类结果;
情感指数结果计算模块,用于对所述待反馈文本内容进行分割,得到所述待反馈文本内容中的多个情感词语,将所述多个情感词语根据预设词典中预设规则计算得到对应的情感指数结果;
情感分析结果分析模块,用于根据所述第一权重分配比、第二权重分配比对所述情感分类结果和所述情感指数结果进行加权,得到所述待反馈文本内容的情感分析结果;
情感观点结果获取模块,用于获取待反馈文本内容对应的情感观点结果;
反馈模块,用于根据所述情感分析结果和所述情感观点结果从预设评论回复关联库中选取与所述待反馈文本内容对应的目标情感反馈评论回复。
8.根据权利要求7所述的装置,其特征在于,所述情感观点结果获取模块包括:
句法类型分析单元,用于对所述待反馈文本内容进行句法类型分析,得到所述待反馈文本内容对应的句法类型;
匹配句法类型获取单元,用于当所述句法类型在预设聚类观点库中观点对应的观点句法类型时,根据词向量模型计算得到所述句法类型对应的匹配句法类型;
情感观点结果匹配单元,用于根据所述匹配句法类型从所述预设聚类观点库中观点对应的观点句法类型匹配得到所述待反馈文本内容对应的情感观点结果。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810119475.0A CN108388608B (zh) | 2018-02-06 | 2018-02-06 | 基于文本感知的情感反馈方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810119475.0A CN108388608B (zh) | 2018-02-06 | 2018-02-06 | 基于文本感知的情感反馈方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108388608A CN108388608A (zh) | 2018-08-10 |
CN108388608B true CN108388608B (zh) | 2020-08-04 |
Family
ID=63075272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810119475.0A Active CN108388608B (zh) | 2018-02-06 | 2018-02-06 | 基于文本感知的情感反馈方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108388608B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109388748A (zh) * | 2018-09-26 | 2019-02-26 | 深圳壹账通智能科技有限公司 | 一种评论信息的回复方法、存储介质和服务器 |
CN109446423B (zh) * | 2018-10-26 | 2022-07-01 | 北京捷报数据技术有限公司 | 一种新闻以及文本的情感判断系统及方法 |
US11100287B2 (en) * | 2018-10-30 | 2021-08-24 | International Business Machines Corporation | Classification engine for learning properties of words and multi-word expressions |
CN109461037B (zh) * | 2018-12-17 | 2022-10-28 | 北京百度网讯科技有限公司 | 评论观点聚类方法、装置和终端 |
CN110321563B (zh) * | 2019-06-28 | 2021-05-11 | 浙江大学 | 基于混合监督模型的文本情感分析方法 |
CN110488973B (zh) * | 2019-07-23 | 2020-11-10 | 清华大学 | 一种虚拟互动留言系统及方法 |
CN110719525A (zh) * | 2019-08-28 | 2020-01-21 | 咪咕文化科技有限公司 | 弹幕表情包的生成方法、电子设备和可读存储介质 |
CN110674256B (zh) * | 2019-09-25 | 2023-05-12 | 携程计算机技术(上海)有限公司 | Ota酒店的点评与回复的相关度的检测方法及系统 |
CN111522913A (zh) * | 2020-04-16 | 2020-08-11 | 山东贝赛信息科技有限公司 | 一种适用于长文本和短文本的情感分类方法 |
CN111783468B (zh) * | 2020-06-28 | 2023-08-15 | 百度在线网络技术(北京)有限公司 | 文本处理方法、装置、设备和介质 |
CN114756598B (zh) * | 2022-03-30 | 2024-10-18 | 北京奇艺世纪科技有限公司 | 目标产品的反馈统计方法、装置、电子设备和存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102073646A (zh) * | 2009-11-23 | 2011-05-25 | 北京科技大学 | 一种面向博客群的主题倾向性处理方法及系统 |
CN103544246A (zh) * | 2013-10-10 | 2014-01-29 | 清华大学 | 互联网多种情感词典构建方法及系统 |
CN104268197A (zh) * | 2013-09-22 | 2015-01-07 | 中科嘉速(北京)并行软件有限公司 | 一种行业评论数据细粒度情感分析方法 |
CN104636425A (zh) * | 2014-12-18 | 2015-05-20 | 北京理工大学 | 一种网络个体或群体情绪认知能力预测与可视化方法 |
CN105183808A (zh) * | 2015-08-26 | 2015-12-23 | 苏州大学张家港工业技术研究院 | 一种问题分类方法及装置 |
US9443013B2 (en) * | 2013-04-09 | 2016-09-13 | International Business Machines Corporation | Question-related identification of relevant social communities |
-
2018
- 2018-02-06 CN CN201810119475.0A patent/CN108388608B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102073646A (zh) * | 2009-11-23 | 2011-05-25 | 北京科技大学 | 一种面向博客群的主题倾向性处理方法及系统 |
US9443013B2 (en) * | 2013-04-09 | 2016-09-13 | International Business Machines Corporation | Question-related identification of relevant social communities |
CN104268197A (zh) * | 2013-09-22 | 2015-01-07 | 中科嘉速(北京)并行软件有限公司 | 一种行业评论数据细粒度情感分析方法 |
CN103544246A (zh) * | 2013-10-10 | 2014-01-29 | 清华大学 | 互联网多种情感词典构建方法及系统 |
CN104636425A (zh) * | 2014-12-18 | 2015-05-20 | 北京理工大学 | 一种网络个体或群体情绪认知能力预测与可视化方法 |
CN105183808A (zh) * | 2015-08-26 | 2015-12-23 | 苏州大学张家港工业技术研究院 | 一种问题分类方法及装置 |
Non-Patent Citations (1)
Title |
---|
"基于网络评论的情感分类与观点抽取技术分析与研究";杨丽;《信息通信》;20171231(第12期);第281-282页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108388608A (zh) | 2018-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108388608B (zh) | 基于文本感知的情感反馈方法、装置、计算机设备和存储介质 | |
CN112632385B (zh) | 课程推荐方法、装置、计算机设备及介质 | |
Kumar et al. | Sentiment analysis of multimodal twitter data | |
Cambria et al. | Senticnet 2: A semantic and affective resource for opinion mining and sentiment analysis | |
Mukhtar et al. | Urdu sentiment analysis using supervised machine learning approach | |
CN110032632A (zh) | 基于文本相似度的智能客服问答方法、装置及存储介质 | |
US11475227B2 (en) | Intelligent routing services and systems | |
CN107688870B (zh) | 一种基于文本流输入的深度神经网络的分层因素可视化分析方法及装置 | |
CN111382361A (zh) | 信息推送方法、装置、存储介质和计算机设备 | |
Mehta et al. | Sentiment analysis of tweets using supervised learning algorithms | |
Petz et al. | On text preprocessing for opinion mining outside of laboratory environments | |
CN114240552A (zh) | 基于深度聚类算法的产品推荐方法、装置、设备及介质 | |
CN109359180B (zh) | 用户画像生成方法、装置、电子设备及计算机可读介质 | |
CN111898384A (zh) | 一种文本情感识别方法、装置、存储介质及电子设备 | |
CN113590928A (zh) | 内容推荐方法、装置及计算机可读存储介质 | |
CN113392179A (zh) | 文本标注方法及装置、电子设备、存储介质 | |
CN113392209A (zh) | 一种基于人工智能的文本聚类方法、相关设备及存储介质 | |
Kauer et al. | Using information retrieval for sentiment polarity prediction | |
CN111563158A (zh) | 文本排序方法、排序装置、服务器和计算机可读存储介质 | |
CN109446423A (zh) | 一种新闻以及文本的情感判断系统及方法 | |
CN110852047A (zh) | 一种文本配乐方法、装置、以及计算机存储介质 | |
Peng et al. | Seq2Emoji: A hybrid sequence generation model for short text emoji prediction | |
Ashiq et al. | A Deep Learning Approaches for Natural Language Processing and Sentiment Analysis in Social Media | |
Kamran et al. | EmoDNN: understanding emotions from short texts through a deep neural network ensemble | |
CN110069686A (zh) | 用户行为分析方法、装置、计算机装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |