CN108170848B

CN108170848B - 一种面向中国移动智能客服的对话场景分类方法

Info

Publication number: CN108170848B
Application number: CN201810048593.7A
Authority: CN
Inventors: 李嫄源; 朱庆元; 李鹏华; 朱智勤; 王冠
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2018-01-18
Filing date: 2018-01-18
Publication date: 2021-08-13
Anticipated expiration: 2038-01-18
Also published as: CN108170848A

Abstract

本发明涉及一种面向中国移动智能客服的对话场景分类方法，属于人工智能技术领域。该方法包括：获取中国移动智能客服场景对话相关自然语言的训练文本；采用MapReduce方法计算量化数据的笛卡尔积进行实体的共指消歧；采用词向量表征方式融合多语境描述进行训练文本稀疏表示；采用尺度相关池化方案与训练级联卷积神经网络模型进行对话场景分类。因此，本发明能有效应答用户与客服交互的自然语言信息，满足智能客服需求。

Description

一种面向中国移动智能客服的对话场景分类方法

技术领域

本发明属于人工智能技术领域，涉及一种面向中国移动智能客服的对话场景分类方法。

背景技术

近年来，智能客服机器人在国内外的发展应用近几年呈现出快速增长的势头，并逐步开始在电信运营商、金融服务等行业形成产业规模。智能客服对话不仅为企业与用户建立了快捷有效的沟通手段，还为企业提供了精细化管理所需的统计分析信息。

现有技术中，智能客服多采用关键词、关键句匹配的方式判断客户问题是否命中知识库，这种方式会造成对话模式呆板固定，缺乏人性化设计，降低了用户体验，且当用户对意图表述不清楚时，整个咨询周期会变长，降低客服效率。

对于目前存在的情况，迫切需要开发一种新型智能客服交互技术，而深度学习近年来在自然语言处理方向迅猛发展为智能客服提供了新的思路。

发明内容

有鉴于此，本发明的目的在于提供一种面向中国移动智能客服的对话场景分类方法，为用户提供快捷高效的客服体验与人性化的用户体验。

为达到上述目的，本发明给出了一种基于深度学习的对话场景分类系统的实现方法，所述深度学习包括：多特征融合下的文本数据预处理，深度增强学习下的语义解析。本发明提供如下技术方案：

一种面向中国移动智能客服的对话场景分类方法，该场景分类方法包括：

101：获取中国移动智能客服场景对话相关自然语言的训练文本；

102：采用MapReduce方法计算量化数据的笛卡尔积进行实体的共指消歧；

103：采用词向量表征方式融合多语境描述进行训练文本稀疏表示；

104：采用尺度相关池化方案与训练级联卷积神经网络模型进行对话场景分类。

进一步，在所述步骤101中，所述的训练文本的获取，包括：对不同移动客服对话场景的任务需求特点进行解析，根据这些特点，采用网络爬虫和专家设计相互补充的方式，获取事实型、列表型、定义型、关系型、观点型的问题/答案文本训练数据。

进一步，在所述步骤102中，采用MapReduce方法计算量化数据的笛卡尔积，依据相似值计算公式

计算每个实体对的相似度；其中，对于n个数据记录，i和j都为0到n之间的自然数，e_i和e_j表示n个实体中的某一个，w表示权重；通过自适应阈值的优化选取相似实体进行融合，完成实体的共指消歧。

进一步，在所述步骤103中，通过HanLP与Stanford parser中的CRF句法分析器与最大熵依存句法分析器将训练文本划分为词或短语，并获取语境量化描述；采用word2vec将其融合成词向量，并与获取的量化描述融合生成新的词向量；借助无监督最大释然学习实现训练文本稀疏表示。

进一步，所述的无监督最大释然学习实现数据稀疏表示，通过在深置信度神经网络的隐藏层神经元中引入稀疏限制和正则项，推导相应的损失函数和惩罚函数，构建稀疏边缘降噪自动编码器；将融合词序、词序、依存关系语境特征的词向量提交给该编码器，借助损失函数的更新完成深度置信神经网络的预训练，微调神经网络的权值、偏置、稀疏限制和正则限制项等参数，完成训练文本的稀疏表示。

进一步，在所述步骤104中，所述卷积神经网络模型的构建，包括：构造条件函数来优化切换多学习机制；对所述稀疏表示的训练数据进行无监督学习预训练进而获取其训练权值；采用尺度相关池化方案与训练级联卷积神经网络模型对于给定对话训练数据集；学习一个线性增强分类器，聚合一组弱学习机制输出分类得分，进行对话场景分类。

进一步，所述卷积神经网络模型通过训练文本稀疏表示进行重复迭代训练更新权重至误差在预设的误差范围之内。

本发明的有益效果在于：本发明采用多特征融合下的自然语言数据稀疏表示，使词、句子等多层次结构中的词向量与词性、依存关系等语境向量深度融合，且能有效地稀疏表示融合生成的词向量，为深度学习的不同分层特征表示提供支撑；通过在深置信度神经网络的隐藏层神经元中引入稀疏限制和正则项，借助损失函数的更新完成深度神经网络的预训练；半监督学习下的自然语言深度学习模型优化，使深度学习模型与自然语言任务匹配。因此，本发明能有效应答用户与客服交互的自然语言信息，满足智能客服需求。

附图说明

为了使本发明的目的、技术方案和有益效果更加清楚，本发明提供如下附图进行说明：

图1为本发明面向移动智能客服的对话场景分类流程示意图；

图2为本发明文本预处理实体共指消歧流程图示意图；

图3为本发明多特征融合下的词向量稀疏编码表示；

图4为本发明深度学习下的自然语言语义解析模型。

具体实施方式

下面将结合附图，对本发明的优选实施例进行详细的描述。

参见图1，本发明提供一种面向中国移动智能客服的对话场景分类方法。该方法具体包括：

101、对电话语音进行语音识别引擎驱动下的用户语音文本数据转换，通过构建Noisy Channel模型，结合Burkhard-Keller树算法与最小编辑距离法，在误拼字典当中实现文本拼写纠错。

通过HanLP与Stanford parser中的CRF句法分析器与最大熵依存句法分析器将文本划分为词或短语，并获取词性、词序、关键词、依存关系等量化描述。

102、参见图2，采用MapReduce方法计算量化数据的笛卡尔积，依据相似值计算公式

计算每个实体对的相似度。其中，对于n个数据记录，i和j都为0到n之间的自然数，e_i和e_j表示n个实体中的某一个，w表示权重。通过自适应阈值的优化选取相似实体进行融合，完成实体的共指消歧。

103、参见图3，采用Word2Vec将划分的词或短语转化为词向量，并与获取的量化描述融合生成新的词向量。根据不同对话任务的需要，词向量融合方式可采取拼接、加权、或者哈希计算。词向量融合效果由随后进行的无监督学习下稀疏表示过程的参数进行综合评判。通过在深置信度神经网络的隐藏层神经元中引入稀疏限制和正则项，推导相应的损失函数和惩罚函数，构建稀疏边缘降噪自动编码器；将融合词序、词序、依存关系等语境特征的词向量提交给该编码器，借助损失函数的更新完成深度神经网络的预训练，微调神经网络的权值、偏置、稀疏限制和正则限制项等参数，完成自然语言数据的稀疏表示。

104、针对稀疏表征下的对话训练数据集，结合多轮对话场景特点，从Singlewords、Fixed windows、Recursive sentence、Bag of words等基本表示结构中选择合适的表示结构，提交给级联卷积神经网络进行语义解析。

参见图4，在级联抑制卷积神经网络中，定义词向量集的N个等级组B，B＝[B₁,B₂,...,B_N]和相应上下文语义标签y_i，如果包含上文语义，则y_i＝1，否则y_i＝0；从卷积层l中对应于B_i∈B的相应特征x_i，采用尺度相关池化方案与RoIPooling方案训练级联卷积神经网络模型，给出m×m×c维特征，其中c是卷积层中的信道数，得到训练数据集：

Y＝{0,1}∈R^N。

对于给定对话训练数据集，在超参数选择约束下，对学习模型进行交叉验证，检查学习模型是否存在缺陷。同时，学习一个线性增强分类器

聚合一组弱学习机制的响应输出

其中h_t是弱学习机制，w_t是相应的权重，输出是分类得分；弱学习机制h_t是一个决策树桩，如果第v个特征维度上的值x_v大于决策阈值δ_v，则输出为1，否则写为h_t(X)＝sign(x_v-δ_v)，T表示最终的对话场景数量。在学习增强分类器完成若干弱学习机制的训练后，得到99％的正样本的排除阈值。所有幸存的样本示例都传递给下一个拒绝分类器

同时采用

中所使用的弱学习机制对

进行初始化。

通过以上的实施方式的描述，所述功能如果以软件功能单元的形式实现并作为独立的产品销售或者使用时，可以存储在计算机中执行各个实施例或者实施例的某些部分所述的方法。

最后说明的是，以上优选实施例仅用以说明本发明的技术方案而非限制，尽管通过上述优选实施例已经对本发明进行了详细的描述，但本领域技术人员应当理解，可以在形式上和细节上对其作出各种各样的改变，而不偏离本发明权利要求书所限定的范围。

Claims

1.一种面向中国移动智能客服的对话场景分类方法，其特征在于：该场景分类方法包括：

S1：获取中国移动智能客服场景对话相关自然语言的训练文本；

S2：采用MapReduce方法计算量化数据的笛卡尔积进行实体的共指消歧；

S3：采用词向量表征方式融合多语境描述进行训练文本稀疏表示，具体包括：通过HanLP与Stanford parser中的条件随机场句法分析器与最大熵依存句法分析器将训练文本划分为词或短语，并获取语境量化描述；采用word2vec将其融合成词向量，并与获取的量化描述融合生成新的词向量；借助无监督最大释然学习实现训练文本稀疏表示；

S4：采用尺度相关池化方案与训练级联卷积神经网络模型进行对话场景分类。

2.根据权利要求1所述的一种面向中国移动智能客服的对话场景分类方法，其特征在于：在所述步骤S1中，所述的训练文本的获取，包括：采用网络爬虫和专家设计相互补充的方式，获取事实型、列表型、定义型、关系型、观点型的问题/答案文本训练数据。

3.根据权利要求1所述的一种面向中国移动智能客服的对话场景分类方法，其特征在于：在所述步骤S2中，采用MapReduce方法计算量化数据的笛卡尔积，依据相似值计算公式

4.根据权利要求3所述的一种面向中国移动智能客服的对话场景分类方法，其特征在于：所述的无监督最大释然学习实现数据稀疏表示，通过在深度置信神经网络的隐藏层神经元中引入稀疏限制和正则项，推导相应的损失函数和惩罚函数，构建稀疏边缘降噪自动编码器；将融合词序、词序、依存关系语境特征的词向量提交给该编码器，借助损失函数的更新完成深度置信神经网络的预训练，微调神经网络的权值、偏置、稀疏限制和正则限制项参数，完成训练文本的稀疏表示。

5.根据权利要求1所述的一种面向中国移动智能客服的对话场景分类方法，其特征在于：在所述步骤S4中，所述卷积神经网络模型的构建，包括：构造条件函数来优化切换多学习机制；对所述稀疏表示的训练数据进行无监督学习预训练进而获取其训练权值；采用尺度相关池化方案与训练级联卷积神经网络模型对于给定对话训练数据集；学习一个线性增强分类器，聚合一组弱学习机制输出分类得分，进行对话场景分类。

6.根据权利要求5所述的一种面向中国移动智能客服的对话场景分类方法，其特征在于：所述卷积神经网络模型通过训练文本稀疏表示进行重复迭代训练更新权重至误差在预设的误差范围之内。