CN113641798B

CN113641798B - 一种针对商家的扰乱性评论的识别方法及系统

Info

Publication number: CN113641798B
Application number: CN202111188290.3A
Authority: CN
Inventors: 王思宇; 江岭; 黄鹏
Original assignee: Chengdu Xiaoduo Technology Co ltd
Current assignee: Chengdu Xiaoduo Technology Co ltd
Priority date: 2021-10-12
Filing date: 2021-10-12
Publication date: 2022-02-08
Anticipated expiration: 2041-10-12
Also published as: CN113641798A

Abstract

本发明提供一种针对商家的扰乱性评论的识别方法及系统，包括：获取商家的类别信息和属性信息；根据类别信息从预设的类别嵌入矩阵中获取商家各个所属类别的表示向量，并计算商家所有类别的表示向量的平均值，得到商家的类别特征向量；根据属性信息从预设的词嵌入矩阵中获取商家属性值的表示向量，并计算商家属性值的表示向量中所有字符向量的平均值，得到商家的属性特征向量；将类别特征向量和属性特征向量进行拼接得到商家特征向量；获取用户做出的评论并通过层次注意力模型处理得到评论对应的评论表示向量；将商家特征向量和评论表示向量映射到匹配空间计算得到匹配概率，并根据匹配概率识别出扰乱性评论；识别扰乱性评论的同时降低了人工成本。

Description

一种针对商家的扰乱性评论的识别方法及系统

技术领域

本发明涉及电子商务技术领域，具体而言，涉及一种针对商家的扰乱性评论的识别方法及系统。

背景技术

用户在购买商品后很多时候都会根据自己的使用体验发表评论信息，因此评论信息对商家或是用户都有很高的利用价值。但是网络上涌现了大量的虚假评论，对商家和用户的体验都造成了极大的影响。这些虚假评论主要分为以下三种：（1）不真实评论((Untruthful Opinions):这些评论来自别有用心的群体，他们企图通过评论美化自身产品和服务，或恶意攻击竞争对手；（2）笼统评论（Reviews on Brands Only）：这类评论通常不直接评论所购买的产品或服务，而是对服务或商品笼统的描述为：为我喜欢这个品牌或这个地方等。（3）非评论(Non-Reviews)：这类评论内容中不包括具体的评论信息，更多的是广告或者闲聊。其中，类型（2）和（3）统称为扰乱性评论(disruptive opinion)，类型1称之为欺诈性评论（deceptive opinion）。欺诈性评论对用户和商家的危害极大，因此学术界和工业界目前已经进行了大量的研究。扰乱性评论相对来说，对于商家和用户威胁较少，因为一般人可以非常容易识别到这类信息。但是，如果一个商品页面充斥较多这样的评论会极大的影响用户体验。为了识别扰乱性评论，目前很多方法都是通过特征抽取与机器学习来实现，但是因为在线评论的内容长短不一、用语不规范、大量社会化内容等问题，采用上述方式进行识别的难度和人工标注成本都很高。因此，需要提供一种方案以便于高效识别扰乱性评论的同时降低人工成本。

发明内容

本发明的目的在于提供一种针对商家的扰乱性评论的识别方法及系统，用以实现高效识别扰乱性评论的同时降低人工成本的技术效果。

第一方面，本发明提供了一种针对商家的扰乱性评论的识别方法，包括：

S1.获取商家的类别信息和属性信息；所述类别信息包括商家能够划分为的多种类别；所述属性信息包括商家的名称和地址；

S2.根据所述类别信息从预设的类别嵌入矩阵中获取商家各个所属类别的表示向量，并计算商家所有类别的表示向量的平均值，得到商家的类别特征向量；

S3.根据所述属性信息从预设的词嵌入矩阵中获取商家属性值的表示向量，并计算商家属性值的表示向量中所有字符向量的平均值，得到商家的属性特征向量；

S4.将所述类别特征向量和所述属性特征向量进行拼接得到商家特征向量；

S5.获取用户做出的评论并通过层次注意力模型处理得到所述评论对应的评论表示向量；

S6.将所述商家特征向量和所述评论表示向量映射到匹配空间计算得到匹配概率，并根据所述匹配概率识别出扰乱性评论；其中，匹配概率的计算方式为：

p = sigmoid（vMe）

式中，p表示匹配概率；v表示评论表示向量；e表示商家特征向量；M是一个映射矩阵且M∈R ^2d×d，R表示实数域，d表示向量维度。

进一步地，所述S5包括：

S51.通过预设的词嵌入矩阵获取所述评论中各个句子中的各个词的词表示向量x _it；将所述词表示向量x _it输入第一双向GRU网络，得到所述词表示向量x _it对应的两个输出，并对这两个输出进行拼接得到参数h _it；

S52.将参数h _it输入第一多层感知器，得到对应的输出结果u _it；

S53.计算所述输出结果u _it与第一随机初始化向量u _w的第一内积；通过第一softmax函数根据所述第一内积得到每个时间步输出的第一权重a _it，并根据所述第一权重a _it和参数h _it进行加权求和，得到每个句子的句子表示向量s _i；

S54. 将所述句子表示向量s _i输入第二双向GRU网络得到句子表示向量s _i对应的两个输出，并对这两个输出进行拼接得到参数h _i；

S55.将参数h _i输入第二多层感知器，得到对应的输出结果u _i；

S56.计算所述输出结果u _i与第二随机初始化向量u _s的第二内积，通过第二softmax函数根据所述第二内积得到每个时间步输出的第二权重a _i，并根据所述第二权重a _i和参数h _i进行加权求和，得到每个评论的评论表示向量。

进一步地，所述第一双向GRU网络和所述第二双向GRU网络均替换为双向LSTM网络。

进一步地，所述方法还包括：

从原始评论数据集中获取一个训练数据集，按照S1-S6的过程和目标函数L对层次注意力模型中的参数进行优化，其中目标函数L的计算方式为：

式中，p表示匹配概率；r _ij表示评论与商家的匹配关系，当评论与商家匹配时，r _ij=1；否则r _ij=0。

进一步地，所述类别嵌入矩阵为E _c∈R ^k×d，R表示实数域，d表示向量维度，k表示所有商家涵盖的类别总数；所述S2的实现方式为：

式中，e _c表示类别特征向量；n表示商家能够划分为的类别总数；i表示变量；e _ci表示各个类别的表示向量。

进一步地，所述词嵌入矩阵为E _w∈R ^m×d，R表示实数域，d表示向量维度，m表示数据集中的词典总数；所述S3的实现方式为：

式中，e _a表示类别特征向量；l表示商家的属性值构成的字符序列中的字符总数；i表示变量；e _ai表示各个字符的表示向量。

进一步地，所述商家特征向量为：e=[e _c，e _a]；式中，e表示商家特征向量，且e∈R ^2d。

第二方面，本发明提供了一种针对商家的扰乱性评论的识别系统，包括：

获取模块，用于获取商家的类别信息和属性信息；所述类别信息包括商家能够划分为的多种类别；所述属性信息包括商家的名称和地址；

第一运算模块，用于根据所述类别信息从预设的类别嵌入矩阵中获取商家各个所属类别的表示向量，并计算商家所有类别的表示向量的平均值，得到商家的类别特征向量；

第二运算模块，用于根据所述属性信息从预设的词嵌入矩阵中获取商家属性值的表示向量，并计算商家属性值的表示向量中所有字符向量的平均值，得到商家的属性特征向量；

拼接模块，用于将所述类别特征向量和所述属性特征向量进行拼接得到商家特征向量；

第三运算模块，用于获取用户做出的评论并通过层次注意力模型得到所述评论对应的评论表示向量；

识别模块，用于将所述商家特征向量和所述评论表示向量映射到匹配空间计算得到匹配概率，并根据所述匹配概率识别出扰乱性评论；其中，匹配概率的计算方式为：

p = sigmoid（vMe）

本发明能够实现的有益效果是：本发明提供的针对商家的扰乱性评论的识别方法及系统先根据商家能够划分的多种类别和预设的类别嵌入矩阵进行运算得到商家的类别特征向量，同时根据商家的名称和地址等属性信息和预设的词嵌入矩阵进行运算得到商家的属性特征向量；其次，将上述类别特征向量和属性特征向量进行拼接得到商家特征向量；然后根据用户做出的评论通过层次注意力模型处理得到评论表示向量，最后将商家特征向量和评论表示向量映射到匹配空间计算得到匹配概率，并根据该匹配概率识别出扰乱性评论，在高效识别扰乱性评论的同时降低了人工成本。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明实施例提供的一种针对商家的扰乱性评论的识别方法的流程示意图；

图2为本发明实施例提供的一种针对商家的扰乱性评论的识别系统的拓扑结构图。

图标：10-识别系统；100-获取模块；200-第一运算模块；300-第二运算模块；400-拼接模块；500-第三运算模块；600-识别模块。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。同时，在本发明的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

请参看图1，图1为本发明实施例提供的一种针对商家的扰乱性评论的识别方法的流程示意图。

经申请人研究发现，为了识别扰乱性评论，目前很多方法都是通过特征抽取与机器学习来实现，但是通过这种方式需要人工标注数据并进行训练，同时因为在线评论的内容长短不一、用语不规范、大量社会化内容等问题，采用上述方式进行识别的难度和人工标注成本都很高。因此本发明实施例提供了一种针对商家的扰乱性评论的识别方法以解决上述问题，其具体内容如下所述。

S1.获取商家的类别信息和属性信息；所述类别信息包括商家能够划分为的多种类别；所述属性信息包括商家的名称和地址。

示例性地，商家的类别信息和属性信息可以从购物平台的后台系统中进行读取，也可以通过用户上传的配置数据进行获取。

S2.根据所述类别信息从预设的类别嵌入矩阵中获取商家各个所属类别的表示向量，并计算商家所有类别的表示向量的平均值，得到商家的类别特征向量。

示例性地，所述类别嵌入矩阵为E _c∈R ^k×d，R表示实数域，d表示向量维度，k表示所有商家涵盖的类别总数；类别特征向量的计算方式为：

在上述实现过程中，通过所有商家涵盖的类别总数构建的类别嵌入矩阵，然后再根据商家的类别信息从该类别嵌入矩阵中获得商家各个所属类别的表示向量，最后计算商家所有类别的表示向量的平均值，得到商家的类别特征向量，可以更加准确地表示商家的类别。

S3.根据所述属性信息从预设的词嵌入矩阵中获取商家属性值的表示向量，并计算商家属性值的表示向量中所有字符向量的平均值，得到商家的属性特征向量。

示例性地，所述词嵌入矩阵为E _w∈R ^m×d，R表示实数域，d表示向量维度，m表示数据集中的词典总数；所述S3的实现方式为：

在上述实现过程中，词嵌入矩阵通过数据集中的词典总数进行构建，然后根据商家的名称和地址等从该词嵌入矩阵获取商家属性值的表示向量，并计算商家属性值的表示向量中所有字符向量的平均值，得到商家的属性特征向量，可以很好地表示商家的属性特征。

S4.将所述类别特征向量和所述属性特征向量进行拼接得到商家特征向量。

示例性地，商家特征向量为：e=[e _c，e _a]，式中，e表示商家特征向量，且e∈R ^2d。

S5.获取用户做出的评论并通过层次注意力模型处理得到所述评论对应的评论表示向量。

在一种实施方式中，上述过程可以按照以下方式进行处理：

S51.通过预设的词嵌入矩阵获取所述评论中各个句子中的各个词的词表示向量x _it；将所述词表示向量x _it输入第一双向GRU网络，得到所述词表示向量x _it对应的两个输出，并对这两个输出进行拼接得到参数h _it。

在一种实施方式中，评论中各个句子中的各个词可以表示为w _it(t∈[0，T]，i∈[0，L]，T表示句子中词的总数，L表示句子的总数)，则各个词w _it的词表示向量x _it经过第一双向GRU网络处理后的两个输出如下：

则拼接后的参数h _it=

。

S52.将参数h _it输入第一多层感知器，得到对应的输出结果u _it。

在一种实施方式中，输出结果u _it可以表示为：u _it=tanh（W _w h _it +b _w），式中W _w为h _it表示的权重，b _w为h _it表示的偏置值。

S53.计算所述输出结果u _it与第一随机初始化向量u _w的第一内积；通过第一softmax函数根据所述第一内积得到每个时间步输出的第一权重a _it，并根据所述第一权重a _it和参数h _it进行加权求和，得到每个句子的句子表示向量s _i。

示例性地，第一权重a _it和句子表示向量s _i的计算方式为：

上式中，u _it ^T表示u _it的转置。

S54. 将所述句子表示向量s _i输入第二双向GRU网络得到句子表示向量s _i对应的两个输出，并对这两个输出进行拼接得到参数h _i。

在一种实施方式中，各个句子表示向量s _i输入第二双向GRU网络后得到的两个输出结果如下：

则拼接后的参数h _i=

。

S55.将参数h _i输入第二多层感知器，得到对应的输出结果u _i。

在一种实施方式中，输出结果u _i可以表示为：u _i=tanh（W _s h _i +b _s），式中W _s为h _i表示的权重，b _s为h _i表示的偏置值。

S56.计算该输出结果u _i与第二随机初始化向量u _s的第二内积；通过第二softmax函数根据所述第二内积得到每个时间步输出的第二权重a _i，并根据所述第二权重a _i和参数h _i进行加权求和，得到每个评论的评论表示向量。

示例性地，第二权重a _i和评论表示向量v的计算方式为：

上式中，u _i ^T表示u _i的转置，评论表示向量v∈R ^d。

需要说明的是，第一双向GRU网络和第二双向GRU网络也可以均替换为双向LSTM网络。在实际使用时可以根据实际需求进行选择。

S6.将所述商家特征向量和所述评论表示向量映射到匹配空间计算得到匹配概率，并根据所述匹配概率识别出扰乱性评论。

在一种实施方式中，匹配概率的计算方式为：

p = sigmoid（vMe）

示例性地，若匹配概率p的值小于0.5则认为该评论为扰乱性评论。需要说明的是匹配概率p的值也可以根据实际情况进行调整。

在一种实施方式中，上述方法还包括：从原始评论数据集中获取一个训练数据集，按照S1-S6的过程和目标函数L对层次注意力模型中的参数进行优化，其中目标函数L的计算方式为：

式中，p表示匹配概率；r _ij表示评论与商家的匹配关系，当评论与商家匹配时，r _ij=1；否则r _ij=0。通过上述方式可以对层次注意力模型中W _w、W _s、E _w等参数进行优化，使结果更加准确。

请参看图2，图2为本发明实施例提供的一种针对商家的扰乱性评论的识别系统的拓扑结构图。

在一种实施方式中，本发明实施例还提供了一种针对商家的扰乱性评论的识别系统10，包括：

获取模块100，用于获取商家的类别信息和属性信息；所述类别信息包括商家能够划分为的多种类别；所述属性信息包括商家的名称和地址；

第一运算模块200，用于根据所述类别信息从预设的类别嵌入矩阵中获取商家所有类别的表示向量，并计算商家所有类别的表示向量的平均值，得到商家的类别特征向量；

第二运算模块300，用于根据所述属性信息从预设的词嵌入矩阵中获取商家属性值的表示向量，并计算商家属性值的表示向量中所有字符向量的平均值，得到商家的属性特征向量；

拼接模块400，用于将所述类别特征向量和所述属性特征向量进行拼接得到商家特征向量；

第三运算模块500，用于获取用户做出的评论并通过层次注意力模型处理得到所述评论对应的评论表示向量；

识别模块600，用于将所述商家特征向量和所述评论表示向量映射到匹配空间计算得到匹配概率，并根据所述匹配概率识别出扰乱性评论；其中，匹配概率的计算方式为：

p = sigmoid（vMe）

综上所述，本发明实施例提供一种针对商家的扰乱性评论的识别方法及系统，包括：获取商家的类别信息和属性信息；根据类别信息从预设的类别嵌入矩阵中获取商家各个所属类别的表示向量，并计算商家所有类别的表示向量的平均值，得到商家的类别特征向量；根据属性信息从预设的词嵌入矩阵中获取商家属性值的表示向量，并计算商家属性值的表示向量中所有字符向量的平均值，得到商家的属性特征向量；将类别特征向量和属性特征向量进行拼接得到商家特征向量；获取用户做出的评论并通过层次注意力模型处理得到评论对应的评论表示向量；将商家特征向量和评论表示向量映射到匹配空间计算得到匹配概率，并根据匹配概率识别出扰乱性评论；识别扰乱性评论的同时降低了人工成本。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种针对商家的扰乱性评论的识别方法，其特征在于，包括：

p = sigmoid（vMe）

2.根据权利要求1所述的方法，其特征在于，所述S5包括：

S56.计算所述输出结果u _i与第二随机初始化向量u _s的第二内积；通过第二softmax函数根据所述第二内积得到每个时间步输出的第二权重a _i，并根据所述第二权重a _i和参数h _i进行加权求和，得到每个评论的评论表示向量。

3.根据权利要求2所述的方法，其特征在于，所述第一双向GRU网络和所述第二双向GRU网络均替换为双向LSTM网络。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，所述类别嵌入矩阵为E _c∈R ^k×d，R表示实数域，d表示向量维度，k表示所有商家涵盖的类别总数；所述S2的实现方式为：

6.根据权利要求5所述的方法，其特征在于，所述词嵌入矩阵为E _w∈R ^m×d，R表示实数域，d表示向量维度，m表示数据集中的词典总数；所述S3的实现方式为：

7.根据权利要求6所述的方法，其特征在于，所述商家特征向量为：e=[e _c，e _a]；式中，e表示商家特征向量，且e∈R ^2d。

8.一种针对商家的扰乱性评论的识别系统，其特征在于，包括：

第三运算模块，用于获取用户做出的评论并通过层次注意力模型处理得到所述评论对应的评论表示向量；

p = sigmoid（vMe）