CN110276068A

CN110276068A - 法律案情分析方法及装置

Info

Publication number: CN110276068A
Application number: CN201910379141.1A
Authority: CN
Inventors: 肖朝军; 钟皓曦; 曾国洋; 刘知远
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2019-05-08
Filing date: 2019-05-08
Publication date: 2019-09-24
Anticipated expiration: 2039-05-08
Also published as: CN110276068B

Abstract

本发明实施例提供一种法律案情分析方法及装置。其中，方法包括：对待分析的案件描述文本进行分词和命名实体识别，获取句子序列；根据句子序列包含的各词语获取多个词向量，利用第一循环神经网络对每一词向量进行编码，并获取各分析任务对应的任务文本向量；将各要素判断任务对应的任务文本向量进行最大池化，获得要素判断任务的整体任务文本向量，利用第二循环神经网络对要素判断任务的整体任务文本向量和案由预测任务对应的任务文本向量进行编码，获取案由预测任务对应的第一隐向量，并将案由预测任务对应的第一隐向量输入至案由预测模型，获取案由预测结果。本发明实施例提供的法律案情分析方法及装置，能提高分析准确度。

Description

法律案情分析方法及装置

技术领域

本发明涉及计算机技术领域，更具体地，涉及一种法律案情分析方法及装置。

背景技术

随着人工智能技术的高速发展，利用人工智能来帮助司法领域的发展成为了时代必然趋势。近几年来，人工智能与法律的交叉学科研究有很多。上个世纪，许多学者利用数学统计算法、关键词匹配算法对法律案件进行案情分析。随着机器学习技术的发展，更多学者开始通过手动抽取文本特征的方法，来进一步自动分析案情。随着深度学习技术高速发展，许多学者专注于利用神经网络抽取文本中蕴含的信息，来进一步提高案件分析的质量。但是，这些方法普遍无法解决实际场景中案件数量分布极度不均衡，相似罪名极度易混淆的问题。在实际场景中，有许多罪名、法条出现频次很低，而传统的深度学习模型无法准确地给出这些案件的分析结果。换句话说，传统的深度学习方法只能够分析最常出现的部分罪名/案由的案件事实，且现有技术无法很好的区分相似罪名案件的区别，不具有好的实用性。

综上所述，现有的技术只能够分析高频的部分罪名的案件事实，且无法区分相似罪名的案件，因此现有技术对案件的分析准确度低且覆盖率低。

发明内容

本发明实施例提供一种法律案情分析方法及装置，用以解决或者至少部分地解决现有法律案情分析方法准确度低的缺陷。

第一方面，本发明实施例提供一种法律案情分析方法，包括：

对待分析的案件描述文本进行分词和命名实体识别，获取句子序列、事件序列和命名实体；

根据所述句子序列包含的各词语、所述事件序列和所述命名实体，获取多个词向量，利用第一循环神经网络对每一所述词向量进行编码，并根据编码结果、任务隐向量和相关矩阵获取各分析任务对应的任务文本向量；其中，所述分析任务包括要素判断任务和案由预测任务；要素为与判断案由相关的多个法学要素；所述要素判断任务的个数与要素的个数相同，各所述要素判断任务分别对应一个所述法学要素；所述任务隐向量的个数与所述分析任务的个数相同，各所述任务隐向量分别对应一个所述分析任务；

将各所述要素判断任务对应的任务文本向量进行最大池化，获得所述要素判断任务的整体任务文本向量，利用第二循环神经网络对所述要素判断任务的整体任务文本向量和所述案由预测任务对应的任务文本向量进行编码，获取所述案由预测任务对应的第一隐向量，并将所述案由预测任务对应的第一隐向量输入至案由预测模型，获取待分析的案件描述文本的案由预测结果；

其中，所述第一循环神经网络、所述任务隐向量、所述相关矩阵、所述第二循环神经网络和所述案由预测模型，均是基于样本法律文书进行训练后获得的。

优选地，所述分析任务还包括：相关法条预测任务和时长预测任务；

相应地，获得所述要素判断任务的整体任务文本向量之后包括：

利用第二循环神经网络对所述要素判断任务的整体任务文本向量、所述案由预测任务对应的任务文本向量、所述相关法条预测任务对应的任务文本向量和所述时长预测任务对应的任务文本向量进行编码，获取所述案由预测任务、所述相关法条预测任务和所述时长预测任务分别对应的第一隐向量；

将所述案由预测任务对应的第一隐向量、所述相关法条预测任务对应的第一隐向量和所述时长预测任务对应的第一隐向量，分别输入至所述案由预测模型、相关法条预测模型和时长预测模型，获取待分析的案件描述文本的案由预测结果、相关法条预测结果和时长预测结果；

其中，所述相关法条预测模型和所述时长预测模型，均是基于所述样本法律文书进行训练后获得的。

优选地，所述根据编码结果、任务隐向量和相关矩阵获取各分析任务对应的任务文本向量之后，还包括：

将每一所述要素判断任务对应的任务文本向量，分别输入至所述要素判断任务对应的要素判断模型，获取所述要素判断任务的结果；

其中，各所述要素判断任务对应的要素判断模型，均是基于所述样本法律文书进行训练后获得的。

优选地，对待分析的案件描述文本进行分词和命名实体识别，获取句子序列、事件序列和命名实体的具体步骤包括：

对所述待分析的案件描述文本进行分词和词性标注，删除停用词，获得多个句子；每一句子包含若干个词语及每一词语对应的词性；

根据预先构造的触发词表对所述多个句子进行筛选，保留描述与案件有关的重要事实的句子，组成所述句子序列；

根据预设的规则、句法依存关系、所述句子序列中各句子包含的词语及词语对应的词性，获取所述待分析的案件描述文本描述的若干个事件和各命名实体，将所述若干个事件按照事件发生时间的先后顺序，组成所述事件序列。

优选地，根据所述句子序列包含的各词语、所述事件序列和所述命名实体，获取多个词向量的具体步骤包括：

将所述句子序列包含的各词语，按照所述事件序列中各事件发生时间的先后顺序进行拼接，获得词语序列；

根据预训练获得的词向量表对所述词语序列进行映射，获得所述句子序列包含的每一词语的原始词向量；

对于所述句子序列包含的每一词语，根据所述词语所在句子所描述的事件及所述词语是否为所述命名实体，对所述词语的原始词向量进行扩展，获取所述词语对应的词向量，获取所述多个词向量。

优选地，所述根据编码结果、任务隐向量和相关矩阵获取各分析任务对应的任务文本向量的具体步骤包括：

对于每一所述分析任务，根据所述编码结果、所述分析任务对应的任务隐向量和所述相关矩阵，获取所述编码结果对应的权重，并根据所述编码结果对应的权重对所述编码结果进行加权求和，获取所述分析任务对应的任务文本向量。

优选地，所述第一循环神经网络为长短时记忆神经网络；所述第二循环神经网络为长短时记忆神经网络。

第二方面，本发明实施例提供一种法律案情分析装置，包括：

数据处理模块，用于对待分析的案件描述文本进行分词和命名实体识别，获取句子序列、事件序列和命名实体；

事实编码模块，用于根据所述句子序列包含的各词语、所述事件序列和所述命名实体，获取多个词向量，利用第一循环神经网络对每一所述词向量进行编码，并根据编码结果、任务隐向量和相关矩阵获取各分析任务对应的任务文本向量；其中，所述分析任务包括要素判断任务和案由预测任务；要素为与判断案由相关的多个法学要素；所述要素判断任务的个数与要素的个数相同，各所述要素判断任务分别对应一个所述法学要素；所述任务隐向量的个数与所述分析任务的个数相同，各所述任务隐向量分别对应一个所述分析任务；

任务序列预测模块，用于将各所述要素判断任务对应的任务文本向量进行最大池化，获得所述要素判断任务的整体任务文本向量，利用第二循环神经网络对所述要素判断任务的整体任务文本向量和所述案由预测任务对应的任务文本向量进行编码，获取所述案由预测任务对应的第一隐向量，并将所述案由预测任务对应的第一隐向量输入至案由预测模型，获取待分析的案件描述文本的案由预测结果；

第三方面，本发明实施例提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，执行所述程序时实现如第一方面的各种可能的实现方式中任一种可能的实现方式所提供的法律案情分析方法的步骤。

第四方面，本发明实施例提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如第一方面的各种可能的实现方式中任一种可能的实现方式所提供的法律案情分析方法的步骤。

本发明实施例提供的法律案情分析方法及装置，基于法律要素与案由之间的依赖关系对法律案情进行分析，能根据要素区分相似罪名的案件，并能适用于分析全部案由的案件事实，而不限于常见的部分案由的案件事实，从而能大大提高案件分析的准确度，并具有更高的案件覆盖率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为根据本发明实施例提供的法律案情分析方法的流程示意图；

图2为根据本发明实施例提供的法律案情分析装置的结构示意图；

图3为根据本发明实施例提供的电子设备的实体结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了克服现有技术的上述问题，本发明实施例提供一种法律案情分析方法及装置，其发明构思是，通过训练获得的模型对与判断案由相关的多个法学要素进行分析，根据法学要素的分析结果和机器学习模型，获得更准确的案由预测结果。

图1为根据本发明实施例提供的法律案情分析方法的流程示意图。如图1所示，方法包括：步骤S101、对待分析的案件描述文本进行分词和命名实体识别，获取句子序列、事件序列和命名实体。

具体地，待分析的案件描述文本，描述了一段案件事实。

句子序列中的每个句子，是一个词语序列。该词语序列，由待分析的案件描述文本中的一个句子(指由逗号、分号或句号分隔开的句子)进行分词获得。

对于中文文本，可以采用现有的任一中文分词包进行分词，例如现有开源的中文分词包thulac。

对于句子序列中的每个句子，若该句子包含特定的词语，则可以获取该句子包含的事件，从而可以获取句子序列包含的全部事件。

例如，若句子序列中的某个句子中包含“殴打”一词，则该句子包含攻击事件。

命名实体至少包括人名、地名和单位名称等。人名、地名和单位名称等具有明显的文本特征，因而可以抽取出句子序列包含的词语中的各命名实体。

步骤S102、根据句子序列包含的各词语、事件序列和命名实体，获取多个词向量，利用第一循环神经网络对每一词向量进行编码，并根据编码结果、任务隐向量和相关矩阵获取各分析任务对应的任务文本向量。

其中，分析任务包括要素判断任务和案由预测任务；要素为与判断案由相关的多个法学要素；要素判断任务的个数与要素的个数相同，各要素判断任务分别对应一个法学要素；任务隐向量的个数与分析任务的个数相同，各任务隐向量分别对应一个分析任务。

具体地，深度学习模型以词向量序列的形式读取序列化的单词，获取句子序列、事件序列和命名实体之后，对于句子序列包含的各词语，利用任一用来产生词向量的相关模型，并结合事件序列和命名实体，可以获得一个词向量序列。该词向量序列包括多个词向量，每一词向量对应句子序列包含的一个词语。

用来产生词向量的相关模型，可以为Word2vec、GloVe和FastText等中的任意一种，本发明实施例对此不作具体限制。

获得词向量序列后，可以利用第一循环神经网络对该词向量序列中的每一词向量进行编码，捕捉句子前后关联的语义信息，编码结果为第二隐向量序列或第二隐向量矩阵。第二隐向量序列的长度与词向量序列的长度相同，即第二隐向量序列中第二隐向量的个数为句子序列包含的词语的个数。

任一词向量输入第一循环神经网络，第一循环神经网络输出一个新的向量，称为第二隐向量。

为了得到与分析任务相关的文本向量，采用注意力机制将第二隐向量序列映射到不同的任务文本空间，得到不同的分析任务对应的任务文本向量。

分析任务至少包括要素判断任务和案由预测任务。要素为与判断案由相关的多个法学要素，因而要素判断任务的个数为多个，分别用于对不同的法学要素的取值进行判断和预测。要素是预先确定的，有多少个要素，相应地有多少个要素预测任务。

例如，对于刑事案件，要素可以包括盈利、买卖、死亡、暴力、国家机关或国家工作人员、公共场合、非法占用、伤害、主观故意和生产作业期间等10个要素。

上述10个要素的含义分别为：盈利，指被告(或犯罪嫌疑人)是否以盈利为目的；买卖，指被告(或犯罪嫌疑人)行为中是否涉及买卖行为；死亡，指被害人是否死亡；暴力，指被告(或犯罪嫌疑人)是否采用了暴力手段犯罪；国家机关或国家工作人员，指案件中是否涉及国家机关与国家工作人员；公共场合，指案件是否发生在公共场合；非法占用，指被告(或犯罪嫌疑人)是否以非法占用为目的；伤害，指被害人是否受伤；主观故意，指被告(或犯罪嫌疑人)主观上是否故意犯罪；生产作业期间，指案件是否发生在生产作业期间。

对于不同类型的行政案件(如治安案件、交通违法案件和工商行政案件等)，可以采用相应的要素，以判断案由。

可以理解的是，每一要素判断任务均有一个对应的任务文本向量。

为了实现注意力机制，为每一个分析任务定义了一个任务隐向量，因而任务隐向量的个数与分析任务的个数相同，各任务隐向量分别对应一个分析任务。任务向量作为查询向量(query)。

相关矩阵，用于表示编码结果与各任务隐向量的相关程度。

案由预测任务，用于预测案由。

步骤S103、将各要素判断任务对应的任务文本向量进行最大池化，获得要素判断任务的整体任务文本向量，利用第二循环神经网络对要素判断任务的整体任务文本向量和案由预测任务对应的任务文本向量进行编码，获取案由预测任务对应的第一隐向量，并将案由预测任务对应的第一隐向量输入至案由预测模型，获取待分析的案件描述文本的案由预测结果。

由于要素判断任务对应的任务文本向量的个数为多个，为了便于进行案由预测，将各要素判断任务对应的任务文本向量定义为对各要素判断任务对应的任务文本向量进行最大池化后的结果。

t_attr＝max_pooling([t₁,t₂,...,t_k])

t_attr,i＝max(t_1,i,t_2,i,...,t_k,i)

其中，t_attr表示要素判断任务的整体任务文本向量；t₁,t₂,...,t_k分别表示各要素判断任务对应的任务文本向量；k为正整数，表示要素判断任务的个数；t_attr,i表示t_attr的第i个元素值；1≤i≤d₁，d₁表示任务文本向量的维数；t_1,i,t_2,i,...,t_k,i分别表示各要素判断任务对应的任务文本向量的第i个元素值。

利用第二循环神经网络捕捉各分析任务之间的依赖关系，当分析任务包括要素判断任务和案由预测任务时，要素判断任务的整体任务文本向量为t_attr，案由预测任务对应的任务文本向量为t_accu，将t_attr和t_accu按要素判断任务和案由预测任务的顺序组成任务序列，通过第二循环神经网络得到要素判断任务对应的第一隐向量和案由预测任务对应的第一隐向量计算公式为

其中，RNN表示第二循环神经网络执行的运算。

获得案由预测任务对应的第一隐向量之后，将输入至案由预测模型，实现将第一隐向量映射到案由预测任务对应的标签空间上，获得案由预测结果。

例如，对于刑事案件，案由预测任务对应的标签可以包括盗窃罪、抢劫罪、故意伤害罪和贪污罪等；对于交通违法案件，案由预测任务对应的标签可以包括超速、不按交通信号灯规定通行、违反交通禁令标志和故意遮挡污损机动车号牌等。

案由预测模型，可以为任一种训练好的分类器，例如支持向量机、人工神经网络和决策树等。

例如，采用训练好的全连接神经网络作为案由预测模型，对于案由预测模型的输出其中，Y_accu＝{盗窃罪,抢劫罪，...}，则案由预测模型输出的案由预测结果y_accu为

其中，softmax表示案由预测模型执行的运算；W_accu和b_accu均表示案由预测模型的参数。

可以理解的是，案由预测结果。y_accu为向量，y_accu每一维度的取值代表对应标签的概率。也就是说，y_accu的各元素值分别表示对应的案由标签的概率。

其中，第一循环神经网络、任务隐向量、相关矩阵、第二循环神经网络和案由预测模型，均是基于样本法律文书进行训练后获得的。

可以理解的是，可以基于样本法律文书进行训练，调整参数，获得第一循环神经网络、各任务隐向量、相关矩阵、第二循环神经网络和案由预测模型。

样本法律文书，指确定最终法律结果的法律文书。例如，对于刑事案件，可以为法院的判决文书；对于行政案件，可以为行政管理机关下达的行政处罚决定书。

本发明实施例基于法律要素与案由之间的依赖关系对法律案情进行分析，能根据要素区分相似罪名的案件，并能适用于分析全部案由的案件事实，而不限于常见的部分案由的案件事实，从而能大大提高案件分析的准确度，并具有更高的案件覆盖率。

基于上述各实施例的内容，分析任务还包括：相关法条预测任务和时长预测任务。

具体地，为了进一步提高案情分析的全面性，还可以对相关法条和时长进行分析，因而分析任务还包括相关法条预测任务和时长预测任务。

相关法条预测任务，用于预测相关法条。

时长预测任务，用于预测处罚的时长。例如，对于刑事案件，处罚的时长为刑期；对于不同的行政案件，处罚的时长可以分别为行政拘留的时长、停业整顿的时长和暂扣驾驶证的时长等。

相应地，获得要素判断任务的整体任务文本向量之后包括：利用第二循环神经网络对要素判断任务的整体任务文本向量、案由预测任务对应的任务文本向量、相关法条预测任务对应的任务文本向量和时长预测任务对应的任务文本向量进行编码，获取案由预测任务、相关法条预测任务和时长预测任务分别对应的第一隐向量。

具体地，分析任务包括要素判断任务、案由预测任务、相关法条预测任务和时长预测任务时，将要素判断任务的整体任务文本向量t_attr、案由预测任务对应的任务文本向量t_accu、相关法条预测任务对应的任务文本向量t_law和时长预测任务对应的任务文本向量t_time，按照要素判断任务、案由预测任务、相关法条预测任务和时长预测任务的顺序，组成任务序列，利用第二循环神经网络捕捉各分析任务之间的依赖关系，对该任务序列进行编码，获得要素判断任务对应的第一隐向量案由预测任务对应的第一隐向量相关法条预测任务对应的第一隐向量和时长预测任务对应的第一隐向量

例如，采用长短时记忆神经网络作为第二循环神经网络时，各分析任务对应的第一隐向量的计算公式为

其中，LSTM表示长短时记忆神经网络执行的运算。

案由预测任务，依赖于各要素判断任务；相关法条预测任务，依赖于各要素判断任务和案由预测任务；时长预测任务，依赖于各要素判断任务、案由预测任务和相关法条预测任务。

将案由预测任务对应的第一隐向量、相关法条预测任务对应的第一隐向量和时长预测任务对应的第一隐向量，分别输入至案由预测模型、相关法条预测模型和时长预测模型，获取待分析的案件描述文本的案由预测结果、相关法条预测结果和时长预测结果。

其中，相关法条预测模型和时长预测模型，均是基于样本法律文书进行训练后获得的。

具体地，获得案由预测任务对应的第一隐向量相关法条预测任务对应的第一隐向量和时长预测任务对应的第一隐向量之后，将和分别输入至案由预测模型、相关法条预测模型和时长预测模型，实现将第一隐向量和分别映射到案由预测任务、相关法条预测任务和时长预测任务对应的标签空间上，获得案由预测结果、相关法条预测结果、时长预测结果。

获得案由预测结果、相关法条预测结果、时长预测结果的具体步骤，与上述实施例中获得案由预测结果的具体步骤类似，此处不再赘述。

可以理解的是，可以基于样本法律文书进行训练，调整参数，获得相关法条预测模型和时长预测模型。

分析任务包括要素判断任务、案由预测任务、相关法条预测任务和时长预测任务

本发明实施例基于法律要素、案由与相关法条之间的依赖关系对相关法条进行预测，基于法律要素、案由、相关法条与时长之间的依赖关系对时长进行预测，能获得更准确地相关法条预测结果和时长预测结果，从而能提高案件分析的准确度和全面性。

基于上述各实施例的内容，根据编码结果、任务隐向量和相关矩阵获取各分析任务对应的任务文本向量之后，还包括：将每一要素判断任务对应的任务文本向量，分别输入至要素判断任务对应的要素判断模型，获取要素判断任务的结果。

其中，各要素判断任务对应的要素判断模型，均是基于样本法律文书进行训练后获得的。

具体地，获得各分析任务对应的任务文本向量t₁,t₂,...,t_k之后，将t₁,t₂,...,t_k分别输入至各自对应的要素判断模型，获得各要素的预测值，作为要素判断任务的结果。

任一要素的预测值的预测公式为

y_i＝softmax(W_it_i+b_i)

其中，t_i表示第i个要素判断任务对应的任务文本；y_i表示第i个要素的预测值；1≤i≤k；k为正整数，表示要素的个数；W_i和b_i均表示第i个要素判断模型的参数；Y_attr＝{是,否}。

可以理解的是，y_i为向量，y_i每一维度的取值代表对应标签的概率。例如，y_i＝[0.1,0.9]，表示第i个要素取值为否的概率为90％，取值为是的概率为10％。

可以理解的是，可以基于样本法律文书进行训练，调整参数，获得各要素判断模型。

本发明实施例通过要素判断模型和各要素判断任务对应的任务文本向量，获得各要素的预测值，便于更全面地了解案件的要点，能提高案情分析的全面性和智能化水平。

基于上述各实施例的内容，对待分析的案件描述文本进行分词和命名实体识别，获取句子序列、事件序列和命名实体的具体步骤包括：对待分析的案件描述文本进行分词和词性标注，删除停用词，获得多个句子；每一句子包含若干个词语及每一词语对应的词性。

具体地，对待分析的案件描述文本中的每个句子进行分词，对分词获得的每个词语进行词性标注，并删除停用词，将待分析的案件描述文本转化为句子的原始序列s＝{s₁,s₂,...,s_m}。该原始序列包括多个句子s₁,s₂,...,s_m，m表示原始序列中句子的数量。

停用词是指在处理自然语言数据(或文本)中，为节省存储空间和提高处理效率，在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词，这些字或词即被称为Stop Words(停用词)。

对于法律案情分析，停用词主要包括人类语言中包含的功能词，这些功能词极其普遍，与其他词相比，功能词没有什么实际含义。

原始序列中每个句子s_j为一个词语序列s_j＝{w_j1,w_j2,...,w_jn}，以及各个词语对应的词性c_j＝{c_j1,c_j2,...,c_jn}。其中，n表示句子s_j包含的词语的数量；w_ji表示第j个句子中的第i个词语；1≤j≤m；1≤i≤n；c_ji表示第j个句子中的第i个词语对应的词性，即w_ji对应的词性；c_ji∈C，C表示词性表。

根据预先构造的触发词表对多个句子进行筛选，保留描述与案件有关的重要事实的句子，组成句子序列。

获得原始序列之后，可以根据预先构造的触发词表对原始序列中的句子进行筛选，检测文本中涉及的对案件发展有意义的事实，保留描述与案件有关的重要事实的句子，删除未描述与案件有关的重要事实的句子，将保留的句子组成句子序列s′＝{s′₁,s′₂,...,s′_m′}。m′表示句子序列中句子的数量。

包含事件触发词的句子被认为包含触发词对应的事件。例如，“殴打”为一个触发词，若句子序列中的某个句子中包含“殴打”一词，则该句子包含攻击事件。

根据预设的规则、句法依存关系、句子序列中各句子包含的词语及词语对应的词性，获取待分析的案件描述文本描述的若干个事件和各命名实体，将若干个事件按照事件发生时间的先后顺序，组成事件序列。

具体地，根据句法依存关系、词性等特征，利用预设的规则，从句子序列中各句子包含的词语中抽取出各命名实体，通过抽取的人名、地名等实体可以抽取出相关事件的发生地点、事件人物、发生时间等属性，从而获取描述的若干个事件及每一事件发生的地点，涉及人物以及发生时间。

例如，预设的规则为动词“殴打”的宾语为攻击事件的受害者，从而可以根据动词“殴打”前后的词语确定涉及攻击事件的人物，主语为施害者、宾语为受害者。

获得上述若干个事件后，可以梳理出事实时间线，将上述若干个事件按照事件发生时间的先后顺序，而不是在句子序列中出现的先后顺序，组成事件序列。对于事件序列中的每一事件，除了标注是什么事件之外，如果获取到事件发生的地点，涉及人物以及发生时间。

例如，待分析的案件描述文本为“李某入室盗窃财物，盗窃过程中被主人发现，随即与主人发生打斗使主人流血受伤，李某立马逃走了”；进行中文分词和词性(如v表示动词，p表示介词，n表示名词，np表示人名，d表示副词，w表示标点等)标注的结果为(李某，np)(入室，v)(盗窃，v)(财物，n)(，，w)(盗窃，v)(过程，n)(中，f)(被，p)(主人，n)(发现，v)(，，w)(随即，d)(与，c)(主人，n)(发生，v)(打斗，v)(使，v)(主人，n)(流血，v)(受伤，v)(，，w)(李某，np)(立马，d)(逃走，v)(了，u)(。，w))；删除被、中等中文停用词的结果为(李某，np)(入室，v)(盗窃，v)(财物，n)(盗窃，v)(过程，n)(主人，n)(发现，v)(随即，d)(与，c)(主人，n)(发生，v)(打斗，v)(主人，n)(流血，v)(受伤，v)(李某，np)(立马，d)(逃走，v)；进行命名实体识别的结果为获得句子“李某入室盗窃财物盗窃过程主人发现与主人发生打斗主人流血受伤李某立马逃走”，实体包括(李某，np)和(主人，n)；进行检测，获得事件序列为事件1：盗窃事件，人物：李某，事件2：攻击事件，人物：李某、主人。

本发明实施例通过触发词对句子进行筛选，能够筛除无用事实，降低输入噪音，从而能减少数据处理量并提高分析准确度。

基于上述各实施例的内容，根据句子序列包含的各词语、事件序列和命名实体，获取多个词向量的具体步骤包括：将句子序列包含的各词语，按照事件序列中各事件发生时间的先后顺序进行拼接，获得词语序列。

具体地，将句子序列s′包含的词语按照事件发生时间的先后顺序进行拼接，得到一个输入词语序列w＝{w₁,w₂,...,w_l}。其中，l表示词语的数量。

根据预训练获得的词向量表对词语序列进行映射，获得句子序列包含的每一词语的原始词向量。

对词向量进行预训练，得到一个词向量表。预训练可以采用Word2vec、GloVe和FastText等中的任意一种方法，本发明实施例对此不作具体限制。

将输入的词语序列通过上述词向量表映射得到每一词语的原始词向量。

对于句子序列包含的每一词语，根据词语所在句子所描述的事件及词语是否为命名实体，对词语的原始词向量进行扩展，获取词语对应的词向量，获取多个词向量。

对于句子序列包含的每一词语，根据词语所在句子所描述的事件，以及该词语是否为命名实体(包括是哪一种命名实体)，对该词语的原始词向量进行扩展，即在该词语的原始词向量后增加若干个元素，增加的若干个元素用于表示词语所在句子所描述的事件以及该词语是哪一种命名实体，从而将该词语的原始词向量扩展为该词语对应的词向量。

对句子序列包含的每一词语都进行扩展之后，得到多个词向量，构成词向量序列其中，l表示词语数量，d表示词向量的维度。

v＝{v₁,v₂,...,v_l}

其中，v₁,v₂,...,v_l分别为词语w₁,w₂,...,w_l对应的词向量。

本发明实施例根据词语所在句子所描述的事件及词语是否为命名实体，对词语的原始词向量进行扩展，获取词语对应的词向量，使得词向量能更好地描述该词语的语境，从而能根据词向量获得更准确的要素判断结果和案由分析结果。

基于上述各实施例的内容，根据编码结果、任务隐向量和相关矩阵获取各分析任务对应的任务文本向量的具体步骤包括：对于每一分析任务，根据编码结果、分析任务对应的任务隐向量和相关矩阵，获取编码结果对应的权重，并根据编码结果对应的权重对编码结果进行加权求和，获取分析任务对应的任务文本向量。

可以理解的是，编码结果为第二隐向量序列其中，d₁表示第二隐向量的维数。

h＝{h₁,h₂,...,h_l}

第二隐向量序列h包括1个第二隐向量，即第二隐向量序列的长度与词语序列w的长度相同。

各任务隐向量可以组成任务向量序列u＝{u₁,u₂,...,u_p}；其中，u_i表示第i个分析任务对应的任务隐向量；1≤i≤p；p表示分析任务的数量。

例如，要素预测任务的数量为10，其他分析任务还包括案由预测任务、相关法条预测任务和时长预测任务，则p＝13。

对于第i个分析任务，根据该分析任务对应的任务隐向量u_i、第二隐向量序列h和相关矩阵W^a，可以获得该分析任务对应的任务文本向量t_i。

具体步骤如下：

获取该分析任务的权重向量权重向量α由第二隐向量序列h中各第二隐向量的权重组成；

权重的计算公式为

其中，α_j表示第二隐向量序列h中第j个第二隐向量的权重；1≤j≤l；

获得该分析任务的权重向量α之后，通过如下公式计算获得t_i，

通过上述步骤，可以获得每一个分析任务对应的任务文本向量。

本发明实施例基于编码结果与任务隐向量之间的相关程度，获得编码结果对于每一任务隐向量的权重，根据编码结果对应的权重对编码结果进行加权求和，获取分析任务对应的任务文本向量，能更准确地表征各分析任务的特征，从而获得更准确的案情分析结果。

基于上述各实施例的内容，第一循环神经网络为长短时记忆神经网络；第二循环神经网络为长短时记忆神经网络。

具体地，第一循环神经网络和第二循环神经网络均可以采用门控循环神经网络。

门控循环神经网络在简单循环神经网络的基础上对网络的结构做了调整，加入了门控机制，用来控制神经网络中信息的传递。门控机制可以用来控制记忆单元中的信息有多少需要保留，有多少需要丢弃，新的状态信息又有多少需要保存到记忆单元中等。这使得门控循环神经网络可以学习跨度相对较长的依赖关系，而不会出现梯度消失和梯度爆炸的问题。

常见的门控循环神经网络包括长短时记忆神经网络和门控制循环单元。

优选地，第一循环神经网络和第二循环神经网络均可以采用长短时记忆神经网络。

长短时记忆神经网络(Long Short-term Memory，简称LSTM)是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。长短时记忆神经网络是一种特殊的门控循环神经网络，也是一种特殊的循环神经网络。

在一般的循环神经网络中，记忆单元没有衡量信息的价值量的能力，因此，记忆单元对于每个时刻的状态信息等同视之，这就导致了记忆单元中往往存储了一些无用的信息，而真正有用的信息却被这些无用的信息挤了出去。LSTM正是从这一点出发做了相应改进，和一般结构的循环神经网络只有一种网络状态不同，LSTM中将网络的状态分为内部状态和外部状态两种。LSTM的外部状态类似于一般结构的循环神经网络中的状态，即该状态既是当前时刻隐藏层的输出，也是下一时刻隐藏层的输入。这里的内部状态则是LSTM特有的。

在LSTM中有三个称之为“门”的控制单元，分别是输入门(input gate)、输出门(output gate)和遗忘门(forget gate)，其中输入门和遗忘门是LSTM能够记忆长期依赖的关键。输入门决定了当前时刻网络的状态有多少信息需要保存到内部状态中，而遗忘门则决定了过去的状态信息有多少需要丢弃。最后，由输出门决定当前时刻的内部状态有多少信息需要输出给外部状态。

通过选择性的记忆和遗忘状态信息，使的LSTM要比一般的循环神经网络能够学习更长时间间隔的依赖关系。

本发明实施例通过采用长短时记忆神经网络作为第一循环神经网络，能更好地捕捉句子前后关联的语义信息，通过采用长短时记忆神经网络作为第二循环神经网络，能更好地捕捉分析任务之间的依赖关系，从而能获得更准确的分析结果，提高分析的准确度。

图2为根据本发明实施例提供的法律案情分析装置的结构示意图。基于上述各实施例的内容，如图2所示，该装置包括数据处理模块201、事实编码模块202和任务序列预测模块203，其中：

数据处理模块201，用于对待分析的案件描述文本进行分词和命名实体识别，获取句子序列、事件序列和命名实体；

事实编码模块202，用于根据句子序列包含的各词语、事件序列和命名实体，获取多个词向量，利用第一循环神经网络对每一词向量进行编码，并根据编码结果、任务隐向量和相关矩阵获取各分析任务对应的任务文本向量；其中，分析任务包括要素判断任务和案由预测任务；要素为与判断案由相关的多个法学要素；要素判断任务的个数与要素的个数相同，各要素判断任务分别对应一个法学要素；任务隐向量的个数与分析任务的个数相同，各任务隐向量分别对应一个分析任务；

任务序列预测模块203，用于将各要素判断任务对应的任务文本向量进行最大池化，获得要素判断任务的整体任务文本向量，利用第二循环神经网络对要素判断任务的整体任务文本向量和案由预测任务对应的任务文本向量进行编码，获取案由预测任务对应的第一隐向量，并将案由预测任务对应的第一隐向量输入至案由预测模型，获取待分析的案件描述文本的案由预测结果；

具体地，数据处理模块201对待分析的案件描述文本进行分词，并对分词获得的词语进行命名实体识别，获取句子序列、事件序列和命名实体。

事实编码模块202获取句子序列、事件序列和命名实体之后，对于句子序列包含的各词语，利用任一用来产生词向量的相关模型，并结合事件序列和命名实体，可以获得一个包括多个词向量的词向量序列；可以利用第一循环神经网络对该词向量序列中的每一词向量进行编码，捕捉句子前后关联的语义信息，编码结果为第二隐向量序列或第二隐向量矩阵；采用注意力机制，根据任务隐向量和相关矩阵，将第二隐向量序列映射到不同的任务文本空间，得到不同的分析任务对应的任务文本向量。

任务序列预测模块203将各要素判断任务对应的任务文本向量进行最大池化，获得要素判断任务的整体任务文本向量；将要素判断任务的整体任务文本向量和案由预测任务对应的任务文本向量，按要素判断任务和案由预测任务的顺序组成任务序列，利用第二循环神经网络捕捉各分析任务之间的依赖关系，对要素判断任务的整体任务文本向量和案由预测任务对应的任务文本向量进行编码，获取案由预测任务对应的第一隐向量；将案由预测任务对应的第一隐向量输入至案由预测模型，实现将案由预测任务对应的第一隐向量映射到案由预测任务对应的标签空间上，获得案由预测结果。

本发明实施例提供的法律案情分析装置，用于执行本发明上述各实施例提供的法律案情分析方法，该法律案情分析装置包括的各模块实现相应功能的具体方法和流程详见上述法律案情分析方法的实施例，此处不再赘述。

该法律案情分析装置用于前述各实施例的法律案情分析方法。因此，在前述各实施例中的法律案情分析方法中的描述和定义，可以用于本发明实施例中各执行模块的理解。

图3为根据本发明实施例提供的电子设备的结构框图。基于上述实施例的内容，如图3所示，该电子设备可以包括：处理器(processor)301、存储器(memory)302和总线303；其中，处理器301和存储器302通过总线303完成相互间的通信；处理器301用于调用存储在存储器302中并可在处理器301上运行的计算机程序指令，以执行上述各方法实施例所提供的法律案情分析方法，例如包括：对待分析的案件描述文本进行分词和命名实体识别，获取句子序列、事件序列和命名实体；根据句子序列包含的各词语、事件序列和命名实体，获取多个词向量，利用第一循环神经网络对每一词向量进行编码，并根据编码结果、任务隐向量和相关矩阵获取各分析任务对应的任务文本向量；其中，分析任务包括要素判断任务和案由预测任务；要素为与判断案由相关的多个法学要素；要素判断任务的个数与要素的个数相同，各要素判断任务分别对应一个法学要素；任务隐向量的个数与分析任务的个数相同，各任务隐向量分别对应一个分析任务；将各要素判断任务对应的任务文本向量进行最大池化，获得要素判断任务的整体任务文本向量，利用第二循环神经网络对要素判断任务的整体任务文本向量和案由预测任务对应的任务文本向量进行编码，获取案由预测任务对应的第一隐向量，并将案由预测任务对应的第一隐向量输入至案由预测模型，获取待分析的案件描述文本的案由预测结果；其中，第一循环神经网络、任务隐向量、相关矩阵、第二循环神经网络和案由预测模型，均是基于样本法律文书进行训练后获得的。

本发明另一实施例公开一种计算机程序产品，计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，计算机程序包括程序指令，当程序指令被计算机执行时，计算机能够执行上述各方法实施例所提供的法律案情分析方法，例如包括：对待分析的案件描述文本进行分词和命名实体识别，获取句子序列、事件序列和命名实体；根据句子序列包含的各词语、事件序列和命名实体，获取多个词向量，利用第一循环神经网络对每一词向量进行编码，并根据编码结果、任务隐向量和相关矩阵获取各分析任务对应的任务文本向量；其中，分析任务包括要素判断任务和案由预测任务；要素为与判断案由相关的多个法学要素；要素判断任务的个数与要素的个数相同，各要素判断任务分别对应一个法学要素；任务隐向量的个数与分析任务的个数相同，各任务隐向量分别对应一个分析任务；将各要素判断任务对应的任务文本向量进行最大池化，获得要素判断任务的整体任务文本向量，利用第二循环神经网络对要素判断任务的整体任务文本向量和案由预测任务对应的任务文本向量进行编码，获取案由预测任务对应的第一隐向量，并将案由预测任务对应的第一隐向量输入至案由预测模型，获取待分析的案件描述文本的案由预测结果；其中，第一循环神经网络、任务隐向量、相关矩阵、第二循环神经网络和案由预测模型，均是基于样本法律文书进行训练后获得的。

此外，上述的存储器302中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本发明另一实施例提供一种非暂态计算机可读存储介质，非暂态计算机可读存储介质存储计算机指令，计算机指令使计算机执行上述各方法实施例所提供的法律案情分析方法，例如包括：对待分析的案件描述文本进行分词和命名实体识别，获取句子序列、事件序列和命名实体；根据句子序列包含的各词语、事件序列和命名实体，获取多个词向量，利用第一循环神经网络对每一词向量进行编码，并根据编码结果、任务隐向量和相关矩阵获取各分析任务对应的任务文本向量；其中，分析任务包括要素判断任务和案由预测任务；要素为与判断案由相关的多个法学要素；要素判断任务的个数与要素的个数相同，各要素判断任务分别对应一个法学要素；任务隐向量的个数与分析任务的个数相同，各任务隐向量分别对应一个分析任务；将各要素判断任务对应的任务文本向量进行最大池化，获得要素判断任务的整体任务文本向量，利用第二循环神经网络对要素判断任务的整体任务文本向量和案由预测任务对应的任务文本向量进行编码，获取案由预测任务对应的第一隐向量，并将案由预测任务对应的第一隐向量输入至案由预测模型，获取待分析的案件描述文本的案由预测结果；其中，第一循环神经网络、任务隐向量、相关矩阵、第二循环神经网络和案由预测模型，均是基于样本法律文书进行训练后获得的。

以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行上述各个实施例或者实施例的某些部分的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种法律案情分析方法，其特征在于，包括：

2.根据权利要求1所述的法律案情分析方法，其特征在于，所述分析任务还包括：相关法条预测任务和时长预测任务；

3.根据权利要求1所述的法律案情分析方法，其特征在于，所述根据编码结果、任务隐向量和相关矩阵获取各分析任务对应的任务文本向量之后，还包括：

4.根据权利要求1所述的法律案情分析方法，其特征在于，对待分析的案件描述文本进行分词和命名实体识别，获取句子序列、事件序列和命名实体的具体步骤包括：

5.根据权利要求1所述的法律案情分析方法，其特征在于，根据所述句子序列包含的各词语、所述事件序列和所述命名实体，获取多个词向量的具体步骤包括：

6.根据权利要求1所述的法律案情分析方法，其特征在于，所述根据编码结果、任务隐向量和相关矩阵获取各分析任务对应的任务文本向量的具体步骤包括：

7.根据权利要求1至6任一所述的法律案情分析方法，其特征在于，所述第一循环神经网络为长短时记忆神经网络；所述第二循环神经网络为长短时记忆神经网络。

8.一种法律案情分析装置，其特征在于，包括：

9.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至7任一项所述的法律案情分析方法的步骤。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现如权利要求1至7任一项所述的法律案情分析方法的步骤。