CN111858682A

CN111858682A - 一种基于深度学习的裁判文书逻辑评估方法及系统

Info

Publication number: CN111858682A
Application number: CN202010772877.8A
Authority: CN
Inventors: 王平辉; 王晓燕; 吴用; 许诺; 赵俊舟; 陶敬; 王悦; 杨鹏
Original assignee: Xian Jiaotong University
Current assignee: Xian Jiaotong University
Priority date: 2020-08-04
Filing date: 2020-08-04
Publication date: 2020-10-30

Abstract

本发明公开了一种基于深度学习的裁判文书逻辑评估方法及系统，包括：对裁判文书进行逻辑抽取，得到具有逻辑支撑性的“案情‑理由‑判决结果”三大部分；对该三大部分进行分句处理生成句对格式数据；构建深度学习模型，使其可以得到输入句对之间的支撑力度；将处理后的“案情‑理由‑判决结果”输入到深度学习模型中，得到“案情‑理由”之间、“理由‑判决结果”之间的逻辑支撑力度；根据“案情‑理由‑判决结果”之间的逻辑支撑力度，计算得到逻辑评估结果。本发明将裁判文书逻辑评估问题转化为“案情‑理由‑判决结果”三大部分之间的逻辑支撑性力度评估，利用深度学习模型实现了对裁判文书逻辑的高效、准确、定量评估。

Description

一种基于深度学习的裁判文书逻辑评估方法及系统

技术领域

本发明属于自然语言处理技术领域，特别涉及一种基于深度学习的裁判文书逻辑评估方法及系统。

背景技术

近年来，以深度学习(Deep Learning)为代表的人工智能技术快速发展，在司法智能化方面取得了巨大的进步，展现出了跨时代的技术理性力量。深度学习的概念源于人工神经网络的研究，含多个隐藏层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。研究深度学习的动机在于建立模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像，声音和文本等。

裁判文书是法院对已经审结案件的书面结论，裁判文书的公开是司法公开的主要体现，因此提高裁判文书的书写质量显得尤为重要。在法律领域，为了提升裁判文书质量，现在的裁判文书的质量评估主要聚焦在基本语法错别字检测、判决罪名是否有误、引用法条是否有误以及刑期是否有误，对于裁判文书的行文逻辑评估，现在绝大多数法院还是采取法官互评的方式进行人为评估，而未实现自动化地对裁判文书的逻辑性进行评价。

对于法院处理的每一例案件，不仅要让判决结果完全符合法律的规定，还要让判决结果有理有据，逻辑支撑性强。因此，分析案件的案情、理由和判决结果之间的因果逻辑关系，自动化、细粒度地对法官裁判文书的逻辑进行定量评估显得非常重要。

发明内容

为了高效、准确地对裁判文书逻辑进行评估，本发明的目的在于提供一种基于深度学习的裁判文书逻辑评估方法及系统，根据裁判文书，充分利用裁判文书的案情、理由和判决结果三大部分，通过深度学习模型，得到案情与理由之间的支撑力度、理由与判决结果的支撑力度。根据案情、理由和判决结果之间的逻辑支撑力度，进而对裁判文书的逻辑进行量化评估。

为了实现上述目的，本发明采用的技术方案是：

一种基于深度学习的裁判文书逻辑评估方法，包括如下步骤：

步骤1：对裁判文书进行逻辑抽取，得到具有逻辑支撑性的“案情-理由-判决结果”三大部分；

步骤2：对“案情-理由-判决结果”三大部分进行分句处理，生成句对格式数据；

步骤3：构建深度学习模型，使其可以得到输入句对之间的支撑力度；

步骤4：将处理后的“案情-理由-判决结果”输入到深度学习模型中，得到“案情-理由”之间、“理由-判决结果”之间的逻辑支撑力度；

步骤5：根据“案情-理由-判决结果”之间的逻辑支撑力度，计算得到逻辑评估结果。

其中，从整体上看，本发明的技术方案为：首先构建了可以输出句对之间逻辑支持性的深度学习模型，并利用已标注的训练集、验证集、测试集对模型进行训练、验证、测试，得到训练好的模型；其次，对于新的裁判文书，先进行预处理，抽取得到案情、理由和判决结果三大部分，将“案情-理由”按照句对的方式输入训练好的模型，可以得到案情-理由之间的逻辑支撑力度，将理由-判决结果按照句对的方式输入训练好的模型，可以得到理由-判决结果之间的逻辑支撑力度；最后，根据“案情-理由-判决结果”之间的逻辑支撑力度，由下至上，计算得到最终的逻辑评估结果。

可选的，所述步骤1的裁判文书类型涵盖刑事类、民事类、行政类。

可选的，所述步骤1获取“案情-理由-判决结果”三大部分，包括：

采用正则表达式在裁判文书中获取“经审理查明”及其近义表达、“本院认为”及其近义表达和“判决如下”及其近义表达三字段在文本中的位置p1、p2、p3；

抽取裁判文书中p1-p2之间文字可得到案情描述部分；

抽取裁判文书中p2-p3之间文字可得到判决理由部分，抽取裁判文书中p3之后的文字可得到判决结果部分。

可选的，所述步骤2生成句对格式数据，包括：将案情描述和理由两大部分按句号分割成各个单句，判决结果整体看作一个单句，根据三大部分的单句，可得到“案情-理由”句对、“理由-判决结果”句对；

可选的，所述步骤3所述深度学习模型包括但不限于各种句间交互模型：以ESIM为代表的文本推理模型、以DSSM为代表的文本匹配模型。

可选的，所述步骤3构建深度学习模型，使其可以得到输入句对之间的支撑力度，包括：

样本数据采集：样本数据包括大量的裁判文书，抽取出裁判文书的案情、理由和判决结果三个部分，将案情描述和理由两大部分按句号分割成各个单句，判决结果整体看作一个单句，构建句对格式数据集，并将数据集分成训练集、验证集、测试集；

数据建模：利用训练集训练模型，利用验证集验证模型，利用测试集测试模型。

可选的，所述构建句对格式数据，对于某一条数据，第一列是案情，第二列是理由，第三列是标签，若案情与理由之间构成逻辑支撑关系，则标签为1，否则为0；或者是，第一列是理由，第二列是判决结果，第三列是标签，若理由与判决结果之间构成逻辑支撑关系，则标签为1，否则为0。

可选的，所述步骤5根据“案情-理由-判决结果”之间的逻辑支撑力度，计算得到逻辑评估结果，包括：

将“案情-理由”句对、“理由-判决结果”句对输入到训练好的模型中，可得到“案情-理由-判决结果”之间的逻辑支撑力度；

将案情、理由、判决结果看作节点，将逻辑支撑力度作为“案情-理由-判决结果”之间连接的权值，若连接权值大于某阈值则予以连接，小于该阈值则无连接关系，这样可以得到由下至上依次为案情、理由、判决结果的树状结构；

最底层的案情节点值设置为1，将两层之间的逻辑支撑力度作为两层之间的连接权值，上一层的节点值是下一层的节点值的加权求和结果，由下至上计算可得到最终结果，也即裁判文书的逻辑评估结果。

另一方面，本发明还提供了一种基于深度学习的裁判文书逻辑评估系统，包括：

裁判文书获取单元，获取待评估的裁判文书；

裁判文书预处理单元，将待评估的裁判文书进行预处理，获取“案情-理由”句对、“理由-判决结果”句对；

深度学习模型构建单元，利用已经获取的裁判文书，建立相应的数据集，对深度学习模型进行训练、验证、测试，得到训练好的深度学习模型，模型输出为“案情-理由”之间、“理由-判决结果”之间的逻辑支撑力度；

裁判文书逻辑评估单元，根据模型输出的“案情-理由-判决结果”之间的逻辑支撑力度，计算得到逻辑评估结果。

与现有技术相比，本发明至少具有如下技术效果或优点：裁判文书类型涵盖刑事、民事、行政三大类别，覆盖范围广、实用性强；利用深度学习的方法，将抽象的逻辑评估，转化为可视化效果好、易于理解的案情-理由-判决结果三层逻辑结构树，并对三层之间的逻辑支撑性进行量化计算，对逻辑性的强弱进行定量刻画；本发明提供的基于深度学习的裁判文书逻辑评估方法和系统，首次实现了对裁判文书逻辑的高效、准确、定量评估。

附图说明

图1为本发明裁判文书逻辑评估方法的流程图。

图2为本发明实施例的文本推理模型结构图。

图3为本发明实施例的逻辑评估计算示意图。

图4为本发明裁判文书逻辑评估系统的结构图。

具体实施方式

为了能够更好地理解本发明所阐述的目的、方法以及优点，现结合附图和实施例详细说明本发明的实施方式。

首先，对本发明实施例涉及的专业术语解释如下：

1.正则表达式：一种对字符串和特殊字符操作的逻辑公式，用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字符串的一种过滤逻辑。

2.深度学习：概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构，经常采用多层循环神经网络或者卷积神经网络来构成“深度”模型。深度学习通过组合底层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示，具有高效性、可塑性、普适性。

下面结合附图和实施例详细说明本发明的实施方式。

如图1所示，本发明首先提供了一种基于深度学习的裁判文书逻辑评估方法，具体包括：

步骤101：对裁判文书进行逻辑抽取，得到具有逻辑支撑性的“案情-理由-判决结果”三大部分。具体地：

1.对于待评估的裁判文书，采用正则表达式的方法在裁判文书中获取类似“经审理查明”、“本院认为”和“判决如下”三字段在文本中的位置，分别为p1、p2、p3；

2.抽取裁判文书中p1-p2之间文字可得到案情描述部分；

3.抽取裁判文书中p2-p3之间文字可得到判决理由部分；

4.抽取裁判文书中p3之后的文字可得到判决结果部分。

步骤102：对“案情-理由-判决结果”三大部分进行分句处理，生成句对格式数据。

1.将案情描述和理由两大部分按句号分割成各个单句，判决结果整体看作一个单句；

2.根据三大部分的单句，可得到“案情-理由”句对、“理由-判决结果”句对。

步骤103：构建深度学习模型，使其可以得到输入句对之间的支撑力度。

1.构建数据集。根据已有的大量裁判文书，依照上述步骤101的方法抽取出裁判文书的案情、理由和判决结果三个部分，依照步骤102的方法得到“案情-理由”句对、“理由-判决结果”句对，并以此构建数据集：对于某一条数据，第一列是案情，第二列是理由，第三列是标签，若案情与理由之间构成逻辑支撑关系，则标签为1，否则为0；或者是，第一列是理由，第二列是判决结果，第三列是标签，若理由与判决结果之间构成逻辑支撑关系，则标签为1，否则为0。最后将数据集按比例拆分为训练集、验证集、测试集，本实施例选择3:1:1，数据集大小分别为30000，10000，10000；

2.构建文本推理深度学习模型。在这里构建文本推理模型，其模型框架如图2所示。Premise是前提，Hypothesis是假设，给定输入句对，模型的功能是判断能否根据前提推理出假设，并给出支持概率，例如Premise为“我今天去游泳馆游泳了”，Hypothesis为“我今天碰水了”，后者是可以由前者推理出来的，那么将这两个句子预处理后输入到训练好的模型中，模型的理论输出应该是1，表示支撑性为1。

模型大致由输入编码、局部推理、推理综合、结果预测四个部分组成：

输入编码：将输入的句子进行清洗(去除停止词)和分词，得到分词后的句子S＝{w₁,w₂,..,w_n}，n为句子长度，本实施例限定n＝200，若句子实际长度大于200，则对句子进行截断，若句子实际长度小于200，则在句子后添加空格至200词。接下来，需要将句子转为数学表示，本实施例采用的是司法领域专用的预训练词向量(word embedding)，向量维度为100，其中空格词向量为0，其他词的词向量每个元素范围是0-1之间的浮点数。至此，可以得到两个句子的数学表示分别为a,b∈R^200×100；进一步地，将两句子的数学表示分别输入到双向长短期记忆网络(BiLSTM)中，进行编码提取文本特征，得到在i时刻两个句子的编码结果：

其中，[]为拼接操作，

分别为句子a在i时刻前向(forward)隐藏层状态、后向(backward)隐藏层状态，隐藏层维度设置为100；

分别为句子b在j时刻前向(forward)隐藏层状态、后向(backward)隐藏层状态，隐藏层维度设置为100；l_a、l_b分别为两句子的实际的长度。

局部推理：将句子进行编码后，接下来是两个句子之间的交互(interactions)、局部推理(local inference)模块，首先计算两个句之间的相似度矩阵：

进一步地，结合相似度矩阵，分别更新两个句子的编码，将两个句子的编码信息互相包含、交互，得到新的表达：

进一步地，将所有时刻的信息进行聚合，分别得到两个句子的高级表示(high-level representation)：

其中

为点乘。

推理综合：将聚合后的信息m_a、m_b输入到BiLSTM中，进行高维度的信息提取，与输入编码环节类似地，得到两个句子的更高层次的表示：

结果预测：最后，将两个句子的高级表示进行拼接：

将拼接后的两句子高级表示依次经过均值池化、最大池化、全连接层，得到1x2的矩阵，通过softmax函数得到归一化矩阵，矩阵的第一行第二列的结果为两个句子之间具有逻辑支撑关系的概率，也即为逻辑支撑力度。

3.训练模型。模型训练过程中，将模型的输出与实际的标签(label)进行比较，损失函数loss采用交叉熵(cross entropy)损失函数，批尺寸(batch size)设为32，所有样本最大迭代次数(epoch)设为20，优化器(optimizer)采用Adam优化器，学习率设置为1e-3，为防止过拟合，神经元的drop_out概率设为0.5。所有的样本跑完一轮后，利用验证集对模型进行验证，验证的指标为F1值，若F1值与最好的F1值相比较大，说明此轮的模型效果较好，则将模型进行保存。训练结束后，可以得到在验证集上表现最好的模型，利用测试集对该模型进行测试，测试的准确度(accuracy)可达到94％。

步骤104：将步骤102处理后的“案情-理由-判决结果”输入到深度学习模型中，得到“案情-理由”之间、“理由-判决结果”之间的逻辑支撑力度。

步骤105：根据案情-理由-判决结果之间的逻辑支撑力度，计算得到逻辑评估结果。

1.计算的具体样例如图3所示，根据步骤104得到的“案情-理由-判决结果”之间的逻辑支撑力度，将案情、理由、判决结果看作节点，将逻辑支撑力度作为“案情-理由-判决结果”之间连接的权值，若连接权值大于0.5则予以连接，小于0.5则无连接关系，这样可以得到由下至上依次为案情、理由、判决结果的树状结构；

2.最底层的案情节点值设置为1，将两层之间的逻辑支撑力度作为两层之间的连接权值，上一层的节点值是下一层的节点值的加权求和结果，由下至上计算可得到最终结果，也即裁判文书的逻辑评估结果。

如图4所示，本发明实施例提供了一种基于深度学习的裁判文书逻辑评估系统，包括：

裁判文书获取单元401：获取待评估的裁判文书。

裁判文书预处理单元402：采用正则表达式在裁判文书中获取“经审理查明”、“本院认为”和“判决如下”三字段在文本中的位置p1、p2、p3；抽取裁判文书中p1-p2之间文字即为案情描述部分；抽取裁判文书中p2-p3之间文字即为判决理由部分；抽取裁判文书中p3之后的文字即为判决结果部分，将案情描述和理由两大部分按句号分割成各个单句，判决结果整体看作一个单句，根据三个部分的单句，可得到“案情-理由”句对、“理由-判决结果”句对。

深度学习模型构建单元403：利用已经获取的刑事、民事、行政类裁判文书，建立相应的数据集，对于某一条数据，第一列是案情，第二列是理由，第三列是标签，若案情与理由之间构成逻辑支撑关系，则标签为1，否则为0；或者是，第一列是理由，第二列是判决结果，第三列是标签，若理由与判决结果之间构成逻辑支撑关系，则标签为1，否则为0；对文本推理模型进行训练、验证、测试，得到训练好的模型。接收裁判文书预处理单元402处理后的裁判文书，并输出“案情-理由-判决结果”之间的逻辑支撑力度。

裁判文书逻辑评估单元404：根据模型输出的“案情-理由-判决结果”之间的逻辑支撑力度，将案情、理由、判决结果看作节点，将逻辑支撑力度作为“案情-理由-判决结果”之间连接的权值，若连接权值大于0.5则予以连接，小于0.5则无连接关系，这样可以得到由下至上依次为案情、理由、判决结果的树状结构；最底层的案情节点值设置为1，将两层之间的逻辑支撑力度作为两层之间的连接权值，上一层的节点值是下一层的节点值的加权求和结果，由下至上计算可得到最终结果，也即裁判文书的逻辑评估结果。

由以上技术方案可知，本发明将裁判文书逻辑评估问题，转化为“案情-理由-判决结果”三大部分之间的逻辑支撑性力度评估，利用深度学习模型，首次实现了对刑事、民事、行政三大类别裁判文书逻辑的高效、准确、定量评估。

本说明书中方法与装置的实施例基本相似，相关之处可相互参照。

以上所述，仅为本发明中的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉该技术的人在本发明所揭露的技术范围内，可理解想到的变换或替换，都应涵盖在本发明的包含范围之内，因此，本发明的保护范围应该以权利要求书的保护范围为准。

Claims

1.一种基于深度学习的裁判文书逻辑评估方法，其特征在于，包括如下步骤：

2.根据权利要求1所述基于深度学习的裁判文书逻辑评估方法，其特征在于，所述裁判文书的类型包括刑事类、民事类和行政类。

3.根据权利要求1所述基于深度学习的裁判文书逻辑评估方法，其特征在于，所述步骤1包括：

抽取裁判文书中p1-p2之间文字即为案情描述部分；

抽取裁判文书中p2-p3之间文字即为判决理由部分；

抽取裁判文书中p3之后的文字即为判决结果部分。

4.根据权利要求1所述基于深度学习的裁判文书逻辑评估方法，其特征在于，所述步骤2包括：将案情描述和理由两大部分按句号分割成各个单句，判决结果整体看作一个单句，根据三大部分的单句，得到“案情-理由”句对、“理由-判决结果”句对。

5.根据权利要求1所述基于深度学习的裁判文书逻辑评估方法，其特征在于，所述深度学习模型为句间交互模型，包括ESIM为代表的文本推理模型以及以DSSM为代表的文本匹配模型。

6.根据权利要求1或5所述基于深度学习的裁判文书逻辑评估方法，其特征在于，所述深度学习模型的构建过程包括：

样本数据采集：样本数据包括大量的裁判文书，抽取出裁判文书的案情、理由和判决结果三大部分，将案情描述和理由两大部分按句号分割成各个单句，判决结果整体看作一个单句，构建句对格式数据集，并将数据集分成训练集、验证集、测试集；

7.根据权利要求6所述基于深度学习的裁判文书逻辑评估方法，其特征在于，所述构建句对格式数据集，对于某一条数据，第一列是案情，第二列是理由，第三列是标签，若案情与理由之间构成逻辑支撑关系，则标签为1，否则为0；或者是，第一列是理由，第二列是判决结果，第三列是标签，若理由与判决结果之间构成逻辑支撑关系，则标签为1，否则为0。

8.根据权利要求6所述基于深度学习的裁判文书逻辑评估方法，其特征在于，所述步骤4和步骤5包括：

将“案情-理由”句对、“理由-判决结果”句对输入到训练好的深度学习模型中，得到“案情-理由-判决结果”之间的逻辑支撑力度；

将案情、理由、判决结果看作节点，将逻辑支撑力度作为“案情-理由-判决结果”之间连接的权值，若连接权值大于某阈值则予以连接，小于该阈值则无连接关系，得到由下至上依次为案情、理由、判决结果的树状结构；

最底层的案情节点值设置为1，将两层之间的逻辑支撑力度作为两层之间的连接权值，上一层的节点值是下一层的节点值的加权求和结果，由下至上计算得到最终结果，也即裁判文书的逻辑评估结果。

9.一种基于深度学习的裁判文书逻辑评估系统，其特征在于，包括：

裁判文书获取单元，获取待评估的裁判文书；