CN114579770A - 一种法律条文检索方法及装置 - Google Patents
一种法律条文检索方法及装置 Download PDFInfo
- Publication number
- CN114579770A CN114579770A CN202210119189.0A CN202210119189A CN114579770A CN 114579770 A CN114579770 A CN 114579770A CN 202210119189 A CN202210119189 A CN 202210119189A CN 114579770 A CN114579770 A CN 114579770A
- Authority
- CN
- China
- Prior art keywords
- legal
- retrieved
- description
- fact
- fact description
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 102
- 239000013598 vector Substances 0.000 claims description 60
- 238000003860 storage Methods 0.000 claims description 15
- 238000004891 communication Methods 0.000 description 11
- 238000009826 distribution Methods 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000012552 review Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/383—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Technology Law (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书提供一种法律条文检索方法及装置,获取待检索的事实描述;将待检索的事实描述输入分类模块,得到待检索的事实描述对应的第一法律问题标签,将所述第一法律问题标签与裁判文书集合中的各个裁判文书对应的第二法律问题标签进行匹配,得到各个裁判文书与待检索的事实描述的匹配度,根据各个裁判文书与待检索的事实描述的匹配度、及各个裁判文书中所引用的法律条文,确定各个裁判文书中包括的各个法律条文与待检索的事实描述之间的条文匹配度;根据各个法律条文的条文匹配度,从各个法律条文中检索出与待检索的事实描述对应的目标法律条文。
Description
技术领域
本说明书一个或多个实施例涉及计算机应用技术领域,尤其涉及一种法律条文检索方法及装置。
背景技术
随着普法工作的进行,越来越多的人知法懂法,越来越多的人在遇到问题时会去网上检索法律解决途径,这就使得越来越多的人产生了检索法律条文的需求。
相关技术中检索法律条文一般只支持根据关键词检索,具体而言,在用户输入关键词后,法律条文检索系统会从自己的数据库中检索出包含用户输入的关键词的法律条文,并将检索到的法律条文返回给用户。
相关技术中的通过关键词检索法律条文的方法,检索出来的结果没有考虑到法律条文的适用性,使得检索得到的结果不准确。
发明内容
有鉴于此,本说明书一个或多个实施例提供一种法律条文检索方法及装置。
根据本说明书一个或多个实施例的第一方面,提出了一种法律条文检索方法,所述方法包括:
获取待检索的事实描述;所述事实描述是法律相关问题的描述;
将待检索的事实描述输入分类模块,得到待检索的事实描述对应的第一法律问题标签,所述第一法律问题标签用于表示待检索的事实描述所属的法律类别;
将所述第一法律问题标签与裁判文书集合中的各个裁判文书对应的第二法律问题标签进行匹配,得到各个裁判文书与待检索的事实描述的匹配度,所述第二法律问题标签用于表示裁判文书中包括的事实描述所属的法律类别;
根据各个裁判文书与待检索的事实描述的匹配度、及各个裁判文书中所引用的法律条文,确定各个裁判文书中包括的各个法律条文与待检索的事实描述之间的条文匹配度;
根据各个法律条文的条文匹配度,从各个法律条文中检索出与待检索的事实描述对应的目标法律条文。
根据本说明书一个或多个实施例的第二方面,提出了一种智慧法庭系统,所述智慧法庭系统至少包括法律条文检索模块;
所述法律条文检索模块执行:
在检测到法官在阅卷界面内选定起诉书或起诉状中事实描述的情况下,将法官选定的事实描述作为待检索的事实描述;
根据权利要求1-7任一项所述的法律条文检索方法检索得到目标法律条文;
在阅卷界面内显示检索得到的目标法律条文,以供法官根据所述目标法律条文进行裁判。
根据本说明书一个或多个实施例的第三方面,提出了一种法律咨询系统,所述法律咨询系统用于为咨询者匹配回答者,回答者负责回答咨询者提供的法律问题;所述法律咨询系统至少包括法律条文检索模块;
所述法律条文检索模块执行:
在检测到回答者选中咨询者输入的法律问题的事实描述后,将选中的事实描述作为待检索的事实描述,并通过上述的法律条文检索方法检索得到目标法律条文;
将目标法律条文发送给回答者,以供回答者根据目标法律条文为咨询者提供法律咨询服务。
根据本说明书一个或多个实施例的第四方面,提出了一种法律条文检索装置,所述装置包括:
事实描述获取模块,用于获取待检索的事实描述;所述事实描述是法律相关问题的描述;
分类模块,用于将待检索的事实描述输入分类模块,得到待检索的事实描述对应的第一法律问题标签,所述第一法律问题标签用于表示待检索的事实描述所属的法律类别;
匹配模块,用于将所述第一法律问题标签与裁判文书集合中的各个裁判文书对应的第二法律问题标签进行匹配,得到各个裁判文书与待检索的事实描述的匹配度,所述第二法律问题标签用于表示裁判文书中包括的事实描述所属的法律类别;
条文匹配度确定模块,用于根据各个裁判文书与待检索的事实描述的匹配度、及各个裁判文书中所引用的法律条文,确定各个裁判文书中包括的各个法律条文与待检索的事实描述之间的条文匹配度;
目标法律条文检索模块,用于根据各个法律条文的条文匹配度,从各个法律条文中检索出与待检索的事实描述对应的目标法律条文。
根据本说明书实施例的第五方面,提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现上述的法律条文检索方法。
根据本说明书实施例的第六方面,提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以上述的法律条文检索方法。
本说明书提供一种法律条文检索方法,获取待检索的事实描述;所述事实描述是法律相关问题的描述;将待检索的事实描述输入分类模块,得到待检索的事实描述对应的第一法律问题标签,所述第一法律问题标签用于表示待检索的事实描述所属的法律类别;将所述第一法律问题标签与裁判文书集合中的各个裁判文书对应的第二法律问题标签进行匹配,得到各个裁判文书与待检索的事实描述的匹配度,所述第二法律问题标签用于表示裁判文书中包括的事实描述所属的法律类别;根据各个裁判文书与待检索的事实描述的匹配度、及各个裁判文书中所引用的法律条文,确定各个裁判文书中包括的各个法律条文与待检索的事实描述之间的条文匹配度;根据各个法律条文的条文匹配度,从各个法律条文中检索出与待检索的事实描述对应的目标法律条文。
通过上述方法,首先,通过输入事实描述而不是输入关键词,用户即使对法律条文的表述方式不熟悉,也能检索得到自己所需要的法律条文,使得检索结果更加准确。其次,通过将用户输入的事实描述与裁判文书的事实描述相匹配,使得检索考虑了法律的适用性,进一步提高了检索结果的准确性。最后,无需用户输入检索范围,使对于法律不熟系的用户也能更好地使用法律条文检索系统。
本说明书公开的法律条文检索方法提高了检索结果的准确性,且使得对法律熟悉的用户(律师、法官等)和对法律不熟悉的用户(普通的群众)都能很好地使用法律条文检索系统,检索得到自己所需要的法律条文。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本说明书的实施例,并与说明书一起用于解释本说明书的原理。
图1是本说明书根据一实施例示出的相关技术中一种法律条文检索系统的示意图。
图2是本说明书根据一示例性实施例示出的一种法律条文检索方法的流程图。
图3是本说明书根据一具体实施例示出的一种法律条文检索系统的示意图。
图4是本说明书根据一示例性实施例示出的一种法律条文检索装置的框图。
图5是本说明书根据一示例性实施例示出的一种法律条文检索装置所在电子设备的一种硬件结构图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。
需要说明的是:在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本说明书中所描述的多个步骤,在其他实施例中也可能被合并为单个步骤进行描述。
为了满足法律条文检索需求,相关技术中存在一种通过关键词检索法律条文的方法,具体而言,如图1所示,通用法规(指的是在全国范围内都适用的法律法规,与地方法规相对应)、地方法规、立法资料以及立法计划是用户可以选择的检索范围,搜索标题和搜索全文是用户可以选择的两种检索方式。举例来说,当用户选择通用法规,并在搜索标题中输入了“宪法”,那么法律条文检索系统将在通用法规中,检索出标题包括“宪法”的法律条文;当用户选择地方法规,并在搜索全文中输入了“违规停车”,那么法律条文检索系统将在地方法规中,检索出全文包括“违规停车”的法律条文。
上述的通过关键词检索法律条文的方法存在以下问题:首先,这种方法需要由用户确定检索范围,对于不熟悉法律的用户来说,是较为不方便的。其次,由于检索的时候只会检索出包含关键词的法律条文,而法律条文的表述方式和日常对话存在差异,对于不了解法律条文表述方式的用户来说,难以得到自己所需的法条。最后,检索法条时并未考虑法律适用性的问题,换言之,并未考虑法律条文在实际案件中的应用情况,这样造成检索得到的法律条文可能并不准确。
为了解决上述问题,本说明书提供一种法律条文检索方法,获取待检索的事实描述;所述事实描述是法律相关问题的描述;将待检索的事实描述输入分类模块,得到待检索的事实描述对应的第一法律问题标签,所述第一法律问题标签用于表示待检索的事实描述所属的法律类别;将所述第一法律问题标签与裁判文书集合中的各个裁判文书对应的第二法律问题标签进行匹配,得到各个裁判文书与待检索的事实描述的匹配度,所述第二法律问题标签用于表示裁判文书中包括的事实描述所属的法律类别;根据各个裁判文书与待检索的事实描述的匹配度、及各个裁判文书中所引用的法律条文,确定各个裁判文书中包括的各个法律条文与待检索的事实描述之间的条文匹配度;根据各个法律条文的条文匹配度,从各个法律条文中检索出与待检索的事实描述对应的目标法律条文。
通过上述方法,首先,通过输入事实描述而不是输入关键词,用户即使对法律条文的表述方式不熟悉,也能检索得到自己所需要的法律条文,使得检索结果更加准确。其次,通过将用户输入的事实描述与裁判文书的事实描述相匹配,使得检索考虑了法律的适用性,进一步提高了检索结果的准确性。最后,无需用户输入检索范围,使对于法律不熟系的用户也能更好地使用法律条文检索系统。
本说明书公开的法律条文检索方法提高了检索结果的准确性,且使得对法律熟悉的用户(律师、法官等)和对法律不熟悉的用户(普通的群众)都能很好地使用法律条文检索系统,检索得到自己所需要的法律条文。
接下来将对本说明书提供的一种法律条文检索方法进行详细说明。
如图2所示,图2是本说明书示出的一种法律条文检索方法的流程图,包括以下步骤:
步骤201,获取待检索的事实描述。
具体而言,为了准确得到法律条文检索结果,首先需要获取检索输入,又考虑到事实描述的方式作为检索输入,对于不了解法律条文的表述方式的人更方便,因此需要获取事实描述。
在对步骤201整体目的进行说明后,首先需要说明法律条文检索方法的应用主体进行说明,该方法可以应用于法律条文检索系统,法律条文检索系统也就是上文提及的法律条文检索系统,该法律条文检索系统可以通过网页为用户提供法律条文检索服务,也可以通过客户端为用户提供法律条文检索服务,本说明书对于法律条文检索系统的形式不做限定。
在对法律条文检索系统进行说明后,接下来将对步骤201中的待检索的事实描述进行说明。具体而言,对于该事实描述的来源而言,该事实描述可以是用户直接输入的;在法律条文检索系统处理压力较大的情况下,用户输入的事实描述无法及时被处理,那么可以将事实描述先暂时存储在法律条文检索系统的存储空间中,在法律条文检索系统处理完在该事实描述输入前输入的事实描述后,将从法律条文检索系统的存储空间中获取出存储的待检索的事实描述,对该事实描述进行检索。
对于事实描述的含义而言,所述事实描述是法律相关问题的描述。具体来说,事实描述的源头是用户的输入,事实描述也就是用户通过语言文字描述的法律问题。比如说事实描述可以是“我所在的单位在没有通知我的情况下修改了关于薪酬的规章制度,并且我的工资被降低了”。
步骤203,将待检索的事实描述输入分类模块,得到待检索的事实描述对应的第一法律问题标签。
步骤205,将所述第一法律问题标签与裁判文书集合中的各个裁判文书对应的第二法律问题标签进行匹配,得到各个裁判文书与待检索的事实描述的匹配度。
接下来将对步骤203和步骤205进行统一说明。
具体而言,通过分类模块,对事实描述(后文如果未加说明,事实描述均指的是待检索的事实描述)进行分类,得到事实描述对应的第一法律问题标签,并通过第一法律问题标签和裁判文书的第二法律问题标签进行检索,得到与事实描述相匹配的裁判文书。
需要说明的是,选择通过第一法律问题标签来检索裁判文书,而不是通过事实描述转换成的特征向量与裁判文书的事实描述转换成的特征向量进行匹配的原因为:如果只是通过特征向量来确定相匹配的裁判文书,那么得到的相匹配的裁判文书只是和事实描述语义上相似的裁判文书;而有些情况下,有些裁判文书和事实描述语义上不相似,但是所属法律类别是相同的,如果通过特征向量来检索向匹配的裁判文书,会漏掉一些语义不相似但是所属法律类别相同的裁判文书。
举例而言,裁判文书的事实描述说明了遗产分配不均问题,但是某个老人的多个孩子之间的遗产分配不均问题,待检索的事实描述所说的是死者的妻子和死者父母遗产分配不均的问题,这两者都属于遗产分配的法律类别,但是可能由于主语不同以及表述方式不同造成了两者语义并不相似,如果通过特征向量来检索裁判文书,就会漏掉这种语义不相似但是所属法律类别相同的裁判文书。可见通过第一法律问题标签来检索与事实描述相匹配的裁判文书,可以使得在不损失检索准确度的情况下,使得检索结果更为丰富。
还需要说明的是,本说明书中选择通过裁判文书进行检索,是为了充分考虑各个法律条文的适用性来检索得到用户所需要的法律条文。如果只使用法律条文本身进行检索,可能不容易得到准确的结果,而裁判文书是法官通过法律知识针对认定的事实进行分析得到的,因此裁判文书中存在对法律条文的使用,通过裁判文书进行检索可以考虑到法律条文的适用性。
在对通过第一法律问题标签进行检索的理由,以及选择裁判文书进行检索的理由进行说明后,接下来将对步骤203和步骤205中涉及的名词进行说明。
首先,分类模块指的是对事实描述进行分类的模块,其为预先训练的,该模块可以通过基于转换器的双向编码表征(Bidirectional Encoder Representation fromTransformers,Bert)串联分类器实现,具体而言,可以先通过Bert将事实描述进行编码,再通过分类器对编码后的事实描述进行分类,得到事实描述的第一法律问题标签。需要说明的是,对事实描述进行编码模型并不一定是Bert,也可以是其他的文本编码器,本说明书对此不做限定。
该分类模块可以从所有的法律问题标签中,筛选出若干和该事实描述相匹配的法律问题标签作为第一法律问题标签。该分类模块不仅可以给待检索的事实描述分类,也可以给裁判文书的事实描述分类,当然给裁判文书的事实描述进行分类的也可以是其他分类模块,本说明书对此不做限定。
其次,第一法律问题标签用于表示待检索的事实描述所属的法律类别,第二法律问题标签用于表示裁判文书中包括的事实描述所属的法律类别,第一法律问题标签和第二法律问题标签的区别仅在于主体不同,换言之,同样的法律问题标签,如果是待检索的事实描述的法律问题标签的话,该法律问题标签就是第一法律问题标签;如果是裁判文书的法律问题标签,那么该法律问题标签就是第二法律问题标签。此外,关于法律问题标签的个数形式等的说明详见后文描述,在此暂不赘述。还需要说明的是,一个第一法律问题标签指的是一个标签,一个第二法律问题标签指的是一个标签,如未加说明,事实描述对应的第一法律问题标签指的是事实描述对应的所有法律问题标签,裁判文书对应的第二法律问题标签指的是裁判文书对应的所有法律问题标签。
还需要说明的是,对于裁判文书来说,一般包括判决书、裁定书、调解书、决定书、通知书及令等,其中裁定书、调解书、决定书、通知书及令一般只会引用《中华人民共和国民事诉讼法》,不会引用其他法律,且可能不包含事实描述部分,因此,本说明书中所涉及的裁判文书指的是判决书,且是存在原告和被告情况下的判决书。
对于裁判文书的第二法律问题标签而言,需要先筛选出裁判文书的事实描述,才能对裁判文书的事实描述进行分类从而获取到每个裁判文书的第二法律问题标签。下面将对一种筛选裁判文书事实描述部分的方法进行说明。
对于一审来说,裁判文书一般包括的事实描述会跟在“经审理本院认定事实如下”、“本院经审理认定事实如下”等后,因此可以将这些词句后的一段内容作为该裁判文书的事实描述。换言之,可以通过如“本院”“认定”“事实”等的关键词,来将这些关键词后的且在“本院认为”前的内容,作为该裁判文书的事实描述。
对于二审来说,如果二审法院赞同一审法院的认定的事实,那么会提及“本院经审理确认一审查明的事实”、“一审判决认定事实属实”等,在存在对于一审认定的事实属实的情况下,可以将裁判文书中的“一审法院认定事实”、“一审法院审理查明”后的且在“本院认为”前的内容,作为该裁判文书的事实描述。如果二审法院和一审法院认定的事实不同,则会在裁判文书中表明“本院二审查明以下事实”或者“本院认定事实如下”等,因此,可以在出现上述关键词的情况下,将上述关键词后且在“本院认为”前的内容作为该裁判文书的事实描述。
对于再审来说,和二审相似,裁判文书中会首先说明一审/一审和二审认定的事实,如果该再审法院赞同某一次认定的事实,则会提及赞同该次审查认定事实的语句,那么可以将这种语句后且在“本院认为”前的内容作为该裁判文书的事实描述。如果该再审法院不赞同之前审查时认定的事实,则会提及类似“本院认定事实如下”等的句子,那么便可以将这种句子后且在“本院认为”前的内容作为事实描述。
此外,裁判文书事实描述部分还可以通过神经网络模型进行筛选,比如可以通过Bert来确定裁判文书的事实描述的开头和结尾,本说明书对筛选裁判文书事实描述部分的方法不做限定。
在对裁判文书的事实描述进行说明后,将对“匹配度”进行说明。裁判文书和待检索的事实描述的匹配度,则表征第一法律问题标签和第二法律问题标签的相似度,换言之,事实描述的第一法律问题标签和裁判文书的第二法律问题标签越相似,则两者之间的匹配度越高。具体的确定裁判文书和待检索的事实描述的方式详见下文描述,在此暂不赘述。
步骤207,根据各个裁判文书与待检索的事实描述的匹配度、及各个裁判文书中所引用的法律条文,确定各个裁判文书中包括的各个法律条文与待检索的事实描述之间的条文匹配度。
步骤209,根据各个法律条文的条文匹配度,从各个法律条文中检索出与待检索的事实描述对应的目标法律条文。
接下来将对步骤207和步骤209进行说明。
具体而言,步骤205得到的是裁判文书和事实描述之间的匹配度,而法律条文检索系统所需要输出的是与事实描述相匹配的法律条文,因此需要基于裁判文书和事实描述之间的匹配度,确定事实描述和各个法律条文的条文匹配度,进而根据条文匹配度确定目标法律条文,从而向用户返回目标法律条文,完成法律条文的检索。需要说明的是,向用户返回的目标法律条文的数量可以是一条也可以是多条,本说明书对此不作限定。
在对步骤207和209整体目的进行说明后,下面将对步骤207和步骤209的具体实现方式进行说明。
其中,法律条文和待检索的事实描述之间的条文匹配度表征了法律条文是否适用于该事实描述,具体而言,某个法律条文越适用于该事实描述,则该法律条文与待检索的事实描述之间的条文匹配度越高。
其中,每个裁判文书引用的法律条文的确定方式,可以是筛选出裁判文书中具有以下格式的内容:书名号后紧跟第M条(M可以是任意自然数,下同,比如《中华人民共和国合同法》第六十条),或者书名号后紧跟多个第M条且多个第M条用顿号或逗号或表示“和”意义的词隔开(比如《中华人民共和国合同法》第三十九条、第四十条、第四十一条、第六十条、第九十六条、第九十七条、第一百零七条、第一百一十四条),当然也可以根据其他相关技术进行确定每个裁判文书所引用的法律条文。为了提高效率,确定每个裁判文书所引用的法律条文可以是在检索前完成并存储的。
对于步骤207来说,每个裁判文书都会引用若干条法律条文,在知道各个裁判文书和事实描述的匹配度的情况下,可以根据以下方式来确定各个法律条文和事实描述的匹配度:先将和事实描述匹配度大于预设阈值的裁判文书筛选出来,然后确定筛选出来的各个裁判文书所引用的法律条文,统计这些裁判文书中引用的各个法律条文的次数,将引用次数作为各个法律条文和事实描述的条文匹配度。这种方式可以较为方便的确定各个法律条文和事实描述的条文匹配度。
为了提高准确度,考虑更多裁判文书中的法律适用情况,对于步骤207来说,还可以通过以下方式来确定各个法律条文和事实描述的条文匹配度:针对每个裁判文书,根据该裁判文书和待检索的事实描述的匹配度,得到该裁判文书所引用的各个法律条文和待检索的事实描述的匹配度;针对每个法律条文,根据每个引用该法律条文的裁判文书对应的该法律条文和待检索的事实描述的匹配度,得到该法律条文的条文匹配度。
其中,对于每个裁判文书而言,可以直接将该裁判文书和待检索的事实描述的匹配度作为其引用的各个法律条文和事实描述的匹配度,也可以是将该裁判文书和待检索的事实描述的匹配度,除以该裁判文书所引用的法律条文的个数,将结果作为该裁判文书所引用的各个法律条文和待检索的事实描述的匹配度。也可以根据所引用法律条文在裁判文书中的位置,来确定该裁判文书所引用的各个法律条文和事实描述的匹配度,具体而言,如果某个法律条文是在裁判文书中间或者中间较前的位置所引用的(一般可能为之前审查时引用的法律条文),则为该法律条文设置较小的权重,如果某个法律条文是在裁判文书最后的位置所引用的,则为该法律条文设置更高的权重。将每个法律条文的权重,与该裁判文书和事实描述的相似度相乘,得到针对该裁判文书的该法律条文与该事实描述的相似度。
其中,为了方便后续的计算,在得到条文匹配度之前,还可以先将各个裁判文书和事实描述的相似度进行归一化处理,使得各个裁判文书和事实描述的相似度的和为1。具体的归一化方法可以是通过softmax进行归一化,当然也可以采用其他的归一化方法。
需要说明的是,这里只是举了几个例子来说明步骤207的具体实现方式,这些例子并不代表对步骤207的限定,步骤207也可以通过其他途径实现。
对于步骤209来说,实现方式可以是:将条文匹配度大于预设的条文匹配度阈值的法律条文作为目标条文,也可以是将条文匹配度最大的前N个法律条文作为目标条文(N可以是预设的自然数),当然,确定目标法律条文的方式不限于以上几种,只要满足:选取的目标法律条文和事实描述的条文匹配度大于任一未被选择的法律条文(也就是除了目标法律条文之外的其他法律条文)的条文匹配度。
在对步骤207和步骤209的具体实现方式进行说明后,还需要说明的是,大部分的裁判文书都会引用诉讼法中的特定法律条文(特定法律条文是做出裁判文书必然要引用的法律条文),这部分法律条文可能对于解决用户的问题没有帮助,换言之,目标法律条文中不包括上述的特定法律条文。
此外,大部分裁判文书都不会在正文中引用法律条文的具体内容,只会引用法律条文的标题,比如《中华人民共和国合同法》第六十条,在得到目标法律条文是标题的情况下,向用户返回的可以是标题,为了使得用户更直观,向用户返回的还可以是法律条文的具体内容。
下面将结合法律问题标签的数量、形式,对步骤205的具体实现方式进行详细说明。
首先对于每个裁判文书对应的第二法律问题标签获取方法进行说明。
针对第二法律问题标签获取时机而言,每个裁判文书对应的第二法律问题标签可以是在对第一法律问题标签和第二法律问题标签进行匹配时获取的;为了减少处理压力,第二法律问题标签也可以是预先获取后存储在存储介质中的。
针对第二法律问题标签的获取方法而言,其可以通过神经网络模型来获取,比如可以通过上述的分类模块获取,也可以通过其他的分类模块来获取,需要注意的是,如果是第一法律问题标签和第二法律问题标签获取所使用的模块不同,这两个不同的模块的所有可分类的标签是相同的(即用于分类的标签是相同的)。
如果是通过上述分类模块来获取,且是预先获取后存储在存储介质中的,那么上述方法还包括:将每个裁判文书的事实描述输入所述分类模块,得到每个裁判文书对应的第二法律问题标签;存储所述每个裁判文书对应的第二法律问题标签。
对第二法律问题标签获取方法进行说明后,接下来将对步骤205的具体实现方法进行说明。
首先,由于第一法律问题标签和第二法律问题使用的是用一套分类体系,那么可以将第一法律问题标签和各个第二法律问题标签分别转换成Q维向量(one-hot向量),Q为分类模块所有可用于分类标签的数量,该Q维向量是每一位非0即1的密集向量,然后通过第一法律问题标签和各个第二法律问题标签的相似度,来确定各个裁判文书和事实描述的匹配度。
换言之,步骤105具体包括:将所述第一法律问题标签转换成第一标签向量;获取每个裁判文书对应的第二法律问题标签转换成的第二标签向量;计算所述第一标签向量与每个第二标签向量的相似度,并根据所述相似度得到各个裁判文书与待检索的事实描述的匹配度。
其中需要说明的是,根据所述相似度得到各个裁判文书与待检索的事实描述的匹配度,可以是直接将相似度作为各个裁判问文书和待检索的事实描述的匹配度,也可以是将相似度与预设的系数相乘,将相乘得到的内容作为各个裁判文书与待检索的事实描述的匹配度
所述第一法律问题标签指的是事实描述对应的所有法律问题标签。第一标签向量用于表征事实描述和各个法律问题标签的匹配度,任一裁判文书对应的第二标签向量用于表征该裁判文书和各个法律问题标签的匹配度。第一标签向量和第二标签向量的相似度,可以通过余弦相似度表示,也可以是通过欧式距离表示,当然也可以是其他的用于表征向量相似度的算法计算得到,本说明书对此不做限定。
第一标签向量和第二标签向量的获取,可以是直接将各个标签转换成Q维向量,举例来说,假设可以用于分类的法律标签有三个,分别是民间借贷、夫妻共同债务以及未约定利息(需要说明的是,标签不是只有三个,标签也不可能只是关于借钱的,这里为了方便举例,只用了这三个标签,下述例子也并不代表对于标签的限定)。另外假设事实描述的第一法律问题标签是民间借贷,裁判文书A的两个第二法律问题标签分别是民间借贷和夫妻共同债务,裁判文书B的两个第二法律问题标签分别是民间借贷和未约定利息。那么事实描述对应的第一标签向量为(1,0,0),裁判文书A对应的第二标签向量为(1,1,0),裁判文书B对应的第二标签向量为(1,0,0)。
此外,考虑到不同的法律问题标签对于匹配度有不同的影响,比如对于债务相关的裁判文书,可能大部分裁判文书都会有未如约还款的第二法律问题标签,而只有少部分的裁判文书会有未约定利息的第二法律问题标签,那么对于事实描述来说,如果想要找到和事实描述匹配度更高的裁判文书,由于大部分和债务相关的裁判文书都回匹配上未如约还款的法律问题标签,那么应该多考虑未约定利息的第二法律问题标签的作用,有助于提升匹配度的准确性。
换言之,需要给各个法律问题标签设置权重,对于相同诉讼领域的法律问题标签来说,某个法律问题标签匹配到的裁判文书越多(匹配到也就是说裁判文书有该法律问题标签),该法律问题标签的权重越低,那么在获取第一标签向量和第二标签向量的时候,可以考虑每个第一标签向量的权重来获取。具体而言,在所述第一法律问题标签的数量是多个的情况下;所述将所述第一法律问题标签转换成第一标签向量,包括:根据待检索的事实描述对应的多个第一法律问题标签、以及每个第一法律问题标签分别对应的预设权重,将待检索的事实描述对应的多个第一法律问题标签转换成第一标签向量。
举例来说,假设存在4个法律问题标签,分别是民间借贷、夫妻共同债务、未约定利息以及未如约还款,假设匹配到民间借贷的裁判文书的数量为A,预设权重为a;匹配到夫妻共同债务的裁判文书数量为B(此处A和B和前文的裁判文书A和裁判文书B不同),预设权重为b;匹配到未约定利息的裁判文书数量为C,预设权重为c;匹配到未如月还款的裁判文书数量为D,预设权重为d;大小关系为D>A>B>C(此处是通过该数量大小关系来举例子,该数量关系并不代表真实情况)。这种情况下,这四个法律问题标签的预设权重的大小关系为:d<a<b<c。
其次,上述步骤205的具体实现方式在第一法律问题标签的数量较多的情况下可以起到较好的效果,而对于第一法律问题标签的数量较少的情况下,步骤205可以通过直接比较事实描述对应的第一法律问题标签和各个裁判文书的第二法律问题标签相比较,针对每个裁判文书,将该裁判文书的第二法律问题标签和第一法律问题标签相同的法律问题标签的个数,确定为该裁判文书和事实描述的匹配度。
举例而言,假设可以用于分类的法律标签有三个,分别是民间借贷、夫妻共同债务以及未约定利息。另外假设事实描述的第一法律问题标签是民间借贷,裁判文书A的两个第二法律问题标签分别是民间借贷和夫妻共同债务,裁判文书B,第二法律问题标签分别是夫妻共同债务。那么可知,事实描述和裁判文书A具有1个相同的标签(民间借贷),那么可以确定裁判文书A和事实描述的匹配度为1,事实描述裁判文书B不具有相同的标签,那么可以确定裁判文书B和事实描述的匹配度为0。
此外,在存在多级标签,且多级标签中级别最小的标签是包括的法律问题范围最大的标签,之后按照标签的级别从小到大进行排序,每两个相邻的标签,序号大的标签都是序号小的标签的子类别。以两级标签为例,上述的多级标签也就是:所述第一法律问题标签和第二法律问题标签分别包括第一级标签和第二级标签,所述第一级标签表示事实描述所属的法律类别是第一类别,所述第二级标签表示事实描述所属的法律类别是第二类别,且所述第二类别是第一类别的子类别。
举例而言,假设用于分类的全部第一级标签包括刑法问题和民法问题(这里只是举例,并不代表对的第一级标签的限定),第二级标签为刑法问题和民法问题的子类别,比如用于分类的全部第二级标签分别包括:A、B、C(此处ABC和上文的ABC含义不同)和经济纠纷、婚姻纠纷(这里只是举例,并不表示对第二级标签的限定),ABC属于刑法问题的子类别,为刑法问题对应的第二级标签;经济纠纷和婚姻纠纷属于民法问题的子类别,也就是两者是民法问题对应的第二级标签。
需要说明的是,上述例子并不代表对本说明书的限定,除了第一级标签和第二级标签,还可以有第三级标签、第四级标签等等。在这种情况下,分类模块可以是按照标签级别进行分类,换言之,先分类得到事实描述的第一级标签,再在该第一级标签对应的第二级标签中分类得到该事实描述的第二级标签。还需要说明的是,分类模块分类出的每一级标签的数量可以是1个,也可以是多个,在存在多个的情况下,多个标签可以属于同一个子类别,也可以属于不同的子类别。
在上述情况下,可以通过以下方式提高处理效率:考虑到步骤205中获取各个裁判文书和事实描述的匹配度的方式较为复杂,在存在多级标签的情况下,可以针对多级标签的特性,预先筛选出包含的裁判文书数量较少的裁判文书集合。具体而言,可以先筛选出具有事实描述对应的第一级标签裁判文书,再从筛选出的裁判文书中进一步筛选出具有事实描述对应的第二级标签的裁判文书,以此类推,直至筛选出数量小于预设阈值,或者筛选到了预设的标签级别。
换言之,在执行步骤205之前,还需要获取裁判文书集合,以存在第一级法律标签和第二级法律标签为例说明如何获取裁判文书集合:根据所述第一法律问题标签和各个裁判文书对应的第二法律问题标签中包括的第一级标签间的匹配度,获取初始裁判文书集合,所述初始裁判文书集合中各裁判文书中包括的事实描述的第一级标签,与待检索的事实描述的第一级标签相匹配;根据所述第一法律问题标签和各个裁判文书对应的第二法律问题标签中包括的第二级标签间的匹配度,从所述初始裁判文书集合中获取裁判文书集合,所述裁判文书集合中各裁判文书中包括的事实描述的第二级标签,与待检索的事实描述的第二级标签相匹配。
其中需要说明的是,此处的第一级标签的匹配度的获取方法,比步骤205中条文匹配度的获取方法更为简单,比如,此处的第一级标签(或任一级标签)的匹配度可以是通过以下方式获取:针对每一级标签,判断每个裁判文书是否包含该事实描述的该级标签,如果都包括,则设置匹配度为1,如果不包括裁判文书的任一该级标签,则设置匹配度为0;此处的第一级标签(或任一级标签)的匹配度还可以是通过以下方式获取:针对每一级标签,确定每个裁判文书和事实描述的该级标签重合数量,如果重合数量大于对应的数量阈值,则设置匹配度为1,否则设置匹配度为0。当然上述两个例子不表示对于本说明书获取裁判文书集合的限定。
还需要说明的是,虽然上述例子中只是举出了两级标签,但是存在三级标签的情况下,上述方法仍然适用,具体而言,存在用于表征事实描述所属的法律类别是第三类别的第三级标签的情况下,可以是直接将通过第二级标签筛选得到裁判文书集合作为对应的裁判文书集合,也可以是根据第三级文书再进行一遍筛选。
如果是上述的后者,上述根据所述第一法律问题标签和各个裁判文书对应的第二法律问题标签中包括的第二级标签间的匹配度,从所述初始裁判文书集合中获取裁判文书集合,所述裁判文书集合中各裁判文书中包括的事实描述的第二级标签,与待检索的事实描述的第二级标签相匹配,包括:
根据第一法律问题标签和各个裁判文书对应的第二法律问题标签中包括的第二级标签间的匹配度,从所述初始裁判文书集合中获取参考裁判文书集合,所述参考裁判文书集合中各裁判文书中包括的事实描述的第二级标签,与待检索的事实描述的第二级标签相匹配;根据第一法律问题标签和各个裁判文书对应的第二法律问题标签中包括的第三级级标签间的匹配度,从所述初始裁判文书集合中获取裁判文书集合,所述裁判文书集合中各裁判文书中包括的事实描述的第二级标签,与待检索的事实描述的第二级标签相匹配。
在存在第四级标签的情况下以此类推,本说明书不再赘述。
在对步骤205的具体实现方式进行说明后,还需要说明的是,本说明书不仅提供了通过裁判文书检索法律条文的方法,还提供了一种根据裁判文书和法律条文本身来联合检索法律条文的方法。
换言之,本说明书的方法还包括:将待检索的事实描述进行编码,得到待检索的事实描述的特征向量;将待检索的事实描述的特征向量和每个法律条文的特征向量相匹配,得到每个法律条文和待检索的事实描述的第二条文匹配度。
也就是说将事实描述对应的特征向量和法律条文对应的特征向量进行匹配,得到每个法律条文相对于事实表述的第二条文匹配度。
在获得第二条文匹配度后,可以分别基于第二条文匹配度和上文中通过裁判文书获得的条文匹配度来筛选出两个法律条文集合,然后将这两个法律条文集合取并集并返回给用户。
也可以是综合第二条文匹配度和上述通过裁判文书获得条文匹配度来输出法律条文。具体而言,步骤209具体包括:将各个裁判文书中包括的法律条文与待检索的事实描述之间的条文匹配度作为第一条文匹配度;针对每个法律条文,结合该法律条文对应的第一匹配度和第二匹配度,得到该法律条文和待检索的事实描述的条文匹配度;根据各个法律条文的条文匹配度,从各个法律条文中检索出与待检索的事实描述对应的目标法律条文。
其中,上述结合第一匹配度和第二匹配度得到条文匹配度,可以是将每个法律条文的第一匹配度和第二匹配度对应相加,得到每个法律条文的条文匹配度;考虑到通过裁判文书和法律条文本身确定的第一匹配度和第二匹配度准确度不同,可以将每个法律条文的第一匹配度和第二匹配度的加权和作为每个法律条文的条文匹配度。
通过上述方法,本说明书实现了以下技术效果:首先,用户无需手段选取检索范围,且用户无需输入关键词,只需输入针对所遭遇法律问题的连续的自然语言描述,使得不了解法律用户也能得到较好的使用体验。其次,本说明书的方法还能通过编码模块得到事实描述进的密集语义向量,通过向量匹配来得到检索的法律条文,使得检索结果更准确。此外,本说明的方法通过裁判文书来检索法律条文,将裁判文书作为链接用户输入事实描述与推荐法律条文的桥梁,即:系统在向用户推荐法律条文的过程中,考虑了法律条文在司法裁判中的适用,这也使得检索结果可以更加准确。
接下来讲通过一具体实施例来对本说明书提供的法律条文检索方法进行说明。
本方法应用于法律条文检索系统,如图3所示,该法律条文检索系统包括四个模块:事实分类模块、裁判文书匹配模块、事实编码模块和法条(也就是法律条文的简称)编码模块。各个模块分别执行以下以完成法律条文的检索:
(1)事实分类模块:
事实分类模块是一个多标签分类的任务,意在通过分析事实描述的特征,得到用户输入的事实描述中所包含的第一法律问题标签。可用于分类的法律问题标签是预先定义好的,并且裁判文书集合中的每篇裁判文书的事实描述也标有相应的第二法律问题标签。具体的分类方法可以参见上文的描述。
(2)裁判文书匹配模块:
裁判文书匹配模块是以事实分类模块所输出的第一标签为query,在裁判文书集合中检索出第二法律问题标签与query最相似的裁判文书。
具体的检索方式:通过标签向量化的方式实现,即:将事实分类模块输出的第一法律问题标签和每篇裁判文书的第二法律问题标签表示成one-hot向量,根据标签的重要程度(对应有预设权重)进行加权,得到query向量(即上文提及的第一标签向量)和各裁判文书的第二标签向量。将query向量与各裁判文书第二标签向量做相似度计算并通过softmax得到裁判文书所引用法条的最终的概率分布(即第一条文匹配度)。
(3)事实编码模块:
事实编码模块是用于将用户输入的事实描述进行编码,通过编码器编码得到富含语义信息的密集向量,用于在法条中使用密集检索。
(4)法条编码模块
法条编码模块与事实编码模块相似,是用于对所有的法律条文进行编码的模块。通过该模块可以得到各个法律条文的密集向量表示,并将其与事实编码器得到的密集向量做相似度计算,通过softmax得到最终的概率分布(即第二条文匹配度)。需要说明的是,由于事实描述和法律条文的文本表述风格存在差异,法条编码模块和事实编码模块所采用的编码器是相互独立的。
最终,将裁判文书匹配模块和法条编码模块所得到的两个概率分布相加(即将某个法律条文和事实描述的第一条文匹配度,以及该法律条文和事实描述的第二条文匹配度相加,得到该法律条文的条文匹配度),得到最终推荐法条的概率分布(即条文匹配度),取概率最高的法条作为最终推荐的结果。
通过上述方法,在输入的事实描述是:“我所在的单位在没有通知我的情况下修改了关于薪酬的规章制度,并且我的工资被降低了”的情况下,该法律条文检索系统将向用户推荐以下内容:《劳动合同法》第四条“用人单位应当依法建立和完善劳动规章制度,保障劳动者享有劳动权利、履行劳动义务。用人单位在制定、修改或者决定有关劳动报酬、工作时间、休息休假、劳动安全卫生、保险福利、职工培训、劳动纪律以及劳动定额管理等直接涉及劳动者切身利益的规章制度或者重大事项时,应当经职工代表大会或者全体职工讨论,提出方案和意见,与工会或者职工代表平等协商确定。在规章制度和重大事项决定实施过程中,工会或者职工认为不适当的,有权向用人单位提出,通过协商予以修改完善。用人单位应当将直接涉及劳动者切身利益的规章制度和重大事项决定公示,或者告知劳动者。”
此外,上述法律条文检索方法除了应用于法律条文检索系统以供用户直接检索法律条文外,还可以应用于智慧法庭系统、法律咨询系统或法律援助系统等接下来将详细叙述上述方法如何应用于智慧法庭系统、法律咨询系统。
首先,在上述方法应用于智慧法庭系统的情况下,可以辅助法官进行裁判。具体来说,当法官停留在阅卷界面时,法官可以选定起诉状或起诉书中的事实描述,或者选定法院认定的事实,智慧法庭系统可以将法官选定的内容作为待检索的事实描述,通过上述方法检索得到目标法律条文,通过目标法律条文辅助法官进行裁判。
换言之,本说明书还提供一种智慧法庭系统,所述智慧法庭系统至少包括法律条文检索模块;所述法律条文检索模块执行:在检测到法官在阅卷界面内选定起诉书或起诉状中事实描述的情况下,将法官选定的事实描述作为待检索的事实描述;根据前述的法律条文检索方法检索得到目标法律条文;在阅卷界面内显示检索得到的目标法律条文,以供法官根据所述目标法律条文进行裁判。
其中,阅卷界面指的是法官终端看到的可以阅览卷宗、证据等的界面。通过上述智慧法庭系统,可以提高法官的处理效率,提升法官的使用体验。
其次,在上述方法应用于法律咨询系统的情况下,可以辅助提供法律咨询的律师或者从业者(也就是回答者)来提供法律咨询服务。具体来说,法律咨询系统会为每个咨询者匹配一个回答者,回答者提出法律问题后,回答者可以选定法律问题的事实描述,法律咨询系统会将选定的内容作为待检索的事实描述,通过前述的法律条文检索方法检索到法律条文,并将法律条文发送给回答者,以辅助回答者提供法律咨询服务。
换言之,本说明书还提供一种法律咨询系统,所述法律咨询系统用于为咨询者匹配回答者,回答者负责回答咨询者提供的法律问题;所述法律咨询系统至少包括法律条文检索模块;所述法律条文检索模块执行:在检测到回答者选中咨询者输入的法律问题的事实描述后,将选中的事实描述作为待检索的事实描述,并通过前述的法律条文检索方法检索得到目标法律条文;将目标法律条文发送给回答者,以供回答者根据目标法律条文为咨询者提供法律咨询服务。
上述法律咨询系统可以提高回答者的效率,提升回答者和咨询者的使用体验。
此外,本说明书中的法律条文检索方法也可以应用于其他需要检索法律条文的场景,比如法律援助系统,上述两个例子只是两个示例,并不表示对于本说明书上述方法应用场景的限定。
与前述方法的实施例相对应,本说明书还提供了法律条文检索装置及其所应用的电子设备的实施例。
如图4所示,图4是本说明书根据一示例性实施例示出的一种法律条文检索装置的框图,所述装置包括:
事实描述获取模块410,用于获取待检索的事实描述;所述事实描述是法律相关问题的描述.
分类模块420,用于将待检索的事实描述输入分类模块,得到待检索的事实描述对应的第一法律问题标签,所述第一法律问题标签用于表示待检索的事实描述所属的法律类别。
匹配模块430,用于将所述第一法律问题标签与裁判文书集合中的各个裁判文书对应的第二法律问题标签进行匹配,得到各个裁判文书与待检索的事实描述的匹配度,所述第二法律问题标签用于表示裁判文书中包括的事实描述所属的法律类别。
条文匹配度确定模块440,用于根据各个裁判文书与待检索的事实描述的匹配度、及各个裁判文书中所引用的法律条文,确定各个裁判文书中包括的各个法律条文与待检索的事实描述之间的条文匹配度。
目标法律条文检索模块450,用于根据各个法律条文的条文匹配度,从各个法律条文中检索出与待检索的事实描述对应的目标法律条文。
其中,所述匹配模块430具体包括:转换子模块4301(图4中未示出),用于将所述第一法律问题标签转换成第一标签向量;相似度计算子模块4302(图4中未示出),用于获取每个裁判文书对应的第二法律问题标签转换成的第二标签向量;计算所述第一标签向量与每个第二标签向量的相似度,并根据所述相似度得到各个裁判文书与待检索的事实描述的匹配度。
其中,所述第一法律问题标签的数量是多个;相似度计算子模块具体用于:根据待检索的事实描述对应的多个第一法律问题标签、以及每个第一法律问题标签分别对应的预设权重,将待检索的事实描述对应的多个第一法律问题标签转换成第一标签向量。
其中,所述第一法律问题标签和第二法律问题标签分别包括第一级标签和第二级标签,所述第一级标签表示事实描述所属的法律类别是第一类别,所述第二级标签表示事实描述所属的法律类别是第二类别,且所述第二类别是第一类别的子类别。在上述情况下,匹配模块430前,还包括裁判文书获取模块425(图4中未示出),用于根据所述第一法律问题标签和各个裁判文书对应的第二法律问题标签中包括的第一级标签间的匹配度,获取初始裁判文书集合,所述初始裁判文书集合中各裁判文书中包括的事实描述的第一级标签,与待检索的事实描述的第一级标签相匹配;根据所述第一法律问题标签和各个裁判文书对应的第二法律问题标签中包括的第二级标签间的匹配度,从所述初始裁判文书集合中获取裁判文书集合,所述裁判文书集合中各裁判文书中包括的事实描述的第二级标签,与待检索的事实描述的第二级标签相匹配。
此外,上述装置还包括第二法律问题标签预存模块400(图4中未示出),用于将每个裁判文书的事实描述输入所述分类模块,得到每个裁判文书对应的第二法律问题标签;存储所述每个裁判文书对应的第二法律问题标签。
条文匹配度确定模块440具体用于:针对每个裁判文书,根据该裁判文书和待检索的事实描述的匹配度,得到该裁判文书所引用的各个法律条文和待检索的事实描述的匹配度;针对每个法律条文,根据每个引用该法律条文的裁判文书对应的该法律条文和待检索的事实描述的匹配度,得到该法律条文的条文匹配度。
此外,上述装置还包括法律条文匹配模块460(图4中未示出),具体用于将待检索的事实描述进行编码,得到待检索的事实描述的特征向量;将待检索的事实描述的特征向量和每个法律条文的特征向量相匹配,得到每个法律条文和待检索的事实描述的第二条文匹配度。在这种情况下,目标法律条文检索模块450具体用于:将各个裁判文书中包括的法律条文与待检索的事实描述之间的条文匹配度作为第一条文匹配度;针对每个法律条文,结合该法律条文对应的第一匹配度和第二匹配度,得到该法律条文和待检索的事实描述的条文匹配度;根据各个法律条文的条文匹配度,从各个法律条文中检索出与待检索的事实描述对应的目标法律条文。
上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
如图5所示,图5示出了实施例法律条文检索装置所在电子设备的一种硬件结构图,该设备可以包括:处理器1010、用于存储处理器可执行指令的存储器;1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。其中所述处理器通过运行所述可执行指令以实现上述的法律条文检索方法。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的法律条文检索方法。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
Claims (12)
1.一种法律条文检索方法,所述方法包括:
获取待检索的事实描述;所述事实描述是法律相关问题的描述;
将待检索的事实描述输入分类模块,得到待检索的事实描述对应的第一法律问题标签,所述第一法律问题标签用于表示待检索的事实描述所属的法律类别;
将所述第一法律问题标签与裁判文书集合中的各个裁判文书对应的第二法律问题标签进行匹配,得到各个裁判文书与待检索的事实描述的匹配度,所述第二法律问题标签用于表示裁判文书中包括的事实描述所属的法律类别;
根据各个裁判文书与待检索的事实描述的匹配度、及各个裁判文书中所引用的法律条文,确定各个裁判文书中包括的各个法律条文与待检索的事实描述之间的条文匹配度;
根据各个法律条文的条文匹配度,从各个法律条文中检索出与待检索的事实描述对应的目标法律条文。
2.根据权利要求1所述的方法,所述将所述第一法律问题标签与裁判文书集合中的各个裁判文书对应的第二法律问题标签进行匹配,得到各个裁判文书与待检索的事实描述的匹配度,包括:
将所述第一法律问题标签转换成第一标签向量;
获取每个裁判文书对应的第二法律问题标签转换成的第二标签向量;
计算所述第一标签向量与每个第二标签向量的相似度,并根据所述相似度得到各个裁判文书与待检索的事实描述的匹配度。
3.根据权利要求2所述的方法,所述第一法律问题标签的数量是多个;
所述将所述第一法律问题标签转换成第一标签向量,包括:
根据待检索的事实描述对应的多个第一法律问题标签、以及每个第一法律问题标签分别对应的预设权重,将待检索的事实描述对应的多个第一法律问题标签转换成第一标签向量。
4.根据权利要求1所述的方法,所述第一法律问题标签和第二法律问题标签分别包括第一级标签和第二级标签,所述第一级标签表示事实描述所属的法律类别是第一类别,所述第二级标签表示事实描述所属的法律类别是第二类别,且所述第二类别是第一类别的子类别;
所述将所述第一法律问题标签与裁判文书集合中的各个裁判文书对应的第二法律问题标签进行匹配之前,所述方法还包括:
根据所述第一法律问题标签和各个裁判文书对应的第二法律问题标签中包括的第一级标签间的匹配度,获取初始裁判文书集合,所述初始裁判文书集合中各裁判文书中包括的事实描述的第一级标签,与待检索的事实描述的第一级标签相匹配;
根据所述第一法律问题标签和各个裁判文书对应的第二法律问题标签中包括的第二级标签间的匹配度,从所述初始裁判文书集合中获取裁判文书集合,所述裁判文书集合中各裁判文书中包括的事实描述的第二级标签,与待检索的事实描述的第二级标签相匹配。
5.根据权利要求1所述的方法,所述方法还包括:
将每个裁判文书的事实描述输入所述分类模块,得到每个裁判文书对应的第二法律问题标签;
存储所述每个裁判文书对应的第二法律问题标签。
6.根据权利要求1所述的方法,所述根据各个裁判文书与待检索的事实描述的匹配度、及各个裁判文书中所引用的法律条文,确定各个裁判文书中包括的各个法律条文与待检索的事实描述之间的条文匹配度,包括:
针对每个裁判文书,根据该裁判文书和待检索的事实描述的匹配度,得到该裁判文书所引用的各个法律条文和待检索的事实描述的匹配度;
针对每个法律条文,根据每个引用该法律条文的裁判文书对应的该法律条文和待检索的事实描述的匹配度,得到该法律条文的条文匹配度。
7.根据权利要求1~6任一所述的方法,
还包括:将待检索的事实描述进行编码,得到待检索的事实描述的特征向量;
将待检索的事实描述的特征向量和每个法律条文的特征向量相匹配,得到每个法律条文和待检索的事实描述的第二条文匹配度;
所述根据各个法律条文的条文匹配度,从各个法律条文中检索出与待检索的事实描述对应的目标法律条文,包括:
将各个裁判文书中包括的法律条文与待检索的事实描述之间的条文匹配度作为第一条文匹配度;
针对每个法律条文,结合该法律条文对应的第一匹配度和第二匹配度,得到该法律条文和待检索的事实描述的条文匹配度;
根据各个法律条文的条文匹配度,从各个法律条文中检索出与待检索的事实描述对应的目标法律条文。
8.一种智慧法庭系统,所述智慧法庭系统至少包括法律条文检索模块;
所述法律条文检索模块执行:
在检测到法官在阅卷界面内选定起诉书或起诉状中事实描述的情况下,将法官选定的事实描述作为待检索的事实描述;
根据权利要求1-7任一项所述的法律条文检索方法检索得到目标法律条文;
在阅卷界面内显示检索得到的目标法律条文,以供法官根据所述目标法律条文进行裁判。
9.一种法律咨询系统,所述法律咨询系统用于为咨询者匹配回答者,回答者负责回答咨询者提供的法律问题;所述法律咨询系统至少包括法律条文检索模块;
所述法律条文检索模块执行:
在检测到回答者选中咨询者输入的法律问题的事实描述后,将选中的事实描述作为待检索的事实描述,并通过权利要求1-7任一项所述的法律条文检索方法检索得到目标法律条文;
将目标法律条文发送给回答者,以供回答者根据目标法律条文为咨询者提供法律咨询服务。
10.一种法律条文检索装置,所述装置包括:
事实描述获取模块,用于获取待检索的事实描述;所述事实描述是法律相关问题的描述;
分类模块,用于将待检索的事实描述输入分类模块,得到待检索的事实描述对应的第一法律问题标签,所述第一法律问题标签用于表示待检索的事实描述所属的法律类别;
匹配模块,用于将所述第一法律问题标签与裁判文书集合中的各个裁判文书对应的第二法律问题标签进行匹配,得到各个裁判文书与待检索的事实描述的匹配度,所述第二法律问题标签用于表示裁判文书中包括的事实描述所属的法律类别;
条文匹配度确定模块,用于根据各个裁判文书与待检索的事实描述的匹配度、及各个裁判文书中所引用的法律条文,确定各个裁判文书中包括的各个法律条文与待检索的事实描述之间的条文匹配度;
目标法律条文检索模块,用于根据各个法律条文的条文匹配度,从各个法律条文中检索出与待检索的事实描述对应的目标法律条文。
11.一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如权利要求1-7中任一项所述的法律条文检索方法。
12.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机指令,所述计算机指令被处理器执行时实现如权利要求1-7中任一项所述的法律条文检索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210119189.0A CN114579770A (zh) | 2022-02-08 | 2022-02-08 | 一种法律条文检索方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210119189.0A CN114579770A (zh) | 2022-02-08 | 2022-02-08 | 一种法律条文检索方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114579770A true CN114579770A (zh) | 2022-06-03 |
Family
ID=81774108
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210119189.0A Pending CN114579770A (zh) | 2022-02-08 | 2022-02-08 | 一种法律条文检索方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114579770A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN119046445A (zh) * | 2024-10-31 | 2024-11-29 | 江西财经大学 | 一种法学用法条查询方法与系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6772149B1 (en) * | 1999-09-23 | 2004-08-03 | Lexis-Nexis Group | System and method for identifying facts and legal discussion in court case law documents |
CN108763484A (zh) * | 2018-05-25 | 2018-11-06 | 南京大学 | 一种基于lda主题模型的法条推荐方法 |
CN113297360A (zh) * | 2021-04-29 | 2021-08-24 | 天津汇智星源信息技术有限公司 | 基于弱监督学习和联合学习机制的法律问答方法及设备 |
CN113312474A (zh) * | 2020-02-27 | 2021-08-27 | 北京睿客邦科技有限公司 | 一种基于深度学习的法律文书的相似案件智能检索系统 |
CN113536780A (zh) * | 2021-06-29 | 2021-10-22 | 华东师范大学 | 一种基于自然语言处理的企业破产案件智能辅助判案方法 |
-
2022
- 2022-02-08 CN CN202210119189.0A patent/CN114579770A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6772149B1 (en) * | 1999-09-23 | 2004-08-03 | Lexis-Nexis Group | System and method for identifying facts and legal discussion in court case law documents |
CN108763484A (zh) * | 2018-05-25 | 2018-11-06 | 南京大学 | 一种基于lda主题模型的法条推荐方法 |
CN113312474A (zh) * | 2020-02-27 | 2021-08-27 | 北京睿客邦科技有限公司 | 一种基于深度学习的法律文书的相似案件智能检索系统 |
CN113297360A (zh) * | 2021-04-29 | 2021-08-24 | 天津汇智星源信息技术有限公司 | 基于弱监督学习和联合学习机制的法律问答方法及设备 |
CN113536780A (zh) * | 2021-06-29 | 2021-10-22 | 华东师范大学 | 一种基于自然语言处理的企业破产案件智能辅助判案方法 |
Non-Patent Citations (2)
Title |
---|
HAOYANG ZHANG 等: "Similarity Judgment of Civil Aviation Regulations Based on Doc2Vec Deep Learning Algorithm", 《2019 12TH INTERNATIONAL CONGRESS ON IMAGE AND SIGNAL PROCESSING, BIOMEDICAL ENGINEERING AND INFORMATICS (CISP-BMEI)》, 23 January 2020 (2020-01-23), pages 1 - 8 * |
陈文仲: "面向案件文书的罪名预测方法研究", 《中国优秀硕士学位论文全文数据库 社会科学Ⅰ辑》, 15 January 2022 (2022-01-15), pages 118 - 18 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN119046445A (zh) * | 2024-10-31 | 2024-11-29 | 江西财经大学 | 一种法学用法条查询方法与系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Riaz et al. | Opinion mining on large scale data using sentiment analysis and k-means clustering | |
Gepp et al. | Big data techniques in auditing research and practice: Current trends and future opportunities | |
Binali et al. | A state of the art opinion mining and its application domains | |
Takala et al. | Gold-standard for Topic-specific Sentiment Analysis of Economic Texts. | |
US20090281870A1 (en) | Ranking products by mining comparison sentiment | |
KR101335540B1 (ko) | 온톨로지 기반의 문서 분류 방법 및 장치 | |
CN110674252A (zh) | 一种面向司法领域的高精度语义搜索系统 | |
Im et al. | Linked tag: image annotation using semantic relationships between image tags | |
CN114254201A (zh) | 一种科技项目评审专家的推荐方法 | |
Chowdhuri et al. | Ontology based integration of XBRL filings for financial decision making | |
US20240370928A1 (en) | Asset value evaluation method and apparatus, model training method and apparatus, and readable storage medium | |
CN112330510A (zh) | 一种志愿推荐方法、装置、服务器及计算机可读存储介质 | |
KR20200145299A (ko) | 온라인 면접 동영상 분석 및 소셜미디어 정보분석 기반 지능형 채용지원 플랫폼 | |
CN116109373A (zh) | 金融产品的推荐方法、装置、电子设备和介质 | |
CN112395484A (zh) | 一种面向自动驾驶汽车的用户满意度评价方法 | |
Nithya et al. | Sentiment analysis on unstructured review | |
CN114579770A (zh) | 一种法律条文检索方法及装置 | |
CN101578600A (zh) | 用于将一个用户的分类标签与由另一个用户定义的分类标签相关联的系统和方法 | |
CN112949963A (zh) | 员工服务质量的评估方法、装置、存储介质和智能设备 | |
CN110209767A (zh) | 一种用户画像构建方法 | |
Kimbrough et al. | On developing indicators with text analytics: Exploring concept vectors applied to English and Chinese texts | |
Gravier et al. | Shaping-up multimedia analytics: Needs and expectations of media professionals | |
Spahiu et al. | Topic profiling benchmarks in the linked open data cloud: Issues and lessons learned | |
Scholtes et al. | Big data analytics for e-discovery | |
CN110837732A (zh) | 目标人物间亲密度识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230802 Address after: 311121 Room 516, floor 5, building 3, No. 969, Wenyi West Road, Wuchang Street, Yuhang District, Hangzhou City, Zhejiang Province Applicant after: Alibaba Dharma Institute (Hangzhou) Technology Co.,Ltd. Address before: 310052 room 508, 5th floor, building 4, No. 699 Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province Applicant before: Alibaba (China) Co.,Ltd. |
|
TA01 | Transfer of patent application right |