Nothing Special   »   [go: up one dir, main page]

CN111198953A - 基于案件文本信息推荐类案的方法、系统及计算机可读存储介质 - Google Patents

基于案件文本信息推荐类案的方法、系统及计算机可读存储介质 Download PDF

Info

Publication number
CN111198953A
CN111198953A CN201811369302.0A CN201811369302A CN111198953A CN 111198953 A CN111198953 A CN 111198953A CN 201811369302 A CN201811369302 A CN 201811369302A CN 111198953 A CN111198953 A CN 111198953A
Authority
CN
China
Prior art keywords
case
label
specific
text
labels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811369302.0A
Other languages
English (en)
Other versions
CN111198953B (zh
Inventor
王赛瑜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Smart Security Technology Co ltd
Original Assignee
Beijing Smart Security Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Smart Security Technology Co ltd filed Critical Beijing Smart Security Technology Co ltd
Priority to CN201811369302.0A priority Critical patent/CN111198953B/zh
Publication of CN111198953A publication Critical patent/CN111198953A/zh
Application granted granted Critical
Publication of CN111198953B publication Critical patent/CN111198953B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Technology Law (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于案件文本信息推荐类案的方法、系统及计算机可读存储介质,其中该基于案件文本信息推荐类案的方法包括构建案件文本要素的特定标签的数据库,所述案件文本要素包括案由、事实、情节、犯罪主体及犯罪对象;导入待处理案件文本;分析待处理案件文本,根据待处理案件文本中的案件文本要素标记对应的特定标签;将待处理案件文本的特定标签与服务器中的类案进行匹配;根据匹配度进行排序并显示对应的至少部分的类案信息。本发明的基于案件文本信息推荐类案的方法查找类案更快捷、使用更方便高效,并且匹配的精准度更高。

Description

基于案件文本信息推荐类案的方法、系统及计算机可读存储 介质
技术领域
本发明涉及法律案件推荐类案技术领域,特别涉及一种基于案件文本信息推荐类案的方法、系统及计算机可读存储介质。
背景技术
目前,公检法机关的司法工作人员当需要查找一个案件的类案时,需要通过阅读案件文书,总结出对应的案由、事实情节,然后在类案网站上输入案由等信息搜索对应类案。这种方式主要有以下几点缺陷:1.通过查阅案件文书提炼出对应案由、事实情节信息,这个过程比较耗费时间,而且可能出现一些差错。2.在类案网站上无法根据一组事实情节类计算综合匹配程度,所以比较难找到与当前案件整体更加匹配的类案。3.无法推荐出当地比较典型的指导性案例。以此造成查阅相关类案费时费力,精准度不高,使用非常不便。
发明内容
本发明的主要目的是提供一种基于案件文本信息推荐类案的方法,旨在查找类案更快捷、使用更方便高效,并且匹配的精准度更高。
为实现上述目的,本发明提出一种基于案件文本信息推荐类案的方法,该基于案件文本信息推荐类案的方法包括以下步骤:
S10:构建案件文本要素的特定标签的数据库,所述案件文本要素包括案由、事实、情节、犯罪主体及犯罪对象;
S30:导入待处理案件文本;
S40:分析待处理案件文本,根据待处理案件文本中的案件文本要素标记对应的特定标签;
S50:将待处理案件文本的特定标签与服务器中的类案进行匹配;
S60:根据匹配度进行排序并显示对应的至少部分的类案信息。
优选地,案由的特定标签包括行贿罪标签、受贿罪标签、贪污罪标签、强奸罪标签、敲诈勒索罪标签、故意伤害罪标签、非法吸收公众存款罪标签、非法拘禁罪标签、掩饰标签、隐瞒犯罪所得标签、犯罪所得收益罪标签、寻衅滋事罪标签、及职务侵占罪标签;
事实的特定标签包括走私标签、贩卖标签、运输标签、制造毒品数量大标签、个人集资诈骗数额巨大标签、电信诈骗数额难以查证认定为其他严重情节标签、非法吸收公众存款数额较大标签、非法拘禁致一人死亡标签、诈骗数额巨大标签、制造毒品数量较大标签、个人集资诈骗数额较大标签、非法拘禁致一人重伤标签、单位集资诈骗数额较大标签、非法持有毒品情节严重标签、及诈骗数额特别巨大标签;
情节的特定标签包括达成刑事和解协议标签、主犯标签、退赃标签、退赔标签、坦白标签、积极赔偿标签、取得谅解标签、如实供述标签、犯罪未遂标签、前科劣迹标签、自愿认罪标签、累犯标签、共同犯罪标签、及犯罪中止标签;
犯罪主体的特定标签包括又聋又哑标签、盲人标签、精神病人标签、老年人标签、及未成年人标签;
犯罪对象的特定标签包括未成年人标签、老年人标签、及残疾人标签。
优选地,S30包括以下步骤:
S31:根据正则匹配规则将待处理案件文本划分为案由、事实、情节、犯罪主体及犯罪对象;
S32:根据正则匹配规则和数据库中案件文本要素的特定标签分别对待处理案件文本的案由、事实、情节、犯罪主体及犯罪对象进行标记对应的特定标签。
优选地,S40具体包括以下步骤:
S41:根据正则匹配规则将案件文本要素中的关键句子和/或字词分别与待处理案件文本的对应案由、事实、情节、犯罪主体及犯罪对象进行匹配,
S42:根据匹配结果对待处理案件文本的整体或待处理案件文本的对应段落打上特定标签。
优选地,S50具体包括以下步骤:
S51:分别对案由、事实、情节、犯罪主体、犯罪对象、审级进行分配权重;
S52:计算待处理案件文本的分值D,计算公式为:D=a×(案由的特定标签个数×R1+事实的特定标签个数×R2+情节的特定标签个数×R3+ 主体的特定标签个数×R4+对象的特定标签个数×R5+R6),
S53:计算每一个类案的分值L,计算公式为:L=a×(类案的案由命中待处理案件文本的案由的特定标签的个数×R1-X1/Y1×R1+类案的事实命中待处理案件文本的事实的特定标签的个数×R2-X2/Y2×R2+类案的情节命中待处理案件文本的情节的特定标签的个数×R3-X3/Y3×R3+类案的主体命中待处理案件文本的主体的特定标签的个数×R4-X4/Y4×R4+类案的对象命中待处理案件文本的对象的特定标签的个数×R5-X5/Y5×R5+ 审级命中个数×R6),
S54:计算匹配度P,计算公式为P=D/L×100%,
其中,其中R1为案由权重,R2为事实权重,R3为情节权重,R4为犯罪主体权重,R5为犯罪对象权重,R6为审级权重,a为相匹配的单个标签分值,
X1为案由中不同于待处理案件文本的特定标签的个数,X2为事实中不同于待处理案件文本的特定标签的个数,X3为情节中不同于待处理案件文本的特定标签的个数,X4为犯罪主体中不同于待处理案件文本的特定标签的个数,X5为犯罪对象中不同于待处理案件文本的特定标签的个数,
Y1为案由中待处理案件文本的特定标签与类案标签的去重个数,Y2为事实中待处理案件文本的特定标签与类案标签的去重个数,Y3为情节中待处理案件文本的特定标签与类案标签的去重个数,Y4为犯罪主体中待处理案件文本的特定标签与类案标签的去重个数,Y5为犯罪对象中待处理案件文本的特定标签与类案标签的去重个数。
优选地,S60具体包括以下步骤:
S61:根据类案信息的匹配度由高到低进行排序并至少部分进行显示。
优选地,S10之后,S30之前包括以下步骤:
S20:对服务器中的类案进行分析打上对应的特定标签。
优选地,S60之后还包括以下步骤:
S70:当选中待处理案件文本的至少一个特定标签时,突出显示对应的案件。
本发明还提出一种基于案件文本信息推荐类案的系统,所述基于案件文本信息推荐类案的系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于案件文本信息推荐类案的程序,其中:
所述基于案件文本信息推荐类案的程序被所述处理器执行时实现如上述所述的基于案件文本信息推荐类案的方法的步骤。
本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有基于案件文本信息推荐类案的程序,所述基于案件文本信息推荐类案的程序被处理器执行时实现如上述所述的基于案件文本信息推荐类案的方法的步骤。
本发明技术方案通过构建案件文本要素的特定标签的数据库,所述案件文本要素包括案由、事实、情节、犯罪主体及犯罪对象;导入待处理案件文本;分析待处理案件文本,根据待处理案件文本中的案件文本要素标记对应的特定标签;将待处理案件文本的特定标签与服务器中的类案进行匹配;根据匹配度进行排序并显示对应的至少部分的类案信息。使本发明在查找待处理案件文本的类案时,只需将待处理案件进行导入,通过自动运算处理将导入的待处理案件的特定标签进行类案查找,得到精确匹配度的类案信息,以此使查找类案更快捷、使用更方便高效,并且匹配的精准度更高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明基于案件文本信息推荐类案的方法一实施例的流程结构示意图;
图2为本发明基于案件文本信息推荐类案的方法另一实施例的流程结构示意图;
图3为图1和图2的步骤S30的细化流程结构示意图;
图4为图1和图2的步骤S40的细化流程结构示意图;
图5为图1和图2的步骤S50的细化流程结构示意图;
图6为图1和图2的步骤S60的细化流程结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
在本发明中,除非另有明确的规定和限定,术语“连接”、“固定”等应做广义理解,例如,“固定”可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
另外,在本发明中如涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
本发明提出一种基于案件文本信息推荐类案的系统。所述基于案件文本信息推荐类案的系统可以是移动电话、智能电话、笔记本电脑、PAD(平板电脑)等可移动设备,以及诸如台式计算机、服务器等固定终端。所述基于案件文本信息推荐类案的系统包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于案件文本信息推荐类案的程序。
其中,所述存储器至少包括一种计算机可读存储介质,用于存储安装于所述基于案件文本信息推荐类案的系统的操作系统和各类应用软件,例如基于案件文本信息推荐类案的程序的程序代码等。此外,所述存储器还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器通常用于控制所述基于案件文本信息推荐类案的系统的总体操作。本实施例中,所述处理器用于运行所述存储器中存储的程序代码或者处理数据,例如运行所述基于案件文本信息推荐类案的程序等。
参照图1,所述基于案件文本信息推荐类案的程序被所述处理器执行时,实现如下步骤:
S10:构建案件文本要素的特定标签的数据库,所述案件文本要素包括案由、事实、情节、犯罪主体及犯罪对象;
S30:导入待处理案件文本;
S40:分析待处理案件文本,根据待处理案件文本中的案件文本要素标记对应的特定标签;
S50:将待处理案件文本的特定标签与服务器中的类案进行匹配;
S60:根据匹配度进行排序并显示对应的至少部分的类案信息。
其中的数据库可存储在服务器存储器上或云端服务器上,通过直接读取或互联网进行获取数据库中的类案信息,数据库中的特定标签按照案件文本要素进行分类,具体为案由的特定标签包括行贿罪标签、受贿罪标签、贪污罪标签、强奸罪标签、敲诈勒索罪标签、故意伤害罪标签、非法吸收公众存款罪标签、非法拘禁罪标签、掩饰标签、隐瞒犯罪所得标签、犯罪所得收益罪标签、寻衅滋事罪标签、及职务侵占罪标签;
事实的特定标签包括走私标签、贩卖标签、运输标签、制造毒品数量大标签、个人集资诈骗数额巨大标签、电信诈骗数额难以查证认定为其他严重情节标签、非法吸收公众存款数额较大标签、非法拘禁致一人死亡标签、诈骗数额巨大标签、制造毒品数量较大标签、个人集资诈骗数额较大标签、非法拘禁致一人重伤标签、单位集资诈骗数额较大标签、非法持有毒品情节严重标签、及诈骗数额特别巨大标签;
情节的特定标签包括达成刑事和解协议标签、主犯标签、退赃标签、退赔标签、坦白标签、积极赔偿标签、取得谅解标签、如实供述标签、犯罪未遂标签、前科劣迹标签、自愿认罪标签、累犯标签、共同犯罪标签、及犯罪中止标签;
犯罪主体的特定标签包括又聋又哑标签、盲人标签、精神病人标签、老年人标签、及未成年人标签;
犯罪对象的特定标签包括未成年人标签、老年人标签、及残疾人标签。
一实施例为:向计算机或服务端输入待处理案件的案号等唯一可确定该案件的信息或计算机直接读取待处理案件文本,再通过运算处理器进行分析处理,将待处理案件文本中的案件文本要素根据正则匹配规则拆分为案件文本要素,具体包括以下步骤:
参照图3,S31:根据正则匹配规则将待处理案件文本划分为案由、事实、情节、犯罪主体及犯罪对象;
S32:根据正则匹配规则和数据库中案件文本要素的特定标签分别对待处理案件文本的案由、事实、情节、犯罪主体及犯罪对象进行标记对应的特定标签。
其中事实的正则匹配规则为:
(盗|窃|偷|总金额)[^。!;]([\s\d,,]+[千万多余])元;
([\d一二三四五六七八九十.])+[千毫]{0,1}克[^、,。,!;;]海洛因;
(抢|抢劫|劫取)[^。!]{0,30}([\d,,]+[千万多余])元、(致|造成|构成|打成)([^,,。;、:;!]){0,5}轻微伤。
情节要素对应正则匹配规则比如:
(?<!不)(系|属|是)[^,。、!,.]?主犯、(?<!未)退还.{0,10}(赃款|经济损失);
(使用|采用|采取)+(暴力手段|胁迫手段|麻醉手段);
诈骗.{0,4}(救灾|抢险|防汛|优抚|扶贫|移民|救济|医疗).{0,4}(款物|财物|物资);
冒充(军警|司法).{0,5}人员非法(扣押|拘禁)。
犯罪主体对应正则匹配规则比如:
又聋又哑;
盲人;
精神病人;
已满七十五周岁的老年人;
未成年人。
犯罪对象对应正则匹配规则比如:
(被害人|(犯罪)?对象|被容留)[\u4E00-\u9FA5X1、(]{0,}[为|是|系|属](未成年|幼女|儿童);
(被害人|(犯罪)?对象|被容留)[\u4E00-\u9FA5X1、(]{0,}[为|是|系|属](老年人);
(被害人|(犯罪)?对象|被容留)[\u4E00-\u9FA5X1、(]{0,}[为|是|系|属](残疾人)。
参照图4,再执行S41:根据正则匹配规则将案件文本要素中的关键句子和/或字词分别与待处理案件文本的对应案由、事实、情节、犯罪主体及犯罪对象进行匹配,
S42:根据匹配结果对待处理案件文本的整体或待处理案件文本的对应段落打上特定标签。
具体通过正则匹配规则匹配每一个案件文本要素中相关的关键字、词、句等进行标记特定标签,其中相关的关键字、词、句可与特定标签中的信息相同或等同,对待处理案件文本的内容根据每一个案件文本要素逐句与相关的关键字、词、句进行分析,当匹配成功后,对待处理案件文本中的案件文本要素标记对应的特定标签、待处理案件文本的整体或待处理案件文本的对应段落打上特定标签。
接着再将待处理案件文本的特定标签与服务器中的类案通过正则匹配规则进行匹配,使匹配的效率和精准度更高,具体包括如下步骤:
参照图5,S51:分别对案由、事实、情节、犯罪主体、犯罪对象、审级进行分配权重;
S52:计算待处理案件文本的分值D,计算公式为:D=a×(案由的特定标签个数×R1+事实的特定标签个数×R2+情节的特定标签个数×R3+ 主体的特定标签个数×R4+对象的特定标签个数×R5+R6),
S53:计算每一个类案的分值L,计算公式为:L=a×(类案的案由命中待处理案件文本的案由的特定标签的个数×R1-X1/Y1×R1+类案的事实命中待处理案件文本的事实的特定标签的个数×R2-X2/Y2×R2+类案的情节命中待处理案件文本的情节的特定标签的个数×R3-X3/Y3×R3+类案的主体命中待处理案件文本的主体的特定标签的个数×R4-X4/Y4×R4+类案的对象命中待处理案件文本的对象的特定标签的个数×R5-X5/Y5×R5+ 审级命中个数×R6),
S54:计算匹配度P,计算公式为P=D/L×100%,
其中,其中R1为案由权重,R2为事实权重,R3为情节权重,R4为犯罪主体权重,R5为犯罪对象权重,R6为审级权重,a为相匹配的单个标签分值,
X1为案由中不同于待处理案件文本的特定标签的个数,X2为事实中不同于待处理案件文本的特定标签的个数,X3为情节中不同于待处理案件文本的特定标签的个数,X4为犯罪主体中不同于待处理案件文本的特定标签的个数,X5为犯罪对象中不同于待处理案件文本的特定标签的个数,
Y1为案由中待处理案件文本的特定标签与类案标签的去重个数,Y2为事实中待处理案件文本的特定标签与类案标签的去重个数,Y3为情节中待处理案件文本的特定标签与类案标签的去重个数,Y4为犯罪主体中待处理案件文本的特定标签与类案标签的去重个数,Y5为犯罪对象中待处理案件文本的特定标签与类案标签的去重个数。
最后根据匹配度进行排序并显示对应的至少部分的类案信息于用户端的显示屏上。供用户进行查阅类案,进一步地参照图6,通过S61:根据类案信息的匹配度由高到低进行排序并至少部分进行显示。使用户可便于快速选择匹配度更高的类案,使用更方便快捷。
参照图2,进一步地,S60之后还包括以下步骤:
S70:当选中待处理案件文本的至少一个特定标签时,突出显示对应的案件。
具体为,待处理案件文本的特定标签可在步骤S40后,可将特定标签进行显示,用户可对该特定标签进行调整确认,当查阅类案时,可通过点击至少一个特定标签时,该特定标签对应的类案或对应的类案中的对应的字、词、句进行突出显示,如字、词、句加亮、变色、增大、字体变化、增加底色等中的一种或多种,以便于用户进一步查阅,使用更高效方便。
参照图2,一实施例为,S10之后,S30之前包括以下步骤:
S20:对服务器中的类案进行分析打上对应的特定标签。
可将待处理案件文本的特定标签与服务器中的类案的特定标签进行匹配,根据匹配度进行排序并显示对应的至少部分的类案信息,以使运算处理是更快速,匹配的效率更高,匹配更精准。
具体一个案件为例如下:
被告人XX,男,1999年6月24日出生于海南省儋州市,汉族,初中文化程度,农民,住XX市XX镇。因本案于2016年7月21日被刑事拘留,2016 年8月26日被逮捕。
法定代理人黎XX,男,1976年12月7日出生,汉族,农民,住XX市 XX镇。系被告人XX的父亲。
法定代理人符XX,女,1978年6月14日出生,汉族,农民,住XX市 XX镇。系被告人XX的母亲。
指定辩护人林X,XX律师事务所律师。
本案由儋州市公安局侦查终结,以被告人XX涉嫌盗窃罪,于2016年10 月12日向本院移送审查起诉。本院受理后,于2016年10月12日已告知被告人有权委托辩护人,2016年10月12日已告知被害人有权委托诉讼代理人,依法讯问被告人,听取了被害人的意见,审查了全部案卷材料。
经审查查明:
1、2016年5月22日11时许,被告人XX、古xx和“大哥”(在逃)来到儋州市那大镇大勇商场停车场附近,看见被害人叶X骑电动车从大勇商场停车场出来,将叶X放在车头下方的一个手提包盗走,手提包内装有现金人民币14783元、苹果手机1部和银行卡。破案后,被盗财物已追回并发还被害人。
因价格认定事项不符合相关规定,儋州市价格认证中心对叶X被盗的一部苹果手机不予受理价格鉴定。
2、2016年5月29日19时许,被告人XX、古xx和“大哥”来到儋州市中兴大道百佳汇超市门前,使用利刃将被害人张X随身携带的挎包划破,盗走一个钱包,钱包内有现金人民币6817元。被害人系残疾人。破案后,被盗财物已追回并发还被害人。
2016年7月21日21时许,公安民警在那大镇解放南路处将形迹可疑的 XX抓获,经盘问教育后,XX如实供述了上述盗窃的犯罪事实。
认定上述事实的证据如下:
有书证常住人口信息、到案经过、刑事判决书及释放证明书;
被害人叶X、张X的陈述;
被告人XX的供述;
价格认定不予受理通知书;
现场勘查笔录及照片。
本院认为,被告人XX无视国家法律,以非法占有为目的,结伙采取秘密手段,携带凶器在公共场所二次盗窃他人财物共计人民币21600元,数额较大,其行为触犯《中华人民共和国刑法》第二百六十四条的规定,应当以盗窃罪追究被告人的刑事责任。被告人XX在实施盗窃行为时已满十六周岁未满十八周岁,系未成年人犯罪,适用《中华人民共和国刑法》第十七条第一款、第三款的规定,应当从轻或者减轻处罚。被告人XX因形迹可疑被盘问、教育后,主动交待了其犯罪事实,可认定为自首,适用《中华人民共和国刑事诉讼法》第六十七条的规定,依法可从轻或减轻处罚。
匹配类案结果:
1.通过语义分析技术,结合特定标签的数据库,解析出当前案件部分特定标签信息如下:
案由:盗窃罪
案件类型:刑事
审判程序:一审
案件归属:海南省、儋州市、儋州人民法院
案件类型:公开案例
犯罪主体:性别:男、作案时年龄:17岁、民族:汉、文化程度:初中、职业:农民、住址:XX市XX镇、所犯罪名:盗窃罪
犯罪对象:残疾人
犯罪事实:事实点标签-数额较大、事实点标签-携带凶器盗窃、事实数值标签-涉案金额3千至3万、事实数值标签-盗窃次数3次以上
犯罪情节:未成年人、自首、退赃退赔
2.根据解析的特定标签信息,推荐出的部分类案结果:
黄某某、吴某某犯盗窃罪一案刑事判决书
【事实】盗窃数额较大
【情节】退赃、退赔;坦白
【法院观点】本院认为,被告人吴某某、黄某某以非法占有为目的,秘密窃取他人财物价值人民币1692元,数额较大,其行为已构成盗窃罪,应予惩处。。公诉机关指控的犯罪事实清楚,证据确实、充分,指控的罪名成立。鉴于被告人吴某某、黄某某如实供述自己的罪行且被盗物品已发还给被害人,依法可从轻处罚。根据本案被告人吴某某、黄某某犯罪的事实、性质、情节及其行为对社会的危害程度,依照《中华人民共和国刑法》第二百六十四条、第二十五条第一款、第六十七条第三款、第五十二条、第六十四条之规定。
陆以某犯盗窃罪一案刑事判决书
【事实】多次盗窃;盗窃数额较大
【情节】退赃、退赔;坦白
【法院观点】本院认为,被告人陆以某无视国家法律,以非法占有为目的,三次秘密窃取他人财物,共价值人民币16180元,数额较大,其行为已构成盗窃罪,公诉机关指控的事实清楚,证据充分,罪名成立,应予支持。被告人陆以某为吸毒而实施盗窃,有酌定从重情节。鉴于被告人陆以某有坦白情节,且被盗物品已追回,可以从轻处罚。依照《中华人民共和国刑法》第二百六十四条、第五十二条、第六十四条、第六十七条第三款之规定。
以使本发明在查找待处理案件文本的类案时,只需将待处理案件进行导入,通过自动运算处理将导入的待处理案件的特定标签进行类案查找,得到精确匹配度的类案信息,以此使查找类案更快捷、使用更方便高效,并且匹配的精准度更高。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

Claims (10)

1.一种基于案件文本信息推荐类案的方法,其特征在于,包括以下步骤:
S10:构建案件文本要素的特定标签的数据库,所述案件文本要素包括案由、事实、情节、犯罪主体及犯罪对象;
S30:导入待处理案件文本;
S40:分析待处理案件文本,根据待处理案件文本中的案件文本要素标记对应的特定标签;
S50:将待处理案件文本的特定标签与服务器中的类案进行匹配;
S60:根据匹配度进行排序并显示对应的至少部分的类案信息。
2.如权利要求1所述的基于案件文本信息推荐类案的方法,其特征在于,
案由的特定标签包括行贿罪标签、受贿罪标签、贪污罪标签、强奸罪标签、敲诈勒索罪标签、故意伤害罪标签、非法吸收公众存款罪标签、非法拘禁罪标签、掩饰标签、隐瞒犯罪所得标签、犯罪所得收益罪标签、寻衅滋事罪标签、及职务侵占罪标签;
事实的特定标签包括走私标签、贩卖标签、运输标签、制造毒品数量大标签、个人集资诈骗数额巨大标签、电信诈骗数额难以查证认定为其他严重情节标签、非法吸收公众存款数额较大标签、非法拘禁致一人死亡标签、诈骗数额巨大标签、制造毒品数量较大标签、个人集资诈骗数额较大标签、非法拘禁致一人重伤标签、单位集资诈骗数额较大标签、非法持有毒品情节严重标签、及诈骗数额特别巨大标签;
情节的特定标签包括达成刑事和解协议标签、主犯标签、退赃标签、退赔标签、坦白标签、积极赔偿标签、取得谅解标签、如实供述标签、犯罪未遂标签、前科劣迹标签、自愿认罪标签、累犯标签、共同犯罪标签、及犯罪中止标签;
犯罪主体的特定标签包括又聋又哑标签、盲人标签、精神病人标签、老年人标签、及未成年人标签;
犯罪对象的特定标签包括未成年人标签、老年人标签、及残疾人标签。
3.如权利要求2所述的基于案件文本信息推荐类案的方法,其特征在于,S30包括以下步骤:
S31:根据正则匹配规则将待处理案件文本划分为案由、事实、情节、犯罪主体及犯罪对象;
S32:根据正则匹配规则和数据库中案件文本要素的特定标签分别对待处理案件文本的案由、事实、情节、犯罪主体及犯罪对象进行标记对应的特定标签。
4.如权利要求3所述的基于案件文本信息推荐类案的方法,其特征在于,S40具体包括以下步骤:
S41:根据正则匹配规则将案件文本要素中的关键句子和/或字词分别与待处理案件文本的对应案由、事实、情节、犯罪主体及犯罪对象进行匹配,
S42:根据匹配结果对待处理案件文本的整体或待处理案件文本的对应段落打上特定标签。
5.如权利要求1所述的基于案件文本信息推荐类案的方法,其特征在于,S50具体包括以下步骤:
S51:分别对案由、事实、情节、犯罪主体、犯罪对象、审级进行分配权重;
S52:计算待处理案件文本的分值D,计算公式为:D=a×(案由的特定标签个数×R1+事实的特定标签个数×R2+情节的特定标签个数×R3+主体的特定标签个数×R4+对象的特定标签个数×R5+R6),
S53:计算每一个类案的分值L,计算公式为:L=a×(类案的案由命中待处理案件文本的案由的特定标签的个数×R1-X1/Y1×R1+类案的事实命中待处理案件文本的事实的特定标签的个数×R2-X2/Y2×R2+类案的情节命中待处理案件文本的情节的特定标签的个数×R3-X3/Y3×R3+类案的主体命中待处理案件文本的主体的特定标签的个数×R4-X4/Y4×R4+类案的对象命中待处理案件文本的对象的特定标签的个数×R5-X5/Y5×R5+审级命中个数×R6),
S54:计算匹配度P,计算公式为P=D/L×100%,
其中,其中R1为案由权重,R2为事实权重,R3为情节权重,R4为犯罪主体权重,R5为犯罪对象权重,R6为审级权重,a为相匹配的单个标签分值,
X1为案由中不同于待处理案件文本的特定标签的个数,X2为事实中不同于待处理案件文本的特定标签的个数,X3为情节中不同于待处理案件文本的特定标签的个数,X4为犯罪主体中不同于待处理案件文本的特定标签的个数,X5为犯罪对象中不同于待处理案件文本的特定标签的个数,
Y1为案由中待处理案件文本的特定标签与类案标签的去重个数,Y2为事实中待处理案件文本的特定标签与类案标签的去重个数,Y3为情节中待处理案件文本的特定标签与类案标签的去重个数,Y4为犯罪主体中待处理案件文本的特定标签与类案标签的去重个数,Y5为犯罪对象中待处理案件文本的特定标签与类案标签的去重个数。
6.如权利要求5所述的基于案件文本信息推荐类案的方法,其特征在于,S60具体包括以下步骤:
S61:根据类案信息的匹配度由高到低进行排序并至少部分进行显示。
7.如权利要求6所述的基于案件文本信息推荐类案的方法,其特征在于,S10之后,S30之前包括以下步骤:
S20:对服务器中的类案进行分析打上对应的特定标签。
8.如权利要求5所述的基于案件文本信息推荐类案的方法,其特征在于,S60之后还包括以下步骤:
S70:当选中待处理案件文本的至少一个特定标签时,突出显示对应的案件。
9.一种基于案件文本信息推荐类案的系统,其特征在于,所述基于案件文本信息推荐类案的系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于案件文本信息推荐类案的程序,其中:
所述基于案件文本信息推荐类案的程序被所述处理器执行时实现如权利要求1至8中任一项所述的基于案件文本信息推荐类案的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于案件文本信息推荐类案的程序,所述基于案件文本信息推荐类案的程序被处理器执行时实现如权利要求1至8中任一项所述的基于案件文本信息推荐类案的方法的步骤。
CN201811369302.0A 2018-11-16 2018-11-16 基于案件文本信息推荐类案的方法、系统及可读存储介质 Expired - Fee Related CN111198953B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811369302.0A CN111198953B (zh) 2018-11-16 2018-11-16 基于案件文本信息推荐类案的方法、系统及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811369302.0A CN111198953B (zh) 2018-11-16 2018-11-16 基于案件文本信息推荐类案的方法、系统及可读存储介质

Publications (2)

Publication Number Publication Date
CN111198953A true CN111198953A (zh) 2020-05-26
CN111198953B CN111198953B (zh) 2023-07-07

Family

ID=70746122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811369302.0A Expired - Fee Related CN111198953B (zh) 2018-11-16 2018-11-16 基于案件文本信息推荐类案的方法、系统及可读存储介质

Country Status (1)

Country Link
CN (1) CN111198953B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111858925A (zh) * 2020-06-04 2020-10-30 国家计算机网络与信息安全管理中心 电信网络诈骗事件的剧本提取方法以及装置
CN112100212A (zh) * 2020-09-04 2020-12-18 中国航天科工集团第二研究院 一种基于机器学习和规则匹配的案件情节抽取方法
CN112348714A (zh) * 2020-11-05 2021-02-09 科大讯飞股份有限公司 证据链构建方法、电子设备和存储介质
CN113486158A (zh) * 2021-09-08 2021-10-08 中国司法大数据研究院有限公司 基于案情比对的类案检索方法、装置、设备及存储介质
US20230306545A1 (en) * 2022-03-24 2023-09-28 Motorola Solutions, Inc. Predictive case solvability score system with action recommendations based on detected trends

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1566418A (zh) * 2003-06-16 2005-01-19 旺宏电子股份有限公司 晶片处理炉每小时晶片处理量参数监控系统和监控方法
US20080282255A1 (en) * 2007-05-09 2008-11-13 Shinichi Kawamoto Highly-available application operation method and system, and method and system of changing application version on line
JP2009276923A (ja) * 2008-05-13 2009-11-26 Meiji Milk Prod Co Ltd 製造プラントにおける設備管理システム
CN102111405A (zh) * 2010-12-17 2011-06-29 国家计算机网络与信息安全管理中心 一种均衡分两组编译正则表达式的方法
CN102142009A (zh) * 2010-12-09 2011-08-03 华为技术有限公司 一种正则表达式匹配的方法及装置
CN102609459A (zh) * 2012-01-12 2012-07-25 神州数码网络(北京)有限公司 基于正则表达式的字符串匹配方法和装置
CN103078808A (zh) * 2012-12-29 2013-05-01 大连环宇移动科技有限公司 适用于多流正则表达式匹配的数据流交换复用系统及方法
JP2015138395A (ja) * 2014-01-22 2015-07-30 三菱重工業株式会社 メンテナンス管理装置、メンテナンス管理方法及びプログラム
CN107145895A (zh) * 2017-03-13 2017-09-08 东方网力科技股份有限公司 基于k‑means算法的公安犯罪类案研判方法
CN107798033A (zh) * 2017-03-01 2018-03-13 中南大学 一种公安领域案件文本的分类方法
CN107818138A (zh) * 2017-09-28 2018-03-20 银江股份有限公司 一种案件法律条例推荐方法及系统
CN108009299A (zh) * 2017-12-28 2018-05-08 北京市律典通科技有限公司 法律审判业务处理方法和装置
CN108073569A (zh) * 2017-06-21 2018-05-25 北京华宇元典信息服务有限公司 一种基于多层级多维度语义理解的法律认知方法、装置和介质
CN108197163A (zh) * 2017-12-14 2018-06-22 上海银江智慧智能化技术有限公司 一种基于裁判文书的结构化处理方法
US20180181924A1 (en) * 2016-12-28 2018-06-28 Yokogawa Electric Corporation Maintenance management device, maintenance management method, and non-transitory computer readable storage medium
CN108280149A (zh) * 2018-01-04 2018-07-13 东南大学 一种基于多维度分类标签的医患纠纷类案件推荐方法
CN108595547A (zh) * 2018-04-09 2018-09-28 南京网感至察信息科技有限公司 一种基于语义抽取的相似案件检索方法
CN108763484A (zh) * 2018-05-25 2018-11-06 南京大学 一种基于lda主题模型的法条推荐方法

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1566418A (zh) * 2003-06-16 2005-01-19 旺宏电子股份有限公司 晶片处理炉每小时晶片处理量参数监控系统和监控方法
US20080282255A1 (en) * 2007-05-09 2008-11-13 Shinichi Kawamoto Highly-available application operation method and system, and method and system of changing application version on line
JP2009276923A (ja) * 2008-05-13 2009-11-26 Meiji Milk Prod Co Ltd 製造プラントにおける設備管理システム
CN102142009A (zh) * 2010-12-09 2011-08-03 华为技术有限公司 一种正则表达式匹配的方法及装置
CN102111405A (zh) * 2010-12-17 2011-06-29 国家计算机网络与信息安全管理中心 一种均衡分两组编译正则表达式的方法
CN102609459A (zh) * 2012-01-12 2012-07-25 神州数码网络(北京)有限公司 基于正则表达式的字符串匹配方法和装置
CN103078808A (zh) * 2012-12-29 2013-05-01 大连环宇移动科技有限公司 适用于多流正则表达式匹配的数据流交换复用系统及方法
JP2015138395A (ja) * 2014-01-22 2015-07-30 三菱重工業株式会社 メンテナンス管理装置、メンテナンス管理方法及びプログラム
US20180181924A1 (en) * 2016-12-28 2018-06-28 Yokogawa Electric Corporation Maintenance management device, maintenance management method, and non-transitory computer readable storage medium
CN107798033A (zh) * 2017-03-01 2018-03-13 中南大学 一种公安领域案件文本的分类方法
CN107145895A (zh) * 2017-03-13 2017-09-08 东方网力科技股份有限公司 基于k‑means算法的公安犯罪类案研判方法
CN108073569A (zh) * 2017-06-21 2018-05-25 北京华宇元典信息服务有限公司 一种基于多层级多维度语义理解的法律认知方法、装置和介质
CN107818138A (zh) * 2017-09-28 2018-03-20 银江股份有限公司 一种案件法律条例推荐方法及系统
CN108197163A (zh) * 2017-12-14 2018-06-22 上海银江智慧智能化技术有限公司 一种基于裁判文书的结构化处理方法
CN108009299A (zh) * 2017-12-28 2018-05-08 北京市律典通科技有限公司 法律审判业务处理方法和装置
CN108280149A (zh) * 2018-01-04 2018-07-13 东南大学 一种基于多维度分类标签的医患纠纷类案件推荐方法
CN108595547A (zh) * 2018-04-09 2018-09-28 南京网感至察信息科技有限公司 一种基于语义抽取的相似案件检索方法
CN108763484A (zh) * 2018-05-25 2018-11-06 南京大学 一种基于lda主题模型的法条推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FIFTH NOVIYANTO ET.AL: "《Tracking online fraud using regular expression》" *
王禄生: "《司法大数据与人工智能开发的技术障碍》", no. 20 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111858925A (zh) * 2020-06-04 2020-10-30 国家计算机网络与信息安全管理中心 电信网络诈骗事件的剧本提取方法以及装置
CN111858925B (zh) * 2020-06-04 2023-08-18 国家计算机网络与信息安全管理中心 电信网络诈骗事件的剧本提取方法以及装置
CN112100212A (zh) * 2020-09-04 2020-12-18 中国航天科工集团第二研究院 一种基于机器学习和规则匹配的案件情节抽取方法
CN112348714A (zh) * 2020-11-05 2021-02-09 科大讯飞股份有限公司 证据链构建方法、电子设备和存储介质
CN113486158A (zh) * 2021-09-08 2021-10-08 中国司法大数据研究院有限公司 基于案情比对的类案检索方法、装置、设备及存储介质
CN113486158B (zh) * 2021-09-08 2021-12-14 中国司法大数据研究院有限公司 基于案情比对的类案检索方法、装置、设备及存储介质
US20230306545A1 (en) * 2022-03-24 2023-09-28 Motorola Solutions, Inc. Predictive case solvability score system with action recommendations based on detected trends

Also Published As

Publication number Publication date
CN111198953B (zh) 2023-07-07

Similar Documents

Publication Publication Date Title
CN111198953A (zh) 基于案件文本信息推荐类案的方法、系统及计算机可读存储介质
Fischer et al. When “enough is enough”: Battered women's decision making around court orders of protection
Weidmann On the accuracy of media-based conflict event data
DeJong et al. A summary of personal protection order statutes in the United States
Nobles et al. Effectiveness of residence restrictions in preventing sex offense recidivism
Szablewska et al. Anti-human trafficking campaigns: A systematic literature review
CN111104798B (zh) 法律文书中的量刑情节的解析方法、系统及计算机可读存储介质
Vindhya et al. Survivors of sex trafficking in Andhra Pradesh: Evidence and testimony
Chykina et al. Using google trends to measure issue salience for hard-to-survey populations
Brewster et al. Sex offender registries: A content analysis
Levenson et al. Community protection policies and repeat sexual offenses in Florida
Stassen et al. Environmental and Wildlife Crime in Sweden from 2000 to 2017
Pina-Sánchez et al. Exploring the punitive surge: Crown Court sentencing practices before and after the 2011 English riots
Kim et al. Domestic violence in the context of the COVID-19 pandemic: a synthesis of systematic reviews
Sleath et al. Factor structure and validation of the controlling behaviors scale–revised and revised conflict tactics scale
Savoie et al. Predicting risk of reoffending in persons with child sexual exploitation material offense histories: The use of Child Pornography Offender Risk Tool in a Scottish population
Arseniev-Koehler et al. Aggression, escalation, and other latent themes in legal intervention deaths of non-hispanic Black and White men: Results from the 2003‒2017 National Violent Death Reporting System
Lyons et al. Risk factors for child death during an intimate partner homicide: A case-control study
Shepherd et al. Estimating the extent and nature of offending by Sudanese-born individuals in Victoria
Karageorgos et al. Perpetration, victimhood, and blame: Australian newspaper representations of domestic violence, 2000–2020
Wilson et al. Nonfatal strangulation during domestic violence events in new south wales: prevalence and characteristics using text mining study of police narratives
McCarthy et al. A typology of citizen presentations in police use of force events: are there ecological drivers?
Segrave et al. Women migrant workers and counter-trafficking responses in Association of Southeast Asian Nations: The enduring challenge of safety and security
Das Understanding fatal crash reporting patterns in Bangladeshi online media using text mining
Aljehani The legal definition of the smuggling of migrants in light of the provisions of the migrant smuggling protocol

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20230707

CF01 Termination of patent right due to non-payment of annual fee