一种诉讼结果的预测方法及系统.pdf

上传人:大师****2 文档编号:6099148 上传时间:2019-04-11 格式:PDF 页数:18 大小:1.19MB
返回 下载 相关 举报
摘要
申请专利号:

CN201610647687.7

申请日:

2016.08.09

公开号:

CN106296495A

公开日:

2017.01.04

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06Q 50/18申请日:20160809|||公开

IPC分类号:

G06Q50/18(2012.01)I; G06N5/04; G06N3/08

主分类号:

G06Q50/18

申请人:

点击律(上海)网络科技有限公司

发明人:

钟康; 刘子悦; 郭超; 吕辉; 杨晓沁

地址:

201203 上海市浦东新区自由贸易试验区祖冲之路1077号2幢3375室

优先权:

专利代理机构:

北京中政联科专利代理事务所(普通合伙) 11489

代理人:

陈超

PDF下载: PDF下载
内容摘要

本发明提供了一种诉讼结果的预测方法及系统,所述方法包括:建立预定主题的知识推理库;知识推理库用于存储推理规则,推理规则多个推理步;基于预定主题的知识推理库,构建预测模型;其中,每个预测模型的神经网络块对应一个推理步;每个推理步所需的推理数据对应一个数据类型,每个数据类型对应神经网络块的输入类型;处理预定主题对应的裁判文书得到训练样本数据集合,训练并修正预测模型;获取待测数据,基于预定义特征词库提取具有属性和属性值的数据对,形成待测数据特征信息集合;基于待测数据特征信息集合,判断待测数据的适用主题并输入预测模型进行预测。本发明能够指导人们预测法律案件的结果,实用性强。

权利要求书

1.一种诉讼结果的预测方法,包括:
获取待测数据;
基于预定义特征词库,提取所述待测数据中与所述预定义特征词相对应的待测数据
对,以形成待测数据特征信息集合;其中,所述待测数据特征信息集合至少包括由案由信
息、诉求信息和证据集合构成的三组待测数据对,每组所述待测数据对对应一个数据类型;
基于所述待测数据特征集合,确定所述待测数据的适用主题;
将所述待测数据特征信息集合输入与所述适用主题对应的预测模型进行预测,得到所
述待测数据的预测结果。
2.根据权利要求1所述的预测方法,其特征在于,在将所述待测数据特征信息集合输入
多神经网络预测模型进行预测的步骤之前,还包括:
基于建立的预定主题的知识推理库,构建所述多神经网络块预测模型。
3.根据权利要求2所述的预测方法,其特征在于,所述基于建立的预定主题的知识推理
库,构建所述多神经网络块预测模型的步骤包括:
建立预定主题的知识推理库;其中,所述预定主题包括案由信息和地域信息;所述知识
推理库存储有至少一条推理规则,所述推理规则是通过对与所述主题对应的条文进行提取
处理和逻辑处理得到的,每个所述推理规则至少包括具有逻辑关系的多个推理步;
基于所述知识推理库,构建所述多神经网络块预测模型;
其中,所述预测模型的每个神经网络块与至少一个推理规则中的一个所述推理步对
应;每个所述推理步的推理数据对应一个数据类型,每个所述数据类型即为一个神经网络
块的数据输入类型;其中,所述推理数据即每个所述推理步进行推理所需的数据,所述推理
数据至少包括一组具有属性和属性值的数据对。
4.根据权利要求3所述的预测方法,其特征在于,在构建所述多神经网络块预测模型的
步骤之后,还包括:
基于预定义特征词库,对文书库的裁判文书进行提取处理得到预定主题的训练样本数
据集合;
基于所述训练样本数据集合,训练以得到所述多神经网络块预测模型;
其中,所述训练样本数据集合至少包括一个训练样本数据,每个所述训练样本数据均
包括至少五组分别由审判法院、案由信息、诉求信息、证据集合和判决结果构成的训练数据
对;每组所述训练数据对对应一个数据输入类型,其中,所述审判法院用于确定地域信息。
5.根据权利要求2或3所述的预测方法,其特征在于,推理步的逻辑关系指:在同一推理
规则中,一个推理步的推理结果为该所述推理规则的最终结果,或,为另一推理步的前置条
件;
所述逻辑关系用于确定各神经网路块之间的约束关系,所述约束关系指:在同一预测
模型中,一个神经网络块的输出值为另一神经网络块的输入值的前置条件,并影响其输出
结果。
6.根据权利要求2所述的预测方法,其特征在于,所述对与所述主题对应的条文进行提
取处理和逻辑处理得到所述推理规则的方法包括:
提取所述条文的特征词,形成条文特征项;
基于条文的层级关系,确定条文特征项之间的逻辑关系;
基于条文特征项之间的逻辑关系构建推理规则。
7.根据权利要求4所述的预测方法,其特征在于,所述基于预定义特征词库,对裁判文
书进行提取处理得到预定主题的训练样本数据集合的步骤包括:
从文书库获取至少一个裁判文书;
依据预定义特征词库,提取每个所述裁判文书中与所述预定义特征词相对应的训练数
据对,对应形成每个所述裁判文书的文书特征集合;
基于至少一个文书特征集合构建文书对象集合,每个文书对象对应一个文书特征集
合;
基于预设过滤规则,过滤所述文书对象集合中的无效文书对象,得到有效文书对象集
合;
提取有效对象集合中至少与所述预定主题的案由信息相对应的有效对象,形成训练对
象集合,所述训练对象集合至少包括一个训练对象;
基于与预定主题对应的预测模型的各神经网络块的数据输入类型,分别提取每个训练
对象中与所述数据输入类型相对应的训练数据对,以分别形成与每个所述训练对象相对应
的训练样本数据;
基于每个所述训练对象相对应的训练样本数据构建所述预定主题的训练样本数据集
合。
8.根据权利要求7所述的预测方法,其特征在于,所述预设过滤规则包括:
判断文书特征集合中的训练数据对的属性和/或属性值是否为空;
若为空,则将与所述文书特征集合对应的文书对象从所述文书对象集合移除;
判断至少两个文书特征集合之间是否存在案件关联性;若存在关联性,则基于文书特
征集合中的判决结果,确定需要过滤掉的文书特征集合对应的文书对象;
其中,所述案件关联性指至少两个文书特征集合的各自的裁判文书对应同一个案件的
不同审理程序。
9.根据权利要求4所述的预测方法,其特征在于,在基于所述训练样本数据集合,训练
以修正所述预测模型之前,还包括:基于预定公式对所述预定主题的训练样本数据中的各
训练数据对的属性和属性值进行归一化处理。
10.根据权利要求4所述的预测方法,其特征在于,在基于所述训练样本数据集合,训练
以修正所述预测模型之前,还包括对所述至少一个神经网络块的冗余性检查;
其中,所述冗余性检查包括:判断当前的预测模型中是否已经存在与训练样本数据中
的具有属性和属性值的训练数据对相对应的神经网路块;
若存在,则激活与该所述神经网络块具有约束关系的其他神经网络块,并执行正向推
理操作;
若不存在,则建立与所述具有属性和属性值的训练数据对相对应的神经网络块,并将
所述神经网络块加至当前的预测模型。
11.根据权利要求10所述的预测方法,还包括,判断所述执行正向推理操作的过程是否
存在矛盾,包括:
判断当前的神经网络块的输出值是否与所述知识推理库中的推理规则相矛盾和/或当
前的神经网络块的输出值是否与另一神经网络块的输出值相矛盾;
若存在矛盾,则将所述矛盾定为矛盾点并执行反向修正操作修正当前的所述神经网络
块。
12.一种诉讼结果的预测系统,包括:
输入单元:用于获取当前输入的待测数据;
提取单元:用于基于预定义特征词库,提取所述待测数据中与所述预定义特征词相对
应的待测数据对,以形成待测数据特征信息集合;
主题分析单元:用于基于所述待测数据特征集合,确定所述待测数据的适用主题;
预测单元,用于将所述待测数据特征信息集合输入与所述适用主题对应的预测模型进
行预测,得到所述待测数据的预测结果。
13.根据权利要求12所述的预测系统,其特征在于,所述预测系统还包括:
条文库,用于存储条文的原始数据;
文书库,用于存储现有的裁判文书的原始数据;
知识推理库,用于存储与所述预定主题相对应的至少一条推理规则;
预定义特征词库,用于存储多个具有属性和属性值的预设数据对;所述预设数据对用
于作为提取待测数据中的待测数据对的依据和/或提取裁判文书中的训练数据对的依据。
14.根据权利要求12所述的预测系统,其特征在于,所述预测系统还包括:
文书获取单元,用于从文书库获取裁判文书;
所述提取单元,还用于所述基于预定义特征词库,对裁判文书进行提取处理得到预定
主题的训练样本数据集合;
数据处理单元,用于基于预定公式对各训练样本数据中的各训练数据对的属性和属性
值和/或待测数据特征信息集合的待测数据对的属性和属性值进行归一化处理;
训练数据获取单元,用于获取经过数据处理单元进行处理后的训练样本数据集合;
训练单元,用于基于训练样本数据集合,通过正向推理操作和反向修正操作训练并修
正神经网络,以使得每个所述训练样本数据对应的预测结果与其自身的实际的判决结果的
差值在预定范围内,且使得预测结果与所述预定主题的推理规则相匹配,从而形成所述预
定主题的神经网络预测模型;
所述预测单元,还用于基于训练样本数据输出经过各个神经网络块训练的合理的预测
结果。
15.根据权利要求12所述的预测系统,其特征在于,所述预测系统还包括:
判断单元,用于判断当前的预测模型中是否已经存在与训练样本数据中的具有属性和
属性值的训练数据对相对应的神经网路块;
若存在,则激活与该所述神经网络块具有约束关系的其他神经网络块,并执行正向推
理操作;
若不存在,则建立与所述具有属性和属性值的训练数据对相对应的神经网络块,并将
所述神经网络块加至当前的预测模型;
用于判断所述执行正向推理操作的过程是否存在矛盾,包括:
判断当前的神经网络块的输出值是否与所述知识推理库中的推理规则相矛盾和/或当
前的神经网络块的输出值是否与另一神经网络块的输出值相矛盾;
若存在矛盾,则将所述矛盾定为矛盾点并执行反向修正操作修正当前的所述神经网络
块。

说明书

一种诉讼结果的预测方法及系统

技术领域

本发明涉及基于神经网络的预测技术领域,具体涉及一种诉讼结果的预测方法及
系统。

背景技术

随着国家新法的快速增加、法律信息的快速传播使得人们的法律意识普遍得到提
高,法律需求也随着生活质量的提高而不断膨胀。但是,法律的专业性和用户的常识浅薄却
始终困扰着普通民众对法律的学习和使用,而法律行业信息的不对称、信息源的杂乱、以及
依据法律条文处理法律问题的特点亦大大增加了普通民众运用法律武器维权的难度,例
如,由于缺乏对诉讼有效期的认识而导致某些法律需求过了诉讼有效期却仍在花费精力找
律师咨询;由于证据力度完全不足以支持诉求却仍在花费时间和精力在起诉等。有鉴于此,
一种能够指导人们对法律案件进预测的方法和系统成为当前的迫切需求。

发明内容

本发明实施例提供了一种诉讼结果的预测方法及系统,一方面基于我国条文法系
特征,从法律条文出发,技术化案件的审理规则,构建知识库推理库,用于指导神经网络模
型预测过程;另一方面,基于真实的诉讼大数据,分析得到在证据和诉求类似,且证据证明
的基本案件情况具有相似性的,同一地域内的案件审理思路特征;在知识库推理指导下,构
建多神经网络块的法律案件结果推理预测模型,对当前客户端输入条件进行训练预测可能
得到的审理结果,一定程度上弥补普通用户法律常识或分析能力上的弱势,增强对自身法
律需求的了解程度。

根据本发明的一方面,本发明提供了一种诉讼结果的预测方法,包括:

获取待测数据;

基于预定义特征词库,提取所述待测数据中与所述预定义特征词相对应的待测数
据对,以形成待测数据特征信息集合;优选地,所述待测数据特征信息集合至少包括由案由
信息、诉求信息和证据集合构成的三组待测数据对,每组所述待测数据对对应一个数据类
型;

基于所述待测数据特征集合,确定所述待测数据的适用主题;

将所述待测数据特征信息集合输入与所述适用主题对应的预测模型进行预测,得
到所述待测数据的预测结果。

优选地,在将所述待测数据特征信息集合输入多神经网络预测模型进行预测的步
骤之前,还包括:

基于建立的预定主题的知识推理库,构建所述多神经网络块预测模型。

优选地,所述基于建立的预定主题的知识推理库,构建所述多神经网络块预测模
型的步骤包括:

建立预定主题的知识推理库;其中,所述预定主题包括案由信息和地域信息;所述
知识推理库存储有至少一条推理规则,所述推理规则是通过对与所述主题对应的条文进行
提取处理和逻辑处理得到的,每个所述推理规则至少包括具有逻辑关系的多个推理步;

基于所述知识推理库,构建所述多神经网络块预测模型;

其中,优选地,所述预测模型的每个神经网络块与至少一个所述推理步对应;每个
所述推理步的推理数据对应一个数据类型,每个所述数据类型即为一个神经网络块的数据
输入类型;其中,所述推理数据即每个所述推理步进行推理所需的数据,所述推理数据至少
包括一组具有属性和属性值的数据对。

优选地,在构建所述多神经网络块预测模型的步骤之后,还包括:

基于预定义特征词库,对文书库的裁判文书进行提取处理得到预定主题的训练样
本数据集合;

基于所述训练样本数据集合,训练以得到所述多神经网络块预测模型;

其中,优选地,所述训练样本数据集合至少包括一个训练样本数据,每个所述训练
样本数据均包括至少五组分别由审判法院、案由信息、诉求信息、证据集合和判决结果构成
的训练数据对;每组所述训练数据对对应一个数据输入类型,其中,所述审判法院用于确定
地域信息。

优选地,推理步的逻辑关系指:在同一推理规则中,一个推理步的推理结果为该所
述推理规则的最终结果,或,为另一推理步的前置条件;

所述逻辑关系用于确定各神经网路块之间的约束关系,所述约束关系指:在同一
预测模型中,一个神经网络块的输出值为另一神经网络块的输入值的前置条件,并影响其
输出结果。

优选地,所述对与所述主题对应的条文进行提取处理和逻辑处理得到所述推理规
则的方法包括:

提取所述条文的特征词,形成条文特征项;

基于条文的层级关系,确定条文特征项之间的逻辑关系;

基于条文特征项之间的逻辑关系构建推理规则。

优选地,所述基于预定义特征词库,对裁判文书进行提取处理得到预定主题的训
练样本数据集合的步骤包括:

从文书库获取至少一个裁判文书;

依据预定义特征词库,提取每个所述裁判文书中与所述预定义特征词相对应的训
练数据对,对应形成每个所述裁判文书的文书特征集合;

基于至少一个文书特征集合构建文书对象集合,每个文书对象对应一个文书特征
集合;

基于预设过滤规则,过滤所述文书对象集合中的无效文书对象,得到有效文书对
象集合;

提取有效对象集合中至少与所述预定主题的案由信息相对应的有效对象,形成训
练对象集合,所述训练对象集合至少包括一个训练对象;

基于与预定主题对应的预测模型的各神经网络块的数据输入类型,分别提取每个
训练对象中与所述数据输入类型相对应的训练数据对,以分别形成与每个所述训练对象相
对应的训练样本数据;

基于每个所述训练对象相对应的训练样本数据构建所述预定主题的训练样本数
据集合。

优选地,所述预设过滤规则包括:

判断文书特征集合中的训练数据对的属性和/或属性值是否为空;

若为空,则将与所述文书特征集合对应的文书对象从所述文书对象集合移除;

判断至少两个文书特征集合之间是否存在案件关联性;若存在关联性,则基于文
书特征集合中的判决结果,确定需要过滤掉的文书特征集合对应的文书对象;

其中,所述案件关联性指至少两个文书特征集合的各自的裁判文书对应同一个案
件的不同审理程序。

优选地,在基于所述训练样本数据集合,训练以修正所述预测模型之前,还包括:
基于预定公式对所述预定主题的训练样本数据中的各训练数据对的属性和属性值进行归
一化处理。

优选地,在基于所述训练样本数据集合,训练以修正所述预测模型之前,还包括对
所述至少一个神经网络块的冗余性检查;

其中,所述冗余性检查包括:判断当前的预测模型中是否已经存在与训练样本数
据中的具有属性和属性值的训练数据对相对应的神经网路块;

若存在,则激活与该所述神经网络块具有约束关系的其他神经网络块,并执行正
向推理操作;

若不存在,则建立与所述具有属性和属性值的训练数据对相对应的神经网络块,
并将所述神经网络块加至当前的预测模型。

优选地,判断所述执行正向推理操作的过程是否存在矛盾,包括:

判断当前的神经网络块的输出值是否与所述知识推理库中的推理规则相矛盾和/
或当前的神经网络块的输出值是否与另一神经网络块的输出值相矛盾;

若存在矛盾,则将所述矛盾定为矛盾点并执行反向修正操作修正当前的所述神经
网络块。

根据本发明的另一个方面,本发明还提供了一种诉讼结果的预测系统,包括:

输入单元:用于获取当前输入的待测数据;

提取单元:用于基于预定义特征词库,提取所述待测数据中与所述预定义特征词
相对应的待测数据对,以形成待测数据特征信息集合;

主题分析单元:用于基于所述待测数据特征集合,确定所述待测数据的适用主题;

预测单元,用于将所述待测数据特征信息集合输入与所述适用主题对应的预测模
型进行预测,得到所述待测数据的预测结果。

优选地,所述预测系统还包括:

条文库,用于存储条文的原始数据;

文书库,用于存储现有的裁判文书的原始数据;

知识推理库,用于存储与所述预定主题相对应的至少一条推理规则;

预定义特征词库,用于存储多个具有属性和属性值的预设数据对;所述预设数据
对用于作为提取待测数据中的待测数据对的依据和/或提取裁判文书中的训练数据对的依
据。

优选地,所述预测系统还包括:

文书获取单元,用于从文书库获取裁判文书;

所述提取单元,还用于所述基于预定义特征词库,对裁判文书进行提取处理得到
预定主题的训练样本数据集合;

数据处理单元,用于基于预定公式对各训练样本数据中的各训练数据对的属性和
属性值和/或待测数据特征信息集合的待测数据对的属性和属性值进行归一化处理;

训练数据获取单元,用于获取经过数据处理单元进行处理后的训练样本数据集
合;

训练单元,用于基于训练样本数据集合,通过正向推理操作和反向修正操作训练
并修正神经网络,以使得每个所述训练样本数据对应的预测结果与其自身的实际的判决结
果的差值在预定范围内,且使得预测结果与所述预定主题的推理规则相匹配,从而形成所
述预定主题的神经网络预测模型;

所述预测单元,还用于基于训练样本数据输出经过各个神经网络块训练的合理的
预测结果。

优选地,所述预测系统还包括:

判断单元,用于判断当前的预测模型中是否已经存在与训练样本数据中的具有属
性和属性值的训练数据对相对应的神经网路块;

若存在,则激活与该所述神经网络块具有约束关系的其他神经网络块,并执行正
向推理操作;

若不存在,则建立与所述具有属性和属性值的训练数据对相对应的神经网络块,
并将所述神经网络块加至当前的预测模型。

用于判断所述执行正向推理操作的过程是否存在矛盾,包括:

判断当前的神经网络块的输出值是否与所述知识推理库中的推理规则相矛盾和/
或当前的神经网络块的输出值是否与另一神经网络块的输出值相矛盾;

若存在矛盾,则将所述矛盾定为矛盾点并执行反向修正操作修正当前的所述神经
网络块。

附图说明

图1是本发明的实施例提供的多神经网络块的示例图;

图2是本发明的实施例提供的多个推理规则中的其中一个的推理规则的示例图。

具体实施方式

本发明的目的是提供一种诉讼结果的预测方法及系统,一方面基于我国条文法系
特征,从法律条文出发,技术化案件的审理规则,构建知识库推理库,用于指导神经网络模
型预测过程;另一方面,基于真实的诉讼大数据,分析得到在证据和诉求类似,且证据证明
的基本案件情况具有相似性的,同一地域内的案件审理思路特征;在知识库推理指导下,构
建多神经网络块的法律案件结果推理预测模型,对当前客户端输入条件进行训练预测可能
得到的审理结果,一定程度上弥补普通用户法律常识或分析能力上的弱势,增强对自身法
律需求的了解程度。

为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参
照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发
明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本
发明的概念。

本发明的实施例提供了一种诉讼结果的预测方法,包括:

获取待测数据;

基于预定义特征词库,提取所述待测数据中与所述预定义特征词相对应的待测数
据对,以形成待测数据特征信息集合;

基于所述待测数据特征集合,确定所述待测数据的适用主题;

将所述待测数据特征信息集合输入与所述适用主题对应的预测模型进行预测,得
到所述待测数据的预测结果。预测结果是在当前条件下对诉求可能的支持度,是个百分比
数据。模型构建中,训练样本中的预期输出结果是基于判决结果对诉求的支持度来计算得
到的百分比。比方说,原告败诉,那预期的输出结果为0;原告诉求都被支持,那预期的输出
结果为100%;原告有3点诉求,判决仅支持1点诉求,那预期的输出结果为33.3%。预测过程
其实就是判断当前的证据能否足以支撑诉求,并计算支撑度。比方说,当前客户端的条件
为:买卖合同纠纷,请求对方支付货款,但是所提供的证据只有送货单,那么可能的预测结
果就为0,即当前证据不足以支撑原告诉求,仅能证明货物交付事实,并不能独立证明买卖
合同的成立,故而驳回诉讼请求。

所述待测数据特征信息集合至少包括由案由信息、诉求信息和证据集合构成的三
组待测数据对,每组所述待测数据对对应一个数据类型。

作为一个优选的实施例,在将所述待测数据特征信息集合输入预测模型之前,还
包括对上述待测数据特征信息集合中的具有属性和属性值的数据对进行数据清洗、数据加
工处理;所述数据清洗包括对缺失字段、数据逻辑、数据格式、以及重复值的处理;所述数据
加工包括数据计算、数据分组以及数据转换的处理。具体举例而说,提取待测数据中的案由
信息、地域信息确定待测数据的当前主题;其中,所述地域信息基于待测数据中的审判法院
确定;

提取待测数据中的时间数据形成时间特征信息;所述时间数据用于计算当前时间
是否超过当前案由信息下规定的有效诉讼时效;

提取待测数据中的诉求信息,基于预设的与当前主题相对应的诉求信息的特征词
语集合去除诉求信息中的非特征词汇构成诉求信息关键词集合以形成诉求特征信息,诉求
特征信息中包含的关键词数量的大小必须不大于预先设定的足够大的整数T2;

提取待测数据中的证据集合,基于预设的与当前主题相对应的证据集合的特征词
语集合提取证据集合中的特征词形成证据特征信息;

案由信息、地域信息、时间特征信息、诉求特征信息以及证据特征信息分别对应一
个数据类型,且此数据类型分别对应当前主题对应的预测模型所需的输入模型。

所述时间特征信息与诉求特征信息、证据特性信息之间存在时间约束关系;所述
诉求特性信息与证据特性信息之间存在事例约束关系;所述时间约束关系是指约束单元的
时间变量值取决于时间特征信息对应的神经网块的输出值,且在输出值的意义代表处于有
效诉讼期限内,约束后续神经网络块可执行正常的推理过程;反之则结束推理;所述诉求特
征信息与证据特性信息之间的事例约束关系是指诉求特征信息的对应的神经网络块的输
出值与证据特性信息对应的神经网络块的某一节点是否存在矛盾关系,如果存在,则结束
推理;如果不存在,则正常执行推理过程得到最终的推理结果;所述知识单元nk之间的事例
约束关系是指知识单元nk+1存在依据知识单元nk的输出值决定的变量,并且该变量的值直
接影响知识单元nk+1的输出值。

在将所述待测数据特征信息集合输入多神经网络预测模型进行预测的步骤之前,
还包括:

基于建立的预定主题的知识推理库,构建所述多神经网络块预测模型。

所述基于建立的预定主题的知识推理库,构建所述多神经网络块预测模型的步骤
包括:

建立预定主题的知识推理库;其中,所述预定主题包括案由信息;所述知识推理库
存储有至少一条推理规则,所述推理规则是通过对与所述主题对应的条文进行提取处理和
逻辑处理得到的,每个所述推理规则至少包括具有逻辑关系的多个推理步;

基于所述知识推理库,构建所述多神经网络块预测模型;

其中,所述预测模型的每个神经网络块与至少一个推理规则中的一个所述推理步
对应;每个所述推理步的推理数据对应一个数据类型,每个所述数据类型即为一个神经网
络块的数据输入类型;其中,所述推理数据即每个所述推理步进行推理所需的数据,所述推
理数据至少包括一组具有属性和属性值的数据对。推理数据包括待测数据对应的推理规则
推理所需的数据和训练样本数据对应的推理规则推理所需的数据。具体举例说明,如图1和
图2所示,图2中的每一个推理的小规则对应一个推理步,每一个推理步都对应一个图1中的
一个输入层M,而每个推理步所需的数据即为一个数据类型以对应输入层M的输入类型,即
每个输入层M都接受一组特定的属性及属性值的输入。再进一步地说,图2中的“规则1:是否
在有效诉讼期内”,所需的数据就包括:standard-terms;occurrence-time;current-time;
假设图1中的输入层M1就是用于接收这类属性和属性值的,且occurrence-time=
20160101;current-time=20160731;standard-terms=2;则输出层O1则为1,表明其处于
有效期内。各神经网络块之间的联系是基于推理规则得到的;假设,M2所接受的属性和属性
值是“规则2:是否有书面买卖合同”所需数据,根据推理库规则,只有当O1=1处在有效期内
的时候才执行后继推理,此时O1=1,则执行M2,反之则执行M3。其中,需要说明的是,如图1所
示,M1、P1、O1构成一个神经网络块,M1表示输入层,P1表示中间层,O1为输出层。

在构建所述多神经网络块预测模型的步骤之后,还包括:

基于预定义特征词库,对文书库的裁判文书进行提取处理得到预定主题的训练样
本数据集合;

基于所述训练样本数据集合,训练以得到所述多神经网络块预测模型;

其中,所述训练样本数据集合至少包括一个训练样本数据,每个所述训练样本数
据均包括至少五组分别由审判法院、案由信息、诉求信息、证据集合和判决结果构成的训练
数据对;每组所述训练数据对对应一个数据输入类型,其中,所述审判法院用于确定地域信
息。

推理步的逻辑关系指:在同一推理规则中,一个推理步的推理结果为该所述推理
规则的最终结果,或,为另一推理步的前置条件;

所述逻辑关系用于确定各神经网路块之间的约束关系,所述约束关系指:在同一
预测模型中,一个神经网络块的输出值为另一神经网络块的输入值的前置条件,并影响其
输出结果。

所述对与所述主题对应的条文进行提取处理和逻辑处理得到所述推理规则的方
法包括:

提取所述条文的特征词,形成条文特征项;具体地说,依据条文属性及属性值,对
条文内容进行分词操作及过滤操作,根据过滤表中的词语,将对条文内容识别意义不大,但
频繁出现的诸如“的、等、和、或”等词去掉,生成条文特征项。

基于条文的层级关系,确定条文特征项之间的逻辑关系;所述述层级关系指条文
之间的父级关系或子级关系,也可以是兄弟关系,子级条文可以为空;兄弟条文包括其上级
非父级条文,和/或,下级非子级条文;父级条文中至少包含一条非空的子级条文;

基于条文特征项之间的逻辑关系构建推理规则。

所述基于预定义特征词库,对裁判文书进行提取处理得到预定主题的训练样本数
据集合的步骤包括:

从文书库获取至少一个裁判文书;

依据预定义特征词库,提取每个所述裁判文书中与所述预定义特征词相对应的训
练数据对,对应形成每个所述裁判文书的文书特征集合;如下表1所示,为商品房销售合同
纠纷主题的文书对象集合S1的其中的一个文书对象的示例表,其中,文书对象所包括的文
书特征信息的属性即指文书案号、案由信息、审判法院、审理程序、原告/上诉人、被告/被上
诉人、关联案号、诉求信息、判决结果以及受理费,文书特征信息的属性值即指各个属性所
对应的各自的具体内容。需要说明的是,此表1的文书对象所包含文书特征信息的仅为示
例,并不是对本发明的限定,且文书特征信息的属性和属性值也并不仅限于表1中给出的属
性和属性值。

表1





基于至少一个文书特征集合构建文书对象集合,每个文书对象对应一个文书特征
集合;

基于预设过滤规则,过滤所述文书对象集合中的无效文书对象,得到有效文书对
象集合;

提取有效对象集合中至少与所述预定主题的案由信息相对应的有效对象,形成训
练对象集合,所述训练对象集合至少包括一个训练对象;

基于与预定主题对应的预测模型的各神经网络块的数据输入类型,分别提取每个
训练对象中与所述数据输入类型相对应的训练数据对,以分别形成与每个所述训练对象相
对应的训练样本数据;

基于每个所述训练对象相对应的训练样本数据构建所述预定主题的训练样本数
据集合。

需要说明的是,在提取有效对象集合中至少与所述预定主题的案由信息相对应的
有效对象,形成训练对象集合之前还包括:对有效对象集合中的有效对象的数据对的属性
和属性值进行数据清洗、数据加工;

其中,所述数据清洗包括对缺失字段、数据逻辑、数据格式、以及重复值的处理;所
述数据加工包括数据计算、数据分组以及数据转换的处理。

具体的数据加工和数据处理主要包括以下步骤:

依据审判法院的属性值确定文书对象的地域信息;

诉求信息的预处理,包括:对诉求信息的属性值进行分词操作,去除属性值的文本
中的非特征词汇,形成关键词集合;其中,根据预设的某预定主题下的诉求信息的特征词汇
集合中,不属于该特征词汇集合的即为需要去除的非特征词汇。特别地,关键词集合的大小
必须不大于预先设定的足够大的整数T2;

证据集合的预处理,包括:根据预设的某预定主题下的证据集合的特征词汇集合,
提取关键词形成证据关键词集合;

建立映射规则,所述证据关键词集合中的集合元素e与预设的预定义类别集合c为
一对一映射关系;并基于映射规则判别所述数组元素e所对应的类别;

根据映射规则,判断集合元素ej所属的类别集合,如下表2所示;当aij=1时,则ej
属于ci类;反之,当aij=0时,则ej不属于ci类;其中,数组元素ej与预定义类别集合ci的映射
关系为一对一映射,即,数组元素ej仅可能属于ci类,而不能同时属于ci类和ci+j类。

根据上述映射规则所得到的元素分类结果,确定ej的类别,并根据处理后的类别
数据更新数组。

表2


受理费及判决结果的预处理,包括:

通过对受理费的属性值的处理,得到原告/上诉人Plf所需承担的金额比例Cost=
PPlf;具体为:判断对受理费的属性值中是否存在与原告/上诉人Plf和/或被告/被上诉人D
相同的值,若仅存在原告/上诉人Plf,则Cost=PPlf=1;若仅存在被告/被上诉人D,则Cost
=PPlf=0;若同时存在Plf与D的值,且相应承担的金额为MPlf与MD,则

依据Cost处理结果,处理判决结果Re,得到原告/上诉人诉求支持程度,即Re=(1-
Cost)×100%=(1-PPlf)×100%。

所述预设过滤规则包括:

判断文书特征集合中的训练数据对的属性和/或属性值是否为空;

若为空,则将与所述文书特征集合对应的文书对象从所述文书对象集合移除;

判断至少两个文书特征集合之间是否存在案件关联性;若存在关联性,则基于文
书特征集合中的判决结果,确定需要过滤掉的文书特征集合对应的文书对象;

其中,所述案件关联性指至少两个文书特征集合的各自的裁判文书对应同一个案
件的不同审理程序。以上表1为例,表1为一个文书对象,其文书案号为(2015)连民终字第
AAA号,关联案号为(2015)连东民初字第BBB号;依据表1的文书对象的判决结果“撤销江苏
省东海县人民法院(2015)连东民初字第BBB号民事判决”,则将文书案号为(2015)连东民初
字第BBB号的文书对象从文书对象集合S1中移除。

在基于所述训练样本数据集合,训练以修正所述预测模型之前,还包括:基于预定
公式对所述预定主题的训练样本数据中的各训练数据对的属性和属性值进行归一化处理。
如下表3所示,仅为示例,并非对本发明的限定,所述训练样本数据中的各数据对的属性值
为一个包含了至少一个关键词的关键词集合;所述预定公式为其中,
j为关键词集合中的第j个关键词,i表示输入层,βi为所述输入层的调节因子,Cij为关键词
Kij在关键词集合中出现的次数;n是关键词集合中包含的关键词的数量。

表3

释义
标识
默认值
示例

诉求
Appeal
“”
撤销,一审,判决,承担,购房款,一倍,赔偿
输入
证据集合
Evi
[]
[“合同类”,”买卖协议”,”收款收据”]
输入
判决结果
Re
“”
100%
输出

在基于所述训练样本数据集合,训练以修正所述预测模型之前,还包括对所述至
少一个神经网络块的冗余性检查;

其中,所述冗余性检查包括:判断当前的预测模型中是否已经存在与训练样本数
据中的具有属性和属性值的训练数据对相对应的神经网路块;

若存在,则激活与该所述神经网络块具有约束关系的其他神经网络块,并执行正
向推理操作;

若不存在,则建立与所述具有属性和属性值的训练数据对相对应的神经网络块,
并将所述神经网络块加至当前的预测模型。

判断所述执行正向推理操作的过程是否存在矛盾,包括:

判断当前的神经网络块的输出值是否与所述知识推理库中的推理规则相矛盾和/
或当前的神经网络块的输出值是否与另一神经网络块的输出值相矛盾;

若存在矛盾,则将所述矛盾定为矛盾点并执行反向修正操作修正当前的所述神经
网络块。

根据本发明的另一个方面,本发明还提供了一种诉讼结果的预测系统,包括:

输入单元:用于获取当前输入的待测数据;

提取单元:用于基于预定义特征词库,提取所述待测数据中与所述预定义特征词
相对应的待测数据对,以形成待测数据特征信息集合;

主题分析单元:用于基于所述待测数据特征集合,确定所述待测数据的适用主题;

预测单元,用于将所述待测数据特征信息集合输入与所述适用主题对应的预测模
型进行预测,得到所述待测数据的预测结果。

所述预测系统还包括:

条文库,用于存储条文的原始数据;

文书库,用于存储现有的裁判文书的原始数据;

知识推理库,用于存储与所述预定主题相对应的至少一条推理规则;

预定义特征词库,用于存储多个具有属性和属性值的预设数据对;所述预设数据
对用于作为提取待测数据中的待测数据对的依据和/或提取裁判文书中的训练数据对的依
据。

所述预测系统还包括:文书获取单元,用于从文书库获取裁判文书;

所述提取单元,还用于所述基于预定义特征词库,对裁判文书进行提取处理得到
预定主题的训练样本数据集合;

数据处理单元,用于基于预定公式对各训练样本数据中的各训练数据对的属性和
属性值和/或待测数据特征信息集合的待测数据对的属性和属性值进行归一化处理;

训练数据获取单元,用于获取经过数据处理单元进行处理后的训练样本数据集
合;

训练单元,用于基于训练样本数据集合,通过正向推理操作和反向修正操作训练
并修正神经网络,以使得每个所述训练样本数据对应的预测结果与其自身的实际的判决结
果的差值在预定范围内,且使得预测结果与所述预定主题的推理规则相匹配,从而形成所
述预定主题的神经网络预测模型;

所述预测单元,还用于基于训练样本数据输出经过各个神经网络块训练的合理的
预测结果。

所述预测系统还包括:判断单元,用于判断当前的预测模型中是否已经存在与训
练样本数据中的具有属性和属性值的训练数据对相对应的神经网路块;若存在,则激活与
该所述神经网络块具有约束关系的其他神经网络块,并执行正向推理操作;若不存在,则建
立与所述具有属性和属性值的训练数据对相对应的神经网络块,并将所述神经网络块加至
当前的预测模型。

用于判断所述执行正向推理操作的过程是否存在矛盾,包括:

判断当前的神经网络块的输出值是否与所述知识推理库中的推理规则相矛盾和/
或当前的神经网络块的输出值是否与另一神经网络块的输出值相矛盾;若存在矛盾,则将
所述矛盾定为矛盾点并执行反向修正操作修正当前的所述神经网络块。

本发明旨在保护一种诉讼结果的预测方法及系统,一方面基于我国条文法系特
征,从法律条文出发,技术化案件的审理规则,构建知识库推理库,用于指导神经网络模型
预测过程;另一方面,基于真实的诉讼大数据,分析得到证据和诉求类似,且证据证明的基
本案件情况具有相似性的,同一地域内的案件审理思路特征;在知识库推理指导下,构建多
神经网络块的诉讼结果的推理预测模型,对当前客户端输入条件进行训练预测可能得到的
审理结果,一定程度上弥补普通用户在法律常识或分析能力上的弱势,增强对自身法律需
求的了解程度。

应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的
原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何
修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨
在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修
改例。

一种诉讼结果的预测方法及系统.pdf_第1页
第1页 / 共18页
一种诉讼结果的预测方法及系统.pdf_第2页
第2页 / 共18页
一种诉讼结果的预测方法及系统.pdf_第3页
第3页 / 共18页
点击查看更多>>
资源描述

《一种诉讼结果的预测方法及系统.pdf》由会员分享,可在线阅读,更多相关《一种诉讼结果的预测方法及系统.pdf(18页珍藏版)》请在专利查询网上搜索。

本发明提供了一种诉讼结果的预测方法及系统,所述方法包括:建立预定主题的知识推理库;知识推理库用于存储推理规则,推理规则多个推理步;基于预定主题的知识推理库,构建预测模型;其中,每个预测模型的神经网络块对应一个推理步;每个推理步所需的推理数据对应一个数据类型,每个数据类型对应神经网络块的输入类型;处理预定主题对应的裁判文书得到训练样本数据集合,训练并修正预测模型;获取待测数据,基于预定义特征词库提取。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1