论文部分内容阅读
近年来,智慧司法领域中针对法律裁判文书的分析和基于案例事实描述的法律判决预测已成为计算法律学的热点研究问题。法律判决预测主要包括罪名、法条和刑期预测任务,法条预测旨在使用案例中的事实描述和法律法规预测案例适应的法条,相关工作主要基于机器学习、神经网络等模型,通过输入裁判文书中的事实描述预测案件对应的法条。目前该研究存在以下难点问题:(1)法条预测任务是典型的一对多问题,单个案件可能涉及多个法条,且不同法条之间的差异通常较小,事实描述的内容和结构相似度很高,传统方法不能较好的处理该问题。(2)裁判文书中的犯罪事实是案件的真实客观描述,其包括的数字型数据对法条的区分有重要的影响,然而现有司法判决预测模型对金钱、年龄等数字大小的敏感度不高,缺乏专门针对该类数据的分析与处理,且目前应用到司法判决预测的模型不能有效获得法律文本的长距离依赖关系。(3)现阶段智慧司法领域中的很多研究任务都提出基于深度神经网络的解决方法,但模型普遍存在“黑盒”缺陷,研究过程和实验结果通常缺乏可解释性与推理机制。基于此,本文针对法条间差异性较小和一对多问题,首先提出基于模型融合与阈值过滤的法条预测模型。然后,通过分析事实描述和相关法条中的数字型数据(包括金钱、年龄等)提出基于数据离散化和深度金字塔卷积神经网络(DPCNN)的法条预测模型。最后,针对研究中缺乏可解释性与推理机制的问题,提出面向司法判决推理的可解释因果模型。相关实验结果与案例验证表明,本文提出的方法提高了任务的准确率,证明了数据离散化处理在法条预测任务中的重要性,补充了现有司法判决推理方法缺乏推理机制及可解释性差的问题。论文主要工作包括:第一,提出了基于模型融合和阈值过滤的法条预测模型。通过分析法律裁判文书的事实描述和法条的具体司法解释,挖掘裁判文书事实描述内容中的特征,基于“中国法研杯”司法人工智能挑战赛中的公开数据,构建了多组不同规模的实验数据集,并分别在不同的实验数据集上进行了多组对比实验。实验结果表明,相比于传统单一模型,所提方法能有效地提高任务的准确率,并且能较好地解决单一案例事实描述对应多个法条的推荐问题。第二,提出了基于数据离散化和DPCNN的法条预测模型。结合相关法条、司法解释文件和刑法类判决文书内容,系统地对事实描述中的数字型数据(包括金钱、年龄等)进行预处理。根据法条预测的特殊性和法律文本的长距离依赖性,将数据离散化方法应用到DPCNN中进行法条预测。在多组数据集上进行了多次实验,与其他最新的基线相比,该方法的实验结果取得了明显提升。第三,提出了面向司法判决推理的可解释因果模型。根据案件审理程序和因果逻辑理论,探索司法判决中的因果关系发现机制,提出因果关系图构建模式和司法判决推理因果模型(JCM)。基于婚姻类文书和《中华人民共和国婚姻法》相关法条,定义了婚姻类案例的判决推理三元组<,,>。提出了司法判决推理因果模型的验证策略,证明了该模型能较好适应法院案件判决程序,具备司法判决任务的客观性、规范性和流程性,能有效补充现有司法判决推理方法缺乏推理机制及可解释性差的问题。