论文部分内容阅读
法律判决预测(LJP)是一项将人工智能应用在法律审判领域的传统任务。它的目的是训练一种能根据法律文本自动预测判决结果(如相关法律条文、控诉罪名、刑期等)的机器法官。在经过20年的信息化建设后,全国各个法院中各类数据,例如证据数据、文书数据等都较为完整。这些标注信息以及众多的场景非常适合将自然语言处理技术(NLP)应用于法律领域。虽然各类法律文本信息的质量较高,但是在这类长序列文本中的信息过于庞杂且难以理解,所以对于机器而言,完成正确的法律判决预测的难度还是较大。如何快速让计算机理解自然语言并正确完成法律判决预测便具有重要的研究意义。本文主要围绕LJP的三个子任务—控诉罪名预测和法律条文推荐以及刑期预测进行相关的研究工作。本文的主要研究工作如下:
(1)针对控诉罪名预测任务中的内容混淆以及动态标签问题,本文提出了基于多层次关系抽取的罪名预测模型,该框架分为两个层级—标签概率层和标签数目层。本文在标签概率层通过构建动态融合注意力模型引入了外部知识去学习相似度关系以及差异性关系以及在标签数目层构建了数目学习网络去学习标签的共现关系。通过学习这三种不同的关系缓解内容混淆以及动态标签问题,本文解决了控诉罪名预测任务。
(2)针对法律条文推荐任务,本文主要研究如何将该任务从文本分类问题转换为语义匹配问题。当将问题转换后,本文提出双向Transformer卷积网络模型,并针对没有合理选择机制造成精度不足这一情况,加入再选择机制对模型进行改进,最终构建了语义匹配串联再选择机制的法条推荐模型。
(3)在刑期预测任务中刑期的计数单位为月,且较为分散,这对于回归预测模型而言难度较大,极易造成准确率较低。针对这一情况,本文提出了基于因果关系的刑期预测模型。该模型中的因果TextCNN能够理解文本中的因果逻辑关系,特别是法律文本与刑期之间的关系。并且,该模型尝试使用特征融合的方式将前两个子任务的提取到的特征信息引入模型中。实验结果表明,这一方式加深了模型对于控诉罪名以及法律条文与刑期的因果关系的理解。
本文针对LJP任务不同子问题的不同难点,采取了不同的方法去解决这些问题并取得了一个阶段性的成果。
(1)针对控诉罪名预测任务中的内容混淆以及动态标签问题,本文提出了基于多层次关系抽取的罪名预测模型,该框架分为两个层级—标签概率层和标签数目层。本文在标签概率层通过构建动态融合注意力模型引入了外部知识去学习相似度关系以及差异性关系以及在标签数目层构建了数目学习网络去学习标签的共现关系。通过学习这三种不同的关系缓解内容混淆以及动态标签问题,本文解决了控诉罪名预测任务。
(2)针对法律条文推荐任务,本文主要研究如何将该任务从文本分类问题转换为语义匹配问题。当将问题转换后,本文提出双向Transformer卷积网络模型,并针对没有合理选择机制造成精度不足这一情况,加入再选择机制对模型进行改进,最终构建了语义匹配串联再选择机制的法条推荐模型。
(3)在刑期预测任务中刑期的计数单位为月,且较为分散,这对于回归预测模型而言难度较大,极易造成准确率较低。针对这一情况,本文提出了基于因果关系的刑期预测模型。该模型中的因果TextCNN能够理解文本中的因果逻辑关系,特别是法律文本与刑期之间的关系。并且,该模型尝试使用特征融合的方式将前两个子任务的提取到的特征信息引入模型中。实验结果表明,这一方式加深了模型对于控诉罪名以及法律条文与刑期的因果关系的理解。
本文针对LJP任务不同子问题的不同难点,采取了不同的方法去解决这些问题并取得了一个阶段性的成果。