面向法律文本的智能判决预测方法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:hdzj999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
法律判决预测(LJP)是一项将人工智能应用在法律审判领域的传统任务。它的目的是训练一种能根据法律文本自动预测判决结果(如相关法律条文、控诉罪名、刑期等)的机器法官。在经过20年的信息化建设后,全国各个法院中各类数据,例如证据数据、文书数据等都较为完整。这些标注信息以及众多的场景非常适合将自然语言处理技术(NLP)应用于法律领域。虽然各类法律文本信息的质量较高,但是在这类长序列文本中的信息过于庞杂且难以理解,所以对于机器而言,完成正确的法律判决预测的难度还是较大。如何快速让计算机理解自然语言并正确完成法律判决预测便具有重要的研究意义。本文主要围绕LJP的三个子任务—控诉罪名预测和法律条文推荐以及刑期预测进行相关的研究工作。本文的主要研究工作如下:
  (1)针对控诉罪名预测任务中的内容混淆以及动态标签问题,本文提出了基于多层次关系抽取的罪名预测模型,该框架分为两个层级—标签概率层和标签数目层。本文在标签概率层通过构建动态融合注意力模型引入了外部知识去学习相似度关系以及差异性关系以及在标签数目层构建了数目学习网络去学习标签的共现关系。通过学习这三种不同的关系缓解内容混淆以及动态标签问题,本文解决了控诉罪名预测任务。
  (2)针对法律条文推荐任务,本文主要研究如何将该任务从文本分类问题转换为语义匹配问题。当将问题转换后,本文提出双向Transformer卷积网络模型,并针对没有合理选择机制造成精度不足这一情况,加入再选择机制对模型进行改进,最终构建了语义匹配串联再选择机制的法条推荐模型。
  (3)在刑期预测任务中刑期的计数单位为月,且较为分散,这对于回归预测模型而言难度较大,极易造成准确率较低。针对这一情况,本文提出了基于因果关系的刑期预测模型。该模型中的因果TextCNN能够理解文本中的因果逻辑关系,特别是法律文本与刑期之间的关系。并且,该模型尝试使用特征融合的方式将前两个子任务的提取到的特征信息引入模型中。实验结果表明,这一方式加深了模型对于控诉罪名以及法律条文与刑期的因果关系的理解。
  本文针对LJP任务不同子问题的不同难点,采取了不同的方法去解决这些问题并取得了一个阶段性的成果。
其他文献
图像生成技术作为艺术创作的重要组成部分,一直以来是计算机视觉的研究热点。传统的非真实感绘制技术利用计算机图形学、图像滤波等方法自动或者半自动地完成图像生成任务,这类方法只能生成简单粗略的图像,在生成图像的细节上做得不够准确。随着深度学习的迅猛发展,神经网络给该领域带来了革命性的改变。得益于更充足的数据量、更复杂的数学模型和更深层的网络结构,基于深度学习的图像生成算法不仅能够生成更复杂逼真的自然图像
共享单车作为一种绿色低碳的出行方式,给人们的出行带来便利。然而,人们自由使用单车给共享单车的维护带来许多问题(例如单车损坏、运送到指定位置等)。因此,共享单车平台可能需要雇佣用户去完成单车维护任务,同时平台需要给予用户合理的报酬以激励用户完成任务。当存在多个用户竞争时,用户可能谎报任务完成成本或者任务完成概率等信息来获得更高的报酬,从而导致平台不能高效的分发单车维护任务。本文主要从两个方面解决此问
小麦是现今世界范围内的主要粮食作物之一。为了提高小麦产量,育种专家致力于发掘其基因型和表型之间的联系。现有的表型提取方法多依赖于手工方式,采集的数据量有限且效率低下。三维CT(Computed Tomography)成像具有成像精细、动态范围高和无损探测内部结构等优点,可以快速且无损地提取小麦的高通量表型。CT扫描出的三维图像具有数据量大且内容高度稀疏化的特点,给图像处理工作带来了不小的挑战。本文
随着无线通信技术的日益成熟以及智能终端的普及,基于位置服务的应用(LBS)得到了全面的发展。用户在进行位置服务相关的查询时,需要向LBS服务提供商提供用户自身的请求内容以及位置信息,因此用户的隐私存在泄漏的风险。基于位置服务的隐私保护问题已经成为学者们研究的一个热点。当前主流的位置隐私保护模型所存在的缺陷包含:点对点分布式模型结构(P2P)用户之间存在不可信任的问题,响应时间较长,反馈结果不精确;
学位
拼车出行作为一种经济的出行方式,吸引了越来越多的乘客使用。如何有效地将乘客的订单分配给合适的司机成为了关键问题。为了给予司机更加合理的报酬,激励司机提供拼车出行服务,本文将对拼车出行中订单分配和司机定价的机制进行研究。在拼车出行中,司机是理性的,且具有异质性(例如不同的司机具有不同的成本信息),并会通过策略性行为(例如虚假地揭露自己的成本信息)去获得更多的利润。司机的策略性行为会造成平台和司机的社
学位
源代码摘要旨在生成自然语言文本,用于描述代码的语义。该任务目前已是软件工程领域不可或缺的部分。尽管现存的方法以能很好地完成此项任务,但是此类模型主要受限于数据充足的背景,而缺乏对于小样本数据和跨语言场景下的讨论。这些模型在实际应用中存在2个问题:(a)训练样本需求大。大多数主流方法中都采用编码器-解码器结构,而此种结构严重依赖于大规模数据训练。而且在现实世界中,获取大样本的优质标记数据集的成本是难
交通标志的检测与识别是智能交通系统领域中的重要研究方向之一,受到许多研究者的关注,但现有的研究主要集中在各类符号型交通标志的检测与识别上,对字符型交通标志的研究较少,且相关研究的检测精度与实时性不能满足实际需求。在实际的交通场景中字符型交通标志大量存在,以文字内容的形式提供丰富且重要的道路信息,这类文本信息的高效精准提取对于智能辅助驾驶系统、无人驾驶技术等具有重要作用。本文结合图像处理与深度学习最
学位
随着智慧城市的建设,智能交通视频监控成为了日益重要的核心环节。车辆重识别(Vehicle Re-identification,简称车辆Re-ID)是智能交通视频分析中的一项新兴技术,正逐渐成为研究热点。车辆重识别的主要任务是在多个非重叠覆盖摄像头的监控网络中在快速检索、定位到目标车辆。在真实开放的交通监控场景中,环境光照的变化、摄像头分辨率低、遮挡等不可控因素使得从视频中难以准确的获取车辆的车牌信
随着人工智能等高新技术的快速发展,探索更加智能化的船舶路径规划方法对于船舶安全航行以及智能化航运业的发展具有重要理论价值与实际应用意义。相比于传统船舶路径规划方法,基于深度强化学习的船舶路径规划方法通过不断“试错式”学习,寻求船舶的最优策略,使船舶在复杂环境中更容易找到安全有效的航行路线。但是,目前以深度强化学习为基础的船舶路径规划方法中,较少结合船舶航行特点;在规划船舶间避碰时较少考虑避碰规则,
学位
近年来,无人机的应用正在快速增长,包括实时监控,提供无线覆盖,遥感,搜索和救援,货物交付,安全和监视,精确农业以及物联网系统等领域。凭借其易于部署,维护成本低,机动性高和具有良好的视距链路等优点,无人机辅助的高速无线通信有望在未来的通信系统中发挥重要作用。然而,由于无人机有限的能量存储和零星的能量供应,无人机系统的通信性能和运行持续时间从根本上受到机载能量的限制。无线充电技术以电磁波为载体向空间中
学位