基于深度学习的检察办案辅助量刑规则挖掘

来源 :华北电力大学(北京) | 被引量 : 0次 | 上传用户:yecongliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
辅助量刑规则挖掘是“智慧法院”的核心内容之一,也是法学与人工智能相结合的研究热点。辅助量刑可以为法官和检察官的日常工作提供参考,有助于维护我国法律体系的公平和正确性。目前,在我国多个建设“智慧法院”的地方法院的法务系统中都配有量刑预测的模块。本文针对法律文书的命名实体识别准确率不高、知识图谱的构建自动性差等问题进行了深入的研究。分别对法律文书的命名实体识别、实体关系抽取、量刑规则挖掘等方面展开论述,结合领域知识建立LSTM-CRF模型用于法律文书的命名实体识别、基于Graph-LSTM模型与注意力机制(attention)相结合的命名实体关系抽取模型,最后结合文本特征构建基于Graph-LSTM模型的量刑规则挖掘模型,实验验证模型准确率较高,满足司法领域的要求。首先,通过在基于长短时记忆模型(Long Short-Term Memory,LSTM)的命名实体识别模型中引入条件随机场(Conditional Random Field,CRF)模型,避免了 LSTM不能捕捉词语标签间约束的问题,特别结合法律文书的文本特征,构造实体识别模型,对比分析不同命名实体的识别准确率以及不同机器学习模型的性能指标。第二,建立基于Graph-LSTM模型与attention机制相结合的法律文书命名实体关系抽取模型。通过分析法律文书的句法依存关系,得到实体间的语义语法特征,根据句法依存结构图构造Graph-LSTM模型。通过远程监督的方法得到弱标签数据集,并引入attention机制在模型的最后消除噪声。通过与其他机器学习模型的对比实验,分析模型性能。最后,设计辅助量刑规则挖掘模型。基于Graph-LSTM模型对法律文书建模,挖掘案件要素特征(X)到刑期(Y)的具有高置信度的关联规则。在命名实体识别工作的基础上,提取出结构化的情节信息作为模型输入,以刑期作为分类结果,训练Graph-LSTM模型。实验分析模型的准确率和五折交叉验证的准确率随着迭代次数的变化,并与其他机器学习进行实验对比,证明了模型的较高准确率。
其他文献
避暑山庄驳岸大体分为四类,沙土驳岸、天然石岸、料石驳岸、人工堆叠山石驳岸。从山庄内水系溪流、河洲与湖岛三种景观来分析清代驳岸的历史原貌,通过现状与历史原貌对比,分
<正>2014年,国资委要求三大航于2017年实现直销比例50%,代理费降低50%;2015年10月26日,携程与百度进行股权置换,拥有去哪儿45%的股份,正式将去哪儿纳入携程系版图;阿里旅行于
经济的发展和科学技术水平的提升促进了大数据时代的到来,随着国家对大数据重视程度的不断提升,国家将大数据发展的战略上升到国家的战略。大数据时代的到来使各个领域开始实
为提高制造系统中高维目标调度优化算法的求解性能,更好地在收敛性和分布性之间保持平衡,提出一种改进精英策略的PCA-NSGAⅡ算法。根据实际生产的需求,建立以最小化生产总成
【正】 近年来,我在挖掘、整理闽东畲族文化遗产的工作中,对畲族的历史渊源,略有所得,现谈些个人的看法.在闽东畲乡,几乎是家家户户住房正厅的两旁大柱上都写着一副:"安邦定
用固相反应法及Nd^3+掺杂制备了(1-x)(Ca0.61Nd0.26)TiO3-x(Li1/2Sm1/2)TiO3(x=0.4-0.7)材料,其介电常数εr高于120且品质因数在3254GHz(1.5GHz)以上,谐振频率温度系数可降低
“互联网+”推动教研发展,引发教研形态转型。文章在梳理网络技术支持教研形态演化发展的基础上,提出“互联网+教研”是信息化教研发展的高端形态,其内涵表现为:以多维空间的
国家公务员是党的干部队伍的重要组成部分。公务员培训是国家公务员制度的重要内容,也是提高公务员素质能力的有效手段。当前,要不断加强和改进公务员的培训工作,重视公务员
本文介绍了频率复用双圆极化馈源系统中所采用的六种高性能士45°移相对的设计方案。提出了分析移相对性能的分析程序和(?)计移相对尺寸的综合程序。这些程序与实验结果吻合
会议
建立了基于Fe3O4/乙二胺四乙酸(EDTA)磁性粒子的集成化蛋白质组学研究方法。首先用共沉淀法合成EDTA负载的Fe3O4/EDTA磁性粒子。在优化的溶液条件下(95%乙腈-1%三氟乙酸,体积分