【摘 要】
:
大数据时代,人工智能已上升为国家战略。海量法律文书的公开为人工智能在法律领域的应用落实提供了重要的发展条件。刑事案件判决预测旨在通过案件的事实描述预测合理的相关法条和罪名指控,成为当前“AI+法律”领域的研究热点。知识图谱提供了对世界的形式化表示,可以作为知识库提供机器更容易理解的数据形式,最大化地挖掘法律文本的内在价值。国内的许多学者构建并发布了高质量的中文知识图谱,但知识图谱在法律领域的应用仍
论文部分内容阅读
大数据时代,人工智能已上升为国家战略。海量法律文书的公开为人工智能在法律领域的应用落实提供了重要的发展条件。刑事案件判决预测旨在通过案件的事实描述预测合理的相关法条和罪名指控,成为当前“AI+法律”领域的研究热点。知识图谱提供了对世界的形式化表示,可以作为知识库提供机器更容易理解的数据形式,最大化地挖掘法律文本的内在价值。国内的许多学者构建并发布了高质量的中文知识图谱,但知识图谱在法律领域的应用仍处于起步阶段,没有开源的法律专业知识图谱支持进一步的研究。本文构建了一个面向刑法领域的专业知识图谱,并研究如何从法律知识图谱中学习知识,从而进一步改进机器学习文本分类算法和深度学习神经网络模型,以支持高效的刑事案件判决预测任务。1.本文以中国裁判文书网发布的刑事文书作为语料库,利用两个开源的中文通用知识图谱,CN-Probase和思知(OwnThink),抽取了一个刑法领域专用知识图谱。该知识图谱包括超过87万个实体和150万个关系,使用图数据库Neo4j进行存储,并发布在 github(https://github.com/dquaner/LegalKG)上。2.针对知识图谱在机器学习文本分类算法上的应用问题,提出了一种基于法律知识图谱的文本相似度计算模型,通过将文本映射到知识图谱中的实体,学习了实体间的概念信息和语义信息;利用计算得到的文本相似度进一步改进了用于刑事判决预测的KNN和SVM算法。3.针对知识图谱在深度学习神经网络模型上的应用问题,提出了一种基于TransE改进的知识表示学习算法;将融合了多源信息的向量化表示作为输入层应用到卷积神经网络和循环神经网络模型中以完成刑事判决预测任务。实验表明,本文构建的刑法领域知识图谱是合理且有效的,以微平均F1值(Micro-F1-measure)和宏平均F1值(Macro-F1-measure)作为评价指标,基于该知识图谱改进的文本分类算法和神经网络模型在刑事案件判决预测任务上都取得了较好的效果。
其他文献
随着工业4.0智能化生产时代的到来,制造业的规模再次扩大,货物量增加,货物种类多样,订单量也增多,这对物流中心的出货带来了不小的挑战。传统模式下为了快速出货,大多公司是多人多车拣货,工人在无预包装信息的情况下只能按经验装箱。工业4.0的领跑者——电气企业SE公司的物流中心E公司在拣货上是这种传统模式,工人为免于重装或避免装箱排布繁琐,会偏向选取比实际需要更大的货箱,使得装载率低下、货箱数量多、包材
目的1、建立检测服用小剂量甲氨蝶呤(methotrexate,MTX)的类风湿关节炎(rheumatoid arthritis,RA)患者红细胞中多聚谷氨酸化甲氨蝶呤(methotrexate polyglutamates,MTXPGs)浓度的方法。2、分析溶质载体有机阴离子转运蛋白家族成员1B1(the solute carrier organic anion transporter famil
早期改革开放的浪潮席卷而来,地方经济快速发展,中国整体经济有着质的飞跃,而这与地方政府竞争有着密不可分的联系。地方政府竞争是在特殊的中国式财政分权背景下衍生而来的,经济分权和政治集权的结合构成了中国式财政分权,对地方政府形成了经济和政治的双重激励。地方政府在激励下追求经济发展与晋升机制,造成一定的资源浪费、环境污染和生态破坏。因此,研究环境质量,研究财政分权、地方政府行为与大气质量的关系,有利于协
随着互联网和信息技术的发展与应用,电子商务改变了传统的零售模式,很多零售企业在保持传统实体零售的同时,开始布局线上渠道的业务,由此构成双渠道分销模式。目前,Y公司也增设了线上网络零售渠道,但是双渠道独立进行运营和库存管理,双渠道库存成本高、库存管理问题突出,随着企业不断扩大经营规模,如何优化双渠道的库存模式并控制成本是企业发展面临的难题。基于此,本文从Y公司的企业发展和利润优化角度,以公司双渠道供
胆甾相液晶因其自发形成的螺旋超结构以及对外界刺激(如电场、磁场、光照、温度、机械力和锚定条件等)的实时响应特性,使其在反射式显示器、温度传感器、生物传感器、可调谐式滤波片、偏光镜、自适应智能窗、快响应的高对比度柔性光电材料等领域应用越来越广泛。在电场调制下,胆甾相液晶排列成横躺螺旋结构,呈现均匀的指纹织构,因其折射率呈周期性分布,具备良好的拉曼-奈斯衍射特性,被广泛应用于光束控制器、增亮膜、光刻掩
材料基因组计划提出了以高通量计算、高通量实验和材料数据库三要素驱动的未来先进材料开发新模式,产生了“数据+人工智能”的创新发展方向。攻克关键性材料技术壁垒,为改变我国长期以来在新材料技术上落后的局面具有重要的战略性意义。本文的工作围绕开发“跨尺度高通量自动流程功能材料集成计算算法和软件”的目标,针对跨尺度高通量计算和数据共享平台的建设需求,主要研究内容与结论如下:(1)基于改进的有效介质理论,采用
串通投标是工程建设招投标领域中的一种最为严重的违法行为。为防止工程串通投标,我国颁布了一系列相关的法律法规,对规制串通投标起到了一定的作用。但笔者多年工作实践以及研究发现,我国工程建设领域串通投标依然不同程度的存在。因此,找到切实规制工程串通投标的“药方”尤为重要。笔者希望通过本文研究,为规制我国工程建设领域串通投标提供一些意见和建议。笔者在本文中尝试了从法经济学的视角研究串通投标相关问题。笔者首
随着我国经济迅猛的发展,我国私人汽车的拥有量每年增加的幅度都超过了10%,驾驶安全问题也成为了现代交通的顽疾。其中,疲劳驾驶以其在交通事故总数中高达20%的占比以及逐年增加的趋势,成为亟待解决的影响安全驾驶的重要因素。研究表明,90%疲劳驾驶引发的事故可以通过提前一秒的警告来避免,因此,本文提出的疲劳驾驶预警系统对于交通安全具有重大意义。本文结合传统机器学习算法和深度学习算法构建了面向终端设备的疲
作为一名伟大的美国黑人作家,玛雅·安吉洛以其卓越的成就成为现代美国黑人文学的重要代表。《我知道笼中鸟为何歌唱》是她的第一本自传性小说。在这部作品中,安吉洛回忆了她从3岁到17岁的成长经历。安吉洛生活在20世纪40年代的南方小镇斯坦普,她不仅要与如影随行的错位和不安全感作斗争,还面临着种族主义、性骚扰和强奸等一系列压迫,这严重影响了她的生活。然而,在周围人的帮助下,她终于意识到爱自己、善待他人、变得
环保产业作为国家战略性新兴产业的重点领域之一,近年来自然也受到资本的追捧,表现出强大的发展势头。为了快速提升竞争力,中国环保企业纷纷走出去,海外并购优质资产,从2015年到2017年间,中国环保企业海外并购案例不仅并购数量高速增长,资产交易规模也迅速上升,其中上市环保企业是绝对的主力军。但现在反观这些环保企业的并购案例,发现多家企业并购获得的成果并不理想,有一些企业甚至陷入了风险和危机。而另外一方