面向“智慧法院”的知识图谱构建方法与研究

来源 :贵州大学 | 被引量 : 7次 | 上传用户:baobei871011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2016年7月底,中共中央办公厅、国务院办公厅印发了《国家信息化发展战略纲要》,将建设“智慧法院”列入国家信息化发展的战略。人民法院作为我国的审判机关,“智慧法院”的建设对提高案件受理、审判、执行、监督等各环节信息化水平,推动司法信息公开,促进司法公平正义具有重大意义。目前法院系统内的案件数据十分丰富,拥有很多有价值的信息,然而当前数据缺乏有效的组织,关键知识难以抽取,难以进行分析与利用。近年来,知识图谱技术的大力发展,为大规模结构化知识的检索、分析提供了可行性解决方法,从专业且大量的案件数据中提取重要的结构化知识进行知识图谱的构建,不仅可以解决“智慧法院”信息化建设中大规模案件信息的搜索、展示与存储问题,而且可以以案件为中心,将法院、法官、原告或被告等重要知识进行关联。知识图谱的构建可以有效的组织、分析、挖掘法院中的海量有价值信息,为高效的案件审理与智能分案问题的解决提供数据基础,让“智慧法院”的信息化建设成果更好的服务社会。本文主要以法院判决书为数据源进行面向“智慧法院”的知识图谱构建工作。首先根据“智慧法院”当前信息化建设需求构建知识图谱结构,然后从判决书等数据源中抽取需要的实体以及属性知识,经过知识融合后形成知识图谱,出于性能考虑,使用Neo4j图数据库和MongoDB非关系型数据库对知识图谱进行存储。为了减少后续知识图谱更新维护成本,本文实现了自动化更新系统,系统能自动抽取新判决书中的知识,截至2019年4月,系统已经将200多万篇判决书数据自动更新到知识图谱中。在知识图谱构建过程中,面向判决书的实体以及属性标注数据极其匮乏,开放抽取工具在判决书上的抽取效果不理想。本文根据原始数据特点,对不同知识采用不同的策略进行抽取,针对结构化文件中的知识,直接解析结构化数据文件;针对可以从判决书中总结规律的知识,采用基于规则的方法进行抽取;针对规则性不强且不存在结构化文本中的知识,采用基于机器学习的方法进行抽取。从非结构化数据中进行实体抽取是本文的重点研究内容,本文在序列标注方法的基础上,提出融合实体边界特征的BiLSTM-CRF模型和基于BERT预训练的BERT-CRF模型,并针对此方法进行了训练语料库标注,实验结果表明,两个模型都有相对较好的识别效果。
其他文献
改革开放以来,FDI开始进入我国,对我国社会经济的持续快速发展起到了重要的促进作用,也从整体上增加了我国的国民收入。但是在FDI规模不断增加的同时,我国东中西三大地区之间
通过调查青海省能源储量、生产和消费现状,掌握目前青海省能源消费的结构,并通过对未来各产业发展情况、能源产量的预测。分析未来青海省能源的平衡情况,提出近期应重点开展的工
选取15年生开心形富士苹果,设计7个不同入渗方式处理,测定了不同处理的苹果产量和不同生育期土壤含水率。结果表明,苹果成熟前不同处理土壤含水率之间差异不明显,进入雨季以
随着全球化竞争的加剧,所有的企业都不能再独善其身,都被卷入这一场竞争之中,而为了适应环境的变化,增强竞争优势,在竞争过程中占据主动地位,许多企业都开始在内部进行改革,而组织内
法国债法改革在民法典中新设“返还”单元,就债法领域内设立了体系化的返还统一规则,不仅适用于非债清偿返还、不当得利返还,也适用于合同无效、解除等引发的返还问题。新体系依
近些年来,人们对中药及其制剂的质量控制越来越重视。随着现代分析技术的提高以及计算机应用技术的不断进步,特征成分多指标综合分析及指纹图谱已经成为公认的中药质量控制模
"互联网+"时代已然来临,随着网络技术的不断成熟,社会的进步和人类文明的发展得到空前程度的提高,中国传统的习俗也在悄然发生转变。借助全新的平台,承载多样的形式,时代发展
长期以来,人们习惯用政府政策对民间经济的影响来思考我国在各个历史时期的经济发展状况,而对民间自身的发展力量未引起相当重视。习惯历史研究的静止观,总在试图寻找"总体发
目的:替牙期间隙分析是对上下颌未萌恒尖牙和恒前磨牙牙冠大小之和进行预测,以判断上下颌可提供的间隙和恒牙萌出需要的间隙之间是否存在不调,即是否存在牙列拥挤及牙列拥挤的严
在车贴语中运用修辞格,可以增强车贴语语言的艺术感染力,语言更加鲜活生动,使车贴语在形式上更加丰富多彩,给驾驶者以及阅读者创造轻松一刻的娱乐效果,同时也可以帮助人们透过车贴