论文部分内容阅读
近年来,我国在建设“智慧法院”中一直不断摸索和进步。“智慧法院”的建设中使用最多的两种技术,一是大数据,大数据主要应用在各种信息材料的共享方面;另一个就是人工智能,主要应用在庭审中,进行辅助审查法律文书、自动提取审判文书证据材料等,提高了审判质量评估、辅助审判、自动量刑、精准分案的工作效率,满足了“智慧法庭”的发展需求。每个系统中的数据都是各种类型的,并且由于文件格式的不同,存在“数据孤岛”的现象,导致数据难以充分挖掘利用等问题,针对这些问题,本文工作主要包括:首先针对法院执行案件信息数据模式多样化、结构复杂及各种平台融合后的数据重复、不完整等问题,设计规则进行转换,提出基于内码序列值聚类方法对重复的数据进行深层次检测及清洗,并构建分布式存储平台进行分布式存储。其次针对数据特征不鲜明,知识体的来源数据庞大和复杂,导致数据挖掘困难的问题,定义数据转换的规则,构建本体知识库,建立业务系统数据模型,并定义综合管理平台数据模型之间的映射关系,提出组合相似度匹配算法。最后针对多元数据的不一致性造成数据冲突问题,构建投票、相互印证、可信、数据源依赖等规则,建立马尔可夫逻辑网络模型,提出投票感知器算法,并进行实验对本文提出的上述方法的有效性进行验证。本文对司法领域的大数据融合、挖掘及分析应用方法研究,通过不断研究新算法新模型的途径,达到法院可以有效处理不同类型数据的目标。