论文部分内容阅读
2013年,某法院着手建立全国集中的“人民法院数据集中管理平台”,建立全国司法数据动态更新机制,整合全国法院司法信息资源,形成国家司法审判信息资源库,实现对全国法院司法信息资源的深入分析与利用,为执法办案、法院管理等提供信息资源服务。本论文就是研究平台中的集中数据仓库系统的设计与建设问题。论文的主要工作包括:(1)根据法院业务,分析法院数据仓库系统的目标、功能和非功能需求。依据数据仓库技术、系统架构技术,确定系统体系架构、研究方案。(2)通过分析法院应用系统的数据源,设计法院统一数据视图、分层的数据仓库概念模型、多维OLAP分析模型、主数据模型和系统逻辑结构。根据Impala特性,设计系统的部署方案。(3)开展数据汇集、数据仓库、列式存储数据库性能测试和数据服务的实现工作。(4)在研究课题的基础上,归纳法院数据仓库系统应用效果。测试和优化系统性能,总结方案价值。该数据仓库系统需要满足成本控制要求,以及运算性能需求。在系统设计时,着手研究对比SybaseIQ、MonetDB、人大金仓、Impala等列式数据库特性,选择开源的Impala作为平台分析性数据库并设计数据仓库模型、数据集市模型和ETL程序。在平台上线时,针对性的验证数据仓库系统性能。本课题的研究对法院构建商业智能分析类项目有重大示范作用。开源技术的软件方案降低对国外软件的依靠,加速推进了依法治国背景下的法院信息化建设。研究形成了包含BI、数据仓库、ETL技术的法院大数据利用解决方案,形成了独立自主知识产权的数据分析产品。