论文部分内容阅读
我国信息化建设经过多年的发展,已经取得了一定的成就,党的十九大更是指出进一步发展数字信息化的工作,公共资源交易作为信息化的重要组成部分,对政府工作、市场公平竞争都起着重要的作用。随着公共资源交易数据大量增长,其背后数据之间复杂的关系以及大量离散的信息,使得数据没有充分的利用。为了更加充分的利用数据,合理配置资源,辅助政府决策,对公共资源交易数据的分析处理有着更深的现实意义。通过构建公共资源交易领域的知识图谱挖掘数据中潜在的关系,并形成一个知识网络,在此基础上进行可视化展示,可以将数据资源的作用最大化,更好的服务政府工作,构建一个公平的市场竞争环境。以公共资源交易数据为核心,建立知识图谱,打破由于传统数据存储媒介的限制,让一直以来独享、分裂、离散、种类复杂的数据形成知识网络,提供更精准的服务。例如多维度的分析招投标人的能力、分析交易中不同材料的价格走势、以及用户投标金额的合理性、对公共资源交易主体行为起到监控作用等。针对上述情况本文主要工作如下:1.本文中针对公共资源交易数据中数据结构多、项目繁杂、品类众多,涉及的主体有招标方、投标方、专家组等,招投标环节比较繁琐,中间数据冗余度高、联系度高等特点,详细的梳理了公共资源交易数据的特性和结构。并对本文中涉及的主体信息数据和招投标过程中的相关数据进行了详细的分析和介绍。2.通过公共资源交易过程中所涉及的关键流程和相关的数据进行分析,从领域数据中抽取并设计本体模型。同时,设计知识抽取框架和关键流程,并对关键技术进行了详细的分析和介绍。通过Jena将本体模型生成OWL文件,并通过OWL将数据实例化成RDF文件。最后将知识化后的数据存储在图数据库Neo4j中。3.由于知识图谱构建的过程中,涉及了大量的数据实体节点,以及节点和节点之间的关联规则关系,导致抽取过程中计算效率低下的问题。本文改进了一种基于权值向量矩阵约简的Apriori算法。该方法从数据集合中选择一个子集作为挖掘对象,并对集合中元素赋予权值。将数据信息用布尔矩阵表示,在运算过程中不断约简矩阵结构,提高了频繁项集的生成效率。测试结果表明,该方法利用权值的引入和矩阵约简思想,大大提高了关联规则计算的效率。4.基于上述构建公共资源交易领域的知识图谱,并利用可视化技术,将数据进行可视化的展示。根据软件工程的思想,进行了需求分析、总体设计、详细设计、系统开发和系统测试。