论文部分内容阅读
现阶段,联网审计在解决因数据量迅速膨胀带来的审计难题方面表现出了很大的优势,且极大地削减了审计成本,因此,在较短的时间内得到迅速推广,逐步取代了传统的审计手段。但是其仍然存在增量提取效率低、对异构审计环境适应能力不足的缺点。除此之外,国家审计有其较强的现实需要,它旨在通过综合分析全国各省市审计数据,在更为宏观的层面上挖掘相关领域的隐含问题,探寻领域发展过程中的各种影响因子,为相关决策的制定、颁布与实施提供有力可靠的数据依据。针对以上两点,本文给出一种部署于多核服务器上的基于任务划分的增量数据提取方法,该方法可以有效利用服务器多处理器的优势,通过遗传算法和序列划分算法保证较高的并行度,采用多进程并行执行任务分组大幅提高了增量提取效率。在此基础上分析当前国家审计的需求,针对目前存在的困难,结合现有联网审计系统研究了面向国家审计的数据集成机制,系统通过文中给出的增量数据提取方法实现数据更新,降低数据传输总量和更新周期。并通过业务同步模块处理各地更新数据,过滤异步数据,保证审计署中心数据仓库中不同地区数据的业务同步。最后,对本文给出的基于任务划分的增量数据提取方案进和面向国家的数据集成系统行实验验证。实验结果表明,面向国家审计的数据集成系统可以实现各省市审计数据的同步物理集成;基于任务划分的增量数据提取方法执行周期明显小于现有方案,加速比达到了49%,较好的完成了研究初衷。