联网审计中增量数据处理技术的研究与应用

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:shiweifeng15
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会保障计算机审计的逐渐铺开,由于数据量的不断增大,审计方案的不断改进等因素,在目前和将来的应用中,对于增量数据的处理、存储、识别以及传输,将逐渐成为国内外学者关注的热点领域。而联网审计工作需要打破地域限制,通过远端部署就能够开展审计工作;同时为了能及时了解社保数据不同阶段的变化情况,以便预测审计结果,增量数据的提取与识别更成为一个不容忽视的问题。本文结合已有的国内外对于增量数据的提取技术,如基于数据库自带的日志解析法、时间戳法、基于快照法、基于触发器法、基于API法以及基于变更轨迹表法等方法,提出了基于多线程技术的改进型影子表法(multi-threadbased improved shadow table),适用于多种类型的数据库中的增量数据提取。根据该方法,本文初步实现了增量数据处理系统,包括:数据转换模块、核心对比模块、指令设置模块以及结果显示模块四部分。在充分考虑了提高系统的可扩展性的前提下,采用java语言实现,增量数据、设置参数传输采用txt文本格式,允许系统管理员和审计人员对系统进行设置;同时,为了适应审计业务的需要,本增量提取系统可以由审计人员任意选择增量提取的属性,并可根据具体情况停止增量识别与提取;审计人员、软件的所有操作将被记录到日志中。最后,本文利用黑龙江省某市的真实数据,将本软件部署于审计机关的设备上,对本方法进行了测试,基本满足了联网审计业务的要求,实现了高效的信息交换并增加了审计灵活性。
其他文献
词语对齐的目标在于指明平行文本片段之间的对应关系,最早是作为统计翻译模型的中间产物而被提出。在英汉词对齐技术研究中,词形、语义、句法的多样性和灵活性,未登录词及分
随着计算机技术的迅速发展,信息资源的异构性在各行各业的信息管理系统中无处不在,形成了大量的信息孤岛。电力行业作为国民经济的基础产业,在国民经济和社会发展中发挥着重
目前,基于先进的互联网和多媒体技术的网络教育,较以前的教育模式有很大的进步。随着新世纪的来临,终身教育成为现代社会的需要。要真正解决和实现教学在任何时间、任何地点进行
织物染色是提高纺织服装产品附加值的关键行业,也是纺织行业的发展和技术水平的综合体现,而配色又是染色行业中至关重要的一个环节。传统的配色过程工作量大,费时费料,而且还
在非易失性存储器中,主流的NAND闪存由于吞吐性能好,能量消耗低,数据存储稳定,成为了数据存储领域的一种重要的存储媒介。多级存储单元(MLC)技术通过提高闪存单元存储密度来
随着互联网中信息量的不断增长,搜索引擎已经成为人们快速获取有效信息的重要手段,是人们日常生活中必不可少的工具之一。但是单一搜索引擎能够检索到的信息量有限;而且有多
在对高维数据的处理中,若不考虑数据降维的问题,会导致数据量大,计算复杂,难以提取有价值的信息等问题,因此,高维数据的特征提取是数据挖掘中重要的数据预处理问题。高维数据
随着多媒体的高速发展,对嵌入式处理器处理音视频的能力要求也越来越高,而嵌入式多核处理器上的并行编程成为了开发过程中的一大难题。如何从另一个角度突破并行编程的牢笼,
随着语义网研究的发展和技术的不断进步,新的语义网应用不断涌现,越来越多的语义网数据被在线发布。截至2009年,语义网搜索引擎Sindice报告已经索引了超过4000万个语义网文档。
在大型现代企业中各部门使用不同的信息管理系统存储和使用数据。如何通过一个公共的数据转换平台,在保持遗留应用系统独立业务和应用风格不变的前提下,能够以统一风格的操作