面向审计风险管理的聚类算法研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:sailordong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是数据挖掘中一种深层次的数据分析方法,在数据探索、识别数据的内在结构和经济分析等方面具有极其重要的作用,已成为数据挖掘、统计学和机器学习等领域的重要研究方向。聚类可以较好地发现数据中潜在的规律和联系,将其应用于审计风险管理的研究中,能给审计人员提供审计依据和判断,对提高审计效率和结果质量、降低审计风险和改善审计风险管理环境都具有重要作用。因此,深入研究聚类技术在审计风险管理中的应用将具有较高的理论意义和十分重要的应用前景。   本文比较全面地介绍了聚类在审计风险管理应用的研究现状,总结了聚类和审计风险管理的基本概念及知识体系,并重点探究了审计风险管理中的数据疑点和抽样风险对审计工作产生的影响,提出了一种基于聚类技术的解决方案。结合相关研究成果,设计并实现了一个基于聚类的审计挖掘系统。   论文的主要研究成果包括以下几个方面:   1、总结了数据挖掘及聚类在审计风险管理中的研究现状,详细介绍了聚类和审计风险管理的知识体系,探讨了聚类技术在审计风险管理中的应用。   2、深入分析了划分算法K-means和层次算法CURE,提出了一种基于划分和层次的混合动态聚类算法。该算法首先使用划分聚类快速生成一定数量的子簇,然后根据整体相似度对测试样本进行自动聚类,并适时剔除孤立点。实验表明该方法具有较高的准确率,并能够有效地减少样本训练时间。   3、针对抽样审计方法在大规模数据集特征不明显情形下对审计风险评估不可靠的问题,将聚类技术引入到分层抽样中,提出了一种基于聚类技术的审计分层抽样算法。该算法通过改进聚类算法中的K-means算法,对审计抽样中的分层抽样算法进行优化,在保证层次抽样数据代表性的前提下,不但缩小审计抽样的样本量,缩短审计抽样的时间,而且降低审计风险,提高审计效率。   4、在分析了Java平台组件开发技术的基础上,综合所提出的改进算法,设计并实现了一个基于J2EE多层体系结构的审计数据挖掘系统。该系统功能包括数据的提取、数据预处理、聚类分析挖掘和挖掘结果的表示等。  
其他文献
随着互联网技术突飞猛进的发展,网络规模正以指数级增长。为了更加快捷的找到所需的信息,而不被庞大无序且结构类型多样的信息海洋所淹没,智能搜索已成为人们获取信息的主要
网络安全问题日益凸显,个人防火墙是保护主机安全的最主要手段之一,防火墙的过滤规则是防火墙的安全防护功能实施的重要依据,过滤规则的动态生成是体现防火墙智能化的重要方
随着数据挖掘技术及网络技术的快速发展,数据发布中如何解决信息共享和隐私保护问题成为了重要的研究内容。数据发布中常常会涉及到相关敏感属性,将现有的敏感属性隐私保护方
随着城市化步伐的加快,传统的抄表收费方式已不能满足需求。传统方式不仅费时费力,准确性低,而且不能联网使得信息反馈不及时,造成行业部门的一些重要经济指标(如产销率等)无
随着P2P网络在电子商务交易中应用研究的深入,交易的安全问题日渐突出。针对这一问题,国内外的研究者们提出了许多信任模型,都各有利弊。其中基于贝叶斯网络的信任模型研究的
随着互联网的飞速发展,Internet上的Web服务数量正在急剧增长。Web服务发现的任务就是要从数量庞大的服务群中找到满足用户需求的服务,其核心技术包括服务描述语言和服务匹配
随着云计算技术的快速发展,各种基于云平台的新型Web服务不断被提出,为了实现跨平台性,基于JavaScript语言的B/S模式是这些服务的主要交互方式。而且用户可以使用浏览器直接
医疗保险是将发生保险合同约定的医疗行为作为给付保险金的先决条件,向被保险人提供在接受诊疗期间所产生的医疗费用支出的保险保障服务。可以保障患者因为就医带来的经济损失得以补偿。医疗保险是国家为了服务人民生活、保障人民健康的而设立的重要举措,涉及到每个参保人的切身利益。在利好的同时也客观存在着利益的驱使,医保欺诈行为成为与保险相伴的长期问题,各种欺诈行为屡见不鲜,新的欺诈手段也是层出不穷,流失的保险金是
随着XML数据的可扩展性和自我描述性的日益发展,越来越多的开发者将其视为网络数据传输的主要形式。XML文件本质上是保存信息的结构化载体,它对自身数据库的处理能力是有限的。
需求变更影响应用程序的开发成本和工作效率,快速应对需求变更是当今软件开发的必然要求。为了实现资源的数字化管理,开发了智能能耗监测系统,通过该系统提高了资源的利用效