面向审计领域的关联规则分析技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:javaer0128
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则是数据挖掘领域一个重要的研究课题,其目的就是在数据库中发现数据项之间的隐含关联。在研究正、负关联规则挖掘的基础上,将挖掘算法应用于社保审计领域,获得隐含在审计数据中的特征影响因子,进而挖掘审计数据项间带有负项的关联规则,分析其内在的审计意义,将有助于审计方法的改进。本文在总结国内外相关领域研究成果的基础上,介绍了数据挖掘和关联规则的基本理论,包括数据挖掘的基本流程、关键技术、关联规则的分类方法以及正、负关联规则的基本概念,并结合多种知识探讨关联规则的正确性问题;对结构化数据的预处理问题,在总结和深入研究的基础上,对数据清理和转换问题进行了探讨;针对审计特征影响因子挖掘问题,提出了一种基于散列表的挖掘算法:MHP算法,从而将频繁项集挖掘与审计特征影响因子发现过程相结合,并应用于社保审计数据集,对算法的性能和挖掘结果进行分析;分析了正、负关联规则挖掘算法中的一种典型挖掘算法:PNARC算法,针对算法中不足之处,提出了一种基于最小相关度和双重置信度的PNAR_M算法,并对算法的性能进行了实验验证;将两种算法应用于审计数据集,挖掘审计数据间带有负项的关联规则,并对挖掘结果进行解释,最终阐述其在审计上的重要意义。
其他文献
论文由五部分所组成,分别从自然图像铅笔画效果生成技术的研究现状、理论模型、算法实现细节、本文的创新工作及结论与展望等方面进行了阐述。  (1)研究现状。计算机图形学
随着技术的进步,知识的积累,越来越多的丰富资源不断地被加入到网络中,使得通过网络就可访问的数据量呈现巨大的增长。尤其是在近一二十年的时间内,随着各种商业应用的广泛推
随着我国市场经济的快速发展,商标图像需求量不断增加,而传统的以基于分类码并且以大量人力为代价的检索方法日益不能解决当前商标注册的矛盾。目前处于研究热点和难点的基于
近年来,医疗诊治事故不断发生,分析其原因主要表现在过度医疗和错误医疗上,而目前医院也并没有找到解决其问题的方法。在本研究中我们提出基于E-Health协同平台的医疗诊治行为检
分布式计算机软件系统已经与人类的生活和生产密不可分,随着应用的不断扩展,系统软件的复杂性越来越高,维护管理和保障其功能可信性也日渐艰难。一些系统故障、操作失误甚至
随着计算机科学的迅速发展和现代大型高速计算机的出现,数值分析和科学计算日益在工程问题中扮演着越来越重要的角色。而非线性偏微分方程作为微分方程的一个重要分支,在流体力
子图同构是图论中一个重要问题,对这个问题的研究不仅具有计算复杂度理论上的价值,同时也有着广泛应用,尤其在生物信息学和模式识别等领域中,很多基础的问题其实都可以转化成
社会网络异常检测(SNCD)是一门新兴的研究领域,它综合了社会学、统计学等多种不同学科的知识。利用社会网络异常检测深入理解社会网络变化对于突发事件的预防有着重要的意义。由
Internet的迅猛发展和普及为流媒体业务发展提供了强大的市场动力。流媒体技术广泛用于多媒体新闻发布、网络广告、在线直播、电子商务、远程教育、实时视频会议等互联网信息
Web服务器在当今Internet服务架构中起着重要的作用,它负责接收和处理用户发送的请求。Web服务器是否合适、高效直接决定了Internet的服务水平。所以要确保网络服务能力,首先