数据挖掘技术在税控系统中的研究与应用

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:ciper618
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从国家实行金税工程以来,国家税务管理不断加强,也形成了多项国家标准和规范。从2007年开始,我校税控系统项目组为国家税务局开发针对大型商场的税控系统,并编写了国标七规范,但系统的机制还不是很完善,只是为税收管理提供了技术支持,并不能为国家税务局的提供决策支持。本文针对国税部门在国税征管、监控工作中的实际需要,对数据仓库技术、数据挖掘技术在国税总局网络税控系统中的应用进行了较为系统、深入的研究。本文的研究内容和成果主要有以下四个方面:   (1)介绍了税控系统技术、数据仓库技术、数据挖掘技术、联机分析处理(On-LineAnalysisProcessing,OLAP)等相关技术及数据挖掘技术在国税总局网络税控系统中的应用。   (2)对单属性变化的增量关联规则更新算法的改进。   对关联规则数据挖掘算法进行了重点研究,详细分析了单属性变化的增量关联规则更新算法的不足和性能瓶颈,并在此基础上,结合国税总局税源数据量巨大的特点,提出了相应的改进算法——多属性变化的增量关联规则更新MACA算法,借助属性矩阵和原有的关联规则的频繁项集,通过对新增各项频繁项集和原有频繁项集构造矩阵,然后按列做与运算,解决了多属性变化关联规则快速更新问题和大大减少了运算的时间复杂度。   (3)对决策树挖掘进行了研究本文对决策树算法了研究和总结,结合国家税务部门需要从海量的税源数据中提取有用信息进行决策支持的需要,重点分析了经典决策树算法ID3的优势和不足,并研究了其改进算法C4.5。   (4)设计了网络税控系统数据仓模型和数据挖掘子系统模型。   本文还探讨了网络税控系统数据仓库模型的设计,详细论述了设计国税总局网络税控系统数据仓库的整个过程、构建网络税控系统数据仓库的目的。本文设计了网络税控系统数据仓库的体系结构、概念模型、逻辑模型和物理模型。最后,本文利用在网络税控系统数据仓库的基础上,将多属性变化增量关联规则更新挖掘应用于网络税控系统中,构建了网络税控系统数据挖掘子模型,详细阐述了多属性变化增量关联规则更新和决策树挖掘在税控系统中的应用,包括挖掘目标,算法的实现和挖掘过程等。  
其他文献
对分布式数据流的分析与挖掘正与日俱增地在众多领域变得十分重要,如网络流分析和金融交易分析等。在分布式环境中,将所有数据都传输到一个节点进行处理是不现实的;更加合理
学位
无线局域网(Wireless Local Area Network, WLAN)是20世纪90年代计算机网络技术与移动通信技术相结合的产物,在现实生活中得到广泛应用,满足了人们对于宽带无线接入网络的迫
随着计算机网络技术的不断发展以及多媒体的迅速普及,多媒体应用已经深入到生活的各个领域。在开放的网络环境中,涉密的多媒体信息在传输和存储中的安全是政府部门、企业和个
学位
随着互联网络的快速发展,人类的生活方式正发生着巨大的改变。博客、微博、QQ、社区网站、门户网站等等这些互联网上的新事务让我们能获取更多的信息,学会更多的交流,离开了这些
智能交通系统(Intelligent Transportation System,简称ITS)是目前世界交通运输领域的前沿研究课题,其核心是针对日益严重的交通需求和环境保护压力,采用信息技术、通信技术、计算
学位
随着计算机和互联网的发展,在自然语言处理领域,以双语(或多语)平行语料库为基础的应用日益增多。除机器翻译方面的应用之外,平行语料库的建设对于双语词典编纂、词义消歧和
学位
计算机技术和网络技术得到了不断的发展,计算机系统也从独立的主机发展到复杂的、互联的开放式系统,这种情况导致计算机及网络的入侵问题越来越突出,为了保护系统资源,需要建
本文以数字电视运营行业为背景,研究了数据挖掘技术在数字电视运营支撑管理系统中的应用范围和使用方式。以聚类算法CLARANS为重点,分析了该算法在处理大数据集时所产生的聚
现今的并行编程实践多采用锁等较低的同步机制访问共享资源,这种编程困难且易出错;新引入的原子区构造虽简化了编程,但支持其实现的软硬件技术尚不令人满意。我们课题组就同
随着计算机网络和多媒体技术的飞速发展,信息安全成为全社会的需求,其中信息隐藏技术作为信息安全的重要方面,近年来得到了很大的关注。而由于JPEG图像的广泛应用和它提够的
学位