基于数据挖掘的税源分析关键技术研究

被引量 : 0次 | 上传用户:gyk0088
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着税务部门信息化建设水平的不断提高,各级税务部门积累了大量的业务数据,但是这些数据却成了“信息孤岛”,缺乏有效的集成,使得数据库中积累了大量的历史数据,然而不断又有新的数据甚至是与原有数据相重复的数据不断的进入数据库,这既增加了税务工作人员的工作量,又使得纳税户重复填写资料,造成纳税户的不满,这就使得大量的数据得不到运用而只能浪费。如何充分利用这些宝贵的数据,从中总结出税收工作的发展规律,为税收管理、政策制定提供依据,是税收信息化发展过程中面临的一个重大课题。同时,税务管理任务从粗放型管理向精细型管理的转变也必须采用一些先进的分析手段,为管理者和决策者提供统一的应用服务系统。建设税务分析系统对实现税务信息现代化有着重要的意义。然而目前的税务分析系统只局限于数据库的管理,如何分析多年来积累的海量数据为税务决策提供事实依据,至今在税务分析系统中没有实现。针对这一问题,本文以柳州市国税局的数据为研究对象,重点讨论税务数据仓库系统的建设,并与数据挖掘技术相结合,获取税源管理的一般规律,提高税源管理的水平。本文主要研究工作如下:⑴在充分研究税收业务和现有税务管理信息系统的基础上,研究了建设税务数据仓库的方法和步骤,设计了税务数据仓库的数据模型和体系结构。⑵研究各种建立数据仓库时数据预处理中的数据清理、转换和加载的方法和策略,规范了业务的日常操作,实现了在一个数据平台上获取数据。⑶分析研究了数据仓库的逻辑设计和物理设计,建立了税务数据仓库系统。并在已建立的税务数据仓库基础上建立OLAP立方体,系统提供了多角度、多层次查询分析数据的功能,可以实现制作动态报表,减轻了以往人工统计分析的工作量。⑷利用关联规则算法对税务数据仓库中数据进行挖掘,获得与税负率有关的重要参数,找到不符合挖掘出的关联规则的纳税户,对其进行重点监控,得出供税务各级领导分析和决策的信息,从而指导税收工作。针对目前采用的关联规则算法主要使用Apriori算法计算量大,所需时间长的特点,使用改进的FP-growth算法。本研究初步建立了柳州市税务系统的数据仓库,并对其进行了统计分析,挖掘了与税负数据有关的关联规则,同时指出税务数据仓库的下一步工作以及本文的不足之处。
其他文献
在塔西佗的作品系列中,《关于演说家的对话》占据着特殊位置,在该文中,塔西佗借助演说术的讨论,充分展现了罗马时期哲学与宗教的冲突。如何理解《对话》,对于把握塔西佗本人
旋流煤粉燃烧器因为能够形成较大的中心回流区,卷吸高温烟气,促进煤粉的着火和稳燃,在工程上得到了广泛的应用。燃烧器内发生着多相流、燃料分解、燃烧等复杂的物理化学过程
江门中微子实验(JUNO)中心探测器用到2万吨液体闪烁体(液闪),工程期间液闪将采用不锈钢材料作为存储容器,不锈钢容器在太阳下放置会达到较高的温度。因此研究液闪在不锈钢容
<正>近两年,随着消费者购买习惯的改变,我国电子商务发展十分迅速,网上商品订购的激增以及消费者对"用户体验"高要求也随之而来,这使得运营商的仓储管理与物流效率成为电商企
企业传统的以权责发生制为基础、事后控制的绩效管理系统,虽能总结过去决策活动的执行结果,但不能很好的对活动进行管理并对未来进行预测,这是企业短视行为的重要诱因。基于
本文对某印染厂的一台型号为YLW6000-AII的500万大卡导热油锅炉的高温烟气的余热回收问题展开了研究与讨论,考虑到该厂印染设备需大量蒸汽,提出了利用热管式余热锅炉回收余热
本研究采用数字大小判断任务,通过四个实验系统探讨了正负数混合呈现对负数数字-空间联结SNARC效应的影响,结果发现:(1)在负数单独呈现条件下,出现了反转SNARC效应;(2)在负数
互联网时代,随着教育信息化的深入发展,慕课这一全新的教育理念和教育技术已经成为高校课程教学改革的热点。该文围绕慕课教学模式,通过课程设置与知识体系构建、教学形式的
佳木斯市郊区自1984年土壤普查以来,土壤有机质状况已经发生了明显的变化。通过分析佳木斯市郊区土壤有机质含量情况,为指导土壤有机质提升工作提供技术支撑。
在藏区每年都要举行各种各样的宗教仪式,举行这些仪式的目的,是为了祭供神灵和鬼怪,从而得到神灵的佑助而获得菩提果位。供奉者也想通过祭供,禳灾除难,吉祥平安。“朵玛”祭