大数据背景下数据挖掘算法在税源管理中的应用

来源 :集美大学 | 被引量 : 0次 | 上传用户:tina_lh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“大数据”已经成为了当下流行的新词之一,商务大数据、医疗大数据、政务大数据……。如何能在大数据背景下,利用掌握的数据和相关技术手段,区别和筛选不同类别的税源,可以为税源管理提供极大的借鉴意义,也能为加强税源管理所需要面临和解决的问题提供决策参考。本文运用大数据分析的K-means数据挖掘技术,对以沪市上市的制造业公司的财务数据进行了分析,从相关性分析出发在经过主成分分析,这两个分析都是为了去除数据中相关性比较高的自变量,筛选有利于进行聚类分析的财务数据,最终得到了企业所得税、经营性现金流量净额、总资产、应交税费四个维度变量。这四个变量相互之间影响较小适合进行聚类分析。在实际聚类分析后,通过结果可以看到对433家上市公司准确的分成了三类,相互之间几乎没有重合,拟合效果较好。然而,对于具体分类的特征得到的结果,远远没有得到应有的解读。对于聚类结果的有效解读,才能更为合理的服务于税源管理。本文主要由六个部分构成:第一部分是引言,通过对当前大数据背景下数据挖掘技术在税源管理中的应用分析,提出了聚类分析应用于税源管理的构想。第二部分介绍了数据挖掘的的概念和聚类分析的原理,为后续的写作做一个理论铺垫。第三部分介绍了税源管理的现状和作用等基础理论。第四部分进行了相关性分析、主成分分析和聚类分析,提出了应用于税源管理的数据挖掘技术的实际应用。第五部分是基于第四部分基础上得到的变量的进一步讨论,分别从财务视角的企业所得税、经营性现金流量净额、总资产、应交税费四个维度变量分析了进行税源管理的方法以及可能存在的问题。第六部分是结论。主要结论有以下四个方面:第一、找到了一种监管企业税收的方法;第二、简化了税源管理的指标;第三、提供一种税源管理的思路;第四、建立完善的税务数据库非常必要。本文的一个可能的创新在于可以通过选取较少的财务数据实现聚类分析的目的,省去了研究繁琐财务数据的麻烦。另一个可能的创新在于找到了一种监管企业税收的方法,既将目标企业加入样本集合中,通过检查异常值的方法判断企业是否正常纳税。
其他文献
物联网作为一个新概念,目前正受到业界的热烈追捧;作为一个全新的产业,无论对经济还是社会都有着重大影响,其发展也时刻受到世界的关注。伴随M2M/NFC//RFID/NGN/SOA/无线宽带
结合桂林电子科技大学实验教学示范中心的建设实践,针对激励及考核制度、实验教学改革与创新、学科竞赛指导、交流培训等环节对实验技术队伍的建设进行了详细阐述。
<正>提起园林城市或者森林城市,人们自然而然地会认为这一定是一座环境优美、宜业宜居的城市。的确,园林城市、森林城市都以大量绿色植被尤其是木本植物为主体构成生态体系,
随着时代的发展,舞蹈教学已逐年趋于低龄化,幼儿舞蹈教师队伍建设、幼儿舞蹈教学研究的课题等突出问题也摆在我们面前。如何才能使现阶段不太成熟、专业标准模糊、教法背离幼
习近平总书记提出要着力开展森林城市建设,将森林城市上升为国家战略,为我国森林城市的发展提供了前所未有的良好机遇。对我国最新的国家宏观政策和战略规划进行了梳理和总结
运用创新思维,以城市自然特点、资源环境状况、经济社会发展和历史文化为基础,通过聚焦多元化的生态空间、生态公共服务供给、森林城市的文化标识等,阐述森林城市的特色化建
森林城市是现代城市发展的新趋势,"国家森林城市"建设是我国城市建设的重要内容。景观格局理念作为景观生态学的核心理论对于森林城市的创建具有十分重要的作用。简略论述了
失地农民由农村进入城市,由于生活环境的改变,自身的弱势地位,社会配套设施的不足等原因的存在,使失地农民出现了生存的危机感、工作的挫折感、被歧视感等心理问题。并且,失
<正>三峡工程作为跨世纪的国家重点工程,近年来始终坚持践行科学发展观。我们通过在三峡总公司一年的挂职锻炼,深深地感受到:三峡工程不仅创造了世界工程史上的一流业绩,而且
随着人口老龄化问题的日益加重,与衰老相关的研究逐渐为众多学者所重视。衰老相关疾病动物模型在衰老研究中有着十分重要的价值,目前常用的衰老相关疾病模型有自然衰老模型、