基于机器学习算法的中小企业增值税纳税行为甄别研究

来源 :山东财经大学 | 被引量 : 0次 | 上传用户:lss81
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国市场经济发展的日新月异,中小企业在经济发展大环境下也得到了不断发展壮大。如何对这些中小企业进行合理的税收征管,已经成为税务部门紧切关注的焦点。随着大数据、人工智能和网络信息技术的飞速发展,传统的税务稽查方法亟需创新改进,将企业税收与大数据机器学习算法相融合,利用机器学习分类学习算法不仅可以发现数据背后的更多特征,而且在为实际的纳税征查工作带来便利的同时提升工作效率。因此,如何将中小企业纳税财务信息与其广泛存在的多源纳税行为相关数据相结合,利用大数据机器学习算法对中小企业增值税纳税行为进行智能甄别研究,对强化税收管理监控功能,实现中小企业税务稽查智能化具有重要的实践意义。本文首先在综述了中小企业增值税纳税行为甄别相关概念、理论及方法和文献基础上,按照中小企业增值税纳税行为的“数据获取→数据清洗→数据探索→学习方法建模→结果讨论展示”的数据科学流程开展研究,主要工作和研究结论如下:(1)数据准备与特征选择。首先,以山东省H市中小企业增值税纳税行为为研究对象,收集整理了85家企业2016-2018三年间共244个样本的年度财务报表(企业资产负债表,利润表,现金流量表)和纳税申报表数据,对中小企业增值税纳税行为探索性分析;其次,按70%:30%的比例将样本数据随机划分为训练集和测试集,以便实施机器学习算法建模及验证研究;最后,基于企业盈利能力、企业偿债能力、企业营运能力、企业成长能力和企业现金能力等五个方面概念指标,选取销售利润率、销售成本率、销售净利率等共29个财务指标,构建了中小企业增值税纳税行为甄别指标体系。因变量是中小企业增值税纳税行为,用“0”表示企业纳税行为遵从,用“1”表示企业纳税行为不遵从,数据中共有45条纳税行为不遵从样本。(2)机器学习算法探索及模型集成验证。首先,对样本数据进行缺失值和标准化处理;其次,分别运用logistic回归,决策树,支持向量机三种分类学习算法对样本训练集数据进行单一模型训练试验分类,并基于精度、准确率、召回度和F度量等指标,在测试集上进行综合评判各单一模型的学习效果;最后,将三种分类算法作为基模型,利用Stacking集成方法进行集成学习训练和测试验证,得到预期效果较好的中小企业增值税纳税行为甄别集成模型。论文研究发现,利用logistic回归,决策树,支持向量机等算法建立的单一甄别模型能够取得一定效果,且在三种分类学习算法中,决策树和支持向量机性能较佳;但从精度指标以及AUC结果综合分析发现,多种弱分类基模型的集成能够显著增加模型的表现能力。因此,基于机器分类学习算法的集成模型在中小企业增值税纳税行为甄别智能学习上有着广泛的应用前景。
其他文献
中小民营企业已成为我国经济发展的重要助力,但我国中小民营企业死亡率较高,人才流失严重,股权激励逐步成为了其留住人才、促进企业发展的重要方式。目前我国针对中小民营企业股权激励的案例研究相对较少,本文选取了具有典型中小民营企业特征的DH公司作为研究对象,通过对DH公司股权激励的纵向剖析,着重探讨:(1)中小民营企业在设计和实施股权激励的过程中应该如何去做;(2)股权激励契约要素的设计如何影响中小民营企
改革开放以来,我国的保险行业市场发展呈快速增长态势,国家高度布局和政策支持进一步明确了保险行业在经济社会中的战略定位,使其对市场经济的稳定发展以及助力融入世界经济一体化起到重要作用,社会各界对保险的认可程度稳步提升,保险正是当下最具成长空间和发展前景的行业之一。但目前保险行业鱼龙混杂,外部竞争愈加激烈,各家保险机构在力争业务扩张的同时,也越发关注优化内部管理,例如研究如何通过不断优化公司薪酬体系、
随着我国经济的高速发展,大气污染日益严重。近年来,采暖季频发的雾霾天气已严重影响人们的日常生活。影响空气质量的因素有很多,我国政府已在各行各业开展了大气污染治理行动:针对汽车尾气排放提升了油品质量,针对建筑扬尘出台了专项整治方案,针对居民生活和取暖提出了清洁化治理等。我国作为煤炭储量和生产大国,“去煤化”之路短期内是不现实的,清洁化治理任重道远,民用优质燃煤的推广成为现阶段的过渡手段。民用优质燃煤
注册会计师财务报表审计的质量水平高低在资本市场具有信号传递作用。企业每年都会向外公布财务信息以披露自身的财务状况、经营成果以及现金流量,而这种财务信息是否真实可靠要经过注册会计师的审计,这些审计师较普通人拥有相应的专业能力优势,因此经过事务所审计过的财务报表更加值得投资者的信任,因此审计过程的质量如何也就决定了审计报告的信赖度高低。信用评级,它主要是用来衡量公司偿还债务能力及意愿的一个指标,在债券
投资活动一直以来都是企业经营过程中非常重要的一环,有效的投资决策能够为企业积累财富、提升自身的生产经营能力,也能分散经营风险,从而促进企业的良性发展,而非效率投资行为会直接影响企业的生存与发展,因此投资活动引发了国内外企业的重点关注。但是由于我国市场经济相较于国外起步较晚,目前我国的资本市场还不够健全,政府的监管力度不够强,在我国企业中存在着严重的委托代理冲突和信息不对称问题。在这种环境下,企业内
本报告基于Tevatronic自主灌溉技术公司投资洽谈会交替传译实践项目。2019年5月28日,笔者通过校方和组委会筛选作为译员参与此次洽谈会,负责中英双语交替传译任务。论文分四章。第一章对此次口译任务的分配和需求做简要介绍;第二章对此次口译过程分阶段进行详细描述:首先介绍笔者在译前阶段所做的准备工作;其次阐述在现场交替口译阶段,笔者采用了相关的口译策略并借助视觉化记忆方法协调分配听辨、笔记和转译
当下体育事业蓬勃发展,网球是其中一项备受欢迎的体育运动,一直以来中国网球水平与世界知名选手水平相差较大,世界高排位运动员比例极低,男子网球虽然一直积蓄力量,在排名上也刷新了历史,但是目前仍尚未有重大突破,中国女子网球水平相对于男子网球水平要好一些,但是二者皆有很大的进步空间。人们之所以能够科学、定量的描述某项活动离不开信息技术带来的巨大作用,只有通过信息技术进行描述才能为下一步的决策提供方向,然而
研究员工敬业度对提高组织绩效具有现实意义。因此敬业度作为近几年的新鲜热词,受到各级组织和各大研究机构的重视。特别是医疗卫生服务行业,是关乎广大人民群众切身生命安全的第一要事,社区卫生机构作为基层的医疗卫生机构,其医务人员是社区卫生机构的重要组成部分,被人们称为居民健康的第一守门人,因此,医务人员的基本职业道德素质在社会经济生活中起到至关重要的作用。但是目前的医疗事业还存在着“缺资源、缺技术、缺人才
中国2008年《企业内部控制基本规范》的颁布和《企业内部控制配套指引》在2010年的出台,表明内部控制在公司规范自身行为方面发挥重要作用,强调企业应按照规范严格要求内控信息的对外公布,对审计委员会组成规定了权利义务。随着内部控制信息披露从自愿披露向强制披露转变,内部控制体系的建立和完善再度引起广泛的关注。内控信息披露在治理公司方面作用不可或缺,其作用的发挥也会对内部控制体系的建立和完善起到一定的作
近年来,审计署发布《审计署“十二五”审计工作发展规划》(审办发[2011]112号)和《关于进一步加大审计力度促进稳增长政策措施落实的意见》(审政研发[2015]58号)等文件,强调对中央重大方针政策进行审计监督,保障政策落实到位。中央的重大政策是国家治理体系的重要组成部分,是促进国家发展和社会进步的强大推动力。然而,政策的落实并不容易,存在着“上有政策,下有对策”“土政策”等诸多问题,导致政策执