论文部分内容阅读
税务评估是指收税单位运用财税信息依法对监管对象的涉税行为进行评估。金税三期工程加强了大数据纳税风险评估的实施力度,纳税评估系统的信息化得到全面的提升。大数据时代下的税务管理需要结合人工智能技术和数据挖掘算法交叉分析企业纳税数据,实时监控企业的涉税行为。本文将纳税评估系统和机器学习相互融合,创新出了更具智能化的分类算法。首先探讨了税务评估的内涵、特点及目前学术界关于此课题的研究程度。其次介绍了现在机器学习中的五种分类算法及理论知识,并阐述了每种分类算法的好坏及适用的场景。然后,针对重庆市企业房产税数据,我们对数据进行了预处理和清洗,然后利用特征工程挑选了重要指标。本文分别对随机森林、GBDT、XGBOOST和LightGBM算法展开了实证分析。基于LightGBM算法,提出了LightGBM和Logistic混合分类算法,改进了LightGBM算法。最后,对比五种算法的结果,剖析结果产生的原因。本文研究表明,XGBOOST算法在企业房产税纳税评估数据中分类效果最好,GBDT算法的分类效果次之。