论文部分内容阅读
摘 要:贵州作为国内率先引入大数据等新兴产业的省份,其经济发展一直以来颇受人们的关注。而财政收入是地方经济发展的重要因素,因此该文将以贵州省财政收入为主要研究对象,收集2004—2019年的相关经济指标并运用Rstudio软件进行数据处理,并做主要变量的描述性统计、相关性分析,通过灰色预测模型对地方财政收入进行预测,得出贵州省2020年和2021年财政收入的预测值,对贵州财将来政收入规划具有一定的参考价值。
关键词:财政收入 描述性统计 相关性分析 灰色预测
中图分类号:F812 文献标识码:A文章编号:1672-3791(2021)07(b)-0187-03
Analysis and Forecast of Fiscal Revenue in Guizhou Province Based on Data Mining Technology
LIU Dewei
(Guizhou University of Finance and Economics, Guiyang, Guizhou Province, 550025 China)
Abstract: As the first province to introduce big data and other emerging industries in China, Guizhou's economic development has always attracted people's attention. Fiscal revenue is an important factor in local economic development. Therefore, this paper will take the fiscal revenue of Guizhou Province as the main research object, collect relevant economic indicators from 2004 to 2019, use Rstudio software for data processing, make descriptive statistics and correlation analysis of main variables, and predict local fiscal revenue through grey prediction model, the predicted financial revenue of Guizhou Province in 2020 and 2021 is obtained, which has a certain reference value for the future financial and political revenue planning of Guizhou Province.
Key Words: Financial revenue; Descriptive statistics; Correlation analysis; Grey prediction
近年來,贵州经济稳步增长,GDP总量从倒数爬升至中等偏下水平,而增速方面已连续10年居于前列,因此贵州的财政收入具备一定的研究意义。关于财政收入预测的研究,众多学者以财政收入来构建多元回归模型,并运用OLS方法估计回归系数,最终通过检验来确定每一种因素对财政收入的贡献度,这种方法对数据依赖较大,存在一定局限性。侯甜甜等学者基于ARIMA和马氏链模型的中国财政收入预测为研究各省财政收入提供了参考[1]。张强等研究者与龙小燕研究者分别运用逐步回归分析方法预测武汉市财政收入并研究了影响因素,这对当地财政政策有很好的指导作用,但是多元逐步回归方法容易局限于局部最优解而不是全局最优解[2-3]。宋良美研究者从VAR模型来对江苏省财政收入和财政支出进行预测和分析[4]。江星等研究者对安徽省财政收入进行多元分析证明实现财政收入的增长主要依靠的是经济的增长[5]。王守英研究者通过模型分析和神经网络对济南市的财政收入进行了预测[6]。丁玮珂等研究者发现第一二三产业对财政收入的影响程度各有不同[7]。综上所述,随着科学和技术的发展与完善,运用新方法对近几年新数据进行研究贵州财政收入是很有必要的。
1 数据探索分析
财政收入的影响因素有许多,有的影响效果强,而有些效果则弱一些,该文根据经济理论以及参考已有研究成果,初步选取13个自变量来分别分析各因素对财政收入(y)的影响,具体见表1。基于数据可得性,该文选取2004—2019年影响财政收入相关变量的数据,数据来源为《贵州统计年鉴》。
1.1 描述性分析
描述性分析是对数据进行整体情况分析,初步了解2004—2019年各种数据的变化程度和增长速度。就上述13个因素从以下几个方面着手分析。
1.1.1 就业和收入方面
社会从业人数(x1)的Min值为1 770.9,Max值为2 186,Mean值为1 929.39,SD值为109.20。由此可见社会就业人数趋于稳定上升趋势,且波动性较小,伴随着经济的持续发展,就业人数稳定增长是一种正向反馈,而就业人数的增多通常也伴随着居民消费的提升,从而提升财政收入;在岗职工工资总额(x2)的Min值为236.6,Max值为2 516.04,Mean值为1 142.02,SD值为771.26。随着贵州省经济的飞速发展,在职工的工资水平也同时得到提升,这不仅有利于人民的生活水平提高,从税收这一层面也反映出了财政收入水平得到了提高;城镇居民人均可支配收入(x4)的Min值为7 322.05,Max值为34 404,Mean值为18 671.19,SD值为8 728.87。可支配收入相比工资总额,能更加直观地反映居民的收入水平,从可支配收入的均值以及标准差来看,其相比工资总额来说波动性更小,也与财政收入水平的关系更为密切。 1.1.2 消费和投资方面
社会消费品零售总额(x3)的Min值为517.56,Max值为4 723.85,Mean值为2 257.69,SD值为1 461.07。同样,消费品零售总额在均值上和在岗职工工资总额保持相差不大的增长趋势,这也能证明财政收入水平得到了提高;全社会固定资产投资额(x7)的Min值为865.23,Max值为17 703.52,Mean值为7 132.19,SD值为6 112.28。固定资产投资额提升幅度较大,为财政收入提供保障;城镇居民人均消费性支出(x5)的Min值为5 494.45,Max值为21 402,Mean值为12 833.23,SD值为5 546.61。消费性支出增速较社消品更小,但波动幅度则较之更大,总体上两者具有较强的关联性;居民消费价格指数(x11)的Min值为98.72,Max值为107.59,Mean值为102.713 75,SD值为2.19,居民消费水平(x13)的Min值为1 946,Max值为19 997.38,Mean值为9 202.98,SD值为5 828.47,由此可以看出居民消费上升速度明显。
1.1.3 产业和税收方面
第一产业值(x9)的Min值为334.5,Max值为2 280.56,Mean值为1 069.67,SD值为700.82;第三产业与第二产业比值(x12)的Min值为0.76,Max值为1.28,Mean值为1.09,SD值为0.14;税收(x10)的Min值为149.29,Max值为2 510.2,Mean值为1 247.66,SD值为822.43。产业的发展对税收的保障作用很强,而税收正是财政收入的重点,从上述数据可以看出第一产业伴随着农业现代化而飞速发展,第二产业与第三产业比值稳步上升,体现为产业结构水平逐步优化,财政收入得到可靠保证。
1.1.4 小结
财政收入(y)的均值和标准差分别为1 525.76和978.34,说明财政收入在逐年上升。由财政收入最小值261.74和最大值3 051.52以及各个经济指标可以看出这十几年间贵州省整体经济水平发生很大变化,结合原始数据也可以看出贵州一直处于稳步发展状态,因此贵州财政收入呈逐年上升趋势。
1.2 相关性分析
根据相关性分析的结果,可以发现社会从业人数(x1)与财政收入(y)的关系不显著;年末人口(x6)、居民消费价格指数(x11)与财政收入(y)均呈现出较弱的负相关关系;而其他变量除了第三产业与第二产业比值(x12)外,剩余变量均与财政收入(y)成高度正向相关关系。
2 模型构建
2.1 Adaptive-lasso变量选择模型
运用LARS算法做Adaptive-lasso的估计,对于给出的每一个γ,在此文取γ=1,这种算法会寻找到一个最优λn。根据R语言编制相应程序运行后的结果显示,在岗职工工资总额(x2)和年末总人口(x6)因素的系数为0,即在模型建立过程中这两个因素就被剔除了。这其中的原因在于在岗职工工资总额(x2)与城镇居民人均可支配收入(x4)、地区生产总值(x8)等因素存在明显的多重共线性;年末总人口(x6)从模型中被剔除的原因是贵州年末人口变化幅度较小,对财政收入影响效果不明显。最终筛选出的影响因素有11个,分别是社会从业人数(x1)、社会消费品零售总额(x3)、城镇居民人均可支配收入(x4)、城镇居民人均消费性支出(x5)、全社会固定资产投资额(x7)、地区生产总值(x8)、第一产业值(x9)、税收(x10)、居民消费价格指数(x11)、第三产业与第二产业比值(x12)、居民消费水平(x13)。
2.2 财政收入模型预测
利用筛选出的11个因素建立灰色预测与神经网络的组合预算模型。这其中社会从业人数(x1)、居民消费价格指数(x11)、第三产业与第二产业比值(x12)的2020—2021年数值通过预测模型得出的预测值与精度等级达不到要求,故被剔除。但是该影响因素理论与实际情况明显相悖,因此该指标预测不达标;居民消费价格指数(x11)对财政收入的传导效应较弱,因此也被剔除;第三产业与第二产业比值(x12)反映产业结构优化,贵州近几年产业变化较大,数据波动大,因此不能稳定影响贵州财政收入,所以也被剔除。剩下的八个指标具体预测精度等级均为“好”。将在2020年和2021年的预测值代入贵州财政收入所建立的模型,得到这两年的预测值分别为3 460.046 0亿元、3 608.095 3亿元,与真实值吻合度较高。
3 结语
通过上述实践,可以看出影响贵州财政因素的众多因素分别社会消费品零售总额(x3)、城镇居民人均可支配收入(x4)、城镇居民人均消费性支出(x5)、全社会固定资产投资额(x7)、地区生产总值(x8)、第一产业值(x9)、税收(x10)、居民消费水平(x13)。结合具体经济情况,贵州省2020年全省地区生产总值达到1.78万亿元,总量在全国上升5位,人均上升4位,相比2019年增幅依然可观。然而基数小、人均低、产业结构落后等一系列问题亟需改善。贵州财政收入是贵州经济稳步发展的重要经济来源,因此,从影响财政收入的众多因素入手,贵州政府需要鼓励各家企业提高贵州居民就业质量,提高城镇居民可支配收入,从而能有效促进居民人均消费性支出;增加贵州第一产业投资力度,在提升贵州经济发展的同时合理增加第一产业只能有效增进税收,从而提升贵州地方财政收入;加大投资社会固定资产,有效提升贵州经济活动质量,从而推动居民消费水平上升;在实现社会消费品零售总额大幅上升前需要提高居民可支配收入,鼓励居民消费性支出。为此,政府及企业要着眼于推动贵州经济高质量发展,集中力量专攻旅游产业、新兴产业,实现农业现代化,加快新型城镇化。
参考文献
[1] 侯甜甜,杨丛,詹炳欢.基于ARIMA和马氏链模型的中国财政收入预测[J].平顶山学院学报,2020,35(2):6-11,42.
[2] 张强,董雪.武汉市财政收入分析预测模型探究[J].现代信息科技,2019,3(2):87-88,91.
[3] 龙小燕.我国宏观调控中财政政策与货币政策协调配合研究[D].北京:中國财政科学研究院,2019.
[4] 宋良美.基于VAR模型的江苏省财政收入和财政支出预测[J].徐州工程学院学报:社会科学版,2020,35(1):48-58.
[5] 江星,于朝梅,田元霞.安徽省财政收入主要影响因素的计量经济学分析[J].环渤海经济瞭望,2020(11):77-78.
[6] 王守英.基于数据挖掘的财政收入预测研究——以济南市为例[D].济南:山东师范大学,2020.
[7] 丁玮珂.广西:新常态下地区财政收入影响因素的实证[J].区域治理,2020(2):8-11.
关键词:财政收入 描述性统计 相关性分析 灰色预测
中图分类号:F812 文献标识码:A文章编号:1672-3791(2021)07(b)-0187-03
Analysis and Forecast of Fiscal Revenue in Guizhou Province Based on Data Mining Technology
LIU Dewei
(Guizhou University of Finance and Economics, Guiyang, Guizhou Province, 550025 China)
Abstract: As the first province to introduce big data and other emerging industries in China, Guizhou's economic development has always attracted people's attention. Fiscal revenue is an important factor in local economic development. Therefore, this paper will take the fiscal revenue of Guizhou Province as the main research object, collect relevant economic indicators from 2004 to 2019, use Rstudio software for data processing, make descriptive statistics and correlation analysis of main variables, and predict local fiscal revenue through grey prediction model, the predicted financial revenue of Guizhou Province in 2020 and 2021 is obtained, which has a certain reference value for the future financial and political revenue planning of Guizhou Province.
Key Words: Financial revenue; Descriptive statistics; Correlation analysis; Grey prediction
近年來,贵州经济稳步增长,GDP总量从倒数爬升至中等偏下水平,而增速方面已连续10年居于前列,因此贵州的财政收入具备一定的研究意义。关于财政收入预测的研究,众多学者以财政收入来构建多元回归模型,并运用OLS方法估计回归系数,最终通过检验来确定每一种因素对财政收入的贡献度,这种方法对数据依赖较大,存在一定局限性。侯甜甜等学者基于ARIMA和马氏链模型的中国财政收入预测为研究各省财政收入提供了参考[1]。张强等研究者与龙小燕研究者分别运用逐步回归分析方法预测武汉市财政收入并研究了影响因素,这对当地财政政策有很好的指导作用,但是多元逐步回归方法容易局限于局部最优解而不是全局最优解[2-3]。宋良美研究者从VAR模型来对江苏省财政收入和财政支出进行预测和分析[4]。江星等研究者对安徽省财政收入进行多元分析证明实现财政收入的增长主要依靠的是经济的增长[5]。王守英研究者通过模型分析和神经网络对济南市的财政收入进行了预测[6]。丁玮珂等研究者发现第一二三产业对财政收入的影响程度各有不同[7]。综上所述,随着科学和技术的发展与完善,运用新方法对近几年新数据进行研究贵州财政收入是很有必要的。
1 数据探索分析
财政收入的影响因素有许多,有的影响效果强,而有些效果则弱一些,该文根据经济理论以及参考已有研究成果,初步选取13个自变量来分别分析各因素对财政收入(y)的影响,具体见表1。基于数据可得性,该文选取2004—2019年影响财政收入相关变量的数据,数据来源为《贵州统计年鉴》。
1.1 描述性分析
描述性分析是对数据进行整体情况分析,初步了解2004—2019年各种数据的变化程度和增长速度。就上述13个因素从以下几个方面着手分析。
1.1.1 就业和收入方面
社会从业人数(x1)的Min值为1 770.9,Max值为2 186,Mean值为1 929.39,SD值为109.20。由此可见社会就业人数趋于稳定上升趋势,且波动性较小,伴随着经济的持续发展,就业人数稳定增长是一种正向反馈,而就业人数的增多通常也伴随着居民消费的提升,从而提升财政收入;在岗职工工资总额(x2)的Min值为236.6,Max值为2 516.04,Mean值为1 142.02,SD值为771.26。随着贵州省经济的飞速发展,在职工的工资水平也同时得到提升,这不仅有利于人民的生活水平提高,从税收这一层面也反映出了财政收入水平得到了提高;城镇居民人均可支配收入(x4)的Min值为7 322.05,Max值为34 404,Mean值为18 671.19,SD值为8 728.87。可支配收入相比工资总额,能更加直观地反映居民的收入水平,从可支配收入的均值以及标准差来看,其相比工资总额来说波动性更小,也与财政收入水平的关系更为密切。 1.1.2 消费和投资方面
社会消费品零售总额(x3)的Min值为517.56,Max值为4 723.85,Mean值为2 257.69,SD值为1 461.07。同样,消费品零售总额在均值上和在岗职工工资总额保持相差不大的增长趋势,这也能证明财政收入水平得到了提高;全社会固定资产投资额(x7)的Min值为865.23,Max值为17 703.52,Mean值为7 132.19,SD值为6 112.28。固定资产投资额提升幅度较大,为财政收入提供保障;城镇居民人均消费性支出(x5)的Min值为5 494.45,Max值为21 402,Mean值为12 833.23,SD值为5 546.61。消费性支出增速较社消品更小,但波动幅度则较之更大,总体上两者具有较强的关联性;居民消费价格指数(x11)的Min值为98.72,Max值为107.59,Mean值为102.713 75,SD值为2.19,居民消费水平(x13)的Min值为1 946,Max值为19 997.38,Mean值为9 202.98,SD值为5 828.47,由此可以看出居民消费上升速度明显。
1.1.3 产业和税收方面
第一产业值(x9)的Min值为334.5,Max值为2 280.56,Mean值为1 069.67,SD值为700.82;第三产业与第二产业比值(x12)的Min值为0.76,Max值为1.28,Mean值为1.09,SD值为0.14;税收(x10)的Min值为149.29,Max值为2 510.2,Mean值为1 247.66,SD值为822.43。产业的发展对税收的保障作用很强,而税收正是财政收入的重点,从上述数据可以看出第一产业伴随着农业现代化而飞速发展,第二产业与第三产业比值稳步上升,体现为产业结构水平逐步优化,财政收入得到可靠保证。
1.1.4 小结
财政收入(y)的均值和标准差分别为1 525.76和978.34,说明财政收入在逐年上升。由财政收入最小值261.74和最大值3 051.52以及各个经济指标可以看出这十几年间贵州省整体经济水平发生很大变化,结合原始数据也可以看出贵州一直处于稳步发展状态,因此贵州财政收入呈逐年上升趋势。
1.2 相关性分析
根据相关性分析的结果,可以发现社会从业人数(x1)与财政收入(y)的关系不显著;年末人口(x6)、居民消费价格指数(x11)与财政收入(y)均呈现出较弱的负相关关系;而其他变量除了第三产业与第二产业比值(x12)外,剩余变量均与财政收入(y)成高度正向相关关系。
2 模型构建
2.1 Adaptive-lasso变量选择模型
运用LARS算法做Adaptive-lasso的估计,对于给出的每一个γ,在此文取γ=1,这种算法会寻找到一个最优λn。根据R语言编制相应程序运行后的结果显示,在岗职工工资总额(x2)和年末总人口(x6)因素的系数为0,即在模型建立过程中这两个因素就被剔除了。这其中的原因在于在岗职工工资总额(x2)与城镇居民人均可支配收入(x4)、地区生产总值(x8)等因素存在明显的多重共线性;年末总人口(x6)从模型中被剔除的原因是贵州年末人口变化幅度较小,对财政收入影响效果不明显。最终筛选出的影响因素有11个,分别是社会从业人数(x1)、社会消费品零售总额(x3)、城镇居民人均可支配收入(x4)、城镇居民人均消费性支出(x5)、全社会固定资产投资额(x7)、地区生产总值(x8)、第一产业值(x9)、税收(x10)、居民消费价格指数(x11)、第三产业与第二产业比值(x12)、居民消费水平(x13)。
2.2 财政收入模型预测
利用筛选出的11个因素建立灰色预测与神经网络的组合预算模型。这其中社会从业人数(x1)、居民消费价格指数(x11)、第三产业与第二产业比值(x12)的2020—2021年数值通过预测模型得出的预测值与精度等级达不到要求,故被剔除。但是该影响因素理论与实际情况明显相悖,因此该指标预测不达标;居民消费价格指数(x11)对财政收入的传导效应较弱,因此也被剔除;第三产业与第二产业比值(x12)反映产业结构优化,贵州近几年产业变化较大,数据波动大,因此不能稳定影响贵州财政收入,所以也被剔除。剩下的八个指标具体预测精度等级均为“好”。将在2020年和2021年的预测值代入贵州财政收入所建立的模型,得到这两年的预测值分别为3 460.046 0亿元、3 608.095 3亿元,与真实值吻合度较高。
3 结语
通过上述实践,可以看出影响贵州财政因素的众多因素分别社会消费品零售总额(x3)、城镇居民人均可支配收入(x4)、城镇居民人均消费性支出(x5)、全社会固定资产投资额(x7)、地区生产总值(x8)、第一产业值(x9)、税收(x10)、居民消费水平(x13)。结合具体经济情况,贵州省2020年全省地区生产总值达到1.78万亿元,总量在全国上升5位,人均上升4位,相比2019年增幅依然可观。然而基数小、人均低、产业结构落后等一系列问题亟需改善。贵州财政收入是贵州经济稳步发展的重要经济来源,因此,从影响财政收入的众多因素入手,贵州政府需要鼓励各家企业提高贵州居民就业质量,提高城镇居民可支配收入,从而能有效促进居民人均消费性支出;增加贵州第一产业投资力度,在提升贵州经济发展的同时合理增加第一产业只能有效增进税收,从而提升贵州地方财政收入;加大投资社会固定资产,有效提升贵州经济活动质量,从而推动居民消费水平上升;在实现社会消费品零售总额大幅上升前需要提高居民可支配收入,鼓励居民消费性支出。为此,政府及企业要着眼于推动贵州经济高质量发展,集中力量专攻旅游产业、新兴产业,实现农业现代化,加快新型城镇化。
参考文献
[1] 侯甜甜,杨丛,詹炳欢.基于ARIMA和马氏链模型的中国财政收入预测[J].平顶山学院学报,2020,35(2):6-11,42.
[2] 张强,董雪.武汉市财政收入分析预测模型探究[J].现代信息科技,2019,3(2):87-88,91.
[3] 龙小燕.我国宏观调控中财政政策与货币政策协调配合研究[D].北京:中國财政科学研究院,2019.
[4] 宋良美.基于VAR模型的江苏省财政收入和财政支出预测[J].徐州工程学院学报:社会科学版,2020,35(1):48-58.
[5] 江星,于朝梅,田元霞.安徽省财政收入主要影响因素的计量经济学分析[J].环渤海经济瞭望,2020(11):77-78.
[6] 王守英.基于数据挖掘的财政收入预测研究——以济南市为例[D].济南:山东师范大学,2020.
[7] 丁玮珂.广西:新常态下地区财政收入影响因素的实证[J].区域治理,2020(2):8-11.