福建省财政收入分析
【摘 要】
针对问题一,我们收集了2005-2014年的相关数据,用SPSS做出逐步回归线性拟合。只要通过了判决系数或显著性的检验,那么所得到的线性回归模型中包含的变量就是我们所要求的关键影响因素。检验之后我们发现,无论是哪种财政收入,都是将死亡率、自然增长率、第一产业值、第一产业比重、第一产业增长率、第三产业值、第三产业比重、第三产业增长率、人均地区生产总值增长率这九个指标变量作为影响财政收入 的关键影响因素。
针对问题二中所收集的数据只有10组,数据量较少,并且通过作图可知四组财政收入均可作为是指数函数。因此我们采用了灰色预测分析中的GM(1,1)预测模型[1]对2015年的各类财政收入进行预测。得出2015年全年公共财政总收入预测值为:5197.7亿元;地方公共财政收入预测值为:3350.4亿元;省国税总收入预测值为:3116.1亿元;全省地税总收入预测值为:3411.2亿元。
针对问题三,由于我省84个设区县的划分是从2011年开始实行的,为了使数据更准确,避免偶然因素造成不必要的误差,所以我们选取了2011到2013的各设区县的财政收入数据,对这一数据进行聚类分析。我们划分类别的标准是使各类均值在总体均值上下,这样就可以将84个设区县分为6类,平潭综合实验区所属的类别为处在总体均值水平的第二类
针对问题四,我们从财政收入规模(利用财政收入集中率衡量)、收入部门结构(用三大类产业比例影响做说明)、收入来源(主要是对税收的疏漏进行分析)这三个这几个方面对我省的财政收入做出分析并提出如要保证财政收入集中率比值等等建议。对于支出,根据福建省从2008年到2013我省的财政支出去向数据,我们从中看到文化领域的失衡,以此提出建议。另外从收支平衡情况我们也可以看到大约是保持在一个比例的,因此我们只是做个提醒,在特殊的情况下,可打破这个比例。
关键字:逐步线性回归、最小二乘法、Q型聚类分析、灰色预测分析、相关性检验
1
一、问题重述
福建省现9个地级市福州、莆田、泉州、厦门、漳州、龙岩、三明、南平、宁德,和1个平潭综合实验区。 2014年末全省常住人口3806万人,比上年末增加32万人,其中城镇常住人口2352万人,占总人口比重为61.8%,比上年末提高1.03个百分点。全年出生人口51.92万人,出生率为13.7‰;死亡人口23.50万人,死亡率为6.2‰;自然增长率为7.5‰。全年实现地区生产总值24055.76亿元,比上年增长9.9%。其中,第一产业增加值2014.91亿元,增长4.4%;第二产业增加值12515.36亿元,增长11.7%;第三产业增加值9525.49亿元,增长8.3%。人均地区生产总值63472元,比上年增长9.1%。第一产业增加值占地区生产总值的比重为8.4%,第二产业增加值比重为52.0%,第三产业增加值比重为39.6%。全年公共财政总收入3828.02亿元,比上年增长11.6%,其中,地方公共财政收入2362.29亿元,增长11.5%;公共财政支出3300.70亿元,增长7.6%。全省国税总收入(含海关代征)2299.67亿元,增长9.2%;全省地税系统组织各项收入2409.27亿元,增长10.1%。
请收集相关数据,建立数学模型,完成以下问题:
1、 梳理影响福建省财政收入关联指标的有关数据,分析、识别影响财政收入的关键影响因素;
2、 结合问题1的分析,对福建省2015年的财政总收入及各个类别收入进行预测; 3、请从财政收入方面对福建省85个设区县进行分类,并说明平潭综合实验区属于哪个类?
4、 结合社会经济发展和福建省近几年的财政收入及支出等情况,从财政收入和支出预算的角度,向福建省财政厅提出几点建议。
二、问题分析
2.1问题一
通过相关分析,可以得知,财政收入(公共财政总收入、地方公共财政收入、全省国税总收入、全省地税总收入)都与好几组数据具有强相关性,为了从中选择关键的影响因素,我们不妨利用SPSS做出逐步回归线性拟合,只要通过了判决系数或显著性的检验,那么所得到的线性回归模型中包含的变量就是我们所要求的关键影响因素。 2.2问题二
针对本题中所收集的数据只有10组,并且通过作图分析可以知道财政总收入及各个类别收入都是随着时间呈指数增长的趋势,因此,采用了灰色预测中的GM(1,1)预测模型对2015年的财政收入进行预测,然后利用级比偏差值进行检验。通过检验后就可作出四类财政收入的2015年的预测值了。 2.3问题三
84个县的划分是从2011年开始实行的,为了使数据更准确,避免偶然因素,所以我们选取了2011到2013的数据,对这三年的平均财政收入使用聚类分析,为了更好的说明数据,我们划分个数的标准是使各类均值在总体均值上下,这样就又可以完成分类,并且得到平潭综合实验区所属的类别。
2
2.4问题四
我们从财政收入规模(利用财政收入集中率衡量)、收入部门结构(用三大类产业比例影响做说明)、收入来源(主要是对税收的疏漏进行分析)这三个这几个方面对我省的财政收入做出分析并提出建议。对于支出,根据福建省从2008年到2013我省的财政支出去向数据,我们从中找到支出比重失衡的项目以此提出建议。另外从收支平衡情况我们也可以得到支出的规律,以此建议财务部作出合乎规律的财政支出预算。
三、模型假设
1、福建省的财政收入只可能与问题重述中提到的因素有关,其它因素造成的影响可忽略不计;
2、所收集的相关数据真实准确,无错误;
四、模型建立及求解
4.1问题一
4.1.1模型建立
yi?b??aixi??()ii?1,2,3...19i?1
29??Y??X ??????(X?X)(y?Y) (1)
?(X?X)2(X为由xi构成的29维向量,X,Y分别为x,y的均值,b为常量) (相应的xi变量标号及数值见附录1)
4.1.2模型求解(以全年公共总收入为例)
利用spss的线性拟回归【1】的逐步回归拟合得到如下的系数表(表 4-1-2 1)
3
非标准化系数 标准 模型 B 误差 1 (常量) 2542..000 784 死亡率 -202..000 732 自然增长70.60.000 率 9 第一产业.145 .000 值 第一比重 22.03.000 8 第一增长-12.3.000 率 39 第三产业.480 .000 值 第三比重 -89.1.000 74 第三增长106.8.000 率 31 人均总值-36.8.000 增长 72 a. 因变量: 总收入 标准系数 相关性 共线性统计量 试用Sig部版 t . 下限 上限 零阶 偏 分 容差 VIF . . 2542.2542.78 784 4 -.06. . -202.-202.73.223 -1.0-.0.008 132.06 732 2 00 06 85 .033 . . 70.6070.609 .711 1.00.00.036 27.549 0 6 9 .060 . . .145 .145 .997 1.00.00.001 1222.0 2 575 .030 . . 22.0322.038 -.931.00.00.009 108.58 3 0 3 40 -.00. . -12.3-12.339 .371 -1.0-.0.260 3.847 8 39 00 04 1.10. . .480 .480 .998 1.00.03.001 995.92 0 5 61 -.08. . -89.1-89.174 .070 -1.0-.0.036 28.002 74 00 15 0 .204 . . 106.8106.831 -.821.00.01.003 342.631 3 0 1 71 -.05. . -36.8-36.872 -.66-1.0-.0.021 46.844 72 4 00 08 4 系数 B 的 95.0% 置信区间 a表4-1-2 1
可看出,剔除完相关性弱的变量后由原始的29项变量就只剩下了死亡率、自然增长率第一产业值,第一产业比重,第一产业增长率,第三产业值,第三产业比重,第三产业增长率,人均地区生产总值增长率这九项变量
模型检验:
模型汇总b 更改统计量 模型 1 调整 标准 估R 方F 更Sig. F Durbin-WR R 方 R 方 计的误差 更改 改 df1 df2 更改 atson 1.0001.000 . . 1.000 . 9 0 . 2.670 a 4
模型汇总b 更改统计量 调整 标准 估R 方F 更Sig. F Durbin-WR R 方 R 方 计的误差 更改 改 df1 df2 更改 atson 1.0001.000 . . 1.000 . 9 0 . 2.670 a a. 预测变量: (常量), 人均总值增长, 第三比重, 第一比重, 第一增长率, 死亡率, 自然增长率, 第三产业值, 第三增长率, 第一产业值。 b. 因变量: 总收入 表4-1-2 2
根据判决系数R方为1,可知该拟合效果很好,因此采用上述九个变量作为主要影响因素。(其余逐步线性回归拟合情况见附录2)
通过比较四种财政收入可知,无论是哪种财政收入,都是将死亡率,自然增长率,第一产业值,第一产业比重,第一产业增长率,第三产业值,第三产业比重,第三产业增长率,人均地区生产总值增长率这九个指标变量作为关键影响因素。
4.2问题二
4.2.1模型建立(以全年公共财政总收入为例) 1)级比检验
建立全年公共财政总收入数据时间序列如下: 模型 1 x(0)?(x(0)(1),x(0)(2),???,x(0)(10))=(786.83 1011.86 1694.42
2056.01
2596.12
3008.91
1284.27 1516.33
3428.76 3828.02)
(1)求级比?(k),有
x(0)(k?1),10 (2) k?2,3,...?(k)?(0)x(k)??(?(2),?(3),???,?(10))=(0.78,0.79,0.85,0.89,0.82 ,0.79,0.86 ,0.88,0.90) (2)级比判断。由于并非所有的?(k)?[0.8338,1.1814],所以需要对x(0)进行平移处理,即x(0)=x(0)+c(此处c的取值为700)
2)GM(1,1)建模
(1)对平移后的数据x(0)作一次累加,得到:
5