黄均铭:回归分析及其在财政收入预测中的应用
(4)本文选取财政收入的影响因素还存在主观性,在选取数据的时候没有进行更深层次的数据关系分析,并且在对数据处理的时候方法比较单一,还不足以直接应用于实际经济研究领域.但是本文的思路是正确的,过程也是科学严谨的,所以只要借助于本文的思路,通过更全面的因素选取、更完善的数据处理,完全可以对财政收入作出更为精确的预测,也可以对实际的经济工作作出更加具体和具有积极意义的指导.本文的思路和方法也并不一定非要局限在中国的经济预测方面,掌握了正确的方法和理论,回归分析可以解决更多的实际问题.
40
辽宁工程技术大学毕业设计(论文)
致谢
在写作过程中,胡行华老师给予了大力的帮助和指导,在此深表感谢!同时也感谢其他帮助和指导过我的老师和同学.
在此我要感谢在整个论文写作过程中帮助过我的每一位人.其中最主要感谢的是我的指导老师胡行华老师.在整个过程中他给了我很大的帮助,在论文题目制定时,他帮助我选择论文主题,在他的细心指导下,让我在写作时有了具体方向.在论文提纲制定时,我的思路不是很清晰,经过老师的帮忙,让我具体写作时思路顿时清晰.在写作过程中给我提供了大量数据资料和建议,告诉我应该注意的细节问题,细心的给我指出错误.在完成初稿后,老师认真查看了我的文章,指出了我存在的很多问题.胡老师诲人不倦的工作作风,一丝不苟的工作态度,严肃认真的治学风格给我留下深刻的影响,值得我永远学习.感谢胡老师的细心指导,才能让我顺利完成毕业论文.在此,谨向导师胡行华老师致以崇高的敬意和衷心的感谢!
41
黄均铭:回归分析及其在财政收入预测中的应用
参考文献
[1] 梅长林,周家良.实用统计方法.[M].北京.科学出版社,2002.
[2] 张厚粲,徐建平.现代心理与教育统计学[M].修订版.北京:师范大学出版社,2004. [3] 杨晓明.SPSS在教育统计中的应用[M].北京:高等教育出版社,2004.
[4] 郑钟光.多元回归分析在矿石体重测定中的应用[J].地质与勘探,1986,986(8):26-27. [5] 苑玉风.多元回归分析的应用研究[J].汽车科技,1996,1(4):25-28.
[6] 李金海.多元回归分析在预测中的应用[J].河北工业大学学报,1996,15(3):34-35. [7] 牛桂萍,黄祖英.用多元回归分析作暴雨的长期预报[J].陕西气象,1996,1(l):23-25. [8] 林祖享,梁舜华.探讨运用多元回归分析预报赤潮[J].海洋环境科学,2002,21(3):18-20.
[9] Riehard A Johnson,Dean W.wiehem.Applied Multivariate Statistical Analysis.6th Edition.Upper Saddle River:Prentice Hall,2007.
[10] N.Adler,B.Golany.Evaluation of deregulated airline networks using data envelopment analysis combined with principal components analysis with an application to Western Europe[J].European Journal of Operational Research,2001,132:260-273.
[11] William F, Christensen, Yasuo Amemiya. Modeling and prediction for multivariate spatial factor analysis[J].Journal of Statistical Planning and Inference,2003,115:543-564.
[12] Yin Xiangrong.Canonical correlation analysis based on information theory[J].Journal of Multivariate Analysis,2004, 85:161-176.
[13] 高惠璇.应用多元统计分析[M].北京:北京大学出版社.2005. [14] 温忠麟.心理与教育统计[M].广东:高等教育出版社,2006.
[15] 张厚粲,徐建平.现代心理与教育统计学[M].第3版.北京:北京师范大学出版社.2009. [16] 张敏强.教育与心理统计学[M].修订版.北京:人民教育出版社,2002.
[17] 柯惠新,黄京华,沈浩主.调查研究中的统计分析法[M].北京:广播学院出版社.1992. [18] 王孝玲.教育统计学[M].上海:华东师范大学出版社.1986.
[19] 茆诗松,丁元,周纪芗,吕乃刚.回归分析及其试验设计[M].上海:华东师范大学出版社,1981. [20] 王惠文.偏最小二乘回归方法及其应用[M].北京:国防工业出版社.1999. [21] 包研科.数据分析教程[M].北京:清华大学出版社,2011.
42
辽宁工程技术大学毕业设计(论文)
附录A译文
斯太尔摩线冷却监控系统的开发与应用
摘要:斯太尔摩控制冷却系统已经成功应用在斯太尔摩生产线,它通过本地网络将材料流体管理系统与PLC自动控制系统联系起来.在生产过程中以及预测最终属性,这种在线模型采用有限元时域微分法去计算温度的变化和相的转变.因为不同钢材的连续冷却温度线在这个模型中是耦合的,所以它可以预测不同钢材的热变化和相转变.也可以为新钢材的生产和优化提供直接的指导.这种在线冷却系统已经被安装在三个斯太尔摩生产线,并取得好的效果.
关键词:冷却控制模型;斯太尔摩;线材生产线;质量预估
1介绍
随着钢铁行业竞争的加剧,如何生产稳定质量新形钢材成为钢铁产业的重点,在冷却过程中,斯太尔摩生产线中也需要更可靠预测控制技术.
由于斯太尔摩生产线高效的生产率以及以及产品良好的机械性能,斯太尔摩成为最流行的控制冷却系统.如图1,斯太尔摩冷却控制系统,1000度的线材快速通过几个冷水槽,到达吐丝机,以重叠的方式存储在存放容器中.它的冷却速率靠打开一下一系列的风扇来控制.
钢材最终的机械属性主要取决于在相转换前的钢材化学组成和冷却速度.由于在生产过程中无法直接观察冷却速率和相转变,那就非常需要去发展一个在线模型去预测最终的机械属性和相转变.尽管有过类似的研究报告,但是为斯太尔摩生产在线预测的模型尚没有人研究.采用有限元时域分析方法,这种在线控制冷却模型已经安装在实际生产过程中
43
黄均铭:回归分析及其在财政收入预测中的应用
了.这篇论文介绍它的基本原理和控制方法.这很有利于生产产品的稳定性.目前,这种在线模型已经应用在三个斯太尔摩生产线,并取得满意效果.
2数学模型
2.1热力学模型
在斯太尔摩生产线中,由于无线长钢条高速移动,轴向热传导可以忽略.这种系统可以根据以下假设公式化,解决一维热传导:①轴对称②横截面处处相同③相同的初始温度,这些和现实非常接近.
解决线材热流体的基本方程如下
???T?k?T?T (1) k??g(T)?pC??p?r??r?r?r?t注意g(T)是线材由于热导性和相转变而引起的体积变化率.ρ是材料密度,cp热容量,k导热系数.
为了减少计算中丢失材料信息,实际的实验数据ρ,k和cp可以在系统接口中直接输入,与传统的回归分析方法见图2和图3.
我们用FDTD crank-nicolson方法解上面方程,因为它的快速性和无条件稳定性.这可以满足在线实时系统的需要.为了保持系统速度和准确性的平衡,通过反复实验,我们选择20个数据.通常,大量的数据能够保证系统的准确性,但是会降低系统的速度.这在在线实时系统中是不实际的.因为实际的生产过程中,一个线材通过吐丝机的时间不会超过2秒.
我们采用下面的边界条件: ●在中心线
t?0,r?0,?k?T?0 (2) ?r●在线材表面
t?0,r?r0,?k?T?h(Tr0?Ta) (3) ?r这儿初始条件是:
t?0,0?r?r0,T?Tin
这里t是时间,单位秒,r0是线材半径,h是热转换常数,t0是线材表面温度,ta是周围空气和水的温度.
44
中文题目:中国1978-2008年财政收入数据的回归分析 外文题目:Regression analysis of China 1978-2008 fiscal
revenue data
毕业设计(论文)共69页(其中译文及原文共19页)图纸共0张
完成日期:2013年6月 答辩日期:2013年6月
辽宁工程技术大学
本科毕业设计(论文)学生诚信承诺保证书
本人郑重承诺:《回归分析及其在财政收入预测中的应用》毕业设计(论文)的内容真实、可靠,系本人在 胡行华 指导教师的指导下,独立完成。如果存在弄虚作假、抄袭的情况,本人承担全部责任。
学生签名:
年 月 日
辽宁工程技术大学
本科毕业设计(论文)指导教师诚信承诺保证书
本人郑重承诺:我已按学校相关规定对 黄均铭 同学的毕业设计(论文)的选题与内容进行了指导和审核,确认由该生独立完成。如果存在弄虚作假、抄袭的情况,本人承担指导教师相关责任。
指导教师签名:
年 月 日
摘要
财政收入是衡量一个地区和国家经济实力的重要标准,控制着国民经济的命脉, 对财政收入进行定量分析并对其做出比较准确的预测可以为相关部门或者企业制定发展规则,实施相关措施提供可靠的理论预测参考.科学、合理地预测财政收入,对于克服年度预算收支确定的随意性和盲目性,正确处理财政与经济的相互关系具有十分重要的意义.
本文主要介绍了一元线性回归分析,多元线性回归分析和逐步回归法.通过多元线性回归分析和逐步回归法对国家财政收入进行建模,然后利用Matlab对其分析,找到能反映财政收入与各因素之间关系的最优回归方程.并且分析模型得出结论,并提出了提高财政收入质量的政策建议.
关键词:线性回归分析;逐步回归;中国财政收入预测
I
Abstract
Fiscal revenue is an important standard to measure a regional and national economic strength, it controls the lifeline of national economy, the quantitative analysis of the fiscal revenue and accurate forecasts on the development rules can provide a reliable theoretical prediction reference for the relevant departments or enterprises to formulate the developing plan. The scientific, rational prediction of fiscal revenue is very important to overcome the annual budget to the randomness and blindness, correctly handle the relationship between finance and economy.
This paper mainly introduces the method of linear regression analysis, multivariate linear regression analysis and stepwise regression method. Modeling the national fiscal revenue by multiple linear regression analysis and stepwise regression method, and then use the MATLAB to analysis it, find the potimal equation that can reflect the relationship between the fiscal revenue and the factors. Analysis the model to draw conclusion, and provide policy recommendations to improve the quality of fiscal revenue.
Key words:linear regression analysis;stepwise regression;China's fiscal revenue forecast
II
目录
摘要 ........................................................................................................................... I Abstract ..................................................................................................................... II 前言 .......................................................................................................................... 1 1回归分析理论基础 ............................................................................................... 5 1.1一元线性回归分析 ........................................................................................ 5 1.1.1一元线性回归的总体模型 ..................................................................... 5 1.1.2回归参数的最小二乘估计 ..................................................................... 8 1.1.3回归方程的显著性检验 ......................................................................... 9 1.2多元线性回归分析 ....................................................................................... 11 1.2.1高斯—马尔科夫假定 ............................................................................ 11 1.2.2最小二乘估计量 ................................................................................... 12 1.2.3 F检验 ................................................................................................... 16 1.2.4回归参数的显著性检验 ....................................................................... 17 1.3逐步回归分析 .............................................................................................. 18 1.3.1逐步回归分析的主要思路 ................................................................... 18 1.3.2逐步回归分析的主要计算步骤 ........................................................... 18 2回归分析的Matlab实现 .................................................................................... 20 2.1线性回归的Matlab数据处理 .................................................................... 20 2.1.1确定回归系数的点估计值 ................................................................... 20 2.1.2求回归系数的点估计和区间估计、并检验回归模型 ....................... 20 2.2逐步回归的Matlab数据处理 .................................................................... 22 3回归分析在财政收入预测中的运用 ................................................................. 28 3.1数据的采集 .................................................................................................. 28 3.2数据的处理 .................................................................................................. 28
辽宁工程技术大学毕业设计(论文)
Coefficients with Error BarsX1X2X3X4X5X6X7X8-4-20246Coeff. t-stat p-val -0.971104 -8.5603 0.0000 0.305706 3.1200 0.0045 -1.27385 -1.0820 0.2900 -0.760118 -1.9901 0.0576 1.42548 4.6473 0.0001 1.19487 0.5171 0.6099 -0.093584 -0.1856 0.8543 1.80544 2.8702 0.00822x 104Model HistoryRMSE105 1015202530354045
图3-7现有自变量:x1,x2,x4,x5,x8 Figure 3-7 the existing variables:x1,x2,x4,x5,x8
由图3-7知方程显著,且x1,x2,x5,x8显著,x4不显著,剔除x4,回到图3-6,引入x7如下:
Coefficients with Error BarsX1X2X3X4X5X6X7X8-505Coeff. t-stat p-val -1.08701 -10.9426 0.0000 0.343634 3.2584 0.0032 -1.04429 -0.7487 0.4613 -0.870875 -1.2221 0.2335 1.05695 2.7584 0.0107 0.226953 0.0583 0.9540 0.422369 1.5176 0.1417 1.10953 1.7859 0.08632x 104Model HistoryRMSE105 101520253035404550
图3-8现有自变量:x1,x2,x5,x7,x8 Figure 3-8 the existing variables:x1,x2,x5,x7,x8
由图3-8知方程显著,且x1,x2,x5,x8显著,x7不显著,剔除x7回到图3-6,引入
35
黄均铭:回归分析及其在财政收入预测中的应用
x6如下:
Coefficients with Error BarsX1X2X3X4X5X6X7X8-4-202Coeff. t-stat p-val -1.06286 -10.4554 0.0000 0.365088 3.2532 0.0033 -0.531804 -0.4240 0.6754 -1.11246 -1.4190 0.1688 1.42745 4.4858 0.0001 -1.65531 -1.4201 0.1679 0.474265 0.5077 0.6163 1.37573 2.2717 0.03202x 104Model HistoryRMSE105 101520253035404550
图3-9现有自变量:x1,x2,x5,x6,x8 Figure 3-9 the existing variables:x1,x2,x5,x6,x8
由图3-9知方程显著,且x1,x2,x5,x8显著,x6不显著,剔除x6回到图3-6,引入
x3如下:
Coefficients with Error BarsX1X2X3X4X5X6X7X8-6-4-202Coeff. t-stat p-val -1.08415 -10.5606 0.0000 0.216178 1.5154 0.1422 0.647539 0.8232 0.4182 -1.27181 -2.0950 0.0469 1.25161 3.4331 0.0021 -2.28844 -1.2003 0.2417 0.740105 1.4544 0.1588 1.46898 2.2975 0.03022x 104Model HistoryRMSE10102030405060
图3-10现有自变量:x1,x2,x3,x5,x8 Figure 3-10 the existing variables:x1,x2,x3,x5,x8
由图3-10知方程显著,且x1,x2,x5,x8显著,x3不显著,剔除x3回到图3-6,得
36
辽宁工程技术大学毕业设计(论文)
到最优回归方程如下:
??2119.19?1.09x?0.3x?1.39x?1.34x (3-2) Y21258?财政收在3-2式中x1为第一产业,x2为工业,x5为批发和零售业,x8为房地产业.Y2入预测值.
由图3-5可知,F?3114.9,p?0.0000,所以回归方程整体高度显著,自变量x1,x2,x5对应的p?0.01,所以x1,x2,x5高度显著,自变量x8对应的p?0.03?0.05,所以x8显著,模型标准误差估计为756.129,可决系数为0.997597.
从3-2式中可以看出,剔除了四个变量x3,x4,x6,x7.它们分别代表了建筑业,交通运输、仓储和邮政业,住宿和餐饮业,金融业.剔除的行业从总体上看年度产值的数字本身就相对较小,再加上交通运输、仓储和邮政业以及很大一部分的建筑业都属于政府投资的服务性事业,所以并不能创造太多利润;而住宿和餐饮业以及金融业又存在行业不规范导致税收困难的现象,其中住宿和餐饮小规模企业林立,而大规模企业又通常乱定价格,金融业缺乏有效的监管机构都是被剔除的原因.
3.3结果论证
对得到的模型3-1式和3-2式分别进行预测,并且对预测值误差对比,选出更好的回归模型.
首先,用逐步分析得到的回归模型3-2式进行预测.由附录3数据中的表5-1知2009-2011年数据,代入3-2式中可得表3-1.
表3-1 中国财政收入预测值与真实值对比
Table 3-1 the prediction and true value comparsion of China's fiscal revenue
年份 2009 2010 2011
x1(亿元)
35226 40533.6 47486.2
x2(亿元)
135239.9 160722.2 188470.2
x5(亿元)
28984.5 35746.1 43445.2
x8(亿元)
18654.9 22782 26708
?(亿元) Y269580.8 86369.2 103077.8
Y(亿元)
68518.3 83101.5 103874.4
?2(%)
1.02 3.15 0.77
?为财政收表3-1中x1为第一产业,x2为工业,x5为批发和零售业,x8为房地产业.Y2?与Y的相对误差. 入预测值,Y为实际财政收入,?2为Y2然后,利用之前通过线性回归得到的模型3-1式,同样对2009-2011年的数据进行预测,得到表3-2,其中x1,x2,x5,x8的数据在表3-1中.
37
黄均铭:回归分析及其在财政收入预测中的应用 表3-2 中国财政收入预测值与真实值对比
Table 3-2 the prediction and true value comparsion of China's fiscal revenue
年份 2009 2010 2011
x3(亿元)
22398.8 26661 31942.7
x4(亿元)
16727.1 19132.2 21931.9
x6(亿元)
7118.2 8068.5 9172.8
x7(亿元)
17767.5 20980.6 24958.3
?(亿元) Y16635.6 8108.9 9495.0
Y(亿元)
68518.3 83101.5 103874.4
?1(%)
2.08 1.94 8.59
?表3-2中x3为建筑业,x4为交通运输和邮政业,x6为住宿和餐饮业,x7为金融业.Y1?与Y的相对误差. 为财政收入预测值,Y为实际财政收入,?1为Y1可以看出与线性回归分析相比,逐步回归分析具有着更高的准确性.而得到的模型中剔除了不显著自变量,剩余的自变量对因变量影响更为显著,具有实际价值.所以在进行这一类数据处理的时候,采用逐步回归分析的方法更加科学合理.
38
辽宁工程技术大学毕业设计(论文)
4结论与展望
本文利用Matlab作为工具,实现了对中国财政收入的逐步回归分析以及对未来中国财政收入的预测.Matlab由于内置了许多集成度很高的数学函数,在进行复杂的数据分析工作时能够起到很大的帮助作用,并且还提供了友好便捷的可视化操作方法,使得整个回归分析的过程更加直观.虽然使用了Matlab后,没有直接参与数据的运算与处理,但是回归分析最重要的是其思想和步骤,这些内容都并没有直接依赖于Matlab,而是自行进行了处理,保证了论文的科学与严谨.本文的预测虽然都是针对已经现有统计数据的年份进行的,但是这为了保证回归分析的结果可以通过对比得到验证,从而使本文的结论更加令人信服.
通过本文对中国1978-2008年年度财政收入以及产业年度产值的逐步回归分析工作,本文可以得到如下的结论:
(1)本文对1978-2008年中国财政收入与第一产业、工业、建筑业、交通运输和邮政业、批发和零售业、住宿和餐饮业、金融业、房地产业进行了回归分析.并利用各产业对财政收入的影响,对2009-2011年的财政收入进行预测.通过预测的结果与事先采集的年度统计数据的对比可以看出,得到预测结果相对准确,说明利用回归分析进行经济预测是可行的.
(2)本文运用了Matlab作为分析的工具,只使用了函数stepwise就完成了所有的具体工作.充分显示了Matlab作为一款专业的数据处理软件,在进行复杂的数学分析工作时具有无可比拟的便捷性.借助于Matlab完全可以进行更加复杂的问题研究和更加繁琐的数据处理,这为今后的研究与分析工作提出了很好的借鉴,那就是要灵活的运用可以利用的工具.
(3)本文的分析结果显示出中国财政收入与第一产业和工业的相关性较高,而与批发和零售业、金融业、房地产业的相关性较小.但是通过结果发现第一产业与财政收入是负相关,说明中国的第一产业生产模式比较落后,财政投入与收益不成比例,所以第一产业急需实现现代化.工业虽然与财政收入相关性高,但是可以看出随着工业化进程的不断发展,对财政收入的贡献比例逐渐减小.批发和零售业、金融业、房地产业对财政收入的贡献比例已经超过了工业,中国可以进一步加强这三方面产业的发展,从而提高整体的财政收入.这些虽然只是一些粗浅结论,但是仍然可以对未来中国的经济发展方向提出指导性的意见.
39
辽宁工程技术大学毕业设计(论文)
Coefficients with Error BarsX1Coeff. t-stat p-val 1.43996 10.4031 0.0000X2 0.41611 2.2418 0.0517X3 -0.410043 -2.0581 0.0697X4-1-0.500.511.52 -0.613954 -12.6212 0.0000Model History20RMSE1005 10152025
图2-5现有自变量:x1,x4 Figure 2-5 the existing variables:x1,x4
由图2-5知方程显著,x1,x4显著,引入x2可得下图:
Coefficients with Error BarsX1Coeff. t-stat p-val 1.45194 12.4100 0.0000X2 0.41611 2.2418 0.0517X3 0.101909 0.1350 0.8959X4-1012 -0.23654 -1.3650 0.2054Model History20RMSE1005 1015202530
图2-6现有自变量:x1,x2,x4 Figure 2-6 the existing variables:x1,x2,x4
由图2-6知方程显著,x1,x2显著,x4不显著,去掉x4可得下图:
25
黄均铭:回归分析及其在财政收入预测中的应用
Coefficients with Error BarsX1Coeff. t-stat p-val 1.46831 12.1047 0.0000X2 0.66225 14.4424 0.0000X3 0.250018 1.3536 0.2089X4-0.500.511.5 -0.23654 -1.3650 0.2054Model History20RMSE1005 1015202530
图2-7现有自变量:x1,x2 Figure 2-7 the existing variables:x1,x2
由图2-7知方程显著,x1,x2显著,引入x3可得下图:
Coefficients with Error BarsX1Coeff. t-stat p-val 1.69589 8.2895 0.0000X2 0.656915 14.8508 0.0000X3 0.250018 1.3536 0.2089X4-2-1012 -0.144061 -0.2032 0.8441Model History20RMSE1005 1015202530
图2-8现有自变量:x1,x2,x3 Figure 2-8 the existing variables:x1,x2,x3
由图2-8知方程显著,x1,x2显著,x3不显著,去掉x3,得到图3-7为最终结果.
26
辽宁工程技术大学毕业设计(论文)
结果表明,自变量x1,x2进入回归方程,x3,x4没能进入回归方程,最优回归方程为
??52.5773?1.4683x?0.6623x Y12回归方程整体显著,自变量高度显著,模型标准误差估计为2.4063,可决系数为0.9744.
27
黄均铭:回归分析及其在财政收入预测中的应用
3回归分析在财政收入预测中的运用
3.1数据的采集
本文数据整理自中国统计年鉴1978-2011年的数据.详见附录3数据.其中因变量中为国财政收入的年度值,自变量为8个可能影响财政收入的因素:第一产业(指农、林、牧、渔业)、工业、建筑业、交通运输和邮政业、批发和零售业、住宿和餐饮业、金融业、房地产业的年度产值数据.这些数据的选取尽量同时保证了数据的完整覆盖以及数据间的独立性,以使得后续的分析工作能有较高的准确性.
3.2数据的处理
本文要进行的工作是利用Matlab的回归分析工具对1978-2008年的中国财政收入以及相关数据进行回归分析,以期判别中国财政收入受那些经济指标的影响最大,并对未来的中国财政收入进行预测.处于对回归分析准确性判断的需要,2009-2011年的数据用来与得到的分析结果给出的预测进行对比,从而确定回归分析的准确性.
对数据的具体回归分析工作借助了Matlab的内置函数stepwise,这个函数本身就集成了回归分析所需要的全部功能,甚至可以简单的一步得出最后的分析结果.但是为了便于分析,本文将按照标准的回归分析方法逐步的对每个变量进行换入和换出,人工的得到最后的分析结果,stepwise函数在这里只是最为一个让回归分析过程更加直观的工具,并且也省去了大量繁琐的计算过程.
(1)工作的第一步是对1978-2008年的数据进行多远线性回归分析,先将各产业的相关年度产值和中国财政收入以矩阵和向量的形式输入Matlab,方便下一步进行处理: >> x=[1027.5 1607 138.2 182 242.3 44.6 68.2 79.9 1270.2 1769.7 143.8 193.7 200.9 44 66.9 86.3 1371.6 1559.5 1777.4 1978.4 2316.1 2564.4 2788.7
1996.5 2048.4 2162.3 2375.6 3448.7
195.5 207.1 220.7 270.6 417.9 665.8
213.4 220.7 246.9 274.9 421.7 568.3
193.8 171.4 198.7 363.5 802.4 852.6
47.4 75 96.4 62.3 114.8 110.8 72.5 149 121.8 96.8 203.9 138.3 259.9 163.2
356.4
162.3 215.2 298.1
231.1 54.1 79.8 99.9
2789 3 16.7 338.5 3967 5 25.7 498.8
3233 4 585.8
1059.6 187.1
450 382.6
28
辽宁工程技术大学毕业设计(论文)
3865.4 4265.9 5342.2 5866.6 5777.2 810 685.7 1483.4 241.4 1536.2
277.4
585.4 964.3 1017.5 1056.3 1306.2 473.8 566.2 662.2 763.7 1101.3 6484 794 812.7 8087.1 1015.1 1420.3 5062 6858 859.4 1167 1268.9 301.9
1834.6 442.3
584.6 10284.5 1415 1689 2405 6963.8 14188
2266.5
9572.7
19480.7 2964.7
12135.8 24950.6 3728.8 14015.4 29447.6 4387.4 14441.9 32921.4 4621.6 14817.6 34018.4 4985.8 14770
35861.5 5172.1
14944.7 40033.6 5522.3 15781.3 43580.6 5931.7 16537
47431.3 6465.5
17381.7 54945.5 7490.8 21412.7 65210 8694.3
22420 77230.8 10367.3 24040 91310.9 12408.6 28627 110534.9 15296.5 33702
130260.2 18743.2 >> Y=[1132.3
1146.4 1159.9 1175.8 1212.3 1367.0 1642.9 2004.8 2122.0 2199.4 2357.2 2664.9 2937.1
2174 2787.9 3244.3 3782.2 4148.6 4660.9 5175.2 6161 6870.3 7492.9 7913.2 9304.4
10666.2 12183 14601
16362.5 2816.6 3773.4 4778.6 5599.7 6327.4 6913.2 7491.1 8158.6
9119.4 9995.4
11169.5 12453.8 13966.2 16530.7 20937.8 26182.3
712.1 1669.7 1008.5 2234.8 1200.1 2798.5 1336.8 3211.7 1561.3 3606.8 1786.9 3697.7 1941.2 3816.5 2146.3 4086.7 2400.1 4353.5 2724.8
4612.8 3126.1 4989.4 3664.8 5393 4195.7 6086.8 4792.6 8099.1
5548.1
12337.5 6616.1
14863.3 1379.6 1909.3 2354 2617.6 2921.1 3434.5 3681.8 4149.1 4715.1 5346.4 6172.7 7174.1
8516.4 10370.5
13809.7 14738.7];
29
黄均铭:回归分析及其在财政收入预测中的应用
3149.5 3483.4 4349.0 5218.1 6242.2 7408.0 8651.1 9876.0 11444.1 13395.2 16386.0 18903.6 21715.3 26396.5 31649.3 38760.2 51321.8 61330.4];
在完成数据的输入后,首先对现有的数据直接进行线性回归,以便在逐步回归完成之后可以与逐步回归的结果进行对比,从而验证逐步回归在剔除了次要的影响变量之后是否对总体的回归分析准确性有所帮助.线性回归使用了Matlab的内置函数regress,其中输入参数x和Y是之前输入的财政收入和产业年度产值数据,而输出参数中b是回归系数,bint是回归系数的区间估计,r是残差,rint是置信区间,stats是用于检验回归模型的统计量,它有四个数值:相关系数r2、F值、与F 对应的概率p、估计误差方差.运行如下: >>X=[ones(31,1) x];
>> [b,bint,r,rint,stats]=regress(Y,X); >> b,bint,stats 输出结果如下: b =
1.9579e+03 -9.3691e-01 5.0134e-01 -1.8814e+00
30
辽宁工程技术大学毕业设计(论文)
-1.4469e+00 9.6062e-01 3.8707e+00 1.0227e+00 1.2150e+00 bint =
1.2353e+03 2.6806e+03 -1.2431e+00 -6.3074e-01 -4.8420e-03 1.0075e+00 -4.8878e+00 1.1250e+00 -3.1763e+00 2.8252e-01 -8.1989e-01 2.7411e+00 -4.9795e+00 1.2721e+01 -1.1063e+00 3.1517e+00 -9.2562e-01 3.3556e+00 stats =
9.9836e-01 1.6760e+03 8.2604e-29 5.3153e+05
即r2?0.9983,F?1676,p?0.0000.回归模型如下:
??1957.9?0.94x?0.5x?1.88x?1.45x?0.96x?3.87x?1.02x?1.22x (3-1) Y112345678在3-1式中,x1第一产业、x2工业、x3建筑业、x4交通运输和邮政业、x5批发和零售业、x6住宿和餐饮业、x7金融业、x8房地产业,F财政收入预测值.
由p?0.05可以看出,线性回归的结果是显著的. 可以作残差图,进一步确定模型是否合理. 输入:rcoplot(r,rint) 输出图3-1.
从残差图3-1可以看出,除了其中四个数据外,其余数据的残差离零点均较近,且残差的置信区间均包含零点,这说明回归模型3-1式符合原始数据,而其中偏差较大的四个点可视为异常点.
31
黄均铭:回归分析及其在财政收入预测中的应用
Residual Case Order Plot2500200015001000Residuals5000-500-1000-1500-2000-250051015Case Number202530
图3-1残差图 Figure 3-1 residual plot
(2)工作第二步用逐步回归法,找最优回归方程.其中引人变量根据t值,未引入的变量中t值最大的引入,被剔除的变量不在考虑引出;剔除变量根据p值,pmax?0.05则剔除相应变量.运算如下: >> stepwise(x,Y) 输出如下:
Coefficients with Error BarsX1X2X3X4X5X6X7X802468Coeff. t-stat p-val 1.60926 14.2815 0.0000 0.443483 34.6158 0.0000 3.16923 32.4242 0.0000 3.29438 25.3310 0.0000 2.28645 31.2061 0.0000 8.37689 28.8545 0.0000 4.23473 26.9852 0.0000 3.80206 47.4765 0.00002x 104Model HistoryRMSE105 10152025303540
图3-2初始值 Figure 3-2 starting value
由图3-2知x8的相关性最高,引入x8如下:
32
辽宁工程技术大学毕业设计(论文)
Coefficients with Error BarsX1X2X3X4X5X6X7X8-6-4-2024Coeff. t-stat p-val -0.523023 -5.5151 0.0000 -0.215118 -1.7843 0.0852 -0.826786 -1.2049 0.2383 -1.95676 -4.1534 0.0003 -0.451399 -1.0113 0.3205 -3.64525 -2.3516 0.0260 0.254821 0.4767 0.6373 3.80206 47.4765 0.00002x 104Model HistoryRMSE105 10152025303540
图3-3现有自变量:x8 Figure 3-3 the existing variables:x8
由图3-3知方程显著,并且x8显著,再引入x1如下:
Coefficients with Error BarsX1X2X3X4X5X6X7X8-20246Coeff. t-stat p-val -0.523023 -5.5151 0.0000 0.509363 4.3803 0.0002 2.69018 4.9841 0.0000 -0.448701 -0.6728 0.5068 1.83237 5.7391 0.0000 2.02251 1.2136 0.2354 0.887648 2.5026 0.0187 4.92332 23.3341 0.00002x 104Model HistoryRMSE105 1015202530354045
图3-4现有自变量:x1,x8 Figure 3-4 the existing variables:x1,x8
由图3-4知方程显著,且x1,x8显著,引入x5如下:
33
黄均铭:回归分析及其在财政收入预测中的应用
Coefficients with Error BarsX1X2X3X4X5X6X7X8-2024Coeff. t-stat p-val -0.931291 -9.6768 0.0000 0.296604 2.8713 0.0080 1.46398 2.4927 0.0194 -0.704499 -1.5976 0.1222 1.83237 5.7391 0.0000 -0.0258915 -0.0210 0.9834 0.155874 0.5006 0.6209 2.79463 7.0224 0.00002x 104Model HistoryRMSE105 1015202530354045
图3-5现有自变量:x1,x5,x8 Figure 3-5 the existing variables:x1,x5,x8
由图3-5知方程显著,且x1,x5,x8显著,引入x2如下:
Coefficients with Error BarsX1X2X3X4X5X6X7X8-4-202Coeff. t-stat p-val -1.09001 -10.7099 0.0000 0.296604 2.8713 0.0080 0.647539 0.8232 0.4182 -0.760118 -1.9901 0.0576 1.38739 4.2940 0.0002 -1.65531 -1.4201 0.1679 0.422369 1.5176 0.1417 1.3428 2.1768 0.03882x 104Model HistoryRMSE105 1015202530354045
图3-6现有自变量:x1,x2,x5,x8 Figure 3-6 the existing variables:x1,x2,x5,x8
由图3-6知方程显著,且x1,x2,x5,x8显著,引入x4如下:
34