多元回归分析中变量的选择——spss的应用毕业论文设计

2019-01-07 19:07

毕 业 论 文

题 目 多元回归分析中的变量选取

——SPSS的应用

院 (系) 数学与统计学院 专业年级 2010级统计学 学生姓名 殷婷 学号 2010101217 指导教师 职称 副教授 日 期 2014-4-22

多元回归分析中的变量选取——SPSS的应用

殷婷

摘要

本文不仅对于复杂的统计计算通过常用的计算机应用软件SPSS来实现,同时通过对两组数据的实证分析,来研究统计学中多元回归分析中的变量选取,让大家对统计中的多元回归数据的选取和操作方法有更深层次的了解。一组数据是对于淘宝交易额的未来发展趋势的研究,一组数据时对于我国财政收入的研究。本文通过两个实证从不同程度上对数据选取的研究运用通俗的语言和浅显的描述将SPSS在多元回归分析中的统计分析方法呈现在大家面前,让大家对多元回归分析以及SPSS软件都可以有更深一步的了解。通过SPSS软件对数据进行分析,对数据进行处理的方法进行总结,找出SPSS对于数据处理和分析的优缺点,最后得在对变量的选取和软件的操作提出建议。

关键词:统计学 SPSS 变量的选取 多元回归分析

Abstract

In this paper, not only for complex statistical calculations done by the commonly used computer application software of SPSS, through the empirical analysis of the two groups of data at the same time, to study the statistics of the variables in the multivariate regression analysis, let everybody to select multiple regression in statistical data and operation methods have a deeper understanding. Is a set of data for the future development trend of taobao

transactions of research, a set of data for the research of our country's financial income. In this paper, through two empirical to select data from different extent research using a common language and plain the SPSS statistical analysis method in multiple regression analysis of present in front of everyone, let everyone to multiple regression analysis and SPSS software can have a deeper understanding. Through the SPSS software to analyze data, and

summarizes method of data processing, find out the advantages and disadvantages of SPSS for data processing and analysis, finally had to put forward the proposal to the operation of the selection of variables and software.

Keywords: Statistical SPSS The selection of variables multiple regression analysis

1

目录

摘要 ............................................................... 1 英文摘要 ........................................................... 1 引言 ............................................................... 3 第一章回归分析 ..................................................... 3

1.1自变量的选择 ........................................................................................................................ 4 1.2国内外研究现状 .................................................................................................................... 5

第二章案例分析一:淘宝交易额的研究 ................................. 6

2.1数据的来源及变量的选取 .................................................................................................... 6 2.2相关分析 ................................................................................................................................ 7 2.2.1散点图 ........................................................................................................................... 7 2.2.2计算相关系数 ............................................................................................................... 8 2.3回归分析 .............................................................................................................................. 11 2.4小结 ...................................................................................................................................... 13

第三章案例分析二:财政收入的研究 .................................. 14

3.1数据的来源及变量的选取 .................................................................................................. 14 3.2相关分析 .............................................................................................................................. 15 3.2.1散点图 ......................................................................................................................... 15 3.2.2计算相关系数 ............................................................................................................. 17 3.3回归分析 .............................................................................................................................. 19 3.4逐步回归 .............................................................................................................................. 21 3.5小结 ...................................................................................................................................... 24

第四章总结及建议 .................................................. 25 参考文献 .......................................................... 26

2

引 言

统计学是一门提供数据信息的收集、处理、归纳和分析的理论与方法的科学。然而随着社会的发展,统计的运用范围越来越广泛,统计学作为高等院校经济类专业和工商管理类专业的核心课程,不管是在经济管理领域,或是在军事、医学等领域的研究中对于数量分析与统计分析都需要更高的要求,需要用到的数学知识较多,应用方面的灵活性也较强,计算量大且复杂。随着我国社会主义市场经济的日趋完善,不管是在宏观经济的经济调控领域还是在微观的企业管理领域中,人们必须准确及时的获得经济运行中的各类信息才能得到高效的监控和科学的管理。然而科学研究的深入,研究的对象也日益变得复杂,复杂系统的研究问题更是成为当今研究的热点。为了更好的描述一个复杂的现象,就需要大量的数据和信息,如何高效、准确地利用已知的信息便成为当今社会研究的一项重要课题。

基于以上背景,本文通过总结和吸取其他国内外学者对统计学研究的,并结合我国的实际情况,本文采用了案例一对于网络购物这块的的研究,通过对2005年到2012年的居民消费水平,以及我国网络普及度,我国人人均纯收入以及我国的居民消费水平对淘宝网的未来发展趋势进行定量数据的研究以及案例二对于我国财政收入的研究,通过对2000年到2012年的人均国内生产总值,经济活动人口,全社会固定投资,进出口总额,居民消费价格水平对我国财政收入的影响进行定量数据的研究。通过对数据的选取,以及软件的操作方法来告知读者如何在SPSS的操作中变量选取的原则、要求和方法。

第一章自变量的选择

1.1自变量的选择

在多元线性回归模型中,自变量的选择实质上就是模型的选择。现设一切可供选择的变量是t个 ,它们组成的回归模型称为全模型(记:m?t?1),在获得n组观测数据后,我们有模型

?Y?X????2??~Nn(0,?In)

其中:Y是n?1的观测值,?是m?1未知参数向量,X是n?m结构矩阵,并假定X的秩为m。

现从x1,x2,?,xt这t个变量中选t?变量,不妨设x1,x2,?,xt?,那么对全模型中的参数?和结构矩阵X可作如下的分块(记:p?t??1):

3

????p,?q??, X??Xp?Xq?

我们称下面的回归模型为选模型:

?Y?Xp?p?? ? 2?~N(0,?I)n?其中:Y是n?1的观测值,?p是p?1未知参数向量, Xp是n?p结构矩阵,并假定Xp的秩为p。

自变量的选择可以看成是这样的两个问题,一是究竟是用全模型还是用选模型,二是若用选模型,则究竟应包含多少变量最适合。如果全模型为真,而我们用了选模型,这就表示在方程中丢掉了部分有用变量,相反,如果选模型为真,而我们选用了全模型,这就表示在方程中引入了一些无用变量,下面从参数估计和预测两个角度来看一看由于模型选择不当带来的后果。

为了讨论方便起见,先引入几个记号: 全模型中参数?,?2的估计:

??(X??X)?1X'Y

?2??1Y?[I?X(X?X)?1X?]Yn?R(X)

其中:R(X)为矩阵X的秩。 在点x?(x1?xt)?点上的预测值为yp?xp?p

2?,?在选模型中参数的估计:

??(X?X)?1X?Y?pppp?p2??1Y?[I?Xp(Xp?Xp)?1Xp]Yn?R(Xp)

~?)???(x1,?xp)?(xp?1,?xt)??? 上的预测值为~在x?(x?pxqyp?x?p?p

1.2国内外研究现状

在科学技术飞速发展的今天,统计学广泛吸收和融合相关学科的新理论,不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法,并拓展了新的领域。今天的统计学已展现出强有力的生命力。在我国,社会主义市场经济体制的逐步建立,实践发展的需要对统计学提出了新的更多、更高的要求。随着我国社会主义市场经济的成长和不断完善,统计学的潜在功能将得到更充分更完满的开掘。在应用回归分析去处理

实际问题时,回归自变量选择是首先要解决的重要问题。通常,在做回归分析时,人们根

4


多元回归分析中变量的选择——spss的应用毕业论文设计.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:煤炭经营资格申请书

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: