东北大学秦皇岛分校毕业设计(论文) 第 21 页
在评价回归方程拟合效果,我们主要考虑以下三个方面:(1)用回归直线做拟合检验;(2)考察回归方程的线性关系;(3)显著性检验回归系数[13]。
有许多种方法来判定回归模型能否恰当地表示所分析的数据,在此仅介绍如何使用简单的残差诊断与共线性诊断。 4.4.1 残差诊断
回归模型时对观测点集拟合的关系式。从回归模型出发,可以得到预测值。观测值
和预测值之间的差称为残差。一般地说,如果回归方程较好地反映y与x的线性关系,残差应该是服从正态分布的。所以较简单的方法是作残差图。
一般认为,若一个回归模型满足所给的基本假定,所有残差应是在e=0附近随机变
化,并落在差异不大的一条带子中,也就可以说明回归模型满足基本假设。 4.4.2 共线性诊断
我们称拟合多元回归时,各自变量间存在线性或近似线性的关系为共线性问题。共线性诊断是对自变量观测值构成的矩阵XTX进行分析。共线性诊断常用条件指数和方差膨胀因子。
东北大学秦皇岛分校毕业设计(论文) 第 22 页
5 数理统计在经济和管理中的应用实例
数理统计在经济和管理中有着广泛的应用,数理统计的应用为高层管理者提供了决 策支持和理论保障。而数理统计在经济和管理中的应用也促进了数理统计的发展。下面本文就数理统计在经济和管理中的应用作出简要的实例分析并进行软件实现。 5.1 假设检验在生产管理中的MATLAB实现
工厂在日常的生产活动中,由于生产技术上的创新、管理的改善或劳动力的增加,往往能提高工厂的生产效率,但是这些成本投入是否能为工厂带来经济效益的提高仍尚待考量。首先,我们给出一个简单的例子。
某工厂甲、乙两台机床加工同一种产品,其中,乙机床是新引进的加工设备,从中随机抽取若干件由这两台机床加工的产品,测得所抽取产品直径(单位:mm)如下:
甲机床:20.1 20.0 19.4 20.5 20.1 19.8 20.2 19.7 19.2 19.5 乙机床:19.0 18.8 20.0 20.0 19.6 19.8 19.9 20.3 20.1 19.6 试求甲、乙两台机床所加工产品的直径方差相等与否?取置信度??0.05[14]。 解析: 这是母体均值未知时的两个正态方差的比较检验,据题目要求,由已知条件建立如下假设:
H0:?12??22,H1:?12??22
MATLAB的实现:
打开MATLAB的Command Window,输入程序 clear all; A=[20.1
20 19.4
20.5
20.1
19.8
20.2
19.7
19.2
19.5]
%定义甲机床对应的子样观测值向量 B=[19 18.8
20 20 19.6
19.8
19.9
20.3
20.1
19.6]
%定义乙机床对应的子样观测值向量 alpha=0.05;
%取置信度等于0.05 tail='both'; %尾部类型为双侧
[h,p,CI,STATS]=vartest2(A,B,alpha,tail)
东北大学秦皇岛分校毕业设计(论文) 第 23 页
%调用vartest2函数进行两个正态母体方差的比较检验,返回变量h、检验的p值、方差之比的置信区间CI及结构变量
运行程序,输出结果 A =
20.1000 20.0000 19.4000 20.5000 20.1000 19.8000 20.2000 19.7000 19.2000 19.5000
B =
19.0000 18.8000 20.0000 20.0000 19.6000 19.8000 19.9000 20.3000 20.1000 19.6000
h = 0 p = 0.6153 CI =
0.1759 2.8507 STATS = fstat: 0.7081 df1: 9 df2: 9
由输出结果可知,p =0.6153>0.05,因此,在置信度??0.05下接受原假设,可以认为甲、乙两台机床加工的产品直径方差相等,该工厂没有必要引进乙机床加工设备。 5.2 回归分析模型在国民经济核算中的应用及SPSS求解
国民经济是衡量一个国家经济发展的重要指标,也是一个国家综合国力的重要体现。目前,我国已超越日本成为世界第二大经济体,但这并不意味着我们已步入发达国家行列,而且我们尚未步入小康社会。到2020年我国即将全面实现小康社会,国民经济必大有增长。下面我们以1978年至2013年国内生产总值[15]为例,研究其对应的回归模型.
东北大学秦皇岛分校毕业设计(论文) 第 24 页
表5.1 国内生产总值
本表按当年价格计算。 单位:亿元
年 份 国内生产总值 第一产业 第二产业 第三产业
1978 1980 1985 1990 1995 2000 2005 2010 2011 2012 2013
3645.2 4545.6 9016.0 18667.8 60793.7 99214.6 184937.4 401512.8 473104.0 519470.1 568845.2
1027.5 1371.6 2564.4 5062.0 12135.8 14944.7 22420.0 40533.6 47486.2 52373.6 56957.0
1745.2 2192.0 3866.6 7717.4 28679.5 45555.9 87598.1 187383.2 220412.8 235162.0 249684.4
872.5 982.0 2585.0 5888.4 19978.5 38714.0 74919.3 173596.0 205205.0 231934.5 262203.8
1、作出因变量y与各个自变量的样本散点图
记国内生产总值为因变量y,第一产业为自变量x1,第二产业为自变量x2,第三产业为自变量x3.
(1)打开spss数据管理窗口,定义四个数值比变量:国内生产总值y,第一产业x1,第二产业x2,第三产业x4,输入表1的数据。
(2)正确操作spss,分别输出y与x1、y与x2、y与x3的散点图(图5.1、图5.2、图)
东北大学秦皇岛分校毕业设计(论文) 第 25 页
图5.1 y与x1散点图 图5.2 y与x2散点图 图5.3 y与x3散点图 2、利用spss求回归方程
由因变量y与各自变量x1、x2、x3间的散点图可知y与x1、x2、x3线性相关。设回归方程为
y??0??1x1??2x2??3x3 (5.1)
取选入变量的显著性水平为0.05,则对回归方程进行检验时,若P≤0.05,则该变量可选入方程;取剔除变量显著水平为0.10,则对回归方程进行检验时,若P≥0.10,则从方程中剔除该变量。正取操作spss,输出如下结果: