SAS备课笔记 - 简单线性回归、多元线性回归 - 图文(2)

2020-02-21 16:12

2009_SAS备课笔记_回归分析

2009_SAS备课笔记_回归分析

逐步回归的结果内容较多,涉及到每一步回归分析的详细信息。每一步的信息都有相应的标志来标识,如“Stepwise Selection: Step 1”表示逐步回归的第一步,每一步都对当前的模型进行方差分析和参数的估计并对参数进行检验,这样整个模型选择的过程我们就会一目了然。最后给出模型选择的结果和选择过程的概略信息,籍此可以确定最终的回归方程。

2009_SAS备课笔记_回归分析

【例题3】下表是对32个企业的年赔偿费用y(单位:千元),年销售额x1(单位:百万元),年利润x2(单位:百万元)和雇佣人数x3的调查数据。 考虑建立如下模型:y=β0+β1 ln x1+β2 ln x2+β3 ln x3+εi (数据编号:data7_03)

No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

【SAS程序】

y 450 387 368 277 676 454 507 496 487 383 311 271 524 498 343 354 x1 4600.6 9255.4 1526.2 1683.2 2752.8 2205.8 2334.6 2746.0 1434.0 470.6 1508.0 464.4 9329.3 2377.5 1174.3 724.7 x2 128.1 733.9 136.0 179.0 231.5 329.5 331.8 237.9 222.3 63.7 149.5 30.0 577.3 250.7 82.6 61.5 x3 4800 5590 1378 2777 3400 2650 3030 4100 2590 860 2108 687 3900 3430 1941 359 No. 17 18 19 20 21 22 23 24 25 26 27 28 20 30 31 32 y 324 225 254 208 518 406 332 340 698 306 613 302 540 203 528 456 x1 724.7 578.9 966.8 591.0 4933.1 7613.2 3457.4 545.3 2361.0 2611.1 1013.2 4560.3 855.7 1211.6 5440.1 x2 90.3 63.3 42.8 48.5 310.6 491.6 228.0 54.6 203.0 201.0 121.3 194.6 63.4 352.1 655.2 x3 391 414 626 1061 6539 8940 5520 780 33712 5200 5050 1863 9794 1230 7180 8770 22862.8 3011.3 2009_SAS备课笔记_回归分析

二、回归分析SAS编程—reg过程

reg过程只是SAS中众多关于回归的过程之一,reg是用于一般目的回归分析的过程,而其它过程则具有各自特殊的用途。reg过程涉及到较多的语句和选项,所以显得稍微复杂一些。下面我们来看看reg过程的语句和基本格式。

PROC REG < 选项列表 > ;

< 标签: > MODEL 应变量列表=<自变量列表> < / 选项列表 > ; BY 变量名列表 ; FREQ 变量名 ; ID 变量名列表 ; VAR 变量名列表 ; WEIGHT 变量名 ; ADD 变量名列表 ; DELETE 变量名列表 ;

< 标签: > MTEST <方程式<, ... , 方程式>> < / 选项列表 > ; OUTPUT < OUT=数据集名 > keyword=变量名列表 < ... keyword=变量名列表> ; PAINT <条件表达式 | ALLOBS>

< / 选项列表 > | < STATUS | UNDO> ; PLOT <=符号>

< ...y变量名*x变量名> <=符号> < / 选项列表 > ; PRINT < 选项列表 > < ANOVA > < MODELDATA > ; REFIT;

RESTRICT 条件表达式, ... , 条件表达式; REWEIGHT <条件表达式 | ALLOBS> < / 选项列表 > | < STATUS | UNDO> ;

< 标签: > TEST 变量表达式,<, ...,变量表达式> < / 选项 > ;

2009_SAS备课笔记_回归分析

Proc reg语句标志reg过程的开始,其后的选项条目较多,功能复杂,这里的选项所具有的功能将会影响到此过程中的所有model语句。各选项及其功能详见下表。

Proc reg语句各选项及其功能 选项(依字母顺序) all alpha=数值 annotate=数据集名 corr covout data=数据集名 edf gout=图形目录 lineprinter | lp noprint outest=数据集名 outseb outsscp=数据集名 outstb outvif pcomit=数值列表 press ridge=数值列表 rsquare simple singular=n tableout usscp 功能描述 执行所有选项的功能(特定语句环境下合法的选项) 以指定的数值为水准计算各种可信区间 指定包含注释信息的数据集用以向plot语句所绘图形添加特定信息 指定SAS对model语句和var语句中的所有变量输出相关矩阵 向outest选项指定的输出数据集输出协方差矩阵 指定用于进行回归分析的数据集 向outest选项指定的数据集输出自变量个数、误差自由度、R2等 指定输出图形元素保存的路径,默认值为work.gseg 以点阵方式(行式打印机方式)输出plot语句绘制的图形 禁止分析结果的输出 将参数估计值以及模型拟合过程统计量(可选)输出到指定的数据集 输出参数估计值的标准误到outest选项所指定的数据集 将SSCP矩阵内容输出到指定的数据集中 将标准化的参数估计值输出到outest选项指定的数据集中 将VIF(方差膨胀因子)输出到outest选项指定的数据集中 对列表中每一个数值进行非完全主成分分析,并输出到outest数据集 计算并输出Press统计量到outest数据集 以列表中的每一个数值为ridge常数K进行ridge回归分析,结果输出到outest数据集 向outest选项指定的数据集输出自变量个数、误差自由度、R2等 将合计、均数、方差、标准差、离均差平方和等输出到结果中 控制用来检验变量奇异性的参数n,此选项较少用到 将参数估计值的标准误、可信区间、t值、P值输出到outest数据集 将reg过程中用到的所有变量的未校正的SSCP矩阵输出到结果中

model语句

model语句用以指定所要拟合的回归模型。其最前面的标签为可选项,可以是不超过8个字符的字符串,用来对定义的模型进行标识,以便于在结果中分辨不同的模型,一般情况下系统会以默认的方式对模型进行标识,你可以省略此项。关键字model后所列的是模型表达式,和方差分析中anova过程的model语句相似。模型表达式中等号的左边为反应变量,等号的右边为自变量列表,自变量间以空格相分隔。这里所用到的所有变量必须存在于所分析的数据集中,而且是数值型的。如果要用到几个变量产生的综合变量,必须在数据步完成新变量的创建过程,model语句中的组合型变量将被视为非法。

Model语句后可设定众多的选项,选项数目比proc reg语句的要多,这里不再一一列出。不过大家不用担心,这里的选项相当一部分和proc reg语句的完全相同,功能也一样,只是作用的范围有所差别,这里的选项只作用于model语句所涉及的功能范围。但有一些选项这里需要介绍一下,因为他们非常常用并且行使重要的功能,见下表。


SAS备课笔记 - 简单线性回归、多元线性回归 - 图文(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:MB670掘锚机试题

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: