;
PROC REG;
MODEL y=x1-x5/SELECTION=RSQUARE ADJRSQ CP MSE AIC BEST=10; RUN; 练习4.1
TITLE’主成分分析’; DATA ex4-1; INPUT x1-x12; CARDS;
46 55 126 51 75.0 25 72 6.8 489 27 8 360 ... … …
48 68 100 45 53.6 23 70 7.2 522 28 9 352 … … … ;
PROC PRINCOMP; RUN;
练习4.2
??1????令?I3?A?????1???0,解得:?1=1+2? ?2=1?? ?3?1??
??????1?x1??0??3????1?2?I?Ax?0?对于?1=1+2?有?求得其特征向量为???????2????3??x??0??3???333? ??3??x1??0?????1??I?A?对于?2=1??有???????x2???0?求得其特征向量为K1?1?K2?2?K1,K2不同时为0?
?x??0??3???其中?1=?0???22??22??=,?1??22???0?2?? 2??练习4-3
TITLE’主成分分析’
OPTION LINESIZE=120; DATA ex4-3;
INPUT mz $ x1-x8; CARDS
满族 16.01 6.06 62.73 494.5 17.02 139.3 7.2 8.34 … … …
毛南族 25.83 7.14 117.30 220.0 29.13 81.0 20.3 3.76 ;
;
PROC PRINCOMP N=4 OUT=COMP;
RUN
PROC SORT DATA=COMP; BY PRIN1 RUN
PROC PRINT ID mz
VAR PRIN1 PRIN2 X1-X8
TITLE’用第一主成分对42个少数民族进行排序‘;
;
RUN;
练习4.4
TITLE’从方差协方差矩阵出发进行主成分分析和因子分析;
DATA ex4-4(TYPE=COV)OUTPUT a(TYPE=CORR); -TYPE-=’COV\\
INPUT –name-$ x1-x14; CARDS;
7.033 2.168 3.540 1.213 1.681 1.498 1.276 2.718 2.827 9.358 8.889 5.154 2.227 5.213
4.89 2.874 0.709 1.276 1.178 1.161 1.765 1.799 8.043 7.611 5.68 2.155 2.939
30.53 5.336 4.638 5.359 5.864 5.713 4.423
2.678 1.254 1.543 1.538 1.512
3.107 1.6 1.851 1.74
4.028 2.164 1.479
3.86 1.197
5.241
PROC PRINCOMP; RUN;
5-1
答:主成分分析与因子分析都是研究多个变量间的互依性,但出发点不同。主成分分析是寻找出能反映原变量信息的综合指标,是对变量共性的一种提取,主成分的个数与原变量数相同,贡献大的主成分常用于评价,或进一步分析,贡献小的主成分常用于判断变量间的关系。因子分析是寻找出能解释原变量的公共因子,这些公共因子互相独立代表某一方面的特性,
它们不能被测量,但对可测量的变量产生影响,或者说通过这些变量体现出来。因子分析的任务是通过原变量提供的错综复杂的关系,寻找潜在的公共因子,当初始因子不好解释时,常对其作旋转变换。提取公共因子的方法很多,主成分是最常用的提取公共因子的方法之一。因此,很多应用者将主成分和因子分析看成一回事,这事片面的。
5-2
TITLE’因子分析’;
OPTION LINESIZE=120; DATA ex5_2; INPUT x1-x12; CARDS;
46 55 126 51 75.0 25 72 6.8 489 27 8 360 ..........
48 68 100 45 53.6 23 70 7.2 522 28 9 352 ;
/*从原始数据出发,进行因子分析*/
PROC FACTOR METHOD=P N=3 ROTATE=VARIMAX; RUN;
/*从协方差矩阵出发,进行因子分析*/
PROC FACTOR COV METHOD=P N=3 ROTATE=VARIMAX; RUN;
练习5.4
TITLE’因子分析与因子旋转’; DATA ex5_4(TYPE=CORR); _TYPE_=”CORR”;
INPUT _name_$ x1—x12; CARDS;
x1 1 x2 0.69
0 1 x3 0.590.65
6 5
1
x4 0.510.550.60
5 7 0 1
x5 0.420.390.380.25
1 7 6 5
1
x6 0.350.300.250.200.610 0 2 0 1 1
x7 0.370.340.320.250.640.61
6 9 9 8 2 1
1 x8 0.400.440.350.310.66
0.640.73
1 5 8 1 0.340.380.28x9
2 1 4
x10.320.370.320 5 7 4 x10.260.380.251 0 5 5 x10.160.200.142 5 0 6
;
0 0 2 8
0.240.400.660.431 7 0 5 0.280.350.400.396 9 7 2 0.250.320.370.402 1 0 8 0.140.160.230.305 2 6 3
0.47
1 8
0.380.46
1
5 0 0.370.400.38
1
9 6 4
0.280.270.210.39
1
5 8 3 8
/*方差最大正交旋转*/
PROC FACTOR METHOD=P N=4 ROTATE=VARIMAX RES; RUN;
/*斜交旋转*/
PROC FACTOR METHOD=P N=3 ROTATE=PROMAX RES; RUN; 6-1解:
不妨假设回归方程为:logitP????x。
?p0/1?p0?(1)ln(OR)?ln???logitP0?logitP1???(???)???
p/1?p?11???ln1可解释为优势比导数的对数值。 OR对例6.1,当x=0时,logitP0?lnp055?ln??,??1.0629 1?p019 当x=1时,logitp?lnp1128?ln????,???1.3107 1?p1164所以相应的logistic回归方程为logitP=1.0629-1.3107x (2)ln(OR)?ln??p1/1?p1???logitP?1?(???)?(???)?2?
p/1?p??1?1???lnOR可解释为优势比平方根的对数值。
当x=1时,logitp1?lnp155?ln???? 1?p119p?1128?ln????
1?p?1164当x=-1时,logitp?1?ln联列上面两式,解得:??0.4075,??0.6554
所以相应的logistic回归方程为logitP=0.4075+0.6554x 6-2 解:
Title ‘logistic回归’; Data ex6-2;
Input f y x1 x2 @@ ; x12=x1*x2;
lable x1=”吸烟否”; lable x2=”用药否”; cards;
14 1 2 0 ;
Proc logistic descending; Weight f;
Model y=x1 x2 x12; Run;
Proc sort ;by x2 ;
Proc logistic descending;
Weight f; Model y=x1; By x2; Run; 6 -3 解:
Data ex6-3; Do y= 0 to 1; Do cho 1 to 4; Do sbp 1 to 4; Input f @@; Output ; End; End; End; Cards;
2 3 8 11 117 121 119
209 ;
Data temp ; Set ex6-3;
1 1 1 1 3 4 6 6 47 22 68 43 7 1 22 0 3 2 7 12 85 98 67 99 1 0 1 0 0 3 11 11 43 20 46 33
8
12