x3 . . 1.00 0.38 0.31….. 0.64 0.58 0.51 ……………...
x15 . . . . . . . . . . . . . . 1 .65 相关阵对称,数据行只须
列出相关阵的上三角部分
x16 . . . . . . . . . . . . . . . 1 ;
proc princomp data=d731(type=corr)
n=3 outstat=s731 ; var x1-x16; run;
PROC PRINCOMP语句中,选项data=d731的括号里指出数据集d731的类型是相关阵,在这里或在DATA步中数据集选项type=corr必有一处是不可缺少的.选项n=3规定只输出3个主成分的有关信息.outstat=s731生成输出统计量的数据集S731是为下面绘制因子负荷量的散布图准备数据。?? Proc print data=s731; Run; data t731; set s731;
if _type_='SCORE'; run;
proc transpose data=t731 out=tt731 prefix=f;
var x1-x16; run; data dt731; set tt731;
p1=sqrt(7.03648)*f1; p2=sqrt(2.61403)*f2; Run;
options ps=40; proc plot data=dt731;
plot p2*p1 $ _name_='*'/vref=0 ; run;
例子7.3.1的输出结果
例子7.3.1的结果分析
1. 前三个主成分说明的方差比例已在70%以上;
2. 由最大特征值对应的特征向量(即列标题为 PRIN1的列)可得第
一主成分:
PRINT1=0.3446X1+0.2662X2+…+0.1634X16
各指标的系数都为正,数值均在0.1至0.3之间.这个主成分一般称为魁梧因子(或大小因子);
3. 由次大特征值对应的特征向量(即列标题为PRIN2的列)可得出第二主成分:
PRINT2=-0.1968X1 - 0.1473X2+0.3137X3+…+0.3599X16
各指标的系数有正有负,负系数对应的变量(X1,X2等)都是反映人体高低的变量 ; 正系数对应的变 量(X3,X16等)都是反映人体胖瘦的变量.这个主成分一般称为高低或胖瘦因子;
4. 由第三大特征值对应的特征向量(即列标题PRIN3的列)可得出第三主成分 PRINT3.查看各指标的系数,发现绝对数值最大和次大对应的变量为前胸(X9)和后背(X10).故这个主成分一般称为特体因
子.
VARCLUS过程
在SAS/STAT软件中提供的VARCLUS过程专用于对变量进行分类,它根据相关阵或协差阵对变量进行分裂聚类或谱系聚类.类的选择原则根据主成分分析和因子分析的思想,它使得每一类的第一主成分或重心分量所解释的方差为最大.?
VARCLUS过程把一组数值变量分为或是不相交的或是谱系的类.同每一类有联系的是该类中这些变量的线性组合,它可能是第一主分量或是重心分量.第一主成分是这些变量的加权平均,它尽可能多地解释方差.如果希望类分量为标准化变量(没有加权)的平均,或者 没有标准化的变量的平均(用选项COV)时,使用重心分量(使用选项CENTROID).这里类分量是指类的第一主分量或重心分量.?
例如,一种教育情况的检查可能包含有50个项目(变量). VARCLUS过程可用来将这些项目分为几类,比如说5个类.每一类将用于处理一部分检查,而且这一部分检查的得分将由类分量给出.如果这个类分量是协差阵的重心分量,那么每组检查简单地是这一部分检查中各项的得分和.? 变量聚类的步骤:?
如果没有为过程提供初始分类的情况(缺省时),VARCLUS过程开始把所有变量看成一个类,然后它重复以下步骤:? (1) 首先挑选一个将被分裂的类.?
根据规定的选项,选中的类应该是:或者用它的类分量所解释的方
差的百分比最小(选项PRECENT=),或者同第二主分量有关的特征根为最大(选项MAXETGH=).? (2) 把选中的类分裂成两个类?
首先计算开头两个主分量,再进行斜交旋转(在特征向量上执行QUARTIMAX旋转),并把每个 变量分配到旋转分量对应的类里,分配的原则是使变量与这个主分量的相关系数为最大.? (3) 变量重新归类?
通过多次反复循环,变量被重新分配到这些类里,使得由这些类分量所解释的方差为最大 .重新分配可能要求保持谱系结构.? 样品分类
对p个变量(指标)观测n次,得n个样品,记 X(i) =(xi1, xi2 ,…, xip)′
为第i个样品,看成p维空间的点,可按距离相近的程度进行分类(参见第六章聚类分析),即若‖ X(i) - X(j)‖≈0,就把第i个样品和第j个样品归为一类.。因原始数据阵X≈X*,故‖ X(i) - X(j)‖≈ ‖ X*(i) - X*(j)‖由(7.3.1)及(7.3.2)式中x*ik的定义知