实验报告八-SAS聚类分析与判别分析(4)

2019-04-10 10:02

1?R**2Ratio?1?(R?squared with Own Cluster)1?(R?squared with Next Closest) 此值越小,表明分类越合理。从此列可看出,比值不是很大,说明这7个变量分成两类可能较合适的。 表8.12 Standardized Scoring Coefficients Cluster Ag Al Cu Ca Sb Bi Sn 1 2 Ag 0.000000 0.401833 Al 0.246204 0.000000 Cu 0.338476 0.000000 Ca 0.331353 0.000000 Sb 0.238418 0.000000 Bi 0.000000 -.356975 Sn 0.000000 0.422982 由表8.12 从标准化变量预测类分量的标准回归系数(Standardized Scoring Coefficients)看出各变量只对本类的类分量有贡献,对其他类分量的回归系数为0。若设C1、C2分别为第一类、第二类分量,则有: C1?0.246204Al?0.338476Cu?0.331353Ca?0.238418Sb C2?0.401833Ag?0.356975Bi?0.422982Sn 表8.13 Cluster Structure Cluster Ag Al Cu Ca Sb Bi Sn 1 2 Ag -.133896 0.858957 Al 0.720274 -.130117 Cu 0.990216 -.400574 Ca 0.969377 -.597652 Sb 0.697494 -.168898 Bi 0.155401 -.763069 Sn -.701315 0.904167 由表8.13给出类结构( Cluster Structure)得出,因类结构相当于因子分析中的因子模型,则有: Ag??0.133896C1?0.858957C2 Al?0.720274C1?0.130117C2 Cu?0.990216C1?0.400574C2 Ca?0.969377C1?0.597652C2 Sb?0.697494C1?0.168898C2 Bi?0.155401C1?0.763069C2 Sn??7.01315C1?0.904167C2 表8.14 Inter-Cluster Correlations: Cluster 1 2 1 2 1.00000 -0.40592 -0.40592 1.00000 No cluster meets the criterion for splitting. 由表8.14类内相关系数(Inter-Cluster Correlations)得出相关系数为0.40592,大于0.3,小于0.5,第一、二类为低度相关。 表8.15: Number Total Proportioof Variation Clustern of s ExplaineVariation d Explained by by Clusters Clusters 1 2 3.740481 0.5344 5.063113 0.7233 Minimum Maximum Minimum Maximum ProportioSecond R-square1-R**2 n Eigenvalud Ratio Explained e for a for a by a in a Variable VariablCluster Cluster e 0.5344 0.7125 1.658120 0.1731 0.938033 0.4865 0.5286 由表8.15汇总信息得出,第一类能解释的总方差量为3.740481,解释的方差占7个变量的总方差的53.44%,由一类成分能解释的方差占全部7个变量的总方差的最小百分比为0.5344,1个变量与其所在类的类分量的最小相关系数的平方R2(Minimum R-squared for a Variable)为0.1731,各类中 (1?R2)own/(1?R2)next 的最大比值(Maximum 1-R**2 Ratio for a Variable)为空。第二类能解释的总方差量为5.063113,解释的方差占7个变量的总方差的72.33%,由一类成分能解释的方差占全部7个变量的总方差的最小百分比为0.7125,1个变量与其所在类的类分量的最小相关系数的平方R2(Minimum R-squared for a Variable)为0.4865,各类中 (1?R2)own/(1?R2)next 的最大比值(Maximum 1-R**2 Ratio for a Variable)为0.5286,。最大的第二特征值分成两类时已经小于1,说明分类数为二合适。 图8.6 聚类谱系图 由图8.6得出,分为两类较合适,第一类为Sn、Bi、Ag,第二类为Sb、Ca、Cu、Al。 【练习8-4】根据经验,今天与昨天的湿度差x1及今天的压温差(气压与温度之差)x2是预报明天是否下雨的两个重要因素。现收集到一批样本数据如表。 今测得x1?0.6,x2?3.0,假定两组的协方差矩阵相等。 RaD 1 1 1 1 1 1 1 1 1 1 2 2 2 Wet -1.9 -6.9 5.2 5 7.3 6.8 0.9 -12.5 1.5 3.8 0.2 -0.1 0.4 PesT 3.2 10.4 2 2.5 0 12.7 -15.4 -2.5 1.3 6.8 6.2 7.5 14.6 2 2 2 2 2 2 2 2.7 2.1 -4.6 -1.7 -2.6 2.6 -2.8 8.3 0.8 4.3 10.9 13.1 12.8 10 (“1”表示雨天,“2”表示非雨天) ①试用距离判别法预报明天是否会下雨,并估计误判概率; ②假定两组x?(x1,x2)均服从二元正态分布,且根据其他信息及经验给出先验概率p1?0.3,p2?0.7,试用贝叶斯判别法预报明天是否下雨; 【解答】 利用编程过程实现题目数据: data Lmf.p84; input RaD Wet PesT@@; cards; 1 -1.9 3.2 1 -6.9 10.4 1 5.2 2.0 1 5.0 2.5 1 7.3 0.0 1 6.8 12.7 1 0.9 -15.4 1 -12.5 -2.5 1 1.5 1.3 1 3.8 6.8 2 0.2 6.2 2 -0.1 7.5 2 0.4 14.6 2 2.7 8.3 2 2.1 0.8 2 -4.6 4.3 2 -1.7 10.9 2 -2.6 13.1 2 2.6 12.8 2 -2.8 10.0 ; run; ①试用距离判别法预报明天是否会下雨,并估计误判概率; 利用proc discrim过程步实现距离判别分析: proc discrim data=lmf.p84 distance lister; class RaD; var Wet PesT; run; 结果: 表8.16 The DISCRIM Procedure Total Sample Size 20 Variables Classes DF Total 19 ,2 DF Within Classes 18 2 DF Between Classes 1 由表8.16 判别分析过程(The DISCRIM Procedure)得知,总样本数(Total Sample Size)为20,变量(Variables)个数为2,分类(Classes)个数为2及自由度。 表8.17 Class Level Information RaD Variable Frequency Weight Proportion Prior Name Probability 1 _1 2 _2 10 10 10.0000 0.500000 10.0000 0.500000 0.500000 0.500000 由表8.17各类别信息(Class Level Information)得知,第一、二类的样本数(Frequency)分别为10、10;两类别权重(Weight)分别为10、10;两类别分别占样本数(Proportion)的50%、50%,两类别的先验概率(Prior Probability)为0.5、0.5。 表8.18 Pooled Covariance Matrix Information: Covariance Natural Log of the Matrix Rank Determinant of the Covariance Matrix 2 6.81587 表8.18 合并协方差矩阵信息(Pooled Covariance Matrix Information),协方差矩阵的秩(Covariance Matrix Rank)为2,协方差矩阵行列式的自然对数(Natural Log of the Determinant of the Covariance Matrix)为6.81587。 表8.19 Squared Distance to RaD: From RaD 1 2 0 1 2 1.30685 1.30685 0 (a) F Statistics, NDF=2, DDF=17 for Squared Distance to RaD From RaD 1 2 0 3.08561 (b) Prob > Mahalanobis Distance for Squared Distance to RaD From RaD 1 1 1.0000 2 0.0719 1 2 3.08561 0


实验报告八-SAS聚类分析与判别分析(4).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:七年级数学寒假乐园试题

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: