实验报告八-SAS聚类分析与判别分析(5)

2019-04-10 10:02

2 0.0719 (c) 1.0000 Generalized Squared Distance to RaD From RaD 1 2 0 1.30685 1 2 1.30685 0 (d) 由表8.19 组间距离平方(Squared Distance to RaD)得知,两组间的距离平方(马氏距离)为1.30685,检验H0:μ1=μ2的F统计量为3.08561,p值为0.0719<0.1,说明雨天、非雨天有较显著的差异,判别归类具有一定意义。广义组间距离平方(Generalized Squared Distance to RaD)与组间的马氏距离平方相等。 表8.20 Linear Discriminant Function for RaD: Variable 1 2 -1.02533 -0.04553 0.22976 Constant -0.06870 Wet PesT 0.03251 0.05118 由表8.20得出线性判别函数: ?1?0.03251Wet?0.05118PesT?0.06870 ?2??0.04553Wet?0.22976PesT?1.02533 表8.21 Posterior Probability of Membership in RaD Posterior Probability of Membership in RaD Obs From RaD Classified into RaD 2 6 15 21 1 1 2 . 2 2 1 1 * * * * 1 2 0.1917 0.8083 0.3142 0.6858 0.7266 0.2734 0.7211 0.2789 * Misclassified observation 由表8.21组中成员的后验概率( Posterior Probability of Membership in RaD)得知,第2个观测值被误判为第一类雨天,根据线性判别函数得出第2个观测值在第一、二类的后验概率分别为0.1917、0.8083;第6个观测值被误判为第一类雨天,根据线性判别函数得出第6个观测值在第一、二类的后验概率分别为0.3142、0.6858;第15个观测值被误判为第二类非雨天,根据线性判别函数得出第15个观测值在第一、二类的后验概率分别为0.7266、0.2734。并由此得到,当湿度差(Wet)为0.6,压温差(PesT)为0.3时,分为第一类,为雨天。 表8.22 Number of Observations and Percent Classified into RaD: From RaD 1 1 8 80.00 2 2 20.00 Total 10 100.00 10 100.00 2 1 10.00 9 90.00 11 55.00 Total 9 45.00 20 100.00 Priors 0.5 0.5 由表8.22得知已知第一类雨天的样本被判别函数归入第一、二类的频数分别为8、2,百分比分别为80%、20%;已知第二类非雨天的样本被判别函数归入第一、二类的频数分别为1、9,百分比分别为10%、90%。 表8.23 Error Count Estimates for RaD: 1 2 Total Rate 0.2000 0.1000 0.1500 Priors 0.5000 0.5000 由表8.23各类别的错误分类率( Error Count Estimates for RaD)得出第一类的错分率高,为20%,各类别的总错分率为0.15=0.2*0.5+0.1*0.5。 综上,利用距离判别法预报明天会下雨,误判概率为0.15。 ,x?(x,x)12②假定两组均服从二元正态分布,且根据其他信息及经验给出先验概率p1?0.3,p2?0.7,试用贝叶斯判别法预报明天是否下雨; ⑴利用proc discrim过程步实现Bayes判别分析: 预处理:由于两个总体的协方差矩阵不知道是否相等,因此我们利用语句pool=test确定两个总体的协方差矩阵的相等性。 proc discrim data=Lmf.p84 pool=test crosslist; class RaD; priors '1'=0.3 '2'=0.7; var Wet PesT; run; 结果: Chi-Square DF Pr>ChiSq 8.733528 3 0.0331 由于P值为0.0331<0.05,因此拒绝两正态总体相等的假设,因此两正态总体协方差矩阵不相等。 利用proc discrim过程步实现Bayes判别分析: OPTIONS PS=500; proc discrim data=Lmf.p84 pool=no crosslist; class RaD; priors '1'=0.3 '2'=0.7; var Wet PesT; run; 结果: 表8.24 The DISCRIM Procedure: Total Sample Size 20 Variables Classes DF Total 19 2 DF Within Classes 18 2 DF Between Classes 1 由表8.24判别分析过程(The DISCRIM Procedure)得知,总样本数(Total Sample Size)为20,变量(Variables)个数为2,分类(Classes)个数为2及自由度。 表8.25 Class Level Information: RaD Variable Frequency Weight Proportion Prior Name Probability 1 _1 2 _2 10 10 10.0000 0.500000 10.0000 0.500000 0.300000 0.700000 由表8.25各类别信息(Class Level Information)得知,第一、二类的样本数(Frequency)分别为10、10;两类别权重(Weight)分别为10、10;两类别分别占样本数(Proportion)的50%、50%,两类别的先验概率(Prior Probability)为0.3、0.7,由题目给出。 表8.26 Within Covariance Matrix Information: RaD Covariance Natural Log of the Matrix Rank Determinant of the Covariance Matrix 1 2 2 2 表8.26组内协方差矩阵信息(Within Covariance Matrix Information),协方差矩阵的秩(Covariance Matrix Rank)为2,协方差矩阵行列式的自然对数(Natural Log of the Determinant of the Covariance Matrix)分别为7.78344、4.74512。 表8.27 Generalized Squared Distance to RaD: Generalized Squared Distance to RaD From RaD 1 2 1 10.19139 11.05618 2 8.13871 5.45847 7.78344 4.74512 表8.27广义组间距离平方(Generalized Squared Distance to RaD)两两配对的组间平方距离为 D2(1|1)?10.19139,D2(1|2)?8.13871, D2(2|1)?11.05618,D2(2|2)?5.45847。 表8.28 Number of Observations and Percent Classified into RaD: Classification Summary for Calibration Data: LMF.P84 Resubstitution Summary using Quadratic Discriminant Function From RaD . 1 0 0.00 2 1 Total 1 100.00 100.00 4 1 6 10 100.00 60.00 40.00 2 0 0.00 10 10 100.00 100.00 15 Total 6 21 100.00 28.57 71.43 Priors 0.3 0.7 因在正态总体的情况下,按Bayes判别的思想,在错判造成的损失认为相等的情况下得到的判别函数相当于马氏距离判别在考虑先验概率及协方差阵相等情况下的推广,因此得出表8.28的结果,第一类雨天的样本被判别函数归入第一、二类的频数分别为6、4,百分比分别为60%、40%;已知第二类非雨天的样本被判别函数归入第一、二类的频数分别为0、10,百分比分别为0%、100%。 表8.29 Error Count Estimates for RaD 1 2 Total Rate 0.4000 0.0000 0.1200 Priors 0.3000 0.7000 由表8.23各类别的错误分类率( Error Count Estimates for RaD)得出第一类的错分率高,为40%,各类别的总错分率为0.12=0.4*0.3+0*0.7。 表8.30 Posterior Probability of Membership in RaD Obs From RaD Classified into RaD 1 2 3 4 5 6 7 8 9 10 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 2 2 * * * * 1 2 0.1781 0.8219 0.1893 0.8107 0.7196 0.2804 0.6518 0.3482 0.9713 0.0287 0.6017 0.3983 0.9973 0.0027 0.9997 0.0003 0.3289 0.6711 0.2220 0.7780


实验报告八-SAS聚类分析与判别分析(5).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:七年级数学寒假乐园试题

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: