华东理工大学2013—2014 学年 第 二 学期
《 多元统计学 》实验报告5
班级 学号 姓名
开课学院 商学院 任课教师 任飞 成绩
实验内容:实验 5 聚类分析方法 1.熟悉SPSS中聚类分析的距离选择功能 2.熟悉SPSS中聚类分析的系统聚类功能 实验要求: 1.选用例题5.1 文件中的变量,完成系统聚类法的各种结果的比较分析 2.对案例:Crop’Pain连锁店,展开聚类分析讨论 教师评语: 教师签名: 年 月 日
实验报告:
1.例题5.1 从21个工厂各抽一件同类产品,每个产品测两个质量指标,记作x1、x2,要求将各厂的产品按质量情况进行分类。
Analyze-Classify-Hierarchical Cluster,在Measure栏中选择距离测度方法: Block ---dij(1)
分析:表明实验是对样品进行分类的。Valid下面的数据21表明有效数据共21组,占总数据的百分比为100%,而被排除的无效数据(missing)为0,百分比为0%。总数据为21组。
1
分析:coefficients下对应的数字为分类的系数,Next stage表明被聚合成一类的数据,其下一步将会参与到哪个阶段的聚类当中,比如说Stage1所对应的next stage为stage 6,表明stage1中的数据或者数据会参与到第6阶段的聚合中,而由stage6可知,数据17缺确实与数据19进行了聚类。
2
上图是本次实验的聚类图,用很简明直观的方法显示出了整个聚类的阶段过程,一目了然。图中附带了刻度,也就是说越是靠前,刻度值越小的聚类,越先发生。比如上图中,最先聚合的,就是以1为标准来进行分类的数据有17,18,19,20组,1、2组,5、6组等。
Method中还有Euclidean distance ---dij(2),Squared Euclidean distance,Chebychev ---dij(∞), Minkowski ---dij(q),Cosine ---cij(1),Pearson correlation ---cij(2),其所产生的图的类别虽然相同,但是由于计算点点之间的距离的方法不一样,因此所分类的阶段和先后顺序有所差别。
2.对案例:Crop’Pain连锁店,展开聚类分析讨论
Analyze-Classify-Hierarchical Cluster,在Cluster Method栏中选择系统聚类方法: 最短距离法(Nearest Linkage)
3
最长距离法(Furthest Linkage)
中间距离法(Median Linkage)
4
重心法(Centroid clustering)
类平均法(Between-groups Linkage)
5