华理多元统计实验6

2020-03-27 13:09

华东理工大学2013—2014 学年 第 二 学期

《 多元统计学 》实验报告5

班级 学号 姓名

开课学院 商学院 任课教师 任飞 成绩

实验内容:实验 5 聚类分析方法 1.熟悉SPSS中聚类分析的距离选择功能 2.熟悉SPSS中聚类分析的系统聚类功能 实验要求: 1.选用例题5.1 文件中的变量,完成系统聚类法的各种结果的比较分析 2.对案例:Crop’Pain连锁店,展开聚类分析讨论 教师评语: 教师签名: 年 月 日

实验报告:

1.例题5.1 从21个工厂各抽一件同类产品,每个产品测两个质量指标,记作x1、x2,要求将各厂的产品按质量情况进行分类。

Analyze-Classify-Hierarchical Cluster,在Measure栏中选择距离测度方法: Block ---dij(1)

分析:表明实验是对样品进行分类的。Valid下面的数据21表明有效数据共21组,占总数据的百分比为100%,而被排除的无效数据(missing)为0,百分比为0%。总数据为21组。

1

分析:coefficients下对应的数字为分类的系数,Next stage表明被聚合成一类的数据,其下一步将会参与到哪个阶段的聚类当中,比如说Stage1所对应的next stage为stage 6,表明stage1中的数据或者数据会参与到第6阶段的聚合中,而由stage6可知,数据17缺确实与数据19进行了聚类。

2

上图是本次实验的聚类图,用很简明直观的方法显示出了整个聚类的阶段过程,一目了然。图中附带了刻度,也就是说越是靠前,刻度值越小的聚类,越先发生。比如上图中,最先聚合的,就是以1为标准来进行分类的数据有17,18,19,20组,1、2组,5、6组等。

Method中还有Euclidean distance ---dij(2),Squared Euclidean distance,Chebychev ---dij(∞), Minkowski ---dij(q),Cosine ---cij(1),Pearson correlation ---cij(2),其所产生的图的类别虽然相同,但是由于计算点点之间的距离的方法不一样,因此所分类的阶段和先后顺序有所差别。

2.对案例:Crop’Pain连锁店,展开聚类分析讨论

Analyze-Classify-Hierarchical Cluster,在Cluster Method栏中选择系统聚类方法: 最短距离法(Nearest Linkage)

3

最长距离法(Furthest Linkage)

中间距离法(Median Linkage)

4

重心法(Centroid clustering)

类平均法(Between-groups Linkage)

5


华理多元统计实验6.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:5S现场管理培训试卷

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: