天津理工大学实验报告
学院(系)名称:计算机与通信工程学院 姓名 班级 课程名称 实验时间 批改意见 学号 实验项目 专业 聚类分析、主成分分析与因子分析 课程代码 实验地点 成绩 0665106 7号楼216 数据分析及其应用软件 2016年4月13号3、4节,中午 教师签字: 一.系统聚类分析: 1. 实验目的 掌握系统聚类分析的基本思想,并能够对分析结果进行解释。 2. 实验环境 SPSS软件。 3. 实验过程记录 (1)在spss中录入数据。 (2)打开系统聚类对话框,选择参与系统聚类分析的变量 第1页 共14页
(3)选择聚类方法,并按下图勾选相应项。 (4)选定凝聚状态表及冰柱图(谱系图)。 (5)点击“继续”,便会得到凝聚状态表和树状图。 4. 实验结果及分析。 第2页 共14页
凝聚状态表: 谱系图: 结果分析: 实验所用数据中参与聚类分析的对象分为三类比较合适,如下表:第三类地区企业盈利属于高水平,第一类地区企业盈利属于中等水平,第二类地区企业盈利属于低水平。 第3页 共14页
类别 地区 北京,天津,上海,甘肃,青海,海南,贵州,山西,重庆,黑龙江,新疆,宁夏 广西,云南,四川,江西,陕西,吉林,安徽,内蒙古 山东,湖南,福建,湖北,江苏,广东,河北,河南,辽宁,浙江 地区个数 第一类 12 第二类 8 第三类 10 二.K-均值聚类分析: 1. 实验目的 掌握K-均值聚类分析的基本思想,并能够对分析结果进行解释。 2. 实验环境 SPSS软件。 3. 实验过程记录。 (1)沿用上面的数据,并对变量差异较大的原始数据进行标准化。 (2)打开K均值聚类分析的对话框,将所有标准化后的变量选入变量框里,地区作为个案标注依据; (3)点击迭代按钮,选择迭代次数为10,点击保存按钮并勾选聚类成员; (4)点击选项按钮并勾选初始聚类中心和anova表,最后点击OK按钮。 第4页 共14页
4. 实验结果及分析。 初始聚类中心 聚类 1 2 -1.19197 -1.21582 -.58671 -.44782 -1.08753 2.74311 3 2.45457 2.39791 1.42907 2.10744 -.95640 .14202 .02881 Zscore(企业个数) .04567 Zscore(盈利个数) -.11133 Zscore(净利润) -.34695 Zscore(营业收入) 1.90731 Zscore(增加值率) Zscore(全员劳动生产率) -.54389 迭代历史记录a 聚类中心中的变动 迭代 1 2 3 4 1 1.656 .588 .124 .000 2 1.417 .000 .000 .000 3 1.584 .965 .180 .000 聚类中心的选择原则是聚核点距离其他点尽可能远。 随着迭代次数增加,类别聚合点的变化越来越小,实验中只用了4次迭代就已经收敛了。 最终聚类中心 聚类 Zscore(企业个数) Zscore(盈利个数) Zscore(净利润) Zscore(营业收入) Zscore(增加值率) 1 -.38144 -.37598 -.58152 -.61849 .31160 2 -1.09240 -1.09455 -.41480 -.50521 -.82668 3 .97617 .96753 1.11302 1.20300 -.28172 第5页 共14页