19 20 21 22 23 24 25 26 27 28 29 30 1 2 6 2 6 10 3 10 1 2 1 1 9 5 17 21 16 15 6 19 11 3 2 10 .118 .131 .133 .268 .277 .300 .341 .615 .669 .730 1.212 3.995 0 14 13 20 21 0 0 24 19 22 27 29 0 18 15 17 0 0 23 0 0 25 28 26 27 22 23 28 25 26 28 30 29 29 30 0 (3) 冰柱图(由于数据过大没法全部展示,故而截取一部分)
下图利用“组间联结”聚类法生成的冰柱图。冰柱图是反映样本聚类情
况的图,如果按照设定的类数,在那类数的行上从左到右就可以找到各类所包含的样本。
(4) 树状聚类图
下图是利用利用“组间联结”聚类法生成的树状聚类图。如果将样本分为三类的话,如图所示,第一类包括广东、山东、江苏;第二类包括浙江、北京、上海;第三类为其他省市。
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Ctluser Combine
C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+
西 藏 26 ─┐ 青 海 29 ─┤ 宁 夏 30 ─┤ 海 南 21 ─┼─┐ 甘 肃 28 ─┤ │ 新 疆 31 ─┤ │ 贵 州 24 ─┘ │ 山 西 4 ─┐ ├─────┐ 重 庆 22 ─┤ │ │ 天 津 2 ─┤ │ │ 黑龙江 8 ─┤ │ │ 广 西 20 ─┼─┘ │ 江 西 14 ─┤ │ 陕 西 27 ─┤ │ 吉 林 7 ─┤ ├─────┐ 云 南 25 ─┤ │ │ 安 徽 12 ─┤ │ │ 内蒙古 5 ─┘ │ │ 辽 宁 6 ─┐ │ │ 福 建 13 ─┼─┐ │ │
湖 北 17 ─┤ │ │ ├─────────────────────────────────┐ 湖 南 18 ─┤ ├─┐ │ │ │ 四 川 23 ─┘ │ ├───┘ │ │ 河 南 16 ───┘ │ │ │ 河 北 3 ─────┘ │ │ 北 京 1 ─┬───────┐ │ │ 上 海 9 ─┘ ├─────┘ │ 浙 江 11 ─────────┘ │ 江 苏 10 ───┬───┐ │ 山 东 15 ───┘ ├─────────────────────────────────────────┘ 广 东 19 ───────┘
下面我们把利用其它六种方法生产树状聚类图予以展示: 1)组内联结聚类法
* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * *
Dendrogram using Average Linkage (Within Group)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+
西 藏 26 ─┐ 青 海 29 ─┤ 宁 夏 30 ─┼─┐ 海 南 21 ─┘ ├───┐ 甘 肃 28 ─┐ │ │ 新 疆 31 ─┼─┘ │ 贵 州 24 ─┘ │ 山 西 4 ─┬─┐ ├─────┐ 重 庆 22 ─┘ │ │ │ 天 津 2 ───┤ │ │ 黑龙江 8 ─┐ │ │ │ 广 西 20 ─┤ ├───┘ │
江 西 14 ─┤ │ ├─────────┐ 陕 西 27 ─┤ │ │ │ 吉 林 7 ─┼─┤ │ │ 云 南 25 ─┤ │ │ │ 安 徽 12 ─┘ │ │ │ 内蒙古 5 ───┘ │ │
北 京 1 ─────┬───────┘ ├─────────────────────────┐ 上 海 9 ─────┘ │ │ 湖 北 17 ─┐ │ │ 湖 南 18 ─┼───┐ │ │ 四 川 23 ─┘ ├─┐ │ │ 辽 宁 6 ───┬─┘ ├─┐ │ │ 福 建 13 ───┘ │ ├───────┐ │ │ 河 南 16 ───────┘ │ ├─────┘ │ 河 北 3 ─────────┘ │ │ 浙 江 11 ─────────────────┘ │ 江 苏 10 ─────────────┬───────┐ │ 山 东 15 ─────────────┘ ├───────────────────────────┘ 广 东 19 ─────────────────────┘
2)最近邻元素聚类法
* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * *
Dendrogram using Single Linkage
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+
西 藏 26 ─┐ 青 海 29 ─┤ 宁 夏 30 ─┤ 海 南 21 ─┤ 甘 肃 28 ─┼─┐ 新 疆 31 ─┤ │ 贵 州 24 ─┘ │ 江 西 14 ─┐ │ 陕 西 27 ─┤ │ 黑龙江 8 ─┤ │ 广 西 20 ─┼─┤ 吉 林 7 ─┤ │ 云 南 25 ─┘ │ 山 西 4 ───┤ 重 庆 22 ───┤ 安 徽 12 ───┤ 天 津 2 ───┤ 内蒙古 5 ───┼───┐ 湖 北 17 ─┬─┤ │ 湖 南 18 ─┘ │ │ 四 川 23 ───┤ ├─────┐ 辽 宁 6 ───┤ │ │
福 建 13 ───┘ │ ├───────────┐ 河 南 16 ───────┘ │ ├─────┐ 河 北 3 ─────────────┘ │ │
北 京 1 ───────┬─────────────────┘ ├─────────────────┐ 上 海 9 ───────┘ │ │ 浙 江 11 ───────────────────────────────┘ │ 江 苏 10 ─────────────────┐ │ 山 东 15 ─────────────────┼───────────────────────────────┘ 广 东 19 ─────────────────┘
3)最远邻元素聚类法
* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * *
Dendrogram using Complete Linkage
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+
西 藏 26 ─┐ 青 海 29 ─┤ 宁 夏 30 ─┤ 海 南 21 ─┼───┐ 甘 肃 28 ─┤ │ 新 疆 31 ─┤ │
贵 州 24 ─┘ ├───────────────┐ 山 西 4 ─┐ │ │ 重 庆 22 ─┼─┐ │ │ 天 津 2 ─┘ │ │ │ 江 西 14 ─┐ ├─┘ │ 陕 西 27 ─┤ │ │ 吉 林 7 ─┤ │ │ 云 南 25 ─┼─┘ │
黑龙江 8 ─┤ ├───────────────────────────┐ 广 西 20 ─┤ │ │ 安 徽 12 ─┤ │ │ 内蒙古 5 ─┘ │ │ 辽 宁 6 ─┐ │ │ 福 建 13 ─┼─┐ │ │ 湖 北 17 ─┤ │ │ │ 湖 南 18 ─┤ ├───────┐ │ │ 四 川 23 ─┘ │ │ │ │ 河 北 3 ───┤ ├─────────┘ │ 河 南 16 ───┘ │ │ 北 京 1 ─┬───┐ │ │ 上 海 9 ─┘ ├─────┘ │ 浙 江 11 ─────┘ │ 江 苏 10 ─┬───┐ │ 山 东 15 ─┘ ├───────────────────────────────────────────┘ 广 东 19 ─────┘
4)质心聚类法
* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * *