方法 a、: a,,. P 7 空间性质
最短距离法 0. 5 0.5 0 -0.5 HI缩
最长距离法 0.5 0.5 0 0.5 扩张
类间平均距离法 nJriB ?/./\0 0 保持
重心法 〇/;/?? - n,:/1,, / nl 0 保持
中间距离法 0.5 0.5 -0.25 0 ^
2. 2. 2基于等价关系的聚类方法
由离散数学中关于关系的描述我们知道,定义在集合Z = ^[;c,,x,,上的关
系如果具有自反性、对称性和传递性则被称为等价关系.设义是一给定集合,
尤?,是它的子集,如果满足[9】:
X! nXj 二 (j), V/,7 = 1,2,\,/ 半 j
X^yjX^Kj^--KjX^=X
则集合尸=, ,?,X《被称为集合的一个划分,而,被叫做这
个划分的块.若是集合上的等价关系,对于任意一个元素X, 可以构造一
个X 的子集,叫做X,对于的等价类,[x,],, = e X,Kx.RXj\\.
对于这种集合,它具有下列性质:
(1) x, e[x丄;
(2)如果 Xy e [x, \\,则必有[xy. = [x, L ;
(3)若 X广[x^ L,但?生 V. L,则必有 k ]r。L = .
由此可知,集合Z上的等价关系7?所构成的类,两两互不相交,而且覆盖整
个集合JT .我们得到如下定理:集合X上的等价关系R所构成的类产生集合X的 10
个分量是反映同一特征A,而只有一个分量反映另一特征B,欧氏距离计算出來的
结果将绝大部分反应特征A,而弱化了特征B,而马氏距离去除了相关性后,据规
避了这个缺点。通过式(2.1)我们可以看出,当C为对角阵时,各特征分量相互
独立,同时,我们还发现,欧氏距离其实就是协方差矩阵C等于单位矩阵I时的
一个特例。可以看出,在这种条件下模式样本集的概率分布不仅各分量之间不相
关,而且其密度函数的等高线为圆(或者超球面),即各分量方向上的密度分布是
均匀的
需要指出的是,计算协方差矩阵是计算马氏距离的关键所在,但是我们只有
在模式集给定的情况下,才能计算出协方差矩阵,遗憾的是这个条件很难实现。
角度相似性函数定义为
‘士^^ (2-2)
是模式向量;C与X之间的夹角余弦,也就是X的单位向量II与X的单位向量 * ‘ ‘ /IW ‘
II之间的点积.夹角余弦的测度反映了几何上相似形的特征,它对于坐标系的 /KII
旋转及缩放时不变的,但对位移和一般的线性变换则并不具有不变性的性质.
Tanimoto测度是将夹角余弦度量进行细小的修改后得到的,主要用于具有{0,
1} 二值特性的情况[”。其具体定义为
共有的特征数目 , xlx, = ;Cf或;Cj.中占有的特征数目之总数 一
不过,相似性测度函数的共同点都涉及到把两个相比较的向量X和X的分量 k j
值组合起来,但怎样组合并无普遍有效的方法,对于具体的模式分类,需视情况
作适当的选择[8]。
在谱系聚类算法中,每次迭代中形成的聚类之间以及它们与各个样本之间的
距离,有多种不同的准则函数[7]。
1.最短距离法[9]
假设A和B是两个聚类,则两类间的最短距离定义为
j | a e A,b e b] (2—4)
式中,(力表示A类中的样本X。和B类中的样本之间的距离.表示A类中所
有样本与B类中所有样本之间的最小距离. 8 第2章聚类分析及其应用实例
£(? -^j)
?=I 广' n. (2-14)
Jpr 叫 pr 又 J\
这里,七=—XX.i,■^J ~ ~ X ^A . S k=\\ S
4.指数相似系数 5
r\—文e' si (2-15) S k^\\
这里,是第A个特征的方差,
=-^(? ‘ k = \\’2,?,S (2-16) “M
5.最大最小法
^min(x?,x^J r, (2-17)
Jmax(x?,x^J /c=l
6.算术平均最小法
Emm(x?,x^J
r? = ^ (2—18)
Z k = \\
7.算术平均最小法
Emin(x?,x^J
r,丨- (2-19)
舍t(?+?) L 人--1
8.几何平均最小法
Emin(x,,,x^J
r, = ^ (2-20 ) y s ^^ k=\\
9.绝对值指数法 12 笫2苹聚类分析及K:应用实例
一个划分,此划分叫做Z关于的商集,记做例如,同余关系i?‘对整数集/
产生的商集就是模C的剩余类[9]:
///?,={[0],,.,[lL,..,[c-4.}
由上述讨论可知,在给定集合Z上定义一个等价关系,就决定集合;r的一种
划分.显然,这样的划分是硬分割,我们可以把这一概念推广到模糊关系上来[9]。
由于模糊等价关系及是论域与自己笛卡尔乘积jxl上的一个模糊集合,
而模糊集合的任何a(0 S a S 1)截集及?都是X X X上的一个普通集合,即为X上的
普通等价关系,也就得到了关于X中对象元素的一种分类.当〇由1下降为0时,