模糊分类的方法及其应用
摘要 本文总结了模糊传递闭包法、直接聚类法、最大树法以及编网法四种分类方法的基本步骤及其应用。并且通过用不同的方法对同一示例进行求解,说明并得到不同的分类方法分类结果是完全一样的。同时使读者对模糊分类的方法有一定的了解.
关键字 模糊数学;模糊分类;方法;应用
The method of fuzzy classification and its application
Abstract This paper summarizes the basic steps of classification and its application of four classification such as the fuzzy transitive closure method, the direct classification method, the maximum tree cluster method and the netting method. And by using different methods to solve the same example to illustrate and get the different classification getting exactly the same results. At the same time ,it making the readers have some knowledge of the methods.
Key words Fuzzy mathematics; The fuzzy classification; Methods; application
1
有一个古老的希腊悖论,是这样说的:“一粒种子肯定不叫一堆,两粒也不是,三粒也不是……;另一方面,所有人都同意,一粒种子肯定不叫一堆.那么,适当的界限到底在哪里呢?我们可不可以说123585粒种子不叫一堆,而123586粒种子就是一堆种子?”很显然,一粒与一堆之间是有很大的差别的.但是,它们之间的差别是逐渐的,而不是突变的,二者之间并不存在明确的界限.换句话说,“一堆”这个概念是具有一定的模糊性的.类似的概念多不胜数,如:年老、高个子、很冷、有点辣、智者、便宜……,很显然,这些概念是不能用经典集合来进行归类的.经典集合描述的是一种非此即彼的现象.而这些模糊概念却是一种亦此亦彼的现象,为此,只能寻找一种新的集合来描述这种现象,这就是模糊集合.1965年,美国控制论专家、数学家查德发表了论文《模糊集合》,模糊数学这门学科从此诞生(详细资料可查询http://baike.http://www.wodefanwen.com// view/24364.htm).
模糊数学是以不确定性的事物为其研究对象的.模糊集合的出现是数学适应描述复杂事物的需要,查德的功绩在于用模糊集合的理论找到解决模糊性的方法,使模糊对象加以确切化,从而使研究确定性对象与不确定性对象的数学沟通起来,过去精确数学、随机数学中描述有不到之处就可以通过模糊数学来弥补.
伴随着数学这一学科的发展,做为数学的一个分支,模糊数学也在渐渐的发展着.目前模糊数学已有模糊拓扑学、模糊群论、模糊图论、模糊概率、模糊语言学、模糊逻辑学等分支.作为一门新兴学科,模糊数学已初步应用于模糊控制、模糊识别、模糊聚类分析、模糊决策、模糊评判、系统理论、信息检索、医学、生物学等各个方面.在气象、机构力学、控制、心理学等方面也有具体的研究成果[1].
在本文中,我将就模糊数学的一个重要应用,即模糊聚类分析的一些模糊分类方法及其应用进行简单的探讨. 1预备知识
1.1模糊聚类分析的定义及其方法
“物以类聚”,分类是各个学科领域中的重要内容.从其原意上讲,分类就是把所需要研究的对象的全体一步步细分为互不相交的子集合,而聚类是指把各个对象的单点集合一步步聚合成不同的类.即:分类是从粗到细,而聚类是从细到粗.在实际应用的过程中,通常情况下是不加以区分的,在此我们将对模糊分类的方法进行简单的探讨.
2
所谓聚类分析[2],就是根据事物间的不同特征、亲疏程度和相似性性等关系,对它们进行分类的一种数学方法.它产生于地质学的若干领域,其数学基础是数理统计中的多元分析.由于在实际生活中,事物间的关系其界限往往是不明显的,即为模糊关系,所以用模糊数学方法进行聚类分析会显得更容易,更符合实际情况,这就是模糊聚类分析具有很强生命力所在.
模糊聚类分析方法一般分为三大类:第一种是分类数不确定,依据不同要求对事物进行动态聚类,这种方法是基于模糊等价矩阵聚类的,称之为模糊等价矩阵动态聚类分析方法;第二种是分类数确定,寻找出对事物的最佳分类方案,这种方法是基于目标函数聚类的.称之为C均值(FCM)聚类算法或称之为模糊ISODATA聚类分析方法;第三种是在摄动有意义的情况下,根据模糊相似矩阵聚类的,此类方法称之为基于摄动的模糊聚类分析方法[2]. 1.2模糊分类的基本步骤
在本文中我们主要介绍模糊等价矩阵动态聚类分析方法,也即当分类数不确定时的各种分类方法.首先,我们来看一下模糊聚类的基本原理和步骤:
事实上,我们已经知道,对于一个合适的分类来说,应满足三个条件:自反性、对称性、传递性.而且等价关系也是满足上述三个条件的,因此,我们将模糊聚类分析按照模糊等价关系来进行.其主要步骤如下:
(1)建立模糊相似关系.
{u1,u2,?,un}设U ?为待分类的全体.其中每一待分类对象由一组数据表征
如下:
ui??xi1,xi2,? ,xim?
现在的问题就在于如何建立ui与uj之间的相似关系:
R(ui,uj)? rij?0,1??i,j?1,2,?,n?.
通常用的方法有:①数量积法,②相关系数法③最大最小法,④算术平均最小法,⑤几何平均最小法,⑥绝对值指数法,⑦绝对值减数法.
其中每种方法有固定的公式来计算得到相似关系R(ui,uj)? r,在此就不一ij一列出,具体参见参考文献[3][4].
除上述方法之外,也可请专家或者由多人打分再取平均值.在实际情况中,具体选取哪一种方法,应根据情况而定,最好选用多种方法,选取分类最符合实
3
际的结果.
(2)改造相似关系为等价关系.
由第一步得到的矩阵R一般是满足自反性和对称性的,即R是相似矩阵,但它不一定具有传递性,从而未必是模糊等价矩阵,因此,需要将它改造成模糊等价矩阵.为此,采用平方法求出R的传递闭包R,R便是所求出的模糊等价矩阵.通过R便可对U 进行分类.
下面我们根据上述步骤来介绍一些模糊等价矩阵动态聚类分析方法中常用的模糊分类方法:模糊传递闭包法,直接聚类法,最大树法,编网法.(注:在本文中为了形成对照,各种方法的应用只选用一个例子.) 2模糊传递闭包法的基本步骤及其应用 2.1模糊传递闭包法的基本步骤
为了说明传递闭包法,我们来看一个有关于模糊相似关系和模糊等价关系之间联系的定理[2]:
设R?F(U?U),则
(1)R为等价的当且仅当R为传递的模糊似关系; (2)若R为模糊相似关系,则t(R)?e(R).
其中t(R)为R的传递闭包,e(R)为关系R的等价闭包.
根据上述定理可知,模糊相似矩阵R的传递闭包t(R)就是一个模糊等价矩阵,因此,可以以t(R)为基础而进行分类,这种聚类方法称为模糊传递闭包法,具体步骤如下:
(1)利用平方自合成方法求出模糊相似矩阵R的传递闭包t(R),即
R2?R4???R2k?t(R)
其中k?[log2n]?1.
(2)适当选取置信水平值??[0,1],求出t(R)的?截矩阵t(R)?,则可知t(R)?为得到的分类就是在 ?水U上的一个等价的Boolean矩阵.然后按t(R)?进行分类,平上的等价分类.具体聚类原则如下:
设t(R)?(rij)n?n,t(R)??(rij(?))n?n,则rij(?)?1,当rij??;rij(?)?0 ,当rij??.
对于ui,uj?U,若rij(?)?1则在?水平上将对象ui和对象uj归为同一类.
4
当?在[0,1]中取不同的值时,相应的分类随之改变,从而得到的模糊分类具有动态性,人们可以根据不同的要求进行分类.因此,模糊聚类分析能使事物之间的内在联系得到反映.
(3)画动态聚类图.
为了能够直观地看到被分类对象之间的相关程度,通常将t(R)中所有互不相同的元素rij按从小到大的顺序排列:
1??1??2?
??m
让?依次取遍?i(i?1,2,,m),得到t(R)?i的一系列分类.将这一系列分类画在
同一个图上,即得到动态聚类图. 2.2模糊传递闭包法的应用
{u1,u2,u3,u4,u5}例 设U ?表示由父、子、女、邻居、母五人组成的集合,
请陌生人对这五个人按相貌相像程度进行打分得到模糊相似矩阵为:
?1??0.8R??0.6??0.1?0.2?0.10.2??10.80.20.85?0.8100.9?,
?0.2010.1?0.850.90.11??0.80.6请用模糊传递闭包法对其进行模糊分类. 解 ①求相似关系.
由题可知,模糊相似矩阵为
?1??0.8R??0.6??0.1?0.2?0.10.2??10.80.20.85?0.8100.9?
?0.2010.1?0.850.90.11??0.80.6自己与自己的相貌完全相像,所以对角线上的元素都为1;
r12?r21?0.8, 表示父子相貌相像程度为80%; r13?r31?0.6,表示父女相貌相像程度为60%;
r14?r41?0.1,表示父亲与邻居的相貌相像程度为10%; r15?r51?0.2,表示父亲与母亲相貌相像程度为20%;
5