灰色聚类方法综述
杨雅捷
(西安理工大学 理学院,陕西 西安 710054)
摘要:灰色聚类是根据灰色关联矩阵或灰数的白化权函数将一些观测指标或观测对象划分成若干个可定义类别的方法。一个聚类可以看成是属于同一类的观测对象的集合。灰色聚类分为灰色关联聚类和灰色白化权函数聚类。灰色关联聚类主要用于同类因素的归并,以使复杂系统简化。灰色白化权函数聚类主要用于检查观测对象是否属于事先设定的不同类别,以便区别对待。它的应用十分广泛,本文具体举例说明灰色聚类方法的应用情况,以及对其进行改进提出一些建议。
关键词:灰色系统理论;灰色聚类;应用及改进措施 文献表示码:A 中图分类号:N941.5
The summarize of grey clustering method
YANG-Yajie
(Xi’an University of Technology School of Science Shaanxi Xi’an 710054)
Abstract: Grey clustering function divided observation targets or observation objects into a number of method that can be defined, which is based on grey relational matrix or grey whitening weight.A cluster can be seen as a set of the same observation objects.Grey cluster is divied into grey relational clustering and grey whitening weight function clustering. Grey relational cluster is mainly used for merging of similar factors,to make complex systems easier. Grey whitening weight function clustering is mainly used for checking whether the observation of different categories of obiects are set in advance so that it can be treated differently. It application is widely used. This article illustrates the application of grey clustering method,As well as to improve it.
Key words: Grey system theory, Grey clustering, Application and improvement measures
1 前言
灰色系统理论是邓聚龙教授80年代初提出的,在短短几十年间,得到了长足发展,目前,在我国已成功运用到了社会,经济,科教等各个方面,成为这些领域中进行预测,决策,分析和控制的有力工具【1】。它是以“部分信息已知,部分信息未知”的“小样本”、“贫信息”不确定性系统为研究对象,着重研究“外延明确、内涵不明确”的对象,主要通过对“部分”已知信息的生成、开发,提取有价值的信息,实现对系统运行行为的正确认识和评价。
灰色系统分析包括灰色关联、灰色聚类和灰色统计评估。其中灰色聚类方法
是发展较早并应用较广的一种方法【2、5】。
灰色聚类可分为灰色关联聚类和灰色白化权函数聚类。灰色关联聚类主要于同类因素的归并,使复杂系统简单化,属于变量删减问题。灰色白化权函数聚类主要用于检查观测对象是否属于事先设定的不同类别。灰色白化权函数聚类又包括灰色变权聚类和灰色定权聚类两种【4、5】。灰色变权聚类适用于指标的意义、量纲皆相同的情形。当聚类指标的意义、量纲不同,且在数量上悬殊较大时,变权聚类可能导致某些指标参与聚类的作用十分微弱。解决这一问题有两种方法:一条途径是采用初值化算子或均值化算子将各个指标值化为无量纲数据,然后进行聚类。另一条途径是各聚类指标事先赋权,即为灰色定权聚类【6、7】。
2 灰色聚类的基本概念
灰色聚类法【8】(灰类白化权函数聚类法)是建立在灰数的白化函数生成基础上的一种方法,它是将聚类对象(评价对象)对不同聚类指标(评价指标)所 拥有的白化值(实测值或分析数据)按N个灰类(评价等级)进行归纳整理,从而判断聚类对象属于哪一类的灰色统计法。
2.1 灰色关联聚类
定义2.1.1 设有n个观测对象,每个对象观测m个特征数据,得到序列如下:
X1?(x1(1),x1(2),?,x1(n))X2?(x2(1),x2(2),?,x2(n))??Xn?(xn(1),xn(2),?,xn(n))
对所有的i?j,i,j?1,2?,m,计算出Xi与Xj的灰色关联度?ij,得上三角矩阵
??11?A??????12??1n??22??2m???????mm?
其中,?ij?1,i?1,2,?,m。称矩阵A为特征变量关联矩阵。
取定临界值r??0,1?,一般要求r>0.5,当?ij?r(i?j)时,则视Xi与Xj为同类特征。
定义2.1.2 特征变量在临界值r下的分类称为特征变量的r灰色关联聚类。
r可根据实际问题的需要确定,r越接近于1,分类越细,每一组分中的变量相对的越少;r越小,分类越粗,这时每一组分中的变量相对的越多。
2.2 灰色变权聚类
定义2.2.1 设有n个聚类对象,m个聚类指标,s个不同灰类,根据第
i(i?1,2,?,n)个对象关于j(j?1,2,?,m)指标的观测值
1,2,?,s?)个灰类,称为灰xij(i?1,2,?,n;j?1,2,?,m)将第i个对象归入第k(k??色聚类。
定义2.2.2 将n个对象关于指标j的取值相应地分为s个灰类,我们称之为j指标子类。j指标k子类的白化权函数为fjk???。
定义2.2.3 设j指标k子类的白化权函数fjk???为如图4-1所示的典型白化权函
kkk数,则称xk1?,xkj?j?2?,xj?3?,xj?4?为fj???的转折点。典型百化权函数记为kkk??????fjkxk1,x2,x3,xjjjj?4?
??定义2.2.4 (1)若白化函数fjk???无第1个或第2个转折点xk1?,xkj?j?2?,即如
k图4-2所示,则称fjk???为下限测度白化权函数,记为fjk?,?,xkj?3?,xj?4?。 k(2)若白化函数fjk???无第2个或第3个转折点xkj?2?,xj?3?重合,即如图4-3k所示,则称fjk???为中测度白化权函数,记为fjkxk1?,xkj?j?2?,?,xj?4?。
k(3)若白化函数fjk???无第3个或第4个转折点xk即如图4-4所示,j?3?,xj?4?,
????则称fjk???为上限测度白化权函数,记为fjkxk1?,xkj?j?2?,?,?。 命题2.2.1 (1)对于图1所示的典型白化权函数,有
?0,x?xk1?,xkj?j?4??k?x?xj?1?kk??,x?x1,xjj?2??kk?xj?2??xj?1?kfj?x???kx?xk?1,j?2?,xj?3??kkk?xj?4??x,??x?x3,xjj?4?k?xk?j?4??xj?3???????????fjk o xj?1? xj?2? xj?3? xj?4? kkkkx 图1
(2)对于图2所示的下限测度白化权函数有
??k0,x?0,xj?4???fjk?x???1,x?0,xkj?3??kkk?xj?4??x,??x?x3,xjj?4??xk?4??xk?3?j?j??????fjk o xkj?3? 图2 xkj?4? x
(3)对于图3所示的中测度白化权函数有
???0,?k?x?xj?1?kfj?x???k,k?xj?2??xj?1??xk?4??xj?,k?xk?j?4??xj?2?x?xk1?,xkj?j?4?????x?xk1?,xkj?j?2??k??x?xk2,xjj?4??fjk o xk1? xkj?j?2? 图3 xkj?4? x
(4)对于图4所示的上限测度白化权函数有
?0,x?xk1?j??kx?x1??j?kfj?x???k,x?xk1?,xkj?j?2?k????x2?x1j?j?1,kx?xj?2????fjk o k ??xk1xjj?2? x 图4 定义2.2.5 (1)对于图1所示的j指标k子类白化权函数,令
?kj?1kxj?2??xkj?3?2??
(2)对于图2所示的j指标k子类白化权函数,令?kj?xk; j?3?(3)对于图3和4所示的j指标k子类白化权函数,令?kj?xkj?2?,则称。 ?kj为j指标k子类的临界值定义2.2.6 设?kj为j指标k子类的临界值,则称?jk??kj??j?1m为j指标k子类的权。
kj定义2.2.7 设xij为对象i关于指标j的观测值,fjk???为j指标k子类白化权函