数据量化处理方法

2020-06-21 13:52

目前对连续量的量化处理方法很多,如等距离法、模糊聚类法、自组织映射(SOM)神经网络分类法等。

目前已经提出了多种连续属性值离散化方法:等距离法、等频率法、最大嫡法、L方法、W方法、P方法等。

自组织映射(SOM)神经网络分类法(过程中涉及相容性检查)

SOM网络是Kohonen T于1981年提出的一种无监督竞争学习型前馈神经网络,能模拟大脑神经系统自组织特征映射的功能,对输入样本按指定的分类数目进行模式分类,分类结果能够较客观地反映数据分布情况。

运用SOM网络对条件属性进行分类量化的具体过程: (1)给定SOM网络初始分类值m=2(如何选择见下) (2)给定条件属性初始维数d=1

(3)将第d维条件属性按从小到大(或从大到小)排序

(4)用SOM网络对排序后的第d维条件属性值进行分类

(5)把相邻两类边界属性值的均值作为该二类的分界值(即条件属性量化参数) (6)用条件属性量化参数对该维条件属性进行量化 (7)赋值d=d+1,返回第(3)步,直到最后一维条件属性

(8)检查数据表是否相容,若不相容,令m=m+1,返回第(2)步;若相容,结束。 注意: (1)采用SOM神经网络对条件属性进行量化处理时,要注意分类数目的确定,分类数目少,可能会得到不相容的知识表达系统;分类数目过大,则会形成各自独立的规则,造成规则数目过多。本文选择的是m=3。 原始数据 (共38组) 进行量化后

最大嫡法

最大嫡法是基于信息论的离散方法,能够保证离散过程中损失最少的信息。


数据量化处理方法.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:世界著名100处建筑(按时间顺序)

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: