A数据挖掘2.0 - 图文(6)

2019-03-16 13:52

首先计算各属性的信息增益 Gain(Ca+浓度)=0

Gain(Mg+浓度)=0.185 Gain(Na+浓度)=0 Gain(Cl-浓度)=0.32

选择 Cl-浓度作为根节点 Cl-浓度 高 低 冰川水 ?

计算各属性的信息增益 Gain(Ca+浓度)=0 Gain(Mg+浓度)=0.45 Gain(Na+浓度)=0.24 选择Mg+浓度作为节点 Cl-浓度 高 低 Mg+浓度 冰川水 高 计算各属性的信息增益 ? Gain(Ca+浓度)=0.24

Gain(Na+浓度)=0.91 Cl-浓度 高 低 冰川水

低 湖泊水 Mg+浓度 高 低 题四

Na+浓度 高 湖泊水 湖泊水 低 冰川水

P(Ca+浓度=低,Mg+浓度=高,Na+浓度=高,Cl-浓度=低 | 类型=冰川水)*P(冰川水)

=P(Ca+浓度=低 | 类型=冰川水)* P(Mg+浓度=高 | 类型=冰川水)* P(Na+浓度=高| 类型=冰川水)* P(Cl-浓度=低 | 类型=冰川水) *P(冰川水) =0.5*0.75*0.5*0.5*0.5=0.0468

P(Ca+浓度=低,Mg+浓度=高,Na+浓度=高,Cl-浓度=低 | 类型=湖泊水)*P(湖泊水)

=P(Ca+浓度=低 | 类型=湖泊水)* P(Mg+浓度=高 | 类型=湖泊水)* P(Na+浓度=高| 类型=湖泊水)* P(Cl-浓度=低 | 类型=湖泊水) *P(湖泊水) =0.5*0.25*0.5*1*0.5=0.03123 第一个样本为冰川水

P(Ca+浓度=高,Mg+浓度=高,Na+浓度=低,Cl-浓度=高 | 类型=冰川水)*P(冰川水)

=P(Ca+浓度=高 | 类型=冰川水)* P(Mg+浓度=高 | 类型=冰川水)* P(Na+浓度=低| 类型=冰川水)* P(Cl-浓度=高 | 类型=冰川水) *P(冰川水) =0.5*0.75*0.5*0.5*0.5=0.0468

P(Ca+浓度=高,Mg+浓度=高,Na+浓度=低,Cl-浓度=高 | 类型=湖泊水)*P(湖泊水)

=P(Ca+浓度=高 | 类型=湖泊水)* P(Mg+浓度=高 | 类型=湖泊水)* P(Na+浓度=低| 类型=湖泊水)* P(Cl-浓度=高 | 类型=湖泊水) *P(湖泊水) =0.5*0.25*0.5*0*0.5=0

第二个样本为冰川水 题五

A,B,C,D,E,F,G之间的距离矩阵如下表 A B C D E A B 1 2 5 C 41 50 45 D 0.5 42.5 50.5 48.5 E F 28.25 36.25 31.25 1.25 1.5 68 65 90 45 36.5 G 根据距离矩阵建立的树如下

A B C D G 46.25 F E F G 题六

第一次迭代以A,B作为平均点,对剩余的点根据到A、B的距离进行分配 {A,C,D,E,F,G,H}, {B} 计算两个簇的平均点 (6.5, 1.7), (4, 5)

第二次迭代,对剩余的点根据到平均点的距离进行分配,得到两个簇 {D,E,F,H}和{A,B,C,G} 计算两个簇的平均点 (9.1, 0.5), (3.25, 3.75)

第三次迭代,对剩余的点根据到平均点的距离进行分配,得到两个簇 {D,E,F,H}和{A,B,C,G}

由于所分配的簇没有发生变化,算法终止。


A数据挖掘2.0 - 图文(6).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:合阳县中小企业服务中心宣传版

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: