数据挖掘
B,C,E
T300 A,B,C,E T400
B,E
2.判定树归纳算法是一种常用的分类算法 (1)请简述判定树归纳算法的基本策略
(2)使用判定树归纳算法,根据顾客年龄age(分为3个年龄段:<18,18...23,>23),收入income(取值为high,medium,low),是否为student(取值为yes和no),信用credit_rating等级(取值为fair和excellent)来判定用户是否会购买PC Game,即构建判定树buys_PCGame,假设现有的数据经过第一次划分之后得到如下图所示结果,并根据该结果对每一个划分中的各个属性计算信息增益
对age<18的顾客:Gain(income)=0.022,Gain(student)=0.162,Gain(credit_rating)=0.323 对age>23的顾客:Gain(income)=0.042,Gain(student)=0.462,Gain(credit_rating)=0.155 请根据以上结果绘制出判定树buys_PCGame。(4分) 3
训练数据集合age、student、income、rating这四个属性,其类别属性为buys,它有两个
不同的取值:{yes,no}。设C1对应类别 buys=yes,C2对应类别 buys=no
(a) 为什么朴素贝叶斯分类称为“朴素”?
根据上面训练数据集,采用朴素贝叶斯分类方法对下列未知样本进行分类,并给出具体步骤,其中未知样本为:X=(age=“<30”,income=medium,student=yes,rating=fair)