数据挖掘试卷一(6)

2020-12-24 23:17

数据挖掘

B,C,E

T300 A,B,C,E T400

B,E

2.判定树归纳算法是一种常用的分类算法 (1)请简述判定树归纳算法的基本策略

(2)使用判定树归纳算法,根据顾客年龄age(分为3个年龄段:<18,18...23,>23),收入income(取值为high,medium,low),是否为student(取值为yes和no),信用credit_rating等级(取值为fair和excellent)来判定用户是否会购买PC Game,即构建判定树buys_PCGame,假设现有的数据经过第一次划分之后得到如下图所示结果,并根据该结果对每一个划分中的各个属性计算信息增益

对age<18的顾客:Gain(income)=0.022,Gain(student)=0.162,Gain(credit_rating)=0.323 对age>23的顾客:Gain(income)=0.042,Gain(student)=0.462,Gain(credit_rating)=0.155 请根据以上结果绘制出判定树buys_PCGame。(4分) 3

训练数据集合age、student、income、rating这四个属性,其类别属性为buys,它有两个

不同的取值:{yes,no}。设C1对应类别 buys=yes,C2对应类别 buys=no

(a) 为什么朴素贝叶斯分类称为“朴素”?

根据上面训练数据集,采用朴素贝叶斯分类方法对下列未知样本进行分类,并给出具体步骤,其中未知样本为:X=(age=“<30”,income=medium,student=yes,rating=fair)


数据挖掘试卷一(6).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:环保工程技术规范-工程设计文件要求(编制说明)

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: