信息工程实验室 实验报告册
集转换成WEKA能处理的格式,如.ARFF格式。思考:如何将其它格式的数据文件(如.XLS)转换为.ARFF格式?
3、 根据选择的数据挖掘算法,如果有必要,在Weka Explorer界面,Preprocess选项中,进
行相应的数据预处理。要求:熟悉Preprocess界面中各个功能选项的含义,理解数据的 特征。思考:在filter中,supervised和unsupervised的区别?
16
信息工程实验室 实验报告册
4、 在Weka Explorer界面,单击Visualize选项,进入WEKA 的可视化页面,可以对当前的
17
信息工程实验室 实验报告册
关系作二维散点图式的可视化浏览。要求: 熟悉Visualize界面中各个功能选项的含义,理解可视化图形的意义。
5、 选择相应的分类与预测挖掘算法对数据集进行分析,进行算法参数的具体设置。如利用
WEKA->Classifier->trees->J48 决策树算法,对泰坦尼克号数据集进行分析;如利用回归模型对连续数值进行预测。要求:对你选择的分类和预测算法思想分别进行介绍,熟悉classify界面的内容,对classifier中的参数含义分别进行介绍。思考:classifier->trees->J48算法与classifier->trees->id3算法的区别与联系。 ID3算法:
18
信息工程实验室 实验报告册
J48算法:
6、 对分析所获得的结果进行解释。如,根据决策树和分类规则尝试讨论泰坦尼克号幸存者
的特征。理解评估分类和预测优劣的一些准则。
19
信息工程实验室 实验报告册
思考题(要求手写)
给出数据挖掘中分类与预测成功应用的案例,并简要介绍。
实验小结(要求手写):
实验中遇到的问题及解决办法、心得、体会等等...
20