Run garbage collector--强制运行Java垃圾回收器,搜索不再需要的内存空间并将之释放,从而可为新任务分配更多的内存。
Log:按钮可以查看以weka操作日志。
没有任务时,右边的小鸟是坐着的,任务运行时,小鸟会站起来左右摇摆。若小鸟站着但不转动,表示任务出了问题。
2.1.2 引例操作显示功能 (1)
2.2 weka的两种数据表格编辑方式下的功能介绍
①Explorer-Preprocess-edit,弹出Viewer对话框;
1、 双击鼠标可以对数据进行修改,
2、 在数据上使用右键可以对数据修改进行撤回(undo)
3、 对数据修改之后,如果想保存,点击下方的ok,撤回点击undo,不保存直接点击cancel
②Weka GUI选择器窗口-Tools | ArffViewer,打开ARFF-Viewer窗口。
1、 在最开始进入界面点击上边的tools,进入arffviewer。
2、 点击打开不同的文件,会在上沿像浏览器一样挨个展示arff文件的内容。
3、 鼠标移动到属性名称旁边是会显示对属性列操作的格式,单机左键会对所有数据按照这个
属性按照升序排列,(shift+左键)会对属性按照这个属性进行降序排列,(Alt+左键)或者直接右键出现对数据进行操作的菜单,对属性列进行重命名,所有数据相加之类的操作都可以在菜单中找到。
4、 鼠标定在某行时,可以删除某一行 5、 有点像excel中的操作
2.2 ARFF 文件组成
2.2.1、对文件格式介绍
WEKA存储数据的格式是ARFF(Attribute-Relation File Format)文件
1、 这是一种ASCII文本文件 2、 文件的扩展名为.arff
3、 可以用写字板打开、编辑ARFF文件。建议用UltraEdit等编辑器
使用写字板打开时如下
①“%”表示注释,WEKA将忽略这些行。
②除去注释后,整个ARFF文件可以分为两个部分:
(a) 第一部分给出了头信息(Head information),包括了对关系的声明和对属性的声
明。
(b) 第二部分给出了数据信息(Data information),即数据集中给出的数据。从“@data”
标记开始,后面的就是数据信息了。
③关系名称在ARFF文件的第一个有效行来定义,格式为:
@relation <关系名>
<关系名>是一个字符串。如果这个字符串包含空格,它必须加上引号(指英文标点的单引号或双引号)。
④属性声明用一列以“@attribute”开头的语句表示。
数据集中的每一个属性都有对应的“@attribute”语句,来定义它的属性名称和数据类型(datatype):
@attribute <属性名><数据类型>
其中<属性名>必须以字母开头的字符串。和关系名称一样,如果这个字符串包含空格,它必须加上引号。
属性声明语句的顺序很重要,它表明了该项属性在数据部分的位置。
最后一个声明的属性被称作class属性,在分类或回归任务中,它是默认的目标变量。
⑤WEKA一共支持五种数据类型
numeric nominal string
数值型
标称(nominal)型 字符串型
日期和时间型
date [
关系型
还可以使用两个类型“integer”和“real”,但是WEKA把它们都当作“numeric”看待。
注意:“integer”,“real”,“numeric”,“date”,“string”这些关键字是区分大小写的,而“relation”、“attribute ”和“data”则不区分。
⑥每个实例占一行,实例的各属性值用逗号“,”隔开。
⑦如果某个属性的值是缺失值(missing value),用问号“?”表示,且这个问号不能省略。 2.2.2 xls文件转arff文件
(1)创建xls文件,保存为csv文件
(2)weka中打开csv格式的文件,另存为arff文件,因为在数据处理中,arff文件最受欢迎
转存后
3.问题反馈与收获
3.1 问题与解决办法
突然忘记了怎么将表格图片快捷保存了, 咨询百度也没找到结果,然后决定使用截图了
3.2 发现与收获
我发现:在数据处理的时候使用离散化,可以更好的显示数据之间的差别。
如下所示
经过离散化之后,数据可以更清楚看出规律了~
4.指导教师评语及成绩:
评语:
成绩:指导教师签名:
批阅日期:月日