暨南大学---数据挖掘课程设计---cwl
3.2数据挖掘实验
3.2.1实验环境 Windows XP
Microsoft SQL Server 2008 Microsoft Visual Studio 2008 Microsoft Office 2003 Excel Access 3.2.2数据准备及预处理
首先选择数据源,以下几个截图是在做实验时的几个步骤。
6
暨南大学---数据挖掘课程设计---cwl
7
暨南大学---数据挖掘课程设计---cwl
3.2.3 实验内容 (输入数据集,选择算法,输出结果,比较分析)
(1)建立一个Analysis Services Project的项目,在数据源中输入数据集:
8
暨南大学---数据挖掘课程设计---cwl
说明: 以上实验室在实验室做的,由于时间不够,回到宿舍自己安装了中文
9
暨南大学---数据挖掘课程设计---cwl
版的SQL SERVER工具,并完成接下来的实验步骤。 3.2.4 算法选择
分类的任务是通过分析由已知类别数据对象组成的训练数据集,建立描述并区分数据对象类别的分类函数或分类模型(也常常称作分类器)。
分类算法有多种,例如,决策树分类算法、神经网络分类算法、贝叶斯分类算法等。这里需要用的是决策树分类算法。
在本挖掘中选择是关联分析,分析过程和结果如以下图所示:
下面是挖掘模型:
10