数据仓库与数据挖掘实验
一、聚类算法测算数据集,如下图所示的数据集:
1.对mfeat-fac数据集进行测算 (1)创建Analysis Services chf项目
打开Business Intelligence Development Studio,选择“文件”—“新建”命令,新建一个Analysis Services 项目。在“名称”文本框中将新项目命名为Analysis Services chf,单击“确定”按钮。
(2)创建数据源Chenhongfei
在右侧解决方案资源管理器中,右键单击“数据源”项,从弹出的快捷菜单中选择“新建数据源”命令。系统将打开数据源向导。单击“新建”按钮,向Adventure Works数据库添加连接。系统将打开“连接管理器”对话框,连接到数据库chenhongfei,单击“确定”按钮。单击“下一步”按钮进入“模拟信息”页,选择“默认值”。具体如下图所示
(3)创建数据源视图Chenhongfei
在解决方案资源管理器中,右键单击“数据源视图”,从弹出的快捷菜单中选择“新建数据源视图”命令,系统将打开数据源视图向导。在“欢迎使用数据源视图向导”页上,单击“下一步”按钮。选择dbo.cc1视图,然后右击,将它包括在新数据源视图中,如下图所示:
(4)创建挖掘结构Cc1
在解决方案资源管理器中,右键单击“挖掘结构”,在弹出的快捷菜单中选择“新建挖掘结构”命令,系统将打开数据挖掘向导。在“欢迎使用数据向导”页上,单击“下一步”按钮。在“选择定义方法”页上,确认已选中“从现有关系数据库或数据仓库”,单击“下一步”按钮。在“选择数据挖掘技术”页的
“你要使用何种数据挖掘技术?”下拉列表中选择“Microsoft聚类分析”选项,如下图所示:
单击“下一步”按钮,在随后出现的“选择数据源视图”页上,请注意已默认选中Chenhongfei。单击“选择数据源视图”页上的“下一步”按钮,在“指定表类型”页上,选择cc1表右边“事例”列中的复选框,单击“下一步”按钮。随后出现“指定定型数据”页。然后单击列0的右边“键”列中的复选框。并且其他的选中相应的“输入”复选框。如下图所示
接着如下图所示设置挖掘结构的相关参数,在“挖掘模型”选
项卡上单击鼠标右键,从弹出的快捷菜单中选择“设置算法参数”命令,系统将打开“算法参数”对话框,如下图所示: