数据挖掘-决策分析(4)

2019-08-26 18:02

属性配置文件

“属性配置文件”选项卡说明输入属性的不同状态如何影响可预测属性的结果。

在“属性配置文件”选项卡中浏览模型

1. 2. 3.

在“可预测”框中,确认已选中 Bike Buyer。

如果“挖掘图例”妨碍“属性配置文件”的显示,请将它移开。 在“直方图”条框中,选择 5。

在我们的模型中,任意一个变量的最大状态数均为 5。

系统会列出影响该可预测属性的状态的属性以及输入属性的每个状态的值及其在该可预测属性的每个状态中的分布。 4.

在“属性”列中,查找 Number Cars Owned。请注意,自行车购买者(标为 1 的列)与非自行车购买者(标为 0 的列)的直方图的差异。如果一个人拥有的汽车数量为 0 或 1,则此人很有可能会购买自行车。 5.

双击自行车购买者(标为 1 的列)列中的 Number Cars Owned 单元格。

“挖掘图例”将显示一个更为详细的视图。 返回页首

属性特征

使用“属性特征”选项卡,可以选择属性和值,以查看所选值事例中出现其他属性值的频率。

在“属性特征”选项卡中浏览模型

1. 2.

在“属性”列表中,确认已选中 Bike Buyer。 将“值”设置为 1。

在查看器中,您将看到,家中无子女、通勤距离较近和居住在北美洲地区的客户更有可能购买自行车。

属性对比

使用“属性对比”选项卡,可以调查自行车购买的两个离散值与其他属性值之间的关系。由于 TM_NaiveBayes 模型只有 1 和 0 两个状态,因此您无需对查看器进行任何更改。

在查看器中,您会看到,没有汽车的人一般会购买自行车,而有两辆汽车的人一般不会购买自行车。

选择输入数据

测试挖掘模型准确性的第一步是选择将用于测试的数据源。您将根据测试数据测试模型的准确性,然后将它们与外部数据一起使用。

选择数据集

1.

切换到 Business Intelligence Development Studio 中的数据挖掘设计器的“挖掘准确性图表”选项卡,并选择“输入选择”选项卡。 2.

在“选择要用于准确性图表的数据集”组框中,选择“使用挖掘结构测试事例”,以便使用您在创建挖掘结构时保留的测试数据来测试模型。

有关其他选项的详细信息,请参阅测量挖掘模型准确性(Analysis Services - 数据挖掘)。

选择模型、可预测列和值

下一步是选择要包含在提升图中的模型、用于比较模型的可预测列以及要预测的值。 注意: “可预测列名称”列表中的挖掘模型列限制为用法类型设置为 Predict 或 Predict Only 而且内容类型为 Discrete 或 Discretized 的列。 显示模型的提升

1.

在数据挖掘设计器的“输入选择”选项卡上,在“选择要在提升图中显示的可预测的挖掘模型列”下选中“同步预测列和值”复选框。 2.

在“可预测列名称”列中,确认为每个模型都选择了 Bike Buyer。 3.

在“显示”列中,选择每个模型。

默认情况下,系统会选中挖掘结构中的所有模型。可以决定不包含某一模型,但对于本教程,请选中所有模型。 4.

在“预测值”列中,选择 1。对于具有相同可预测列的每个模型,将自动填充相同的值。 5.

选择“提升图”选项卡以显示提升图。

当您单击该选项卡时,便会对服务器和数据库的挖掘结构和输入表或测试数据运行预测查询。结果将绘制在图上。

输入“预测值”时,提示图会绘制随机推测模型和理想模型。您创建的挖掘模型将处于这两种极限情况之间,即介于随机推测模型和精确无误的预测模型之间。与随机推测相比,任何提高均被视为“提升”。 6.

使用图例可以查找表示理想模型和随机推测模型的彩色线。 您将注意到 TM_Decision_Tree 模型提供最大的提升,其表现优于聚类分析模型和 Naive Bayes 模型。

使用筛选器

通过筛选,您可以轻松地创建基于数据子集生成的模型。筛选器只应用于该模型,而且不会更改基础数据源。有关如何将筛选器应用于嵌套表的信息,请参阅数据挖掘中级教程(Analysis Services - 数据挖掘)。

事例表的筛选器

首先,您将复制 TM_Decision_Tree 模型。

复制决策树模型

1.

在 Business Intelligence Development Studio 中,在解决方案资源管理器中选择 ASDataMining2008。 2. 3.

单击“挖掘模型”选项卡。

右键单击 TM_Decision_Tree 模型,然后选择“新建挖掘模型”。 4. 5.

在“模型名称”字段中,键入 TM_Decision_Tree_Male。 单击“确定”。

然后为模型创建一个筛选器,用于根据客户的性别选择客户。

创建挖掘模型的事例筛选器

1.

右键单击 TM_Decision_Tree_Male 挖掘模型以打开快捷菜单。 - 或 -

选择该模型。在“挖掘模型”菜单上,选择“设置模型筛选器”。 2.

在“模型筛选器”对话框的“挖掘结构列”文本框中,单击网格中的第一行。

下拉列表只显示该表中列的名称。 3.

在“挖掘结构列”文本框中,选择“性别”。

文本框左侧的图标会发生改变,以指示所选项是表还是列。 4. 5. 6. 7.

单击“运算符”文本框,并从列表中选择等于 (=) 运算符。 单击“值”文本框,然后键入 M。 单击网格中的下一行。 单击“确定”关闭模型筛选器。

筛选器显示在“属性”窗口中。或者,您也可以从“属性”窗口启动“模型筛选器”对话框。 8.

重复上述步骤,但这次应将模型命名为

TM_Decision_Tree_Female,并在“值”文本框中键入 F。 现在,“挖掘模型”选项卡中会显示两个新模型。

处理筛选后的模型

模型经过部署和处理后才能使用。有关处理模型的详细信息,请参阅处理 Targeted Mailing 结构中的模型(数据挖掘基础教程)。


数据挖掘-决策分析(4).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:武汉理工大学土建学院硕士生导师

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: