spss软件 决策树(3)

2020-03-29 12:39

? 如要进行用户自定义的抽样,选择User Defined 圆钮并使用User Defined标签中的选择项挑选出数据集合中的某个变量,该变量确定划分.

在启动抽样过程前你可以在标签的左下部分指定一个随机种子。计算机程序的随机化过程经常始于某种种子。如果你在不同的挖掘流程使用相同的数据集合和相同的种子,你会得到相同的数据划分。注意对数据的重新排序会导致数据的不同的顺序,因此导致不同的数据划分,这有可能会产生不同的挖掘结果.

该标签的右边你可以指定数据划分到训练数据、验证数据和测试数据的百分数. 划分 HMEQ数据集合用于建模. 根据现有的数据创建训练数据和验证数据集合,忽略测试数据.

4. 分布设置 Train, Validation, 和 Test 为 67, 33, 和 0. 5. 关闭Data Partition节点,选择Yes 把所做的改动存起来.

2.3生成和解释决策树 目标:

学习EM可用的决策树模型类型 生成决策树模型

检查模型结果和解释这些结果 理论和实证角度选择决策阈值

要完成第一个框图的第一阶段,需把一个Tree 节点和一个Assessment 节点加到工作区并连接如下:

检查决策树的缺省设置. 1. 双击打开Tree 节点.

2. 查看Variables 标签以确保所有的变量具有适当的状态、模型作用以及测量水平.

?

如果变量的模型角色或者测量水平信息不正确,在这个节点里是不能修改的。你必须返回到输入数据源(input data source) 节点去修正.

3. 选择 Basic.

以前讨论的生成决策树的选择项均在此标签中.

可用的裂分标准依赖于目标变量的测量水平。对于二元或者名义目标变量,缺省的裂分标准是chi-square检验,显著性水平为0.2. 如果不用缺省设置,你可以用entropy 减少或者Gini(基尼数)减少的方法作为裂分标准。对于有序目标变量,只有entropy 或者基尼数方法。对于连续型目标变量,你有两个裂分标准供选择:缺省 F 检验或者方差减少。

这一标签的其它选择项影响树的生长和大小。按照缺省,只有二元裂分可用,树的最大深度是6个层次,树叶中最小的观测记录数是1. 然而,还有一个节点裂分所需要的观测记录数的设置。这个数值的缺省值是训练数据里所有的记录数除以100.

?

There are additional options available in the Advanced tab. All of the options are discussed in greater detail in the Decision Tree Modeling course.

4. 关闭 Tree 节点.

5. 从 Tree节点运行框图。右击Tree 节点并选择 Run. 6. 选择弹出框的Yes 查看结果.

当查看树节点的结果时, All 标签处于活动状态,界面展示了后面几个子标签的总结。

从右下角的图形我们知道训练数据集合最初生成的是18个树叶的树,然后根据验证数据集合被修剪成有8个树叶的树。左下角的表告诉我们这个8个树叶的树在验证数据上的精度是89.02%.

7. 通过选择菜单条View ? Tree 查看树. 以下是树的一部分.

尽管这棵树应该有8个树叶,但这些树叶并不都能看到。根据缺省,决策树浏览器只显示3层.

要修改可浏览的层数,操作如下: 1. 选择View ? Tree Options…. 2. 在 Tree depth down 区域键入 6. 3. 选择 OK.

4. 检查一下所有8个树叶是否都能看到.

The colors in the tree ring diagram and the decision tree itself indicate node purity by default. If the node contains all ones or all zeros, the node is colored red. If the node contains an equal mix of ones and zeros, it is colored yellow. You can change the coloring scheme as follows: 1. Select Tools ? Define Colors.

2. Select the Proportion of a target value radio button.

3. Select 0 in the Select a target value table. Selecting zero as the target value makes the leaves with all zeros green and those with no zeros (that is, all ones) red. In other words, leaves that include only individuals who will default on their loan will be red.


spss软件 决策树(3).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:一步步安装配置MooseFS社区版

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: