一个在外”的原则,即每个观测是通过除了这个观测以外的其他观测推导出来的判别函数来分类的。由第4张表可以看出,通过判别函数预测,有147个观测是分类正确的,其中,y 1组50个观测全部被判对,y 2组50个观测中有48个观测被判对,y 3组50个观测中有49个观测被判对,从而有147/150=98%的原始观测被判对。在交叉验证中,y 1组50个观测全部被判对,y 2组50个观测中有48个观测被判对,y 3组50个观测中有49个观测被判对,从而交叉验证有147/150=98%的原始观测被判对。还可以通过分类结果分析判对和判错的百分比。第(5)为分类结果图,从图中可以看到,Setosa鸢尾花与Versicolour鸢尾花和Virginica鸢尾花可以很清晰的区分开,而Versicolour鸢尾花和Virginica鸢尾花这两种之间存在重合区域,即存在误判。
我们还可以通过保存(Save)选项选择预测的类别关系和判别得分等,对观测进行诊断。 由前面分析我们发现,协方差矩阵不等,可以考虑采用Separate-groups协方差矩阵,选择Separate-groups协方差矩阵,其他选择同上,得分类结果表如下:
输出结果4-6
(1)