信息资源管理
数据分类——一个两步过程 (2)
第二步,使用模型,对将来的或未知的对象进行分类
– 首先评估模型的预测准确率 对每个测试样本,将已知的类标号和该样本的学习模型类
预测比较 模型在给定测试集上的准确率是正确被模型分类的测试样
本的百分比 测试集要独立于训练样本集,否则会出现“过分适应数据
”的情况
如果准确性能被接受,则分类规则就可用来对新 数据进行分类
信息资源管理
数据分类——一个两步过程 (2)
第二步,使用模型,对将来的或未知的对象进行分类
– 首先评估模型的预测准确率 对每个测试样本,将已知的类标号和该样本的学习模型类
预测比较 模型在给定测试集上的准确率是正确被模型分类的测试样
本的百分比 测试集要独立于训练样本集,否则会出现“过分适应数据
”的情况
如果准确性能被接受,则分类规则就可用来对新 数据进行分类
下一篇:项目风险评估报告内容提纲