0~1之间的机率值乘以加权值后,再将各组答案加总起来获得最后的结果。另外,亦分别计算投票式与算术平均的整合方式以供做为效能分析上的比较。对于各个算法的处理如下: (1).判定树算法:
对于判定树算法来说,因为是以Microsft SQL Server的Analysis Service为建置及分析的工具,它是从数据库的观点来设计施做,并由数据仓储中取出数据来进行预测,故微软将其运作方式设计成与SQL语法类似描述,以下为类似的语法
SELECT [Aspmean], [Asprng], [Ccaspct], [Ccdtm],[Dist2cen], [Dist2fault], [Dist2faults], [Dist2rd], [Dist2riv], [Geology], [Pgaew], [Pgans], [Pgaver], [Slope], [Slpmean], [Slprng], [资料仓储之山崩结果], [预测模式之山崩预测], PredictProbability([预测模式之山崩预测]) from [预测模式], [数据仓储]
故若预测结果是山崩,该值为发生山崩的机率值,若预测结果是非山崩,则该值为不会发生山崩的机率值。为求统一计算方便,我们将它们全部转为山崩的机率值,即将原来非山崩的机率值改为山崩机率值,例如,若预测结果是非山崩且机率为0.9,则经过反算后山崩机率只有0.1,即(1-0.9) = 0.1。 (2).类神经网络:
类神经网络因其输出值原本就是位于0~1之间的值,越接近1者,山崩机率越高,故无需经过反算,该输出值可以直接拿来与其他模式结果进行加权运算。 (3).案例式概念学习
案例式概念学习算法会为每个输入欲预测的数据,计算该笔纪录在被计算出来的预测分类中之代表性分数,表示此一纪录对其他在同一类别里的所有数据范例的平均相似度,它的值也世介于0~1之间,但并不代表为机率值,为了取得其机率值,我们以每一类别中获有最高代表性分数的值当作该类别的代表分数,或称做类别原型(class prototype)。将每一个数据范例的代表性分数除以类别原型的代表性分数,即可获得每一数据范例的可信度或机率值,接着再按照之前的做法,将机率值转换为山崩机率
值,即可与其他模式的结果整合运算。 (4).贝式分类器
贝氏分类器的演算原就是从机率的观点来计算的,故可以计算预测类别的机率值,然后再按照先前的转换方式,转换为山崩的机率。 (5).结果值的加权加总
结果值的加权加总是一个尝试错误的过程,必须经过多次的调整与测试才能获得最佳的结果,这是一个优化的求取,由于本研究只有使用四个模式,经过几次的排列组合后即已获得最佳的结果。最后发现,若以判定树算法的结果权重占50%,类神经算法的结果权重占30%,贝式分类器分类值权重占15%,案例式概念学习算法的结果权重占5%,加总之后的分数可以获得高于任一个别模式所得的预测结果(详细评比参见稍后说明)。尽管没有明确的规律定义权重的配比,但是可以发现,原则上对于较高预测率的模式,给以较高的权重,通常可以获得更理想的准确率。
图3-13 模式垂直整合
图3-14 模式水平整合
模式 3 方案3 結果 樣本 模式 2 方案2 加權整合 模式 1 方案1 新案例 結果 樣本 模式 1 + 解決方案 新案例
表3-3 地质分布(Geology)编码值对照表 编码值 Geology_2 Geology_3 Geology_4 Geology_5 Geology_6 Geology_7 Geology_8 Geology_9 Geology_10 Geology_11 Geology_12 Geology_13 Geology_15 Geology_16 Geology_17
表3-4 距断层破碎带距离(Dist2Faults)编码值对照表 编码 第二层 Dist2Faults_L2_1 Dist2Faults_L2_2 Dist2Faults_L2_3 Dist2Faults_L2_4 Dist2Faults_L2_5 Dist2Faults_L2_6 Dist2Faults_L2_7 Dist2Faults_L2_8 Dist2Faults_L2_9 说明 十八重溪层 达见砂岩 西村层;佳阳层 庐山层;苏乐层 瑞芳群及其相当地层 三峡群及其相当地层 野柳群及其相当地层 四棱砂岩;眉溪砂岩;白冷层 大桶山层;干沟层;水长流层 五指山层;蚊子坑层;粗坑层 锦水页岩及其相当地层 卓兰层及其相当地层 头嵙山层及卑南山砾岩及其相当地层 台地堆积 冲积层 值域 第一层 等距分等 0 ~ 1765 1765 ~3531 3531 ~ 5297 5297 ~ 7063 7063 ~ 8829 8829 ~ 10595 10595 ~ 12361 12361 ~ 14127 14127 ~ 15892 自然分等 0 ~ 888 888 ~ 1901 1901 ~ 3006 3006 ~ 4228 4228 ~ 5772 5772 ~ 7697 7697 ~ 9832 9832 ~ 12298 12298 ~ 15893 Dist2Faults_L1_1 Dist2Faults_L1_1 Dist2Faults_L1_1 Dist2Faults_L1_2 Dist2Faults_L1_2 Dist2Faults_L1_2 Dist2Faults_L1_3 Dist2Faults_L1_3 Dist2Faults_L1_3