河北工业大学2015届毕业论文
表3-3各个类别中的案例数
聚类 1 2 3 4 5 6 7 8 9 10 11 案例个数 705.000 134.000 528.000 248.000 15.000 820.000 92.000 746.000 54.000 710.000 494.000 聚类 12 13 14 15 16 17 18 19 20 20 21 案例个数 368.000 374.000 84.000 4.000 94.000 162.000 670.000 393.000 26.000 258.000 258.000 聚类 22 23 24 25 26 27 28 29 有效 缺失 案例个数 25.000 175.000 693.000 359.000 7.000 377.000 13.000 5.000 8633.000 0.000 通过表3-3可知,不同聚类之间的案例数目相差很大,因此需要对其进行调整,进行交通中区的合并。 3.1.2 交通中区的调整
为了便于进行交通分区的调整,需要知道各个交通中区的之间的亲疏程度,因此利用spss中的系统聚类法,对各个聚类中心进行聚类分析,为交通中区的合并提供数据支持,
设置其中聚类的数目为20到29个,得到各个聚类中心之间的距离树状图如图3-3。
27
河北工业大学2015届毕业论文
图3-3 各聚类中心距离树状图
利用图3-3,再结合各个聚类中心的地理位置以及各个类别中的案例数量,最终确定将类别2、类别29合并,将类别5、类别15、类别16、类别22、类别28合并,将类别20和类别29合并,最终得到23个类,并对其进行重新的编号,并结合研究区域内自然屏障等因素,达到最终的交通中区分区如图3-4所示。
28
河北工业大学2015届毕业论文
图3-4 各个交通中区位置及其编号
3.4 OD矩阵的获取
在完成交通中区的划分后,便可以根据每一个上下车点所属于的交通中区来获取每天各个分区之间的OD矩阵,采用VBA对经过聚类后的数据进行处理,根据之前交通分区,每个经纬度点都属于并且唯一属于某一个交通中区,因此便可以根据每一对上下车点各自所属的交通中区来获取OD矩阵,数据处理过程如图3-5所示。
29
河北工业大学2015届毕业论文
开始 填写sheet2表头 将表格sheet1中总数据记录条数赋 值给rownum,并定义循环变量t 第t行上下车字符 段数值为1 Y 将sheet1中第t行区号赋值给origen1,将sheet2中第t+1行区号赋 值给origen2 将sheet2中第origen1+1行第 1 origen2+1列数值加 t>rownum Y 结束 N N t=t+1 图3-5 OD矩阵获取流程图
此外考虑到样本只占总量的1%,因此需要对OD矩阵中的数目按比例扩展,均扩大100倍,得到的部分OD矩阵如图3-6所示。具体代码参看附录A。
30
河北工业大学2015届毕业论文
图3-6 2014 年1月7日部分OD矩阵
3.5 本章小结
本文主要介绍了如何聚类分析完成OD点的聚类,完成交通分区,并得出OD矩阵。
首先就聚类分析进行了概述,然后对交通分区的原则等进行了概述,最后结合哈尔滨市实际的地理情况完成了交通分区,并根据得到的交通分区得到了OD矩阵。
31