河北工业大学2015届毕业论文
20 21 22 23 24 25 26 27 28 29 45.780397 45.695957 45.806174 45.718091 45.762608 45.783897 45.678034 45.781727 45.822569 45.833221 126.772726 126.635227 126.534923 126.553596 126.624062 126.697617 126.730958 126.675688 126.642233 126.750379
图 3-1 初始聚类中心
此外考虑到k-均值聚类法是以距离最小为原则,但是现有数据各个数据点地理位置的确定是依靠其经纬度,而经纬度是不能直接进行距离的计算的,需将各个经纬度坐标点转化为平面坐标系内的点,才能够进行聚类分析,在此将WGS-84坐标系的经纬度数值(经度,纬度)转化为54系的高斯平面坐标系内的平面数据(x,y),在此需要提供哈尔滨市的中央子午线的经度,大约为东经126度33分31.19秒,本文中是利用VBA来转换坐标
22
河北工业大学2015届毕业论文
系,具体代码参看附录A,经整理计算公式如下:
X?f*Radians(B)?sin(Radians(B))*cos(Radians(B))*(c?sin2(Radians(B)) *(d?sin2Radians(B))*e))?((((tan2(Radians(B))?58)*tan2(radians(B))?61) *(Radians(L?L0))2*(cos2(Radians(B))?58)*(tan2(Radians(B))?61)* (Radians(L?L0))2*cos2(Radians(B))/30?(4*a*cos2(Radians(B))?5) *(1?a*cos2(Radians(B)))?tan2(Radians(B))*(Radians(L?L0))2 *cos2(Radians(B))/12?1)*b/1?a*cos2(Radians(B))*tan(Radians(B)) *(Radians(L?L0))2*cos2(Radians(B))/2
Y?((((tan2(Radians(B))?18)*tan2(Radians(B))?(58*tan2(Radians(B))?14) *a*cos2(Radians(B))?5)*(Radians(L?L0))2*cos2(Radians(B))?5) * (Radians(L?L0))2*cos2(Radians(B))/20?(1?a*cos2(Radians(B)) ?tan2(Radians(B)))*(Radians(L?L0))2*cos2(Radians(B))/6?1) *b/1?a*cos2(Radians(B))*Radians(L?L0)*cos(Radians(B))其中
L0
,L,B分别代表当地的中央子午线经度、转换坐标点的纬度值、转换坐标点的经
度值的以度为单位的形式,a=0.006738525415,b=6399698.9018,c=32005.78006,d=133.92133,e=0.7031,f=6367558.49686[25]。
在此以聚类中心数据为例展示经过转换之后的数据的形式,处理后的聚类中心数据如表3-2所示。
表3-2 平面坐标系的聚类中心
CLUSTER_ 1 2 3 4 5 6 7 8 9 10
X 5066785.530544 5065311.957838 5071142.895249 5062845.090225 5074824.223207 5068476.060512 5059134.873927 5069040.003512 5070737.001532 5066412.922015 23
Y 4576.498183 14762.96748 6022.927922 9625.377641 -3871.3677 7328.857208 4812.863446 3243.603993 12850.31244 9096.40983 河北工业大学2015届毕业论文
11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 5068852.518702 5066871.198554 5063606.007731 5062570.894924 5078667.215229 5074963.637833 5061351.476280 5066117.698320 5064959.349626 5071788.923584 5062384.140947 5074632.002712 5064841.440870 5069791.490951 5072165.048520 5060403.639724 5071921.124994 5076457.422947 5077655.870769 10173.04323 1998.648638 3880.161858 -3702.97632 -1549.16806 -458.834373 977.5839039 11626.84298 6856.520057 16647.71134 5963.331225 -1845.48924 -394.570893 5087.659384 10805.7732 13423.89287 9100.804307 6494.307999 14895.68875 3.3.2 进行K-均值聚类
首先在SPSS中打开2014年1月7日的数据,通过SPSS利用每条数据中的位置数据来进行聚类分析,具体过程如图3-2所示,
24
河北工业大学2015届毕业论文
25
河北工业大学2015届毕业论文
图3-2 K—均值聚类过程
经K-均值聚类所得到的结果如表3-3所示。
26