储。
4. 相同属性多边形公共边界的删除
当图幅内图形数据完成拼接后,相邻图斑会有相同属性。此时,应将相同属性的两个或多个
1 2 2 相邻图斑组合成一个图斑,即消除公共边界,并
1 对共同属性进行合并(图6.32)。 2 多边形公共界线的删除,可以通过构成每一面域的线段坐标链,删去其中共同的线段,然后
图6.32 相同属性多边形公共边界的删除
重新建立合并多边形的线段链表。
对于多边形的属性表,除多边形的面积和周长需重新计算外,其余属性保留其中之一图斑的属性即可。
1 2 6.7 拓扑生成
在图形修改完毕后,需要对图形要素建立正确的拓扑关系。目前,大多数GIS软件都提供了完善的拓扑关系生成功能。正如拓扑的定义所描述的,建立拓扑关系时只需要关注实体之间的连接、相邻关系,而节点的位置、弧段的具体形状等非拓扑属性则不影响拓扑的建立过程。
1. 点线拓扑关系的建立
点线拓扑关系的建立方法有两种方案。一种是在图形采集和编辑中实时建立,此时有两个文件表,一个记录结点所关联的弧段,一个记录弧段两端点的结点。如图6.33所示,已经数字化了两条弧段A1 、A2,涉及3个结点,当从N2 出发数字化第三条弧段A3时,起始结点首先根据空间坐标,寻找它附近是否存在已有的结点或弧段,若存在结点,则弧段A3不产生新的起结点号,而将N2作为它的起结点。当它到终结点时,进行同样的判断和处理,由于A2的终结点不能匹配到现有结点,因而产生一个新结点。将新弧段和新结点分别填入弧段表中,同时在结点表一栏的N2的记录添加N2所关联的新弧段A3。同理在数字化的弧段A4时,由于起结点和终结点都匹配到原有的结点,所以不需创建新结点记录,只是创建一个新的弧段记录,然后在原来的N3和N4结点关联的弧段记录中分别增加这一条弧段号A4。
建立结点弧段拓扑关系的第二种方案是在图形采集与编辑之后,系统自动建立拓扑关系。其基本思想与前面类似,在执行过程中逐渐建立弧段与起终结点和结点关联的弧段表。
N1 N2 A 2A1
ID N3 A1 A2 弧段-结点表 起结点 N1 N2 终结点 N2 N3 结点-弧段表 ID N1 N2 N3 关联弧段 A1 A1,A2 A2
N1 N2 A 2A1
A3 N3 N4 ID A1 A2 A3 弧段-结点表 起结点 N1 N2 N2 结点-弧段表
终结点 N2 N3 N4 ID N1 N2 N3 N4 关联弧段 A1 A1,A2,A3 A2 A3 弧段-结点表 结点-弧段表
N1 N2 A 2A1 A3 N3 A4 N4 ID A1 A2 A3 A4 起结点 N1 N2 N2 N3 终结点 N2 N3 N4 N3 ID N1 N2 N3 关联弧段 A1 A2,A2,A3 A2,A4 A3,A3 图6.33 结点与弧段拓扑关系的实时建立
2. 多边形拓扑关系的建立
多边形有三种情况:独立多边形,它与其他多边形没有共同边界,如独立房屋,这种多边形可以在数字化过程中直接生成,因为它仅涉及一条封闭的弧段;具有公共边界的简单多边形,在数据采集时,仅输入了边界弧段数据,然后用一种算法自动将多边形的边界聚合起来,建立多边形文件;第三种是嵌套的多边形,除了要按第二种方法自动建立多边形外,还要考虑多边形内的多边形(也称作内岛)。
下面以第二种情况为例,讨论多边形自动生成的步骤和方法。 a) 三个没有吻合在一起的弧段端点 b) 经结点匹配处理后产生的同一结点
首先进行结点匹配(snap)。如图6.34所示的3条弧段的端点A、B、C本来应该是同一结点,但由于数字化误差,三点坐标不完全一致,造成他们之间不能建立关联关系。因此,以任一弧段的端点为圆心,以给定容差为半径,产生一个搜索圆,搜索落入该搜索圆内的其他弧段的端点,若有,则取这些端点坐标的平均值作为结点位置,并代替原来各弧段的端点
A4 弧段—结点表 ID N2 A5 A6 N3 A1 A2
A2 A3 A4 A5 A6 图6.34 结点匹配示意图
结点—弧段表 ID N1 N2 N3 N4 N4 起结点 N1 N1 N1 N4 N4 N2 终结点 N4 N3 N2 N3 N2 N3 关联弧段 A2, A3, A1 A6, A5, A3 A4, A6, A2 A4, A1, A5 A3 A1 N1
图 6.35 结点与弧段拓扑关系的建立
坐标。
建立结点—弧段拓扑关系。在结点匹配的基础上,对产生的结点进行编号,并产生两个文件表,一个记录结点所关联的弧段,另一个记录弧段两端的结点(图6.35)。
多边形的自动生成。多边形的自动生成实际上就是建立多边形与弧段的关系,并将弧段关联的左右多边形填入弧段文件中。建立多边形拓扑关系时,必须考虑弧段的方向性,即弧段沿起结点出发,到终结点结束,沿该弧段前进方向,将其关联的两个多边形定义为左多边形和右多边形。多边形拓扑关系是从弧段文件出发建立的。
A2 A3 N1 ID N1 关联弧段 A3, A2, A1, A4 A1 A4 图6.36 在结点处弧段按方位角大小排序
在建立多边形拓扑关系之前,首先将所有弧段的左、右多边形都置为空,并将已经建立的结点—弧段拓扑关系中各个结点所关联的弧段按方位角大小排序。方位角是指从x轴按逆时针方向量至结点与它相邻的该弧段上后一个(或前一个)顶点的连线的夹角(图6.36)。建立多边形拓扑关系的算法如下:
从弧段文件中得到第一条弧段,以该弧段为起始弧段,并以顺时针方向为搜索方向,若起终点号相同,则这是一条单封闭弧段,否则根据前进方向的结点号在结点—弧段拓扑关系表中搜索下一个待连接的弧段。由于与每个结点有关的弧段都已按方位角大小排过序,则下一个待连接的弧段就是它的后续弧段。如图6.35所示,假如从A4开始,其起结点为N4,终结点为N3,在结点N3上,连接的弧段分别为A4、A6、A2, 则后续弧段为A6,沿A6向前追踪,其下一结点为N2, N2连接的弧段为A6、A5、A3,后续弧段为A5,A5的下一结点为N4,回到弧段追踪的起点,形成一个弧段号顺时针排列的闭合的多边形,该多边形——弧段的拓扑关系表建立完毕。在多边形建立过程中,将形成的多边形号逐步填入弧段——多边形关系表的左、右多边形内。
对于嵌套多边形,需要在建立简单多边形以后或建立过程中,采用多边形包含分析方法判别一个多边形包含了哪些多边形,并将这些内多边形按逆时针排列。 3. 网络拓扑关系的建立
在输入道路、水系、管网、通讯线路等信息时,为了进行流量、连通性、最佳线路分析,需要确定实体间的连接关系。网络拓扑关系的建立主要是确定结点与弧段之间的拓扑关系,这一工作可以由GIS软件自动完成,其方法与建立多边形拓扑关系时相似,只是不需要建立多边形。但在一些特殊情况下,两条相互交叉的弧段在交点处不一定需要结点,如道路交通中的立交桥,在平面上相交,但实际上不连通,这时需要手工修改,将在交叉处连通的节
图6.37 删除不需要的节点
点删除(图6.37)。
6.8 数据压缩
数据压缩是指从取得的数据集合中抽取一个子集,这个子集作为一个新的信息源,在规定的精度范围内最好地逼近原集合,而又取得尽可能大的压缩比。 1. 栅格数据的压缩
栅格数据的压缩是指栅格数据量的减少,这是与栅格数据结构密切相关的话题。其压缩技术有游程长度编码、块状编码、四叉树法等,详见第四章。 2. 矢量数据的压缩
矢量数据压缩的目的是删除冗余数据,减少数据的存储量,节省存储空间,加快后继处
理的速度。压缩的主要任务是根
P4 P1 P8 据线性要素中心轴线和面状要P14 P3 P9 P5 P7 素的边界线的特征,减少弧段矢P12 Pn
量坐标串中顶点的个数(结点不P2 P10 P6 P11 P13 P 能去除),常用的压缩方法有如15P1 P P3 P5 P14 14下几种。 P8 P9 P7 (1)间隔取点法
Pn
每隔规定的距离取一点,或P10 P2 P6 P13 P 者每隔k个点取一点,但首末点15P14 一定要保留。如图6.38所示,弧
D临
段由顶点序列{P1,P2,?Pn}构成,图6.38 间隔取点法
D临为临界距离。首先保留弧段
的起始点P1,再计算P2点与 P1点之间的距离D21,若D21≧D临,则保留第P2点,否则舍去P2点。依此方法,逐一比较相邻两点间的距离,以确定需要舍弃的点。
(2)垂距法和偏角法
P2
P4
P1 P2
P4
限差 限差 P3 图6.39 垂距法和偏角法
P3 这两种方法是按照垂距或偏角的限差选取符合或超过限差的点。如图6.39所示,P2点
的垂距和偏角小于限差,应舍弃;P3点的垂距和偏角大于限差,应保留。
(3)分裂法(Douglas-Peucker法)
这种方法试图保持曲线走向,并允许用户规定合理的限差。其步骤为: ①把曲线首末两端点连成一条直线; ②计算曲线上每一点与直线的垂直距离。若所有这些距离均小于限差,则将直线两端点间的各点全部舍去。
③若上一步条件不满足,则保留含有最大垂足距离的点,将原曲线分成两段曲线,再递归地重复使用分裂法。
6.9 数据质量评价与控制
空间数据是地理信息系统最基本和最重要的组成部分,也是一个地理信息系统项目中成本比重最大的部分。数据质量的好坏,关系到分析过程的效率高低,及至影响着系统应用分析结果的可靠程度和系统应用目标的真正实现。因此,对数据质量的评价与控制就显得尤为重要。
6.9.1 空间数据质量的相关概念
与空间数据质量相关的几个概念分别是: 1. 误差(Error)
简而言之,误差表示数据与其真值之间的差异。误差的概念是完全基于数据而言的,没有包含统计模型在内,从某种程度上讲,它只取决于量测值,因为真值是确定的。如测量地面某点高程为1002.4m,而其真值为1001.3m,则该数据误差为0.9m。
误差与不确定性有着不同的含义。在上例中,认为量测值(1002.4m)与误差(0.9m)都是确定的。也就是说,存在误差,但不存在不确定性。不确定性指的是“未知或未完全知”,因此,不确定性是基于统计的推理、预测。这样的预测即针对未知的真值,也针对未知的误差。
2. 准确度(Accuracy)
准确度是量测值与真值之间的接近程度。它可以用误差来衡量。仍以前问所述某点高程为例,如果以更先进量测方式测得其值为1002.1m,则此量测方式比前一种方式更为准确,亦即其准确度更高。 3. 偏差(Bias)
与误差不同,偏差基于一个面向全体量测值的统计模型,通常以平均误差来描述。 4. 精密度(Precision)
精密度指在对某个量的多次量测中,各量测值之间的离散程度。可以看出,精密度的实质在于它对数据准确度的影响,同时在很多情况下,它可以通过准确度而得到体现,故常把二者结合在一起称为精确度,简称精度。精度通常表示成一个统计值,它基于一组重复的监测值,如样本平均值的标准差。
A组量测值 B组量测值 C组量测值 D组量测值
图6.40中,离中心圆圆心距离越近,表示越高的准确度(Accuracy)。图中,A 组量测值中,只有一个距离圆心较近,准确度相对较高,整体值比较分散,说明这一组数据偏差大、精密度较差;B组量测值偏差不大但精密度较低,数据整体准确度较低;C组值偏差较大,虽具有较高的精密度,整体准确度仍较低;D组值偏差较小且具有很高的精密度,数据整体准确性较高。
5. 不确定性(uncertainty)
不确定性是指对真值的认知或肯定的程度,是更广泛意义上的误差,包含系统误差、偶然误差、粗差、可度量和不可度量误差、数据的不完整性、概念的模糊性等。在GIS中,用于进行空间分析的空间数据,其真值一般无从量测,空间分析模型往往是在对自然现象认识的基础上建立的,因而空间数据和空间分析中倾向于采用不确定性来描述数据和分析结果的质量。
此外,GIS数据的规范化和标准化直接影响地理信息的共享,而地理信息共享又直接影响到GIS的经济效益和社会效益。为了解决利用已有数据资源,并为今后数据共享创造条件,各国都在努力开展标准化研究工作。国家制定的规范和标准是信息资源共享的基础,不但有利于国内信息交流,也有利于国际信息交流。但是目前空间数据的标准化仍然存在不少问题,还缺乏统一的标准和规范,各部门间也缺乏必要的联系和协调,对空间数据科学的分类和统计缺乏严格的定义,直接导致建立的各类信息系统之间数据杂乱,难以相互利用,信息得不到有效的交流和共享。为使数据库和信息系统能向各级政府和部门提供更好的信息服
图6.40 数据质量相关概念示意图