为相对精度和绝对精度。
(3)属性精度:指空间实体的属性值与其真值相符的程度。通常取决于地理数据的类 型,且常常与位置精度有关,包括要素分类与代码的正确性、要素属性值的准确性及其名 称的正确性等。
(4)时间精度:指数据的现势性。可以通过数据更新的时间和频度来表现。
(5)逻辑一致性:指地理数据关系上的可靠性,包括数据结构、数据内容(包括空间特征、专题特征和时间特征),以及拓扑性质上的内在一致性。
(6)数据完整性:指地理数据在范围、内容及结构等方面满足所有要求的完整程度,包括数据范围、空间实体类型、空间关系分类、属性特征分类等方面的完整性。
(7)表达形式的合理性:主要指数据抽象、数据表达与真实地理世界的吻合性,包括空间特征、专题特征和时间特征表达的合理性等。 2、空间数据质量的评价
空间数据质量的评价,就是用空间数据质量标准要素对数据所描述的空间、专题和时 间特征进行评价。下面给出了空间数据质量评价矩阵(表5-2)。
表5-2 空间数据质量评价矩阵表
空间数据描述 空间数据要素 世系(继承性) 位置精度 属性精度 逻辑一致性 完整性 表现形式准确性 空间特征 时间特征 专题特征 三、 误差的类型(源误差、操作误差)
空问数据的质量通常用误差来衡量,而误差定义为空间数据与其真值的差别。空间数据误差的来源是多方面的,例如,GIS的原始录入数据本身包含着数据采集过程中引入的源误差。另外,在原始数据录入到空间数据库以及随后的数据分析处理和结果输出过程中,每一步都会引入新误差。根据P.A.Burrough(1986)的建议,可以将GIS数据误差的来源归纳为三类,如表5-3所示。
97
1、源误差
GIS数据的来源主要有,直接从现场利用GPS或全站仪采集的数字数据;现有纸质地图的数字化;航空影像和遥感数字数据或统计调查数据等。这些数据受表5—3中前两类误差来源的部分或全部影响。
表5-3 空间数据误差的来源
误差类型 误差来源 误差特征 源误差 数据年代;数据的空间覆盖范围;地图比例尺;观测密度数据的可访问性,数据格式;数据与用途的一致性;数据的采集处理费用明显、易探测 由自然变化或原始测量引起的误差位置误差;属性误差:质量和数量方面的误差 数据偏差:输入输出错误,观测者偏差,自然变化 不明显 难测定 GIS处理过程引起的误差 计算机字长引起的误差 拓扑分析引起的误差:逻辑错误、地图叠置操作 分类与综合引起的误差:分类方法、分类间隔、内插方法复杂 难探测
(1) 地面测量数字数据的误差
来源于地面测量的数字数据中含有控制测量和碎部测量误差。其中控制点误差又受控制网的参考基准、网形和观测精度以及观测费用等因素的影响。碎部点误差随继承了控制点的误差外,还受自身的观测方法、观测精度和地界的人为判断,以及地物地貌的取舍等 因素的影响。当然,原始观测误差受观测仪器、观测者和外界环境三种因素影响。地面测量数据中的误差可以表现为随机误差、系统误差或粗差。一般而言,粗差采用可靠性理论探测剔除,系统误差采用实验方法校正或建立系统误差模型处理,随机误差采用随机模型, 如最小二乘法平差处理。利用误差传播律可求得点坐标的方差—协方差阵或误差椭圆(球)元素采表达点坐标数据的精度。
(2) 地图数字化数据的误差
目前GIS数据的主要来源之一是现有地图数字化。原因固有误差和数字化过程误差是 地图数字化数据误差的主要来源。原因固有误差除含有上述地面控制测量和碎部测量的全 部误差外,还含有制图误差。
① 制图误差
a 、控制点展绘误差 展绘控制点是成图的第一步。对于与立体测图仪相连的直角坐标展点仪而言,该项误差的均方根为0.17—0.32mm,这在地图精度要求不高时可不予考虑。
98
b、编绘误差 地形图的编绘一般用摄影测量手段把各种原始资料化为同一比例尺的过程,其中所引入的误差大约在0.30一O.33mm之间。
c、绘图误差 绘图误差是在绘图过程中产生的。误差的范围为0.06-0.18mm之间。 d、综合误差 地图综合误差的大小取决于特征的类型与复杂程度,故该项误差极难量化。象曲线这类特征,其综合误差可能很大,而直线的综合误差又近似为零。当两个或两个以上的特征无法在图上适当表示时,需要人为地在地图上将特征表示符移位,使地图清晰易渎。这种移位也会引起综合误差,其大小主要取决于特征的接近程度和成图比例尺的大小。比例尺越小,移位越大,误差也越大。
e、地图复制误差 地图复制误差的均方差为O.1一O.2mm。
f、分色板套合误差 彩色地图是由一系列金属分色板套合生成的,每一块分色板在图 上印出一种颜色。该项误差的均方差为O.17—0.30mm。
g、绘图材料的变形误差 地图一般印刷于纸质载体上,随着温度和湿度的变化,纸的尺寸也会改变。如果温度不变,湿度从0%增至25%,则纸的尺寸改变1.6%。由于纸的膨胀系数和收缩系数并不相等,因此,即使湿度又降至原来大小,图纸也不可能恢复到原来尺寸。由于纸张在印刷时温度升高,纸张长度会伸长1.5%,宽度伸长2.9%,而当纸干燥或冷却后,其长度和宽度又分别收缩0.25%和0.75%。因此,印刷冷却后,图纸在长、宽方向上的净伸长分别为1.25%和2.15%,
h、归化到同一比例尺所引起的误差 地图的比例尺是指真实的主比例尺。例如,对兰勃特正形投影而言,主比例尺只有沿着标准纬线时才是不变的,而标准纬线之内的比例尺变小,之外的比例尺变大。因此,在将地图数字化或者从地图量距时,必须利用适当的比例尺因子进行修正。
i、特征的定义 自然界的许多特征并无明确的界限。例如,海岸线的实际位置在哪里? 森林和草地间的界线如何确定?因此,特征定义会引起特征位置的某些不确定性,但并非 所有的特征都有此误差。
j、特征夸大误差 为了增强图的可读性,有时需要夸大某些特征,因为它们在图上难以按其真实情况表示。例如,分界线应是无宽线、但表示在图上时,却占有一定宽度。有时根据地图的用途,需要将某些特征夸大,以区别于其它特征。如,在道路上将道路特征夸大以示醒目。特征夸大误差取决于地图的比例尺、用途和所涉及特征的类型。同样地,并非所有的特征都具有此类误差。
由于很难知道制图过程中各种误差间的关系以及图纸尺寸的不稳定性,因此,很难准 确地评价原图固有误差。
99
② 数字化误差
数字化方式主要有手工数字化和扫描数字化。目前在生产实践中多采用扫描数字化,然后屏幕半自动化跟踪。线划跟踪与扫描数字化所引起的平面误差较小,只是在扫描数字化时,要素结合处出现的误差较大。 (3)遥感数据误差
遥感数据的误差累积过程可以区分为:数据获取误差、数据处理误差、数据分析误差、 数据转换误差和人工判断误差。
① 数据获取误差
遥感资料获取时,存在着多种误差。其中有些误差源是可控的,例如,几何误差或辐射误差;有些则是不可控的,如气候条件和景观的自然变化。可控的数据获取误差又包括 几何误差和遥感平台误差。
② 数据预处理误差
数据预处理包括利用地面控制进行校正,几何校正、图像增强和分类等。这些预处理 会引入各种各样的误差。例如,几何校正会引起平面位置和专题误差。位置误差取决于校 正模型的逼近和校正模型参数求解时所用控制数据中的误差。专题误差来自重新抽样。分 类本身就是一个引入显著误差的过程。潜在的分类误差源可能有遥感数据测量中的随机误 差,类型清晰度中的模糊度,混合类型分类系统,以及不同的分类系统缺少相容性。
③ 数据转换误差
在矢量—栅格数据转换过程中,会出现显著误差。引起矢量数据栅格化误差的主要原因有两个:属性概括误差;拓扑匹配错误。栅格化误差的大小与下列因素有关:转换中所用的算法,格网的尺寸,栅格表达时的定向,以及地图图形的复杂性等。
④ 人工判读误差
在数据分析和判读阶段会引入人工判读误差。在GIS中使用遥感数据时,人工判读误差会影响随后的GIS分析结果。这种误差是主观的,因此难以量化,它与判读员从遥感影像中提取信息的能力和技能有关,还与影像的尺度和所需的概括程度有关。 2、操作误差
除了GIS原始录入数据本身带有的源误差外,空间数据在GIS的模型分析和数据处理等操作中还会引入新误差。如,由计算机字长引起的误差,拓扑分析引入的误差和叠置中引入的误差等。
(1)由计算机字长引起的误差
在计算机中,数据是由一定字长的编码数字表示的。舍入误差是由计算机字长引起的
100
一种误差。这种误差出现在GIS的各种数值运算和模型分析过程中。由舍入误差引起的问 题很多,例如GIS空间数据库中整数编码对面积和周长计算的影响,比例尺变换和旋转变 换对拓扑关系的影响等。削弱舍入误差影响的方法主要有:增加字长并用带小数的实数表 示数据;改变数据在计算机中的表达方式;采用合适的算法等。
除了数据处理精度外,数据存储精度也与计算机字长有关。16位的计算机在存储低分辨率的栅格图像时不会出现问题,但存储高精度的控制点坐标或点位精度要求高的地理数据时,则不能胜任。减少存储误差影响的方法有:采用双精度字长存储数据,使用有效位数多的数据记录控制点坐标;使用32位整数运算法处理数据,即把坐标数据转换成以厘米或毫米为单位的整数,然后用整数存储和运算;采用嵌套法,即先把研究区域划分成若干块,并用粗略的分辨率来定义它们,每块再以有限精度建立局部原点,以此为基准确定块中各细节的坐标。这种方法可以用单精度字长记录非控制点坐标,用双精度字长记录控制点坐标,并可将它们联接起来。嵌套可以是多级嵌套。 (2)由拓扑分析引起的误差
GIS中的拓扑分析会产生大量的误差。如矢量数据栅格化引起的拓扑匹配误差,多层叠置过程中产生的无意义多边形等。这是由于GIS中进行的大多数拓扑空间操作都隐含地假设:原始数据是均匀分布的,数字化过程没有错误;拓扑网络的叠置仅仅是网络多边形边界相交和重新构成网络问题;边界线能明确定义和描绘;所有的算法都假定为完全确定的操作;对某类型或其它自然因素所确定的分类区间是最合适的。 (3)数据分类和内插引起的误差
GIS空间数据库中数据的许多不规则性是由所使用的分类方法和从点数据到面数据的内插方法引起的,即它们作为GIS中的一种操作会引入许多误差。
以上讨论了GIS空间数据库中原始录用数据本身含有的源误差和随后空间操作中引入的新误差。一般来说,源误差远大于操作误差,因此,要想控制GIS产品的质量,良好的原始录用数据是首要的。
四、GIS空间操作中误差的传播
GIS产品是利用含有源误差的空间数据,通过GIS分析操作产生的。源误差和操作误差通过GIS操作经累积后传播到GIS的产品中。考虑如下的GIS空间操作: y=f(xl,x2,...xn)
其中xi(i=1,2…n)为描述空间数据的自变量,它带有源误差;y为描述GIS产品的因变量,f(·)为描述GIS空间操作过程的数学函数,用以计算操作误差。根据f(·)的特征,可以分成两类运算:算术运算和逻辑运算。下面讨论这两种运算关系下的误差传播。
101