1. 属性数据的来源
国家资源与环境信息系统规范在“专业数据分类和数据项目建议总表”中,将数据分为社会环境、自然环境和资源与能源三大类共14小项,并规定了每项数据的内容及基本数据来源。
(1)社会环境数据
社会环境数据包括城市与人口、交通网、行政区划、地名、文化和通信设施五类。这几类数据可从人口普查办公室、外交部、民政部、国家测绘局,以及林业、文化、教育、卫生、邮政等相关部门获取。
(2)自然环境
自然环境数据包括地形数据、海岸及海域数据、水系及流域数据、基础地质数据五类。这些数据可以从国家测绘局、海洋局、水利水电部以及地质、矿产、地震、石油等相关部门和结构获取。
(3)资源与能源
资源与能源数据包括土地资源相关数据、气候和水热资源相关数据、生物资源相关数据、矿产资源相关数据、海洋资源相关数据五类。这几类数据可从中国科学院、国家测绘局及农、林、气象、水电、海洋等相关部门获取。 2. 属性数据的分类
空间数据的分类,是根据系统的功能以及相应的国际、国家和行业空间信息分类规范和标准,将具有不同空间特征和语义的空间要素区别开来的过程,是为了在空间数据的逻辑结构上将数据组织为不同的信息层并标识空间要素的类别。
空间数据一般采用线分类法对空间实体进行分类,即将分类对象按选定的空间特征和语义信息作为分类划分的基础,逐次地分成相应的若干个层级的类目,并排列成一个有层次的,逐级展开的分类体系。同级类之间是并列关系,下级类与上级类间存在着隶属关系,同级类不重复、不交叉。从而将地理空间的空间实体组织为一个层级树,因此也称作层级分类法。
我国《国土基础地理信息数据分类与代码》(GB/T 13923-1992)将地球表面的自然和社会基础信息分为9个大类,分别为测量控制点、水系、居民地、交通、管线与垣栅、境界、地形与土质、植被和其他类,在每个大类下又依次细分为小类、一级和二级类,如图6.12所示。
3. 属性数据的编码
属性数据的编码是指确定属性数据的代码的方法和过程。代码是一个或一组有序的易于被计算机或人识别与处理的符号,是计算机鉴别和查找信息的主要依据和手段。编码的直接产物就是代码,而分类分级则是编码的基础。
平面控制点 测量控制点
?
高程控制点 其他控制点
国土基础地理信息
水系
? ? ?
高速公路 ? ? ? ? ? ? ? ?
城市快速路 城市主干道 城市次干道 城市支线 城市其他路
居民地 交通 管线和垣栅 境界
?
铁路 公路 铁路和公路 主要构筑物
?
一级公路 二级公路 三级公路
?
四级公路 等外公路 普通公路 专用公路 城市道路 ?
?
?
航运 港口 空运
? ? ?
地形与土质 植被 其他
? ?
图6.12 国土基础地理信息分类体系
对于要直接记录到栅格或矢量数据文件中的属性数据,则必须先对其进行编码,将各种属性数据变为计算机可以接受的数字或字符形式,便于GIS存储管理。属性数据编码一般要基于以下几个原则:①编码的系统性和科学性;②编码的一致性和唯一性。③编码的标准化和通用性;④编码的简捷性。⑤编码的可扩展性。
(1)属性数据编码方案的制定
在属性数据分类编码的过程中,应力求规范化、标准化,有可遵循标准的尽量依标准。如要对交通GIS系统数据进行编码,就有许多规范及行业标准可以遵循(表6.3)。
表6.3 与交通GIS相关的国家及行业标准 GB2260-95 GB10114-88 GB12409-90 GB/T15660-95 GB917.1-917.2 JT0022-90 JTJ073-96 GB920-89 GB/T919-94 GB11708-89 GBJ124-88 GB/T4754-94 中华人民共和国行政区划代码 县以下行政区划代码编制规则 地理格网 1:5千、1:1万、1:2.5万、1:5万、1:10万地形图要素与代码 公路路线命名编号和编码规则 公路管理养护单位代码编制规则 公路养护技术规范 公路路面等级与面层类型代码 公路等级代码 公路桥梁命名编号和编码规则 道路工程术语标准 国民经济行业分类与代码 如果没有适用的标准可遵循,可依照以下编码的一般方法,制定出有一定适用性的编码标准:
①列出全部制图对象清单;
②制定对象分类、分级原则和指标,将制图对象进行分类、分级; ③拟定分类代码系统;
④代码及其格式。设定代码使用的字符和数字、码位长度、码位分配等; ⑤建立代码和编码对象的对照表。这是编码最终成果档案,是数据输入计算机进行编码的依据。
河 流 6 可通航河 61 不通航河 62 常年河 611 时令河 612 消失河 613 长度<1 Km 6111 宽度<1m 61141 长度<2 Km 6112 宽度1~2 m 61142 长度<5 Km 6113 宽度2~5 m 61143 长度<10 Km 6114 长度>10 Km 6115 宽度>50 m 61146 宽度5~20 m 宽度20~50 m 61144 61145 深度5~10 m 611451 深度10~20 m 611452 深度20~30 m 611453 深度30~60 m 611454 深度>500 m 611458 深度60~120 m 深度120~300 m 深度300~500 m 611455 611456 611457 图6.13 河流类型的层次分类编码方案
属性的科学分类体系无疑是GIS中属性编码的基础。目前,较为常用的编码方法有层次分类编码法与多源分类编码法两种基本类型。
(2)层次分类编码法
层次分类编码法是按照分类对象的从属和层次关系为排列顺序的一种代码,它的优点是能明确表示出分类对象的类别,代码结构有严格的隶属关系。图6.13以河流类型的编码为例,说明层次分类编码法所构成的编码体系。
(3)多源分类编码法 又称独立分类编码法,是指对于一个特定的分类目标,根据诸多不同的分类依据分别进行编码,各位数字代码之间并没有隶属关系。表6.4以河流为例说明了属性数据多源分类编码法的编码方法。
表6.4 河流编码的标准分类方案 通航情况 流水季节 河流长度 河流宽度 < 1 m: 1 河流深度 5~10 m: 1 通航: 1 常年河:1 <1 Km: 1 不通航:2 时令河:2 <2 Km: 2 1~2 m: 2 10~20 m: 2 消失河:3 <5 Km: 3 2~5 m: 3 20~30 m: 3 <10 Km 4 5~20 m: 4 30~60 m: 4 >10 Km 5 20~50 m:5 60~120 m: 5 >50 m: 6 120~300 m:6 300~500 m:7 >500 m: 8 例如,表中常年河、通航、河床形状为树形,主流长7公里,宽25米,平均深度为50米在表中表示为:11454。由此可见,该种编码方法一般具有较大的信息载量。有利于对于空间信息的综合分析。
在实际工作中,也往往将以上两种编码方法结合使用,以达到更理想的效果。
6.3数据编辑
由于各种空间数据源本身的误差,以及数据采集过程中不可避免的错误,使得获得的空间数据不可避免的存在各种错误。为了“净化”数据,满足空间分析与应用的需要,在采集完数据之后,必须对数据进行必要的检查,包括空间实体是否遗漏、是否重复录入某些实体、图形定位是否错误、属性数据是否准确以及与图形数据的关联是否正确等。数据编辑是数据处理的主要环节,并贯穿于整个数据采集与处理过程。
不正规多边形 多边形不封闭 结点不重合 过头 不及 碎屑多边形 伪结点 图6.14 数据错误示意图 6.3.1 图形数据编辑
空间数据采集过程中,人为因素是造成图形数据错误的主要原因。如数字化过程中手的抖动,两次录入之间图纸的移动,都会导致位置不准确,并且在数字化过程中,难以实现完全精确的定位。常见的数字化错误是线条连接过头和不及两种情况。此外,在数字化后的地图上,经常出现的错误有以下几种(图6.14):
(1)伪节点(Pseudo Node):当一条线没有一次录入完毕时,就会产生伪结点。伪节点使一条完整的线变成两段。
(2)悬挂节点(Dangling Node):当一个节点只与一条线相连接,那么该节点称为悬挂节点。悬挂节点有过头和不及、多边形不封闭、节点不重合等几种情形。
(3)碎屑多边形(Sliver Polygon):碎屑多边形也称条带多边形。因为前后两次录入同一条线的位置不可能完全一致,就会产生碎屑多边形,即由于重复录入而引起。另外,当用不同比例尺的地图进行数据更新时也可能产生。
(4)不正规的多边形(Weird Polygon):在输入线的过程中,点的次序倒置或者位置不准确会引起不正规的多边形。在进行拓扑生成时,会产生碎屑多边形。
上述错误—般会在建立拓扑的过程中发现。其它图形数据错误,包括遗漏某些实体、重复录入某些实体、图形定位错误等的检查一般可采用如下方法进行:
(1)叠合比较法,把成果数据打印在透明材料上,然后与原图叠合在一起,在透光桌上仔细的观察和比较。叠合比较法是空间数据数字化正确与否的最佳检核方法,对于空间数据的比例尺不准确和空间数据的变形马上就可以观察出来。如果数字化的范围比较大,分块数字化时,除检核一幅(块)图内的差错外,还应检核已存入计算机的其它图幅的接边情况;
(2)目视检查法,指在屏幕上用目视检查的方法,检查一些明显的数字化误差与错误; (3)逻辑检查法,根据数据拓扑一致性进行检验,如将弧段连成多边形,数字化节点误差的检查等。
对于检查出的错误,对图形数据编辑是通过向系统发布编辑命令(多数是窗口菜单)用光标激活来完成的。编辑命令主要有增加数据、删除数据和修改数据三类。编辑的对象是点元、线元、面元及目标,编辑工作的完成主要利用GIS的图形编辑功能(表6.5)来完成。
表6.5 地理信息系统的图形编辑功能 点编辑 删除 移动 拷贝 旋转 追加 水平对齐 垂直对齐
线编辑 删除 移动 拷贝 追加 旋转(改向)
剪断 光滑 求平行线
面编辑 弧段加点 弧段删点 弧段移动 删除弧段 移动弧段 插入弧段 剪断弧段
目标编辑 删除目标 旋转目标 拷贝目标 移动目标 放大目标 缩小目标 开窗口
6.3.2 属性数据编辑
属性数据校核包括两部分:
(1)属性数据与空间数据是否正确关联,标识码是否唯一,不含空值。 (2)属性数据是否准确,属性数据的值是否超过其取值范围等。
对属性数据进行校核很难,因为不准确性可能归结于许多因素,如观察错误、数据过时和数据输入错误等等。属性数据错误检查可通过以下方法完成:
(1)首先可以利用逻辑检查,检查属性数据的值是否超过其取值范围,属性数据之间或属性数据与地理实体之间是否有荒谬的组合。在许多数字化软件中,这种检查通常使用程序来自动完成。例如有些软件可以自动进行多边形结点的自动平差,属性编码的自动查错等。
(2)把属性数据打印出来进行人工校对,这和用校核图来检查空间数据准确性相似。 对属性数据的输入与编辑,一般在属性数据处理模块中进行。但为了建立属性描述数据与几何图形的联系,通常需要在图形编辑系统中设计属性数据的编辑功能,主要是将一个实体的属性数据连接到相应的几何目标上,亦可在数字化及建立图形拓扑关系的同时或之后,对照一个几何目标直接输入属性数据。一个功能强的图形编辑系统可提供删除、修改、拷贝属性等功能。
6.4 数学基础变换
每一个地理信息系统所包含的空间数据都应具有同样的地理数学基础,包括坐标系统、地图投影等。扫描得到的图像数据和遥感影像数据往往会有变形,与标准地形图不符,这时需要对其进行几何纠正。当在一个系统内使用不同来源的空间数据时,它们之间可能会有不同的投影方式和坐标系统,需要进行坐标变换使它们具有统一的空间参照系统。统一的数学基础是运用各种分析方法的前提。