第五章 空间数据采集与处理
第一节 数据源种类
地理信息系统的数据源是指建立地理信息系统数据库所需要的各种类型数据的来源。地理信息系统的数据源是多种多样的,并随系统功能的不同而不同,主要包括以下各种:
一、 地图
各种类型的地图是GIS最主要的数据源,因为地图是地理数据的传统描述形式,是具有共同参考坐标系统的点、线、面的二维平面形式的表示,内容丰富,图上实体间的空间关系直观,而且实体的类别或属性可以用各种不同的符号加以识别和表示。我国大多数的GIS系统其图形数据大部分都来自地图。但由于地图以下的特点,对其应用时须加以注意。
1、 地图存储介质的缺陷 由于地图多为纸质,由于存放条件的不同,都存在不同程
度的变形,具体应用时,须对其进行纠正。
2、 地图现势性较差 由于传统地图更新需要的周期较长,造成现存地图的现势性不
能完全满足实际的需要。
3、 地图投影的转换 由于地图投影的存在,使得对不同地图投影的地图数据进行交
流前,须先进行地图投影的转换。
二、 遥感影象数据
遥感影象是GIS中一个极其重要的信息源。
通过遥感影象可以快速、准确地获得大面积的、综合的各种专题信息,航天遥感影象还可以取得周期性的资料,这些都为GIS提供了丰富的信息。但是因为每种遥感影象都有其自身的成像规律、变形规律,所以对其的应用要注意影象的纠正、影象的分辨率、影象的解译特征等方面的问题。
三、 统计数据
国民经济的各种统计数据常常也是GIS的数据源。如人口数量、人口构成、国民生产总值等等。
四、 实测数据
各种实测数据特别是一些GPS点位数据、地籍测量数据常常是GIS 的一个很准确和很
82
现势的资料。
五、 数字数据
目前,随着各种专题图件的制作和各种GIS系统的建立,直接获取数字图形数据和属性数据的可能性越来越大。数字数据也成为GIS信息源不可缺少的一部分。但对数字数据的采用需注意数据格式的转换和数据精度、可信度的问题。
六、 各种文字报告和立法文件
各种文字报告和立法文件在一些管理类的GIS系统中,有很大的应用,如在城市规划管理信息系统中,各种城市管理法规及规划报告在规划管理工作中起着很大的作用。
对于一个多用途的或综合型的系统,一般都要建立一个大而灵活的数据库,以支持其非常广泛的应用范围。而对于专题型和区域型统一的系统,则数据类型与系统功能之间具有非常密切的关系。
第二节 空间数据采集
一、 属性数据的采集
属性数据即空间实体的特征数据,一般包括名称、等级、数量、代码等多种形式,属性数据的内容有时直接记录在栅格或矢量数据文件中,有时则单独输入数据库存储为属性文件,通过关键码与图形数据相联系。
对于要输入属性库的属性数据,通过键盘则可直接键入。
对于要直接记录到栅格或矢量数据文件中的属性数据,则必须先对其进行编码,将各种属性数据变为计算机可以接受的数字或字符形式,便于GIS存储管理。 下面,主要从属性数据的编码原则、编码内容、编码方法方面作以说明。 1、 编码原则
属性数据编码一般要基于以下三个原则:
(1)编码的系统性和科学性。编码系统在逻辑上必须满足所涉及学科的科学分类方法,以体现该类属性本身的自然系统性。另外,还要能反映出同一类型中不同的级别特点。一个编码系统能否有效运作其核心问题就在于此。
(2)编码的一致性。一致性是指对象的专业名词、术语的定义等必须严格保证一致, 对代码所定义的同一专业名词、术语必须是唯一的。
(3)编码的标准化和通用性。为满足未来有效的信息传输和交流,所制定的编码系统
83
必须在有可能的条件下实现标准化。
我国目前正在研究编码的标准化问题,并对某些项目作了规定。如中华人民共和国行政区划代码使用国家颁布的GB—2260—80编码,其中有省(市、自治区)三位,县(区)三位。其余三位由用户自己定义,最多为十位。编码的标准化就是拟定统一的代码内容、码位长度、码位分配和码位格式为大家所采用。因此,编码的标准化为数据的通用性创造了条件。当然,编码标准化的实现将经历一个分步渐进的过程,并且只能是适度的,这是由于地理对象的复杂性和区域差异性所决定的。
(4)编码的简捷性。在满足国家标准的前提下、每一种编码应该是以最小的数据量载负最大的信息量,这样,既便于计算机存贮和处理,又具有相当的可读性。
(5)编码的可扩展性。虽然代码的码位一般要求紧凑经济、减少冗余代码,但应考虑到实际使用时往往会出现新的类型需要加入到编码系统中,因此编码的设置应留有扩展的余地,避免新对象的出现而使原编码系统失效、造成编码错乱现象。
2、编码内容
属性编码一般包括三个方面的内容:
(1)登记部分,用来标识属性数据的序号,可以是简单的连续编号,也可划分不同层次进行顺序编码;
(2)分类部分,用来标识属性的地理特征,可采用多位代码反映多种特征; (3)控制部分,用来通过一定的查错算法,检查在编码、录入和传输中的错误,在属性数据量较大情况下具有重要意义。
3、编码方法 编码的一般方法是:
(1)列出全部制图对象清单。
(2)制定对象分类,分级原则和指标将制图对象进行分类、分级。 (3)拟定分类代码系统。
(4)设定代码及其格式。设定代码使用的字符和数字、码位长度、码位分配等。 (5)建立代码和编码对象的对照表.这是编码最终成果档案,是数据输人计算机进行编码的依据。
属性的科学分类体系无疑是GIS中属性编码的基础。目前,较为常用的编码方法有层次分类编码法与多源分类编码法两种基本类型。
1)层次分类编码法:
是按照分类对象的从属和层次关系为排列顺序的一种代码,它的优点是能明确表示出
84
分类对象的类别,代码结构有严格的隶属关系。图5-?以土地利用类型的编码为例,说明层次分类编码法所构成的编码体系。
土地利用类型 7耕地 71园地 72林地 73牧草地 74居民点及公矿用地 75交通用地75水域 76未利用地 77有林地 731灌木地 732疏林地 733未成林林地 734迹地 735针叶树疏林地7331阔叶树疏林地7332 图5-1 土地利用类型编码(层次分类编码法)
2)多源分类编码法
又称独立分类编码法。是指对于一个特定的分类目标,根据诸多不同的分类依据分别进行编码,各位数字代码之间并没有隶属关系。表5-1以河流为例说明了属性数据多源分类编码法的编码方法。
表5-1 河流编码的标准分类方案和数码系统表
标 志 编 号 Ⅰ 1 2 3 Ⅱ 1 2 3 Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ 平原河 过渡河 山地河 常年河 时令河 消失河 分 类 85
1 2 1 2 3 4 5 6 通航河 不通航河 树状河 平行河 筛状河 辐射河 扇形河 迷宫河 主〔要河〕流∶一级 支 流∶二级 三级 1 2 3 4 5 6 7 四级 五级 六级 七级 河长:一组—— 1公里以下 二组—— 2公里以下 1 2 3 4 5 三组—— 5公里以下 四组——10公里以下 五组——10公里以上 河宽:一组—— 5~10 米 1 2 3 4 5 6 7 8 二组—— 10~20 米 三组—— 20~30 米 四组—— 30~60 米 五组—— 60~120米 六组——120~300米 七组——300~500米 八组——500米以上 1 2 3 4 5 6 7 河流间的最短距离50米 50 ~100 米 100 ~200 米 200 ~400 米 400 ~500 米 500 ~1000米 1000~2000米 1 2 3 4 5 弯曲度:2.5公里弯曲 深度 宽度 >40 >50 >50 >40 >50 >75 >25 >50 >75 >25 >50 >100 <25 >75 >150
例如,表中111114322表示:常年河,通航,河床形状为树形,主流长7公里,宽25
86