武大资环GIS课件
? 对象-关系数据库管理方式
? DBMS软件商在RDBMS中进行扩展,使之能直接存储和管理非结构化的空
间数据,如Informix 和Oracle等都推出了空间数据管理的专用模块,定义了操纵点、线、面、圆等空间对象的API函数。
? 主要解决空间数据的变长记录的管理,效率比二进制块的管理高得多,但仍
没有解决对象的嵌套问题,空间数据结构不能由用户定义,用户不能根据GIS要求再定义,使用上受一定限制。
? 面向对象数据库管理方式
? 为了有效地描述复杂的事物或现象,需要在更高层次上综合利用和管理多种
数据结构和数据模型,并用面向对象的方法进行统一的抽象。这就是面向对象数据模型的含义,其具体实现就是面向对象的数据结构。
? 面向对象模型最适合于空间数据的表达和管理,它不仅支持变长记录,且支
持对象的嵌套,信息的继承和聚集。
? 允许用户定义对象和对象的数据结构及它的操作。可以将空间对象根据G
IS需要,定义合适的数据结构和一组操作。这种空间数据结构可以带和不带拓扑,当带拓扑时,涉及对象的嵌套、对象的连接和对象与信息聚集。 ? 面向对象的地理数据模型的核心是对复杂对象的模拟和操纵。
第四讲 (补充) 空间索引
? 索引的概念
? 索引对大家来说并不陌生的,如日常生活遇到的词典中索引,文献中的词条
索引,等等这些生活中的索引(以及书籍目录等)中就包括了计算机索引结构的基本原理
? 索引的基本构件是索引项。一个索引项中有关键词值和指针,通过指针就可
41
武大资环GIS课件
找到含有此关键词值的记录,即一个索引项为:(关键词值,指针)。多个索引项就构成了一个索引(表) ? 索引本身也是一个文件,当索引很大时,也可将其分块,建立高一层的索引。
如此继续下去,直到最高级索引不超过一个块时为止,这样就得到了一个多级索引结构
? 索引通常置于磁盘或内存,内存中一般只存放最高级索引。一旦对一个大型
数据文件建立了索引而形成了索引文件,则不论是对随机查找,还是对顺序查找都是方便的
? 主要的索引技术
? 如何组织索引文件是索引技术中的主要问题.对名级索引可采用定长记录固
定组块的方式,并可对索引进行再索引,层层上去,直到最高级索引不超过系统规定的一个块的大小为止.这样,整个索引文件就构成了一棵以索引块和记录块为的索引树
? 树状数据结构有很多,如二叉树,多叉树等,它们都可用来构成索引文件.但是,
这些结构主要有以两方面的问题,其一是大都只适于内查找,即所要查找的资料均放在内存中;其二是易引起所谓不平衡的问题.对后者我们以二叉树为例.当二叉插入记录时,每次都从根开始比较关键词的大小,比根小的放到根的左子树中,比根大的则放到根的右子树中,在子树中重复上述过程,直至找到记录的正确位置.在这种不加控制的情况下,树中可能会出现长短不一的分枝,即有的可能很长,有的可能很短.这种人根到叶的路径不等长的现象就叫做不平衡.如果出现不平衡,则在检索时平均查找次数可能变大,使得查找效率大为降低
? 为解决平衡问题,人们相继提出了平衡的二叉树及AVL树,但这些树仍局限于
内查找.为了寻找一种适合外查找且能动态维持索引树平衡的结构,因而就应运面生了B-树和B+树
? 索引文件
? 记录本身的主文件外,还利用索引法列出一个键值K与其对应记录的磁盘地
址的索引表,即索引是由关键字和指针组成的索引项构成。
? 索引非顺序文件
? 索引表中顺序列出所有可能的键值(稠密索引),利用二分查找法查找所需
键值,得到所需记录地址。该方法存取快,且无需记录顺序排列。
建立方法:记录按输入的顺序放入数据区,同时软件在索引区建立索引表,待全部数据输完后,软件自动将索引表排序 ? 索引顺序文件
? 是一种按照逻辑键值排序的索引文件,是用嵌入索引的手段把顺序文件予以
扩充,以加速查找,记录的物理顺序与索引中键值的顺序是一致的。(采用稀疏索引)
? 建立方法:数据按顺序分块存放(块间相临),记录每块的最后记录键值及
块的首地址形成索引表。
42
武大资环GIS课件
? 空间索引
? 就是指依据空间对象的位置和形状或空间对象之间的某种空间关系按一定
的顺序排列的一种数据结构,其中包含空间对象的概要信息,如对象的标识、外接矩形及指向空间对象实体的指针。 ? 作为一种辅助性的空间数据结构,空间索引介于空间操作算法和空间对象之
间,它通过筛选作用,大量与特定空间操作无关的空间对象被排除,从而提高空间操作的速度和效率
? 构造一个高性能的空间索引系统要解决几个主要问题:1,高速查询,在大资
料量的条件下能进行实时查询;2,高度扩展性,可以无限扩展索引区域;3,地理元素变化时,能够很快更新空间索引;4,不受坐标系或投影变换的直接影响
? 空间索引的性能的优劣直接影响空间数据库和地理信息系统的整体性能,它
是空间数据库和地理信息系统的一项关键技术
? 尽管有许多特定的数据结构和算法用来完成空间索引,但基本原理相似,即采
用分割原理,把查询空间划分为若干区域(通常为矩形或多边形),这些区域或单元包含空间资料并可唯一标识。目前,有两种分割方法,一种是规则分割方法,另一种是基于对象的分割方法。规则分割方法是将地理空间按照规则或半规则方式分割,分割单元间接地与地理对象相关联,地理要素的几何部分可能被分割到几个相邻的单元中,这时地理对象的描述保持完整、而空间索引单元只存储对象的位置参考信息。在基于对象的分割方法中,索引空间的分割直接由地理对象来确定,索引单元包括地理对象的最小外接矩形
? 目前,国际上研究出许多高效的空间索引方法,常见的空间索引方法一般是自
顶向下、逐级地划分地理空间,从而形成各种树状空间索引结构。比较有代表性的规则分割方法包括规则格网索引方法(Jones,1997年)、BSP树(Fuchs,1983年) 和KDB树(Robinson,1987年)等。基于对象的分割方法包括R树(Guttman,1984年)、R+树(Sellis,1987年)和Cell树(Guttman,1991年;刘东,1996年;陈述彭, 1999年)等。
? 格网索引(Grid Index)
? 思路:
是将研究区域用横竖线条划分大小相等或不等的格网,记录每一个格网所包含的空间实体。当用户进行空间查询时,首先计算出用户查询对象所在格网,然后再在该网格中快速查询所选空间实体,这样一来就大大地加速了空间索引的查询速度。
? 步骤:
? 划分行列(M X N);
? 计算网格大小及每个格网的矩形范围;
? 开辟目标空间(记录目标穿过的网格)和格网空间(记录格网内的
目标);
? 注册点、线、面、注记等目标,并记录之;
? 查询:首先计算出用户查询对象所在的网格,然后通过该网格快速查询所选
地理对象。
43
武大资环GIS课件
第五讲 空间数据处理
1. 基本算法 2. 图形编辑 3. 属性编辑
4. 图形的裁剪与合并 5. 图幅接边 6. 坐标变换 7. 投影变换 8. 矢栅相互转换
(部分教材上有的这里略去了)
1:基本算法
点在多边形中的判断
? 点在多边形内的判别最直接的方法是铅重线法或者说平行线法或者说射线
法,即从需判别的点开始划一任一方向的直线,(该直线可以是铅直线或平行线),然后计算它所通过多边形的交点,当交点的个数是奇数时,该点在多边形内,若是偶数,表明它在多边形外
? 但是使用射线法有时候可能失效,产生判断错误。当射线通过多边形的拐点
或某一条边时,这时按统计通过多边形边界交点的奇偶数,产生错误的判断结果
线与多边形求交
? 线与多边形是否相交,需要判断每条线段与多边形的边界线段是否有交点 ? 如果没有任何交点,再判断端点是在多边形内还是多边形外,如果两端点在
多边形外,线段又与多边形不相交,则该线段相离多边形,如果两点都在多边形内,并且与多边形边界没有交点,则该线段在多边形内
? 如果有一个或多个交点,该线段与多边形相交,部分在多边形内,部分在多
边形外
? 即使两个点都在多边形内如GH或都在多边形外如IJ,它们都可能与多边形
相交
? 所以判断线与多边形是否相交,仅判别端点是不够的,必须判断线状目标的
每一段与多边形边界的每一段是否有交点
多边形与多边形相交判断
? 两个多边形是否相交需要判断两个多边形边界的所有线段相互之间是否有
交点。
? 如果没有任何交点,它们可能相分离,也可以一个多边形在另一个多边形之
内
? 两个多边形边界线段只要存在一个交点则表明两个多边形相交 ? 如果它们公共一条边界,则它们相邻
区域填充
? 种子法 ? 扫描线法
44
武大资环GIS课件
2:图形编辑
图形编辑又叫数据编辑、数字化编辑,是指对地图资料数字化后的数据进行编辑加工其主要的目的是在改正数据差错的同时,相应地改正数字化资料的图形 图形编辑是一交互处理过程, GIS具备的图形编辑功能的要求是: 1)具有友好的人机界面,即操作灵活、易于理解、响应迅速等;
2)具有对几何数据和属性编码的修改功能,如点、线、面的增加、删除、修改等; 3)具有分层显示和窗口操作功能,便于用户的使用。
点的选择 线的选择 面的选择
结点咬合-结点匹配 结点与线的咬合
在数字化过程中,经常遇到一个结点与一个线状目标的中间相交,这时由于测量误差,它也可能不完全交于线目标上,而需要进行编辑,称为结点与线的咬合
伪结点的删除 删除与增加结点 移动一个结点 删除一条弧断 数据检查与清理 Redo and Undo
3: 属性编辑
类似于关系数据库的编辑
4: 图形的裁剪
? 矩形裁剪 ? 多边形裁剪
? 逐边裁剪法
图形的合并 ? 线线合并 ? 面面合并
? ?
5:图幅接边
由于空间数据采集的误差和人工操作的误差,两个相邻图幅的地图的空间数据在结合处可能出现逻辑裂隙与几何裂隙。
逻辑裂隙指的是当一个地物在一幅图的数据文件中具有地物编码A,而在另一幅图的数据文件中却具有地物编码B,或者同一个物体在这两个数据文件中具有不同的属性信息,如公路的宽度,等高线的高程等。
几何裂隙指的是由数据文件边界分开的一个地物的两部分不能精确地衔接。
在地理信息系统和机助制图中,需要把单独数字化的相邻图幅的空间数据在逻辑上
45
? ?