地理数据库
第一章 地理数据库基本概念
第一节 GIS数据库概述
地理信息系统:地理信息系统是依托于计算机技术,能够对空间数据进行采集,处理,存储,并能够自动或半自动地对空间数据进行分析,从而为各种决策提供依据的计算机系统。
通常所指的地理信息系统就是一个地理信息软件系统。 组成
由计算机硬件、软件、数据和用户四大要素组成 计算机硬件包括各类计算机处理及终端设备; 软件是支持数据信息的采集、存贮加工、再现和回答用户问题的计算机程序系统;
数据则是系统分析与处理的对象,构成系统的应用基础;
用户是信息系统所服务的对象 GIS 硬件 软件 人员 数据 数据采集 数据存储 数据处理 应用软件 开发人员 应用人员 开发软件 操作系统 地理数据库地位和作用 在数据获取过程中,GIS数据库用于存贮和管理空间信息 。
在数据处理系统中,它既是数据提供者,也是处理结果的归宿处 。
在检索和输出过程中,它是各类地理数据的数据源 。 是地理信息系统的重要组成部分。 定义
以特定的数据模型和信息结构来表达、存储和管理某类地理空间信息,以满足不同用户对空间信息需求的数据库。
地理空间(Geographic Space )
地理空间是地球上大气圈、水圈、生物圈、岩石圈和土壤圈交互作用的区域。
地理信息系统中的空间概念常用“地理空间”(Geospatial)来表述。
空间信息
指在信息世界中的地理空间信息。这是对现实世界的抽象,即从现实世界到信息世界。
数据模型和信息结构
在计算机世界中,通过抽象、建模形成不同种类数据的表达形式。通过GIS数据库的数据模型对空间数据进行表达、存储和管理。是对现实世界的抽象,从现实世界到信息世界
1、 空间特征 描述了空间物体的位臵,形态,以及空
间拓扑关系。
2、抽象特征 抽象真实世界的综合特征。
3、空间关系特征 空间拓扑特征。
4、多尺度与多态性 不同比例尺和精度下,表现为不同形态。
5、 非结构化特征 空间对象的数据是变长的。 6、 分类编码特征 空间对象按照某种标准进行分类编
码。
7、 海量特征 数据量比一般数据库大得多,具有数据
海量的特点 传统数据库管理空间数据的不足
1 、空间数据是连续的,并且有很强的空间相关性。 2、 空间数据实体类型繁多,实体间存在复杂的空间关系 。
3、 空间数据的目标坐标长度不定,具有变长记录,数据项目可能很多、很复杂 。
4 、空间数据库需要大量的空间数据操作和查询。 本节问题
1、地理数据库在GIS系统中的地位和作用? 2、地理数据库的特征?
3、什么是GIS数据库?阐述其中几个关键概念的含义。第二节 数据库基础理论 数据库系统的几个概念 1、数据
1) 描述现实世界各种信息的符号记录
2) 可以有多种不同的表现形式:数字、文字、图形、图像、声音等
3) 是信息的载体、信息的具体表现形式 2、信息
1) 概念
(1) 构成客观世界的三大要素(信息、能源和材料)之一
(2) 信息是从数据中提取出的有用的东西 2) 特性
(1) 信息传递需要物质载体,信息的获取和传递要消耗能量
(2) 信息是可以感知的
(3) 信息可以加工:存储、压缩、传递、共享、再生、增值
3、数据与信息的关系
1) 数据是具体的,信息是抽象的
2) 数据不一定有用,但信息是有用的数据
3) 信息是各种数据所包括的意义,数据是载荷信息的物理符号
4) 可用不同的数据形式来表现同一数据,信息不随数据的表现形式而改变 5) 通常可混用
(1) 信息资源=数据资源 (2) 信息采集=数据采集? (3) 信息处理=数据处理
4、数据处理(信息处理)
1) 利用计算机对各种形式的数据进行处理
2) 从大量的原始数据中抽取有价值的信息,作为行为和决策的依据
3) 包括以下的数据操作 (1) 采集(2) 整理、编码(3) 输入(4) 存储(5) 加工/计算、分类、检索(6) 传输、输出 5、数据库 1) database (DB)
2) 长期储存在计算机中的、有组织的、可共享的数据的集合
3) 特点——(1) 按照一定的数据模型组织(2) 独立性、易扩展性(3) 较小的冗余度(4) 可共享 6、数据库管理系统
1) Database Management System (DBMS) 2) 管理数据库的软件(数据管理软件) 3) 用于建立、运用和维护数据库 4) 位于用户和操作系统之间 7、数据库系统
1) database system (DBS)
2) 一般由数据库、数据库管理系统、应用系统、数据库管理员构成
3) =计算机系统+数据库
4) 三要素——(1) DB(2) DBMS(3) Users 8、用户
1) 终端用户(最终用户、End User)——(1) 非计算机专业人员(2) 交互式操作
2) 应用程序员(Application Programmer)——(1) 负责设计和编制应用程序(2) 通过应用程序存取和维护数据库(3) 为终端用户准备应用程序(4) 是数据库管理员(DBA)手下的工作人员
3) 数据库管理员(Database Administrator, DBA)——(1) 全面负责数据库系统的管理、维护、正常使用(2) 主要职责——1. 参与数据库设计的全过程2. 决定数据库的存储与读取策略3. 定义数据的安全性和完整性4. 监督控制数据库的使用和运行,及时处理运行程序中出现的问题5. 改进和重新构造数据库系统
数据库系统层次结构
数据库用户
应用系统 应用开发工具软件 数据库管理系统 操作系统 硬件/数据库 数据库系统的构成
DB 完成某一功能的应用程序1 DBMS DBAP 1 相互有关联关系 应用程序2 管理数据库的DBAP 2 的数据的集合 应用程序n DBAP n Computer System
数据管理技术的发展(三个阶段)
1、人工管理阶段
(计算机产生-20世纪50年代)主要用于科学计算。 特点:(1)数据不保存;(2)没有对数据进行管理的软件系统;(3)数据不同享;(4)一组数据对应于一个程序,数据是面向应用的。 2、文件系统阶段
( 20世纪50年代后期-60年代中期)不仅用于科学计算,还大量用于管理数据。
特点:(1)数据需要长期保存在外存上供反复使用;(2)程序之间有了一定的独立性;(3)文件的形式已经多样化;(4)数据的存取基本上以记录为单位。 3、数据库系统阶段 ( 20世纪60年代后期)
特点:(1)采用复杂的结构化的数据模型(2)较高的数据独立性(物理,逻辑)(3)最低的冗余度(4)数
据控制功能 比较 人工管理 文件系统 数据库系统 应用范围 科学计算 科学计算、管理 数据处理 硬件 无直接存取存储设备 磁盘、磁鼓 大容量磁盘 软件 没有操作系有文件系有数据库管理系统 统 统 联机实时联机实时处理, 处理方式 批处理 处理 批处分布处理批处理 理 数据的管理者 人 文件系统 数据库管理系统 数据面向某一应用程某一应用的对象 序 程序 整个应用系统 数据的共无共享,冗余共享性差,共享性高,冗余度享程度 度极大 冗余度大 小 数据的独不独立,完全高度的物理独立立性 依赖于程序 独立性差 性和逻辑独立性 记录内有数据的结整体结构化,用数构化 无结构 结构, 整体无结据模型描述 构 由数据库管理系数据控制应用程序自应用程序统提供数据安全能力 己控制 自己控制 完整性、并发控制和恢复能力 数据模型 数据模型的基本概念 1、 什么是数据模型
计算机无法直接处理现实事物。在现实世界中事物之间是存在联系的。例如,学校教学系统中的教师、学生、课程、成绩等都是相互关联的。需要将现实事物转化为计算机可以理解的数据,这需要一个工具。在数据库中用“数据模型”这个工具来抽象、表示和处理现实世界中的数据和信息。通俗地讲数据模型就是现实世界的模拟。
通常把表示客观事物及其联系的数据及结构称为数据模型
2、对数据模型的要求(1)比较真实地模拟现实世界(2)容易被人类理解。(人的角度)(3)便于在计算机上实现。(计算机的角度)
数据模型是数据库系统的核心和基础。一种数据模型
很难全面满足这三方面要求,在实际系统中针对不同的使用对象和目的,可采用不同的数据模型 3、数据模型的三要素
1)数据结构——(1) 描述系统的静态特性(2) 所研究的对象类型的集合(3) 不同的数据结构决定不同的数据模型—有层次结构、网状结构、关系结构;数据结构是刻画一个数据模型性质最重要的方面;与数据结构类型相对应的数据模型有层次模型、网状模型、关系模型。 2)数据操作——(1) 描述系统的动态特性(2) 对数据库中的各种对象的实例允许执行的操作和操作规则的集合(3) 操作分类—1. 检索2. 插入3. 修改4. 删除
3)数据完整性和约束条件——为了保证数据的正确、有效和相容。例如:某大学数据库规定6门课以上不及格不能授予学士学位;男职工退休年龄60周岁,女职工退休年龄55周岁等。 概念模型和逻辑模型
1、第一级抽象——概念模型 1)在将现实世界中的具体事物抽象、组织为某一DBMS支持的模型,人们常首先将现实世界抽象为信息世界,然后将信息世界转换成机器世界。
2)即得到信息世界内的一种信息结构,这种不信赖于具体的计算机系统,是一种概念级的模型。 3)是信息世界的建模,是第一层抽象。
4)是用户与数据库设计人员之间进行交流的语言。因此具有较强的语义表达能力,且应简单、清晰、易于被理解。 数据抽象
现实世界 用户 概念化
信息世界 形式化
计算机 计算机世
1)信息世界中的基本概念
(1)实体(Entity)——客观存在并相互区别的事物
举例:1. 具体:人、事、物2. 抽象概念:一个学生、一门课、选课3. 联系:师生关系 (2)实体集(Entity Set)——同一类型实体的集合。 举例:1. 全体学生2. 所有演出
(3)属性(Attribute)——实体所具有的某一特性。用若干属性来描述实体。
举例:1. 学生的学号、姓名、性别、系别等特征。2. (200800765,张三,男,计算机系)
(4) 联系(Relationship)——实体内部的联系(组成实体的各属性之间的联系);实体之间的联系。(不同实体之间的联系);联系可以归纳为:一对一(1:1)的联系、一对多(1:n)的联系和多对多(m:n)的联系三类。
举例:1. 一对一:一个班有一个班长,一个班长只在一个班任职。2. 一对多:一个班由多个学生,每个学生只在这个班学习。3. 多对多:一个课程可以多个学生选修,一个学生可以选修多门课程。
2)概念模型的表示方法——实体关系模型
(1)E-R图 (Entity-Relationship Model) 1976年,由P.P.S.Chen提出E-R模型
E-R图为实体-联系图,提供了表示实体型、属性和联系的方法,用来描述现实世界的概念模型。构成E-R图的基本要素是实体型、属性和联系 。
(2)E-R图表示方法——实体型:矩形+实体名 属性:椭圆形,无向边与实体连接
联系:菱形+联系名,无向边与实体连接,边上标注联系类型
姓名 学号 系别 课程名 课程号 主讲教师 学生 m n 选修 课程 用椭圆表示 实体的属性 将参与联系的实 用菱形表示 体用线段连接 用矩形表示 实体间的联并标上联系类型 实体集,在框 内写上实体名 2、第二级抽象——逻辑模型(数据模型)
逻辑模型分类
1、层次模型
层次模型的结构是树形结构。树的节(结)点是实体,树的枝是联系,从上到下为一对多的联系。每个实体由“根”开始,沿着不同的分支放在不同的层次上。如果不再向下分支,则此分支中最后的节点称为“叶”。
支持层次模型的数据库管理系统称为层次数据库管理系统,其中的数据库称为层次数据库。 》》》图为某学院的机构设臵,“根”节点是学院,“叶”节点是各教研室
学 院 计算机系 自控系 数学系 外语系 软件教研硬件教研室 共外教研专业教研室 室 室
优点:(1)数据模型简单(2)若实体间的关系固定,性能很优越
缺点:(1)描述现实世界的非层次性很笨拙(2)插入和删除操作限制较多 2、网状模型
用网状结构表示实体及其之间的联系的模型。在网状模型中,每一个节点代表一个实体,并且允许节点有多于一个“父”节点。网状模型代表了多对多的联系类型。
专业系 教研室 课程 学生 教员 任课 选课 优点:(1)能够直接描述现实世(2)存取效率较高 缺点:(1)数据描述语言极其复杂(2)数据独立性差 3、关系模型
关系模型是以数学理论为基础构造的数据模型。它用二维表格来表示实体集中实体之间的联系。关系模型有很强的数据表达能力,结构单一,数据操作方便,最易被用户接受。以关系模型建立的关系数据库是目前应用最广泛的数据库。如Oracle、Sybase、SQL Server、Access、VFP等。
学生登记表 学 号 姓 名 年 龄 性 别 系 名 年 级 95004 王小明 19 女 社会学 95 95006 黄大鹏 20 男 商品学 95 95008 张文斌 18 女 法律学 95 … … … … … … 3、关系模型
关系模型的一些术语
(1)关系(Relation):一个关系通常指一张表。 (2)元组(Tuple):表中的一个行。 (3)属性(Attribute):表中的一列。
(4)码(Key):可以唯一确定一个元组的属性组。 (5)域(Domain):属性的取值范围。
(6)关系模式:对关系的描述,一般表述为: 关系名(属性1,属性2,…属性n)
例如:学生(学号,姓名,性别,年龄,专业) 课程(课程号,课程名称,学分) 1)关系与表:关系的逻辑结构就是一张二维表,例如,学籍表、课程表等。例如,在Visual FoxPro中,一个关系就是一个?表?,每个表对应一个磁盘文件,表文件的扩展名为.DBF。表文件名即表的名称,也就是关系的名称。
2)属性与字段: 一个关系有很多属性(即实体的属性),对应二维表中的列(垂直方向)。每一个属性有一个名字,称为属性名。对于一张二维表格来说,属性就是表格中的栏(列),同栏的数据应具有相同的性质,例如,?姓名?这一栏就只能填入姓名数据,而不能是其他数据。在数据库中,属性表示为表中的?字段?,属性名即为字段名。 3) 关系模型与表结构 :一个关系模型对应一个关的
结构。其格式为:关系名(属性名1,属性名2,...,
属性名n)在数据库中对应的表结构为:表名(字段名1,字段名2,...,字段名n) 4)元组与记录
在一个表格(一个关系)中,行(水平方向)称为?元组?。在数据库中,元组表示为表中的?记录?。一个表中可以有多条记录,也可以没有记录,没有记录的表称为?空表?。 5)码与关键字
用来区分不同元组(实体)的属性或属性组合,称为码。在数据库中对应的概念是关键字,关键字是字段或字段的组合,用于在表中唯一标识记录。 6)关系模型与数据库
从集合论的观点来看——一个关系模型就是若干个有联系的关系模型的集合;关系是元组的集合;元组是属性值的集合 优点:(1)有严格的数学概念作基础(2)关系模型的概念单一(3)存取路径对用户透明 缺点:(1)查询效率不高 关系数据模型
关系模式:学生(学号、姓名、性别、年龄、籍贯) 三个世界中术语的对应关系
本节问题
1、阐述数据库系统的构成。
2、三种主要的数据模型(层次模型、网状模型、关系模型)的特点和优缺点。 3、手工绘制E-R图。
练习
旅游查询系统
酒店位于某道路。请用E-R图画出酒店和道路的概念模型。 公交管理系统
某公交公司管理若干公交线路,每条公交线路由若干个公交站点构成,每条公交线路由多台公交车运行。请用E-R图画出公交公司、公交线路、公交站点、公交车的概念模型。
第三节 GIS数据库的形成和发展 GIS数据库计算平台的发展
空间数据模型 栅格模型