数据库基础知识点(3)

2019-04-01 21:00

若Y不函数依赖于X,则记为X?Y(公式不对,见P105)

若X?Y,但Y不完全函数依赖于X,则称Y对X部分函数依赖。 (2)公理系统三条规则:

A1:(自反律)。若Y?X?U,则X?Y为F所逻辑蕴含

A2: (增广律)。若X?Y为F所逻辑蕴含,且Z?U,则XZ?YZ为F所逻辑蕴含

A3:(传递律)。若X?Y及Y?Z为F所逻辑蕴含,则X?Z为F所逻辑蕴含

注意:自反律所得到的函数依赖均为平凡的函数依赖 (3)合并规则:由X?Y,Y?Z,有X?YZ 伪传递规则:由X?Y,WY?Z,有XW?Z 分解规则:由X?Y及Z?Y,有X?Z

3、第一范式、第二范式、第三范式、Boyce-Codd范式

(1)关系模式需要满足一定的条件,不同程度的条件称为不同的范式。 (2)第一范式(1NF):元组的每个分量必须是不可再分的数据项

(3)第二范式(2NF):若关系模式R?1NF, 且每一个非主属性完全函数依赖于码,则R?2NF

2NF就是不允许关系模式的属性之间有这样的函数依赖X?Y,其中X是码的真子集,Y是非主属性,即不允许有非主属性对码的部分函数依赖

(4)第三范式(3NF):若关系模式R?2NF,且每一个非主属性都不传递依赖于码,则R?3NF

(5)BCNF就是3NF的进一步规范化

在函数依赖的范畴内,BCNF达到了最高的规范化程度 4、多值依赖的定义及第四范式

(1)P110-111,多值依赖的定义,性质以及第四范式 5、关系模式的分解,模式分解的等价标准 (1)等价标准:

①分解具有无损连接性

②分解保持函数依赖(P114)

6、数据库设计的过程,各设计阶段的主要任务 (1)数据库设计过程:

需求分析 概念结构设计 逻辑结构设计 物理结构设计 数据库实施

数据库运行与维护

(2)概念结构设计特点:

有丰富的语义表达能力 易于交流与理解 易于变动

易于想各种数据模型转换

(3)设计概念结构的几种主要方式:

自顶向下:首先定义全局概念结构的框架,再逐步细化 自底向上:首先定义每一局部应用的概念结构,然后按一点的规则把他们集成,从而得到全局概念结构。

由里向外:首先定义最重要的那些核心结构,再逐渐向外扩充 混合策略:把自顶向下和自底向上结合起来的方法

(4)局部的E-R图转换为全局E-R图时,可能存在的冲突:

属性冲突:包括类型、取值范围、取值单位的冲突 结构冲突:

命名冲突:包括实体类型名、联系类型名之间异名同义或同名异义等 (5)物理结构设计的内容:

存储结构的格式设计 存储方法设计

①顺序存放:平均查询次数为关系的记录个数的二分之一 ②散列存放:查询次数由散列算法决定

③聚簇存放:记录“聚簇”是指将不同类型额记录分配到相同的物理区域中去

存取方法设计

(6)规范化理论最主要的应用是在数据库逻辑设计阶段

六、数据库管理系统

1、数据库管理系统的基本功能和主要成分 (1)数据库管理系统的基本功能:

数据定义功能:数据定义语言(DDL) 数据操纵功能:数据操纵语言(DML) 数据存储和管理功能 事务管理功能 其他功能

(2)数据库管理系统的三个主要部分:

存储管理器 查询处理器 事务管理器

2、数据存储组织和基本索引结构 (1)存储介质的分层:

高速缓冲存储器:是最快最昂贵的存储介质,一般很小

主存储器:用于存放可被CPU直接处理的数据的存储介质,若发生电源故障或者系统崩溃,主存储器中的内容常会丢失

第二级存储器:速度比主存储器慢得多,常用的是磁盘存储器 第三极存储器:主要是磁带存储器

在这个层次结构中,层次越高,则成本就越高,速度就越快

最快的存储介质(高速和主存储器)称为基本存储。第二级存储器称为辅助存储器或联机存储,最底层的介质(磁带机和自动光盘机)称为第三级存储或脱机存储

高速和主存储器属于易失性存储,第二级和第三级存储器是非易失性存储器 (2)磁盘:盘面被逻辑地划分为磁道,磁道又被划分为扇区,磁盘的每个盘面都对应一个读写头

(3)磁盘控制器是计算机系统与磁盘驱动器之间的接口

(4)磁盘块是磁盘空间分配的基本单位,也是在磁盘与主存之间传输数据的逻辑元,一个磁盘块由一个或多个扇区组成。 (5)一个磁盘块包含的信息:

块中记录的数目

块中空闲空间的末尾去

一个由包含记录位置和大小的条目组成的数组

(6)如果一条记录被删除,它所占的空间被释放,且它对应的条目被置换成被删除状态。此外,块中在被删除记录之前的记录将被移动。

(7)数据库系统中提高访问效率的一个重要手段是减少磁盘和内存之间传输的块数目。

(8)在内存中分配一定的空间作为缓冲区,内存缓冲区划分为缓冲块,缓冲块的大小与磁盘块大小相同

由于数据库系统中的程序可以对缓冲区的内容进行修改,所以磁盘上的副本比在缓冲区的副本旧。

(9)一个文件上可以建立多个索引,但只能建立一个主索引。 (10)索引类型:散列索引和顺序索引(P131-134)

(11)顺序索引例如B+树能有效地支持点查询和范围查询;散列索引能有效地支持点查询,但不支持范围查询。

3、查询处理的基本步骤和查询优化的主要方法

(1)查询处理器最主要的模块是查询编译器和查询执行引擎

(2)查询处理的代价可以通过该查询对各种资源的使用情况进行度量,进一步地,可以简答地用磁盘块I/O次数来度量磁盘上存储数据的代价。 (3)查询执行的最基本的动作是关系代数运算的执行

实现选择运算的另一种方法是索引扫描。执行条件是表在选择条件的属性上建有索引。

(4)一般,索引扫描的执行代价小于全表扫描的执行代价,还可以大大减少磁盘块I/O次数。

(5)查询优化是从许多策略中找出最有效的查询执行计划的一种处理过程 (6)主要方法:( P139)

逻辑查询计划选择 物理查询计划选择

4、事务管理的基本概念,并发控制和故障恢复的主要方法 (1)事务特性:

原子性:事务的所有操作在数据库中要么全部正确反映出来,要么全部不反映出来

保证原子性是DBMS的事务管理器中故障恢复机制的责任

一致性:事务的全部执行(即没有并执行的其他事务),保持数据库的一致性

确保单个事务的一致性是对该事务进行编码的应用程序员的责任 隔离性:每个事务都感觉不到系统中有其他事务在并发执行

持久性:一个事务成功完成后,它对数据库的改变必须是永久的,即使系统可能出现故障。

确保持久性也是DBMS的事务管理器中故障恢复机制的责任 (2)系统故障类型:

①事务故障:有两种错误可能导致事务执行失败 逻辑错误:事务由于某些内部条件而无法继续正常执行,这样的内部条件如非法输入、找不到数据、溢出或超出资源限制

系统错误:系统进入一种不良状态(例如死锁),结果事务无法继续正常执行。但该事务可以在以后的某个时间重新执行

回复子系统需要强行回滚该事务,即撤销该事务对数据库已作出的所有的修改,称做事务的撤销或回滚(UNDO)。

②系统故障:硬件故障,或者数据库软件或操作系统的漏洞,导致系统停止运行,主存储器内容丢失,而外存储器仍完好无损。

恢复子系统必须重做(REDO)

③磁盘故障 :可以利用其他磁盘上的数据备份,或磁带上的备份进行恢复 (3)日志是日志记录的序列,它记录了数据库中的所有更新活动 (4)日志记录的种类:

事务开始记录日志记录 更新日志记录

事务提交日志记录 事务中止日志记录

(5)利用更新日志记录中的改前值可以进行UNDO操作,撤销已做的修改操作,将数据项恢复到修改以前的旧值

利用更新日志记录中的改后值可以进行REDO操作,重做已完成的操作,将数据项置为修改后的新值。 (6)事务故障恢复的步骤

反向扫描日志文件,查找该事务的更新操作

对该事务的每一个更新操作执行UNDO操作,即将日志记录中的改前值写入数据库

如此处理下去,直到读到该事务的开始日志,则事务故障恢复结束 (7)系统故障的恢复步骤:

正向扫描日志文件,找出在故障发生前已提交的事务,将其事务标识记入REDO队列;找出在故障发生时尚未完成的事务,将其事务标识记入UNDO队列。

对UNDO队列中的事务进行UNDO处理,即反向扫描日志文件,对每一个需要UNDO的事务的更新操作执行逆操作。

对REDO队列中的事务进行REDO处理,即正向扫描日志文件,对每一个需要REDO的事务的更新重新执行日志记录登记的操作。 (8)事务并发执行可能出现的问题

丢失更新 对未提交更新的依赖 不一致的分析

(9)可串行化:如果多个事务在某个调度下的执行结果与这些事务在某个串行调度下的执行结果相同。则称这个调度为可串行化的调度。

(10)共享锁与排他锁:共享锁于共享锁相容,而与排他锁不相容 (11)保证可串行性的一个协议是两阶段封锁协议:

增长阶段:事务可以获得锁,但不能释放锁 减缩阶段:事务可以释放锁,但不能获得锁

(12)可以通过将两阶段封锁增强为严格两阶段封锁协议来避免级联回滚 (13)死锁指的是两个或更多的事务同时处于等待状态,每个事务都在等待其他事务的释放锁使其可以继续执行。

七、数据库系统的体系结构和安全性

1、分布式数据库系统体系结构

(1)每一个分布式数据库系统包含一个节点的集合,这些节点通过某种类型的网络连接在一起。其中每一个节点是一个独立的数据库系统节点

(2)分布式系统的所有问题是内部的、实现级别的问题,而不是外部的、用户级别的

(3)分布式数据库系统的特点:

不同透明度层次的分布式数据管理 增加了可靠性和可用性 提高了性能 更容易扩充

(4)分布透明性或网络透明性:是指用户从网络的操作细节中解脱出来,分为位置透明性和命名透明性

①位置透明性:是指用于执行任务的命令对于数据的位置和发出命令的系统的位置来说是独立的

②命名透明性:意味着对象一旦被命名,就可以在没有附加说明的情况下无二义性地存取该命名对象

③复制透明性:为了获得更好的可用性、更高的性能和可靠性,数据库副本会存储在多个网络站点上。复制透明性使用户不知道有副本的存在

④分片透明性:分为水平分片和垂直分片。

(5)水平分片:按一定的条件把全局关系的所有元组划分为若干个不相交的子集,每个子集都是关系的一个片段。

垂直分片:按一定条件将一个关系以列为单位“垂直地”分割。且每个垂直分片都包含该关系的主键。

混合分片:将两种分片方式混合生成的分片方式。 (6)分片原则:

完备性原则 不相交原则 可重构原则

(7)在分布式数据库中,查询处理送比较复杂的,优化目标是:减少传输的数据量

(8)有一种比较有效的操作策略:基于一个称为半连接的操作。半连接操作是不可交换的

(9)分布式DBMS会出现的问题:

处理数据项的多个副本 分布式提交 分布式死锁 其他问题


数据库基础知识点(3).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:扭矩传感器设计说明书

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: