第一章1.1
1、数据(Data)是数据库中存储的基本对象。 2、数据的定义:描述事物的符号记录。 3、数据的种类:文字、图形、图象、声音。 4、数据的特点:数据与其语义是不可分的。
5、数据库的定义:数据库(Database,简称DB)是长期储存在计算机内、有组织的、可共享的大量数据集合。 6、数据库的特征:
1)数据按一定的数据模型组织、描述和储存; 2)可为各种用户共享 3)冗余度较小 4)数据独立性较高 5)易扩展
7、数据库管理系统(Database Management System,简称DBMS)是位于用户与操作系统之间的一层数据管理软件。
8、数据库管理系统的主要功能: 1)数据定义功能
2)数据组织、存储和管理 3)数据操纵功能 4)数据库的运行管理
5)数据库的建立和维护功能 6)其他功能
9、数据库系统(Database System,简称DBS)是指在计算机系统中引入数据库后的系统构成。 10、数据库系统(DBS)的构成由数据库(DB)、数据库管理系统(DBMS)(及其开发工具)、应用系统、数据库管理员(DBA)(和用户)构成。
11、数据管理是指对数据进行分类、组织、编码、存储、检索和维护,是数据处理的中心问题。 12、数据管理技术经历了人工管理阶段、文件系统阶段、数据库系统阶段三个阶段。 13、人工管理阶段数据具有的特点: 数据的管理者:应用程序,数据不保存。 数据面向的对象:某一应用程序 数据的共享程度:无共享、冗余度极大 数据的独立性:不独立,完全依赖于程序 数据的结构化:无结构
数据控制能力:应用程序自己控制 14、文件系统阶段数据具有的特点:
数据的管理者:文件系统,数据可长期保存 数据面向的对象:某一应用程序 数据的共享程度:共享性差、冗余度大 数据的结构化:记录内有结构,整体无结构
数据的独立性:独立性差,数据的逻辑结构改变必须 修改应用程序
数据控制能力:应用程序自己控制 缺点:
数据共享性差 数据独立性差
15、数据库系统的特点:
1)数据的结构化:整体数据的结构化是数据库的主要特征之一。数据库中实现的是数据的真正结构化
1
2)数据的共享性高,冗余度低,易扩充。
3)数据的独立性高:高度的物理独立性和一定的逻辑独立性。数据独立性是由DBMS的二级映像功能来保证的。
4)数据由DBMS统一管理和控制:数据库的共享是并发的共享。具有最小冗余度和较高的数据独立性。 16、物理独立性:指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。当数据的物理存储改变了,应用程序不用改变。
逻辑独立性:指用户的应用程序与数据库的逻辑结构是相互独立的。数据的逻辑结构改变了,用户程序也可以不变。
17、DBMS的控制功能:
1)数据的安全性(Security)保护 2)数据的完整性(Integrity)检查 3)并发(Concurrency)控制 4)数据库恢复(Recovery) 第一章1.2
18、数据模型(Data Model)是对现实世界数据特征的抽象,用来描述数据、组织数据和对数据进行操作。 19、数据模型应满足三方面要求:1)能比较真实地模拟现实世界2)容易为人所理解3)便于在计算机上实现
20、现有的数据库系统均是基于某种数据模型的;数据模型是数据库系统的核心和基础。 21、数据模型分成两个不同的层次:1)概念模型 2)逻辑模型和物理模型 22、概念模型是按用户的观点来对数据和信息建模,主要用于数据库设计。
23、逻辑模型主要包括网状模型、层次模型、关系模型等,它是按计算机系统的观点对数据建模。 24、现实世界—概念模型:由数据库设计人员完成
概念模型—逻辑模型:由数据库设计人员完成/数据库设计工具协助设计人员完成 逻辑模型—物理模型:由数DBMS完成
25、数据模型的组成要素:数据结构、数据操作和数据的完整性约束条件。
26、数据结构是所描述的对象类型的集合,描述数据库的组成对象以及对象之间的联系。 27、数据操作是对系统动态特性的描述。
28、数据的约束条件是一组完整性规则的集合。 29、信息世界中的基本概念:(7个) 实体(Entity):客观存在并可相互区别的事物称为实体。 属性(Attribute):实体所具有的某一特性称为属性。 码(Key):唯一标识实体的属性集称为码。 域(Domain):属性的取值范围称为该属性的域 实体型(Entity Type):用实体名及其属性名集合来抽象和刻画同类实体 实体集(Entity Set):同型实体的集合称为实体集 联系(Relationship):反映为实体内部的联系和实体之间的联系。 30、实体型间联系:一对一联系(1:1)、一对多联系(1:n)和多对多联系(m:n) 31、层次模型和网状模型统称为格式化模型。
32、格式化模型中数据结构的单位是基本层次联系。基本层次联系是指两个记录以及它们之间的一对多(包括一对一)的联系。 33、关系模型的数据结构:表
面向对象模型的数据结构:对象
34、满足下面两个条件的基本层次联系的集合为层次模型。 1)有且只有一个结点没有双亲结点,这个结点称为根结点; 2)根以外的其它结点有且只有一个双亲结点。 35、层次模型的特点:
2
1)结点的双亲是唯一的
2)只能直接处理一对多的实体联系
3)没有一个子女记录值能够脱离双亲记录值而独立存在 36、多对多联系在层次模型中的表示 分解方法(P23):冗余结点法和虚拟结点法
37、冗余结点法的优点是结构清晰,结点改变存储位置,缺点是需要额外占用存储空间,有潜在的不一致性。虚拟结点法的优点是减少对存储空间的浪费,避免产生潜在的不一致性,缺点是结点改变存储位置可能引起虚拟结点中指针的修改。
38、层次模型的数据操纵:查询 ;插入; 删除; 更新
39、层次模型的完整性约束:没有相应的双亲结点值就不能插入子女结点值;如果删除双亲结点值,则相应的子女结点值也被同时删除。
40、层次数据库中不仅要存储数据本身,还要存储数据之间的层次联系。
41、层次模型常用的实现方法:邻接法(前序遍历)和链接法(子女-兄弟链接法和层次序列链接法 )P24
42、层次模型的优点:
1)层次模型的数据结构比较简单清晰。 2)层次数据库的查询效率高。
3)层次数据模型提供了良好的完整性支持 层次模型的缺点:
1)现实世界中很多联系是非层次性的 2)一个结点具有多个双亲
3)查询子女结点必须通过双亲结点 4)由于结构严密,层次命令趋于程序化
43、满足下面两个条件的基本层次联系的集合为网状模型: 1)允许一个以上的结点无双亲; 2)一个结点可以有多于一个的双亲。 44、网状模型的完整性约束: 1)支持记录码的概念;
2)保证一个联系中双亲结点与子女结点之间是一对多联系; 3)支持双亲记录和子女记录之间某些约束条件;
45、网状模型常用方法——链接法:单向链接、双向链接、环状链接、向首链接 46、网状模型的优点:
1)能够更为直接地描述现实世界 2)具有良好的性能,存取效率较高 缺点:
1)结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握 2)DDL、DML语言复杂,用户不容易使用
47、关系模型是最重要的一种数据模型。关系模型中数据的逻辑结构是一张二维表。 48、关系(Relation):一个关系对应通常说的一张表。 元组(Tuple):表中的一行即为一个元组。 属性(Attribute):表中的一列即为一个属性。 主码(Key):表中的某个属性组,它可以唯一确定一个元组。 域(Domain):属性的取值范围。 分量:元组中的一个属性值。
关系模式:对关系的描述
49、关系模型模型要求必须是规范化,即要求关系必须满足一定的规范条件,这些规范条件中最基本的一条就是,关系的每一个分量必须是一个不可分的数据项。
3
50、关系数据模型的操作主要包括查询、插入、删除、更新。
51、关系的完整性约束条件包括三大类:实体完整性、参照完整性和用户定义的完整性。 52、关系数据模型的优点:
1)关系模型与格式化不同,它是建立在严格的数学概念的上的。 2)关系模型的概念单一。
3)模型的存取路径对用户透明,从而具有更高的数据独立性、更好的安全保密性,也简化了程序员的工作和数据库开发建立的工作。
关系数据模型的最主要的缺点是,由于存取路径对用户透明,查询效率往往不如格式化数据模型。 第一章 1.3
53、从数据库管理系统角度看,数据库系统通常采用三级模式结构;这是数据库管理系统内部的系统结构。 54、从数据库最终用户角度看,数据库系统的结构分为单用户结构、主从式结构、分布式结构、客户/服务器、浏览器/应用服务器/数据库服务器多层结构等。这是数据库系统外部的体系结构。 55、型(Type):对某一类数据的结构和属性的说明 值(Value):是型的一个具体赋值
56、模式是相对稳定的,而实例是相对变动的。模式反映的是数据的结构及其联系,而实例反映的是数据库某一时刻的状态。
57、数据库系统的三级模式结构是指数据库系统是由外模式、模式和内模式三级构成。
58、模式(也称逻辑模式)数据库中全体数据的逻辑结构和特征的描述,所有用户的公共数据视图。一个数据库只有一个模式
59、外模式(也称子模式或用户模式)是数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述,数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。外模式通常是模式的子集,一个数据库可以有多个外模式。同一外模式也可以为某一用户的多个应用系统所使用,但一个应用程序只能使用一个外模式。
60、内模式(也称存储模式)是一个数据库只有一个内模式。是数据物理结构和存储方式的描述,是数据在数据库内部的表示。
61、两层映像保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。 62、外模式/模式映像定义外模式与模式之间的对应关系
63、当模式改变时,数据库管理员修改有关的外模式/模式映象,使外模式保持不变。应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。 64、数据库中模式/内模式映象是唯一的。定义了数据全局逻辑结构与存储结构之间的对应关系。 65、当数据库的存储结构改变了(例如选用了另一种存储结构),由数据库管理员修改模式/内模式映象,使模式保持不变。从而应用程序不必改变。保证了数据与程序的物理独立性,简称数据的物理独立性。 第二章
66、关系数据库应用数学方法来处理数据库中的数据
67、80年代后,关系数据库系统成为最重要、最流行的数据库系统 68、关系数据库系统是支持关系模型的数据库系统
69、关系模型由关系数据结构、关系操作集合和关系完整性约束组成 70、单一的数据结构----关系
71、从用户角度,关系模型中数据的逻辑结构是一张二维表。 72、关系模型建立在集合代数的基础上
73、域是一组具有相同数据类型的值的集合。 74、笛卡尔积是域上面的一种集合运算。
75、笛卡尔积可表示为一个二维表。表中的每行对应一个元组,表中的每列对应一个域。 76、关系是笛卡尔积的有限子集。无限关系在数据库系统中是无意义的。 77、关系也是一个二维表,表的每行对应一个元 78、组,表的每列对应一个域。
4
79、若关系中的某一属性组的值能唯一地标识一个元组,则称该属性组为候选码。若一个关系有多个候选码,则选定其中一个为主码(Primary key)。
80、关系的三种类型:基本关系(基本表或基表)、查询表和视图表。 81、基本关系是实际存在的表,是实际存储数据的逻辑表示 82、查询表是查询结果对应的表
83、视图表是由基本表或其他视图表导出的表,是虚表,不对应实际存储的数据
84、基本关系的性质:① 列是同质的;② 不同的列可出自同一个域;③ 列的顺序无所谓 ④ 任意两个元组不能完全相同;⑤ 行的顺序无所谓;⑥ 分量必须取原子值 85、关系模式(Relation Schema)是型;关系是值;关系模式是对关系的描述
86、关系是关系模式在某一时刻的状态或内容。关系模式是静态的、稳定的,而关系是动态的、随时间不断变化的,因为关系操作在不断地更新着数据库中的数据。 87、在关系模型中,实体以及实体间的联系都是用关系来表示的
88、在一个给定的应用领域中,所有实体及实体之间联系的关系的集合构成一个关系数据库。 89、关系模型中三类完整性约束:实体完整性、参照完整性和用户定义的完整性组成。 90、常用的关系操作包括查询操作和插入、删除、修改操作两大部分。
91、查询操作分为选择、投影、连接、除、并、交、差、笛卡尔积等;选择、投影、并、差、笛卡尔积是5种基本操作。查询的表达能力很强,是关系操作中最主要的部分
92、关系操作的特点是集合操作方式,即操作的对象和结果都是集合。非关系数据模型的数据操作方式则为一次一次记录方式。
92、关系数据语言可以分为三类:
93、关系模型中三类完整性约束:实体完整性、参照完整性和用户定义的完整性。
94、关系模型的完整性规则是对关系的某种约束条件。实体完整性和参照完整性是关系模型必须满足的完整性约束条件,被称作是关系的两个不变性,应该由关系系统自动支持。 95、实体完整性规则:基本关系的所有主属性都不能取空值 96、关系模型必须遵守实体完整性规则的原因
(1) 实体完整性规则是针对基本关系而言的。一个基本表通常对应现实世界的一个实体集或多对多联系。 (2) 现实世界中的实体和实体间的联系都是可区分的,即它们具有某种唯一性标识。 (3) 相应地,关系模型中以主码作为唯一性标识。 (4) 主码中的属性即主属性不能取空值。
97、Ks是基本关系S的主码。如果F与Ks相对应,则称F是R的外码。R为参照关系,S为被参照关系。
外码并不一定要与相应的主码同名。当外码与相应的主码属于不同关系时,往往给它们取相同的名字。 98、参照完整性规则:若属性F是基本关系R的外码,它与基本关系S的主码Ks相对应,则对于R中每个元组在F上的值必须为1)或者了空值(F的每个属性均为空值)2);或者等于S中某个元组的主码值。 99、任何关系数据库都应该支持实体完整性和参照完整性。
5