库基础上,结合人工智能技术和面向对象技术提出了主动数据库。主动数据库的主要目标是提供对紧急情况及时反应的能力,同时提高数据库管理系统的模块化程度。主动数据库通常采用的方法是在传统数据库系统中嵌入!\(即事件—条件—动作)规则,在某一事件发生时引发数据库管理系统去检测数据库当前状态,看是否满足设定的条件,若条件满足,便触发规定动作的执行。
3.4 知识库
知识数据库系统的功能是如何把由大量的事实、规则、概念组成的知识存储起来,进行管理,并向用户提供方便快速的检索、查询手段。因此,知识数据库可定义为:知识、经验、规则和事实的集合。知识数据库系统应具备对知识的表示方法;对知识系统化的组织管理;知识库的操作;库的查询与检索;知识的获取与学习;知识的编辑;库的管理等功能。知识数据库是人工智能技术与数据库技术的结合。
3.5 多媒体数据库
随着多媒体技术的发展,多媒体应用逐步深入,多媒体应用涉及大量的多媒体信息,它们包括图形、文本、图像、声音、视频等信息。多媒体信息系统的建立强烈地呼唤着管理多媒体的数据库技术,在这样的背景下,产生了多媒体数据库技术。多媒体数据库应具备的功能要求为:能表示和理解多媒体数据,能刻画、管理和表现各种媒体数据的特性和相互关系;具备物理数据独立性、逻辑数据独立性和媒体数据独立性,媒体类型可扩展;提供更为灵活的模式定义和修改功能,支持模式进化与演变,具备某些长事务处理的能力;提供多媒体访问的多种手段,近似性查询,混合方式访问等。多媒体数据管理系统在多媒体应用中非常重要,它为多媒体应用提供了基本数据支撑。多媒体数据库的研究始于80年代中期,在多年的技术研究和系统开发中,获得了很大的成果。但目前还没有功能完善、技术成熟的多媒体数据库管理系统。
3.6 XML数据库
经过近几年业界同仁的共同努力,XML数据库技术取得了很大的进展,已经有若干种XML数据库产品问世并服务于社会生活的各个方面。但是,XML数据库的事业才刚刚开始,还有很多问题等待着我们去解决。 未来几年,XML数据库技术有可能在下述方面取得进展:异构数据源的集成;底层索引结构; 并发加锁协议。XML模式规范化是一个值得关注的方向。一旦取得突破,将会使我们可以像在关系库中那样方便地设计XML数据库的结构,消除数据的冗余和不一致现象。目前,这一领域已经成为学术界关注的热点。但是,完整的、为业界所公认的理论体系尚未建立。
3.7 模糊数据库
模糊数据库是在一般数据库系统中引入”模糊”概念,进而对模糊数据、数据间的模糊关系与模糊约束实施模糊数据操作和查询的数据库系统。模糊数据库系统中的研究内容涉及模糊数据库的形式定义、模糊数据库的数据模型、模物数据库语言设计、模糊数据库设计方法及模糊数据库管理系统的实现。近年来,也有许多工作是对关系之外的其它效据模型进行模糊扩展,如模糊E-R(实体—关系)、模糊多媒体数据库等。当前,科研人员在模糊数据库的研究、开发与应用系统的建立方面都做了不少工作,但是,摆在人们面前的问题是如何进一步研究与开发大型适用的模糊数据库商业性系统。
3.8 数据仓库和联机分析处理(OLAP)
为了有效地支持决策分析,近几年人们提出了数据仓库的概念。数据仓库就是从不同的源数据中抽取数据,将其整理转换成新的存储格式,为决策目的将数据聚合在一种特殊的格式中,这种支持管理决策过程的、面向主题的、集成的、稳定的、不同时的数据聚合称为数据仓库(Data Warehouse)。数据仓库中数据的组织方式有虚拟存储、
基于关系表的存储和多维数据库存储3种存储方式。整个仓库系统可分为数据源、数据存储与管理、分析处理3个功能部分。由于数据仓库是集成信息的存储中心,由数据存储管理器收集整理源信息的数据成为仓库系统使用的数据格式和数据模型,并自动监测数据源中数据的变化,反映到存储中心,对数据仓库进行更新维护。而联机分析处理(OLAP)是数据仓库上的最重要应用,是决策分析的关键。数据仓库是为了有效地支持决策分析,而从操作数据库中提取并经过加工后所得到的数据集合,是一个特殊的数据库。数据仓库也需要由一个数据库管理系统支持,它有关系型和多维型两类数据库管理系统。
3.9 数据挖掘
数据挖掘(Data Mining)又称数据开采,就是从大量的、不全的、有噪声的、模糊的、随机的数据中提取隐含在其中的人们事先不知道的、但又是潜在有用的信息和知识的过程,提取的知识表现为概念(Concepts)、规则(Rules)、规律模式约束等形式。在人工智能领域又习惯称其为数据库中知识发现(KDD,即Knowledge Discovery in Database)。其本质类似于人脑对客观世界的反映,从客观的事实中抽象成主观的知识,然后指导客观实践,数据挖掘就是从客体的数据库中概括抽象提取规律性的东西以供决策支持系统的建立和使用。
数据开采以数据库中的数据为数据源,整个过程可分为数据集成、数据选择、预处理、数据开采、结果表达和解析等过程。开采的范围可针对多媒体数据库、数据仓库、Web数据库、主动型数据库、时间型及概率型数据库等。采用的技术有人工神经网络、决策树、遗传算法、规则归纳、分类、聚类、减维、模式识别、不确定性处理等。发现的知识有广义型知识、特征型知识、差异型知识、关联型知识、预测型知识、偏离型知识。目前数据采掘的研究和应用所面临的主要挑战是:对大型数据库的数据采掘方法;对非结构和无结构数据库中的数据采掘操作;用户参与的交互采掘;对采掘得到的知识的证实技
术;知识的解释和表达机制;由于数据库的更新,原有知识的修正;采掘所得知识库的建立、使用和维护。
3.10 面向对象数据库及数据可视化技术
面向对象数据库系统将数据作为能自动重新得到和共享的对象存储,包含在对象中的是完成每一项数据库事务处理指令,这些对象可能包含不同类型的数据,包括传统的数据和处理过程,也包括声音、图形和视频信号,对象可以共享和重用。面向对象的数据库系统的这些特性通过重用和建立新的多媒体应用能力使软件开发变得容易,这些应用可以将不同类型的数据结合起来。面向对象数据库系统的好处是他支持WWW应用能力。然而,面向对象的数据库是一项相对较新的技术,尚缺乏理论支持,他可能在处理大量包含很多事务的数据方面比关系数据库系统慢得多,但人们已经开发了混合关系对象数据库,这种数据库将关系数据库管理系统处理事务的能力与面向对象数据库系统处理复杂关系与新型数据的能力结合起来。
数据可视化是指在计算机屏幕上以图形或图像方式,形象地向用户显示各种数据,使用户快速地理解和吸收数据所表示的信息,以提高人的大脑二次处理信息的速度和能力。可见,数据可视化是提高人类吸收和处理信息的速度和能力的重要途径。数据可视化是一个刚刚开始的新的研究领域,还有许多问题有待探索。目前已经被提出的数据可视化技术有:几何可视化技术、基于图标的可视化技术、基于象素的可视化技术、分析可视化技术等。
4.数据库技术的未来发展
数据、计算机硬件和数据库应用,这三者推动着数据库技术与系统的发展。数据库要管理的数据的复杂度和数据量都在迅速增长;计算机硬件平台的发展仍然实践着摩尔定律;数据库应用迅速向深度、
广度扩展。尤其是互联网的出现,极大地改变了数据库的应用环境,向数据库领域提出了前所未有的技术挑战。这些因素的变化推动着数据库技术的进步,出现了一批新的数据库技术,如Web数据库技术、并行数据库技术、数据仓库与联机分析技术、数据挖掘与商务智能技术、内容管理技术、海量数据管理技术等。限于篇幅,本文不可能逐一去展开来阐述这些方面的变化,只是从这些变化中归纳出数据库技术发展呈现出的突出特点。
“四高”即DBMS具有高可靠性、高性能、高可伸缩性和高安全性。数据库是企业信息系统的核心和基础,其可靠性和性能是企业领导人非常关心的问题。因为,一旦宕机会给企业造成巨大的经济损失,甚至会引起法律的纠纷。最典型的例子就是证券交易系统,如果在一个行情来临的时候,由于交易量的猛增,造成数据库系统的处理能力不足,导致数据库系统崩溃,将会给证券公司和股民造成巨大的损失。在我国计算机应用的早期,由于计算机系统还不是企业运营必要的成分,人们对数据库的重要性认识不足,而且为了经费上的节约常常采用一些低层次的数据管理软件,如dBASE等,或者盗版的软件。但是,随着信息化进程的深化,计算机系统越来越成为企业运营的不可缺少的部分,这时,数据库系统的稳定和高效是必要的条件。在互联网环境下还要考虑支持几千或上万个用户同时存取和7x24小时不间断运行的要求,提供联机数据备份、容错、容灾以及信息安全措施等。
事实上,数据库系统的稳定和高效也是技术上长久不衰的追求。此外,从企业信息系统发展的角度上看,一个系统的可扩展能力也是非常重要的。由于业务的扩大,原来的系统规模和能力已经不再适应新的要求的时候,不是重新更换更高档次的机器,而是在原有的基础上增加新的设备,如处理器、存储器等,从而达到分散负载的目的。数据的安全性是另一个重要的课题,普通的基于授权的机制已经不能满足许多应用的要求,新的基于角色的授权机制以及一些安全功能要素,如存储隐通道分析、标记、加密、推理控制等,在一些应用中成为切切实实的需要。