库技术无法实现这种复合任务,事务处理和分析处理具有极不相同的性质,直接用事务处理环境来支持决策是根本行不通的。数据仓库技术的出现解决了传统关系数据库在分析型处理、提供决策支持分析方面的不足。数据仓库的数据来自于操作型数据库,经过一系列的抽取、转换、加载的处理,变成对终端用户有用的信息,形成一个新的集成系统。与传统数据库相比数据仓库的特点是数据的继承与分析能力,数据仓库的出现并不是要取代传统操作性数据库,而是以传统的操作性数据库为基础,建立一个用于支持管理层决策分的的综合信息分析应用系统。表2.2是数据仓库和传统操作型数据库的比较。
表2.2传统数据库与数据仓库的区别
比较项目
总体特征
面向用户
功能目标
存储内容
基础结构
关系结构
使用频率
访问特征
数据规模
传统数据库 围绕高效的即时的事务处理展开 业务人员 面向业务操作 以当前业务数据为主 关系型 3NF三级范式 很高 读取写入并重 较小 数据仓库 以提供决策支持为目标 管理决策人员 面向数据分析 主要是以发生的历史数据 多维型 星型或雪花型结构 较低 读取为主 较大
2.2数据仓库的相关概念
1.数据仓库
1993年数据仓库之父W.H.Inmon出版了“Building the Data WareHouse”,定义了数据仓库的概念“数据仓库是面向主题的、集成的、不可更新的且随时间变化的数据集合,用于支持管理层的决策过程。”[4]
面向主题的
数据仓库中是分不同的主题来体现,基于在比较高的层次上,对数据进行归类,不同的主题分别对应不同的宏观的分析领域。因为不面对日常操作和实际事