中国电信EDA
总体规范2.0
2 引言
ITSP大背景,企业环境的大背景,集约化要求等等引出全网数据共享服务中心的概念.
2.1 全网数据共享服务中心
全网数据共享服务中心的概念、架构及在itsp3.0中的定位 全网数据共享服务中心核心构成是两级EDA及全网数据交换枢纽,由此引出规范EDA建设的重要性.
版权声明,保密
第2页 共123页
中国电信EDA
总体规范2.0
2.2 本规范制定的目的和意义
围绕本规范作为总部和省EDA建设的指导规范这样一个定位,说明本规范的设计目的、功能定位、构成要素等。
3 EDA概述
3.1 现状分析
大数据时代,EDA存储不够,扩容难,非结构化数据处理能力不足,数据实时性处理能力不足 数据应用能力不足 数据基础能力不足 数据运营能力不足
3.2 技术目标
优化架构体系,支撑大数据处理(包括实时处理)与存储能力
建设数据运营管理平台,提升数据运营管理能力 ,提升数据汇聚、交互、共享与服务能力
版权声明,保密
第3页 共123页
中国电信EDA
总体规范2.0
4 EDA系统架构(国信)
中国电信 EDA 是中国电信信息化转型的战略体系(CTG-MBOSS)的重要组成部分,服务于整个中国电信企业发展战略。EDA 在整个 CTG-MBOSS 中起到对企业数据整体的规范和管控作用,其范围包括对企业所有数据的规范体系和管控体系。
EDA 是指企业实施全面的企业运营数据的管理和控制,实现数据在采集之后的分析,从企业的整体视角了解企业、客户和市场,通过数据更好地支撑企业运营。根据ITSP 3.0的目标要求,中国电信企业数据架构以数据共享为目标,做好基础数据管理,积极探索和推进大数据应用,以系统为载体,以数据管控为保障,实现企业数据共享、业务支撑和价值提升。
EDA 是由运营数据仓储(ODS)、大数据平台(BDS)、企业数据仓库(EDW)系统及承载在其上的数据展现与服务、数据应用组成,包括 EDW 、 ODS和BDS 所涉及 的ETL、元数据管理、数据存储、报表和 OLAP 以及数据挖掘等。
4.1 技术架构
EDA技术架构由数据存储与处理平台、数据展现和服务、数据应用、数据运营管理四部分组成,如下图所示。
版权声明,保密
第4页 共123页
中国电信EDA
总体规范2.0
图4-1 中国电信 EDA 技术与架构
? 数据存储与处理:由ETL平台、运营数据仓储(ODS)、大数据平台(BDS)、企
业数据仓库(EDW)和 数据集市构成,是数据应用承载的基础。
? ETL平台:为了满足对当前非结构化、海量数据的实时处理要求,在原有ETL
基础上引入了分布式ETL处理模式。ETL 平台包括数据的抽取、转换、装载的过程,为 ODS、EDW、大数据平台提供数据基础。传统ETL采用文本文件、数据库、消息服务等技术方式对传统的结构化数据进行增量或全量的采集和处理,将数据提供给ODS平台。分布式ETL通过多服务器间按照协同工作机制,将要执行的ETL流程分配在多台机器上执行,将数据提供给大数据平台。ETL 平台的数据处理过程涵盖了数据生产源系统、ODS、EDW、大数据平台、数据集市的数据流向全过程,使经过处理后的数据符合 EDA 域各层的使用需要。
? ODS:ODS的大部分数据来源于生产系统,主要采用批处理的数据处理方式,
多基于OLTP技术的SMP架构的数据存储管理,存储了短期的面向运营的准实
版权声明,保密
第5页 共123页
中国电信EDA
时结构化数据,提供统一的企业运营数据视图,支撑跨系统的生产报表、跨系统数据的批量计算、准实时运营数据查询和准实时的数据共享应用。ODS给大数据平台提供数据共享,ODS的部分数据来源于EDW的分析结果数据。ODS通过共享层将数据提供给外围系统使用,作为EDW的主要数据来源。 ? 大数据平台:为了满足移动互联网时代数据处理和分析的要求,新的EDA以
混搭架构引入了大数据技术,负责对非结构化、海量数据进行处理、整合、存储及分析应用,形成大数据平台。大数据平台的数据来源于互联网日志、信令和外部系统数据。海量结构化数据和非结构化数据采用批处理的数据处理方式,基于MPP高可扩展并行数据库架构或hadoop架构的数据存储管理方式,存储了诸如用户话单、DPI等数据信息;消息类流数据采用流处理的数据处理方式,实时处理,实时对外共享结果,一般不做存储要求。大数据平台通过hadoop等技术对海量数据进行轻度汇总,对海量的、非结构化的数据进行标准化、标签化,共享给ODS,同时使用大数据挖掘和探索手段,支撑全网大数据的创新应用。大数据平台与ODS和EDW相互补充,丰富了原有EDA的数据存储和数据应用。
? EDW:面向分析型的数据仓库,数据主要来源于ODS,ODS未整合的运营数据
直接从源系统抽取。采用批处理的数据处理方式,基于SMP架构或MPP高可扩展并行数据库架构的存储管理,存储了长期的、明细和概要的分析型信息,采用数据统计、多维分析和数据挖掘等手段,细分市场和客户,支撑市场的经营分析和决策。
? 数据集市:数据集市作为中国电信 EDA 系统的组成部分,从企业运营数据仓
储 ODS 、大数据平台和企业数据仓库EDW 抽取相关数据并进行转换和装载,并根据应用需求形成数据集合,支撑各种专业化应用,是为满足已定义的用户组或业务领域对于特定业务信息的需求而创建,较数据仓库而言,更关注在数据中构建复杂业务规则来支持功能强大的分析。数据集市包括地域集市、应用集市、专业集市、基于大数据的创新集市。在实现方式上,数据集市可
版权声明,保密
总体规范2.0
第6页 共123页