3.3.1 节点管理
实现与数据中心相连的各个节点的信息管理、配置管理,包括业务部门、区县数据中心等。
3.3.2 主题管理
数据采集、数据发布、数据共享、数据交换、公共服务以及决策支持均以主题的方式进行,因此必须实现对主题的管理。主题是元数据的集合。
3.3.3 元数据管理
元数据是关于数据的数据。元数据描述了数据的结构和意义,同时也可以描述应用程序和流程的结构和意义。构造数据中心数据库的重要步骤之一,就是定义和创建元数据(Metadata)。元数据提供一个目录,列出数据中心有什么数据。所有进入数据中心的数据,必须在元数据中有所表述。数据中心的数据管理系统必须提供储存和管理元数据的方法。以元数据管理为核心,建立数据中心的数据资源目录体系,提供给业务部门参考使用。
数据中心的元数据包括基础数据元和共享数据元,由数据中心统一管理。基础数据元由数据中心定义,共享数据元由业务部门定义并注册到数据中心。业务部门进入数据中心的元数据管理中心好比进了一个“超市”,可以方便地知道可以获取和使用哪些数据,并进行数据使用申请的定制。
3.3.4 公共代码管理
对公共代码需要有统一的标准规范,数据中心必须提供公共代码的管理。基于数据中心的公共代码规范,各部门和区县数据中心可以通过数据转换将各种不同含义的编码和标准规范的编码之间进行双向的转换。
11
3.3.5 数据采集
与各业务部门形成数据采集机制,通过数据共享交换平台从各业务部门汇总数据,对原始数据进行缓存、存储。
3.3.6 数据整理比对
从各业务部门采集共享数据后,进行数据转换,对全市自然人和法人基本数据进行数据比对、冲突检测处理并入库。
3.3.7 数据交换
实现省、市、区各级数据中心之间、业务部门与数据中心之间以及业务部门之间的数据交换业务,形成高效、安全、可靠、稳定的数据交换网络。提供定时批量、实时按需的数据交换,提供点对点、一对多的数据交换支持,对数据交换进行管理和监控。
3.3.8 数据访问
在统一的权限管理系统之上,实现对自然人和法人的建档、调档、阅档等业务。对社保卡系统、公共服务中心系统、业务系统提供数据访问。对决策支持系统、业务监管提供数据支持。
3.3.9 数据备份与恢复
恢复管理是对数据进行备份、导入导出以及数据库恢复等。数据是数据中心核心的资源。全面的容灾方式应该是数据备份+数据复制+远程容灾。对系统中的数据要定期进行系统备份。采用本地备份与异地备份相结合的方式。
3.3.10 标准管理
进行数据中心的标准规范尤其是数据标准的审核制定、升级维护与发布实施
12
等管理功能。在数据中心的建立之初,由于标准规范处于不断完善的过程,应建立标准的版本管理机制,方便业务部门的查询和使用。
3.3.11 应用支持
对社保相关业务应用系统、公共服务系统、业务监管系统和决策支持系统提供提供数据、通道和平台等支持。
3.3.12 运行管理
为方便对数据中心的管理和维护,需要一套功能完整的运行管理与监控维护系统。运行管理系统主要提供给数据中心的系统管理人员使用,用于保证数据中心的安全可靠和高效运行。其功能主要包括面向安全性的用户管理、权限管理、密码管理和日志管理等;面向性能优化的性能监控等。面向可用性的节点管理、交换规则管理和状态监控;其中节点管理包括对业务部门的信息管理。
3.4 性能需求分析 3.4.1 业务处理量分析
数据中心的主要业务包括:
(1)基础数据的采集、转换、比对以及分发 这是数据中心的主要负载压力所在。 (2)业务数据交换的备案或存储转发
在数据中心建设初期,业务数据在业务部门之间交换;当业务部门的接口系统难以承受数据交换的负载时,才可能通过数据中心存储转发。所以这部分业务不会对负载造成负载压力。
(3)元数据库和公共代码库的管理和共享
由于元数据库和公共代码库相对稳定,并且数据量不是很大,所以不会对数
13
据中心造成负载压力。
(4)与业务部门交换公共服务数据
由于业务不停地在发生,即使采用定时批量的交换方式,也会对数据中心造成较大的负载压力。
(5)汇集统计数据,并提供查询
统计数据一般按月提供,而且提交的一般为结果数据,在数据交换方面不会构成太大压力。领导的数据查询会形成少量的负载。
(6)提供业务部门的容灾备份
容灾备份不需通过数据库服务器处理,所以不会对数据中心的负载构成压力。
数据中心的主要负载压力在于两个方面,一是基础数据的采集、维护和使用;二是数据中心与业务部门之间的公共服务数据交换。下面我们分别进行分析。 3.4.1.1 基础数据采集、转换、比对和分发
基础数据包括自然人基础数据库和法人单位基础数据库。由于在数量上自然人数据量远远大于法人单位的数据量,所以在进行业务数据量分析时,我们主要考虑自然人基础数据。 (1)基础数据的变动估计 ? 基准数据和基础数据
自然人基础数据包含基准数据。基准数据包括身份证号码和姓名等5个基本属性。基础数据是在基准数据的基础上扩展10个常用的属性构成的,如户籍地址、婚姻状态等。
? 基准数据的变动
基准数据在四大变动(出生、死亡、迁入、迁出)以及改名等情况下发生变化,每年的出生率、死亡率、迁入迁出以及改名情况,大致预测基准数据的变动概率为10%左右。
14
? 基础数据的变动
在基准数据不变的情况下预测基础数据的变动。基础数据的10个常用属性如婚姻状态是容易发生变化的。
(2)基础数据变动造成的负载
基础数据的变动将引起数据中心的负载。首先业务部门需将变动数据交换给数据中心,数据中心采集后进行转换和比对,然后进行发布,分发给有需要的部门使用。
估计数据中心采集一次数据变动相当于2笔数据库交易;进行转换和比对相当于3笔数据库交易,然后再将基础数据分发给10个左右的业务单位共享使用,每分发一次相当于1笔数据库交易。根据我们以上对数据中心的变动次数的估计,每年的业务量约为:(500+100)*(2+3+1*10)=9000万笔数据库交易。
按一年250个工作日,每个工作日8小时计算,每分钟的业务量约为:9000万笔 / (250*8*60)= 750笔/分钟
依据“80-20”估算方法,峰值的业务处理量为:3000笔/分钟。 3.4.1.2 公共服务数据交换
数据中心提供对公共服务系统的支持。各业务部门的公共服务业务数据通过统一的数据共享与交换平台即时或定时的交换到数据中心,保存到公共服务数据库。再与外网的公共服务数据库同步。
3.5 安全保障体系需求分析 3.5.1 系统安全可靠性需求
数据中心是社会保障业务处理的核心系统,如果遇到破坏,或无法正常工作,将造成无法估量的损失。需要保护的资源不仅有物理资源(设备、设施)、数据资源(数据、数据库软件等),而且还有网络资源(通信链路、网络接入等)。
15