金税三期-管理决策系统架构需求v1[1].0(4)

2019-04-21 18:15

金税三期工程架构管控项目

第3章 数据设计约束

3.1. 规划策略

管理决策系统的数据规划,应全面服从“信息管税”总体战略发展需要,以税收风险管理理念为指导,结合构建“查询报表、风险管理、政策评估、核算管理、绩效考核、知识管理”的管理决策体系需求,通过对大量生产数据的整合、加工和处理,实现从数据到信息再到知识的阶梯性转换过程,形成总局统一视图、数据仓库和数据集市,从而为总局的数据分析和决策支持提供保障。

3.2. 数据划分

管理决策系统的数据规划,可以划分为以下几类:统一数据视图、数据仓库和数据集市、元数据、知识库。

3.2.1. 统一数据视图

统一数据视图,按天抽取并整合来自近期征管操作数据库、网络发票库、交叉稽核库等的数据,建立统一的用户视图,支撑管理决策应用,如支撑征管状况分析、统计查询和报表等。统一数据视图,数据粒度一般为明细和轻度汇总。

统一数据视图可以存储如下数据:

? 全国法人涉税的所有数据,包括法人的基本信息、申报、征收等数据,形成“法

人库”;

? 全国自然人涉税的所有数据,包括自然人的基本信息、家庭和收入情况等数据,

形成“自然人库”;

? 全国发票数据,包括票种核定、发票明细(含网络发票)、纳税人发票领购、验

旧缴销等数据,形成“发票库”;

? 全国税务机构数据,包括机构、人员、身份认证、岗责体系等数据,形成“税务

机关数据库”;

? 财产涉税的所有数据,包括房产、车辆、船舶等,形成“财产库”;

第16页/共42页

金税三期工程架构管控项目

? 外部信息数据,包括同外部门进行业务协同的交换数据等,形成“外部信息库”。

3.2.2. 数据仓库和数据集市

数据仓库,按天抽取、转换、加载来自统一数据视图的数据,建立企业级数据模型,支撑管理决策和联机分析应用,如风险管理、政策评估、核算管理、绩效考核等。数据仓库,存储已有和未来至少3年(一般10年)的基础数据,数据粒度包括从明细到轻度汇总、中度汇总、高度汇总。汇总程度越高,数据粒度越大,数据在线保留时间越长,所体现的业务事实越宏观。

数据仓库可以存储以下数据:

? 当前(或之前某一时间点)明细数据; ? 历史数据; ? 汇总和统计数据;

? 衍生数据,如按照指标体系、分析方法通过计算确定的各种指标数据。 数据集市是数据仓库的子集,通常将明细数据聚合为汇总数据,同时在汇总数据上的分析可下钻到明细数据,主要目的是支持各种不同的前端主题应用。

3.2.3. 元数据

元数据(Metadata)是描述数据的数据,描述数据结构和建立方法的数据。在管理决策系统中,元数据为访问数据库提供了一个信息目录,该目录全面描述了数据库中都有什么数据、这些数据怎么得到的和怎么访问这些数据。

元数据按用途的不同可以分为:业务元数据、技术元数据。

业务元数据是从业务角度描述数据的数据,它提供了介于数据应用和生产系统之间的语义层定义,包括指标口径、代码标准、业务术语、业务规则等。

技术元数据存储关于数据层技术细节的数据,是用于开发、管理和维护系统使用的数据。它主要包括以下信息:

? 统一数据视图、数据仓库和数据集市等结构的描述,包括模式、视图、层次结构、

维等的定义;

? 统一数据视图、数据仓库和数据集市等内容的描述,包括数据粒度、算法、主题

域等的定义;

? 源数据到目的数据的映射,包括:源数据和它们的内容,数据抽取、清理、转换

第17页/共42页

金税三期工程架构管控项目

和刷新规则等;

? 用户访问权限、数据备份历史记录等。

管理决策系统应建立统一的业务、技术元数据视图,以支撑元数据管理。

3.2.4. 知识库

管理决策系统应建立良好的税务知识积累、应用、评估、沟通和考核系统机制,建立起支撑税务机构及其工作人员的知识平台。

税务知识库的创建,首先要求分析建立税务知识体系结构,按照知识类型和应用类型等进行类别划分,形成知识树,并最终汇总成为税务知识库。税务知识库存储的数据对象包括:结构化数据、具有非结构化数据特征的文本和图像,以及其他混合内容。

管理决策系统应根据税务知识体系结构,建立起税务知识库,以支撑知识管理应用。

3.3. 数据建模

在管理决策系统中,数据模型建设是至关重要的。本项目的数据模型应该包括统一数据视图、数据仓库全面的数据规划,如数据层次划分、内容组织等。

数据模型应分成多层进行设计,涵盖税务业务内涵需完整、全面。具体的规划要点如下:

? 统一数据视图建模

统一数据视图是一个面向主题的、集成的、可变的、当前的数据集合,用于支持对即时性的、操作性的、集成的管理决策需求。统一数据视图可以按照3NF设计成OLTP数据库,以总体架构项目规划的数据模型为基础,优化其逻辑访问及物理存储结构,达到高效查询的要求。

? 数据仓库建模

数据仓库的特征在于面向主题、集成性、稳定性和时变性,用于提供税收业务完整的业务视图,包含税收业务各环节的基础业务数据。数据仓库可以参考3NF、STAR-SCHEMA等建模方法确定数据模型,优化其逻辑访问及物理存储结构,以便处理大量的数据并发访问。

? 数据集市建模

第18页/共42页

金税三期工程架构管控项目

围绕数据仓库数据,面向不同分析主题,进行数据集市建模,完成管理决策和联机分析应用。数据集市的结构可以是多维数据集(如星型、雪花型),也可以是关系数据集。数据模型的设计,包括指标体系建立、分析方法选择、分析主题建立等三项内容。

? 指标体系建立:构建税务分析指标体系,包括报表类、分析类、评估类和考

核类指标等,形成指标库(如风险指标库),以支撑核算管理、风险管理、政策评估、绩效考核等分析应用。指标体系的构建,需要全面反映税务管理决策支持的需求,具有前瞻性、灵活性、可扩展性等特点。

? 分析方法选择:只有综合地运用分析方法才能实现深入分析的目标。管理决

策系统,应从数据仓库中选出数据集,在数据集上运用科学的分析方法,建立税务行业分析模型。分析方法包括: 80/20分析、对比分析、因素分析等常见算法,聚类、关联、分类等高级算法,以及决策树、神经网络等数据挖掘算法。

? 分析主题建立:包括主题数据集市模型和前端展现模型两个层次。主题数据

集市指MOLAP,前端展现模型是分析结果与用户的信息交互。

3.4. 数据流转

源数据库 近期征管操作数据库(N+X) 近期征管操作数据库(N+X) 近期征管操作数据库(N+X) 近期征管操作数据库(N+X) 网络发票数据库 增值税交叉稽核(总局)数据库 近期征管操作数据库(N+X) N+X+Y统一视图的税务机关库 N+X+Y统一视图的发票数据库 目标数据库 N+X+Y统一视图的法人数据库 N+X+Y统一视图的财产数据库 N+X+Y统一视图的自然人数据库 传输数据内容 法人相关数据 传输方式 ETL定时 传输频度 每天 财产相关数据 ETL定时 每天 自然人相关数据 ETL定时 每天 发票相关信息 网络发票信息 增值税交叉稽核信息 税务机构的汇总数据 ETL定时 ETL定时 ETL定时 每天 每天 每天 ETL定时 每天 第19页/共42页

金税三期工程架构管控项目

源数据库 总局行政办公数据库群 与工商、银行、海关等外部门信息交换数据 外部应用平台和前置系统数据 目标数据库 传输数据内容 行政办公数据 传输方式 ETL定时 传输频度 每天 N+X+Y统一视图的外部信息库 第三方数据 ETL定时 每天 Y个月的历史数N+X+Y统一视图的系统管理库 据 根据历史数ETL定时 据迁移的要求 根据历史数ETL定时 据迁移的要求 ETL定时 每天 总局内网平台系统数据 N+X+Y统一视图 N+X+Y统一视图 数据仓库

Y个月的历史数据 管理决策涉及的基础数据 数据集市涉及的数据仓库 数据集市 基础数据 数据集市涉及的主题数据 ETL定时 每天 ETL定时 每天 第20页/共42页


金税三期-管理决策系统架构需求v1[1].0(4).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:南中环太行路立交深基坑方案

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: