DW DataStage ETL 培训 - DataStage介绍(2)

2020-04-16 12:13

2、 3、 4、

在“Permission”页框中,设置并分配开发人员组的权限。 在“Tracing”页框中,设置或取消服务端进行跟踪。 在“Schedule”页框中,设置调度时运行Job所用到的用户名和口令。

5、

在“Tunables”页框中,指定Hash文件Stage的读写的缓存大小。

另外,在Adminstrator中还可以设置常用服务器的默认值: 1、改变License信息:

2、设置服务器端连接超时时间

可设置连接超时时间

3、

3.2 Designer

Designer:创建、设计、开发DataStage应用程序,包括Job、

Job Sequencer等,以及编译、运行这些DS应用程序。

第一步:登陆Designer

第二步:选择Project

s

第三步:进入Designer

中间偏右是Designer的设计区域,可以将Stage和Link从工具的板块上拖动过来放在上面。左边是Repository窗口,显示的是Manger中的分支。

Manger中的分支,就像Jobs和表定义一样可以直接拖曳到设计区域。点击View->Repository来显示Repository窗口。

点击View->Property Browser来显示Job属性窗口。

Designer的工具栏:

Designer提供一个数据流程的模式,轻松将设置和Job的设计有机的组成。 Designer的功能: 1、指定数据如何抽取。

2、制定数据的转换规则和进行转换。

3、使用参考性质的Lookup到数据集市中编辑数据。

1) 例如,如果销售的记录集包括Customer_ID,可以在Customer_Master表中使用Lookup查找到Customer名称。 2) 当需要连接数据集市并使用查询,可以快速的进行访问。 4、对数据进行整合和聚合。

5、在定义的约束条件中将基础数据分割成为多个输出的连接。

Job类型:

1)Parallel Job:这是最常用的Job类型,适用于DataStage的EE版本,

它运行于安装了SMP、MPP等系统的服务器上,最大特点是在Job内部可以并行处理数据。

2)Server Job:适用于DataStage的SE版本,它与Parallel Job最大的区

别是在Job内部不能并行处理数据,只能串行,这就使到它在处理大数据量ETL时的效率远远低于Parallel Job。

3)MainFrame Job:大型机Job,它只适用于企业MVS版本。

另外,除了上面几种类型的Job,DataStage还提供了两个实体给开发人员提高开发效率和设置Job的运行顺序:

1)Shared Container:共享容器,它有一系列的Stage和Link组成,在同

一个Project里,它可以被不同的Job重用,类似于PL/SQL里的函数。与Shared Container相对应的,DataStage还提供了Local Container,它只能在一个Job里使用,不能跨Job重用。根据Job类型的不同,它分


DW DataStage ETL 培训 - DataStage介绍(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:06年英语专四听力原文和答案学习啊 -

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: