SEG_PREFIX=gp PORT_BASE=50000
declare -a DATA_DIRECTORY=(/data1/gpdb_p1 /data1/gpdb_p2 /data1/gpdb_p3
/data1/gpdb_p4
/data1/gpdb_m1
/data1/gpdb_m2
/data1/gpdb_m3 /data1/gpdb_m4)
MASTER_HOSTNAME=mdw1 MASTER_DIRECTORY=/data1/gpdb_p1 MASTER_PORT=5432
如果配置有镜像区段,该文件中还要包含有镜像区段的配置。
2.5.2.2 磁盘性能测试
在Master主机上以gpadmin执行测试命令:
gpcheckperf -d /data/gpdb_p1 -d /data/gpdb_p2 -d /data/gpdb_p3 -d /data/gpdb_p4 -S 32GB -r ds -D -v -f /data/gpdb_master/config/hosts-setup
/data/gpdb_master/config/hosts-setup内容同/home/gpadmin/seg_hosts_file。
2.5.2.3 网络性能测试
测试在Master主机上按照子网顺序进行,每一子网(或称每一网段)建立一个主机清单文件。
采用千兆交换机,对第一网段的Master主机和Segment主机的每两个主机之间进行双向同步测试。即:/data/gpdb_master/config/host_net0的内容如下:
mdw-1 sdw1-1
第18页
mdw-1 sdw2-1 sdw1-1 sdw2-1
测试命令会选取第一个到第二个、第三个到第四个i、第五个到第六个??主机进行先单向在反向(参数-r n),或者双向同时测试(参数-r N)。
测试命令:
gpcheckperf -d /data/gpdb_p1 -r N -f /data/gpdb_master/config/host_net0
测试结果样板:
==================== == RESULT
==================== Netperf bisection bandwidth test mdw-1 -> sdw1-1 = 34.580000 mdw-1 -> sdw2-1 = 78.350000 sdw1-1 -> sdw2-1 = 34.970000 sdw1-1 -> mdw-1 = 66.060000 sdw2-1 -> mdw-1 = 47.040000 sdw2-1 -> sdw1-1 = 66.070000
Summary:
sum = 327.07 MB/sec min = 34.58 MB/sec max = 78.35 MB/sec avg = 54.51 MB/sec median = 66.06 MB/sec
第19页
[Warning] connection between mdw-1 and sdw1-1 is no good [Warning] connection between sdw1-1 and sdw2-1 is no good [Warning] connection between sdw1-1 and mdw-1 is no good [Warning] connection between sdw2-1 and mdw-1 is no good [Warning] connection between sdw2-1 and sdw1-1 is no good
2.5.3 进行初始化
运行初始化工具gp_init_config将按照指定的初始化配置文件,建立Greeenplum数据库。
1) 运行gpinitsystem命令,并指定初始化配置文件,例如:
$ gpinitsystem -c /home/gpadmin/gp_init_config 如果有备份Master服务器,运行: $
gpinitsystem
-c
/home/gpadmin/gp_init_config
-s
standby_master_hostname
2) 该工具将按照配置文件检查相应主机是否可以连接、目录是否可以存
取,接下来会确认配置,例如: => Continue with Greenplum creation? y
3) 该工具将建立Master的实例和每一区段实例,每一区段服务器上的工
作并行进行,该步骤需要一定时间;
4) 结束后该工具将启动Greenplum数据库,你将看到
=> Greenplum Database instance successfully created.
? 设定住数据目录环境变量MASTER_DATA_DIRECTORY
1) 将MASTER_DATA_DIRECTORY设定为gpinitsystem在Master服务
第20页
器的数据库目录下建立的目录,如在gpadmin的原文件(如.bashrc)中增加:
MASTER_DATA_DIRECTORY=/gpdata/gp-1 export MASTER_DATA_DIRECTORY 执行:
$ source ~/.bashrc
第21页
2)
第3章 Greenplum的起停操作
常用的三条命令:
gpstart——启动Greenplum; gpstop——停止Greenplum; gpstate——检查Greenplum状态。
Greenplum所有工作完成后,可以用psql建立数据库表等操作,来检查Greenplum的工作情况。
第22页
第4章 Greenplum测试
参照以下例子,进行系统加载和查询测试。
4.1 数据加载测试情况 4.1.1 外部表建立语句
create external table sales_ext (
sales_date DATE, store_id INT, product_id INT, quantity INT, Sales_month INT) LOCATION ('gpfdist://mdw-1:8080/sales*.csv') FORMAT 'TEXT' (DELIMITER ',');
4.1.2 Sales表建立语句
create table sales (
sales_date DATE, store_id INT, product_id INT, quantity INT, Sales_month INT) DISTRIBUTED RANDOMLY;
4.1.3 Sales数据加载测试
加载语句:
INSERT INTO sales SELECT * FROM sales_ext;
第23页