集群可以支持的并发加载任务总数

集群加载时,集群节点上的gbloader主要是cpu负载较高,可以通过集群节点的cpu核数估算集群可以支持的并发加载任务总数。
1、保守估计(有查询等其他业务):
加载任务数=Cores/2/副本数
例如: 2副本(1主1备)集群,节点cpu为32核,则支持的加载任务数=32/2/2=8个。

2、如果只有加载几乎没有其他业务,可以适当放宽:
加载任务数=Cores / 1.5 / 副本数
例如: 2副本(1主1备)集群,节点cpu为32核,则支持的加载任务数=32/ 1.5 /2≈10个。

关于dispserver dispcli gbloader网络部署的问题

dispserver主要功能:
1、dispserver可根据命令执行相应的文件切分或复制操作。切分指的是将数据文件划分为若干条块,每个节点分配一个条块的数据;复制是指将全部数据分配给每个提出数据读取要求的节点。
2、dispserver可根据dispcli发来的打开文件或读取数据的命令执行相应的操作。dispcli的主要功能就是通知dispserver开始切分文件,并且通过gcluster启动集群节点上的gbloader,来读取dispserver端的数据进行导入。数据源文件和dispserver必须在同一台物理机器上,且必须打开监听dispserver服务端口的权限,dispcli所在的机器必须可以连接到dispserver所在的物理机器以及部署集群节点的物理机器,集群节点需要访问dispserver获取数据,不同网段无法获取数据,dispcli需要访问集群拓扑信息,所以也需要在同一个网络中。
dispserver dispcli gbloader网络部署要求:
dispserver、dispcli、gbloader必须在同一网段下进行部署,可以分别进行部署。dispserver部署在一台机器上,dispcli部署在另外一台机器上,两台机器必须和集群各节点在同一个网段环境下。

如何把整个库的表结构导出,但只导表结构不导数据?

GBase8a数据库提供了gcdump工具,用于导出数据库中表结构、存储过程及自定义函数,举例如下:
导出ssbm数据库中表结构、存储过程及自定义函数,输出内容中包含CREATE DATABASE语句。

[gbase@localhost ~]$/opt/gcluster/server/bin/gcdump -ugbase -pgbase20110531 -B -R ssbm >/home/gbase/ssbm.sql

-B 输出内容中包含'create database'的信息 
-R 输出存储过程和函数
-t 不输出建表信息

集群数据远程导出rmt:SELECT INTO OUTFILE...使用注意事项

GBase 8a集群提供数据远程导出功能,即把数据从集群服务器导出到集群客户端所在的机器,导出后的数据为文本文件。
语法如下:

rmt:SELECT_SYNTAX INTO OUTFILE ...

info:注意事项:

1、远程导出功能需要使用客户端所在机器的6066–6165端口范围作为导出服务的临时端口。使用远程导出功能前请先确认该端口范围正常开放,且未被占用,否则可能导致远程导出失败。
2、远程导出客户端服务器gccli连接集群必须指定-h参数,指向集群中任一节点ip地址。
3、“rmt:”与select_syntax 之间不能有空格,否则会报语法错误,数据不能正常导出。
4、select语句中不能有回车,否则会报语法错误。