全部产品
Search
文档中心

实时数仓Hologres:使用COPY命令导出Hologres的数据至OSS

更新时间:Aug 24, 2023

阿里云对象存储(Object Storage Service,简称 OSS)是阿里云提供的安全、低成本及高可靠的云存储服务。本文指导您使用copy to命令语句和hg_dump_to_oss命令语句将查询的数据导出到指定的OSS。

使用限制

  • 仅当前Hologres实例的Superuser或拥有pg_execute_server_program权限的用户,才可以使用hg_dump_to_oss导出Hologres的数据至OSS。Superuser可以授予其他用户pg_execute_server_program权限,命令如下。
    --DB开启简单权限模型,执行以下语句
    call spm_grant('pg_execute_server_program','云账号ID/云邮箱/RAM账号');
    
    --DB使用的是专家权限模型,执行以下语句
    grant pg_execute_server_program to 云账号ID/云邮箱/RAM账号;
  • 单次导入至OSS的数据量不能超过5GB。

命令介绍

  • COPY命令COPY命令是PostgreSQL表和标准文件系统之间移动数据的工具,Hologres支持COPY命令。COPY TO语句将SELECT查询的结果内容复制到一个文件或者其他输出介质中。COPY FROM语句用于从一个文件复制数据到一个表。
  • hg_dump_to_oss命令:用于将在Hologres中查询的结果dump到指定的OSS。

COPY命令

如下内容将为您介绍COPY TO命令的具体语法格式和参数说明:
  • 命令格式
    COPY ( query ) TO { PROGRAM 'command' | STDOUT }
        [ [ WITH ] ( option [, ...] ) ]
    其中,option可以是下列之一:
        FORMAT [format_name]
        DELIMITER 'delimiter_character'
        NULL 'null_string'
        HEADER
        QUOTE 'quote_character'
        ESCAPE 'escape_character'
        ENCODING 'encoding_name'
  • 参数说明
    参数描述
    query输入的查询语句。查询语句前后的圆括号必需保留。
    PROGRAM一个要执行的命令,输出会写入到该命令的标准输入。
    STDOUT指定输出,该输出将同步到客户端应用。
    FORMAT选择数据格式,其格式可以为text,csv 或者binary。默认为text。
    DELIMITER指定分隔文件每行中各列的字符,这必须是一个单一的单字节字符。各数据格式的字符说明如下:
    • text格式中默认是一个制表符(如\t)。
    • csv格式默认是一个逗号(,)。
    • binary格式时不支持使用这个选项。
    NULL指定表示一个空值的字符串。各数据格式的字符说明如下:
    • text格式中默认是\N。
    • csv格式默认是一个未加引用的空串。
    • binary格式时不支持使用这个选项。
    HEADER指定文件包含标题行,其中有每一列的名称。只有csv格式支持该选项。
    QUOTE指定应该出现在一个匹配QUOTE值的数据字符之前的字符,这必须是一个单一的单字节字符。 默认和QUOTE值一样。只有csv格式支持该选项。
    ENCODING指定文件按照encoding_name编码。如果省略,将使用当前的客户端编码。

hg_dump_to_oss命令

如下内容将为您介绍hg_dump_to_oss命令的具体语法格式和参数说明,在Hologres中hg_dump_to_oss命令与COPY TO命令组合在一起使用。

  • 命令格式
    COPY (query) TO PROGRAM 'hg_dump_to_oss --AccessKeyId <accessid> --AccessKeySecret <accesskey> --Endpoint <ossendpoint> --BucketName <bucketname> --DirName <dirname> --FileName <filename> --BatchSize <xxx> ' (DELIMITER ',', HEADER true, FORMAT CSV);
    说明 <dirname>前请不要添加/\等字符。
  • 参数说明
    参数描述示例
    query输入的查询语句。select * from dual;
    AccessKeyId当前账号的AccessKey ID。

    您可以单击AccessKey 管理,获取AccessKey ID。

    AccessKeySecret当前账号的AccessKey SECRET。

    您可以单击AccessKey 管理,获取AccessKey Secret。

    EndpointOSS的经典网络访问域名。

    您可以单击Bucket列表页面的目标Bucket名称,进入Bucket详情页查看。

    oss-cn-beijing-internal.aliyuncs.com
    BucketNameOSS对应的Bucket名称。dummy_bucket
    DirNameOSS存放输出结果的目录。testdemo/
    FileName(可选)OSS对应的文件名称。file_name
    BatchSize每次执行hg_dump_to_oss的行数,默认为10005000
    DELIMITER结果列之间的分隔符,默认为制表符(Tab-separated Values,简称TSV)。','

使用示例

在Hologres中hg_dump_to_oss命令与COPY TO命令的使用示例如下。
-- 将Hologres内部表数据dump到指定OSS
COPY (select * from holo_test LIMIT 2) TO PROGRAM 'hg_dump_to_oss --AccessKeyId <access id> --AccessKeySecret <access key> --Endpoint oss-cn-hangzhou-internal.aliyuncs.com --BucketName hologres-demo --DirName holotest/ --FileName file_name --BatchSize 3000' DELIMITER ',';

-- 将Hologres外部表数据dump到指定OSS
COPY (select * from foreign_holo_test LIMIT 20) TO PROGRAM 'hg_dump_to_oss --AccessKeyId <access id> --AccessKeySecret <access key> --Endpoint oss-cn-hangzhou-internal.aliyuncs.com --BucketName hologres-demo --DirName holotest/ --FileName file_name --BatchSize 3000' (DELIMITER ',', HEADER true);

-- 跨region dump到指定OSS
COPY (select * from holo_test_1 LIMIT 20) TO PROGRAM 'hg_dump_to_oss --AccessKeyId <access id> --AccessKeySecret <access key> --Endpoint oss-cn-beijing-internal.aliyuncs.com --BucketName hologres-demo --DirName holotest/ --FileName file_name --BatchSize 3000' (DELIMITER ',', HEADER true, FORMAT CSV);
说明 Hologres支持跨地域导出数据至指定的OSS。例如,可以导出杭州地域的实例查询出的数据至北京地域的OSS。

常见问题

常见的报错内容及解决方法如下:
  • ERROR: syntax error at or near ")"LINE 1: COPY (select 1,2,3 from ) TO PROGRAM 'hg_dump_to_oss2 --Acce...

    输入的query有误,请检查对应的查询语句。

  • DETAIL: child process exited with exit code 255

    选择的OSS网络类型有误。如果您使用的是公共云,请选择经典网络

  • DETAIL: command not found

    您需要配置DUMP TO OSSprogramhg_dump_to_oss,否则会出现该报错。

  • ERROR: program "hg_dump_to_oss ...” failed DETAIL: child process exited with exit code 101

    输入的AccessKeyId不合法,请使用当前账号的AccessKey ID。

  • ERROR: program "hg_dump_to_oss ...” failed DETAIL: child process exited with exit code 102

    输入的AccessKeySecret不合法,请使用当前账号的AccessKey Secret。

  • ERROR: program "hg_dump_to_oss ...” failed DETAIL: child process exited with exit code 103

    输入的Endpoint不合法,请确认对应OSS经典网络的Endpoint。

  • ERROR: program "hg_dump_to_oss ...” failed DETAIL: child process exited with exit code 104

    输入的BucketName不合法,请确认对应的Bucket名称。

  • ERROR: program "hg_dump_to_oss ..." failed DETAIL: child process exited with exit code 105

    缺少参数,请对照参数说明,检查必选参数是否均已配置。

  • ERROR: program "hg_dump_to_oss ...” failed DETAIL: child process exited with exit code 255

    一般情况下是由于holo server与指定的OSS网络不通导致该报错,可以更换OSS域名(例如:OSS网络类型选择经典网络)。更多关于OSS的域名信息,请参见访问域名和数据中心