本文为您介绍如何使用DataStudio导入MaxCompute数据至Hologres。

前提条件

背景信息

DataStudio支持一键表数据同步功能,您可以使用可视化方式导入MaxCompute表数据并进行查询。该方式比创建外部表直接查询数据的性能更好。

您也可以使用SQL语句导入MaxCompute数据,详情请参见使用SQL导入MaxCompute的数据至Hologres

操作步骤

  1. 新建一键表数据同步节点
    1. 登录DataWorks控制台
    2. 在左侧导航栏,单击工作空间列表
    3. 选择工作空间所在地域后,单击相应工作空间后的进入数据开发
    4. DataStudio界面的左侧导航栏,单击数据开发图标。
    5. 进入数据开发页面,鼠标悬停至顶部菜单栏的新建图标,选择Hologres>一键表数据同步
      一键表数据同步
    6. 新建节点对话框中,输入节点名称,并选择目标文件夹,单击提交
  2. 在编辑节点页面,配置各项参数。
    配置参数
    参数 说明
    目标连接 Hologres的实例名称。
    目标库 Hologres实例下的数据库名称。
    外部表来源
    • 已有外部表

      已经提前在Hologres中创建映射MaxCompute数据的外部表。

    • 新建外部表

      表示无相应的外部表,需要同步时新建。

    外部表表名字 已存在的外部表名称,需要与同步数据的MaxCompute表对应。
    目标Schema 当前Hologres数据库下的Schema名称。默认为public,若您有新建Schema,可以选择您新建的Schema。
    目标表名 需要导入数据的Hologres内部表名称。如已有表,执行后原表和数据将被删除重建。
    目标表描述 自定义添加需要导入数据的Hologres内部表的描述。
    同步字段 选择需要同步的MaxCompute表字段,可以选择全部字段,也可以选择部分字段。
    分区配置 选择需要同步的分区字段。当前Hologres仅支持一级分区。
    索引配置 为目标表构建索引。索引的创建请参见设置表属性
    SQL Script 自动解析出当前运行的SQL,方便参照。
  3. 在新建节点的编辑页面,单击保存图标,保存配置信息。
  4. 在新建节点的编辑页面,单击运行图标,导入MaxCompute表数据。
  5. 查看同步的MaxCompute表数据
    1. 在左侧导航栏,单击PG管理图标,进入表管理页面。
    2. 双击需要查看的Hologres内部表,显示表编辑页面。
  6. (可选)周期性调度
    1. 在节点的编辑页面,单击节点编辑区域右侧的调度配置,配置节点的调度属性,详情请参见配置基础属性
    2. 在节点的编辑页面,单击工具栏中的保存图标,保存节点。
    3. 单击工具栏中的提交图标,提交节点。
    4. 提交新版本对话框中,输入变更描述,单击确认