数据集成是稳定高效、弹性伸缩的数据同步平台,为阿里云大数据计算引擎(MaxCompute、AnalyticDB for PostgreSQL和Hologres等)提供离线、批量数据的进出通道。
重要
- 在网络可达的情况下,支持通过独享数据集成资源组实现跨账号、跨地域及同步本地IDC数据。例如跨账号同步将A账号下的MySQL数据库的数据可以同步至B账号的MongoDB等数据库中。
- 数据源需要在连通网络的前提下进行数据同步,详情请参见配置资源组与网络连通。
- 数据集成支持向导模式和脚本模式配置离线任务,但以下场景仅支持使用脚本模式配置任务:
- 无法通过DataWorks数据集成新建数据源。
- 数据源本身不支持使用向导模式配置任务,可直接通过脚本模式配置任务。
- 部分插件的参数仅支持使用脚本模式配置任务。
单表离线同步支持的数据源
DataWorks支持您在数据开发(DataStudio)界面配置单表离线同步。
整库离线同步支持的数据源
DataWorks支持您在数据集成主站新建整库离线同步方案,快速将来源数据源内所有表上传至目标数据源,帮助您节省大量初始化数据上云的批量任务创建时间。
当前DataWorks支持各类数据源的数据整库迁移至MaxCompute、OSS、Elasticsearch等,支持的数据源类型和操作指导链接如下。
去向数据源 | 来源数据源 | 操作指导链接 |
---|---|---|
MaxCompute | 整库离线同步至MaxCompute | |
OSS | 整库离线同步至OSS | |
Elasticsearch | 整库离线同步至Elasticsearch |