Data sources and synchronization solutions - DataWorks - Alibaba Cloud Documentation Center

Synchronization solutions

Synchronization type	Source granularity	Destination granularity	Latency	Synchronization scenario
Batch synchronization for a single table	A single table	A single table or partition	T+1 or periodic	Periodic full synchronization, periodic incremental synchronization
Batch synchronization for sharded tables	Multiple tables with identical structures	A single table or partition	T+1 or periodic	Periodic full synchronization, periodic incremental synchronization
Real-time synchronization for a single table	A single table	A single table or partition	Seconds to minutes	Real-time incremental synchronization (Change Data Capture (CDC))
Real-time synchronization for sharded tables	Multiple logical tables (logical aggregations of multiple physical tables)	Map to multiple destination tables or MERGE into a single destination table	Seconds to minutes	Full synchronization + real-time incremental synchronization (CDC)
Batch synchronization for an entire database	An entire database or multiple tables	Map to multiple tables and their partitions	One-time or periodic	One-time/periodic full synchronization, one-time/periodic incremental synchronization, one-time full + periodic incremental synchronization
Real-time synchronization for an entire database	An entire database or multiple tables	Map to multiple tables and their partitions	Seconds to minutes	Full synchronization + real-time incremental synchronization (CDC)
Full and incremental synchronization for an entire database	An entire database or multiple tables	Map to multiple tables and their partitions	Initial full synchronization: Batch Subsequent incremental synchronization: T+1	One-time full + T+1 incremental synchronization (using a Base+Log pattern)

Data source capabilities

Data source	Batch (single table)	Real-time (single table)	Batch (database)	Real-time (database)	Full and incremental (database)
ApsaraDB for Memcache data source	Read	-	-	-	-
ApsaraDB for MongoDB data source	Read/Write	-	-	-	-
ApsaraDB for PolarDB-X 1.0 data source	Read/Write	-	-	-	-
ApsaraDB for Redis data source	Read/Write	-	-	-	-
ApsaraDB RDS for MySQL data source	Read/Write	Write	Read	Write	-
ApsaraDB RDS for PostgreSQL data source	Read/Write	-	Read	-	-
ApsaraDB for OceanBase data source	Read/Write	-	-	Read	Read
ApsaraDB RDS for SQL Server data source	Read	-	-	-	-
ApsaraDB RDS for MariaDB TX data source	Read	-	-	-	-
AnalyticDB for MySQL data source	Read/Write	-	-	-	-
AnalyticDB for PostgreSQL data source	Read	-	-	-	-
API data source	Read	-	-	-	-
Data Lake Analytics (DLA) data source	Read/Write	Read/Write	-	Write	-
Doris data source	Read/Write	Write	Write	Write	-
DB2 for LUW data source	Read/Write	-	Read	-	-
SelectDB data source	Read/Write	Write	Read	-	-
DRDS data source	Read/Write	-	Read	-	-
Enterprise Distributed Application Service (EDAS) data source	Read/Write	-	Read	-	-
	Read/Write	Write	Write	Write	-
EMR ClickHouse data source	Read/Write	-	-	-	-
	Read/Write	-	-	-	-
	Read/Write (Native API) Read (SQL 2.0.x) Write (SQL 1.1.x)	-	-	-	-
EMR HDFS data source	Read/Write	-	-	-	-
	Read/Write	-	Read/Write	-	-
Hologres data source	Read/Write	Read/Write	Read/Write	Write	-
EMR Impala data source	Read	-	-	-	-
Kafka data source	Read/Write	Read/Write	-	Write	-
EMR Kudu data source	Read/Write	-	-	-	-
MaxCompute data source	Read/Write	Write	-	Write	-
Message Queue for Apache RocketMQ data source	Read/Write	Read	-	-	-
OpenSearch data source	Read/Write	Write	Write	Write	Write
Object Storage Service (OSS) data source	Read/Write	-	-	-	-
On-premises ApsaraDB for Lindorm data source	Write	-	-	-	-
On-premises Cassandra data source	Write	-	-	-	-
On-premises FTP data source	Read	-	-	-	-
On-premises Greenplum data source	Read/Write	-	-	-	-
On-premises HDFS data source	Read/Write	-	-	Read	-
On-premises MySQL data source	Read/Write	Read	Read	Read	Read
On-premises odpshttp data source	Write	-	-	-	-
On-premises Oracle data source	Read/Write	Read	Read	Read	Read
On-premises PolarDB for PostgreSQL (compatible with Oracle) data source	Read/Write	-	Write	Write	-
On-premises PolarDB-O data source	Read/Write	-	Write	Write	-
On-premises PostgreSQL data source	Read/Write	Read	Read	Read	Read
On-premises SQL Server data source	Read/Write	-	Read	Read	-
On-premises Teradata data source	Read/Write	-	Read	Read	-
On-premises Phoenix data source	Write	-	-	-	-
PolarDB for MySQL data source	Read/Write	-	-	-	-
PolarDB for PostgreSQL data source	Read/Write	-	-	-	-
PostGIS data source	Read/Write	-	-	-	-
SFTP data source	Write	-	-	-	-
StarRocks data source	Read/Write	-	-	-	-
Tablestore data source	Read/Write	Write	Write	Write	-
TDDW data source	Read/Write	-	Read	-	-
TIDB data source	Read/Write	Write	-	-	-
EMR Presto data source	Read/Write	-	-	-	-
Trino data source	Read/Write	-	-	-	-
VVP data source	Write	-	-	-	-
	Read/Write	-	-	-	-
VPC ECS API data source	Read	-	-	-	-

DataWorks:Supported data sources and synchronization solutions

Synchronization solutions

Recommended synchronization solutions

1. Batch synchronization (T+1/periodic)

a. Batch synchronization for a single table

b. Batch synchronization for an entire database

2. Real-time synchronization (second-to-minute latency)

Real-time: single table vs. entire database

3. Real-time CDC to append-only destinations

Data source capabilities

Use cases

Related documentation