DataWorks のリアルタイムデータ同期機能は、ソースデータベースからターゲットデータベースへデータ変更をリアルタイムでレプリケートします。単一テーブルまたは全体のデータベースを同期でき、ターゲットデータベースをソースと常に整合させることが可能です。
コア機能
以下の図に、リアルタイム同期のコア機能を示します。
機能 | 説明 |
多様なデータソース間でのデータ同期 | リアルタイム同期は、幅広いデータソースをサポートしています。さまざまなソースおよびターゲットのデータソースを組み合わせて、同期パイプラインを構築できます。詳細については、「サポートされるデータソースと同期ソリューション」をご参照ください。 |
複雑なネットワーク環境におけるデータ同期 | リアルタイム同期は、Alibaba Cloud のデータベース、オンプレミス IDC、ECS 上の自己管理データベース、および他社クラウドプロバイダーのデータベースなど、さまざまな環境をサポートしています。開始前に、リソースグループとソース/ターゲットのエンドポイント間のネットワーク接続性が確保されていることを確認してください。設定の詳細については、「ネットワーク接続ソリューション」をご参照ください。 |
ユースケース | リアルタイム同期は、単一テーブル間の同期およびシャード化されたソースからの増分データを単一のターゲットテーブルへ同期する両方のユースケースをサポートしています。
|
リアルタイム同期タスクの構成 | リアルタイム同期タスクを構成する際には、以下の機能を活用して、コード不要で単一テーブルデータに対するリアルタイム ETL を実行できます。詳細については、「Data Integration におけるリアルタイム同期タスクの構成」をご参照ください。 単一テーブル向けリアルタイム同期:
|
リアルタイム同期タスクの運用・保守(O&M) | 同期タスクに対してモニタリングおよびアラートの構成が可能です。
|
DataStudio インターフェイスからはリアルタイム同期タスクを実行できません。リアルタイム同期タスクを保存・提出した後、本番環境のオペレーションセンターで実行する必要があります。
リアルタイム同期タスクでは、ビューの同期はサポートされていません。
サポートされるデータソース
DataStudio および Data Integration でサポートされるデータソースは一部重複しています。必要なデータソースタイプが Data Integration で利用可能な場合は、リアルタイム同期タスクの作成にそちらをご利用いただくことを推奨します。
Data Integration のすべてのソースおよびターゲットデータソースを任意に組み合わせることはできません。構成時の 同期タイプ オプションを参照し、サポートされる組み合わせをご確認ください。
Data Integration および DataStudio(新バージョン)
ソース:Kafka、Hologres、Oracle、LogHub、DataHub。
ターゲット:ApsaraDB for OceanBase、Data Lake Formation(DLF)、Doris、Hologres、Kafka、MaxCompute、Object Storage Service(OSS)、OSS-HDFS、StarRocks、Tablestore、Lindorm。
データ処理:データフィルタリング、文字列置換、データマスキング、JSON 解析、およびフィールドの編集・割り当て。
DataStudio(レガシ)
ソース:MySQL、DataHub、LogHub、Kafka、PolarDB。
ターゲット:MaxCompute、Hologres、AnalyticDB for MySQL 3.0、Elasticsearch、DataHub、Kafka。
データ処理:データフィルタリング、文字列置換、データマスキング。
クイックスタート
単一テーブル向けリアルタイム同期タスクを作成するには、「Data Integration におけるリアルタイム同期タスクの構成」および「DataStudio(レガシ)におけるリアルタイム同期タスクの構成」をご参照ください。
よくある質問
リアルタイム同期タスクに関するよくある質問については、「リアルタイム同期に関するよくある質問」をご参照ください。