すべてのプロダクト
Search
ドキュメントセンター

Data Transmission Service:PolarDB for MySQL クラスターから MaxCompute プロジェクトへのデータ同期

最終更新日:Nov 09, 2025

このトピックでは、Data Transmission Service (DTS) を使用して PolarDB for MySQL クラスターから MaxCompute プロジェクトにデータを同期する方法について説明します。

前提条件

制限事項

説明

DTS は、ソースデータベースからターゲットデータベースに外部キーを同期しません。 そのため、ソースデータベースでのカスケード操作と削除操作は、ターゲットデータベースに同期されません。

タイプ

説明

ソースデータベースの制限

  • 同期するテーブルにはプライマリキーまたは一意制約が必要で、フィールドは一意である必要があります。 そうでない場合、ターゲットデータベースに重複データが表示されることがあります。

  • テーブルレベルでデータを同期し、列名のマッピングなどのテーブル編集が必要な場合、単一のデータ同期タスクは最大 1,000 テーブルをサポートします。 この制限を超えると、タスクの送信時にエラーが報告されます。 この場合、テーブルを複数の同期タスクに分割するか、データベース全体を同期するタスクを設定します。

  • バイナリログ:

    • バイナリログを有効にし、loose_polar_log_bin パラメーターを ON に設定する必要があります。 そうしないと、事前チェック中にエラーが報告され、DTS インスタンスの起動に失敗します。 バイナリログの有効化とパラメーターの変更方法の詳細については、「バイナリログの有効化」および「クラスターとノードのパラメーター設定」をご参照ください。

      説明

      PolarDB for MySQL クラスターのバイナリログを有効にすると、ストレージ容量を消費し、料金が発生します。

    • PolarDB for MySQL クラスターのバイナリログは、少なくとも 3 日間保持する必要があります。 7 日間保持することをお勧めします。 そうしないと、DTS がバイナリログを取得できないため、DTS タスクが失敗する可能性があります。 極端な場合、これによりデータの不整合やデータ損失が発生する可能性があります。 必要な期間よりも短いバイナリログ保持期間に起因する問題は、DTS サービスレベルアグリーメント (SLA) の対象外です。

      説明

      PolarDB for MySQL クラスターのバイナリログの保持期間を設定する方法の詳細については、「保持期間の変更」をご参照ください。

  • 初期スキーマ同期および初期完全同期中は、データベースまたはテーブルのスキーマを変更する DDL 操作を実行しないでください。 そうしないと、データ同期タスクは失敗します。

その他の制限

  • ソース PolarDB for MySQL クラスターの読み取り専用ノードからデータを同期することはできません。

  • ソース PolarDB for MySQL クラスターから OSS 外部テーブルを同期することはできません。

  • INDEX、PARTITION、VIEW、PROCEDURE、FUNCTION、TRIGGER、および FK の同期はサポートされていません。

  • 初期完全同期中のデータベースインスタンスのプライマリ/セカンダリフェールオーバーはサポートされていません。 フェールオーバーが発生した場合は、同期タスクを速やかに再設定してください。

  • データを同期する前に、ソースデータベースとターゲットデータベースのパフォーマンスを評価してください。 オフピーク時にデータを同期することをお勧めします。 そうしないと、初期完全同期がソースデータベースとターゲットデータベースの読み取りおよび書き込みリソースを消費し、データベースの負荷が増加する可能性があります。

  • 初期完全同期は同時 INSERT 操作を実行するため、ターゲットデータベースのテーブルに断片化が発生します。 その結果、初期完全同期が完了した後、宛先インスタンスの表領域はソースインスタンスの表領域よりも大きくなります。

  • テーブルレベルのデータ同期の場合、pt-online-schema-change などのツールを使用してソースデータベースの同期オブジェクトに対してオンライン DDL 操作を実行しないでください。 そうしないと、同期は失敗します。

  • テーブルレベルのデータ同期の場合、DTS からのデータ以外のデータがターゲットデータベースに書き込まれない場合は、Data Management (DMS) を使用してオンライン DDL 操作を実行できます。 詳細については、「テーブルをロックせずにスキーマを変更する」をご参照ください。

  • DTS 同期中は、DTS からのデータ以外のデータをターゲットデータベースに書き込まないでください。 そうしないと、ソースデータベースとターゲットデータベースの間でデータの不整合が発生する可能性があります。 たとえば、他のデータがターゲットデータベースに書き込まれている間に DMS を使用してオンライン DDL 操作を実行すると、ターゲットデータベースでデータが失われる可能性があります。

  • MaxCompute はプライマリキー制約をサポートしていないため、ネットワークの問題やその他の理由で DTS がデータを再送信した場合、MaxCompute に重複レコードが表示されることがあります。

  • インスタンスが失敗した場合、DTS ヘルプデスクは 8 時間以内にインスタンスの回復を試みます。 回復プロセス中に、インスタンスの再起動やパラメーターの調整などの操作が実行される場合があります。

    説明

    パラメーターが調整されるとき、DTS インスタンスのパラメーターのみが変更されます。 データベースのパラメーターは変更されません。 変更される可能性のあるパラメーターには、インスタンスパラメーターの変更で説明されているものが含まれますが、これらに限定されません。

その他の注意事項

DTS は、バイナリログのオフセットを進めるために、ソースデータベースで CREATE DATABASE IF NOT EXISTS `test` コマンドを定期的に実行します。

課金

同期タイプタスク設定料金
スキーマ同期と完全データ同期無料。
増分データ同期有料。 詳細については、「課金の概要」をご参照ください。

サポートされている同期トポロジ

  • 一方向 1 対 1 同期

  • 一方向 1 対多同期

  • 一方向カスケード同期

  • 一方向多対 1 同期

DTS がサポートする同期トポロジの詳細については、「同期トポロジ」をご参照ください。

同期可能な SQL 操作

操作タイプ

SQL 文

DML

INSERT、UPDATE、DELETE

DDL

ADD COLUMN

説明

属性列を含む ADD COLUMN 操作は同期できません。

同期プロセス

  1. 初期スキーマ同期。

    DTS は、必要なオブジェクトのスキーマをソースデータベースから MaxCompute に同期します。 初期スキーマ同期中、DTS はソーステーブル名の末尾に _base サフィックスを追加します。 たとえば、ソーステーブルの名前が customer の場合、MaxCompute のテーブル名は customer_base になります。

  2. 初期完全同期。

    DTS は、テーブルの既存データをソースデータベースから MaxCompute の宛先テーブルに同期します。 たとえば、ソースデータベースの customer テーブルは、MaxCompute の customer_base テーブルに同期されます。 このデータは、後続の増分同期の基礎となります。

    説明

    _base が付加された宛先テーブルは、完全ベースラインテーブルとして知られています。

  3. 増分データ同期。

    DTS は MaxCompute に増分データテーブルを作成します。 増分データテーブルの名前には、customer_log のように _log サフィックスが付きます。 次に、DTS はソースデータベースで生成された増分データを増分データテーブルに同期します。

    説明

    増分データテーブルの構造の詳細については、「増分データテーブルの構造」をご参照ください。

手順

  1. 次のいずれかの方法でデータ同期ページに移動し、データ同期インスタンスが存在するリージョンを選択します。

    DTS コンソール

    1. DTS コンソールにログインします。

    2. 左側のナビゲーションウィンドウで、データ同期 をクリックします。

    3. ページ左上で、データ同期タスクが存在するリージョンを選択します。

    DMS コンソール

    説明

    実際の操作は、DMS コンソールのモードとレイアウトによって異なる場合があります。 詳細については、「シンプルモード」および「DMS コンソールのレイアウトとスタイルのカスタマイズ」をご参照ください。

    1. DMS コンソールにログインします。

    2. 上部のナビゲーションバーで、[データ + AI] にポインターを合わせ、DTS (DTS) > データ同期 を選択します。

    3. データ同期タスク の右側にあるドロップダウンリストから、データ同期インスタンスが存在するリージョンを選択します。

  2. タスクの作成 をクリックして、タスク設定ページに移動します。

  3. ソースデータベースとターゲットデータベースを設定します。 次の表にパラメーターを示します。

    セクション

    パラメーター

    説明

    N/A

    タスク名

    DTS タスクの名前。 DTS はタスク名を自動的に生成します。 タスクを簡単に識別できるわかりやすい名前を指定することをお勧めします。 一意のタスク名を指定する必要はありません。

    ソースデータベース

    既存の接続情報の選択

    • DTS に登録されているデータベースインスタンスを使用する場合は、ドロップダウンリストからインスタンスを選択します。 DTS は、インスタンスの次のデータベースパラメーターを自動的に入力します。 詳細については、「データベース接続の管理」をご参照ください。

      説明

      DMS コンソールでは、[DMS データベースインスタンスの選択] ドロップダウンリストからデータベースインスタンスを選択できます。

    • DTS へのインスタンスの登録に失敗した場合、または DTS に登録されているインスタンスを使用する必要がない場合は、次のデータベース情報を設定する必要があります。

    データベースタイプ

    PolarDB for MySQL を選択します。

    アクセス方法

    Alibaba Cloud インスタンス を選択します。

    インスタンスリージョン

    ソース PolarDB for MySQL クラスターが存在するリージョン。

    Alibaba Cloudアカウント全体でのデータの複製

    この例では、データは同じ Alibaba Cloud アカウント内で同期されます。 いいえ を選択します。

    PolarDB クラスター ID

    ソース PolarDB for MySQL クラスターの ID。

    データベースアカウント

    ソース PolarDB for MySQL クラスターのデータベースアカウント。 このアカウントには、同期するオブジェクトに対する読み取り権限が必要です。

    データベースパスワード

    データベースへのアクセスに使用するパスワード。

    暗号化

    ソース PolarDB for MySQL クラスターへの接続を暗号化するかどうかを指定します。 このパラメーターは、ビジネス要件に基づいて設定できます。 SSL 暗号化機能の詳細については、「SSL 暗号化の設定」をご参照ください。

    宛先データベース

    既存の接続情報の選択

    • DTS に登録されているデータベースインスタンスを使用する場合は、ドロップダウンリストからインスタンスを選択します。 DTS は、インスタンスの次のデータベースパラメーターを自動的に入力します。 詳細については、「データベース接続の管理」をご参照ください。

      説明

      DMS コンソールでは、[DMS データベースインスタンスの選択] ドロップダウンリストからデータベースインスタンスを選択できます。

    • DTS へのインスタンスの登録に失敗した場合、または DTS に登録されているインスタンスを使用する必要がない場合は、次のデータベース情報を設定する必要があります。

    データベースタイプ

    MaxCompute を選択します。

    アクセス方法

    Alibaba Cloud インスタンス を選択します。

    インスタンスリージョン

    宛先の MaxCompute プロジェクトが存在するリージョン。

    プロジェクト

    MaxCompute プロジェクトの名前。

    Alibaba Cloud アカウントの AccessKey ID

    前提条件で準備した AccessKey ペアを入力します。

    Alibaba Cloud アカウントの AccessKey Secret

  4. ページ下部で、接続をテストして続行 をクリックします。

    説明

    DTS サーバーからのアクセスを許可するために、DTS サーバーの CIDR ブロックがソースデータベースとターゲットデータベースのセキュリティ設定に自動または手動で追加できることを確認してください。 詳細については、「ホワイトリストに DTS サーバーの IP アドレスを追加する」をご参照ください。

  5. [OK] をクリックして ODPS アカウントの権限付与を完了し、接続をテストして続行 をクリックします。

  6. 同期するオブジェクトを設定します。

    1. オブジェクト設定 ステップで、同期するオブジェクトを設定します。

      パラメーター

      説明

      同期タイプ

      同期タイプ。 デフォルトでは、増分データ同期 が選択されています。 スキーマ同期完全データ同期 も選択する必要があります。 事前チェックが完了すると、DTS は選択したオブジェクトの既存データをソースデータベースから宛先クラスターに同期します。 既存データは、後続の増分同期の基礎となります。

      追加列の命名規則

      DTS が MaxCompute にデータを同期した後、DTS は宛先テーブルに追加列を追加します。 追加列の名前が宛先テーブルの既存の列の名前と同じ場合、データ同期は失敗します。 ビジネス要件に基づいて 新規ルール または 前のルール を選択します。

      警告

      このパラメーターを指定する前に、宛先テーブルの追加列と既存の列に名前の競合がないか確認してください。 そうしないと、タスクが失敗したり、データが失われたりする可能性があります。 追加列のルールと定義の詳細については、「追加列の命名規則」をご参照ください。

      増分データテーブルのパーティション定義

      ビジネス要件に基づいてパーティション名を選択します。 パーティションの詳細については、「パーティション」をご参照ください。

      競合するテーブルの処理モード

      • エラーの事前チェックと報告: ターゲットデータベースにソースデータベースのテーブルと同じ名前のテーブルが含まれているかどうかをチェックします。 ソースデータベースとターゲットデータベースに同じテーブル名のテーブルが含まれていない場合、事前チェックは合格します。 それ以外の場合、事前チェック中にエラーが返され、データ同期タスクを開始できません。

        説明

        ソースデータベースとターゲットデータベースに同じ名前のテーブルが含まれており、ターゲットデータベースのテーブルを削除または名前変更できない場合は、オブジェクト名マッピング機能を使用して、ターゲットデータベースに同期されるテーブルの名前を変更できます。 詳細については、「オブジェクト名のマッピング」をご参照ください。

      • エラーを無視して続行: ソースデータベースとターゲットデータベースの同じテーブル名の事前チェックをスキップします。

        警告

        エラーを無視して続行 を選択すると、データの不整合が発生し、ビジネスに潜在的なリスクが生じる可能性があります。

        • ソースデータベースとターゲットデータベースのスキーマが同じで、ターゲットデータベースのデータレコードがソースデータベースのデータレコードと同じプライマリキー値または一意キー値を持つ場合:

          • 完全データ同期中、DTS はデータレコードをターゲットデータベースに同期しません。 ターゲットデータベースの既存のデータレコードは保持されます。

          • 増分データ同期中、DTS はデータレコードをターゲットデータベースに同期します。 ターゲットデータベースの既存のデータレコードは上書きされます。

        • ソースデータベースとターゲットデータベースのスキーマが異なる場合、データの初期化に失敗することがあります。 この場合、一部の列のみが同期されるか、データ同期インスタンスが失敗します。 慎重に進めてください。

      移行先インスタンスでのオブジェクト名の大文字化

      宛先インスタンスのデータベース名、テーブル名、列名の大文字/小文字。 デフォルトでは、DTS デフォルトポリシー が選択されています。 他のオプションを選択して、オブジェクト名の大文字/小文字がソースまたはターゲットデータベースのものと一致するようにすることができます。 詳細については、「宛先インスタンスのオブジェクト名の大文字/小文字を指定する」をご参照ください。

      ソースオブジェクト

      ソースオブジェクト セクションから 1 つ以上のオブジェクトを選択し、向右 アイコンをクリックしてオブジェクトを 選択中のオブジェクト セクションに追加します。

      説明

      同期するオブジェクトとしてテーブルを選択できます。

      選択中のオブジェクト

      • 宛先インスタンスに同期するオブジェクトの名前を変更するには、選択中のオブジェクト セクションでオブジェクトを右クリックします。 詳細については、「オブジェクト名のマッピング」トピックの「単一オブジェクトの名前をマッピングする」セクションをご参照ください。

      • 一度に複数のオブジェクトの名前を変更するには、選択中のオブジェクト セクションの右上隅にある 一括編集 をクリックします。 詳細については、「オブジェクト名のマッピング」トピックの「一度に複数のオブジェクト名をマッピングする」セクションをご参照ください。

    2. 次へ:詳細設定 をクリックして詳細設定を構成します。

      パラメーター

      説明

      タスクのスケジュールに使用する専用クラスターの選択

      専用クラスターを指定しない場合、DTS はデフォルトでタスクを共有クラスターにスケジュールします。 データ同期インスタンスの安定性を向上させたい場合は、専用クラスターを購入してください。 詳細については、「DTS 専用クラスターとは」をご参照ください。

      失敗した接続の再試行時間

      接続失敗時のリトライ時間範囲。 データ同期タスクの開始後にソースまたはターゲットデータベースへの接続に失敗した場合、DTS は時間範囲内で直ちに接続をリトライします。 有効値: 10~1440。 単位: 分。 デフォルト値: 720。 このパラメーターを 30 より大きい値に設定することをお勧めします。 指定された時間範囲内に DTS がソースおよびターゲットデータベースに再接続すると、DTS はデータ同期タスクを再開します。 そうしないと、データ同期タスクは失敗します。

      説明
      • 同じソースまたはターゲットデータベースを持つ複数のデータ同期タスクに異なるリトライ時間範囲を指定した場合、最も短いリトライ時間範囲が優先されます。

      • DTS が接続をリトライすると、DTS インスタンスに対して課金されます。 ビジネス要件に基づいてリトライ時間範囲を指定することをお勧めします。 ソースインスタンスと宛先インスタンスがリリースされた後、できるだけ早く DTS インスタンスをリリースすることもできます。

      移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。

      その他の問題のリトライ時間範囲。 たとえば、データ同期タスクの開始後に DDL または DML 操作が失敗した場合、DTS は時間範囲内で直ちに操作をリトライします。 有効値: 1~1440。 単位: 分。 デフォルト値: 10。 このパラメーターを 10 より大きい値に設定することをお勧めします。 指定された時間範囲内に失敗した操作が正常に実行されると、DTS はデータ同期タスクを再開します。 そうしないと、データ同期タスクは失敗します。

      重要

      移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。 パラメーターの値は、失敗した接続の再試行時間 パラメーターの値より小さくする必要があります。

      完全同期レートを制限するかどうか

      完全データ同期中、DTS はソースデータベースとターゲットデータベースの読み取りおよび書き込みリソースを使用します。 これにより、データベースサーバーの負荷が増加する可能性があります。 完全データ同期タスクに対して 1 秒あたりのソースデータベースのクエリ率 QPS1 秒あたりの完全移行の行数 RPS、および 1 秒あたりの完全移行データ量 (MB) BPS パラメーターを設定して、ターゲットデータベースサーバーの負荷を軽減できます。

      説明

      このパラメーターは、完全データ同期同期タイプ パラメーターで選択されている場合にのみ設定できます。

      増分同期率を制限するかどうか

      増分データ同期のスロットリングを有効にするかどうかを指定します。 ビジネス要件に基づいて、増分データ同期のスロットリングを有効にできます。 スロットリングを設定するには、1 秒あたりの増分同期の行数 RPS および 1 秒あたりの増分同期データ量 (MB) BPS パラメーターを設定する必要があります。 これにより、ターゲットデータベースサーバーの負荷が軽減されます。

      順方向および逆方向タスクのハートビートテーブル SQL を削除

      DTS インスタンスの実行中に、ハートビートテーブルに対する SQL 操作をソースデータベースに書き込むかどうかを指定します。 有効値:

      • はい: ハートビートテーブルに対する SQL 操作を書き込みません。 この場合、DTS インスタンスの遅延が表示されることがあります。

      • いいえ: ハートビートテーブルに対する SQL 操作を書き込みます。 この場合、ソースデータベースの物理バックアップやクローンなどの機能が影響を受ける可能性があります。

      環境タグ

      DTS インスタンスを識別するために使用される環境タグ。 ビジネス要件に基づいて環境タグを選択できます。 この例では、環境タグは選択されていません。

      ETL の設定

      抽出、変換、書き出し (ETL) 機能を有効にするかどうかを指定します。 詳細については、「ETL とは」をご参照ください。 有効値:

      監視アラート

      データ同期インスタンスのアラートを設定するかどうかを指定します。 タスクが失敗した場合、または同期遅延が指定されたしきい値を超えた場合、アラート連絡先は通知を受け取ります。 有効値:

      • いいえ: アラートを有効にしません。

      • はい: アラートを設定します。 この場合、アラートのしきい値と アラート通知設定 も設定する必要があります。 詳細については、「モニタリングとアラートの設定」トピックの「DTS タスク作成時のモニタリングとアラートの設定」セクションをご参照ください。

  7. タスク設定を保存し、事前チェックを実行します。

    • 関連する API 操作を呼び出して DTS タスクを設定する際に指定するパラメーターを表示するには、次:タスク設定の保存と事前チェック にポインターを合わせ、OpenAPI パラメーターのプレビュー をクリックします。

    • パラメーターを表示する必要がない場合、または表示済みの場合は、ページ下部の 次:タスク設定の保存と事前チェック をクリックします。

    説明
    • データ同期タスクを開始する前に、DTS は事前チェックを実行します。 タスクが事前チェックに合格した後にのみ、データ同期タスクを開始できます。

    • データ同期タスクが事前チェックに失敗した場合は、失敗した各項目の横にある [詳細の表示] をクリックします。 チェック結果に基づいて原因を分析した後、問題をトラブルシューティングします。 その後、事前チェックを再実行します。

    • 事前チェック中に項目のアラートがトリガーされた場合:

      • アラート項目を無視できない場合は、失敗した項目の横にある [詳細の表示] をクリックして問題をトラブルシューティングします。 その後、再度事前チェックを実行します。

      • アラート項目を無視できる場合は、[アラート詳細の確認] をクリックします。 [詳細の表示] ダイアログボックスで、[無視] をクリックします。 表示されるメッセージで、[OK] をクリックします。 次に、[再度事前チェック] をクリックして再度事前チェックを実行します。 アラート項目を無視すると、データの不整合が発生し、ビジネスに潜在的なリスクが生じる可能性があります。

  8. インスタンスを購入します。

    1. [成功率]100% になるまで待ちます。 次に、[次へ: インスタンスの購入] をクリックします。

    2. [購入] ページで、データ同期タスクの課金方法とインスタンスクラスのパラメーターを設定します。 次の表にパラメーターを示します。

      セクション

      パラメーター

      説明

      新しいインスタンスクラス

      課金方法

      • サブスクリプション: データ同期インスタンスを作成するときにサブスクリプションの料金を支払います。 サブスクリプション課金方法は、長期利用の場合、従量課金方法よりも費用対効果が高くなります。

      • 従量課金: 従量課金インスタンスは時間単位で課金されます。 従量課金方法は短期利用に適しています。 従量課金のデータ同期インスタンスが不要になった場合は、インスタンスをリリースしてコストを削減できます。

      リソースグループの設定

      データ同期インスタンスが属するリソースグループ。 デフォルト値: デフォルトのリソースグループ。 詳細については、「Resource Management とは」をご参照ください。

      インスタンスクラス

      DTS は、同期速度が異なるインスタンスクラスを提供します。 ビジネス要件に基づいてインスタンスクラスを選択できます。 詳細については、「データ同期インスタンスのインスタンスクラス」をご参照ください。

      サブスクリプション期間

      サブスクリプション課金方法を選択した場合は、サブスクリプション期間と作成するデータ同期インスタンスの数を指定します。 サブスクリプション期間は、1~9 か月、1 年、2 年、3 年、または 5 年です。

      説明

      このパラメーターは、サブスクリプション 課金方法を選択した場合にのみ使用できます。

    3. [データ伝送サービス (従量課金) 利用規約] を読み、選択します。

    4. [購入して開始] をクリックします。 表示されるダイアログボックスで、OK をクリックします。

      タスクの進行状況はタスクリストで確認できます。

増分データテーブルの構造