このトピックでは、Data Transmission Service (DTS) を使用して PolarDB for MySQL クラスターから AnalyticDB for PostgreSQL インスタンスへデータを同期する方法について説明します。
前提条件
宛先の AnalyticDB for PostgreSQL インスタンスが作成済みである必要があります。また、宛先インスタンスの空きストレージ容量は、ソースの PolarDB for MySQL クラスターで使用されているストレージ容量よりも大きくなければなりません。詳細については、「インスタンスの作成」をご参照ください。
移行先の AnalyticDB for PostgreSQL インスタンスに、同期されたデータを格納するためのデータベースが作成されます。詳細については、「CREATE DATABASE」をご参照ください。
注意事項
種別 | 説明 |
ソースデータベースの制限 |
|
その他の制限 |
|
その他の注意点 | DTS は、バイナリログオフセットを進めるために、ソースデータベース上で定期的に CREATE DATABASE IF NOT EXISTS `test` コマンドを実行します。 |
課金
同期タイプ | 料金 |
スキーマ同期および初期完全データ同期 | 無料です。 |
増分データ同期 | 課金対象です。詳細については、「課金概要」をご参照ください。 |
増分同期をサポートする SQL 操作
操作タイプ | SQL 文 |
DML | INSERT、UPDATE、DELETE 説明 データを宛先の AnalyticDB for PostgreSQL インスタンスに書き込む際、DTS は自動的に UPDATE 文を REPLACE INTO 文に変換します。プライマリキーに対して UPDATE 文が実行された場合、DTS はそれを DELETE 文および INSERT 文に変換します。 |
DDL | CREATE TABLE、ALTER TABLE、TRUNCATE TABLE、DROP TABLE |
データベースアカウントに必要な権限
データベース | 必要な権限 | アカウント作成および権限付与方法 |
ソースの PolarDB for MySQL クラスター | 同期対象オブジェクトに対する読み取り・書き込み権限 | |
宛先の AnalyticDB for PostgreSQL インスタンス | 宛先データベースに対する読み取り・書き込み権限 | 「ユーザーの作成および管理」および「ユーザー権限の管理」をご参照ください。 説明 初期アカウントまたは RDS_SUPERUSER 権限を持つアカウントを使用することもできます。 |
操作手順
-
[データ同期タスク] ページに移動します。
-
Data Management (DMS) コンソール にログインします。
-
上部ナビゲーションバーで、[データ + AI] をクリックします。
-
左側ナビゲーションウィンドウで、 を選択します。
説明-
DMS コンソールのモードおよびレイアウトによって操作が異なる場合があります。詳細については、「シンプルモードコンソール」および「DMS コンソールのレイアウトおよびスタイルのカスタマイズ」をご参照ください。
-
新しい DTS コンソールの [データ同期タスク] ページ に直接アクセスすることもできます。
-
タスクの作成 をクリックして、タスク設定ページを開きます。
ソースおよび宛先データベースを設定します。
カテゴリ
設定項目
説明
該当なし
タスク名
DTS が自動的にタスク名を生成します。識別しやすいように、わかりやすい名前を指定することを推奨します。タスク名は一意である必要はありません。
移行元データベース
既存の接続情報の選択
システムに追加済み(新規作成または保存済み)のデータベースインスタンスを使用する場合、ドロップダウンリストからデータベースインスタンスを選択します。データベース情報は自動的に設定されます。
説明DMS コンソールでは、この設定項目の名称は DMS データベースインスタンスの選択 です。
データベースインスタンスをシステムに追加していない場合、または追加済みのインスタンスを使用しない場合は、以下のデータベース情報を手動で設定します。
データベースタイプ
PolarDB for MySQL を選択します。
アクセス方法
Alibaba Cloud インスタンス を選択します。
インスタンスのリージョン
ソースの PolarDB for MySQL クラスターが配置されているリージョンを選択します。
Alibaba Cloud アカウント間でデータを複製
この例では、現在の Alibaba Cloud アカウントに属するデータベースインスタンスを使用します。× を選択します。
PolarDB クラスター ID
ソースの PolarDB for MySQL クラスターの ID を選択します。
データベースアカウント
ソースの PolarDB for MySQL クラスターのデータベースアカウントを入力します。必要な権限の詳細については、「データベースアカウントに必要な権限」をご参照ください。
データベースのパスワード
データベースアカウントに対応するパスワードを入力します。
移行先データベース
既存の接続情報の選択
システムに追加済み(新規作成または保存済み)のデータベースインスタンスを使用する場合、ドロップダウンリストからデータベースインスタンスを選択します。データベース情報は自動的に設定されます。
説明DMS コンソールでは、この設定項目の名称は DMS データベースインスタンスの選択 です。
データベースインスタンスをシステムに追加していない場合、または追加済みのインスタンスを使用しない場合は、以下のデータベース情報を手動で設定します。
データベースタイプ
AnalyticDB for PostgreSQL を選択します。
アクセス方法
Alibaba Cloud インスタンス を選択します。
インスタンスのリージョン
宛先の AnalyticDB for PostgreSQL インスタンスが配置されているリージョンを選択します。
インスタンス ID
宛先の AnalyticDB for PostgreSQL インスタンスの ID を選択します。
データベース名
宛先の AnalyticDB for PostgreSQL インスタンスでデータを受信するために使用するデータベースの名前を入力します。
データベースアカウント
宛先の AnalyticDB for PostgreSQL インスタンスのデータベースアカウントを入力します。必要な権限の詳細については、「データベースアカウントに必要な権限」をご参照ください。
データベースのパスワード
データベースアカウントに対応するパスワードを入力します。
設定を完了したら、ページ下部の 接続をテストして続行 をクリックします。
説明DTS サーバーからのアクセスを許可するために、ソースおよび宛先データベースのセキュリティ設定に DTS サーバーの IP アドレス CIDR ブロックを追加する必要があります。この設定は自動または手動で行えます。詳細については、「DTS サーバーの IP アドレス CIDR ブロックをホワイトリストに追加する」をご参照ください。
タスクオブジェクトを設定します。
オブジェクト設定 ページで、同期するオブジェクトを設定します。
設定項目
説明
同期タイプ
増分データ同期 が選択されています。デフォルトでは、スキーマ同期 および 完全データ同期 も選択する必要があります。事前チェック完了後、DTS は選択したオブジェクトをソースインスタンスから宛先クラスターに初期完全同期し、その後の増分データ同期のベースラインデータとします。
同期する DDL および DML 操作
インスタンスレベルで同期する DDL または DML 操作を選択できます。サポートされる操作の詳細については、「増分同期をサポートする SQL 操作」をご参照ください。
説明データベースまたはテーブルごとに同期する SQL 操作を選択するには、選択中のオブジェクト ボックス内の同期オブジェクトを右クリックします。表示されるダイアログボックスで、SQL 操作を選択してください。
競合するテーブルの処理モード
エラーの事前チェックと報告:宛先データベースに同名のテーブルが存在するかどうかをチェックします。同名のテーブルが存在しない場合、事前チェックは合格します。同名のテーブルが存在する場合、事前チェックは失敗し、データ同期タスクは開始されません。
説明宛先データベースで同名のテーブルを削除または名前変更できない場合は、別のテーブル名にマッピングできます。詳細については、「テーブル名および列名のマッピング」をご参照ください。
エラーを無視して続行:宛先データベースでの重複テーブル名のチェックをスキップします。
警告エラーを無視して続行 を選択すると、データ不整合が発生し、ビジネスにリスクをもたらす可能性があります。例えば:
テーブルスキーマが同一で、宛先データベースのレコードがソースデータベースのレコードと同じプライマリキーまたは一意キー値を持つ場合:
初期完全同期中は、DTS が宛先クラスター内のレコードを保持し、ソースデータベースの対応レコードは同期されません。
増分同期中は、ソースデータベースのレコードが宛先データベースのレコードを上書きします。
テーブルスキーマが異なる場合、初期データ同期が失敗し、一部の列データのみが同期されるか、完全に同期が失敗する可能性があります。慎重に操作してください。
ストレージエンジンタイプ
宛先テーブルのストレージエンジンタイプを選択します。デフォルトは Beam です。
説明この設定項目は、ターゲットの AnalyticDB for PostgreSQL インスタンスのカーネルバージョンが v7.0.6.6 以降であり、かつ 同期タイプ が スキーマ同期 に設定されている場合にのみ利用可能です。
移行先インスタンスでのオブジェクト名の大文字化
宛先インスタンスに同期されるデータベース、テーブル、列オブジェクト名の大文字・小文字の扱いポリシーを設定できます。デフォルトでは、DTS のデフォルトポリシー が選択されています。ソースおよび宛先データベースのデフォルトポリシーを使用することもできます。詳細については、「宛先オブジェクト名の大文字・小文字の扱いポリシー」をご参照ください。
ソースオブジェクト
ソースオブジェクト ボックスで同期するオブジェクトをクリックし、
をクリックして 選択中のオブジェクト ボックスに移動させます。説明同期オブジェクトとしてデータベースまたはテーブルを選択できます。
選択中のオブジェクト
宛先インスタンスで単一の同期オブジェクトの名前を変更するには、選択中のオブジェクト ボックス内のオブジェクトを右クリックします。オブジェクト名の変更方法の詳細については、「単一のデータベース、テーブル、または列のマッピング」をご参照ください。
宛先インスタンスで複数の同期オブジェクトの名前を一括で変更するには、選択中のオブジェクト ボックスの右上隅にある 一括編集 をクリックします。詳細については、「データベース、テーブル、および列の一括マッピング」をご参照ください。
説明同期するテーブルのデータをフィルターするには、選択中のオブジェクト セクション内のテーブルを右クリックします。表示されるダイアログボックスで、フィルター条件を設定してください。詳細については、「フィルター条件の設定」をご参照ください。
特定のデータベースまたはテーブルに対して同期する SQL 操作を選択するには、選択中のオブジェクト セクション内のオブジェクトを右クリックします。表示されるダイアログボックスで、同期する SQL 操作を選択してください。詳細については、「増分同期をサポートする SQL 操作」をご参照ください。
オブジェクト名マッピング機能を使用してオブジェクトの名前を変更すると、他の依存オブジェクトの同期が失敗する可能性があります。
詳細設定へ をクリックして、詳細パラメーターを設定します。
設定項目
説明
タスクのスケジュールに使用する専用クラスターの選択
デフォルトでは、DTS は共有クラスター上でタスクをスケジューリングするため、クラスターを選択する必要はありません。より安定したパフォーマンスを求める場合は、DTS 同期タスクを実行するための専用クラスターを購入できます。詳細については、「DTS 専用クラスターとは」をご参照ください。
移行元テーブルで生成された Online DDL ツールの一時テーブルを移行先データベースにコピーします。
ソースデータベースで Data Management (DMS) または gh-ost を使用してオンライン DDL 変更を実行する場合、オンライン DDL 変更で生成された一時テーブルのデータを同期するかどうかを選択できます。
重要DTS タスクは、pt-online-schema-change などのツールを使用したオンライン DDL 変更をサポートしていません。これらのツールを使用すると、DTS タスクが失敗します。
各ステージの処理方法は次のとおりです。スキーマ同期 および 完全データ同期 ステージでは、データベースまたはテーブルスキーマを変更する DDL 操作が許可されていないため、これらのステージはオンライン DDL ポリシーの制御を受けません。
スキーマ同期:このステージはオンライン DDL ポリシーの制御を受けません。関連する一時テーブルが作成されます。
完全データ同期: このステージは、オンラインDDLポリシーによって制御されません。一時テーブルは完全同期の対象に含まれません。名前が正規表現 (
^_(.+)_(?:gho|new)$または^_(.+)_(?:ghc|del|old)$) に一致するすべてのテーブルは除外されます。増分データ同期:このステージはオンライン DDL ポリシーの制御を受けます。
○:オンライン DDL 操作で生成された一時テーブル(例:
_table-name_gho)のデータ変更を同期します。いいえ、DMS オンライン DDL に適応 および いいえ、gh-ost に適応:gh-ost などのツールで生成された一時テーブル(例:
_table-name_gho)のデータ変更を正規表現ルールに基づいてフィルターで除外します。
○:オンライン DDL 変更で生成された一時テーブルデータを同期します。
説明オンライン DDL 変更で生成された一時テーブルデータが非常に大きい場合、同期遅延が発生する可能性があります。
いいえ、DMS オンライン DDL に適応:オンライン DDL 操作で生成された一時テーブルからのデータを同期しません。ソースデータベースで Data Management (DMS) を使用して実行された元の DDL 文のみを同期します。
説明このオプションを選択すると、宛先データベースのテーブルがロックされます。
いいえ、gh-ost に適応:オンライン DDL 変更で生成された一時テーブルからのデータを同期しません。カスタムフィルタールールをサポートしています。DTS は、gh-ost などのツールで生成された一時テーブル(例:
_table-name_gho)のデータ変更を正規表現ルールに基づいてフィルターで除外します。必要に応じて、シャドウテーブルおよび不要なテーブルに一致させるデフォルトの正規表現を変更できます。シャドウテーブル:
^_(.+)_(?:gho|new)$不要なテーブル:
^_(.+)_(?:ghc|del|old)$
説明このオプションを選択すると、宛先データベースのテーブルがロックされます。
失敗した接続の再試行時間
同期タスク開始後、ソースまたは宛先データベースへの接続が失敗した場合、DTS はエラーを報告し、直ちに接続のリトライを開始します。デフォルトリトライ時間は 720 分です。10 ~ 1,440 分の範囲でカスタムリトライ時間を指定することもできます。30 分以上に設定することを推奨します。指定時間内に DTS がデータベースに正常に再接続できた場合、同期タスクは自動的に再開されます。そうでない場合、タスクは失敗します。
説明同じソースまたは宛先を共有する複数の DTS インスタンス(例:インスタンス A およびインスタンス B)があり、インスタンス A のネットワークリトライ時間を 30 分、インスタンス B を 60 分に設定した場合、両方のインスタンスでより短い 30 分が使用されます。
DTS は接続リトライ期間中もタスク実行時間に対して課金されるため、ビジネスニーズに基づいてリトライ時間をカスタマイズするか、ソースおよび宛先データベースインスタンスをリリースした後は速やかに DTS インスタンスをリリースすることを推奨します。
移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。
同期タスク開始後、ソースまたは宛先データベースで接続以外の問題(DDL または DML 実行例外など)が発生した場合、DTS はエラーを報告し、直ちに継続的なリトライ操作を開始します。デフォルトリトライ時間は 10 分です。1 ~ 1,440 分の範囲でカスタムリトライ時間を指定することもできます。10 分以上に設定することを推奨します。設定されたリトライ時間内に該当操作が成功した場合、同期タスクは自動的に再開されます。そうでない場合、タスクは失敗します。
重要移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。 の値は、失敗した接続の再試行時間 の値より小さくする必要があります。
完全同期レートを制限するかどうか
初期完全同期ステージ中、DTS はソースおよび宛先データベースの読み取り・書き込みリソースを消費するため、データベース負荷が増大します。ソースおよび宛先データベースの負荷を軽減するために、1 秒あたりのソースデータベースのクエリ率 QPS、1 秒あたりの完全移行の行数 RPS、および 1 秒あたりの完全移行データ量 (MB) BPS パラメーターを設定して、初期完全同期タスクのレート制限を設定できます。
説明この設定項目は、同期タイプ が 完全データ同期 に設定されている場合にのみ利用可能です。
同期インスタンスの実行後も、初期完全同期レートを調整 できます。
増分同期率を制限するかどうか
増分同期タスクのレート制限を設定することもできます。宛先データベースの負荷を軽減するために、1 秒あたりの増分同期の行数 RPS および 1 秒あたりの増分同期データ量 (MB) BPS を設定してください。
環境タグ
ビジネスニーズに基づいてインスタンスを識別するために、環境タグを選択できます。この例では、タグを選択する必要はありません。
順方向および逆方向タスクのハートビートテーブル SQL を削除
DTS インスタンス実行中に、ソースデータベースにハートビート SQL 情報を書き込むかどうかを選択します。
○:ハートビート SQL 情報はソースデータベースに書き込まれません。これにより、DTS インスタンスが遅延を報告する可能性があります。
×:ハートビート SQL 情報をソースデータベースに書き込みます。これにより、ソースデータベースの物理バックアップやクローンなどの機能に干渉する可能性があります。
ETL 機能の設定
抽出・変換・書き出し (ETL) 機能を有効化するかどうかを選択します。詳細については、「ETL とは」をご参照ください。有効値:
-
○:ETL 機能を有効化します。コードエディタにデータ処理文を入力してください。詳細については、「データ移行またはデータ同期タスクでの ETL の設定」をご参照ください。
-
×:ETL 機能を無効化します。
監視アラート
アラートを設定するかどうかを指定します。同期が失敗した場合、または遅延が指定されたしきい値を超えた場合、アラート連絡先に通知が送信されます。
×:アラートは設定されません。
○:アラートしきい値を設定し、アラート通知 を指定してアラートを設定します。詳細については、「タスク設定中のモニタリングおよびアラートの設定」をご参照ください。
[次へ:データ検証] をクリックして、データ検証タスクを設定します。
データ検証機能を使用する場合は、「データ検証の設定」を参照して設定手順をご確認ください。
オプション: 上記の設定を完了した後、次:データベースおよびテーブルのフィールド設定 をクリックして、宛先の AnalyticDB for PostgreSQL インスタンスに同期するテーブルの タイプ、プライマリキー列の追加、および 配布キー を設定できます。
タスクを保存して事前チェックを実行します。
このインスタンスを設定するための API パラメーターを表示するには、次:タスク設定の保存と事前チェック ボタンにカーソルを合わせ、表示されるバルーン内の OpenAPI パラメーターのプレビュー をクリックします。
API パラメーターの確認が完了したら、ページ下部の 次:タスク設定の保存と事前チェック をクリックします。
説明同期ジョブ開始前に、DTS は事前チェックを実行します。すべての事前チェック項目が合格した場合にのみ、ジョブを開始できます。
事前チェックが失敗した場合、失敗した項目の横にある 詳細を表示 をクリックします。表示される指示に従って問題を修正し、再度事前チェックを実行してください。
事前チェックで警告が返された場合:
チェック項目が失敗し、無視できない場合は、項目の横にある 詳細を表示 をクリックします。指示に従って問題を修正し、再度事前チェックを実行してください。
無視可能なチェック項目については、アラートの詳細を確認、無視、OK、および 再度事前チェックを実行 を順にクリックして警告をスキップし、事前チェックを再実行できます。警告項目を非表示にすると、データ不整合などの問題が発生し、ビジネスにリスクをもたらす可能性があります。
成功率 が 100% になったら、次:インスタンスの購入 をクリックします。
データ同期インスタンスを購入します。
購入 ページで、データ同期インスタンスの課金方法およびリンク仕様を選択します。以下の表でこれらのパラメーターについて詳しく説明します。
カテゴリ
パラメーター
説明
新しいインスタンスクラス
課金方法
サブスクリプション:インスタンス作成時に支払いが発生します。長期的なニーズに適しており、従量課金よりもコスト効率が高くなります。サブスクリプション期間が長いほど、割引率が高くなります。
従量課金:1 時間単位で課金されます。短期的なニーズに適しています。使用後すぐにインスタンスをリリースすることでコストを節約できます。
リソースグループ構成
インスタンスが属するリソースグループです。デフォルトはデフォルトリソースグループです。詳細については、「Resource Management とは」をご参照ください。
リンク仕様
DTS は、さまざまなパフォーマンスレベルを持つ同期仕様を提供しています。同期リンク仕様は同期レートに影響します。ビジネスシナリオに基づいて仕様を選択してください。詳細については、「データ同期リンク仕様」をご参照ください。
サブスクリプション期間
サブスクリプションモードでは、サブスクリプションインスタンスの期間および数量を選択します。1 ~ 9 ヶ月の月単位サブスクリプション、または 1、2、3、5 年の年単位サブスクリプションを選択できます。
説明このオプションは、課金方法が サブスクリプション の場合にのみ利用可能です。
設定を完了したら、Data Transmission Service (従量課金) 利用規約 を読み、同意してください。
購入して起動 をクリックします。OK ダイアログボックスで、[OK] をクリックします。
[データ同期] ページでタスクの進行状況を確認できます。