Data Transmission Service (DTS) は、PolarDB for PostgreSQL クラスターと RDS for PostgreSQL や自主管理 PostgreSQL データベースなどの PostgreSQL データベースとの間でリアルタイムの双方向データ同期をサポートしています。本トピックでは、RDS for PostgreSQL インスタンスを宛先として双方向データ同期を設定する方法について説明します。他のデータソースの場合も設定手順は同様です。
前提条件
ソースとなる PolarDB for PostgreSQL クラスターおよび宛先となる RDS for PostgreSQL インスタンスを作成済みである必要があります。詳細については、「データベースクラスターの作成」および「ApsaraDB RDS for PostgreSQL インスタンスの作成」をご参照ください。
説明ソースおよびターゲットデータベースでサポートされているバージョンについては、「同期ソリューション」をご参照ください。
ソースおよびターゲットデータベースに十分なストレージ領域があることを確認してください。
宛先の RDS for PostgreSQL インスタンス内に、データを受信するためのデータベースを作成済みである必要があります。詳細については、「データベースの作成」をご参照ください。
ソースの PolarDB for PostgreSQL クラスターおよびターゲットの RDS for PostgreSQL インスタンスの
wal_levelパラメーターは、logicalに設定されている必要があります。詳細については、「クラスターのパラメーターを設定する」および「インスタンスのパラメーターを設定する」をご参照ください。
注意事項
スキーマ同期中に、DTS は外部キーをソースデータベースからターゲットデータベースへ同期します。
完全データ同期および増分データ同期中、DTS はセッションレベルで制約チェックおよび外部キーのカスケード操作を一時的に無効化します。タスク実行中にソースデータベースでカスケード更新または削除操作を実行すると、データ不整合が発生する可能性があります。
種別 | 説明 |
ソースデータベースの制限事項 |
|
その他の制限事項 |
|
課金
同期タイプ | 料金 |
スキーマ同期および完全データ同期 | 無料です。 |
増分データ同期 | 課金対象です。詳細については、「課金概要」をご参照ください。 |
サポートされる競合検出
データ整合性を確保するため、双方向同期中のデータベースインスタンスのいずれか一方でのみ、同じプライマリキー、ビジネスプライマリキー、または一意キーを持つデータレコードを更新するようにしてください。両方のデータベースインスタンスでデータレコードが更新された場合、DTS システムはタスクで設定された競合解決ポリシーを適用します。
DTS は競合をチェックおよび修正し、双方向同期タスクの安定性を最大化します。DTS は以下のタイプの競合を検出できます。
-
INSERT 操作による一意性競合
双方向同期中、同じプライマリキーを持つレコードが両方のデータベースインスタンスに同時に(または短時間の間に)挿入された場合、一意制約競合が発生します。INSERT 文がピアインスタンスに同期されると、同じプライマリキー値を持つレコードがすでに存在するため失敗します。
-
UPDATE 操作におけるレコードの不一致
-
更新対象のレコードが宛先インスタンスに存在しない場合、DTS は UPDATE 操作を INSERT 操作に変換します。ただし、一意性競合が発生する可能性があります。
-
UPDATE 操作で更新されるレコードがプライマリキーまたは一意キーの競合を引き起こす場合。
-
-
削除対象のレコードが存在しない場合
削除対象のレコードが宛先インスタンスに存在しません。この場合、指定した競合解決ポリシーに関係なく、DTS は DELETE 操作を無視します。
-
時間差および遅延のため、DTS は競合を 100 % 防止できるとは限りません。整合性を確保するため、同じプライマリキーまたは一意キーを持つレコードは、一度に 1 つのデータベースインスタンスでのみ更新してください。
-
DTS は上記のデータ競合に対してさまざまな競合解決戦略を提供しており、双方向データ同期を設定する際に選択できます。
サポートされる同期オブジェクト
SCHEMA、TABLE
説明これには、PRIMARY KEY、UNIQUE KEY、FOREIGN KEY、DATATYPE (組み込みデータ型)、DEFAULT CONSTRAINT が含まれます。
VIEW、PROCEDURE (PostgreSQL 11 以降)、FUNCTION、RULE、SEQUENCE、EXTENSION、TRIGGER、AGGREGATE、INDEX、OPERATOR、DOMAIN
サポートされる SQL 操作
データ定義言語 (DDL) 操作は、フォワードタスク(ソースデータベースからターゲットデータベースへの同期)でのみ同期できます。リバースタスク(ターゲットデータベースからソースデータベースへの同期)では DDL 操作はサポートされておらず、自動的にフィルターされます。
操作タイプ | SQL 操作文 |
DML | INSERT、UPDATE、DELETE |
DDL |
重要
|
データベースアカウント権限
データベース | 必要な権限 | アカウント作成および権限付与方法 |
PolarDB for PostgreSQL | データベースのオーナーである特権アカウント。 | 「データベースアカウントの作成」および「データベース管理」をご参照ください。 |
RDS for PostgreSQL | データベースのオーナーである特権アカウント(認可済みアカウント)。 |
操作手順
双方向同期インスタンスを購入します。詳細については、「購入手順」をご参照ください。
重要インスタンスを購入する際、機能 は データ同期、ソースインスタンス は PolarDB PostgreSQL、宛先インスタンス は PostgreSQL、同期トポロジー は 双方向同期 に設定してください。その他のパラメーターは必要に応じて設定します。
宛先リージョンの同期タスクリストページに移動します。以下の 2 つの方法のいずれかを使用できます。
DTS コンソールから
左側のナビゲーションウィンドウで、データ同期 をクリックします。
ページ左上隅で、同期インスタンスが配置されているリージョンを選択します。
DMS コンソールから
説明実際の操作は DMS コンソールのモードおよびレイアウトによって異なる場合があります。詳細については、「シンプルモード」および「DMS インターフェイスのレイアウトおよびスタイルのカスタマイズ」をご参照ください。
Data Management (DMS) にログインします。
上部のメニューバーで、 を選択します。
データ同期タスク の右側で、同期インスタンスが配置されているリージョンを選択します。
作成した双方向同期インスタンスを見つけます。操作 列のフォワードタスクで、タスクの設定 をクリックします。
ソースおよびターゲットデータベースを設定します。
カテゴリ
設定
説明
該当なし
タスク名
DTS は自動的にタスク名を生成します。識別しやすいように、わかりやすい名前を指定することを推奨します。名前は一意である必要はありません。
移行元データベース
既存の接続情報の選択
システムに追加済み(新規作成または保存済み)のデータベースインスタンスを使用する場合は、ドロップダウンリストからデータベースインスタンスを選択します。データベース情報は自動的に設定されます。
説明DMS コンソールでは、この設定項目の名前は DMS データベースインスタンスの選択 です。
データベースインスタンスをシステムに追加していない場合、またはすでに追加済みのインスタンスを使用しない場合は、以下のデータベース情報を手動で設定します。
データベースタイプ
PolarDB for PostgreSQL を選択します。
アクセス方法
Alibaba Cloud インスタンス を選択します。
インスタンスのリージョン
これはインスタンス購入時に選択したリージョンに固定されており、変更できません。
Alibaba Cloud アカウント間でデータを複製
この例では、現在の Alibaba Cloud アカウントに属するデータベースインスタンスを使用します。× を選択します。
インスタンス ID
ソースの PolarDB for PostgreSQL クラスターの ID を選択します。
データベース名
ソースの PolarDB for PostgreSQL クラスター内で同期対象オブジェクトを含むデータベースの名前を入力します。
データベースアカウント
ソースの PolarDB for PostgreSQL クラスターのデータベースアカウントを入力します。権限要件については、「データベースアカウント権限」をご参照ください。
データベースのパスワード
データベースアカウントに対応するパスワードを入力します。
移行先データベース
既存の接続情報の選択
システムに追加済み(新規作成または保存済み)のデータベースインスタンスを使用する場合は、ドロップダウンリストからデータベースインスタンスを選択します。データベース情報は自動的に設定されます。
説明DMS コンソールでは、この設定項目の名前は DMS データベースインスタンスの選択 です。
データベースインスタンスをシステムに追加していない場合、またはすでに追加済みのインスタンスを使用しない場合は、以下のデータベース情報を手動で設定します。
データベースタイプ
PostgreSQL を選択します。
アクセス方法
Alibaba Cloud インスタンス を選択します。
インスタンスのリージョン
これはインスタンス購入時に選択したリージョンに固定されており、変更できません。
インスタンス ID
宛先の RDS for PostgreSQL インスタンスの ID を選択します。
データベース名
宛先の RDS for PostgreSQL インスタンス内でデータを受信するデータベースの名前を入力します。
データベースアカウント
宛先の RDS for PostgreSQL インスタンスのデータベースアカウントを入力します。権限要件については、「データベースアカウント権限」をご参照ください。
データベースのパスワード
データベースアカウントに対応するパスワードを入力します。
暗号化
ソースデータベースへの接続を暗号化するかどうかを指定します。ビジネス要件に基づいてこのパラメーターを設定できます。この例では、非暗号化 を選択します。
ソースデータベースへの SSL 暗号化接続を確立する場合は、次の手順を実行します。SSL 暗号化 を選択し、必要に応じて CA 証明書、クライアント証明書、および クライアント証明書の秘密鍵 をアップロードし、その後 クライアント証明書の秘密鍵のパスワード を指定します。
説明自己管理 PostgreSQL データベースの暗号化を SSL 暗号化 に設定する場合は、CA 証明書 をアップロードする必要があります。
クライアント証明書を使用する場合は、クライアント証明書 および クライアント証明書の秘密鍵 をアップロードし、クライアント証明書の秘密鍵のパスワード を指定する必要があります。
ApsaraDB RDS for PostgreSQL インスタンスの SSL 暗号化の設定方法については、「SSL 暗号化」をご参照ください。
設定が完了したら、ページ下部の 接続をテストして続行 をクリックします。
説明DTS サーバーからのアクセスを許可するため、ソースおよびターゲットデータベースのセキュリティ設定に DTS サーバーの IP アドレス CIDR ブロックを追加していることを確認してください。これは自動的または手動で行えます。詳細については、「DTS サーバーの IP アドレス CIDR ブロックをホワイトリストに追加する」をご参照ください。
ソースまたはターゲットデータベースが自己管理データベース(アクセス方法 が Alibaba Cloud インスタンス ではない)の場合、DTS サーバーの CIDR ブロック ダイアログボックス内で 接続テスト をクリックする必要があります。
タスクオブジェクトを設定します。
オブジェクト設定 ページで、同期するオブジェクトを設定します。
設定
説明
同期タイプ
デフォルトで 増分データ同期 が選択されています。通常、スキーマ同期 および 完全データ同期 も選択する必要があります。事前チェックが完了すると、DTS は選択したオブジェクトの完全データ同期をソースインスタンスから宛先クラスターに実行します。これは、その後の増分データ同期のベースラインデータとなります。
DDL 操作を除外
○ を選択すると、DDL 操作は同期されません。
× を選択すると、DDL 操作は同期されます。
重要双方向同期リンクの安定性を確保するため、フォワードタスク(ソースデータベースからターゲットデータベースへの同期)でのみ DDL の同期を有効にするかどうかを選択できます。リバースタスク(ターゲットデータベースからソースデータベースへの同期)では、DDL 操作は自動的にフィルターされます。
グローバルな競合修復ポリシー
必要に応じて競合解決ポリシーを選択します。
Taskfailed (競合が発生した場合、エラーが報告されタスクは終了します。)
同期中にデータ競合が発生すると、タスクはエラーを報告して停止します。タスクは失敗状態となり、手動での介入が必要です。
Ignore (競合が発生した場合、移行先インスタンスの競合レコードが使用されます。)
同期中にデータ競合が発生すると、現在の同期文はスキップされ、処理は継続されます。宛先データベースの競合レコードは保持されます。
Overwrite (競合が発生した場合、移行先インスタンスの競合レコードは上書きされます。)
同期中にデータ競合が発生すると、宛先データベースの競合レコードが上書きされます。
説明サポートされる競合タイプについては、「サポートされる競合検出」をご参照ください。
同期タスクが一時停止または再開され、遅延が発生している場合、これらのポリシーは遅延中には適用されません。デフォルトで宛先のデータが上書きされます。
競合するテーブルの処理モード
エラーの事前チェックと報告:宛先データベースに同じ名前のテーブルが存在するかどうかをチェックします。同じ名前のテーブルが存在しない場合、事前チェックは合格します。同じ名前のテーブルが存在する場合、事前チェックは失敗し、データ同期タスクは開始されません。
説明宛先データベースで同じ名前のテーブルを削除または名前変更できない場合は、別のテーブル名にマッピングできます。詳細については、「テーブル名および列名のマッピング」をご参照ください。
エラーを無視して続行:宛先データベースでの重複テーブル名のチェックをスキップします。
警告エラーを無視して続行 を選択すると、データ不整合が発生し、ビジネスにリスクが及ぶ可能性があります。例:
テーブルスキーマが同じで、宛先データベースのレコードがソースデータベースのレコードと同じプライマリキーまたは一意キー値を持つ場合:
完全同期中、DTS は宛先クラスターのレコードを保持します。ソースデータベースの対応するレコードは同期されません。
増分同期中、ソースデータベースのレコードが宛先データベースのレコードを上書きします。
テーブルスキーマが異なる場合、初期データ同期が失敗する可能性があります。これにより、一部の列データのみが同期されるか、完全に同期が失敗する可能性があります。慎重に進めてください。
移行先インスタンスでのオブジェクト名の大文字化
宛先インスタンスでのデータベース、テーブル、列などの移行オブジェクト名の大文字小文字区別ポリシーを設定できます。デフォルトでは、DTS のデフォルトポリシー が選択されています。ソースまたはターゲットデータベースのデフォルトポリシーと大文字小文字区別を一致させることもできます。詳細については、「宛先データベースでのオブジェクト名の大文字小文字区別」をご参照ください。
ソースオブジェクト
ソースオブジェクト ボックスで、同期するオブジェクトをクリックし、
をクリックして 選択中のオブジェクト ボックスに移動させます。説明同期オブジェクトの粒度はスキーマまたはテーブルです。テーブルを同期オブジェクトとして選択した場合、ビュー、トリガー、ストアドプロシージャなどの他のオブジェクトはターゲットデータベースに同期されません。
同期対象のテーブルに SERIAL データ型が含まれており、同期タイプ で スキーマ同期 を選択する場合は、シーケンス を選択するか、スキーマ全体を同期することを推奨します。
選択中のオブジェクト
宛先インスタンスで同期オブジェクトの名前を変更するには、選択中のオブジェクト ボックス内のオブジェクトを右クリックして名前を編集します。詳細については、「スキーマ、テーブル、および列名のマッピング」をご参照ください。
選択済みの同期オブジェクトを削除するには、選択中のオブジェクト ボックス内でオブジェクトをクリックし、
をクリックして ソースオブジェクト ボックスに移動させます。
説明オブジェクト名マッピング機能を使用する場合、マッピングされたオブジェクトに依存する他のオブジェクトの同期が失敗する可能性があります。
WHERE 句でデータをフィルターするには、選択中のオブジェクト ボックス内の対象テーブルを右クリックし、表示されるダイアログボックスでフィルター条件を設定します。詳細については、「フィルター条件の設定」をご参照ください。
増分同期の SQL 操作を指定するには、選択中のオブジェクト ボックス内の同期オブジェクトを右クリックし、表示されるダイアログボックスで目的の SQL 操作を選択します。
詳細設定へ をクリックして、詳細パラメーターを設定します。
設定
説明
タスクのスケジュールに使用する専用クラスターの選択
デフォルトでは、DTS は共有クラスター上でタスクをスケジューリングするため、クラスターを選択する必要はありません。より安定したパフォーマンスを求める場合は、DTS 同期タスクを実行するための専用クラスターを購入できます。詳細については、「DTS 専用クラスターとは」をご参照ください。
失敗した接続の再試行時間
同期タスク開始後、ソースまたはターゲットデータベースへの接続が失敗した場合、DTS はエラーを報告し、すぐに接続のリトライを開始します。デフォルトのリトライ時間は 720 分です。10 ~ 1,440 分の範囲でカスタムリトライ時間を指定することもできます。30 分以上に設定することを推奨します。指定された時間内に DTS がデータベースへの再接続に成功した場合、同期タスクは自動的に再開されます。そうでない場合、タスクは失敗します。
説明同じソースまたはターゲットを共有する複数の DTS インスタンス(例:インスタンス A とインスタンス B)があり、インスタンス A のネットワークリトライ時間を 30 分、インスタンス B を 60 分に設定した場合、両方に短い方の 30 分が適用されます。
DTS は接続リトライ期間中もタスク実行時間に対して課金するため、ビジネスニーズに基づいてリトライ時間をカスタマイズするか、ソースおよびターゲットデータベースインスタンスをリリースした後はできるだけ早く DTS インスタンスをリリースすることを推奨します。
移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。
同期タスク開始後、ソースまたはターゲットデータベースで接続以外の問題(DDL や DML 実行例外など)が発生した場合、DTS はエラーを報告し、すぐに継続的なリトライ操作を開始します。デフォルトのリトライ時間は 10 分です。1 ~ 1,440 分の範囲でカスタムリトライ時間を設定することもできます。10 分以上に設定することを推奨します。設定されたリトライ時間内に関連操作が成功した場合、同期タスクは自動的に再開されます。そうでない場合、タスクは失敗します。
重要移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。 の値は、失敗した接続の再試行時間 の値より小さくする必要があります。
完全同期レートを制限するかどうか
完全同期フェーズ中、DTS はソースおよびターゲットデータベースの読み取り・書き込みリソースを消費するため、データベース負荷が増加する可能性があります。ソースおよびターゲットデータベースの負荷を軽減するため、1 秒あたりのソースデータベースのクエリ率 QPS、1 秒あたりの完全移行の行数 RPS、および 1 秒あたりの完全移行データ量 (MB) BPS パラメーターを設定して、完全同期タスクのレート制限を設定できます。
説明この設定項目は、同期タイプ が 完全データ同期 に設定されている場合にのみ利用可能です。
同期インスタンス実行後も、完全同期レートを調整 できます。
増分同期率を制限するかどうか
増分同期タスクのレート制限も設定できます。宛先データベースの負荷を軽減するため、1 秒あたりの増分同期の行数 RPS および 1 秒あたりの増分同期データ量 (MB) BPS を設定します。
環境タグ
必要に応じて、インスタンスを識別するための環境タグを選択できます。この例では選択不要です。
ETL 機能の設定
抽出・変換・書き出し (ETL) 機能を有効にするかどうかを選択します。詳細については、「ETL とは」をご参照ください。有効値:
-
○:ETL 機能を有効にします。コードエディタにデータ処理文を入力します。詳細については、「データ移行またはデータ同期タスクでの ETL の設定」をご参照ください。
-
×:ETL 機能を無効にします。
次へ:データ検証 をクリックして、データ検証タスクを設定します。
データ検証機能を使用する場合は、「データ検証の設定」の設定手順をご参照ください。
タスクを保存して事前チェックを実行します。
このインスタンスを設定するための API パラメーターを表示するには、次:タスク設定の保存と事前チェック ボタンにカーソルを合わせ、表示されるバルーン内の OpenAPI パラメーターのプレビュー をクリックします。
API パラメーターの確認が完了したら、ページ下部の 次:タスク設定の保存と事前チェック をクリックします。
説明同期ジョブ開始前に、DTS は事前チェックを実行します。すべての事前チェック項目が合格した後でのみ、ジョブを開始できます。
事前チェックが失敗した場合は、失敗した項目の横にある 詳細を表示 をクリックします。指示に従って問題を修正し、再度事前チェックを実行してください。
事前チェックで警告が返された場合:
チェック項目が失敗し、無視できない場合は、項目の横にある 詳細を表示 をクリックします。指示に従って問題を修正し、再度事前チェックを実行してください。
無視可能なチェック項目については、アラートの詳細を確認、無視、OK、および 再度事前チェックを実行 を順にクリックして、警告をスキップし、事前チェックを再実行します。警告項目をマスクすると、データ不整合などの問題が発生し、ビジネスにリスクが及ぶ可能性があります。
成功率 が 100 % に達したら、戻る をクリックします。
リモート同期タスクを設定します。
フォワード同期タスクの初期同期が完了するまで待ちます。プロセスが完了すると、ステータス が 実行中 になります。
操作 列のリモートタスクで、タスクの設定 をクリックします。
ステップ 4 から ステップ 7 を参照して、リモート同期タスクを設定します。
重要リバース同期タスクを設定する際は、正しいソースおよび宛先インスタンスを選択する必要があります。リバースタスクのソースインスタンスはフォワードタスクの宛先インスタンスです。リバースタスクの宛先インスタンスはフォワードタスクのソースインスタンスです。データベース名、アカウント、パスワードなどのインスタンス情報が一致していることを慎重に確認してください。
リバース同期タスクでは、ソースおよびターゲットデータベースの インスタンスのリージョン を変更できません。フォワード同期タスクと比較して、設定可能なパラメーターが少なくなります。コンソールに表示されるパラメーターを設定してください。
リバース同期タスクの 競合するテーブルの処理モード は、フォワード同期タスクによって宛先インスタンスに同期されたテーブルをチェックしません。
リバース同期タスクは、フォワードタスクの 選択中のオブジェクト リストに含まれていないオブジェクトの同期をサポートしていません。
リバースタスクを設定する際は、マッピング機能を使用しないことを推奨します。そうしないと、データ不整合が発生する可能性があります。
成功率 が 100 % になったら、戻る をクリックします。
リモート同期タスクの設定後、両方の同期タスクの ステータス が 実行中 になるまで待ちます。これで双方向データ同期の設定が完了です。
