このトピックでは、Data Transmission Service (DTS) を使用して PolarDB for PostgreSQL (Oracle 互換) クラスターから Message Queue for Apache Kafka インスタンスにデータを移行する方法について説明します。
前提条件
ソース PolarDB for PostgreSQL (Oracle 互換) クラスターの wal_level パラメーターの値が logical に設定されていること。これにより、論理デコードに必要な情報が先行書き込みログ (WAL) に追加されます。詳細については、「クラスターパラメーターの設定」をご参照ください。
移行先の Message Queue for Apache Kafka インスタンスが作成されていること。移行先インスタンスには、ソース PolarDB for PostgreSQL (Oracle 互換) インスタンスの使用済みディスク領域よりも多くの利用可能なディスク領域が必要です。
説明サポートされているデータベースのバージョンについては、「移行ソリューション」をご参照ください。
移行先の Message Queue for Apache Kafka インスタンスに、移行されたデータを受信するためのトピックが作成されていること。詳細については、「ステップ 1: トピックの作成」をご参照ください。
注意事項
タイプ | 説明 |
ソースデータベースの制限 |
|
その他の制限 |
|
課金ルール
移行タイプ | タスク構成料金 | インターネットトラフィック料金 |
スキーマ移行と完全データ移行 | 無料。 | Alibaba Cloud からインターネット経由でデータが移行される場合にのみ課金されます。詳細については、「課金の概要」をご参照ください。 |
増分データ移行 | 課金されます。詳細については、「課金の概要」をご参照ください。 |
増分移行をサポートする SQL 操作
操作タイプ | SQL 文 |
DML | INSERT、UPDATE、DELETE |
DDL |
重要
|
データベースアカウントに必要な権限
データベース | 必要な権限 | アカウントの作成と権限付与の方法 |
PolarDB for PostgreSQL (Oracle 互換) クラスター | 権限のあるアカウント |
手順
次のいずれかの方法でデータ移行ページに移動し、データ移行インスタンスが存在するリージョンを選択します。
DTS コンソール
DTS コンソールにログインします。
左側のナビゲーションウィンドウで、データの移行 をクリックします。
ページの左上隅で、データ移行インスタンスが存在するリージョンを選択します。
DMS コンソール
説明実際の操作は、DMS コンソールのモードとレイアウトによって異なる場合があります。詳細については、「シンプルモード」および「DMS コンソールのレイアウトとスタイルをカスタマイズする」をご参照ください。
DMS コンソールにログインします。
上部のナビゲーションバーで、ポインターを の上に移動します。
[データ移行タスク] の右側にあるドロップダウンリストから、データ同期インスタンスが存在するリージョンを選択します。
タスクの作成 をクリックして、タスク構成ページに移動します。
ソースデータベースと移行先データベースを構成します。次の表にパラメーターを示します。
説明移行先の Message Queue for Apache Kafka インスタンスのパラメーターを取得する方法については、「Message Queue for Apache Kafka インスタンスのパラメーターを構成する」をご参照ください。
カテゴリ
構成
説明
N/A
タスク名
DTS タスクの名前。DTS はタスク名を自動的に生成します。タスクを簡単に識別できるわかりやすい名前を指定することをお勧めします。一意のタスク名を指定する必要はありません。
移行元データベース
既存の接続情報の選択
DTS に登録されているデータベースインスタンスを使用する場合は、ドロップダウンリストからインスタンスを選択します。DTS は、インスタンスの次のデータベースパラメーターを自動的に入力します。詳細については、「データベース接続の管理」をご参照ください。
説明DMS コンソールでは、[DMS データベースインスタンスの選択] ドロップダウンリストからデータベースインスタンスを選択できます。
インスタンスを DTS に登録できない場合、または DTS に登録されているインスタンスを使用する必要がない場合は、次のデータベース情報を構成する必要があります。
データベースタイプ
PolarDB (Oracle と互換性) を選択します。
アクセス方法
Alibaba Cloud インスタンス を選択します。
インスタンスのリージョン
ソース PolarDB for PostgreSQL (Oracle 互換) クラスターが存在するリージョンを選択します。
Alibaba Cloud アカウント間でデータを複製
この例では、同じ Alibaba Cloud アカウント内でデータを移行します。× を選択します。
インスタンス ID
ソース PolarDB for PostgreSQL (Oracle 互換) クラスターの ID を選択します。
データベース名
ソース PolarDB for PostgreSQL (Oracle 互換) クラスターから移行するオブジェクトを含むデータベースの名前を入力します。
データベースアカウント
ソース PolarDB for PostgreSQL (Oracle 互換) クラスターのデータベースアカウントを入力します。必要な権限については、「データベースアカウントに必要な権限」をご参照ください。
データベースのパスワード
データベースへのアクセスに使用されるパスワード。
移行先データベース
既存の接続情報の選択
DTS に登録されているデータベースインスタンスを使用する場合は、ドロップダウンリストからインスタンスを選択します。DTS は、インスタンスの次のデータベースパラメーターを自動的に入力します。詳細については、「データベース接続の管理」をご参照ください。
説明DMS コンソールでは、[DMS データベースインスタンスの選択] ドロップダウンリストからデータベースインスタンスを選択できます。
インスタンスを DTS に登録できない場合、または DTS に登録されているインスタンスを使用する必要がない場合は、次のデータベース情報を構成する必要があります。
データベースタイプ
Kafka を選択します。
アクセス方法
Express Connect、VPN Gateway、または Smart Access Gateway を選択します。
説明ここでは、Message Queue for Apache Kafka インスタンスは、移行インスタンスの自己管理 Kafka データベースとして構成されます。
インスタンスのリージョン
移行先の Message Queue for Apache Kafka インスタンスが存在するリージョンを選択します。
接続中の VPC
移行先の Message Queue for Apache Kafka インスタンスが属する VPC (VPC) の ID を選択します。
ドメイン名または IP アドレス
移行先の Message Queue for Apache Kafka インスタンスの [デフォルトエンドポイント] から任意の IP アドレスを入力します。
ポート番号
移行先の Message Queue for Apache Kafka インスタンスのサービスポートを入力します。デフォルト値は 9092 です。
データベースアカウント
この例では、このパラメーターを入力する必要はありません。
データベースのパスワード
Kafka のバージョン
Kafka インスタンスのバージョンを選択します。
暗号化
必要に応じて 非暗号化 または SCRAM-SHA-256 を選択します。
トピック
ドロップダウンリストからデータを受信するトピックを選択します。
Kafka スキーマレジストリの使用
Kafka Schema Registry は、Avro スキーマを保存および取得するための RESTful インターフェイスを提供するメタデータサービスレイヤーです。
×: Kafka Schema Registry を使用しません。
○: Kafka Schema Registry を使用します。スキーマレジストリの URL または IP アドレス テキストボックスに、Kafka Schema Registry に登録されている Avro スキーマの URL または IP アドレスを入力する必要があります。
ページの下部で、[接続性のテストと続行] をクリックします。
説明DTS サーバーの CIDR ブロックが、ソースデータベースと移行先データベースのセキュリティ設定に自動または手動で追加され、DTS サーバーからのアクセスが許可されることを確認してください。詳細については、「DTS サーバーの IP アドレスをホワイトリストに追加する」をご参照ください。
ソースまたは移行先データベースが自己管理データベースで、その アクセス方法 が Alibaba Cloud インスタンス に設定されていない場合は、DTS サーバーの CIDR ブロック ダイアログボックスで 接続テスト をクリックします。
移行するオブジェクトを構成します。
オブジェクト設定 ページで、移行するオブジェクトを構成します。
構成
説明
移行タイプ
完全移行のみを実行する必要がある場合は、スキーマ移行 と 完全データ移行 の両方を選択します。
ゼロダウンタイム移行を実行するには、スキーマ移行、完全データ移行、および 増分データ移行 を選択します。
説明移行先 Kafka インスタンスの アクセス方法 が Alibaba Cloud インスタンス の場合、スキーマ移行 はサポートされていません。
増分データ移行 を選択しない場合は、データ移行中にソースインスタンスに新しいデータを書き込まないでください。これにより、データの整合性が確保されます。
競合するテーブルの処理モード
エラーの事前チェックと報告: 移行先データベースにソースデータベースのテーブルと同じ名前のテーブルが含まれているかどうかを確認します。ソースデータベースと移行先データベースに同じテーブル名のテーブルが含まれていない場合、事前チェックは合格します。それ以外の場合は、事前チェック中にエラーが返され、データ移行タスクを開始できません。
説明ソースデータベースと移行先データベースに同じ名前のテーブルが含まれており、移行先データベースのテーブルを削除または名前変更できない場合は、オブジェクト名マッピング機能を使用して、移行先データベースに移行されるテーブルの名前を変更できます。詳細については、「オブジェクト名のマッピング」をご参照ください。
エラーを無視して続行: ソースデータベースと移行先データベースの同じテーブル名の事前チェックをスキップします。
警告エラーを無視して続行 を選択すると、データの不整合が発生し、ビジネスが次の潜在的なリスクにさらされる可能性があります。
ソースデータベースと移行先データベースのスキーマが同じで、データレコードのプライマリキーが移行先データベースの既存のデータレコードと同じ場合、次のシナリオが発生する可能性があります。
完全データ移行中、DTS はデータレコードを移行先データベースに移行しません。移行先データベースの既存のデータレコードは保持されます。
増分データ移行中、DTS はデータレコードを移行先データベースに移行します。移行先データベースの既存のデータレコードは上書きされます。
ソースデータベースと移行先データベースのスキーマが異なる場合、特定の列のみが移行されるか、データ移行タスクが失敗します。注意して進めてください。
Kafka のデータ形式
Kafka インスタンスに保存するデータ形式を選択します。
[Canal JSON] を選択した場合、パラメーターの説明と例については、「Canal JSON」をご参照ください。
説明現在、[Canal JSON] を選択できるのは、中国 (青島) および中国 (北京) リージョンのみです。
[DTS Avro] を選択した場合、データは DTS Avro のスキーマ定義に基づいて解析されます。詳細については、「GitHub」をご参照ください。
[Shareplex JSON] を選択した場合、パラメーターの説明と例については、「Shareplex JSON」をご参照ください。
Kafka 圧縮形式
Kafka 圧縮データの圧縮形式。ビジネス要件に基づいて圧縮形式を選択します。有効な値:
LZ4: (デフォルト): 低い圧縮率と高い圧縮速度。
GZIP: 高い圧縮率と低い圧縮速度。
説明GZIP 圧縮は大量の CPU リソースを消費します。
Snappy: 中程度の圧縮率と中程度の圧縮速度。
Kafka パーティションへのデータ転送ポリシー
目的の ポリシーを選択します。
メッセージ肯定応答メカニズム
目的の メッセージ確認メカニズムを選択します。
DDL 情報を格納するトピック
移行先インスタンスでのオブジェクト名の大文字化
移行先インスタンスのデータベース名、テーブル名、および列名の大文字/小文字。デフォルトでは、[DTS のデフォルトポリシー] が選択されています。他のオプションを選択して、オブジェクト名の大文字/小文字がソースまたは移行先データベースのものと一致するようにすることができます。詳細については、「移行先インスタンスのオブジェクト名の大文字/小文字を指定する」をご参照ください。
ソースオブジェクト
ソースオブジェクト セクションから 1 つ以上のオブジェクトを選択します。
アイコンをクリックして、オブジェクトを 選択中のオブジェクト セクションに追加します。説明移行するオブジェクトとしてテーブルを選択できます。
選択中のオブジェクト
この例では追加の構成は必要ありません。マッピング機能を使用して、移行先 Kafka インスタンスのソーステーブルのトピック名、トピックパーティション数、およびパーティションキーを設定できます。詳細については、「マッピング情報」をご参照ください。
説明オブジェクト名マッピング機能を使用すると、このオブジェクトに依存する他のオブジェクトの移行が失敗する可能性があります。
増分移行の SQL 操作を選択するには、選択中のオブジェクト セクションで移行オブジェクトを右クリックし、表示されるダイアログボックスで目的の SQL 操作を選択します。
詳細設定へ をクリックして詳細設定を構成します。
構成
説明
タスクのスケジュールに使用する専用クラスターの選択
デフォルトでは、専用クラスターを指定しない場合、DTS はデータ移行タスクを共有クラスターにスケジュールします。データ移行タスクの安定性を向上させたい場合は、専用クラスターを購入してください。詳細については、「DTS 専用クラスターとは」をご参照ください。
失敗した接続の再試行時間
失敗した接続のリトライ時間範囲。データ移行タスクの開始後にソースまたは移行先データベースへの接続に失敗した場合、DTS はリトライ時間範囲内で直ちに接続をリトライします。有効な値: 10 から 1,440。単位: 分。デフォルト値: 720。パラメーターを 30 より大きい値に設定することをお勧めします。指定されたリトライ時間範囲内に DTS がソースおよび移行先データベースに再接続されると、DTS はデータ移行タスクを再開します。それ以外の場合、データ移行タスクは失敗します。
説明同じソースまたは移行先データベースを共有する複数のデータ移行タスクに異なるリトライ時間範囲を指定した場合、後で指定された値が優先されます。
DTS が接続をリトライすると、DTS インスタンスに対して課金されます。ビジネス要件に基づいてリトライ時間範囲を指定することをお勧めします。また、ソースデータベースと移行先インスタンスがリリースされた後、できるだけ早く DTS インスタンスをリリースすることもできます。
移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。
その他の問題のリトライ時間範囲。たとえば、データ移行タスクの開始後に DDL または DML 操作の実行に失敗した場合、DTS はリトライ時間範囲内で直ちに操作をリトライします。有効な値: 1 から 1440。単位: 分。デフォルト値: 10。パラメーターを 10 より大きい値に設定することをお勧めします。指定されたリトライ時間範囲内に失敗した操作が正常に実行されると、DTS はデータ移行タスクを再開します。それ以外の場合、データ移行タスクは失敗します。
重要移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。 パラメーターの値は、失敗した接続の再試行時間 パラメーターの値より小さくする必要があります。
完全移行率を制限するかどうか
完全データ移行のスロットリングを有効にするかどうかを指定します。完全データ移行中、DTS はソースおよび移行先データベースの読み取りおよび書き込みリソースを使用します。これにより、データベースサーバーの負荷が増加する可能性があります。ビジネス要件に基づいて、完全データ移行のスロットリングを有効にすることができます。スロットリングを構成するには、1 秒あたりのソースデータベースのクエリ率 QPS、1 秒あたりの完全移行の行数 RPS、および 1 秒あたりの完全移行データ量 (MB) BPS パラメーターを構成する必要があります。これにより、移行先データベースサーバーの負荷が軽減されます。
説明このパラメーターは、移行タイプ パラメーターで 完全データ移行 を選択した場合にのみ構成できます。
増分移行率を制限するかどうか
増分データ移行のスロットリングを有効にするかどうかを指定します。スロットリングを構成するには、1 秒あたりの増分移行の行数 RPS および 1 秒あたりの増分移行データ量 (MB) BPS パラメーターを構成する必要があります。これにより、移行先データベースサーバーの負荷が軽減されます。
説明このパラメーターは、移行タイプ パラメーターで 増分データ移行 を選択した場合にのみ構成できます。
環境タグ
必要に応じて、インスタンスを識別するための環境タグを選択できます。この例では必須ではありません。
ETL の設定
抽出・変換・書き出し (ETL) 機能を有効にするかどうかを指定します。詳細については、「ETL とは」をご参照ください。有効な値:
[はい]: ETL 機能を構成します。コードエディタにデータ処理文を入力できます。詳細については、「データ移行またはデータ同期タスクで ETL を構成する」をご参照ください。
[いいえ]: ETL 機能を構成しません。
監視アラート
データ移行タスクのアラートを構成するかどうかを指定します。タスクが失敗した場合、または移行遅延が指定されたしきい値を超えた場合、アラート連絡先は通知を受け取ります。有効な値:
[いいえ]: アラートを構成しません。
[はい]: アラートを構成します。この場合、アラートのしきい値と アラート通知設定も構成する必要があります。詳細については、「モニタリングとアラートの設定」トピックの「DTS タスク作成時のモニタリングとアラートの設定」セクションをご参照ください。
タスク設定を保存し、事前チェックを実行します。
関連する API 操作を呼び出して DTS タスクを構成するときに指定するパラメーターを表示するには、次:タスク設定の保存と事前チェック の上にポインターを移動し、OpenAPI パラメーターのプレビュー をクリックします。
パラメーターを表示する必要がない場合、または表示済みの場合は、ページの下部にある 次:タスク設定の保存と事前チェック をクリックします。
説明データ移行タスクを開始する前に、DTS は事前チェックを実行します。データ移行タスクは、タスクが事前チェックに合格した後にのみ開始できます。
タスクが事前チェックに合格しなかった場合は、失敗した各項目の横にある [詳細の表示] をクリックします。チェック結果に基づいて原因を分析した後、問題をトラブルシューティングします。その後、再度事前チェックを実行します。
事前チェック中に項目のアラートがトリガーされた場合:
アラート項目を無視できない場合は、失敗した項目の横にある [詳細の表示] をクリックして問題をトラブルシューティングします。その後、再度事前チェックを実行します。
アラート項目を無視できる場合は、[アラート詳細の確認] をクリックします。[詳細の表示] ダイアログボックスで、[無視] をクリックします。表示されるメッセージで、[OK] をクリックします。次に、[再度事前チェック] をクリックして、再度事前チェックを実行します。アラート項目を無視すると、データの不整合が発生し、ビジネスが潜在的なリスクにさらされる可能性があります。
インスタンスを購入します。
[成功率] が [100%] になるまで待ちます。次に、[次へ: インスタンスの購入] をクリックします。
[インスタンスの購入] ページで、データ移行インスタンスのインスタンスクラスパラメーターを構成します。次の表にパラメーターを示します。
セクション
パラメーター
説明
新しいインスタンスクラス
リソースグループ
データ移行インスタンスが属するリソースグループ。デフォルト値: [デフォルトリソースグループ]。詳細については、「Resource Management とは」をご参照ください。
インスタンスクラス
DTS は、移行速度が異なるインスタンスクラスを提供します。ビジネスシナリオに基づいてインスタンスクラスを選択できます。詳細については、「データ移行インスタンスのインスタンスクラス」をご参照ください。
チェックボックスをオンにして、[Data Transmission Service (従量課金) サービス規約] を読んで同意します。
[購入して開始] をクリックします。表示されるメッセージで、[OK] をクリックします。
[データ移行] ページでタスクの進行状況を表示できます。
説明データ移行タスクを使用して増分データを移行できない場合、タスクは自動的に停止します。[ステータス] セクションに [完了] が表示されます。
データ移行タスクを使用して増分データを移行できる場合、タスクは自動的に停止しません。増分データ移行タスクは停止も完了もしません。[ステータス] セクションに [実行中] が表示されます。
マッピング情報
選択中のオブジェクト エリアで、移行先トピック名 (テーブルレベル) の上にマウスポインターを移動します。
移行先トピック名の後に表示される 編集 をクリックします。
表示される テーブルの編集 ダイアログボックスで、マッピング情報を構成します。
説明スキーマレベルでは、ダイアログボックスの名前は スキーマの編集 であり、構成可能なパラメーターは少なくなります。テーブルレベルでは、ダイアログボックスの名前は テーブルの編集 です。
移行オブジェクトがスキーマ全体でない場合、スキーマの編集 ダイアログボックスで 対象トピックの名前 と パーティション数 を変更することはできません。
構成
説明
対象トピックの名前
ソーステーブルが移行される移行先トピックの名前。デフォルトでは、これは ソースデータベースとターゲットデータベースの設定 ステップ中に 移行先データベース セクションで選択された トピック です。
重要移行先データベースが Message Queue for Apache Kafka インスタンスの場合、指定されたトピック名は移行先 Kafka インスタンスに存在する必要があります。そうでない場合、データ移行は失敗します。移行先データベースが自己管理 Kafka データベースで、移行インスタンスにスキーマ移行タスクが含まれている場合、DTS は指定したトピックを移行先データベースに作成しようとします。
対象トピックの名前 を変更すると、データは指定したトピックに書き込まれます。
フィルタリング条件
詳細については、「フィルター条件の設定」をご参照ください。
パーティション数
データが書き込まれる移行先トピックのパーティション数。
パーティションキー
Kafka パーティションへのデータ転送ポリシー が 主キーのハッシュ値に基づいて、データを個別のパーティションに転送 に設定されている場合、このパラメーターを構成する必要があります。ハッシュ値を計算するために、1 つ以上の列をパーティションキーとして指定します。DTS は、計算されたハッシュ値に基づいて、移行先トピックの各パーティションに異なる行を配信します。そうでない場合、この配信ポリシーは増分書き込みフェーズ中に有効になりません。
説明パーティションキー は、テーブルの編集 ダイアログボックスでのみ選択できます。
[OK] をクリックします。