このトピックでは、data Transmission Service (DTS) を使用して、PolarDB for PostgreSQLクラスターからApsaraDB for SelectDBインスタンスにデータを同期する方法について説明します。 このようにして、大量のデータを分析できます。
前提条件
ターゲットApsaraDB for SelectDBインスタンスが作成されました。 このインスタンスの使用可能なストレージ容量は、ソースPolarDB for PostgreSQLクラスターのデータの合計サイズよりも大きくなっています。 詳細は、インスタンスの作成をご参照ください。
ソースPolarDB for PostgreSQLクラスターのwal_levelパラメーターがlogicalに設定されています。 詳細は、「クラスターパラメーターの指定」をご参照ください。
使用上の注意
種類 | 説明 |
ソースデータベースの制限 |
|
その他の制限 |
|
課金
同期タイプ | タスク設定料金 |
スキーマ同期と完全データ同期 | 無料です。 |
増分データ同期 | 有料。 詳細については、「課金の概要」をご参照ください。 |
データ同期をサポートするSQL操作
操作タイプ | SQL 文 |
DML | 挿入、更新、削除 |
DDL | コラム、ドロップコラムを追加 |
データベースアカウントに必要な権限
データベース | 必要な権限 | 関連ドキュメント |
ソースPolarDB for PostgreSQLクラスター | データベースの所有者である特権アカウントの権限 | |
ターゲットApsaraDB for SelectDBインスタンス | USAGE_PRIV権限と次の読み取りおよび書き込み権限: SELECT_PRIV、LOAD_PRIV、ALTER_PRIV、CREATE_PRIV、およびDROP_PRIV。 |
手順
次のいずれかの方法を使用して、[データ同期] ページに移動し、データ同期インスタンスが存在するリージョンを選択します。
DTSコンソール
最初に DTSコンソール
。
左側のナビゲーションウィンドウで、データ同期 を選択します。
ページの左上隅で、データ同期インスタンスが存在するリージョンを選択します。
DMSコンソール
説明実際の操作は、DMSコンソールのモードとレイアウトによって異なります。 詳細については、「シンプルモード」および「DMSコンソールのレイアウトとスタイルのカスタマイズ」をご参照ください。
最初に DMSコンソール
を使用します。
上部のナビゲーションバーで、ポインタを [データ開発] に移動し、
を選択します。データ同期タスク の右側にあるドロップダウンリストから、データ同期インスタンスが存在するリージョンを選択します。
タスクの作成 をクリックして、タスク設定ページに移動します。
(オプションの手順) ページの右上隅にある 新バージョンの設定ページを試してみる をクリックします。
説明ページの右上隅に 旧バージョンの設定ページに戻る ボタンが表示されている場合は、この手順をスキップします。
構成ページの新しいバージョンと以前のバージョンの特定のパラメータは異なる場合があります。 設定ページの新しいバージョンを使用することを推奨します。
ソースデータベースとターゲットデータベースを設定します。 下表に、各パラメーターを説明します。
Category
設定
説明
非該当
タスク名
DTSタスクの名前。 タスク名は自動生成されます。 タスクを簡単に識別できるように、わかりやすい名前を指定することをお勧めします。 一意のタスク名を指定する必要はありません。
移行元データベース
既存の接続情報の選択
使用するデータベース。 ビジネス要件に基づいて、既存のデータベースを使用するかどうかを選択できます。
既存のデータベースを選択すると、DTSはデータベースのパラメーターを自動的に入力します。
既存のデータベースを選択しない場合は、次のデータベース情報を構成する必要があります。
説明DTSコンソールで、データベース接続 ページまたは新しい構成ページでデータベースをDTSに登録します。 詳細については、「データベース接続の管理」をご参照ください。
DMSコンソールで、既存のデータベースをDMS データベースインスタンスの選択 ドロップダウンリスト。 DMS データベースインスタンスの追加 をクリックするか、DMSコンソールのホームページに戻り、データベースをDMSに登録することもできます。 詳細については、「Alibaba Cloudデータベースインスタンスの登録」および「サードパーティのクラウドサービスまたは自己管理データベースでホストされているデータベースの登録」をご参照ください。
データベースタイプ
移行元ディスクのタイプを設定します。 PolarDB for PostgreSQL を選択します。
アクセス方法
ソースデータベースのアクセス方法。 Alibaba Cloud インスタンス を選択します。
インスタンスのリージョン
ソースPolarDB for PostgreSQLクラスターが存在するリージョン。
Alibaba Cloud アカウント間でデータを複製
この例では、現在のAlibaba Cloudアカウントのデータベースが使用されています。 × を選択します。
インスタンス ID
ソースPolarDB for PostgreSQLクラスターのIDを選択します。
データベース名
同期するデータをソースPolarDB for PostgreSQLクラスターに格納するデータベースの名前。
データベースアカウント
ソースPolarDB for PostgreSQLクラスターのデータベースアカウント。 アカウントに必要な権限の詳細については、このトピックの「データベースアカウントに必要な権限」をご参照ください。
データベースのパスワード
データベースへのアクセスに使用されるパスワード。
移行先データベース
既存の接続情報の選択
使用するデータベース。 ビジネス要件に基づいて、既存のデータベースを使用するかどうかを選択できます。
既存のデータベースを選択すると、DTSはデータベースのパラメーターを自動的に入力します。
既存のデータベースを選択しない場合は、次のデータベース情報を構成する必要があります。
説明DTSコンソールで、データベース接続 ページまたは新しい構成ページでデータベースをDTSに登録します。 詳細については、「データベース接続の管理」をご参照ください。
DMSコンソールで、既存のデータベースをDMS データベースインスタンスの選択 ドロップダウンリスト。 DMS データベースインスタンスの追加 をクリックするか、DMSコンソールのホームページに戻り、データベースをDMSに登録することもできます。 詳細については、「Alibaba Cloudデータベースインスタンスの登録」および「サードパーティのクラウドサービスまたは自己管理データベースでホストされているデータベースの登録」をご参照ください。
データベースタイプ
ターゲットデータベースのタイプ。 [SelectDB] を選択します。
アクセス方法
ターゲットデータベースのアクセス方法。 Alibaba Cloud インスタンス を選択します。
インスタンスのリージョン
ターゲットApsaraDB for SelectDBインスタンスが存在するリージョン。
Alibaba Cloud アカウント間でデータを複製
この例では、現在のAlibaba Cloudアカウントのデータベースが使用されています。 × を選択します。
インスタンス ID
ターゲットApsaraDB for SelectDBインスタンスクラスターのID。
データベースアカウント
ターゲットApsaraDB for SelectDBインスタンスのデータベースアカウント。 アカウントに必要な権限の詳細については、このトピックの「データベースアカウントに必要な権限」をご参照ください。
データベースのパスワード
データベースへのアクセスに使用されるパスワード。
ページの下部で、接続をテストして続行 をクリックします。
説明DTSサーバーのCIDRブロックをソースデータベースとターゲットデータベースのセキュリティ設定に自動または手動で追加して、DTSサーバーからのアクセスを許可できるようにします。 詳細については、「DTSサーバーのCIDRブロックの追加」をご参照ください。
同期するオブジェクトを設定します。
オブジェクト設定 ステップで、同期するオブジェクトを設定します。
設定
説明
同期タイプ
同期タイプ。 デフォルトでは、増分データ同期が選択されています。 [スキーマ同期] および [完全データ同期] も選択する必要があります。 事前チェックが完了すると、DTSは選択したオブジェクトの履歴データをソースデータベースからターゲットクラスターに同期します。 履歴データは、その後の増分同期の基礎となる。
重要PolarDB for PostgreSQLクラスターからApsaraDB for SelectDBインスタンスにデータを同期すると、データ型が変換されます。 [スキーマ同期] を選択しない場合は、ターゲットApsaraDB for SelectDBインスタンスで、対応するスキーマを使用して一意または重複キーモデルを使用するテーブルを事前に作成する必要があります。 詳細については、このトピックの [データ型マッピング] および [追加の列] のセクションと [データモデル] を参照してください。
競合するテーブルの処理モード
エラーの事前チェックと報告: ターゲットデータベースに、ソースデータベースのテーブルと同じ名前のテーブルが含まれているかどうかを確認します。 ソースデータベースとターゲットデータベースに同じテーブル名のテーブルが含まれていない場合は、事前チェックに合格します。 それ以外の場合、事前チェック中にエラーが返され、データ同期タスクを開始できません。
説明ソースデータベースとターゲットデータベースに同じ名前のテーブルが含まれていて、ターゲットデータベース内のテーブルを削除または名前変更できない場合は、オブジェクト名マッピング機能を使用して、ターゲットデータベースに同期されるテーブルの名前を変更できます。 詳細については、「マップオブジェクト名」をご参照ください。
エラーを無視して続行: ソースデータベースとターゲットデータベースの同じテーブル名の事前チェックをスキップします。
警告エラーを無視して続行 を選択すると、データの不整合が発生し、ビジネスが潜在的なリスクにさらされる可能性があります。
ソースデータベースとターゲットデータベースが同じスキーマを持ち、ターゲットデータベースのデータレコードがソースデータベースのデータレコードと同じ主キー値または一意キー値を持つ場合:
完全データ同期中、DTSはデータレコードをターゲットデータベースに同期しません。 ターゲットデータベースの既存のデータレコードが保持されます。
増分データ同期中、DTSはデータレコードをターゲットデータベースに同期します。 ターゲットデータベースの既存のデータレコードが上書きされます。
ソースデータベースとターゲットデータベースのスキーマが異なる場合、データの初期化に失敗する可能性があります。 この場合、一部の列のみが同期されるか、データ同期タスクが失敗します。 作業は慎重に行ってください。
移行先インスタンスでのオブジェクト名の大文字化
ターゲットインスタンスのデータベース名、テーブル名、および列名の大文字化。 デフォルトでは、DTSデフォルトポリシーが選択されています。 他のオプションを選択して、オブジェクト名の大文字化をソースまたはターゲットデータベースの大文字化と一致させることができます。 詳細については、「ターゲットインスタンスのオブジェクト名の大文字化の指定」をご参照ください。
ソースオブジェクト
ソースオブジェクト セクションから1つ以上のオブジェクトを選択し、
アイコンをクリックして 選択中のオブジェクト セクションにオブジェクトを追加します。
説明同期するオブジェクトとして、列、テーブル、またはスキーマを選択できます。
選択中のオブジェクト
同期先データベースで同期するオブジェクトの名前を変更するには、選択中のオブジェクト セクションでオブジェクトを右クリックします。 詳細については、「マップオブジェクト名」をご参照ください。
選択したオブジェクトを削除するには、選択中のオブジェクト セクションでオブジェクトをクリックし、
アイコンをクリックしてオブジェクトを ソースオブジェクト セクションに移動します。
[同期タイプ] パラメーターに [スキーマ同期] を選択した場合、同期するオブジェクトとしてテーブルのみを選択でき、
bucket_count
パラメーターを設定する必要があります。 [選択されたオブジェクト] セクションで移行するテーブルを右クリックし、表示される [パラメーター設定] セクションの [パラメーター設定の有効化] パラメーターの [はい] を選択し、ビジネス要件に基づいて [値] を指定し、[OK] をクリックします。
説明オブジェクト名マッピング機能を使用してオブジェクトの名前を変更すると、そのオブジェクトに依存する他のオブジェクトの同期が失敗する可能性があります。
データをフィルタリングするWHERE条件を指定するには、選択中のオブジェクト セクションでテーブルを右クリックします。 表示されるダイアログボックスで、条件を指定します。 詳細については、「フィルター条件の指定」をご参照ください。
増分同期のSQL操作を選択するには、選択中のオブジェクト セクションでオブジェクトを右クリックします。 表示されるダイアログボックスで、同期するSQL操作を選択します。
次へ:詳細設定 をクリックして詳細設定を設定します。
設定
説明
タスクのスケジュールに使用する専用クラスターの選択
デフォルトでは、専用クラスターを指定しない場合、DTSはタスクを共有クラスターにスケジュールします。 データ同期タスクの安定性を向上させたい場合は、専用クラスターを購入してください。 詳細については、「DTS専用クラスターの概要」をご参照ください。
失敗した接続の再試行時間
失敗した接続のリトライ時間範囲。 データ同期タスクの開始後にソースデータベースまたはターゲットデータベースの接続に失敗した場合、DTSはその時間範囲内ですぐに接続を再試行します。 有効な値: 10 ~ 1440 単位:分 デフォルト値: 720 このパラメーターを30より大きい値に設定することを推奨します。 DTSが指定された時間範囲内にソースデータベースとターゲットデータベースに再接続すると、DTSはデータ同期タスクを再開します。 それ以外の場合、データ同期タスクは失敗します。
説明ソースまたはターゲットデータベースが同じである複数のデータ同期タスクに対して異なるリトライ時間範囲を指定した場合、最も短いリトライ時間範囲が優先されます。
DTSが接続を再試行すると、DTSインスタンスに対して課金されます。 業務要件に基づいて再試行時間範囲を指定することを推奨します。 ソースインスタンスとターゲットインスタンスがリリースされた後、できるだけ早くDTSインスタンスをリリースすることもできます。
移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。
その他の問題の再試行時間範囲。 たとえば、データ同期タスクの開始後にDDLまたはDML操作の実行に失敗した場合、DTSはその時間範囲内ですぐに操作を再試行します。 有効な値: 1 ~ 1440 単位:分 デフォルト値は 10 です。 このパラメーターを10より大きい値に設定することを推奨します。 指定された時間範囲内で失敗した操作が正常に実行されると、DTSはデータ同期タスクを再開します。 それ以外の場合、データ同期タスクは失敗します。
重要移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。 パラメーターの値は、失敗した接続の再試行時間 パラメーターの値よりも小さくする必要があります。
完全移行率を制限するかどうか
完全データ同期中、DTSはソースデータベースとターゲットデータベースの読み取りおよび書き込みリソースを使用します。 これにより、データベースサーバーの負荷が増加する可能性があります。 1 秒あたりのソースデータベースのクエリ率 QPS 、1 秒あたりの完全移行の行数 RPS、および1 秒あたりの完全移行データ量 (MB) BPS パラメーターを設定して、ターゲットデータベースサーバーの負荷を軽減できます。
説明このパラメーターは、同期タイプ パラメーターで 完全データ同期 が選択されている場合にのみ表示されます。
増分同期率を制限するかどうか
増分データ同期のスロットリングを有効にするかどうかを指定します。 ビジネス要件に基づいて、増分データ同期のスロットリングを有効にできます。 スロットリングを設定するには、1 秒あたりの増分同期の行数 RPSおよび1 秒あたりの増分同期データ量 (MB) BPS パラメーターを設定する必要があります。 これにより、移行先データベースサーバーの負荷が軽減されます。
環境タグ
環境タグを選択して、実際の状況に基づいてインスタンスを識別できます。 この例では、環境タグは選択されていません。
ETL の設定
抽出、変換、および読み込み (ETL) 機能を有効にするかどうかを指定します。 詳細については、「」をご参照ください。ETLとは何ですか? 有効な値:
Yes: ETL機能を設定します。 コードエディターでデータ処理ステートメントを入力できます。 詳細については、「データ移行またはデータ同期タスクでのETLの設定」をご参照ください。
No: ETL機能を設定しません。
監視アラート
データ同期タスクのアラートを設定するかどうかを指定します。 タスクが失敗するか、同期レイテンシが指定されたしきい値を超えると、アラート送信先は通知を受け取ります。 有効な値:
No: アラートを有効にしません。
Yes: アラートを設定します。 この場合、アラートしきい値と
アラート通知設定 詳細については、「モニタリングとアラートの設定」トピックの「DTSタスクの作成時のモニタリングとアラートの設定」をご参照ください。
オプション: ページの下部で、次:データベースおよびテーブルのフィールド設定 をクリックします。 表示されるダイアログボックスで、同期するテーブルのプライマリキー列の追加、配布キー、およびエンジンの選択パラメーターを指定します。
説明この手順は、同期タイプ パラメーターに スキーマ同期 を選択した場合にのみ使用できます。 定義ステータス を すべて に設定し、データベースとテーブルのフィールドを変更できます。
ドロップダウンリストからプライマリキー列の追加パラメーターに複数の列を選択できます。 プライマリキー列の追加パラメーターに指定した1つ以上の列を配布キーパラメーターに選択できます。
テーブルにプライマリキーまたはUNIQUE制約がない場合は、[Engine] パラメーターに [duplicate] を選択します。 そうしないと、データ同期タスクが失敗するか、データが失われる可能性があります。
タスク設定を保存し、事前チェックを実行します。
関連するAPI操作を呼び出してDTSタスクを設定するときに指定するパラメーターを表示するには、ポインターを 次:タスク設定の保存と事前チェック に移動し、OpenAPI パラメーターのプレビュー をクリックします。
パラメーターを表示または表示する必要がない場合は、ページ下部の 次:タスク設定の保存と事前チェック をクリックします。
説明データ同期タスクを開始する前に、DTSは事前チェックを実行します。 データ同期タスクは、タスクが事前チェックに合格した後にのみ開始できます。
データ同期タスクが事前チェックに失敗した場合は、失敗した各項目の横にある [詳細の表示] をクリックします。 チェック結果に基づいて原因を分析した後、問題のトラブルシューティングを行います。 次に、プレチェックを再実行します。
事前チェック中にアイテムに対してアラートがトリガーされた場合:
アラートアイテムを無視できない場合は、失敗したアイテムの横にある [詳細の表示] をクリックして、問題のトラブルシューティングを行います。 次に、もう一度プレチェックを実行します。
アラート項目を無視できる場合は、[アラート詳細の確認] をクリックします。 [詳細の表示] ダイアログボックスで、[無視] をクリックします。 表示されたメッセージボックスで、[OK] をクリックします。 次に、[再度事前チェック] をクリックして、事前チェックを再度実行します。 アラート項目を無視すると、データの不整合が発生し、ビジネスが潜在的なリスクにさらされる可能性があります。
インスタンスを購入します。
成功率が100% になるまで待ちます。 次に、[次へ: インスタンスの購入] をクリックします。
購入ページで、データ同期インスタンスの課金方法とインスタンスクラスのパラメーターを設定します。 下表にパラメーターを示します。
セクション
パラメーター
説明
新しいインスタンスクラス
Billing Method
サブスクリプション: データ同期インスタンスの作成時にサブスクリプションの料金を支払います。 使用期間が長期の場合、サブスクリプション課金方式は、従量課金方式と比較して費用対効果が高くなります。
従量課金: 従量課金インスタンスは1時間ごとに課金されます。 従量課金方式は、リソースを短期間使用する場合に適しています。 従量課金データ同期インスタンスが不要になった場合は、インスタンスをリリースしてコストを削減できます。
リソースグループの設定
データ同期インスタンスが属するリソースグループ。 デフォルト値: Default resource group 詳細については、「」をご参照ください。リソース管理とは
インスタンスクラス
DTSは、同期速度が異なるインスタンスクラスを提供します。 ビジネス要件に基づいてインスタンスクラスを選択できます。 詳細については、「データ同期インスタンスのインスタンスクラス」をご参照ください。
サブスクリプション期間
サブスクリプションの課金方法を選択した場合は、サブスクリプション期間と作成するデータ同期インスタンスの数を指定します。 サブスクリプション期間は、1〜9か月、1年、2年、3年、または5年とすることができる。
説明このパラメーターは、サブスクリプション の課金方法を選択した場合にのみ使用できます。
読み取りと選択データ伝送サービス (従量課金) サービス規約.
[購入して開始] をクリックします。 表示されるダイアログボックスで、OK をクリックします。
タスクリストでタスクの進行状況を確認できます。
データ型マッピング
カテゴリ | PolarDB for PostgreSQLクラスターのデータ型 | ApsaraDB for SelectDBインスタンスのデータ型 |
NUMERIC | SMALLINT | SMALLINT |
INTEGER | INT | |
BIGINT | BIGINT | |
DECIMAL | DECIMAL | |
NUMERIC | DECIMAL | |
REAL | DOUBLE | |
DOUBLE | DOUBLE | |
SMALLSERIAL | SMALLINT | |
シリアル | INT | |
ビッグシリーズ | BIGINT | |
MONETARY | お金 | STRING |
CHARACTER |
| VARCHAR 重要 データの損失を回避するために、CHARおよびVARCHAR(n) タイプのデータは、データがターゲットSelectDBインスタンスに同期された後にVARCHAR(4 * n) に変換されます。
|
TEXT | STRING | |
BINARY | BYTEA | STRING |
日付と時間 | タイムスタンプ [(P)] [タイムゾーンなし] | DATETIMEV2 |
タイムスタンプ [(P)] タイムゾーン付き | DATETIMEV2 | |
日付 | DATEV2 | |
タイム [(P)] [タイムゾーンなし] | VARCHAR (50) | |
タイムゾーン付きTIME [(P)] | VARCHAR (50) | |
インターバル [フィールド] [(P)] | STRING | |
BOOLEAN | BOOLEAN | BOOLEAN |
ジオメトリック |
| STRING |
ネットワークアドレス |
| STRING |
テキスト検索 | TSVECTOR | STRING |
XML | XML | STRING |
JSON | JSON | JSON |
追加の列
次の表に、DTSによって自動的に作成される、または複製キーモデルのターゲットテーブルに手動で追加される追加の列を示します。
列 | タイプ | デフォルト値 | 説明 |
_is_deleted | Int | 0 | データを削除するかどうかを指定します。
|
_バージョン | Bigint | 0 |
|
_record_id | Bigint | 0 |
|