Data Transmission Service (DTS) は、自主管理 PostgreSQL データベースや ApsaraDB RDS for PostgreSQL インスタンスなどの PostgreSQL データベースから、大規模なデータ分析のために ApsaraDB for SelectDB へのデータ移行をサポートします。このトピックでは、ソースデータベースとして ApsaraDB RDS for PostgreSQL インスタンスを使用した手順について説明します。
前提条件
ソースの ApsaraDB RDS for PostgreSQL インスタンスよりも多くのストレージ容量を持つ、移行先の ApsaraDB for SelectDB インスタンスを作成します。詳細については、「インスタンスの作成」をご参照ください。
注意事項
タイプ | 説明 |
ソースデータベースの制限 |
|
その他の制限 |
|
特殊なケース |
|
課金
移行タイプ | リンク設定料金 | データ転送料金 |
スキーマ移行と完全データ移行 | 無料。 | この例では無料です。 |
増分データ移行 | 有料です。詳細については、「課金の概要」をご参照ください。 |
増分移行でサポートされる SQL 操作
操作タイプ | SQL 文 |
DML | INSERT、UPDATE、DELETE |
DDL | ADD COLUMN、DROP COLUMN |
データベースアカウントに必要な権限
データベース | 必要な権限 | アカウントの作成と権限付与の方法 |
ソース ApsaraDB RDS for PostgreSQL インスタンス | 移行対象データベースの所有者である特権アカウント。 | |
宛先 SelectDB インスタンス | クラスターへのアクセス権限 (Usage_priv) およびデータベースに対する読み取り/書き込み権限 (Select_priv、Load_priv、Alter_priv、Create_priv、および Drop_priv)。 |
操作手順
次のいずれかの方法で [データ移行] ページに移動し、データ移行インスタンスが存在するリージョンを選択します。
DTS コンソール
DTS コンソールにログインします。
左側のナビゲーションウィンドウで、データの移行 をクリックします。
ページの左上隅で、データ移行インスタンスが存在するリージョンを選択します。
DMS コンソール
説明実際の操作は、DMS コンソールのモードとレイアウトによって異なる場合があります。詳細については、「シンプルモード」および「DMS コンソールのレイアウトとスタイルをカスタマイズする」をご参照ください。
DMS コンソールにログインします。
上部のナビゲーションバーで、ポインターを に移動します。
[データ移行タスク] の右側にあるドロップダウンリストから、データ同期インスタンスが存在するリージョンを選択します。
タスクの作成 をクリックして、タスク設定ページに移動します。
ソースデータベースとターゲットデータベースを設定します。次の表にパラメーターを示します。
カテゴリ
設定
説明
なし
タスク名
DTS は自動的にタスク名を生成します。簡単に識別できるように、わかりやすい名前を指定することを推奨します。名前は一意である必要はありません。
移行元データベース
既存の接続情報の選択
DTS に登録されているデータベースインスタンスを使用する場合、ドロップダウンリストからインスタンスを選択します。DTS はインスタンスの次のデータベースパラメーターを自動的に入力します。詳細については、「データベース接続の管理」をご参照ください。
説明DMS コンソールでは、[DMS データベースインスタンスを選択] ドロップダウンリストからデータベースインスタンスを選択できます。
DTS へのインスタンス登録に失敗した場合、または DTS に登録されているインスタンスを使用する必要がない場合は、次のデータベース情報を設定する必要があります。
データベースタイプ
PostgreSQL を選択します。
アクセス方法
Alibaba Cloud インスタンス を選択します。
インスタンスのリージョン
ソース ApsaraDB RDS for PostgreSQL インスタンスが存在するリージョンを選択します。
Alibaba Cloud アカウント間でデータを複製
この例では、現在の Alibaba Cloud アカウントのデータベースインスタンスが使用されます。× を選択します。
インスタンス ID
ソース ApsaraDB RDS for PostgreSQL インスタンスの ID を選択します。
データベース名
ソース ApsaraDB RDS for PostgreSQL インスタンスで移行するオブジェクトを含むデータベースの名前を入力します。
データベースアカウント
ソース ApsaraDB RDS for PostgreSQL インスタンスのデータベースアカウントを入力します。必要な権限の詳細については、「データベースアカウントに必要な権限」をご参照ください。
データベースのパスワード
データベースアカウントに対応するパスワードを入力します。
移行先データベース
既存の接続情報の選択
DTS に登録されているデータベースインスタンスを使用する場合、ドロップダウンリストからインスタンスを選択します。DTS はインスタンスの次のデータベースパラメーターを自動的に入力します。詳細については、「データベース接続の管理」をご参照ください。
説明DMS コンソールでは、[DMS データベースインスタンスを選択] ドロップダウンリストからデータベースインスタンスを選択できます。
DTS へのインスタンス登録に失敗した場合、または DTS に登録されているインスタンスを使用する必要がない場合は、次のデータベース情報を設定する必要があります。
データベースタイプ
[SelectDB] を選択します。
アクセス方法
Alibaba Cloud インスタンス を選択します。
インスタンスのリージョン
宛先 SelectDB インスタンスが存在するリージョンを選択します。
Alibaba Cloud アカウント間でデータを複製
この例では、現在の Alibaba Cloud アカウントのデータベースインスタンスが使用されます。× を選択します。
インスタンス ID
宛先 SelectDB インスタンスの ID を選択します。
データベースアカウント
宛先 SelectDB インスタンスのデータベースアカウントを入力します。必要な権限の詳細については、「データベースアカウントに必要な権限」をご参照ください。
データベースのパスワード
データベースインスタンスへのアクセスに使用するパスワード。
ページの下部で、[接続をテストして続行] をクリックします。
説明DTS サーバーからのアクセスを許可するために、DTS サーバーの CIDR ブロックがソースデータベースとターゲットデータベースのセキュリティ設定に自動または手動で追加されていることを確認してください。詳細については、「DTS サーバーの IP アドレスをホワイトリストに追加する」をご参照ください。
ソースまたはターゲットデータベースが自己管理データベースであり、その アクセス方法 が Alibaba Cloud インスタンス に設定されていない場合、DTS サーバーの CIDR ブロック ダイアログボックスで 接続テスト をクリックします。
移行するオブジェクトを設定します。
オブジェクト設定 ページで、移行するオブジェクトを設定します。
設定
説明
移行タイプ
完全データ移行のみを実行する場合は、スキーマ移行 と 完全データ移行 を選択します。
ゼロダウンタイム移行を実行するには、スキーマ移行、完全データ移行、および 増分データ移行 を選択します。
重要PostgreSQL データベースから SelectDB インスタンスへのデータ移行中、データ型が変換されます。スキーマ移行 を選択しない場合は、事前に宛先の SelectDB インスタンスに Unique または Duplicate モデルを使用し、必要な構造を持つテーブルを作成する必要があります。詳細については、「データ型のマッピング」、「追加列に関する情報」、および「データモデル」をご参照ください。
増分データ移行 を選択した場合、データ整合性を確保するために、データ移行中にソースインスタンスに新しいデータを書き込まないでください。
競合するテーブルの処理モード
エラーの事前チェックと報告:ターゲットデータベースに同じ名前のテーブルが存在するかどうかをチェックします。同じ名前のテーブルが存在しない場合、このチェック項目は合格します。同じ名前のテーブルが存在する場合、事前チェックフェーズでエラーが報告され、データ移行タスクは開始されません。
説明ターゲットデータベースで同じ名前のテーブルを削除または名前変更できない場合は、ターゲットデータベースでテーブルの名前を変更できます。詳細については、「テーブル名と列名のマッピング」をご参照ください。
エラーを無視して続行:ターゲットデータベースに同じ名前のテーブルが存在するかどうかのチェックをスキップします。
警告エラーを無視して続行 を選択すると、データ不整合が発生し、ビジネスにリスクをもたらす可能性があります。例:
テーブルスキーマが一致し、DTS がターゲットデータベースでソースデータベースのレコードと同じプライマリキー値を持つレコードに遭遇した場合、DTS は宛先クラスターのレコードを保持しません。ソースデータベースのレコードがターゲットデータベースのレコードを上書きします。
テーブルスキーマが一致しない場合、一部の列のデータのみが移行されるか、移行が失敗する可能性があります。注意して進めてください。
移行先インスタンスでのオブジェクト名の大文字化
宛先インスタンスのデータベース名、テーブル名、列名の大文字/小文字。デフォルトでは、[DTS のデフォルトポリシー] が選択されています。オブジェクト名の大文字/小文字がソースまたはターゲットデータベースのものと一致するように、他のオプションを選択できます。詳細については、「宛先インスタンスのオブジェクト名の大文字/小文字を指定する」をご参照ください。
ソースオブジェクト
ソースオブジェクト セクションから 1 つ以上のオブジェクトを選択します。
アイコンをクリックして、オブジェクトを 選択中のオブジェクト セクションに追加します。説明スキーマまたはテーブルレベルで移行オブジェクトを選択できます。
選択中のオブジェクト
宛先インスタンスで移行するオブジェクトの名前を指定したり、宛先インスタンスでデータを受信するオブジェクトを指定したりするには、選択中のオブジェクト セクションでオブジェクトを右クリックします。詳細については、「オブジェクト名のマッピング」をご参照ください。
移行対象として選択されている 1 つ以上のオブジェクトを削除するには、選択中のオブジェクト セクションでオブジェクトをクリックし、
アイコンをクリックしてオブジェクトを ソースオブジェクト セクションに移動します。移行タイプ として スキーマ移行 を選択した場合、テーブルレベルで移行するオブジェクトを選択する必要があります。次に、バケット数 (
bucket_countパラメーター) を設定する必要があります。これを行うには、選択中のオブジェクト リストでテーブルを右クリックします。パラメーター設定 セクションで、パラメーター設定の有効化 を ○ に設定し、要件に基づいて パラメーター値 を指定してから、[OK] をクリックします。
説明オブジェクト名マッピング機能を使用してオブジェクトの名前を変更すると、そのオブジェクトに依存する他のオブジェクトの移行が失敗する可能性があります。
WHERE 条件を指定してデータをフィルタリングするには、選択中のオブジェクト セクションでテーブルを右クリックします。表示されるダイアログボックスで、条件を指定します。詳細については、「フィルター条件の設定」をご参照ください。
増分移行の SQL 操作を選択するには、選択中のオブジェクト セクションでオブジェクトを右クリックします。表示されるダイアログボックスで、移行する SQL 操作を選択します。
詳細設定へ をクリックして、詳細設定を行います。
設定
説明
タスクのスケジュールに使用する専用クラスターの選択
デフォルトでは、専用クラスターを指定しない場合、DTS はデータ移行タスクを共有クラスターにスケジュールします。データ移行タスクの安定性を向上させたい場合は、専用クラスターを購入してください。詳細については、「DTS 専用クラスターとは」をご参照ください。
失敗した接続の再試行時間
接続失敗時のリトライ時間範囲。データ移行タスク開始後にソースまたはターゲットデータベースへの接続に失敗した場合、DTS はリトライ時間範囲内ですぐに接続をリトライします。有効な値:10~1,440。単位:分。デフォルト値:720。パラメーターを 30 より大きい値に設定することを推奨します。指定されたリトライ時間範囲内に DTS がソースおよびターゲットデータベースに再接続された場合、DTS はデータ移行タスクを再開します。そうでない場合、データ移行タスクは失敗します。
説明同じソースまたはターゲットデータベースを共有する複数のデータ移行タスクに異なるリトライ時間範囲を指定した場合、後で指定された値が優先されます。
DTS が接続をリトライする際、DTS インスタンスに対して課金されます。ビジネス要件に基づいてリトライ時間範囲を指定することを推奨します。また、ソースデータベースと宛先インスタンスがリリースされた後、できるだけ早く DTS インスタンスをリリースすることもできます。
移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。
その他の問題に対するリトライ時間範囲。たとえば、データ移行タスク開始後に DDL または DML 操作の実行に失敗した場合、DTS はリトライ時間範囲内ですぐに操作をリトライします。有効な値:1~1440。単位:分。デフォルト値:10。パラメーターを 10 より大きい値に設定することを推奨します。指定されたリトライ時間範囲内に失敗した操作が正常に実行された場合、DTS はデータ移行タスクを再開します。そうでない場合、データ移行タスクは失敗します。
重要移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。 パラメーターの値は、失敗した接続の再試行時間 パラメーターの値より小さくする必要があります。
完全移行率を制限するかどうか
完全データ移行の速度制限を有効にするかどうかを指定します。完全データ移行中、DTS はソースおよびターゲットデータベースの読み取り/書き込みリソースを使用します。これにより、データベースサーバーの負荷が増加する可能性があります。ビジネス要件に基づいて、完全データ移行の速度制限を有効にできます。速度制限を設定するには、1 秒あたりのソースデータベースのクエリ率 QPS、1 秒あたりの完全移行の行数 RPS、および 1 秒あたりの完全移行データ量 (MB) BPS パラメーターを設定する必要があります。これにより、ターゲットデータベースサーバーの負荷が軽減されます。
説明このパラメーターは、移行タイプ パラメーターで 完全データ移行 を選択した場合にのみ設定できます。
増分移行率を制限するかどうか
増分データ移行の速度制限を有効にするかどうかを指定します。速度制限を設定するには、1 秒あたりの増分移行の行数 RPS および 1 秒あたりの増分移行データ量 (MB) BPS パラメーターを設定する必要があります。これにより、ターゲットデータベースサーバーの負荷が軽減されます。
説明このパラメーターは、移行タイプ パラメーターで 増分データ移行 を選択した場合にのみ設定できます。
環境タグ
インスタンスを識別するために環境タグを選択できます。この例では、タグを選択する必要はありません。
ETL 機能の設定
抽出・変換・書き出し (ETL) 機能を有効にするかどうかを指定します。詳細については、「ETL とは」をご参照ください。有効な値:
[はい]:ETL 機能を設定します。コードエディタでデータ処理文を入力できます。詳細については、「データ移行またはデータ同期タスクで ETL を設定する」をご参照ください。
[いいえ]:ETL 機能を設定しません。
監視アラート
データ移行タスクのアラートを設定するかどうかを指定します。タスクが失敗した場合、または移行遅延が指定されたしきい値を超えた場合、アラート連絡先は通知を受け取ります。有効な値:
[いいえ]:アラートを設定しません。
はい: アラートを設定します。 この場合、アラートのしきい値とアラート通知設定も設定する必要があります。 詳細については、監視とアラートの設定 Topic の「DTS タスクの作成時に監視とアラートを設定する」セクションをご参照ください。
オプション:上記の設定を完了した後、次:データベースおよびテーブルのフィールド設定 をクリックして、宛先テーブルの プライマリキー列の追加、配布キー、および エンジンの選択 を設定します。
説明このステップは、タスクオブジェクトを設定する際に 移行タイプ として スキーマ移行 を選択した場合にのみ利用可能です。定義ステータス を すべて に設定して変更を行うことができます。
プライマリキー列の追加 は、複数の列で構成される複合プライマリキーにすることができます。配布キー として機能させるために、プライマリキー列の追加 から 1 つ以上の列を選択する必要があります。
プライマリキーも一意制約もないテーブルの場合、エンジンの選択 を [duplicate] に設定してください。そうしないと、インスタンスの障害やデータ損失が発生する可能性があります。
タスク設定を保存し、事前チェックを実行します。
DTS タスクを設定するために該当する API 操作を呼び出す際に指定するパラメーターを表示するには、次:タスク設定の保存と事前チェック にポインターを合わせ、OpenAPI パラメーターのプレビュー をクリックします。
パラメーターを表示する必要がない場合、または表示済みの場合、ページの下部にある 次:タスク設定の保存と事前チェック をクリックします。
説明データ移行タスクを開始する前に、DTS は事前チェックを実行します。タスクが事前チェックに合格した後にのみ、データ移行タスクを開始できます。
タスクが事前チェックに合格しなかった場合、失敗した各項目の横にある [詳細の表示] をクリックします。チェック結果に基づいて原因を分析した後、問題をトラブルシューティングします。その後、再度事前チェックを実行します。
事前チェック中に項目に対してアラートがトリガーされた場合:
アラート項目が無視できない場合、失敗した項目の横にある [詳細の表示] をクリックし、問題をトラブルシューティングします。その後、再度事前チェックを実行します。
アラート項目が無視できる場合、[アラート詳細の確認] をクリックします。[詳細の表示] ダイアログボックスで、[無視] をクリックします。表示されるメッセージで、[OK] をクリックします。その後、[再度事前チェック] をクリックして、再度事前チェックを実行します。アラート項目を無視すると、データ不整合が発生し、ビジネスに潜在的なリスクがもたらされる可能性があります。
インスタンスを購入します。
[成功率] が [100%] になるまで待ちます。その後、[次へ:インスタンスの購入] をクリックします。
[インスタンスの購入] ページで、データ移行インスタンスの [インスタンスクラス] パラメーターを設定します。次の表にパラメーターを示します。
セクション
パラメーター
説明
新しいインスタンスクラス
リソースグループ
データ移行インスタンスが属するリソースグループ。デフォルト値:[デフォルトリソースグループ]。詳細については、「Resource Management とは」をご参照ください。
インスタンスクラス
DTS は、移行速度が異なるインスタンスクラスを提供します。ビジネスシナリオに基づいてインスタンスクラスを選択できます。詳細については、「データ移行インスタンスのインスタンスクラス」をご参照ください。
チェックボックスを選択して、[Data Transmission Service (従量課金) 利用規約] を読み、同意します。
[購入して開始] をクリックします。表示されたメッセージで、、[OK] をクリックします。
[データ移行] ページでタスクの進行状況を表示できます。
説明データ移行タスクが増分データを移行するために使用できない場合、タスクは自動的に停止します。[ステータス] セクションに [完了] が表示されます。
データ移行タスクが増分データを移行するために使用できる場合、タスクは自動的に停止しません。増分データ移行タスクは決して停止または完了しません。[ステータス] セクションに [実行中] が表示されます。
データ型のマッピング
カテゴリ | PostgreSQL データ型 | SelectDB データ型 |
NUMERIC | SMALLINT | SMALLINT |
INTEGER | INT | |
BIGINT | BIGINT | |
DECIMAL | DECIMAL | |
NUMERIC | DECIMAL | |
REAL | DOUBLE | |
DOUBLE | DOUBLE | |
SMALLSERIAL | SMALLINT | |
SERIAL | INT | |
BIGSERIAL | BIGINT | |
MONETARY | MONEY | STRING |
CHARACTER |
| VARCHAR 重要 データ損失を防ぐため、CHAR(n) および VARCHAR(n) 型のデータは、SelectDB インスタンスに移行された後、VARCHAR(4*n) に変換されます。
|
TEXT | STRING | |
BINARY | BYTEA | STRING |
DATE AND TIME | TIMESTAMP [(P)] [WITHOUT TIME ZONE] | DATETIMEV2 |
TIMESTAMP [(P)] WITH TIME ZONE | DATETIMEV2 | |
DATE | DATEV2 | |
TIME [(P)] [WITHOUT TIME ZONE] | VARCHAR(50) | |
TIME [(P)] WITH TIME ZONE | VARCHAR(50) | |
INTERVAL [FIELDS] [(P)] | STRING | |
BOOLEAN | BOOLEAN | BOOLEAN |
GEOMETRIC |
| STRING |
NETWORK ADDRESS |
| STRING |
TEXT SEARCH | TSVECTOR | STRING |
XML | XML | STRING |
JSON | JSON | JSON |
追加列に関する情報
次の表は、DTS によって自動的に追加されるか、Duplicate モデルを使用する宛先テーブルに手動で追加する必要がある追加列について説明しています。
名前 | データ型 | デフォルト値 | 説明 |
_is_deleted | Int | 0 | データが削除されたかどうかを示します。
|
_version | Bigint | 0 |
|
_record_id | Bigint | 0 |
|