Data Transmission Service (DTS) を使用して、SQL Server データベースから RDS PostgreSQL インスタンスにデータを同期できます。このトピックでは、Elastic Compute Service (ECS) インスタンス上の SQL Server データベースから データを同期する方法について説明します。
この機能は、中国 (青島)、中国 (北京)、および中国 (香港) リージョンでのみ利用可能です。
前提条件
宛先の RDS PostgreSQL インスタンスが作成されていること。このインスタンスの利用可能なストレージ容量は、ソース SQL Server データベースが占有するストレージ容量よりも大きい必要があります。詳細については、「ApsaraDB RDS for PostgreSQL インスタンスをすばやく作成する」をご参照ください。
説明サポートされているソースデータベースとターゲットデータベースのバージョンについては、「データ同期シナリオの概要」をご参照ください。
同期されたデータを格納するために、宛先の RDS PostgreSQL インスタンスにデータベースが作成されていること。詳細については、「データベースの作成」をご参照ください。
ソースインスタンスが次のいずれかの条件を満たす場合は、同期タスクを複数の小さなタスクに分割することをお勧めします。
同期するデータに複数のスキーマが含まれている。
ソースインスタンスの単一のデータベースが、1 時間に 1 回以上ログをバックアップする。
ソースインスタンスの単一のデータベースが、1 時間に 100 を超える DDL 文を実行する。
ソースインスタンスの単一のデータベースに対して、ログが 20 MB/s を超えるレートで書き込まれる。
変更データキャプチャ (CDC) 機能を 1,000 を超えるテーブルで有効にする必要がある。
使用上の注意
スキーマ同期中、DTS はソースデータベースからターゲットデータベースに外部キーを同期します。
完全データ同期および増分データ同期中、DTS はセッションレベルで外部キーの制約チェックとカスケード操作を一時的に無効にします。データ同期中にソースデータベースでカスケード更新および削除操作を実行すると、データの不整合が発生する可能性があります。
タイプ | 説明 |
ソースデータベースの制限 |
|
その他の制限 |
|
特殊なケース | ソースインスタンスが RDS SQL Server インスタンスの場合、DTS はデータ同期のためにソースインスタンスに |
課金
| 同期タイプ | タスク構成料金 |
| スキーマ同期と完全データ同期 | 無料。 |
| 増分データ同期 | 課金されます。詳細については、「課金の概要」をご参照ください。 |
同期可能な SQL 操作
操作タイプ | SQL 操作 |
DML | INSERT、UPDATE、DELETE 説明 UPDATE 操作がラージオブジェクトのみを更新する場合、DTS はその操作を同期しません。 |
データベースアカウントの権限
データベース | 必要な権限 | アカウント作成と権限付与の方法 |
ソース自己管理 SQL Server | sysadmin 権限。 | CREATE USER および ユーザー権限管理。 |
宛先 RDS PostgreSQL インスタンス | ターゲットデータベース所有者の権限。アカウントはデータベースの所有者である必要があります。 |
準備
データ同期タスクを構成する前に、自己管理 SQL Server データベースでログ設定を構成し、クラスター化インデックスを作成します。- 自己管理 SQL Server データベースで次のステートメントを実行して、復元モデルを完全に変更します。SQL Server Management Studio (SSMS) を使用して復元モデルを変更することもできます。詳細については、「データベースの復元モデルの表示または変更 (SQL Server)」をご参照ください。
パラメーター:use master; GO ALTER DATABASE <database_name> SET RECOVERY FULL WITH ROLLBACK IMMEDIATE; GO<database_name>: ソースデータベースの名前。
例:use master; GO ALTER DATABASE mytestdata SET RECOVERY FULL WITH ROLLBACK IMMEDIATE; GO - 次のステートメントを実行して、ソースデータベースの論理バックアップを作成します。すでに論理バックアップを作成している場合は、このステップをスキップしてください。
パラメーター:BACKUP DATABASE <database_name> TO DISK='<physical_backup_device_name>'; GO- <database_name>: ソースデータベースの名前。
- <physical_backup_device_name>: バックアップファイルのストレージパスとファイル名。
BACKUP DATABASE mytestdata TO DISK='D:\backup\dbdata.bak'; GO - 次のステートメントを実行して、ソースデータベースのログバックアップを作成します。
パラメーター:BACKUP LOG <database_name> to DISK='<physical_backup_device_name>' WITH init; GO- <database_name>: ソースデータベースの名前。
- <physical_backup_device_name>: バックアップファイルのストレージパスとファイル名。
BACKUP LOG mytestdata TO DISK='D:\backup\dblog.bak' WITH init; GO
手順
次のいずれかの方法を使用して [データ同期] ページに移動し、データ同期インスタンスが存在するリージョンを選択します。
DTS コンソール
DTS コンソールにログインします。
左側のナビゲーションウィンドウで、データ同期 をクリックします。
ページの左上隅で、データ同期タスクが存在するリージョンを選択します。
DMS コンソール
説明実際の操作は、DMS コンソールのモードとレイアウトによって異なる場合があります。詳細については、「シンプルモード」および「DMS コンソールのレイアウトとスタイルをカスタマイズする」をご参照ください。
DMS コンソールにログインします。
上部のナビゲーションバーで、[データ + AI] にポインターを合わせ、 を選択します。
データ同期タスク の右側にあるドロップダウンリストから、データ同期インスタンスが存在するリージョンを選択します。
タスクの作成 をクリックして、タスク構成ページに移動します。
ソースデータベースとターゲットデータベースを構成します。次の表にパラメーターを示します。
セクション
パラメーター
説明
N/A
タスク名
DTS タスクの名前。DTS はタスク名を自動的に生成します。タスクを簡単に識別できるわかりやすい名前を指定することをお勧めします。一意のタスク名を指定する必要はありません。
移行元データベース
既存の接続情報の選択
DTS に登録されているデータベースインスタンスを使用する場合は、ドロップダウンリストからインスタンスを選択します。DTS はインスタンスの次のデータベースパラメーターを自動的に入力します。詳細については、「データベース接続の管理」をご参照ください。
説明DMS コンソールでは、[DMS データベースインスタンスの選択] ドロップダウンリストからデータベースインスタンスを選択できます。
DTS へのインスタンスの登録に失敗した場合、または DTS に登録されているインスタンスを使用する必要がない場合は、次のデータベース情報を構成する必要があります。
データベースタイプ
SQL Server を選択します。
アクセス方法
ソースデータベースのデプロイ場所に基づいて接続タイプを選択します。この例では、ECS 上の自己管理データベース を選択します。
説明自己管理データベースに別の接続タイプを選択した場合は、対応する準備も行う必要があります。詳細については、「準備の概要」をご参照ください。
インスタンスのリージョン
ソース SQL Server データベースをホストする ECS インスタンスが存在するリージョンを選択します。
ECS インスタンス ID
ソース SQL Server データベースをホストする ECS インスタンスの ID を選択します。
ポート番号
ソース SQL Server データベースのサービスポートを入力します。デフォルト値は 1433 です。
データベースアカウント
ソース SQL Server データベースのアカウントを入力します。必要な権限については、「データベースアカウントの権限」をご参照ください。
データベースのパスワード
データベースへのアクセスに使用されるパスワード。
暗号化
シナリオに基づいて 非暗号化 または SSL 暗号化 を選択します。
ソースデータベースで SSL 暗号化が有効になっていない場合は、非暗号化 を選択します。
ソースデータベースで SSL 暗号化が有効になっている場合は、SSL 暗号化 を選択します。DTS はデフォルトでサーバー証明書を信頼します。
移行先データベース
既存の接続情報の選択
DTS に登録されているデータベースインスタンスを使用する場合は、ドロップダウンリストからインスタンスを選択します。DTS はインスタンスの次のデータベースパラメーターを自動的に入力します。詳細については、「データベース接続の管理」をご参照ください。
説明DMS コンソールでは、[DMS データベースインスタンスの選択] ドロップダウンリストからデータベースインスタンスを選択できます。
DTS へのインスタンスの登録に失敗した場合、または DTS に登録されているインスタンスを使用する必要がない場合は、次のデータベース情報を構成する必要があります。
データベースタイプ
PostgreSQL を選択します。
アクセス方法
Alibaba Cloud インスタンス を選択します。
インスタンスのリージョン
宛先の RDS PostgreSQL インスタンスが存在するリージョンを選択します。
インスタンス ID
宛先の RDS PostgreSQL インスタンスの ID を選択します。
データベース名
宛先の RDS PostgreSQL インスタンスでデータを受信するために使用されるデータベースの名前を入力します。
データベースアカウント
宛先の RDS PostgreSQL インスタンスのデータベースアカウントを入力します。必要な権限については、「データベースアカウントの権限」をご参照ください。
データベースのパスワード
データベースへのアクセスに使用されるパスワード。
暗号化
ソースデータベースへの接続を暗号化するかどうかを指定します。このパラメーターは、ビジネス要件に基づいて構成できます。この例では、非暗号化 が選択されています。
ソースデータベースへの SSL 暗号化接続を確立する場合は、次の手順を実行します。SSL 暗号化 を選択し、必要に応じて CA 証明書、クライアント証明書、および クライアント証明書の秘密鍵 をアップロードし、クライアント証明書の秘密鍵のパスワード を指定します。
説明[暗号化] を自己管理 PostgreSQL データベースの SSL 暗号化 に設定した場合は、CA 証明書 をアップロードする必要があります。
クライアント証明書を使用する場合は、クライアント証明書 と クライアント証明書の秘密鍵 をアップロードし、クライアント証明書の秘密鍵のパスワード を指定する必要があります。
ApsaraDB RDS for PostgreSQL インスタンスの SSL 暗号化を構成する方法については、「SSL 暗号化」をご参照ください。
ページの下部で、接続をテストして続行 をクリックします。DTS サーバーの CIDR ブロック ダイアログボックスで、接続テスト をクリックします。
説明DTS サーバーからのアクセスを許可するために、DTS サーバーの CIDR ブロックがソースデータベースとターゲットデータベースのセキュリティ設定に自動または手動で追加できることを確認してください。詳細については、「DTS サーバーの IP アドレスをホワイトリストに追加する」をご参照ください。
同期するオブジェクトを構成します。
オブジェクト設定 ステップで、同期するオブジェクトを構成します。
パラメーター
説明
同期タイプ
同期タイプ。デフォルトでは、[増分データ同期] が選択されています。[スキーマ同期] と [完全データ同期] も選択する必要があります。事前チェックが完了すると、DTS は選択したオブジェクトの既存データをソースデータベースから宛先クラスターに同期します。既存データは、後続の増分同期の基礎となります。
SQL Server 増分同期モード
クラスター化テーブルはログ解析で増分同期し、ヒープテーブルの場合は CDC で増分同期します (ハイブリッド式ログ解析):
利点:
このモードは、ヒープテーブル、プライマリキーのないテーブル、圧縮テーブル、および計算列のあるテーブルをサポートします。
このモードは、より高い安定性とさまざまな完全な DDL 文を提供します。
短所:
DTS は、ソースデータベースにトリガー dts_cdc_sync_ddl、ハートビートテーブル dts_sync_progress、および DDL ストレージテーブル dts_cdc_ddl_history を作成し、ソースデータベースと特定のテーブルに対して変更データキャプチャ (CDC) を有効にします。
ソースデータベースで CDC が有効になっているテーブルに対して SELECT INTO、TRUNCATE、または RENAME COLUMN 文を実行することはできません。ソースデータベースで DTS によって作成されたトリガーは手動で削除できません。
ソースデータベースのログに基づく増分同期 (ヒープテーブル非対応):
利点:
このモードでは、ソースデータベースの設定は変更されません。
短所:
このモードは、ヒープテーブル、プライマリキーのないテーブル、圧縮テーブル、または計算列のあるテーブルをサポートしていません。
増分同期のための CDC インスタンスのポーリングとクエリ:
利点:
ソースデータベースが Amazon RDS for SQL Server インスタンス、Microsoft Azure SQL Database のデータベース、Microsoft Azure SQL Managed Instance、Microsoft Azure SQL Server on Virtual Machine、または Google Cloud SQL for SQL Server インスタンスである場合、完全データ同期と増分データ同期がサポートされます。
SQL Server のネイティブ CDC コンポーネントを使用して増分データを取得できます。これにより、増分データ同期の安定性が向上し、帯域幅の使用量が削減されます。
短所:
DTS がソースデータベースへのアクセスに使用するアカウントには、CDC 機能を有効にする権限が必要です。増分データ同期には 10 秒の遅延があります。
複数のデータベース内の複数のテーブルを同期するように DTS タスクを構成すると、安定性とパフォーマンスの問題が発生する可能性があります。
DTS がサポートする CDC が有効になっているテーブルの最大数の制限
現在の同期インスタンスが CDC を有効にできるテーブルの最大数を指定します。デフォルト値は 1000 です。
説明このパラメーターは、SQL Server 増分同期モード が ソースデータベースのログに基づく増分同期 (ヒープテーブル非対応) に設定されている場合は使用できません。
競合するテーブルの処理モード
エラーの事前チェックと報告: ターゲットデータベースにソースデータベースのテーブルと同じ名前のテーブルが含まれているかどうかを確認します。ソースデータベースとターゲットデータベースに同じテーブル名のテーブルが含まれていない場合、事前チェックは合格します。それ以外の場合は、事前チェック中にエラーが返され、データ同期タスクを開始できません。
説明ソースデータベースとターゲットデータベースに同じ名前のテーブルが含まれており、ターゲットデータベースのテーブルを削除または名前変更できない場合は、オブジェクト名マッピング機能を使用して、ターゲットデータベースに同期されるテーブルの名前を変更できます。詳細については、「オブジェクト名のマッピング」をご参照ください。
エラーを無視して続行: ソースデータベースとターゲットデータベースの同一テーブル名の事前チェックをスキップします。
警告エラーを無視して続行 を選択すると、データの不整合が発生し、ビジネスに潜在的なリスクが生じる可能性があります。
ソースデータベースとターゲットデータベースのスキーマが同じで、ターゲットデータベースのデータレコードがソースデータベースのデータレコードと同じプライマリキー値または一意キー値を持つ場合:
完全データ同期中、DTS はデータレコードをターゲットデータベースに同期しません。ターゲットデータベースの既存のデータレコードは保持されます。
増分データ同期中、DTS はデータレコードをターゲットデータベースに同期します。ターゲットデータベースの既存のデータレコードは上書きされます。
ソースデータベースとターゲットデータベースのスキーマが異なる場合、データの初期化に失敗することがあります。この場合、一部の列のみが同期されるか、データ同期インスタンスが失敗します。注意して進めてください。
移行先インスタンスでのオブジェクト名の大文字化
宛先インスタンスのデータベース名、テーブル名、列名の大文字/小文字。デフォルトでは、[DTS デフォルトポリシー] が選択されています。他のオプションを選択して、オブジェクト名の大文字/小文字がソースデータベースまたはターゲットデータベースと一致するようにすることができます。詳細については、「宛先インスタンスのオブジェクト名の大文字/小文字を指定する」をご参照ください。
ソースオブジェクト
ソースオブジェクト ボックスで、同期するテーブルをクリックし、
をクリックして 選択中のオブジェクト ボックスに移動します。重要同期するオブジェクトとしてテーブルのみを選択できます。同期するすべてのテーブルは同じスキーマにある必要があります。そうしないと、データの不整合が発生したり、データ同期タスクが失敗したりする可能性があります。
選択中のオブジェクト
デフォルトでは、ソーススキーマ名が宛先スキーマ名として使用され、ソーステーブル名が宛先テーブル名として使用されます。
宛先の RDS PostgreSQL インスタンスのスキーマ名を変更するには、選択中のオブジェクト セクションで同期するテーブルのスキーマを右クリックします。表示される スキーマの編集 ダイアログボックスで、スキーマ名 を変更します。
説明選択中のオブジェクト セクションで同期するテーブルを右クリックして、宛先テーブルまたは列の名前を変更したり、WHERE 条件を設定してデータをフィルターしたりすることもできます。詳細については、「フィルター条件の指定」および「オブジェクト名のマッピング」をご参照ください。
増分同期の SQL 操作を選択するには、選択中のオブジェクト セクションでオブジェクトを右クリックします。表示されるダイアログボックスで、同期する SQL 操作を選択します。
選択したオブジェクトを削除するには、選択中のオブジェクト ボックスでオブジェクトをクリックし、
をクリックして ソースオブジェクト ボックスに移動します。
次へ:詳細設定 をクリックして詳細設定を構成します。
パラメーター
説明
タスクのスケジュールに使用する専用クラスターの選択
デフォルトでは、専用クラスターを指定しない場合、DTS はタスクを共有クラスターにスケジュールします。データ同期インスタンスの安定性を向上させたい場合は、専用クラスターを購入してください。詳細については、「DTS 専用クラスターとは」をご参照ください。
失敗した接続の再試行時間
失敗した接続のリトライ時間範囲。データ同期タスクの開始後にソースデータベースまたはターゲットデータベースへの接続に失敗した場合、DTS は時間範囲内で即座に接続をリトライします。有効値: 10~1440。単位: 分。デフォルト値: 720。このパラメーターは 30 より大きい値に設定することをお勧めします。DTS が指定された時間範囲内にソースデータベースとターゲットデータベースに再接続すると、DTS はデータ同期タスクを再開します。そうでない場合、データ同期タスクは失敗します。
説明同じソースデータベースまたはターゲットデータベースを持つ複数のデータ同期タスクに異なるリトライ時間範囲を指定した場合、最も短いリトライ時間範囲が優先されます。
DTS が接続をリトライすると、DTS インスタンスに対して課金されます。ビジネス要件に基づいてリトライ時間範囲を指定することをお勧めします。ソースインスタンスと宛先インスタンスがリリースされた後、できるだけ早く DTS インスタンスをリリースすることもできます。
移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。
その他の問題のリトライ時間範囲。たとえば、データ同期タスクの開始後に DDL または DML 操作の実行に失敗した場合、DTS は時間範囲内で即座に操作をリトライします。有効値: 1~1440。単位: 分。デフォルト値: 10。このパラメーターは 10 より大きい値に設定することをお勧めします。指定された時間範囲内に失敗した操作が正常に実行されると、DTS はデータ同期タスクを再開します。そうでない場合、データ同期タsクは失敗します。
重要移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。 パラメーターの値は、失敗した接続の再試行時間 パラメーターの値より小さくする必要があります。
完全同期レートを制限するかどうか
完全データ同期中、DTS はソースデータベースとターゲットデータベースの読み取りおよび書き込みリソースを使用します。これにより、データベースサーバーの負荷が増加する可能性があります。1 秒あたりのソースデータベースのクエリ率 QPS、1 秒あたりの完全移行の行数 RPS、および 1 秒あたりの完全移行データ量 (MB) BPS パラメーターを完全データ同期タスクに構成して、ターゲットデータベースサーバーの負荷を軽減できます。
説明このパラメーターは、同期タイプ パラメーターで 完全データ同期 が選択されている場合にのみ構成できます。
増分同期率を制限するかどうか
増分データ同期のスロットリングを有効にするかどうかを指定します。ビジネス要件に基づいて、増分データ同期のスロットリングを有効にできます。スロットリングを構成するには、1 秒あたりの増分同期の行数 RPS および 1 秒あたりの増分同期データ量 (MB) BPS パラメーターを構成する必要があります。これにより、ターゲットデータベースサーバーの負荷が軽減されます。
環境タグ
必要に応じて、インスタンスを識別するための環境タグを選択できます。この例では、タグを選択する必要はありません。
ETL の設定
抽出・変換・書き出し (ETL) 機能を有効にするかどうかを指定します。詳細については、「ETL とは」をご参照ください。有効値:
[はい]: ETL 機能を構成します。コードエディタにデータ処理文を入力できます。詳細については、「データ移行またはデータ同期タスクで ETL を構成する」をご参照ください。
[いいえ]: ETL 機能を構成しません。
監視アラート
データ同期インスタンスのアラートを構成するかどうかを指定します。タスクが失敗した場合、または同期遅延が指定されたしきい値を超えた場合、アラート連絡先は通知を受け取ります。有効値:
[いいえ]: アラートを有効にしません。
[はい]: アラートを構成します。この場合、アラートのしきい値と アラート通知設定も構成する必要があります。詳細については、「DTS タスク作成時のモニタリングとアラートの構成」トピックの「DTS タスク作成時のモニタリングとアラートの構成」セクションをご参照ください。
[次のステップ: データ検証] をクリックしてデータ検証を構成します。
データ検証機能の使用方法の詳細については、「データ検証タスクの構成」をご参照ください。
タスク設定を保存し、事前チェックを実行します。
関連する API 操作を呼び出して DTS タスクを構成するときに指定するパラメーターを表示するには、次:タスク設定の保存と事前チェック にポインターを合わせ、OpenAPI パラメーターのプレビュー をクリックします。
パラメーターを表示する必要がない場合、または表示済みの場合は、ページの下部にある 次:タスク設定の保存と事前チェック をクリックします。
説明データ同期タスクを開始する前に、DTS は事前チェックを実行します。データ同期タスクは、タスクが事前チェックに合格した後にのみ開始できます。
データ同期タスクが事前チェックに失敗した場合は、失敗した各項目の横にある [詳細の表示] をクリックします。チェック結果に基づいて原因を分析した後、問題をトラブルシューティングします。その後、事前チェックを再実行します。
事前チェック中に項目のアラートがトリガーされた場合:
アラート項目を無視できない場合は、失敗した項目の横にある [詳細の表示] をクリックして問題をトラブルシューティングします。その後、事前チェックを再度実行します。
アラート項目を無視できる場合は、[アラート詳細の確認] をクリックします。[詳細の表示] ダイアログボックスで、[無視] をクリックします。表示されるメッセージで、[OK] をクリックします。次に、[事前チェックを再実行] をクリックして事前チェックを再度実行します。アラート項目を無視すると、データの不整合が発生し、ビジネスに潜在的なリスクが生じる可能性があります。
インスタンスを購入します。
[成功率] が [100%] になるまで待ってから、[次へ: インスタンスの購入] をクリックします。
[購入] ページで、データ同期タスクの課金方法とインスタンスクラスのパラメーターを構成します。次の表にパラメーターを示します。
セクション
パラメーター
説明
新しいインスタンスクラス
課金方法
サブスクリプション: データ同期インスタンスを作成するときにサブスクリプションの料金を支払います。サブスクリプション課金方法は、長期使用の場合、従量課金方法よりも費用対効果が高くなります。
従量課金: 従量課金インスタンスは時間単位で課金されます。従量課金方法は短期使用に適しています。従量課金データ同期インスタンスが不要になった場合は、インスタンスをリリースしてコストを削減できます。
リソースグループ設定
データ同期インスタンスが属するリソースグループ。デフォルト値: [デフォルトのリソースグループ]。詳細については、「Resource Management とは」をご参照ください。
インスタンスクラス
DTS は、同期速度が異なるインスタンスクラスを提供します。ビジネス要件に基づいてインスタンスクラスを選択できます。詳細については、「データ同期インスタンスのインスタンスクラス」をご参照ください。
サブスクリプション期間
サブスクリプション課金方法を選択した場合は、サブスクリプション期間と作成するデータ同期インスタンスの数を指定します。サブスクリプション期間は、1~9 か月、1 年、2 年、3 年、または 5 年にすることができます。
説明このパラメーターは、サブスクリプション 課金方法を選択した場合にのみ使用できます。
[Data Transmission Service (従量課金) サービス規約] を読んで選択します。
[購入して開始] をクリックします。表示されるダイアログボックスで、OK をクリックします。
タスクリストでタスクの進捗状況を表示できます。