Data Transmission Service (DTS) では、自己管理 SQL Server データベースを AnalyticDB for PostgreSQL に同期できます。これにより、リアルタイム分析向けのデータ転送を容易に行えます。
前提条件
対応している自己管理 SQL Server データベースのバージョンについては、「同期の概要」をご参照ください。
宛先の AnalyticDB for PostgreSQL インスタンスを作成します。まだ作成していない場合は、「インスタンスの作成」をご参照ください。
宛先の AnalyticDB for PostgreSQL インスタンスのストレージ容量は、自己管理 SQL Server データベースが使用しているストレージ容量より大きい必要があります。
-
ソースインスタンスに以下のいずれかの条件が該当する場合は、同期を複数のタスクに分割してください。
-
データベース数が 10 を超える場合。
-
単一のデータベースに対して 1 時間あたり 1 回を超えるログバックアップが実行される場合。
-
単一のデータベースに対して 1 時間あたり 100 回を超える DDL 操作が実行される場合。
-
単一のデータベースのログ量が 20 MB/s を超える場合。
-
1,000 を超えるテーブルに対して、変更データキャプチャ (CDC) を有効にする必要があります。
-
重要事項
スキーマ同期中、DTS はソースデータベースから外部キーを宛先データベースに同期します。
完全データ同期および増分同期中、DTS はセッションレベルで制約チェックおよび外部キーのカスケード操作を一時的に無効化します。タスク実行中にソースデータベースでカスケード更新または削除操作を実行すると、データ不整合が発生する可能性があります。
種別 | 説明 |
ソースデータベースの制限事項 |
|
その他の制限事項 |
|
特殊ケース | ソースインスタンスが RDS for SQL Server インスタンスの場合、DTS はソースインスタンス内にデータ同期用の ` |
課金
同期タイプ | 料金 |
スキーマ同期および完全データ同期 | 無料です。 |
増分データ同期 | 課金対象です。詳細については、「課金の概要」をご参照ください。 |
サポートされる同期トポロジー
一方通行・一対一同期
一方通行・一対多同期
一方通行・多対一同期
これらのトポロジーの説明および注意事項については、「同期トポロジーの概要」をご参照ください。
サポートされる SQL 操作
操作タイプ | SQL 文 |
DML | `INSERT`、`UPDATE`、`DELETE` 説明
|
DDL |
説明
|
データベースアカウントの権限
データベース | 必要な権限 | アカウント作成および権限付与方法 |
自己管理 SQL Server | `sysadmin` | |
AnalyticDB for PostgreSQL インスタンス |
説明 代わりに、AnalyticDB for PostgreSQL の初期アカウントを使用することもできます。 |
事前準備
同期タスクを設定する前に、自己管理 SQL Server データベースのトランザクションログ設定を構成し、クラスター化インデックスを作成する必要があります。
複数のデータベースを同期する場合は、手順 1~3 を繰り返してください。そうしないと、データ不整合が発生する可能性があります。
自己管理 SQL Server データベースで、次のコマンドを実行して、データベースの復元モードを完全に設定します。SQL Server Management Studio (SSMS) を使用することもできます。詳細については、「データベースの復元モードを変更する」をご参照ください。
use master; GO ALTER DATABASE <database_name> SET RECOVERY FULL WITH ROLLBACK IMMEDIATE; GOパラメーターの説明:
`<database_name>`:同期対象のデータベース名。
例:
use master; GO ALTER DATABASE mytestdata SET RECOVERY FULL WITH ROLLBACK IMMEDIATE; GO以下のコマンドを実行して、同期対象のデータベースの論理バックアップを実行します。すでに論理バックアップを実行済みの場合は、このステップをスキップできます。
BACKUP DATABASE <database_name> TO DISK='<physical_backup_device_name>'; GOパラメーターの説明:
`<database_name>`:同期対象のデータベース名。
`<physical_backup_device_name>`:バックアップファイルのパスおよびファイル名。
例:
BACKUP DATABASE mytestdata TO DISK='D:\backup\dbdata.bak'; GO以下のコマンドを実行して、同期対象のデータベースのトランザクションログをバックアップします。
BACKUP LOG <database_name> to DISK='<physical_backup_device_name>' WITH init; GOパラメーターの説明:
`<database_name>`:同期対象のデータベース名。
`<physical_backup_device_name>`:バックアップファイルのパスおよびファイル名。
例:
BACKUP LOG mytestdata TO DISK='D:\backup\dblog.bak' WITH init; GO
操作手順
宛先リージョンの同期タスク一覧ページに移動します。以下のいずれかの方法を使用できます。
DTS コンソールから
Data Transmission Service (DTS) コンソール にログインします。
左側のナビゲーションウィンドウで、データ同期 をクリックします。
ページの左上隅で、同期インスタンスが配置されているリージョンを選択します。
DMS コンソールから
説明実際の操作は、DMS コンソールのモードおよびレイアウトによって異なる場合があります。詳細については、「シンプルモード」および「DMS インターフェイスのレイアウトおよびスタイルのカスタマイズ」をご参照ください。
Data Management (DMS) にログインします。
トップメニューで、 の順に選択します。
データ同期タスク の右側で、同期インスタンスが配置されているリージョンを選択します。
タスクの作成 をクリックして、タスク設定ページを開きます。
ソースおよび宛先データベースを設定します。
カテゴリ
設定
説明
なし
タスク名
DTS が自動的にタスク名を生成します。識別しやすいように、説明的な名前を指定することを推奨します。名前は一意である必要はありません。
ソースデータベース
データベースタイプ
SQL Server を選択します。
アクセス方法
ソースデータベースの配置場所に応じて選択します。本例では、ECS 上の自己管理データベース を選択します。
説明自己管理データベースに対して他の接続タイプを選択した場合、追加の準備が必要です。詳細については、「準備の概要」をご参照ください。
インスタンスリージョン
自己管理 SQL Server データベースをホストする ECS インスタンスのリージョンを選択します。
ECS インスタンス ID
自己管理 SQL Server データベースをホストする ECS インスタンス ID を選択します。
ポート番号
自己管理 SQL Server データベースのサービスポートを入力します。デフォルトは 1433 です。
データベースアカウント
自己管理 SQL Server データベースのアカウントを入力します。必要な権限については、「データベースアカウントの権限」をご参照ください。
データベースパスワード
データベースアカウントに対応するパスワードを入力します。
暗号化
必要に応じて、非暗号化 または SSL 暗号化 を選択します。
-
ソースデータベースで SSL 暗号化が有効化されていない場合は、非暗号化 を選択します。
-
ソースデータベースで SSL 暗号化が有効化されている場合は、SSL 暗号化 を選択します。DTS はデフォルトでサーバー側の証明書を信頼します。
宛先データベース
データベースタイプ
AnalyticDB PostgreSQL を選択します。
アクセス方法
クラウドインスタンス を選択します。
インスタンスリージョン
宛先の AnalyticDB for PostgreSQL インスタンスのリージョンを選択します。
インスタンス ID
宛先の AnalyticDB for PostgreSQL インスタンスのインスタンス ID を選択します。
データベース名
同期対象オブジェクトを含む宛先の AnalyticDB for PostgreSQL インスタンス内のデータベース名を入力します。
データベースアカウント
宛先の AnalyticDB for PostgreSQL インスタンスのデータベースアカウントを入力します。必要な権限については、「データベースアカウントの権限」をご参照ください。
データベースパスワード
データベースアカウントに対応するパスワードを入力します。
-
設定を完了したら、ページ下部の 接続をテストして続行 をクリックします。DTS サーバーの CIDR ブロック ダイアログボックスで、接続テスト をクリックします。
説明DTS サーバーの IP アドレス CIDR ブロックを、ソースおよび宛先データベースのセキュリティ設定に追加して、DTS サーバーからのアクセスを許可してください。これは自動的または手動で行うことができます。詳細については、「DTS サーバーの IP アドレス CIDR ブロックをホワイトリストに追加」をご参照ください。
タスクオブジェクトを設定します。
オブジェクト設定 ページで、同期対象のオブジェクトを設定します。
設定
説明
同期タイプ
増分データ同期 が選択されています。デフォルトでは、スキーマ同期 および 完全データ同期 も選択する必要があります。事前チェックが完了すると、DTS はソースインスタンスから宛先クラスターへ選択されたオブジェクトの完全データ同期を実行します。これは、その後の増分データ同期のベースラインデータとなります。
競合するテーブルの処理モード
エラーの事前チェックと報告:宛先データベースに同名のテーブルが存在するかどうかをチェックします。同名のテーブルが存在しない場合は、事前チェックが通過します。同名のテーブルが存在する場合は、事前チェックが失敗し、データ同期タスクは開始されません。
説明宛先データベースで同名のテーブルを削除または名前変更できない場合は、別のテーブル名にマッピングできます。詳細については、「テーブルおよび列名のマッピング」をご参照ください。
エラーを無視して続行:宛先データベースにおける重複テーブル名のチェックをスキップします。
警告エラーを無視して続行 を選択すると、データ不整合が発生し、ビジネスにリスクを及ぼす可能性があります。たとえば:
テーブルスキーマが同一であり、宛先データベースのレコードとソースデータベースのレコードが同一のプライマリキーまたはユニークキー値を持つ場合:
完全同期中、DTS は宛先クラスター内のレコードを保持し、ソースデータベースからの対応するレコードは同期されません。
増分同期中、ソースデータベースからのレコードが宛先データベースのレコードを上書きします。
テーブルスキーマが異なる場合、初期データ同期が失敗する可能性があります。これにより、一部の列データのみが同期されるか、完全に同期が失敗する可能性があります。慎重に進めてください。
SQL Server 増分同期モード
クラスター化テーブルはログ解析で増分同期し、ヒープテーブルの場合は CDC で増分同期します (ハイブリッド式ログ解析):
メリット:
ソースデータベースにヒープテーブル、プライマリキーのないテーブル、圧縮テーブル、計算列を含むテーブルがあるシナリオをサポートします。
リンクの安定性が高く、完全な DDL 文を取得でき、DDL シナリオを包括的にサポートします。
デメリット:
DTS はソースデータベースに `dts_cdc_sync_ddl` トリガー、`dts_sync_progress` ハートビートテーブル、`dts_cdc_ddl_history` DDL ストレージテーブルを作成し、データベースレベルおよび一部のテーブルの CDC を有効化します。
ソースデータベースで CDC が有効化されたテーブルに対しては、`SELECT INTO`、`TRUNCATE`、`RENAME COLUMN`、列型の変更文を実行できません。DTS がソースデータベースに作成したトリガーは手動で削除できません。
説明`geometry`、`geography`、`hierarchyid` 型を含むテーブルでは CDC の有効化はサポートされていません。
ソースデータベースのログに基づく増分同期 (ヒープテーブル非対応):
メリット:
このモードはソースデータベースに対して非侵入型です。
デメリット:
ソースデータベースにヒープテーブル、プライマリキーのないテーブル、圧縮テーブル、計算列を含むテーブルがあるシナリオはサポートされていません。
増分同期のための CDC インスタンスのポーリングとクエリ:
メリット:
ソースデータベースが Amazon RDS for SQL Server、Azure SQL Database、Azure SQL Managed Instance、Azure SQL Server on Virtual Machine、Google Cloud SQL for SQL Server の場合、完全および増分同期をサポートします。
このモードでは、SQL Server のネイティブ Change Data Capture (CDC) コンポーネントを使用して増分データを取得します。これにより、増分同期がより安定し、ネットワーク帯域幅の消費が少なくなります。
デメリット:
DTS インスタンスで使用されるソースデータベースアカウントには、CDC を有効化する権限が必要です。増分データ同期には約 10 秒の遅延があります。
複数のデータベースおよびテーブルを同期するシナリオでは、安定性およびパフォーマンスの問題が発生するリスクがあります。
DTS がサポートする CDC が有効になっているテーブルの最大数の制限
現在の同期インスタンスで CDC を有効化できるテーブル数の上限を、必要に応じて設定します。デフォルト値は 1000 です。
説明この設定項目は、SQL Server 増分同期モード が ソースデータベースのログに基づく増分同期 (ヒープテーブル非対応) に設定されている場合、利用できません。
同期する DDL および DML 操作
インスタンスレベルで同期する DDL または DML 操作を選択します。サポートされる操作については、「サポートされる SQL 操作」をご参照ください。
説明データベースまたはテーブルごとに同期する SQL 操作を選択するには、選択中のオブジェクト ボックス内の同期対象オブジェクトを右クリックします。表示されるダイアログボックスで、SQL 操作を選択します。
ストレージエンジンタイプ
宛先テーブルのストレージエンジンタイプを選択します。デフォルトは Beam です。
説明この設定項目は、ターゲットの AnalyticDB for PostgreSQL インスタンスのカーネルバージョンが v7.0.6.6 以降であり、同期タイプ が スキーマ同期 に設定されている場合にのみ利用可能です。
ソースオブジェクト
ソースオブジェクト ボックスで同期対象のオブジェクトをクリックし、
をクリックして 選択中のオブジェクト ボックスに移動します。説明本シナリオでは異種データベース間の同期を行うため、同期対象オブジェクトとしてテーブルのみを選択できます。ビュー、トリガー、ストアドプロシージャなどの他のオブジェクトは宛先データベースに同期されません。
選択中のオブジェクト
宛先インスタンスで単一の同期オブジェクトの名前を変更するには、選択中のオブジェクト ボックス内のオブジェクトを右クリックします。オブジェクトの名前変更について詳しくは、「単一のデータベース、テーブル、または列のマッピング」をご参照ください。
宛先インスタンスで複数の同期オブジェクトの名前を一括で変更するには、選択中のオブジェクト ボックスの右上隅にある 一括編集 をクリックします。詳細については、「データベース、テーブル、列の一括マッピング」をご参照ください。
説明データベースまたはテーブルレベルで SQL 操作を選択するには、選択済みオブジェクト セクション内の同期オブジェクトを右クリックし、表示されるダイアログボックスで必要な操作を選択できます。
WHERE 句を使用してデータをフィルターするには、選択済みオブジェクト セクション内のテーブルを右クリックし、表示されるダイアログボックスでフィルター条件を設定できます。詳細については、「フィルター条件の設定」をご参照ください。
オブジェクト名マッピングを使用すると、依存オブジェクトの同期が失敗する可能性があります。
詳細設定へ をクリックして、高度なパラメーターを設定します。
設定
説明
タスクのスケジュールに使用する専用クラスターの選択
デフォルトでは、DTS は共有クラスター上でタスクをスケジュールし、クラスターを選択する必要はありません。より安定したパフォーマンスを得るには、DTS 同期タスクを実行する専用クラスターを購入できます。詳細については、「DTS 専用クラスターとは?」をご参照ください。
失敗した接続の再試行時間
同期タスクが開始された後、ソースまたは宛先データベースへの接続が失敗した場合、DTS はエラーを報告し、直ちに接続のリトライを開始します。デフォルトのリトライ時間は 720 分です。10 分から 1,440 分の範囲でカスタムのリトライ時間を指定することもできます。リトライ時間を 30 分以上に設定することを推奨します。指定された時間内に DTS がデータベースに再接続できた場合、同期タスクは自動的に再開されます。そうでない場合は、タスクが失敗します。
説明複数の DTS インスタンス(たとえばインスタンス A およびインスタンス B)が同一のソースまたは宛先を共有しており、インスタンス A のネットワークリトライ時間を 30 分、インスタンス B のネットワークリトライ時間を 60 分に設定した場合、両方のインスタンスで短い方の 30 分が使用されます。
DTS は接続リトライ期間中のタスク実行時間に対して課金するため、ビジネスニーズに応じてリトライ時間をカスタマイズするか、ソースおよび宛先データベースインスタンスが解放された直後に DTS インスタンスを解放することを推奨します。
移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。
同期タスクが開始された後、ソースまたは宛先データベースで接続性以外の問題(DDL または DML 実行例外など)が発生した場合、DTS はエラーを報告し、直ちに継続的なリトライ操作を開始します。デフォルトのリトライ時間は 10 分です。1 分から 1,440 分の範囲でカスタムのリトライ時間を指定することもできます。リトライ時間を 10 分以上に設定することを推奨します。設定されたリトライ時間内に関連する操作が成功した場合、同期タスクは自動的に再開されます。そうでない場合は、タスクが失敗します。
重要移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。 の値は、失敗した接続の再試行時間 の値より小さくする必要があります。
完全同期レートを制限するかどうか
完全同期ステージでは、DTS がソースおよび宛先データベースの読み取りおよび書き込みリソースを消費し、データベース負荷が増加する可能性があります。ソースおよび宛先データベースの負荷を軽減するため、1 秒あたりのソースデータベースのクエリ率 QPS、1 秒あたりの完全移行の行数 RPS、1 秒あたりの完全移行データ量 (MB) BPS のパラメーターを設定することで、完全同期タスクのレート制限を設定できます。
説明この設定項目は、同期タイプ が 完全データ同期 に設定されている場合にのみ利用可能です。
同期インスタンス実行後に、完全同期レートの調整 も可能です。
増分同期率を制限するかどうか
増分同期タスクのレート制限も設定できます。宛先データベースの負荷を軽減するため、1 秒あたりの増分同期の行数 RPS および 1 秒あたりの増分同期データ量 (MB) BPS を設定します。
引用符でオブジェクト名を囲みます。
宛先オブジェクト名を引用符で囲むかどうかを選択します。○ を選択し、以下のいずれかの条件が満たされる場合、DTS は初期スキーマ同期および増分データ同期フェーズで宛先オブジェクト名にシングルクォートまたはダブルクォートを追加します。
ソースデータベースのビジネス環境が大文字小文字を区別し、混合ケースを使用している場合。
ソーステーブル名が英字で始まらず、英字、数字、または特殊文字以外の文字を含む場合。
説明アンダースコア (`_`)、シャープ記号 (`#`)、ドル記号 (`$`) のみが特殊文字としてサポートされています。
同期対象のスキーマ、テーブル、または列の名前が宛先データベースにおいてキーワード、予約語、または無効な文字である場合。
説明引用符を追加する場合、データ同期タスク完了後にクエリで引用符付きの宛先オブジェクト名を使用する必要があります。
環境タグ
インスタンスを識別するための環境ラベルを選択します。本例では必須ではありません。
ETL 機能の設定
抽出・変換・書き出し (ETL) 機能を有効化するかどうかを選択します。詳細については、「ETL とは?」をご参照ください。有効な値は以下のとおりです。
-
○:ETL 機能を有効化します。コードエディタにデータ処理文を入力します。詳細については、「データ移行またはデータ同期タスクにおける ETL の設定」をご参照ください。
-
×:ETL 機能を無効化します。
監視アラート
アラート通知を設定するかどうかを指定します。同期が失敗した場合やレイテンシーが指定されたしきい値を超えた場合、アラート連絡先に通知が送信されます。
×:アラート通知は設定されません。
○:アラートしきい値を設定し、アラート通知 を指定してアラート通知を設定します。詳細については、「タスク設定中のモニタリングおよびアラート通知の設定」をご参照ください。
次へ:データ検証 をクリックして、データ検証タスクを設定します。
データ検証機能を使用する場合は、設定手順については、「データ検証の設定」をご参照ください。
任意:上記の手順を完了した後、次:データベースおよびテーブルのフィールド設定 をクリックして、宛先の AnalyticDB for PostgreSQL インスタンス内のテーブルの タイプ、プライマリキー列の追加、配布キー を設定します。
説明このステップは、タスクオブジェクトの設定中に 同期タイプ を選択し、スキーマ同期 を選択した場合にのみ表示されます。定義ステータス ドロップダウンリストから すべて を選択して設定を変更できます。
プライマリキー列の追加 は、複数の列で構成される複合キーにすることができます。プライマリキー列の追加 リストから 1 つ以上の列を選択し、配布キー として設定できます。詳細については、「データテーブルの管理」および「テーブル分散の定義」をご参照ください。
タスクを保存して事前チェックを実行します。
このインスタンスの API パラメーターを表示するには、次:タスク設定の保存と事前チェック ボタンにカーソルを合わせ、ポップアップで OpenAPI パラメーターのプレビュー をクリックします。
API パラメーターの表示が完了したら、ページ下部の 次:タスク設定の保存と事前チェック をクリックします。
説明同期ジョブが開始される前に、DTS は事前チェックを実行します。すべての事前チェック項目が合格した場合にのみ、ジョブを開始できます。
事前チェックが失敗した場合、失敗した項目横の 詳細を表示 をクリックします。指示に従って問題を修正し、再度事前チェックを実行してください。
事前チェックで警告が返された場合:
無視できないチェック項目が失敗した場合、項目横の 詳細を表示 をクリックします。指示に従って問題を修正し、再度事前チェックを実行してください。
無視可能なチェック項目については、アラートの詳細を確認、無視、OK、再度事前チェックを実行 の順にクリックして警告をスキップし、再度事前チェックを実行できます。警告項目を無視した場合、データ不整合などの問題が発生し、ビジネスにリスクを及ぼす可能性があります。
インスタンスを購入します。
成功率 が 100 % の場合、次:インスタンスの購入 をクリックします。
購入 ページで、データ同期インスタンスの課金方法およびリンク仕様を選択します。以下の表で、これらのパラメーターについて詳しく説明します。
カテゴリ
パラメーター
説明
新しいインスタンスクラス
課金方法
サブスクリプション:インスタンス作成時に支払いを行います。長期的なニーズに適しており、従量課金と比較してコスト効率が高くなります。サブスクリプション期間が長いほど、割引率が高くなります。
従量課金:時間単位で課金されます。短期的なニーズに適しています。使用後すぐにインスタンスを解放することで、コストを節約できます。
リソースグループ構成
インスタンスが属するリソースグループです。デフォルトはデフォルトリソースグループです。詳細については、「Resource Management とは?」をご参照ください。
リンク仕様
DTS は、さまざまなパフォーマンスレベルの同期仕様を提供しています。同期リンク仕様は同期レートに影響します。ビジネスシナリオに応じて仕様を選択できます。詳細については、「データ同期リンク仕様」をご参照ください。
サブスクリプション期間
サブスクリプションモードでは、サブスクリプションインスタンスの期間および数量を選択します。月額サブスクリプションは 1~9 ヶ月、年額サブスクリプションは 1、2、3、または 5 年から選択できます。
説明このオプションは、課金方法が サブスクリプション の場合にのみ利用可能です。
設定を完了したら、「Data Transmission Service (従量課金) 利用規約」を読み、チェックボックスを選択します。
購入して起動 をクリックします。OK ダイアログボックスで、OK をクリックします。
データ同期ページでタスクの進行状況を確認できます。