すべてのプロダクト
Search
ドキュメントセンター

AnalyticDB:Db2 for LUWデータベースのデータをAnalyticDB for PostgreSQLインスタンスに同期する

最終更新日:Dec 09, 2024

このトピックでは、data Transmission Service (DTS) を使用して、Db2 for LUWデータベースからAnalyticDB for PostgreSQLインスタンスにデータを同期する方法について説明します。

前提条件

  • AnalyticDB for PostgreSQLインスタンスが作成されました。 詳細については、「インスタンスの作成」をご参照ください。

  • 完全データ同期の場合、ターゲットAnalyticDB For PostgreSQLインスタンスの使用可能なストレージ容量は、ソースDb2 for LUWデータベースのデータの合計サイズよりも大きくなります。

制限事項

説明
  • スキーマ同期中、DTSはソースデータベースからターゲットデータベースに外部キーを同期します。

  • 完全データ同期および増分データ同期中、DTSはセッションレベルで外部キーに対する制約チェックおよびカスケード操作を一時的に無効にします。 データ同期中にソースデータベースに対してカスケード更新および削除操作を実行すると、データの不整合が発生する可能性があります。

制限タイプ

説明

ソースデータベースの制限

  • 帯域幅の要件: ソースデータベースがデプロイされるサーバーには、十分なアウトバウンド帯域幅が必要です。 そうでなければ、データ同期速度は低下する。

  • 同期するテーブルには、PRIMARY KEYまたはUNIQUE制約が必要であり、すべてのフィールドが一意である必要があります。 そうでない場合、宛先データベースは重複するデータレコードを含み得る。

  • 同期するオブジェクトとしてテーブルを選択し、テーブルや列の名前の変更など、ターゲットデータベース内のテーブルを変更する場合は、1つのデータ同期タスクで最大5,000のテーブルを同期できます。 タスクを実行して5,000を超えるテーブルを同期すると、リクエストエラーが発生します。 この場合、複数のタスクを構成してテーブルをバッチで同期するか、タスクを構成してデータベース全体を同期することをお勧めします。

  • データログ機能を有効にする必要があります。 それ以外の場合、事前チェック中にエラーメッセージが返され、データ同期タスクを開始できません。

    説明

    増分データ同期のみを実行する場合、ソースデータベースのデータログを24時間以上保存する必要があります。 完全データ同期と増分データ同期の両方を実行する場合、ソースデータベースのデータログは少なくとも7日間保存する必要があります。 そうしないと、DTSはデータログの取得に失敗し、タスクが失敗する可能性があります。 例外的な状況では、データの不整合または損失が発生します。 完全なデータ同期が完了したら、保持期間を24時間以上に設定できます。 上記の要件に基づいて、データログの保持期間を設定してください。 そうしないと、DTSのSLAに記載されているサービスの信頼性またはパフォーマンスを保証できません。

その他の制限

  • DTSは、Db2 for LUWのCDCレプリケーション技術に基づいて、Db2 for LUWデータベースの増分データをターゲットデータベースに同期します。 しかし、CDC複製技術には独自の限界がある。 詳細については、「SQLレプリケーションの一般的なデータ制限」をご参照ください。

  • データを同期する前に、ソースデータベースとターゲットデータベースのパフォーマンスに対するデータ同期の影響を評価します。 オフピーク時にデータを同期することを推奨します。 最初の完全データ同期中、DTSはソースデータベースとターゲットデータベースの読み取りおよび書き込みリソースを使用します。 これにより、データベースサーバーの負荷が増加する可能性があります。

  • 初期の完全データ同期中に、同時INSERT操作により、ターゲットデータベースのテーブルが断片化されます。 したがって、最初の完全データ同期が完了した後、ターゲットデータベースの使用されるテーブルスペースのサイズは、ソースデータベースのサイズよりも大きくなります。

  • データ同期中は、DTSのみを使用してデータをターゲットデータベースに書き込むことをお勧めします。 これにより、ソースデータベースとターゲットデータベース間のデータの不一致が防止されます。 データ同期が完了したら、DMSを使用してDDLステートメントをオンラインで実行できます。 詳細については、「ロックフリーDDL操作の実行」をご参照ください。

  • スキーマ同期および増分データ同期中、ソースデータベースの外部キーはターゲットデータベースに同期されません。

  • 同期するオブジェクトとしてテーブルのみを選択できます。 テーブルを追加最適化 (AO) テーブルにすることはできません。

  • 列マッピングが完全でないテーブル同期に使用されている場合、またはソーステーブルとターゲットテーブルのスキーマに一貫性がない場合、ターゲットデータベースに含まれていないソースデータベースの列のデータが失われます。

特別なケース

ソースDb2 for LUWデータベースは自己管理データベースです。 Db2 for LUWデータベースのデータを同期する場合は、次の項目に注意してください。

  • データ同期タスクの実行中にソースデータベースでプライマリ /セカンダリの切り替えを実行すると、タスクは失敗します。

  • DTSは、同期先データベースの最新の同期データレコードのタイムスタンプとソースデータベースの現在のタイムスタンプに基づいて同期レイテンシを計算します。 ソースデータベースでDML操作が長時間実行されない場合、同期レイテンシが不正確になる可能性があります。 同期レイテンシが高すぎる場合は、ソースデータベースでDML操作を実行してレイテンシを更新できます。

    説明

    同期するオブジェクトとしてデータベース全体を選択した場合は、ハートビートテーブルを作成できます。 ハートビートテーブルは1秒ごとに更新されるか、データを受信します。

課金

同期タイプタスク設定料金
スキーマ同期と完全データ同期無料です。
増分データ同期有料。 詳細については、「課金概要」をご参照ください。

サポートしている同期トポロジ

  • 一方向の 1 対 1 の同期

  • 一方向の 1 対多の同期

  • 一方向のカスケード同期

  • 一方向の多対 1 の同期

DTSでサポートされている同期トポロジの詳細については、「同期トポロジ」をご参照ください。

同期可能なSQL操作

操作タイプ

SQL文

DML

挿入、更新、および削除

説明

データがコピー先のAnalyticDB for PostgreSQLインスタンスに書き込まれると、UPDATEステートメントは自動的にREPLACE INTOステートメントに変換されます。 UPDATE文が主キーで実行された場合、UPDATE文はDELETE文とINSERT文に変換されます。

準備

手順

  1. [データ同期タスク] ページに移動します。

    1. 最初に

      データ管理 (DMS) コンソール

    2. 上部のナビゲーションバーで、[DTS] をクリックします。

    3. 左側のナビゲーションウィンドウで、DTS (DTS) > データ同期.

    説明
  2. の右側にデータ同期タスク、データ同期インスタンスが存在するリージョンを選択します。

    説明

    新しいDTSコンソールを使用する場合は、上部のナビゲーションバーでデータ同期インスタンスが存在するリージョンを選択する必要があります。

  3. タスクの作成 をクリックして、タスク設定ページに移動します。

  4. (オプションの手順) ページの右上隅にある 新バージョンの設定ページを試してみる をクリックします。

    説明
    • ページの右上隅に 旧バージョンの設定ページに戻る ボタンが表示されている場合は、この手順をスキップします。

    • 構成ページの新しいバージョンと以前のバージョンの特定のパラメータは異なる場合があります。 設定ページの新しいバージョンを使用することを推奨します。

  5. ソースデータベースとターゲットデータベースを設定します。 下表に、各パラメーターを説明します。

    カテゴリ

    パラメーター

    説明

    非該当

    タスク名

    DTSタスクの名前。 タスク名は自動生成されます。 タスクを簡単に識別できるように、わかりやすい名前を指定することをお勧めします。 一意のタスク名を指定する必要はありません。

    移行元データベース

    DMS データベースインスタンスの選択

    使用するデータベース。 ビジネス要件に基づいて、既存のデータベースを使用するかどうかを選択できます。

    • 既存のデータベースを選択すると、DTSはデータベースのパラメーターを自動的に入力します。

    • 既存のデータベースを選択しない場合は、次のデータベース情報を構成する必要があります。

    説明

    データベースタイプ

    移行元ディスクのタイプを設定します。 [DB2 for LUW] を選択します。

    アクセス方法

    ターゲットデータベースのアクセス方法。 この例では、ECS上の自己管理データベースが選択されています。

    説明

    ソースデータベースが自己管理データベースの場合、データベースのネットワーク環境を展開する必要があります。 詳細については、「準備の概要」をご参照ください。

    インスタンスリージョン

    ソースDb2 for LUWデータベースが存在するリージョン。

    Alibaba Cloud アカウント間でデータを複製

    この例では、現在のAlibaba Cloudアカウントのデータベースが使用されています。 × を選択します。

    ECSインスタンスID

    Db2 for LUWデータベースがデプロイされているElastic Compute Service (ECS) インスタンスのID。

    ポート番号

    Db2 for LUWデータベースのサービスポート番号。 デフォルト値: 50000

    データベース名

    同期するオブジェクトが属するDb2 for LUWデータベースの名前。

    データベースアカウント

    ソースDb2 for LUWデータベースのデータベースアカウント。 権限要件の詳細については、このトピックの「準備」セクションの参照を参照してください。

    データベースパスワード

    データベースへのアクセスに使用されるパスワード。

    移行先データベース

    DMS データベースインスタンスの選択

    使用するデータベース。 ビジネス要件に基づいて、既存のデータベースを使用するかどうかを選択できます。

    • 既存のデータベースを選択すると、DTSはデータベースのパラメーターを自動的に入力します。

    • 既存のデータベースを選択しない場合は、次のデータベース情報を構成する必要があります。

    説明

    データベースタイプ

    ターゲットデータベースのタイプ。 [AnalyticDB for PostgreSQL] を選択します。

    アクセス方法

    ターゲットデータベースのアクセス方法。 [Alibaba Cloudインスタンス] を選択します。

    インスタンスリージョン

    移行先のAnalyticDB for PostgreSQLインスタンスが存在するリージョン。

    インスタンスID

    移行先のAnalyticDB for PostgreSQLインスタンスのID。

    データベース名

    移行先のAnalyticDB for PostgreSQL内のデータベースの名前。

    データベースアカウント

    移行先のAnalyticDB for PostgreSQLインスタンスのデータベースアカウント。 権限要件の詳細については、このトピックの「準備」セクションの参照を参照してください。

    データベースパスワード

    データベースへのアクセスに使用されるパスワード。

  6. ページの下部で、接続性をテストして続行.

    ソースまたはターゲットデータベースがAlibaba Cloudデータベースインスタンス (ApsaraDB RDS for MySQLインスタンスやApsaraDB for MongoDBインスタンスなど) の場合、DTSは自動的にDTSサーバーのCIDRブロックをインスタンスのホワイトリストに追加します。 ソースデータベースまたはターゲットデータベースがElastic Compute Service (ECS) インスタンスでホストされている自己管理データベースの場合、DTSサーバーのCIDRブロックがECSインスタンスのセキュリティグループルールに自動的に追加されます。ECSインスタンスがデータベースにアクセスできるようにする必要があります。 ソースデータベースまたはターゲットデータベースが、データセンターにデプロイされているか、サードパーティのクラウドサービスプロバイダーによって提供される自己管理データベースである場合、DTSサーバーのCIDRブロックをデータベースのホワイトリストに手動で追加して、DTSがデータベースにアクセスできるようにする必要があります。 詳細については、「DTSサーバーのCIDRブロックの追加」をご参照ください。

    警告

    DTSサーバーのCIDRブロックがデータベースまたはインスタンスのホワイトリスト、またはECSセキュリティグループルールに自動的または手動で追加されると、セキュリティリスクが発生する可能性があります。 したがって、DTSを使用してデータを同期する前に、潜在的なリスクを理解して認識し、次の対策を含む予防策を講じる必要があります。VPNゲートウェイ、またはSmart Access Gateway。

  7. 同期するオブジェクトを設定します。

    1. オブジェクト設定 ステップで、同期するオブジェクトを設定します。

      パラメーター

      説明

      同期タイプ

      同期タイプ。 デフォルトでは、増分データ同期が選択されています。 [スキーマ同期] および [完全データ同期] も選択する必要があります。 事前チェックが完了すると、DTSは選択したオブジェクトの履歴データをソースデータベースからターゲットクラスターに同期します。 履歴データは、その後の増分同期の基礎となる。

      同期する DDL および DML 操作

      同期するDDL操作とDML操作。 詳細については、このトピックの「同期可能なSQL操作」をご参照ください。

      説明

      特定のデータベースまたはテーブルで実行されるSQL操作を選択するには、次の手順を実行します。[選択されたオブジェクト] セクションで、オブジェクトを右クリックします。 表示されるダイアログボックスで、同期するSQL操作を選択します。

      競合するテーブルの処理モード

      • エラーの事前チェックと報告: ターゲットデータベースに、ソースデータベースのテーブルと同じ名前のテーブルが含まれているかどうかを確認します。 ソースデータベースとターゲットデータベースに同じテーブル名のテーブルが含まれていない場合は、事前チェックに合格します。 それ以外の場合、事前チェック中にエラーが返され、データ同期タスクを開始できません。

        説明

        ソースデータベースとターゲットデータベースに同じ名前のテーブルが含まれていて、ターゲットデータベース内のテーブルを削除または名前変更できない場合は、オブジェクト名マッピング機能を使用して、ターゲットデータベースに同期されるテーブルの名前を変更できます。 詳細については、「マップオブジェクト名」をご参照ください。

      • エラーを無視して続行: ソースデータベースとターゲットデータベースの同じテーブル名の事前チェックをスキップします。

        警告

        エラーを無視して続行 を選択すると、データの不整合が発生し、ビジネスが潜在的なリスクにさらされる可能性があります。

        • ソースデータベースとターゲットデータベースが同じスキーマを持ち、ターゲットデータベースのデータレコードがソースデータベースのデータレコードと同じ主キー値または一意キー値を持つ場合:

          • 完全データ同期中、DTSはデータレコードをターゲットデータベースに同期しません。 ターゲットデータベースの既存のデータレコードが保持されます。

          • 増分データ同期中、DTSはデータレコードをターゲットデータベースに同期します。 ターゲットデータベースの既存のデータレコードが上書きされます。

        • ソースデータベースとターゲットデータベースのスキーマが異なる場合、データの初期化に失敗する可能性があります。 この場合、一部の列のみが同期されるか、データ同期タスクが失敗します。 作業は慎重に行ってください。

      ストレージエンジンタイプ

      ターゲットデータベースのテーブルのストレージエンジンタイプ。 このパラメーターは自動的にBeamに設定されます。

      説明

      このパラメーターは、V7.0.6.6以降のAnalyticDB for PostgreSQLインスタンスの [同期タイプ] パラメーターを [スキーマ同期] に設定した場合にのみ使用できます。

      移行先インスタンスでのオブジェクト名の大文字化

      ターゲットインスタンスのデータベース名、テーブル名、および列名の大文字化。 デフォルトでは、DTSデフォルトポリシーが選択されています。 他のオプションを選択して、オブジェクト名の大文字化をソースまたはターゲットデータベースの大文字化と一致させることができます。 詳細については、「ターゲットインスタンスのオブジェクト名の大文字化の指定」をご参照ください。

      ソースオブジェクト

      ソースオブジェクト セクションから1つ以上のオブジェクトを選択し、向右アイコンをクリックして 選択中のオブジェクト セクションにオブジェクトを追加します。

      説明

      同期するオブジェクトとしてテーブルのみを選択できます。 ビュー、トリガー、ストアドプロシージャなどの他のオブジェクトは、ターゲットデータベースと同期されません。

      選択中のオブジェクト

      • 同期先のインスタンスに同期するオブジェクトの名前を変更するには、選択中のオブジェクト セクションでオブジェクトを右クリックします。 詳細については、「オブジェクト名のマップ」トピックの「単一オブジェクトの名前のマップ」セクションをご参照ください。

      • 一度に複数のオブジェクトの名前を変更するには、選択中のオブジェクト セクションの右上隅にある 一括編集 をクリックします。 詳細については、「オブジェクト名のマップ」トピックの「一度に複数のオブジェクト名をマップする」セクションをご参照ください。

      説明
      • 特定のデータベースまたはテーブルで実行されるSQL操作を選択するには、選択中のオブジェクト セクションでオブジェクトを右クリックします。 表示されるダイアログボックスで、同期するSQL操作を選択します。 詳細については、このトピックの「同期可能なSQL操作」をご参照ください。

      • データをフィルタリングするWHERE条件を指定するには、選択中のオブジェクト セクションでオブジェクトを右クリックします。 表示されるダイアログボックスで、条件を指定します。 詳細については、「フィルター条件の指定」をご参照ください。

    2. 次へ:詳細設定 をクリックして詳細設定を設定します。

      パラメーター

      説明

      タスクのスケジュールに使用する専用クラスターの選択

      デフォルトでは、専用クラスターを指定しない場合、DTSはタスクを共有クラスターにスケジュールします。 データ同期タスクの安定性を向上させたい場合は、専用クラスターを購入してください。 詳細については、「DTS専用クラスターの概要」をご参照ください。

      失敗した接続の再試行時間

      失敗した接続のリトライ時間範囲。 データ同期タスクの開始後にソースデータベースまたはターゲットデータベースの接続に失敗した場合、DTSはその時間範囲内ですぐに接続を再試行します。 有効な値: 10 ~ 1440 単位:分 デフォルト値: 720 このパラメーターを30より大きい値に設定することを推奨します。 DTSが指定された時間範囲内にソースデータベースとターゲットデータベースに再接続すると、DTSはデータ同期タスクを再開します。 それ以外の場合、データ同期タスクは失敗します。

      説明
      • ソースまたはターゲットデータベースが同じである複数のデータ同期タスクに対して異なるリトライ時間範囲を指定した場合、最も短いリトライ時間範囲が優先されます。

      • DTSが接続を再試行すると、DTSインスタンスに対して課金されます。 業務要件に基づいて再試行時間範囲を指定することを推奨します。 ソースインスタンスとターゲットインスタンスがリリースされた後、できるだけ早くDTSインスタンスをリリースすることもできます。

      移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。

      その他の問題の再試行時間範囲。 たとえば、データ同期タスクの開始後にDDLまたはDML操作の実行に失敗した場合、DTSはその時間範囲内ですぐに操作を再試行します。 有効な値: 1 ~ 1440 単位:分 デフォルト値は 10 です。 このパラメーターを10より大きい値に設定することを推奨します。 指定された時間範囲内で失敗した操作が正常に実行されると、DTSはデータ同期タスクを再開します。 それ以外の場合、データ同期タスクは失敗します。

      重要

      移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。 パラメーターの値は、失敗した接続の再試行時間 パラメーターの値よりも小さくする必要があります。

      完全移行率を制限するかどうか

      完全データ同期中、DTSはソースデータベースとターゲットデータベースの読み取りおよび書き込みリソースを使用します。 これにより、データベースサーバーの負荷が増加する可能性があります。 1 秒あたりのソースデータベースのクエリ率 QPS1 秒あたりの完全移行の行数 RPS、および1 秒あたりの完全移行データ量 (MB) BPS パラメーターを設定して、ターゲットデータベースサーバーの負荷を軽減できます。

      説明

      このパラメーターは、同期タイプ パラメーターで 完全データ同期 が選択されている場合にのみ表示されます。

      増分同期率を制限するかどうか

      増分データ同期のスロットリングを有効にするかどうかを指定します。 ビジネス要件に基づいて、増分データ同期のスロットリングを有効にできます。 スロットリングを設定するには、1 秒あたりの増分同期の行数 RPSおよび1 秒あたりの増分同期データ量 (MB) BPS パラメーターを設定する必要があります。 これにより、移行先データベースサーバーの負荷が軽減されます。

      環境タグ

      データ同期インスタンスを識別するために使用される環境タグ。 ビジネス要件に基づいて環境タグを選択できます。 この例では、環境タグは選択されていません。

      ETL の設定

      抽出、変換、および読み込み (ETL) 機能を有効にするかどうかを指定します。 詳細については、「」をご参照ください。ETLとは何ですか? 有効な値:

      監視アラート

      データ同期タスクのアラートを設定するかどうかを指定します。 タスクが失敗するか、同期レイテンシが指定されたしきい値を超えると、アラート送信先は通知を受け取ります。 有効な値:

    3. [次のステップ: データ検証] をクリックしてデータ検証を設定します。

      データ検証機能の使用方法の詳細については、「データ検証タスクの設定」をご参照ください。

    4. (オプション) ページの下部で、次:データベースおよびテーブルのフィールド設定 をクリックします。 表示されるダイアログボックスで、移行するテーブルの タイププライマリキー列の追加 、および 配布キー パラメーターを指定します。 パラメーター値は、テーブルがターゲットAnalyticDB for PostgreSQLインスタンスに移行された後に適用されます。

      説明
      • この手順は、タスクに対して移行するオブジェクトを設定するときに スキーマ同期 を選択した場合にのみ使用できます。 定義ステータス パラメーターを すべて に設定し、データベースとテーブルのフィールドを変更できます。

      • プライマリキー列の追加 フィールドでは、複数の列を指定して複合プライマリキーを形成できます。 この場合、1つ以上のプライマリキー列の追加配布キー列として指定する必要があります。

      • 主キー列と配布キー列の詳細については、「テーブルの管理」および「テーブル配布の定義」をご参照ください。

  8. タスク設定を保存し、事前チェックを実行します。

    • 関連するAPI操作を呼び出してDTSタスクを設定するときに指定するパラメーターを表示するには、ポインターを 次:タスク設定の保存と事前チェック に移動し、OpenAPI パラメーターのプレビュー をクリックします。

    • パラメーターを表示または表示する必要がない場合は、ページ下部の 次:タスク設定の保存と事前チェック をクリックします。

    説明
    • データ同期タスクを開始する前に、DTSは事前チェックを実行します。 データ同期タスクは、タスクが事前チェックに合格した後にのみ開始できます。

    • データ同期タスクが事前チェックに失敗した場合は、失敗した各項目の横にある [詳細の表示] をクリックします。 チェック結果に基づいて原因を分析した後、問題のトラブルシューティングを行います。 次に、プレチェックを再実行します。

    • 事前チェック中にアイテムに対してアラートがトリガーされた場合:

      • アラートアイテムを無視できない場合は、失敗したアイテムの横にある [詳細の表示] をクリックして、問題のトラブルシューティングを行います。 次に、もう一度プレチェックを実行します。

      • アラート項目を無視できる場合は、[アラート詳細の確認] をクリックします。 [詳細の表示] ダイアログボックスで、[無視] をクリックします。 表示されたメッセージボックスで、[OK] をクリックします。 次に、[再度事前チェック] をクリックして、事前チェックを再度実行します。 アラート項目を無視すると、データの不整合が発生し、ビジネスが潜在的なリスクにさらされる可能性があります。

  9. 成功率100% になるまで待ちます。 次に、[次へ: インスタンスの購入] をクリックします。

  10. データ移行インスタンスを購入します。

    1. 購入ページで、データ同期インスタンスの課金方法とインスタンスクラスのパラメーターを設定します。 下表にパラメーターを示します。

      セクション

      パラメーター

      説明

      新しいインスタンスクラス

      Billing Method

      • サブスクリプション: データ同期インスタンスの作成時にサブスクリプションの料金を支払います。 使用期間が長期の場合、サブスクリプション課金方式は、従量課金方式と比較して費用対効果が高くなります。

      • 従量課金: 従量課金インスタンスは1時間ごとに課金されます。 従量課金方式は、リソースを短期間使用する場合に適しています。 従量課金データ同期インスタンスが不要になった場合は、インスタンスをリリースしてコストを削減できます。

      リソースグループの設定

      データ同期インスタンスが属するリソースグループ。 デフォルト値: Default resource group 詳細については、「」をご参照ください。リソース管理とは

      インスタンスクラス

      DTSは、同期速度が異なるインスタンスクラスを提供します。 ビジネス要件に基づいてインスタンスクラスを選択できます。 詳細については、「データ同期インスタンスのインスタンスクラス」をご参照ください。

      サブスクリプション期間

      サブスクリプションの課金方法を選択した場合は、サブスクリプション期間と作成するデータ同期インスタンスの数を指定します。 サブスクリプション期間は、1〜9か月、1年、2年、3年、または5年とすることができる。

      説明

      このパラメーターは、サブスクリプション の課金方法を選択した場合にのみ使用できます。

    2. 読み取りと選択データ伝送サービス (従量課金) サービス規約.

    3. [購入して開始] をクリックします。 表示されるダイアログボックスで、OK をクリックします。

      タスクリストでタスクの進行状況を確認できます。