このトピックでは、Data Transmission Service (DTS) を使用して、TiDB データベースから ApsaraDB RDS for MySQL インスタンスにデータを移行する方法について説明します。
前提条件
宛先 ApsaraDB RDS for MySQL インスタンスが作成されていること。インスタンスの使用可能なストレージ容量が、ソース TiDB データベースのデータ総容量よりも大きいこと。詳細については、「ApsaraDB RDS for MySQL インスタンスを作成する」をご参照ください。
TiDB データベースから増分データを移行する場合、準備 (オプション) が行われ、増分データが収集されていること。
準備 (オプション)
以下のいずれかの方法を使用して、TiDB データベースから増分データを収集できます。
TiDB Binlog を使用する
ソースデータベースがデプロイされているサーバーは、Pump、Drainer、および Kafka クラスタがデプロイされているサーバーと同じ内部ネットワーク内にある必要があります。これにより、ネットワークレイテンシが増分データ移行に与える影響を最小限に抑えることができます。
以下のいずれかの方法で、Kafka クラスタまたはインスタンスを準備します。
自己管理 Kafka クラスタをデプロイします。詳細については、Apache Kafka 公式 Web サイトをご覧ください。
警告Kafka ブローカーの
message.max.bytesパラメータとreplica.fetch.max.bytesパラメータ、および Kafka コンシューマーのfetch.message.max.bytesパラメータを大きい値に設定することをお勧めします。これにより、Kafka クラスタは TiDB データベースからより大量のバイナリログデータを受信できます。詳細については、「CONFIGURATION」をご参照ください。ApsaraMQ for Kafka インスタンスを作成します。詳細については、「概要」をご参照ください。
説明ApsaraMQ for Kafka インスタンスは、ソースデータベースサーバーと同じ Virtual Private Cloud (VPC) にデプロイする必要があります。これにより、信頼性の高いデータ転送が保証され、ネットワークレイテンシが増分データ移行に与える影響を最小限に抑えることができます。
自己管理 Kafka クラスタまたは ApsaraMQ for Kafka インスタンスにトピックを作成します。
重要増分データを ID が 0 のパーティションにレプリケートできるようにするには、トピックにパーティションが 1 つだけ含まれていることを確認してください。
Pump と Drainer をデプロイします。詳細については、「TiDB Binlog クラスタのデプロイ」をご参照ください。
Drainer の構成ファイルを変更し、Drainer からデータを受信する Kafka クラスタを指定します。詳細については、「Binlog コンシューマークライアントユーザーガイド」をご参照ください。
説明TiDB データベースがデプロイされているサーバーが Kafka クラスタに接続できることを確認してください。
DTS サーバーの CIDR ブロックを TiDB データベースのホワイトリストに追加します。詳細については、「DTS サーバーの CIDR ブロックを追加する」をご参照ください。
TiCDC を使用する
以下のいずれかの方法で、Kafka クラスタまたはインスタンスを準備します。
自己管理 Kafka クラスタをデプロイします。詳細については、Apache Kafka 公式 Web サイトをご覧ください。
警告Kafka ブローカーの
message.max.bytesパラメータとreplica.fetch.max.bytesパラメータ、および Kafka コンシューマーのfetch.message.max.bytesパラメータを大きい値に設定することをお勧めします。これにより、Kafka クラスタは TiDB データベースからより大量のバイナリログデータを受信できます。詳細については、「CONFIGURATION」をご参照ください。ApsaraMQ for Kafka インスタンスを作成します。詳細については、「概要」をご参照ください。
説明ApsaraMQ for Kafka インスタンスは、ソースデータベースサーバーと同じ Virtual Private Cloud (VPC) にデプロイする必要があります。これにより、信頼性の高いデータ転送が保証され、ネットワークレイテンシが増分データ移行に与える影響を最小限に抑えることができます。
自己管理 Kafka クラスタまたは ApsaraMQ for Kafka インスタンスにトピックを作成します。
重要増分データを ID が 0 のパーティションにレプリケートできるようにするには、トピックにパーティションが 1 つだけ含まれていることを確認してください。
TiCDC をインストールします。詳細については、「Deploy and Maintain TiCDC」をご参照ください。
説明TiUP を使用して、TiDB クラスタに新しい TiCDC ノードを追加するか、既存の TiCDC ノードをスケールアウトすることをお勧めします。
ソース TiDB データベースの増分データを Kafka にレプリケートします。詳細については、「Replicate Data to Kafka」をご参照ください。
説明TiDB データベースがデプロイされているサーバーが Kafka クラスタに接続できることを確認してください。
最初のコマンドラインで
tiup cdc cli changefeed create \を使用することをお勧めします。
使用上の注意
カテゴリ | 説明 |
ソースデータベースの制限 |
|
その他の制限 |
|
課金
移行タイプ | インスタンス構成料金 | インターネットトラフィック料金 |
スキーマ移行と完全データ移行 | 無料。 | ターゲットデータベースの アクセス方法 パラメーターが パブリック IP アドレス に設定されている場合、インターネットトラフィックの料金が発生します。詳細については、「課金概要」をご参照ください。 |
増分データ移行 | 課金されます。詳細については、「請求の概要」をご参照ください。 |
増分移行をサポートする SQL 操作
操作タイプ | SQL 文 |
DML | INSERT、UPDATE、および DELETE |
DDL | CREATE TABLE、DROP TABLE、ALTER TABLE、RENAME TABLE、TRUNCATE TABLE、CREATE VIEW、DROP VIEW、および ALTER VIEW |
データベースアカウントに必要な権限
データベース | 必要な権限 | 参照 |
TiDB データベース | 移行するオブジェクトに対する SELECT 権限と SHOW VIEW 権限 | Privilege Management |
ApsaraDB RDS for MySQL インスタンス | 宛先データベースに対する読み取り権限と書き込み権限 | 「アカウントを作成する」および「アカウントの権限を変更する」 |
手順
以下のいずれかの方法を使用して [データ移行] ページに移動し、データ移行インスタンスが存在するリージョンを選択します。
DTS コンソール
DTS コンソール にログオンします。
左側のナビゲーション ウィンドウで、データの移行 をクリックします。
ページの左上隅で、データ移行インスタンスが存在するリージョンを選択します。
DMS コンソール
説明実際の操作は、DMS コンソールのモードとレイアウトによって異なる場合があります。詳細については、「シンプルモード」および「DMS コンソールのレイアウトとスタイルをカスタマイズする」をご参照ください。
DMS コンソール にログオンします。
上部のナビゲーションバーで、ポインタを に移動します。
[データ移行タスク] の右側にあるドロップダウンリストから、データ同期インスタンスが存在するリージョンを選択します。
タスクの作成 をクリックして、タスク構成ページに移動します。
ソースデータベースと宛先データベースを構成します。次の表にパラメータを示します。
セクション
パラメータ
説明
なし
タスク名
DTS タスクの名前。DTS はタスク名を自動的に生成します。タスクを簡単に識別できるわかりやすい名前を指定することをお勧めします。一意のタスク名を指定する必要はありません。
移行元データベース
[既存の接続を選択]
DTS に登録されているデータベースインスタンスを使用する場合は、ドロップダウンリストからインスタンスを選択します。DTS は、インスタンスの以下のデータベースパラメータを自動的に入力します。詳細については、「データベース接続を管理する」をご参照ください。
説明DMS コンソールでは、[DMS データベースインスタンスを選択] ドロップダウンリストからデータベースインスタンスを選択できます。
インスタンスを DTS に登録できなかった場合、または DTS に登録されているインスタンスを使用する必要がない場合は、以下のデータベース情報を構成する必要があります。
データベースタイプ
ソースデータベースのタイプ。 TiDB を選択します。
アクセス方法
ソースデータベースのアクセス方法。TiDB データベースのデプロイメント場所に 基づいてアクセス方法を選択します。この例では、ECS 上の自己管理データベース を選択します。
説明このパラメータを他の値に設定する場合は、データ移行前に自己管理データベースに必要な環境を準備する必要があります。詳細については、「準備の概要」をご参照ください。
インスタンスのリージョン
TiDB データベースが存在するリージョン。
ECS インスタンス ID
TiDB データベースをホストする ECS インスタンスの ID。
ポート番号
ソース TiDB データベースのサービスポート番号。デフォルト値: [4000]。
データベースアカウント
TiDB データベースのアカウント。アカウントに必要な権限の詳細については、このトピックの「データベースアカウントに必要な権限」セクションをご参照ください。
データベースのパスワード
データベースへのアクセスに使用するパスワード。
増分データの移行
TiDB データベースの増分データを移行するかどうかを指定します。ビジネス要件に基づいてこのパラメータを構成します。
説明TiDB データベースから増分データを移行する場合は、○ を選択し、Kafka クラスター情報を入力します。詳細については、このトピックの「Kafka クラスター」セクションをご参照ください。
移行先データベース
[既存の接続を選択]
DTS に登録されているデータベースインスタンスを使用する場合は、ドロップダウンリストからインスタンスを選択します。DTS は、インスタンスの以下のデータベースパラメータを自動的に入力します。詳細については、「データベース接続を管理する」をご参照ください。
説明DMS コンソールでは、[DMS データベースインスタンスを選択] ドロップダウンリストからデータベースインスタンスを選択できます。
インスタンスを DTS に登録できなかった場合、または DTS に登録されているインスタンスを使用する必要がない場合は、以下のデータベース情報を構成する必要があります。
データベースタイプ
ターゲットデータベースの活字。 MySQL を選択します。
アクセス方法
ターゲットデータベースのアクセス方法。 Alibaba Cloud インスタンス を選択します。
インスタンスのリージョン
宛先 ApsaraDB RDS for MySQL インスタンスが存在するリージョン。
Alibaba Cloud アカウント間でデータを複製
この例では、現在の Alibaba Cloud アカウントのデータベースインスタンスが使用されます。 × を選択します。
RDS インスタンス ID
宛先 ApsaraDB RDS for MySQL インスタンスの ID。
データベースアカウント
宛先 ApsaraDB RDS for MySQL インスタンスのデータベースアカウント。アカウントに必要な権限の詳細については、このトピックの「データベースアカウントに必要な権限」セクションをご参照ください。
データベースのパスワード
データベースインスタンスへのアクセスに使用するパスワード。
暗号化
データベースへの接続を暗号化するかどうかを指定します。ビジネス要件に基づいて、[暗号化なし] または [SSL 暗号化] を選択できます。このパラメータを [SSL 暗号化] に設定する場合は、DTS タスクを構成する前に、ApsaraDB RDS for MySQL インスタンスで SSL 暗号化を有効にする必要があります。詳細については、「クラウド証明書を使用して SSL 暗号化を有効にする」をご参照ください。
ページの下部にある [接続テストと続行] をクリックし、表示される [DTS サーバーの CIDR ブロック] ダイアログボックスで 接続テスト をクリックします。
説明DTS サーバーの CIDR ブロックが、ソースデータベースとターゲットデータベースのセキュリティ設定に自動または手動で追加され、DTS サーバーからのアクセスが許可されていることを確認します。詳細については、「DTS サーバーの CIDR ブロックを追加する」をご参照ください。
移行するオブジェクトを構成します。
オブジェクト設定 ページで、移行するオブジェクトを設定します。
パラメータ
説明
移行タイプ
完全データ移行のみを実行するには、[スキーマ移行] と [完全データ移行] を選択します。
データ移行中のサービス継続性を確保するには、[スキーマ移行]、[完全データ移行]、および [増分データ移行] を選択します。
説明[スキーマ移行] を選択しない場合は、宛先データベースにデータを受信するためのデータベースとテーブルが作成され、[選択したオブジェクト] でオブジェクト名マッピング機能が有効になっていることを確認してください。
[増分データ移行] を選択しない場合は、データ移行中にソースデータベースにデータを書き込まないことをお勧めします。これにより、ソースデータベースと宛先データベース間でデータの整合性が確保されます。
競合するテーブルの処理モード
エラーの事前チェックと報告: ターゲットデータベースに、ソースデータベースのテーブルと同じ名前を使用するテーブルが含まれているかどうかを確認します。 ソースデータベースとターゲットデータベースに同じテーブル名のテーブルが含まれていない場合、事前チェックは成功します。 それ以外の場合、事前チェック中にエラーが返され、データ移行タスクを開始できません。
説明ソースデータベースと宛先データベースに同じ名前のテーブルが含まれており、宛先データベースのテーブルを削除または名前変更できない場合は、オブジェクト名マッピング機能を使用して、宛先データベースに移行するテーブルの名前を変更できます。詳細については、「オブジェクト名をマッピングする」をご参照ください。
エラーを無視して続行: ソースデータベースとターゲットデータベースで同一のテーブル名が存在する場合の事前チェックをスキップします。
警告エラーを無視して続行 を選択すると、データの不整合が発生し、ビジネスが以下の潜在的なリスクにさらされる可能性があります。
ソースデータベースと宛先データベースのスキーマが同じで、データレコードのプライマリキーが宛先データベースの既存のデータレコードと同じである場合、以下のシナリオが発生する可能性があります。
完全データ移行中、DTS はデータレコードを宛先データベースに移行しません。宛先データベースの既存のデータレコードは保持されます。
増分データ移行中、DTS はデータレコードを宛先データベースに移行します。宛先データベースの既存のデータレコードは上書きされます。
ソースデータベースと宛先データベースのスキーマが異なる場合、特定の列のみが移行されるか、データ移行タスクが失敗します。注意して進めてください。
移行先インスタンスでのオブジェクト名の大文字化
宛先インスタンスのデータベース名、テーブル名、および列名の大文字と小文字。デフォルトでは、[DTS デフォルトポリシー] が選択されています。他のオプションを選択して、オブジェクト名の大文字と小文字がソースデータベースまたは宛先データベースと一致するようにすることができます。詳細については、「宛先インスタンスのオブジェクト名の大文字と小文字を指定する」をご参照ください。
ソースオブジェクト
ソースオブジェクト セクションから 1 つ以上のオブジェクトを選択します。
アイコンをクリックして、選択中のオブジェクト セクションにオブジェクトを追加します。説明テーブルまたはデータベースを移行対象として選択できます。
選択中のオブジェクト
宛先インスタンスに移行するオブジェクトの名前を変更するには、[選択したオブジェクト] セクションでオブジェクトを右クリックします。詳細については、「単一オブジェクトの名前をマッピングする」をご参照ください。
複数のオブジェクトの名前を一度に変更するには、[選択したオブジェクト] セクションの右上隅にある [一括編集] をクリックします。詳細については、「一度に複数のオブジェクト名をマッピングする」をご参照ください。
説明データをフィルタリングするための WHERE 条件を指定するには、選択中のオブジェクト セクションのテーブルを右クリックします。表示されるダイアログボックスで、フィルター条件を指定します。
オブジェクト名マッピング機能を使用してオブジェクトの名前を変更すると、そのオブジェクトに依存する他のオブジェクトが移行に失敗する可能性があります。
次へ:詳細設定 をクリックして、詳細設定を構成します。
パラメータ
説明
失敗した接続の再試行時間
接続失敗時のリトライ時間の範囲。データ移行タスクの開始後にソースデータベースまたは宛先データベースに接続できない場合、DTS はリトライ時間の範囲内で直ちに接続を再試行します。有効な値: 10 ~ 1,440。単位: 分。デフォルト値: 720。パラメータを 30 より大きい値に設定することをお勧めします。指定されたリトライ時間の範囲内で DTS がソースデータベースと宛先データベースに再接続された場合、DTS はデータ移行タスクを再開します。それ以外の場合、データ移行タスクは失敗します。
説明同じソースデータベースまたは宛先データベースを共有する複数のデータ移行タスクに異なるリトライ時間の範囲を指定した場合、後で指定した値が優先されます。
DTS が接続を再試行すると、DTS インスタンスの料金が発生します。ビジネス要件に基づいてリトライ時間の範囲を指定することをお勧めします。ソースデータベースと宛先インスタンスが解放された後、できるだけ早く DTS インスタンスを解放することもできます。
移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。
その他の問題のリトライ時間の範囲。たとえば、データ移行タスクの開始後に DDL 操作または DML 操作が実行に失敗した場合、DTS はリトライ時間の範囲内で直ちに操作を再試行します。有効な値: 1 ~ 1440。単位: 分。デフォルト値: 10。パラメータを 10 より大きい値に設定することをお勧めします。指定されたリトライ時間の範囲内で失敗した操作が正常に実行された場合、DTS はデータ移行タスクを再開します。それ以外の場合、データ移行タスクは失敗します。
重要移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。 パラメーターの値は、失敗した接続の再試行時間 パラメーターの値よりも小さくなければなりません。
完全移行率を制限するかどうか
完全なデータ移行の速度制限を有効にするかどうかを指定します。完全なデータ移行中、DTS はソースデータベースとターゲットデータベースの読み取りリソースと書き込みリソースを使用します。これにより、データベースサーバーの負荷が増加する可能性があります。ビジネス要件に基づいて、完全なデータ移行の速度制限を有効にすることができます。速度制限を設定するには、1 秒あたりのソースデータベースのクエリ率 QPS、1 秒あたりの完全移行の行数 RPS、および 1 秒あたりの完全移行データ量 (MB) BPS パラメーターを設定する必要があります。これにより、ターゲットデータベースサーバーの負荷が軽減されます。
説明このパラメーターは、完全データ移行 を 移行タイプ パラメーターに選択した場合にのみ構成できます。
増分移行率を制限するかどうか
増分データ移行の速度制限を有効にするかどうかを指定します。1 秒あたりの増分移行の行数 RPS と 1 秒あたりの増分移行データ量 (MB) BPS パラメーターを設定して、速度制限を設定する必要があります。これにより、ターゲットデータベースサーバーの負荷が軽減されます。
説明このパラメーターは、増分データ移行 を 移行タイプ パラメーターに選択した場合にのみ構成できます。
環境タグ
DTS インスタンスを識別するために使用される環境タグ。ビジネス要件に基づいて環境タグを選択できます。この例では、このパラメータを構成する必要はありません。
ETL の設定
抽出、変換、書き出し (ETL) 機能を有効にするかどうかを指定します。詳細については、「ETL とは」をご参照ください。有効な値:
[はい]: ETL 機能を構成します。コードエディタにデータ処理文を入力できます。詳細については、「データ移行タスクまたはデータ同期タスクで ETL を構成する」をご参照ください。
[いいえ]: ETL 機能を構成しません。
監視アラート
データ移行タスクのアラートを構成するかどうかを指定します。タスクが失敗した場合、または移行レイテンシが指定されたしきい値を超えた場合、アラート連絡先に通知が送信されます。有効な値:
[いいえ]: アラートを構成しません。
[はい]: アラートを構成します。この場合、アラートしきい値と アラート通知設定 も構成する必要があります。詳細については、「監視とアラートを構成する」トピックの「DTS タスクの作成時に監視とアラートを構成する」セクションをご参照ください。
[次のステップ: データ検証] をクリックして、データ検証タスクを構成します。
データ検証機能の使用方法の詳細については、「データ検証タスクを構成する」をご参照ください。
タスク設定を保存し、事前チェックを実行します。
関連 API 操作を呼び出して DTS タスクを構成する際に指定するパラメーターを表示するには、次:タスク設定の保存と事前チェック にポインターを移動し、OpenAPI パラメーターのプレビュー をクリックします。
パラメーターを表示する必要がない場合、またはすでに表示した場合は、ページ下部にある 次:タスク設定の保存と事前チェック をクリックします。
説明データ移行タスクを開始する前に、DTS は事前チェックを実行します。タスクが事前チェックに合格した後でのみ、データ移行タスクを開始できます。
タスクが事前チェックに合格しなかった場合は、失敗した各項目の横にある [詳細の表示] をクリックします。チェック結果に基づいて原因を分析した後、問題をトラブルシューティングします。その後、事前チェックを再度実行します。
事前チェック中に項目のアラートがトリガーされた場合:
アラート項目を無視できない場合は、失敗した項目の横にある [詳細の表示] をクリックして、問題をトラブルシューティングします。その後、事前チェックを再度実行します。
アラート項目を無視できる場合は、[アラート詳細の確認] をクリックします。[詳細の表示] ダイアログボックスで、[無視] をクリックします。表示されるメッセージで、[OK] をクリックします。その後、[再チェック] をクリックして、事前チェックを再度実行します。アラート項目を無視すると、データの不整合が発生し、ビジネスが潜在的なリスクにさらされる可能性があります。
インスタンスを購入します。
[成功率] が [100%] になるまで待ちます。その後、[次へ: インスタンスの購入] をクリックします。
[インスタンスの購入] ページで、データ移行インスタンスの [インスタンスクラス] パラメータを構成します。次の表にパラメータを示します。
セクション
パラメータ
説明
新しいインスタンスクラス
[リソースグループ]
データ移行インスタンスが属するリソースグループ。デフォルト値: [デフォルトリソースグループ]。詳細については、「リソース管理とは」をご参照ください。
インスタンスクラス
DTS は、移行速度が異なるインスタンスクラスを提供します。ビジネスシナリオに基づいてインスタンスクラスを選択できます。詳細については、「データ移行インスタンスのインスタンスクラス」をご参照ください。
チェックボックスをオンにして、[データ伝送サービス (従量課金制) サービス規約] を読んで同意します。
[購入して開始] をクリックします。表示されるメッセージで、[OK] をクリックします。
[データ移行] ページでタスクの進捗状況を確認できます。
説明データ移行タスクを増分データの移行に使用できない場合、タスクは自動的に停止します。[完了] が [ステータス] セクションに表示されます。
データ移行タスクを増分データの移行に使用できる場合、タスクは自動的に停止しません。増分データ移行タスクは停止または完了しません。[実行中] が [ステータス] セクションに表示されます。
Kafka クラスタ
パラメータ | 説明 |
Kafka クラスタータイプ | Kafka クラスターのタイプ。Kafka クラスターのデプロイメント場所に 基づいて、このパラメーターを構成します。この例では、ECS 上の自己管理データベース を選択します。 説明 Express Connect、VPN Gateway、または Smart Access Gateway を選択した場合、接続中の VPC ドロップダウンリストから VPC を選択し、ドメイン名または IP アドレス を指定する必要があります。 |
Kafka データソースコンポーネント | 行った準備に基づいて、TiDB のデフォルト binlog 形式を使用する または TiDB CDC モードの Canal-JSON 形式を使用する を選択します。 |
ECS インスタンス ID | Kafka クラスタが属する ECS インスタンスの ID。 |
ポート番号 | Kafka クラスタのサービスポート。 |
Kafka クラスターアカウント | Kafka クラスタのユーザー名とパスワード。Kafka クラスタで認証が有効になっていない場合は、このパラメータを構成する必要はありません。 |
Kafka クラスターのパスワード | |
Kafka のバージョン | Kafka クラスタバージョン。 説明 Kafka クラスタのバージョンが 1.0 以降の場合は、1.0 を選択します。 |
暗号化 | Kafka クラスターへの接続を暗号化するかどうかを指定します。ビジネスおよびセキュリティ要件に基づいて、非暗号化 または SCRAM-SHA-256 を選択します。 |
トピック | 増分データが属するトピック。 |