このトピックでは、Data Transmission Service (DTS) を使用して、TiDB データベースから AnalyticDB for MySQL V3.0 クラスタにデータを移行する方法について説明します。
前提条件
準備(オプション)
以下のいずれかの方法を使用して、TiDB データベースから増分データを収集できます。
TiDB Binlog を使用する
ソースデータベースがデプロイされているサーバーは、Pump、Drainer、および Kafka クラスタがデプロイされているサーバーと同じ内部ネットワーク内にある必要があります。これにより、ネットワークレイテンシが増分データ移行に与える影響を最小限に抑えることができます。
以下のいずれかの方法で、Kafka クラスタまたはインスタンスを準備します。
自己管理 Kafka クラスタをデプロイします。詳細については、Apache Kafka 公式 Web サイトをご覧ください。
警告Kafka ブローカーの
message.max.bytes
パラメータとreplica.fetch.max.bytes
パラメータ、および Kafka コンシューマーのfetch.message.max.bytes
パラメータを大きい値に設定することをお勧めします。これにより、Kafka クラスタは TiDB データベースからより大量のバイナリログデータを受信できます。詳細については、「CONFIGURATION」をご参照ください。ApsaraMQ for Kafka インスタンスを作成します。詳細については、「概要」をご参照ください。
説明ApsaraMQ for Kafka インスタンスは、ソースデータベースサーバーと同じ VPC (Virtual Private Cloud) にデプロイする必要があります。これにより、信頼性の高いデータ転送が保証され、ネットワークレイテンシが増分データ移行に与える影響を最小限に抑えることができます。
自己管理 Kafka クラスタまたは ApsaraMQ for Kafka インスタンスにトピックを作成します。
重要増分データを ID が 0 のパーティションに確実にレプリケートするには、トピックにパーティションが 1 つだけ含まれていることを確認してください。
Pump と Drainer をデプロイします。詳細については、「TiDB Binlog Cluster Deployment」をご参照ください。
Drainer の構成ファイルを変更し、Drainer からデータを受信する Kafka クラスタを指定します。詳細については、「Binlog Consumer Client User Guide」をご参照ください。
説明TiDB データベースがデプロイされているサーバーが Kafka クラスタに接続できることを確認してください。
DTS サーバーの CIDR ブロックを TiDB データベースのホワイトリストに追加します。詳細については、「DTS サーバーの CIDR ブロックの追加」をご参照ください。
TiCDC を使用する
以下のいずれかの方法で、Kafka クラスタまたはインスタンスを準備します。
自己管理 Kafka クラスタをデプロイします。詳細については、Apache Kafka 公式 Web サイトをご覧ください。
警告Kafka ブローカーの
message.max.bytes
パラメータとreplica.fetch.max.bytes
パラメータ、および Kafka コンシューマーのfetch.message.max.bytes
パラメータを大きい値に設定することをお勧めします。これにより、Kafka クラスタは TiDB データベースからより大量のバイナリログデータを受信できます。詳細については、「CONFIGURATION」をご参照ください。ApsaraMQ for Kafka インスタンスを作成します。詳細については、「概要」をご参照ください。
説明ApsaraMQ for Kafka インスタンスは、ソースデータベースサーバーと同じ VPC (Virtual Private Cloud) にデプロイする必要があります。これにより、信頼性の高いデータ転送が保証され、ネットワークレイテンシが増分データ移行に与える影響を最小限に抑えることができます。
自己管理 Kafka クラスタまたは ApsaraMQ for Kafka インスタンスにトピックを作成します。
重要増分データを ID が 0 のパーティションに確実にレプリケートするには、トピックにパーティションが 1 つだけ含まれていることを確認してください。
TiCDC をインストールします。詳細については、Deploy and Maintain TiCDC をご参照ください。
説明TiUP を使用して、新しい TiCDC ノードを追加するか、TiDB クラスタ内の既存の TiCDC ノードをスケールアウトすることをお勧めします。
ソース TiDB データベースの増分データを Kafka にレプリケートします。詳細については、Replicate Data to Kafka をご参照ください。
説明TiDB データベースがデプロイされているサーバーが Kafka クラスタに接続できることを確認してください。
最初のコマンドラインでは、
tiup cdc cli changefeed create \
を使用することをお勧めします。
使用上の注意
カテゴリ | 説明 |
ソースデータベースの制限 |
|
その他の制限 |
|
データ型マッピング
詳細については、「異種データベース間のデータ型マッピング」をご参照ください。
課金
移行タイプ | インスタンス構成料金 | インターネットトラフィック料金 |
スキーマ移行と完全データ移行 | 無料。 | 宛先データベースの アクセス方法 パラメータが パブリック IP アドレス に設定されている場合、インターネットトラフィック料金が発生します。詳細については、「課金の概要」をご参照ください。 |
増分データ移行 | 課金されます。詳細については、「請求の概要」をご参照ください。 |
増分移行をサポートする SQL 操作
操作タイプ | SQL 文 |
DML | INSERT、UPDATE、および DELETE 説明 宛先 AnalyticDB for MySQL V3.0 クラスタにデータが書き込まれると、UPDATE 文は自動的に REPLACE INTO 文に変換されます。UPDATE 文がプライマリキーで実行される場合、UPDATE 文は DELETE 文と INSERT 文に変換されます。 |
DDL | CREATE TABLE、DROP TABLE、RENAME TABLE、TRUNCATE TABLE、ADD COLUMN、および DROP COLUMN |
データベースアカウントに必要な権限
データベース | 必要な権限 | 参照 |
TiDB データベース | 移行するオブジェクトに対する SELECT 権限と SHOW VIEW 権限 | Privilege Management |
AnalyticDB for MySQL V3.0 クラスタ | 宛先データベースに対する読み取りおよび書き込み権限 | 「データベースアカウントの作成」をご参照ください。 |
手順
以下のいずれかの方法を使用して、データ移行ページに移動し、データ移行インスタンスが存在するリージョンを選択します。
DTS コンソール
DTS コンソール にログインします。
左側のナビゲーションウィンドウで、データの移行 をクリックします。
ページの左上隅で、データ移行インスタンスが存在するリージョンを選択します。
DMS コンソール
説明実際の操作は、DMS コンソールのモードとレイアウトによって異なる場合があります。詳細については、「シンプルモード」および「DMS コンソールのレイアウトとスタイルのカスタマイズ」をご参照ください。
DMS コンソール にログインします。
上部のナビゲーションバーで、ポインタを
に移動します。[データ移行タスク] の右側にあるドロップダウンリストから、データ同期インスタンスが存在するリージョンを選択します。
タスクの作成 をクリックして、タスク構成ページに移動します。
ソースデータベースと宛先データベースを構成します。次の表にパラメータを示します。
セクション
パラメータ
説明
該当なし
タスク名
DTS タスクの名前。DTS はタスク名を自動的に生成します。タスクを簡単に識別できるわかりやすい名前を指定することをお勧めします。一意のタスク名を指定する必要はありません。
移行元データベース
[既存の接続を選択]
DTS に登録されているデータベースインスタンスを使用する場合は、ドロップダウンリストからインスタンスを選択します。DTS は、インスタンスの以下のデータベースパラメータを自動的に入力します。詳細については、「データベース接続の管理」をご参照ください。
説明DMS コンソールでは、[DMS データベースインスタンスを選択] ドロップダウンリストからデータベースインスタンスを選択できます。
インスタンスを DTS に登録できなかった場合、または DTS に登録されているインスタンスを使用する必要がない場合は、以下のデータベース情報を構成する必要があります。
データベースタイプ
ソースデータベースの種類。TiDB を選択します。
アクセス方法
ソースデータベースのアクセス方法。TiDB データベースのデプロイ場所に基づいてアクセス方法を選択します。この例では、ECS 上の自己管理データベース を選択します。
説明このパラメータを他の値に設定する場合は、データ移行前に自己管理データベースに必要な環境を準備する必要があります。詳細については、「準備の概要」をご参照ください。
インスタンスのリージョン
TiDB データベースが存在するリージョン。
ECS インスタンス ID
TiDB データベースをホストする ECS インスタンスの ID。
ポート番号
TiDB データベースのサービスポート番号。デフォルト値:4000。
データベースアカウント
TiDB データベースのアカウント。
データベースのパスワード
データベースへのアクセスに使用するパスワード。
増分データの移行
TiDB データベースの増分データを移行するかどうかを指定します。ビジネス要件に基づいてこのパラメータを構成します。
説明TiDB データベースから増分データを移行する場合は、○ を選択し、Kafka クラスタを入力します。
移行先データベース
[既存の接続を選択]
DTS に登録されているデータベースインスタンスを使用する場合は、ドロップダウンリストからインスタンスを選択します。DTS は、インスタンスの以下のデータベースパラメータを自動的に入力します。詳細については、「データベース接続の管理」をご参照ください。
説明DMS コンソールでは、[DMS データベースインスタンスを選択] ドロップダウンリストからデータベースインスタンスを選択できます。
インスタンスを DTS に登録できなかった場合、または DTS に登録されているインスタンスを使用する必要がない場合は、以下のデータベース情報を構成する必要があります。
データベースタイプ
宛先データベースの種類。AnalyticDB for MySQL 3.0 を選択します。
アクセス方法
Alibaba Cloud インスタンス を選択します。
インスタンスのリージョン
宛先 AnalyticDB for MySQL V3.0 クラスタが存在するリージョン。
インスタンス ID
宛先 AnalyticDB for MySQL V3.0 クラスタの ID。
データベースアカウント
宛先 AnalyticDB for MySQL V3.0 クラスタのデータベースアカウント。アカウントに必要な権限の詳細については、このトピックの データベースアカウントの権限要件 セクションをご参照ください。
データベースのパスワード
データベースインスタンスへのアクセスに使用するパスワード。
ページの下部にある [接続をテストして続行] をクリックし、表示される [DTS サーバーの CIDR ブロック] ダイアログボックスで 接続テスト をクリックします。
説明DTS サーバーの CIDR ブロックが、ソースデータベースとターゲットデータベースのセキュリティ設定に自動または手動で追加され、DTS サーバーからのアクセスが許可されていることを確認します。詳細については、「DTS サーバーの CIDR ブロックを追加する」をご参照ください。
移行するオブジェクトを構成します。
オブジェクト設定 ページで、移行するオブジェクトを構成します。
パラメータ
説明
移行タイプ
完全データ移行のみを実行するには、[スキーマ移行] と [完全データ移行] を選択します。
データ移行中のサービス継続性を確保するには、[スキーマ移行]、[完全データ移行]、および [増分データ移行] を選択します。
説明[スキーマ移行] を選択しない場合は、宛先データベースにデータを受信するためのデータベースとテーブルが作成され、[選択済みオブジェクト] でオブジェクト名マッピング機能が有効になっていることを確認してください。
[増分データ移行] を選択しない場合は、データ移行中にソースデータベースにデータを書き込まないことをお勧めします。これにより、ソースデータベースと宛先データベース間でデータの整合性が確保されます。
テーブルの結合
[はい]:この値を選択すると、DTS は各テーブルに
__dts_data_source
列を追加してデータソースを記録します。詳細については、「複数テーブルマージ機能の有効化」をご参照ください。[いいえ]:これはデフォルト値です。
説明このパラメータを [はい] に設定すると、タスクで選択したすべてのソーステーブルが宛先テーブルにマージされます。特定のソーステーブルをマージする必要がない場合は、これらのテーブルに対して個別のデータ移行タスクを作成できます。
警告DDL 操作を実行してソースデータベースまたはテーブルのスキーマを変更しないことをお勧めします。変更すると、データの不整合が発生したり、データ移行タスクが失敗したりする可能性があります。
競合するテーブルの処理モード
エラーの事前チェックと報告:宛先データベースにソースデータベースのテーブルと同じ名前を使用するテーブルが含まれているかどうかを確認します。ソースデータベースと宛先データベースに同じテーブル名のテーブルが含まれていない場合、事前チェックは合格です。それ以外の場合、事前チェック中にエラーが返され、データ移行タスクを開始できません。
説明ソースデータベースと宛先データベースに同じ名前のテーブルが含まれており、宛先データベースのテーブルを削除または名前変更できない場合は、オブジェクト名マッピング機能を使用して、宛先データベースに移行されるテーブルの名前を変更できます。詳細については、「オブジェクト名のマッピング」をご参照ください。
エラーを無視して続行:ソースデータベースと宛先データベースで同じテーブル名の事前チェックをスキップします。
警告エラーを無視して続行 を選択すると、データの不整合が発生し、ビジネスが以下の潜在的なリスクにさらされる可能性があります。
ソースデータベースと宛先データベースのスキーマが同じで、データレコードのプライマリキーが宛先データベースの既存のデータレコードと同じである場合、以下のシナリオが発生する可能性があります。
完全データ移行中、DTS はデータレコードを宛先データベースに移行しません。宛先データベースの既存のデータレコードは保持されます。
増分データ移行中、DTS はデータレコードを宛先データベースに移行します。宛先データベースの既存のデータレコードは上書きされます。
ソースデータベースと宛先データベースのスキーマが異なる場合、特定の列のみが移行されるか、データ移行タスクが失敗します。注意して進めてください。
移行先インスタンスでのオブジェクト名の大文字化
宛先インスタンスのデータベース名、テーブル名、および列名の大文字と小文字の区別。デフォルトでは、[DTS デフォルトポリシー] が選択されています。他のオプションを選択して、オブジェクト名の大文字と小文字の区別がソースデータベースまたは宛先データベースと一致するようにすることができます。詳細については、「宛先インスタンスのオブジェクト名の大文字と小文字の区別の指定」をご参照ください。
ソースオブジェクト
ソースオブジェクト セクションから 1 つ以上のオブジェクトを選択します。
アイコンをクリックして、選択中のオブジェクト セクションにオブジェクトを追加します。
説明移行対象としてテーブルまたはデータベースを選択できます。
選択中のオブジェクト
宛先インスタンスに移行するオブジェクトの名前を変更するには、[選択済みオブジェクト] セクションでオブジェクトを右クリックします。詳細については、「単一オブジェクトの名前のマッピング」をご参照ください。
一度に複数のオブジェクトの名前を変更するには、[選択済みオブジェクト] セクションの右上隅にある [一括編集] をクリックします。詳細については、「一度に複数のオブジェクト名のマッピング」をご参照ください。
説明WHERE 条件を指定してデータをフィルタリングするには、選択中のオブジェクト セクションでテーブルを右クリックします。表示されるダイアログボックスで、フィルタ条件を指定します。
オブジェクト名マッピング機能を使用してオブジェクトの名前を変更すると、そのオブジェクトに依存する他のオブジェクトが移行に失敗する可能性があります。
次へ:詳細設定 をクリックして、詳細設定を構成します。
パラメータ
説明
失敗した接続の再試行時間
接続失敗時の再試行時間の範囲。データ移行タスクの開始後にソースデータベースまたは宛先データベースに接続できない場合、DTS は再試行時間の範囲内で直ちに接続を再試行します。有効値:10 ~ 1,440。単位:分。デフォルト値:720。このパラメータは 30 より大きい値に設定することをお勧めします。指定された再試行時間の範囲内で DTS がソースデータベースと宛先データベースに再接続された場合、DTS はデータ移行タスクを再開します。それ以外の場合、データ移行タスクは失敗します。
説明同じソースデータベースまたは宛先データベースを共有する複数のデータ移行タスクに異なる再試行時間の範囲を指定した場合、後で指定した値が優先されます。
DTS が接続を再試行すると、DTS インスタンスの料金が発生します。ビジネス要件に基づいて再試行時間の範囲を指定することをお勧めします。また、ソースデータベースと宛先インスタンスが解放された後、できるだけ早く DTS インスタンスを解放することもできます。
移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。
その他の問題の再試行時間の範囲。たとえば、データ移行タスクの開始後に DDL または DML 操作の実行に失敗した場合、DTS は再試行時間の範囲内で直ちに操作を再試行します。有効値:1 ~ 1440。単位:分。デフォルト値:10。このパラメータは 10 より大きい値に設定することをお勧めします。指定された再試行時間の範囲内で失敗した操作が正常に実行された場合、DTS はデータ移行タスクを再開します。それ以外の場合、データ移行タスクは失敗します。
重要移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。 パラメータの値は、失敗した接続の再試行時間 パラメータの値よりも小さくなければなりません。
完全移行率を制限するかどうか
完全データ移行のスロットリングを有効にするかどうかを指定します。完全データ移行中、DTS はソースデータベースと宛先データベースの読み取りおよび書き込みリソースを使用します。これにより、データベースサーバーの負荷が増加する可能性があります。ビジネス要件に基づいて、完全データ移行のスロットリングを有効にすることができます。スロットリングを構成するには、1 秒あたりのソースデータベースのクエリ率 QPS、1 秒あたりの完全移行の行数 RPS、および 1 秒あたりの完全移行データ量 (MB) BPS パラメータを構成する必要があります。これにより、宛先データベースサーバーの負荷が軽減されます。
説明移行タイプ パラメータで 完全データ移行 を選択した場合にのみ、このパラメータを構成できます。
増分移行率を制限するかどうか
増分データ移行のスロットリングを有効にするかどうかを指定します。スロットリングを構成するには、1 秒あたりの増分移行の行数 RPS と 1 秒あたりの増分移行データ量 (MB) BPS パラメータを構成する必要があります。これにより、宛先データベースサーバーの負荷が軽減されます。
説明移行タイプ パラメータで 増分データ移行 を選択した場合にのみ、このパラメータを構成できます。
環境タグ
DTS インスタンスを識別するために使用される環境タグ。ビジネス要件に基づいて環境タグを選択できます。この例では、このパラメータを構成する必要はありません。
ETL の設定
抽出、変換、書き出し (ETL) 機能を有効にするかどうかを指定します。詳細については、「ETL とは」をご参照ください。有効値:
[はい]:ETL 機能を構成します。コードエディタにデータ処理文を入力できます。詳細については、「データ移行タスクまたはデータ同期タスクでの ETL の構成」をご参照ください。
[いいえ]:ETL 機能を構成しません。
監視アラート
データ移行タスクのアラートを構成するかどうかを指定します。タスクが失敗した場合、または移行レイテンシが指定されたしきい値を超えた場合、アラート連絡先に通知が送信されます。有効値:
[いいえ]:アラートを構成しません。
[はい]:アラートを構成します。この場合、アラートのしきい値と アラート通知設定 も構成する必要があります。詳細については、「監視とアラートの構成」トピックの DTS タスクの作成時に監視とアラートを構成する セクションをご参照ください。
[次のステップ:データ検証] をクリックして、データ検証タスクを構成します。
データ検証機能の使用方法の詳細については、「データ検証タスクの構成」をご参照ください。
オプション。 次:データベースおよびテーブルのフィールド設定 をクリックします。表示されるページで、宛先 AnalyticDB for MySQL V3.0 クラスタに移行するテーブルの タイプ、プライマリキー列の追加、配布キー、および [パーティションキー]、[パーティションルール]、[パーティションライフサイクル] などのパーティションキー情報を構成します。
説明このステップは、タスクで移行するオブジェクトを構成するときに、移行タイプ で スキーマ移行 を選択した場合にのみ使用できます。定義ステータス を すべて に設定し、データベースとテーブルフィールドを変更できます。
プライマリキー列の追加 フィールドでは、複数の列を指定して複合プライマリキーを形成できます。この場合、1 つ以上の プライマリキー列の追加 を 配布キー および [パーティションキー] として指定する必要があります。詳細については、「CREATE TABLE」をご参照ください。
タスク設定を保存し、事前チェックを実行します。
関連する API 操作を呼び出して DTS タスクを構成するときに指定するパラメータを表示するには、次:タスク設定の保存と事前チェック にポインタを移動し、OpenAPI パラメーターのプレビュー をクリックします。
パラメータを表示する必要がない場合、またはすでに表示している場合は、ページの下部にある 次:タスク設定の保存と事前チェック をクリックします。
説明データ移行タスクを開始する前に、DTS は事前チェックを実行します。タスクが事前チェックに合格した後でのみ、データ移行タスクを開始できます。
タスクが事前チェックに合格しなかった場合は、失敗した各項目の横にある [詳細の表示] をクリックします。チェック結果に基づいて原因を分析した後、問題をトラブルシューティングします。その後、事前チェックを再度実行します。
事前チェック中に項目のアラートがトリガーされた場合:
アラート項目を無視できない場合は、失敗した項目の横にある [詳細の表示] をクリックして、問題をトラブルシューティングします。その後、事前チェックを再度実行します。
アラート項目を無視できる場合は、[アラート詳細の確認] をクリックします。[詳細の表示] ダイアログボックスで、[無視] をクリックします。表示されるメッセージで、[OK] をクリックします。次に、[再チェック] をクリックして、事前チェックを再度実行します。アラート項目を無視すると、データの不整合が発生し、ビジネスが潜在的なリスクにさらされる可能性があります。
インスタンスを購入します。
[成功率] が [100%] になるまで待ちます。次に、[次へ:インスタンスの購入] をクリックします。
[インスタンスの購入] ページで、データ移行インスタンスの [インスタンスクラス] パラメータを構成します。次の表にパラメータを示します。
セクション
パラメータ
説明
新しいインスタンスクラス
[リソースグループ]
データ移行インスタンスが属するリソースグループ。デフォルト値:[デフォルトのリソースグループ]。詳細については、「リソース管理とは」をご参照ください。
インスタンスクラス
DTS は、移行速度が異なるインスタンスクラスを提供します。ビジネスシナリオに基づいてインスタンスクラスを選択できます。詳細については、「データ移行インスタンスのインスタンスクラス」をご参照ください。
チェックボックスをオンにして、[データ伝送サービス (従量課金制) サービス規約] を読んで同意します。
[購入して開始] をクリックします。表示されるメッセージで、[OK] をクリックします。
[データ移行] ページでタスクの進捗状況を確認できます。
説明データ移行タスクを増分データの移行に使用できない場合、タスクは自動的に停止します。[ステータス] セクションに [完了] と表示されます。
データ移行タスクを増分データの移行に使用できる場合、タスクは自動的に停止しません。増分データ移行タスクは停止または完了しません。[ステータス] セクションに [実行中] と表示されます。
Kafka クラスタ
パラメータ | 説明 |
Kafka クラスタータイプ | Kafka クラスタのタイプ。Kafka クラスタのデプロイ場所に基づいてこのパラメータを構成します。この例では、ECS 上の自己管理データベース を選択します。 説明 Express Connect、VPN Gateway、または Smart Access Gateway を選択する場合は、接続中の VPC ドロップダウンリストから VPC を選択し、ドメイン名または IP アドレス を指定する必要もあります。 |
Kafka データソースコンポーネント | 行った準備に基づいて、TiDB のデフォルト binlog 形式を使用する または TiDB CDC モードの Canal-JSON 形式を使用する を選択します。 |
ECS インスタンス ID | Kafka クラスタが属する ECS インスタンスの ID。 |
ポート番号 | Kafka クラスタのサービスポート。 |
Kafka クラスターアカウント | Kafka クラスタのユーザー名とパスワード。Kafka クラスタで認証が有効になっていない場合は、このパラメータを構成する必要はありません。 |
Kafka クラスターのパスワード | |
Kafka のバージョン | Kafka クラスタのバージョン。 説明 Kafka クラスタのバージョンが 1.0 以降の場合は、1.0 を選択します。 |
暗号化 | Kafka クラスタへの接続を暗号化するかどうかを指定します。ビジネスおよびセキュリティ要件に基づいて、非暗号化 または SCRAM-SHA-256 を選択します。 |
トピック | 増分データが属するトピック。 |