このトピックでは、Data Transmission Service (DTS) を使用して ApsaraDB RDS for MySQL インスタンスから ApsaraMQ for Kafka インスタンスにデータを移行する方法について説明します。
前提条件
ソース ApsaraDB RDS for MySQL インスタンスと宛先 ApsaraMQ for Kafka インスタンスが作成されている。
説明ApsaraDB RDS for MySQL インスタンスの作成方法の詳細については、「ApsaraDB RDS for MySQL インスタンスの作成」をご参照ください。
ソースデータベースと宛先データベースのサポートされているバージョンの詳細については、「データ移行シナリオの概要」をご参照ください。
宛先 ApsaraMQ for Kafka インスタンスの使用可能なストレージ容量が、ソース ApsaraDB RDS for MySQL インスタンスのデータの合計サイズよりも大きい。
宛先 ApsaraMQ for Kafka インスタンスで、移行されたデータを受信するためのトピックが作成されている。詳細については、「手順 3: リソースの作成」トピックの「手順 1: トピックの作成」セクションをご参照ください。
制限事項
DTS は、ソースデータベースの外部キーを宛先データベースに移行しません。そのため、ソースデータベースのカスケード操作と削除操作は宛先データベースに移行されません。
カテゴリ | 説明 |
ソースデータベースの制限 |
|
その他の制限 |
|
特別なケース |
|
課金ルール
移行タイプ | タスク構成料金 | インターネットトラフィック料金 |
スキーマ移行と完全データ移行 | 無料。 | Alibaba Cloud からインターネット経由でデータが移行される場合にのみ課金されます。詳細については、「課金概要」をご参照ください。 |
増分データ移行 | 課金されます。詳細については、「課金概要」をご参照ください。 |
移行タイプ
スキーマ移行
DTS は、選択したオブジェクトのスキーマをソースデータベースから宛先データベースに移行します。
完全データ移行
DTS は、必要なオブジェクトの既存データをソースデータベースから宛先データベースに移行します。
増分データ移行
完全データ移行が完了すると、DTS はソースデータベースから宛先データベースに増分データを移行します。増分データ移行により、データ移行中に自己管理アプリケーションのサービスを中断することなく、データをスムーズに移行できます。
増分移行できる SQL 操作
操作タイプ | SQL 文 |
DML | INSERT、UPDATE、DELETE |
DDL |
|
データベースアカウントに必要な権限
インスタンス | スキーマ移行 | 完全データ移行 | 増分データ移行 |
ソース ApsaraDB RDS for MySQL インスタンス | 移行対象のオブジェクトに対する読み取り権限。 |
手順
次のいずれかの方法を使用してデータ移行ページに移動し、データ移行インスタンスが存在するリージョンを選択します。
DTS コンソール
DTS コンソール にログインします。
左側のナビゲーションウィンドウで、データの移行 をクリックします。
ページの左上隅で、データ移行インスタンスが存在するリージョンを選択します。
DMS コンソール
説明実際の操作は、DMS コンソールのモードとレイアウトによって異なる場合があります。詳細については、「シンプルモード」と「DMS コンソールのレイアウトとスタイルのカスタマイズ」をご参照ください。
DMS コンソール にログインします。
上部のナビゲーションバーで、
にポインターを移動します。[データ移行タスク] の右側のドロップダウンリストから、データ同期インスタンスが存在するリージョンを選択します。
タスクの作成 をクリックして、タスク構成ページに移動します。
ソースデータベースと宛先データベースを構成します。次の表にパラメータを示します。
警告ソースデータベースと宛先データベースを構成した後、ページの上部に表示される [制限事項] を読むことをお勧めします。そうでない場合、タスクが失敗したり、データの不整合が発生したりする可能性があります。
セクション
パラメータ
説明
該当なし
タスク名
DTS タスクの名前。DTS はタスク名を自動的に生成します。タスクを簡単に識別できる説明的な名前を指定することをお勧めします。一意のタスク名を指定する必要はありません。
ソースデータベース
[既存の接続を選択]
DTS に登録されているデータベースインスタンスを使用する場合は、ドロップダウンリストからインスタンスを選択します。DTS は、インスタンスの次のデータベースパラメータを自動的に入力します。詳細については、「データベース接続の管理」をご参照ください。
説明DMS コンソールでは、[DMS データベースインスタンスを選択] ドロップダウンリストからデータベースインスタンスを選択できます。
インスタンスを DTS に登録できなかった場合、または DTS に登録されているインスタンスを使用する必要がない場合は、次のデータベース情報を構成する必要があります。
データベースタイプ
ソースデータベースのタイプ。[MySQL] を選択します。
アクセス方法
ソースデータベースのアクセス方法。[Alibaba Cloud インスタンス] を選択します。
インスタンスリージョン
ソース ApsaraDB RDS for MySQL インスタンスが存在するリージョン。
Alibaba Cloudアカウント全体でのデータの複製
Alibaba Cloud アカウント間でデータを移行するかどうかを指定します。この例では、[いいえ] が選択されています。
[RDS インスタンス ID]
ソース ApsaraDB RDS for MySQL インスタンスの ID。
データベースアカウント
ソース ApsaraDB RDS for MySQL インスタンスのデータベースアカウント。アカウントには、移行対象のオブジェクトに対する読み取り権限が必要です。
データベースパスワード
データベースへのアクセスに使用するパスワード。
暗号化
データベースへの接続を暗号化するかどうかを指定します。ビジネス要件に基づいて、[暗号化なし] または [SSL 暗号化] を選択できます。このパラメータを [SSL 暗号化] に設定する場合は、DTS タスクを構成する前に、ApsaraDB RDS for MySQL インスタンスで SSL 暗号化を有効にする必要があります。詳細については、「クラウド証明書を構成して SSL 暗号化を有効にする」をご参照ください。
宛先データベース
[既存の接続を選択]
DTS に登録されているデータベースインスタンスを使用する場合は、ドロップダウンリストからインスタンスを選択します。DTS は、インスタンスの次のデータベースパラメータを自動的に入力します。詳細については、「データベース接続の管理」をご参照ください。
説明DMS コンソールでは、[DMS データベースインスタンスを選択] ドロップダウンリストからデータベースインスタンスを選択できます。
インスタンスを DTS に登録できなかった場合、または DTS に登録されているインスタンスを使用する必要がない場合は、次のデータベース情報を構成する必要があります。
データベースタイプ
宛先データベースのタイプ。[Kafka] を選択します。
アクセス方法
宛先データベースのアクセス方法。Alibaba Cloud インスタンス を選択します。
インスタンスリージョン
宛先 ApsaraMQ for Kafka インスタンスが存在するリージョン。
[Kafka インスタンス ID]
宛先 ApsaraMQ for Kafka インスタンスの ID。
暗号化
宛先インスタンスへの接続を暗号化するかどうかを指定します。ビジネスとセキュリティの要件に基づいて、[暗号化なし] または [SCRAM-SHA-256] を選択します。
[トピック]
移行されたデータを受信するために使用されるトピック。ドロップダウンリストからトピックを選択します。
[DDL 情報を格納するトピック]
DDL 情報を格納するために使用されるトピック。ドロップダウンリストからトピックを選択します。このパラメータを構成しない場合、DDL 情報は [トピック] パラメータで指定されたトピックに格納されます。
[Kafka Schema Registry を使用する]
Kafka Schema Registry を使用するかどうかを指定します。Kafka Schema Registry は、メタデータのサービス層を提供します。これは、Avro スキーマを格納および取得するための RESTful API を提供します。有効な値:
いいえ
[はい]: このパラメータで [はい] を選択した場合は、Avro スキーマの Kafka Schema Registry に登録されている URL または IP アドレスを入力する必要があります。
ページの下部にある [接続をテストして続行] をクリックします。
説明DTS サーバーの CIDR ブロックをソースデータベースと宛先データベースのセキュリティ設定に自動または手動で追加して、DTS サーバーからのアクセスを許可できることを確認してください。詳細については、「DTS サーバーの CIDR ブロックを追加する」をご参照ください。
ソースデータベースまたは宛先データベースが自己管理データベースであり、その アクセス方法 が Alibaba Cloud インスタンス に設定されていない場合は、DTS サーバーの CIDR ブロック ダイアログボックスの 接続テスト をクリックします。
移行するオブジェクトを構成します。
オブジェクト設定 ページで、移行するオブジェクトを構成します。
パラメータ
説明
移行タイプ
完全データ移行のみを実行するには、[スキーマ移行] と [完全データ移行] を選択します。
データ移行中のサービス継続性を確保するには、[スキーマ移行]、[完全データ移行]、[増分データ移行] を選択します。
説明宛先データベースが ApsaraMQ for Kafka インスタンスの場合、[スキーマ移行] はサポートされていません。
[増分データ移行] を選択しない場合は、データ移行中にソースデータベースにデータを書き込まないことをお勧めします。これにより、ソースデータベースと宛先データベース間でデータの整合性が確保されます。
競合テーブルの処理モード
エラーの事前チェックと報告: 宛先データベースにソースデータベースのテーブルと同じ名前を使用するテーブルが含まれているかどうかを確認します。ソースデータベースと宛先データベースに同じテーブル名のテーブルが含まれていない場合、事前チェックは合格です。そうでない場合、事前チェック中にエラーが返され、データ移行タスクを開始できません。
説明ソースデータベースと宛先データベースに同じ名前のテーブルが含まれており、宛先データベースのテーブルを削除または名前変更できない場合は、オブジェクト名マッピング機能を使用して、宛先データベースに移行されるテーブルの名前を変更できます。詳細については、「オブジェクト名をマッピングする」をご参照ください。
エラーを無視して続行: ソースデータベースと宛先データベースで同じテーブル名の事前チェックをスキップします。
警告エラーを無視して続行 を選択すると、データの不整合が発生し、ビジネスが次の潜在的なリスクにさらされる可能性があります。
ソースデータベースと宛先データベースのスキーマが同じで、データレコードのプライマリキーが宛先データベースの既存のデータレコードと同じである場合、次のシナリオが発生する可能性があります。
完全データ移行中、DTS はデータレコードを宛先データベースに移行しません。宛先データベースの既存のデータレコードは保持されます。
増分データ移行中、DTS はデータレコードを宛先データベースに移行します。宛先データベースの既存のデータレコードは上書きされます。
ソースデータベースと宛先データベースのスキーマが異なる場合、特定の列のみが移行されるか、データ移行タスクが失敗します。注意して進めてください。
[Kafka のデータ形式]
宛先 ApsaraMQ for Kafka インスタンスにデータが格納される形式。
[DTS Avro] を選択すると、データは DTS Avro のスキーマ定義に基づいて解析されます。詳細については、「GitHub」をご参照ください。
[Canal JSON] を選択すると、データは Canal JSON 形式に解析されます。データを Canal JSON 形式に解析するために使用されるパラメータとサンプルコードの詳細については、「メッセージキューのデータ形式」トピックの Canal JSON セクションをご参照ください。
[Kafka データ圧縮形式]
Kafka 圧縮データの圧縮形式。ビジネス要件に基づいて圧縮形式を選択します。有効な値:
[LZ4]: (デフォルト): 低圧縮率、高圧縮速度。
[GZIP]: 高圧縮率、低圧縮速度。
説明GZIP 圧縮は大量の CPU リソースを消費します。
[Snappy]: 中程度の圧縮率、中程度の圧縮速度。
[Kafka パーティションへのデータ送信ポリシー]
Kafka パーティションにデータを移行するためのポリシー。ビジネス要件に基づいてポリシーを選択します。詳細については、「Kafka パーティションにデータを移行するためのポリシーを指定する」をご参照ください。
[メッセージ確認応答メカニズム]
DTS が Apache Kafka インスタンスにデータを移行するときのメッセージ確認応答メカニズム。詳細については、「メッセージ確認応答メカニズム」をご参照ください。
移行先インスタンスでのオブジェクト名の大文字化
宛先インスタンスのデータベース名、テーブル名、列名の大文字と小文字の区別。デフォルトでは、[DTS デフォルトポリシー] が選択されています。他のオプションを選択して、オブジェクト名の大文字と小文字の区別がソースデータベースまたは宛先データベースと一致するようにすることができます。詳細については、「宛先インスタンスのオブジェクト名の大文字と小文字の区別を指定する」をご参照ください。
ソースオブジェクト
ソースオブジェクト セクションから 1 つ以上のオブジェクトを選択します。
アイコンをクリックして、選択中のオブジェクト セクションにオブジェクトを追加します。
説明移行対象としてテーブルのみを選択できます。
選択中のオブジェクト
この例では、このパラメータを構成する必要はありません。オブジェクト名マッピング機能を使用して、宛先 ApsaraMQ for Kafka インスタンスに関する情報 (ソーステーブルのデータの移行先のトピックの名前、トピックのパーティション数、パーティションキーなど) を指定できます。詳細については、このトピックの オブジェクト名マッピング機能を使用する セクションをご参照ください。
説明オブジェクト名マッピング機能を使用してオブジェクトの名前を変更すると、そのオブジェクトに依存する他のオブジェクトが移行に失敗する可能性があります。
増分移行中にオブジェクトで実行された DML または DDL 操作を移行するには、選択中のオブジェクト セクションでオブジェクトを右クリックします。表示されるダイアログボックスで、移行する DML 操作と DDL 操作を選択します。詳細については、このトピックの 増分移行できる SQL 操作 セクションをご参照ください。
次へ:詳細設定 をクリックして詳細設定を構成します。
パラメータ
説明
タスクのスケジュールに使用する専用クラスターの選択
デフォルトでは、専用クラスターを指定しない場合、DTS はデータ移行タスクを共有クラスターにスケジュールします。データ移行タスクの安定性を向上させるには、専用クラスターを購入します。詳細については、「DTS 専用クラスターとは」をご参照ください。
失敗した接続の再試行時間
接続失敗時の再試行時間の範囲。データ移行タスクの開始後にソースデータベースまたは宛先データベースに接続できない場合、DTS は再試行時間の範囲内で直ちに接続を再試行します。有効な値: 10 ~ 1,440。単位: 分。デフォルト値: 720。パラメータを 30 より大きい値に設定することをお勧めします。指定された再試行時間の範囲内で DTS がソースデータベースと宛先データベースに再接続された場合、DTS はデータ移行タスクを再開します。そうでない場合、データ移行タスクは失敗します。
説明同じソースデータベースまたは宛先データベースを共有する複数のデータ移行タスクに異なる再試行時間の範囲を指定した場合、後で指定した値が優先されます。
DTS が接続を再試行すると、DTS インスタンスの料金が発生します。ビジネス要件に基づいて再試行時間の範囲を指定することをお勧めします。ソースデータベースと宛先インスタンスが解放された後、できるだけ早く DTS インスタンスを解放することもできます。
移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。
その他の問題の再試行時間の範囲。たとえば、データ移行タスクの開始後に DDL または DML 操作の実行に失敗した場合、DTS は再試行時間の範囲内で直ちに操作を再試行します。有効な値: 1 ~ 1440。単位: 分。デフォルト値: 10。パラメータを 10 より大きい値に設定することをお勧めします。指定された再試行時間の範囲内で失敗した操作が正常に実行された場合、DTS はデータ移行タスクを再開します。そうでない場合、データ移行タスクは失敗します。
重要移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。 パラメータの値は、失敗した接続の再試行時間 パラメータの値よりも小さくなければなりません。
完全移行率を制限するかどうか
完全データ移行のスロットリングを有効にするかどうかを指定します。完全データ移行中は、DTS はソースデータベースと宛先データベースの読み取りリソースと書き込みリソースを使用します。これにより、データベースサーバーの負荷が増加する可能性があります。ビジネス要件に基づいて、完全データ移行のスロットリングを有効にすることができます。スロットリングを構成するには、1 秒あたりのソースデータベースのクエリ率 QPS、1 秒あたりの完全移行の行数 RPS、1 秒あたりの完全移行データ量 (MB) BPS パラメータを構成する必要があります。これにより、宛先データベースサーバーの負荷が軽減されます。
説明移行タイプ パラメータで 完全データ移行 を選択した場合にのみ、このパラメータを構成できます。
増分移行率を制限するかどうか
増分データ移行のスロットリングを有効にするかどうかを指定します。スロットリングを構成するには、1 秒あたりの増分移行の行数 RPS と 1 秒あたりの増分移行データ量 (MB) BPS パラメータを構成する必要があります。これにより、宛先データベースサーバーの負荷が軽減されます。
説明移行タイプ パラメータで 増分データ移行 を選択した場合にのみ、このパラメータを構成できます。
順方向および逆方向タスクのハートビートテーブル sql を削除
DTS インスタンスの実行中に、ハートビートテーブルの SQL 操作をソースデータベースに書き込むかどうかを指定します。有効な値:
[はい]: ハートビートテーブルの SQL 操作を書き込みません。この場合、DTS インスタンスのレイテンシが表示される場合があります。
[いいえ]: ハートビートテーブルの SQL 操作を書き込みます。この場合、ソースデータベースの物理バックアップやクローニングなどの機能が影響を受ける可能性があります。
環境タグ
DTS インスタンスを識別するために使用される環境タグ。ビジネス要件に基づいて環境タグを選択できます。この例では、環境タグは追加されていません。
ETL の設定
抽出、変換、書き出し (ETL) 機能を有効にするかどうかを指定します。詳細については、「ETL とは」をご参照ください。有効な値:
[はい]: ETL 機能を構成します。コードエディタにデータ処理文を入力できます。詳細については、「データ移行タスクまたはデータ同期タスクで ETL を構成する」をご参照ください。
[いいえ]: ETL 機能を構成しません。
[監視とアラート]
データ移行タスクのアラートを構成するかどうかを指定します。タスクが失敗した場合、または移行レイテンシが指定されたしきい値を超えた場合、アラート連絡先に通知が送信されます。有効な値:
[いいえ]: アラートを構成しません。
[はい]: アラートを構成します。この場合、アラートしきい値と アラート通知設定 も構成する必要があります。詳細については、「監視とアラートの構成」トピックの DTS タスクを作成するときに監視とアラートを構成する セクションをご参照ください。
タスク設定を保存し、事前チェックを実行します。
DTS タスクを構成するために関連する API 操作を呼び出すときに指定するパラメータを表示するには、次:タスク設定の保存と事前チェック にポインターを移動し、OpenAPI パラメーターのプレビュー をクリックします。
パラメータを表示する必要がない場合、またはすでに表示している場合は、ページの下部にある 次:タスク設定の保存と事前チェック をクリックします。
説明データ移行タスクを開始する前に、DTS は事前チェックを実行します。タスクが事前チェックに合格した後でのみ、データ移行タスクを開始できます。
タスクが事前チェックに合格しなかった場合は、失敗した各項目の横にある [詳細の表示] をクリックします。チェック結果に基づいて原因を分析した後、問題をトラブルシューティングします。その後、事前チェックを再度実行します。
事前チェック中に項目のアラートがトリガーされた場合:
アラート項目を無視できない場合は、失敗した項目の横にある [詳細の表示] をクリックして、問題をトラブルシューティングします。その後、事前チェックを再度実行します。
アラート項目を無視できる場合は、[アラート詳細の確認] をクリックします。[詳細の表示] ダイアログボックスで、[無視] をクリックします。表示されるメッセージで、[OK] をクリックします。次に、[再チェック] をクリックして、事前チェックを再度実行します。アラート項目を無視すると、データの不整合が発生し、ビジネスが潜在的なリスクにさらされる可能性があります。
インスタンスを購入します。
[成功率] が [100%] になるまで待ちます。次に、[次へ: インスタンスの購入] をクリックします。
[インスタンスの購入] ページで、データ移行インスタンスの [インスタンスクラス] パラメータを構成します。次の表にパラメータを示します。
セクション
パラメータ
説明
新しいインスタンスクラス
[リソースグループ]
データ移行インスタンスが属するリソースグループ。デフォルト値: [デフォルトのリソースグループ]。詳細については、「リソース管理とは」をご参照ください。
インスタンスクラス
DTS は、移行速度が異なるインスタンスクラスを提供します。ビジネスシナリオに基づいてインスタンスクラスを選択できます。詳細については、「データ移行インスタンスのインスタンスクラス」をご参照ください。
チェックボックスをオンにして、[データ伝送サービス (従量課金制) サービス規約] を読んで同意します。
[購入して開始] をクリックします。表示されるメッセージで、[OK]
[データ移行] ページでタスクの進捗状況を確認できます。
説明データ移行タスクを増分データの移行に使用できない場合、タスクは自動的に停止します。[ステータス] セクションに [完了] と表示されます。
データ移行タスクを増分データの移行に使用できる場合、タスクは自動的に停止しません。増分データ移行タスクは停止または完了しません。[ステータス] セクションに [実行中] と表示されます。
オブジェクト名マッピング機能を使用する
選択中のオブジェクト セクションで、トピック名にポインターを移動します。
編集 を右クリックします。
表示されるダイアログボックスで、次の表に示すパラメータを構成します。
パラメータ
説明
テーブル名
ソーステーブルのデータの移行先のトピックの名前。デフォルトでは、このパラメータは [ソースデータベースと宛先データベースの構成] 手順の [宛先データベース] セクションの トピック の値に設定されます。
重要宛先データベースが ApsaraMQ for Kafka インスタンスの場合、トピックは宛先 ApsaraMQ for Kafka インスタンスに存在する必要があります。そうでない場合、データ移行は失敗します。自己管理 Kafka クラスタにデータを移行し、スキーマ移行タスクが移行インスタンスに含まれている場合、DTS は宛先データベースで指定したトピックの作成を試みます。
ソーステーブルの [テーブル名] パラメータの値を宛先データベースのトピックの名前に変更すると、テーブルのデータは指定されたトピックに書き込まれます。
フィルタリング条件
詳細については、「フィルタ条件を指定する」をご参照ください。
パーティション数
データの移行先のトピックのパーティション数。
パーティションキー
Kafka パーティションへのデータ転送ポリシー パラメータを 主キーのハッシュ値に基づいて、データを個別のパーティションに転送 に設定した場合は、このパラメータを構成して、ハッシュ値を計算するためのパーティションキーとして 1 つ以上の列を指定します。DTS は、計算されたハッシュ値に基づいて、宛先トピックの各パーティションに異なる行を配信します。
説明列の パーティションキー を選択するには、まず すべてのテーブルを同期 をオフにする必要があります。
[OK] をクリックします。