このトピックでは、Data Transmission Service (DTS) を使用して、PolarDB for MySQL クラスターから MaxCompute プロジェクトにデータを移行する方法について説明します。
前提条件
MaxCompute が有効化され、MaxCompute プロジェクトが作成されていること。 詳細については、「MaxCompute と DataWorks の有効化」および「MaxCompute プロジェクトの作成」をご参照ください。
DTS から MaxCompute へのアクセスを許可するために、MaxCompute プロジェクトに IP アドレスホワイトリストが設定されていること。 詳細については、「Alibaba Cloud サービスから MaxCompute へのアクセスを許可するための IP アドレスホワイトリストの設定」をご参照ください。
移行先の MaxCompute プロジェクトを所有する Alibaba Cloud アカウントの AccessKey ペアが作成されていること。 詳細については、「AccessKey ペアの作成」をご参照ください。
注意事項
DTS はソースデータベースの外部キーをターゲットデータベースに移行しません。 そのため、ソースデータベースのカスケード操作と削除操作はターゲットデータベースに移行されません。
制限タイプ | 説明 |
ソースデータベースの制限 |
|
その他の制限 |
|
課金
移行タイプ | タスク構成料金 | インターネットトラフィック料金 |
スキーマ移行と完全なデータ移行 | 無料 | この例では料金は発生しません。 説明 ターゲットデータベースの [アクセス方法] パラメーターが [パブリック IP アドレス] に設定されている場合、インターネットトラフィック料金が課金されます。 詳細については、「課金の概要」をご参照ください。 |
増分データ移行 | 課金されます。 詳細については、「課金の概要」をご参照ください。 |
移行タイプ
スキーマ移行
DTS は、必要なオブジェクトのスキーマをソースデータベースから MaxCompute に移行します。 スキーマ同期中、DTS はソーステーブル名の末尾に _base サフィックスを追加します。 たとえば、ソーステーブルの名前が customer の場合、MaxCompute のテーブル名は customer_base になります。
完全なデータ移行
DTS は、テーブルの既存データをソースデータベースから MaxCompute のターゲットテーブルに移行します。 たとえば、ソースデータベースの customer テーブルは、MaxCompute の customer_base テーブルに移行されます。 このデータは、後続の増分同期の基礎となります。
説明_base サフィックスが付いたターゲットテーブルは、完全なベースラインテーブルとして知られています。
増分データ移行
DTS は MaxCompute に増分データテーブルを作成します。 増分データテーブルの名前は、ターゲットテーブルの名前に _log サフィックスを付けたもの (customer_log など) です。 その後、DTS はソースデータベースからこのテーブルに増分データをリアルタイムで移行します。
説明増分データテーブルの構造の詳細については、「増分データテーブルの構造」をご参照ください。
増分移行可能な SQL 操作
操作タイプ | SQL 文 |
DML | INSERT、UPDATE、および DELETE |
DDL | ADD COLUMN 説明 属性列を含む ADD COLUMN 操作は移行できません。 |
データベースアカウントに必要な権限
データベースタイプ | 必要な権限 | 作成および承認方法 |
PolarDB for MySQL | 移行するオブジェクトに対する読み取り権限。 |
操作手順
次のいずれかの方法でデータ移行ページに移動し、データ移行インスタンスが存在するリージョンを選択します。
DTS コンソール
DTS コンソールにログインします。
左側のナビゲーションウィンドウで、データの移行 をクリックします。
ページの左上隅で、データ移行インスタンスが存在するリージョンを選択します。
DMS コンソール
説明実際の操作は、DMS コンソールのモードとレイアウトによって異なる場合があります。 詳細については、「シンプルモード」および「DMS コンソールのレイアウトとスタイルのカスタマイズ」をご参照ください。
DMS コンソールにログインします。
上部のナビゲーションバーで、ポインターを に移動します。
[データ移行タスク] の右側にあるドロップダウンリストから、データ同期インスタンスが存在するリージョンを選択します。
タスクの作成 をクリックして、タスク構成ページに移動します。
ソースデータベースとターゲットデータベースを構成します。 次の表にパラメーターを示します。
セクション
パラメーター
説明
N/A
タスク名
DTS タスクの名前。 DTS は自動的にタスク名を生成します。 タスクを簡単に識別できるわかりやすい名前を指定することを推奨します。 一意のタスク名を指定する必要はありません。
移行元データベース
既存の接続情報の選択
DTS に登録されているデータベースインスタンスを使用する場合、ドロップダウンリストからインスタンスを選択します。 DTS は、インスタンスの次のデータベースパラメーターを自動的に入力します。 詳細については、「データベース接続の管理」をご参照ください。
説明DMS コンソールでは、[DMS データベースインスタンスを選択] ドロップダウンリストからデータベースインスタンスを選択できます。
DTS にインスタンスを登録できない場合、または DTS に登録されているインスタンスを使用する必要がない場合は、次のデータベース情報を構成する必要があります。
データベースタイプ
PolarDB for MySQL を選択します。
アクセス方法
Alibaba Cloud インスタンス を選択します。
インスタンスのリージョン
ソースの PolarDB for MySQL クラスターが存在するリージョン。
Alibaba Cloud アカウント間でデータを複製
この例では、データは同じ Alibaba Cloud アカウント内で移行されます。 × を選択します。
PolarDB クラスター ID
ソースの PolarDB for MySQL クラスターの ID。
データベースアカウント
ソースの PolarDB for MySQL クラスターのデータベースアカウント。 データベースアカウントに必要な権限の詳細については、「データベースアカウントに必要な権限」をご参照ください。
データベースのパスワード
データベースへのアクセスに使用されるパスワード。
暗号化
ソースデータベースへの接続を暗号化するかどうかを指定します。 このパラメーターは、ビジネス要件に基づいて構成できます。 SSL 暗号化機能の詳細については、「SSL 暗号化の設定」をご参照ください。
移行先データベース
既存の接続情報の選択
DTS に登録されているデータベースインスタンスを使用する場合、ドロップダウンリストからインスタンスを選択します。 DTS は、インスタンスの次のデータベースパラメーターを自動的に入力します。 詳細については、「データベース接続の管理」をご参照ください。
説明DMS コンソールでは、[DMS データベースインスタンスを選択] ドロップダウンリストからデータベースインスタンスを選択できます。
DTS にインスタンスを登録できない場合、または DTS に登録されているインスタンスを使用する必要がない場合は、次のデータベース情報を構成する必要があります。
データベースタイプ
MaxCompute を選択します。
アクセス方法
Alibaba Cloud インスタンス を選択します。
インスタンスのリージョン
ターゲットの MaxCompute プロジェクトが存在するリージョン。
プロジェクト
ターゲットの MaxCompute プロジェクトの名前。
Alibaba Cloud アカウントの AccessKey ID
「前提条件」セクションで準備した AccessKey ペアを入力します。
Alibaba Cloud アカウントの AccessKey Secret
ページの下部で、[接続テストと次へ] をクリックします。
説明DTS サーバーからのアクセスを許可するために、DTS サーバーの CIDR ブロックがソースデータベースとターゲットデータベースのセキュリティ設定に自動または手動で追加できることを確認してください。 詳細については、「DTS サーバーの IP アドレスをホワイトリストに追加」をご参照ください。
[OK] をクリックして、DTS によって作成された組み込みアカウントに MaxCompute プロジェクトの権限を付与します。 次に、接続をテストして続行 をクリックします。
移行するオブジェクトを構成します。
オブジェクト設定 ページで、移行するオブジェクトを構成します。
パラメーター
説明
移行タイプ
完全なデータ移行のみを実行するには、[スキーマ移行] と [完全なデータ移行] を選択します。
データ移行中のサービス継続性を確保するには、[スキーマ移行]、[完全なデータ移行]、および [増分データ移行] を選択します。
説明[スキーマ移行] を選択しない場合は、データを受信するためにターゲットデータベースにデータベースとテーブルが作成されていること、および [選択したオブジェクト] でオブジェクト名マッピング機能が有効になっていることを確認してください。
[増分データ移行] を選択しない場合は、データ移行中にソースデータベースにデータを書き込まないことを推奨します。 これにより、ソースデータベースとターゲットデータベース間のデータ整合性が確保されます。
追加列の命名規則
DTS が MaxCompute にデータを移行した後、DTS はターゲットテーブルに追加の列を追加します。 追加の列がターゲットテーブルの既存の列と同じ名前を持つ場合、データ移行タスクは失敗します。 ビジネス要件に基づいて 新規ルール または 前のルール を選択する必要があります。
警告このパラメーターを指定する前に、ターゲットテーブルの追加列と既存の列に名前の競合がないか確認してください。 そうしないと、タスクが失敗したり、データが失われたりする可能性があります。 追加列の命名規則の詳細については、「追加列の命名規則」をご参照ください。
増分データテーブルのパーティション定義
ビジネス要件に基づいてパーティション名を選択します。 パーティションの詳細については、「パーティション」をご参照ください。
競合するテーブルの処理モード
エラーの事前チェックと報告:ターゲットデータベースにソースデータベースのテーブルと同じ名前のテーブルが含まれているかどうかをチェックします。 ソースデータベースとターゲットデータベースに同じテーブル名を持つテーブルが含まれていない場合、事前チェックは合格します。 そうでない場合、事前チェック中にエラーが返され、データ移行タスクを開始できません。
説明ソースデータベースとターゲットデータベースに同じ名前のテーブルが含まれており、ターゲットデータベースのテーブルを削除または名前変更できない場合は、オブジェクト名マッピング機能を使用して、ターゲットデータベースに移行されるテーブルの名前を変更できます。 詳細については、「オブジェクト名のマッピング」をご参照ください。
エラーを無視して続行:ソースデータベースとターゲットデータベースの同じテーブル名の事前チェックをスキップします。
警告エラーを無視して続行 を選択すると、データ不整合が発生し、ビジネスが次の潜在的なリスクにさらされる可能性があります:
ソースデータベースとターゲットデータベースのスキーマが同じで、データレコードがターゲットデータベースの既存のデータレコードと同じプライマリキーを持つ場合、次のシナリオが発生する可能性があります:
完全なデータ移行中、DTS はデータレコードをターゲットデータベースに移行しません。 ターゲットデータベースの既存のデータレコードは保持されます。
増分データ移行中、DTS はデータレコードをターゲットデータベースに移行します。 ターゲットデータベースの既存のデータレコードは上書きされます。
ソースデータベースとターゲットデータベースのスキーマが異なる場合、特定の列のみが移行されるか、データ移行タスクが失敗します。 慎重に進めてください。
移行先インスタンスでのオブジェクト名の大文字化
ターゲットインスタンスのデータベース名、テーブル名、および列名の大文字/小文字。 デフォルトでは、[DTS のデフォルトポリシー] が選択されています。 他のオプションを選択して、オブジェクト名の大文字/小文字がソースまたはターゲットデータベースのものと一致するようにすることができます。 詳細については、「ターゲットインスタンスのオブジェクト名の大文字/小文字を指定」をご参照ください。
ソースオブジェクト
ソースオブジェクト セクションから 1 つ以上のオブジェクトを選択します。
アイコンをクリックして、オブジェクトを 選択中のオブジェクト セクションに追加します。説明移行するオブジェクトとしてテーブルを選択できます。
選択中のオブジェクト
ターゲットインスタンスに移行するオブジェクトの名前を変更するには、[選択したオブジェクト] セクションでオブジェクトを右クリックします。 詳細については、「単一オブジェクトの名前のマッピング」をご参照ください。
一度に複数のオブジェクトの名前を変更するには、[選択したオブジェクト] セクションの右上隅にある [一括編集] をクリックします。 詳細については、「一度に複数のオブジェクト名をマッピング」をご参照ください。
説明ターゲットインスタンスで使用するテーブル名を変更するには、選択中のオブジェクト セクションでテーブルを右クリックします。 詳細については、「オブジェクト名のマッピング」をご参照ください。
移行するテーブルのデータをフィルターするには、選択中のオブジェクト セクションでテーブルを右クリックします。 表示されるダイアログボックスで、フィルター条件を構成します。 詳細については、「フィルター条件の設定」をご参照ください。
オブジェクト名マッピング機能を使用してオブジェクトの名前を変更すると、このオブジェクトに依存する他のオブジェクトの移行が失敗する可能性があります。
詳細設定へ をクリックして、詳細設定を構成します。
パラメーター
説明
タスクのスケジュールに使用する専用クラスターの選択
デフォルトでは、専用クラスターを指定しない場合、DTS はデータ移行タスクを共有クラスターにスケジュールします。 データ移行タスクの安定性を向上させたい場合は、専用クラスターを購入してください。 詳細については、「DTS 専用クラスターとは」をご参照ください。
失敗した接続の再試行時間
接続失敗のリトライ時間範囲。 データ移行タスク開始後にソースまたはターゲットデータベースへの接続に失敗した場合、DTS はリトライ時間範囲内で直ちに接続をリトライします。 有効な値:10 から 1,440。 単位:分。 デフォルト値:720。 パラメーターを 30 より大きい値に設定することを推奨します。 指定されたリトライ時間範囲内に DTS がソースおよびターゲットデータベースに再接続された場合、DTS はデータ移行タスクを再開します。 そうでない場合、データ移行タスクは失敗します。
説明同じソースまたはターゲットデータベースを共有する複数のデータ移行タスクに異なるリトライ時間範囲を指定した場合、後から指定された値が優先されます。
DTS が接続をリトライする際、DTS インスタンスに対して課金されます。 ビジネス要件に基づいてリトライ時間範囲を指定することを推奨します。 また、ソースデータベースとターゲットインスタンスがリリースされた後、できるだけ早く DTS インスタンスをリリースすることもできます。
移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。
その他の問題のリトライ時間範囲。 たとえば、データ移行タスク開始後に DDL または DML 操作が失敗した場合、DTS はリトライ時間範囲内で直ちに操作をリトライします。 有効な値:1 から 1440。 単位:分。 デフォルト値:10。 パラメーターを 10 より大きい値に設定することを推奨します。 指定されたリトライ時間範囲内に失敗した操作が正常に実行された場合、DTS はデータ移行タスクを再開します。 そうでない場合、データ移行タスクは失敗します。
重要移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。 パラメーターの値は、失敗した接続の再試行時間 パラメーターの値より小さくする必要があります。
完全移行率を制限するかどうか
完全なデータ移行のスロットリングを有効にするかどうかを指定します。 完全なデータ移行中、DTS はソースおよびターゲットデータベースの読み取りおよび書き込みリソースを使用します。 これにより、データベースサーバーの負荷が増加する可能性があります。 ビジネス要件に基づいて、完全なデータ移行のスロットリングを有効にすることができます。 スロットリングを構成するには、1 秒あたりのソースデータベースのクエリ率 QPS、1 秒あたりの完全移行の行数 RPS、および 1 秒あたりの完全移行データ量 (MB) BPS パラメーターを構成する必要があります。 これにより、ターゲットデータベースサーバーの負荷が軽減されます。
説明このパラメーターは、移行タイプ パラメーターで 完全データ移行 を選択した場合にのみ構成できます。
増分移行率を制限するかどうか
増分データ移行のスロットリングを有効にするかどうかを指定します。 スロットリングを構成するには、1 秒あたりの増分移行の行数 RPS と 1 秒あたりの増分移行データ量 (MB) BPS パラメーターを構成する必要があります。 これにより、ターゲットデータベースサーバーの負荷が軽減されます。
説明このパラメーターは、移行タイプ パラメーターで 増分データ移行 を選択した場合にのみ構成できます。
順方向および逆方向タスクのハートビートテーブル SQL を削除
DTS インスタンスの実行中に、ハートビートテーブルに対する SQL 操作をソースデータベースに書き込むかどうかを指定します。 有効な値:
[はい]:ハートビートテーブルに対する SQL 操作を書き込みません。 この場合、DTS インスタンスの遅延が表示されることがあります。
[いいえ]:ハートビートテーブルに対する SQL 操作を書き込みます。 この場合、ソースデータベースの物理バックアップやクローニングなどの機能が影響を受ける可能性があります。
環境タグ
DTS インスタンスを識別するために使用される環境タグ。 ビジネス要件に基づいて環境タグを選択できます。 この例では、このパラメーターを構成する必要はありません。
ETL の設定
抽出・変換・書き出し (ETL) 機能を有効にするかどうかを指定します。 詳細については、「ETL とは」をご参照ください。 有効な値:
[はい]:ETL 機能を構成します。 コードエディタでデータ処理文を入力できます。 詳細については、「データ移行またはデータ同期タスクでの ETL の構成」をご参照ください。
[いいえ]:ETL 機能を構成しません。
監視アラート
データ移行タスクのアラートを構成するかどうかを指定します。 タスクが失敗した場合、または移行遅延が指定されたしきい値を超えた場合、アラート連絡先は通知を受け取ります。 有効な値:
[いいえ]:アラートを構成しません。
[はい]:アラートを構成します。 この場合、アラートのしきい値とアラート通知設定も構成する必要があります。 詳細については、「DTS タスク作成時の監視とアラートの設定」トピックの「DTS タスク作成時の監視とアラートの設定」セクションをご参照ください。
タスク設定を保存し、事前チェックを実行します。
関連する API 操作を呼び出して DTS タスクを構成する際に指定するパラメーターを表示するには、ポインターを 次:タスク設定の保存と事前チェック に移動し、OpenAPI パラメーターのプレビュー をクリックします。
パラメーターを表示する必要がない場合、または表示済みの場合は、ページの下部にある 次:タスク設定の保存と事前チェック をクリックします。
説明データ移行タスクを開始する前に、DTS は事前チェックを実行します。 データ移行タスクは、タスクが事前チェックに合格した後にのみ開始できます。
タスクが事前チェックに合格しなかった場合は、各失敗項目の横にある [詳細の表示] をクリックします。 チェック結果に基づいて原因を分析した後、問題をトラブルシューティングします。 その後、再度事前チェックを実行します。
事前チェック中に項目のアラートがトリガーされた場合:
アラート項目を無視できない場合は、失敗した項目の横にある [詳細の表示] をクリックして問題をトラブルシューティングします。 その後、再度事前チェックを実行します。
アラート項目を無視できる場合は、[アラート詳細の確認] をクリックします。 [詳細の表示] ダイアログボックスで、[無視] をクリックします。 表示されるメッセージで、[OK] をクリックします。 次に、[再度事前チェック] をクリックして、再度事前チェックを実行します。 アラート項目を無視すると、データ不整合が発生し、ビジネスが潜在的なリスクにさらされる可能性があります。
インスタンスを購入します。
[成功率] が [100%] になるまで待ちます。 次に、[次へ:インスタンスの購入] をクリックします。
[インスタンスの購入] ページで、データ移行インスタンスの [インスタンスクラス] パラメーターを構成します。 次の表にパラメーターを示します。
セクション
パラメーター
説明
新しいインスタンスクラス
リソースグループ
データ移行インスタンスが属するリソースグループ。 デフォルト値:[デフォルトのリソースグループ]。 詳細については、「Resource Management とは」をご参照ください。
インスタンスクラス
DTS は、移行速度が異なるインスタンスクラスを提供します。 ビジネスシナリオに基づいてインスタンスクラスを選択できます。 詳細については、「データ移行インスタンスのインスタンスクラス」をご参照ください。
チェックボックスを選択して、[Data Transmission Service (従量課金) サービス規約] を読み、同意します。
[購入して開始] をクリックします。 表示されるメッセージで、[OK] をクリックします。
[データ移行] ページでタスクの進行状況を表示できます。
説明データ移行タスクが増分データを移行するために使用できない場合、タスクは自動的に停止します。 [ステータス] セクションに [完了] が表示されます。
データ移行タスクが増分データを移行するために使用できる場合、タスクは自動的に停止しません。 増分データ移行タスクは決して停止または完了しません。 [ステータス] セクションに [実行中] が表示されます。
増分データテーブルの構造
MaxCompute で set odps.sql.allow.fullscan=true; コマンドを実行して、MaxCompute プロジェクトの全表スキャンを許可する必要があります。
DTS は、ソースの MySQL データベースで生成された増分データを MaxCompute の増分データテーブルに移行します。 増分データテーブルには、増分データと特定のメタデータが格納されます。 次の表に、増分データテーブルのスキーマを示します。
フィールド | 説明 |
record_id | 増分ログのレコード ID。ログの一意の識別子です。 説明
|
operation_flag | 操作タイプ。 有効な値:
|
utc_timestamp | UTC での操作タイムスタンプ。 バイナリログファイルのタイムスタンプでもあります。 |
before_flag | 列の値が更新前の値であるかどうかを示します。 有効な値:Y と N。 |
after_flag | 列の値が更新後の値であるかどうかを示します。 有効な値:Y と N。 |