すべてのプロダクト
Search
ドキュメントセンター

DataWorks:MySQLデータベースからHologresにデータをリアルタイムで同期する

最終更新日:Jan 14, 2025

このトピックでは、サーバーレス同期タスクを構成して、MySQLデータベースからHologresにデータをリアルタイムで同期する方法について説明します。

前提条件

MySQLデータソースとHologresデータソースがDataWorksワークスペースに追加されています。詳細については、「データソースの追加と管理」をご参照ください。

手順

ステップ 1:サーバーレス同期タスクを作成する

  1. データ統合ページに移動します。

    DataWorksコンソールにログオンします。上部のナビゲーションバーで、目的のリージョンを選択します。左側のナビゲーションペインで、[データ開発とガバナンス] > [データ統合] を選択します。表示されるページで、ドロップダウンリストから目的のワークスペースを選択し、[データ統合に移動] をクリックします。

  2. データ統合ページの左側のナビゲーションペインで、[サーバーレス同期タスク] をクリックします。

    image

  3. [サーバーレス同期タスク] ページの上部で、ソースタイプとデスティネーションタイプを選択し、[サーバーレス同期タスクの作成] をクリックします。この例では、ソースタイプとしてMySQL、デスティネーションタイプとしてHologresが選択されています。

ステップ 2:サーバーレス同期タスクの基本情報を構成する

説明
  • 既存のデータソースを使用する場合は、[データソースの設定] セクションで [既存のデータソースを使用] をクリックします。次に、[データソース] ドロップダウンリストから目的のデータソースを選択できます。

  • 既存のデータソースを使用しない場合は、[データソースの設定] セクションで目的のデータソースに関する情報を直接設定できます。この場合、事前にデータ統合または管理センターにデータソースを追加する必要はありません。

  • ソースとデスティネーションに関する情報を設定した後、[テスト] をクリックできます。 ApsaraDB RDS for MySQLインスタンスとHologresインスタンスの場合、インスタンスにIPアドレスホワイトリストが設定されていない場合、ネットワーク接続テストは自動的に合格します。インスタンスにIPアドレスホワイトリストが設定されている場合は、必要なIPアドレスをIPアドレスホワイトリストに追加して、DataWorksがインスタンスにアクセスできるようにする必要があります。 IPアドレスの詳細については、「ネットワーク接続の設定」をご参照ください。

image

ステップ 3:サーバーレス同期タスクのソーステーブルとマッピングルールを設定する

データの同期元となるソースデータベースとソーステーブルを選択する

接続テストに合格すると、選択したソースのデータベースとテーブルが現在のワークスペースに自動的にプルされます。 DataWorksでは、この例で作成したサーバーレス同期タスクのソーステーブルを選択するために、[指定されたデータベースとテーブルを選択][正規表現を使用] のいずれかの方法を使用できます。

[ソーステーブル] リストからテーブルを選択した後、image アイコンをクリックして、選択したテーブルを [選択済みテーブル] リストに移動します。

image

ソーステーブルとデスティネーションテーブル間のマッピングを設定する

目的のソーステーブルが表示されている行を見つけ、[アクション] 列の [更新] をクリックします。次に、デスティネーションテーブル名のマッピングルール、デスティネーションスキーマ名のマッピングルール、ソースフィールドタイプとデスティネーションフィールドタイプ間のマッピングなどの設定を行います。

image

アラートルールと詳細パラメーターを設定する

[サーバーレス同期タスクの作成] ページの右上隅にある [アラートルールを設定][詳細パラメーターを設定]、または [DDL機能を設定] をクリックし、指示に従って関連パラメーターを設定します。

ステップ 4:設定を完了する

上記の設定が完了したら、[完了] をクリックします。

説明

[完了] を初めてクリックすると、システムはサーバーレス同期タスクの設定を自動的にチェックします。設定チェックは事前チェックのみであり、タスク設定の完了を妨げるものではありません。

image

サーバーレス同期タスクを開始する

重要
  • サーバーレス同期タスクを開始すると、システムはタスクに対して別の設定チェックを自動的に実行します。サーバーレス同期タスクは、設定チェックに合格した場合にのみ正常に開始できます。

  • 設定チェックのチェック項目は、サーバーレス同期タスクの同期タイプによって異なります。

  • サーバーレス同期タスクを初めて開始すると、システムは必要な権限を持っているかどうかを確認します。権限は、従量課金制サーバーレスリソースグループの購入に必要な権限と同じです。アカウントに AliyunBSSOrderAccess ポリシーと AliyunDataWorksFullAccess ポリシーがアタッチされている場合にのみ、権限を取得できます。

[サーバーレス同期タスク] ページの [タスク] セクションで、作成したサーバーレス同期タスクを見つけ、[アクション] 列の [開始] をクリックします。

image

  • サーバーレス同期タスクを開始すると、タスクは環境準備ステージに入ります。このステージでは、システムはサーバーレス同期タスクを実行するために必要なリソースをバックエンドで準備します。環境準備ステージは数分で完了する予定です。

    image

  • サーバーレス同期タスクが開始されると、タスクは実行状態になります。

    image

サーバーレス同期タスクの実行の詳細を表示する

[サーバーレス同期タスク] ページの [タスク] セクションで、サーバーレス同期タスクを見つけ、[名前/ID] 列のタスク名または [実行の概要] 列のステージ名をクリックして、タスク詳細ページに移動します。タスク詳細ページでは、次の情報を表示できます。

image

  • 基本情報:サーバーレス同期タスクのデータソース情報、注文 ID、同期タイプが含まれます。

  • 実行ステータス:各ステージの実行ステータスが含まれます。サーバーレス同期タスクの操作ログ、フェイルオーバーレコード、リソース使用率も表示できます。

  • 詳細:スキーマ移行、フル同期、リアルタイム同期の詳細が含まれます。

サーバーレス同期タスクを変更する

  1. [サーバーレス同期タスク] ページの [タスク] セクションで、サーバーレス同期タスクを見つけ、[アクション] 列の [その他] をクリックし、[編集] を選択して、サーバーレス同期タスクの設定ページに移動します。

    image

  2. サーバーレス同期タスクにソーステーブルを追加または削除するか、サーバーレス同期タスクの他の設定を変更します。次に、[完了] をクリックします。

  3. [アクション] 列に表示される [更新の適用] をクリックします。

    image

    • [更新の適用] をクリックすると、システムはサーバーレス同期タスクの設定を自動的にチェックします。サーバーレス同期タスクがチェックに失敗した場合、変更は有効になりません。

    • [更新の適用] をクリックした後にチェックされる項目数は、サーバーレス同期タスクを初めて開始したときにチェックされる項目数よりも少なくなります。これは、最初の起動ではリソースの準備が必要ですが、サーバーレス同期タスクに更新を適用するとリソースの初期化が完了しているためです。