DataWorks コンソールで Data Lake Analytics ノードを作成して、オンラインの ETL プロセスを構築できます。

  • Data Lake Analytics ノードは、Alibaba Cloud の Data Lake Analytics に接続するために使用されます。 詳細については、「https://www.alibabacloud.com/help/doc-detail/70378.htm」をご参照ください。
  • 専用のリソースグループで Data Lake Analytics ノードを実行することを推奨します。 デフォルトのリソースグループで Data Lake Analytics ノードを実行すると、ネットワーク接続エラーが発生します。
  • 現在、Data Lake Analytics ノードに対しては運用環境での接続のみ選択できます。
  1. DataWorks コンソールにログインします。 左側のナビゲーションウィンドウで [ワークスペース] をクリックします。 [ワークスペース] ページでノードを作成するワークスペースを確認し、[操作] 列の [データ分析] をクリックします。
  2. Data Lake Analytics ノードの作成 アイコンにポインターを移動し、[カスタム] > [Data Lake Analytics] の順にクリックします。

    [ワークフロー] をクリックし、[ユーザー定義] を右クリックして、[作成] > [Data Lake Analytics] の順にクリックすることもできます。

  3. [ノードの作成] ダイアログボックスで、[ノード名] および [ロケーション] を設定し、[コミット] をクリックします。
    ノード名は 1 文字から 128 文字にする必要があります。
  4. Data Lake Analytics ノードを編集します。
    ノード編集ページで接続を選択し、SQL コードを編集できます。
    1. 接続を選択します。

      ターゲットとなるノードの接続を選択します。 ドロップダウンリストで必要な接続が見つからない場合は、[接続の追加] をクリックして、データソースページで接続を作成すします。

    2. SQL 文を編集します。

      接続を選択したら、Data Lake Analytics でサポートされている構文に基づいて SQL 文を記述できます。 SQL コードエディターでデータ操作言語 (DML) およびデータ定義言語 (DDL) の文を記述できます。

    3. SQL 文を保存します。

      SQL 文の編集が終了したら、[保存] アイコンをクリックしてノードの設定をサーバーに保存します。

    4. SQL 文を実行します。

      [実行] アイコンをクリックして、保存した SQL 文を実行します。

  5. ノードのスケジュールを設定します。

    右側の [プロパティ] をクリックし、[スケジュール] セクションで関連パラメーターを設定します。 詳細については、「Properties」をご参照ください。

  6. ノードをコミットします。

    スケジュール設定が完了したら、[保存] アイコンをクリックし、コードエディターの上部ツールバーにある [送信] または [コミットしてロックを解除] アイコンをクリックします。 Data Lake Analytics ノードは、開発環境にコミットされています。

  7. ノードをデプロイします。

    詳細については、「ノードのデプロイ (Deploy a node)」をご参照ください。

  8. 本番環境でノードをテストします。