DataWorks で EMR Serverless StarRocks タスクを実行するには、EMR Serverless StarRocks インスタンスをコンピューティングリソースとして関連付けます。関連付けられると、そのリソースはデータ開発タスクに利用可能になります。
事前準備
開始する前に、以下を確認してください。
ワークスペースの要件:
DataWorks ワークスペースが作成済みであり、DataStudio の新しいバージョンを使用していることを確認します。DataStudio の新しいバージョンを使用していないワークスペースの場合は、代わりに StarRocks データソースを作成します。
Resource Access Management (RAM) ユーザーがワークスペースに追加され、ワークスペース管理者ロールが割り当てられていることを確認します。
インスタンスの要件:
DataWorks ワークスペースと同じリージョンに EMR Serverless StarRocks インスタンスが存在することを確認します。クロスリージョン関連付けはサポートされていません。
ネットワーク要件:
リソースグループがワークスペースに関連付けられ、ネットワーク接続が検証済みであることを確認します。
サーバーレスリソースグループ: コンピューティングリソースインスタンスは、サーバーレスリソースグループに接続する必要があります。
以前のバージョンの専用リソースグループ: コンピューティングリソースインスタンスは、スケジューリング用の専用リソースグループに接続する必要があります。詳細については、「以前のバージョンの専用リソースグループの使用」をご参照ください。
リソースグループの内部ネットワーク CIDR ブロックが、EMR Serverless StarRocks インスタンスの内部ネットワークホワイトリストに追加されていることを確認します。CIDR ブロックを見つけるには、「リソースグループの内部ネットワーク CIDR ブロックの取得」をご参照ください。
使用制限
サポートされているリージョン: 中国 (杭州)、中国 (上海)、中国 (北京)、中国 (深セン)、中国 (香港)、日本 (東京)、シンガポール、インドネシア (ジャカルタ)、ドイツ (フランクフルト)、米国 (シリコンバレー)、米国 (バージニア)。
必要な権限:
| オペレーター | 必要な権限 |
|---|---|
| Alibaba Cloud アカウント | 追加の権限は不要です。 |
| RAM ユーザーまたは RAM ロール | コンピューティングリソースを作成するには、O&M または ワークスペース管理者 ロール、あるいは AliyunDataWorksFullAccess 権限が必要です。詳細については、「ユーザーへのワークスペース管理者ロールの付与」をご参照ください。 |
サーバーレス StarRocks コンピューティングリソースの関連付け
コンピューティングリソースページへの移動
「DataWorks コンソール」にログインします。対象リージョンに切り替え、左側のナビゲーションウィンドウで [その他] > [管理センター] を選択します。ドロップダウンリストからワークスペースを選択し、[管理センターへ移動] をクリックします。
左側のナビゲーションウィンドウで、[コンピューティングリソース] をクリックします。
コンピューティングリソースの構成
[コンピューティングリソースの関連付け] をクリックします。
[コンピューティングリソースの関連付け] ページで、コンピューティングリソースタイプを [サーバーレス StarRocks]に設定します。[サーバーレス StarRocks コンピューティングリソースの関連付け] 構成ページが開きます。
選択した構成モードのパラメーターを構成します。
Alibaba Cloud インスタンスモード
パラメーター 説明 インスタンス 関連付ける EMR Serverless StarRocks インスタンスを選択します。または、ドロップダウンリストの [作成] をクリックして EMR Serverless StarRocks インスタンスを作成 することもできます。ワークスペースの作成 時に本番環境と開発環境を分離した場合は、両方の環境に対応する StarRocks インスタンスを選択する必要があります。 データベース名 EMR Serverless StarRocks インスタンス内のデータベースを選択します。データベースが存在しない場合は、インスタンス内で直接作成してください。 認証方式 Enterprise Edition でのみ利用可能です。他のエディションでは [アカウントとパスワード] 方式のみサポートされます。[所有者] に設定した場合、DataWorks Enterprise Edition のテナント管理者は、Security Center で Manage Ranger and Identity Credentials を追加し、RAM ユーザーとエンジンアカウント間のマッピングを設定する必要があります。 ユーザー名 EMR Serverless StarRocks インスタンスの作成時に設定したユーザー名です。デフォルトのユーザー名は adminです。パスワード EMR Serverless StarRocks インスタンスの作成時に設定したパスワードです。パスワードを忘れた場合は、インスタンス詳細ページに移動し、[パスワードのリセット] をクリックしてリセットしてください。 接続文字列モード
パラメーター 説明 [ホスト / IP アドレス] StarRocks フロントエンド (FE) の IP アドレス。 ポート StarRocks FE のクエリポート。デフォルトは 9030です。StarRocks の構成に基づいて調整します。URL のロード StreamLoad 用の StarRocks FE アドレス。 FE_IP:FE_HTTPの形式です。複数のアドレスをコンマで区切ります。FE_IPは内部ネットワークアドレスである必要があります。インターネットアドレスはサポートされていません。FE_HTTPは通常8030または18030です。データベース名 EMR Serverless StarRocks インスタンスでデータベースを選択します。データベースが存在しない場合は、インスタンスの SQL エディターで作成します。 ユーザー名 EMR Serverless StarRocks インスタンスの作成時に設定されたユーザー名です。デフォルトのユーザー名は adminです。パスワード EMR Serverless StarRocks インスタンスを作成した際に設定したパスワードです。パスワードを忘れてしまった場合は、インスタンスの詳細ページに移動し、[パスワードのリセット] をクリックします。 高度なパラメーター 省略可能です。[プロパティの追加] をクリックして、追加の接続プロパティを追加します。使用可能なプロパティについては、MySQL Connector/J 構成リファレンスをご参照ください。 コンピューティングリソースインスタンス名 コンピューティングリソースを識別する名前です。タスクはこの名前を使用して、実行時にリソースを選択します。 接続構成セクションで、DataWorks が StarRocks ノードタスクを実行するために使用するリソースグループを選択し、[ネットワーク接続のテスト] をクリックして、そのリソースグループが EMR Serverless StarRocks インスタンスに到達できることを確認します。トラブルシューティングについては、「ネットワーク接続ソリューションの概要」をご参照ください。
[OK] をクリックします。
説明同名の Serverless StarRocks データソースが、現在のワークスペースの [データソース] セクションに自動的に作成されます。
次のステップ
コンピューティングリソースが関連付けられたら、以下のノードタイプでデータ開発に利用できます。
バッチ同期タスク: [データ統合] > [オフライン同期] ノード内にあります。詳細については、「バッチ同期ノード」をご参照ください。
EMR Serverless StarRocks タスク: ノード内です。 Serverless StarRocks SQL ノードをご参照ください。