DataWorks で EMR Serverless StarRocks タスクを開発および管理するには、まず EMR Serverless StarRocks インスタンスを Serverless StarRocks 計算リソースとしてアタッチする必要があります。インスタンスがアタッチされると、データ開発に使用できます。
前提条件
EMR Serverless StarRocks インスタンスが作成されていること。
EMR Serverless StarRocks インスタンスを購入する際は、インスタンスをアタッチする DataWorks ワークスペースと同じ [リージョン] を選択してください。インスタンスとワークスペースが異なるリージョンにある場合、インスタンスを計算リソースとしてアタッチすることはできません。
DataWorks ワークスペースが作成されていること。Resource Access Management (RAM) ユーザーがワークスペースに追加され、ワークスペース管理者ロールが割り当てられていること。
重要新しいバージョンの DataStudio を使用するワークスペースでのみサポートされます。
新しいバージョンの DataStudio を使用しないワークスペースでは、DataWorks で StarRocks データソースを作成できます。
リソースグループがワークスペースにアタッチされ、そのネットワーク接続が検証されていること。
サーバーレスリソースグループを使用する場合、計算リソースインスタンスが サーバーレスリソースグループに接続できることを確認してください。
以前のバージョンの専用リソースグループを使用する場合、計算リソースインスタンスが関連するシナリオの専用スケジューリングリソースグループに接続できることを確認してください。
リソースグループの内部ネットワーク CIDR ブロックを取得し、それを EMR Serverless StarRocks インスタンスの内部ネットワークホワイトリストに追加します。これにより、リソースグループとインスタンス間のネットワーク接続が確保されます。
制限
リージョン制限: 中国 (杭州)、中国 (上海)、中国 (北京)、中国 (深圳)、中国 (香港)、日本 (東京)、シンガポール、インドネシア (ジャカルタ)、ドイツ (フランクフルト)、米国 (シリコンバレー)、および米国 (バージニア)。
権限の制限:
オペレーター
必要な権限
Alibaba Cloud アカウント
追加の権限は必要ありません。
RAM ユーザー/RAM ロール
O&M またはワークスペース管理者ロールを持つワークスペースメンバー、または
AliyunDataWorksFullAccess権限を持つメンバーのみが計算リソースを作成できます。権限の付与に関する詳細については、「ユーザーにワークスペース管理者ロールを付与する」をご参照ください。
計算リソースリストページに移動
DataWorks コンソールにログインします。ターゲットリージョンに切り替えます。左側のナビゲーションウィンドウで、 を選択します。ドロップダウンリストからワークスペースを選択し、[管理センターへ移動] をクリックします。
左側のナビゲーションウィンドウで、[計算リソース] をクリックします。
Serverless StarRocks 計算リソースのアタッチ
計算リソースページで、パラメーターを構成して Serverless StarRocks 計算リソースをアタッチします。
アタッチする計算リソースタイプを選択します。
[計算リソースのアタッチ] をクリックして、[計算リソースのアタッチ] ページを開きます。
[計算リソースのアタッチ] ページで、計算リソースタイプを [Serverless StarRocks] に設定します。[Serverless StarRocks 計算リソースのアタッチ] 構成ページが開きます。
Serverless StarRocks 計算リソースを構成します。
[サーバーレス Spark コンピューティングリソースのアタッチ] ページで、次の表に従って設定を構成できます。
パラメーター
説明
構成モード
Alibaba Cloud インスタンスモードと 接続文字列モード。選択したモードに基づいてパラメーターを構成します。
Alibaba Cloud インスタンスモード
StarRocks インスタンス
アタッチする EMR Serverless StarRocks インスタンスを選択します。ドロップダウンリストの [作成] をクリックして EMR Serverless StarRocks インスタンスを作成することもできます。
説明ワークスペースを作成する際に本番環境と開発環境を分離することを選択した場合、両方の環境に対して StarRocks インスタンスを選択する必要があります。
データベース名
EMR Serverless StarRocks インスタンスでデータベースを選択します。データベースが作成されていない場合は、EMR Serverless StarRocks インスタンスで作成できます。
ユーザー名とパスワード
EMR Serverless StarRocks インスタンスの作成時に設定したユーザー名とパスワード。デフォルトのユーザー名は
adminです。パスワードを忘れた場合は、EMR Serverless StarRocks インスタンスのインスタンス詳細ページで [パスワードのリセット] を実行できます。接続文字列モード
ホスト/IP
StarRocks フロントエンド (FE) の IP アドレス。
ポート
StarRocks FE のクエリポート。デフォルトのポートは
9030です。StarRocks の構成に基づいてポートを指定します。ロード URL
StreamLoad 用の StarRocks FE のアドレス。フォーマットは
FE_IP:FE_HTTPです。複数の FE アドレスがある場合は、カンマで区切ります。説明FE_IPは内部ネットワークアドレスである必要があります。インターネットアドレスはサポートされていません。FE_HTTPポートは通常8030または18030です。StarRocks の構成に基づいてポートを指定します。データベース名
EMR Serverless StarRocks インスタンスでデータベースを選択します。データベースが作成されていない場合は、EMR Serverless StarRocks インスタンスの SQL エディターで作成できます。
ユーザー名とパスワード
EMR Serverless StarRocks インスタンスの作成時に設定したユーザー名とパスワード。デフォルトのユーザー名は
adminです。パスワードを忘れた場合は、EMR Serverless StarRocks インスタンスのインスタンス詳細ページで [パスワードのリセット] を実行できます。詳細パラメーター
このパラメーターはオプションです。[プロパティの追加] をクリックしてプロパティパラメーターを追加できます。パラメーターの詳細については、「MySQL 公式ドキュメント」をご参照ください。
計算リソースインスタンス名
計算リソースを識別する名前。タスクの実行時に、この名前に基づいて計算リソースが選択されます。
接続性をテストします。
接続構成セクションで、DataWorks が StarRocks ノードタスクの実行に使用するリソースグループを選択します。[接続性のテスト] をクリックして、リソースグループが EMR Serverless StarRocks インスタンスにアクセスできることを確認します。詳細については、「ネットワーク接続ソリューションの概要」をご参照ください。
[確認] をクリックして、Serverless StarRocks 計算リソースを構成します。
説明Serverless StarRocks 計算リソースをアタッチすると、現在のワークスペースの [データソース] セクションに同じ名前の Serverless StarRocks データソースが自動的に作成されます。
次のステップ
Serverless StarRocks 計算リソースをアタッチした後、次のノードでデータ開発に使用できます。
ノードで計算リソースを使用してバッチ同期タスクを開発できます。詳細については、「バッチ同期ノード」をご参照ください。
ノードで計算リソースを使用して EMR Serverless StarRocks タスクを開発できます。詳細については、「Serverless StarRocks SQL ノード」をご参照ください。