DataWorks の StarRocks ノードを使用して、StarRocks タスクの開発、スケジュール、統合を行います。このトピックでは、開発ワークフローについて説明します。
概要
StarRocks は、次世代の高速 MPP データベースです。MySQL プロトコルと互換性があり、この OLAP エンジンは、多次元分析、データレイク分析、高同時実行クエリ、リアルタイムデータ分析など、さまざまなシナリオで優れたパフォーマンスを発揮します。
前提条件
ビジネスフローの作成
DataStudio はビジネスフローによって開発を整理します。ノードを作成する前に、ビジネスフローを作成する必要があります。詳細については、「ワークフローの作成」をご参照ください。
StarRocks データソースの作成
ご利用の StarRocks データベースを DataWorks のデータソースとして追加します。詳細については、「StarRocks データソースの作成」をご参照ください。
説明StarRocks ノードは、JDBC 経由で作成された StarRocks データソースのみをサポートします。
(オプション。RAM ユーザーに必須) RAM ユーザーをワークスペースに追加し、開発 または ワークスペース管理者 のロールを割り当てます。ワークスペース管理者ロールは権限が強いため、慎重に付与してください。詳細については、「ワークスペースへのメンバーの追加」をご参照ください。
制限事項
サポートされているリージョン:中国 (杭州)、中国 (上海)、中国 (北京)、中国 (深セン)、中国 (成都)、中国 (香港)、シンガポール、マレーシア (クアラルンプール)、ドイツ (フランクフルト)、米国 (シリコンバレー)、および米国 (バージニア)。
ステップ 1: StarRocks ノードの作成
DataStudio ページに移動します。
DataWorks コンソールにログインします。上部のナビゲーションバーで、目的のリージョンを選択します。左側のナビゲーションウィンドウで、を選択します。表示されたページで、ドロップダウンリストから目的のワークスペースを選択し、[データ開発へ] をクリックします。
対象のビジネスフローを右クリックし、 を選択します。
[ノードの作成] ダイアログボックスで、ノードの [名前] を入力し、[確認] をクリックします。
ステップ 2: StarRocks タスクの開発
(オプション) StarRocks データソースの選択
設定タブで対象のデータソースを選択します。StarRocks データソースが 1 つしか存在しない場合は、デフォルトで選択されます。
StarRocks ノードは、JDBC 経由で作成された StarRocks データソースのみをサポートします。

SQL コードの開発: 簡単な例
エディターにタスクコードを入力します。この例では、データベース内のすべての基本テーブルをクエリします:
SELECT * FROM information_schema.tables
WHERE table_type = 'BASE TABLE';SQL コードの開発: カタログとデータベースの切り替え
SET CATALOG catalog_name; --現在のセッションのカタログを切り替えます
USE catalog_name.db_name; --現在のセッションのデータベースを指定します解析エラーを防ぐために、キーワードをバックティック (``) で囲んでください。
SQL コードの開発: スケジュールパラメーターの使用
[スケジュールパラメーター] を使用して、動的な入力を定義します。コード内の変数を ${variable_name} として定義し、右側の [スケジュール設定] > [スケジュールパラメーター] で値を割り当てます。サポートされているフォーマットと設定の詳細については、「スケジュールパラメーターでサポートされているフォーマット」および「スケジュールパラメーターの設定と使用」をご参照ください。
たとえば、パラメーター a が $[yyyymmdd] (今日) に設定されている場合、コードは今日作成されたテーブルをクエリします。
SELECT * FROM information_schema.tables
WHERE CREAT_TIME = '${a}';ステップ 3: タスクスケジュールの設定
タスクをスケジュールするには、右側の [スケジュール設定] をクリックしてプロパティを設定します。詳細については、「概要」をご参照ください。
送信する前に、[再実行プロパティ] と [上流依存ノード] を設定してください。
ステップ 4: タスクコードのデバッグ
タスクをデバッグして、正しく実行されることを確認します:
(オプション) デバッグリソースグループを選択し、パラメーター値を割り当てます。
ツールバーの
アイコンをクリックします。[パラメーター] ダイアログボックスで、リソースグループを選択します。デバッグ用にスケジュールパラメーターに値を割り当てます。パラメーターの割り当てロジックの詳細については、「タスクのデバッグプロセス」をご参照ください。
タスクコードを保存して実行します。
アイコンをクリックして保存し、
アイコンをクリックして実行します。(オプション) スモークテストの実行
送信中または送信後にスモークテストを実行して、開発環境での実行を検証します。詳細については、「スモークテストの実行」をご参照ください。
ステップ 5: タスクの送信と公開
ノードを送信して公開し、スケジュールを有効化します。
ツールバーの
アイコンをクリックしてノードを保存します。ツールバーの
アイコンをクリックしてノードタスクを送信します。[送信] ダイアログボックスで、[変更内容の説明] を入力し、コードレビューオプションを選択します。
説明送信する前に、[再実行プロパティ] と [上流依存ノード] を設定してください。
コードレビューは品質を保証します。有効になっている場合、公開前にレビュー担当者がコードを承認する必要があります。詳細については、「コードレビュー」をご参照ください。
標準モードのワークスペースでは、右上の [公開] をクリックして本番環境にデプロイします。詳細については、「タスクの公開」をご参照ください。
次のステップ
モニタリングとメンテナンスの詳細については、[オペレーションセンター] のドキュメントをご参照ください。定期タスクの管理