DataWorksは、StarRocksタスクを開発および定期的にスケジュールし、StarRocksタスクを他のタイプのタスクと統合するために使用できるStarRocksノードを提供します。このトピックでは、StarRocksノードを使用してタスクを開発する方法について説明します。
背景情報
StarRocksは、超並列処理(MPP)フレームワークに基づいて構築された次世代の高速データ分析エンジンであり、すべてのデータ分析シナリオに適しています。 StarRocksはMySQLプロトコルと互換性があります。 StarRocksは優れたパフォーマンスを提供し、オンライン分析処理(OLAP)シナリオでさまざまなデータモデルをサポートしています。これには、多次元分析、データレイク分析、高並列クエリ、リアルタイムデータ分析が含まれます。
前提条件
ワークフローが作成されている。
DataStudioでは、さまざまなタイプの計算エンジンの開発操作はワークフローに基づいて実行されます。そのため、ノードを作成する前に、ワークフローを作成する必要があります。詳細については、「ワークフローを作成する」をご参照ください。
StarRocksデータソースが追加されている。
StarRocksデータベースをStarRocksデータソースとしてDataWorksに追加する必要があります。詳細については、「StarRocksデータソース」をご参照ください。
説明Java Database Connectivity(JDBC)接続文字列モードでDataWorksに追加されたStarRocksデータソースのみに基づいて、StarRocksノードを作成できます。
(RAMユーザーを使用してタスクを開発する場合に必要)RAMユーザーがDataWorksワークスペースにメンバーとして追加され、[開発] ロールまたは [ワークスペース管理者] ロールが割り当てられている。ワークスペース管理者ロールには、必要以上の権限があります。 ワークスペース管理者ロールを割り当てる場合は注意してください。メンバーを追加してロールを割り当てる方法の詳細については、「ワークスペースメンバーを追加し、ロールを割り当てる」をご参照ください。
制限
このタイプのノードは、中国(杭州)、中国(上海)、中国(北京)、中国(深セン)、中国(成都)、中国(香港)、シンガポール、マレーシア(クアラルンプール)、ドイツ(フランクフルト)、米国(シリコンバレー)、米国(バージニア)の各リージョンでサポートされています。
ステップ 1:StarRocksノードを作成する
DataStudioページに移動します。
DataWorksコンソール にログオンします。 上部のナビゲーションバーで、目的のリージョンを選択します。 左側のナビゲーションウィンドウで、 を選択します。 表示されるページで、ドロップダウンリストから目的のワークスペースを選択し、[データ開発に移動] をクリックします。
目的のワークフローを見つけ、ワークフロー名を右クリックし、 を選択します。
[ノードの作成] ダイアログボックスで、[名前] パラメーターを構成し、[確認] をクリックします。 その後、ノードを使用してタスクを開発し、タスクスケジューリングプロパティを構成できます。
ステップ 2:StarRocksタスクを開発する
(オプション)StarRocksデータソースを選択する
目的のワークスペースに複数のStarRocksデータソースを追加した場合は、ノードを使用してタスクを開発する前に、StarRocksノードの構成タブでデータソースを選択する必要があります。 目的のワークスペースにStarRocksデータソースを1つだけ追加した場合、そのデータソースはデフォルトでタスクの開発に使用されます。
Java Database Connectivity(JDBC)接続文字列モードでDataWorksに追加されたStarRocksデータソースのみに基づいて、StarRocksノードを作成できます。

SQLコードを開発する:簡単な例
StarRocksノードの構成タブにあるコードエディターで、タスクコードを記述します。 次のサンプルコードは、StarRocksデータベースでタイプがBASE TABLEであるすべてのテーブルに関する情報をクエリする方法の例を示しています。
SELECT * FROM information_schema.tables
WHERE table_type = 'BASE TABLE';SQLコードを開発する:カタログとデータベースを切り替える
SET CATALOG catalog_name; -- 現在のセッションのアクティブなカタログを切り替えます
USE catalog_name.db_name; -- 現在のセッションのアクティブなデータベースを指定しますカタログ名またはデータベース名がキーワードの場合は、解析エラーを回避するためにバックティック(``)で囲みます。
SQLコードを開発する:スケジューリングパラメーターを使用する
DataWorksは、定期的なスケジューリングシナリオでのスケジューリングパラメーターの構成に基づいて、タスクのコードで値が動的に置き換えられるスケジューリングパラメーターを提供します。${変数} 形式でタスクコードに変数を定義し、[パラメーター] セクションの [プロパティ] タブで変数に値を割り当てることができます。 サポートされているスケジューリングパラメーターの形式とスケジューリングパラメーターの構成方法については、「サポートされているスケジューリングパラメーターの形式」および「スケジューリングパラメーターを構成して使用する」をご参照ください。
次のサンプルコードでは、スケジューリングパラメーター a の値は $[yyyymmdd] で、これは現在の日付を示します。次のコードを実行して、現在の日付にデータベースに作成されたテーブルに関する情報をクエリ できます。
SELECT * FROM information_schema.tables
WHERE CREAT_TIME = '${a}';ステップ 3:タスクスケジューリングプロパティを構成する
システムでノード上のタスクを定期的に実行する場合、ノードの構成タブの右側のナビゲーションウィンドウで [プロパティ] をクリックして、ビジネス要件に基づいてタスクスケジューリングプロパティを構成できます。 詳細については、「概要」をご参照ください。
タスクをコミットする前に、[再実行] パラメーターと [親ノード] パラメーターを [プロパティ] タブで構成する必要があります。
ステップ 4:タスクコードをデバッグする
次の操作を実行して、タスクがビジネス要件に基づいて期待どおりに構成されているかどうかを確認できます。
オプション。リソースグループを選択し、カスタムパラメーターを変数に割り当てます。
ノードの構成タブの上部ツールバーにある
アイコンをクリックします。 [パラメーター] ダイアログボックスで、デバッグおよびタスクコードの実行に使用するスケジューリング用のリソースグループを選択します。タスクコードでスケジューリングパラメーターを使用する場合は、デバッグのためにスケジューリングパラメーターを変数に値として割り当てます。 スケジューリングパラメーターの値割り当てロジックの詳細については、「デバッグ手順」をご参照ください。
タスクコードを保存して実行します。
上部ツールバーで、
アイコンをクリックしてタスクコードを保存します。 次に、
アイコンをクリックしてタスクコードを実行します。オプション。スモークテストを実行します。
ノードをコミットするとき、またはノードをコミットした後に、開発環境でノードのスモークテストを実行して、ノードが期待どおりに実行されるかどうかを確認できます。 詳細については、「スモークテストを実行する」をご参照ください。
ステップ 5:タスクをコミットしてデプロイする
ノード上のタスクが構成されたら、タスクをコミットしてデプロイする必要があります。 タスクをコミットしてデプロイすると、システムはスケジューリング構成に基づいてタスクを定期的に実行します。
上部ツールバーの
アイコンをクリックして、タスクを保存します。上部ツールバーの
アイコンをクリックして、ノード上のタスクをコミットします。[送信] ダイアログボックスで、[変更の説明] パラメーターを構成します。 次に、タスクをコミットした後に、ビジネス要件に基づいてタスクコードを確認するかどうかを決定します。
説明タスクをコミットする前に、[再実行] パラメーターと [親ノード] パラメーターを [プロパティ] タブで構成する必要があります。
コードレビュー機能を使用して、タスクのコード品質を確保し、無効なタスクコードによって引き起こされるタスク実行エラーを防ぐことができます。 コードレビュー機能を有効にすると、コミットされたノードコードは、コードレビューに合格した後にのみデプロイできます。 詳細については、「コードレビュー」をご参照ください。
標準モードのワークスペースを使用する場合は、タスクをコミットした後に、本番環境にタスクをデプロイする必要があります。 ノード上のタスクをデプロイするには、ノードの構成タブの右上隅にある [デプロイ] をクリックします。 詳細については、「タスクをデプロイする」をご参照ください。
次のステップ
タスクをコミットしてデプロイすると、スケジューリング構成に基づいてタスクが定期的に実行されます。対応するノードの構成タブの右上隅にある [運用センター] をクリックして運用センターに移動し、タスクのスケジューリングステータスを表示できます。 詳細については、「自動トリガーされたタスクの表示と管理」をご参照ください。