DataWorks の Lindorm Ray ノードを使用すると、Ray 分散コンピューティングフレームワークを使用して Python ジョブを開発し、定期的にスケジュールできます。このトピックでは、Lindorm Ray ノードでジョブを開発するためのワークフローの概要を説明します。
概要
Lindorm コンピュートエンジンは、Ray 分散コンピューティングフレームワークに基づくコンピューティングサービスを提供します。オープンソースの Ray API と互換性があり、分散コンピューティング、機械学習、データ処理などのシナリオ向けの Python プログラミングモデルをサポートしています。DataWorks の Lindorm Ray ノードを使用すると、オンラインで Python コードを記述し、Ray 送信コマンドを設定して、Ray ジョブの開発、デバッグ、定期的なスケジューリングを行うことができます。
制限事項
リソースグループ:Lindorm Ray ノードは、Serverless リソースグループでのみ実行できます。
言語:Lindorm Ray ノードは Python 言語のみをサポートします。
実行:コードを 1 行またはブロック単位で実行することはできません。ジョブ全体を送信して実行する必要があります。
前提条件
Lindorm インスタンスを作成し、ご利用の DataWorks ワークスペースにバインド済みであること。詳細については、「Lindorm コンピュートリソースのバインド」をご参照ください。
Lindorm コンソールで Ray リソースグループを作成済みであること。詳細については、「RAY リソースグループの使用」をご参照ください。
(任意) このステップは、RAM アカウントを使用している場合にのみ必要です。ジョブ開発用の RAM アカウントを対応するワークスペースに追加し、[開発者] または [ワークスペース管理者] ロールを付与する必要があります。ワークスペース管理者ロールには広範な権限があるため、慎重に付与してください。メンバーの追加方法の詳細については、「ワークスペースへのメンバーの追加」をご参照ください。
説明メインアカウントを使用している場合は、このステップをスキップできます。
Lindorm Ray ノードの作成
手順については、「Lindorm Ray ノードの作成」をご参照ください。
Lindorm Ray ノードの開発
Lindorm Ray ノードの開発は、コードエディターでの Python コードの記述と、Ray 送信コマンドセクションでのジョブ送信コマンドの設定の 2 つの部分で構成されます。
Lindorm Ray ノードのデバッグ
実行設定の構成
ノードの右側にある Run Configuration パネルで、[コンピュートリソース]、[Lindorm リソースグループ]、および [リソースグループ] を設定します。パラメーターについては、次の表で説明します。
パラメーター
説明
コンピューティングリソース
バインドした Lindorm コンピュートリソースを選択します。
Lindorm リソースグループ
Lindorm コンソールで作成した Ray リソースグループを選択します。
リソースグループ
ネットワーク接続テストに合格した Serverless リソースグループを選択します。Lindorm Ray ノードは Serverless リソースグループのみをサポートします。
スクリプトパラメーター
${ParameterName} 形式で変数を定義した場合は、[スクリプトパラメーター] セクションで対応する [パラメーター名] と [パラメーター値] を設定します。これらの変数は、実行時に実際の値に置き換えられます。詳細については、「スケジューリングパラメーターのソースと式」をご参照ください。
デバッグのためのノードの実行
[保存] をクリックし、次に [実行] をクリックしてノードを実行します。
次のステップ
ノードのスケジューリング設定:ノードを定期的に実行する必要がある場合は、右側の [スケジューリング設定] パネルで [スケジューリングポリシー] やその他のスケジューリングプロパティを設定します。
ノードの公開:ジョブを本番環境で実行する必要がある場合は、
アイコンをクリックして公開プロセスを開始します。ノードをスケジュールに従って実行するには、本番環境に公開する必要があります。