すべてのプロダクト
Search
ドキュメントセンター

Cloud Config:PAI 分散トレーニングのための AIMaster ベースのフォールトトレランスモニタリングを有効にする

最終更新日:Nov 22, 2025

PAI Deep Learning Containers (DLC) ジョブは、AIMaster ベースのフォールトトレランスモニタリングが有効になっている場合に準拠していると見なされます。トレーニングジョブが存在しない場合、このルールは適用されません。

リスクレベル

デフォルトのリスクレベルは高です。

必要に応じてリスクレベルを変更できます。

検出ロジック

  • PAI Deep Learning Containers (DLC) ジョブは、AIMaster ベースのフォールトトレランスモニタリングが有効になっている場合に準拠していると見なされます。

  • トレーニングジョブが存在しない場合、このルールは適用されません。

ルールの詳細

パラメーター

説明

ルール名

PAI 分散トレーニングのための AIMaster ベースのフォールトトレランスモニタリングを有効にする

ルール識別子

pai-dlc-error-monitoring-ai-master-enabled

タグ

[PAIWorkspace]

自動修復

サポートされていません

ルールトリガー

定期的、24 時間ごと

サポートされるリソースタイプ

[ACS::PAIWorkspace::Workspace]

入力パラメーター

なし

修復ガイド

修復の詳細については、「AIMaster: 弾性自動フォールトトレランスエンジン」をご参照ください。