All Products
Search
Document Center

Cloud Config:Aktifkan pemantauan toleransi kesalahan berbasis AIMaster untuk pelatihan terdistribusi PAI

Last Updated:Nov 22, 2025

Job PAI Deep Learning Containers (DLC) dianggap mematuhi jika pemantauan toleransi kesalahan berbasis AIMaster diaktifkan. Aturan ini tidak berlaku apabila tidak terdapat Job pelatihan.

Tingkat risiko

Tingkat risiko default adalah Tinggi.

Anda dapat menyesuaikan tingkat risiko sesuai kebutuhan.

Logika deteksi

  • Job PAI Deep Learning Containers (DLC) dianggap mematuhi jika pemantauan toleransi kesalahan berbasis AIMaster diaktifkan.

  • Jika tidak terdapat Job pelatihan, aturan ini tidak berlaku.

Detail aturan

Parameter

Deskripsi

Nama aturan

Aktifkan pemantauan toleransi kesalahan berbasis AIMaster untuk pelatihan terdistribusi PAI

Pengidentifikasi aturan

pai-dlc-error-monitoring-ai-master-enabled

Tag

[PAIWorkspace]

Remediasi otomatis

Tidak didukung

Pemicu aturan

Periodik, setiap 24 jam

Jenis sumber daya yang didukung

[ACS::PAIWorkspace::Workspace]

Parameter input

Tidak ada

Panduan remediasi

Untuk informasi lebih lanjut mengenai remediasi, lihat AIMaster: Elastic Automatic Fault Tolerance Engine.