全部产品
Search
文档中心

Platform For AI:Lihat pekerjaan pelatihan

更新时间:Jul 02, 2025

Setelah mengirimkan pekerjaan pelatihan, Anda dapat melihat informasi dasar, konfigurasi, peristiwa, tampilan sumber daya, dan log untuk mendapatkan detailnya.

Lihat informasi dasar dan konfigurasi pekerjaan

  1. Masuk ke Konsol PAI. Pilih wilayah dan ruang kerja.

  2. Di panel navigasi sebelah kiri, pilih Model Training > Deep Learning Containers (DLC).

  3. Klik nama pekerjaan yang diinginkan.

  4. Pada tab Overview, lihat informasi dasar, lingkungan, dan sumber daya pekerjaan. image

Lihat peristiwa pekerjaan

Anda dapat melihat peristiwa penjadwalan dan terkait sumber daya dari pekerjaan dalam DLC serta menyelesaikan masalah berdasarkan peristiwa tersebut.

  • Lihat peristiwa pekerjaan.

    Klik tab Event dan lihat peristiwa pekerjaan. image

  • Lihat peristiwa node.

    Di bagian Instance pada tab Overview, klik Log di kolom Actions. Di kotak dialog yang muncul, klik tab Event dan lihat peristiwa node.image

Lihat tampilan sumber daya

Tampilan sumber daya memungkinkan Anda melihat metrik seperti penggunaan GPU, Memori GPU, utilisasi CPU, penggunaan memori, dan I/O jaringan. Anda dapat melihat penggunaan sumber daya pekerjaan secara real-time pada tab Pemantauan untuk memahami kebutuhan sumber daya dan mengalokasikannya secara hemat biaya.

Buka tab Monitoring dan lihat tampilan sumber daya pekerjaan.image

Metrik dalam dimensi job, pod, dan GPU didukung.

Lihat log pekerjaan

Jika pekerjaan tidak berjalan sesuai harapan atau Anda ingin melihat riwayat eksekusi pekerjaan, Anda dapat melihat log pekerjaan untuk mendapatkan informasi utama selama eksekusi. Gunakan salah satu metode berikut:

  • Di bagian Instance pada tab Overview, klik Log di kolom Actions untuk melihat log output node.image

  • Buka tab Log dan cari log berdasarkan kata kunci. Untuk informasi lebih lanjut, lihat bagian "Cari log agregat berdasarkan kata kunci" dalam topik Buat dan kelola pekerjaan pelatihan kontainer.image

Lihat peristiwa perilaku

Platform for AI (PAI) terintegrasi dengan ActionTrail. Anda dapat melihat dan mencari peristiwa perilaku akun Alibaba Cloud Anda dalam DLC selama 90 hari terakhir di ActionTrail. Untuk informasi lebih lanjut, lihat Gunakan ActionTrail untuk menanyakan peristiwa perilaku.

Referensi

Anda dapat mengelola pekerjaan pelatihan berdasarkan statusnya. Untuk informasi lebih lanjut, lihat Kelola pekerjaan pelatihan.