Untuk secara intuitif melihat dan menganalisis proses serta hasil pelatihan model pada antarmuka pengguna (UI) yang divisualisasikan, Anda dapat menggunakan TensorBoard dalam kode pelatihan untuk membaca log dan memanfaatkan fitur TensorBoard dari Deep Learning Containers (DLC). Topik ini menjelaskan cara membuat dan mengelola instance TensorBoard.
Prasyarat
Anda telah mengaitkan dataset dengan pekerjaan DLC. Hanya pekerjaan DLC yang dikaitkan dengan dataset yang dapat menggunakan TensorBoard untuk melihat laporan analisis. Klik nama pekerjaan DLC untuk pergi ke tab Overview dan periksa apakah pekerjaan tersebut terkait dengan dataset.
Anda telah menyimpan log ringkasan menggunakan TensorBoard dalam kode pelatihan berdasarkan contoh kode di contoh berikut.
Contoh
Dataset dan konfigurasi TensorBoard berikut digunakan untuk pekerjaan DLC dalam contoh ini.
Konfigurasikan dataset Object Storage Service (OSS):
OSS URI:
oss://w*********.oss-cn-hangzhou-internal.aliyuncs.com/dlc_dataset_1/Path mount:
/mnt/data/
Tentukan lokasi penyimpanan log ringkasan menggunakan SummaryWriter di TensorBoard:
SummaryWriter('/mnt/data/output/runs/mnist_experiment'). Berikut adalah kode contoh lengkap:
Buat instance TensorBoard
Masuk ke Konsol PAI. Pilih wilayah tempat instance Anda berada di bilah navigasi atas dan pilih ruang kerja. Kemudian, klik Enter Deep Learning Containers (DLC).
Di halaman yang muncul, klik TensorBoard di kolom Actions pekerjaan yang ingin Anda kelola. Di panel TensorBoard, klik Create TensorBoard.

Di halaman Create TensorBoard, konfigurasikan parameter dan klik OK. Tabel berikut menjelaskan parameter.
Informasi Dasar
Parameter
Deskripsi
Name
Nama instance TensorBoard.
Mount Settings
Mount Type: Anda dapat memilih Mount Dataset, Mount OSS, dan By Task. Kami merekomendasikan Anda memilih Mount Dataset.
Summary Path: Path tempat log ringkasan TensorBoard disimpan. Anda dapat memperoleh path lengkap dari kelas SummaryWriter di kode pelatihan.
Konfigurasi sampel untuk contoh:
Mount Dataset: Pilih dataset dan masukkan path relatif direktori ringkasan di dataset.

Mount OSS: Pilih path penyimpanan OSS dan masukkan path relatif direktori ringkasan di OSS.

By Task: Pilih pekerjaan DLC yang diinginkan dan masukkan path lengkap file log di container.

Konfigurasi Sumber Daya
Tabel berikut menjelaskan jenis sumber daya yang didukung.
Jenis sumber daya
Deskripsi
Free Quota
Sistem memberikan Anda sejumlah sumber daya gratis. Setiap instance dapat menggunakan hingga 2 vCPU dan 4 GiB memori. Jika jumlah kuota gratis tidak memenuhi kebutuhan bisnis Anda, Anda dapat menonaktifkan instance yang berjalan pada kuota gratis untuk melepaskan sumber daya gratis dan menggunakan sumber daya gratis yang dilepaskan untuk membuat instance TensorBoard.
Lingjun AI Computing Service
Sumber daya publik: menggunakan metode penagihan bayar sesuai pemakaian. Hanya komputasi umum yang menggunakan sumber daya publik. Anda dapat memilih tipe instance berdasarkan kebutuhan bisnis Anda.
Kuota Sumber Daya: menggunakan metode penagihan langganan. Anda harus membeli sumber daya komputasi dan membuat kuota sebelum Anda menentukan parameter ini. Anda harus mengonfigurasi parameter berikut bersama dengan parameter ini:
CatatanFitur ini hanya tersedia untuk pengguna di daftar putih. Jika Anda ingin menggunakan fitur ini, hubungi manajer akun Anda untuk mengonfigurasi daftar putih.
Priority: prioritas instance TensorBoard. Nilai valid: 1 hingga 9. Nilai 1 menunjukkan prioritas terendah.
Job Resource: sumber daya yang Anda gunakan untuk menjalankan instance TensorBoard. Sumber daya termasuk jumlah vCPUs dan memory. Satuan ukuran memori adalah GiB.
General Computing
VPC
Jika Anda menggunakan Public Resources untuk membuat instance TensorBoard, parameter terkait virtual private cloud (VPC) tersedia.
Jika Anda tidak mengonfigurasi VPC, koneksi Internet digunakan. Dalam hal ini, sistem mungkin tersendat saat memulai instance TensorBoard atau saat melihat laporan karena lebar pita jaringan koneksi Internet yang terbatas.
Untuk memastikan lebar pita jaringan yang cukup dan performa yang stabil, kami merekomendasikan Anda mengonfigurasi VPC.
Pilih VPC, vSwitch, dan grup keamanan di wilayah saat ini. Setelah menyelesaikan konfigurasi, kluster tempat instance TensorBoard berjalan dapat mengakses layanan di VPC yang dipilih dan menggunakan grup keamanan yang ditentukan untuk mengontrol akses.
PentingJika instance TensorBoard menggunakan dataset yang memerlukan VPC, seperti dataset Cloud Parallel File Storage (CPFS) atau dataset NAS yang memiliki titik mount di VPC, Anda harus mengonfigurasi VPC.
Buka halaman TensorBoard untuk melihat laporan analisis.
Di bilah navigasi kiri halaman ruang kerja, pilih .
Di tab TensorBoard, jika Status instance TensorBoard adalah Running, klik View TensorBoard di kolom Actions.
Halaman TensorBoard akan muncul.

Kelola instance TensorBoard
Ikuti langkah-langkah berikut untuk mengelola instance TensorBoard:
Masuk ke Konsol PAI. Pilih wilayah tempat instance Anda berada di bilah navigasi atas dan pilih ruang kerja. Kemudian, klik Enter Jobs.
Di tab TensorBoard halaman yang muncul, lakukan operasi berikut untuk mengelola instance TensorBoard.

Mulai instance TensorBoard
Klik Start di kolom Tindakan untuk memulai ulang instance TensorBoard yang dihentikan.
Lihat detail instance TensorBoard
Klik nama instance TensorBoard. Di halaman detail instance TensorBoard, lihat Basic Information dan Configuration Information.
Lihat pekerjaan DLC terkait
Lihat jumlah pekerjaan DLC yang dikaitkan dengan instance TensorBoard. Di tab Tensorboard, gerakkan pointer ke ikon
di kolom Associated Task untuk melihat ID pekerjaan DLC terkait. Klik ID untuk pergi ke halaman detail pekerjaan DLC.Lihat dataset terkait
Lihat jumlah dataset yang dikaitkan dengan instance TensorBoard. Di tab Tensorboard, gerakkan pointer ke ikon
di kolom Associated Dataset untuk melihat ID dataset terkait. Klik ID untuk pergi ke halaman detail dataset.Lihat durasi berjalan
Lihat durasi berjalan instance TensorBoard. Durasi berjalan dimulai saat instance dimulai. Setelah menghentikan instance TensorBoard, durasi berjalan akan diatur ulang. Di tab Tensorboard, lihat durasi berjalan instance TensorBoard di kolom Running Duration.
Hentikan instance TensorBoard
Klik Stop di kolom Actions instance TensorBoard.
Klik Auto-stop Settings di kolom Actions instance TensorBoard untuk menentukan waktu Anda ingin instance berhenti secara otomatis.
Referensi
Anda dapat membuat instance TensorBoard untuk pekerjaan DLC di halaman . Untuk informasi lebih lanjut, lihat Buat dan kelola instance TensorBoard.