Untuk memvisualisasikan dan menganalisis proses serta hasil pelatihan model secara lebih intuitif, simpan log pelatihan dalam kode Anda menggunakan TensorBoard, lalu gunakan fitur TensorBoard pada Deep Learning Containers (DLC) untuk visualisasi. Topik ini menjelaskan cara membuat dan mengelola instans TensorBoard.
Prasyarat
Untuk melihat laporan analisis menggunakan TensorBoard, pekerjaan DLC Anda harus memiliki set data yang dikonfigurasi. Pada halaman daftar pekerjaan DLC, klik nama pekerjaan tersebut. Di halaman Overview, pastikan bahwa set data telah dikonfigurasi untuk pekerjaan tersebut.
Simpan log Summary dalam kode pelatihan Anda menggunakan TensorBoard. Untuk contoh kode penyimpanan file log Summary, lihat contoh di Kasus.
Kasus Pekerjaan DLC Menggunakan TensorBoard
Topik ini menyediakan kasus pekerjaan DLC berikut dengan konfigurasi set data dan TensorBoard sebagai berikut:
Konfigurasikan set data Object Storage Service (OSS):
Alamat OSS:
oss://w*********.oss-cn-hangzhou-internal.aliyuncs.com/dlc_dataset_1/Jalur pemasangan:
/mnt/data/
Tetapkan alamat penyimpanan file log Summary menggunakan SummaryWriter TensorBoard:
SummaryWriter('/mnt/data/output/runs/mnist_experiment'). Contoh kode pelatihan lengkap adalah sebagai berikut:
Buat Instans TensorBoard
Masuk ke Konsol PAI. Di bilah navigasi atas, pilih wilayah dan ruang kerja, lalu klik Enter Job.
Pada kolom Actions pekerjaan target, klik TensorBoard. Pada panel TensorBoard yang muncul, klik Create TensorBoard.

Pada halaman Create TensorBoard, konfigurasikan parameter berikut, lalu klik OK.
Informasi Dasar
Parameter
Deskripsi
Name
Kustomisasi nama instans TensorBoard.
Datasets
Configuration Type: Jenis yang didukung meliputi: Mount Dataset (Direkomendasikan), Mount OSS, dan By Task.
Summary Path: Ini adalah lokasi penyimpanan file log Summary TensorBoard yang ditentukan dalam kode pelatihan Anda. Temukan SummaryWriter dalam kode Anda untuk mendapatkan jalur lengkap Summary tersebut.
Berikut adalah contoh tiga metode konfigurasi untuk kasus pekerjaan yang disebutkan di atas:
Dengan Dataset: Pilih set data yang dikonfigurasi untuk pekerjaan tersebut. Untuk direktori Summary, masukkan hanya jalur relatif file log di dalam set data.

Dengan Object Storage Service (OSS): Masukkan jalur OSS yang sesuai. Untuk direktori Summary, masukkan hanya jalur relatif file log di dalam OSS.

Dengan Pekerjaan: Pilih pekerjaan DLC target. Untuk direktori Summary, masukkan jalur lengkap file log di dalam kontainer.

Konfigurasi Sumber Daya
Konfigurasikan jenis sumber daya berikut:
Jenis Sumber Daya
Deskripsi
Free Quota
Sistem menyediakan sejumlah kuota gratis. Setiap instans mendukung maksimal 2 vCPU dan 4 GiB memori. Jika kuota gratis tidak memenuhi kebutuhan Anda, matikan instans gratis lain yang sedang berjalan untuk melepaskan kuota dan buat instans TensorBoard baru.
Lingjun AI Computing Service
Public resources: Metode penagihan adalah pay-as-you-go. Hanya komputasi umum yang mendukung sumber daya publik. Pilih spesifikasi sumber daya sesuai kebutuhan.
Resource quota: Metode penagihan adalah langganan. Beli sumber daya komputasi dan buat kuota sumber daya terlebih dahulu. Kemudian, pilih kuota sumber daya tersebut dan konfigurasikan parameter berikut:
CatatanFitur ini saat ini hanya tersedia untuk pengguna dalam daftar putih. Jika diperlukan, hubungi manajer akun Anda untuk menambahkan akun Anda ke daftar putih.
Priority: Menunjukkan prioritas eksekusi instans TensorBoard yang berjalan secara bersamaan. Rentang nilainya [1, 9], dengan 1 menunjukkan prioritas terendah.
Job Resource: Konfigurasikan sumber daya yang digunakan saat menjalankan instans TensorBoard: vCPUs dan Memory (GiB).
General Computing
Konfigurasi Virtual Private Cloud (VPC)
Saat membuat instans TensorBoard menggunakan Public Resources, konfigurasikan parameter ini.
Jika Anda tidak mengonfigurasi virtual private cloud (VPC), koneksi jaringan publik akan digunakan. Karena koneksi jaringan publik memiliki lebar pita terbatas, instans TensorBoard mungkin mengalami tersendat atau gagal memulai/menampilkan laporan dengan benar.
Konfigurasikan VPC untuk memastikan lebar pita jaringan yang cukup dan performa yang lebih stabil.
Pilih VPC yang tersedia di wilayah saat ini, lalu pilih vSwitch dan security group yang sesuai. Setelah dikonfigurasi, kluster yang menjalankan instans TensorBoard dapat langsung mengakses layanan dalam VPC ini dan menggunakan security group yang dipilih untuk kontrol akses aman.
PentingJika instans TensorBoard menggunakan set data yang memerlukan konfigurasi VPC (seperti set data CPFS atau set data Network Attached Storage (NAS) dengan titik pemasangan di dalam VPC), Anda harus menyiapkan VPC.
Buka halaman TensorBoard untuk melihat laporan analisis.
Di panel navigasi kiri, pilih .
Beralih ke tab TensorBoard. Saat Status instans TensorBoard target adalah Running, klik View TensorBoard di kolom Actions. Halaman akan otomatis dialihkan ke halaman TensorBoard.

Kelola Instans TensorBoard
Kelola instans TensorBoard yang telah dibuat sebagai berikut:
Masuk ke Konsol PAI. Di bilah navigasi atas, pilih wilayah dan ruang kerja, lalu klik Enter Job.
Di tab TensorBoard, kelola instans TensorBoard.

Jalankan instans TensorBoard
Klik Start untuk menjalankan kembali instans TensorBoard yang dihentikan.
Lihat detail instans TensorBoard
Klik nama instans target untuk melihat Basic Information dan Configuration Information.
Lihat pekerjaan terkait
Di kolom Associated Task, arahkan kursor ke ikon
untuk melihat ID pekerjaan DLC terkait. Anda juga dapat mengkliknya untuk membuka halaman detail pekerjaan.Lihat set data terkait
Di kolom Associated Dataset, arahkan kursor ke ikon
untuk melihat ID set data terkait. Anda juga dapat mengkliknya untuk membuka halaman detail set data.Lihat durasi eksekusi
Di kolom Running Duration, lihat waktu proses instans target. Waktu ini akan diatur ulang setelah Anda menghentikan instans.
Hentikan instans TensorBoard:
Klik Stop di kolom Actions instans target untuk menghentikan instans secara langsung.
Klik Auto-stop Settings di kolom Actions instans target untuk mengatur waktu henti otomatis.
Referensi
Anda juga dapat membuat instans TensorBoard untuk pekerjaan Deep Learning Containers (DLC) di halaman . Untuk informasi selengkapnya, lihat Buat dan kelola instans TensorBoard.