Topik ini menjawab pertanyaan yang sering diajukan tentang DSW.
Memulai Instance
T: Mengapa instans DSW saya gagal dimulai?
Troubleshooting: Klik nama instans DSW untuk melihat pesan error pada tab Events.

Daftar berikut menjelaskan error umum beserta solusinya:
Penyebab kegagalan startup lainnya:
Kegagalan pembuatan karena pembayaran tertunda
Jika akun Anda memiliki pembayaran tertunda, instans DSW tidak dapat dibuat. Voucher tidak dapat digunakan untuk membayar jumlah yang tertunda. Login ke User Center untuk memeriksa pembayaran tertunda.
T: Apa yang harus saya lakukan jika sistem menunjukkan stok resource atau kuota tidak mencukupi?
Error umum:
"Jenis resource yang Anda minta [ecs.******] saat ini tidak mencukupi" (stok resource tidak mencukupi).
"Penggunaan resource Anda telah melebihi batas default" (melebihi batas dua GPU per wilayah).
"Resource kluster sepenuhnya dimanfaatkan" (resource komputasi sepenuhnya terisi).
Analisis penyebab:
Stok resource publik tidak mencukupi
Resource publik digunakan bersama oleh banyak pengguna dan mungkin kekurangan stok selama jam sibuk.
Tipe GPU tertentu, seperti GPU high-end, lebih rentan kehabisan stok.
Setiap akun dibatasi hingga dua GPU per wilayah.
Kuota resource khusus tidak mencukupi
Anda telah membeli kuota resource khusus, tetapi kuota tersebut telah habis digunakan.
Kuota tidak dialokasikan secara wajar, dan ruang kerja tertentu memiliki kuota yang tidak mencukupi.
Solusi:
Ubah tipe instans: Jika tipe GPU yang dipilih kehabisan stok, coba tipe GPU lain.
Beralih ke wilayah lain: Di pojok kiri atas konsol PAI, beralihlah ke wilayah lain dan coba buat instans di sana.
Tingkatkan kuota GPU: Untuk menggunakan resource publik dengan lebih dari dua GPU, Anda dapat mengajukan tiket.
Beli resource khusus: Jika Anda membutuhkan pasokan resource yang stabil, beli kuota resource khusus. Untuk informasi lebih lanjut, lihat Beli sumber daya komputasi umum dan Kelola kuota sumber daya.
T: Dapatkah saya mengeksekusi file Python saat instans DSW dimulai?
Anda dapat mengatur Custom Startup Script saat membuat instans DSW atau dengan memodifikasi konfigurasi instans.

Fitur ini memungkinkan Anda menyesuaikan lingkungan atau melakukan tugas inisialisasi selama startup instans. Skrip kustom dijalankan setelah gambar dan resource siap tetapi sebelum aplikasi pengembangan seperti JupyterLab dan Code Server dimulai.
Periode timeout adalah 3 menit. Skrip kustom meningkatkan waktu startup instans, dan skrip akan timeout setelah 3 menit. Jangan lakukan tugas berdurasi panjang, seperti mengunduh gambar, dalam skrip kustom.
Anda dapat melihat log operasi skrip tersebut. Setelah instans dimulai, Anda dapat menemukan log operasi yang dihasilkan oleh skrip kustom di path `/var/log/user-command/`.
T: Saya tidak dapat menemukan instans DSW saya. Apa yang harus saya lakukan?
Di halaman ikhtisar, Anda dapat melihat instans dari berbagai tipe dan mencoba beralih ke wilayah berbeda.

T: Apa yang harus saya lakukan jika halaman DSW tidak normal atau tidak merespons?
Masalah seperti halaman kosong, Notebook yang terus-menerus memuat, atau Terminal yang tidak menerima perintah biasanya terkait dengan lingkungan lokal Anda. Coba langkah-langkah berikut:
Bersihkan cache browser Anda dan coba lagi.
Gunakan mode penyamaran atau privat browser Anda untuk mengakses halaman tersebut.
Ubah lingkungan jaringan Anda, misalnya beralih dari jaringan internal perusahaan ke hotspot ponsel, untuk memeriksa adanya pembatasan firewall.
Coba gunakan browser lain, seperti Chrome atau Firefox.
T: Apakah data pada disk sistem instans DSW dengan disk cloud akan hilang jika saya menghentikan, me-restart, mengubah konfigurasi, atau mengubah gambar instans?
Disk sistem instans DSW merupakan disk cloud untuk instans dalam kelompok resource publik dan untuk instans resource tujuan umum di mana Anda memilih Disk sebagai disk sistem. Informasi berikut menjelaskan kehilangan data pada disk sistem:
Hentikan instans: Data mungkin hilang. Jika disk cloud belum diperluas dan instans tetap dihentikan lebih dari 15 hari, data akan dihapus dan tidak dapat dipulihkan. Jika disk cloud telah diperluas atau instans dihentikan kurang dari 15 hari, data tidak hilang.
Restart instans: Data tidak hilang. Setelah instans dihentikan atau direstart, semua paket yang diinstal menggunakan
pip, file kode, dan data lain yang disimpan pada disk sistem instans tetap dipertahankan.Ubah tipe instans: Data tidak hilang. Menyesuaikan tipe instans, seperti resource CPU, memori, atau GPU, tidak memengaruhi data pada disk sistem instans.
Ubah gambar instans: Beberapa data mungkin hilang. Mengubah gambar tidak memengaruhi dataset yang dimount atau data di OSS, tetapi konten pada disk sistem mungkin direset. Oleh karena itu, sebelum mengubah gambar instans, simpan data instans tersebut. Misalnya, Anda dapat menyalin atau memindahkan data ke dataset atau OSS. Untuk informasi lebih lanjut, lihat Mount dataset, bucket OSS, sistem file NAS, atau sistem file CPFS.
Untuk instans resource tujuan umum yang menggunakan Temporary Storage sebagai disk sistemnya, data pada disk sistem akan hilang jika instans dihentikan, direstart, atau konfigurasi atau gambarnya diubah, bahkan jika kelompok resource AI-nya dikonfigurasi dengan disk cloud berlangganan.
T: Dapatkah saya mengambil kembali instans DSW yang dibuat dari resource publik yang dirilis setelah tidak aktif lebih dari 15 hari?
Untuk instans DSW yang dibuat dari resource publik, jika disk sistemnya belum diperluas dengan biaya dan instans tetap dihentikan lebih dari 15 hari berturut-turut, disk sistemnya akan secara otomatis dihapus. Data tersebut tidak dapat dipulihkan.
Hentikan, hapus, atau rilis instans
T: Bagaimana cara merilis instans DSW?
Di halaman daftar instans DSW, klik Stop atau Delete untuk instans tersebut.

Catatan: Jika Anda memperluas disk sistem saat membuat instans DSW, Anda akan dikenai biaya untuk disk sistem tersebut terlepas dari status instans. Untuk menghentikan semua penagihan untuk instans DSW, Anda harus menghapus instans tersebut.
T: Mengapa saya tidak dapat menemukan instans DSW saya?
Jika Anda tidak dapat menemukan instans Anda, coba beralih ke wilayah dan ruang kerja yang berbeda.

T: Bagaimana cara saya merilis paket sumber daya uji coba gratis?
Anda tidak perlu merilis atau menghentikan paket resource percobaan gratis.
T: Bagaimana cara saya benar-benar menghentikan penagihan untuk instans DSW? Apa perbedaan antara "menghentikan" dan "menghapus" instans?
Hentikan instans: Operasi ini melepaskan resource komputasi instans (CPU/GPU) dan menjeda penagihan untuk resource tersebut. Perhatikan bahwa Anda tetap dikenai biaya untuk disk sistem yang diperluas.
Hapus instans: Operasi ini menghapus instans dan semua resource-nya secara permanen, termasuk disk sistem. Semua penagihan terkait dihentikan.
Cara memilih:
Hentikan: Gunakan opsi ini jika Anda tidak membutuhkan instans untuk sementara tetapi ingin mempertahankan data dan lingkungannya untuk restart di masa depan.
Hapus: Gunakan opsi ini jika Anda tidak lagi membutuhkan instans dan ingin menghentikan semua penagihan. Backup data Anda sebelum melakukan operasi ini.
T: Mengapa instans DSW saya terjebak dalam status "Stopping" atau "Deleting" dalam waktu lama?
Menghentikan atau menghapus instans memerlukan waktu. Sistem perlu menghentikan tugas dengan aman, menyimpan status, dan mereklamasi resource. Jika instans tidak merespons dalam waktu lama, penyebab umumnya adalah sebagai berikut:
Instans memiliki proses yang belum dihentikan dengan benar.
Penggunaan memori terlalu tinggi, sehingga mencegah instans merespons perintah shutdown.
Dalam kasus ini, tunggu beberapa saat lalu refresh halaman. Status instans seharusnya berubah menjadi Stopped.
T: Apakah data dan kode saya akan hilang setelah saya menghentikan atau menghapus instans DSW?
Apakah data dipertahankan tergantung pada operasi Anda dan tipe kelompok resource instans.
Hentikan instans:
Kebijakan retensi data bervariasi berdasarkan tipe kelompok resource.
Untuk sebagian besar instans bayar sesuai penggunaan yang menggunakan Disk sebagai disk sistem: Jika disk cloud belum diperluas dan instans tetap dihentikan lebih dari 15 hari, data akan dihapus dan tidak dapat dipulihkan. Jika disk cloud telah diperluas atau instans dihentikan kurang dari 15 hari, data tidak hilang.
Pada instans yang menggunakan Temporary Storage sebagai disk sistem, data akan dihapus saat instans dihentikan dan tidak dapat dipulihkan.
Hapus instans:
Semua data pada disk sistemnya akan dihapus secara permanen dan tidak dapat dipulihkan. Oleh karena itu, backup semua data penting sebelum menghapus instans.
T: Mengapa instans DSW saya yang sedang berjalan berhenti secara otomatis?
Instans dikonfigurasi dengan kebijakan shutdown saat idle. Kebijakan ini dirancang untuk menghemat resource dan diaktifkan secara default untuk instans percobaan gratis.
Kondisi pemicu: Penggunaan CPU dan GPU instans terus-menerus di bawah ambang batas yang ditetapkan selama periode 3 jam.
Tindakan yang disarankan:
Hentikan manual: Untuk menghemat resource, hentikan instans secara manual saat tidak digunakan. Kebijakan shutdown saat idle tidak dijamin dipicu setiap kali.
Modifikasi kebijakan: Untuk menjalankan tugas jangka panjang, Anda dapat memodifikasi atau menonaktifkan kebijakan ini. Langkah-langkahnya sebagai berikut:
T: Saya telah menghentikan atau menghapus semua instans DSW saya. Mengapa statusnya masih menunjukkan "Running", atau mengapa saya masih menerima notifikasi penagihan?
Periksa penyebab umum berikut:
Anda mungkin mengacaukan paket resource dengan instans. Status "Running" yang Anda lihat mungkin mengacu pada paket resource (seperti "250 jam yang dapat ditagih per bulan"), bukan instans. Paket resource selalu berlaku dalam periode validitasnya, dan statusnya independen dari status instans.
Disk sistem yang diperluas masih ditagih. Menghentikan instans hanya menjeda penagihan untuk resource komputasi, tetapi disk sistem yang diperluas terus dikenai biaya penyimpanan.
Ada penundaan dalam penagihan. Penagihan tidak real-time, dan tagihan mungkin dihasilkan beberapa jam setelah Anda menggunakan resource. Misalnya, biaya yang dikeluarkan pagi hari mungkin muncul di tagihan sore hari.
Penagihan dan tagihan
T: Bagaimana cara DSW dikenai biaya? Mengapa saya dikenai biaya meskipun instans saya aktif tetapi tidak menjalankan kode apa pun?
DSW mendukung metode penagihan berlangganan dan bayar sesuai pemakaian. Anda dapat memilih metode penagihan sesuai kebutuhan. Untuk informasi lebih lanjut tentang penagihan, lihat Penagihan DSW.
Untuk metode penagihan bayar sesuai pemakaian, Anda dikenai biaya berdasarkan waktu proses instans Anda. Karena instans yang berjalan terus-menerus menggunakan resource komputasi, Anda dikenai biaya selama instans berada dalam status Running, bahkan jika tidak ada kode yang dieksekusi atau WebIDE tidak dibuka.
T: Bagaimana cara saya melihat tagihan DSW saya?
Untuk pengguna bayar sesuai pemakaian, Anda dapat membuka halaman Biaya dan Pengeluaran untuk melihat detail penagihan. Untuk informasi lebih lanjut, lihat Lihat detail penagihan.
T: Mengapa saya masih dikenai biaya setelah menghentikan instans DSW saya?
Ada dua alasan utama yang biasanya menyebabkan dikenai biaya setelah menghentikan instans:
Penundaan penagihan: Untuk metode penagihan bayar sesuai pemakaian, ada penundaan dalam pembuatan dan pemotongan tagihan. Notifikasi penagihan yang Anda terima mungkin untuk penggunaan aktual sebelum Anda menghentikan instans, bukan untuk biaya yang dihasilkan setelah dihentikan.
Ekspansi disk sistem: Jika Anda memperluas disk sistem saat membuat instans DSW, biaya penyimpanan untuk disk sistem terus dihasilkan bahkan saat instans berada dalam status Stopped. Disk sistem yang diperluas tidak dapat diperkecil. Untuk menghentikan penagihan, Anda harus menghapus instans tersebut. Sebelum menghapus instans, pastikan Anda telah membackup semua data yang diperlukan. Data tidak dapat dipulihkan setelah instans dihapus.
Untuk menentukan apakah disk sistem telah diperluas, klik nama instans untuk membuka halaman detail dan periksa apakah kapasitas disk sistem melebihi kuota gratis. Instans dalam kelompok resource publik memiliki kuota gratis 100 GiB.

T: Bagaimana cara saya benar-benar menghentikan semua penagihan terkait instans DSW?
Cara paling menyeluruh untuk menghentikan semua penagihan untuk instans DSW adalah dengan menghapus instans tersebut. Sebelum menghapus instans, pastikan Anda telah membackup semua data yang diperlukan. Data tidak dapat dipulihkan setelah instans dihapus.

Anda dapat beralih ke ruang kerja dan wilayah yang berbeda untuk memastikan semua instans dihapus.

T: Bagaimana biaya dihitung untuk instans DSW bayar sesuai pemakaian yang digunakan kurang dari satu jam?
Biaya untuk instans bayar sesuai pemakaian dihitung berdasarkan jumlah menit aktual yang digunakan. Rumusnya adalah: Jumlah tagihan = (Harga satuan / 60) × Durasi layanan aktual (menit).
Penarikan model
T: Mengapa saya mendapatkan error "Gagal menarik gambar 'crpi-****-vpc.cn-hangzhou.personal.cr.aliyuncs.com/apo/cat:full'" saat menarik model?
Saat membuat instans DSW, jika Anda mengonfigurasi alamat registri dan repository gambar bersifat privat, Anda harus memasukkan username dan password untuk repository gambar tersebut.

Penggunaan gambar
T: Mengapa saya mendapatkan error "kapasitas penyimpanan sementara tidak mencukupi" saat membuat gambar?
Penyebab: Saat membuat gambar, sistem memeriksa apakah ruang bebas yang tersisa pada disk sistem lebih besar dari ukuran layer yang akan ditulis. Jika ruang bebas tidak mencukupi, error ini dilaporkan.
Solusi: Di Terminal DSW, jalankan df -h untuk memeriksa penggunaan ruang disk sistem file dan pastikan ruang yang digunakan oleh overlay tidak melebihi ruang yang tersedia di /dev/vda4. Jika ruang yang tersedia terlampaui, Anda dapat mengatasi masalah ini dengan mengatur Custom Excluded Path saat membuat gambar.


T: Bagaimana cara saya menggunakan gambar Docker di DSW?
Gunakan gambar Docker untuk memulai instans DSW: Anda dapat mendorong gambar Docker ke Alibaba Cloud Container Registry (ACR) lalu menambahkannya ke gambar kustom ruang kerja PAI Anda. Anda kemudian dapat memilih gambar ini untuk memulai instans DSW.
Untuk mendorong gambar Docker ke ACR, lihat Gunakan instance ACR Edisi Personal untuk mendorong dan menarik gambar.
Untuk menambahkan gambar kustom PAI, lihat Gambar kustom.
Untuk mengemas lingkungan gambar DSW saat ini guna memulai instans lain atau menerapkan model, lihat Buat gambar instans DSW.
Instal dan gunakan Docker di IDE berbasis cloud DSW: Instans yang dibuat dari resource publik dan resource komputasi umum tidak mendukung instalasi dan penggunaan Docker di DSW. Namun, resource Lingjun mendukung hal ini.
T: Mengapa pembuatan gambar DSW gagal atau timeout?
Ukuran gambar melebihi batas: Saat membuat gambar DSW, volume data pada satu layer gambar tidak boleh melebihi 10 GiB. Jika tidak, pembuatan gagal. Coba kurangi ukuran gambar.
Ketidakcocokan wilayah: Instans DSW dan instance ACR harus berada di wilayah yang sama. Jika tidak, repository gambar yang sesuai tidak dapat ditemukan saat membuat gambar.
Ruang disk sistem tidak mencukupi: Saat membuat gambar, jika ruang bebas yang tersisa pada disk sistem kurang dari ukuran data yang akan ditulis ke layer gambar, error "kapasitas penyimpanan sementara tidak mencukupi" dilaporkan.
Masalah jaringan: Saat menggunakan ACR Edisi Personal, gambar didorong melalui jaringan publik. Gambar yang lebih besar mungkin gagal karena fluktuasi jaringan atau waktu transmisi yang lama. Jika instance ACR Edisi Perusahaan diikat ke VPC yang sama dengan instans DSW, gambar dapat didorong melalui jaringan internal, yang lebih cepat dan stabil.
T: Mengapa tombol "Create Image" berwarna abu-abu, atau mengapa saya tidak dapat menemukan repository image saya saat membuat image?
Status instans salah: Fitur Create Image hanya tersedia untuk instans DSW yang berada dalam status Running. Jika instans berada dalam status Stopped atau status lain, tombol tersebut berwarna abu-abu dan tidak tersedia.
Prasyarat tidak terpenuhi atau kesalahan konfigurasi:
Anda harus terlebih dahulu membuat instance ACR di wilayah yang sama dengan instans DSW dan membuat namespace serta repository gambar di dalamnya.
Pastikan instans DSW dan instance ACR berada di wilayah yang sama.
T: Mengapa saya mendapatkan error "Push image registry-vpc.cn-****.aliyuncs.com/****/lm-mirrors:**** Gagal: Push container gagal, Nama Container: dsw-notebook" saat membuat gambar?
Saat membuat gambar, pastikan volume data dalam satu layer gambar tidak melebihi 10 GiB. Jika tidak, pembuatan gagal. Untuk instans DSW dalam kelompok resource publik, Anda dapat mengatur path pengecualian kustom untuk mengecualikan file atau direktori tertentu agar tidak dimasukkan dalam gambar yang dihasilkan. Atau, Anda dapat memount path penyimpanan, seperti path OSS, untuk menyimpan data di path yang dimount dan mengaksesnya melalui path tersebut.

Ekspansi disk sistem
T: Seberapa besar disk sistem instans DSW, dan apa yang harus saya lakukan jika penuh?
File dan data di instans DSW disimpan di disk sistem secara default, dan kuota gratis tertentu disediakan.
Lihat kuota gratis
Instans yang dibuat dalam kelompok resource publik memiliki kuota gratis 100 GiB. Resource komputasi umum menyediakan disk sistem gratis hanya jika memenuhi persyaratan spesifikasi. Resource Lingjun tidak menyediakan disk cloud gratis. Anda dapat melihat ukuran spesifik ruang disk sistem gratis di opsi disk sistem pada halaman konfigurasi instans. Prosedur:
Di halaman daftar instans, klik nama instans.
Di pojok kanan atas, klik Change Settings dan gulir ke bawah ke System Disk.

Lihat penggunaan disk sistem
Klik nama instans DSW. Di bagian Environment Context, Anda dapat melihat penggunaan disk sistem.

Perluas disk sistem saat penuh
Jika penggunaan ruang disk sistem melebihi kuota gratis, Anda dapat memilih untuk memperluas disk sistem atau memount dataset.
T: Dapatkah disk sistem diperkecil?
Disk sistem DSW tidak dapat diperkecil setelah diperluas. Jika Anda menemukan bahwa ruang disk sistem instans DSW yang dibuat sebelumnya terlalu besar dan perlu membackup informasi penting di instans tersebut, Anda dapat membackup data ke OSS dengan memount dataset, bucket OSS, sistem file NAS, atau sistem file CPFS. Anda kemudian dapat menghapus instans DSW untuk menghindari penagihan berkelanjutan dan membuat instans DSW baru dengan ruang disk sistem yang sesuai dengan kebutuhan Anda.
Konfigurasi mount
T: Bagaimana cara saya memount dan menggunakan sistem file saya sendiri pada instans DSW?
Anda dapat memount bucket OSS, sistem file NAS, sistem file CPFS, atau sistem file CPFS Lingjun saat membuat instans. Anda kemudian dapat memasukkan direktori mount di Terminal DSW untuk melihat dan menggunakan file tersebut.
Saat ini, DSW hanya mendukung pemasangan sistem file di wilayah yang sama saat membuat instans. Untuk informasi lebih lanjut, lihat Buat instans DSW.
T: Mengapa saya mendapatkan error "MountTarget yang ditentukan 3b79d4a2ac-xmk97.cn-shanghai.nas.aliyuncs.com tidak berada di VPC vpc(instans terhubung-VPC)" saat memount dataset NAS ke instans PAI-DSW dan memulai instans?
Penyebab: Mount target dikonfigurasi saat dataset NAS dibuat.
Solusi: Biarkan bidang mount target kosong saat membuat dataset.

T: Mengapa saya mendapatkan error "mount:wrong fs type,bad option,bad superblock" saat menjalankan perintah mount untuk mengunggah dan mengunduh file ke NAS menggunakan FTP berbasis ECS?
Gejala

Solusi
Sebelum menjalankan perintah
mount, instal paket nfs-utils.yum install nfs-utils
T: Apa yang harus saya lakukan jika mendapatkan error "Input/output error" saat mengakses direktori yang dimount setelah memount dataset OSS?

Kesalahan ini terjadi karena peran belum diberikan izin akses OSS (AliyunPAIDLCAccessingOSSRole). Untuk informasi tentang cara memberikan izin, lihat Berikan izin kepada akun layanan PAI.
T: Bagaimana cara saya mengurangi risiko error kehabisan memori (OOM) saat menggunakan Jindo untuk memount dataset OSS?
Anda dapat mengatasi masalah ini dengan salah satu dari dua cara berikut:
Metode 1: Gunakan Jindo 6.8.1, yang telah mengoptimalkan penggunaan memori.
{ "fs.jindo.fuse.pod.image.tag":"6.8.1" }
Metode 2: Gunakan ossfs.
Saat mengirimkan pekerjaan, tentukan:
{ "mountType": "ossfs" }
Dengan konfigurasi berikut untuk menonaktifkan optimasi readdirplus, Anda dapat mengurangi penggunaan cache metadata saat mencantumkan konten folder. Hal ini membantu meminimalkan masalah OOM:
{ "mountType": "ossfs", "fs.ossfs.args": "-oreaddirplus=false" }
T: Saya telah berhasil memount bucket OSS. Mengapa saya tidak dapat melihatnya di browser file di sebelah kiri antarmuka JupyterLab?
Hal ini karena browser file DSW menampilkan direktori kerja instans secara default, yang biasanya /mnt/workspace. Path mount yang Anda tentukan saat memount bucket OSS (misalnya, /mnt/data) tidak berada di direktori kerja default, sehingga tidak ditampilkan dalam daftar file di sebelah kiri.
Solusi:
Akses melalui kode: File Anda berhasil dimount. Dalam kode Anda, Anda harus menggunakan path mount lengkap untuk mengaksesnya, misalnya,
open('/mnt/data/my_file.csv').Ubah target mount: Untuk melihat file dengan mudah di UI, Anda dapat mengatur path mount ke subdirektori direktori kerja saat mengonfigurasi mount, misalnya,
/mnt/workspace/my_oss_data. Setelah mount selesai, Anda dapat melihat file OSS Anda di foldermy_oss_datadi browser file.Akses melalui terminal: Anda dapat menjalankan perintah
cd /mnt/datadi Terminal DSW untuk memasuki direktori mount, lalu menggunakan perintah sepertilsuntuk melihat dan mengoperasikan file.
T: Mengapa saya mendapatkan error "Transport endpoint is not connected" atau "input/output error" saat menggunakan bucket OSS yang dimount?
Error ini menunjukkan bahwa koneksi mount antara instans DSW dan bucket OSS terputus. Penyebab dan metode troubleshooting yang mungkin adalah sebagai berikut:
Masalah izin peran RAM: Periksa apakah peran RAM yang dikonfigurasi untuk instans DSW telah diberikan izin untuk mengakses OSS (misalnya,
AliyunPAIDLCAccessingOSSRole). Izin yang tidak mencukupi adalah penyebab umum ketidakmampuan membaca dari OSS.Resource layanan mount tidak mencukupi: Saat melakukan pembacaan dan penulisan acak intensitas tinggi atau banyak operasi file kecil, proses
ossfsatauJindoFuseyang bertanggung jawab atas mount mungkin crash karena error kehabisan memori (OOM). Di "Advanced Configuration" konfigurasi mount, Anda dapat menonaktifkan cache metadata atau meningkatkan konfigurasi memori. Untuk informasi lebih lanjut, lihat JindoFuse.Pulihkan koneksi:
Untuk mount yang dikonfigurasi saat startup, cara termudah untuk memulihkan koneksi adalah dengan me-restart instans DSW. Sistem secara otomatis mengeksekusi ulang mount.
Anda juga dapat menggunakan PAI SDK untuk mengeksekusi perintah mount dinamis guna memount ulang path tanpa me-restart instans.
T: Jenis data apa saja yang didukung DSW untuk dimount? Dapatkah saya langsung memount Alibaba Cloud Drive atau tabel MaxCompute?
DSW mendukung penggunaan layanan penyimpanan cloud OSS, NAS, dan CPFS dengan membuat dataset atau langsung memount path.
Alibaba Cloud Drive tidak didukung: DSW saat ini tidak mendukung pemasangan langsung Alibaba Cloud Drive pribadi. Kami menyarankan agar Anda menyimpan data yang akan diproses di OSS.
Pemasangan tabel MaxCompute tidak didukung: Data tabel MaxCompute (sebelumnya ODPS) tidak dapat langsung "dimount" ke direktori DSW seperti sistem file. Anda dapat membaca dan menulis data dalam kode DSW Anda menggunakan SDK atau API yang disediakan oleh PAI. Untuk informasi lebih lanjut, lihat Gunakan PyODPS untuk membaca dan menulis tabel MaxCompute.
T: Apakah kode dan data saya akan hilang setelah instans DSW saya dimatikan atau dihapus? Bagaimana cara saya mencapai persistensi dan migrasi data?
Disk sistem instans DSW adalah penyimpanan sementara. Untuk kelompok resource publik, data dihapus jika instans dihentikan lebih dari 15 hari. Untuk kelompok resource khusus, data disk sistem juga dihapus setelah instans dihentikan atau dihapus.
Untuk mencapai penyimpanan persisten data dan kode serta migrasi di antara instans yang berbeda, Anda harus menggunakan penyimpanan eksternal yang dimount.
Solusi persistensi: Simpan semua data, kode, model, dan aset penting Anda di path OSS atau NAS yang dimount. Dengan cara ini, bahkan jika instans DSW dihapus, semua aset Anda tetap disimpan dengan aman di bucket OSS atau sistem file NAS Anda sendiri.
Solusi migrasi: Saat Anda perlu memigrasikan data dari satu instans DSW ke instans lain, cukup mount path OSS atau NAS yang sama yang berisi data tersebut ke instans baru. Ini adalah cara paling nyaman untuk memigrasikan data.
T: Saya telah berhasil memount bucket OSS. Mengapa saya tidak dapat melihat file di direktori kerja saya di bucket OSS?
Path mount default yang ditentukan saat memount bucket OSS adalah /mnt/data, sedangkan direktori kerja default DSW adalah /mnt/workspace. Oleh karena itu, Anda tidak dapat melihat file dari direktori kerja di bucket OSS. Anda dapat menggunakan perintah copy berikut untuk menyalin file dari direktori kerja ke /mnt/data. Anda kemudian dapat melihat file yang sesuai di bucket OSS.
cp -r /mnt/workspace/. /mnt/data/Pembacaan, pengunggahan, dan pengunduhan data
T: Bagaimana cara saya menggunakan DSW untuk membaca data dari OSS?
Anda dapat menggunakan SDK Python atau API untuk membaca data dari OSS. Untuk informasi lebih lanjut, lihat Baca data dari dan tulis data ke Object Storage Service (OSS).
T: Bagaimana cara saya mengunggah dan mengunduh folder?
DSW saat ini tidak mendukung pengunggahan dan pengunduhan folder secara langsung. Namun, Anda dapat mengunggah dan mengunduh folder dengan mengompresnya. Terminal DSW menyediakan lingkungan Linux di mana Anda dapat menggunakan antarmuka baris perintah Linux standar, seperti tar, gzip, dan unzip, untuk mengekstrak file. Contoh berikut menggunakan tar.
Jalankan
tar --versionuntuk memeriksa apakah tar diinstal. Jika tidak, Anda dapat menginstalnya menggunakan perintah berikut.# Perintah instalasi untuk sistem berbasis Debian (seperti Ubuntu) sudo apt install tar # Perintah instalasi untuk sistem berbasis Red Hat (seperti CentOS dan Fedora) sudo yum install tarEkstrak folder tersebut.
# Kompres folder. /path/to/diretory adalah folder yang akan dikompres. tar -cvf archive_name.tar /path/to/directory # Ekstrak folder tar -xvf archive_name.tar
T: Bagaimana cara saya mentransfer dan berbagi data antara dua instans DSW?
Anda dapat menggunakan salah satu dari dua metode berikut:
Mount dataset, bucket OSS, sistem file NAS, atau sistem file CPFS: Mount dataset atau path OSS yang sama ke kedua instans DSW, lalu simpan data di dataset atau path penyimpanan tersebut untuk berbagi data.
Unggah dan unduh file: Unduh data yang akan dibagikan dari instans DSW sumber, lalu unggah ke instans DSW lainnya.
T: Apa yang harus saya lakukan jika tidak ada respons atau pengunduhan gagal setelah saya mengklik "Download"?
Hal ini biasanya disebabkan oleh kemacetan jaringan atau masalah browser. Coba langkah-langkah berikut:
Tunggu sebentar. File besar memerlukan waktu respons lebih lama untuk diunduh.
Beralih ke browser lain atau gunakan mode penyamaran browser Anda dan coba lagi.
Untuk file besar (seperti yang lebih dari 200 MB) atau jika jaringan tidak stabil, disarankan untuk mengunduh dengan memount bucket OSS.
T: Apa yang harus saya lakukan jika sistem menunjukkan ruang "File Transfer Station" tidak mencukupi?
Kapasitas total File Transfer Station adalah 10 GB. Anda perlu membuka halaman manajemen transfer station dan membersihkan file di transfer station untuk melepaskan ruang. Jika halaman tidak segera diperbarui, coba refresh browser Anda.
T: Mengapa saya selalu diarahkan ke "File Transfer Station" saat mengunggah?
Hal ini normal. Untuk memastikan stabilitas dan kecepatan unggah, semua file yang lebih besar dari 10 MB secara otomatis ditransfer melalui File Transfer Station dan disimpan ke instans Anda setelah selesai.
T: Bagaimana cara saya mengunggah file lokal besar (seperti model lebih dari 5 GB) atau sejumlah besar data ke DSW dan menggunakannya?
Ruang disk sistem instans DSW terbatas dan merupakan penyimpanan sementara. Tidak disarankan untuk langsung mengunggah file besar atau sejumlah besar data. Anda dapat terlebih dahulu mengunggah data ke Alibaba Cloud Object Storage Service (OSS) lalu memount-nya ke instans DSW untuk digunakan. Untuk informasi lebih lanjut, lihat Mount dataset, bucket OSS, sistem file NAS, atau sistem file CPFS.
Koneksi remote ke instans
T: Mengapa saya mendapatkan error "client_loop: send disconnect: Broken pipe" saat menghubungkan ke instans DSW dengan ProxyClient?
Saat menggunakan ProxyClient untuk menghubungkan ke instans DSW melalui SSH, jika Anda tidak melakukan operasi apa pun dalam waktu lama, koneksi terputus, dan sistem mungkin menampilkan prompt berikut:

Untuk mengatasi masalah ini, kami sarankan Anda menggunakan metode yang lebih stabil Koneksi remote: Koneksi SSH langsung untuk menghubungkan ke instans DSW.
T: Mengapa membuka folder lokal gagal setelah terhubung ke Instans dari jarak jauh dengan VSCode?
Masalah ini umumnya disebabkan oleh klien VSCode. Kami sarankan Anda mengunggah file lokal ke instans DSW. Untuk operasi spesifik, lihat Unggah dan unduh file.
T: Mengapa konfigurasi koneksi SSH langsung gagal dengan pesan error: Gagal memperbarui item zona privat: Gagal menambahkan zona?
Error ini terjadi karena layanan resolusi DNS internal tidak diaktifkan. Anda dapat mengaktifkan layanan ini. Untuk informasi lebih lanjut, lihat Aktifkan resolusi DNS internal.
Masalah jaringan
T: Bagaimana cara saya mengatasi kecepatan unduh jaringan yang lambat?
Instans DSW dan DLC menggunakan gateway bersama secara default. Karena keterbatasan bandwidth, kecepatan unduh mungkin tidak memenuhi kebutuhan Anda saat mengunduh file besar. Oleh karena itu, saat ingin meningkatkan kecepatan unduh jaringan, Anda dapat merujuk pada hal berikut:
Jika Anda mengunduh resource di dalam Tiongkok: Anda dapat membuat Internet NAT gateway untuk virtual private cloud (VPC) tempat instans berada, menyambungkan Elastic IP Address (EIP), dan mengonfigurasi entri SNAT. Untuk operasi terperinci, lihat Gunakan gateway khusus untuk meningkatkan kecepatan akses jaringan publik.
Catatan: Saat menggunakan metode ini, verifikasi bahwa sakelar Rate Limit for Internet Access diaktifkan untuk ruang kerja. Untuk informasi lebih lanjut, lihat Kelola ruang kerja > Konfigurasi Umum.

Jika Anda mengunduh resource dari luar Tiongkok daratan: Anda dapat menggunakan Global Accelerator (GA) untuk menarik model atau gambar kontainer dari luar Tiongkok.
Sebagai tambahan, Anda dapat terlebih dahulu mengunduh file resource ke perangkat lokal Anda lalu langsung mengunggahnya ke instans DSW. Atau, Anda dapat terlebih dahulu mengunggahnya ke Object Storage Service (OSS) lalu memount-nya ke instans DSW.
T: Apakah instans DSW memiliki alamat IP publik?
Instans DSW tidak diberikan alamat IP publik secara default. Untuk mengakses Internet atau memungkinkan pihak eksternal mengakses instans DSW Anda, disarankan agar Anda mengonfigurasi NAT Gateway atau menggunakan Elastic IP Address (EIP). Untuk informasi lebih lanjut, lihat Konfigurasi jaringan.
T: Dapatkah port jaringan publik diduplikasi saat instans DSW diekspos ke jaringan publik melalui NAT Gateway?
Saat Anda menggunakan layanan kustom DSW untuk menyediakan antarmuka ke pihak eksternal, jika beberapa layanan dikonfigurasi dengan NAT Gateway yang sama, port layanan kustom semua layanan yang mengakses jaringan publik melalui NAT Gateway tersebut tidak boleh sama. Hal ini mencakup layanan kustom di instans DSW yang berbeda.
T: Mengapa instans DSW saya tidak dapat mengakses jaringan publik?
Instans DSW dapat mengakses jaringan publik melalui Public Gateway secara default. Jika Anda tidak dapat mengakses jaringan publik, periksa apakah Private Gateway dipilih untuk Internet Access Gateway di halaman konfigurasi instans. Jika Anda memilih gateway khusus, Anda harus mengonfigurasi Elastic IP Address dan entri SNAT. Untuk informasi lebih lanjut, lihat Gunakan gateway khusus untuk meningkatkan kecepatan akses jaringan publik. Atau, Anda dapat memilih gateway publik.

T: Mengapa saya mendapatkan error "Network is unreachable" saat mengakses hugging face?
Saat menarik model dari luar Tiongkok daratan (seperti model dari huggingface.co) di instans DSW, Anda mungkin tidak dapat mengaksesnya karena masalah jaringan lintas domain. Untuk mengatasi masalah ini, Anda dapat membuat instance Global Accelerator (GA) dan menggunakan layanan akselerasi jaringan globalnya untuk memungkinkan DSW memiliki kemampuan akses jaringan lintas domain guna mendapatkan model dan gambar. Untuk informasi lebih lanjut, lihat Tarik model atau gambar kontainer dari luar Tiongkok.
Instalasi library pihak ketiga
T: Bagaimana cara saya menggunakan library pihak ketiga di DSW?
DSW mendukung instalasi library pihak ketiga. Untuk informasi lebih lanjut, lihat Kelola library pihak ketiga.
T: Apakah paket yang saya instal dengan pip dan kode yang saya tulis akan hilang setelah instans DSW saya dimatikan (dihentikan)?
Tidak, tidak akan hilang jika Anda menggunakan disk cloud sebagai disk sistem. Data disk instans, termasuk lingkungan di bawah /mnt/workspace dan /root, dipertahankan. Saat Anda memulai kembali instans, semua lingkungan dan file tetap ada. Hanya penghapusan instans yang benar-benar menghapus semua data.
T: Mengapa library pihak ketiga yang saya instal tidak berlaku?
Setelah menginstal library pihak ketiga dengan perintah pip, jika Anda tidak dapat menemukan library tersebut saat mengimpornya dengan perintah import, pertama-tama coba restart layanan atau Kernel. Jika error tetap ada, konfirmasi lingkungan yang sedang digunakan. Saat menginstal library pihak ketiga, DSW menginstalnya ke lingkungan Python 3 secara default. Untuk menginstalnya ke lingkungan lain, Anda harus terlebih dahulu beralih ke lingkungan tersebut secara manual lalu melakukan instalasi. Misalnya:
Instal ke lingkungan Python 2.
source activate python2
pip install --user xxx
Instal ke lingkungan TensorFlow 2.0.
source activate tf2
pip install --user xxxDi sini, xxx perlu diganti dengan nama library pihak ketiga yang akan diinstal.
T: Mengapa instalasi paket dengan pip install di DSW gagal dengan konflik dependensi atau error versi?
Hal ini biasanya disebabkan oleh ketidakcocokan lingkungan. Troubleshoot dan atasi masalah dengan mengikuti langkah-langkah berikut:
Ubah gambar. Ini adalah solusi yang disarankan. Hentikan instans saat ini, buat instans DSW baru, dan pilih gambar resmi yang berbeda. Misalnya, jika gambar PyTorch 2.1 saat ini tidak berfungsi, Anda dapat mencoba gambar PyTorch 2.3, atau coba seri gambar
modelscope, yang biasanya memiliki kompatibilitas lebih baik.Instal versi tertentu. Rujuk dokumentasi resmi paket untuk menemukan versi yang mendukung lingkungan DSW Anda saat ini (versi Python/CUDA), lalu jalankan
pip install package_name==x.y.z.Ubah sumber unduhan. Coba gunakan mirror domestik seperti mirror Universitas Tsinghua:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple <yourLibraryName>.
T: Saya telah menginstal library di Terminal DSW. Mengapa saya tidak dapat menemukannya saat mengimpornya di Jupyter Notebook?
Hal ini mungkin karena Terminal dan Jupyter menggunakan dua lingkungan Python yang berbeda. Anda dapat menjalankan perintah which python untuk mengonfirmasi lingkungan Python mana yang sedang digunakan, atau instal library yang diperlukan di Notebook. Misalnya:

T: Kode saya melaporkan error bahwa versi driver CUDA terlalu rendah. Apakah saya perlu memperbarui driver NVIDIA secara manual di DSW?
Jangan perbarui versi driver. Driver dan CUDA instans DSW telah diinstal sebelumnya dan dikunci. Anda tidak dapat dan tidak boleh memodifikasinya secara manual. Jika Anda melakukannya, instans sangat mungkin rusak dan tidak dapat dipulihkan. Pendekatan yang benar adalah mengubah gambar DSW. Hentikan instans saat ini, buat instans baru, dan pilih gambar resmi dengan versi CUDA dan driver yang lebih tinggi.
Misalnya, gambar resmi: modelscope:1.9.4-pytorch2.0.1tensorflow2.13.0-gpu-py38-cu118-ubuntu20.04. Di sini, cu118 menunjukkan bahwa versi CUDA adalah 11.8.
T: Dapatkah saya menggunakan Docker di DSW untuk menerapkan aplikasi saya?
Untuk menggunakan Docker di resource Lingjun, Anda dapat mengajukan tiket untuk ditambahkan ke daftar putih. Instans DSW dari resource non-Lingjun tidak mendukung menjalankan instance Docker lain di dalam container instans.
T: Instans DSW saya tidak memiliki perintah unzip atau 7z. Bagaimana cara saya mengekstrak file?
Anda dapat menginstalnya menggunakan perintah apt-get.
Instal
unzip: Di Terminal, jalankanapt-get update && apt-get install -y unzip, lalu gunakanunzip your_file.zip.Instal
p7zip(untuk 7z): Di Terminal, jalankanapt-get update && apt-get install -y p7zip-full, lalu gunakan7z x your_file.7z.
T: Mengapa instalasi library pihak ketiga selalu macet atau timeout?
Jika instalasi library pihak ketiga macet, timeout, atau sangat lambat, biasanya merupakan masalah jaringan. Troubleshoot dan atasi masalah dengan mengikuti langkah-langkah berikut:
Langkah 1: Konfirmasi konektivitas jaringan
Di terminal, jalankan perintah ping www.aliyun.com untuk menguji apakah Anda dapat mengakses Internet. Jika jaringan terputus, lanjutkan ke langkah berikutnya untuk memeriksa konfigurasi jaringan.
Langkah 2: Periksa konfigurasi gateway
Di halaman konfigurasi instans, lihat tipe Internet Access Gateway:
Public Gateway: Secara default, instans DSW menggunakan Public Gateway untuk mengakses Internet. Anda dapat mengonfirmasi tipe gateway di halaman konfigurasi instans. Karena gateway publik memiliki bandwidth terbatas, kecepatan unduh mungkin tidak mencukupi untuk file besar. Dalam hal ini, Anda dapat menggunakan gateway khusus.
Dedicated Gateway: Gateway khusus menyediakan kecepatan akses jaringan yang lebih tinggi. Setelah memilih gateway khusus, Anda harus membuat Internet NAT gateway di virtual private cloud (VPC), menyambungkan Elastic IP Address (EIP), dan mengonfigurasi entri SNAT. Jika tidak, Anda tidak akan dapat mengakses jaringan publik. Untuk informasi lebih lanjut, lihat Gunakan gateway khusus untuk meningkatkan kecepatan akses jaringan publik.
Langkah 3: Coba ubah sumber unduhan pip
DSW menggunakan sumber mirror Alibaba Cloud secara default, tetapi masalah mungkin terjadi selama jam sibuk atau karena fluktuasi jaringan. Disarankan untuk beralih ke sumber mirror domestik lain:
# Instal menggunakan mirror Universitas Tsinghua (disarankan)
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn <yourLibraryName>
# Instal menggunakan mirror USTC
pip install -i https://pypi.mirrors.ustc.edu.cn/simple --trusted-host pypi.mirrors.ustc.edu.cn <yourLibraryName>
# Instal menggunakan mirror Douban
pip install -i https://pypi.doubanio.com/simple --trusted-host pypi.doubanio.com <yourLibraryName>Untuk mengubah sumber pip default secara permanen, lihat Lihat atau ubah sumber pip.
Langkah 4: Gunakan instalasi offline
Jika jaringan benar-benar terputus atau sangat tidak stabil, Anda dapat menggunakan metode instalasi offline:
Di komputer lokal Anda (dengan jaringan yang baik), unduh paket instalasi dalam format
.whl:# Jalankan di komputer lokal Anda pip download <yourLibraryName> -d ./packagesUnggah file
.whlyang diunduh ke instans DSW. Untuk informasi tentang pengunggahan file, lihat Unggah dan unduh file.Lakukan instalasi offline di DSW:
pip install /path/to/your-package.whl
T: Bagaimana cara saya mendapatkan izin root di WebIDE DSW?
Sebagian besar gambar resmi DSW dijalankan sebagai pengguna root secara default. Saat Anda membuka Terminal, jika prompt perintahnya adalah root@..., artinya Anda sudah menjadi pengguna root. Peringatan "tidak disarankan menjalankan sebagai pengguna root" yang muncul selama instalasi pip dapat diabaikan dengan aman. Jika gambar Anda tidak login sebagai root, ini adalah pengaturan gambar itu sendiri, dan Anda perlu beralih ke gambar yang mendukung root.
T: Bagaimana cara saya memulai xserver di DSW?
DSW tidak mendukung memulai xserver.
Penerapan model
T: Bagaimana cara saya menerapkan model yang dihasilkan oleh DSW?
Gunakan layanan penerapan model EAS
Setelah selesai membuat model, Anda dapat menggunakan PAI-EAS untuk menerapkan model sebagai layanan online. Untuk informasi lebih lanjut, lihat Terapkan model sebagai layanan online.
Unduh model untuk penerapan lokal
Anda dapat mengklik kanan model yang dihasilkan oleh DSW untuk mengunduhnya ke perangkat lokal Anda.
Operasi Instance
T: Saat menjalankan kode machine learning, mengapa saya diminta login ulang setelah halaman tidak aktif selama beberapa waktu?
Karena alasan keamanan, sesi login DSW berlaku selama 3 jam. Setelah kedaluwarsa, Anda perlu login ulang, tetapi hal ini tidak memengaruhi eksekusi tugas. Untuk menjalankan tugas dalam waktu lama, disarankan untuk menjalankan tugas di latar belakang menggunakan perintah nohup di Terminal DSW.
T: Apakah tugas pelatihan yang berjalan di DSW akan berlanjut setelah saya menutup browser atau mematikan komputer saya?
Ya, akan berlanjut. Instans DSW berjalan di cloud, dan menutup perangkat lokal Anda tidak memengaruhi status berjalannya. Namun, perhatikan bahwa beberapa instans, terutama instans percobaan gratis, mungkin dikonfigurasi dengan kebijakan shutdown saat idle. Jika resource instans, seperti CPU dan GPU, tetap di bawah ambang batas tertentu selama periode waktu tertentu, sistem mungkin menentukan bahwa instans sedang idle dan menghentikannya secara otomatis, yang akan mengganggu tugas Anda.
T: Mengapa DSW tidak dapat memulai Docker?
Karena DSW sendiri berjalan di dalam container, DSW tidak mendukung instalasi Docker. Versi CUDA yang sesuai telah diinstal sebelumnya pada mesin virtual dasar dan tidak dapat diubah. Anda dapat menggunakan nvidia-smi untuk melihat versi CUDA yang sesuai.
T: Mengapa saya tidak memiliki fitur bash seperti auto-completion tab di Terminal?
Karena beberapa gambar memiliki batasan penggunaan, Anda harus secara manual memasukkan bash di Terminal lalu tekan Enter untuk memulai fitur terkait bash.
T: Apa yang harus saya lakukan jika tipe instans DSW tidak memenuhi persyaratan saat saya melakukan pengembangan AI di DSW?
Anda dapat memperbarui tipe instans DSW dengan mengikuti langkah-langkah berikut:
Di daftar instans DSW, klik nama instans untuk membuka halaman detail instans.
Di tab Instance Settings, klik Change Settings.
Di panel Change Instance Settings, perbarui tipe instans.
CatatanSaat memperbarui tipe instans DSW, jika instans sedang berjalan, operasi pembaruan akan segera me-restart instans. Pastikan Anda telah menyimpan konten di instans.
T: Penggunaan memori saya tinggi. Bagaimana cara saya melepaskannya?
Jika penggunaan memori tinggi memengaruhi operasi normal, Anda dapat mengatasi masalah dengan salah satu dari dua cara.
Jika Anda tidak dapat menggunakan baris perintah karena penggunaan memori tinggi, klik Stop Instance di pojok kanan atas. Atau, kembali ke konsol DSW dan klik Stop di baris instans. Tunggu hingga instans berhenti sebelum memulainya kembali.
Jika Anda masih dapat berinteraksi dengan baris perintah, Anda dapat memasukkan perintah
topdi Terminal instans untuk melihat penggunaan memori semua proses saat ini.%MEMmenunjukkan persentase memori yang ditempati, danPIDmenunjukkan ID proses.
Jika Anda ingin mengakhiri proses yang menempati banyak memori, masukkan berikut di baris perintah:
kill PIDAnda perlu mengganti PID dengan PID proses yang ingin Anda akhiri. Setelah menjalankan perintah, Anda dapat melihat bahwa penggunaan memori telah berkurang.

T: Mengapa saya mendapatkan error "RuntimeError: CUDA error: too many resources requested for launch" saat runtime?
Penyebab: Error ini menunjukkan bahwa resource yang diminta oleh kernel CUDA melebihi resource yang tersedia. Error ini biasanya terkait dengan keterbatasan perangkat keras GPU.
Solusi: Anda dapat mencoba me-restart instans dan menjalankan program lagi. Jika masih tidak berhasil, Anda perlu memilih instans yang dipercepat GPU dengan spesifikasi lebih tinggi.
T: Dapatkah saya membuat ruang swap untuk menggunakan memori virtual saat DSW kehabisan memori?
DSW sendiri adalah container dan tidak mendukung pembuatan atau pengelolaan ruang swap.
Alasannya sebagai berikut:
Batasan izin: Izin kernel container dibatasi, dan tidak dapat memount file swap. Bahkan jika Anda mendapatkan izin root di dalam container, Anda tidak dapat melewati kebijakan resource host.
Kebijakan platform: Platform secara seragam menjadwalkan dan membatasi resource untuk memastikan stabilitas dan keamanan lingkungan multi-penyewa.
Saran: Jika memori tidak mencukupi, optimalkan kode atau tingkatkan tipe instans.





