Function Compute menyediakan instans CPU dan instans yang dipercepat GPU. Kedua jenis instans tersebut dapat digunakan dalam mode on-demand atau provisioned. Instans on-demand ditagih berdasarkan durasi eksekusi aktual, dan Anda dapat mengombinasikannya dengan fitur konkurensi instans untuk meningkatkan pemanfaatan sumber daya. Penagihan instans provisioned dimulai saat Function Compute memulai instans dan berakhir saat instans dilepaskan. Instans provisioned secara efektif dapat mengurangi cold start. Topik ini menjelaskan tipe, mode penggunaan, metode penagihan, serta spesifikasi instans fungsi di Function Compute.
Tipe Instans
Instans CPU: Tipe instans dasar dari Function Compute. Cocok untuk skenario dengan lonjakan lalu lintas atau beban kerja komputasi-intensif.
Instans yang dipercepat GPU: Instans yang menggunakan arsitektur Turing untuk akselerasi GPU. Digunakan terutama untuk memproses file audio dan video, beban kerja AI, serta gambar. Instans ini mempercepat bisnis dengan memindahkan beban ke perangkat keras GPU.
Untuk informasi lebih lanjut tentang praktik terbaik untuk instans yang dipercepat GPU dalam berbagai skenario, lihat topik-topik berikut:
PentingInstans yang dipercepat GPU hanya dapat diterapkan menggunakan image kontainer.
Ketika menggunakan instans yang dipercepat GPU, Anda dapat bergabung dengan grup DingTalk (ID grup: 64970014484) dan memberikan informasi berikut untuk mendapatkan dukungan teknis:
Nama organisasi Anda, seperti nama perusahaan.
ID akun Alibaba Cloud Anda.
Wilayah tempat Anda ingin menggunakan instans yang dipercepat GPU. Contoh: Tiongkok (Shenzhen).
Informasi kontak Anda, seperti nomor ponsel, alamat email, atau akun DingTalk Anda.
Mode Instans
Baik instans CPU maupun instans yang dipercepat GPU mendukung mode on-demand dan provisioned. Bagian ini menjelaskan kedua mode tersebut.
On-demand mode
Pendahuluan
Instans on-demand dialokasikan dan dilepaskan oleh Function Compute. Function Compute secara otomatis menyesuaikan jumlah instans sesuai volume pemanggilan fungsi yang diterima. Instans dibuat ketika permintaan meningkat dan dilepaskan ketika permintaan berkurang. Pembuatan instans on-demand dipicu oleh permintaan. Instans on-demand dihapus jika tidak ada permintaan selama periode tertentu (biasanya 3 hingga 5 menit). Pemanggilan pertama kali memerlukan waktu untuk cold start selesai.
Secara default, setiap akun Alibaba Cloud dapat menjalankan hingga 100 instans per wilayah. Kuota aktual dapat dilihat pada halaman Kuota Umum di Konsol Quota Center. Anda juga dapat mengajukan penyesuaian kuota di Konsol Quota Center.
Metode Penagihan
Durasi penagihan instans on-demand dimulai saat permintaan diterima dan berlanjut hingga permintaan sepenuhnya diproses. Setiap instans on-demand dapat memproses satu atau lebih permintaan secara bersamaan. Untuk informasi lebih lanjut, lihat Konfigurasikan konkurensi instans.
Tidak ada instans yang dialokasikan jika tidak ada permintaan, sehingga tidak ada biaya yang dihasilkan. Anda hanya dikenakan biaya saat fungsi dipanggil. Untuk informasi lebih lanjut tentang harga dan penagihan, lihat Ikhtisar Penagihan.
Anda dapat menggunakan fitur konkurensi instans berdasarkan kebutuhan bisnis untuk meningkatkan pemanfaatan sumber daya. Jika digunakan, CPU dan memori dibagi secara preemptif saat beberapa tugas dieksekusi pada satu instans secara bersamaan, meningkatkan pemanfaatan sumber daya.
Konkurensi Instans = 1
Dalam mode on-demand, durasi penagihan dimulai saat permintaan tiba di instans dan berakhir saat permintaan sepenuhnya diproses.
Konkurensi Instans > 1
Dalam kasus ini, pengukuran durasi eksekusi instans on-demand dimulai saat permintaan pertama diterima dan berakhir saat permintaan terakhir sepenuhnya diproses. Fitur konkurensi instans menggunakan kembali sumber daya, membantu menghemat biaya.
Provisioned mode
Pendahuluan
Dalam mode provisioned, Anda bertanggung jawab atas alokasi dan pelepasan instans fungsi. Instans provisioned dipertahankan hingga Anda melepaskannya. Permintaan pemanggilan didistribusikan secara prioritas ke instans provisioned. Jika instans provisioned tidak cukup untuk memproses semua permintaan, Function Compute mengalokasikan instans on-demand untuk memproses kelebihannya. Untuk informasi lebih lanjut tentang cara menghapus instans provisioned, lihat Konfigurasikan aturan penskalaan otomatis.
Instans provisioned membantu mengurangi cold start. Anda dapat menentukan jumlah tetap instans provisioned berdasarkan anggaran bisnis. Selain itu, Anda dapat mengonfigurasi kebijakan penskalaan otomatis terjadwal berdasarkan pola lalu lintas layanan atau memilih penskalaan berbasis ambang batas jika layanan tidak menunjukkan pola lalu lintas yang jelas. Setelah digunakan, latensi cold start rata-rata berkurang secara signifikan.
Mode Idle
Instans CPU
Status instans CPU diklasifikasikan menjadi status aktif dan idle berdasarkan apakah sumber daya vCPU dialokasikan ke instans tersebut. Secara default, fitur mode idle diaktifkan.
Instans Aktif
Instans dianggap aktif jika sedang memproses permintaan atau jika fitur idle mode dinonaktifkan. Jika fitur idle mode dinonaktifkan, vCPU dialokasikan ke instans provisioned tanpa memandang apakah instans tersebut sedang memproses permintaan atau tidak. Dengan cara ini, instans dianggap aktif setiap saat dan dapat terus memproses tugas latar belakang.
Instans Idle
Instans provisioned dengan fitur idle mode diaktifkan masuk ke status idle saat tidak memproses permintaan. Function Compute membekukan vCPU instans tersebut saat tidak memproses permintaan. Instans dalam status idle tidak dikenakan biaya, menghemat biaya. Jika hook PreFreeze dikonfigurasikan, instans masuk ke status idle setelah hook PreFreeze dieksekusi. Jika tidak, instans segera masuk ke status idle setelah selesai memproses permintaan. Untuk informasi lebih lanjut tentang status instans, lihat Siklus hidup instans fungsi.
Anda dapat memilih apakah akan mengaktifkan fitur mode idle berdasarkan kebutuhan bisnis Anda.
Biaya
Jika Anda ingin menggunakan instans provisioned untuk mengurangi cold start dan menghemat biaya, kami sarankan mengaktifkan fitur mode idle. Fitur ini tidak hanya meminimalkan cold start tetapi juga memungkinkan Anda membayar hanya untuk memori dan sumber daya disk yang dikonsumsi oleh instans provisioned setelah mereka masuk ke status idle.
Tugas Latar Belakang
Jika fungsi Anda perlu menjalankan tugas latar belakang, kami sarankan tidak mengaktifkan fitur mode idle. Berikut adalah contoh skenario:
Beberapa kerangka aplikasi bergantung pada penjadwal bawaan atau fitur latar belakang. Middleware yang bergantung perlu secara berkala melaporkan denyut jantung.
Beberapa operasi asinkron dilakukan menggunakan Goroutine lightweight threads di Go, fungsi asinkron di Node.js, atau thread asinkron di Java.
Instans yang Dipercepat GPU
Status instans yang dipercepat GPU diklasifikasikan menjadi status aktif dan idle berdasarkan apakah sumber daya GPU dialokasikan ke instans tersebut. Secara default, fitur mode idle diaktifkan.
Instans Aktif
Instans dianggap aktif jika sedang memproses permintaan atau jika fitur idle mode dinonaktifkan. Setelah fitur idle mode diaktifkan, Function Compute membekukan GPU instans tersebut saat tidak memproses permintaan.
Instans Idle
Instans provisioned dengan fitur idle mode diaktifkan masuk ke status idle saat tidak memproses permintaan.
Metode Penagihan
Instans Aktif
Penagihan instans provisioned dimulai saat mereka dibuat dan berakhir saat mereka dilepaskan. Instans provisioned diminta dan dilepaskan oleh Anda, sehingga terus menghasilkan biaya hingga dilepaskan. Jika fitur mode idle tidak diaktifkan, biaya didasarkan pada harga satuan instans aktif setiap saat.
Instans Idle
Jika fitur mode idle diaktifkan, instans provisioned masuk ke status idle saat tidak memproses permintaan. Harga instans idle jauh lebih rendah daripada instans aktif. Untuk informasi lebih lanjut, lihat Faktor konversi.
Spesifikasi Instans
Instans CPU
Tabel berikut menjelaskan spesifikasi instans CPU. Konfigurasikan instans Anda sesuai kebutuhan.
vCPU
Ukuran Memori (MB)
Ukuran Paket Kode Maksimum (GB)
Durasi Eksekusi Fungsi Maksimum (detik)
Ukuran Disk Maksimum (GB)
Bandwidth Maksimum (Gbit/d)
0.05 hingga 16
Catatan: Nilainya harus kelipatan dari 0.05.
128 hingga 32768
Catatan: Nilainya harus kelipatan dari 64.
10
86400
10
Nilai valid:
512 MB. Ini adalah nilai default.
10 GB.
5
CatatanRasio vCPU terhadap kapasitas memori (dalam GB) harus dari 1:1 hingga 1:4.
Instans yang Dipercepat GPU
Tabel berikut menjelaskan spesifikasi instans yang dipercepat GPU. Konfigurasikan instans Anda sesuai kebutuhan.
CatatanInstans GPU fc.gpu.tesla.1 menawarkan performa serupa dengan instans yang menggunakan GPU NVIDIA T4.
Tipe Instans
Ukuran GPU Penuh (GB)
Daya Komputasi GPU Penuh (TFLOPS)
Spesifikasi Tersedia
Mode On-demand Didukung atau Tidak
Mode Provisioned Reguler Didukung atau Tidak
Mode Provisioned Idle Didukung atau Tidak
FP16
FP32
Memori vGPU (MB)
Daya Komputasi vGPU (GPU)
vCPU
Ukuran Memori (MB)
fc.gpu.tesla.1
16
65
8
Nilai valid: 1024 hingga 16384 (1 GB hingga 16 GB)
Catatan: Nilainya harus kelipatan dari 1024.
Nilainya dihitung berdasarkan rumus berikut: Daya komputasi vGPU = memori vGPU (dalam GB)/16 × daya komputasi GPU penuh. Misalnya, jika Anda mengatur memori vGPU menjadi 5 GB, daya komputasi vGPU maksimum yang tersedia adalah 5/16 × daya komputasi GPU penuh.
Catatan: Daya komputasi dialokasikan secara otomatis oleh Function Compute.
Nilai valid: 0.05 hingga [memori vGPU (dalam GB)/2].
Catatan: Nilainya harus kelipatan dari 0.05. Untuk informasi lebih lanjut, lihat Spesifikasi GPU.
Nilai valid: 128 hingga [memori vGPU (dalam GB) x 2048].
Catatan: Nilainya harus kelipatan dari 64. Untuk informasi lebih lanjut, lihat Spesifikasi GPU.
Y
Y
Y
fc.gpu.ada.1
48
119
60
49152 (48 GB)
Catatan: Hanya spesifikasi memori vGPU 48 GB yang didukung.
Secara default, daya komputasi GPU penuh dialokasikan.
Catatan: Daya komputasi dialokasikan secara otomatis oleh Function Compute.
8
Catatan: Hanya spesifikasi 8-vCPU yang didukung.
65536 (64 GB)
Catatan: Hanya spesifikasi memori 64 GB yang didukung.
N
Y
Y
Instans yang dipercepat GPU dari Function Compute juga mendukung spesifikasi sumber daya berikut.
Ukuran Image (GB)
Durasi Eksekusi FungsiMaksimum (detik)
Ukuran Disk Maksimum (GB)
Bandwidth Maksimum (Gbit/d)
Container Registry Enterprise Edition (Standard Edition): 15
Container Registry Enterprise Edition (Advanced Edition): 15
Container Registry Enterprise Edition (Basic Edition): 15
Container Registry Personal Edition (gratis): 15
86400
10
5
CatatanMengatur tipe instans ke g1 memberikan efek yang sama dengan mengatur tipe instans ke fc.gpu.tesla.1.
Instans GPU seri Tesla didukung di wilayah berikut: Tiongkok (Hangzhou), Tiongkok (Shanghai), Tiongkok (Beijing), Tiongkok (Zhangjiakou), Tiongkok (Shenzhen), Jepang (Tokyo), AS (Virginia), dan Singapura.
Instans GPU seri Ada didukung di wilayah berikut: Tiongkok (Beijing), Tiongkok (Hangzhou), Tiongkok (Shanghai), dan Tiongkok (Shenzhen).
Spesifikasi GPU
Referensi
Anda dapat mengaktifkan fitur mode idle saat mengonfigurasi aturan penskalaan otomatis. Untuk informasi lebih lanjut, lihat Konfigurasikan aturan penskalaan otomatis.
Untuk informasi lebih lanjut tentang metode penagihan dan item yang dapat ditagih Function Compute, lihat Ikhtisar Penagihan.
Ketika Anda memanggil operasi API untuk membuat fungsi, Anda dapat menggunakan parameter
instanceTypeuntuk menentukan tipe instans. Untuk informasi lebih lanjut, lihat CreateFunction.Untuk informasi lebih lanjut tentang cara menentukan tipe dan spesifikasi instans di konsol Function Compute, lihat Kelola fungsi.