Anda dapat men-deploy aplikasi yang memerlukan instans yang dipercepat GPU sebagai fungsi menggunakan gambar kontainer. Pendekatan ini ideal untuk proyek AI populer, seperti Stable Diffusion WebUI, ComfyUI, Generasi yang Diperkaya dengan Pengambilan Data (RAG), dan TensorRT. Menggunakan gambar kontainer untuk mengirimkan fungsi meningkatkan efisiensi pengembangan dan pengiriman.
Buat fungsi
Masuk ke Function Compute console. Di panel navigasi sebelah kiri, pilih .
Di bilah menu atas, pilih wilayah. Pada halaman Function List, klik Create Function.
Pada kotak dialog yang muncul, pilih GPU Function, lalu klik Create GPU Function.
Pada halaman Create GPU Function, atur parameter berikut, lalu klik Create.
Basic Configurations: Masukkan Function Name. Nama harus unik dalam Akun Alibaba Cloud dan wilayah yang sama, serta mengikuti konvensi penamaan.
Elastic Configurations: Pilih tipe instans. Anda tidak dapat menggunakan instans yang disediakan dan instans sesuai permintaan secara bersamaan. Setelah fungsi dibuat, tipe instans tidak dapat diubah.
On-demand instances
Configuration Item
Description
Example
Instance Type
Pilih On-demand Instance. Instans diskalakan secara otomatis berdasarkan volume permintaan dan dilepas saat tidak ada permintaan. Anda ditagih berdasarkan penggunaan aktual.
On-demand Instance
GPU Card Type
Pilih tipe kartu GPU. Untuk informasi lebih lanjut tentang spesifikasi yang didukung oleh berbagai tipe kartu, lihat Instance types and specifications.
Ada series
Specifications
Atur spesifikasi GPU Memory, vCPU, Memory, dan Disk untuk fungsi sesuai kebutuhan bisnis Anda. Setelah Anda mengatur spesifikasi, penggunaan setiap resource dihitung dengan mengalikan spesifikasi dengan durasi penggunaan. Untuk informasi lebih lanjut, lihat Billing overview.
CatatanSemua direktori pada disk dapat ditulis. Ruang disk bersifat shared.
Disk terikat pada siklus hidup instans fungsi dasar. Saat sistem mereklaim instans, data pada disk akan hilang. Jika Anda memerlukan penyimpanan persisten, Anda dapat memasang sistem file NAS atau Bucket OSS. Untuk informasi lebih lanjut, lihat Configure a NAS file system dan Configure Object Storage Service.
GPU Memory: 48 GB
vCPU: 8 vCPU
Memory: 64 GB
Disk: 512 MB (tidak ditagih, Function Compute menyediakan kuota gratis sebesar 10 GB ruang disk)
Minimum Instances
Jika bisnis Anda sensitif terhadap latensi, setelah memilih Elastic Instance, kami menyarankan Anda mengatur jumlah minimum instans menjadi 1 atau lebih untuk mengunci resource terlebih dahulu dan mengurangi latensi cold start.
CatatanSetelah Anda mengatur Minimum Instances menjadi 1 atau lebih, jika tidak ada kebijakan elastis untuk jumlah minimum instans yang dikonfigurasi atau jika tidak ada kebijakan elastis yang aktif dalam suatu periode, jumlah minimum instans saat ini adalah nilai yang Anda tetapkan di sini.
Jika beberapa kebijakan elastis dikonfigurasi, sistem menghitung Minimum Number Of Instances yang diperlukan saat setiap kebijakan dipicu. Sistem kemudian menggunakan nilai tertinggi di antara kebijakan yang aktif sebagai Minimum Number Of Instances saat ini.
Untuk informasi lebih lanjut, lihat How is the current minimum number of instances calculated?.
1
Concurrency Per Instance
Anda dapat mengonfigurasi beberapa permintaan konkuren untuk satu instans fungsi GPU. Artinya, satu instans dapat memproses beberapa permintaan secara bersamaan. Untuk informasi lebih lanjut, lihat Configure concurrency per instance.
Provisioned instances
Configuration Item
Description
Example
Instance Type
Pilih Provisioned Instance. Instans dialokasikan ke fungsi dari kolam sumber daya yang telah dibeli sebelumnya.
Instans yang disediakan direkomendasikan untuk skenario di mana biaya yang dapat diprediksi, latensi rendah, dan pemanfaatan resource tinggi penting untuk memastikan stabilitas bisnis.
Provisioned Instance
Provisioned Resource Pool
Kolam sumber daya yang disediakan adalah kumpulan instans yang disediakan yang dapat dialokasikan ke fungsi target. Jika kapasitas kolam sumber daya yang disediakan tidak mencukupi, klik Scale-out di kolom Actions dan ikuti petunjuk di layar untuk memperluasnya. Untuk informasi lebih lanjut, lihat Provisioned resource pools (subscription).
Provisioned Resource Pool: fc-pool-****
GPU Card Type: Ada
Specifications
Atur spesifikasi GPU Memory, vCPU, Memory, dan Disk untuk fungsi sesuai kebutuhan bisnis Anda. Setelah Anda mengatur spesifikasi, penggunaan setiap resource dihitung dengan mengalikan spesifikasi dengan durasi penggunaan. Untuk informasi lebih lanjut, lihat Billing overview.
CatatanSemua direktori pada disk dapat ditulis. Ruang disk bersifat shared.
Disk terikat pada siklus hidup instans fungsi dasar. Saat sistem mereklaim instans, data pada disk akan hilang. Jika Anda memerlukan penyimpanan persisten, Anda dapat memasang sistem file NAS atau Bucket OSS. Untuk informasi lebih lanjut, lihat Configure a NAS file system dan Configure Object Storage Service.
GPU Memory: 48 GB
vCPU: 8 vCPU
Memory: 64 GB
Disk: 512 MB (tidak ditagih, Function Compute menyediakan kuota gratis sebesar 10 GB ruang disk)
Number Of Provisioned Instances
Alokasikan sejumlah instans yang disediakan ke fungsi target berdasarkan resource yang tersedia di kolam sumber daya yang disediakan.
1
Concurrency Per Instance
Anda dapat mengonfigurasi beberapa permintaan konkuren untuk satu instans fungsi GPU. Artinya, satu instans dapat memproses beberapa permintaan secara bersamaan. Untuk informasi lebih lanjut, lihat Configure concurrency per instance.
20
Function Code: Konfigurasikan lingkungan runtime dan kode fungsi.
Configuration Item
Description
Example
Runtime Environment
Use Sample Image: Pilih contoh gambar yang disediakan oleh Function Compute untuk men-deploy fungsi berbasis gambar dengan cepat. Pilih gambar target dari daftar gambar di bawah item konfigurasi Container Image.
Use Image from ACR: Di bawah item konfigurasi Container Image, klik Select Image From ACR. Di panel Select Container Image, pilih Container Registry instance dan ACR image repository yang telah dibuat. Lalu, temukan gambar target di area gambar di bawah ini dan klik Select di kolom Actions. Untuk informasi lebih lanjut, lihat Create a function that uses a custom image.
Container Image
Pilih gambar target.
SpringBoot Web Application Sample Image
Startup Command
Perintah startup untuk program. Jika Anda tidak mengonfigurasi perintah startup, Entrypoint/CMD dari gambar digunakan secara default.
None
Listener Port
Port tempat server HTTP dalam kode Anda mendengarkan.
9000
Execution Timeout
Atur periode timeout. Default Execution Timeout adalah 60 detik, dan maksimum 86400 detik.
60
Instance Prefetch: Dalam skenario inferensi AI, Anda dapat mengonfigurasi instance prefetch untuk memanaskan model sebelumnya. Hal ini menghilangkan latensi cold start pada permintaan pertama.
Configuration Item
Description
Example
Instance Prefetch
Instance Prefetch
Konfigurasikan hook Initializer untuk memanaskan instans dan mengoptimalkan cold start. Hook menjalankan skrip tertentu atau memanggil antarmuka untuk memuat model setelah instans fungsi dimulai tetapi sebelum memproses permintaan.
Untuk informasi lebih lanjut tentang hook Initializer, lihat Configure the instance lifecycle.
Enabled
Timeout
Atur periode timeout untuk hook Initializer.
60
Prefetch Program Type
Anda dapat mengonfigurasi dua jenis hook Initializer untuk memanaskan model: Execute Instruction dan Invoke Code.
Execute Instruction
Instruction Content
Konfigurasikan isi instruksi yang akan dieksekusi. Anda dapat menggunakan implementasi shell kustom, seperti
/bin/bash,/bin/sh,/bin/csh, dan/bin/zsh. Pastikan lingkungan runtime fungsi mendukung shell yang dipilih.Permissions, Network, and Storage: Konfigurasikan role akses, pengaturan jaringan, dan mount storage fungsi.
Parameter
Description
Example
Function Role
Platform Function Compute menggunakan peran RAM ini untuk menghasilkan kunci sementara guna mengakses resource Alibaba Cloud dan meneruskannya ke kode. Untuk informasi lebih lanjut, lihat Use a function role to grant Function Compute permissions to access other Alibaba Cloud services.
mytestrole
Allow Access To VPC
Aktifkan ini untuk mengizinkan fungsi mengakses resource di VPC. Untuk informasi lebih lanjut, lihat Configure network settings.
Enabled
VPC
Wajib diisi jika Anda mengatur Allow Access To VPC ke Yes. Buat VPC baru atau pilih ID VPC dari daftar drop-down.
fc.auto.create.vpc.1632317****
VSwitch
Wajib diisi jika Anda mengatur Allow Access To VPC ke Yes. Buat vSwitch baru atau pilih ID vSwitch dari daftar drop-down.
fc.auto.create.vswitch.vpc-bp1p8248****
Security Group
Wajib diisi jika Anda mengatur Allow Access To VPC ke Yes. Buat grup keamanan baru atau pilih grup keamanan dari daftar drop-down.
fc.auto.create.SecurityGroup.vsw-bp15ftbbbbd****
Allow Default NIC To Access Public Network
Izinkan fungsi mengakses jaringan publik melalui network interface card default.
PentingSaat Anda menggunakan Alamat IP publik statis, Anda harus menonaktifkan Allow Default NIC To Access Public Network. Jika tidak, Alamat IP publik statis yang dikonfigurasi tidak berlaku. Untuk informasi lebih lanjut, lihat Configure a static public IP address.
Enabled
Mount NAS File System
Pasang sistem file NAS ke fungsi untuk penyimpanan persisten data bersama, seperti model yang digunakan bersama oleh beberapa fungsi inferensi. Untuk informasi lebih lanjut, lihat Configure a NAS file system.
Jika Anda memilih konfigurasi otomatis, sistem menggunakan sistem file NAS tujuan umum yang sudah ada bernama Alibaba-Fc-V3-Component-Generated. Jika tidak ada sistem file NAS yang memenuhi syarat di akun Anda, sistem akan membuatnya.
Enabled
Mount OSS Object Storage
Pasang Bucket OSS ke fungsi untuk penyimpanan persisten log, file bisnis, dan data lainnya. Untuk informasi lebih lanjut, lihat Configure Object Storage Service (OSS).
Enabled
Logs And Tracing Analysis
Parameter
Description
Example
Log Feature
Simpan log eksekusi fungsi secara persisten ke Simple Log Service. Ini membantu debugging kode, troubleshooting, dan analitik data. Untuk informasi lebih lanjut, lihat Configure the logging feature.
Automatic Configuration: Secara otomatis memilih proyek log yang dimulai dengan
serverless-<region_id>.Hanya satu proyek log semacam itu yang dibuat di setiap wilayah. Jika sistem menemukan bahwa proyek log ini sudah ada di wilayah saat ini, sistem menggunakan proyek yang sudah ada.
Custom Configuration: Tentukan secara manual Log Project dan Logstore tujuan.
Enabled
More Configurations
Parameter
Description
Example
Time Zone
Pilih zona waktu untuk fungsi. Ini secara otomatis menambahkan variabel lingkungan TZ ke fungsi dengan zona waktu yang dipilih sebagai nilainya.
UTC
Tags
Atur tag untuk fungsi agar dapat mengelompokkan dan mengelola fungsi. Anda harus mengatur kunci tag dan nilai tag.
key : value
Resource Group
Pilih resource group untuk fungsi. Gunakan kelompok sumber daya untuk mengelola fungsi Anda secara berkelompok.
Default Resource Group
Environment Variables
Gunakan variabel lingkungan untuk menyesuaikan perilaku fungsi secara fleksibel tanpa mengubah kode. Untuk informasi lebih lanjut, lihat Configure environment variables.
{ "BUCKET_NAME": "MY_BUCKET", "TABLE_NAME": "MY_TABLE" }
Edit a function
Setelah fungsi dibuat, Anda dapat mengubah gambarnya dengan mengedit runtime di tab Configuration pada halaman detail fungsi.

Untuk informasi tentang modifikasi lainnya, seperti mengubah variabel lingkungan atau pengaturan penyimpanan log, lihat Configure a function.
Delete a function
Masuk ke Function Compute console. Pada halaman Function List, temukan fungsi yang ingin dihapus dan klik Delete di kolom Actions. Pada kotak dialog yang muncul, pastikan fungsi tidak memiliki resource yang dilampirkan, seperti pemicu atau kebijakan elastis untuk jumlah minimum instans. Lalu, konfirmasi penghapusan.
Dapatkan ARN fungsi
Nama Sumber Daya Alibaba Cloud (ARN) digunakan untuk mengidentifikasi resource Alibaba Cloud dalam kode Anda. Anda dapat memperoleh ARN fungsi untuk mereferensikannya.
Masuk ke Function Compute console. Di panel navigasi sebelah kiri, pilih .
Di bilah menu atas, pilih wilayah. Lalu, pada halaman Function List, klik nama fungsi tersebut.
Pada halaman Function Details, klik Copy ARN di sebelah kanan untuk memperoleh ARN fungsi target.

Referensi
Function Compute menyediakan empat tipe fungsi untuk skenario berbeda: event functions, web functions, task functions, dan GPU functions. Untuk informasi tentang cara memilih tipe fungsi yang sesuai dengan skenario Anda, lihat Technology selection guide.
Selain konsol, Function Compute menyediakan API dan tool Serverless Devs untuk mengelola fungsi. Untuk informasi lebih lanjut, lihat CreateFunction dan Quick Start for Serverless Devs.
Jika eksekusi fungsi melebihi waktu, lihat What do I do if a "Function timeout" error occurs?.
Fungsi yang jarang dipanggil mungkin memiliki waktu pemanggilan lebih lama. Untuk informasi lebih lanjut tentang alasannya, lihat Why do infrequently used functions have long invocation times?. Untuk menghilangkan dampak latensi cold start, atur jumlah minimum instans menjadi 1 atau lebih.