全部产品
Search
文档中心

Function Compute:Buat fungsi GPU

更新时间:Dec 04, 2025

Anda dapat men-deploy aplikasi yang memerlukan instans yang dipercepat GPU sebagai fungsi menggunakan gambar kontainer. Pendekatan ini ideal untuk proyek AI populer, seperti Stable Diffusion WebUI, ComfyUI, Generasi yang Diperkaya dengan Pengambilan Data (RAG), dan TensorRT. Menggunakan gambar kontainer untuk mengirimkan fungsi meningkatkan efisiensi pengembangan dan pengiriman.

Buat fungsi

  1. Masuk ke Function Compute console. Di panel navigasi sebelah kiri, pilih Function Management > Function List.

  2. Di bilah menu atas, pilih wilayah. Pada halaman Function List, klik Create Function.

  3. Pada kotak dialog yang muncul, pilih GPU Function, lalu klik Create GPU Function.

  4. Pada halaman Create GPU Function, atur parameter berikut, lalu klik Create.

    • Basic Configurations: Masukkan Function Name. Nama harus unik dalam Akun Alibaba Cloud dan wilayah yang sama, serta mengikuti konvensi penamaan.

    • Elastic Configurations: Pilih tipe instans. Anda tidak dapat menggunakan instans yang disediakan dan instans sesuai permintaan secara bersamaan. Setelah fungsi dibuat, tipe instans tidak dapat diubah.

      • On-demand instances

        Configuration Item

        Description

        Example

        Instance Type

        Pilih On-demand Instance. Instans diskalakan secara otomatis berdasarkan volume permintaan dan dilepas saat tidak ada permintaan. Anda ditagih berdasarkan penggunaan aktual.

        On-demand Instance

        GPU Card Type

        Pilih tipe kartu GPU. Untuk informasi lebih lanjut tentang spesifikasi yang didukung oleh berbagai tipe kartu, lihat Instance types and specifications.

        Ada series

        Specifications

        Atur spesifikasi GPU Memory, vCPU, Memory, dan Disk untuk fungsi sesuai kebutuhan bisnis Anda. Setelah Anda mengatur spesifikasi, penggunaan setiap resource dihitung dengan mengalikan spesifikasi dengan durasi penggunaan. Untuk informasi lebih lanjut, lihat Billing overview.

        Catatan
        • Semua direktori pada disk dapat ditulis. Ruang disk bersifat shared.

        • Disk terikat pada siklus hidup instans fungsi dasar. Saat sistem mereklaim instans, data pada disk akan hilang. Jika Anda memerlukan penyimpanan persisten, Anda dapat memasang sistem file NAS atau Bucket OSS. Untuk informasi lebih lanjut, lihat Configure a NAS file system dan Configure Object Storage Service.

        • GPU Memory: 48 GB

        • vCPU: 8 vCPU

        • Memory: 64 GB

        • Disk: 512 MB (tidak ditagih, Function Compute menyediakan kuota gratis sebesar 10 GB ruang disk)

        Minimum Instances

        Jika bisnis Anda sensitif terhadap latensi, setelah memilih Elastic Instance, kami menyarankan Anda mengatur jumlah minimum instans menjadi 1 atau lebih untuk mengunci resource terlebih dahulu dan mengurangi latensi cold start.

        Catatan

        Setelah Anda mengatur Minimum Instances menjadi 1 atau lebih, jika tidak ada kebijakan elastis untuk jumlah minimum instans yang dikonfigurasi atau jika tidak ada kebijakan elastis yang aktif dalam suatu periode, jumlah minimum instans saat ini adalah nilai yang Anda tetapkan di sini.

        Jika beberapa kebijakan elastis dikonfigurasi, sistem menghitung Minimum Number Of Instances yang diperlukan saat setiap kebijakan dipicu. Sistem kemudian menggunakan nilai tertinggi di antara kebijakan yang aktif sebagai Minimum Number Of Instances saat ini.

        Untuk informasi lebih lanjut, lihat How is the current minimum number of instances calculated?.

        1

        Concurrency Per Instance

        Anda dapat mengonfigurasi beberapa permintaan konkuren untuk satu instans fungsi GPU. Artinya, satu instans dapat memproses beberapa permintaan secara bersamaan. Untuk informasi lebih lanjut, lihat Configure concurrency per instance.

      • Provisioned instances

        Configuration Item

        Description

        Example

        Instance Type

        Pilih Provisioned Instance. Instans dialokasikan ke fungsi dari kolam sumber daya yang telah dibeli sebelumnya.

        Instans yang disediakan direkomendasikan untuk skenario di mana biaya yang dapat diprediksi, latensi rendah, dan pemanfaatan resource tinggi penting untuk memastikan stabilitas bisnis.

        Provisioned Instance

        Provisioned Resource Pool

        Kolam sumber daya yang disediakan adalah kumpulan instans yang disediakan yang dapat dialokasikan ke fungsi target. Jika kapasitas kolam sumber daya yang disediakan tidak mencukupi, klik Scale-out di kolom Actions dan ikuti petunjuk di layar untuk memperluasnya. Untuk informasi lebih lanjut, lihat Provisioned resource pools (subscription).

        • Provisioned Resource Pool: fc-pool-****

        • GPU Card Type: Ada

        Specifications

        Atur spesifikasi GPU Memory, vCPU, Memory, dan Disk untuk fungsi sesuai kebutuhan bisnis Anda. Setelah Anda mengatur spesifikasi, penggunaan setiap resource dihitung dengan mengalikan spesifikasi dengan durasi penggunaan. Untuk informasi lebih lanjut, lihat Billing overview.

        Catatan
        • Semua direktori pada disk dapat ditulis. Ruang disk bersifat shared.

        • Disk terikat pada siklus hidup instans fungsi dasar. Saat sistem mereklaim instans, data pada disk akan hilang. Jika Anda memerlukan penyimpanan persisten, Anda dapat memasang sistem file NAS atau Bucket OSS. Untuk informasi lebih lanjut, lihat Configure a NAS file system dan Configure Object Storage Service.

        GPU Memory: 48 GB

        vCPU: 8 vCPU

        Memory: 64 GB

        Disk: 512 MB (tidak ditagih, Function Compute menyediakan kuota gratis sebesar 10 GB ruang disk)

        Number Of Provisioned Instances

        Alokasikan sejumlah instans yang disediakan ke fungsi target berdasarkan resource yang tersedia di kolam sumber daya yang disediakan.

        1

        Concurrency Per Instance

        Anda dapat mengonfigurasi beberapa permintaan konkuren untuk satu instans fungsi GPU. Artinya, satu instans dapat memproses beberapa permintaan secara bersamaan. Untuk informasi lebih lanjut, lihat Configure concurrency per instance.

        20

    • Function Code: Konfigurasikan lingkungan runtime dan kode fungsi.

      Configuration Item

      Description

      Example

      Runtime Environment

      • Use Sample Image: Pilih contoh gambar yang disediakan oleh Function Compute untuk men-deploy fungsi berbasis gambar dengan cepat. Pilih gambar target dari daftar gambar di bawah item konfigurasi Container Image.

      • Use Image from ACR: Di bawah item konfigurasi Container Image, klik Select Image From ACR. Di panel Select Container Image, pilih Container Registry instance dan ACR image repository yang telah dibuat. Lalu, temukan gambar target di area gambar di bawah ini dan klik Select di kolom Actions. Untuk informasi lebih lanjut, lihat Create a function that uses a custom image.

      Custom Image > Use Sample Image

      Container Image

      Pilih gambar target.

      SpringBoot Web Application Sample Image

      Startup Command

      Perintah startup untuk program. Jika Anda tidak mengonfigurasi perintah startup, Entrypoint/CMD dari gambar digunakan secara default.

      None

      Listener Port

      Port tempat server HTTP dalam kode Anda mendengarkan.

      9000

      Execution Timeout

      Atur periode timeout. Default Execution Timeout adalah 60 detik, dan maksimum 86400 detik.

      60

    • Instance Prefetch: Dalam skenario inferensi AI, Anda dapat mengonfigurasi instance prefetch untuk memanaskan model sebelumnya. Hal ini menghilangkan latensi cold start pada permintaan pertama.

      Configuration Item

      Description

      Example

      Instance Prefetch

      Instance Prefetch

      Konfigurasikan hook Initializer untuk memanaskan instans dan mengoptimalkan cold start. Hook menjalankan skrip tertentu atau memanggil antarmuka untuk memuat model setelah instans fungsi dimulai tetapi sebelum memproses permintaan.

      Untuk informasi lebih lanjut tentang hook Initializer, lihat Configure the instance lifecycle.

      Enabled

      Timeout

      Atur periode timeout untuk hook Initializer.

      60

      Prefetch Program Type

      Anda dapat mengonfigurasi dua jenis hook Initializer untuk memanaskan model: Execute Instruction dan Invoke Code.

      Execute Instruction

      Instruction Content

      Konfigurasikan isi instruksi yang akan dieksekusi. Anda dapat menggunakan implementasi shell kustom, seperti /bin/bash, /bin/sh, /bin/csh, dan /bin/zsh. Pastikan lingkungan runtime fungsi mendukung shell yang dipilih.

      Lihat Callback method implementation

    • Permissions, Network, and Storage: Konfigurasikan role akses, pengaturan jaringan, dan mount storage fungsi.

      Parameter

      Description

      Example

      Function Role

      Platform Function Compute menggunakan peran RAM ini untuk menghasilkan kunci sementara guna mengakses resource Alibaba Cloud dan meneruskannya ke kode. Untuk informasi lebih lanjut, lihat Use a function role to grant Function Compute permissions to access other Alibaba Cloud services.

      mytestrole

      Allow Access To VPC

      Aktifkan ini untuk mengizinkan fungsi mengakses resource di VPC. Untuk informasi lebih lanjut, lihat Configure network settings.

      Enabled

      VPC

      Wajib diisi jika Anda mengatur Allow Access To VPC ke Yes. Buat VPC baru atau pilih ID VPC dari daftar drop-down.

      fc.auto.create.vpc.1632317****

      VSwitch

      Wajib diisi jika Anda mengatur Allow Access To VPC ke Yes. Buat vSwitch baru atau pilih ID vSwitch dari daftar drop-down.

      fc.auto.create.vswitch.vpc-bp1p8248****

      Security Group

      Wajib diisi jika Anda mengatur Allow Access To VPC ke Yes. Buat grup keamanan baru atau pilih grup keamanan dari daftar drop-down.

      fc.auto.create.SecurityGroup.vsw-bp15ftbbbbd****

      Allow Default NIC To Access Public Network

      Izinkan fungsi mengakses jaringan publik melalui network interface card default.

      Penting

      Saat Anda menggunakan Alamat IP publik statis, Anda harus menonaktifkan Allow Default NIC To Access Public Network. Jika tidak, Alamat IP publik statis yang dikonfigurasi tidak berlaku. Untuk informasi lebih lanjut, lihat Configure a static public IP address.

      Enabled

      Mount NAS File System

      Pasang sistem file NAS ke fungsi untuk penyimpanan persisten data bersama, seperti model yang digunakan bersama oleh beberapa fungsi inferensi. Untuk informasi lebih lanjut, lihat Configure a NAS file system.

      Jika Anda memilih konfigurasi otomatis, sistem menggunakan sistem file NAS tujuan umum yang sudah ada bernama Alibaba-Fc-V3-Component-Generated. Jika tidak ada sistem file NAS yang memenuhi syarat di akun Anda, sistem akan membuatnya.

      Enabled

      Mount OSS Object Storage

      Pasang Bucket OSS ke fungsi untuk penyimpanan persisten log, file bisnis, dan data lainnya. Untuk informasi lebih lanjut, lihat Configure Object Storage Service (OSS).

      Enabled

    • Logs And Tracing Analysis

      Parameter

      Description

      Example

      Log Feature

      Simpan log eksekusi fungsi secara persisten ke Simple Log Service. Ini membantu debugging kode, troubleshooting, dan analitik data. Untuk informasi lebih lanjut, lihat Configure the logging feature.

      • Automatic Configuration: Secara otomatis memilih proyek log yang dimulai dengan serverless-<region_id>.

        Hanya satu proyek log semacam itu yang dibuat di setiap wilayah. Jika sistem menemukan bahwa proyek log ini sudah ada di wilayah saat ini, sistem menggunakan proyek yang sudah ada.

      • Custom Configuration: Tentukan secara manual Log Project dan Logstore tujuan.

      Enabled

    • More Configurations

      Parameter

      Description

      Example

      Time Zone

      Pilih zona waktu untuk fungsi. Ini secara otomatis menambahkan variabel lingkungan TZ ke fungsi dengan zona waktu yang dipilih sebagai nilainya.

      UTC

      Tags

      Atur tag untuk fungsi agar dapat mengelompokkan dan mengelola fungsi. Anda harus mengatur kunci tag dan nilai tag.

      key : value

      Resource Group

      Pilih resource group untuk fungsi. Gunakan kelompok sumber daya untuk mengelola fungsi Anda secara berkelompok.

      Default Resource Group

      Environment Variables

      Gunakan variabel lingkungan untuk menyesuaikan perilaku fungsi secara fleksibel tanpa mengubah kode. Untuk informasi lebih lanjut, lihat Configure environment variables.

      {
          "BUCKET_NAME": "MY_BUCKET",
          "TABLE_NAME": "MY_TABLE"
      }

Edit a function

Setelah fungsi dibuat, Anda dapat mengubah gambarnya dengan mengedit runtime di tab Configuration pada halaman detail fungsi.

image

Untuk informasi tentang modifikasi lainnya, seperti mengubah variabel lingkungan atau pengaturan penyimpanan log, lihat Configure a function.

Delete a function

Masuk ke Function Compute console. Pada halaman Function List, temukan fungsi yang ingin dihapus dan klik Delete di kolom Actions. Pada kotak dialog yang muncul, pastikan fungsi tidak memiliki resource yang dilampirkan, seperti pemicu atau kebijakan elastis untuk jumlah minimum instans. Lalu, konfirmasi penghapusan.

Dapatkan ARN fungsi

Nama Sumber Daya Alibaba Cloud (ARN) digunakan untuk mengidentifikasi resource Alibaba Cloud dalam kode Anda. Anda dapat memperoleh ARN fungsi untuk mereferensikannya.

  1. Masuk ke Function Compute console. Di panel navigasi sebelah kiri, pilih Function Management > Function List.

  2. Di bilah menu atas, pilih wilayah. Lalu, pada halaman Function List, klik nama fungsi tersebut.

  3. Pada halaman Function Details, klik Copy ARN di sebelah kanan untuk memperoleh ARN fungsi target.

    image

Referensi