Topik ini menjelaskan cara melihat metrik pemantauan dari instans yang dipercepat GPU dan mengonfigurasi kebijakan penskalaan otomatis berdasarkan metrik sumber daya yang berbeda.
Latar Belakang
Pemanfaatan sumber daya perangkat keras GPU bervariasi tergantung pada skenario, seperti Pelatihan model, Inferensi AI, dan Transkoding audio-video. Function Compute menyediakan fitur penskalaan otomatis untuk instans yang dipercepat GPU berdasarkan pemanfaatan sumber daya GPU, termasuk multiprosesor streaming (SM), Memori GPU, decoder perangkat keras, dan penyandi perangkat keras.
Anda dapat mengonfigurasi kebijakan penskalaan otomatis untuk instans yang disediakan di Function Compute menggunakan modifikasi pengaturan terjadwal atau berbasis metrik. Untuk instans yang dipercepat GPU, hanya modifikasi pengaturan berbasis metrik yang dapat digunakan. Informasi lebih lanjut tersedia di bagian "Modifikasi Pengaturan Berbasis Metrik" dalam Konfigurasikan Instans yang Disediakan dan Aturan Penskalaan Otomatis.
Lihat metrik instans yang dipercepat GPU
Setelah fungsi GPU dieksekusi, Anda dapat melihat penggunaan sumber daya instans yang dipercepat GPU di Function Compute console.
Masuk ke Konsol Function Compute. Di panel navigasi kiri, pilih .
Di bilah navigasi atas, pilih wilayah. Dalam daftar layanan, klik nama layanan yang diinginkan.
- Dalam daftar fungsi dasbor pemantauan, klik nama fungsi yang diinginkan.
- Pada halaman dasbor pemantauan, klik tab Instance Metrics.Anda dapat memeriksa penggunaan sumber daya instans yang dipercepat GPU dengan melihat metrik berikut: GPU-accelerated Memory Usage (Percentage), GPU-accelerated SM Usage (Percentage), GPU-accelerated Hardware Encoder Usage (Percentage), dan GPU-accelerated Hardware Decoder Usage (Percentage).
Konfigurasikan kebijakan penskalaan otomatis
Metrik untuk penggunaan sumber daya GPU
| Metrik | Deskripsi | Rentang nilai |
| GPUSmUtilization | Pemanfaatan SM GPU | [0, 1]. Tingkat pemanfaatan berkisar dari 0% hingga 100%. |
| GPUMemoryUtilization | Penggunaan memori GPU | [0, 1]. Tingkat pemanfaatan berkisar dari 0% hingga 100%. |
| GPUDecoderUtilization | Pemanfaatan decoder perangkat keras GPU | [0, 1]. Tingkat pemanfaatan berkisar dari 0% hingga 100%. |
| GPUEncoderUtilization | Pemanfaatan penyandi perangkat keras GPU | [0, 1]. Tingkat pemanfaatan berkisar dari 0% hingga 100%. |
Konfigurasikan kebijakan penskalaan otomatis di Konsol Function Compute
Masuk ke Konsol Function Compute. Di panel navigasi kiri, klik Services & Functions.
Di bilah navigasi atas, pilih wilayah. Pada halaman Services, klik layanan yang diinginkan.
Pada halaman Functions, klik nama fungsi yang diinginkan. Pada halaman Detail Fungsi yang muncul, klik tab Auto Scaling.
- Pada halaman Detail Fungsi, klik tab Auto Scaling dan klik Create Rule.
- Pada halaman yang muncul, konfigurasikan parameter berikut dan klik Create.
- Konfigurasikan versi dan jumlah minimum instans. Pertahankan nilai default untuk parameter lainnya.

- Di bagian Metric-based Setting Modification, klik + Add Configuration dan konfigurasikan kebijakan.Contoh:

Setelah konfigurasi selesai, Anda dapat memilih untuk melihat perubahan Function Provisioned Instances. - Konfigurasikan versi dan jumlah minimum instans. Pertahankan nilai default untuk parameter lainnya.
Konfigurasikan kebijakan penskalaan otomatis menggunakan Serverless Devs
- Fungsi GPU telah diterapkan. Untuk informasi lebih lanjut, lihat Panggil Fungsi GPU Berdasarkan Tugas Asinkron.
- Buat direktori proyek.
mkdir fc-gpu-async-job&&cd fc-gpu-async-job - Di direktori proyek, buat file yang berisi kebijakan penskalaan otomatis, seperti gpu-sm-hpa-policy.json.Contoh:
{ "target": 1, "targetTrackingPolicies": [ {"name":"hpa_gpu_decoder_util","startTime":"2022-09-05T16:00:00.000Z","endTime":"2023-07-06T16:00:00.000Z","metricType":"GPUSmUtilization","metricTarget":0.01,"minCapacity":1,"maxCapacity":20} ] } - Di direktori proyek, jalankan perintah berikut untuk menambahkan kebijakan penskalaan otomatis ke fungsi yang diinginkan:
s cli fc provision put --region ${region} --service-name ${service-name} --function-name ${function-name} --qualifier LATEST --config gpu-sm-hpa-policy.json - Jalankan perintah berikut untuk melihat kebijakan penskalaan otomatis:
s cli fc provision get --region ${region} --service-name ${service-name} --function-name ${function-name} --qualifier LATESTJika perintah berhasil dijalankan, hasil berikut dikembalikan:[2022-10-08 16:00:12] [INFO] [FC] - Getting provision: zh****.LATEST/zh**** serviceName: zh**** functionName: zh**** qualifier: LATEST resource: 164901546557****#zh****#LATEST#zh**** target: 1 current: 1 scheduledActions: null targetTrackingPolicies: - name: hpa_gpu_decoder_util startTime: 2022-09-05T16:00:00.000Z endTime: 2023-07-06T16:00:00.000Z metricType: GPUSmUtilization metricTarget: 0.01 minCapacity: 1 maxCapacity: 20 currentError: alwaysAllocateCPU: true
Referensi
Untuk memodifikasi sensitivitas penskalaan otomatis, bergabunglah dengan grup DingTalk untuk menghubungi dukungan teknis Function Compute.