全部产品
Search
文档中心

Platform For AI:Uji stres layanan

更新时间:Jan 06, 2026

Elastic Algorithm Service (EAS) menyediakan pengujian stres untuk layanan model bahasa besar (LLM) dan layanan tujuan umum. Anda dapat membuat serta menjalankan pengujian stres hanya dengan beberapa klik untuk memahami lebih baik kinerja layanan EAS Anda. Topik ini menjelaskan cara membuat dan mengelola tugas pengujian stres.

Langkah 1: Pergi ke halaman Buat Tugas Pengujian Stres

  1. Masuk ke Konsol PAI. Di bilah navigasi atas, pilih wilayah target. Di sisi kanan halaman, pilih ruang kerja yang diinginkan, lalu klik Enter EAS.

  2. Di tab Stress Testing Task, klik Add Stress Testing Task.

Langkah 2: Buat tugas pengujian stres

Pengujian stres layanan LLM

Jika layanan EAS Anda merupakan layanan LLM, centang kotak LLM Service untuk menghasilkan laporan pengujian stres yang disesuaikan dengan skenario LLM.

Anda hanya dapat membuat tugas pengujian stres untuk layanan LLM melalui konsol. Operasi ini tidak didukung oleh client EASCMD.

Penting

Pengujian stres layanan LLM hanya mendukung dua operasi API OpenAI berikut: /v1/completions dan /v1/chat/completions. Oleh karena itu, fitur pengujian stres layanan LLM hanya dapat digunakan untuk layanan EAS yang dideploy menggunakan mesin inferensi yang kompatibel dengan operasi API OpenAI, seperti vLLM, SGLang, LMDeploy, dan BladeLLM.

Di halaman Add Stress Testing Task, konfigurasikan parameter berikut, lalu klik OK.

Informasi Dasar

image

Parameter

Description

Service

Pilih layanan yang ingin Anda uji stresnya dan pilih LLM Service.

Service API

Hanya dua operasi API OpenAI berikut yang didukung:

  • Completions: Operasi API permintaan adalah /v1/completions. API ini digunakan untuk tugas penyelesaian satu putaran.

  • Chat: Operasi API permintaan adalah /v1/chat/completions. API ini digunakan untuk tugas percakapan multi-putaran.

Stress Testing URL

Setelah Anda memilih Service API, sistem secara otomatis mengonfigurasi URL pemanggilan layanan.

Model ID

Wajib diisi. Masukkan ID model resmi dari komunitas open source ModelScope atau Hugging Face. Contoh: Qwen/Qwen2.5-7B-Instruct.

  • Anda dapat memuat tokenizer yang sesuai untuk menghitung jumlah token secara akurat selama pengujian stres.

  • ID model digunakan sebagai parameter model dalam permintaan jika nama model tidak ditentukan.

Model Name

Opsional. Nama model digunakan untuk membangun parameter model dalam permintaan. Parameter ini memiliki prioritas lebih tinggi daripada Model ID. Jika Anda tidak mengisi parameter ini, Model ID akan digunakan sebagai parameter permintaan.

  • Anda tidak perlu mengonfigurasi nama model dalam skenario berikut:

    • Layanan LLM dideploy menggunakan mesin inferensi BladeLLM.

    • Layanan LLM dideploy menggunakan mesin inferensi vLLM, SGLang, atau LMDeploy, dan parameter model dalam permintaan adalah Model ID.

  • Anda harus mengonfigurasi nama model dalam skenario berikut:

    Layanan LLM dideploy menggunakan mesin inferensi vLLM, SGLang, atau LMDeploy, dan parameter model dalam permintaan bukan Model ID. Misalnya, parameternya adalah path lokal model, atau Anda menentukan parameter --served-model-name saat memulai layanan vLLM.

Jenis Data dan Parameter Terkait

Data Type

Pengaturan parameter

Public Dataset

Menggunakan dataset ShareGPT publik untuk pengujian stres. Dataset ini berisi banyak catatan percakapan dan dapat digunakan untuk mengevaluasi kinerja layanan LLM. Konfigurasikan parameter berikut:

  • Dataset: Hanya ShareGPT yang didukung.

  • Output Length: Mengontrol panjang teks yang dihasilkan. Jika Anda tidak mengisi parameter ini, output tidak dipotong. Dengan mengonfigurasi panjang output, Anda dapat menguji stabilitas dan kinerja layanan LLM di bawah beban berbeda.

Custom Dataset

Konfigurasikan dataset kustom berdasarkan skenario spesifik Anda.

Penting

Data permintaan untuk pengujian stres LLM harus menyertakan parameter "stream": true untuk membangun permintaan streaming. Ini diperlukan untuk mengumpulkan metrik terkait token seperti time to first token (TTFT) dan time per output token (TPOT).

  • Data Source: Anda dapat mengunggah file data kustom dari sumber berikut untuk pengujian stres:

    • Single Data: Di kotak teks Single Data, masukkan satu data permintaan pengujian stres. Data tersebut harus berupa string yang dienkripsi Base64.

    • Data Address: Di kotak teks Data Address, masukkan path HTTP dari sumber data uji. Anda dapat menentukan satu file atau file .zip. File .zip akan secara otomatis didekompresi setelah diunduh.

    • OSS File: Dapatkan file pengujian stres dengan mengonfigurasi path Object Storage Service (OSS).

    • Local Upload: Ikuti petunjuk di konsol untuk mengunggah file pengujian stres lokal ke path OSS. File tersebut kemudian diambil dari OSS.

  • Split Data in File by Line: Parameter ini tersedia jika Anda mengatur Data Source ke Data Address, OSS File, atau Local Upload. Jika Anda mengaktifkan sakelar ini, file pengujian stres yang diunggah akan dipisah per baris. Setiap baris digunakan sebagai satu data pengujian stres. Jika tidak, seluruh isi file digunakan sebagai satu data pengujian stres.

    Catatan

    Untuk contoh konfigurasi file pengujian stres, lihat benchmark_demo.json. Setiap data dalam file tersebut merupakan permintaan pengguna aktual dalam format JSON. Kami menyarankan Anda terlebih dahulu menggunakan fitur debugging online untuk memastikan format permintaan tunggal sudah benar.

Analog Data

  • Data Generation Mode: Hanya Uniform Distribution yang didukung.

  • Input Token Count: Rentang panjang token input. Nilai minimum adalah 10 dan nilai maksimum adalah 10000. Nilai default adalah 1024.

  • Output Token Count: Rentang panjang token output. Nilai minimum adalah 10 dan nilai maksimum adalah 10000. Nilai default adalah 128.

Mode Pengujian dan Parameter Terkait

Mode pengujian berikut didukung:

  • Fixed Concurrency Test: Menggunakan jumlah pengguna konkuren tetap untuk menguji kinerja sistem pada tingkat konkurensi tertentu.

  • Fixed Request Rate Test: Menetapkan laju permintaan tetap untuk menguji kinerja sistem.

  • Extreme Throughput Test: Menentukan Request Rate (QPS) maksimum yang dapat ditangani oleh layanan inferensi dengan mengirimkan banyak permintaan konkuren. Pengujian ini digunakan untuk mengevaluasi kapasitas maksimum sistem.

Dalam mode Fixed Concurrency Test dan Fixed Request Rate Test, Anda dapat mengaktifkan Continuous Stress Testing.

  • Jika Anda mengaktifkan Continuous Stress Testing, tugas akan berjalan sepanjang durasi pengujian stres, terlepas dari Number of Request Samples.

  • Jika Anda menonaktifkan Continuous Stress Testing, tugas akan berhenti ketika Number of Request Samples yang ditentukan tercapai atau Maximum Stress Testing Duration berakhir.

Pengaturan parameter untuk mode pengujian berbeda adalah sebagai berikut:

Mode uji

Pengaturan parameter

Fixed Concurrency Test

  • Concurrency: Jumlah pengguna konkuren yang akan disimulasikan. Nilai yang valid: 1 hingga 200.

  • Maximum Stress Testing Duration (s): Durasi uji stres dalam detik. Nilai default adalah 300. Nilai minimum adalah 30.

  • Number of Request Samples: Anda tidak perlu mengatur parameter ini jika mengaktifkan Continuous Stress Testing. Parameter ini menentukan jumlah permintaan yang dikirim selama uji stres. Nilai yang valid: 100 hingga 1000.

Fixed Request Rate Test

Mengatur laju permintaan tetap. Mode ini cocok untuk menguji performa sistem pada laju permintaan tertentu.

  • Request Rate: Jumlah permintaan yang dikirim per detik.

  • Maximum Concurrency: Jumlah pengguna konkuren yang akan disimulasikan.

  • Maximum Stress Testing Duration (s): Durasi uji stres dalam detik. Nilai default adalah 300. Nilai minimum adalah 30.

  • Number of Request Samples: Anda tidak perlu mengatur parameter ini jika mengaktifkan Continuous Stress Testing. Parameter ini menentukan jumlah permintaan yang dikirim selama uji stres. Nilai yang valid: 100 hingga 1000.

Extreme Throughput Test

  • Maximum Stress Testing Duration (s): Durasi uji stres dalam detik. Nilai default adalah 300. Nilai minimum adalah 30.

  • Number of Request Samples: Jumlah permintaan yang dikirim selama uji stres. Nilai yang valid: 100 hingga 1000.

Konfigurasi Lainnya

Parameter

Description

HTTP Header

Formatnya adalah pasangan kunci-nilai. Contohnya:

  • Kirim informasi autentikasi: Authorization: EAS_TOKEN

  • Menetapkan format data badan permintaan: Content-Type: application/json

Burstiness

  • Nilai default: 1. Granularitas data: 0,1. Rentang data: 0,1 hingga 200.

  • Burstiness mengontrol pola distribusi waktu pembuatan permintaan dan hanya berlaku dalam mode fixed request rate. Nilai default 1 mengikuti distribusi Poisson. Nilai lain mengikuti distribusi gamma. Nilai yang lebih kecil menunjukkan aliran permintaan yang lebih bursty. Nilai yang lebih besar menunjukkan aliran permintaan yang lebih seragam.

Random Seed

Nilai default: 0. Tipe data: integer. Rentang nilai: 0 hingga 4294967295 (2^32 - 1).

Ignore EOS

Mengaktifkan Ignore EOS berarti model mengabaikan token end-of-sequence (EOS) saat menghasilkan teks. Ini memaksa model untuk menghasilkan teks hingga panjang generasi maksimum yang telah ditentukan tercapai.

Pengujian stres layanan tujuan umum

Pengujian stres untuk layanan tujuan umum mendukung tiga mode berikut:

  • auto mode: Controller VPC eas-benchmark secara otomatis membuat worker agent untuk pengujian stres, menetapkan konkurensi yang sesuai, dan menggunakan algoritma auto-tuning untuk menentukan kapasitas maksimum layanan.

  • scan mode: Beban ditingkatkan secara dinamis berdasarkan parameter yang Anda tentukan, seperti QPS awal (minQPS), QPS maksimum (maxQPS), interval pertumbuhan QPS (adjustInterval), dan ukuran langkah pertumbuhan QPS (qpsGrowthDelta). Pengujian berhenti ketika layanan mencapai maxRT atau maxQPS yang ditentukan, atau ketika jumlah error melebihi ambang batas toleransi kesalahan (faultTolerate).

  • manual mode: Jumlah agent pengujian stres dan konkurensi setiap agent bersifat tetap. Anda dapat menyesuaikan jumlah agent dan konkurensinya secara dinamis selama pengujian stres.

Konsol hanya mendukung mode auto. Client EASCMD mendukung mode auto, scan, dan manual. Bagian berikut menjelaskan cara menggunakannya.

Gunakan konsol

Catatan

Konsol pengujian stres membatasi timeout permintaan hingga 20 detik. Jika kode return 512 muncul dalam laporan pengujian stres, kemungkinan besar disebabkan oleh timeout permintaan. Konsol pengujian stres EAS tidak mendukung konfigurasi timeout kustom.

Di halaman Add Stress Testing Task, konfigurasikan parameter berikut, lalu klik OK.

image

Parameter

Deskripsi

Basic Information

Service

Pilih layanan yang ingin Anda uji stresnya.

Stress Testing URL

URL pemanggilan layanan.

Stress Testing Configuration

Data Source

Konfigurasikan data pengujian stres menggunakan Single Data, Data Address, OSS File, atau Local Upload. Untuk informasi lebih lanjut tentang cara membangun data pengujian stres dan jenis file yang didukung, lihat Lampiran 1: Data pengujian stres.

Catatan
  • Satu data permintaan uji stres harus berupa string yang dikodekan dalam Base64.

  • File pengujian stres dapat berupa file tunggal atau file .zip. File .zip akan secara otomatis didekompresi setelah diunduh.

Split Data in File by Line

Parameter ini tersedia jika Anda mengatur Data Source ke Data Address, OSS File, atau Local Upload.

Jika Anda mengaktifkan sakelar ini, file pengujian stres yang diunggah akan dipisah per baris. Setiap baris digunakan sebagai satu data pengujian stres. Jika tidak, seluruh isi file digunakan sebagai satu data pengujian stres.

Maximum Stress Testing Duration (s)

Durasi pengujian stres dalam detik. Nilai default adalah 300 detik.

Maximum Stress Testing QPS

QPS maksimum, yaitu laju permintaan yang dikirim per detik. Nilai default adalah 10000.

Maximum Stress Testing RT (ms)

Waktu respons (RT) maksimum dalam milidetik. Jika ambang batas ini terlampaui, QPS akan disesuaikan secara otomatis hingga RT waktu nyata memenuhi ekspektasi.

HTTP Header

Konfigurasi header permintaan dalam pasangan kunci-nilai. Contohnya:

  • Kirim informasi autentikasi: Authorization: EAS_TOKEN

  • Setel format data badan permintaan: Content-Type: application/json

Gunakan klien EASCMD

Jalankan perintah bench create untuk membuat tugas pengujian stres. Untuk informasi lebih lanjut tentang cara login ke client EASCMD, lihat Unduh dan autentikasi client. Setelah tugas dibuat, Anda dapat melihat data pemantauan waktu nyata menggunakan URL yang dikembalikan dalam output. Contoh berikut menunjukkan format perintah untuk sistem Windows 64-bit.

eascmdwin64.exe bench create [bench_desc_json]

Parameter bench_desc_json menentukan file JSON yang berisi informasi tentang tugas pengujian stres. Kode berikut memberikan beberapa contoh.

Data Permintaan Pengujian Stres Tunggal

{
    "service": {
        "serviceName": "xgb_test"
    },
    "data": {
        "content": "W1sxLDAsMCwwLDEsMSwwLDEsMCwxLDEsMCwwLDEsMCwxLDAsMSwwLDAsMSwxLDEsMCwxLDEsMCwwLDAsMSwxLDEsMCwxLDEsMSwxLDAsMSwxLDEsMCwxLDAsMCwwLDEsMSwwLDAsMCwxLDAsMSwwLDEsMCwwLDEsMCwwLDEsMCwxLDAsMCwxLDAsMCwwLDAsMSwwLDEsMCwxLDAsMCwxLDEsMSwwLDAsMSwwLDAsMCwwLDEsMSwxLDAsMSwxLDAsMCwxLDAsMSwwLDEsMSwxLDEsMCwxLDAsMCwxLDEsMSwxLDAsMCwwLDEsMSwwXV0K"
    }
}
                

Data Pengujian Stres File OSS

Gunakan parameter path untuk menentukan beberapa file OSS sebagai data pengujian stres.

Untuk mengonfigurasi beberapa entri data pengujian stres dalam batch, kemas data permintaan ke dalam file .zip dan atur parameter path ke oss://XX.zip.

{
    "service": {
        "serviceName": "xgb_test"
    },
    "data": {
        "path": "oss://examplebucket/test1.bin,oss://examplebucket/test2.bin"
    }
}
                

Untuk informasi lebih lanjut tentang parameter JSON, lihat Lampiran 3: Parameter konfigurasi JSON untuk pengujian stres.

Berikut ini adalah contoh output sistem.

[RequestId]: DE240637-4976-59AF-A28C-BAA55C0A****
[OK] Tugas [benchmark-xgb-test-b514] sedang dibuat
[OK] [Agnet: 0/1]: Berhasil memulai benchmark master
[OK] [Agnet: 0/1]: Berhasil memulai benchmark master
[OK] [Agnet: 1/1]: Tugas benchmark sedang berjalan
[OK] Tugas benchmark sedang berjalan
[OK] Klik tautan http://127.0.0.1:18222/eas-benchmark/statsview untuk mengamati detail visualisasi secara real-time, Anda dapat mematikannya dengan CTRL+C.
Mematikan tidak akan mengganggu tugas pengujian benchmark, dan Anda dapat membukanya kembali dengan perintah visualize:
eascmd -c [config_file] bench visualize benchmark-xgb-test-b514

Langkah 3: Lihat detail pengujian stres

Lihat data pemantauan real-time

Saat Status tugas pengujian stres adalah Running, klik nama tugas untuk melihat data pemantauan waktu nyata.image

Lihat laporan pengujian stres

Saat Status tugas pengujian stres adalah Completed, klik nama tugas untuk melihat laporan pengujian stres.

Laporan pengujian stres mencakup Basic Information, Stress Testing Configuration, Test Results, dan Stress Testing Task Monitoring. Tabel berikut menjelaskan metrik pemantauan untuk tugas pengujian stres.

  • Metrik pemantauan yang hanya didukung untuk layanan LLM

    TTFT (Time To First Token)

    Latensi token pertama dalam respons. Metrik ini mengukur waktu dari saat permintaan dikirim hingga token pertama diterima dari layanan.

    image

    TPOT (Time per Output Token)

    Latensi setiap token berikutnya dalam respons. Metrik ini mengukur interval waktu antara dua token berturut-turut yang dihasilkan oleh layanan.

    image

    TPS (Token Per Second)

    Jumlah token yang ditransmisikan per detik.

    image

  • Metrik pemantauan yang didukung untuk semua layanan

    Requests per second distribution

    Distribusi jumlah permintaan yang diterima layanan per detik.

    image

    Response time distribution

    Distribusi jumlah respons yang dikembalikan layanan dalam rentang waktu yang dipilih.

    image

    Traffic distribution

    Distribusi volume data permintaan yang dikirim dari klien ke layanan dan respons yang dikembalikan layanan ke klien dalam rentang waktu yang dipilih.

    image

    Response time range distribution

    Proporsi waktu respons yang dikembalikan layanan dalam rentang berbeda, dalam milidetik.

    image

    Overall response time distribution

    Latensi end-to-end permintaan pada kuantil berbeda, dalam milidetik.

    image

    Return status code distribution

    Distribusi kode status yang dikembalikan layanan.

    image

Langkah 4: Kelola tugas pengujian stres

Kelola tugas pengujian stres di konsol

Di tab Stress Testing Task, Anda dapat melihat daftar tugas pengujian stres yang telah dibuat dan melakukan operasi seperti Start, Clone, Copy Report, dan Delete.

image

Kelola tugas pengujian stres menggunakan client EASCMD

  • Lihat daftar tugas pengujian stres

    Jalankan perintah bench list untuk melihat daftar tugas pengujian stres yang dibuat oleh pengguna saat ini. Contoh berikut menunjukkan format perintah untuk sistem Windows 64-bit.

    eascmdwin64.exe bench ls

    Contoh berikut menunjukkan output sistem.

    [RequestId]: 7F953F8E-8897-5785-808A-CA648302****
    +-------------------------+--------------------------+-------------+----------------+---------+---------------------+
    |        TASKNAME         |          TASKID          |   REGION    | AVAILABLEAGENT | STATUS  |     CREATETIME      |
    +-------------------------+--------------------------+-------------+----------------+---------+---------------------+
    | benchmark-***-test-**** | eas-b-ql470xog6qeh25**** | cn-shanghai |              0 | Stopped | 2022-06-17 17:58:01 |
    | benchmark-***-test-**** | eas-b-bdnzvwq0z0h3xq**** | cn-shanghai |              2 | Running | 2022-06-20 12:18:54 |
    +-------------------------+--------------------------+-------------+----------------+---------+---------------------+
  • Lihat detail tugas pengujian stres

    Jalankan perintah bench desc untuk melihat detail tugas pengujian stres tertentu. Contoh berikut menunjukkan format perintah untuk sistem Windows 64-bit.

    eascmdwin64.exe bench desc [benchmark_task_name]

    Ganti [benchmark_task_name] dengan nama tugas pengujian stres.

    Berikut ini adalah contoh output sistem.

    +----------------+------------------------------------------------------------------------------+
    |     TaskName   | benchmark-***-test-b514                                                      |
    |     TaskId     | eas-b-bdnzvwq0z0h3xq****                                                     |
    |    ServiceName | xgb_test                                                                     |
    |         Region | cn-shanghai                                                                  |
    |   DesiredAgent | 2                                                                            |
    | AvailableAgent | 2                                                                            |
    |         Status | Running                                                                      |
    |        Message | Benchmark task is running                                                    |
    |     CreateTime | 2021-10-20 12:38:35                                                          |
    |     UpdateTime | 2021-10-20 12:38:45                                                          |
    |         Config | {                                                                            |
    |                |   "base": {                                                                  |
    |                |     "agentCount": 2,                                                         |
    |                |     "concurrency": 40,                                                       |
    |                |     "duration": 1200,                                                        |
    |                |     "requestCount":                                                          |
    |                | 922337203685477****,                                                         |
    |                |   },                                                                         |
    |                |  ...                                                                         |
    |                | }                                                                            |
    +----------------+------------------------------------------------------------------------------+
  • Aktifkan visualisasi real-time untuk tugas pengujian stres

    Jalankan perintah bench visualize untuk mengaktifkan fitur visualisasi waktu nyata untuk tugas pengujian stres. Setelah perintah ini dijalankan, server web dimulai di mesin lokal pada 127.0.0.1 untuk menampilkan halaman pemantauan waktu nyata. Contoh berikut menunjukkan format perintah untuk sistem Windows 64-bit.

    eascmdwin64.exe bench visualize [benchmark_task_name]

    Ganti [benchmark_task_name] dengan nama tugas pengujian stres.

    Contoh keluaran:

    [OK] Click the link http://127.0.0.1:18734/eas-benchmark/statsview to observe realtime visualization details, you can turn it off with CTRL+C.
    Turning off will not interrupt the benchmark test task, and you can reopen it by the visualize command:
    eascmd -c [config_file] bench visualize benchmark-xgb-test-b514

    Buka tautan http://127.0.0.1:18734/eas-benchmark/statsview di browser untuk melihat data waktu nyata.

  • Dapatkan laporan pengujian stres

    Ketika status tugas pengujian stres berubah menjadi Stopped, tugas tersebut selesai. Laporan pengujian stres disimpan ke OSS. Anda dapat menjalankan perintah bench report untuk mendapatkan laporan pengujian stres. Contoh berikut menunjukkan format perintah untuk sistem Windows 64-bit.

    eascmdwin64.exe  bench report [benchmark_task_name]

    Ganti [benchmark_task_name] dengan nama tugas pengujian stres.

    Berikut ini adalah contoh output sistem.

    [OK] Benchmark task benchmark-demo-test-c7eb report url: http://eas-benchmark.oss-cn-chengdu.aliyuncs.com/summary/benchmark-demo-test-c7eb-10004.html

    Buka tautan yang mengikuti url di browser untuk melihat laporan pengujian stres. Gambar berikut menunjukkan contoh laporan.image.png

  • Ubah secara dinamis jumlah instans klien dan konkurensi

    Ketika mode pengujian stres adalah manual, Anda harus menggunakan perintah bench update untuk mengubah secara dinamis jumlah instans klien dan konkurensi. Contoh berikut menunjukkan format perintah untuk sistem Windows 64-bit.

    eascmdwin64.exe bench update [benchmark_task_name] -Doptional.concurrency=<attr_value> -Doptional.agentCount=<attr_value>

    Ganti <attr_value> dengan nilai spesifik. Kode berikut menunjukkan contoh penggunaan.

    eascmdwin64.exe bench update benchmark-demo-b99c -Doptional.concurrency=2 -Doptional.agentCount=1

    Berikut ini adalah contoh output sistem.

    [RequestId]: 9920C672-4D41-5CC4-8EC0-C690F76EB2BA
    [OK] Running [TaskName: benchmark-demo-b99c, DesiredAgent:1, AvailableAgent: 1, Message: Benchmark task is Updating]
    [OK] Benchmark task benchmark-demo-b99c was updated successfully
  • Hentikan tugas pengujian stres

    Jalankan perintah bench stop untuk menghentikan tugas pengujian stres yang sedang berjalan. Contoh berikut menunjukkan format perintah untuk sistem Windows 64-bit.

    eascmdwin64.exe bench stop [benchmark_task_name]

    Ganti [benchmark_task_name] dengan nama tugas pengujian stres.

    Berikut ini adalah contoh output sistem.

    Apakah Anda yakin ingin menghentikan tugas benchmark [benchmark-***-test-b514] di [cn-shanghai]? [Y/n]
    [OK] Tugas [benchmark-***-test-b514] sedang dihentikan
    [OK] [Agnet: 0/1]: Tugas benchmark sedang Berjalan
    [OK] [Agnet: 0/1]: Tugas benchmark telah Dihentikan
    [OK] Tugas benchmark telah dihentikan

    Jika fitur visualisasi waktu nyata sedang berjalan saat Anda menghentikan tugas, sistem akan mengeluarkan laporan pengujian stres ke terminal tempat perintah visualisasi dijalankan. Anda juga dapat menjalankan perintah bench report untuk mendapatkan laporan HTML yang lebih detail dengan grafik.

  • Mulai tugas pengujian stres

    Jalankan perintah bench start untuk memulai kembali tugas pengujian stres yang dihentikan. Contoh berikut menunjukkan format perintah untuk sistem Windows 64-bit.

    eascmdwin64.exe bench start [benchmark_task_name]
    Catatan

    Perbedaan antara perintah ini dan perintah bench create adalah bahwa perintah ini memulai ulang tugas pengujian stres berdasarkan konfigurasi terakhir yang diperbarui dari tugas tersebut.

    Ganti [benchmark_task_name] dengan nama tugas pengujian stres.

    Contoh berikut menunjukkan output sistem.

    Are you sure to start the benchmark task [benchmark-***-test-b514] in [cn-shanghai]? [Y/n]
    [OK] Task [benchmark-***-test-b514] is starting
    [OK] [Agnet: 0/1]: Succeed to start benchmark master
    [OK] [Agnet: 1/1]: Benchmark task is Running
    [OK] Benchmark task is Running
    [OK] Click the link http://127.0.0.1:18947/eas-benchmark/statsview to observe realtime visualization details, you can turn it off with CTRL+C.
    Turning off will not interrupt the benchmark test task, and you can reopen it by the visualize command:
    eascmd -c [config_file] bench visualize benchmark-xgb-test-b514
  • Hapus tugas pengujian stres

    Setelah tugas pengujian stres selesai, controller VPC menyimpan catatan tugas tersebut berdasarkan status akhirnya. Tabel berikut menjelaskan aturan retensi.

    Keadaan akhir

    Periode retensi

    Stopped

    48 jam.

    CreateFailed, UpdateFailed, Terminated, atau Error

    10 menit.

    Setelah periode retensi berakhir, sistem secara otomatis menghapus tugas pengujian stres.

    Anda juga dapat menjalankan perintah bench delete untuk menghapus tugas pengujian stres secara manual. Berikut ini menunjukkan format perintah.

    eascmdwin64.exe bench delete [benchmark_task_name]

    Ganti [benchmark_task_name] dengan nama tugas pengujian stres.

    Berikut ini adalah contoh output sistem.

    Are you sure to delete the benchmark task [benchmark-***-test-b514] in [cn-shanghai]? [Y/n]
    [OK] Benchmark task benchmark-***-test-b514 is Deleting
    [OK] Benchmark task was deleted successfully

Lampiran 1: Data pengujian stres

Format data pengujian stres

Format data permintaan layanan bergantung pada definisi model dan implementasi prosesor. Data dapat dalam salah satu format berikut:

  • Jika Anda menggunakan data tidak terstruktur, seperti data suara, citra, atau teks, Anda dapat langsung mengunggah file sebagai data permintaan untuk pengujian stres.

  • Jika Anda menggunakan data terstruktur, seperti data TFRequest, Anda harus menggunakan kit pengembangan perangkat lunak (SDK) EAS untuk membangun data permintaan dan kemudian mengunggah data biner yang dihasilkan sebagai file. Untuk informasi lebih lanjut, lihat Pemanasan layanan model.

Jenis file data pengujian stres

Jenis file yang didukung meliputi .txt, .jpg, .bin, dan .zip. Jenis spesifik tergantung pada persyaratan layanan.

Lampiran 2: Contoh konfigurasi pengujian stres

Ketika Anda menggunakan client EASCMD untuk membuat tugas pengujian stres untuk layanan tujuan umum, Anda dapat menggunakan mode auto, scan, atau manual.

Anda dapat menambahkan parameter mode ke bagian optional file konfigurasi untuk menentukan mode pengujian stres. Kode berikut menunjukkan contoh konfigurasi.

auto mode

Dalam mode auto, Anda hanya perlu menentukan nama layanan dan data pengujian stres dalam file konfigurasi. Anda dapat menggunakan nilai default untuk parameter lainnya. Kode berikut menunjukkan contoh konfigurasi.

{
    "service": {
        "serviceName": "demo"
    },
    "data": {
        "path": "https://examplebucket.oss-cn-chengdu.aliyuncs.com/data/warmup.tf.bin"
    },
    "optional": {
        "maxQPS": 1000,
        "duration": 300
     }
}

scan mode

{
    "service": {
        "serviceName": "demo"
    },
    "data": {
        "content": "aGVsbG8K"
    },
    "optional": {
        "mode": "scan",
        "maxQPS": 1000,
        "minQPS": 500,
        "qpsGrowthDelta": 100,
        "adjustInterval": 30
    }
}

manual mode

{
    "service": {
        "serviceName": "demo"
    },
    "data": {
        "content": "aGVsbG8K"
    },
    "optional": {
        "mode": "manual",
        "agentCount": 1,
        "concurrency": 5
    }
}

Lampiran 3: Parameter konfigurasi JSON untuk pengujian stres

Item

Parameter

Wajib

Deskripsi

service

serviceName

Ya

Nama layanan tempat Anda ingin melakukan pengujian stres.

data

content

Tidak

Satu data permintaan pengujian stres sebagai string yang dienkripsi Base64.

Untuk mengonfigurasi beberapa data permintaan, tentukan parameter path. Untuk informasi lebih lanjut tentang cara membangun data pengujian stres dan jenis file yang didukung, lihat Lampiran 1: Data pengujian stres.

path

Tidak

Path sumber data uji. Anda dapat mengonfigurasi path HTTP atau path OSS. Anda dapat menentukan beberapa path yang dipisahkan koma (,). Anda juga dapat mengemas beberapa file pengujian stres ke dalam file .zip untuk konfigurasi batch.

Catatan

File yang menyimpan data pengujian stres harus dalam format aslinya dan tidak perlu dienkripsi Base64.

multiLine

Tidak

Menentukan apakah data uji dipisah per baris. Ini adalah parameter Boolean. Nilai default adalah false. Jika Anda mengatur parameter ini ke true, data yang diunduh diurai per baris.

http

headers

Tidak

Pengaturan header permintaan HTTP. Ini adalah parameter daftar. Contohnya: ["Authorization:aaa", "Content-Type:text"].

timeout

Tidak

Latensi permintaan HTTP dalam milidetik. Nilai default adalah 20000.

optional

mode

Tidak

Mode pengujian stres. Nilai valid:

  • auto (default): Mode tekanan otomatis.

  • scan: Mode tekanan periodik.

  • manual: Mode tekanan manual.

duration

Tidak

Durasi pengujian stres dalam detik. Nilai default adalah 600. Nilai maksimum adalah 1200.

agentCount

Tidak

Jumlah instans klien dalam mode manual. Jumlah instans yang lebih besar menghasilkan tekanan yang lebih tinggi. Nilai default adalah 1.

concurrency

Tidak

Konkurensi setiap instans klien dalam mode manual. Konkurensi yang lebih tinggi menghasilkan tekanan yang lebih tinggi. Nilai default adalah 2. Ketika tekanan tidak mencukupi, pertama-tama tingkatkan konkurensi. Jika peningkatan konkurensi tidak meningkatkan tekanan, coba tingkatkan jumlah instans klien.

adjustInterval

Tidak

Interval penyesuaian dinamis untuk tekanan otomatis dalam mode scan, dalam detik. Nilai default adalah 60.

minQPS

Tidak

Nilai QPS awal untuk tekanan otomatis dalam mode scan. Nilai default adalah 100.

maxQPS

Tidak

QPS maksimum yang diizinkan dalam mode scan atau auto.

maxRT

Tidak

RT maksimum (TP99) dalam mode scan atau auto. Jika ambang batas ini terlampaui, QPS disesuaikan secara otomatis hingga RT waktu nyata memenuhi ekspektasi.

qpsGrowthDelta

Tidak

Nilai peningkatan QPS setiap kali dalam mode scan. Nilai default adalah 50.

faultTolerate

Tidak

Toleransi terhadap error permintaan (kode status non-200) dalam mode scan atau auto. Misalnya, nilai 0,01 menunjukkan bahwa proses penanganan error dipicu jika 1% permintaan mengalami error. Nilai default adalah 0,001, yang berarti toleransi terhadap error permintaan adalah satu dalam seribu.

faultAction

Tidak

Perilaku controller pengujian stres ketika tingkat error permintaan melebihi ambang batas yang ditetapkan oleh faultTolerate dalam mode scan atau auto. Nilai valid:

  • stop: Mempertahankan QPS saat ini dan tidak melanjutkan peningkatan tekanan.

  • revise (default): Menyesuaikan QPS secara dinamis hingga tingkat error permintaan memenuhi ekspektasi.

FAQ

T: Error 400 atau 404 dikembalikan untuk permintaan pengujian stres tunggal, tetapi permintaan curl tunggal berhasil

Gejala: Semua permintaan gagal selama pengujian stres pada layanan inferensi model besar di EAS. Pengujian menggunakan satu sampel data dan mengembalikan kode status HTTP 400 atau 404. Namun, permintaan curl manual untuk data yang sama berhasil dengan kode status 200.

Akar penyebab:

  • Error 404: Path URL permintaan pengujian stres salah. Misalnya, path berisi garis miring di akhir, seperti /test/, tetapi layanan terdaftar dengan path /test. Hal ini menyebabkan ketidaksesuaian routing.

  • Error 400: String JSON tidak diapit tanda kutip tunggal saat menghasilkan enkripsi Base64 untuk badan permintaan. Misalnya, echo -n {"file_names": [...]} | base64. Hal ini dapat menyebabkan error parsing shell. Akibatnya, layanan menerima format JSON yang tidak valid dan tidak dapat mengurai permintaan.

Solusi:

  • Pastikan path URL pengujian stres persis sama dengan path layanan yang terdaftar. Hapus semua garis miring di akhir. Gunakan /test alih-alih /test/.

  • Sebelum menghasilkan enkripsi Base64, apit badan permintaan JSON lengkap dengan tanda kutip tunggal. Contohnya:

    echo -n '{"file_names": ["xxx.pdf"]}' | base64

Referensi

  • Anda dapat membuat dan mengelola tugas pengujian stres dengan memanggil operasi API. Untuk informasi lebih lanjut tentang operasi API dan parameternya, lihat Tugas pengujian stres.

  • Setelah Anda memastikan bahwa kinerja layanan memenuhi persyaratan Anda, Anda dapat menggunakan layanan tersebut untuk inferensi model. Untuk informasi lebih lanjut, lihat Ikhtisar metode pemanggilan.