Topik ini menyediakan ambang batas kapasitas dan referensi kinerja permintaan per detik (QPS) untuk berbagai tipe instans Cloud-native API Gateway guna membantu Anda memilih tipe instans yang sesuai dengan kebutuhan.
Ambang kapasitas
Tabel berikut mencantumkan ambang batas kapasitas untuk berbagai tipe instans gerbang. Anda mendapatkan cakupan Service-Level Agreement (SLA) penuh selama metrik kapasitas gerbang berada di bawah tingkat alert. Untuk layanan inti, pastikan metrik kapasitas gerbang tetap di bawah tingkat aman guna menjamin stabilitas yang lebih tinggi.
Tingkat aman: Sistem gerbang mampu mempertahankan throughput tinggi dan latensi rendah bahkan jika lalu lintas meningkat hingga dua kali lipat.
Tingkat alert: Saat gerbang beroperasi di atas tingkat ini, latensi dapat meningkat dan terdapat ancaman terhadap stabilitas selama lonjakan lalu lintas.
Tipe instans apigw.dev.x1 merupakan deployment node tunggal dan tidak mencakup SLA. Gunakan hanya untuk tujuan pengujian. Untuk layanan produksi, pastikan Anda menggunakan tipe instans gerbang dengan multiple node.
SLA tidak mencakup kegagalan permintaan yang disebabkan oleh penggunaan CPU atau memori melebihi tingkat alert. Gerbang akan menghasilkan alert saat penggunaan CPU dan memori mencapai tingkat tersebut. Pantau segera beban dan alert pada gerbang.
Tipe instans gateway | Koneksi klien | Koneksi HTTPS baru per detik | CPU usage | Penggunaan memori | ||||
Tingkat aman | Tingkat peringatan | Tingkat aman | Tingkat peringatan | Tingkat aman | Tingkat peringatan | Tingkat aman | Tingkat peringatan | |
apigw.dev.x1 | 12.000 | 24.000 | 400 | 800 | 30% | 60% | 75% | 75% |
apigw.small.x1 | 24.000 | 48.000 | 800 | 1.600 | 30% | 60% | 75% | 75% |
apigw.small.x2 | 48.000 | 96.000 | 1.600 | 3.200 | 30% | 60% | 75% | 75% |
apigw.small.x4 | 96.000 | 192.000 | 3.200 | 6.400 | 30% | 60% | 75% | 75% |
apigw.medium.x1 | 192.000 | 384.000 | 6.400 | 12.800 | 30% | 60% | 75% | 75% |
apigw.medium.x2 | 384.000 | 768.000 | 12.800 | 25.600 | 30% | 60% | 75% | 75% |
apigw.medium.x3 | 576.000 | 1.152.000 | 19.200 | 38.400 | 30% | 60% | 75% | 75% |
apigw.large.x1 | 768.000 | 1.536.000 | 25.600 | 51.200 | 30% | 60% | 75% | 75% |
apigw.large.x2 | 1.536.000 | 3.072.000 | 51.200 | 102.400 | 30% | 60% | 75% | 75% |
apigw.large.x3 | 2.304.000 | 4.608.000 | 76.800 | 153.600 | 30% | 60% | 75% | 75% |
apigw.large.x4 | 3.072.000 | 6.144.000 | 102.400 | 204.800 | 30% | 60% | 75% | 75% |
Referensi kinerja QPS
QPS gerbang dipengaruhi oleh beberapa faktor, seperti ukuran acknowledgement serta apakah HTTPS atau gzip diaktifkan. Tabel berikut memberikan referensi konservatif untuk nilai QPS (skenario terburuk) ketika penggunaan CPU gerbang berada pada 30%.
Pembentukan koneksi HTTPS baru mengonsumsi sumber daya CPU yang signifikan. Untuk layanan dengan banyak koneksi HTTPS short-lived yang konkuren, evaluasi kapasitas gerbang berdasarkan data koneksi short-lived HTTPS dalam tabel di bawah ini.
Tipe instans Gateway | apigw.dev.x1 | apigw.small.x1 | apigw.small.x2 | apigw.small.x4 | apigw.medium.x1 | apigw.medium.x2 | apigw.medium.x3 | apigw.large.x1 | apigw.large.x2 | apigw.large.x3 | apigw.large.x4 | |||
Jenis koneksi | Acknowledgement size (KB) | HTTPS diaktifkan | Should I use gzip? | Referensi QPS pada tingkat CPU aman (30%) | ||||||||||
Koneksi berumur pendek | 1 | Tidak | Tidak | 1.700 | 3.400 | 6.800 | 13.600 | 28.000 | 56.000 | 84.000 | 112.000 | 224.000 | 336.000 | 448.000 |
Ya | Tidak | 500 | 1.000 | 2.000 | 4.000 | 8.700 | 17.400 | 26.100 | 34.800 | 69.600 | 104.400 | 139.200 | ||
Koneksi persisten | 1 | Tidak | Tidak | 2.200 | 4.400 | 8.800 | 17.600 | 35.000 | 70.000 | 105.000 | 140.000 | 280.000 | 420.000 | 560.000 |
Ya | Tidak | 2.000 | 4.000 | 8.000 | 16.000 | 32.000 | 64.000 | 96.000 | 128.000 | 256.000 | 384.000 | 512.000 | ||
Ya | Ya | 1.700 | 3.400 | 6.800 | 13.600 | 28.000 | 56.000 | 84.000 | 112.000 | 224.000 | 336.000 | 448.000 | ||
10 | Tidak | Tidak | 1.800 | 3.600 | 7.200 | 14.400 | 30.000 | 60.000 | 90.000 | 120.000 | 240.000 | 360.000 | 480.000 | |
Ya | Tidak | 1.700 | 3.400 | 6.800 | 13.600 | 28.000 | 56.000 | 84.000 | 112.000 | 224.000 | 336.000 | 448.000 | ||
Ya | Ya | 1.000 | 2.000 | 4.000 | 8.000 | 16.000 | 32.000 | 48.000 | 64.000 | 128.000 | 192.000 | 256.000 | ||
Batas kuota
Kuota global
Kuota global bersifat independen dari tipe instans gerbang. Untuk meminta peningkatan kuota, kirim tiket.
Kuota default | Quota limit | |
Instans per wilayah | 50 | 100 |
Total operasi API per wilayah | 10.000 | 20.000 |
API operations per API | 1.000 | 2.000 |
Kuota tipe instans
Kuota tipe instans bergantung pada tipe instans gerbang. Jika kuota masih belum mencukupi setelah Anda melakukan upgrade ke tipe instans yang lebih tinggi, Anda dapat submit a ticket untuk mengajukan peningkatan lebih lanjut.
Dev & Small | Medium & Large | |||
Kuota default | Quota limit | Kuota default | Quota limit | |
Nama domain yang diterbitkan | 50 | 100 | 200 | 500 |
Layanan terkait | 100 | 200 | 300 | 500 |
Total entri rute | 200 | 500 | 1.000 | 2.000 |
Total operasi API online | 1.000 | 2.000 | 3.000 | 5.000 |
Number of K8s service sources | 2 | 3 | 3 | 5 |
Lingkungan terkait | 5 | 10 | 15 | 20 |
Kuota resource untuk skenario Ingress
Kuota resource untuk skenario Ingress bergantung pada tipe instans gerbang. Hindari melebihi kuota untuk tipe instans Anda agar terhindar dari masalah stabilitas.
Batas kuota ditentukan oleh tipe instans. Anda hanya dapat meningkatkan kuota dengan melakukan upgrade tipe instans atau menambahkan kluster gateway baru. Scaling out instans dengan tipe yang sama tidak akan meningkatkan kuotanya.
Dev | Small | Medium | Large | |
Domain Names | 500 | 1.000 | 2.500 | 7.500 |
Layanan | 1.000 | 2.000 | 4.000 | 10.000 |
Rute | 1.000 | 2.000 | 4.000 | 10.000 |
Ingress | 1.500 | 1.000 | 2.500 | 7.500 |
Endpoint | 2.500 | 5.000 | 10.000 | 25.000 |