全部产品
Search
文档中心

API Gateway:Perencanaan kapasitas

更新时间:Dec 12, 2025

Topik ini menyediakan ambang batas kapasitas dan referensi kinerja permintaan per detik (QPS) untuk berbagai tipe instans Cloud-native API Gateway guna membantu Anda memilih tipe instans yang sesuai dengan kebutuhan.

Ambang kapasitas

Tabel berikut mencantumkan ambang batas kapasitas untuk berbagai tipe instans gerbang. Anda mendapatkan cakupan Service-Level Agreement (SLA) penuh selama metrik kapasitas gerbang berada di bawah tingkat alert. Untuk layanan inti, pastikan metrik kapasitas gerbang tetap di bawah tingkat aman guna menjamin stabilitas yang lebih tinggi.

  • Tingkat aman: Sistem gerbang mampu mempertahankan throughput tinggi dan latensi rendah bahkan jika lalu lintas meningkat hingga dua kali lipat.

  • Tingkat alert: Saat gerbang beroperasi di atas tingkat ini, latensi dapat meningkat dan terdapat ancaman terhadap stabilitas selama lonjakan lalu lintas.

  • Tipe instans apigw.dev.x1 merupakan deployment node tunggal dan tidak mencakup SLA. Gunakan hanya untuk tujuan pengujian. Untuk layanan produksi, pastikan Anda menggunakan tipe instans gerbang dengan multiple node.

  • SLA tidak mencakup kegagalan permintaan yang disebabkan oleh penggunaan CPU atau memori melebihi tingkat alert. Gerbang akan menghasilkan alert saat penggunaan CPU dan memori mencapai tingkat tersebut. Pantau segera beban dan alert pada gerbang.

Tipe instans gateway

Koneksi klien

Koneksi HTTPS baru per detik

CPU usage

Penggunaan memori

Tingkat aman

Tingkat peringatan

Tingkat aman

Tingkat peringatan

Tingkat aman

Tingkat peringatan

Tingkat aman

Tingkat peringatan

apigw.dev.x1

12.000

24.000

400

800

30%

60%

75%

75%

apigw.small.x1

24.000

48.000

800

1.600

30%

60%

75%

75%

apigw.small.x2

48.000

96.000

1.600

3.200

30%

60%

75%

75%

apigw.small.x4

96.000

192.000

3.200

6.400

30%

60%

75%

75%

apigw.medium.x1

192.000

384.000

6.400

12.800

30%

60%

75%

75%

apigw.medium.x2

384.000

768.000

12.800

25.600

30%

60%

75%

75%

apigw.medium.x3

576.000

1.152.000

19.200

38.400

30%

60%

75%

75%

apigw.large.x1

768.000

1.536.000

25.600

51.200

30%

60%

75%

75%

apigw.large.x2

1.536.000

3.072.000

51.200

102.400

30%

60%

75%

75%

apigw.large.x3

2.304.000

4.608.000

76.800

153.600

30%

60%

75%

75%

apigw.large.x4

3.072.000

6.144.000

102.400

204.800

30%

60%

75%

75%

Referensi kinerja QPS

QPS gerbang dipengaruhi oleh beberapa faktor, seperti ukuran acknowledgement serta apakah HTTPS atau gzip diaktifkan. Tabel berikut memberikan referensi konservatif untuk nilai QPS (skenario terburuk) ketika penggunaan CPU gerbang berada pada 30%.

Catatan

Pembentukan koneksi HTTPS baru mengonsumsi sumber daya CPU yang signifikan. Untuk layanan dengan banyak koneksi HTTPS short-lived yang konkuren, evaluasi kapasitas gerbang berdasarkan data koneksi short-lived HTTPS dalam tabel di bawah ini.

Tipe instans Gateway

apigw.dev.x1

apigw.small.x1

apigw.small.x2

apigw.small.x4

apigw.medium.x1

apigw.medium.x2

apigw.medium.x3

apigw.large.x1

apigw.large.x2

apigw.large.x3

apigw.large.x4

Jenis koneksi

Acknowledgement size (KB)

HTTPS diaktifkan

Should I use gzip?

Referensi QPS pada tingkat CPU aman (30%)

Koneksi berumur pendek

1

Tidak

Tidak

1.700

3.400

6.800

13.600

28.000

56.000

84.000

112.000

224.000

336.000

448.000

Ya

Tidak

500

1.000

2.000

4.000

8.700

17.400

26.100

34.800

69.600

104.400

139.200

Koneksi persisten

1

Tidak

Tidak

2.200

4.400

8.800

17.600

35.000

70.000

105.000

140.000

280.000

420.000

560.000

Ya

Tidak

2.000

4.000

8.000

16.000

32.000

64.000

96.000

128.000

256.000

384.000

512.000

Ya

Ya

1.700

3.400

6.800

13.600

28.000

56.000

84.000

112.000

224.000

336.000

448.000

10

Tidak

Tidak

1.800

3.600

7.200

14.400

30.000

60.000

90.000

120.000

240.000

360.000

480.000

Ya

Tidak

1.700

3.400

6.800

13.600

28.000

56.000

84.000

112.000

224.000

336.000

448.000

Ya

Ya

1.000

2.000

4.000

8.000

16.000

32.000

48.000

64.000

128.000

192.000

256.000

Batas kuota

Kuota global

Kuota global bersifat independen dari tipe instans gerbang. Untuk meminta peningkatan kuota, kirim tiket.

Kuota default

Quota limit

Instans per wilayah

50

100

Total operasi API per wilayah

10.000

20.000

API operations per API

1.000

2.000

Kuota tipe instans

Kuota tipe instans bergantung pada tipe instans gerbang. Jika kuota masih belum mencukupi setelah Anda melakukan upgrade ke tipe instans yang lebih tinggi, Anda dapat submit a ticket untuk mengajukan peningkatan lebih lanjut.

Dev & Small

Medium & Large

Kuota default

Quota limit

Kuota default

Quota limit

Nama domain yang diterbitkan

50

100

200

500

Layanan terkait

100

200

300

500

Total entri rute

200

500

1.000

2.000

Total operasi API online

1.000

2.000

3.000

5.000

Number of K8s service sources

2

3

3

5

Lingkungan terkait

5

10

15

20

Kuota resource untuk skenario Ingress

Kuota resource untuk skenario Ingress bergantung pada tipe instans gerbang. Hindari melebihi kuota untuk tipe instans Anda agar terhindar dari masalah stabilitas.

Catatan

Batas kuota ditentukan oleh tipe instans. Anda hanya dapat meningkatkan kuota dengan melakukan upgrade tipe instans atau menambahkan kluster gateway baru. Scaling out instans dengan tipe yang sama tidak akan meningkatkan kuotanya.

Dev

Small

Medium

Large

Domain Names

500

1.000

2.500

7.500

Layanan

1.000

2.000

4.000

10.000

Rute

1.000

2.000

4.000

10.000

Ingress

1.500

1.000

2.500

7.500

Endpoint

2.500

5.000

10.000

25.000