全部产品
Search
文档中心

API Gateway:Buat instans gateway

更新时间:Nov 10, 2025

Instans Cloud-native API Gateway memungkinkan eksposur layanan, manajemen lalu lintas, perlindungan keamanan, dan manajemen siklus hidup API. Topik ini menjelaskan cara membuat instans Cloud-native API Gateway.

Konfigurasi dasar

Aktivasi pertama kali memerlukan otorisasi

Kebijakan sistem:

AliyunServiceRoleForNativeApiGw: Mengizinkan akses ke layanan cloud lain seperti ACK, VPC, SLB, dan MSE.

AliyunServiceRolePolicyForNativeApiGwInvokeFC: Mengizinkan akses ke layanan Function Compute (FC).

  1. Masuk ke Konsol Cloud-native API Gateway, klik System Management di panel navigasi sebelah kiri, lalu klik Create Instance pada halaman Instance. Pada halaman pembelian Cloud-native API Gateway, konfigurasikan parameter berikut:

    • Product Type: Mendukung Pay-as-you-go dan Subscription. Untuk informasi selengkapnya, lihat Billing overview.

      • Pay-as-you-go: Penagihan dihitung per jam. Jika durasi penggunaan kurang dari satu jam, Anda akan dikenai biaya untuk satu jam. Penyelesaian tagihan dilakukan setiap jam.

      • Subscription: Penagihan dihitung per bulan. Langganan tahunan dihitung sebagai 12 bulan.

    • Region: Pilih region tempat gerbang berada. Region ini harus sama dengan region tempat layanan backend Anda berada. Region tidak dapat diubah setelah instans dibuat.

    • Instance Name: Sesuaikan nama gerbang. Kami menyarankan Anda menggunakan nama yang menggambarkan lingkungan atau kombinasi lingkungan dan jenis bisnis, misalnya test atau order-prod. Nama dapat memiliki panjang hingga 64 karakter.

    • Instance Specification: Pilih spesifikasi node berdasarkan kebutuhan bisnis aktual Anda setelah melakukan capacity assessment.

      Ambang batas kapasitas spesifikasi node berbeda

      Tabel berikut menjelaskan ambang batas kapasitas spesifikasi instans berbeda. Jika nilai metrik kapasitas gerbang lebih rendah daripada ambang peringatan, persyaratan perjanjian tingkat layanan (SLA) Anda dapat dipenuhi sepenuhnya. Untuk bisnis utama Anda, kami menyarankan agar nilai metrik kapasitas gerbang tetap di bawah ambang aman. Hal ini memastikan stabilitas sistem Anda.

      • Ambang aman: Pada dan di atas ambang aman, instans gerbang Anda dapat memastikan throughput tinggi dan latensi rendah bahkan ketika lalu lintas meningkat dua kali lipat.

      • Ambang peringatan: Ketika instans Anda mencapai ambang peringatan, latensi meningkat dan terdapat risiko ketidakstabilan dalam kasus lonjakan lalu lintas.

      • Tidak ada jaminan SLA yang disediakan untuk instans node tunggal, yang biasanya direkomendasikan untuk skenario pengujian. Pastikan Anda menggunakan instans multi-node untuk bisnis produksi.

      Tipe instans gateway

      Koneksi klien

      Koneksi HTTPS baru per detik

      Penggunaan CPU

      Penggunaan memori

      Tingkat aman

      Tingkat peringatan

      Tingkat aman

      Tingkat peringatan

      Tingkat aman

      Tingkat peringatan

      Tingkat aman

      Tingkat peringatan

      apigw.dev.x1

      12.000

      24.000

      400

      800

      30%

      60%

      75%

      75%

      apigw.small.x1

      24.000

      48.000

      800

      1.600

      30%

      60%

      75%

      75%

      apigw.small.x2

      48.000

      96.000

      1.600

      3.200

      30%

      60%

      75%

      75%

      apigw.small.x4

      96.000

      192.000

      3.200

      6.400

      30%

      60%

      75%

      75%

      apigw.medium.x1

      192.000

      384.000

      6.400

      12.800

      30%

      60%

      75%

      75%

      apigw.medium.x2

      384.000

      768.000

      12.800

      25.600

      30%

      60%

      75%

      75%

      apigw.medium.x3

      576.000

      1.152.000

      19.200

      38.400

      30%

      60%

      75%

      75%

      apigw.large.x1

      768.000

      1.536.000

      25.600

      51.200

      30%

      60%

      75%

      75%

      apigw.large.x2

      1.536.000

      3.072.000

      51.200

      102.400

      30%

      60%

      75%

      75%

      apigw.large.x3

      2.304.000

      4.608.000

      76.800

      153.600

      30%

      60%

      75%

      75%

      apigw.large.x4

      3.072.000

      6.144.000

      102.400

      204.800

      30%

      60%

      75%

      75%

    • Resource Group: Pilih kelompok sumber daya yang sudah ada atau kelompok sumber daya default. Gunakan kelompok sumber daya untuk mengkategorikan dan mengelola sumber daya akun cloud. Lakukan kontrol akses, penyediaan sumber daya, dan pemantauan di tingkat kelompok, sehingga tidak perlu mengelola sumber daya secara individual. Untuk membuat kelompok sumber daya baru, klik Create Resource Group.

    • Network Type: Mendukung Public, Private, dan Public + Private.

      • Public: Jika Anda memilih Public, Cloud Data Transfer (CDT) menyediakan layanan BGP (Multi-ISP) untuk akses Anda dan mengenakan biaya lalu lintas publik. Untuk informasi selengkapnya, lihat Internet data transfers.

      • Private: Data yang ditransfer melalui jaringan pribadi tidak dikenai biaya.

      • Public + Private: Jika Anda memilih Public + Private, data dapat ditransfer melalui Internet atau jaringan pribadi. Data yang ditransfer melalui Internet dikenai biaya lalu lintas publik oleh CDT, yang menyediakan layanan BGP (Multi-ISP) untuk akses Anda. Data yang ditransfer melalui jaringan pribadi tidak dikenai biaya.

    • Virtual Private Cloud: Pilih virtual private cloud (VPC) tempat instans Anda berjalan. Instans Cloud-native API Gateway harus berada dalam VPC yang sama dengan layanan yang akan diakses oleh instans tersebut.

    • Select Zone: Mendukung Auto-assign atau Manually Select.

      • Auto-assign: Pilih VSwitch untuk men-deploy node gerbang, dan sistem akan secara otomatis mengalokasikan dua zona untuk men-deploy node gerbang.

      • Manually Select: Pilih secara manual Zones dan VSwitches untuk men-deploy node gerbang.

  2. Setelah menyelesaikan konfigurasi, klik Buy Now. Pada halaman Confirm Order, periksa detail konfigurasi Cloud-native API Gateway dan klik Activate Now.

    Pembuatan instans mungkin memerlukan waktu satu hingga lima menit untuk selesai.
  3. Pada halaman Instance di Konsol Cloud-native API Gateway, periksa status instans gerbang yang telah dibuat. Saat status menunjukkan Running, gerbang telah berhasil dibuat.

Fitur lanjutan

Saat membuat instans gerbang, Anda dapat mengonfigurasi operasi berikut jika perlu menggunakan data log untuk pemantauan dan analisis, atau perlu mengompresi permintaan dan respons untuk mengurangi lalu lintas gerbang. Perhatikan bahwa akselerasi perangkat keras Gzip hanya dapat diaktifkan saat pembuatan instans dan tidak dapat diaktifkan setelahnya, sedangkan tidak ada batasan untuk layanan log.

Aktifkan akselerasi perangkat keras Gzip

Akselerasi perangkat keras Gzip mengacu pada teknologi yang menggunakan perangkat keras khusus untuk mengompresi dan mendekompresi data secara cepat. Dengan memindahkan tugas dekompresi format Gzip dari CPU ke perangkat keras khusus, efisiensi pemrosesan meningkat secara signifikan dan beban CPU berkurang.

Prosedur

  1. Pada halaman pembelian Cloud-native API Gateway, setelah menyelesaikan Basic configuration, konfigurasikan parameter berikut dan klik Activate Now:

    • Region: Akselerasi perangkat keras Gzip didukung di region berikut: Hangzhou, Beijing, Shanghai, Shenzhen, Ulanqab, China (Hong Kong), dan Singapura.

      Saat ini, beberapa zona di region yang didukung mungkin tidak mendukung fitur ini. Silakan merujuk ke halaman pembelian produk untuk ketersediaan spesifik.
    • Instance Specification: Pilih spesifikasi apigw.medium.x1 atau yang lebih tinggi.

    • Gzip Hardware Acceleration: Pilih untuk mengaktifkan akselerasi perangkat keras Gzip.

      image

  2. Setelah instans berhasil dibuat, klik ID/nama instans target, klik Parameter Configuration di panel navigasi sebelah kiri, dan edit parameter EnableGzipHardwareAccelerate di bagian Gateway Engine Parameters.

    Jika Anda tidak memilih Enable Gzip Hardware Acceleration saat pembelian, Anda tidak dapat mengaktifkan konfigurasi ini.
  3. Setelah diaktifkan, klien harus mampu memproses data terkompresi Gzip. Untuk klien yang didukung, tambahkan Accept-Encoding: gzip di header permintaan.

Referensi kinerja

Berapa banyak lalu lintas yang dapat dihemat setelah mengaktifkan kompresi Gzip dibandingkan sebelumnya?

Saat menggunakan kompresi Gzip, rasio kompresi (rasio ukuran data terkompresi terhadap ukuran data tidak terkompresi) sangat dipengaruhi oleh data itu sendiri. Rasio kompresi yang lebih rendah menunjukkan efek kompresi yang lebih baik, sedangkan rasio kompresi yang lebih tinggi menunjukkan efek kompresi yang lebih buruk.

Umumnya, jika data berisi banyak pola atau struktur berulang (seperti huruf, kata, dan tanda baca dalam teks), kompresi Gzip bekerja lebih baik, menghasilkan rasio kompresi yang lebih rendah. Sebaliknya, untuk data dengan keacakan tinggi dan entropi tinggi (seperti gambar, video, file terkompresi, dll.), karena repetitivitas internalnya yang rendah, rasio kompresinya biasanya lebih tinggi dan efek kompresinya terbatas.

Pelanggan berbeda memiliki perbedaan signifikan dalam rasio kompresi saat menggunakan kompresi Gzip karena atribut bisnis mereka yang berbeda. Menurut statistik dari instans yang mengaktifkan Gzip di region inti, sebagian besar instans memiliki rasio kompresi antara 10% dan 50%, artinya setelah mengaktifkan Gzip, pengguna tersebut rata-rata dapat menghemat lebih dari 50% lalu lintas.

Berapa banyak sumber daya instans yang dapat dihemat dengan menggunakan akselerasi perangkat keras saat Gzip sudah diaktifkan?

Setelah mengaktifkan akselerasi perangkat keras Gzip, gerbang akan menggunakan perangkat keras khusus untuk kompresi, sehingga menghemat sumber daya CPU. Data uji stres berikut membandingkan konsumsi CPU antara instans node tunggal dengan akselerasi perangkat keras Gzip yang diaktifkan dan instans 4-node yang menggunakan Gzip perangkat lunak saat menangani lalu lintas QPS yang sama.

Sebagai contoh, data terkompresi adalah teks JSON berukuran sekitar 120k:

QPS

Akselerasi perangkat keras Gzip/apigw.medium.x1/konsumsi CPU node tunggal

Perangkat Lunak Gzip/apigw.medium.x1/4 node Konsumsi CPU

2.000

9%

11%

5.000

26%

28%

10.000

56%

56%

13.000

69%

72%

Dari data tabel, kita dapat melihat bahwa konsumsi CPU dari mengaktifkan akselerasi perangkat keras Gzip/node tunggal pada dasarnya setara dengan Gzip perangkat lunak/4 node. Artinya, apa yang sebelumnya memerlukan 4 node untuk menangani sekarang dapat ditangani hanya dengan 1 node setelah mengaktifkan akselerasi perangkat keras Gzip, menghemat sekitar 75% sumber daya instans.

Aktifkan pengiriman log untuk gerbang cloud-native

Jika Anda perlu mengumpulkan, menyimpan, dan menganalisis log operasi gerbang, Anda dapat mengaktifkan Simple Log Service (SLS) saat pembuatan instans gerbang untuk analisis log dan pemantauan Dasbor.

Saat menyelesaikan Basic configuration, pilih Use Simple Log Service (SLS), dan sistem akan mengaktifkan Simple Log Service (SLS) untuk Anda serta mengaktifkan pengiriman log gerbang.

Setelah mengaktifkan pengiriman log, Anda dapat melihat log gerbang di Observability > Log Center.

Deskripsi bidang log

Nama bidang

Tipe

Deskripsi

__time__

long

Waktu saat log dihasilkan.

cluster_id

string

Instans gerbang yang dibeli.

ai_log

json

Bidang log yang dirancang untuk Model API, Agent API, dan MCP API. Bidang ini dalam format JSON. Bidang ini kosong untuk jenis API lainnya.

  • api: Nama AI API.

  • cache_status: Jika caching konten diaktifkan untuk Model API, bidang ini menunjukkan apakah permintaan mengenai cache.

  • consumer: Jika autentikasi konsumen diaktifkan, bidang ini mencatat identitas konsumen untuk permintaan saat ini.

  • fallback_from: Jika kebijakan fallback diaktifkan untuk Model API, bidang ini mencatat rute asal permintaan dialihkan.

  • input_token: Jumlah token input dalam permintaan LLM.

  • llm_first_token_duration: Waktu respons (RT) paket pertama dari permintaan LLM.

  • llm_service_duration: RT keseluruhan dari permintaan LLM.

  • model: Nama model dalam permintaan LLM.

  • output_token: Jumlah token output dalam permintaan LLM.

  • response_type: Tipe respons dari permintaan LLM, seperti streaming atau non-streaming.

  • safecheck_status: Status Moderasi Konten dari permintaan LLM.

  • token_ratelimit_status: Menunjukkan apakah permintaan LLM diblokir oleh pembatasan laju berbasis token.

authority

string

Header Host dalam pesan permintaan.

bytes_received

long

Ukuran badan permintaan, tidak termasuk header.

bytes_sent

long

Ukuran badan respons, tidak termasuk header.

downstream_local_address

string

Alamat pod gerbang.

downstream_remote_address

string

Alamat klien yang terhubung ke gerbang.

duration

long

Total waktu yang diperlukan untuk memproses permintaan. Ini adalah periode dari saat gerbang menerima byte pertama dari layanan downstream hingga mengirim byte terakhir dari respons. Satuan: milidetik.

method

string

Metode HTTP.

path

string

Jalur dalam permintaan HTTP.

protocol

string

Versi protokol HTTP.

request_duration

long

Periode dari saat gerbang menerima byte pertama dari layanan downstream hingga menerima byte terakhir dari layanan downstream. Satuan: milidetik.

request_id

string

Gerbang menghasilkan ID untuk setiap permintaan dan menyertakannya dalam header x-request-id. Backend dapat menggunakan bidang ini untuk pencatatan log dan pemecahan masalah.

requested_server_name

string

Nama server yang digunakan untuk koneksi SSL-VPN.

response_code_details

string

Memberikan informasi tambahan tentang kode respons. Misalnya, `via_upstream` menunjukkan bahwa kode respons dikembalikan oleh layanan backend, dan `route_not_found` menunjukkan bahwa tidak ada rute yang cocok ditemukan untuk permintaan tersebut.

response_tx_duration

long

Periode dari saat gerbang menerima byte pertama dari layanan upstream hingga mengirim byte terakhir ke layanan downstream. Satuan: milidetik.

route_name

string

Nama rute.

start_time

string

Waktu permintaan dimulai. Format: UTC.

trace_id

string

ID jejak.

upstream_cluster

string

Kluster upstream.

upstream_host

string

Alamat IP upstream.

upstream_local_address

string

Alamat lokal yang digunakan untuk menghubungkan ke layanan upstream.

upstream_service_time

long

Waktu yang diperlukan oleh layanan upstream untuk memproses permintaan, dalam milidetik. Ini mencakup latensi jaringan untuk akses gerbang ke layanan upstream dan waktu pemrosesan layanan upstream itu sendiri.

upstream_transport_failure_reason

string

Alasan kegagalan koneksi ke layanan upstream.

user_agent

string

Header User-Agent dalam permintaan HTTP.

x_forwarded_for

string

Header x-forwarded-for dalam permintaan HTTP. Header ini biasanya menunjukkan alamat IP asal klien HTTP.

Apa yang harus dilakukan selanjutnya

  • Gateway API Berbasis Cloud-native mendukung berbagai tipe API, termasuk REST API, HTTP API, dan WebSocket API. Anda dapat mengonfigurasi aturan routing atau kebijakan untuk berbagai tipe API sesuai kebutuhan bisnis Anda.

  • Anda dapat membuat layanan untuk menambahkan layanan backend ke instans Anda. Instans tersebut kemudian dapat memperoleh dan mengelola titik akhir layanan backend secara terpusat.

  • Jika Anda memerlukan routing untuk mengizinkan akses eksternal ke layanan internal Anda, lihat Access applications in ACK by using an HTTP API.

  • Untuk informasi selengkapnya tentang pertanyaan umum saat menggunakan Cloud-native API Gateway, lihat FAQ.