Topik ini menjelaskan item yang dapat ditagih dan harga untuk AI Gateway, mencakup dua jenis produk: instans khusus dan Serverless.
Metode Penagihan
Gateway AI mendukung metode penagihan berikut:
Bayar sesuai pemakaian: Metode penagihan pascabayar ini menagih Anda per jam. Penggunaan kurang dari satu jam dihitung sebagai satu jam penuh. Biaya dihitung per jam dan tagihan diterbitkan setiap 24 jam. Pemotongan biaya dilakukan secara otomatis dari Saldo akun Alibaba Cloud Anda. Waktu penagihan aktual dapat bervariasi.
Langganan: Metode penagihan prabayar ini menagih Anda per bulan. Langganan tahunan berlaku selama periode 12 bulan. Biaya dipotong secara otomatis dari Saldo akun Alibaba Cloud Anda. Waktu penagihan aktual dapat bervariasi.
Item yang Dapat Ditagih
AI Gateway tersedia dalam dua jenis: instans khusus dan Serverless.
Instans khusus: Item yang dapat ditagih meliputi biaya instans, biaya pemrosesan data, dan biaya lalu lintas internet.
Serverless: Item yang dapat ditagih meliputi biaya CU permintaan dan biaya lalu lintas internet.
Instans khusus
Biaya instans
Wilayah | Jenis instans | Harga bayar sesuai pemakaian (USD/jam) | Harga langganan (USD/bulan) |
Daratan Tiongkok (tidak termasuk Hong Kong (Tiongkok), Makau (Tiongkok), dan Taiwan (Tiongkok)) | aigw.small.x1 | 1,11069 | 559,65 |
aigw.small.x2 | 2,124948 | 1.071,084 | |
aigw.small.x4 | 4,022018 | 2.026,794 | |
aigw.medium.x1 | 7,854 | 3.958,64 | |
aigw.medium.x2 | 15,46776 | 7.795,76 | |
aigw.medium.x3 | 23,08096 | 11.632,88 | |
aigw.large.x1 | 29,927352 | 15.083,25 | |
aigw.large.x2 | 59,619378 | 30.048,018 | |
aigw.large.x3 | 89,31195 | 45.013,332 | |
Tiongkok (Hong Kong), Jepang (Tokyo) | aigw.small.x1 | 1,666322 | 839,475 |
aigw.small.x2 | 3,187422 | 1.606,626 | |
aigw.small.x4 | 6,033314 | 3.040,191 | |
aigw.medium.x1 | 11,78128 | 5.937,96 | |
aigw.medium.x2 | 23,20192 | 11.693,64 | |
aigw.medium.x3 | 34,62144 | 17.449,32 | |
aigw.large.x1 | 44,891028 | 22.624,875 | |
aigw.large.x2 | 89,428794 | 45.072,027 | |
aigw.large.x3 | 133,968198 | 67.519,998 | |
Singapura, Indonesia (Jakarta), Jerman (Frankfurt) | aigw.small.x1 | 1,53258 | 772,317 |
aigw.small.x2 | 2,932566 | 1.478,09592 | |
aigw.small.x4 | 5,55058 | 2.796,97572 | |
aigw.medium.x1 | 10,8388 | 5.462,9232 | |
aigw.medium.x2 | 21,34552 | 10.758,1488 | |
aigw.medium.x3 | 31,85168 | 16.053,3744 | |
aigw.large.x1 | 41,299986 | 20.814,885 | |
aigw.large.x2 | 82,274556 | 41.466,26484 | |
aigw.large.x3 | 123,250764 | 62.118,39816 | |
AS (Virginia), AS (Silicon Valley) | aigw.small.x1 | 1,332828 | 671,58 |
aigw.small.x2 | 2,549708 | 1.285,3008 | |
aigw.small.x4 | 4,826192 | 2.432,1528 | |
aigw.medium.x1 | 9,4248 | 4.750,368 | |
aigw.medium.x2 | 18,5612 | 9.354,912 | |
aigw.medium.x3 | 27,69704 | 13.959,456 | |
aigw.large.x1 | 35,912604 | 18.099,9 | |
aigw.large.x2 | 71,543472 | 36.057,6216 | |
aigw.large.x3 | 107,17434 | 54.015,9984 |
Biaya pemrosesan data
Saat membuat instans AI Gateway, Anda dapat memilih jenis jaringan: Internet, jaringan pribadi, atau Internet + jaringan pribadi. Pemrosesan data untuk masing-masing jenis jaringan ditagih secara terpisah. Dalam satu siklus penagihan, volume pemrosesan data merupakan total volume data dari permintaan dan tanggapan.
Wilayah | Jenis jaringan | Harga (USD/GB/jam) |
Cloud Publik | Internet | 0,005 |
Jaringan pribadi | 0,007 |
Rumus penagihan
Internet: Biaya per jam = Volume pemrosesan data × Harga.
Sebagai contoh, Anda menggunakan instans gerbang selama dua jam. Instans tersebut memproses data sebesar 5 GB pada jam pertama dan 10 GB pada jam kedua. Total biaya pemrosesan data untuk dua jam tersebut adalah 0,005 × 5 + 0,005 × 10 = 0,075 USD.
Jaringan pribadi: Biaya per jam = Volume pemrosesan data × Harga.
Sebagai contoh, Anda menggunakan instans gerbang selama dua jam. Instans tersebut memproses data sebesar 5 GB pada jam pertama dan 10 GB pada jam kedua. Total biaya pemrosesan data untuk dua jam tersebut adalah 0,007 × 5 + 0,007 × 10 = 0,105 USD.
Serverless
Biaya CU permintaan
Capacity Unit (CU) adalah unit terkecil yang digunakan untuk mengukur konsumsi sumber daya instans Serverless.
Biaya CU dikenakan per jam. Penggunaan kurang dari satu jam dihitung sebagai satu jam penuh. Granularitas penagihan minimum adalah 1.000 CU, dan penggunaan dibulatkan ke atas ke kelipatan 1.000 CU terdekat. Jika total CU yang digunakan dalam satu jam kurang dari 100.000, Anda ditagih untuk 100.000 CU.
Biaya CU per jam = maks{CU aktual untuk jam tersebut, 100.000} × harga CU
Contoh penagihan:
Jika jumlah CU aktual yang digunakan dalam satu jam adalah 50.200 (kurang dari 100.000), jumlah CU yang ditagih untuk jam tersebut adalah 100.000.
Jika jumlah CU aktual yang digunakan dalam satu jam adalah 150.200 (lebih dari 100.000), jumlah CU yang ditagih untuk jam tersebut adalah 151.000 karena granularitas penagihan minimum adalah 1.000 CU.
Aturan pengukuran CU untuk API yang berbeda
CU untuk satu panggilan API ditentukan oleh koefisien CU jenis API dan ukuran muatan, dengan rumus sebagai berikut:
CU untuk satu panggilan API = koefisien CU × CEILING{(Muatan permintaan + Muatan tanggapan) / 512 KB}
Koefisien CU untuk setiap jenis API adalah sebagai berikut:
Model API: 10
MCP Server: 5
Agent API: 2
Contoh penagihan:
Untuk permintaan Model API dengan muatan permintaan 100 KB dan muatan tanggapan 800 KB, CU untuk permintaan ini dihitung sebagai: 10 × CEILING{(100 + 800) / 512} = 20
Untuk permintaan MCP Server dengan muatan permintaan 50 KB dan muatan tanggapan 300 KB, CU untuk permintaan ini dihitung sebagai: 5 × CEILING{(50 + 300) / 512} = 5
Harga CU
Wilayah | Harga (USD/1.000 CU) |
Daratan Tiongkok (tidak termasuk Hong Kong (Tiongkok), Makau (Tiongkok), dan Taiwan (Tiongkok)) | 0,0007 |
Tiongkok (Hong Kong), Jepang (Tokyo) | 0,001 |
Singapura, Indonesia (Jakarta), Jerman (Frankfurt) | 0,001 |
AS (Virginia), AS (Silicon Valley) | 0,00085 |
Biaya lalu lintas internet
Lalu lintas internet ditagih melalui Apa itu Cloud Data Transfer?. Untuk informasi selengkapnya, lihat Lalu lintas internet.