Topik ini menjelaskan item yang dapat ditagih, metode penagihan, serta aturan penagihan dari Platform AI Search Terbuka.
Item yang dapat ditagih
Platform AI Search Terbuka mengenakan biaya untuk item berikut:
Pemanggilan Model: Anda dikenai biaya untuk memanggil model seperti Layanan Pemrosesan Konten Dokumen, layanan penyematan teks, dan layanan pengurutan.
Penyesuaian Model (khusus Wilayah China (Shanghai)): Anda dikenai biaya untuk menyesuaikan model yang disediakan oleh AI Search Open Platform dengan data Anda sendiri, misalnya untuk pelatihan kustom untuk layanan reduksi dimensi vektor.
Penyebaran Model (Wilayah China (Shanghai) saja): Anda dikenakan biaya penyebaran dan pemanggilan saat menerapkan model dari berbagai sumber pada Platform AI Search Terbuka.
Pengembangan Layanan (Wilayah China (Shanghai) saja): Platform AI Search Terbuka mengintegrasikan fitur Distribution Switch (DSW) dari PAI. Anda dapat menggunakan Notebook di platform untuk mengembangkan dan mengeksekusi layanan.
Anda dapat mengaktifkan Platform AI Search Terbuka secara gratis. Tidak ada biaya jika Anda tidak menggunakan layanan tersebut.
Metode penagihan
Kecuali layanan mesin pencari, semua layanan di Platform AI Search Terbuka ditagih berdasarkan sistem bayar sesuai penggunaan. Anda dikenakan biaya berdasarkan jumlah pemanggilan layanan dan jam yang dapat ditagih, diukur dalam Compute Units (CUs), yang dikonsumsi oleh pelatihan model kustom. Tagihan dihasilkan setiap jam. Semua tagihan per jam digabungkan menjadi satu pesanan, dan total biaya dipotong dari Akun Alibaba Cloud Anda.
Mulai 17:00 pada 4 Juli 2024, beberapa layanan mengadopsi penetapan harga bertingkat. Untuk informasi lebih lanjut, lihat aturan penagihan rinci di bagian berikutnya.
Aturan penagihan
Pemanggilan model
Dalam model bahasa besar (LLM), token adalah unit teks terkecil yang dapat diproses dan dipahami oleh model. Token biasanya mewakili segmen teks seperti kata, frasa, karakter, atau simbol. Model yang berbeda mungkin memiliki metode pemisahan mereka sendiri, dan jumlah karakter mungkin tidak sesuai satu-satu dengan jumlah token.
Satuan penagihan untuk token yang digunakan dalam pemanggilan model pada Platform AI Search Terbuka adalah USD/1.000 token. Beberapa layanan mengadopsi penetapan harga bertingkat, dan beberapa layanan ditagih berdasarkan token input dan output.
Beberapa model mendukung Perhitungan Token untuk memperkirakan jumlah token yang dihasilkan oleh suatu pemanggilan.
Contoh Penetapan Harga Bertingkat:
Di wilayah Jerman (Frankfurt), jika Anda memanggil layanan penyematan teks jarang dan menghasilkan 1.000.000 token, yang setara dengan 1.000 unit penagihan, biayanya dihitung sebagai berikut: 500 × 0,001 + 500 × 0,0004 = 0,7 USD.
Contoh Penagihan Input dan Output:
Di wilayah Jerman (Frankfurt), jika Anda memanggil model bahasa besar qwen3-235b-a22b dan menghasilkan 1.000 token input dan 1.000 token output, biayanya dihitung sebagai berikut:
1 × 0,0007 + 1 × 0,0028 = 0,0035 USD.
Wilayah Jerman (Frankfurt)
Nama model | ID Model | Satuan penagihan | Harga untuk 0-500 unit | Harga untuk unit di atas 500 |
ops-document-analyze-001 | USD/1.000 token | 0,0009 | 0,000272 | |
USD/gambar | 0,00073 | |||
USD/tabel | 0,00157 | |||
Penguraian konten dokumen - Ekstraksi struktur hierarkis berbasis pemahaman semantik Catatan Ketika Anda memanggil Layanan Penguraian Konten Dokumen, Anda dapat menggunakan parameter untuk mengontrol apakah akan mengaktifkan fitur ekstraksi struktur hierarki dokumen berdasarkan pemahaman semantik. Jika fitur ini diaktifkan, selain biaya penguraian dokumen, Anda dikenai biaya 0,00052 USD/1.000 token untuk fitur ini. | USD/1.000 token | 0,00052 | ||
ops-image-analyze-ocr-001 | USD/pemanggilan | 0,012 | 0,0031 | |
ops-image-analyze-vlm-001 | USD/1.000 token | 0,011 | ||
ops-document-split-001 | USD/1.000 token | 0,0009 | 0,000003 | |
ops-text-embedding-001 | USD/1.000 token | 0,0009 | 0,000072 | |
ops-text-embedding-002 | 0,0009 | 0,000054 | ||
ops-text-embedding-zh-001 | 0,0009 | 0,000022 | ||
ops-text-embedding-en-001 | 0,0009 | 0,000019 | ||
ops-gte-sentence-embedding-multilingual-base | 0,0009 | 0,00003 | ||
ops-qwen3-embedding-0.6b | 0,0009 | 0,000062 | ||
Digunakan untuk penyematan teks dan gambar | ops-m2-encoder Penyematan teks | USD/1.000 token | 0,0009 | 0,000039 |
ops-m2-encoder Penyematan gambar | USD/gambar | 0,0009 | 0,000032 | |
ops-m2-encoder-large Penyematan teks | USD/1.000 token | 0,0009 | 0,000065 | |
ops-m2-encoder-large Vektorisasi gambar | USD/gambar | 0,0009 | 0,000042 | |
ops-gme-qwen2-vl-2b-instruct Penyematan teks | USD/1.000 token | 0,0009 | 0,000162 | |
ops-gme-qwen2-vl-2b-instruct Penyematan gambar | USD/gambar | 0,0009 | 0,000146 | |
ops-text-sparse-embedding-001 | USD/1.000 token | 0,001 | 0,0004 | |
ops-embedding-dim-reduction-001 | USD/dokumen | 0,0009 | 0,0000064 | |
ops-bge-reranker-larger | USD/dokumen | 0,0005 | 0,000048 | |
ops-text-reranker-001 | 0,0005 | 0,00016 | ||
ops-qwen3-reranker-0.6b | 0,0005 | 0,000026 | ||
ops-video-snapshot-001 | USD/1.000 gambar | 0,03 | ||
ops-audio-asr-001 | USD/jam | 0,2 | ||
Mesin pencari | Alibaba Cloud Elasticsearch: layanan cloud yang sepenuhnya dikelola yang dibangun berdasarkan Elasticsearch open source. Kompatibel 100% dengan fitur open source dan mendukung penggunaan langsung serta penagihan bayar sesuai penggunaan. Untuk informasi lebih lanjut, lihat Elasticsearch. | |||
OpenSearch-Edisi Pencarian Vektor: Untuk informasi lebih lanjut tentang penagihan, lihat Edisi Pencarian Vektor. | ||||
qwen3-235b-a22b | USD/1.000 token | Input: 0,0007 Output: 0,0028 | ||
ops-qwen-turbo | Input: 0,000065 Output: 0,00026 | |||
qwen-turbo | Input: 0,00005 Output: 0,0002 | |||
qwen-plus | Input: 0,0004 Output: 0,0012 | |||
qwen-max | Input: 0,0016 Output: 0,0064 | |||
ops-query-analyze-001 | USD/1.000 token | Input: 0,004 Output: 0,018 | ||
Wilayah China (Shanghai)
Nama model | ID model | Satuan penagihan | Harga untuk 0-500 unit | Harga untuk unit di atas 500 |
ops-document-analyze-001 | USD/1.000 token | 0,0007 | 0,00085 | |
USD/gambar | 0,0023 | |||
USD/tabel | 0,005 | |||
Penguraian konten dokumen - Ekstraksi struktur hierarkis berbasis pemahaman semantik Catatan Saat Anda memanggil Layanan Penguraian Konten Dokumen, Anda dapat menggunakan parameter untuk mengontrol apakah akan mengaktifkan fitur ekstraksi struktur hierarkis dokumen berbasis pemahaman semantik. Jika fitur ini diaktifkan, selain biaya penguraian dokumen, Anda dikenakan biaya 0,00031 USD/1.000 token untuk fitur ini. | USD/1.000 token | 0,00031 | ||
ops-image-analyze-ocr-001 | USD/pemanggilan | 0,0112 | 0,0058 | |
ops-image-analyze-vlm-001 | USD/1.000 token | 0,0093 | ||
ops-document-split-001 | USD/1.000 token | 0,0007 | 0,000003 | |
ops-text-embedding-001 | USD/1.000 token | 0,0007 | 0,000023 | |
ops-text-embedding-002 | 0,0007 | 0,00007 | ||
ops-text-embedding-zh-001 | 0,0007 | 0,00001 | ||
ops-text-embedding-en-001 | 0,0007 | 0,000011 | ||
ops-gte-sentence-embedding-multilingual-base | 0,0007 | 0,000025 | ||
ops-qwen3-embedding-0.6b | 0,0007 | 0,000071 | ||
Digunakan untuk penyematan teks dan gambar | ops-m2-encoder Penyematan teks | USD/1.000 token | 0,0007 | 0,000026 |
ops-m2-encoder Penyematan gambar | USD/gambar | 0,0007 | 0,0000162 | |
ops-m2-encoder-large Penyematan teks | USD/1.000 token | 0,0007 | 0,000067 | |
ops-m2-encoder-large Vektorisasi gambar | USD/gambar | 0,0007 | 0,000033 | |
ops-gme-qwen2-vl-2b-instruct Penyematan teks | USD/1.000 token | 0,0007 | 0,00008 | |
ops-gme-qwen2-vl-2b-instruct Vektorisasi gambar | USD/gambar | 0,0007 | 0,000072 | |
ops-text-sparse-embedding-001 | USD/1.000 token | 0,00084 | 0,00014 | |
ops-embedding-dim-reduction-001 | USD/dok | 0,0007 | 0,0000071 | |
ops-bge-reranker-larger | USD/dok | 0,00014 | 0,000013 | |
ops-text-reranker-001 | 0,00014 | 0,000062 | ||
ops-qwen3-reranker-0.6b | 0,00014 | 0,000015 | ||
ops-video-snapshot-001 | USD per 1.000 unit | 0,016 | ||
ops-audio-asr-001 | USD/jam | 0,09 | ||
Mesin pencari | Alibaba Cloud Elasticsearch: layanan cloud yang sepenuhnya dikelola yang dibangun berdasarkan Elasticsearch open source. Kompatibel 100% dengan fitur open source dan mendukung penggunaan langsung serta penagihan bayar sesuai penggunaan. Untuk informasi lebih lanjut, lihat Alibaba Cloud ES. | |||
OpenSearch-Edisi Pencarian Vektor: Untuk informasi lebih lanjut tentang penagihan, lihat Edisi Pencarian Vektor. | ||||
qwen3-235b-a22b | USD/1.000 token | Input: 0,00056 Output: 0,0056 | ||
qwq-32b | Input: 0,00028 Output: 0,00084 | |||
ops-qwen-turbo | Input: 0,00006 Output: 0,0001 | |||
qwen-turbo | Input: 0,000042 Output: 0,000084 | |||
qwen-plus | Input: 0,000112 Output: 0,00028 | |||
qwen-max | Input: 0,000336 Output: 0,001344 | |||
deepseek-r1 | Input: 0,00056 Output: 0,00224 | |||
deepseek-r1-distill-qwen-7b | Input: 0,00007 Output: 0,00014 | |||
deepseek-r1-distill-qwen-14b | Input: 0,00014 Output: 0,00042 | |||
deepseek-v3 | Input: 0,00028 Output: 0,00112 | |||
| USD/pemanggilan | 0,00735 | ||
USD/1.000 token | Penulisan ulang kueri: Input: 0,000336 Output: 0,001344 | |||
ops-query-analyze-001 | USD/1.000 token | Pengenalan maksud dan ekstensi kueri alternatif:
| ||
Generasi Natural Language to SQL (NL2SQL):
| ||||
Modul evaluasi digunakan untuk mengevaluasi secara komprehensif proses pengembangan Generasi yang Diperkaya dengan Pengambilan Data (RAG) yang disediakan oleh Platform AI Search Terbuka, mulai dari pengguna mengajukan pertanyaan hingga sistem RAG mengambil konten dan LLM menghasilkan jawaban. | USD/1.000 token | Input: 0,0007 Output: 0,0021 | ||
Penyesuaian model
Nama model | Deskripsi | Harga |
Pelatihan kustom untuk model reduksi dimensi vektor memungkinkan Anda menyesuaikan model reduksi dimensi vektor berdasarkan data vektor yang Anda berikan. Dalam skenario bisnis aktual, Anda pertama-tama menggunakan model penyematan untuk memvektorkan teks atau kueri, lalu menggunakan model reduksi dimensi vektor untuk lebih mengurangi dimensi vektor. | Anda dikenakan biaya berdasarkan jumlah CU sumber daya komputasi yang dikonsumsi. Harga setiap CU adalah 0,5422614 USD. Jumlah CU yang dikonsumsi tergantung pada jumlah dan dimensi data pelatihan. Sebagai contoh, untuk melatih model dengan 100.000 data berdimensi 1024, sekitar 250 CU dikonsumsi, dan biayanya adalah 250 × 0,5422614 = 135,56535 USD. |
Penyebaran model
Rumus penagihan: Harga CU × CU per tipe instans × Jumlah instans
Tabel berikut menjelaskan aturan penagihan.
Tipe instans | Harga CU (USD/jam) | CU per mesin | Harga per mesin (USD/jam) |
gpu.v100.16g.x1 | 0,15 | 30,14 | 4,521 |
gpu.t4.16g.x1 | 16,07 | 2,4105 | |
gpu.a10.24g.x1 | 11,01 | 1,6515 |
Sebagai contoh, jika Anda membeli dua instans gpu.a10.24g.x1 untuk menerapkan layanan model, biayanya dihitung sebagai berikut: 0,15 × 11,01 × 2 = 3,303 USD/jam.
Pengembangan layanan
Setelah Anda memulai sebuah instans, Anda akan dikenakan biaya berdasarkan sistem bayar sesuai penggunaan. Biaya dihitung menggunakan rumus berikut: Harga CU × CU per tipe instans × Jumlah instans.
Tabel berikut menjelaskan aturan penagihan.
Tipe instans | Harga CU (USD/jam) | CU per mesin | Harga per mesin (USD/jam) |
gpu.t4.16g.x1 | 0,15 | 16,07 | 2,4105 |
ops.basic1.gi.large | 0,61 | 0,0915 |
Sebagai contoh, jika Anda memilih satu instans ops.basic1.gi.large, biayanya dihitung sebagai berikut: 0,15 × 0,61 × 1 = 0,0915 USD/jam.
Perhatian
Nama layanan sesuai satu-satu dengan ID layanan dan parameter API. Untuk informasi lebih lanjut, lihat Ikhtisar Layanan.
Tagihan dibuat setiap jam berdasarkan penggunaan aktual Anda.
Untuk layanan dengan penetapan harga bertingkat, biaya dihitung berdasarkan penggunaan di setiap tingkat.
Untuk layanan yang menggunakan 1.000 token sebagai satuan penagihan, statistik penggunaan mungkin mencakup desimal.
Pastikan bahwa Akun Alibaba Cloud Anda tidak memiliki pembayaran tertunda untuk menghindari gangguan layanan.
Contoh penagihan
Misalkan di wilayah Jerman (Frankfurt), Anda menggunakan layanan pemisahan dokumen sebanyak 1.000 unit. Perhitungan biaya adalah sebagai berikut:
Biaya untuk 500 unit pertama (inklusif): 0,0009 USD × 500 = 0,45 USD
Biaya untuk unit di atas 500: 0,000003 USD × 500 = 0,0015 USD
Total biaya: 0,45 + 0,0015 = 0,4515 USD