Penagihan untuk OpenSearch - OpenSearch - Alibaba Cloud Documentation Center

Topik ini menjelaskan item yang dapat ditagih, metode penagihan, serta aturan penagihan Platform Terbuka AI Search.

Item yang dapat ditagih

Platform Terbuka AI Search mengenakan biaya untuk item berikut:

model invocation: Biaya untuk memanggil layanan model, seperti Layanan Pemrosesan Konten Dokumen, layanan text embedding, dan layanan sorting. Biaya dihitung berdasarkan penggunaan token.
model customization (hanya Wilayah China (Shanghai)): Biaya untuk menyesuaikan model yang disediakan oleh Platform Terbuka AI Search dengan data Anda sendiri, seperti pelatihan kustom layanan pengurangan dimensi vektor. Penagihan didasarkan pada sumber daya komputasi yang digunakan.
Model deployment (hanya Wilayah China (Shanghai)): Anda dikenai biaya deployment dan pemanggilan saat menerapkan model dari berbagai sumber di Platform Terbuka AI Search.
Service development (hanya Wilayah China (Shanghai)): Platform Terbuka AI Search mengintegrasikan fitur PAI Distribution Switch (DSW). Anda dapat menggunakan Notebook di platform untuk mengembangkan dan mengeksekusi layanan.

Catatan

Anda dapat mengaktifkan Platform Terbuka AI Search secara gratis. Anda tidak dikenai biaya jika tidak menggunakan layanan tersebut.

Metode penagihan

Kecuali layanan mesin pencari, semua layanan di Platform Terbuka AI Search ditagih berdasarkan sistem pay-as-you-go. Anda dikenai biaya berdasarkan jumlah pemanggilan layanan dan jam yang dapat ditagih, diukur dalam Compute Units (CU), yang dikonsumsi oleh pelatihan model kustom. Tagihan dibuat setiap jam. Semua tagihan per jam digabungkan menjadi satu Pesanan, dan total biaya dipotong dari Akun Alibaba Cloud Anda.

Penting

Mulai pukul 17.00 pada 4 Juli 2024, beberapa layanan menerapkan harga bertingkat. Untuk informasi lebih lanjut, lihat aturan penagihan terperinci di bagian berikut.

Aturan penagihan

Pemanggilan model

Dalam large language model (LLM), token adalah unit teks terkecil yang dapat diproses dan dipahami oleh model. Token biasanya merepresentasikan segmen teks seperti kata, frasa, karakter, atau simbol. Model yang berbeda mungkin memiliki metode chunking sendiri, dan jumlah karakter tidak selalu berkorespondensi satu-satu dengan jumlah token.

Unit penagihan untuk token yang digunakan dalam pemanggilan model di Platform Terbuka AI Search adalah USD/1.000 token. Beberapa layanan menerapkan harga bertingkat, dan beberapa layanan ditagih berdasarkan token input dan output.

Catatan

Beberapa model mendukung Token calculation untuk memperkirakan jumlah token yang dihasilkan oleh satu kali pemanggilan.

Contoh harga bertingkat:

Di wilayah Jerman (Frankfurt), jika Anda memanggil layanan sparse text embedding dan menghasilkan 1.000.000 token, yang setara dengan 1.000 unit penagihan, biayanya dihitung sebagai berikut: 500 × 0,001 + 500 × 0,0004 = 0,7 USD.

Contoh penagihan berdasarkan input dan output:

Di wilayah Jerman (Frankfurt), jika Anda memanggil large language model qwen3-235b-a22b dan menghasilkan 1.000 token input serta 1.000 token output, biayanya dihitung sebagai berikut:

1 × 0,0007 + 1 × 0,0028 = 0,0035 USD.

Wilayah China (Shanghai)

Nama model	ID model	Unit penagihan	Harga untuk 0-500 unit	Harga untuk unit di atas 500
Document content parsing	ops-document-analyze-001	USD/1.000 token	0,0007	0,00085
		USD/image	0,0023
		USD/table	0,005
Document content parsing - Extraction of hierarchical structure based on semantic understanding Catatan Saat Anda memanggil Layanan Pemrosesan Konten Dokumen, Anda dapat menggunakan parameter untuk mengontrol apakah akan mengaktifkan fitur ekstraksi struktur hierarkis dokumen berdasarkan pemahaman semantik. Jika fitur ini diaktifkan, selain biaya parsing dokumen, Anda dikenai biaya tambahan sebesar 0,00031 USD/1.000 token untuk fitur ini.		USD/1.000 token	0,00031
Image text recognition	ops-image-analyze-ocr-001	USD/call	0,0112	0,0058
Image content understanding	ops-image-analyze-vlm-001	USD/1.000 token	0,0093
Document chunking	ops-document-split-001	USD/1.000 token	0,0007	0,000003
Text embedding	ops-text-embedding-001	USD/1.000 token	0,0007	0,000023
	ops-text-embedding-002		0,0007	0,00007
	ops-text-embedding-zh-001		0,0007	0,00001
	ops-text-embedding-en-001		0,0007	0,000011
	ops-gte-sentence-embedding-multilingual-base		0,0007	0,000025
	ops-qwen3-embedding-0.6b		0,0007	0,000071
Multimodal embedding Untuk penyematan teks dan gambar	ops-m2-encoder Text embedding	USD/1.000 token	0,0007	0,000026
	ops-m2-encoder Image embedding	USD/image	0,0007	0,0000162
	ops-m2-encoder-large Text embedding	USD/1.000 token	0,0007	0,000067
	ops-m2-encoder-large Image embedding	USD/image	0,0007	0,000033
	ops-gme-qwen2-vl-2b-instruct Text embedding	USD/1.000 token	0,0007	0,00008
	ops-gme-qwen2-vl-2b-instruct Image vectorization	USD/image	0,0007	0,000072
	`ops-mm-embedding-face-001` Image vectorization	USD/1.000 token	0,0041	0,00041
Sparse text embedding	ops-text-sparse-embedding-001	USD/1.000 token	0,00084	0,00014
Vector dimension reduction service	ops-embedding-dim-reduction-001	USD/doc	0,0007	0,0000071
Sorting service	ops-bge-reranker-larger	USD/doc	0,00014	0,000013
	ops-text-reranker-001		0,00014	0,000062
	ops-qwen3-reranker-0.6b		0,00014	0,000015
Video snapshot	ops-video-snapshot-001	USD/1.000 gambar	0,016
Speech recognition	ops-audio-asr-001	USD/jam	0,09
Search engine	Alibaba Cloud Elasticsearch: layanan cloud terkelola penuh yang dibangun berdasarkan Elasticsearch open source. Layanan ini 100% kompatibel dengan fitur open source dan mendukung penggunaan langsung serta penagihan pay-as-you-go. Untuk informasi lebih lanjut, lihat Alibaba Cloud ES.
Search engine	OpenSearch-Vector Search Edition: Untuk informasi lebih lanjut tentang penagihan, lihat Vector Search Edition.
LLM	qwen3-235b-a22b	USD/1.000 token	Input: 0,00056 Output: 0,0056
	ops-qwen-turbo		Input: 0,00006 Output: 0,0001
	qwen-turbo		Input: 0,000042 Output: 0,000084
	qwen-plus		Input: 0,000112 Output: 0,00028
	qwen-max		Input: 0,000336 Output: 0,001344
	deepseek-r1		Input: 0,00056 Output: 0,00224
	deepseek-r1-distill-qwen-7b		Input: 0,00007 Output: 0,00014
	deepseek-r1-distill-qwen-14b		Input: 0,00014 Output: 0,00042
	deepseek-v3		Input: 0,00028 Output: 0,00112
Web search	Biaya web search dihitung sebagai berikut: Biaya pemanggilan + Biaya penulisan ulang kueri Secara default, model qwen-max digunakan untuk penulisan ulang kueri selama web search. Penggunaan: Anda dapat menggunakan web search dengan dua cara berikut: Memanggil API web search secara langsung. Mengaktifkan web search saat menggunakan LLM.	USD/call	0,00735
Web search		USD/1.000 token	Penulisan ulang kueri: Input: 0,000336 Output: 0,001344
Query analysis	ops-query-analyze-001	USD/1.000 token	Pengenalan maksud dan ekstensi kueri alternatif: Input: 0,001 Output: 0,004
Query analysis	ops-query-analyze-001	USD/1.000 token	Generasi Natural Language to SQL (NL2SQL): Input: 0,00031 Output: 0,00078
Object detection	`ops-object-detect-face-001`	USD/image	0,00029
Evaluation	Modul penilaian digunakan untuk mengevaluasi secara komprehensif proses pengembangan retrieval-augmented generation (RAG) yang disediakan oleh Platform Terbuka untuk AI Search, mulai dari pengguna mengajukan pertanyaan hingga sistem RAG mengambil konten dan LLM menghasilkan jawaban.	USD/1.000 token	Input: 0,0007 Output: 0,0021

Penyesuaian model

Nama model

Deskripsi

Harga

Pelatihan kustom untuk model pengurangan dimensi vektor

Pelatihan kustom untuk model pengurangan dimensi vektor memungkinkan Anda menyesuaikan model pengurangan dimensi vektor berdasarkan data vektor yang Anda sediakan. Dalam skenario bisnis aktual, Anda pertama-tama menggunakan model embedding untuk melakukan vektorisasi teks atau kueri, lalu menggunakan model pengurangan dimensi vektor untuk lebih lanjut mengurangi dimensi vektor tersebut.

Anda dikenai biaya berdasarkan jumlah CU sumber daya komputasi yang dikonsumsi. Harga setiap CU adalah 0,5422614 USD.

Jumlah CU yang dikonsumsi bergantung pada jumlah dan dimensi data pelatihan. Misalnya, untuk melatih model dengan 100.000 data berdimensi 1.024, sekitar 250 CU dikonsumsi, dan biayanya adalah 250 × 0,5422614 = 135,56535 USD.

Penerapan model

Rumus penagihan: harga CU × CU per tipe instans × Jumlah instans

Tabel berikut menjelaskan aturan penagihan.

Tipe instans	Harga CU (USD/jam)	CU per mesin	Harga per mesin (USD/jam)
gpu.v100.16g.x1	0,15	30,14	4,521
gpu.t4.16g.x1		16,07	2,4105
gpu.a10.24g.x1		11,01	1,6515

Sebagai contoh, jika Anda membeli dua instans gpu.a10.24g.x1 untuk menerapkan layanan model, biayanya dihitung sebagai berikut: 0,15 × 11,01 × 2 = 3,303 USD/jam.

Pengembangan layanan

Setelah Anda memulai instans, Anda dikenai biaya berdasarkan sistem pay-as-you-go. Biaya dihitung menggunakan rumus berikut: harga CU × CU per tipe instans × Jumlah instans.

Tabel berikut menjelaskan aturan penagihan.

Tipe instans	Harga CU (USD/jam)	CU per mesin	Harga per mesin (USD/jam)
gpu.t4.16g.x1	0,15	16,07	2,4105
ops.basic1.gi.large	0,15	0,61	0,0915

Sebagai contoh, jika Anda memilih satu instans ops.basic1.gi.large, biayanya dihitung sebagai berikut: 0,15 × 0,61 × 1 = 0,0915 USD/jam.

Wilayah Jerman (Frankfurt)

Nama model	ID model	Unit penagihan	Harga untuk 0-500 unit	Harga untuk unit di atas 500
Document content parsing	ops-document-analyze-001	USD/1.000 token	0,0009	0,000272
		USD/image	0,00073
		USD/table	0,00157
Document content parsing - Extraction of hierarchical structure based on semantic understanding Catatan Saat Anda memanggil Layanan Pemrosesan Konten Dokumen, Anda dapat menggunakan parameter untuk mengontrol apakah akan mengaktifkan fitur ekstraksi struktur hierarkis dokumen berdasarkan pemahaman semantik. Jika fitur ini diaktifkan, selain biaya parsing dokumen, Anda dikenai biaya tambahan sebesar 0,00052 USD/1.000 token untuk fitur ini.		USD/1.000 token	0,00052
Image text recognition	ops-image-analyze-ocr-001	USD/call	0,012	0,0031
Image content understanding	ops-image-analyze-vlm-001	USD/1.000 token	0,011
Document chunking	ops-document-split-001	USD/1.000 token	0,0009	0,000003
Text embedding	ops-text-embedding-001	USD/1.000 token	0,0009	0,000072
	ops-text-embedding-002		0,0009	0,000054
	ops-text-embedding-zh-001		0,0009	0,000022
	ops-text-embedding-en-001		0,0009	0,000019
	ops-gte-sentence-embedding-multilingual-base		0,0009	0,00003
	ops-gte-sentence-embedding-multilingual-base		0,0009	0,00003
	ops-qwen3-embedding-0.6b		0,0009	0,000062
Multimodal embedding Untuk penyematan teks dan gambar	ops-m2-encoder Text embedding	USD/1.000 token	0,0009	0,000039
	ops-m2-encoder Image embedding	USD/image	0,0009	0,000032
	ops-m2-encoder-large Text embedding	USD/1.000 token	0,0009	0,000065
	ops-m2-encoder-large Image Vectorization	USD/image	0,0009	0,000042
	ops-gme-qwen2-vl-2b-instruct Text embedding	USD/1.000 token	0,0009	0,000162
	ops-gme-qwen2-vl-2b-instruct Image embedding	USD/image	0,0009	0,000146
	`ops-mm-embedding-face-001` Image vectorization	USD/1.000 token	0,007	0,0007
Sparse text embedding	ops-text-sparse-embedding-001	USD/1.000 token	0,001	0,0004
Vector dimension reduction service	ops-embedding-dim-reduction-001	USD/doc	0,0009	0,0000064
Sorting service	ops-bge-reranker-larger	USD/doc	0,0005	0,000048
	ops-text-reranker-001		0,0005	0,00016
	ops-text-reranker-001		0,0005	0,00016
	ops-qwen3-reranker-0.6b		0,0005	0,000026
Video snapshot	ops-video-snapshot-001	USD/1.000 gambar	0,03
Speech recognition	ops-audio-asr-001	USD/jam	0,2
Search engine	Alibaba Cloud Elasticsearch: layanan cloud terkelola penuh yang dibangun berdasarkan Elasticsearch open source. Layanan ini 100% kompatibel dengan fitur open source dan mendukung penggunaan langsung serta penagihan pay-as-you-go. Untuk informasi lebih lanjut, lihat Elasticsearch.
Search engine	OpenSearch-Vector Search Edition: Untuk informasi lebih lanjut tentang penagihan, lihat Vector Search Edition.
LLM	qwen3-235b-a22b	USD/1.000 token	Input: 0,0007 Output: 0,0028
	ops-qwen-turbo		Input: 0,000065 Output: 0,00026
	qwen-turbo		Input: 0,00005 Output: 0,0002
	qwen-plus		Input: 0,0004 Output: 0,0012
	qwen-max		Input: 0,0016 Output: 0,0064
Query analysis	ops-query-analyze-001	USD/1.000 token	Input: 0,004 Output: 0,018
Object detection	`ops-object-detect-face-001`	USD/image	0,00029

Peringatan

Nama layanan berkorespondensi satu-satu dengan ID layanan dan parameter API. Untuk informasi lebih lanjut, lihat Ikhtisar layanan.
Tagihan dibuat setiap jam berdasarkan penggunaan aktual Anda.
Untuk layanan dengan harga bertingkat, biaya dihitung berdasarkan penggunaan di setiap tingkat.
Untuk layanan yang menggunakan 1.000 token sebagai unit penagihan, statistik penggunaan mungkin mencakup angka desimal.
Pastikan Akun Alibaba Cloud Anda tidak memiliki Pembayaran tertunda untuk menghindari gangguan layanan.

Contoh penagihan

Asumsikan di wilayah Jerman (Frankfurt), Anda memanggil layanan document chunking sebanyak 1.000 unit. Biayanya dihitung sebagai berikut:

Biaya untuk 500 unit pertama (termasuk): 0,0009 USD × 500 = 0,45 USD
Biaya untuk unit di atas 500: 0,000003 USD × 500 = 0,0015 USD
Total biaya: 0,45 + 0,0015 = 0,4515 USD

Referensi

Lihat detail tagihan