全部产品
Search
文档中心

OpenSearch:Metode penagihan dan item yang dapat ditagih

更新时间:Oct 22, 2025

Topik ini menjelaskan item yang dapat ditagih, metode penagihan, serta aturan penagihan dari Platform AI Search Terbuka.

Item yang dapat ditagih

Platform AI Search Terbuka mengenakan biaya untuk item berikut:

Catatan

Anda dapat mengaktifkan Platform AI Search Terbuka secara gratis. Tidak ada biaya jika Anda tidak menggunakan layanan tersebut.

Metode penagihan

Kecuali layanan mesin pencari, semua layanan di Platform AI Search Terbuka ditagih berdasarkan sistem bayar sesuai penggunaan. Anda dikenakan biaya berdasarkan jumlah pemanggilan layanan dan jam yang dapat ditagih, diukur dalam Compute Units (CUs), yang dikonsumsi oleh pelatihan model kustom. Tagihan dihasilkan setiap jam. Semua tagihan per jam digabungkan menjadi satu pesanan, dan total biaya dipotong dari Akun Alibaba Cloud Anda.

Penting

Mulai 17:00 pada 4 Juli 2024, beberapa layanan mengadopsi penetapan harga bertingkat. Untuk informasi lebih lanjut, lihat aturan penagihan rinci di bagian berikutnya.

Aturan penagihan

Pemanggilan model

Dalam model bahasa besar (LLM), token adalah unit teks terkecil yang dapat diproses dan dipahami oleh model. Token biasanya mewakili segmen teks seperti kata, frasa, karakter, atau simbol. Model yang berbeda mungkin memiliki metode pemisahan mereka sendiri, dan jumlah karakter mungkin tidak sesuai satu-satu dengan jumlah token.

Satuan penagihan untuk token yang digunakan dalam pemanggilan model pada Platform AI Search Terbuka adalah USD/1.000 token. Beberapa layanan mengadopsi penetapan harga bertingkat, dan beberapa layanan ditagih berdasarkan token input dan output.

Catatan

Beberapa model mendukung Perhitungan Token untuk memperkirakan jumlah token yang dihasilkan oleh suatu pemanggilan.

Contoh Penetapan Harga Bertingkat:

Di wilayah Jerman (Frankfurt), jika Anda memanggil layanan penyematan teks jarang dan menghasilkan 1.000.000 token, yang setara dengan 1.000 unit penagihan, biayanya dihitung sebagai berikut: 500 × 0,001 + 500 × 0,0004 = 0,7 USD.

Contoh Penagihan Input dan Output:

Di wilayah Jerman (Frankfurt), jika Anda memanggil model bahasa besar qwen3-235b-a22b dan menghasilkan 1.000 token input dan 1.000 token output, biayanya dihitung sebagai berikut:

1 × 0,0007 + 1 × 0,0028 = 0,0035 USD.

Wilayah Jerman (Frankfurt)

Nama model

ID Model

Satuan penagihan

Harga untuk 0-500 unit

Harga untuk unit di atas 500

Penguraian konten dokumen

ops-document-analyze-001

USD/1.000 token

0,0009

0,000272

USD/gambar

0,00073

USD/tabel

0,00157

Penguraian konten dokumen - Ekstraksi struktur hierarkis berbasis pemahaman semantik

Catatan

Ketika Anda memanggil Layanan Penguraian Konten Dokumen, Anda dapat menggunakan parameter untuk mengontrol apakah akan mengaktifkan fitur ekstraksi struktur hierarki dokumen berdasarkan pemahaman semantik. Jika fitur ini diaktifkan, selain biaya penguraian dokumen, Anda dikenai biaya 0,00052 USD/1.000 token untuk fitur ini.

USD/1.000 token

0,00052

Pengenalan teks gambar

ops-image-analyze-ocr-001

USD/pemanggilan

0,012

0,0031

Pemahaman konten gambar

ops-image-analyze-vlm-001

USD/1.000 token

0,011

Pemisahan dokumen

ops-document-split-001

USD/1.000 token

0,0009

0,000003

Penyematan teks

ops-text-embedding-001

USD/1.000 token

0,0009

0,000072

ops-text-embedding-002

0,0009

0,000054

ops-text-embedding-zh-001

0,0009

0,000022

ops-text-embedding-en-001

0,0009

0,000019

ops-gte-sentence-embedding-multilingual-base

0,0009

0,00003

ops-qwen3-embedding-0.6b

0,0009

0,000062

Penyematan multimodal

Digunakan untuk penyematan teks dan gambar

ops-m2-encoder

Penyematan teks

USD/1.000 token

0,0009

0,000039

ops-m2-encoder

Penyematan gambar

USD/gambar

0,0009

0,000032

ops-m2-encoder-large

Penyematan teks

USD/1.000 token

0,0009

0,000065

ops-m2-encoder-large

Vektorisasi gambar

USD/gambar

0,0009

0,000042

ops-gme-qwen2-vl-2b-instruct

Penyematan teks

USD/1.000 token

0,0009

0,000162

ops-gme-qwen2-vl-2b-instruct

Penyematan gambar

USD/gambar

0,0009

0,000146

Penyematan teks jarang

ops-text-sparse-embedding-001

USD/1.000 token

0,001

0,0004

Layanan reduksi dimensi vektor

ops-embedding-dim-reduction-001

USD/dokumen

0,0009

0,0000064

Layanan pengurutan

ops-bge-reranker-larger

USD/dokumen

0,0005

0,000048

ops-text-reranker-001

0,0005

0,00016

ops-qwen3-reranker-0.6b

0,0005

0,000026

Snapshot video

ops-video-snapshot-001

USD/1.000 gambar

0,03

Pengenalan ucapan

ops-audio-asr-001

USD/jam

0,2

Mesin pencari

Alibaba Cloud Elasticsearch: layanan cloud yang sepenuhnya dikelola yang dibangun berdasarkan Elasticsearch open source. Kompatibel 100% dengan fitur open source dan mendukung penggunaan langsung serta penagihan bayar sesuai penggunaan. Untuk informasi lebih lanjut, lihat Elasticsearch.

OpenSearch-Edisi Pencarian Vektor: Untuk informasi lebih lanjut tentang penagihan, lihat Edisi Pencarian Vektor.

LLM

qwen3-235b-a22b

USD/1.000 token

Input: 0,0007

Output: 0,0028

ops-qwen-turbo

Input: 0,000065

Output: 0,00026

qwen-turbo

Input: 0,00005

Output: 0,0002

qwen-plus

Input: 0,0004

Output: 0,0012

qwen-max

Input: 0,0016

Output: 0,0064

Analisis kueri

ops-query-analyze-001

USD/1.000 token

Input: 0,004

Output: 0,018

Wilayah China (Shanghai)

Nama model

ID model

Satuan penagihan

Harga untuk 0-500 unit

Harga untuk unit di atas 500

Penguraian konten dokumen

ops-document-analyze-001

USD/1.000 token

0,0007

0,00085

USD/gambar

0,0023

USD/tabel

0,005

Penguraian konten dokumen - Ekstraksi struktur hierarkis berbasis pemahaman semantik

Catatan

Saat Anda memanggil Layanan Penguraian Konten Dokumen, Anda dapat menggunakan parameter untuk mengontrol apakah akan mengaktifkan fitur ekstraksi struktur hierarkis dokumen berbasis pemahaman semantik. Jika fitur ini diaktifkan, selain biaya penguraian dokumen, Anda dikenakan biaya 0,00031 USD/1.000 token untuk fitur ini.

USD/1.000 token

0,00031

Pengenalan teks gambar

ops-image-analyze-ocr-001

USD/pemanggilan

0,0112

0,0058

Pemahaman konten gambar

ops-image-analyze-vlm-001

USD/1.000 token

0,0093

Pemisahan dokumen

ops-document-split-001

USD/1.000 token

0,0007

0,000003

Penyematan teks

ops-text-embedding-001

USD/1.000 token

0,0007

0,000023

ops-text-embedding-002

0,0007

0,00007

ops-text-embedding-zh-001

0,0007

0,00001

ops-text-embedding-en-001

0,0007

0,000011

ops-gte-sentence-embedding-multilingual-base

0,0007

0,000025

ops-qwen3-embedding-0.6b

0,0007

0,000071

Penyematan multimodal

Digunakan untuk penyematan teks dan gambar

ops-m2-encoder

Penyematan teks

USD/1.000 token

0,0007

0,000026

ops-m2-encoder

Penyematan gambar

USD/gambar

0,0007

0,0000162

ops-m2-encoder-large

Penyematan teks

USD/1.000 token

0,0007

0,000067

ops-m2-encoder-large

Vektorisasi gambar

USD/gambar

0,0007

0,000033

ops-gme-qwen2-vl-2b-instruct

Penyematan teks

USD/1.000 token

0,0007

0,00008

ops-gme-qwen2-vl-2b-instruct

Vektorisasi gambar

USD/gambar

0,0007

0,000072

Penyematan teks jarang

ops-text-sparse-embedding-001

USD/1.000 token

0,00084

0,00014

Layanan reduksi dimensi vektor

ops-embedding-dim-reduction-001

USD/dok

0,0007

0,0000071

Layanan pengurutan

ops-bge-reranker-larger

USD/dok

0,00014

0,000013

ops-text-reranker-001

0,00014

0,000062

ops-qwen3-reranker-0.6b

0,00014

0,000015

Snapshot video

ops-video-snapshot-001

USD per 1.000 unit

0,016

Pengenalan ucapan

ops-audio-asr-001

USD/jam

0,09

Mesin pencari

Alibaba Cloud Elasticsearch: layanan cloud yang sepenuhnya dikelola yang dibangun berdasarkan Elasticsearch open source. Kompatibel 100% dengan fitur open source dan mendukung penggunaan langsung serta penagihan bayar sesuai penggunaan. Untuk informasi lebih lanjut, lihat Alibaba Cloud ES.

OpenSearch-Edisi Pencarian Vektor: Untuk informasi lebih lanjut tentang penagihan, lihat Edisi Pencarian Vektor.

LLM

qwen3-235b-a22b

USD/1.000 token

Input: 0,00056

Output: 0,0056

qwq-32b

Input: 0,00028

Output: 0,00084

ops-qwen-turbo

Input: 0,00006

Output: 0,0001

qwen-turbo

Input: 0,000042

Output: 0,000084

qwen-plus

Input: 0,000112

Output: 0,00028

qwen-max

Input: 0,000336

Output: 0,001344

deepseek-r1

Input: 0,00056

Output: 0,00224

deepseek-r1-distill-qwen-7b

Input: 0,00007

Output: 0,00014

deepseek-r1-distill-qwen-14b

Input: 0,00014

Output: 0,00042

deepseek-v3

Input: 0,00028

Output: 0,00112

Pencarian web

  • Biaya pencarian web dihitung sebagai berikut: Biaya pemanggilan + Biaya penulisan ulang kueri

    Secara default, model qwen-max digunakan untuk penulisan ulang kueri selama pencarian web.
  • Penggunaan: Anda dapat menggunakan pencarian web dengan dua cara berikut:

    • Langsung memanggil API pencarian web.

    • Aktifkan pencarian web saat menggunakan LLM.

USD/pemanggilan

0,00735

USD/1.000 token

Penulisan ulang kueri:

Input: 0,000336

Output: 0,001344

Analisis kueri

ops-query-analyze-001

USD/1.000 token

Pengenalan maksud dan ekstensi kueri alternatif:

  • Input: 0,001

  • Output: 0,004

Generasi Natural Language to SQL (NL2SQL):

  • Input: 0,00031

  • Output: 0,00078

Evaluasi

Modul evaluasi digunakan untuk mengevaluasi secara komprehensif proses pengembangan Generasi yang Diperkaya dengan Pengambilan Data (RAG) yang disediakan oleh Platform AI Search Terbuka, mulai dari pengguna mengajukan pertanyaan hingga sistem RAG mengambil konten dan LLM menghasilkan jawaban.

USD/1.000 token

Input: 0,0007

Output: 0,0021

Penyesuaian model

Nama model

Deskripsi

Harga

Pelatihan kustom untuk model reduksi dimensi vektor

Pelatihan kustom untuk model reduksi dimensi vektor memungkinkan Anda menyesuaikan model reduksi dimensi vektor berdasarkan data vektor yang Anda berikan. Dalam skenario bisnis aktual, Anda pertama-tama menggunakan model penyematan untuk memvektorkan teks atau kueri, lalu menggunakan model reduksi dimensi vektor untuk lebih mengurangi dimensi vektor.

Anda dikenakan biaya berdasarkan jumlah CU sumber daya komputasi yang dikonsumsi. Harga setiap CU adalah 0,5422614 USD.

Jumlah CU yang dikonsumsi tergantung pada jumlah dan dimensi data pelatihan. Sebagai contoh, untuk melatih model dengan 100.000 data berdimensi 1024, sekitar 250 CU dikonsumsi, dan biayanya adalah 250 × 0,5422614 = 135,56535 USD.

Penyebaran model

Rumus penagihan: Harga CU × CU per tipe instans × Jumlah instans

Tabel berikut menjelaskan aturan penagihan.

Tipe instans

Harga CU (USD/jam)

CU per mesin

Harga per mesin (USD/jam)

gpu.v100.16g.x1

0,15

30,14

4,521

gpu.t4.16g.x1

16,07

2,4105

gpu.a10.24g.x1

11,01

1,6515

Sebagai contoh, jika Anda membeli dua instans gpu.a10.24g.x1 untuk menerapkan layanan model, biayanya dihitung sebagai berikut: 0,15 × 11,01 × 2 = 3,303 USD/jam.

Pengembangan layanan

Setelah Anda memulai sebuah instans, Anda akan dikenakan biaya berdasarkan sistem bayar sesuai penggunaan. Biaya dihitung menggunakan rumus berikut: Harga CU × CU per tipe instans × Jumlah instans.

Tabel berikut menjelaskan aturan penagihan.

Tipe instans

Harga CU (USD/jam)

CU per mesin

Harga per mesin (USD/jam)

gpu.t4.16g.x1

0,15

16,07

2,4105

ops.basic1.gi.large

0,61

0,0915

Sebagai contoh, jika Anda memilih satu instans ops.basic1.gi.large, biayanya dihitung sebagai berikut: 0,15 × 0,61 × 1 = 0,0915 USD/jam.

Perhatian

  • Nama layanan sesuai satu-satu dengan ID layanan dan parameter API. Untuk informasi lebih lanjut, lihat Ikhtisar Layanan.

  • Tagihan dibuat setiap jam berdasarkan penggunaan aktual Anda.

  • Untuk layanan dengan penetapan harga bertingkat, biaya dihitung berdasarkan penggunaan di setiap tingkat.

  • Untuk layanan yang menggunakan 1.000 token sebagai satuan penagihan, statistik penggunaan mungkin mencakup desimal.

  • Pastikan bahwa Akun Alibaba Cloud Anda tidak memiliki pembayaran tertunda untuk menghindari gangguan layanan.

Contoh penagihan

Misalkan di wilayah Jerman (Frankfurt), Anda menggunakan layanan pemisahan dokumen sebanyak 1.000 unit. Perhitungan biaya adalah sebagai berikut:

  • Biaya untuk 500 unit pertama (inklusif): 0,0009 USD × 500 = 0,45 USD

  • Biaya untuk unit di atas 500: 0,000003 USD × 500 = 0,0015 USD

  • Total biaya: 0,45 + 0,0015 = 0,4515 USD

Referensi

Lihat Detail Konsumsi