Basis pengetahuan - Alibaba Cloud Model Studio - Alibaba Cloud Documentation Center

Basis pengetahuan melengkapi model bahasa besar (LLM) dengan data privat dan informasi terkini. Dengan menggunakan Generasi yang Diperkaya dengan Pengambilan Data (Retrieval-Augmented Generation/RAG), LLM mengambil konten relevan dari basis pengetahuan untuk menghasilkan jawaban yang lebih akurat.

Penting

Batasan akses Konsol: Hanya pengguna yang membuat aplikasi Alibaba Cloud Model Studio di wilayah Singapura sebelum 21 April 2025 yang dapat mengakses tab Application Development.
Tab ini berisi fitur-fitur berikut: Applications (aplikasi agen dan aplikasi alur kerja), Components (rekayasa prompt dan plug-in), dan Data (basis pengetahuan dan data aplikasi). Semua fitur ini merupakan fitur pratinjau. Gunakan dengan hati-hati di lingkungan produksi.
Batasan pemanggilan API: Hanya pengguna yang membuat aplikasi Alibaba Cloud Model Studio di wilayah Singapura sebelum 21 April 2025 yang dapat memanggil API data aplikasi, basis pengetahuan, dan rekayasa prompt.

Aplikasi tanpa basis pengetahuan khusus

LLM tanpa basis pengetahuan khusus tidak dapat menjawab pertanyaan spesifik domain secara akurat.

Aplikasi dengan basis pengetahuan khusus

LLM dengan basis pengetahuan khusus dapat menjawab pertanyaan spesifik domain secara akurat.

Model yang didukung

Model-model berikut mendukung basis pengetahuan. Mengonfigurasi basis pengetahuan untuk Qwen

Qwen-Max/Plus/Turbo
QwenVL-Max/Plus
Versi open-source Qwen (misalnya, Qwen2.5)

Daftar ini dapat berubah sewaktu-waktu. Untuk daftar terbaru, lihat halaman Manajemen Aplikasi saat Anda membuat aplikasi.

Panduan cepat

Bagian ini menunjukkan cara membangun aplikasi tanya-jawab LLM yang menjawab pertanyaan spesifik domain tanpa menulis kode apa pun. Panduan ini menggunakan "seri ponsel Alibaba Cloud Model Studio" sebagai contoh.

1. Bangun basis pengetahuan

Buka halaman Basis pengetahuan, lalu klik Create Knowledge Base. isi Name dan Description, biarkan pengaturan lainnya tetap default, lalu klik Next Step.
Pilih Default Category dan unggah file Alibaba Cloud Model Studio Phone Series Product Introduction.docx. Klik Next Step, lalu klik Complete.

2. Integrasi dengan aplikasi bisnis

Setelah membuat basis pengetahuan, kaitkan dengan aplikasi Alibaba Cloud Model Studio atau aplikasi eksternal dalam ruang kerja yang sama untuk memproses permintaan pengambilan data.

Aplikasi agen

Buka halaman App Center, temukan aplikasi agen target, klik Configure pada kartunya, lalu pilih model untuk aplikasi tersebut.

Klik tombol + di sebelah kanan Document Knowledge Base untuk menambahkan basis pengetahuan yang telah Anda buat. Anda dapat membiarkan ambang batas kemiripan dan bobot pada nilai default-nya.

(Opsional) Ambang batas kemiripan: Menyaring hasil pengambilan data

Basis pengetahuan menggunakan pencarian semantik untuk menemukan teks dalam data atau file privat Anda yang relevan secara semantik dengan kueri, meskipun kata kuncinya sama sekali berbeda.

Misalnya, pengguna mengirimkan kueri berikut: Ponsel Alibaba Cloud mana yang terbaik untuk fotografi?

Hasil yang paling relevan (misalnya, teks tentang Qwen Vivid 7) mungkin tidak mengandung kata kunci apa pun dari kueri tersebut.

Dalam tabel di bawah ini, kemiripan kata kunci dihitung menggunakan indeks Jaccard, dan kemiripan semantik adalah kemiripan cosinus yang dihitung oleh model text-embedding-v4.

Teks yang diambil	Kemiripan kata kunci	Kemiripan semantik
Qwen Vivid 7: Pengalaman baru dalam fotografi cerdas	0	0,43
Alibaba Cloud Model Studio Ace Ultra: Pilihan bagi para gamer	0,17	0,32
Alibaba Cloud Model Studio Flex Fold+: Era baru layar lipat	0,25	0,24

Ambang batas kemiripan: Hanya potongan teks dengan skor kemiripan semantik yang lebih tinggi dari ambang batas ini yang diambil. Mengatur ambang batas terlalu tinggi dapat menyaring potongan teks yang relevan.

(Opsional) Bobot: Mempengaruhi urutan pengambilan data untuk beberapa basis pengetahuan

Saat aplikasi agen dikaitkan dengan beberapa basis pengetahuan, Anda dapat memberikan bobot berdasarkan pentingnya setiap sumber informasi. Selama pengambilan data multi-jalur, jika potongan teks dari basis pengetahuan berbeda memiliki skor kemiripan yang sama, sistem memrioritaskan potongan teks dari basis pengetahuan dengan bobot lebih tinggi.

Batasan utama: Bobot hanya berlaku antar basis pengetahuan dengan jenis yang sama. Misalnya, bobot basis pengetahuan pencarian dokumen tidak memengaruhi urutan pengambilan data basis pengetahuan kueri data, dan sebaliknya.
Cara kerja: Sistem pertama-tama menghitung relevansi antara kueri pengguna dan konten di setiap basis pengetahuan untuk menyaring potongan teks yang paling relevan. Kemudian, sistem mengalikan skor kemiripan setiap potongan teks dengan bobot basis pengetahuan yang sesuai. Setelah penyusunan ulang berbobot, hasilnya diteruskan ke LLM sebagai konteks. Potongan teks dengan skor berbobot lebih tinggi diprioritaskan oleh LLM.

Pada kotak input di sisi kanan halaman, masukkan pertanyaan. LLM akan menggunakan basis pengetahuan yang Anda buat untuk menghasilkan jawaban.

Misalnya: "Bantu saya memilih ponsel Alibaba Cloud Model Studio dengan kamera terbaik di bawah 3.000 CNY."

Aplikasi alur kerja

Buka halaman App Center, temukan aplikasi alur kerja target, lalu klik Konfigurasikan pada kartunya. Seret node basis pengetahuan ke kanvas dan hubungkan setelah node Start.
Konfigurasikan node basis pengetahuan:
1. Input: Di sebelah kanan variabel content, klik daftar drop-down Value dan pilih Built-in Variable. Anda mungkin perlu membuka grup "Built-in Variable" untuk menemukan variabel query.
2. Pilih Basis Pengetahuan: Node basis pengetahuan menawarkan dua metode pemilihan:
  - Pilih basis pengetahuan tetap: Pilih basis pengetahuan yang telah Anda buat dari menu drop-down. Gunakan metode ini ketika basis pengetahuan yang sama diperlukan untuk setiap panggilan.
  - Pemilihan Dinamis: Konfigurasikan variabel CodeList untuk secara dinamis menentukan basis pengetahuan mana yang akan digunakan berdasarkan output dari node hulu. Gunakan metode ini untuk mengambil data dari basis pengetahuan berbeda berdasarkan input yang bervariasi.
3. Tentukan TopK (Opsional): Menentukan jumlah potongan teks yang dikembalikan ke node hilir (biasanya node LLM).
  
  Meningkatkan nilai ini biasanya meningkatkan akurasi jawaban LLM tetapi juga meningkatkan konsumsi token input LLM.
Seret node LLM ke kanvas dan hubungkan setelah node basis pengetahuan serta sebelum node end.
Konfigurasikan node LLM:
1. Pada daftar Model configuration, pilih model untuk node tersebut.
2. Pada bidang Prompt, masukkan prompt yang menginstruksikan LLM untuk menggunakan basis pengetahuan. Masukkan "/" untuk memasukkan variabel result, yang merepresentasikan hasil dari pengambilan data basis pengetahuan.
Konfigurasikan node akhir: Masukkan / dan pilih untuk menetapkan respons LLM sebagai output akhir.
Klik Test di pojok kanan atas halaman. Pada kotak input di sebelah kanan, masukkan pertanyaan. LLM akan menggunakan basis pengetahuan yang Anda buat untuk menghasilkan jawaban.

Misalnya: "Bantu saya memilih ponsel Alibaba Cloud Model Studio dengan kamera terbaik di bawah 3.000 CNY."

Aplikasi eksternal

Selain membangun aplikasi di Alibaba Cloud Model Studio, Anda dapat menggunakan Alibaba Cloud Model Studio SDK untuk mengintegrasikan pengambilan data basis pengetahuan ke dalam aplikasi AI eksternal.

Untuk langkah-langkah integrasi terperinci, lihat Panduan API Basis Pengetahuan.

3. Optimalkan kinerja RAG (Opsional)

Jika hasil pengambilan data tidak lengkap atau tidak akurat selama proses tanya-jawab, lihat Optimalisasi kinerja RAG.

Aksi

Di halaman basis pengetahuan, Anda dapat melihat dan mengelola semua basis pengetahuan dalam ruang kerja saat ini.

ID basis pengetahuan: Nilai bidang ID pada setiap kartu basis pengetahuan, digunakan untuk pemanggilan API.

Buat basis pengetahuan

Klik Create Knowledge Base, ikuti tiga langkah: berikan informasi dasar dan pilih jenis basis pengetahuan, konfigurasikan sumber data, dan atur parameter pengindeksan.

Dari halaman basis pengetahuan, klik Create Knowledge Base.
Berikan informasi dasar

Pilih Knowledge Base Type berdasarkan kasus penggunaan Anda. Setiap basis pengetahuan hanya mendukung satu jenis. Jika Anda memilih jenis pencarian dokumen, Anda juga harus memilih kasus penggunaan: tanya-jawab dokumen dasar, balasan teks kaya:
- Tanya-jawab dokumen dasar: Ideal untuk pengambilan data semantik dokumen teks biasa.
- Balasan teks kaya: Ideal untuk respons yang berisi teks kaya.
Jenis basis pengetahuan tidak dapat diubah setelah pembuatan.
- Pencarian dokumen (skenario pengambilan data)
  - Kasus penggunaan
    - Skenario ini cocok untuk mengambil data tidak terstruktur, seperti dokumen internal perusahaan dan manual produk. Data tidak terstruktur tidak diorganisir dalam skema tabel yang telah ditentukan dan dapat mencakup teks, tabel, dan gambar.
    - Jika file Anda berisi gambar yang ingin disertakan dalam respons aplikasi Alibaba Cloud Model Studio Anda, pilih Pencarian dokumen.
  - Sumber data: Anda dapat mengunggah file lokal atau mengimpornya dari Object Storage Service (OSS).
    Instruksi pembuatan (pencarian dokumen)
    Pilih data: Tentukan sumber data, yang dapat berupa file atau konten, untuk diimpor ke basis pengetahuan guna pengambilan data. Anda dapat menggunakan unggah lokal atau impor cloud (dengan memilih kategori atau file yang sudah ada).
    
    Unggah lokal: Unggah file langsung dari komputer Anda. Buka panel yang dapat dilipat di bawah ini untuk mempelajari cara memilih metode penguraian.
    
    Metode penguraian (pengaturan kustom)
    
    Konfigurasikan strategi penguraian sesuai kebutuhan. Jika Anda tidak yakin metode mana yang harus dipilih, kami menyarankan menggunakan pengaturan default.
    
    Digital Parsing: Tidak mengurai ilustrasi atau grafik dalam file. Ini adalah metode penguraian tercepat, biasanya memakan waktu beberapa detik hingga satu menit untuk dokumen teks biasa 10–20 halaman.
    
    Penguraian Dokumen Cerdas: Mengenali dan mengekstraksi teks dari ilustrasi untuk menghasilkan ringkasan. Ringkasan ini, bersama dengan konten non-gambar lainnya, dipecah menjadi potongan dan divectorisasi untuk pengambilan data basis pengetahuan. Metode ini relatif cepat, biasanya memakan waktu satu hingga lima menit untuk dokumen 10–20 halaman yang berisi ilustrasi.
    
    Penguraian LLM: Aplikasi yang menggunakan model Qwen-VL dapat menjawab pertanyaan tentang konten ilustrasi dan grafik. Untuk mengenali dan memahami konten ini, pilih LLM Parsing. Karena metode ini memerlukan pemanggilan LLM untuk pemahaman mendalam, biasanya memakan waktu dua hingga sepuluh menit untuk dokumen 10–20 halaman yang berisi grafik.
    
    Penguraian Qwen-VL: Metode ini dirancang untuk file gambar. Anda dapat menentukan model Qwen-VL dan memberikan prompt untuk memandu pengenalan dan ekstraksi tata letak serta elemen gambar. Mengurai satu gambar biasanya memakan waktu beberapa detik hingga satu menit.
    
    Impor cloud: Impor file yang sudah ada dari Object Storage Service (OSS).
    
    Konfigurasi indeks: Tentukan cara data yang diimpor diproses dan disimpan, yang secara langsung memengaruhi kinerja pengambilan data.
    
    Di antara pengaturan berikut, hanya penyimpanan vektor dengan AnalyticDB for PostgreSQL (ADB-PG) yang mungkin dikenai biaya. Semua konfigurasi lainnya gratis.
    
    Ekstraksi metadata
    
    Metadata terdiri dari atribut tambahan yang terkait dengan data tidak terstruktur. Atribut-atribut ini diintegrasikan ke dalam potongan sebagai pasangan kunci-nilai.
    
    Tujuan: Metadata memberikan konteks penting untuk potongan dan dapat secara signifikan meningkatkan akurasi pengambilan data. Misalnya, pertimbangkan basis pengetahuan yang berisi ribuan file pengenalan produk di mana nama file adalah nama produk. Jika pengguna mencari "gambaran fungsi Produk A," dan isi setiap file berisi "gambaran fungsi" tetapi tidak ada yang menyebut "Produk A," basis pengetahuan mungkin mengambil banyak potongan yang tidak relevan. Namun, jika Anda menambahkan nama produk sebagai metadata ke semua potongan, basis pengetahuan dapat secara akurat menyaring potongan yang terkait dengan "Produk A" dan juga berisi "gambaran fungsi." Hal ini meningkatkan akurasi pengambilan data dan mengurangi konsumsi token input LLM.
    
    Penggunaan: Saat Anda memanggil aplikasi melalui API, Anda dapat menentukan metadata dalam parameter permintaan metadata_filter. Saat aplikasi mengambil informasi dari basis pengetahuan, aplikasi tersebut pertama-tama menyaring file yang relevan berdasarkan metadata yang ditentukan.
    
    Catatan: Anda tidak dapat mengonfigurasi ekstraksi metadata setelah basis pengetahuan dibuat.
    
    Cara mengonfigurasi metadata
    
    Aktifkan Ekstraksi metadata, lalu klik Settings untuk melampirkan metadata seragam atau personal ke semua file dalam basis pengetahuan. Selama pemotongan, metadata untuk setiap file diintegrasikan ke dalam potongannya masing-masing. Gambar berikut menunjukkan templat metadata yang digunakan dalam contoh sebelumnya:
    
    Buat templat metadata
    
    Metode ekstraksi nilai:
    
    Konstan: Melampirkan atribut tetap ke semua file dalam basis pengetahuan.
    
    Seperti yang ditunjukkan dalam contoh sebelumnya, jika semua file dalam basis pengetahuan memiliki penulis yang sama, Anda dapat menetapkan konstan untuk bidang bernama author.
    
    Variabel: Melampirkan atribut variabel ke setiap file dalam basis pengetahuan. Atribut yang saat ini didukung adalah file_name dan cat_name. Jika Anda memilih file_name, Alibaba Cloud Model Studio melampirkan nama file ke metadatanya, seperti yang ditunjukkan dalam contoh sebelumnya. Jika Anda memilih cat_name, Alibaba Cloud Model Studio melampirkan nama kategori yang berisi file ke metadata file tersebut.
    
    LLM: Sistem mencocokkan konten teks setiap file dalam basis pengetahuan dengan aturan Deskripsi Entitas yang dikonfigurasi untuk secara otomatis mengidentifikasi dan mengekstraksi informasi yang relevan, yang kemudian dilampirkan sebagai atribut ke metadata file.
    
    Seperti yang ditunjukkan dalam templat metadata pada contoh sebelumnya, untuk mengekstraksi semua tahun yang muncul di setiap file sebagai atribut file, Anda dapat mengonfigurasi bidang LLM bernama date. Deskripsi entitas dikonfigurasi sebagai berikut:
    
    RegEx: Sistem mencocokkan konten teks setiap file dalam basis pengetahuan dengan ekspresi reguler yang ditentukan. Konten yang cocok dengan ekspresi diekstraksi dan ditambahkan sebagai atribut ke metadata file.
    
    Seperti yang ditunjukkan dalam templat meta informasi pada contoh di atas, jika Anda ingin mengekstraksi semua referensi yang muncul di setiap file (dengan asumsi referensi dimulai dengan 《 dan diakhiri dengan 》), Anda dapat mengonfigurasi bidang ekspresi reguler bernama reference. Ekspresi reguler dikonfigurasi sebagai berikut:
    
    Pencarian kata kunci: Sistem mencari setiap file untuk kata kunci yang telah ditentukan dan menambahkan kata kunci yang cocok sebagai atribut ke metadata file.
    
    Misalnya, dalam templat metadata pada contoh sebelumnya, kata kunci yang telah ditentukan adalah:
    
    Karena file hanya berisi kata kunci "financing," "industry," "green," dan "capital," sistem hanya mengekstraksi keempat kata kunci ini sebagai nilai untuk atribut keywords file tersebut.
    
    Digunakan untuk Pengambilan Data: Saat diaktifkan, baik metadata (bidang dan nilai) maupun konten potongan digunakan untuk pengambilan data. Saat dinonaktifkan, hanya konten potongan yang digunakan untuk pengambilan data.
    
    Digunakan untuk Balasan Model: Saat diaktifkan, baik metadata (bidang dan nilai) maupun konten potongan diberikan ke LLM untuk menghasilkan respons. Saat dinonaktifkan, hanya konten potongan yang diberikan.
    
    Rakit header Excel
    
    Saat diaktifkan, basis pengetahuan memperlakukan baris pertama semua file XLSX dan XLS sebagai header dan secara otomatis menambahkannya ke setiap potongan (baris data). Hal ini mencegah LLM salah mengartikan header sebagai baris data biasa.
    
    Anda tidak perlu mengaktifkan pengaturan ini jika basis pengetahuan berisi file dalam format lain, seperti PDF.
    
    Metode pemotongan
    
    Pilih pemotongan cerdas (direkomendasikan).
    
    Tujuan: Basis pengetahuan membagi file menjadi potongan dan mengonversi potongan-potongan tersebut menjadi vektor menggunakan model penyematan. Potongan dan vektor tersebut kemudian disimpan sebagai pasangan kunci-nilai dalam database vektor. Setelah basis pengetahuan dibuat, Anda dapat melihat atau mengedit konten spesifik (teks dan gambar) setiap potongan.
    
    Catatan: Setelah basis pengetahuan dibuat, pengaturan pemotongan dokumen tidak dapat diubah. Strategi pemotongan yang tidak tepat dapat mengurangi kinerja pengambilan data dan recall.
    
    Penulisan ulang percakapan multi-putaran
    
    Saat diaktifkan, sistem menggunakan model ringan khusus untuk menulis ulang kueri pengguna saat ini menjadi kueri mandiri dengan konteks lengkap dengan memasukkan riwayat percakapan. Sistem kemudian menggunakan kueri yang ditulis ulang ini untuk mengambil informasi dari basis pengetahuan.
    
    Model penyematan
    
    Model penyematan mengonversi prompt input asli dan teks pengetahuan menjadi vektor numerik untuk menghitung kemiripan semantik. Model default Vektor Resmi (text-embedding-v2) mendukung berbagai bahasa selain Tionghoa dan Inggris serta menormalisasi vektor yang dihasilkan. Pengaturan ini tidak dapat diubah.
    
    Dimensi vektor yang dihasilkan oleh basis pengetahuan menggunakan (tidak dapat dimodifikasi):
    
    Vektor Resmi (text-embedding-v2): 1.536 dimensi
    
    penyematan multimoda qwen3 (qwen3-vl-embedding): Diaktifkan secara otomatis saat kasus penggunaan Pemahaman visual dipilih. Model ini mendukung pembuatan vektor untuk gambar dan dokumen teks kaya setelah pemahaman visual.
    
    Model penyusunan ulang
    
    Model penyusunan ulang berada di luar basis pengetahuan. Model ini menyusun ulang potongan kandidat dari pencarian vektor awal dan mengembalikan K potongan teratas dengan skor kemiripan tertinggi. Penyusun ulang resmi yang direkomendasikan, qwen3-rerank (hibrida), mempertimbangkan relevansi semantik dan fitur pencocokan teks (seperti skor BM25) untuk menangani kueri yang memerlukan pencocokan kata kunci yang tepat. Untuk penyusunan ulang semantik saja, pilih qwen3-rerank.
    
    Mode model penyusunan ulang
    
    Saat Anda membuat basis pengetahuan, Anda dapat memilih salah satu mode berikut untuk pengaturan mode model penyusunan ulang:
    
    Mode Tanya-Jawab (default): Menyusun potongan kandidat berdasarkan "skor kecocokan Tanya-Jawab" dengan kueri. Mode ini cocok untuk skenario di mana pengguna mengajukan pertanyaan lengkap dan mengharapkan menemukan jawaban dalam satu potongan.
    
    Mode Kemiripan: Menyusun potongan kandidat berdasarkan "skor kemiripan semantik" dengan kueri. Mode ini cocok untuk skenario di mana kueri dan potongan memiliki frasa yang mirip.
    
    Mode lanjutan kustom: Memungkinkan Anda memberikan instruksi bahasa alami hingga 200 karakter untuk memengaruhi proses penyusunan ulang. Mode ini cocok untuk skenario dengan persyaratan penyusunan ulang khusus.
    
    Peringatan
    Mode model penyusunan ulang hanya dapat dipilih saat Anda membuat basis pengetahuan dan tidak dapat dimodifikasi setelah pembuatan. Sebelum mengonfigurasi pengaturan ini, perhatikan batasan berikut:
    
    Batasan jenis basis pengetahuan: Pengaturan ini hanya berlaku untuk basis pengetahuan pencarian dokumen, kueri data, dan pencarian audio-video. Basis pengetahuan Tanya-Jawab Gambar tidak didukung.
    
    Batasan kasus penggunaan: Pengaturan ini hanya didukung untuk kasus penggunaan Tanya-Jawab dokumen dasar dan Balasan teks kaya. Kasus penggunaan Pemahaman visual (dokumen teks kaya) dan Tanya-Jawab cepat tidak didukung.
    
    Ambang batas kemiripan
    
    Ambang batas ini menetapkan skor kemiripan minimum untuk mengambil potongan dari hasil yang dikembalikan oleh model penyusunan ulang. Hanya potongan dengan skor yang melebihi nilai ini yang diambil.
    
    Catatan
    Ini adalah ambang batas kemiripan default untuk basis pengetahuan. Saat Anda mengaitkan basis pengetahuan dengan aplikasi Alibaba Cloud Model Studio tertentu, Anda juga dapat menetapkan ambang batas terpisah untuk aplikasi tersebut, yang menggantikan ambang batas default basis pengetahuan.
    
    Menurunkan ambang batas ini mengambil lebih banyak potongan tetapi mungkin menyertakan konten yang kurang relevan. Menaikkannya mengurangi jumlah potongan yang diambil. Jika diatur terlalu tinggi, basis pengetahuan mungkin membuang potongan yang relevan.
    
    Anda dapat menggunakan pengujian hit untuk menyesuaikan ambang batas kemiripan guna menyeimbangkan recall dan presisi.
    
    Jumlah recall maksimum
    
    Anggaplah aplikasi Alibaba Cloud Model Studio dikaitkan dengan tiga basis pengetahuan: A1, A2, dan A3. Sistem mengambil potongan yang terkait dengan input dari basis-basis ini, menyusun ulang menggunakan model penyusunan ulang, dan memilih K potongan paling relevan untuk digunakan sebagai konteks bagi LLM. Nilai K ini adalah jumlah recall maksimum (hingga 20), yang menentukan jumlah potongan yang disediakan model penyusunan ulang kepada LLM.
    
    Meningkatkan nilai ini dapat meningkatkan akurasi respons LLM tetapi juga meningkatkan konsumsi token input LLM.
    
    Penyimpanan vektor
    
    Pilih database vektor untuk menyimpan vektor teks. Database vektor Built-in memenuhi kebutuhan fungsional dasar basis pengetahuan. Untuk fitur lanjutan seperti manajemen database, audit, atau pemantauan, kami menyarankan memilih AnalyticDB for PostgreSQL (ADB-PG).
    
    Saat Anda membeli instans ADB-PG, Anda harus mengaktifkan Optimalisasi Mesin Vektor. Jika tidak, Alibaba Cloud Model Studio tidak dapat menggunakan instans tersebut.
    Instruksi pembuatan (pemahaman visual)
    Saat Anda memilih kasus penggunaan Pemahaman visual (dokumen teks kaya), basis pengetahuan menggunakan model penyematan multimoda untuk pemahaman visual dokumen. Metode ini mempertahankan informasi tata letak asli alih-alih menggunakan metode pemotongan teks tradisional.
    
    Batasan format file
    
    Di area unggah file tab Pilih data, arahkan kursor ke Lihat persyaratan format untuk melihat persyaratannya.
    
    Perbedaan konfigurasi indeks
    
    Konfigurasi indeks untuk kasus penggunaan pemahaman visual berbeda dari kasus penggunaan tanya-jawab dokumen dasar:
    
    Model penyematan: Model penyematan multimoda qwen3 (qwen3-vl-embedding) dipilih secara otomatis dan tidak dapat diubah setelah pembuatan.
    
    Penulisan ulang percakapan multi-putaran: Dapat diaktifkan atau dinonaktifkan.
    
    Ambang batas kemiripan: Default adalah 0,20.
    
    Jumlah recall maksimum: Default adalah 5.
    
    Metode pemotongan: Pemahaman visual tidak menggunakan metode pemotongan teks tradisional (seperti pemotongan cerdas atau pemotongan kustom). Sebagai gantinya, metode ini memahami setiap halaman dokumen berdasarkan pengindeksan visual.
    
    Batasan pengeditan
    
    Model penyematan (penyematan multimoda qwen3) dan jenis penyimpanan vektor (Bawaan) tidak dapat diubah setelah pembuatan.
    
    Edisi basis pengetahuan hanya dapat diubah sekali per hari.
- Kueri data (skenario chatbot atau NL2SQL)
  - Kasus penggunaan:
    - Ideal untuk membangun sistem tanya-jawab pada data terstruktur (data yang diorganisir dalam skema tabel yang telah ditentukan) untuk membuat asisten yang mengkueri FAQ, data produk, atau informasi personel.
    - Jika data Anda terdiri dari pasangan pertanyaan dan jawaban FAQ lengkap, pilih Kueri Data. Misalnya, jika file Excel berisi dua kolom, Question dan Answer, basis pengetahuan kueri data dapat menggunakan kolom Question untuk pengambilan data dan kolom Answer sebagai konteks untuk respons LLM.
      
      Basis pengetahuan pencarian dokumen tidak mendukung fungsionalitas ini.
    - Anda dapat mengimpor beberapa file Excel, tetapi skema tabelnya harus identik.
  - Integrasi sumber data: Anda dapat mengunggah file XLS atau XLSX lokal.
    Instruksi pembuatan (Kueri Data)
    Pilih data: Tentukan sumber data (file atau konten) untuk diimpor ke basis pengetahuan guna pengambilan data. Metode yang didukung meliputi unggah lokal dan impor cloud.
    
    Catatan
    Setelah basis pengetahuan dibuat, sumber datanya tidak dapat diubah. Setiap basis pengetahuan hanya mendukung satu sumber data.
    
    Unggah lokal: Unggah tabel data (format XLS atau XLSX) dari komputer lokal Anda. Baris pertama harus berupa header tabel.
    
    Impor cloud (pilih tabel data): Pilih tabel data yang sudah ada dari Model Studio.
    
    Konfigurasi indeks: Tentukan cara data yang diimpor diproses dan disimpan, yang secara langsung memengaruhi kinerja pengambilan data.
    
    Di antara pengaturan berikut, hanya penyimpanan vektor dengan AnalyticDB for PostgreSQL (ADB-PG) yang mungkin dikenai biaya. Semua konfigurasi lainnya gratis.
    
    Pengambilan data dan balasan model
    
    Used for Retrieval: Saat diaktifkan, basis pengetahuan mengambil data dari kolom ini.
    
    Used for Model Reply: Saat diaktifkan, LLM menggunakan hasil pengambilan data dari kolom ini untuk menghasilkan respons. Misalnya, jika Anda mengaktifkan Used for Retrieval untuk kolom "Nama," "Jenis Kelamin," "Posisi," dan "Usia," tetapi hanya mengaktifkan Used for Model Reply untuk kolom "Nama" dan "Posisi," basis pengetahuan akan mengambil data dari keempat kolom tersebut. Namun, hanya hasil pengambilan data dari kolom "Nama" dan "Posisi" yang diberikan ke LLM untuk menghasilkan responsnya.
    
    Seperti yang ditunjukkan pada gambar berikut, karena "digunakan untuk balasan model" tidak diaktifkan untuk kolom "Usia," LLM yang dikaitkan dengan basis pengetahuan ini masih tidak dapat menjawab pertanyaan "Berapa usia Zhang San?".
    
    Penulisan ulang percakapan multi-putaran
    
    Saat diaktifkan, sistem menggunakan model ringan khusus untuk menulis ulang kueri pengguna saat ini menjadi kueri mandiri dengan konteks lengkap dengan memasukkan riwayat percakapan. Sistem kemudian menggunakan kueri yang ditulis ulang ini untuk mengambil informasi dari basis pengetahuan.
    
    Model penyematan
    
    Model penyematan mengonversi prompt input asli dan teks pengetahuan menjadi vektor numerik untuk menghitung kemiripan semantik. Model default Vektor Resmi (text-embedding-v2) mendukung berbagai bahasa selain Tionghoa dan Inggris serta menormalisasi vektor yang dihasilkan. Pengaturan ini tidak dapat diubah.
    
    Dimensi vektor yang dihasilkan oleh basis pengetahuan menggunakan (tidak dapat dimodifikasi):
    
    Vektor Resmi (text-embedding-v2): 1.536 dimensi
    
    penyematan multimoda qwen3 (qwen3-vl-embedding): Diaktifkan secara otomatis saat kasus penggunaan Pemahaman visual dipilih. Model ini mendukung pembuatan vektor untuk gambar dan dokumen teks kaya setelah pemahaman visual.
    
    Model penyusunan ulang
    
    Model penyusunan ulang berada di luar basis pengetahuan. Model ini menyusun ulang potongan kandidat dari pencarian vektor awal dan mengembalikan K potongan teratas dengan skor kemiripan tertinggi. Penyusun ulang resmi yang direkomendasikan, qwen3-rerank (hibrida), mempertimbangkan relevansi semantik dan fitur pencocokan teks (seperti skor BM25) untuk menangani kueri yang memerlukan pencocokan kata kunci yang tepat. Untuk penyusunan ulang semantik saja, pilih qwen3-rerank.
    
    Mode model penyusunan ulang
    
    Saat Anda membuat basis pengetahuan, Anda dapat memilih salah satu mode berikut untuk pengaturan mode model penyusunan ulang:
    
    Mode Tanya-Jawab (default): Menyusun potongan kandidat berdasarkan "skor kecocokan Tanya-Jawab" dengan kueri. Mode ini cocok untuk skenario di mana pengguna mengajukan pertanyaan lengkap dan mengharapkan menemukan jawaban dalam satu potongan.
    
    Mode Kemiripan: Menyusun potongan kandidat berdasarkan "skor kemiripan semantik" dengan kueri. Mode ini cocok untuk skenario di mana kueri dan potongan memiliki frasa yang mirip.
    
    Mode lanjutan kustom: Memungkinkan Anda memberikan instruksi bahasa alami hingga 200 karakter untuk memengaruhi proses penyusunan ulang. Mode ini cocok untuk skenario dengan persyaratan penyusunan ulang khusus.
    
    Peringatan
    Mode model penyusunan ulang hanya dapat dipilih saat Anda membuat basis pengetahuan dan tidak dapat dimodifikasi setelah pembuatan. Sebelum mengonfigurasi pengaturan ini, perhatikan batasan berikut:
    
    Batasan jenis basis pengetahuan: Pengaturan ini hanya berlaku untuk basis pengetahuan pencarian dokumen, kueri data, dan pencarian audio-video. Basis pengetahuan Tanya-Jawab Gambar tidak didukung.
    
    Batasan kasus penggunaan: Pengaturan ini hanya didukung untuk kasus penggunaan Tanya-Jawab dokumen dasar dan Balasan teks kaya. Kasus penggunaan Pemahaman visual (dokumen teks kaya) dan Tanya-Jawab cepat tidak didukung.
    
    Ambang batas kemiripan
    
    Ambang batas ini menetapkan skor kemiripan minimum untuk mengambil potongan dari hasil yang dikembalikan oleh model penyusunan ulang. Hanya potongan dengan skor yang melebihi nilai ini yang diambil.
    
    Catatan
    Ini adalah ambang batas kemiripan default untuk basis pengetahuan. Saat Anda mengaitkan basis pengetahuan dengan aplikasi Alibaba Cloud Model Studio tertentu, Anda juga dapat menetapkan ambang batas terpisah untuk aplikasi tersebut, yang menggantikan ambang batas default basis pengetahuan.
    
    Menurunkan ambang batas ini mengambil lebih banyak potongan tetapi mungkin menyertakan konten yang kurang relevan. Menaikkannya mengurangi jumlah potongan yang diambil. Jika diatur terlalu tinggi, basis pengetahuan mungkin membuang potongan yang relevan.
    
    Anda dapat menggunakan pengujian hit untuk menyesuaikan ambang batas kemiripan guna menyeimbangkan recall dan presisi.
    
    Jumlah recall maksimum
    
    Anggaplah aplikasi Alibaba Cloud Model Studio dikaitkan dengan tiga basis pengetahuan: A1, A2, dan A3. Sistem mengambil potongan yang terkait dengan input dari basis-basis ini, menyusun ulang menggunakan model penyusunan ulang, dan memilih K potongan paling relevan untuk digunakan sebagai konteks bagi LLM. Nilai K ini adalah jumlah recall maksimum (hingga 20), yang menentukan jumlah potongan yang disediakan model penyusunan ulang kepada LLM.
    
    Meningkatkan nilai ini dapat meningkatkan akurasi respons LLM tetapi juga meningkatkan konsumsi token input LLM.
    
    Penyimpanan vektor
    
    Pilih database vektor untuk menyimpan vektor teks. Database vektor Built-in memenuhi kebutuhan fungsional dasar basis pengetahuan. Untuk fitur lanjutan seperti manajemen database, audit, atau pemantauan, kami menyarankan memilih AnalyticDB for PostgreSQL (ADB-PG).
    
    Saat Anda membeli instans ADB-PG, Anda harus mengaktifkan Optimalisasi Mesin Vektor. Jika tidak, Alibaba Cloud Model Studio tidak dapat menggunakan instans tersebut.
- Tanya-Jawab Gambar (pencarian gambar)
  - Kasus Penggunaan:
    - Ideal untuk membangun aplikasi pengambilan data multimoda untuk pencarian berdasarkan gambar dan pencarian berdasarkan gambar dan teks, seperti asisten penemuan produk atau asisten tanya-jawab visual.
  - Integrasi sumber data: Anda dapat mengunggah file XLS atau XLSX lokal.
    
    File XLS dan XLSX harus berisi URL gambar yang dapat diakses publik untuk membangun indeks gambar. Untuk informasi lebih lanjut, lihat instruksi pembuatan di bawah ini.
    Pembuatan (Tanya-Jawab Gambar)
    Pilih data: Tentukan sumber data untuk diimpor ke basis pengetahuan guna pengambilan data. Metode yang didukung meliputi Unggah Lokal dan Impor Cloud (memilih tabel data yang sudah ada dari konektor data).
    
    Catatan
    Sumber data tidak dapat diubah setelah basis pengetahuan dibuat. Basis pengetahuan hanya dapat mendukung satu sumber data.
    
    Unggah lokal: Unggah tabel data dalam format XLS atau XLSX dari komputer lokal Anda.
    
    Catatan
    
    Persyaratan bidang: Tabel data harus berisi setidaknya satu bidang image_url untuk menghasilkan indeks gambar.
    
    Proses pembuatan: Basis pengetahuan mengakses URL gambar di bidang image_url, mengekstraksi fitur visual, dan menyimpannya sebagai vektor.
    
    Proses pengambilan data: Basis pengetahuan membandingkan vektor yang dihasilkan dari gambar yang diunggah pengguna dengan vektor gambar yang disimpan dan mengembalikan catatan yang paling relevan.
    
    Impor cloud (pilih tabel data): Pilih tabel data yang sudah ada dari data aplikasi Anda di Alibaba Cloud Model Studio.
    
    Konfigurasi indeks: Konfigurasikan cara data yang diimpor diproses dan disimpan, yang secara langsung memengaruhi kinerja pengambilan data.
    
    Di antara pengaturan berikut, hanya penyimpanan vektor dengan AnalyticDB for PostgreSQL (ADB-PG) yang mungkin dikenai biaya. Semua konfigurasi lainnya gratis.
    
    Pengambilan data dan balasan model
    
    Used for Retrieval: Saat diaktifkan, basis pengetahuan mengambil data dari kolom ini.
    
    Used for Model Reply: Saat diaktifkan, LLM menggunakan hasil pengambilan data dari kolom ini untuk menghasilkan respons. Misalnya, jika Anda mengaktifkan Used for Retrieval untuk kolom "Nama," "Jenis Kelamin," "Posisi," dan "Usia," tetapi hanya mengaktifkan Used for Model Reply untuk kolom "Nama" dan "Posisi," basis pengetahuan akan mengambil data dari keempat kolom tersebut. Namun, hanya hasil pengambilan data dari kolom "Nama" dan "Posisi" yang diberikan ke LLM untuk menghasilkan responsnya.
    
    Seperti yang ditunjukkan pada gambar berikut, karena "digunakan untuk balasan model" tidak diaktifkan untuk kolom "Usia," LLM yang dikaitkan dengan basis pengetahuan ini masih tidak dapat menjawab pertanyaan "Berapa usia Zhang San?".
    
    Penulisan ulang percakapan multi-putaran
    
    Saat diaktifkan, sistem menggunakan model ringan khusus untuk menulis ulang kueri pengguna saat ini menjadi kueri mandiri dengan konteks lengkap dengan memasukkan riwayat percakapan. Sistem kemudian menggunakan kueri yang ditulis ulang ini untuk mengambil informasi dari basis pengetahuan.
    
    Model penyematan
    
    Model penyematan mengonversi prompt input, teks pengetahuan, dan gambar menjadi vektor numerik untuk perbandingan kemiripan. Untuk informasi lebih lanjut, lihat Vektorisasi Teks dan Multimoda.
    
    penyematan multimoda qwen2.5 (qwen2.5-vl-embedding): Merepresentasikan input single-modal atau mixed-modal sebagai vektor terpadu, cocok untuk pengambilan data lintas-modal dan skenario pencarian gambar. Misalnya, jika Anda memasukkan gambar kemeja dengan teks "temukan gaya serupa yang terlihat lebih muda," model ini menggabungkan gambar dan instruksi teks menjadi satu vektor.
    
    Penyematan Multimoda v1 (multimodal-embedding-v1): Menghasilkan vektor terpisah untuk setiap bagian input (gambar dan teks).
    
    penyematan multimoda qwen3 (qwen3-vl-embedding): Versi peningkatan dari qwen2.5-vl-embedding yang lebih meningkatkan pemahaman fusi gambar-teks dan akurasi pengambilan data lintas-modal.
    
    Model penyusunan ulang
    
    Model penyusunan ulang berada di luar basis pengetahuan. Model ini menyusun ulang potongan kandidat dari pencarian vektor awal dan mengembalikan K potongan teratas dengan skor kemiripan tertinggi. Penyusun ulang resmi yang direkomendasikan, qwen3-rerank (hibrida), mempertimbangkan relevansi semantik dan fitur pencocokan teks (seperti skor BM25) untuk menangani kueri yang memerlukan pencocokan kata kunci yang tepat. Untuk penyusunan ulang semantik saja, pilih qwen3-rerank.
    
    Mode model penyusunan ulang
    
    Saat Anda membuat basis pengetahuan, Anda dapat memilih salah satu mode berikut untuk pengaturan mode model penyusunan ulang:
    
    Mode Tanya-Jawab (default): Menyusun potongan kandidat berdasarkan "skor kecocokan Tanya-Jawab" dengan kueri. Mode ini cocok untuk skenario di mana pengguna mengajukan pertanyaan lengkap dan mengharapkan menemukan jawaban dalam satu potongan.
    
    Mode Kemiripan: Menyusun potongan kandidat berdasarkan "skor kemiripan semantik" dengan kueri. Mode ini cocok untuk skenario di mana kueri dan potongan memiliki frasa yang mirip.
    
    Mode lanjutan kustom: Memungkinkan Anda memberikan instruksi bahasa alami hingga 200 karakter untuk memengaruhi proses penyusunan ulang. Mode ini cocok untuk skenario dengan persyaratan penyusunan ulang khusus.
    
    Peringatan
    Mode model penyusunan ulang hanya dapat dipilih saat Anda membuat basis pengetahuan dan tidak dapat dimodifikasi setelah pembuatan. Sebelum mengonfigurasi pengaturan ini, perhatikan batasan berikut:
    
    Batasan jenis basis pengetahuan: Pengaturan ini hanya berlaku untuk basis pengetahuan pencarian dokumen, kueri data, dan pencarian audio-video. Basis pengetahuan Tanya-Jawab Gambar tidak didukung.
    
    Batasan kasus penggunaan: Pengaturan ini hanya didukung untuk kasus penggunaan Tanya-Jawab dokumen dasar dan Balasan teks kaya. Kasus penggunaan Pemahaman visual (dokumen teks kaya) dan Tanya-Jawab cepat tidak didukung.
    
    Ambang batas kemiripan
    
    Ambang batas ini menetapkan skor kemiripan minimum untuk mengambil potongan dari hasil yang dikembalikan oleh model penyusunan ulang. Hanya potongan dengan skor yang melebihi nilai ini yang diambil.
    
    Catatan
    Ini adalah ambang batas kemiripan default untuk basis pengetahuan. Saat Anda mengaitkan basis pengetahuan dengan aplikasi Alibaba Cloud Model Studio tertentu, Anda juga dapat menetapkan ambang batas terpisah untuk aplikasi tersebut, yang menggantikan ambang batas default basis pengetahuan.
    
    Menurunkan ambang batas ini mengambil lebih banyak potongan tetapi mungkin menyertakan konten yang kurang relevan. Menaikkannya mengurangi jumlah potongan yang diambil. Jika diatur terlalu tinggi, basis pengetahuan mungkin membuang potongan yang relevan.
    
    Anda dapat menggunakan pengujian hit untuk menyesuaikan ambang batas kemiripan guna menyeimbangkan recall dan presisi.
    
    Jumlah recall maksimum
    
    Anggaplah aplikasi Alibaba Cloud Model Studio dikaitkan dengan tiga basis pengetahuan: A1, A2, dan A3. Sistem mengambil potongan yang terkait dengan input dari basis-basis ini, menyusun ulang menggunakan model penyusunan ulang, dan memilih K potongan paling relevan untuk digunakan sebagai konteks bagi LLM. Nilai K ini adalah jumlah recall maksimum (hingga 20), yang menentukan jumlah potongan yang disediakan model penyusunan ulang kepada LLM.
    
    Meningkatkan nilai ini dapat meningkatkan akurasi respons LLM tetapi juga meningkatkan konsumsi token input LLM.
    
    Penyimpanan vektor
    
    Pilih database vektor untuk menyimpan vektor teks. Database vektor Built-in memenuhi kebutuhan fungsional dasar basis pengetahuan. Untuk fitur lanjutan seperti manajemen database, audit, atau pemantauan, kami menyarankan memilih AnalyticDB for PostgreSQL (ADB-PG).
    
    Saat Anda membeli instans ADB-PG, Anda harus mengaktifkan Optimalisasi Mesin Vektor. Jika tidak, Alibaba Cloud Model Studio tidak dapat menggunakan instans tersebut.
Pilih kasus penggunaan: tanya-jawab dokumen dasar, balasan teks kaya.

Selama periode permintaan puncak, proses pembuatan dapat memakan waktu beberapa jam, tergantung pada volume data. Harap bersabar.

Perbarui basis pengetahuan

Perubahan pada basis pengetahuan secara otomatis disinkronkan dengan aplikasi apa pun yang menggunakannya.

Pencarian dokumen

Pembaruan otomatis (direkomendasikan)
Anda dapat mengatur pembaruan otomatis dengan mengintegrasikan API OSS, FC, dan basis pengetahuan Model Studio. Ikuti langkah-langkah berikut:
1. Buat bucket: Buka konsol OSS dan buat bucket OSS untuk menyimpan file sumber Anda.
2. Buat basis pengetahuan: Buat basis pengetahuan tidak terstruktur untuk menyimpan konten privat Anda.
3. Buat fungsi yang didefinisikan pengguna: Buka konsol FC dan buat fungsi untuk menangani event perubahan file, seperti pembuatan dan penghapusan file. Untuk informasi lebih lanjut, lihat Buat fungsi. Fungsi ini memanggil API yang relevan dari Panduan API Basis Pengetahuan untuk menyinkronkan basis pengetahuan Anda dengan perubahan file di OSS.
4. Buat pemicu OSS: Di FC, kaitkan pemicu OSS dengan fungsi yang didefinisikan pengguna yang telah dibuat sebelumnya. Saat event perubahan file seperti unggahan terjadi, pemicu mengaktifkan fungsi tersebut.
Pembaruan manual

Di halaman Basis Pengetahuan, temukan basis pengetahuan yang ingin Anda perbarui dan klik View Details pada kartunya.
- Untuk menambahkan file baru: Klik Upload Data dan pilih file yang sudah ada dari konektor data.
- Untuk menghapus file: Temukan file tersebut dan klik Delete di sebelah kanannya.
- Untuk memodifikasi konten file: Pembaruan dan penggantian langsung tidak didukung. Pertama, hapus versi lama dari basis pengetahuan, lalu impor versi yang diperbarui.
  
  Catatan: Kegagalan menghapus versi lama dapat menyebabkan hasil pencarian yang usang.

Kueri data dan Tanya-Jawab Gambar

Catatan: Di halaman detail basis pengetahuan Tanya-Jawab Gambar, tidak ada tombol Unggah Data langsung. Untuk memperbarui data, klik tautan Lihat Sumber Data untuk membuka halaman detail konektor data.

Pembaruan otomatis

Tidak didukung.
Pembaruan manual

Jika sumber data untuk basis pengetahuan Anda adalah tabel data di Data Aplikasi, ikuti dua langkah berikut untuk pembaruan manual.
1. Langkah 1: Perbarui tabel data
  
  Buka tab Data Aplikasi. Di panel kiri, pilih tabel data target dan klik Upload Data.
  - Untuk memasukkan data baru: Atur jenis impor ke Incremental Upload. Unggah file Excel yang hanya berisi baris header dan baris data baru.
    
    Baris header file harus sesuai dengan skema tabel saat ini. Anda dapat mengklik Download Template untuk mendapatkan file templat standar, lalu tambahkan data baru Anda ke dalamnya.
  - Untuk menghapus data: Atur jenis impor ke Upload and Overwrite. Unggah file Excel yang berisi baris header dan dataset lengkap terbaru, dengan catatan yang tidak diinginkan dihapus.
    
    Untuk mendapatkan dataset lengkap, klik ikon untuk mengunduh data dalam format XLSX.
  - Untuk memodifikasi data: Atur jenis impor ke Upload and Overwrite. Unggah file Excel yang berisi baris header dan dataset lengkap yang telah dimodifikasi.
2. Langkah 2: Sinkronkan perubahan ke basis pengetahuan
  
  Kembali ke daftar Basis Pengetahuan, temukan basis pengetahuan target, dan klik View Details pada kartunya. Klik ikon di pojok kiri atas tabel data, lalu konfirmasi prompt untuk menyinkronkan basis pengetahuan.
  
  Anda harus mengulangi langkah-langkah ini untuk setiap pembaruan manual.

Pencarian audio dan video

Pembaruan otomatis

Tidak didukung.
Pembaruan manual

Di halaman Basis Pengetahuan, temukan basis pengetahuan yang ingin Anda perbarui dan klik View Details pada kartunya.
- Untuk menambahkan file baru: Klik Upload Data dan pilih file yang sudah ada dari Data Aplikasi.
- Untuk menghapus file: Temukan file tersebut dan klik Delete di sebelah kanannya.
  
  Tindakan ini hanya menghapus file dari basis pengetahuan. Tindakan ini tidak memengaruhi file sumber di Data Aplikasi.
- Untuk memodifikasi konten file: Pembaruan dan penggantian langsung tidak didukung. Pertama, hapus versi lama dari basis pengetahuan, lalu impor versi yang diperbarui.
  
  Catatan: Kegagalan menghapus versi lama dapat menyebabkan hasil pencarian yang usang.

Edit basis pengetahuan

Setelah membuat basis pengetahuan, Anda hanya dapat memodifikasi nama basis pengetahuan, deskripsi basis pengetahuan, dan ambang batas kemiripan. Untuk mengubah konfigurasi lainnya, Anda harus menghapus dan membuat ulang basis pengetahuan. Operasi ini hanya tersedia di konsol dan tidak memiliki API yang sesuai.

Prosedur: Di halaman Basis Pengetahuan, temukan basis pengetahuan target, klik ikon 更多（...） pada kartunya, lalu klik Edit. Catatan: Anda hanya dapat memodifikasi konfigurasi basis pengetahuan sekali per hari kalender. Sistem diam-diam menolak upaya berikutnya pada hari yang sama.

Hapus basis pengetahuan

Peringatan

Tindakan ini tidak dapat dibatalkan. Lanjutkan dengan hati-hati.

Sebelum menghapus basis pengetahuan, kami menyarankan Anda memutuskan kaitannya dari semua aplikasi Model Studio yang dipublikasikan.

Anda masih dapat menghapus basis pengetahuan yang dikaitkan dengan aplikasi yang belum dipublikasikan.

Prosedur

Untuk setiap aplikasi terpublikasi yang terkait dengan basis pengetahuan:
1. Di halaman Aplikasi Saya, temukan aplikasi tersebut dan klik Configure.
2. Hapus basis pengetahuan dari daftar, lalu klik Publish di pojok kanan atas untuk mempublikasikan ulang aplikasi.
Di halaman Basis Pengetahuan, temukan basis pengetahuan, klik ikon pada kartunya, lalu klik Delete.

Ubah konfigurasi

Edisi Perusahaan menggunakan RCU untuk kinerja pengambilan data tinggi pada QPS tinggi dan menawarkan kapasitas penyimpanan lebih besar. Edisi Standar cocok untuk pengembangan, pengujian, atau skenario konkurensi rendah.

Catatan

Anda dapat beralih antara Edisi Standar dan Edisi Perusahaan serta mengubah jumlah RCU untuk Edisi Perusahaan.

Anda hanya dapat mengubah konfigurasi Basis Pengetahuan sekali per hari kalender.

RCU: Retrieval Compute Unit (RCU) adalah ukuran konkurensi pengambilan data Basis Pengetahuan. Satu RCU mendukung sekitar 50 QPS untuk pengambilan data online. Jumlah RCU yang lebih tinggi mendukung konkurensi yang lebih besar.

Catatan:
- Untuk menurunkan spesifikasi Basis Pengetahuan Edisi Perusahaan yang menggunakan penyimpanan platform ke Edisi Standar, Anda harus terlebih dahulu mengurangi ruang penyimpanan yang digunakan menjadi kurang dari 80 GB.
  
  Anda dapat mengosongkan ruang penyimpanan dengan menghapus file atau data dari Basis Pengetahuan.
Prosedur:
1. Di halaman Basis Pengetahuan, untuk Basis Pengetahuan yang ingin Anda edit, klik ikon pada kartunya, lalu klik Edit.
2. Di kotak dialog, pilih tindakan berdasarkan edisi saat ini:
  - Edisi Standar: Pilih Upgrade.
  - Edisi Perusahaan: Pilih Downgrade atau Ubah Jumlah RCU.
3. Ikuti petunjuk di layar. Konfigurasi baru berlaku segera setelah Anda mengklik OK.

Hit testing

Gunakan pengujian hit untuk memverifikasi bahwa basis pengetahuan Anda memberikan input pengetahuan yang akurat ke aplikasi AI Anda. Simulasikan kueri pengguna, evaluasi hasil pengambilan data, dan sesuaikan ambang batas kemiripan.

Model penyusunan ulang dalam pengujian hit mendukung tiga mode: mode tanya-jawab (default), dirancang untuk kueri yang tidak cocok sempurna dengan konten dokumen; mode kemiripan, ideal untuk kueri yang sangat mirip dengan konten dokumen; dan mode lanjutan kustom. Skor peringkat untuk kueri yang sama dapat sangat bervariasi tergantung pada mode yang dipilih. Misalnya, segmen teks yang sama mungkin mendapat skor 47% dalam mode tanya-jawab tetapi hingga 69% dalam mode kemiripan.

Dengan pengujian hit, Anda dapat:

Memverifikasi bahwa basis pengetahuan memberikan input pengetahuan yang efektif ke aplikasi AI Anda
Menyesuaikan ambang batas kemiripan untuk menyeimbangkan tingkat recall dan akurasi
Mengidentifikasi celah konten atau masalah kualitas dalam basis pengetahuan Anda

Kasus penggunaan

Kasus penggunaan 1: Menanyakan harga produk

Input uji: "Berapa harga ponsel Model Studio Anda?"
Hasil yang diharapkan: Ambil segmen teks relevan yang berisi informasi harga.

Kasus penggunaan 2: Pemecahan masalah teknis

Input uji: "Apa yang harus saya lakukan jika perangkat saya tidak bisa terhubung ke Wi-Fi?"
Hasil yang diharapkan: Ambil segmen teks relevan tentang pemecahan masalah koneksi Wi-Fi.

Kasus penggunaan 3: Pengambilan data dengan pemahaman visual (basis pengetahuan pemahaman visual)

Basis pengetahuan pemahaman visual mendukung tiga mode kueri: teks saja, gambar saja, dan gambar+teks.
Mode 1 (teks saja): Masukkan "Object Storage Service" untuk mengambil segmen relevan dari dokumen dan gambar.
Mode 2 (gambar saja): Unggah tangkapan layar produk. Sistem menggunakan pemahaman visual untuk mencocokkan segmen yang secara semantik mirip.
Mode 3 (gambar+teks): Unggah gambar dan masukkan teks deskriptif. Kueri gabungan dapat meningkatkan kemiripan pengambilan data.

Kasus penggunaan 4: Tanya-jawab cepat (basis pengetahuan Tanya-jawab cepat)

Basis pengetahuan Tanya-jawab cepat hanya mendukung kueri teks (input gambar tidak didukung) dan ideal untuk pengambilan data cepat dari dokumen terstruktur:
Input uji: "Berapa harga Qwen Pro 8?"
Hasil yang diharapkan: Cepat ambil segmen FAQ relevan yang mencakup informasi harga.

Prosedur

Di halaman basis pengetahuan, temukan basis pengetahuan yang ingin Anda uji dan klik Hit Test pada kartunya.
Di antarmuka uji, masukkan pertanyaan (kami menyarankan menggunakan kueri pengguna umum) dan tinjau hasil pengambilan data.
- Hasil pengambilan data: Bagian ini menampilkan hasil hit dari uji saat ini, diurutkan berdasarkan kemiripan secara menurun. Klik segmen apa pun untuk melihat kontennya.
- Ikon: Untuk basis pengetahuan Tanya-Jawab Gambar, sistem mengonversi gambar input menjadi vektor untuk mengambil catatan, lalu mengirim catatan tersebut dengan pertanyaan ke LLM untuk jawaban. Sebaliknya, basis pengetahuan pencarian dokumen, kueri data tidak menggunakan gambar yang diunggah untuk pengambilan data. Namun, basis pengetahuan pencarian dokumen dengan kasus penggunaannya diatur ke pemahaman visual menggunakan gambar yang diunggah untuk pengambilan data, mendukung mode kueri teks saja, gambar saja, dan gambar+teks. Dalam konteks ini, kueri gabungan gambar dan teks meningkatkan kemiripan pengambilan data.
Verifikasi bahwa segmen teks relevan diambil dengan benar. Jika tidak, sesuaikan ambang batas kemiripan dan ulangi langkah sebelumnya.
Klik View Recall History untuk membandingkan kinerja pengambilan data dengan pengaturan ambang batas berbeda.

Kuota dan batasan

Untuk informasi tentang sumber data yang didukung, kapasitas, dan batasan lainnya, lihat Kuota dan batasan basis pengetahuan.
Jumlah maksimum basis pengetahuan per aplikasi Model Studio:
- Pencarian dokumen: Hingga 5
- Kueri data: Hingga 5
- Tanya-Jawab Gambar: Hingga 1
Anda dapat mengaitkan hingga 11 basis pengetahuan jenis berbeda.

Penagihan

Fitur basis pengetahuan gratis, tetapi Anda mungkin dikenai biaya untuk memanggil aplikasi Model Studio yang menggunakan basis pengetahuan.

Langkah	Penagihan
Bangun basis pengetahuan	Gratis.
Integrasikan dengan aplikasi bisnis	Saat aplikasi Model Studio mengambil potongan teks dari basis pengetahuan, hal ini meningkatkan jumlah token input LLM dan dapat meningkatkan biaya inferensi model. Untuk informasi lebih lanjut, lihat Item yang dapat ditagih dan harga. Catatan: Anda tidak dikenai biaya jika hanya menggunakan API Ambil untuk mengambil data dari basis pengetahuan dan tidak menggunakan aplikasi Model Studio untuk menghasilkan respons.
manajemen dan O&M	Gratis.

Referensi API

Lihat Direktori API (Basis Pengetahuan) untuk daftar lengkap API basis pengetahuan dan parameternya.
Lihat Panduan API Basis Pengetahuan untuk penggunaan terperinci dan contoh kode.

FAQ

Membangun basis pengetahuan

T: Dapatkah saya menghapus file atau tabel data dari Data Aplikasi setelah mengimpornya ke basis pengetahuan?
- Untuk basis pengetahuan pencarian dokumen: Ya. File di Data Aplikasi dan file yang diimpor ke basis pengetahuan bersifat independen. Menghapus file sumber di Data Aplikasi tidak memengaruhi file yang diimpor.
- Untuk basis pengetahuan kueri data dan Tanya-Jawab Gambar: Tidak. Menghapus data sumber menyebabkan fitur seperti sinkronisasi data dan tampilan basis pengetahuan gagal.
T: Saat saya memanggil API basis pengetahuan, saya menerima kode kesalahan BailianIndexServiceNotOpen. Apa yang harus saya lakukan?

Kode kesalahan BailianIndexServiceNotOpen menunjukkan bahwa layanan basis pengetahuan Model Studio belum diaktifkan. Masuk ke konsol Model Studio, buka halaman Data > basis pengetahuan, lalu klik Aktifkan Sekarang untuk mengaktifkan layanan. Kemudian, coba lagi.

Menangani gambar dan konten multimoda

T: File saya berisi ilustrasi yang ingin saya sertakan dalam respons aplikasi Model Studio. Apa yang harus saya lakukan?

Pencarian dokumen

Metode 1 (Hanya untuk aplikasi agen)

Saat Anda membuat basis pengetahuan, pilih pencarian dokumen sebagai Jenis basis pengetahuan dan With Illustrations sebagai kasus penggunaan.

Saat Anda memilih Dengan Ilustrasi, basis pengetahuan mengekstraksi ringkasan dari ilustrasi dalam file. Model bahasa besar (LLM) kemudian memutuskan apakah akan memasukkan gambar berdasarkan relevansi ringkasan dengan pertanyaan pengguna.

Penting
Jangan memilih penguraian dokumen elektronik saat mengunggah dokumen. Metode penguraian ini tidak dapat mengekstraksi konten gambar, yang mencegah fitur Dengan Ilustrasi berfungsi dengan benar.
Saat membuat atau mengedit aplikasi agen, pilih model Qwen-Plus atau Qwen-Plus-Latest (model ini direkomendasikan untuk kinerja optimal). Klik tombol + di sebelah kanan Document knowledge base, lalu tambahkan basis pengetahuan yang telah Anda buat pada langkah sebelumnya.

Catatan
Panjang recall yang dikonfigurasi harus kurang dari panjang dokumen aktual. Jika panjang recall lebih besar dari panjang dokumen, sistem mengembalikan seluruh dokumen dan melewati logika untuk fitur Dengan Ilustrasi.

Catatan: Fitur "Dengan Ilustrasi" dan "Tampilkan Sumber Jawaban" tidak dapat diaktifkan secara bersamaan.
Hasil tanya-jawab aktual:

Metode 2 (Untuk aplikasi agen dan aplikasi alur kerja)

Unggah gambar ke lokasi yang dapat diakses publik dan dapatkan URL lengkapnya. Kami menyarankan menggunakan OSS. Untuk instruksi, lihat Unggah gambar ke OSS dan gunakan URL filenya.

Masukkan URL lengkap gambar ke dalam file. Jalur relatif tidak didukung. Jangan menyematkan file gambar langsung ke dalam dokumen (misalnya, dengan menyalin dan menempel atau memasukkan gambar lokal dari menu). Anda harus mereferensikan gambar menggunakan URL yang dapat diakses publik.

Jika gambar gagal ditampilkan meskipun mengikuti instruksi ini, verifikasi bahwa URL dalam potongan lengkap. Periksa dan hapus spasi atau karakter khusus tambahan yang dapat menyebabkan kesalahan penguraian. Anda dapat mengedit potongan secara langsung untuk melakukan koreksi.

Contoh mereferensikan gambar dengan benar dalam file

Templat prompt contoh

Hasil tanya-jawab aktual

# Basis Pengetahuan
Harap ingat materi berikut. Materi ini mungkin membantu menjawab pertanyaan.
${documents}

# Persyaratan
Jika ada gambar, harap tampilkan.

Contoh mereferensikan gambar dengan salah dalam file

Templat prompt contoh

Hasil tanya-jawab aktual

# Basis Pengetahuan
Harap ingat materi berikut. Materi ini mungkin membantu menjawab pertanyaan.
${documents}

# Persyaratan
Jika ada gambar, harap tampilkan.

Penjelasan: Jika Anda menyematkan gambar langsung ke dalam file, aplikasi Model Studio tidak menampilkannya dalam responsnya.

Tanya-Jawab Gambar

Unggah gambar ke lokasi yang dapat diakses publik dan dapatkan URL lengkapnya. Kami menyarankan menggunakan OSS. Untuk instruksi, lihat Unggah gambar ke OSS dan gunakan URL filenya.
Di tab Tabel, buat tabel data baru dan tambahkan bidang bertipe image_url untuk menyimpan URL lengkap gambar.
Catatan
- Bidang image_url tidak mendukung jalur relatif.
- Satu bidang image_url tidak dapat menyimpan beberapa URL gambar. Untuk mengaitkan catatan dengan beberapa gambar, buat bidang image_url terpisah untuk setiap gambar, seperti image_1 dan image_2.
- Setiap gambar yang direferensikan oleh bidang image_url harus tidak lebih besar dari 3 MB. Jika batas ini dilampaui, pembuatan basis pengetahuan gagal.
- Setelah tabel data dibuat, Anda tidak dapat menambahkan bidang baru bertipe image_url atau mengubah tipe bidang yang ada menjadi image_url. Sertakan semua bidang gambar yang diperlukan dalam skema tabel awal.
Saat Anda membuat basis pengetahuan, pilih Tanya-Jawab Gambar sebagai Jenis basis pengetahuan.
Saat membuat atau mengedit aplikasi agen, klik tombol + di sebelah kanan Image (basis pengetahuan Tanya-Jawab Gambar), tambahkan basis pengetahuan yang telah Anda buat pada langkah sebelumnya, lalu ubah templat prompt menjadi:
```
# Basis Pengetahuan
Harap ingat materi berikut. Materi ini mungkin membantu menjawab pertanyaan.
${documents}

# Persyaratan
Jika ada gambar, harap tampilkan.
```

Ajukan pertanyaan di kotak input di sebelah kanan.

Misalnya: "Perkenalkan secara singkat ponsel Model Studio X1."

Contoh mereferensikan gambar dengan benar

Templat prompt contoh

Prompt pengguna dan respons aplikasi Model Studio

# Basis Pengetahuan
Harap ingat materi berikut. Materi ini mungkin membantu menjawab pertanyaan.
${documents}

# Persyaratan
Jika ada gambar, harap tampilkan.

Izin dan keamanan

T: Saya menerima kesalahan "Izin hilang untuk modul ini" saat mencoba mengelola basis pengetahuan. Apa yang harus saya lakukan?

Secara default, Pengguna RAM tidak dapat melakukan operasi tulis seperti membuat, memperbarui, atau menghapus basis pengetahuan. Akun Alibaba Cloud harus memberikan izin izin halaman kepada Pengguna RAM untuk Administrator atau, minimal, untuk Operasi Data Aplikasi dan Operasi Basis Pengetahuan.
T: Apakah basis pengetahuan bersifat privat? Dapatkah organisasi atau pengguna lain mengaksesnya?

Basis pengetahuan bersifat privat untuk ruang kerjanya dan hanya dapat diakses serta dikelola oleh anggota ruang kerja tersebut.
T: Apakah Alibaba Cloud akan menggunakan basis pengetahuan di akun saya untuk menjawab pertanyaan pengguna lain?

Alibaba Cloud berkomitmen terhadap privasi data dan tidak akan menggunakan data basis pengetahuan Anda untuk pelatihan model atau menjawab pertanyaan pengguna lain. Lihat Pernyataan Kepatuhan & Privasi untuk komitmen keamanan dan privasi data kami.

Migrasi dan ekspor

T: Bagaimana cara mengekspor basis pengetahuan ke mesin lokal saya?

Ekspor satu klik saat ini tidak didukung. Sebagai alternatif, Anda dapat menulis skrip yang memanggil API ListChunks untuk mengambil data dokumen dan potongan secara batch.

Model yang didukung

Panduan cepat

1. Bangun basis pengetahuan

2. Integrasi dengan aplikasi bisnis

Aplikasi agen

Aplikasi alur kerja

Aplikasi eksternal

3. Optimalkan kinerja RAG (Opsional)

Aksi

Buat basis pengetahuan

Ekstraksi metadata

Rakit header Excel

Metode pemotongan

Penulisan ulang percakapan multi-putaran

Model penyematan

Model penyusunan ulang

Ambang batas kemiripan

Jumlah recall maksimum

Penyimpanan vektor

Batasan format file

Perbedaan konfigurasi indeks

Batasan pengeditan

Pengambilan data dan balasan model

Penulisan ulang percakapan multi-putaran

Model penyematan

Model penyusunan ulang

Ambang batas kemiripan

Jumlah recall maksimum

Penyimpanan vektor

Pengambilan data dan balasan model

Penulisan ulang percakapan multi-putaran

Model penyematan

Model penyusunan ulang

Ambang batas kemiripan

Jumlah recall maksimum

Penyimpanan vektor

Perbarui basis pengetahuan

Pencarian dokumen

Kueri data dan Tanya-Jawab Gambar

Pencarian audio dan video

Edit basis pengetahuan

Hapus basis pengetahuan

Ubah konfigurasi

Hit testing

Kasus penggunaan

Prosedur

Kuota dan batasan

Penagihan

Referensi API

FAQ

Membangun basis pengetahuan

Menangani gambar dan konten multimoda

Pencarian dokumen

Tanya-Jawab Gambar

Izin dan keamanan

Migrasi dan ekspor