Konsol menyediakan halaman Tes Tanya Jawab bawaan untuk pengguna melakukan tes Tanya Jawab. Saat Anda memasukkan pertanyaan, model akan mencocokkannya dengan hasil yang sesuai untuk memberikan jawaban. Setelah membeli dan mengonfigurasi instans, Anda dapat menyesuaikan parameter berbeda untuk menguji efek Tanya Jawab dalam berbagai skenario dan kebutuhan. Kemudian, Anda dapat memilih konfigurasi parameter optimal berdasarkan hasilnya. Topik ini menjelaskan cara melakukan tes Tanya Jawab di konsol serta parameter yang dapat disesuaikan.
Prasyarat
Instans OpenSearch-LLM Edisi Cerdas telah dibuat. Untuk informasi lebih lanjut, lihat Buat instans.
Konfigurasi data telah selesai. Untuk informasi lebih lanjut, lihat Konfigurasi data.
Prosedur
Prosedur berikut menggunakan file video sebagai contoh untuk menunjukkan proses lengkap dari mengunggah video hingga penguraian otomatis oleh basis pengetahuan, kemudian melakukan tes Tanya Jawab berdasarkan konten video untuk mengembalikan hasil terkait.
Masuk ke Konsol OpenSearch dan pilih Edisi Pencarian Percakapan Berbasis LLM. Di panel navigasi di sebelah kiri, klik Manajemen Instans. Temukan instans yang ingin dikelola dan klik Kelola di kolom Aksi. Di halaman Rincian Instans, klik Pusat Konfigurasi, lalu klik Konfigurasi Data. Klik Impor File, pilih file yang ingin diunggah, lalu klik Unggah File untuk mengimpor file ke basis pengetahuan.

Tunggu hingga file berhasil diunggah. Saat status kueri data menunjukkan selesai, klik Tes Tanya Jawab di panel navigasi di sebelah kiri untuk mengajukan pertanyaan kepada model.

Setelah masuk ke halaman tes Tanya Jawab, klik Konfigurasi Model di pojok kanan atas. Anda dapat mengonfigurasi Parameter Tanya Jawab, Parameter Prompt, Parameter Pengambilan Dokumen, Parameter Gambar Referensi, Parameter Pemahaman Kueri, Parameter Intervensi Manual, dan Parameter Lainnya sesuai kebutuhan pencarian Anda. Kemudian, masukkan pertanyaan di kotak dialog dan klik Kirim.
Lihat hasil tes Tanya Jawab, yang akan dikembalikan berdasarkan konten di basis pengetahuan yang diunggah.
Parameter
Parameter Tanya Jawab | ||||
Parameter | Tipe | Diperlukan | Nilai default | Deskripsi |
options.chat.model | String | Ya | opensearch-qwen | LLM yang digunakan untuk tes Tanya Jawab. Panjang konteks yang didukung dan jumlah maksimum token input dan output bervariasi berdasarkan LLM: |
Prompt | String | Tidak | Template prompt default | Template prompt yang digunakan untuk tes Tanya Jawab. Untuk informasi tentang template prompt yang didukung, lihat Kelola prompt |
question.session | Boolean | Tidak | true |
|
options.chat.enable_deep_search | Boolean | Tidak | false | Menentukan apakah akan mengaktifkan pencarian mendalam.
|
options.retrieve.web_search.enable | Boolean | Tidak | false | Menentukan apakah akan mengaktifkan fitur pencarian Internet.
|
options.chat.stream | Boolean | Tidak | true | Menentukan apakah akan mengaktifkan pengkodean transfer HTTP chunked.
|
Parameter Prompt | |||
Parameter | Tipe | Diperlukan | Deskripsi |
options.chat.prompt_config.attitude | String | Tidak |
|
options.chat.prompt_config.rule | String | Tidak | Tingkat detail percakapan. Nilai default: detailed.
|
options.chat.prompt_config.noanswer | String | Tidak | Informasi yang dikembalikan jika sistem gagal menemukan jawaban atas pertanyaan tersebut. Nilai default: sorry.
|
options.chat.prompt_config.language | String | Tidak | Bahasa jawaban. Nilai default: Bahasa Mandarin
|
options.chat.prompt_config.role | Boolean | Tidak | Menentukan apakah akan mengaktifkan peran kustom untuk menjawab pertanyaan. |
options.chat.prompt_config.role_name | String | Tidak | Nama peran kustom. Contoh: AI Assistant. |
options.chat.prompt_config.out_format | String | Tidak | Format jawaban. Nilai default: teks.
|
Parameter Pengambilan Dokumen | |||
Parameter | Tipe | Diperlukan | Deskripsi |
options.retrieve.doc.filter | String | Tidak | Filter yang digunakan untuk menyaring dokumen di basis pengetahuan berdasarkan bidang tertentu selama pengambilan dokumen. Secara default, parameter ini dibiarkan kosong. Untuk contoh penggunaan filter, lihat Parameter filter. Bidang berikut didukung:
Contoh: |
options.retrieve.doc.top_n | Integer | Tidak | Jumlah dokumen yang akan diambil. Nilai valid: (0, 50]. Nilai default: 5. |
options.retrieve.doc.sf | Float | Tidak | Ambang batas skor vektor untuk pengambilan dokumen.
|
options.retrieve.doc.dense_weight | Float | Bobot vektor padat selama pengambilan dokumen jika model vektor jarang diaktifkan. Nilai valid: (0.0, 1.0). Nilai default: 0.7. | |
options.retrieve.doc.formula | String | Tidak | Rumus berdasarkan mana dokumen yang diambil diurutkan. Catatan Untuk informasi tentang sintaks, lihat Fungsi pengurutan halus. Relevansi algoritma dan relevansi lokasi geografis tidak didukung. |
options.retrieve.doc.operator | String | Tidak | Operator antara istilah yang diperoleh setelah segmentasi teks selama pengambilan dokumen. Parameter ini hanya berlaku jika model vektor jarang dinonaktifkan.
|
Parameter Gambar Referensi | ||||
Parameter | Tipe | Diperlukan | Nilai default | Deskripsi |
options.retrieve.image.sf | Float | Tidak | 1 | Ambang batas skor vektor untuk pengambilan dokumen.
|
options.retrieve.image.dense_weight | Float | Tidak | 0.7 | Bobot vektor padat selama pengambilan gambar jika model vektor jarang diaktifkan. Nilai valid: (0.0, 1.0). Nilai default: 0.7. |
Parameter Pemahaman Kueri | ||||
Parameter | Tipe | Diperlukan | Rentang valid | Deskripsi |
options.retrieve.qp.query_extend | Boolean | Tidak | - | Menentukan apakah akan memperluas kueri. Kueri yang diperluas digunakan untuk mengambil segmen dokumen di OpenSearch. Nilai default: false.
|
options.retrieve.qp.query_extend_num | Integer | Tidak | (0, +∞) | Jumlah maksimum kueri yang akan diperluas jika fitur perluasan kueri diaktifkan. Nilai default: 5. |
Parameter Intervensi Manual | |||
Parameter | Tipe | Diperlukan | Deskripsi |
options.retrieve.entry.sf | Float | Tidak | Ambang batas skor vektor untuk intervensi manual. Nilai valid: [0, 2.0]. Nilai default: 0.3. Semakin kecil nilainya, semakin tinggi relevansi dokumen tetapi semakin sedikit dokumen yang diambil. Sebaliknya, dokumen yang kurang relevan mungkin diambil. |
Parameter Pencarian Mendalam | |||
Parameter | Tipe | Diperlukan | Deskripsi |
options.chat.agent.think_process | Boolean | Tidak | Menentukan apakah akan menampilkan proses pemikiran. |
options.chat.agent.max_think_round | Integer | Tidak | Jumlah putaran pemikiran (maksimum 20). |
options.chat.agent.language | String | Tidak | Bahasa untuk proses pemikiran dan jawaban. AUTO: pilih Bahasa Mandarin atau Inggris berdasarkan kueri. CN: Bahasa Mandarin. EN: Bahasa Inggris. |
Parameter Lainnya | |||
Parameter | Tipe | Diperlukan | Deskripsi |
options.retrieve.return_hits | Boolean | Tidak | Menentukan apakah akan mengembalikan hasil pengambilan dokumen. Jika Anda mengatur parameter ini ke true, parameter search_hits dikembalikan dalam respons. |
options.chat.history_max | Integer | Tidak | Jumlah maksimum putaran percakapan berdasarkan mana sistem mengembalikan hasil. Nilai maksimum: 20. Nilai default: 1. |
options.chat.link | Boolean | Tidak | Menentukan apakah akan mengembalikan URL sumber referensi. Secara spesifik, parameter ini menentukan apakah sumber referensi termasuk dalam konten yang dihasilkan oleh model. Nilai valid:
Contoh respons jika Anda mengatur parameter ini ke true:
|
options.chat.rich_text_strategy | String | Tidak | Metode pemrosesan teks kaya. Jika parameter ini tidak ada atau dibiarkan kosong, teks kaya tidak diaktifkan, dan metode pemrosesan default digunakan:
Untuk informasi lebih lanjut, lihat Teks Kaya. |
options.retrieve.graph | Boolean | Tidak | Menentukan apakah akan melakukan asosiasi kueri dan pengambilan berdasarkan hubungan grafik. Parameter ini hanya berlaku jika GraphRAG diaktifkan dalam konfigurasi data. |
options.chat.enable_llm_knowledge | Boolean | Tidak | Menentukan apakah akan menggunakan LLM untuk mengembalikan jawaban jika tidak ada hasil pencarian yang diperoleh. true false |
Anda dapat melakukan tes Tanya Jawab dengan memanggil Operasi API atau menggunakan SDK OpenSearch.