Jalankan Tes Q&A untuk Mengoptimalkan Pencarian Percakapan - OpenSearch

Konsol menyediakan halaman Tes Tanya Jawab bawaan untuk pengguna melakukan tes Tanya Jawab. Saat Anda memasukkan pertanyaan, model akan mencocokkannya dengan hasil yang sesuai untuk memberikan jawaban. Setelah membeli dan mengonfigurasi instans, Anda dapat menyesuaikan parameter berbeda untuk menguji efek Tanya Jawab dalam berbagai skenario dan kebutuhan. Kemudian, Anda dapat memilih konfigurasi parameter optimal berdasarkan hasilnya. Topik ini menjelaskan cara melakukan tes Tanya Jawab di konsol serta parameter yang dapat disesuaikan.

Prasyarat

Instans OpenSearch-LLM Edisi Cerdas telah dibuat. Untuk informasi lebih lanjut, lihat Buat instans.
Konfigurasi data telah selesai. Untuk informasi lebih lanjut, lihat Konfigurasi data.

Prosedur

Prosedur berikut menggunakan file video sebagai contoh untuk menunjukkan proses lengkap dari mengunggah video hingga penguraian otomatis oleh basis pengetahuan, kemudian melakukan tes Tanya Jawab berdasarkan konten video untuk mengembalikan hasil terkait.

Masuk ke Konsol OpenSearch dan pilih Edisi Pencarian Percakapan Berbasis LLM. Di panel navigasi di sebelah kiri, klik Manajemen Instans. Temukan instans yang ingin dikelola dan klik Kelola di kolom Aksi. Di halaman Rincian Instans, klik Pusat Konfigurasi, lalu klik Konfigurasi Data. Klik Impor File, pilih file yang ingin diunggah, lalu klik Unggah File untuk mengimpor file ke basis pengetahuan.
Tunggu hingga file berhasil diunggah. Saat status kueri data menunjukkan selesai, klik Tes Tanya Jawab di panel navigasi di sebelah kiri untuk mengajukan pertanyaan kepada model.
Setelah masuk ke halaman tes Tanya Jawab, klik Konfigurasi Model di pojok kanan atas. Anda dapat mengonfigurasi Parameter Tanya Jawab, Parameter Prompt, Parameter Pengambilan Dokumen, Parameter Gambar Referensi, Parameter Pemahaman Kueri, Parameter Intervensi Manual, dan Parameter Lainnya sesuai kebutuhan pencarian Anda. Kemudian, masukkan pertanyaan di kotak dialog dan klik Kirim.
Lihat hasil tes Tanya Jawab, yang akan dikembalikan berdasarkan konten di basis pengetahuan yang diunggah.

Parameter

Parameter Tanya Jawab
Parameter	Tipe	Diperlukan	Nilai default	Deskripsi
options.chat.model	String	Ya	opensearch-qwen	LLM yang digunakan untuk tes Tanya Jawab. Panjang konteks yang didukung dan jumlah maksimum token input dan output bervariasi berdasarkan LLM:
Prompt	String	Tidak	Template prompt default	Template prompt yang digunakan untuk tes Tanya Jawab. Untuk informasi tentang template prompt yang didukung, lihat Kelola prompt
question.session	Boolean	Tidak	true	false: menonaktifkan fitur percakapan multi-putaran. true: mengaktifkan fitur percakapan multi-putaran. Sistem mengembalikan hasil berdasarkan n putaran percakapan terbaru. session: menentukan sumber percakapan. Sistem mengembalikan hasil berdasarkan konteks percakapan dengan sumber yang sama.
options.chat.enable_deep_search	Boolean	Tidak	false	Menentukan apakah akan mengaktifkan pencarian mendalam. true: mengaktifkan pencarian mendalam. Inferensi multi-putaran diperlukan untuk mengembalikan hasil data komprehensif. Ini meningkatkan waktu dan sumber daya komputasi yang dikonsumsi oleh percakapan. false: menonaktifkan pencarian mendalam.
options.retrieve.web_search.enable	Boolean	Tidak	false	Menentukan apakah akan mengaktifkan fitur pencarian Internet. true: mengaktifkan fitur pencarian Internet. Dalam hal ini, sistem mengembalikan jawaban berdasarkan data yang dicari di Internet. Ini meningkatkan waktu dan sumber daya komputasi yang dikonsumsi oleh percakapan. false: menonaktifkan fitur pencarian Internet.
options.chat.stream	Boolean	Tidak	true	Menentukan apakah akan mengaktifkan pengkodean transfer HTTP chunked. true (default) false

Parameter Prompt
Parameter	Tipe	Diperlukan	Deskripsi
options.chat.prompt_config.attitude	String	Tidak	Nada percakapan. Parameter ini termasuk dalam template prompt bawaan. Nilai default: normal. normal (default) sopan sabar
options.chat.prompt_config.rule	String	Tidak	Tingkat detail percakapan. Nilai default: detailed. detailed stepbystep
options.chat.prompt_config.noanswer	String	Tidak	Informasi yang dikembalikan jika sistem gagal menemukan jawaban atas pertanyaan tersebut. Nilai default: sorry. sorry: Maaf, saya tidak bisa menjawab pertanyaan Anda berdasarkan informasi yang diketahui. uncertain: Saya tidak tahu.
options.chat.prompt_config.language	String	Tidak	Bahasa jawaban. Nilai default: Bahasa Mandarin Bahasa Mandarin Bahasa Inggris Bahasa Thailand Bahasa Korea
options.chat.prompt_config.role	Boolean	Tidak	Menentukan apakah akan mengaktifkan peran kustom untuk menjawab pertanyaan.
options.chat.prompt_config.role_name	String	Tidak	Nama peran kustom. Contoh: AI Assistant.
options.chat.prompt_config.out_format	String	Tidak	Format jawaban. Nilai default: teks. teks tabel daftar markdown

Parameter Pengambilan Dokumen
Parameter	Tipe	Diperlukan	Deskripsi
options.retrieve.doc.filter	String	Tidak	Filter yang digunakan untuk menyaring dokumen di basis pengetahuan berdasarkan bidang tertentu selama pengambilan dokumen. Secara default, parameter ini dibiarkan kosong. Untuk contoh penggunaan filter, lihat Parameter filter. Bidang berikut didukung: tabel: sebuah tabel. raw_pk: kunci utama dokumen. kategori: kategori dokumen. skor: skor dokumen. timestamp: timestamp dokumen. Contoh: "filter" : "raw_pk=\"123\"" # Mendapatkan data dari dokumen yang memiliki kunci utama 123. "filter" : "category=\"value1\"" # Mendapatkan data dari dokumen yang memiliki kategori value1. "filter" : "category=\"value1\" OR category=\"value2\"" # Mendapatkan data dari dokumen yang memiliki kategori value1 atau value2. "filter" : "score>1.0" # Mendapatkan data dari dokumen yang memiliki skor lebih besar dari 1.0. "filter" : "timestamp>1356969600" # Mendapatkan data dari dokumen yang memiliki timestamp lebih besar dari 1 Januari 2013.
options.retrieve.doc.top_n	Integer	Tidak	Jumlah dokumen yang akan diambil. Nilai valid: (0, 50]. Nilai default: 5.
options.retrieve.doc.sf	Float	Tidak	Ambang batas skor vektor untuk pengambilan dokumen. Jika model vektor jarang dinonaktifkan, nilai parameter berkisar dari 0 hingga 2.0 dan nilai default adalah 1.3. Semakin kecil nilainya, semakin tinggi relevansi dokumen tetapi semakin sedikit dokumen yang diambil. Sebaliknya, dokumen yang kurang relevan mungkin diambil. Jika model vektor jarang diaktifkan, nilai default adalah 0.35. Semakin besar nilainya, semakin tinggi relevansi dokumen tetapi semakin sedikit dokumen yang diambil. Sebaliknya, dokumen yang kurang relevan mungkin diambil.
options.retrieve.doc.dense_weight	Float		Bobot vektor padat selama pengambilan dokumen jika model vektor jarang diaktifkan. Nilai valid: (0.0, 1.0). Nilai default: 0.7.
options.retrieve.doc.formula	String	Tidak	Rumus berdasarkan mana dokumen yang diambil diurutkan. Catatan Untuk informasi tentang sintaks, lihat Fungsi pengurutan halus. Relevansi algoritma dan relevansi lokasi geografis tidak didukung.
options.retrieve.doc.operator	String	Tidak	Operator antara istilah yang diperoleh setelah segmentasi teks selama pengambilan dokumen. Parameter ini hanya berlaku jika model vektor jarang dinonaktifkan. AND: Dokumen yang cocok dengan semua istilah diambil. Nilai default: AND. OR: Dokumen yang cocok dengan setidaknya satu istilah diambil.

Parameter Gambar Referensi
Parameter	Tipe	Diperlukan	Nilai default	Deskripsi
options.retrieve.image.sf	Float	Tidak	1	Ambang batas skor vektor untuk pengambilan dokumen. Jika model vektor jarang dinonaktifkan, nilai parameter berkisar dari 0 hingga 2.0 dan nilai default adalah 1.0. Semakin kecil nilainya, semakin tinggi relevansi dokumen tetapi semakin sedikit dokumen yang diambil. Sebaliknya, dokumen yang kurang relevan mungkin diambil. Jika model vektor jarang diaktifkan, nilai default adalah 0.5. Semakin besar nilainya, semakin tinggi relevansi dokumen tetapi semakin sedikit dokumen yang diambil. Sebaliknya, dokumen yang kurang relevan mungkin diambil.
options.retrieve.image.dense_weight	Float	Tidak	0.7	Bobot vektor padat selama pengambilan gambar jika model vektor jarang diaktifkan. Nilai valid: (0.0, 1.0). Nilai default: 0.7.

Parameter Pemahaman Kueri
Parameter	Tipe	Diperlukan	Rentang valid	Deskripsi
options.retrieve.qp.query_extend	Boolean	Tidak	-	Menentukan apakah akan memperluas kueri. Kueri yang diperluas digunakan untuk mengambil segmen dokumen di OpenSearch. Nilai default: false. false (default): tidak memperluas kueri. true: memperluas kueri. Interaksi tambahan dengan LLM dilakukan. Ini memperlambat respons sistem. Jangan perluas kueri untuk aplikasi yang memerlukan respons cepat.
options.retrieve.qp.query_extend_num	Integer	Tidak	(0, +∞)	Jumlah maksimum kueri yang akan diperluas jika fitur perluasan kueri diaktifkan. Nilai default: 5.

Parameter Intervensi Manual
Parameter	Tipe	Diperlukan	Deskripsi
options.retrieve.entry.sf	Float	Tidak	Ambang batas skor vektor untuk intervensi manual. Nilai valid: [0, 2.0]. Nilai default: 0.3. Semakin kecil nilainya, semakin tinggi relevansi dokumen tetapi semakin sedikit dokumen yang diambil. Sebaliknya, dokumen yang kurang relevan mungkin diambil.

Parameter Pencarian Mendalam
Parameter	Tipe	Diperlukan	Deskripsi
options.chat.agent.think_process	Boolean	Tidak	Menentukan apakah akan menampilkan proses pemikiran.
options.chat.agent.max_think_round	Integer	Tidak	Jumlah putaran pemikiran (maksimum 20).
options.chat.agent.language	String	Tidak	Bahasa untuk proses pemikiran dan jawaban. AUTO: pilih Bahasa Mandarin atau Inggris berdasarkan kueri. CN: Bahasa Mandarin. EN: Bahasa Inggris.

Parameter Lainnya
Parameter	Tipe	Diperlukan	Deskripsi
options.retrieve.return_hits	Boolean	Tidak	Menentukan apakah akan mengembalikan hasil pengambilan dokumen. Jika Anda mengatur parameter ini ke true, parameter search_hits dikembalikan dalam respons.
options.chat.history_max	Integer	Tidak	Jumlah maksimum putaran percakapan berdasarkan mana sistem mengembalikan hasil. Nilai maksimum: 20. Nilai default: 1.
options.chat.link	Boolean	Tidak	Menentukan apakah akan mengembalikan URL sumber referensi. Secara spesifik, parameter ini menentukan apakah sumber referensi termasuk dalam konten yang dihasilkan oleh model. Nilai valid: true false (default) Contoh respons jika Anda mengatur parameter ini ke true: Anda dapat mengubah ukuran disk dari instans Elastic Compute Service (ECS) secara online atau offline[^1^]. Jika Anda menggunakan metode pengubahan ukuran online, Anda dapat mengubah ukuran disk tanpa perlu memulai ulang instans. Jika Anda menggunakan metode pengubahan ukuran offline, Anda harus memulai ulang instans[^1^]. Untuk mengubah ukuran disk, lakukan langkah-langkah berikut: Masuk ke Konsol ECS, temukan disk yang ingin Anda ubah ukurannya, klik Ubah Ukuran di kolom Aksi, dan kemudian pilih metode pengubahan ukuran berdasarkan kebutuhan bisnis Anda[^1^]. Jika Anda perlu mengubah partisi dan sistem file, Anda dapat memperoleh informasi terkait menggunakan CLI atau di konsol[^2^]. Setelah disk ECS diubah ukurannya, Anda tidak dapat mengurangi kapasitasnya. Kami merekomendasikan agar Anda merencanakan kapasitas secara wajar[^3^]. `[^`Nomor`^]` menunjukkan nomor urut dokumen yang diambil dalam referensi hasil yang dikembalikan. Misalnya, `[^1^]` menunjukkan dokumen pertama dalam referensi.
options.chat.rich_text_strategy	String	Tidak	Metode pemrosesan teks kaya. Jika parameter ini tidak ada atau dibiarkan kosong, teks kaya tidak diaktifkan, dan metode pemrosesan default digunakan: inside_response: Tag teks kaya dalam jawaban langsung dipulihkan ke teks asli dalam format Markdown. Perhatikan bahwa tabel disisipkan langsung ke file Markdown dalam format HTML. extend_response: Konten aktual dari setiap tag teks kaya dalam jawaban dikembalikan oleh rich_text_ref. Gambar dikembalikan sebagai URL, tabel dikembalikan dalam format HTML, dan kode dikembalikan dalam format teks. Untuk informasi lebih lanjut, lihat Teks Kaya.
options.retrieve.graph	Boolean	Tidak	Menentukan apakah akan melakukan asosiasi kueri dan pengambilan berdasarkan hubungan grafik. Parameter ini hanya berlaku jika GraphRAG diaktifkan dalam konfigurasi data.
options.chat.enable_llm_knowledge	Boolean	Tidak	Menentukan apakah akan menggunakan LLM untuk mengembalikan jawaban jika tidak ada hasil pencarian yang diperoleh. true false

Catatan

Anda dapat melakukan tes Tanya Jawab dengan memanggil Operasi API atau menggunakan SDK OpenSearch.

Prasyarat

Prosedur

Parameter

Parameter Tanya Jawab

Parameter Prompt

Parameter Pengambilan Dokumen

Parameter Gambar Referensi

Parameter Pemahaman Kueri

Parameter Intervensi Manual

Parameter Pencarian Mendalam

Parameter Lainnya