All Products
Search
Document Center

OpenSearch:Teks Kaya

Last Updated:Jul 02, 2025

Topik ini menjelaskan cara mengonfigurasi fitur teks kaya dari Edisi Pencarian Percakapan Berbasis LLM OpenSearch dan efek dari fitur tersebut.

Dalam proses RAG online OpenSearch, semua elemen teks kaya seperti gambar, tabel, dan kode diekstraksi selama pemotongan dokumen dan disimpan dalam format tag teks kaya bersama dengan konten utama. Jika Anda mengaktifkan fitur teks kaya, elemen teks kaya dalam dokumen dapat dimasukkan dalam jawaban yang diberikan oleh model bahasa besar (LLMs).

Mengaktifkan fitur teks kaya

Parameter rich_text_strategy pada tab Other Parameters di halaman Q&A Test instance OpenSearch Anda digunakan untuk mengelola fitur teks kaya. Mengonfigurasi parameter ini akan mengaktifkan fitur tersebut, sementara membiarkannya kosong akan menonaktifkannya.

image

Deskripsi Parameter:

Parameter berikut ditambahkan ke operasi API Melakukan pencarian percakapan berbasis teks.

options.chat.rich_text_strategy

String

Tidak

Metode pemrosesan teks kaya. Jika parameter ini tidak ada atau dibiarkan kosong, teks kaya tidak diaktifkan, dan metode pemrosesan default digunakan.

  • inside_response: Tag teks kaya dalam jawaban langsung dipulihkan ke teks asli dalam format Markdown. Perhatikan bahwa tabel langsung dimasukkan ke dalam file Markdown dalam format HTML.

  • extend_response: Konten aktual dari setiap tag teks kaya dalam jawaban dikembalikan oleh rich_text_ref. Gambar dikembalikan sebagai URL, tabel dikembalikan dalam format HTML, dan kode dikembalikan dalam format teks.

inside_response

Jawaban dikembalikan dalam format Markdown dan mungkin mencakup elemen teks kaya seperti tabel, gambar, dan kode.

extend_response

Jawaban dikembalikan dalam teks biasa dan mungkin mencakup tag teks kaya. Anda dapat mengklik tag untuk melihat detail teks kaya yang tidak dirender.

Contoh Permintaan

{
	"question": {
		"text": "Bagaimana cara mengonfigurasi aturan identifikasi data sensitif?",
		"type": "TEXT"
	},
	"options": {
		"chat": {
			"rich_text_strategy": "inside_response"
		}
	}
}

Respon untuk extend_response

Tag teks kaya dalam data.rich_text_ref perlu diurai secara otomatis, dan logika untuk mengganti tag teks kaya dalam data.answer perlu dikembangkan.

{
  "request_id": "0bb16ed4-6eec-4ae4-b1dd-0650289b45b3",
  "status": "OK",
  "latency": 11421.663139,
  "result": {
    "data": [
      {
        "answer": "Untuk mengonfigurasi aturan identifikasi data sensitif, lakukan langkah-langkah berikut: \n\n1. Buka halaman Identifikasi Data Sensitif. \n   - Masuk ke konsol DataWorks dan buka halaman pengembangan data. \n   - Klik ikon di sudut kiri atas. Kemudian, pilih Semua Produk > Tata Kelola Data > Penjaga Keamanan Data. Di halaman yang muncul, klik Coba Sekarang untuk pergi ke halaman Penjaga Keamanan Data. \n   - Di panel navigasi di sebelah kiri, pilih Konfigurasi Aturan > Identifikasi Data Sensitif. \n\n2. Konfigurasikan kategori untuk tipe bidang sensitif. \n   - Jika Anda menggunakan Penjaga Keamanan Data untuk pertama kali, Anda dapat mencari atau menambahkan kategori di bagian kiri. \n   - Jika Anda adalah pengguna yang sudah ada, Anda dapat membuat kategori berdasarkan kebutuhan bisnis Anda. \n   - Nama kategori harus unik. Nama tersebut harus memiliki panjang 1 hingga 30 karakter dan dapat berisi huruf dan angka. \n\n3. Konfigurasikan aturan identifikasi data sensitif. \n   - Di tab Aturan Identifikasi Data, klik \"+ Tipe Bidang Sensitif\" untuk menambahkan tipe bidang sensitif. \n   - Di langkah Informasi Dasar, konfigurasikan parameter, termasuk Tipe Bidang Sensitif, Kategori Data, Tingkat Sensitivitas, dan Deskripsi. [^Table-16134^]\n   - Klik \"Lanjutkan\". \n   - Di langkah Konfigurasi Aturan, konfigurasikan aturan identifikasi data sensitif berdasarkan tipe bidang sensitif, konfigurasikan kondisi berdasarkan mana aturan dipicu, dan kemudian uji akurasi aturan. [^Figure-19933^]\n   - Klik \"Terbitkan untuk Digunakan\" untuk menerbitkan aturan identifikasi data sensitif. \n\n4. Otorisasi tugas identifikasi data sensitif untuk mengidentifikasi data sensitif dan mulai tugas tersebut. \n   - Di sudut kiri atas halaman Identifikasi Data Sensitif, klik \"Jalankan Tugas\" untuk mengotorisasi tugas identifikasi data sensitif untuk mengidentifikasi data sensitif. \n   - Di panel Aktifkan tugas identifikasi data sensitif, konfigurasikan tugas identifikasi data sensitif, termasuk jenis tugas, metode pemindaian, dan rentang pemindaian. [^Figure-41464^]\n   - Klik \"Jalankan\" untuk memulai tugas. \n\nPerhatikan hal-hal berikut: \n- Jika Anda tidak ingin menggunakan aturan tersebut, Anda dapat mengklik \"Simpan sebagai Draf\" untuk menyimpan aturan. \n- Jika data di kolom memenuhi beberapa aturan identifikasi data sensitif yang dikonfigurasi untuk tipe bidang sensitif yang berbeda, sistem mengidentifikasi data sensitif di kolom tersebut dalam urutan berikut: identifikasi nama bidang sensitif, identifikasi konten sensitif, dan identifikasi komentar sensitif. \n- Jika Anda ingin aturan baru berlaku secara real-time, Anda harus memicu tugas untuk dijalankan secara manual. \n- Jika Anda memodifikasi aturan identifikasi data sensitif, aturan baru berlaku saat tugas dijalankan secara otomatis berikutnya. \n\nSelain itu, Anda dapat melakukan operasi berikut: \n- Salin aturan \n- Modifikasi aturan \n- Hapus aturan \n- Terbitkan beberapa aturan sekaligus \n- Batalkan penerbitan beberapa aturan sekaligus \n\nOperasi ini dapat membantu Anda mengelola aturan identifikasi data sensitif secara lebih fleksibel.",
        "type": "TEXT",
        "reference": [
          {
            "tokenNum": 1814,
            "id": "8d89d16d8e73658ee12ea0b9e70a5ee2",
            "title": "Konfigurasikan aturan identifikasi data sensitif dan jalankan tugas identifikasi data sensitif_DataWorks-Pusat Bantuan Alibaba Cloud",
            "url": "https://xxx.com"
          }
        ],
        "rich_text_ref": [
          {
            "id": "Table-16134",
            "content": "<table><tbody>\n <tr>\n  <td></td>\n  <td></td>\n </tr>\n <tr>\n  <td></td>\n  <td>Nama tipe bidang sensitif, seperti nama, nomor ID, atau nomor telepon. Nama tersebut harus unik. </td>\n </tr>\n <tr>\n  <td></td>\n  <td>Kategori tempat tipe bidang sensitif termasuk. Jika kategori yang ada tidak memenuhi kebutuhan bisnis Anda, Anda dapat mengonfigurasi kategori di halaman . Untuk informasi lebih lanjut, lihat <a href=\"https://xxx.com" id=\"21566a9cceiv9\" title=\"\" class=\"xref\">Tentukan kategori dan tingkat sensitivitas data sensitif</a>. </td>\n </tr>\n <tr>\n  <td></td>\n  <td>Tingkat sensitivitas tipe bidang sensitif. Angka besar menunjukkan tingkat sensitivitas tinggi. Jika tingkat sensitivitas yang ada tidak memenuhi kebutuhan Anda, Anda dapat mengonfigurasi tingkat sensitivitas di halaman . Untuk informasi lebih lanjut, lihat <a href=\"https://xxx.com\" id=\"39588a781b9hn\" title=\"\" class=\"xref\">Tentukan kategori dan tingkat sensitivitas data sensitif</a>. </td>\n </tr>\n</tbody></table>"
          },
          {
            "id": "Figure-19933",
            "content": "https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/9017816461/p339261.png"
          },
          {
            "id": "Figure-41464",
            "content": "https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/5947660271/p819013.png"
          }
        ]
      },
      {
        "answer": "https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/5947660271/p339229.png",
        "type": "IMAGE",
        "reference": [
          {
            "tokenNum": 179,
            "id": "8d89d16d8e73658ee12ea0b9e70a5ee2",
            "title": "Konfigurasikan aturan identifikasi data sensitif dan jalankan tugas identifikasi data sensitif_DataWorks-Pusat Bantuan Alibaba Cloud",
            "url": "https://xxx.com"
          }
        ]
      }
    ]
  }
}

Respons untuk inside_response

Bidang data.answer diurai dalam format Markdown, terlepas dari bidang rich_text_ref.

{
  "request_id": "b1f59cc0-daad-45e2-bc41-f01e1c2ff5d7",
  "status": "OK",
  "latency": 9.828,389664,
  "result": {
    "data": [
      {
        "answer": "Untuk mengonfigurasi aturan identifikasi data sensitif, lakukan langkah-langkah berikut: \n\n1. Pergi ke halaman Identifikasi Data Sensitif. \n   - Masuk ke konsol DataWorks dan pergi ke halaman Pengembangan Data. \n   - Di halaman Pengembangan Data, pilih ruang kerja dari daftar drop-down dan klik Pergi ke Pengembangan Data. \n   - Di halaman yang muncul, klik ikon di pojok kiri atas dan pilih \"Semua Produk > Tata Kelola Data > Penjaga Keamanan Data\" untuk pergi ke halaman Penjaga Keamanan Data. Di halaman tersebut, klik Coba Sekarang. \n   - Di panel navigasi di sebelah kiri, pilih \"Konfigurasi Aturan > Identifikasi Data Sensitif\". \n\n2. Konfigurasikan kategori untuk tipe bidang sensitif. \n   - Jika Anda menggunakan Penjaga Keamanan Data untuk pertama kalinya, Anda dapat mencari atau menambahkan kategori di bagian sebelah kiri. \n   - Jika Anda adalah pengguna yang sudah ada, Anda dapat membuat kategori berdasarkan kebutuhan bisnis Anda. \n   - Nama kategori harus unik. Nama harus memiliki panjang 1 hingga 30 karakter dan dapat berisi huruf dan angka. \n\n3. Konfigurasikan aturan identifikasi data sensitif. \n   - Di tab Aturan Identifikasi Data, klik \"+ Tipe Bidang Sensitif\" untuk menambahkan tipe bidang sensitif. \n   - Di langkah Informasi Dasar, konfigurasikan informasi dasar tentang tipe bidang sensitif. \n     - Masukkan nilai di bidang Tipe Bidang Sensitif. \n     - Pilih nilai dari daftar drop-down Kategori Data. \n     - Pilih nilai dari daftar drop-down Tingkat Sensitivitas. \n     - Masukkan nilai di bidang Deskripsi. \n   - Klik \"Berikutnya\". \n   - Di langkah Konfigurasi Aturan, konfigurasikan aturan identifikasi data sensitif berdasarkan tipe bidang sensitif, konfigurasikan kondisi berdasarkan mana aturan dipicu, dan kemudian uji akurasi aturan. ![](https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/9017816461/p339261.png)\n   - Klik \"Terbitkan untuk Digunakan\" untuk menerbitkan aturan identifikasi data sensitif. \n\n4. Otorisasi tugas identifikasi data sensitif untuk mengidentifikasi data sensitif dan mulai tugas. \n   - Di pojok kiri atas halaman Identifikasi Data Sensitif, klik \"Jalankan Tugas\" untuk mengotorisasi tugas identifikasi data sensitif untuk mengidentifikasi data sensitif. \n   - Mulai tugas identifikasi data sensitif. \n     - Konfigurasikan tugas identifikasi data sensitif, termasuk jenis tugas, metode pemindaian, dan rentang pemindaian. ![](https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/5947660271/p819013.png)\n     - Klik \"Jalankan Tugas\" untuk memulai tugas. \n\n5. Kelola aturan identifikasi data sensitif. \n   - Salin, modifikasi, atau hapus aturan. \n   - Terbitkan atau batalkan penerbitan beberapa aturan sekaligus. \n\nAnda dapat menggunakan aturan dalam tugas identifikasi data sensitif untuk mengidentifikasi data sensitif hanya setelah aturan diterbitkan. Jika banyak aturan tersedia, Anda dapat menerbitkan atau membatalkan penerbitan aturan sekaligus.",
        "type": "TEXT_MARKDOWN",
        "reference": [
          {
            "tokenNum": 1814,
            "id": "8d89d16d8e73658ee12ea0b9e70a5ee2",
            "title": "Konfigurasikan aturan identifikasi data sensitif dan jalankan tugas identifikasi data sensitif_DataWorks-Pusat Bantuan Alibaba Cloud",
            "url": "https://xxx.com"
          }
        ],
        "rich_text_ref": [
          {
            "id": "Figure-3873",
            "content": "https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/9017816461/p339261.png"
          },
          {
            "id": "Figure-19511",
            "content": "https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/5947660271/p819013.png"
          }
        ]
      },
      {
        "answer": "https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/5947660271/p339229.png",
        "type": "IMAGE",
        "reference": [
          {
            "tokenNum": 179,
            "id": "8d89d16d8e73658ee12ea0b9e70a5ee2",
            "title": "Konfigurasikan aturan identifikasi data sensitif dan jalankan tugas identifikasi data sensitif_DataWorks-Pusat Bantuan Alibaba Cloud",
            "url": "https://xxx/user-guide/identify-sensitive-data"
          }
        ]
      }
    ]
  }
}

Catatan penggunaan

Dalam daftar data yang dikembalikan, item "type": "IMAGE" menunjukkan hasil beberapa gambar pada fase pengambilan. Gambar-gambar tersebut tidak terkait dengan fitur teks kaya. Korelasi gambar yang dihasilkan oleh fitur teks kaya lebih baik dibandingkan dengan gambar yang dihasilkan pada fase pengambilan.