全部产品
Search
文档中心

Elasticsearch:Unggah file kamus sinonim

更新时间:Jul 06, 2025

Sebelum menggunakan sinonim, Anda harus mengunggah file kamus sinonim. Topik ini menjelaskan cara mengunggah file kamus sinonim ke kluster Alibaba Cloud Elasticsearch dan memberikan tindakan pencegahan terkait.

Tindakan Pencegahan

  • Sebelum mengunggah file kamus sinonim ke kluster Elasticsearch, pastikan kluster dalam kondisi normal. Setelah pengunggahan, sistem akan me-restart kluster. Selama restart, sistem memperbarui kamus sinonim di semua node dalam kluster berdasarkan file yang diunggah. Waktu yang diperlukan untuk penerapan kamus yang diperbarui bergantung pada spesifikasi, volume data, dan beban kluster. Kami menyarankan Anda mengunggah file kamus sinonim selama jam-jam sepi.

  • Dalam kebanyakan kasus, jika indeks kluster memiliki shard replika dan beban kluster normal, kluster tetap dapat menyediakan layanan selama perubahan konfigurasi. Indikator beban normal meliputi: Utilisasi CPU setiap node sekitar 60%, penggunaan heap memory sekitar 50%, dan nilai NodeLoad_1m kurang dari jumlah vCPU untuk node tersebut.

  • Jika indeks kluster tidak memiliki shard replika, beban kluster terlalu tinggi, atau sejumlah besar data ditulis atau di-query, akses ke kluster mungkin timeout selama perubahan konfigurasi. Kami menyarankan Anda mengonfigurasi mekanisme ulang akses untuk klien sebelum melakukan perubahan konfigurasi kluster guna mengurangi dampak pada bisnis.

  • File kamus baru tidak berlaku untuk indeks yang sudah ada karena indeks ini tidak dapat secara otomatis memuat file tersebut. Sebagai contoh, indeks index-aliyun dibuat berdasarkan file sinonim aliyun.txt, dan Anda memodifikasi file tersebut lalu mengunggahnya. File yang diunggah tidak berlaku untuk indeks tersebut. Untuk membuat file kamus baru berlaku pada indeks yang sudah ada, lakukan salah satu operasi berikut:

    • Reindex data dalam indeks setelah kamus sinonim kluster Elasticsearch diperbarui. Layanan tidak terganggu selama operasi reindex.

    • Buka kembali indeks. Layanan terganggu selama operasi pembukaan kembali. Untuk membuka kembali indeks, buka tab Console halaman Dev Tools di konsol Kibana dan jalankan perintah berikut:

      ---index_name menentukan nama indeks.
      POST <index_name>/_close
      POST <index_name>/_open
  • File kamus sinonim harus berupa file TXT yang dikodekan dalam UTF-8. Setiap baris hanya dapat berisi satu ekspresi sinonim. Ekspresi sinonim mendukung aturan Solr dan aturan WordNet. Berikut adalah contoh kode:

    ipod, i-pod, i pod => ipod, i-pod, i pod
    foo => foo bar
  • Daftar stopword kluster Elasticsearch tidak boleh berisi kata kunci yang ditentukan dalam file kamus sinonim kluster. Jika tidak, kesalahan akan dilaporkan dalam log kluster saat Anda mengunggah file kamus sinonim baru atau melakukan perubahan lainnya.

  • Untuk mencegah dampak pada bisnis, kami menyarankan Anda tidak mengubah nama file kamus sinonim yang sedang digunakan. Jika tidak, indeks yang menggunakan file kamus sinonim tersebut mungkin menjadi abnormal.

Prosedur

  1. Masuk ke konsol Alibaba Cloud Elasticsearch.

  2. Di panel navigasi sisi kiri, klik Elasticsearch Clusters.

  3. Arahkan ke kluster yang diinginkan.

    1. Di bilah navigasi atas, pilih grup sumber daya tempat kluster berada dan wilayah tempat kluster berada.

    2. Di halaman Elasticsearch Clusters, temukan kluster dan klik ID-nya.

  4. Di panel navigasi sisi kiri halaman yang muncul, pilih Configuration and Management > Cluster Configuration.

  5. Di bagian Basic Configuration, klik Upload di sebelah kanan Synonym Dictionary Configuration.

  6. Di panel Synonym Dictionary Configuration, klik Configure di pojok kiri bawah.

  7. Pilih metode yang ingin Anda gunakan untuk mengunggah file kamus sinonim.

    Catatan

    File kamus sinonim adalah file TXT yang dihasilkan berdasarkan aturan yang dijelaskan di Aturan Konfigurasi.

    • Upload: Jika Anda memilih metode ini, klik Upload dan pilih file kamus sinonim yang ingin Anda unggah dari mesin lokal Anda.

    • Add OSS File: Jika Anda memilih metode ini, konfigurasikan parameter Nama Bucket dan Nama File, dan klik Add.

      Pastikan bucket yang Anda tentukan berada di wilayah yang sama dengan kluster Elasticsearch Anda dan file yang akan diunggah adalah file TXT.

  8. Klik Save.

Catatan

Jika Anda ingin mendapatkan file kamus yang telah diunggah, klik ikon 已上传词库文件下载图标 yang sesuai dengan file untuk mengunduh file tersebut.

Apa yang Harus Dilakukan Selanjutnya

Setelah status kluster Elasticsearch menjadi Normal, masuk ke konsol Kibana kluster tersebut. Kemudian, buat indeks, verifikasi sinonim, dan unggah data uji untuk melakukan tes pencarian. Saat membuat indeks, Anda harus mengonfigurasi parameter setting dan mapping serta menentukan "synonyms_path": "analysis/your_dict_name.txt" untuk parameter setting. Untuk informasi lebih lanjut, lihat Gunakan sinonim dan Menggunakan Sinonim di dokumentasi Elasticsearch open source.

Referensi

Operasi API untuk memperbarui kamus sinonim kluster: UpdateSynonymsDicts