All Products
Search
Document Center

Elasticsearch:Pengantar seri Indexing Service

Last Updated:Mar 26, 2026

Kluster Elasticsearch menangani proses indexing dan pencarian pada node yang sama, sehingga Anda harus mengukur kapasitas kluster berdasarkan throughput tulis puncak meskipun trafik tulis bersifat bursty atau tidak dapat diprediksi. Kluster Alibaba Cloud Elasticsearch Kernel-enhanced Edition dengan Indexing Service memindahkan seluruh operasi tulis ke layanan cloud terkelola, sehingga sumber daya kluster Anda dapat difokuskan sepenuhnya untuk pencarian. Berdasarkan arsitektur read/write splitting, Indexing Service menyediakan indexing ber-throughput tinggi dan latensi rendah dengan biaya hanya sebagian kecil dibandingkan menjalankan workload berat-tulis pada kluster standar.

Penting

Indexing Service tersedia di wilayah China (Hong Kong). Pantau terus ketersediaannya di wilayah lain.

Kasus penggunaan

Indexing Service dirancang untuk analisis data time series dengan transaksi tulis per detik (TPS) tinggi, fluktuasi trafik tulis signifikan, dan permintaan per detik (QPS) rendah. Workload khas meliputi:

  • Retrieval dan analisis log

  • Pemantauan dan analisis metrik

  • Pengumpulan, pemantauan, dan analisis data perangkat keras Internet of Things (IoT) cerdas

Penting

Sinkronisasi data antara kluster Edisi Kernel-enhanced dengan Indexing Service yang diaktifkan dan kluster Anda bergantung pada tugas apack/cube/metadata/sync. Jalankan GET _cat/tasks?v untuk memeriksa status tugas tersebut. Jangan menghapus tugas ini secara manual. Jika tugas dihapus, jalankan POST /_cube/meta/sync untuk segera memulihkannya guna menghindari gangguan pada operasi tulis data.

Cara kerja

Kluster Elasticsearch tradisional menangani indexing dan pencarian pada node yang sama, sehingga throughput tulis sangat bergantung pada kapasitas kluster. Saat terjadi lonjakan trafik tulis, seluruh kluster terdampak—termasuk latensi pencarian.

Indexing Service memisahkan kedua fungsi tersebut:

  • Jalur tulis: Indexing Service menerima seluruh trafik tulis dan memproses indexing di lingkungan write-hosting khusus.

  • Jalur baca: Kluster Anda menangani kueri pencarian terhadap data yang telah direplikasi dari lingkungan write-hosting.

Architecture diagram

Arsitektur ini menghilangkan kebutuhan untuk mengukur kapasitas kluster berdasarkan throughput tulis puncak. Indexing Service menyediakan dan menskalakan sumber daya tulis di latar belakang, sementara kluster Anda fokus pada performa pencarian.

Tiga teknologi utama mendukung lingkungan write-hosting:

TeknologiDeskripsi
Physical replication of indexesMereplikasi data pada level segmen secara real-time antar kluster, menjaga sinkronisasi antara kluster write-hosting dan kluster Anda.
Separation of compute and storageMemisahkan komputasi tulis dari penyimpanan, memungkinkan penskalaan independen untuk masing-masing lapisan.
faster-bulkOptimasi kernel Alibaba Cloud yang secara signifikan mempercepat throughput bulk indexing.

Manfaat

ManfaatDetail
Biaya rendahSumber daya komputasi untuk operasi tulis berkurang rata-rata 60%. Bayar sesuai volume tulis aktual, bukan kapasitas puncak.
Elastic scalingSumber daya tulis diskalakan secara otomatis mengikuti fluktuasi trafik. Tidak diperlukan migrasi data.
Tanpa operasi dan maintenance (O&M)Indexing Service mengelola seluruh operasi tulis di cloud, menghilangkan beban manajemen kluster terkait operasi tulis.
Performa tinggiOptimasi tulis tingkat profesional melalui physical replication, pemisahan komputasi-penyimpanan, dan faster-bulk.
Latensi rendahReplikasi fisik lintas kluster pada level segmen menjaga latensi data dalam kondisi tulis jenuh pada kisaran ratusan milidetik.
Ketersediaan tinggiDukungan disaster recovery geografis melalui backup multi-kluster lintas wilayah. Jika suatu kluster gagal, alihkan indeks ke kluster lain yang berfungsi untuk hosting.

Penagihan

Indexing Service mengenakan biaya hosting tulis, yang terdiri dari:

  • Biaya trafik tulis: Berdasarkan volume trafik tulis ke lingkungan write-hosting.

  • Biaya penyimpanan: Berdasarkan storage space yang digunakan untuk hosting.

Biaya hosting tulis berlaku terlepas dari apakah kluster Anda menggunakan penagihan langganan atau pay-as-you-go. Untuk detail harga, lihat penagihan Elasticsearch.

Indexing Service mengurangi sumber daya yang diperlukan untuk menangani operasi tulis di kluster Anda, sehingga menurunkan biaya kluster secara keseluruhan.

Batasan

Indexing Service memberlakukan batasan pada throughput tulis, jumlah dokumen, dan konfigurasi indeks.

Batasan tingkat kluster

Batasan ini bersifat mutlak. Melebihi batas akan mengembalikan HTTP 429.

ItemBatasError saat dilampaui
Trafik tulis200 MB/sInflow Quota Exceed. Untuk meminta batas lebih tinggi, submit a ticketsubmit a ticket.
Dokumen yang ditulis per detik200.000 docs/sWrite QPS Exceed. Untuk meminta batas yang lebih tinggi, ajukan Tiket
Permintaan PUT untuk Pemetaan50 TPSPutMappingRequest blocked.
Permintaan Put Mapping yang sering mengonsumsi sumber daya komputasi signifikan dan dapat memengaruhi stabilitas layanan hosting. Definisikan templat indeks sebelum menulis data untuk meminimalkan operasi Put Mapping.

Batasan tingkat shard

Batasan ini bersifat lunak. Jika batas tercapai, layanan tetap berjalan tetapi kualitas tidak dapat dijamin.

ItemBatas lunakKode error
Trafik tulis (tanpa primary key)10 MB/s per shardwrite_size blocked
Trafik tulis (dengan primary key)5 MB/s per shardwrite_size blocked
Dokumen yang ditulis per detik5.000 docs/s per shard
Shard per indeks300 shard

Batasan konfigurasi

Indexing Service secara otomatis mengelola parameter berikut. Konfigurasi sisi klien untuk parameter ini tidak berlaku.

ParameterNilai defaultCatatan
index.refresh_interval30sDikonfigurasi otomatis oleh Indexing Service.
index.translog.durabilityasyncDiatur ke async untuk mengaktifkan penulisan translog asinkron.
index.merge.policy.max_merged_segment1024mbDikonfigurasi otomatis.
index.translog.flush_threshold_size2gbDikonfigurasi otomatis.
index.translog.sync_interval100sDikonfigurasi otomatis.

Batasan tingkat indeks

ItemBatas
Parameter lifecycle freezeTidak dapat dimodifikasi dalam siklus hidup indeks.
Operasi shrinkIndeks yang di-host tidak kompatibel dengan operasi shrink dalam Index Lifecycle Management (ILM). Lakukan operasi shrink hanya ketika indeks tidak sedang di-host. Lihat Shrink.
Pembatalan hosting otomatisHosting dinonaktifkan secara otomatis 3 hari setelah indeks di-host. Ubah durasi ini agar sesuai dengan kebutuhan siklus hidup data Anda.
Preprocessing Ingest NodeSaat menggunakan Ingest Node untuk memproses dokumen sebelum indexing, preprocessing dijalankan di kluster Anda, bukan di lingkungan hosting. Hindari logika pemrosesan yang sangat kompleks dalam konfigurasi ini. Untuk detailnya, lihat Ingest Node.

Pengujian performa

Hasil berikut membandingkan performa tulis antara Edisi Kernel-enhanced dengan Indexing Service dan kluster Edisi Standar dengan spesifikasi perangkat keras yang identik.

Hasil ini didasarkan pada Lingkungan pengujian dan set data yang dijelaskan di bawah. Performa aktual bergantung pada karakteristik data, konfigurasi indeks, dan pola workload Anda.

Lingkungan pengujian

  • Set data: Set data nyc_taxis, disediakan oleh Rally, tool benchmark open source untuk Elasticsearch

  • Konfigurasi indeks: 15 shard, 1 replica, translog asinkron, physical replication diaktifkan, refresh_interval = 5 detik

Hasil pengujian

Spesifikasi (3 node data)Edisi klusterWrite TPSWrite visibility delay
2 core, 8 GBEdisi Standar24.8835 detik
2 core, 8 GBEdisi Kernel-enhanced dengan Indexing Service226.6496 detik
4 core, 16 GBEdisi Standar52.3725 detik
4 core, 16 GBEdisi Kernel-enhanced dengan Indexing Service419.5746 detik
8 core, 32 GBEdisi Standar110.2775 detik
8 core, 32 GBEdisi Kernel-enhanced dengan Indexing Service804.0106 detik

Peningkatan performa vs Edisi Standar

Spesifikasi (3 node)Peningkatan Write TPS
2 core, 8 GB910%
4 core, 16 GB801%
8 core, 32 GB729%