LindormSearch adalah layanan mesin pencari yang disediakan oleh Lindorm. Layanan ini menggunakan kluster terdistribusi yang terdiri dari beberapa node. Sebelum membeli LindormSearch, Anda harus mengevaluasi kapasitas sumber daya kluster Anda. Topik ini memberikan panduan umum untuk membantu Anda merencanakan kapasitas kluster.
Evaluasi kapasitas penyimpanan
- Jumlah replika: Secara default, jumlah replika yang direkomendasikan adalah 0. LindormSearch menggunakan penyimpanan bersama terdistribusi. Jika sebuah node gagal, data dapat bermigrasi secara otomatis ke node lain untuk memastikan kontinuitas layanan. Untuk keandalan tinggi, kami sarankan mengatur jumlah replika menjadi 1.
- Pembengkakan indeks: Dalam sebagian besar kasus, ukuran data indeks dapat meningkat hingga 20%.
- Mesin pencari: Cadangkan 20% dari penyimpanan untuk operasi seperti pencatatan log transaksi dan kompaksi berkala.
- Penyimpanan cadangan untuk OS: Secara default, 5% dari penyimpanan dicadangkan untuk sistem operasi.
- Ambang batas keamanan sistem: Untuk memastikan stabilitas kluster, cadangkan 20% dari penyimpanan. Jika penggunaan mencapai 80%, pesan teks peringatan akan dikirim secara otomatis.
Kebutuhan penyimpanan dapat diestimasi dengan rumus berikut:
Penyimpanan yang diperlukan = Penyimpanan yang ditempati oleh data sumber × 1,9Kompleksitas dan volume query serta penulisan data bervariasi berdasarkan skenario bisnis. Kami sarankan mengevaluasi kebutuhan kapasitas penyimpanan sebelum memilih sumber daya. Anda dapat melakukan tes untuk memastikan apakah sumber daya tersebut memadai. Berikut adalah beberapa rekomendasi umum:
- Pilih setidaknya dua node untuk mencegah titik kegagalan tunggal.
- Pilih node dengan spesifikasi tinggi, seperti 16 inti CPU dan 64 GB memori.
- Jika hasil tes menunjukkan bahwa sumber daya komputasi tidak memenuhi persyaratan bisnis, lakukan skalabilitas vertikal. Misalnya, tingkatkan spesifikasi node dari 4 inti CPU dan 16 GB memori menjadi 8 inti CPU dan 32 GB memori. Kemudian, tentukan apakah perlu melakukan ekspansi horizontal dengan menambah jumlah node.
Setiap indeks dibagi menjadi beberapa shard. Saat data ditulis, algoritma hash secara otomatis mengalokasikan data ke shard yang berbeda berdasarkan ID dokumen. Berikut adalah beberapa rekomendasi untuk mengonfigurasi jumlah shard:
- Ukuran satu shard berkisar antara 20 GB hingga 50 GB.
- Jumlah shard harus merupakan kelipatan bulat dari jumlah node. Misalnya, jika instans memiliki dua node, atur jumlah shard untuk indeks menjadi 2.
- Jika data bisnis Anda, seperti data log dan data pesanan, memiliki atribut waktu, gunakan fitur alias yang disediakan oleh sistem. Fitur ini terus menghasilkan indeks baru dan secara berkala menghapus indeks asli. Untuk informasi lebih lanjut tentang cara menggunakan alias, lihat Gunakan sharding (alias).