Jika sebuah kluster Elasticsearch (ES) mengalami pemanfaatan CPU, memori, atau disk yang terus-menerus tinggi, atau jika kinerja query dan penulisan tidak dapat memenuhi kebutuhan bisnis, Anda dapat meningkatkan konfigurasi kluster. Peningkatan ini memungkinkan Anda memulihkan stabilitas layanan dengan menambah jumlah node, meningkatkan spesifikasi node, menambah ruang disk, atau menambah jenis node baru.
Sebelum melakukan peningkatan
Operasi peningkatan dapat menyebabkan latensi layanan, konflik konfigurasi, dan perubahan penagihan. Bacalah hal berikut dengan cermat sebelum melanjutkan.
Stabilitas Layanan
Aturan stabilitas layanan selama perubahan kluster:
Kluster
Status Layanan
Aksi
Beban Normal + Replika Ada
Beban normal: CPU ≤ 60%, heap memory ≤ 50%, load < jumlah core
Layanan berlanjut. Kinerja mungkin sedikit menurun.
Tidak diperlukan tindakan tambahan.
Beban Tinggi + Tidak Ada Replika
Beban tinggi: Konkurensi tinggi untuk penulisan atau query selama peningkatan, CPU > 60%, heap memory > 50%
Timeout akses sesekali
Aktifkan mekanisme ulang pada klien.
Tingkatkan jumlah replika indeks sebelum peningkatan.
Beban Tinggi + Status Abnormal
Timeout akses sesekali atau jitter
Perbaiki status kluster sebelum mengubah konfigurasi.
Jendela Operasi: Lakukan operasi selama jam-jam sepi.
Perencanaan Kapasitas
Evaluasi kapasitas kluster yang diperlukan.
Kendala Konfigurasi
Peningkatan tidak mendukung perubahan versi.
Operasi peningkatan hanya dapat mengubah satu jenis node pada satu waktu.
Dampak Biaya
Setelah Anda mengirimkan pesanan peningkatan, sistem akan menagih Anda berdasarkan konfigurasi baru. Untuk informasi lebih lanjut tentang aturan penagihan, lihat Bayar sesuai penggunaan dan Langganan.
Pemeriksaan Pra-Peningkatan
Memutakhirkan kluster tanpa menyelesaikan pemeriksaan berikut dapat menyebabkan kerusakan kluster, kehilangan data, atau layanan tidak tersedia. Pastikan untuk memeriksa dan memverifikasi setiap item.
Kesehatan Kluster
Jalankan
GET _cluster/healthuntuk memastikan status kluster adalah HIJAU. Jika statusnya bukan HIJAU, lihat Kesalahan Perubahan Kluster: Status Kluster Tidak Sehat.Keamanan Beban
Jalankan
GET _cat/nodes?v. Utilisasi CPU yang direkomendasikan adalah 60% atau kurang. Jika melebihi nilai ini, aktifkan mekanisme ulang pada klien dan tambahkan jumlah replika indeks.Kesiapan Indeks
Periksa indeks dalam keadaan TUTUP dengan menjalankan
GET /_cat/indices?v. Jika ada, buka sementara dengan menjalankanPOST /<index_name>/_open. Jika tidak, perubahan konfigurasi mungkin gagal karena alasan berikut:Jika indeks dalam keadaan TUTUP, status kluster tidak dapat menjadi HIJAU. ES memerlukan status kluster menjadi HIJAU sebelum melakukan perubahan konfigurasi sensitif tertentu, seperti menyesuaikan aturan alokasi shard.
Selama perubahan konfigurasi, kluster mengalokasikan ulang shard. Perhatikan hal berikut:
Shard dari indeks yang ditutup tidak dapat dialokasikan ulang.
Hal ini menyebabkan operasi yang bergantung pada status HIJAU gagal.
Ini mencegah status kluster mencapai HIJAU. Status tertinggi yang bisa dicapai adalah KUNING.
Jalankan
GET _cat/indices?vuntuk memeriksa apakah jumlah replika untuk setiap indeks minimal 1.Untuk instans multi-zona, pastikan jumlah replika untuk setiap indeks dalam kluster lebih kecil dari jumlah zona selama peningkatan. Sebagai contoh, Anda dapat menetapkan jumlah replika menjadi 1. Setelah peningkatan selesai, Anda harus secara manual menambah jumlah replika.
Keseimbangan Shard
Jalankan
GET _cat/shards?vuntuk memeriksa adanya shard yang tidak seimbang.PentingMemeriksa distribusi shard yang seimbang sebelum peningkatan adalah langkah kunci untuk mencegah penurunan performa atau crash kluster selama atau setelah proses.
prirep: Periksa apakah ada shard replika (r) yangTIDAK DITETAPKAN.state: Periksa apakah ada shard yang terjebak dalam keadaanRELOCATINGuntuk waktu lama.
Masalah ini mencegah node baru menerima shard dengan benar. Hal ini menyebabkan status kluster tetap KUNING atau MERAH setelah peningkatan. Jika masalah ini ada, lihat Solusi untuk beban kluster yang tidak merata untuk menyelesaikannya.
Metode 1: Upgrade di konsol
Di halaman Instans, klik Upgrade.
Atau, di halaman Informasi Dasar, pilih .
Di halaman Upgrade/Downgrade, sesuaikan parameter konfigurasi sesuai kebutuhan.
PentingParameter konfigurasi yang tersedia bervariasi berdasarkan tipe kluster dan versi. Parameter aktual ditampilkan di halaman Upgrade/Downgrade.
Aturan berikut berlaku saat Anda mengubah jumlah zona: Jika inventaris untuk tipe instans tertentu tidak mencukupi di suatu zona, Anda harus memigrasikan node di zona tersebut sebelum melakukan upgrade.
Penambahan: Anda dapat menambah jumlah zona dari satu menjadi dua atau tiga.
Anda dapat meningkatkan spesifikasi node (kelas penyimpanan). Opsi berikut diurutkan berdasarkan performa dari terendah hingga tertinggi:
Disk generasi sebelumnya: disk dasar, disk ultra, dan SSD standar.
CatatanDisk ini sedang dihapus secara bertahap di beberapa wilayah dan zona. Saat memilih tipe disk, kami sarankan Anda memilih SSD perusahaan (ESSD).
ESSD: ESSD menggabungkan jaringan Ethernet 25 Gigabit (GbE) dan teknologi Remote Direct Memory Access (RDMA). Mereka menyediakan hingga 1 juta operasi I/O acak baca/tulis per detik (IOPS) per disk dan latensi rendah pada satu tautan.
Disk lokal.
CatatanDisk lokal adalah perangkat hard disk lokal pada server fisik tempat Instance ECS berada. Disk ini menyediakan akses penyimpanan lokal untuk Instance ECS. Disk lokal cocok untuk skenario yang memerlukan performa I/O penyimpanan tinggi dan penyimpanan massal yang hemat biaya.
Perubahan Cerdas (diaktifkan secara default): Sistem secara otomatis memilih metode perubahan optimal berdasarkan item konfigurasi. Anda dapat menonaktifkan fitur ini secara manual untuk menentukan metode perubahan:
Metode perubahan
Prinsip
Waktu yang diperlukan
Dampak layanan dan skenario
Perubahan biru-hijau
Tambahkan node baru → Salin data → Alihkan dengan mulus
Lebih lama
Alamat IP node berubah. Performa kluster mungkin berfluktuasi sementara.
Cocok untuk skenario yang tidak sensitif terhadap durasi perubahan tetapi memerlukan ketersediaan kluster tinggi.
Perubahan langsung
Lakukan pembaruan bergulir pada node (tidak diperlukan penyalinan data).
Lebih singkat
Alamat IP node tidak berubah. Performa kluster mungkin berfluktuasi sementara.
Cocok untuk skenario di mana kluster memiliki hambatan performa dan perubahan cepat diinginkan.
PentingJika utilisasi sumber daya tinggi (misalnya, CPU > 60%), gunakan perubahan langsung dengan hati-hati.
Perubahan Paksa: Melewati pemeriksaan kesehatan tetapi memicu restart paksa kluster. Ini dapat menyebabkan gangguan layanan yang berkepanjangan. Waktu pemulihan tergantung pada volume data. Gunakan metode ini hanya untuk skala keluar darurat ketika kluster sudah tidak tersedia.
Tinjau dan setujui Terms Of Service dan Service Level Agreement, lalu klik Buy Now. Sistem akan menagih Anda berdasarkan metode penagihan.
Selama proses upgrade, status kluster berubah menjadi Aktif. Performa kluster mungkin berfluktuasi sementara, dan koneksi transien dapat terjadi. Setelah upgrade selesai, status kluster berubah menjadi Normal.
Metode 2: Peningkatan dengan memanggil API
Untuk informasi tentang cara melakukan peningkatan kluster dengan memanggil API, lihat UpdateInstance.
Memantau kemajuan dan memverifikasi setelah peningkatan
Setelah peningkatan dimulai, Anda dapat melihat kemajuannya di konsol di bawah Instances > Instans Basic Information.
Klik Show Details:
Setelah peningkatan selesai, konfirmasikan bahwa konfigurasi baru telah diterapkan. Di halaman Informasi Dasar kluster, periksa item berikut:
Status kluster adalah Normal.
Zona
Jumlah node dan spesifikasi penyimpanan: Pastikan node baru telah bergabung dengan kluster dan spesifikasi penyimpanan sudah benar.
Keseimbangan shard: Jalankan
GET _cat/allocation?vuntuk memeriksa distribusi shard. Jika shard tidak seimbang, lihat Solusi untuk beban kluster yang tidak merata untuk menyelesaikan masalah tersebut.
FAQ
Apakah Alibaba Cloud ES mendukung peningkatan atau penurunan versi?
Setelah saya mengubah jumlah node, apakah kluster secara otomatis menyeimbangkan ulang shard?
Apa yang harus saya lakukan jika saya memilih konfigurasi yang salah saat membeli instans ES?
Setelah meningkatkan tipe instans, bisakah saya menurunkannya? Bagaimana caranya?
Apa yang harus saya lakukan jika terjadi kesalahan atau timeout saat meningkatkan kluster?
Akankah mengubah tipe disk pada instans ES menyebabkan kehilangan data?
Bisakah saya langsung meningkatkan CPU untuk instans ES untuk menghindari migrasi data?