全部产品
Search
文档中心

PolarDB:Automatic failover and manual failover

更新时间:Jul 06, 2025

Kluster PolarDB dapat secara otomatis memindahkan layanan dari node utama ke node baca-saja saat terjadi kegagalan sistem. Anda juga dapat melakukan failover manual dengan menentukan node baca-saja sebagai node utama baru.

Tindakan pencegahan

Selama failover otomatis atau manual, layanan database mungkin terganggu selama sekitar 20 hingga 30 detik jika hot standby dinonaktifkan untuk node baca-saja. Dalam hal ini, koneksi Anda ke database mungkin terputus. Pastikan aplikasi Anda dapat tersambung kembali secara otomatis ke kluster. Jika hot standby diaktifkan untuk node baca-saja, failover dapat diselesaikan dalam waktu 5 hingga 10 detik. Untuk informasi tentang cara mengaktifkan hot standby untuk node baca-saja, lihat Konfigurasi Node Replika Panas.

Penting

Dalam kasus ekstrem tertentu, waktu interupsi database selama failover mungkin bertambah tetapi tidak melebihi 3 menit.

Failover otomatis

Kluster PolarDB Edisi Kluster menggunakan arsitektur kluster dengan ketersediaan tinggi aktif-aktif. Ketika node utama gagal, sistem secara otomatis memilih node utama baru dari node baca-saja dan memindahkan layanan dari node utama lama ke node utama baru.

Prioritas failover ditetapkan untuk setiap node dalam kluster. Prioritas ini menentukan node mana yang dapat dipilih sebagai node utama selama failover. Jika beberapa node memiliki prioritas yang sama, mereka memiliki probabilitas yang sama untuk dipilih sebagai node utama.

Sistem melakukan langkah-langkah berikut untuk memilih node utama:

  1. Temukan semua node baca-saja yang tersedia yang dapat dipilih sebagai node utama.

  2. Pilih node baca-saja dengan prioritas failover tertinggi.

  3. Jika failover ke node baca-saja pertama gagal karena masalah jaringan, status replikasi abnormal, atau alasan lainnya, sistem mencoba memindahkan layanan ke node baca-saja berikutnya hingga failover berhasil.

Anda dapat melihat dan mengonfigurasi prioritas failover setiap node dalam kluster di bagian Basic Information pada halaman Database Nodes kluster.

优先级

Catatan
  • Jika hot standby dinonaktifkan untuk node baca-saja yang dipilih sebagai node utama baru, layanan database mungkin terganggu selama sekitar 20 hingga 30 detik selama failover. Dalam hal ini, koneksi Anda ke database mungkin terputus. Pastikan aplikasi Anda dapat tersambung kembali secara otomatis ke kluster.

  • Jika hot standby diaktifkan untuk node baca-saja yang dipilih sebagai node utama baru, failover dapat diselesaikan dalam waktu 5 hingga 10 detik.

  • Dalam kasus ekstrem tertentu, waktu interupsi database selama failover mungkin bertambah tetapi tidak melebihi 3 menit.

Failover manual

Anda juga dapat melakukan failover manual dengan menentukan node baca-saja sebagai node utama baru. Failover manual cocok untuk skenario di mana Anda perlu menguji ketersediaan tinggi kluster atau menentukan node baca-saja tertentu sebagai node utama kluster.

  1. Di sudut kiri atas, pilih wilayah tempat kluster diterapkan.

  2. Temukan kluster dan klik ID-nya.

  3. Di bagian Database Nodes pada halaman Basic Information, klik ikon 切换 di sudut kanan atas bagian tersebut untuk beralih tampilan.

  4. Klik Fail Over.

    主备切换

  5. Di kotak dialog yang muncul, konfigurasikan parameter New Primary Node dan klik OK.

    Catatan
    • Jika hot standby dinonaktifkan untuk node baca-saja yang ditentukan sebagai node utama baru, layanan database mungkin terganggu selama sekitar 20 hingga 30 detik selama failover. Dalam hal ini, koneksi Anda ke database mungkin terputus. Pastikan aplikasi Anda dapat tersambung kembali secara otomatis ke kluster.

    • Jika hot standby diaktifkan untuk node baca-saja yang ditentukan sebagai node utama baru, failover dapat diselesaikan dalam waktu 5 hingga 10 detik.

    • Dalam kasus ekstrem tertentu, waktu interupsi database selama failover mungkin bertambah tetapi tidak melebihi 3 menit.

FAQ

  • Status kluster saya tidak kembali ke Berjalan 10 menit setelah failover selesai. Apa penyebab yang mungkin? Bagaimana cara menangani masalah ini?

  • Jika koneksi persisten dibuat antara aplikasi Anda dan kluster, aplikasi Anda mungkin gagal mendeteksi status koneksi yang berubah ketika anomali memicu failover. Jika tidak ada periode timeout soket yang ditentukan, aplikasi Anda menunggu database mengembalikan hasilnya. Dalam banyak kasus, aplikasi Anda terputus setelah ratusan detik. Selama periode ini, beberapa koneksi ke database tidak normal, dan sejumlah besar pernyataan SQL gagal dieksekusi.

    Untuk menghindari koneksi yang tidak valid, kami sarankan Anda menentukan parameter connectTimeout dan socketTimeout untuk mencegah aplikasi Anda menunggu terlalu lama karena kesalahan jaringan. Ini mengurangi jumlah waktu yang diperlukan untuk pulih dari kegagalan.

    Anda harus menentukan parameter ini berdasarkan beban kerja dan mode penggunaan Anda. Nilai yang direkomendasikan untuk skenario transaksi online:

    • connectTimeout: Kami sarankan Anda mengatur parameter ini menjadi 1 hingga 2 detik.

    • socketTimeout: Untuk lingkungan jaringan internal, kami sarankan Anda mengatur parameter ini menjadi 10 hingga 15 detik. Untuk lingkungan jaringan publik, kami sarankan Anda mengatur parameter ini menjadi 60 hingga 90 detik.

    Catatan

    Nilai-nilai di atas hanya untuk referensi.

Operasi API terkait

Operasi

Deskripsi

FailoverDBCluster

Menjalankan failover manual dalam kluster PolarDB dengan menentukan node baca-saja sebagai node utama baru.