Tair (Redis OSS-compatible) mendukung alih primary/secondary secara manual. Alih manual secara aktif menukar peran node primary dan secondary. Berbeda dengan failover otomatis sistem, alih manual memungkinkan Anda mengontrol instans dalam skenario tanpa gangguan.
Skenario
Latihan pemulihan bencana: Anda dapat mensimulasikan kegagalan node selama jam sepi untuk memverifikasi kemampuan pemulihan bencana dan keandalan aplikasi saat terjadi alih database.
Optimalkan latensi akses: Jika aplikasi dan node primary berada di zona yang berbeda, Anda dapat melakukan alih primary/secondary sehingga node primary berpindah ke zona yang sama dengan aplikasi. Penerapan akses terdekat ini mengurangi latensi jaringan.
Contoh skenario
Pada contoh ini, instance ECS aplikasi berada di Zona B, sedangkan node primary instans Tair berada di Zona A. Instance ECS harus terhubung ke node primary melalui zona yang berbeda, sehingga meningkatkan latensi jaringan dan berpotensi memengaruhi kinerja instans serta operasi bisnis.

Untuk mengoptimalkan penerapan sumber daya cloud, Anda dapat melakukan alih primary/secondary untuk menukar peran node. Setelah alih, node di Zona B menjadi node primary. Perlu diperhatikan bahwa hanya peran node yang berubah; zona dan ID-nya tetap sama. Hal ini memungkinkan instance ECS dan instans database terhubung dalam zona yang sama, sehingga meminimalkan latensi jaringan.
Prasyarat
Instans menggunakan edisi High Availability.
Edisi Single Copy tidak mendukung alih primary/secondary.
Dampak alih
Node data tempat alih dilakukan akan terputus selama beberapa detik. Alih memiliki risiko potensial kehilangan data, misalnya ketidaksesuaian data antara node master dan replica akibat latensi sinkronisasi. Untuk mencegah risiko kehilangan data akibat alih dan doublewrite data yang disebabkan oleh cache Domain Name System (DNS), node data akan berada dalam status read-only hingga 30 detik.
Setelah instans memasuki status Switching, Anda tidak dapat mengelola instans tersebut, seperti mengubah konfigurasi atau memigrasikannya ke zona lain.
Tentang alih tanpa gangguan
Jika instans dan client Anda memenuhi persyaratan versi berikut, Anda dapat melakukan alih primary/secondary tanpa gangguan, sehingga menghindari dampak putus sementara dan status read-only terhadap bisnis Anda:
Versi instans: 7.0.2.9 atau lebih baru.
Versi client: Valkey-Java 5.3.0 atau lebih baru, atau Valkey-Go 1.0.67 atau lebih baru.
Prosedur
Masuk ke Konsol dan buka halaman Instances. Di bilah navigasi atas, pilih wilayah tempat instans yang ingin Anda kelola berada, lalu temukan instans tersebut dan klik ID instans.
Di panel navigasi sebelah kiri, klik Service Availability.
Di area Data Node, pilih shard data yang ingin dialihkan, lalu klik Failover.
CatatanJika instans menggunakan arsitektur kluster, Anda dapat melihat zona node primary dan secondary untuk setiap shard data di halaman ini.
Di panel yang muncul, pilih waktu efektif untuk alih.
Apply Immediately: Sistem akan segera melakukan alih primary/secondary.
Effective Within Maintenance Window: Sistem akan melakukan alih selama jendela pemeliharaan yang telah Anda tetapkan. Untuk informasi lebih lanjut tentang cara melihat dan mengubah jendela pemeliharaan, lihat Set a maintenance window.
CatatanJika Anda memilih Effective Within Maintenance Window, sistem segera memulai persiapan, seperti permintaan resource dan sinkronisasi data. Status instans berubah menjadi Switching, tetapi hal ini tidak memengaruhi layanan Anda. Alih peran node yang sebenarnya beserta dampak terkaitnya—seperti putus sementara dan status read-only—baru terjadi ketika Maintenance Window dimulai.
Klik OK.
Untuk keamanan, lengkapi otentikasi sekunder, seperti Multi-Factor Authentication (MFA), sesuai prompt. Setelah berhasil melewati otentikasi, Anda tidak perlu mengotentikasi ulang selama 15 menit.
Operasi API terkait
Operasi API | Deskripsi |
Secara manual melakukan alih primary/secondary. Berguna untuk latihan pemulihan bencana dan untuk mengaktifkan akses terdekat bagi aplikasi dalam penerapan multi-zona. |
Referensi
Topik ini menjelaskan cara melakukan alih primary/secondary secara manual. Sebagai komponen inti dari ketersediaan tinggi, Tair (Redis OSS-compatible) juga mendukung failover otomatis. Sistem terus memantau kesehatan node, dan jika node primary tidak tersedia, sistem secara otomatis memicu failover untuk mempromosikan node secondary menjadi node primary baru, sehingga menjamin ketersediaan layanan yang tinggi. Untuk informasi lebih lanjut, lihat High availability.