Sistem pemulihan bencana diterapkan di dua Wilayah Alibaba Cloud. Jika situs produksi mengalami kegagalan—misalnya akibat tsunami atau gempa bumi—sistem bisnis akan beralih ke situs pemulihan bencana. Karena situs produksi dan situs pemulihan bencana berada di Wilayah yang berbeda, solusi ini menyediakan Disaster Recovery as a Service dengan recovery point objective (RPO) serendah 1 menit dan recovery time objective (RTO) serendah 15 menit, sehingga menjamin kelangsungan bisnis yang sangat andal serta mencegah secara efektif kegagalan sistem akibat bencana regional.
Persiapan
Sebelum menerapkan pemulihan bencana lintas wilayah, pilih Wilayah selain lingkungan produksi Anda sebagai Wilayah tujuan untuk pemulihan bencana. Di Wilayah tersebut, buat virtual private cloud (VPC), lalu buat vSwitch replikasi dan vSwitch pemulihan.
Langkah 1: Buat pasangan situs pemulihan bencana
Setelah menyelesaikan persiapan, lindungi instans ECS sumber Anda dengan pemulihan bencana lintas wilayah sebagai berikut:
Masuk ke Cloud Backup console.
Pilih , lalu klik Switch to Continuous Replication-based Disaster Recovery di pojok kiri atas halaman.
Klik Add, pilih Cross-region disaster recovery sebagai tipe, lalu masukkan informasi Production site information dan Disaster recovery site information.
Klik penciptaan.
Langkah 2: Tambahkan server yang dilindungi
Setelah membuat pasangan situs pemulihan bencana, tambahkan server yang dilindungi sebagai berikut:
Klik tab Protected Servers dan konfirmasi informasi pasangan situs pemulihan bencana di pojok kanan atas.
Klik Add di sebelah Protected Servers, lalu pilih instans ECS yang ingin Anda lindungi.
Klik Confirmation untuk menyelesaikan penambahan. Status server awalnya akan menampilkan "Installing client", lalu berubah menjadi "Initialized".
CatatanJika status server tidak menunjukkan Initialized, klik untuk menyelesaikan inisialisasi client.
Langkah 3: Mulai replikasi
Mulai replikasi pemulihan bencana untuk menyalin server Anda ke cloud dan mempertahankan replikasi real-time. Ikuti langkah-langkah berikut:
Klik tab Protected Servers. Pada kolom Actions untuk server yang ingin direplikasi, pilih .
Pada panel Start Replication, konfigurasikan parameter berikut, lalu klik Start.
Parameter
Deskripsi
Recovery Point Policy
Pilih interval waktu dari daftar drop-down. Cloud Backup membuat titik pemulihan pada interval ini setiap hari. Satuannya adalah jam.
Disk Type
Tipe yang didukung meliputi ultra disk, ESSD, dan SSD.
Copy Network
Pilih jaringan replikasi dari daftar drop-down. Cloud Backup menggunakan jaringan ini untuk mereplikasi data pemulihan bencana ke cloud.
Secara default, Cloud Backup membaca vSwitch yang tersedia dari VPC situs secondary. Jaringan replikasi dan pemulihan dapat menggunakan vSwitch yang sama. Menggunakan jaringan yang sama mempercepat pemulihan. Jika jaringan replikasi dan pemulihan berada di zona yang berbeda, RTO meningkat. Kami menyarankan mengonfigurasi zona yang sama dengan Recovery Network.
Restore Network
Pilih jaringan pemulihan dari daftar drop-down. Selama pemulihan bencana (seperti latihan atau failover), Cloud Backup menggunakan jaringan ini untuk memulihkan data—misalnya, untuk membuat instans ECS yang dipulihkan.
Secara default, Cloud Backup membaca vSwitch yang tersedia dari VPC situs secondary. Jaringan replikasi dan pemulihan dapat menggunakan vSwitch yang sama. Menggunakan jaringan yang sama mempercepat pemulihan. Jika jaringan replikasi dan pemulihan berada di zona yang berbeda, RTO meningkat. Kami menyarankan mengonfigurasi zona yang sama dengan Replication Network.
Automatically Restart After Replication Interruption
Menentukan apakah replikasi akan dimulai ulang secara otomatis setelah terputus. Pilih opsi ini untuk memulai ulang tugas replikasi jika berhenti.
Replikasi pemulihan bencana kemudian berlangsung dalam tiga tahap: Starting Replication, Full Replication, dan Real-time Replication.
Starting Replication: Layanan pemulihan bencana ECS memindai data sistem dan memperkirakan total volume data. Tahap ini biasanya memakan waktu beberapa menit.
Full Replication: Layanan pemulihan bencana ECS mentransfer semua data valid dari seluruh server ke Alibaba Cloud. Durasi tergantung pada volume data dan lebar pita jaringan. Bilah progres di konsol menampilkan perkembangan replikasi.
Real-time Replication: Setelah replikasi penuh selesai, Alibaba Cloud menyimpan salinan lengkap data Anda. Kemudian, Alibaba Cloud Replication Service (AReS) memantau semua operasi penulisan disk pada server dan terus-menerus mereplikasinya ke Alibaba Cloud secara real-time.
(Opsional) Latihan pemulihan bencana
Setelah replikasi real-time dimulai, Anda dapat melakukan latihan pemulihan bencana pada server Anda.
Latihan pemulihan bencana menjalankan server yang dilindungi di cloud dan memvalidasi kebenaran aplikasi. Ini merupakan bagian penting dari proses pemulihan bencana karena:
Memverifikasi bahwa aplikasi yang dilindungi dapat dijalankan secara normal di cloud.
Memastikan operator terbiasa dengan proses pemulihan sehingga dapat melakukan alih bencana dengan lancar jika situs primary mengalami kegagalan.
Lakukan latihan pemulihan bencana sebagai berikut:
Pada tab Protected Servers, klik Disaster Recovery Drill di kolom Actions untuk server yang ingin diuji.
Pada panel Disaster Recovery Drill, pilih Recovery Network, IP Address, apakah akan Use ECS Instance Type, Disk Type, Recovery Point, Elastic IP Address, dan Post-switch Script. Lalu klik Start.
CatatanCloud Backup secara otomatis menyimpan 24 titik pemulihan dari 24 jam terakhir untuk setiap server.
Jika Anda tidak menggunakan tipe instans ECS, Anda juga harus menentukan CPU dan memori.
Alibaba Cloud kemudian menjalankan server di latar belakang berdasarkan titik waktu yang Anda pilih. Replikasi data real-time tetap berjalan tanpa terganggu selama latihan.
Setelah beberapa menit, latihan selesai. Klik tautan di bawah Drill Information untuk memverifikasi data dan aplikasi.
Purge lingkungan latihan.
Setelah verifikasi, klik Purge Drill Environment di kolom Actions untuk server tersebut. Ini akan menghapus instans ECS yang dipulihkan.
CatatanSetelah memverifikasi instans ECS yang dibuat selama latihan, segera purge lingkungan latihan untuk mengurangi biaya.
Langkah 4: Failover
Latihan pemulihan bencana rutin memastikan bisnis Anda dapat dijalankan di cloud kapan saja. Jika situs primary mengalami kegagalan besar dan Anda perlu segera menjalankan ulang layanan inti di cloud, lakukan failover.
Gunakan failover hanya ketika server yang dilindungi mengalami kegagalan kritis. Operasi ini menghentikan replikasi real-time. Anda harus memulai ulang replikasi dan melakukan replikasi penuh untuk melanjutkan perlindungan pemulihan bencana.
Lakukan failover sebagai berikut:
Pada tab Protected Servers, di kolom Actions untuk server tersebut, pilih .
Pada panel Failover, pilih Recovery Network, IP Address, apakah akan Use ECS Instance Type, Disk Type, Recovery Point, Elastic IP Address, dan Post-switch Script. Lalu klik Start.
PentingAnda hanya dapat menggunakan titik pemulihan Current Time satu kali.
Setelah failover selesai, klik tautan di bawah Failover/Failback Information untuk memeriksa data dan aplikasi.
Jika aplikasi berjalan dengan benar pada titik waktu saat ini, pilih .
CatatanSetelah menyelesaikan failover atau mengganti titik pemulihan—dan memastikan aplikasi yang dipulihkan telah mengambil alih bisnis—melakukan Confirm Failover akan membersihkan sumber daya pemulihan bencana di cloud untuk menghemat biaya.
Jika kondisi aplikasi tidak memuaskan—misalnya karena masalah konsistensi database atau data sumber yang rusak telah disinkronkan ke wilayah lain—sebelum mengonfirmasi failover, pilih .
CatatanMengganti titik pemulihan bekerja seperti failover—Anda hanya perlu memilih titik pemulihan yang lebih awal.
Langkah 5: Replikasi balik
Setelah mereplikasi server yang dilindungi dari satu Wilayah—misalnya Wilayah A—ke Wilayah lain—misalnya Wilayah B—Anda dapat melakukan replikasi balik dari Wilayah B kembali ke Wilayah A.
Lakukan replikasi balik sebagai berikut:
Pada tab Protected Servers, di kolom Actions untuk server tersebut, pilih , lalu konfirmasi pendaftaran balik server yang dilindungi.
Di kolom Actions, pilih .
Pada panel Start Reverse Replication, pilih apakah akan mengaktifkan Original Machine Recovery, lalu pilih Replication Network dan Recovery Network. Lalu klik Start.
PeringatanPemulihan bencana cross-region dan cross-zone mendukung Original Machine Recovery. Saat diaktifkan, data pada host ECS target akan di-purge. Gunakan opsi ini dengan hati-hati.
Ketika server memasuki replikasi balik real-time, di kolom Actions, pilih .
Pada panel Failback, masukkan informasi CPU dan Memory, pilih Recovery Network dan IP Address, lalu edit Post-recovery Script.
Setelah failback selesai, di kolom Actions, pilih untuk mendaftarkan ulang server yang dilindungi.