全部产品
Search
文档中心

MaxCompute:Zone-disaster recovery

更新时间:Dec 05, 2025

Pemulihan bencana antar-zona MaxCompute membantu Anda mengatasi peristiwa seperti kegagalan jaringan carrier, pemadaman listrik pusat data, kegagalan fasilitas, dan kegagalan kluster. Dengan mengaktifkan disaster recovery penyimpanan multi-AZ dan ketersediaan tinggi (high availability) komputasi multi-AZ, Anda dapat mengurangi waktu henti layanan serta memenuhi persyaratan kelangsungan bisnis dan kepatuhan industri.

Pengenalan fungsi

Pemulihan bencana antar-zona MaxCompute memperluas ketersediaan layanan penyimpanan data dan komputasi dari satu Availability Zone (AZ) tunggal ke tiga AZ dalam wilayah yang sama. Fitur ini memanfaatkan isolasi fisik dan koneksi jaringan berlatensi rendah antara ketiga AZ tersebut untuk menyediakan sinkronisasi data secara real-time dan isolasi kesalahan lintas pusat data. Hal ini memastikan sistem bisnis Anda tidak terganggu oleh kegagalan pada satu pusat data, sehingga meningkatkan ketahanan bisnis Anda.

Pemulihan bencana antar-zona MaxCompute mencakup disaster recovery penyimpanan multi-AZ dan ketersediaan tinggi (HA) komputasi multi-AZ. Rinciannya sebagai berikut:

  • Penyimpanan multi-AZ: Fitur ini diaktifkan per proyek. Fitur ini mengonversi data historis dari penyimpanan lokal zona tunggal menjadi penyimpanan redundan tiga zona. Data inkremental ditulis secara sinkron ke ketiga zona tersebut. Jika terjadi kegagalan tingkat AZ, disaster recovery penyimpanan memastikan layanan baca-tulis data tidak terganggu. Hal ini menjamin tidak ada kehilangan data dan memenuhi tujuan titik pemulihan (Recovery Point Objective/RPO) sebesar 0. Penyimpanan multi-AZ mendukung semua data pengguna dalam suatu proyek, seperti metadata, izin pengguna, semua jenis tabel, materialized view, UDF, dan resource.

  • Ketersediaan tinggi komputasi multi-AZ: Anda dapat menyambungkan resource komputasi ketersediaan tinggi multi-AZ ke proyek yang telah mengaktifkan penyimpanan multi-AZ. Hal ini memberikan perlindungan pemulihan bencana antar-zona yang komprehensif untuk penyimpanan data maupun komputasi. Anda dapat memesan resource komputasi ketersediaan tinggi multi-AZ yang cukup di beberapa AZ. Jika terjadi kegagalan tingkat AZ, resource komputasi secara otomatis melakukan failover dari AZ yang gagal ke AZ yang sehat. Resource komputasi ketersediaan tinggi multi-AZ mendukung semua jenis pekerjaan, seperti SQL Task, MaxFrame, Cupid Task, dan MapReduce Task.

image

Panduan pemulihan bencana

Setelah Anda mengaktifkan pemulihan bencana antar-zona, operasi pemulihan berikut terjadi saat terjadi kegagalan tingkat AZ:

  1. Anda menerima notifikasi dari Alibaba Cloud MaxCompute mengenai kegagalan tersebut.

  2. Layanan segera mengalokasikan resource komputasi di AZ yang sehat. Sistem memeriksa integritas dan ketersediaan data seperti tabel, partisi, dan izin dalam proyek tersebut.

  3. Pekerjaan yang dikirim dari client mungkin gagal. Anda harus mengirim ulang pekerjaan yang gagal tersebut. Anda tidak perlu mengubah konfigurasi MaxCompute Anda, seperti Endpoint, informasi autentikasi, project_name, atau quota_name.

  4. Setelah pekerjaan dilanjutkan, terus pantau layanan lapisan atas Anda untuk memastikan bisnis kembali normal.

Kasus penggunaan

  • Industri keuangan

    Fitur ini memastikan layanan keuangan perbankan dapat terus menganalisis dan memproses data transaksi bisnis, serta membantu menghindari gangguan layanan akibat kegagalan pusat data.

  • Infrastruktur kritis

    Fitur ini melindungi sistem analitik data untuk sektor kelistrikan, air, dan transportasi. Fitur ini memastikan layanan informasi penting yang diandalkan publik tidak terganggu oleh kegagalan pusat data.

Nilai bagi pelanggan

  • Redundansi dan backup data.

  • Berkurangnya waktu henti layanan.

  • Kepatuhan terhadap regulasi industri.

  • Peningkatan pengalaman pelanggan untuk layanan lapisan atas.

Wilayah

Pemulihan bencana antar-zona didukung di wilayah-wilayah berikut: Tiongkok (Hangzhou), Tiongkok (Shanghai), Tiongkok (Beijing), Tiongkok (Shenzhen), Cloud Keuangan Tiongkok (Shanghai), Tiongkok (Hong Kong), Singapura, dan Indonesia (Jakarta).

Tagihan

Catatan penggunaan

Anda harus mengaktifkan disaster recovery penyimpanan multi-AZ dan HA komputasi multi-AZ untuk mencapai perlindungan pemulihan bencana antar-zona yang komprehensif untuk penyimpanan dan komputasi.

  • Selama persiapan disaster recovery penyimpanan, eksekusi pekerjaan tidak terpengaruh. Proses ini transparan bagi bisnis Anda.

  • Selama persiapan disaster recovery penyimpanan, jika data sedang dialirkan ke tabel partisi historis, tugas persiapan akan menunggu hingga operasi tulis dikomit. Anda sebaiknya secara berkala beralih ke partisi baru untuk penulisan data, misalnya harian atau mingguan. Hal ini memastikan semua tabel dan partisi menyelesaikan konversi ke penyimpanan multi-AZ.

  • Data backup lokal dan data TimeTravel yang dihasilkan sebelum Anda mengaktifkan disaster recovery penyimpanan tetap berada di penyimpanan lokal AZ asal.

  • Data backup lokal dan data TimeTravel yang dihasilkan setelah Anda mengaktifkan disaster recovery penyimpanan disimpan secara redundan di tiga AZ.

Aktifkan disaster recovery penyimpanan multi-AZ

  1. Masuk ke MaxCompute console dan pilih wilayah di pojok kiri atas.

  2. Di panel navigasi sebelah kiri, pilih Manage Configurations > Disaster Recovery.

  3. Di halaman Disaster Recovery, klik tab Zone-disaster Recovery.

  4. Klik Enable Zone-disaster Recovery. Di kotak dialog Enable Zone-disaster Recovery, pilih proyek di bawah Select Project, centang kotak konfirmasi, lalu klik OK.

  5. Setelah tugas dibuat, sistem mulai mempersiapkan data proyek untuk disaster recovery penyimpanan. Proses ini memigrasikan data dari satu AZ ke penyimpanan tiga AZ. Proses persiapan data membutuhkan waktu sekitar dua hari untuk selesai. Setelah proses selesai, proyek tersebut memiliki kemampuan disaster recovery penyimpanan.

Aktifkan ketersediaan tinggi komputasi multi-AZ (tersedia di wilayah tertentu)

Untuk mengaktifkan HA komputasi multi-AZ, beli resource komputasi ketersediaan tinggi multi-AZ dan atur kuota komputasi default proyek target ke resource komputasi ketersediaan tinggi multi-AZ tersebut. Fitur ini hanya tersedia di wilayah tertentu.

  1. Masuk ke MaxCompute console dan pilih wilayah di pojok kiri atas.

  2. Di panel navigasi sebelah kiri, pilih Manage Configurations > Quotas.

  3. Di halaman Quotas, klik New Quota.

  4. Di halaman pembelian resource, konfigurasikan parameter-parameter berikut.

    1. Specification Type: Pilih Multi-zone HA Computing Resource.

    2. Multi-zone HA CU: Pilih jumlah CU yang akan dibeli. Pembelian minimum adalah 50 CU. Anda dapat membeli tambahan CU dalam kelipatan 1.

  5. Klik Buy Now, lalu selesaikan pembayaran sesuai petunjuk untuk menyelesaikan pembelian.

    Di panel navigasi sebelah kiri, pilih Manage Configurations > Quotas.

    Anda dapat melihat Multi-zone HA Computing Resources yang telah dibuat.

  6. Atur Default Quota proyek target ke resource komputasi ketersediaan tinggi multi-AZ.

    1. Masuk ke MaxCompute console dan pilih wilayah di pojok kiri atas.

    2. Di panel navigasi sebelah kiri, pilih Manage Configurations > Projects.

    3. Di halaman Projects, temukan proyek target dan klik Manage di kolom Actions-nya.

    4. Di halaman Project Settings, klik tab Parameter Configuration.

    5. Di bagian Basic Information, klik Edit.

    6. Atur Default Quota ke resource komputasi ketersediaan tinggi multi-AZ, lalu klik Submit.

Pantau resource pemulihan bencana

Di halaman detail resource pemulihan bencana, Anda dapat melihat status keseluruhan pemulihan bencana proyek, informasi pemantauan AZ, dan detail data tabel.

  1. Masuk ke MaxCompute console dan pilih wilayah di pojok kiri atas.

  2. Di panel navigasi sebelah kiri, pilih Manage Configurations > Disaster Recovery.

  3. Di halaman Disaster Recovery, klik tab Zone-disaster Recovery.

  4. Di halaman Zone-disaster Recovery, klik nama proyek target yang telah diaktifkan fitur pemulihan bencananya untuk masuk ke halaman detail resource pemulihan bencana tingkat proyek.

    • Di bagian Basic Information, lihat status keseluruhan pemulihan bencana proyek saat ini. Informasi ini mencakup AZ, informasi pemulihan kontrol, status saat ini, waktu pembuatan pemulihan bencana, dan waktu failover terakhir.

      • Jika Current Status bernilai Preparing, data sedang dikonversi ke penyimpanan multi-AZ.

      • Jika Current Status bernilai Normal, data disimpan di beberapa AZ dan memiliki kemampuan disaster recovery penyimpanan tingkat AZ.

    • Zone Monitoring

      Bagian ini menampilkan informasi pemantauan untuk komputasi ketersediaan tinggi multi-AZ. Anda dapat melihat informasi AZ dari resource komputasi ketersediaan tinggi multi-AZ yang telah Anda beli dan sambungkan ke proyek.

      • AZ dengan status In Use menunjukkan bahwa pekerjaan Anda sedang berjalan di AZ tersebut.

      • AZ dengan status (Reserved) menunjukkan bahwa jika AZ tempat pekerjaan Anda berjalan mengalami kegagalan, resource komputasi akan melakukan failover ke AZ ini.

    • Table Data Details

      Anda dapat melakukan kueri tepat untuk tabel target berdasarkan nama skema dan nama tabel. Jika Anda tidak menentukan skema atau tabel, informasi semua tabel dalam proyek akan ditampilkan.

      Column

      Description

      Schema Name

      Skema dalam proyek.

      Table Name

      Nama tabel.

      Partitioned Table

      Menunjukkan apakah tabel tersebut merupakan tabel partisi.

      Last Data Update Time

      Waktu terakhir data dalam tabel diperbarui.

      Data Volume

      Volume data tabel tersebut.

      Data Distribution

      AZ tempat data tabel didistribusikan.

      • Jika status AZ adalah (Preparing), data sedang dikonversi ke penyimpanan multi-AZ.

      • Jika status AZ adalah (In Use), data disimpan secara redundan di beberapa AZ.

      Actions

      Jika tabel tersebut merupakan tabel partisi, klik View Partition Details untuk melihat Last Data Update Time, Data Volume, dan Data Distribution setiap partisi.

Latihan pemulihan bencana

MaxCompute menyediakan simulasi bencana dan latihan failover tingkat proyek. Prosedurnya sebagai berikut.

  1. Kirim tiket ke Alibaba Cloud untuk meminta latihan pemulihan bencana. Dalam tiket tersebut, cantumkan wilayah, nama proyek, nama kuota, dan jendela waktu latihan. Anda sebaiknya melakukan latihan ini selama jam sepi.

  2. Setelah Alibaba Cloud menyetujui tiket Anda, tombol Failover akan tersedia di halaman Disaster Recovery Resource Details tingkat proyek di Konsol MaxCompute. Anda dapat mengikuti petunjuk untuk mengalihkan AZ tempat resource komputasi Anda berjalan. Ini mensimulasikan failover. Setelah failover, pekerjaan yang baru dikirim akan langsung dieksekusi. Anda harus mengulang secara manual pekerjaan apa pun yang gagal selama pergantian AZ.

Penting

Operasi di atas hanya berlaku untuk skenario latihan. Dalam bencana AZ-level yang sebenarnya, sistem secara otomatis melakukan failover resource komputasi.

Nonaktifkan pemulihan bencana

  1. Di panel navigasi sebelah kiri, pilih Manage Configurations > Disaster Recovery.

  2. Di halaman Disaster Recovery, klik tab Zone-disaster Recovery.

  3. Di tab Zone-disaster Recovery, klik Disable Disaster Recovery di kolom Actions untuk proyek target.

  4. Di kotak dialog Disable Zone-disaster Recovery, centang kotak konfirmasi, lalu klik OK.

Penting
  • Menonaktifkan pemulihan bencana merupakan operasi yang penting. Setelah Anda menonaktifkannya, proyek tersebut langsung kehilangan kemampuan pemulihan bencananya. Evaluasi dampaknya secara cermat.

  • Setelah Anda menonaktifkan pemulihan bencana, data proyek akan didistribusikan ulang ke penyimpanan lokal satu AZ.