Anda dapat mengintegrasikan pusat cadangan dengan Managed Service for Prometheus dan memanfaatkan layanan ini untuk memantau status vault cadangan serta tugas secara real-time. Topik ini menjelaskan cara memantau pusat cadangan dan mengonfigurasi peringatan.
Prasyarat
Komponen layanan cadangan migrate-controller telah diinstal dengan versi v1.7.10 atau lebih baru. Untuk informasi lebih lanjut, lihat Instal migrate-controller dan Berikan Izin dan Kelola Komponen.
Versi terbaru migrate-controller tidak dapat diinstal pada kluster yang menjalankan Kubernetes versi lama dari 1.20. Untuk menggunakan fitur pemantauan pusat cadangan, perbarui versi Kubernetes kluster Anda terlebih dahulu. Untuk detail lebih lanjut, lihat Perbarui Kluster Secara Manual.
Managed Service for Prometheus harus diaktifkan untuk kluster.
Penagihan
Komponen migrate-controller mengirimkan data deret waktu ke Managed Service for Prometheus. Data ini dianggap sebagai data deret waktu kustom. Penggunaan data deret waktu kustom akan menimbulkan biaya tambahan.
Sebelum mengaktifkan fitur pemantauan pusat cadangan, kami merekomendasikan Anda membaca Data Deret Waktu untuk memahami aturan penagihan data deret waktu kustom. Biaya dapat bervariasi berdasarkan ukuran kluster dan jumlah aplikasi. Anda juga dapat melihat penggunaan sumber daya di Managed Service for Prometheus.
Antarmuka pusat cadangan dengan Managed Service for Prometheus
Anda dapat menggunakan Managed Service for Prometheus untuk memantau status vault cadangan yang terkait dengan kluster dan status tugas cadangan dalam kluster.
Masuk ke Konsol ARMS.
Di panel navigasi kiri, klik Integration Center. Pada tab Infrastructure, cari dan klik Ack Backup Center untuk menuju halaman integrasi.
Pada tab Start Integration, pilih kluster Container Service for Kubernetes (ACK) yang memiliki pusat cadangan terinstal dan klik OK.
Setelah integrasi selesai, Anda dapat masuk ke Konsol ACK atau Konsol ARMS untuk melihat dasbor.
Lihat dasbor pusat cadangan
Prosedur
Masuk ke Konsol ACK. Di panel navigasi kiri, klik Clusters.
Pada halaman Clusters, temukan kluster yang diinginkan dan klik namanya. Di panel kiri, pilih .
Pada halaman Prometheus Monitoring, klik tab Others dan lihat dasbor pusat cadangan di bawah tab ACK BackupCenter.
Untuk informasi lebih lanjut tentang cara melihat dasbor pusat cadangan di Konsol ARMS, lihat Lihat Dasbor.
Pengenalan Dasbor
Berikut adalah dasbor pusat cadangan yang didukung: Lokasi Cadangan (informasi vault cadangan), Status Operasi Cadangan (informasi tugas cadangan), dan Status Addon (informasi komponen kerja).
Lokasi Cadangan
Dasbor ini menampilkan informasi rinci (Backuplocation Detail) tentang vault cadangan yang terkait dengan kluster saat ini. 
Vault cadangan menyimpan file cadangan dan menampilkan hubungan antara pusat cadangan dan Bucket OSS. Pusat cadangan hanya dapat melakukan tugas cadangan, snapshot, dan pemulihan setelah vault cadangan memasuki status Tersedia. Tabel berikut menjelaskan metrik Backuplocation Detail.
Metric | Deskripsi |
Backuplocation | Nama vault cadangan. |
OSS Bucket | Nama Bucket OSS yang terkait dengan vault cadangan. |
Region | Wilayah Bucket OSS, seperti cn-hangzhou. |
NetworkPolicy | Jenis koneksi jaringan antara vault cadangan dan Bucket OSS. Nilai valid:
|
Phase | Status vault cadangan. Nilai valid:
|
Status Operasi Cadangan
Dasbor ini menampilkan status tugas cadangan, termasuk gambaran semua tugas cadangan (Backup Overview) dan detail tugas cadangan yang gagal (Failed Backup Detail).

Backup Overview: Menampilkan jumlah tugas cadangan yang dibuat di setiap vault cadangan dalam kluster saat ini melalui histogram. Tugas cadangan mencakup tugas cadangan instan dan tugas cadangan terjadwal. Sumbu X menampilkan nama vault cadangan dan sumbu Y menampilkan jumlah tugas cadangan di setiap vault cadangan. Tabel berikut menjelaskan metrik Backup Overview.
Metric
Deskripsi
Backup (Failed)
Bilah merah menampilkan jumlah tugas cadangan yang gagal.
Backup (Completed)
Bilah hijau menampilkan jumlah tugas cadangan yang berhasil.
Failed Backup Detail: Menampilkan informasi dasar tugas cadangan yang gagal dalam kluster saat ini. Tabel berikut menjelaskan metrik Failed Backup Detail.
Metric
Deskripsi
Backup
Nama tugas cadangan.
Backuplocation
Nama vault cadangan tempat tugas cadangan dimiliki.
BackupType
Mode cadangan dari tugas cadangan. Nilai valid:
AppBackup: membuat hanya cadangan aplikasi (cadangan YAML).
AppAndPvBackup: membuat cadangan aplikasi dan data. File YAML dan data yang disimpan dalam volume persisten (PV) dicadangkan.
DataType
Tipe cadangan data. Nilai valid:
snapshot: PV adalah volume disk.
hbr: PV adalah volume sistem file, termasuk volume lokal HostPath, volume NAS, dan volume OSS.
all: PV mencakup volume disk dan volume sistem file.
none: Cadangan data diaktifkan. Namun, tidak ada PV yang digunakan dalam namespace tertentu.
FromSchedule
Tipe tugas cadangan. Nilai valid:
Kosong: tugas cadangan instan.
Tidak kosong: tugas cadangan terjadwal. Nama rencana cadangan ditampilkan.
Status Addon
Dasbor ini menampilkan status komponen kerja csdr-controller dan csdr-velero. Pastikan komponen kerja berjalan normal agar pusat cadangan dapat menjalankan tugas cadangan, snapshot, dan pemulihan.
Setelah komponen pusat cadangan migrate-controller diinstal, ia menjalankan pra-pemeriksaan pada kluster. Setelah pra-pemeriksaan selesai, migrate-controller menerapkan komponen kerja csdr-controller dan csdr-velero di namespace csdr pusat cadangan.

Komponen kerja csdr-controller dan csdr-velero berjalan di Deployment pod. Tabel berikut menjelaskan metrik Status Addon.
Metric | Deskripsi |
Age | Waktu aktif komponen kerja. |
Status | Status komponen kerja. Nilai valid:
|
Pods | Informasi rinci pod komponen kerja. |
Memory Request | Jumlah sumber daya memori yang dipesan untuk komponen kerja. |
CPU Request | Jumlah sumber daya CPU yang dipesan untuk komponen kerja. |
Memory Limit | Batas atas memori komponen kerja. |
CPU Limit | Batas atas CPU komponen kerja. |
Konfigurasikan peringatan untuk kegagalan tugas cadangan
Peringatan untuk kegagalan tugas cadangan adalah peringatan acara. Sebuah CustomResourceDefinition (CRD) applicationbackups di grup sumber daya csdr.alibabacloud.com dibuat untuk setiap tugas cadangan. Saat tugas cadangan gagal, CRD menghasilkan acara WARN.
Kueri acara WARN yang dihasilkan untuk tugas cadangan yang gagal
Jalankan perintah berikut untuk mengkueri acara WARN yang dihasilkan untuk tugas cadangan yang gagal:
kubectl -n csdr get events --field-selector='type!=Normal'Keluaran yang Diharapkan:
VaultError: backup vault is unavailable: oss: service returned error: StatusCode=403, ErrorCode=AccessDenied, ErrorMessage="The bucket you access does not belong to you.", RequestId=668516BC35F915******VaultError menampilkan penyebab kegagalan.
Konfigurasikan aturan peringatan untuk menghasilkan acara WARN untuk kegagalan tugas cadangan
Gunakan fitur peringatan kluster ACK untuk mengonfigurasi aturan peringatan. Untuk informasi lebih lanjut, lihat Manajemen Peringatan.
Analisis data pemantauan abnormal
Troubleshoot masalah bahwa komponen kerja tidak ada atau dalam status abnormal (UnHealth)
Setelah pusat cadangan diinstal, komponen kerja tidak dapat ditemukan atau diterapkan berulang kali.
Jalankan perintah berikut untuk mengkueri status komponen migrate-controller:
kubectl -n kube-system get pod -l app=migrate-controllerJika komponen dalam status
CrashLoopBackOffatau terus-menerus me-restart, kluster gagal melewati pra-pemeriksaan. Biasanya, masalah ini terjadi karena kluster menggunakan FlexVolume atau kluster terdaftar tidak memiliki izin yang diperlukan. Untuk informasi lebih lanjut, lihat FAQ tentang Pusat Cadangan dan Kluster Terdaftar.Status UnHealth komponen kerja berlangsung lama. Dasbor pod tidak menampilkan data atau status abnormal.
Pod komponen kerja tidak dapat dimulai. Untuk informasi lebih lanjut, lihat Troubleshooting Pod.
Komponen kerja dalam status Health tetapi jumlah restart yang ditampilkan di dasbor pod bukan 0.
Penggunaan memori komponen csdr-velero mengalami lonjakan selama proses cadangan. Dalam skenario ini, kesalahan Out-of-Memory (OOM) mudah terjadi, yang menyebabkan komponen keluar secara tidak normal. Anda dapat meningkatkan penggunaan memori untuk menyelesaikan masalah ini.
CatatanJika pod komponen kerja keluar secara tidak normal selama proses cadangan, tugas cadangan akan gagal atau tetap dalam status InProgress untuk waktu yang lama.
Troubleshoot masalah bahwa vault cadangan dalam status abnormal (Unavailable)
Jalankan perintah berikut untuk melihat pesan kesalahan.
Ganti <unavailable-backuplocation-name> dengan nama vault cadangan dalam status abnormal.
kubectl -n csdr describe backuplocation <unavailabe-backuplocation-name>Untuk informasi lebih lanjut tentang troubleshooting pengecualian vault cadangan, lihat FAQ tentang Pusat Cadangan.
Troubleshoot kegagalan tugas cadangan
Gunakan CLI
Jalankan perintah berikut untuk melihat pesan kesalahan.
Ganti <failed-applicationbackup-name> dengan nama tugas cadangan yang gagal.
kubectl -ncsdr describe applicationbackup <failed-applicationbackup-name>Untuk informasi lebih lanjut tentang troubleshooting kegagalan tugas cadangan, lihat FAQ tentang Pusat Cadangan.
Gunakan konsol
Masuk ke Konsol ACK. Di panel navigasi kiri, klik Clusters.
Pada halaman Clusters, temukan kluster yang diinginkan dan klik namanya. Di panel kiri, pilih .
Pada halaman Application Backup, klik tab Backup Records, temukan tugas cadangan yang gagal, dan klik Failed di kolom Status untuk melihat pesan kesalahan.