PolarDB memberi tahu Anda mengenai event maintenance mendatang—seperti peningkatan perangkat lunak, maintenance perangkat keras, dan migrasi kluster—melalui SMS, panggilan suara, email, dan pesan di dalam konsol. Di halaman Scheduled Events, Anda dapat meninjau detail event dan mengambil tindakan: menjadwalkan ulang switchover, mengatur jendela maintenance berulang, atau membatalkan event.
Tingkat urgensi event
Event terjadwal dibagi menjadi dua tingkat urgensi:
[S0: Urgent] Risk fixing: Event tak terduga yang harus segera ditangani untuk mencegah kegagalan—misalnya, penggantian perangkat keras darurat, peningkatan versi bermasalah, perbaikan exception pada host, dan perpanjangan Sertifikat SSL sebelum kedaluwarsa. Notifikasi dapat dikirim tiga hari atau lebih sebelumnya, tetapi jendela penjadwalan ulang sangat singkat.
[S1: Scheduled] System maintenance: Masalah berisiko rendah atau peningkatan perangkat lunak dan perangkat keras yang direncanakan. Notifikasi dikirim lebih dari tiga hari sebelumnya, dan Anda dapat membatalkan event ini.
Konfigurasi notifikasi
PolarDB mengirimkan notifikasi 1–3 hari sebelum event, tergantung pada tingkat urgensi.
Untuk menerima notifikasi, konfigurasikan kontak di Message Center untuk ApsaraDB Fault or Maintenance Notifications. Tambahkan personel operasi dan maintenance (O&M) database sebagai kontak. Pilih Email sebagai metode notifikasi untuk keandalan pengiriman tertinggi. Internal Messages juga tersedia.

Gambar 1 Entri Pengaturan Pesan di konsol Message Center

Gambar 2 Pengaturan notifikasi untuk ApsaraDB Fault or Maintenance NotificationsMessage CenterMetode notifikasi mencakup Email dan Internal Messages. Kami merekomendasikan Anda memilih Email untuk meningkatkan tingkat keberhasilan notifikasi.
Untuk otomatisasi O&M berbasis event, berlangganan system event CloudMonitor. CloudMonitor mengirimkan notifikasi siklus hidup—langganan, mulai, selesai, dan pembatalan—untuk setiap event maintenance. Untuk petunjuk pengaturan, lihat Kelola kebijakan langganan event (direkomendasikan). Untuk informasi tentang system event CloudMonitor yang dapat Anda langgani, lihat bagian "Lampiran 1 System event terkait CloudMonitor" dalam topik ini.
Contoh muatan event CloudMonitor:
{
"eventId": "c864b30b-7f69-5f04-b0e7-8dfb0eabcfd9",
"product": "RDS",
"reason": "Host software/hardware upgrade",
"extra": {
"impactEn": "Transient instance disconnection",
"eventCode": "rds_apsaradb_transfer",
"eventNameEn": "Instance migration",
"switchTime": "2024-09-15T01:30:00+08:00",
"startTime": "2024-09-14T21:30:00+08:00",
"cancelCode": "OutOfGoodPerfBySoftHardwareUpgrade",
"detailCode": "HostSoftHardwareUpgrade",
"instanceInfo": ""
},
"instanceId": "rm-2ze9d66o65q1g02g6",
"eventType": "Maintenance",
"instanceComment": "rm-2ze9d66o65q1g02g6",
"instanceType": "Instance",
"publishTime": "2024-09-10T16:01:47+08:00"
}Bidang utama dalam muatan:
| Field | Description |
|---|---|
eventId | ID event. Event yang sama selalu memiliki ID yang sama. |
product | Kode layanan. |
reason | Penyebab event. |
impactEn | Dampak bisnis dari event. |
eventCode | Kode jenis event O&M. |
eventNameEn | Nama event O&M. |
switchTime | Waktu switchover terjadwal—saat koneksi transient terjadi jika switchover dilakukan. |
startTime | Waktu mulai terjadwal—saat event masuk ke antrean penjadwalan. |
cancelCode | Kode risiko pembatalan. |
detailCode | Kode penyebab detail. |
instanceId | ID instans. |
instanceComment | Alias instans. |
publishTime | Waktu penerbitan notifikasi event. |
Lihat event terjadwal
Masuk ke konsol PolarDB.
Di panel navigasi kiri, pilih Event Center (formerly known as Event Management) > Scheduled Events. Di bilah navigasi atas, pilih wilayah tempat kluster Anda berada.
Di halaman Scheduled Events, lihat detail event. Secara default, event dengan status Planned ditampilkan. Klik tab Completed atau Canceled untuk melihat event historis.
Attribute Example Description Event type Risk fixing Tingkat urgensi: risk fixing atau system maintenance. Status Pending Status penjadwalan. Lihat Status event di bawah. Event type Minor version update Jenis spesifik dari event maintenance. Untuk daftar lengkap, lihat Jenis dan dampak event. Cause - Penyebab event. Business impact Transient connections Bagaimana event memengaruhi workload Anda. Berbeda-beda tergantung jenis event. O&M suggestions Pastikan aplikasi Anda dikonfigurasi secara otomatis untuk menyambung ulang ke kluster Anda. Tindakan yang direkomendasikan sebelum atau selama event. Start time - Saat event masuk ke antrean penjadwalan. Kosong jika statusnya Waiting Setting Time. Sebelum waktu ini, kluster tidak terpengaruh. Setelah waktu ini, operasi tingkat kluster (seperti mengubah konfigurasi atau migrasi lintas zona) sementara tidak tersedia. Scheduled switchover time - Perkiraan waktu saat koneksi transient terjadi akibat switchover primary/secondary atau link. Dalam kasus ekstrem, hingga dua kali switchover dapat terjadi. Deadline - Waktu terakhir untuk mengonfigurasi waktu eksekusi. Waktu switchover yang Anda atur tidak boleh melewati deadline ini. Cancelable Yes Apakah Anda dapat membatalkan event ini. Tersedia untuk sebagian besar event O&M sistem. Schedule changeable Yes Apakah Anda dapat menjadwalkan ulang event ini. Tidak tersedia untuk event risk fixing mendesak dengan jendela waktu singkat.
Status event
Setiap status menunjukkan tindakan apa yang perlu Anda ambil:
| Status | What it means | What to do |
|---|---|---|
| Waiting Setting Time | Belum ada waktu eksekusi yang ditetapkan. Jika Anda tidak mengonfigurasi sebelum deadline, sistem akan secara otomatis membatalkan event. | Atur waktu switchover sebelum deadline. |
| Pending | Menunggu waktu mulai terjadwal. | Tidak perlu tindakan. |
| Executing | Event sedang berjalan. Intervensi manual tidak tersedia. | Ajukan tiket untuk menghentikan secara darurat. |
| Successful | Event berhasil diselesaikan. | Tidak perlu tindakan. |
| Canceled | Event dibatalkan atau gagal. Lihat Penyebab pembatalan di bawah. | Tinjau penyebab dan bertindak sesuai. |
Penyebab pembatalan
| Cause code | Description |
|---|---|
| UserCancel | Anda membatalkan event di konsol atau melalui pemanggilan API. |
| UserResponseTimeout | Event dibatalkan secara otomatis karena Anda tidak menetapkan waktu eksekusi sebelum deadline. |
| SupervisorCancel | Pihak yang menginisiasi event membatalkannya untuk keperluan manajemen database. |
| AvoidCancel | Risiko telah diatasi atau kluster tidak lagi memerlukan event ini—misalnya, kluster sudah menggunakan versi terbaru. |
| AutoCancel | Sistem membatalkan event karena kluster tidak memenuhi kondisi eksekusi saat pemeriksaan rutin—misalnya, status kluster abnormal. |
| ExecuteTimeout | Event masuk ke antrean eksekusi tetapi tidak selesai dalam waktu yang diharapkan. |
| ExecuteFail | Event gagal selama eksekusi karena exception yang tidak diketahui. |
Jadwalkan ulang event
Pilih event yang ingin Anda jadwalkan ulang dan klik Schedule Event. Pilih salah satu opsi berikut:
Immediate execution: Memulai event segera. Waktu saat ini digunakan sebagai waktu mulai, dan event langsung masuk ke antrean eksekusi.
Switchover at a specified time: Pilih waktu switchover dalam rentang yang diizinkan. Waktu mulai dihitung secara otomatis berdasarkan waktu switchover yang Anda pilih. Waktu mulai baru tidak boleh lebih awal dari waktu saat ini.
Kapan Anda tidak dapat menjadwalkan ulang event:
Penjadwalan ulang diblokir jika salah satu kondisi berikut berlaku:
Event berada dalam status Executing.
Waktu mulai event telah lewat.
Waktu saat ini melebihi deadline event.
Waktu mulai baru event lebih awal dari waktu saat ini.
Waktu switchover untuk event ini tidak dapat diubah.
Untuk mengatur waktu switchover melewati deadline (jika Anda menerima risiko terkait), ajukan tiket.
Atur jendela maintenance berulang
Jendela waktu berulang memungkinkan Anda menentukan jadwal preferensi untuk event maintenance mendatang. Saat event baru dibuat, sistem menggunakan jendela ini untuk menghitung waktu eksekusinya alih-alih mengambil dari jendela maintenance kluster Anda.
Perhatikan hal berikut: 1. Pengaturan ini hanya berlaku untuk event baru. Untuk mengubah waktu event yang sudah ada, gunakan Schedule Event. 2. Pengaturan ini hanya memengaruhi waktu eksekusi event tingkat system maintenance. Waktu eksekusi aktual yang ditampilkan di daftar event memiliki prioritas lebih tinggi. 3. Ini adalah pengaturan tingkat account-level dan berlaku untuk semua layanan database yang mendukung konfigurasi jendela waktu berulang.
Klik Recurring Time Window Settings di pojok kanan atas daftar event. Anda dapat mengatur jendela berdasarkan bulan atau minggu.
Contoh: Jika Anda mengatur jendela berulang menjadi 02:00–03:00 pada hari Senin dan Selasa, dan rentang waktu yang diizinkan untuk event baru mencakup Selasa ini hingga Minggu depan, slot switchover yang memenuhi syarat adalah Selasa 02:00–03:00 dan Senin depan 02:00–03:00. Sistem akan menjadwalkan switchover secara preferensial pada hari Selasa.
Untuk informasi tentang pengaturan jendela maintenance untuk kluster individual, lihat Set a maintenance window.
Jenis dan dampak event
| Event type | Trigger | Impact type | Impact description |
|---|---|---|---|
| Cluster migration | Kerentanan host, kedaluwarsa garansi perangkat keras, atau peningkatan OS. Sistem memigrasikan kluster ke server baru. Berlaku untuk kluster non-high-availability dan kluster read-only. | Transient cluster disconnection | Setelah waktu switchover tercapai: koneksi ke kluster atau node yang terpengaruh mungkin mengalami gangguan singkat, lalu kluster masuk ke status read-only hingga 30 detik selama sinkronisasi data. Selama periode ini, Data Management (DMS) dan Data Transmission Service (DTS) sementara tidak tersedia. Jadwalkan switchover selama jam sepi dan pastikan aplikasi Anda menyambung ulang secara otomatis. |
| Primary/secondary switchover | Kerentanan host, kedaluwarsa garansi perangkat keras, atau peningkatan OS. Sistem memindahkan workload dari node primary ke node read-only. Hanya berlaku untuk kluster high-availability. | Transient cluster disconnection | Sama seperti cluster migration. |
| Cluster parameter adjustment | Risiko parameter yang diketahui. Sistem memodifikasi parameter kluster. Jika parameter yang dimodifikasi memerlukan restart, kluster akan direstart. | Varies | Tergantung pada parameter yang dimodifikasi. |
| Host vulnerability fixing | Kerentanan terdeteksi pada host tempat kluster berjalan. | Transient cluster disconnection | Sama seperti cluster migration. |
| SSL certificate renewal | Sertifikat SSL akan segera kedaluwarsa. | Transient cluster disconnection | Sama seperti cluster migration. |
| Backup mode upgrade | Mode backup kluster dialihkan dari cadangan logis ke cadangan fisik. | Transient cluster disconnection | Sama seperti cluster migration. |
| Cross-zone migration | Peningkatan dan perbaikan infrastruktur fisik di wilayah dan zona tertentu. | Transient cluster disconnection | Sama seperti cluster migration. |
| Minor engine version update | Tersedia pembaruan versi minor untuk menyediakan fitur baru, memperbaiki isu yang diketahui, dan meningkatkan pengalaman pengguna. | Transient cluster disconnection | Sama seperti cluster migration. Untuk perbedaan antar versi, lihat Engine release notes dan Release notes. |
| Minor version update of PolarProxy | Tersedia pembaruan versi minor untuk PolarProxy guna menyediakan fitur baru, memperbaiki isu yang diketahui, dan meningkatkan pengalaman pengguna. | Transient cluster disconnection | Titik akhir kluster atau titik akhir kustom mungkin terputus hingga 10 detik selama pembaruan. Untuk perbedaan versi, lihat catatan rilis terkait. |
| Network upgrade | Peningkatan fasilitas jaringan untuk meningkatkan kinerja dan stabilitas jaringan. | Transient cluster disconnection atau perubahan alamat IP virtual | Gangguan transient yang sama seperti cluster migration. Beberapa peningkatan jaringan lintas zona mungkin mengubah alamat IP virtual kluster. Jika klien terhubung menggunakan alamat IP virtual, koneksi akan terputus. Untuk mencegah hal ini, gunakan titik akhir dalam format nama domain dan nonaktifkan Cache DNS pada aplikasi dan server Anda. |
| Storage gateway upgrade | Peningkatan gerbang penyimpanan untuk meningkatkan kinerja dan stabilitas penyimpanan. | I/O jitter | Jitter I/O sementara dan peningkatan latensi SQL mungkin terjadi, berlangsung tidak lebih dari 3 detik. |
| Enabling of transparent migration | Peningkatan pengalaman pengguna. | Parameter adjustment | Tidak terjadi restart atau migrasi dan workload Anda tidak terpengaruh. |
| PolarProxy migration | Host yang menjalankan PolarProxy ditingkatkan atau dirawat. | PolarProxy migration | Titik akhir kluster atau titik akhir kustom mungkin terputus hingga 10 detik. |
FAQ
Waktu mulai dan waktu switchover
Operasi event
Referensi API
| Operation | Description |
|---|---|
| DescribePendingMaintenanceActions | Menanyakan jumlah event terjadwal berdasarkan jenis tugas. |
| ModifyPendingMaintenanceAction | Memodifikasi waktu switchover event terjadwal. |
| DescribePendingMaintenanceAction | Menanyakan detail event terjadwal. |