PolarDB は、ソフトウェアアップグレード、ハードウェアメンテナンス、クラスターマイグレーションなどの今後の保守作業を SMS、音声通知、電子メール、およびコンソール内メッセージで通知します。[スケジュール済みイベント] ページでは、イベントの詳細を確認し、スイッチオーバーの再スケジュール、定期的な保守ウィンドウの設定、またはイベントのキャンセルといった操作が可能です。
イベントの緊急度レベル
スケジュール済みイベントは、以下の 2 つの緊急度レベルに分類されます。
[S0:緊急] リスク対応:障害を未然に防止するため、迅速な対応が必要な予期せぬイベントです。例として、緊急のハードウェア交換、不具合のあるバージョンへのアップグレード、ホスト異常の修正、有効期限切れ前の SSL 証明書の更新などがあります。通知は通常、3 日以上前に行われますが、再スケジュール可能な期間は短くなります。
[S1:スケジュール済み] システム保守:リスクが低く、事前に計画されたソフトウェアおよびハードウェアのアップグレードです。通知は 3 日以上前に送信され、これらのイベントはキャンセル可能です。
通知の設定
PolarDB は、イベントの緊急度に応じて、イベント発生の 1~3 日前に通知を送信します。
通知を受信するには、メッセージセンター で ApsaraDB の障害または保守に関する通知 の連絡先を設定してください。データベース運用・保守(O&M)担当者を連絡先として追加します。配信信頼性を最大限に高めるため、通知方法として 電子メール を選択することを推奨します。サイト内メッセージも利用可能です。

図 1 メッセージセンター コンソールにおけるメッセージ設定のエントリ

図 2 ApsaraDB の障害または保守に関する通知の通知設定メッセージセンター通知方法には電子メールおよびサイト内メッセージがあります。通知の成功確率を向上させるため、電子メールを選択することを推奨します。
イベント駆動型のO&M自動化では、CloudMonitorシステムイベントをサブスクライブします。CloudMonitorは、各メンテナンスイベントに対して、サブスクライブ、開始、終了、キャンセルのライフサイクル通知をプッシュします。設定手順については、「イベントサブスクリプションポリシーの管理(推奨)」をご参照ください。サブスクライブ可能なCloudMonitorシステムイベントについて詳しくは、このトピックの「付録1 CloudMonitor関連のシステムイベント」セクションをご覧ください。
CloudMonitor イベントペイロードのサンプル:
{
"eventId": "c864b30b-7f69-5f04-b0e7-8dfb0eabcfd9",
"product": "RDS",
"reason": "Host software/hardware upgrade",
"extra": {
"impactEn": "Transient instance disconnection",
"eventCode": "rds_apsaradb_transfer",
"eventNameEn": "Instance migration",
"switchTime": "2024-09-15T01:30:00+08:00",
"startTime": "2024-09-14T21:30:00+08:00",
"cancelCode": "OutOfGoodPerfBySoftHardwareUpgrade",
"detailCode": "HostSoftHardwareUpgrade",
"instanceInfo": ""
},
"instanceId": "rm-2ze9d66o65q1g02g6",
"eventType": "Maintenance",
"instanceComment": "rm-2ze9d66o65q1g02g6",
"instanceType": "Instance",
"publishTime": "2024-09-10T16:01:47+08:00"
}ペイロード内の主要フィールド:
| フィールド | 説明 |
|---|---|
eventId | イベント ID。同一イベントは常に同じ ID を持ちます。 |
product | サービスコード。 |
reason | イベントの原因。 |
impactEn | イベントによる業務への影響。 |
eventCode | O&M イベントタイプのコード。 |
eventNameEn | O&M イベントの名称。 |
switchTime | 予定切り替え日時 — スイッチオーバー実行時に一時的な切断が発生する時刻。 |
startTime | 予定開始時刻 — イベントがスケジューリングキューに入る時刻。 |
cancelCode | キャンセルリスクコード。 |
detailCode | 詳細な原因コード。 |
instanceId | インスタンス ID。 |
instanceComment | インスタンスのエイリアス。 |
publishTime | イベント通知の公開時刻。 |
スケジュール済みイベントの表示
PolarDB コンソールにログインします。
左側ナビゲーションウィンドウで、イベントセンター(旧称:イベント管理) > スケジュール済みイベント を選択します。上部ナビゲーションバーから、ご利用のクラスターが配置されているリージョンを選択します。
[スケジュール済みイベント] ページで、イベントの詳細を表示します。予定済み 状態のイベントがデフォルトで表示されます。完了済み タブまたは キャンセル済み タブをクリックして、履歴イベントを表示できます。
属性 例 説明 イベントタイプ リスク対応 緊急度レベル:リスク対応またはシステム保守。 ステータス 未処理 スケジューリング状況。下記の「イベントステータス」をご参照ください。 イベントタイプ マイナーバージョンアップデート 保守イベントの具体的なタイプ。全リストについては、「イベントタイプと影響」をご参照ください。 原因 - イベントの原因。 業務への影響 一時的な接続 イベントがワークロードに与える影響。イベントタイプによって異なります。 O&M に関する推奨事項 アプリケーションがクラスターへの自動再接続を正しく構成していることを確認してください。 イベント発生前または発生中の推奨アクション。 開始時刻 - イベントがスケジューリングキューに入る時刻。「待機中(時間設定待ち)」ステータスの場合は空欄になります。この時刻より前はクラスターに影響はありません。この時刻以降は、構成変更やゾーン間マイグレーションなどのクラスターレベルの操作が一時的に利用不可になります。 予定切り替え日時 - プライマリ/セカンダリまたはリンクのスイッチオーバーにより瞬断が発生すると予想される時刻。極端なケースでは、最大 2 回のスイッチオーバーが発生する可能性があります。 締切日時 - 実行時刻を設定できる最終時刻。設定するスイッチオーバー時刻は、この締切日時より後になることはできません。 キャンセル可能 はい このイベントをキャンセルできるかどうか。ほとんどのシステム O&M イベントで利用可能です。 スケジュール変更可能 はい このイベントのスケジュールを変更できるかどうか。短い再スケジュール期間を持つ緊急のリスク対応イベントでは利用できません。
イベントステータス
各ステータスは、必要となる操作(該当する場合)を示しています。
| ステータス | 意味 | 対応方法 |
|---|---|---|
| 待機中(時間設定待ち) | 実行時刻が設定されていません。締切日時までに設定しない場合、システムが自動的にイベントをキャンセルします。 | 締切日時までにスイッチオーバー時刻を設定してください。 |
| 未処理 | 予定開始時刻を待機中です。 | 特に操作は必要ありません。 |
| 実行中 | イベントが実行中です。手動介入はできません。 | 緊急で終了する場合は、チケットを送信してください。 |
| 成功 | イベントが正常に完了しました。 | 特に操作は必要ありません。 |
| キャンセル済み | イベントがキャンセルされたか、失敗しました。「キャンセルの原因」をご参照ください。 | 原因を確認し、適切に対応してください。 |
キャンセルの原因
| 原因コード | 説明 |
|---|---|
| UserCancel | コンソールまたは API 呼び出しにより、ユーザーがイベントをキャンセルしました。 |
| UserResponseTimeout | ユーザーが締切日時までに実行時刻を設定しなかったため、イベントが自動的にキャンセルされました。 |
| SupervisorCancel | データベース管理上の目的で、イベントの発行者がイベントをキャンセルしました。 |
| AvoidCancel | リスクが軽減された、またはクラスターがこのイベントを不要とする状況(例:クラスターが既に最新バージョンである)になりました。 |
| AutoCancel | 定期的なチェックにおいて、クラスターが実行条件を満たさなかったため、システムがイベントをキャンセルしました(例:クラスターのステータスが異常である)。 |
| ExecuteTimeout | イベントが実行キューに入ったものの、所定の時間内に完了しませんでした。 |
| ExecuteFail | 不明な例外により、イベント実行中に失敗しました。 |
イベントの再スケジュール
再スケジュールするイベントを選択し、イベントのスケジュール をクリックします。以下のいずれかのオプションを選択します。
即時実行:イベントを直ちに開始します。現在時刻が開始時刻として使用され、イベントはすぐに実行キューに入ります。
指定時刻でのスイッチオーバー:許容範囲内のスイッチオーバー時刻を選択します。開始時刻は、選択したスイッチオーバー時刻に基づいて自動計算されます。新しい開始時刻は、現在時刻より前になることはできません。
イベントを再スケジュールできない場合:
以下のいずれかの条件が成立する場合、再スケジュールはブロックされます。
イベントが 実行中 ステータスである。
イベントの開始時刻がすでに経過している。
現在時刻がイベントの締切日時より後である。
イベントの新しい開始時刻が現在時刻より前である。
このイベントのスイッチオーバー時刻を変更できない。
締切日時を超えてスイッチオーバー時刻を設定する(関連リスクを承諾する場合)には、チケットを送信してください。
定期的な保守ウィンドウの設定
定期的なタイムウィンドウを設定することで、今後の保守イベントの実行時刻を優先的に指定できます。新しいイベントが作成された際、システムはクラスターの保守ウィンドウではなく、この定期的なタイムウィンドウに基づいて実行時刻を算出します。
以下の点にご注意ください。1. この設定は 新規イベント にのみ適用されます。既存イベントの時刻を変更するには、代わりに イベントのスケジュール を使用してください。2. この設定は システム保守レベル のイベントの実行時刻にのみ影響します。イベント一覧に表示される実際の実行時刻が最優先されます。3. これは アカウントレベル の設定であり、定期的なタイムウィンドウ設定をサポートするすべてのデータベースサービスに適用されます。
イベント一覧の右上隅にある 定期的なタイムウィンドウ設定 をクリックします。月単位または週単位でウィンドウを設定できます。
例: 定期的なウィンドウを月曜日および火曜日の 02:00~03:00 に設定し、新しいイベントの許容時間範囲が今週の火曜日から来週の日曜日までである場合、候補となるスイッチオーバースロットは火曜日 02:00~03:00 および来週の月曜日 02:00~03:00 となります。システムは、火曜日のスイッチオーバーを優先的にスケジュールします。
個別のクラスターのメンテナンスウィンドウを設定する方法について詳しくは、「メンテナンスウィンドウの設定」をご参照ください。
イベントタイプと影響
| イベントタイプ | トリガー | 影響タイプ | 影響の説明 |
|---|---|---|---|
| クラスターマイグレーション | ホスト脆弱性、ハードウェア保証期間の終了、または OS アップグレード。システムがクラスターを新しいサーバーへ移行します。非高可用性クラスターおよび読み取り専用クラスターに適用されます。 | クラスターの瞬断 | スイッチオーバー時刻に達した後:クラスターまたは影響を受けるノードへの接続が一時的に中断され、その後データ同期のためクラスターが最大 30 秒間読み取り専用状態になります。この期間中、Data Management (DMS) および Data Transmission Service (DTS) は一時的に利用不可になります。ピーク時を避けた時間帯にスイッチオーバーをスケジュールし、アプリケーションが自動的に再接続するよう構成されていることを確認してください。 |
| プライマリ/セカンダリ スイッチオーバー | ホスト脆弱性、ハードウェア保証期間の終了、または OS アップグレード。システムがワークロードをプライマリノードから読み取り専用ノードへ転送します。高可用性クラスターにのみ適用されます。 | クラスターの瞬断 | クラスターマイグレーションと同様です。 |
| クラスターパラメーター調整 | 既知のパラメーターリスク。システムがクラスターパラメーターを変更します。変更されたパラメーターが再起動を要する場合、クラスターは再起動します。 | 変動あり | 変更されるパラメーターに依存します。 |
| ホスト脆弱性対応 | クラスターが稼働するホスト上で検出された脆弱性。 | クラスターの瞬断 | クラスターマイグレーションと同様です。 |
| SSL 証明書の更新 | SSL 証明書の有効期限が近づいている。 | クラスターの瞬断 | クラスターマイグレーションと同様です。 |
| バックアップモードのアップグレード | クラスターのバックアップモードを論理バックアップから物理バックアップへ切り替える。 | クラスターの瞬断 | クラスターマイグレーションと同様です。 |
| ゾーン間マイグレーション | 特定のリージョンおよびゾーンにおける物理インフラストラクチャーのアップグレードおよび改善。 | クラスターの瞬断 | クラスターマイグレーションと同様です。 |
| エンジンのマイナーバージョンアップデート | 新機能の提供、既知の問題の修正、ユーザーエクスペリエンスの向上を目的としたマイナーバージョンアップデートが利用可能です。 | クラスターの瞬断 | クラスターマイグレーションと同様です。バージョン間の違いについては、「エンジンリリースノート」および「リリースノート」をご参照ください。 |
| PolarProxy のマイナーバージョンアップデート | 新機能の提供、既知の問題の修正、ユーザーエクスペリエンスの向上を目的とした PolarProxy のマイナーバージョンアップデートが利用可能です。 | クラスターの瞬断 | アップデート中に、クラスターエンドポイントまたはカスタムエンドポイントが最大 10 秒間切断される可能性があります。バージョンの違いについては、関連するリリースノートをご参照ください。 |
| ネットワークアップグレード | ネットワークパフォーマンスおよび安定性の向上を目的としたネットワーク設備のアップグレード。 | クラスターの瞬断または仮想 IP アドレスの変更 | クラスターマイグレーションと同様の瞬断が発生します。一部のゾーン間ネットワークアップグレードでは、クラスターの仮想 IP アドレスが変更される場合があります。クライアントが仮想 IP アドレスを使用して接続している場合、接続が中断されます。これを防ぐには、ドメイン名形式のエンドポイントを使用し、アプリケーションおよびサーバーの DNS キャッシュを無効化してください。 |
| ストレージゲートウェイのアップグレード | ストレージパフォーマンスおよび安定性の向上を目的としたストレージゲートウェイのアップグレード。 | I/O ジッター | 一時的な I/O ジッターおよび SQL レイテンシーの増加が発生する可能性があり、その継続時間は最大 3 秒です。 |
| 透過的マイグレーションの有効化 | ユーザーエクスペリエンスの向上。 | パラメーター調整 | 再起動やマイグレーションは発生せず、ワークロードに影響はありません。 |
| PolarProxy のマイグレーション | PolarProxy を実行するホストのアップグレードまたは保守。 | PolarProxy のマイグレーション | クラスターエンドポイントまたはカスタムエンドポイントが最大 10 秒間切断される可能性があります。 |
よくある質問
開始時刻とスイッチオーバー時刻
イベント操作
API リファレンス
| 操作 | 説明 |
|---|---|
| DescribePendingMaintenanceActions | タスクタイプ別にスケジュール済みイベントの数を照会します。 |
| ModifyPendingMaintenanceAction | スケジュール済みイベントのスイッチオーバー時刻を変更します。 |
| DescribePendingMaintenanceAction | スケジュール済みイベントの詳細を照会します。 |