スケジュール済みイベントの表示と管理 - PolarDB - Alibaba Cloud ドキュメントセンター

PolarDB は、ソフトウェアアップグレード、ハードウェアメンテナンス、クラスターマイグレーションなどの今後の保守作業を SMS、音声通知、電子メール、およびコンソール内メッセージで通知します。[スケジュール済みイベント] ページでは、イベントの詳細を確認し、スイッチオーバーの再スケジュール、定期的な保守ウィンドウの設定、またはイベントのキャンセルといった操作が可能です。

イベントの緊急度レベル

スケジュール済みイベントは、以下の 2 つの緊急度レベルに分類されます。

[S0：緊急] リスク対応：障害を未然に防止するため、迅速な対応が必要な予期せぬイベントです。例として、緊急のハードウェア交換、不具合のあるバージョンへのアップグレード、ホスト異常の修正、有効期限切れ前の SSL 証明書の更新などがあります。通知は通常、3 日以上前に行われますが、再スケジュール可能な期間は短くなります。
[S1：スケジュール済み] システム保守：リスクが低く、事前に計画されたソフトウェアおよびハードウェアのアップグレードです。通知は 3 日以上前に送信され、これらのイベントはキャンセル可能です。

通知の設定

PolarDB は、イベントの緊急度に応じて、イベント発生の 1～3 日前に通知を送信します。

通知を受信するには、メッセージセンターで ApsaraDB の障害または保守に関する通知 の連絡先を設定してください。データベース運用・保守（O&M）担当者を連絡先として追加します。配信信頼性を最大限に高めるため、通知方法として 電子メール を選択することを推奨します。サイト内メッセージも利用可能です。

図 1 メッセージセンターコンソールにおけるメッセージ設定のエントリ

図 2 ApsaraDB の障害または保守に関する通知の通知設定メッセージセンター通知方法には電子メールおよびサイト内メッセージがあります。通知の成功確率を向上させるため、電子メールを選択することを推奨します。

イベント駆動型のO&M自動化では、CloudMonitorシステムイベントをサブスクライブします。CloudMonitorは、各メンテナンスイベントに対して、サブスクライブ、開始、終了、キャンセルのライフサイクル通知をプッシュします。設定手順については、「イベントサブスクリプションポリシーの管理（推奨）」をご参照ください。サブスクライブ可能なCloudMonitorシステムイベントについて詳しくは、このトピックの「付録1 CloudMonitor関連のシステムイベント」セクションをご覧ください。

CloudMonitor イベントペイロードのサンプル：

{
  "eventId": "c864b30b-7f69-5f04-b0e7-8dfb0eabcfd9",
  "product": "RDS",
  "reason": "Host software/hardware upgrade",
  "extra": {
    "impactEn": "Transient instance disconnection",
    "eventCode": "rds_apsaradb_transfer",
    "eventNameEn": "Instance migration",
    "switchTime": "2024-09-15T01:30:00+08:00",
    "startTime": "2024-09-14T21:30:00+08:00",
    "cancelCode": "OutOfGoodPerfBySoftHardwareUpgrade",
    "detailCode": "HostSoftHardwareUpgrade",
    "instanceInfo": ""
  },
  "instanceId": "rm-2ze9d66o65q1g02g6",
  "eventType": "Maintenance",
  "instanceComment": "rm-2ze9d66o65q1g02g6",
  "instanceType": "Instance",
  "publishTime": "2024-09-10T16:01:47+08:00"
}

ペイロード内の主要フィールド：

フィールド	説明
`eventId`	イベント ID。同一イベントは常に同じ ID を持ちます。
`product`	サービスコード。
`reason`	イベントの原因。
`impactEn`	イベントによる業務への影響。
`eventCode`	O&M イベントタイプのコード。
`eventNameEn`	O&M イベントの名称。
`switchTime`	予定切り替え日時 — スイッチオーバー実行時に一時的な切断が発生する時刻。
`startTime`	予定開始時刻 — イベントがスケジューリングキューに入る時刻。
`cancelCode`	キャンセルリスクコード。
`detailCode`	詳細な原因コード。
`instanceId`	インスタンス ID。
`instanceComment`	インスタンスのエイリアス。
`publishTime`	イベント通知の公開時刻。

スケジュール済みイベントの表示

PolarDB コンソールにログインします。
左側ナビゲーションウィンドウで、イベントセンター（旧称：イベント管理） > スケジュール済みイベント を選択します。上部ナビゲーションバーから、ご利用のクラスターが配置されているリージョンを選択します。

[スケジュール済みイベント] ページで、イベントの詳細を表示します。予定済み 状態のイベントがデフォルトで表示されます。完了済み タブまたは キャンセル済み タブをクリックして、履歴イベントを表示できます。

属性	例	説明
イベントタイプ	リスク対応	緊急度レベル：リスク対応またはシステム保守。
ステータス	未処理	スケジューリング状況。下記の「イベントステータス」をご参照ください。
イベントタイプ	マイナーバージョンアップデート	保守イベントの具体的なタイプ。全リストについては、「イベントタイプと影響」をご参照ください。
原因	-	イベントの原因。
業務への影響	一時的な接続	イベントがワークロードに与える影響。イベントタイプによって異なります。
O&M に関する推奨事項	アプリケーションがクラスターへの自動再接続を正しく構成していることを確認してください。	イベント発生前または発生中の推奨アクション。
開始時刻	-	イベントがスケジューリングキューに入る時刻。「待機中（時間設定待ち）」ステータスの場合は空欄になります。この時刻より前はクラスターに影響はありません。この時刻以降は、構成変更やゾーン間マイグレーションなどのクラスターレベルの操作が一時的に利用不可になります。
予定切り替え日時	-	プライマリ／セカンダリまたはリンクのスイッチオーバーにより瞬断が発生すると予想される時刻。極端なケースでは、最大 2 回のスイッチオーバーが発生する可能性があります。
締切日時	-	実行時刻を設定できる最終時刻。設定するスイッチオーバー時刻は、この締切日時より後になることはできません。
キャンセル可能	はい	このイベントをキャンセルできるかどうか。ほとんどのシステム O&M イベントで利用可能です。
スケジュール変更可能	はい	このイベントのスケジュールを変更できるかどうか。短い再スケジュール期間を持つ緊急のリスク対応イベントでは利用できません。

イベントステータス

各ステータスは、必要となる操作（該当する場合）を示しています。

ステータス	意味	対応方法
待機中（時間設定待ち）	実行時刻が設定されていません。締切日時までに設定しない場合、システムが自動的にイベントをキャンセルします。	締切日時までにスイッチオーバー時刻を設定してください。
未処理	予定開始時刻を待機中です。	特に操作は必要ありません。
実行中	イベントが実行中です。手動介入はできません。	緊急で終了する場合は、チケットを送信してください。
成功	イベントが正常に完了しました。	特に操作は必要ありません。
キャンセル済み	イベントがキャンセルされたか、失敗しました。「キャンセルの原因」をご参照ください。	原因を確認し、適切に対応してください。

キャンセルの原因

原因コード	説明
UserCancel	コンソールまたは API 呼び出しにより、ユーザーがイベントをキャンセルしました。
UserResponseTimeout	ユーザーが締切日時までに実行時刻を設定しなかったため、イベントが自動的にキャンセルされました。
SupervisorCancel	データベース管理上の目的で、イベントの発行者がイベントをキャンセルしました。
AvoidCancel	リスクが軽減された、またはクラスターがこのイベントを不要とする状況（例：クラスターが既に最新バージョンである）になりました。
AutoCancel	定期的なチェックにおいて、クラスターが実行条件を満たさなかったため、システムがイベントをキャンセルしました（例：クラスターのステータスが異常である）。
ExecuteTimeout	イベントが実行キューに入ったものの、所定の時間内に完了しませんでした。
ExecuteFail	不明な例外により、イベント実行中に失敗しました。

イベントの再スケジュール

再スケジュールするイベントを選択し、イベントのスケジュール をクリックします。以下のいずれかのオプションを選択します。

即時実行：イベントを直ちに開始します。現在時刻が開始時刻として使用され、イベントはすぐに実行キューに入ります。
指定時刻でのスイッチオーバー：許容範囲内のスイッチオーバー時刻を選択します。開始時刻は、選択したスイッチオーバー時刻に基づいて自動計算されます。新しい開始時刻は、現在時刻より前になることはできません。

イベントを再スケジュールできない場合：

以下のいずれかの条件が成立する場合、再スケジュールはブロックされます。

イベントが 実行中 ステータスである。
イベントの開始時刻がすでに経過している。
現在時刻がイベントの締切日時より後である。
イベントの新しい開始時刻が現在時刻より前である。
このイベントのスイッチオーバー時刻を変更できない。

締切日時を超えてスイッチオーバー時刻を設定する（関連リスクを承諾する場合）には、チケットを送信してください。

定期的な保守ウィンドウの設定

定期的なタイムウィンドウを設定することで、今後の保守イベントの実行時刻を優先的に指定できます。新しいイベントが作成された際、システムはクラスターの保守ウィンドウではなく、この定期的なタイムウィンドウに基づいて実行時刻を算出します。

重要

以下の点にご注意ください。1. この設定は 新規イベント にのみ適用されます。既存イベントの時刻を変更するには、代わりに イベントのスケジュール を使用してください。2. この設定は システム保守レベル のイベントの実行時刻にのみ影響します。イベント一覧に表示される実際の実行時刻が最優先されます。3. これは アカウントレベル の設定であり、定期的なタイムウィンドウ設定をサポートするすべてのデータベースサービスに適用されます。

イベント一覧の右上隅にある 定期的なタイムウィンドウ設定 をクリックします。月単位または週単位でウィンドウを設定できます。

例：定期的なウィンドウを月曜日および火曜日の 02:00～03:00 に設定し、新しいイベントの許容時間範囲が今週の火曜日から来週の日曜日までである場合、候補となるスイッチオーバースロットは火曜日 02:00～03:00 および来週の月曜日 02:00～03:00 となります。システムは、火曜日のスイッチオーバーを優先的にスケジュールします。

個別のクラスターのメンテナンスウィンドウを設定する方法について詳しくは、「メンテナンスウィンドウの設定」をご参照ください。

スケジュール済みイベントのキャンセル

キャンセルするイベントを選択し、スケジュール済みイベントのキャンセル をクリックします。確認ページでキャンセルリスクを確認し、確認をクリックします。

重要

スケジュール済みイベントは、サービス品質および安定性の向上を目的として、クラウドデータベース管理システムが日常的な点検中に発行します。不必要なキャンセルは避けてください。イベントをキャンセルした場合、システムは 1～30 日の無音期間の後に再び同イベントを発行することがあります。代わりに、ワークロードに影響を与えないタイミングへスイッチオーバーを再スケジュールすることを推奨します。イベントを完全にブロックするにはチケットを送信してください。ただし、ホスト障害復旧、ディスクフルロック解消、SSL 証明書更新などの緊急リスク対応イベントはブロックできません。

イベントタイプと影響

イベントタイプ	トリガー	影響タイプ	影響の説明
クラスターマイグレーション	ホスト脆弱性、ハードウェア保証期間の終了、または OS アップグレード。システムがクラスターを新しいサーバーへ移行します。非高可用性クラスターおよび読み取り専用クラスターに適用されます。	クラスターの瞬断	スイッチオーバー時刻に達した後：クラスターまたは影響を受けるノードへの接続が一時的に中断され、その後データ同期のためクラスターが最大 30 秒間読み取り専用状態になります。この期間中、Data Management (DMS) および Data Transmission Service (DTS) は一時的に利用不可になります。ピーク時を避けた時間帯にスイッチオーバーをスケジュールし、アプリケーションが自動的に再接続するよう構成されていることを確認してください。
プライマリ／セカンダリスイッチオーバー	ホスト脆弱性、ハードウェア保証期間の終了、または OS アップグレード。システムがワークロードをプライマリノードから読み取り専用ノードへ転送します。高可用性クラスターにのみ適用されます。	クラスターの瞬断	クラスターマイグレーションと同様です。
クラスターパラメーター調整	既知のパラメーターリスク。システムがクラスターパラメーターを変更します。変更されたパラメーターが再起動を要する場合、クラスターは再起動します。	変動あり	変更されるパラメーターに依存します。
ホスト脆弱性対応	クラスターが稼働するホスト上で検出された脆弱性。	クラスターの瞬断	クラスターマイグレーションと同様です。
SSL 証明書の更新	SSL 証明書の有効期限が近づいている。	クラスターの瞬断	クラスターマイグレーションと同様です。
バックアップモードのアップグレード	クラスターのバックアップモードを論理バックアップから物理バックアップへ切り替える。	クラスターの瞬断	クラスターマイグレーションと同様です。
ゾーン間マイグレーション	特定のリージョンおよびゾーンにおける物理インフラストラクチャーのアップグレードおよび改善。	クラスターの瞬断	クラスターマイグレーションと同様です。
エンジンのマイナーバージョンアップデート	新機能の提供、既知の問題の修正、ユーザーエクスペリエンスの向上を目的としたマイナーバージョンアップデートが利用可能です。	クラスターの瞬断	クラスターマイグレーションと同様です。バージョン間の違いについては、「エンジンリリースノート」および「リリースノート」をご参照ください。
PolarProxy のマイナーバージョンアップデート	新機能の提供、既知の問題の修正、ユーザーエクスペリエンスの向上を目的とした PolarProxy のマイナーバージョンアップデートが利用可能です。	クラスターの瞬断	アップデート中に、クラスターエンドポイントまたはカスタムエンドポイントが最大 10 秒間切断される可能性があります。バージョンの違いについては、関連するリリースノートをご参照ください。
ネットワークアップグレード	ネットワークパフォーマンスおよび安定性の向上を目的としたネットワーク設備のアップグレード。	クラスターの瞬断または仮想 IP アドレスの変更	クラスターマイグレーションと同様の瞬断が発生します。一部のゾーン間ネットワークアップグレードでは、クラスターの仮想 IP アドレスが変更される場合があります。クライアントが仮想 IP アドレスを使用して接続している場合、接続が中断されます。これを防ぐには、ドメイン名形式のエンドポイントを使用し、アプリケーションおよびサーバーの DNS キャッシュを無効化してください。
ストレージゲートウェイのアップグレード	ストレージパフォーマンスおよび安定性の向上を目的としたストレージゲートウェイのアップグレード。	I/O ジッター	一時的な I/O ジッターおよび SQL レイテンシーの増加が発生する可能性があり、その継続時間は最大 3 秒です。
透過的マイグレーションの有効化	ユーザーエクスペリエンスの向上。	パラメーター調整	再起動やマイグレーションは発生せず、ワークロードに影響はありません。
PolarProxy のマイグレーション	PolarProxy を実行するホストのアップグレードまたは保守。	PolarProxy のマイグレーション	クラスターエンドポイントまたはカスタムエンドポイントが最大 10 秒間切断される可能性があります。

よくある質問

O&M イベントの通知を受信する理由は何ですか？

Alibaba Cloud は、PolarDB サービスの継続性、安定性、および品質を維持するために、スケジュール済みの保守イベントを発行します。これらのイベントには、ソフトウェアおよびハードウェアのアップグレード、構成変更、ネットワーク改善などが含まれます。クラスターに対して自動マイナーバージョンアップデートが有効になっている場合、これらのアップデートに関する通知を定期的に受信します。

通知はいつ送信されますか？なぜ通知を受信していないのですか？

通知は、イベントの緊急度に応じて、イベント発生の 1～3 日前に送信されます。メッセージセンターの通知連絡先を確認し、過去 1 か月間に「ApsaraDB の予定保守作業に関する通知」という件名の電子メールが届いていないかをご確認ください。

通知を受け取りましたが、[スケジュール済みイベント] 一覧にイベントが表示されません。なぜですか？

通知ステータスのコールバックに遅延が発生している可能性があります。1～3 分待ってページをリフレッシュしてください。また、正しいリージョンが選択されているかを確認してください。
通知の内容がデータベース以外のインフラストラクチャー変更（例：「Alibaba Cloud データベースネットワークアップグレードのお知らせ」という件名の電子メール）である可能性があります。これらは基盤インフラストラクチャーチームが発行するクラスターまたはデータセンター単位の変更であり、データベースインスタンスまたはクラスター単位の変更ではありません。このような変更にはスケジュール済みイベントは存在せず、再スケジュールやキャンセルもできません。電子メールまたはサイト内メッセージの本文が公式情報源となります。

開始時刻とスイッチオーバー時刻

開始時刻を過ぎても、一覧に「実行中」と表示されないのはなぜですか？

開始時刻を過ぎると、イベントはスケジューリングキューに入り、実行を待機します。この期間中、システムは実行チェック、環境初期化、O&M アクションのオーケストレーションといった準備作業を行いますが、クラスターの可用性には影響しません。開始時刻よりも、スイッチオーバー時刻に注目してください。

準備プロセスはイベントタイプによって異なります。例えば、高可用性クラスターのマイグレーションでは、通常、データセンター間でセカンダリインスタンスを再作成し、プライマリ／セカンダリスイッチオーバーを実行し、再度セカンダリインスタンスを再作成するといったタスクが、スイッチオーバー時刻を中心にオーケストレーションされます。

予定スイッチオーバー時刻を変更するにはどうすればよいですか？

コンソールでイベントの再スケジュールを行います（「イベントの再スケジュール」を参照）か、ModifyPendingMaintenanceAction API オペレーションを呼び出します。

マイグレーションタスクの完了時刻を推定できますか？

表示されるのは開始時刻および概算のスイッチオーバー時刻のみです。実際の終了時刻は、ネットワーク遅延、タスクキューの深さ、データサイズなどの要因に左右されるため、事前に推定することはできません。

「待機中（時間設定待ち）」イベントの締切日時までに実行時刻を設定しなかった場合、どうなりますか？

システムが自動的にイベントをキャンセルします。保守作業が依然として必要である場合、システムが新しい通知を送信します。

イベント操作

キャンセルすべきですか、それとも再スケジュールすべきですか？

可能な限り再スケジュールすることを推奨します。業務への影響を最小限に抑えるため、ピーク時を避けた時間帯にスイッチオーバー時刻を選択してください。キャンセルした場合、システムは 1～30 日の無音期間の後に再び同イベントを発行することがあります。

イベントが完了したことを確認するにはどうすればよいですか？

イベントが完了すると、[スケジュール済みイベント] 一覧から 完了済み タブへ移動します。リアルタイムのステータス追跡には、CloudMonitor のシステムイベントサブスクリプション（「通知の設定」をご参照）をご利用ください。

クラスターマイグレーションイベントは、クラスターのゾーン、アカウント、ネットワーク、またはエンドポイントを変更しますか？

いいえ。クラスターマイグレーションイベント後も、クラスターのゾーン、アカウント、ネットワーク、およびエンドポイントは変更されません。

API リファレンス

操作	説明
DescribePendingMaintenanceActions	タスクタイプ別にスケジュール済みイベントの数を照会します。
ModifyPendingMaintenanceAction	スケジュール済みイベントのスイッチオーバー時刻を変更します。
DescribePendingMaintenanceAction	スケジュール済みイベントの詳細を照会します。