RDS Custom システムイベントは、O&M タスク実行ステータス、リソースの例外、リソースのステータス変更などのクラウドリソース情報を記録および通知するために Alibaba Cloud によって定義されます。システムイベントを通じて、基盤となるアップグレードによるインスタンスの移行、またはシステムメンテナンスによるインスタンスの再起動など、RDS Custom リソースに関するリスクおよび例外情報を取得できます。その後、システムイベントに迅速に対応および処理して、RDS Custom リソースの可用性やパフォーマンスの低下によるビジネスへの影響を防ぐことができます。
ユースケース
リスクと例外の通知
Alibaba Cloud は、RDS Custom コンソールにシステムイベント (システムメンテナンスによる再起動、インスタンスの有効期限切れ、その他リソースの可用性やパフォーマンスに影響を与える可能性のあるイベントなど) を表示します。一部の重要なシステムイベントは、メール、および内部メッセージを通じても送信されます。RDS Custom コンソールまたは OpenAPI を通じてこれらのイベントに対応できます。ビジネスへの影響を避けるために、システムイベントに迅速に対応することをお勧めします。
たとえば、サブスクリプションインスタンスが有効期限切れにより停止しようとしている場合、RDS Custom コンソールは、有効期限切れによるインスタンスの停止に起因するビジネスへの影響を避けるためにインスタンスを更新するように目立つように通知します。
自動 O&M
RDS Custom コンソールに表示されるシステムイベントにはイベントステータスが定義されており、対応するシステム O&M タスクの実行ステータスを簡単に区別できます。システムイベントのステータスの変更は Cloud Monitor に同期され、自動 O&M メカニズムの構築に役立ちます。イベントステータスの詳細については、「RDS Custom のシステムイベントステータス」をご参照ください。
説明各イベントステータスは Cloud Monitor イベント名に対応します。たとえば、RDS Custom イベントコード InstanceFailure.Reboot は、イベントステータス Executing および Executed をサポートしており、これらは Cloud Monitor イベント名 Instance:InstanceFailure.Reboot:Executing および Instance:InstanceFailure.Reboot:Executed に対応します。
ステータス変更イベントには、インスタンスの実行ステータスの変更やプリエンプティブルインスタンスの中断など、RDS Custom コンソールに表示されない一部のシステムイベントが含まれます。これらのシステムイベントは、RDS Custom コンソールまたは OpenAPI で直接対応することはできません。RDS Custom はこれらのシステムイベントのイベントステータスを定義していませんが、これらのシステムイベントが発生すると、Cloud Monitor に報告されるため、ニーズに基づいてイベント駆動型の自動 O&M システムを構築できます。
たとえば、ECS インスタンスを起動または停止すると、ステータス変更イベントがトリガーされます。このイベントはリスクや例外を示すものではありません。操作をシステムに記録したい場合は、ステータス変更イベントのイベント通知を設定し、アラートコールバック機能を使用してインスタンスの起動および停止情報を操作ログに書き込むことができます。
システムイベントのタイプ
システムイベントは、その原因に基づいて次のカテゴリに分類できます。
カテゴリ | 説明 | RDS Custom イベントセンターに表示 |
スケジュールされた O&M イベント | Alibaba Cloud は、セキュリティ上の理由からホストソフトウェアをアップグレードしたり、基盤となるホストのハードウェアおよびソフトウェアに潜む障害リスクを予測して対処したりする必要がある場合があります。対応する O&M タスクの実行が RDS Custom リソースの可用性に影響を与えたり、パフォーマンスの低下を引き起こしたりする可能性がある場合、Alibaba Cloud は実行時間、オブジェクト、影響、およびその他の情報について事前に通知します。これらのシステムイベントには、スケジュールされた実行時間中に対応でき、ピーク時の影響を避けるためにビジネスアクティビティが低い期間に処理することを選択できます。 説明 スケジュールされた O&M イベントは、プロアクティブ O&M イベントとも呼ばれ、数百万台のサーバーにおける Alibaba Cloud の O&M 経験、数万の大企業顧客にサービスを提供する能力、および Alibaba DAMO Academy の最先端の機械学習アルゴリズムに基づいて、基盤となるホストのハードウェアまたはソフトウェアに潜む障害リスクを予測して対処します。ホストの障害リスクを回避できない場合、Alibaba Cloud は影響を受ける RDS Custom ユーザーにスケジュールされた O&M イベントを通じて事前に通知し、ユーザーにビジネス切り替えのためのバッファ時間を提供します。ユーザーが事前にスケジュールされた O&M イベントに対応しない場合、障害リスクが発生したときに RDS Custom インスタンスが利用不可になったり、再起動したりする可能性があります。 | はい |
予期しない O&M イベント | このカテゴリのシステムイベントは、カーネルパニック、メモリ不足エラー、または基盤となるホストのハードウェアまたはソフトウェアの障害などの予期しない問題により、ECS インスタンスが再起動または利用不可になったときにトリガーされます。Alibaba Cloud は予期しない O&M イベントを迅速に送信し、RDS Custom リソースの可用性をできるだけ早く復元し、対応するシステム O&M タスクの実行ステータスを通知します。 説明 予期しない O&M イベントは、一般的に、基盤となるホストの予測不可能な障害や、RDS Custom インスタンスのオペレーティングシステムのカーネルエラーなどの問題により、RDS Custom インスタンスが突然利用不可になったり再起動したりするイベントを指します。
| はい |
システムイベントの重要度
システムイベントには、インスタンスの通常運用への影響に基づいて、次の重要度が割り当てられます。
重大: 重大なシステムイベントは、インスタンスが利用不可になる可能性があり、できるだけ早く対処する必要があります。たとえば、支払い遅延によるリソースのリリース時や、インスタンスエラーによるインスタンスの再デプロイ時に、重大なシステムイベントがトリガーされます。
警告: 警告システムイベントはビジネスに影響を与えます。たとえば、バースト可能インスタンスがパフォーマンスベースラインを超えてバーストできない場合に、警告システムイベントがトリガーされます。これらのイベントに細心の注意を払うか、必要に応じて対処する必要があります。
情報: これらのイベントに注意を払うかどうかを選択できます。たとえば、ディスクスナップショットが作成された場合などです。
システムイベントのステータスとウィンドウ
コンソールに表示されるシステムイベントには、次の表で説明するようにイベントステータスが定義されています。
状態 | プロパティ | 説明 |
照会中 | 一時的 | システムが照会中であり、権限付与を待っています。権限付与後、イベントは実行中ステータスになります。 |
スケジュール済み | 一時的 | O&M タスクは実行がスケジュールされていますが、まだ開始されていません。実行が開始されると、イベントは実行中ステータスになります。 |
実行中 | 一時的 | システムイベントに関連する O&M タスクが実行されています。 |
実行済み | 安定的 | システムイベントに関連する O&M タスクが完了しました。 |
回避済み | 安定的 | ユーザー操作ウィンドウ内で影響を受けるインスタンスを移行したため、システムイベントの影響は回避されました。 |
失敗 | 安定的 | システムイベントに関連する O&M タスクが失敗しました。 |
キャンセル済み | 安定的 | システムイベントに関連する O&M タスクは自動的にキャンセルされます。 |
次の図は、イベントステータス間の典型的なトランジションを示しています。
システムイベントには、次のウィンドウが含まれます。
ユーザー操作ウィンドウ
システムイベントのユーザー操作ウィンドウは、イベントが送信されたときに開始され、関連する O&M タスクがスケジュールどおりに実行されるときに終了します。ユーザー操作ウィンドウ内でイベントを手動で処理するか、システムが自動的にイベントを処理するのを待つことができます。ユーザー操作ウィンドウの長さに関する次の項目に注意してください:
ほとんどの場合、スケジュールされた O&M イベントのユーザー操作ウィンドウは 24 時間から 48 時間の範囲です。
説明照会中ステータスのシステムイベントの場合、ユーザー操作ウィンドウの長さに制限はありません。イベントに関連する O&M タスクは、タスクの実行を承認した後にのみ開始できます。
ほとんどの場合、障害や不正な操作によって引き起こされる予期しない O&M システムイベントには、ユーザー操作ウィンドウがありません。
サブスクリプションインスタンスの有効期限が近づいていることを示すシステムイベントの場合、ウィンドウは 3 日間です。
支払い遅延により従量課金インスタンスが停止しようとしていることを示すシステムイベントの場合、ウィンドウは 1 時間未満です。
イベント実行ウィンドウ
システムイベントの実行ウィンドウは、関連する O&M タスクが実行されたときに開始され、タスクが完了したときに終了します。イベント実行ウィンドウの長さに関する次の項目に注意してください:
障害回復イベントなどのシステムイベントの場合、ウィンドウは 10 分以内です。
障害や不正な操作によって引き起こされる予期しない O&M イベントには、短いイベント実行ウィンドウがあります。
操作
操作 | 説明とリファレンス |
システムイベントについて理解する | システムイベントについて学び、イベント名、重要度、使用シナリオ、制限、ステータス、および名前のフォーマットを理解するには、このトピックをご参照ください。 |
システムイベントを表示する |
|
システムイベントを処理する | 一部の重要なシステムイベント (RDS Custom リソースの可用性に影響を与えたり、パフォーマンスの低下を引き起こしたりするイベントなど) については、コンソールまたは OpenAPI を通じて迅速に対応し、ビジネス運用への影響を避けるために推奨事項に従って処理することをお勧めします。 |
システムイベントを監視する | RDS Custom インスタンスでのビジネス運用の安定性を確保し、自動 O&M を実装するために、イベント通知を設定して基盤となる環境の変更を監視することをお勧めします。イベント通知を設定すると、システムは指定した通知方法を使用して通知を送信します。 CloudMonitor を通じてアラートルールを設定し、イベント通知をプッシュするには、「CloudMonitor を使用して RDS Custom イベント通知をサブスクライブする」をご参照ください。 |