このトピックでは、RDS Custom でサポートされているシステムイベント (スケジュールされたメンテナンスイベントや予期しないメンテナンスイベントなど) をまとめ、各システムイベントの対処方法を提案します。
RDS Custom のイベントコードと CloudMonitor のイベント名のフォーマット
システムイベントを通じて自動メンテナンスメカニズムを確立できるように、RDS Custom のシステムイベントは CloudMonitor に同期されます。同じイベントに対する RDS Custom のイベントコードと CloudMonitor のイベント名は、特定の命名フォーマットに従います。
RDS Custom イベントコード: イベントの原因とリソースへの影響に関する情報を含み、
<イベントの原因>.<リソースへの影響>というフォーマットになります。CloudMonitor イベント名: リソースタイプ、イベントの原因、リソースへの影響、イベントステータスに関する情報を含み、
<リソースタイプ>:<イベントの原因>.<リソースへの影響>:<イベントステータス>というフォーマットになります。
すべての RDS Custom イベントコードと CloudMonitor イベント名に、すべての情報が含まれているわけではありません。たとえば、CloudMonitor イベント名 Disk:ErrorDetected:Executing は、ディスクの破損が検出されたことを示しているため、その後のリソースへの影響に関する情報は不要です。
スケジュールされた O&M イベント
オペレーティングシステム内からインスタンスを再起動すると、イベントに対応するメンテナンス操作は有効になりません。したがって、このトピックで言及されているインスタンスの再起動操作は、RDS Custom コンソールまたは API 操作の呼び出しによって実行される操作を指します。詳細については、「インスタンスの再起動」または「RebootRCInstance」をご参照ください。
イベントコード | イベント名 | イベントレベル | CloudMonitor イベント名 | イベントの説明と影響 | 対処方法の提案 |
SystemMaintenance.Reboot | システムメンテナンスによるインスタンスの再起動 | クリティカル |
| Alibaba Cloud は、RDS Custom インスタンスがデプロイされているホストで、潜在的なソフトウェアまたはハードウェアの障害リスクを検出します。これらのリスクにより、RDS Custom インスタンスが再起動する可能性があります。このリスクはまだ直接的な障害にはなっていません。このシステムイベントは、スケジュールされたシステムメンテナンス時刻の 24~48 時間前に送信されます。 説明 障害リスクには以下が含まれます:
| 説明 イベントのステータスの変化に注意を払うことを推奨します。インスタンスを再起動してもイベントのステータスが変わらない場合、イベントへの応答が失敗し、リスクは解消されていません。リスクを回避するために、後で適切な時間 (この操作から 12 時間以上経過後が望ましい) にインスタンスを再起動することを推奨します。 |
SystemMaintenance.Stop | システムメンテナンスによるインスタンスの停止 | クリティカル |
| Alibaba Cloud は、RDS Custom インスタンスがデプロイされているホストで、潜在的なソフトウェアまたはハードウェアの障害リスクを検出します。これらのリスクにより、RDS Custom インスタンスがシャットダウンして停止する可能性があります。このリスクはまだ直接的な障害にはなっていません。このシステムイベントは、スケジュールされたシステムメンテナンス時刻の 24~48 時間前に送信されます。 | |
SystemMaintenance.Redeploy | システムメンテナンスによるインスタンスの再デプロイ | クリティカル |
| Alibaba Cloud は、RDS Custom インスタンスがデプロイされているホストで、潜在的なソフトウェアまたはハードウェアの障害リスクを検出します。これらのリスクにより、RDS Custom インスタンスが再デプロイされる可能性があります。このリスクはまだ直接的な障害にはなっていません。このシステムイベントは、スケジュールされたシステムメンテナンス時刻の 24~48 時間前に送信されます。 重要 ローカル SSD ディスクまたはローカル HDD ディスクを使用するインスタンスでは、データディスクが再初期化され、ローカルディスク上のデータは削除されます。 | /etc/fstab 構成ファイルの変更やデータのバックアップなどの準備を完了することを推奨します。その後、ニーズに応じて以下のいずれかの応答方法を選択します。
説明 イベントのステータスの変化に注意を払うことを推奨します。インスタンスを再デプロイしてもイベントのステータスが変わらない場合、イベントへの応答が失敗し、リスクは解消されていません。リスクを回避するために、後で適切な時間 (この操作から 12 時間以上経過後が望ましい) にインスタンスを再デプロイすることを推奨します。 |
SystemFailure.Redeploy | システムエラーによるインスタンスの再デプロイ | クリティカル |
| Alibaba Cloud が、基盤となるホストのソフトウェアまたはハードウェアの障害により RDS Custom インスタンスを再デプロイする必要があると判断した場合、このシステムイベントは即座に送信されます。 説明 ローカルディスクがアタッチされたインスタンスや SGX 暗号化コンピューティングをサポートするインスタンスなど、ホストのハードウェアに依存するインスタンスのみがこのタイプのイベントをサポートします。 | /etc/fstab 構成ファイルの変更やデータのバックアップなどの準備を完了することを推奨します。その後、ニーズに応じて以下のいずれかの応答方法を選択します。
|
SystemMaintenance.CleanReleasedDisks | インスタンスはリリースされたディスクの構成情報をクリーンアップする必要があります | 警告 |
| Alibaba Cloud が、RDS Custom インスタンスのオペレーティングシステムに、支払い遅延のためにリリースされた 1 つ以上のディスクの構成情報が含まれていると判断した場合、このシステムイベントが送信されます。 | 適切な時間を選択して、Alibaba Cloud がリリースされたディスクの構成情報をクリーンアップすることを承認することを推奨します。 重要 Alibaba Cloud は、お客様が承認した指定時刻にインスタンスをシャットダウンし、ディスクをクリーンアップしてから、インスタンスを再度起動します。 |
予期しない O&M イベント
イベントコード | イベント名 | イベントレベル | CloudMonitor イベント名 | イベントの説明と影響 | 対処方法の提案 |
SystemFailure.Reboot | システムエラーによるインスタンスの再起動 | クリティカル |
| Alibaba Cloud が、基盤となるホストの予期しないソフトウェアまたはハードウェアの障害 (CPU またはメモリのハードウェア損傷など) により RDS Custom インスタンスが再起動されたと判断した場合、このシステムイベントは即座に送信されます。 | インスタンスが自動的に再起動するのを待ってから、インスタンスとアプリケーションが正常に機能しているか確認することを推奨します。 再起動プロセス中に、Alibaba Cloud はインスタンスを別の正常なホストに移行します。 |
InstanceFailure.Reboot | オペレーティングシステムエラーによるインスタンスの再起動が必要 | クリティカル |
| Alibaba Cloud が、メモリ不足、ブルースクリーン、フリーズ、継続的なシリアルポートのログ出力、またはカーネルパニックなど、内部のオペレーティングシステムの問題により RDS Custom インスタンスがクラッシュしたと判断した場合、このシステムイベントは即座に送信されます。 | インスタンスが自動的に再起動するのを待ってから、インスタンスとアプリケーションが正常に機能しているか確認することを推奨します。 オペレーティングシステムで Kdump サービスを有効にすると、クラッシュの原因をトラブルシューティングし、将来同様の問題を回避できます。詳細については、「Linux インスタンスで Kdump サービスを有効にする方法」をご参照ください。 |
SystemFailure.Stop | システムエラーによるインスタンスの停止 | クリティカル |
| Alibaba Cloud が、基盤となるホストのソフトウェアまたはハードウェアの障害 (CPU またはメモリのハードウェア損傷など) により RDS Custom インスタンスがシャットダウンされたと判断した場合、このシステムイベントは即座に送信されます。 | インスタンスが自動的に停止するのを待ってから、インスタンスを起動することを推奨します。 インスタンスを起動すると、Alibaba Cloud はそれを別の正常なホストに移行します。 |
SystemFailure.Delete | インスタンス作成失敗による請求の自動キャンセル | クリティカル |
| Alibaba Cloud が、RDS Custom インスタンスの注文は成功したものの作成に失敗したと判断した場合、このシステムイベントは即座に送信されます。 | システムがインスタンスを自動的にリリースするのを待つことを推奨します。これは通常、作成失敗後 5 分以内に発生します。 説明 注文の支払いが済んでいる場合、インスタンスがリリースされた後に返金されます。 |
InstanceFailure.PerformanceImpact | インスタンスエラーによるインスタンスのパフォーマンス低下 | 警告 |
| インスタンス内で予期しない例外 (GuestOS カーネルのハングなど) が発生し、インスタンスのパフォーマンスが低下した場合、このシステムイベントは即座に送信されます。 | インスタンスにログインして例外を特定して解決し、このシステムイベントのステータスを監視することを推奨します。システムイベントが報告されなくなった場合、パフォーマンスの低下が解決されたことを示します。 |