イベントセンターを使用して、Alibaba Cloud Elasticsearch (ES) のシステム O&M イベントを表示できます。これにより、サービス異常を迅速に検出し、問題を迅速に分析して特定できます。このトピックでは、ES のイベントカテゴリと、イベントの表示および処理方法について説明します。
イベントカテゴリ
ES イベントは、原因と影響によって次のように分類されます。
詳細については、「付録: イベント詳細」をご参照ください。
イベントカテゴリ | 定義 | 原因と影響 | 例 |
システム変更 | システム変更イベントは Alibaba Cloud によって開始されます。これらのイベントは通知され、クラスターが影響を受けるかどうかを確認する必要があります。 | インフラストラクチャの変更または障害によって引き起こされるシステム変更イベントは、クラスターのアクセスに影響を与える可能性があります。このタイプのイベントがトリガーされると、システムは通知を送信します。通知とクラスターのステータスを迅速に確認してください。 |
|
クラスタの健全性 | システムは実際の使用状況に基づいてクラスターのヘルスを定期的に検査します。予期しない診断結果をイベントとして表示します。 | Alibaba Cloud サービスの持続可能性を確保するために、システムはクラスターリソースの異常またはリスクを検出すると、クラスターヘルスイベントを自動的にトリガーします。これにより、影響が最小限に抑えられます。 説明 O&M イベントの実行中、クラスターは一時的なジッターを経験する可能性がありますが、通常のアクセスには影響しません。自動実行が失敗した場合、イベントセンターページで手動でノードの再起動をトリガーできます。手動介入ウィンドウは 24〜 | 検査により ES ノードがオフラインであることが検出されました。 |
クラスタ変更 | これらは、クラスターを変更するために開始する操作イベントです。変更プロセス中に障害またはブロックが発生する可能性があります。 | インスタンスタイプの変更またはカーネルのアップグレードによって引き起こされるクラスター変更イベントは、対応するノードの再起動をトリガーします。O&M イベントの実行中、クラスターは一時的なジッターを経験する可能性がありますが、通常のアクセスには影響しません。 |
|
イベントの表示と処理
イベントセンターページでは、現在のアカウントで生成されたイベントに関する情報を表示し、必要に応じて処理できます。
イベントセンターに移動します。
Alibaba Cloud Elasticsearch コンソールにログインします。
左側のナビゲーションウィンドウで、イベントセンター をクリックします。
イベント情報を表示します。
イベントセンター ページでは、条件でフィルターして、指定した期間内の選択したタイプのターゲットインスタンスのすべてのイベントを表示できます。その後、イベントの詳細に基づいて操作を実行できます。
説明イベントセンターですべてのイベント情報を表示できます。また、イベントをサブスクライブし、迅速な処理が必要な重大なアラートに対して通知を設定することもできます。アラートがトリガーされると、システムは指定されたアラート連絡先に電話、ショートメッセージ、またはメールでアラート通知を自動的に送信します。
イベント情報と関連する処理操作を次の表に示します。
イベント情報
説明
クラスター ID
イベントを生成した Alibaba Cloud ES インスタンスの ID。
ノード ID
イベントを生成したインスタンスノードの ID。
イベントレベル
イベントの重大度。レベルには次のものがあります。
情報: 通常の操作中のシステムのステータスまたは操作を記録します。多くの場合、システムのステータス監視またはデバッグに使用されます。
アラート: システムに潜在的な問題または異常が存在しますが、現在の操作には影響しません。継続的な監視が必要です。
重大: システムで重大なエラーまたは障害が発生しました。直ちに処理する必要があります。そうしないと、サービスの利用不可またはデータの損失が発生する可能性があります。
イベントステータス
イベントの実行ステータス。ステータスには、待機中、実行中、実行されました、実行に失敗しました、実行中断、キャンセル済み、実行の確認待ち、および 変更保留中 があります。その中で:
待機中: イベントは、システム設定時刻またはスケジュールされた時刻に実行されるのを待っています。
実行の確認待ち: イベントの詳細に基づいて、イベントをすぐに実行するか、イベントのスナップショットバックアップを作成するかを決定できます。
説明システム変更イベントのローカルディスクに関連する一部のイベントのみがこのステータスをサポートします。
ES クラスターのアップグレードや指定されたノードへの新しいバージョンのデプロイなどのデプロイメントイベントのみが、スナップショットバックアップをサポートします。
変更保留中: 現在の変更タスクはグレースケール変更を完了しました。変更されたノードとクラスターの安定性を確認し、後続のタスクを実行するかどうかを決定する必要があります。たとえば、変更操作は最初に一部のノードでテストする必要があります。小規模な範囲で変更が検証された後、すべてのノードで実行されます。
実行に失敗しました または 実行中断 状態のイベントについては、原因を特定し、通常のビジネス運用に影響を与えないように迅速に処理してください。
イベントの説明
イベントの原因と影響。
発生時間 および 終了日時
イベント実行の開始時刻と終了時刻。
スケジュールされた実行時間 および 実行終了日時
イベントのスケジュールされた開始時刻と推定終了時刻。
説明システム変更イベントのみがこの設定をサポートします。
ソース
イベントのソース。ソースには次のものがあります。
プロアクティブ通知: ES はイベントが生成された後、イベントセンターにイベントをプロアクティブにプッシュします。
イベントサブスクリプション: 指定されたイベントをリッスンするためにサブスクライブします。イベントが発生すると、システムは対応する通知を受信します。
推奨操作
推奨される操作に基づいて関連イベントを処理できます。サポートされている処理操作はイベントによって異なります。実際のインターフェイスが優先されます。
[テクニカルサポートへのお問い合わせ]: イベントについて質問がある場合は、テクニカルサポートに連絡して相談できます。
再起動: 関連インスタンスの指定されたノードを直ちに再起動します。
再起動の予約: 再起動時刻を指定する必要があります。システムは、スケジュールされた時刻に関連インスタンスの指定されたノードを再起動します。ノードの再起動時刻は、スケジュールされた時刻より少なくとも
5分後でなければなりません。システムは、スケジュールされた時刻から5分以内にノードを再起動します。
説明現在のインスタンスまたはノードで 再起動、強制再起動、またはグレースケール再起動 を実行すると、システムはそのインスタンスまたはノードの再起動イベントの実行を自動的にトリガーします。ただし、ES バージョンのアップグレードなどの再デプロイメントイベントについては、引き続きチケットを送信してテクニカルサポート担当者に連絡する必要があります。
付録: イベント詳細
イベントタイプ | イベントコードと名前 | イベントレベル | CloudMonitor イベント名 | 説明と影響 |
システム変更イベント |
| 致命的 |
| インフラストラクチャの障害により、ローカルディスクが利用できなくなります。 |
| 致命的 |
| インフラストラクチャの障害により、クラウドディスクのパフォーマンスが低下します。 | |
| 致命的 |
| 潜在的なインフラストラクチャの障害により、インスタンスが停止する可能性があります。 | |
| 致命的 |
|
| |
| 警告 |
|
| |
クラスターヘルスイベント |
| 致命的 |
| 異常なクラスター状態により、インスタンスが再起動します。 |
クラスター変更イベント |
| 情報 |
|
|
| 情報 |
|
| |
| 情報 |
| カーネルバージョンの更新により、インスタンスが再起動します。 |