すべてのプロダクト
Search
ドキュメントセンター

:アラートOpsCenterの概要

最終更新日:Jan 03, 2025

Alert OpsCenterは、ビジネス中心のアラート管理およびO&Mプラットフォームです。 ZabbixやPrometheusなどのサードパーティのモニタリングプラットフォームによって生成されるアラート、およびSimple Log Serviceリソースによって生成されるアラートをビジネスに追加できます。 これにより、ビジネスを使用してアラートを管理し、アラート通知を統合的に送信し、O&M効率を向上させることができます。 このトピックでは、Alert OpsCenterのアーキテクチャと機能について説明します。

アーキテクチャ

Simple Log Service Alert OpsCenterでは、ビジネスごとにアラートを管理できます。 各ビジネスには、リソース層から始まり、インシデント管理で終わる完全なパイプラインが含まれます。

Business architecture

  • リソース層: コンピューティング、ストレージ、ネットワークリソース (ホスト、仮想マシン、Server Load Balancer (SLB) リソース、Javaアプリケーション、Goアプリケーションなど) が含まれます。

  • メトリックレイヤー: 時系列データ、ログデータ、トレースデータが含まれます。 メトリクスは、各リソースのヘルスステータスを示すことができます。

  • モニタリング層: Zabbix、Prometheus、Simple Log Serviceのアラートモニタリングシステム、Simple Log Serviceのインテリジェント検査機能などのモニタリングツールを使用して、メトリックをモニタリングするアラートモニタリングルールを作成できます。 たとえば、高いCPU使用率と、ネットワークトラフィックの一時的で急激な増加を監視できます。

  • 可視化レイヤー: トリガーされたアラートの数、アラートの処理ステータス、アラート通知のステータスなど、さまざまなリソースのアラートステータスを表示するための可視化されたレポートを提供します。

  • アラート通知: アラートがトリガーされると、Simple Log Serviceは指定されたアクションポリシーに基づいてアラート通知を送信します。 Simple Log Serviceは、SMSメッセージ、音声通話、DingTalk、カスタムWebフック、EventBridge、およびFunction Computeを使用して、指定されたユーザーにアラート通知を送信できます。 Simple Log Serviceがアラート通知を送信する前に、アラートポリシーを使用してアラートのノイズを除去できます。

  • インシデント管理: アラートがアラート管理システムに送信された後、アラートはルート統合ポリシーに基づいてさまざまなセットにマージされます。 インシデントは、セットごとに自動的に作成されます。 O&Mエンジニアは、さまざまなアラートインシデントを管理できます。 たとえば、インシデントのステータスを解決済み、確認済み、または無視に変更できます。 インシデントハンドラーを指定することもできます。

特徴

アラートOpsCenterは、次の機能を提供します。

  • アラートソースの統合: アラートソースは、ビジネスのアラートのソースです。 アラートソースには、Log Businessリソースとサードパーティのアラートソースが含まれます。 次の方法を使用して、アラートソースを統合できます。

    • 垂直アラートソース

      テクニカル展開に基づいてアラートソースを統合できます。 たとえば、アクセス層、コンピューティング層、およびストレージ層のリソースを使用する場合、統合管理のためにリソースをビジネスに追加できます。

    • 水平アラートソース

      O&M要件に基づいてアラートソースを統合できます。 たとえば、データベースO&MチームがすべてのRDSインスタンスを管理したい場合は、統合管理のためにRDSインスタンスのデータをビジネスに追加できます。

    • サードパーティの警告ソース

      企業にZabbixやPrometheusなどの監視プラットフォームが1つ以上ある場合、企業は監視プラットフォームによって生成されたアラートデータを企業に追加して、統合管理を行うことができます。

  • ビジネスポリシー: Alert OpsCenterでは、アラートをマージ、抑制、または無音にするようにビジネスポリシーを設定できます。 ビジネスポリシーは、有効、無効、混合の3つの設定モードをサポートしています。

    • 有効にする

      有効化モードでは、現在の業務用に設定されているアラートポリシーとアクションポリシーが適用されます。 ビジネスのアラートソースが、アラートセンターで使用可能なアラートポリシーおよび使用可能なアクションポリシーに関連付けられている場合、アラートソースに関連付けられているポリシーは無効になります。

    • Disable

      無効モードでは、現在の業務用に設定されているアラートポリシーとアクションポリシーは適用されません。 ビジネスのアラートソースが、アラートセンターで使用可能なアラートポリシーと使用可能なアクションポリシーに関連付けられている場合、アラートソースに関連付けられているポリシーが有効になります。

    • 混合

      ビジネスのアラートソースが、アラートセンターで使用可能なアラートポリシーおよび使用可能なアクションポリシーに関連付けられている場合、アラートソースに関連付けられているポリシーおよびビジネスに設定されているポリシーはすべて有効になります。

  • インシデント管理: インシデントのステータスを、確認済み、無視済み、または解決済みに変更できます。 インシデントハンドラーを指定することもできます。

  • アラートステータスダッシュボード: Alert OpsCenterには、アラートソースのステータス、またはビジネスでトリガーされたアラートとアラートステータスの詳細を表示する [アラートステータス] ダッシュボードがあります。

  • トラブルシューティングダッシュボード: Alert OpsCenterでは、Global Alert Pipeline Center、Global Alert Rule Center、Global Alert Troubleshooting Center、Pub Alert Centerなどのトラブルシューティングダッシュボードを提供します。 上記のダッシュボードには、アラートに関する情報が表示されます。