すべてのプロダクト
Search
ドキュメントセンター

Cloud Monitor:ログモニタリング機能を使用したログキーワードのモニタリングとアラートルールの設定

最終更新日:May 15, 2024

CloudMonitorのログモニタリング機能を使用して、Simple log Serviceによって収集されたログに特定のキーワードが表示される回数を計算できます。 ログモニタリング機能を使用して、キーワードのアラートルールを設定することもできます。 キーワードが表示される回数が指定された条件を満たす場合、アラートがトリガーされます。 このトピックでは、ログ内の特定のキーワードを監視するためのメトリックを作成する方法と、キーワードのアラートルールを設定する方法について説明します。

重要

ログモニタリング機能は、2022年9月13日22:00:00より前にサブスクリプションCloudMonitor Basic (cms_edition) を購入したユーザー、または従量課金制CloudMonitor Basic (cms_post) を有効化したユーザーのみが利用できます。 ログモニタリング機能は、2024年9月14日から利用できなくなります。 Hybrid Cloud monitoringのSimple Log Serviceログモニタリング機能の使用を推奨します。

前提条件

オンプレミスログは収集され、Simple Log Serviceに保存されます。 詳細については、「Simple Log Service」をご参照ください。

背景情報

次の例は、Simple Log Serviceによって収集されるサンプルログを示しています。

2017-06-21 14:38:05 [INFO] [impl.FavServiceImpl] execute_failと実行時間は100msuserid=
2017-06-21 14:38:05 [WARN] [impl.ShopServiceImpl] execute_fail、待機時間200ms
2017-06-21 14:38:05 [INFO] [impl.ShopServiceImpl] execute_failおよび実行時間は100ms、reason:user_id invalid
2017-06-21 14:38:05 [情報] [impl.FavServiceImpl] execute_success, wait moment ,reason:user_id invalid
2017-06-21 14:38:05 [WARN] [impl.UserServiceImpl] execute_fail、実行時間はmsuserid=100
2017-06-21 14:38:06 [WARN] [impl.FavServiceImpl] execute_fail, wait moment userid=
2017-06-21 14:38:06 [ERROR] [impl.UserServiceImpl] userid=, action=, test=, wait moment ,reason:user_id invalid
2017-06-21 14:38:06 [ERROR] [impl.ShopServiceImpl] execute_success:send msg、200ms 

この例では、ERRORをキーワードとして使用して、ログモニタリング機能を使用してメトリックを作成し、キーワードをモニタリングするアラートルールを設定する方法を説明します。 キーはレベルで、値はログの内容です。 次の表に、サンプルログから抽出されるキーと値のペアを示します。

キー

level

2017-06-21 14:38:05 [INFO] [impl.FavServiceImpl] execute_failおよび実行時間は100msuserid=

level

2017-06-21 14:38:05 [WARN] [impl.ShopServiceImpl] execute_fail、待機時間200ms

level

2017-06-21 14:38:06 [ERROR] [impl.ShopServiceImpl] execute_success:send msg,200ms

手順

  1. オプション。 CloudMonitorにSimple Log Serviceへのアクセス権限を付与します。

    初めてログモニタリング機能を使用するときは、CloudMonitorにSimple log Serviceにアクセスする権限を付与する必要があります。

    1. にログインします。CloudMonitorコンソール.

    2. 左側のナビゲーションウィンドウで、[アクセスセンター] > [ログモニタリング] を選択します。

    3. では、CloudMonitorのサービスにリンクされたロールダイアログボックスで、OK.

  2. levelフィールドの値にキーワードERRORが含まれるログを監視するためのログ監視メトリックを作成します。

    1. の左上隅にログモニタリングページをクリックします。ログ監視メトリックの作成.

    2. では、リソースの関連付けステップ、パラメータを設定し、次へ.

      パラメーター

      説明

      リージョン

      Simple Log Serviceプロジェクトが存在するリージョン。

      プロジェクト

      Simple Log Serviceプロジェクトの名前。

      ログストア

      Simple Log Service Logstoreの名前。

    3. では、メトリックの定義ステップ、パラメータを設定し、次へ.

      パラメーター

      説明

      メトリック名

      メトリックの名前。

      ユニット

      メトリックの単位

      コンピューティングサイクル

      メトリックの統計期間。 単位は分です。 有効な値: 1、2、3、4、5、10、15、20、30、および60。

      統計的方法

      統計期間内のログデータを集計するために使用される関数。 指定されたフィールドの値が数値の場合、すべての統計方法を使用できます。 それ以外の場合は、Countメソッドとcountpsメソッドのみを使用してログデータを集計できます。 有効な値:

      • Count: 統計期間内の指定されたフィールドの値の数を計算します。

      • Sum: 指定されたフィールドの値の直前の合計を計算します。

      • Max: 統計期間内の指定されたフィールドの最大値を計算します。

      • Min: 統計期間内の指定されたフィールドの最小値を計算します。

      • Average: 統計期間内の指定されたフィールドの値の平均を計算します。

      • countps: 指定されたフィールドの値の数を統計期間内の合計秒数で割った値を計算します。

      • sumps: 指定されたフィールドの値の合計を、統計期間内の合計秒数で割った値を計算します。

      • distinct: 統計期間内の指定されたフィールドの一意の値の数を計算します。

      拡張フィールド

      計算結果に対して基本的な操作を実行します。 たとえば、統計方法パラメーターを設定してログデータを集計した後、HTTPリクエストの総数を計算するためにTotalNumberとしてフィールドを指定します。 同時に、別のフィールドを5xxNumberとして指定して、ステータスコードが499を超えるHTTPリクエストの数を計算します。 この場合、拡張フィールドを指定して、次の式を使用してサーバーエラー率を計算できます: 5XXNumber/TotalNumber × 100% 。

      ログフィルター

      ログデータをフィルタリングします。 このパラメーターは、SQLのWHERE句に相当します。 たとえば、levelフィールドの値がERRORであるログを監視する場合、パラメーターをlevel>=ERRORに設定します。

      データのフィルタリングに使用するログフィールドの名前には、漢字を含めることはできません。

      グループ単位

      集計されるデータに基づくディメンション。 このパラメーターは、SQLのGROUP BY句に相当します。

      ログデータは、指定されたディメンションごとにグループ化されます。 ディメンションを指定しない場合、指定された集計関数に基づいてすべてのデータが集計されます。

      詳細については、「GROUP BY句」をご参照ください。

      SQLの選択

      指定した統計メソッドをSQL文に変換します。 このパラメーターは、データの処理方法を示します。

      アプリケーショングループ

      アプリケーショングループの名前。 指定されたアプリケーショングループにメトリックが追加されます。

    4. [アラートルールの設定] ステップで、キーワードERRORを監視するアラートルールを設定し、[次へ] をクリックします。

      パラメーター

      説明

      アラートルール

      アラートルールの名前です。

      ルールの説明

      アラートをトリガーする条件。 メトリックが指定された条件を満たす場合、アラートがトリガーされます。

      アラートレベル

      アラート通知方法。 有効な値:

      メール + Webhook

      しきい値を超えたときにトリガーされます

      しきい値を超えた連続回数。 指定した制限を超えると、アラート送信先グループのアラート送信先がアラート通知を受信します。 有効な値: 1、3、5、10、15、30、60、90、120、および180。

      ミュート用

      CloudMonitorがアラート通知を再送信してからアラートがクリアされるまでの間隔。 有効な値: 5分、15分、30分、60分、3時間、6時間、12時間、24時間。

      しきい値を超えると、CloudMonitorはアラート通知を送信します。 ミュート期間内に再びしきい値を超えた場合、CloudMonitorはアラート通知を再送信しません。 ミュート期間が終了してもアラートがクリアされない場合、CloudMonitorはアラート通知を再送信します。

      有効期間

      アラートルールが有効になっている期間。 CloudMonitorは、指定された期間内にのみアラートルールに基づいてメトリックを監視します。

      アラートコールバック

      インターネット経由でアクセスできるコールバックURL。 CloudMonitorは、指定したコールバックURLにアラート通知をプッシュするPOSTまたはGETリクエストを送信します。 HTTPリクエストのみサポートされています。 アラートコールバックを設定する方法については、「アラートコールバック機能を使用してしきい値トリガーアラートに関する通知を送信する」をご参照ください。

    5. では、作成結果ステップ、クリック閉じる.

  3. キーワードERRORのモニタリングデータを表示します。

    ログモニタリング指標を作成したら、3〜5分待ちます。 [ログモニタリング] ページで、モニタリングチャートを表示するメトリックを見つけ、[操作] 列の监控图表アイコンをクリックします。

  4. キーワードERRORに対して送信されるアラート通知を表示します。

    Simple log Serviceにエラーレベルのログが表示されると、CloudMonitorはアラート通知を送信します。