すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:CloudMonitor での EAS イベントの表示

最終更新日:Jul 01, 2026

EAS は CloudMonitor で 2 つのイベントタイプ (ServiceServiceInstance) を定義しています。EAS イベントコントローラーは、これらのイベントを CloudMonitor にリアルタイムでプッシュします。その後、CloudMonitor コンソールまたは API を使用して、イベントを表示し、運用、監査、またはアラートのためのルールを設定できます。

EAS イベントの表示

コンソールの使用

CloudMonitor コンソールで EAS イベントを表示するには、次の手順を実行します。

  1. CloudMonitor コンソール にログインします。

  2. 左側のナビゲーションウィンドウで、イベントセンター > Systemイベント.

  3. イベントモニタリング タブで、[プロダクト] に [PAI-EAS (廃止)] を選択し、[検索] をクリックして EAS システムイベントを表示します。

    image

  4. 対象イベントの アクション 列で、詳細 をクリックします。以下は例です。image

    パラメータ

    パラメータ

    説明

    Product

    プロダクトコード。PAI の場合、コードは learn です。

    Name

    イベント名。サポートされているイベント名のリストについては、「付録:サポートされている EAS イベント」の [イベント名] 列をご参照ください。

    Level

    イベントレベル。設定可能な値:

    • INFO :情報。

    • WARN :警告。

    • CRITICAL :重大。

    RegionId

    サービスが配置されているリージョンの ID。例:中国 (上海) の場合は cn-shanghai

    ResourceId

    リソース ID。詳細については、「ポリシーの説明」をご参照ください。

    InstanceName

    サービスまたは Pod インスタンスの名前。

    Time

    イベントが発生した時刻 (UNIX ミリ秒タイムスタンプ形式)。

    GroupId

    EAS サービスに対応する CloudMonitor アプリケーショングループ。デフォルトではグループは割り当てられません。

    Content

    イベントのコアコンテンツ。

    • サービスレベルイベント:文字列。

    • Pod インスタンスレベルイベント:JSON オブジェクト。詳細については、「Content パラメータ」をご参照ください。

    Content パラメータ

    パラメータ

    説明

    serviceName

    インスタンスが属するサービスの名前。

    serviceId

    インスタンスが属するサービスの ID。

    serviceGroup

    インスタンスが属するサービスグループ。

    resourceType

    インスタンスが配置されているリソースグループのタイプ。設定可能な値:

    • PublicResource :パブリックリソースグループ。

    • DedicatedResource :専用リソースグループ。

    instanceType

    インスタンスタイプ。

    cpu

    インスタンスが使用する CPU 数。

    memory

    インスタンスのメモリサイズ (MB 単位)。

    gpu

    インスタンスが使用する GPU 数。

    gpuMemory

    インスタンスの GPU メモリサイズ (GB 単位)。

    nvidiaName

    インスタンスが使用する GPU の名前。

    role

    インスタンスのサービスロール。設定可能な値:

    • Queue :キューサービス。

    • DataLoader :オフラインサービス。

    • Standard :標準サービス。

    isBurst

    インスタンスが Burstable によって管理されているかどうかを示します。設定可能な値:

    • falseBurstable はインスタンスを管理していません。つまり、そのリソースグループでオートスケーリングが無効になっています。

    • trueBurstable はインスタンスを管理しています。つまり、そのリソースグループでオートスケーリングが有効になっています。

    isSpot

    インスタンスがスポットインスタンスかどうかを示します。設定可能な値:

    • false :インスタンスはスポットインスタンスではありません。

    • true :インスタンスはスポットインスタンスです。

    callerUid

    EAS サービスを作成したユーザーの UID。

    timestamp

    コンテナの最終起動時刻。

    restartCount

    インスタンスが再起動された回数。

    exitCode

    インスタンスの終了コード。デフォルトでは空です。

    reason

    イベントの理由。

    message

    イベントメッセージ。

API の使用

DescribeSystemEventAttribute API を使用して EAS イベントを表示することもできます。

アラートルールの作成と有効化

コンソールの使用

  1. システムイベントのアラートルールを作成します。次の主要なパラメータを設定します。

    • [プロダクトタイプ]: [PAI-EAS (廃止)] を選択します。

    • Event TypeServiceInstance または Service を選択します。

    • イベントレベル:ビジネス要件に基づいて 1 つ以上のイベントレベルを選択します。

    • [イベント名]:監視する 1 つ以上のイベント名を選択します。説明については、「付録」をご参照ください。

    • キーワードフィルタリング: イベントの content フィールドに基づいてイベントをフィルタリングするキーワードを指定します。

    image

  2. システムイベントアラートのコールバックを使用します。

API の使用

API を使用してアラートルールを作成および有効化することもできます。詳細については、「イベントのアラートルールの作成」および「イベントアラートルールの有効化」をご参照ください。

よくある質問

サービスインスタンスとは推論サービスを指しますか、それとも Pod インスタンスを指しますか。

Service イベントタイプはサービスレベルイベントを表します。ServiceInstance イベントタイプは Pod インスタンスレベルイベントを表します。この文脈では、サービスインスタンスは Pod インスタンスを指します。

付録:サポートされている EAS イベント

EAS は次のサービスレベルおよび Pod インスタンスレベルのイベントを定義しています。

イベントタイプ

イベント名

説明

イベントレベル

ServiceInstance

EAS:ServiceInstance:Running

Pod インスタンスは実行中です。

INFO

EAS:ServiceInstance:Pending

Pod インスタンスはスケジューリング待機中です。

INFO

EAS:ServiceInstance:Completed

Pod インスタンスは完了しました。

INFO

EAS:ServiceInstance:Terminating

Pod インスタンスは削除中です。

INFO

EAS:ServiceInstance:Terminated

Pod インスタンスは削除されました。

INFO

EAS:ServiceInstance:Unknown

Pod インスタンスで不明な例外が発生しました。

WARN

EAS:ServiceInstance:Evicted

Pod インスタンスは退避されました。

WARN

EAS:ServiceInstance:ErrImagePull

Pod インスタンスのイメージのプル中にエラーが発生しました。

WARN

EAS:ServiceInstance:ImagePullBackOff

Pod インスタンスのイメージのプルに失敗しました。

WARN

EAS:ServiceInstance:CrashLoopBackOff

Pod インスタンスがクラッシュしました。

CRITICAL

EAS:ServiceInstance:Error

Pod インスタンスで内部エラーが発生しました。

CRITICAL

EAS:ServiceInstance:Failed

Pod インスタンスの実行に失敗しました。

CRITICAL

EAS:ServiceInstance:SpotToBeReleased

スポットインスタンスはまもなくリリースされます。

WARN

Service

EAS:Service:ReplicasChanged

サービスレプリカ数が変更されました。

INFO

EAS:Service:StatusChanged

サービスステータスが変更されました。

INFO

EAS:Service:Unavailable

サービスは利用できません。

CRITICAL

EAS:Service:UpdateFailed

サービスの更新に失敗しました。

CRITICAL