All Products
Search
Document Center

Platform For AI:Event EAS di CloudMonitor

Last Updated:Jun 26, 2026

Elastic Algorithm Service (EAS) mendefinisikan dua jenis event untuk CloudMonitor: event layanan (Service) dan event instans layanan (ServiceInstance). EAS mendorong event-event tersebut ke CloudMonitor secara real time. Anda dapat melihatnya di Konsol CloudMonitor atau dengan memanggil operasi API untuk O&M, audit, atau konfigurasi alert.

Lihat event EAS

Konsol

Ikuti langkah-langkah berikut untuk melihat event EAS di Konsol CloudMonitor.

  1. Masuk ke Konsol Cloud Monitor.

  2. Di panel navigasi, pilih Event Center > System Event.

  3. Pada tab Event Monitoring, pilih PAI untuk Product, lalu klik Search untuk melihat event sistem EAS.

    image

  4. Pada kolom Actions suatu event, klik Details. Gambar berikut menunjukkan contohnya.image

    Deskripsi parameter

    Parameter

    Deskripsi

    Product

    Kode produk. Misalnya, kode untuk Platform for AI (PAI) adalah learn.

    Name

    Nama event. Untuk informasi lebih lanjut mengenai nama event yang didukung oleh PAI, lihat kolom Name di Lampiran: Event EAS yang Didukung.

    Level

    Tingkat event. Nilai yang valid:

    • INFO: informasi

    • WARN: peringatan

    • CRITICAL: kritis

    Status

    Status event. Untuk informasi lebih lanjut mengenai status event PAI, lihat kolom Status di Lampiran: Event EAS yang Didukung.

    RegionId

    ID wilayah tempat layanan berada. Misalnya, cn-shanghai menunjukkan wilayah Tiongkok (Shanghai).

    ResourceId

    ID resource. Untuk informasi lebih lanjut, lihat Elemen kebijakan.

    InstanceName

    Nama layanan atau instans layanan.

    Time

    Waktu terjadinya event, dalam format UNIX millisecond timestamp.

    GroupId

    Kelompok aplikasi CloudMonitor yang sesuai dengan EAS. Secara default, tidak ada kelompok yang dibuat.

    Content

    Isi inti dari event.

    • Untuk event tingkat layanan, nilainya berupa string.

    • Untuk event tingkat instans layanan, nilainya dalam format JSON. Untuk detailnya, lihat tabel Deskripsi parameter Content di bawah.

    Deskripsi parameter Content

    Parameter

    Deskripsi

    serviceName

    Nama layanan tempat instans tersebut berada.

    serviceId

    ID layanan tempat instans tersebut berada.

    serviceGroup

    Kelompok layanan tempat instans tersebut berada.

    resourceType

    Jenis kelompok sumber daya tempat instans tersebut berada. Nilai yang valid:

    • PublicResource: kelompok sumber daya publik.

    • DedicatedResource: kelompok sumber daya khusus.

    instanceType

    Tipe instans.

    cpu

    Jumlah vCPU yang digunakan oleh instans.

    memory

    Ukuran memori instans. Satuan: MB.

    gpu

    Jumlah GPU yang digunakan oleh instans.

    gpuMemory

    Ukuran memori GPU instans. Satuan: GB.

    nvidiaName

    Nama GPU yang digunakan oleh instans.

    role

    Peran layanan tempat instans tersebut berada. Nilai yang valid:

    • Queue: layanan antrian.

    • DataLoader: layanan offline.

    • Standard: layanan reguler.

    isBurst

    Menunjukkan apakah instans dikelola oleh fitur auto scaling. Nilai yang valid:

    • false: Fitur auto scaling dinonaktifkan untuk kelompok sumber daya tempat instans tersebut berada.

    • true: Fitur auto scaling diaktifkan untuk kelompok sumber daya tempat instans tersebut berada.

    isSpot

    Menunjukkan apakah instans merupakan spot instans. Nilai yang valid:

    • false: Instans bukan spot instans.

    • true: Instans merupakan spot instans.

    callerUid

    UID pengguna yang membuat layanan EAS.

    timestamp

    Waktu saat kontainer terakhir dimulai.

    restartCount

    Jumlah kali instans telah direstart.

    exitCode

    Kode keluar instans. Nilai default-nya null.

    status

    Status instans. Untuk informasi lebih lanjut mengenai nilai yang valid, lihat kolom Status di Lampiran: Event EAS yang Didukung.

    reason

    Penyebab event.

    message

    Pesan event.

API

Anda juga dapat memanggil operasi DescribeSystemEventAttribute untuk mengkueri event EAS.

Buat dan aktifkan aturan alert

Konsol

  1. Buat aturan alert untuk event sistem. Tabel berikut menjelaskan parameter utama.

    • Product Type: Pilih PAI.

    • Event Type: Pilih ServiceInstance atau Service.

    • Event Level: Pilih satu atau beberapa tingkat event sesuai kebutuhan bisnis Anda.

    • Event Name: Pilih nama event yang ingin dipantau. Anda dapat memilih satu atau beberapa nama event. Untuk informasi lebih lanjut, lihat kolom Description di Lampiran.

    • Keyword Filtering: Tentukan kata kunci untuk menyaring event berdasarkan pencocokan bidang content.

    image

  2. atau gunakan callback untuk alert pada event sistem.

API

Anda juga dapat memanggil operasi API untuk membuat dan mengaktifkan aturan alert untuk suatu event. Untuk informasi lebih lanjut, lihat Buat aturan alert untuk event dan Aktifkan aturan alert untuk event.

FAQ

Instans layanan: inference service atau pod?

Event Service adalah event tingkat layanan. Event ServiceInstance adalah event tingkat instans layanan. Dalam topik ini, instans layanan mengacu pada instans pod.

Lampiran: Event EAS yang Didukung

EAS mendefinisikan event tingkat layanan dan tingkat instans layanan berikut.

Jenis peristiwa

Name

Deskripsi

Tingkat Peristiwa

Status

ServiceInstance

EAS:ServiceInstance:Running

Instans layanan berjalan

INFO

Running

EAS:ServiceInstance:Pending

Instans layanan tertunda

INFO

Pending

EAS:ServiceInstance:Completed

Instans layanan selesai

INFO

Completed

EAS:ServiceInstance:Terminating

Instans layanan sedang dihentikan

INFO

Terminating

EAS:ServiceInstance:Terminated

Instans layanan dihentikan

INFO

Terminated

EAS:ServiceInstance:Unknown

Instans layanan dalam status tidak diketahui

WARN

Unknown

EAS:ServiceInstance:Evicted

Instans layanan di-evict

WARN

Evicted

EAS:ServiceInstance:ErrImagePull

Error saat menarik image untuk instans layanan

WARN

ErrImagePull

EAS:ServiceInstance:ImagePullBackOff

Gagal menarik image untuk instans layanan

WARN

ImagePullBackOff

EAS:ServiceInstance:CrashLoopBackOff

Instans layanan dalam crash loop

CRITICAL

CrashLoopBackOff

EAS:ServiceInstance:Error

Error internal pada instans layanan

CRITICAL

Error

EAS:ServiceInstance:Failed

Instans layanan gagal

CRITICAL

Failed

EAS:ServiceInstance:SpotToBeReleased

Instans Spot akan segera dilepaskan.

WARN

SpotToBeReleased

Service

EAS:Service:ReplicasChanged

Jumlah replika layanan berubah

INFO

Status aktual layanan. Ini bukan nilai tetap. Untuk nilai yang mungkin, lihat Status Layanan EAS.

EAS:Service:StatusChanged

Status layanan berubah

INFO

StatusChanged

EAS:Service:Unavailable

Layanan tidak tersedia

CRITICAL

Unavailable

EAS:Service:UpdateFailed

Pembaruan layanan gagal

CRITICAL

UpdateFailed