全部产品
Search
文档中心

Elastic Compute Service:Gunakan alat atop untuk memantau metrik Linux

更新时间:Oct 17, 2025

Alat atop memberikan wawasan real-time tentang status sistem melalui antarmuka interaktif. Alat ini juga dapat berjalan sebagai layanan latar belakang untuk merekam snapshot aktivitas sistem dan proses pada interval tertentu. Snapshot ini disimpan dalam format log biner untuk membantu pelacakan dan diagnosis masalah sistem.

Instal atop

  1. Masuk ke instans Linux menggunakan Workbench.

  2. Instal alat atop.

    Alibaba Cloud Linux 2/3, CentOS 7/8, atau Fedora

    # Perbarui paket.
    sudo yum update -y
    
    # Instal atop.
    sudo yum install atop -y

    Ubuntu atau Debian

    # Perbarui paket.
    sudo apt update -y
    
    # Instal atop.
    sudo apt install atop -y

    CentOS Stream 9 atau Rocky Linux 9

    # Perbarui paket.
    sudo dnf update -y
    
    # Instal repositori EPEL.
    sudo dnf install epel-release -y
    
    # Instal atop.
    sudo dnf install atop -y

    openSUSE

    # Perbarui paket.
    sudo zypper update -y
    
    # Instal atop.
    sudo zypper install atop atop-daemon -y
  3. Mulai layanan atop.

    sudo systemctl start atop
  4. Verifikasi bahwa layanan atop telah dimulai dengan sukses.

    Jalankan sudo systemctl status atop untuk memeriksa status layanan. Status active (running) menunjukkan keberhasilan.

Lihat metrik real-time dengan atop

  1. Jalankan perintah atop [interval_sampling_dalam_detik] [jumlah_sampling] untuk masuk ke mode interaktif.

    # Lihat dengan pengaturan default (diperbarui setiap 10 detik).
    atop
    
    # Lihat metrik sistem setiap 5 detik.
    atop 5
    
    # Kumpulkan metrik sistem 30 kali dalam interval 10 detik.
    atop 10 30
    
    # Kumpulkan metrik 10 kali dalam interval 30 detik dan tulis hasilnya ke file.
    atop 30 10 > /tmp/atop.mem
  2. Dalam mode interaktif, gunakan tombol satu huruf untuk beralih tampilan atau mengurutkan proses.

    Keterangan

    Fungsi

    Tujuan

    c

    Tampilkan baris perintah lengkap

    Lihat parameter spesifik yang digunakan untuk memulai proses.

    g

    Tampilan generik (default)

    Lihat ringkasan CPU, pertumbuhan memori, dan I/O disk.

    m/M

    Tampilan memori/Urutkan berdasarkan memori

    Analisis penggunaan memori dan halaman kesalahan. Pecahkan masalah kebocoran memori.

    d/D

    Tampilan disk/Urutkan berdasarkan disk

    Analisis I/O disk. Identifikasi proses dengan aktivitas baca/tulis disk tinggi.

    n/N

    Tampilan jaringan/Urutkan berdasarkan jaringan (memerlukan Anda untuk menginstal dan memuat modul kernel netatop)

    Analisis lalu lintas jaringan. Identifikasi proses dengan lalu lintas jaringan tinggi.

    a

    Tampilan agregasi

    Agregat konsumsi sumber daya dari semua thread atau proses program.

    C

    Urutkan berdasarkan CPU

    Identifikasi dengan cepat proses yang paling banyak menggunakan CPU.

    h

    Tampilkan bantuan

    Lihat lebih banyak pintasan keyboard.

    q

    Keluar

    Keluar dari mode interaktif.

Lihat metrik historis dengan atop

Setelah layanan atop dimulai, ia secara berkala menghasilkan file log biner di direktori /var/log/atop/. File-file tersebut diberi nama dalam format atop_YYYYMMDD.

atop log adalah file biner. Membukanya dengan editor teks seperti cat, less, atau vim akan menampilkan karakter yang tidak dapat dibaca.

Baca log historis

  1. Baca file log historis.

    Gunakan perintah atop -r <log_file> untuk memuat file log tertentu.

    # Lihat log hari ini. atop secara otomatis menemukan file log untuk hari saat ini.
    atop -r
    
    # Lihat log untuk tanggal tertentu.
    atop -r /var/log/atop/atop_YYYYMMDD
  2. Navigasi ke titik waktu tertentu dalam log.

    Saat Anda memuat file log, antarmuka menampilkan snapshot pertama dari file tersebut.

    1. Tekan t untuk melompat maju ke snapshot berikutnya.

    2. Tekan T (huruf besar) untuk melompat mundur ke snapshot sebelumnya.

    3. Tekan b dan masukkan waktu dalam format HH:MM untuk langsung melompat ke waktu tersebut.

Optimalkan perilaku logging atop

Saat menganalisis log historis, Anda mungkin menemukan bahwa frekuensi logging default (sekali setiap 10 menit) terlalu luas untuk masalah tertentu, atau periode retensi default 28 hari tidak memenuhi kebutuhan Anda. Anda dapat menyesuaikan frekuensi logging latar belakang, periode retensi, dan jalur penyimpanan atop dengan memodifikasi file konfigurasinya.

  1. Buka file konfigurasi menggunakan vim atau editor teks lainnya.

    • Untuk RHEL dan turunannya (Alibaba Cloud Linux, CentOS, Fedora, dan Rocky Linux):

      sudo vim /etc/sysconfig/atop
    • Untuk Debian dan turunannya (Ubuntu dan Debian) serta openSUSE:

      sudo vim /etc/default/atop
  2. File konfigurasi default berisi konten berikut:

    LOGOPTS=""
    LOGINTERVAL=600
    LOGGENERATIONS=28
    LOGPATH=/var/log/atop
    • LOGOPTS: Opsi logging tambahan. Misalnya, menyetel -L membuat tautan simbolik di /var/log/atop/atop_current yang menunjuk ke file log terbaru untuk akses cepat selama rotasi log.

    • LOGINTERVAL: Interval sampling untuk logging, dalam detik. Defaultnya adalah 600 (10 menit), artinya atop mencatat snapshot sistem setiap 10 menit.

    • LOGGENERATIONS: Siklus hidup file log, dalam hari. Defaultnya adalah 28, artinya atop menghapus file log yang lebih tua dari 28 hari.

    • LOGPATH: Jalur penyimpanan file log. Defaultnya adalah /var/log/atop.

      Untuk mengubah jalur ini, pastikan direktori baru ada dan proses atop memiliki izin tulis ke direktori tersebut.
  3. Mulai ulang layanan atop untuk menerapkan perubahan Anda.

    sudo systemctl restart atop

Hasilkan laporan metrik

atopsar adalah alat baris perintah non-interaktif yang termasuk dalam paket atop. Alat ini mengekstrak data dari file log biner atop untuk menghasilkan laporan kinerja sistem.

Contoh

  • Hasilkan laporan pada metrik utilisasi CPU untuk sistem saat ini selama periode 1 menit (12 sampel pada interval 5 detik).

    atopsar -c 5 12
  • Hasilkan laporan pada metrik memori untuk rentang waktu tertentu pada hari saat ini.

    # Lihat laporan metrik memori untuk hari ini dari 18:00 hingga 18:01.
    atopsar -m -b 18:00 -e 18:01
  • Hasilkan laporan pada metrik memori untuk rentang waktu tertentu pada tanggal tertentu.

    # Lihat laporan metrik memori untuk 15 Agustus 2025, dari 18:00 hingga 18:01.
    atopsar -m -r /var/log/atop/atop_20250815 -b 18:00 -e 18:01

Sintaks perintah atopsar

atopsar [options] [interval] [count]
  • [options]: Flag untuk menentukan jenis laporan, seperti -c (CPU), -m (memori), dan -d (disk).

  • [interval]: Interval waktu untuk keluaran laporan, dalam detik.

  • [count]: Jumlah kali laporan dihasilkan.

Pahami metriks

Ikhtisar sumber daya sistem

Kategori Metrik

Metrik

Deskripsi

Unit

ATOP

Nama host, Tanggal

Menampilkan nama host saat ini, tanggal sampling, dan waktu.

-

Interval sampling

Menampilkan interval waktu antara dua sampel.

Detik

PRC (Total Proses)

sys

Total waktu CPU yang dikonsumsi oleh semua proses dalam mode kernel selama interval sampling.

Detik

user

Total waktu CPU yang dikonsumsi oleh semua proses dalam mode pengguna selama interval sampling.

Detik

#proc

Total jumlah proses dalam sistem.

Unit

#trun

Rata-rata jumlah thread dalam keadaan berjalan.

Unit

#tslpi

Jumlah thread dalam keadaan tidur yang dapat diinterupsi.

Item

#tslpu

Jumlah thread dalam keadaan tidur yang tidak dapat diinterupsi.

Unit

#zombie

Jumlah proses zombie.

Unit

clones

Jumlah proses atau thread baru yang dibuat oleh panggilan sistem clone selama interval sampling.

Hitungan/detik

#exit

Jumlah proses yang keluar selama interval sampling.

Hitungan/detik

CPU/cpu (Total/Per core)

sys%

Persentase waktu yang dihabiskan CPU dalam mode kernel.

%

user%

Persentase waktu yang dihabiskan CPU dalam mode pengguna.

%

irq%

Persentase waktu yang dihabiskan CPU dalam menangani interupsi perangkat keras (irq) dan interupsi perangkat lunak (softirq).

%

idle%

Persentase waktu CPU sepenuhnya idle.

%

wait%

Persentase waktu CPU idle saat menunggu I/O disk selesai.

%

steal%

Persentase waktu CPU virtual menunggu CPU fisik (waktu dicuri oleh host atau VM lain).

%

guest%

Persentase waktu CPU menjalankan mesin virtual.

%

freq%

Frekuensi rata-rata CPU sebagai persentase dari frekuensi maksimumnya.

%

CPL (Beban CPU)

avg1/avg5/avg15

Rata-rata beban sistem selama 1 menit, 5 menit, dan 15 menit terakhir.

-

csw

Jumlah pergantian konteks selama interval sampling.

Hitungan/detik

intr

Jumlah total interupsi yang terjadi selama interval sampling.

Hitungan/detik

MEM (Memori fisik)

tot

Jumlah total memori fisik dalam sistem.

GiB/MiB

free

Jumlah memori bebas yang sepenuhnya tidak digunakan.

GiB/MiB

cache

Jumlah memori yang digunakan sebagai cache halaman untuk menyimpan data file.

GiB/MiB

dirty

Jumlah halaman kotor di cache halaman yang telah dimodifikasi tetapi belum ditulis ke disk.

MiB

buff

Jumlah memori yang digunakan sebagai cache buffer untuk menyimpan metadata perangkat blok.

MiB

slab

Jumlah memori yang digunakan oleh kernel untuk struktur datanya sendiri (slab allocator).

MiB

shmem

Ukuran memori bersama, termasuk tmpfs.

MiB

vmbal

(Sistem 32-bit saja) Jumlah memori seimbang untuk area memori virtual.

MiB

SWP (Partisi swap)

tot

Ukuran total partisi swap.

GiB/MiB

free

Ukuran partisi swap yang bebas.

GiB/MiB

swcac

Jumlah memori yang telah di-swap keluar tetapi juga di-cache.

MiB

vmcom

Jumlah total memori virtual yang dikomit oleh aplikasi.

GiB/MiB

vmlim

Batas jumlah memori virtual yang dapat dikomit.

GiB/MiB

PAG (Aktivitas paging)

scan

Jumlah halaman yang dipindai oleh kernel untuk mereklaim memori selama interval sampling.

Halaman/detik

steal

Jumlah halaman yang berhasil direklaim oleh kernel setelah pemindaian.

Halaman/detik

stall

Jumlah kali kernel berhenti untuk menunggu reklamasi halaman karena memori tidak mencukupi.

Hitungan/detik

swin

Jumlah halaman yang di-swap masuk dari partisi swap ke memori fisik.

Halaman/detik

swout

Jumlah halaman yang di-swap keluar dari memori fisik ke partisi swap.

Halaman/detik

DSK (Disk)

LVM (Logical Volume)

busy

Persentase waktu disk sibuk. Nilai 100% menunjukkan bahwa disk jenuh.

%

read/write

Jumlah permintaan baca/tulis yang diselesaikan selama interval sampling.

Hitungan/detik

KiB/r/KiB/w

Ukuran data rata-rata per permintaan baca/tulis.

KB

Msec/r/Msec/w

Waktu rata-rata per permintaan baca/tulis, termasuk waktu antrian dan layanan.

Millidetik

avio

Waktu layanan rata-rata untuk permintaan I/O, tidak termasuk waktu antrian.

Millidetik

NET (Jaringan)

transport

Statistik paket untuk lapisan TCP dan UDP.

Paket/detik

network

Statistik paket untuk lapisan IP, termasuk paket yang diterima, dikirim, dan diteruskan.

Paket/detik

*if*

Menampilkan aktivitas untuk setiap antarmuka jaringan.

-

pcki/pcko

Jumlah paket data yang diterima/dikirim oleh antarmuka.

Paket/detik

spdi/spdo

Kecepatan antarmuka menerima/mengirim data.

Mbps

erri/erro

Jumlah kesalahan yang terjadi selama penerimaan/pengiriman pada antarmuka.

Hitungan/detik

drpi/drpo

Jumlah paket data yang dijatuhkan selama penerimaan/pengiriman pada antarmuka.

Hitungan/detik

Detail tingkat proses

Lihat

Metrik

Deskripsi

Unit

Tampilan generik (default)

PID

ID Proses. Pengenal proses unik dalam sistem.

-

S

Status proses. R-running, S-tidur yang dapat diinterupsi, D-tidur yang tidak dapat diinterupsi, Z-zombie, E-keluar.

-

CPU%

Penggunaan CPU.

%

MEM%

Penggunaan memori.

%

THR

Jumlah thread.

Unit

PAG

Kesalahan halaman utama. Jumlah kali proses perlu membaca data dari disk ke memori. Ini adalah ukuran tekanan I/O disk.

Hitungan/detik

CMD

Nama perintah. Nama file executable proses. Tekan tombol c untuk menampilkan baris perintah lengkap.

-

Tampilan memori

VSIZE

Ukuran memori virtual. Ukuran total ruang alamat virtual yang diminta oleh proses.

KiB/MiB/GiB

RSIZE

Ukuran set resident. Jumlah memori fisik aktual yang saat ini ditempati oleh proses.

KiB/MiB/GiB

SHR

Ukuran memori bersama.

KiB/MiB/GiB

RGROW

Pertumbuhan memori resident. Angka positif menunjukkan konsumsi memori meningkat. Angka negatif menunjukkan penurunan.

KiB

VGROW

Pertumbuhan memori virtual.

KiB

Tampilan disk

DSK%

Persentase aktivitas disk. Persentase waktu sibuk disk total yang disebabkan oleh I/O disk proses.

%

RDDSK/WRDSK

Data disk dibaca/ditulis.

KiB/MB

WCANCL

Jumlah penulisan yang dibatalkan. Jumlah data yang ditulis proses ke cache halaman tetapi dihapus sebelum disinkronkan ke disk.

KiB/MB

Tampilan jaringan

NET%

Persentase aktivitas jaringan. Persentase total lalu lintas jaringan dari semua proses yang dihasilkan oleh proses ini.

%

TCPSND/TCPRCV

Data TCP dikirim/diterima.

KiB/MB

UDPSND/UDPRCV

Data UDP dikirim/diterima.

KiB/MB

Terapkan dalam produksi

  • Perencanaan ruang disk: Ukuran log atop bergantung pada frekuensi pengumpulan, jumlah proses sistem, dan periode retensi. Untuk memperkirakan ruang yang diperlukan, periksa ukuran satu file log dengan perintah ls -lh /var/log/atop/ lalu kalikan ukuran tersebut dengan nilai LOGGENERATIONS.

  • Interval pemantauan: Untuk skenario yang memerlukan analisis lebih rinci, Anda dapat mengubah LOGINTERVAL dalam konfigurasi default menjadi 30 detik. Namun, perlu diingat bahwa memperpendek interval meningkatkan I/O disk dan overhead CPU dari proses atop. Sesuaikan nilai ini berdasarkan beban kerja instans Anda.

FAQ

  1. Mengapa saya mendapatkan kesalahan stat raw file: No such file or directory saat menjalankan atop -r?

    Kesalahan ini berarti atop tidak dapat menemukan file log untuk tanggal yang ditentukan. Alasan yang mungkin termasuk:

    1. Layanan atop tidak berjalan pada tanggal yang ditentukan.

    2. File log dihapus karena kebijakan rotasi log (periode retensi yang ditetapkan oleh LOGGENERATIONS telah terlampaui).

    3. Anda sedang meminta tanggal di masa depan.

      Periksa direktori /var/log/atop untuk daftar file log yang tersedia.

  2. Bagaimana cara mengurangi penggunaan ruang disk oleh atop?

    Anda dapat mengurangi penggunaan ruang disk dengan memodifikasi file konfigurasi. Ingatlah untuk memulai ulang layanan atop setelah melakukan perubahan.

    1. Kurangi periode retensi log: Turunkan nilai LOGGENERATIONS dalam file konfigurasi, misalnya dari 28 menjadi 14.

    2. Kurangi frekuensi pengumpulan: Tingkatkan nilai LOGINTERVAL dalam file konfigurasi, misalnya dari 600 menjadi 1200.

  3. Mengapa saya tidak bisa melihat lalu lintas jaringan per proses saat menekan tombol n dalam mode interaktif atop?

    Secara default, atop tidak melacak lalu lintas jaringan per proses. Untuk mengaktifkannya, Anda harus menginstal dan memuat modul kernel netatop.

    1. Instal paket pengembangan kernel dan alat kompilasi yang diperlukan.

      sudo yum install -y kernel-devel dkms elfutils-libelf-devel
    2. Unduh kode sumber netatop ke direktori tertentu.

      cd /usr/src/ && sudo wget https://www.atoptool.nl/download/netatop-3.2.2.tar.gz
    3. Dekompresi kode sumber dan navigasikan ke direktori sumber.

      sudo tar -zxvf netatop-3.2.2.tar.gz && cd netatop-3.2.2
    4. Bangun dan instal modul serta daemon dari kode sumber.

      sudo make && sudo make install
    5. Mulai layanan netatop.

      sudo systemctl start netatop
    6. Verifikasi bahwa netatop telah berhasil diinstal.

      Jalankan atop dan tekan n. Jika daftar detail proses mencakup kolom NET, instalasi telah berhasil.

      image