全部产品
Search
文档中心

Elastic Compute Service:Diagnosis instans komprehensif

更新时间:Nov 18, 2025

Fitur diagnosis instans komprehensif memeriksa status sistem, jaringan, dan disk suatu instans untuk membantu Anda memahami kondisi kesehatannya serta segera mengidentifikasi dan menyelesaikan masalah umum.

Prasyarat

  • Saat menggunakan fitur diagnosis Instance Fee and Security Behavior Audit, sistem akan memeriksa apakah akun saat ini memiliki peran terkait layanan AliyunServiceRoleForECSSelfService. Jika peran tersebut tidak ada, prompt akan muncul. Setelah Anda mengonfirmasi prompt tersebut, sistem secara otomatis membuat peran terkait layanan AliyunServiceRoleForECSSelfService.

    Peran AliyunServiceRoleForECSSelfService mencakup kebijakan akses sistem AliyunServiceRolePolicyForECSSelfService. Anda tidak dapat menambahkan, mengubah, atau menghapus izin yang diberikan oleh kebijakan ini.

    Klik untuk memperluas tampilan isi kebijakan AliyunServiceRolePolicyForECSSelfService

    {
      "Version": "1",
      "Statement": [
        {
          "Action": [
            "ecs:StartInstance",
            "ecs:StopInstance",
            "ecs:DescribeInstances",
            "ecs:CreateSnapshot",
            "ecs:DescribeSnapshots",
            "ecs:DeleteSnapshot",
            "ecs:DescribeDisks",
            "ecs:DescribeDisksFullStatus",
            "ecs:ResetDisk",
            "ecs:DescribeInvocationResults",
            "ecs:DescribeInvocations",
            "ecs:RunCommand",
            "ecs:CreateDiagnosticReport",
            "oos:StartExecution",
            "oos:ListExecutions",
            "oos:ListExecutionLogs",
            "oos:ListTaskExecutions",
            "oos:CancelExecution",
            "actiontrail:LookupEvents"
          ],
          "Resource": "*",
          "Effect": "Allow"
        },
        {
          "Action": "ram:DeleteServiceLinkedRole",
          "Resource": "*",
          "Effect": "Allow",
          "Condition": {
            "StringEquals": {
              "ram:ServiceName": "selfservice.ecs.aliyuncs.com"
            }
          }
        }
      ]
    }

    Jika Anda menggunakan pengguna Resource Access Management (RAM) untuk menjalankan diagnosis Instance Fee and Security Behavior Audit, hubungi pemilik akun Alibaba Cloud agar memberikan izin kepada pengguna RAM untuk membuat peran terkait layanan. Untuk informasi selengkapnya, lihat Buat kebijakan kustom dalam mode edit dan Berikan izin kepada pengguna RAM.

    Dokumen kebijakan berikut memberikan izin kepada pengguna RAM untuk menggunakan fitur pemecahan masalah instans mandiri. <account ID> adalah variabel. Gantilah dengan UID akun Alibaba Cloud Anda.

    {
        "Statement": [
            {
                "Action": [
                    "ram:CreateServiceLinkedRole"
                ],
                "Resource": "acs:ram:*:<account ID>:role/*",
                "Effect": "Allow",
                "Condition": {
                    "StringEquals": {
                        "ram:ServiceName": [
                            "selfservice.ecs.aliyuncs.com"
                        ]
                    }
                }
            }
        ],
        "Version": "1"
    }
  • Jika Anda menjalankan diagnosis komprehensif atau mendiagnosis anomali jaringan, pastikan instans memenuhi kondisi berikut:

    • Jenis instans: Instans termasuk dalam keluarga instans yang tersedia untuk pembelian. Untuk informasi selengkapnya, lihat Keluarga instans.

      Catatan

      Keluarga instans yang sudah dihentikan tidak mendukung fitur diagnosis kesehatan instans.

    • Status instans: Instans berada dalam status Running.

    • Sistem operasi: Jika skenario yang dipilih melibatkan pemeriksaan konfigurasi dalam sistem operasi instans, pastikan sistem operasi memenuhi persyaratan pada tabel berikut.

      Arsitektur sistem

      Versi sistem operasi

      Konfigurasi dalam sistem operasi

      x86 64-bit

      • Windows Server 2008 dan versi lebih baru

      • Alibaba Cloud Linux 2/3

      • AlmaLinux 8.x dan versi lebih baru

      • Anolis OS 7.x/8.x

      • CentOS 7.x/8.x

      • CentOS Stream 8 dan versi lebih baru

      • Debian 8.x dan versi lebih baru

      • Fedora 33/34

      • OpenSUSE 15.x/42.x

      • Rocky Linux 8.x dan versi lebih baru

      • SUSE Linux Enterprise Server 12.x/15.x

      • Ubuntu 16.04/18.04/20.04/24.04

      • Versi Python: Python 3.6 atau lebih baru

      • Cloud Assistant Agent telah diinstal. Untuk informasi selengkapnya, lihat Instal Agen Asisten Cloud.

      Catatan

      Distribusi sistem operasi yang tidak tercantum dalam tabel tidak didukung. Kinerja diagnosis pada distribusi yang tidak didukung tidak dijamin.

  • Jika skenarionya adalah Instance fails to start, pastikan instans memenuhi kondisi berikut:

    • Status instans: Instans berada dalam status Stopped.

    • Sistem operasi: Skenario yang dipilih melibatkan pemeriksaan konfigurasi dalam sistem operasi instans. Pastikan sistem operasi memenuhi persyaratan pada tabel berikut.

      Arsitektur sistem

      Versi sistem operasi

      x86 64-bit

      • Windows Server 2008 dan versi lebih baru

      • Alibaba Cloud Linux 2/3

      • AlmaLinux 8.x dan versi lebih baru

      • Anolis OS 7.x/8.x

      • CentOS 7.x/8.x

      • CentOS Stream 8 dan versi lebih baru

      • Debian 8.x dan versi lebih baru

      • Fedora 33/34

      • OpenSUSE 15.x/42.x

      • Rocky Linux 8.x dan versi lebih baru

      • SUSE Linux Enterprise Server 12.x/15.x

      • Ubuntu 16.04/18.04/20.04/24.04

      Catatan

      Distribusi sistem operasi yang tidak tercantum dalam tabel tidak didukung. Kinerja diagnosis pada distribusi yang tidak didukung tidak dijamin.

Skenario

Gunakan fitur diagnosis instans komprehensif dalam skenario berikut untuk memahami kondisi kesehatan instans Anda:

  • Pemecahan masalah: Jalankan diagnosis terarah untuk menemukan solusi atas masalah yang Anda alami, seperti koneksi jaringan gagal.

  • Pemeriksaan rutin: Pahami kondisi kesehatan keseluruhan instans Anda selama operasi dan pemeliharaan (O&M) rutin guna mendeteksi dan menangani masalah secara proaktif serta mencegah gangguan bisnis.

Catatan

Fitur diagnosis kesehatan instans menyediakan deskripsi masalah dan solusi yang direkomendasikan untuk setiap item diagnosis. Untuk informasi selengkapnya, lihat Item diagnosis dan hasilnya.

Prosedur

Konsol ECS

Buat diagnosis instans

  1. Masuk ke Konsol ECS.

  2. Di panel navigasi sebelah kiri, pilih O&M and Monitoring > Self-service Troubleshooting.

  3. Di pojok kiri atas bilah menu atas, pilih wilayah.

  4. Pilih waktu dan ID instans, lalu klik Start Diagnosis.

    Catatan

    Hanya satu tugas diagnostik yang dapat berlangsung untuk suatu instans dalam satu waktu. Interval antara dua diagnosis berturut-turut harus lebih dari 5 menit.

    Jenis masalah

    Deskripsi

    Instance Performance Issues

    Mendiagnosis masalah seperti beban CPU tinggi, penggunaan memori tinggi, penggunaan bandwidth tinggi, BPS atau IOPS disk tinggi, atau penurunan kinerja pada instance ECS.

    Instance Connection Or Startup Failures

    Mendiagnosis masalah seperti koneksi jarak jauh yang gagal melalui Protokol Secure Shell (SSH) atau VNC, instans mati, atau sistem operasi instans gagal dimulai.

    Network Issues

    Mendiagnosis masalah seperti penurunan kinerja jaringan atau kegagalan ping pada instance ECS.

    Instance Operation Did Not Take Effect

    Mendiagnosis masalah ketika operasi pada instance ECS tidak berpengaruh, seperti ekspansi disk yang tidak diterapkan.

    Insufficient Resource Quota

    Mendiagnosis masalah yang terjadi karena kuota sumber daya ECS telah tercapai. Contohnya termasuk kuota kapasitas disk tidak mencukupi, kuota citra tidak mencukupi, atau mencapai jumlah maksimum Elastic Network Interfaces (ENI) atau grup keamanan.

    Security Risk Detection

    Mendiagnosis risiko keamanan pada instance ECS, seperti kerentanan sistem, peringatan keamanan, atau proses berbahaya.

    Instance Fee And Security Behavior Audit

    Mengaudit dan melacak operasi yang terkait dengan status instance ECS, biaya instans, dan grup keamanan.

    Catatan

    Untuk menggunakan fitur audit biaya instans dan perilaku keamanan, Anda harus memiliki peran terkait layanan dan izin untuk pemecahan masalah instans mandiri. Untuk informasi selengkapnya, lihat Peran terkait layanan AliyunServiceRoleForECSSelfService.

    Instance Device Detection

    Memeriksa apakah perangkat seperti GPU pada instans berjalan dengan baik.

    Other Issues

    Anda dapat langsung memasukkan detail masalah, ID instans, dan epoch pemecahan masalah yang sesuai.

    Item diagnosis aktual dapat bervariasi. Di laporan diagnostik, klik tab di bawah Diagnostic Item Details untuk melihat item dan progresnya. Diagnosis memerlukan beberapa menit. Anda dapat melihat progres di halaman saat ini atau menutup kotak dialog dan memeriksa daftar tugas diagnostik untuk melihat progres dan laporan.

  5. Lihat laporan diagnostik.

    Laporan diagnostik berisi informasi berikut:

    • Informasi Dasar: Meliputi rentang waktu diagnosis, ID sumber daya, ID laporan, dan waktu diagnosis.

    • Hasil Diagnosis: Jika semua pemeriksaan normal, hasilnya adalah No Anomalies Found On The Instance. Jika ditemukan item abnormal, item spesifik akan ditampilkan beserta solusi yang direkomendasikan. Anda dapat mengikuti rekomendasi tersebut untuk menyelesaikan masalah.

    • Detail Item Diagnosis: Meliputi hasil untuk setiap item diagnosis, dengan tingkat keparahan Critical, Warning, dan Passed.

    Catatan

    Saat menggunakan fitur audit biaya instans dan perilaku keamanan, Anda juga dapat memperoleh informasi lebih lanjut dengan cara berikut:

    Anda dapat menggunakan laporan diagnostik untuk menyelesaikan masalah.

    • Untuk masalah umum, Anda dapat menemukan solusinya dalam dokumentasi. Untuk informasi selengkapnya, lihat Masalah umum dan solusi untuk sistem operasi tamu instance ECS.

    • Untuk kegagalan startup instans, Anda dapat masuk ke instance ECS dan menggunakan disk perbaikan yang dilampirkan untuk memperbaiki masalah tersebut.

Lihat riwayat diagnosis

Untuk meninjau status kesehatan historis suatu instans, Anda dapat melihat riwayat diagnosisnya.

  1. Masuk ke Konsol ECS.

  2. Lihat riwayat diagnosis instans.

    1. Di panel navigasi sebelah kiri, pilih O&M and Monitoring > Self-service Troubleshooting.

    2. Di bilah navigasi atas, pilih wilayah.

    3. Di tab Instance Troubleshooting, klik View History.

    4. Di halaman Detection History, klik tab Instance Health Diagnosis, masukkan ID sumber daya atau ID laporan, lalu klik ikon search.

    Catatan

    Di daftar laporan riwayat diagnosis, Anda dapat mengklik ikon Filter di sebelah kiri Actions dan memilih status untuk memfilter daftar.

  3. Untuk satu entri riwayat diagnosis, Anda dapat mengklik View Report untuk melihat laporan lengkap, atau mengklik Diagnose Again untuk memulai diagnosis baru.

OpenAPI

  1. Anda dapat mengkueri metrik diagnosis.

    Panggil DescribeDiagnosticMetrics untuk mengkueri metrik diagnosis. Untuk daftar metrik diagnosis yang tersedia, lihat Item diagnosis dan hasilnya.

  2. Anda dapat mengelola kumpulan metrik diagnosis.

    Terdapat dua jenis kumpulan metrik diagnosis. Anda dapat menggunakannya untuk membuat laporan diagnosis.

    • Kumpulan metrik diagnosis publik: Kumpulan metrik diagnosis publik didasarkan pada masalah umum pengguna dan membantu menyederhanakan proses diagnosis.

      Kumpulan metrik diagnosis publik dikelola oleh Alibaba Cloud. Anda tidak dapat mengubahnya. Anda dapat memanggil DescribeDiagnosticMetricSets untuk mengkueri kumpulan metrik diagnosis publik. Kumpulan metrik diagnosis publik yang saat ini didukung adalah sebagai berikut.

      Nama metrik

      Deskripsi

      Skenario

      dms-instancedefault

      Kumpulan diagnosis default

      Digunakan untuk pemeriksaan komprehensif instance ECS.

    • Kumpulan metrik diagnosis kustom: Jika Anda hanya ingin memeriksa metrik diagnosis tertentu, Anda dapat memanggil CreateDiagnosticMetricSet untuk membuat kumpulan metrik diagnosis kustom. Setelah kumpulan dibuat, Anda dapat memanggil DescribeDiagnosticMetricSets untuk mengkuerinya.

      Tanggapan contoh berikut menunjukkan bahwa kumpulan metrik diagnosis kustom bernama test telah dibuat.

      {
        "RequestId": "6AF68D67-601A-5278-AB10-4195CCA7****",
        "MetricSets": [
          {
            "Type": "User",
            "MetricIds": [
              "Instance.ControllerError",
              "Instance.CPUException",
              "Instance.CPUSplitLock"
            ],
            "MetricSetId": "dms-uf6ck3iljpbft15i****",
            "ResourceType": "instance",
            "MetricSetName": "test"
          }
        ]
      }
  3. Anda dapat membuat laporan diagnosis.

    Anda dapat memanggil CreateDiagnosticReport untuk membuat laporan diagnosis menggunakan kumpulan metrik diagnosis kustom atau publik.

    Tanggapan contoh berikut menunjukkan bahwa laporan diagnosis berhasil dibuat.

    {
      "RequestId": "A1283ACE-2F19-54B9-9464-401EBD1A****",
      "ReportId": "dr-uf6aacg5g2fjp64i****"
    }
  4. Anda dapat mengkueri laporan diagnosis.

    Anda dapat memanggil DescribeDiagnosticReports untuk mengkueri detail laporan diagnosis. Tanggapan mengembalikan hasil diagnosis untuk setiap metrik diagnosis dalam kumpulan tersebut. Untuk informasi selengkapnya tentang hasil item diagnosis, lihat Item diagnosis dan hasilnya.

    Tanggapan contoh berikut menunjukkan bahwa diagnosis normal dan tidak ditemukan masalah.

    {
      "RequestId": "20381C19-C31B-52AE-AC9B-8AD672E4****",
      "NextToken": "",
      "Reports": [
        {
          "Status": "Finished",
          "EndTime": "2022-09-07T15:36Z",
          "ResourceId": "i-uf653eye7pkftni****",
          "MetricSetId": "dms-uf6ck3iljpbft15i****",
          "Issues": [],
          "StartTime": "2022-09-05T15:36Z",
          "CreationTime": "2022-09-07T15:36Z",
          "ReportId": "dr-uf6aacg5g2fjp64i****",
          "ResourceType": "instance",
          "Severity": "Normal",
          "FinishedTime": "2022-09-07T15:36Z"
        }
      ]
    }

Referensi