Status Kesehatan Alibaba Cloud
Disarankan untuk memantau status kesehatan sumber daya Alibaba Cloud agar dapat menangani pengecualian segera setelah terjadi. Untuk informasi lebih lanjut, kunjungi Status Kesehatan Alibaba Cloud.
Di halaman Status Kesehatan Alibaba Cloud, Anda dapat memeriksa status kesehatan setiap layanan di berbagai wilayah serta berlangganan feed RSS (Really Simple Syndication) untuk pengecualian layanan.

CloudMonitor
CloudMonitor Basic adalah layanan gratis yang menyediakan kemampuan pemantauan real-time untuk Platform for AI (PAI). Dengan CloudMonitor Basic, Anda dapat melacak status operasional sumber daya cloud, penggunaan sumber daya dalam Elastic Compute Service (ECS), performa situs web, serta gangguan dalam operasi bisnis.
Untuk menggunakan kemampuan pemantauan CloudMonitor Basic, aktifkan CloudMonitor Basic untuk PAI. Informasi lebih lanjut dapat ditemukan di Pemantauan Layanan Cloud.
Aktifkan peringatan untuk metrik penting sekaligus
CloudMonitor Basic memungkinkan Anda mengaktifkan peringatan untuk beberapa metrik PAI penting secara bersamaan dan membangun sistem peringatan dengan efisien. Dengan cara ini, Anda dapat memperoleh wawasan komprehensif tentang penggunaan sumber daya cloud dan status operasional bisnis. Untuk informasi lebih lanjut, lihat Aktifkan Fitur Peringatan Proaktif.
Konfigurasikan peringatan kustom untuk metrik yang diinginkan
Anda dapat membuat dasbor kustom untuk mengelola semua metrik yang ingin dipantau dalam satu platform. Untuk informasi lebih lanjut, lihat Kelola Grafik Pemantauan dari Dasbor Kustom.
Anda dapat mengonfigurasi aturan peringatan untuk setiap metrik guna menerima notifikasi penting melalui berbagai metode, termasuk panggilan telepon, pesan teks, email, chatbot DingTalk, dan aplikasi Alibaba Cloud.
Anda juga dapat membuat daftar hitam peringatan untuk memblokir peringatan pada metrik tertentu. Untuk informasi lebih lanjut, lihat Kelola Kebijakan Daftar Hitam.
Cloud Config
Cloud Config adalah layanan audit gratis yang membantu Anda memantau perubahan konfigurasi semua sumber daya cloud serta memastikan kepatuhan infrastruktur cloud secara terus-menerus.
Lacak perubahan konfigurasi sumber daya
Cloud Config dapat mengaudit operasi akun Alibaba Cloud dan Pengguna Manajemen Akses Sumber Daya (RAM) yang dibuat oleh akun tersebut. Secara default, perubahan konfigurasi dicatat setiap 10 menit.
Aktifkan pemeriksaan awal kepatuhan untuk MLPS 2.0
Cloud Config menggunakan aturan yang sesuai dengan Baseline untuk Skema Perlindungan Multi-Level (MLPS) 2.0 untuk mengevaluasi kepatuhan konfigurasi sumber daya cloud. Anda dapat mengaktifkan pemeriksaan awal kepatuhan untuk MLPS 2.0 hanya dengan beberapa klik. Sistem akan memeriksa sumber daya Anda secara otomatis dan terus-menerus untuk kepatuhan. Anda juga dapat mengunduh laporan pemeriksaan awal dan mengirimkannya ke lembaga inspeksi.
Kueri dan analisis data audit secara real-time
Anda dapat mengirim perubahan konfigurasi historis dan peristiwa non-patuhan sumber daya ke penyimpanan log dalam Layanan Log Sederhana. Dengan cara ini, Anda dapat menanyakan dan menganalisis data audit secara terpusat. Untuk informasi lebih lanjut, lihat Kirimkan Data Sumber Daya ke Penyimpanan Log dalam Layanan Log Sederhana.
ActionTrail
Anda dapat mengaktifkan ActionTrail untuk PAI guna memantau dan mencatat operasi akun Alibaba Cloud secara terpusat, termasuk masuk ke Konsol PAI dan akses ke sumber daya cloud. Dengan cara ini, Anda dapat melakukan analisis keamanan, deteksi intrusi, pelacakan perubahan sumber daya, serta audit kepatuhan berdasarkan catatan tersebut.
ActionTrail dapat menghasilkan log untuk akses layanan cloud menggunakan Konsol Manajemen Alibaba Cloud, memanggil Operasi API, dan menggunakan alat pengembang. Untuk informasi tentang peristiwa audit, lihat Peristiwa Audit ECS.
Secara default, ActionTrail melacak dan menyimpan peristiwa selama 90 hari sebelumnya. Jika Anda perlu menyimpan peristiwa untuk periode waktu yang lebih lama, buat jejak yang mengirim peristiwa ke penyimpanan log Layanan Log Sederhana atau Bucket Object Storage Service (OSS). Untuk informasi lebih lanjut, lihat Memulai.
Setelah membuat jejak untuk mengirim peristiwa ke penyimpanan log Layanan Log Sederhana atau Bucket OSS, Anda dapat menanyakan atau menganalisis peristiwa tersebut di konsol Layanan Log Sederhana atau OSS. Untuk informasi lebih lanjut, lihat Kueri Peristiwa di Konsol Layanan Log Sederhana atau OSS.
Jika Anda perlu melacak peristiwa historis, ajukan tiket untuk meminta izin yang diperlukan.
Notifikasi ruang kerja
PAI menyediakan mekanisme notifikasi untuk ruang kerja. Anda dapat membuat aturan notifikasi untuk memantau status pekerjaan Deep Learning Containers (DLC) dan pekerjaan pipeline, atau memicu peristiwa terkait berdasarkan status persetujuan versi model. Notifikasi dapat diterima melalui berbagai metode, seperti DingTalk, panggilan telepon, dan email. Untuk informasi lebih lanjut, lihat Notifikasi Ruang Kerja.
Tensorboard
Anda dapat membuat TensorBoard di Machine Learning Designer atau untuk pekerjaan DLC guna melihat laporan analitik pelatihan model secara visual. Untuk informasi lebih lanjut, lihat topik-topik berikut:
Machine Learning Designer: Gunakan TensorBoard untuk Memvisualisasikan Laporan Analitik.
DLC: TensorBoard.