Mengimpor custom image yang salah konfigurasi—misalnya karena driver yang tidak tersedia atau pengaturan jaringan yang tidak sesuai—dapat menyebabkan instance Elastic Compute Service (ECS) gagal boot atau mengalami masalah jaringan. Gunakan tool sersi dari Alibaba Cloud untuk memindai, mengevaluasi, dan secara otomatis memperbaiki gambar Anda sebelum diimpor guna meningkatkan tingkat keberhasilan penerapan.
Modifikasi yang dilakukan oleh skrip perbaikan sersi bersifat ireversibel.
Sistem operasi yang didukung
Tool ini mendukung family sistem operasi (OS) utama:
Seri Red Hat: Alibaba Cloud Linux, Anolis, Red Hat, CentOS, CentOS Stream, Fedora, AlmaLinux, Rocky Linux, openEuler, dan OpenCloudOS.
Seri Debian: Debian, Ubuntu, Kylin, dan UOS.
Seri SUSE: SUSE dan openSUSE.
Sistem FreeBSD, Fedora CoreOS, dan Windows Server tidak didukung.
Prosedur
Langkah 1: Unduh dan ekstrak tool
Unduh paket tool
sersi.wget https://ecs-image-tools.oss-cn-hangzhou.aliyuncs.com/imagecheck/sersi.tar.gzEkstrak paket tool tersebut.
tar -xf sersi.tar.gz
Langkah 2: Periksa gambar
Jalankan perintah pemeriksaan untuk menghasilkan laporan kesehatan gambar Anda.
Pindai gambar untuk semua item pemeriksaan.
./main.sh --target=image --diagnosticAnalisis hasilnya. Perintah tersebut menghasilkan laporan terformat.
OK: Item tersebut memenuhi spesifikasi gambar Alibaba Cloud.FAILED(Harus diperbaiki): Item tersebut memiliki masalah kritis yang dapat mencegah instans boot atau menyebabkan fungsi inti (seperti jaringan) gagal.WARNING(Disarankan diperbaiki): Item tersebut memiliki masalah konfigurasi. Meskipun tidak memengaruhi proses boot instans, hal ini dapat menyebabkan beberapa fitur advanced (seperti Cloud Assistant atau pemantauan) tidak tersedia atau menimbulkan risiko keamanan.
Untuk deskripsi detail item pemeriksaan, lihat Ikhtisar item pemeriksaan dan perbaikan.
------------------------------------------------------------ OS: Alibaba Cloud Linux 3 Kernel: 5.10.134-16.1.al8.x86_64 Arch: x86_64 RTC-Mode: utc Boot-Mode: Legacy ------------------------------------------------------------ Image Check Result Virtio [OK] Nvme [OK] Fstab [OK] Grub [OK] Dhcp [OK] Selinux [OK] OnlineResizeFS [OK] CloudAssistant [OK] CloudInit [OK] SecurityCenterAgent [OK] SupportMocInstanceTypes [OK] DiskUsage [OK] InodeUsage [OK] SystemFileAttribute [OK] CriticalUser [OK] QemuGuestAgent [OK] SshConfig [OK] Firewall [OK] Total case Count 18 Successes: 18 Failures: 0 Warnings: 0 ------------------------------------------------------------
Langkah 3: Perbaiki gambar
Perbaikan otomatis
Skrip perbaikan melakukan perubahan yang bersifat ireversibel. Ikuti proses aman "tinjau, lalu eksekusi".
Toolsersitidak secara otomatis memperbaiki itemDiskUsage,InodeUsage,CriticalUser,LibDirectory, danSupportMocInstanceTypes. Perbaiki item-item tersebut secara manual dengan mengikuti petunjuk pada bagian Perbaikan manual.
Tinjau:
Gunakan parameter
--dry-rununtuk menghasilkan dan meninjau skrip perbaikan tanpa membuat perubahan apa pun.Untuk memperbaiki satu item saja, lihat Bagaimana cara memperbaiki satu item pemeriksaan?
# Perbaiki semua masalah ./main.sh --target=image --run all --dry-runEksekusi:
Setelah memastikan skrip tersebut aman, hapus parameter
--dry-rununtuk menerapkan perbaikan.# Perbaikan interaktif: Konfirmasi diminta sebelum setiap langkah perbaikan dieksekusi. ./main.sh --target=image --run allAnalisis hasil perbaikan:
OK: Item berhasil diperbaiki.NO_FOUND_RISK: Tidak ditemukan masalah untuk item ini dalam gambar.OK_Need_Reboot: Perbaikan telah selesai, tetapi reboot sistem diperlukan agar perubahan berlaku.DRY_RUN: Tool yang dijalankan dalam mode dry-run menemukan masalah dan mencetak skrip perbaikan tanpa mengeksekusinya.FAILED: Perbaikan gagal. Anda perlu melakukan Perbaikan manual.
Perbaikan manual
Untuk item yang tidak dapat diperbaiki secara otomatis atau perbaikan otomatis gagal, ikuti petunjuk manual berikut.
DiskUsage: Hapus file yang tidak diperlukan secara manual.InodeUsage: Hapus file yang tidak diperlukan secara manual.CriticalUser: Pertahankan akun root.LibDirectory: Tautan simbolik /lib dan /lib64 tidak boleh mengarah ke jalur mutlak. Ubah agar mengarah ke jalur relatif.SupportMocInstanceTypes: Sistem yang tidak mendukung tipe instans SHENLONG biasanya merupakan versi lama yang sudah end-of-life (EOL) dan tidak lagi dipelihara. Tingkatkan ke versi OS yang masih aktif dipelihara oleh vendor.Virtio: Instal driver virtio.Nvme: Instal driver NVMe.Dhcp: Konfigurasikan jaringan sebagai DHCP dalam gambar Linux.Selinux: Aktifkan atau nonaktifkan SELinux.OnlineResizeFS: Instal cloud-init dan tool growpart.Cloudinit: Instal cloud-init.SshConfig: Periksa file konfigurasi sshd.Firewall: Nonaktifkan layanan firewall sistem.CloudAssistant: Instal Cloud Assistant Agent.SecurityCenterAgent: Instal agen Security Center.QemuGuestAgent: Uninstal secara manualqemu-guest-agent.SystemFileAttribute: Jangan gunakan perintahchattruntuk mengunci file penting seperti /etc/shadow.
Langkah 4: Verifikasi perbaikan
(Opsional) Reboot sistem. Beberapa perbaikan (
Nvme,Dhcp, danSelinux) memerlukan reboot sistem agar berlaku.Jalankan kembali perintah pemeriksaan untuk memastikan semua item memiliki status
OK../main.sh --target=image --diagnostic
Ikhtisar item pemeriksaan dan perbaikan
Item pemeriksaan (Case Name) | Item perbaikan | Dampak | Deskripsi |
|
| Instans ECS gagal boot. | Memeriksa apakah driver virtio telah diinstal dalam gambar. Instans ECS Alibaba Cloud adalah mesin virtual (VM) berbasis KVM dan bergantung pada driver virtio untuk disk virtual. |
|
| Tidak dapat menggunakan tipe instans yang memerlukan cloud disk berbasis protokol NVMe, seperti ecs.g7se. | Memeriksa apakah driver NVMe telah diinstal dalam gambar. Beberapa tipe instans ECS, seperti ecs.g8i, ecs.g8a, ecs.g9i, dan ecs.g9a, menggunakan cloud disk berbasis protokol NVMe dan memerlukan gambar yang menyertakan driver NVMe. NVMe menawarkan kecepatan lebih cepat dan bandwidth transfer lebih tinggi dibandingkan protokol driver tradisional (seperti SCSI dan virtio-blk). Instal driver NVMe dalam gambar Anda untuk mendukung tipe instans tersebut. |
|
| Sistem gagal boot. | Memeriksa apakah konfigurasi /etc/fstab benar. Konfigurasi yang salah, seperti perangkat mount yang tidak ada atau UUID perangkat yang salah, dapat menyebabkan sistem gagal boot. |
|
| Sistem gagal boot. | Memeriksa apakah file konfigurasi GRUB benar. Kesalahan konfigurasi, seperti menentukan partisi boot berdasarkan nama perangkat alih-alih UUID, akan mencegah sistem boot. |
|
| Koneksi jaringan sistem gagal. | Memeriksa apakah DHCP diaktifkan untuk antarmuka jaringan. Pengalamatan statis dapat menyebabkan konfigurasi jaringan gagal dan masalah koneksi. Tambahkan |
|
| Instans ECS gagal boot. | Memeriksa apakah SELinux dinonaktifkan. Nonaktifkan SELinux. |
|
| Partisi root instans tidak dapat diubah ukurannya. | Memeriksa apakah gambar dapat memperbesar partisi dan sistem file root secara otomatis saat boot pertama kali (melalui cloud-init atau growpart). Misalnya, gambar 10 GB dapat diperluas untuk mengisi disk sistem 100 GB. Untuk informasi selengkapnya, lihat Perluas partisi dan sistem file (Linux). |
|
| Konfigurasi inisialisasi sistem tidak ada. | Memeriksa apakah cloud-init telah diinstal. cloud-init mengonfigurasi NTP, repositori paket, hostname, dan pasangan kunci SSH saat boot, serta menjalankan skrip User Data instans. |
|
| Koneksi SSH ke instans gagal. | Memeriksa apakah file konfigurasi layanan sshd (biasanya /etc/ssh/sshd_config) benar. Jika file konfigurasi sshd salah, layanan sshd mungkin gagal dimulai, yang pada gilirannya dapat menyebabkan koneksi SSH ke instans ECS gagal. Untuk memeriksa file tersebut:
|
|
| Firewall sistem dapat memblokir akses ke instans. | Memeriksa apakah layanan firewall diaktifkan. Nonaktifkan layanan firewall sistem dan gunakan grup keamanan ECS untuk mengelola traffic inbound dan outbound instans cloud Anda secara terpusat. |
|
| O&M Cloud menjadi tidak praktis. | Memeriksa apakah Cloud Assistant telah diinstal dalam gambar. Cloud Assistant adalah tool otomatisasi native yang dibuat untuk ECS yang memungkinkan operasi dan pemeliharaan yang efisien. Instal layanan Cloud Assistant dalam gambar Anda. |
|
| Kerentanan dalam instans tidak dapat diidentifikasi tanpa perlindungan dari Security Center. | Memeriksa apakah agen Security Center telah diinstal. Agen harus diinstal agar server dilindungi oleh Security Center. |
|
| Fitur instans mungkin tidak berfungsi dengan benar. | Memeriksa apakah telah diinstal. Perangkat lunak ini berjalan di VM dan berkomunikasi dengan mesin host, yang dapat menyebabkan beberapa layanan ECS tidak tersedia dan fungsionalitas instans tidak lengkap. |
| Tidak didukung | Sistem gagal boot. | Memeriksa apakah penggunaan ruang disk normal. Anda dapat menjalankan perintah untuk memeriksa penggunaan ruang disk dan memastikan tersedia ruang yang cukup. |
| Tidak didukung | Sistem gagal boot. | Memeriksa apakah penggunaan inode disk normal. Anda dapat menjalankan perintah |
|
| Instans gagal boot atau berfungsi secara abnormal. | Memeriksa apakah atribut file konfigurasi sistem penting benar. |
| Tidak didukung | Instans gagal boot atau berfungsi secara abnormal. | Memeriksa apakah pengguna kritis (seperti root) ada. Ketidakhadiran pengguna kritis dapat menyebabkan sistem boot secara abnormal atau mencegah koneksi jarak jauh ke instans. |
| Tidak didukung | Sistem berfungsi secara abnormal. | Pada sistem Linux seri Red Hat, /lib dan /lib64 biasanya merupakan tautan simbolik yang mengarah ke /usr/lib dan /usr/lib64. Jangan ubah tautan ini karena dapat menyebabkan masalah sistem. |
| Tidak didukung | Tidak dapat menggunakan family instans SHENLONG seperti dan . | Memeriksa apakah gambar mendukung tipe instans SHENLONG Alibaba Cloud ECS. Instans ECS terbaru, seperti dan , biasanya merupakan tipe instans SHENLONG. Jika versi OS dan kernel gambar terlalu lama, gambar tersebut mungkin gagal boot pada tipe instans ini. Untuk informasi selengkapnya, lihat Ikhtisar family instans. |
Deskripsi detail perintah perbaikan
Perintah untuk memperbaiki gambar secara otomatis adalah sebagai berikut:
./main.sh --target=image --run <case> [--debug] [--dry-run] [-y]Parameter | Wajib | Deskripsi |
| Ya | Item perbaikan yang akan dijalankan.
|
| Tidak | Disarankan untuk percobaan perbaikan pertama. Mencetak skrip perbaikan tanpa mengeksekusinya. |
| Tidak | Mengaktifkan output log detail untuk troubleshooting. |
| Tidak | Otomatis mengonfirmasi semua langkah perbaikan dan melewati prompt interaktif. |
Dokumen terkait
Setelah lolos validasi, Anda dapat mendapatkan file image Linux dan kemudian mengimpor gambar kustom ke Platform Alibaba Cloud.
FAQ
Mengapa masalah masih ada setelah saya menerapkan perbaikan untuk nvme, selinux atau dhcp?
Ketiga perbaikan ini memerlukan reboot agar diterapkan. Setelah menerapkannya, reboot VM dan jalankan kembali tool tersebut untuk memverifikasi hasilnya.
Bagaimana cara memperbaiki satu item pemeriksaan?
Untuk memperbaiki satu item, seperti SshConfig:
Pada tabel Ikhtisar item pemeriksaan dan perbaikan, temukan item perbaikan
sshdyang sesuai dengan item pemeriksaanSshConfig.Tinjau:
Untuk memperbaiki item yang berbeda, ganti
sshddengan nama item perbaikan yang sesuai../main.sh --target=image --run sshd --dry-runEksekusi:
./main.sh --target=image --run sshd