Container Compute Service (ACS) menyediakan arsitektur terkelola serta komponen kunci untuk komputasi berbasis kontainer. Operasi yang tidak tepat pada komponen atau aplikasi yang tidak dikelola dalam kluster ACS dapat mengakibatkan gangguan layanan. Untuk memperkirakan dan menghindari risiko yang mungkin timbul, pastikan Anda membaca dan memahami rekomendasi serta catatan penggunaan dalam topik ini sebelum mulai menggunakan ACS.
Catatan penggunaan
Pembaruan kluster
Gunakan fitur pembaruan kluster ACS untuk memperbarui versi Kubernetes dari kluster ACS Anda. Metode lainnya dapat menyebabkan masalah stabilitas atau kompatibilitas.
ACS menyediakan fitur-fitur berikut untuk mendukung pembaruan kluster:
Pembaruan versi untuk kluster ACS.
Pemeriksaan awal untuk pembaruan versi. Pemeriksaan awal membantu memastikan bahwa kluster ACS memenuhi syarat untuk pembaruan versi.
Catatan rilis untuk versi Kubernetes baru. Catatan rilis menjelaskan versi Kubernetes baru dan membandingkan versi baru dengan versi sebelumnya.
Pemberitahuan untuk risiko potensial akibat perubahan sumber daya. Fitur ini memberi tahu Anda tentang risiko yang mungkin timbul akibat perubahan sumber daya yang disebabkan oleh pembaruan versi.
Kami menyarankan Anda mengikuti saran-saran berikut saat menggunakan fitur pembaruan kluster:
Lakukan pemeriksaan awal sebelum memperbarui kluster dan perbaiki masalah yang dilaporkan dalam hasil pemeriksaan awal.
Baca dan pahami catatan rilis versi Kubernetes baru. Periksa status kluster dan beban kerja Anda berdasarkan risiko pembaruan yang dilaporkan oleh ACS. Kemudian, evaluasi dampak dari pembaruan kluster.
Anda tidak dapat membatalkan pembaruan kluster. Sebelum memperbarui kluster, persiapkan pembaruan dan buat rencana cadangan.
Perbarui kluster Anda ke versi Kubernetes terbaru sebelum versi ini dihentikan oleh ACS. Untuk informasi lebih lanjut, lihat Dukungan untuk Versi Kubernetes.
Konfigurasi Kubernetes
Jangan gunakan anotasi yang dicadangkan oleh Kubernetes dalam template YAML. Jika tidak, ketidaktersediaan sumber daya, kegagalan aplikasi, dan pengecualian dapat terjadi. Label dengan awalan
kubernetes.io/atauk8s.io/dicadangkan untuk komponen kunci. Contoh: pv.kubernetes.io/bind-completed: "yes".
Kluster ACS
Dalam skenario berikut, kluster ACS tidak memenuhi syarat untuk kompensasi:
Untuk menyederhanakan O&M kluster, ACS dapat mengelola komponen sistem tertentu untuk kluster Anda. Setelah Anda mengaktifkan komponen sistem terkelola untuk kluster Anda, komponen tersebut diterapkan dan dipelihara oleh ACS. ACS tidak memberikan kompensasi atas kerugian bisnis yang disebabkan oleh kesalahan pengguna seperti penghapusan tidak sengaja sumber daya Kubernetes yang digunakan oleh komponen sistem terkelola.
Operasi berisiko tinggi
Operasi berikut dianggap sebagai operasi berisiko tinggi di ACS dan dapat sangat menurunkan stabilitas bisnis Anda. Baca dan pahami dampak dari operasi berisiko tinggi berikut.
Operasi berisiko tinggi pada kluster
Kategori | Operasi berisiko tinggi | Dampak | Cara memulihkan |
API Server | Hapus instance Server Load Balancer (SLB) yang digunakan untuk mengekspos server API. | Anda gagal mengelola kluster. | Tidak dapat dipulihkan. Anda harus membuat kluster baru. |
Lainnya | Gunakan Resource Access Management (RAM) untuk memodifikasi izin. | Sumber daya seperti instance SLB mungkin gagal dibuat. | Pulihkan izin. |
Operasi berisiko tinggi pada jaringan dan load balancing
Operasi Berisiko Tinggi | Dampak | Cara Memulihkan |
Modifikasi atau hapus tag yang ditambahkan ACS ke instance SLB. | Instance SLB tidak berfungsi secara normal. | Pulihkan tag. |
Ubah konfigurasi instance SLB yang dikelola oleh ACS, termasuk konfigurasi instance, listener, dan grup vServer. | Instance SLB tidak berfungsi secara normal. | Pulihkan konfigurasi SLB. |
Hapus anotasi | Instance SLB yang ada tidak berfungsi secara normal. | Tambahkan anotasi ke konfigurasi Service. Catatan Jika sebuah Service dikonfigurasikan untuk menggunakan instance SLB yang ada, Anda tidak dapat mengubah konfigurasi untuk membuat instance SLB baru untuk Service tersebut. Untuk menggunakan instance SLB baru, Anda harus membuat Service baru. |
Hapus instance SLB yang dibuat oleh ACS di konsol SLB. | Kesalahan mungkin terjadi dalam jaringan kluster. | Hapus instance SLB dengan menghapus Service yang terkait dengan instance SLB tersebut. Untuk informasi lebih lanjut tentang cara menghapus Service, lihat Hapus Service. |
Hapus secara manual Service | NGINX Ingress controller tidak berjalan secara normal dan mungkin berhenti berjalan. | Gunakan template YAML berikut untuk membuat Service dengan nama yang sama: |
Operasi berisiko tinggi pada penyimpanan
Operasi Berisiko Tinggi | Dampak | Cara Memulihkan |
Lepaskan disk dari pod di konsol Elastic Compute Service (ECS). | Kesalahan I/O terjadi saat Anda menulis data ke pod. | Mulai ulang pod. |
Mount disk ke beberapa pod. | Data pod ditulis ke disk lokal atau kesalahan I/O terjadi saat Anda menulis data ke pod. | Mount disk hanya ke satu pod. Penting Disk Alibaba Cloud tidak dapat dibagi. Setiap disk hanya dapat dimount ke satu pod. |
Hapus secara manual direktori File Storage NAS (NAS) yang dimount ke pod. | Kesalahan I/O terjadi saat Anda menulis data ke pod. | Mulai ulang pod. |
Operasi berisiko tinggi pada log
Operasi Berisiko Tinggi | Dampak | Cara Memulihkan |
Hapus CustomResourceDefinitions (CRDs) aliyunlogconfig. | Log gagal dikumpulkan. | Buat ulang CRDs aliyunlogconfig yang dihapus dan sumber daya terkait. Log yang dihasilkan selama periode waktu ketika CRDs aliyunlogconfig tidak ada tidak dapat dikumpulkan. Jika Anda menghapus CRDs aliyunlogconfig, tugas pengumpulan log terkait juga dihapus. Setelah Anda membuat ulang CRDs aliyunlogconfig, Anda juga harus meluncurkan kembali tugas pengumpulan log. |
Copot komponen logging. | Log gagal dikumpulkan. | Instal ulang komponen logging dan buat secara manual CRDs aliyunlogconfig. Log yang dihasilkan selama periode waktu ketika komponen logging tidak ada tidak dapat dikumpulkan. Jika Anda menghapus komponen logging, CRDs aliyunlogconfig dan Logtail juga dihapus. Log yang dihasilkan selama periode waktu ketika komponen logging tidak ada tidak dapat dikumpulkan. |