全部产品
Search
文档中心

Container Service for Kubernetes:Catatan rilis ACK untuk 2025

更新时间:Dec 09, 2025

Topik ini menjelaskan catatan rilis terbaru untuk Container Service for Kubernetes (ACK).

Informasi latar belakang

  • Untuk informasi mengenai versi Kubernetes yang didukung oleh Container Service for Kubernetes (ACK), lihat Panduan versi.

  • Container Service for Kubernetes (ACK) mendukung sistem operasi seperti ContainerOS, Alibaba Cloud Linux 3 Container Optimized Edition, Alibaba Cloud Linux 3, Alibaba Cloud Linux 3 for Arm, Alibaba Cloud Linux UEFI 3, Red Hat, Ubuntu, dan Windows. Untuk informasi selengkapnya, lihat Sistem operasi.

Oktober 2025

Produk

Fitur

Deskripsi

Wilayah

Referensi

Dukungan penjadwalan GPU menggunakan DRA

Dalam skenario pelatihan dan inferensi AI di mana beberapa aplikasi perlu berbagi sumber daya GPU, Anda dapat menerapkan driver NVIDIA Dynamic Resource Allocation (DRA) di kluster ACK untuk mengatasi keterbatasan penjadwalan plug-in perangkat tradisional. API DRA Kubernetes memungkinkan alokasi GPU secara dinamis dan kontrol sumber daya detail halus di antara pod, sehingga meningkatkan pemanfaatan GPU dan mengurangi biaya.

Semua

Jadwalkan GPU menggunakan DRA

Distributed Cloud Container Platform for Kubernetes (ACK One)

Kluster terdaftar mendukung reservasi kapasitas GPU-HPN ACS

Dengan mendaftarkan kluster Kubernetes di tempat ke cloud dan menggunakan mekanisme reservasi kapasitas GPU High-Performance Network (GPU-HPN), Anda dapat mengelola serta menjadwalkan sumber daya GPU di tempat dan cloud secara seragam. Hal ini menyediakan komputasi berkinerja tinggi dan stabil untuk beban kerja utama seperti pelatihan dan inferensi AI.

Semua

Contoh penggunaan daya komputasi GPU HPN ACS dalam kluster terdaftar ACK One

Dukungan pengumpulan metrik komponen lapisan kontrol menggunakan Prometheus yang dikelola sendiri

Untuk lingkungan cloud hibrida yang menggunakan sistem pemantauan Prometheus yang dikelola sendiri, Anda dapat menginstal komponen Metrics Aggregator dan mengonfigurasi ServiceMonitor guna mengelola status kesehatan lapisan kontrol kluster terdaftar ACK One secara terpusat. Pendekatan ini mengintegrasikan metrik komponen inti ke dalam sistem pemantauan yang ada untuk peringatan dan observabilitas terpadu.

Semua

Kumpulkan metrik komponen lapisan kontrol menggunakan Prometheus yang dikelola sendiri

Cloud Native AI Suite

Dukungan pengiriman pekerjaan pelatihan terdistribusi PyTorch yang dipercepat eRDMA menggunakan Arena

Dalam pelatihan GPU multi-node, jika latensi komunikasi jaringan menurunkan kinerja keseluruhan, Anda dapat menggunakan Arena untuk mengirimkan pekerjaan terdistribusi PyTorch dan mengonfigurasi akselerasi jaringan elastic Remote Direct Memory Access (eRDMA). Hal ini memperpendek siklus pelatihan model melalui komunikasi berlatensi rendah dan throughput tinggi antar node, sehingga meningkatkan efisiensi pelatihan dan pemanfaatan kluster.

Semua

Kirimkan pekerjaan pelatihan terdistribusi PyTorch yang dipercepat eRDMA menggunakan Arena

September 2025

Produk

Fitur

Deskripsi

Wilayah

Referensi

Container Service for Kubernetes

Dukungan untuk Kubernetes 1.34

ACK kini mendukung Kubernetes 1.34. Anda dapat membuat kluster yang menjalankan Kubernetes 1.34 atau meningkatkan kluster yang ada ke Kubernetes 1.34.

Semua

Kubernetes 1.34

Dukungan untuk kelompok node cloud hibrida

Untuk mengelola sumber daya server di tempat dalam kluster ACK, Anda dapat membuat kelompok node cloud hibrida dalam kluster ACK Pro untuk mencapai penjadwalan elastis dan optimalisasi biaya untuk sumber daya cloud dan di tempat. Tambahkan node cloud hibrida yang ada ke kluster untuk memanfaatkan aset TI saat ini sambil mempertahankan orkestrasi terpadu.

Semua

Buat dan kelola kelompok node cloud hibrida

Dukungan untuk mengonfigurasi resolusi DNS untuk kelompok node cloud hibrida

Jika kelompok node cloud hibrida menggunakan CoreDNS di cloud untuk resolusi nama domain, akses yang sering dapat meningkatkan beban pada jalur sewa dan dapat menyebabkan kegagalan resolusi karena koneksi yang tidak stabil. Anda dapat mengonfigurasi NodeLocal DNSCache untuk mengurangi masalah ini.

Semua

Konfigurasi NodeLocal DNSCache untuk kelompok node cloud hibrida

Dukungan untuk plug-in jaringan Terway Hybrid

Saat kelompok node cloud hibrida terhubung ke pusat data di tempat, topologi jaringan yang kompleks dan persyaratan perutean lintas domainnya melebihi kemampuan plug-in jaringan kontainer biasa. Plug-in jaringan Terway Hybrid dirancang khusus untuk kelompok node cloud hibrida dan memastikan konektivitas jaringan antar pod dalam kluster, baik yang berada di pusat data maupun di cloud.

Semua

Gunakan plug-in jaringan Terway Hybrid

ossfs 2.0 mendukung autentikasi RRSA

Untuk aplikasi yang memerlukan penyimpanan persisten atau berbagi data di antara beberapa pod, Anda dapat memasang bucket OSS sebagai volume ossfs 2.0 menggunakan PV yang disediakan secara dinamis. Kami merekomendasikan penggunaan RAM Roles for Service Accounts (RRSA) untuk autentikasi. RRSA menyediakan tingkat keamanan yang lebih tinggi dengan kredensial sementara yang diputar-otomatis dan mendukung isolasi izin tingkat pod, sehingga cocok untuk lingkungan produksi, multitenan, dan lingkungan keamanan tinggi lainnya.

Semua

Gunakan volume ossfs 2.0 yang disediakan secara dinamis

Distributed Cloud Container Platform for Kubernetes (ACK One)

Dukungan untuk mengakses daya komputasi GPU cloud

Kluster terdaftar ACK One mendukung penjadwalan dan O&M terpadu untuk berbagai sumber daya komputasi heterogen. Hal ini secara signifikan meningkatkan pemanfaatan sumber daya kluster Kubernetes yang menggunakan komputasi heterogen.

Semua

Akses daya komputasi GPU cloud

Dukungan untuk memigrasikan aplikasi kluster tunggal ke armada dan mendistribusikannya ke beberapa kluster

Untuk mengatasi masalah seperti operasi berulang, kesalahan, dan kesulitan sinkronisasi dalam penerapan aplikasi multi-kluster, Anda dapat menggunakan antarmuka baris perintah (CLI) AMC untuk menerapkan aplikasi dengan cepat ke beberapa kluster. Hal ini juga memungkinkan pengelolaan terpadu dan sinkronisasi otomatis untuk pembaruan selanjutnya.

Semua

Migrasikan aplikasi kluster tunggal ke armada dan distribusikan ke beberapa kluster

Agustus 2025

Produk

Fitur

Deskripsi

Wilayah

Referensi

Container Service for Kubernetes

Dukungan untuk penyeimbangan beban yang sadar KV Cache menggunakan perutean inferensi pintar

Penyeimbangan beban yang sadar KV Cache dirancang untuk skenario inferensi AI generatif. Permintaan dialokasikan secara dinamis ke node komputasi optimal untuk secara signifikan meningkatkan efisiensi layanan model bahasa besar (LLM).

Semua

Gunakan perutean yang sadar cache awalan dalam mode presisi

Dukungan untuk plug-in CNI kustom

Plug-in Container Network Interface (CNI) Terway dan Flannel bawaan yang disediakan oleh ACK memenuhi sebagian besar kebutuhan jaringan kontainer. Namun, dalam beberapa skenario, untuk menggunakan fitur khusus dari plug-in CNI lainnya, ACK memungkinkan Anda menginstal plug-in CNI kustom di kluster Anda menggunakan mode Bring Your Own CNI (BYOCNI).

Semua

Gunakan plug-in CNI kustom di kluster ACK

Kluster mode hosting cerdas mendukung komponen governance kebijakan terkelola

Untuk memenuhi persyaratan kepatuhan kluster dan meningkatkan keamanan kluster, aktifkan fitur manajemen kebijakan keamanan. Aturan kebijakan keamanan mencakup Infra, Compliance, Pod Security Policy (PSP), dan K8s-general.

Semua

Aktifkan manajemen kebijakan keamanan

Knative mendukung daya komputasi ACS

Layanan Knative dapat dikonfigurasi untuk menggunakan daya komputasi Container Compute Service (ACS). Jenis komputasi yang beragam dan kualitas ACS membantu memenuhi tuntutan beban kerja dari berbagai skenario bisnis dan mengoptimalkan biaya.

Semua

Gunakan sumber daya ACS

Gateway dengan Ekstensi Inferensi mendukung konfigurasi yang lebih fleksibel

  • Dukungan untuk konfigurasi ekstensi inferensi kustom: Anda dapat menyesuaikan kebijakan perutean dengan mengonfigurasi anotasi atau memodifikasi dan menimpa konfigurasi penerapan ekstensi dengan membuat ConfigMap.

  • Dukungan untuk konfigurasi Gateway kustom: Anda dapat menyesuaikan parameter Gateway yang sebenarnya, seperti jenis layanan, jumlah replika penerapan, dan sumber daya, dengan memodifikasi konfigurasi sumber daya EnvoyProxy.

Semua

Dukungan untuk menerapkan layanan inferensi vLLM secara aman di kluster komputasi rahasia ACK untuk komputasi heterogen

Inferensi model bahasa besar (LLM) melibatkan data sensitif dan aset model inti, yang berisiko bocor saat dijalankan di lingkungan yang tidak tepercaya. Solusi ACK Confidential AI (ACK-CAI) mengintegrasikan teknologi komputasi rahasia berbasis perangkat keras seperti Intel Trust Domain Extensions (TDX) dan Trusted Execution Environments (TEE) GPU untuk menyediakan keamanan ujung ke ujung bagi inferensi model.

Semua

Terapkan layanan inferensi vLLM secara aman di kluster komputasi rahasia ACK untuk komputasi heterogen

Cloud Native AI Suite

AI Inference Suite diluncurkan

Dengan penggunaan luas model bahasa besar (LLM), penerapan dan pengelolaan yang efisien, stabil, dan skalabel di lingkungan produksi telah menjadi tantangan inti bagi perusahaan. Cloud Native AI Inference Suite (AI Serving Stack), yang dibangun di atas Alibaba Cloud Container Service for Kubernetes, adalah solusi ujung ke ujung yang dirancang untuk inferensi AI berbasis cloud-native. Suite ini mengatasi seluruh siklus hidup inferensi LLM, menyediakan kemampuan terintegrasi untuk manajemen penerapan, perutean pintar, skalabilitas elastis, dan observabilitas mendalam. Baik Anda baru memulai atau sudah memiliki operasi AI berskala besar, Cloud Native AI Inference Suite dapat menangani skenario inferensi AI berbasis cloud-native yang kompleks.

Semua

AI Inference Suite

Juli 2025

Produk

Fitur

Deskripsi

Wilayah

Referensi

Container Service for Kubernetes

Dukungan untuk mengakses metadata instans ECS hanya dalam mode diberlakukan

Anda dapat mengambil metadata ECS, seperti ID instans, informasi VPC, dan informasi network interface card, dari dalam instans ECS menggunakan Instance Metadata Service (IMDS). Di kluster ACK, mode akses default untuk metadata instans node kompatibel dengan mode normal dan mode diberlakukan. Anda dapat beralih ke mode diberlakukan saja (IMDSv2) untuk meningkatkan keamanan IMDS lebih lanjut.

Semua

Akses metadata instans ECS hanya dalam mode diberlakukan

Dukungan untuk berlangganan citra dari sumber luar negeri

Untuk menyinkronkan citra secara berkala dari repositori citra luar negeri seperti Docker Hub, Google Container Registry (GCR), dan Quay ke instans Edisi Perusahaan, Anda dapat menggunakan fitur langganan artefak dari instans Edisi Perusahaan.

Semua

Dapatkan citra dari sumber luar negeri melalui langganan artefak

Dukungan untuk memasang sistem file NAS menggunakan klien EFC melalui CNFS

Extreme File Client (EFC) menyediakan kemampuan seperti caching terdistribusi untuk meningkatkan kinerja akses Penyimpanan File NAS. EFC juga mendukung akses konkurensi tinggi dan paralel ke set data besar, sehingga cocok untuk skenario aplikasi kontainer yang intensif data dan berkonkurensi tinggi, seperti analitik data besar, pelatihan AI, dan inferensi AI. Dibandingkan dengan pemasangan NAS menggunakan protokol NFS default, pemasangan NAS menggunakan EFC dapat mempercepat akses file serta meningkatkan kinerja baca-tulis.

Semua

Pasang sistem file NAS menggunakan klien EFC melalui CNFS

Distributed Cloud Container Platform for Kubernetes (ACK One)

Dukungan untuk pengalaman GitOps berbasis konsol

Anda dapat menggunakan konsol untuk mengelola berbagai kemampuan GitOps, termasuk mengaktifkan atau menonaktifkan fitur, mengaktifkan akses jaringan publik dan mengonfigurasi daftar kontrol akses (ACL), menggunakan UI ApplicationSet, mengonfigurasi ConfigMap Argo CD dan memulai ulang komponen, serta memanfaatkan fitur observabilitas pemantauan dan pencatatan log.

Semua

Panduan Cepat GitOps

GitOps multi-kluster mendukung konfigurasi ConfigMap Argo CD

ACK One memungkinkan Anda mengelola fitur dan izin terkait GitOps dengan mengonfigurasi ConfigMap Argo CD.

Semua

Konfigurasi ConfigMap Argo CD

Dukungan untuk mengaktifkan penjadwalan elastis yang sadar inventaris untuk armada multi-kluster

Dalam penerapan aplikasi multi-wilayah, armada multi-kluster ACK One menggunakan penjadwal pintar yang sadar inventaris untuk mengelola alokasi sumber daya. Penjadwal ini bekerja sama dengan elastisitas instan. Jika kluster dalam armada memiliki sumber daya yang tidak mencukupi, layanan aplikasi dijadwalkan ke kluster yang memiliki inventaris tersedia. Fitur elastisitas instan kemudian memperluas kapasitas node yang diperlukan di kluster tersebut untuk mengakomodasi layanan. Pendekatan ini meningkatkan tingkat keberhasilan penjadwalan dan mengurangi biaya sumber daya.

Semua

Aktifkan penjadwalan elastis yang sadar inventaris untuk armada multi-kluster

Container Service for Edge (ACK Edge)

Dukungan untuk mengonfigurasi PrivateLink untuk akses jalur sewa

Kluster ACK Edge mendukung akses jaringan melalui jalur sewa. Hal ini memungkinkan node edge dalam kluster ACK Edge mengakses layanan Alibaba Cloud seperti ACK dan Container Registry (ACR) secara aman dan efisien, sekaligus mengatasi masalah seperti konflik jaringan dan kurangnya alamat IP tetap.

Semua

Konfigurasi PrivateLink untuk akses jalur sewa

Juni 2025

Produk

Fitur

Deskripsi

Wilayah

Referensi

Container Service for Kubernetes

Gunakan AI Profiling di konsol

AI Profiling adalah alat analisis kinerja non-intrusif berbasis extended Berkeley Packet Filter (eBPF) dan injeksi proses dinamis. Alat ini dirancang secara native untuk skenario kontainer Kubernetes dan mendukung deteksi online proses kontainer yang menjalankan pekerjaan GPU. AI Profiling menyediakan kemampuan pengumpulan data yang komprehensif dan memungkinkan Anda memulai dan menghentikan pengumpulan data kinerja secara dinamis pada pekerjaan GPU yang sedang berjalan. Untuk layanan online, alat profiling yang dapat dilampirkan dan dilepas secara dinamis ini memungkinkan analisis real-time dan mendetail tanpa memodifikasi kode layanan.

Semua

AI Profiling

Pemulihan otomatis node GPU

Fitur pemulihan otomatis node kini mendukung pemulihan otomatis untuk kegagalan instans yang disebabkan oleh anomali perangkat lunak dan perangkat keras GPU.

ACK menyediakan pemulihan otomatis sisi Kubernetes untuk kegagalan instans pada node Elastic GPU Service (EGS) dan node Lingjun yang mendasarinya yang disebabkan oleh anomali perangkat lunak dan perangkat keras GPU. Fitur ini menawarkan kemampuan O&M otomatis untuk seluruh proses, mulai dari deteksi kesalahan, peringatan, isolasi otomatis, hingga pengosongan node dan perbaikan otomatis. Fitur ini juga mendukung pelaksanaan perbaikan hanya setelah otorisasi pengguna, yang lebih meningkatkan kemampuan O&M kesalahan otomatis dan mengurangi biaya O&M kluster.

Semua

Aktifkan pemulihan otomatis node

Volume yang disediakan secara statis untuk CPFS for Lingjun

CPFS for Lingjun memberikan throughput dan operasi input/output per detik (IOPS) ultra-tinggi serta mendukung akselerasi jaringan RDMA ujung ke ujung. CPFS for Lingjun cocok untuk skenario komputasi cerdas seperti AIGC dan kendaraan otonom. Anda dapat membuat volume yang disediakan secara statis untuk CPFS for Lingjun di kluster Anda dan menggunakannya dalam beban kerja.

Semua

Gunakan CPFS for Lingjun dengan volume yang disediakan secara statis

Komponen CNI ACK VPD

Komponen CNI ACK VPD menyediakan manajemen jaringan kontainer untuk node Lingjun di kluster ACK Pro. Sebagai plug-in CNI untuk node Lingjun, CNI ACK VPD mengalokasikan dan mengelola sumber daya jaringan kontainer untuk node Lingjun yang menggunakan Lingjun Connect.

Semua

ACK VPD CNI

Komponen ack-kms-agent-webhook-injector

ack-kms-agent-webhook-injector menyuntikkan Key Management Service (KMS) Agent sebagai kontainer sidecar ke dalam pod. Hal ini memungkinkan pod aplikasi menggunakan antarmuka HTTP lokal untuk mengambil kredensial dari instans KMS melalui KMS Agent dan menyimpannya dalam memori. Hal ini menghindari hardcoding informasi sensitif dan meningkatkan keamanan data.

Semua

Impor kredensial KMS Alibaba Cloud untuk aplikasi

Kemampuan diperluas untuk komponen Gateway dengan Ekstensi Inferensi

Gateway dengan Ekstensi Inferensi mendukung berbagai kerangka kerja layanan inferensi AI generatif, seperti vLLM dan SGLang. Gateway ini menyediakan kemampuan yang ditingkatkan untuk layanan inferensi AI generatif yang diterapkan berdasarkan kerangka kerja yang berbeda. Kemampuan ini mencakup dukungan untuk membuat kebijakan rilis bertahap, penyeimbangan beban inferensi, dan perutean berbasis nama model. Anda juga dapat mengonfigurasi kebijakan pembatasan laju dan pemutusan sirkuit untuk layanan inferensi.

Semua

Ikhtisar Gateway dengan Ekstensi Inferensi

Implementasikan solusi kontainer rahasia CAA berdasarkan VM rahasia

Dalam skenario yang memerlukan komputasi rahasia, seperti pengendalian risiko keuangan dan layanan kesehatan, Anda dapat menerapkan beban kerja komputasi rahasia di kluster ACK menggunakan solusi Cloud API Adaptor (CAA). Solusi ini menggunakan teknologi Intel® TDX untuk melindungi data sensitif dari serangan eksternal atau potensi ancaman dari penyedia cloud, membantu Anda memenuhi persyaratan kepatuhan industri.

Semua

Implementasikan solusi kontainer rahasia CAA berdasarkan VM rahasia

Cloud Native AI Suite

Jadwalkan alur kerja Dify menggunakan XXL-JOB

Alur kerja Dify dalam banyak skenario, seperti pemantauan risiko, analitik data, pembuatan konten, dan sinkronisasi data, bergantung pada penjadwalan untuk mengotomatiskan pekerjaan. Namun, Dify tidak mendukung penjadwalan secara native. Untuk mengatasi hal ini, praktik terbaik ini menjelaskan cara mengintegrasikan XXL-JOB, penjadwal pekerjaan terdistribusi, untuk menjadwalkan dan memantau status aplikasi alur kerja serta memastikan operasinya yang stabil.

Semua

Jadwalkan aplikasi alur kerja Dify menggunakan XXL-JOB

Mei 2025

Produk

Fitur

Deskripsi

Wilayah

Referensi

Container Service for Kubernetes

Dukungan untuk Kubernetes 1.33

Dukungan untuk Kubernetes 1.33 tersedia. Anda dapat membuat kluster yang menjalankan Kubernetes 1.33 atau meningkatkan kluster yang ada ke Kubernetes 1.33.

Semua

Kubernetes 1.33

Komponen ack-ram-authenticator diinstal secara default

Mulai dari Kubernetes 1.33, versi terbaru komponen terkelola ack-ram-authenticator diinstal secara default pada kluster ACK yang dikelola yang baru dibuat. Hal ini tidak mengonsumsi sumber daya node kluster Anda.

Semua

[Pemberitahuan layanan] Komponen ack-ram-authenticator diinstal secara default pada kluster ACK yang dikelola yang menjalankan Kubernetes 1.33 dan versi lebih baru

containerd 2.1.1 dirilis

containerd 2.1.1 mendukung fitur seperti Node Resource Interface (NRI), Container Device Interface (CDI), dan Sandbox API.

Semua

Catatan rilis runtime containerd

Dukungan untuk ossfs 2.0

ossfs 2.0 adalah klien berbasis Filesystem in Userspace (FUSE) yang dapat memasang Alibaba Cloud OSS sebagai sistem file lokal. Hal ini memungkinkan kontainer aplikasi mengakses data OSS melalui operasi POSIX seolah-olah mengakses file lokal. Dibandingkan dengan ossfs 1.0, ossfs 2.0 memberikan peningkatan kinerja dalam operasi baca-tulis berurutan dan pembacaan file kecil berkonkurensi tinggi. ossfs 2.0 cocok untuk skenario yang memerlukan kinerja akses penyimpanan tinggi, seperti pelatihan AI, inferensi, pemrosesan data besar, dan kendaraan otonom.

Semua

ossfs 2.0

Distributed Cloud Container Platform for Kubernetes (ACK One)

Gunakan ApplicationSet untuk mengoordinasikan penerapan multi-lingkungan dan dependensi aplikasi

Praktik terbaik baru tersedia. Praktik ini menjelaskan cara membangun sistem penerapan otomatis yang mendukung manajemen dependensi untuk beberapa aplikasi antara lingkungan pengembangan dan pra-produksi. Hal ini didasarkan pada fitur Progressive Syncs Argo CD dan kemampuan orkestrasi sumber daya multi-lingkungan ApplicationSet.

Semua

Gunakan ApplicationSet untuk mengoordinasikan penerapan multi-lingkungan dan dependensi aplikasi

April 2025

Produk

Fitur

Deskripsi

Wilayah

Referensi

Container Service for Kubernetes

Buat dan kelola kelompok node Lingjun

Anda dapat membuat dan mengelola kelompok node Lingjun di kluster ACK Pro.

Semua

Kelompok node Lingjun

Konfigurasikan kelompok node dengan menentukan properti instans

Anda dapat mengonfigurasi tipe instans kelompok node dengan menentukan properti instans, seperti vCPU dan memori. Kelompok node secara otomatis memilih tipe instans yang memenuhi persyaratan untuk memperluas kapasitas, yang meningkatkan tingkat keberhasilan operasi memperluas kapasitas.

Semua

Konfigurasi kelompok node dengan menentukan properti instans

AI Profiling real-time

Dalam skenario kontainer Kubernetes, AI Profiling adalah alat analisis kinerja non-intrusif berbasis eBPF dan injeksi proses dinamis. AI Profiling mendukung deteksi online proses kontainer yang menjalankan pekerjaan GPU. Untuk layanan online, alat profiling yang dapat dilampirkan dan dilepas secara dinamis ini memungkinkan analisis real-time dan mendetail tanpa memodifikasi kode layanan.

Semua

Gunakan AI Profiling dari baris perintah

Aktifkan preemption

Saat sumber daya kluster langka, pekerjaan prioritas tinggi mungkin gagal berjalan karena sumber daya tidak mencukupi. Setelah Anda mengaktifkan preemption, penjadwal ACK dapat menggunakan impersonasi sumber daya untuk mengidentifikasi dan mengusir pod prioritas rendah, melepaskan sumber daya komputasi untuk memastikan pekerjaan prioritas tinggi segera dimulai.

Semua

Aktifkan preemption

Akses layanan melalui Gateway dengan Ekstensi Inferensi

Komponen Gateway dengan Ekstensi Inferensi dibangun di atas proyek Envoy Gateway. Komponen ini mendukung seluruh kemampuan dasar Gateway API dan sumber daya ekstensi Envoy Gateway open source.

Semua

Akses layanan melalui Gateway dengan Ekstensi Inferensi

Penyempurnaan untuk layanan AI generatif

Anda dapat menggunakan komponen Gateway dengan Ekstensi Inferensi untuk mengimplementasikan fitur seperti perutean pintar, manajemen lalu lintas yang efisien, rilis bertahap untuk layanan inferensi AI generatif, pemutusan sirkuit untuk layanan inferensi, dan pencerminan lalu lintas untuk layanan inferensi.

Semua

Penyempurnaan untuk layanan AI generatif

Pencadangan dan pemulihan volume persisten PVC-ke-PVC

Anda dapat mencadangkan dan memulihkan data disk dalam kluster ACK di cloud, atau antar kluster ACK di wilayah yang sama atau berbeda. Setelah pencadangan selesai di kluster sumber, Anda dapat menggunakan pusat cadangan untuk memulihkan serangkaian klaim volume persisten (PVC) baru dan PV yang sesuai di kluster saat ini atau kluster lain. Anda kemudian dapat memasangnya langsung tanpa menyesuaikan konfigurasi YAML beban kerja apa pun.

Semua

Pusat cadangan

alibabacloud-privateca-issuer dirilis

AlibabaCloud Private CA Issuer dirilis. Issuer ini memungkinkan Anda menggunakan cert-manager untuk membuat dan mengelola sertifikat Alibaba Cloud Private CA di kluster Anda. Issuer ini kini tersedia di Pasar Aplikasi ACK.

Semua

None

Terapkan beban kerja dan implementasikan penyeimbangan beban di kluster ACK yang dikelola (mode hosting cerdas)

Topik ini menjelaskan cara menerapkan beban kerja di kluster ACK yang dikelola (mode hosting cerdas) dan menggunakan ALB Ingress untuk akses jaringan publik. Setelah Anda menyelesaikan langkah-langkahnya, Anda dapat mengakses aplikasi melalui nama domain yang dikonfigurasi untuk mencapai manajemen lalu lintas eksternal dan penyeimbangan beban yang efisien.

Semua

Terapkan beban kerja dan implementasikan penyeimbangan beban

Praktik terbaik untuk Datapath V2

Topik ini menjelaskan cara mengoptimalkan konfigurasi jaringan kluster yang menggunakan plug-in jaringan Terway setelah Datapath V2 diaktifkan. Hal ini mencakup mengonfigurasi parameter Conntrack dan mengelola sumber daya Identity untuk meningkatkan kinerja dan stabilitas kluster.

Semua

Praktik terbaik untuk Datapath V2

Panduan peningkatan komponen Dify

Praktik terbaik baru tersedia. Praktik ini menjelaskan cara meningkatkan ack-dify dari versi sebelumnya ke v1.0.0 atau lebih baru. Langkah-langkahnya mencakup pencadangan data, instalasi alat migrasi plug-in ke dalam sistem plug-in, dan mengaktifkan ekosistem plug-in baru.

Semua

Tingkatkan komponen Dify di kluster ACK

Distributed Cloud Container Platform for Kubernetes (ACK One)

Gunakan PrivateLink untuk menyelesaikan konflik alamat IP di segmen jaringan pusat data

Setelah kluster Kubernetes di pusat data terhubung ke kluster terdaftar ACK One melalui jalur sewa, konflik dapat terjadi saat Anda menggunakan sumber daya komputasi Serverless karena layanan lain di jaringan internal menggunakan segmen jaringan yang sama. Gunakan PrivateLink untuk menyelesaikan konflik alamat IP di segmen jaringan pusat data.

Semua

Gunakan PrivateLink untuk menyelesaikan konflik alamat IP di segmen jaringan pusat data

Penjadwalan pod ACS lintas wilayah

Kluster terdaftar ACK One mendukung integrasi tanpa hambatan sumber daya komputasi Serverless dari berbagai wilayah ke dalam kluster Kubernetes. Hal ini memungkinkan penjadwalan dinamis dan pengelolaan terpadu sumber daya GPU lintas wilayah.

Semua

Penjadwalan pod ACS lintas wilayah

Pengumpulan log

Anda dapat mengonfigurasi pengumpulan log menggunakan CRD SLS atau variabel lingkungan untuk mengumpulkan log kontainer secara otomatis berdasarkan Alibaba Cloud Simple Log Service (SLS).

Semua

Container Service for Edge (ACK Edge)

Versi 1.32 dirilis

Versi 1.32 didukung. Fitur-fiturnya mencakup pengoptimalan permintaan dari CoreDNS, kube-proxy, dan kubelet ke kube-apiserver, serta pengurangan lalu lintas komunikasi cloud-ke-edge.

Semua

Catatan rilis ACK Edge dengan Kubernetes 1.32

Konfigurasi elemen jaringan di lingkungan jalur sewa

Anda dapat menghubungkan perangkat server IDC pusat data di tempat ke kluster melalui Internet atau jalur sewa untuk manajemen kontainerisasi. Saat Anda terhubung melalui jalur sewa, Anda harus mengonfigurasi elemen jaringan infrastruktur sebelum akses.

Semua

Konfigurasi elemen jaringan di lingkungan jalur sewa

Cloud Native AI Suite

Dukungan untuk komponen HistoryServer

Ray Dashboard native hanya tersedia saat kluster berjalan. Setelah kluster dihentikan, Anda tidak dapat memperoleh log historis dan data pemantauan. Anda dapat menggunakan RayCluster HistoryServer untuk mengumpulkan log node secara real-time selama runtime kluster dan menyimpannya secara persisten ke OSS.

Semua

Instal komponen HistoryServer di ACK

Dukungan untuk komponen KubeRay

Anda dapat menerapkan komponen KubeRay Operator dan mengintegrasikannya dengan pemantauan SLS dan Prometheus Alibaba Cloud untuk meningkatkan manajemen log, observabilitas sistem, dan ketersediaan tinggi.

Semua

Instal komponen KubeRay di ACK

Maret 2025

Produk

Fitur

Deskripsi

Wilayah

Referensi

Container Service for Kubernetes

Kluster ACK Pro mendukung mode hosting cerdas

Saat membuat kluster ACK yang dikelola, Anda dapat mengaktifkan mode hosting cerdas untuk dengan cepat membuat kluster Kubernetes yang mengikuti praktik terbaik.

Setelah kluster dibuat, kelompok node yang dikelola secara cerdas dibuat secara default. Kelompok node ini secara dinamis memperluas atau memperkecil kapasitas berdasarkan kebutuhan beban kerja. ACK bertanggung jawab atas tugas O&M seperti peningkatan versi sistem operasi, peningkatan versi perangkat lunak, dan perbaikan kerentanan keamanan.

Semua

Dukungan untuk mengaktifkan analisis pelacakan untuk komponen lapisan kontrol dan bidang data

Setelah Anda mengaktifkan analisis pelacakan untuk server API atau kubelet kluster, informasi jejak secara otomatis dilaporkan ke Managed Service for OpenTelemetry. Hal ini menyediakan data pemantauan seperti detail jejak yang divisualisasikan dan topologi real-time.

Semua

Notifikasi pesan teks dan email untuk KubeConfig berisiko tinggi dirilis

Anda dapat menerima notifikasi pesan teks dan email mengenai KubeConfig yang telah dihapus tetapi masih menimbulkan risiko bagi akun Anda.

Semua

None

Dukungan untuk menerapkan perutean pintar dan manajemen lalu lintas menggunakan ACK Gateway dengan Ekstensi Inferensi

Anda dapat menggunakan komponen ACK Gateway dengan Ekstensi Inferensi untuk mengonfigurasi ekstensi layanan inferensi guna menerapkan perutean pintar dan manajemen lalu lintas yang efisien.

Semua

Gunakan Gateway dengan Ekstensi Inferensi untuk menerapkan perutean pintar dan manajemen lalu lintas

Distributed Cloud Container Platform for Kubernetes (ACK One)

Dukungan untuk pengelolaan terpadu komponen armada multi-kluster

Armada ACK One menyediakan pengelolaan komponen terpadu dan otomatis untuk insinyur O&M kluster. Anda dapat menentukan garis dasar yang mencakup beberapa komponen beserta versinya, lalu menerapkannya ke beberapa kluster. Fitur ini juga mendukung konfigurasi komponen, penerapan batch, dan rollback untuk meningkatkan stabilitas sistem.

Semua

Pengelolaan komponen multi-kluster

Dukungan untuk distribusi dinamis dan penjadwalan ulang

Armada ACK One dapat menggunakan PropagationPolicy untuk membagi replika beban kerja berdasarkan sumber daya yang tersedia di sub-kluster. Secara default, penjadwalan ulang diaktifkan pada armada ACK One. Pemeriksaan otomatis dilakukan setiap dua menit. Jika pod tetap dalam keadaan tidak dapat dijadwalkan selama lebih dari 30 detik, replika tersebut dijadwalkan ulang.

Semua

Distribusi dinamis dan penjadwalan ulang

Cloud Native AI Suite

Dukungan untuk mengatur prioritas antrian Slurm

Praktik terbaik baru tersedia yang menjelaskan cara menggunakan kebijakan konfigurasi antrian yang sesuai dalam lingkungan sistem Slurm. Kebijakan ini membantu menjadwalkan dan memproses jumlah pekerjaan maksimum saat pekerjaan diajukan atau statusnya berubah, sehingga mengoptimalkan kinerja.

Semua

Atur prioritas antrian Slurm di kluster ACK

Februari 2025

Produk

Fitur

Deskripsi

Wilayah

Referensi

Container Service for Kubernetes

Dukungan untuk memodifikasi grup keamanan dan zona waktu lapisan kontrol

Jika grup keamanan dan zona waktu yang dipilih saat pembuatan kluster tidak lagi memenuhi kebutuhan Anda, Anda dapat memodifikasi grup keamanan lapisan kontrol dan zona waktu kluster di halaman informasi dasar kluster.

Semua

Lihat informasi kluster

Kelompok node mendukung konfigurasi containerd kustom

Anda dapat menyesuaikan pengaturan parameter containerd untuk node dalam kelompok node. Misalnya, Anda dapat mengonfigurasi beberapa repositori mirror untuk repositori citra tertentu atau melewati verifikasi sertifikat keamanan untuk repositori citra tertentu.

Semua

Sesuaikan parameter containerd untuk kelompok node

Tips kekuatan elastisitas ditambahkan untuk kelompok node

Saat kelompok node diperluas kapasitasnya, operasi tersebut mungkin gagal karena inventaris instans tidak mencukupi atau karena tipe instans ECS tidak didukung di zona yang ditentukan. Anda dapat menggunakan kekuatan elastisitas untuk mengevaluasi ketersediaan konfigurasi kelompok node dan kesehatan penyediaan instans, serta menerima saran konfigurasi yang sesuai.

Semua

Lihat kekuatan elastisitas kelompok node

Dukungan untuk mengaktifkan orkestrasi pekerjaan batch

Argo Workflows adalah mesin alur kerja native Kubernetes yang mendukung orkestrasi pekerjaan paralel melalui YAML atau Python. Argo Workflows menyederhanakan otomatisasi dan manajemen aplikasi kontainer, serta cocok untuk skenario seperti pipeline CI/CD, pemrosesan data, dan pembelajaran mesin. Anda dapat mengaktifkan orkestrasi pekerjaan batch dengan menginstal komponen Argo Workflows dan menggunakan CLI Argo Alibaba Cloud atau konsol untuk membuat serta mengelola tugas alur kerja.

Semua

Aktifkan orkestrasi pekerjaan batch

Deteksi kesalahan GPU

Komponen ack-node-problem-detector yang disediakan oleh ACK memperkuat kemampuan pemantauan aktivitas anomali pada node kluster berdasarkan proyek open source node-problem-detector. Komponen ini menyediakan serangkaian item deteksi kesalahan terkait GPU untuk meningkatkan deteksi kesalahan dalam skenario GPU. Saat kesalahan terdeteksi, Event Kubernetes atau Kondisi Node Kubernetes yang sesuai dihasilkan berdasarkan jenis kesalahan.

Semua

Deteksi dan isolasi otomatis kesalahan GPU

Distributed Cloud Container Platform for Kubernetes (ACK One)

Jadwalkan dan distribusikan pekerjaan Spark multi-kluster berdasarkan sumber daya sisa aktual

Praktik terbaik ini menjelaskan cara menggunakan armada ACK One dan komponen ACK Koordinator untuk menjadwalkan serta mendistribusikan pekerjaan Spark multi-kluster berdasarkan sumber daya sisa aktual setiap kluster (bukan sumber daya yang diminta). Hal ini memaksimalkan pemanfaatan sumber daya menganggur di beberapa kluster dan memastikan operasi normal layanan online melalui kontrol prioritas dan penerapan hibrida offline.

Semua

Jadwalkan dan distribusikan pekerjaan Spark multi-kluster berdasarkan sumber daya sisa aktual

Container Service for Edge (ACK Edge)

Dukungan untuk menambahkan vSwitch pod

Dalam skenario edge ENS, jika kluster ACK Edge menggunakan plug-in Terway Edge, Anda dapat menambahkan vSwitch pod untuk meningkatkan sumber daya alamat IP yang tersedia bagi kluster saat vSwitch memiliki alamat IP yang tidak mencukupi atau blok CIDR pod perlu diperluas.

Semua

Tambahkan vSwitch pod

Pemantauan sumber daya GPU

Kluster ACK Edge dapat mengelola node GPU di pusat data dan di edge, menyatukan pengelolaan daya komputasi heterogen di berbagai wilayah dan lingkungan. Anda dapat menghubungkan kluster ACK Edge ke Pemantauan Prometheus Alibaba Cloud untuk menyediakan kemampuan observabilitas yang sama bagi node GPU di pusat data dan di edge seperti yang ada di cloud.

Semua

Praktik terbaik untuk memantau sumber daya GPU di kluster ACK Edge

Cloud Native AI Suite

Terapkan layanan inferensi model distilasi DeepSeek berbasis ACK

Topik ini menggunakan model DeepSeek-R1-Distill-Qwen-7B sebagai contoh untuk menjelaskan cara menggunakan KServe di Alibaba Cloud Container Service for Kubernetes (ACK) guna menerapkan layanan inferensi model distilasi DeepSeek yang siap produksi.

Semua

Terapkan layanan inferensi model distilasi DeepSeek berbasis ACK

Praktik terbaik untuk menerapkan model DeepSeek lengkap untuk inferensi dalam penerapan multi-node terdistribusi di ACK

Praktik terbaik ini menjelaskan solusi untuk inferensi terdistribusi model besar DeepSeek-R1-671B berbasis ACK. Solusi ini menggunakan kebijakan paralelisme hibrida dan alat Alibaba Cloud Arena untuk mencapai penerapan terdistribusi yang efisien pada dua node. Solusi ini juga menjelaskan cara mengintegrasikan DeepSeek-R1 yang diterapkan ke platform Dify secara mulus untuk dengan cepat membangun sistem chat AI tingkat perusahaan yang mendukung pemahaman teks panjang.

Semua

Praktik untuk menerapkan model DeepSeek lengkap untuk inferensi dalam penerapan multi-node terdistribusi di ACK

Januari 2025

Produk

Fitur

Deskripsi

Wilayah

Referensi

Container Service for Kubernetes

Kelompok node mendukung akselerasi citra sesuai permintaan

ACK mendukung pemuatan citra kontainer sesuai permintaan berdasarkan teknologi akselerasi citra Data Accelerator for Disaggregated Infrastructure (DADI). Hal ini menghilangkan kebutuhan untuk mengunduh citra secara penuh dan memungkinkan dekompresi online untuk secara signifikan mengurangi waktu startup aplikasi.

Semua

Percepat startup kontainer menggunakan pemuatan citra kontainer sesuai permintaan

Dukungan untuk sistem operasi Alibaba Cloud Linux 3 Container Optimized Edition ditambahkan

Alibaba Cloud Linux 3 Container Optimized Edition (Alibaba Cloud Linux 3.2104 LTS 64-bit Container Optimized Edition) adalah versi citra berbasis citra standar default Alibaba Cloud Linux yang dioptimalkan untuk skenario kontainer. Berdasarkan pengalaman praktis luas dari banyak pelanggan Container Service for Kubernetes, Alibaba Cloud mengembangkan citra Alibaba Cloud Linux 3 Container Optimized Edition. Sistem operasi cloud-native yang dikembangkan sendiri ini dirancang untuk memenuhi tuntutan skenario kontainer terhadap kepadatan penerapan yang lebih tinggi, kecepatan startup yang lebih cepat, dan isolasi keamanan yang lebih kuat.

Semua

Dukungan untuk Kubernetes 1.32

ACK kini mendukung Kubernetes 1.32. Anda dapat membuat kluster yang menjalankan Kubernetes 1.32 atau meningkatkan kluster yang ada ke Kubernetes 1.32.

Semua

Kubernetes 1.32

Dukungan untuk meningkatkan pemanfaatan sumber daya menggunakan ElasticQuotaTree dan antrian pekerjaan

Untuk memungkinkan tim dan pekerjaan yang berbeda berbagi sumber daya komputasi dalam kluster sekaligus memastikan alokasi dan isolasi sumber daya yang tepat, Anda dapat menggunakan ack-kube-queue, ElasticQuotaTree, dan ack-scheduler untuk mencapai manajemen sumber daya yang fleksibel.

Semua

None

Praktik terbaik baru untuk kontrol detail halus terhadap sumber daya kluster menggunakan kelompok sumber daya

Untuk mengelola sumber daya di Container Service for Kubernetes secara lebih efisien, Anda dapat menggunakan kelompok sumber daya. Kelompok sumber daya memungkinkan Anda mengatur sumber daya berdasarkan dimensi seperti departemen, proyek, atau lingkungan. Saat dikombinasikan dengan Resource Access Management (RAM), hal ini memungkinkan isolasi sumber daya dan manajemen izin detail halus dalam satu akun Alibaba Cloud.

Semua

Gunakan kelompok sumber daya untuk kontrol sumber daya detail halus

Distributed Cloud Container Platform for Kubernetes (ACK One)

Kluster terdaftar ACK One dapat mengakses daya komputasi ACS

Anda dapat menggunakan daya komputasi kontainer yang disediakan oleh ACS di kluster terdaftar ACK One.

Semua

Jadwalkan pod ke ACS menggunakan node virtual

Dukungan untuk akses layanan lintas kluster menggunakan nama domain layanan native

Layanan multi-kluster ACK One mendukung akses layanan lintas kluster menggunakan nama domain layanan native melalui MultiClusterService. Anda dapat merutekan lalu lintas lintas kluster menggunakan layanan native secara langsung, tanpa memodifikasi kode layanan Anda, konfigurasi DNSConfig pod aplikasi Anda, atau konfigurasi CoreDNS.

Semua

Gunakan nama domain Service native untuk akses layanan lintas kluster

Dukungan untuk mengakses sumber daya multi-kluster menggunakan Go SDK

Jika Anda ingin mengintegrasikan armada ACK One ke platform Anda untuk mengakses sumber daya di sub-kluster, Anda dapat menggunakan Go SDK.

Semua

Akses sumber daya multi-kluster menggunakan Go SDK

Container Service for Edge (ACK Edge)

Dukungan untuk memperluas kapasitas node cloud

Saat sumber daya node di tempat tidak mencukupi, fitur penyesuaian otomatis node dapat secara otomatis memperluas kapasitas node cloud untuk kluster ACK Edge guna melengkapi kapasitas penjadwalan.

Semua

Elastisitas node ECS cloud

Dukungan untuk menerapkan layanan inferensi elastis LLM cloud hibrida

Dengan menginstal komponen ack-kserve dan menggunakan fitur elastisitas cloud kluster ACK Edge, Anda dapat menerapkan layanan inferensi elastis LLM cloud hibrida. Hal ini memungkinkan penjadwalan sumber daya cloud dan di tempat secara fleksibel serta mengurangi biaya operasional layanan inferensi LLM.

Semua

Dukungan untuk penjadwalan GPU bersama

Dengan penjadwalan GPU bersama, Anda dapat menjadwalkan beberapa pod ke kartu GPU yang sama untuk berbagi sumber daya komputasinya, sehingga meningkatkan pemanfaatan GPU dan menghemat biaya.

  • Node cloud kluster ACK Edge mendukung fitur berbagi GPU, isolasi memori GPU, dan isolasi daya komputasi.

  • Kelompok node edge kluster ACK Edge hanya mendukung berbagi GPU; fitur isolasi memori GPU dan isolasi daya komputasi tidak didukung.

Semua

Gunakan penjadwalan GPU bersama

Dukungan untuk pengelolaan terpadu sumber daya ECS di berbagai wilayah

Praktik terbaik baru tersedia yang menjelaskan cara menggunakan kluster ACK Edge untuk mengelola sumber daya komputasi yang didistribusikan di berbagai wilayah secara terpusat. Hal ini memungkinkan manajemen siklus hidup penuh dan penjadwalan sumber daya yang efisien untuk aplikasi cloud-native.

Semua

Kelola sumber daya ECS di berbagai wilayah secara terpusat

Informasi selengkapnya

Untuk catatan rilis ACK sebelum 2025, lihat Catatan rilis (sebelum 2025).