Topik ini menjawab beberapa pertanyaan umum (FAQ) terkait penggunaan node edge di ACK Edge clusters.
Bagaimana komponen ACK Edge membedakan node cloud dari node edge?
ACK Edge menentukan apakah sebuah node adalah node edge berdasarkan label alibabacloud.com/is-edge-worker pada node tersebut.
Jika sebuah node ditambahkan ke kelompok node cloud atau kelompok node edge, label is-edge-worker secara otomatis ditambahkan ke node tersebut. Jika nilai label is-edge-worker adalah true, maka node tersebut adalah node edge. Jika nilainya false, maka node tersebut adalah node cloud.
Bagaimana cara menambahkan node edge ke kelompok node melalui sirkuit Express Connect?
Perhatikan persyaratan berikut saat menambahkan node edge di ACK Edge clusters ke kelompok node melalui sirkuit Express Connect. Untuk informasi lebih lanjut, lihat Konfigurasi khusus ACK Edge clusters saat menggunakan sirkuit Express Connect.
Saat membuat kelompok node edge, atur tipe kelompok node menjadi dedicated. Kemudian, lihat Tambahkan node edge untuk menghasilkan skrip yang digunakan untuk menambahkan node edge ke kelompok node edge khusus.
Untuk informasi lebih lanjut tentang kelompok node edge khusus, lihat Manajemen kelompok node edge.
CatatanJika versi Kubernetes dari ACK Edge cluster adalah 1.22 atau lebih baru, Anda tidak dapat menentukan parameter
inDedicatedNetworkdalam skrip untuk menambahkan node edge ke kelompok node melalui sirkuit Express Connect. Jika versinya lebih lama dari 1.22, tingkatkan versinya.Saat menambahkan node edge ke kelompok node melalui sirkuit Express Connect, node edge perlu berkomunikasi dengan layanan Alibaba Cloud melalui alamat privat. Pastikan bahwa node edge terhubung ke layanan Alibaba Cloud yang relevan, seperti Object Storage Service (OSS), Container Registry, dan Server Load Balancer (SLB).
Bagaimana cara menambahkan node yang dipercepat GPU ke kelompok node?
Anda harus terlebih dahulu menginstal Driver GPU.
Untuk informasi lebih lanjut tentang versi driver yang didukung, lihat Versi driver NVIDIA yang didukung oleh ACK.
Anda harus mengonfigurasi parameter
gpuVersiondalam skrip yang digunakan untuk menghubungkan node ke cloud. Model GPU berikut didukung:
Setelah mengonfigurasi parameter tersebut, alat koneksi secara otomatis menginstal nvidia-containerd-runtime. Untuk informasi lebih lanjut, lihat NVIDIA Container Runtime.
Bagaimana cara menangani kegagalan eksekusi skrip koneksi node?
Tabel berikut menjelaskan cara menangani kegagalan eksekusi skrip. Jika masalah Anda tidak dijelaskan dalam tabel berikut, kumpulkan informasi diagnostik node dan submit a ticket. Untuk informasi lebih lanjut tentang cara mengumpulkan informasi diagnostik node edge, lihat bagian Bagaimana cara mengumpulkan informasi diagnostik node di ACK Edge cluster? dari topik ini.
Pesan kesalahan | Penyebab kegagalan | Solusi yang disarankan |
The os XXX unsupport | Versi sistem operasi node edge tidak didukung. | Untuk informasi lebih lanjut tentang versi sistem operasi yang didukung, lihat Tambahkan node edge. |
invalid nodeName | Nama node tidak valid. |
|
Node route overlaps with service cidr | Rute node bertentangan dengan blok CIDR pod atau blok CIDR Service dari kluster. | Buat ulang kluster dan konfigurasikan ulang blok CIDR pod atau blok CIDR Service. Pastikan bahwa blok CIDR ini tidak bertentangan dengan alamat NameServer dan rute node. |
response error msg: TOKEN_EXPIRED | Token untuk menghubungkan node ke cloud telah kedaluwarsa. |
|
A node named XXX is already exist in the cluster | Node dengan nama yang sama sudah ada di kluster. | Hapus node dari kluster. |
error run phase join-node: failed to get cluster info: failed to get cluster-info configmap, Get "https://xx.xxx.xx.xx:6443/api/v1/namespaces/kube-public/configmaps/cluster-info": dial tcp xx.xxx.xx.xx:6443: i/o timeout | Sistem gagal mendapatkan informasi tentang kluster. | Saat edgeadm menghubungkan ke node edge, edgeadm harus mengakses server API menggunakan alamat IP. Periksa apakah aturan daftar kontrol akses (ACL) yang dikonfigurasi untuk instance SLB server API memblokir alamat IP tersebut. |
error run phase join-node: Install edge-hub failed: Copy file /tmp/edge-hub to /usr/bin/edge-hub fail: open /usr/bin/edge-hub: text file busy | 40009 | 40009 | Instalasi edge-hub gagal karena file biner untuk edge-hub sudah ada di node. | Jalankan perintah |
error run phase post-check: timed out waiting for the condition | Komponen sistem gagal memulai. |
|
Apa yang harus saya lakukan jika node edge gagal ditingkatkan saat saya meningkatkan ACK Edge cluster?
Saat Anda meningkatkan kelompok node edge, jika pesan This node has been upgraded successfully tidak dikembalikan, tangani masalah tersebut dengan merujuk pada solusi yang dijelaskan dalam tabel berikut.
Pesan kesalahan | Penyebab kegagalan | Solusi yang disarankan |
edgeadm version xxxx does not match cluster version | Versi alat peningkatan tidak konsisten dengan versi kluster. |
|
node has already been upgraded to xxx | Versi node sudah diperbarui ke versi yang diinginkan. | Jika komponen tertentu di node belum ditingkatkan, simpan log dan submit a ticket. |
kubelet target version xxxx does not match cluster version xxxx | Versi kubelet tidak konsisten dengan versi bidang kontrol kluster. |
|
Parameter currentVersion cann't null | Versi edgeadm yang lebih lama digunakan. |
|
upgrade kubelet failed at phase install, recover to previous state. error run phase upgrade: xxxx | Kluster gagal ditingkatkan dan telah dikembalikan secara otomatis ke keadaan sebelumnya. Status node tidak terpengaruh. | Simpan log dan submit a ticket. |
upgrade kubelet failed at phase install, recover to previous state recover kubelet failed, err: xxx error run phase upgrade: xxxx | Kluster gagal ditingkatkan dan telah dikembalikan secara otomatis ke keadaan sebelumnya. Status node terpengaruh. | Simpan log dan submit a ticket. |
Bagaimana cara mengumpulkan informasi diagnostik tentang node di ACK Edge cluster?
Jika terjadi pengecualian pada node di ACK Edge cluster, lakukan langkah-langkah berikut untuk mengumpulkan informasi diagnostik tentang node untuk analisis data:
Masuk ke node abnormal di ACK Edge cluster.
Jalankan perintah berikut untuk mengunduh skrip diagnostik:
curl -o /usr/local/bin/diagnose_edge_node.sh https://aliacs-k8s-cn-hangzhou.oss-cn-hangzhou.aliyuncs.com/public/diagnose/diagnose_k8s.shJalankan perintah berikut untuk membuat skrip diagnostik dapat dieksekusi:
chmod u+x /usr/local/bin/diagnose_edge_node.shJalankan perintah berikut untuk beralih ke direktori yang ditentukan:
cd /usr/local/bin/Jalankan perintah berikut untuk menjalankan skrip diagnostik:
./diagnose_edge_node.shKeluaran yang diharapkan: Setiap kali Anda menjalankan skrip diagnostik, file dengan nama berbeda dihasilkan. Dalam contoh ini, file log bernama
diagnose_1578310147.tar.gz....... + echo 'please get diagnose_1578310147.tar.gz for diagnostics' please get diagnose_1578310147.tar.gz for diagnostics + echo 'Submit the file named diagnose_1578310147.tar.gz to request technical support.' Submit the file named diagnose_1578310147.tar.gz to request technical support.Jalankan perintah
lluntuk memverifikasi bahwa laporan diagnostik bernamadiagnose_1578310147.tar.gzada.