全部产品
Search
文档中心

Container Service for Kubernetes:FAQ tentang node edge

更新时间:Jul 02, 2025

Topik ini menjawab beberapa pertanyaan umum (FAQ) terkait penggunaan node edge di ACK Edge clusters.

Bagaimana komponen ACK Edge membedakan node cloud dari node edge?

ACK Edge menentukan apakah sebuah node adalah node edge berdasarkan label alibabacloud.com/is-edge-worker pada node tersebut.

Jika sebuah node ditambahkan ke kelompok node cloud atau kelompok node edge, label is-edge-worker secara otomatis ditambahkan ke node tersebut. Jika nilai label is-edge-worker adalah true, maka node tersebut adalah node edge. Jika nilainya false, maka node tersebut adalah node cloud.

Bagaimana cara menambahkan node edge ke kelompok node melalui sirkuit Express Connect?

Perhatikan persyaratan berikut saat menambahkan node edge di ACK Edge clusters ke kelompok node melalui sirkuit Express Connect. Untuk informasi lebih lanjut, lihat Konfigurasi khusus ACK Edge clusters saat menggunakan sirkuit Express Connect.

  • Saat membuat kelompok node edge, atur tipe kelompok node menjadi dedicated. Kemudian, lihat Tambahkan node edge untuk menghasilkan skrip yang digunakan untuk menambahkan node edge ke kelompok node edge khusus.

    Untuk informasi lebih lanjut tentang kelompok node edge khusus, lihat Manajemen kelompok node edge.

    Catatan

    Jika versi Kubernetes dari ACK Edge cluster adalah 1.22 atau lebih baru, Anda tidak dapat menentukan parameter inDedicatedNetwork dalam skrip untuk menambahkan node edge ke kelompok node melalui sirkuit Express Connect. Jika versinya lebih lama dari 1.22, tingkatkan versinya.

  • Saat menambahkan node edge ke kelompok node melalui sirkuit Express Connect, node edge perlu berkomunikasi dengan layanan Alibaba Cloud melalui alamat privat. Pastikan bahwa node edge terhubung ke layanan Alibaba Cloud yang relevan, seperti Object Storage Service (OSS), Container Registry, dan Server Load Balancer (SLB).

Bagaimana cara menambahkan node yang dipercepat GPU ke kelompok node?

  • Anda harus terlebih dahulu menginstal Driver GPU.

  • Untuk informasi lebih lanjut tentang versi driver yang didukung, lihat Versi driver NVIDIA yang didukung oleh ACK.

  • Anda harus mengonfigurasi parameter gpuVersion dalam skrip yang digunakan untuk menghubungkan node ke cloud. Model GPU berikut didukung:

      image.png

  • Setelah mengonfigurasi parameter tersebut, alat koneksi secara otomatis menginstal nvidia-containerd-runtime. Untuk informasi lebih lanjut, lihat NVIDIA Container Runtime.

Bagaimana cara menangani kegagalan eksekusi skrip koneksi node?

Tabel berikut menjelaskan cara menangani kegagalan eksekusi skrip. Jika masalah Anda tidak dijelaskan dalam tabel berikut, kumpulkan informasi diagnostik node dan submit a ticket. Untuk informasi lebih lanjut tentang cara mengumpulkan informasi diagnostik node edge, lihat bagian Bagaimana cara mengumpulkan informasi diagnostik node di ACK Edge cluster? dari topik ini.

Pesan kesalahan

Penyebab kegagalan

Solusi yang disarankan

The os XXX unsupport

Versi sistem operasi node edge tidak didukung.

Untuk informasi lebih lanjut tentang versi sistem operasi yang didukung, lihat Tambahkan node edge.

invalid nodeName

Nama node tidak valid.

  1. Nama node dapat berisi huruf kecil, tanda hubung (-), dan titik (.).

  2. Nama node harus memiliki panjang 1 hingga 253 karakter.

  3. Nama node tidak boleh dimulai dengan localhost.

Node route overlaps with service cidr

Rute node bertentangan dengan blok CIDR pod atau blok CIDR Service dari kluster.

Buat ulang kluster dan konfigurasikan ulang blok CIDR pod atau blok CIDR Service. Pastikan bahwa blok CIDR ini tidak bertentangan dengan alamat NameServer dan rute node.

response error msg: TOKEN_EXPIRED

Token untuk menghubungkan node ke cloud telah kedaluwarsa.

  1. Hasilkan skrip lain untuk menghubungkan node ke cloud.

  2. Periksa apakah jam sistem node normal.

A node named XXX is already exist in the cluster

Node dengan nama yang sama sudah ada di kluster.

Hapus node dari kluster.

error run phase join-node: failed to get cluster info: failed to get cluster-info configmap, Get "https://xx.xxx.xx.xx:6443/api/v1/namespaces/kube-public/configmaps/cluster-info": dial tcp xx.xxx.xx.xx:6443: i/o timeout

Sistem gagal mendapatkan informasi tentang kluster.

Saat edgeadm menghubungkan ke node edge, edgeadm harus mengakses server API menggunakan alamat IP. Periksa apakah aturan daftar kontrol akses (ACL) yang dikonfigurasi untuk instance SLB server API memblokir alamat IP tersebut.

error run phase join-node: Install edge-hub failed: Copy file /tmp/edge-hub to /usr/bin/edge-hub fail: open /usr/bin/edge-hub: text file busy | 40009 | 40009

Instalasi edge-hub gagal karena file biner untuk edge-hub sudah ada di node.

Jalankan perintah edgeadm reset untuk membersihkan data di node, lalu jalankan skrip koneksi node lagi.

error run phase post-check: timed out waiting for the condition

Komponen sistem gagal memulai.

  1. Unduh alat edgeadm lagi dan jalankan perintah edgeadm reset untuk menginstal ulang alat tersebut. Pastikan bahwa versi terbaru edgeadm digunakan.

  2. Periksa apakah node edge dapat mengakses alamat publik yang relevan sesuai harapan. Untuk informasi lebih lanjut tentang alamat publik, lihat Manajemen jaringan.

  3. Kumpulkan informasi diagnostik tentang node dan submit a ticket. Untuk informasi lebih lanjut tentang cara mengumpulkan informasi diagnostik, lihat bagian Bagaimana cara mengumpulkan informasi diagnostik node di ACK Edge cluster? dari topik ini.

Apa yang harus saya lakukan jika node edge gagal ditingkatkan saat saya meningkatkan ACK Edge cluster?

Saat Anda meningkatkan kelompok node edge, jika pesan This node has been upgraded successfully tidak dikembalikan, tangani masalah tersebut dengan merujuk pada solusi yang dijelaskan dalam tabel berikut.

Pesan kesalahan

Penyebab kegagalan

Solusi yang disarankan

edgeadm version xxxx does not match cluster version

Versi alat peningkatan tidak konsisten dengan versi kluster.

  1. Periksa apakah bidang kontrol kluster telah ditingkatkan.

  2. Periksa apakah parameter TARGET_CLUSTER_VERSION ditentukan dengan benar.

node has already been upgraded to xxx

Versi node sudah diperbarui ke versi yang diinginkan.

Jika komponen tertentu di node belum ditingkatkan, simpan log dan submit a ticket.

kubelet target version xxxx does not match cluster version xxxx

Versi kubelet tidak konsisten dengan versi bidang kontrol kluster.

  1. Jika parameter kubelet-version ditentukan, periksa apakah nilai parameter tersebut konsisten dengan versi bidang kontrol kluster.

  2. Jika parameter ini dibiarkan kosong, submit a ticket.

Parameter currentVersion cann't null

Versi edgeadm yang lebih lama digunakan.

  1. Periksa apakah edgeadm versi terbaru digunakan.

  2. Anda dapat memperbarui kluster dari Kubernetes 1.18 ke 1.20, atau dari Kubernetes 1.20 ke 1.22.

upgrade kubelet failed at phase install, recover to previous state.

error run phase upgrade: xxxx

Kluster gagal ditingkatkan dan telah dikembalikan secara otomatis ke keadaan sebelumnya. Status node tidak terpengaruh.

Simpan log dan submit a ticket.

upgrade kubelet failed at phase install, recover to previous state

recover kubelet failed, err: xxx

error run phase upgrade: xxxx

Kluster gagal ditingkatkan dan telah dikembalikan secara otomatis ke keadaan sebelumnya. Status node terpengaruh.

Simpan log dan submit a ticket.

Bagaimana cara mengumpulkan informasi diagnostik tentang node di ACK Edge cluster?

Jika terjadi pengecualian pada node di ACK Edge cluster, lakukan langkah-langkah berikut untuk mengumpulkan informasi diagnostik tentang node untuk analisis data:

  1. Masuk ke node abnormal di ACK Edge cluster.

  2. Jalankan perintah berikut untuk mengunduh skrip diagnostik:

    curl -o /usr/local/bin/diagnose_edge_node.sh https://aliacs-k8s-cn-hangzhou.oss-cn-hangzhou.aliyuncs.com/public/diagnose/diagnose_k8s.sh
  3. Jalankan perintah berikut untuk membuat skrip diagnostik dapat dieksekusi:

    chmod u+x /usr/local/bin/diagnose_edge_node.sh
  4. Jalankan perintah berikut untuk beralih ke direktori yang ditentukan:

    cd /usr/local/bin/
  5. Jalankan perintah berikut untuk menjalankan skrip diagnostik:

    ./diagnose_edge_node.sh

    Keluaran yang diharapkan: Setiap kali Anda menjalankan skrip diagnostik, file dengan nama berbeda dihasilkan. Dalam contoh ini, file log bernama diagnose_1578310147.tar.gz.

    ......
    + echo 'please get diagnose_1578310147.tar.gz for diagnostics'
    please get diagnose_1578310147.tar.gz for diagnostics
    + echo 'Submit the file named diagnose_1578310147.tar.gz to request technical support.'
    Submit the file named diagnose_1578310147.tar.gz to request technical support.
  6. Jalankan perintah ll untuk memverifikasi bahwa laporan diagnostik bernama diagnose_1578310147.tar.gz ada.