全部产品
Search
文档中心

Platform For AI:Mengelola Kluster dan Node Lingjun

更新时间:Jul 23, 2025

Kluster Lingjun adalah kumpulan node komputasi berkinerja tinggi yang dilengkapi dengan komponen optimasi Lingjun. Setiap node Lingjun sesuai dengan server GPU, yang dapat digunakan untuk menyebarkan layanan komputasi heterogen. Topik ini menjelaskan cara mengelola kluster dan node Lingjun, seperti melihat informasi kluster atau node serta memperluas kapasitas kluster.

Mengelola Kluster Lingjun

Kluster Lingjun dapat berada dalam salah satu dari status berikut:

  • Initialization Failed: Kluster gagal diinisialisasi. Untuk detail lebih lanjut tentang kegagalan, lihat Pusat Tugas O&M.

  • Initializing: Jaringan kluster sedang dikonfigurasi, dan node komputasi Lingjun sedang diinisialisasi.

  • Running: Kluster sedang berjalan. Anda hanya dapat memperluas, mengecilkan, menginstal ulang, atau me-restart node ketika kluster dalam status Running.

    Penting

    Jika tugas perluasan, pengecilan, penginstalan ulang, atau restart melibatkan node komputasi Lingjun yang berbeda, Anda dapat mengirimkan tugas-tugas tersebut sekaligus untuk dijalankan secara paralel.

Melihat Informasi tentang Kluster

  1. Masuk ke Konsol Komputasi Cerdas Lingjun.

  2. Di panel navigasi sisi kiri, pilih Resources and Nodes > Cluster Management.

  3. Temukan kluster yang ingin dikelola dan klik Details di kolom Operasi. Halaman Cluster Details akan muncul.

    1. Lihat informasi dasar kluster, seperti nama kluster, jumlah kelompok node, dan informasi pembuatan.

    2. Lihat informasi tambahan pada tab Node Group, Monitoring and Alerting, Basic Metrics, RDMA, dan GPU.

Memperluas Kapasitas Kluster

Catatan

Untuk memperluas kluster, Anda harus menginstal klien Penyimpanan File Paralel Cloud (CPFS) di setiap node GPU yang ditambahkan dan menambahkan node terkait ke kluster CPFS terkait.

Anda juga harus menambahkan tag ke node yang ditambahkan.

  1. Masuk ke Konsol Komputasi Cerdas Lingjun.

  2. Di panel navigasi sisi kiri, pilih Resources and Nodes > Cluster Management.

  3. Temukan kluster yang ingin dikelola dan klik Expand di kolom Operasi.

    1. Di bagian Original Group Details, temukan grup node dan klik Scale Up di kolom Aksi.

    2. Di kotak dialog yang muncul, konfigurasikan parameter Nama Awalan Node, Kata Sandi Logon, dan Konfirmasi Kata Sandi.

    3. Di tab Tidak Digunakan, pilih satu atau beberapa node yang tidak digunakan atau klik Beli Node untuk membeli node baru. Lalu, klik Yes.

  4. Di bagian The following information displays the detailed configurations for scale-up, klik Confirm Submission.

  5. Kembali ke halaman Cluster Management. Status kluster adalah Scaling Up. Tunggu hingga proses perluasan selesai.

Menyusutkan Kluster

Peringatan
  • Jika Anda menyusutkan kluster, node yang dihapus akan diinstal ulang dan semua data akan dihapus. Pastikan data telah dicadangkan sebelum menghapus node.

  • Anda juga harus menghapus node terkait dari kluster CPFS terkait.

  1. Masuk ke Konsol Komputasi Cerdas Lingjun.

  2. Di panel navigasi sisi kiri, pilih Resources and Nodes > Cluster Management.

  3. Temukan kluster yang ingin dikelola dan klik Shrink di kolom Operasi.

    1. Di bagian Original Group Details, pilih satu atau beberapa node yang ingin dihapus dan klik Batch Remove from Cluster.

    2. Di bagian The following information displays the detailed configurations for scale-down, klik Confirm Submission.

  4. Di halaman Confirm Scale-down Configurations, masukkan HAPUS di bidang dan klik OK.

  5. Kembali ke halaman Cluster Management. Status kluster adalah Scaling Down. Tunggu hingga proses pengecilan selesai.

Menghapus Kluster

Penting
  • Sebelum menghapus kluster, pastikan semua node telah dihapus dari kluster.

  • Kluster CPFS terkait tidak akan dihapus saat kluster dihapus.

  1. Masuk ke Konsol Komputasi Cerdas Lingjun.

  2. Di panel navigasi sisi kiri, pilih Resources and Nodes > Cluster Management.

  3. Klik ID kluster yang ingin Anda hapus. Di halaman Cluster Details, klik Delete di pojok kanan atas.

  4. Di pesan yang muncul, klik OK.

Membuat Grup Node untuk Kluster

Anda dapat membuat grup node untuk kluster Lingjun dengan salah satu cara berikut:

  • Buat grup node saat membuat kluster. Untuk informasi lebih lanjut, lihat Konfigurasi kluster dan grup node.

  • Buat grup node untuk kluster yang sudah ada.

    1. Masuk ke Konsol Komputasi Cerdas Lingjun.

    2. Di panel navigasi sisi kiri, pilih Resources and Nodes > Cluster Management.

    3. Klik ID kluster tempat kelompok node akan dibuat.

    4. Di halaman Detail Kluster, klik tab Node Group.

    5. Di tab Grup Node, klik Create Group. Konfigurasikan informasi grup node, seperti nama grup node dan model default.

    6. Opsional: Setelah membuat grup node, Anda dapat mengubah nama atau menghapus grup node.

Mengelola Node Lingjun

Penting

Anda hanya dapat melakukan satu operasi pada node komputasi Lingjun pada satu waktu, seperti menambahkan, menghapus, menginstal ulang, atau me-restart node.

Membeli Node

  1. Masuk ke Konsol Komputasi Cerdas Lingjun.

  2. Di panel navigasi sisi kiri, pilih Resources and Nodes > Node Management.

  3. Di halaman Node Management, klik Purchase Node.

  4. Ikuti petunjuk untuk membeli node.

Melihat Detail Node

  1. Masuk ke Konsol Komputasi Cerdas Lingjun.

  2. Di panel navigasi sisi kiri, pilih Resources and Nodes > Node Management. Halaman Node Management akan muncul.

  3. Klik tab Semua untuk melihat semua node.

    • Anda dapat melihat informasi dasar tentang node, seperti ID node, nama node, nama citra, dan zona.

    • Anda dapat mencari node berdasarkan kata kunci. Pilih kategori dari daftar drop-down, seperti Image Name, Zone, atau IP Address. Masukkan kata kunci di kotak pencarian dan klik ikon pencarian.

  4. Klik tab Unused untuk melihat node yang tidak digunakan. Anda dapat melihat informasi dasar tentang node yang tidak digunakan, seperti jenis node dan kelompok sumber daya.

Masuk ke Node

  1. Masuk ke Konsol Komputasi Cerdas Lingjun.

  2. Di panel navigasi sisi kiri, pilih Resources and Nodes > Node Management.

  3. Temukan node yang ingin dikelola, klik ikon Lebih Banyak di kolom Actions, lalu pilih Remote Logon.

    • Gunakan root sebagai nama pengguna logon.

    • Gunakan kata sandi logon kluster. Untuk informasi lebih lanjut, lihat bagian Konfigurasi kluster dan grup node dari topik "Membuat kluster dasar Lingjun".

Menginstal Ulang Node

Penting
  • Data node akan dihapus saat menginstal ulang. Berhati-hatilah saat melakukan instalasi ulang.

  • Anda hanya dapat menginstal ulang node ketika kluster dalam status Running.

  • Saat menginstal ulang node, Anda harus menghapus node dari kluster CPFS terkait dan menambahkan node yang diinstal ulang ke kluster CPFS.

Anda perlu menginstal ulang node dalam situasi berikut:

  • Redeploy bisnis.

  • Mengubah versi OS.

  • Memenuhi persyaratan O&M.

Prosedur

  1. Masuk ke Konsol Komputasi Cerdas Lingjun.

  2. Di panel navigasi sisi kiri, pilih Resources and Nodes > Node Management.

  3. Di halaman Node Management, temukan node yang ingin dikelola dan klik Reinstall di kolom Aksi. Di kotak dialog yang muncul, pilih versi citra, ubah nama node, masukkan dan konfirmasi kata sandi root node, lalu klik Reinstall.

Me-restart Node

Penting
  • Me-restart node dapat memengaruhi kelangsungan bisnis.

  • Anda hanya dapat me-restart node ketika kluster dalam status Running.

Anda perlu me-restart node dalam situasi berikut:

  • Menyebarkan aplikasi atau layanan baru.

  • Mengubah pengaturan sistem.

  • Memenuhi persyaratan O&M.

Prosedur

  1. Masuk ke Konsol Komputasi Cerdas Lingjun.

  2. Di panel navigasi sisi kiri, pilih Resources and Nodes > Node Management.

  3. Di halaman Node Management, temukan node yang ingin dikelola dan klik Restart di kolom Aksi.