Kelompok sumber daya RAY untuk mesin komputasi Lindorm menyediakan layanan komputasi terdistribusi guna memproses workload AI secara end-to-end. Kelompok sumber daya ini kompatibel dengan model komputasi dan antarmuka pemrograman RAY, serta terintegrasi secara mendalam dengan mesin penyimpanan multi-model Lindorm untuk menangani tugas pra-pemrosesan, pelatihan, dan inferensi secara efisien. Topik ini menjelaskan cara mengaktifkan dan mengelola kelompok sumber daya RAY beserta metode penagihannya.
Kelompok sumber daya RAY saat ini berada dalam pratinjau undangan. Untuk menggunakan fitur ini, hubungi dukungan teknis Lindorm (DingTalk ID: s0s3eg3) guna meminta akses.
Prasyarat
Anda telah mengaktifkan LindormTable.
Anda telah mengaktifkan mesin komputasi Lindorm.
Metode penagihan
Kelompok sumber daya RAY beroperasi dalam mode persisten. Biayanya terdiri dari dua komponen:
Biaya sumber daya persisten: Dihitung dalam CUs berdasarkan sumber daya persisten yang dikonfigurasi untuk node head dan node pekerja.
Biaya sumber daya elastis: Node pekerja mendukung skalabilitas elastis berdasarkan workload. Biaya untuk node pekerja yang diskalakan secara elastis dihitung dalam CUs berdasarkan durasi penggunaan.
Aktifkan kelompok sumber daya RAY
Masuk ke Konsol Lindorm. Di pojok kiri atas halaman, pilih wilayah instans tersebut. Pada halaman Instances, klik ID instans target atau klik View Instance Details di kolom Actions untuk instans tersebut.
Pada halaman Instance Details, di bagian Configurations, klik Resource Groups di kolom Operations untuk Compute Engine.
Pada halaman Resource Group Details, klik Create Resource Group dan konfigurasikan parameter berikut:
Resource Group Type: Pilih RAY.
Resource Group Name: Nama kelompok sumber daya. Nama hanya boleh berisi huruf kecil dan angka, serta panjangnya maksimal 63 karakter. Contohnya,
raycg.Running Mode: Nilai default-nya adalah Resident. Dalam mode Resident, kluster Ray selalu berjalan, dan Anda dapat mengirimkan pekerjaan RAY ke kluster ini. Saat tidak ada pekerjaan yang berjalan, kluster beroperasi dengan jumlah sumber daya minimal. Setelah pekerjaan dikirimkan, kluster akan secara dinamis meminta sumber daya sesuai kebutuhan pekerjaan tersebut.
Parameter untuk kelompok sumber daya RAY resident:
Konfigurasi node head. Pilih spesifikasi sumber daya dan disk space untuk node head berdasarkan ukuran kluster Anda.
Jumlah kelompok pekerja. Pilih satu atau beberapa kelompok pekerja sesuai kebutuhan. Setiap kelompok pekerja dapat memiliki spesifikasi sumber daya yang berbeda.
Konfigurasi kelompok pekerja. Konfigurasikan spesifikasi sumber daya, disk space, serta jumlah replika minimum dan maksimum yang berjalan untuk setiap kelompok pekerja.
Konfigurasi node head
Configuration item
Description
Head resource type
Kelompok sumber daya RAY mendukung tipe sumber daya CPU dan GPU.
Head Resource Specifications
Untuk tipe sumber daya CPU, pilih kuota CPU dan memori, seperti 4 core dan 8 GB, 4 core dan 16 GB, atau 8 core dan 32 GB. Pilih spesifikasi berdasarkan ukuran kluster Anda. Nilai default-nya adalah 4 core dan 16 GB.
Untuk tipe sumber daya GPU, hubungi dukungan teknis Lindorm (DingTalk ID: s0s3eg3) untuk menggunakan sumber daya GPU. Sumber daya GPU tunduk pada keterbatasan jenis mesin dan ketersediaan stok.
Head disk size
Disk space untuk node head. Ruang ini digunakan untuk menyimpan log, file overflow memori, dan file sumber daya yang digunakan selama eksekusi pekerjaan. Ukuran default-nya adalah 30 GB.
Konfigurasi kelompok pekerja
Configuration item
Description
Worker resource type
Kelompok sumber daya RAY mendukung tipe sumber daya CPU dan GPU.
Worker Resource Specifications
Untuk tipe sumber daya CPU, pilih kuota CPU dan memori, seperti 4 core dan 8 GB, 4 core dan 16 GB, atau 8 core dan 32 GB. Pilih spesifikasi sumber daya kelompok pekerja berdasarkan kebutuhan pekerjaan aktual Anda. Nilai default-nya adalah 4 core dan 16 GB.
Untuk tipe sumber daya GPU, hubungi dukungan teknis Lindorm (DingTalk ID: s0s3eg3) untuk menggunakan sumber daya GPU. Sumber daya GPU tunduk pada keterbatasan jenis mesin dan ketersediaan stok.
Worker disk space
Disk space untuk node pekerja. Ruang ini digunakan untuk menyimpan log, file overflow memori, dan file sumber daya yang digunakan selama eksekusi pekerjaan. Ukuran default-nya adalah 30 GB.
Minimum number of workers
Jumlah replika minimum dalam kelompok pekerja. Kelompok ini mempertahankan jumlah replika tersebut saat tidak ada pekerjaan yang berjalan.
Maximum number of workers
Jumlah replika maksimum dalam kelompok pekerja. Ini adalah jumlah maksimum node pekerja yang dapat disediakan saat pekerjaan sedang berjalan.
Klik OK untuk membuat kelompok sumber daya RAY. Proses pembuatan memerlukan waktu sekitar 20 menit.
Kelola kelompok sumber daya RAY
Masuk ke Konsol Lindorm. Di pojok kiri atas halaman, pilih wilayah instans tersebut. Pada halaman Instances, klik ID instans target atau klik View Instance Details di kolom Actions untuk instans tersebut.
Pada halaman Instance Details, di bagian Configurations, klik Resource Groups di kolom Operations untuk Compute Engine.
Pada halaman Resource Group Details, arahkan kursor ke WebUI di kolom Actions untuk kelompok sumber daya RAY guna mendapatkan alamat WebUI-nya. Contohnya:
http://alb-57k7r581oht8rd****.cn-hangzhou.alb.aliyuncsslb.com/ray/raycg/dashboard/.Buka alamat WebUI kelompok sumber daya tersebut di browser untuk melihat status berjalannya.

Di bilah navigasi bagian atas WebUI, Anda dapat beralih antar tab untuk melihat daftar pekerjaan (Jobs), status kluster (Cluster), daftar aktor (Actors), dan log kluster (Logs).
Pada tab Cluster, Anda dapat melihat penggunaan sumber daya untuk semua node dalam kluster, seperti CPU, memori, GPU, dan Object Store.
(Opsional) Pada halaman Resource Group Details, Anda juga dapat Delete kelompok sumber daya.
CatatanKelompok sumber daya RAY saat ini tidak mendukung operasi modify atau restart.