Gunakan model campuran Gaussian (GMM) yang telah dilatih dari Komponen Prediksi GMM untuk melakukan prediksi pengelompokan. Topik ini menjelaskan cara mengonfigurasi Komponen Prediksi GMM.
Batasan
Komponen Prediksi GMM hanya dapat digunakan dengan sumber daya komputasi MaxCompute dan Flink dari PAI.
Mengonfigurasi komponen di konsol PAI
Anda dapat mengonfigurasi parameter untuk Komponen Prediksi GMM di konsol Machine Learning Platform for AI (PAI).
Tab | Parameter | Deskripsi |
Field Setting | vectorCol | Nama kolom vektor. |
reservedCols | Kolom yang akan disimpan oleh algoritma. | |
Parameter Setting | predictionCol | Nama kolom prediksi. |
predictionDetailCol | Nama kolom detail prediksi. | |
numThreads | Jumlah utas komponen. Nilai default: 1. | |
Execution Tuning | Number of Workers | Jumlah inti. Parameter ini harus digunakan bersama dengan parameter Memory per worker, unit MB. Nilai parameter ini harus bilangan bulat positif. Nilai valid: [1,9999]. Untuk informasi lebih lanjut, lihat Lampiran: Cara memperkirakan penggunaan sumber daya. |
Memory per worker, unit MB | Ukuran memori setiap inti. Nilai valid: 1024 hingga 64 × 1024. Satuan: MB. Untuk informasi lebih lanjut, lihat Lampiran: Cara memperkirakan penggunaan sumber daya. |
Lampiran: Cara memperkirakan penggunaan sumber daya
Rujuk bagian berikut untuk memperkirakan penggunaan sumber daya.
Bagaimana cara memperkirakan memori yang digunakan oleh setiap node?
Memori yang digunakan oleh setiap node adalah sekitar ukuran model dikali 30.
Sebagai contoh, jika ukuran model input adalah 1 GB, memori setiap node dapat diatur menjadi 30 GB.
Bagaimana cara memperkirakan jumlah node yang dibutuhkan?
Tugas pelatihan terdistribusi mempercepat proses namun melambat saat jumlah node bertambah karena overhead komunikasi. Jika tugas mulai melambat, hentikan penambahan jumlah node. Jumlah node pada titik ini dapat digunakan.