Dalam skenario rekomendasi, Anda dapat menggunakan solusi FM-Embedding yang disediakan oleh Machine Learning Designer untuk mendapatkan vektor fitur dari setiap pengguna dan item. Kemudian, gunakan modul recall untuk menghitung hasil perkalian vektor fitur tersebut. Dengan cara ini, Anda dapat memprediksi peringkat yang akan diberikan oleh setiap pengguna kepada setiap item. Topik ini menjelaskan cara menggunakan algoritma Factorization Machine (FM) dan Embedding untuk menghasilkan vektor fitur pengguna dan item.
Prasyarat
Ruang kerja telah dibuat. Untuk informasi lebih lanjut, lihat Buat dan Kelola Ruang Kerja.
Sumber daya MaxCompute terhubung dengan ruang kerja. Untuk informasi lebih lanjut, lihat Kelola Sumber Daya Komputasi Ruang Kerja.
Informasi latar belakang
Rekomendasi berbasis AI dibagi menjadi dua modul: Pengurutan dan Recall. Modul recall menggunakan vektor fitur untuk merepresentasikan pengguna dan item yang direkomendasikan. Hasil perkalian vektor fitur pengguna dan vektor fitur item menunjukkan minat pengguna pada item tersebut. Pipeline yang dijelaskan dalam topik ini menggunakan data rekomendasi nyata. Pipeline ini dapat dibuat dari template preset FM-Embedding for Rec-System dari Machine Learning Designer. Anda dapat menghasilkan vektor fitur pengguna dan item dengan cepat melalui penyeretan dan peletakan Komponen yang disediakan oleh Machine Learning Designer.
Dataset
Tabel berikut menjelaskan bidang dalam dataset.
Parameter | Tipe | Deskripsi |
userid | STRING | ID pengguna. |
age | DOUBLE | Usia pengguna. |
gender | STRING | Jenis kelamin pengguna. |
itemid | STRING | ID item. |
price | DOUBLE | Harga item. |
size | DOUBLE | Ukuran item. |
label | DOUBLE | Menunjukkan apakah pengguna telah membeli item. Nilai yang valid:
|
Gambar berikut menunjukkan data sampel yang digunakan dalam pipeline. 
Prosedur
Buka halaman Machine Learning Designer.
Masuk ke Konsol PAI.
Di panel navigasi sebelah kiri, klik Workspaces. Di halaman Workspaces, klik nama ruang kerja yang ingin Anda kelola.
Di panel navigasi sebelah kiri, pilih .
Buat pipeline.
Di halaman Visualized Modeling (Designer), klik tab Preset Templates.
Di tab Preset Templates, temukan template FM-Embedding for Rec-System dan klik Create.
Di kotak dialog Create Pipeline, konfigurasikan parameter. Anda dapat menggunakan nilai default mereka.
Nilai yang ditentukan untuk parameter Pipeline Data Path adalah jalur bucket Object Storage Service (OSS) untuk data sementara dan model yang dihasilkan selama waktu proses pipeline.
Klik OK.
Pipeline akan dibuat dalam waktu sekitar 10 detik.
Lihat komponen pipeline di kanvas, seperti yang ditunjukkan pada gambar berikut. Sistem secara otomatis membuat pipeline berdasarkan template bawaan.

Bidang
Deskripsi
①
Komponen ini melakukan one-hot encoding pada semua data fitur. One-hot encoding mengonversi data bertipe karakter menjadi data bertipe numerik. Dalam pipeline ini, komponen One Hot Encoding-1 pertama-tama melakukan one-hot encoding pada semua data fitur dan menghasilkan model encoding. Kemudian, komponen One Hot Encoding-1 mengekspor model encoding ke komponen One Hot Encoding-2 dan One Hot Encoding-3.
②
Komponen ini menghasilkan model FM. Anda dapat mengklik komponen tersebut dan melihat pengaturan parameter default komponen pada tab Parameters Setting di panel sebelah kanan. Nilai default dari Dimensions adalah 1,1,10, di mana 10 menunjukkan jumlah dimensi dalam setiap vektor fitur.
③
Komponen ini menghasilkan kode fitur pengguna. Atur Binarization Column ke userid, gender, dan age serta atur Appended Columns ke userid untuk komponen ini.
④
Komponen ini menghasilkan kode fitur item. Atur Binarization Column ke itemid, price, dan size serta atur Appended Columns ke itemid untuk komponen ini.
⑤
Komponen-komponen ini mengekstrak vektor fitur pengguna dan item. Setiap komponen mencakup parameter berikut:
ID column name of embedding vector: parameter feature_id dari model yang dilatih oleh komponen FM Train-1.
Embedding vector column name: parameter feature_weights dari model yang dilatih oleh komponen FM Train-1.
Weight vector column name: kolom sparse yang diekspor oleh komponen One Hot Encoding-1.
Output result column name: nama kolom yang berisi vektor fitur yang dihasilkan.
Jalankan pipeline dan lihat hasilnya.
Di pojok kiri atas kanvas, klik ikon
.Setelah pipeline dijalankan, klik kanan Embedding extract-1 di kanvas dan pilih . Di kotak dialog yang muncul, lihat vektor fitur pengguna.

Klik kanan Embedding extract-2 di kanvas dan pilih . Di kotak dialog yang muncul, lihat vektor fitur item.
