全部产品
Search
文档中心

Platform For AI:Gunakan FM-Embedding untuk matching recall

更新时间:Jul 06, 2025

Dalam skenario rekomendasi, Anda dapat menggunakan solusi FM-Embedding yang disediakan oleh Machine Learning Designer untuk mendapatkan vektor fitur dari setiap pengguna dan item. Kemudian, gunakan modul recall untuk menghitung hasil perkalian vektor fitur tersebut. Dengan cara ini, Anda dapat memprediksi peringkat yang akan diberikan oleh setiap pengguna kepada setiap item. Topik ini menjelaskan cara menggunakan algoritma Factorization Machine (FM) dan Embedding untuk menghasilkan vektor fitur pengguna dan item.

Prasyarat

Informasi latar belakang

Rekomendasi berbasis AI dibagi menjadi dua modul: Pengurutan dan Recall. Modul recall menggunakan vektor fitur untuk merepresentasikan pengguna dan item yang direkomendasikan. Hasil perkalian vektor fitur pengguna dan vektor fitur item menunjukkan minat pengguna pada item tersebut. Pipeline yang dijelaskan dalam topik ini menggunakan data rekomendasi nyata. Pipeline ini dapat dibuat dari template preset FM-Embedding for Rec-System dari Machine Learning Designer. Anda dapat menghasilkan vektor fitur pengguna dan item dengan cepat melalui penyeretan dan peletakan Komponen yang disediakan oleh Machine Learning Designer.

Dataset

Tabel berikut menjelaskan bidang dalam dataset.

Parameter

Tipe

Deskripsi

userid

STRING

ID pengguna.

age

DOUBLE

Usia pengguna.

gender

STRING

Jenis kelamin pengguna.

itemid

STRING

ID item.

price

DOUBLE

Harga item.

size

DOUBLE

Ukuran item.

label

DOUBLE

Menunjukkan apakah pengguna telah membeli item. Nilai yang valid:

  • 1.0: Pengguna telah membeli item.

  • 0.0: Pengguna belum membeli item.

Gambar berikut menunjukkan data sampel yang digunakan dalam pipeline. Raw data

Prosedur

  1. Buka halaman Machine Learning Designer.

    1. Masuk ke Konsol PAI.

    2. Di panel navigasi sebelah kiri, klik Workspaces. Di halaman Workspaces, klik nama ruang kerja yang ingin Anda kelola.

    3. Di panel navigasi sebelah kiri, pilih Model Training > Visualized Modeling (Designer).

  2. Buat pipeline.

    1. Di halaman Visualized Modeling (Designer), klik tab Preset Templates.

    2. Di tab Preset Templates, temukan template FM-Embedding for Rec-System dan klik Create.

    3. Di kotak dialog Create Pipeline, konfigurasikan parameter. Anda dapat menggunakan nilai default mereka.

      Nilai yang ditentukan untuk parameter Pipeline Data Path adalah jalur bucket Object Storage Service (OSS) untuk data sementara dan model yang dihasilkan selama waktu proses pipeline.

    4. Klik OK.

      Pipeline akan dibuat dalam waktu sekitar 10 detik.

    5. Lihat komponen pipeline di kanvas, seperti yang ditunjukkan pada gambar berikut. Sistem secara otomatis membuat pipeline berdasarkan template bawaan.

      Matching recall pipeline

      Bidang

      Deskripsi

      Komponen ini melakukan one-hot encoding pada semua data fitur. One-hot encoding mengonversi data bertipe karakter menjadi data bertipe numerik. Dalam pipeline ini, komponen One Hot Encoding-1 pertama-tama melakukan one-hot encoding pada semua data fitur dan menghasilkan model encoding. Kemudian, komponen One Hot Encoding-1 mengekspor model encoding ke komponen One Hot Encoding-2 dan One Hot Encoding-3.

      Komponen ini menghasilkan model FM. Anda dapat mengklik komponen tersebut dan melihat pengaturan parameter default komponen pada tab Parameters Setting di panel sebelah kanan. Nilai default dari Dimensions adalah 1,1,10, di mana 10 menunjukkan jumlah dimensi dalam setiap vektor fitur.

      Komponen ini menghasilkan kode fitur pengguna. Atur Binarization Column ke userid, gender, dan age serta atur Appended Columns ke userid untuk komponen ini.

      Komponen ini menghasilkan kode fitur item. Atur Binarization Column ke itemid, price, dan size serta atur Appended Columns ke itemid untuk komponen ini.

      Komponen-komponen ini mengekstrak vektor fitur pengguna dan item. Setiap komponen mencakup parameter berikut:

      • ID column name of embedding vector: parameter feature_id dari model yang dilatih oleh komponen FM Train-1.

      • Embedding vector column name: parameter feature_weights dari model yang dilatih oleh komponen FM Train-1.

      • Weight vector column name: kolom sparse yang diekspor oleh komponen One Hot Encoding-1.

      • Output result column name: nama kolom yang berisi vektor fitur yang dihasilkan.

  3. Jalankan pipeline dan lihat hasilnya.

    1. Di pojok kiri atas kanvas, klik ikon image.png.

    2. Setelah pipeline dijalankan, klik kanan Embedding extract-1 di kanvas dan pilih View Data > Output. Di kotak dialog yang muncul, lihat vektor fitur pengguna. Feature vectors of users

    3. Klik kanan Embedding extract-2 di kanvas dan pilih View Data > Output. Di kotak dialog yang muncul, lihat vektor fitur item. Feature vectors of items