All Products
Search
Document Center

Artificial Intelligence Recommendation:Praktik Terbaik untuk Menyesuaikan Algoritma Rekomendasi di PAI-Rec

Last Updated:Apr 01, 2026

Tutorial ini memandu Anda melalui konfigurasi solusi rekomendasi kustom di PAI-Rec menggunakan dataset publik. Pada akhirnya, Anda akan memiliki pipeline rekomendasi end-to-end yang berfungsi, mencakup rekayasa fitur, recall, dan peringkat detail halus—dengan alur kerja yang diterapkan ke DataWorks.

Prasyarat

Sebelum memulai, pastikan Anda telah:

Langkah 1: Buat instans PAI-Rec dan inisialisasi layanan

Langkah ini menyediakan instans PAI-Rec Edisi Premium dan menghubungkannya ke sumber daya cloud yang telah Anda siapkan dalam prasyarat. Edisi Premium wajib digunakan—edisi ini mencakup diagnostik data dan fitur solusi rekomendasi kustom yang digunakan dalam tutorial ini.

  1. Masuk ke halaman utama Personalized Recommendation Platform dan klik Buy Now.

  2. Pada halaman pembelian, atur parameter berikut dan klik Buy Now.

    ParameterDeskripsi
    Region and zoneWilayah tempat layanan cloud Anda diterapkan.
    Service typePilih Premium Edition. Edisi Premium menambahkan fitur diagnostik data dan solusi rekomendasi kustom dibandingkan Edisi Standar.
  3. Masuk ke Konsol PAI-Rec dan pilih wilayah Anda dari bilah menu atas.

  4. Di panel navigasi kiri, klik Instance list. Klik nama instans untuk membuka halaman detail instans.

  5. Pada bagian Operation guide, klik Init. Anda akan diarahkan ke System configurations > End-to-End service. Klik Edit, konfigurasikan sumber daya pada tabel berikut, lalu klik Done.

    Konfigurasi sumber daya

    ParameterDeskripsi
    Modeling
    PAI workspaceMasukkan ruang kerja PAI default yang telah Anda buat.
    DataWorks workspaceMasukkan ruang kerja DataWorks yang dihasilkan secara otomatis.
    MaxCompute project (workspace)Masukkan proyek MaxCompute yang telah Anda buat.
    OSS bucketPilih bucket OSS yang telah Anda buat.
    Engine
    Real-time recall engineUse PAI-FeatureStorePilih Yes.
    Real-time feature queryUse PAI-FeatureStorePilih Yes.
  6. Di panel navigasi kiri, pilih System configurations > Permission management. Pada tab Access service, verifikasi bahwa akses telah diberikan untuk setiap produk cloud.

Langkah 2: Klon dataset publik

Langkah ini memuat data sampel ke dalam proyek MaxCompute Anda. PAI-Rec menyediakan tiga tabel bersama di proyek publik pai_online_project:

  • Tabel pengguna: pai_online_project.rec_sln_demo_user_table

  • Tabel item: pai_online_project.rec_sln_demo_item_table

  • Tabel perilaku: pai_online_project.rec_sln_demo_behavior_table

Data dalam tabel-tabel ini dihasilkan secara acak dan tidak memiliki makna bisnis nyata, sehingga metrik pelatihan seperti Area Under the Curve (AUC) akan rendah. Hal ini diharapkan untuk pengaturan demo.

Dua metode tersedia:

MetodeDukungan penjadwalanKapan digunakan
Sinkronkan jendela waktu tetap menggunakan SQLTidakPengaturan satu kali untuk menjelajahi tutorial
Hasilkan data menggunakan skrip PythonYa (harian)Pelatihan model rutin dengan tugas terjadwal

Untuk pembuatan data harian dan pelatihan model, gunakan metode skrip Python.

Sinkronkan jendela waktu tetap

Jalankan perintah SQL di DataWorks untuk menyalin ketiga tabel dari pai_online_project ke proyek MaxCompute Anda (misalnya, project_mc).

  1. Masuk ke Konsol DataWorks dan pilih wilayah Anda.

  2. Di panel navigasi kiri, klik Data development and O&M > Data development.

  3. Pilih ruang kerja DataWorks yang telah Anda buat dan klik Go to data development.

  4. Arahkan kursor ke Create dan pilih Create node > MaxCompute > ODPS SQL. Atur parameter berikut dan klik Confirm.

    Konfigurasi sumber daya

    ParameterDeskripsiContoh
    Engine instanceSumber data MaxCompute yang disambungkan.
    Node typeODPS SQLODPS SQL
    PathJalur tempat node ini disimpan.Business Flow/Workflow/MaxCompute
    NameNama kustom untuk node ini.Data
  5. Di editor node, tempel dan jalankan SQL berikut. Sebelum menjalankan, konfigurasikan variabel penjadwalan agar ${bizdate} diatur ke tanggal kemarin dan ${bizdate_100} diatur ke 100 hari sebelum ${bizdate}. Konfigurasikan parameter penjadwalan sebagai berikut: image Jalankan SQL berikut sekali untuk menyalin data dari proyek publik ke proyek Anda:

    CREATE TABLE IF NOT EXISTS rec_sln_demo_user_table_v1(
     user_id BIGINT COMMENT 'Unique user ID',
     gender STRING COMMENT 'Gender',
     age BIGINT COMMENT 'Age',
     city STRING COMMENT 'City',
     item_cnt BIGINT COMMENT 'Number of created items',
     follow_cnt BIGINT COMMENT 'Number of follows',
     follower_cnt BIGINT COMMENT 'Number of followers',
     register_time BIGINT COMMENT 'Registration time',
     tags STRING COMMENT 'User tags'
    ) PARTITIONED BY (ds STRING) STORED AS ALIORC;
    
    INSERT OVERWRITE TABLE rec_sln_demo_user_table_v1 PARTITION(ds)
    SELECT *
    FROM pai_online_project.rec_sln_demo_user_table
    WHERE ds >= "${bizdate_100}" and ds <= "${bizdate}";
    
    CREATE TABLE IF NOT EXISTS rec_sln_demo_item_table_v1(
     item_id BIGINT COMMENT 'Item ID',
     duration DOUBLE COMMENT 'Video duration',
     title STRING COMMENT 'Title',
     category STRING COMMENT 'Primary tag',
     author BIGINT COMMENT 'Author',
     click_count BIGINT COMMENT 'Total clicks',
     praise_count BIGINT COMMENT 'Total likes',
     pub_time BIGINT COMMENT 'Publication time'
    ) PARTITIONED BY (ds STRING) STORED AS ALIORC;
    
    INSERT OVERWRITE TABLE rec_sln_demo_item_table_v1 PARTITION(ds)
    SELECT *
    FROM pai_online_project.rec_sln_demo_item_table
    WHERE ds >= "${bizdate_100}" and ds <= "${bizdate}";
    
    CREATE TABLE IF NOT EXISTS rec_sln_demo_behavior_table_v1(
     request_id STRING COMMENT 'Instrumentation ID/Request ID',
     user_id STRING COMMENT 'Unique user ID',
     exp_id STRING COMMENT 'Experiment ID',
     page STRING COMMENT 'Page',
     net_type STRING COMMENT 'Network type',
     event_time BIGINT COMMENT 'Behavior time',
     item_id STRING COMMENT 'Item ID',
     event STRING COMMENT 'Behavior type',
     playtime DOUBLE COMMENT 'Playback/Read duration'
    ) PARTITIONED BY (ds STRING) STORED AS ALIORC;
    
    INSERT OVERWRITE TABLE rec_sln_demo_behavior_table_v1 PARTITION(ds)
    SELECT *
    FROM pai_online_project.rec_sln_demo_behavior_table
    WHERE ds >= "${bizdate_100}" and ds <= "${bizdate}";

Hasilkan data menggunakan skrip Python

Gunakan metode ini untuk menjadwalkan pembuatan data harian. Skrip ini menghasilkan data sintetis untuk rentang waktu tertentu.

  1. Di konsol DataWorks, buat node PyODPS 3. Lihat Buat dan kelola node MaxCompute.

  2. Unduh create_data.py dan tempel isinya ke dalam node PyODPS 3.

  3. Di panel kanan, klik Scheduling configurations dan konfigurasikan parameter penjadwalan. Ganti variabel berikut: Setelah penggantian: Konfigurasikan dependensi penjadwalan, lalu klik ikon Simpan image dan Submit image.

    • $user_table_namerec_sln_demo_user_table

    • $item_table_namerec_sln_demo_item_table

    • $behavior_table_namerec_sln_demo_behavior_table

    image

    image

  4. Buka Operation center dan pilih Periodic task O&M > Periodic tasks.

  5. Di kolom Actions tugas target, pilih Backfill data > Current and descendant nodes.

  6. Di panel Backfill data, atur waktu data dan klik Submit and go. Atur waktu data ke Scheduled task date - 60 untuk mengisi ulang data selama 60 hari dan memastikan integritas data.

Konfigurasi node dependensi

Tambahkan tiga node virtual ke proyek DataWorks Anda. Node-node ini berfungsi sebagai jangkar dependensi untuk tabel data, memastikan tugas downstream menunggu data tersedia sebelum dijalankan.

  1. Arahkan kursor ke Create dan pilih Create node > General > Virtual node. Buat tiga node virtual menggunakan pengaturan berikut dan klik Confirm.

    Konfigurasi sumber daya

    ParameterDeskripsiContoh
    Node typeVirtual NodeVirtual Node
    PathJalur tempat node disimpan.Workflow/Workflow/General
    NameNama tabel data yang disinkronkan.rec_sln_demo_user_table_v1, rec_sln_demo_item_table_v1, rec_sln_demo_behavior_table_v1

    image

  2. Untuk setiap node virtual, atur konten node menjadi select 1;. Lalu klik Scheduling configurations di panel kanan dan lengkapi pengaturan berikut: Konfigurasikan ketiga node tersebut.

    • Di bawah Time property, atur Rerun property ke Rerun when succeeded or failed.

    • Di bawah Scheduling dependencies > Upstream dependencies, masukkan nama ruang kerja DataWorks, pilih node dengan akhiran _root, lalu klik Add.

    image

  3. Klik ikon image di depan setiap node virtual untuk mengirimnya.

Langkah 3: Daftarkan data

Daftarkan ketiga tabel yang telah disinkronkan di PAI-Rec agar tersedia untuk rekayasa fitur, recall, dan konfigurasi peringkat pada langkah-langkah berikutnya.

  1. Masuk ke Konsol PAI-Rec dan pilih wilayah Anda.

  2. Di panel navigasi kiri, klik Instance list. Klik nama instans untuk membuka halaman detail instans.

  3. Di panel navigasi kiri, pilih Custom recommendation solution > Data registration. Pada tab MaxCompute table, klik Add data table. Tambahkan satu tabel pengguna, satu tabel item, dan satu tabel perilaku menggunakan pengaturan berikut, lalu klik Start import.

    ParameterDeskripsiContoh
    MaxCompute projectProyek MaxCompute yang telah Anda buat.project_mc
    MaxCompute tableTabel data yang telah disinkronkan.Pengguna: rec_sln_demo_user_table_v1; Item: rec_sln_demo_item_table_v1; Perilaku: rec_sln_demo_behavior_table_v1
    Data table nameNama tampilan kustom untuk tabel.User Table, Item Table, Behavior Table

Langkah 4: Buat skenario rekomendasi

Buat skenario rekomendasi untuk menentukan konteks di mana rekomendasi disajikan (misalnya, feed halaman utama). Untuk latar belakang tentang skenario rekomendasi dan ID trafik, lihat Terms.

Di panel navigasi kiri, pilih Recommendation scenarios. Klik Create scenario, konfigurasikan parameter berikut, lalu klik OK.

Konfigurasi sumber daya

ParameterDeskripsiContoh
Scenario nameNama kustom untuk skenario ini.HomePage
Scenario descriptionDeskripsi skenario.

Langkah 5: Buat dan konfigurasi solusi algoritma

Langkah ini mengonfigurasi algoritma recall dan peringkat untuk skenario rekomendasi Anda. Untuk pengaturan produksi lengkap, algoritma berikut tersedia:

  • Global hot recall: Mengurutkan item top-k berdasarkan statistik klik dari data log.

  • Global hot fallback recall: Menyimpan set kandidat cadangan di Redis untuk mencegah hasil kosong jika mesin recall utama gagal.

  • Grouped hot recall: Melakukan recall item berdasarkan grup atribut (misalnya, kota atau jenis kelamin) untuk meningkatkan personalisasi item populer.

  • etrec u2i recall: Recall pengguna-ke-item berdasarkan algoritma filtering kolaboratif etrec.

  • Swing u2i recall (opsional): Recall pengguna-ke-item berdasarkan algoritma Swing.

  • Cold-start recall (opsional): Recall untuk pengguna dan item baru menggunakan algoritma DropoutNet.

  • Fine-grained ranking: Pilih MultiTower untuk peringkat tujuan tunggal atau DBMTL untuk peringkat multi-tujuan.

Recall vektor dan recall PDN biasanya ditambahkan setelah tahap recall dasar selesai. Recall vektor memerlukan mesin recall vektor dan tidak dibahas dalam tutorial ini karena FeatureDB tidak mendukungnya.

Untuk menyelesaikan penyebaran dengan cepat, tutorial ini hanya mengonfigurasi global hot recall dan etrec u2i recall untuk tahap recall, serta fine-grained ranking untuk tahap peringkat.

  1. Di panel navigasi kiri, pilih Custom recommendation solution > Solution configuration. Pilih skenario yang telah Anda buat, klik Create recommendation solution, isi parameter berikut, lalu klik Save and configure algorithm solution. Untuk parameter yang tidak tercantum di sini, pertahankan nilai default. Lihat Data table configuration untuk detailnya.

    Konfigurasi sumber daya

    ParameterDeskripsi
    Solution nameNama kustom.
    Scenario nameSkenario rekomendasi yang telah Anda buat.
    Offline storeProyek MaxCompute yang terkait dengan skenario.
    DataWorks workspaceRuang kerja DataWorks yang terkait dengan skenario.
    Workflow nameNama alur kerja DataWorks yang dibuat saat Anda menerapkan skrip solusi. Misalnya, Flow.
    StorageAPI configurationUntuk wilayah di Tiongkok daratan (seperti Beijing dan Shanghai), pilih StorageAPI (DTS bayar sesuai penggunaan). Untuk wilayah lain (seperti China (Hong Kong), Singapura, dan Frankfurt), beli dulu kelompok sumber daya DTS khusus, lalu pilih di sini. Tambahkan parameter ke tugas pelatihan TorchEasyRec di PAI-DLC dalam format: -odps_data_quota_name ot_xxxx_p#ot_yyyy.
    slim_modePilih No untuk tutorial ini.
    OSS bucketBucket OSS yang terkait dengan skenario.
    ProjectProyek FeatureStore yang telah Anda buat. Untuk online store, pilih FeatureDB.
    User entityEntitas fitur pengguna user di proyek FeatureStore.
    Item entityEntitas fitur item item di proyek FeatureStore.
  2. Pada node Data table configuration, klik Add di sebelah setiap tabel data. Konfigurasikan tabel log perilaku, tabel pengguna, dan tabel item seperti dijelaskan di bawah, lalu klik Next. Untuk parameter yang tidak tercantum di sini, pertahankan nilai default. Lihat Data table configuration. Tabel log perilaku Saat mengonfigurasi tabel log perilaku, sesuaikan field agar sesuai dengan data aktual Anda. Log perilaku demo berisi: ID permintaan, ID pengguna, halaman, waktu perilaku, dan jenis perilaku. Jika data Anda memiliki dimensi tambahan, klasifikasikan sebagai informasi pengguna atau item untuk rekayasa fitur.

    Konfigurasi sumber daya tabel log perilaku

    ParameterDeskripsiContoh
    Behavior table nameTabel perilaku yang terdaftar.rec_sln_demo_behavior_table_v1
    Time partitionField partisi tabel perilaku.dsyyyymmdd
    Behavior information configuration
    Request IDUUID yang mengidentifikasi setiap permintaan rekomendasi. Opsional.request_id
    Behavior eventField yang mencatat event perilaku.event
    Behavior event enumeration valuesJenis event dalam log perilaku.expr,click,praise
    Behavior valueKedalaman perilaku, seperti durasi tayangan atau harga transaksi.playtime
    Behavior timestampWaktu event sebagai Unix timestamp (presisi detik).event_time
    Timestamp formatFormat waktu perilaku.unixtime
    Behavior scenarioField skenario tempat perilaku terjadi.page
    Scenario enumeration valuesNilai skenario yang akan disertakan untuk statistik fitur.home,detail
    User information configuration
    User IDField ID pengguna di tabel perilaku.user_id
    User categorical featuresFitur kategorikal pengguna di tabel perilaku.net_type
    Item information configuration
    Item IDField ID item di tabel perilaku.item_id

    User table

    Konfigurasi sumber daya tabel pengguna

    ParameterDeskripsiContoh
    User table nameTabel pengguna yang terdaftar.rec_sln_demo_user_table_v1
    Time partitionField partisi waktu tabel pengguna.dsyyyymmdd
    User information configuration
    User IDField ID pengguna di tabel pengguna.user_id
    Registration timestampWaktu pendaftaran pengguna.register_time
    Timestamp formatFormat waktu pendaftaran.unixtime
    Categorical featuresField kategorikal di tabel pengguna.gender, city
    Numerical featuresField numerik di tabel pengguna.age, item_cnt, follow_cnt, follower_cnt
    Tag featureNama field fitur tag.tags

    Item table

    Konfigurasi sumber daya tabel item

    ParameterDeskripsiContoh
    Item table nameTabel item yang terdaftar.rec_sln_demo_item_table_v1
    Time partitionField partisi waktu tabel item.dsyyyymmdd
    Item information configuration
    Item IDField ID item di tabel item.item_id
    Author IDPenulis item.author
    Listing timestampField waktu pendaftaran item.pub_time
    Timestamp formatFormat waktu pendaftaran.unixtime
    Categorical featuresField kategorikal di tabel item.category
    Numerical featuresField numerik di tabel item.click_count, praise_count
  3. Pada node Feature configuration, atur parameter berikut, klik Generate features, atur versi fitur, lalu klik Next. Setelah mengklik Generate features, sistem akan menurunkan fitur statistik untuk pengguna dan item. Nilai default sudah cukup untuk tutorial ini. Lihat Feature configuration untuk menyesuaikan fitur turunan.

    Konfigurasi sumber daya

    ParameterDeskripsiContoh
    Common statistics periodJendela waktu untuk pembuatan fitur batch. Tutorial ini menggunakan 3, 7, dan 15 hari. Jika volume perilaku pengguna rendah, coba 21 hari.3,7,15
    Key behaviorsEvent perilaku yang disertakan. Tambahkan secara berurutan: impresi (expr), lalu click, lalu praise.expr, click, praise
  4. Pada node Recall configuration, klik Add di sebelah kategori recall target, konfigurasikan parameter, klik Confirm, lalu klik Next.

    Bagian berikut menjelaskan setiap metode recall. Untuk penyebaran cepat, konfigurasikan hanya Global hot recall dan etrec u2i recall. Metode lainnya hanya sebagai referensi. #### Global hot recall Global hot recall menghasilkan daftar item populer yang diurutkan (top_n item) berdasarkan statistik event klik. Setelah kode diterapkan ke DataWorks, Anda dapat memodifikasi formula skor atau event target. Formula skornya adalah:

    Konfigurasi sumber daya

    Global hot recall

    Global hot recall menghasilkan daftar item populer yang diurutkan (top_n item) berdasarkan statistik event klik. Setelah kode diterapkan ke DataWorks, Anda dapat memodifikasi formula skor atau event target.

    Formula skornya adalah:

    click_uv * click_uv / (expr + adj_factor) * exp(-item_publish_days / fresh_decay_denom)

    Di mana:

    • click_uv: Untuk tingkat klik (CTR) yang sama, jumlah klik yang lebih besar menunjukkan popularitas yang lebih tinggi.

    • click_uv / (expr + adj_factor): CTR yang telah dihaluskan. click_uv adalah jumlah pengguna unik yang mengklik; expr adalah jumlah impresi. Faktor penyesuaian adj_factor mencegah penyebut nol dan mengoreksi CTR saat jumlah impresi rendah.

    • exp(-item_publish_days / fresh_decay_denom): Penalti kesegaran yang mengurangi skor item lama. item_publish_days adalah jumlah hari sejak publikasi.

    image

    etrec u2i recall

    etrec adalah algoritma filtering kolaboratif berbasis item. Lihat Collaborative filtering etrec untuk detailnya.

    image

    ParameterDeskripsi
    Training daysJumlah hari log perilaku yang digunakan untuk pelatihan. Default: 30. Sesuaikan berdasarkan volume log.
    Recall countJumlah akhir pasangan pengguna-ke-item yang dihasilkan secara offline.
    U2ITriggerItem yang telah berinteraksi dengan pengguna (misalnya, diklik, difavoritkan, atau dibeli). Jangan sertakan item yang hanya terkena impresi.
    Behavior time windowJumlah hari data perilaku yang dikumpulkan. Default: 15.
    Behavior time attenuation coefficientNilai antara 0 dan 1. Nilai lebih tinggi menyebabkan perilaku masa lalu lebih cepat meluruh, sehingga mengurangi bobotnya dalam membangun item pemicu.
    Trigger selection countJumlah ID item per pengguna yang digunakan untuk melakukan Produk Kartesius dengan data i2i dari etrec. Nilai antara 10 dan 50 umumnya digunakan. Terlalu banyak pemicu menghasilkan set kandidat yang terlalu besar.
    U2i behavior weightAtur bobot event impresi ke 0 atau biarkan tidak diatur.
    I2I model settingsParameter model etrec. Lihat Collaborative filtering etrec. Hindari mengatur jumlah pemilihan item terkait terlalu tinggi. image

    Grouped hot recall

    Siapkan peringkat berdasarkan grup atribut (misalnya, kota dan jenis kelamin) untuk memberikan personalisasi awal. Contoh berikut menggunakan kombinasi jenis kelamin dan nilai bucket dari atribut numerik sebagai grup.

    image

    Swing u2i recall

    Swing mengukur kemiripan item berdasarkan prinsip Pengguna-Item-Pengguna.

    image

    image

    Vector recall

    Dua metode recall vektor tersedia: DSSM dan MIND.

    Atur target recall sebagai berikut:

    • Recall target name: is_click

    • Recall target selection: max(if(event='click', 1, 0))

    SQL berikut menghasilkan target recall:

    select max(if(event='click',1,0)) is_click, ...
    from ${behavior_table}
    where dt between ${bizdate_start} and ${bizdate_end}
    group by req_id, user_id, item

    Di mana:

    • ${behavior_table}: Tabel perilaku.

    • ${bizdate_start}: Tanggal mulai jendela waktu perilaku.

    • event: Field event di tabel perilaku. Pilih nilai berdasarkan field spesifik Anda.

    • is_click: Nama target.

    Rumus dimensi embedding:

    EMB_SQRT4_STEP8: (8 + Pow(count, 0.25)) / 8) * 8
    EMB_SQRT4_STEP4: (4 + Pow(count, 0.25)) / 4) * 4
    EMB_LN_STEP8:    (8 + Log(count + 1)) / 8) * 8
    EMB_LN_STEP4:    (4 + Log(count + 1)) / 4) * 4

    Gunakan fungsi Log saat jumlah nilai fitur besar.

    image

    image

    Cold-start recall

    DropoutNet adalah model recall menara ganda (menara pengguna + menara item) yang cocok untuk pengguna dan item populer, serta pengguna dan item ekor panjang dan baru. Lihat DropoutNet.

    image

    Global hot fallback recall

    Global hot fallback recall berfungsi sebagai jaring pengaman: jika mesin recall utama gagal, ia mengembalikan set kandidat yang telah dihitung sebelumnya dan disimpan di Redis. Output-nya adalah satu baris data.

    image

    Collaborative metric learning i2i recall

    Model recall Collaborative Metric Learning I2I menghitung kemiripan item berdasarkan data klik sesi.

    image

  5. Pada node Ranking configuration, klik Add di sebelah Fine-grained ranking, konfigurasikan parameter, klik Confirm, lalu klik Next.

    Konfigurasi sumber daya

    PAI-Rec mendukung berbagai model peringkat. Lihat Ranking models untuk daftar lengkapnya. Berikut cara mengonfigurasi DBMTL, model peringkat multi-tujuan.

    image

    Klik Add di sebelah Refined ranking target settings (labels) dan tambahkan dua label:

    • Target 1 image

    • Target 2 (huruf 'l' dalam 'ln' adalah huruf L kecil) image

  6. Pada node Generate script, klik Generate deployment script.

    Penting

    Setelah skrip dihasilkan, sistem menghasilkan alamat OSS tempat semua file penyebaran disimpan. Simpan alamat ini secara lokal—Anda akan membutuhkannya jika menerapkan secara manual melalui Migration Assistant.

    image

  7. Setelah pembuatan skrip selesai, klik OK di kotak dialog. Anda akan diarahkan ke Custom recommendation solution > Deployment records. Jika pembuatan gagal, tinjau log eksekusi, perbaiki error, lalu hasilkan ulang skrip.

Langkah 6: Terapkan solusi rekomendasi

Setelah skrip dihasilkan, terapkan ke DataWorks menggunakan salah satu dari dua metode.

Metode 1: Terapkan melalui Personalized Recommendation Platform

  1. Klik Go to deploy di sebelah solusi target.

    image

  2. Pada halaman Deployment preview, di bagian File diff, pilih file yang akan diterapkan. Untuk penerapan pertama, klik Select all, lalu klik Deploy to DataWorks. Halaman akan kembali ke Deployment records, menampilkan proses penerapan sedang berlangsung.

    image

  3. Klik image untuk memperbarui daftar dan memeriksa status penerapan.

    • Jika penerapan gagal, klik View log di kolom Actions, perbaiki error, lalu hasilkan ulang dan terapkan kembali skrip.

    • Ketika Deployment status berubah menjadi Success, skrip telah diterapkan. Buka halaman Pengembangan Data DataWorks untuk melihat kode yang diterapkan. Lihat Panduan proses pengembangan data.

    image

  4. Jalankan pengisian ulang data untuk mengisi data historis guna pelatihan.

    1. Pada halaman Deployment records, klik Details di sebelah solusi yang berhasil diterapkan.

    2. Pada halaman Deployment preview, klik View task data backfill process untuk meninjau instruksi pengisian ulang data dan memastikan integritas data.

    3. Konfirmasi bahwa tabel pengguna, tabel item, dan tabel perilaku semuanya berisi data untuk _n_ hari terakhir, di mana _n_ sama dengan jumlah jendela waktu pelatihan dan jendela waktu fitur maksimum. Jika Anda menggunakan data demo dari tutorial ini, sinkronkan partisi data terbaru. Jika Anda menghasilkan data dengan skrip Python, lakukan pengisian ulang melalui Operation center DataWorks.

    4. Klik Create deployment task. Di bawah Backfill task list, klik Start tasks sequentially. Tunggu hingga semua tugas berhasil selesai. Jika suatu tugas gagal, klik Details untuk melihat log, perbaiki kesalahan tersebut, jalankan ulang tugasnya, lalu klik Continue untuk melanjutkan.

    截屏2025-10-20 15

Metode 2: Terapkan menggunakan Migration Assistant

Setelah skrip dihasilkan, terapkan secara manual melalui DataWorks Migration Assistant. Untuk instruksi lengkap, lihat Buat dan lihat tugas impor DataWorks. Parameter utamanya adalah:

  • Import name: Atur sesuai petunjuk di konsol.

  • Upload method: Pilih OSS file, masukkan OSS link dari Langkah 5, lalu klik Verify.

Paket penyebaran disimpan di alamat OSS yang dihasilkan di Langkah 5, misalnya: oss://examplebucket/algoconfig/plan/1723717372/package.zip. Masuk ke Konsol OSS untuk mengambil URL file.

image

Langkah 7: Bekukan node

Tutorial ini menggunakan data demo. Setelah pengisian ulang data selesai, bekukan tiga node virtual yang dibuat di Langkah 2 untuk mencegahnya berjalan sesuai jadwal harian.

Di Operation center DataWorks, pilih Periodic task O&M > Periodic tasks. Cari nama node (misalnya, rec_sln_demo_user_table_v1), pilih node target (Ruang Kerja.Nama node), lalu pilih Pause (Freeze).