全部產品
Search
文件中心

Artificial Intelligence Recommendation:PAI-Rec推薦演算法定製的最佳實務文檔

更新時間:Feb 06, 2026

為方便您快捷體驗PAI-Rec產品,本文提供了一份公開資料集,您可以按照文檔說明,按步驟體驗PAI-Rec推薦演算法定製的特徵工程、召回、精排等關鍵功能的配置,產生代碼並部署到DataWorks相應的商務程序中。

前提條件

在開始執行操作前,請確認您已完成以下準備工作:

1.建立PAI-Rec執行個體並初始化服務

  1. 登入推薦系統開發平台PAI-Rec首頁,單擊立即購買

  2. 在PAI-Rec執行個體購買頁面,配置以下關鍵參數,然後單擊立即購買

    參數

    說明

    地區和可用性區域

    您的雲端服務部署的地區。

    服務類型

    本方案選擇標準版,且啟用“推薦方案定製”功能。

  3. 登入PAI-Rec管理主控台,在頂部功能表列左上方處,選擇地區。

  4. 在左側導覽列選擇執行個體列表,單擊執行個體名稱,進入執行個體詳情頁面。

  5. 單擊操作指引地區的雲產品配置,跳轉至系統配置>雲產品配置頁面,單擊編輯,按照如下資源配置完成相應參數配置,然後單擊退出

    資源配置

    參數

    說明

    建模

    Machine Learning Platform for AI 工作空間

    填寫已建立的PAI預設工作空間。

    巨量資料開發治理平台 DataWorks 工作空間

    填寫自動產生的DataWorks工作空間。

    MaxCompute MaxCompute 專案(工作)空間

    填寫已建立的MaxCompute專案。

    Object Storage Service Bucket

    選擇已建立的OSS Bucket。

    引擎

    即時召回引擎

    確認是否使用PAI-FeatureStore,選擇

    即時特徵查詢

    確認是否使用PAI-FeatureStore,選擇

  6. 在左側導覽列選擇系統配置>許可權管理,按照介面提示,在訪問服務頁簽檢查各項雲產品授權情況,確保對應雲產品訪問狀態正常。

2. 複製公開資料集

1.同步資料表

本方案的輸入資料有兩種方案:

  1. 從pai_online_project專案中複製固定時間窗的資料,不支援任務例行調度執行。

  2. 提供Python指令碼,通過代碼產出資料,可以通過DataWorks執行任務產出指定時間段的資料。

如果需要調度每天產出資料和訓練模型,建議使用第二種方案。您需要部署指定的Python代碼以產生所需資料,詳情請參見“通過代碼產出資料”頁簽。

同步固定時間窗的資料

PAI-Rec在公開訪問的專案pai_online_project中提前準備了推薦演算法中常用的三張表:

  • 使用者表:pai_online_project.rec_sln_demo_user_table

  • 物品表:pai_online_project.rec_sln_demo_item_table

  • 行為表:pai_online_project.rec_sln_demo_behavior_table

本方案後續的操作均基於上述三張表,其資料均是隨機產生的類比資料,沒有真實業務含義,因此訓練得到的AUC等指標較低。您需要在DataWorks中執行SQL命令,從pai_online_project專案中將上述表資料同步到您的DataWorks專案(例如DataWorks_a)中。具體操作步驟如下:

  1. 登入DataWorks控制台,在頂部功能表列左上方處,選擇地區。

  2. 在左側導覽列單擊資料開發與營運>資料開發

  3. 選擇已建立的DataWorks工作空間後,單擊進入資料開發

  4. 滑鼠移至上方至建立,選擇建立節點>MaxCompute>ODPS SQL,按照如下資源配置完成相應參數配置,然後單擊確認

    資源配置

    參數

    說明

    引擎執行個體

    選擇已綁定的MaxCompute資料來源。

    節點類型

    選擇節點類型ODPS SQL。

    路徑

    選擇當前節點所在路徑。例如商務程序/Workflow/MaxCompute

    名稱

    自訂填寫,例如Data。

  5. 在建立節點地區,複製並運行下面的代碼,將使用者表、物品表、行為表從pai_online_project專案同步到您已建立的MaxCompute專案(例如project_mc)中。執行代碼需要設定變數,指定bizdate到bizdate日期之前100天的資料。一般把bizdate設定為當前的日期的前一天,設定調度參數如下:image以下代碼執行一次,即可將資料從公用的pai_online_project專案複製到使用者的專案中:

CREATE TABLE IF NOT EXISTS rec_sln_demo_user_table_v1(
 user_id BIGINT COMMENT '使用者唯一ID',
 gender STRING COMMENT '性別',
 age BIGINT COMMENT '年齡',
 city STRING COMMENT '城市',
 item_cnt BIGINT COMMENT '創作內容數',
 follow_cnt BIGINT COMMENT '關注數',
 follower_cnt BIGINT COMMENT '粉絲數',
 register_time BIGINT COMMENT '註冊時間',
 tags STRING COMMENT '使用者標籤'
) PARTITIONED BY (ds STRING) STORED AS ALIORC;

INSERT OVERWRITE TABLE rec_sln_demo_user_table_v1 PARTITION(ds)
SELECT *
FROM pai_online_project.rec_sln_demo_user_table
WHERE ds >= "${bizdate_100}" and ds <= "${bizdate}";

CREATE TABLE IF NOT EXISTS rec_sln_demo_item_table_v1(
 item_id BIGINT COMMENT '內容ID',
 duration DOUBLE COMMENT '視頻時間長度',
 title STRING COMMENT '標題',
 category STRING COMMENT '一級標籤',
 author BIGINT COMMENT '作者',
 click_count BIGINT COMMENT '累計點擊數',
 praise_count BIGINT COMMENT '累計點贊數',
 pub_time BIGINT COMMENT '發布時間'
) PARTITIONED BY (ds STRING) STORED AS ALIORC;

INSERT OVERWRITE TABLE rec_sln_demo_item_table_v1 PARTITION(ds)
SELECT *
FROM pai_online_project.rec_sln_demo_item_table
WHERE ds >= "${bizdate_100}" and ds <= "${bizdate}";

CREATE TABLE IF NOT EXISTS rec_sln_demo_behavior_table_v1(
 request_id STRING COMMENT '埋點ID/請求ID',
 user_id STRING COMMENT '使用者唯一ID',
 exp_id STRING COMMENT '實驗ID',
 page STRING COMMENT '頁面',
 net_type STRING COMMENT '網路型號',
 event_time BIGINT COMMENT '行為時間',
 item_id STRING COMMENT '內容ID',
 event STRING COMMENT '行為類型',
 playtime DOUBLE COMMENT '播放時間長度/閱讀時間長度'
) PARTITIONED BY (ds STRING) STORED AS ALIORC;


INSERT OVERWRITE TABLE rec_sln_demo_behavior_table_v1 PARTITION(ds)
SELECT *
FROM pai_online_project.rec_sln_demo_behavior_table
WHERE ds >= "${bizdate_100}" and ds <= "${bizdate}";

通過代碼產出資料

使用固定時間窗的資料,不支援任務例行調度執行。如果有執行需求,您需要部署特定的Python代碼以產生所需資料。具體操作步驟如下:

  1. 在DataWorks控制台建立PyODPS 3節點,詳情請參見建立並管理MaxCompute節點

  2. 單擊並下載create_data.py,將檔案內容粘貼到PyODPS 3節點中。

  3. 單擊右側的調度配置,並配置以下參數,然後單擊右上方的儲存image和提交image

    • 配置調度參數:

      • 注意替換變數:

        $user_table_name可以替換為rec_sln_demo_user_table

        $item_table_name可以替換為rec_sln_demo_item_table

        $behavior_table_name可以替換為rec_sln_demo_behavior_table

        image

        替換後:

        image

    • 配置調度依賴。

  4. 單擊營運中心,並選擇周期任務營運 > 周期任務

  5. 單擊目標任務操作列下的補資料 > 當前節點及下遊節點

  6. 補資料配置面板中,設定業務日期,並單擊提交並跳轉

    較好的補資料時間範圍為60天,建議您將業務日期設定為任務定時調度日期-60,以確保資料的完整性。

2.配置依賴節點

為了確保後續代碼產生與部署的順利進行,請預先在您的DataWorks專案中添加三個SQL代碼節點。請將這些節點的調度依賴配置為工作空間的根節點,完成所有設定後再發布節點。具體操作步驟如下:

  1. 滑鼠移至上方至建立,選擇建立節點>通用>虛擬節點,按照如下資源配置分別建立3個虛擬節點,然後單擊確認

    資源配置

    參數

    說明

    方案預設樣本

    節點類型

    選擇節點類型。

    虛擬節點

    路徑

    選擇當前節點所在路徑。

    商務程序/Workflow/通用

    名稱

    分別填寫已同步的資料表名稱。

    • rec_sln_demo_user_table_v1

    • rec_sln_demo_item_table_v1

    • rec_sln_demo_behavior_table_v1

    image

  2. 選中節點,分別將代碼節點內容設定為select 1;,然後單擊右側的調度配置,完成以下配置:

    • 時間屬性地區,設定重跑屬性運行成功或失敗後節點重跑

    • 調度依賴>依賴的上遊節點地區,輸入DataWorks工作空間名稱,選擇帶有_root尾碼的節點,單擊添加

      3個虛擬節點均需配置。

      image

  3. 單擊虛擬節點前的image,提交該節點。

3.註冊資料

為了後續在推薦方案定製功能中配置特徵工程、召回、排序演算法,您需要先註冊同步到DataWorks專案中的三張表,具體操作步驟如下:

  1. 登入PAI-Rec管理主控台,在頂部功能表列左上方處選擇地區。

  2. 在左側導覽列選擇執行個體列表,單擊執行個體名稱,進入執行個體詳情頁面。

  3. 在左側導覽列選擇推薦方案定製>資料註冊,在MaxCompute表頁簽單擊新增資料表,按照如下資源配置分別新增1個使用者表、1個物品表和1個行為表,然後單擊開始匯入

    參數

    說明

    方案預設樣本

    MaxCompute專案

    選擇已建立的MaxCompute專案。

    project_mc

    MaxCompute表

    選擇已同步到DataWorks工作空間的資料表。

    • 使用者表:rec_sln_demo_user_table_v1

    • 物品表:rec_sln_demo_item_table_v1

    • 行為表:rec_sln_demo_behavior_table_v1

    資料表名稱

    自訂填寫。

    • 使用者表

    • 物品表

    • 行為表

4.建立推薦情境

在配置推薦任務之前需要先建立一個推薦情境。推薦情境的基本概念、流量編碼含義參考基本概念

在左側導覽列選擇推薦情境,單擊建立情境,按照如下資源配置建立1個推薦情境,然後單擊確定

資源配置

參數

說明

方案預設樣本

情境名稱

自訂填寫。

HomePage

情境介紹

關於情境的詳細說明。

5.建立並配置演算法方案

如果您需要完整配置一個真實情境,建議配置的召回和精排如下。

  • 全域熱門召回:日誌資料中,全面熱門資料的統計排名取Top k。

  • 全域熱門兜底召回:使用Redis作為兜底,防止推薦介面下發資料為空白。

  • 分組熱門召回:按照城市、性別區間等指標來分類召回,這對提高熱門物品的準確性有協助。

  • etrec u2i召回:基於etrec協同過濾演算法。

  • swing u2i召回(可選):基於Swing演算法。

  • 冷啟動召回(可選):dropoutnet演算法的冷啟動召回。

  • 精排:單目標可以選擇MultiTower排序;多目標可選擇DBMTL排序。

一般當召回比較全面之後再開啟向量召回或者PDN召回等演算法。向量召回需要配合向量召回引擎,因為FeatureDB不支援向量召回,因此我們在本案例中不配置向量召回。

本文旨在體驗配置與部署流程,因此在召回配置環節只配置了全域熱門召回及RECommender(eTREC,一種協同過濾的實現)的u2i召回策略。在排序配置上,選擇了精細化排名以最佳化體驗。具體操作步驟如下:

  1. 在左側導覽列選擇推薦方案定製>方案配置,選擇已建立的情境,並單擊建立推薦方案,按照如下資源配置建立1個方案,然後單擊儲存並進入演算法方案配置

    未說明的參數保持預設即可,詳情請參見資料表配置

    資源配置

    參數

    說明

    方案名稱

    自訂填寫。

    情境名稱

    選擇已建立的推薦情境。

    離線資料來源

    選擇推薦情境關聯的MaxCompute專案。

    DataWorks工作空間

    選擇推薦情境關聯的DataWorks工作空間。

    商務程序名稱

    該名稱為後續部署推薦方案指令碼時,在DataWorks建立的商務程序名稱。可自訂填寫,例如Flow。

    StorageAPI配置

    國內地區:如北京、上海等可以選擇“StorageAPI”,即隨用隨付的Data Transmission Service;

    海外地區:如中國香港、新加坡、法蘭克福等,需要先購買與使用獨享Data Transmission Service資源群組(如沒有隨用隨付,需要購買包月的Data Transmission Service),然後重新整理選擇包月的Data Transmission Service名稱。在DataWorks的PAI-DLC的TorchEasyRec訓練任務中增加參數,形式類似:-odps_data_quota_name ot_xxxx_p#ot_yyyy。

    slim_mode

    如果DataWorks選購版本對遷移助手中匯入的程式碼封裝有大小限制,可使用此功能,並將超出大小限制的程式碼封裝手動上傳。本方案選擇

    OSS Bucket

    選擇推薦情境關聯的OSS Bucket。

    專案

    選擇已建立的FeatureStore專案,其中線上資料來源選擇FeatureDB。

    使用者實體

    選擇FeatureStore專案對應的user特徵實體user。

    物品實體

    選擇FeatureStore專案對應的item特徵實體item。

  2. 資料表配置節點,單擊目標資料表右側的添加,按照如下資源配置分別設定行為日誌表使用者表物品表,並設定相應的分區、事件、特徵、時間戳記等欄位,然後單擊下一步

    未說明的參數保持預設即可,詳情請參見資料表配置

    行為日誌表資源配置

    在配置行為日誌表時,應依據實際資料內容作出調整。以本文為例,行為日誌包含諸如請求ID、使用者唯一識別碼、行為發生的頁面、行為時間戳記及行為類別等核心資訊。若表中包含更豐富的資料維度,推薦將這些資訊按使用者和物品分類,配置到使用者資訊或物品資訊中,以便於後續的特徵工程處理。

    參數

    說明

    方案預設樣本

    行為表名稱

    選擇登入的行為表。

    rec_sln_demo_behavior_table_v1

    時間分區

    行為表的分區欄位。

    ds

    yyyymmdd

    行為資訊配置

    請求ID

    日誌中標記每次推薦請求的ID,一般是程式產生的UUID。可不填。

    request_id

    行為事件

    指日誌中記錄行為事件的欄位。

    event

    行為事件枚舉值

    行為事件中包含的枚舉值,如曝光、點擊、加購或購買等行為。

    expr,click,praise

    行為的值

    表示行為的深度,如成交價格、觀看時間長度等欄位。

    playtime

    行為時間戳記

    日誌發生的時間,精確到秒的時間戳記。

    event_time

    時間戳記格式

    和行為時間戳記配合使用。

    unixtime

    行為情境

    表示日誌發生的情境欄位,如首頁、搜尋網頁或商品詳情頁。

    page

    情境枚舉值

    指使用了哪些情境的資料,在後續特徵工程中可以分情境統計特徵。

    home,detail

    使用者資訊配置

    使用者ID

    行為表中使用者ID的標識。

    user_id

    使用者類別特徵

    行為表中存在的使用者類別特徵,如網路、操作平台或性別等。

    net_type

    物品資訊配置

    物品ID

    行為表中物品ID的標識。

    item_id

    使用者表資源配置

    參數

    說明

    方案預設樣本

    使用者表名稱

    選擇已註冊的使用者表。

    rec_sln_demo_user_table_v1

    時間分區

    使用者表的時間分區欄位。

    ds

    yyyymmdd

    使用者資訊配置

    使用者ID

    使用者表中的使用者ID欄位。

    user_id

    註冊時間戳記

    該使用者註冊的時間。

    register_time

    時間戳記格式

    和註冊時間戳記配合使用。

    unixtime

    類別特徵

    使用者表的類別欄位,如性別、年齡段或所屬城市等。

    gender,city

    數值特徵

    使用者表的數值欄位,如作品數、積分等。

    age,item_cnt,follow_cnt,follower_cnt

    tag特徵

    tag特徵欄位名。

    tags

    物品表資源配置

    參數

    說明

    方案預設樣本

    物品表名稱

    選擇登入的物品表。

    rec_sln_demo_item_table_v1

    時間分區

    物品表的時間分區欄位。

    ds

    yyyymmdd

    物品資訊配置

    物品ID

    物品表中的物品ID欄位。

    item_id

    作者ID

    商品所屬的作者。

    author

    上架時間戳記

    物品上架時間戳記欄位名。

    pub_time

    時間戳記格式

    和上架時間戳記配合使用。

    unixtime

    類別特徵

    物品表的類別欄位,如類目。

    category

    數值特徵

    物品表的數值欄位,如作價格、累計銷量或點贊量。

    click_count,praise_count

  3. 特徵配置節點,按照如下資源配置完成相應參數配置,單擊產生特徵,設定特徵版本,然後單擊下一步

    單擊產生特徵後,會在使用者和物品側衍生出多種統計特徵,本方案不對衍生特徵進行二次編輯,保持預設即可。您可以根據自身業務需求,對衍生特徵進行編輯,詳情請參見特徵配置

    資源配置

    參數

    說明

    方案預設樣本

    常用統計時間周期

    該配置將用於批量產生特徵。為了避免產生特徵過多,本方案設定統計時間周期為3、7、15天,分別為了統計使用者和物品在最近3天、7天和15天內的統計特徵。

    如果使用者行為數量很少,可嘗試設定21天。

    3,7,15

    重點關注行為

    選擇已配置的行為事件,建議添加次序為expr(曝光)、click(點擊)、praise(點贊)。

    expr,click,praise

  4. 召回配置節點,單擊目標分類右側的添加,完成相應參數配置,單擊確認,然後單擊下一步

    以下內容包含了多種召回配置方法,為了帶您快速體驗部署流程,您可以只配置全域熱門召回etrec u2i召回。其他向量召回、協同度量召回等僅供參考。

    資源配置

    全域熱門召回

    全域熱門召回是根據點擊事件統計得到熱門的物品熱門排行榜(top_n表示熱門排行榜個數)。如果要修改熱門的得分公式或者訪問事件,您可在產生相關代碼後,將其部署到DataWorks平台再進行修改。

    打分公式為click_uv*click_uv/(expr+adj_factor)*exp(-item_publish_days/fresh_decay_denom),其中

    • click_uv:相同點擊率(CTR)時,點擊量越多,則越熱門。

    • click_uv/(expr+adj_factor):平滑後的點擊率(CTR),其中click_uv表示點擊使用者數量,expr表示曝光數量。增加調節因子adj_factor,一方面是為了防止分母為0,另一方面是當曝光數量很少的時候,CTR會接近於1,加上adj_factor之後CTR會遠離1,從而使得CTR更加趨近於真實的CTR。

    • exp(-item_publish_days/fresh_decay_denom):懲罰發布早的商品。其中item_publish_days表示從發布時間到當前的天數。

    image

    etrec u2i召回

    etrec是基於item的協同過濾演算法,詳情請參見協同過濾etrec

    image

    參數

    描述

    訓練天數

    表示使用多少天的行為日誌來訓練。預設為30天,您可以根據日誌量來增減。

    召回數目

    表示最終離線產出的使用者到物品的數量。

    U2ITrigger

    表示使用者有互動行為的物品。例如使用者點擊、收藏或購買的物品,一般不包含曝光物品。

    行為時間視窗

    表示收集多少天內的行為資料,預設為15,表示最近15天。

    行為時間衰減係數

    一般介於0-1之間,值越大表示過去的行為距離今天衰減越厲害,在構造trigger_item中其佔比權重越小。

    Trigger選取數目

    指每個使用者取多少個物品ID去與etrec產出的i2i資料做笛卡爾積。建議取值在10到50之間。如果Trigger的數目太大會造成召回的候選物品數量太多。

    u2i行為權重

    其中注意曝光事件要麼不設定,要麼設定為權重0。建議不設定曝光事件,即跳過使用者曝光資料。

    I2I模型設定

    etrec的參數設定,詳情請參見協同過濾etrec。其中相關Item選取數目建議不要太多。image

    分組熱門召回

    即可設定按照城市、性別等屬性來統計熱門排行榜,能提供初步個人化的召回。如下樣本中,使用性別和數值的分桶號組合作為分組。

    image

    swing u2i召回

    Swing是一種item相關性計算方法,基於User-Item-User原理衡量Item的相似性。image

    image

    向量召回

    提供兩種向量召回方式DSSMMIND ,具體介紹參考:

    • 召回目標名稱:一般指是否點擊,設定為is_click。

    • 召回目標選取: 設定為max(if(event='click', 1, 0))

      該部分在執行的時候可以參考如下代碼:

      select max(if(event='click',1,0)) is_click ,...
      from ${behavior_table}
      where between dt=${bizdate_start} and dt=${bizdate_end}
      group by req_id,user_id,item

      其中:

      • ${behavior_table}:表示行為表。

      • ${bizdate_start}:是行為時間窗的開始日期。

      • event:是${behavior_table}表裡面事件欄位,需根據具體欄位選擇。

      • is_click:即目標名稱。

      其中維度計算的公式如下:

      EMB_SQRT4_STEP8: (8 + Pow(count, 0.25)) / 8) * 8
      EMB_SQRT4_STEP4: (4 + Pow(count, 0.25)) / 4) * 4
      EMB_LN_STEP8:    (8 + Log(count + 1)) / 8) * 8
      EMB_LN_STEP4:    (4 + Log(count + 1)) / 4) * 4

      其中count表示特徵枚舉值個數。當特徵取值個數較多時,使用Log函數。

    image

    image

    冷啟動召回

    類似於DSSM的雙塔召回模型,分為user塔和item塔。DropoutNet是一種既適用於頭部使用者和物品,也適用於中長尾,甚至全新的使用者和物品的召回模型。

    image

    全域熱門召回兜底

    全域熱門召回兜底和全域熱門召回基本一致,主要是為了防止全域熱門召回引擎失敗情況下能夠召回足夠多的候選集,因此將其存放在Redis儲存中,該產出只有一行資料。image

    協同度量學習i2i召回

    協同度量學習i2i召回,又稱Collaborative Metric Learning I2I召回模型,基於session點擊資料計算item與item的相似性。image

  5. 排序配置節點,單擊精排右側的添加,按照如下資源配置完成相應參數配置,單擊確認,然後單擊下一步

    資源配置

    本平台提供多種排序模型,具體可參考排序模型。下面是按照多目標排序模型DBMTL來設定相關的排序參數。

    image

    單擊精排目標設定(labels)後的新增,新增如下兩個label:

    • 目標1image

    • 目標2(注意ln中的l是L的小寫)image

  6. 產生指令碼節點,單擊產生部署指令碼image

    重要

    指令碼產生成功後,系統將產生一個如上圖所示的OSS地址,該OSS路徑儲存了待部署的所有檔案。您可以將該地址儲存到本地,方便後續使用手動方式部署指令碼。

  7. 指令碼產生完成後,在彈窗中單擊確定,跳轉至推薦方案定製>部署記錄頁面。

    如果產生失敗,請查看作業記錄,分析並解決具體報錯問題,然後重建指令碼。

6.部署推薦方案

指令碼產生完成後,您可以通過以下兩種方式,將該指令碼部署至DataWorks。

方式一:通過推薦全鏈路深度定製開發平台部署

  1. 單擊目標方案右側的前往部署image

  2. 部署預覽頁面的檔案diff地區,選擇要部署的檔案。本方案為首次部署,單擊全選,然後單擊部署到DataWorks

    頁面自動返回到部署記錄頁面,顯示指令碼部署運行中。image

  3. 等待一段時間後,單擊image重新整理列表,查看部署狀態。

    • 如果部署失敗,請單擊操作列下的查看日誌,分析並解決具體報錯問題,然後重建指令碼並部署。

    • 部署狀態變為成功,代表指令碼已成功部署。您可以前往該方案配置的DataWorks工作空間下的資料開發頁面,查看部署好的代碼,詳情請參見資料開發流程指引image

  4. 查看任務補資料流程。

    1. 推薦方案定製 > 部署記錄頁面,單擊已部署成功的推薦方案操作列下的詳情

    2. 部署預覽頁面,單擊查看任務補資料流程,瞭解補資料流程和相關說明,確保資料的完整性。

    3. 保證使用者表、物品表、使用者行為表分區都有最近n天(n的值可以是:訓練時間窗加上最大特徵時間窗的數值)的資料。如果是使用本文的demo資料,注意同步最新的資料分區。如果使用Python指令碼產出資料,則在DataWorks營運中心補數產出最新的資料分區。

    4. 點擊建立補數任務,在補數工作清單下面點擊依次啟動任務。保證任務都成功運行。某個任務如果運行失敗,可以點擊詳情來查看日誌資訊,分析並解決相應的錯誤,然後重跑即可。重跑成功後需要點擊頁面左上方的續跑,直至任務全部成功。截屏2025-10-20 15

方式二:通過遷移助手部署

指令碼產生成功後,您也可以前往DataWorks控制台,通過遷移助手功能手動部署指令碼,其中關鍵參數說明如下,其他動作詳情,請參見建立和查看DataWorks匯入任務

  • 匯入名稱:按照控制台提示進行設定。

  • 上傳方式:使用OSS檔案,輸入OSS連結並進行校正

    部署檔案存放在步驟5產生的OSS地址中,例如oss://examplebucket/algoconfig/plan/1723717372/package.zip,您可登入OSS控制台,按如下步驟擷取相應檔案的URL連結。image

7.凍結節點

此文檔是Demo資料,當一鍵補數已經完成,需要凍結營運中心裏面的任務(步驟2.2中三個節點),防止任務每天調度執行。

進入DataWorks的營運中心,滑鼠選擇周期任務營運>周期任務,搜尋剛才建立節點名稱(如rec_sln_demo_user_table_v1),選中目標節點(工作空間.節點名),選擇暫停(凍結)即可。