PAI-Rec推薦開發平台-推薦方案定製-排序配置 -

在排序配置中我們選擇添加一個“精排”：

本例中精排模型名稱填寫acc_rank，精排目標設定包含兩個目標：is_click（運算式max(if(event='click', 1, 0))）和is_praise（運算式max(if(event='praise', 1, 0))）。過濾欄位選擇age等，訓練天數設為30，模型類型選擇dbmtl，embed_dim策略選擇EMB_SQRT4_STEP4。

精排模型名稱：字母加底線，推薦用：${情境名稱}_${模型名稱}_rank
精排目標設定：精排目標可以設定多個目標，包含分類和迴歸目標，詳情如下。

分類目標

精排目標名稱自訂；精排目標運算式，一般我們是二分類目標，根據彙總條件做對應的彙總；目標類型分類就是classification。

例如，精排目標名稱填寫is_click，精排目標運算式填寫max(if(event='click', 1, 0))。精排目標依賴(depends)為可選項，多個資料用逗號分隔。

迴歸目標

精排目標名稱可自訂；

精排目標運算式：對於迴歸目標，我們需要對行為表目標數值做sum彙總加和，然後取log變換；

目標類型：選擇迴歸目標regression;

精排目標依賴：如果某目標（x）需要依賴另外一個目標（y），可以在目標依賴處填寫。例如：在視頻中我們只有點擊之後才會播放，播放的觀看時間長度是play_time，那麼play_time目標可以依賴點擊目標（注意這裡選擇的是上面註冊的分類任務名稱is_click）。同理，其他分類任務也適用。

過濾欄位：可以選擇我們不需要參與訓練的特徵，或者不能在曝光之前擷取到的特徵，如play_time是曝光之後使用者的觀看時間長度。這些欄位放在訓練特徵裡面會導致特徵穿越。其他如是否點擊、是否付費的欄位都要去掉。
訓練天數：表示我們用多少天的資料集進行訓練精排模型。
模型選擇：如果是單任務則結合EasyRec選擇單任務的模型，是多任務的選擇多任務的模型，此處我們是多任務，選擇DBMTL。
特徵選取方式，特徵選取的目標列：特徵選取方式如果有配置，將對所有的特徵進行篩選，選擇重要的特徵進行訓練，目標列則配合其選擇方式，選擇重要的特徵。由於這個方案增加了複雜性，建議第一個模型版本不使用。
是否增量訓練：false表示全量訓練，建議預設選擇false。true則表示增量訓練，我們後一天的訓練會在前一天訓練好的模型上繼續訓練。
是否非同步訓練：在分布式訓練中是否非同步訓練。
樣本權重：如果配置，則會對不同樣本根據運算式獲得權重，進而影響模型訓練精度，一般不用。
情境資料篩選：是否用某特定情境下的資料進行訓練。
使用特徵平台：是否會使用配置好的FeatureStore，如果在推薦方案的環境配置中有配置FeatureStore，則會啟用FeatureStore。
自動特徵工程：會根據現有的特徵，利用演算法挖掘更有用的特徵來進行訓練。建議第一個版本不用autofe，當需要調優效果的時候再使用自動特徵工程挖掘更多的特徵。