在排序配置中我們選擇添加一個“精排”:


精排模型名稱:字母加底線,推薦用:${情境名稱}_${模型名稱}_rank
精排目標設定:精排目標可以設定多個目標,包含分類和迴歸目標,詳情如下:
分類目標
精排目標名稱自訂;精排目標運算式,一般我們是二分類目標,根據彙總條件做對應的彙總;目標類型分類就是classification,如下圖:

迴歸目標
精排目標名稱可自訂;
精排目標運算式:對於迴歸目標,我們需要對行為表目標數值做sum彙總加和,然後取log變換;
目標類型:選擇迴歸目標regression;
精排目標依賴:如果某目標(x)需要依賴另外一個目標(y),可以在目標依賴處填寫。例如:在視頻中我們只有點擊之後才會播放,播放的觀看時間長度是play_time,那麼play_time目標可以依賴點擊目標(注意這裡選擇的是上面註冊的分類任務名稱is_click)。同理,其他分類任務也適用。如下圖:

過濾欄位:可以選擇我們不需要參與訓練的特徵,或者不能在曝光之前擷取到的特徵,如play_time是曝光之後使用者的觀看時間長度。這些欄位放在訓練特徵裡面會導致特徵穿越。其他如是否點擊、是否付費的欄位都要去掉。
訓練天數:表示我們用多少天的資料集進行訓練精排模型。
模型選擇:如果是單任務則結合EasyRec選擇單任務的模型,是多任務的選擇多任務的模型,此處我們是多任務,選擇DBMTL。
特徵選取方式,特徵選取的目標列:特徵選取方式如果有配置,將對所有的特徵進行篩選,選擇重要的特徵進行訓練,目標列則配合其選擇方式,選擇重要的特徵。由於這個方案增加了複雜性,建議第一個模型版本不使用。
是否增量訓練:false表示全量訓練,建議預設選擇false。true則表示增量訓練,我們後一天的訓練會在前一天訓練好的模型上繼續訓練。
是否非同步訓練:在分布式訓練中是否非同步訓練。
樣本權重:如果配置,則會對不同樣本根據運算式獲得權重,進而影響模型訓練精度,一般不用。
情境資料篩選:是否用某特定情境下的資料進行訓練。
使用特徵平台:是否會使用配置好的FeatureStore,如果在推薦方案的環境配置中有配置FeatureStore,則會啟用FeatureStore。
自動特徵工程:會根據現有的特徵,利用演算法挖掘更有用的特徵來進行訓練。建議第一個版本不用autofe,當需要調優效果的時候再使用自動特徵工程挖掘更多的特徵。