快速開始
安裝命令
我們可以使用 pairecmd 快速建立專案。現在 V2 版本支援 PAI-Rec控制台(推薦使用)。
V2 版本
下載地址:
下載之後,在類 *nix 系統,需要設定下可執行檔。命令:chmod +x pairecmd
建立專案
以建立專案名稱 pairec-demo 舉例,執行命令後,會在目前的目錄產生 pairec-demo 目錄,該目錄包含專案代碼。
./pairecmdmac project --name pairec-demo產生的目錄結構如下:
pairec-demo
├── Makefile
├── conf
│ └── config.json.production
├── docker
│ └── Dockerfile
├── go.mod
└── src
├── controller
│ └── feed.go
└── main.go進入 pairec-demo 目錄,執行
go mod tidy編譯打包專案
專案裡提供了 Makefile 檔案, 如果要編譯的話,直接運行
make && make build如果遇到錯誤的話,可以先執行
go mod tidy如果要打包成鏡像的話,執行
make release可以結合實際情況來修改 Makefile 檔案。

註:可以通過 阿里雲鏡像 開通個人鏡像,然後建立BIN_NAME 指定的鏡像倉庫。
運行專案
可以進入到 pairec-demo 目錄, 運行一下命令啟動服務,日誌會輸出到終端上。
通過config參數傳入設定檔路徑。
go run src/main.go --config=conf/config.json.production --alsologtostderr可以用下面的介面進行測試(開啟另一個終端,運行):
curl -v http://localhost:8000/api/rec/feed -d '{"uid":"76295990", "size":10, "scene_id":"home_feed"}'config 具體的配置可以參考引擎配置單。
介面測試
在產生的專案中,本身已經實現了一個推薦介面,具體實現可以參考 controller/feed.go 。 介面定義如下:
介面名稱
/api/rec/feed
請求參數
參數名稱 | 參數說明 | 類型 | 是否必須 | 用例 |
uid | 使用者id | string | 是 | "1000079" |
size | 擷取item數量 | integer | 是 | 10 |
scene_id | 情境id | String | 是 | home_feed |
features | 上下文特徵 | json map | 否 | {"age":20, "sex":"male"} |
complex_type_features | 複雜類型的上下文特徵,如果需要有類型的資訊請求模型服務,需要設定此值。 | json array | 否 | [{"name":"age", "type":"int", "values":20}, {"name":"sex", "values":"male", "type":"string"}] |
item_id | 相似性推薦傳入的物品ID | string | 否 | 248791390 |
item_list | 自訂的召回傳入列表 | json array | 否 | [{"item_id":"1111", "score":1},{"item_id":"222", "score":0.95}] |
debug | debug 用,列印更多的日誌 | bool | 否 | true |
request_id | 請求唯一標識ID,此參數為空白時,PAI-Rec 引擎會自動產生,如果使用者傳入,使用參數值當成請求的ID | string | 否 | "c46c3f5e-6b32-4b5c-8aac-59a319941248" |
當有一批召回的資料,希望通過介面傳遞進來,可以賦值給 item_list。 item_list 是一個數組,每個 item 是 map object ,item 中必須有 item_id 欄位,表示物品的ID。其餘都是可選的。 item 中如果包含 score 欄位,會當成召回得分處理。其餘欄位當成 item 屬性進行處理。
complex_type_features
複雜類型的上下文特徵需要數組傳遞過來,每個元素包含的內容如下:
名稱 | 說明 | 用例 |
name | 上下文特徵名稱 | age |
type | 上下文特徵類型 | int |
values | 上下文特徵值,這裡可以設定多種類型,支援具體值,數組, map 等 | 20 |
使用樣本:
傳遞單個值,
[{"name":"age", "type":"int", "values":20}, {"name":"sex", "values":"male", "type":"string"}]傳遞數組
[{"name":"list_features", "type":"list<int>", "values":[1,2,3]}]傳遞map
[{"name":"map_features", "type":"map<int,int>", "values":{"1":10,"2":20,"3":30}}], 或者[{"name":"map_features", "type":"map<int,int>", "values":{"1":"10","2":"20","3":"30"}}],
type 支援的類型包括 int, int64, float, double, string, list<int> , list<int64> , list<float>, list<double>, list<string>, map<int,int>, map<int,int64>, map<int,float>, map<int,double>, map<int,string>, map<string,int>, map<string,int64>, map<string,float>, map<string,double>, map<string,string>, map<int64,int>, map<int64,int64>,map<int64,float>, map<int64,double>, map<int64,string>
傳遞上下文中, complex_type_features 和 features 可以同時使用。
介面返回
名稱 | 說明 | 類型 | 樣本 |
code | 介面返回業務碼 | int | 200 |
msg | 商務資訊 | string | success |
request_id | 請求的唯一標識 | string | e332fe9c-7d99-45a8-a047-bc7ec33d07f6 |
size | 返回的推薦條目數量 | int | 10 |
experiment_id | 實驗ID 標識, 沒有對接 AB 實驗,返回為空白 | string | ER2_L1#EG1#E2 |
items | 返回推薦條目的列表 | json array | [{"item_id":"248791390","score":0.9991594902203332,"retrieve_id":"mock_recall"}] |
items 條目具體說明如下:
名稱 | 說明 | 類型 | 樣本 |
item_id | 推薦物品ID | string | 3v5RE7417j7R |
retrieve_id | 召回源ID標識 | string | u2i_recall |
score | 推薦得分 | float | 0.45 |
extra | 使用者自訂欄位輸出,不指定的話,不會輸出 | json map | 參考下文自訂輸出欄位的說明 |
錯誤碼說明
錯誤碼 | 說明 | msg |
200 | 介面正常 | success |
299 | 返回的數量不足 | items size not enough |
400 | 參數錯誤,不同的情況, msg 說明不同 | uid not empty 或者nexpected end of JSON input 等 |
500 | 伺服器錯誤, 以 HTTP 錯誤碼形式返回 |
請求範例
curl -v http://host/api/rec/feed -d '{"uid":"76295990", "size":10, "scene_id":"home_feed"}'返回資料
{
"code":200,
"msg":"success",
"request_id":"e332fe9c-7d99-45a8-a047-bc7ec33d07f6",
"size":10,
"experiment_id":"",
"items":[
{
"item_id":"248791390",
"score":0.9991594902203332,
"retrieve_id":"mock_recall"
},
...
]
}輸出自訂欄位
在上文item條目的說明中,預設會輸出item_id,retrieve_id,score欄位。但很多情況下,使用者想自訂輸出更多的欄位,比如item的屬性欄位或者模型的得分等等。可以在SceneConfs的某個情境下自訂輸出欄位名稱,配置定義在OutputFields裡,介面會放到extra欄位中。
配置參考樣本如下:
"SceneConfs": {
"${scene_name}": {
"default": {
"RecallNames": [
"collaborative_filter"
],
"OutputFields": [
"item:type",
"item:age",
"score:*",
"score:model_v1_ctr"
]
}
}
}以item開頭的會輸出item相應的屬性欄位,如果不存在的話,會輸出 null
以score開頭的會輸出模型返回的得分
score:*會輸出所有的模型得分,放在algo_scores裡
常見問題
問題1:如何通過推薦介面傳入一個物品列表再排序?
回答:把指定物品列表通過介面的參數item_list傳入;然後在引擎配置單中設定一個上下文召回(ContextItemRecall),讓PAI-Rec引擎從介面參數item_list中讀取物品列表。
問題2:用戶端如何埋點可以記錄PAI-Rec的埋點資訊並使用實驗報表?
回答:推薦介面中返回兩個欄位:request_id和experiment_id,使用者需要把這兩個欄位在用戶端埋點,然後至少在曝光、點擊行為日誌中包含這兩個欄位。其他如播放時間長度、加入購物車、購買等行為日誌中埋點更好,如果其他行為中沒有埋點,則效果統計會受到一些影響。參考資料註冊與欄位配置中的SQL案例,產生離線“實驗報表來源表”,然後註冊到AB實驗平台,配置自訂指標,計算報表資料之後,可以在實驗指標報表中查看實驗報表。