召回管理是PAI-Rec內建的召回引擎,提供毫秒級高效能召回能力以及低成本的接入方式。 具體的功能包括:
融合多路召回,包括X2I召回、向量召回、隨機召回。
每一路召回鏈路都可以單獨定製,支援同時設定多個運算元。
召回的同時,可以在召回節點進行資料過濾,減少鏈路的網路IO。返回的同時,可以定製物品表的屬性欄位。
提供資料表的毫秒級更新,比如曝光過濾,狀態過濾,提高即時性。
鏈路說明

不管是召回表,物品表,過濾表,都可以由MaxCompute 表匯入註冊,也可以即時匯入。
資料表的定義,召回服務的定義都在PAI-Rec Server 中。
部署在PAI-EAS 的PAI-Rec engine 引擎服務會通過SDK發起對Recall Engine Service 服務的調用,並擷取召回結果。
Recall Engine 架構

叢集分為Master和Data 節點。
對資料通過物品欄位(分區欄位)進行切分,不同的物品資料落在不同的分區上。
同一個分區內,至少有兩個副本。 同屬於分區內的節點,資料完全一致。
當進行召回請求時,Master會把請求分發到不同的分區上,不同的分區內會通過負載平衡落到具體的data節點上進行處理。 處理完成,Master會合并召回資料,進行處理後返回資料。
由於是通過物品欄位進行分區的,不同維度表只要物品欄位相同,就會落到同一個節點上。 在同一個節點上就能join不同表的資料,在本地就能完成擷取物品表屬性,曝光過濾等需求。
