召回管理是PAI-Rec内置的召回引擎,提供毫秒级高性能召回能力以及低成本的接入方式。 具体的功能包括:
融合多路召回,包括X2I召回、向量召回、随机召回。
每一路召回链路都可以单独定制,支持同时设置多个算子。
召回的同时,可以在召回节点进行数据过滤,减少链路的网络IO。返回的同时,可以定制物品表的属性字段。
提供数据表的毫秒级更新,比如曝光过滤,状态过滤,提高实时性。
链路说明

不管是召回表,物品表,过滤表,都可以由MaxCompute 表导入注册,也可以实时导入。
数据表的定义,召回服务的定义都在PAI-Rec Server 中。
部署在PAI-EAS 的PAI-Rec engine 引擎服务会通过SDK发起对Recall Engine Service 服务的调用,并获取召回结果。
Recall Engine 架构

集群分为Master和Data 节点。
对数据通过物品字段(分片字段)进行切分,不同的物品数据落在不同的分片上。
同一个分片内,至少有两个副本。 同属于分片内的节点,数据完全一致。
当进行召回请求时,Master会把请求分发到不同的分片上,不同的分片内会通过负载均衡落到具体的data节点上进行处理。 处理完成,Master会合并召回数据,进行处理后返回数据。
由于是通过物品字段进行分片的,不同维度的表只要物品字段相同,就会落到同一个节点上。 在同一个节点上就能join不同表的数据,在本地就能完成获取物品表属性,曝光过滤等需求。
