人工智能平台 PAI - QuickStart支持模型评测,评估LLM的综合性能
Jun 20 2024
人工智能平台 PAI零代码完成端到端的模型评测链路,方便用户找到适合自身业务场景的大模型。
适用客户
1. 需要低门槛筛选符合自身业务场景的LLM模型的客户 2. 需要对在QuickStart中完成微调的模型进行能力评估的客户
新增功能/规格
PAI-QuickStart提供LLM评测功能,可基于权威公开数据集(CMMLU/C-Eval/MMLU等),或自定义数据集,进行模型综合能力的评估,判断模型能力是否适合自身业务场景,并提供多模型性能对比能力。