人工智能平台 PAI - 发布模型评测中心v1.0
Aug 15 2025
人工智能平台 PAI开箱即用,无需代码开发即可完成端到端的模型评测链路,快速评估模型能力是否适合客户自身业务场景
适用客户
对部署、微调模型时对模型效果评估有需求的客户群体
新增功能/规格
提供PAI平台通用的模型评测功能,自动评估模型的综合能力。 1. 支持多种评测对象:PAI-Model Gallery公共模型、自定义模型、PAI-EAS服务、自定义服务 2. 评测可基于内置的权威公开数据集(CMMLU/C-Eval/MMLU等)或用户自定义数据集 3. 评测指标包括通用NLP评估指标、裁判员模型评估指标 4. 支持多模型效果对比 5. 自动输出评测报告