本文介绍如何管理训练任务产出的模型,并进一步对模型进行评测和部署。
前提条件
已创建ACK Pro集群且Kubernetes版本不低于1.20。具体操作,请参见创建ACK Pro版集群。
已安装云原生AI套件的开发控制台和调度组件。具体操作,请参见安装云原生AI套件。
集群管理员在RAM控制台已创建RAM用户(子账号),并为该RAM用户分配和关联配额组。关于如何创建RAM用户,请参见创建RAM用户。关于如何为RAM用户分配和关联配额组,请参见步骤一:为用户配置配额组。
已经有训练完成的任务。具体操作,请参见提交Tensorflow训练任务和定时任务。
操作步骤
登录开发控制台。具体操作,请参见步骤二:登录开发控制台。
在AI开发控制台的左侧导航栏中,单击模型管理。
单击模型管理页面的创建模型。
在创建对话框中,配置需要创建的模型名称、模型版本以及该模型对应关联的训练的Job。
本示例的模型名称为test-model,模型版本为1,训练的Job选择为tf-dist-git。
单击确定。
在模型列表中可以看到刚创建的模型基本信息。