全部产品
Search
文档中心

机器翻译:机器翻译自学习平台使用指南

更新时间:May 19, 2026

机器翻译自学习平台适用于无算法背景,但对非通用领域翻译质量要求较高,且至少有上万条高质量双语语料的用户。适用场景包括,医学专业术语以及专业的表达句式翻译难度较大的医疗领域、对翻译时效性和准确性要求较高,单单依靠人工翻译不能做到时效性和准确性兼顾的金融领域等。

说明

定制模型若想取得明显的效果提升,至少需要1万条高质量双语语料。训练语料越优质、数量级越大,定制模型的效果会越好。

使用流程概述

image

平台使用指南

1.新建项目

进入机器翻译控制台,选择我的项目栏,点击创建项目按钮新建项目,注意,一个项目可添加多个项目管理员,管理员拥有这个项目下所有权限,可以通过输入阿里云账号添加。

创建项目页面,填写项目名称联系方式项目描述,完成后单击确认

2.新建定制模型

项目创建完成后,点击新建定制模型按钮新建定制模型。

自定义定制模型页面,完成基础信息配置:填写模型名称,在选择语向中设置源语言目标语言,选择场景标签(最多5个,选择后不可修改)。

3.数据上传

上传用于模型训练的数据文件。

说明

单条训练语料不要超过100个字符。

上传数据集页面的基本信息配置区域,填写数据集名称,设置源语言目标语言,选择场景标签。在右侧上传数据集区域,单击上传文件上传 .tmx 或 .tsv 格式的训练数据文件。

4.模型训练

选择用于模型训练的数据文件,开始模型训练,模型训练时间约3到5小时。

添加训练数据步骤中,单击添加数据集选择已上传的数据集(数据集需包含至少10条数据)。勾选费用确认后,单击确认开始模型训练。

模型训练完成后,系统会给出模型BLEU参考值。BLEU参考值越高,代表翻译质量越好,具体对应关系详见下图。

image

5.词典干预

上传针对性的干预词典,提升模型翻译质量。

在项目详情页选择干预词典页签,单击右上角的上传词典按钮上传词典文件。上传完成后,可在词典列表中查看词典的源语言、目标语言、词条数和状态等信息。

6.模型测试及调用

模型训练完成后点击发布按钮,发布定制模型。

发布完成后,可对模型进行测试。

1.原文、2.通用模型翻译结果、3.定制模型翻译结果

根据定制版翻译引擎调用指南,完成您的模型调用,请确保在使用该接口前,已充分了解定制版翻译产品的收费方式和价格