全部产品
Search
文档中心

智能语音交互:语音识别自学习工具

更新时间:Nov 03, 2020

优化识别效果的利器

阿里云提供的语音识别服务,提供了通用的模型,或者模型领域的通用模型如8k客服质检模型、电商等。如果您在自己的领域积累了丰富的历史数据,那么就可以使用这些历史数据来对自己的模型做定制的优化。

通过使用阿里云语音自学习工具,您可以通过可操作的界面上传训练语料文本,通过对您训练语料做模型训练,可以有效提高您的场景的语音识别识别率,尤其是专有名词和文本中的高频词汇,有较好的优化效果。

具体在管理控制台训练定制模型的操作说明,请查看 管理自学习模型文档。

训练语料说明

自学习平台训练模型的语料格式为小于20M的 UTF-8格式TXT文本 文件。训练语料应基于您历史生产出的标注文本,或者应用场景的专业术语的文本集合构成。

  • 识别语料应该一句一行
  • 针对要识别的重点内容,如专有名词、人名地名等,需要在语料中反复出现,才可以提高识别的权重。

应用举例

某地即将召开一场红学研究会,为了记录会场嘉宾的讲话,主办方选择接入阿里云智能语音服务来进行会议转写。首先开发人员注册并开通阿里云智能语音服务,为了提高会议发言的识别率,考虑采用自学习平台进行模型训练优化:

  • 选择基础模型:采用通用模型。
  • 训练语料采集:由于会议核心是讨论红楼梦相关的议题,开发人员将红楼梦小说的原文进行处理,根据标点做裁剪,将原文每句话保存为训练文本中的一行。
  • 操作训练模型:通过自学习平台提交语料和训练之后,采用训练出的模型,可以有效识别出『贾宝玉』等红楼梦中的词汇,获得理想的识别效果。