Intelligent Speech Interaction は、音声認識の効果を高めるための認識カスタマイズツールを提供しています。音声認識サービスがお客様のビジネス分野に固有の単語を認識できない場合は、ホットワード機能を使用できます。Intelligent Speech Interaction によって提供される基本モデルがビジネス要件を満たしていない場合は、コンソールでカスタムモデルを作成して基本モデルを最適化できます。
コンソールでカスタムモデルをトレーニングおよび管理する方法の詳細については、「カスタムモデルの管理」をご参照ください。
トレーニングコーパス
セルフラーニングプラットフォームでは、ホットワードの設定とカスタムモデルの作成ができます。
ホットワード: 特定の単語の認識効果を高めるために、ホットワードを設定できます。 ホットワードは、人物名、場所名、またはビジネス固有の単語です。 詳細については、「ホットワード」をご参照ください。
カスタムモデル: 特定のシナリオで音声認識の効果を高めるために、基本モデルを最適化できます。 固有名詞や高頻度語を認識したい場合は、カスタムモデルを使用することで最適な結果を得ることができます。 詳細については、「カスタムモデル」をご参照ください。
ユースケース
紅学研究セミナーが開催されようとしています。 ゲストスピーカーの音声を録音するために、主催者は音声文字変換に Intelligent Speech Interaction を選択します。 開発者は Alibaba Cloud アカウントを登録し、Intelligent Speech Interaction をアクティブにします。 音声認識の効果を高めるために、開発者はセルフラーニングプラットフォームでカスタムモデルをトレーニングします。
基本モデルを選択します。開発者は、ユニバーサル モデルを使用することを選択します。
トレーニングコーパスを収集します。 このセミナーは、「紅楼夢」に関連するトピックに焦点を当てています。 開発者は句読点に基づいて元のテキストをトリミングし、各文をトレーニングコーパスの個別の行として保存します。
カスタムモデルをトレーニングします。 セルフラーニングプラットフォームで、開発者はトレーニングコーパスをアップロードし、トレーニングコーパスに基づいてカスタムモデルをトレーニングします。 このようにして、開発者はトレーニング済みのモデルを使用して「紅楼夢」の特定の単語 (賈宝玉など) を認識し、最適な認識結果を得ることができます。