すべてのプロダクト
Search
ドキュメントセンター

Intelligent Speech Interaction:言語モデルのカスタマイズ

最終更新日:Jun 04, 2026

Alibaba Cloud Intelligent Speech Interaction (ISI) は、汎用、教育、司法、医療などのシナリオ向けに事前学習済みの音声認識モデルを提供しています。これらの事前学習済みモデルを超える音声認識ニーズがある場合や、既存の標準モデルをカスタマイズしたい場合は、言語モデルのカスタマイズ機能を使用して、ご自身のビジネステキストデータに基づいてモデルをトレーニングできます。

言語モデルのカスタマイズが必要なケース

事前学習済みモデルは日常的な会話を十分に処理できますが、ドメイン固有の用語を誤認識することがよくあります。たとえば、医療相談の文字起こしを行うアプリケーションでは、汎用モデルを使用すると薬剤名、プロシージャ、臨床用語などが頻繁に混同される可能性があります。ご自身のドメインテキストに基づいてカスタム言語モデルをトレーニングすることで、その分野特有の語彙や文脈をモデルに学習させ、専門用語や高頻度ワードの認識精度を向上させることができます。

以下のいずれかに該当する場合は、言語モデルのカスタマイズをご利用ください。

  • アプリケーションがドメイン固有の音声(医療または業界特化)を扱う場合

  • 事前学習済みのシナリオモデルが、ご利用のプロダクト名、ブランド用語、または専門用語を認識できない場合

  • ビジネス上重要な高頻度ワードの認識精度を向上させる必要がある場合

仕組み

ビジネス関連のテキストデータをセルフラーニングプラットフォームにアップロードします。ご利用のシナリオに合ったベースモデルを選択し、トレーニングを開始します。プラットフォームはアップロードされたデータから語彙と文脈を学習します。トレーニング完了後、モデルを公開することで、音声認識リクエストに適用されます。

セルフラーニングモデルを作成・適用する方法は次の 2 つです。

  • コンソール:コンソールでセルフラーニングモデルのトレーニングおよび管理を行います。[プロジェクト機能設定] セクションで [シナリオ切り替え] をクリックし、セルフラーニングモデルを選択します。モデルを公開すると、自動的に AppKey にアタッチされ、コードの変更は不要です。

  • POP APIPOP API を使用したセルフラーニングモデルの作成を行います。SDK のインターフェイスを呼び出して、クライアントコード内にモデル ID を設定してください。モデルは ID が設定された後にのみ有効になります。

モデルのトレーニング:エンドツーエンドの例

この例では、簡潔な Alibaba 企業紹介を使用して言語モデルをトレーニングする方法を示します。サンプルのトレーニングデータをダウンロードする

トレーニングデータの準備

トレーニングデータとは、モデルにドメイン固有の語彙と文脈を学習させるためのテキストです。トレーニングデータの品質とフォーマットは、認識精度に直接影響します。

フォーマット要件:

  • プレーンテキストで、1 行につき 1 文

  • 文の区切りには句読点を使用

データ量のガイドライン:

  • ビジネス上重要な単語やフレーズが含まれる文は、認識を強化するために複数回含める

サンプルトレーニングデータは次のようになっています。

In September 1999, the 18 founders led by Jack Ma officially established Alibaba Group in an apartment in Hangzhou. The group's first website was Alibaba, an English-language global wholesale marketplace.
In October 1999, Alibaba Group raised five million USD from several investment institutions.
In October 1999, Alibaba Group raised five million USD from several investment institutions.
In January 2000, Alibaba Group raised twenty million USD from several investment institutions, including SoftBank.
In January 2000, Alibaba Group raised twenty million USD from several investment institutions, including SoftBank.
In September 2000, Alibaba Group held the first West Lake Summit on Swordmanship, gathering business and opinion leaders from the Internet industry to discuss important topics.

重要な文は複数回出現しています。「ファイナンス」や「インターネット」など、ビジネス上重要なワードを含む文を繰り返すことで、それらの用語に対するモデルの認識が強化されます。

モデルのトレーニング

  1. ご利用のシナリオに合ったベースモデルを選択します。この例では汎用モデルを使用します。

  2. トレーニングデータをプレーンテキスト形式で準備し、1 行につき 1 文、文の間に句読点を挿入します。

  3. セルフラーニングプラットフォームにテキストデータを送信し、トレーニングを開始します。トレーニング完了後、モデルはトレーニングデータに含まれる語彙を認識し、ドメインに特化した認識結果を提供します。