音声認識サービスを使用する場合、ビジネス分野に固有の単語のデフォルトの認識結果が期待どおりにならないことがあります。このような場合は、これらの単語をホットワードとして語彙に追加することで、認識結果を向上させることができます。
ホットワードの分類
名前ホットワード
名前ホットワードとして追加できるのは、人名と地名のみです。 1 つのホットワード語彙には、人名または地名のみを含めることができます。
ビジネス固有のホットワード
ビジネス固有のホットワードには、人物名や会社名、さまざまなビジネス分野で使用される固有名詞が含まれます。例としては、通常 Tracey として認識される人名 Tracy、司法分野の固有名詞「appellee」、e コマース分野の固有名詞「送料無料」などがあります。
ホットワードには句読点を含めることはできません。各ホットワードは最大 10 文字の漢字を含めることができます。
名前ホットワードのグループを 10 個、ビジネス固有のホットワードのグループを 10 個追加できます。各グループには最大 128 個のホットワードを含めることができます。
プロジェクトごとに、人名ホットワードのグループを 1 つ、地名ホットワードのグループを 1 つ、ビジネス固有のホットワードのグループを 1 つ関連付けることができます。
多数のホットワードを追加するには、カスタム言語モデルを作成します。カスタム言語モデルの詳細については、「カスタムモデル」をご参照ください。
ホットワードを作成するために使用される 2 つの方法の比較
Intelligent Speech Interaction コンソールを使用してホットワードを作成し、プロジェクトの appkey に関連付ける場合、コードでホットワード語彙を指定する必要はありません。Alibaba Cloud pctowap open platform(POP)API を使用する場合、ビジネス固有のホットワードの語彙のみを作成できます。クライアントから POP API を呼び出して作成したホットワード語彙は、SDK を呼び出してコードで語彙 ID を設定した後にのみ有効になります。
Intelligent Speech Interaction コンソールを使用してホットワードを作成する場合は、アップロードするホットワードファイルで各ホットワードが別々の行を占めるようにしてください。各ホットワードの重みを指定する必要はありません。ビジネス固有のホットワードの語彙を作成するために POP API を呼び出す場合は、各ホットワードの重みを指定する必要があります。
サンプルアプリケーション
次の映画名の認識結果を向上させるには、映画名をホットワードとしてプロジェクトに追加します。
The Shawshank Redemption
Farewell My Concubine
Léon: The Professional
Forrest Gump
Life Is Beautiful
Titanic
Spirited Away
Schindler's List
Inception
WALL-E
Hachi: A Dog's Tale
3 Idiots
The Legend of 1900
The Chorus
The Truman Show
The Godfather
My Neighbor Totoro
Interstellar