組み込みの音声認識 (Speech-to-Text, STT) システムは、ホットワード設定をサポートしています。このトピックでは、ホットワード機能とその設定方法について説明します。
機能概要
音声認識のホットワード機能を使用すると、特定の単語グループをホットワードとして設定できます。音声認識システムが実行されると、これらのホットワードが優先され、認識プロセスにおける重みが増加します。ビジネスドメイン内の特定の単語の認識精度が低い場合、ホットワード機能を使用して結果を改善できます。
制限事項
対応言語:この機能は中国語と英語の単語のみをサポートします。
ファイルフォーマット:ホットワードファイルは、
UTF-8エンコーディングの TXT ファイルである必要があります。コンテンツ要件:
1 つのファイルに最大 500 個のホットワードを含めることができます。
各ホットワードの長さは最大 10 文字です。
各単語は改行する必要があります。単語に句読点や特殊文字を含めることはできません。
ファイルサイズ:ホットワードファイルのサイズは 100 KB を超えることはできません。
設定
ホットワードは、コンソール、OpenAPI、またはクライアントソフトウェア開発キット (SDK) を使用して設定できます。各設定方法の範囲と優先度は次のとおりです:
コンソールでの設定:ワークフロー内のすべての呼び出しインスタンスに対してグローバルに有効になります。
OpenAPI/クライアント SDK での設定:インスタンスレベルで有効になり、現在の呼び出しインスタンスにのみ適用されます。
OpenAPI またはクライアント SDK を使用して設定されたホットワードは、コンソールで設定されたホットワードを上書きします。
コンソールでの設定
ホットワードファイルの準備:優先したいキーワードを TXT ファイルに追加します。次のコードは例です:
The Shawshank Redemption Farewell My Concubine Léon: The Professional Forrest Gump Life Is Beautiful Titanic Spirited Away Schindler's List Inception WALL-ESTT ノードの設定:準備したホットワードファイルをリアルタイムワークフローの STT ノードにアップロードします。

ホットワードの適用:ホットワードファイルをアップロードした後、ワークフローを保存して変更を適用します。
OpenAPI での設定
OpenAPI 操作を呼び出すことで、インスタンスレベルの音声認識ホットワードを設定することもできます。これを行うには、GenerateAIAgentCall 操作を呼び出し、AIAgentConfig.AsrConfig.AsrHotWords パラメーターでホットワードを渡します。詳細については、「AIAgentConfig」をご参照ください。
OpenAPI を使用して設定されたホットワードは、コンソールで設定されたホットワードを上書きします。
クライアント起動時の設定
AICallKit SDK は、インスタンスレベルのホットワード設定をサポートしています。
Android
// 呼び出し設定オブジェクトを作成します。
ARTCAICallEngine.ARTCAICallConfig artcaiCallConfig = new ARTCAICallEngine.ARTCAICallConfig();
// ホットワードリストを設定します。
artcaiCallConfig.agentConfig.asrConfig.asrHotWords = new ArrayList<String>() {{ add("xxx"); add("yyy");}};
// 呼び出し開始プロセスは省略します。
... iOS
// エージェント設定オブジェクトを作成します。
let agentConfig = ARTCAICallAgentConfig()
// ホットワードリストを設定します。
agentConfig.asrConfig.asrHotWords = ["xxx", "yyy"]
// 呼び出し設定にエージェント設定をセットします。
callConfig.agentConfig = agentConfig
// 呼び出し開始プロセスは省略します。
...
Web
// エージェント設定オブジェクトを作成します。
const agentConfig = new AICallAgentConfig();
// ホットワードリストを設定します。
agentConfig.asrConfig.asrHotWords = ["xxx", "yyy"];
// 呼び出し設定にエージェント設定をセットします。
callConfig.agentConfig = agentConfig
// 呼び出し開始プロセスは省略します。
...