このトピックでは、Intelligent Speech Interaction (ISI) プロジェクトの作成、構成、編集、削除の方法について説明します。各プロジェクトには独自の Appkey があり、独立した音声認識と音声合成の構成が可能です。
前提条件
プロジェクトを作成する前に、ISI サービスを有効化する必要があります。詳細については、「ステップ 3: サービスの有効化」をご参照ください。
プロジェクトの作成
-
ISI コンソールにサインインします。
-
左側のナビゲーションペインで、[すべてのプロジェクト] をクリックします。
-
[すべてのプロジェクト] ページで、[プロジェクトの作成] をクリックします。
-
[プロジェクトの作成] ダイアログボックスで、[プロジェクト名] を入力し、[プロジェクトタイプ] を選択し、必要に応じて [プロジェクトシナリオの説明] を追加します。
利用可能なプロジェクトタイプ: [音声認識 + 音声合成][+ 音声分析]、[音声認識のみ]、[音声合成のみ]、および [オンデバイスソリューション]。
プロジェクトタイプはコンソール上の設定を簡素化するためのものであり、API 機能を制限するものではありません。例えば、「speech recognition only」 を選択した場合でも、API を通じて音声合成サービスを呼び出すことは可能です。
-
プロジェクトが作成されると、[すべてのマイプロジェクト] ページでプロジェクトとその appkey を確認できます。
プロジェクトの構成
クイックスタートの目的で、このセクションをスキップしてデフォルト設定を使用することもできます。必要に応じて、後からプロジェクトをカスタマイズしてください。
音声認識
これらの手順は、[プロジェクトタイプ] が [音声認識のみ] または [音声認識 + 音声合成 + 音声分析] に設定されている場合に適用されます。
-
対象のプロジェクトの右側にある[プロジェクト機能設定]をクリックします。
-
[音声認識 (ASR)] セクションで、ベースモデルまたは自己学習モデルを選択します。
-
[設定の変更] をクリックし、ユースケースに合わせてベースモデルを選択し、オンラインでテストしてから、[使用を確定] をクリックします。
-
ベースモデルがニーズを満たさない場合は、ホットワードを設定するか、カスタムモデルを作成します。詳細については、「言語モデルのカスタマイズ」および「ホットワード」をご参照ください。
プロジェクト機能設定ページの [Self-learning] セクションで、ドロップダウンリストから既存の [name hotwords]、[location hotwords]、[business-specific hotwords]、[language models] を選択します。その後、[Apply] をクリックして変更を適用します。
-
音声合成
これらの手順は、[プロジェクトタイプ] が [テキスト読み上げのみ] または [音声認識 + テキスト読み上げ + 音声分析] に設定されている場合に適用されます。
[音声合成 (TTS)] モジュールでは、音声合成モデルを選択し、話速、ピッチ、音量などの基本パラメーターを設定します。コンソールの設定は、発行されるとプロジェクトの appkey に関連付けられます。アプリケーションが API コールでこれらのパラメーターを指定しない場合、コンソールのデフォルト設定が適用されます。
-
対象のプロジェクトの右側にある[プロジェクト機能設定]をクリックします。
-
[音声合成 (TTS)] セクションで、[設定の変更] をクリックします。
-
音声を選択し、[基本パラメーター] セクションで話速、ピッチ、音量を設定します。
[text-to-speech only] 設定ページで、左側の音声カテゴリ (例: [General]) から音声 (例: [Zhiyuan]) を選択します。[Basic Parameters] で、[speech rate]、[pitch]、[volume]、[sample rate]、[format] を設定します。
-
右側の [Test] モジュールで、音声をプレビューします。
-
[使用を確定] をクリックします。設定はただちに有効になります。
プロジェクトの編集
対象のプロジェクトの右にある[編集]をクリックして、その名前またはシナリオの説明を更新します。
プロジェクトの削除
対象のプロジェクトの右にある[削除]をクリックして削除します。
削除されたプロジェクトは復元できません。