高品質な録音データは、モデル学習にとって非常に重要です。このドキュメントでは、録音環境、デバイス、およびプロセスを考慮して高品質な録音を生成する方法について説明します。
このドキュメントは [中国 (北京)] リージョンにのみ適用されます。モデルを使用するには、中国 (北京) リージョンの [API キー] を使用する必要があります。
録音デバイス
携帯電話、デジタルボイスレコーダー、プロ用レコーダーなどのデバイスを使用できます。
録音環境
環境の選択
録音環境を選択する際の主な考慮事項は、ノイズと残響を低減することです。より良い結果を得るには、特に吸音装置を備えた 10 平方メートル未満の小さな部屋で録音することをお勧めします。また、低コストの吸音綿で部屋を改造することもできます。これにより、音波の平面反射が拡散反射に変わり、残響が軽減され、録音品質が向上します。
ノイズコントロール
屋外ノイズ:ノイズを軽減するためにドアと窓を閉めます。
屋内ノイズ:屋内ノイズの一般的な発生源には、エアコン、ファン(コンピューターファンを含む)、蛍光灯の安定器、人の声が含まれます。これらのノイズ源を特定して排除するには、携帯電話で周囲の音を録音し、大音量で録音を聞いてください。
残響制御
残響とは、音が空間内で反射、屈折、拡散し、徐々に減衰する際に生じる聴覚効果です。音波が壁やガラスなどの滑らかな表面で反射すると、音が濁る可能性があります。
録音する際は、何もない部屋を選ばないことをお勧めします。代わりに、吸音設備のある場所、または不規則なレイアウトの環境を使用して、残響を低減してください。オフィスエリアや会議室は一般に残響が大きく、録音環境としてはお勧めできません。
手順
典型的な寝室は、一般的で理想的な録音環境です。録音する際は、次の点を考慮してください。
携帯電話から約 10 cm の距離を維持して、近すぎたり遠すぎたりすることによって発生する可能性のある破裂音や電流の問題を回避します。
ドアと窓を閉めて、屋外のノイズを減らします。
エアコンまたはファンをオフにして、屋内ノイズの干渉を減らします。
カーテンを引いて、ガラスからの音の反射を減らします。
キャビネットのドアを開き、衣服やベッドシーツなどのアイテムを使用してキャビネットや机の表面を覆います。これにより、滑らかな表面からの音の反射が軽減され、録音品質が向上します。
録音スクリプト
スクリプトでは、単語数が少ない短い文は避けてください。読むときは、流暢さを維持し、5 秒以上連続して頻繁に、または不必要に一時停止することは避けてください。長い一時停止はレプリケーションに悪影響を与え、失敗する可能性があります。
録音前にスクリプトをよく理解して、ペルソナとパフォーマンススタイルを決定することをお勧めします。感情を込めて読み、機械的な配信を避けることで、レプリケーションが期待どおりに実行されるようにします。
スクリプトの内容に特別な制限はありません。合成する予定の内容と同様の内容を使用できます。
シナリオに中国語と英語が混在している場合は、中国語の部分のみを録音する必要があります。レプリケーション後、モデルは中国語と英語の両方で自動的に読み取ることができます。
禁止用語を含むスクリプトを読まないでください。レプリケーションが失敗します。