忠実度の高い音声クローンには、高品質な入力音声が不可欠です。
デバイス
スマートフォン、デジタルボイスレコーダー、またはプロフェッショナルオーディオレコーダーを使用してください。
環境
場所
10 平方メートル以下の、閉鎖された狭い空間で録音してください。
吸音フォーム、カーペット、カーテンなどの吸音材がある部屋を選択してください。
講堂、会議室、教室などの広く開放的な場所は、強い残響を引き起こすため避けてください。
ノイズコントロール
屋外の騒音:窓やドアを閉め、交通騒音や工事騒音を避けてください。
屋内の騒音:エアコン、扇風機、蛍光灯の安定器の電源を切ってください。スマートフォンで環境音を録音し、大音量で再生して隠れた騒音源を特定します。
残響コントロール
残響は、発話を不鮮明にし、明瞭度を低下させます。
カーテンを引く、クローゼットのドアを開ける、または机や棚を衣類やシーツで覆うことで、滑らかな表面からの反射を低減してください。
本棚や布張りの家具など、不規則な形状のオブジェクトを使用して音波を拡散させてください。
スクリプト
コンテンツに厳密な制限はありません。ターゲットとするアプリケーションシナリオに合わせてスクリプトを調整してください。
「こんにちは」や「はい」などの短いフレーズは避け、完全な文章を使用してください。
意味的な連続性を保ってください。読み上げる際は、途中で間を置く回数を減らし、少なくとも 3 秒間は途切れない発話を目指してください。
温かみ、親しみやすさ、真面目さなど、適切な感情表現を加えて、ロボットのような話し方を避けてください。
政治、ポルノ、暴力に関連するような禁止用語は、クローン作成が失敗するため含めないでください。
ベストプラクティス
たとえば、標準的な寝室では:
窓やドアを閉めて、外部の騒音を遮断します。
エアコン、扇風機、その他の電化製品の電源を切ります。
カーテンを引いて、ガラスの反射を低減します。
机を衣類や毛布で覆い、表面の反射を低減します。
スクリプトをよく読み込み、話者のトーンを定めてから、自然に読み上げます。
破裂音による歪みや信号の減衰を避けるため、録音デバイスを口から約 10 cm 離して設置します。