リアル istik ビデオのためのオーディオ駆動リップシンク - Alibaba Cloud Model Studio

VideoRetalk は、キャラクター動画と音声ファイルを使用して、キャラクターの口の動きを音声と同期させた新しい動画を生成する動画生成モデルです。

重要

このドキュメントは中国 (北京) に適用されます。モデルを使用するには、中国 (北京) リージョンの API キーを使用する必要があります。

モデルの概要

入力例

出力例

キャラクター動画:

音声オーディオ:

モデル

単価

タスク送信の RPS 制限

同時実行タスク数

videoretalk

従量課金、生成されたビデオの長さに基づき課金: $0.011469/秒

(常に 1 つのジョブのみが実行されています。キュー内の他のジョブは待機中です。)

モデルの 1 秒あたりのレコード数 (RPS) の上限引き上げをリクエストするには、modelstudio@service.aliyun.com にメールを送信してください。メールには、Alibaba Cloud アカウント ID、モデル、および必要な RPS を含める必要があります。

VideoRetalk は従量課金制で利用できます。このモデルは API 呼び出しによってのみ使用できます。Alibaba Cloud Model Studio コンソールではテストできません。
VideoRetalk モデルを呼び出し、キャラクターの鮮明な正面向きの動画と鮮明な音声ファイルを提供して、口パクを置き換えた動画を生成できます。詳細については、「VideoRetalk ビデオ生成」をご参照ください。