聲動人像VideoRetalk視頻口型替換模型-大模型服務平台百鍊-阿里雲

聲動人像VideoRetalk是一個人物視頻產生模型，可基於人物視頻和人聲音頻，產生人物講話口型與輸入音頻相匹配的新視頻。

重要

本文檔適用於“中國大陸（北京）”。如需使用模型，需使用“中國大陸（北京）”地區的API Key。

模型概覽

輸入樣本

輸出樣本

人物視頻：

人聲音頻：

模型名稱

單價

任務下發介面RPS限制

同時處理中任務數量

videoretalk

後付費，按產生視頻的時間長度計費：$0.011469/秒

（在同一時刻，只有1個作業實際處於運行狀態，其他隊列中的作業處於排隊狀態）

如果您需要提高模型的RPS，請發送郵件至modelstudio@service.aliyun.com進行申請，並在郵件中告知阿里雲主帳號uid、期望申請的模型和RPS。

聲動人像VideoRetalk模型支援後付費調用。目前僅支援通過API調用，不支援在阿里雲百鍊的控制台線上體驗。
調用“聲動人像VideoRetalk”模型，輸入畫面清晰且正面鏡頭的人物視頻，以及人聲清晰的音頻檔案，即可產生人物口型替換視頻。具體操作請參見VideoRetalk視頻產生。