聲動人像VideoRetalk是一個人物視頻產生模型,可基於人物視頻和人聲音頻,產生人物講話口型與輸入音頻相匹配的新視頻。
重要
本文檔適用於“中國大陸(北京)”。如需使用模型,需使用“中國大陸(北京)”地區的API Key。
模型概覽
模型效果樣本
輸入樣本 | 輸出樣本 |
人物視頻: 人聲音頻: |
資費與限流
模型名稱 | 單價 | 任務下發介面RPS限制 | 同時處理中任務數量 |
videoretalk | 後付費,按產生視頻的時間長度計費:$0.011469/秒 | 1 | 1 (在同一時刻,只有1個作業實際處於運行狀態,其他隊列中的作業處於排隊狀態) |
如果您需要提高模型的RPS,請發送郵件至modelstudio@service.aliyun.com進行申請,並在郵件中告知阿里雲主帳號uid、期望申請的模型和RPS。
模型調用
聲動人像VideoRetalk模型支援後付費調用。目前僅支援通過API調用,不支援在阿里雲百鍊的控制台線上體驗。
調用“聲動人像VideoRetalk”模型,輸入畫面清晰且正面鏡頭的人物視頻,以及人聲清晰的音頻檔案,即可產生人物口型替換視頻。具體操作請參見VideoRetalk視頻產生。