全部產品
Search
文件中心

Alibaba Cloud Model Studio:視頻口型替換-聲動人像VideoRetalk

更新時間:Oct 15, 2025

聲動人像VideoRetalk是一個人物視頻產生模型,可基於人物視頻和人聲音頻,產生人物講話口型與輸入音頻相匹配的新視頻。

重要

本文檔適用於“中國大陸(北京)”。如需使用模型,需使用“中國大陸(北京)”地區的API Key

模型概覽

模型效果樣本

輸入樣本

輸出樣本

人物視頻:

人聲音頻:

資費與限流

模型名稱

單價

任務下發介面RPS限制

同時處理中任務數量

videoretalk

後付費,按產生視頻的時間長度計費:$0.011469/秒

1

1

(在同一時刻,只有1個作業實際處於運行狀態,其他隊列中的作業處於排隊狀態)

如果您需要提高模型的RPS,請發送郵件至modelstudio@service.aliyun.com進行申請,並在郵件中告知阿里雲主帳號uid、期望申請的模型和RPS。

模型調用

  • 聲動人像VideoRetalk模型支援後付費調用。目前僅支援通過API調用,不支援在阿里雲百鍊的控制台線上體驗。

  • 調用“聲動人像VideoRetalk”模型,輸入畫面清晰且正面鏡頭的人物視頻,以及人聲清晰的音頻檔案,即可產生人物口型替換視頻。具體操作請參見VideoRetalk視頻產生