悦动人像EMO（图生唱演视频） - 大模型服务平台百炼

悦动人像EMO可基于人物肖像图片和人声音频文件，生成高质量的人物肖像动态视频。其中，包含2个独立的模型“悦动人像EMO-detect”和“悦动人像EMO”，分别提供人物图片合规检测与人物视频生成能力。

重要

本文档仅适用于“中国内地（北京）”地域。如需使用模型，需使用“中国内地（北京）”地域的API Key。

输入物：人物肖像图片+人声音频文件

输出物：人物肖像动态视频

人物肖像：

上春山

人声音频：参见右侧视频

人物视频：

使用动作风格强度：活泼（"style_level": "active"）

人物肖像：

15_原图

人声音频：参见右侧视频

人物视频：

使用动作风格强度：适中（"style_level": "normal"）

人物肖像：

娃哈哈

人声音频：参见右侧视频

人物视频：

使用动作风格强度：平静（"style_level": "calm"）

说明

以上示例，由集成了“悦动人像EMO”的千问APP生成。

模式

模型名称

单价

任务下发接口QPS限制

同时处理中任务数量

模型调用

emo-detect-v1

模型调用，后付费：

$0.000574/张

同步接口无限制

emo-v1

模型调用，后付费：

（在同一时刻，只有1个作业实际处于运行状态，其他队列中的作业处于排队状态）

已开通服务并获得API-KEY：获取API Key。

悦动人像EMO系列模型支持后付费调用。
模型调用时，参照以下顺序：
1. 调用“悦动人像EMO-detect”模型确认输入的人物图像符合规范（可参考文档：EMO 图像检测）；
2. 调用“悦动人像EMO”模型，输入人物图像原图、经检测通过后获得的相关图像区域参数、以及包含清晰人声的音频文件，生成人物肖像动态视频（可参考文档：EMO 视频生成）。