全部产品
Search
文档中心

大模型服务平台百炼:图生唱演视频-悦动人像EMO

更新时间:Feb 06, 2026

悦动人像EMO可基于人物肖像图片和人声音频文件,生成高质量的人物肖像动态视频。其中,包含2个独立的模型“悦动人像EMO-detect”和“悦动人像EMO”,分别提供人物图片合规检测与人物视频生成能力。

重要

本文档仅适用于“中国内地(北京)”地域。如需使用模型,需使用“中国内地(北京)”地域的API Key

模型概览

模型简介

  • 悦动人像EMO-detect,是一个特定的图像检测模型,用于检测输入的图片是否满足emo模型所需的人物肖像图片规范。

  • 悦动人像EMO,是一个人物视频生成模型,可基于人物肖像图片和人声音频文件生成人物肖像动态视频。

模型效果示例

输入物:人物肖像图片+人声音频文件

输出物:人物肖像动态视频

人物肖像:

上春山

人声音频:参见右侧视频

人物视频:

使用动作风格强度:活泼("style_level": "active")

人物肖像:

15_原图

人声音频:参见右侧视频

人物视频:

使用动作风格强度:适中("style_level": "normal")

人物肖像:

娃哈哈

人声音频:参见右侧视频

人物视频:

使用动作风格强度:平静("style_level": "calm")

说明

以上示例,由集成了“悦动人像EMO”的千问APP生成。

资费与限流

模式

模型名称

单价

任务下发接口QPS限制

同时处理中任务数量

模型调用

emo-detect-v1

模型调用,后付费:

$0.000574/张

5

同步接口无限制

emo-v1

模型调用,后付费:

  • 生成1:1画幅视频:$0.011469/秒

  • 生成3:4画幅视频:$0.022937/秒

1

(在同一时刻,只有1个作业实际处于运行状态,其他队列中的作业处于排队状态)

前提条件

已开通服务并获得API-KEY:获取API Key

模型调用

  • 悦动人像EMO系列模型支持后付费调用。

  • 模型调用时,参照以下顺序:

    1. 调用“悦动人像EMO-detect”模型确认输入的人物图像符合规范(可参考文档:EMO 图像检测);

    2. 调用“悦动人像EMO”模型,输入人物图像原图、经检测通过后获得的相关图像区域参数、以及包含清晰人声的音频文件,生成人物肖像动态视频(可参考文档:EMO 视频生成)。