悦动人像EMO可基于人物肖像图片和人声音频文件,生成高质量的人物肖像动态视频。其中,包含2个独立的模型“悦动人像EMO-detect”和“悦动人像EMO”,分别提供人物图片合规检测与人物视频生成能力。
重要
本文档仅适用于“中国内地(北京)”地域。如需使用模型,需使用“中国内地(北京)”地域的API Key。
模型概览
模型简介
悦动人像EMO-detect,是一个特定的图像检测模型,用于检测输入的图片是否满足emo模型所需的人物肖像图片规范。
悦动人像EMO,是一个人物视频生成模型,可基于人物肖像图片和人声音频文件生成人物肖像动态视频。
模型效果示例
输入物:人物肖像图片+人声音频文件 | 输出物:人物肖像动态视频 |
人物肖像:
人声音频:参见右侧视频 | 人物视频: 使用动作风格强度:活泼("style_level": "active") |
人物肖像:
人声音频:参见右侧视频 | 人物视频: 使用动作风格强度:适中("style_level": "normal") |
人物肖像:
人声音频:参见右侧视频 | 人物视频: 使用动作风格强度:平静("style_level": "calm") |
说明
以上示例,由集成了“悦动人像EMO”的千问APP生成。
资费与限流
模式 | 模型名称 | 单价 | 任务下发接口QPS限制 | 同时处理中任务数量 |
模型调用 | emo-detect-v1 | 模型调用,后付费: $0.000574/张 | 5 | 同步接口无限制 |
emo-v1 | 模型调用,后付费:
| 1 (在同一时刻,只有1个作业实际处于运行状态,其他队列中的作业处于排队状态) |
前提条件
已开通服务并获得API-KEY:获取API Key。


