全部产品
Search
文档中心

Alibaba Cloud Model Studio:Citra ke video bernyanyi - EMO

更新时间:Oct 22, 2025

EMO menghasilkan video potret dinamis berkualitas tinggi dari citra potret dan file audio yang berisi suara manusia. Layanan ini mencakup dua model independen: EMO-detect untuk memvalidasi kesesuaian citra potret dan EMO untuk pembuatan video potret.

Penting

Dokumen ini hanya berlaku untuk Wilayah China (Beijing). Untuk menggunakan model-model tersebut, Anda harus menggunakan Kunci API dari wilayah China (Beijing).

Ikhtisar Model

Pengenalan Model

  • EMO-detect adalah model deteksi citra yang digunakan untuk memeriksa apakah citra input sesuai dengan spesifikasi model EMO.

  • EMO adalah model pembuatan video potret yang menghasilkan video potret dinamis dari citra potret dan file audio yang berisi suara manusia.

Unjuk Performa

Input: Gambar Potret dan File Audio Suara Manusia

Output: Video Potret Dinamis

Potret:

上春山

Audio: Lihat video di sebelah kanan

Video Potret:

Gaya aksi yang digunakan: Aktif ("style_level": "active")

Potret:

15_原图

Audio: Lihat video di sebelah kanan

Video Potret:

Gaya aksi yang digunakan: Normal ("style_level": "normal")

Potret:

娃哈哈

Audio: Lihat video di sebelah kanan

Video Potret:

Gaya aksi yang digunakan: Tenang ("style_level": "calm")

Catatan

Contoh-contoh di atas dihasilkan oleh Tongyi App, yang mengintegrasikan EMO.

Penagihan dan Pembatasan Kecepatan

Mode

Model

Harga Satuan

Batas QPS untuk API pengiriman tugas

Jumlah Tugas Serentak

Pemanggilan Model

emo-detect-v1

Pemanggilan Model, bayar sesuai penggunaan:

$0.000574/gambar

5

Tidak ada batas untuk API sinkron

emo-v1

Pemanggilan Model, bayar sesuai penggunaan:

  • Hasilkan video rasio aspek 1:1: $0.011469/detik

  • Hasilkan video rasio aspek 3:4: $0.022937/detik

1

(Pada waktu tertentu, hanya satu pekerjaan yang sedang berjalan. Pekerjaan lain dalam antrian menunggu.)

Prasyarat

Anda telah mengaktifkan layanan dan memperoleh Kunci API. Untuk informasi lebih lanjut, lihat Persiapan: Konfigurasi Kunci API.

Pemanggilan Model

  • Seri model EMO tersedia secara bayar sesuai penggunaan.

  • Untuk memanggil model, ikuti langkah-langkah berikut:

    1. Panggil model EMO-detect untuk memastikan bahwa gambar potret input sesuai dengan spesifikasi. Untuk informasi lebih lanjut, lihat Deteksi Gambar EMO.

    2. Panggil model EMO. Sediakan citra potret asli, parameter area citra relevan yang dikembalikan setelah citra lolos deteksi, dan file audio yang berisi suara manusia yang jelas untuk menghasilkan video potret dinamis. Untuk informasi lebih lanjut, lihat Pembuatan video EMO.