Buat video potret dinamis dengan EMO API - Model Studio

EMO menghasilkan video potret dinamis berkualitas tinggi dari citra potret dan file audio yang berisi suara manusia. Layanan ini mencakup dua model independen: EMO-detect untuk memvalidasi kesesuaian citra potret dan EMO untuk pembuatan video potret.

Penting

Dokumen ini hanya berlaku untuk Wilayah China (Beijing). Untuk menggunakan model-model tersebut, Anda harus menggunakan Kunci API dari wilayah China (Beijing).

Ikhtisar Model

Pengenalan Model

EMO-detect adalah model deteksi citra yang digunakan untuk memeriksa apakah citra input sesuai dengan spesifikasi model EMO.
EMO adalah model pembuatan video potret yang menghasilkan video potret dinamis dari citra potret dan file audio yang berisi suara manusia.

Unjuk Performa

Input: Gambar Potret dan File Audio Suara Manusia

Output: Video Potret Dinamis

Potret:

上春山

Audio: Lihat video di sebelah kanan

Video Potret:

Gaya aksi yang digunakan: Aktif ("style_level": "active")

Potret:

15_原图

Audio: Lihat video di sebelah kanan

Video Potret:

Gaya aksi yang digunakan: Normal ("style_level": "normal")

Potret:

娃哈哈

Audio: Lihat video di sebelah kanan

Video Potret:

Gaya aksi yang digunakan: Tenang ("style_level": "calm")

Catatan

Contoh-contoh di atas dihasilkan oleh Tongyi App, yang mengintegrasikan EMO.

Penagihan dan Pembatasan Kecepatan

Mode

Model

Harga Satuan

Batas QPS untuk API pengiriman tugas

Jumlah Tugas Serentak

Pemanggilan Model

emo-detect-v1

Pemanggilan Model, bayar sesuai penggunaan:

$0.000574/gambar

Tidak ada batas untuk API sinkron

emo-v1

Pemanggilan Model, bayar sesuai penggunaan:

Hasilkan video rasio aspek 1:1: $0.011469/detik
Hasilkan video rasio aspek 3:4: $0.022937/detik

(Pada waktu tertentu, hanya satu pekerjaan yang sedang berjalan. Pekerjaan lain dalam antrian menunggu.)

Prasyarat

Anda telah mengaktifkan layanan dan memperoleh Kunci API. Untuk informasi lebih lanjut, lihat Persiapan: Konfigurasi Kunci API.

Pemanggilan Model

Seri model EMO tersedia secara bayar sesuai penggunaan.
Untuk memanggil model, ikuti langkah-langkah berikut:
1. Panggil model EMO-detect untuk memastikan bahwa gambar potret input sesuai dengan spesifikasi. Untuk informasi lebih lanjut, lihat Deteksi Gambar EMO.
2. Panggil model EMO. Sediakan citra potret asli, parameter area citra relevan yang dikembalikan setelah citra lolos deteksi, dan file audio yang berisi suara manusia yang jelas untuk menghasilkan video potret dinamis. Untuk informasi lebih lanjut, lihat Pembuatan video EMO.