EMO menghasilkan video potret dinamis berkualitas tinggi dari citra potret dan file audio yang berisi suara manusia. Layanan ini mencakup dua model independen: EMO-detect untuk memvalidasi kesesuaian citra potret dan EMO untuk pembuatan video potret.
Dokumen ini hanya berlaku untuk Wilayah China (Beijing). Untuk menggunakan model-model tersebut, Anda harus menggunakan Kunci API dari wilayah China (Beijing).
Ikhtisar Model
Pengenalan Model
EMO-detect adalah model deteksi citra yang digunakan untuk memeriksa apakah citra input sesuai dengan spesifikasi model EMO.
EMO adalah model pembuatan video potret yang menghasilkan video potret dinamis dari citra potret dan file audio yang berisi suara manusia.
Unjuk Performa
Input: Gambar Potret dan File Audio Suara Manusia | Output: Video Potret Dinamis |
Potret:
Audio: Lihat video di sebelah kanan | Video Potret: Gaya aksi yang digunakan: Aktif ("style_level": "active") |
Potret:
Audio: Lihat video di sebelah kanan | Video Potret: Gaya aksi yang digunakan: Normal ("style_level": "normal") |
Potret:
Audio: Lihat video di sebelah kanan | Video Potret: Gaya aksi yang digunakan: Tenang ("style_level": "calm") |
Contoh-contoh di atas dihasilkan oleh Tongyi App, yang mengintegrasikan EMO.
Penagihan dan Pembatasan Kecepatan
Mode | Model | Harga Satuan | Batas QPS untuk API pengiriman tugas | Jumlah Tugas Serentak |
Pemanggilan Model | emo-detect-v1 | Pemanggilan Model, bayar sesuai penggunaan: $0.000574/gambar | 5 | Tidak ada batas untuk API sinkron |
emo-v1 | Pemanggilan Model, bayar sesuai penggunaan:
| 1 (Pada waktu tertentu, hanya satu pekerjaan yang sedang berjalan. Pekerjaan lain dalam antrian menunggu.) |
Prasyarat
Anda telah mengaktifkan layanan dan memperoleh Kunci API. Untuk informasi lebih lanjut, lihat Persiapan: Konfigurasi Kunci API.
Pemanggilan Model
Seri model EMO tersedia secara bayar sesuai penggunaan.
Untuk memanggil model, ikuti langkah-langkah berikut:
Panggil model EMO-detect untuk memastikan bahwa gambar potret input sesuai dengan spesifikasi. Untuk informasi lebih lanjut, lihat Deteksi Gambar EMO.
Panggil model EMO. Sediakan citra potret asli, parameter area citra relevan yang dikembalikan setelah citra lolos deteksi, dan file audio yang berisi suara manusia yang jelas untuk menghasilkan video potret dinamis. Untuk informasi lebih lanjut, lihat Pembuatan video EMO.


