Wan - Video editing API (2.1) - Alibaba Cloud Model Studio

Model terpadu Wan 2.1 untuk pengeditan video mendukung berbagai modalitas input, termasuk teks, gambar, dan video, untuk berbagai tugas pembuatan dan pengeditan video.

Dokumentasi Terkait: panduan pengguna

Cakupan

Untuk memastikan pemanggilan berhasil, model, URL endpoint, dan Kunci API harus berada di wilayah yang sama. Pemanggilan lintas wilayah akan gagal.

Pilih model: Konfirmasi wilayah model.
Pilih URL: Pilih URL endpoint sesuai wilayah model. Protokol HTTP didukung.
Konfigurasikan Kunci API: Pilih wilayah, dapatkan Kunci API, lalu konfigurasikan dalam variabel lingkungan Anda.

Catatan

Kode contoh dalam topik ini ditujukan untuk wilayah Singapura.

Penting

Domain lama https://dashscope-intl.aliyuncs.com untuk wilayah Singapura akan segera ditinggalkan. Harap migrasi ke domain baru https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com sesegera mungkin.

Pemanggilan HTTP

Model terpadu pengeditan video memerlukan waktu pemrosesan 5–10 menit, sehingga API menggunakan proses asinkron dengan dua langkah inti: "buat task -> polling hasil".

Langkah 1: Buat task

Singapura

POST https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis

Saat melakukan panggilan, ganti WorkspaceId dengan Workspace ID yang sebenarnya.

Beijing

POST https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis

Parameter permintaan

Multi-image reference

Kunci API untuk wilayah Singapura dan China (Beijing) berbeda. Buat Kunci API

URL berikut ditujukan untuk wilayah Singapura. Untuk wilayah China (Beijing), gunakan URL ini sebagai gantinya: https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis

curl --location 'https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "image_reference",
        "prompt": "In the video, a girl gracefully emerges from a misty, ancient forest. Her steps are light, and the camera captures her every nimble moment. When she stops to look at the lush woods around her, a smile of surprise and joy blossoms on her face. This scene, frozen in an interplay of light and shadow, records her wonderful encounter with nature.",
        "ref_images_url": [
            "http://wanx.alicdn.com/material/20250318/image_reference_2_5_16.png",
            "http://wanx.alicdn.com/material/20250318/image_reference_1_5_16.png"
        ]
    },
    "parameters": {
        "prompt_extend": true,
        "obj_or_bg": ["obj","bg"],
        "size": "1280*720"
    }
}'

Video repainting

Kunci API untuk wilayah Singapura dan China (Beijing) berbeda. Buat Kunci API

URL berikut ditujukan untuk wilayah Singapura. Untuk wilayah China (Beijing), gunakan URL ini sebagai gantinya: https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis

curl --location 'https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_repainting",
        "prompt": "The video shows a black steampunk-style car driven by a gentleman, adorned with gears and copper pipes. The background is a steam-powered candy factory with retro elements, creating a vintage and fun scene.",
        "video_url": "http://wanx.alicdn.com/material/20250318/video_repainting_1.mp4"
    },
    "parameters": {
        "prompt_extend": false,
        "control_condition": "depth"
    }
}'

Local editing

Kunci API untuk wilayah Singapura dan China (Beijing) berbeda. Buat Kunci API

URL berikut ditujukan untuk wilayah Singapura. Untuk wilayah China (Beijing), gunakan URL ini sebagai gantinya: https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis

curl --location 'https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_edit",
        "prompt": "The video shows a Parisian-style French cafe where a lion in a suit elegantly sips coffee. It holds a coffee cup in one hand, taking a gentle sip with a relaxed expression. The cafe is tastefully decorated, with soft hues and warm lighting illuminating the lion's area.",
        "mask_image_url": "http://wanx.alicdn.com/material/20250318/video_edit_1_mask.png",
        "video_url": "http://wanx.alicdn.com/material/20250318/video_edit_2.mp4",
        "mask_frame_id": 1
    },
    "parameters": {
        "prompt_extend": false,
        "mask_type": "tracking",
        "expand_ratio": 0.05
    }
}'

Video extension

Kunci API untuk wilayah Singapura dan China (Beijing) berbeda. Buat Kunci API

URL berikut ditujukan untuk wilayah Singapura. Untuk wilayah China (Beijing), gunakan URL ini sebagai gantinya: https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis

curl --location 'https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_extension",
        "prompt": "A dog wearing sunglasses skateboarding on the street, 3D cartoon.",
        "first_clip_url": "http://wanx.alicdn.com/material/20250318/video_extension_1.mp4"
    },
    "parameters": {
        "prompt_extend": false
    }
}'

Video outpainting

Kunci API untuk wilayah Singapura dan China (Beijing) berbeda. Buat Kunci API

URL berikut ditujukan untuk wilayah Singapura. Untuk wilayah China (Beijing), gunakan URL ini sebagai gantinya: https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis

curl --location 'https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_outpainting",
        "prompt": "An elegant woman passionately plays the violin, with a full symphony orchestra behind her.",
        "video_url": "http://wanx.alicdn.com/material/20250318/video_outpainting_1.mp4"
    },
    "parameters": {
        "prompt_extend": false,
        "top_scale": 1.5,
        "bottom_scale": 1.5,
        "left_scale": 1.5,
        "right_scale": 1.5
    }
}'

Header permintaan

Content-Type string (Wajib)

Tipe konten dari permintaan. Harus berupa application/json.

Authorization string (Wajib)

Mengotentikasi permintaan dengan Kunci API Model Studio. Contoh: Bearer sk-xxxx.

X-DashScope-Async string (Wajib)

Mengaktifkan pemrosesan asinkron. Permintaan HTTP hanya mendukung panggilan asinkron. Nilainya harus enable.

Penting

Jika header permintaan ini tidak disertakan, kesalahan "current user api does not support synchronous calls" akan dikembalikan.

Body permintaan

Multi-image reference

model string (Wajib)

Nama model. Contoh: wan2.1-vace-plus.

input object (Wajib)

Input dasar, seperti prompt.

Properti

prompt string (Wajib)

Menjelaskan elemen dan fitur visual yang ingin dimasukkan dalam video yang dihasilkan.

Mendukung bahasa Tionghoa dan Inggris. Panjang maksimum adalah 800 karakter, di mana setiap karakter Tionghoa atau huruf dihitung sebagai satu karakter. Teks yang melebihi batas ini akan dipotong secara otomatis.

Untuk teknik prompt, lihat Panduan Prompt Text-to-Video/Image-to-Video.

function string (Wajib)

Nama fitur. Untuk multi-image reference, nilai parameter ini adalah image_reference.

Multi-image reference mendukung hingga 3 gambar referensi. Gambar-gambar tersebut dapat berisi entitas dan latar belakang, seperti manusia, hewan, pakaian, dan pemandangan. Gunakan prompt untuk menggambarkan konten video yang diinginkan, dan model akan menggabungkan beberapa gambar tersebut untuk menghasilkan konten video yang koheren.

ref_images_url array[string] (Wajib)

Array berisi URL gambar referensi.

URL publik:
- Mendukung protokol HTTP dan HTTPS.
- Contoh: https://xxx/xxx.png.

Anda dapat memberikan 1 hingga 3 gambar referensi. Jika lebih dari 3, hanya 3 gambar pertama yang digunakan.

Persyaratan gambar:

Format: JPG, JPEG, PNG, BMP, TIFF, atau WEBP.
Resolusi: Lebar dan tinggi harus berada dalam rentang [360, 2000] piksel.
Ukuran: Maksimal 10 MB.
URL tidak boleh mengandung karakter Tionghoa.

Rekomendasi:

Saat menggunakan gambar referensi untuk entitas, kami menyarankan agar setiap gambar hanya berisi satu entitas. Latar belakang sebaiknya berwarna solid (misalnya putih) agar entitas lebih menonjol.
Jika menggunakan latar belakang dari gambar referensi, Anda dapat memberikan maksimal satu gambar latar belakang, yang tidak boleh mengandung objek entitas apa pun.

parameters object (Opsional)

Parameter untuk pemrosesan video, seperti pengaturan watermark.

Properti

obj_or_bg array[string] (Opsional)

Parameter ini digunakan untuk mengidentifikasi tujuan setiap gambar referensi dan berkorespondensi satu-ke-satu dengan parameter ref_images_url. Setiap elemen dalam array menentukan apakah gambar pada posisi yang bersangkutan merupakan 'subjek' atau 'latar belakang':

obj: Menunjukkan bahwa gambar tersebut adalah entitas referensi.
bg: Menentukan gambar tersebut sebagai referensi latar belakang (maksimal satu).

Catatan penggunaan:

Kami menyarankan Anda selalu menyertakan parameter ini, dan panjangnya harus sama dengan panjang ref_images_url, jika tidak akan muncul error.
Parameter ini dapat diabaikan dan secara default bernilai ["obj"] hanya jika ref_images_url berupa array dengan satu elemen.

Contoh: ["obj", "obj", "bg"].

size string (Opsional)

Resolusi video yang dihasilkan (lebar*tinggi). Model mendukung pembuatan video 720p. Nilai yang valid:

1280*720 (Default): Rasio aspek video adalah 16:9, dengan lebar 1280 dan tinggi 720.
720*1280: Rasio aspek video adalah 9:16.
960*960: Rasio aspek video adalah 1:1.
832*1088: Rasio aspek video adalah 3:4.
1088*832: Rasio aspek video adalah 4:3.

duration integer (Opsional)

Durasi video yang dihasilkan dalam detik. Nilai ini tetap pada 5.

prompt_extend bool (Opsional)

Menentukan apakah akan mengaktifkan penulisan ulang prompt. Jika diaktifkan, model bahasa besar (LLM) akan menulis ulang prompt input. Hal ini dapat meningkatkan hasil secara signifikan untuk prompt pendek, tetapi memperpanjang waktu pemrosesan.

true (default): Mengaktifkan penulisan ulang prompt.
false: Menonaktifkan penulisan ulang prompt.

seed integer (Opsional)

Bilangan acak seed mengontrol tingkat keacakan konten yang dihasilkan oleh model. Rentang nilai parameter seed adalah [0, 2147483647].

Jika Anda tidak menentukan seed, seed akan dibuat secara otomatis. Untuk hasil yang dapat direproduksi, gunakan nilai seed yang sama pada beberapa permintaan.

watermark bool (Opsional)

Menentukan apakah akan menambahkan watermark 'AI-generated' di pojok kanan bawah gambar.

false (default): Tidak menambahkan watermark.
true: Menambahkan watermark.

Video repainting

model string (Wajib)

Nama model. Contoh: wan2.1-vace-plus.

input object (Wajib)

Input dasar, seperti prompt.

Properti

prompt string (Wajib)

Menjelaskan elemen dan fitur visual yang ingin dimasukkan dalam video yang dihasilkan.

Untuk teknik prompt, lihat Panduan Prompt Text-to-Video/Image-to-Video.

function string (Wajib)

Nama fitur. Untuk video repainting, nilai parameter ini adalah video_repainting.

Fitur video repainting mengekstraksi pose dan gerakan entitas, pencampuran aliran, kontur gerak, serta struktur garis dari video input. Fitur ini kemudian menggabungkannya dengan prompt teks untuk menghasilkan video baru dengan karakteristik dinamis yang sama. Fitur ini juga mendukung penggantian entitas dalam video asli dengan menggunakan gambar referensi, misalnya untuk mengubah penampilan karakter sambil mempertahankan gerakan aslinya.

video_url string (Wajib)

URL video input.

URL publik:
- Mendukung protokol HTTP dan HTTPS.
- Contoh: https://xxx/xxx.mp4.

Persyaratan video:

Format: MP4.
Laju frame: 16 FPS atau lebih tinggi.
Ukuran: Maksimal 50 MB.
Durasi: Maksimal 5 detik. Video yang lebih panjang akan dipotong menjadi 5 detik pertama.
URL tidak boleh mengandung karakter Tionghoa.

Resolusi video output:

Jika resolusi video input 720p atau lebih rendah, resolusi output akan sama dengan input.
Jika resolusi video input lebih tinggi dari 720p, resolusi akan diturunkan agar sesuai dalam resolusi 720p sambil mempertahankan rasio aspek asli.

Durasi video output:

Durasi video output mengikuti durasi video input, hingga maksimal 5 detik.
Contoh: Jika video input berdurasi 3 detik, output juga berdurasi 3 detik. Jika input berdurasi 6 detik, output adalah 5 detik pertama dari input.

ref_images_url array[string] (Opsional)

Array berisi URL gambar referensi.

URL publik:
- Mendukung protokol HTTP dan HTTPS.
- Contoh: https://xxx/xxx.png.

Hanya mendukung 1 gambar referensi. Kami menyarankan gambar ini berupa gambar entitas untuk mengganti konten entitas dalam video input.

Persyaratan gambar:

Format: JPG, JPEG, PNG, BMP, TIFF, atau WEBP.
Resolusi: Lebar dan tinggi harus berada dalam rentang [360, 2000] piksel.
Ukuran: Maksimal 10 MB.
URL tidak boleh mengandung karakter Tionghoa.

Rekomendasi:

Saat menggunakan gambar referensi untuk entitas, kami menyarankan agar gambar hanya berisi satu entitas. Latar belakang sebaiknya berwarna solid (misalnya putih) agar entitas lebih menonjol.

parameters object (Wajib)

Parameter untuk pemrosesan video, seperti pengaturan watermark.

Properti

control_condition string (Wajib)

Metode ekstraksi fitur video.

posebodyface: Mengekstraksi ekspresi wajah dan gerakan tubuh entitas dari video input. Cocok untuk skenario di mana detail ekspresi wajah entitas perlu dipertahankan.
posebody: Mengekstraksi gerakan tubuh entitas dari video input, tanpa mempertimbangkan ekspresi wajah. Cocok untuk skenario di mana hanya gerakan tubuh entitas yang perlu dikontrol.
depth: Mengekstraksi pencampuran aliran dan kontur gerak dari video input.
scribble: Mengekstraksi struktur garis dari video input.

strength float (Opsional)

Menyesuaikan kekuatan kontrol metode ekstraksi fitur video yang ditentukan oleh parameter control_condition terhadap video yang dihasilkan.

Nilainya harus berada dalam rentang [0.0, 1.0]. Nilai default adalah 1.0.

Nilai yang lebih besar membuat video yang dihasilkan lebih mengikuti gerakan dan komposisi video asli. Nilai yang lebih kecil memberikan kebebasan kreatif yang lebih besar.

prompt_extend bool (Opsional)

true (default): Mengaktifkan penulisan ulang prompt.
false: Menonaktifkan penulisan ulang prompt. (Direkomendasikan)

Jika deskripsi teks tidak konsisten dengan konten video, model mungkin salah menginterpretasi input. Kami menyarankan Anda menonaktifkan ekspansi cerdas secara manual dan memberikan deskripsi adegan yang jelas dan spesifik dalam prompt untuk meningkatkan konsistensi dan akurasi.

seed integer (Opsional)

Bilangan acak seed mengontrol tingkat keacakan konten yang dihasilkan oleh model. Rentang nilai parameter seed adalah [0, 2147483647].

Jika Anda tidak menentukan seed, seed akan dibuat secara otomatis. Untuk hasil yang dapat direproduksi, gunakan nilai seed yang sama pada beberapa permintaan.

watermark bool (Opsional)

Menentukan apakah akan menambahkan watermark 'AI-generated' di pojok kanan bawah gambar.

false (default): Tidak menambahkan watermark.
true: Menambahkan watermark.

Local editing

model string (Wajib)

Nama model. Contoh: wan2.1-vace-plus.

input object (Wajib)

Input dasar, seperti prompt.

Properti

prompt string (Wajib)

Menjelaskan elemen dan fitur visual yang ingin dimasukkan dalam video yang dihasilkan.

Untuk teknik prompt, lihat Panduan Prompt Text-to-Video/Image-to-Video.

function string (Wajib)

Nama fitur: Untuk local editing, nilai parameter ini adalah video_edit.

Fitur local editing memungkinkan Anda menambah, memodifikasi, atau menghapus elemen di area tertentu dari video input. Anda juga dapat mengganti entitas atau latar belakang di area pengeditan untuk pengeditan video detail halus.

video_url string (Wajib)

URL video input.

URL publik:
- Mendukung protokol HTTP dan HTTPS.
- Contoh: https://xxx/xxx.mp4.

Persyaratan video:

Format: MP4.
Laju frame: 16 FPS atau lebih tinggi.
Ukuran: Maksimal 50 MB.
Durasi: Maksimal 5 detik. Video yang lebih panjang akan dipotong menjadi 5 detik pertama.
URL tidak boleh mengandung karakter Tionghoa.

Resolusi video output:

Jika resolusi video input 720p atau lebih rendah, resolusi output akan sama dengan input.
Jika resolusi video input lebih tinggi dari 720p, resolusi akan diturunkan agar sesuai dalam resolusi 720p sambil mempertahankan rasio aspek asli.

Durasi video output:

Durasi video output mengikuti durasi video input, hingga maksimal 5 detik.
Contoh: Jika video input berdurasi 3 detik, output juga berdurasi 3 detik. Jika input berdurasi 6 detik, output adalah 5 detik pertama dari input.

ref_images_url array[string] (Opsional)

Array berisi URL gambar referensi.

URL publik:
- Mendukung protokol HTTP dan HTTPS.
- Contoh: https://xxx/xxx.png.

Saat ini hanya mendukung 1 gambar referensi. Gambar ini dapat digunakan sebagai entitas atau latar belakang untuk mengganti konten yang sesuai dalam video input.

Persyaratan gambar:

Format: JPG, JPEG, PNG, BMP, TIFF, atau WEBP.
Resolusi: Lebar dan tinggi harus berada dalam rentang [360, 2000] piksel.
Ukuran: Maksimal 10 MB.
URL tidak boleh mengandung karakter Tionghoa.

Rekomendasi:

Saat menggunakan gambar referensi untuk entitas, kami menyarankan agar gambar hanya berisi satu entitas. Latar belakang sebaiknya berwarna solid (misalnya putih) agar entitas lebih menonjol.
Jika menggunakan latar belakang dari gambar referensi, gambar latar belakang tersebut tidak boleh mengandung objek entitas apa pun.

mask_image_url string (Opsional)

URL gambar mask.

URL publik:
- Mendukung protokol HTTP dan HTTPS.
- Contoh: https://xxx/xxx.png.

Parameter ini menentukan area pengeditan video. Anda dapat menentukan parameter ini atau parameter mask_video_url. Kami menyarankan Anda memprioritaskan parameter ini.

Dalam gambar mask, area putih (nilai piksel [255, 255, 255]) menentukan wilayah yang akan diedit, sedangkan area hitam (nilai piksel [0, 0, 0]) menentukan wilayah yang akan dipertahankan.

Persyaratan gambar:

Format: JPG, JPEG, PNG, BMP, TIFF, atau WEBP.
Resolusi gambar: Harus sama dengan resolusi video input (video_url).
Ukuran: Maksimal 10 MB.
URL tidak boleh mengandung karakter Tionghoa.

mask_frame_id integer (Opsional)

Parameter ini berlaku saat mask_image_url tidak kosong. Parameter ini menentukan ID frame dalam video tempat target mask muncul.

Nilai default adalah 1, yang menunjukkan frame pertama video.

Rentang nilainya adalah [1, max_frame_id], di mana max_frame_id = laju frame video input * durasi video input + 1.

Sebagai contoh, jika video input (video_url) memiliki laju frame 16 FPS (frame per detik) dan durasi 5 detik, jumlah total frame adalah 16 × 5 + 1 = 81. Oleh karena itu, max_frame_id = 81.

mask_video_url string (Opsional)

URL video mask.

URL publik:
- Mendukung protokol HTTP dan HTTPS.
- Contoh: https://xxx/xxx.mp4.

Parameter ini digunakan untuk menentukan area pengeditan video. Anda harus menentukan parameter ini atau parameter mask_image_url.

Format video, laju frame, resolusi, dan panjang video mask harus identik dengan video input (video_url).

Dalam video mask, area putih (nilai piksel [255, 255, 255]) menentukan wilayah yang akan diedit, sedangkan area hitam (nilai piksel [0, 0, 0]) menentukan wilayah yang akan dipertahankan.

parameters object (Opsional)

Parameter untuk pemrosesan video, seperti pengaturan watermark.

Properti

control_condition string (Opsional)

Metode ekstraksi fitur video. Nilai default adalah "", yang berarti tidak ada fitur yang diekstraksi.

posebodyface: Mengekstraksi ekspresi wajah dan gerakan tubuh entitas dari video input. Cocok untuk skenario di mana wajah entitas menempati sebagian besar frame dan fiturnya terlihat jelas.
depth: Mengekstraksi pencampuran aliran dan kontur gerak dari video input.

mask_type string (Opsional)

Saat mask_image_url tidak kosong, parameter ini berlaku untuk menentukan perilaku area pengeditan.

tracking (Default): Area pengeditan mengikuti lintasan gerak objek target secara dinamis. Cocok untuk skenario di mana subjek bergerak.
fixed: Area pengeditan tetap dan tidak berubah mengikuti konten layar.

expand_ratio float (Opsional)

Saat mask_type bernilai tracking, parameter ini berlaku dan menentukan rasio perluasan area mask ke luar.

Nilainya harus berada dalam rentang [0.0, 1.0]. Nilai default adalah 0.05, yang direkomendasikan.

Nilai yang lebih kecil membuat area mask lebih pas mengikuti objek target, sedangkan nilai yang lebih besar memperluas area mask lebih jauh.

expand_mode string (Opsional)

Saat mask_type bernilai tracking, parameter ini berlaku dan menentukan bentuk area mask.

Algoritma akan menghasilkan video mask dengan bentuk yang sesuai dari gambar mask input, berdasarkan expand_mode yang dipilih. Nilai yang didukung adalah sebagai berikut:

hull (Default): Mode poligon. Mode ini menggunakan poligon untuk mengelilingi objek yang dimask.
bbox: Mode kotak pembatas. Mode ini menggunakan persegi panjang untuk mengelilingi objek yang dimask.
original: Mode asli, yang berusaha mempertahankan bentuk asli target mask.

size string (Opsional)

Resolusi video yang dihasilkan (lebar*tinggi). Model mendukung pembuatan video 720p. Nilai yang valid:

1280*720 (Default): Rasio aspek video adalah 16:9, dengan lebar 1280 dan tinggi 720.
720*1280: Rasio aspek video adalah 9:16.
960*960: Rasio aspek video adalah 1:1.
832*1088: Rasio aspek video adalah 3:4.
1088*832: Rasio aspek video adalah 4:3.

duration integer (Opsional)

Durasi video yang dihasilkan dalam detik. Nilai ini tetap pada 5.

prompt_extend bool (Opsional)

true (default): Mengaktifkan penulisan ulang prompt.
false: Menonaktifkan penulisan ulang prompt. (Direkomendasikan)

Jika deskripsi teks tidak konsisten dengan konten video, model mungkin salah menginterpretasi input. Kami menyarankan Anda menonaktifkan ekspansi cerdas secara manual dan memberikan deskripsi adegan yang jelas dan spesifik dalam prompt untuk meningkatkan konsistensi dan akurasi.

seed integer (Opsional)

Bilangan acak seed mengontrol tingkat keacakan konten yang dihasilkan oleh model. Rentang nilai parameter seed adalah [0, 2147483647].

Jika Anda tidak menentukan seed, seed akan dibuat secara otomatis. Untuk hasil yang dapat direproduksi, gunakan nilai seed yang sama pada beberapa permintaan.

watermark bool (Opsional)

Menentukan apakah akan menambahkan watermark 'AI-generated' di pojok kanan bawah gambar.

false (default): Tidak menambahkan watermark.
true: Menambahkan watermark.

Video extension

model string (Wajib)

Nama model. Contoh: wan2.1-vace-plus.

input object (Wajib)

Input dasar, seperti prompt.

Properti

prompt string (Wajib)

Menjelaskan elemen dan fitur visual yang ingin dimasukkan dalam video yang dihasilkan.

Untuk teknik prompt, lihat Panduan Prompt Text-to-Video/Image-to-Video.

function string (Wajib)

Nama fungsi. Untuk video extension, nilai parameter ini adalah video_extension.

Fitur video extension menghasilkan konten berkelanjutan dari gambar atau video. Fitur ini juga dapat mengekstraksi fitur dinamis, seperti gerakan dan pencampuran aliran, dari video referensi untuk membimbing pembuatan video dengan gerakan serupa.

Durasi total video yang dihasilkan adalah 5 detik. Ini adalah durasi output akhir, bukan penambahan 5 detik ke konten asli.

first_frame_url string (Opsional)

URL gambar frame pertama.

URL publik:
- Mendukung protokol HTTP dan HTTPS.
- Contoh: https://xxx/xxx.png.

Persyaratan gambar:

Format: JPG, JPEG, PNG, BMP, TIFF, atau WEBP.
Resolusi: Lebar dan tinggi harus berada dalam rentang [360, 2000] piksel.
Ukuran: Maksimal 10 MB.
URL tidak boleh mengandung karakter Tionghoa.

last_frame_url string(Opsional)

URL gambar frame terakhir.

URL publik:
- Mendukung protokol HTTP dan HTTPS.
- Contoh: https://xxx/xxx.png.

Persyaratan gambar:

Format: JPG, JPEG, PNG, BMP, TIFF, atau WEBP.
Resolusi: Lebar dan tinggi harus berada dalam rentang [360, 2000] piksel.
Ukuran: Maksimal 10 MB.
URL tidak boleh mengandung karakter Tionghoa.

first_clip_url string (Opsional)

URL klip video pertama.

URL publik:
- Mendukung protokol HTTP dan HTTPS.
- Contoh: https://xxx/xxx.mp4.

Persyaratan video:

Format: MP4.
Laju bingkai video: Lebih besar atau sama dengan 16 FPS. Saat first_clip_url dan last_clip_url digunakan bersamaan, kami menyarankan kedua klip memiliki laju frame yang sama.
Ukuran: Maksimal 50 MB.
Panjang video: Video tidak boleh lebih panjang dari 3 detik. Jika lebih panjang, 3 detik pertama video akan digunakan. Jika Anda menentukan first_clip_url dan last_clip_url, durasi total kedua klip video tidak boleh melebihi 3 detik.
URL tidak boleh mengandung karakter Tionghoa.

Resolusi video output:

Jika resolusi video input 720p atau lebih rendah, resolusi output akan sama dengan input.
Jika resolusi video input lebih tinggi dari 720p, resolusi akan diturunkan agar sesuai dalam resolusi 720p sambil mempertahankan rasio aspek asli.

last_clip_url string(Opsional)

URL klip video terakhir.

URL publik:
- Mendukung protokol HTTP dan HTTPS.
- Contoh: https://help-static-aliyun-doc.aliyuncs.com/xxx.mp4.

Persyaratan video:

Format: MP4.
Laju bingkai video: 16 FPS atau lebih tinggi. Saat first_clip_url dan last_clip_url digunakan bersamaan, kami menyarankan kedua klip memiliki laju frame yang sama.
Ukuran: Maksimal 50 MB.
Durasi video: Durasi tidak boleh melebihi 3 detik. Jika video lebih panjang, hanya 3 detik pertama yang digunakan. Jika Anda menentukan first_clip_url dan last_clip_url, durasi gabungan keduanya tidak boleh melebihi 3 detik.
URL tidak boleh mengandung karakter Tionghoa.

Resolusi video output:

Jika resolusi video input 720p atau lebih rendah, resolusi output akan sama dengan input.
Jika resolusi video input lebih tinggi dari 720p, resolusi akan diturunkan agar sesuai dalam resolusi 720p sambil mempertahankan rasio aspek asli.

video_url string (Opsional)

URL video input.

URL publik:
- Mendukung protokol HTTP dan HTTPS.
- Contoh: https://help-static-aliyun-doc.aliyuncs.com/xxx.mp4.

Video ini terutama digunakan untuk mengekstraksi fitur gerak yang bekerja bersama parameter first_frame_url, last_frame_url, first_clip_url, dan last_clip_url untuk membimbing pembuatan video extended dengan performa gerak serupa.

Persyaratan video:

Format: MP4.
Laju frame: 16 FPS atau lebih tinggi, konsisten dengan klip sebelum dan sesudahnya.
Resolusi: Konsisten dengan frame dan klip sebelum dan sesudahnya.
Ukuran: Maksimal 50 MB.
Durasi: Maksimal 5 detik. Video yang lebih panjang akan dipotong menjadi 5 detik pertama.
URL tidak boleh mengandung karakter Tionghoa.

parameters object (Opsional)

Parameter untuk pemrosesan video, seperti pengaturan resolusi video output.

Properti

control_condition string (Opsional)

Metode ekstraksi fitur video. Parameter ini wajib jika video_url ditentukan. Nilai default adalah "", yang berarti tidak ada fitur yang diekstraksi.

posebodyface: Mengekstraksi ekspresi wajah dan gerakan tubuh entitas dalam video input.
depth: Mengekstraksi kontur komposisi dan gerakan dari video input.

duration integer (Opsional)

Durasi video yang dihasilkan dalam detik. Nilai ini tetap pada 5.

prompt_extend bool (Opsional)

true (default): Mengaktifkan penulisan ulang prompt.
false: Menonaktifkan penulisan ulang prompt. (Direkomendasikan)

Jika deskripsi teks tidak konsisten dengan konten video, model mungkin salah menginterpretasi input. Kami menyarankan Anda menonaktifkan ekspansi cerdas secara manual dan memberikan deskripsi adegan yang jelas dan spesifik dalam prompt untuk meningkatkan konsistensi dan akurasi.

seed integer (Opsional)

Bilangan acak seed mengontrol tingkat keacakan konten yang dihasilkan oleh model. Rentang nilai parameter seed adalah [0, 2147483647].

Jika Anda tidak menentukan seed, seed akan dibuat secara otomatis. Untuk hasil yang dapat direproduksi, gunakan nilai seed yang sama pada beberapa permintaan.

watermark bool (Opsional)

Menentukan apakah akan menambahkan watermark 'AI-generated' di pojok kanan bawah gambar.

false (default): Tidak menambahkan watermark.
true: Menambahkan watermark.

Video outpainting

model string (Wajib)

Nama model. Contoh: wan2.1-vace-plus.

input object (Wajib)

Input dasar, seperti prompt.

Properti

prompt string (Wajib)

Menjelaskan elemen dan fitur visual yang ingin dimasukkan dalam video yang dihasilkan.

Untuk teknik prompt, lihat Panduan Prompt Text-to-Video/Image-to-Video.

function string (Wajib)

Nama fitur. Untuk video outpainting, nilai parameter ini adalah video_outpainting.

Fitur video outpainting memperluas proporsi frame video ke arah atas, bawah, kiri, dan kanan secara proporsional.

video_url string (Wajib)

URL video input.

URL publik:
- Mendukung protokol HTTP dan HTTPS.
- Contoh: https://xxx/xxx.mp4.

Persyaratan video:

Format: MP4.
Laju frame: 16 FPS atau lebih tinggi.
Ukuran: Maksimal 50 MB.
Durasi: Maksimal 5 detik. Video yang lebih panjang akan dipotong menjadi 5 detik pertama.
URL tidak boleh mengandung karakter Tionghoa.

Resolusi video output:

Jika resolusi video input 720p atau lebih rendah, resolusi output akan sama dengan input.
Jika resolusi video input lebih tinggi dari 720p, resolusi akan diturunkan agar sesuai dalam resolusi 720p sambil mempertahankan rasio aspek asli.

Durasi video output:

Durasi video output mengikuti durasi video input, hingga maksimal 5 detik.
Contoh: Jika video input berdurasi 3 detik, output juga berdurasi 3 detik. Jika input berdurasi 6 detik, output adalah 5 detik pertama dari input.

parameters object (Opsional)

Parameter untuk pemrosesan video, seperti pengaturan rasio perluasan.

Properti

top_scale float (Opsional)

Memusatkan frame video dan memperluasnya ke atas berdasarkan rasio yang ditentukan.

Nilainya harus berada dalam rentang [1.0, 2.0]. Nilai default adalah 1.0, yang berarti tidak ada perluasan.

bottom_scale float (Opsional)

Memusatkan frame video dan memperluasnya ke bawah berdasarkan rasio yang ditentukan.

Nilainya harus berada dalam rentang [1.0, 2.0]. Nilai default adalah 1.0, yang berarti tidak ada perluasan.

left_scale float (Opsional)

Memusatkan frame video dan memperluasnya ke kiri berdasarkan rasio yang ditentukan.

Nilainya harus berada dalam rentang [1.0, 2.0]. Nilai default adalah 1.0, yang berarti tidak ada perluasan.

right_scale float (Opsional)

Memusatkan frame video dan memperluasnya ke kanan berdasarkan rasio yang ditentukan.

Nilainya harus berada dalam rentang [1.0, 2.0]. Nilai default adalah 1.0, yang berarti tidak ada perluasan.

duration integer (Opsional)

Durasi video yang dihasilkan dalam detik. Nilai ini tetap pada 5.

prompt_extend bool (Opsional)

true (default): Mengaktifkan penulisan ulang prompt.
false: Menonaktifkan penulisan ulang prompt. (Direkomendasikan)

Jika deskripsi teks tidak konsisten dengan konten video, model mungkin salah menginterpretasi input. Kami menyarankan Anda menonaktifkan ekspansi cerdas secara manual dan memberikan deskripsi adegan yang jelas dan spesifik dalam prompt untuk meningkatkan konsistensi dan akurasi.

seed integer (Opsional)

Bilangan acak seed mengontrol tingkat keacakan konten yang dihasilkan oleh model. Rentang nilai parameter seed adalah [0, 2147483647].

Jika Anda tidak menentukan seed, seed akan dibuat secara otomatis. Untuk hasil yang dapat direproduksi, gunakan nilai seed yang sama pada beberapa permintaan.

watermark bool (Opsional)

Menentukan apakah akan menambahkan watermark 'AI-generated' di pojok kanan bawah gambar.

false (default): Tidak menambahkan watermark.
true: Menambahkan watermark.

Parameter respons	Respons sukses Simpan `task_id` untuk menanyakan status dan hasil task. `{ "output": { "task_status": "PENDING", "task_id": "0385dc79-5ff8-4d82-bcb6-xxxxxx" }, "request_id": "4909100c-7b5a-9f92-bfe5-xxxxxx" }` Respons error Pembuatan task gagal. Lihat Kode kesalahan. `{ "code": "InvalidApiKey", "message": "No API-key provided.", "request_id": "7438d53d-6eb8-4596-8835-xxxxxx" }`
output `object` Output dari tugas asinkron. Properti task_id `string` ID task. Berlaku untuk kueri selama 24 jam. task_status `string` Status task. Nilai enumerasi PENDING RUNNING SUCCEEDED FAILED CANCELED UNKNOWN: Task tidak ada atau statusnya tidak diketahui.
request_id `string` Identifier unik permintaan untuk pelacakan dan troubleshooting.
code `string` Kode kesalahan. Dikembalikan hanya untuk permintaan yang gagal. Lihat Kode kesalahan.
message `string` Pesan kesalahan detail. Dikembalikan hanya untuk permintaan yang gagal. Lihat Kode kesalahan.

Langkah 2: Tanyakan hasil berdasarkan ID task

Singapura

GET https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/api/v1/tasks/{task_id}

Saat melakukan panggilan, ganti WorkspaceId dengan Workspace ID yang sebenarnya.

China (Beijing)

GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}

Parameter permintaan	Hasil tugas kueri Ganti `{task_id}` dengan nilai `task_id` yang dikembalikan oleh panggilan API sebelumnya. `task_id` berlaku untuk kueri selama 24 jam. `curl -X GET https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/api/v1/tasks/{task_id} \ --header "Authorization: Bearer $DASHSCOPE_API_KEY"`
Header permintaan
Authorization `string` (Wajib) Mengotentikasi permintaan dengan Kunci API Model Studio. Contoh: Bearer sk-xxxx.
Parameter path URL
task_id `string` (Wajib) ID task.

Parameter respons	Task berhasil Data task, termasuk status task dan URL video, tersedia selama 24 jam lalu dihapus secara otomatis. Segera simpan video yang dihasilkan. { "request_id": "851985d0-fbba-9d8d-a17a-xxxxxx", "output": { "task_id": "208e2fd1-fcb4-4adf-9fcc-xxxxxx", "task_status": "SUCCEEDED", "submit_time": "2025-05-15 16:14:44.723", "scheduled_time": "2025-05-15 16:14:44.750", "end_time": "2025-05-15 16:20:09.389", "video_url": "https://dashscope-result-wlcb.oss-cn-wulanchabu.aliyuncs.com/xxx.mp4?xxxxxx", "orig_prompt": "In the video, a girl gracefully walks out from a misty, ancient forest. Her steps are light, and the camera captures her every nimble moment. When the girl stops and looks around at the lush woods, a smile of surprise and joy blossoms on her face. This scene, frozen in a moment of interplay between light and shadow, records her wonderful encounter with nature.", "actual_prompt": "A girl in a light-colored long dress slowly walks out from a misty, ancient forest, her steps as light as a dance. She has slightly curly long hair, a delicate face, and bright eyes. The camera follows her movements, capturing every nimble moment. When she stops, turns, and looks around at the lush woods, a smile of surprise and joy blossoms on her face. Sunlight filters through the leaves, casting mottled shadows and freezing this beautiful moment of harmony between human and nature. The style is a fresh and natural portrait, combining medium and full shots with a level perspective and slight camera movement." }, "usage": { "video_duration": 5, "video_ratio": "standard", "video_count": 1 } } Task gagal Saat task gagal, `task_status` bernilai FAILED dengan kode dan pesan kesalahan. Lihat Kode kesalahan. `{ "request_id": "e5d70b02-ebd3-98ce-9fe8-759d7d7b107d", "output": { "task_id": "86ecf553-d340-4e21-af6e-a0c6a421c010", "task_status": "FAILED", "code": "InvalidParameter", "message": "The size is not match xxxxxx" } }`
output `object` Informasi tentang output task. Properti task_id `string` ID task. Berlaku untuk kueri selama 24 jam. task_status `string` Status task. Nilai enumerasi PENDING RUNNING SUCCEEDED FAILED CANCELED UNKNOWN: Task tidak ada atau statusnya tidak diketahui. submit_time `string` Waktu saat task diajukan. Waktu dalam UTC+8 dan formatnya YYYY-MM-DD HH:mm:ss.SSS. scheduled_time `string` Waktu saat task dieksekusi. Waktu dalam UTC+8 dan formatnya YYYY-MM-DD HH:mm:ss.SSS. end_time `string` Waktu saat task selesai. Waktu dalam UTC+8 dan formatnya YYYY-MM-DD HH:mm:ss.SSS. video_url `string` URL video MP4 (H.264) yang dihasilkan. Tautan ini berlaku selama 24 jam. orig_prompt `string` Prompt input asli. actual_prompt `string` Prompt yang digunakan untuk generasi setelah penulisan ulang prompt. Bidang ini dikembalikan hanya jika penulisan ulang prompt diaktifkan. code `string` Kode kesalahan. Dikembalikan hanya untuk permintaan yang gagal. Lihat Kode kesalahan. message `string` Pesan kesalahan detail. Dikembalikan hanya untuk permintaan yang gagal. Lihat Kode kesalahan.
usage `object` Statistik output task. Hanya disediakan untuk task yang berhasil. Properti video_duration `integer` Durasi video yang dihasilkan dalam detik. video_ratio `string` Rasio aspek video yang dihasilkan. Nilainya selalu `standard`. video_count `integer` Jumlah video yang dihasilkan.
request_id `string` Identifier unik permintaan untuk pelacakan dan troubleshooting.

Batasan

Periode retensi data: ID task task_id dan URL video video_url hanya disimpan selama 24 jam. Setelah kedaluwarsa, Anda tidak dapat lagi menanyakan atau mengunduhnya.
Dukungan audio: Fitur ini saat ini hanya menghasilkan video tanpa suara. Untuk menghasilkan audio, gunakan Speech Synthesis.

Kode kesalahan

Jika pemanggilan model gagal dengan pesan kesalahan, lihat Kode kesalahan untuk troubleshooting.

FAQ

T: Bagaimana cara menambahkan daftar putih domain penyimpanan video?

J: Video yang dihasilkan oleh model disimpan di OSS. API mengembalikan URL publik sementara. Untuk mengonfigurasi daftar putih firewall untuk URL unduhan ini, perhatikan hal berikut: Penyimpanan dasar dapat berubah secara dinamis. Topik ini tidak menyediakan daftar putih nama domain OSS tetap untuk mencegah masalah akses akibat informasi yang kedaluwarsa. Jika Anda memiliki persyaratan kontrol keamanan, hubungi manajer akun Anda untuk mendapatkan daftar nama domain OSS terbaru.

Cakupan

Pemanggilan HTTP

Langkah 1: Buat task

Singapura

Beijing

Parameter permintaan

Multi-image reference

Video repainting

Local editing

Video extension

Video outpainting

Header permintaan

Body permintaan

Multi-image reference

Video repainting

Local editing

Video extension

Video outpainting

Parameter respons

Respons sukses

Respons error

Langkah 2: Tanyakan hasil berdasarkan ID task

Singapura

China (Beijing)

Parameter permintaan

Hasil tugas kueri

Header permintaan

Parameter path URL

Parameter respons

Task berhasil

Task gagal

Batasan

Kode kesalahan

FAQ

T: Bagaimana cara menambahkan daftar putih domain penyimpanan video?