All Products
Search
Document Center

Alibaba Cloud Model Studio:Wan - Referensi API Pengeditan Video Umum

Last Updated:Feb 27, 2026

Model pengeditan video umum Wan mendukung berbagai modalitas input—seperti teks, gambar, dan video—serta menjalankan berbagai tugas pembuatan dan pengeditan video.

Referensi: Panduan pengguna

Cakupan Penerapan

Untuk memastikan pemanggilan API berhasil, model, URL endpoint, dan kunci API harus berada di wilayah yang sama. Pemanggilan lintas-wilayah akan gagal.

Catatan

Kode contoh dalam topik ini berlaku untuk wilayah Singapura.

Pemanggilan HTTP

Tugas pengeditan video memerlukan waktu sekitar 5 hingga 10 menit, sehingga API menggunakan pemanggilan asinkron. Alur kerja lengkapnya terdiri dari dua langkah inti: Buat task → Poll hasilnya.

Langkah 1: Buat task untuk mendapatkan ID task

Singapura

POST https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis

Beijing

POST https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis

Parameter permintaan

Referensi multi-gambar

Kunci API untuk wilayah Singapura dan China (Beijing) berbeda. Untuk informasi selengkapnya, lihat Dapatkan kunci API dan host API
URL berikut ini untuk wilayah Singapura. Jika Anda menggunakan model di wilayah China (Beijing), ganti URL dengan: https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "image_reference",
        "prompt": "In the video, a girl gracefully walks out from a misty, ancient forest. Her steps are light, and the camera captures her every nimble moment. When she stops and looks around at the lush woods, a smile of surprise and joy blossoms on her face. This scene, frozen in a moment of interplay between light and shadow, records her wonderful encounter with nature.",
        "ref_images_url": [
            "http://wanx.alicdn.com/material/20250318/image_reference_2_5_16.png",
            "http://wanx.alicdn.com/material/20250318/image_reference_1_5_16.png"
        ]
    },
    "parameters": {
        "prompt_extend": true,
        "obj_or_bg": ["obj","bg"],
        "size": "1280*720"
    }
}'

Repainting video

Kunci API untuk wilayah Singapura dan China (Beijing) berbeda. Untuk informasi selengkapnya, lihat Dapatkan kunci API dan host API
URL berikut ini untuk wilayah Singapura. Jika Anda menggunakan model di wilayah China (Beijing), ganti URL dengan: https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_repainting",
        "prompt": "The video shows a black steampunk-style car driven by a gentleman. The car is decorated with gears and copper pipes. The background features a steam-powered candy factory and retro elements, creating a vintage and playful scene.",
        "video_url": "http://wanx.alicdn.com/material/20250318/video_repainting_1.mp4"
    },
    "parameters": {
        "prompt_extend": false,
        "control_condition": "depth"
    }
}'

Pengeditan lokal

Kunci API untuk wilayah Singapura dan China (Beijing) berbeda. Untuk informasi selengkapnya, lihat Dapatkan kunci API dan host API
URL berikut ini untuk wilayah Singapura. Jika Anda menggunakan model di wilayah China (Beijing), ganti URL dengan: https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_edit",
        "prompt": "The video shows a Parisian-style French cafe where a lion in a suit is elegantly sipping coffee. It holds a coffee cup in one hand, taking a gentle sip with a relaxed expression. The cafe is tastefully decorated, with soft hues and warm lighting illuminating the area where the lion is.",
        "mask_image_url": "http://wanx.alicdn.com/material/20250318/video_edit_1_mask.png",
        "video_url": "http://wanx.alicdn.com/material/20250318/video_edit_2.mp4",
        "mask_frame_id": 1
    },
    "parameters": {
        "prompt_extend": false,
        "mask_type": "tracking",
        "expand_ratio": 0.05
    }
}'

Ekstensi video

Kunci API untuk wilayah Singapura dan China (Beijing) berbeda. Untuk informasi selengkapnya, lihat Dapatkan kunci API dan host API
URL berikut ini untuk wilayah Singapura. Jika Anda menggunakan model di wilayah China (Beijing), ganti URL dengan: https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_extension",
        "prompt": "A dog wearing sunglasses is skateboarding on the street, 3D cartoon.",
        "first_clip_url": "http://wanx.alicdn.com/material/20250318/video_extension_1.mp4"
    },
    "parameters": {
        "prompt_extend": false
    }
}'

Outpainting video

Kunci API berbeda berdasarkan wilayah, seperti Singapura dan Beijing. Dapatkan kunci API
URL berikut ini untuk wilayah Singapura. Jika Anda menggunakan model di wilayah China (Beijing), ganti URL dengan: https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_outpainting",
        "prompt": "An elegant lady is passionately playing the violin, with a full symphony orchestra behind her.",
        "video_url": "http://wanx.alicdn.com/material/20250318/video_outpainting_1.mp4"
    },
    "parameters": {
        "prompt_extend": false,
        "top_scale": 1.5,
        "bottom_scale": 1.5,
        "left_scale": 1.5,
        "right_scale": 1.5
    }
}'
Header permintaan

Content-Type string (Wajib)

Tipe konten permintaan. Harus berupa application/json.

Authorization string (Wajib)

Kredensial otentikasi menggunakan Kunci API Model Studio.

Contoh: Bearer sk-xxxx

X-DashScope-Async string (Wajib)

Mengaktifkan pemrosesan asinkron. Harus diatur ke enable karena permintaan HTTP hanya mendukung pemrosesan asinkron.

Penting

Mengembalikan kesalahan "current user api does not support synchronous calls" jika tidak disertakan.

Body permintaan

Referensi multi-gambar

model string (Wajib)

Nama model. Contoh: wan2.1-vace-plus.

input object (Wajib)

Informasi input dasar, seperti prompt.

Properti

prompt string (Wajib)

Prompt yang menggambarkan elemen dan fitur visual yang diharapkan dalam video yang dihasilkan.

Mendukung bahasa Tionghoa dan Inggris. Setiap karakter, huruf, atau tanda baca dihitung sebagai satu karakter. Teks yang melebihi batas akan dipotong secara otomatis.

Untuk tips prompt, lihat Panduan prompt pembuatan video.

function string (Wajib)

Nama fitur. Untuk referensi multi-gambar, atur nilai ini ke image_reference.

Referensi multi-gambar mendukung hingga tiga gambar referensi. Konten gambar dapat mencakup entitas dan latar belakang, seperti orang, hewan, pakaian, dan pemandangan. Gunakan parameter prompt untuk menggambarkan konten video yang diinginkan. Model menggabungkan beberapa gambar untuk menghasilkan video yang koheren.

ref_images_url array[string] (Wajib)

Array URL gambar referensi input.

  1. URL publik:

    • Mendukung protokol HTTP dan HTTPS.

    • Contoh: https://xxx/xxx.mp3.

Anda dapat memberikan 1 hingga 3 gambar referensi. Jika lebih dari 3, hanya 3 gambar pertama yang digunakan.

Persyaratan gambar:

  • Format: JPG, JPEG, PNG, BMP, TIFF, atau WEBP.

  • Resolusi: Lebar dan tinggi harus antara 360 hingga 2.000 piksel.

  • Ukuran: Maksimum 10 MB.

  • URL tidak boleh mengandung karakter Tionghoa.

Tips penggunaan:

  • Jika menggunakan entitas dari gambar referensi, sertakan hanya satu entitas per gambar. Gunakan latar belakang berwarna solid—seperti putih atau warna tunggal—untuk lebih menonjolkan entitas tersebut.

  • Jika menggunakan latar belakang dari gambar referensi, gunakan maksimal satu gambar latar belakang, dan pastikan tidak mengandung objek entitas.

parameters object (Opsional)

Parameter pemrosesan video, seperti pengaturan watermark.

Properti

obj_or_bg array[string] (Opsional)

Mengidentifikasi tujuan setiap gambar referensi dan berkorespondensi satu-ke-satu dengan parameter ref_images_url. Setiap elemen menunjukkan apakah gambar yang sesuai merupakan referensi "entitas" atau "latar belakang":

  • obj: Menentukan gambar yang digunakan sebagai referensi entitas.

  • bg: Referensi latar belakang. Hanya satu referensi latar belakang yang diizinkan.

Petunjuk:

  • Kami merekomendasikan menyediakan parameter ini. Panjangnya harus sesuai dengan ref_images_url. Jika tidak, terjadi kesalahan.

  • Anda boleh mengabaikan parameter ini hanya ketika ref_images_url adalah array berisi satu elemen. Dalam kasus tersebut, nilai default-nya adalah ["obj"].

Contoh: ["obj", "obj", "bg"].

size string (Opsional)

Resolusi video output dalam format lebar*tinggi. Nilai yang didukung:

  • 1280*720 (default): Rasio aspek 16:9. 1280 adalah lebar; 720 adalah tinggi.

  • 720*1280: 9:16.

  • 960×960: Rasio aspek 1:1.

  • Resolusi 832*1088 menghasilkan rasio aspek video 3:4.

  • Resolusi 1088*832 memiliki rasio aspek video 4:3.

duration integer (Opsional)

Durasi video dalam detik. Tetap pada 5 dan tidak dapat diubah. Model selalu menghasilkan video berdurasi 5 detik.

prompt_extend bool (Opsional)

Apakah akan mengaktifkan penulisan ulang prompt. Jika diaktifkan, Large Language Model (LLM) akan menulis ulang prompt input. Ini meningkatkan kualitas untuk prompt pendek tetapi memperpanjang waktu pemrosesan.

  • true (default): Aktifkan penulisan ulang.

  • false: Nonaktifkan penulisan ulang.

seed integer (Opsional)

Seed acak yang mengontrol keacakan konten yang dihasilkan. Rentang valid: [0, 2147483647].

Jika diabaikan, algoritma akan menghasilkan seed acak secara otomatis. Untuk menghasilkan hasil yang relatif stabil, gunakan nilai seed yang sama.

watermark bool (Opsional)

Apakah akan menambahkan watermark ("AI Generated" di pojok kanan bawah).

  • false (default): Tanpa watermark.

  • true: Tambahkan watermark.

Repainting video

model string (Wajib)

Nama model. Contoh: wan2.1-vace-plus.

input object (Wajib)

Informasi input dasar, seperti prompt.

Properti

prompt string (Wajib)

Prompt yang menggambarkan elemen dan fitur visual yang diharapkan dalam video yang dihasilkan.

Mendukung bahasa Tionghoa dan Inggris. Setiap karakter, huruf, atau tanda baca dihitung sebagai satu karakter. Teks yang melebihi batas akan dipotong secara otomatis.

Untuk tips prompt, lihat Panduan prompt pembuatan video.

function string (Wajib)

Nama fitur. Untuk repainting video, atur nilai ini ke video_repainting.

Repainting video mengekstraksi pose dan gerakan entitas, kontur komposisi dan gerak, serta struktur sketsa dari video input. Kemudian menggabungkannya dengan prompt teks untuk menghasilkan video baru dengan fitur dinamis yang identik. Anda juga dapat mengganti entitas dalam video asli dengan gambar referensi—misalnya, mengubah penampilan karakter sambil mempertahankan gerakannya.

video_url string (Wajib)

URL video input.

  1. URL publik:

    • Mendukung protokol HTTP dan HTTPS.

    • Contoh: https://xxx/xxx.mp3.

Batasan video:

  • Format: MP4.

  • Laju frame: ≥ 16 FPS.

  • Ukuran: ≤ 50 MB.

  • Durasi: ≤ 5 detik. Jika lebih panjang, hanya 5 detik pertama yang digunakan.

  • URL tidak boleh mengandung karakter Tionghoa.

Resolusi video output:

  • Jika resolusi input ≤ 720P, output mempertahankan resolusi asli.

  • Jika resolusi input > 720P, output diskalakan ke ≤ 720P sambil mempertahankan rasio aspek.

Durasi video output:

  • Sesuai dengan durasi input, maksimal 5 detik.

  • Contoh: Input 3 detik menghasilkan output 3 detik. Input 6 detik menghasilkan 5 detik pertama.

ref_images_url array[string] (Opsional)

Array URL gambar referensi input.

  1. URL publik:

    • Mendukung protokol HTTP dan HTTPS.

    • Contoh: https://xxx/xxx.mp3.

Hanya 1 gambar referensi yang didukung. Kami merekomendasikan menggunakan gambar entitas untuk mengganti entitas dalam video input.

Persyaratan gambar:

  • Format: JPG, JPEG, PNG, BMP, TIFF, atau WEBP.

  • Resolusi: Lebar dan tinggi harus antara 360 hingga 2.000 piksel.

  • Ukuran: ≤ 10 MB.

  • URL tidak boleh mengandung karakter Tionghoa.

Tips penggunaan:

  • Jika menggunakan entitas dari gambar referensi, sertakan hanya satu entitas per gambar. Gunakan latar belakang berwarna solid—seperti putih atau warna tunggal—untuk lebih menonjolkan entitas tersebut.

parameters object (Wajib)

Parameter pemrosesan video, seperti pengaturan watermark.

Properti

control_condition string (Wajib)

Metode ekstraksi fitur video.

  • posebodyface: Mengekstraksi ekspresi wajah dan gerakan tubuh. Terbaik untuk skenario yang membutuhkan detail wajah halus.

  • posebody: Mengekstraksi gerakan tubuh saja (tanpa ekspresi wajah). Terbaik untuk mengontrol gerakan tubuh saja.

  • depth: Mengekstraksi kontur komposisi dan gerak.

  • scribble: Mengekstraksi struktur sketsa.

strength float (Opsional)

Menyesuaikan seberapa kuat metode control_condition memengaruhi video yang dihasilkan.

Default: 1.0. Rentang: [0.0, 1.0].

Nilai yang lebih tinggi membuat output lebih mirip gerakan dan komposisi video asli. Nilai yang lebih rendah memberikan lebih banyak kebebasan kreatif.

prompt_extend bool (Opsional)

Apakah akan mengaktifkan penulisan ulang prompt. Jika diaktifkan, LLM akan menulis ulang prompt input. Ini meningkatkan kualitas untuk prompt pendek tetapi memperpanjang waktu pemrosesan.

  • true (default): Aktifkan penulisan ulang.

  • false: Nonaktifkan penulisan ulang. (Direkomendasikan)

Jika deskripsi teks bertentangan dengan video input, model mungkin salah menafsirkan prompt. Untuk meningkatkan konsistensi dan akurasi, nonaktifkan penulisan ulang prompt dan berikan deskripsi yang jelas dan spesifik dalam prompt.

seed integer (Opsional)

Seed acak yang mengontrol keacakan konten yang dihasilkan. Rentang valid: [0, 2147483647].

Jika diabaikan, algoritma akan menghasilkan seed acak secara otomatis. Untuk menghasilkan hasil yang relatif stabil, gunakan nilai seed yang sama.

watermark bool (Opsional)

Apakah akan menambahkan watermark ("AI Generated" di pojok kanan bawah).

  • false (default): Tanpa watermark.

  • true: Tambahkan watermark.

Pengeditan lokal

model string (Wajib)

Nama model. Contoh: wan2.1-vace-plus.

input object (Wajib)

Informasi input dasar, seperti prompt.

Properti

prompt string (Wajib)

Prompt yang menggambarkan elemen dan fitur visual yang diharapkan dalam video yang dihasilkan.

Mendukung bahasa Tionghoa dan Inggris. Setiap karakter, huruf, atau tanda baca dihitung sebagai satu karakter. Teks yang melebihi batas akan dipotong secara otomatis.

Untuk tips prompt, lihat Panduan prompt pembuatan video.

function string (Wajib)

Nama fitur. Untuk pengeditan lokal, atur nilai ini ke video_edit.

Pengeditan lokal memungkinkan Anda menambah, memodifikasi, atau menghapus elemen di area tertentu video input. Anda juga dapat mengganti entitas atau latar belakang di area tersebut untuk kontrol detail halus.

video_url string (Wajib)

URL video input.

  1. URL publik:

    • Mendukung protokol HTTP dan HTTPS.

    • Contoh: https://xxx/xxx.mp3.

Batasan video:

  • Format: MP4.

  • Laju frame: ≥ 16 FPS.

  • Ukuran: ≤ 50 MB.

  • Durasi: ≤ 5 detik. Jika lebih panjang, hanya 5 detik pertama yang digunakan.

  • URL tidak boleh mengandung karakter Tionghoa.

Resolusi video output:

  • Jika resolusi input ≤ 720P, output mempertahankan resolusi asli.

  • Jika resolusi input > 720P, output diskalakan ke ≤ 720P sambil mempertahankan rasio aspek.

Durasi video output:

  • Sesuai dengan durasi input, maksimal 5 detik.

  • Contoh: Input 3 detik menghasilkan output 3 detik. Input 6 detik menghasilkan 5 detik pertama.

ref_images_url array[string] (Opsional)

Array URL gambar referensi input.

  1. URL publik:

    • Mendukung protokol HTTP dan HTTPS.

    • Contoh: https://xxx/xxx.mp3.

Hanya 1 gambar referensi yang didukung. Anda dapat menggunakannya sebagai entitas atau latar belakang untuk mengganti konten yang sesuai dalam video input.

Persyaratan gambar:

  • Format: JPG, JPEG, PNG, BMP, TIFF, atau WEBP.

  • Resolusi: Lebar dan tinggi harus antara 360 hingga 2.000 piksel.

  • Ukuran: ≤ 10 MB.

  • URL tidak boleh mengandung karakter Tionghoa.

Tips penggunaan:

  • Jika menggunakan entitas dari gambar referensi, sertakan hanya satu entitas per gambar. Gunakan latar belakang berwarna solid—seperti putih atau warna tunggal—untuk lebih menonjolkan entitas tersebut.

  • Jika menggunakan latar belakang dari gambar referensi, pastikan tidak mengandung objek entitas.

mask_image_url string (Opsional)

URL gambar mask.

  1. URL publik:

    • Mendukung protokol HTTP dan HTTPS.

    • Contoh: https://xxx/xxx.mp3.

Parameter ini menentukan area pengeditan video. Tentukan salah satu parameter ini atau mask_video_url. Kami merekomendasikan parameter ini.

Area putih pada gambar mask (nilai piksel tepat [255, 255, 255]) menandai area yang akan diedit. Area hitam (nilai piksel tepat [0, 0, 0]) menandai area yang dipertahankan.

Persyaratan gambar:

  • Format: JPG, JPEG, PNG, BMP, TIFF, atau WEBP.

  • Resolusi: Harus persis sesuai dengan resolusi video input (video_url).

  • Ukuran: ≤ 10 MB.

  • URL tidak boleh mengandung karakter Tionghoa.

mask_frame_id integer (Opsional)

Parameter ini hanya berlaku ketika mask_image_url tidak kosong. Parameter ini mengidentifikasi nomor frame tempat objek yang dimask muncul.

Default: 1 (frame pertama).

Rentang valid: [1, max_frame_id], dengan max_frame_id = laju frame video input × durasi video input + 1.

Contohnya, jika video input (video_url) memiliki laju frame 16 FPS dan durasi 5 detik, total framenya adalah 81 (16×5+1). Jadi max_frame_id = 81.

mask_video_url string (Opsional)

URL video mask.

  1. URL publik:

    • Mendukung protokol HTTP dan HTTPS.

    • Contoh: https://xxx/xxx.mp3.

Parameter ini menentukan area pengeditan video. Tentukan salah satu parameter ini atau mask_image_url.

Video mask harus sesuai dengan video input (video_url) dalam format, laju frame, resolusi, dan durasi.

Area putih pada video mask (nilai piksel tepat [255, 255, 255]) menandai area yang akan diedit. Area hitam (nilai piksel tepat [0, 0, 0]) menandai area yang dipertahankan.

parameters object (Opsional)

Parameter pemrosesan video, seperti pengaturan watermark.

Properti

control_condition string (Opsional)

Metode ekstraksi fitur video. Default: "" (tanpa ekstraksi).

  • posebodyface: Mengekstraksi ekspresi wajah dan gerakan tubuh. Terbaik ketika wajah entitas menempati sebagian besar frame dan fiturnya terlihat jelas.

  • depth: Mengekstraksi kontur komposisi dan gerak.

mask_type string (Opsional)

Parameter ini hanya berlaku ketika mask_image_url tidak kosong. Parameter ini menentukan perilaku area pengeditan.

  • tracking (default): Area pengeditan mengikuti lintasan gerak objek target. Terbaik untuk objek bergerak.

  • fixed: Area pengeditan tetap dan tidak berubah seiring konten video.

expand_ratio float (Opsional)

Parameter ini hanya berlaku ketika mask_type adalah tracking. Parameter ini mengatur rasio ekspansi keluar area mask.

Rentang: [0.0, 1.0]. Default: 0.05. Direkomendasikan.

Nilai yang lebih kecil membuat mask lebih pas pada objek target. Nilai yang lebih besar memperluas mask lebih luas.

expand_mode string (Opsional)

Parameter ini hanya berlaku ketika mask_type adalah tracking. Parameter ini menentukan bentuk area mask.

Algoritma menghasilkan video mask dengan bentuk yang dipilih berdasarkan gambar mask input dan expand_mode. Nilai yang didukung:

  • hull (default): Mode poligon. Poligon membungkus objek yang dimask.

  • bbox: Mode bounding box. Persegi panjang membungkus objek yang dimask.

  • original: Mode mentah. Mempertahankan bentuk mask asli sebanyak mungkin.

size string (Opsional)

Resolusi video output dalam format lebar*tinggi. Nilai yang didukung:

  • 1280*720 (default): Rasio aspek 16:9. 1280 adalah lebar; 720 adalah tinggi.

  • 720*1280: 9:16.

  • 960×960: Rasio aspek 1:1.

  • Resolusi 832*1088 menghasilkan rasio aspek video 3:4.

  • Resolusi 1088*832 memiliki rasio aspek video 4:3.

duration integer (Opsional)

Durasi video dalam detik. Tetap pada 5 dan tidak dapat diubah. Model selalu menghasilkan video berdurasi 5 detik.

prompt_extend bool (Opsional)

Apakah akan mengaktifkan penulisan ulang prompt. Jika diaktifkan, LLM akan menulis ulang prompt input. Ini meningkatkan kualitas untuk prompt pendek tetapi memperpanjang waktu pemrosesan.

  • true (default): Aktifkan penulisan ulang.

  • false: Nonaktifkan penulisan ulang. (Direkomendasikan)

Jika deskripsi teks bertentangan dengan video input, model mungkin salah menafsirkan prompt. Untuk meningkatkan konsistensi dan akurasi, nonaktifkan penulisan ulang prompt dan berikan deskripsi yang jelas dan spesifik dalam prompt.

seed integer (Opsional)

Seed acak yang mengontrol keacakan konten yang dihasilkan. Rentang valid: [0, 2147483647].

Jika diabaikan, algoritma akan menghasilkan seed acak secara otomatis. Untuk menghasilkan hasil yang relatif stabil, gunakan nilai seed yang sama.

watermark bool (Opsional)

Apakah akan menambahkan watermark ("AI Generated" di pojok kanan bawah).

  • false (default): Tanpa watermark.

  • true: Tambahkan watermark.

Ekstensi video

model string (Wajib)

Nama model. Contoh: wan2.1-vace-plus.

input object (Wajib)

Informasi input dasar, seperti prompt.

Properti

prompt string (Wajib)

Prompt yang menggambarkan elemen dan fitur visual yang diharapkan dalam video yang dihasilkan.

Mendukung bahasa Tionghoa dan Inggris. Setiap karakter, huruf, atau tanda baca dihitung sebagai satu karakter. Teks yang melebihi batas akan dipotong secara otomatis.

Untuk tips prompt, lihat Panduan prompt pembuatan video.

function string (Wajib)

Nama fitur. Untuk ekstensi video, atur nilai ini ke video_extension.

Ekstensi video menghasilkan konten berkelanjutan dari gambar atau video. Fitur ini juga mengekstraksi fitur dinamis—seperti gerakan dan komposisi—dari video referensi untuk memandu pembuatan video baru dengan gerakan serupa.

Video yang diperluas memiliki durasi total 5 detik. Catatan: Ini adalah durasi penuh video output akhir—bukan tambahan 5 detik pada video asli.

first_frame_url string (Opsional)

URL gambar frame pertama.

  1. URL publik:

    • Mendukung protokol HTTP dan HTTPS.

    • Contoh: https://xxx/xxx.mp3.

Persyaratan gambar:

  • Format: JPG, JPEG, PNG, BMP, TIFF, atau WEBP.

  • Resolusi: Lebar dan tinggi harus antara 360 hingga 2.000 piksel.

  • Ukuran: ≤ 10 MB.

  • URL tidak boleh mengandung karakter Tionghoa.

last_frame_url string(Opsional)

URL gambar frame terakhir.

  1. URL publik:

    • Mendukung protokol HTTP dan HTTPS.

    • Contoh: https://xxx/xxx.mp3.

Persyaratan gambar:

  • Format: JPG, JPEG, PNG, BMP, TIFF, atau WEBP.

  • Resolusi: Lebar dan tinggi harus antara 360 hingga 2.000 piksel.

  • Ukuran: ≤ 10 MB.

  • URL tidak boleh mengandung karakter Tionghoa.

first_clip_url string (Opsional)

URL segmen video pertama.

  1. URL publik:

    • Mendukung protokol HTTP dan HTTPS.

    • Contoh: https://xxx/xxx.mp3.

Persyaratan video:

  • Format: MP4.

  • Laju frame: ≥ 16 FPS. Jika menggunakan first_clip_url dan last_clip_url bersamaan, pertahankan laju frame yang konsisten.

  • Ukuran: ≤ 50 MB.

  • Durasi video: Tidak boleh melebihi 3 detik. Jika durasi lebih panjang, hanya 3 detik pertama yang digunakan. Jika first_clip_url dan last_clip_url keduanya ditentukan, durasi gabungannya tidak boleh melebihi 3 detik.

  • URL tidak boleh mengandung karakter Tionghoa.

Resolusi video output:

  • Jika resolusi input ≤ 720P, output mempertahankan resolusi asli.

  • Jika resolusi input > 720P, output diskalakan ke ≤ 720P sambil mempertahankan rasio aspek.

last_clip_url string(Opsional)

URL segmen video terakhir.

  1. URL publik:

    • Mendukung protokol HTTP dan HTTPS.

    • Contoh: https://help-static-aliyun-doc.aliyuncs.com/xxx.mp3.

Persyaratan video:

  • Format: MP4.

  • Laju frame: ≥ 16 FPS. Jika menggunakan first_clip_url dan last_clip_url bersamaan, pertahankan laju frame yang konsisten.

  • Ukuran: ≤ 50 MB.

  • Durasi video: Tidak boleh melebihi 3 detik. Jika durasi lebih panjang, hanya 3 detik pertama yang digunakan. Jika first_clip_url dan last_clip_url keduanya ditentukan, durasi gabungannya tidak boleh melebihi 3 detik.

  • URL tidak boleh mengandung karakter Tionghoa.

Resolusi video output:

  • Jika resolusi input ≤ 720P, output mempertahankan resolusi asli.

  • Jika resolusi input > 720P, output diskalakan ke ≤ 720P sambil mempertahankan rasio aspek.

video_url string (Opsional)

URL video input.

  1. URL publik:

    • Mendukung protokol HTTP dan HTTPS.

    • Contoh: https://help-static-aliyun-doc.aliyuncs.com/xxx.mp3.

Video ini digunakan untuk mengekstraksi fitur gerak. Video ini bekerja bersama first_frame_url, last_frame_url, first_clip_url, dan last_clip_url untuk memandu pembuatan video yang diperluas dengan gerakan serupa.

Persyaratan video:

  • Format: MP4.

  • Laju frame: ≥ 16 FPS, konsisten dengan klip yang berdekatan.

  • Resolusi: Konsisten dengan frame dan klip yang berdekatan.

  • Ukuran: ≤ 50 MB.

  • Durasi: ≤ 5 detik. Jika lebih panjang, hanya 5 detik pertama yang digunakan.

  • URL tidak boleh mengandung karakter Tionghoa.

parameters object (Opsional)

Parameter pemrosesan video, seperti resolusi output.

Properti

control_condition string (Opsional)

Metode ekstraksi fitur video. Wajib saat video_url disediakan. Default: "" (tanpa ekstraksi).

  • posebodyface: Mengekstraksi ekspresi wajah dan gerakan tubuh.

  • depth: Mengekstraksi kontur komposisi dan gerak.

duration integer (Opsional)

Durasi video dalam detik. Tetap pada 5 dan tidak dapat diubah. Model selalu menghasilkan video berdurasi 5 detik.

prompt_extend bool (Opsional)

Apakah akan mengaktifkan penulisan ulang prompt. Jika diaktifkan, LLM akan menulis ulang prompt input. Ini meningkatkan kualitas untuk prompt pendek tetapi memperpanjang waktu pemrosesan.

  • true (default): Aktifkan penulisan ulang.

  • false: Nonaktifkan penulisan ulang. (Direkomendasikan)

Jika deskripsi teks bertentangan dengan video input, model mungkin salah menafsirkan prompt. Untuk meningkatkan konsistensi dan akurasi, nonaktifkan penulisan ulang prompt dan berikan deskripsi yang jelas dan spesifik dalam prompt.

seed integer (Opsional)

Seed acak yang mengontrol keacakan konten yang dihasilkan. Rentang valid: [0, 2147483647].

Jika diabaikan, algoritma akan menghasilkan seed acak secara otomatis. Untuk menghasilkan hasil yang relatif stabil, gunakan nilai seed yang sama.

watermark bool (Opsional)

Apakah akan menambahkan watermark ("AI Generated" di pojok kanan bawah).

  • false (default): Tanpa watermark.

  • true: Tambahkan watermark.

Outpainting video

model string (Wajib)

Nama model. Contoh: wan2.1-vace-plus.

input object (Wajib)

Informasi input dasar, seperti prompt.

Properti

prompt string (Wajib)

Prompt yang menggambarkan elemen dan fitur visual yang diharapkan dalam video yang dihasilkan.

Mendukung bahasa Tionghoa dan Inggris. Setiap karakter, huruf, atau tanda baca dihitung sebagai satu karakter. Teks yang melebihi batas akan dipotong secara otomatis.

Untuk tips prompt, lihat Panduan prompt pembuatan video.

function string (Wajib)

Nama fitur. Untuk outpainting video, atur nilai ini ke video_outpainting.

Outpainting video memperluas video secara proporsional ke arah atas, bawah, kiri, dan kanan.

video_url string (Wajib)

URL video input.

  1. URL publik:

    • Mendukung protokol HTTP dan HTTPS.

    • Contoh: https://xxx/xxx.mp3.

Batasan video:

  • Format: MP4.

  • Laju frame: ≥ 16 FPS.

  • Ukuran: ≤ 50 MB.

  • Durasi: ≤ 5 detik. Jika lebih panjang, hanya 5 detik pertama yang digunakan.

  • URL tidak boleh mengandung karakter Tionghoa.

Resolusi video output:

  • Jika resolusi input ≤ 720P, output mempertahankan resolusi asli.

  • Jika resolusi input > 720P, output diskalakan ke ≤ 720P sambil mempertahankan rasio aspek.

Durasi video output:

  • Sesuai dengan durasi input, maksimal 5 detik.

  • Contoh: Input 3 detik menghasilkan output 3 detik. Input 6 detik menghasilkan 5 detik pertama.

parameters object (Opsional)

Parameter pemrosesan video, seperti rasio penskalaan.

Properti

top_scale float (Opsional)

Memusatkan frame video dan menskalakan ke atas secara proporsional.

Rentang: [1.0, 2.0]. Default: 1.0 (tanpa penskalaan).

bottom_scale float (Opsional)

Memusatkan frame video dan menskalakan ke bawah secara proporsional.

Rentang: [1.0, 2.0]. Default: 1.0 (tanpa penskalaan).

left_scale float (Opsional)

Memusatkan frame video dan menskalakan ke kiri secara proporsional.

Rentang: [1.0, 2.0]. Default: 1.0 (tanpa penskalaan).

right_scale float (Opsional)

Memusatkan frame video dan menskalakan ke kanan secara proporsional.

Rentang: [1.0, 2.0]. Default: 1.0 (tanpa penskalaan).

duration integer (Opsional)

Durasi video dalam detik. Tetap pada 5 dan tidak dapat diubah. Model selalu menghasilkan video berdurasi 5 detik.

prompt_extend bool (Opsional)

Apakah akan mengaktifkan penulisan ulang prompt. Jika diaktifkan, LLM akan menulis ulang prompt input. Ini meningkatkan kualitas untuk prompt pendek tetapi memperpanjang waktu pemrosesan.

  • true (default): Aktifkan penulisan ulang.

  • false: Nonaktifkan penulisan ulang. (Direkomendasikan)

Jika deskripsi teks bertentangan dengan video input, model mungkin salah menafsirkan prompt. Untuk meningkatkan konsistensi dan akurasi, nonaktifkan penulisan ulang prompt dan berikan deskripsi yang jelas dan spesifik dalam prompt.

seed integer (Opsional)

Seed acak yang mengontrol keacakan konten yang dihasilkan. Rentang valid: [0, 2147483647].

Jika diabaikan, algoritma akan menghasilkan seed acak secara otomatis. Untuk menghasilkan hasil yang relatif stabil, gunakan nilai seed yang sama.

watermark bool (Opsional)

Apakah akan menambahkan watermark ("AI Generated" di pojok kanan bawah).

  • false (default): Tanpa watermark.

  • true: Tambahkan watermark.

Parameter respons

Respons sukses

Simpan task_id untuk menanyakan status dan hasil task.

{
    "output": {
        "task_status": "PENDING",
        "task_id": "0385dc79-5ff8-4d82-bcb6-xxxxxx"
    },
    "request_id": "4909100c-7b5a-9f92-bfe5-xxxxxx"
}

Respons kesalahan

Pembuatan task gagal. Lihat kode kesalahan untuk mengatasi masalah.

{
    "code": "InvalidApiKey",
    "message": "No API-key provided.",
    "request_id": "7438d53d-6eb8-4596-8835-xxxxxx"
}

output object

Informasi output task.

Properti

task_id string

ID task. Dapat digunakan untuk menanyakan task hingga 24 jam.

task_status string

Status task.

Enumerasi

  • PENDING

  • RUNNING

  • SUCCEEDED

  • FAILED

  • CANCELED

  • UNKNOWN: Task tidak ada atau status tidak diketahui

request_id string

Pengidentifikasi unik untuk permintaan. Gunakan untuk pelacakan dan troubleshooting masalah.

code string

Kode kesalahan. Dikembalikan hanya ketika permintaan gagal. Lihat kode kesalahan untuk detailnya.

message string

Pesan kesalahan detail. Dikembalikan hanya ketika permintaan gagal. Lihat kode kesalahan untuk detailnya.

Langkah 2: Tanyakan hasil menggunakan ID task

Singapura

GET https://dashscope-intl.aliyuncs.com/api/v1/tasks/{task_id}

Beijing

GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}

Parameter permintaan

Hasil Tugas Kueri

Ganti {task_id} dengan nilai task_id yang dikembalikan oleh pemanggilan API sebelumnya.

curl -X GET https://dashscope-intl.aliyuncs.com/api/v1/tasks/{task_id} \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"
Header permintaan

Authorization string (Wajib)

Kredensial otentikasi menggunakan Kunci API Model Studio.

Contoh: Bearer sk-xxxx

Parameter path URL

task_id string (Wajib)

ID task yang akan ditanyakan.

Parameter respons

Task berhasil

Data task—termasuk status dan URL video—hanya disimpan selama 24 jam lalu dihapus secara otomatis. Segera simpan video yang dihasilkan.

{
    "request_id": "851985d0-fbba-9d8d-a17a-xxxxxx",
    "output": {
        "task_id": "208e2fd1-fcb4-4adf-9fcc-xxxxxx",
        "task_status": "SUCCEEDED",
        "submit_time": "2025-05-15 16:14:44.723",
        "scheduled_time": "2025-05-15 16:14:44.750",
        "end_time": "2025-05-15 16:20:09.389",
        "video_url": "https://dashscope-result-wlcb.oss-cn-wulanchabu.aliyuncs.com/xxx.mp4?xxxxxx",
        "orig_prompt": "In the video, a girl gracefully walks out from a misty, ancient forest. Her steps are light, and the camera captures her every nimble moment. When the girl stops and looks around at the lush woods, a smile of surprise and joy blossoms on her face. This scene, frozen in a moment of interplay between light and shadow, records her wonderful encounter with nature.",
        "actual_prompt": "A girl in a light-colored long dress slowly walks out from a misty, ancient forest, her steps as light as a dance. She has slightly curly long hair, a delicate face, and bright eyes. The camera follows her movements, capturing every nimble moment. When she stops, turns, and looks around at the lush woods, a smile of surprise and joy blossoms on her face. Sunlight filters through the leaves, casting mottled shadows and freezing this beautiful moment of harmony between human and nature. The style is a fresh and natural portrait, combining medium and full shots with a level perspective and slight camera movement."
    },
    "usage": {
        "video_duration": 5,
        "video_ratio": "standard",
        "video_count": 1
    }
}

Task gagal

Saat task gagal, task_status diatur ke FAILED dengan kode dan pesan kesalahan. Lihat kode kesalahan untuk mengatasi masalah.

{
    "request_id": "e5d70b02-ebd3-98ce-9fe8-759d7d7b107d",
    "output": {
        "task_id": "86ecf553-d340-4e21-af6e-a0c6a421c010",
        "task_status": "FAILED",
        "code": "InvalidParameter",
        "message": "The size is not match xxxxxx"
    }
}

output object

Informasi output task.

Properti

task_id string

ID task. Dapat digunakan untuk menanyakan task hingga 24 jam.

task_status string

Status task.

Enumerasi

  • PENDING

  • RUNNING

  • SUCCEEDED

  • FAILED

  • CANCELED

  • UNKNOWN: Task tidak ada atau status tidak diketahui

submit_time string

Waktu saat task diajukan. Waktu dalam UTC+8. Format: YYYY-MM-DD HH:mm:ss.SSS.

scheduled_time string

Waktu saat task mulai berjalan. Waktu dalam UTC+8. Format: YYYY-MM-DD HH:mm:ss.SSS.

end_time string

Waktu saat task selesai. Waktu dalam UTC+8. Format: YYYY-MM-DD HH:mm:ss.SSS.

video_url string

URL video. Berlaku selama 24 jam. Unduh video menggunakan URL ini. Format output: MP4 (encoding H.264).

orig_prompt string

Prompt input asli.

actual_prompt string

Prompt yang digunakan setelah penulisan ulang prompt diaktifkan. Tidak dikembalikan jika penulisan ulang prompt dinonaktifkan.

code string

Kode kesalahan. Dikembalikan hanya ketika permintaan gagal. Lihat kode kesalahan untuk detailnya.

message string

Pesan kesalahan detail. Dikembalikan hanya ketika permintaan gagal. Lihat kode kesalahan untuk detailnya.

usage object

Statistik output. Dihitung hanya untuk task yang berhasil.

Properti

video_duration integer

Durasi video yang dihasilkan dalam detik.

video_ratio string

Rasio aspek video yang dihasilkan. Tetap pada standard.

video_count integer

Jumlah video yang dihasilkan.

request_id string

Pengidentifikasi unik untuk permintaan. Gunakan untuk pelacakan dan troubleshooting masalah.

Batasan

  • Validitas data: task_id dan video_url video hanya berlaku selama 24 jam. Setelah kedaluwarsa, tidak dapat ditanyakan atau diunduh.

  • Dukungan audio: Model saat ini menghasilkan video tanpa suara dan tidak mendukung output audio. Jika diperlukan, hasilkan audio menggunakan sintesis suara.

Kode kesalahan

Jika pemanggilan model gagal dan mengembalikan pesan kesalahan, lihat Pesan kesalahan untuk troubleshooting.

FAQ

Q: Bagaimana cara mendapatkan daftar putih nama domain untuk penyimpanan video?