リクエストパラメーター | 複数画像参照シンガポールリージョンと中国 (北京) リージョンの API キーは異なります。詳細については、「API キーと API ホストの取得 次の URL はシンガポールリージョン用です。中国 (北京) リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis に置き換えてください。 curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
"model": "wan2.1-vace-plus",
"input": {
"function": "image_reference",
"prompt": "In the video, a girl gracefully walks out from a misty, ancient forest. Her steps are light, and the camera captures her every nimble moment. When she stops and looks around at the lush woods, a smile of surprise and joy blossoms on her face. This scene, frozen in a moment of interplay between light and shadow, records her wonderful encounter with nature.",
"ref_images_url": [
"http://wanx.alicdn.com/material/20250318/image_reference_2_5_16.png",
"http://wanx.alicdn.com/material/20250318/image_reference_1_5_16.png"
]
},
"parameters": {
"prompt_extend": true,
"obj_or_bg": ["obj","bg"],
"size": "1280*720"
}
}'
ビデオ再描画シンガポールリージョンと中国 (北京) リージョンの API キーは異なります。詳細については、「API キーと API ホストの取得 次の URL はシンガポールリージョン用です。中国 (北京) リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis に置き換えてください。 curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
"model": "wan2.1-vace-plus",
"input": {
"function": "video_repainting",
"prompt": "The video shows a black steampunk-style car driven by a gentleman. The car is decorated with gears and copper pipes. The background features a steam-powered candy factory and retro elements, creating a vintage and playful scene.",
"video_url": "http://wanx.alicdn.com/material/20250318/video_repainting_1.mp4"
},
"parameters": {
"prompt_extend": false,
"control_condition": "depth"
}
}'
ローカル編集シンガポールリージョンと中国 (北京) リージョンの API キーは異なります。詳細については、「API キーと API ホストの取得 次の URL はシンガポールリージョン用です。中国 (北京) リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis に置き換えてください。 curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
"model": "wan2.1-vace-plus",
"input": {
"function": "video_edit",
"prompt": "The video shows a Parisian-style French cafe where a lion in a suit is elegantly sipping coffee. It holds a coffee cup in one hand, taking a gentle sip with a relaxed expression. The cafe is tastefully decorated, with soft hues and warm lighting illuminating the area where the lion is.",
"mask_image_url": "http://wanx.alicdn.com/material/20250318/video_edit_1_mask.png",
"video_url": "http://wanx.alicdn.com/material/20250318/video_edit_2.mp4",
"mask_frame_id": 1
},
"parameters": {
"prompt_extend": false,
"mask_type": "tracking",
"expand_ratio": 0.05
}
}'
ビデオ拡張シンガポールリージョンと中国 (北京) リージョンの API キーは異なります。詳細については、「API キーと API ホストの取得 次の URL はシンガポールリージョン用です。中国 (北京) リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis に置き換えてください。 curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
"model": "wan2.1-vace-plus",
"input": {
"function": "video_extension",
"prompt": "A dog wearing sunglasses is skateboarding on the street, 3D cartoon.",
"first_clip_url": "http://wanx.alicdn.com/material/20250318/video_extension_1.mp4"
},
"parameters": {
"prompt_extend": false
}
}'
ビデオアウトペインティングシンガポールリージョンと中国 (北京) リージョンの API キーは異なります。詳細については、「API キーと API ホストの取得 次の URL はシンガポールリージョン用です。中国 (北京) リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis に置き換えてください。 curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
"model": "wan2.1-vace-plus",
"input": {
"function": "video_outpainting",
"prompt": "An elegant lady is passionately playing the violin, with a full symphony orchestra behind her.",
"video_url": "http://wanx.alicdn.com/material/20250318/video_outpainting_1.mp4"
},
"parameters": {
"prompt_extend": false,
"top_scale": 1.5,
"bottom_scale": 1.5,
"left_scale": 1.5,
"right_scale": 1.5
}
}'
|
リクエストヘッダー |
Content-Type string (必須) リクエストのコンテンツタイプ。 application/json である必要があります。 |
Authorization string (必須) Model Studio API キーを使用した認証情報。 例: Bearer sk-xxxx |
X-DashScope-Async string (必須) 非同期処理を有効にします。HTTP リクエストは非同期処理にのみ対応しているため、enable に設定する必要があります。
重要 このヘッダーを含めないと、「current user api does not support synchronous calls」というエラーが返されます。 |
リクエストボディ |
複数画像参照model string (必須) モデル名。例: wan2.1-vace-plus。 input object (必須) プロンプトなどの基本的な入力情報。 プロパティ prompt string (必須) ビデオの要素と視覚的特徴を記述するテキスト。中国語と英語をサポートしています。各文字、アルファベット、句読点は 1 文字としてカウントされます。制限を超えたテキストは切り捨てられます。 プロンプト技術の詳細については、「ビデオ生成プロンプトガイド」をご参照ください。 function string (必須) 機能名です。複数イメージのリファレンスには、 image_reference をセットします。 最大 3 つのリファレンスイメージに対応しています。イメージコンテンツには、エンティティ (人物、動物、衣服) やバックグラウンド (シーン) を含めることができます。プロンプトを使用して、目的のビデオコンテンツを記述します。モデルはイメージをマージして、一貫性のあるビデオを生成します。 ref_images_url array[string] (必須) 参照画像の URL。 パブリック URL:
1〜3 枚の参照画像を提供します。3 枚を超えて提供された場合、最初の 3 枚のみが使用されます。 参照画像の要件: 推奨事項: | parameters object (任意) ウォーターマーク設定などのビデオ処理パラメーター。 プロパティ obj_or_bg array[string] (任意) 各リファレンスイメージの目的を識別します (ref_images_url と 1 対 1 で対応)。各要素は、対応するイメージが「エンティティ」か「バックグラウンド」かを示します: 説明: 例: ["obj", "obj", "bg"]。 size string (任意) ビデオ解像度は width*height フォーマットです。使用可能な値: 1280*720 (デフォルト): 16:9。
720*1280: 9:16。
960*960: 1:1。
832*1088: 3:4。
1088*832: 4:3。
duration integer (任意) ビデオの持続時間 (秒)。5 に固定されており、変更できません。モデルは常に 5 秒のビデオを生成します。 prompt_extend bool (任意) プロンプトリライトを有効にするかどうか。LLM が入力プロンプトを書き換えることで、短いプロンプトの品質を向上させますが、処理時間は長くなります。 seed integer (任意) 生成のランダム性を制御するランダムシード。範囲: [0, 2147483647]。 省略した場合は自動生成されます。一貫した結果を得るには、同じシードを使用してください。 watermark bool (任意) ウォーターマーク (右下に「AI Generated」) を追加するかどうか。 |
ビデオ再描画model string (必須) モデル名。例: wan2.1-vace-plus。 input object (必須) プロンプトなどの基本的な入力情報。 プロパティ prompt string (必須) ビデオの要素と視覚的特徴を記述するテキスト。中国語と英語をサポートしています。各文字、アルファベット、句読点は 1 文字としてカウントされます。制限を超えたテキストは切り捨てられます。 プロンプト技術の詳細については、「ビデオ生成プロンプトガイド」をご参照ください。 function string (必須) 機能名。動画の再塗装には、video_repainting を設定します。 入力ビデオからエンティティのポーズ、アクション、構図、モーション輪郭、スケッチ構造を抽出し、テキストプロンプトと組み合わせて、同じ動的特徴を持つ新しいビデオを生成します。また、参照画像でエンティティを置き換えて、アクションを維持しながら外観を変更することもできます。 video_url string (必須) 入力ビデオの URL。 パブリック URL:
入力ビデオの要件: 出力ビデオの解像度について: 出力ビデオの持続時間について: ref_images_url array[string] (任意) 入力参照画像の URL の配列。 パブリック URL:
参照画像は 1 枚のみサポートされます。この画像は、入力ビデオのエンティティを置き換えるために使用されるエンティティ画像にすることを推奨します。 画像の要件: 推奨事項: | parameters object (必須) ウォーターマーク設定などのビデオ処理パラメーター。 プロパティ control_condition string (必須) ビデオの特徴抽出方法を設定します。 posebodyface: 入力ビデオ内のエンティティの表情と身体の動きを抽出します。これは、顔の詳細を保持する必要があるシナリオに適しています。
posebody: 入力ビデオからエンティティの身体の動きを抽出します (表情は除く)。身体の動きのみを制御する必要があるシナリオで使用します。
depth: 入力ビデオから構図とモーション輪郭を抽出します。
scribble: 入力ビデオからスケッチ構造を抽出します。
strength float (任意) control_condition 特徴抽出メソッドが生成されたビデオに適用するコントロールの強度を調整します。
デフォルト値は 1.0 です。値の範囲は [0.0, 1.0] です。 値が大きいほど、生成されるビデオは元のビデオのアクションや構図に近くなります。値が小さいほど、より創造的な自由度が高まります。 prompt_extend bool (任意) プロンプトリライトを有効にするかどうかを指定します。有効にすると、LLM が入力プロンプトを書き換えます。これにより、短いプロンプトの生成品質が大幅に向上する可能性がありますが、処理時間は長くなります。 テキストによる説明が入力ビデオコンテンツと一致しない場合、モデルがプロンプトを誤って解釈する可能性があります。生成の一貫性と精度を向上させるには、プロンプトリライトを無効にし、prompt に明確で具体的な説明を提供してください。 seed integer (任意) 生成のランダム性を制御するランダムシード。範囲: [0, 2147483647]。 省略した場合は自動生成されます。一貫した結果を得るには、同じシードを使用してください。 watermark bool (任意) ウォーターマーク (右下に「AI Generated」) を追加するかどうか。 |
ローカル編集model string (必須) モデル名。例: wan2.1-vace-plus。 input object (必須) プロンプトなどの基本的な入力情報。 プロパティ prompt string (必須) ビデオの要素と視覚的特徴を記述するテキスト。中国語と英語をサポートしています。各文字、アルファベット、句読点は 1 文字としてカウントされます。制限を超えたテキストは切り捨てられます。 プロンプト技術の詳細については、「ビデオ生成プロンプトガイド」をご参照ください。 function string (必須) 機能の名前。ローカル編集では、値を video_edit に設定します。 ローカル編集では、入力ビデオの指定された領域の要素を追加、変更、または削除できます。また、編集領域のエンティティや背景を置き換えることで、詳細なビデオ編集を実現できます。 video_url string (必須) 入力ビデオの URL。 パブリック URL:
入力ビデオの要件: 出力ビデオの解像度について: 出力ビデオの持続時間について: ref_images_url array[string] (任意) 入力参照画像の URL の配列。 パブリック URL:
現在、参照画像は 1 枚のみサポートされています。この画像は、入力ビデオの対応するコンテンツを置き換えるためのエンティティまたは背景として使用できます。 画像の要件: 推奨事項: mask_image_url string (任意) マスク画像の URL。 パブリック URL:
このパラメーターはビデオ編集エリアを指定します。このパラメーターまたは mask_video_url パラメーターのいずれかを指定する必要があります。このパラメーターを推奨します。 マスク画像の白い領域 (ピクセル値が正確に [255, 255, 255]) は編集する領域を示します。黒い領域 (ピクセル値が正確に [0, 0, 0]) は保持する領域を示します。 画像の要件: mask_frame_id integer (任意) このパラメーターは、mask_image_url が Empty でない場合にのみ使用されます。これは、「frame ID」で表される、マスクされたオブジェクトが表示されるフレームを識別します。 デフォルト値は 1 で、ビデオの最初のフレームを示します。 値は [1, max_frame_id] の範囲内である必要があります。ここで、max_frame_id = input video frame rate × input video duration + 1 です。 例えば、フレームレートが 16 FPS、持続時間が 5 秒の入力ビデオ (video_url) の場合、総フレーム数は 81 (16*5 + 1) です。 したがって、max_frame_id の値は 81 です。 mask_video_url string (任意) マスクビデオの URL。 パブリック URL:
このパラメーターは、編集するビデオのエリアを指定します。このパラメーターまたは mask_image_url パラメーターのいずれかを指定する必要があります。 マスク動画は、入力動画 (video_url) と、動画フォーマット、フレームレート、解像度、長さが同じである必要があります。 マスクビデオの白い領域 (ピクセル値が正確に [255, 255, 255]) は編集する領域を示します。黒い領域 (ピクセル値が正確に [0, 0, 0]) は保持する領域を示します。 | parameters object (任意) ウォーターマーク設定などのビデオ処理パラメーター。 プロパティ control_condition string (任意) ビデオの特徴抽出方法を設定します。デフォルト値は "" で、抽出が行われないことを意味します。 mask_type string (任意) このパラメーターは、mask_image_url が空でない場合にのみ有効であり、編集エリアの動作を指定します。 expand_ratio float (任意) mask_type が tracking に設定されている場合、このパラメーターが適用され、マスクエリアの外側への拡張率を指定します。
値の範囲は [0.0, 1.0] です。デフォルト値は 0.05 です。デフォルト値の使用を推奨します。 値が小さいほど、マスク領域はターゲットオブジェクトに密着します。値が大きいほど、マスク領域はより広く拡大されます。 expand_mode string (任意) mask_type が tracking に設定されている場合、このパラメーターが適用され、マスクエリアの形状を指定します。
アルゴリズムは、入力マスクイメージと選択された expand_mode に基づいて、対応する形状のマスクビデオを生成します。サポートされている値は次のとおりです: hull (デフォルト): ポリゴンモード。ポリゴンがマスクされたオブジェクトを囲みます。
bbox: バウンディングボックスモード。矩形がマスクされたオブジェクトを囲みます。
original: 生モード。元のマスクされたオブジェクトの形状を可能な限り保持します。
size string (任意) width*height フォーマットのビデオ解像度。使用できる値:
1280*720 (デフォルト): 16:9。
720*1280: 9:16。
960*960: 1:1。
832*1088: 3:4。
1088*832: 4:3。
duration integer (任意) ビデオの持続時間 (秒)。5 に固定されており、変更できません。モデルは常に 5 秒のビデオを生成します。 prompt_extend bool (任意) プロンプトリライトを有効にするかどうかを指定します。有効にすると、LLM が入力プロンプトを書き換えます。これにより、短いプロンプトの生成品質が大幅に向上する可能性がありますが、処理時間は長くなります。 テキストの説明が入力ビデオコンテンツと一致しない場合、モデルがプロンプトを誤って解釈する可能性があります。生成の一貫性と精度を向上させるには、プロンプトリライトを無効にし、prompt に明確で具体的な説明を記述してください。 seed integer (任意) 生成のランダム性を制御するランダムシード。範囲: [0, 2147483647]。 省略した場合は自動生成されます。一貫した結果を得るには、同じシードを使用してください。 watermark bool (任意) ウォーターマーク (右下に「AI Generated」) を追加するかどうか。 |
ビデオ拡張model string (必須) モデル名。例: wan2.1-vace-plus。 input object (必須) プロンプトなどの基本的な入力情報。 プロパティ prompt string (必須) ビデオの要素と視覚的特徴を記述するテキスト。中国語と英語をサポートしています。各文字、アルファベット、句読点は 1 文字としてカウントされます。制限を超えたテキストは切り捨てられます。 プロンプト技術の詳細については、「ビデオ生成プロンプトガイド」をご参照ください。 function string (必須) 機能の名前。動画拡張機能は video_extension に設定されています。 ビデオ拡張は、画像またはビデオに基づいて連続したコンテンツを生成します。また、参照ビデオからアクションや構図などの動的特徴を抽出し、同様の動きを持つビデオの生成をガイドします。 拡張されたビデオの合計持続時間は 5 秒です。注意: これは最終的な出力ビデオの合計持続時間であり、元のビデオに 5 秒追加されるわけではありません。 first_frame_url string (任意) 最初のフレーム画像の URL。 パブリック URL:
画像の要件: last_frame_url string(任意) 最後のフレーム画像の URL。 パブリック URL:
画像の要件: first_clip_url string (任意) 最初のビデオセグメントの URL。 パブリック URL:
ビデオの要件: ビデオフォーマット: MP4。 動画のフレームレート: 16 FPS 以上。 first_clip_url と last_clip_url の両方を使用する場合は、2 つのクリップのフレームレートを同じにすることを推奨します。 ビデオサイズ: 50 MB を超えてはなりません。 動画の持続時間は 3 秒を超えてはなりません。持続時間がこれより長い場合、最初の 3 秒のみが使用されます。first_clip_url と last_clip_url の両方が指定されている場合、それらの合計持続時間も 3 秒を超えてはなりません。 URL には中国語文字を含めることはできません。
出力ビデオの解像度について: last_clip_url string(任意) 最後のビデオセグメントの URL。 パブリック URL:
ビデオの要件: ビデオフォーマット: MP4。 ビデオフレームレート: 16 FPS 以上。 first_clip_url と last_clip_url を併用する場合、2 つのクリップのフレームレートを同じにすることを推奨します。 ビデオサイズ: 50 MB を超えてはなりません。 動画の持続時間: 3 秒以内である必要があります。持続時間が 3 秒を超える場合、最初の 3 秒のみが使用されます。first_clip_url と last_clip_url の両方が指定されている場合、それらの合計持続時間は 3 秒以内である必要があります。 URL には中国語文字を含めることはできません。
出力ビデオの解像度について: video_url string (任意) 入力ビデオの URL。 パブリック URL:
モーション特徴を抽出するために使用されます。これらを first_frame_url、last_frame_url、first_clip_url、および last_clip_url と組み合わせることで、類似したモーションを持つ拡張ビデオの生成をガイドできます。 ビデオの要件: ビデオフォーマット: MP4。 ビデオフレームレート: 16 FPS 以上、先行および後続のクリップと一致していること。 ビデオ解像度: 先行および後続のフレームおよびクリップと一致していること。 ビデオサイズ: 50 MB を超えてはなりません。 ビデオ持続時間: 5 秒を超えてはなりません。持続時間が長い場合は、最初の 5 秒のみが使用されます。 URL には中国語文字を含めることはできません。
| parameters object (任意) 出力ビデオの解像度などのビデオ処理パラメーター。 プロパティ control_condition string (任意) ビデオの特徴抽出方法を設定します。これは `video_url` が提供されている場合に必須です。デフォルト値は "" で、抽出が行われないことを意味します。 duration integer (任意) ビデオの持続時間 (秒)。5 に固定されており、変更できません。モデルは常に 5 秒のビデオを生成します。 prompt_extend bool (任意) プロンプトリライトを有効にするかどうかを指定します。有効にすると、LLM が入力プロンプトを書き換えます。これにより、短いプロンプトの生成品質が大幅に向上する可能性がありますが、処理時間は長くなります。 テキストの説明が入力ビデオのコンテンツと一致しない場合、モデルがプロンプトを誤って解釈する可能性があります。生成の一貫性と精度を向上させるには、プロンプトリライトを無効にし、prompt で明確かつ具体的な説明を指定してください。 seed integer (任意) 生成のランダム性を制御するランダムシード。範囲: [0, 2147483647]。 省略した場合は自動生成されます。一貫した結果を得るには、同じシードを使用してください。 watermark bool (任意) ウォーターマーク (右下に「AI Generated」) を追加するかどうか。 |
ビデオアウトペインティングmodel string (必須) モデル名。例: wan2.1-vace-plus。 input object (必須) プロンプトなどの基本的な入力情報。 プロパティ prompt string (必須) ビデオの要素と視覚的特徴を記述するテキスト。中国語と英語をサポートしています。各文字、アルファベット、句読点は 1 文字としてカウントされます。制限を超えたテキストは切り捨てられます。 プロンプト技術の詳細については、「ビデオ生成プロンプトガイド」をご参照ください。 function string (必須) 使用する機能を指定します。ビデオアウトペインティングには、このパラメーターを video_outpainting に設定します。 上下左右の方向にビデオを比例的に拡張できます。 video_url string (必須) 入力ビデオの URL。 パブリック URL:
入力ビデオの要件: 出力ビデオの解像度について: 出力ビデオの持続時間について: | parameters object (任意) スケーリング比などのビデオ処理パラメーター。 プロパティ top_scale float (任意) ビデオフレームを中央に配置し、ビデオを上方向に比例的に拡大します。範囲: [1.0, 2.0]。デフォルト: 1.0 (スケーリングなし)。 bottom_scale float (任意) ビデオフレームを中央に配置し、ビデオを比例的に縮小スケーリングします。範囲: [1.0, 2.0]。デフォルト: 1.0 (スケーリングなし)。 left_scale float (任意) ビデオフレームを中央に配置し、ビデオを左方向に比例的に拡大します。範囲: [1.0, 2.0]。デフォルト: 1.0 (スケーリングなし)。 right_scale float (任意) ビデオフレームを中央に配置し、ビデオを縦横比を維持してスケーリングします。範囲: [1.0, 2.0]。デフォルト: 1.0 (スケーリングなし)。 duration integer (任意) ビデオの持続時間 (秒)。5 に固定されており、変更できません。モデルは常に 5 秒のビデオを生成します。 prompt_extend bool (任意) プロンプトリライトを有効にするかどうかを指定します。有効にすると、LLM が入力プロンプトを書き換えます。これにより、短いプロンプトの生成品質が大幅に向上する可能性がありますが、処理時間は長くなります。 テキストによる説明が入力ビデオコンテンツと一致しない場合、モデルがプロンプトを誤って解釈する可能性があります。生成の一貫性と精度を向上させるには、プロンプトリライトを無効にし、prompt に明確で具体的な説明を指定してください。 seed integer (任意) 生成のランダム性を制御するランダムシード。範囲: [0, 2147483647]。 省略した場合は自動生成されます。一貫した結果を得るには、同じシードを使用してください。 watermark bool (任意) ウォーターマーク (右下に「AI Generated」) を追加するかどうか。 |
|