すべてのプロダクト
Search
ドキュメントセンター

:Wan2.1 - ビデオ編集 API リファレンス

最終更新日:Apr 04, 2026

Wan 汎用ビデオ編集モデルは、テキスト、画像、ビデオなどの複数の入力モダリティをサポートし、さまざまなビデオ生成および編集タスクを実行できます。

関連ドキュメント: ユーザーガイド

可用性

モデル、エンドポイント URL、API キーには、対応するリージョンを使用してください。

  • モデルの選択: ご利用のモデルが対象リージョンで利用可能であることを確認します。

  • URL の選択: 対応するリージョンのエンドポイント URL を選択します。HTTP と HTTPS の両方がサポートされています。

  • API キーの設定: リージョンを選択し、API キーを取得して、環境変数に設定します。

説明

このトピックのサンプルコードは、シンガポールリージョンに適用されます。

HTTP

ビデオ生成タスクには 5〜10 分かかります。API は非同期呼び出し方式 (「タスク作成 → 結果ポーリング」) を採用しています。

ステップ 1: タスクの作成

シンガポール

POST https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis

北京

POST https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis

リクエストパラメーター

複数画像参照

シンガポールリージョンと中国 (北京) リージョンの API キーは異なります。詳細については、「API キーと API ホストの取得
次の URL はシンガポールリージョン用です。中国 (北京) リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis に置き換えてください。
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "image_reference",
        "prompt": "In the video, a girl gracefully walks out from a misty, ancient forest. Her steps are light, and the camera captures her every nimble moment. When she stops and looks around at the lush woods, a smile of surprise and joy blossoms on her face. This scene, frozen in a moment of interplay between light and shadow, records her wonderful encounter with nature.",
        "ref_images_url": [
            "http://wanx.alicdn.com/material/20250318/image_reference_2_5_16.png",
            "http://wanx.alicdn.com/material/20250318/image_reference_1_5_16.png"
        ]
    },
    "parameters": {
        "prompt_extend": true,
        "obj_or_bg": ["obj","bg"],
        "size": "1280*720"
    }
}'

ビデオ再描画

シンガポールリージョンと中国 (北京) リージョンの API キーは異なります。詳細については、「API キーと API ホストの取得
次の URL はシンガポールリージョン用です。中国 (北京) リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis に置き換えてください。
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_repainting",
        "prompt": "The video shows a black steampunk-style car driven by a gentleman. The car is decorated with gears and copper pipes. The background features a steam-powered candy factory and retro elements, creating a vintage and playful scene.",
        "video_url": "http://wanx.alicdn.com/material/20250318/video_repainting_1.mp4"
    },
    "parameters": {
        "prompt_extend": false,
        "control_condition": "depth"
    }
}'

ローカル編集

シンガポールリージョンと中国 (北京) リージョンの API キーは異なります。詳細については、「API キーと API ホストの取得
次の URL はシンガポールリージョン用です。中国 (北京) リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis に置き換えてください。
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_edit",
        "prompt": "The video shows a Parisian-style French cafe where a lion in a suit is elegantly sipping coffee. It holds a coffee cup in one hand, taking a gentle sip with a relaxed expression. The cafe is tastefully decorated, with soft hues and warm lighting illuminating the area where the lion is.",
        "mask_image_url": "http://wanx.alicdn.com/material/20250318/video_edit_1_mask.png",
        "video_url": "http://wanx.alicdn.com/material/20250318/video_edit_2.mp4",
        "mask_frame_id": 1
    },
    "parameters": {
        "prompt_extend": false,
        "mask_type": "tracking",
        "expand_ratio": 0.05
    }
}'

ビデオ拡張

シンガポールリージョンと中国 (北京) リージョンの API キーは異なります。詳細については、「API キーと API ホストの取得
次の URL はシンガポールリージョン用です。中国 (北京) リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis に置き換えてください。
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_extension",
        "prompt": "A dog wearing sunglasses is skateboarding on the street, 3D cartoon.",
        "first_clip_url": "http://wanx.alicdn.com/material/20250318/video_extension_1.mp4"
    },
    "parameters": {
        "prompt_extend": false
    }
}'

ビデオアウトペインティング

シンガポールリージョンと中国 (北京) リージョンの API キーは異なります。詳細については、「API キーと API ホストの取得
次の URL はシンガポールリージョン用です。中国 (北京) リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis に置き換えてください。
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_outpainting",
        "prompt": "An elegant lady is passionately playing the violin, with a full symphony orchestra behind her.",
        "video_url": "http://wanx.alicdn.com/material/20250318/video_outpainting_1.mp4"
    },
    "parameters": {
        "prompt_extend": false,
        "top_scale": 1.5,
        "bottom_scale": 1.5,
        "left_scale": 1.5,
        "right_scale": 1.5
    }
}'
リクエストヘッダー

Content-Type string (必須)

リクエストのコンテンツタイプ。 application/json である必要があります。

Authorization string (必須)

Model Studio API キーを使用した認証情報。

例: Bearer sk-xxxx

X-DashScope-Async string (必須)

非同期処理を有効にします。HTTP リクエストは非同期処理にのみ対応しているため、enable に設定する必要があります。

重要

このヘッダーを含めないと、「current user api does not support synchronous calls」というエラーが返されます。

リクエストボディ

複数画像参照

model string (必須)

モデル名。例: wan2.1-vace-plus

input object (必須)

プロンプトなどの基本的な入力情報。

プロパティ

prompt string (必須)

ビデオの要素と視覚的特徴を記述するテキスト。中国語と英語をサポートしています。各文字、アルファベット、句読点は 1 文字としてカウントされます。制限を超えたテキストは切り捨てられます。

プロンプト技術の詳細については、「ビデオ生成プロンプトガイド」をご参照ください。

function string (必須)

機能名です。複数イメージのリファレンスには、 image_reference をセットします。

最大 3 つのリファレンスイメージに対応しています。イメージコンテンツには、エンティティ (人物、動物、衣服) やバックグラウンド (シーン) を含めることができます。プロンプトを使用して、目的のビデオコンテンツを記述します。モデルはイメージをマージして、一貫性のあるビデオを生成します。

ref_images_url array[string] (必須)

参照画像の URL。

  1. パブリック URL:

    • HTTP および HTTPS プロトコルをサポートします。

    • 例: https://xxx/xxx.mp3。

1〜3 枚の参照画像を提供します。3 枚を超えて提供された場合、最初の 3 枚のみが使用されます。

参照画像の要件:

  • フォーマット: JPG、JPEG、PNG、BMP、TIFF、または WEBP。

  • 解像度: 幅と高さの両方が 360〜2,000 ピクセルの範囲内である必要があります。

  • サイズ: 最大 10 MB。

  • URL には中国語文字を含めることはできません。

推奨事項:

  • エンティティ画像の場合、エンティティを際立たせるために、単色の背景 (白または単一色) を使用し、画像ごとに 1 つのエンティティのみを含めることを推奨します。

  • 背景画像の場合、最大 1 枚を使用し、エンティティオブジェクトを含まないようにしてください。

parameters object (任意)

ウォーターマーク設定などのビデオ処理パラメーター。

プロパティ

obj_or_bg array[string] (任意)

各リファレンスイメージの目的を識別します (ref_images_url と 1 対 1 で対応)。各要素は、対応するイメージが「エンティティ」か「バックグラウンド」かを示します:

  • obj: エンティティ参照。

  • bg: 背景参照。最大 1 つの背景参照が許可されます。

説明:

  • 推奨。長さが ref_images_url と一致しないとエラーが報告されます。

  • ref_images_url の要素が 1 つの場合にのみ省略可能です (デフォルトは ["obj"] です)。

例: ["obj", "obj", "bg"]。

size string (任意)

ビデオ解像度は width*height フォーマットです。使用可能な値:

  • 1280*720 (デフォルト): 16:9。

  • 720*1280: 9:16。

  • 960*960: 1:1。

  • 832*1088: 3:4。

  • 1088*832: 4:3。

duration integer (任意)

ビデオの持続時間 (秒)。5 に固定されており、変更できません。モデルは常に 5 秒のビデオを生成します。

prompt_extend bool (任意)

プロンプトリライトを有効にするかどうか。LLM が入力プロンプトを書き換えることで、短いプロンプトの品質を向上させますが、処理時間は長くなります。

  • true (デフォルト)

  • false

seed integer (任意)

生成のランダム性を制御するランダムシード。範囲: [0, 2147483647]

省略した場合は自動生成されます。一貫した結果を得るには、同じシードを使用してください。

watermark bool (任意)

ウォーターマーク (右下に「AI Generated」) を追加するかどうか。

  • false (デフォルト)

  • true

ビデオ再描画

model string (必須)

モデル名。例: wan2.1-vace-plus

input object (必須)

プロンプトなどの基本的な入力情報。

プロパティ

prompt string (必須)

ビデオの要素と視覚的特徴を記述するテキスト。中国語と英語をサポートしています。各文字、アルファベット、句読点は 1 文字としてカウントされます。制限を超えたテキストは切り捨てられます。

プロンプト技術の詳細については、「ビデオ生成プロンプトガイド」をご参照ください。

function string (必須)

機能名。動画の再塗装には、video_repainting を設定します。

入力ビデオからエンティティのポーズ、アクション、構図、モーション輪郭、スケッチ構造を抽出し、テキストプロンプトと組み合わせて、同じ動的特徴を持つ新しいビデオを生成します。また、参照画像でエンティティを置き換えて、アクションを維持しながら外観を変更することもできます。

video_url string (必須)

入力ビデオの URL。

  1. パブリック URL:

    • HTTP および HTTPS プロトコルをサポートします。

    • 例: https://xxx/xxx.mp3。

入力ビデオの要件:

  • フォーマット: MP4。

  • フレームレート: 16 FPS 以上。

  • サイズ: 最大 50 MB。

  • 持続時間: 最大 5 秒。長い場合は、最初の 5 秒のみが使用されます。

  • URL には中国語文字を含めることはできません。

出力ビデオの解像度について:

  • 入力ビデオの解像度が 720P 以下の場合、出力は元の解像度を維持します。

  • 入力ビデオの解像度が 720P を超える場合、元のアスペクト比を維持しながら 720P 以下に縮小されます。

出力ビデオの持続時間について:

  • 出力ビデオは入力ビデオと同じ持続時間になり、最大 5 秒です。

  • 例: 入力ビデオが 3 秒の場合、出力も 3 秒です。入力が 6 秒の場合、出力は最初の 5 秒です。

ref_images_url array[string] (任意)

入力参照画像の URL の配列。

  1. パブリック URL:

    • HTTP および HTTPS プロトコルをサポートします。

    • 例: https://xxx/xxx.mp3。

参照画像は 1 枚のみサポートされます。この画像は、入力ビデオのエンティティを置き換えるために使用されるエンティティ画像にすることを推奨します。

画像の要件:

  • 画像フォーマット: JPG、JPEG、PNG、BMP、TIFF、または WEBP。

  • 画像解像度: 幅と高さは 360〜2,000 ピクセルの範囲内である必要があります。

  • 画像サイズ: 10 MB を超えてはなりません。

  • URL には中国語文字を含めることはできません。

推奨事項:

  • 参照画像からエンティティを使用する場合、エンティティをより際立たせるために、各画像に 1 つのエンティティのみを含め、背景を白や単色などの単色にすることを推奨します。

parameters object (必須)

ウォーターマーク設定などのビデオ処理パラメーター。

プロパティ

control_condition string (必須)

ビデオの特徴抽出方法を設定します。

  • posebodyface: 入力ビデオ内のエンティティの表情と身体の動きを抽出します。これは、顔の詳細を保持する必要があるシナリオに適しています。

  • posebody: 入力ビデオからエンティティの身体の動きを抽出します (表情は除く)。身体の動きのみを制御する必要があるシナリオで使用します。

  • depth: 入力ビデオから構図とモーション輪郭を抽出します。

  • scribble: 入力ビデオからスケッチ構造を抽出します。

strength float (任意)

control_condition 特徴抽出メソッドが生成されたビデオに適用するコントロールの強度を調整します。

デフォルト値は 1.0 です。値の範囲は [0.0, 1.0] です。

値が大きいほど、生成されるビデオは元のビデオのアクションや構図に近くなります。値が小さいほど、より創造的な自由度が高まります。

prompt_extend bool (任意)

プロンプトリライトを有効にするかどうかを指定します。有効にすると、LLM が入力プロンプトを書き換えます。これにより、短いプロンプトの生成品質が大幅に向上する可能性がありますが、処理時間は長くなります。

  • true (デフォルト)

  • false (推奨)

テキストによる説明が入力ビデオコンテンツと一致しない場合、モデルがプロンプトを誤って解釈する可能性があります。生成の一貫性と精度を向上させるには、プロンプトリライトを無効にし、prompt に明確で具体的な説明を提供してください。

seed integer (任意)

生成のランダム性を制御するランダムシード。範囲: [0, 2147483647]

省略した場合は自動生成されます。一貫した結果を得るには、同じシードを使用してください。

watermark bool (任意)

ウォーターマーク (右下に「AI Generated」) を追加するかどうか。

  • false (デフォルト)

  • true

ローカル編集

model string (必須)

モデル名。例: wan2.1-vace-plus

input object (必須)

プロンプトなどの基本的な入力情報。

プロパティ

prompt string (必須)

ビデオの要素と視覚的特徴を記述するテキスト。中国語と英語をサポートしています。各文字、アルファベット、句読点は 1 文字としてカウントされます。制限を超えたテキストは切り捨てられます。

プロンプト技術の詳細については、「ビデオ生成プロンプトガイド」をご参照ください。

function string (必須)

機能の名前。ローカル編集では、値を video_edit に設定します。

ローカル編集では、入力ビデオの指定された領域の要素を追加、変更、または削除できます。また、編集領域のエンティティや背景を置き換えることで、詳細なビデオ編集を実現できます。

video_url string (必須)

入力ビデオの URL。

  1. パブリック URL:

    • HTTP および HTTPS プロトコルをサポートします。

    • 例: https://xxx/xxx.mp3。

入力ビデオの要件:

  • フォーマット: MP4。

  • フレームレート: 16 FPS 以上。

  • サイズ: 最大 50 MB。

  • 持続時間: 最大 5 秒。長い場合は、最初の 5 秒のみが使用されます。

  • URL には中国語文字を含めることはできません。

出力ビデオの解像度について:

  • 入力ビデオの解像度が 720P 以下の場合、出力は元の解像度を維持します。

  • 入力ビデオの解像度が 720P を超える場合、元のアスペクト比を維持しながら 720P 以下に縮小されます。

出力ビデオの持続時間について:

  • 出力ビデオは入力ビデオと同じ持続時間になり、最大 5 秒です。

  • 例: 入力ビデオが 3 秒の場合、出力も 3 秒です。入力が 6 秒の場合、出力は最初の 5 秒です。

ref_images_url array[string] (任意)

入力参照画像の URL の配列。

  1. パブリック URL:

    • HTTP および HTTPS プロトコルをサポートします。

    • 例: https://xxx/xxx.mp3。

現在、参照画像は 1 枚のみサポートされています。この画像は、入力ビデオの対応するコンテンツを置き換えるためのエンティティまたは背景として使用できます。

画像の要件:

  • 画像フォーマット: JPG、JPEG、PNG、BMP、TIFF、または WEBP。

  • 画像解像度: 幅と高さは 360〜2,000 ピクセルの範囲内である必要があります。

  • 画像サイズ: 10 MB を超えてはなりません。

  • URL には中国語文字を含めることはできません。

推奨事項:

  • 参照画像からエンティティを使用する場合、エンティティをより際立たせるために、各画像に 1 つのエンティティのみを含め、背景を白や単色などの単色にすることを推奨します。

  • 参照画像から背景を使用する場合、背景画像にはエンティティオブジェクトを含めないでください。

mask_image_url string (任意)

マスク画像の URL。

  1. パブリック URL:

    • HTTP および HTTPS プロトコルをサポートします。

    • 例: https://xxx/xxx.mp3。

このパラメーターはビデオ編集エリアを指定します。このパラメーターまたは mask_video_url パラメーターのいずれかを指定する必要があります。このパラメーターを推奨します

マスク画像の白い領域 (ピクセル値が正確に [255, 255, 255]) は編集する領域を示します。黒い領域 (ピクセル値が正確に [0, 0, 0]) は保持する領域を示します。

画像の要件:

  • 画像フォーマット: JPG、JPEG、PNG、BMP、TIFF、または WEBP。

  • 画像の解像度: 入力動画 (video_url) の解像度と完全に一致している必要があります。

  • 画像サイズ: 10 MB を超えてはなりません。

  • URL には中国語文字を含めることはできません。

mask_frame_id integer (任意)

このパラメーターは、mask_image_url が Empty でない場合にのみ使用されます。これは、「frame ID」で表される、マスクされたオブジェクトが表示されるフレームを識別します。

デフォルト値は 1 で、ビデオの最初のフレームを示します。

値は [1, max_frame_id] の範囲内である必要があります。ここで、max_frame_id = input video frame rate × input video duration + 1 です。

例えば、フレームレートが 16 FPS、持続時間が 5 秒の入力ビデオ (video_url) の場合、総フレーム数は 81 (16*5 + 1) です。 したがって、max_frame_id の値は 81 です。

mask_video_url string (任意)

マスクビデオの URL。

  1. パブリック URL:

    • HTTP および HTTPS プロトコルをサポートします。

    • 例: https://xxx/xxx.mp3。

このパラメーターは、編集するビデオのエリアを指定します。このパラメーターまたは mask_image_url パラメーターのいずれかを指定する必要があります。

マスク動画は、入力動画 (video_url) と、動画フォーマット、フレームレート、解像度、長さが同じである必要があります。

マスクビデオの白い領域 (ピクセル値が正確に [255, 255, 255]) は編集する領域を示します。黒い領域 (ピクセル値が正確に [0, 0, 0]) は保持する領域を示します。

parameters object (任意)

ウォーターマーク設定などのビデオ処理パラメーター。

プロパティ

control_condition string (任意)

ビデオの特徴抽出方法を設定します。デフォルト値は "" で、抽出が行われないことを意味します。

  • posebodyface: 入力ビデオ内のエンティティの表情と身体の動きを抽出します。これは、エンティティの顔がフレーム内で大きく、特徴がはっきりと見えるシナリオに適しています。

  • depth: 入力ビデオから構図とモーション輪郭を抽出します。

mask_type string (任意)

このパラメーターは、mask_image_url が空でない場合にのみ有効であり、編集エリアの動作を指定します。

  • tracking (デフォルト): 編集領域はターゲットオブジェクトの軌跡を動的に追跡します。このモードは、動くオブジェクトのあるシーンに適しています。

  • fixed: 編集領域は固定され、ビデオコンテンツによって変化しません。

expand_ratio float (任意)

mask_typetracking に設定されている場合、このパラメーターが適用され、マスクエリアの外側への拡張率を指定します。

値の範囲は [0.0, 1.0] です。デフォルト値は 0.05 です。デフォルト値の使用を推奨します。

値が小さいほど、マスク領域はターゲットオブジェクトに密着します。値が大きいほど、マスク領域はより広く拡大されます。

expand_mode string (任意)

mask_typetracking に設定されている場合、このパラメーターが適用され、マスクエリアの形状を指定します。

アルゴリズムは、入力マスクイメージと選択された expand_mode に基づいて、対応する形状のマスクビデオを生成します。サポートされている値は次のとおりです:

  • hull (デフォルト): ポリゴンモード。ポリゴンがマスクされたオブジェクトを囲みます。

  • bbox: バウンディングボックスモード。矩形がマスクされたオブジェクトを囲みます。

  • original: 生モード。元のマスクされたオブジェクトの形状を可能な限り保持します。

size string (任意)

width*height フォーマットのビデオ解像度。使用できる値:

  • 1280*720 (デフォルト): 16:9。

  • 720*1280: 9:16。

  • 960*960: 1:1。

  • 832*1088: 3:4。

  • 1088*832: 4:3。

duration integer (任意)

ビデオの持続時間 (秒)。5 に固定されており、変更できません。モデルは常に 5 秒のビデオを生成します。

prompt_extend bool (任意)

プロンプトリライトを有効にするかどうかを指定します。有効にすると、LLM が入力プロンプトを書き換えます。これにより、短いプロンプトの生成品質が大幅に向上する可能性がありますが、処理時間は長くなります。

  • true (デフォルト)

  • false (推奨)

テキストの説明が入力ビデオコンテンツと一致しない場合、モデルがプロンプトを誤って解釈する可能性があります。生成の一貫性と精度を向上させるには、プロンプトリライトを無効にし、prompt に明確で具体的な説明を記述してください。

seed integer (任意)

生成のランダム性を制御するランダムシード。範囲: [0, 2147483647]

省略した場合は自動生成されます。一貫した結果を得るには、同じシードを使用してください。

watermark bool (任意)

ウォーターマーク (右下に「AI Generated」) を追加するかどうか。

  • false (デフォルト)

  • true

ビデオ拡張

model string (必須)

モデル名。例: wan2.1-vace-plus

input object (必須)

プロンプトなどの基本的な入力情報。

プロパティ

prompt string (必須)

ビデオの要素と視覚的特徴を記述するテキスト。中国語と英語をサポートしています。各文字、アルファベット、句読点は 1 文字としてカウントされます。制限を超えたテキストは切り捨てられます。

プロンプト技術の詳細については、「ビデオ生成プロンプトガイド」をご参照ください。

function string (必須)

機能の名前。動画拡張機能は video_extension に設定されています。

ビデオ拡張は、画像またはビデオに基づいて連続したコンテンツを生成します。また、参照ビデオからアクションや構図などの動的特徴を抽出し、同様の動きを持つビデオの生成をガイドします。

拡張されたビデオの合計持続時間は 5 秒です。注意: これは最終的な出力ビデオの合計持続時間であり、元のビデオに 5 秒追加されるわけではありません。

first_frame_url string (任意)

最初のフレーム画像の URL。

  1. パブリック URL:

    • HTTP および HTTPS プロトコルをサポートします。

    • 例: https://xxx/xxx.mp3。

画像の要件:

  • 画像フォーマット: JPG、JPEG、PNG、BMP、TIFF、または WEBP。

  • 画像解像度: 幅と高さは 360〜2,000 ピクセルの範囲内である必要があります。

  • 画像サイズ: 10 MB を超えてはなりません。

  • URL には中国語文字を含めることはできません。

last_frame_url string(任意)

最後のフレーム画像の URL。

  1. パブリック URL:

    • HTTP および HTTPS プロトコルをサポートします。

    • 例: https://xxx/xxx.mp3。

画像の要件:

  • 画像フォーマット: JPG、JPEG、PNG、BMP、TIFF、または WEBP。

  • 画像解像度: 幅と高さは 360〜2,000 ピクセルの範囲内である必要があります。

  • 画像サイズ: 10 MB を超えてはなりません。

  • URL には中国語文字を含めることはできません。

first_clip_url string (任意)

最初のビデオセグメントの URL。

  1. パブリック URL:

    • HTTP および HTTPS プロトコルをサポートします。

    • 例: https://xxx/xxx.mp3。

ビデオの要件:

  • ビデオフォーマット: MP4。

  • 動画のフレームレート: 16 FPS 以上。 first_clip_urllast_clip_url の両方を使用する場合は、2 つのクリップのフレームレートを同じにすることを推奨します。

  • ビデオサイズ: 50 MB を超えてはなりません。

  • 動画の持続時間は 3 秒を超えてはなりません。持続時間がこれより長い場合、最初の 3 秒のみが使用されます。first_clip_urllast_clip_url の両方が指定されている場合、それらの合計持続時間も 3 秒を超えてはなりません。

  • URL には中国語文字を含めることはできません。

出力ビデオの解像度について:

  • 入力ビデオの解像度が 720P 以下の場合、出力は元の解像度を維持します。

  • 入力ビデオの解像度が 720P を超える場合、元のアスペクト比を維持しながら 720P 以下に縮小されます。

last_clip_url string(任意)

最後のビデオセグメントの URL。

  1. パブリック URL:

    • HTTP および HTTPS プロトコルをサポートします。

    • 例: https://help-static-aliyun-doc.aliyuncs.com/xxx.mp3。

ビデオの要件:

  • ビデオフォーマット: MP4。

  • ビデオフレームレート: 16 FPS 以上。 first_clip_urllast_clip_url を併用する場合、2 つのクリップのフレームレートを同じにすることを推奨します。

  • ビデオサイズ: 50 MB を超えてはなりません。

  • 動画の持続時間: 3 秒以内である必要があります。持続時間が 3 秒を超える場合、最初の 3 秒のみが使用されます。first_clip_urllast_clip_url の両方が指定されている場合、それらの合計持続時間は 3 秒以内である必要があります。

  • URL には中国語文字を含めることはできません。

出力ビデオの解像度について:

  • 入力ビデオの解像度が 720P 以下の場合、出力は元の解像度を維持します。

  • 入力ビデオの解像度が 720P を超える場合、元のアスペクト比を維持しながら 720P 以下に縮小されます。

video_url string (任意)

入力ビデオの URL。

  1. パブリック URL:

    • HTTP および HTTPS プロトコルをサポートします。

    • 例: https://help-static-aliyun-doc.aliyuncs.com/xxx.mp3。

モーション特徴を抽出するために使用されます。これらを first_frame_urllast_frame_urlfirst_clip_url、および last_clip_url と組み合わせることで、類似したモーションを持つ拡張ビデオの生成をガイドできます。

ビデオの要件:

  • ビデオフォーマット: MP4。

  • ビデオフレームレート: 16 FPS 以上、先行および後続のクリップと一致していること。

  • ビデオ解像度: 先行および後続のフレームおよびクリップと一致していること。

  • ビデオサイズ: 50 MB を超えてはなりません。

  • ビデオ持続時間: 5 秒を超えてはなりません。持続時間が長い場合は、最初の 5 秒のみが使用されます。

  • URL には中国語文字を含めることはできません。

parameters object (任意)

出力ビデオの解像度などのビデオ処理パラメーター。

プロパティ

control_condition string (任意)

ビデオの特徴抽出方法を設定します。これは `video_url` が提供されている場合に必須です。デフォルト値は "" で、抽出が行われないことを意味します。

  • posebodyface: 入力ビデオからエンティティの表情と身体の動きを抽出します。

  • depth: 入力ビデオから構図とモーション輪郭を抽出します。

duration integer (任意)

ビデオの持続時間 (秒)。5 に固定されており、変更できません。モデルは常に 5 秒のビデオを生成します。

prompt_extend bool (任意)

プロンプトリライトを有効にするかどうかを指定します。有効にすると、LLM が入力プロンプトを書き換えます。これにより、短いプロンプトの生成品質が大幅に向上する可能性がありますが、処理時間は長くなります。

  • true (デフォルト)

  • false (推奨)

テキストの説明が入力ビデオのコンテンツと一致しない場合、モデルがプロンプトを誤って解釈する可能性があります。生成の一貫性と精度を向上させるには、プロンプトリライトを無効にし、prompt で明確かつ具体的な説明を指定してください。

seed integer (任意)

生成のランダム性を制御するランダムシード。範囲: [0, 2147483647]

省略した場合は自動生成されます。一貫した結果を得るには、同じシードを使用してください。

watermark bool (任意)

ウォーターマーク (右下に「AI Generated」) を追加するかどうか。

  • false (デフォルト)

  • true

ビデオアウトペインティング

model string (必須)

モデル名。例: wan2.1-vace-plus

input object (必須)

プロンプトなどの基本的な入力情報。

プロパティ

prompt string (必須)

ビデオの要素と視覚的特徴を記述するテキスト。中国語と英語をサポートしています。各文字、アルファベット、句読点は 1 文字としてカウントされます。制限を超えたテキストは切り捨てられます。

プロンプト技術の詳細については、「ビデオ生成プロンプトガイド」をご参照ください。

function string (必須)

使用する機能を指定します。ビデオアウトペインティングには、このパラメーターを video_outpainting に設定します。

上下左右の方向にビデオを比例的に拡張できます。

video_url string (必須)

入力ビデオの URL。

  1. パブリック URL:

    • HTTP および HTTPS プロトコルをサポートします。

    • 例: https://xxx/xxx.mp3。

入力ビデオの要件:

  • フォーマット: MP4。

  • フレームレート: 16 FPS 以上。

  • サイズ: 最大 50 MB。

  • 持続時間: 最大 5 秒。長い場合は、最初の 5 秒のみが使用されます。

  • URL には中国語文字を含めることはできません。

出力ビデオの解像度について:

  • 入力ビデオの解像度が 720P 以下の場合、出力は元の解像度を維持します。

  • 入力ビデオの解像度が 720P を超える場合、元のアスペクト比を維持しながら 720P 以下に縮小されます。

出力ビデオの持続時間について:

  • 出力ビデオは入力ビデオと同じ持続時間になり、最大 5 秒です。

  • 例: 入力ビデオが 3 秒の場合、出力も 3 秒です。入力が 6 秒の場合、出力は最初の 5 秒です。

parameters object (任意)

スケーリング比などのビデオ処理パラメーター。

プロパティ

top_scale float (任意)

ビデオフレームを中央に配置し、ビデオを上方向に比例的に拡大します。範囲: [1.0, 2.0]。デフォルト: 1.0 (スケーリングなし)。

bottom_scale float (任意)

ビデオフレームを中央に配置し、ビデオを比例的に縮小スケーリングします。範囲: [1.0, 2.0]。デフォルト: 1.0 (スケーリングなし)。

left_scale float (任意)

ビデオフレームを中央に配置し、ビデオを左方向に比例的に拡大します。範囲: [1.0, 2.0]。デフォルト: 1.0 (スケーリングなし)。

right_scale float (任意)

ビデオフレームを中央に配置し、ビデオを縦横比を維持してスケーリングします。範囲: [1.0, 2.0]。デフォルト: 1.0 (スケーリングなし)。

duration integer (任意)

ビデオの持続時間 (秒)。5 に固定されており、変更できません。モデルは常に 5 秒のビデオを生成します。

prompt_extend bool (任意)

プロンプトリライトを有効にするかどうかを指定します。有効にすると、LLM が入力プロンプトを書き換えます。これにより、短いプロンプトの生成品質が大幅に向上する可能性がありますが、処理時間は長くなります。

  • true (デフォルト)

  • false (推奨)

テキストによる説明が入力ビデオコンテンツと一致しない場合、モデルがプロンプトを誤って解釈する可能性があります。生成の一貫性と精度を向上させるには、プロンプトリライトを無効にし、prompt に明確で具体的な説明を指定してください。

seed integer (任意)

生成のランダム性を制御するランダムシード。範囲: [0, 2147483647]

省略した場合は自動生成されます。一貫した結果を得るには、同じシードを使用してください。

watermark bool (任意)

ウォーターマーク (右下に「AI Generated」) を追加するかどうか。

  • false (デフォルト)

  • true

レスポンスパラメーター

成功レスポンス

タスクのステータスと結果をクエリするには、task_id を保存します。

{
    "output": {
        "task_status": "PENDING",
        "task_id": "0385dc79-5ff8-4d82-bcb6-xxxxxx"
    },
    "request_id": "4909100c-7b5a-9f92-bfe5-xxxxxx"
}

エラーレスポンス

タスクの作成に失敗しました。問題を解決するには、「エラーコード」をご参照ください。

{
    "code": "InvalidApiKey",
    "message": "No API-key provided.",
    "request_id": "7438d53d-6eb8-4596-8835-xxxxxx"
}

output object

タスクの出力情報。

プロパティ

task_id string

タスクの ID。最大 24 時間、タスクのクエリに使用できます。

task_status string

タスクのステータス。

列挙

  • PENDING

  • RUNNING

  • SUCCEEDED

  • FAILED

  • CANCELED

  • UNKNOWN: タスクが存在しないか、ステータスが不明です

request_id string

リクエストの一意の識別子。問題の追跡とトラブルシューティングに使用します。

code string

エラーコード。リクエストが失敗した場合にのみ返されます。詳細については、「エラーコード」をご参照ください。

message string

詳細なエラーメッセージ。リクエストが失敗した場合にのみ返されます。詳細については、「エラーコード」をご参照ください。

ステップ 2: 結果のクエリ

シンガポール

GET https://dashscope-intl.aliyuncs.com/api/v1/tasks/{task_id}

北京

GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}

リクエストパラメーター

タスク結果のクエリ

{task_id} を、前の API 呼び出しで返された task_id の値に置き換えます。task_id は、24 時間以内のクエリに対して有効です。

curl -X GET https://dashscope-intl.aliyuncs.com/api/v1/tasks/{task_id} \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"
リクエストヘッダー

Authorization string (必須)

Model Studio API キーを使用した認証情報。

例: Bearer sk-xxxx

URL パスパラメーター

task_id string (必須)

クエリするタスクの ID。

レスポンスパラメーター

タスク成功

タスクデータは 24 時間保持された後、自動的に削除されます。ビデオは速やかに保存してください。

{
    "request_id": "851985d0-fbba-9d8d-a17a-xxxxxx",
    "output": {
        "task_id": "208e2fd1-fcb4-4adf-9fcc-xxxxxx",
        "task_status": "SUCCEEDED",
        "submit_time": "2025-05-15 16:14:44.723",
        "scheduled_time": "2025-05-15 16:14:44.750",
        "end_time": "2025-05-15 16:20:09.389",
        "video_url": "https://dashscope-result-wlcb.oss-cn-wulanchabu.aliyuncs.com/xxx.mp4?xxxxxx",
        "orig_prompt": "In the video, a girl gracefully walks out from a misty, ancient forest. Her steps are light, and the camera captures her every nimble moment. When the girl stops and looks around at the lush woods, a smile of surprise and joy blossoms on her face. This scene, frozen in a moment of interplay between light and shadow, records her wonderful encounter with nature.",
        "actual_prompt": "A girl in a light-colored long dress slowly walks out from a misty, ancient forest, her steps as light as a dance. She has slightly curly long hair, a delicate face, and bright eyes. The camera follows her movements, capturing every nimble moment. When she stops, turns, and looks around at the lush woods, a smile of surprise and joy blossoms on her face. Sunlight filters through the leaves, casting mottled shadows and freezing this beautiful moment of harmony between human and nature. The style is a fresh and natural portrait, combining medium and full shots with a level perspective and slight camera movement."
    },
    "usage": {
        "video_duration": 5,
        "video_ratio": "standard",
        "video_count": 1
    }
}

タスク失敗

タスクが失敗すると、task_status は FAILED に設定され、エラーコードとメッセージが出力されます。問題を解決するには、「エラーコード」をご参照ください。

{
    "request_id": "e5d70b02-ebd3-98ce-9fe8-759d7d7b107d",
    "output": {
        "task_id": "86ecf553-d340-4e21-af6e-a0c6a421c010",
        "task_status": "FAILED",
        "code": "InvalidParameter",
        "message": "The size is not match xxxxxx"
    }
}

output object

タスクの出力情報。

プロパティ

task_id string

タスクの ID。最大 24 時間、タスクのクエリに使用できます。

task_status string

タスクのステータス。

列挙

  • PENDING

  • RUNNING

  • SUCCEEDED

  • FAILED

  • CANCELED

  • UNKNOWN: タスクが存在しないか、ステータスが不明です

submit_time string

タスクが送信された時刻。時刻は UTC+8 です。フォーマット: YYYY-MM-DD HH:mm:ss.SSS

scheduled_time string

タスクが実行を開始した時刻。時刻は UTC+8 です。フォーマット: YYYY-MM-DD HH:mm:ss.SSS

end_time string

タスクが完了した時刻。時刻は UTC+8 です。フォーマット: YYYY-MM-DD HH:mm:ss.SSS

video_url string

ビデオ URL (24 時間有効)。フォーマット: MP4 (H.264 エンコーディング)。

orig_prompt string

元の入力プロンプト。

actual_prompt string

プロンプトリライトが有効な場合に使用される実際のプロンプト。プロンプトリライトが無効な場合、このフィールドは返されません。

code string

エラーコード。リクエストが失敗した場合にのみ返されます。詳細については、「エラーコード」をご参照ください。

message string

詳細なエラーメッセージ。リクエストが失敗した場合にのみ返されます。詳細については、「エラーコード」をご参照ください。

usage object

出力統計。成功したタスクに対してのみカウントされます。

プロパティ

video_duration integer

生成されたビデオの持続時間 (秒)。

video_ratio string

生成される動画のアスペクト比。standard に固定されています。

video_count integer

生成されたビデオの数。

request_id string

リクエストの一意の識別子。問題の追跡とトラブルシューティングに使用します。

制限事項

  • データの有効期間task_idvideo_url は 24 時間保持されます。有効期限が切れた後は、照会またはダウンロードできなくなります。

  • 音声サポート: このモデルは無音のビデオを生成します。音声を追加するには、音声合成を使用してください。

エラーコード

モデルの呼び出しが失敗し、エラーメッセージが返された場合は、「エラーメッセージ」を参照してトラブルシューティングを行ってください。

よくある質問

Q: ビデオストレージのアクセスドメイン名のホワイトリストを取得するにはどうすればよいですか?

A: モデルによって生成されたビデオは OSS に保存されます。API は一時的なパブリック URL を返します。このダウンロード URL のファイアウォールホワイトリストを設定するには、次の点にご注意ください: 基盤となるストレージは動的に変更される可能性があります。このトピックでは、古い情報によるアクセス問題を避けるため、固定の OSS ドメイン名ホワイトリストは提供していません。セキュリティ管理要件がある場合は、アカウントマネージャーに連絡して最新の OSS ドメイン名リストを入手してください。