すべてのプロダクト
Search
ドキュメントセンター

Alibaba Cloud Model Studio:wan2.2-s2v ビデオ生成 API リファレンス

最終更新日:Oct 15, 2025

wan2.2-s2v デジタルヒューマンモデルは、1 枚の画像と 1 つのオーディオファイルから、人が話したり、歌ったり、自然な動きでパフォーマンスしたりするビデオを生成できます。

  • オーディオ駆動: 入力オーディオファイルが静止画像内のキャラクターを駆動し、その唇の動き、表情、およびアクションをオーディオと同期させます。

  • 豊富なシナリオ: 「スピーキング」、「シンギング」、「パフォーマンス」の 3 つのリップシンクシナリオをサポートします。

  • 多様なキャラクター: 実在の人物 (ポートレート、半身、全身) およびアニメキャラクターをサポートします。

  • 出力ビデオ解像度: 480p および 720p の解像度オプションをサポートします。

重要

このドキュメントは、中国 (北京) リージョンにのみ適用されます。モデルを使用するには、中国 (北京) リージョンの API キーを使用する必要があります。

モデルと価格

北京リージョン

モデル

単価

レート制限 (Alibaba Cloud アカウントと RAM ユーザーで共有)

タスク送信 RPS 制限

同時タスク数

wan2.2-s2v

480P: $0.071677/秒

720P: $0.129018/秒

5

1

課金例を表示するにはクリック

課金計算式は次のとおりです: 合計コスト = 実際のビデオ時間 (秒) × 選択した解像度の単価

480p の解像度でビデオを生成し、成功したタスクに対して返される `usage.video_duration` が 10.23 秒であると仮定します。

コスト計算: 10.23 秒 × $0.071677/秒 = $0.73325571

注: 課金対象の時間は、成功したタスクに対して返される `usage.video_duration` フィールドに基づきます。

HTTP API

前提条件

ステップ 1: タスクを作成し、タスク ID を取得する

POST https://dashscope.aliyuncs.com/api/v1/services/aigc/image2video/video-synthesis
説明
  • このモデルの呼び出しには時間がかかるため、タスクは非同期呼び出しによって作成されます。

  • タスクが作成されると、システムはすぐに task_id を返します。次のステップでは、この `task_id` を使用して 24 時間以内にタスクの結果をクエリします。

リクエストパラメーター

フィールド

タイプ

渡し方

必須

説明

Content-Type

String

ヘッダー

はい

リクエストのタイプ。値を application/json に設定します。

application/json

Authorization

String

ヘッダー

はい

API キー。フォーマットは Bearer sk-xxx です。

Bearer sk-1a**2b

X-DashScope-Async

String

ヘッダー

はい

非同期呼び出しが使用されることを示す `enable` に設定された静的フィールド。

enable

model

String

本文

はい

呼び出すモデル。

wan2.2-s2v

input.image_url

String

本文

はい

アップロードされた画像の URL。

  • 画像フォーマット: JPG、JPEG、PNG、BMP、WEBP がサポートされています。

  • 画像解像度: 画像の幅と高さは 400 から 7,000 ピクセルの間である必要があります。

  • インターネット経由でアクセス可能な HTTP/HTTPS リンクのみがサポートされています。

http://aaa/bbb.jpg

input.audio_url

String

本文

はい

アップロードされたオーディオファイルの URL。

  • オーディオフォーマット: WAV と MP3 がサポートされています。

  • オーディオ制限: ファイルサイズは 15 MB 未満、時間は 20 秒未満である必要があります。

  • オーディオコンテンツ: オーディオには、クリアで大きな人間の音声が含まれている必要があります。周囲の騒音やバックグラウンドミュージックなどの干渉を取り除いてください。

  • インターネット経由でアクセス可能な HTTP/HTTPS リンクのみがサポートされています。

http://aaa/bbb.mp3

parameters.resolution

String

本文

いいえ

ビデオの解像度レベル。

有効な値は 480P と 720P です。デフォルト値は 480P です。

モデルは、出力ビデオの縦横比を入力画像と同じに保とうとします。縦横比を変更せずに、ビデオの総ピクセル数を選択したレベルに近づけるように調整します。

480P: この解像度は通常 640 × 480 (約 310,000 ピクセル) で、縦横比は 4:3 です。

720P: この解像度は通常 1280 × 720 (約 920,000 ピクセル) で、縦横比は 16:9 です。

: 入力画像の縦横比が 4:5 で、480P レベルを選択した場合、出力ビデオは 4:5 の縦横比を維持します。解像度は 310,000 ピクセルに近づくように調整されます。たとえば、出力ビデオの解像度は 480 × 600 になり、合計 288,000 ピクセルになる場合があります。このデータは参考用です。実際の出力は異なる場合があります。

480P

応答パラメーター

フィールド

タイプ

説明

output.task_id

String

非同期タスクの一意の ID。

a8532587-fa8c-4ef8-82be-0c46b17950d1

output.task_status

String

非同期タスクが送信された後のジョブのステータス。

PENDING

request_id

String

リクエストの一意の ID。

7574ee8f-38a3-4b1e-9280-11c33ab46e51

リクエストの例

curl 'https://dashscope.aliyuncs.com/api/v1/services/aigc/image2video/video-synthesis/' \
 --header 'X-DashScope-Async: enable' \
 --header "Authorization: Bearer $DASHSCOPE_API_KEY" \
 --header 'Content-Type: application/json' \
 --data '{
     "model": "wan2.2-s2v",
     "input": {
            "image_url": "https://img.alicdn.com/imgextra/i3/O1CN011FObkp1T7Ttowoq4F_!!6000000002335-0-tps-1440-1797.jpg",
            "audio_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250825/iaqpio/input_audio.MP3"
        },
        "parameters": {
            "resolution": "480P"
        }
    }'

応答の例

{
    "output": {
        "task_id": "a8532587-fa8c-4ef8-82be-xxxxxx", 
    	"task_status": "PENDING"
    }
    "request_id": "7574ee8f-38a3-4b1e-9280-xxxxxx"
}

ステップ 2: タスク ID で結果をクエリする

task_id を使用して GET リクエストを送信し、タスクのステータスと結果をクエリします。URL の {task_id} を実際のタスク ID に置き換えてください。

GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}
説明
  • ビデオ生成タスクには時間がかかります。ポーリングメカニズムを使用し、10 秒などの合理的なクエリ間隔を設定して結果を取得してください。

  • 成功したタスクに対して返される video_url24 時間有効です。ビデオを速やかにダウンロードして保存してください。

リクエストパラメーター

フィールド

タイプ

渡し方

必須

説明

Authorization

String

ヘッダー

はい

API キー。例: Bearer sk-xxx。

Bearer sk-xxx

task_id

String

Url Path

はい

クエリするタスクの ID。

a8532587-fa8c-4ef8-82be-0c46b17950d1

応答パラメーター

フィールド

タイプ

説明

output.task_id

String

クエリされたタスクの ID。

a8532587-fa8c-4ef8-82be-0c46b17950d1

output.task_status

String

タスクのステータス。考えられる値は次のとおりです:

  • PENDING

  • RUNNING

  • SUCCEEDED

  • FAILED

  • UNKNOWN

  • CANCELED

SUCCEEDED

output.submit_time

String

タスクが送信された時間。

2025-09-01 09:37:27.468

output.scheduled_time

String

タスクが実行を開始した時間。

2025-09-01 09:37:34.885

output.end_time

String

タスクが完了した時間。

2025-09-01 09:40:20.734

output.results.video_url

String

生成されたビデオファイル。

video_url は 24 時間有効です。速やかにダウンロードしてください。

https://xxx/1.mp4?Expires=xxx

usage.duration

Float

ビデオの長さ (秒)。これは秒単位の課金に使用されます。

10.23

usage.video_count

Integer

生成されたビデオの数。

1

usage.SR

Integer

生成されたビデオの解像度レベル。

480

output.code

String

エラーコード。このパラメーターはタスクが失敗した場合に返されます。

InvalidParameter

output.message

String

エラーの詳細。このパラメーターはタスクが失敗した場合に返されます。

The request is missing required parameters or in a wrong format

request_id

String

リクエストの一意の ID。

7574ee8f-38a3-4b1e-9280-11c33ab46e51

リクエストの例

86ecf553-d340-4e21-xxxxxxxxx を実際のタスク ID に置き換えてください。

curl -X GET https://dashscope.aliyuncs.com/api/v1/tasks/86ecf553-d340-4e21-xxxxxxxxx \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"
説明

24 時間以内にのみ `task_id` を使用してタスクの結果をクエリできます。その後、結果はシステムによって自動的に消去されます。

応答の例

成功した応答

タスクのステータスやビデオ URL などのタスクデータは 24 時間のみ保持されます。その後、データは自動的に消去されます。結果を速やかに保存してください。

{
    "output": {
        "task_id": "bcae8761-f242-4775-a11e-xxxxxx",
        "task_status": "SUCCEEDED",
        "submit_time": "2025-09-01 09:37:27.468",
        "scheduled_time": "2025-09-01 09:37:34.885",
        "end_time": "2025-09-01 09:40:20.734",
        "results": {
            "video_url": "http://dashscope-result-hz.oss-cn-hangzhou.aliyuncs.com/1d/xxx.mp4?Expires=xxxxxx"
        }
    },
    "usage": {
        "duration": 18.13,
        "video_count": 1,
        "SR": 480
        },
    "request_id": "28cfedb1-cd60-9e0c-b920-xxxxxx"
}

失敗した応答

{
    "request_id": "8d49f522-f6a4-9eed-b322-xxxxxx",
    "output": {
        "task_id": "101ad32f-7653-4ae9-8f22-xxxxxx",
        "task_status": "FAILED",
        "submit_time": "2025-09-01 11:43:41.174",
        "scheduled_time": "2025-09-01 11:43:48.937",
        "end_time": "2025-09-01 11:43:49.802",
        "code": "InvalidURL",
        "message": "Required URL is missing or invalid, please check the request URL."
    }
}

課金とレート制限

課金ルール

  • 課金項目: 正常に生成されたビデオの秒数に対して、従量課金制で課金されます。

  • 課金計算式: 料金 = 単価 × ビデオ時間 (秒)

  • 課金優先度: まず無料クォータが消費されます。無料クォータを使い切ると、デフォルトで従量課金方法が使用されます。

    • 「無料クォータのみ」機能を有効にすると、無料クォータを使い切った後の追加料金を防ぐことができます。詳細については、「新規ユーザー向けの無料クォータ」をご参照ください。

  • 失敗に対する課金なし: モデルの呼び出しの失敗や処理エラーは、料金が発生したり、無料クォータを消費したりすることはありません。

無料クォータ

無料クォータの請求、クエリ、使用方法の詳細については、「新規ユーザー向けの無料クォータ」をご参照ください。

使用状況のクエリ

モデルの呼び出しが完了してから約 1 時間後、モデル観測 (シンガポール) ページに移動して、使用量、呼び出し回数、成功率などのメトリックを表示できます。

モデルが中国 (北京) リージョンにある場合は、モデル観測ページに移動してください。

レート制限

モデルのレート制限ルールとよくある質問については、「レート制限」をご参照ください。

エラーコード

モデルの呼び出しが失敗し、エラーメッセージが返された場合は、「エラーメッセージ」をご参照ください。