すべてのプロダクト
Search
ドキュメントセンター

Alibaba Cloud Model Studio:wan2.2-s2v デジタルヒューマン動画生成 API リファレンス

最終更新日:Mar 03, 2026

wan2.2-s2v デジタルヒューマンモデルは、1 枚の画像と 1 つの音声ファイルから、自然な口の動き、表情、動作で話したり、歌ったり、パフォーマンスしたりする人物の動画を生成します。

  • 音声駆動:入力された音声ファイルが静止画像内のキャラクターを駆動し、その口の動き、表情、体の動きを音声と同期させます。

  • 豊富なシナリオ:会話、歌、パフォーマンスの 3 つのリップシンクシナリオをサポートします。

  • 多様なキャラクター:ポートレート、半身、全身の画像を含む実在の人物や、アニメキャラクターをサポートします。

  • 出力動画の解像度:480P と 720P の解像度オプションを提供します。

重要

このドキュメントは、中国 (北京) リージョンにのみ適用されます。モデルを使用するには、中国 (北京) リージョンの API キー を使用する必要があります。

モデルと料金

モデル名

単価

レート制限 (Alibaba Cloud アカウントと RAM ユーザーで共有)

タスク送信 RPS 制限

同時タスク数

wan2.2-s2v

480P:$0.071677/秒

720P:$0.129018/秒

5

1

HTTP API

前提条件

ステップ 1:タスクの作成とタスク ID の取得

POST https://dashscope.aliyuncs.com/api/v1/services/aigc/image2video/video-synthesis
説明
  • このモデルの呼び出しは時間がかかるため、タスクは非同期呼び出しによって作成されます。

  • タスクが作成されると、システムはすぐに task_id を返します。次のステップで、この task_id を使用して 24 時間以内にタスク結果をクエリします。

リクエストパラメーター

フィールド

受け渡し方法

必須

説明

Content-Type

String

ヘッダー

はい

リクエストのタイプ。値を application/json に設定します。

application/json

Authorization

String

ヘッダー

はい

API キー。フォーマットは Bearer sk-xxx です。

Bearer sk-1a**2b

X-DashScope-Async

String

ヘッダー

はい

非同期呼び出しが使用されることを示す、`enable` に設定された静的フィールド。

enable

model

String

ボディ

はい

呼び出すモデル。

wan2.2-s2v

input.image_url

String

ボディ

はい

アップロードされた画像の URL。

  • 画像フォーマット:JPG、JPEG、PNG、BMP、WEBP がサポートされています。

  • 画像解像度:画像の幅と高さは 400〜7,000 ピクセルの範囲内である必要があります。

  • インターネット経由でアクセス可能な HTTP/HTTPS リンクのみがサポートされています。

http://aaa/bbb.jpg

input.audio_url

String

ボディ

はい

アップロードされた音声ファイルの URL。

  • 音声フォーマット:WAV と MP3 がサポートされています。

  • 音声の制限:ファイルサイズは 15 MB 未満、長さは 20 秒未満である必要があります。

  • 音声コンテンツ:音声には、クリアで大きな人間の声が含まれている必要があります。周囲の騒音やバックグラウンドミュージックなどの干渉を除去してください。

  • インターネット経由でアクセス可能な HTTP/HTTPS リンクのみがサポートされています。

http://aaa/bbb.mp3

parameters.resolution

String

ボディ

いいえ

動画の解像度レベル。

有効な値は 480P と 720P です。デフォルト値は 480P です。

モデルは、出力動画の縦横比を入力画像と同じに保とうとします。縦横比を維持したまま、動画の総ピクセル数が選択したレベルに近くなるように調整します。

480P:この解像度は通常 640 × 480 (約 31 万ピクセル) で、縦横比は 4:3 です。

720P:この解像度は通常 1280 × 720 (約 92 万ピクセル) で、縦横比は 16:9 です。

:入力画像の縦横比が 4:5 で 480P レベルを選択した場合、出力動画は 4:5 の縦横比を維持します。解像度は 31 万ピクセルに近くなるように調整されます。たとえば、出力動画の解像度は 480 × 600 (合計 288,000 ピクセル) になる場合があります。このデータは参考用です。実際の出力は異なる場合があります。

480P

レスポンスパラメーター

フィールド

説明

output.task_id

String

非同期タスクの一意の ID。

a8532587-fa8c-4ef8-82be-0c46b17950d1

output.task_status

String

非同期タスクが送信された後のタスクのステータス。

PENDING

request_id

String

リクエストの一意の ID。

7574ee8f-38a3-4b1e-9280-11c33ab46e51

リクエスト例

curl 'https://dashscope.aliyuncs.com/api/v1/services/aigc/image2video/video-synthesis/' \
 --header 'X-DashScope-Async: enable' \
 --header "Authorization: Bearer $DASHSCOPE_API_KEY" \
 --header 'Content-Type: application/json' \
 --data '{
     "model": "wan2.2-s2v",
     "input": {
            "image_url": "https://img.alicdn.com/imgextra/i3/O1CN011FObkp1T7Ttowoq4F_!!6000000002335-0-tps-1440-1797.jpg",
            "audio_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250825/iaqpio/input_audio.MP3"
        },
        "parameters": {
            "resolution": "480P"
        }
    }'

レスポンス例

{
    "output": {
        "task_id": "a8532587-fa8c-4ef8-82be-xxxxxx", 
    	"task_status": "PENDING"
    },
    "request_id": "7574ee8f-38a3-4b1e-9280-xxxxxx"
}

ステップ 2:タスク ID による結果のクエリ

前のステップで取得した task_id を使用して GET リクエストを送信し、タスクステータスと結果をクエリします。URL 内の {task_id} を実際のタスク ID に置き換えてください。

GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}
説明
  • 動画生成タスクの完了には 5〜10 分かかる場合があります。ポーリングメカニズムを使用し、15 秒などの妥当なクエリ間隔を設定して結果を取得できます。

  • 成功したタスクに対して返される video_url24 時間有効です。速やかに動画をダウンロードして保存してください。

リクエストパラメーター

フィールド

パラメーターの転送方法

必須

説明

Authorization

String

ヘッダー

はい

API キー。例:Bearer sk-xxx。

Bearer sk-xxx

task_id

String

URL パス

はい

クエリするタスクの ID。

a8532587-fa8c-4ef8-82be-0c46b17950d1

レスポンスパラメーター

フィールド

説明

output.task_id

String

クエリされたタスクの ID。

a8532587-fa8c-4ef8-82be-0c46b17950d1

output.task_status

String

タスクステータス。指定可能な値は次のとおりです。

  • PENDING:タスクはキューに入っています。

  • RUNNING:タスクは処理中です。

  • 成功

  • FAILED:タスクは失敗しました。

  • UNKNOWN:タスクが存在しないか、ステータスが不明です。

  • CANCELED:タスクはキャンセルされました。

SUCCEEDED

output.submit_time

String

タスクが送信された時刻。

2025-09-01 09:37:27.468

output.scheduled_time

String

タスクが実行を開始した時刻。

2025-09-01 09:37:34.885

output.end_time

String

タスクが完了した時刻。

2025-09-01 09:40:20.734

output.results.video_url

String

生成された動画ファイル。

video_url は 24 時間有効です。速やかにダウンロードしてください。

https://xxx/1.mp4?Expires=xxx

usage.duration

Float

動画の長さ (秒単位)。これは課金に使用され、秒単位で計算されます。

10.23

usage.video_count

Integer

生成された動画の数。

1

usage.SR

Integer

生成された動画の解像度ティア。

480

usage.size

String

リクエストによって生成された動画の解像度。

"size": "640*480"

usage.fps

Integer

リクエストによって生成された動画のフレームレート。

"fps": 16

output.code

String

エラーコード。このパラメーターはタスクが失敗した場合に返されます。

InvalidParameter

output.message

String

エラーの詳細。このパラメーターはタスクが失敗した場合に返されます。

The request is missing required parameters or in a wrong format

request_id

String

リクエストの一意の ID。

7574ee8f-38a3-4b1e-9280-11c33ab46e51

リクエスト例

86ecf553-d340-4e21-xxxxxxxxx を実際のタスク ID に置き換えてください。

curl -X GET https://dashscope.aliyuncs.com/api/v1/tasks/86ecf553-d340-4e21-xxxxxxxxx \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"
説明

task_id を使用してタスク結果をクエリできるのは 24 時間以内です。この期間を過ぎると、システムは結果を自動的に消去します。

レスポンス例

成功レスポンス

タスクステータスや動画 URL などのタスクデータは 24 時間のみ保持され、その後自動的に消去されます。結果は速やかに保存してください。

{
    "output": {
        "task_id": "bcae8761-f242-4775-a11e-xxxxxx",
        "task_status": "SUCCEEDED",
        "submit_time": "2025-09-01 09:37:27.468",
        "scheduled_time": "2025-09-01 09:37:34.885",
        "end_time": "2025-09-01 09:40:20.734",
        "results": {
            "video_url": "http://dashscope-result-hz.oss-cn-hangzhou.aliyuncs.com/1d/xxx.mp4?Expires=xxxxxx"
        }
    },
    "usage": {
        "duration": 18.13,
        "size": "512*640",
        "fps": 16,
        "video_count": 1,
        "SR": 480
    },
    "request_id": "28cfedb1-cd60-9e0c-b920-xxxxxx"
}

失敗レスポンス

{
    "request_id": "8d49f522-f6a4-9eed-b322-xxxxxx",
    "output": {
        "task_id": "101ad32f-7653-4ae9-8f22-xxxxxx",
        "task_status": "FAILED",
        "submit_time": "2025-09-01 11:43:41.174",
        "scheduled_time": "2025-09-01 11:43:48.937",
        "end_time": "2025-09-01 11:43:49.802",
        "code": "InvalidURL",
        "message": "Required URL is missing or invalid, please check the request URL."
    }
}

課金とレート制限

  • モデルの無料クォータと課金単価については、「Wanxiang - デジタルヒューマン」をご参照ください。

  • モデルのレート制限については、「Wanxiang series」をご参照ください。

  • 課金の詳細:

    • 入力は課金対象外です。出力は、正常に生成された動画の秒数に基づいて課金されます。

    • モデル呼び出しの失敗または処理エラーが発生した場合、課金は発生せず、新規ユーザー向け無料クォータも消費されません。

エラーコード

モデルの呼び出しに失敗し、エラーメッセージが返された場合は、「エラーメッセージ」をご参照ください。