Wan 画像から動画へモデルは、マルチモーダル入力 (テキスト、画像、音声、動画) をサポートし、主に3つのタスクを実行できます:開始フレームからの動画生成、開始フレームと終了フレームからの動画生成、動画の続きを生成。
新しい画像から動画への API (wan2.7-i2v モデル) は、これら 3 つのタスクをサポートします。この新しい API を使用してください。
元の開始フレームからの画像から動画への生成 API (wan2.6 以前のモデル) は、開始フレームからの動画生成のみをサポートします。
利用可能なリージョン
API 呼び出しを成功させるには、モデル、エンドポイント URL、API キーに同じリージョンを使用する必要があります。リージョンをまたいだ呼び出しは失敗します。
モデルの選択:モデルが対象リージョンで利用可能であることを確認します。
URL の選択:対応するリージョンのエンドポイント URL を選択します。
API キーの設定:リージョン用の API キーを取得し、API キーを環境変数として設定します。
このトピックのサンプルコードは、シンガポールリージョンに適用されます。
HTTP
この API は、新しい画像から動画へのプロトコルを使用し、wan2.7 モデルのみをサポートします。
画像から動画へのタスクは 1〜5 分かかるため、API は非同期呼び出しを使用します。プロセスは 2 つのステップで構成されます:
ステップ 1:タスクを作成し、タスク ID を取得
シンガポール
POST https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis
北京
POST https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis
タスクが作成された後、返された
task_idを使用して結果をクエリします。task_idは 24 時間有効です。重複したタスクを作成しないでください。代わりに、ポーリングを使用して結果を取得してください。初心者向けのチュートリアルについては、「Postman」をご参照ください。
リクエストパラメーター | 開始フレームからの動画生成開始フレームの画像と音声に基づいて動画を生成します。 開始フレームと終了フレームからの動画生成開始フレームと終了フレームを渡して動画を生成します。 ビデオの続き最初のビデオクリップに基づいて後続のコンテンツを生成します。 |
Content-Type リクエストのコンテンツタイプは | |
Authorization Model Studio API キーを使用した認証情報。 例: | |
X-DashScope-Async 非同期処理を有効にします。HTTP リクエストは非同期処理のみをサポートするため、 重要 含まれていない場合、「current user api does not support synchronous calls」エラーが返されます。 | |
リクエストボディ | |
model モデル名。モデルのリストとその価格については、「モデルの価格」をご参照ください。 例:wan2.7-i2v。 | |
input プロンプトなどの基本的な入力情報。 | |
parameters 解像度、持続時間、プロンプトリライト、ウォーターマークなどの動画処理パラメーター。 |
レスポンスパラメーター | 成功応答
エラー応答タスクの作成に失敗しました。問題を解決するには、「エラーコード」をご参照ください。 |
output タスクの出力情報。 | |
request_id リクエストの一意の識別子。問題の追跡とトラブルシューティングに使用します。 | |
code エラーコード。リクエストが失敗した場合にのみ返されます。詳細については、「エラーコード」をご参照ください。 | |
message 詳細なエラーメッセージ。リクエストが失敗した場合にのみ返されます。詳細については、「エラーコード」をご参照ください。 |
ステップ 2:タスク ID で結果をクエリ
シンガポール
GET https://dashscope-intl.aliyuncs.com/api/v1/tasks/{task_id}
北京
GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}
ポーリングの推奨:動画生成には数分かかることがあります。15 秒などの適切なクエリ間隔でポーリングメカニズムを使用して、結果を取得してください。
タスクステータスの遷移:PENDING → RUNNING → SUCCEEDED または FAILED。
結果の URL:タスクが成功すると、動画の URL が返されます。URL は 24 時間有効です。URL を取得したら、すぐに動画をダウンロードし、Object Storage Service (OSS) などの永続的なストレージサービスに保存する必要があります。
task_id の有効期間:24 時間。この期間を過ぎると、結果をクエリできなくなり、API はタスクステータスとして
UNKNOWNを返します。
リクエストパラメーター | タスク結果のクエリ
|
ヘッダー | |
Authorization Model Studio API キーを使用した認証情報。 例: | |
パスパラメーター | |
task_id クエリするタスクの ID。 |
レスポンスパラメーター | タスク成功動画の URL は 24 時間のみ保持され、その後自動的に消去されます。生成された動画は速やかに保存してください。 タスク失敗タスクが失敗すると、 タスククエリの期限切れ
|
output タスクの出力情報。 | |
usage 出力情報の統計。成功した結果のみがカウントされます。 | |
request_id リクエストの一意の識別子。問題の追跡とトラブルシューティングに使用します。 |
制限事項
データの有効期間:
task_idとvideo_urlは 24 時間のみ保持されます。この期間を過ぎると、クエリやダウンロードはできません。コンテンツモデレーション:入力コンテンツ (プロンプト、画像、動画など) と出力動画はコンテンツモデレーションの対象となります。コンテンツがルールに違反する場合、システムは「IPInfringementSuspect」または「DataInspectionFailed」エラーを返します。詳細については、「エラーメッセージ」をご参照ください。
エラーコード
モデルの呼び出しが失敗し、エラーメッセージが返された場合は、「エラーメッセージ」を参照して問題を解決してください。
よくある質問
Q:3:4 のような特定の縦横比の動画を生成するにはどうすればよいですか?
A:出力動画の縦横比は、入力素材 (開始フレームの画像または開始ビデオクリップ) によって決まります。ただし、出力の縦横比は入力比率と完全に同じになることは保証されません。例えば、正確に 3:4 にならない場合があります。わずかなズレが生じることがあります。
以下の例では、「入力開始フレーム画像」を使用したロジックを説明します:
なぜバイアスが発生するのですか?
実行ロジック:システムは入力画像の縦横比をベースライン参照として使用します。これを
resolutionレベルの目標総ピクセル数と組み合わせます。動画の幅と高さは、ビデオエンコーディングの仕様により 16 の倍数である必要があります。システムは最も近い有効な解像度に自動的に調整します。計算例:入力開始フレーム画像のサイズが 750 × 1000 ピクセル (縦横比 3:4 = 0.75) の場合。解像度は「720P」(約 920,000 総ピクセルを目標) に設定されています。実際の出力動画の解像度は 816 × 1104 ピクセル (縦横比 ≈ 0.739、約 900,000 総ピクセル) になります。
推奨事項:
入力制御:目標の縦横比に一致する開始フレームまたはビデオクリップを使用します。
後処理:厳密な縦横比の要件がある場合は、生成後に編集ツールを使用して動画をトリミングするか、黒枠を追加します。
Q:動画ストレージアクセス用のドメイン名のホワイトリストを取得するにはどうすればよいですか?
A:モデルによって生成された動画は OSS に保存されます。API は一時的な公開 URL を返します。このダウンロード URL のファイアウォールホワイトリストを設定するには、次の点にご注意ください:基盤となるストレージは動的に変更される可能性があります。このトピックでは、古い情報によるアクセス問題を避けるため、固定の OSS ドメイン名ホワイトリストは提供していません。セキュリティ制御の要件がある場合は、アカウントマネージャーに連絡して最新の OSS ドメイン名リストを入手してください。