EMO モデルは、ポートレート画像と音声オーディオを使用して、顔のアニメーションビデオを生成します。
このドキュメントは、中国 (北京) リージョンにのみ適用されます。モデルを使用するには、中国 (北京) リージョンの API キー を使用する必要があります。
パフォーマンスのショーケース
サンプル入力 | サンプル出力 |
ポートレート:
音声オーディオ: | アクションスタイルの強度: |
その他の例については、「パフォーマンスのショーケース」をご参照ください。
アップロードされたすべての画像と音声ファイルが法的に準拠したソースからのものであり、使用に必要な権限を持っていることを確認してください。
前提条件
モデルサービスを 有効化して API キーを取得 し、API キーを環境変数として設定 する必要があります。
EMO 画像検出 API を使用して入力画像を処理し、顔領域 (face_bbox) と動的領域 (ext_bbox) の座標値を取得できます。これらの値はリクエストパラメーターとして使用されます。
HTTP 呼び出し
ステップ 1: タスクを作成してタスク ID を取得する
POST https://dashscope.aliyuncs.com/api/v1/services/aigc/image2video/video-synthesisタスクを作成すると、システムはすぐに
task_idを返します。この ID を使用してステップ 2 でタスク結果をクエリできます。task_idは作成後 24 時間有効です。
リクエストパラメーター | |
ヘッダー | |
X-DashScope-Async 非同期処理構成パラメーター。HTTP リクエストは非同期処理のみをサポートします。このパラメーターを 重要 このリクエストヘッダーがない場合、「current user api does not support synchronous calls」というエラーメッセージが返されます。 | |
Authorization このヘッダーは身分認証に使用されます。API は Alibaba Cloud Model Studio API キーを使用してリクエストを認証します。例: Bearer sk-xxxx。 | |
Content-Type リクエストのコンテンツタイプ。このパラメーターを | |
リクエストボディ | |
model モデル名。例: emo-v1。 | |
input 基本的な入力情報を指定します。 | |
parameters |
レスポンスパラメーター | 成功レスポンスのサンプルエラーレスポンスのサンプル |
output タスクの出力情報を含みます。 | |
request_id 一意のリクエスト ID。この ID を使用して問題を追跡およびトラブルシューティングできます。 | |
code リクエストが失敗したときに返されるエラーコード。詳細については、「エラーコード」をご参照ください。 | |
message リクエストが失敗したときに返される詳細なエラーメッセージ。詳細については、「エラーコード」をご参照ください。 |
ステップ 2: タスク ID に基づいて結果をクエリする
前のステップの task_id を使用して、タスクのステータスと結果をポーリングします。URL の {task_id} を実際のタスク ID に置き換えてください。
GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}`task_id` の有効性: ID は作成後 24 時間有効です。この期間を過ぎると、結果をクエリできなくなります。API は
UNKNOWNのタスクステータスを返します。タスクステータスのフロー: 正常に処理されるタスクは、`PENDING` (キュー内)、`RUNNING` (処理中)、`SUCCEEDED` (成功) または `FAILED` (失敗) のステータスを遷移します。
結果の取得: ビデオの生成には数分かかります。クエリ API のデフォルトの上限は 20 QPS です。15 秒などの合理的なクエリ間隔でポーリングメカニズムを使用して結果を取得します。
video_url の有効性: タスクが成功した後、URL は 24 時間有効です。リンクを取得したらすぐにビデオをダウンロードして永続ストレージに転送する必要があります (例: Object Storage Service (OSS))。
リクエストパラメーター | |
ヘッダー | |
Authorization リクエストの身分認証に使用されます。API は Alibaba Cloud Model Studio API キーを使用して認証します。例: Bearer sk-xxxx。 | |
URL パスパラメーター | |
task_id クエリするタスクの `task_id`。例: a8532587-fa8c-4ef8-82be-xxxxxx。 |
レスポンスパラメーター | 成功レスポンスのサンプルエラーレスポンスのサンプル |
request_id 一意のリクエスト ID。この ID を使用して問題を追跡およびトラブルシューティングできます。 | |
output タスクの出力情報を含みます。 | |
usage |
課金とレート制限
モデル名 | 単価 | タスク送信 QPS 制限 | 同時タスク |
emo-v1 | 従量課金制。出力ビデオの実際の時間に基づいて課金されます:
| 5 | 1 (超過したタスクはキューに入れられます。) |
エラーコード
Alibaba Cloud Model Studio プラットフォームの一般的なステータスコードについては、「エラーメッセージ」をご参照ください。
このモデルには、次の特定のエラーコードもあります:
HTTP リターンコード | エラーコード | エラーメッセージ | 説明 |
400 | InvalidParameter | The request is missing required parameters or in a wrong format, please check the parameters that you send. | 入力パラメーターのフォーマットが正しくありません。 |
400 | InvalidParameter | The style_level is invalid. | `style_level` の値が列挙範囲内にありません。 |
400 | InvalidParameter.DataInspection | Unable to download the media resource during the data inspection process. | システムが画像または音声ファイルをダウンロードする際にタイムアウトが発生しました。 中国国外から呼び出しを行う場合、不安定なクロスボーダーネットワークのためにリソースのダウンロードタイムアウトが発生することがあります。ファイルを中国の OSS に保存してからモデルを呼び出すことができます。一時記憶領域 を使用してファイルをアップロードすることもできます。 |
400 | InvalidURL | The request URL is invalid, please check the request URL is available and the request image format is one of the following types: JPEG, JPG, PNG, BMP, and WEBP. | 入力画像のダウンロードに失敗しました。ネットワークまたは入力フォーマットを確認してください。サポートされているフォーマットは JPEG、JPG、PNG、BMP、WEBP です。 |
400 | InvalidURL | Required URL is missing or invalid, please check the request URL. | 入力 URL が正しくないか、見つかりません。 |
400 | InvalidURL | The input audio is longer than 60s! | 入力音声ファイルが最大長の 60 秒を超えています。 |
400 | InvalidURL | File size is larger than 15MB. | 入力音声ファイルが最大サイズの 15 MB を超えています。 |
400 | InvalidURL | File type is not supported. Allowed types are: .wav, .mp3. | 入力音声のフォーマットが無効です。サポートされているフォーマットは WAV と MP3 です。 |
400 | InvalidFile.Content | The input image has no human body. Please upload other image with single person. | 入力画像に人物が見つかりません。人物を含む画像をアップロードしてください。 |
400 | InvalidFile.Content | The input image has multi human bodies. Please upload other image with single person. | 入力画像に複数の人物が見つかりました。1 人だけを含む画像をアップロードしてください。 |
400 | InvalidFile.BodyProportion | The proportion of the detected person in the picture is too large or too small, please upload other image. | 入力画像内の人物の比率が要件を満たしていません。 |
400 | InvalidFile.Resolution | The image resolution is invalid, please make sure that the largest length of image is smaller than 7000, and the smallest length of image is larger than 400. | 画像の解像度が無効です。最小辺の長さは 400 ピクセル以上、最大辺の長さは 7,000 ピクセルを超えてはなりません。 |
400 | InvalidFile.Value | The value of the image is invalid, please upload other clearer image. | 入力画像が暗すぎて要件を満たしていません。より鮮明な画像をアップロードしてください。 |
400 | InvalidFile.FrontBody | The pose of the detected person is invalid, please upload other image with the front view. | アップロードされた画像の人物がカメラから顔を背けており、要件を満たしていません。人物の正面からの画像をアップロードしてください。 |
400 | InvalidFile.FullFace | The pose of the detected face is invalid, please upload other image with whole face. | アップロードされた画像の人物の顔のポーズが要件を満たしていません。顔が見える画像をアップロードしてください。 |
400 | InvalidFile.FacePose | The pose of the detected face is invalid, please upload other image with the expected orientation. | アップロードされた画像の人物の顔のポーズが要件を満たしていません。顔の向きが大きくずれていない画像をアップロードしてください。 |
