Qwen-Image-Edit は、複数の入力画像と出力画像をサポートします。画像内のテキストを正確に修正したり、オブジェクトを追加・削除・移動したり、被写体の動作を変更したり、画像スタイルを転送したり、ディテールを強化したりできます。
クイックスタート
この例では、qwen-image-2.0-pro を使用して、3 つの入力画像と 1 つのプロンプトから 2 つの編集済み画像を生成する方法を説明します。
入力プロンプト:画像 1 の女性が、画像 2 の黒いドレスを着用し、画像 3 のポーズで座る。
入力画像 1 | 入力画像 2 | 入力画像 3 | 出力画像(複数) | |
|
|
|
|
|
API を呼び出す前に、API キーを取得し、環境変数として API キーをエクスポートしてください。
SDK を使用して API を呼び出すには、DashScope SDK をインストールしてください。SDK は Python および Java 向けに提供されています。
Qwen の画像編集モデルは、1~3 枚の入力画像をサポートします。qwen-image-2.0、qwen-image-edit-max、および qwen-image-edit-plus シリーズは、1~6 枚の画像を生成できます。qwen-image-edit は、1 枚の画像のみを生成できます。生成された画像の URL は24 時間有効です。生成された画像をローカルデバイスにダウンロードしてください。
Python
import json
import os
import dashscope
from dashscope import MultiModalConversation
# 以下はシンガポールリージョン向けの URL です。北京リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1 に置き換えてください。
dashscope.base_http_api_url = 'https://dashscope-intl.aliyuncs.com/api/v1'
# このモデルは、1~3 枚の入力画像をサポートします。
messages = [
{
"role": "user",
"content": [
{"image": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/thtclx/input1.png"},
{"image": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/iclsnx/input2.png"},
{"image": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/gborgw/input3.png"},
{"text": "画像 1 の女性が、画像 2 の黒いドレスを着用し、画像 3 のポーズで座るようにしてください。"}
]
}
]
# シンガポールリージョンと北京リージョンでは、別々の API キーを使用します。API キーの取得先:https://www.alibabacloud.com/help/en/model-studio/get-api-key
# 環境変数が設定されていない場合は、API キーを指定してください:api_key="sk-xxx"
api_key = os.getenv("DASHSCOPE_API_KEY")
# qwen-image-2.0、qwen-image-edit-max、および qwen-image-edit-plus シリーズは、1~6 枚の画像を出力できます。この例では、2 枚の画像を出力する方法を示しています。
response = MultiModalConversation.call(
api_key=api_key,
model="qwen-image-2.0-pro",
messages=messages,
stream=False,
n=2,
watermark=False,
negative_prompt=" ",
prompt_extend=True,
size="1024*1536",
)
if response.status_code == 200:
# 完全な応答を表示するには、次の行のコメントを解除してください。
# print(json.dumps(response, ensure_ascii=False))
for i, content in enumerate(response.output.choices[0].message.content):
print(f"出力画像 {i+1} の URL:{content['image']}")
else:
print(f"HTTP ステータスコード:{response.status_code}")
print(f"エラーコード:{response.code}")
print(f"エラーメッセージ:{response.message}")
print("詳細については、ドキュメントをご参照ください:https://www.alibabacloud.com/help/en/model-studio/error-code")
Java
import com.alibaba.dashscope.aigc.multimodalconversation.MultiModalConversation;
import com.alibaba.dashscope.aigc.multimodalconversation.MultiModalConversationParam;
import com.alibaba.dashscope.aigc.multimodalconversation.MultiModalConversationResult;
import com.alibaba.dashscope.common.MultiModalMessage;
import com.alibaba.dashscope.common.Role;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import com.alibaba.dashscope.exception.UploadFileException;
import com.alibaba.dashscope.utils.JsonUtils;
import com.alibaba.dashscope.utils.Constants;
import java.io.IOException;
import java.util.Arrays;
import java.util.Collections;
import java.util.HashMap;
import java.util.Map;
import java.util.List;
public class QwenImageEdit {
static {
// 以下はシンガポールリージョン向けの URL です。北京リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1 に置き換えてください。
Constants.baseHttpApiUrl = "https://dashscope-intl.aliyuncs.com/api/v1";
}
// シンガポールリージョンと北京リージョンでは、別々の API キーを使用します。API キーの取得先:https://www.alibabacloud.com/help/en/model-studio/get-api-key
// 環境変数が設定されていない場合は、API キーを指定してください:apiKey="sk-xxx"
static String apiKey = System.getenv("DASHSCOPE_API_KEY");
public static void call() throws ApiException, NoApiKeyException, UploadFileException, IOException {
MultiModalConversation conv = new MultiModalConversation();
// このモデルは、1~3 枚の入力画像をサポートします。
MultiModalMessage userMessage = MultiModalMessage.builder().role(Role.USER.getValue())
.content(Arrays.asList(
Collections.singletonMap("image", "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/thtclx/input1.png"),
Collections.singletonMap("image", "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/iclsnx/input2.png"),
Collections.singletonMap("image", "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/gborgw/input3.png"),
Collections.singletonMap("text", "画像 1 の女性が、画像 2 の黒いドレスを着用し、画像 3 のポーズで座るようにしてください。")
)).build();
// qwen-image-2.0、qwen-image-edit-max、および qwen-image-edit-plus シリーズは、1~6 枚の画像を出力できます。この例では、2 枚の画像を出力する方法を示しています。
Map<String, Object> parameters = new HashMap<>();
parameters.put("watermark", false);
parameters.put("negative_prompt", " ");
parameters.put("n", 2);
parameters.put("prompt_extend", true);
parameters.put("size", "1024*1536");
MultiModalConversationParam param = MultiModalConversationParam.builder()
.apiKey(apiKey)
.model("qwen-image-2.0-pro")
.messages(Collections.singletonList(userMessage))
.parameters(parameters)
.build();
MultiModalConversationResult result = conv.call(param);
// 完全な応答を表示するには、次の行のコメントを解除してください。
// System.out.println(JsonUtils.toJson(result));
List<Map<String, Object>> contentList = result.getOutput().getChoices().get(0).getMessage().getContent();
int imageIndex = 1;
for (Map<String, Object> content : contentList) {
if (content.containsKey("image")) {
System.out.println("出力画像 " + imageIndex + " の URL:" + content.get("image"));
imageIndex++;
}
}
}
public static void main(String[] args) {
try {
call();
} catch (ApiException | NoApiKeyException | UploadFileException | IOException e) {
System.out.println(e.getMessage());
}
}
}curl
以下のコマンドは、シンガポールリージョン向けの URL を使用しています。中国 (北京) リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation に置き換えてください。
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--data '{
"model": "qwen-image-2.0-pro",
"input": {
"messages": [
{
"role": "user",
"content": [
{
"image": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/thtclx/input1.png"
},
{
"image": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/iclsnx/input2.png"
},
{
"image": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/gborgw/input3.png"
},
{
"text": "画像 1 の女性が、画像 2 の黒いドレスを着用し、画像 3 のポーズで座るようにしてください。"
}
]
}
]
},
"parameters": {
"n": 2,
"negative_prompt": " ",
"prompt_extend": true,
"watermark": false,
"size": "1024*1536"
}
}'モデル推奨事項
qwen-image-2.0-proシリーズ(推奨): 画像生成および編集を統合したモデルで、テキストレンダリング、リアルな質感、意味的整合性の向上に特化しています。qwen-image-2.0シリーズ: 画像生成および編集を統合したモデルの高速版で、品質とパフォーマンスのバランスを最適化しています。
各リージョンでサポートされるモデルについては、「モデル一覧」をご参照ください。
入力命令
入力画像(messages)
messages パラメーターは配列であり、単一のオブジェクトのみを含む必要があります。このオブジェクトには、role および content プロパティを含める必要があります。role プロパティは user に設定する必要があります。content プロパティには、image(1~3 枚の画像)および text(1 つの編集命令)を含める必要があります。
入力画像は、以下の要件を満たす必要があります:
サポートされる画像形式は JPG、JPEG、PNG、BMP、TIFF、WEBP、GIF です。
出力画像は PNG 形式です。アニメーション GIF の場合は、最初のフレームのみが処理されます。
最適な結果を得るためには、画像の解像度を幅・高さともに 384~3072 ピクセルの範囲にすることを推奨します。解像度が低すぎると出力画像がぼやける可能性があり、高すぎると処理時間が長くなる可能性があります。
1 枚の画像ファイルのサイズは 10 MB を超えてはなりません。
"messages": [
{
"role": "user",
"content": [
{ "image": "公開 URL または Image 1 の Base64 データ" },
{ "image": "公開 URL または Image 2 の Base64 データ" },
{ "image": "公開 URL または Image 3 の Base64 データ" },
{ "text": "編集命令(例:'画像 1 の女性が、画像 2 の黒いドレスを着用し、画像 3 のポーズで座る')" }
]
}
]画像の入力順序
複数の入力画像を指定する場合、その順序は配列内の並び順によって定義されます。編集命令は、content フィールド内の画像の順序(例:「画像 1」「画像 2」)に対応している必要があります。
入力画像 1 | 入力画像 2 | 出力画像 | |
|
|
画像 1 の女性の服を、画像 2 の女性の服に置き換えます。 |
画像 2 の女性の服を、画像 1 の女性の服に置き換えます。 |
画像の入力方法
公開 URL
HTTP または HTTPS プロトコルをサポートする、一般に公開されている画像 URL を指定できます。
例:
https://xxxx/img.png。
Base64 エンコーディング
画像ファイルを Base64 エンコードされた文字列に変換し、以下の形式で連結します:data:{mime_type};base64,{base64_data}。
{mime_type}:画像のメディアタイプで、ファイル形式に対応している必要があります。{base64_data}:ファイルの Base64 エンコード文字列です。例:
data:image/jpeg;base64,GDU7MtCZz...(例は簡略化のため省略されています)。
完全なコード例については、「Python SDK」および「Java SDK」をご参照ください。
その他のパラメーター
以下の任意のパラメーターを使用して、生成結果を調整できます:
n:生成する画像の枚数。デフォルト値は 1 です。qwen-image-2.0、qwen-image-edit-max、および qwen-image-edit-plus シリーズのモデルは、1~6 枚の画像を生成できます。
qwen-image-editモデルは、1 枚の画像のみを生成できます。negative_prompt:画像から除外するコンテンツ(例:「blur(ぼかし)」や「extra fingers(余分な指)」など)を記述します。このパラメーターにより、生成画像の品質を最適化できます。
watermark:画像の右下隅に「Qwen-Image」のウォーターマークを追加するかどうかを指定します。デフォルト値は
falseです。以下の画像に、ウォーターマークのスタイルを示します:
seed:乱数シード。値は
[0, 2147483647]の整数である必要があります。このパラメーターを指定しない場合、アルゴリズムがランダムな数値をシードとして生成します。同じシード値を使用すると、生成結果を一貫して再現できます。
以下の任意のパラメーターは、qwen-image-2.0、qwen-image-edit-max、および qwen-image-edit-plus シリーズのモデルでのみ利用可能です:
size:出力画像の解像度。形式は
width*height(例:"1024*2048")です。qwen-image-2.0 シリーズのモデルでは、幅と高さを自由に設定できます。出力画像の総ピクセル数は、512 × 512 ~ 2048 × 2048 の範囲内である必要があります。デフォルトでは、入力画像(複数ある場合は最後の画像)と同じ解像度になります。qwen-image-edit-max および qwen-image-edit-plus シリーズのモデルでは、幅と高さを 512~2048 ピクセルの範囲で設定できます。デフォルトでは、出力画像の解像度は1024*1024に近くなり、元の画像に近い縦横比になります。prompt_extend:プロンプトの書き換え機能を有効または無効にします。デフォルト値は
trueです。有効にすると、モデルがプロンプトを最適化します。この機能は、シンプルまたは記述が不十分なプロンプトに対して、結果を大幅に改善できます。
パラメーターの完全な一覧については、「Qwen-Image-Edit API リファレンス」をご参照ください。
概要
マルチ画像融合
入力画像 1 | 入力画像 2 | 入力画像 3 | 出力画像 |
|
|
|
画像 1 の女性が、画像 2 のネックレスを着用し、画像 3 のバッグを左肩にかけている。 |
トピックの一貫性
入力画像 | 出力画像 1 | 出力画像 2 | 出力画像 3 |
|
青色の背景を持つ ID 写真に変更します。人物は白いシャツ、黒いスーツ、ストライプ柄のネクタイを着用しています。 |
人物は白いシャツ、グレーのスーツ、ストライプ柄のネクタイを着用しています。片手はネクタイに添えられています。背景は淡い色調です。 |
人物は「Qwen Image」と太い筆致フォントで書かれた黒いパーカーを着用しています。光が髪を照らす中、手すりにもたれかかっています。背景には橋と海が広がっています。 |
|
エアコンをソファの隣にあるリビングルームに設置します。 |
エアコンの吹出口から霧を発生させ、ソファにかかっています。さらに、緑の葉も追加されています。 |
上部に白い手書き文字「自然新風 畅享呼吸」を追加します。 |
スケッチ作成
入力画像 | 出力画像 | |
|
画像 1 で詳細に描かれた形状に一致する画像を生成し、以下の説明に従います:晴れた日に微笑む若い女性。丸い茶色のサングラス(レオパード柄のフレーム)を着用。髪はきちんとまとめられ、真珠のイヤリング、紫の星柄の濃紺のスカーフ、黒いレザージャケットを身に着けています。 |
画像 1 で詳細に描かれた形状に一致する画像を生成し、以下の説明に従います:カメラに向かって微笑む高齢の男性。顔にはしわがあり、風で髪が乱れており、丸いフレームの老眼鏡をかけています。首には星柄の使い古された赤いスカーフを巻き、綿入りジャケットを着ています。 |
クリエイティブなプロダクト生成
入力画像 | 出力画像 | ||
|
このクマを、白い背景に薄灰色の三日月の輪郭で表現された月の下に座らせ、ギターを持たせ、小さな星や「Be Kind」というフレーズの吹き出しを周囲に浮かべます。 |
このデザインを T シャツおよび紙製トートバッグに印刷します。女性モデルがこれらのアイテムを展示しています。女性は「Be kind」と書かれた野球帽も着用しています。 |
商業用完成品として設計された、ハイパーリアリスティックな 1/7 スケールのキャラクターモデルを、ホワイトキーボード付きの iMac が置かれたデスク上に配置します。モデルは、ラベルや文字のないクリアな円形アクリル台座の上に立ちます。プロフェッショナルなスタジオ照明が、彫刻されたディテールを際立たせます。背景の iMac 画面には、同一モデルの ZBrush によるモデリングプロセスが表示されています。モデルの隣には、前面に透明ウィンドウを備えたパッケージボックスを配置し、内部にはクリアなプラスチックシェルのみが見えるようにします。ボックスはモデルよりやや高く、収容可能なサイズになっています。 |
このクマは宇宙飛行士のスーツを着用し、遠くを指差しています。 |
このクマは豪華なボールガウンを着用し、優雅なダンスポーズで両腕を広げています。 |
このクマはスポーツウェアを着用し、バスケットボールを抱え、片足を曲げています。 | |
深度マップからの画像生成
入力画像 | 出力画像 | |
|
画像 1 で描かれた深度マップに一致する画像を生成し、以下の説明に従います:石畳の脇道に青い自転車が停められており、背景の石の割れ目から雑草が生えています。 |
画像 1 で描かれた深度マップに一致する画像を生成し、以下の説明に従います:泥だらけの道に古びた赤い自転車が停められており、背景には鬱蒼とした原生林が広がっています。 |
キーポイントからの画像生成
入力画像 | 出力画像 | |
|
画像 1 で描かれた人物のポーズに一致する画像を生成し、以下の説明に従います:雨の中、油紙傘を手に持つ漢服姿の中国女性。背景には蘇州庭園があります。 |
画像 1 で描かれた人物のポーズに一致する画像を生成し、以下の説明に従います:地下鉄のホームに立つ若者。野球帽、T シャツ、ジーンズを着用しています。背後には電車が疾走しています。 |
テキスト編集
入力画像 | 出力画像 | 入力画像 | 出力画像 |
|
Scrabble タイルの「HEALTH INSURANCE」を「明天会更好」に置き換えます。 |
|
メモの「Take a Breather」を「Relax and Recharge」に変更します。 |
入力画像 | 出力画像 | ||
|
「Qwen-Image」を黒いインク滴フォントに変更します。 |
「Qwen-Image」を黒い手書きフォントに変更します。 |
「Qwen-Image」を黒いピクセルフォントに変更します。 |
「Qwen-Image」を赤色に変更します。 |
「Qwen-Image」を青紫色のグラデーションに変更します。 |
「Qwen-Image」をキャンディカラーに変更します。 | |
「Qwen-Image」の素材を金属に変更します。 |
「Qwen-Image」の素材を雲に変更します。 |
「Qwen-Image」の素材をガラスに変更します。 | |
要素の追加・削除・変更・置き換え
機能 | 入力画像 | 出力画像 |
要素の追加 |
|
ペンギンの前に「Welcome to Penguin Beach」と書かれた小さな木製の看板を追加します。 |
要素の削除 |
|
皿の上の髪の毛を削除します。 |
要素の置き換え |
|
モモをリンゴに変更します。 |
肖像画の修正 |
|
目を閉じるようにします。 |
ポーズの修正 |
|
両手をカメラに向かって開き、指を広げて遊び心のあるポーズをとります。 |
視点変換
入力画像 | 出力画像 | 入力画像 | 出力画像 |
|
正面ビューを取得します。 |
|
左を向きます。 |
|
背面ビューを取得します。 |
|
右を向きます。 |
背景の置き換え
入力画像 | 出力画像 | |
|
背景をビーチに変更します。 |
元の背景を、リアルな現代の教室シーンに置き換えます。背景の中央には伝統的な濃緑色または黒の黒板があり、白いチョークで「Qwen」という漢字がきれいに書かれています。 |
古い写真の処理
機能 | 入力画像 | 出力画像 |
古い写真の修復および彩色 |
|
古い写真を修復し、傷を除去し、ノイズを低減し、ディテールを強化し、高解像度でリアルな画像を生成します。自然な肌色、鮮明な顔の特徴、歪みなし。 |
|
画像の内容に基づいて、知的に彩色して、より鮮やかにします。 |
課金およびレート制限
無料クォータおよび料金については、「モデル一覧および料金」をご参照ください。
レート制限については、「Qwen-Image」をご参照ください。
課金の詳細:
課金は正常に生成された画像の枚数に基づきます。失敗したモデル呼び出しや処理エラーは、課金対象外であり、無料クォータも消費しません。
無料クォータを使い切った後に追加の課金を回避するため、「無料クォータのみ」機能を有効化できます。詳細については、「新規ユーザー向け無料クォータ」をご参照ください。
API リファレンス
API の入力および出力パラメーターについては、「Qwen - 画像編集」をご参照ください。
エラーコード
モデル呼び出しが失敗し、エラーメッセージが返された場合は、「エラーメッセージ」をご参照ください。
よくある質問
Q:Qwen の画像編集モデルは、どのような言語をサポートしていますか?
A:正式に簡体字中国語および英語をサポートしています。その他の言語も動作する場合がありますが、結果は保証されません。
Q:モデル呼び出しのメトリックを確認するにはどうすればよいですか?
A:モデル呼び出しが完了してから 1 時間後、モデルモニタリング(シンガポール) または モデルモニタリング(中国 (北京)) ページにアクセスして、呼び出し回数や成功率などのメトリックを確認できます。詳細については、「請求照会およびコスト管理」をご参照ください。
Q:画像ストレージ用のドメイン名ホワイトリストを取得するにはどうすればよいですか?
A:モデルによって生成された画像は OSS に保存されます。API は一時的な公開 URL を返します。このダウンロード URL のファイアウォールホワイトリストを設定するには、以下の点に注意してください:基盤となるストレージは動的に変更される可能性があります。本トピックでは、過時情報によるアクセス障害を防ぐため、固定の OSS ドメイン名ホワイトリストを提供していません。セキュリティ制御が必要な場合は、アカウントマネージャーに連絡して、最新の OSS ドメイン名リストを取得してください。
詳細については、「画像生成に関するよくある質問」をご参照ください。











































































