Qwen-Image-Edit-Plus は、複数画像の入力と出力をサポートしています。画像内のテキストの正確な変更、オブジェクトの追加、削除、移動、被写体の動作の変更、画像スタイルの転送、および詳細の強調表示が可能です。
クイックスタート
この例では、qwen-image-edit-plus を使用して、3 つの入力画像とプロンプトに基づいて 2 つの編集済み画像を生成する方法を示します。
入力プロンプト:画像 1 の女の子が画像 2 の黒いドレスを着て、画像 3 のポーズで座る。
入力画像 1 | 入力画像 2 | 入力画像 3 | 出力画像 (複数画像) | |
|
|
|
|
|
呼び出しを行う前に、API キーを取得し、API キーを環境変数として設定してください。
SDK を使用して呼び出しを行うには、DashScope SDK をインストールしてください。SDK は Python と Java で利用できます。
Qwen 画像編集モデルは、1 ~ 3 枚の入力画像に対応しています。 qwen-image-edit-plus、qwen-image-edit-plus-2025-12-15、および qwen-image-edit-plus-2025-10-30 を含む qwen-image-edit-plus シリーズのモデルは、1 ~ 6 枚の画像を生成できます。 qwen-image-edit モデルは、1 枚の画像のみを生成できます。 生成された画像の URL は24 時間有効です。 速やかに画像をローカルデバイスにダウンロードしてください。
Python
import json
import os
import dashscope
from dashscope import MultiModalConversation
# 以下はシンガポールリージョンの URL です。北京リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1 に置き換えてください。
dashscope.base_http_api_url = 'https://dashscope-intl.aliyuncs.com/api/v1'
# モデルは 1〜3 枚の入力画像をサポートします。
messages = [
{
"role": "user",
"content": [
{"image": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/thtclx/input1.png"},
{"image": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/iclsnx/input2.png"},
{"image": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/gborgw/input3.png"},
{"text": "画像 1 の女の子が画像 2 の黒いドレスを着て、画像 3 のポーズで座るようにしてください。"}
]
}
]
# シンガポールリージョンと北京リージョンの API キーは異なります。API キーの取得:https://www.alibabacloud.com/help/ja/model-studio/get-api-key
# 環境変数を設定していない場合は、次の行をご利用の Model Studio API キーに置き換えてください:api_key="sk-xxx"
api_key = os.getenv("DASHSCOPE_API_KEY")
# qwen-image-edit-plus は 1〜6 枚の画像の出力をサポートします。この例では 2 枚の画像を出力する方法を示します。
response = MultiModalConversation.call(
api_key=api_key,
model="qwen-image-edit-plus",
messages=messages,
stream=False,
n=2,
watermark=False,
negative_prompt="low quality",
prompt_extend=True,
# size パラメーターは、出力画像数 n が 1 の場合にのみサポートされます。それ以外の場合はエラーが報告されます。
# size="1024*2048",
)
if response.status_code == 200:
# 完全な応答を表示するには、次の行のコメントを解除してください。
# print(json.dumps(response, ensure_ascii=False))
for i, content in enumerate(response.output.choices[0].message.content):
print(f"出力画像 {i+1} の URL: {content['image']}")
else:
print(f"HTTP ステータスコード: {response.status_code}")
print(f"エラーコード: {response.code}")
print(f"エラーメッセージ: {response.message}")
print("詳細については、ドキュメントをご参照ください:https://www.alibabacloud.com/help/ja/model-studio/error-code")
Java
import com.alibaba.dashscope.aigc.multimodalconversation.MultiModalConversation;
import com.alibaba.dashscope.aigc.multimodalconversation.MultiModalConversationParam;
import com.alibaba.dashscope.aigc.multimodalconversation.MultiModalConversationResult;
import com.alibaba.dashscope.common.MultiModalMessage;
import com.alibaba.dashscope.common.Role;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import com.alibaba.dashscope.exception.UploadFileException;
import com.alibaba.dashscope.utils.JsonUtils;
import com.alibaba.dashscope.utils.Constants;
import java.io.IOException;
import java.util.Arrays;
import java.util.Collections;
import java.util.HashMap;
import java.util.Map;
import java.util.List;
public class QwenImageEdit {
static {
// 以下はシンガポールリージョンの URL です。北京リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1 に置き換えてください。
Constants.baseHttpApiUrl = "https://dashscope-intl.aliyuncs.com/api/v1";
}
// シンガポールリージョンと北京リージョンの API キーは異なります。API キーの取得については、https://www.alibabacloud.com/help/ja/model-studio/get-api-key をご参照ください。
// 環境変数を設定していない場合は、次の行をご利用の Model Studio API キーに置き換えてください:apiKey="sk-xxx"
static String apiKey = System.getenv("DASHSCOPE_API_KEY");
public static void call() throws ApiException, NoApiKeyException, UploadFileException, IOException {
MultiModalConversation conv = new MultiModalConversation();
// モデルは 1〜3 枚の入力画像をサポートします。
MultiModalMessage userMessage = MultiModalMessage.builder().role(Role.USER.getValue())
.content(Arrays.asList(
Collections.singletonMap("image", "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/thtclx/input1.png"),
Collections.singletonMap("image", "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/iclsnx/input2.png"),
Collections.singletonMap("image", "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/gborgw/input3.png"),
Collections.singletonMap("text", "画像 1 の女の子が画像 2 の黒いドレスを着て、画像 3 のポーズで座るようにしてください。")
)).build();
// qwen-image-edit-plus は 1〜6 枚の画像の出力をサポートします。この例では 2 枚の画像を出力する方法を示します。
Map<String, Object> parameters = new HashMap<>();
parameters.put("watermark", false);
parameters.put("negative_prompt", "low quality");
parameters.put("n", 2);
parameters.put("prompt_extend", true);
// size パラメーターは、出力画像数 n が 1 の場合にのみサポートされます。それ以外の場合はエラーが報告されます。
// parameters.put("size", "1024*2048");
MultiModalConversationParam param = MultiModalConversationParam.builder()
.apiKey(apiKey)
.model("qwen-image-edit-plus")
.messages(Collections.singletonList(userMessage))
.parameters(parameters)
.build();
MultiModalConversationResult result = conv.call(param);
// 完全な応答を表示するには、次の行のコメントを解除してください。
// System.out.println(JsonUtils.toJson(result));
List<Map<String, Object>> contentList = result.getOutput().getChoices().get(0).getMessage().getContent();
int imageIndex = 1;
for (Map<String, Object> content : contentList) {
if (content.containsKey("image")) {
System.out.println("出力画像 " + imageIndex + " の URL: " + content.get("image"));
imageIndex++;
}
}
}
public static void main(String[] args) {
try {
call();
} catch (ApiException | NoApiKeyException | UploadFileException | IOException e) {
System.out.println(e.getMessage());
}
}
}curl
次のコマンドは、シンガポールリージョンの URL を使用します。中国 (北京) リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation に置き換えてください。
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--data '{
"model": "qwen-image-edit-plus",
"input": {
"messages": [
{
"role": "user",
"content": [
{
"image": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/thtclx/input1.png"
},
{
"image": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/iclsnx/input2.png"
},
{
"image": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/gborgw/input3.png"
},
{
"text": "画像 1 の女の子が画像 2 の黒いドレスを着て、画像 3 のポーズで座るようにしてください。"
}
]
}
]
},
"parameters": {
"n": 2,
"negative_prompt": "low quality",
"prompt_extend": true,
"watermark": false
}
}'モデルの選択
qwen-image-edit-plus シリーズ (推奨)
このシリーズは、単一画像の編集、複数画像の融合、プロンプトの最適化、カスタム解像度をサポートしています。1〜6 枚の画像を生成し、以下の 3 つのモデルが含まれます:
qwen-image-edit-plusとqwen-image-edit-plus-2025-10-30:これらのモデルは同じ機能を持ちます。qwen-image-edit-plus-2025-12-15:キャラクターの一貫性、工業デザイン、幾何学的推論の機能が強化されています。
qwen-image-edit:単一画像の編集と複数画像の融合をサポートします。1 枚の画像しか生成できません。
詳細については、「Qwen 画像編集」をご参照ください。
入力の説明
入力画像 (messages)
messages は、role と content プロパティを持つ単一のオブジェクトを含む配列です。role は user に設定する必要があり、content には image プロパティに 1〜3 枚の画像と、text プロパティに 1 つの編集命令を含める必要があります。
入力画像は、以下の要件を満たす必要があります:
画像フォーマット:JPG、JPEG、PNG、BMP、TIFF、WEBP、GIF。
出力画像は PNG 形式です。アニメーション GIF の場合、最初のフレームのみが処理されます。
画像解像度:最良の結果を得るには、画像の幅と高さを 384〜3072 ピクセルの間にすることを推奨します。解像度が低いと出力がぼやける可能性があり、解像度が高いと処理時間が増加します。
ファイルサイズ:単一の画像ファイルのサイズは 10 MB を超えることはできません。
"messages": [
{
"role": "user",
"content": [
{ "image": "画像 1 のパブリック URL または Base64 データ" },
{ "image": "画像 2 のパブリック URL または Base64 データ" },
{ "image": "画像 3 のパブリック URL または Base64 データ" },
{ "text": "編集命令。例:「画像 1 の女の子が画像 2 の黒いドレスを着て、画像 3 のポーズで座る」" }
]
}
]画像の入力順序
複数の入力画像を提供する場合、画像の順序は配列内のシーケンスによって定義されます。編集命令は、`Image 1` や `Image 2` のように、content フィールド内の画像の順序に対応している必要があります。そうでない場合、結果が予期しないものになる可能性があります。
入力画像 1 | 入力画像 2 | 出力画像 | |
|
|
画像 1 の女の子の服を画像 2 の女の子の服に置き換える。 |
画像 2 の女の子の服を画像 1 の女の子の服に置き換える。 |
画像の入力方法
パブリック URL
HTTP または HTTPS プロトコルをサポートする、一般にアクセス可能な画像 URL を提供できます。
値の例:
https://xxxx/img.png。
Base64 エンコーディング
画像ファイルを Base64 エンコードされた文字列に変換し、data:{mime_type};base64,{base64_data} の形式で連結できます。
{mime_type}:画像のメディアタイプ。ファイル形式に対応している必要があります。{base64_data}:ファイルの Base64 エンコードされた文字列。値の例:
data:image/jpeg;base64,GDU7MtCZz...(例はデモンストレーションのために切り捨てられています。)
完全なコード例については、「Python SDK」および「Java SDK」をご参照ください。
その他のパラメーター
以下のオプションのパラメーターを使用して、生成結果を調整できます:
n:生成する画像の数。デフォルト値は 1 です。qwen-image-edit-plus シリーズのモデルは、1〜6 枚の画像の生成をサポートします。
qwen-image-editモデルは 1 枚の画像しか生成できません。negative_prompt:「ぼかし」や「余分な指」など、画像から除外するコンテンツを記述します。このパラメーターは、生成された画像の品質を最適化するのに役立ちます。
watermark:画像の右下隅に「Qwen-Image」のウォーターマークを追加するかどうかを指定します。デフォルト値は
falseです。以下の画像はウォーターマークのスタイルを示しています:
seed:乱数シード。値は
[0, 2147483647]の範囲の整数です。このパラメーターが指定されていない場合、アルゴリズムは乱数を生成してシードとして使用します。同じシード値を使用すると、生成されるコンテンツが比較的一貫性を保つのに役立ちます。
以下のオプションのパラメーターは、qwen-image-edit-plus シリーズのモデルでのみ利用可能です:
size:出力画像の解像度。形式は
width*heightの文字列で、例えば"1024*2048"のようになります。幅と高さは 512〜2048 ピクセルの範囲で指定できます。このパラメーターは、出力画像数 (n) が 1 の場合にのみ利用可能です。それ以外の場合はエラーが返されます。このパラメーターが設定されていない場合、出力画像は元の画像 (複数画像入力の場合は最後の画像) と同様のアスペクト比を維持し、解像度は1024*1024に近くなります。prompt_extend: プロンプト書き換え機能を有効にするかどうかを指定します。この機能はデフォルトで有効になっています。有効にすると、サービスは大規模モデルを使用してプロンプトを最適化します。これにより、単純または説明の少ないプロンプトの結果が大幅に向上します。
パラメーターの完全なリストについては、「Qwen-Image-Edit API リファレンス」をご参照ください。
ショーケース
複数画像の融合
入力画像 1 | 入力画像 2 | 入力画像 3 | 出力画像 |
|
|
|
画像 1 の女の子が画像 2 のネックレスをつけ、画像 3 のバッグを左肩にかけている。 |
主題の一貫性
入力画像 | 出力画像 1 | 出力画像 2 | 出力画像 3 |
|
青い背景の証明写真に変更。白いシャツ、黒いスーツ、ストライプのネクタイを着用。 |
白いシャツ、グレーのスーツ、ストライプのネクタイを着用し、片手をネクタイにかけ、明るい色の背景。 |
太い筆文字で「千问图像」と書かれた黒いパーカーを着用し、手すりにもたれかかり、髪に日光が当たっている。背景には橋と海が見える。 |
|
このエアコンをリビングルームのソファの隣に置く。 |
エアコンの吹き出し口からソファまで伸びる霧を追加し、緑の葉を追加する。 |
上部に白い手書きのテキスト「自然新风 畅享呼吸」を追加する。 |
スケッチからの作成
入力画像 | 出力画像 | |
|
画像 1 で概説された詳細な形状に一致し、次の説明に従う画像を生成する:晴れた日に若い女性が微笑んでいる。彼女はヒョウ柄のフレームの丸い茶色のサングラスをかけている。髪はきれいに結ばれ、真珠のイヤリング、白い星柄のダークブルーのスカーフ、黒いレザージャケットを着用している。 |
画像 1 で概説された詳細な形状に一致し、次の説明に従う画像を生成する:年配の女性がカメラに向かって微笑んでいる。彼女の顔にはしわがあり、髪は風で乱れ、丸いフレームの老眼鏡をかけている。首には使い古された星柄の赤いスカーフを巻き、綿入りのジャケットを着ている。 |
クリエイティブなプロダクト生成
入力画像 | 出力画像 | ||
|
このクマを月 (白い背景に薄灰色の三日月の輪郭で表現) の下に座らせ、ギターを持たせ、「Be Kind」などのフレーズが入った小さな星や吹き出しを周りに浮かばせる。 |
このデザインを T シャツと紙のトートバッグに印刷する。女性モデルがこれらのアイテムを展示している。彼女は「Be kind」と書かれた野球帽もかぶっている。 |
商業完成品としてデザインされた超リアルな 1/7 スケールのキャラクターモデルが、白いキーボードの iMac コンピュータの上に置かれている。モデルは、ラベルやテキストのない、きれいで丸い透明なアクリルベースの上に立っている。プロのスタジオ照明が彫刻の詳細をハイライトしている。背景の iMac 画面には、同じモデルの ZBrush モデリングプロセスが表示されている。モデルの隣には、前面に透明なウィンドウが付いたパッケージングボックスを置き、中にはモデルよりわずかに高く、それを保持するのに合理的なサイズの透明なプラスチックシェルのみが見える。 |
このクマは宇宙服を着て遠くを指さしている。 |
このクマは豪華なボールガウンを着て、優雅なダンスのポーズで腕を広げている。 |
このクマはスポーツウェアを着てバスケットボールを持ち、片足を曲げている。 | |
深度マップからの画像生成
入力画像 | 出力画像 | |
|
画像 1 で概説された深度マップに一致し、次の説明に従う画像を生成する:青い自転車が路地に駐車されており、背景の石のひび割れからいくつかの雑草が生えている。 |
画像 1 で概説された深度マップに一致し、次の説明に従う画像を生成する:使い古された赤い自転車が泥だらけの道に駐車されており、背景には密な原生林がある。 |
キーポイントからの画像生成
入力画像 | 出力画像 | |
|
画像 1 で概説された人間のポーズに一致し、次の説明に従う画像を生成する:漢服を着た中国人女性が雨の中で油紙傘を持ち、背景には蘇州の庭園がある。 |
画像 1 で概説された人間のポーズに一致し、次の説明に従う画像を生成する:若い男性が地下鉄のプラットフォームに立っている。彼は野球帽、T シャツ、ジーンズを着用している。彼の後ろを電車が高速で通過している。 |
テキスト編集
入力画像 | 出力画像 | 入力画像 | 出力画像 |
|
スクラブルのタイルにある「HEALTH INSURANCE」を「明天会更好」に置き換える。 |
|
メモの「Take a Breather」というフレーズを「Relax and Recharge」に変更する。 |
入力画像 | 出力画像 | ||
|
「Qwen-Image」を黒いインクドリップフォントに変更する。 |
「Qwen-Image」を黒い手書きフォントに変更する。 |
「Qwen-Image」を黒いピクセルフォントに変更する。 |
「Qwen-Image」を赤色に変更する。 |
「Qwen-Image」を青紫のグラデーションに変更する。 |
「Qwen-Image」をキャンディーカラーに変更する。 | |
「Qwen-Image」の素材を金属に変更する。 |
「Qwen-Image」の素材を雲に変更する。 |
「Qwen-Image」の素材をガラスに変更する。 | |
追加、削除、変更、置換
機能 | 入力画像 | 出力画像 |
要素の追加 |
|
ペンギンの前に「Welcome to Penguin Beach」と書かれた小さな木製の看板を追加する。 |
要素の削除 |
|
皿から髪の毛を取り除く。 |
要素の置換 |
|
桃をリンゴに変更する。 |
ポートレートの修正 |
|
彼女の目を閉じさせる。 |
ポーズの修正 |
|
彼女は手を挙げ、手のひらをカメラに向け、指を広げて遊び心のあるポーズをとる。 |
視点変換
入力画像 | 出力画像 | 入力画像 | 出力画像 |
|
正面図を取得する。 |
|
左を向く。 |
|
背面図を取得する。 |
|
右を向く。 |
背景置換
入力画像 | 出力画像 | |
|
背景をビーチに変更する。 |
元の背景をリアルな現代の教室のシーンに置き換える。背景の中央には伝統的な深緑色または黒色の黒板がある。黒板には白いチョークで「通义千问」という漢字がきちんと書かれている。 |
古い写真の処理
機能 | 入力画像 | 出力画像 |
古い写真の修復とカラー化 |
|
古い写真を修復し、傷を取り除き、ノイズを低減し、詳細を強調し、高解像度、リアルな画像、自然な肌の色、鮮明な顔の特徴、歪みなし。 |
|
コンテンツに基づいて画像をインテリジェントにカラー化し、より鮮やかにする。 |
課金とレート制限
モデルの無料クォータと価格については、「モデルリストと価格」をご参照ください。
モデルのレート制限については、「Qwen-Image」をご参照ください。
課金の説明:
課金は、正常に生成された画像の数に基づきます。モデルの呼び出しの失敗や処理エラーは、料金が発生したり、無料クォータを消費したりすることはありません。
「無料クォータのみ」機能を有効にすると、無料クォータを使い切った後の追加料金を回避できます。詳細については、「新規ユーザー向けの無料クォータ」をご参照ください。
API リファレンス
API の入出力パラメーターについては、「Qwen - 画像編集」をご参照ください。
エラーコード
呼び出しが失敗した場合は、「エラーメッセージ」でトラブルシューティングを行ってください。
よくある質問
Q:qwen-image-edit はマルチターンの対話型編集をサポートしていますか?
A:いいえ、サポートしていません。このモデルはシングルターンの実行のみをサポートします。各呼び出しは独立したステートレスなタスクです。連続して編集を行うには、生成された画像を新しい入力として別の呼び出しに使用できます。
Q:qwen-image-edit および qwen-image-edit-plus シリーズのモデルはどの言語をサポートしていますか?
A:公式には簡体字中国語と英語をサポートしています。他の言語も試すことができますが、そのパフォーマンスは完全には検証されておらず、保証されていません。
Q:異なるアスペクト比の複数の参照画像をアップロードした場合、どの画像が出力画像のアスペクト比を決定しますか?
A:出力画像は、最後にアップロードされた参照画像のアスペクト比と一致します。
Q:モデルの使用状況を確認するにはどうすればよいですか?
A: モデルの呼び出しデータは、1 時間遅れで利用可能になります。[モデル観測] (シンガポール または 北京) ページに移動して、呼び出し使用量、呼び出し回数、成功率などのメトリックを表示できます。詳細については、「モデルの呼び出しレコードの表示方法」をご参照ください。
その他の質問については、「画像生成に関するよくある質問」をご参照ください。











































































