Text-to-Image および画像編集に適したモデルを選択します。
Text-to-Image
wan2.7-image-pro を推奨します。このモデルは、テキストレンダリング、ブランドカラーコントロール、キャラクターの一貫性を保った複数画像生成、画像編集などの機能を兼ね備えています。Text-to-Image では最大 4096x4096、画像編集では最大 2048x2048 の解像度をサポートします。詳細な手順については、Text-to-Image 生成をご参照ください。
z-image-turbo を使用するケース
画像生成のみ (編集機能なし) の場合。
速度やコストを優先する場合:生成速度が 10 倍速く、コストは約 5 分の 1 です。
写実的なポートレートやプロダクト写真の場合。
qwen-image-2.0-pro を使用するケース
否定的なプロンプトを使用して、出力から特定の要素を除外する場合。
1 回の呼び出しで最大 6 つの画像バリエーションを生成する場合 (Wan の標準モードでは最大 4 つまでサポート)。
画像編集
wan2.7-image-pro を推奨します。このモデルは、複数画像のリファレンス (最大 9 枚の入力画像)、バウンディングボックスを使用したインタラクティブな編集、キャラクターの一貫性を保った複数画像生成をサポートします。詳細な手順については、画像編集 - Qwen および 画像編集 - Wan 2.7/2.6/2.5 をご参照ください。
qwen-image-2.0-pro を使用するケース
編集時に否定的なプロンプトを使用するには、qwen-image-2.0-pro を使用します (生成と編集の両方で同じモデル ID が使用されます)。
推奨モデル
モデル | ユースケース | Text-to-Image | 編集 | 最大出力数 | 最大解像度 |
| テキストレンダリング、ブランドカラー、キャラクターの一貫性を保った複数画像生成、複数画像の編集 | 4 (連続 12) | 4096x4096 (Text-to-Image) / 2048x2048 (編集) | ||
| Pro 版と同じ機能ですが、生成がより速く、最大解像度が低く (2048x2048) なっています。 | 4 (連続 12) | 2048x2048 | ||
| 高速生成、低コスト、写実的なポートレート | 1 | 2048x2048 | ||
| 否定的なプロンプト、最大 6 つの画像バリエーション | 6 | 2048x2048 | ||
| qwen-image-2.0-pro の高速版 | 6 | 2048x2048 |
すべてのモデル
Wan
モデル ID | Text-to-Image | 編集 | 最大出力数 | 最大解像度 |
| 4 (連続 12) | 4096x4096 (Text-to-Image) / 2048x2048 (編集) | ||
| 4 (連続 12) | 2048x2048 | ||
| 4 | 1440x1440 | ||
| 4 | 1440x1440 | ||
| 4 | 1440x1440 | ||
| 4 | 1280x1280 | ||
| 4 | 1440x1440 | ||
| 4 | 1440x1440 | ||
| 4 | 1440x1440 | ||
| 4 | 1440x1440 | ||
レガシー | ||||
中国 (北京) リージョンでのみ利用可能 | 1 | 1024x1024 | ||
Qwen Image
モデル ID | Text-to-Image | 編集 | 最大出力数 | 最大解像度 |
| 6 | 2048x2048 | ||
| 6 | 2048x2048 | ||
| 6 | 2048x2048 | ||
| 6 | 2048x2048 | ||
| 1 | 1664x928 | ||
| 1 | 1664x928 | ||
| 1 | 1664x928 | ||
| 1 | 1664x928 | ||
| 1 | 1664x928 | ||
| 6 | 2048x2048 | ||
| 6 | 2048x2048 | ||
| 6 | 2048x2048 | ||
| 6 | 2048x2048 | ||
| 6 | 2048x2048 | ||
| 1 | 1024x1024 |
Z-Image
モデル ID | Text-to-Image | 編集 | 最大出力数 | 最大解像度 |
| 1 | 2048x2048 |