All Products
Search
Document Center

Alibaba Cloud Model Studio:Teks-ke-gambar

Last Updated:Mar 18, 2026

Gunakan API teks-ke-gambar untuk menghasilkan gambar baru berdasarkan deskripsi teks. Alibaba Cloud Model Studio menyediakan dua keluarga model:

  • Qwen-Image: unggul dalam rendering teks kompleks berbahasa Tiongkok dan Inggris.

  • Seri Wan: menghasilkan gambar realistis dan efek visual berkualitas fotografi.

Coba secara online: Singapura | Beijing

Kinerja model

Qwen-Image

Teks kompleks

p1005416-转换自-png

Paragraf panjang

p1005400-转换自-png

Tata letak kompleks

3

Pembuatan poster

image

Desain ilustrasi

1

Fotografi fotorealistik

2

Lihat prompt

Teks kompleks: Etalase toko buku. Sebuah papan menampilkan “New Arrivals This Week”. Di bawahnya, label rak dengan teks “Best-Selling Novels Here”. Di sampingnya, poster berwarna mengiklankan “Author Meet And Greet on Saturday” dengan potret penulis di tengah. Ada empat buku di rak buku, yaitu “The Light Between Worlds” “When Stars Are Scattered” “The Silent Patient” “The Night Circus”.

Paragraf panjang: Seorang gadis muda berpakaian seragam sekolah berdiri di kelas, menulis di papan tulis. Di tengah papan, tertulis rapi dengan kapur putih: “Introducing Qwen-Image, a foundational image generation model that excels in complex text rendering and precise image editing.” Cahaya alami lembut masuk melalui jendela, menciptakan bayangan halus. Adegan ini dirender dalam gaya fotografi realistis, dengan tekstur detail halus, depth of field dangkal, dan rona tonal hangat. Ekspresi fokus gadis tersebut dan debu kapur yang melayang di udara menambah rasa gerakan dan vitalitas. Elemen latar belakang—termasuk meja siswa dan poster edukatif—sedikit kabur untuk menekankan aksi utama. Resolusi ultra-tinggi 32K, citra berkualitas DSLR, efek bokeh lembut, dan komposisi bergaya dokumenter.

Tata letak kompleks: Buat slide PowerPoint kelas untuk pidato. Slide ini menampilkan bentuk artistik dan dekoratif yang membingkai informasi teks tersusun rapi sebagai infografis elegan. Judul tengah: ‘Habits for Emotional Wellbeing’, dikelilingi pola bunga simetris. Kiri atas: ‘Practice Mindfulness’ + ikon teratai minimalis + teks ‘Be present, observe without judging, and accept without resisting.’ Di bawahnya: ‘Cultivate Gratitude’ + ilustrasi tangan terbuka + teks ‘Appreciate simple joys and acknowledge positivity daily.’ Kiri bawah: ‘Stay Connected’ + ikon gelembung obrolan minimalis + teks ‘Build and maintain meaningful relationships to sustain emotional energy.’ Kanan bawah: ‘Prioritize Sleep’ + ilustrasi bulan sabit + teks ‘Quality sleep benefits both body and mind.’ Kanan atas: ‘Regular Physical Activity’ + ikon pelari joging + teks ‘Exercise boosts mood and relieves anxiety.’ Kanan atas: ‘Continuous Learning’ + ikon buku + teks ‘Engage in new skills and knowledge for growth.’ Tata letak menyeimbangkan kejelasan dan seni untuk memandu penonton secara alami. --ar 16:9 --style clean - presentation.

Desain Poster: Poster bergambar tangan yang menawan ini menampilkan tiga anak anjing bermain bola di rumput hijau subur, dihiasi elemen seperti burung dan bintang. Judul utama, “Come Play Ball!”, ditampilkan mencolok di bagian atas dengan font kartun biru tebal. Di bawah judul, subjudul “Come [Show Off Your Skills]!” muncul dalam font hijau. Gelembung ucapan menambah sentuhan bermain dengan teks: “Hehe, watch me amaze my little friends next!” Di bagian bawah, teks tambahan berbunyi: “We get to play ball with our friends again!” Palet warna berpusat pada hijau dan biru segar, dengan aksen merah muda dan kuning cerah yang menciptakan suasana ceria dan kekanak-kanakan.

Desain ilustrasi: Ilustrasi hidup dan bersemangat dari adegan jalan komersial cerah yang ramai, potongan kehidupan sehari-hari. Di latar depan, seorang anak laki-laki muda berbaju putih dan celana pendek sedang memilih barang dari kios pasar. Kios tersebut penuh dengan camilan, minuman, dan barang kebutuhan sehari-hari. Pemilik kios, seorang pria paruh baya bercelemek, sedang mengatur produk. Sebuah papan kayu bertuliskan “Qwen-Image” dengan gaya tulisan tangan menggantung di atas kios. Latar belakang menampilkan bangunan modern berwarna-warni dengan papan nama mencolok untuk “Alibaba”, “Model Studio, dan “Text-to-Image”. Langitnya biru azur dengan awan putih mengembang dan camar yang terbang. Gaya Seni: Ilustrasi realisme, halus dan lembut, warna cerah, lapisan kaya, tekstur gambar tangan halus, detail, cahaya dan bayangan kuat, komposisi penuh, rasa kedalaman kuat, suasana ceria dan santai.

Fotografi fotorealistik: Wanita Asia berusia awal dua puluhan. Ia memiliki poni lurus dan rambut hitam panjang yang jatuh alami di atas bahunya. Ia duduk menyamping di sofa bermotif bunga vintage. Kainnya putih gading dengan bunga merah muda dan hijau, sedikit usang dan terkesan nyaman. Ia mengenakan sweter mohair hijau muda longgar—lembut dan mengembang—dan rok linen abu-abu kebiruan terang. Penampilannya segar, alami, dan santai. Tangan kanannya memegang tomat merah dekat dagu, berpose santai. Ia menatap langsung ke kamera dengan mata tenang dan sedikit jauh. Sebuah piring keramik terang berada di sebelah kanannya, berisi tiga atau empat tomat merah cerah dengan tangkai hijau—kontras tajam terhadap palet hijau dingin. Latar belakangnya adalah dinding hijau teal yang lapuk, bertekstur dan tidak sempurna. Cahaya alami masuk dari jendela, membentuk berkas diagonal jelas di atasnya dan dinding. Lapisan cahaya dan bayangan kaya. Tanaman pot berada di ambang jendela dan di sudut-sudut. Sebuah lemari kayu antik cokelat tua samar terlihat di sebelah kiri. Foto ini menggunakan nada hijau dingin, dengan butiran film terlihat dan kebocoran cahaya halus. Komposisinya penuh. Suasananya tenang, artistik, dan sangat mengingatkan pada potret film vintage.

Wan

Fotografi potret

p1023523-转换自-png

Fotorealistik

p1023409-转换自-png

Gaya artistik

p1023526-转换自-png

Rendering teks

p1023535-转换自-png

Desain poster

p1023546-转换自-png

Generasi multi-gambar

p1023532-转换自-png

Lihat prompt

Fotografi potret: Potret wanita Skandinavia hiper-realistis. Rambut pirang platinum mengalir dan mata biru menusuk dengan bintik-bintik wajah mencolok. Tatapan intelektual tajam. Pencahayaan directional bernada dingin Nordik menciptakan suasana es. Gaya modern minimalis dengan garis bersih. Latar belakang gradien dingin kabur dengan depth-of-field dangkal. Fitur wajah Nordik autentik dan tekstur kulit porselen.

Fotografi fotorealistik: Adegan hutan perspektif fish-eye dengan distorsi perspektif dramatis. Rubah merah ultra-detail menatap lensa dengan mata amber menusuk. Tekstur bulu hiper-realistis menunjukkan rambut penjaga individu dan lapisan undercoat. Pohon melengkung radial membentuk pola latar belakang melingkar. Gaya lukisan cat air dengan sapuan transparan dan rembesan pigmen organik. Palet pastel lembut berupa nada hijau lumut dan ocher tanah. Pencahayaan bergaya lukisan dengan cahaya atmosferik melalui celah kanopi.

Gaya artistik: Lagu pastoral bergaya lukisan minyak vintage. Seorang petani menggiring domba melintasi padang rumput penuh bunga liar. Kincir angin berputar di kejauhan di bawah langit biru dan awan putih. Asap mengepul dari cerobong rumah kayu. Warna cerah dan lembut. Penuh ketenangan dan kenyamanan.

Rendering teks: Halaman dari panduan identifikasi tanaman. Bergaya cat air gambar tangan. Menggambarkan “dandelion” dengan bagian-bagian berlabel.

Desain poster: Adegan poster sinematik: Close-up ekstrem makro mata dalam retakan kayu. Monokrom minimalis, fusi cat air-CGI, saturasi rendah. Dorongan lambat dengan getaran untuk intensitas surealis. Ruang negatif luas, judul tersembunyi. Dioptimalkan untuk generasi video imersif.

Generasi multi-gambar: Kenangan seumur hidup seorang pria tua. Empat potret dalam bingkai berbeda: masa kanak-kanak (foto hitam-putih), masa muda (foto seragam militer), usia paruh baya (foto kerja setelan bisnis), dan usia tua (foto bersama pasangan).

Model yang didukung

Pemilihan model

  • Rendering teks kompleks (misalnya, poster, couplet): Gunakan qwen-image-2.0-pro atau wan2.6-t2i.

  • Adegan realistis dan gaya fotografi (penggunaan umum): Pilih model Wan seperti wan2.6-t2i atau wan2.5-t2i-preview.

  • Resolusi gambar output khusus: Gunakan seri qwen-image-2.0 atau model Wan. Seri qwen-image-2.0 mendukung lebar dan tinggi khusus. Total piksel harus antara 512*512 dan 2048*2048. Model Wan seperti wan2.6-t2i mendukung total piksel antara 1280*1280 dan 1440*1440.

    Seri qwen-image-max dan qwen-image-plus hanya mendukung lima ukuran tetap: 1664*928 (16:9), 928*1664 (9:16), 1328*1328 (1:1), 1472*1104 (4:3), dan 1104*1472 (3:4).

Mulai

Prasyarat

Sebelum memanggil API, dapatkan Kunci API Anda. Kemudian tetapkan Kunci API Anda sebagai Variabel lingkungan. Jika Anda menggunakan SDK DashScope, juga instal SDK.

Kode contoh

Metode pemanggilan:

  • Semua model teks-ke-gambar Qwen mendukung panggilan sinkron. Model qwen-image-plus dan qwen-image juga mendukung panggilan asinkron. Untuk detailnya, lihat Qwen - teks-ke-gambar.

  • Semua model teks-ke-gambar Wan mendukung panggilan asinkron. Model wan2.6-t2i juga mendukung panggilan sinkron. Untuk detailnya, lihat Wan - teks-ke-gambar V2.

Sinkron

Python

Contoh permintaan

import json
import os
import dashscope
from dashscope import MultiModalConversation

# Gunakan URL ini untuk wilayah Singapura. Untuk wilayah Beijing, ganti dengan: https://dashscope.aliyuncs.com/api/v1
dashscope.base_http_api_url = 'https://dashscope-intl.aliyuncs.com/api/v1'

messages = [
    {
        "role": "user",
        "content": [
            {"text": "Healing-style hand-drawn poster featuring three puppies playing with a ball on lush green grass, adorned with decorative elements such as birds and stars. The main title “Come Play Ball!” is prominently displayed at the top in bold, blue cartoon font. Below it, the subtitle “Come [Show Off Your Skills]!” appears in green font. A speech bubble adds playful charm with the text: “Hehe, watch me amaze my little friends next!” At the bottom, supplementary text reads: “We get to play ball with our friends again!” The color palette centers on fresh greens and blues, accented with bright pink and yellow tones to highlight a cheerful, childlike atmosphere."}
        ]
    }
]

# Kunci API berbeda antara wilayah Beijing dan Singapura. Dapatkan Kunci API Anda: https://www.alibabacloud.com/help/zh/model-studio/get-api-key
# Jika Anda belum menyetel variabel lingkungan, ganti baris di bawah ini dengan: api_key="sk-xxx"
api_key = os.getenv("DASHSCOPE_API_KEY")

response = MultiModalConversation.call(
    api_key=api_key,
    model="qwen-image-2.0-pro",
    messages=messages,
    result_format='message',
    stream=False,
    watermark=False,
    prompt_extend=True,
    negative_prompt="Low resolution, low quality, distorted limbs, malformed fingers, oversaturated colors, wax-figure appearance, lack of facial detail, excessive smoothness, AI-looking artifacts, chaotic composition, blurry or warped text.",
    size='2048*2048'
)

if response.status_code == 200:
    print(json.dumps(response, ensure_ascii=False))
else:
    print(f"HTTP status code: {response.status_code}")
    print(f"Error code: {response.code}")
    print(f"Error message: {response.message}")
    print("See documentation: https://www.alibabacloud.com/help/zh/model-studio/error-code")

Contoh respons

URL gambar kedaluwarsa setelah 24 jam. Unduh gambar segera.
{
    "status_code": 200,
    "request_id": "d2d1a8c0-325f-9b9d-8b90-xxxxxx",
    "code": "",
    "message": "",
    "output": {
        "text": null,
        "finish_reason": null,
        "choices": [
            {
                "finish_reason": "stop",
                "message": {
                    "role": "assistant",
                    "content": [
                        {
                            "image": "https://dashscope-result-wlcb.oss-cn-wulanchabu.aliyuncs.com/xxx.png?Expires=xxx"
                        }
                    ]
                }
            }
        ]
    },
    "usage": {
        "input_tokens": 0,
        "output_tokens": 0,
        "width": 2048,
        "image_count": 1,
        "height": 2048
    }
}

Java

Contoh permintaan

import com.alibaba.dashscope.aigc.multimodalconversation.MultiModalConversation;
import com.alibaba.dashscope.aigc.multimodalconversation.MultiModalConversationParam;
import com.alibaba.dashscope.aigc.multimodalconversation.MultiModalConversationResult;
import com.alibaba.dashscope.common.MultiModalMessage;
import com.alibaba.dashscope.common.Role;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import com.alibaba.dashscope.exception.UploadFileException;
import com.alibaba.dashscope.utils.JsonUtils;
import com.alibaba.dashscope.utils.Constants;

import java.io.IOException;
import java.util.Arrays;
import java.util.Collections;
import java.util.HashMap;
import java.util.Map;

public class QwenImage {

    static {
        // Gunakan URL ini untuk wilayah Singapura. Untuk wilayah Beijing, ganti dengan: https://dashscope.aliyuncs.com/api/v1
        Constants.baseHttpApiUrl = "https://dashscope-intl.aliyuncs.com/api/v1";
    }

    // Kunci API berbeda antara wilayah Beijing dan Singapura. Dapatkan Kunci API Anda: https://www.alibabacloud.com/help/zh/model-studio/get-api-key
    // Jika Anda belum menyetel variabel lingkungan, ganti baris di bawah ini dengan: static String apiKey="sk-xxx"
    static String apiKey = System.getenv("DASHSCOPE_API_KEY");

    public static void call() throws ApiException, NoApiKeyException, UploadFileException, IOException {

        MultiModalConversation conv = new MultiModalConversation();

        MultiModalMessage userMessage = MultiModalMessage.builder().role(Role.USER.getValue())
                .content(Arrays.asList(
                        Collections.singletonMap("text", "Healing-style hand-drawn poster featuring three puppies playing with a ball on lush green grass, adorned with decorative elements such as birds and stars. The main title “Come Play Ball!” is prominently displayed at the top in bold, blue cartoon font. Below it, the subtitle “Come [Show Off Your Skills]!” appears in green font. A speech bubble adds playful charm with the text: “Hehe, watch me amaze my little friends next!” At the bottom, supplementary text reads: “We get to play ball with our friends again!” The color palette centers on fresh greens and blues, accented with bright pink and yellow tones to highlight a cheerful, childlike atmosphere.")
                )).build();

        Map<String, Object> parameters = new HashMap<>();
        parameters.put("watermark", false);
        parameters.put("prompt_extend", true);
        parameters.put("negative_prompt", "Low resolution, low quality, distorted limbs, malformed fingers, oversaturated colors, wax-figure appearance, lack of facial detail, excessive smoothness, AI-looking artifacts, chaotic composition, blurry or warped text.");
        parameters.put("size", "2048*2048");

        MultiModalConversationParam param = MultiModalConversationParam.builder()
                .apiKey(apiKey)
                .model("qwen-image-2.0-pro")
                .messages(Collections.singletonList(userMessage))
                .parameters(parameters)
                .build();

        MultiModalConversationResult result = conv.call(param);
        System.out.println(JsonUtils.toJson(result));
    }

    public static void main(String[] args) {
        try {
            call();
        } catch (ApiException | NoApiKeyException | UploadFileException | IOException e) {
            System.out.println(e.getMessage());
        }
        System.exit(0);
    }

Contoh respons

URL gambar kedaluwarsa setelah 24 jam. Unduh gambar segera.
{
    "requestId": "5b6f2d04-b019-40db-a5cc-xxxxxx",
    "usage": {
        "image_count": 1,
        "width": 2048,
        "height": 2048
    },
    "output": {
        "choices": [
            {
                "finish_reason": "stop",
                "message": {
                    "role": "assistant",
                    "content": [
                        {
                            "image": "https://dashscope-result-wlcb.oss-cn-wulanchabu.aliyuncs.com/xxx.png?Expires=xxx"
                        }
                    ]
                }
            }
        ]
    }
}

curl

Contoh permintaan
curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--data '{
    "model": "qwen-image-2.0-pro",
    "input": {
        "messages": [
            {
                "role": "user",
                "content": [
                    {
                        "text": "A winter street scene in Beijing featuring two adjacent traditional Chinese shops with gray-tiled roofs and vermilion-red exterior walls standing side by side. Warm-glow lanterns adorned with paper-cut horse motifs hang beneath the eaves, casting soft halos under overcast diffused light that gently reflects off the damp cobblestone pavement. On the left is a calligraphy shop: an aged indigo signboard bears the bold running-script characters “Text Rendering.” A vertical scroll on the storefront glass reads from top to bottom in Tian Yingzhang’s hard-pen style: “Professional Slides, Bilingual Posters, Advanced Infographics,” stamped with a cinnabar seal reading “1k token.” Inside, three vertically mounted calligraphy works are faintly visible on the wall—the first says “Alibaba,” the second “Qwen,” and the third “Image Generation.” An elderly white-haired man stands with his back to the camera, admiring the art. On the right is a flower shop whose sign spells out “Realistic Texture” using fresh blooms. Multi-tiered shelves inside display red roses, pink peonies, and greenery. A circular floral-patterned badge on the door reads “2k resolution,” and a colorful neon sign at the entrance displays the text “Detailed Depiction: People, Nature, Architecture.” Between the two shops sits a snowman holding an old-fashioned chalkboard with the words “Qwen-Image-2.0 Officially Released” scrawled in chalk. On the left side of the street, a young couple leans close together—the woman has a slender face, wears a beige cashmere coat and nude-toned sheer tights, and holds a transparent heart-shaped balloon printed with white text: “Image Generation and Editing in One.” Inside the balloon is a fluffy capybara plush toy. The man wears a well-tailored dark gray wool overcoat layered over a light turtleneck sweater. On the right side of the street, a delivery rider speeds past with “Smaller Model, Faster Speed” written across his back. The entire street blends dynamic motion with serene stillness through interwoven light and shadow."
                    }
                ]
            }
        ]
    },
    "parameters": {
        "negative_prompt": "Low resolution, low quality, distorted limbs, malformed fingers, oversaturated colors, wax-figure appearance, lack of facial detail, excessive smoothness, AI-looking artifacts, chaotic composition, blurry or warped text.",
        "prompt_extend": true,
        "watermark": false,
        "size": "2048*2048"
    }
}'
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--data '{
    "model": "qwen-image-2.0-pro",
    "input": {
      "messages": [
        {
          "role": "user",
          "content": [
            {
              "text": "Healing-style hand-drawn poster featuring three puppies playing with a ball on lush green grass, adorned with decorative elements such as birds and stars. The main title “Come Play Ball!” is prominently displayed at the top in bold, blue cartoon font. Below it, the subtitle “Come [Show Off Your Skills]!” appears in green font. A speech bubble adds playful charm with the text: “Hehe, watch me amaze my little friends next!” At the bottom, supplementary text reads: “We get to play ball with our friends again!” The color palette centers on fresh greens and blues, accented with bright pink and yellow tones to highlight a cheerful, childlike atmosphere."
            }
          ]
        }
      ]
    },
    "parameters": {
      "negative_prompt": "Low resolution, low quality, distorted limbs, malformed fingers, oversaturated colors, wax-figure appearance, lack of facial detail, excessive smoothness, AI-looking artifacts, chaotic composition, blurry or warped text.",
      "prompt_extend": true,
      "watermark": false,
      "size": "2048*2048"
    }
}'
Contoh respons
{
    "output": {
        "choices": [
            {
                "finish_reason": "stop",
                "message": {
                    "content": [
                        {
                            "image": "https://dashscope-result-sh.oss-cn-shanghai.aliyuncs.com/xxx.png?Expires=xxx"
                        }
                    ],
                    "role": "assistant"
                }
            }
        ]
    },
    "usage": {
        "height": 2048,
        "image_count": 1,
        "width": 2048
    },
    "request_id": "d0250a3d-b07f-49e1-bdc8-6793f4929xxx"
}

Asinkron

SDK membungkus logika asinkron di tingkat bawah. Antarmuka tingkat atasnya berperilaku seperti panggilan sinkron (permintaan tunggal, tunggu hasil akhir). Contoh curl menggunakan dua API asinkron terpisah: satu untuk mengirimkan tugas, lainnya untuk mengkueri hasil.

Python

Contoh permintaan

import os
import dashscope
from dashscope.aigc.image_generation import ImageGeneration
from dashscope.api_entities.dashscope_response import Message

# URL wilayah Singapura. base_url berbeda berdasarkan wilayah.
dashscope.base_http_api_url = 'https://dashscope-intl.aliyuncs.com/api/v1'

# Jika DASHSCOPE_API_KEY tidak disetel, ganti dengan: api_key="sk-xxx"
# Kunci API berbeda berdasarkan wilayah. Lihat https://www.alibabacloud.com/help/en/model-studio/get-api-key
api_key = os.getenv("DASHSCOPE_API_KEY")

message = Message(
    role="user",
    content=[
        {
            'text': 'A flower shop with exquisite windows, a beautiful wooden door, and flowers on display'
        }
    ]
)
print("----sync call, please wait a moment----")
rsp = ImageGeneration.call(
    model="wan2.6-t2i",
    api_key=api_key,
    messages=[message],
    negative_prompt="",
    prompt_extend=True,
    watermark=False,
    n=1,
    size="1280*1280"
)
print(rsp)

Contoh respons

URL berlaku selama 24 jam. Unduh segera.
{
    "status_code": 200,
    "request_id": "820dd0db-eb42-4e05-8d6a-1ddb4axxxxxx",
    "code": "",
    "message": "",
    "output": {
        "text": null,
        "finish_reason": null,
        "choices": [
            {
                "finish_reason": "stop",
                "message": {
                    "role": "assistant",
                    "content": [
                        {
                            "image": "https://dashscope-result-bj.oss-cn-beijing.aliyuncs.com/xxxxxx.png?Expires=xxxxxx",
                            "type": "image"
                        }
                    ]
                }
            }
        ],
        "audio": null,
        "finished": true
    },
    "usage": {
        "input_tokens": 0,
        "output_tokens": 0,
        "characters": 0,
        "image_count": 1,
        "size": "1280*1280",
        "total_tokens": 0
    }
}

Java

Contoh permintaan

import com.alibaba.dashscope.aigc.imagegeneration.*;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import com.alibaba.dashscope.exception.UploadFileException;
import com.alibaba.dashscope.utils.Constants;
import com.alibaba.dashscope.utils.JsonUtils;
import java.util.Collections;

public class Main {

    static {
        // URL wilayah Singapura. base_url berbeda berdasarkan wilayah.
        Constants.baseHttpApiUrl = "https://dashscope-intl.aliyuncs.com/api/v1";
    }

    // Jika DASHSCOPE_API_KEY tidak disetel, ganti dengan: apiKey="sk-xxx"
    // Kunci API berbeda berdasarkan wilayah. Lihat https://www.alibabacloud.com/help/en/model-studio/get-api-key
    static String apiKey = System.getenv("DASHSCOPE_API_KEY");

    public static void basicCall() throws ApiException, NoApiKeyException, UploadFileException {
        ImageGenerationMessage message = ImageGenerationMessage.builder()
                .role("user")
                .content(Collections.singletonList(
                        Collections.singletonMap("text", "A flower shop with exquisite windows, a beautiful wooden door, and flowers on display")
                )).build();

        ImageGenerationParam param = ImageGenerationParam.builder()
                .apiKey(apiKey)
                .model("wan2.6-t2i")
                .n(1)
                .size("1280*1280")
                .negativePrompt=""
                .promptExtend=true
                .watermark=false
                .messages(Collections.singletonList(message))
                .build();

        ImageGeneration imageGeneration = new ImageGeneration();
        ImageGenerationResult result = null;
        try {
            System.out.println("---sync call, please wait a moment----");
            result = imageGeneration.call(param);
        } catch (ApiException | NoApiKeyException | UploadFileException e) {
            throw new RuntimeException(e.getMessage());
        }
        System.out.println(JsonUtils.toJson(result));
    }

    public static void main(String[] args) {
        try {
            basicCall();
        } catch (ApiException | NoApiKeyException | UploadFileException e) {
            System.out.println(e.getMessage());
        }
    }
}

Contoh respons

URL berlaku selama 24 jam. Unduh segera.
{
    "status_code": 200,
    "request_id": "50b57166-eaaa-4f17-b1e0-35a5ca88672c",
    "code": "",
    "message": "",
    "output": {
        "choices": [
            {
                "finish_reason": "stop",
                "message": {
                    "role": "assistant",
                    "content": [
                        {
                            "image": "https://dashscope-result-sh.oss-cn-shanghai.aliyuncs.com/xxx.png?Expires=xxx",
                            "type": "image"
                        }
                    ]
                }
            }
        ],
        "finished": true
    },
    "usage": {
        "input_tokens": 0,
        "output_tokens": 0,
        "image_count": 1,
        "size": "1280*1280",
        "total_tokens": 0
    }
}

curl

Catatan
  • Setel parameter header X-DashScope-Async ke enable untuk panggilan asinkron.

  • task_id untuk tugas asinkron kedaluwarsa setelah 24 jam. Setelah kedaluwarsa, status tugas menjadi UNKNOWN.

Langkah 1: Kirim tugas

Permintaan ini mengembalikan ID tugas (task_id).

curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/image-generation/generation' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'X-DashScope-Async: enable' \
--data '{
    "model": "wan2.6-t2i",
    "input": {
        "messages": [
            {
                "role": "user",
                "content": [
                    {
                        "text": "A flower shop with exquisite windows, a beautiful wooden door, and flowers on display"
                    }
                ]
            }
        ]
    },
    "parameters": {
        "prompt_extend": true,
        "watermark": false,
        "n": 1,
        "negative_prompt": "",
        "size": "1280*1280"
    }
}'
Langkah 2: Kueri hasil menggunakan ID tugas

Gunakan task_id dari Langkah 1. Poll status tugas hingga task_status menjadi SUCCEEDED atau FAILED.

Ganti {task_id} dengan nilai task_id yang dikembalikan oleh panggilan API sebelumnya. task_id berlaku untuk kueri dalam waktu 24 jam.

curl -X GET https://dashscope-intl.aliyuncs.com/api/v1/tasks/{task_id} \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"

Kemampuan utama

1. Mengikuti instruksi (prompt)

Parameter: input.prompt (wajib) dan input.negative_prompt (opsional).

  • Prompt (positive prompt): Menggambarkan apa yang Anda inginkan dalam gambar—subjek, adegan, gaya, pencahayaan, dan komposisi. Ini adalah parameter kontrol utama untuk teks-ke-gambar.

  • Negative prompt: Menggambarkan apa yang tidak Anda inginkan dalam gambar, seperti “blurry” atau “extra fingers”. Digunakan hanya untuk membantu menyempurnakan kualitas output.

Kiat penulisan: Prompt terstruktur sering menghasilkan hasil lebih baik. Lihat Panduan prompt teks-ke-gambar untuk praktik terbaik.

2. Aktifkan penulisan ulang prompt

Parameter: parameters.prompt_extend (boolean, bawaan: true).

Fitur ini secara otomatis memperluas dan menyempurnakan prompt pendek untuk meningkatkan kualitas gambar. Mengaktifkannya menambahkan latensi 3–5 detik—waktu yang dibutuhkan model bahasa besar untuk menulis ulang teks.

Saran praktis:

  • Aktifkan saat prompt input Anda singkat atau umum. Ini secara signifikan meningkatkan kualitas gambar.

  • Nonaktifkan saat Anda membutuhkan kendali ketat atas detail, sudah memberikan deskripsi terperinci, atau memerlukan latensi rendah. Setel prompt_extend ke false.

3. Atur resolusi gambar output

Parameter: parameters.size (string), format: "width*height".

seri qwen-image-2.0: Mendukung lebar dan tinggi khusus. Total piksel harus antara 512*512 dan 2048*2048. Resolusi bawaan adalah 2048*2048. Resolusi yang direkomendasikan:

  • 2688*1536: 16:9

  • 1536*2688: 9:16

  • 2048*2048 (bawaan): 1:1

  • 2368*1728: 4:3

  • 1728*2368: 3:4

seri qwen-image-max dan qwen-image-plus: Hanya mendukung lima resolusi tetap berikut:

  • 1664*928 (bawaan): 16:9

  • 1472*1104: 4:3

  • 1328*1328: 1:1

  • 1104*1472: 3:4

  • 928*1664: 9:16

Model Wan V2 (versi 2.0 dan seterusnya): mendukung lebar dan tinggi dalam rentang [512, 1440] piksel, dengan jumlah total piksel tidak melebihi 1440*1440. Resolusi umum:

  • 1024*1024 (bawaan): 1:1

  • 1440*810: 16:9

  • 810*1440: 9:16

  • 1440*1080: 4:3

  • 1080*1440: 3:4

Peluncuran

  • Toleransi kesalahan

    • Atasi pembatasan laju: Saat API mengembalikan kode kesalahan Throttling atau kode status HTTP 429, permintaan dibatasi lajunya. Lihat Pembatasan laju untuk detailnya.

    • Poll tugas asinkron: Saat melakukan polling untuk hasil tugas asinkron, gunakan strategi yang masuk akal—seperti setiap 3 detik selama 30 detik pertama, lalu interval meningkat—untuk menghindari pemicuan pembatasan laju. Tetapkan timeout akhir (misalnya, 2 menit). Tandai tugas sebagai gagal jika melebihi waktu.

  • Pencegahan risiko

    • Penyimpanan persisten: URL gambar dari API kedaluwarsa setelah 24 jam. Sistem produksi harus segera mengunduh gambar setelah menerima URL dan menyimpannya di Penyimpanan persisten (misalnya, Alibaba Cloud Object Storage Service).

    • Moderasi konten: Semua input prompt dan negative_prompt dimoderasi. Jika konten melanggar kebijakan, permintaan diblokir dan mengembalikan kesalahan DataInspectionFailed.

    • Risiko hak cipta dan kepatuhan: Pastikan prompt Anda mematuhi hukum dan peraturan yang berlaku. Menghasilkan konten dengan merek dagang, kemiripan selebriti, atau IP berhak cipta dapat menimbulkan risiko pelanggaran. Anda bertanggung jawab atas risiko tersebut.

Referensi API

Penagihan dan pembatasan laju

Kode kesalahan

Jika pemanggilan model gagal dan mengembalikan pesan kesalahan, lihat Pesan kesalahan untuk penyelesaian.

FAQ

T: Berapa lama URL gambar berlaku? Bagaimana cara menyimpan gambar secara permanen?

J: URL gambar kedaluwarsa setelah 24 jam. Unduh gambar segera setelah menerima URL dan simpan ke Penyimpanan persisten—seperti server lokal atau Alibaba Cloud Object Storage Service.

T: Panggilan API saya mengembalikan DataInspectionFailed. Bagaimana cara memperbaikinya?

J: Kesalahan ini berarti teks input Anda memicu moderasi konten. Tinjau dan revisi prompt atau negative_prompt Anda untuk menghapus konten yang berpotensi tidak sesuai, lalu coba lagi.

T: Haruskah saya mengaktifkan atau menonaktifkan parameter prompt_extend?

J: Biarkan diaktifkan (bawaan) saat prompt Anda singkat atau Anda ingin model menambahkan detail kreatif. Nonaktifkan dengan menyetel ke false saat prompt Anda sudah terperinci—atau saat Anda membutuhkan kendali latensi ketat.

T: Bagaimana cara meningkatkan rendering teks dalam gambar?

J: Gunakan model qwen-image-2.0-pro. Model ini unggul dalam rendering teks.