全部产品
Search
文档中心

Alibaba Cloud Model Studio:Teks-ke-gambar

更新时间:Jan 13, 2026

API teks-ke-gambar memungkinkan Anda membuat citra baru berdasarkan deskripsi teks. Alibaba Cloud Model Studio menyediakan dua seri model utama:

  • Qwen-Image: Unggul dalam rendering teks kompleks berbahasa Tiongkok dan Inggris.

  • Seri Wan: Menghasilkan citra realistis dan efek visual berkualitas fotografi.

Coba secara online: Singapura | Beijing

Kinerja model

Qwen-Image

Teks kompleks

p1005416-转换自-png

Paragraf panjang

p1005400-转换自-png

Tata letak kompleks

3

Pembuatan poster

image

Desain ilustrasi

1

Fotografi realistis

2

Klik untuk melihat prompt

Teks kompleks: Etalase toko buku. Sebuah papan menampilkan “Barang Baru Minggu Ini”. Di bawahnya, label rak bertuliskan “Novel Terlaris di Sini”. Di sampingnya, poster berwarna-warni mengiklankan “Temu Penulis Hari Sabtu” dengan potret penulis di tengah. Terdapat empat buku di rak buku, yaitu “The light between worlds” “When stars are scattered” “The silent patient” “The night circus”

Paragraf panjang: Seorang gadis muda berpakaian seragam sekolah berdiri di kelas, menulis di papan tulis. Di tengah papan, tertulis rapi dengan kapur putih: “Memperkenalkan Qwen-Image, model generasi citra dasar yang unggul dalam rendering teks kompleks dan pengeditan citra presisi.” Cahaya alami lembut masuk melalui jendela, menciptakan bayangan halus. Adegan ini dirender dalam gaya fotografi realistis, dengan tekstur sangat detail, depth of field dangkal, dan nuansa warna hangat. Ekspresi fokus gadis tersebut dan debu kapur yang melayang di udara menambah rasa gerakan dan vitalitas. Elemen latar belakang—termasuk meja siswa dan poster edukasi—sedikit kabur untuk menekankan aksi utama. Resolusi ultra-tinggi 32K, kualitas gambar DSLR, efek bokeh lembut, dan komposisi bergaya dokumenter.

Tata letak kompleks: Buat slide PPT kelas untuk presentasi. Slide ini menampilkan bentuk artistik dan dekoratif yang membingkai informasi teks tersusun rapi sebagai infografis elegan. Judul tengah: ‘Kebiasaan untuk Kesejahteraan Emosional’, dikelilingi pola bunga simetris. Kiri atas: ‘Latih Mindfulness’ + ikon teratai minimalis + teks ‘Hadirlah saat ini, amati tanpa menghakimi, terima tanpa melawan’. Bawah: ‘Tanamkan Rasa Syukur’ + ilustrasi tangan terbuka + teks ‘Hargai kebahagiaan sederhana dan akui hal positif setiap hari’. Bawah kiri: ‘Tetap Terhubung’ + ikon gelembung obrolan minimalis + teks ‘Bangun dan pertahankan hubungan bermakna untuk menjaga energi emosional’. Bawah kanan: ‘Utamakan Tidur’ + ilustrasi bulan sabit + teks ‘Tidur berkualitas bermanfaat bagi tubuh dan pikiran’. Atas kanan: ‘Aktivitas Fisik Rutin’ + ikon pelari joging + teks ‘Olahraga meningkatkan suasana hati dan meredakan kecemasan’. Kanan atas: ‘Pembelajaran Berkelanjutan’ + ikon buku + teks ‘Terlibat dalam keterampilan dan pengetahuan baru demi pertumbuhan’. Tata letak menyeimbangkan kejelasan & seni, memandu penonton secara alami. --ar 16:9 --style clean - presentation.

Pembuatan poster: Poster bergambar tangan bergaya penyembuhan yang menampilkan tiga anak anjing bermain bola di atas rumput hijau subur, dihiasi elemen dekoratif seperti burung dan bintang. Judul utama “Come Play Ball!” ditampilkan mencolok di bagian atas dengan font kartun biru tebal. Di bawahnya, subjudul “Come [Show Off Your Skills]!” muncul dalam font hijau. Gelembung ucapan menambah daya tarik bermain dengan teks: “Hehe, watch me amaze my little friends next!” Di bagian bawah, teks tambahan berbunyi: “We get to play ball with our friends again!” Palet warna berpusat pada hijau dan biru segar, diaksen dengan nada pink dan kuning cerah untuk menonjolkan suasana ceria dan kekanak-kanakan.

Desain ilustrasi: Ilustrasi cerah dan hidup dari pemandangan jalanan komersial cerah yang ramai, potongan kehidupan sehari-hari. Di latar depan, seorang anak laki-laki muda berkaos putih dan celana pendek sedang memilih barang dari gerai pasar. Gerai tersebut dipenuhi camilan, minuman, dan barang kebutuhan sehari-hari. Pemilik gerai, seorang pria paruh baya bercelemek, sedang mengatur produk. Papan kayu bertuliskan “Qwen-Image” bergaya tulisan tangan menggantung di atas gerai. Latar belakang menampilkan bangunan modern berwarna-warni dengan papan nama mencolok untuk “Alibaba” “Model Studio” “Teks-ke-Gambar”. Langit biru cerah dengan awan putih mengembang dan burung camar yang terbang. Gaya Seni: Ilustrasi realisme, halus dan lembut, warna cerah, lapisan kaya, tekstur gambar tangan halus, detail, cahaya dan bayangan kuat, komposisi penuh, rasa kedalaman kuat, suasana ceria dan santai.

Fotografi realistis: Fotografi jalanan mode tinggi yang realistis dari seorang perempuan Asia muda. Ia berdiri percaya diri di jalan kota yang hidup dan bercahaya neon pada malam hari. Ia mengenakan jaket bomber hitam ramping dengan logo geometris putih halus dan kata “Qwen” disulam di bagian belakang, dipadukan dengan celana kargo gelap. Latar belakang dipenuhi papan nama bercahaya dan bokeh lembut lampu kota, menciptakan suasana sinematik dan atmosferik. Pencahayaannya dramatis, dengan sorotan dari papan neon yang memantulkan warna ke wajah dan jaketnya. Di sudut kanan bawah, teks overlay bertuliskan “Neon Dreams” dan “Urban Pulse”. Teks tersebut menggunakan font sans-serif modern dan stylish dengan efek cahaya neon halus, terintegrasi mulus ke dalam komposisi. Seluruh gambar harus menjadi mahakarya ultra-detail, 8K UHD, dengan fokus tajam dan kualitas fotografi profesional, menangkap momen urban spontan namun kuat.

Wan

Fotografi potret

p1023523-转换自-png

Fotografi realistis

p1023409-转换自-png

Gaya lukisan

p1023526-转换自-png

Generasi teks

p1023535-转换自-png

Desain poster

p1023546-转换自-png

Generasi set citra

p1023532-转换自-png

Klik untuk melihat prompt

Fotografi potret: Potret hiper-realistis perempuan Skandinavia, rambut pirang platinum mengalir dan mata biru menusuk dengan bintik-bintik mencolok, tatapan intelektual tajam, pencahayaan directional bernuansa dingin Nordik menciptakan suasana es, gaya modern minimalis dengan garis bersih, depth-of-field dangkal dengan latar belakang gradien dingin yang kabur, fitur wajah Nordik autentik dan tekstur kulit porselen.

Fotografi realistis: Adegan hutan perspektif fish-eye dengan distorsi perspektif dramatis, rubah merah ultra-detail menatap lensa dengan mata amber menusuk, tekstur bulu hiper-realistis menunjukkan rambut pelindung individual dan lapisan undercoat, pohon terdistorsi radial membentuk pola latar belakang melingkar, gaya lukisan cat air dengan sapuan transparan dan rembesan pigmen organik, palet pastel lembut warna hijau lumut dan oker tanah, pencahayaan bergaya lukisan dengan cahaya atmosferik melalui celah kanopi

Gaya lukisan: Adegan pastoral gaya lukisan minyak vintage, seorang petani menggembalakan domba melintasi padang rumput penuh bunga liar, kincir angin di kejauhan berputar di bawah langit biru dan awan putih, asap mengepul dari cerobong rumah kayu, warna cerah dan lembut, penuh ketenangan dan kenyamanan.

Generasi teks: Halaman dari buku ilustrasi botani, gaya cat air gambar tangan, menggambarkan "dandelion" dan memberi label berbagai bagiannya.

Desain poster: Adegan poster sinematik: Close-up ekstrem makro mata dalam retakan kayu. Monokrom minimalis, fusi cat air-CGI, saturasi rendah. Dorongan lambat dengan getaran untuk intensitas surealis. Ruang negatif luas, judul tersembunyi. Dioptimalkan untuk generasi video imersif.

Generasi set citra: Kenangan kehidupan seorang pria tua, empat potret dalam bingkai berbeda, menggambarkan masa kecilnya (foto hitam putih), masa muda (foto seragam militer), usia paruh baya (foto kerja setelan bisnis), dan masa tua (foto bersama istrinya).

Model yang didukung

Pemilihan model

  • Rendering teks kompleks (misalnya untuk poster dan kaligrafi): Gunakan qwen-image-max atau wan2.6-t2i.

  • Adegan realistis dan gaya fotografi (untuk skenario umum): Gunakan model Wan, seperti wan2.6-t2i atau wan2.5-t2i-preview.

  • Resolusi output citra kustom: Gunakan model Wan, seperti wan2.2-t2i-flash. Model ini mendukung kombinasi lebar dan tinggi apa pun dalam rentang 512 hingga 1440 piksel.

    Qwen-Image hanya mendukung lima resolusi tetap: 1664×928 (16:9), 928×1664 (9:16), 1328×1328 (1:1), 1472×1104 (4:3), dan 1104×1472 (3:4).

Mulai

Prasyarat

Sebelum memulai, buat kunci API dan ekspor sebagai variabel lingkungan. Jika Anda menggunakan SDK DashScope, instal SDK.

Kode contoh

Metode pemanggilan: Qwen-Image mendukung panggilan sinkron. Model qwen-image-plus dan qwen-image juga mendukung panggilan asinkron. Wan hanya mendukung panggilan asinkron.

  • Panggilan asinkron: API untuk kedua model kompatibel. Anda cukup mengubah parameter model untuk beralih di antara keduanya. Misalnya, untuk menggunakan model Wan, atur model ke "wan2.2-t2i-flash".

  • Panggilan sinkron: Hanya Qwen-Image yang mendukung metode ini. Untuk mempelajari cara melakukan panggilan sinkron, lihat Referensi API Qwen-Image.

Contoh berikut menggunakan metode panggilan asinkron. Kode contoh menggunakan qwen-image-plus sebagai contoh, tetapi pendekatan yang sama berlaku untuk model Wan.

SDK mengenkapsulasi logika pemrosesan asinkron, sehingga tampak sebagai panggilan sinkron di tingkat antarmuka. Artinya, satu permintaan menunggu hasil akhir. Sebaliknya, contoh curl menggunakan dua panggilan API asinkron terpisah: satu untuk mengirimkan tugas dan satu lagi untuk menanyakan hasilnya.

Python

Contoh permintaan

from http import HTTPStatus
from urllib.parse import urlparse, unquote
from pathlib import PurePosixPath
import requests
from dashscope import ImageSynthesis
import os
import dashscope

# URL berikut untuk wilayah Singapura. Jika Anda menggunakan model di wilayah Tiongkok (Beijing), ganti URL dengan: https://dashscope.aliyuncs.com/api/v1
dashscope.base_http_api_url = 'https://dashscope-intl.aliyuncs.com/api/v1'

prompt = "Poster bergambar tangan bergaya penyembuhan yang menampilkan tiga anak anjing bermain bola di atas rumput hijau subur, dihiasi elemen dekoratif seperti burung dan bintang. Judul utama “Come Play Ball!” ditampilkan mencolok di bagian atas dengan font kartun biru tebal. Di bawahnya, subjudul “Come [Show Off Your Skills]!” muncul dalam font hijau. Gelembung ucapan menambah daya tarik bermain dengan teks: “Hehe, watch me amaze my little friends next!” Di bagian bawah, teks tambahan berbunyi: “We get to play ball with our friends again!” Palet warna berpusat pada hijau dan biru segar, diaksen dengan nada pink dan kuning cerah untuk menonjolkan suasana ceria dan kekanak-kanakan."

# Kunci API untuk wilayah Singapura dan Tiongkok (Beijing) berbeda. Untuk mendapatkan kunci API, lihat https://www.alibabacloud.com/help/en/model-studio/get-api-key
# Jika Anda belum mengonfigurasi variabel lingkungan, ganti baris berikut dengan kunci API Model Studio Anda: api_key="sk-xxx"
api_key = os.getenv("DASHSCOPE_API_KEY")

print('----panggilan sinkron, harap tunggu sebentar----')
rsp = ImageSynthesis.call(api_key=api_key,
                          model="qwen-image-plus", # Saat ini, hanya model qwen-image-plus dan qwen-image yang mendukung panggilan API asinkron.
                          prompt=prompt,
                          negative_prompt=" ",
                          n=1,
                          size='1664*928',
                          prompt_extend=True,
                          watermark=False)
print(f'respons: {rsp}')
if rsp.status_code == HTTPStatus.OK:
    # Simpan citra ke direktori saat ini.
    for result in rsp.output.results:
        file_name = PurePosixPath(unquote(urlparse(result.url).path)).parts[-1]
        with open('./%s' % file_name, 'wb+') as f:
            f.write(requests.get(result.url).content)
else:
    print(f'panggilan_sinkron Gagal, status_code: {rsp.status_code}, kode: {rsp.code}, pesan: {rsp.message}')

Contoh respons

URL berlaku selama 24 jam. Unduh citra segera.
{
    "status_code": 200,
    "request_id": "a47b1a65-7041-4565-9068-xxxxxx",
    "code": null,
    "message": "",
    "output": {
        "task_id": "91093132-475e-43cf-b94e-xxxxxx",
        "task_status": "SUCCEEDED",
        "results": [
            {
                "url": "https://dashscope-result-sz.oss-cn-shenzhen.aliyuncs.com/xxx.png?Expires=xxxxxx",
                "orig_prompt": "Poster bergambar tangan bergaya penyembuhan yang menampilkan tiga anak anjing bermain bola di atas rumput hijau subur, dihiasi elemen dekoratif seperti burung dan bintang. Judul utama “Come Play Ball!” ditampilkan mencolok di bagian atas dengan font kartun biru tebal. Di bawahnya, subjudul “Come [Show Off Your Skills]!” muncul dalam font hijau. Gelembung ucapan menambah daya tarik bermain dengan teks: “Hehe, watch me amaze my little friends next!” Di bagian bawah, teks tambahan berbunyi: “We get to play ball with our friends again!” Palet warna berpusat pada hijau dan biru segar, diaksen dengan nada pink dan kuning cerah untuk menonjolkan suasana ceria dan kekanak-kanakan.",
                "actual_prompt": "Desain poster bergambar tangan bergaya masa kecil: Tiga anak anjing bermain dengan riang berinteraksi dengan bola berwarna-warni di atas hamparan rumput hijau subur. Elemen dekoratif halus termasuk burung yang beterbangan dan bintang berkelap-kelip tersebar di seluruh area. Di tengah atas, judul tebal bergaya kartun biru “Come Play Ball!” menonjol mencolok. Tepat di bawahnya, subjudul “Come [Show Off Your Skills]!” ditulis dengan huruf hijau ceria. Gelembung ucapan whimsical di dekat salah satu anak anjing berisi teks bermain: “Hehe, watch me amaze my little friends next!” Di tepi bawah, teks tambahan yang lebih kecil berbunyi: “We get to play ball with our friends again!” Palet warna berpusat pada hijau segar dan biru langit, diaksen dengan sentuhan pink cerah dan kuning cerah, meningkatkan suasana ceria dan kekanak-kanakan. Gaya mengevokasi ilustrasi tinta tangan nostalgia dengan tekstur lembut, garis halus, dan komposisi seperti buku cerita whimsical."
            }
        ],
        "submit_time": "2025-09-09 13:39:20.659",
        "scheduled_time": "2025-09-09 13:39:20.717",
        "end_time": "2025-09-09 13:39:45.233"
    },
    "usage": {
        "image_count": 1
    }
}

Java

Contoh permintaan

// Copyright (c) Alibaba, Inc. and its affiliates.

import com.alibaba.dashscope.aigc.imagesynthesis.ImageSynthesis;
import com.alibaba.dashscope.aigc.imagesynthesis.ImageSynthesisListResult;
import com.alibaba.dashscope.aigc.imagesynthesis.ImageSynthesisParam;
import com.alibaba.dashscope.aigc.imagesynthesis.ImageSynthesisResult;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import com.alibaba.dashscope.task.AsyncTaskListParam;
import com.alibaba.dashscope.utils.Constants;
import com.alibaba.dashscope.utils.JsonUtils;
import java.util.HashMap;
import java.util.Map;

public class Text2Image {
    static {
        // URL berikut untuk wilayah Singapura. Jika Anda menggunakan model di wilayah Tiongkok (Beijing), ganti URL dengan: https://dashscope.aliyuncs.com/api/v1
        Constants.baseHttpApiUrl = "https://dashscope-intl.aliyuncs.com/api/v1";
    }

    // Kunci API untuk wilayah Singapura dan Tiongkok (Beijing) berbeda. Untuk mendapatkan kunci API, lihat https://www.alibabacloud.com/help/en/model-studio/get-api-key
    // Jika Anda belum mengonfigurasi variabel lingkungan, ganti baris berikut dengan kunci API Model Studio Anda: static String apiKey = "sk-xxx"
    static String apiKey = System.getenv("DASHSCOPE_API_KEY");

    public static void basicCall() throws ApiException, NoApiKeyException {
        String prompt = "Poster bergambar tangan bergaya penyembuhan yang menampilkan tiga anak anjing bermain bola di atas rumput hijau subur, dihiasi elemen dekoratif seperti burung dan bintang. Judul utama “Come Play Ball!” ditampilkan mencolok di bagian atas dengan font kartun biru tebal. Di bawahnya, subjudul “Come [Show Off Your Skills]!” muncul dalam font hijau. Gelembung ucapan menambah daya tarik bermain dengan teks: “Hehe, watch me amaze my little friends next!” Di bagian bawah, teks tambahan berbunyi: “We get to play ball with our friends again!” Palet warna berpusat pada hijau dan biru segar, diaksen dengan nada pink dan kuning cerah untuk menonjolkan suasana ceria dan kekanak-kanakan.";
        Map<String, Object> parameters = new HashMap<>();
        parameters.put("prompt_extend", true);
        parameters.put("watermark", false);
        parameters.put("negative_prompt", " ");
        ImageSynthesisParam param =
                ImageSynthesisParam.builder()
                        .apiKey(apiKey)
                        // Saat ini, hanya model qwen-image-plus dan qwen-image yang mendukung panggilan API asinkron.
                        .model("qwen-image-plus")
                        .prompt(prompt)
                        .n(1)
                        .size("1664*928")
                        .parameters(parameters)
                        .build();

        ImageSynthesis imageSynthesis = new ImageSynthesis();
        ImageSynthesisResult result = null;
        try {
            System.out.println("---panggilan sinkron, harap tunggu sebentar----");
            result = imageSynthesis.call(param);
        } catch (ApiException | NoApiKeyException e){
            throw new RuntimeException(e.getMessage());
        }
        System.out.println(JsonUtils.toJson(result));
    }

    public static void main(String[] args){
        try{
            basicCall();
        }catch(ApiException|NoApiKeyException e){
            System.out.println(e.getMessage());
        }
    }
}

Contoh respons

URL berlaku selama 24 jam. Unduh citra segera.
{
    "request_id": "9f3044ba-528f-4606-8830-xxxxxx",
    "output": {
        "task_id": "fecf4c7f-3508-45f4-8454-xxxxxx",
        "task_status": "SUCCEEDED",
        "results": [
            {
                "orig_prompt": "Poster bergambar tangan bergaya penyembuhan yang menampilkan tiga anak anjing bermain bola di atas rumput hijau subur, dihiasi elemen dekoratif seperti burung dan bintang. Judul utama “Come Play Ball!” ditampilkan mencolok di bagian atas dengan font kartun biru tebal. Di bawahnya, subjudul “Come [Show Off Your Skills]!” muncul dalam font hijau. Gelembung ucapan menambah daya tarik bermain dengan teks: “Hehe, watch me amaze my little friends next!” Di bagian bawah, teks tambahan berbunyi: “We get to play ball with our friends again!” Palet warna berpusat pada hijau dan biru segar, diaksen dengan nada pink dan kuning cerah untuk menonjolkan suasana ceria dan kekanak-kanakan.",
                "actual_prompt": "Desain poster bergambar tangan bergaya masa kecil: Tiga anak anjing bermain dengan riang berinteraksi dengan bola berwarna-warni di atas hamparan rumput hijau subur. Elemen dekoratif halus termasuk burung yang beterbangan dan bintang berkelap-kelip tersebar di seluruh area. Di tengah atas, judul tebal bergaya kartun biru “Come Play Ball!” menonjol mencolok. Tepat di bawahnya, subjudul “Come [Show Off Your Skills]!” ditulis dengan huruf hijau ceria. Gelembung ucapan whimsical di dekat salah satu anak anjing berisi teks bermain: “Hehe, watch me amaze my little friends next!” Di tepi bawah, teks tambahan yang lebih kecil berbunyi: “We get to play ball with our friends again!” Palet warna berpusat pada hijau segar dan biru langit, diaksen dengan sentuhan pink cerah dan kuning cerah, meningkatkan suasana ceria dan kekanak-kanakan. Gaya mengevokasi ilustrasi tinta tangan nostalgia dengan tekstur lembut, garis halus, dan komposisi seperti buku cerita whimsical.",
                "url": "https://dashscope-result-sz.oss-cn-shenzhen.aliyuncs.com/xxx.png?Expires=xxxx"
            }
        ]
    },
    "usage": {
        "image_count": 1
    }
}

curl

Catatan
  • Untuk panggilan asinkron, atur parameter header X-DashScope-Async ke enable.

  • task_id untuk tugas asinkron berlaku selama 24 jam. Setelah kedaluwarsa, status tugas berubah menjadi UNKNOWN.

Langkah 1: Kirim permintaan pembuatan tugas

Permintaan ini mengembalikan ID tugas (task_id).

curl -X POST https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/text2image/image-synthesis \
    -H 'X-DashScope-Async: enable' \
    -H "Authorization: Bearer $DASHSCOPE_API_KEY" \
    -H 'Content-Type: application/json' \
    -d '{
    "model": "qwen-image-plus",
    "input": {
        "prompt": "Poster bergambar tangan bergaya penyembuhan yang menampilkan tiga anak anjing bermain bola di atas rumput hijau subur, dihiasi elemen dekoratif seperti burung dan bintang. Judul utama “Come Play Ball!” ditampilkan mencolok di bagian atas dengan font kartun biru tebal. Di bawahnya, subjudul “Come [Show Off Your Skills]!” muncul dalam font hijau. Gelembung ucapan menambah daya tarik bermain dengan teks: “Hehe, watch me amaze my little friends next!” Di bagian bawah, teks tambahan berbunyi: “We get to play ball with our friends again!” Palet warna berpusat pada hijau dan biru segar, diaksen dengan nada pink dan kuning cerah untuk menonjolkan suasana ceria dan kekanak-kanakan."
    },
    "parameters": {
        "negative_prompt":" ",
        "size": "1664*928",
        "n": 1,
        "prompt_extend": true,
        "watermark": false
    }
}'        
Langkah 2: Tanyakan hasil berdasarkan ID tugas

Gunakan task_id dari langkah sebelumnya untuk memeriksa status tugas melalui API hingga task_status menjadi SUCCEEDED atau FAILED.

Ganti 86ecf553-d340-4e21-xxxxxxxxx dengan ID tugas aktual.

Kunci API bersifat spesifik wilayah. Dapatkan kunci API.
Untuk model di wilayah Beijing, ganti base_url dengan https://dashscope.aliyuncs.com/api/v1/tasks/86ecf553-d340-4e21-xxxxxxxxx
curl -X GET https://dashscope-intl.aliyuncs.com/api/v1/tasks/86ecf553-d340-4e21-xxxxxxxxx \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"

Kemampuan utama

1. Mengikuti instruksi (prompt)

Parameter: input.prompt (wajib), input.negative_prompt (opsional).

  • prompt (positive prompt): Menggambarkan konten, subjek, adegan, gaya, pencahayaan, dan komposisi yang ingin Anda lihat dalam citra. Ini adalah parameter inti untuk mengontrol generasi teks-ke-gambar.

  • negative_prompt: Menggambarkan konten yang tidak ingin Anda lihat dalam citra, seperti "blurry" atau "extra fingers". Ini hanya digunakan untuk membantu mengoptimalkan kualitas generasi.

Kiat penulisan: Prompt terstruktur biasanya menghasilkan hasil lebih baik. Untuk kiat penulisan, lihat Panduan prompt teks-ke-gambar.

2. Aktifkan penulisan ulang prompt

Parameter: parameters.prompt_extend (bool, default true).

Fitur ini secara otomatis memperluas dan mengoptimalkan prompt pendek untuk meningkatkan kualitas citra. Mengaktifkan fitur ini menambahkan latensi 3 hingga 5 detik karena model besar digunakan untuk menulis ulang prompt.

Praktik terbaik:

  • Aktifkan saat prompt input Anda sederhana atau luas. Fitur ini dapat secara signifikan meningkatkan kualitas citra.

  • Nonaktifkan jika Anda ingin mengontrol detail halus, sudah memberikan deskripsi terperinci, atau sensitif terhadap latensi respons API. Untuk menonaktifkannya, atur eksplisit parameter prompt_extend ke false.

3. Atur resolusi output citra

Parameter: parameters.size (string), dalam format "width*height".

Qwen-Image: Hanya mendukung lima resolusi tetap berikut:

  • 1664×928 (default): 16:9.

  • 1472×1104: 4:3.

  • 1328×1328: 1:1.

  • 1104×1472: 3:4.

  • 928×1664: 9:16.

Model Wan V2 (v2.0 dan seterusnya): Mendukung resolusi dengan lebar dan tinggi dari 512 hingga 1440 piksel, asalkan jumlah total piksel tidak melebihi 1440×1440. Resolusi umum:

  • 1024×1024 (default): 1:1.

  • 1440×810: 16:9.

  • 810×1440: 9:16.

  • 1440×1080: 4:3.

  • 1080×1440: 3:4.

Tayang

  • Strategi toleransi kesalahan

    • Atasi pembatasan laju: Jika API mengembalikan kode kesalahan Throttling atau status HTTP 429, pembatasan laju telah dipicu, lihat Batas laju.

    • Polling tugas asinkron: Saat memeriksa hasil tugas asinkron, gunakan strategi polling yang wajar, seperti polling setiap 3 detik selama 30 detik pertama lalu tingkatkan intervalnya. Ini membantu menghindari pemicuan pembatasan laju akibat permintaan terlalu sering. Tetapkan timeout akhir untuk tugas, misalnya 2 menit, dan anggap tugas gagal jika melebihi waktu tersebut.

  • Pencegahan risiko

    • Persistensi hasil: URL citra yang dikembalikan API berlaku selama 24 jam. Sistem produksi Anda harus segera mengunduh citra setelah Anda mendapatkan URL dan memindahkannya ke layanan penyimpanan persisten Anda sendiri, seperti Alibaba Cloud Object Storage Service (OSS).

    • Moderasi Konten: Semua input prompt dan negative_prompt menjalani moderasi konten. Jika input tidak sesuai, permintaan diblokir dan dikembalikan kesalahan DataInspectionFailed.

    • Risiko hak cipta dan kepatuhan konten yang dihasilkan: Pastikan konten prompt Anda mematuhi peraturan perundang-undangan terkait. Menghasilkan konten yang mencakup merek dagang, potret selebriti, atau gambar IP berhak cipta dapat menimbulkan risiko pelanggaran. Anda bertanggung jawab untuk menilai dan menanggung segala kewajiban yang timbul.

Referensi API

Penagihan dan pembatasan laju

Untuk informasi tentang kuota gratis dan harga satuan model, lihat Generasi citra.

Aturan penagihan

  • Item yang ditagih: Anda ditagih berdasarkan jumlah citra yang berhasil dihasilkan dengan metode penagihan bayar sesuai pemakaian.

  • Rumus penagihan: Biaya = Harga satuan × Jumlah citra.

  • Urutan konsumsi: Kuota gratis dikonsumsi terlebih dahulu. Setelah kuota gratis Anda habis, metode penagihan bayar sesuai pemakaian digunakan secara default.

    • Anda dapat mengaktifkan opsi "Hanya kuota gratis" untuk mencegah biaya setelah kuota gratis Anda habis. Untuk informasi lebih lanjut, lihat Kuota gratis untuk pengguna baru.

  • Tidak dikenai biaya untuk kegagalan: Panggilan model yang gagal atau kesalahan pemrosesan tidak dikenai biaya atau menghabiskan kuota gratis.

Kuota gratis

Untuk informasi lebih lanjut tentang cara mengklaim, menanyakan, dan menggunakan kuota gratis, lihat Kuota gratis untuk pengguna baru.

Menanyakan penggunaan

Sekitar satu jam setelah panggilan model selesai, Anda dapat membuka halaman Observasi Model (Singapura) untuk melihat metrik seperti penggunaan, jumlah panggilan, dan tingkat keberhasilan.

Jika Anda menggunakan model di wilayah Tiongkok (Beijing), buka halaman Observasi Model untuk wilayah Tiongkok (Beijing).

Pembatasan laju

Untuk aturan pembatasan laju dan FAQ, lihat Batas laju.

Kode kesalahan

Jika panggilan gagal, lihat Pesan kesalahan untuk troubleshooting.

FAQ

T: Berapa lama URL citra berlaku? Bagaimana cara menyimpan citra saya secara permanen?

J: URL citra berlaku selama 24 jam. Anda harus segera mengunduh citra setelah mendapatkan URL dan menyimpannya ke penyimpanan persisten Anda sendiri, seperti server lokal atau Object Storage Service (OSS).

T: Panggilan API mengembalikan kesalahan DataInspectionFailed. Apa yang harus saya lakukan?

J: Kesalahan ini menunjukkan bahwa teks input memicu moderasi konten. Periksa dan modifikasi teks dalam prompt atau negative_prompt untuk menghapus konten yang berpotensi tidak sesuai, lalu coba ulang permintaan.

T: Haruskah saya mengaktifkan atau menonaktifkan parameter prompt_extend?

J: Biarkan diaktifkan (default) saat prompt Anda sederhana atau Anda ingin model lebih kreatif. Atur eksplisit ke false saat prompt Anda sudah sangat detail dan profesional, atau saat Anda memiliki persyaratan ketat terhadap latensi respons API.

T: Bagaimana cara meningkatkan kualitas teks yang dihasilkan dalam citra?

J: Jika bisnis Anda sangat bergantung pada generasi teks yang jelas dan akurat dalam citra, gunakan model qwen-image-plus. Model ini secara khusus dilatih untuk skenario tersebut.