Cara menggunakan model pemikiran mendalam - Alibaba Cloud Model Studio

Model pemikiran mendalam melakukan penalaran sebelum menghasilkan respons, sehingga meningkatkan akurasi untuk tugas kompleks seperti penalaran logis dan perhitungan numerik. Topik ini menjelaskan cara memanggil model pemikiran mendalam, seperti Qwen dan DeepSeek.

Panduan implementasi

Alibaba Cloud Model Studio menyediakan API untuk berbagai model pemikiran mendalam. Model-model tersebut mendukung dua mode: hybrid-thinking dan thinking-only.

Mode hybrid-thinking: Gunakan parameter enable_thinking untuk mengontrol apakah mode berpikir diaktifkan:

Atur ke true: Model melakukan penalaran sebelum memberikan respons.
Atur ke false: Model memberikan respons secara langsung.

Kompatibel dengan OpenAI

# Impor dependensi dan buat client...
completion = client.chat.completions.create(
    model="qwen-plus", # Pilih model
    messages=[{"role": "user", "content": "Who are you"}],    
    # Karena enable_thinking bukan parameter standar OpenAI, lewatkan melalui extra_body
    extra_body={"enable_thinking":True},
    # Panggil dalam mode keluaran streaming
    stream=True,
    # Pastikan paket data terakhir dari respons streaming berisi informasi konsumsi token
    stream_options={
        "include_usage": True
    }
)

DashScope

# Impor dependensi...

response = Generation.call(
    # Jika Anda belum mengonfigurasi variabel lingkungan, ganti baris berikut dengan Kunci API Model Studio Anda: api_key = "sk-xxx",
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    # Anda dapat mengganti ini dengan model pemikiran mendalam lain sesuai kebutuhan
    model="qwen-plus",
    messages=messages,
    result_format="message",
    enable_thinking=True,
    stream=True,
    incremental_output=True
)

Mode thinking-only: Model selalu berpikir sebelum memberikan respons, dan perilaku ini tidak dapat dinonaktifkan. Format permintaan sama dengan mode hybrid-thinking, tetapi parameter enable_thinking tidak diperlukan.

Proses berpikir dikembalikan dalam bidang reasoning_content, sedangkan respons dikembalikan dalam bidang content. Model pemikiran mendalam melakukan penalaran sebelum memberikan respons, sehingga meningkatkan waktu respons. Sebagian besar model ini hanya mendukung keluaran streaming; oleh karena itu, contoh dalam topik ini menggunakan panggilan streaming.

Model yang didukung

Qwen3

Edisi komersial
- Seri Qwen-Max (mode hybrid-thinking, dinonaktifkan secara default): qwen3-max, qwen3-max-2026-01-23, qwen3-max-preview
- Seri Qwen-Plus (mode hybrid-thinking, dinonaktifkan secara default): qwen-plus, qwen-plus-latest, qwen-plus-2025-04-28, dan model snapshot versi berikutnya
- Seri Qwen-Flash (mode hybrid-thinking, dinonaktifkan secara default): qwen-flash, qwen-flash-2025-07-28, dan model snapshot versi berikutnya
- Seri Qwen-Turbo (mode hybrid-thinking, dinonaktifkan secara default): qwen-turbo, qwen-turbo-latest, qwen-turbo-2025-04-28, dan model snapshot versi berikutnya
Edisi open-source
- Mode hybrid-thinking, diaktifkan secara default: qwen3-235b-a22b, qwen3-32b, qwen3-30b-a3b, qwen3-14b, qwen3-8b, qwen3-4b, qwen3-1.7b, qwen3-0.6b
- Mode thinking-only: qwen3-next-80b-a3b-thinking, qwen3-235b-a22b-thinking-2507, qwen3-30b-a3b-thinking-2507

QwQ (berbasis Qwen2.5)

Mode thinking-only: qwq-plus, qwq-plus-latest, qwq-plus-2025-03-05, qwq-32b

DeepSeek (Wilayah Beijing)

Mode hybrid-thinking, dinonaktifkan secara default: deepseek-v3.2, deepseek-v3.2-exp, deepseek-v3.1
Mode thinking-only: deepseek-r1, deepseek-r1-0528, deepseek-r1 distilled model

Kimi (Wilayah Beijing)

Mode thinking-only: kimi-k2-thinking

Untuk informasi selengkapnya mengenai nama model, konteks, harga, dan versi snapshot, lihat Daftar model. Untuk informasi selengkapnya mengenai pembatasan laju, lihat Batas laju.

Mulai

Prasyarat: Buat Kunci API dan atur Kunci API sebagai variabel lingkungan. Jika menggunakan SDK, Anda harus menginstal SDK OpenAI atau DashScope (SDK DashScope untuk Java harus versi 2.19.4 atau lebih baru).

Jalankan kode berikut untuk memanggil model qwen-plus dalam mode berpikir dengan keluaran streaming.

Kompatibel dengan OpenAI

Python

Kode contoh

from openai import OpenAI
import os

# Inisialisasi client OpenAI
client = OpenAI(
    # Jika Anda belum mengonfigurasi variabel lingkungan, ganti berikut dengan Kunci API Model Studio Anda: api_key="sk-xxx"
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    # Berikut adalah base_url untuk wilayah Singapura. Jika Anda menggunakan model di wilayah Virginia, ganti base_url dengan https://dashscope-us.aliyuncs.com/compatible-mode/v1
    # Jika Anda menggunakan model di wilayah Beijing, ganti base_url dengan https://dashscope.aliyuncs.com/compatible-mode/v1
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

messages = [{"role": "user", "content": "Who are you"}]

completion = client.chat.completions.create(
    model="qwen-plus",  # Anda dapat mengganti ini dengan model pemikiran mendalam lain sesuai kebutuhan
    messages=messages,
    extra_body={"enable_thinking": True},
    stream=True,
    stream_options={
        "include_usage": True
    },
)

reasoning_content = ""  # Proses berpikir lengkap
answer_content = ""  # Respons lengkap
is_answering = False  # Menunjukkan apakah fase respons telah dimulai
print("\n" + "=" * 20 + "Proses berpikir" + "=" * 20 + "\n")

for chunk in completion:
    if not chunk.choices:
        print("\nUsage:")
        print(chunk.usage)
        continue

    delta = chunk.choices[0].delta

    # Kumpulkan hanya konten berpikir
    if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None:
        if not is_answering:
            print(delta.reasoning_content, end="", flush=True)
        reasoning_content += delta.reasoning_content

    # Saat konten diterima, mulai merespons
    if hasattr(delta, "content") and delta.content:
        if not is_answering:
            print("\n" + "=" * 20 + "Respons lengkap" + "=" * 20 + "\n")
            is_answering = True
        print(delta.content, end="", flush=True)
        answer_content += delta.content

Respons

====================Proses Berpikir====================

Oke, pengguna bertanya "Siapa Anda", jadi saya perlu memberikan tanggapan yang akurat dan ramah. Pertama, saya harus memastikan identitas saya, yaitu Qwen, yang dikembangkan oleh Lab Tongyi di bawah Alibaba Group. Selanjutnya, saya harus menjelaskan fungsi utama saya, seperti menjawab pertanyaan, membuat teks, dan melakukan penalaran logis. Di saat yang sama, saya harus mempertahankan nada yang ramah serta menghindari penggunaan istilah teknis yang terlalu rumit agar pengguna merasa nyaman. Saya juga perlu menghindari penggunaan terminologi kompleks guna memastikan tanggapan ini ringkas dan jelas. Selain itu, saya mungkin perlu menambahkan beberapa elemen interaktif, seperti mengundang pengguna untuk mengajukan pertanyaan guna mendorong komunikasi lebih lanjut. Terakhir, saya akan memeriksa apakah ada informasi penting yang terlewat, seperti nama Mandarin saya "Tongyi Qianwen" dan nama Inggris saya "Qwen", serta perusahaan induk dan laboratorium pengembang saya. Saya harus memastikan tanggapan ini komprehensif dan memenuhi harapan pengguna.
====================Tanggapan Lengkap====================

Halo! Saya Qwen, sebuah model bahasa besar ultra yang dikembangkan secara mandiri oleh Lab Tongyi di bawah Alibaba Group. Saya dapat menjawab pertanyaan, membuat teks, melakukan penalaran logis, dan menulis kode, dengan tujuan menyediakan pengguna dengan informasi dan layanan berkualitas tinggi. Anda dapat memanggil saya Qwen, atau hanya Tongyi Qianwen. Bagaimana saya bisa membantu Anda?

Node.js

Kode contoh

import OpenAI from "openai";
import process from 'process';

// Inisialisasi client OpenAI
const openai = new OpenAI({
    apiKey: process.env.DASHSCOPE_API_KEY, // Baca dari variabel lingkungan
    // Berikut adalah base_url untuk wilayah Singapura. Jika Anda menggunakan model di wilayah Virginia, ganti base_url dengan https://dashscope-us.aliyuncs.com/compatible-mode/v1 
    // Jika Anda menggunakan model di wilayah Beijing, ganti base_url dengan https://dashscope.aliyuncs.com/compatible-mode/v1
    baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1'
});

let reasoningContent = '';
let answerContent = '';
let isAnswering = false;

async function main() {
    try {
        const messages = [{ role: 'user', content: 'Who are you' }];
        const stream = await openai.chat.completions.create({
            model: 'qwen-plus',
            messages,
            stream: true,
            enable_thinking: true
        });
        console.log('\n' + '='.repeat(20) + 'Proses berpikir' + '='.repeat(20) + '\n');

        for await (const chunk of stream) {
            if (!chunk.choices?.length) {
                console.log('\nUsage:');
                console.log(chunk.usage);
                continue;
            }

            const delta = chunk.choices[0].delta;
            
            // Kumpulkan hanya konten berpikir
            if (delta.reasoning_content !== undefined && delta.reasoning_content !== null) {
                if (!isAnswering) {
                    process.stdout.write(delta.reasoning_content);
                }
                reasoningContent += delta.reasoning_content;
            }

            // Saat konten diterima, mulai merespons
            if (delta.content !== undefined && delta.content) {
                if (!isAnswering) {
                    console.log('\n' + '='.repeat(20) + 'Respons lengkap' + '='.repeat(20) + '\n');
                    isAnswering = true;
                }
                process.stdout.write(delta.content);
                answerContent += delta.content;
            }
        }
    } catch (error) {
        console.error('Error:', error);
    }
}

main();

Hasil pengembalian

====================Proses Berpikir====================

Oke, pengguna bertanya "Siapa Anda", jadi saya perlu menjawab mengenai identitas saya. Pertama, saya harus menyatakan secara jelas bahwa saya adalah Qwen, sebuah model bahasa besar yang dikembangkan secara mandiri oleh Alibaba Cloud. Selanjutnya, saya dapat menyebutkan fungsi utama saya, seperti menjawab pertanyaan, membuat teks, dan penalaran logis. Saya juga harus menekankan dukungan multibahasa saya, termasuk Bahasa Tiongkok dan Bahasa Inggris, sehingga pengguna tahu bahwa saya mampu menangani permintaan dalam berbagai bahasa. Selain itu, saya mungkin perlu menjelaskan skenario penerapan saya, seperti membantu dalam belajar, pekerjaan, dan kehidupan sehari-hari. Namun, pertanyaan pengguna cukup langsung, jadi kemungkinan besar saya tidak perlu memberikan informasi terlalu rinci. Saya harus menjaga jawaban tetap ringkas dan jelas. Di saat yang sama, saya perlu memastikan nada yang ramah serta mengundang pengguna untuk mengajukan pertanyaan lebih lanjut. Saya akan memeriksa apakah saya melewatkan informasi penting, seperti versi atau pembaruan terbaru saya, tetapi kemungkinan besar pengguna tidak memerlukan detail sebanyak itu. Terakhir, saya akan memastikan bahwa respons ini akurat dan bebas dari kesalahan.
====================Respons Lengkap====================

Saya adalah Qwen, sebuah model bahasa besar yang dikembangkan secara mandiri oleh Tongyi Lab di bawah Alibaba Group. Saya mampu melakukan berbagai tugas, seperti menjawab pertanyaan, membuat teks, penalaran logis, dan pemrograman. Saya mendukung berbagai bahasa, termasuk Bahasa Tiongkok dan Bahasa Inggris. Jika Anda memiliki pertanyaan atau membutuhkan bantuan, jangan ragu untuk memberi tahu saya!

HTTP

Kode contoh

curl

# ======= Penting =======
# Berikut adalah base_url untuk Singapura. Jika Anda menggunakan model di wilayah Beijing, ganti base_url dengan: https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions
# Jika Anda menggunakan model di wilayah Virginia, ganti base_url dengan: https://dashscope-us.aliyuncs.com/compatible-mode/v1/chat/completions
# === Hapus komentar ini sebelum eksekusi ===
curl -X POST https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
    "model": "qwen-plus",
    "messages": [
        {
            "role": "user", 
            "content": "Who are you"
        }
    ],
    "stream": true,
    "stream_options": {
        "include_usage": true
    },
    "enable_thinking": true
}'

Respons

data: {"choices":[{"delta":{"content":null,"role":"assistant","reasoning_content":""},"index":0,"logprobs":null,"finish_reason":null}],"object":"chat.completion.chunk","usage":null,"created":1745485391,"system_fingerprint":null,"model":"qwen-plus","id":"chatcmpl-e2edaf2c-8aaf-9e54-90e2-b21dd5045503"}

.....

data: {"choices":[{"finish_reason":"stop","delta":{"content":"","reasoning_content":null},"index":0,"logprobs":null}],"object":"chat.completion.chunk","usage":null,"created":1745485391,"system_fingerprint":null,"model":"qwen-plus","id":"chatcmpl-e2edaf2c-8aaf-9e54-90e2-b21dd5045503"}

data: {"choices":[],"object":"chat.completion.chunk","usage":{"prompt_tokens":10,"completion_tokens":360,"total_tokens":370},"created":1745485391,"system_fingerprint":null,"model":"qwen-plus","id":"chatcmpl-e2edaf2c-8aaf-9e54-90e2-b21dd5045503"}

data: [DONE]

DashScope

Python

Kode contoh

import os
from dashscope import Generation
import dashscope

# Berikut adalah base_url untuk wilayah Singapura. Jika Anda menggunakan model di wilayah Virginia, ganti base_url dengan https://dashscope-us.aliyuncs.com/api/v1
# Jika Anda menggunakan model di wilayah Beijing, ganti base_url dengan https://dashscope.aliyuncs.com/api/v1
dashscope.base_http_api_url = "https://dashscope-intl.aliyuncs.com/api/v1"

messages = [{"role": "user", "content": "Who are you?"}]

completion = Generation.call(
    # Jika Anda belum mengonfigurasi variabel lingkungan, ganti baris berikut dengan Kunci API Model Studio Anda: api_key = "sk-xxx",
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    model="qwen-plus",
    messages=messages,
    result_format="message",
    enable_thinking=True,
    stream=True,
    incremental_output=True,
)

# Definisikan proses berpikir lengkap.
reasoning_content = ""
# Definisikan respons lengkap.
answer_content = ""
# Tentukan apakah proses berpikir telah selesai dan respons telah dimulai.
is_answering = False

print("=" * 20 + "Proses berpikir" + "=" * 20)

for chunk in completion:
    # Jika proses berpikir dan respons keduanya kosong, abaikan.
    if (
        chunk.output.choices[0].message.content == ""
        and chunk.output.choices[0].message.reasoning_content == ""
    ):
        pass
    else:
        # Jika saat ini sedang dalam proses berpikir.
        if (
            chunk.output.choices[0].message.reasoning_content != ""
            and chunk.output.choices[0].message.content == ""
        ):
            print(chunk.output.choices[0].message.reasoning_content, end="", flush=True)
            reasoning_content += chunk.output.choices[0].message.reasoning_content
        # Jika saat ini sedang dalam tahap respons.
        elif chunk.output.choices[0].message.content != "":
            if not is_answering:
                print("\n" + "=" * 20 + "Respons lengkap" + "=" * 20)
                is_answering = True
            print(chunk.output.choices[0].message.content, end="", flush=True)
            answer_content += chunk.output.choices[0].message.content

# Untuk mencetak proses berpikir lengkap dan respons lengkap, hapus komentar dan jalankan kode berikut.
# print("=" * 20 + "Proses berpikir lengkap" + "=" * 20 + "\n")
# print(f"{reasoning_content}")
# print("=" * 20 + "Respons lengkap" + "=" * 20 + "\n")
# print(f"{answer_content}")

Respons

====================Proses berpikir====================
Oke, pengguna bertanya, "Siapa Anda?" Saya perlu menjawab pertanyaan ini. Pertama, saya harus memperjelas identitas saya: Saya adalah Qwen, sebuah model bahasa skala besar yang dikembangkan oleh Alibaba Cloud. Selanjutnya, saya perlu menjelaskan fungsi dan kegunaan saya, seperti menjawab pertanyaan, membuat teks, dan melakukan penalaran logis. Saya juga harus menekankan bahwa tujuan saya adalah menjadi asisten yang membantu bagi pengguna, dengan memberikan bantuan dan dukungan.

Saat menanggapi, saya harus mempertahankan nada percakapan dan menghindari jargon teknis atau kalimat yang rumit. Saya dapat menambahkan frasa yang ramah, seperti "Halo!~", untuk membuat percakapan lebih alami. Selain itu, saya harus memastikan informasinya akurat dan tidak menghilangkan poin-poin penting, seperti pengembang saya, fungsi utama, dan kasus penggunaan.

Saya juga perlu mempertimbangkan potensi pertanyaan lanjutan dari pengguna, seperti contoh aplikasi spesifik atau detail teknis. Jadi, saya dapat secara halus menyisipkan pancingan dalam tanggapan saya untuk mendorong pertanyaan lebih lanjut. Misalnya, menyebutkan "Baik itu pertanyaan tentang kehidupan sehari-hari atau topik profesional, saya akan berusaha sebaik mungkin untuk membantu" bersifat komprehensif dan terbuka.

Terakhir, saya akan memeriksa apakah tanggapan tersebut lancar dan bebas dari informasi yang berulang atau berlebihan, serta memastikannya ringkas dan jelas. Saya juga akan menjaga keseimbangan antara bersikap ramah dan profesional, sehingga pengguna merasa saya mudah didekati dan dapat diandalkan.
====================Tanggapan lengkap====================
Halo!~ Saya Qwen, sebuah model bahasa skala besar yang dikembangkan oleh Alibaba Cloud. Saya dapat menjawab pertanyaan, membuat teks, melakukan penalaran logis, menulis kode, dan banyak lagi, dengan tujuan memberikan bantuan dan dukungan kepada pengguna. Baik Anda memiliki pertanyaan tentang kehidupan sehari-hari maupun topik profesional, saya akan berusaha sebaik mungkin untuk membantu. Ada yang bisa saya bantu?

Java

Kode contoh

// Versi SDK DashScope >= 2.19.4
import java.util.Arrays;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import com.alibaba.dashscope.aigc.generation.Generation;
import com.alibaba.dashscope.aigc.generation.GenerationParam;
import com.alibaba.dashscope.aigc.generation.GenerationResult;
import com.alibaba.dashscope.common.Message;
import com.alibaba.dashscope.common.Role;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.InputRequiredException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import io.reactivex.Flowable;
import java.lang.System;
import com.alibaba.dashscope.utils.Constants;

public class Main {
    static {
        // Berikut adalah base_url untuk wilayah Singapura. Jika Anda menggunakan model di wilayah Virginia, ganti base_url dengan https://dashscope-us.aliyuncs.com/api/v1
        // Jika Anda menggunakan model di wilayah Beijing, ganti base_url dengan https://dashscope.aliyuncs.com/api/v1
        Constants.baseHttpApiUrl="https://dashscope-intl.aliyuncs.com/api/v1";
    }
    private static final Logger logger = LoggerFactory.getLogger(Main.class);
    private static StringBuilder reasoningContent = new StringBuilder();
    private static StringBuilder finalContent = new StringBuilder();
    private static boolean isFirstPrint = true;

    private static void handleGenerationResult(GenerationResult message) {
        String reasoning = message.getOutput().getChoices().get(0).getMessage().getReasoningContent();
        String content = message.getOutput().getChoices().get(0).getMessage().getContent();

        if (!reasoning.isEmpty()) {
            reasoningContent.append(reasoning);
            if (isFirstPrint) {
                System.out.println("====================Proses berpikir====================");
                isFirstPrint = false;
            }
            System.out.print(reasoning);
        }

        if (!content.isEmpty()) {
            finalContent.append(content);
            if (!isFirstPrint) {
                System.out.println("\n====================Respons lengkap====================");
                isFirstPrint = true;
            }
            System.out.print(content);
        }
    }
    private static GenerationParam buildGenerationParam(Message userMsg) {
        return GenerationParam.builder()
                // Jika Anda belum mengonfigurasi variabel lingkungan, ganti baris berikut dengan Kunci API Model Studio Anda: .apiKey("sk-xxx")
                .apiKey(System.getenv("DASHSCOPE_API_KEY"))
                .model("qwen-plus")
                .enableThinking(true)
                .incrementalOutput(true)
                .resultFormat("message")
                .messages(Arrays.asList(userMsg))
                .build();
    }
    public static void streamCallWithMessage(Generation gen, Message userMsg)
            throws NoApiKeyException, ApiException, InputRequiredException {
        GenerationParam param = buildGenerationParam(userMsg);
        Flowable<GenerationResult> result = gen.streamCall(param);
        result.blockingForEach(message -> handleGenerationResult(message));
    }

    public static void main(String[] args) {
        try {
            Generation gen = new Generation();
            Message userMsg = Message.builder().role(Role.USER.getValue()).content("Who are you?").build();
            streamCallWithMessage(gen, userMsg);
//             Cetak hasil akhir.
//            if (reasoningContent.length() > 0) {
//                System.out.println("\n====================Respons lengkap====================");
//                System.out.println(finalContent.toString());
//            }
        } catch (ApiException | NoApiKeyException | InputRequiredException e) {
            logger.error("An exception occurred: {}", e.getMessage());
        }
        System.exit(0);
    }
}

Nilai pengembalian

====================Proses Berpikir====================
Oke, pengguna bertanya "Siapa Anda?", dan saya perlu menjawab berdasarkan pengaturan awal saya. Pertama, peran saya adalah Qwen, model bahasa tingkat tinggi dari Alibaba Group. Saya harus mempertahankan nada yang santai, sederhana, dan mudah dipahami.

Pengguna mungkin baru mengenal saya atau ingin memastikan identitas saya. Saya harus langsung menyatakan siapa saya, lalu menjelaskan secara singkat fungsi dan kegunaan saya, seperti menjawab pertanyaan, membuat teks, serta menulis kode. Saya juga harus menyebutkan dukungan multibahasa agar pengguna tahu bahwa saya dapat menangani permintaan dalam berbagai bahasa.

Selain itu, sesuai pedoman, saya harus mempertahankan persona yang mirip manusia, sehingga nadanya harus ramah. Saya bisa menggunakan emoji untuk menambah kehangatan. Di saat yang sama, saya mungkin perlu mengarahkan pengguna untuk mengajukan lebih banyak pertanyaan atau memanfaatkan fitur-fitur saya, misalnya dengan menanyakan bantuan apa yang mereka butuhkan.

Saya harus berhati-hati agar tidak menggunakan istilah teknis yang rumit dan menghindari penjelasan yang terlalu panjang. Saya akan memeriksa apakah ada poin penting yang terlewat, seperti dukungan multibahasa dan kemampuan spesifik. Saya harus memastikan tanggapan memenuhi semua persyaratan, termasuk bersifat santai dan ringkas.
====================Tanggapan Lengkap====================
Halo! Saya Qwen, model bahasa tingkat tinggi dari Alibaba Group. Saya dapat menjawab pertanyaan dan membuat teks, seperti cerita, dokumen resmi, email, dan panduan kerja. Saya juga dapat melakukan penalaran logis, menulis kode, menyampaikan opini, dan bermain game. Saya mahir dalam berbagai bahasa, antara lain Cina, Inggris, Jerman, Prancis, dan Spanyol. Ada hal apa yang bisa saya bantu?

HTTP

Kode contoh

curl

# ======= Penting =======
# Berikut adalah URL untuk wilayah Singapura. Jika Anda menggunakan model di wilayah Beijing, ganti URL dengan: https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation
# Jika Anda menggunakan model di wilayah Virginia, ganti base_url dengan: https://dashscope-us.aliyuncs.com/api/v1/services/aigc/text-generation/generation
# === Hapus komentar ini sebelum eksekusi ===
curl -X POST "https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/text-generation/generation" \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-H "X-DashScope-SSE: enable" \
-d '{
    "model": "qwen-plus",
    "input":{
        "messages":[      
            {
                "role": "user",
                "content": "Who are you?"
            }
        ]
    },
    "parameters":{
        "enable_thinking": true,
        "incremental_output": true,
        "result_format": "message"
    }
}'

Respons

id:1
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"","reasoning_content":"Hmm","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":14,"input_tokens":11,"output_tokens":3},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

id:2
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"","reasoning_content":",","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":15,"input_tokens":11,"output_tokens":4},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

id:3
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"","reasoning_content":"the user","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":16,"input_tokens":11,"output_tokens":5},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

id:4
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"","reasoning_content":" asks","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":17,"input_tokens":11,"output_tokens":6},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

id:5
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"","reasoning_content":" '","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":18,"input_tokens":11,"output_tokens":7},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}
......

id:358
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"help","reasoning_content":"","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":373,"input_tokens":11,"output_tokens":362},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

id:359
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":",","reasoning_content":"","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":374,"input_tokens":11,"output_tokens":363},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

id:360
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":" feel free","reasoning_content":"","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":375,"input_tokens":11,"output_tokens":364},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

id:361
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":" to","reasoning_content":"","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":376,"input_tokens":11,"output_tokens":365},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

id:362
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":" let me know","reasoning_content":"","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":377,"input_tokens":11,"output_tokens":366},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

id:363
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"!","reasoning_content":"","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":378,"input_tokens":11,"output_tokens":367},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

id:364
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"","reasoning_content":"","role":"assistant"},"finish_reason":"stop"}]},"usage":{"total_tokens":378,"input_tokens":11,"output_tokens":367},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

Kemampuan inti

Beralih antara mode berpikir dan non-berpikir

Mengaktifkan mode berpikir umumnya meningkatkan kualitas respons, tetapi menambah latensi dan biaya. Saat menggunakan model yang mendukung mode hybrid-thinking, Anda dapat beralih secara dinamis antara mode berpikir dan non-berpikir berdasarkan kompleksitas pertanyaan tanpa perlu mengganti model:

Untuk tugas yang tidak memerlukan penalaran kompleks—seperti obrolan sehari-hari atau pasangan tanya jawab sederhana—aturlah enable_thinking ke false untuk menonaktifkan mode berpikir.
Untuk tugas yang memerlukan penalaran kompleks—seperti penalaran logis, pembuatan kode, atau penyelesaian soal matematika—aturlah enable_thinking ke true untuk mengaktifkan mode berpikir.

Kompatibel dengan OpenAI

Penting

Parameter enable_thinking bukan parameter standar OpenAI. Jika menggunakan SDK Python OpenAI, sertakan parameter ini melalui extra_body. Pada SDK Node.js, sertakan sebagai parameter tingkat atas.

Python

Kode contoh

from openai import OpenAI
import os

# Inisialisasi client OpenAI
client = OpenAI(
    # Jika Anda belum mengonfigurasi variabel lingkungan, ganti berikut dengan Kunci API Model Studio Anda: api_key="sk-xxx"
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    # Berikut adalah base_url untuk wilayah Singapura. Jika Anda menggunakan model di wilayah Virginia, ganti base_url dengan https://dashscope-us.aliyuncs.com/compatible-mode/v1 # Jika Anda menggunakan model di wilayah Beijing, ganti base_url dengan https://dashscope.aliyuncs.com/compatible-mode/v1
    # Jika Anda menggunakan model di wilayah Beijing, ganti base_url dengan https://dashscope.aliyuncs.com/compatible-mode/v1
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

messages = [{"role": "user", "content": "Who are you"}]
completion = client.chat.completions.create(
    model="qwen-plus",
    messages=messages,
    # Atur enable_thinking melalui extra_body untuk mengaktifkan proses berpikir
    extra_body={"enable_thinking": True},
    stream=True,
    stream_options={
        "include_usage": True
    },
)

reasoning_content = ""  # Proses berpikir lengkap
answer_content = ""  # Respons lengkap
is_answering = False  # Menunjukkan apakah fase respons telah dimulai
print("\n" + "=" * 20 + "Proses berpikir" + "=" * 20 + "\n")

for chunk in completion:
    if not chunk.choices:
        print("\n" + "=" * 20 + "Konsumsi token" + "=" * 20 + "\n")
        print(chunk.usage)
        continue

    delta = chunk.choices[0].delta

    # Kumpulkan hanya konten berpikir
    if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None:
        if not is_answering:
            print(delta.reasoning_content, end="", flush=True)
        reasoning_content += delta.reasoning_content

    # Saat konten diterima, mulai merespons
    if hasattr(delta, "content") and delta.content:
        if not is_answering:
            print("\n" + "=" * 20 + "Respons lengkap" + "=" * 20 + "\n")
            is_answering = True
        print(delta.content, end="", flush=True)
        answer_content += delta.content

Respons

====================Proses berpikir====================

Okay, the user is asking 'Who are you'. I need to figure out what they want to know. They might be interacting with me for the first time or want to confirm my identity. I should start by introducing myself as Qwen, developed by Tongyi Lab. Then, I should explain my capabilities, such as answering questions, creating text, and programming, so the user understands how I can help. I should also mention that I support multiple languages, so international users know they can communicate in different languages. Finally, I should be friendly and invite them to ask more questions to encourage further interaction. I need to be concise and clear, avoiding too much technical jargon to make it easy for the user to understand. The user probably wants a quick overview of my abilities, so I'll focus on my functions and uses. I should also check if I've missed any information, like mentioning Alibaba Group or more technical details. However, the user probably just needs basic information, not an in-depth explanation. I'll make sure my response is friendly and professional, and encourages the user to keep asking questions.
====================Respons lengkap====================

I am Qwen, a large-scale language model developed by Tongyi Lab. I can help you answer questions, create text, write code, and express ideas. I support conversations in multiple languages. How can I help you?
====================Konsumsi token====================

CompletionUsage(completion_tokens=221, prompt_tokens=10, total_tokens=231, completion_tokens_details=CompletionTokensDetails(accepted_prediction_tokens=None, audio_tokens=None, reasoning_tokens=172, rejected_prediction_tokens=None), prompt_tokens_details=PromptTokensDetails(audio_tokens=None, cached_tokens=0))

Node.js

Kode contoh

import OpenAI from "openai";
import process from 'process';

// Inisialisasi klien OpenAI
const openai = new OpenAI({
    // Jika Anda belum mengonfigurasi variabel lingkungan, ganti yang berikut ini dengan kunci API Model Studio Anda: apiKey: "sk-xxx"
    apiKey: process.env.DASHSCOPE_API_KEY, 
    // Berikut ini adalah baseURL untuk wilayah Singapura. Jika Anda menggunakan model di wilayah Virginia, ganti baseURL dengan https://dashscope-us.aliyuncs.com/compatible-mode/v1 
    // Jika Anda menggunakan model di wilayah Beijing, ganti baseURL dengan https://dashscope.aliyuncs.com/compatible-mode/v1
    baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1'
});

let reasoningContent = ''; // Proses berpikir penuh
let answerContent = ''; // Tanggapan penuh
let isAnswering = false; // Menunjukkan apakah fase tanggapan telah dimulai

async function main() {
    try {
        const messages = [{ role: 'user', content: 'Who are you' }];
        
        const stream = await openai.chat.completions.create({
            model: 'qwen-plus',
            messages,
            // Di SDK Node.js, parameter non-standar seperti enable_thinking diteruskan sebagai properti tingkat atas dan tidak perlu ditempatkan di extra_body.
            enable_thinking: true,
            stream: true,
            stream_options: {
                include_usage: true
            },
        });

        console.log('\n' + '='.repeat(20) + 'Proses berpikir' + '='.repeat(20) + '\n');

        for await (const chunk of stream) {
            if (!chunk.choices?.length) {
                console.log('\n' + '='.repeat(20) + 'Konsumsi token' + '='.repeat(20) + '\n');
                console.log(chunk.usage);
                continue;
            }

            const delta = chunk.choices[0].delta;
            
            // Kumpulkan hanya konten pemikiran
            if (delta.reasoning_content !== undefined && delta.reasoning_content !== null) {
                if (!isAnswering) {
                    process.stdout.write(delta.reasoning_content);
                }
                reasoningContent += delta.reasoning_content;
            }

            // Saat konten diterima, mulai berikan tanggapan
            if (delta.content !== undefined && delta.content) {
                if (!isAnswering) {
                    console.log('\n' + '='.repeat(20) + 'Tanggapan penuh' + '='.repeat(20) + '\n');
                    isAnswering = true;
                }
                process.stdout.write(delta.content);
                answerContent += delta.content;
            }
        }
    } catch (error) {
        console.error('Error:', error);
    }
}

main();

Respons

====================Proses Berpikir====================

Oke, pengguna bertanya 'Siapa Anda'. Saya perlu memahami apa yang ingin mereka ketahui. Mereka mungkin berinteraksi dengan saya untuk pertama kalinya atau ingin memastikan identitas saya. Saya harus mulai dengan memperkenalkan nama dan identitas saya, yaitu Qwen, dengan nama dalam bahasa Inggris Qwen. Selanjutnya, saya harus menyatakan bahwa saya adalah model bahasa Tingkat Tinggi yang dikembangkan secara mandiri oleh Tongyi Lab di bawah Alibaba Group. Kemudian, saya harus menyebutkan kemampuan saya, seperti menjawab pertanyaan, membuat teks, pemrograman, dan menyampaikan pendapat, sehingga pengguna memahami tujuan saya. Saya juga harus menyebutkan bahwa saya mendukung beberapa bahasa, yang akan berguna bagi pengguna internasional. Terakhir, saya harus mengajak mereka untuk mengajukan pertanyaan dan mempertahankan sikap ramah serta terbuka. Saya perlu menggunakan bahasa yang sederhana dan mudah dipahami, dengan menghindari jargon teknis yang berlebihan. Pengguna mungkin membutuhkan bantuan atau hanya ingin tahu, sehingga tanggapan saya harus bersifat ramah dan mendorong interaksi lebih lanjut. Selain itu, saya mungkin perlu mempertimbangkan apakah pengguna memiliki kebutuhan yang lebih mendalam, seperti menguji kemampuan saya atau mencari bantuan spesifik, tetapi tanggapan awal harus fokus pada informasi dasar dan panduan. Saya akan menjaga nada percakapan dan menghindari kalimat yang rumit agar informasi menjadi lebih efektif.
====================Tanggapan Lengkap====================

Halo! Saya Qwen, model bahasa Tingkat Tinggi yang dikembangkan secara mandiri oleh Tongyi Lab di bawah Alibaba Group. Saya dapat membantu Anda menjawab pertanyaan, membuat teks (seperti cerita, dokumen resmi, email, dan naskah), melakukan penalaran logis, menulis kode, serta bahkan menyampaikan pendapat dan bermain game. Saya mendukung beberapa bahasa, termasuk namun tidak terbatas pada bahasa Tiongkok, Inggris, Jerman, Prancis, dan Spanyol.

Jika Anda memiliki pertanyaan atau memerlukan bantuan, jangan ragu untuk bertanya kapan saja!
====================Penggunaan token====================

{
  prompt_tokens: 10,
  completion_tokens: 288,
  total_tokens: 298,
  completion_tokens_details: { reasoning_tokens: 188 },
  prompt_tokens_details: { cached_tokens: 0 }
}

HTTP

Kode contoh

curl

# ======= Penting =======
# Berikut adalah base_url untuk Singapura. Jika Anda menggunakan model di wilayah Beijing, ganti base_url dengan: https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions
# Jika Anda menggunakan model di wilayah Virginia, ganti base_url dengan: https://dashscope-us.aliyuncs.com/compatible-mode/v1/chat/completions
# === Hapus komentar ini sebelum eksekusi ===
curl -X POST https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
    "model": "qwen-plus",
    "messages": [
        {
            "role": "user", 
            "content": "Who are you"
        }
    ],
    "stream": true,
    "stream_options": {
        "include_usage": true
    },
    "enable_thinking": true
}'

DashScope

Python

Kode contoh

import os
from dashscope import Generation
import dashscope
# Berikut adalah base_url untuk wilayah Singapura. Jika Anda menggunakan model di wilayah Virginia, ganti base_url dengan https://dashscope-us.aliyuncs.com/api/v1
# Jika Anda menggunakan model di wilayah Beijing, ganti base_url dengan https://dashscope.aliyuncs.com/api/v1
dashscope.base_http_api_url = "https://dashscope-intl.aliyuncs.com/api/v1/"

# Inisialisasi parameter permintaan
messages = [{"role": "user", "content": "Who are you?"}]

completion = Generation.call(
    # Jika Anda belum mengonfigurasi variabel lingkungan, ganti berikut dengan Kunci API Model Studio Anda: api_key="sk-xxx"
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    model="qwen-plus",
    messages=messages,
    result_format="message",  # Atur format hasil ke message
    enable_thinking=True,     # Aktifkan proses berpikir
    stream=True,              # Aktifkan keluaran streaming
    incremental_output=True,  # Aktifkan keluaran inkremental
)

reasoning_content = ""  # Proses berpikir lengkap
answer_content = ""     # Respons lengkap
is_answering = False    # Menunjukkan apakah fase respons telah dimulai

print("\n" + "=" * 20 + "Proses berpikir" + "=" * 20 + "\n")

for chunk in completion:
    message = chunk.output.choices[0].message
    
    # Kumpulkan hanya konten berpikir
    if message.reasoning_content:
        if not is_answering:
            print(message.reasoning_content, end="", flush=True)
        reasoning_content += message.reasoning_content

    # Saat konten diterima, mulai merespons
    if message.content:
        if not is_answering:
            print("\n" + "=" * 20 + "Respons lengkap" + "=" * 20 + "\n")
            is_answering = True
        print(message.content, end="", flush=True)
        answer_content += message.content

print("\n" + "=" * 20 + "Konsumsi token" + "=" * 20 + "\n")
print(chunk.usage)
# Setelah loop selesai, variabel reasoning_content dan answer_content berisi konten lengkap.
# Anda dapat melakukan pemrosesan lanjutan di sini sesuai kebutuhan.
# print(f"\n\nProses berpikir lengkap:\n{reasoning_content}")
# print(f"\nRespons lengkap:\n{answer_content}")

Respons

====================Proses Berpikir====================

Oke, pengguna bertanya 'Siapa Anda?'. Saya perlu memahami apa yang ingin mereka ketahui. Mereka mungkin berinteraksi dengan saya untuk pertama kalinya atau ingin memastikan identitas saya. Pertama-tama, saya harus memperkenalkan diri sebagai Qwen dan menyatakan bahwa saya adalah model bahasa tingkat tinggi yang dikembangkan secara mandiri oleh Tongyi Lab di bawah Alibaba Group. Selanjutnya, saya mungkin perlu menjelaskan kemampuan saya, seperti menjawab pertanyaan, membuat teks, serta pemrograman, sehingga pengguna memahami tujuan saya. Saya juga harus menyebutkan bahwa saya mendukung banyak bahasa, sehingga pengguna internasional mengetahui bahwa mereka dapat berkomunikasi dalam berbagai bahasa. Terakhir, saya harus bersikap ramah dan mengundang mereka untuk mengajukan pertanyaan guna mendorong interaksi lebih lanjut. Saya perlu menggunakan bahasa yang sederhana dan mudah dipahami, serta menghindari jargon teknis yang berlebihan. Pengguna mungkin memiliki kebutuhan yang lebih mendalam, seperti menguji kemampuan saya atau mencari bantuan, sehingga memberikan contoh spesifik—seperti menulis cerita, dokumen resmi, atau email—akan lebih baik. Saya juga harus memastikan tanggapan ini tersusun dengan baik; mungkin dengan mencantumkan fungsi-fungsi saya, tetapi transisi alami akan lebih baik daripada menggunakan poin-poin bernomor. Selain itu, saya harus menekankan bahwa saya adalah asisten AI tanpa kesadaran pribadi dan semua jawaban saya didasarkan pada data pelatihan untuk menghindari kesalahpahaman. Saya mungkin perlu memeriksa apakah ada informasi penting yang terlewat, seperti kemampuan multimodal atau pembaruan terbaru, tetapi berdasarkan tanggapan sebelumnya, kemungkinan besar saya tidak perlu membahas hal tersebut secara mendalam. Singkatnya, tanggapan ini harus komprehensif namun ringkas, ramah, serta membantu, sehingga pengguna merasa dipahami dan didukung.
====================Tanggapan Lengkap====================

Saya adalah Qwen, model bahasa tingkat tinggi yang dikembangkan secara mandiri oleh Tongyi Lab di bawah Alibaba Group. Saya dapat membantu Anda dengan:

1. **Menjawab pertanyaan**: Baik itu pertanyaan akademis, pengetahuan umum, maupun masalah khusus domain, saya akan berusaha memberikan jawaban.
2. **Membuat teks**: Saya dapat membantu Anda menulis cerita, dokumen resmi, email, panduan kerja, dan lainnya.
3. **Penalaran logis**: Saya dapat membantu Anda dalam penalaran logis dan pemecahan masalah.
4. **Pemrograman**: Saya dapat memahami dan menghasilkan kode dalam berbagai bahasa pemrograman.
5. **Dukungan multibahasa**: Saya mendukung banyak bahasa, termasuk namun tidak terbatas pada bahasa Tiongkok, Inggris, Jerman, Prancis, dan Spanyol.

Jika Anda memiliki pertanyaan atau membutuhkan bantuan, jangan ragu untuk bertanya kepada saya kapan saja!
====================Penggunaan token====================

{"input_tokens": 11, "output_tokens": 405, "total_tokens": 416, "output_tokens_details": {"reasoning_tokens": 256}, "prompt_tokens_details": {"cached_tokens": 0}}

Java

Kode contoh

// Versi SDK DashScope >= 2.19.4
import com.alibaba.dashscope.aigc.generation.Generation;
import com.alibaba.dashscope.aigc.generation.GenerationParam;
import com.alibaba.dashscope.aigc.generation.GenerationResult;
import com.alibaba.dashscope.common.Message;
import com.alibaba.dashscope.common.Role;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.InputRequiredException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import com.alibaba.dashscope.utils.Constants;
import io.reactivex.Flowable;
import java.lang.System;
import java.util.Arrays;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

public class Main {
    private static final Logger logger = LoggerFactory.getLogger(Main.class);
    private static StringBuilder reasoningContent = new StringBuilder();
    private static StringBuilder finalContent = new StringBuilder();
    private static boolean isFirstPrint = true;

    private static void handleGenerationResult(GenerationResult message) {
        String reasoning = message.getOutput().getChoices().get(0).getMessage().getReasoningContent();
        String content = message.getOutput().getChoices().get(0).getMessage().getContent();

        if (!reasoning.isEmpty()) {
            reasoningContent.append(reasoning);
            if (isFirstPrint) {
                System.out.println("====================Proses berpikir====================");
                isFirstPrint = false;
            }
            System.out.print(reasoning);
        }

        if (!content.isEmpty()) {
            finalContent.append(content);
            if (!isFirstPrint) {
                System.out.println("\n====================Respons lengkap====================");
                isFirstPrint = true;
            }
            System.out.print(content);
        }
    }
    private static GenerationParam buildGenerationParam(Message userMsg) {
        return GenerationParam.builder()
                // Jika Anda belum mengonfigurasi variabel lingkungan, ganti baris berikut dengan Kunci API Model Studio Anda: .apiKey("sk-xxx")
                .apiKey(System.getenv("DASHSCOPE_API_KEY"))
                .model("qwen-plus")
                .enableThinking(true)
                .incrementalOutput(true)
                .resultFormat("message")
                .messages(Arrays.asList(userMsg))
                .build();
    }
    public static void streamCallWithMessage(Generation gen, Message userMsg)
            throws NoApiKeyException, ApiException, InputRequiredException {
        GenerationParam param = buildGenerationParam(userMsg);
        Flowable<GenerationResult> result = gen.streamCall(param);
        result.blockingForEach(message -> handleGenerationResult(message));
    }

    public static void main(String[] args) {
        try {
            // Berikut adalah base_url untuk wilayah Singapura. Jika Anda menggunakan model di wilayah Virginia, ganti base_url dengan https://dashscope-us.aliyuncs.com/api/v1
            // Jika Anda menggunakan model di wilayah Beijing, ganti base_url dengan https://dashscope.aliyuncs.com/api/v1
            Generation gen = new Generation("http", "https://dashscope-intl.aliyuncs.com/api/v1");
            Message userMsg = Message.builder().role(Role.USER.getValue()).content("Who are you?").build();
            streamCallWithMessage(gen, userMsg);
//             Cetak hasil akhir.
//            if (reasoningContent.length() > 0) {
//                System.out.println("\n====================Respons lengkap====================");
//                System.out.println(finalContent.toString());
//            }
        } catch (ApiException | NoApiKeyException | InputRequiredException e) {
            logger.error("An exception occurred: {}", e.getMessage());
        }
        System.exit(0);
    }
}

Nilai pengembalian

====================Proses berpikir====================
Baik, pengguna bertanya 'Siapa Anda?'. Saya perlu mencari tahu apa yang ingin mereka ketahui. Mereka mungkin ingin mengetahui identitas saya atau sedang menguji tanggapan saya. Pertama, saya harus menyatakan dengan jelas bahwa saya adalah Qwen, sebuah model bahasa tingkat tinggi dari Alibaba Group. Kemudian, saya mungkin perlu memperkenalkan secara singkat kemampuan saya, seperti menjawab pertanyaan, membuat teks, dan pemrograman, agar pengguna memahami tujuan saya. Saya juga harus menyebutkan bahwa saya mendukung beberapa bahasa, sehingga pengguna internasional tahu bahwa mereka dapat berkomunikasi dalam berbagai bahasa. Terakhir, saya harus bersikap ramah dan mengundang mereka untuk mengajukan pertanyaan, yang akan membuat mereka merasa diterima dan bersedia untuk melanjutkan interaksi. Saya perlu memastikan jawabannya tidak terlalu panjang tetapi komprehensif. Pengguna mungkin memiliki pertanyaan lanjutan, seperti detail teknis atau kasus penggunaan saya, tetapi tanggapan awal harus ringkas dan jelas. Saya akan memastikan saya tidak menggunakan jargon teknis agar semua pengguna dapat mengerti. Saya akan memeriksa apakah saya telah melewatkan informasi penting, seperti dukungan multibahasa dan contoh spesifik dari fungsi saya. Baik, ini seharusnya sudah mencakup kebutuhan pengguna.
====================Tanggapan lengkap====================
Saya adalah Qwen, sebuah model bahasa tingkat tinggi dari Alibaba Group. Saya dapat menjawab pertanyaan, membuat teks (seperti cerita, dokumen resmi, email, dan playbook), melakukan penalaran logis, menulis kode, menyatakan opini, bermain game, dan banyak lagi. Saya mendukung percakapan dalam beberapa bahasa, termasuk namun tidak terbatas pada Bahasa Mandarin, Inggris, Jerman, Prancis, dan Spanyol. Jika Anda memiliki pertanyaan atau memerlukan bantuan, jangan ragu untuk bertanya kepada saya kapan saja!

HTTP

Kode contoh

curl

# ======= Penting =======
# Berikut adalah URL untuk wilayah Singapura. Jika Anda menggunakan model di wilayah Beijing, ganti URL dengan: https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation
# Jika Anda menggunakan model di wilayah Virginia, ganti base_url dengan: https://dashscope-us.aliyuncs.com/api/v1/services/aigc/text-generation/generation
# === Hapus komentar ini sebelum eksekusi ===
curl -X POST "https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/text-generation/generation" \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-H "X-DashScope-SSE: enable" \
-d '{
    "model": "qwen-plus",
    "input":{
        "messages":[      
            {
                "role": "user",
                "content": "Who are you?"
            }
        ]
    },
    "parameters":{
        "enable_thinking": true,
        "incremental_output": true,
        "result_format": "message"
    }
}'

Respons

id:1
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"","reasoning_content":"Hmm","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":14,"input_tokens":11,"output_tokens":3},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

id:2
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"","reasoning_content":",","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":15,"input_tokens":11,"output_tokens":4},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

id:3
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"","reasoning_content":"the user","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":16,"input_tokens":11,"output_tokens":5},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

id:4
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"","reasoning_content":" asks","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":17,"input_tokens":11,"output_tokens":6},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

id:5
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"","reasoning_content":" '","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":18,"input_tokens":11,"output_tokens":7},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}
......

id:358
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"help","reasoning_content":"","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":373,"input_tokens":11,"output_tokens":362},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

id:359
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":",","reasoning_content":"","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":374,"input_tokens":11,"output_tokens":363},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

id:360
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":" feel free","reasoning_content":"","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":375,"input_tokens":11,"output_tokens":364},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

id:361
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":" to","reasoning_content":"","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":376,"input_tokens":11,"output_tokens":365},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

id:362
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":" let me know","reasoning_content":"","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":377,"input_tokens":11,"output_tokens":366},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

id:363
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"!","reasoning_content":"","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":378,"input_tokens":11,"output_tokens":367},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

id:364
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"","reasoning_content":"","role":"assistant"},"finish_reason":"stop"}]},"usage":{"total_tokens":378,"input_tokens":11,"output_tokens":367},"request_id":"25d58c29-c47b-9e8d-a0f1-d6c309ec58b1"}

Selain itu, model edisi open-source Qwen3, qwen-plus-2025-04-28, dan qwen-turbo-2025-04-28 menyediakan metode untuk mengontrol mode berpikir secara dinamis melalui prompt. Saat enable_thinking bernilai true, tambahkan /no_think ke prompt untuk menonaktifkan mode berpikir. Untuk mengaktifkan kembali mode berpikir dalam percakapan multi-putaran, tambahkan /think ke prompt input terbaru. Model akan mengikuti instruksi /think atau /no_think yang paling baru.

Batasi panjang proses berpikir

Model pemikiran mendalam terkadang menghasilkan proses penalaran yang panjang, sehingga meningkatkan waktu tunggu dan mengonsumsi lebih banyak token. Gunakan parameter thinking_budget untuk membatasi jumlah maksimum token dalam proses penalaran. Jika batas tersebut terlampaui, model akan segera menghasilkan respons.

thinking_budget menentukan panjang maksimum rantai-pikiran model. Untuk informasi selengkapnya, lihat Daftar model.

Penting

Parameter thinking_budget didukung oleh model Qwen3 (dalam mode berpikir) dan Kimi.

Kompatibel dengan OpenAI

Python

Kode contoh

from openai import OpenAI
import os

# Inisialisasi client OpenAI
client = OpenAI(
    # Jika Anda belum mengonfigurasi variabel lingkungan, ganti berikut dengan Kunci API Model Studio Anda: api_key="sk-xxx"
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    # Berikut adalah base_url untuk wilayah Singapura. Jika Anda menggunakan model di wilayah Virginia, ganti base_url dengan https://dashscope-us.aliyuncs.com/compatible-mode/v1 # Jika Anda menggunakan model di wilayah Beijing, ganti base_url dengan https://dashscope.aliyuncs.com/compatible-mode/v1
    # Jika Anda menggunakan model di wilayah Beijing, ganti base_url dengan https://dashscope.aliyuncs.com/compatible-mode/v1
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

messages = [{"role": "user", "content": "Who are you"}]

completion = client.chat.completions.create(
    model="qwen-plus",
    messages=messages,
    # Parameter enable_thinking mengaktifkan proses berpikir, dan parameter thinking_budget menetapkan jumlah maksimum token untuk proses penalaran.
    extra_body={
        "enable_thinking": True,
        "thinking_budget": 50
        },
    stream=True,
    stream_options={
        "include_usage": True
    },
)

reasoning_content = ""  # Proses berpikir lengkap
answer_content = ""  # Respons lengkap
is_answering = False  # Menunjukkan apakah fase respons telah dimulai
print("\n" + "=" * 20 + "Proses berpikir" + "=" * 20 + "\n")

for chunk in completion:
    if not chunk.choices:
        print("\nUsage:")
        print(chunk.usage)
        continue

    delta = chunk.choices[0].delta

    # Kumpulkan hanya konten berpikir
    if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None:
        if not is_answering:
            print(delta.reasoning_content, end="", flush=True)
        reasoning_content += delta.reasoning_content

    # Saat konten diterima, mulai merespons
    if hasattr(delta, "content") and delta.content:
        if not is_answering:
            print("\n" + "=" * 20 + "Respons lengkap" + "=" * 20 + "\n")
            is_answering = True
        print(delta.content, end="", flush=True)
        answer_content += delta.content

Respons

====================Proses berpikir====================

Okay, the user asked "Who are you", so I need to give a clear and friendly response. First, I should state my identity, which is Qwen, developed by the Tongyi Lab under Alibaba Group. Next, I should explain my main functions, such as answering
====================Respons lengkap====================

I am Qwen, a large-scale language model developed by the Tongyi Lab at Alibaba Group. I can answer questions, create text, perform logical reasoning, and write code, with the goal of providing help and convenience to users. How can I help you?

Node.js

Kode contoh

import OpenAI from "openai";
import process from 'process';

// Inisialisasi client OpenAI
const openai = new OpenAI({
    apiKey: process.env.DASHSCOPE_API_KEY, // Baca dari variabel lingkungan
    // Berikut adalah base_url untuk wilayah Singapura. Jika Anda menggunakan model di wilayah Virginia, ganti base_url dengan https://dashscope-us.aliyuncs.com/compatible-mode/v1 
    // Jika Anda menggunakan model di wilayah Beijing, ganti base_url dengan https://dashscope.aliyuncs.com/compatible-mode/v1
    baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1'
});

let reasoningContent = '';
let answerContent = '';
let isAnswering = false;


async function main() {
    try {
        const messages = [{ role: 'user', content: 'Who are you' }];
        const stream = await openai.chat.completions.create({
            model: 'qwen-plus',
            messages,
            stream: true,
            // Parameter enable_thinking mengaktifkan proses berpikir, dan parameter thinking_budget menetapkan jumlah maksimum token untuk proses penalaran.
            enable_thinking: true,
            thinking_budget: 50
        });
        console.log('\n' + '='.repeat(20) + 'Proses berpikir' + '='.repeat(20) + '\n');

        for await (const chunk of stream) {
            if (!chunk.choices?.length) {
                console.log('\nUsage:');
                console.log(chunk.usage);
                continue;
            }

            const delta = chunk.choices[0].delta;
            
            // Kumpulkan hanya konten berpikir
            if (delta.reasoning_content !== undefined && delta.reasoning_content !== null) {
                if (!isAnswering) {
                    process.stdout.write(delta.reasoning_content);
                }
                reasoningContent += delta.reasoning_content;
            }

            // Saat konten diterima, mulai merespons
            if (delta.content !== undefined && delta.content) {
                if (!isAnswering) {
                    console.log('\n' + '='.repeat(20) + 'Respons lengkap' + '='.repeat(20) + '\n');
                    isAnswering = true;
                }
                process.stdout.write(delta.content);
                answerContent += delta.content;
            }
        }
    } catch (error) {
        console.error('Error:', error);
    }
}

main();

Respons

====================Proses berpikir====================

Okay, the user asked "Who are you", so I need to give a clear and accurate response. First, I should introduce my identity, which is Qwen, developed by the Tongyi Lab under Alibaba Group. Next, I should explain my main functions, such as answering questions
====================Respons lengkap====================

I am Qwen, an ultra-large language model independently developed by the Tongyi Lab under Alibaba Group. I can perform various tasks such as answering questions, creating text, logical reasoning, and coding. If you have any questions or need help, feel free to let me know!

HTTP

Kode contoh

curl

# ======= Penting =======
# Berikut adalah base_url untuk Singapura. Jika Anda menggunakan model di wilayah Beijing, ganti base_url dengan: https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions
# Jika Anda menggunakan model di wilayah Virginia, ganti base_url dengan: https://dashscope-us.aliyuncs.com/compatible-mode/v1/chat/completions
# === Hapus komentar ini sebelum eksekusi ===
curl -X POST https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
    "model": "qwen-plus",
    "messages": [
        {
            "role": "user", 
            "content": "Who are you"
        }
    ],
    "stream": true,
    "stream_options": {
        "include_usage": true
    },
    "enable_thinking": true,
    "thinking_budget": 50
}'

Respons

data: {"choices":[{"delta":{"content":null,"role":"assistant","reasoning_content":""},"index":0,"logprobs":null,"finish_reason":null}],"object":"chat.completion.chunk","usage":null,"created":1745485391,"system_fingerprint":null,"model":"qwen-plus","id":"chatcmpl-e2edaf2c-8aaf-9e54-90e2-b21dd5045503"}

.....

data: {"choices":[{"finish_reason":"stop","delta":{"content":"","reasoning_content":null},"index":0,"logprobs":null}],"object":"chat.completion.chunk","usage":null,"created":1745485391,"system_fingerprint":null,"model":"qwen-plus","id":"chatcmpl-e2edaf2c-8aaf-9e54-90e2-b21dd5045503"}

data: {"choices":[],"object":"chat.completion.chunk","usage":{"prompt_tokens":10,"completion_tokens":360,"total_tokens":370},"created":1745485391,"system_fingerprint":null,"model":"qwen-plus","id":"chatcmpl-e2edaf2c-8aaf-9e54-90e2-b21dd5045503"}

data: [DONE]

DashScope

Python

Kode contoh

import os
from dashscope import Generation
import dashscope
# Berikut adalah base_url untuk wilayah Singapura. Jika Anda menggunakan model di wilayah Virginia, ganti base_url dengan https://dashscope-us.aliyuncs.com/api/v1
# Jika Anda menggunakan model di wilayah Beijing, ganti base_url dengan https://dashscope.aliyuncs.com/api/v1
dashscope.base_http_api_url = "https://dashscope-intl.aliyuncs.com/api/v1/"

messages = [{"role": "user", "content": "Who are you?"}]

completion = Generation.call(
    # Jika Anda belum mengonfigurasi variabel lingkungan, ganti baris berikut dengan Kunci API Model Studio Anda: api_key = "sk-xxx",
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    model="qwen-plus",
    messages=messages,
    result_format="message",
    enable_thinking=True,
    # Tetapkan jumlah maksimum token untuk proses penalaran.
    thinking_budget=50,
    stream=True,
    incremental_output=True,
)

# Definisikan proses berpikir lengkap.
reasoning_content = ""
# Definisikan respons lengkap.
answer_content = ""
# Tentukan apakah proses berpikir telah selesai dan respons telah dimulai.
is_answering = False

print("=" * 20 + "Proses berpikir" + "=" * 20)

for chunk in completion:
    # Jika proses berpikir dan respons keduanya kosong, abaikan.
    if (
        chunk.output.choices[0].message.content == ""
        and chunk.output.choices[0].message.reasoning_content == ""
    ):
        pass
    else:
        # Jika saat ini sedang dalam proses berpikir.
        if (
            chunk.output.choices[0].message.reasoning_content != ""
            and chunk.output.choices[0].message.content == ""
        ):
            print(chunk.output.choices[0].message.reasoning_content, end="", flush=True)
            reasoning_content += chunk.output.choices[0].message.reasoning_content
        # Jika saat ini sedang dalam tahap respons.
        elif chunk.output.choices[0].message.content != "":
            if not is_answering:
                print("\n" + "=" * 20 + "Respons lengkap" + "=" * 20)
                is_answering = True
            print(chunk.output.choices[0].message.content, end="", flush=True)
            answer_content += chunk.output.choices[0].message.content

# Untuk mencetak proses berpikir lengkap dan respons lengkap, hapus komentar dan jalankan kode berikut.
# print("=" * 20 + "Proses berpikir lengkap" + "=" * 20 + "\n")
# print(f"{reasoning_content}")
# print("=" * 20 + "Respons lengkap" + "=" * 20 + "\n")
# print(f"{answer_content}")

Hasil pengembalian

====================Proses berpikir====================
Okay, the user is asking "Who are you?", so I need to give a clear and friendly response. First, I should introduce my identity, which is Qwen, developed by the Tongyi Lab under Alibaba Group. Next, I should explain my main functions, such as
====================Respons lengkap====================
I am Qwen, a large-scale language model independently developed by the Tongyi Lab at Alibaba Group. I can answer questions, create text, perform logical reasoning, and write code, with the goal of providing users with comprehensive, accurate, and useful information and assistance. How can I help you?

Java

Kode contoh

// Versi SDK DashScope >= 2.19.4
import java.util.Arrays;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import com.alibaba.dashscope.aigc.generation.Generation;
import com.alibaba.dashscope.aigc.generation.GenerationParam;
import com.alibaba.dashscope.aigc.generation.GenerationResult;
import com.alibaba.dashscope.common.Message;
import com.alibaba.dashscope.common.Role;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.InputRequiredException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import io.reactivex.Flowable;
import java.lang.System;
import com.alibaba.dashscope.utils.Constants;

public class Main {
    static {
        // Berikut adalah base_url untuk wilayah Singapura. Jika Anda menggunakan model di wilayah Virginia, ganti base_url dengan https://dashscope-us.aliyuncs.com/api/v1
        // Jika Anda menggunakan model di wilayah Beijing, ganti base_url dengan https://dashscope.aliyuncs.com/api/v1
        Constants.baseHttpApiUrl="https://dashscope-intl.aliyuncs.com/api/v1";
    }
    private static final Logger logger = LoggerFactory.getLogger(Main.class);
    private static StringBuilder reasoningContent = new StringBuilder();
    private static StringBuilder finalContent = new StringBuilder();
    private static boolean isFirstPrint = true;

    private static void handleGenerationResult(GenerationResult message) {
        String reasoning = message.getOutput().getChoices().get(0).getMessage().getReasoningContent();
        String content = message.getOutput().getChoices().get(0).getMessage().getContent();

        if (!reasoning.isEmpty()) {
            reasoningContent.append(reasoning);
            if (isFirstPrint) {
                System.out.println("====================Proses berpikir====================");
                isFirstPrint = false;
            }
            System.out.print(reasoning);
        }

        if (!content.isEmpty()) {
            finalContent.append(content);
            if (!isFirstPrint) {
                System.out.println("\n====================Respons lengkap====================");
                isFirstPrint = true;
            }
            System.out.print(content);
        }
    }
    private static GenerationParam buildGenerationParam(Message userMsg) {
        return GenerationParam.builder()
                // Jika Anda belum mengonfigurasi variabel lingkungan, ganti baris berikut dengan Kunci API Model Studio Anda: .apiKey("sk-xxx")
                .apiKey(System.getenv("DASHSCOPE_API_KEY"))
                .model("qwen-plus")
                .enableThinking(true)
                .thinkingBudget(50)
                .incrementalOutput(true)
                .resultFormat("message")
                .messages(Arrays.asList(userMsg))
                .build();
    }
    public static void streamCallWithMessage(Generation gen, Message userMsg)
            throws NoApiKeyException, ApiException, InputRequiredException {
        GenerationParam param = buildGenerationParam(userMsg);
        Flowable<GenerationResult> result = gen.streamCall(param);
        result.blockingForEach(message -> handleGenerationResult(message));
    }

    public static void main(String[] args) {
        try {
            Generation gen = new Generation();
            Message userMsg = Message.builder().role(Role.USER.getValue()).content("Who are you?").build();
            streamCallWithMessage(gen, userMsg);
//             Cetak hasil akhir.
//            if (reasoningContent.length() > 0) {
//                System.out.println("\n====================Respons lengkap====================");
//                System.out.println(finalContent.toString());
//            }
        } catch (ApiException | NoApiKeyException | InputRequiredException e) {
            logger.error("An exception occurred: {}", e.getMessage());
        }
        System.exit(0);
    }
}

Respons

====================Proses berpikir====================
Okay, the user is asking "Who are you?", so I need to give a clear and friendly response. First, I should introduce my identity, which is Qwen, developed by the Tongyi Lab under Alibaba Group. Next, I should explain my main functions, such as
====================Respons lengkap====================
I am Qwen, a large-scale language model independently developed by the Tongyi Lab at Alibaba Group. I can answer questions, create text, perform logical reasoning, and write code, with the goal of providing users with comprehensive, accurate, and useful information and assistance. How can I help you?

HTTP

Kode contoh

curl

# ======= Penting =======
# Berikut adalah URL untuk wilayah Singapura. Jika Anda menggunakan model di wilayah Beijing, ganti URL dengan: https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation
# Jika Anda menggunakan model di wilayah Virginia, ganti base_url dengan: https://dashscope-us.aliyuncs.com/api/v1/services/aigc/text-generation/generation
# === Hapus komentar ini sebelum eksekusi ===
curl -X POST "https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/text-generation/generation" \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-H "X-DashScope-SSE: enable" \
-d '{
    "model": "qwen-plus",
    "input":{
        "messages":[      
            {
                "role": "user",
                "content": "Who are you?"
            }
        ]
    },
    "parameters":{
        "enable_thinking": true,
        "thinking_budget": 50,
        "incremental_output": true,
        "result_format": "message"
    }
}'

Nilai pengembalian

id:1
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"","reasoning_content":"Okay","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":14,"output_tokens":3,"input_tokens":11,"output_tokens_details":{"reasoning_tokens":1}},"request_id":"2ce91085-3602-9c32-9c8b-fe3d583a2c38"}

id:2
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"","reasoning_content":",","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":15,"output_tokens":4,"input_tokens":11,"output_tokens_details":{"reasoning_tokens":2}},"request_id":"2ce91085-3602-9c32-9c8b-fe3d583a2c38"}

......

id:133
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"!","reasoning_content":"","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":149,"output_tokens":138,"input_tokens":11,"output_tokens_details":{"reasoning_tokens":50}},"request_id":"2ce91085-3602-9c32-9c8b-fe3d583a2c38"}

id:134
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"","reasoning_content":"","role":"assistant"},"finish_reason":"stop"}]},"usage":{"total_tokens":149,"output_tokens":138,"input_tokens":11,"output_tokens_details":{"reasoning_tokens":50}},"request_id":"2ce91085-3602-9c32-9c8b-fe3d583a2c38"}

Fitur lainnya

Rincian penagihan

Proses berpikir ditagih berdasarkan jumlah token output.
Beberapa model hybrid-thinking menerapkan tarif berbeda untuk mode berpikir dan mode non-berpikir.
Jika model dalam mode berpikir tidak menghasilkan proses berpikir, penagihan akan menggunakan tarif mode non-berpikir.

FAQ

T: Bagaimana cara menonaktifkan mode berpikir?

Kemampuan untuk menonaktifkan mode berpikir bergantung pada jenis model:

Untuk model hybrid-thinking, seperti qwen-plus dan deepseek-v3.2-exp, atur parameter enable_thinking ke false untuk menonaktifkan mode tersebut.
Untuk model thinking-only, seperti qwen3-235b-a22b-thinking-2507 dan deepseek-r1, Anda tidak dapat menonaktifkan mode tersebut.

T: Model mana yang mendukung keluaran non-streaming?

Model pemikiran mendalam memerlukan waktu pemrosesan lebih lama sebelum merespons, sehingga meningkatkan latensi respons dan berisiko mengalami timeout pada keluaran non-streaming. Kami merekomendasikan penggunaan panggilan streaming. Jika Anda tetap memerlukan keluaran non-streaming, gunakan salah satu model berikut yang didukung.

Qwen3

Edisi Komersial
- Seri Qwen-Max: qwen3-max-preview
- Seri Qwen-Plus: qwen-plus
- Seri Qwen-Flash: qwen-flash, qwen-flash-2025-07-28
- Seri Qwen-Turbo: qwen-turbo
Edisi Open-Source
- qwen3-next-80b-a3b-thinking, qwen3-235b-a22b-thinking-2507, qwen3-30b-a3b-thinking-2507

DeepSeek (Wilayah Beijing)

deepseek-v3.2, deepseek-v3.2-exp, deepseek-r1, deepseek-r1-0528, deepseek-r1 distilled model

Kimi (Wilayah Beijing)

kimi-k2-thinking

T: Bagaimana cara membeli token setelah kuota gratis saya habis?

Anda dapat mengakses pusat Biaya dan Pengeluaran untuk mengisi ulang akun Anda. Pastikan akun Anda tidak memiliki pembayaran tertunda sebelum memanggil model.

Setelah kuota gratis habis, panggilan model akan secara otomatis dikenai biaya dengan siklus penagihan per jam. Untuk melihat rincian penagihan, buka Billing Details.

T: Bisakah saya mengunggah gambar atau dokumen untuk mengajukan pertanyaan?

Model yang dijelaskan dalam topik ini hanya mendukung input teks. Model Qwen3-VL dan QVQ mendukung pemikiran mendalam untuk gambar.

T: Bagaimana cara melihat konsumsi token dan jumlah panggilan?

Satu jam setelah Anda memanggil model, buka halaman Observasi Model (Singapura atau Beijing). Atur kondisi kueri, seperti rentang waktu dan ruang kerja. Lalu, pada area Models, temukan model target dan klik Monitor di kolom Actions untuk melihat statistik panggilan model. Untuk informasi selengkapnya, lihat dokumen Observasi Model.

Data diperbarui setiap jam. Selama periode puncak, mungkin terjadi latensi hingga satu jam.

Referensi API

Untuk informasi selengkapnya mengenai parameter input dan output model pemikiran mendalam, lihat Qwen.

Kode kesalahan

Jika terjadi kesalahan, lihat Pesan Kesalahan untuk pemecahan masalah.