Topik ini menjelaskan cara memanggil model DeepSeek di Alibaba Cloud Model Studio menggunakan API yang kompatibel dengan OpenAI atau SDK DashScope.
Dokumen ini hanya berlaku untuk wilayah China (Beijing). Untuk menggunakan model-model ini, Anda harus menggunakan Kunci API dari wilayah China (Beijing).
Ketersediaan model
deepseek-v3.2, deepseek-v3.2-exp, dan deepseek-v3.1 (Parameter mengontrol apakah model berpikir sebelum memberikan respons)
Model berpikir hibrida, dengan mode berpikir dinonaktifkan secara default. deepseek-v3.2 adalah model pertama dari DeepSeek yang mengintegrasikan pemikiran dengan penggunaan tool. Model ini mendukung pemanggilan tool baik dalam mode berpikir maupun non-berpikir.
Gunakan parameter
enable_thinkinguntuk mengontrol mode berpikir.deepseek-r1 (Selalu berpikir sebelum memberikan respons)
deepseek-r1-0528, dirilis pada Mei 2025, merupakan versi peningkatan dari deepseek-r1 yang dirilis pada Januari 2025. Versi baru ini menunjukkan peningkatan signifikan dalam tugas penalaran kompleks. Kedalaman pemikiran selama inferensi meningkat, sehingga waktu respons menjadi lebih lama.
deepseek-r1 di Model Studio telah ditingkatkan ke versi 0528.
Model deepseek-r1-distill adalah hasil fine-tuning dari model bahasa besar open-source, seperti Qwen dan Llama, dengan sampel pelatihan yang dihasilkan oleh deepseek-r1 melalui penyulingan pengetahuan.
deepseek-v3 (Tidak berpikir sebelum memberikan respons)
Model deepseek-v3 telah dipra-latih pada 14,8 T token dan unggul dalam pemrosesan teks panjang, kode, matematika, pengetahuan ensiklopedis, dan bahasa Tionghoa.
Ini adalah versi yang dirilis pada 26 Desember 2024, bukan versi yang dirilis pada 24 Maret 2025.
Dalam mode berpikir, model berpikir sebelum memberikan respons. Langkah-langkah pemikiran ditampilkan di bidang reasoning_content. Dibandingkan dengan mode non-berpikir, waktu respons lebih lama, tetapi kualitas respons lebih baik.
Kami merekomendasikan deepseek-v3.2, model terbaru dari DeepSeek. Model ini memiliki mode berpikir opsional, memiliki batas laju yang kurang ketat, dan harganya lebih rendah dibandingkan deepseek-v3.1.
Model | Context window | Max input | Max CoT | Max response |
(tokens) | ||||
deepseek-v3.2 Versi lengkap 685B | 131.072 | 98.304 | 32.768 | 65.536 |
deepseek-v3.2-exp Versi lengkap 685B | ||||
deepseek-v3.1 Versi lengkap 685B | ||||
deepseek-r1 Versi lengkap 685B | 16.384 | |||
deepseek-r1-0528 Versi lengkap 685B | ||||
deepseek-v3 Versi lengkap 671B | 131.072 | - | ||
Max CoT adalah jumlah maksimum token untuk proses berpikir dalam mode berpikir.
Model-model yang tercantum di atas bukan layanan pihak ketiga terintegrasi. Semuanya di-deploy di server Model Studio.
Untuk informasi tentang batas permintaan konkuren, lihat Batas laju DeepSeek.
Mulai
deepseek-v3.2 adalah model terbaru dalam seri DeepSeek. Gunakan parameter enable_thinking untuk beralih antara mode berpikir dan non-berpikir. Kode berikut menunjukkan cara memanggil model deepseek-v3.2 dalam mode berpikir.
Sebelum memulai, buat Kunci API dan ekspor Kunci API sebagai Variabel lingkungan. Jika Anda memanggil model menggunakan SDK, instal SDK OpenAI atau DashScope.
Kompatibel dengan OpenAI
Parameter enable_thinking bukan parameter standar OpenAI. Di SDK Python OpenAI, Anda harus meneruskan parameter ini dalam extra_body. Di SDK Node.js, Anda harus meneruskannya sebagai parameter tingkat atas.
Python
Kode contoh
from openai import OpenAI
import os
# Inisialisasi klien OpenAI
client = OpenAI(
# Jika variabel lingkungan belum dikonfigurasi, ganti baris berikut dengan Kunci API Studio Model Anda: api_key="sk-xxx"
api_key=os.getenv("DASHSCOPE_API_KEY"),
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)
messages = [{"role": "user", "content": "Who are you"}]
completion = client.chat.completions.create(
model="deepseek-v3.2",
messages=messages,
# Atur enable_thinking di extra_body untuk mengaktifkan mode berpikir
extra_body={"enable_thinking": True},
stream=True,
stream_options={
"include_usage": True
},
)
reasoning_content = "" # Proses berpikir lengkap
answer_content = "" # Respons lengkap
is_answering = False # Menunjukkan apakah fase respons telah dimulai
print("\n" + "=" * 20 + "Thinking process" + "=" * 20 + "\n")
for chunk in completion:
if not chunk.choices:
print("\n" + "=" * 20 + "Token usage" + "=" * 20 + "\n")
print(chunk.usage)
continue
delta = chunk.choices[0].delta
# Kumpulkan hanya konten berpikir
if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None:
if not is_answering:
print(delta.reasoning_content, end="", flush=True)
reasoning_content += delta.reasoning_content
# Mulai merespons saat konten diterima
if hasattr(delta, "content") and delta.content:
if not is_answering:
print("\n" + "=" * 20 + "Full response" + "=" * 20 + "\n")
is_answering = True
print(delta.content, end="", flush=True)
answer_content += delta.contentRespons
====================Thinking process====================
Ah, pengguna bertanya siapa saya. Ini adalah pertanyaan pembuka yang sangat umum. Saya perlu memperkenalkan identitas dan fungsi saya secara sederhana dan jelas. Saya bisa mulai dengan latar belakang perusahaan dan kemampuan inti untuk membantu pengguna memahami dengan cepat.
Saya harus menyoroti sifat gratis dan kekuatan berbasis teks saya, tetapi hindari terlalu banyak detail. Terakhir, saya akan membimbing percakapan dengan pertanyaan terbuka, yang sesuai dengan sifat asisten.
Saya akan memposisikan diri sebagai asisten AI tingkat perusahaan, yang profesional sekaligus ramah. Emoji dalam tanda kurung dapat menambah kesan ramah.
====================Full response====================
Halo! Saya DeepSeek, asisten AI yang dibuat oleh DeepSeek.
Saya adalah model berbasis teks saja. Meskipun saya tidak mendukung pengenalan multimodal, saya memiliki fitur unggah file yang dapat membantu Anda memproses berbagai file seperti gambar, txt, pdf, ppt, word, dan excel, serta membaca informasi teks darinya untuk membantu Anda. Saya sepenuhnya gratis digunakan, memiliki context window 128K, dan mendukung pencarian web (Anda perlu mengaktifkannya secara manual di Web/Aplikasi).
Pengetahuan saya terkini hingga Juli 2024, dan saya akan membantu Anda dengan antusiasme dan perhatian. Anda dapat mengunduh aplikasi saya dari toko aplikasi resmi.
Apakah ada yang bisa saya bantu? Baik itu pertanyaan tentang studi, pekerjaan, atau kehidupan sehari-hari Anda, saya dengan senang hati membantu! ✨
====================Token usage====================
CompletionUsage(completion_tokens=238, prompt_tokens=5, total_tokens=243, completion_tokens_details=CompletionTokensDetails(accepted_prediction_tokens=None, audio_tokens=None, reasoning_tokens=93, rejected_prediction_tokens=None), prompt_tokens_details=None)Node.js
Kode contoh
import OpenAI from "openai";
import process from 'process';
// Inisialisasi klien OpenAI
const openai = new OpenAI({
// Jika variabel lingkungan belum dikonfigurasi, ganti baris berikut dengan Kunci API Studio Model Anda: apiKey: "sk-xxx"
apiKey: process.env.DASHSCOPE_API_KEY,
baseURL: 'https://dashscope.aliyuncs.com/compatible-mode/v1'
});
let reasoningContent = ''; // Proses berpikir lengkap
let answerContent = ''; // Respons lengkap
let isAnswering = false; // Menunjukkan apakah fase respons telah dimulai
async function main() {
try {
const messages = [{ role: 'user', content: 'Who are you' }];
const stream = await openai.chat.completions.create({
model: 'deepseek-v3.2',
messages,
// Catatan: Di SDK Node.js, parameter non-standar seperti enable_thinking diteruskan sebagai properti tingkat atas dan tidak perlu ditempatkan di extra_body.
enable_thinking: true,
stream: true,
stream_options: {
include_usage: true
},
});
console.log('\n' + '='.repeat(20) + 'Thinking process' + '='.repeat(20) + '\n');
for await (const chunk of stream) {
if (!chunk.choices?.length) {
console.log('\n' + '='.repeat(20) + 'Token usage' + '='.repeat(20) + '\n');
console.log(chunk.usage);
continue;
}
const delta = chunk.choices[0].delta;
// Kumpulkan hanya konten berpikir
if (delta.reasoning_content !== undefined && delta.reasoning_content !== null) {
if (!isAnswering) {
process.stdout.write(delta.reasoning_content);
}
reasoningContent += delta.reasoning_content;
}
// Mulai merespons saat konten diterima
if (delta.content !== undefined && delta.content) {
if (!isAnswering) {
console.log('\n' + '='.repeat(20) + 'Full response' + '='.repeat(20) + '\n');
isAnswering = true;
}
process.stdout.write(delta.content);
answerContent += delta.content;
}
}
} catch (error) {
console.error('Error:', error);
}
}
main();Respons
====================Thinking process====================
Ah, pengguna bertanya siapa saya. Ini adalah pertanyaan pembuka yang sangat umum. Saya perlu memperkenalkan identitas dan fungsi inti saya secara sederhana dan jelas, tanpa terlalu banyak detail.
Saya bisa mulai dengan latar belakang perusahaan dan posisi dasar, lalu mencantumkan beberapa kemampuan utama agar pengguna cepat memahami apa yang bisa saya lakukan. Saya akan mengakhiri dengan pertanyaan terbuka agar pengguna mudah melanjutkan.
Saya harus menyoroti fitur praktis seperti gratis, konteks panjang, dan pemrosesan file. Saya akan menjaga nada ramah namun terkendali, tanpa menggunakan emoji.
====================Full response====================
Halo! Saya DeepSeek, asisten AI yang dibuat oleh DeepSeek.
Saya adalah model berbasis teks saja dengan context window 128K, dan saya dapat membantu Anda menjawab pertanyaan, berdialog, serta membantu tugas berbasis teks. Meskipun saya tidak mendukung pengenalan multimodal, saya dapat memproses file yang Anda unggah, seperti gambar, txt, pdf, ppt, word, dan excel, serta membaca informasi teks darinya untuk membantu Anda.
Saya sepenuhnya gratis digunakan dan tidak memiliki fungsi suara, tetapi Anda dapat mengunduh aplikasi saya dari toko aplikasi resmi. Untuk menggunakan pencarian web, ingatlah untuk mengaktifkannya secara manual di Web atau Aplikasi.
Pengetahuan saya terkini hingga Juli 2024, dan saya akan membantu Anda dengan antusiasme dan perhatian. Jika Anda memiliki pertanyaan atau membutuhkan bantuan, cukup beri tahu saya! Saya dengan senang hati membantu. ✨
====================Token usage====================
{
prompt_tokens: 5,
completion_tokens: 243,
total_tokens: 248,
completion_tokens_details: { reasoning_tokens: 83 }
}HTTP
Kode contoh
curl
curl -X POST https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek-v3.2",
"messages": [
{
"role": "user",
"content": "Who are you"
}
],
"stream": true,
"stream_options": {
"include_usage": true
},
"enable_thinking": true
}'DashScope
Python
Kode contoh
import os
from dashscope import Generation
# Inisialisasi parameter permintaan
messages = [{"role": "user", "content": "Who are you?"}]
completion = Generation.call(
# Jika variabel lingkungan belum dikonfigurasi, ganti baris berikut dengan Kunci API Studio Model Anda: api_key="sk-xxx"
api_key=os.getenv("DASHSCOPE_API_KEY"),
model="deepseek-v3.2",
messages=messages,
result_format="message", # Atur format hasil ke message
enable_thinking=True,
stream=True, # Aktifkan keluaran streaming
incremental_output=True, # Aktifkan keluaran inkremental
)
reasoning_content = "" # Proses berpikir lengkap
answer_content = "" # Respons lengkap
is_answering = False # Menunjukkan apakah fase respons telah dimulai
print("\n" + "=" * 20 + "Thinking process" + "=" * 20 + "\n")
for chunk in completion:
message = chunk.output.choices[0].message
# Kumpulkan hanya konten berpikir
if "reasoning_content" in message:
if not is_answering:
print(message.reasoning_content, end="", flush=True)
reasoning_content += message.reasoning_content
# Mulai merespons saat konten diterima
if message.content:
if not is_answering:
print("\n" + "=" * 20 + "Full response" + "=" * 20 + "\n")
is_answering = True
print(message.content, end="", flush=True)
answer_content += message.content
print("\n" + "=" * 20 + "Token usage" + "=" * 20 + "\n")
print(chunk.usage)Respons
====================Thinking process====================
Oh, pengguna bertanya siapa saya. Ini adalah pertanyaan perkenalan diri yang sangat dasar. Saya perlu menyatakan identitas dan fungsi saya secara ringkas dan jelas, menghindari hal yang rumit. Saya bisa mulai dengan latar belakang perusahaan dan kemampuan inti untuk membantu pengguna memahami dengan cepat.
Mengingat pengguna mungkin baru, saya bisa menambahkan beberapa kasus penggunaan dan fitur khas, seperti gratis, konteks panjang, dan pemrosesan file. Saya akan mengakhiri dengan undangan terbuka untuk bantuan, menjaga sikap ramah.
Tidak perlu terlalu banyak detail teknis, fokusnya harus pada kemudahan penggunaan dan kepraktisan.
====================Full response====================
Halo! Saya DeepSeek, asisten AI yang dibuat oleh DeepSeek.
Saya adalah model berbasis teks saja. Meskipun saya tidak mendukung pengenalan multimodal, saya memiliki fitur unggah file yang dapat membantu Anda memproses file seperti gambar, txt, pdf, ppt, word, dan excel dengan membaca informasi teks untuk dianalisis. Saya sepenuhnya gratis digunakan, memiliki context window 128K, dan mendukung pencarian web (Anda perlu mengaktifkannya secara manual).
Pengetahuan saya terkini hingga Juli 2024, dan saya akan membantu Anda dengan antusiasme dan perhatian. Anda dapat mengunduh aplikasi saya dari toko aplikasi resmi.
Jika Anda memiliki pertanyaan atau membutuhkan bantuan, silakan tanyakan! Saya dengan senang hati menjawab pertanyaan Anda dan membantu berbagai tugas. ✨
====================Token usage====================
{"input_tokens": 6, "output_tokens": 240, "total_tokens": 246, "output_tokens_details": {"reasoning_tokens": 92}}Java
Kode contoh
SDK Java DashScope harus versi 2.19.4 atau lebih baru.
// Versi SDK DashScope harus 2.19.4 atau lebih baru.
import com.alibaba.dashscope.aigc.generation.Generation;
import com.alibaba.dashscope.aigc.generation.GenerationParam;
import com.alibaba.dashscope.aigc.generation.GenerationResult;
import com.alibaba.dashscope.common.Message;
import com.alibaba.dashscope.common.Role;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.InputRequiredException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import io.reactivex.Flowable;
import java.lang.System;
import java.util.Arrays;
public class Main {
private static StringBuilder reasoningContent = new StringBuilder();
private static StringBuilder finalContent = new StringBuilder();
private static boolean isFirstPrint = true;
private static void handleGenerationResult(GenerationResult message) {
String reasoning = message.getOutput().getChoices().get(0).getMessage().getReasoningContent();
String content = message.getOutput().getChoices().get(0).getMessage().getContent();
if (reasoning != null && !reasoning.isEmpty()) {
reasoningContent.append(reasoning);
if (isFirstPrint) {
System.out.println("====================Thinking process====================");
isFirstPrint = false;
}
System.out.print(reasoning);
}
if (content != null && !content.isEmpty()) {
finalContent.append(content);
if (!isFirstPrint) {
System.out.println("\n====================Full response====================");
isFirstPrint = true;
}
System.out.print(content);
}
}
private static GenerationParam buildGenerationParam(Message userMsg) {
return GenerationParam.builder()
// Jika variabel lingkungan belum dikonfigurasi, ganti baris berikut dengan: .apiKey("sk-xxx")
.apiKey(System.getenv("DASHSCOPE_API_KEY"))
.model("deepseek-v3.2")
.enableThinking(true)
.incrementalOutput(true)
.resultFormat("message")
.messages(Arrays.asList(userMsg))
.build();
}
public static void streamCallWithMessage(Generation gen, Message userMsg)
throws NoApiKeyException, ApiException, InputRequiredException {
GenerationParam param = buildGenerationParam(userMsg);
Flowable<GenerationResult> result = gen.streamCall(param);
result.blockingForEach(message -> handleGenerationResult(message));
}
public static void main(String[] args) {
try {
Generation gen = new Generation();
Message userMsg = Message.builder().role(Role.USER.getValue()).content("Who are you?").build();
streamCallWithMessage(gen, userMsg);
} catch (ApiException | NoApiKeyException | InputRequiredException e) {
System.err.println("Terjadi pengecualian: " + e.getMessage());
}
}
}Respons
====================Thinking process====================
Hmm, pengguna mengajukan pertanyaan perkenalan diri yang sederhana. Ini adalah kueri umum, jadi saya perlu menyatakan identitas dan fungsi saya dengan jelas dan cepat. Saya akan menggunakan nada santai dan ramah untuk memperkenalkan diri sebagai DeepSeek-V3, yang dibuat oleh DeepSeek. Saya juga bisa menyebutkan jenis bantuan yang dapat saya berikan, seperti menjawab pertanyaan, mengobrol, dan membimbing. Terakhir, saya akan menambahkan emoji agar lebih mudah didekati. Saya harus menjaga agar tetap ringkas dan jelas.
====================Full response====================
Saya DeepSeek-V3, asisten cerdas yang dibuat oleh DeepSeek! Saya dapat membantu Anda menjawab berbagai pertanyaan, memberikan saran, mencari informasi, dan bahkan mengobrol dengan Anda! Jangan ragu untuk bertanya apa pun tentang studi, pekerjaan, atau kehidupan sehari-hari Anda. Bagaimana saya bisa membantu Anda?HTTP
Kode contoh
curl
curl -X POST "https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation" \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-H "X-DashScope-SSE: enable" \
-d '{
"model": "deepseek-v3.2",
"input":{
"messages":[
{
"role": "user",
"content": "Who are you?"
}
]
},
"parameters":{
"enable_thinking": true,
"incremental_output": true,
"result_format": "message"
}
}'Fitur lainnya
Model | |||||
deepseek-v3.2 | |||||
deepseek-v3.2-exp | Hanya didukung dalam mode non-berpikir. | ||||
deepseek-v3.1 | Hanya didukung dalam mode non-berpikir. | ||||
deepseek-r1 | |||||
deepseek-r1-0528 | |||||
deepseek-v3 | |||||
Distilled model |
Nilai parameter default
Model | temperature | top_p | repetition_penalty | presence_penalty | max_tokens | thinking_budget |
deepseek-v3.2 | 1,0 | 0,95 | - | - | 65.536 | 32.768 |
deepseek-v3.2-exp | 0,6 | 0,95 | 1,0 | - | 65.536 | 32.768 |
deepseek-v3.1 | 0,6 | 0,95 | 1,0 | - | 65.536 | 32.768 |
deepseek-r1 | 0,6 | 0,95 | - | 1 | 16.384 | 32.768 |
deepseek-r1-0528 | 0,6 | 0,95 | - | 1 | 16.384 | 32.768 |
Distilled version | 0,6 | 0,95 | - | 1 | 16.384 | 16.384 |
deepseek-v3 | 0,7 | 0,6 | - | - | 16.384 | - |
Tanda hubung (-) menunjukkan bahwa parameter tersebut tidak memiliki nilai default dan tidak dapat diatur.
Model deepseek-r1, deepseek-r1-0528, dan model hasil penyulingan tidak mendukung pengaturan parameter-parameter ini.
Untuk deskripsi parameter, lihat OpenAI Chat.
Penagihan
Penagihan didasarkan pada jumlah token input dan output. Untuk detail harga, lihat Daftar model dan harga.
Dalam mode berpikir, CoT ditagih sebagai token output.
FAQ
Dapatkah saya mengunggah gambar atau dokumen untuk mengajukan pertanyaan?
Model DeepSeek hanya mendukung input teks. Model ini tidak mendukung input gambar atau dokumen. Qwen-VL mendukung input gambar, dan Qwen-Long mendukung input dokumen.
Bagaimana cara melihat penggunaan token dan jumlah panggilan?
Satu jam setelah Anda memanggil model, buka halaman Pemantauan Model. Atur kondisi kueri, seperti rentang waktu dan ruang kerja. Temukan model target di area Models dan klik Monitor di kolom Actions untuk melihat statistik panggilannya. Untuk informasi lebih lanjut, lihat Pemantauan penggunaan dan kinerja.
Data diperbarui setiap jam. Selama jam sibuk, pembaruan mungkin tertunda hingga satu jam.

Kode error
Jika terjadi error, lihat Pesan error untuk solusinya.