DeepSeek R1, DeepSeek V3, DeepSeek V3.1 API - Alibaba Cloud Model Studio

Topik ini menjelaskan cara memanggil model DeepSeek di Alibaba Cloud Model Studio menggunakan API yang kompatibel dengan OpenAI atau SDK DashScope.

Penting

Dokumen ini hanya berlaku untuk wilayah China (Beijing). Untuk menggunakan model-model ini, Anda harus menggunakan Kunci API dari wilayah China (Beijing).

Ketersediaan model

deepseek-v3.2, deepseek-v3.2-exp, dan deepseek-v3.1 (Parameter mengontrol apakah model berpikir sebelum memberikan respons)
Model berpikir hibrida, dengan mode berpikir dinonaktifkan secara default. deepseek-v3.2 adalah model pertama dari DeepSeek yang mengintegrasikan pemikiran dengan penggunaan tool. Model ini mendukung pemanggilan tool baik dalam mode berpikir maupun non-berpikir.
Gunakan parameter enable_thinking untuk mengontrol mode berpikir.
deepseek-r1 (Selalu berpikir sebelum memberikan respons)
- deepseek-r1-0528, dirilis pada Mei 2025, merupakan versi peningkatan dari deepseek-r1 yang dirilis pada Januari 2025. Versi baru ini menunjukkan peningkatan signifikan dalam tugas penalaran kompleks. Kedalaman pemikiran selama inferensi meningkat, sehingga waktu respons menjadi lebih lama.
  deepseek-r1 di Model Studio telah ditingkatkan ke versi 0528.
- Model deepseek-r1-distill adalah hasil fine-tuning dari model bahasa besar open-source, seperti Qwen dan Llama, dengan sampel pelatihan yang dihasilkan oleh deepseek-r1 melalui penyulingan pengetahuan.
deepseek-v3 (Tidak berpikir sebelum memberikan respons)
Model deepseek-v3 telah dipra-latih pada 14,8 T token dan unggul dalam pemrosesan teks panjang, kode, matematika, pengetahuan ensiklopedis, dan bahasa Tionghoa.
Ini adalah versi yang dirilis pada 26 Desember 2024, bukan versi yang dirilis pada 24 Maret 2025.

Dalam mode berpikir, model berpikir sebelum memberikan respons. Langkah-langkah pemikiran ditampilkan di bidang reasoning_content. Dibandingkan dengan mode non-berpikir, waktu respons lebih lama, tetapi kualitas respons lebih baik.

Kami merekomendasikan deepseek-v3.2, model terbaru dari DeepSeek. Model ini memiliki mode berpikir opsional, memiliki batas laju yang kurang ketat, dan harganya lebih rendah dibandingkan deepseek-v3.1.

Model	Context window	Max input	Max CoT	Max response
	(tokens)
deepseek-v3.2 Versi lengkap 685B	131.072	98.304	32.768	65.536
deepseek-v3.2-exp Versi lengkap 685B
deepseek-v3.1 Versi lengkap 685B
deepseek-r1 Versi lengkap 685B				16.384
deepseek-r1-0528 Versi lengkap 685B
deepseek-v3 Versi lengkap 671B		131.072	-

Model hasil penyulingan

Model	Context window	Max input	Max CoT	Max response
	(tokens)
deepseek-r1-distill-qwen-1.5b Berdasarkan Qwen2.5-Math-1.5B	32.768	32.768	16.384	16.384
deepseek-r1-distill-qwen-7b Berdasarkan Qwen2.5-Math-7B
deepseek-r1-distill-qwen-14b Berdasarkan Qwen2.5-14B
deepseek-r1-distill-qwen-32b Berdasarkan Qwen2.5-32B
deepseek-r1-distill-llama-8b Berdasarkan Llama-3.1-8B
deepseek-r1-distill-llama-70b Berdasarkan Llama-3.3-70B

Max CoT adalah jumlah maksimum token untuk proses berpikir dalam mode berpikir.

Model-model yang tercantum di atas bukan layanan pihak ketiga terintegrasi. Semuanya di-deploy di server Model Studio.

Untuk informasi tentang batas permintaan konkuren, lihat Batas laju DeepSeek.

Mulai

deepseek-v3.2 adalah model terbaru dalam seri DeepSeek. Gunakan parameter enable_thinking untuk beralih antara mode berpikir dan non-berpikir. Kode berikut menunjukkan cara memanggil model deepseek-v3.2 dalam mode berpikir.

Sebelum memulai, buat Kunci API dan ekspor Kunci API sebagai Variabel lingkungan. Jika Anda memanggil model menggunakan SDK, instal SDK OpenAI atau DashScope.

Kompatibel dengan OpenAI

Catatan

Parameter enable_thinking bukan parameter standar OpenAI. Di SDK Python OpenAI, Anda harus meneruskan parameter ini dalam extra_body. Di SDK Node.js, Anda harus meneruskannya sebagai parameter tingkat atas.

Python

Kode contoh

from openai import OpenAI
import os

# Inisialisasi klien OpenAI
client = OpenAI(
    # Jika variabel lingkungan belum dikonfigurasi, ganti baris berikut dengan Kunci API Studio Model Anda: api_key="sk-xxx"
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

messages = [{"role": "user", "content": "Who are you"}]
completion = client.chat.completions.create(
    model="deepseek-v3.2",
    messages=messages,
    # Atur enable_thinking di extra_body untuk mengaktifkan mode berpikir
    extra_body={"enable_thinking": True},
    stream=True,
    stream_options={
        "include_usage": True
    },
)

reasoning_content = ""  # Proses berpikir lengkap
answer_content = ""  # Respons lengkap
is_answering = False  # Menunjukkan apakah fase respons telah dimulai
print("\n" + "=" * 20 + "Thinking process" + "=" * 20 + "\n")

for chunk in completion:
    if not chunk.choices:
        print("\n" + "=" * 20 + "Token usage" + "=" * 20 + "\n")
        print(chunk.usage)
        continue

    delta = chunk.choices[0].delta

    # Kumpulkan hanya konten berpikir
    if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None:
        if not is_answering:
            print(delta.reasoning_content, end="", flush=True)
        reasoning_content += delta.reasoning_content

    # Mulai merespons saat konten diterima
    if hasattr(delta, "content") and delta.content:
        if not is_answering:
            print("\n" + "=" * 20 + "Full response" + "=" * 20 + "\n")
            is_answering = True
        print(delta.content, end="", flush=True)
        answer_content += delta.content

Respons

====================Thinking process====================

Ah, pengguna bertanya siapa saya. Ini adalah pertanyaan pembuka yang sangat umum. Saya perlu memperkenalkan identitas dan fungsi saya secara sederhana dan jelas. Saya bisa mulai dengan latar belakang perusahaan dan kemampuan inti untuk membantu pengguna memahami dengan cepat.
Saya harus menyoroti sifat gratis dan kekuatan berbasis teks saya, tetapi hindari terlalu banyak detail. Terakhir, saya akan membimbing percakapan dengan pertanyaan terbuka, yang sesuai dengan sifat asisten.
Saya akan memposisikan diri sebagai asisten AI tingkat perusahaan, yang profesional sekaligus ramah. Emoji dalam tanda kurung dapat menambah kesan ramah.
====================Full response====================

Halo! Saya DeepSeek, asisten AI yang dibuat oleh DeepSeek.

Saya adalah model berbasis teks saja. Meskipun saya tidak mendukung pengenalan multimodal, saya memiliki fitur unggah file yang dapat membantu Anda memproses berbagai file seperti gambar, txt, pdf, ppt, word, dan excel, serta membaca informasi teks darinya untuk membantu Anda. Saya sepenuhnya gratis digunakan, memiliki context window 128K, dan mendukung pencarian web (Anda perlu mengaktifkannya secara manual di Web/Aplikasi).

Pengetahuan saya terkini hingga Juli 2024, dan saya akan membantu Anda dengan antusiasme dan perhatian. Anda dapat mengunduh aplikasi saya dari toko aplikasi resmi.

Apakah ada yang bisa saya bantu? Baik itu pertanyaan tentang studi, pekerjaan, atau kehidupan sehari-hari Anda, saya dengan senang hati membantu! ✨
====================Token usage====================

CompletionUsage(completion_tokens=238, prompt_tokens=5, total_tokens=243, completion_tokens_details=CompletionTokensDetails(accepted_prediction_tokens=None, audio_tokens=None, reasoning_tokens=93, rejected_prediction_tokens=None), prompt_tokens_details=None)

Node.js

Kode contoh

import OpenAI from "openai";
import process from 'process';

// Inisialisasi klien OpenAI
const openai = new OpenAI({
    // Jika variabel lingkungan belum dikonfigurasi, ganti baris berikut dengan Kunci API Studio Model Anda: apiKey: "sk-xxx"
    apiKey: process.env.DASHSCOPE_API_KEY, 
    baseURL: 'https://dashscope.aliyuncs.com/compatible-mode/v1'
});

let reasoningContent = ''; // Proses berpikir lengkap
let answerContent = ''; // Respons lengkap
let isAnswering = false; // Menunjukkan apakah fase respons telah dimulai

async function main() {
    try {
        const messages = [{ role: 'user', content: 'Who are you' }];
        
        const stream = await openai.chat.completions.create({
            model: 'deepseek-v3.2',
            messages,
            // Catatan: Di SDK Node.js, parameter non-standar seperti enable_thinking diteruskan sebagai properti tingkat atas dan tidak perlu ditempatkan di extra_body.
            enable_thinking: true,
            stream: true,
            stream_options: {
                include_usage: true
            },
        });

        console.log('\n' + '='.repeat(20) + 'Thinking process' + '='.repeat(20) + '\n');

        for await (const chunk of stream) {
            if (!chunk.choices?.length) {
                console.log('\n' + '='.repeat(20) + 'Token usage' + '='.repeat(20) + '\n');
                console.log(chunk.usage);
                continue;
            }

            const delta = chunk.choices[0].delta;
            
            // Kumpulkan hanya konten berpikir
            if (delta.reasoning_content !== undefined && delta.reasoning_content !== null) {
                if (!isAnswering) {
                    process.stdout.write(delta.reasoning_content);
                }
                reasoningContent += delta.reasoning_content;
            }

            // Mulai merespons saat konten diterima
            if (delta.content !== undefined && delta.content) {
                if (!isAnswering) {
                    console.log('\n' + '='.repeat(20) + 'Full response' + '='.repeat(20) + '\n');
                    isAnswering = true;
                }
                process.stdout.write(delta.content);
                answerContent += delta.content;
            }
        }
    } catch (error) {
        console.error('Error:', error);
    }
}

main();

Respons

====================Thinking process====================

Ah, pengguna bertanya siapa saya. Ini adalah pertanyaan pembuka yang sangat umum. Saya perlu memperkenalkan identitas dan fungsi inti saya secara sederhana dan jelas, tanpa terlalu banyak detail.

Saya bisa mulai dengan latar belakang perusahaan dan posisi dasar, lalu mencantumkan beberapa kemampuan utama agar pengguna cepat memahami apa yang bisa saya lakukan. Saya akan mengakhiri dengan pertanyaan terbuka agar pengguna mudah melanjutkan.

Saya harus menyoroti fitur praktis seperti gratis, konteks panjang, dan pemrosesan file. Saya akan menjaga nada ramah namun terkendali, tanpa menggunakan emoji.
====================Full response====================

Halo! Saya DeepSeek, asisten AI yang dibuat oleh DeepSeek.

Saya adalah model berbasis teks saja dengan context window 128K, dan saya dapat membantu Anda menjawab pertanyaan, berdialog, serta membantu tugas berbasis teks. Meskipun saya tidak mendukung pengenalan multimodal, saya dapat memproses file yang Anda unggah, seperti gambar, txt, pdf, ppt, word, dan excel, serta membaca informasi teks darinya untuk membantu Anda.

Saya sepenuhnya gratis digunakan dan tidak memiliki fungsi suara, tetapi Anda dapat mengunduh aplikasi saya dari toko aplikasi resmi. Untuk menggunakan pencarian web, ingatlah untuk mengaktifkannya secara manual di Web atau Aplikasi.

Pengetahuan saya terkini hingga Juli 2024, dan saya akan membantu Anda dengan antusiasme dan perhatian. Jika Anda memiliki pertanyaan atau membutuhkan bantuan, cukup beri tahu saya! Saya dengan senang hati membantu. ✨
====================Token usage====================

{
  prompt_tokens: 5,
  completion_tokens: 243,
  total_tokens: 248,
  completion_tokens_details: { reasoning_tokens: 83 }
}

HTTP

Kode contoh

curl

curl -X POST https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
    "model": "deepseek-v3.2",
    "messages": [
        {
            "role": "user", 
            "content": "Who are you"
        }
    ],
    "stream": true,
    "stream_options": {
        "include_usage": true
    },
    "enable_thinking": true
}'

DashScope

Python

Kode contoh

import os
from dashscope import Generation

# Inisialisasi parameter permintaan
messages = [{"role": "user", "content": "Who are you?"}]

completion = Generation.call(
    # Jika variabel lingkungan belum dikonfigurasi, ganti baris berikut dengan Kunci API Studio Model Anda: api_key="sk-xxx"
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    model="deepseek-v3.2",
    messages=messages,
    result_format="message",  # Atur format hasil ke message
    enable_thinking=True,
    stream=True,              # Aktifkan keluaran streaming
    incremental_output=True,  # Aktifkan keluaran inkremental
)

reasoning_content = ""  # Proses berpikir lengkap
answer_content = ""     # Respons lengkap
is_answering = False    # Menunjukkan apakah fase respons telah dimulai

print("\n" + "=" * 20 + "Thinking process" + "=" * 20 + "\n")

for chunk in completion:
    message = chunk.output.choices[0].message
    # Kumpulkan hanya konten berpikir
    if "reasoning_content" in message:
        if not is_answering:
            print(message.reasoning_content, end="", flush=True)
        reasoning_content += message.reasoning_content

    # Mulai merespons saat konten diterima
    if message.content:
        if not is_answering:
            print("\n" + "=" * 20 + "Full response" + "=" * 20 + "\n")
            is_answering = True
        print(message.content, end="", flush=True)
        answer_content += message.content

print("\n" + "=" * 20 + "Token usage" + "=" * 20 + "\n")
print(chunk.usage)

Respons

====================Thinking process====================

Oh, pengguna bertanya siapa saya. Ini adalah pertanyaan perkenalan diri yang sangat dasar. Saya perlu menyatakan identitas dan fungsi saya secara ringkas dan jelas, menghindari hal yang rumit. Saya bisa mulai dengan latar belakang perusahaan dan kemampuan inti untuk membantu pengguna memahami dengan cepat.
Mengingat pengguna mungkin baru, saya bisa menambahkan beberapa kasus penggunaan dan fitur khas, seperti gratis, konteks panjang, dan pemrosesan file. Saya akan mengakhiri dengan undangan terbuka untuk bantuan, menjaga sikap ramah.
Tidak perlu terlalu banyak detail teknis, fokusnya harus pada kemudahan penggunaan dan kepraktisan.
====================Full response====================

Halo! Saya DeepSeek, asisten AI yang dibuat oleh DeepSeek.

Saya adalah model berbasis teks saja. Meskipun saya tidak mendukung pengenalan multimodal, saya memiliki fitur unggah file yang dapat membantu Anda memproses file seperti gambar, txt, pdf, ppt, word, dan excel dengan membaca informasi teks untuk dianalisis. Saya sepenuhnya gratis digunakan, memiliki context window 128K, dan mendukung pencarian web (Anda perlu mengaktifkannya secara manual).

Pengetahuan saya terkini hingga Juli 2024, dan saya akan membantu Anda dengan antusiasme dan perhatian. Anda dapat mengunduh aplikasi saya dari toko aplikasi resmi.

Jika Anda memiliki pertanyaan atau membutuhkan bantuan, silakan tanyakan! Saya dengan senang hati menjawab pertanyaan Anda dan membantu berbagai tugas. ✨
====================Token usage====================

{"input_tokens": 6, "output_tokens": 240, "total_tokens": 246, "output_tokens_details": {"reasoning_tokens": 92}}

Java

Kode contoh

Penting

SDK Java DashScope harus versi 2.19.4 atau lebih baru.

// Versi SDK DashScope harus 2.19.4 atau lebih baru.
import com.alibaba.dashscope.aigc.generation.Generation;
import com.alibaba.dashscope.aigc.generation.GenerationParam;
import com.alibaba.dashscope.aigc.generation.GenerationResult;
import com.alibaba.dashscope.common.Message;
import com.alibaba.dashscope.common.Role;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.InputRequiredException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import io.reactivex.Flowable;
import java.lang.System;
import java.util.Arrays;

public class Main {
    private static StringBuilder reasoningContent = new StringBuilder();
    private static StringBuilder finalContent = new StringBuilder();
    private static boolean isFirstPrint = true;
    private static void handleGenerationResult(GenerationResult message) {
        String reasoning = message.getOutput().getChoices().get(0).getMessage().getReasoningContent();
        String content = message.getOutput().getChoices().get(0).getMessage().getContent();
        if (reasoning != null && !reasoning.isEmpty()) {
            reasoningContent.append(reasoning);
            if (isFirstPrint) {
                System.out.println("====================Thinking process====================");
                isFirstPrint = false;
            }
            System.out.print(reasoning);
        }
        if (content != null && !content.isEmpty()) {
            finalContent.append(content);
            if (!isFirstPrint) {
                System.out.println("\n====================Full response====================");
                isFirstPrint = true;
            }
            System.out.print(content);
        }
    }
    private static GenerationParam buildGenerationParam(Message userMsg) {
        return GenerationParam.builder()
                // Jika variabel lingkungan belum dikonfigurasi, ganti baris berikut dengan: .apiKey("sk-xxx")
                .apiKey(System.getenv("DASHSCOPE_API_KEY"))
                .model("deepseek-v3.2")
                .enableThinking(true)
                .incrementalOutput(true)
                .resultFormat("message")
                .messages(Arrays.asList(userMsg))
                .build();
    }
    public static void streamCallWithMessage(Generation gen, Message userMsg)
            throws NoApiKeyException, ApiException, InputRequiredException {
        GenerationParam param = buildGenerationParam(userMsg);
        Flowable<GenerationResult> result = gen.streamCall(param);
        result.blockingForEach(message -> handleGenerationResult(message));
    }
    public static void main(String[] args) {
        try {
            Generation gen = new Generation();
            Message userMsg = Message.builder().role(Role.USER.getValue()).content("Who are you?").build();
            streamCallWithMessage(gen, userMsg);
        } catch (ApiException | NoApiKeyException | InputRequiredException e) {
            System.err.println("Terjadi pengecualian: " + e.getMessage());
        }
    }
}

Respons

====================Thinking process====================

Hmm, pengguna mengajukan pertanyaan perkenalan diri yang sederhana. Ini adalah kueri umum, jadi saya perlu menyatakan identitas dan fungsi saya dengan jelas dan cepat. Saya akan menggunakan nada santai dan ramah untuk memperkenalkan diri sebagai DeepSeek-V3, yang dibuat oleh DeepSeek. Saya juga bisa menyebutkan jenis bantuan yang dapat saya berikan, seperti menjawab pertanyaan, mengobrol, dan membimbing. Terakhir, saya akan menambahkan emoji agar lebih mudah didekati. Saya harus menjaga agar tetap ringkas dan jelas.
====================Full response====================

Saya DeepSeek-V3, asisten cerdas yang dibuat oleh DeepSeek! Saya dapat membantu Anda menjawab berbagai pertanyaan, memberikan saran, mencari informasi, dan bahkan mengobrol dengan Anda! Jangan ragu untuk bertanya apa pun tentang studi, pekerjaan, atau kehidupan sehari-hari Anda. Bagaimana saya bisa membantu Anda?

HTTP

Kode contoh

curl

curl -X POST "https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation" \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-H "X-DashScope-SSE: enable" \
-d '{
    "model": "deepseek-v3.2",
    "input":{
        "messages":[      
            {
                "role": "user",
                "content": "Who are you?"
            }
        ]
    },
    "parameters":{
        "enable_thinking": true,
        "incremental_output": true,
        "result_format": "message"
    }
}'

Fitur lainnya

Model	Multi-turn conversation	Function calling	Context cache	Structured output	Partial mode
deepseek-v3.2	Didukung	Didukung	Didukung	Tidak didukung	Tidak didukung
deepseek-v3.2-exp	Didukung	Didukung Hanya didukung dalam mode non-berpikir.	Tidak didukung	Tidak didukung	Tidak didukung
deepseek-v3.1	Didukung	Didukung Hanya didukung dalam mode non-berpikir.	Tidak didukung	Tidak didukung	Tidak didukung
deepseek-r1	Didukung	Didukung	Tidak didukung	Tidak didukung	Tidak didukung
deepseek-r1-0528	Didukung	Didukung	Tidak didukung	Tidak didukung	Tidak didukung
deepseek-v3	Didukung	Didukung	Tidak didukung	Tidak didukung	Tidak didukung
Distilled model	Didukung	Tidak didukung	Tidak didukung	Tidak didukung	Tidak didukung

Nilai parameter default

Model	temperature	top_p	repetition_penalty	presence_penalty	max_tokens	thinking_budget
deepseek-v3.2	1,0	0,95	-	-	65.536	32.768
deepseek-v3.2-exp	0,6	0,95	1,0	-	65.536	32.768
deepseek-v3.1	0,6	0,95	1,0	-	65.536	32.768
deepseek-r1	0,6	0,95	-	1	16.384	32.768
deepseek-r1-0528	0,6	0,95	-	1	16.384	32.768
Distilled version	0,6	0,95	-	1	16.384	16.384
deepseek-v3	0,7	0,6	-	-	16.384	-

Tanda hubung (-) menunjukkan bahwa parameter tersebut tidak memiliki nilai default dan tidak dapat diatur.
Model deepseek-r1, deepseek-r1-0528, dan model hasil penyulingan tidak mendukung pengaturan parameter-parameter ini.
Untuk deskripsi parameter, lihat OpenAI Chat.

Penagihan

Penagihan didasarkan pada jumlah token input dan output. Untuk detail harga, lihat Daftar model dan harga.

Dalam mode berpikir, CoT ditagih sebagai token output.

FAQ

Dapatkah saya mengunggah gambar atau dokumen untuk mengajukan pertanyaan?

Model DeepSeek hanya mendukung input teks. Model ini tidak mendukung input gambar atau dokumen. Qwen-VL mendukung input gambar, dan Qwen-Long mendukung input dokumen.

Bagaimana cara melihat penggunaan token dan jumlah panggilan?

Satu jam setelah Anda memanggil model, buka halaman Pemantauan Model. Atur kondisi kueri, seperti rentang waktu dan ruang kerja. Temukan model target di area Models dan klik Monitor di kolom Actions untuk melihat statistik panggilannya. Untuk informasi lebih lanjut, lihat Pemantauan penggunaan dan kinerja.

Data diperbarui setiap jam. Selama jam sibuk, pembaruan mungkin tertunda hingga satu jam.

Kode error

Jika terjadi error, lihat Pesan error untuk solusinya.