DeepSeek R1、DeepSeek V3、DeepSeek V3.1 API - Alibaba Cloud Model Studio

模型列表

deepseek-v3.2、deepseek-v3.2-exp與deepseek-v3.1（可通過參數控制回複前是否思考）

以上為混合思考模型，預設不開啟思考模式。deepseek-v3.2是DeepSeek推出的首個將思考融入工具使用的模型，同時支援思考模式與非思考模式的工具調用。

通過 enable_thinking 參數控制是否思考。
deepseek-r1（回複前總會思考）
- deepseek-r1-0528 於 2025 年 5月發布，是 2025年1月發布 deepseek-r1 的升級版模型。新版模型在複雜推理任務中的表現有了顯著提升；增加了推理過程中的思考深度，導致回應時間變長。
  
  阿里雲百鍊的 deepseek-r1 模型現已升級至 0528 版本。
- deepseek-r1-distill 系列模型是基於知識蒸餾技術，使用 deepseek-r1 產生的訓練樣本對 Qwen、Llama 等開源大模型進行微調訓練後得到的模型。
deepseek-v3（回複前不思考）

deepseek-v3 模型，在 14.8T token 上進行了預訓練，長文本、代碼、數學、百科、中文能力上表現優秀。

於2024年12月26日發布，非2025年3月24日發布版本。

思考模式下，模型會先思考再回複，通過reasoning_content欄位展示模型的思考步驟。相比於非思考模式，響應時間長度增加，但模型回複效果增強。

建議選擇 deepseek-v3.2 模型，該模型為 DeepSeek 最新模型，可按需選擇是否開啟思考模式，限流條件寬鬆，且價格低於 deepseek-v3.1。

模型名稱	上下文長度	最大輸入	最大思維鏈長度	最大回複長度
	（Token數）
deepseek-v3.2 685B 滿血版	131,072	98,304	32,768	65,536
deepseek-v3.2-exp 685B 滿血版
deepseek-v3.1 685B 滿血版
deepseek-r1 685B 滿血版				16,384
deepseek-r1-0528 685B 滿血版
deepseek-v3 671B 滿血版		131,072	-

蒸餾模型

模型名稱	上下文長度	最大輸入	最大思維鏈長度	最大回複長度
	（Token數）
deepseek-r1-distill-qwen-1.5b 基於 Qwen2.5-Math-1.5B	32,768	32,768	16,384	16,384
deepseek-r1-distill-qwen-7b 基於 Qwen2.5-Math-7B
deepseek-r1-distill-qwen-14b 基於 Qwen2.5-14B
deepseek-r1-distill-qwen-32b 基於 Qwen2.5-32B
deepseek-r1-distill-llama-8b 基於 Llama-3.1-8B
deepseek-r1-distill-llama-70b 基於 Llama-3.3-70B

最大思維鏈長度是模型在思考模式下，思考過程的最大 Token 數量。

以上模型非整合第三方服務，均部署在阿里雲百鍊伺服器上。

並發限流請參考DeepSeek 限流條件。

快速開始

deepseek-v3.2 是 DeepSeek 系列最新模型，支援通過enable_thinking參數設定思考與非思考模式。運行以下代碼快速調用思考模式的 deepseek-v3.2 模型。

需要已擷取API Key與API Host並完成配置API Key到環境變數（準備下線，併入配置 API Key）。如果通過SDK調用，需要安裝 OpenAI 或 DashScope SDK。

OpenAI相容

說明

enable_thinking非 OpenAI 標準參數，OpenAI Python SDK 通過 extra_body傳入，Node.js SDK 作為頂層參數傳入。

Python

範例程式碼

from openai import OpenAI
import os

# 初始化OpenAI用戶端
client = OpenAI(
    # 如果沒有配置環境變數，請用阿里雲百鍊API Key替換：api_key="sk-xxx"
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

messages = [{"role": "user", "content": "你是誰"}]
completion = client.chat.completions.create(
    model="deepseek-v3.2",
    messages=messages,
    # 通過 extra_body 設定 enable_thinking 開啟思考模式
    extra_body={"enable_thinking": True},
    stream=True,
    stream_options={
        "include_usage": True
    },
)

reasoning_content = ""  # 完整思考過程
answer_content = ""  # 完整回複
is_answering = False  # 是否進入回複階段
print("\n" + "=" * 20 + "思考過程" + "=" * 20 + "\n")

for chunk in completion:
    if not chunk.choices:
        print("\n" + "=" * 20 + "Token 消耗" + "=" * 20 + "\n")
        print(chunk.usage)
        continue

    delta = chunk.choices[0].delta

    # 只收集思考內容
    if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None:
        if not is_answering:
            print(delta.reasoning_content, end="", flush=True)
        reasoning_content += delta.reasoning_content

    # 收到content，開始進行回複
    if hasattr(delta, "content") and delta.content:
        if not is_answering:
            print("\n" + "=" * 20 + "完整回複" + "=" * 20 + "\n")
            is_answering = True
        print(delta.content, end="", flush=True)
        answer_content += delta.content

返回結果

====================思考過程====================

啊，使用者問我是誰。這是很常見的開場問題，需要簡單清晰地介紹自己的身份和功能。可以用公司背景和核心能力作為開頭，讓使用者快速建立認知。  
想到要突出免費屬性和文本特長，但避免過度展開細節。最後用開放性問題引導對話繼續，符合助手的服務性質。  
考慮用企業級AI助手作為定位描述，既專業又親切。括弧裡的Emoji可以適當增加親和力。
====================完整回複====================

你好！我是DeepSeek，由深度求索公司創造的AI助手。

我是一個純文字模型，雖然不支援多模態識別功能，但我有檔案上傳功能，可以幫你處理映像、txt、pdf、ppt、word、excel等各種檔案，從中讀取文字資訊來協助你。我完全免費使用，擁有128K的上下文長度，還支援連網搜尋功能（需要你在Web/App中手動開啟）。

我的知識截止到2024年7月，我會用熱情細膩的方式為你提供協助。你可以通過官方市集下載App來使用我。

有什麼問題我可以幫你解答嗎？無論是學習、工作還是生活上的疑問，我都很樂意協助你！✨
====================Token 消耗====================

CompletionUsage(completion_tokens=238, prompt_tokens=5, total_tokens=243, completion_tokens_details=CompletionTokensDetails(accepted_prediction_tokens=None, audio_tokens=None, reasoning_tokens=93, rejected_prediction_tokens=None), prompt_tokens_details=None)

Node.js

範例程式碼

import OpenAI from "openai";
import process from 'process';

// 初始化OpenAI用戶端
const openai = new OpenAI({
    // 如果沒有配置環境變數，請用阿里雲百鍊API Key替換：apiKey: "sk-xxx"
    apiKey: process.env.DASHSCOPE_API_KEY, 
    baseURL: 'https://dashscope.aliyuncs.com/compatible-mode/v1'
});

let reasoningContent = ''; // 完整思考過程
let answerContent = ''; // 完整回複
let isAnswering = false; // 是否進入回複階段

async function main() {
    try {
        const messages = [{ role: 'user', content: '你是誰' }];
        
        const stream = await openai.chat.completions.create({
            model: 'deepseek-v3.2',
            messages,
            // 注意：在 Node.js SDK，enable_thinking 這樣的非標準參數作為頂層屬性傳遞，無需放在 extra_body 中
            enable_thinking: true,
            stream: true,
            stream_options: {
                include_usage: true
            },
        });

        console.log('\n' + '='.repeat(20) + '思考過程' + '='.repeat(20) + '\n');

        for await (const chunk of stream) {
            if (!chunk.choices?.length) {
                console.log('\n' + '='.repeat(20) + 'Token 消耗' + '='.repeat(20) + '\n');
                console.log(chunk.usage);
                continue;
            }

            const delta = chunk.choices[0].delta;
            
            // 只收集思考內容
            if (delta.reasoning_content !== undefined && delta.reasoning_content !== null) {
                if (!isAnswering) {
                    process.stdout.write(delta.reasoning_content);
                }
                reasoningContent += delta.reasoning_content;
            }

            // 收到content，開始進行回複
            if (delta.content !== undefined && delta.content) {
                if (!isAnswering) {
                    console.log('\n' + '='.repeat(20) + '完整回複' + '='.repeat(20) + '\n');
                    isAnswering = true;
                }
                process.stdout.write(delta.content);
                answerContent += delta.content;
            }
        }
    } catch (error) {
        console.error('Error:', error);
    }
}

main();

返回結果

====================思考過程====================

啊，使用者問我是誰，這是很常見的開場問題。需要簡單清晰地介紹自己的身份和核心功能，避免過度展開。

可以用公司背景和基本定位作為開頭，再列舉幾個關鍵能力讓使用者快速瞭解我能做什麼。最後用開放性問題結束，方便使用者繼續提問。

想到要突出免費、長上下文和檔案處理這些實用特點，語氣保持友好但克制，不用Emoji。
====================完整回複====================

你好！我是DeepSeek，由深度求索公司創造的AI助手。

我是一個純文字模型，擁有128K的上下文處理能力，可以幫你解答各種問題、進行對話交流、協助處理文本任務等。雖然我不支援多模態識別功能，但我可以處理你上傳的映像、txt、pdf、ppt、word、excel等檔案，從中讀取文字資訊來協助你。

我完全免費使用，沒有語音功能，但你可以通過官方市集下載App來使用我。如果需要連網搜尋，記得在Web或App中手動點開連網搜尋按鍵哦。

我的知識截止到2024年7月，會以熱情細膩的方式為你提供協助。有什麼問題或需要協助的地方，儘管告訴我吧！我很樂意為你服務。✨
====================Token 消耗====================

{
  prompt_tokens: 5,
  completion_tokens: 243,
  total_tokens: 248,
  completion_tokens_details: { reasoning_tokens: 83 }
}

HTTP

範例程式碼

curl

curl -X POST https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
    "model": "deepseek-v3.2",
    "messages": [
        {
            "role": "user", 
            "content": "你是誰"
        }
    ],
    "stream": true,
    "stream_options": {
        "include_usage": true
    },
    "enable_thinking": true
}'

DashScope

Python

範例程式碼

import os
from dashscope import Generation

# 初始化請求參數
messages = [{"role": "user", "content": "你是誰？"}]

completion = Generation.call(
    # 如果沒有配置環境變數，請用阿里雲百鍊API Key替換：api_key="sk-xxx"
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    model="deepseek-v3.2",
    messages=messages,
    result_format="message",  # 設定結果格式為 message
    enable_thinking=True,
    stream=True,              # 開啟流式輸出
    incremental_output=True,  # 開啟增量輸出
)

reasoning_content = ""  # 完整思考過程
answer_content = ""     # 完整回複
is_answering = False    # 是否進入回複階段

print("\n" + "=" * 20 + "思考過程" + "=" * 20 + "\n")

for chunk in completion:
    message = chunk.output.choices[0].message
    # 只收集思考內容
    if "reasoning_content" in message:
        if not is_answering:
            print(message.reasoning_content, end="", flush=True)
        reasoning_content += message.reasoning_content

    # 收到 content，開始進行回複
    if message.content:
        if not is_answering:
            print("\n" + "=" * 20 + "完整回複" + "=" * 20 + "\n")
            is_answering = True
        print(message.content, end="", flush=True)
        answer_content += message.content

print("\n" + "=" * 20 + "Token 消耗" + "=" * 20 + "\n")
print(chunk.usage)

返回結果

====================思考過程====================

哦，使用者問我是誰，這是一個很基礎的自我介紹問題。需要簡潔清晰地說明身份和功能，避免複雜化。可以用公司背景和核心能力作為開頭，讓使用者快速建立認知。  
考慮到使用者可能是初次接觸，可以補充一些典型使用情境和特點，比如免費、長上下文、檔案處理等實用資訊。結尾加上開放式的協助邀請，保持友好態度。  
不需要過多技術細節，重點突出易用性和實用性。
====================完整回複====================

你好！我是DeepSeek，由深度求索公司創造的AI助手.

我是一個純文字模型，雖然不支援多模態識別功能，但我有檔案上傳功能，可以幫你處理映像、txt、pdf、ppt、word、excel等檔案，讀取其中的文字資訊進行分析處理。我完全免費使用，擁有128K的上下文處理能力，還支援連網搜尋功能（需要你手動點開連網搜尋按鍵）。

我的知識截止到2024年7月，會以熱情細膩的方式為你提供協助。你可以通過官方市集下載我的App來使用我。

有什麼問題或者需要協助的地方，儘管問我吧！我很樂意為你解答各種疑問，協助你處理各種任務。✨
====================Token 消耗====================

{"input_tokens": 6, "output_tokens": 240, "total_tokens": 246, "output_tokens_details": {"reasoning_tokens": 92}}

Java

範例程式碼

重要

DashScope Java SDK 版本需要不低於2.19.4。

// dashscope SDK的版本 >= 2.19.4
import com.alibaba.dashscope.aigc.generation.Generation;
import com.alibaba.dashscope.aigc.generation.GenerationParam;
import com.alibaba.dashscope.aigc.generation.GenerationResult;
import com.alibaba.dashscope.common.Message;
import com.alibaba.dashscope.common.Role;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.InputRequiredException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import io.reactivex.Flowable;
import java.lang.System;
import java.util.Arrays;

public class Main {
    private static StringBuilder reasoningContent = new StringBuilder();
    private static StringBuilder finalContent = new StringBuilder();
    private static boolean isFirstPrint = true;
    private static void handleGenerationResult(GenerationResult message) {
        String reasoning = message.getOutput().getChoices().get(0).getMessage().getReasoningContent();
        String content = message.getOutput().getChoices().get(0).getMessage().getContent();
        if (reasoning != null && !reasoning.isEmpty()) {
            reasoningContent.append(reasoning);
            if (isFirstPrint) {
                System.out.println("====================思考過程====================");
                isFirstPrint = false;
            }
            System.out.print(reasoning);
        }
        if (content != null && !content.isEmpty()) {
            finalContent.append(content);
            if (!isFirstPrint) {
                System.out.println("\n====================完整回複====================");
                isFirstPrint = true;
            }
            System.out.print(content);
        }
    }
    private static GenerationParam buildGenerationParam(Message userMsg) {
        return GenerationParam.builder()
                // 若沒有配置環境變數，請用阿里雲百鍊API Key將下行替換為：.apiKey("sk-xxx")
                .apiKey(System.getenv("DASHSCOPE_API_KEY"))
                .model("deepseek-v3.2")
                .enableThinking(true)
                .incrementalOutput(true)
                .resultFormat("message")
                .messages(Arrays.asList(userMsg))
                .build();
    }
    public static void streamCallWithMessage(Generation gen, Message userMsg)
            throws NoApiKeyException, ApiException, InputRequiredException {
        GenerationParam param = buildGenerationParam(userMsg);
        Flowable<GenerationResult> result = gen.streamCall(param);
        result.blockingForEach(message -> handleGenerationResult(message));
    }
    public static void main(String[] args) {
        try {
            Generation gen = new Generation();
            Message userMsg = Message.builder().role(Role.USER.getValue()).content("你是誰？").build();
            streamCallWithMessage(gen, userMsg);
        } catch (ApiException | NoApiKeyException | InputRequiredException e) {
            System.err.println("An exception occurred: " + e.getMessage());
        }
    }
}

返回結果

====================思考過程====================

唔，使用者問了一個簡單的自我介紹問題。這種問題很常見，需要快速清晰地表明身份和功能。考慮用輕鬆友好的語氣介紹自己是DeepSeek-V3，並說明由深度求索公司創造。可以加上能提供的協助類型，比如解答問題、聊天、學習輔導等，最後用Emoji增加親和力。不需要過多解釋，保持簡潔明了就好。
====================完整回複====================

DeepSeek-V3，一個由深度求索公司創造的智能助手！我可以協助你解答各種問題、提供建議、進行知識查詢，甚至陪你聊天！無論是學習、工作還是日常生活中的疑問，儘管問我吧~有什麼我可以幫你的嗎？

HTTP

範例程式碼

curl

curl -X POST "https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation" \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-H "X-DashScope-SSE: enable" \
-d '{
    "model": "deepseek-v3.2",
    "input":{
        "messages":[      
            {
                "role": "user",
                "content": "你是誰？"
            }
        ]
    },
    "parameters":{
        "enable_thinking": true,
        "incremental_output": true,
        "result_format": "message"
    }
}'

其它功能

模型	多輪對話	Function Calling	上下文緩衝	結構化輸出	首碼續寫
deepseek-v3.2	支援	支援	支援	不支援	不支援
deepseek-v3.2-exp	支援	支援僅支援非思考模式。	不支援	不支援	不支援
deepseek-v3.1	支援	支援僅支援非思考模式。	不支援	不支援	不支援
deepseek-r1	支援	支援	不支援	不支援	不支援
deepseek-r1-0528	支援	支援	不支援	不支援	不支援
deepseek-v3	支援	支援	不支援	不支援	不支援
蒸餾模型	支援	不支援	不支援	不支援	不支援

參數預設值

模型	temperature	top_p	repetition_penalty	presence_penalty	max_tokens	thinking_budget
deepseek-v3.2	1.0	0.95	-	-	65,536	32,768
deepseek-v3.2-exp	0.6	0.95	1.0	-	65,536	32,768
deepseek-v3.1	0.6	0.95	1.0	-	65,536	32,768
deepseek-r1	0.6	0.95	-	1	16,384	32,768
deepseek-r1-0528	0.6	0.95	-	1	16,384	32,768
蒸餾版	0.6	0.95	-	1	16,384	16,384
deepseek-v3	0.7	0.6	-	-	16,384	-

“-” 表示沒有預設值，也不支援設定。
deepseek-r1、deepseek-r1-0528、蒸餾版模型不支援設定以上參數值。
參數含義請參考OpenAI Chat。

計費說明

按照模型的輸入與輸出 Token 計費，價格詳情請參考模型列表與價格。

思考模式下，思維鏈按照輸出 Token 計費。

可以上傳圖片或文檔進行提問嗎？

DeepSeek 模型僅支援文本輸入，不支援輸入圖片或文檔。千問VL模型支援圖片輸入，Qwen-Long模型支援文檔輸入。

如何查看Token消耗量及調用次數？

模型調用完一小時後，在模型觀測版面設定查詢條件（例如，選擇時間範圍、業務空間等），再在模型列表地區找到目標模型並單擊操作列的監控，即可查看該模型的調用統計結果。具體請參見模型監控文檔。

資料按小時更新，高峰期可能有小時級延遲，請您耐心等待。

Alibaba Cloud Model Studio：DeepSeek大語言模型

模型列表

快速開始

OpenAI相容

Python

範例程式碼

返回結果

Node.js

範例程式碼

返回結果

HTTP

範例程式碼

curl

DashScope

Python

範例程式碼

返回結果

Java

範例程式碼

返回結果

HTTP

範例程式碼

curl

其它功能

參數預設值

計費說明

常見問題

可以上傳圖片或文檔進行提問嗎？

如何查看Token消耗量及調用次數？

錯誤碼