全部產品
Search
文件中心

Alibaba Cloud Model Studio:DeepSeek大語言模型

更新時間:Dec 05, 2025

本文檔介紹如何在阿里雲百鍊平台通過OpenAI相容介面或DashScope SDK調用DeepSeek系列模型。

重要

本文檔僅適用於“中國大陸(北京)”地區。如需使用模型,需使用“中國大陸(北京)”地區的API Key

模型列表

  • deepseek-v3.2、deepseek-v3.2-exp與deepseek-v3.1(可通過參數控制回複前是否思考

    以上為混合思考模型,預設不開啟思考模式。deepseek-v3.2是DeepSeek推出的首個將思考融入工具使用的模型,同時支援思考模式與非思考模式的工具調用。

    通過 enable_thinking 參數控制是否思考。
  • deepseek-r1(回複前總會思考)

    • deepseek-r1-0528 於 2025 年 5月發布,是 2025年1月發布 deepseek-r1 的升級版模型。新版模型在複雜推理任務中的表現有了顯著提升;增加了推理過程中的思考深度,導致回應時間變長。

      阿里雲百鍊的 deepseek-r1 模型現已升級至 0528 版本。
    • deepseek-r1-distill 系列模型是基於知識蒸餾技術,使用 deepseek-r1 產生的訓練樣本對 Qwen、Llama 等開源大模型進行微調訓練後得到的模型。

  • deepseek-v3(回複前不思考)

    deepseek-v3 模型,在 14.8T token 上進行了預訓練,長文本、代碼、數學、百科、中文能力上表現優秀。

    於2024年12月26日發布,非2025年3月24日發布版本。

思考模式下,模型會先思考再回複,通過reasoning_content欄位展示模型的思考步驟。相比於非思考模式,響應時間長度增加,但模型回複效果增強。

建議選擇 deepseek-v3.2 模型,該模型為 DeepSeek 最新模型,可按需選擇是否開啟思考模式,限流條件寬鬆,且價格低於 deepseek-v3.1。

模型名稱

上下文長度

最大輸入

最大思維鏈長度

最大回複長度

(Token數)

deepseek-v3.2

685B 滿血版

131,072

98,304

32,768

65,536

deepseek-v3.2-exp

685B 滿血版

deepseek-v3.1

685B 滿血版

deepseek-r1

685B 滿血版

16,384

deepseek-r1-0528

685B 滿血版

deepseek-v3

671B 滿血版

131,072

-

蒸餾模型

模型名稱

上下文長度

最大輸入

最大思維鏈長度

最大回複長度

(Token數)

deepseek-r1-distill-qwen-1.5b

基於 Qwen2.5-Math-1.5B

32,768

32,768

16,384

16,384

deepseek-r1-distill-qwen-7b

基於 Qwen2.5-Math-7B

deepseek-r1-distill-qwen-14b

基於 Qwen2.5-14B

deepseek-r1-distill-qwen-32b

基於 Qwen2.5-32B

deepseek-r1-distill-llama-8b

基於 Llama-3.1-8B

deepseek-r1-distill-llama-70b

基於 Llama-3.3-70B
最大思維鏈長度是模型在思考模式下,思考過程的最大 Token 數量。
以上模型非整合第三方服務,均部署在阿里雲百鍊伺服器上。
並發限流請參考DeepSeek 限流條件

快速開始

deepseek-v3.2 是 DeepSeek 系列最新模型,支援通過enable_thinking參數設定思考與非思考模式。運行以下代碼快速調用思考模式的 deepseek-v3.2 模型。

需要已擷取與配置 API Key並完成配置API Key到環境變數(準備下線,併入配置 API Key)。如果通過SDK調用,需要安裝 OpenAI 或 DashScope SDK

OpenAI相容

說明

enable_thinking非 OpenAI 標準參數,OpenAI Python SDK 通過 extra_body傳入,Node.js SDK 作為頂層參數傳入。

Python

範例程式碼

from openai import OpenAI
import os

# 初始化OpenAI用戶端
client = OpenAI(
    # 如果沒有配置環境變數,請用阿里雲百鍊API Key替換:api_key="sk-xxx"
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

messages = [{"role": "user", "content": "你是誰"}]
completion = client.chat.completions.create(
    model="deepseek-v3.2",
    messages=messages,
    # 通過 extra_body 設定 enable_thinking 開啟思考模式
    extra_body={"enable_thinking": True},
    stream=True,
    stream_options={
        "include_usage": True
    },
)

reasoning_content = ""  # 完整思考過程
answer_content = ""  # 完整回複
is_answering = False  # 是否進入回複階段
print("\n" + "=" * 20 + "思考過程" + "=" * 20 + "\n")

for chunk in completion:
    if not chunk.choices:
        print("\n" + "=" * 20 + "Token 消耗" + "=" * 20 + "\n")
        print(chunk.usage)
        continue

    delta = chunk.choices[0].delta

    # 只收集思考內容
    if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None:
        if not is_answering:
            print(delta.reasoning_content, end="", flush=True)
        reasoning_content += delta.reasoning_content

    # 收到content,開始進行回複
    if hasattr(delta, "content") and delta.content:
        if not is_answering:
            print("\n" + "=" * 20 + "完整回複" + "=" * 20 + "\n")
            is_answering = True
        print(delta.content, end="", flush=True)
        answer_content += delta.content

返回結果

====================思考過程====================

啊,使用者問我是誰。這是很常見的開場問題,需要簡單清晰地介紹自己的身份和功能。可以用公司背景和核心能力作為開頭,讓使用者快速建立認知。  
想到要突出免費屬性和文本特長,但避免過度展開細節。最後用開放性問題引導對話繼續,符合助手的服務性質。  
考慮用企業級AI助手作為定位描述,既專業又親切。括弧裡的Emoji可以適當增加親和力。
====================完整回複====================

你好!我是DeepSeek,由深度求索公司創造的AI助手。

我是一個純文字模型,雖然不支援多模態識別功能,但我有檔案上傳功能,可以幫你處理映像、txt、pdf、ppt、word、excel等各種檔案,從中讀取文字資訊來協助你。我完全免費使用,擁有128K的上下文長度,還支援連網搜尋功能(需要你在Web/App中手動開啟)。

我的知識截止到2024年7月,我會用熱情細膩的方式為你提供協助。你可以通過官方市集下載App來使用我。

有什麼問題我可以幫你解答嗎?無論是學習、工作還是生活上的疑問,我都很樂意協助你!✨
====================Token 消耗====================

CompletionUsage(completion_tokens=238, prompt_tokens=5, total_tokens=243, completion_tokens_details=CompletionTokensDetails(accepted_prediction_tokens=None, audio_tokens=None, reasoning_tokens=93, rejected_prediction_tokens=None), prompt_tokens_details=None)

Node.js

範例程式碼

import OpenAI from "openai";
import process from 'process';

// 初始化OpenAI用戶端
const openai = new OpenAI({
    // 如果沒有配置環境變數,請用阿里雲百鍊API Key替換:apiKey: "sk-xxx"
    apiKey: process.env.DASHSCOPE_API_KEY, 
    baseURL: 'https://dashscope.aliyuncs.com/compatible-mode/v1'
});

let reasoningContent = ''; // 完整思考過程
let answerContent = ''; // 完整回複
let isAnswering = false; // 是否進入回複階段

async function main() {
    try {
        const messages = [{ role: 'user', content: '你是誰' }];
        
        const stream = await openai.chat.completions.create({
            model: 'deepseek-v3.2',
            messages,
            // 注意:在 Node.js SDK,enable_thinking 這樣的非標準參數作為頂層屬性傳遞,無需放在 extra_body 中
            enable_thinking: true,
            stream: true,
            stream_options: {
                include_usage: true
            },
        });

        console.log('\n' + '='.repeat(20) + '思考過程' + '='.repeat(20) + '\n');

        for await (const chunk of stream) {
            if (!chunk.choices?.length) {
                console.log('\n' + '='.repeat(20) + 'Token 消耗' + '='.repeat(20) + '\n');
                console.log(chunk.usage);
                continue;
            }

            const delta = chunk.choices[0].delta;
            
            // 只收集思考內容
            if (delta.reasoning_content !== undefined && delta.reasoning_content !== null) {
                if (!isAnswering) {
                    process.stdout.write(delta.reasoning_content);
                }
                reasoningContent += delta.reasoning_content;
            }

            // 收到content,開始進行回複
            if (delta.content !== undefined && delta.content) {
                if (!isAnswering) {
                    console.log('\n' + '='.repeat(20) + '完整回複' + '='.repeat(20) + '\n');
                    isAnswering = true;
                }
                process.stdout.write(delta.content);
                answerContent += delta.content;
            }
        }
    } catch (error) {
        console.error('Error:', error);
    }
}

main();

返回結果

====================思考過程====================

啊,使用者問我是誰,這是很常見的開場問題。需要簡單清晰地介紹自己的身份和核心功能,避免過度展開。

可以用公司背景和基本定位作為開頭,再列舉幾個關鍵能力讓使用者快速瞭解我能做什麼。最後用開放性問題結束,方便使用者繼續提問。

想到要突出免費、長上下文和檔案處理這些實用特點,語氣保持友好但克制,不用Emoji。
====================完整回複====================

你好!我是DeepSeek,由深度求索公司創造的AI助手。

我是一個純文字模型,擁有128K的上下文處理能力,可以幫你解答各種問題、進行對話交流、協助處理文本任務等。雖然我不支援多模態識別功能,但我可以處理你上傳的映像、txt、pdf、ppt、word、excel等檔案,從中讀取文字資訊來協助你。

我完全免費使用,沒有語音功能,但你可以通過官方市集下載App來使用我。如果需要連網搜尋,記得在Web或App中手動點開連網搜尋按鍵哦。

我的知識截止到2024年7月,會以熱情細膩的方式為你提供協助。有什麼問題或需要協助的地方,儘管告訴我吧!我很樂意為你服務。✨
====================Token 消耗====================

{
  prompt_tokens: 5,
  completion_tokens: 243,
  total_tokens: 248,
  completion_tokens_details: { reasoning_tokens: 83 }
}

HTTP

範例程式碼

curl

curl -X POST https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
    "model": "deepseek-v3.2",
    "messages": [
        {
            "role": "user", 
            "content": "你是誰"
        }
    ],
    "stream": true,
    "stream_options": {
        "include_usage": true
    },
    "enable_thinking": true
}'

DashScope

Python

範例程式碼

import os
from dashscope import Generation

# 初始化請求參數
messages = [{"role": "user", "content": "你是誰?"}]

completion = Generation.call(
    # 如果沒有配置環境變數,請用阿里雲百鍊API Key替換:api_key="sk-xxx"
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    model="deepseek-v3.2",
    messages=messages,
    result_format="message",  # 設定結果格式為 message
    enable_thinking=True,
    stream=True,              # 開啟流式輸出
    incremental_output=True,  # 開啟增量輸出
)

reasoning_content = ""  # 完整思考過程
answer_content = ""     # 完整回複
is_answering = False    # 是否進入回複階段

print("\n" + "=" * 20 + "思考過程" + "=" * 20 + "\n")

for chunk in completion:
    message = chunk.output.choices[0].message
    # 只收集思考內容
    if "reasoning_content" in message:
        if not is_answering:
            print(message.reasoning_content, end="", flush=True)
        reasoning_content += message.reasoning_content

    # 收到 content,開始進行回複
    if message.content:
        if not is_answering:
            print("\n" + "=" * 20 + "完整回複" + "=" * 20 + "\n")
            is_answering = True
        print(message.content, end="", flush=True)
        answer_content += message.content

print("\n" + "=" * 20 + "Token 消耗" + "=" * 20 + "\n")
print(chunk.usage)

返回結果

====================思考過程====================

哦,使用者問我是誰,這是一個很基礎的自我介紹問題。需要簡潔清晰地說明身份和功能,避免複雜化。可以用公司背景和核心能力作為開頭,讓使用者快速建立認知。  
考慮到使用者可能是初次接觸,可以補充一些典型使用情境和特點,比如免費、長上下文、檔案處理等實用資訊。結尾加上開放式的協助邀請,保持友好態度。  
不需要過多技術細節,重點突出易用性和實用性。
====================完整回複====================

你好!我是DeepSeek,由深度求索公司創造的AI助手.

我是一個純文字模型,雖然不支援多模態識別功能,但我有檔案上傳功能,可以幫你處理映像、txt、pdf、ppt、word、excel等檔案,讀取其中的文字資訊進行分析處理。我完全免費使用,擁有128K的上下文處理能力,還支援連網搜尋功能(需要你手動點開連網搜尋按鍵)。

我的知識截止到2024年7月,會以熱情細膩的方式為你提供協助。你可以通過官方市集下載我的App來使用我。

有什麼問題或者需要協助的地方,儘管問我吧!我很樂意為你解答各種疑問,協助你處理各種任務。✨
====================Token 消耗====================

{"input_tokens": 6, "output_tokens": 240, "total_tokens": 246, "output_tokens_details": {"reasoning_tokens": 92}}

Java

範例程式碼

重要

DashScope Java SDK 版本需要不低於2.19.4。

// dashscope SDK的版本 >= 2.19.4
import com.alibaba.dashscope.aigc.generation.Generation;
import com.alibaba.dashscope.aigc.generation.GenerationParam;
import com.alibaba.dashscope.aigc.generation.GenerationResult;
import com.alibaba.dashscope.common.Message;
import com.alibaba.dashscope.common.Role;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.InputRequiredException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import io.reactivex.Flowable;
import java.lang.System;
import java.util.Arrays;

public class Main {
    private static StringBuilder reasoningContent = new StringBuilder();
    private static StringBuilder finalContent = new StringBuilder();
    private static boolean isFirstPrint = true;
    private static void handleGenerationResult(GenerationResult message) {
        String reasoning = message.getOutput().getChoices().get(0).getMessage().getReasoningContent();
        String content = message.getOutput().getChoices().get(0).getMessage().getContent();
        if (reasoning != null && !reasoning.isEmpty()) {
            reasoningContent.append(reasoning);
            if (isFirstPrint) {
                System.out.println("====================思考過程====================");
                isFirstPrint = false;
            }
            System.out.print(reasoning);
        }
        if (content != null && !content.isEmpty()) {
            finalContent.append(content);
            if (!isFirstPrint) {
                System.out.println("\n====================完整回複====================");
                isFirstPrint = true;
            }
            System.out.print(content);
        }
    }
    private static GenerationParam buildGenerationParam(Message userMsg) {
        return GenerationParam.builder()
                // 若沒有配置環境變數,請用阿里雲百鍊API Key將下行替換為:.apiKey("sk-xxx")
                .apiKey(System.getenv("DASHSCOPE_API_KEY"))
                .model("deepseek-v3.2")
                .enableThinking(true)
                .incrementalOutput(true)
                .resultFormat("message")
                .messages(Arrays.asList(userMsg))
                .build();
    }
    public static void streamCallWithMessage(Generation gen, Message userMsg)
            throws NoApiKeyException, ApiException, InputRequiredException {
        GenerationParam param = buildGenerationParam(userMsg);
        Flowable<GenerationResult> result = gen.streamCall(param);
        result.blockingForEach(message -> handleGenerationResult(message));
    }
    public static void main(String[] args) {
        try {
            Generation gen = new Generation();
            Message userMsg = Message.builder().role(Role.USER.getValue()).content("你是誰?").build();
            streamCallWithMessage(gen, userMsg);
        } catch (ApiException | NoApiKeyException | InputRequiredException e) {
            System.err.println("An exception occurred: " + e.getMessage());
        }
    }
}

返回結果

====================思考過程====================

唔,使用者問了一個簡單的自我介紹問題。這種問題很常見,需要快速清晰地表明身份和功能。考慮用輕鬆友好的語氣介紹自己是DeepSeek-V3,並說明由深度求索公司創造。可以加上能提供的協助類型,比如解答問題、聊天、學習輔導等,最後用Emoji增加親和力。不需要過多解釋,保持簡潔明了就好。
====================完整回複====================

DeepSeek-V3,一個由深度求索公司創造的智能助手!我可以協助你解答各種問題、提供建議、進行知識查詢,甚至陪你聊天!無論是學習、工作還是日常生活中的疑問,儘管問我吧~有什麼我可以幫你的嗎?

HTTP

範例程式碼

curl

curl -X POST "https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation" \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-H "X-DashScope-SSE: enable" \
-d '{
    "model": "deepseek-v3.2",
    "input":{
        "messages":[      
            {
                "role": "user",
                "content": "你是誰?"
            }
        ]
    },
    "parameters":{
        "enable_thinking": true,
        "incremental_output": true,
        "result_format": "message"
    }
}'

其它功能

模型

多輪對話

Function Calling

結構化輸出

首碼續寫

上下文緩衝

deepseek-v3.2

支援

支援

不支援

不支援

不支援

deepseek-v3.2-exp

支援

支援

僅支援非思考模式。

不支援

不支援

不支援

deepseek-v3.1

支援

支援

僅支援非思考模式。

不支援

不支援

不支援

deepseek-r1

支援

支援

不支援

不支援

不支援

deepseek-r1-0528

支援

支援

不支援

不支援

不支援

deepseek-v3

支援

支援

不支援

不支援

不支援

蒸餾模型

支援

不支援

不支援

不支援

不支援

參數預設值

模型

temperature

top_p

repetition_penalty

presence_penalty

deepseek-v3.2

1.0

0.95

-

-

deepseek-v3.2-exp

0.6

0.95

1.0

-

deepseek-v3.1

0.6

0.95

1.0

-

deepseek-r1

0.6

0.95

-

1

deepseek-r1-0528

0.6

0.95

-

1

蒸餾版

0.6

0.95

-

1

deepseek-v3

0.7

0.6

-

-

  • “-” 表示沒有預設值,也不支援設定。

  • deepseek-r1、deepseek-r1-0528、蒸餾版模型不支援設定以上參數值。

計費說明

按照模型的輸入與輸出 Token 計費,價格詳情請參考模型列表與價格

思考模式下,思維鏈按照輸出 Token 計費。

常見問題

可以上傳圖片或文檔進行提問嗎

DeepSeek 模型僅支援文本輸入,不支援輸入圖片或文檔。通義千問VL模型支援圖片輸入,Qwen-Long模型支援文檔輸入。

如何查看Token消耗調用次數?

模型調用完一小時後,在模型觀測版面設定查詢條件(例如,選擇時間範圍、業務空間等),再在模型列表地區找到目標模型並單擊操作列的監控,即可查看該模型的調用統計結果。具體請參見用量與效能觀測文檔。

資料按小時更新,高峰期可能有小時級延遲,請您耐心等待。

image

錯誤碼

如果執行報錯,請參見錯誤資訊進行解決。