LangStudio 提供了一個直觀、高效的整合式開發環境,可在此構建、調試和最佳化由大語言模型、Python節點及其他工具組成的應用流。
快速開始
參見建立工作流程應用。
建立方式說明
從模板建立:提供多情境的應用模板快速搭建AI應用。
按類型建立:
標準型:適用於跨平台 app程式開發。利用大語言模型的強大功能、定製的Python代碼等來打造您的定製化應用流。
對話型:適用於對話型應用程式開發。在標準型的基礎上,對話型提供對話歷史、輸入、輸出的管理,以及對話方塊形式的測試介面。
從OSS匯入:選擇待匯入的應用流ZIP壓縮包檔案或應用流OSS路徑,該路徑必須直接包含應用流的flow.dag.yaml及其他Code檔案。
可通過LangStudio應用流列表操作列的匯出功能將應用流匯出,分享給他人匯入使用。
將Dify的DSL檔案轉換LangStudio應用流格式後,可通過該方式匯入。
配置環境變數
在 LangStudio 中,您可以添加應用流程執行時所需的環境變數,系統會在應用流執行前自動載入這些變數,供 Python 節點、工具調用或自訂邏輯使用。
適用情境
敏感資訊管理:儲存 API 金鑰、認證令牌等,避免寫入程式碼在代碼中。
配置參數化:靈活設定模型地址、逾時時間等運行參數。
配置與使用
在應用流編輯頁面,單擊右上方设置,添加環境變數。

在Python節點中,可通過標準 Python 的
os.environ訪問已配置的環境變數:import os # 樣本:擷取 API 金鑰 api_key = os.environ["OPENAI_API_KEY"]
配置語音互動
在應用流編輯頁面,單擊右上方设置,在全局配置頁簽進行語音互動設定。
語音轉文字
語音轉文字功能可將使用者的語音輸入轉換為文本,並作為開始節點中標識為“對話輸入”欄位的輸入內容。

配置參數 | 說明 |
模型設定 | 選擇已配置的模型服務串連和 ASR 模型。目前支援 Paraformer 系列模型。 |
識別語言 | 設定語音辨識的語言。當前僅 paraformer-v2 模型支援指定識別語言。 |
文字轉語音
文字轉語音功能可將工作流程的對話輸出自動合成為語音。

配置參數 | 說明 |
模型設定 | 選擇已配置的模型服務串連和 TTS 模型。目前支援 CosyVoice 系列模型。 |
音色設定 | 選擇合成語音的音色。支援多種預置音色。 |
自動播放 | 開啟後,對話時合成的語音會自動播放。 |
部署調用
部署至PAI-EAS後,您可以通過API調用實現語音互動功能。關於通用的API調用方式,請參見應用流部署。本節重點說明語音互動相關的差異部分。
語音輸入
在請求體中添加system.audio_input欄位傳入音頻檔案 URL(檔案資料結構可參考檔案類型輸入輸出),系統會自動將音頻轉換為文本並填入對話輸入欄位。
{
"question": "",
"system": {
"audio_input": {
"source_uri": "oss://your-bucket.oss-cn-hangzhou.aliyuncs.com/audio/input.wav"
}
}
}語音輸出
如需擷取 TTS 合成的音頻資料,請使用完整模式(<Endpoint>/run端點)進行調用,簡單模式不返迴音頻資料。
欄位 | 說明 |
audio_data | Base64編碼的音頻資料片段,需在用戶端解碼後拼接播放 |
tts_metadata | 音頻中繼資料,包含格式(pcm)、採樣率(22050Hz)、聲道數(1)、位深(16bit) |
流式響應
TTS音頻通過SSE事件流中的TTSOutput事件返回:
{
"event": "TTSOutput",
"audio_data": "<base64編碼的音頻資料>",
"tts_metadata": {
"format": "pcm",
"sample_rate": 22050,
"channels": 1,
"bit_depth": 16
}
}非流式響應
TTS音頻作為output.tts_audio欄位包含在JSON響應中:
{
"output": {
"answer": "xxx",
"tts_audio": {
"audio_data": "<base64編碼的完整音頻資料>",
"tts_metadata": {
"format": "pcm",
"sample_rate": 22050,
"channels": 1,
"bit_depth": 16
}
}
}
}預置組件說明
詳情請參見工作流程節點參考。
下一步
在完成應用流的開發和調試後,您可以對應用流進行評測,待滿足業務需求後,您可以將應用流部署至模型線上服務PAI-EAS中供生產使用。