LangStudio是一個可視化大模型應用開發平台,提供知識庫、連網搜尋、智能體(Agent)等多種預置組件,支援從開發、調試到一鍵部署的完整流程,協助企業快速構建生產級AI應用。
產品功能架構
應用流開發:允許開發人員以圖形化方式構建大模型應用。
效能調優:提供線上調試與調用鏈追蹤能力,協助開發人員快速識別瓶頸與異常,提升應用穩定性與響應效率。
互動式運行:在開發介面提供交談視窗,開發人員可以即時輸入問題並查看應用輸出,快速驗證應用邏輯是否符合預期。
調用鏈分析:以可視化調用鏈(Trace)形式展示每個節點的輸入、輸出、耗時與錯誤記錄檔,便於定位延遲來源或邏輯缺陷。
應用流部署:支援將調試完成的應用流快速發布為線上API服務,並提供部署後的可觀測性支援。
一鍵部署:將應用流一鍵部署至PAI-EAS(模型線上服務),自動產生RESTful API,支援身份認證與流量控制。
線上觀測:服務部署後,可查看請求詳情、調用鏈路與作業記錄,持續監控服務健康狀態並輔助故障排查。
產品優勢
無縫對接PAI生態:提供從模型調用、代碼開發、批量評測到彈性部署的一站式解決方案,全面支援AI應用從概念驗證(POC)快速走向生產部署。
生產級監控與調優能力:深度整合阿里雲可觀測鏈路OpenTelemetry版和Log ServiceSLS,提供完整的調用鏈追蹤和效能分析能力。
企業級安全與穩定保障:通過VPC內網隔離、基於角色的精微調權限控制和專屬資源部署等保障企業級應用的高可用性與安全性。
適用情境
企業級RAG應用
針對專業領域知識更新頻繁、通用大模型回答準確性不足的問題,結合企業私人知識庫構建檢索增強產生(RAG)應用,提升問答結果的專業性與時效性。
動態知識更新:內建資料同步工具,支援配置定時任務,自動化更新知識庫索引,確保模型回答的時效性。
安全與隱私保障:確保企業資料在模型訓練和推理過程中的安全與隔離,嚴格遵循資料隱私法規和內部審計要求。
NL2SQL智能BI助手
非技術人員難以編寫SQL查詢,導致資料分析效率低下。通過自然語言描述資料需求,自動轉換為結構化SQL語句,降低使用門檻,提升報表產生速度。
智能查詢產生:理解使用者的自然語言意圖,產生對應資料庫文法的SQL語句。
自動化報表產生:基於查詢結果,自動組建圖表或資料報表。
資料洞察與建議:基於歷史資料分析,提供智能化的業務洞察和決策建議。
多模態Chat Agent
支援整合語音辨識、映像理解等模型,構建能夠處理多模態輸入的智能體 (Agent)。通過內建的狀態管理和工具調用節點,可實現複雜的任務流轉。
地區限制
目前LangStudio支援在以下地區使用:華東1(杭州)、華東2(上海)、華北2(北京)、華北6(烏蘭察布)、華南1(深圳)、中國(香港)、新加坡、日本(東京)、德國(法蘭克福)、美國(維吉尼亞)。為降低延遲,建議選擇靠近您業務資料來源或目標使用者的地區。
計費說明
LangStudio 平台本身免費,但其運行依賴的底層雲產品將按各自的標準單獨計費,包括Object Storage Service(用於儲存工作檔案)、可觀測鏈路OpenTelemetry版(用於調用鏈追蹤)、Log ServiceSLS(用於日誌採集)以及PAI-EAS(用於服務部署)等。費用詳情請參見大模型應用開發(LangStudio)計費說明。
使用流程
應用開發與部署流程如下:
首次使用LangStudio需開通相關雲產品服務並完成服務角色授權,詳情請參見雲產品依賴與授權:LangStudio。
以下步驟示範如何基於阿里雲百鍊模型服務建立一個簡單的對話應用。
建立模型服務串連。在頁面,單擊建立串連,連線類型選擇百鍊大模型服務,按照頁面提示前往阿里雲百鍊控制台準備工作:擷取與配置 API Key。
建立應用流。在應用流頁面,單擊建立應用流,建立方式選擇按類型建立,選擇對話型。並選擇一個OSS Bucket作為工作路徑,用來儲存應用流的代碼和相關檔案。
編輯應用流。進入應用流詳情頁面,單擊大模型節點,選擇步驟1建立的阿里雲百鍊模型服務串連,並根據情境選擇一個模型,例如
qwen-max。綁定運行時並調試。調試前,需為應用流建立並綁定一個運行時(為應用提供調試運行環境)。
在畫布左上方的下拉式功能表中,選擇一個已有運行時,或單擊建立運行時。
運行時綁定成功後,單擊運行,在對話方塊中,輸入問題。輸出內容下方可以查看鏈路和日誌,對應用流進行反覆式開發法、問題診斷與效能調優。

部署至PAI-EAS。單擊右上方部署,選擇合適的部署資源,並配置專用網路。
說明因阿里雲百鍊的模型服務需通過公網訪問,而PAI-EAS服務預設無法訪問公網,故需通過VPC與NAT Gateway讓PAI-EAS服務訪問公網。
測試服務API。部署成功後,跳轉到PAI-EAS服務詳情頁面,在線上調試頁簽下配置並發送請求。請求體樣本:
{"question":"3+9等於幾"}。更多調用方式參見調用服務。重要請求體中的Key(本例中為
question)需與應用流開始節點中定義的輸入參數名一致。