智能助手(小PAI)是基於大模型技術構建的 PAI 平台內建智能助手。深度整合於 PAI 各個子產品(如 DSW、DLC、EAS 等)的控制台介面,旨在通過智能診斷、產品問答、環境校正及售前方案推薦,降低 AI 開發門檻,提升使用者在資源管理、模型開發及部署過程中的營運效率。
核心功能
1. 智能診斷助手
小PAI 提供多維度自動化診斷能力,能夠快速定位資源運行異常或串連失敗的根因。
DSW問題診斷:
狀態異常診斷:針對 DSW 執行個體啟動失敗、停止失敗等狀態,自動識別“後付費規格無庫存”、“系統硬碟空間滿”等原因,並提供“一鍵切換規格”或“一鍵擴容”的便捷入口。
SSH 串連診斷:掃描使用者 VPC 配置、安全性群組 SSH 連接埠、執行個體
openssh-server狀態、sshd進程及config設定檔,解決串連不通的痛點。執行個體恢複中診斷:針對長時間處於恢複中狀態的執行個體進行問題診斷。
訓練任務問題診斷
Model Gallery任務診斷:支援訓練任務失敗狀態診斷。
DLC任務診斷:針對訓練任務失敗,任務長時間排隊等問題診斷
部署服務問題診斷
Model Gallery部署:支援訓練任務及部署任務的失敗狀態診斷。
EAS服務診斷:提供服務失敗狀態問題診斷。
控制台互動診斷:針對控制台彈窗報錯資訊提供通俗易懂的釋義與解決方案。
2. PAI 產品問答助手
降低使用者在產品使用初期的使用門檻,提供即時知識響應。
術語釋義:在建立資源等操作頁面,針對專業名詞提供即時釋義,協助使用者準確配置參數。
通用問答:基於 PAI 官方文件庫,回答產品操作、功能限制等通用諮詢。
3. PPU 支援助手
針對PPU算力資源提供專項支援。
環境與鏡像:自動完成 PPU 環境校正,並根據使用者需求推薦最匹配的 PPU 專用鏡像。
模型適配:智能推薦 Model Gallery 中已完成 PPU 適配最佳化的模型。
4. PAI 售前與方案助手
結合使用者業務情境,提供選型建議。
模型選型推薦:根據訓練或推理情境需求,智能推薦模型。
機型規格推薦:基於模型規模,推薦適配的機型規格。
PD分離配置推薦:根據使用者輸入的模型、GPU類型、I/O長度和SLO要求,自動計算並推薦最優的PD配比和並行策略。
產品優勢
原廠診斷邏輯:整合 PAI 專家級營運經驗,快速定位配置錯誤問題。
一鍵式修複:不僅發現問題,更針對庫存不足、系統硬碟用滿等高頻問題提供“一鍵擴容/換規格”的閉環能力。
感知使用者情境:具備感知使用者內容相關的能力,可根據使用者所處的子產品頁面,提供個人化的推薦問題及拒答策略。
使用方式
喚起小PAI:PAI控制台頁面點擊右下角的智能助手(小PAI)表徵圖。

輸入需求:
直接提問:如“為什麼我的 DSW 連不上 SSH?”
點擊報錯連結:當執行個體或任務運行失敗時,點擊報錯詳情頁中的小PAI icon,小PAI 將自動彈出並運行診斷邏輯。
執行操作建議:根據小PAI 提供的診斷報告,點擊“一鍵擴容”或查看“下一步操作建議”進行問題修複。
常見問題
如果診斷結果無法解決我的問題怎麼辦?
您可以在對話方塊中反饋診斷不準確,或聯絡官方支援人員人工介入。