Alibaba Cloud Linux 4 Agentic Edition,別名Agentic OS ,是阿里雲一款 Agent-first 作業系統,專為 AI Agent 設計
鏡像介紹
Agentic OS是阿里雲基於自研的作業系統Alibaba Cloud Linux為Agent設計的衍生作業系統,它提供Agent最佳的運行環境,提升阿里雲客戶使用Agent的體驗。Agentic OS完全相容 Alinux4 所有能力(核心最佳化、雲原生支援等),圍繞 Agent 的認知方式和工作模式,構建全新的OS架構。
層級 | 組件 | 說明 |
封裝互動層 | Copilot Shell(cosh) | 替代預設 Shell,支援自然語言 + bash 雙模互動 |
OS Skills | 內建技能包機制,Agent 通過 Skill 說明書與運行時層、基礎系統層互動獲得部署、營運、診斷、可觀測等"動手能力" | |
運行時層 | AgentSecCore | 從系統加固、沙箱隔離、Skill 簽名到隱私保護,構建 OS 級縱深安全防線,確保 Agent 在受控、可審計、最小許可權的環境中安全運行 |
AgentSight | 一款基於eBPF技術的 AI Agent 可觀測性工具,能夠在無侵入、零修改前提下,對運行在 Linux 系統上的 AI Agent 進行即時監控,捕獲其LLM API 呼叫、Token 消耗及進程行為。 | |
基礎系統層 | Alinux4 | 相容 Alinux4 所有能力(核心最佳化、雲原生支援等) |
適用範圍
Agentic OS 適用範圍說明:
適用於多種執行個體規格類型系列,包括ECS Bare Metal Instance。更多資訊,請參見執行個體規格類型系列。
僅支援X86的CPU架構
支援執行個體記憶體建議>=2GB
適用於各種 Agent 情境工作負載,包括 OpenClaw、CoPaw、Claude Code 等主流 Agent 架構
費用
Agentic OS 是免費的作業系統鏡像,但使用鏡像時,需要支付其他資源產生的費用,如大模型調用,vCPU、記憶體、儲存、公網頻寬和快照等。
核心優勢
極致Token經濟型
將複雜的OS專家知識封裝為標準化 Skill ,大幅減少執行環境理解以及試錯探索的Token開銷,實現從意圖到執行的零延遲閉環。自然語言重新定義人機互動
首次將 cosh(Copilot Shell)作為預設互動入口,使用者通過自然語言即可驅動作業系統完成環境部署、工具安裝等日常營運操作,告別複雜命令列記憶,帶來操作方式上的根本性變革。Skill 全鏈路安全加密,構築內生安全防線
對每個 Skill 實施數位簽章與加密保護,調用前強制身份鑒權與完整性校正,結合硬體級安全沙箱隔離異常行為,從 OS 核心層面確保 Agent 在受控、可審計、最小許可權的環境中安全運行。
核心組件簡介
Cosh(Copilot Shell)
Copilot Shell(cosh)是 Alibaba Cloud Linux 4 Agentic Edition 的預設互動式 Shell,替代 bash 作為系統登入後的第一入口。
cosh 的核心設計理念是「雙模互動」。自然語言模式下,使用者直接用中文或英文描述意圖,系統藉助大模型將其轉化為可執行檔系統操作;命令模式下,使用者可通過 ! 首碼快速執行 Shell 命令,或通過 /bash 回退到全功能互動式 bash。兩種模式自由混合,無需切換環境。
在保留完整 bash 相容性的基礎上,cosh 增加了自然語言理解、Skill 調用、MCP 工具整合和多級審批控制等能力。cosh 將複雜的系統級能力抽象為自然語言互動,又整合了OS Skills 說明書,降低了作業系統的使用門檻,使人類使用者和 Agent 智能體都能以簡單的方式驅動作業系統完成任務。
OS Skills
OS Skills是 Agentic OS 為 AI Agent 編寫的作業系統使用手冊。
傳統作業系統文檔面向人類使用者,依賴自然語言描述、截圖樣本和行業潛在共識。Agent 在閱讀這類文檔時,需要消耗大量 Token 進行理解。OS Skills 說明書將作業系統知識重新組織為 Agent 可直接理解和執行的結構化格式——SKILL,Agent 不再需要「讀懂文檔再操作」,而是「讀到即能做」。
OS Skills 說明書已覆蓋兩大領域:
說明書領域 | 對應知識域 | 覆蓋內容 |
system-admin | 系統管理 | 使用者與許可權管理、系統服務管理、核心升級等基礎系統管理操作 |
security | 系統安全 | 系統安全基準檢查、漏洞掃描與修複等 |
system-ops | 系統營運 | 提供Linux常見效能以及穩定性問題的診斷能力 |
Agent 在接收到使用者意圖後,自動匹配對應的 Skill 並執行,無需人工指定調用路徑。
AgentSecCore
AgentSecCore是面向 AI Agent 運行平台的作業系統級安全核心。在 AI Agent 逐步獲得作業系統層級的執行能力(包括檔案讀寫、網路訪問、進程管理等)的背景下,傳統應用安全邊界已不再適用。AgentSecCore 從 OS 層面為 Agent 構建縱深防禦體系,確保 Agent 在受控、可審計、最小許可權的環境中安全運行。
AgentSecCore 作為所有業務 Skill 之上的安全監督層運行,目前採用四階段縱深防禦架構,從底層作業系統到上層應用逐層加固,架構自下而上為:
層級 | 防護能力 | 技術實現 |
Phase 1 | Skill資產完整性校正 | PGP 簽名 + SHA256 雜湊 + Manifest |
Phase 2 | 系統隱私資訊保護 | SKILL 規則 + DLP |
Phase 3 | 系統安全強化 | LoongShield seharden 基準掃描與加固 |
Phase 4 | 沙箱隔離 | Bubblewrap + Landlock + seccomp |
AgentSight
AgentSight 是面向 AI Agent 運行平台的作業系統級可觀測組件。儘管 AI Agent 的能力不斷增強,其在實際運行中也暴露出Token 消耗常遠超使用者預期的問題:一次看似簡單的對話,背後可能觸發了多輪工具調用與上下文重組, Token 開銷可達使用者直覺估計的數倍乃至數十倍,而使用者卻缺乏有效感知與追溯手段。
為此,Agentsight 構建了一套完整的 Agent 可觀測性體系。該方案在零侵入商務邏輯的前提下,實現了對 Agent 運行全鏈路的細粒度資料擷取與關聯分析。這不僅協助開發人員清晰還原互動軌跡,更能支撐對 Token 消耗的精準歸因及異常行為的快速定位。
Agentsight主要包含以下能力:
Token消耗分析:對 Agent 運行過程中的 Token 消耗進行全方位度量與歸因。支援按時間段或最近 N 小時靈活查詢,可自動環比對比。支援按智能體、任務、角色等多維度拆分消耗來源,分析粒度可精確至單次 LLM 調用。
行為審計:對 Agent 的 LLM 調用及進程執行行為的全鏈路記錄與追蹤。在資料擷取中,完整留存每次 LLM 調用的供應商、模型版本等關鍵中繼資料,並同步捕獲進程的命令列參數。此外,系統支援按時間維度、進程標識及事件類型進行多維度靈活篩選,並提供可視化的匯總統計分析能力。