Alibaba Cloud Linux 4 Agentic Edition(別名:Agentic OS)は、Alibaba Cloud が AI Agent 向けに設計した「Agent-first」をコンセプトとしたオペレーティングシステムです。
イメージ概要
Agentic OS は、Alibaba Cloud 独自の Alibaba Cloud Linux を基盤とする、AI Agent 専用の派生型オペレーティングシステムです。Alibaba Cloud 上における Agent の最適な実行環境を提供します。Agentic OS は、カーネル最適化やクラウドネイティブ対応など、Alinux4 のすべての機能と完全互換であり、さらに Agent の認知・操作パターンに着目した新たな OS アーキテクチャを導入しています。
レイヤー | コンポーネント | 説明 |
インタラクションレイヤー | Copilot Shell (cosh) | デフォルトシェルを置き換え、自然言語および bash の両モードでのインタラクションをサポートします。 |
OS Skills | 内蔵スキルパッケージ機構です。Agent はスキルマニフェストを用いて、ランタイムおよびベースシステムレイヤーと連携し、デプロイメント、運用・保守(O&M)、診断、可観測性の各タスクを実行します。 | |
ランタイムレイヤー | AgentSecCore | システム強化、サンドボックス隔離、スキル署名、プライバシー保護により、OS レベルで多層防御アーキテクチャを構築し、Agent が制御可能・監査可能・最小権限の環境で安全に実行されることを保証します。 |
AgentSight | AI Agent 向けの eBPF ベース可観測性ツールです。Linux システム上で AI Agent をリアルタイムで非侵入型にモニターし、LLM API 呼び出し、Token 消費量、プロセス動作をコード変更や侵入なしで収集します。 | |
ベースシステムレイヤー | Alinux4 | カーネル最適化およびクラウドネイティブ対応を含む、Alinux4 のすべての機能と完全互換です。 |
適用範囲
Agentic OS の適用範囲に関する注意事項です。
弾性ベアメタルサーバーを含む各種インスタンスファミリーと互換があります。詳細については、「インスタンスファミリー」をご参照ください。
x86 CPU アーキテクチャのみをサポートします。
インスタンスメモリは最低でも 2 GB を推奨します。
OpenClaw、CoPaw、Claude Code などの主要な Agent フレームワークを含む、さまざまな Agent ワークロードシナリオをサポートします。
課金
Agentic OS は無料のオペレーティングシステムイメージです。ただし、このイメージとともに使用するその他のリソース(例:LLM 呼び出し、vCPU、メモリ、ストレージ、パブリック帯域幅、スナップショットなど)については課金されます。
主な特長
Token エコノミーへの最適化
複雑な OS 専門知識を標準化されたスキルに封じ込めることで、環境理解や試行錯誤による Token オーバーヘッドを大幅に削減します。これにより、意図から実行までのゼロレイテンシー・クローズドループ処理を実現します。自然言語による人間とシステムの関係の再定義
デフォルトシェルとして cosh(Copilot Shell)を採用しています。自然言語(日本語または英語)で日常的な運用・保守(O&M)タスク(例:環境デプロイメント、ツールのインストール)を指示でき、複雑なコマンドライン構文を記憶する必要がなく、システムとの関わり方を根本的に変革します。エンドツーエンドのスキル暗号化による内在的セキュリティ
各スキルはデジタル署名および暗号化により保護されています。呼び出し前に、システムは必須の身分認証および整合性検証を実行します。さらに、ハードウェアレベルのセキュリティサンドボックスにより異常動作を隔離することで、OS カーネルレベルから、Agent が制御可能・監査可能・最小権限の環境で安全に動作することを保証します。
主要コンポーネント
cosh(Copilot Shell)
Copilot Shell(cosh)は、Alibaba Cloud Linux 4 Agentic Edition のデフォルトインタラクティブシェルであり、ご利用のインスタンスへのログイン後に利用される主要なエントリポイントとして bash を置き換えます。
cosh のコア設計思想は「デュアルモードインタラクション」です。自然言語モードでは、中国語または英語で直接意図を記述すると、大規模言語モデルがそれを実行可能なシステム操作に翻訳します。コマンドモードでは、プレフィックス ! を付与してシェルコマンドを即時実行したり、/bash を入力してフル機能のインタラクティブ bash へ戻ったりできます。環境切替を伴わず、両モードを自由に混在使用できます。
cosh は bash との完全互換性を維持しつつ、自然言語理解、スキル呼び出し、MCP ツール統合、マルチレベル承認制御などの機能を追加しています。複雑なシステムレベル機能を自然言語インタラクションに抽象化し、OS Skills マニフェストと統合することで、OS 利用の障壁を低減し、人間ユーザーおよび AI Agent の双方が容易に OS を駆動してタスクを完了できるようにします。
OS Skills
OS Skills は、Agentic OS 内で AI Agent 向けに設計されたオペレーティングシステムマニュアルです。
従来のオペレーティングシステムドキュメントは人間ユーザー向けに作成されており、自然言語による説明、画面キャプチャの例示、業界共通の暗黙の知識に依存しています。このようなドキュメントを Agent が理解するには多数の Token が必要です。OS Skills マニフェストは、オペレーティングシステムの知識を Agent が直接理解・実行可能な構造化形式(SKILL)に再編成します。「ドキュメントを読み、その後操作する」のではなく、「読みながら即時実行」が可能になります。
現在、OS Skills マニフェストは以下の2つのドメインをカバーしています。
マニフェストドメイン | 知識領域 | 内容 |
system-admin | システム管理 | ユーザーおよび権限管理、システムサービス管理、カーネルアップグレードなどの基本的なシステム管理タスク。 |
security | システムセキュリティ | システムセキュリティベースラインチェック、脆弱性スキャン、および是正措置。 |
system-ops | システム運用 | Linux における一般的なパフォーマンスおよび安定性問題に対する診断機能を提供します。 |
Agent がユーザーの意図を受信すると、手動で呼び出しパスを指定することなく、自動的に該当するスキルをマッチして実行します。
AgentSecCore
AgentSecCore は、AI Agent ランタイム向けの OS レベルセキュリティカーネルです。AI Agent がファイル I/O、ネットワークアクセス、プロセス管理といった OS レベルの実行能力を獲得するにつれ、従来のアプリケーションセキュリティ境界では十分ではなくなりました。AgentSecCore は、OS レベルで Agent 向けの多層防御システムを構築し、Agent が制御可能・監査可能・最小権限の環境で安全に実行されることを保証します。
AgentSecCore は、すべてのビジネススキルの上位に位置するセキュリティ監視レイヤーとして動作します。現在は、基盤となるオペレーティングシステムから上位アプリケーションまでをカバーする、4段階の多層防御アーキテクチャを採用しています。
フェーズ | 保護機能 | 技術的実装 |
フェーズ 1 | スキル資産の整合性検証 | PGP 署名 + SHA256 ハッシュ + マニフェスト |
フェーズ 2 | システム非公開データ保護 | SKILL ルール + DLP(データ損失防止) |
フェーズ 3 | システムセキュリティ強化 | LoongShield seharden ツールを用いたベースラインスキャンおよびセキュリティ強化 |
フェーズ 4 | サンドボックス隔離 | Bubblewrap + Landlock + seccomp |
AgentSight
AgentSight は、AI Agent ランタイム向けの OS レベル可観測性コンポーネントです。AI Agent の能力は日増しに高まっていますが、実際の運用では顕著な課題が浮かび上がります。すなわち、Token 消費がユーザーの想定を大きく上回ることが頻発している点です。一見単純な会話であっても、複数のツール呼び出しやコンテキスト再構築をトリガーし、予想の数倍から数十倍にも及ぶ Token コストが発生し、ユーザーが原因を追跡・理解する有効な手段が存在しません。
この課題に対処するため、AgentSight は包括的な Agent 可観測性フレームワークを提供します。本ソリューションは、Agent 実行チェーン全体にわたって非侵入型で細かい粒度のデータを収集し、相関分析を実行します。これにより、開発者はインタラクション軌跡を明確に再構築できるだけでなく、Token 消費の正確な帰属および異常動作の迅速な特定を支援します。
AgentSight の主な機能は以下のとおりです。
Token 消費分析:Agent 実行中の Token 消費を計測・帰属します。時間範囲または直近 N 時間を柔軟にクエリでき、期間比較を自動実行します。また、Agent、タスク、ロールなど複数のディメンションで消費源を分解でき、分析粒度は単一の LLM 呼び出し単位まで細分化可能です。
動作監査:Agent のエンドツーエンド LLM 呼び出しおよびプロセス実行動作を記録・追跡します。データ収集時には、LLM 呼び出し毎のプロバイダーおよびモデルバージョンといった重要なメタデータを保持し、同時にプロセスのコマンドライン引数も取得します。さらに、時間、プロセス ID、イベントタイプなどによる柔軟な多次元フィルタリングをサポートし、視覚的なまとめおよび統計分析機能も提供します。