Alibaba Cloud Linux 4 Agentic Edition は、AI エージェント向けの初の Agent-first オペレーティングシステムです。自然言語インタラクション、構造化されたスキルマニフェスト、4 層のセキュリティを特徴とし、エージェントのワークロード効率とセキュリティを最適化します。 - Alibaba Cloud Linux

Alibaba Cloud Linux 4 Agentic Edition (ANOLISA) は、Alibaba Cloud が提供する AI エージェント向けの、エージェントファーストのオペレーティングシステムです。

イメージ

Alibaba Cloud 独自の Alibaba Cloud Linux から派生した ANOLISA は、エージェントに最適な実行環境を提供するように設計されています。ANOLISA は、カーネルの最適化やクラウドネイティブのサポートなど、Alinux4 のすべての機能と完全な互換性を持ち、エージェントの認知および操作パターンを中心とした新しい OS アーキテクチャを導入しています。

レイヤー	コンポーネント	説明
インタラクションレイヤー	Copilot Shell (cosh)	デフォルトのシェルを置き換え、自然言語と bash によるデュアルモードインタラクションをサポートします。
インタラクションレイヤー	OS Skills	組み込みのスキルパッケージメカニズムです。エージェントはスキルマニフェストを使用してランタイムレイヤーおよびベースシステムレイヤーと対話し、デプロイメント、運用、診断、可観測性の機能を取得します。
ランタイムレイヤー	AgentSecCore	AgentSecCore は、AI エージェント向けに設計されたセキュリティ製品です。プロンプトインジェクション、動的コード実行、スキルセキュリティ、意図の逸脱、システム環境リスクなど、エージェントのライフサイクルにおける主要な脅威に焦点を当てています。OS レベルで、感知、意思決定、ブロック、トレーサビリティのための多次元的な多層防御メカニズムを提供します。Cosh や OPENCLAW などのエージェントフレームワークとの非侵入型の統合をサポートします。
	AgentSight	AI エージェント向けの eBPF ベースの可観測性ツールです。侵入やコード変更を一切必要とせず、Linux システム上で実行されている AI エージェントをリアルタイムで監視し、大規模言語モデル (LLM) の API 呼び出し、トークン消費量、プロセス動作をキャプチャします。
	Tokenless	Tokenless は ANOLISA のトークン最適化コンポーネントです。ビジネスロジックに侵入することなく、ツール定義とモデル応答を自動的に圧縮することで、LLM の推論トークン消費量を大幅に削減します。
	ws-ckpt	AI エージェントのワークスペーススナップショットおよびロールバックツールです。重要な操作の前に手動でスナップショットを作成したり、各 Q&A ラウンドの後に自動スナップショットを有効にしたりできます。ワンクリックで任意の履歴状態にロールバックできるため、実行プロセスが可逆的になります。
	Skill Optimizer	インテリジェントなスキル最適化エンジンです。環境認識、オンデマンドロード、オフライン事前コンパイルを使用して、無関係なスキルからの干渉を減らし、エージェントのタスク完了率を向上させ、トークン消費量を削減します。
ベースシステムレイヤー	Alinux4	カーネルの最適化やクラウドネイティブのサポートなど、Alinux4 のすべての機能と互換性があります。

適用範囲

ANOLISA には、以下の要件とサポートされるユースケースがあります。

弾性ベアメタルサーバーを含む、さまざまなインスタンスファミリーに適用可能です。詳細については、「インスタンスファミリー」をご参照ください。
- x86 CPU アーキテクチャのみがサポートされています。
- インスタンスメモリは 2 GB 以上を推奨します。
OpenClaw、CoPaw、Claude Code などの主要なエージェントフレームワークを含む、幅広いエージェントワークロードに適しています。

課金

ANOLISA は無料のオペレーティングシステムイメージです。ただし、大規模言語モデルの呼び出し、vCPU、メモリ、ストレージ、パブリック帯域幅、スナップショットなどの関連リソースには料金が発生します。

特長

究極のトークンエコノミー
複雑な OS の専門知識を標準化されたスキルにカプセル化することで、環境分析や試行錯誤の探索によるトークンのオーバーヘッドを削減し、意図から実行までのゼロレイテンシーのクローズドループプロセスを実現します。
自然言語がヒューマンコンピュータインタラクションを再定義
デフォルトのインタラクティブなエントリポイントとして Copilot Shell (cosh) を導入しています。自然言語を使用して環境のデプロイメントやツールのインストールなどの日常的な操作を実行できるため、複雑なコマンドを覚える必要がなくなり、インタラクションモデルが根本的に変わります。
エンドツーエンドのスキル暗号化が内在的なセキュリティを構築
各スキルはデジタル署名と暗号化によって保護されています。呼び出しの前に、システムは ID 認証と完全性検証を強制します。これと、異常な動作を分離するためのハードウェアレベルのセキュリティサンドボックスを組み合わせることで、エージェントが OS カーネルレベルで制御され、監査可能で、最小権限の環境で実行されることを保証します。

コアコンポーネント

Alibaba Cloud Linux 4 Agentic Edition (ANOLISA) には、Copilot Shell、AgentSecCore、AgentSight、OS Skills の 4 つのコアコンポーネントが含まれています。すべてのコンポーネントはオープンソースであり、https://github.com/alibaba/anolisa で入手できます。

Cosh (Copilot Shell)

Copilot Shell (cosh) は Alibaba Cloud Linux 4 Agentic Edition (ANOLISA) のデフォルトの対話型シェルであり、システムにログインした後のプライマリエントリポイントとして bash を置き換えます。

cosh の中心的な設計思想は「デュアルモードインタラクション」です。自然言語モードでは、意図を中国語または英語で直接記述でき、システムは大規模言語モデルを使用してそれを実行可能なシステム操作に変換します。コマンドモードでは、! プレフィックスを使用してシェルコマンドをすばやく実行したり、/bash を使用してフル機能の対話型 bash にフォールバックしたりできます。環境を切り替えることなく、両方のモードを自由に混在させることができます。

bash との完全な互換性を維持しながら、cosh は自然言語理解、スキル呼び出し、MCP ツール統合、多段階の承認制御などの機能を追加します。複雑なシステムレベルの機能を自然言語インタラクションに抽象化し、OS Skills スキルマニフェストを統合することで、cosh はオペレーティングシステムを使用するための障壁を下げます。これにより、人間のユーザーと AI エージェントの両方がオペレーティングシステムのタスクをより簡単に完了できるようになります。

OS Skills

OS Skills は、AI エージェントのために書かれた ANOLISA のオペレーティングシステムマニュアルです。

従来のオペレーティングシステムのドキュメントは人間のユーザー向けに書かれており、自然言語による説明、例、暗黙の業界規則に依存しています。エージェントは、このドキュメントを理解するために多くのトークンを消費します。OS Skills スキルマニフェストは、オペレーティングシステムの知識を、エージェントが直接理解して実行できるスキルと呼ばれる構造化された機械可読フォーマットに再編成します。「ドキュメントを読んでから操作する」のではなく、エージェントは「読んで実行する」ことができます。

OS Skills スキルマニフェストは現在、2 つのドメインをカバーしています。

マニフェストドメイン	知識エリア	内容
system-admin	システム管理	ユーザーと権限の管理、システムサービス管理、カーネルのアップグレードなどの基本的なシステム管理操作。
security	システムセキュリティ	システムセキュリティのベースラインチェック、脆弱性スキャン、および修正。
system-ops	システム運用	Linux の一般的なパフォーマンスと安定性の問題に対する診断機能を提供します。

エージェントがユーザーの意図を受け取ると、手動で指定された呼び出しパスを必要とせずに、対応するスキルを自動的に照合して実行します。

AgentSecCore

AgentSecCore は、AI エージェントランタイム向けの OS レベルのセキュリティカーネルです。AI エージェントがファイル I/O、ネットワークアクセス、プロセス管理などの OS レベルの実行機能を取得するにつれて、従来のアプリケーションセキュリティの境界はもはや十分ではありません。AgentSecCore は、OS レベルでエージェントの多層防御システムを構築し、エージェントが制御され、監査可能で、最小権限の環境で実行されることを保証します。

AgentSecCore は、「意図のセキュリティ」と「システムレベルの封じ込め」という 2 つの柱を中心に、3 層の多層防御システムを構築します。この設計により、1 つのレイヤーが侵害されても、後続のレイヤーが依然として保護を提供することが保証されます。下から上へのアーキテクチャは次のとおりです。

レイヤー	機能	実装
レイヤー 1：実行前境界 (防止)	プロンプトスキャナーコードスキャナースキル台帳	ルール、機械学習 (ML)、ベクトル検索という段階的な 3 層アプローチによるプロンプトインジェクションおよびジェイルブレイク検出エンジン。 28 の検出ルールと Shell/Python のサポートを特徴とする、コード用の実行前セキュリティインターセプター。スナップショット署名、追記専用バージョンチェーン、4 段階のセキュリティスキャンを特徴とする、スキルの完全性および改ざん防止エンジン。
レイヤー 2：ランタイム認識 (検出)	セキュリティ可観測性	セキュリティサンドボックス、システム強化、資産の完全性の 3 つのドメインをカバーします。構造化されたセキュリティイベントを永続化し、オンデマンドでセキュリティサマリーレポートを生成します。
レイヤー 3：低レベルフォールバック (封じ込め)	セキュリティベースライン検査 OS レベルの分離と監視	OS レベルのセキュリティ強化ルールライブラリを使用して自動的にスキャンし、システムセキュリティを侵害するエージェントのアクションを検出し、逸脱レポートと修正提案を生成します。 Linux カーネルのセキュリティプリミティブ (Namespace、Cgroup、seccomp、Capability) を活用して、プロセスレベルのサンドボックス、システムコールの監視とインターセプト、および詳細な権限制御を提供します。

AgentSight

AgentSight は、AI エージェントランタイム向けの OS レベルの可観測性コンポーネントです。過剰なトークン消費と、それに対応するユーザーの可視性とトレーサビリティの欠如に対処します。ビジネスロジックに侵入することなく、エージェントの実行チェーン全体にわたって詳細なデータを収集し、相関分析を実行します。

AgentSight は、主に 3 つの機能を提供します。

トークン消費量分析：エージェントの実行中のトークン消費量を測定し、属性を特定します。時間範囲または最後の N 時間でデータをクエリし、エージェント、タスク、ロールなどのディメンションで消費量を分類でき、分析の粒度は単一の LLM 呼び出しまで可能です。
動作監査：エージェントの LLM 呼び出しとプロセス実行動作をエンドツーエンドで記録します。プロバイダーやモデルバージョンなどの各呼び出しのメタデータを保持し、プロセスのコマンドライン引数もキャプチャします。時間やセッションなどのディメンションでデータをフィルタリングし、視覚的な要約統計を表示できます。
可視化ダッシュボード：リモートデプロイメント後にローカルブラウザからアクセスできる Web UI を提供します。トークン消費量の傾向をリアルタイムで表示し、エージェントのプロセスの状態を監視し、異常なプロセスを再起動できます。また、ユーザー入力、モデルプロンプト、推論プロセス、各ステップでのトークン消費量の分布など、各セッションの完全なトレースにドリルダウンすることもできます。

ws-ckpt

ws-ckpt (AI Agent Workspace Checkpoint) は、ANOLISA の AI エージェントワークスペース向けのファイルレベルのスナップショットおよびロールバックツールです。

AI エージェントは、タスクの実行中にワークスペースファイルを大幅に変更する可能性があります。操作が失敗したり、予期しない結果が生じたりした場合、回復は困難になることがあります。ws-ckpt メカニズムは、ワークスペースの軽量なスナップショット管理を提供します。重要な操作の前に手動でスナップショットを作成したり、各 Q&A ラウンドの後に自動スナップショットを有効にしたりできます。変更を元に戻す必要がある場合は、ワンクリックで任意の履歴状態にロールバックできるため、エージェントの操作が可逆的かつ追跡可能になります。

ws-ckpt の中心的な設計思想は、「エージェントの作業に保険をかける」ことです。高リスクな操作を実行する前に、自然言語または CLI コマンドを使用して手動でスナップショットを作成できます。頻繁にファイルが変更されるタスクの場合は、各 Q&A ラウンドの後に自動スナップショットを有効にできます。システムは最初のスナップショットが作成されると自動的に初期化され、追加の構成は必要ありません。

ws-ckpt は、以下の機能を提供します。

機能	説明
手動スナップショット	重要な操作の前に、自然言語または CLI コマンドを使用してワークスペースのスナップショットを手動で作成します。
自動スナップショット	頻繁にファイルが変更されるタスクの場合は、各 Q&A ラウンドの後に自動スナップショットを有効にできます。これは現在、OpenClaw と Hermes でサポートされています。
ワンクリックロールバック	任意の履歴スナップショットにロールバックして、ワークスペースファイルを指定した時点の完全な状態に復元します。
スナップショット管理	スナップショットのリスト表示と削除機能を提供し、カスタムスナップショット識別子と説明をサポートします。
デュアルモードインタラクション	自然言語インタラクション (エージェントとの対話を通じて) と CLI コマンド操作モードの両方をサポートします。

Skill Optimizer

Skill Optimizer は、ANOLISA のインテリジェントなスキル最適化エンジンです。ロード時と実行時の両方で、エージェントのスキル使用の効率と品質を向上させます。

スキルエコシステムが成長するにつれて、エージェントは 2 つの課題に直面します。第一に、各会話でスキルの完全なリストをロードすると、無関係なコンテキストが導入され、トークン消費量が増加し、意思決定が妨げられます。第二に、同じスキルを理解して実行する能力はモデルによって大きく異なり、スキルのパフォーマンスに一貫性がなくなります。Skill Optimizer は、これら両方の課題に対処します。インテリジェントフィルタリングにより、現在のタスクに最も関連性の高いスキルのサブセットのみがエージェントに表示され、事前コンパイル最適化により、高頻度スキルがターゲットモデルの機能プロファイルに適応されます。

Skill Optimizer は、エージェントが「より少ないスキルで正しいことを行う」ことを目指しています。ロード側では、システムは実行環境とワークスペースタイプを自動的に識別し、最も関連性の高いスキルのサブセットをインテリジェントに照合して提示します。このプロセスはエージェントフレームワークに対して透明です。実行側では、ANOLISA はオフラインコンパイルによって最適化された、人気のある高頻度のコミュニティスキルをいくつかプリインストールしています。これらのスキルを使用すると、タスクの完了率が高まり、トークンの節約が大きくなります。

Skill Optimizer は、以下の機能を提供します。

機能	説明
インテリジェントフィルタリング	実行環境とワークスペースタイプに基づいて、現在のタスクに最も関連性の高いスキルのサブセットを自動的にフィルタリングして提示し、無関係なスキルをブロックします。
事前コンパイル最適化	ターゲットモデルの機能プロファイルに適応するようにオフラインで最適化された、高頻度スキルの複数の組み込みバリアントが含まれています。これにより、実行成功率が向上します。
透明な統合	上流のエージェントフレームワークに対して完全に透明です。コードの変更は必要なく、構成または会話を通じて有効にできます。

Tokenless

Tokenless は、ANOLISA のトークン最適化コンポーネントであり、コンテキスト圧縮とコマンドフィルタリングを通じて、エージェントと LLM のインタラクションにおけるトークン消費量を削減します。

エージェントがより複雑なタスクを担うにつれて、肥大化したツール定義、冗長な構造化応答、ノイズの多いコマンド出力がコンテキストウィンドウをすぐに埋め尽くす可能性があります。これにより、推論コストが増加し、有効な情報が押し出されます。Tokenless は、エージェントと LLM の間にインテリジェントな最適化パイプラインを構築します。ツール定義を自動的に合理化し、構造化データにコンパクトなエンコーディングを適用し、コマンド出力からノイズをフィルタリングします。これらの機能が連携して、エージェントの動作セマンティクスを変更することなく、トークンのオーバーヘッドを大幅に削減します。

Tokenless は、エージェントが同じタスクをより少ないトークンで完了するのに役立ちます。最適化プロセス全体は、プラグインとフックのメカニズムを通じて自動的に適用されるため、上流のエージェントフレームワークに対して完全に透明であり、ビジネスコードの変更は必要ありません。すべての圧縮効果は定量的に記録され、最適化のメリットを評価するためのデータを提供します。

Tokenless は、以下の機能を提供します。

機能	説明
コンテキスト圧縮	Function Calling のツール定義を合理化し、CLI コマンド応答から注意散漫な情報をフィルタリングし、コンパクトエンコーディングを使用して構造化データを圧縮します。
統計追跡	圧縮前後の比較を自動的に記録し、タイプ別に節約量を要約します。
透明な統合	プラグインとフックを通じて自動的に適用され、エージェントフレームワークへの侵入はゼロです。