すべてのプロダクト
Search
ドキュメントセンター

AgentBay:MCP ツール概要

最終更新日:Mar 14, 2026

本トピックでは、MCP ツールの機能と、サポートされている環境について説明します。詳細については、画像 (サンドボックス環境) をご参照ください。

AgentBay MCP ツール概要

MCP ツールサポートマトリクス

機能

ツール名

説明

ブラウザでの使用

コンピューターでの使用 (Linux)

コンピューターでの使用 (Windows)

モバイルでの使用

CodeSpace

サンドボックス環境の作成

create_sandbox

新しい AgentBay サンドボックス環境を作成し、サンドボックス ID を返します。

サポート

サポート

サポート

サポート

非サポート

サンドボックスアクセス URL の取得

get_sandbox_url

サンドボックスのランタイムアクセス URL を取得します。各 URL は使用後に有効期限が切れます。

サポート

サポート

サポート

サポート

非サポート

全画面スクリーンショットの撮影と共有

system_screenshot

現在のディスプレイの全画面スクリーンショットをキャプチャし、共有可能な URL を返します。

サポート

サポート

サポート

サポート

非サポート

サンドボックスリソースの解放

kill_sandbox

タスク完了後にサンドボックスリソースを解放します。

サポート

サポート

サポート

サポート

非サポート

ブラウザ要素へのホバー

browser_hover

ページ要素にホバーします。

サポート

非サポート

非サポート

非サポート

非サポート

ブラウザ要素のドラッグ

browser_drag

2 つの要素間でドラッグアンドドロップ操作を実行します。

サポート

非サポート

非サポート

非サポート

非サポート

ブラウザで戻る

browser_navigate_back

前のページに移動します。

サポート

非サポート

非サポート

非サポート

非サポート

ネットワークリクエストの取得

browser_network_requests

ページ読み込み後のすべてのネットワークリクエストを返します。

サポート

非サポート

非サポート

非サポート

非サポート

ブラウザでのファイルアップロード

browser_file_upload

1 つ以上のファイルをアップロードします。

サポート

非サポート

非サポート

非サポート

非サポート

ブラウザでのキー押下

browser_press_key

キーボードのキーを押します。

サポート

非サポート

非サポート

非サポート

非サポート

フォームの一括入力

browser_fill_form

一度に複数のフォームフィールドに入力します。

サポート

非サポート

非サポート

非サポート

非サポート

ブラウザでのテキスト入力

browser_type

編集可能な要素にテキストを入力します。

サポート

非サポート

非サポート

非サポート

非サポート

ブラウザウィンドウのサイズ変更

browser_resize

ブラウザウィンドウのサイズを変更します。

サポート

非サポート

非サポート

非サポート

非サポート

ページスナップショットのキャプチャ

browser_snapshot

現在のページのアクセシビリティスナップショットをキャプチャします。これは、操作を実行するためにスクリーンショットよりも優れています。

サポート

非サポート

非サポート

非サポート

非サポート

現在のページを閉じる

browser_close

現在のページを閉じます。

サポート

非サポート

非サポート

非サポート

非サポート

ブラウザタブの管理

browser_tabs

ブラウザタブのリスト表示、作成、クローズ、または切り替えを行います。

サポート

非サポート

非サポート

非サポート

非サポート

コンソールメッセージの取得

browser_console_messages

すべてのコンソールメッセージを返します。

サポート

非サポート

非サポート

非サポート

非サポート

ブラウザのインストール

browser_install

構成で指定されたブラウザをインストールします。

サポート

非サポート

非サポート

非サポート

非サポート

JavaScript 式の評価

browser_evaluate

ページまたは要素上で JavaScript 式を評価します。

サポート

非サポート

非サポート

非サポート

非サポート

ブラウザで URL に移動

browser_navigate

指定された URL に移動します。

サポート

非サポート

非サポート

非サポート

非サポート

ページスクリーンショットの撮影

browser_take_screenshot

現在のページのスクリーンショットを撮影します。

サポート

非サポート

非サポート

非サポート

非サポート

ブラウザでのクリック

browser_click

Web ページでクリック操作を実行します。

サポート

非サポート

非サポート

非サポート

非サポート

ポップアップダイアログの処理

browser_handle_dialog

ポップアップダイアログを処理します。

サポート

非サポート

非サポート

非サポート

非サポート

ページコンテンツをお待ちください。

browser_wait_for

テキストが表示または非表示になるのを待つか、指定した時間待機します。

サポート

非サポート

非サポート

非サポート

非サポート

ドロップダウンからオプションを選択

browser_select_option

ドロップダウンメニューからオプションを選択します。

サポート

非サポート

非サポート

非サポート

非サポート

UI 要素の非同期観測

page_use_observe_async

ページ上のインタラクティブな UI 要素を非同期で検索し、説明します。

サポート

非サポート

非サポート

非サポート

非サポート

抽出タスク結果の取得

page_use_get_extract_result

非同期抽出タスクの結果を取得します。

サポート

非サポート

非サポート

非サポート

非サポート

計画タスクの作成

browser_use_create_planner_task

タスクを詳細なステップに分解する計画タスクを作成します。

サポート

非サポート

非サポート

非サポート

非サポート

ナビゲーション URL

page_use_navigate

ブラウザで指定された URL に移動します。

サポート

非サポート

非サポート

非サポート

非サポート

操作タスクの進捗取得

page_use_get_act_result

非同期操作タスクの現在の進捗または最終結果を取得します。

サポート

非サポート

非サポート

非サポート

非サポート

自然言語タスクの実行

browser_use_execute_task

自然言語で記述されたタスクを実行します。

サポート

非サポート

非サポート

非サポート

非サポート

Web ページのスクリーンショット撮影

page_use_screenshot

現在の Web ページの画像をキャプチャします。

サポート

非サポート

非サポート

非サポート

非サポート

観測タスク結果の取得

page_use_get_observe_result

非同期観測タスクの結果を取得します。

サポート

非サポート

非サポート

非サポート

非サポート

タスクステータスのクエリ

browser_use_get_task_status

ID でタスクのステータスをクエリします。

サポート

非サポート

非サポート

非サポート

非サポート

Web ページデータの抽出

page_use_extract

指示に基づいて Web ページから情報やデータを取得します。

サポート

非サポート

非サポート

非サポート

非サポート

ページ操作の同期実行

page_use_act

現在の Web ページで 1 つ以上の操作を同期的に実行します。

サポート

非サポート

非サポート

非サポート

非サポート

ページ操作の非同期実行

page_use_act_async

1 つ以上の操作を非同期で開始し、タスク ID を返します。

サポート

非サポート

非サポート

非サポート

非サポート

実行中のタスクの終了

browser_use_terminate_task

ID で実行中のタスクを終了します。

サポート

非サポート

非サポート

非サポート

非サポート

Web データの非同期抽出

page_use_extract_async

Web ページから情報やデータを非同期で取得します。

サポート

非サポート

非サポート

非サポート

非サポート

ページへのログイン

page_use_login

特定のログイン構成を使用してログイン操作を実行します。

サポート

非サポート

非サポート

非サポート

非サポート

インタラクティブな要素の検索

page_use_observe

現在のページ上のインタラクティブな UI 要素を検索し、説明します。

サポート

非サポート

非サポート

非サポート

非サポート

ブラウザセッションを閉じる

page_use_close_session

現在のブラウザプロキシセッションを閉じ、リソースをクリーンアップします。

サポート

非サポート

非サポート

非サポート

非サポート

Base64 形式のデスクトップスクリーンショット

screenshot

デスクトップスクリーンショットをキャプチャし、base64 エンコードされたデータを返します。

サポート

サポート

サポート

サポート

非サポート

Chrome ブラウザの停止

stopChrome

Chrome ブラウザを停止します。

サポート

非サポート

非サポート

非サポート

非サポート

CDP で Chrome を起動

startChromeByCdp

Chrome を起動し、Chrome DevTools Protocol (CDP) 用の WebSocket デバッグポートを作成します。

サポート

非サポート

非サポート

非サポート

非サポート

行単位でのファイル編集

edit_file

テキストファイルを行単位で編集します。変更を git 形式の差分フォーマットで表示します。

サポート

サポート

サポート

サポート

非サポート

ファイルメタデータの取得

get_file_info

ファイルまたはディレクトリの詳細なメタデータを取得します。

サポート

サポート

サポート

サポート

非サポート

ファイル変更の監視

get_file_change

ディレクトリ内のファイルシステムイベントを監視し、新しいイベントを返します。

サポート

サポート

サポート

サポート

非サポート

ファイルコンテンツの読み取り

read_file

ファイルシステムからファイルコンテンツを読み取ります。オフセットと長さのパラメーターをサポートします。

サポート

サポート

サポート

サポート

非サポート

複数ファイルの読み取り

read_multiple_files

複数のファイルのコンテンツを一度に読み取ります。

サポート

サポート

サポート

サポート

非サポート

ディレクトリファイルのリスト表示

list_directory

指定されたパスにあるすべてのファイルとディレクトリの詳細なリストを取得します。

サポート

サポート

サポート

サポート

非サポート

ファイルの移動または名前変更

move_file

ファイルとディレクトリを移動または名前変更します。

サポート

サポート

サポート

サポート

非サポート

ファイルの再帰的検索

search_files

find コマンドを使用して、パターンに一致するファイルとディレクトリを再帰的に検索します。

サポート

サポート

サポート

サポート

非サポート

ファイルコンテンツの書き込み

write_file

新しいファイルを作成するか、既存のファイルにコンテンツを書き込みます。

サポート

サポート

サポート

サポート

非サポート

ファイルまたはディレクトリのコピー

copy_file

元のファイルを保持したまま、ファイルまたはディレクトリを新しい場所にコピーします。

サポート

サポート

サポート

サポート

非サポート

ファイルまたはディレクトリの削除

delete_file

ファイルシステムからファイルとディレクトリを削除します。

サポート

サポート

サポート

サポート

サポート

ディレクトリの作成

create_directory

新しいディレクトリを作成するか、その存在を確認します。

サポート

サポート

サポート

サポート

非サポート

シェルコマンドの実行

shell

シェルまたは cmd コマンドをタイムアウト付きで実行します。

サポート

サポート

サポート

サポート

非サポート

システムメトリックの取得

get_metrics

CPU、メモリ、ディスク、ネットワーク統計などのシステムメトリックを取得します。

サポート

サポート

サポート

サポート

非サポート

インストール済みアプリケーションのリスト表示

get_installed_apps

システムにインストールされているアプリケーションのリストを取得します。

非サポート

サポート

サポート

サポート

非サポート

アプリケーションの起動

start_app

指定されたコマンドを使用してアプリケーションを起動します。

非サポート

サポート

サポート

サポート

非サポート

コマンドによるアプリケーションの停止

stop_app_by_cmd

停止コマンドを使用してアプリケーションを停止します。

非サポート

サポート

サポート

サポート

非サポート

マウスカーソル位置の取得

get_cursor_position

画面上の現在のマウスカーソル位置を取得します。

非サポート

サポート

サポート

非サポート

非サポート

マウスのドラッグ

drag_mouse

マウスを開始点から終了点までドラッグします。

非サポート

サポート

サポート

非サポート

非サポート

画面サイズの取得

get_screen_size

プライマリ画面の幅、高さ、DPI スケーリング比を取得します。

非サポート

サポート

サポート

非サポート

非サポート

マウスカーソルの移動

move_mouse

マウスカーソルを指定された画面座標に移動します。

非サポート

サポート

サポート

非サポート

非サポート

キーボードキーの解放

release_keys

複数のキーボードキーを解放します。

非サポート

サポート

サポート

非サポート

非サポート

キーボードショートカットの押下

press_keys

複数のキーボードキーを同時に押します。ショートカットをサポートします。

非サポート

サポート

サポート

非サポート

非サポート

テキストの入力

input_text

指定されたテキストを入力します。

非サポート

サポート

サポート

サポート

非サポート

マウスホイールのスクロール

scroll

指定された座標でマウスホイールをスクロールします。

非サポート

サポート

サポート

非サポート

非サポート

マウスのクリック

click_mouse

指定された絶対座標でクリックします。

非サポート

サポート

サポート

非サポート

非サポート

ウィンドウの全画面表示

fullscreen_window

指定されたウィンドウを全画面モードに設定します。

非サポート

サポート

サポート

非サポート

非サポート

ウィンドウの最小化

minimize_window

指定されたウィンドウを最小化します。

非サポート

サポート

サポート

非サポート

非サポート

ウィンドウのサイズ変更

resize_window

指定されたウィンドウのサイズを変更します。

非サポート

サポート

サポート

非サポート

非サポート

ウィンドウのアクティブ化

activate_window

指定されたウィンドウをアクティブ化 (フォーカス) します。

非サポート

サポート

サポート

非サポート

非サポート

ルートウィンドウのリスト表示

list_root_windows

すべてのルートウィンドウとそれに関連する情報をリスト表示します。

非サポート

サポート

サポート

非サポート

非サポート

ウィンドウの最大化

maximize_window

指定されたウィンドウを最大化します。

非サポート

サポート

サポート

非サポート

非サポート

ウィンドウを閉じる

close_window

指定されたウィンドウを閉じます。

非サポート

サポート

サポート

非サポート

非サポート

アクティブウィンドウ情報の取得

get_active_window

現在のアクティブウィンドウに関する詳細情報を取得します。

非サポート

サポート

サポート

非サポート

非サポート

フォーカスモード制御

focus_mode

フォーカスモードを有効または無効にして、前景ウィンドウの範囲を制限します。

非サポート

サポート

非サポート

非サポート

非サポート

ウィンドウを通常の状態に戻す

restore_window

指定されたウィンドウを通常の状態に戻します。

非サポート

サポート

サポート

非サポート

非サポート

プロセス名によるプロセス停止

stop_app_by_pname

プロセス名ですべての関連プロセスを停止します。

非サポート

サポート

サポート

非サポート

非サポート

表示されているアプリケーションのリスト表示

list_visible_apps

表示されているウィンドウを持つすべてのアプリケーションとそのプロセス情報をリスト表示します。

非サポート

サポート

サポート

非サポート

非サポート

PID によるプロセス停止

stop_app_by_pid

PID で指定されたプロセスを終了します。

非サポート

サポート

サポート

非サポート

非サポート

サンドボックスでのコード実行

run_code

サンドボックスで指定されたコードスニペットを実行します。複数のプログラミング言語をサポートします。

非サポート

サポート

非サポート

非サポート

非サポート

セマンティック検索用のコード

search_codebase

セマンティック検索を使用して、意味によってコードベース内のコードまたは知識を検索します。

非サポート

非サポート

非サポート

非サポート

サポート

コードシンボルの検索

search_symbol

コードシンボルとその関係 (クラス、メソッド、インターフェイスなど) を検出します。

非サポート

非サポート

非サポート

非サポート

サポート

ディレクトリ構造のリスト表示

list_dir

ディレクトリの内容をリスト表示して、ファイル構造を理解するのに役立てます。

非サポート

非サポート

非サポート

非サポート

サポート

ファイルパスの glob 検索

search_file

glob パターンを使用してワークスペース内のファイルパスを検索します。

非サポート

非サポート

非サポート

非サポート

サポート

コード内の正規表現検索

grep_code

ripgrep エンジンを使用して、高性能なファイルコンテンツ検索を実行します。

非サポート

非サポート

非サポート

非サポート

サポート

コンパイルエラーの取得

get_problems

コードファイル内のコンパイルエラーまたはリントエラーを取得します。

非サポート

非サポート

非サポート

非サポート

サポート

ターミナルでのコマンド実行

run_in_terminal

ターミナルでシェルコマンドを実行します。

非サポート

非サポート

非サポート

非サポート

サポート

ターミナル出力の取得

get_terminal_output

バックグラウンドのターミナルコマンドの実行出力を取得します。

非サポート

非サポート

非サポート

非サポート

サポート

Web サービスのプレビュー

run_preview

ローカル Web サービス用のプレビューブラウザを設定します。

非サポート

非サポート

非サポート

非サポート

サポート

完全な文字列置換

search_replace

ファイル内の完全な文字列を置換します。

非サポート

非サポート

非サポート

非サポート

サポート

ファイルの作成または上書き

create_file

新しいファイルを作成するか、既存のファイルを指定されたコンテンツで上書きします。

非サポート

非サポート

非サポート

非サポート

サポート

タスクリスト管理

todo_write

複雑な複数ステップのタスクを追跡するためにタスクリストを作成および管理します。

非サポート

非サポート

非サポート

非サポート

サポート

ユーザーへの質問

ask_user_question

実行中にユーザーに質問して、好みや決定を収集します。

非サポート

非サポート

非サポート

非サポート

サポート

対話モードの切り替え

switch_mode

対話モードを切り替えます (例: 計画モードに切り替える)。

非サポート

非サポート

非サポート

非サポート

サポート

実装計画の作成

create_plan

簡潔な実装計画を作成して保存します。

非サポート

非サポート

非サポート

非サポート

サポート

メモリデータの更新

update_memory

ユーザーの意図に基づいてメモリを更新、追加、または削除します。

非サポート

非サポート

非サポート

非サポート

サポート

モバイルデバイスでのタップ

tap

指定された画面座標でタップ操作を実行します (モバイル)。

非サポート

非サポート

非サポート

サポート

非サポート

画面でのスワイプ

swipe

画面上でスワイプジェスチャーを実行します。

非サポート

非サポート

非サポート

サポート

非サポート

キーイベントの送信

send_key

指定されたキーコードでキーイベントを送信します (例: 戻るキーまたはホームキー)。

非サポート

非サポート

非サポート

サポート

非サポート

入力フィールドのテキストをクリア

clear_text

現在の入力フィールドのテキストをクリアします。

非サポート

非サポート

非サポート

サポート

非サポート

スクロール付きの長いスクリーンショット撮影

long_screenshot

スクロールして長いスクリーンショットを撮影し、画像を結合します。

非サポート

非サポート

非サポート

サポート

非サポート

すべての UI 要素の取得

get_all_ui_elements

非インタラクティブなものを含む、デバイス上のすべての UI 要素を取得します。

非サポート

非サポート

非サポート

サポート

非サポート

クリック可能な UI 要素の取得

get_clickable_ui_elements

デバイス上のすべてのクリック可能な UI 要素を取得します。

非サポート

非サポート

非サポート

サポート

非サポート

非同期タスクの開始

execute_task

非同期モバイルタスクを開始し、タスク ID を返します。

非サポート

非サポート

非サポート

サポート

非サポート

非同期タスクステータスのクエリ

get_task_status

非同期タスクのステータスと増分出力ストリームを取得します。

非サポート

非サポート

非サポート

サポート

非サポート

非同期タスクの終了

terminate_task

実行中の非同期タスクを終了します。

非サポート

非サポート

非サポート

サポート

非サポート

キーボードスキャンコードの送信

send_scan_codes

低レベルのキーボード入力制御のために、生のキーボードスキャンコードを送信します。

非サポート

非サポート

サポート

非サポート

非サポート

ツール機能の詳細

ツール機能

ツール名

ツールの説明

パラメーター例

サンドボックス環境の作成

create_sandbox

新しい AgentBay サンドボックスを作成し、その ID を返します。

{
  "type": "object",
  "properties": {},
  "required": []
}

サンドボックスアクセス URL の取得

get_sandbox_url

ユーザーアクセス用の Wuying MCP ランタイム URL を取得します。各 URL は 1 回限りの使用で、すぐに有効期限が切れます。

{
  "type": "object",
  "properties": {
    "sandbox_id": {
      "type": "string",
      "title": "サンドボックス ID",
      "description": "サンドボックス ID は、ツール実行環境の識別子です。この sandbox_id は create_sandbox ツールから取得されます。"
    }
  },
  "required": [
    "sandbox_id"
  ]
}

全画面スクリーンショットの撮影と共有

system_screenshot

現在の画面の全画面スクリーンショットをキャプチャし、共有可能な URL を返します。スクリーンショットは自動的に処理され、安全に保存されます。セキュリティのため、生成された URL は 64 分後に有効期限が切れます。

{
  "type": "object",
  "properties": {
    "sandbox_id": {
      "type": "string",
      "title": "サンドボックス ID",
      "description": "サンドボックス ID は、ツール実行環境の識別子です。この sandbox_id は create_sandbox ツールから取得されます。"
    }
  },
  "required": [
    "sandbox_id"
  ]
}

サンドボックスリソースの解放

kill_sandbox

タスク完了後にリソースを解放します。

{
  "type": "object",
  "properties": {
    "sandbox_id": {
      "type": "string",
      "title": "サンドボックス ID",
      "description": "サンドボックス ID は、ツール実行環境の識別子です。この sandbox_id は create_sandbox ツールから取得されます。"
    }
  },
  "required": [
    "sandbox_id"
  ]
}

シェルコマンドの実行

shell

シェルコマンドを実行し、出力またはエラーを返します。

{
  "inputSchema": {
    "properties": {
      "command": {
        "description": "クライアントによって入力されたコマンドです。",
        "type": "string"
      },
      "timeout_ms": {
        "default": 1000,
        "description": "コマンド実行のタイムアウト (ミリ秒)。指定しない場合、デフォルト値 (例: 1000 ms) が使用されます。",
        "type": "integer"
      }
    },
    "required": ["command", "timeout_ms"],
    "type": "object"
  }
}

ブラウザページを閉じる

browser_close

ブラウザページを閉じます。

{
  "inputSchema": {
    "type": "object",
    "properties": {},
    "additionalProperties": false,
    "$schema": "http://json-schema.org/draft-07/schema#"
  }
}

ブラウザウィンドウのサイズ変更

browser_resize

ブラウザウィンドウのサイズを変更します。

{
  "inputSchema": {
    "type": "object",
    "properties": {
      "width": {
        "type": "number",
        "description": "ブラウザウィンドウの幅です。"
      },
      "height": {
        "type": "number",
        "description": "ブラウザウィンドウの高さです。"
      }
    },
    "required": ["width", "height"],
    "additionalProperties": false,
    "$schema": "http://json-schema.org/draft-07/schema#"
  }
}

コンソールメッセージの取得

browser_console_messages

すべてのコンソールメッセージを返します。

{
  "inputSchema": {
    "type": "object",
    "properties": {},
    "additionalProperties": false,
    "$schema": "http://json-schema.org/draft-07/schema#"
  }
}

ポップアップダイアログの処理

browser_handle_dialog

ダイアログボックスを処理します。

{
  "inputSchema": {
    "type": "object",
    "properties": {
      "accept": {
        "type": "boolean",
        "description": "ダイアログボックスを受け入れるかどうか。"
      },
      "promptText": {
        "type": "string",
        "description": "プロンプトダイアログボックスのプロンプトテキスト。"
      }
    },
    "required": ["accept"],
    "additionalProperties": false,
    "$schema": "http://json-schema.org/draft-07/schema#"
  }
}

ブラウザでのファイルアップロード

browser_file_upload

1 つ以上のファイルをアップロードします。

{
  "inputSchema": {
    "type": "object",
    "properties": {
      "paths": {
        "type": "array",
        "items": {
          "type": "string"
        },
        "description": "アップロードするファイルの絶対パス。単一のファイルまたは複数のファイルを指定できます。"
      }
    },
    "required": ["paths"],
    "additionalProperties": false,
    "$schema": "http://json-schema.org/draft-07/schema#"
  }
}

ブラウザのインストール

browser_install

構成で指定されたブラウザをインストールします。ブラウザがインストールされていないというエラーが表示された場合は、このツールを呼び出してください。

{
  "inputSchema": {
    "type": "object",
    "properties": {},
    "additionalProperties": false,
    "$schema": "http://json-schema.org/draft-07/schema#"
  }
}

ブラウザでのキー押下

browser_press_key

キーボードのキーを押します。

{
  "inputSchema": {
    "type": "object",
    "properties": {
      "key": {
        "type": "string",
        "description": "押すキーの名前または生成する文字 (例: `ArrowLeft` または `a`)。"
      }
    },
    "required": ["key"],
    "additionalProperties": false,
    "$schema": "http://json-schema.org/draft-07/schema#"
  }
}

ブラウザで URL に移動

browser_navigate

URL に移動します。

{
  "inputSchema": {
    "type": "object",
    "properties": {
      "url": {
        "type": "string",
        "description": "移動先の URL。"
      }
    },
    "required": ["url"],
    "additionalProperties": false,
    "$schema": "http://json-schema.org/draft-07/schema#"
  }
}

ブラウザで戻る

browser_navigate_back

前のページに移動します。

{
  "inputSchema": {
    "type": "object",
    "properties": {},
    "additionalProperties": false,
    "$schema": "http://json-schema.org/draft-07/schema#"
  }
}

ブラウザで進む

browser_navigate_forward

次のページに移動します。

{
  "inputSchema": {
    "type": "object",
    "properties": {},
    "additionalProperties": false,
    "$schema": "http://json-schema.org/draft-07/schema#"
  }
}

ネットワークリクエストの取得

browser_network_requests

ページが読み込まれてからのすべてのネットワークリクエストを返します。

{
  "inputSchema": {
    "type": "object",
    "properties": {},
    "additionalProperties": false,
    "$schema": "http://json-schema.org/draft-07/schema#"
  }
}

ページスクリーンショットの撮影

browser_take_screenshot

現在のページのスクリーンショットを撮影します。スクリーンショットに基づいて操作を実行することはできません。操作には `browser_snapshot` を使用してください。

{
  "inputSchema": {
    "type": "object",
    "properties": {
      "raw": {
        "type": "boolean",
        "description": "PNG 形式の非圧縮データを返すかどうか。デフォルトは false で、JPEG 画像を返します。"
      },
      "filename": {
        "type": "string",
        "description": "スクリーンショットを保存するファイル名。指定しない場合、デフォルトは `page-{timestamp}.{png|jpeg}` です。"
      },
      "element": {
        "type": "string",
        "description": "スクリーンショットの権限を取得するための要素の人間が判読可能な説明。指定しない場合、ビューポートがキャプチャされます。`element` を指定する場合は、`ref` も指定する必要があります。"
      },
      "ref": {
        "type": "string",
        "description": "ページスナップショット内のターゲット要素へのリファレンス。指定しない場合、ビューポートがキャプチャされます。`ref` を指定する場合は、`element` も指定する必要があります。"
      }
    },
    "additionalProperties": false,
    "$schema": "http://json-schema.org/draft-07/schema#"
  }
}

ページスナップショットのキャプチャ

browser_snapshot

現在のページのアクセシビリティスナップショットをキャプチャします。

{
  "inputSchema": {
    "type": "object",
    "properties": {},
    "additionalProperties": false,
    "$schema": "http://json-schema.org/draft-07/schema#"
  }
}

ブラウザでのクリック

browser_click

Web ページでクリック操作を実行します。

{
  "inputSchema": {
    "type": "object",
    "properties": {
      "element": {
        "type": "string",
        "description": "対話する権限を取得するための要素の人間が判読可能な説明。"
      },
      "ref": {
        "type": "string",
        "description": "ページスナップショット内のターゲット要素へのリファレンス。"
      }
    },
    "required": ["element", "ref"],
    "additionalProperties": false,
    "$schema": "http://json-schema.org/draft-07/schema#"
  }
}

ブラウザ要素のドラッグ

browser_drag

2 つの要素間でドラッグアンドドロップ操作を実行します。

{
  "inputSchema": {
    "type": "object",
    "properties": {
      "startElement": {
        "type": "string",
        "description": "対話する権限を取得するためのソース要素の人間が判読可能な説明。"
      },
      "startRef": {
        "type": "string",
        "description": "ページスナップショット内のソース要素へのリファレンス。"
      },
      "endElement": {
        "type": "string",
        "description": "対話する権限を取得するためのターゲット要素の人間が判読可能な説明。"
      },
      "endRef": {
        "type": "string",
        "description": "ページスナップショット内のターゲット要素へのリファレンス。"
      }
    },
    "required": ["startElement", "startRef", "endElement", "endRef"],
    "additionalProperties": false,
    "$schema": "http://json-schema.org/draft-07/schema#"
  }
}

ブラウザ要素へのホバー

browser_hover

ページ要素にマウスをホバーさせます。

{
  "inputSchema": {
    "type": "object",
    "properties": {
      "element": {
        "type": "string",
        "description": "対話する権限を取得するための要素の人間が判読可能な説明。"
      },
      "ref": {
        "type": "string",
        "description": "ページスナップショット内のターゲット要素へのリファレンス。"
      }
    },
    "required": ["element", "ref"],
    "additionalProperties": false,
    "$schema": "http://json-schema.org/draft-07/schema#"
  }
}

ブラウザでのテキスト入力

browser_type

編集可能な要素にテキストを入力します。

{
  "inputSchema": {
    "type": "object",
    "properties": {
      "element": {
        "type": "string",
        "description": "対話する権限を取得するための要素の人間が判読可能な説明。"
      },
      "ref": {
        "type": "string",
        "description": "ページスナップショット内のターゲット要素へのリファレンス。"
      },
      "text": {
        "type": "string",
        "description": "要素に入力するテキスト。"
      },
      "submit": {
        "type": "boolean",
        "description": "入力したテキストを送信するかどうか (入力後に Enter キーを押す)。"
      },
      "slowly": {
        "type": "boolean",
        "description": "文字ごとにタイプするかどうか。これは、ページ上のキープレスハンドラをトリガーするのに役立ちます。デフォルトでは、テキスト全体が一度に入力されます。"
      }
    },
    "required": ["element", "ref", "text"],
    "additionalProperties": false,
    "$schema": "http://json-schema.org/draft-07/schema#"
  }
}

ドロップダウンからオプションを選択

browser_select_option

ドロップダウンメニューでオプションを選択します。

{
  "inputSchema": {
    "type": "object",
    "properties": {
      "element": {
        "type": "string",
        "description": "対話する権限を取得するための要素の人間が判読可能な説明。"
      },
      "ref": {
        "type": "string",
        "description": "ページスナップショット内のターゲット要素へのリファレンス。"
      },
      "values": {
        "type": "array",
        "items": {
          "type": "string"
        },
        "description": "ドロップダウンメニューで選択する値の配列。単一の値または複数の値を指定できます。"
      }
    },
    "required": ["element", "ref", "values"],
    "additionalProperties": false,
    "$schema": "http://json-schema.org/draft-07/schema#"
  }
}

ページコンテンツの待機

browser_wait_for

テキストが表示または非表示になるのを待つか、指定した時間が経過するのを待ちます。

{
  "inputSchema": {
    "type": "object",
    "properties": {
      "time": {
        "type": "number",
        "description": "待機する時間 (秒)。"
      },
      "text": {
        "type": "string",
        "description": "待機するテキスト。"
      },
      "textGone": {
        "type": "string",
        "description": "非表示になるのを待つテキスト。"
      }
    },
    "additionalProperties": false,
    "$schema": "http://json-schema.org/draft-07/schema#"
  }
}

ディレクトリの作成

create_directory

新しいディレクトリを作成するか、ディレクトリが存在することを確認します。1 回の操作で複数のネストされたディレクトリを作成できます。ディレクトリが既に存在する場合、この操作はサイレントに成功します。プロジェクトに必要なディレクトリ構造を設定したり、必要なパスが存在することを確認したりするのに最適です。許可されたディレクトリでのみ機能します。

{
  "inputSchema": {
    "properties": {
      "path": {
        "description": "作成するディレクトリのパス。",
        "type": "string"
      }
    },
    "required": ["path"],
    "type": "object"
  }
}

行単位でのファイル編集

edit_file

テキストファイルに対して行ベースの編集を実行します。各編集は、正確な行シーケンスを新しいコンテンツに置き換えます。行われた変更を表示するために、git 形式の差分を返します。許可されたディレクトリでのみ機能します。

{
  "inputSchema": {
    "properties": {
      "dryRun": {
        "default": false,
        "description": "git 形式の差分フォーマットを使用して変更をプレビューします。",
        "type": "boolean"
      },
      "edits": {
        "items": {
          "properties": {
            "newText": {
              "description": "置き換える新しいテキスト。",
              "type": "string"
            },
            "oldText": {
              "description": "検索するテキスト - 完全一致である必要があります。",
              "type": "string"
            }
          },
          "required": ["oldText", "newText"],
          "type": "object"
        },
        "type": "array"
      },
      "path": {
        "description": "編集するファイルのパス。",
        "type": "string"
      }
    },
    "required": ["path", "edits"],
    "type": "object"
  }
}

ファイルメタデータの取得

get_file_info

ファイルまたはディレクトリの詳細なメタデータを取得します。サイズ、作成時刻、最終変更時刻、権限、タイプなどの包括的な情報を返します。このツールは、実際のコンテンツを読み取らずにファイルの特性を理解するのに最適です。許可されたディレクトリでのみ機能します。

{
  "inputSchema": {
    "properties": {
      "path": {
        "description": "検査するファイルまたはディレクトリのパス。",
        "type": "string"
      }
    },
    "required": ["path"],
    "type": "object"
  }
}

ファイルコンテンツの読み取り

read_file

ファイルシステムからファイルの内容を読み取ります。オプションの「オフセット」(バイト単位) を指定して特定の位置から読み取りを開始したり、オプションの「長さ」(バイト単位) を指定して読み取るバイト数を制限したりできます。「長さ」を省略するか 0 にすると、ファイルの最後まで読み取られます。さまざまなテキストエンコーディングを処理し、ファイルが読み取れない場合は詳細なエラーメッセージを提供します。許可されたディレクトリでのみ機能します。

{
  "inputSchema": {
    "properties": {
      "length": {
        "description": "読み取るバイト数。省略または 0 の場合は、ファイルの最後まで読み取ります。",
        "minimum": 0,
        "type": "integer"
      },
      "offset": {
        "default": 0,
        "description": "このバイトオフセットから読み取りを開始します。",
        "minimum": 0,
        "type": "integer"
      },
      "path": {
        "description": "読み取るファイルのパス。",
        "type": "string"
      }
    },
    "required": ["path"],
    "type": "object"
  }
}

複数ファイルの読み取り

read_multiple_files

複数のファイルの内容を同時に読み取ります。これは、複数のファイルを分析または比較する必要がある場合に、ファイルを 1 つずつ読み取るよりも効率的です。各ファイルの内容は、そのパスをリファレンスとして返されます。単一のファイルの読み取りに失敗しても、操作全体は停止しません。許可されたディレクトリでのみ機能します。

{
  "inputSchema": {
    "properties": {
      "paths": {
        "description": "読み取るファイルパスの配列。",
        "items": {
          "type": "string"
        },
        "type": "array"
      }
    },
    "required": ["paths"],
    "type": "object"
  }
}

ディレクトリファイルのリスト表示

list_directory

指定されたパス内のすべてのファイルとディレクトリの詳細なリストを取得します。結果は、[FILE] と [DIR] のプレフィックスでファイルとディレクトリを明確に区別します。このツールは、ディレクトリ構造を理解し、特定のファイルを見つけるのに役立ちます。許可されたディレクトリでのみ機能します。

{
  "inputSchema": {
    "properties": {
      "path": {
        "description": "リスト表示するディレクトリのパス。",
        "type": "string"
      }
    },
    "required": ["path"],
    "type": "object"
  }
}

ファイルの移動または名前変更

move_file

ファイルとディレクトリを移動または名前変更します。ファイルを別のディレクトリに移動し、1 回の操作で名前を変更できます。宛先が既に存在する場合、操作は失敗します。異なるディレクトリ間で機能し、同じディレクトリ内での単純な名前変更にも使用できます。ソースと宛先の両方が許可されたディレクトリ内にある必要があります。

{
  "inputSchema": {
    "properties": {
      "destination": {
        "description": "宛先のファイルまたはディレクトリのパス。",
        "type": "string"
      },
      "source": {
        "description": "ソースのファイルまたはディレクトリのパス。",
        "type": "string"
      }
    },
    "required": ["source", "destination"],
    "type": "object"
  }
}

ファイルの再帰的検索

search_files

パターンに一致するファイルとディレクトリを再帰的に検索します。開始パスからすべてのサブディレクトリを検索します。検索では大文字と小文字が区別され、部分的な名前に一致します。一致するすべての項目の完全なパスを返します。正確な場所がわからない場合にファイルを見つけるのに最適です。許可されたディレクトリでのみ検索します。

{
  "inputSchema": {
    "properties": {
      "excludePatterns": {
        "default": [],
        "description": "除外するパターン (オプション)。",
        "items": {
          "type": "string"
        },
        "type": "array"
      },
      "path": {
        "description": "検索を開始するディレクトリパス。",
        "type": "string"
      },
      "pattern": {
        "description": "一致させるパターン。",
        "type": "string"
      }
    },
    "required": ["path", "pattern"],
    "type": "object"
  }
}

ファイルコンテンツの書き込み

write_file

新しいファイルを作成するか、既存のファイルの内容に書き込みます。mode パラメーターを指定して、ファイルを完全に上書きするか、ファイルの末尾に追加するかを選択できます。書き込む前にファイルをクリアするには overwrite モード (デフォルト) を使用し、ファイルの末尾にコンテンツを追加するには append モードを使用します。適切なエンコーディングでテキストコンテンツを処理します。許可されたディレクトリでのみ機能します。

{
  "inputSchema": {
    "properties": {
      "content": {
        "description": "書き込むコンテンツ。",
        "type": "string"
      },
      "mode": {
        "default": "overwrite",
        "description": "書き込みモード: 'overwrite' はファイルをクリアし、'append' はファイルの末尾に追加します。",
        "enum": ["overwrite", "append"],
        "type": "string"
      },
      "path": {
        "description": "書き込むファイルのパス。",
        "type": "string"
      }
    },
    "required": ["path", "content"],
    "type": "object"
  }
}

ページ操作の同期実行

page_use_act

現在の Web ページで 1 つ以上のアクションを実行し、すべてのアクションが完了するまでブロックします。

このメソッドは、現在のエージェントを介して提供されたアクションをすぐに実行し、アクションのシーケンス全体が完了した後に最終結果を返します。単一のインタラクションと一連の連続したアクションを処理できます。

{
  "type": "object",
  "title": "page_use_actArguments",
  "required": [
    "sandbox_id",
    "action"
  ],
  "properties": {
    "sandbox_id": {
      "type": "string",
      "title": "サンドボックス ID",
      "description": "サンドボックス ID は、ツール実行環境の識別子です。この sandbox_id は create_sandbox ツールから取得されます。"
    },
    "dom_settle_timeout_ms": {
      "type": "integer",
      "title": "Dom Settle Timeout Ms"
    },
    "page_id": {
      "anyOf": [
        {
          "type": "string"
        },
        {
          "type": "null"
        }
      ],
      "title": "Page Id"
    },
    "variables": {
      "additionalProperties": {
        "type": "string"
      },
      "type": "object",
      "title": "Variables"
    },
    "action": {
      "type": "string",
      "title": "Action"
    },
    "context_id": {
      "default": 0,
      "type": "integer",
      "title": "Context Id"
    },
    "iframe": {
      "type": "boolean",
      "title": "Iframe"
    },
    "timeout_ms": {
      "type": "integer",
      "title": "Timeout Ms"
    },
    "use_vision": {
      "default": false,
      "type": "boolean",
      "title": "Use Vision"
    }
  }
}

Web ページのスクリーンショット撮影

page_use_screenshot

現在の Web ページのスクリーンショットをキャプチャします。

このツールは、全ページスクリーンショット、指定領域のトリミング、画質設定をサポートする柔軟なスクリーンショット機能を提供します。結果はデータ URL (例: data:image/png;base64) として返され、フロントエンドアプリケーションで直接使用できます。

{
  "type": "object",
  "title": "page_use_screenshotArguments",
  "properties": {
    "sandbox_id": {
      "type": "string",
      "title": "サンドボックス ID",
      "description": "サンドボックス ID は、ツール実行環境の識別子です。この sandbox_id は create_sandbox ツールから取得されます。"
    },
    "page_id": {
      "anyOf": [
        {
          "type": "string"
        },
        {
          "type": "null"
        }
      ],
      "title": "Page Id"
    },
    "full_page": {
      "default": true,
      "type": "boolean",
      "title": "Full Page"
    },
    "context_id": {
      "default": 0,
      "type": "integer",
      "title": "Context Id"
    },
    "clip": {
      "additionalProperties": {
        "type": "number"
      },
      "type": "object",
      "title": "Clip"
    },
    "timeout": {
      "type": "integer",
      "title": "Timeout"
    },
    "quality": {
      "default": 80,
      "type": "integer",
      "title": "Quality"
    }
  },
  "required": [
    "sandbox_id"
  ]
}

ブラウザセッションを閉じる

page_use_close_session

現在のブラウザプロキシセッションを閉じます。

これにより、プロキシによって管理されているブラウザプロセスが終了し、関連リソースが解放されます。

{
  "type": "object",
  "title": "page_use_close_sessionArguments",
  "properties": {
    "sandbox_id": {
      "type": "string",
      "title": "サンドボックス ID",
      "description": "サンドボックス ID は、ツール実行環境の識別子です。この sandbox_id は create_sandbox ツールから取得されます。"
    }
  },
  "required": [
    "sandbox_id"
  ]
}

インタラクティブな要素の検索

page_use_observe

インタラクティブなユーザーインターフェース要素を識別し、特定します。

このツールは、後続のアクションで使用するために、操作可能な要素 (ボタンや入力フィールドなど) を見つけて説明するのに役立ちます。

操作可能な要素を見つける必要がある場合は、observe ツールを使用してください。

構造化データやテキストコンテンツを抽出するには、代わりに extract ツールを使用してください。

{
  "type": "object",
  "title": "page_use_observeArguments",
  "required": [
    "sandbox_id",
    "instruction"
  ],
  "properties": {
    "sandbox_id": {
      "type": "string",
      "title": "サンドボックス ID",
      "description": "サンドボックス ID は、ツール実行環境の識別子です。この sandbox_id は create_sandbox ツールから取得されます。"
    },
    "dom_settle_timeout_ms": {
      "type": "integer",
      "title": "Dom Settle Timeout Ms"
    },
    "page_id": {
      "anyOf": [
        {
          "type": "string"
        },
        {
          "type": "null"
        }
      ],
      "title": "Page Id"
    },
    "instruction": {
      "type": "string",
      "title": "Instruction"
    },
    "context_id": {
      "default": 0,
      "type": "integer",
      "title": "Context Id"
    },
    "iframe": {
      "default": false,
      "type": "boolean",
      "title": "Iframe"
    },
    "use_vision": {
      "default": false,
      "type": "boolean",
      "title": "Use Vision"
    }
  }
}

ページ操作の非同期実行

page_use_act_async

現在の Web ページで 1 つ以上のアクションの実行を非同期で開始し、進捗ポーリング用の task_id を返します。

page_use_act とは異なり、このメソッドはアクションが完了するまでブロックしません。すぐに実行を開始し、一意の task_id を返し、クライアントが page_use_get_act_result を使用して中間進捗と最終結果をポーリングできるようにします。

{
  "type": "object",
  "title": "page_use_act_asyncArguments",
  "required": [
    "sandbox_id",
    "action"
  ],
  "properties": {
    "sandbox_id": {
      "type": "string",
      "title": "サンドボックス ID",
      "description": "サンドボックス ID は、ツール実行環境の識別子です。この sandbox_id は create_sandbox ツールから取得されます。"
    },
    "dom_settle_timeout_ms": {
      "type": "integer",
      "title": "Dom Settle Timeout Ms"
    },
    "page_id": {
      "anyOf": [
        {
          "type": "string"
        },
        {
          "type": "null"
        }
      ],
      "title": "Page Id"
    },
    "variables": {
      "additionalProperties": {
        "type": "string"
      },
      "type": "object",
      "title": "Variables"
    },
    "action": {
      "type": "string",
      "title": "Action"
    },
    "context_id": {
      "default": 0,
      "type": "integer",
      "title": "Context Id"
    },
    "iframe": {
      "type": "boolean",
      "title": "Iframe"
    },
    "timeout_ms": {
      "type": "integer",
      "title": "Timeout Ms"
    },
    "use_vision": {
      "default": false,
      "type": "boolean",
      "title": "Use Vision"
    }
  }
}

非同期操作タスクの進捗取得

page_use_get_act_result

非同期操作タスクの現在の進捗または最終結果を取得します。

このメソッドは、以前の page_use_act_async の呼び出しから取得した task_id と共に使用する必要があります。タスクの現在のステータスを返し、実行が完了した場合 (is_done)、対応する結果コンテンツを含みます。

{
  "type": "object",
  "title": "page_use_get_act_resultArguments",
  "required": [
    "sandbox_id",
    "task_id"
  ],
  "properties": {
    "sandbox_id": {
      "type": "string",
      "title": "サンドボックス ID",
      "description": "サンドボックス ID は、ツール実行環境の識別子です。この sandbox_id は create_sandbox ツールから取得されます。"
    },
    "task_id": {
      "type": "string",
      "title": "Task Id"
    }
  }
}

非同期抽出タスク結果の取得

page_use_get_extract_result

抽出タスクの結果を取得するための非同期関数。

{
  "type": "object",
  "title": "page_use_get_extract_resultArguments",
  "required": [
    "sandbox_id",
    "task_id"
  ],
  "properties": {
    "sandbox_id": {
      "type": "string",
      "title": "サンドボックス ID",
      "description": "サンドボックス ID は、ツール実行環境の識別子です。この sandbox_id は create_sandbox ツールから取得されます。"
    },
    "task_id": {
      "type": "string",
      "title": "Task Id"
    }
  }
}

ページ上の URL への移動

page_use_navigate

ブラウザで指定された URL に移動します。

{
  "type": "object",
  "title": "page_use_navigateArguments",
  "required": [
    "sandbox_id",
    "url"
  ],
  "properties": {
    "sandbox_id": {
      "type": "string",
      "title": "サンドボックス ID",
      "description": "サンドボックス ID は、ツール実行環境の識別子です。この sandbox_id は create_sandbox ツールから取得されます。"
    },
    "url": {
      "type": "string",
      "title": "Url"
    }
  }
}

コードの実行

run_code

Linux プラットフォーム上の指定されたコンテキストでコードを実行し、出力またはエラーを返します。

{
  "inputSchema": {
    "properties": {
      "code": {
        "description": "実行するコード。",
        "type": "string"
      },
      "language": {
        "description": "コード実行のためのプログラミング言語。サポートされている値: 'python'、'javascript'。指定しない場合、デフォルトで Python が使用されます。",
        "type": "string"
      },
      "timeout_s": {
        "default": 300,
        "description": "コマンド実行のタイムアウト (秒)。指定しない場合、デフォルトは 300 秒で、最大 3600 秒です。",
        "type": "integer"
      }
    },
    "required": ["code"],
    "type": "object"
  }
}