本文介紹如何利用無影 AgentBay SDK 實現各種自動化情境。包含多個實用樣本和使用情境,旨在展示如何在各種自動化情境中使用 AgentBay SDK。每個指南都聚焦於 SDK 的特定應用情境,不僅提供基礎實現代碼,還展示與 LangChain 等主流開發架構的整合方式,便於阿里雲開發人員使用者快速上手和整合到實際專案中。
沙箱環境(envs)
envs 目錄包含按沙箱環境組織的樣本。在 AgentBay 中,沙箱環境是指一個隔離的雲端運算環境,在其中可以安全高效地執行特定類型的操作。每個環境都為不同用例提供專門的功能。
目前實現了兩種不同的沙箱環境:
browser:網頁瀏覽器沙箱環境,提供 Web 自動化功能,包括表單填寫、網頁抓取和 UI 互動。
codespace:代碼執行沙箱環境,提供在隔離環境中運行和測試代碼的功能。
入門指南
設定環境變數,可通過以下方式:
直接匯出環境變數:
export AGENTBAY_API_KEY=your_api_key_here推薦方法:使用每個實踐教程目錄中的
.env檔案。
實踐教程可能需要額外的 API 金鑰,例如用於 LLM 功能的 DashScope API 金鑰。
選擇感興趣的特定實踐教程。
遵循實踐教程中的設定說明。
運行樣本指令碼查看 SDK 的實際運行效果。
實踐教程
AgentBay SDK 提供了一套全面的工具,用於高效地與 AgentBay 雲環境進行互動。相關實踐教程展示了 SDK 在不同領域的實際應用:
表單填寫
此實踐教程示範如何使用 Agent-Bay SDK 建立表單填寫代理。該代理可完成以下工作:
將 HTML 表單上傳到 Agent-Bay 環境。
使用 Agent-Bay 的瀏覽器功能在瀏覽器中開啟表單。
使用自然語言指令填寫表單欄位。
自動認可表單。
自動化測試
此實踐教程示範如何使用 LangChain 和 Agent-Bay SDK 建立測試代理程式。該代理可完成以下工作:
掃描 Python 專案以識別需要測試的模組。
基於專案結構使用 LLM 產生測試案例。
在隔離的 AgentBay 雲會話中執行測試。
將測試結果儲存到本地記錄檔。
框架組成
每個實踐教程都採用支援多種代理架構的結構。目前大多數樣本包括 LangChain 整合,並計劃擴充到其他架構。專案採用模組化結構,將核心功能與架構特定整合分離:
cookbook-name/
├── README.md # 文檔
├── .env # 環境變數
├── common/ # 公用核心功能
│ └── src/ # 與架構無關的代碼
└── framework-name/ # 框架組成(例如:langchain)
├── data/ # 輸出資料目錄
├── src/ # 架構特定代碼
└── requirements.txt # 依賴項(針對 Python)