本文介紹如何使用無影 AgentBay SDK 建立表單填寫代理。該代理可以將 HTML 表單上傳至 AgentBay並在瀏覽器中開啟表單,根據自然語言指令自動填寫資料。
功能特性
將 HTML 表單上傳至 AgentBay 環境。
使用 AgentBay 的瀏覽器功能在瀏覽器中開啟表單。
使用自然語言指令填寫表單欄位。
自動認可表單。
框架組成指南
本專案採用支援多種代理架構的結構。請參考特定的框架組成指南擷取詳細的設定和使用說明:
LangChain 整合指南:LangChain 架構的完整設定和使用說明。
專案源碼參考Form-Filling Agent。
專案結構
本專案採用模組化結構,將核心功能與架構特定整合分離:
├── README.md # 文檔
├── .env # 環境變數
├── common/ # 公用核心功能
│ ├── src/ # 與架構無關的代碼
│ │ ├── form.html # 樣本 HTML 表單
│ │ └── form_filler.py # 核心表單填寫功能
│ └── README.md # 文檔
├── langchain/ # LangChain 整合
│ ├── data/ # 輸出資料目錄(螢幕截圖等)
│ ├── src/ # LangChain 特定代碼
│ │ ├── form_filling_agent.py # LangChain 特定實現
│ │ └── form_filling_agent_example.py # LangChain 編排樣本指令碼
│ └── requirements.txt # Python 依賴項公用模組
common目錄包含可在不同代理架構中使用的所有核心功能。包括:
Agent-Bay 會話管理。
檔案上傳操作。
瀏覽器初始化和控制。
表單填寫操作。
資源清理。
框架組成模組
架構特定目錄(如 langchain)包含整合代碼,這些代碼使用公用模組的核心功能,並將其封裝在架構特定組件中。
自訂
可以修改 form.html檔案以使用自己的表單,並更新樣本指令碼中的指令以匹配您表單中的欄位。