什麼是 Stagehand MCP Server?
Stagehand MCP Server 作為 AI 應用與實際網頁自動化任務之間的橋樑。它通過將網頁瀏覽器控制暴露為 MCP 工具,使大型語言模型可以程式化地導航網站、執行任務和收集數據。它利用 Browserbase 實現遠端無頭瀏覽,並直接與 Claude Desktop 整合,使得基於 LLM 的工作流程可以使用複雜的瀏覽器自動化。
如何配置
- 從官方來源克隆 Stagehand MCP Server 倉庫。
- 在專案目錄中,使用以下命令安裝依賴:
npm install npm run build
- 更新你的 Claude Desktop 配置以註冊 Stagehand MCP Server:
{ "mcpServers": { "stagehand": { "command": "node", "args": ["path/to/mcp-server-browserbase/stagehand/dist/index.js"], "env": { "BROWSERBASE_API_KEY": "<YOUR_BROWSERBASE_API_KEY>", "BROWSERBASE_PROJECT_ID": "<YOUR_BROWSERBASE_PROJECT_ID>", "OPENAI_API_KEY": "<YOUR_OPENAI_API_KEY>" } } } }
- 使用以下命令運行伺服器:
node dist/index.js
- 重新啟動 Claude Desktop 以載入新的 MCP 配置。Stagehand 工具將顯示為可用的 MCP 工具。
如何使用
- 啟動配置好的 Claude Desktop MCP Server。
- 從可用的 MCP 工具菜單訪問 Stagehand 工具(尋找鎚子圖標)。
- 使用如網站導航、動作自動化和數據提取的工具,選擇相關工具,輸入必需的參數(例如網址、動作、指令),然後運行函數。
- 在需要時,通過其各自的資源端點查看控制台日誌或螢幕截圖。
- 有關視覺演示,請參考可用文檔或演示視頻,展示 Claude 如何通過 Stagehand MCP Server 與網絡互動。
主要特點
- 標準化的網頁自動化工具,可以在 Claude Desktop 中輕鬆訪問。
- 與 Browserbase 的安全整合,支持遠程無頭瀏覽器會話。
- 可執行工具集:導航網站、執行行動、提取結構化數據。
- 資源端點提供瀏覽器控制台日誌和按需螢幕截圖,實現完整可追跡性。
- 支持自定義憑證和環境隔離,以便進行敏感任務和安全操作。
使用案例
- 從網頁自動收集數據,獲取即時見解。
- 端到端的工作流程自動化,例如登錄網站、瀏覽儀表板和下載報告。
- 快速原型開發基於瀏覽器的 LLM 驅動工作流。
- 監控和抓取面向公眾的網絡內容,實現即時提取。
- 收集螢幕截圖和診斷日誌以用於合規或報告。
常見問題
Q1: 使用 Stagehand MCP Server 是否需要暴露我的本地文件或數據庫?
不需要,Stagehand MCP Server 只與網頁資源互動,提供對瀏覽器會話、螢幕截圖和日誌的訪問。除非通過其他 MCP 伺服器顯式整合,否則你的本地文件和數據庫會保持隔離。
Q2: 我需要從 Browserbase 獲取什麼?
你需要一個 Browserbase API 金鑰和專案ID。這些憑證用於啟動安全的遠程瀏覽器會話。
Q3: 我如何知道 Stagehand MCP Server 是否正常運行?
啟動伺服器並重新啟動 Claude Desktop 後,你應該會看到 Stagehand 工具出現在可調用的 MCP 工具中。此外,檢查伺服器的命令行輸出以確認連接或錯誤。
Q4: 我可以將 Stagehand MCP Server 與其他 LLM 主機一起使用嗎?
目前主要的官方整合與 Claude Desktop 兼容,但任何支持 MCP 協議和工具的主機都有可能利用 Stagehand MCP Server。
Q5: 可以以程式方式捕捉螢幕截圖或訪問瀏覽器日誌嗎?
可以,螢幕截圖和瀏覽器控制台日誌都是作為資源公開的,可以通過其唯一的資源標識符訪問,方便程式化地檢索證據或調試結果。