Stagehand MCP Server

什麼是 Stagehand MCP Server？

Stagehand MCP Server 作為 AI 應用與實際網頁自動化任務之間的橋樑。它通過將網頁瀏覽器控制暴露為 MCP 工具，使大型語言模型可以程式化地導航網站、執行任務和收集數據。它利用 Browserbase 實現遠端無頭瀏覽，並直接與 Claude Desktop 整合，使得基於 LLM 的工作流程可以使用複雜的瀏覽器自動化。

如何配置

從官方來源克隆 Stagehand MCP Server 倉庫。
在專案目錄中，使用以下命令安裝依賴：
```
npm install
npm run build
```

更新你的 Claude Desktop 配置以註冊 Stagehand MCP Server：

{
  "mcpServers": {
    "stagehand": {
      "command": "node",
      "args": ["path/to/mcp-server-browserbase/stagehand/dist/index.js"],
      "env": {
        "BROWSERBASE_API_KEY": "<YOUR_BROWSERBASE_API_KEY>",
        "BROWSERBASE_PROJECT_ID": "<YOUR_BROWSERBASE_PROJECT_ID>",
        "OPENAI_API_KEY": "<YOUR_OPENAI_API_KEY>"
      }
    }
  }
}

使用以下命令運行伺服器：
```
node dist/index.js
```
重新啟動 Claude Desktop 以載入新的 MCP 配置。Stagehand 工具將顯示為可用的 MCP 工具。

如何使用

啟動配置好的 Claude Desktop MCP Server。
從可用的 MCP 工具菜單訪問 Stagehand 工具（尋找鎚子圖標）。
使用如網站導航、動作自動化和數據提取的工具，選擇相關工具，輸入必需的參數（例如網址、動作、指令），然後運行函數。
在需要時，通過其各自的資源端點查看控制台日誌或螢幕截圖。
有關視覺演示，請參考可用文檔或演示視頻，展示 Claude 如何通過 Stagehand MCP Server 與網絡互動。

主要特點

標準化的網頁自動化工具，可以在 Claude Desktop 中輕鬆訪問。
與 Browserbase 的安全整合，支持遠程無頭瀏覽器會話。
可執行工具集：導航網站、執行行動、提取結構化數據。
資源端點提供瀏覽器控制台日誌和按需螢幕截圖，實現完整可追跡性。
支持自定義憑證和環境隔離，以便進行敏感任務和安全操作。

使用案例

從網頁自動收集數據，獲取即時見解。
端到端的工作流程自動化，例如登錄網站、瀏覽儀表板和下載報告。
快速原型開發基於瀏覽器的 LLM 驅動工作流。
監控和抓取面向公眾的網絡內容，實現即時提取。
收集螢幕截圖和診斷日誌以用於合規或報告。

常見問題

Q1: 使用 Stagehand MCP Server 是否需要暴露我的本地文件或數據庫？

不需要，Stagehand MCP Server 只與網頁資源互動，提供對瀏覽器會話、螢幕截圖和日誌的訪問。除非通過其他 MCP 伺服器顯式整合，否則你的本地文件和數據庫會保持隔離。

Q2: 我需要從 Browserbase 獲取什麼？

你需要一個 Browserbase API 金鑰和專案ID。這些憑證用於啟動安全的遠程瀏覽器會話。

Q3: 我如何知道 Stagehand MCP Server 是否正常運行？

啟動伺服器並重新啟動 Claude Desktop 後，你應該會看到 Stagehand 工具出現在可調用的 MCP 工具中。此外，檢查伺服器的命令行輸出以確認連接或錯誤。

Q4: 我可以將 Stagehand MCP Server 與其他 LLM 主機一起使用嗎？

目前主要的官方整合與 Claude Desktop 兼容，但任何支持 MCP 協議和工具的主機都有可能利用 Stagehand MCP Server。

Q5: 可以以程式方式捕捉螢幕截圖或訪問瀏覽器日誌嗎？

可以，螢幕截圖和瀏覽器控制台日誌都是作為資源公開的，可以通過其唯一的資源標識符訪問，方便程式化地檢索證據或調試結果。

協議名稱	描述
stagehand_navigate	在遠程瀏覽器實例中導航到指定的 URL。輸入：要打開的 URL 字串。
stagehand_act	在當前網頁上執行指定的動作。輸入：動作描述（字串）、可選變數（物件）以進行參數化互動。
stagehand_extract	根據指令和提供的 JSON 架構，從網頁提取結構化數據。輸入：提取指令（字串）、提取架構（物件）。
stagehand_observe	觀察當前網頁，並根據可選指令返回可能的行動列表。輸入：觀察指令（字串，可選）。

Stagehand MCP Server