Что такое Stagehand MCP Server?
Stagehand MCP Server выступает в роли моста между ИИ-приложениями и реальными задачами веб-автоматизации. Он предоставляет управление веб-браузером в виде инструментов MCP, что позволяет большим языковым моделям легко искать сайты, выполнять задачи и собирать данные автоматически. Он использует Browserbase для удаленного безголового серфинга и напрямую интегрируется с Claude Desktop, что делает сложную браузерную автоматизацию доступной для рабочих процессов на основе LLM.
Как настроить
- Клонируйте репозиторий Stagehand MCP Server из его официального источника.
- В директории проекта установите зависимости, запустив:
npm install npm run build
- Обновите конфигурацию Claude Desktop, чтобы зарегистрировать Stagehand MCP Server:
{ "mcpServers": { "stagehand": { "command": "node", "args": ["path/to/mcp-server-browserbase/stagehand/dist/index.js"], "env": { "BROWSERBASE_API_KEY": "<YOUR_BROWSERBASE_API_KEY>", "BROWSERBASE_PROJECT_ID": "<YOUR_BROWSERBASE_PROJECT_ID>", "OPENAI_API_KEY": "<YOUR_OPENAI_API_KEY>" } } } }
- Запустите сервер:
node dist/index.js
- Перезапустите Claude Desktop, чтобы загрузить новую конфигурацию MCP. Инструменты Stagehand тогда появятся как доступные MCP инструменты.
Как использовать
- Запустите Claude Desktop с настроенным MCP Server.
- Получите доступ к инструментам Stagehand из меню доступных инструментов MCP (ищите иконку молотка).
- Используйте инструменты, такие как навигация по сайтам, автоматизация действий и извлечение данных, выбирая соответствующий инструмент, вводя необходимые параметры (например, URL, действия, инструкции) и запускайте функцию.
- При необходимости просматривайте ресурсы, такие как логи консоли или скриншоты, через их соответствующие конечные точки.
- Для визуальной демонстрации обратитесь к доступной документации или демонстрационным видео, показывающим взаимодействие Claude с вебом через Stagehand MCP Server.
Ключевые особенности
- Стандартизированные инструменты веб-автоматизации легко доступны в Claude Desktop через MCP.
- Безопасная интеграция с Browserbase для удаленных сессий безголового браузера.
- Исполняемый набор инструментов: навигация по сайтам, выполнение действий, извлечение структурированных данных.
- Конечные точки ресурсов предоставляют логи консоли браузера и скриншоты по запросу для полной отслеживаемости.
- Поддерживает пользовательские учетные данные и изоляцию окружения для чувствительных задач и безопасных операций.
Сценарии использования
- Автоматизированный сбор данных с веб-страниц для актуальных инсайтов.
- Автоматизация рабочих процессов от начала до конца, таких как вход на сайты, навигация по панелям управления и загрузка отчетов.
- Быстрое прототипирование браузерных рабочих процессов на основе LLM.
- Мониторинг и извлечение содержимого веб-сайтов в реальном времени с помощью автоматизации, управляемой LLM.
- Сбор скриншотов и диагностических логов для соблюдения норм или отчетности.
Часто задаваемые вопросы
Q1: Нужно ли мне раскрывать свои локальные файлы или базу данных для использования Stagehand MCP Server?
Нет, Stagehand MCP Server взаимодействует только с веб-ресурсами и предоставляет доступ к сессиям браузера, скриншотам и логам. Ваши локальные файлы и базы данных остаются изолированными, если не интегрированы явным образом через другие MCP сервера.
Q2: Что мне нужно от Browserbase?
Вам понадобится API ключ Browserbase и ID проекта. Эти данные необходимы для создания безопасных удаленных сессий браузера.
Q3: Как узнать, работает ли Stagehand MCP Server правильно?
После запуска сервера и перезапуска Claude Desktop вы должны увидеть инструменты Stagehand как доступные MCP инструменты. Кроме того, проверьте вывод командной строки сервера на предмет подтверждения подключения или ошибок.
Q4: Могу ли я использовать Stagehand MCP Server с другими хостами LLM кроме Claude Desktop?
В настоящее время основная официальная интеграция идет с Claude Desktop, но любой хост, поддерживающий протокол MCP и инструменты, потенциально может использовать Stagehand MCP Server.
Q5: Возможно ли программно захватывать скриншоты или получить доступ к логам браузера?
Да, как скриншоты, так и логи консоли браузера доступны как ресурсы, к которым можно получить доступ через их уникальные идентификаторы ресурсов, что упрощает получение доказательств или отладку результатов программно.