Puppeteer MCP | MCPBro

Что такое Puppeteer MCP?

Puppeteer MCP – это плагин/сервер, который предоставляет возможности автоматизации браузера через Model Context Protocol, делая веб-серфинг, скрейпинг и автоматизацию доступными для LLM и агентских фреймворков. Он использует безголовую библиотеку Chrome Puppeteer, позволяя моделям и агентам программно посещать веб-страницы, заполнять формы, нажимать кнопки, делать скриншоты и извлекать данные – все это с использованием стандартизированных точек доступа MCP.

Как настроить Puppeteer MCP

Установите Node.js (если он еще не установлен).
Установите сервер Puppeteer MCP, используя npx или клонируя репозиторий:
```
npx -y @modelcontextprotocol/server-puppeteer
```
Или установите как зависимость:
```
npm install -g @modelcontextprotocol/server-puppeteer
```
Запустите сервер:
```
npx -y @modelcontextprotocol/server-puppeteer
```
При необходимости вы можете передать переменные окружения или параметры командной строки для настройки (такие как управление доступом, параметры песочницы или безголовые опции).
Настройте приложение вашего клиента/агента MCP (например, Claude Desktop или другой хост LLM), чтобы подключиться к серверу Puppeteer MCP, указав его команду и все необходимые аргументы. Пример (конфигурация JSON для Claude Desktop):
```
{
  "mcpServers": {
    "puppeteer": {
      "command": "npx",
      "args": ["-y", "@modelcontextprotocol/server-puppeteer"]
    }
  }
}
```
При необходимости настройте параметры безопасности, сетевой доступ или настройте аутентификацию, если сервер MCP доступен удаленно.

Как использовать Puppeteer MCP

Обнаружьте доступные инструменты: Используйте ваш клиент MCP, чтобы запросить точку tools/list, чтобы увидеть, какие действия на основе Puppeteer доступны (например, puppeteer.navigate, puppeteer.evaluate, puppeteer.screenshot и т.д.).
Вызовите инструменты: Вызовите нужную функцию через протокол MCP, предоставив соответствующие параметры (например, указав URL для перехода или селектор элемента для клика).
Автоматизация последовательностей: Соедините несколько вызовов инструментов Puppeteer, чтобы создать сложные сценарии, такие как вход на сайт, навигация по нескольким страницам, извлечение таблиц или графиков и загрузка файлов.
Получите и обработайте результаты: Результат каждого вызова будет включать соответствующие данные, такие как содержание страницы, снимки DOM, извлеченные значения или бинарные данные (для скриншотов, PDF и т.д.).
Интегрируйтесь с другими инструментами MCP: Сочетайте Puppeteer MCP с другими серверами MCP (например, Файловая система, Память, База данных) для многоэтапной, многомодальной автоматизации и обработки данных.

Ключевые функции

Автоматизация безголового браузера: Легко управляйте Chrome/Chromium для полного взаимодействия с вебом.
Доступ к динамическому контенту: Поддерживает сайты с интенсивным использованием JavaScript, SPA и интерактивные сайты.
Извлечение данных: Скрапьте структурированный/неструктурированный контент с точными селекторами.
Симуляция действий: Кликните, введите, выберите, прокрутите и взаимодействуйте, как будто вы реальный пользователь.
Сбор ресурсов: Делайте скриншоты, создавайте PDF и извлекайте отрисованный HTML или фрагменты DOM.
Безопасность и песочница: Точные разрешения предотвращают небезопасные действия и гарантируют безопасную работу.
Легкая интеграция: Стандартизированный интерфейс MCP работает без дополнительных усилий с ведущими агентами/приложениями LLM.
Скриптованные последовательности: Организуйте сложные рабочие процессы, соединяя вызовы инструментов.

Сценарии использования

Автоматизированный веб-скрейпинг: Извлечение списков продуктов, новостных статей, публичных наборов данных или постов в социальных сетях.
Сбор динамических данных: Захват данных с веб-страниц, отрисованных JavaScript, недоступных для базовых HTTP-запросов.
Заполнение форм и отправка: Автоматизация входа, регистрации или многоэтапных процессов ввода данных.
Визуальная регрессия и мониторинг: Периодически делайте скриншоты или создавайте PDF-версии ценных веб-страниц для мониторинга или ведения записей.
Тестирование и контроль качества: Запуск автоматизированных UI тестов или проверок регрессии в рамках рабочего процесса вашего LLM.
Улучшенный браузинг для агентов: Позвольте LLM «управлять» браузером для исследования, резюмирования или проверки актуального веб-контента во время задач NLP.

Часто задаваемые вопросы

1. Нужно ли мне знание Puppeteer, чтобы использовать сервер Puppeteer MCP?
Нет. Инструменты представлены в виде простых точек доступа MCP с ясными описаниями, поэтому ни пользователю, ни LLM не нужно знать детали API Puppeteer, чтобы инициировать общие действия браузера.

2. Как я могу ограничить доступ к сайтам или действиям для сервера?
Вы можете настроить разрешенные домены, черные списки или безопасные действия через переменные окружения или параметры командной строки. Всегда следуйте лучшим практикам управления доступом, особенно в совместных или производственных средах.

3. Могу ли я использовать Puppeteer MCP для обхода капчи и экранов входа?
Хотя Puppeteer MCP поддерживает полные действия браузера (включая заполнение форм и навигацию), он не включает решения для капчи. Однако вы можете использовать его для отображения капчи для решения человеком, или задействовать сторонние плагины/сервисы, если это необходимо.

4. Какие типы файлов может выдавать Puppeteer MCP?
Вы можете извлекать HTML, простой текст, скриншоты (PNG/JPEG), PDF и произвольно извлеченные данные из DOM.

5. Возможно ли автоматизировать многоступенчатые рабочие процессы, которые зависят от предыдущих результатов?
Да. Вы можете соединить несколько вызовов инструментов в логике вашего агента или клиента, передавая результат от одного шага к другому по мере необходимости.

Название протокола	Описание
puppeteer.navigate	Переходит в безголовом браузере на указанный URL, ждет загрузки страницы и, при необходимости, ждет определенных событий DOM или селекторов.
puppeteer.evaluate	Выполняет произвольный JavaScript в контексте загруженной веб-страницы и возвращает результат. Используется для инспекции DOM, извлечения данных или манипуляций.
puppeteer.screenshot	Делает скриншот текущей страницы браузера, области просмотра или указанного элемента DOM, возвращая изображение в запрашиваемом формате (PNG/JPEG) для визуального просмотра или архивирования.
puppeteer.extract	Извлекает структурированные данные со страницы, используя предоставленные CSS-селекторы или XPath, что позволяет легко собирать данные из таблиц, списков или пользовательских элементов.
puppeteer.click	Выполняет щелчок мыши (при необходимости двойной щелчок или правый щелчок) на элементе, соответствующем селектору, имитируя взаимодействие пользователя для навигации или отправки форм.
puppeteer.type	Вводит текст в элемент ввода или текстовую область, что полезно для автоматизации входа, форм поиска или других интерактивных полей.
puppeteer.pdf	Создает PDF текущей страницы, сохраняя стили и макет, для архивирования или соблюдения норм.