Puppeteer MCP | MCPBro

O que é o Puppeteer MCP?

O Puppeteer MCP é um plugin/servidor que expõe capacidades de automação de navegador através do Model Context Protocol, tornando o navegação na web, scraping e automação acessíveis a LLMs e frameworks de agentes. Ele utiliza a biblioteca Puppeteer do Chrome headless, permitindo que modelos e agentes visitem páginas da web programaticamente, preencham formulários, cliquem em botões, capturem screenshots e façam scraping de dados - tudo usando endpoints MCP padronizados.

Como Configurar o Puppeteer MCP

Instale o Node.js (se ainda não estiver presente).

Instale o servidor Puppeteer MCP usando npx ou clonando o repositório:

npx -y @modelcontextprotocol/server-puppeteer

Ou instale como uma dependência:

npm install -g @modelcontextprotocol/server-puppeteer

Inicie o servidor:
```
npx -y @modelcontextprotocol/server-puppeteer
```
Opcionalmente, você pode passar variáveis de ambiente ou argumentos de linha de comando para configuração personalizada (como controles de acesso, configurações de sandbox ou opções headless).
Configure seu aplicativo cliente/agente MCP (como Claude Desktop ou outro host LLM) para se conectar ao servidor Puppeteer MCP, especificando seu comando e quaisquer argumentos necessários. Exemplo (configuração JSON do Claude Desktop):
```
{
  "mcpServers": {
    "puppeteer": {
      "command": "npx",
      "args": ["-y", "@modelcontextprotocol/server-puppeteer"]
    }
  }
}
```
Opcionalmente, ajuste as configurações de segurança, acesso à rede ou configure autenticação se expuser o servidor MCP remotamente.

Como Usar o Puppeteer MCP

Descubra ferramentas disponíveis: Use seu cliente MCP para consultar o endpoint tools/list e ver quais ações baseadas no Puppeteer estão disponíveis (como puppeteer.navigate, puppeteer.evaluate, puppeteer.screenshot, etc.).
Invocar ferramentas: Chame a função desejada através do protocolo MCP, fornecendo os parâmetros apropriados (por exemplo, especificando uma URL para navegar ou um seletor de elemento para clicar).
Automatizar sequências: Encadeie várias chamadas de ferramentas Puppeteer para scriptar fluxos de trabalho complexos, como fazer login em um site, navegar por várias páginas, fazer scraping de tabelas ou gráficos e baixar arquivos.
Recuperar e manipular resultados: A saída de cada chamada incluirá dados relevantes, como conteúdo da página, snapshots do DOM, valores extraídos ou dados binários (para screenshots, PDFs, etc.).
Integrar com outras ferramentas MCP: Combine o Puppeteer MCP com outros servidores MCP (por exemplo, Filesystem, Memory, Database) para automação e processamento de dados multi-passo e multimodal.

Principais Recursos

Automação de navegador headless: Controle o Chrome/Chromium para interação total na web.
Acesso a conteúdo dinâmico: Suporta sites ricos em JavaScript, SPA e interativos.
Extração de dados: Faça scraping de conteúdo estruturado/não estruturado com seletores precisos.
Simulação de ações: Clique, digite, selecione, role e interaja como um usuário real faria.
Captura de recursos: Tire screenshots, gere PDFs e extraia HTML ou fragmentos de DOM renderizados.
Segurança e sandboxing: Permissões detalhadas impedem ações inseguras e garantem operação segura.
Fácil integração: A interface MCP padronizada funciona imediatamente com os principais agentes/apps LLM.
Sequências programáveis: Orquestre fluxos de trabalho complexos encadeando invocações de ferramentas.

Casos de Uso

Scraping automatizado da web: Extraia listas de produtos, artigos de notícias, conjuntos de dados públicos ou postagens de redes sociais.
Coleta de dados dinâmicos: Capture dados de páginas renderizadas em JavaScript que não estão disponíveis para solicitações HTTP básicas.
Preenchimento e envio de formulários: Automatize processos de login, inscrição ou entrada de dados múltiplas.
Regressão visual e monitoramento: Tire screenshots ou PDF de páginas da web valiosas periodicamente para monitoramento ou registro.
Teste e QA: Execute testes de UI automatizados ou verificações de regressão de dentro do seu fluxo de trabalho LLM.
Navegação aprimorada por agentes: Permita que LLMs “dirijam” o navegador para pesquisar, resumir ou validar conteúdo web ao vivo durante tarefas de NLP.

FAQ

1. Preciso de conhecimento prévio do Puppeteer para usar o servidor Puppeteer MCP?
Não. As ferramentas são expostas como endpoints MCP fáceis de usar com descrições claras, então nem o usuário nem o LLM precisam saber os detalhes da API do Puppeteer para acionar ações comuns de navegador.

2. Como restrinjo quais sites ou ações o servidor pode acessar?
Você pode configurar domínios permitidos, listas de bloqueio ou listas de permissões usando variáveis de ambiente ou parâmetros de linha de comando. Sempre siga as melhores práticas para controle de acesso, especialmente em ambientes compartilhados ou de produção.

3. Posso usar o Puppeteer MCP para contornar captchas e telas de login?
Embora o Puppeteer MCP suporte ações completas de navegador (incluindo preenchimento de formulários e navegação), ele não inclui resolução nativa de captcha. No entanto, você pode usá-lo para apresentar captchas para resolução por humanos ou utilizar plugins/serviços de terceiros, se desejado.

4. Quais tipos de arquivo o Puppeteer MCP pode gerar?
Você pode extrair HTML, texto simples, screenshots (PNG/JPEG), PDFs e dados arbitrários extraídos do DOM.

5. É possível automatizar fluxos de trabalho múltiplos que dependem de resultados anteriores?
Sim. Você pode encadear várias chamadas de ferramentas na lógica do seu agente ou cliente, passando a saída de um passo para outro conforme necessário.

Nome do Protocolo	Descrição
puppeteer.navigate	Navega o navegador headless para uma URL especificada, aguarda o carregamento da página e opcionalmente aguarda certos eventos ou seletores do DOM.
puppeteer.evaluate	Executa JavaScript arbitrário no contexto da página web carregada e retorna o resultado. Usado para inspeção do DOM, extração de dados ou manipulação.
puppeteer.screenshot	Captura uma screenshot da página atual do navegador, viewport ou um elemento DOM especificado, retornando uma imagem no formato solicitado (PNG/JPEG) para inspeção visual ou arquivamento.
puppeteer.extract	Extrai dados estruturados da página usando seletores CSS ou XPath fornecidos, permitindo fácil scraping de dados de tabelas, listas ou elementos personalizados.
puppeteer.click	Executa um clique do mouse (opcionalmente duplo clique ou clique direito) em um elemento que corresponda a um seletor, simulando interação do usuário para navegação ou envio de formulários.
puppeteer.type	Digita texto em um elemento de entrada ou textarea, útil para automatizar logins, formulários de busca ou outros campos interativos.
puppeteer.pdf	Gera um PDF da página atual, preservando estilos e layout, para arquivamento ou fins de conformidade.