Browserbase MCP Server

Browserbase MCP Server

El servidor MCP de Browserbase es un servidor de automatización de navegadores en la nube. Permite que los modelos de lenguaje interactúen con la web de forma programática. Permite acciones como navegación, rellenar formularios, extracción de datos, capturas de pantalla y ejecución de JavaScript a través de una interfaz estándar llamada Protocolo de Contexto de Modelo (MCP).

Author: browserbase


Ver Protocolo

¿Qué es el servidor MCP de Browserbase?

El servidor MCP de Browserbase es un servidor ligero. Proporciona a los LLM acceso seguro a herramientas de automatización de navegadores en la nube. Se integra con Browserbase y Stagehand para permitir que agentes inteligentes realicen tareas de navegación y extraigan información estructurada a través del estándar MCP.

Cómo configurar

  1. Instala el servidor MCP de Browserbase: Clona o descarga el repositorio y sigue las instrucciones de configuración en la carpeta browserbase/.
  2. Configura las credenciales: Configura tus credenciales de API de Browserbase y cualquier variable de entorno necesaria para las sesiones de navegador en la nube.
  3. Inicia el servidor: Lanza el servidor, asegurándote de que puede conectar con Browserbase y escuche en el puerto configurado.
  4. Registro MCP: Asegúrate de que tu aplicación huésped MCP pueda descubrir y conectar con el servidor MCP de Browserbase, generalmente a través de un punto final de red.

Cómo usar

  • Usa tu cliente habilitado para LLM (como una interfaz de chat o marco de agentes) para conectarte al punto final del servidor MCP de Browserbase.
  • Lista las herramientas disponibles usando el punto final tools/list.
  • Invoca tareas de automatización del navegador llamando a las herramientas disponibles (como navegación, tomar capturas de pantalla o ejecutar JavaScript), pasando los parámetros necesarios.
  • Recupera resultados como capturas de pantalla, datos extraídos o registros de consola para usarlos en tu flujo de trabajo de IA o mostrarlos en tu aplicación.

Características clave

  • Automatización del navegador en la nube: Inicia y controla sesiones de navegador de forma remota con una orquestación potente.
  • Extracción de datos web: Reúne datos estructurados de cualquier página web en tiempo real.
  • Monitoreo de consola: Monitorea los registros de consola del navegador para depuración o captura de eventos en tiempo de ejecución.
  • Captura de pantalla: Toma capturas de pantalla a alta resolución, ya sea de toda la página o de elementos específicos.
  • Interacción rica con la web: Navega sitios web de forma programática, haz clic en botones y completa formularios.

Casos de uso

  • Agentes de IA navegando por la web: Permite que agentes LLM investiguen, extraigan datos de productos o comparen información entre sitios web.
  • Pruebas automatizadas y monitoreo: Realiza verificaciones automáticas de sitios web, pruebas o monitorea cambios en el contenido.
  • UX conversacional: Mejora chatbots o asistentes con datos web dinámicos y la capacidad de navegar en nombre de los usuarios.
  • Automatización de procesos: Completa formularios web o completa flujos de trabajo para los usuarios como parte de la automatización de procesos comerciales.

Preguntas frecuentes

1. ¿Debo ejecutar el servidor localmente o puede funcionar en la nube? Puedes ejecutar el servidor MCP de Browserbase en tu máquina local o desplegarlo en la nube, siempre que tu aplicación huésped MCP pueda conectarse a él.

2. ¿Cómo se asegura mi datos al usar el servidor MCP de Browserbase? Todos los intercambios de datos ocurren dentro del protocolo MCP estándar y seguro. Tú controlas las credenciales y la duración de las sesiones, manteniendo la navegación aislada del LLM y dentro de tu infraestructura.

3. ¿Qué navegadores son compatibles? El servidor MCP de Browserbase utiliza navegadores en la nube proporcionados por Browserbase y puede soportar navegadores modernos como Chrome (se planean otros).

4. ¿Puedo personalizar las configuraciones del navegador para tareas web especiales? Sí, hay opciones de configuración avanzada disponibles al modificar los parámetros de la API cuando inicias sesiones del navegador.

5. ¿Es posible usar Browserbase MCP con cualquier LLM? Absolutamente. Cualquier LLM o plataforma de agentes que soporte el protocolo MCP puede usar el servidor MCP de Browserbase.