Amazon Kendra Index MCP Server

Amazon Kendra Index MCP Server

El servidor Amazon Kendra Index MCP integra las capacidades avanzadas de búsqueda empresarial de Amazon Kendra con herramientas basadas en IA y LLM, permitiendo la descubrimiento y recuperación de información relevante de bases de conocimiento organizacionales mediante consultas en lenguaje natural.

Author: awslabs


Ver Protocolo

¿Qué es el servidor Amazon Kendra Index MCP?

El servidor Amazon Kendra Index MCP es un servidor conforme a MCP que expone las capacidades de los índices de Amazon Kendra a aplicaciones y agentes impulsados por IA. Permite a los usuarios y a los LLM listar los índices de Kendra disponibles y realizar consultas de búsqueda semántica sobre datos empresariales indexados usando lenguaje natural, proporcionando documentos e información relevante como contexto para tareas y flujos de trabajo de IA generativa.

Cómo configurar el servidor Amazon Kendra Index MCP

  1. Requisitos previos:

    • Asegúrate de tener una cuenta de AWS con Amazon Kendra habilitado.
    • Configura permisos IAM apropiados para que el servidor pueda acceder a los índices de Kendra y realizar operaciones de búsqueda/consulta.
    • Instala Python 3.10+ y uv.
  2. Instalación:

    • Instala el servidor Amazon Kendra Index MCP usando:
      uvx awslabs.amazon-kendra-index-mcp-server@latest
      
    • Alternativamente, incluye este servidor en tu archivo de configuración del cliente MCP (por ejemplo, mcp.json, cline_mcp_settings.json) así:
      {
        "awslabs.amazon-kendra-index-mcp-server": {
          "command": "uvx",
          "args": [
            "awslabs.amazon-kendra-index-mcp-server@latest"
          ],
          "env": {
            "AWS_PROFILE": "tu-perfil-aws",
            "AWS_REGION": "us-east-1",
            "FASTMCP_LOG_LEVEL": "ERROR"
          }
        }
      }
      
    • Ajusta AWS_PROFILE y AWS_REGION según sea necesario para tu entorno.
  3. Credenciales:

    • Asegúrate de que las credenciales de AWS (perfil, variables de entorno o roles de EC2) estén configuradas para permitir el acceso a los recursos de Amazon Kendra.
  4. (Opcional) Soporte para Docker:

    • Puedes construir y ejecutar el servidor como un contenedor Docker si prefieres implementaciones en contenedor.

Cómo usar el servidor Amazon Kendra Index MCP

  1. Habilitar el servidor: Después de configurarlo, inicia tu cliente o agente MCP (como Cline, Cursor, Windsurf, etc.) con el servidor listado como habilitado.

  2. Descubrir índices de Kendra: Puedes pedirle a tu asistente de IA, o invocar herramientas directamente, que enumeren los índices de Kendra disponibles en tu cuenta. Por ejemplo:

    • "Lista todos los índices de Amazon Kendra disponibles."
  3. Consultar índices de Kendra: Usa lenguaje natural para buscar datos en los datos empresariales indexados. Por ejemplo:

    • "Encuentra todos los documentos sobre nuestra política de seguridad de datos usando el índice corporativo principal de Kendra."
  4. Manejo de resultados: El cliente MCP o el agente LLM utilizará los resultados de búsqueda relevantes para mejorar su comprensión, sugerir acciones o generar respuestas aprovechando el conocimiento actualizado y específico del dominio de tus fuentes indexadas.

  5. Integración con agentes: Los agentes basados en LLM pueden integrar automáticamente los resultados de búsqueda de Kendra en flujos de trabajo de RAG (Generación Aumentada por Recuperación), mejorando la veracidad y el contexto de las respuestas.

Características clave

  • Listado de índices: Enumera todos los índices de Amazon Kendra disponibles en tu cuenta de AWS.
  • Búsqueda semántica en lenguaje natural: Emite consultas abiertas o dirigidas a los índices de Kendra usando inglés simple, recuperando los documentos o pasajes más relevantes.
  • Contexto empresarial de RAG: Permite que asistentes de IA generativa accedan a conocimiento organizacional estructurado para generar salidas más precisas y ricas en contexto.
  • Seguro y configurable: Utiliza autenticación de AWS para un acceso seguro a los datos.
  • Integración flexible: Funciona sin problemas con cualquier cliente, agente o entorno de desarrollo habilitado para MCP.

Casos de uso

  • Búsqueda de conocimiento impulsada por IA: Permite que los chatbots y asistentes de IA respondan preguntas de los usuarios con información extraída de documentación empresarial, wikis, manuales o repositorios técnicos indexados en Kendra.
  • Inyección de contexto para asistentes de desarrollo: Proporciona a los asistentes de codificación y agentes IDE orientaciones, fragmentos o documentos de políticas actualizados y autorizados relevantes para el proyecto o consulta del desarrollador.
  • Verificaciones de cumplimiento automatizadas: Recupera y presenta documentos de políticas, listas de verificación de cumplimiento o instrucciones en respuesta a auditorías o consultas regulatorias.
  • Mejora de preguntas y respuestas empresariales: Utiliza con LLMs en herramientas de soporte al cliente o recursos humanos para responder preguntas de empleados usando fuentes organizacionales confiables.
  • Pipelines de RAG (Generación Aumentada por Recuperación): Obtén contexto preciso de Kendra para fundamentar las respuestas de IA generativa en datos fácticos de la empresa.

Preguntas frecuentes

Q1: ¿Necesito una suscripción a Amazon Kendra para usar este servidor?
Sí, debes tener Amazon Kendra provisionado en tu cuenta de AWS y uno o más índices creados.

Q2: ¿Puedo restringir qué índices se exponen a los agentes de IA?
Sí, el acceso se controla a través de permisos IAM de AWS. Puedes limitar los índices permitidos mediante políticas basadas en recursos.

Q3: ¿Qué datos pueden acceder los asistentes de IA a través del servidor Kendra Index MCP?
Solo los datos indexados en tus índices de Kendra configurados y a los que las credenciales IAM del servidor permiten el acceso.

Q4: ¿Las consultas a Kendra son en tiempo real o en caché?
Las consultas son en vivo; cada operación recupera los resultados más recientes de Kendra (sujeto al horario de indexación de Kendra).

Q5: ¿Cómo se manejan los conjuntos de resultados grandes?
Por defecto, solo se devuelven los documentos o fragmentos más relevantes (pueden aplicarse límites de paginación o de resultados, según la configuración y los parámetros de la herramienta).