Amazon Kendra Index MCP Server

Amazon Kendra Index MCP Server

Der Amazon Kendra Index MCP Server integriert die fortschrittlichen Suchfunktionen von Amazon Kendra mit KI- und LLM-basierten Tools. So können relevante Informationen aus Wissensdatenbanken der Organisation durch natürliche Sprache abgefragt und abgerufen werden.

Author: awslabs


Protokoll anzeigen

Was ist der Amazon Kendra Index MCP Server?

Der Amazon Kendra Index MCP Server ist ein MCP-konformer Server, der die Möglichkeiten der Amazon Kendra-Indizes für KI-gestützte Anwendungen und Agenten bereitstellt. Er ermöglicht es Benutzern und LLMs, verfügbare Kendra-Indizes aufzulisten und semantische Suchanfragen gegen indizierte Unternehmensdaten in natürlicher Sprache auszuführen. Dadurch erhalten sie relevante Dokumente und Einblicke als Kontext für generative KI-Aufgaben und Workflows.

So konfigurieren Sie den Amazon Kendra Index MCP Server

  1. Voraussetzungen:

    • Stellen Sie sicher, dass Sie ein AWS-Konto mit aktivem Amazon Kendra haben.
    • Richten Sie die erforderlichen IAM-Berechtigungen ein, damit der Server auf Kendra-Indizes zugreifen und Such-/Abfrageoperationen durchführen kann.
    • Installieren Sie Python 3.10+ und uv.
  2. Installation:

    • Installieren Sie den Amazon Kendra Index MCP Server mit:
      uvx awslabs.amazon-kendra-index-mcp-server@latest
      
    • Alternativ fügen Sie diesen Server zu Ihrer MCP-Client-Konfigurationsdatei (z. B. mcp.json, cline_mcp_settings.json) hinzu:
      {
        "awslabs.amazon-kendra-index-mcp-server": {
          "command": "uvx",
          "args": [
            "awslabs.amazon-kendra-index-mcp-server@latest"
          ],
          "env": {
            "AWS_PROFILE": "ihr-aws-profil",
            "AWS_REGION": "us-east-1",
            "FASTMCP_LOG_LEVEL": "ERROR"
          }
        }
      }
      
    • Passen Sie AWS_PROFILE und AWS_REGION nach Bedarf für Ihre Umgebung an.
  3. Zugangsdaten:

    • Stellen Sie sicher, dass die AWS-Zugangsdaten (Profil, Umgebungsvariablen oder EC2-Rollen) so konfiguriert sind, dass sie Zugriff auf Amazon Kendra-Ressourcen ermöglichen.
  4. (Optional) Docker-Unterstützung:

    • Sie können den Server als Docker-Container erstellen und ausführen, wenn Sie containerisierte Bereitstellungen bevorzugen.

So verwenden Sie den Amazon Kendra Index MCP Server

  1. Geben Sie den Server frei: Starten Sie nach der Konfiguration Ihren MCP-Client oder Agenten (wie Cline, Cursor, Windsurf usw.) mit dem Server, der als aktiviert aufgeführt ist.

  2. Kendra-Indizes entdecken: Fragen Sie Ihren KI-Assistenten oder rufen Sie direkt Tools auf, um die verfügbaren Kendra-Indizes in Ihrem Konto aufzulisten. Zum Beispiel:

    • "Liste alle verfügbaren Amazon Kendra-Indizes auf."
  3. Kendra-Indizes abfragen: Nutzen Sie natürliche Sprache, um in den indizierten Unternehmensdaten zu suchen. Zum Beispiel:

    • "Finde alle Dokumente zu unserer Datensicherheitspolitik mit dem Haupt-Kendra-Index der Firma."
  4. Ergebnisverarbeitung: Der MCP-Client oder LLM-Agent verwendet die relevanten Suchergebnisse, um sein Verständnis zu verbessern, Aktionen vorzuschlagen oder Antworten zu generieren, unter Verwendung von aktuellen, fachspezifischen Kenntnissen aus Ihren indizierten Quellen.

  5. Integration mit Agenten: LLM-basierte Agenten können Kendra-Suchergebnisse automatisch in RAG (Retrieval-Augmented Generation) Workflows integrieren, was die Genauigkeit und den Kontext der Antworten verbessert.

Hauptmerkmale

  • Indexauflistung: Auflisten aller verfügbaren Amazon Kendra-Indizes in Ihrem AWS-Konto.
  • Semantische Suche in natürlicher Sprache: Stellen Sie offene oder gezielte Anfragen an Kendra-Indizes in einfachem Englisch und rufen Sie die relevantesten Dokumente oder Absätze ab.
  • Enterprise RAG-Kontext: Ermöglichen Sie generativen KI-Assistenten den Zugang zu strukturiertem organisatorischen Wissen für genauere, kontextreiche Ausgaben.
  • Sicher und konfigurierbar: Nutzt AWS-Authentifizierung für sicheren Datenzugriff.
  • Flexible Integration: Funktioniert nahtlos mit jedem MCP-fähigen Client, Agenten oder Entwicklungsumgebung.

Anwendungsfälle

  • KI-gestützte Wissenssuche: Lassen Sie KI-Chatbots und -Assistenten Benutzerfragen mit Informationen beantworten, die aus Unternehmensdokumentationen, Wikis, Handbüchern oder technischen Repositories stammen, die in Kendra indiziert sind.
  • Kontextinjektion für Entwicklerassistenten: Stellen Sie Programmierassistenten und IDE-Agenten aktuelle, autoritative Anleitungen, Code-Snippets oder Richtliniendokumente zur Verfügung, die für das Projekt oder die Anfrage des Entwicklers relevant sind.
  • Automatisierte Compliance-Prüfungen: Ruft Richtliniendokumente, Compliance-Checklisten oder Anweisungen im Hinblick auf Prüfungs- oder Regulierungsanfragen ab und präsentiert sie.
  • Verbesserung von Unternehmensfragen und -antworten: Verwenden Sie LLMs in Kundenservice- oder HR-Tools, um Mitarbeiterfragen mithilfe vertrauenswürdiger organisatorischer Quellen zu beantworten.
  • RAG (Retrieval-Augmented Generation) Pipelines: Holen Sie präzisen Kontext aus Kendra, um generative AI-Antworten in faktenbasierten Unternehmensdaten zu verankern.

Häufig gestellte Fragen

F1: Brauche ich ein Amazon Kendra-Abonnement, um diesen Server zu nutzen?
Ja, Sie müssen Amazon Kendra in Ihrem AWS-Konto bereitgestellt haben und mindestens einen Index erstellt haben.

F2: Kann ich einschränken, welche Indizes für KI-Agenten offenbart werden?
Ja, der Zugriff wird über AWS IAM-Berechtigungen gesteuert. Sie können erlaubte Indizes über ressourcenbasierte Richtlinien einschränken.

F3: Auf welche Daten können KI-Assistenten über den Kendra Index MCP Server zugreifen?
Nur auf die Daten, die in Ihren konfigurierten Kendra-Indizes indiziert sind und auf die die IAM-Zugangsdaten des Servers Zugriff erlauben.

F4: Sind Abfragen an Kendra in Echtzeit oder gecached?
Abfragen sind live – jede Operation ruft die neuesten verfügbaren Ergebnisse von Kendra ab (unterliegt dem Indexierungszeitplan von Kendra).

F5: Wie werden große Ergebnislisten gehandhabt?
Standardmäßig werden nur die relevantesten Dokumente oder Snippets zurückgegeben (Paginierung oder Ergebnislimits können basierend auf Konfiguration und Toolparametern gelten).