AWS Rekognition MCP Server

AWS Rekognition MCP Server

Сервер AWS Rekognition MCP позволяет ИИ-ассистентам и инструментам разработки использовать возможности компьютерного зрения Amazon Rekognition как динамические инструменты в workflows, обеспечивая бесшовное взаимодействие с функциями анализа изображений и видео через стандартный интерфейс протокола Model Context Protocol.

Author: awslabs


Просмотреть протокол

Что такое сервер AWS Rekognition MCP?

Сервер AWS Rekognition MCP — это специализированный MCP-сервер, который предоставляет функции анализа изображений и видео Amazon Rekognition как вызываемые инструменты для больших языковых моделей (LLM) и агентов ИИ. Он позволяет приложениям программно анализировать изображения для обнаружения объектов, распознавания сцен, анализа лиц и многого другого с использованием Amazon Rekognition, все это в безопасном и расширяемом workflow протокола Model Context Protocol.

Как настроить сервер AWS Rekognition MCP

  • Установите uv из Astral и убедитесь, что у вас установлен Python 3.10 или выше.
  • Настройте свои учетные данные AWS (используя профиль AWS или переменные окружения) с разрешениями на доступ к Amazon Rekognition.
  • Добавьте запись конфигурации в настройки вашего клиента MCP (такие как mcp.json, cline_mcp_settings.json или назначенный конфигурационный файл вашего инструмента) в разделе mcpServers, например:
    {
      "awslabs.amazon-rekognition-mcp-server": {
        "command": "uvx",
        "args": ["awslabs.amazon-rekognition-mcp-server@latest"],
        "env": {
          "AWS_PROFILE": "ваш-aws-профиль",
          "AWS_REGION": "us-east-1",
          "FASTMCP_LOG_LEVEL": "ERROR"
        }
      }
    }
    
  • При желании, задайте AWS_REGION и отрегулируйте уровень логирования или другие переменные окружения по мере необходимости.
  • Сохраните и перезапустите ваш клиент MCP или ассистента LLM, чтобы загрузить новый сервер.

Как использовать сервер AWS Rekognition MCP

  1. В вашем интерфейсе чата или инструменте ИИ-программирования убедитесь, что сервер AWS Rekognition MCP включен и работает.
  2. Когда вам предложат проанализировать изображение, дайте указание ассистенту использовать возможности Rekognition, например, "Проанализируй это изображение на предмет объектов с помощью Rekognition."
  3. Клиент MCP обнаружит и вызовет соответствующие инструменты (такие как detect_labels, detect_faces), предоставляемые сервером Rekognition MCP.
  4. Проверьте и, если необходимо, одобрите действия инструментов в вашем клиенте (процессы одобрения зависят от вашего интерфейса).
  5. Сервер обрабатывает изображение, вызывает API Amazon Rekognition и возвращает результаты (такие как обнаруженные метки, лица или текст) непосредственно в ваш рабочий процесс с поддержкой ИИ для использования в дальнейших задачах или отображения.

Ключевые особенности

  • Интеграция в реальном времени с API анализа изображений и видео Amazon Rekognition
  • Поддержка множества задач распознавания: обнаружение меток, анализ лиц, обнаружение текста в изображении и классификация сцен
  • Стандартизированный вызов инструментов и обработка результатов через MCP, совместимый с различными инструментами ИИ и IDE
  • Безопасное, настраиваемое выполнение с использованием ваших собственных учетных данных и инфраструктуры AWS
  • Легко комбинируется с другими серверами MCP AWS и инструментами разработчиков в рамках одного рабочего процесса

Примеры использования

  • Автоматизированная модерация контента для изображений, загруженных пользователями в чат-ботах, приложениях или инструментах для бизнеса
  • Создание интеллектуальных ассистентов, которые резюмируют, классифицируют или отмечают коллекции изображений для документации, поиска или каталогизации
  • Извлечение текстовой информации из скриншотов, форм или изображений с указателями — интегрировано в более крупные автоматизации рабочего процесса документов
  • Автоматизация задач безопасности, аутентификации или соблюдения норм с помощью анализа лиц или обнаружения объектов в изображениях
  • Поддержка задач генерации кода, которые динамически выбирают модели ML или логику на основе проанализированного содержимого изображения
  • Быстрая разработка визуальных функций на основе ИИ с использованием подсказок на естественном языке в ассистентах программирования или IDE

Часто задаваемые вопросы

Вопрос 1: Какие разрешения нужны для запуска сервера AWS Rekognition MCP?
Вам нужны учетные данные AWS с по меньшей мере rekognition:DetectLabels, rekognition:DetectFaces и другими необходимыми разрешениями API Rekognition для анализируемых ресурсов.

Вопрос 2: Могу ли я использовать сервер Rekognition MCP с локальными изображениями?
Да; большинство клиентов поддерживают загрузку локальных изображений для анализа, которые сервер обрабатывает либо загружая в S3, либо через прямой API (в зависимости от конфигурации и инструмента).

Вопрос 3: Как ограничить или одобрить запросы на чувствительные данные изображений?
Workflow MCP включает шаги одобрения для каждого вызова инструмента в многих IDE и чат-клиентах; вы можете отключить "autoApprove" и требовать ручного обзора перед каждый анализом.

Вопрос 4: Поддерживается ли видеоанализ?
Сервер сосредоточен на основных API Rekognition, включая обнаружение меток и лиц для изображений; поддержка анализа видео может зависеть от дорожной карты внедрения или обновлений сервера.

Вопрос 5: Результаты Rekognition отправляются LLM?
Да. Результаты анализа (метки, обнаруженные лица, текст и т. д.) возвращаются через клиент MCP к ассистенту или агенту ИИ для использования в контекстуально осознанных ответах или для автоматизации дальнейших действий.