AWS Rekognition MCP Server

AWS Rekognition MCP Server

AWS Rekognition MCP 服务器使 AI 助手和开发工具能够通过标准化的模型上下文协议接口,访问 Amazon Rekognition 的计算机视觉功能,提供图像和视频分析功能的无缝交互。

Author: awslabs


查看协议

什么是 AWS Rekognition MCP 服务器?

AWS Rekognition MCP 服务器是一个专用的 MCP 服务器,提供 Amazon Rekognition 的图像和视频分析功能,供大型语言模型(LLMs)和 AI 助手调用。它允许应用程序通过编程方式分析图像,实现物体检测、场景识别、面部分析等功能,所有操作都在模型上下文协议的安全和可扩展的工作流程中进行。

如何配置 AWS Rekognition MCP 服务器

  • Astral 安装 uv,确保你有 Python 3.10 及以上版本。
  • 配置你的 AWS 凭证(使用 AWS 配置文件或环境变量),以便访问 Amazon Rekognition 的权限。
  • 在 MCP 客户端设置中添加配置条目(如 mcp.jsoncline_mcp_settings.json 或你工具的指定配置文件),例如:
    {
      "awslabs.amazon-rekognition-mcp-server": {
        "command": "uvx",
        "args": ["awslabs.amazon-rekognition-mcp-server@latest"],
        "env": {
          "AWS_PROFILE": "你的 AWS 配置文件",
          "AWS_REGION": "us-east-1",
          "FASTMCP_LOG_LEVEL": "ERROR"
        }
      }
    }
    
  • 可选地,设置 AWS_REGION 并根据需要微调日志记录或其他环境设置。
  • 保存并重新启动你的 MCP 客户端或 LLM 助手,以加载新服务器。

如何使用 AWS Rekognition MCP 服务器

  1. 在你的聊天界面或 AI 编码工具中,确保 AWS Rekognition MCP 服务器已启用并正在运行。
  2. 当提示分析图像时,指示助手使用 Rekognition 功能,例如:“使用 Rekognition 分析此图像中的物体。”
  3. MCP 客户端将发现并调用 Rekognition MCP 服务器所提供的工具(如 detect_labelsdetect_faces)。
  4. 在你的客户端中检查并(如果需要)批准工具操作(批准流程取决于你特定的界面)。
  5. 服务器处理图像,调用 Amazon Rekognition 的 API,并将结果(如检测到的标签、面孔或文本)直接返回到你的 AI 助理工作流程中,以用于进一步任务或显示。

主要特点

  • 与 Amazon Rekognition 图像和视频分析 API 的实时集成
  • 支持多种识别任务:标签检测、面部分析、图像中的文本检测和场景分类
  • 通过 MCP 的标准化工具调用和结果处理,兼容多种 AI 工具链和 IDE
  • 使用你自己的 AWS 凭证和基础设施进行安全、可配置的执行
  • 与其他 AWS MCP 服务器和开发工具在同一工作流程中易于组合

使用案例

  • 自动内容审核,用于聊天机器人、应用或企业工具中用户上传的图像
  • 构建智能助手,总结、分类或标记图像集合,用于文档、搜索或目录
  • 从屏幕截图、表单或标识图像中提取文本信息—集成到更大的文档工作流自动化中
  • 自动化安全、身份验证或合规任务,通过图像中的面部分析或物体检测实现
  • 辅助代码生成任务,根据分析的图像内容动态选择 ML 模型或逻辑
  • 使用自然语言提示,在编码助手或 IDE 中快速原型化视觉 AI 驱动的功能

常见问题

Q1: 运行 AWS Rekognition MCP 服务器需要什么权限?
你需要具有至少 rekognition:DetectLabelsrekognition:DetectFaces 和其他所需的 Rekognition API 权限的 AWS 凭证,以访问你打算分析的资源。

Q2: 我可以使用本地图像文件与 Rekognition MCP 服务器吗?
可以;大多数客户端支持上传本地图像进行分析,服务器处理这些图像,方式是上传到 S3 或通过直接 API(取决于配置和工具)。

Q3: 如何限制或批准对敏感图像数据的请求?
MCP 工作流程在许多 IDE 和聊天客户端中包括每个工具调用的批准步骤;你可以禁用“自动批准”,并要求在每次分析之前进行手动审核。

Q4: 支持视频分析吗?
服务器专注于核心 Rekognition API,包括图像的标签与面部检测;视频分析的支持可能取决于实施路线图或服务器更新。

Q5: 来自 Rekognition 的结果会发送到 LLM 吗?
是的。分析结果(标签、检测到的面孔、文本等)通过 MCP 客户端返回给 AI 助手或代理,用于上下文感知回答或自动化进一步操作。