Qu'est-ce que le serveur AWS HealthOmics MCP ?
Le serveur AWS HealthOmics MCP est un serveur spécialisé Model Context Protocol (MCP) conçu pour relier les applications IA et la plateforme AWS HealthOmics. Il expose des points de terminaison sécurisés et standardisés pour que les LLM et les outils de codage IA puissent créer, gérer et introspecter des flux de travail en sciences de la vie écrits dans des langages comme WDL, Nextflow et CWL sur AWS HealthOmics. Ce serveur simplifie le processus d'orchestration des pipelines de génomique et de bioinformatique, en abstrait la complexité derrière les appels de fonction natifs à l'IA.
Comment configurer
- Prérequis :
- Assurez-vous d'avoir Python (>=3.10) installé (de préférence via
uv
d'Astral). - Configurez vos identifiants AWS (profil ou variables d'environnement) avec les autorisations suffisantes pour utiliser AWS HealthOmics.
- Assurez-vous d'avoir Python (>=3.10) installé (de préférence via
- Installation :
- Installez ou mettez à jour le serveur en utilisant la commande suivante :
uvx awslabs.aws-healthomics-mcp-server@latest
- Ou ajoutez-le à la configuration de votre client MCP (voir les exemples ci-dessous).
- Installez ou mettez à jour le serveur en utilisant la commande suivante :
- Configuration du client :
- Ajoutez une entrée à votre fichier de configuration client MCP (par exemple,
mcp.json
,cline_mcp_settings.json
, etc.) :"awslabs.aws-healthomics-mcp-server": { "command": "uvx", "args": ["awslabs.aws-healthomics-mcp-server@latest"], "env": { "AWS_PROFILE": "votre-profil-aws", "AWS_REGION": "us-east-1", "FASTMCP_LOG_LEVEL": "ERROR" } }
- Ajoutez une entrée à votre fichier de configuration client MCP (par exemple,
- Paramètres optionnels :
- Personnalisez avec des variables telles que le langage de flux de travail, le répertoire des pipelines ou les paramètres de concurrence comme décrit dans le README du serveur.
- Option Conteneur :
- Construisez et exécutez dans Docker comme :
docker build -t awslabs/aws-healthomics-mcp-server ./src/aws-healthomics-mcp-server docker run --rm -it -e AWS_PROFILE=votre-profil-aws -e AWS_REGION=us-east-1 awslabs/aws-healthomics-mcp-server:latest
- Construisez et exécutez dans Docker comme :
Comment utiliser
- Découverte :
- Utilisez la fonctionnalité de liste d'outils ou l'interface utilisateur de votre assistant IA (comme Cline, Cursor, ou Windsurf) pour trouver les outils HealthOmics.
- Prompts :
- Donnez à votre agent des instructions telles que :
"En utilisant le serveur AWS HealthOmics MCP, générez un nouveau flux de travail Nextflow pour une analyse RNA-seq."
"Déboguez cette exécution de pipeline échouée dans HealthOmics."
- Donnez à votre agent des instructions telles que :
- Invocation d'outils :
- Le LLM ou l'agent appellera des fonctions telles que
list_workflows
,create_workflow
,run_workflow
, ouget_run_status
selon les besoins.
- Le LLM ou l'agent appellera des fonctions telles que
- Modes d'exécution :
- Utilisez le mode ‘Plan’ pour des suggestions et des révisions, ou le mode ‘Act’ pour laisser l'agent exécuter directement les opérations de gestion de flux de travail (avec approbation manuelle ou automatique pour les actions sensibles).
- Suivi des flux de travail :
- Demandez des statuts en temps réel ou des résumés des exécutions de flux de travail ; recevez des journaux, des messages de diagnostic et des métriques d'exécution via la sortie de l'agent.
- Intégration :
- Combinez les actions HealthOmics avec le traitement ou la visualisation des données en enchaînant des outils dans une seule automatisation ou session d'agent.
Fonctionnalités principales
- Support multi-langage des flux de travail : Prend en charge la génération et l'exécution pour les flux de travail WDL, Nextflow et CWL.
- Gestion de flux de travail de bout en bout : Permet la création, la soumission, le suivi des statuts, le débogage et l'optimisation pour les pipelines HealthOmics depuis une interface native à l'IA.
- Sécurisé et conforme : Utilise vos identifiants ou profils AWS pour une exécution sécurisée, soutenant les politiques organisationnelles et les contrôles d'accès.
- Diagnostics intégrés : Récupère les journaux d'exécution, les rapports d'erreur et les métriques d'exécution pour un débogage et une optimisation efficaces.
- Outils orientés agent : Expose des fonctions d'outils concises et découvrables pour l'intégration LLM, simplifiant la synthèse des commandes et l'approbation des actions.
- Prêt pour l'automatisation : Idéal pour une utilisation dans des évaluations par lots, des sessions de codage assisté et des flux de travail de bioinformatique natifs dans le cloud.
Cas d'utilisation
- Création de flux de travail en bioinformatique : Génération rapide de nouveaux pipelines d'analyse en génomique ou protéomique à partir d'instructions en anglais de haut niveau.
- Exécution automatisée de flux de travail : Soumission et suivi sans couture des flux de travail HealthOmics pour des analyses par lot à grande échelle.
- Débogage de pipeline : Résolution interactive des exécutions analytiques échouées ou sous-performantes avec révision des journaux et recommandations de remédiation.
- Recherche en sciences de la vie collaborative : Équipes de codage ou scientifiques de données itèrent ensemble sur des pipelines de traitement des données reproductibles via des interfaces conversationnelles.
- Surveillance réglementaire et de conformité : Utilisez des assistants pilotés par IA pour auditer les définitions de flux de travail ou les traces d'exécution pour respecter les meilleures pratiques et la conformité.
- Éducation et formation : Enseignez les concepts des flux de travail en bioinformatique de manière interactive avec des retours instantanés, des suggestions de code et des données synthétiques.
FAQ
Q1 : Puis-je utiliser le serveur AWS HealthOmics MCP avec plusieurs langages de flux de travail ?
Oui, le serveur prend en charge les flux de travail WDL, Nextflow et CWL. Vous pouvez spécifier le langage de flux de travail dans votre prompt ou votre configuration et utiliser différents outils ou APIs selon les besoins.
Q2 : Comment puis-je suivre le statut de mes exécutions de flux de travail ?
Listez ou obtenez le statut des flux de travail en cours, complétés ou échoués en utilisant les outils list_workflow_runs
ou get_workflow_run_status
. Vous pouvez également demander des journaux pour un débogage plus approfondi.
Q3 : Ai-je besoin de permissions IAM spéciales pour utiliser ce serveur ?
Oui, vos identifiants AWS doivent accorder des permissions appropriées pour les APIs AWS HealthOmics (comme l'exécution de flux de travail, l'accès aux compartiments S3 pour les données d'entrée/sortie et la visualisation des journaux).
Q4 : Mon agent IA peut-il analyser les erreurs dans les exécutions de pipeline échouées ?
Oui, le serveur permet aux agents de récupérer les journaux d'exécution, les traces d'erreur et les recommandations pour les motifs d'échec courants.
Q5 : Mes données scientifiques sont-elles sécurisées lorsque j'utilise le serveur MCP ?
Le serveur fonctionnent dans votre environnement AWS sécurisé et ne déplace ni n'expose les données en dehors de votre compte, sauf si cela est configuré explicitement.