AWS HealthOmics MCP Server

Qu'est-ce que le serveur AWS HealthOmics MCP ?

Le serveur AWS HealthOmics MCP est un serveur spécialisé Model Context Protocol (MCP) conçu pour relier les applications IA et la plateforme AWS HealthOmics. Il expose des points de terminaison sécurisés et standardisés pour que les LLM et les outils de codage IA puissent créer, gérer et introspecter des flux de travail en sciences de la vie écrits dans des langages comme WDL, Nextflow et CWL sur AWS HealthOmics. Ce serveur simplifie le processus d'orchestration des pipelines de génomique et de bioinformatique, en abstrait la complexité derrière les appels de fonction natifs à l'IA.

Comment configurer

Prérequis :
- Assurez-vous d'avoir Python (>=3.10) installé (de préférence via uv d'Astral).
- Configurez vos identifiants AWS (profil ou variables d'environnement) avec les autorisations suffisantes pour utiliser AWS HealthOmics.
Installation :
- Installez ou mettez à jour le serveur en utilisant la commande suivante :
```
uvx awslabs.aws-healthomics-mcp-server@latest
```
- Ou ajoutez-le à la configuration de votre client MCP (voir les exemples ci-dessous).

Configuration du client :

Ajoutez une entrée à votre fichier de configuration client MCP (par exemple, mcp.json, cline_mcp_settings.json, etc.) :

"awslabs.aws-healthomics-mcp-server": {
  "command": "uvx",
  "args": ["awslabs.aws-healthomics-mcp-server@latest"],
  "env": {
    "AWS_PROFILE": "votre-profil-aws",
    "AWS_REGION": "us-east-1",
    "FASTMCP_LOG_LEVEL": "ERROR"
  }
}

Paramètres optionnels :
- Personnalisez avec des variables telles que le langage de flux de travail, le répertoire des pipelines ou les paramètres de concurrence comme décrit dans le README du serveur.

Option Conteneur :

Construisez et exécutez dans Docker comme :

docker build -t awslabs/aws-healthomics-mcp-server ./src/aws-healthomics-mcp-server
docker run --rm -it -e AWS_PROFILE=votre-profil-aws -e AWS_REGION=us-east-1 awslabs/aws-healthomics-mcp-server:latest

Comment utiliser

Découverte :
- Utilisez la fonctionnalité de liste d'outils ou l'interface utilisateur de votre assistant IA (comme Cline, Cursor, ou Windsurf) pour trouver les outils HealthOmics.
Prompts :
- Donnez à votre agent des instructions telles que :
  
  "En utilisant le serveur AWS HealthOmics MCP, générez un nouveau flux de travail Nextflow pour une analyse RNA-seq."
  "Déboguez cette exécution de pipeline échouée dans HealthOmics."
Invocation d'outils :
- Le LLM ou l'agent appellera des fonctions telles que list_workflows, create_workflow, run_workflow, ou get_run_status selon les besoins.
Modes d'exécution :
- Utilisez le mode ‘Plan’ pour des suggestions et des révisions, ou le mode ‘Act’ pour laisser l'agent exécuter directement les opérations de gestion de flux de travail (avec approbation manuelle ou automatique pour les actions sensibles).
Suivi des flux de travail :
- Demandez des statuts en temps réel ou des résumés des exécutions de flux de travail ; recevez des journaux, des messages de diagnostic et des métriques d'exécution via la sortie de l'agent.
Intégration :
- Combinez les actions HealthOmics avec le traitement ou la visualisation des données en enchaînant des outils dans une seule automatisation ou session d'agent.

Fonctionnalités principales

Support multi-langage des flux de travail : Prend en charge la génération et l'exécution pour les flux de travail WDL, Nextflow et CWL.
Gestion de flux de travail de bout en bout : Permet la création, la soumission, le suivi des statuts, le débogage et l'optimisation pour les pipelines HealthOmics depuis une interface native à l'IA.
Sécurisé et conforme : Utilise vos identifiants ou profils AWS pour une exécution sécurisée, soutenant les politiques organisationnelles et les contrôles d'accès.
Diagnostics intégrés : Récupère les journaux d'exécution, les rapports d'erreur et les métriques d'exécution pour un débogage et une optimisation efficaces.
Outils orientés agent : Expose des fonctions d'outils concises et découvrables pour l'intégration LLM, simplifiant la synthèse des commandes et l'approbation des actions.
Prêt pour l'automatisation : Idéal pour une utilisation dans des évaluations par lots, des sessions de codage assisté et des flux de travail de bioinformatique natifs dans le cloud.

Cas d'utilisation

Création de flux de travail en bioinformatique : Génération rapide de nouveaux pipelines d'analyse en génomique ou protéomique à partir d'instructions en anglais de haut niveau.
Exécution automatisée de flux de travail : Soumission et suivi sans couture des flux de travail HealthOmics pour des analyses par lot à grande échelle.
Débogage de pipeline : Résolution interactive des exécutions analytiques échouées ou sous-performantes avec révision des journaux et recommandations de remédiation.
Recherche en sciences de la vie collaborative : Équipes de codage ou scientifiques de données itèrent ensemble sur des pipelines de traitement des données reproductibles via des interfaces conversationnelles.
Surveillance réglementaire et de conformité : Utilisez des assistants pilotés par IA pour auditer les définitions de flux de travail ou les traces d'exécution pour respecter les meilleures pratiques et la conformité.
Éducation et formation : Enseignez les concepts des flux de travail en bioinformatique de manière interactive avec des retours instantanés, des suggestions de code et des données synthétiques.

FAQ

Q1 : Puis-je utiliser le serveur AWS HealthOmics MCP avec plusieurs langages de flux de travail ?
Oui, le serveur prend en charge les flux de travail WDL, Nextflow et CWL. Vous pouvez spécifier le langage de flux de travail dans votre prompt ou votre configuration et utiliser différents outils ou APIs selon les besoins.

Q2 : Comment puis-je suivre le statut de mes exécutions de flux de travail ?
Listez ou obtenez le statut des flux de travail en cours, complétés ou échoués en utilisant les outils list_workflow_runs ou get_workflow_run_status. Vous pouvez également demander des journaux pour un débogage plus approfondi.

Q3 : Ai-je besoin de permissions IAM spéciales pour utiliser ce serveur ?
Oui, vos identifiants AWS doivent accorder des permissions appropriées pour les APIs AWS HealthOmics (comme l'exécution de flux de travail, l'accès aux compartiments S3 pour les données d'entrée/sortie et la visualisation des journaux).

Q4 : Mon agent IA peut-il analyser les erreurs dans les exécutions de pipeline échouées ?
Oui, le serveur permet aux agents de récupérer les journaux d'exécution, les traces d'erreur et les recommandations pour les motifs d'échec courants.

Q5 : Mes données scientifiques sont-elles sécurisées lorsque j'utilise le serveur MCP ?
Le serveur fonctionnent dans votre environnement AWS sécurisé et ne déplace ni n'expose les données en dehors de votre compte, sauf si cela est configuré explicitement.

Nom du Protocole	Description
list_workflows	list_workflows Liste tous les flux de travail disponibles enregistrés avec AWS HealthOmics dans votre compte. Utile pour naviguer, auditer ou sélectionner un pipeline pour exécution ou inspection.
create_workflow	create_workflow Enregistre une nouvelle définition de flux de travail HealthOmics (WDL, Nextflow ou CWL). Nécessite un script ou un modèle de flux de travail et des paramètres de configuration. Renvoie les détails et les identifiants d'enregistrement du flux de travail.
run_workflow	run_workflow Exécute (soumet) un flux de travail enregistré avec des entrées et des ressources computationnelles spécifiées. Accepte des paramètres pour sélectionner le flux de travail, les fichiers de données d'entrée (par exemple, depuis S3) et des options pour l'allocation des ressources.
get_workflow_run_status	get_workflow_run_status Récupère le statut et les métadonnées pour un exécution spécifique de flux de travail. Inclut la phase d'exécution, le résumé des résultats, les codes d'erreur (si échoué) et les horodatages.
list_workflow_runs	list_workflow_runs Récupère les historiques et les statuts de tous les exécutions de flux de travail, filtrables par flux de travail, état ou fenêtre temporelle. Utile pour le suivi et les rapports de haut niveau.
get_workflow_logs	get_workflow_logs Récupère les journaux d'exécution et les diagnostics pour le débogage des échecs de flux de travail ou les goulets d'étranglement de performance. Permet un débogage ciblé et des pistes d'audit.