Model Context Protocol (MCP) est une norme ouverte qui permet aux agents d’IA d’appeler des outils externes. Le serveur MCP de W&B donne à votre IDE, à votre assistant de code ou à votre agent conversationnel un accès direct à vos données et à votre documentation W&B, afin de répondre aux questions sur vos runs, traces, évaluations et artefacts sans avoir à faire de copier-coller. Pour obtenir la liste complète de ce que vous pouvez faire avec le serveur, consultez la section fonctionnalités du serveur MCP de W&B. Il s’intègre nativement à la plupart des IDE, assistants de code et agents conversationnels, notamment :Documentation Index
Fetch the complete documentation index at: https://wb-21fd5541-docs-2658.mintlify.app/llms.txt
Use this file to discover all available pages before exploring further.
- Cursor
- Visual Studio Code (VS Code)
- Claude Code
- Codex
- Gemini CLI
- Mistral LeChat
- Claude Desktop
Types de déploiement
Serveur hébergé (recommandé)
Un serveur MCP géré par W&B, auquel votre client se connecte via HTTP avec votre clé API W&B. Aucune installation ni aucun processus local à maintenir.Utiliser le serveur hébergé
Installation locale
Exécutez le serveur MCP sur votre propre machine via STDIO ou HTTP. À utiliser si vous avez besoin d’un fonctionnement isolé du réseau, de verrouiller une version précise, d’un comportement de serveur personnalisé, d’un développement actif du serveur ou de la prise en charge d’un client qui ne prend en charge que STDIO.Exécuter le serveur MCP localement
Prérequis
- Créez une clé API W&B sur wandb.ai/authorize.
- Définissez cette clé comme variable d’environnement
WANDB_API_KEY, ou transmettez-la à votre client sous forme de jeton Bearer. - Pour Cloud dédié, Autogéré et les installations locales sur une instance autre que l’instance par défaut, définissez la variable d’environnement
WANDB_BASE_URLsur l’URL de votre instance.
Utiliser le serveur hébergé
Authorization.
URL de connexion
| Déploiement | URL du serveur |
|---|---|
| Cloud mutualisé | https://mcp.withwandb.com/mcp |
| Cloud dédié | https://<your-instance>/mcp |
| Autogéré | https://<your-instance>/mcp |
https://mcp.withwandb.com/mcp par https://<your-instance>/mcp et laissez tout le reste inchangé. Les configurations client ci-dessous utilisent l’URL du Cloud mutualisé.
- Claude Code
- Claude Desktop
- Codex
- Cursor
- Gemini CLI
- Mistral LeChat
- API Responses d’OpenAI
- VS Code
Exécutez la commande suivante dans votre terminal, en remplaçant le jeton Bearer par votre clé API W&B :Ajoutez
--scope user pour configurer Claude Code globalement. Omettez-le pour configurer uniquement le projet en cours.Vérifiez la connexion en demandant List my W&B entities. L’agent doit appeler list_entities_tool et renvoyer votre nom d’utilisateur ainsi que les éventuelles Teams. Si la connexion échoue, voir Résolution des problèmes. Pour plus d’informations, voir la documentation MCP de Claude Code.Exécuter le serveur MCP en local
- Environnements isolés du réseau ou hors ligne où votre client ne peut pas atteindre un point de terminaison W&B hébergé.
- Version épinglée. Le serveur hébergé suit la branche principale. Une installation locale permet d’épingler une balise de version spécifique.
- Comportement personnalisé du serveur, comme modifier les descriptions des outils, ajouter des outils ou définir un budget de jetons de réponse différent de la valeur par défaut.
- Développement actif sur le serveur lui-même.
- Clients STDIO uniquement ou clients nécessitant un processus local.
WANDB_BASE_URL avec l’URL de votre instance.
Prérequis locaux
- Python 3.11 ou version ultérieure.
uvoupip.- Une clé API W&B, définie dans
WANDB_API_KEY. WANDB_BASE_URLdéfini sur l’URL de votre instance si vous utilisez Cloud dédié ou Autogéré.
Installer le serveur
- uvx (sans installation permanente)
- uv
- pip
- Installer depuis GitHub
Configurez votre client
<your-wandb-api-key> par votre clé API W&B si nécessaire :
- Claude Code
- Claude Desktop
- Codex
- Cursor
- VS Code
Exécutez la commande suivante. Ajoutez
--scope user pour une configuration globale.Exécutez le serveur avec le transport HTTP
Variables d’environnement
env de votre client ou exportez-les dans votre shell.
| Variable | Description |
|---|---|
WANDB_API_KEY | Clé API W&B pour l’authentification. Requise. |
WANDB_BASE_URL | URL personnalisée de l’instance W&B pour Cloud dédié ou Autogéré. Valeur par défaut : https://api.wandb.ai. |
WANDB_MCP_PROXY_DOCS | Active le proxy de recherche dans la documentation search_wandb_docs_tool. Valeur par défaut : true. |
WANDBOT_BASE_URL | Point de terminaison personnalisé pour le proxy de recherche dans la documentation. |
MAX_RESPONSE_TOKENS | Budget de jetons pour la troncature des réponses des outils. Valeur par défaut : 30000. |
MCP_SERVER_LOG_LEVEL | Niveau de verbosité de la journalisation. Valeurs possibles : DEBUG, INFO, WARNING, ERROR. |
Capacités du serveur MCP de W&B
- “Montrez-moi les 5 meilleurs runs selon
eval/accuracydansyour-team/your-project.” - “Comment la latence des traces de prédiction de mon agent de recrutement a-t-elle évolué au cours du dernier mois ?”
- “Générez un Report W&B comparant les décisions prises par l’agent de recrutement la semaine dernière.”
- “Quelles versions de l’artefact
production-modelexistent, et quelles modifications ont été apportées entrev2etv3?” - “Comment puis-je créer un classement dans Weave ?”
Outils disponibles
- Découverte
- Experiments et runs
- Traces Weave
- Reports
- Artifacts et registre
- Docs
Des outils qui vous aident à identifier les noms de projet et d’entité, et à inspecter les schémas.
| Tool | Use when | Example prompt |
|---|---|---|
list_entities_tool | Aucune entité n’est spécifiée, ou pour énumérer les équipes et comptes auxquels la clé API peut accéder. | ”À quelles équipes W&B ai-je accès ?” |
query_wandb_entity_projects | L’entité est connue, mais pas le nom du projet, ou une requête précédente a échoué avec “project not found”. | ”Liste tous les projets de your-team.” |
probe_project_tool | Pour découvrir les métriques disponibles, les clés de configuration et les tags dans un projet basé sur des runs que vous ne connaissez pas. | ”Analyse your-team/your-project et dites-moi quelles métriques sont enregistrées.” |
infer_trace_schema_tool | Pour découvrir les noms de champs, les types et des exemples de valeurs dans un projet de traces Weave que vous ne connaissez pas avant d’exécuter une requête. | ”Quels champs figurent dans les traces Weave de your-team/your-project ?” |
Requêtes de traces axées sur le schéma
infer_trace_schema_tool pour identifier les champs disponibles, puis appelez query_weave_traces_tool avec une liste précise de colonnes et detail_level :
detail_level | Renvoie | À utiliser lorsque |
|---|---|---|
schema | Champs structurels uniquement. Le plus rapide. | Pour parcourir ou compter. |
summary | Entrées et sorties tronquées. Par défaut. | Pour la plupart des tâches d’analyse. |
full | Tout, sans troncature. | Pour examiner en détail un petit nombre de traces spécifiques. |
full uniquement pour les traces pertinentes.
Conseils d’utilisation
Bonnes pratiques générales
- Spécifiez l’entité et le projet. Les outils MCP nécessitent une entité explicite (votre équipe ou votre compte personnel) et un nom de projet. Indiquez les deux dans каждой question, par exemple « dans
your-team/your-project». - Posez des questions ciblées. Préférez « Quelle évaluation a obtenu le score F1 le plus élevé ? » à « Quelle est ma meilleure évaluation ? ». Des métriques et des plages de temps précises produisent de meilleurs appels d’outils.
- Vérifiez la récupération complète. Pour les questions larges telles que « Quels sont mes runs les plus performants ? », demandez à l’agent de confirmer qu’il a récupéré tous les runs disponibles, et pas seulement les plus récents.
- Combinez avec W&B Skills. W&B Skills montrent aux agents de code comment structurer les flux de travail W&B. Skills fournit des modèles et MCP fournit l’accès aux données ; les deux fonctionnent bien ensemble.
Pour les flux de travail avec de nombreuses traces
- Commencez par le schéma. Appelez
infer_trace_schema_toolavantquery_weave_traces_toolafin que l’agent sache quels champs et quelles valeurs de filtre sont valides. - Choisissez le bon
detail_level. Utilisezschemapour explorer,summary(par défaut) pour l’analyse, etfulluniquement lorsque vous examinez en détail un petit nombre de traces spécifiques. - Enchaînez avec
resolve_trace_roots_tool. Après une requête sur des traces enfants, transmettez la liste detrace_idobtenue àresolve_trace_roots_toolpour associer chaque trace à sa session racine en un seul appel groupé. - Privilégiez
summarize_evaluation_toolpour les évaluations. Il agrège automatiquement la hiérarchieEvaluation.evaluateetpredict_and_score. Ne revenez àquery_weave_traces_toolque pour les données de trace brutes.
Pour les flux de travail comportant beaucoup de runs
- Sondez avant d’interroger. Appelez
probe_project_toolsur un projet centré sur les runs que vous ne connaissez pas encore afin d’identifier les clés de métriques, les clés de configuration et les tags avant de construire votre requête GraphQL. - Utilisez
get_run_history_toolpour les séries chronologiques. GraphQL n’échantillonne pas. Pour les courbes de perte et les autres données de séries chronologiques,get_run_history_toolest donc à la fois plus rapide et moins coûteux. - Laissez
compare_runs_toolcalculer les écarts. Il renvoie les écarts de configuration et de métriques avec un historique aligné en un appel unique, ce qui évite une comparaison manuelle. - Commencez par un contrôle de santé. Lorsqu’un run d’entraînement semble anormal, appelez
diagnose_run_toolavant d’examiner manuellement l’historique.
Pour Cloud dédié et Autogéré
- Préférez le serveur hébergé sur votre instance, à l’adresse
https://<your-instance>/mcp. Il expose les mêmes outils que le serveur multilocataire, sans nécessiter deWANDB_BASE_URLcôté client. Ne recourez à une installation locale que si le serveur hébergé n’est pas encore activé. - Si vous l’exécutez localement sur votre instance, définissez
WANDB_BASE_URLavec l’URL de votre instance dans le blocenvdu client. Sans cela, le serveur cibleapi.wandb.aiet ne renvoie aucune donnée. - Les limites de débit sur Cloud dédié sont distinctes de celles du mode multilocataire. Voir les limites de débit du Cloud dédié pour connaître les valeurs par défaut et savoir comment demander des modifications.
Pour les installations en local
- Privilégiez le transport STDIO pour les clients de bureau (Cursor, VS Code, Claude Code, Claude Desktop). Ne passez au transport HTTP que si un client l’exige explicitement (par exemple, l’API OpenAI Responses).
- Lorsque les appels d’outil échouent silencieusement, définissez
MCP_SERVER_LOG_LEVEL=DEBUGdans le blocenvdu client, puis vérifiez à nouveau les journaux MCP du client. - Si vous installez depuis GitHub (
uvx --from git+https://github.com/wandb/wandb-mcp-server wandb_mcp_server),uvxutilise la branche par défaut. Pour utiliser une version stable, spécifiez un tag explicite en ajoutant@v0.3.2à l’URL Git.
Flux de travail recommandés
Explorer un projet inconnu
list_entities_toolpour trouver une entité ou une équipe.query_wandb_entity_projectspour trouver le projet.probe_project_toolpour les projets basés sur des runs, ouinfer_trace_schema_toolpour les projets de traces Weave.- Un appel ciblé à
query_wandb_toolouquery_weave_traces_toolà l’aide des clés identifiées.
Analyser les appels LLM en échec
query_weave_traces_toolavec un filtre sur les champs d’erreur ou d’exception, etdetail_level="summary".resolve_trace_roots_toolsur la liste detrace_idobtenue afin d’associer chaque échec à sa session racine.query_weave_traces_toolavecdetail_level="full"sur un petit nombre de racines spécifiques afin d’approfondir l’analyse.create_wandb_report_toolpour documenter les résultats.
Diagnostiquer un run d’entraînement défaillant
get_run_history_toolpour récupérer les courbes de perte et de validation.diagnose_run_toolpour effectuer des vérifications automatisées de convergence, de surapprentissage et de NaN.compare_runs_toolpar rapport à un run de référence connu pour être correct.create_wandb_report_toolavec des panneaux de graphiques linéaires pour partager le diagnostic.
Résumer les évaluations et comparer les versions du modèle
summarize_evaluation_toolpour les taux de réussite par Scorer et le nombre d’erreurs.list_artifact_versions_toolsur la collection de modèles concernée.compare_artifact_versions_toolentre la version candidate et la version de production actuelle.log_analysis_to_wandbetcreate_wandb_report_toolpour publier la comparaison.
Dépannage
| Symptôme | Cause et correctif |
|---|---|
401 Unauthorized ou Invalid API key | Votre clé API W&B est absente, mal formée ou n’est pas autorisée pour l’entité ou l’équipe cible. Générez une nouvelle clé sur wandb.ai/authorize et vérifiez qu’elle est transmise sous forme de jeton Bearer ou définie dans WANDB_API_KEY. |
| Résultats vides pour des requêtes qui devraient aboutir | Le nom de l’équipe/de l’entité ou du projet est incorrect, ou la clé API ne dispose pas de l’accès nécessaire. Vérifiez les deux avec l’agent, puis réessayez. |
404 Not Found ou connection refused sur https://<your-instance>/mcp | Le serveur MCP hébergé n’est pas encore activé sur votre instance Cloud dédié ou Autogéré, ou le client pointe vers une URL incorrecte. Contactez l’assistance W&B pour demander l’activation, puis vérifiez l’URL dans URL de connexion. |
429 Too Many Requests sur Cloud dédié | Vous avez atteint les limites de débit de votre instance. Voir limites de débit du Cloud dédié pour savoir comment demander des limites plus élevées. |
Le serveur local ne parvient pas à trouver uvx dans Claude Desktop | Utilisez le chemin complet vers uvx dans le champ command de claude_desktop_config.json. |