Model Context Protocol (MCP) は、AI エージェントが外部ツールを呼び出せるようにするオープン標準です。W&B MCP Server は、IDE、コーディングアシスタント、またはチャットエージェントが W&B のデータやドキュメントに直接アクセスできるようにするため、コピー&ペーストなしで Runs、トレース、評価、artifacts に関する質問に答えられます。サーバーでできることの一覧については、W&B MCP Server capabilities セクションを参照してください。 以下を含む、ほとんどの IDE、コーディングクライアント、チャットエージェントにネイティブに統合できます。Documentation Index
Fetch the complete documentation index at: https://wb-21fd5541-docs-2658.mintlify.app/llms.txt
Use this file to discover all available pages before exploring further.
- Cursor
- Visual Studio Code (VS Code)
- Claude Code
- Codex
- Gemini CLI
- Mistral LeChat
- Claude Desktop
デプロイメントタイプ
ホスト型サーバー(推奨)
W&B が管理するMCP serverです。クライアントは W&B APIキー を使用して HTTP 経由で接続します。インストールは不要で、維持するローカルプロセスもありません。ホスト型サーバーを使用する
ローカルインストール
MCP server をご自身のマシン上で STDIO または HTTP 経由で実行します。外部ネットワークから隔離された運用、特定のリリースへの固定、カスタムのサーバー動作、サーバーのアクティブな開発、または STDIO のみに対応するクライアントのサポートが必要な場合に使用します。MCP serverをローカルで実行する
前提条件
- wandb.ai/authorize で W&B APIキーを発行します。
- そのキーを
WANDB_API_KEY環境変数に設定するか、Bearerトークンとしてクライアントに渡します。 - 専用クラウド、セルフマネージド、またはデフォルト以外のインスタンスを対象とするローカルインストールでは、
WANDB_BASE_URL環境変数にインスタンスの URL を設定します。
ホスト型サーバーを使用する
Authorization ヘッダーに W&B APIキー を指定し、HTTP 経由で接続するようにクライアントを設定してください。
接続 URL
| デプロイメント | サーバー URL |
|---|---|
| Multi-tenant Cloud | https://mcp.withwandb.com/mcp |
| 専用クラウド | https://<your-instance>/mcp |
| セルフマネージド | https://<your-instance>/mcp |
https://mcp.withwandb.com/mcp を https://<your-instance>/mcp に置き換え、それ以外はそのままにしてください。以下のクライアント設定では、Multi-tenant Cloud の URL を使用しています。
- Claude Code
- Claude Desktop
- Codex
- Cursor
- Gemini CLI
- Mistral LeChat
- OpenAI Responses API
- VS Code
ターミナルで次のコマンドを実行し、Bearer トークンを W&B APIキーに置き換えてください:Claude Code をグローバルに設定するには、
--scope user を追加します。これを省略すると、現在の project のみが設定されます。List my W&B entities. と入力して、接続を確認します。エージェントは list_entities_tool を呼び出し、ユーザー名と所属している Teams を返すはずです。接続に失敗した場合は、Troubleshootingを参照してください。詳細は、Claude Code’s MCP documentationを参照してください。MCP serverをローカルで実行する
- エアギャップ環境またはオフライン環境 で、クライアントがホスト型の W&Bエンドポイント に接続できない場合。
- バージョンの固定。ホスト型サーバーは main ブランチに追従します。ローカルインストールでは、特定のリリースタグに固定できます。
- カスタムのサーバー動作。たとえば、ツールの説明を変更する、ツールを追加する、デフォルト以外のレスポンストークン予算を設定する場合です。
- サーバー自体を活発に開発している場合。
- STDIO のみのクライアント、またはローカルプロセスを必要とするクライアントの場合。
WANDB_BASE_URL 環境変数にインスタンスの URL を設定してください。
ローカルの前提条件
- Python 3.11 以降。
uvまたはpip。WANDB_API_KEYに設定した W&B APIキー。- 専用クラウドまたはセルフマネージドを使用している場合は、インスタンスの URL を
WANDB_BASE_URLに設定してください。
サーバーをインストールする
- uvx(永続的なインストールは不要)
- uv
- pip
- GitHub からインストール
クライアントを設定する
<your-wandb-api-key> を W&B APIキーに置き換えて、次の設定を実行します:
- Claude Code
- Claude Desktop
- Codex
- Cursor
- VS Code
次のコマンドを実行します。グローバル設定にするには
--scope user を追加します。HTTP トランスポートでサーバーを実行する
環境変数
env ブロックに設定するか、シェルで export してください。
| 変数 | 説明 |
|---|---|
WANDB_API_KEY | 認証用の W&B APIキー。必須です。 |
WANDB_BASE_URL | 専用クラウドまたはセルフマネージド向けのカスタム W&B インスタンス URL。デフォルトは https://api.wandb.ai です。 |
WANDB_MCP_PROXY_DOCS | search_wandb_docs_tool のドキュメント検索プロキシを有効にします。デフォルト: true。 |
WANDBOT_BASE_URL | ドキュメント検索プロキシ用のカスタムエンドポイント。 |
MAX_RESPONSE_TOKENS | ツール応答を切り詰める際のトークン上限。デフォルト: 30000。 |
MCP_SERVER_LOG_LEVEL | ログ出力の詳細度。DEBUG、INFO、WARNING、ERROR のいずれかです。 |
W&B MCP Server の機能
- “
your-team/your-projectのeval/accuracyに基づく上位 5 件の Runs を表示してください。” - “私の採用エージェントの predict トレースのレイテンシは、先月にかけてどのように推移しましたか?”
- “先週、採用エージェントが行った判断を比較する W&B report を生成してください。”
- “
production-modelartifact にはどのバージョンが存在し、v2とv3の間にはどのような変更がありましたか?” - “Weave でリーダーボードを作成するにはどうすればよいですか?“
利用可能なツール
- 検出
- Experiments / Runs
- Weave トレース
- Reports
- Artifacts と Registry
- ドキュメント
project名やentity名を特定し、スキーマを確認するのに役立つツールです。
| Tool | Use when | Example prompt |
|---|---|---|
list_entities_tool | entity が指定されていない場合、または APIキー でアクセス可能な Teams とアカウントを列挙したい場合。 | “アクセス可能な W&B の Teams はどれですか?” |
query_wandb_entity_projects | entity はわかっているが project名 が不明な場合、または以前のクエリが “project not found” で失敗した場合。 | “your-team 配下のすべての Projects を一覧表示してください。“ |
probe_project_tool | run ベースの不慣れな project で、利用可能なメトリクス、設定キー、tags を確認したい場合。 | “your-team/your-project を調べて、どのメトリクスがログされているか教えてください。“ |
infer_trace_schema_tool | 不慣れな Weave traces project に対してクエリする前に、フィールド名、タイプ、サンプル値を確認したい場合。 | “your-team/your-project の Weave traces にはどのフィールドがありますか?” |
スキーマファーストのトレースクエリ
infer_trace_schema_tool を呼び出して利用可能なフィールドを確認し、その後、正確な列のリストと detail_level を指定して query_weave_traces_tool を呼び出します。
detail_level | 戻り値 | 使用する場面 |
|---|---|---|
schema | 構造フィールドのみ。最速。 | 閲覧や件数のカウント。 |
summary | 入力と出力を切り詰めて返します。デフォルト。 | ほとんどの分析タスク。 |
full | 省略せずにすべて返します。 | 少数の特定のトレースを詳しく調べる場合。 |
full まで詳細度を上げられます。
使用のヒント
一般的なベスト プラクティス
- entity と project を指定してください。 MCP ツールでは、entity (チームまたは個人のアカウント) と project 名を明示的に指定する必要があります。たとえば、
your-team/your-projectのように、すべての質問に両方を含めてください。 - 具体的な質問をしてください。 「What is my best evaluation?」より、「Which eval had the highest F1 score?」のように尋ねる方が適しています。メトリクスや時間範囲を具体的にすると、より適切なツール呼び出しになります。
- すべて取得できていることを確認してください。 「What are my best performing runs?」のような広い質問では、最新のものだけでなく、利用可能なすべての Runs を取得したことをエージェントに確認させてください。
- W&B Skills と組み合わせてください。 W&B Skills は、コーディング エージェントに W&B ワークフローの構成方法を教えます。Skills はパターンを提供し、MCP はデータアクセスを提供するため、両者は相性よく連携します。
トレースが多いワークフロー向け
- schema から始めてください。 エージェントが有効なフィールドとフィルター値を把握できるよう、
query_weave_traces_toolの前にinfer_trace_schema_toolを呼び出します。 - 適切な
detail_levelを選択してください。 閲覧にはschema、分析にはsummary(デフォルト) を使用し、fullは少数の特定トレースを詳しく調べる場合にのみ使用してください。 resolve_trace_roots_toolをチェーンしてください。 子トレースをクエリした後、結果のtrace_idリストをresolve_trace_roots_toolに渡すと、1 回のバッチ Call で各トレースをルートセッションに対応付けられます。- eval では
summarize_evaluation_toolを優先してください。 これにより、Evaluation.evaluateとpredict_and_scoreの階層が自動的に集約されます。生のトレースデータが必要な場合にのみ、query_weave_traces_toolを使用してください。
run が多いワークフロー向け
- クエリする前に確認してください。 run ベースの不慣れな project では、GraphQL を組み立てる前に
probe_project_toolを呼び出し、メトリクスキー、設定キー、tags を把握してください。 - 時系列データには
get_run_history_toolを使用してください。 GraphQL はサンプリングしないため、損失曲線やその他の時系列データでは、get_run_history_toolのほうが高速で低コストです。 - 差分比較は
compare_runs_toolに任せてください。 設定とメトリクスの差分に加え、整列済みの履歴が 1 回の呼び出しで返されるため、手動で比較する必要がありません。 - まず health check を実行してください。 トレーニング run に問題があるように見える場合は、手動で履歴を掘り下げる前に
diagnose_run_toolを呼び出してください。
専用クラウドおよびセルフマネージド向け
- インスタンスでホストされているサーバー (
https://<your-instance>/mcp) を優先して使用してください。このサーバーでは、クライアント側でWANDB_BASE_URLを設定しなくても、Multi-tenant サーバーと同じツールを利用できます。ホストされているサーバーがまだ有効になっていない場合にのみ、ローカル インストールにフォールバックしてください。 - インスタンスに対してローカルで run する場合は、クライアントの
envブロックでWANDB_BASE_URLをインスタンスの URL に設定してください。これを設定しないと、サーバーはapi.wandb.aiを参照するため、データを返しません。 - 専用クラウドのレート制限は Multi-tenant とは別です。デフォルト値と変更のリクエスト方法については、Dedicated Cloud rate limits を参照してください。
ローカル環境にインストールする場合
- デスクトップクライアント (Cursor、VS Code、Claude Code、Claude Desktop) では、STDIO トランスポートを優先してください。クライアント側で明示的に必要とされる場合 (たとえば OpenAI Responses API) にのみ、HTTP トランスポートに切り替えてください。
- tool call がエラー表示なしで失敗する場合は、クライアントの
envブロックでMCP_SERVER_LOG_LEVEL=DEBUGを設定し、クライアントの MCP ログを再確認してください。 - GitHub からインストールする場合 (
uvx --from git+https://github.com/wandb/wandb-mcp-server wandb_mcp_server) 、uvxはデフォルトブランチに固定されます。安定したバージョンが必要な場合は、Git URL に@v0.3.2を追加して、明示的にタグを指定してください。
推奨ワークフロー
不案内な project を調べる
- entity またはチームを検索するには、
list_entities_toolを使用します。 - project を検索するには、
query_wandb_entity_projectsを使用します。 - run ベースの project には
probe_project_tool、Weave のトレース project にはinfer_trace_schema_toolを使用します。 - 見つかったキーを使って、対象を絞った
query_wandb_toolまたはquery_weave_traces_toolを呼び出します。
失敗した LLM calls をトリアージする
- エラーまたは例外フィールドにフィルターを設定し、
detail_level="summary"を指定してquery_weave_traces_toolを使用します。 - 得られた
trace_idリストに対してresolve_trace_roots_toolを使用し、各失敗をルートセッションに対応付けます。 - 少数の特定のルートに対して
detail_level="full"を指定してquery_weave_traces_toolを使用し、詳細を調査します。 - 調査結果を記録するために
create_wandb_report_toolを使用します。
不調なトレーニング run を診断する
get_run_history_toolを使用して、損失曲線と検証曲線を取得します。diagnose_run_toolを使用して、収束、過学習、NaN を自動的にチェックします。compare_runs_toolを使用して、既知の正常なベースライン run と比較します。create_wandb_report_toolを使用して、診断結果を共有するための折れ線グラフのパネルを含む report を作成します。
評価を要約してモデルバージョンを比較する
- scorer ごとの合格率とエラー数を確認するには
summarize_evaluation_toolを使用します。 - 関連するモデルコレクションに対して
list_artifact_versions_toolを使用します。 - 候補バージョンと現在の本番バージョンを比較するには
compare_artifact_versions_toolを使用します。 - 比較結果を公開するには
log_analysis_to_wandbとcreate_wandb_report_toolを使用します。
トラブルシューティング
| 症状 | 原因と対処方法 |
|---|---|
401 Unauthorized または Invalid API key | W&B APIキー がない、形式が正しくない、または対象のentityまたはチームに対する認可がありません。wandb.ai/authorize でキーを再生成し、bearer token として渡されているか、WANDB_API_KEY に設定されていることを確認してください。 |
| 成功するはずのクエリで結果が空になる | チーム/entityまたは project 名が正しくないか、APIキーにアクセス権がありません。エージェントで両方を確認してから、再試行してください。 |
https://<your-instance>/mcp で 404 Not Found または connection refused が表示される | ホスト型の MCP server が 専用クラウド または セルフマネージド インスタンスでまだ有効化されていないか、クライアントが誤った URL を参照しています。有効化を依頼するには W&B サポート に連絡し、その後 Connection URL で URL を確認してください。 |
専用クラウド で 429 Too Many Requests が表示される | インスタンスの rate limits に達しています。制限の引き上げを依頼する方法については、専用クラウド rate limits を参照してください。 |
Claude Desktop でローカルサーバーが uvx を見つけられない | claude_desktop_config.json の command フィールドで、uvx へのフルパスを使用してください。 |