メインコンテンツへスキップ

Documentation Index

Fetch the complete documentation index at: https://wb-21fd5541-docs-2658.mintlify.app/llms.txt

Use this file to discover all available pages before exploring further.

Model Context Protocol (MCP) は、AI エージェントが外部ツールを呼び出せるようにするオープン標準です。W&B MCP Server は、IDE、コーディングアシスタント、またはチャットエージェントが W&B のデータやドキュメントに直接アクセスできるようにするため、コピー&ペーストなしで Runs、トレース、評価、artifacts に関する質問に答えられます。サーバーでできることの一覧については、W&B MCP Server capabilities セクションを参照してください。 以下を含む、ほとんどの IDE、コーディングクライアント、チャットエージェントにネイティブに統合できます。
  • Cursor
  • Visual Studio Code (VS Code)
  • Claude Code
  • Codex
  • Gemini CLI
  • Mistral LeChat
  • Claude Desktop

デプロイメントタイプ

より高い分離性と柔軟性が必要な場合は、ホスト型サーバーを使用することも、ローカル版を設定することもできます。ローカル版を使用する場合、クライアントはサーバーにアクセスするために別のURLを使用する必要があります。

ホスト型サーバー(推奨)

W&B が管理するMCP serverです。クライアントは W&B APIキー を使用して HTTP 経由で接続します。インストールは不要で、維持するローカルプロセスもありません。ホスト型サーバーを使用する

ローカルインストール

MCP server をご自身のマシン上で STDIO または HTTP 経由で実行します。外部ネットワークから隔離された運用、特定のリリースへの固定、カスタムのサーバー動作、サーバーのアクティブな開発、または STDIO のみに対応するクライアントのサポートが必要な場合に使用します。MCP serverをローカルで実行する
W&B を専用クラウドまたはセルフマネージドで実行していて、インスタンスでホスト型サーバーがまだ有効になっていない場合は、W&B サポート または W&B のアカウント担当チームに連絡して有効化を依頼してください。

前提条件

クライアントを設定する前に、次の作業を行ってください。
  • wandb.ai/authorize で W&B APIキーを発行します。
  • そのキーを WANDB_API_KEY 環境変数に設定するか、Bearerトークンとしてクライアントに渡します。
  • 専用クラウド、セルフマネージド、またはデフォルト以外のインスタンスを対象とするローカルインストールでは、WANDB_BASE_URL 環境変数にインスタンスの URL を設定します。

ホスト型サーバーを使用する

W&B は、すべてのデプロイメントタイプでマネージド MCP server を提供しています。何もインストールする必要はありません。Authorization ヘッダーに W&B APIキー を指定し、HTTP 経由で接続するようにクライアントを設定してください。

接続 URL

URL は、W&B デプロイメントのタイプによって異なります。
デプロイメントサーバー URL
Multi-tenant Cloudhttps://mcp.withwandb.com/mcp
専用クラウドhttps://<your-instance>/mcp
セルフマネージドhttps://<your-instance>/mcp
専用クラウドまたはセルフマネージドの場合は、https://mcp.withwandb.com/mcphttps://<your-instance>/mcp に置き換え、それ以外はそのままにしてください。以下のクライアント設定では、Multi-tenant Cloud の URL を使用しています。
ターミナルで次のコマンドを実行し、Bearer トークンを W&B APIキーに置き換えてください:
claude mcp add --transport http wandb https://mcp.withwandb.com/mcp \
  --header "Authorization: Bearer <your-wandb-api-key>"
Claude Code をグローバルに設定するには、--scope user を追加します。これを省略すると、現在の project のみが設定されます。List my W&B entities. と入力して、接続を確認します。エージェントは list_entities_tool を呼び出し、ユーザー名と所属している Teams を返すはずです。接続に失敗した場合は、Troubleshootingを参照してください。詳細は、Claude Code’s MCP documentationを参照してください。

MCP serverをローカルで実行する

ローカルインストールはホスト型サーバーの代替手段であり、どのデプロイメントタイプでもデフォルトではありません。ホスト型サーバーがご利用のセットアップに適さない場合に使用してください。 ローカルで実行する一般的な理由は次のとおりです。
  • エアギャップ環境またはオフライン環境 で、クライアントがホスト型の W&Bエンドポイント に接続できない場合。
  • バージョンの固定。ホスト型サーバーは main ブランチに追従します。ローカルインストールでは、特定のリリースタグに固定できます。
  • カスタムのサーバー動作。たとえば、ツールの説明を変更する、ツールを追加する、デフォルト以外のレスポンストークン予算を設定する場合です。
  • サーバー自体を活発に開発している場合。
  • STDIO のみのクライアント、またはローカルプロセスを必要とするクライアントの場合。
専用クラウドまたはセルフマネージドのユーザーには、ホスト型サーバーの利用を推奨します。ホスト型サーバーがまだお使いのインスタンスで有効になっていない場合、または上記のいずれかの理由に当てはまる場合にのみ、wandb/wandb-mcp-server からローカルインストールを使用してください。WANDB_BASE_URL 環境変数にインスタンスの URL を設定してください。

ローカルの前提条件

サーバーをローカルで実行するには、以下を用意してください。
  • Python 3.11 以降。
  • uv または pip
  • WANDB_API_KEY に設定した W&B APIキー。
  • 専用クラウドまたはセルフマネージドを使用している場合は、インスタンスの URL を WANDB_BASE_URL に設定してください。

サーバーをインストールする

インストール方法を選択し、次のコマンドを実行して MCP server をインストールします。
uvx --from git+https://github.com/wandb/wandb-mcp-server wandb_mcp_server

クライアントを設定する

MCP クライアントを選択し、必要に応じて <your-wandb-api-key> を W&B APIキーに置き換えて、次の設定を実行します:
次のコマンドを実行します。グローバル設定にするには --scope user を追加します。
claude mcp add wandb \
  -e WANDB_API_KEY=<your-wandb-api-key> \
  -e WANDB_BASE_URL=https://your-wandb-instance.example.com \
  -- uvx --from git+https://github.com/wandb/wandb-mcp-server wandb_mcp_server

HTTP トランスポートでサーバーを実行する

Web ベースのクライアントやテストでは、HTTP トランスポートでサーバーを実行します:
uvx wandb_mcp_server --transport http --host 0.0.0.0 --port 8080
ローカルサーバーを OpenAI Responses API などの外部クライアントに公開するには、トンネルを使用します:
uvx wandb_mcp_server --transport http --port 8080

# 別のターミナルで
ngrok http 8080
トンネル URL を使用するように MCP クライアントの設定を更新します。

環境変数

以下の環境変数は、ローカルインストールにおける認証、インスタンスのルーティング先、およびサーバーの動作を制御します。クライアントの env ブロックに設定するか、シェルで export してください。
変数説明
WANDB_API_KEY認証用の W&B APIキー。必須です。
WANDB_BASE_URL専用クラウドまたはセルフマネージド向けのカスタム W&B インスタンス URL。デフォルトは https://api.wandb.ai です。
WANDB_MCP_PROXY_DOCSsearch_wandb_docs_tool のドキュメント検索プロキシを有効にします。デフォルト: true
WANDBOT_BASE_URLドキュメント検索プロキシ用のカスタムエンドポイント。
MAX_RESPONSE_TOKENSツール応答を切り詰める際のトークン上限。デフォルト: 30000
MCP_SERVER_LOG_LEVELログ出力の詳細度。DEBUGINFOWARNINGERROR のいずれかです。
完全なコマンドライン リファレンスと高度なオプションについては、wandb-mcp-server README を参照してください。

W&B MCP Server の機能

MCP server を使用すると、Experiments の分析、トレースのデバッグ、Reports の作成、Registry と Artifacts の管理、W&B ドキュメントに関する質問への回答を行えます。以下のプロンプト例は、エージェントが W&B MCP Server に接続されているときに実行を依頼できるタスクの一部を示しています。
  • your-team/your-projecteval/accuracy に基づく上位 5 件の Runs を表示してください。”
  • “私の採用エージェントの predict トレースのレイテンシは、先月にかけてどのように推移しましたか?”
  • “先週、採用エージェントが行った判断を比較する W&B report を生成してください。”
  • production-model artifact にはどのバージョンが存在し、v2v3 の間にはどのような変更がありましたか?”
  • “Weave でリーダーボードを作成するにはどうすればよいですか?“

利用可能なツール

サーバーでは、さまざまな目的に応じて複数のツールを提供しています。次の表は、各ツールの名、エージェントがそのツールを使用すべきタイミング、およびそのツールを呼び出す際に使用できる具体的なプロンプトを示しています。
project名やentity名を特定し、スキーマを確認するのに役立つツールです。
ToolUse whenExample prompt
list_entities_toolentity が指定されていない場合、または APIキー でアクセス可能な Teams とアカウントを列挙したい場合。“アクセス可能な W&B の Teams はどれですか?”
query_wandb_entity_projectsentity はわかっているが project名 が不明な場合、または以前のクエリが “project not found” で失敗した場合。your-team 配下のすべての Projects を一覧表示してください。“
probe_project_toolrun ベースの不慣れな project で、利用可能なメトリクス、設定キー、tags を確認したい場合。your-team/your-project を調べて、どのメトリクスがログされているか教えてください。“
infer_trace_schema_tool不慣れな Weave traces project に対してクエリする前に、フィールド名、タイプ、サンプル値を確認したい場合。your-team/your-project の Weave traces にはどのフィールドがありますか?”

スキーマファーストのトレースクエリ

Weave のトレースをクエリする際は、まず infer_trace_schema_tool を呼び出して利用可能なフィールドを確認し、その後、正確な列のリストと detail_level を指定して query_weave_traces_tool を呼び出します。
detail_level戻り値使用する場面
schema構造フィールドのみ。最速。閲覧や件数のカウント。
summary入力と出力を切り詰めて返します。デフォルト。ほとんどの分析タスク。
full省略せずにすべて返します。少数の特定のトレースを詳しく調べる場合。
このパターンを使用すると、広範な質問でも token 使用量を低く抑えつつ、エージェントは重要なトレースに対してのみ full まで詳細度を上げられます。

使用のヒント

以下のベストプラクティスとワークフローは、W&B MCP Server をより効果的に活用するのに役立ちます。まずは一般的なベストプラクティスを確認し、その後、ご自身のワークロードに合ったサブセクションを読んで、より具体的なアドバイスや複数ステップのツールチェーンを参照してください。

一般的なベスト プラクティス

ユースケースにかかわらず、次のプラクティスに従ってください。
  • entity と project を指定してください。 MCP ツールでは、entity (チームまたは個人のアカウント) と project 名を明示的に指定する必要があります。たとえば、your-team/your-project のように、すべての質問に両方を含めてください。
  • 具体的な質問をしてください。 「What is my best evaluation?」より、「Which eval had the highest F1 score?」のように尋ねる方が適しています。メトリクスや時間範囲を具体的にすると、より適切なツール呼び出しになります。
  • すべて取得できていることを確認してください。 「What are my best performing runs?」のような広い質問では、最新のものだけでなく、利用可能なすべての Runs を取得したことをエージェントに確認させてください。
  • W&B Skills と組み合わせてください。 W&B Skills は、コーディング エージェントに W&B ワークフローの構成方法を教えます。Skills はパターンを提供し、MCP はデータアクセスを提供するため、両者は相性よく連携します。

トレースが多いワークフロー向け

Weave のトレースを扱う際は、次のプラクティスに従ってください。
  • schema から始めてください。 エージェントが有効なフィールドとフィルター値を把握できるよう、query_weave_traces_tool の前に infer_trace_schema_tool を呼び出します。
  • 適切な detail_level を選択してください。 閲覧には schema、分析には summary (デフォルト) を使用し、full は少数の特定トレースを詳しく調べる場合にのみ使用してください。
  • resolve_trace_roots_tool をチェーンしてください。 子トレースをクエリした後、結果の trace_id リストを resolve_trace_roots_tool に渡すと、1 回のバッチ Call で各トレースをルートセッションに対応付けられます。
  • eval では summarize_evaluation_tool を優先してください。 これにより、Evaluation.evaluatepredict_and_score の階層が自動的に集約されます。生のトレースデータが必要な場合にのみ、query_weave_traces_tool を使用してください。
エンドツーエンドのワークフローについては、失敗した LLM calls をトリアージする を参照してください。

run が多いワークフロー向け

W&B Models の Runs を扱う際は、次のプラクティスに従ってください。
  • クエリする前に確認してください。 run ベースの不慣れな project では、GraphQL を組み立てる前に probe_project_tool を呼び出し、メトリクスキー、設定キー、tags を把握してください。
  • 時系列データには get_run_history_tool を使用してください。 GraphQL はサンプリングしないため、損失曲線やその他の時系列データでは、get_run_history_tool のほうが高速で低コストです。
  • 差分比較は compare_runs_tool に任せてください。 設定とメトリクスの差分に加え、整列済みの履歴が 1 回の呼び出しで返されるため、手動で比較する必要がありません。
  • まず health check を実行してください。 トレーニング run に問題があるように見える場合は、手動で履歴を掘り下げる前に diagnose_run_tool を呼び出してください。
エンドツーエンドのワークフローについては、問題のあるトレーニング run を診断するeval を要約してモデルバージョンを比較する を参照してください。

専用クラウドおよびセルフマネージド向け

非 Multi-tenant デプロイでは、次のプラクティスに従ってください。
  • インスタンスでホストされているサーバー (https://<your-instance>/mcp) を優先して使用してください。このサーバーでは、クライアント側で WANDB_BASE_URL を設定しなくても、Multi-tenant サーバーと同じツールを利用できます。ホストされているサーバーがまだ有効になっていない場合にのみ、ローカル インストールにフォールバックしてください。
  • インスタンスに対してローカルで run する場合は、クライアントの env ブロックで WANDB_BASE_URL をインスタンスの URL に設定してください。これを設定しないと、サーバーは api.wandb.ai を参照するため、データを返しません。
  • 専用クラウドのレート制限は Multi-tenant とは別です。デフォルト値と変更のリクエスト方法については、Dedicated Cloud rate limits を参照してください。

ローカル環境にインストールする場合

サーバーを自分のマシンで実行する際は、次の点に従ってください。
  • デスクトップクライアント (Cursor、VS Code、Claude Code、Claude Desktop) では、STDIO トランスポートを優先してください。クライアント側で明示的に必要とされる場合 (たとえば OpenAI Responses API) にのみ、HTTP トランスポートに切り替えてください。
  • tool call がエラー表示なしで失敗する場合は、クライアントの env ブロックで MCP_SERVER_LOG_LEVEL=DEBUG を設定し、クライアントの MCP ログを再確認してください。
  • GitHub からインストールする場合 (uvx --from git+https://github.com/wandb/wandb-mcp-server wandb_mcp_server) 、uvx はデフォルトブランチに固定されます。安定したバージョンが必要な場合は、Git URL に @v0.3.2 を追加して、明示的にタグを指定してください。
実際の質問の多くでは、1つのツールだけでは足りません。エージェントに、以下のいずれかのチェーンに従うよう指示してください。

不案内な project を調べる

project にログされた内容を確認するには、次のツールをチェーンして使用します。
  1. entity またはチームを検索するには、list_entities_tool を使用します。
  2. project を検索するには、query_wandb_entity_projects を使用します。
  3. run ベースの project には probe_project_tool、Weave のトレース project には infer_trace_schema_tool を使用します。
  4. 見つかったキーを使って、対象を絞った query_wandb_tool または query_weave_traces_tool を呼び出します。

失敗した LLM calls をトリアージする

問題のあるトレースと、それを生成したセッションを特定するには、次のツールを組み合わせて使用します。
  1. エラーまたは例外フィールドにフィルターを設定し、detail_level="summary" を指定して query_weave_traces_tool を使用します。
  2. 得られた trace_id リストに対して resolve_trace_roots_tool を使用し、各失敗をルートセッションに対応付けます。
  3. 少数の特定のルートに対して detail_level="full" を指定して query_weave_traces_tool を使用し、詳細を調査します。
  4. 調査結果を記録するために create_wandb_report_tool を使用します。

不調なトレーニング run を診断する

疑わしいトレーニング run のヘルスチェックを行うには、次のツールをチェーンして使用します。
  1. get_run_history_tool を使用して、損失曲線と検証曲線を取得します。
  2. diagnose_run_tool を使用して、収束、過学習、NaN を自動的にチェックします。
  3. compare_runs_tool を使用して、既知の正常なベースライン run と比較します。
  4. create_wandb_report_tool を使用して、診断結果を共有するための折れ線グラフのパネルを含む report を作成します。

評価を要約してモデルバージョンを比較する

どのモデルバージョンが評価で最も優れた結果を出したかを確認するには、次のツールを組み合わせて使用します:
  1. scorer ごとの合格率とエラー数を確認するには summarize_evaluation_tool を使用します。
  2. 関連するモデルコレクションに対して list_artifact_versions_tool を使用します。
  3. 候補バージョンと現在の本番バージョンを比較するには compare_artifact_versions_tool を使用します。
  4. 比較結果を公開するには log_analysis_to_wandbcreate_wandb_report_tool を使用します。

トラブルシューティング

W&B MCP Server の使用時に発生する問題の診断と解決には、次の表を参照してください。
症状原因と対処方法
401 Unauthorized または Invalid API keyW&B APIキー がない、形式が正しくない、または対象のentityまたはチームに対する認可がありません。wandb.ai/authorize でキーを再生成し、bearer token として渡されているか、WANDB_API_KEY に設定されていることを確認してください。
成功するはずのクエリで結果が空になるチーム/entityまたは project 名が正しくないか、APIキーにアクセス権がありません。エージェントで両方を確認してから、再試行してください。
https://<your-instance>/mcp404 Not Found または connection refused が表示されるホスト型の MCP server が 専用クラウド または セルフマネージド インスタンスでまだ有効化されていないか、クライアントが誤った URL を参照しています。有効化を依頼するには W&B サポート に連絡し、その後 Connection URL で URL を確認してください。
専用クラウド で 429 Too Many Requests が表示されるインスタンスの rate limits に達しています。制限の引き上げを依頼する方法については、専用クラウド rate limits を参照してください。
Claude Desktop でローカルサーバーが uvx を見つけられないclaude_desktop_config.jsoncommand フィールドで、uvx へのフルパスを使用してください。