Model Context Protocol(MCP)은 AI 에이전트가 외부 도구를 호출할 수 있도록 하는 개방형 표준입니다. W&B MCP Server는 IDE, 코딩 도우미 또는 채팅 에이전트가 W&B 데이터와 문서에 직접 액세스할 수 있게 해주므로, 복사해서 붙여넣지 않아도 Runs, 트레이스, evaluations, 아티팩트에 관한 질문에 답할 수 있습니다. 서버로 수행할 수 있는 작업의 전체 목록은 W&B MCP Server 기능 섹션을 참조하세요. 다음을 포함한 대부분의 IDE, 코딩 클라이언트, 채팅 에이전트와 기본적으로 통합됩니다:Documentation Index
Fetch the complete documentation index at: https://wb-21fd5541-docs-2658.mintlify.app/llms.txt
Use this file to discover all available pages before exploring further.
- Cursor
- Visual Studio Code (VS Code)
- Claude Code
- Codex
- Gemini CLI
- Mistral LeChat
- Claude Desktop
배포 유형
Hosted 서버(권장)
클라이언트가 W&B API 키를 사용해 HTTP로 연결하는 W&B 관리형 MCP 서버입니다. 설치할 필요가 없고, 유지 관리해야 할 로컬 프로세스도 없습니다.Hosted 서버 사용
로컬 설치
MCP 서버를 자신의 머신에서 STDIO 또는 HTTP로 실행하세요. 에어갭 환경에서의 오퍼레이션, 특정 릴리스에 고정, 맞춤형 서버 동작, 활발한 서버 개발, 또는 STDIO만 지원하는 클라이언트를 지원해야 할 때 사용합니다.MCP 서버를 로컬에서 실행
사전 요구 사항
- wandb.ai/authorize에서 W&B API 키를 생성하세요.
- 키를
WANDB_API_KEY환경 변수로 설정하거나 클라이언트에 Bearer 토큰으로 전달하세요. - 기본 인스턴스가 아닌 다른 인스턴스에 연결하는 Dedicated Cloud, Self-Managed 및 로컬 설치의 경우
WANDB_BASE_URL환경 변수를 해당 인스턴스 URL로 설정하세요.
W&B 호스팅 서버 사용
Authorization 헤더에 W&B API 키를 포함해 HTTP로 연결하도록 클라이언트를 설정하세요.
연결 URL
| Deployment | Server URL |
|---|---|
| Multi-tenant Cloud | https://mcp.withwandb.com/mcp |
| Dedicated Cloud | https://<your-instance>/mcp |
| Self-Managed | https://<your-instance>/mcp |
https://mcp.withwandb.com/mcp를 https://<your-instance>/mcp로 바꾸고, 나머지는 그대로 유지하세요. 아래 클라이언트 설정은 Multi-tenant URL을 사용합니다.
- Claude Code
- Claude Desktop
- Codex
- Cursor
- Gemini CLI
- Mistral LeChat
- OpenAI Responses API
- VS Code
터미널에서 다음 명령어를 실행하되, Bearer 토큰을 W&B API 키로 바꾸세요:Claude Code를 전역으로 구성하려면
--scope user를 추가하세요. 현재 프로젝트만 구성하려면 이 옵션을 생략하세요.List my W&B entities.라고 요청해 연결을 확인하세요. 에이전트가 list_entities_tool을 호출하고 사용자 이름과 속한 모든 Teams를 반환해야 합니다. 연결에 실패하면 문제 해결을 참조하세요. 자세한 내용은 Claude Code’s MCP documentation을 참조하세요.MCP 서버를 로컬에서 실행
- 클라이언트가 호스팅된 W&B 엔드포인트에 연결할 수 없는 에어갭 또는 오프라인 환경.
- 버전 고정. 호스팅 서버는 main 브랜치를 따릅니다. 로컬 설치는 특정 릴리스 태그에 고정할 수 있습니다.
- 도구 설명 변경, 도구 추가, 기본값이 아닌 응답 token 예산 설정과 같은 맞춤형 서버 동작.
- 서버 자체를 활발히 개발 중인 경우.
- STDIO 전용 클라이언트 또는 로컬 프로세스가 필요한 클라이언트.
WANDB_BASE_URL 환경 변수를 인스턴스 URL로 설정하세요.
로컬 사전 요구 사항
- Python 3.11 이상
uv또는pipWANDB_API_KEY로 설정된 W&B API 키- Dedicated Cloud 또는 Self-Managed를 사용하는 경우, 인스턴스 URL로 설정된
WANDB_BASE_URL
서버 설치
- uvx (영구 설치 없이)
- uv
- pip
- GitHub에서 설치
클라이언트 설정
<your-wandb-api-key>를 W&B API 키로 바꾸세요:
- Claude Code
- Claude Desktop
- Codex
- Cursor
- VS Code
다음 명령어를 실행하세요. 전역 설정을 하려면
--scope user를 추가하세요.HTTP 전송으로 서버 실행
환경 변수
env 블록에 설정하거나 셸에서 export하세요.
| Variable | Description |
|---|---|
WANDB_API_KEY | 인증에 사용하는 W&B API 키입니다. 필수입니다. |
WANDB_BASE_URL | Dedicated Cloud 또는 Self-Managed용 맞춤형 W&B 인스턴스 URL입니다. 기본값은 https://api.wandb.ai입니다. |
WANDB_MCP_PROXY_DOCS | search_wandb_docs_tool 문서 검색 프록시를 활성화합니다. 기본값: true. |
WANDBOT_BASE_URL | 문서 검색 프록시용 맞춤형 엔드포인트입니다. |
MAX_RESPONSE_TOKENS | 도구 응답 잘림에 사용할 토큰 한도입니다. 기본값: 30000. |
MCP_SERVER_LOG_LEVEL | 로그 상세 수준입니다. DEBUG, INFO, WARNING, ERROR 중 하나입니다. |
W&B MCP Server 기능
- “
your-team/your-project에서eval/accuracy기준 상위 5개 run을 보여줘.” - “내 채용 에이전트의 predict 트레이스 지연 시간은 지난 한 달 동안 어떻게 변화했나요?”
- “지난주 채용 에이전트가 내린 결정을 비교하는 W&B Reports를 생성해줘.”
- “
production-model아티팩트에는 어떤 버전이 있으며,v2와v3사이에 무엇이 변경되었나요?” - “Weave에서 리더보드를 어떻게 만드나요?”
사용 가능한 도구
- 검색
- Experiments 및 Runs
- Weave 트레이스
- Reports
- Artifacts와 레지스트리
- 문서
프로젝트와 entity 이름을 찾고 스키마를 확인하는 데 도움이 되는 도구입니다.
| Tool | 사용하는 경우 | 예시 프롬프트 |
|---|---|---|
list_entities_tool | entity가 지정되지 않았거나, API 키로 액세스할 수 있는 팀과 계정을 나열해야 하는 경우입니다. | ”내가 액세스할 수 있는 W&B 팀은 무엇인가요?” |
query_wandb_entity_projects | entity는 알고 있지만 프로젝트 이름은 모르거나, 이전 쿼리가 “project not found”로 실패한 경우입니다. | ”your-team 아래의 모든 프로젝트를 나열하세요.” |
probe_project_tool | 익숙하지 않은 run 기반 프로젝트에서 사용 가능한 메트릭, 설정 키, tags를 파악해야 하는 경우입니다. | ”your-team/your-project를 살펴보고 어떤 메트릭이 로깅되는지 알려주세요.” |
infer_trace_schema_tool | 익숙하지 않은 Weave 트레이스 프로젝트를 쿼리하기 전에 필드 이름, 유형, 샘플 값을 파악해야 하는 경우입니다. | ”your-team/your-project의 Weave 트레이스에는 어떤 필드가 있나요?” |
스키마 우선 트레이스 쿼리
infer_trace_schema_tool을 호출해 사용 가능한 필드를 확인한 다음, 정확한 column 목록과 detail_level을 지정해 query_weave_traces_tool을 호출하세요:
detail_level | 반환값 | 사용 시점 |
|---|---|---|
schema | 구조 필드만 반환합니다. 가장 빠릅니다. | 둘러보거나 개수를 셀 때 |
summary | 잘린 inputs 및 outputs를 반환합니다. 기본값입니다. | 대부분의 분석 작업 |
full | 잘리지 않은 전체 내용을 반환합니다. | 소수의 특정 트레이스를 자세히 확인할 때 |
full로 확장할 수 있습니다.
사용 팁
일반적인 모범 사례
- entity와 프로젝트를 지정하세요. MCP 도구에는 명시적인 entity(팀 또는 개인 계정)와 프로젝트 이름이 필요합니다. 모든 질문에 이 두 가지를 모두 포함하세요. 예: “
your-team/your-project에서” - 구체적인 질문을 하세요. “내 최고의 평가는 무엇인가요?”보다는 “어떤 eval이 가장 높은 F1 score를 기록했나요?”라고 묻는 편이 좋습니다. 구체적인 메트릭과 시간 범위를 지정하면 더 나은 도구 Call이 생성됩니다.
- 전체 조회인지 확인하세요. “가장 성능이 좋은 Runs는 무엇인가요?”와 같은 광범위한 질문의 경우, 가장 최근 run만이 아니라 사용 가능한 모든 Runs를 조회했는지 에이전트에 확인하도록 요청하세요.
- W&B Skills와 함께 사용하세요. W&B Skills는 코딩 에이전트가 W&B 워크플로를 구성하는 방법을 알려줍니다. Skills는 패턴을 제공하고 MCP는 데이터 액세스를 제공하므로, 두 기능을 함께 사용하면 효과적입니다.
트레이스 중심 워크플로의 경우
- 스키마부터 시작하세요. 에이전트가 어떤 필드와 필터 값이 유효한지 알 수 있도록
query_weave_traces_tool보다 먼저infer_trace_schema_tool을 호출하세요. - 적절한
detail_level을 선택하세요. 둘러볼 때는schema를, 분석할 때는summary(기본값)를, 소수의 특정 트레이스를 자세히 확인할 때만full을 사용하세요. resolve_trace_roots_tool을 연이어 사용하세요. 하위 트레이스를 쿼리한 후 결과로 나온trace_id목록을resolve_trace_roots_tool에 전달하면, 각 트레이스를 루트 세션에 한 번의 배치 호출로 매핑할 수 있습니다.- eval에는
summarize_evaluation_tool을 우선 사용하세요. 이 도구는Evaluation.evaluate및predict_and_score계층을 자동으로 집계합니다. 원시 트레이스 데이터가 필요할 때만query_weave_traces_tool을 사용하세요.
run 중심 워크플로의 경우
- 쿼리하기 전에 먼저 프로브하세요. 익숙하지 않은 run 기반 프로젝트에서는 GraphQL 쿼리를 작성하기 전에
probe_project_tool을 호출해 metric 키, 설정 키, tags를 파악하세요. - 시계열 데이터에는
get_run_history_tool을 사용하세요. GraphQL은 샘플링을 하지 않으므로, loss 곡선과 기타 시계열 데이터에는get_run_history_tool이 더 빠르고 비용도 더 적게 듭니다. - 차이 비교는
compare_runs_tool에 맡기세요. 이 도구는 단일 Call로 config 및 metric 델타와 정렬된 이력 데이터를 반환하므로 수동 비교를 피할 수 있습니다. - 먼저 헬스 체크를 실행하세요. 트레이닝 run이 이상해 보이면, 이력을 수동으로 자세히 살펴보기 전에
diagnose_run_tool을 호출하세요.
Dedicated Cloud 및 Self-Managed의 경우
- 인스턴스의 호스팅 서버인
https://<your-instance>/mcp를 우선 사용하는 것이 좋습니다. 이 서버는 클라이언트 측WANDB_BASE_URL설정 없이도 Multi-tenant 서버와 동일한 도구를 노출합니다. 호스팅 서버가 아직 활성화되지 않은 경우에만 로컬 설치로 대체하세요. - 인스턴스를 대상으로 로컬에서 실행하는 경우, 클라이언트의
env블록에서WANDB_BASE_URL을 인스턴스 URL로 설정하세요. 이를 설정하지 않으면 서버가api.wandb.ai를 대상으로 하므로 데이터를 반환하지 않습니다. - Dedicated Cloud의 요청 속도 제한은 Multi-tenant와 별도로 적용됩니다. 기본값과 변경 요청 방법은 Dedicated Cloud rate limits를 참조하세요.
로컬 설치 시
- 데스크톱 클라이언트(Cursor, VS Code, Claude Code, Claude Desktop)에는 STDIO 전송 방식을 우선 사용하세요. 클라이언트가 명시적으로 요구하는 경우에만 HTTP 전송 방식으로 전환하세요(예: OpenAI Responses API).
- 도구 Call이 아무 오류 메시지 없이 실패하면 클라이언트의
env블록에서MCP_SERVER_LOG_LEVEL=DEBUG를 설정한 다음, 클라이언트의 MCP 로그를 다시 확인하세요. - GitHub에서 설치하는 경우(
uvx --from git+https://github.com/wandb/wandb-mcp-server wandb_mcp_server),uvx는 기본 브랜치에 고정됩니다. 안정적인 버전이 필요하면 Git URL 끝에@v0.3.2를 추가해 명시적인 태그로 고정하세요.
권장 워크플로
낯선 프로젝트 살펴보기
- entity 또는 팀을 찾으려면
list_entities_tool을 사용합니다. - 프로젝트를 찾으려면
query_wandb_entity_projects를 사용합니다. - run 기반 프로젝트에는
probe_project_tool을, Weave 트레이스 프로젝트에는infer_trace_schema_tool을 사용합니다. - 찾은 키를 사용해
query_wandb_tool또는query_weave_traces_tool을 대상에 맞게 호출합니다.
실패한 LLM calls 선별하기
- 오류 또는 예외 필드에 Filter를 적용하고
detail_level="summary"로query_weave_traces_tool을 실행합니다. - 결과
trace_id목록에resolve_trace_roots_tool을 적용해 각 실패를 해당 루트 세션에 매핑합니다. - 일부 특정 루트에 대해
detail_level="full"로query_weave_traces_tool을 실행해 자세히 살펴봅니다. create_wandb_report_tool로 결과를 문서화합니다.
문제가 있는 트레이닝 run 진단하기
get_run_history_tool로 loss 및 검증 곡선을 가져옵니다.diagnose_run_tool로 수렴, 과적합, NaN을 자동으로 점검합니다.compare_runs_tool로 정상으로 확인된 기준 run과 비교합니다.create_wandb_report_tool로 선 그래프 Panel이 포함된 report를 만들어 진단 결과를 공유합니다.
평가를 요약하고 모델 버전 비교하기
- 각 Scorer별 통과율과 오류 수를 확인하려면
summarize_evaluation_tool - 관련 모델 컬렉션의
list_artifact_versions_tool - 후보 버전과 현재 프로덕션 버전을 비교하려면
compare_artifact_versions_tool - 비교 결과를 게시하려면
log_analysis_to_wandb및create_wandb_report_tool
문제 해결
| 증상 | 원인 및 해결 방법 |
|---|---|
401 Unauthorized 또는 Invalid API key | W&B API 키가 없거나 형식이 잘못되었거나, 대상 entity 또는 팀에 대한 권한이 없습니다. wandb.ai/authorize에서 키를 다시 생성한 뒤, Bearer 토큰으로 전달되었거나 WANDB_API_KEY에 설정되어 있는지 확인하세요. |
| 성공할 것으로 예상한 쿼리에서 빈 결과가 반환됨 | 팀/entity 또는 프로젝트 이름이 올바르지 않거나 API 키에 액세스 권한이 없습니다. 에이전트와 함께 두 항목을 모두 확인한 후 다시 시도하세요. |
https://<your-instance>/mcp에서 404 Not Found 또는 connection refused 발생 | 호스팅된 MCP 서버가 Dedicated Cloud 또는 Self-Managed 인스턴스에서 아직 활성화되지 않았거나, 클라이언트가 잘못된 URL을 가리키고 있습니다. 활성화를 요청하려면 W&B 지원팀에 문의한 다음, Connection URL에서 URL을 확인하세요. |
Dedicated Cloud에서 429 Too Many Requests 발생 | 인스턴스의 요청 속도 제한에 도달했습니다. 더 높은 제한을 요청하는 방법은 Dedicated Cloud rate limits를 참조하세요. |
Claude Desktop에서 로컬 서버가 uvx를 찾지 못함 | claude_desktop_config.json의 command 필드에 uvx의 전체 경로를 사용하세요. |