MCP 3개 연결하면 AI 두뇌 72% 낭비 — CLI로 토큰 비용 17배 절감하는 법
MCP를 AI 코딩 도구에 연결하면 컨텍스트 윈도우의 72%가 스키마로 낭비됩니다. Scalekit 75회 벤치마크 결과, CLI 방식은 토큰 32배 절감·비용 17배 절감·성공률 100%를 기록했습니다. 지금 바로 적용할 수 있는 3가지 해결책을 정리했습니다.
한 줄 요약: AI 코딩 도우미에 외부 도구를 많이 연결할수록, 정작 AI가 생각할 수 있는 공간은 줄어듭니다. 실측 결과 MCP(AI가 외부 도구를 연결해서 쓸 수 있게 해주는 규격) 3개만 연결해도 AI 두뇌 용량의 72%가 도구 설명서로 꽉 찼습니다.
MCP 컨텍스트 윈도우 낭비 — AI 코딩 도구가 느려지는 진짜 이유
요즘 Claude Code, Cursor 같은 AI 코딩 도구를 쓰면서 GitHub, Slack, 데이터베이스 등을 MCP(Model Context Protocol)로 연결하는 분들이 많습니다. 그런데 연결을 많이 할수록 AI가 점점 느려지거나 엉뚱한 답을 하는 경험, 해보신 적 있나요?
Apideck(API 통합 플랫폼)의 엔지니어 Samir Amzani가 이 현상의 원인을 자세한 분석 글로 공개했고, Scalekit은 75회 반복 벤치마크로 이를 숫자로 증명했습니다.
컨텍스트 윈도우란? — AI의 작업 기억 용량
AI에게는 컨텍스트 윈도우(한 번에 읽고 생각할 수 있는 총 용량)라는 제한이 있습니다. 사람으로 치면 '작업 기억 용량'에 해당합니다. Claude의 경우 이 공간이 약 20만 토큰(한국어 기준 약 소설 1.5권 분량)입니다.
문제는 MCP로 외부 도구를 연결하면, AI가 사용자의 질문을 읽기도 전에 도구 설명서(스키마)가 이 공간을 차지한다는 것입니다. GitHub MCP 서버 하나만 연결해도 43개 도구의 설명서가 한꺼번에 들어가서 약 5만 5천 토큰을 차지합니다. AI 코딩을 처음 시작하는 분이라면 무료 학습 가이드에서 기본 개념부터 확인해보시기 바랍니다.
위 그림이 핵심입니다. '저장소의 프로그래밍 언어를 알려줘'라는 간단한 질문 하나에, CLI(터미널 명령어) 방식은 1,365토큰으로 끝나지만, MCP는 쓰지도 않을 42개 도구의 설명서까지 통째로 싣고 가서 44,026토큰을 씁니다. 32배 차이입니다.
MCP vs CLI 벤치마크 — 75회 실험 결과
Scalekit이 Claude Sonnet 4를 사용해 5가지 GitHub 작업을 각 방식별 25회씩, 총 75회 반복 측정한 결과입니다.
작업별 토큰 소모량 (중간값)
| 작업 | CLI | MCP | 배수 |
|---|---|---|---|
| 저장소 언어·라이선스 확인 | 1,365 | 44,026 | 32배 |
| PR 상세·리뷰 상태 조회 | 1,648 | 32,279 | 20배 |
| 저장소 정보·설치 방법 | 9,386 | 82,835 | 9배 |
| 기여자별 병합 PR 조회 | 5,010 | 33,712 | 7배 |
| 최신 릴리스·의존성 확인 | 8,750 | 37,402 | 4배 |
MCP 토큰 비용 비교 — 월 3달러 vs 55달러
월 1만 회 작업 기준으로 환산하면:
CLI 방식
월 $3.20
성공률 100% (25/25)
MCP 직접 연결
월 $55.20
성공률 72% (18/25) — 실패율 28%
17배 비싼데 4번 중 1번은 실패합니다. MCP 실패의 원인은 프로토콜 자체의 문제가 아니라, 원격 서버와의 TCP 연결 시간 초과였습니다.
MCP 스키마 팽창(Schema Bloat)이 발생하는 원리
MCP의 설계 구조상, AI가 어떤 도구를 쓸지 미리 알 수 없기 때문에 연결된 모든 도구의 사용설명서를 매번 통째로 싣습니다. GitHub MCP 서버라면 '저장소 조회', 'PR 생성', '웹훅 관리', '이슈 작성' 등 43개 도구의 설명이 전부 들어갑니다.
사람으로 비유하면, 전화번호 하나만 찾으면 되는데 전화번호부 전체를 머릿속에 올려놓고 시작하는 것과 같습니다.
해결책 1: MCP 연결 수 줄이기 — 지금 바로 적용 가능
가장 간단한 대응은 정말 필요한 MCP만 연결하는 것입니다.
실천 팁: Claude Code나 Cursor에서 MCP를 10개 연결해두셨다면, 지금 하는 작업에 실제로 필요한 2~3개만 활성화하고 나머지는 비활성화해보시기 바랍니다. AI 응답이 눈에 띄게 좋아질 수 있습니다.
해결책 2: CLI 방식으로 토큰 700분의 1로 줄이기
Apideck이 제안하는 방식은 MCP 대신 CLI(터미널 명령어)를 사용하는 것입니다. MCP가 도구 43개의 설명서를 한 번에 싣는 반면, CLI는 필요할 때 필요한 것만 '도움말'을 불러봅니다.
// MCP 방식: AI에게 43개 도구 설명서가 한꺼번에 로드됨 → 55,000+ 토큰 소모
// CLI 방식: AI가 필요할 때만 질문
$ apideck --list # 20토큰 — "어떤 서비스가 있지?"
$ apideck github --list # 200토큰 — "GitHub에서 뭘 할 수 있지?"
$ apideck github repo --help # 150토큰 — "저장소 조회는 어떻게 하지?"
이 '점진적 발견(progressive disclosure)' 방식은 시작할 때 80토큰만 차지합니다. MCP의 55,000토큰과 비교하면 약 700분의 1입니다.
해결책 3: MCP 게이트웨이 — 기업 환경 토큰 90% 절감
MCP를 아예 안 쓸 수 없는 환경(여러 사용자의 권한 관리, 보안 감사가 필요한 기업 등)이라면 MCP 게이트웨이라는 절충안이 있습니다. 43개 도구 중 현재 작업에 관련된 2~3개만 골라서 AI에게 전달하는 중간 계층입니다.
Scalekit의 추정에 따르면, 게이트웨이를 사용하면 MCP의 토큰 소모를 약 90% 줄여서 44,026토큰이 약 3,000토큰으로 내려갑니다. 비용도 월 $55.20에서 $5 수준으로 절감됩니다.
MCP vs CLI vs 게이트웨이 — 어떤 방식을 선택해야 할까
CLI 추천
개인 개발자, API 연결이 50개 이상인 경우, 토큰 비용에 민감한 경우
MCP + 게이트웨이 추천
기업 환경, 사용자별 권한 관리 필요, 보안 감사 필수인 경우
MCP 직접 연결 주의
도구 5~10개 이하 + 한 세션에 수백 번 호출하는 경우에만 효율적
벤치마크 직접 실행하기 — 오픈소스 코드 공개
Scalekit이 벤치마크 코드를 오픈소스로 공개했습니다. GitHub 개인 토큰과 Anthropic API 키만 있으면 내 환경에서 직접 측정해볼 수 있습니다.
git clone https://github.com/scalekit-inc/mcp-vs-cli-benchmark
cd mcp-vs-cli-benchmark
# README의 안내에 따라 환경 변수 설정 후 실행
핵심 정리
MCP 자체가 나쁜 기술은 아닙니다. 문제는 '모든 도구의 설명서를 매번 통째로 싣는' 현재의 구조입니다. AI 코딩 도구를 쓰면서 "왜 이렇게 느리지?", "왜 엉뚱한 답을 하지?"라는 경험을 했다면, 연결된 MCP 수를 먼저 점검해보시기 바랍니다. 그것만으로도 AI의 성능이 체감될 만큼 달라질 수 있습니다.
AI 코딩과 바이브코딩에 대해 더 알고 싶다면 무료 학습 가이드를 확인해보시기 바랍니다.
관련 콘텐츠 — Easy클코로 AI 시작하기 | 무료 학습 가이드
출처