Anthropic 숨긴 신모델 Claude Mythos 유출 → '사이버 역량 역대 최강' 내부 경고 담겼다
Anthropic의 CMS 설정 오류로 약 3,000건의 내부 문서가 유출됐습니다. 문서에는 'Claude Mythos'라는 코드명의 신모델이 기존 Claude 대비 사이버보안·코딩·추론 능력에서 극적으로 높은 점수를 기록하며 '역대 최강'임을 확인하는 내용이 담겼습니다.
2026년 3월 말, AI 업계는 예상치 못한 폭탄 하나를 마주했습니다. Anthropic(앤트로픽)의 콘텐츠 관리 시스템(CMS, Content Management System — 웹사이트의 글·이미지·문서를 올리고 관리하는 소프트웨어) 설정 오류로 인해 약 3,000건의 내부 미공개 문서가 공개 캐시(cache — 빠른 접근을 위해 임시로 저장해 둔 인터넷 저장소)에 그대로 노출된 것입니다. 이 문서들 안에는 세상에 아직 공개되지 않은 신모델 'Claude Mythos'에 대한 상세한 내용이 고스란히 담겨 있었습니다.
3,000건 문서 유출 — 어떻게 일어났나
보안 전문 기업 LayerX Security의 연구원 Roy Paz와 케임브리지대학교 연구원 Alexandre Pauwels가 이 유출 데이터를 처음 발견했습니다. 이들은 일반적인 웹 인덱싱(web indexing — 검색엔진이 인터넷 페이지를 자동으로 수집해 목록을 만드는 과정) 도중 Anthropic의 내부 문서가 공개 캐시에 저장돼 있다는 사실을 확인했습니다.
유출의 원인은 단순했습니다. Anthropic이 사용하는 CMS의 설정에서 특정 내부 페이지가 외부 검색엔진 크롤러(crawler — 인터넷을 자동으로 돌아다니며 정보를 수집하는 프로그램)에 노출되지 않도록 막는 설정이 잘못 적용된 것입니다. 그 결과, 수천 건의 민감한 내부 문서가 수주간 누구나 접근 가능한 상태로 방치됐습니다.
Anthropic은 문제를 인지한 직후 즉시 해당 문서들을 비공개 처리했지만, 이미 연구자들에 의해 내용이 캡처되고 분석된 뒤였습니다. 이 사건은 단순한 기술적 실수가 얼마나 큰 정보 보안(information security — 기업이나 기관이 보유한 중요 정보가 외부에 새어나가지 않도록 보호하는 체계) 파장을 일으킬 수 있는지를 단적으로 보여주는 사례로 기록됐습니다.
Claude Mythos란 무엇인가 — 기존 Claude와 무엇이 다른가
유출 문서에는 'Capybara' 또는 'Claude Mythos'라는 코드명(codename — 제품이나 프로젝트가 공식 출시되기 전에 내부에서만 사용하는 임시 이름)으로 불리는 신규 모델의 상세한 성능 데이터와 개발 방향이 담겨 있었습니다.
Anthropic의 공식 대변인은 이 모델에 대해 "역대 가장 강력한 모델"이라고 인정하며, "성능의 단계적 비약(step change)"이라는 표현을 사용했습니다. 이는 단순한 점진적 개선이 아니라, 이전 세대와는 본질적으로 다른 수준의 능력을 갖췄다는 의미입니다.
구체적으로 Claude Mythos는 세 가지 영역에서 현재의 최신 모델인 Claude Opus 4.6 대비 "극적으로 높은 점수"를 기록한 것으로 나타났습니다.
- 소프트웨어 코딩: 복잡한 프로그래밍 문제를 해결하는 능력에서 현격한 향상
- 학술 추론: 수학·과학·논리 문제 등 고난도 학문적 사고 능력에서 압도적 성과
- 사이버보안: 해킹 취약점(vulnerability — 소프트웨어나 시스템에 존재하는 보안상 허점) 분석 및 공격 시뮬레이션에서 기존 어떤 AI 모델도 넘지 못한 수준
벤치마크(benchmark — AI 모델의 성능을 숫자로 측정하는 표준 테스트) 결과가 공개되진 않았지만, 유출 문서는 여러 공인된 평가 항목에서 Claude Mythos가 현존하는 모든 경쟁 모델을 넘어선다는 점을 명시하고 있습니다.
"역대 최강"이라는 증거 — 사이버보안 벤치마크에서 무슨 일이 있었나
유출 문서 중 가장 충격적인 부분은 사이버보안 역량에 관한 서술이었습니다. 문서는 Claude Mythos가 "사이버 역량에서 다른 어떤 AI 모델보다 훨씬 앞서 있다"고 명시하고 있습니다. 이는 GPT-4o, Gemini Ultra 등 현존하는 최상위 AI 모델들을 모두 포함한 비교에서 나온 결론입니다.
사이버보안 분야에서 AI가 갖는 역량은 크게 두 방향입니다. 하나는 방어(defense) — 시스템의 취약점을 찾아내고 패치(patch — 소프트웨어의 결함을 수정하는 업데이트)를 제안하는 능력. 다른 하나는 공격(offense) — 취약점을 실제로 악용하는 익스플로잇(exploit — 시스템의 보안 취약점을 이용해 공격하는 코드나 방법)을 만들어내는 능력입니다.
유출 문서에 따르면, Claude Mythos는 두 방향 모두에서 압도적인 성능을 보였습니다. 특히 자동화된 취약점 발견 및 익스플로잇 생성 능력이 기존 모델 대비 비약적으로 향상된 것으로 나타났습니다.
이는 단순한 기술 발전의 의미를 넘어섭니다. 만약 이 모델이 악의적인 목적으로 사용된다면, 기존의 사이버 방어 체계 전체를 무력화할 수 있는 공격 도구가 될 수 있기 때문입니다. Fortune은 이 사안을 "전례 없는 사이버보안 리스크"라는 제목으로 별도 기사를 발행하며 업계의 우려를 집약했습니다.
Anthropic 스스로 경고한 이유 — 이 모델이 왜 위험한가
놀라운 것은 Anthropic 자체도 이 모델의 위험성을 공식적으로 인정했다는 사실입니다. 유출 문서와 이후 공식 확인 과정에서, Anthropic은 Claude Mythos가 "방어자보다 훨씬 빠른 속도로 취약점을 악용하는 모델 물결의 전조"가 될 수 있다고 직접 경고했습니다.
이 경고의 의미를 풀어보면 다음과 같습니다. 현재 사이버 공격과 방어의 싸움은 어느 정도 균형을 유지하고 있습니다. 공격자가 새로운 취약점을 발견하면, 방어자도 시간을 들여 패치를 개발하고 배포합니다. 그런데 Claude Mythos처럼 극도로 빠르게 취약점을 분석하고 익스플로잇을 만들어낼 수 있는 AI가 등장하면, 이 균형이 완전히 무너질 수 있습니다. 방어가 따라잡기 불가능한 속도로 공격이 이루어질 수 있기 때문입니다.
이런 위험성을 인식했기 때문에, Anthropic은 현재 Claude Mythos의 일반 출시를 보류하고 소수의 얼리 액세스(early access — 정식 출시 전에 선정된 소수 사용자에게만 먼저 제공하는 방식) 고객을 대상으로만 제한적인 테스트를 진행 중입니다. 초기 배포는 주로 사이버보안 응용 평가에 집중하고 있으며, 외부 연결(API 확장)은 단계적으로 진행할 예정입니다.
높은 연산 비용도 걸림돌
일반 출시가 지연되는 또 다른 이유는 기술적·경제적 문제입니다. Claude Mythos를 구동하는 데 필요한 연산 자원(computing resource — AI 모델을 실행하기 위해 필요한 컴퓨터 처리 능력)이 현재의 Claude 시리즈보다 훨씬 높은 것으로 알려져 있습니다. 이는 모델 하나를 한 번 실행하는 데 드는 비용이 크게 늘어난다는 의미이며, 수백만 명의 사용자가 동시에 사용하는 상업 서비스에 즉시 도입하기엔 현실적인 한계가 있습니다.
Anthropic은 이 비용 문제를 해결하기 위한 최적화 작업을 병행하고 있는 것으로 전해집니다. 하지만 안전성 평가와 비용 최적화가 모두 완료되기 전까지는 일반 출시가 이루어지지 않을 것으로 보입니다.
언제 쓸 수 있나 — 출시 전망과 업계 반응
현재로선 Claude Mythos의 정확한 공개 출시 일정이 확정되지 않았습니다. Anthropic은 이 모델의 안전성 평가를 매우 엄격하게 진행하고 있으며, 특히 사이버보안 관련 오용 가능성을 차단하기 위한 안전장치(safety guardrail — AI가 유해한 방식으로 사용되는 것을 막기 위해 모델에 내장된 제한 장치) 개발에 상당한 시간을 투자하고 있습니다.
업계 반응은 크게 두 갈래로 나뉩니다. 한편에서는 Claude Mythos의 놀라운 성능에 주목하며, 이 모델이 AI 능력의 새로운 기준점을 제시할 것이라는 기대를 보입니다. 다른 한편에서는 이처럼 강력한 사이버보안 역량을 가진 AI가 충분한 안전장치 없이 출시될 경우, 전 세계 디지털 인프라가 전례 없는 수준의 위협에 노출될 수 있다고 경고합니다.
Fortune을 비롯해 The Decoder, Techzine 등 주요 기술 언론이 이 사건을 대서특필하며, 단순한 AI 성능 이야기를 넘어 AI 안전성(AI safety — AI 시스템이 인간에게 해를 끼치지 않도록 설계하고 관리하는 분야 전체를 아우르는 개념) 논의의 핵심 사례로 다루고 있습니다.
이번 유출은 의도치 않은 사고였지만, 역설적으로 AI 개발 기업들이 내부적으로 얼마나 강력한 모델을 개발하고 있으며, 그 잠재적 위험성을 스스로도 얼마나 진지하게 받아들이고 있는지를 세상에 알리는 계기가 됐습니다. Claude Mythos의 공식 등장이 가져올 파장은 출시 이후에도 한동안 업계와 사회의 뜨거운 화두가 될 것으로 보입니다.
관련 콘텐츠 — Easy클코로 AI 시작하기 | 무료 학습 가이드 | AI 뉴스 더보기