2026-03-20AI 모델MiniMax자가 진화AI 벤치마크AI 비용

AI가 사람 없이 스스로 100번 훈련해서 30% 똑똑해졌다 — MiniMax M2.7

중국 AI 스타트업 MiniMax가 스스로 자신의 약점을 찾아 고치는 AI 모델 M2.7을 공개했습니다. 100회 이상 자가 개선을 반복해 성능이 30% 올랐고, Claude Opus 4.6과 GPT-5.4에 근접하면서 가격은 5분의 1 수준입니다.

AI가 자기 자신을 가르치는 시대가 시작됐습니다. 중국 AI 기업 MiniMax가 3월 18일 공개한 M2.7은 세계 최초로 '자가 진화(Self-Evolution)' 능력을 탑재한 AI 모델입니다. 사람이 개입하지 않아도 AI가 스스로 실패 원인을 분석하고, 코드를 고치고, 테스트하고, 결과가 좋으면 채택하는 과정을 100번 넘게 반복했습니다. 결과적으로 성능이 30% 향상됐고, 개발 과정의 30~50%를 사람 대신 AI가 처리했습니다.

AI가 스스로 진화한다는 게 무슨 뜻인가

보통 AI 모델을 만들 때는 사람 연구원이 직접 실험을 설계하고, 실패하면 원인을 분석하고, 코드를 수정하고, 다시 테스트합니다. M2.7은 이 과정을 AI가 혼자서 해냅니다.

구체적으로 M2.7은 이런 순서를 반복합니다:

① 실패 분석 — 어디서 틀렸는지 스스로 찾아냄
② 코드 수정 — 자기 자신의 코드를 직접 고침
③ 테스트 실행 — 수정된 버전으로 시험을 돌림
④ 비교 판단 — 이전보다 나아졌으면 채택, 아니면 되돌림

이 과정을 100번 이상 반복한 결과, M2.7은 내부 성능 지표에서 30% 향상을 달성했습니다. MiniMax 측은 "엔지니어 1명이 4일 만에 만든 기본 환경 위에서, AI가 스스로 나머지를 완성했다"고 밝혔습니다.

Claude, GPT와 비교하면 어느 수준인가

MiniMax M2.7 벤치마크 비교 차트 — SWE Bench Pro, VIBE-Pro, MLE-Bench 등 8개 항목에서 Claude Opus 4.6, GPT-5.4와 비교

위 차트는 M2.7을 현재 최고 성능 AI 모델들과 비교한 결과입니다. 핵심 수치를 정리하면:

SWE Bench Pro(코드 버그 수정 능력): M2.7 56.2% — GPT-5.4 57.7%, Opus 4.6 57.3%에 근접
VIBE-Pro(프로젝트 전체 완성 능력): M2.7 55.6% — Sonnet 4.6 56.1%과 거의 동등
MLE-Bench Lite(AI 연구 과제 수행): M2.7 66.6% — Opus 4.6(72.7%)에 이어 2위
MM-ClawBench(복잡한 도구 활용): M2.7 62.7% — 전체 모델 중 1위

특히 주목할 점은 M2.7의 크기입니다. 실제로 작동하는 부분(활성 파라미터)이 100억 개로, 경쟁 모델 대비 훨씬 작습니다. 작은 두뇌로 큰 두뇌와 비슷한 성적을 낸 셈입니다. 응답 속도도 초당 100 토큰으로, Claude Opus 4.6보다 3배 빠릅니다.

가격이 파격적이다

AI 모델을 업무에 쓸 때 가장 신경 쓰이는 건 비용입니다. M2.7의 가격을 정리하면:

기본 가격: 입력 100만 토큰(한국어 약 25만 자)당 $0.3
캐시 적용 시: 100만 토큰당 $0.06 — 같은 수준 성능의 모델 중 최저가
비교: Claude Opus 4.6 입력 $15/M, GPT-5.4 $2.5/M → M2.7이 5~250배 저렴

MiniMax 측은 "항상 켜놓는 AI 비서(always-on agent)를 운영하기 가장 적합한 가격"이라고 설명합니다. 자동 캐시 기능이 내장돼 있어 별도 설정 없이도 반복 작업에서 비용이 자동으로 줄어듭니다.

자가 진화 시스템의 구조

M2.7 자가 진화 시스템 아키텍처 — 사람과 AI의 역할 분담 다이어그램

위 다이어그램은 M2.7의 자가 진화가 어떻게 작동하는지 보여줍니다. 핵심은 사람은 방향만 잡고, AI가 실행과 개선을 반복하는 구조입니다.

사람이 하는 일은 세 가지뿐입니다: ① 목표 설정, ② 결과 검토, ③ 다음 방향 결정. 나머지 실험 설계, 코드 수정, 성능 측정, 보고서 작성은 전부 M2.7이 처리합니다. MiniMax는 이 방식으로 내부 연구팀의 생산성을 크게 끌어올렸다고 합니다.

MiniMax는 어떤 회사인가

MiniMax는 2021년 12월 중국에서 설립된 AI 스타트업으로, 현재 전 세계 2억 명 이상이 이 회사의 AI 제품을 사용하고 있습니다. 텍스트·음성·영상·음악까지 다루는 멀티모달(여러 종류의 데이터를 한 번에 처리하는) AI 모델을 만듭니다.

이전 모델 M2.5도 업계에서 주목받았지만, M2.7은 '자가 진화'라는 완전히 새로운 능력을 추가하면서 한 단계 도약했습니다. 특히 거짓 정보 생성(할루시네이션) 점수가 -40에서 +1로 극적으로 개선되어, 기존 중국 AI 모델의 약점이던 신뢰성 문제를 상당 부분 해결했습니다.

개발자라면 지금 바로 써볼 수 있다

M2.7은 이미 API(다른 프로그램에서 호출해서 쓸 수 있는 방식)로 공개돼 있습니다. Claude Code, Cursor, Cline 같은 AI 코딩 도구에서도 연결해서 쓸 수 있습니다.

# MiniMax M2.7 API 호출 예시 (Python)
import requests

response = requests.post(
    "https://api.minimax.io/v1/text/chatcompletion_v2",
    headers={"Authorization": "Bearer YOUR_API_KEY"},
    json={
        "model": "MiniMax-M2.7",
        "messages": [{"role": "user", "content": "안녕하세요"}]
    }
)

빠른 버전인 M2.7-highspeed도 있어서, 동일한 결과를 더 빠르게 받을 수 있습니다. 무료 체험은 MiniMax Agent 플랫폼에서 가능합니다.

AI 업계에 던지는 질문

M2.7이 보여준 '자가 진화'는 AI 개발의 미래를 엿보게 합니다. 지금까지 AI 모델을 개선하려면 수십 명의 연구원이 수개월간 실험을 반복해야 했습니다. M2.7은 그 과정의 절반을 AI 스스로 해낸 최초의 사례입니다.

물론 우려도 있습니다. AI가 자기 자신을 수정하는 과정에서 의도치 않은 편향이 증폭되거나, 사람이 예상하지 못한 방향으로 변할 수 있습니다. MiniMax도 이 점을 인지하고, 사람의 검토와 승인 단계를 의무적으로 포함시켰습니다.

현재 ChatGPT(OpenAI), Claude(Anthropic), Gemini(Google) 세 회사가 지배하는 AI 시장에서, 중국 스타트업이 '자가 진화'라는 새로운 경쟁 축을 열었다는 점이 이번 발표의 가장 큰 의미입니다. 5분의 1 가격에 비슷한 성능, 거기에 스스로 발전하는 능력까지 — AI 시장의 판도가 다시 한번 흔들리고 있습니다.

관련 콘텐츠 — Easy클코로 AI 시작하기 | 무료 학습 가이드 | AI 뉴스 더보기

출처

AI 소식, 가장 빠르고 쉽게 받아보세요

누구나 이해할 수 있도록, 가장 자세하고 쉽게 알려드립니다

텔레그램 채널 구독