실패하면 그냥 반복하는 AI vs 실패에서 배우는 JiuwenClaw — GAIA 인간 수준 91.69%
openJiuwen 커뮤니티가 자기 진화형 AI 에이전트 'JiuwenClaw'를 오픈소스로 공개했습니다. 실패를 분석해 스스로 개선하는 폐쇄 루프 방식으로, GAIA 벤치마크 91.69%를 달성해 인간 수준에 근접했습니다.
실패해도 똑같은 방법을 반복하는 기존 AI 에이전트와 달리, JiuwenClaw는 실패 원인을 자동으로 분석하고 전략을 바꿉니다. Apache 2.0(상업용 사용 포함 무료로 쓸 수 있는 오픈소스 라이선스) 라이선스로 누구나 무료로 내려받을 수 있으며, GAIA 벤치마크(AI가 얼마나 실제 세상 문제를 잘 해결하는지 측정하는 종합 테스트 — 구글 검색, 파일 작업, 계산 등 포함)에서 91.69%를 기록해 인간 참가자 평균인 약 92%에 거의 닿았습니다.
JiuwenClaw: 실패를 학습으로 전환하는 자기 진화형 AI 에이전트 (출처: MarkTechPost)
기존 AI 에이전트와 무엇이 다른가 — "실패해도 반복" vs "실패에서 배운다"
지금까지 대부분의 AI 에이전트는 태스크를 실행하다 막히면 개발자가 직접 프롬프트(AI에게 주는 지시문)를 고쳐야 했습니다. 에이전트 자체는 실패했다는 사실을 알아도, 다음번에 다른 방법을 시도하지 않습니다. 같은 지시문으로 같은 실수를 반복하는 것이 기존 방식의 한계입니다.
JiuwenClaw는 이 구조를 바꿉니다. 핵심은 자율 기술 진화(Autonomous Skill Evolution)입니다. 도구 호출이 실패하거나 사용자가 결과에 "아니오" 또는 부정적인 반응을 보이면, 에이전트는 즉시 실패 원인을 분석하고 더 나은 전략을 자동으로 생성합니다. 개발자가 손댈 필요가 없습니다.
이 과정을 폐쇄 루프(Closed Loop — 실행→결과→피드백→개선→재실행을 스스로 반복하는 자동화 고리)라고 부릅니다. 구체적으로는 다음 다섯 단계가 자동으로 순환합니다.
- 실행: 주어진 태스크를 수행합니다.
- 실패: 도구 오류나 사용자 부정 피드백이 발생합니다.
- 학습: 실패 원인을 자동으로 분석합니다.
- 최적화: 텍스트 그래디언트(AI에게 주는 지시문을 자동으로 개선하는 최적화 기법) 방식으로 지시문과 예시를 동시에 업데이트합니다.
- 재실행: 개선된 전략으로 다시 시도합니다.
이 구조 덕분에 JiuwenClaw는 사용할수록 똑똑해집니다. 수동 프롬프트 엔지니어링(사람이 직접 AI 지시문을 다듬는 작업)이 필요 없다는 점이 기업과 개인 사용자 모두에게 가장 큰 장점입니다.
숫자로 보는 성능 — GAIA 91.69%, BrowseComp-Plus 80%
JiuwenClaw의 기반 플랫폼인 openJiuwen의 DeepAgent는 GAIA 벤치마크(AI가 얼마나 실제 세상 문제를 잘 해결하는지 측정하는 종합 테스트 — 구글 검색, 파일 작업, 계산 등 포함)에서 91.69%를 달성했습니다. GAIA는 단순한 퀴즈가 아니라 웹 검색, 파일 분석, 수학 계산, 여러 단계에 걸친 추론 등 실제 세상에서 사람이 하는 복잡한 작업을 AI가 얼마나 잘 처리하는지를 측정하는 가장 까다로운 벤치마크 중 하나입니다.
인간 참가자의 평균 점수가 약 92%임을 감안하면, 91.69%는 사실상 인간 수준입니다. NVIDIA의 최신 AI 모델인 Nemotron의 점수도 초과했습니다.
웹 탐색 전문 모듈인 DeepSearch는 BrowseComp-Plus 벤치마크(AI가 웹을 얼마나 정확하게 탐색해 답을 찾는지 측정하는 벤치마크)에서 80% 정확도를 기록했습니다. 단순히 키워드를 검색하는 수준을 넘어, 여러 페이지를 돌아다니며 정보를 종합하는 심층 검색 능력을 측정하는 이 벤치마크에서 80%는 현재 공개된 오픈소스 에이전트 중 최상위권에 해당합니다.
openJiuwen 플랫폼의 시스템 구조 (출처: openJiuwen 공식 사이트)
세 줄 명령어로 설치 — pip install jiuwenclaw
JiuwenClaw의 또 다른 강점은 설치 편의성입니다. Python 3.11 이상이 설치된 컴퓨터라면 터미널에서 아래 세 줄만 입력하면 됩니다.
# 1단계: 패키지 설치
pip install jiuwenclaw
# 2단계: 초기화
jiuwenclaw-init
# 3단계: 실행
jiuwenclaw-start
설치가 완료되면 브라우저에서 http://localhost:5173으로 접속해 바로 사용할 수 있습니다. 별도의 서버 계정이나 복잡한 설정이 필요 없이 내 컴퓨터에서 완전히 로컬로 실행됩니다.
패키지는 PyPI(pip install로 설치하는 파이썬 패키지 저장소)를 통해 공개되어 있으며, openJiuwen SDK v0.1.9 버전(2026년 3월 23일 릴리스)이 현재 최신입니다. 코드베이스는 Python 76.9%로 구성되어 있으며, GitHub에서 스타 136개, 포크 31개를 기록 중입니다 (공개 초기 단계임을 감안하면 빠른 관심 증가입니다).
업무 자동화와 연동 — 화웨이 클라우드, Lark 메신저, 음성 어시스턴트
JiuwenClaw는 개인 사용자를 넘어 기업 환경에서도 바로 쓸 수 있도록 설계되었습니다.
화웨이 클라우드 MaaS(AI 모델을 클라우드 서비스로 제공하는 플랫폼)를 포함해 OpenAI, Anthropic, Google 등 주류 LLM(대형 언어 모델) 플랫폼과 완전히 호환됩니다. 기업이 이미 사용 중인 AI 인프라에 그대로 연결할 수 있습니다.
Lark(라크) 메신저 통합은 업무 현장에서 특히 유용합니다. Lark는 바이트댄스(틱톡 모회사)가 만든 기업용 메신저로 아시아 기업들에서 널리 사용됩니다. JiuwenClaw를 Lark에 연결하면 채팅창에서 바로 "이 데이터 분석해줘", "회의 일정 정리해줘" 같은 명령을 AI 에이전트에게 내릴 수 있습니다.
화웨이 기기 사용자라면 시아오이(Xiaoyi) 음성 어시스턴트와의 통합도 지원됩니다. 화웨이 스마트폰이나 태블릿에서 음성으로 태스크를 실행할 수 있어, 손을 쓰지 않고도 AI 에이전트를 작동시킬 수 있습니다.
장기 작업 관리 측면에서는 이벤트 기반 멀티 에이전트 제어 기능이 돋보입니다. 복잡한 태스크를 여러 에이전트가 나눠 처리하는 중에 갑자기 우선순위가 바뀌거나 방향을 바꿔야 할 때, 시스템이 자동으로 적응합니다. 그리고 작업 상태가 영구적으로 저장되기 때문에 중간에 전원이 꺼지거나 오류가 나도 중단된 지점부터 재개할 수 있습니다. 시간이 오래 걸리는 데이터 처리나 문서 작업에서 처음부터 다시 시작할 필요가 없어집니다.
앞으로의 전망 — 자기 개선 AI의 새 기준점이 될까
JiuwenClaw는 현재 GitHub 스타 136개, 포크 31개로 공개 초기 단계이지만, 자기 진화 메커니즘이라는 독특한 접근법으로 AI 에이전트 분야에서 주목받고 있습니다.
기존 에이전트들이 "더 좋은 모델"에 의존해 성능을 높이는 것과 달리, JiuwenClaw는 "더 나은 학습 루프"로 성능을 높이는 방향을 택했습니다. 이는 모델 크기나 비용과 무관하게 사용할수록 똑똑해지는 에이전트를 의미합니다. 소규모 팀이나 개인 개발자도 고가의 API 없이 경쟁력 있는 AI 자동화를 구축할 수 있는 가능성을 엽니다.
Apache 2.0 라이선스(상업용 사용 포함 무료로 쓸 수 있는 오픈소스 라이선스)로 공개된 만큼, 기업이 내부 시스템에 통합하거나 별도 제품을 만드는 데도 법적 제약이 없습니다. openJiuwen SDK가 꾸준히 업데이트되고 커뮤니티가 성장한다면, JiuwenClaw는 자기 개선형 AI 에이전트의 새로운 기준점이 될 수 있습니다.
지금 바로 GitHub 저장소에서 코드를 살펴보거나, PyPI(pip install로 설치하는 파이썬 패키지 저장소)에서 pip install jiuwenclaw 한 줄로 직접 경험해볼 수 있습니다.