AI가 짠 코드는 깨끗한데 아무도 이해 못 한다 — 구글 엔지니어가 경고하는 '이해력 부채'
AI 코딩 도구로 코드를 생성한 개발자의 이해력 점수가 17% 낮았습니다. 구글 엔지니어 Addy Osmani가 '이해력 부채(Comprehension Debt)' 개념을 제시하며, AI가 만든 코드를 아무도 이해하지 못하는 위험을 경고합니다.
AI 코딩 도구를 쓰면 코드가 빠르게 나옵니다. 테스트도 통과하고, 린트(코드 품질 검사) 경고도 없습니다. 그런데 한 가지 문제가 있습니다 — 그 코드를 이해하는 사람이 아무도 없다는 것입니다.
구글 클라우드와 Gemini 팀에서 일하는 시니어 엔지니어 Addy Osmani가 이 현상에 이름을 붙였습니다. '이해력 부채(Comprehension Debt)' — 시스템에 존재하는 코드의 양과 사람이 실제로 이해하는 코드의 양 사이에 벌어지는 격차입니다.
기술 부채와 다른, 보이지 않는 위험
우리가 익숙한 기술 부채(Technical Debt)는 눈에 보입니다. 코드가 지저분하고, 수정할 때마다 부딪힙니다. 하지만 이해력 부채는 다릅니다. 코드가 깨끗해 보이고, 테스트도 통과하지만, 정작 왜 그렇게 만들어졌는지 아는 사람이 없습니다.
Osmani는 한 학생 팀의 사례를 인용합니다. 7주 동안 AI로 빠르게 개발했지만, 결국 간단한 수정조차 할 수 없게 됐습니다. "팀 누구도 설계 결정이 왜 그렇게 내려졌는지, 시스템의 각 부분이 어떻게 함께 작동하는지 설명할 수 없었다"는 것이 핵심 원인이었습니다.

Anthropic 연구: AI를 쓰면 속도는 비슷한데 이해력은 17% 떨어진다
Osmani가 인용한 Anthropic의 'AI가 기술 습득에 미치는 영향' 연구는 52명의 엔지니어를 대상으로 새로운 라이브러리를 학습하는 과정을 추적했습니다. 결과는 놀라웠습니다.
핵심 수치 3가지
• AI를 사용한 그룹과 사용하지 않은 그룹의 작업 완료 시간은 거의 같았습니다 (23분 vs 25분)
• 그러나 후속 이해력 퀴즈에서 AI 그룹은 50점, 비AI 그룹은 67점을 기록 — 17% 차이 (p=0.010)
• 디버깅(오류 찾기) 능력에서 가장 큰 하락이 나타났습니다
더 흥미로운 것은 AI 사용 방식에 따라 결과가 극적으로 달랐다는 점입니다. 연구팀은 AI 사용 패턴을 7가지로 분류했습니다.
이해력이 높아지는 AI 사용법
개념 탐구형 (Conceptual Inquiry) — AI에게 "이 코드가 왜 이렇게 작동하는지 설명해줘"라고 묻는 방식. 이해력 점수 65%, 소요 시간 22분.
코드-설명 혼합형 (Hybrid Code-Explanation) — 코드를 받되, 왜 그렇게 짰는지 설명도 함께 요청. 이해력 점수 68%, 소요 시간 24분.
생성 후 이해형 (Generation-then-Comprehension) — 먼저 코드를 생성하고, 이후 그 코드를 분석하고 이해하는 단계를 추가. 이해력 점수 86%, 소요 시간 24분. 최고 점수입니다.
이해력이 떨어지는 AI 사용법
AI 위임형 (AI Delegation) — "이거 만들어줘" 하고 결과만 복사-붙여넣기. 이해력 점수 35%, 소요 시간 22분.
반복 디버깅형 (Iterative AI Debugging) — 오류가 나면 AI에게 반복적으로 "고쳐줘"만 요청. 이해력 점수 24%, 소요 시간 31분. 가장 느리고 가장 못 배웁니다.
같은 AI 도구를 써도, "만들어줘"라고 시키는 사람과 "왜 이렇게 작동하는지 설명해줘"라고 묻는 사람의 이해력 차이가 3.6배에 달했습니다.
AI는 코드를 사람보다 빠르게 만들지만, 사람은 그만큼 빠르게 검토할 수 없다
Osmani가 지적하는 핵심 문제는 속도의 비대칭입니다. AI는 몇 초 만에 수백 줄의 코드를 생성하지만, 사람이 그 코드를 꼼꼼히 읽고 이해하는 데는 여전히 오랜 시간이 걸립니다.
과거에는 코드 리뷰가 품질 관리와 지식 공유를 동시에 했습니다. 선배 개발자가 후배의 코드를 읽으면서 "이 부분은 이렇게 하면 더 좋겠다"고 가르쳤습니다. 하지만 AI가 코드를 생성하면 이 피드백 루프가 끊어집니다. 후배 개발자가 선배보다 빠르게 코드를 만들어내지만, 아무도 그 코드를 제대로 이해하지 못하는 상황이 벌어집니다.
테스트를 통과해도 안전하지 않은 이유
"테스트가 다 통과했으니까 괜찮지 않나?" 이렇게 생각할 수 있습니다. Osmani는 이에 대해 명확하게 반박합니다.
"드래그한 항목이 완전히 투명해져서는 안 된다는 테스트를 누가 작성하겠습니까? 그 가능성 자체를 생각하지 못했으니까요."
테스트는 예상할 수 있는 문제만 잡습니다. AI가 수백 개의 테스트 케이스를 동시에 수정하면, 리뷰어는 모든 변경이 정말 필요했는지 판단할 수 없습니다. 복잡한 동작은 실제로 사용해봐야만 드러나는데, 그때는 이미 프로덕션(실제 서비스 환경)에 배포된 뒤입니다.
AI를 잘 쓰는 사람이 더 가치 있어지는 시대
Osmani의 결론은 AI를 버리자는 것이 아닙니다. "코드를 싸게 만드는 것이 이해를 건너뛰어도 된다는 뜻은 아닙니다. 이해하는 작업 자체가 본업입니다"라고 그는 말합니다.
그가 제안하는 접근법을 정리하면 이렇습니다.
AI 시대에 '이해력 부채'를 줄이는 4가지 원칙
1. 코드를 만들기 전에 무엇을 할 것인지 먼저 정리하기 — AI에게 바로 "만들어줘"가 아니라, 먼저 요구사항을 명확히 적어두는 것이 중요합니다.
2. "만들어줘" 대신 "설명해줘"로 시작하기 — Anthropic 연구에서 이해력 점수가 가장 높았던 그룹은 AI에게 개념부터 물어본 사람들이었습니다.
3. AI가 만든 코드를 반드시 읽고 이해한 뒤 커밋하기 — 코드를 생성한 뒤 "이 코드가 무슨 일을 하는지 설명해줘"라고 한 번 더 물으면 이해력이 86%까지 올라갑니다.
4. 시스템 전체를 머릿속에 그릴 수 있는 사람을 키우기 — 깊은 시스템 이해를 가진 엔지니어의 가치는 AI 시대에 더 올라갑니다.
비개발자에게도 해당되는 이야기
이 문제는 개발자만의 일이 아닙니다. AI로 보고서를 쓰고, AI로 데이터를 분석하고, AI로 기획서를 만드는 모든 사람에게 같은 원리가 적용됩니다. AI가 만든 결과물을 이해하지 못한 채 사용하면, 질문이 들어왔을 때 대답할 수 없고, 문제가 생겼을 때 고칠 수 없습니다.
AI를 가장 잘 활용하는 사람은 AI에게 일을 시킨 뒤 결과를 그대로 쓰는 사람이 아니라, AI에게 "왜?"를 물으며 배우는 사람입니다. Anthropic 연구가 보여준 3.6배의 이해력 차이가 이를 증명합니다.
관련 콘텐츠 — Easy클코로 AI 시작하기 | 무료 학습 가이드 | AI 뉴스 더보기