AI 숫자 편향 실험 — ChatGPT·Claude·Gemini 전부 27을 고른 이유
ChatGPT, Claude, Gemini, Llama에게 1~50 사이 숫자를 고르라고 하면 전부 27을 답합니다. 7만 5,600번 실험으로 밝혀진 AI 랜덤 숫자 편향의 원인과 직접 확인하는 방법을 정리했습니다.
AI 숫자 편향이라는 흥미로운 현상이 화제입니다. ChatGPT에게 "1부터 50 사이에서 숫자 하나만 골라봐"라고 하면 27이라고 답합니다. Claude에게 같은 질문을 하면? 역시 27. Gemini도 27, Llama도 27. AI 모델 4종이 마치 약속이라도 한 듯 정확히 같은 숫자를 고릅니다. 지금 바로 직접 해볼 수 있는 실험입니다.
이 현상은 최근 Reddit에서 시작된 실험이 해커뉴스에서 55개의 댓글과 함께 화제가 되면서 다시 주목받고 있습니다. 스페인의 물리학자 하비에르 코로나도-블라스케스(Javier Coronado-Blázquez)는 6개 AI 모델을 대상으로 7만 5,600번의 숫자 선택 실험을 수행했고, 그 결과는 충격적이었습니다.
범위별 AI 랜덤 숫자 편향 패턴
AI 모델들에게 범위를 바꿔가며 숫자를 골라보라고 하면, 범위마다 일관된 편향이 나타납니다.
1~10 범위: GPT-4o-mini, Phi-4, Gemini 2.0이 10번 중 8번은 7을 고릅니다. 사람에게 "1~10 중 아무거나 골라봐"라고 하면 28%가 7을 고르는데, AI는 이 편향을 80~100%까지 증폭시킵니다.
1~50 범위: ChatGPT, Claude Sonnet 4, Gemini 2.5 Flash, Llama 4가 전부 27을 고릅니다.
1~100 범위: Meta 데이터 과학자 콜린 프레이저(Colin Fraser)가 ChatGPT에게 2,000번 물어본 결과, 응답의 약 10%가 42였습니다. 더글러스 애덤스의 소설 『은하수를 여행하는 히치하이커를 위한 안내서』에서 "생명, 우주, 그리고 모든 것의 해답"으로 나오는 바로 그 숫자입니다.
1~10,000 범위: ChatGPT는 7,200~7,500 구간에 집중적으로 몰립니다. 구체적으로 7,284 / 7,314 / 7,342 / 7,381 / 7,421 / 7,438 같은 숫자가 반복적으로 등장합니다.
ChatGPT·Claude·Gemini 모델별 선호 숫자 비교
1~100 범위에서 각 AI 모델이 가장 좋아하는 숫자는 미묘하게 다릅니다.
최애 숫자: 47
최애 숫자: 42
최애 숫자: 72
자주 등장: 37, 47, 73
흥미로운 점은 AI가 좋아하는 숫자 대부분이 소수(prime number, 1과 자기 자신으로만 나뉘는 숫자)라는 것입니다. 37, 47, 73 모두 소수이고, 7로 끝나는 숫자(37, 47, 57, 67, 77, 87)가 유독 자주 등장합니다. 반면 11, 22, 33, 44처럼 숫자가 반복되는 경우는 거의 고르지 않고, 5의 배수도 피합니다.
LLM이 랜덤 숫자를 못 고르는 근본 원인
AI는 진짜 '랜덤'으로 숫자를 고르는 것이 아닙니다. ChatGPT, Claude, Gemini 같은 대형 언어 모델(LLM)은 인터넷에 있는 수십억 개의 텍스트를 학습했습니다. 그 텍스트 속에는 사람들이 '랜덤하다고 느끼는 숫자'가 패턴으로 남아 있습니다.
사람은 "아무 숫자나 골라봐"라고 하면 본능적으로 너무 크지도 작지도 않은, 둥근 숫자(10, 20, 50)가 아닌, 뭔가 '불규칙해 보이는' 숫자를 고릅니다. 그래서 7이나 37 같은 숫자가 선호됩니다. AI는 이 인간의 편향을 그대로 학습한 뒤, 오히려 더 극단적으로 증폭시킵니다.
코로나도-블라스케스 연구팀은 7개 언어, 6가지 온도(temperature, AI 응답의 창의성을 조절하는 파라미터) 설정에서 실험했지만, 결론은 하나였습니다: "GPT나 Gemini 같은 대형 모델이 더 창의적이라고 알려져 있지만, 랜덤 숫자 생성에서는 작은 모델만큼이나 편향적이고 예측 가능합니다."
이는 AI를 활용할 때 중요한 시사점을 줍니다. AI가 자신 있게 내놓는 답이라도 학습 데이터의 편향이 반영된 결과일 수 있다는 것입니다. 프롬프트 엔지니어링 가이드에서 다루듯이, AI에게 질문하는 방식에 따라 결과의 품질이 크게 달라집니다.
직접 AI 숫자 편향을 실험해보는 방법
지금 바로 ChatGPT, Claude, Gemini 중 아무거나 열고 이렇게 물어보면 됩니다.
1부터 50 사이에서 숫자 하나만 골라줘.
높은 확률로 27이라는 답을 받게 됩니다. 범위를 1~10,000으로 넓혀보면 7,200~7,500 사이의 숫자가 나올 가능성이 높습니다.
더 자세한 비교를 원한다면, 데이터 시각화 전문가 아난드 S가 만든 인터랙티브 시각화 도구에서 GPT-3.5, Claude 3, Gemini 1.0이 0~100 범위에서 각각 어떤 숫자를 선호하는지 직접 확인할 수 있습니다.
AI 편향이 알려주는 LLM 활용의 교훈
이 실험이 단순한 재미를 넘어 중요한 이유가 있습니다. AI에게 "랜덤 숫자"처럼 정답이 없는 질문을 던지면, AI가 학습 데이터에 얼마나 의존하는지가 그대로 드러납니다. 해커뉴스의 한 댓글은 이렇게 정리했습니다: "자신이 이해하지 못하는 분야에서 AI에 의존하면, 속게 됩니다."
반면 긍정적인 측면도 있습니다. GPT-4는 이전 버전의 42 편향을 교정해서 더 균등한 분포를 만들어냈습니다. Keenethics 팀은 물리적 엔트로피(예측할 수 없는 자연 현상에서 나오는 무작위성)를 AI에 결합해 진짜 랜덤한 결과를 만드는 방법을 개발했습니다. AI의 편향은 발견하면 고칠 수 있다는 뜻이기도 합니다.
AI 도구를 업무에 활용할 때도 마찬가지입니다. AI의 답변을 그대로 믿기보다, 편향 가능성을 인지하고 검증하는 습관이 중요합니다. 에이전틱 AI 입문 가이드에서 AI를 효과적으로 활용하는 기본 원칙을 확인해 보세요.
관련 콘텐츠 — Easy클코로 AI 시작하기 | 무료 학습 가이드 | AI 뉴스 더보기