엑셀 대신 AI에게 물어보세요 — 20만 건 데이터를 말 한마디로 분석하는 무료 워크숍 자료 공개
Django 공동 창시자 사이먼 윌리슨이 탐사 보도 컨퍼런스 NICAR 2026에서 진행한 'AI 코딩 에이전트로 데이터 분석하기' 3시간 워크숍 자료를 무료 공개했습니다. Claude Code와 OpenAI Codex를 사용해 20만 건의 샌프란시스코 가로수 데이터를...
"데이터 20만 건을 분석해줘"라고 AI에게 말하면, SQL 쿼리를 짜고 히트맵까지 그려줍니다. Django(파이썬 웹 프레임워크)의 공동 창시자이자 AI 분야의 대표적 실무 블로거 사이먼 윌리슨이 탐사 보도 컨퍼런스 NICAR 2026에서 3시간짜리 워크숍을 진행하고, 그 자료를 전부 무료로 공개했습니다. 참가자 전원이 사용한 AI 비용은 단 23달러(약 3만 원)이었습니다.
기자도 마케터도 데이터를 직접 분석하는 시대
이 워크숍의 핵심은 단순합니다 — 코딩을 모르는 사람도 AI에게 한국어(또는 영어)로 질문하면 데이터 분석 결과를 받을 수 있다는 것입니다. 사이먼 윌리슨은 워크숍 핸드아웃에서 Claude Code(Anthropic의 AI 코딩 도구)와 OpenAI Codex(OpenAI의 코딩 에이전트)를 사용해 실제 공공 데이터를 분석하는 과정을 단계별로 보여줍니다.
워크숍에서 다루는 8가지 주제는 다음과 같습니다:
1. AI 코딩 에이전트란 무엇인가
2. ChatGPT·Claude 기초 실습
3. Claude Code, Codex 설치 및 설정
4. 데이터베이스에 말로 질문하기 — 샌프란시스코 가로수 20만 그루 분석
5. FEC 선거자금 데이터 탐색
6. 데이터 정리 — 동네 코드를 실제 이름으로 바꾸기
7. 시각화 만들기 — 히트맵, 차트, 인터랙티브 지도
8. 웹 스크래핑(웹사이트에서 데이터 자동 수집) — ProPublica 재산공개 데이터
"가로수 20만 그루를 지도에 그려줘" — AI가 30초 만에 완성
가장 인상적인 데모는 샌프란시스코시 가로수 데이터셋을 활용한 것입니다. 시에서 공개한 20만 그루의 가로수 위치·종류·크기 데이터를 SQLite(가벼운 데이터베이스)에 넣고, AI에게 자연어로 질문합니다.
"가장 많이 심어진 나무 종류 10개를 알려줘", "연도별 식재 추이를 보여줘", "가로수가 가장 많은 거리는?" — 이런 질문을 던지면 AI가 자동으로 SQL 쿼리(데이터베이스 질의 명령어)를 작성하고 결과를 돌려줍니다.
더 나아가 AI에게 "이 데이터를 히트맵으로 시각화해줘"라고 요청하면, Leaflet.js(지도 라이브러리)와 OpenStreetMap을 활용해 인터랙티브 히트맵을 자동으로 만들어줍니다:
위 스크린샷에서 볼 수 있듯이, SQL 쿼리 입력란과 히트맵이 한 화면에 나타납니다. 나무 지름(DBH) 데이터를 가중치로 사용해 큰 나무가 있는 지역일수록 더 진하게 표시됩니다. 이 히트맵의 전체 소스 코드도 공개되어 있습니다.
웹사이트의 숨겨진 데이터도 AI가 찾아낸다
워크숍의 웹 스크래핑 섹션에서는 ProPublica(미국 탐사 보도 매체)의 공직자 재산공개 페이지를 예시로 사용합니다. 이 사이트는 SvelteKit(웹 프레임워크)으로 만들어져 있어 데이터가 이해하기 어려운 JSON 형식으로 숨어 있습니다.
AI 에이전트는 rodney라는 브라우저 자동화 도구를 통해 실제 Chrome 브라우저를 제어하며, 페이지를 열고, 버튼을 클릭하고, 데이터를 추출합니다. 핵심은 AI가 "역공학"을 수행한다는 점입니다 — 화면에 보이는 내용과 숨겨진 데이터를 비교해서 어떤 필드가 어떤 의미인지 스스로 알아냅니다.
비용: 참가자 전원 합쳐서 3만 원
이 워크숍에서 가장 놀라운 숫자는 비용입니다. 참가자 전원이 3시간 동안 AI 에이전트를 사용하며 데이터를 분석하고 시각화한 총비용이 약 23달러(약 3만 원)에 불과했습니다. OpenAI Codex의 API 토큰 비용만 집계한 수치로, Claude Code는 구독(Claude Pro/Max)으로 사용했습니다.
이는 데이터 분석을 위해 비싼 BI(비즈니스 인텔리전스) 도구를 구매하거나, 개발자에게 별도로 의뢰할 필요가 점점 줄어들고 있음을 보여줍니다.
직접 따라해보기 — 5분이면 시작할 수 있습니다
가장 쉬운 방법은 GitHub Codespaces를 사용하는 것입니다. 브라우저에서 바로 실행되므로 아무것도 설치할 필요가 없습니다:
1. GitHub 계정으로 로그인
2. Codespace 생성 페이지 접속
3. 'Create codespace' 클릭
4. Claude 또는 Codex에 로그인
5. 데이터 분석 시작!
내 컴퓨터에서 직접 실행하고 싶다면 아래 순서를 따릅니다:
# 1. 패키지 매니저 uv 설치 (파이썬 도구 관리용)
# docs.astral.sh/uv 참조
# 2. Claude Code 설치
npm install -g @anthropic-ai/claude-code
claude
# 3. Datasette 설치 (데이터 탐색 도구)
uv tool install 'datasette>=1.0a25'
# 4. 데이터를 SQLite에 넣고 탐색 시작
uvx datasette trees.db
Claude Pro 또는 Max 구독이 있다면 추가 비용 없이 Claude Code를 사용할 수 있습니다. 전체 워크숍 자료에서 단계별 가이드를 확인할 수 있습니다.
데이터를 다루는 모든 사람을 위한 도구
이 워크숍이 특별한 이유는 대상이 기자라는 점입니다. NICAR(탐사 보도 기자 및 편집자 협회 컨퍼런스)은 매년 수천 명의 기자가 모이는 데이터 저널리즘 행사입니다. 코딩을 전문적으로 하지 않는 기자들이 AI를 활용해 공공 데이터를 분석하고, 시각화하고, 기사에 활용하는 방법을 배운 것입니다.
이 방법은 기자뿐 아니라 마케터(캠페인 성과 데이터 분석), 연구자(실험 데이터 탐색), 사무직(엑셀 파일 수만 줄 분석), 소상공인(매출 데이터 패턴 파악)에게도 그대로 적용됩니다.
사이먼 윌리슨은 지난주 공개한 에이전틱 엔지니어링 5가지 원칙에 이어, 이번에는 실제 현장에서 비개발자들이 AI 도구를 사용하는 구체적인 방법을 보여줬습니다. "AI가 코드를 짜주니까, 이제 중요한 건 어떤 질문을 던질 줄 아느냐"라는 메시지가 이 워크숍의 핵심입니다.
AI와 바이브코딩에 대해 더 알고 싶다면 무료 학습 가이드를 확인해보시기 바랍니다.