내가 짠 코드가 AI 학습 데이터가 됩니다 — GitHub Copilot, 기업만 제외하고 개인은 자동 동의
4월 24일부터 GitHub Copilot이 무료·Pro·Pro+ 사용자의 코드를 AI 학습에 사용합니다. 기업용은 제외. 끄지 않으면 자동 동의되며, 커뮤니티에서는 85 대 4로 반대가 압도적입니다.
GitHub Copilot을 쓰고 있다면 지금 당장 설정을 확인해야 합니다. 4월 24일부터 GitHub이 무료·Pro·Pro+ 사용자의 코드 입력, AI 추천 결과, 파일 구조 등을 AI 모델 학습 데이터로 사용합니다. 기본 설정이 '동의'로 바뀌어 있어서, 끄지 않으면 자동으로 참여하게 됩니다.
기업용 요금제(Business, Enterprise)는 이 정책에서 완전히 제외됩니다. 회사 돈으로 Copilot을 쓰는 개발자는 보호받고, 개인 돈으로 구독하는 개발자의 코드만 학습에 쓰인다는 뜻입니다. 학생·교사 플랜도 제외 대상입니다.
수집 범위 — 코드만이 아니라 작업 패턴까지
GitHub이 학습에 사용하겠다고 밝힌 데이터는 생각보다 넓습니다:
• 내가 수정하거나 수락한 AI 추천 코드
• Copilot에 보내진 코드 조각 — 커서 주변의 코드 맥락 포함
• 파일 이름과 저장소(프로젝트 폴더) 구조
• 댓글, 문서, 주석
• 좋아요/싫어요 피드백, Copilot 채팅 대화 내용
• 코드 탐색 패턴 — 어떤 파일을 어떤 순서로 열어보는지까지
Windows Forum의 분석에 따르면, 이는 "단순한 사용량 지표가 아니라 개발자가 어떻게 생각하고, 탐색하고, 편집하는지에 대한 촘촘한 행동 기록"입니다.
특히 주목할 점은, 비공개(private) 저장소에서 작업할 때도 Copilot 사용 중에 생성된 코드 조각이 수집될 수 있다는 것입니다. GitHub은 "비공개 저장소에 저장된 코드 자체는 학습에 쓰지 않는다"고 밝혔지만, Copilot 사용 과정에서 발생하는 상호작용 데이터는 별개라고 구분합니다. 즉, 비공개 프로젝트에서 코딩하면서 Copilot이 보여준 추천을 수락했다면, 그 코드 조각은 수집 대상입니다.
4월 24일 전에 끄는 법 — 3단계
1 github.com/settings/copilot/features 접속
2 Privacy 섹션에서 "Allow GitHub to use my data for AI model training" 항목 찾기
3 Enabled → Disabled로 변경
※ 이전에 "제품 개선용 데이터 수집"을 꺼둔 적 있다면 설정이 유지돼 있을 수 있습니다. 하지만 반드시 직접 확인하시기 바랍니다 — 일부 사용자는 설정이 초기화됐다고 보고했습니다.
커뮤니티 반응 — 85 반대 vs 4 찬성
GitHub의 공식 커뮤니티 토론에서 이 정책 변경은 85개 반대표 대 4개 찬성표를 받았습니다. 39개 댓글 중 정책을 지지한 GitHub 직원은 단 1명이었습니다. 해커뉴스에서도 228표를 받으며 110개의 댓글이 달릴 정도로 뜨거운 논쟁이 벌어졌습니다.
개발자들이 특히 문제 삼는 점들:
📌 "끄면 기능도 줄어든다" — 데이터 수집을 거부하면 일부 Copilot 기능 접근이 제한되는 구조입니다. GitHub은 이를 '혜택'이라고 표현하지만, 개발자들은 "기부가 아니라 강제"라고 비판합니다.
📌 "민감한 정보가 새어나갈 수 있다" — Copilot은 API 키, 데이터베이스 비밀번호 등 민감한 파일을 자동으로 걸러내는 기능이 없습니다. 코딩 중 실수로 노출될 수 있습니다.
📌 "설정이 초기화된다" — 일부 사용자가 끈 뒤 페이지를 새로고침하니 설정이 다시 켜져 있었다고 보고했습니다.
📌 "이중 잣대" — 법적 자원이 있는 기업 고객은 보호하면서, 개인 개발자만 학습 대상으로 삼고 있습니다.
수집된 데이터는 Microsoft에도 공유된다
GitHub은 수집된 데이터가 "GitHub 계열사, 즉 Microsoft를 포함한 기업 그룹"과 공유될 수 있다고 명시했습니다. 다만, 제3자 AI 제공업체나 독립 서비스 제공자에게는 공유하지 않는다고 밝혔습니다. GitHub의 최고제품책임자 Mario Rodriguez는 공식 블로그에서 "참여하면 우리 모델이 개발 워크플로를 더 잘 이해하고, 더 정확하고 안전한 코드를 추천할 수 있게 된다"고 설명했습니다.
하지만 The Register는 "Microsoft가 자사 AI 모델 훈련에 이 데이터를 활용할 수 있는 문이 열린 것"이라고 분석했습니다.
GitHub을 떠나려는 개발자들
이번 정책에 반발해 GitHub을 떠나겠다는 개발자들이 나오고 있습니다. 대안으로 거론되는 플랫폼들:
• Codeberg — 독일 비영리 재단이 운영하는 코드 호스팅. 광고·데이터 수집 없음
• Forgejo — 내 서버에 직접 설치하는 코드 호스팅 (무료 오픈소스)
• 코드에 저작권 표시 추가 — 소스 파일 상단에 라이선스 고지를 넣어 방어적 조치를 취하는 방법
체크리스트: 지금 확인할 것
✅ github.com/settings/copilot/features 방문
✅ "Allow GitHub to use my data for AI model training" → Disabled
✅ 저장 후 새로고침해서 설정이 유지되는지 재확인
✅ GitHub 계정이 여러 개라면 각각 확인
✅ 마감: 2026년 4월 24일
관련 콘텐츠 — Easy클코로 AI 시작하기 | 무료 학습 가이드 | AI 뉴스 더보기
출처