깃허브, 4월 24일부터 당신의 코드로 AI를 훈련시킨다

깃허브 코파일럿을 무료, 프로, 또는 프로+ 요금제로 쓰고 있다면, 당신의 코드가 곧 AI 훈련 데이터가 된다. 언젠가 그럴 수도 있다는 얘기가 아니다. 2026년 4월 24일부터 깃허브는 사용자의 코파일럿 상호작용 데이터를 AI 모델 훈련에 활용하기 시작한다. 직접 설정에 들어가서 꺼놓지 않으면 자동으로 적용된다. 이 발표는 3월 25일 개인정보처리방침 업데이트 안에 조용히 묻혀 있었지만, 개발자 커뮤니티의 반응은 결코 조용하지 않았다.
깃허브가 수집하는 데이터의 범위
"상호작용 데이터"가 정확히 뭘 의미하는지 짚고 넘어가야 한다. 깃허브의 표현이 꽤 광범위하기 때문이다. 업데이트된 개인정보처리방침에 따르면, 수집 대상에는 작성한 코드 스니펫, 수락하거나 수정한 코파일럿 출력물, 커서 주변의 코드 컨텍스트, 주석과 문서, 파일 이름과 저장소 구조, 탐색 패턴, 채팅이나 인라인 제안 같은 코파일럿 기능과의 상호작용, 좋아요/싫어요 같은 피드백 신호까지 포함된다.
이건 단순한 "익명 사용 지표" 수준이 아니다. 개발자가 어떻게 코드를 작성하고, 어떤 코드를 쓰고, AI 도움을 받으면서 어떤 식으로 작업하는지에 대한 상세한 지도나 마찬가지다. 그리고 맞다, 비공개 저장소에도 적용된다.
옵트아웃이 문제인 이유
개발자들이 분노하는 핵심 지점은 바로 이것이다. 기본 설정이 "켜짐"이라는 것. 지금부터 4월 24일 사이에 아무것도 안 하면, 깃허브는 자동으로 데이터를 수집하고 모델 훈련에 활용하기 시작한다. 직접 코파일럿 설정에 들어가서 개인정보 항목을 찾아 "AI 모델 훈련에 내 데이터 사용 허용" 옵션을 꺼야 한다.
빅테크 업계에서 표준이 된 전형적인 옵트아웃 전략이다. 기업들은 대다수 사용자가 설정을 건드리지 않는다는 걸 잘 안다. 깃허브에는 1억 명 이상의 등록 개발자가 있고, 2026년 초 기준으로 약 470만 명의 유료 코파일럿 구독자가 있다. 이 중 극소수만이 이 정책 변경을 인지하고, 더 적은 수가 실제로 조치를 취할 것이다.
다행히 이전에 제품 개선 목적의 데이터 수집을 거부해 둔 사용자라면 기존 설정이 유지된다고 깃허브는 밝혔다. 하지만 나머지 모든 사용자에겐 시한이 흐르고 있다.
개발자들의 반발은 거세다
커뮤니티 반응은 압도적으로 부정적이다. 이 변경에 대한 깃허브 커뮤니티 토론 스레드의 반응 비율이 모든 것을 말해준다. 싫어요 59개, 로켓 이모지는 단 3개. 수십 개의 댓글 중 깃허브 개발자 관계 부사장인 마틴 우드워드를 제외하면 이 정책을 지지하는 사람은 거의 없었다.
핵심 반대 논리는 단순하다. 개발자들에게 자기 작업물을 넘겨서 언젠가 자신을 대체하거나 자신의 기술 가치를 떨어뜨릴 수 있는 도구를 훈련시키라고 요구하는 셈이다. 그것도 무상으로, 기본 설정으로, 서비스 약관 업데이트에 끼워 넣은 30일 사전 고지만으로.
더 깊은 신뢰 문제도 있다. 많은 개발자들은 2018년 마이크로소프트가 75억 달러에 인수하면서 개발자 커뮤니티를 존중하겠다고 약속했기 때문에 깃허브를 선택했다. 비공개 저장소 데이터를 상업용 AI 제품 훈련에 사용하는 것은 그 약속에서 크게 벗어나는 행보로 느껴진다.
면제 대상이 시사하는 것
모든 사용자가 동일하게 영향받는 건 아니다. 코파일럿 비즈니스와 엔터프라이즈 요금제 사용자는 훈련 데이터 프로그램에서 완전히 제외된다. 교육용 플랜을 이용하는 학생과 교사도 마찬가지다.
이게 무엇을 의미하는지 잠깐 생각해보자. 깃허브는 사실상 이렇게 말하고 있다. 회사가 엔터프라이즈 요금을 내면 코드가 안전하고, 개인 개발자나 프로 플랜의 소규모 팀이면 코드는 마음대로 쓰겠다는 것이다. 협상력이 가장 약한 사람들이 가장 적은 보호를 받는 구조, AI 데이터 경제에서 반복적으로 나타나는 패턴이다.
더 큰 그림: AI의 끝없는 데이터 갈증
깃허브의 이번 행보는 고립된 사건이 아니다. 사용자 데이터를 생성하는 모든 플랫폼이 그 데이터를 AI 훈련에 투입할 방법을 찾고 있는 업계 전반의 흐름 속에 있다. 메타는 인스타그램과 페이스북 게시물로 이미 하고 있고, 구글은 사실상 모든 것에 하고 있다. 레딧은 데이터를 구글에 6천만 달러에 팔았다.
깃허브 사례가 특히 민감한 이유는 데이터의 성격 때문이다. 코드는 지적 재산이다. 개발자의 전문 기술이 만들어낸 결과물 그 자체다. 비공개 저장소에 있는 코드는 독점적인 비즈니스 로직, 영업 비밀, 또는 최소한 외부에 공유할 의도가 전혀 없었던 경쟁 우위를 담고 있는 경우가 많다.
깃허브의 입장은 데이터를 책임감 있게 사용하며 상호작용 패턴에 대한 훈련이 모두를 위해 코파일럿을 개선한다는 것이다. 사실일 수도 있다. 하지만 "잘 쓰겠습니다"는 "허락을 구하지 않았습니다"에 대한 만족스러운 답변이 된 적이 없다.
거부 방법
4월 24일 전에 거부하고 싶다면 방법은 이렇다.
github.com/settings/copilot/features에 접속한다. Privacy 항목에서 "Allow GitHub to use my data for AI model training" 토글을 찾아 끈다. 끝이다. 깃허브는 이 설정을 끄더라도 코파일럿 기능 이용에는 아무런 영향이 없다고 밝혔다.
조직의 경우는 상황이 다르다. 비즈니스나 엔터프라이즈 플랜이라면 이미 제외되어 있다. 하지만 팀원들이 개인 프로 계정을 쓰고 있다면, 사내 공지를 돌리는 게 좋을 것이다.
한 가지 더 주의할 점은, 거부는 미래 데이터 수집에만 적용된다는 것이다. 4월 24일 이전에 기존 약관 하에서 수집된 데이터가 향후 어떻게 처리되는지에 대해 깃허브는 명확한 입장을 밝히지 않았다.
앞으로 지켜볼 것
진짜 시험대는 4월 24일 이후에 온다. 실제로 얼마나 많은 개발자가 거부할까? 그 수가 적으면 다른 개발 도구 기업들도 깃허브의 전략을 따라할 가능성이 높다. 반대로 깃랩 같은 대안 플랫폼으로의 대규모 이탈이 일어나면, AI 기반 개발 도구 시장의 경쟁 구도 자체가 재편될 수 있다.
법적 차원도 있다. EU의 개인정보보호법은 동의와 데이터 처리에 대한 엄격한 규정이 있으며, AI 훈련에 대한 옵트아웃 기본값은 규제 당국을 만족시키지 못할 수 있다. EU AI법 시행 기관이 이번 달 이미 첫 공식 조사를 시작했고, 개발자 코드와 관련된 대형 사건은 중요한 선례를 만들 수 있다.
지금은 개발자들에게 공이 넘어가 있다. 4월 24일까지 자신의 코드가 깃허브의 다음 AI 모델 훈련에 사용되게 할 것인지, 아니면 비공개로 유지할 것인지 결정해야 한다. 어느 쪽을 선택하든, 이런 선택을 해야 한다는 사실 자체가 AI 산업이 어디로 향하고 있는지를 잘 보여준다.
참고자료
매일 브리핑 받기
AI, 암호화폐, 경제, 정치. 네 가지 이야기. 매일 아침.
스팸 없음. 언제든지 구독 해지 가능.