Contents

AI가 GitHub 최고 법률 책임자 Shelley McKinley를 바쁘게 만드는 이유

깃허브의 최고 법률 책임자, 셸리 맥킨리 , 이번 주 유럽 의회에서 “세계 최초의 포괄적인 AI 법"으로 의결된 인공지능(AI) 법뿐만 아니라 코파일럿 페어 프로게이머를 둘러싼 법적 다툼으로 인해 많은 일을 처리해야 하는 상황입니다.

유럽연합의 AI 법은 인공지능이 일상생활에 미치는 영향이 커짐에 따라 이에 대응하기 위해 2021년에 처음 제안되어 3년 동안 개발되어 왔습니다. 이 포괄적인 규제 프레임워크는 잠재적 위험에 따라 AI 애플리케이션을 평가하며, 특정 상황과 사용 목적에 따라 다양한 요건과 조항이 적용됩니다.

해당 조항이 오픈소스 소프트웨어 개발자에게 법적 책임을 초래할 수 있는 방식과 관련된 모호한 표현.

2005년 Microsoft에 입사한 맥킨리는 회사 법무 부서에서 Xbox 및 홀로렌즈 하드웨어 사업부와 관련된 업무를 담당하고 뮌헨과 암스테르담에서 법률 고문직을 맡는 등 여러 직책을 맡았습니다. 결국 그는 GitHub의 최고 법률 책임자로 취임하여 지금까지 약 3년 동안 그 직책을 맡고 있습니다.

2021년에 GitHub로 자리를 옮기면서 저는 최고 법률 책임자에 대한 일반적인 기대와는 다른 다방면의 직책을 맡게 되었습니다. 저의 업무 포트폴리오는 상업적 계약, 제품 개발 및 인사 문제와 관련된 일상적인 법률 문제 관리와 같은 다양한 업무를 포괄합니다. 또한, 저는 리더십과 옹호 활동을 통해 개발자 커뮤니티의 포용성을 증진함으로써 접근성을 위한 조직의 노력을 주도하고 있습니다.

맥킨리의 책임 범위는 GitHub에서 엔지니어링 전략을 추진하는 역할 이상으로 넓습니다. 또한 환경 지속 가능성 표준을 준수하고, 이와 관련하여 Microsoft의 광범위한 목표와 원활하게 연계되도록 하는 책임도 맡고 있습니다. 또한 개발자가 환영받고 안전하며 긍정적인 느낌을 받을 수 있는 플랫폼 환경을 유지하기 위한 노력을 주도합니다. 여기에는 이러한 기대에 부응하기 위해 콘텐츠를 면밀히 모니터링하고 조정하는 일이 포함됩니다.

최근 들어 윌리엄 맥킨리의 책임이 인공지능과 밀접하게 연관되어 있다는 것은 부인할 수 없는 사실입니다.

이번 주에 예상되는 EU AI 법안 승인을 앞두고 런던에서 맥킨리를 인터뷰할 기회가 있었습니다.

/images/ai-is-keeping-github-chief-legal-officer-shelley-mckinley-busy.png

이 이미지에서 GitHub의 최고 법률 책임자인 Shelley McKinley를 볼 수 있습니다.

두 세계의 충돌

GitHub는 협업 소프트웨어 개발을 촉진하는 광범위한 플랫폼으로, 사용자가 프로젝트별 데이터가 포함된 리포지토리 콘텐츠를 보관, 규제 및 모든 지역의 개인에게 배포할 수 있도록 지원합니다. 조직은 폐쇄된 환경 내에서 리포지토리의 개인 정보를 보호하기 위해 구독 플랜을 구매할 수 있는 옵션이 있지만, 투명한 커뮤니티 중심 환경에서 끊임없이 협력하는 오픈 소스 소프트웨어 개발자들의 집단적 노력 덕분에 GitHub의 괄목할 만한 성장과 광범위한 도달 범위가 가능했습니다.

2018년 Microsoft에 인수된 이후 기술 부문에서 상당한 발전이 있었습니다. 그 이전에도 인공지능은 이미 인정을 받았지만, 대중 문화에서는 아직 널리 퍼진 개념이 아니었습니다. 하지만 ChatGPT와 DALL-E와 같은 혁신 기술이 등장하면서 인공지능은 많은 사람들의 일상 생활에 필수적인 요소가 되었습니다.

인공 지능 전문가로서 저는 AI가 제 직업 생활의 중요한 부분이 되었다는 사실을 증명할 수 있습니다. 저는 AI 기반 제품 개발 및 출시를 위한 전략 수립, AI 정책에 관한 중요한 대화에 참여, 플랫폼 내 통합 시 영향 평가 등 다양한 측면을 담당하고 있습니다.

인공지능의 발전은 오픈소스 리소스에 크게 의존해 왔으며, 공동의 노력과 정보 공유는 오늘날 존재하는 여러 저명한 인공지능 플랫폼의 탄생에 필수적인 역할을 했습니다. 대표적인 예로 처음에는 오픈소스 기반으로 설립되었지만 이후 보다 배타적인 접근 방식으로 전환하면서 설립자가 조직과 법적 분쟁을 겪은 OpenAI를 들 수 있습니다.

유럽의 임박한 AI 규제 조치의 의도는 칭찬할 만하지만, 반대론자들은 이러한 정책이 오픈소스 커뮤니티에 예상치 못한 상당한 반향을 일으켜 잠재적으로 인공지능의 발전을 저해할 수 있다고 주장합니다. 이러한 관점은 GitHub의 옹호 이니셔티브의 초석이 되어 왔습니다.

맥킨리는 규제 기관, 정책 입안자, 법률 전문가들이 기술 분야에 대한 전문 지식이 부족하다는 사실을 인정합니다. 그는 디지털 자산의 작동에 대한 포괄적인 이해가 있어야 사회가 규제 조치를 시행할 때 정보에 입각한 결정을 내릴 수 있다고 믿기 때문에 디지털 자산의 기능에 대해 개인을 계몽하는 노력의 중요성을 강조합니다.

제안된 규정을 둘러싼 주요 우려는 광범위한 다양한 작업을 처리할 수 있는 ‘오픈 소스 범용 인공 지능’ 시스템에 대한 잠재적 영향과 관련이 있습니다. 이러한 우려는 애플리케이션 영역 내에서 발생할 수 있는 모든 문제에 대해 오픈 소스 AI 시스템 제작자에게 법적 책임을 전가할 수 있는 가능성을 중심으로 제기되었습니다. 이러한 시나리오는 잠재적으로 이러한 기여자들의 참여를 방해하여 독점적인 지적 재산권 시스템을 개발하는 회사들에게 권한과 영향력이 집중되는 결과를 초래할 수 있습니다.

오픈 소스 소프트웨어 개발은 본질적으로 분산되어 있으며, 전 세계 1억 명 이상의 개발자를 보유한 GitHub는 개발자가 많은 사람들이 4차 산업 혁명이라고 선전하는 에 계속 기여하도록 인센티브를 제공해야 합니다 . 이것이 바로 GitHub가 오픈 소스 범용 AI 기술을 개발하는 개발자를 위한 면제를 위해 로비 활동을 펼치며 AI 법에 대해 적극적으로 목소리를 높인 이유입니다.

GitHub는 방대하고 번성하는 오픈 소스 커뮤니티의 수호자로서 책임을 인식하고 있습니다. 우리의 목표는 전 세계 개발자 간의 협업을 촉진하는 포용적인 환경을 제공하여 사회 전반에 도움이 되는 기술 발전을 촉진하는 것입니다. 혁신을 촉진하기 위한 이러한 노력은 단순히 서비스에 추가되는 바람직한 기능이 아니라 기업과 플랫폼으로서의 사명의 핵심에 자리 잡고 있습니다.

개정된 인공지능법에는 오픈소스 라이선스 계약에 따라 배포되는 인공지능 모델 및 시스템과 관련한 특정 예외 조항이 포함되어 있습니다. 그러나 이는 AI 기술과 관련된 “허용할 수 없는” 위험이 존재하는 상황에는 적용되지 않습니다. 따라서 오픈소스 범용 AI 모델을 만드는 개발자는 유럽연합 규제 당국에 동등한 수준의 문서나 보증을 제공할 필요가 없습니다. 그럼에도 불구하고 어떤 독점 모델과 오픈 소스 모델이 ‘고위험’을 초래하는 것으로 분류될지는 여전히 불확실합니다.

복잡한 문제에도 불구하고 맥킨리의 집중적인 옹호 활동은 대체로 효과가 있는 것으로 보입니다. 규제 당국은 일반적으로 오픈소스 개발자가 만든 시스템의 개별 구성 요소를 의미하는 ‘구성 요소’에서 벗어나 컴파일된 애플리케이션 내에서 발생하는 상위 수준의 프로세스에 초점을 맞추고 있는 것으로 보입니다.

맥킨리는 이러한 긍정적인 결과가 정책 입안자들에게 해당 주제에 대해 알리기 위한 자신의 팀의 노력에 직접적으로 기인한다고 인정했습니다.그는 고려해야 할 핵심 측면 중 하나는 자유롭게 사용할 수 있고 투명한 오픈 소스 구성 요소와 오픈 소스 인공지능(AI) 모델로 구성된 구성 요소라고 강조했습니다. 그러나 그는 특히 다운스트림 상용 제품을 고려할 때 여러 당사자 간에 책임을 공정하게 배분할 수 있는 방법을 결정하는 데 어려움이 있다고 지적했습니다. 전반적으로 이번 개발은 혁신과 오픈소스 개발자 모두에게 중요한 승리라고 할 수 있습니다.

Copilot 입력

GitHub의 AI 기반 페어 프로그래밍 도구인 Copilot 도입은 소프트웨어 엔지니어링을 비롯한 수많은 분야에 큰 영향을 미칠 수 있는 인공지능의 혁신적 물결을 일으켰습니다. Gmail의 스마트 작성 기능이 추가 콘텐츠를 제안하여 이메일 작성 과정을 간소화하는 것과 유사하게, Copilot은 개발자가 입력할 때 코드 조각과 함수 구성 요소에 관한 제안을 제공합니다.

그럼에도 불구하고 올해 초 Copilot의 상용 출시에 따라 모든 오픈 소스 소프트웨어 개발자에게 GitHub를 포기할 것을 촉구한 비영리 단체인 Software Freedom Conservancy의 회원들을 포함하여 개발 커뮤니티 내에서 상당한 우려를 불러일으켰습니다. 이러한 분위기는 Copilot이 적절한 보상이나 인정 없이 오픈 소스 커뮤니티의 공동 노력에 의존하는 독점적인 유료 서비스라는 사실에서 비롯된 것입니다. 또한, Copilot은 공개적으로 사용 가능한 방대한 양의 소스 코드와 고급 자연어 처리 기술을 사용하여 광범위하게 학습된 OpenAI 코덱스를 적극 활용하여 ChatGPT가 등장하기 전에 OpenAI와 함께 공동 개발되었다는 점도 주목할 필요가 있습니다.

/images/ai-is-keeping-github-chief-legal-officer-shelley-mckinley-busy.gif

GitHub 코파일럿 이미지 크레딧: GitHub

코파일럿은 궁극적으로 소프트웨어의 작성자가 누구인지에 대한 중요한 질문을 제기합니다. 다른 개발자가 작성한 코드를 재탕한 것에 불과하다면 해당 개발자가 그 공로를 인정받아야 하지 않을까요? Software Freedom Conservancy의 브래들리 쿤 는 이 문제에 대해 정확하게 설명하는 글을 썼습니다: " 소프트웨어가 내 부조종사라면 누가 내 소프트웨어를 프로그래밍했나? "

“오픈 소스” 소프트웨어는 제약 없이 작동한다는 믿음이 널리 퍼져 있기 때문에 일부 개인은 그러한 라이선스 계약에 따라 공개된 코드를 자신이 적합하다고 생각하는 방식으로 자유롭게 활용할 수 있다고 생각할 수 있습니다. 그러나 이러한 허용 라이선스에는 다양한 차이가 있지만, 일반적으로 다른 사람이 만든 코드를 적절하게 사용하는 사람은 적절한 인증을 제공해야 한다는 중요한 단서 조항이 포함되어 있습니다.코파일럿이 제공하는 코드의 저작자를 밝히려고 할 때, 특히 그 정체성이 불확실하기 때문에 문제가 발생합니다.

Copilot 사태는 또한 제너레이티브 AI가 무엇인지 단순히 이해하는 데 있어 몇 가지 어려움을 강조합니다. 인간 소프트웨어 개발자가 이전 코드를 살펴봄으로써 어떤 작업을 학습하는 것처럼, ChatGPT나 Copilot과 같은 도구에 사용되는 대규모 언어 모델은 방대한 데이터에 대해 학습을 진행하며, Copilot은 항상 다른 곳에서 생성된 것과 유사하거나 심지어 동일한 결과물을 생성할 가능성이 높습니다. 다시 말해, 공개 코드와 일치할 때마다 “자주” 일치하는 리포지토리는 “수백 개는 아니더라도 수십 개에 달하는” 개의 리포지토리에 적용됩니다.

맥킨리는 생성 인공 지능과 그에 대응하는 인공 지능의 차이점을 반복해서 설명하면서 기존 소스 코드를 복제하는 도구로서 Copilot의 한계에 대해 설명했습니다. 기존 프로그래밍 관행으로 인해 유사성이 발생할 수 있지만, 이러한 시도는 산발적이고 드물게 발생합니다. 그럼에도 불구하고 당사는 지적 재산의 오용 또는 의도치 않은 복제에 대한 일부 개인의 우려를 인지하고 있습니다. 따라서 개발자의 열정과 소중한 의견을 균형 있게 반영하는 신중하고 사려 깊은 전략을 채택하기 위해 노력하고 있습니다.

2022년 말, 여러 미국 소프트웨어 개발자가 “전례 없는 오픈 소스 소프트웨어 불법 복제"라며 Copilot의 저작권법 위반을 주장하며 회사를 고소했습니다. 그 사이 몇 달 동안 Microsoft, GitHub, OpenAI는 소송의 다양한 측면을 기각하는 데 성공했지만 소송은 , 원고들은 최근 GitHub의 개발자와의 계약 위반 혐의에 대해 수정된 불만을 제기한 상태입니다.

법적 분쟁에 대한 예상은 전혀 예상치 못한 일이 아니었다고 McKinley는 말합니다. “실제로 우리 커뮤니티가 이 문제에 대해 우려를 표명한 것은 분명합니다.“라고 McKinley는 주장했습니다.

이를 염두에 두고 GitHub는 다른 개발자가 생성한 코드를 Copilot이 ‘차용’할 수 있는 방식에 대한 우려를 완화하기 위해 몇 가지 노력을 기울였습니다. 예를 들어 " 중복 감지 " 기능을 도입했습니다. 이 기능은 기본적으로 꺼져 있지만 활성화하면 Copilot에서 공개적으로 사용 가능한 코드와 일치하는 150자 이상의 코드 완성 제안을 차단합니다.그리고 지난 8월, GitHub는 개발자가 코드 참조 기능(아직 베타 버전)을 새롭게 선보였는데, 이 기능을 통해 개발자는 이동 경로를 따라가며 제안된 코드 스니펫의 출처를 확인할 수 있으며, 이 정보를 바탕으로 라이선스 요건 및 저작자 표시와 관련된 법률을 준수하고 코드 스니펫이 사용된 전체 라이브러리까지 사용할 수 있게 됩니다.

/images/ai-is-keeping-github-chief-legal-officer-shelley-mckinley-busy-1.gif

코파일럿 코드 매치 이미지 크레딧: 깃허브

깃허브에서 개발자들이 우려를 제기한 문제의 정도를 측정하는 것은 플랫폼에서 중복 감지 기능이 “1% 미만"의 시간에만 활성화된다고 밝혔기 때문에 어려울 수 있습니다. 게다가 일반적으로 파일에 최소한의 로컬 컨텍스트가 포함되어 있어 제안된 변경 사항이 다른 곳에서 발견된 코드와 일치하는 경향이 있을 때 발생합니다.

1억 명 이상의 개발자를 지원하는 저희 플랫폼에서는 Copilot과 같은 AI 기술에 대한 개발자의 우려에 대해 다양한 관점이 존재합니다. 이러한 다양한 의견에 대응하기 위해 저희는 개발자 커뮤니티의 피드백에 적극적으로 대응하여 코파일럿의 품질과 개발자를 위한 사용자 편의성을 향상시키기 위한 선제적인 조치를 취하고자 합니다.

다음 단계는?

EU 인공지능법의 발전은 인공지능의 존재와 윤곽이 명확하게 정립되는 새로운 시대가 시작되었음을 의미합니다. 그러나 기업들은 여전히 약 2년이라는 장기간의 준비 기간을 거쳐야만 해당 조항을 준수할 의무를 지게 되는데, 이는 데이터 보호 영역에서 GDPR의 시행으로 인해 필요한 준비 기간이 길어진 것을 연상시킵니다.

맥킨리는 기술 표준이 AI 법의 개발과 시행에 상당한 영향을 미칠 것으로 보고 있습니다. 기업 간 일관된 규정 준수를 보장하기 위해서는 준수할 수 있는 조화로운 표준을 수립하는 것이 중요합니다. 일반 개인정보 보호 규정(GDPR)은 이러한 조화를 이루기 위해 개발된 다양한 개인정보 보호 표준의 예시입니다. AI 법이 시행 단계로 접어들면서 여러 이해관계자가 법 시행에 영향을 미치려고 할 것입니다. 따라서 이러한 논의에 개발자와 오픈소스 지지자들을 참여시켜 그들의 관점이 반영될 수 있도록 하는 것이 중요합니다.

또한 가까운 시일 내에 추가적인 규제 조치가 있을 것으로 예상됩니다. 최근 바이든 대통령은 인공지능 시스템의 안전과 보안을 보장하기 위한 가이드라인을 마련하기 위한 행정명령에 서명하여 유럽과 미국이 모두 ‘위험 기반’ 전략을 채택하고 있음에도 불구하고 규제에 대한 접근 방식에 잠재적인 불일치가 있을 수 있음을 시사했습니다.

맥킨리에 따르면 유럽연합의 인공지능법은 유럽 대륙이 지지하는 가치를 반영하여 역내 기본권 보호의 토대가 되고 있습니다. 반면 미국은 사이버 보안과 딥페이크 문제를 해결하는 데 우선순위를 두고 있습니다. 그러나 두 접근 방식 모두 잠재적으로 위험한 상황을 파악하는 것으로 수렴되며, 발표자는 위험 중심 전략을 채택하는 것이 자국의 입장과 일치하기 때문에 적절하다고 판단했습니다.