이번 주 AI: '오픈 소스'가 개방적이지 않을 때
빠르게 진화하는 인공 지능 분야에 보조를 맞추는 것은 중요한 도전 과제입니다. 따라서 이 작업을 수행할 수 있는 인공지능의 개발을 기다리는 동안, 이전에 다루지 않았던 주목할 만한 연구와 실험을 포함하여 기계 학습 영역의 최근 발전과 발견에 대한 포괄적인 개요를 정리해 보았습니다.
메타는 최근 라마 시리즈 생성 AI 모델에 새롭게 추가된 두 가지 모델, 즉 라마 3 8B와 라마 3 70B를 출시했습니다. Meta에 따르면 이 모델들은 텍스트를 분석하고 생성하는 기능을 갖추고 있으며 오픈 소스 도구로 제공되고 있습니다. 이 모델은 특정 목표에 따라 맞춤형 시스템을 개발하고자 하는 개발자를 위한 기본 구성 요소로 활용될 예정입니다.
“우리는 이것이 동급 최고의 오픈 소스 모델이라고 믿습니다.“라고 Meta는 블로그 게시물 에 썼습니다. “우리는 일찍 그리고 자주 릴리스하는 오픈 소스 정신을 수용하고 있습니다.”
한 가지 문제가 있습니다. 라마 3 모델은 적어도 가장 엄격한 정의인 에서는 실제로 ‘오픈 소스’가 아닙니다.
오픈 소스 AI 모델을 제한 없이 활용할 수 있는 자유는 이러한 명칭에 내포되어 있지만, 최신 버전인 라마 3을 포함한 라마 모델에 이러한 자유가 항상 보장되는 것은 아닙니다. 기대와 달리 Meta는 이러한 모델을 다른 모델의 학습 과정에 사용하는 것을 금지하는 등 모델 사용에 특정한 제약을 가하고 있습니다. 또한 7억 명 이상의 광범위한 사용자 기반을 보유한 앱 개발사도 애플리케이션에 라마 모델을 사용하기 전에 메타의 고유 허가를 받아야 합니다.
인공지능 영역에서 기업이 ‘오픈 소스’라는 문구를 사용하면서 그 해석에 관한 오랜 논쟁이 다시 불붙고 있습니다.
지난 8월 카네기 멜론, AI Now 연구소, Signal 재단의 연구원들이 공동 저술한 연구 에서는 라마뿐만 아니라 ‘오픈 소스’로 브랜드화되는 많은 AI 모델이 큰 어획량을 기록한다는 사실을 발견했습니다. 모델을 학습시키는 데 필요한 데이터는 비밀로 유지됩니다. 이러한 모델을 실행하는 데 필요한 컴퓨팅 성능은 많은 개발자가 감당할 수 없는 수준입니다. 그리고 이를 미세 조정하는 데 드는 인건비도 엄청나게 비쌉니다.
AI 기반 모델을 ‘오픈 소스’로 분류하는 데 어려움이 없는 것은 아닙니다. 인공지능의 맥락에서 무엇이 진정한 개방성을 구성하는지에 대한 미묘한 이해와 정확한 정의가 필요합니다.
오픈 소스 라이선스의 기반이 되는 기본 IP 메커니즘인 저작권이 AI 프로젝트의 다양한 구성 요소와 조각, 특히 모델의 내부 스캐폴딩에 적용될 수 있는지 여부는 아직 해결되지 않은 질문 중 하나입니다(예: embedding .&text=기술적으로%2C%20embeddings%20는%vectors%20created,meaningful%data%20about%각%의개체에%대한%개체.). ). 오픈소스에 대한 인식과 AI가 실제로 작동하는 방식 사이의 불일치를 극복하기 위해 오픈소스는 개발자가 제한 없이 코드를 연구하고 수정할 수 있도록 하기 위해 고안된 것입니다. 하지만 AI를 사용하면 어떤 요소를 연구하고 수정해야 하는지는 해석에 따라 달라질 수 있습니다.
이 문제를 둘러싼 모호함이 많지만, 카네기 멜론의 연구는 Meta와 같은 기술 기업이 ‘오픈 소스’라는 용어를 사용하는 것과 관련된 해로운 결과를 분명하게 강조합니다.
라마와 같은 ‘오픈 소스’ 인공 지능 이니셔티브의 등장은 종종 언론의 관심을 불러일으키며 프로젝트 개발자에게 비용 효율적인 홍보의 한 형태로 작용합니다. 반대로 오픈 소스 커뮤니티는 이러한 프로젝트의 유지 관리자가 불균형적으로 얻는 기술 발전이나 전략적 이득 측면에서 동일한 이점을 얻지 못하는 경향이 있습니다.
이 연구의 저자에 따르면 ‘오픈 소스’ 인공지능 이니셔티브, 특히 대기업에서 시작된 이니셔티브는 민주적 접근성을 촉진하기보다는 집중된 권한을 강화하고 증폭시키는 것으로 관찰되었습니다. 이러한 관점은 향후 주목할 만한 오픈 소스 인공지능 모델의 출시를 예상할 때 고려할 가치가 있습니다.
최근 인공지능과 관련된 주목할 만한 사건들이 다수 발생했습니다:
Meta는 Facebook, Messenger, Instagram, WhatsApp에서 다음과 같은 업데이트를 통해 Meta AI로 알려진 AI 챗봇을 강화했습니다.* 성능 향상을 위한 라마 3 기반 백엔드 도입* 빠른 이미지 생성 및 웹 검색 결과에 대한 액세스 등 새로운 기능 출시 Meta의 준독립 정책 위원회인 감독위원회는 현재 회사의 소셜 플랫폼이 노골적인 AI 생성 이미지를 어떻게 처리하고 있는지에 초점을 맞추고 있습니다.소셜 미디어 서비스인 Snap은 자사 플랫폼에서 AI가 생성한 이미지에 워터마크를 추가할 계획을 발표했습니다. 여기에는 반짝임 이모티콘이 있는 반투명 버전의 Snap 로고가 포함될 예정이며, 모든 AI-
머신 러닝
이미지 크레딧이 추가될 예정입니다: DrAfter123 / 게티 이미지
챗봇이 당신의 마음을 바꿀 수 있을까요?스위스 연구진은 인공지능이 사용자에 대한 개인 정보로 미리 무장하면 실제로 같은 정보를 가진 사람보다 토론에서 더 설득력이 있을 수 있다는 사실을 발견했습니다.
GPT-4와 같은 인공지능 기반 언어 모델의 사용은 특히 여론에 영향을 미치고 선거 결과를 좌우할 수 있는 능력과 관련하여 정치 담론에 미칠 잠재적 영향에 대한 우려를 불러일으켰습니다. 2016년 미국 대선 캠페인 기간 동안 표적 광고를 통해 유권자 행동을 조작한 혐의로 논란을 일으킨 데이터 마이닝 회사 케임브리지 애널리티카를 언급하며 EPFL의 프로젝트 책임자 로버트 웨스트는 “이것은 스테로이드를 장착한 캠브리지 애널리티카"라고 말했습니다. 웨스트에 따르면, AI 모델은 방대한 정보 데이터베이스를 바탕으로 보다 설득력 있는 주장이나 입장을 만들어 여론을 조작하는 데 사용될 수 있습니다. 그러나 그는 이러한 기술의 힘을 과소평가하지 말라고 경고하며
어쨌든 이 모델들은 왜 그렇게 언어에 능할까요? 이는 엘리자로 거슬러 올라가면 오랜 연구 역사가 있는 분야 중 하나입니다. 이 분야에서 많은 연구를 수행한 사람 중 한 명에 대해 궁금하다면 스탠퍼드의 크리스토퍼 매닝 의 프로필을 확인해 보세요. 그는 방금 존 폰 노이만 메달을 수상했습니다; 축하드립니다!
도발적인 제목의 인터뷰에서 (이 사이트에도 소개된 적이 있는) 또 다른 장기 AI 연구자인 스튜어트 러셀과 포스트닥 마이클 코헨이 “AI가 우리 모두를 죽이지 못하게 하는 방법"에 대해 추측합니다. 아마도 조만간 알아내면 좋을 것 같습니다! 피상적인 논의가 아니라, AI 모델의 동기를 실제로 이해할 수 있는 방법(올바른 단어라면)과 이를 중심으로 규제를 어떻게 만들어야 하는지에 대해 이야기하는 똑똑한 사람들입니다.
이 인터뷰는 사실 이달 초 사이언스 에 게재된 논문에 관한 것으로, 이들은 ‘장기 계획 에이전트’라고 부르는 목표를 달성하기 위해 전략적으로 행동할 수 있는 고급 AI는 테스트가 불가능할 수 있다고 제안합니다. 기본적으로 모델이 성공하기 위해 통과해야 하는 테스트를 ‘이해’하는 방법을 학습하면 해당 테스트를 창의적으로 무효화하거나 우회하는 방법을 배울 수 있습니다. 작은 규모에서 이러한 현상을 보았는데, 대규모에서는 어떨까요?
러셀은 그러한 에이전트를 만드는 데 필요한 하드웨어를 제한할 것을 제안하지만, 물론 로스 알라모스와 샌디아 국립 연구소는 방금 납품받았습니다. LANL은 방금 2,560개의 그레이스 호퍼 엔비디아 칩으로 구성된 새로운 AI 연구용 슈퍼컴퓨터인 Venado 의 리본 커팅식을 가졌습니다.
연구원들이 새로운 뉴로모픽 컴퓨터를 살펴보고 있습니다.
샌디아 국립연구소는 최근 인텔이 개발한 11억 5천만 개의 합성 신경 단위로 구성된 뛰어난 인지 컴퓨팅 플랫폼인 “할라 포인트"를 수여받았습니다. 이 획기적인 기술은 전 세계에서 가장 광범위한 것으로 간주되며, 주로 통계적 방법론에 의존하는 기존의 컴퓨팅 패러다임에서 크게 벗어난 것입니다. 오히려 뉴로모픽 컴퓨팅은 혁신적인 접근 방식이라는 이름처럼 인간 두뇌의 복잡한 작용에서 영감을 얻어 정보를 처리하는 새로운 방법을 모색하기 위해 노력합니다.
최근 컨퍼런스에서 Sandia의 연구원 브래드 아이몬은 새로 개발된 10억 개의 뉴런 시스템의 잠재력에 대해 흥분을 감추지 못했습니다. 이 첨단 기술은 인공지능 알고리즘의 획기적인 혁신을 위한 전례 없는 기회를 제공하며, 현재의 방법을 뛰어넘어 더 효율적이고 지능적인 솔루션을 만들 수 있는 가능성을 제시합니다. 또한 최적화 및 모델링 프로세스를 포함하여 뇌에서 영감을 얻은 기술을 통합하여 기존 컴퓨팅 알고리즘을 혁신할 수 있는 가능성을 제공합니다.