Contents

Google은 무료 오픈 웨이트 챗봇 제품군인 Gemma를 통해 '개방형 AI'로 전환합니다.

Contents

/images/google-goes-open-ai-with-gemma-a-free-open-weights-chatbot-family.jpg

확대 Google

수요일에 Google 은 더 강력하지만 폐쇄적인 Gemini 모델과 유사한 기술을 기반으로 하는 무료 개방형 모델인 Gemma 라는 새로운 AI 언어 모델 제품군을 발표했습니다. Gemini와 달리 Gemma 모델은 데스크톱 또는 노트북 컴퓨터에서 로컬로 실행할 수 있습니다. 이는 2022년 OpenAI의 ChatGPT가 AI 챗봇의 열풍을 일으킨 이후 Google이 처음으로 선보이는 중요한 개방형 대규모 언어 모델(LLM)입니다.

Gemma 2B는 20억 개의 파라미터로 구성된 방대한 보완 기능을 자랑하며, 그보다 더 확장된 Gemma 7B는 70억 개의 파라미터로 더욱 넉넉하게 할당되었습니다. 두 옵션 프레젠터 모두 사전 학습 및 미세 조정된 구성의 각기 다른 모습으로 제공됩니다. 인공 신경망의 영역에서 매개변수는 알고리즘 구성의 결정 요인을 나타내며, 가중치는 문서 저장소에 보관된 이러한 매개변수의 선택된 하위 집합을 구성합니다.

구글 딥마인드와 다른 구글 AI 팀에서 개발한 새로운 언어 모델인 Gemma는 Gemini AI 어시스턴트의 기능을 구동하는 데 활용된 것과 같이 구글의 고급 대중용 대규모 언어 모델을 포괄하는 포괄적인 용어인 Gemini를 만드는 데 사용된 기술에서 영감을 얻었습니다. Google에 따르면 이 이름은 귀중하거나 가치 있는 물건을 뜻하는 라틴어 ‘젬마’에서 유래한 것입니다.

Gemma는 ChatGPT 출시 이후 Google의 첫 번째 주요 오픈 LLM이지만(과거에는 FLAN-T5 등 개의 소규모 연구 모델 를 출시한 바 있음), 오픈 AI 연구에 대한 Google의 첫 번째 공헌은 아닙니다. 구글은 트랜스포머 아키텍처 의 개발과 텐서플로, BERT , T5 , JAX 과 같은 릴리스들을 주요 기여로 꼽고 있으며, 이 분야에서 중요한 역할을 했다고 해도 논란의 여지가 없을 것입니다.

/images/gemma_performance.jpg

확대 / Google에서 제공한 Gemma 성능 차트. 구글은 젬마가 여러 벤치마크에서 메타의 라마 2보다 성능이 뛰어나다고 말합니다. Google

더 적은 성능과 높은 컨패세이션율로 인해 더 작은 오픈 웨이트 LLM은 최근까지 기술 데모에 가깝게 사용되어 왔지만, 일부 대형 LLM이 GPT-3.5 성능 수준에 도달하기 시작하면서 최근에는 기술 데모에 가깝게 사용되고 있습니다. 그럼에도 불구하고 전문가들은 소스를 사용할 수 있는 오픈 가중치 AI 모델을 챗봇의 투명성과 개인정보 보호를 보장하는 데 필수적인 단계로 보고 있습니다.그러나 구글 젬마는 일반적으로 특정 유형의 소프트웨어 라이선스 를 의미하며 제한이 거의 없기 때문에 “오픈 소스"는 아닙니다.

실제로 Gemma는 작년 2월부터 오픈 웨이트 모델(예: LLaMA 및 Llama 2)을 출시하여 큰 화제를 모은 Meta에 대항하기 위한 전략으로 보입니다. 이 기술은 ChatGPT 애플리케이션과 클라우드 API를 통해서만 사용할 수 있고 로컬에서 실행할 수 없는 OpenAI의 GPT-4 Turbo와 같은 AI 모델과는 상반되는 기술입니다. Gemma에 대한 로이터 보도는 메타 각도에 초점을 맞추고 Google이 Vertex AI 클라우드 플랫폼에 더 많은 개발자를 유치하기를 희망한다고 추측합니다.

아직 Gemma를 사용해 본 적은 없지만 Google은 7B 모델이 수학, Python 코드 생성, 일반 지식 및 상식적인 추론 작업에 대한 여러 벤치마크에서 Meta의 Llama 2 7B 및 13B 모델보다 성능이 뛰어나다고 주장합니다. 현재 머신 러닝 커뮤니티 플랫폼인 Kaggle Hugging Face 을 통해 사용할 수 있습니다.

다른 소식으로, 구글은 Gemma 릴리스와 함께 " 책임 있는 생성 AI 툴킷 “을 출시했으며, 이 툴킷은 구글이 ‘안전하고 책임 있는’ AI 애플리케이션 개발을 위한 지침과 도구를 제공할 것으로 기대합니다.