구글, '제미니' AI가 GPT-4를 능가한다며 뽐내다
구글은 최근 많은 사람들이 기다려온 AI 혁신 기술인 제미니를 공개했는데, 이 기술 대기업은 제미니가 OpenAI의 고급 GPT-4 대규모 언어 모델(LLM)을 능가한다고 주장하고 있습니다. 실제로 구글에 따르면 이 새로운 AI 시스템은 지능 테스트에서 고도의 전문성을 갖춘 개인이 발휘하는 능력과 동등한 수준의 능력을 갖추고 있다고 합니다.
지난 5월 구글의 I/O 컨퍼런스에서 순다르 피차이 CEO는 나노, 프로, 울트라의 세 가지 버전으로 제공되는 새로운 모델을 발표했습니다. 이 중 울트라 버전이 가장 진보된 것으로 알려졌으며, 기능 면에서 GPT-4를 능가할 가능성이 있는 것으로 선전되고 있습니다.
최근 공식 발표에 따르면 제미니 프로의 고급 버전이 구글의 바드 대화형 에이전트에 원활하게 통합되었습니다. 울타는 보안 및 개선에 대한 엄격한 심사를 계속 진행하고 있지만, 내년 초에는 바드에 완전히 동화될 것으로 예상됩니다.
구글은 이번 프레젠테이션에서 초보적인 수준의 시각적 전시를 제공했지만, 최신 인공지능에 대한 구체적인 내용은 여전히 알기 어렵습니다. 따라서 매개변수의 수나 학습 데이터 세트와 같은 필수적인 정보가 공개되지 않아 다른 최신 인공지능 시스템과 공정하게 비교하는 데 어려움이 있습니다.
업계 전반에서 인공지능 시스템의 인지 능력을 평가할 수 있는 보편적으로 인정되고 표준화된 지표가 없다는 것은 심각한 결함입니다.
본질적으로 우리는 회사의 전망에 대한 낙관론을 전달하는 특정 마케팅 주장에 노출되어 왔지만, 이러한 주장이 가시적인 결과로 이어질지는 아직 미지수입니다. 따라서 입증 가능한 성과를 통해 약속을 입증해야 할 책임은 조직에 있습니다.
Gemini는 블로그 게시물의 설명에서 알 수 있듯이 텍스트, 코드, 오디오, 이미지 및 비디오와 같은 다양한 형태의 데이터를 원활하게 통합할 수 있는 독보적인 기능을 갖추고 있습니다.
구글은 최근 제미니의 놀라운 능력을 보여주는 매력적인 동영상 시리즈를 통해 최신 AI 기술인 ‘제미니’를 공개했습니다. 예를 들어, 한 동영상에서는 제미니가 파란 오리의 이미지를 얼마나 정확하게 식별할 수 있는지 보여줍니다. 또 다른 동영상에서는 수학 문제에서 학생의 답 뒤에 숨은 이유를 분석하고 설명하여 정답과 오답을 정확하게 판단하는 AI의 능력을 보여줍니다.
GPT-3와 라이벌인 OpenAI의 GPT-4를 실제 기능과 성능 측면에서 비교할 때 흥미로운 질문이 생깁니다.
수학, 물리학, 역사, 법학, 의학, 윤리학 등 57개 과목에 걸쳐 일반 지식뿐만 아니라 문제 해결 능력까지 평가하는 MMLU(대규모 다중 언어 이해력) 시험에서 제미니 울트라 버전이 90%의 점수를 획득했다고 밝혔다.
앞서 언급한 성과는 일반적으로 평균 89.8%의 정답률을 보이는 전문가들의 실력도 뛰어넘었다는 것을 의미합니다.
테스트에서 86.4%의 점수를 획득했음에도 불구하고, Google이 보고한 바에 따르면 GPT-4의 성능은 Google이 개발한 Bard 챗봇에 통합된 중간 단계의 Gemini Pro 모델보다 뛰어났습니다. 업계에서 GPT-3.5의 존재감과 상대적인 성공에도 불구하고 이 놀라운 성과는 이루어졌습니다.
본질적으로 오늘 구글이 공개한 정보에서 알 수 있듯이, 이 경쟁은 여전히 치열한 경쟁을 벌이고 있으며 치열한 접전을 벌이고 있습니다.
구글 딥마인드의 제품 담당 부사장인 엘리 콜린스는 최근 언론 브리핑에서 구글의 최신 언어 모델인 제미니가 기존의 최첨단 대규모 언어 모델(LLM)을 뛰어넘는 차별화된 기능을 갖고 있는지에 대한 질문에 다소 모호한 답변을 내놓았습니다. 그는 “그런 것 같습니다"라고 간단히 대답했습니다.
콜린스는 제미니가 콜린스와 그의 팀이 AI 모델에 대해 수행한 가장 광범위한 안전성 평가를 거쳤으며, 이 때문에 구글의 출시가 지연되었을 가능성이 있다고 언급했습니다.
구글은 모델에 사용된 구체적인 매개변수 수를 공개하지 않았는데, 이는 다른 유사한 시스템과 비교하는 과정을 복잡하게 만들 수 있는 결정입니다.
구글은 검색 엔진 결과의 기능을 강화하기 위해 지난 몇 달 동안 ‘실험적인’ 검색 생성 경험을 추가로 선보였습니다. 그러나 지금까지 관찰한 바에 따르면 이 도구는 기대에 미치지 못하는 것으로 보입니다.
본질적으로 Gemini가 시장에서 경쟁사와 어떻게 비교되는지에 대해서는 상당한 수준의 불확실성이 남아 있습니다.
텍스트 기반 프롬프트에 국한된 현재 Bard의 기능은 당분간 지속될 것으로 보입니다. 최근 회사 대변인의 발표에 따르면, 조만간 시각적 및 청각적 상호작용을 모두 통합할 계획이 발표되었지만, 이러한 개선 사항은 아직 제공되지 않습니다.
구글은 제미니 울트라의 성능이 GPT-4를 능가한다고 주장하지만, 아직 완전히 개발되지 않았고 널리 사용하기에 적합하지 않으므로 현재로서는 어떤 단정적인 판단도 내릴 수 없습니다.
전 구글 CEO 에릭 슈미트는 최근 인터뷰에서 향후 5년 내에 인공지능(AI)이 초래할 잠재적 위험에 대해 우려를 표명했습니다. 그는 의료, 교육 등 다양한 분야에서 인공지능이 가져올 엄청난 혜택을 인정하면서도, 인공지능의 급속한 발전이 제대로 관리되지 않을 경우 예기치 못한 결과를 초래할 수 있다고 경고했습니다. 그는 AI 시스템이 인간의 가치와 이익에 부합하도록 책임감 있는 개발과 규제의 필요성을 강조했습니다.
이 기사 공유하기