Contents

픽셀 사이를 읽을 수 있는 AI를 만드는 애플 연구원들

Contents

/images/apple-researchers-make-ai-that-can-read-between-the-pixels.jpg

인공지능의 뛰어난 인지 능력으로 인해 불안감을 유발할 수 있는 것은 사실입니다. 그러나 직관적으로 보이는 요소를 인식하지 못하는 경우가 종종 발생하여 더 정교한 기술의 필요성을 강조합니다. 최근 Apple의 연구원들은 AI의 지속적인 개발과 성능 향상에 있어 또 다른 장애물을 극복할 수 있는 방법을 찾아낸 것으로 보입니다.

몇몇 연구자들은 최근 참조 해상도라고 알려진 시각 정보를 정확하게 이해하는 실질적인 언어 모델의 능력을 조사했습니다. 이 현상은 가상 음성 비서인 Siri의 경쟁력을 유지하고 지속적으로 향상시키려는 Apple의 열망을 강조하는 학술 간행물에서 자세히 설명합니다.

논문 에서는 이 연구를 통해 비서가 더 많은 대화를 할 수 있도록 하는 방법을 강조했습니다. 행간을 읽고 화면의 맥락을 더 잘 이해함으로써 Siri와 같은 어시스턴트는 보다 자연스러운 방식으로 응답할 수 있습니다.

이 분야의 전문가들에 따르면 사용자와 상담원 간의 자연스러운 커뮤니케이션을 촉진하도록 설계된 대화형 AI 시스템에는 ‘그들’, ‘그’와 같은 모호한 용어를 포함한 문맥 이해 능력이 필수적입니다.

앞서 언급한 조사를 통해 경쟁사에 대한 Apple의 조사 수준에 관한 귀중한 인사이트를 얻을 수 있었습니다. 특히 이 조사에는 GPT-3.5와 GPT-4라는 두 가지 주목할 만한 벤치마크에 대해 회사의 언어 모델을 평가하는 작업이 포함되었습니다. 흥미롭게도 가장 기본적인 Apple 모델조차도 GPT-4와 비슷한 성능을 보여주었습니다. 또한, 가장 큰 모델은 Apple이 밝힌 것처럼 GPT-4를 상당한 차이로 능가했습니다.

애플의 최고 경영자 팀 쿡은 2월에 열린 실적 발표에서 인공지능과 관련된 최근 커뮤니케이션에 따라 같은 해 말에 인공지능 기반 기능이 도입될 것이라고 미묘하게 암시했습니다.

앞서 언급한 시점에서 팀 쿡은 공개적으로 논의하기 전에 부지런히 작업을 실행하는 애플의 운영 방식을 설명했습니다. 애플은 섣부른 발표를 자제하는 것에서 알 수 있듯이 이러한 접근 방식을 일관되게 고수하고 있습니다. 하지만 올해 말 공개될 혁신적인 프로젝트가 있어 이해관계자들의 큰 관심을 불러일으키고 있습니다.

실제로 애플은 최근 M3 칩을 탑재한 업데이트된 맥북 에어를 공개하면서 인공지능의 통합을 핵심 기능으로 강조했습니다.

이 특별한 조사는 애플의 인공 지능에 대한 추구의 시작을 의미할 수 있습니다.

이미지 크레딧: 헤더 사진 라이선스 제공 Depositphotos .