Contents

OpenAI, 비전 API가 포함된 GPT-4 Turbo 일반 사용 가능

Contents

/images/openai-makes-gpt-4-turbo-with-vision-api-generally-available.jpg

OpenAI는 자사의 강력한 GPT-4 Turbo with Vision 모델이 이제 자사 API를 통해 일반에 제공되어 기업과 개발자가 고급 언어 및 비전 기능을 애플리케이션에 통합할 수 있는 새로운 기회를 열었다고 발표했습니다.

2021년 9월에 GPT-4의 비전 및 오디오 업로드 기능이 도입되고 2021년 11월에 열린 OpenAI의 개발자 컨퍼런스에서 향상된 GPT-4 터보 변형이 공개된 데 이어, 이번 개발에서는 GPT-4 터보 API 내에 시각 입력 기능이 통합되었습니다.

GPT-4 Turbo는 처리 속도가 크게 향상되는 동시에 최대 128,000개의 토큰, 즉 약 300페이지에 해당하는 더 넓은 입력 매개변수 범위를 제공할 것으로 예상됩니다. 또한 소프트웨어 엔지니어를 위한 접근 가능한 가격 옵션을 제공합니다.

이 모델 기능의 중요한 개선 사항은 특정 함수 호출을 통해 텍스트 기반 입력을 JSON 형식으로 처리할 수 있다는 점입니다. 따라서 개발자는 이메일, 쇼핑, 소셜 미디어 플랫폼에 게시하는 등의 활동을 포함하여 상호 연결된 애플리케이션 내에서 자동으로 작업을 실행할 수 있는 JSON 스니펫을 사용하여 프로그래밍 가능한 명령을 만들 수 있게 되었습니다. 하지만 실제 사건이나 상황에 영향을 미칠 수 있는 작업을 수행하기 전에 사용자를 위한 확인 프로세스를 구현하는 것이 좋습니다.

Cognition , AI 코딩 에이전트 Devin이 이 모델을 사용하여 전체 코드를 자동으로 생성하는 등 여러 스타트업이 이미 비전과 함께 GPT-4 Turbo를 활용하고 있습니다:

@cognition_labs 가 구축한 Devin은 다양한 코딩 작업에 비전을 사용하는 GPT-4 Turbo 기반의 AI 소프트웨어 엔지니어링 어시스턴트입니다. pic.twitter.com/E1Svxe5fBu

- OpenAI 개발자 (@OpenAIDevs) 2024년 4월 9일

Healthify , 건강 및 피트니스 앱은 식사 사진을 기반으로 영양 분석 및 권장 사항을 제공하는 모델을 사용합니다:

@healthifyme 팀은 전 세계 음식의 사진 인식을 통해 사용자에게 영양 인사이트를 제공하기 위해 비전과 함께 GPT-4 Turbo를 사용하여 Snap을 구축했습니다. pic.twitter.com/jWFLuBgEoA

- OpenAI 개발자 (@OpenAIDevs) 2024년 4월 9일

영국 스타트업인 TLDraw 는 가상 화이트보드에 비전과 함께 GPT-4 Turbo를 사용하고 사용자 그림을 기능적인 웹사이트로 변환합니다:

@tldraw 가 만든 Make Real은 사용자가 화이트보드에 UI를 그릴 수 있으며, GPT-4 Turbo with Vision을 사용하여 실제 코드로 구동되는 작동하는 웹사이트를 생성할 수 있습니다. pic.twitter.com/RYlbmfeNRZ

- OpenAI 개발자 (@OpenAIDevs) 2024년 4월 9일

앤트로픽의 클로드 3 오푸스와 구글의 제미니 고급과 같은 최근 혁신의 강력한 반대에 직면했음에도 불구하고 말이죠, 애플리케이션 프로그래밍 인터페이스(API)의 출시가 임박함에 따라 기업 부문에서 OpenAI의 입지가 강화될 것으로 예상되며, 곧 출시될 고급 언어 모델에 대한 기대감도 높아지고 있습니다.

(사진 제공: v2osk )

또한, Stability AI는 ‘Stable LM 2’ 모델이라고 불리는 120억 개의 파라미터를 갖춘 새로운 언어 모델을 도입한 것도 주목할 만한 소식입니다. 또한 16억 개의 파라미터를 자랑하는 이전 모델의 업데이트 버전도 출시했습니다.