Multimodal Ai - Category - All Things IT @AI

Multimodal Ai

2024

HyperGAI가 HPT를 소개합니다: 선도적인 멀티모달 LLM의 획기적인 제품군 03-24

엔비디아, 미래의 휴머노이드에 동력을 공급할 멀티모달 AI 프로젝트 GR00T 공개 03-19

Writer, 엔터프라이즈 워크플로우를 재구상하는 멀티모달 AI, 팔미라-비전 공개 02-27

OpenAI, 애플 비전 프로용 ChatGPT 앱 출시 02-07

멀티모달 대규모 언어 모델(MM-LLM)의 진화, 기능, AI 연구에 미치는 영향에 대한 이해를 통해 멀티모달 대규모 언어 모델의 미래를 조명하는 AI 백서입니다. 01-31

언어 모델에서 저수준 시각 능력 향상: 보고, 기억하고, 추론하는(LRR) 멀티모달 언어 모델을 제안하는 퀄컴 AI 리서치 01-30

Adept AI, 디지털 에이전트를 위해 특별히 설계된 새로운 멀티모달 모델 '푸유-헤비' 출시 01-28

UCSD와 NYU의 연구진이 SEAL MLLM 프레임워크를 소개합니다: 고해상도 이미지에서 정확한 시각적 접지를 위한 LLM 가이드 시각적 검색 알고리즘 V ∗를 소개합니다. 01-09

모바일 디바이스에서 실행할 수 있는 유능한 멀티모달 비전 언어 모델(MMVLM)인 MobileVLM을 만나보세요. 01-03

이 AI 연구에서는 TinyGPT-V를 소개합니다: 다양한 실제 비전 언어 애플리케이션에 맞춤화된 매개변수 효율적인 MLLM(멀티모달 대규모 언어 모델)을 소개합니다. 01-02

이미지, 텍스트, 오디오, 동작을 이해하고 생성할 수 있는 자동 회귀형 멀티모달 AI 모델인 Unified-IO 2를 만나보세요. 01-01

2023

Microsoft와 조지아 공대의 연구원들이 VCoder를 소개합니다: 멀티모달 대규모 언어 모델을 위한 다목적 비전 인코더 12-29

이 AI 백서에서는 InternVL을 공개합니다: 60억 개의 파라미터를 가진 비전-언어 기반 모드로 멀티모달 AGI의 격차를 해소하는 방법 12-29

구글 딥마인드의 새로운 쌍둥이자리 탐색: 화제의 중심은 무엇일까요? 12-22

일반 세계 모델: 활주로 AI 연구, 새로운 장기적 연구 노력의 시작 12-18

제미니를 만나보세요: 인공 지능의 미래를 재정의하는 구글의 획기적인 멀티모달 AI 모델 12-07

학습 작업, 데이터 도메인, 시각적 임베딩이 혼합된 다용도 멀티모달 대규모 언어 모델(MLLM)인 SPHINX를 만나보세요. 11-18

이 AI 백서에서는 LLaVA-Plus를 소개합니다: 대형 멀티모달 모델의 기능을 확장하는 범용 멀티모달 어시스턴트, LLaVA-Plus 소개 11-17

사전 학습된 트랜스포머에서 사전 학습 데이터 구성과 상황 내 학습 간의 격차를 연구한 Google DeepMind의 AI 논문입니다. 11-13

전통적인 머신러닝은 여전히 유효할까요? 11-06

1
2