Multimodal Ai
2024
HyperGAI가 HPT를 소개합니다: 선도적인 멀티모달 LLM의 획기적인 제품군
03-24
엔비디아, 미래의 휴머노이드에 동력을 공급할 멀티모달 AI 프로젝트 GR00T 공개
03-19
Writer, 엔터프라이즈 워크플로우를 재구상하는 멀티모달 AI, 팔미라-비전 공개
02-27
OpenAI, 애플 비전 프로용 ChatGPT 앱 출시
02-07
멀티모달 대규모 언어 모델(MM-LLM)의 진화, 기능, AI 연구에 미치는 영향에 대한 이해를 통해 멀티모달 대규모 언어 모델의 미래를 조명하는 AI 백서입니다.
01-31
언어 모델에서 저수준 시각 능력 향상: 보고, 기억하고, 추론하는(LRR) 멀티모달 언어 모델을 제안하는 퀄컴 AI 리서치
01-30
Adept AI, 디지털 에이전트를 위해 특별히 설계된 새로운 멀티모달 모델 '푸유-헤비' 출시
01-28
UCSD와 NYU의 연구진이 SEAL MLLM 프레임워크를 소개합니다: 고해상도 이미지에서 정확한 시각적 접지를 위한 LLM 가이드 시각적 검색 알고리즘 V ∗를 소개합니다.
01-09
모바일 디바이스에서 실행할 수 있는 유능한 멀티모달 비전 언어 모델(MMVLM)인 MobileVLM을 만나보세요.
01-03
이 AI 연구에서는 TinyGPT-V를 소개합니다: 다양한 실제 비전 언어 애플리케이션에 맞춤화된 매개변수 효율적인 MLLM(멀티모달 대규모 언어 모델)을 소개합니다.
01-02
이미지, 텍스트, 오디오, 동작을 이해하고 생성할 수 있는 자동 회귀형 멀티모달 AI 모델인 Unified-IO 2를 만나보세요.
01-01
2023
Microsoft와 조지아 공대의 연구원들이 VCoder를 소개합니다: 멀티모달 대규모 언어 모델을 위한 다목적 비전 인코더
12-29
이 AI 백서에서는 InternVL을 공개합니다: 60억 개의 파라미터를 가진 비전-언어 기반 모드로 멀티모달 AGI의 격차를 해소하는 방법
12-29
구글 딥마인드의 새로운 쌍둥이자리 탐색: 화제의 중심은 무엇일까요?
12-22
일반 세계 모델: 활주로 AI 연구, 새로운 장기적 연구 노력의 시작
12-18
제미니를 만나보세요: 인공 지능의 미래를 재정의하는 구글의 획기적인 멀티모달 AI 모델
12-07
학습 작업, 데이터 도메인, 시각적 임베딩이 혼합된 다용도 멀티모달 대규모 언어 모델(MLLM)인 SPHINX를 만나보세요.
11-18
이 AI 백서에서는 LLaVA-Plus를 소개합니다: 대형 멀티모달 모델의 기능을 확장하는 범용 멀티모달 어시스턴트, LLaVA-Plus 소개
11-17
사전 학습된 트랜스포머에서 사전 학습 데이터 구성과 상황 내 학습 간의 격차를 연구한 Google DeepMind의 AI 논문입니다.
11-13
전통적인 머신러닝은 여전히 유효할까요?
11-06