Language Model
2024
Apple의 연구원들이 'pfl-research'를 소개합니다: 연합 학습 시뮬레이션을 위한 빠르고 모듈식이며 사용하기 쉬운 Python 프레임워크
04-15
MixedBread AI, 바이너리 MRL 도입: 새로운 임베딩 압축 방법으로 벡터 검색의 확장성을 높이고 임베딩 기반 애플리케이션을 활성화합니다.
04-14
Microsoft Research, 언어, 양식, 모델 및 작업 전반에 걸쳐 대규모 언어 모델을 벤치마킹할 수 있는 '메가버스' 소개
04-14
기계 학습에서 세계 지식과 암기 평가하기: 튀빙겐 대학교의 연구
04-14
신경망 훈련의 미래: 하이퍼파라미터 스케일링을 위한 μ-트랜스퍼에 대한 경험적 인사이트
04-14
Google AI, LLM 정렬을 위한 고품질 합성 데이터 생성을 위한 머신 러닝 프레임워크인 CodecLM 출시
04-14
AI의 인과적 추론의 발전: 홍콩 폴리테크닉 대학교와 충칭 대학교 연구진, LLM 평가를 위한 코즈널벤치 개발
04-13
Meta와 MBZUAI의 이 AI 백서에서는 모델 크기와 지식 저장 용량에 관한 매우 정확한 확장 법칙을 조사하는 원칙적인 AI 프레임워크를 소개합니다.
04-13
이글(RWKV-5) 및 핀치(RWKV-6): 멀티헤드 행렬 값 상태와 동적 데이터 기반 순환 메커니즘을 통합하여 순환 신경망 기반 언어 모델에서 상당한 진전을 이루었습니다.
04-13
Google AI, 패치스코프를 소개합니다: 숨겨진 표현에 대한 자연어 설명을 제공하도록 LLM을 학습시키는 머신 러닝 접근 방식, 패치스코프 출시
04-13
LLM2Vec: 모든 디코더 전용 LLM을 텍스트 인코더로 변환하는 간단한 AI 접근 방식 비지도 및 지도 범주에서 MTEB에서 SOTA 성능을 달성하는 방법
04-13
다국어 대규모 언어 모델의 발전: 글로벌 커뮤니케이션 및 컴퓨터 언어학에 대한 혁신, 도전 과제 및 영향
04-13
중국에서 온 이 AI 백서에서는 MiniCPM을 소개합니다: 확장 가능한 학습 접근법을 통한 혁신적인 소규모 언어 모델 소개
04-13
Cohere AI, 엔터프라이즈 검색 및 RAG(검색 증강 생성) 시스템 최적화를 위해 설계된 최첨단 기반 모델인 Rerank 3를 공개합니다.
04-12
Samba-CoE v0.3: 고급 라우팅 기능으로 AI 효율성의 재정의
04-12
중국에서 발행된 이 AI 논문에서는 검색 트리(RoT)에 대한 리플렉션을 소개합니다: 트리 검색 기반 프롬프트 방법의 성능을 개선하기 위해 설계된 LLM 리플렉션 프레임워크
04-12
UC 버클리 연구진이 ThoughtSculpt를 소개합니다: 혁신적인 몬테카를로 트리 검색 및 수정 기법으로 대규모 언어 모델 추론 강화하기
04-12
스탠퍼드와 MIT의 연구원들이 스트림 오브 서치(SoS)를 소개합니다: 언어 모델이 외부 지원 없이도 언어 검색을 통해 문제 해결 방법을 학습할 수 있도록 하는 머신 러닝 프레임워크
04-11
허깅페이스, 고품질의 제어 가능한 텍스트 음성 변환(TTS) 모델을 위한 추론 및 훈련 라이브러리인 Parler-TTS 출시
04-11
SpeechAlign: 기술 상호작용의 자연스러움과 표현력 향상을 위해 사람의 피드백으로 음성 합성을 혁신하는 기술
04-11