Google AI 오픈 소스 Flan-T5: NLP 작업에 텍스트-투-텍스트 접근 방식을 사용하는 트랜스포머 기반 언어 모델
Contents
제로 샷과 소수 샷 단서를 혼합하여 훈련하면 두 환경 모두에서 훨씬 우수한 결과를 얻을 수 있음을 입증합니다. - 섹션 3.3의 확장, 입력 반전을 사용한 작업 다양성 향상, 연쇄 사고 훈련 데이터 추가, 다양한 데이터 소스 균형 조정 등 효율적인 인스트럭션 튜닝을 위한 주요 방법을 측정하고 시연합니다. - 결과: 이러한 기술적 결정은 사용 가능한 오픈 소스 명령어 튜닝 컬렉션과 비교하여 보류 중인 작업 성능을 3~17% 향상시켰습니다 - 결과: Flan-T5 XL은 단일 작업 미세 조정을 위한 보다 강력하고 효과적인 계산 시작점을 제공합니다. - 새로운 Flan 2022 작업 컬렉션, 템플릿 및 연구 방법론을 공개적으로 사용할 수 있도록 합니다. 소스 코드는 GitHub에서 사용할 수 있습니다.
Paper 및 Github 를 확인하세요. 비교에 대한 자세한 내용은 멋진 기사 을 참조하세요. 이 연구에 대한 모든 크레딧은 이 프로젝트의 연구진에게 있습니다. 또한 최신 AI 연구 뉴스, 멋진 AI 프로젝트 등을 공유하는 13만 명 이상의 ML 서브 레딧, Discord 채널 및 이메일 뉴스레터에 가입하는 것을 잊지 마세요.
이제 지정된 프롬프트에 따라 일러스트레이션 내러티브를 생성할 수 있는 스토리버드.ai의 기능에 몇 가지 흥미로운 기능이 추가되었다는 소식을 전해드렸습니다. 이 혁신에 대해 자세히 알아보시려면 아래 링크를 방문해 주세요. 이 정보는 스폰서 콘텐츠로 제공됩니다.