Contents

엘레우터 AI 연구 그룹, 분류기 없는 안내(CFG)를 LLM에 사용하는 방법 시연

Contents

최근 대규모 언어 모델의 발전으로 광범위한 애플리케이션에서 텍스트를 생성할 수 있는 뛰어난 성능이 입증되었습니다. 생성 과정은 일반적으로 작업 지침, 문맥 정보 또는 제한된 예시를 포함하는 프롬프트를 통해 촉진됩니다. 그러나 특히 더 작은 모델을 사용할 때 환각, 품질 저하 및 발산과 같은 다양한 문제가 발생했습니다. 이러한 문제를 해결하기 위해 몇 가지 전략이 제시되었는데, 그중에는 지침과 강화 학습을 기반으로 한 미세 조정이 있습니다. 단, 계산 요구 사항과 필요한 데이터로 인해 모든 사용자가 이러한 접근 방식을 활용할 수 있는 것은 아니라는 점에 유의해야 합니다.

EleutherAI의 연구팀은 응답을 생성할 때 프롬프트로 표시되는 사용자의 표현된 목적에 더 큰 의미를 부여하는 추론 방법론을 제안합니다. 이 접근 방식은 결론을 도출하는 과정에서 프롬프트에 더 큰 중요성을 부여함으로써 세대 간 일관성을 강화하고자 합니다.

조사에 따르면 텍스트-이미지 생성 영역에서도 유사한 문제가 발생하는 것으로 나타났습니다. 기존의 추론 기법은 비정형적이거나 특수한 자극을 처리할 때 조건화의 중요한 측면을 놓칠 수 있습니다. 확산 모델의 생성 능력을 향상시키기 위해 생성된 이미지에서 바람직한 특성을 촉진하기 위해 별도의 분류기를 통합하는 것이 제안되었습니다. 최근에는 생성 모델을 암시적 분류기로 활용함으로써 분류기가 필요 없는 분류기 없는 안내(CFG)가 도입되었습니다.

연구자들은 텍스트에서 이미지를 생성한 이전 성과를 바탕으로 조건부 흐름 그래프(CFG)를 유니모달 텍스트 생성에 적용하여 모델의 입력과의 호환성을 최적화하는 것을 목표로 삼았습니다. 연구진은 CFG를 추가 훈련 없이 텍스트 생성에 바로 사용할 수 있는 반면, 텍스트-이미지 모델은 CFG를 활용하기 위해 조건부 드롭아웃 훈련이 필요하다는 것을 보여줍니다. 이 연구는 간단한 일회성 프롬프트부터 복잡한 챗봇 스타일의 프롬프트 및 모든 중간 사례에 이르기까지 다양한 프롬프트 기술 전반에 걸쳐 정렬을 향상시키는 데 있어 CFG의 잠재력을 강조합니다.

구성 문법(CFG)을 활용한 언어 모델링에 대한 혁신적인 접근 방식은 고급 방법론의 구현을 통해 검증되었으며, 그 결과 여러 업계 표준 벤치마크에서 인상적인 개선이 이루어졌습니다. 이러한 벤치마크는 기본 프롬프트, 연쇄 프롬프트, 긴 텍스트 프롬프트, 챗봇 스타일 프롬프트를 포함한 다양한 유형의 프롬프트를 포괄합니다.우리가 제안한 방법인 LLaMA-7B의 우수한 성능은 PaLM-540B와 비교하여 주목할 만한 결과를 통해 입증되었으며, LAMBADA 벤치마크에서 최첨단 솔루션으로 인정받았습니다.

본 연구는 언어 모델(LM)의 로짓 분포를 수정하는 것을 목표로 하는 추론 방법의 범주에 속하며, 이러한 노력과 전적으로 일치합니다. 연구 결과에 따르면 계산적 특징 관리(CFG) 추론 작업의 수를 두 배로 늘리면 모델의 전체 성능을 약 두 배로 향상시킬 수 있는 것으로 나타났습니다. 이 개발은 처리 능력이 낮은 장치에서 덜 복잡하고 비용 효율적인 모델을 학습할 수 있는 새로운 가능성을 열어줍니다.

다양한 스타일의 조건부 흐름 그래프(CFG)로 생성된 텍스트를 구별하는 인간의 능력을 평가하기 위해 부정적 프롬프트를 사용한 실험이 수행되었습니다. 그 결과, 75%에 달하는 대다수의 참가자가 다른 CFG 방식에 비해 생성적 사전 학습 트랜스포머(GPT)로 생성된 결과물을 선호한다는 사실이 밝혀졌습니다. 이 결과는 CFG 내에서 특정 기능의 선택을 세밀하게 제어하면 생성된 텍스트에 대한 사람들의 선호도가 향상될 수 있음을 시사합니다.

논문 을 확인하세요. 최신 AI 연구 뉴스, 멋진 AI 프로젝트 등을 공유하는 25만 명 이상의 ML 서브 레딧, Discord 채널, 트위터, 이메일 뉴스레터에 가입하는 것을 잊지 마세요. 위의 글과 관련하여 궁금한 점이 있거나 저희가 놓친 부분이 있다면 언제든지 Asif@All Things IT @AI

로 이메일을 보내주시기 바랍니다.“AI 도구 클럽에서 100가지가 넘는 옵션을 아우르는 광범위한 인공지능 도구 모음을 살펴보세요.

최근 사용자가 주어진 프롬프트를 사용하여 그림으로 된 내러티브를 만들 수 있는 StoryBird.ai의 몇 가지 놀라운 기능 공개에 관한 정보를 받았습니다. 이 혁신에 대해 자세히 알아보고 싶으시다면 제공된 링크를 클릭해 주세요. 이 메시지는 후원을 받고 있음을 알려드립니다.