Contents

알리바바 연구원, GPT-4 표준을 넘어 대규모 언어 모델에서 역할극을 강화하는 혁신적인 자체 정렬 방법 'Ditto' 소개

Contents

최근 인공 지능 및 자연어 처리에서 대규모 언어 모델(LLM)의 사용이 주목을 받고 있습니다. 이러한 추세에도 불구하고 이러한 모델 내에서 역할극 시나리오를 효과적으로 구현하는 것과 관련된 지속적인 문제가 남아 있습니다. 이러한 작업을 성공적으로 수행하려면 언어학에 대한 깊은 이해와 다양한 캐릭터 역할의 일관된 구현이 필요합니다. 이러한 장애물을 극복하기 위해 알리바바의 연구원들은 롤플레잉 상호작용에 능숙하게 참여할 수 있는 LLM의 역량을 크게 확장하는 혁신적인 셀프 얼라인먼트 접근 방식인 DITTO를 제안했습니다.

본 연구는 오픈소스 대규모 언어 모델(LLM)의 역할 수행 능력과 관련하여 독점 언어 모델과 비교했을 때 최적이 아닌 성능이라는 근본적인 문제를 해결하고자 합니다. 이전의 접근 방식은 GPT-4와 같은 고급 모델이 보여주는 롤플레잉 능력을 더 약한 오픈소스 대안을 활용하여 복제하려고 시도했습니다. 그러나 이러한 시도는 일관된 역할 정체성을 유지하고 확장된 역할 기반 상호 작용에서 신뢰할 수 있고 상황에 적합한 정보를 제공하는 데 어려움을 겪으면서 LLM 내에서 역할 놀이의 잠재력을 완전히 실현하지 못했습니다.

본 연구는 대규모 언어 모델(LLM)을 다양한 캐릭터의 만남, 사건, 페르소나, 대화 교환을 포괄하는 광범위한 텍스트 저장소에 노출되어 형성된 복합적인 개체로 인식함으로써 혁신적인 전략을 발전시킵니다. 이러한 잠재적인 캐릭터 이해를 활용하여 DITTO 방식은 능숙하게 시뮬레이션된 역할극 상호작용을 촉진합니다. 개념적으로 역할극은 독해의 특수한 형태로 간주되며, LLM은 제공된 특성과 전기적 세부 사항에 따라 뚜렷한 페르소나에 자신의 관점을 적용합니다.

/images/alibaba-researchers-introduce-ditto-a-revolutionary-self-alignment-method-to-enhance-role-play-in-large-language-models-beyond-gpt-4-standards.png

DITTO의 방법론은 위키데이터와 위키피디아 같은 오픈 소스 데이터를 활용하여 캐릭터 프로필을 생성합니다. 초기 프로세스에서는 여러 캐릭터에 대한 광범위한 프로필을 생성하여 이후 대화 시뮬레이션 단계의 토대를 마련합니다. 이 후반 단계에서는 일련의 독해 연습을 통해 역할극 대화가 진행되며, 이 과정에서 각 캐릭터의 배경 스토리와 관련된 질문이 언어 모델에 의해 제기되고 해결됩니다. 이 전략을 사용하면 언어 모델이 다양한 캐릭터에 대한 고유의 이해를 활용하고 활용할 수 있으므로 더욱 진정성 있고 다양한 롤플레잉 상호작용을 촉진할 수 있습니다.

실험 설계에는 제안된 방법의 평가를 위해 저명한 오픈소스 대규모 언어 모델인 Llama-2, MPT, OpenLLaMA를 사용하는 것이 포함되었습니다. 실험 결과, 통합 모델은 추론 능력, 상식적 이해력, 자동화된 코드 생성 등의 영역에서 기존 오픈소스 롤플레잉 벤치마크에 비해 주목할 만한 개선이 이루어졌습니다. 여러 차례에 걸친 확장된 상호작용을 통해 일관된 캐릭터 페르소나를 효과적으로 유지하면서 정확한 도메인별 정보를 제공하는 혁신적인 접근 방식인 DITTO는 이전 방식을 뛰어넘어 최첨단 상용 챗봇 솔루션에 필적하는 경쟁력 있는 결과를 보여주었습니다.

/images/alibaba-researchers-introduce-ditto-a-revolutionary-self-alignment-method-to-enhance-role-play-in-large-language-models-beyond-gpt-4-standards-1.png

요약하면, 이번 조사는 대규모 언어 모델(LLM) 영역에서 주목할 만한 진전을 보여줍니다. DITTO의 통합은 오픈소스 LLM이 지금까지 독점적인 모델에서만 가능했던 롤플레잉 적성을 달성할 수 있도록 지원하는 데 있어 중요한 시점이 될 것입니다. 이러한 접근 방식을 통해 유니티는 롤플레잉에 대한 LLM의 역량을 확대하고 다양한 대인관계와 매혹적인 맥락에서 활용할 수 있는 새로운 비전을 제시합니다. 특히, 이번 조사 결과는 창의적인 방법을 통해 LLM의 타고난 역량을 활용할 수 있는 잠재적 가능성을 밝혀냄으로써 자연어 처리와 인공 지능의 미래 혁신을 향한 길을 제시하고 있습니다.

논문 Github 을 확인하세요. 이 연구에 대한 모든 저작권은 이 프로젝트의 연구진에게 있습니다. 또한 트위터를 팔로우하는 것도 잊지 마세요.

뉴스레터는 여러분의 관심을 불러일으킬 만한 최신 노력과 업데이트에 대한 정보를 얻을 수 있는 훌륭한 플랫폼이므로, 저희의 노력에 감사하는 분들을 뉴스레터 구독에 진심으로 초대합니다.

텔레그램 채널에 가입하는 것을 잊지 마세요

2024년 1월 29일에 열리는 ‘차세대 GPT-4 비전을 이용한 실시간 문서 및 이미지 분석’이라는 무료 웨비나에 참석하여 최첨단 인공지능 기술 활용에 대한 귀중한 인사이트를 얻으세요. 이 특별한 이벤트는 문서 및 이미지 분석을 위한 AI 분야의 최첨단 발전을 살펴보고 조직에 어떤 이점을 제공할 수 있는지 알아볼 수 있는 기회를 제공합니다.