이 AI 백서에서는 기존 플래너의 강점을 LLM에 통합한 최초의 프레임워크인 LLM+P를 소개합니다.
인공지능 연구가 시작된 이래, 인간처럼 쉽고 다양한 방식으로 대화할 수 있는 언어 모델을 만들기 위한 노력이 계속되고 있습니다. 1966년에 개발된 엘리자와 같은 초기 모델은 그럴듯한 특정 질문에 대한 답변을 제공할 수 있었지만, 인간과 비교할 때 진정한 “이해력"이 부족하다는 결함을 드러내는 질문을 고안하는 것은 결코 어려운 일이 아니었습니다. GPT-4 및 ChatGPT와 같은 대규모 언어 모델(LLM)이 이전의 기대치를 뛰어넘었음에도 불구하고 여전히 진정한 이해에는 미치지 못합니다. 안타깝게도 인터넷에는 미취학 아동도 알아볼 수 있는 결과를 생성하기 위해 ChatGPT를 조작하여 큰 만족감을 얻는 사람들로 가득 차 있습니다.
언어 학습 모델(LLM)의 생성 및 교육은 이해력에 도움이 되지 않습니다. 이 모델의 주요 목표는 주어진 문맥에 따라 그럴듯한 단어 시퀀스를 생성하는 것입니다. 이들은 자신을 효과적으로 표현하는 능력과 같은 언어적 역량은 뛰어나지만 언제, 무엇을 전달해야 하는지에 대한 이해와 같은 기능적 역량은 부족합니다. 마호왈드(Mahowald) 등이 보고한 바와 같이, LLM은 비전통적인 요청에 응답하거나 복잡한 실제 시나리오를 파악하는 등 학습 데이터 이외의 문제를 해결하는 데 어려움을 겪고 있습니다.
언어 모델(LLM)의 훈련 코퍼스 내에 모든 수학 및 계획 작업을 통합하는 것은 모델에 추가적인 노력이 필요한 고된 작업일 수 있습니다. 그러나 이러한 노력의 필요성은 여전히 불분명합니다. 반대로, 기존의 범용 기호 플래너 및 계산기에 LLM을 통합하면 신뢰할 수 있는 결과를 보장할 수 있습니다. 이러한 접근 방식은 이전에 다양한 연구자들에 의해 탐구된 바 있습니다. 본 연구는 미세 조정이 필요한 경우에도 모델 자체를 변경하지 않으면서 계획 문제를 해결할 수 있는 전례 없는 방법론을 LLM에 제공하는 것을 목표로 합니다.
대신 텍사스 대학교 오스틴 캠퍼스와 뉴욕 주립 대학교의 학자들은 계획 문제에 대한 자연어 표현이 제공될 때 대규모 언어 모델(LLM)과 기호적 추론(P)의 강점을 모두 활용하여 두 방법 중 하나만 사용하는 것보다 더 정확한 솔루션을 제공하는 LLM+\_P라는 접근법을 제안했습니다.
앞서 언급한 프로세스에는 주어진 시나리오에 대한 설명을 생성하고, 다목적 계획 시스템을 활용하여 문제를 해결한 다음, 계획 시스템에서 얻은 결과를 사람이 이해할 수 있는 형식으로 다시 변환하는 작업이 포함됩니다.
이 연구에서 저자들은 언어 모델 + 플래너(LLM+)가 주어진 프롬프트를 언제 처리해야 하는지 결정할 수 있는 시나리오를 고려하지 않았으며, 이는 향후 연구에 중요한 영향을 미칠 수 있습니다. 그러나 광범위한 경험적 조사를 통해 LLM+P를 활용하면 기존 언어 모델에 비해 광범위한 계획 문제에 대해 훨씬 더 정확한 솔루션을 얻을 수 있음을 입증했습니다. 이 다재다능한 접근 방식은 여기서는 계획 문제라는 렌즈를 통해 시연되었지만 계산기를 사용하는 산술 문제를 포함하여 다양한 문제 영역을 잠재적으로 해결할 수 있습니다. 또한 저자들은 코드와 연구 결과를 GitHub를 통해 액세스할 수 있도록 했습니다.
논문 및 GitHub 링크 을 확인하세요. 최신 AI 연구 소식, 멋진 AI 프로젝트 등을 공유하는 20만 명 이상의 ML 서브 레딧, Discord 채널, 이메일 뉴스레터에 가입하는 것도 잊지 마세요. 위의 글과 관련하여 궁금한 점이 있거나 저희가 놓친 부분이 있다면 언제든지 이메일을 보내주세요.
AI Tools Club 플랫폼에는 다양한 인공지능 도구가 마련되어 있습니다.
StoryBird.ai의 최신 발전으로 사용자가 주어진 프롬프트에 따라 일러스트 내러티브를 만들 수 있는 놀라운 기능이 추가되었습니다. 제공된 링크를 클릭하여 이 혁신적인 기능을 체험해 보시기 바랍니다. 이 정보는 후원을 받고 있습니다.