Contents

CMU의 이 AI 백서에서는 에이전트키트를 소개합니다: 자연어를 사용하여 AI 에이전트를 구축하기 위한 머신 러닝 프레임워크

Contents

인공지능의 영역에서 에이전트 기반 시스템에는 디지털 환경에서 독립적으로 작업을 수행하는 인공지능 에이전트가 포함됩니다. 복잡한 지시를 이해하고 주변 환경에 적응적으로 대응할 수 있는 지능형 에이전트를 개발하는 데는 어려운 기술적 장애물이 존재합니다. 에이전트 제작에서 반복적으로 발생하는 문제 중 하나는 고급 프로그래밍 전략에 의존해야 한다는 점입니다. 일반적으로 에이전트는 힘든 코딩 프로세스를 통해 제작되며, 특정 애플리케이션 프로그래밍 인터페이스(API)에 대한 광범위한 지식이 요구되고 종종 범용성이 저하되기도 합니다. 이러한 방법론은 창의성과 접근성을 억제하여 AI 에이전트의 잠재적 사용 범위를 제한된 도메인 이상으로 제한할 수 있습니다.

기존 연구에서는 지능형 에이전트의 계획 및 대화형 기능을 향상시키기 위해 GPT-4와 같은 고급 언어 모델을 통합하고 연쇄 사고 프롬프트를 활용하는 방법을 탐구했습니다. 주목할 만한 발전으로는 에이전트 기능을 최적화하여 보다 민첩한 작업 관리를 가능하게 하는 LangChain과 같은 프레임워크의 개발이 있습니다. 또한 에이전트의 행동을 효율적으로 지시하는 잘 구조화된 입력을 사용하여 이러한 모델을 오픈월드 게임과 같은 복잡한 환경으로 확대 적용하려는 연구 노력도 있었습니다. 이러한 발전은 적응형 및 지각형 AI 구조의 상당한 진화를 의미하며, 다양한 환경에서 다양한 대응과 정확한 작업 수행을 가능하게 합니다.

/images/this-ai-paper-from-cmu-introduces-agentkit-a-machine-learning-framework-for-building-ai-agents-using-natural-language.png

카네기멜론대학교, NVIDIA, Microsoft, 보스턴대학교의 전문가들이 전례 없는 협력을 통해 개발한 에이전트키트는 프로그래밍 코드 대신 자연어를 사용하여 인공지능 에이전트를 만들 수 있는 새로운 프레임워크로서 사용자가 인공지능 에이전트를 만들 수 있도록 지원합니다. 이 접근 방식의 핵심은 노드가 언어적 프롬프트를 통해 설명되는 하위 작업을 나타내는 그래프 기반 아키텍처에 있습니다. 이러한 구조화된 표현을 활용하면 복잡한 에이전트 동작을 쉽게 조합할 수 있어 사용자 접근성과 전체 시스템의 적응성을 크게 향상시킬 수 있습니다.

/images/this-ai-paper-from-cmu-introduces-agentkit-a-machine-learning-framework-for-building-ai-agents-using-natural-language-1.png

에이전트키트의 접근 방식은 방향성 비순환 그래프(DAG)를 사용하여 각 작업에 대한 구조화된 표현을 생성하고, 각 DAG 노드는 개별 작업에 해당합니다. 이 구조를 통해 작업 종속성을 식별하고 해결하여 논리적 진행과 체계적인 실행을 촉진할 수 있습니다. 노드는 GPT-4와 같은 대규모 언어 모델을 활용하여 자연어 프롬프트에 대한 응답을 처리하고 생성하여 다양한 형태의 커뮤니케이션을 처리할 수 있는 다기능성을 제공합니다.또한 이 프레임워크는 운영 중에 적응할 수 있는 기능을 갖추고 있어 환경이나 작업 요구 사항의 변동에 효과적으로 대응할 수 있습니다. 이 네트워크 내에서 연속적인 노드를 연결함으로써 에이전트키트는 원활한 데이터 흐름을 촉진하여 적응형 작업 관리와 복잡한 운영 시퀀스의 정확한 실행을 모두 수용하는 효과적이고 간소화된 워크플로우를 구현합니다.

실험 결과에서 알 수 있듯이 AgentKit은 작업 관리에서 괄목할 만한 향상을 보여주었습니다. 크래프터 게임 시뮬레이션에서 에이전트키트를 활용하면 작업 완료율이 80%까지 향상되는 놀라운 결과를 얻었습니다. 또한 웹샵 시나리오에 적용했을 때는 5%라는 놀라운 증가율로 현재의 최신 모델보다 뛰어난 성능을 보였습니다. 이러한 결과는 사용자 친화적인 구성을 통해 복잡한 작업을 처리할 수 있는 시스템의 능력을 강조합니다. 또한 이러한 성과는 다양한 분야에 걸쳐 효과적으로 배포하여 에이전트 중심 운영에서 일관되고 정량화 가능한 발전을 제공할 수 있는 AgentKit의 다목적성을 강조합니다.

요약하면, 에이전트키트는 기존의 프로그래밍 기법이 아닌 자연어 입력을 통해 복잡한 에이전트를 생성할 수 있게 함으로써 인공지능 에이전트 개발의 상당한 도약을 의미합니다. 에이전트키트는 그래프 중심 아키텍처와 GPT-4와 같은 고급 언어 모델을 통합함으로써 인공지능 에이전트의 동적 구성 및 수정을 용이하게 합니다. 게임과 전자상거래를 비롯한 다양한 애플리케이션에서 상당한 성공을 거둔 것은 이 혁신적인 접근 방식의 효과와 적응성을 잘 보여줍니다. 이 글에서 살펴본 사례는 다양한 분야에서 사용자 친화적이고 광범위한 접근성을 갖춘 AI 솔루션의 엄청난 가능성을 암시합니다.

논문 Github 을 확인하세요. 이 연구에 대한 모든 저작권은 이 프로젝트의 연구진에게 있습니다. 또한 트위터를 팔로우하는 것도 잊지 마세요. 텔레그램 채널, 디스코드 채널, 링크드인 그룹에 가입하세요.

저희의 노력에 감사하는 분들을 위해 뉴스레터를 구독해 주시면 더욱 관심을 불러일으킬 수 있는 최신 노력과 업데이트에 대한 정보를 얻을 수 있는 훌륭한 수단이 될 것입니다.

40,000명 이상의 회원을 자랑하는 Reddit의 광범위한 머신러닝 커뮤니티의 일원이 되는 것을 잊지 마세요.

콘텐츠 파트너십을 원하시면 여기에서 양식을 작성하세요…

Google, NVIDIA, Meta, 스탠포드, MIT, Microsoft 등 저명한 기관의 저명한 연구자들이 구독하는 빠르게 확장 중인 뉴스레터를 즐겨보세요.