마이크로소프트의 태스크위버: 도메인별 복잡한 작업을 처리하기 위한 지능형 대화형 에이전트의 역량 강화
GPT, 클로드, 라마와 같은 대규모 언어 모델(LLM)의 최근 개발은 자연어 이해 및 생산에 있어 탁월한 능력을 보여주었습니다. 이러한 모델은 챗봇과 가상 비서 애플리케이션에서 널리 활용되고 있습니다. 하지만 이러한 모델들은 정교한 데이터 구조가 포함된 복잡한 데이터 분석 작업에 직면했을 때 한계에 부딪혔고, 다양한 사용자 요구와 선호도를 수용하는 데 어려움을 겪어왔습니다.
최신 인공 지능 시스템이 제시하는 다각적인 과제를 해결하기 위해 Microsoft의 전담 연구 그룹은 LLM 기반 자율 에이전트의 기능을 활용하는 혁신적인 코드 중심 프레임워크인 TaskWeaver를 개발했습니다. 이 획기적인 도구는 복잡한 작업을 효율적으로 관리하면서 특수한 상황에 원활하게 적응할 수 있는 고급 대화형 에이전트를 만들기 위한 강력하고 다재다능한 기반을 제공합니다.
TaskWeaver는 사용자 정의 플러그인을 기능적으로 액세스 가능한 엔티티로 활용하여 사용자 문의를 실행 가능한 명령어로 변환합니다. 이 방법론은 복잡한 데이터 구조, 적응형 플러그인 배포, 재량적 플러그인 선택을 위한 견고한 지원을 제공하며, 관련 논리 연산을 관리하기 위해 LLM의 프로그래밍 기능을 활용합니다. 이 프레임워크는 생성된 코드의 안전한 실행을 보장합니다.
사용자와 시스템 간의 인터페이스 역할을 하는 플래너, 사용자 입력에 따라 코드를 생성하는 코드 생성기(CG), 생성된 코드를 실행하면서 진행 상황을 모니터링하는 코드 실행기(CE)로 구성됩니다. 플래너는 사용자로부터 작업 요청을 받아 이를 더 작은 작업 또는 하위 작업으로 분할하고 CE가 완료할 수 있도록 감독합니다. 또한 이 과정에서 스스로를 되돌아볼 수 있는 기능도 있습니다. CG는 사용 가능한 플러그인을 사용하고 필요한 경우 적절한 함수 호출을 사용하여 각 하위 작업에 대한 코드를 생성합니다. 마지막으로 CE는 생성된 코드를 실행하고 전체 세션 동안 실행 상태를 유지합니다.
태스크웨이버는 두 가지 전략을 활용하여 멀티 에이전트 시스템 구성으로 전환할 수 있는 가능성을 제공합니다. 첫 번째 방법은 사용 가능한 플러그인을 통해 추가 에이전트와의 통신을 시작하는 TaskWeaver에 의해 구동되는 에이전트로 구성됩니다. 또 다른 전략은 AutoGen과 같은 기존 멀티 에이전트 플랫폼 내에 TaskWeaver로 제어되는 에이전트를 통합하는 것입니다.
태스크위버는 복잡한 도메인별 데이터 분석 작업을 처리할 수 있는 고급 대화형 에이전트를 생성하기 위한 혁신적인 접근 방식으로서 놀라운 잠재력을 보여주며, 이와 관련하여 현재의 대규모 언어 모델의 한계를 뛰어넘고 있습니다. LLM 기술의 지속적인 발전과 개선을 통해 TaskWeaver는 점점 더 복잡하고 정교한 애플리케이션을 만드는 데 기여할 수 있는 유리한 위치에 있으며, 이는 대화형 인공 지능 분야에서 상당한 도약을 의미하기도 합니다.
코드는 https://github.com/microsoft/TaskWeaver/ 에서 오픈 소스입니다. 논문 TaskWeaver: 코드 우선 에이전트 프레임워크 arXiv .