Contents

마이크로소프트의 태스크위버: 도메인별 복잡한 작업을 처리하기 위한 지능형 대화형 에이전트의 역량 강화

Contents

GPT, 클로드, 라마와 같은 대규모 언어 모델(LLM)의 최근 개발은 자연어 이해 및 생산에 있어 탁월한 능력을 보여주었습니다. 이러한 모델은 챗봇과 가상 비서 애플리케이션에서 널리 활용되고 있습니다. 하지만 이러한 모델들은 정교한 데이터 구조가 포함된 복잡한 데이터 분석 작업에 직면했을 때 한계에 부딪혔고, 다양한 사용자 요구와 선호도를 수용하는 데 어려움을 겪어왔습니다.

최신 인공 지능 시스템이 제시하는 다각적인 과제를 해결하기 위해 Microsoft의 전담 연구 그룹은 LLM 기반 자율 에이전트의 기능을 활용하는 혁신적인 코드 중심 프레임워크인 TaskWeaver를 개발했습니다. 이 획기적인 도구는 복잡한 작업을 효율적으로 관리하면서 특수한 상황에 원활하게 적응할 수 있는 고급 대화형 에이전트를 만들기 위한 강력하고 다재다능한 기반을 제공합니다.

/images/microsofts-taskweaver-empowering-intelligent-conversational-agents-for-handling-domain-specific-complex-tasks.png

TaskWeaver는 사용자 정의 플러그인을 기능적으로 액세스 가능한 엔티티로 활용하여 사용자 문의를 실행 가능한 명령어로 변환합니다. 이 방법론은 복잡한 데이터 구조, 적응형 플러그인 배포, 재량적 플러그인 선택을 위한 견고한 지원을 제공하며, 관련 논리 연산을 관리하기 위해 LLM의 프로그래밍 기능을 활용합니다. 이 프레임워크는 생성된 코드의 안전한 실행을 보장합니다.

/images/microsofts-taskweaver-empowering-intelligent-conversational-agents-for-handling-domain-specific-complex-tasks-1.png

사용자와 시스템 간의 인터페이스 역할을 하는 플래너, 사용자 입력에 따라 코드를 생성하는 코드 생성기(CG), 생성된 코드를 실행하면서 진행 상황을 모니터링하는 코드 실행기(CE)로 구성됩니다. 플래너는 사용자로부터 작업 요청을 받아 이를 더 작은 작업 또는 하위 작업으로 분할하고 CE가 완료할 수 있도록 감독합니다. 또한 이 과정에서 스스로를 되돌아볼 수 있는 기능도 있습니다. CG는 사용 가능한 플러그인을 사용하고 필요한 경우 적절한 함수 호출을 사용하여 각 하위 작업에 대한 코드를 생성합니다. 마지막으로 CE는 생성된 코드를 실행하고 전체 세션 동안 실행 상태를 유지합니다.

/images/microsofts-taskweaver-empowering-intelligent-conversational-agents-for-handling-domain-specific-complex-tasks.png

태스크웨이버는 두 가지 전략을 활용하여 멀티 에이전트 시스템 구성으로 전환할 수 있는 가능성을 제공합니다. 첫 번째 방법은 사용 가능한 플러그인을 통해 추가 에이전트와의 통신을 시작하는 TaskWeaver에 의해 구동되는 에이전트로 구성됩니다. 또 다른 전략은 AutoGen과 같은 기존 멀티 에이전트 플랫폼 내에 TaskWeaver로 제어되는 에이전트를 통합하는 것입니다.

태스크위버는 복잡한 도메인별 데이터 분석 작업을 처리할 수 있는 고급 대화형 에이전트를 생성하기 위한 혁신적인 접근 방식으로서 놀라운 잠재력을 보여주며, 이와 관련하여 현재의 대규모 언어 모델의 한계를 뛰어넘고 있습니다. LLM 기술의 지속적인 발전과 개선을 통해 TaskWeaver는 점점 더 복잡하고 정교한 애플리케이션을 만드는 데 기여할 수 있는 유리한 위치에 있으며, 이는 대화형 인공 지능 분야에서 상당한 도약을 의미하기도 합니다.

코드는 https://github.com/microsoft/TaskWeaver/ 에서 오픈 소스입니다. 논문 TaskWeaver: 코드 우선 에이전트 프레임워크 arXiv .