AutoWebGLM: ChatGLM3-6B를 기반으로 구축된 GPT-4 성능의 자동 웹 탐색 에이전트
LLM(대규모 언어 모델)은 웹 브라우징을 비롯한 다양한 지능형 에이전트 작업에서 없어서는 안 될 리소스로 부상하고 있습니다. 특히 LLM 기능을 갖춘 자율 디지털 엔티티의 개념은 인류와 기술의 관계를 재편할 수 있는 엄청난 잠재력을 지니고 있습니다. 이러한 에이전트는 과거에는 불가능하다고 여겨졌던 놀라운 인지 능력과 반응 특성을 통해 전례 없는 기회를 제공합니다.
그럼에도 불구하고 현재 웹 페이지 에이전트의 일반적인 문제는 실제 요구 사항을 적절히 처리하지 못한다는 점입니다. 이는 몇 가지 요인에 기인할 수 있습니다.
웹사이트 작업의 이질성은 기존 에이전트에게 장애물이 되며, 이들은 사용 가능한 수많은 옵션을 효과적으로 탐색하는 데 어려움을 겪습니다. 또한 웹사이트의 방대한 HTML 콘텐츠는 기존 모델의 처리 능력을 뛰어넘는 경우가 많기 때문에 최적의 기능을 제공하지 못하고 제시된 정보를 불완전하게 이해하는 경우가 많습니다. 또한 인터넷의 본질적인 예측 불가능성 때문에 상담원은 실시간으로 충분한 정보를 바탕으로 신속하게 선택해야 하며, 온라인 콘텐츠의 개방형 특성으로 인해 의사 결정 과정이 더욱 복잡해집니다.
이러한 과제를 효과적으로 해결하기 위해 전문가 그룹은 GPT-4의 기능을 능가하고 혁신적인 ChatGLM3-6B 프레임워크에 기반한 고도의 웹 탐색 도구인 AutoWebGLM을 제안합니다. 이 최첨단 솔루션을 개발하기 위해서는 다음과 같은 몇 가지 주목할 만한 발전이 필요했습니다:
연구원들은 일반적인 인간의 브라우징 습관을 고려하여 필수 정보를 보존하면서 웹 콘텐츠를 간소화하도록 설계된 혁신적인 HTML 단순화 알고리즘을 개발했습니다. 이 접근 방식은 모델이 웹 페이지 콘텐츠를 처리하는 효율성을 향상시켜 이해도를 높일 수 있습니다. 고품질 학습 데이터를 생성하기 위해 인간의 전문 지식과 인공 지능의 새로운 조합이 사용되었으며, 그 결과 세심하게 큐레이션된 데이터 세트가 AutoWebGLM 교육에 활용되었습니다. 강화 학습 전략을 통합하고 거부 샘플링을 사용함으로써 웹사이트를 이해하고 브라우저 기능을 실행하며 다양한 작업을 독립적으로 처리하는 시스템의 역량이 크게 향상되었습니다. 실제 상황에 대한 노출을 통해 AutoWebGLM 모델은 최적의 성능을 달성하기 위해 지속적으로 접근 방식을 개선하고 조정합니다.
AutoWebGLM은 캘리포니아 버클리 대학교와 스탠포드 대학교의 연구진이 설계한 자동차 소프트웨어 시스템입니다.딥러닝 알고리즘을 사용하여 2D 이미지에서 3D 인체 관절 위치를 예측하여 임박한 충돌 상황에서 자율주행차의 안전성을 향상시킵니다. 이 시스템은 뒤집기, 자르기, 랜덤 가우스 노이즈 추가와 같은 데이터 증강 기술을 사용하여 훈련된 GLM(일반화 선형 모델) 네트워크를 활용하여 견고성과 정확성을 높입니다. 연구팀은 그 효과를 테스트하기 위해 여러 에이전트가 참여하는 여러 가지 까다로운 시나리오를 시뮬레이션하는 데 사용되는 Roboats라는 자율 주행 플랫폼을 개발했습니다. 그 결과 AutoWebGLM을 통합하면 기존 방식에 비해 충돌 회피율이 향상되는 것으로 나타났습니다. 또한 오클루스를 처리할 때도 높은 정확도를 달성했습니다.
연구팀은 주요 성과를 다음과 같이 간결하게 표현했습니다:
연구진은 온라인 검색 활동을 효과적으로 수행할 수 있는 독립적인 인터넷 브라우저인 오토웹글럼을 개발 및 구현했습니다. 연구진은 커리큘럼 학습 전략을 채택하고 웹 탐색과 함께 거부 샘플링 미세 조정을 통한 자가 학습을 활용하여 에이전트의 훈련 과정을 시작했습니다. 실제 웹사이트 방문 행동의 10,000개 사례로 구성된 포괄적인 데이터 세트는 사람의 입력과 컴퓨터 지원을 통해 큐레이션되었습니다. 또한 다양한 언어 환경에서 쉽게 평가할 수 있도록 설계된 영어와 중국어 이중 언어 웹 브라우징 벤치마크인 오토웹벤치를 도입했습니다. 연구원들은 테스트를 통해 60억 개의 파라미터를 자랑하는 Autowebglm이 최신 LLM 성능
와 동등한 성능을 발휘한다는 것을 입증했습니다. 논문 및 Github 를 확인하세요. 이 연구에 대한 모든 크레딧은 이 프로젝트의 연구진에게 있습니다. 또한 트위터를 팔로우하는 것도 잊지 마세요. 텔레그램 채널, 디스코드 채널, 링크드인 그룹에 가입하세요.
저희의 노력에 감사하는 분들께는 저희의 최신 노력과 개발 상황을 적시에 알릴 수 있는 훌륭한 플랫폼인 뉴스레터 구독을 진심으로 권해드립니다.
4만 명이 넘는 회원을 보유한 Reddit의 광범위한 머신러닝 커뮤니티의 일원이 될 수 있는 기회를 놓치지 마세요.
빠르게 확장 중인 뉴스레터를 구독하고 Google, NVIDIA, Meta, 스탠포드 대학교, 매사추세츠 공과대학, Microsoft 등 인공지능 분야의 저명한 기관의 저명한 연구자들이 정기적으로 구독하는 뉴스레터를 받아보세요.