연구원들은 제너레이티브 시뮬레이션을 사용하여 로봇을 위한 무한한 훈련 데이터를 확보합니다.
요약
연구진이 개발한 혁신적인 로봇 에이전트로, 생성 시뮬레이션 환경에 참여하여 새로운 능력을 자율적으로 습득할 수 있는 능력을 갖췄습니다.
카네기멜론 대학교, 칭화 정보 보안 연구소, 매사추세츠 공과대학교 컴퓨터 과학 및 인공 지능 연구소, 매사추세츠 애머스트 대학교, MIT와 IBM의 합작 벤처인 MIT-IBM AI Lab의 연구자들은 로봇의 자율 학습 프로세스를 위한 훈련 데이터를 무제한으로 공급하기 위해 최신 발전된 생성 인공 지능을 활용하는 데 주력하고 있습니다.
RoboGen은 생성 시뮬레이션을 활용하여 여러 로봇 작업을 포괄적인 방식으로 자율적으로 마스터할 수 있는 고급 로봇 에이전트입니다. 개발팀은 OpenAI의 GPT-4와 같은 최첨단 기반 모델을 사용하여 다양한 작업, 시나리오 및 교육 프로토콜을 원활하게 생성함으로써 사람의 감독을 최소화하면서 로봇의 숙련도를 크게 향상시킵니다.
생성 시뮬레이션에 GPT-4 사용
4단계로 구성된 간소화된 워크플로우가 특징입니다:
로봇의 작업 생성을 용이하게 하기 위해 RoboGen은 특정 로봇 모델과 관련 오브젝트를 모두 입력 파라미터로 활용합니다. GPT-4의 고급 기능을 사용하여 주어진 기준에 맞는 다양한 작업을 생성할 수 있습니다.
RoboGen은 포괄적인 오브제버스 저장소에서 3차원 오브젝트를 추출하고 GPT-4의 고급 기능을 활용하여 실제와 같은 컨텍스트 내에서 능숙하게 배치함으로써 다양한 작업의 실행을 지원하는 시뮬레이션 장면을 쉽게 생성할 수 있습니다.
RoboGen은 GPT-4를 사용하여 훈련 감독 생성이라는 프로세스를 통해 복잡한 작업을 더 작고 관리하기 쉬운 단계로 세분화합니다. 이 접근 방식을 사용하면 강화 학습과 같은 알고리즘을 사용하여 이러한 간단한 작업을 효과적으로 해결할 수 있습니다. 그 후 GPT-4는 각 개별 작업의 고유한 특성과 요구 사항에 따라 가장 적합한 알고리즘을 선택합니다.
작업, 설정, 보조 작업, 계산 전략 등 필수 매개변수가 확인되면 시뮬레이션 환경 내에서 장면 숙지 및 훈련 연습을 모두 포함하는 기술 습득 과정이 시작됩니다.
비디오: Wang, Xian, Chen et al.
권장
추가 개발 예정
초기 실험에서 로보젠은 다양한 작업에 대한 100가지가 넘는 다양한 훈련 시나리오를 개발했습니다. 연구원들은 이 데이터 세트가 성능 면에서 인간이 만든 데이터 세트를 능가한다고 주장합니다. 그럼에도 불구하고 연구진은 여러 플랫폼에서 일반화된 로봇 학습을 용이하게 하기 위해 특별히 설계된 구글 딥마인드의 Open-X 구현 데이터 세트와 비교하지는 않았습니다. 이 추가 데이터 세트는 향후 RoboGen의 기능을 향상시킬 수 있는 가능성이 있습니다.
비디오: 왕, 시안, 첸 외
저자들은 RoboGen의 단점 중 하나가 습득한 능력에 대한 확인이 없다는 점을 인정하지만, 가까운 시일 내에 이 문제를 해결하기 위해 자동화된 절차를 통합할 것으로 예상하고 있습니다. 또한, 지속적인 연구 노력을 통해 이 문제를 해결하기 위한 진전이 이루어지고 있음에도 불구하고 현실과의 괴리로 인한 지속적인 도전 과제를 인식하고 있습니다.
모든 정보, 추가 예제 및 코드는 GitHub 에서 확인할 수 있습니다.