Contents

Boston Dynamics는 ChatGPT를 사용하여 로봇 투어 가이드를 제작합니다.

Contents

/images/boston-dynamics-uses-chatgpt-to-create-a-robot-tour-guide.jpg

채팅(로)봇 만들기

보스턴 다이내믹스의 스팟 로봇은 놀라운 민첩성을 보여주었으며, 이제는 능숙한 여행 가이드 역할도 수행할 수 있게 되었습니다.

자율 4족 보행 로봇인 스팟과 함께 OpenAI의 ChatGPT 챗봇이 사용하는 것과 같은 생성형 인공지능 기술의 잠재적 적용 가능성을 조사하기 위해 창의적인 엔지니어 팀이 이러한 최첨단 리소스를 활용한 가상 투어 가이드를 고안했습니다.

매혹적인 시각적 프레젠테이션을 활용한 이 최고 수준의 프로덕션은 놀랍고 시각적으로 매력적인 놀라운 결과물을 선보입니다. 스타일리시한 헤드웨어 액세서리와 실제와 같은 안구 보철물, 인공 수염을 착용한 주인공은 보스턴 다이내믹스의 최첨단 매사추세츠 시설의 여러 구역을 매끄럽게 이동하면서 첨단 로봇 조작기를 사용하여 일련의 복잡한 기동을 수행합니다.

이 영상에서 보스턴 다이내믹스의 수석 소프트웨어 엔지니어인 매트 클링겐스미스는 로봇 공학 분야에서 최첨단 기술의 잠재적 응용 분야를 탐구하는 데 관심을 표명합니다.

탐사 중 성능을 향상시키기 위해 팀은 스팟이 마주치게 될 방의 개요와 용도에 대한 간결한 설명을 제공했습니다. 이 정보는 Spot의 자체 센서가 수집한 시각적 입력과 결합되었으며, 이후 ‘시각적 질문 답변’ 알고리즘을 사용하여 처리되었습니다. 이 접근 방식의 목표는 로봇의 주변 환경에 대한 심층적인 이해를 바탕으로 보다 상세하고 유익한 구두 응답을 제공하는 것입니다.

이 비디오는 명령에 따라 다양한 페르소나를 구현하는 Spot의 놀라운 능력을 보여줍니다. 예를 들어, 처음에는 세련된 영국 집사의 모습으로 등장했다가 나중에는 유쾌하게 비꼬는 태도로 변하는 모습을 볼 수 있습니다. 또한 셰익스피어 극작가의 묘사는 특히 주목할 만합니다.

클링겐스미스는 시각 정보에 대한 자신의 내러티브와 관점을 완벽하게 통합하여 독특하고 복잡한 페르소나를 생성하는 AI의 능력에 놀라움을 금치 못했습니다. 그 결과 놀라운 수준의 창의성과 적응력을 보여줬습니다.

소프트웨어 엔지니어는 스팟의 특정 반응에 놀라움을 표했는데, 예를 들어 스팟이 자신의 조상을 밝혀달라고 요청하자 로봇이 Boston Dynamics의 오토메이션 컬렉션 내에서 자신의 초기 반복을 안내하는 식이었습니다.

클링엔스미스는 인공지능을 통해 로봇이 단순히 미리 정해진 명령을 실행하는 데 그치지 않고 주변 환경에서 수행할 수 있는 잠재적 행동을 이해하는 미래를 상상합니다. 클링엔스미스의 말에 따르면 이러한 기능은 예상치 못한 애플리케이션에 유용하게 사용될 수 있습니다.

인간 여행 가이드는 아직 걱정할 필요는 없지만, 클링엔스미스 AI 챗봇은 여전히 무언가를 지어내는 경향(“환각"으로 알려진)이 있으며, 이는 박물관과 같은 곳에서 일어나고 싶지 않은 일이라고 말했습니다.

다른 사람이 지적한 것처럼 문제의 개인은 온라인 연결이 중단되는 데 취약합니다.