Contents

컬럼비아 대학과 딥마인드, 트랜스포머 기반 모델을 사용하여 일반 부품 조립 계획 개선

Contents

시각적 공간 추론을 활용하여 새로운 물체를 조립할 수 있는 자율 로봇 시스템은 광범위한 실제 응용 분야에서 상당한 잠재력을 가지고 있습니다. 부품 조립 분야에서 급속한 발전이 있었지만, 현재의 방법은 여전히 미리 정해진 목표나 잘 알려진 분류에 국한되어 있습니다.

앞서 언급한 제약을 해결하기 위해 최근 발간된 “일반 부품 조립 계획"이라는 제목의 논문에서는 컬럼비아 대학과 구글 딥마인드 간의 공동 연구 노력을 소개하며 일반 부품 조립 트랜스포머(GPAT)로 알려진 새로운 트랜스포머 기반 접근법의 활용을 제안하고 있습니다. 이 혁신적인 방법론은 뛰어난 일반화 기능을 갖추고 있어 보이지 않는 광범위한 대상 구성과 구성 요소를 효율적으로 생성할 수 있습니다.

/images/columbia-university-deepmind-enhance-general-part-assembly-planning-using-a-transformer-based-model.png

저자들은 다음과 같은 내용으로 구성된 주요 제출물에 대한 간결한 개요를 제공합니다:

보이지 않는 부품으로 새로운 표적을 구축하는 능력을 연구하기 위해 일반 부품 조립 과제를 제안합니다. 우리는 일반 부품 조립의 계획 문제를 목표 조건부 모양 재배열 문제로 다루며, 부품 조립을 “개방형 어휘”(즉, 부품 어휘) 목표 객체 세분화 과제로 취급합니다. 새롭고 다양한 대상 및 부품 모양으로 일반화하도록 훈련할 수 있는 어셈블리 계획용 일반 부품 어셈블리 트랜스포머(GPAT)를 소개합니다. /images/columbia-university-deepmind-enhance-general-part-assembly-planning-using-a-transformer-based-model-1.png

먼저 타겟 포인트 클라우드를 GPAT(General Part Assembly Transformer)를 사용하여 타겟을 변형된 부품의 특정 세부 사항을 나타내는 작은 세그먼트로 분해하고, 두 번째로 포즈 추정 단계에서 분할된 타겟과 입력 포인트 클라우드를 사용하여 각 부품의 최종 6-DoF(6-degree of freedom) 포즈를 결정합니다.

/images/columbia-university-deepmind-enhance-general-part-assembly-planning-using-a-transformer-based-model-2.png /images/columbia-university-deepmind-enhance-general-part-assembly-planning-using-a-transformer-based-model-3.png

실험 분석에는 방대한 3차원 물체 컬렉션으로 구성된 PartNet과 실제 데이터의 두 가지 포괄적인 데이터 세트에 대해 일반화된 병렬 적대 훈련(GPAT)을 테스트하는 것이 포함되었습니다. 다양한 일반화 시나리오에 대한 엄격한 평가를 통해 GPAT가 알려지지 않은 이질적인 타겟 및 부품 구성을 놀라운 정확도로 추정하는 탁월한 능력을 보여줌으로써 전반적으로 인상적인 성공률을 기록하는 것을 관찰했습니다.

이 연구는 GPAT의 재생 능력을 입증했으며, 연구팀은 이번 연구 결과가 비전 가이드 종합 로봇 조립 시스템을 구축하는 데 상당한 잠재력을 가지고 있다고 확신하고 있습니다.

논문 일반 부품 조립 계획 arXiv .