Contents

제미니: 독보적인 칩렛 가속기 숙달로 내일의 딥 뉴럴 네트워크 지평을 열다

Contents

점점 더 복잡해지는 문제를 해결하는 분야에서 심층 신경망의 확산으로 규모와 복잡성이 기하급수적으로 증가하고 있으며, 이에 따라 더 많은 연산 자원과 메모리 용량이 필요합니다. 이러한 요구를 충족하기 위해 칩렛 기술은 딥 뉴럴 네트워크 아키텍처를 구현할 때 성능 향상, 에너지 사용량 감소, 다양성 증가의 잠재력을 제공하며 기존의 모놀리식 칩을 대체할 수 있는 유망한 대안으로 떠오르고 있습니다.

칩렛 기술이 제공하는 잠재적 이점에도 불구하고 패키징 비용 증가와 고가의 다이 투 다이(D2D) 연결 등 몇 가지 과제가 있습니다. 따라서 확장 가능한 딥 뉴럴 네트워크(DNN) 칩렛 가속기의 개발을 촉진하기 위해서는 이 접근 방식의 장점을 효과적으로 활용하는 동시에 단점을 해결하는 것이 중요합니다.

대규모 DNN 칩렛 가속기를 위한 매핑 및 아키텍처 공동 탐색" 칭화대학교, 시안 자오퉁대학교, IIISCT, 상하이 인공지능 연구소 등 저명한 기관의 학자들로 구성된 다학제 연구팀은 대규모 심층신경망(DNN) 칩렛 가속기를 위해 특별히 설계된 아키텍처 및 매핑 기술을 공동으로 탐색하는 데 집중하는 제미니라는 독창적인 접근법을 도입했습니다. 이 새로운 방법으로 달성한 획기적인 결과는 성능과 에너지 효율성 측면에서 놀라운 향상을 보여주며, 평균 1.98배의 놀라운 성능 향상과 1.41배의 에너지 효율성 향상

/images/gemini-bridging-tomorrows-deep-neural-network-frontiers-with-unrivaled-chiplet-accelerator-mastery.png

연구자들은 칩렛 기술에 내재된 두 가지 주요 장애물을 정확히 찾아냈습니다. 아키텍처와 관련하여 가장 적합한 칩렛 입자 크기를 결정하는 것이 핵심 문제로, 제조 효율성을 높이기 위해 여러 개의 작은 칩렛을 활용하는 것과 비용 관리를 위해 더 적은 수의 큰 칩렛을 채택하는 것 사이에서 미세하게 조정된 균형이 필요합니다. DNN 매핑의 경우, 칩렛 기술이 제공하는 방대한 범위로 인해 고가의 D2D 연결이 필요하다는 어려움이 있습니다.

/images/gemini-bridging-tomorrows-deep-neural-network-frontiers-with-unrivaled-chiplet-accelerator-mastery-1.png

멀티코어 칩렛 심층신경망(DNN) 추론 가속기에서 저전력 공간 분할 다중 프로세스(LP SPM) 방식을 관리하는 것과 관련된 복잡한 문제를 해결하기 위해 우리 팀은 표현에 대한 새로운 레이어 중심 접근 방식을 개발했습니다. 저전력 매핑의 최적화 가능성을 개략적으로 설명함으로써 상당한 개선 가능성을 발견했습니다.이 혁신적인 기술과 적응형 하드웨어 청사진을 기반으로 광범위한 DNN 칩렛 가속 시스템을 위한 매핑 전략 조사 및 아키텍처 비용 평가를 모두 포함하는 포괄적인 탐색 프레임워크인 Gemini를 소개합니다.

/images/gemini-bridging-tomorrows-deep-neural-network-frontiers-with-unrivaled-chiplet-accelerator-mastery-2.png

매핑 엔진은 인코딩 프로세스에 의해 묘사된 광활한 공간을 효과적으로 통과하기 위해 신중하게 설계된 5개의 연산자를 통합하는 시뮬레이션 어닐링(SA) 알고리즘을 활용하여 궁극적으로 값비싼 D2D 통신의 필요성을 줄입니다. 동시에 금전적 비용 평가기는 서로 다른 아키텍처 특성을 가진 다양한 가속기 구성과 관련된 재정적 영향을 평가합니다.

/images/gemini-bridging-tomorrows-deep-neural-network-frontiers-with-unrivaled-chiplet-accelerator-mastery-3.png

연구원들은 실험적 조사에서 제미니 하드웨어의 최적화된 조인트 설계 및 구성과 탱그램 스마트 프로세싱 모듈(SPM)을 활용한 심바의 하드웨어를 대조했습니다. 그 결과 제미니는 여러 개의 심층 신경망(DNN)과 다양한 배치 크기에서 평균 1.98배의 성능 향상과 1.41배의 에너지 효율 향상을 보여줬습니다. 또한 이러한 성능 향상과 관련된 재정적 지출은 14.3%의 미미한 증가에 그쳤습니다.

본 연구는 심층 신경망(DNN) 추론 가속기 내에서 저전력 희소 행렬 곱셈(LP SPM)과 관련된 최적화 환경을 처음으로 포괄적으로 설명함으로써 이 분야의 중요한 이정표가 되었습니다. 혁신적인 선구자인 Gemini 프레임워크는 에너지 소비, 계산 효율성, 재정 건전성 등의 요소를 신중하게 고려하면서 방대한 규모의 DNN 칩렛 가속기에 걸쳐 아키텍처 설계와 매핑 전략 간의 상호 작용을 동시에 조사함으로써 기존의 경계를 뛰어넘습니다.

결론적으로, 연구팀은 심층 신경망 추론 가속의 맥락에서 단일 칩렛을 사용하여 여러 특수 프로세서를 지원하는 것을 고려할 때 Gemini 프레임워크가 안내하는 신중한 설계 원칙을 통합하는 것이 잠재적인 이점이 있음을 강조합니다. 이러한 접근 방식은 끊임없이 발전하는 기술 환경에서 창의적인 솔루션을 육성하고 전반적인 성능을 향상시킬 수 있는 가능성을 제시합니다.

논문 제미니: 대규모 DNN 칩렛 가속기를 위한 매핑 및 아키텍처 공동 탐색 arXiv .