인간으로부터 직접 작업을 학습할 수 있는 딥마인드의 새로운 AI
구글의 딥마인드는 사람의 지시를 통해 작업을 학습할 수 있는 인공지능 에이전트를 개발했습니다. 시간이 지남에 따라 이 인공지능 에이전트는 교사가 시범을 보인 행동을 복제할 수 있으며, 심지어 그러한 행동에 대한 기억을 유지할 수도 있습니다.
Nature에 실린 논문에서 연구자들은 이전에 수집한 인간 정보에 의존하지 않고 자체 생성된 데이터만을 활용하여 인공지능 모델을 훈련할 수 있는 문화 전파라는 방법론을 설명합니다.
딥마인드 연구진이 개발한 모방 학습은 인공지능의 기술 습득에 대한 새로운 접근 방식을 나타냅니다. 이 방법은 비디오 튜토리얼을 관찰하는 과정과 유사하며, AI는 교육 자료에서 얻은 지식을 관찰, 적용 및 보유함으로써 학습합니다.
인공적으로 구축된 가상 환경인 GoalCycle3D에서 AI 에이전트는 인간 사용자와의 사전 상호작용 없이도 사상 최초로 인간 강사가 시연하는 일련의 동작을 성공적으로 모방했습니다. 특히 이 시스템은 해당 분야의 전문가가 자리를 떠난 후에도 이러한 시연을 기억하는 능력이 지속되었습니다.
실제 적용
딥마인드의 획기적인 연구는 다양한 물체를 효율적으로 다루고 배치하는 등 복잡한 작업을 학습하는 능력을 향상시켜 로봇 공학 분야에 혁명을 일으킬 수 있는 잠재력을 가지고 있습니다. 또한 이 기술을 고객 서비스 시스템으로 확장하여 고객을 위해 개인화되고 동적으로 조정 가능한 지원을 가능하게 하는 고급 대화형 학습 기능을 강화할 수 있습니다.
관련 자료: 구글 딥마인드의 6단계 인공지능
딥마인드가 공개한 획기적인 발견은 특히 인간 데이터 수집과 관련된 높은 비용과 자연스러운 변동을 보이는 복잡한 작업과 관련된 상황에서 인공지능에 대한 이 혁신적인 접근법의 중요성을 강조합니다.
이 논문은 제안된 접근법의 또 다른 장점, 즉 개인의 프라이버시를 보호할 수 있는 능력을 강조합니다. 이는 기존 모델을 학습시키는 데 일반적으로 필요한 방대한 양의 개인 정보를 보유할 필요 없이 직접 관찰을 통해 실시간으로 학습할 수 있는 AI의 능력을 통해 달성할 수 있습니다.
이러한 인공지능 개발의 획기적인 발전 이전에는 대부분의 연구가 단발성 학습 능력을 고려하지 않고 단일 작업 중심의 모방 학습에 집중했습니다.여기에 소개된 혁신적인 접근 방식은 심층 강화 학습 방법론을 통해 가중치 구성이 개선된 신경망을 사용하는 에이전트 중심 프레임워크를 특징으로 합니다.
이 방법론의 구현은 딥마인드가 말한 바와 같이 인공 지능 개발의 틀 안에 문화적 진화 과정을 통합하는 데 있어 중요한 진전을 의미합니다.
이 새로운 접근 방식은 특정 장점을 보여주지만, 내재적인 제약이 없는 것은 아닙니다. 특히, AI 에이전트가 제한된 데이터에서 실수로 일반화할 가능성이 존재합니다. 또한 이 훈련 방식은 비교적 간단한 시나리오에 의존했기 때문에 다양한 상황에서 이 방법을 효과적으로 적용할 수 있는지 여부를 결정하기 위해서는 다양한 상황을 탐색하는 등 추가적인 조사가 필요합니다.