메타의 얀 르쿤, 제너레이티브 AI를 버리고 싶어하다
인공지능 분야의 저명인사이자 기술 선구자인 얀 르쿤 박사는 기존의 생성형 인공지능 접근 방식을 뛰어넘어 인공 일반 인공지능을 달성할 수 있는 기계를 개발하여 인공지능 비서가 인간과 동등한 인지 능력을 갖출 수 있도록 하는 것이 그의 야망이라고 말합니다.
세계 AI 칸 페스티벌에서 얀 르쿤은 현재 머신러닝이 우리 주변 세계의 복잡성을 이해하지 못한다는 한계가 있다며 불만을 표출했습니다. 인공 지능이 더 지능적이 되려면 기계가 우리 환경의 복잡성을 파악하는 동시에 정보를 유지하고 논리적 결론을 도출하며 과거 경험을 바탕으로 정보에 입각한 결정을 내릴 수 있는 능력을 갖춰야 합니다.
제 생각에 인공지능의 향후 궤적은 텍스트 처리 영역 내에서만 기능하고 다른 영역이나 애플리케이션으로 확장할 수 없는 능력에 기반한 것으로 보입니다.
르쿤은 생성형 AI보다 공동 임베딩 아키텍처를 선호하며, 이러한 선호는 단순히 텍스트를 생성하는 대신 누락된 정보를 예측하는 기능을 갖춘 메타 최초의 JEPA 기반 시스템인 I-JEPA에 대한 그의 작업에 반영되어 있습니다.
텍스트를 예측하는 작업은 간단해 보일 수 있지만, 복잡한 현실 세계에 적용하는 것은 복잡한 세부 사항이 많기 때문에 상당한 어려움이 따릅니다.
칸 영화제에서 발표한 얀 르쿤의 발언에 따르면, 앞으로 공동 임베딩 및 예측 분석(JEPA) 프레임워크에 기반한 AI 시스템이 더 많이 도입될 것으로 예상됩니다. 메타의 연구팀은 정지 이미지뿐만 아니라 동영상 콘텐츠까지 포함하도록 JEPA의 기능을 확장하는 데 주력하고 있는 것으로 알려졌습니다.
“I-JEPA는 아직 빅 데이터 세트에 대해 훈련되지 않았지만 잠재적으로 DINOv2를 압도할 수 있을 것으로 보입니다.” DINOv2 은 자가 지도 학습 기능을 갖춘 Meta의 컴퓨터 비전 모델입니다.
AGI는 AGI가 아닙니다
작년 칸 영화제에서 르쿤은 ChatGPT를 겨냥했습니다. 올해 행사에서 그는 인공 일반 지능(AGI)이라는 주제를 집중적으로 다루었습니다.
머신러닝 분야의 저명한 연구자인 얀 르쿤은 “특정 영역에서 뛰어난 능력을 가진 첨단 인공지능 시스템이라도 인간의 인지 능력 전체를 복제할 수는 없다는 사실을 인식하는 것이 중요합니다.“라고 말합니다. 그는 “개인으로서의 한계와 오류에도 불구하고 체스와 같은 복잡한 보드 게임과 같은 특정 작업에서 우리를 능가할 수 있는 특수 컴퓨터 프로그램과 같은 기술을 이용할 수 있다는 사실을 인정해야 합니다.“라고 덧붙였습니다.
존경받는 튜링상 수상자는 인공 일반 지능(AGI)을 ‘고급 기계 지능’ 또는 ‘AMI’로 명명하는 대안적인 명칭을 제안했습니다.
새로운 사고 방식에 대한 르쿤의 제안은 중요한 진전을 이루었지만, 인공 정신 지능(AMI)의 실제 실현은 여전히 상당한 과제로 남아있었습니다. 딥러닝의 선구자인 르쿤은 AMI를 실현하려면 수십 년이 더 걸릴 것이라고 주장했습니다. 동시에 그는 인공 시스템이 결국 모든 영역에서 인간의 인지 능력을 능가할 수 있지만, 그러한 발전은 향후 10년 이내 또는 그 이후에는 이루어지지 않을 것이라고 주장했습니다.
그는 진보는 불가피하며 목표 실현에 더 가까워지는 발견의 순간이 있을 것이라고 인정했지만, 이 과정에서도 도전은 지속될 것으로 예상했습니다.
연사는 자율주행차 등의 예를 들며 현대 인공지능의 지능에 의문을 제기했습니다. 자율주행차는 광범위한 훈련에도 불구하고 아직 인간의 개입으로부터 완전한 독립을 의미하는 레벨 5의 자율성에 도달하지 못했다고 주장했습니다.
르쿤은 인간의 지능은 고도로 전문화되어 있고 비선형적으로 진행되며 서로 연결된 다양한 기술과 경험으로 구성되어 있기 때문에 측정하기 어려운 실체라고 가정했습니다.
르쿤의 관점에 따르면 대규모 언어 모델을 기반으로 하는 시스템이 인간과 동등한 수준의 인지 능력을 갖추기 위해서는 우리 주변 세계의 복잡성을 이해하고 탐색할 수 있도록 이러한 인공 지능 프레임워크를 가르치고 훈련하는 것이 필수적입니다.
실제로 인간이 가지고 있는 이해의 대부분은 언어적 의사소통이 아니라 현실과의 직접적인 만남에서 비롯됩니다. 우리는 다양한 상황에 노출되면서 인상을 형성하고 통찰력을 얻을 수 있으며, 이는 종종 어떤 언어적 교류보다 세상에 대한 우리의 인식에 더 큰 영향을 미칩니다.
인공 일반 지능(AGI)의 도래가 임박했다는 주장은 근거가 없을 수 있으므로 주의를 기울이는 것이 중요합니다. AGI의 개념은 여전히 지속적인 연구 및 개발의 주제이며, 그 시대가 가까워졌다고 주장하는 모든 주장은 회의적인 태도를 취해야 합니다.
4세 어린이가 LLM보다 똑똑하다
르쿤은 인공 지능 모델이 인간의 직접적인 입력 없이 자율적인 방법으로 환경에 대한 지식을 습득할 수 있도록 옹호했습니다.
현대 환경에서 널리 사용되는 인공 지능의 형태는 일반적으로 LLM이라고 하는 대규모 언어 모델로 구성됩니다.
즉, 어린이가 일생 동안 정보에 노출되는 양은 현존하는 모든 접근 가능한 텍스트로 학습된 대규모 언어 모델(LLM)이 활용하는 데이터의 양을 훨씬 능가합니다.
얀 르쿤의 기조연설에서 이전 정보를 바탕으로 미래의 행동을 예측하는 자동 회귀 모델도 비판에서 자유롭지 못했습니다. 메타 연구자는 이러한 시스템의 유용성을 인정하면서도 인간 이해의 극히 일부만을 포괄한다고 비판했습니다.
자동 회귀 모델은 수많은 적용 가능성을 제공하지만, 인간과 같은 지능을 달성한다는 측면에서는 주요 경로에서 우회하거나 우회하는 것을 의미합니다.
AI의 미래에 대한 그의 견해는 무엇인가요?
얀 르쿤이 제시한 미래 비전에서는 디지털화 영역에서 인간이 수행하는 모든 상호작용이 인공지능 비서에 의해 촉진되고 안내될 것입니다.
메타의 한 연구원이 예측한 미래의 인공지능 기반 비서는 메타의 혁신적인 레이밴 스마트 안경과 유사한 웨어러블 기기 형태의 첨단 하드웨어 기술을 통해 지원될 것으로 예상됩니다.
인간의 언어를 이해하고 생성할 수 있는 인공 지능 개발에는 상당한 진전이 있었지만, 현재의 능력과 진정한 지능적 행동 사이에는 상당한 격차가 남아 있습니다. 특히, 대부분의 대규모 언어 모델(LLM)에서 부족한 한 가지 중요한 측면은 효과적인 계획을 세울 수 없다는 점입니다. 크리스토퍼 매닝 박사는 작년 AI 컨퍼런스 기조연설에서 “우리가 진정으로 원하는 것은 세상을 이해할 수 있는 기계입니다… 기억하고, 추론하고, 계획할 수 있어야 합니다.“라고 말했듯이 말이죠. 따라서 AI 시스템이 기존의 패턴에 기반한 단순한 응답을 넘어 진정한 자율성을 달성하려면 연구자들은 이러한 모델 내에서 계획 능력을 향상시키는 데 집중해야 합니다.
미래의 인공지능 시스템이 의도한 목적을 효과적으로 달성하기 위해서는 다양한 언어, 문화, 관심사 기반의 다양성에 적응할 수 있는 역량을 갖춰야 한다는 것이 LeCun의 기대입니다.
이 야심찬 목표를 실현하려면 주로 미국이나 중국에 기반을 둔 몇몇 기업을 넘어 여러 산업, 지역 및 이해관계자들과 광범위하고 다양한 협력이 필요합니다.
미래의 인공지능 시스템은 인간 지식의 광범위한 축적을 포괄할 것으로 예상되며, 르쿤의 비유에 따르면 이러한 첨단 비서는 인터넷이나 위키피디아에 필적하는 유비쿼터스 플랫폼 역할을 하게 될 것입니다. AI 기술의 발전은 인간의 인지 능력을 증강하고 향상시킬 것으로 기대됩니다.
그는 AI가 위협이 될 수 있다는 생각에 놀라지 말라고 청중을 안심시키며, 그러한 결과를 제시하는 사람은 누구도 신뢰를 주어서는 안 된다고 단호하게 말했습니다.