놀라운 정확도로 인간의 행동을 예측하는 MIT의 새로운 AI 모델
매사추세츠 공과대학(MIT)과 워싱턴 대학교의 연구진은 계산의 한계를 고려하여 기업의 선택 기반 행동을 시뮬레이션하는 혁신적인 접근 방식을 고안했습니다. 과거 패턴을 기반으로 향후 행동을 예측할 수 있는 이 모델은 판단과 의사결정 과정에서 인간의 불규칙성을 이해하고 이에 적응함으로써 인공지능과 인간의 시너지를 높이기 위한 것입니다.
결정되지 않은 목표를 추구할 때 차선의 성과를 보이는 인간과 인공지능 개체의 행동을 예측하기 위해 새로운 방법론을 사용할 수 있습니다.
MIT와 여러 연구자들은 계산상의 한계로 인해 인간이나 인공지능 개체가 보이는 비합리적이거나 차선의 행동을 포괄하는 이론적 구조를 공식화했습니다. 이 방법론은 체스 대회의 맥락에서 개체의 향후 행동을 예측할 수 있는 잠재력을 가지고 있습니다.
인공지능 시스템이 개인과 생산적으로 상호 작용하기 위해서는 인간의 행동을 포괄적으로 표현하는 형태의 효과적인 기반을 갖추는 것이 필수적입니다. 그러나 사람들은 이러한 프로세스에 참여할 때 종종 최적의 의사 결정 경향을 보이지 않는 경우가 많습니다.
특정 상황의 내재적 복잡성은 합리적 의사결정 과정에 극복할 수 없는 난관을 제시할 수 있습니다. 따라서 아무리 유능하고 경험이 풍부한 사람이라도 계산 능력의 한계로 인해 특정 문제에 대한 최적의 해결책을 도출하는 데 오랜 시간을 할애할 수 없습니다.
새로운 모델링 접근법의 개발
매사추세츠 공과대학(MIT)과 워싱턴 대학교의 연구원들은 문제를 효과적으로 해결하는 능력을 방해할 수 있는 잠재적인 미확인 계산 한계를 고려하여 인간이든 인공이든 개체의 행동을 표현하는 방법론을 고안해냈습니다.
제안된 방법을 사용하면 제한된 수의 과거 행동을 관찰하여 에이전트의 계산 한계를 결정할 수 있습니다. “추론 예산"이라고 하는 이 정보는 해당 에이전트의 후속 행동을 예측하는 데 활용될 수 있습니다.
실제 적용 및 모델 검증
최근 논문에서 저자는 체스 대국에서 과거 궤적을 기반으로 개인의 탐색 목표를 추출하고 플레이어의 향후 기동을 예측할 수 있는 접근법을 제시합니다.이 방법은 이러한 선택 과정을 모델링하는 데 널리 활용되는 다른 전략을 능가하거나 동등합니다.
이 혁신적인 접근 방식은 연구자들이 인공지능에 인간의 행동을 더 깊이 이해할 수 있는 능력을 부여하여 인공지능이 인간과 효과적으로 상호 작용할 수 있는 능력을 향상시킬 수 있는 잠재력을 가지고 있습니다. 이 방법은 사람의 행동을 파악하고 그로부터 의도를 추론함으로써 AI 비서의 유용성을 크게 향상시킬 수 있으며, 이 주제에 관한 중요한 논문의 수석 연구원이자 유망한 EECS 대학원생인 아툴 폴 제이콥이 언급한 바와 같이, 이 방법은 AI 비서의 유용성을 크게 향상시킬 수 있습니다.
인간에게 의미 있는 지원을 제공할 수 있는 인공지능 시스템을 개발하려면 인간의 행동을 이해하고 예측하는 것이 중요합니다. 인공지능 에이전트는 과거의 행동 패턴을 관찰함으로써 잠재적인 오류나 인간 협력자가 어려움을 겪을 수 있는 영역을 파악하고 그에 따라 대체 접근법을 제안하거나 자체 성능을 조정할 수 있습니다. 따라서 인간의 행동을 정확하게 모델링하는 능력은 인간의 능력을 효과적으로 지원하고 향상시키는 AI 어시스턴트를 만드는 데 필수적입니다.
제이콥은 워싱턴 대학교의 조교수인 아비셰크 굽타, 전기공학 및 컴퓨터 과학 부교수이자 컴퓨터 과학 및 인공지능 연구소(CSAIL)의 회원인 제이콥 안드레아스와 협력하여 이 논문을 작성했습니다. 이들의 연구는 곧 개최될 학습 표현에 관한 국제 컨퍼런스에서 소개될 예정입니다.
행동 모델링
연구자들은 수년 동안 인간 행동의 계산적 표현을 개발하는 데 상당한 노력을 기울여 왔습니다. 이러한 노력에서 널리 채택된 전략은 모델에 무작위성을 통합하는 것이었는데, 그 결과 가상 개체가 최적의 행동 방침을 선택하지 못하는 경우가 종종 발생했습니다. 이 접근 방식은 정확한 의사결정을 보다 현실적인 묘사로 대체하여 선택 시 약 95%의 경우 성공하는 개인을 묘사합니다.
이러한 접근 방식은 인간이 종종 일관성 없는 방식으로 비최적 행동을 보인다는 현실을 무시할 수 있습니다.
매사추세츠 공과대학(MIT)의 연구진은 최적의 선택을 할 수 없는 상황에서 목표를 고안하고 추론하는 방법을 추가로 탐구했습니다.
체스 선수에 대한 이전 연구에서 영감을 얻은 Jacob과 그의 동료들은 관찰된 패턴에 기반한 모델을 개발했습니다. 특히, 이들은 단순한 결정을 내릴수록 플레이어의 숙고 시간이 줄어드는 반면, 강자는 어려운 게임에서 복잡한 선택을 고민하는 데 더 많은 시간을 소비한다는 사실을 발견했습니다.
제이콥의 관점에 따르면 궁극적으로 개인이 특정 이슈에 대해 고민하는 정도가 인간 행동의 신뢰할 만한 지표로 작용한다는 것이 관찰되었습니다.
연구진은 개인의 이전 행동을 기반으로 개인의 미래 사고 능력을 추론할 수 있는 방법론을 개발했으며, 이후 이 데이터를 활용하여 대상자의 의사 결정 과정을 종합적으로 나타낼 수 있는 방법을 개발했습니다.
체스 게임과 같은 특정 시나리오를 조사하기 위해 이 연구자들은 특정 기간 동안 작동하는 미리 정해진 계산 프로세스를 구현합니다. 이를 통해 알고리즘이 실행되는 동안 생성된 선택지를 분석하고 평가할 수 있습니다.
다중 에이전트 시스템을 평가하기 위해 제안된 방법에는 동일한 문제를 해결하려는 가상의 에이전트의 의사 결정 프로세스와 비교하는 것이 포함됩니다. 이를 통해 각 개별 에이전트가 취하는 행동이 시스템 전체의 전체 목표와 일치하는지 확인하고자 합니다. 또한 이 접근 방식을 통해 연구자들은 에이전트의 의사 결정 프로세스가 고장 나거나 의도된 행동 과정에서 벗어난 시점을 정확히 찾아낼 수 있습니다.
이 정보를 기반으로 모델은 에이전트가 주어진 문제를 해결하는 데 할당할 시간을 나타내는 에이전트의 계획 범위를 추정할 수 있습니다. 이 추정을 활용하여 모델은 에이전트가 비슷한 딜레마를 해결할 때 어떻게 행동할지 예측할 수 있습니다.
해석 가능한 솔루션
이 접근 방식은 조사자가 추가적인 노력 없이도 문제 해결 계획에 의해 실행된 선택에 대한 포괄적인 통찰력을 얻을 수 있기 때문에 효율성이 높습니다. 또한 이 패러다임은 특정 알고리즘 범주를 통해 해결할 수 있는 모든 문제를 포함하도록 확장할 수 있습니다.
추론 예산에서 저를 놀라게 한 주목할 만한 측면 중 하나는 해석 가능성입니다. 기본적으로 더 어려운 문제일수록 더 많은 준비가 필요하거나 강력한 성격을 가지려면 더 긴 계획이 수반된다는 것을 시사합니다. 처음에는 제이콥이 말한 것처럼 우리 알고리즘이 이러한 패턴을 유기적으로 식별할 수 있을지 의구심이 들었습니다.
즉, 이전 궤적을 기반으로 탐색 목표 추출, 언어적 신호에서 의사 전달 의도 파악, 인간 대 인간 체스 대국에서 미래 기동 예측 등이 그것입니다.
연구진이 사용한 조사 접근 방식은 모든 실험에서 일반적인 옵션보다 우월한 것으로 나타났습니다.또한 연구진이 개발한 인간 행동 모델은 체스 대회의 숙련도 및 과제 복잡도 평가와 효과적으로 상관관계가 있는 것으로 관찰되었습니다.
앞으로의 목표는 로봇 애플리케이션에 널리 사용되는 방법론인 강화 학습을 비롯한 다양한 분야의 의사결정 절차를 시뮬레이션하는 데 이 전략을 활용하는 것입니다. 궁극적으로는 이러한 연구 결과를 확장하여 보다 유능한 인공지능 파트너를 만든다는 중요한 목표를 향해 계속 노력하고자 합니다.
참조: “잠재 추론 예산으로 제한적으로 합리적인 에이전트 모델링”, Athul Paul Jacob, Abhishek Gupta 및 Jacob Andreas, ICLR 2024.
OpenReview
이 프로젝트는 MIT 슈바르츠만 전산대학의 증강 및 생산성을 위한 인공 지능 프로그램과 국립과학재단으로부터 자금을 지원받았습니다.