Contents

통계적 관점에서 알고리즘 학습 문제로 프롬프트 기반 인컨텍스트 학습을 제시하는 새로운 인공 지능(AI) 연구 접근법

Contents

상황 내 학습에서의 일반화 및 암시적 모델 선택"을 통해 상황 내 학습 문제를 알고리즘 학습 문제로 공식화했습니다. 이들은 추론 시점에 다른 목표 알고리즘을 구현하도록 훈련하여 전문화할 수 있는 학습 알고리즘으로 트랜스포머를 사용했습니다. 이 논문에서는 트랜스포머를 통해 인컨텍스트 학습의 통계적 측면을 살펴보고 이론적 예측을 검증하기 위해 수치적 평가를 수행했습니다.

이 연구에서는 두 가지 상황을 조사했습니다. 첫 번째 시나리오에서는 프롬프트가 독립적이고 동일하게 분산된 일련의 입력-라벨 쌍에 의해 생성되었습니다. 반대로 두 번째 상황에서는 프롬프트가 동적 시스템의 궤적으로 나타났는데, 이 궤적은 후속 상태가 이전 상태에 따라 달라지며, xm+1 = f(xm) + 잡음으로 나타났습니다.

이에 비추어 볼 때, 그러한 모델이 훈련되는 과정에 대해 문의할 수 있습니다.

ICL의 훈련 단계에서는 여러 작업(T)이 각각의 데이터 분포 }와 연관됩니다. 각 작업은 해당 분포에서 독립적인 훈련 시퀀스 St를 샘플링하고 동일한 시퀀스의 값 x와 함께 St의 하위 시퀀스를 전달하여 x에 대한 예측을 생성합니다. 이 프로세스는 일반적인 메타 학습 프레임워크를 따릅니다. 예측에 따라 손실이 최소화됩니다. ICL 학습의 기본 아이디어는 주어진 작업에 가장 적합한 알고리즘을 찾는 것입니다.

입력 일관성 손실(ICL)에 대한 한계 추정치를 설정하기 위해 연구원들은 알고리즘 안정성 영역에서 도출된 특정 안정성 조건을 활용했습니다. 프롬프트의 훈련 예제는 알고리즘의 후속 의사 결정 프로세스에 영향을 미칩니다. 따라서 이러한 입력 섭동을 해결하기 위해 입력 데이터에 특정 조건을 부과해야 했습니다. 이 문제에 대한 자세한 내용은 첨부된 백서를 참조하시기 바랍니다. 그림 7에 표시된 바와 같이, 제시된 실험 결과는 사용된 학습 알고리즘(이 경우 트랜스포머)의 안정성을 평가합니다.

/images/a-new-artificial-intelligence-ai-research-approach-presents-prompt-based-in-context-learning-as-an-algorithm-learning-problem-from-a-statistical-perspective.png

앞서 언급한 관찰 결과는 멀티태스크 학습의 맥락에서 샘플 크기 ’n’ 또는 작업당 시퀀스 수 ‘M’을 늘리면 시스템이 안정적이고 동적인 경우를 포함하여 오류의 위험을 효과적으로 완화할 수 있음을 시사합니다.

수치 테스트를 통해 위에 명시된 한계를 살펴봅시다.

모든 실험에 사용된 아키텍처 프레임워크는 12개의 레이어, 8개의 주의 헤드, 256차원의 임베딩 공간으로 구성됩니다. 이 아키텍처는 회귀 및 선형 동적 작업 모두에 적용되었습니다.

그림 2는 선형 회귀의 성능을 (a)와 (b)로 표시된 두 개의 그래프를 통해 보여줍니다. 빨간색 선은 컨텍스트 내 학습의 결과를 나타내고, 녹색 선은 최소 제곱 방법을 사용한 결과를 나타냅니다. 두 결과 모두 검은색 점선으로 표시된 최적의 릿지 또는 가중치 솔루션과 일치합니다. 이러한 결과는 “학습 작업 선행"이라고도 하는 당면 과제에 따라 적절한 모델을 선택하는 트랜스포머의 기능을 뒷받침합니다. 또한 그림 6은 다양한 주문 크기 H에 대한 컨텍스트 내 학습과 최소제곱 결과를 비교한 것입니다. 결과에 따르면 컨텍스트 내 학습이 주문 크기에 관계없이 최소제곱 방법보다 일관되게 더 나은 성능을 보입니다.

요약하면, 실험 결과는 가설을 뒷받침하는 것으로 밝혀져 이론적 예측을 검증할 수 있었습니다. 추가 연구와 관련하여 조사할 가치가 있는 몇 가지 흥미로운 방법이 있습니다.

멀티태스크 학습(MTL)과 관련된 위험의 경계를 특정 작업으로 제한할 수 있으며, 제한할 수 있다면 어떻게 제어할 수 있나요?

완전 동적 시스템을 관찰하고 분석하여 얻은 결과를 강화 학습에 활용되는 시스템과 같은 더 광범위한 종류의 시스템에 적용할 수 있나요?

관찰 결과에 따르면, 이전 위험은 전적으로 MTL 작업의 특성과 복잡성에 의해 영향을 받으며 모델의 복잡성과는 관련이 없는 것으로 추론되었으며, 이는 트랜스포머의 귀납적 편향과 트랜스포머가 학습하는 알고리즘 유형에 대한 추가 탐색이 필요합니다.

논문 를 확인하세요. 이 연구에 대한 모든 크레딧은 이 프로젝트의 연구진에게 있습니다. 또한 최신 AI 연구 뉴스, 멋진 AI 프로젝트 등을 공유하는 Reddit 페이지, Discord 채널, 이메일 뉴스레터에 가입하는 것을 잊지 마세요.

StoryBird.ai의 최신 발전으로 몇 가지 놀라운 기능이 도입되어 사용자가 주어진 프롬프트에 따라 일러스트 내러티브를 만들 수 있게 되었습니다. 이 혁신에 대해 자세히 알아보고 싶으시다면 편의를 위해 제공된 링크를 방문하시기 바랍니다. 이 콘텐츠는 후원을 받았습니다.