CancerGPT를 만나보세요: 대규모 언어 모델을 사용하여 특정 조직에서 약물 쌍의 시너지를 몇 번의 촬영으로 예측하는 제안된 모델
인공 지능의 최신 발전은 작업별 훈련 없이도 여러 다운스트림 작업을 수행할 수 있는 “제너럴리스트” 모델이라고도 하는 기초 모델에 의존합니다. 이러한 모델의 한 가지 예로 기존 AI 모델을 크게 개선한 사전 학습된 대규모 언어 모델인 GPT-3 및 GPT-4가 있습니다. 이러한 모델은 소수 학습 또는 제로 샷 학습을 사용하여 지식을 습득하고 명시적으로 학습되지 않은 새로운 작업에 적용할 수 있습니다. 또한 이러한 모델이 학습 데이터 내에 암시적으로 존재하는 작업을 통해 학습할 수 있는 멀티태스크 학습은 다양한 작업을 효과적으로 수행할 수 있는 능력에 중요한 역할을 합니다.
유한책임의료(LLM)는 컴퓨터 비전, 로봇 공학, 자연어 처리 등 다양한 영역에서 소수점 학습에 능숙함을 보여 왔지만, 생물학과 같은 복잡한 분야에 대한 적용 가능성은 아직 종합적으로 평가되어야 할 과제입니다. 관찰되지 않은 생화학 반응을 추론하기 위해서는 참여 개체와 이를 뒷받침하는 생물학적 시스템에 대한 이해가 필수적입니다. 대부분의 관련 정보는 자유 텍스트 형식으로 제공되어 LLM을 훈련하는 데 활용할 수 있는 반면, 구조화된 데이터베이스에는 소량의 데이터만 포함되어 있습니다. 텍사스 대학교, 매사추세츠 애머스트 대학교, 텍사스 대학교 보건 과학 센터의 학자들은 구조화되지 않은 문헌에서 사전 지식을 추출하는 LLM이 혁신적인 접근 방식이 될 수 있다고 제안합니다.
사전 탐색이 제한된 새로운 암 유형에서 약물 쌍의 시너지 효과를 예측하는 것은 몇 샷의 생물학적 예측에서 엄청난 도전 과제를 제시합니다. 암, 감염성 질환, 신경계 질환과 같은 난치성 질환의 관리에서 병용 요법의 활용이 보편화되었으며, 이는 종종 단독 요법에 비해 향상된 치료 결과로 이어집니다. 따라서 약물 발견 및 개발 영역에서 약물 쌍의 시너지 효과를 예측하는 데 더 많은 관심이 집중되고 있습니다. 그러나 가능한 조합의 수가 방대하고 기본 생물학적 과정의 복잡한 특성으로 인해 약물 쌍의 시너지를 정확하게 예측하는 것은 여전히 어려운 작업입니다.
약물 쌍의 시너지 잠재력을 예측하기 위해 머신 러닝을 주로 활용하는 여러 가지 계산 방법이 고안되었습니다. 이러한 기법은 다양한 약물 조합에 대한 결과를 산출하는 대규모 체외 실험 데이터 세트에 의존합니다. 머신 러닝 알고리즘을 훈련하기 위해 이러한 데이터 세트를 사용하여 패턴을 식별하고 테스트되지 않은 약물 쌍의 시너지 가능성을 예측할 수 있습니다. 그러나 특정 조직 유형, 특히 뼈와 연조직의 경우 실험 데이터에 대한 액세스가 제한됩니다.반대로, 사용 가능한 대부분의 데이터는 유방암과 폐암과 같은 특정 조직 내의 일반적인 암 형태에 초점을 맞추고 있습니다. 이러한 훈련 데이터의 부족은 이러한 조직에서 세포주를 확보하는 과정이 까다롭고 비용이 많이 들기 때문입니다. 따라서 대규모 머신 러닝 모델에는
신체 내 여러 유형의 세포 간의 시너지 효과에 대한 이전 연구에서는 생물학적 및 세포 수준에서의 중요한 차이를 고려하지 않았으며, 대신 상호 작용 방식에 대한 일반적인 가정에 의존했습니다. 최근의 연구에서는 유전적 또는 화학적 프로필과 같은 보다 복잡한 데이터를 사용하여 서로 다른 조직 간의 상호 작용을 더 잘 이해함으로써 이러한 한계를 극복하려고 노력했습니다. 그러나 이러한 접근 방식은 충분한 데이터가 있는 조직에 적용될 때만 효과적이며, 각 조직 유형의 고유한 특징을 정확하게 포착할 수 있는 모델을 개발하기 위해서는 추가 연구가 필요합니다. 이 연구의 목적은 특히 암의 맥락에서 다양한 유형의 세포와 조직 간의 복잡한 관계에 대한 이해를 향상시킬 수 있는 방법을 모색하는 것입니다.
생물학적 개체에 관한 예후 데이터를 문헌 자료에서 수작업으로 수집하는 것은 매우 힘든 작업일 수 있습니다. 이러한 한계를 극복하기 위해 언어 학습 모델(LLM)에 저장된 이전 연구의 아카이브된 과학 정보를 활용하는 혁신적인 접근 방식을 사용합니다. 예측 작업을 자연어 추론 문제로 변환하고 LLM에 내장된 지식을 활용하여 몇 가지 약물 쌍 시너지 예측 모델을 개발했습니다. 실험 결과, 이 LLM 기반 소수 샷 예측 모델은 대부분의 경우 강력한 표 형식 예측 모델보다 성능이 뛰어났으며, 제로 샷 설정에서도 놀라운 정확도를 달성했습니다. 가장 까다로운 생물학적 예측 작업 중 하나에서 이 탁월한 소수 샷 예측 성능은 광범위한 생물 의학
논문 을 확인하십시오. 최신 AI 연구 뉴스, 멋진 AI 프로젝트 등을 공유하는 20만 명 이상의 ML 서브 레딧, Discord 채널, 이메일 뉴스레터에 가입하는 것도 잊지 마세요. 위의 글과 관련하여 궁금한 점이 있거나 누락된 내용이 있으면 언제든지 이메일을 보내주세요.
운영을 개선하고 성능을 최적화하는 혁신적인 솔루션을 탐색하고 발견할 수 있는 AI 도구 클럽에서 100개가 넘는 다양한 인공 지능 도구 컬렉션을 살펴보세요.
스토리버드.ai의 최신 기능 개선으로 사용자가 특정 프롬프트를 입력하여 시각적으로 매력적인 스토리를 만들 수 있는 놀라운 기능이 추가되었습니다.이 혁신적인 도구를 살펴보고 싶으시다면 제공된 링크(후원)를 클릭하세요.