AI 기반 위험 예측을 통한 췌장암 조기 개입의 새로운 희망
췌장암에 대한 최초의 기록은 18세기로 거슬러 올라갑니다. 그 이후로 연구자들은 이 회피하기 어렵고 치명적인 질병을 이해하기 위해 길고 고된 여정을 시작했습니다. 안타깝게도 췌장은 복강 내에 깊숙이 숨어 있기 때문에 조기에 발견하는 데 상당한 어려움이 있습니다.
베스 이스라엘 디코니스 메디컬 센터의 방사선 종양학과 직원 과학자 리머 아펠바움과 매사추세츠 공과대학교 컴퓨터 과학 및 인공 지능 연구소(CSAIL)의 연구진은 췌장암의 흔한 유형인 췌관 선암종 발병 위험이 높은 개인의 식별을 강화하는 것을 목표로 협력하고 있습니다. 이 연구자들은 미국 전역의 여러 기관의 전자 의료 기록을 통합한 연합 네트워크를 활용하여 초기 단계에서 PDAC를 감지할 수 있는 신뢰할 수 있고 널리 적용 가능한 머신러닝 모델을 만들고자 했습니다.
인공 신경망인 “PRISM"과 확률 추정을 위한 통계적 방법인 로지스틱 회귀 모델을 활용하여 기존 기법을 능가하는 성능을 보였습니다. 연구진이 비교한 결과, 기존 선별 가이드라인은 위험 임계값이 5배 이상 높은 PDAC 사례의 약 10%를 식별하는 반면, PRISM은 동일한 임계값에서 35%의 PDAC 사례를 검출할 수 있는 것으로 나타났습니다.
암 위험을 감지하는 데 AI를 사용하는 것은 새로운 현상이 아니며, 알고리즘은 유방 촬영 사진, 폐암에 대한 CT 스캔을 분석하고 세포진 검사 및 HPV 검사 분석을 지원하는 등 몇 가지 애플리케이션을 예로 들 수 있습니다. “PRISM 모델은 5백만 명 이상의 환자를 대상으로 한 광범위한 데이터베이스에서 개발 및 검증되어 이 분야의 대부분의 선행 연구 규모를 능가하는 것이 특징입니다.“라고 MIT CSAIL 소속 전기공학 및 컴퓨터과학(EECS) 박사 과정 학생이자 새로운 연구 을 요약한 eBioMedicine의 오픈 액세스 논문 의 제1저자인 카이 지아(Kai Jia) 박사는 말합니다.“이 모델은 일상적인 임상 및 실험실 데이터를 사용하여 예측을 수행하며, 미국 인구의 다양성은 일반적으로 미국의 일부 의료 센터와 같은 특정 지역에 국한된 다른 PDAC 모델에 비해 상당한 발전을 이루었습니다. 또한 훈련 과정에서 고유한 정규화 기술을 사용하여 모델의 일반화 가능성 및 해석 가능성을 향상시켰습니다.”
본 보고서는 암 위험 평가에 대한 이해를 높이기 위해 방대한 데이터 세트와 고급 계산 기술을 활용하는 효과적인 방법론을 설명합니다.“라고 하버드 의과대학의 저명한 교수이자 암 센터 소장 겸 베스 이스라엘 디코니스 의료센터의 혈액학 및 혈액 악성 종양 과장인 데이비드 아비건 박사는 이 연구에 직접 참여하지는 않았지만 의견을 피력했습니다. “이러한 접근 방식은 잠재적으로 악성 종양에 대한 높은 감수성을 보이는 개인을 정확히 찾아내어 표적화된 검사와 적시에 개입할 수 있는 혁신적인 전술을 제공할 수 있습니다.
프리즘적 관점
PRISM 프로젝트의 시작은 현대 진단 방법의 내재적 단점을 직접 경험한 데서 비롯된 것으로 약 6년 전으로 거슬러 올라갈 수 있습니다. 수석 저자이자 하버드 의대 강사이자 방사선 종양학자인 아펠바움 박사에 따르면, 췌장암 환자의 약 80~85%가 치료적 개입이 불가능한 단계에서 진단을 받는다고 합니다. 이 경험은 전자 의료 기록(EHR)에 포함된 방대한 정보를 탐색하는 원동력이 되었습니다.
CSAIL 그룹은 Appelbaum과의 긴밀한 협력을 통해 문제의 의료 및 기계 학습 구성 요소를 더 깊이 이해하여 궁극적으로 매우 정확하고 투명한 예측 모델을 만들 수 있었습니다. “우리의 가설은 전자 건강 기록(EHR) 데이터에 췌장암의 미묘한 지표(조기 경고 신호)가 포함되어 있을 수 있다는 것이었습니다.“라고 연구자는 설명합니다. 이러한 모델을 구축할 때 연합 EHR 네트워크를 활용하기로 한 결정은 의료 시스템 내에서 위험 평가 도구를 구현할 수 있는 확장 가능한 솔루션을 개발할 수 있게 해 주었습니다.“라고 설명합니다.
PrismNN과 PrismLR 모델 모두 환자 인구통계학적 세부 정보, 임상 진단, 치료적 개입, 실험실 검사 결과를 포함하는 전자 건강 기록(EHR) 정보를 검사하여 췌관 선암종(PDAC)의 잠재적 위험을 추정합니다.인공 신경망을 활용하는 PrismNN은 나이, 과거 병력, 실험실 결과와 같은 데이터 요소에 존재하는 복잡한 패턴을 인식하여 PDAC 발생 가능성과 관련된 위험 지수를 산출할 수 있습니다. 반대로 PrismLR은 로지스틱 회귀를 사용하여 보다 간단한 분석을 통해 동일한 변수를 기반으로 PDAC 위험을 확률적으로 평가합니다. 이 두 가지를 종합하면
의료 전문가의 신뢰를 얻기 위한 핵심 요소는 업계에서 일반적으로 ‘해석 가능성’이라고 하는 복잡한 알고리즘을 이해하는 데 있습니다. 로지스틱 회귀 모델이 더 높은 투명성을 보여주지만, 최근의 획기적인 발전으로 심층 신경망의 기능에 대한 더 깊은 인사이트를 얻을 수 있게 되었습니다. 이러한 지식을 활용하여 저희 팀은 한 환자의 전자 건강 기록에서 수집한 방대한 잠재적 지표를 약 85개의 중요한 마커로 압축할 수 있었습니다. 놀랍게도 개인의 나이, 당뇨병 상태, 의사와의 상담 횟수 등 이러한 지표는 췌장암 발병 가능성에 대한 의사의 임상적 직관과 완벽하게 일치했습니다.
앞으로 나아갈 길
PRISM 모델은 큰 잠재력을 가지고 있지만, 그 효과는 지속적인 개발과 개선에 달려 있습니다. 현재 이 모델은 미국의 데이터에만 의존하고 있기 때문에 전 세계의 다양한 인구 집단에 폭넓게 적용하려면 맞춤화가 필요합니다. 향후 개선 사항에는 국제 데이터 세트를 통합하여 모델의 문화 간 관련성을 높이고 새로운 바이오마커를 추가로 통합하여 위험 예측의 정확성을 높이는 것이 포함됩니다.
향후 목표 중 하나는 일상적인 의료 환경 내에서 모델을 실제로 적용하는 것입니다. 우리의 궁극적인 목표는 이러한 모델이 기존 의료 시스템의 일부로 손쉽게 작동하여 환자 데이터를 효과적으로 처리하고 의료 전문가에게 추가적인 업무 부담 없이 잠재적 위험 요소를 알려주는 것입니다. 전자 건강 기록(EHR) 시스템과 함께 작동하는 통합 머신러닝 모델을 통해 의사에게 위험 환자에 대한 적시 경고를 제공함으로써 증상이 발생하기 전에도 선제적으로 개입할 수 있기를 희망합니다. 저희의 방법을 실제 상황에서 구현하여 모든 사람의 더 길고 건강한 삶을 증진하는 데 기여할 수 있다는 가능성에 대해 기대가 큽니다.
이 논문의 수석 저자인 Jia는 동료인 Applebaum, MIT EECS 교수이자 CSAIL 수석 연구원인 Martin Rinard와 함께 이 연구를 저술했습니다.연구에 참여한 연구원들은 MIT CSAIL에 재직하는 동안 방위고등연구계획국, 보잉, 국립과학재단, 아르노 연구소 등 다양한 출처로부터 지원을 받았습니다. 또한 TriNetX는 프로젝트에 필수적인 리소스를 제공했고, Prevent Cancer Foundation은 연구팀을 지원했습니다.