인공지능(AI)을 이용해 두경부암 가운데 하나인 진행성 침샘암의 생존 예측모델을 연구한 결과가 나왔다. 향후 침샘암을 비롯한 두경부암 환자의 맞춤형 치료에 도움이 될 것으로 보인다.
현재까지 조직병리학적 단계에 따라 예후를 예측한 연구는 많았지만 암 환자의 나이, 성별, 치료법 등 임상정보를 고려한 생존 예측모델 연구는 처음이다.
이영찬 강동경희대병원 이비인후과 교수, 김태훈 교수팀은 머신러닝 기법을 이용해 침샘암의 생존 예측모델을 연구, 이 가운데 가장 높은 예측과 낮은 오차를 보인 모델을 확인했다.
침샘암은 주타액선(침샘)과 소타액선(침샘)에서 발생하는 악성종양을 말한다. 머리에서 가슴 윗부분까지의 영역에서 발생하는 두경부암 중 하나다. 침샘이 귀밑, 혀밑, 턱밑부터 비강, 볼점막, 구개, 혀를 비롯해 인두와 기관지까지 퍼져 있어 다양한 부위에서 발생할 수 있다.
침샘암은 보통 초기 통증이나 증상이 없는데 주타액선에서 발생한 경우 발생 부위에 덩어리가 생길 수 있고, 악성이 심한 경우 안면신경이나 혀가 마비되기도 한다. 저악성도이면 국소 수술만으로 치료가 가능하며, 고악성도이면 방사선치료까지 받아야 한다.
그동안 침샘암은 조직병리학적 단계에 따라 침샘암의 예후를 예측하는 연구는 많이 보고돼 있다. 하지만 미국암연합위원회(AJCC)가 분류하는 암의 TNM(종양크기, 림프절전이, 원격전이) 병기로만 생존율을 분석한 연구방법은 개별 환자에 대한 다른 임상적 정보(나이, 성별, 치료방법 등)를 고려하지 않아 적용에 한계가 있었다. 이에 이영찬 교수팀은 미국국립암연구소에서 제공하는 암환자 빅데이터(SEER data)를 바탕으로 머신러닝 기법을 이용한 생존예측모델 연구를 진행했다.
2004~2016년에 진단된 총 607명의 T3 또는 그 이상의 병기를 가진 진행성 타액선(이하선) 암환자를 대상으로 연구를 진행했다. 암환자 빅데이터에는 진단 시 나이, 성별, 인종은 물론 TNM 병기, 조직학적 분화도, 종양의 크기, 치료 방법, 생존기간 등이 포함돼 있다.
머신러닝은 인공지능의 한 분야로 기계학습이라고도 부르는데, 주어진 데이터로부터 패턴이나 특성을 학습해 새로운 데이터에 대한 작업을 수행할 수 있도록 하는 알고리즘 및 관련 분야를 일컫는다. 생존분석에는 여러 모델이 있는데 이영찬 교수팀은 네 가지 △Cox proportional hazard model (CoxPH), △conditional survival forest model (CSF), △random survival forest model (RSF), △DeepSurv model 등을 이용했다.
일차결과지표(Primary outcome)는 질병 진단일로부터 특정 질병 사망 사이의 기간을 기준으로 삼았다. 연구 결과 생존분석에서 정확도 지표를 나타내는 C-index 값에서는 각각 CSF (0.79), DeepSurv (0.79), CoxPH (0.78), RSF (0.76) 모델 순으로 우수한 예측력을 보였다. 또 다른 비교 척도로 이용되는 Brier score(IBS) 값에서는 CoxPH (0.02), CSF (0.02), DeepSurv (0.03) 모델 순으로 우수한 예측력을 나타냈다.
추가로 평균제곱근오차 (Root mean square error, RMSE)와 평균절대오차 (Mean absolute error)를 이용해 잔여수명과 실제수명과의 차이를 예측했다. 그 결과 CSF, RSF 모델에서 낮은 오차를 보이며 더 우수한 예측력을 보였다. 종합적으로 이 연구에서는 CSF모델이 가장 높은 예측 성능과 낮은 오차를 입증했다.
이번 연구는 비교적 드문 암에서도 머신러닝을 이용한 분석이 기존 예후 예측 방법보다 정확한 분석이 가능할 것으로 기대된다. 이영찬 교수는 "이번 연구로 환자 개별 임상정보를 적용해 실제적인 생존 기간을 예측할 수 있는 기틀이 마련됐다"며 "환자 개개인에게 맞는 맞춤형 치료 구현에 도움이 될 것"이라고 말했다.
이번 연구는 과학기술정보통신부와 한국연구재단이 추진하는 바이오·의료기술개발사업(혁신형의사과학자공동연구)의 지원으로 수행됐으며 두경부암 관련 유명 저널인 ‘Oral oncology’ 온라인판(IF 5.337)에 게재됐다.