AI의사 ‘왓슨’ 뒤쫓는 ‘닥터앤서’, 기대와 우려 사이

정책사회

박정환 기자
등록 2019-11-15 19:07:44
수정 2020-09-09 16:08:56

과기부·25개병원, 357억원 들여 8개 질환 솔루션 개발 … 현지화 강점, 수가 책정이 관건

닥터앤서가 실용화되면 현재 40~60% 수준인 소아난청 및 발달장애 진단정확도를 90%대까지 높일 수 있을 것으로 예상된다.

3년 전 의료계에 혜성처럼 등장해 기대를 모았던 인공지능(AI) 의사 ‘왓슨 포 온콜로지(Watson for Oncology)’가 서양인에 편중된 암 진단 데이터베이스, 의료기기 허가 불발 등으로 주춤한 가운데 ‘빅5’를 포함한 국내 다수 대학병원이 연구개발에 나선 ‘닥터앤서(Dr. Answer)’가 새로운 대항마로 떠오르고 있다.

왓슨은 IBM이 개발한 암치료 솔루션으로 전문 코디네이터와 전문의가 환자를 상담한 뒤 환자의 키·몸무게 등 신체지수, 혈액·유전자검사 수치, 기존 치료법 등 데이터를 입력하면 방대한 의료데이터를 활용해 분석하고 약 10초 이내에 적합한 치료법을 ‘강력추천’, 추천’, ‘비추천’으로 구분해 제시한다. 미국 메모리얼슬로언케터링 암센터(MSKCC)에서 엄선한 의학저널 290종과 교과서 200종 등 1200만 페이지에 달하는 의학 데이터를 담고 있으며 필요에 따라 추가적인 학습이 가능하다.

왓슨은 도입 초기 서울 내 대형 상급종합병원에 대책 없이 암 환자를 뺏겨야 했던 서울 주변 수도권, 지방 대학병원들의 집중적인 관심을 모았다. 2016년 길병원을 시작으로 2017년 부산대병원, 대구가톨릭대병원, 계명대동산병원, 건양대병원, 조선대병원, 전남대병원, 중앙보훈병원 등이 잇따라 왓슨을 도입했다. 하지만 2018년 이후 왓슨의 한계가 하나 둘 드러나면서 대학병원들의 도입이 ‘뚝’ 끊겼다.

왓슨 열풍이 갑작스럽게 식은 이유로 한국인의 유전적 특성을 제대로 반영하지 못한 암 임상 데이터가 지목되고 있다. 실제로 왓슨은 암종별, 인종별로 정확도가 들쑥날쑥해 신뢰도에 조금씩 금이 가고 있다는 지적이다.

왓슨의 성능은 보통 ‘일치율’로 평가된다. 일치율은 왓슨이 강력추천 또는 추천한 치료법과 실제 의사가 선택한 치료법이 얼마나 일치하는지 나타내는 수치다. 2017년 미국임상암학회(ASCO)가 발표한 통계에 따르면 왓슨의 일치율은 대장암에서 70~80%로 비교적 높았지만 전이성 대장암은 40%, 진행성 위암은 49%에 그쳤다.

2015년 말 왓슨을 도입한 인도 마니팔병원의 경우 직장암의 일치율은 80%로 높았지만 폐암은 17.8%에 그치는 등 암종별로도 큰 차이를 보였다. 길병원이 2017년 왓슨 도입 1주년을 맞아 발표한 통계에선 왓슨의 대장암 의견 일치율은 55.9%, 위암은 40%에 그쳤다. 건양대병원의 경우 유방암에 대한 왓슨의 일치율은 48%에 머물렀다.

한 소화기내과 전문의는 “한국인에서 유병률 1·2위를 기록 중인 위암과 대장암에서 왓슨이 제시한 치료법의 신뢰도가 떨어지는 것은 국내 대학병원들이 왓슨 도입을 꺼리게 된 가장 큰 이유”라며 “왓슨이 제시한 수술이나 항암제가 국내에선 보험급여가 되지 않아 의료진이 차선으로 다른 치료법을 골라 일치율이 낮게 나타나는 점도 고려할 필요가 있다”고 말했다.

백정흠 길병원 외과 교수는 “왓슨에 대한 기존 연구결과는 의료진과 판단이 얼마나 일치하는지 분석하는 정도에 그친다”며 “의료진이 선택하는 치료법이 무조건 ‘왕도’인 것은 아니므로 일치율이 왓슨의 정확성과 효용성을 평가하는 지표로 적절한 것인지 의문이 든다”고 설명했다. 이어 “다만 왓슨은 미국 등 서구 데이터를 기반으로 하고 있어 국내 데이터를 업그레이드하는 현지화가 필요하다”고 덧붙였다.

하지만 현지화를 위해 새 데이터를 추가하는 것도 쉬운 일은 아니다. 추가 데이터를 입력할 때마다 개발사인 IBM에 비용을 지불해야 해 병원의 비융 부담이 상당하기 때문이다.

더 큰 문제는 왓슨이 국내에서 의료기기로 허가되지 않아 환자에게 진료비를 청구할 수 없다는 것이다. 2017년 11월 식품의약품안전처는 지난해 11월 AI 의료기기 허가심사 가이드라인을 내놓으며 ‘왓슨처럼 처방·진료에 관한 문헌정보를 검색해 정리해주는 소프트웨어는 의료기기에 해당하지 않는다’고 규정했다. 국내에선 의료기기로 허가받지 못하면 환자에게 진료비를 청구할 수 없다. 이 때문에 수십 억원을 들여 도입한 왓슨을 어쩔 수 없이 환자에게 ‘무료 서비스’하고 있는 실정이다.

이같은 이유로 한국형 왓슨의 개발을 요구하는 목소리가 높아지자 과학기술정보통신부는 2018년부터 3년간 총 357억원을 들여 AI 기반 정밀의료 솔루션 ‘닥터앤서(Dr. Answer)’ 개발에 돌입했다. 닥터앤서 사업추진단엔 서울대병원, 서울아산병원, 연세대 세브란스병원, 성균관대 삼성서울병원, 가톨릭대 서울성모병원 등 ‘빅5’와 분당서울대병원, 연세대 강남세브란스병원, 한양대병원, 고려대 구로병원, 이대목동병원 등 유력 상급종합병원을 포함 총 25개 의료기관과 19개 ICT(정보통신기술)·SW(소프트웨어) 기업이 참여했다. 사업추진 총괄주관병원은 서울아산병원, 추진단장은 김종재 서울아산병원 아산생명과학연구원장(병리과 교수)이 맡았다.

왓슨을 처음 도입한 길병원도 닥터앤서 개발에 뛰어들었다. 길병원은 대장암 관련 진단 및 치료 솔루션 제공을 위한 연구를 진행 중이다. 길병원 관계자는 “왓슨 운용을 포기하거나, 비중을 줄이는 게 아니다”며 “다만 현지화 측면에서 닥터앤서가 유리한 점이 있고, 왓슨은 왓슨 나름의 장점이 있어 두 솔루션을 환자에 따라 선택적으로 사용하는 방안을 강구하고 있다”고 말했다.

왓슨과 달리 연구개발 단계부터 다수의 의료기관이 뛰어든 것은 정부가 ‘수가 신설’을 조건으로 병원들의 참여를 독려했기 때문이다. 즉 환자에게 무료로 서비스를 해야 했던 왓슨과 달리 합법적인 진료비 청구가 가능해 병원의 수익을 늘릴수 있다는 기대감이 작용했다.

사업추진단은 심뇌혈관질환, 심장질환, 유방암, 대장암, 전립선암, 치매, 뇌전증, 소아 희귀난치성 유전질환 등 8개 질환의 진단 및 치료법 제시에 필요한 25개 소프트웨어를 개발하게 된다. 추진단은 2020년까지 닥터앤서 개발을 완료하고 임상시험에 돌입할 예정이다.

닥터앤서는 ‘현지화’ 측면에서 왓슨에 비교 우위를 보일 것으로 예상된다. 김종재 교수는 “같은 질환이라도 개인의 건강상태, 생활습관, 유전체정보 등에 따라 질병 진행 예후와 치료법이 판이하게 달라지는데 왓슨의 솔루션은 서양인 데이터를 기반으로 해 국내에선 분명한 한계를 보여왔다”며 “닥터앤서는 한국인에서 유병률이 높은 암이나 기타질환의 진단 정확도를 높이고 개인 맞춤형 정밀의료를 실현하는 데 기여할 것”이라고 말했다.

또 닥터앤서는 왓슨과 달리 여러 연구결과와 정보를 통합·분석해 치료 플랜을 제시하는 것 외에 축적된 데이터를 질병 예측·진단·예후관리에 활용 가능한 의료영상 데이터 기반 소프트웨어를 적용할 수 있다. 사업추진단은 소아난청과 발달장애의 경우 현재 진단 정확도가 40~60% 수준인데 닥터앤서를 활용하면 90%대까지 높일 수 있을 것으로 기대하고 있다.

닥터앤서에 대한 회의적인 반응도 적잖다. 한 대학병원 관계자는 “아직 확실하진 않지만 닥터앤서엔 주로 ‘빅5’ 교수진 위주의 진료 및 수술 프로토콜이 많이 반영될 가능성이 높다”며 “문제는 ‘크고 잘 나가는 병원’의 임상 데이터라고 해서 자존심 강한 다른 병원 교수진들이 무작정 신뢰하고 따를지 의문”이라고 말했다.

사업에 너무 많은 의료기관 및 IT기업이 참여하다보니 각 기관이 가져가는 연구비 ‘파이’가 적어 연구에 차질이 생길 수 있다는 우려도 나온다. 김종재 교수는 “왓슨의 선례를 고려해 병원들의 적극적인 참여를 유도하려면 수익을 낼 수 있는 합리적인 수가 책정과 정부의 공격적인 재정 지원이 요구된다”고 강조했다.

프로필이미지

박정환 기자

댓글 삭제

헤드라인

많이 읽은 기사 (최근 7일간)