프로테오믹스(Proteomics, 단백질체학) 기반 정밀의료 기술개발 기업 베르티스(대표 노동영, 한승만)는 딥러닝 기반 AI 기술을 적용해 단백체 질량분석 데이터만 가지고 질병 여부를 판별할 수 있는 진단 모델에 대한 연구 성과를 단백체 분야 세계 최대 규모의 학술행사 ‘2022 세계단백체학회(HUPO, Human Proteome Organization)’에서 발표했다고 9일 밝혔다.
베르티스는 머신러닝을 기반으로 기존 질량분석 프로테오믹스 데이터 해석의 한계를 극복하고 활용을 극대화하기 위해 SAN(Spectrum is All You Need) 프로젝트를 추진 중이다. SAN은 혈액 검체의 질량분석 스펙트럼만으로 질병 여부를 판별할 수 있는 모델을 개발하기 위한 프로젝트이다. 내달 4일부터 8일까지 멕시코 칸쿤에서 개최된 세계단백체학회에서 난소암과 췌장암에 대해 진단 모델의 정확도를 평가한 첫 번째 연구 결과를 선보였다.
베르티스가 개발한 딥러닝 모델은 단백체 스펙트럼만 가지고 95% 이상의 정확도를 보이며 난소암과 췌장암의 질병 유무를 판별했다. 이번 연구에서 베르티스 연구팀은 질량분석을 통해 난소암 군 혈액 검체 156개(건강한 사람 50%, 난소암 환자 50%), 췌장암 군 혈액 검체 116개(건강한 사람 50%, 난소암 환자 50%)의 단백체 스펙트럼을 확보했다. 질환별로 각각 80%와 10%의 검체에 대한 스펙트럼을 딥러닝 모델을 학습시키고 학습 내용을 검증시키는데 활용했으며, 나머지 10%를 가지고 질환 유무를 판별하는 테스트를 진행했다.
베르티스는 진단 솔루션 개발 시 질량분석 기술을 기반으로 대상 질환의 단백질 바이오마커들을 발굴하고 알고리즘을 개발하는 방식을 채택하고 있다. 이번 연구로 딥러닝 모델과 단백체 스펙트럼만으로 대상 질병을 진단하는데 고무적인 성과를 확인한 만큼 SAN 프로젝트를 통해 머신러닝을 기반으로 암 등 주요 질환에 대해 보다 정확하고 신속하게 판별하는 진단 솔루션을 선보이기 위한 연구개발을 가속화할 계획이다.
연구의 성과 발표는 16년간 구글에서 소프트웨어 엔지니어로 활약하고 올해 7월 베르티스의 미국법인 베르티스 바이오사이언스에 합류한 에릭 김(Eric Y. Kim) 수석 머신러닝 엔지니어(Principal Machine Learning Engineer)가 주도했다. 에릭 김 수석 엔지니어는 연구 성과에 대해 “딥러닝을 적용해 질병 진단의 정확도와 검사로서 효율성을 혁신적으로 높일 수 있는 가능성을 제시했다는 점에서 프로테오믹스 기반 진단 기술의 전환점을 마련했다”며, “기술의 완성도를 높이고 실제 임상에서 주요 질환의 조기 진단을 활성화에 기여할 수 있도록 향후 연구에도 최선을 다하겠다“고 말했다.
베르티스는 현재 글로벌 최고 수준의 질량분석기반 정량 프로테오믹스 기술을 보유, 이를 기반으로 세계 최초의 프로테오믹스 기반 혈액 검사 유방암 조기 진단 솔루션, ‘마스토체크(Mastocheck®)’ 상용화에 성공했다. 최근에는 바이오인포매틱스(Bioinformatics, 생물정보학)와 머신러닝 분야의 전문가들을 영입해 인공지능(AI)와 머신러닝을 활용해 프로테오믹스 데이터의 해석과 활용 한계를 극복하기 위해 노력하고 있다.
김상태 베르티스 바이오사이언스 최고기술책임자(CTO) “인체의 단백체는 질병 발현의 실제 신호이기 때문에 매우 중요한 정보지만, 현재는 이 단백체 정보 중 절반 이상이 해석조차 불가능해 버려지고 있다. 이런 상황에서 SAN은 AI 기술 기반으로 완전히 새로운 데이터 해석 방식을 구현하며 단백체 데이터의 해석과 활용을 극대화할 수 있는 길을 열었다”며 “이번 연구 성과를 더욱 활성화하고 질병 조기 진단, 동반 진단과 치료 타겟 발굴 등에 응용하여 정밀의료를 실현할 것”이라고 말했다.