유전체 빅데이터 기반 AI 신약개발 기업 ㈜신테카바이오(대표 정종선)는 자체 개발한 유전 변이 정확도 보정 알고리즘 ‘알디스캔’ 성능평가 연구 결과가 SCIE급 국제 저널 '컴퓨테이셔널 바이올로지' 온라인판에 게재되었다고 14일 밝혔다.
신테카바이오는 기존 유전 변이 검출 알고리즘의 오류를 보정하여 변이 검출 정확도를 크게 향상시킨 ‘알디스캔’을 신규 개발했다. 알디스캔은 표준 유전체 염기서열에 정리된 리드뎁스들의 분포를 고려하여 위양성 변이를 보정하는 방법으로 정확도를 향상시킨 NGS(Next Generation Sequencing) 기반 유전체 염기서열 변이 검출 알고리즘이다.
성능평가는 인하대병원 정밀의료분석지원센터 김루시아 교수 연구팀과 공동 연구를 통해 진행됐다. 기존 변이 검출 알고리즘을 단독으로 적용하였을 때와 대비하여 알디스캔을 추가 적용하고 변이 검출 결과를 보정하였을 때 더 효과적으로 위양성 변이를 제거할 수 있음을 확인했다.
공개 유전체 데이터인 1000G(1000Genomes Project)와 일루미나의 데이터 세트를 활용하여 기존 변이 검출 알고리즘과 알디스캔을 적용해 변이를 검출하고 성능 평가를 실시했다. 그 결과 생식세포 염기 서열변이 검출에서는 12개 케이스에서 11개 케이스로, 체세포 염기서열변이 검출에서는 24개 케이스에서 21개 케이스로 위양성 변이를 제거하여 향상된 변이 검출 정확도를 확인했다.
유전 변이 정보는 질병 진단 및 개인 맞춤 치료나 신규 치료제 개발에 주요한 단서가 되기 때문에 변이를 정확하게 검출하는 것이 매우 중요하다. 기존에도 다수의 변이 검출 알고리즘이 개발되어 있으나 변이 검출 오류의 위험성은 여전히 존재하기 때문에 정확성 및 신뢰성을 높이기 위한 노력이 계속되고 있다.
신테카바이오는 독자 개발한 알고리즘인 애디스캔과 알디스캔을 기반으로 검출된 염기서열 변이의 진위성을 평가하는 표준화된 QC기준 확립도 완료했다.
자사의 암, 희귀 유전질환 질병 변이 자동검출 프로그램 NGS-ARS(Next Generation Sequencing Automatic Report System)를 비롯해 인공지능모델링 환자계층화 프로그램 PGM-ARS(Personalized Genome Medicine Automatic Report System)에 염기서열 변이 검출 및 위양성 변이 검출 보정의 알고리즘과 염기서열 변이의 진위성을 평가하는 QC 기준을 적용한 ‘인공지능 유전체 분석 프로그램’을 자체적으로 구축하여 2022년 3분기에 서비스 개시를 목표로 하고 있다.
신테카바이오 관계자는 “유전체 분석 기술과 AI 신약개발 기술을 모두 보유하여 신약개발 전주기에 AI 플랫폼 적용이 가능한 것이 자사의 경쟁력”이라며 “알디스캔 알고리즘과표준화된 QC 기준은 향후 정밀의료 유전체 연구 및 신약개발을 위한 유전체 분석에도 활용 가능할 것”이라고 말했다.