김형범 연세대 의대 약리학 교수(기초과학연구원 IBS 연구위원)와 윤성로 서울대 전기정보공학부 교수가 특정 유전자 부위를 자르는 다양한 유전자가위 중 최고의 효과를 낼 것으로 예측되는 유전자가위를 골라주는 인공지능(Artificial Intelligence) 프로그램을 개발했다.
유전자가위는 유전자에 결합해 특정 DNA 부위(염기서열)를 자르는 데 사용하는 인공효소다. DNA를 자르는 절단효소(nuclease)와 이 절단효소가 타깃 DNA 부위에 달라붙도록 하는 길라잡이인 가이드RNA(guide RNA)로 이뤄진다.
수많은 가이드RNA 중 어느 것이 가장 정확하게 목표 DNA 부위에 부착하는지 가려내는 것은 전세계 연구진의 고민거리였다. 이번 연구는 유전자교정 정밀도를 높여 이같은 문제를 해소하는 데 기여할 것으로 평가받고 있다. 결과는 세계 과학술지인 ‘네이처바이오테크놀로지’(Nature Biotechnology) 1월 30일자 온라인판에 게재됐다.
김 교수는 다양한 형태의 방대한 데이터를 입력하면 인공지능이 스스로 학습해 규칙을 찾아주는 딥러닝 기술이 유전자가위의 유전자교정 효과를 정확히 예측하는 데 유용할 것으로 판단했다. 국내 인공지능 전문가로 알려진 윤 교수와 공동연구를 추진했다.
윤 교수는 “딥러닝 도입으로 수 만 가지 유전자가위 중 최적 효과를 나타낼 것으로 추정되는 몇 가지만 실제로 제작해 실험해보면 된다”며 “연구 시간과 비용을 대폭 줄이게 됐다”고 말했다.
김 교수는 “유전자가위 효과를 예측하는 기존 컴퓨터 시뮬레이션 프로그램은 데이터 저장량이 적어 다양한 형태의 유전자가위 정보를 담기에 부족하다”며 “예측값이 정확하지 않아 활용도가 떨어진다”고 말했다. 이어 “상당수 연구원이 각종 유전자가위를 직접 만들어 일일이 실험으로 효과를 검증하는 수밖에 없다”며 “막대한 시간과 비용이 소요되고 있다”고 덧붙였다.
인공지능 기반 유전자가위 예측모델을 구축하는 첫 단계로 김 교수는 1만5000개에 달하는 각기 다른 가이드RNA를 가진 ‘크리스퍼 유전자가위’(CRISPR-Cpf1) 유전자교정 효과 정보를 분석했다. 앞서 개발한 유전자가위 활성도를 대량 측정하는 첨단 분석기법을 활용했다.
윤 교수는 이 정보와 자체 개발한 딥러닝 기술을 활용해 인공지능 프로그램이 다양한 조건에서 유전자교정 효과가 높은 크리스퍼 유전자가위부터 순서대로 제시하도록 설계했다
김 교수는 “실제 실험결과와 인공지능이 제시한 예측값의 상관관계가 0.87로 수렴해 인공지능의 정확성이 높았다”고 덧붙였다. 상관관계 값이 1에 가까울 수로 정확도와 신뢰도가 높다. 기존 유전자가위 시뮬레이션 프로그램은 이 값이 평균 0.5~0.6에 그친다.
김 교수는 또 “기존 시뮬레이션 프로그램에 없던 새로운 변수 조건을 넣고 학습시킨 게 중요했다”며 “유전자가위가 타깃 DNA 부위에 정확히 달라붙도록 염색질 접근성(chromatin accessibility)까지 고려한 정보를 인공지능에 넣었다”고 설명했다.
윤 교수는 “유전자가위가 복잡한 DNA 구조를 잘 헤집고 들어가 목표한 부위에 정확히 부착하는 게 유전자교정 성패를 좌우한다”며 “관련된 정보를 종합해 프로그램에 넣고 인공지능을 학습시켰다”고 덧붙였다. DNA는 서로 사다리꼴로 연결된 두 가닥이 3차원적인 나선형으로 꼬여있다. 공동연구팀은 한국연구재단과 IBS로부터 후원을 받아 1년간 연구를 수행했다.