인공지능을 통한 신약개발 플랫폼 개발 벤처기업 디어젠이 Self-Attention 메커니즘을 기반으로 한 약물-단백질 상호작용 예측 알고리즘(MT-DTI, Molecule Transformer Drug Target Interaction) 개발 성과를 8~10일 진행된 MLHC(Machine Learning for Healthcare) 2019 학회에서 발표했다고 12일 밝혔다.
MLHC는 의료 빅데이터를 활용한 인공지능 기술 분야 최대 학회다. 2011년부터 매년 개최되는 MLHC는 올해 미국 미시간 주의 미시간 대학(University of Michigan)에서 진행됐다.
MT-DTI는 기존 DTI 예측 모델의 한계를 극복해 디어젠에서 자체개발 한 새로운 DTI 모델이다. 디어젠의 실험 결과 기존 DTI 예측 모델들 대비 월등한 성능을 보였으며 MT-DTI를 이용해 EGFR(상피세포 성장 수용체)를 타깃 하는 30개의 신약후보물질을 예측했을 때 현재 미국 식품의약국(FDA)에서 승인받은 8개의 EFGR 타깃 항암제가 모두 포함돼 있음을 확인했다.
DTI(Drug Target Interaction)는 질병을 유발하는 것으로 예측되는 타깃 물질과 약물 후보물질의 상호작용을 예측해 신약후보물질을 도출하는 것이다.
그러나 전통적인 실험실 기반의(in-vitro) DTI는 비용과 시간이 많이 필요한 과정일 뿐만 아니라 DTI로 도출된 신약후보물질 중 실제 신약으로 이어지는 경우는 10% 미만이다.
따라서 최근 신약개발 시장에서는 컴퓨터 시뮬레이션 기반의(in-silico) 기술을 이용한 DTI 예측이 요구되고 있다. 이는 신약개발 전체 프로세스에 드는 시간과 비용을 43%까지 감소시킬 수 있다고 한다.
이러한 최신 요구에 따라서 여러 종류의 in-silico DTI 예측 모델들 (KronRLS, SimBoost, DeepDTA 등)이 제안됐지만 이 방법들은 복잡한 화학구조를 제대로 반영하지 못하고 방대한 화합물 정보를 제대로 이용하지 못해 후보물질예측에 한계가 있는 것으로 알려져 있다.
그에 비해 MT-DTI는 Self-Attention 메커니즘을 모델에 반영해 복잡한 화학구조를 더욱 효과적으로 모델링 했고 PubChem의 약 9700만 개의 방대한 화합물 데이터베이스를 사전학습에 이용 가능하게 하여 모델의 정밀도를 높였다.
디어젠 신봉근 최고 인공지능책임자는 "이번 연구를 통해 MT-DTI 모델이 신약후보물질을 제시하는 데 빠르고 정밀한 플랫폼으로 활용될 가능성이 확인됐다"며 "나아가 우리의 MT-DTI 모델은 적은 비용으로 신약을 개발할 수 있게 하며 환자 맞춤 의료시대를 앞당길 것이다"고 말했다.
디어젠 강길수 대표이사는 "디어젠은 신약 개발에 필요한 화합물, 단백질, 유전체 및 다양한 의료 빅데이터를 활용하여 AI 모델 개발과 데이터 기반 in-silico 플랫폼 기술을 개발 중이다"며 "현재 디어젠은 AI 기술을 활용하여 first/best in class의 신약을 만들기 위해 여러 신약 개발 전문가들과 함께 협업하고 있다. 나아가 디어젠의 AI 기술이 신약 개발에 중요한 포지션을 갖도록 노력하고 있다"고 말했다.
이번 연구 성과에 대한 논문은 'Self-Attention Based Molecule Representation for Predicting Drug-Target Interaction'이라는 제목으로 JMLR(Journal of Machine Learning Research)저널에 게재될 예정이다.
댓글보기(0)