학술논문

딥러닝을 이용한 단백질-리간드 결합 친화력 예측 / Prediction of protein-ligand binding affinity using deep learning
Document Type
Dissertation/ Thesis
Source
Subject
딥러닝
합성곱 신경망
주의 집중 기법
결합 친화력
구조 기반의 신약 디자인
Language
Korean
Abstract
구조 기반의 신약 디자인에서 정확하게 단백질-리간드 결합 친화력을 예측하는 것은 새로운 약물 디자인에 소요되는 비용을 감소시킬 수 있으므로 중요하다. 보다 정확한 예측을 위하여 역장 기반, 지식 기반, 경험적 점수 함수들을 포함하는 많은 고전적인 방법들이 지난 수십년 동안 개발되어왔다. 하지만 고전적인 방법들은 단백질-리간드 복합체를 구성하는 상호작용의 복잡한 매커니즘을 표현하기에는 한계가 있다. 이러한 한계를 극복하기 위하여 기계 학습 및 심층학습을 이용한 방법들이 주목받기 시작하였으나, 단백질-리간드 복합체의 표현 방법 및 심층 학습 모델의 최적의 아키텍처를 찾는 것이 여전히 문제로 남아있다. 본 연구에서는 국소적인 구조 정보를 담고 있는 설명자 및 임베딩 행렬을 이용하여 단백질-리간드 복합체를 행렬로 표현하였다. 입력되는 데이터의 구조를 고려하여 1차원 합성곱을 사용하는 합성곱 계층이 사용되었으며, 결합 친화력 예측에 중요한 설명자를 강조하기 위하여 주의 집중 계층을 도입하였다. 제안하는 방법은 기존의 모델들보다 더 높은 예측 정확도를 보여주었다. 또한 주의 집중 계층은 결합 친화력과 설명자들의 적절한 선형 관계를 찾아냈다. 이러한 결과는 우리의 모델이 단백질-리간드 복합체의 결합 친화력을 정확하게 예측할 수 있음을 보여준다.
In Structure Based Drug Design (SBDD) accurately predicting Protein-Ligand Binding affinity is important because it can lower the cost of a de novo drug design. Many scoring functions have been developed for more accurate predictions in the past decades. However, classical methods have limitations in representation the complicated mechanism of interactions the make up the protein ligand complex. To overcome these limitations methods using machine learning and deep learning have begun to draw attention, but representation method of the protein-ligand complex and find the optimal architecture of the deep learning model remains a problem. In this study, the complex was represented in a matrix using descriptors and embedding matrix containing local structural information. In consideration of the structure the input data, a one-dimensional convolution was used, and an attention layer was introduced to emphasize the descriptors that are important for predicting binding affinity. The proposed method showed higher predictive accuracy than existing models. The attention layer also found a proper linear relationship between binding affinity and descriptors. This result show that the proposed method can accurately predict the binding affinity of the protein-ligand complex.