본문 바로가기

카테고리 없음

DeepMind, AI 기반 예측 단백질 모델링에 대한 초기 연구

출처 : https://techcrunch.com/2018/12/03/deepmind-claims-early-progress-in-ai-based-predictive-protein-modelling/

 

 

 

알파 폴드

Google (AI) 전문가 인 딥 마인드 (DeepMind) 유전자 서열에만 기초한 단백질의 3D 구조를 예측하는 복잡한 작업을 돕기 위해 인공 지능의 유용성을 입증 할 수 있다는 "중요한 이정표"를 발표했다.

단백질 구조를 이해하는 것은 질병 진단과 치료에 중요하며 과학자의 인체에 대한 이해를 향상시킬뿐만 아니라 잠재적으로 단백질 디자인과 생체 공학을 지원하도록 도울 수 있습니다.

"  단백질을 접는 방법을 예측하기 위해 인공 지능을 사용하는 프로젝트에 관한 블로그 포스트 에 글을 올리면 2 년 후 :"AlphaFold [DeepMind의 AI]가 생성하는 단백질의 3D 모델은 이전에 만들어진 것보다 훨씬 정확합니다. 생물학의 핵심 과제 중 하나에 대한 중요한 진전 "이라고 덧붙였다.

DNA의 잔류 아미노산으로부터 단백질 분자의 고유 한 3D 상태 (예 : 단백질 사슬이 원래 상태에 도달하는 방법)를 예측하는 다양한 과학적 방법이 있습니다.

그러나 3D 구조를 모델링하는 것은 매우 복잡한 작업이며, 아미노산 간의 상호 작용과 같은 요인에 의존하는 단백질 폴딩 때문에 얼마나 많은 순열이있을 수 있는지를 고려해야합니다.

인간의 직감을 활용하여 실행 가능한 단백질 형태를 예측하려고 하는 crowdsourced 게임 ( FoldIt ) 조차 있습니다 .

딥 마인드 (DeepMind)는 단백질 구조를 예측하기 위해 큰 데이터를 사용하는 수년간의 선행 연구에 의존하고 있다고 주장했다.

특히 그것은 게놈 데이터에 대한 깊은 학습 접근법을 적용하고 있습니다.

"다행히 유전학 분야는 유전자 시퀀싱 비용의 급격한 감소 덕분에 데이터가 풍부합니다. 결과적으로 게놈 데이터에 의존하는 예측 문제에 대한 깊은 학습 접근법이 지난 몇 년 동안 점점 인기를 얻었습니다. 이 문제에 대한 DeepMind의 연구 결과로 AlphaFold가 생겨나 고 올해 CASP [ 단백질 구조 예측 기술에 대한 중요한 평가에 관한 커뮤니티 와이드 실험 ]에 블로그 포스트에 글을 올렸 습니다.

"우리는 CASP 주최자가"단백질 구조 예측을위한 전산 방식의 전례없는 진전 "에 참여한 것을 자랑스럽게 생각하며   , 참가한 팀 중 1 위를 차지했습니다 (우리의 출품작은 A7D 임)."

"우리 팀은 이전에 해결 된 단백질을 템플릿으로 사용하지 않고 목표 형상을 처음부터 모델링하는 어려운 문제에 특히 중점을 두었습니다. 우리는 단백질 구조의 물리적 특성을 예측할 때 높은 수준의 정확도를 얻었고 완전한 단백질 구조 예측을 위해 두 가지 다른 방법을 사용했습니다.

딥 마인드 (DeepMind)는 유전자 알고리즘으로부터 단백질 특성을 예측하기 위해 훈련 된 심 신경 네트워크 (deep neural networks)를 사용하는 두 가지 방법을 사용했다고 밝혔다.

"우리 네트워크가 예측하는 특성은 다음과 같습니다. (a) 아미노산 쌍 사이의 거리와 (b) 이들 아미노산을 연결하는 화학 결합 간의 각도. 첫 번째 개발은 아미노산 쌍이 서로 가깝게 있는지를 추정하는 일반적으로 사용되는 기술에 대한 발전이다.

"우리는 단백질 내의 모든 잔기 쌍 사이의 거리의 분리 된 분포를 예측하기 위해 신경망을 훈련 시켰습니다. 이 확률은 제안 된 단백질 구조가 얼마나 정확한지 평가하는 점수로 합쳐졌다. 우리는 또한 전체 거리를 사용하여 제안 된 구조가 얼마나 가까운 거리에 있는지를 추정하는 별도의 신경망을 훈련했습니다. "

그런 다음 새로운 방법을 사용하여 단백질 구조의 예측을 구축하고 예측과 일치하는 알려진 구조를 검색했습니다.

"우리의 첫 번째 방법은 구조 생물학에서 일반적으로 사용되는 기술을 토대로 반복적으로 단백질 구조 조각을 새로운 단백질 조각으로 대체했습니다. 우리는 생성 된 신경망을 훈련하여 제안 된 단백질 구조의 점수를 지속적으로 향상시키는 데 사용 된 새로운 단편을 발명했습니다.

"두 번째 방법은 그라디언트 디센트 - 작고 점진적인 개선을 위해 기계 학습에서 일반적으로 사용되는 수학적 기법 -을 통해 점수를 최적화하여 매우 정확한 구조를 만들어 냈습니다. 이 기술은 조립되기 전에 별도로 접혀 있어야하는 조각보다는 전체 단백질 사슬에 적용되어 예측 과정의 복잡성을 줄였습니다. "

DeepMind는 "과학적 발견을위한 AI의 유용성"을 입증하면서 계산 방법을 사용하여 "단백질 폴딩 진행의 초기 징후"로서 지금까지 달성 된 결과를 설명합니다.

비록 그것이 어떤 종류의 "정량화 할 수있는 영향"을 가지고있는 깊은 학습 접근법은 여전히 ​​초기 단계라고 강조합니다.

"질병을 치료하고 환경을 관리하는 데 정량화 할 수 있기 전에해야 할 일이 많지만 잠재력이 엄청납니다." "기계 학습이 과학의 세계를 어떻게 발전시킬 수 있는지에 초점을 맞춘 헌신적 인 팀을 통해 우리는 기술이 변화를 가져올 수있는 여러 가지 방법을 기대하고 있습니다."