우리 몸속 심장, 근육, 헤모글로빈, 인슐린, 항체에는 한 가지 공통점이 있다. 바로 모두 단백질로 이뤄져 있다는 점이다. 단백질은 생명체의 세포와 조직을 형성하고,
유전정보를 전달하며, 에너지 생성을 돕는 등 거의 모든 생명현상에 관여하는 만능 일꾼이다. 따라서 단백질 구조를 파악하는 일은 인류의 건강과 질병 치료를 위한
핵심적인 연구 과제로 꼽힌다.
서울대학교 약학대학의 AI 연구자 이주용 교수를 만나 단백질 구조 연구의 중요성과 의미를 들어봤다.
“통상적으로 노벨상은 이론적 성과만으로 수여되지 않습니다. 검증된 연구 결과가 인간의 삶에 도움을 준다는 것이 확인되어야 하죠. 최근 몇 년간 AI를 활용한 단백질 구조 연구는 급격한 성장을 거두었는데, 노벨상까지 수상하게 되면서 AI를 통해 얻어낸 결과값을 신뢰할 수 있다고 공증받은 것과 다름없습니다. 최근 약학 분야에서는 비만치료제 ‘위고비Wegovy’처럼 펩타이드Peptide (단백질의 작은 단위) 기반의 약물이 큰 이슈가 됐는데요. 향후에는 단백질 구조에 기반한 신약 개발이 늘어나고, 개발 과정과 시간도 단축될 것입니다.”
“질병은 신체의 단백질이 정해진 규칙대로 상호작용하지 못하고 오류가 발생해 과도하게 움직이거나, 움직이지 않는 증상이 나타날 때 발생합니다. 이때 과도하게 움직이는 단백질에는 억제할 분자를 결합하고, 움직이지 않는 단백질에는 이를 활성화할 분자를 결합해 균형을 되찾을 수 있습니다. 마치 자물쇠와 열쇠처럼 딱 맞아떨어지는 분자를 찾아내는 과정이죠. 단백질 구조를 모르던 시절의 일은 마치 눈을 감고 수만 개의 열쇠를 자물쇠에 끼워보는 것과 같았습니다. 그러나 단백질 구조를 파악함으로써 열쇠의 모양을 보고 자물쇠에 맞는 열쇠를 찾아내는 단계에 이른 셈입니다.”
“구조 예측 프로그램 원리의 핵심적인 아이디어는 바로 공진화❶입니다. 특정 단백질, 예를 들어 인간에게 있는 단백질 A는 종마다 약간의 차이는 있지만 말, 참치, 바다거북 등 다양한 생물에서도 유사한 형태로 존재합니다. 이를 기반으로 단백질을 이루는 기본 단위인 아미노산의 서열을 나열하고 비교하는 과정을 ‘다중 서열 정렬’이라고 합니다. 정렬을 통해 관찰해보면, 종마다 똑같이 배치되는 아미노산이 있는 반면, 돌연변이로 인해 변동된 부분도 나타나는데요. 흥미로운 점은 특정 아미노산 쌍이 함께 돌연변이를 일으키는 경향이 관찰된다는 점입니다. 이는 단백질 구조에서 물리적으로 가까운 아미노산들이 서로 영향을 미치기 때문입니다.”
이러한 종별 아미노산 데이터를 AI에 학습시키고, 돌연변이의 상관관계와 패턴을 분석함으로써 단백질의 3D 구조를 예측하는 것이 알파폴드의 작동 원리다. 더불어 AI는 공진화 데이터뿐만 아니라 기존에 밝혀진 단백질 구조와 물리적·화학적 규칙을 대규모로 학습해 보다 정확한 구조를 도출해낸다.
- ❶ 공진화Co-evolution: 한 아미노산이 돌연변이를 일으키면 이와 관련된 다른 아미노산도 같이 돌연변이가 일어나는 현상. 즉 서로 다른 둘 이상의 아미노산이 영향을 주며 진화한다는 개념
“노벨 화학상을 수상한 데이비드 베이커 교수 연구팀이 단백질 구조 연구를 선도한다는 것은 부정할 수 없습니다. 알파폴드가 발표되기 이전부터 단백질 구조를 예측하고 설계하는 데 독보적인 기여를 해왔으니까요. 현재 서울대학교 생명과학부에는 해당 연구팀의 주요 멤버로 활약했던 백민경 교수가 재직 중입니다. 이렇듯 우수한 인력과 연구 시설, 또 투자가 이어지기 때문에 새로운 단백질 구조 예측 모델을 만들거나 신약을 개발하는 등의 성과가 나타날 것으로 예상됩니다.”
정부에서도 AI 모델을 활용한 신약 개발을 적극 지원할 방침이다. 보건복지부와 과학기술정보통신부는 올해부터 5년간 348억 원을 투입해 제약사, 대학병원, 연구기관, 기업 등이 보유한 신약 개발 데이터를 학습하는 ‘연합학습 기반 신약 개발 가속화 프로젝트 K-MELLODDY’를 론칭했다. 이를 통해 AI 의료 기술 사업화 규모를 두 배 이상 확대하고, 기술 격차를 단축하며, R&D 투자를 이어나간다는 계획이다.
서울대학교 계산 기반 신약 개발LCBC 연구실
서울대학교 LCBCLearning Computational Biology through Chemistry 연구실은 단백질 구조 및 설계 분야에서 AI 기반 연구를 중점적으로 수행한다. 특히 생물학적 데이터를 분석하고 예측 모델을 개발함으로써 신약 개발, 질병 연구 그리고 생명공학 응용 등 다양한 영역에 기여하고 있다. 현재 딥러닝을 활용해 단백질 상호작용, 유전자 발현, 약물 개발 등 심도 깊은 연구를 수행하고 있다.
이번 노벨 화학상 수상은 AI가 연구적 도구에 그치지 않고, 인류 보편적으로 활용될 것임을 시사합니다. 요즘 많은 분들이 챗GPT와 같은 AI를 활용하고 있는데요. 단순히 특정 AI 모델의 사용법을 익히는 것에서 그치기보다 자신이 전공한 분야에 AI를 접목시켜 어떤 도움을 받을 수 있을지를 탐구하는 것이 중요합니다. 특정 모델에만 의존하다 보면 새로운 모델이 등장했을 때 적응하기 어려울 수 있기 때문입니다. 이제는 보다 근본적인 질문을 던져야 할 때라고 생각합니다.
결국 핵심은 수학입니다. 여기에 더해 통계학적인 지식도 큰 도움이 될 것입니다. 특히 학생이라면 수학·통계학·물리학 등을 열심히 공부하는 것이 중요합니다. 요즘은 서점에서도 AI 입문서를 쉽게 구할 수 있는데, 처음에는 감을 잡는다는 생각으로 한두 권 정도 읽어보는 것도 좋습니다. 관련 홈페이지에서 실습 예제를 찾아보면 큰 도움이 될 것입니다. 다양한 분야에 대한 호기심을 갖고 융합적 사고를 키운다면 AI를 활용하는 데 경쟁력을 갖출 수 있을 것입니다.