검색창 열기
R&Dism>공학자의 서재
단백질 구조의 비밀,
AI를 통해 풀어내다
이주용 서울대학교 약학대학 제약학과 교수
김규성 사진 김기남

우리 몸속 심장, 근육, 헤모글로빈, 인슐린, 항체에는 한 가지 공통점이 있다. 바로 모두 단백질로 이뤄져 있다는 점이다. 단백질은 생명체의 세포와 조직을 형성하고, 유전정보를 전달하며, 에너지 생성을 돕는 등 거의 모든 생명현상에 관여하는 만능 일꾼이다. 따라서 단백질 구조를 파악하는 일은 인류의 건강과 질병 치료를 위한 핵심적인 연구 과제로 꼽힌다.
서울대학교 약학대학의 AI 연구자 이주용 교수를 만나 단백질 구조 연구의 중요성과 의미를 들어봤다.

AI 단백질 구조 연구, 노벨 화학상을 수상하다
지난 10월 노벨위원회는 미국 워싱턴주립대학교의 단백질설계연구소 소장인 데이비드 베이커 교수, 글로벌 대기업 구글이 소유한 AI 기업 ‘딥마인드’의 데미스 하사비스 최고경영자와 존 점퍼 선임연구원 총 3인을 노벨 화학상 수상자로 선정한다고 발표했다. 올해의 노벨 화학상이 단백질 구조를 연구한 3인의 공동 수상으로 결정된 것이다. 1962년 존 켄트루와 막스 페루츠가 최초로 단백질의 3차원 구조를 규명해 노벨 화학상을 받은 이래 단백질 구조 연구에 진전이 있을 때면 화학상이 주어졌지만, 이번 수상이 의미하는 바는 크다. 이주용 교수는 AI를 활용한 단백질 구조 연구가 실용성과 신뢰성을 갖게 됐다고 평가했다.

“통상적으로 노벨상은 이론적 성과만으로 수여되지 않습니다. 검증된 연구 결과가 인간의 삶에 도움을 준다는 것이 확인되어야 하죠. 최근 몇 년간 AI를 활용한 단백질 구조 연구는 급격한 성장을 거두었는데, 노벨상까지 수상하게 되면서 AI를 통해 얻어낸 결과값을 신뢰할 수 있다고 공증받은 것과 다름없습니다. 최근 약학 분야에서는 비만치료제 ‘위고비Wegovy’처럼 펩타이드Peptide (단백질의 작은 단위) 기반의 약물이 큰 이슈가 됐는데요. 향후에는 단백질 구조에 기반한 신약 개발이 늘어나고, 개발 과정과 시간도 단축될 것입니다.”
s7_1_1.jpg
생명현상의 핵심, 단백질 구조
그렇다면 단백질 구조 연구가 중요한 이유는 무엇일까? 해답은 단백질이 우리 몸을 구성하는 주요 물질이라는 점에 있다. 신체는 약 2만 개의 단백질로 구성되어 있으며, 이들은 상호작용하면서 생명현상을 이끌어간다. 우리가 숨을 쉬는 것부터 먹고, 보고, 느끼는 것까지 모든 과정에서 단백질은 핵심적인 역할을 한다. 그렇기에 단백질의 구조를 밝히고 이해하는 연구는 신체 작동의 원리를 해명하고 질병 치료에 획기적인 진전을 가져올 수 있다.

“질병은 신체의 단백질이 정해진 규칙대로 상호작용하지 못하고 오류가 발생해 과도하게 움직이거나, 움직이지 않는 증상이 나타날 때 발생합니다. 이때 과도하게 움직이는 단백질에는 억제할 분자를 결합하고, 움직이지 않는 단백질에는 이를 활성화할 분자를 결합해 균형을 되찾을 수 있습니다. 마치 자물쇠와 열쇠처럼 딱 맞아떨어지는 분자를 찾아내는 과정이죠. 단백질 구조를 모르던 시절의 일은 마치 눈을 감고 수만 개의 열쇠를 자물쇠에 끼워보는 것과 같았습니다. 그러나 단백질 구조를 파악함으로써 열쇠의 모양을 보고 자물쇠에 맞는 열쇠를 찾아내는 단계에 이른 셈입니다.”
‘단백질 설계 연구’와 ‘단백질 구조 예측 연구’
이번 노벨 화학상의 면면을 들여다보면 단순히 단백질 구조를 밝혔다는 이유로 상을 받은 것이 아닌 ‘단백질 설계 연구’와 ‘단백질 구조 예측 연구’에 대한 성과를 인정받은 것으로 평가된다. 데이비드 베이커 교수 연구팀은 자연에 존재하지 않았지만, 질병 치료 등 원하는 기능을 수행하는 맞춤형 단백질을 설계하는 단백질 설계 연구로 수상했는데, 이는 자연계에 없던 새로운 단백질을 디자인하는 것이 가능해졌다는 점을 의미한다. 다만 설계된 단백질이 정확한 3D 구조를 형성해 의도한 기능을 수행하는지 예측하기 어려웠는데, 이를 해결해준 것이 딥마인드의 알파폴드다. 하사비스 최고경영자와 존 점퍼 선임연구원은 AI가 데이터 속의 패턴을 감지하는 데 뛰어나다는 점에 착안해 단백질의 3차원 구조를 예측하는 알파폴드를 개발했다.

“구조 예측 프로그램 원리의 핵심적인 아이디어는 바로 공진화입니다. 특정 단백질, 예를 들어 인간에게 있는 단백질 A는 종마다 약간의 차이는 있지만 말, 참치, 바다거북 등 다양한 생물에서도 유사한 형태로 존재합니다. 이를 기반으로 단백질을 이루는 기본 단위인 아미노산의 서열을 나열하고 비교하는 과정을 ‘다중 서열 정렬’이라고 합니다. 정렬을 통해 관찰해보면, 종마다 똑같이 배치되는 아미노산이 있는 반면, 돌연변이로 인해 변동된 부분도 나타나는데요. 흥미로운 점은 특정 아미노산 쌍이 함께 돌연변이를 일으키는 경향이 관찰된다는 점입니다. 이는 단백질 구조에서 물리적으로 가까운 아미노산들이 서로 영향을 미치기 때문입니다.”

이러한 종별 아미노산 데이터를 AI에 학습시키고, 돌연변이의 상관관계와 패턴을 분석함으로써 단백질의 3D 구조를 예측하는 것이 알파폴드의 작동 원리다. 더불어 AI는 공진화 데이터뿐만 아니라 기존에 밝혀진 단백질 구조와 물리적·화학적 규칙을 대규모로 학습해 보다 정확한 구조를 도출해낸다.
  • ❶ 공진화Co-evolution: 한 아미노산이 돌연변이를 일으키면 이와 관련된 다른 아미노산도 같이 돌연변이가 일어나는 현상. 즉 서로 다른 둘 이상의 아미노산이 영향을 주며 진화한다는 개념
정부, K-MELLODDY 사업 통해 AI 신약 개발 지원
이렇듯 단백질 구조 예측 연구를 이끄는 딥마인드의 알파폴드를 보유한 미국이 AI를 활용한 단백질 구조 연구에서 앞서나가는 것이 사실이다. 하지만 국내 연구진 역시 세계적 수준에 뒤처지지 않는 성과를 내고 있다. 이 교수는 국내 연구진의 기여와 협력에도 주목했다.

“노벨 화학상을 수상한 데이비드 베이커 교수 연구팀이 단백질 구조 연구를 선도한다는 것은 부정할 수 없습니다. 알파폴드가 발표되기 이전부터 단백질 구조를 예측하고 설계하는 데 독보적인 기여를 해왔으니까요. 현재 서울대학교 생명과학부에는 해당 연구팀의 주요 멤버로 활약했던 백민경 교수가 재직 중입니다. 이렇듯 우수한 인력과 연구 시설, 또 투자가 이어지기 때문에 새로운 단백질 구조 예측 모델을 만들거나 신약을 개발하는 등의 성과가 나타날 것으로 예상됩니다.”

정부에서도 AI 모델을 활용한 신약 개발을 적극 지원할 방침이다. 보건복지부와 과학기술정보통신부는 올해부터 5년간 348억 원을 투입해 제약사, 대학병원, 연구기관, 기업 등이 보유한 신약 개발 데이터를 학습하는 ‘연합학습 기반 신약 개발 가속화 프로젝트 K-MELLODDY’를 론칭했다. 이를 통해 AI 의료 기술 사업화 규모를 두 배 이상 확대하고, 기술 격차를 단축하며, R&D 투자를 이어나간다는 계획이다.
단백질과 AI의 융합을 선도하다
서울대학교 계산 기반 신약 개발LCBC 연구실

서울대학교 LCBCLearning Computational Biology through Chemistry 연구실은 단백질 구조 및 설계 분야에서 AI 기반 연구를 중점적으로 수행한다. 특히 생물학적 데이터를 분석하고 예측 모델을 개발함으로써 신약 개발, 질병 연구 그리고 생명공학 응용 등 다양한 영역에 기여하고 있다. 현재 딥러닝을 활용해 단백질 상호작용, 유전자 발현, 약물 개발 등 심도 깊은 연구를 수행하고 있다.

s7_1_2.jpg
이주용 교수는 세상에 도움이 되는 성과를 이루고자 신약 개발 연구팀을 구성해 신약 후보 물질 탐색에 나섰다. 연구팀은 AI와 물리 기반의 시뮬레이션을 이용해 신약 개발을 추진하고 있다.
s7_1_3.jpg
s7_1_4.jpg
이번 노벨 화학상 수상은 AI가 연구적 도구에 그치지 않고,
인류 보편적으로 활용될 것임을 시사합니다.
✓ 분야를 막론하고 AI의 중요성이 나날이 높아지고 있습니다. 어떻게 활용해야 할까요?
이번 노벨 화학상 수상은 AI가 연구적 도구에 그치지 않고, 인류 보편적으로 활용될 것임을 시사합니다. 요즘 많은 분들이 챗GPT와 같은 AI를 활용하고 있는데요. 단순히 특정 AI 모델의 사용법을 익히는 것에서 그치기보다 자신이 전공한 분야에 AI를 접목시켜 어떤 도움을 받을 수 있을지를 탐구하는 것이 중요합니다. 특정 모델에만 의존하다 보면 새로운 모델이 등장했을 때 적응하기 어려울 수 있기 때문입니다. 이제는 보다 근본적인 질문을 던져야 할 때라고 생각합니다.
✓ 그렇다면 AI의 원리를 이해하기 위해 어떤 것을 배워야 할까요?
결국 핵심은 수학입니다. 여기에 더해 통계학적인 지식도 큰 도움이 될 것입니다. 특히 학생이라면 수학·통계학·물리학 등을 열심히 공부하는 것이 중요합니다. 요즘은 서점에서도 AI 입문서를 쉽게 구할 수 있는데, 처음에는 감을 잡는다는 생각으로 한두 권 정도 읽어보는 것도 좋습니다. 관련 홈페이지에서 실습 예제를 찾아보면 큰 도움이 될 것입니다. 다양한 분야에 대한 호기심을 갖고 융합적 사고를 키운다면 AI를 활용하는 데 경쟁력을 갖출 수 있을 것입니다.
✓ 연구자이자 교육자로서 최종 목표는 무엇인가요?
s7_1_4.jpg
이번 노벨 화학상 수상은 AI가 연구적 도구에 그치지 않고,
인류 보편적으로 활용될 것임을 시사합니다.
우선 학생들을 위한 체계적인 커리큘럼을 구축하고 싶습니다. 현재 약학대 내에 AI와 관련된 교육 과정이 충분히 마련돼 있지 않은 상황이거든요. 학생들이 AI를 조금 더 쉽게 이해하고 활용할 수 있도록 돕는 수업을 만드는 것이 목표입니다. 연구자로서는 AI와 컴퓨터 시뮬레이션을 활용해 10~20년 이내에 실질적 도움을 줄 수 있는 약품을 개발하는 것이 최종적인 꿈입니다.
s7_1_5.jpg
이주용 서울대학교 약학대학 제약학과 교수
이주용 교수는
2005년 서울대학교 학부를 갓 졸업한 화학도였던 이주용 교수는 컴퓨터를 활용해 단백질 구조를 밝혀낸다는 동 대학 석차옥 교수의 연구에 호기심을 느껴 연구진에 합류했다. 단백질의 다양한 성질을 분석하고 예측하는 연구 과정이 그에게는 레고 블록을 조립하는 놀이처럼 흥미로웠다. 미국에서 박사후연구원 과정을 마친 뒤, 세상에 도움이 되는 성과를 이루고자 신약 개발 연구팀을 구성해 신약 후보 물질 탐색에 나섰다. AI의 등장 이후 단백질 구조 연구가 세계적으로 급속히 진전되면서 이주용 교수 연구팀도 AI와 물리 기반의 시뮬레이션을 이용해 신약 개발을 추진하고 있다.
s7_1_6.jpg
 이번 호 PDF 다운로드