검색창 열기
R&Dism> 슬기로운 기술 생활
질병 치료의 열쇠,
단백질 구조의 비밀
김형자 과학 칼럼니스트

우리가 음식을 통해 섭취하는 단백질은 생명 유지에 꼭 필요한 영양소입니다. 생물체 내에서 세포 생성과 성장, 대사 작용 등 모든 생명 현상을 담당하는 일꾼 역할을 합니다. 단백질의 기능은 단백질의 구조와 직접 연관되어 있습니다. 단백질 구조는 ‘질병 치료의 핵심 열쇠’이기도 합니다. 이렇듯 중요한 단백질은 과연 어떻게 만들어지고, 어떤 구조를 하고 있을까요?

DNA가 RNA를 거쳐 단백질 만들어내
단백질은 생물체를 구성하는 구성 성분이자 세포 안에서 벌어지는 거의 모든 생명 반응에 관여하는 기본단위입니다. 우리 몸의 근육과 피부, 손톱, 발톱, 머리카락 등이 모두 단백질로 이뤄져 있고, 성장호르몬·성호르몬의 주요 성분 또한 단백질입니다. 또 혈액 속의 적혈구·백혈구, 세균·바이러스 등에 맞서 싸우는 면역에 중요한 항체도 단백질입니다.

단백질, 지방, 탄수화물은 3대 영양소입니다. 그중에서도 단백질은 으뜸으로 꼽을 만합니다. 단백질의 영어명 프로틴protein은 ‘첫 번째의, 가장 중요한’을 뜻하는 그리스어 프로테이오스proteios에서 유래했습니다. 그만큼 단백질이 중요하다는 의미입니다.

그렇다면 단백질은 어떻게 만들어질까요. 1953년 미국의 분자생물학자 제임스 왓슨과 영국의 생물학자 프란시스 크릭이 DNA의 이중나선 구조를 밝힌 이후 과학자들은 생명 현상에서 유전자가 ‘있다’는 사실 못지않게 유전자가 ‘기능한다’는 점에 더욱 주목했습니다.

여기서 기능한다는 의미는 단백질을 만든다는 뜻입니다. 이를 ‘유전자 발현’이라 합니다. 유전자는 유전 형질을 규정하는 인자이고, 유전자의 본체는 DNA입니다. 따라서 DNA는 유전정보의 창고입니다. 즉 유전자는 세포 내에서 어떤 단백질을 만들 것인가에 대한 정보를 갖고 있을 뿐, 세포의 기능을 실제로 좌우하는 것은 유전자로부터 만들어지는 단백질인 것입니다.

1958년 크릭은 DNA의 유전정보가 단백질로 전달된다는 ‘센트럴 도그마central dogama’라는 가설을 내놓았습니다. 이는 DNA가 생존에 필요한 여러 단백질을 합성할 때 RNA(리보핵산)라는 중간단계를 거쳐 단백질을 만들고, 그 과정에서 DNA의 유전정보가 RNA를 거쳐 단백질에 담긴다는 이론입니다.

이후 많은 과학자들이 이 가설을 실험적으로 증명하기 위해 도전했습니다. 그 결과 8년 뒤인 1966년 미국의 로버트 홀리와 마셜 니런버그, 고빈드 코라나가 아데닌(A)-구아닌(G)-티민(T)-시토신(C)이 수없이 나열된 DNA의 염기서열을 알아내는 데 성공했습니다. DNA에서 전달된 RNA의 유전정보는 ‘AGC’처럼 3개의 염기가 모여서 하나의 특정 아미노산을 만들어내는 방식으로 발현되고, 단백질을 구성하는 아미노산은 모두 20가지가 존재한다는 사실을 밝혔습니다. 이 20가지의 아미노산이 실에 꿴 구슬처럼 수백에서 수천 개 연결돼 단백질이 됩니다. 이 같은 공로로 세 사람은 1968년 노벨 생리의학상을 수상했습니다.
s6_1_1.jpg
제임스 왓슨
s6_1_2.jpg
프란시스 크릭
아미노산이 단백질을 구성하는 밑바탕
s6_1_3.jpg
단백질은 탄소, 수소, 산소, 질소 분자로 구성되어 있습니다. 그리고 세포라는 화학 공장에서 이 분자들이 모여 글리신·히스티딘 등 아미노산을 구성하고, 20가지의 아미노산이 다양하게 조합된 한 줄짜리 단백질을 탄생시킵니다.

아미노산은 중심이 되는 탄소 원자에 아미노기-NH2, 카르복실기-COOH, 특정한 곁사슬(R기)로 결합되어 있습니다. 이를 ‘펩티드 결합’이라고 부릅니다. 이때 2개 이상의 아미노산이 연결된 것을 ‘펩티드’, 약 10개 이상의 아미노산이 연결된 것은 ‘폴리펩티드’라 합니다. 이 폴리펩티드가 둘 또는 그 이상 모여서 하나의 집합체를 형성하고 있는 것이 바로 단백질입니다. 단백질의 화학식은 NH2CHRnCOOHn입니다.
단백질은 생김새가 중요합니다. 단백질의 입체 구조가 곧 단백질의 기능을 결정짓기 때문입니다. 인체의 단백질은 10만 개 정도 되는데 기능이 천차만별입니다. 개개인의 성격과 체질이 다 다른 것도 실은 각 개인이 가지는 단백질의 차이에 있습니다. 이는 아미노산의 배열 순서에 따라 결정되고, 이 순서는 각 개인이 그의 조상으로부터 받은 유전인자에 이미 기록되어 있습니다. 단백질은 유전자 정보로부터 만들어지기 때문에 유전자 정보를 바꾸는 돌연변이는 단백질 구조를 바꾸기도 합니다. 그에 따라 기능도 함께 바뀔 수 있습니다.

단백질의 중요한 기능 중 하나는 ‘효소 기능’입니다. 효소는 화학 반응의 속도를 조절해주는 물질로, 단백질로 만들어집니다. 사람을 포함한 동물이나 식물의 생존에 필요한 수많은 복잡한 생화학 반응이 모두 효소에 의해 진행됩니다.

우리가 단백질을 음식으로 섭취하면, 단백질은 효소에 의해 먼저 아미노산으로 분해됩니다. 이 아미노산이 인체 세포에서 새로운 단백질을 만드는 데 사용됩니다. 효소 덕분에 음식물을 소화시킬 수 있고, 포도당을 아미노산으로 바꾸기도 합니다. 인체 세포 내에 효소가 없으면 이런 반응들이 너무 느리게 진행돼 우리 몸에 여러 이상 증세가 나타나 건강을 악화시킵니다.
반세기 난제, 3차원 구조의
‘단백질 접힘’
이처럼 다양한 기능을 가진 단백질은 아미노산이 다양한 순서로 고리를 이루며 연결되면서 형성됩니다. 이 과정에서 아미노산 사슬이 가장 안정한 상태를 찾을 때까지 복잡하게 얽히고 꼬여 3차원의 입체 구조가 형성됩니다. 이를 ‘단백질 접힘’이라고 합니다.

단백질의 입체 구조를 알아내는 것은 과학자들의 가장 근본적인 숙제 중 하나입니다. 주어진 아미노산 서열로 만들 수 있는 단백질의 구조를 알아내야 체내에서 이 단백질이 어떤 기능을 하는지 알 수 있고, 생체 내 상호작용이 밝혀져야 단백질의 이상으로 생기는 알츠하이머치매나 파킨슨병 같은 난치성질환의 원인을 찾거나 치료 방법을 개발할 수 있습니다.

단백질은 보통 생체 내에서 다른 단백질과 상호작용하면서 그 기능을 발휘합니다. 따라서 특정 단백질의 상호작용을 방해할 수도 있습니다. 이때 단백질 간 상호작용을 조절하는, 분자량이 매우 적은 소분자의 작용이 중요합니다. 이들 작용을 조절할 수 있는 능력은 질병 치료에 있어 강력한 도구가 될 수 있습니다. 질병의 원인인 표적 단백질 표면에 소분자가 잘 결합하느냐에 따라 질병 치료에 대한 약의 효능이 결정되기 때문입니다.

단백질의 구조는 긴 사슬의 아미노산 분자들이 서로 상호작용하는 방식, 주변 환경 조건에 따라 접히는 모양이 달라집니다. 수많은 변수가 관여하는 셈입니다. 따라서 아미노산 하나하나가 어떻게 접혀서 단백질이 만들어지는지 밝혀내기는 엄청 힘듭니다.

예를 들어 세포막 위에 존재하는 막단백질의 경우 막에서 분리되면 구조가 변하기 때문에 실험을 통해 그 구조를 확인하는 작업이 까다롭습니다. 또 이론적으로 만들 수 있는 무수한 단백질의 구조를 일일이 실험으로 확인하는 방법도 한계가 있습니다.
s6_1_4.jpg
과학자들이 해독한 단백질 구조 1%에 불과
현재 과학자들은 새 질병 치료법 개발을 위해 단백질과 소분자 사이의 상호작용을 분석하려고 연구 중입니다. 하지만 소분자에 결합하는 단백질조차 가려내기 어려워 이들 작용을 분석하는 건 인류의 50년 넘는 난제였습니다. 또 단백질과 단백질이 넓고 얕은 결합 면으로 이뤄져 상호작용하기 때문에 소분자는 강하게 결합하지 못해 소분자를 이용한 약물 개발이 쉽지 않은 실정입니다.

그동안 과학자들은 X선이나 핵자기공명, 극저온 전자현미경 등의 장비를 활용해 단백질의 3차원 구조를 해독해왔습니다. 지구상에서 존재가 확인된 단백질은 2억 개 이상입니다. 하지만 이 같은 방법으로 세계 과학자들이 밝혀낸 단백질 구조는 지금까지 약 1%에 불과합니다. 이러한 속도로 2억 개의 단백질 구조를 확인하려면 기약 없는 시간을 보내야 할 상황입니다.

사람이 직접 해독하는 방식은 정확한 결과를 낼 수 있다는 장점이 있습니다. 반면 비용이 많이 들고 시간도 오래 걸린다는 게 단점입니다. 어떤 단백질의 구조는 10년이 넘게 걸려도 실마리를 잡지 못하기도 합니다. 컴퓨터 시뮬레이션으로 구조를 예측하는 방법도 시도됐지만 계산 시간이 길었고, 시뮬레이션에 필요한 에너지 함수가 부정확해 정확도도 떨어졌습니다.
AI, 신약 개발 새 지평 열어
최근 인공지능AI이 이러한 판도를 확 바꿔놓았습니다. 구글 딥마인드의 알파폴드1(2018년 개발)과 알파폴드2 (2020년 개발)가 순식간에 2억 개 이상의 단백질 구조를 예측한 것입니다.
지구상 거의 모든 동물, 식물, 박테리아 등에서 발견된 단백질 구조인 셈입니다. 지난해에는 ‘알파폴드3’로 단백질의 결합 구조까지 정확히 예측해냈습니다.

전 세계의 내로라하는 생물학 석학들이 단백질 구조 하나를 파악하는 데는 수개월에서 수년이 걸립니다. 반면 알파폴드 시리즈는 50년 넘게 난제였던 ‘단백질 접힘 문제’를 풀어내는 데 몇 분에서 몇 시간밖에 걸리지 않고 해결한 것입니다. 아미노산 서열은 유전자 정보로부터 추정할 수 있습니다. 따라서 AI에게 유전자나 아미노산 서열 같은 정보를 주면 그로부터 단백질 구조를 예측할 수 있습니다.

구글 딥마인드는 또 2024년 단백질을 설계하는 AI ‘알파 프로테오’를 후속으로 공개했습니다. 이 AI는 자연에서 발견한 적 없는 새로운 단백질을 설계하는 ‘생성 모델’입니다. 엔비디아의 ‘바이오니모’, 메타의 ‘ESM 폴드’, 지난해 노벨 화학상 수상자인 데이비드 베이커 교수팀의 ‘로제타폴드’도 단백질을 설계하는 AI입니다. 이들 AI는 텍스트로 단백질의 모양과 크기, 기능과 같은 속성을 입력하면 이에 적합한 새로운 단백질 디자인을 생성해냅니다.
s6_1_5.jpg
노벨 화학상을 수상한 데이비드 베이커
미국 워싱턴대 교수가 단백질 구조를 들고 설명하고 있다.
단백질 생성 AI의 쓰임새는 무궁무진합니다. 신약 개발뿐 아니라 인류의 당면 문제까지 해결하는 일이 가능합니다. 어떤 과학자는 플라스틱을 분해하는 효소를 개발해 환경문제를 해결할 수 있고, 어떤 과학자는 기후 친화적 시멘트를 생산해 탄소중립에 도움을 줄 수 있습니다. 이러한 활용성을 통해 AI가 지구온난화를 비롯해 인류의 희귀 난치병 정복에 결정적 역할을 하길 기대합니다.
s6_1_6.jpg
구글 딥마인드는 2024년 단백질을 설계하는
AI ‘알파 프로테오’를 후속으로 공개했다.
s6_1_7.jpg
2억 개 이상의 단백질 구조를 예측한 구글 딥마인드의 알파폴드
s6_1_8.jpg
김형자 과학 칼럼니스트
청소년 과학 잡지 <Newton> 편집장을 지냈으며, 현재 과학 칼럼니스트와 저술가로 활동 중이다.
저서로는 <구멍에서 발견한 과학>, <먹는 과학책> 등이 있다.
 이번 호 PDF 다운로드