카테고리 없음

[젊은 두뇌가 뛴다]⑧ AI로 생명체의 미개척지 탐험하는 세포 지도 그린다

산포로 2023. 3. 6. 09:12

[젊은 두뇌가 뛴다]⑧ AI로 생명체의 미개척지 탐험하는 세포 지도 그린다

백민경 서울대 생명과학부 교수 인터뷰
2021년 세계적 연구 성과 ‘로제타 폴드’ 개발
신약 개발 위한 단백질 상호작용 연구
해외 제안 뿌리치고 제자 양성 위해 귀국
인체 상호작용 밝힐 디지털 세포 지도 목표

 

한국계 최초로 수학계의 노벨상으로 불린 ‘필즈상’을 받은 허준이 프린스턴대 교수는 1983년생이다. 나이를 따지는 한국 사회에서 1980년대생은 아직 젊은 실무진 축에 속하지만, 과학계에선 위상이 남다르다. 30대 중후반에서 40대 중반까지는 연구자의 역량과 아이디어가 빛나는 시기로 불린다. 한국연구재단에 따르면, 노벨상 과학 부문 수상자들이 자신의 핵심 연구를 처음 시작한 평균 연령이 37.9세로 나타났다. 조선비즈는 한국의 기초 과학과 공학을 이끌 차세대 리더들을 독자들께 소개하는 인터뷰 시리즈를 시작한다. 젊은 과학자들은 한국공학한림원과 한국과학기술한림원의 추천을 받아 선정했다. ‘제2의 허준이’를 넘어서 한국의 첫 노벨상 과학 부문 수상자, 그리고 한국 산업의 미래를 이끌어갈 핵심 인재가 이들에게서 나오기를 기대한다. [편집자주]

 

‘생명과학의 발전을 끌어갈 돌파구(Breakthrough)’, 단백질의 구조를 예측한다는 수십년의 꿈은 이제 현실이 됐다. 세포의 비밀을 이해하는 것부터 신약 개발까지 우리의 미래를 바꿔놓을 것이다.”

 

국제학술지 ‘사이언스’는 2021년 ‘올해 최고의 연구 성과’로 단백질 구조 예측 인공지능(AI) ‘로제타폴드’를 선정했다. 로제타폴드는 데이비드 베이커 미국 워싱턴대 생화학과 교수와 당시 베이커 교수의 연구실에서 박사 후 연구원으로 근무하던 백민경 서울대 생명과학부 교수(34)가 개발한 AI 소프트웨어다. 베이커 교수팀은 그해 사이언스에 이 AI를 처음 공개했다. 로제타폴드는 단백질의 아미노산 염기서열을 바탕으로 3차원(3D) 구조를 예측하는 AI 모델로, 정확도 90% 이상을 달성하는 데 성공했다. 사이언스는 “로제타폴드가 생명과학의 발전을 끌어갈 돌파구(Breakthrough)로 단백질의 구조를 예측하려는 수십년의 꿈은 이제 현실이 됐다”며 “세포의 비밀을 이해하는 것부터 신약 개발까지 우리의 미래를 바꿔놓을 것”이라고 극찬했다.

 

백민경 서울대 생명과학부 교수는 "한국에 돌아와 후배들을 양성하는 것이 목표"라고 말했다. 실제로 그는 좋은 조건의 여러 제안을 뿌리치고 서울대 생명과학부 교수로 자리를 잡았다. /박상훈 기자

 

사이언스의 올해 최고의 연구 성과에 이름을 올린 한국인은 백 교수가 처음이다. 전 세계가 주목한 연구 성과를 남긴 백 교수는 지난해 8월 한국으로 돌아와 서울대 생명과학부 교수가 됐다. 지난 14일 서울 관악구 서울대 관악캠퍼스에서 만난 백 교수는 “여러 제안을 두고 고민하던 중 한국에서 후배들의 길을 열어주고 싶어 복귀를 결심했다”고 말했다.

 

한국으로 돌아온 백 교수는 로제타폴드를 넘어 서는 새로운 AI 모델 개발을 꿈꾸고 있다. 세포에 있는 모든 물질의 상호작용을 밝히고 이를 표현할 수 있는 ‘디지털 세포 지도’다. 만일 디지털 세포 지도가 완성된다면 생명과학 연구나 신약 개발에 필요한 시간과 노력은 크게 줄어들 수 있다.

 

다음은 일문일답.

 

-한국에 들어온 이후 어떻게 지내고 있나.

 

“꽤 바쁜 시간을 보냈다. 연구 제안서를 쓰기도 하고, 각종 정책 포럼에도 참여하고 있다. 최근에는 연구실에 학생들을 받아 새로운 연구도 준비하고 있다.”

 

-로제타폴드 개발자로 국내에서도 이름을 알렸다. 로제타폴드를 개발하게 된 계기가 있나.

 

“원래 대학원에서 ‘계산화학’을 전공했다. 컴퓨터 계산방법을 바탕으로 단백질의 구조와 상호작용을 연구하는 분야다. 박사 후 연구원으로 베이커 교수의 연구실을 선택한 것도 그가 단백질 구조 분야의 석학이었기 때문이다. 그 때가 2019년쯤이었는데, 당시 단백질구조예측대회(CASP)에서 눈에 띄는 참가팀과 참가작이 있다는 소식을 들었다. 그게 바로 구글 딥마인드의 알파폴드였다. 알파폴드의 등장에 자극을 받고 연구를 시작했다.”

 

-원래 AI에 관심이 많았나.

 

“그렇지는 않았다. 그런데 알파고, 알파폴드 같은 AI 모델을 보면서 ‘이제는 AI를 다룰 줄 모르면 뒤쳐질 수 있겠다’는 생각이 들었다. 그래서 박사과정에 재학할 때 공부를 시작했다. 논문을 보면서 코딩을 해보기도 하고, 학회에서 마련한 AI 관련 세미나와 교육프로그램에도 적극적으로 참여했다. 사실 로제타폴드 개발 때문에 대단한 실력을 갖고 있을 것이라고 오해하는 사람들이 많은데, 실제로는 그렇지 않다. 핵심적인 알고리즘을 개발하는 것은 여전히 전문 분야가 아니다.”

 

-베이커 교수 연구실에 합류한지 2년여 만에 로제타폴드 연구 결과를 발표했다. 실제 개발에 얼마나 걸렸나.

 

“실제 로제타폴드 개발에는 1년이 채 걸리지 않았다. 2020년 12월 본격적으로 시작해 초기 버전은 1달만에 완성됐다. 이후에는 성능을 끌어 올리는데 4달 정도가 걸렸다. 논문에 소개된 최종 형태가 만들어진 것은 2021년 5월쯤이다.”

 

국제 학술지 '사이언스'가 2021년 '올해 최고의 연구 성과'로 로제타폴드를 선정했다. /AAAS

 

 

-개발 과정에 어려움은 없었나.

 

“초기 버전을 만드는 것은 그다지 어렵지 않았다. 이미 알파폴드에 적용된 아이디어는 전문가들 사이에서는 잘 알려져 있던 부분이다. 알파폴드가 코드를 공개한 것도 큰 도움이 됐다. 그런데 정확도를 높이는 것은 다른 문제였다. 미세한 코드 조정이 필요했지만, 나도 AI 전문가가 아니고, 도움을 받을 만한 전문가도 없었다. 수차례 수정해 정확도를 높이는데 성공했고, 다른 연구실에서 연구하던 단백질의 염기서열을 받아 미리 예측해주면서 성능을 확인했다. 그 결과 꽤 만족스러운 결과를 얻었다.”

 
-로제타폴드 개발 이외의 연구성과는 잘 알려지지 않았다. 다른 성과도 소개해달라.

 

“로제타폴드 이후에 AI로 ‘효모’에서 단백질의 상호작용을 예측한 논문이 대표적이다. 단백질 상호작용은 생명체에게 가장 중요한 부분으로, 신약 개발에 핵심이 되지만, 밝혀진 부분은 많지 않다. 알파폴드나 로제타폴드로도 단백질의 상호작용을 예측하는 것은 아직 어려운 단계다. 알파폴드와 로제타폴드를 결합해 약 900개의 단백질 상호작용을 찾아냈다.”

 

-짧은 시간에 좋은 성과를 많이 냈다. 좋은 제안이 많았을텐데 한국으로 복귀한 이유는 무엇인가.

 

“한국으로 돌아 온 이유는 여러가지가 있다. 사실 미국 대학에서 좋은 조건을 제시하기도 했다. 나 혼자 좋은 성과를 내는 것보다는 훌륭한 연구자들을 키워 더 많은 한국의 인재들이 활약할 수 있게 하고 싶어 한국으로 들어 왔다. 기업에서도 좋은 조건을 많이 제시해줬다. 기업과 대학에서 제시하는 처우 차이가 꽤 컸다. 그래도 인력 양성을 하려면 대학에서 연구하는 것이 좋겠다고 생각했다.”

 

-베이커 교수가 붙잡지는 않았나.

 

“내가 계속 남아주길 바랐다. 그래도 이왕 한국행을 결정했으면 ‘하고 싶은 연구를 하라’는 조언도 해줬다. 베이커 교수와 일하면서 내가 하고 싶은 연구를 참 많이 했던 것 같다. 학생들도 이런 환경에서 일할 수 있게 해주고 싶다.”

 

-인재들이 많아지려면 관련 산업이 발전해야 한다.

 

“최근 정부에서 디지털바이오에 대한 관심이 커지고 있다. 여러가지 육성 지원책도 만들고 있는 것으로 알고 있다. 단백질 구조는 특히 신약 산업과 관련돼 있다. 실제로 알파폴드를 이용해 신약을 개발하겠다는 기업도 나타나고 있다. 베이커 교수 연구실에서 만든 신약 벤처에서도 로제타폴드를 신약 개발 플랫폼으로 활용하고 있다.”

 

로제타폴드로 예측한 단백질 IL-12와 수용체가 결합한 구조. /Ian Haydon/Institute for Protein Design

 

-알파폴드, 로제타폴드 이후 주목할 만한 단백질 구조예측 AI가 나오지 않고 있다.

 

“이미 알파폴드와 로제타폴드가 출중한 능력을 갖고 있기 때문에 당장 개선된 모델의 필요성이 크지 않다. 대신 여러 단백질이 결합해 이루는 3차원 구조, 항원과 항체 결합을 예측할 수 있는 모델이 필요하다. 지금 알파폴드가 아무리 높은 예측력을 보여도 결국 단백질에 유기분자가 어디에, 어떻게 결합하는지는 아직 예측을 잘 하지 못한다. 만약 이걸 예측할 수 있다면 신약 개발 분야에서 큰 임팩트를 남길 수 있다.”

 

-신약 개발에 관심이 원래 많았나.

 

“어릴 때 꿈이 신약을 개발하는 과학자가 되는 것이었다. 그래서 화학과에 진학을 한 것이다. 그런데 실제로 유기화학 실험을 해보니 나와 맞지 않다는 것을 깨달았다. 대신에 실험을 하지 않고도 연구할 수 있는 방법을 찾다가 계산화학을 전공하게 된 것이다.

 

-지금 하고 있는 연구도 단백질의 상호작용을 예측하는 것인가.

 

“몇 가지 새로운 연구를 준비하고 있다. 궁극적인 목표는 세포에 있는 모든 물질의 상호작용을 예측하는 것이다. ‘디지털 세포 지도’라고 이름 붙일 수 있을 것 같다. 생체 분자의 상호작용을 이해해 생명이 가진 비밀을 풀고, 질병을 극복할 수 있을 것이라고 기대한다.

 

-AI 기술을 생명과학·의학 연구에 접목하려는 시도가 최근 활발하다. 한국의 경쟁력은 어느 수준인가.

 

“연구의 양적인 면과 질적인 면을 따로 따져보면 질적인 면은 매우 우수하다. 그러나 다른 분야와 비슷하게 양적인 면에서는 선진국에 비해 부족한 편이다. 그 이유 중 하나는 연구 인력의 부족이다. 연구자들이 연구에 활용할 컴퓨팅 자원도 풍부하지 않다. 해외의 경우에는 국가 차원의 컴퓨팅 자원 지원이 풍부하다. 한국도 이제 막 인프라를 넓히고 있다. 지금도 여전히 베이커 교수와 협력을 통해 컴퓨팅 자원을 활용하고 있다.”

 

백민경 서울대 생명과학부 교수는 궁극적인 목표로 '디지털 세포 지도' 제작을 꼽았다. 인체 세포가 가진 모든 물질의 상호작용을 밝히겠다는 목표다. /박상훈 기자

 

-개선되고 있는 부분이 더 있나.

 

“AI에서 가장 중요한 것은 풍부한 데이터다. 단백질 구조를 연구할 때도 표준화된 데이터베이스가 있어서 생각보다 수월했다. 그런데 디옥시리보핵산(DNA), 리보핵산(RNA)의 상호작용에 대한 데이터는 거의 없다. 베이커 교수 연구실에서는 100명 이상의 연구원들이 함께 데이터를 만들기 때문에 연구가 가능하지만, 한국에서는 연구실이 소규모 단위로 이뤄져 있어 이마저도 쉽지 않았다. 그런데 최근 관련 연구자들이 모여서 학회나 연구회를 만들자는 목소리가 나오고 있다. 연구자들이 힘을 합쳐 데이터를 만들고, 새로운 가치를 창출해낼 수 있을 것으로 기대한다.”

 

-앞으로 목표는 무엇인가.

 

“교육자로서, 과학자로서 다른 목표가 있다. 교육자로서는 좋은 학생들이 과학계, 산업계로 진출할 수 있는 길을 닦아주는 것이다. 그러려면 연구도 잘해야 하고, 산업에서 활용할 수 있을 만한 응용 분야도 만들어야 한다. 과학자로서는 생명체가 가진 모든 생체 분자의 상호작용을 연구하는 것이다.”

 

백민경 서울대 생명과학부 교수는

 

1990년에 태어났다. 2013년 서울대 화학부를 졸업한 뒤 같은 학교에서 석사와 박사를 마쳤다. 2018~2019년 서울대 화학분자공학사업단 연수연구원, 2019~2022년 미국 워싱턴대 박사 후 연구원을 거쳐 2022년부터 서울대에서 교수로 일하고 있다.