카테고리 없음

30억 DNA 염기쌍 중 내 질병 유전자는

산포로 2010. 12. 31. 10:42

30억 DNA 염기쌍 중 내 질병 유전자는

 

 

개인별 맞춤의학 앞당기는 바이오인포매틱스

 

어떤 유전질환에 걸린 환자를 치료하는 방법 가운데 하나는 그 질환을 일으키는 유전자가 무엇인지를 연구하는 것이다. 그 다음 유전자 자체나 유전자가 만드는 단백질을 목표로 의약품을 개발하게 된다.

 

이를 위해 필요한 것이 유전자 지도다. 유전자 지도란 유전자 전체의 염기서열을 해독하는 작업이다. 최근 기술의 발달로 이런 유전자 지도를 만드는 작업은 빠르면 두 달이면 완료할 수 있게 됐다. 불과 10년 전만해도 유전자의 염기서열을 분석하는 데에는 9~10년이 소요됐다.

 

유전체 염기서열 분석 기술, 10년간 비약적 발전

 

유전자 염기서열 분석, 시퀀싱(Sequencing)기술이 비약적으로 발전한 계기는 지난 2001년 완료된 인간유전체프로젝트(HGP, Human Genome Project)이다. 2001년 2월 미 생명공학회사 셀레라지노믹스는 인간 DNA 샘플을 이용해 30억 쌍의 염기서열을 밝혀내고 인간유전체지도의 99%를 완성했다. 이후 2003년 4월 해독하지 못한 대부분의 염기서열을 해독해 인간유전체지도를 완성했다.

 

차세대 염기서열분석 NGS(Next Generation Sequencing)는 가장 최신의 상용화된 유전자 염기서열 분석 기술이다. NGS 기술의 발달로 이제는 훨씬 쉽고 저비용으로 대용량의 시퀀싱이 가능해졌다.

 

대학의 조그만 실험실에서도 시퀀싱할 수 있는 장비들이 등장했으며 DNA가 단순한 미생물의 경우 하루면 전체 유전체를 시퀀싱할 수 있다. 인간이나 작물과 같이 상대적으로 고등생물의 경우에도 몇 달이면 전체 유전체 해독이 가능할 정도로 시퀀싱 기술은 발전했다.

 

생물은 다양한 생체정보를 DNA 염기서열의 유전자로 표현하고 있다. 개체의 완전한 DAN 염기서열 정보는 생명현상을 이해하고 질병과 관련한 정보를 얻을 수 있다는 점에서 매우 중요하다.

 

때문에 DNA 염기서열 정보를 해독하는 시퀀싱의 핵심은 개인차 및 민족적 특성을 파악하거나 유전자 이상과 관련된 질환에서 염색체 이상을 포함한 선천성 원인과 규명, 당뇨병 고혈압, 암과 같은 복합 질병의 유전자 결함을 찾는 것이다.

 

유전자 염기서열 자체는 데이터, 유용한 정보로 가공해야

 

그런데 시퀀싱을 통해 해독한 DNA의 염기서열 자체는 데이터이지 그 자체가 유용한 정보는 아니다. 유전자 시퀀싱이란 DNA를 구성하는 염기인 A, T, G, C가 어떤 순서로 배열됐는지 그 서열순서를 하나하나 밝혀내는 작업이다.

 

인간유전체프로젝트 결과 인간의 유전체는 30억 쌍의 염기서열로 구성돼 있다는 점이 규명됐다. 30억이라는 방대한 유전 데이터가 어떤 의미를 갖는 정보인지를 연구하기 위해 태동한 학문이 이른바 ‘바이오인포매틱스(Bioinformatics)’이다. 바이오인포매틱스는 생물을 뜻하는 바이오와 정보를 뜻하는 인포매틱스를 합성한 신조어이다.

 

30억이라는 대규모의 정보를 다루기 위해 바이오인포매틱스는 컴퓨터를 이용한다. 즉 30억 개의 염기쌍 가운데 어떤 유전자가 단백질 합성에 활용되는 유전자인지, 이 유전자는 어떤 단백질을 만드는 유전자인지를 규명하는 학문이 바이오인포매틱스인 셈이다.

 

인간유전체프로젝트 이후 밝혀진 사실 가운데 하나는 사람 개인간 염기서열의 차이가 당초 과학자들의 예상보다 훨씬 크다는 점이다. 2000년 인간유전체프로젝트 당시만 해도 과학자들은 개인간 염기서열 차이는 0.1%에 불과할 것으로 내다봤다.

 

하지만 현재 과학계에서는 최대치로 3%까지 평가하고 있다. 3% 라는 수치는 유전자의 세계에서는 매우 큰 수치이다. 사람과 원숭이의 전체 유전자 염기서열 차이는 3%가 채 되지 않는다.

 

이런 개인별 염기서열의 차이는 특정 질환에 대한 약이 어떤 사람에게는 효과적일 수 있지만 반면 어떤 사람에게는 아무런 효과가 없을 수 있다는 점을 의미한다. 그 질환에 관련된 단백질이 염기서열의 차이로 사람마다 다를 수 있기 때문이다.

 

또 다른 중요한 시사점은 유전자 몇 개의 발현을 조절한다고 특정 질병을 치료하기는 매우 힘들다는 점이다. 인간유전체프로젝트 이전에 과학자들은 특정 질병과 관련한 유전자를 인간유전체프로젝트를 통해 찾으며 그 질병을 고칠 수 있을 것이라고 생각했다.

 

이런 기대는 인간유전체프로젝트에 대한 장밋빛 전망을 부풀린 측면이 없잖아 있다. 하지만 시퀀싱의 발달로 드러난 점은 어떤 질병을 야기하는 유전자를 찾아내더라도 그 질병을 100% 설명할 수는 없다는 점이다.

 

유전자 하나 규명으로 질병치료는 어려워

 

자가면역질환의 하나인 크론병의 경우 이 병에 관련된 유전자가 100개 가량인 것으로 밝혀졌다. 하지만 이 100개의 유전자를 완벽하게 이해하더라도 크론병의 단 20%에 대해서만 설명할 수 있는 것으로 과학계는 보고 있다.

 

‘Cancer Genome Project’는 암과 관련된 유전자를 해독하는 프로그램이다. 암과 관련된 유전자는 300~600개 정도로 추정되고 있다. 어떤 사람이 병원에서 A라는 암의 1기라는 진단을 받았을 때 이 600개 유전자 중에서 어떤 유전자가 A라는 암에 연관돼있는지를 규명하는 것은 현재까지 매우 어려운 작업이다.

 

약의 개발과 관련해 고전적인 방법으로 가상 약물 검사(Virtual Drug Screening)라는 것이 있다. 질병 관련 단백질의 3차원 구조를 알고 있다면 이 구조에 딱 들어맞는 화학물질을 컴퓨터 프로그램을 통해 찾아내는 기술이다. 질병 단백질에 정확하게 결합하면 질병 단백질의 기능을 붕괴할 수 있다.

 

그런데 이제는 하나의 단백질만을 대상으로 연구하는 것은 큰 의미가 없게 됐다. 유전자 몇 개를 조절해서 질병을 통제할 수 없다는 것은 결국 단백질 몇 개를 제어한다고 고칠 수 있는 병이 없다는 것을 의미하기 때문이다. 때문에 하나의 단백질이 아니라 질병과 관련된 단백질 전체 그룹을 찾는 것이 최근의 연구동향이다.

 

연세대 생명공학과 이인석 교수는 “사람마다 유전자 염기서열이 상이하고 특정 질환에 관여하는 단백질이 하나가 아니기 때문에 분자 수준에서 병의 요인을 찾고 유전자의 역할을 규명하는 개인별 유전체 해독이 약의 개발 못지않게 중요하게 됐다”고 말했다.

 

하나의 유전자가 질병을 모두 설명할 수 없고 개인마다 유전자의 차이가 크다는 점은 결국 개인별 유전체 해독을 바탕으로 한 개인별 맞춤의료 시대가 도래했다는 점을 의미한다. 기술의 발달로 유전체 시퀀싱 비용은 낮아지고 시간은 점점 줄어들고 있다.

 

바이오인포매틱스, 개인별 맞춤의학 앞당겨

 

10년 전 10년이 걸리던 인간 유전체 해독이 수년 내 몇 시간이면 이뤄질 전망이다. 2003년 인간 유전체 프로젝트는 총 13년 동안 27억 달러가 소요됐지만 2010년 할리우드 여배우 클렌 클로즈는 4만8천 달러로 자신의 유전체를 해독할 수 있었다.

 

최근 ‘1000 유전체 프로젝트’를 통해 각종 질환의 위험을 높이는 인간 변이유전자 지도의 95%가 완성됐다. 유전자변이는 DNA 염기의 배열순서가 달라지는 것으로 단 1개의 염기서열 순서가 바껴도 암과 같은 특정 질병의 발병률을 높이는 요인이 된다. 과학계는 향후 5년 내에 개인 유전체분석 서비스가 대중화되고 이를 바탕으로 개인맞춤형 의료시대가 열릴 것으로 내다보고 있다.
 
이성규 객원기자 | henry95@daum.net  2010.12.30

http://www.sciencetimes.co.kr/article.do?todo=view&atidx=0000047246