카테고리 없음

우버가 개발한 배차용 AI 코로나19 변이 다음 우세종 족집게처럼 찾았다

산포로 2022. 5. 26. 20:08

우버가 개발한 배차용 AI 코로나19 변이 다음 우세종 족집게처럼 찾았다

 

과학자들은 인공지능(AI)으로 코로나19 변이 중 우세종이 될 변이를 미리 추려내는 기술을 개발했다. 브로드연구소 제공

 

차량공유기업 우버가 개발한 인공지능(AI) 기계학습 기법을 활용해 신종 코로나바이러스 감염증(COVID-19·코로나19) 돌연변이를 분석해 어떤 변이가 우세종이 될지를 미리 예측하는 기술이 개발됐다. 기존 데이터로 분석한 결과 전 세계 우세종이 된 스텔스 오미크론 변이나 2021년 새로 등장한 알파 변이와 같은 변이가 우세화하기 한 달 전에 미리 존재를 확인할 수 있었다.

 

제이콥 르미외 하버드 의대 교수와 프리츠 오버마이어 브로드연구소 기계학습 펠로우 연구팀은 코로나19 유전자 변이를 분석해 어떤 변이가 우세종이 될지를 예측하는 기계학습 모델 ‘파이아낫(PyR0)’을 개발했다고 25일 국제학술지 ‘사이언스’에 발표했다. 기초재생산지수를 뜻하는 R0는 바이러스가 한 사람이 다른 사람을 얼마나 감염시킬 수 있는지는 나타내는 감염력 지표다.

 

전 세계 과학자들은 코로나19 발발 초기부터 다양한 코로나19 바이러스 변이의 감염력 정도를 예측하기 위해 노력해왔다. 그러나 메신저리보핵산(RNA) 바이러스인 코로나19 바이러스는 변이가 만들어지는 속도가 빠르고 변이도 다양해 모든 변이를 비교해 감염력을 찾는 데 어려움이 컸다. 변이 게놈 수천 개를 비교하는 데만 수일이 걸렸다.

 

파이아넛은 기존 게놈분석기술과 달리 수백만 개의 코로나19 바이러스 게놈을 1시간 만에 분석하는 능력을 갖췄다. 연구팀은 코로나19 변이의 게놈을 공유하는 국제인플루엔자정보공유기구(GISAID)에 올해 1월까지 올라온 코로나19 게놈 640만 개를 파이아넛에 학습시켰다. 파이아넛은 비슷한 게놈 서열을 그룹화한 다음 공유하는 유전자 돌연변이 집합을 정의하고 여러 변이체에서 나타나는 돌연변이에만 초점을 맞춰 계산 속도를 높였다.

 

돌연변이들로 분류한 이후에는 어떤 돌연변이가 흔해지고 있는지를 확인해 돌연변이가 바이러스를 얼마나 빨리 퍼트릴 수 있는지를 추정한다. 유전적 구성에 따라서 변이들이 어떤 비율로 증가할지도 추정한다. 코로나19 변이 하나하나가 어떤 능력을 가지는지는 알지 못하지만 서로가 가진 돌연변이 비교를 통해 결국 어떤 돌연변이를 가진 변이가 우세종이 될지는 알아낼 수 있다.

 

파이아넛은 실제 우세종으로 등장했던 변이의 확산을 앞서 예측하는 능력을 보였다. 연구팀이 올해 1월까지 데이터를 토대로 향후 우세종을 분석한 결과 오미크론 변이의 하위 변이로 현재 전 세계 우세종이 된 스텔스 오미크론(BA.2)의 증가를 예측해냈다. 스텔스 오미크론은 3월부터 전 세계에 빠르게 퍼지며 우세종이 됐다. 기존 변이보다 감염력이 60% 높아졌던 알파 변이도 세계보건기구가 우려 변이로 지정하기 한 달 전인 2020년 11월 말 우세종 가능성을 예고했다.

 

우세종을 먼저 찾아낼 수 있으면 코로나19 확산을 미리 예측하는 데 활용할 수 있다. 자세히 연구할 돌연변이를 미리 결정해 전염성 증가와 중화항체 회피 능력을 예측하는 데도 도움을 줄 수 있다. 마틴 잔코윅 브로드연구소 기계학습 펠로우는 “코로나19 게놈은 이제 많은 돌연변이를 축적했기 때문에 모든 돌연변이 조합을 조사하는 것이 극도로 어렵다”며 “파이아낫은 게놈을 전체적으로 볼 수 있고 실험실에서 덜 주목받는 변이를 미리 가리킬 수 있다”고 말했다.

 

파이아넛은 우버의 AI랩스에서 개발한 기계학습 ‘파이로(Pyro)’를 토대로 만들어졌다. 우버는 운전자와 탑승자 매칭과 최적 경로 제안 등에 활용하기 위한 AI용 기계학습 기술을 2017년 오픈소스로 공개했다. 불확실한 변수가 많을 때 결과를 빠르게 예측할 수 있어 과학 분야에서 오히려 활용 폭이 컸다. 우버 AI랩스에서 파이로를 개발하는 데 참여한 오버마이어 펠로우가 2020년 브로드연구소에 합류하며 코로나19를 비롯한 생물학에 우버의 기계학습을 적용하는 연구가 시작됐다.

 

파디스 사베티 하버드대 공중보건대학원 전염병학과 교수는 “모든 데이터를 살펴보고 하나의 예측을 내 놓는 기계학습 기반 접근 방식은 매우 가치가 있다”며 “무엇이 부상하고 잠재적 위협이 될지 식별하는 데 도움이 된다”고 말했다.

 

동아사이언스 (dongascience.com) 조승한 기자 shinjsh@donga.com 2022.05.26 06:35