
이어 이같은 데이터를 활용해 사람들의 삶의 여정과 주요 변곡점을 나타낼 수 있는 AI 모델을 만들었다. 이때 삶의 주요 요소들을 마치 초거대언어모델이 단어를 다루는 것과 비슷한 방식으로 표현했다. 삶에서 일어나는 사건들이 언어 모델의 단어에 해당하는 셈이다.
연구진은 이 모델에 '라이프2벡(life2vec)'이란 이름을 붙였다. 수많은 단어들 사이의 의미적 거리를 다차원 벡터 공간에 나타냄으로써 AI 언어모델의 성능 향상에 크게 기여한 '워드2벡(word2vec)' 기술에서 딴 이름이다. 워드2벡은 단어 사이의 관계를 수학적으로 표현, 언어모델이 번역을 하거나 다음에 나올 단어의 확률을 정확하게 예측하게 하는 기반이 됐다.
라이프2벡 모델은 질병이나 보건, 거주지, 소득 수준 등 삶의 주요 사건이나 요소들을 벡터로 나타내 삶의 다음 단계를 예측한다.
연구진은 이 모델을 바탕으로 2016년 1월 이후 4년의 기간 동안 35-65세 사이 집단의 조기사망률을 예측했다. 사람들의 성격에 나타나는 미묘한 차이도 포착할 수 있었다. 이 모델은 기존의 다른 예측 모델에 비해 정확도가 11% 이상 높았다고 연구진은 밝혔다.
사회경제적 및 보건 관련 요소들 사이의 복잡한 연결 고리를 드러내는 방식을 통해 삶을 정확하게 예측할 수 있다는 가능성을 열었다는 평가다. 다만 실제로 적용하기 위해선 사생활 보호를 위한 엄격한 규제가 반드시 필요하다고 연구진은 밝혔다.
논문 제목은 Using sequences of life-events to predict human lives 이다.