최초입력 2025.04.29 16:44:20
이진환 한국단백체학회장·국가과학기술연구회 정책기획본부장
단백질 빅데이터 구축을 둘러싼 세계 각국의 경쟁이 치열하다. 단백질 구조분석 생성 인공지능(AI)인 알파폴드가 지난해 노벨 화학상을 수상한 것은 단백질 연구가 인류 생명과학 기술의 최첨단에 서 있음을 보여준다. 기술 발전으로 대량의 단백질 데이터를 확보할 수 있게 되면서 국가 주도의 빅데이터 구축 프로젝트가 본격화되고 있다. 그 규모와 투자는 놀라울 정도다.
대표적 바이오 빅데이터 인프라인 UK 바이오뱅크를 보유한 영국은 60만명의 혈액 샘플에서 약 5400종의 단백질을 분석하는 프로젝트를 추진 중이다. 중국은 인체 단백질 지도 완성을 목표로 2023년부터 30년간 수조 원을 투입해 ‘파이허브(π-HuB)’ 프로젝트를 진행하고 있다. 미국, 독일, 일본, 호주, 캐나다, 스웨덴 등도 독자적 전략으로 경쟁에 참여하고 있다.
이들이 빅데이터 구축에 주력하는 이유는 명확하다. 단백질 분석 프로젝트가 국제 협력 방식으로 진행됨에 따라 주도적으로 참여하거나 성과를 공유받기 위해선 자국 데이터를 보유해야 한다. 더불어 자국민의 건강 증진과 미래 의료·바이오 산업의 주도권 확보라는 국가 전략도 깔려 있다.
실제로 UK 바이오뱅크의 단백질 분석 프로젝트에는 14개 글로벌 제약사가 공동 투자하고 있다. 단백질 데이터가 신약 개발의 핵심 자원이기 때문이다. 중국 또한 자국의 단백질 분석 기술을 최대한 활용해 산업 생태계 전반의 경쟁력을 끌어올리고 있다.
한국도 단백질 빅데이터 구축으로 나아가는 뜻깊은 첫걸음을 뗐지만, 속도를 높여야 한다. 수만 명 규모의 참여자 모집과 데이터 생산, 자원화, 공유·활용까지 아우르는 방대한 사업이므로 국가 주도 추진이 필수다.
현재 추진 중인 ‘국가 바이오 빅데이터 구축사업’은 오는 2028년까지 77만명의 데이터를 확보하며, 일부 암 환자 조직 3000건에 대한 단백질 분석도 포함돼 있다. 그러나 유전자 중심의 설계로 인해 단백질 데이터의 양과 깊이 면에서는 한계가 존재한다. 참고로 일본은 이미 2018년 5000명의 혈액 샘플에 대해 단백질 분석 결과를 발표했다.
독일은 세계 최초로 인간 뇌 단백질 프로젝트를 가동해 분석 기술을 선점했고, 일본은 장기 코호트에 단백질 분석을 접목해 체계적인 빅데이터를 구축해 나가고 있다. 우리도 구체적인 로드맵과 단계적 실행 전략으로 나아가야 한다.
국내에서도 2000년대 초 국가 주도로 ‘프로테오믹스기술이용개발사업단’이 출범해 한국인의 주요 질환에 대한 단백질 탐색을 추진한 바 있다. 이 사업은 연구인력 양성과 임상기반 기술역량 확보의 발판이 되었다. 현재 미국 국립암연구소(NCI)가 주도하는 국제암유전단백체컨소시엄(ICPC)의 32개 프로젝트 중 6개를 국내 연구진이 주도적으로 이끌고 있다. 단백질 바이오마커 기반 유방암 조기 진단 기술을 상용화한 국내 기업도 있다.
우리는 후발주자이지만 아직 기회는 있다. 공간단백질 분석 분야에서도 정부 과제를 통해 원천 기술 확보에 도전 중이다. 국가 단백질 빅데이터가 체계적으로 구축되고, 연구자와 기업에 활용 기회가 열릴 때 한국의 단백체학 기술력 향상과 성과 창출은 과속화 되고 글로벌 정밀의료와 바이오 산업을 선도할 수 있을 것이다.
[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]