매일경제 빌리어드뉴스 MK빌리어드뉴스 로고

네이버, 추론 모델 ‘하이퍼클로바X 씽크’ 공개…“최상급 언어 능력 갖춰”

한국어 통사론 등 전문가 레벨 평가에서 국내 및 글로벌 비교군 중 최고 수준 점수 비전 멀티모달 결합해 시각 추론 기술 확보 수능 생명과학 그래프 문제도 풀어내 “추론모델 오픈소스화도 계획 중”

  • 안선제
  • 기사입력:2025.06.30 11:11:09
  • 최종수정:2025.06.30 11:11:09
  • 프린트
  • 이메일
  • 페이스북
  • 트위터
한국어 통사론 등 전문가 레벨 평가에서
국내 및 글로벌 비교군 중 최고 수준 점수
비전 멀티모달 결합해 시각 추론 기술 확보
수능 생명과학 그래프 문제도 풀어내
“추론모델 오픈소스화도 계획 중”
[사진 = 네이버]
[사진 = 네이버]

네이버가 추론 능력을 강화한 생성형 인공지능(AI) ‘하이퍼클로바X 씽크(HyperCLOVA X THINK)’ 개발을 완료하고 모델의 세부 정보를 소개하는 테크니컬 리포트를 발표했다고 30일 밝혔다. 해당 모델은 추론 능력을 기반으로 한국어 통사론, 의미론, 화용론 등 전문가 레벨 평가에서 비교군 중 최고 수준 점수를 기록한 것으로 나타났다.

네이버에 따르면 ‘KoBALT-700’ 벤치마크로 주요 LLM(거대언어모델)의 언어 능력을 측정한 결과, 하이퍼클로바X 씽크는 유사 규모로 구축된 국내 주요 추론모델 및 글로벌 최고 수준 오픈소스 모델보다 더 높은 점수를 기록했다.

해당 벤치마크는 서울대학교 언어학과에서 LLM의 깊이 있는 한국어 이해도를 진단하기 위해 설계됐으며, AI가 대화의 격률을 적절하게 파악하는지, 문장의 논항 구조를 정확히 분석하는지 등을 평가하는 전문가 수준의 문항들로 구성돼 있다.

또 다른 대표적인 한국어 성능 평가 지표인 ‘HAERAE-Bench’에서도 추론모델을 포함한 국내외 주요 오픈소스 모델보다 높은 점수를 기록했다. 네이버 관계자는 “AI 에이전트 서비스에서 사용자와 모델 간 자유로운 언어적 상호작용의 중요성은 점점 커지는 만큼, 이 모델은 일상 속 다양한 상황에서 이뤄지는 사용자의 지시를 더 정확하게 이해하고 수행할 수 있는 추론모델로서 경쟁력을 발휘할 것”이라고 설명했다.

하이퍼클로바X 씽크 모델은 언어뿐만 아니라 시각 정보를 바탕으로도 추론할 수 있는 기술도 확보했다. 테크니컬 리포트에 따르면 하이퍼클로바X 씽크는 스템(STEM, 과학·기술·공학·수학) 분야 문제를 이미지 형식으로 입력했을 때 이를 인식하고 추론하는 과정을 통해 정답을 맞히는 모습을 보였다.

예를 들어 한국 대학수학능력시험 생명과학 문제에서 그림으로 제시된 ‘생태계 천이 과정’과 ‘특정 식물 군집의 시간에 따른 총생산량 및 호흡량 그래프’를 인식·분석하고 이를 양수림, 혼합림, 지의류 등에 대한 지식과 결합해 선택지 중 올바른 서술을 골라낸다.

하이퍼클로바X 씽크 성능 평가를 담당한 네이버클라우드 유강민 리더는 “이번 추론모델은 멀티모달 추론을 겨냥해 만든 것이 아님에도 시각 추론 영역에서 의미 있는 결과가 도출됐다”며 “이미 하이퍼클로바X 기반의 이미지, 영상, 음성 멀티모달 기술을 확보하고 있으므로 향후 보다 강력한 멀티모달 추론 능력을 갖춘 모델로 고도화해나갈 것”이라고 말했다.

네이버는 한국 AI 기술 생태계 활성화를 위해 추론모델을 오픈소스로도 공개할 계획이다. 네이버가 지난 4월 공개한 오픈소스 경량모델 ‘하이퍼클로바X 씨드(HyperCLOVA X SEED)’는 한 달여 만에 50만 다운로드를 넘어서기도 했다.

성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 “하이퍼클로바X를 ‘지능의 향상’과 ‘감각의 확장’의 두 가지 축으로 고도화하고 있으며, 이번 하이퍼클로바X 씽크를 통해 지능 측면에서 상당한 발전이 이뤄졌다”며 “급변하는 AI 흐름 속에서 글로벌 선두권 그룹의 기술을 지속적으로 갖춰가고 있으며, 기술 패러다임에 발맞추는 것에 그치지 않고 사용자에게 실질적 가치를 제공할 수 있는 방법을 함께 찾아나갈 것”이라고 말했다.

[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]