행동심리학의 관점에 따르면, 행동으로 나타나지 않는 언어나 지능은 생명력이 없다. 그간 챗GPT, 미드저니 등 대규모 언어모델(LLM) 인공지능은 어쩌면 행동과 무관한 통계학적 언어지능에 속했다.

반면, 대규모 액션 모델 LAM(Large Action Model)은 인간의 의도를 이해하고 실제 행동으로 옮길 수 있다는 점에서 주목받고 있다. LAM은 단순히 텍스트를 생성·이해하는 단계를 넘어, 디지털 환경 및 실제 세계와 상호작용을 통해 사용자의 목표를 달성하는 차세대 인공지능 모델이다. LAM의 핵심 기능은 정보를 제공하거나 텍스트를 생성하는 것을 넘어, 높은 수준의 ‘계획’과 ‘행동’을 추구한다.
LAM 기반의 선구적인 스타트업 ‘래빗 R1(Rabbit R1)’은 행동하는 AI에 속한다. 래빗 R1은 액션을 기반으로 한 에이전트 AI로, 말로 명령만 내리면 행동을 수행한다. 음성 하나로 AI가 직접 비행기 예약, 호텔 체크인, 식당 예약, 쇼핑, 음악 재생 등 다양한 업무를 수행한다. 사용자가 앱을 따로 설치하지 않아도, R1이 클라우드에서 앱을 실행하며 직접 조작한다. 예를 들어, “택시 불러줘”라고 명령하면, 래빗 R1이 우버나 카카오 택시 앱을 직접 조작하여 차량을 호출한다. “다음 주 뉴욕 호텔 예약해 줘”와 같은 명령을 받으면 야놀자나 익스피디아와 같은 여행 예약 서비스와 연동해서 바로 처리할 수 있다. 기존 AI 비서와 달리 실제 행동을 수행하는 점이 가장 큰 차별점이다.
[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]