'스타2'부터 '포켓몬 블루'까지… 테크기업들, AI 학습에 게임 활용 구글 인공지능 제미나이 2.5 '포켓몬 블루' 게임 완주 화제 인간처럼 게임의 규칙 이해 다양한 변수 적극 대응하며 상황따라 전략적 결정 내려 똑똑한 'AI 에이전트' 한발 더
볼보의 AI가 가상공간에서 주행 연습을 하는 모습.
"정말 멋진 마무리였다. 제미나이 2.5 프로가 '포켓몬 블루'를 완주했다."
지난 4일(현지시간) 순다르 피차이 구글 최고경영자(CEO)는 자신의 X에 영상과 함께 한 개발자에게 축하의 글을 남겼다. 조엘Z라는 별명을 사용하는 소프트웨어 엔지니어가 구글의 제미나이 2.5 프로를 활용해 고전 게임인 '포켓몬 블루'를 클리어하는 영상을 생중계한 것이 화제가 됐다.
사람들을 놀라게 한 것은 인공지능(AI)이 직접 화면을 보고 게임 시스템을 이해한 뒤 최선의 전략을 세워 이를 바탕으로 행동했다는 점이었다. 주인공 캐릭터가 장애물을 피해 이동할 수 있도록 방향키를 직접 누르고 대결을 유리하게 만들어 줄 아이템 사용 시점도 파악해 엔딩을 본 것이다.
구글 제미나이에 앞서 앤스로픽의 클로드 3.7 소네트 모델도 '포켓몬 레드'에 도전했는데 AI는 게임 내 복잡한 지형과 시각적 요소를 해석하는 데 여러움을 겪으며 결국 도전을 포기하기도 했다.
구글 딥마인드가 개발한 생성형 AI 모델 제미나이가 게임을 클리어한 것은 이미 예고된 일이었다. 구글 외에도 다양한 테크기업들의 AI 모델이 저마다 다양한 컴퓨터·콘솔 게임에 도전하고 있기 때문이다. AI가 잘 놀아야 경쟁력이 생기기 때문이다.
딥마인드 '알파스타'가 스타크래프트2를 플레이하는 모습.
챗GPT로 이름을 알린 오픈AI도 앞서 AI 게임 프로그램을 선보인 적이 있다. 오픈AI는 밸브의 온라인 게임 '도타2'를 플레이할 수 있는 봇을 2017년 처음 선보였다. 등장 이후 빠른 속도로 프로게이머들을 이기기 시작한 이 봇은 2019년 도타2 챔피언을 꺾으며 화제가 됐다. 이 AI는 일반 유저들을 상대로 사흘간 7257번의 맞대결을 펼쳐 무려 99.4%의 압도적인 승률을 기록했다. 바둑과 달리 실시간으로 진행되는 게임에서 AI가 쏟아지는 수많은 전장 정보를 바탕으로 상대의 움직임을 예측해 대응한 것이다.
일반인들은 게임을 무료함을 달래주는 대상으로 보지만 빅테크는 AI의 문제 해결 능력과 상호작용 능력을 테스트하는 좋은 도구로서 게임의 기능에 주목한다. 게임은 규칙이 명확하고, 보상 구조가 존재하며, 반복 가능하고 통제가 가능한 환경이란 것이 장점이다. 난이도 또한 자유롭게 조절할 수 있다. 통제된 환경에서 다양한 변수를 주고 안전하게 각종 실험을 진행할 수 있는 것이다.
즉, 이를 통해 AI가 인간처럼 환경을 인식하고 판단해 행동하는 능력을 키울 수 있다. 구글이 최신 게임을 마다하고 출시된 지 30년이 가까운 고전 게임을 선택한 것도 이유가 있다. 플레이어에게 다양한 선택지를 줘 자유도를 높인 오픈월드 게임에 비해 고전 게임은 그 구조가 명확하면서도 결정적인 선택이 필요한 구조를 갖추고 있기 때문이다. 고전 게임이 초급 단계라면 최신 게임은 심화 단계라고 비유할 수 있다. 실제 많은 연구자들이 게임을 통해 'AI가 목적을 설정할 수 있나' '주어진 목표를 위해 AI가 비선형 경로를 설계할 수 있나' '중간 실패를 학습으로 전환할 수 있나' 등 다양한 기능을 테스트하고 있다.
구글 '제미나이'가 고전 게임인 포켓몬 블루를 플레이하는 모습.
2016년 바둑기사 이세돌과의 대국으로 화제가 됐던 딥마인드는 AI의 직관적인 전략과 장기 계획 능력 학습을 위해 체스, 바둑 등을 활용했다. 이세돌을 꺾은 딥마인드는 게임사 블리자드와 손잡고 블리자드의 유명 실시간 전략게임인 스타크래프트2 AI를 개발하기도 했다. 딥마인드는 "정답도 없고 실시간인 스타크래프트는 알파고보다 훨씬 더 어렵다"며 "인간 같은 AI를 만들고 싶다면 게임을 훈련장으로 삼아야 한다"고 설명했다.
딥마인드는 '시마'로 명명한 프로젝트를 통해 지난 15년간 체스, 바둑, 스타크래프트 등 다양한 게임을 활용한 AI 연구를 진행해왔다. 궁극적으로 딥마인드는 게임을 활용해 사람처럼 사고하고 행동하는 범용 AI인 '임베디드AI'를 만드는 것이 목표다. 사람과 상호 작용하는 똑똑한 AI 에이전트 개발을 위해 게임을 활용하는 것이다.
게임은 다채로운 장르만큼 AI에 다양한 능력을 학습시킬 수 있다. 실시간 전략게임 스타크래프트는 자원 관리, 전략 수립 등 불완전한 정보를 기반으로 한 의사결정을, 정육면체 블록으로 게임 속에서 다양한 물건들을 조립해 만드는 마인크래프트는 도구 제작, 건축, 장기 목표 설정 능력을 배양할 수 있다. 이외에도 플레이어들 간 협업을 요구하는 도타2 같은 게임을 통해 AI 간 협업 능력을 키울 수도 있다.
자동차 기업 볼보도 자율주행 AI 개발을 위해 게임 엔진인 유니티 게임엔진과 가상현실(VR) 기술, 시뮬레이터 게임 기술을 활용하기도 했다. AI도 도로주행을 해야 운전 실력을 키울 수 있는데, 실도로 주행이 아닌 게임과 같은 가상공간에서 운전 연습을 한 것이다. 게임을 활용하는 사례가 늘어나자 인기 게임 GTA를 개발한 락스타게임즈가 GTA 게임을 활용한 상당수 연구를 중단해달라는 서한을 연구자들에게 보내기도 했다.
데미스 허사비스 딥마인드 CEO는 "게임은 현실을 압축한 마이크로코즘(통제된 조건에서 자연 생태계의 행동을 시뮬레이션하고 예측하는 데 사용하는 단순하고 인공적인 미소 환경 생태계)으로, 우리가 게임을 잘하는 AI를 만든다면 그 능력을 세상에 확장할 수 있다"고 언급하기도 했다.