매일경제 빌리어드뉴스 MK빌리어드뉴스 로고

“인류, AI 작동원리에 무지”…AI 모델의 MRI 만들겠다는 ‘이 남자’

‘안전한 AI’ 강조 아모데이 CEO AGI 작동원리 모르면 인류에 위협

  • 이영욱
  • 기사입력:2025.04.27 18:08:47
  • 최종수정:2025.04.27 18:08:47
  • 프린트
  • 이메일
  • 페이스북
  • 트위터
‘안전한 AI’ 강조 아모데이 CEO
AGI 작동원리 모르면 인류에 위협
다리오 아모데이 앤스로픽 CEO가 지난 1월 스위스에서 열린 다보스포럼에 참석헤 발언하고 있다. AFP연합뉴스
다리오 아모데이 앤스로픽 CEO가 지난 1월 스위스에서 열린 다보스포럼에 참석헤 발언하고 있다. AFP연합뉴스

생성형AI 모델 ‘클로드’를 개발한 앤스로픽이 인류는 AI(인공지능)의 작동원리에 대해 아는 것이 거의 없다며 AI의 작동원리를 밝혀내겠다고 밝혔다.

다리오 아모데이 앤스로픽 최고경영자(CEO)는 지난 24일(현지시간) 자신의 홈페이지에 에세이 하나를 공개했다. 아모데이는 이를 통해 “오늘날 세계 최고 수준의 AI 모델의 작동방식에 대해 연구자들이 거의 이해하지 못하고 있다”며 “2027년까지 대부분의 AI 모델 문제를 신뢰성 있게 탐지할 수 있도록 하겠다”고 밝혔다.

앤스로픽을 비롯한 여러 AI 기업들이 경쟁하면서 매일 다양한 모델들이 쏟아지고 있다. 아모데이는 “ AI 시스템은 나날이 그 기능이 발전하고 있지만 이 시스템이 정확히 어떻게 작동하는지를 아는 사람은 거의 없다”고 지적했다. 기술이 빠르게 발전하며 AI는 점점 더 똑똑해지고 있지만, 좀처럼 줄지 않는 ‘환각 현상’은 여전히 연구자·개발자들을 괴롭히고 있다. 환각 현상이란 대화형 인공지능에서 존재하지 않거나 맥락에 관계 없는 답을 마치 진실인 듯 자연스럽게 내놓는 것을 말한다. 이같은 환각 현상은 AI의 신뢰도를 낮추는 문제로 이어진다. 연구자들이 답을 찾기 위해 여러가지 연구를 진행하고 있지만 아직까지 환각 현상이 나타나는 이유에 대한 명쾌한 답은 없는 상황이다.

아모데이는 “이런 상황에서 향후 등장할 범용인공지능(AGI)의 작동원리를 모른다면 (인류에) 큰 위협이 될 수 있다”고 강조했다. 그러면서 앤스로픽이 이 문제를 해결하겠다고 공언했다.

앤스로픽은 ‘기계적 해석 가능성’ 분야 선도기업이다. 기계적 해석 가능성이란 AI 모델이 특정 답을 내놨을 때 왜 그런 판단을 내렸는지 과정을 살펴보는 것이다. 딥러닝 내부 구조가 어떻게 작동해 이런 결과를 내놓는지를 연구한다.

이런 연구는 AI의 신뢰성을 높이고, 위험한 행동을 사전에 탐지하는 등 AGI를 연구하는데 있어 필수적이다. 현재 AI는 ‘블랙박스’라는 평가가 있는데, AI가 왜 이렇게 판단했는지를 제대로 설명하기가 어렵기 때문이다. 아모데이는 “장기적으로는 AI 모델에 대해 MRI처럼 정밀 진단이 가능한 도구를 만들고 싶다”고 밝혔다.

아모데이의 이같은 주장은 ‘안전한 AI’를 최우선으로 하는 앤스로픽의 철학과도 닿아있다. 오픈AI에서 리서치 부사장으로 근무하며 GPT-2와 GPT-3 개발을 주도했던 아모데이는 안전한 AI를 강조하는 ‘오픈AI 마피아’의 일원이기도 하다.

[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]