
실리콘밸리는 엔지니어들에게 기회의 땅이다. 누구나 실리콘밸리에서 스타트업을 창업해 큰 기업을 키우고, 부자가 될 수 있다. 미국뿐만 아니라 전 세계인들에게 기회가 열려 있다. 스노플레이크는 프랑스 출신 개발자 두 사람이 2012년에 만든 클라우드 데이터 기업이다. 실리콘밸리 유력 벤처투자자들의 투자를 받아 2020년 그해 최대 규모의 기업공개에도 성공했다. 상장 이후 주가가 하락세를 보였던 스노플레이크는 최근 1년간은 50% 이상 상승하면서 인공지능(AI)이라는 흐름을 제대로 타고 있다. 2일 스노플레이크 서밋 2025에서 브누아 다주빌 공동창업자 겸 제품부문 대표를 만나 그의 인사이트를 들어봤다.
― 어떻게 스노플레이크를 창업하게 됐나.
▷2012년 7월 스노플레이크를 공동창업자인 티에리 크루앙스와 창업했다. 그때는 흥미로운 시기였다. 표에 들어가는 구조화된 정형 데이터가 있었고, 반구조화된 데이터가 있었다. 사람들은 두 데이터에 각각 다른 시스템이 필요하다고 생각했다.
당시 하둡이라는 정형 데이터와 반정형 데이터를 각각 처리하는 시스템이 있었다. 우리는 이것이 말도 안된다고 생각했다. 두 가지 유형의 데이터를 단일 시스템 아래에 통합해야 한다고 생각했다. 구조화된 데이터에 매우 우수한 데이터 웨어하우스 역할을 하면서 동시에 반구조화된 데이터를 잘 처리하는 시스템이 필요하다고 생각했다. 이것이 스노플레이크를 만든 첫 번째 이유였다.
― 두 번째 이유는 무엇인가.
▷다른 이유는 클라우드였다. 우리는 클라우드가 데이터 분석에 놀라운 시스템이라고 생각했다. 왜냐하면 데이터는 처리할 때 많은 능력이 필요하지만 항상 필요하지는 않기 때문이다. 수요에 따라 처리 능력을 동원할 수 있는 유연성이 필요했다. 클라우드에서는 이 요구사항이 완벽하게 부합한다고 생각했다. 더 흥미로운 점은 우리가 많은 컴퓨팅 자원을 학보하고 이를 활용할 수 있다면, 더 많은 자원을 사용할수록 더 빠르게 작업할 수 있다는 점이었다. 예를 들어 한두 대 서버를 사용하는 것보다 100대를 사용하면 100배 더 빠르게 작업할 수 있다. 왜냐하면 많은 데이터를 분산 처리할 수 있기 때문이다.
그런데 클라우드에서는 이를 100배 빠르게 작업하더라도 같은 가격을 지불하게 된다. 왜냐면 100배 더 적은 시간 사용하기 때문에 자체 서버로 이를 처리하는 것에 비해 훨씬 적은 비용이 든다.
전통적인 시스템에서는 데이터를 기계(서버)에 저장하기 때문에 서버를 없애면 데이터도 사라진다. 그래서 우리는 컴퓨팅과 스토리지를 분리했다. 이에 맞춰 시스템 아키텍처를 분리했다. 당시에 데이터를 활용할 수 있는 것은 구글과 같은 큰 기업뿐이었다. 그들은 데이터 처리 방법을 알고 있었고 많은 전문지식과 엔지니어를 보유하고 있었기 때문이다. 그러나 다른 기업들에는 이런(빅데이터) 것이 어려웠다. 그래서 우리는 모든 조직과 모든 사람이 구글처럼 할 수 있게 만들고 싶었다.
― 창업을 했지만 초기부터 외부 CEO로 임명하고 개발에만 집중했다.
▷크루앙스와 창업을 했을 때 우리는 회사가 아니라 제품을 만들고 싶었다. 우리의 열정은 스노플레이크라는 제품을 만드는 데 있었고, 만약 가능했다면 제품만 만들었을 것이다. 그래서 비즈니스에 정말로 열중하지 않았다.
무언가를 만드는 사람에게 중요한 것은 자신이 잘하는 것, 자신의 진정한 전문 분야다. 우리는 좋은 제품을 만드는 방법은 알았지만, 판매 조직을 운영하거나 마케팅을 하거나 CEO로서 필요한 다른 관점을 갖지는 못했다.
그래서 자신이 부족한 전문성을 가져와야 한다는 걸 깨닫는 게 중요하다. 그리고 그 전문성을 가진 사람들을 믿어야 한다. 나는 가끔 스타트업과 아이를 키우는 것과 비교한다. 아이를 키우면 두 부모가 있고, 그 부모는 아이의 영원한 부모다. 반면 스타트업은 그렇지 않다. 창업자가 아니더라도 회사를 사랑하는 사람들이 모여서 이 '아기'를 자신만큼 사랑하게 된다. 비록 그 아기가 그들의 것이 아니지만, 열정을 가진 것이다. 이는 정말 멋진 느낌이다. 다양한 기술을 가진 부모 같은 사람들이 모여서 회사에 재능을 쏟아붓는 것이다.
― AI도 결국 데이터의 산물이다. 언제 AI의 가능성을 봤나.
▷우리는 매우 일찍 깨달았다. 이 기술이 알려지기 전에 이미 이 기술과 협력하기 시작했기 때문이다. AI가 다가오고 있다는 것을 알고 있었다. 데이터 플랫폼에 AI는 아주 큰 영향을 미친다. 생성형AI가 등장하기 전 데이터 분석 분야에서 일하는 사람에게 데이터를 정의해달라고 하면, 이들은 '정형데이터'만 얘기했을 것이다. 왜냐면 기계(컴퓨터)가 처리할 수 있는 데이터는 표 형식의 데이터였기 때문이다. 누구도 문서, 이미지, 비디오, 오디오 같은 데이터가 데이터 플랫폼의 일부가 될 거라고 생각하지 않았다. 왜냐하면 이런 데이터는 인간 데이터이기 때문이다. 나는 항상 이 데이터는 인간만 이해할 수 있다고 말해왔다. 기계는 그 의미를 이해할 수 없기 때문에 진짜 데이터 분석이 아니었다. 데이터 분석은 구조화된 데이터와 반구조화된 데이터에 한정돼 있었다.
하지만 AI는 비구조화된 데이터를 플랫폼에 연결한다. 문서를 AI가 추출한 데이터와 결합할 수 있고, 이를 나머지와 결합해 대시보드를 만들 수도 있다. 데이터 분석 플랫폼이 다루는 데이터 스펙트럼이 혁명적으로 확장됐다. 우리는 이제 AI를 사용해 데이터를 추출하고 분석에 활용할 수 있다. AI가 이력서를 분석해 여기서 데이터를 추출해낼 수 있다. 이제 AI로 전체 파이프라인을 자동화할 수 있다. 이는 정말 혁명적인 것이고 이 분야의 초기 단계에 불과하다.
두 번째 혁명적인 부분은 데이터 전문가 측면이다. 스노플레이크는 모든 조직이 구글처럼 데이터를 사용하도록 만들고 싶었다. 하지만 기업에서는 스노플레이크 같은 플랫폼을 다룰 수 있는 데이터 전문가는 몇 명만 있었다. 하지만 AI의 등장으로 비즈니스 사용자, 마케팅팀, 영업팀이 데이터와 직접 소통할 수 있게 되었다. 왜냐하면 자연어로 얘기하면 AI가 질문의 의미를 파악해 해당 데이터 플랫폼에서 질문에 맞는 데이터를 추출하는 방법을 결정하기 때문이다. 이것이 우리가 말하는 에이전트다. 정말 마법 같은 일이다. 조직 내 데이터 활용 가능 사용자 수를 크게 확장하기 때문이다.
[실리콘밸리 이덕주 특파원]
[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]