GPT를 만든 사람이 Tesla를 떠난 이유 — 안드레이 카파시와 두 사상의 만남

1편부터 4편까지를 안 보신 분들을 위해 시리즈를 한 줄로 요약하면 — 인공지능이라는 분야가 1956년에 처음 시작된 이후 70년 동안 두 갈래로 갈라져 왔다는 이야기를 했다. 한쪽은 신경망에 데이터를 많이 먹이는 사상이고, 다른 쪽은 시스템이 자기 미래를 시뮬레이션으로 두어보고 학습하는 사상이다. 4편의 결론은 이 두 사상이 한 머릿속에서 통합되어야 비로소 다음 좌표가 잡힌다는 것이었다. 4편에서 우리는 그 통합을 거대 기업 구글의 안에서 봤다.

5편에서는 같은 결론을 한 사람의 머릿속 안에서 본다.

그 사람의 이름은 안드레이 카파시(Andrej Karpathy). GPT를 만든 회사 OpenAI의 공동창업 멤버. 자율주행 베팅의 정점 Tesla에서 5년간 인공지능 전체를 책임진 사람. 그리고 2022년 7월의 어느 날, Tesla를 떠나기로 결정한 사람.

GPT는 ChatGPT를 떠받친 그 기반 모델의 이름이고, OpenAI는 ChatGPT를 만든 그 회사다. 한국 독자에게 카파시라는 이름은 익숙하지 않을 수 있지만, 그가 일한 두 회사의 이름은 모두 익숙할 것이다. 두 회사 모두에서 그는 핵심 자리에 있었다.

그가 왜 Tesla를 떠났는지, 그 결정이 어떻게 나왔는지를 풀면, 4편의 핵심 결론 — 신경망에 데이터를 많이 먹이는 것만으로는 부족하다는 결론 — 의 가장 강한 외부 증인이 자기 16년을 갈아 같은 답에 도달한 이야기가 나온다.

1막. 2022년 7월 — 트윗 한 줄로 끝난 5년

2022년 7월 13일, 한 사람이 트위터에 짧은 글을 올렸다. 한국어로 옮기면 대략 이런 뜻이다.

"지난 5년 동안 Tesla의 목표를 돕는 일은 큰 즐거움이었습니다. 떠나는 결정은 어려웠고요. 그 5년 동안 Autopilot은 차선 유지에서 도심 주행으로 졸업했고, 저는 이 뛰어난 Autopilot 팀이 그 모멘텀을 계속 이어가는 모습을 보고 싶습니다."

쓴 사람의 이름은 안드레이 카파시. Autopilot은 Tesla의 자율주행 시스템 이름이다. 그 시점 카파시의 직함은 Tesla의 인공지능 총괄 책임자였다. 자율주행 비전 시스템 전체를 5년간 책임진 사람. 일론 머스크가 직접 영입한 사람. 그가 떠난다는 글이 그 주 실리콘밸리에서 가장 많이 인용된 트윗이 됐다.

트윗에는 떠나는 진짜 이유가 적혀있지 않았다. 인공지능 분야에서 다음 일에 집중하고 싶다는 정도의 일반적인 문장만 있었다. 그러나 그가 떠난 뒤 1년 동안 자기 강연과 유튜브 채널에서 한 말들을 모으면 그림이 분명해진다. 한 가지 결론에 그가 도달한 것이다.

신경망에 데이터를 많이 먹이는 것만으로는 지능이 안 나온다.

이 한 줄에 그가 어떻게 도달했는지, 그 답을 들으려면 시간을 13년 거슬러 캐나다 토론토로 가야 한다.

2막. 2009-2017 — 한 사상이 한 사람 머릿속에 자리잡은 시기

2009년, 카파시는 토론토 대학에서 컴퓨터과학과 물리학을 전공으로 학부를 마쳤다. 어린 시절 가족과 함께 슬로바키아에서 캐나다로 이민 온 청년이었다. 학부를 마친 뒤 그는 캐나다 서부 브리티시컬럼비아 대학으로 옮겨 석사를 했다. 그러다 2011년, 그는 다시 미국 캘리포니아로 옮겨간다. 박사 과정 입학한 학교는 스탠포드. 지도교수의 이름이 다음 4년을 결정한다.

페이페이 리(Fei-Fei Li).

그녀가 누구인지 한 줄로 옮기면 이렇다. 컴퓨터에게 사진을 보여주고 그게 무엇인지 알아맞히게 만드는 일을, 학계의 본업으로 끌어올린 거장. 같은 일을 더 정확히 말하면, 이미지넷이라는 거대한 사진 데이터셋을 그녀가 만들었다. 이미지넷은 약 1,400만 장의 사진에 22,000가지 사물 분류 태그가 사람 손으로 직접 달린 데이터의 산이다. 이 산이 2010년대 신경망이 폭발한 도화선이 됐다. 페이페이 리는 그 산을 쌓아 올린 사람이다.

카파시는 그 산 위에 박사 약 4년을 보냈다. 그가 한 일을 한 줄로 옮기면 이렇다. 신경망에 사진을 보여주면 사진을 묘사하는 문장을 출력하는 시스템을 만든 것. 이게 뭐 대단한 일인가 싶을 수 있는데, 박사 과정을 시작한 2011년 당시 컴퓨터는 사진 한 장도 제대로 알아보지 못했다. 카파시의 박사 작업이 무르익은 2015년 즈음에 와서야 기계가 사진을 보고 "한 남자가 노란색 우비를 입고 서핑보드를 들고 해변을 걷고 있다" 같은 문장을 출력하기 시작했다.

이게 카파시 머릿속 핵심 자리다. 사진을 보여주면 신경망이 답한다. 데이터를 많이 보여주면 신경망이 잘 답한다. 페이페이 리가 데이터의 산을 쌓고, 그 산 위에서 카파시가 신경망을 키웠다. 4년 동안 그가 그 한 가지를 그대로 살았다.

박사 과정 막바지인 2015년, 같은 페이페이 리가 스탠포드에서 컴퓨터 비전 강의 하나를 새로 만들었다. 강의 코드는 CS231n. 페이페이 리가 책임 교수였고, 카파시가 주요 강사 중 한 명으로 합류해 강의를 직접 가르쳤다. 이 강의가 미친 영향이 한 가지 있다. 강의 영상이 모두 유튜브에 무료로 올라갔고, 그 영상이 그 다음 5년 동안 전 세계 신경망 입문자들이 가장 많이 본 강의가 됐다. 한국·중국·인도의 수많은 엔지니어가 이 강의로 신경망을 배웠다. 카파시가 박사 과정 학생 신분으로 이미 한 세대의 스승 자리에 섰다는 뜻이다.

같은 해 2015년 12월, 카파시는 한 그룹의 창업 멤버로 이름을 올린다. 회사 이름은 OpenAI. 11명의 창업 멤버 중 한 명이었다. 같은 멤버 명단에 일론 머스크와 샘 알트먼과 그렉 브록만이 있었다. 같은 OpenAI가 7년 뒤 ChatGPT라는 챗봇으로 세상을 바꾸게 된다.

이게 카파시의 사상이 한 회사에서 처음 자리잡은 시기였다. OpenAI의 출발선은 사람처럼 다양한 일을 다 할 수 있는 인공지능을 안전하게 만드는 일이었다. 방법은 명확했다. 신경망에 데이터를 충분히 먹인다. 그 답은 카파시가 스탠포드에서 4년 동안 살아낸 답과 정확히 일치했다. 페이페이 리의 데이터 산이 한 회사 안에서 다른 형태로 다시 시작된 셈이다.

OpenAI에서 1년 반을 보내는 사이 그의 머릿속에 한 그림이 정리됐다.

그러다 2017년 6월, 그는 OpenAI를 떠난다. 떠난 곳은 Tesla. 직함은 인공지능 총괄 책임자. 머스크가 직접 영입한 자리였다.

Tesla로 옮긴 직후인 2017년 11월, 그는 자기 블로그에 "Software 2.0"이라는 글을 올렸다. 한국어로 옮기면 "소프트웨어의 두 번째 시대"라는 뜻이다. 한 줄 요약은 이렇다. 앞으로 소프트웨어는 사람이 코드를 쓰는 게 아니라, 신경망에 데이터를 먹여서 만들어진다. 코드의 시대가 끝나고 데이터의 시대가 온다는 선언이었다. OpenAI에서 정리된 머릿속 그림을 Tesla 이직 직후에 글로 풀어낸 셈이다. 카파시 사상의 가장 명확한 자기 진술이기도 했다.

자기 사상을 그대로 현실 세계의 가장 큰 한 도메인으로 옮길 자리. 자율주행이라는 자리에.

3막. 2017-2022 — Tesla 5년, 운전 따라 하기의 한계

카파시가 Tesla에 들어간 자리는 자율주행 비전 시스템의 정점이었다. 카메라 8개에서 들어오는 영상을 받아, 차량과 보행자와 차선과 신호등을 모두 인식하고, 어떻게 운전할지 결정하는 시스템 전체.

그가 5년 동안 만든 시스템의 골격을 한 문장으로 옮기면 이렇다. 인간 운전자 수만 명이 직접 운전한 영상을 신경망에 먹인 뒤, 신경망이 그 운전을 따라 하도록 학습시킨 것. 학계에서는 이걸 behavior cloning이라고 부르는데, 한국어로 풀면 운전 따라 하기다.

운전 따라 하기 방식의 사상은 명확했다. 운전이라는 행위는 인간이 이미 잘하는 일이다. 그러니까 인간의 운전을 충분히 많이 모아서 신경망에 보여주면, 신경망이 인간 운전자처럼 운전할 수 있다. 데이터의 양이 답이다. 신경망의 크기가 답이다. Tesla는 그 시점 세계에서 가장 많은 운전 데이터를 모을 수 있는 회사였다. 차량 수백만 대가 매일 도로를 누비고, 그 데이터가 회사 서버로 들어왔다. 페이페이 리가 박사 시절 카파시에게 보여준 데이터의 산이, Tesla에서는 도로 위의 데이터의 강으로 바뀐 셈이다.

카파시는 5년간 이 방식의 정점을 만들었다. 비전 시스템의 구조를 점점 깔끔하게 정리해갔다. 처음에는 각 인식 작업을 별도의 신경망이 처리하다가, 점점 하나의 큰 신경망으로 통합해갔다. 그가 떠난 직후에 Tesla가 발표한 차세대 자율주행 시스템은 카메라 영상을 입력받아 곧바로 조향각과 가속과 브레이크를 출력하는 한 덩어리의 신경망이었다. 카파시가 5년간 만든 사상의 완성형.

문제는 그 완성형 자체에 있었다.

운전 따라 하기 방식은 한 가지 결정적인 일을 못한다. "내가 만약 다른 선택을 했다면 어떻게 됐을까?"라는 질문을 못 던진다. 신경망은 인간이 한 행동만 학습한다. 인간이 안 한 행동의 결과는 데이터에 없다. 그래서 신경망 안에는 "그 순간 브레이크 대신 핸들을 꺾었다면 사고를 피했을까"라는 가정 자체가 없다.

도로는 정확히 그 질문이 매 순간 필요한 도메인이다. 옆 차가 갑자기 끼어들 수 있다. 무단횡단자가 튀어나올 수 있다. 빗물에 차선이 안 보일 수 있다. 이 모든 우연 앞에서 운전자가 진짜로 해야 하는 일은 한 가지다. 여러 가능한 미래를 동시에 머릿속에 두고, 그중 가장 안전한 한 가지를 고르는 일.

우리 시리즈 4편에서 다룬 알파고가 한 일이 정확히 그것이다. 알파고는 2016년 이세돌 9단을 이긴 인공지능 바둑 프로그램이다. 다음 한 수가 아니라, 다음 수에서 펼쳐질 수십만 가지 미래를 시뮬레이션 안에서 두어보고 가장 좋은 가지를 고른 것. 이게 알파고가 인간을 이긴 메커니즘이다.

Tesla의 신경망은 그 시뮬레이션을 안 한다. 인간이 한 평균적 행동을 출력할 뿐이다. 데이터가 아무리 많아도 이 한계는 안 풀린다. 30억 마일을 모아도 안 풀린다. 신경망의 크기를 100배로 키워도 안 풀린다. 인간이 한 행동만 들어있는 데이터로는 인간이 안 한 행동의 결과를 알 수 없기 때문이다.

이게 운전 따라 하기 방식이 본질적으로 못 푸는 한계다. 데이터가 아무리 많아도, 신경망이 아무리 커도, 가정해보는 일을 못한다.

카파시 본인이 이 한계를 5년간 가장 가까이서 봤다. 매일 봤다. 매일 회사가 새 모델을 출시했고, 매일 도로에서 인간이 봤다면 피했을 사고가 일어났다. 데이터를 더 모으면 풀린다는 답을 5년간 시도해본 끝에, 그 답이 안 풀린다는 것을 본인이 알았다.

그리고 2022년 7월 13일, 그는 떠나기로 결정했다.

4막. 2023-2025 — 같은 사람이 같은 자리에서 다른 사상을 던지기 시작했다

2023년 2월, 카파시는 OpenAI로 돌아간다. 7년 만의 복귀였다. 그가 떠나있는 사이 OpenAI는 GPT-3.5와 ChatGPT로 세상을 바꿨다. 그가 다시 들어간 자리는 다음 세대 시스템을 설계하는 자리였다.

이 복귀에서 한 가지가 중요하다. 그는 같은 사상에 다시 들어간 게 아니었다. 7년 사이에 그의 머릿속에서 사상이 바뀌어 있었다.

복귀 후 1년 동안 그가 자기 유튜브 채널과 강연에서 반복한 메시지를 한 줄로 옮기면 이렇다.

신경망에 추론 회로를 결합해야 한다.

추론 회로라는 말을 좀 풀면 이렇다. 신경망 하나가 답을 출력하는 게 아니라, 신경망이 자기 답을 다시 점검하고, 다른 가능성을 두어보고, 가장 좋은 답을 고르는 과정. 이게 정확히 4편에서 다룬 알파고가 한 일이다. 한 수를 두기 전에 그 수의 미래 가지들을 두어보고 가장 좋은 가지를 고르는 일.

GPT를 만든 사람이 GPT 자체로는 부족하다는 사실을 공개적으로 말하기 시작한 것이다.

2024년 한 해 동안 그가 여러 강연과 인터뷰에서 반복해 던진 메시지가 한 가지 있다. Tesla에서 자기 팀이 가장 과소평가한 것이 미래를 두어보고 좋은 길을 고르는 일이었다는 것. 4편에서 알파고가 매 수마다 한 일이고, 우리가 매달 클라이언트 회사와 함께 하는 일이다.

이게 사후 시인이다. 본인이 5년간 살아낸 답의 결함을 본인 입으로 인정한 것이다.

2024년 2월, 그는 OpenAI를 다시 떠난다. 두 번째 퇴사. 같은 해 7월, 그는 자기 회사를 차린다. 회사 이름은 Eureka Labs. 회사가 하려는 일은 인공지능으로 가르치는 새 학교를 만드는 것이었다. 그러나 회사의 첫 작품이 발표되기 전부터 그는 유튜브에 신경망에 관한 무료 강의 시리즈를 꾸준히 올렸다. 한 강의가 4시간을 넘기는 깊이의 강의들이었다. 그가 한 일은 자기 머릿속에 16년간 쌓인 사상을 통째로 풀어주는 일이었다.

그 강의 시리즈에서 그가 가장 강조하는 한 가지가 있다.

신경망 하나로 모든 걸 풀려고 하지 말 것. 신경망 위에 추론 회로를 얹어야 한다.

이 한 줄이 4편의 결론과 정확히 일치한다. 우리는 4편에서 대형 언어 모델을 회사의 도서관에, 강화학습과 탐색을 회사의 회의실에 비유했다. 대형 언어 모델은 ChatGPT 같은 챗봇의 본체를 말하고, 영어로는 LLM이다. 강화학습은 시스템이 시행착오로 답을 찾는 방식이다. 탐색은 가능한 미래 가지들을 두어보는 일이다. 4편에서 우리는 이 둘 다 없으면 살아있는 결정이 안 나온다고 했다. 카파시는 같은 결론에 자기 16년을 갈아 도달했다. 그것도 가장 큰 한 회사 Tesla를 떠나는 결정을 본인 손으로 내린 끝에.

이 사실이 5편의 결정적 자리다. 우리는 4편에서 대형 언어 모델만으론 부족하다는 주장을 시리즈 안에서 던졌다. 그 주장의 가장 강한 외부 증인이, GPT 사상의 본진 안에서 자란 사람이 자기 입으로 같은 말을 반복하고 있다는 사실이다. 거장이 우리와 같은 좌표를 보고 있다.

한 사람의 16년 안에서 두 사상이 평행으로 굴러갔다. 한쪽은 신경망에 데이터를 먹이는 사상이었고, 다른 쪽은 신경망에 추론 회로를 얹는 사상이었다. 그가 OpenAI의 첫 자리(2015-2017)와 Tesla 5년(2017-2022)에서는 첫 번째 사상의 정점을 살아낸 시기다. 그가 OpenAI에 돌아온 2023년 이후로는 두 사상이 한 머릿속에서 통합되기 시작한 시기다. 4편에서 우리가 본 구글의 9년 평행 구조가 한 사람의 머릿속에서 그대로 반복된 셈이다. 한 회사 안에서 한 인간 안으로 규모가 줄었을 뿐, 패턴은 같다.

5막. 카운터 — "추론 회로조차도 답이 아니다"

여기서 한 거장의 카운터를 짚어야 한다. 카파시가 도달한 결론에 정면으로 반대 의견을 던지는 또 한 명의 거장. 그의 이름은 얀 르쿤(Yann LeCun).

르쿤이 누구인지 짧게 풀면 이렇다. 페이스북 모회사 메타(Meta)의 인공지능 총괄 책임자. 2018년 컴퓨터과학의 노벨상으로 불리는 튜링상을 힌튼·벤지오와 함께 공동 수상한 인물. 인공지능의 3대 대부로 불리는 한 명이다. 그가 1980-90년대 미국의 한 통신 회사 연구소에서 발명한 신경망 구조가 한 가지 있다. 이름은 CNN(Convolutional Neural Network), 한국어로 풀면 합성곱 신경망이다. 사진을 작은 조각들로 잘라 본 뒤, 그 조각들이 어떻게 합쳐져 무엇이 되는지 알아맞히는 방식. 오늘날 모든 컴퓨터 이미지 인식 시스템이 이 구조 위에서 돌아간다. 카파시가 박사 시절 페이페이 리 밑에서 사진을 알아보는 신경망을 돌릴 때 그 토대가 정확히 르쿤이 발명한 CNN이었다. 즉 카파시와 르쿤은 사상의 출발선에서 한 자리 떨어진 거장이고, 사실상 사상의 선후배 관계에 가깝다. 4편에서 카운터로 잠깐 등장한 그 사람이다.

르쿤이 일관되게 견지하는 입장이 한 가지 있다. 그가 자주 쓰는 비유로 정리하면 이렇다.

"지능이 케이크라면, 케이크의 본체는 자기 스스로 학습하는 신경망이다. 그 위에 얹힌 아이싱이 사람이 정답을 알려주는 학습이다. 강화학습은 그 위의 체리 한 알에 불과하다."

이 비유를 그는 2016년 처음 던진 뒤로 강연과 발표에서 같은 메시지를 반복해서 던졌다. 같은 단어 그대로는 아니지만 같은 결의 한 줄을 매번 다시 새겼다. 강화학습 진영에 대한 정면 카운터다.

4편 5막에서 우리는 이 카운터를 한 차원의 비판으로 다뤘다. 5편의 르쿤은 한 차원 더 깊다. 5편 4막의 카파시가 도달한 결론 — 신경망에 추론 회로를 얹어야 한다 — 에 대해, 르쿤은 다시 한번 부정한다.

"추론 회로조차도 답이 아니다."

그가 제시하는 다른 답의 이름은 JEPA다. 영어로 풀면 Joint Embedding Predictive Architecture, 한국어로 풀면 "공동 임베딩 예측 구조"가 된다. 이 표현이 또 어렵다. 더 친절히 풀면 이렇다. 신경망 안에 세상의 작동 원리를 직접 만들어 넣고, 그 모형 안에서 미래를 예측하는 방식. 학계에서는 이걸 World Model이라고 부르고, 한국어로 풀면 "세계 모형"이다.

이 답이 어떻게 다른지 한 가지 비유로 풀면 이렇다. 카파시가 말한 추론 회로는 신경망이 자기 답을 점검하는 회의실 같은 것이다. 르쿤이 말한 세계 모형은, 회의실에 들어가기 전에 신경망 안에 세상의 작은 모형을 만들어 두는 것이다. 회의실은 가능성을 두어볼 뿐이지만, 세계 모형은 그 가능성이 어떻게 펼쳐질지를 직접 시뮬레이션할 수 있다. 르쿤의 입장은 이거다 — 회의실만으로는 효율이 안 나온다. 세상의 모형을 신경망이 자기 손으로 만들어야 한다.

이게 5편에서 보는 두 거장의 정면 충돌이다. 한쪽은 GPT를 만들고 자율주행을 5년 살아낸 끝에 추론 회로가 답이라고 말한다. 다른 쪽은 페이스북의 인공지능 전체를 이끌면서 추론 회로조차 답이 아니라고 말한다. 두 사람 모두 인공지능의 거장이고, 두 사람 모두 같은 좌표 — "신경망에 데이터를 많이 먹이는 것만으로는 부족하다" — 까지는 같이 왔다. 그 좌표에서 다음 한 발자국을 두는 방향이 다르다.

카파시가 옳은 부분이 있다. 추론 회로는 만들기 쉽다. 기존 신경망 위에 한 단계 얹기만 하면 된다. 그래서 산업에서 빨리 작동한다. ChatGPT 같은 챗봇에 추론 기능을 얹는 방향이 정확히 이 길이고, 2024년 이후 모든 대형 인공지능 회사가 이 길을 따라가고 있다.

르쿤이 옳은 부분도 있다. 추론 회로만으로는 진짜 인간 수준 지능에 도달하지 못한다. 인간은 머릿속에 세상의 모형을 직접 만들어두고 그 모형 안에서 미래를 예측한다. 네 살 아이가 컵을 보고 떨어트리면 깨질 것을 아는 이유는 자기 머릿속 세계 모형에서 컵의 미래를 본 것이지, 추론 회로를 돌린 게 아니다.

METAL AI의 입장은 명확하다. 학습이라는 영역에서 두 거장의 답이 다르다는 사실 자체가, 한 가지 답으로 모든 클라이언트를 도울 수 없다는 뜻이다. 우리는 클라이언트의 도메인에 따라 두 답의 비중을 다르게 둔다. 다음 한 달 트렌드를 예측해야 하는 패션 사입처럼 결정의 가지가 명확한 자리에서는 카파시의 추론 회로 사상이 빠르다. 클라이언트 회사 자체의 살아있는 모형이 필요한 자리 — 예를 들어 한 회사의 운영 전체를 모형화해서 그 안에서 다음 분기를 시뮬레이션하는 자리 — 에서는 르쿤의 세계 모형 사상이 더 깊다. 한쪽만으로는 클라이언트를 다 도울 수 없다.

두 거장이 정면으로 부딪히는 자리에서 METAL AI가 매일 자기 결을 잡는다.

6막. 같은 결론을 우리는 매일 살고 있다 — 패션회사 재방문

여기서 우리 회사 운영으로 다시 넘어와 보자.

4편 5막에서 우리는 패션회사가 매달 중국과 베트남 현지에 사입을 다니는 자리를 한 가지 사례로 풀었다. 패션회사는 패션 사입 회사이고, 사입은 현지 공장에서 다음 한 달 팔 제품을 직접 골라 들여오는 일이다. 한 달에 한 번씩 buyer가 수천 가지 후보를 마주하고 어떤 제품을 얼마나 들여올지 결정한다. 작년 같은 달 매출 1위 제품의 변주만으로는 매달 한 발씩 늦는다. 트렌드는 매달 움직이고, 작년 데이터로는 그 움직임의 다음 한 발자국을 못 잡아낸다. 그래서 우리는 회사의 인격을 데이터로 정리한 위에 시뮬레이션 트리를 두어 다음 한 달을 미리 결정한다. 알파고가 게임에서 한 일의 패션 사입 버전.

5편에서 같은 사례를 다시 본다. 다른 자리에서.

패션회사 사례가 빅데이터와 시뮬레이션을 둘 다 안고 가야 했던 이유가 무엇이었나. 작년 데이터만으로는 다음 한 달 트렌드의 한 발자국을 못 잡기 때문이다. 같은 일이 도로 위에서 Tesla에 일어났다. 인간 운전자 데이터만으로는 도로의 모든 우연을 못 잡기 때문이다.

두 도메인에서 같은 답이 나왔다. 데이터의 양만으로는 부족하다. 데이터 위에 미래를 두어보는 회로가 필요하다.

이 두 도메인의 답이 같다는 사실이 우연이 아니다. 학습이라는 영역에서 시스템이 자기 다음 수를 두는 방식의 본질이 그렇기 때문이다. 그리고 그 본질에 카파시가 16년 갈아 도달했다는 사실, 같은 본질에 시리즈 3편에서 다룬 도파민 신호 연구가 30년의 신경과학 끝에 도달했다는 사실, 시리즈 4편의 알파고가 한 결정에 도달했다는 사실이 다 한 자리로 모인다.

패션회사의 매달 사입에 우리가 적용한 한 가지 메커니즘이 있다. 회사 인격이라는 도서관 위에 시뮬레이션 트리라는 회의실을 얹는 것. 그 메커니즘이 카파시가 Tesla에서 5년간 적용하지 못한 메커니즘과 같다. 한쪽은 제품을 결정하는 자리고 다른 쪽은 핸들 각도를 결정하는 자리지만, 두 결정의 본질은 같다. 다음 한 수가 펼쳐질 미래들을 두어본 뒤 가장 좋은 가지를 고르는 일.

여기에 5막에서 본 르쿤의 카운터를 한 겹 더 얹는다. 클라이언트가 회사 전체의 운영을 모형으로 만들어 그 안에서 다음 분기를 시뮬레이션하고 싶다면, 추론 회로만으로는 부족하다. 회사 자체의 작은 세계 모형을 만들어야 한다. 패션회사의 사입 결정은 추론 회로 쪽에 가깝지만, 회사 전체의 1년 계획 같은 자리는 세계 모형 쪽에 가깝다. 한 클라이언트의 한 결정마다 어디에 비중을 둘지 우리가 직접 판단한다.

그래서 우리는 클라이언트마다 같은 패턴으로 일한다. 대형 언어 모델이라는 도서관 위에 강화학습과 탐색이라는 회의실을 얹고, 필요한 자리에는 세계 모형이라는 시뮬레이션 방까지 얹는다. 한 가지만으로는 살아있는 회사를 학습시킬 수 없다는 것이 우리가 매일 내리는 판단이다. 이 사상의 외부 증인 두 명을 5편에서 만난 셈이다 — 추론 회로를 강조하는 카파시, 그리고 세계 모형을 강조하는 르쿤. 두 사상이 다 필요한 자리에 METAL AI가 서 있다.

결론

GPT 사상의 본진에서 자란 사람이 자율주행이라는 거대한 베팅을 5년 살아낸 끝에, 신경망에 데이터를 많이 먹이는 것만으로는 부족하다는 결론에 도달했다. 그 결론에 도달하기 위해 그는 Tesla를 떠나는 결정을 본인 손으로 내렸다. 그리고 그 결정 이후 2년 동안 자기 유튜브에서 같은 메시지를 반복해서 던지고 있다. 같은 좌표를 두고 또 한 명의 거장 르쿤은 카파시의 답조차 충분치 않다고 말한다. 세계 모형이 답이라고 말한다. 두 거장이 같은 출발점에서 다른 방향을 가리킨다.

거대 조직의 두 사상이 한 머릿속에서 통합되어야 폭발한다는 4편의 결론은, 한 회사 안에서만 작동하는 게 아니다. 한 사람의 머릿속에서도 똑같이 작동한다. 카파시의 16년이 그 증명이다. 그가 OpenAI의 첫 자리와 Tesla 5년 동안 한 사상만 살았을 때는 두 사상이 평행이었다. 그가 OpenAI로 돌아와 추론 회로를 강조하기 시작한 2023년 이후로 두 사상이 한 머릿속에서 통합되기 시작했다. 통합된 그 자리에서 그가 던지는 한 마디 한 마디가 지금 우리가 사는 시대의 다음 좌표를 가리킨다.

그리고 그 좌표 옆에 르쿤이 또 다른 좌표를 두고 있다. 두 거장이 가리키는 두 좌표 사이에서 METAL AI가 매일 일한다. 패션회사의 매달 사입처럼, 자율주행처럼, 클라이언트 회사의 매일 결정처럼, 살아있는 시스템은 데이터의 양만으로 안 풀린다. 데이터 위에 회의실이 필요하고, 회사에 따라 세계 모형까지도 필요하다. 한 가지 답으로 모든 회사를 도울 수 없다는 사실이, 우리가 클라이언트마다 다른 비중으로 두 사상을 가져가는 이유다.

시리즈 1편의 끝에서 우리는 마빈 민스키의 한 줄을 남겼다. 지능의 힘은 단 하나의 완벽한 원리가 아니라, 우리의 광대한 다양성에서 비롯된다. 민스키는 인공지능이라는 단어가 처음 만들어진 1956년 다트머스 회의의 주역 중 한 명이다. 시리즈 2편의 끝에서는 강화학습의 아버지 리치 서튼과 카파시 본인이 던진 같은 질문 — 신경망은 자기 경험으로부터 학습하지 못한다는 질문 — 에 대한 한 가지 실용적 대응책을 METAL AI가 한 시간 단위 인터뷰로 운영하고 있다고 적었다. 시리즈 3편의 끝에서는 회사도 살아있는 인간이고, 빅데이터로 인격을 세우고 우연성으로 미래를 던진다고 적었다. 시리즈 4편의 끝에서는 두 사상이 한 머릿속에서 통합되는 순간에 비로소 다음 좌표가 잡힌다고 적었다. 시리즈 5편의 끝에서, 우리는 그 통합이 한 회사가 아니라 한 사람의 머릿속에서도 같은 형태로 작동하고, 그 결론 옆에 또 다른 거장의 카운터가 한 가지 더 서 있어서 두 좌표 사이에 METAL AI의 자리가 있다는 사실을 남긴다.

GPT를 만든 사람이 Tesla를 떠난 이유가 정확히 그 자리에 있다. 그가 16년을 살아낸 끝에 도달한 답이, 우리가 클라이언트마다 매일 일하는 자리의 답과 같다는 사실. 그리고 그 답 옆에 르쿤이 던지는 또 다른 답이 함께 서 있고, METAL AI가 그 둘 사이에서 매일 자기 결을 잡는다는 사실. 거장의 16년과 또 한 거장의 평생이, 우리 회사의 매일과 같은 자리에 서 있다.

— 김현국 (Hyunkook Kim) · METAL AI 대표 · 2026년 5월 12일 (화)