크로마이징 - 안드레 카파시가 말하는 ‘AI 에이전트의 10년’

안드레 카파시가 말하는 ‘AI 에이전트의 10년’
최근 인터뷰 핵심 정리와 실전 활용 워크플로우
1. 다시 주목받는 카파시의 메시지
OpenAI 공동창업자이자 테슬라 오토파일럿을 이끌었던 안드레 카파시(Andrej Karpathy)는 2025년 하반기부터 Dwarkesh Patel 팟캐스트 인터뷰와 본인 X 계정을 통해 AI 에이전트의 현재와 미래에 대한 매우 구체적인 시각을 잇따라 내놓고 있다. 그의 메시지는 단순한 낙관도, 단순한 회의도 아니다. ‘에이전트의 해(year of agents)가 아니라 에이전트의 10년(decade of agents)’이라는 한 문장이 핵심을 압축한다.
“It’s the decade of agents, not the year of agents.” — Andrej Karpathy, Dwarkesh Podcast (2025.10)
2. 왜 ‘10년’인가 — 현시점 에이전트의 네 가지 결함
카파시는 자신의 AI 타임라인이 실리콘밸리 평균 대비 ‘5~10배 비관적’이라고 직접 밝혔다. 그가 지목한 현재 에이전트의 결함은 네 가지다. 첫째, 충분하지 않은 추론 능력. 둘째, 부족한 멀티모달 처리. 셋째, 신뢰할 수 있는 컴퓨터 사용(computer use) 능력의 부재. 넷째, 지속학습(continual learning)의 부재다. 이 네 가지를 풀어내는 데 약 10년이 걸린다는 것이 그의 진단이다.
특히 그가 강조하는 개념이 ‘March of Nines(나인의 행진)’이다. 데모에서 90%의 성공률을 보이는 시스템은 첫 번째 9에 도달했을 뿐이며, 99% → 99.9% → 99.99%로 가는 매 단계마다 동일한 양의 엔지니어링 노력이 필요하다는 통찰이다. 이는 그가 5년간 테슬라 오토파일럿을 이끌며 체감한 현실로, 에이전트가 데모에서는 매끄럽지만 프로덕션에서는 무너지는 이유를 정확히 설명한다.
열 단계 워크플로우에서 각 단계의 성공률이 98%라면 전체 신뢰성은 약 82%로 떨어진다. 단계가 길어질수록 실패 확률이 곱해지기 때문이다. 카파시의 메시지는 단순하다. 데모를 신뢰성 있는 제품으로 옮기는 데 필요한 ‘남은 9들’의 무게를 과소평가하지 말라.
3. Software 3.0 — 새로운 프로그래밍 패러다임
카파시는 동시에 매우 낙관적인 면모도 보인다. 그는 현재의 변화를 ‘Software 3.0’이라 명명한다. 1.0이 사람이 직접 코드를 짜는 시대, 2.0이 데이터로 신경망 가중치를 학습시키는 시대였다면, 3.0은 사람이 자연어 프롬프트로 LLM을 ‘프로그래밍’하는 시대다. 이 패러다임에서 컨텍스트 윈도우는 곧 RAM이며, 모델 가중치는 CPU의 역할을 한다. 즉 프롬프트가 곧 프로그램이다.
이는 그가 2025년 초 제안한 ‘vibe coding(바이브 코딩)’ 개념의 자연스러운 확장이며, 2026년 들어서는 ‘agentic engineering(에이전틱 엔지니어링)’이라는 더 정제된 형태로 진화하고 있다. 즉, 느슨한 대화형 프롬프팅에서 출발해 명확한 목표·경계·테스트를 가진 엔지니어링 디시플린으로 자리 잡아 가는 흐름이다.
4. 카파시 본인의 실제 워크플로우
가장 흥미로운 부분은 그가 본인의 작업 방식을 어떻게 바꾸었는가이다. 최근 X에 올린 노트에서 그는 다음과 같이 밝혔다.
11월만 해도 80%가 수동+자동완성, 20%가 에이전트였다. 지금은 80%가 에이전트 코딩이고 20%가 수정·마무리다. — 20년 프로그래밍 인생에서 가장 큰 변화.
그의 실제 셋업은 다음과 같다. 왼쪽 화면에 여러 개의 Claude 대화창을 띄우고, 오른쪽 IDE에서 코드 리뷰와 수동 편집을 진행하는 ‘human-in-the-loop’ 사이클이다. 사람은 명확한 요구사항·상위 설계·최종 품질 검증을 담당하고, 에이전트는 반복 구현·정보 검색·구체적 코딩 작업을 맡는다. 핵심은 두 가지를 분리하는 것이다. 의사결정 권한은 사람이 갖고, 노동 집약적 실행은 에이전트가 분담한다.
5. 실무자가 차용할 만한 카파시의 패턴 세 가지
첫째, CLAUDE.md 파일. 매번 프롬프트로 에이전트를 통제하는 대신, 코드베이스에 함께 두는 단일 문서로 에이전트가 따라야 할 사고방식과 행동 규칙을 정의한다. 이는 에이전트의 가장 흔한 실패 패턴인 ‘말없는 가정(silent assumption)’ — 모델이 사용자 의도를 임의로 해석한 채 진행해 버리는 문제 — 을 방어하는 핵심 장치다.
둘째, LLM Wiki 패턴. Notion, Google Docs, 북마크 등으로 흩어진 개인 지식을 마크다운 파일로 통합하고, 그 폴더를 코딩 에이전트에 가리킨 뒤 질문하는 방식이다. 모델은 사용자의 실제 자료에 근거(grounded)해 답하므로, 일반 LLM 답변 대비 정확도와 개인 적합성이 크게 올라간다.
셋째, AutoResearch 방식. 마크다운으로 연구 방향을 적어두고 에이전트가 밤새 실험을 돌리도록 한 뒤, 아침에 git history와 검증된 개선만 받아보는 패턴이다. 도메인을 가리지 않고 적용 가능한 ‘잠자는 동안 일하는 에이전트’ 워크플로우의 좋은 본보기다.
6. 정리 — ‘에이전트의 10년’을 살아가는 법
카파시의 메시지를 한 문장으로 압축하면 이렇다. ‘에이전트는 환상이 아니지만, 마법도 아니다.’ 그는 에이전트를 매일 사용하면서도, 그 한계를 가장 정확히 아는 사람이다. 실무자에게 의미하는 바는 분명하다.
첫째, 데모에 흥분하지 말고 신뢰성의 9를 하나씩 올리는 엔지니어링을 설계하라. 둘째, 본인의 워크플로우에서 에이전트 비중을 점진적으로 올려가되, 인간의 검토 사이클을 절대 빼지 마라. 셋째, 프롬프트가 아닌 컨텍스트 자체를 디자인하라. CLAUDE.md, 개인 지식 베이스, 자동화 루프 모두 이 발상의 구체화다.
10년이라는 시간은 길어 보이지만, 카파시 자신이 지난 1년 만에 코딩 워크플로우의 80%를 뒤집었다는 사실을 떠올려야 한다. 변화의 기울기가 가팔라질수록, 일찍 패턴을 잡은 사람과 그렇지 않은 사람의 격차는 벌어진다. ‘에이전트의 10년’은 기다림이 아니라, 매일 1%씩 9를 올리는 사람들의 10년이다.
참고 자료
• Dwarkesh Podcast — Andrej Karpathy: AGI is still a decade away (2025.10)
• Andrej Karpathy on X — claude coding workflow notes
• VentureBeat — Karpathy’s March of Nines: why 90% reliability isn’t enough
• The New Stack — OpenAI Co-Founder: AI Agents Are Still 10 Years Away
댓글 0
- 첫 댓글을 남겨보세요