이 글은 소프트웨어 개발 분야가 결정론적 코드에서 벗어나 점점 더 확률적 시스템으로 변화하고 있음을 보여줍니다. 저자는 직접 개발한 시스템인 Compound Loop를 예시로 들어, AI 에이전트가 코드를 자율적으로 작성하고 검토하는 시대가 도래했음을 설명합니다. 이러한 변화는 개발자의 역할, 조직 구조, 그리고 '출시'의 의미까지도 변화시키고 있으며, 특히 AI 네이티브 기업들 사이에서 빠르게 확산되고 있습니다. 결론적으로, 미래의 소프트웨어 개발은 현재의 모델이 아닌, 아직 오지 않은 더 발전된 AI 모델을 위해 조직과 문화를 구축해야 한다는 점을 강조합니다.
1. 무감각의 시작: 소프트웨어 개발의 새로운 시대 🌃
소프트웨어는 조용히 확률적 시스템으로 진화하고 있어요. 이전에는 코드를 작성하고, 테스트하고, 배포하면 제대로 작동할 것이라고 확신할 수 있었죠. 하지만 이제는 이런 확신이 깨지고 있습니다. 특히 AI 기반의 선도적인 기업들을 보면, 코드베이스가 '아마 작동할 거야' 라고 믿는 시스템으로 변모하기 시작했어요. 더 이상 정확히 성공 확률을 단정할 수 없게 된 거죠.
이러한 변화는 우리의 업무 방식뿐만 아니라 역할, 조직, 교육 과정, 그리고 '제품 출시'의 본질까지 바꾸고 있습니다. 저자 팀 데이비스(Tim Davis)도 이러한 변화를 직접 경험하며 깨달았다고 해요.
"저는 제가 직접 만들었기 때문에 알아챘습니다."
2. '컴파운드 루프' 개발 경험: 24시간 근무자의 탄생 🚀
저자는 몇 달 전, 퇴근 후 시간을 활용해 '컴파운드 루프(Compound Loop)'라는 사이드 프로젝트를 만들었습니다. 이 시스템은 여러 최신 AI 모델을 활용해서 코드를 스스로 작성하고, 검토하고, 병합하는 작업을 거의 자율적으로 수행했어요. 저자는 잠들기 전에 이 시스템에 실제 문제를 맡기고, 아침에 일어나면 밤새 생성된 수많은 풀 리퀘스트(Pull Request)를 확인했다고 합니다.
"어떤 풀 리퀘스트는 훌륭했고, 어떤 것은 틀렸으며, 어떤 것은 제가 질문해야 할 내용을 수면 위로 떠오르게 했습니다."
오전 8시가 되면, 저자는 전날 밀린 업무를 처리하는 대신, 밤새 진행된 작업 중 어떤 것을 유지할지 결정했어요. 그 사이에도 시스템은 로그를 분석하며 계속해서 새로운 풀 리퀘스트를 추가했습니다. 이런 지속적인 복합적 특성은 정말 놀라웠다고 합니다.
이는 지식 노동 역사상 처음으로, 퇴근한 사람이 자신의 뇌를 온전히 가지고 가지 않는 상황을 만들어냈어요. 이제 '9-9-6'(오전 9시 출근, 오후 9시 퇴근, 주 6일 근무) 개념은 사라지고, 우리는 그저 24시간 일하는 직원이 된 것입니다. 하지만 여기서 24시간 일하는 직원은 사람이 24시간 내내 일한다는 뜻이 아니라, 여러 에이전트가 엄청난 병렬성을 가지고 일한다는 의미예요. 2026년 현재에도 대부분의 팀은 타이핑 속도보다는 조율에서 병목 현상을 겪고 있지만, 미래는 항상 최전선에서 먼저 나타나고, 이미 이곳에 와 있다는 것이 저자의 생각입니다. 이 글은 전체 산업에 대한 설명이라기보다는, 가장 AI 네이티브한 팀들 내부에서 이미 일어나고 있는 일들을 보여주며, 이것이 나머지 산업에 어떤 영향을 미칠지 예측합니다.
3. 역할의 변화: 승진과 분할의 양면성 🎭
가장 AI 네이티브한 팀 내부에서 역할 변화는 단순히 "모두가 상위 레벨로 올라간다"는 통념보다 더 복잡하게 나타납니다. 일부 개발자는 실제로 더 높은 단계로 이동하고 있어요. 최고의 엔지니어는 더욱 효과적인 프로덕트 매니저가 되고, 최고의 프로덕트 매니저는 시스템 아키텍트가 되며, 최고의 아키텍트는 시장의 변화를 고민하게 됩니다. 이들은 자신의 경력에서 최고의 시기를 보내고 있으며, 그들의 업무는 이전보다 훨씬 더 큰 영향력을 발휘합니다.
하지만 이것이 전부가 아닙니다. 이런 낙관적인 이야기 뒤에는 하향 압력이 존재하며, 이는 역할을 더욱 세분화시키고 있습니다. 많은 엔지니어가 아키텍트가 되는 대신, 명세 작성자, 검토자, 그리고 에이전트 관리자가 되고 있어요. 이들은 기계가 이해할 수 있는 프롬프트로 의도를 번역하고, 그 결과물을 자신조차 완전히 이해하지 못할 수 있는 표준에 따라 평가하는 데 시간을 보냅니다. 일부는 정말 중요한 일이지만, 일부는 2026년의 데이터 입력과 다름없는 작업이라고 저자는 지적합니다.
저자는 이러한 변화가 사람들에게 어떤 의미인지 솔직하게 이야기해야 한다고 강조합니다.
"이러한 파편화된 역할은 보수가 적고, 가치도 낮게 평가되며, 많은 경우 경력의 막다른 골목이 될 것입니다. 시스템에 필요하지만 보상받지 못하는 '결과물 정리' 작업의 한 층이 되는 거죠."
에이전트 시스템을 효과적으로 운영하는 상위 30%와 그 결과물을 관리하는 중간 계층 사이의 임금 격차는 이전 시대의 엔지니어와 영업 사원 간의 격차보다 훨씬 더 커질 것이라고 예측합니다. 저자가 면밀히 관찰하는 회사들에서는 이미 이러한 격차가 벌어지고 있으며, 저자는 이 격차가 저절로 줄어들지는 않을 것이라고 봅니다.
특히 AI 인프라 분야에서는 여전히 커널 성능, 컴파일러 설계, 하드웨어 추상화 같은 영역이 중요한 방어벽으로 남아 있습니다. 이는 시스템 엔지니어링의 가장 낮은 수준에서 높은 결정론적 특성이 요구되기 때문입니다. 하지만 이러한 방어벽 위에 소프트웨어를 구축하는 수준에서는, 기계가 아직 복제할 수 없는 인간의 입력으로 무게 중심이 강력하게 이동하고 있으며, 이러한 변화는 실제적이며 가속화되고 있습니다.
4. 제본스의 역설과 코드의 미래 📈
1865년 경제학자 윌리엄 스탠리 제본스(William Stanley Jevons)는 증기기관의 효율성 증대가 석탄 소비를 줄이기보다는 오히려 늘렸다고 관찰했습니다. 효율성이 높아지면서 엔진을 사용할 가치가 있는 일들이 더 많아졌기 때문이죠. 우리는 지금 소프트웨어 버전의 동일한 현상을 겪고 있으며, 이는 소프트웨어 역사상 가장 흥미로운 순간 중 하나입니다. 코드를 작성하는 단위 비용이 0에 가까워지면서, 우리는 코드를 덜 쓰는 것이 아니라 훨씬 더 많이 작성하고 훨씬 더 많이 배포하고 있습니다. 최고의 팀들은 이러한 변화에 적극적으로 적응하고 있습니다.
"확장 법칙이 무한하다고 믿는 기업들은 그에 맞춰 구축하고 있으며, 이들이 승자가 될 것입니다."
선도적인 AI 네이티브 기업에 있는 저자의 많은 친구들은 이미 이러한 변화에 빠르게 적응하고 있습니다. 에이전트들은 풀 리퀘스트를 열고, 서로의 작업을 검토하며, 인간이 키보드를 만지지 않고도 이를 닫습니다. 문제가 발생하면 실시간 모니터링 루프를 통해 빠르게 수정됩니다. 자가 치유 테스트 스위트는 기본 코드가 변경되면 스스로 다시 작성됩니다. 자율 실험 루프는 팀이 예전에는 세 번의 가설을 검증하던 시간에 백 번의 가설을 세우고, 측정하고, 폐기합니다. 문서화는 AI 기술을 통해 합쳐지는 과정에서 더 빠르게 업데이트되고, 이 AI 기술 자체도 개선됩니다. 우리는 이제 기능 구현이 엔지니어의 타이핑 속도에 제약을 받던 시대에서, 인간의 창의성, 에이전트 시스템 관리, 그리고 제품이 결과물을 흡수하는 속도에 제약을 받는 시대로 이동하고 있습니다.
저자는 지금이 무언가를 만들기에 정말 좋은 시기라고 생각합니다. 생산량 증가는 미묘하지 않고, 에이전트를 중심으로 재구성된 팀들은 1년 전보다 3배, 5배, 심지어 10배 더 많은 것을 출시하고 있으며, 이러한 증가는 가속화되고 있습니다. 저자가 대화하는 많은 창업가와 운영자들은 잡음에 대해 불평하기보다는, 내일에 에이전트 플릿에 더 많은 작업을 어떻게 공급할지 고민하고 있습니다. 왜냐하면 잘 지시된 에이전트의 작은 생산량 증가조차도 여전히 타이핑에 의존하는 경쟁사들에 비해 복리 이자처럼 쌓이는 이점이 되기 때문입니다.
하지만 제본스의 두 번째 교훈 역시 여기에도 적용됩니다. 이는 이러한 변화의 흐름을 타는 팀과 그렇지 못한 팀을 가르는 중요한 요소입니다. 공급이 폭발적으로 증가하면 선택이 모든 것이 됩니다. 석탄이 풍부해지자 엔진의 가치가 높아졌지만, 무엇을 태우고, 무엇에 동력을 공급하며, 그 결과물로 무엇을 만들지 선택하는 규율이 훨씬 더 중요해졌습니다. 판단 없는 값싼 에너지는 단지 낭비일 뿐이며, 이는 코드에도 똑같이 적용됩니다.
이러한 변화에 잘 대응하는 팀들에게 선택은 압도적인 문제가 아니라 새로운 영향력의 지점입니다. 에이전트 플릿을 올바른 문제로 이끌고, 결과물에서 실제로 가치 있는 것을 선별하며, 그 결과를 일관성 있는 무언가로 통합할 수 있는 운영자가 지금 소프트웨어에서 가장 큰 영향력을 가진 작업을 하고 있습니다. 이제 작업의 가치는 그것을 만드는 데 얼마나 많은 노력이 들었는지로 결정되지 않습니다. 노력이 줄어들었기 때문입니다. 이제 가치는 누가 에이전트 플릿을 얼마나 잘 지시하고, 돌아온 결과물 중에서 무엇을 선택하며, 그것을 더 빠르게 복합적으로 성장하는 무언가로 통합했는지에 따라 결정됩니다. 이제 생산은 더 이상 어려운 부분이 아닙니다. 지금 어려운 것은 방향 설정, 선택, 그리고 일관성이며, 이는 최고의 팀들이 가장 빠르게 키우려고 노력하는 역량입니다.
5. 결정론적 엔지니어링에서 확률적 엔지니어링으로 🎲
우리는 결정론적 엔지니어링에서 확률적 엔지니어링으로 빠르게 전환하고 있습니다. 하지만 우리의 도구, 교육, 조직적 직관은 여전히 옛 패러다임에 맞춰져 있어요. 결정론적 엔지니어링은 우리 직업 역사 대부분 동안 적용되었던 계약과 같았습니다. 코드를 작성하고, 테스트하고, 검토하면, 잘 알려진 범위 내에서 그것이 무엇을 하는지 확실히 알 수 있었죠. 오류도 결정론적이었습니다. 동일한 입력에 동일한 출력이 나왔고, 버그는 재현 가능해서 찾아낼 수 있었습니다.
하지만 확률적 엔지니어링은 다릅니다. 최전선 팀에서는 이미 이런 현상이 나타나고 있어요. 코드베이스의 상당 부분은 확률적 시스템에 의해 생성되었고, 완전히 파악하기에는 너무 큰 맥락 속에서 시간 압박을 받으며 검토되었습니다. 그리고 단 한 명의 인간도 처음부터 끝까지 설계하지 않은 전체 시스템에 통합되었죠. 코드베이스는 여전히 실행되고 배포되지만, "의도대로 작동한다"는 신뢰 구간은 넓어졌습니다. 하지만 대부분의 팀은 이를 반영하기 위해 관행을 업데이트하지 못했어요. 여기서 모든 것의 핵심 비대칭성이 드러납니다. 생성은 저렴해졌지만, 검증은 그렇지 않다는 것입니다.
에이전트는 500줄짜리 풀 리퀘스트를 1분 이내에 그럴듯하게 생성할 수 있습니다. 하지만 이 풀 리퀘스트에서 미묘한 버그를 찾아내는 것은 (예를 들어 동시성 문제, 사양에 대한 미묘한 오해, 또는 코드가 문자 그대로 요청된 것을 했지만 실제로 원하는 것은 아니었던 경우) 선임 엔지니어가 한 시간 이상 주의 깊게 읽어야 할 수도 있습니다. 검토는 생성보다 확장성이 떨어지며, 결정적으로 출력량에 따라 선형적으로 확장되지 않습니다. 코드베이스의 더 많은 부분이 에이전트에 의해 작성될수록, 단일 부분을 평가하기 위해 머릿속에 담고 있어야 할 맥락이 더 커지기 때문입니다. 이제 당신은 자신이 작성한 코드베이스에 대해 하나의 풀 리퀘스트를 검토하는 것이 아니라, 주로 다른 에이전트가 작성하고, 당신이 깊이 검토한 것을 잊어버린 코드베이스에 대해, 끊임없이 증가하는 시간 압박 속에서 풀 리퀘스트를 검토하게 됩니다.
"어떤 규모에서는 시스템이 인간이 안정적으로 평가할 수 있는 것보다 더 많은 것을 생산하게 되고, 정확성은 확실성보다는 확률적이 됩니다."
이것은 미래의 문제가 아니라 현재의 문제입니다. 특정 처리량을 넘어서면 버그가 생기는 것은 검토자들이 부주의해서가 아니라, 인간의 주의력으로 의미 있게 검사할 수 있는 출력량을 초과했기 때문입니다. 그리고 검토의 상당 부분을 수행하는 모델 자체도 비결정론적이어서 많은 것을 놓치게 됩니다. 코드베이스는 이제 '작동한다는 것을 아는 것'이 아니라, '작동할 것이라고 믿는 것'이 되고, 그 확률을 더 이상 정확하게 말할 수 없게 됩니다.
구체적으로는, 열 번 중 아홉 번은 테스트 스위트를 통과하는 경쟁 조건, 스테이징에서는 완벽하게 작동하지만 예상치 못한 프롬프트 분포에서는 실패하는 기능, 또는 1만 개 중 한 행을 조용히 손상시키고 있어 3주 후에나 발견될 마이그레이션과 같은 상황이 발생합니다. 최근 Proximal과 Modular가 최신 에이전트 시스템을 테스트하기 위해 공동으로 발표한 연구 결과(https://www.modular.com/blog/how-frontier-coding-agents-built-a-video-diffusion-pipeline-on-max)에서도 이러한 실패 패턴이 문서화되어 있습니다. 저자 또한 자신의 멀티 에이전트 시스템으로 작성한 코드에서 이러한 현상을 직접 목격했다고 합니다. 이러한 실패 모드는 일반적으로 극적인 붕괴보다는 느리고 조용한 품질 저하의 형태로 나타납니다. 생성은 증가하고, 검토 품질은 떨어지며, 눈에 띄지 않는 결함이 축적되고, 시스템에 대한 신뢰는 조용히 침식되어 결국 고객이나 감사인, 또는 프로덕션 사고가 문제가 수면 위로 떠오르게 할 때까지 이어집니다. 그때가 되면 기술 부채는 이미 깊어집니다.
불편한 진실은 우리가 이 문제를 제대로 해결할 도구를 아직 가지고 있지 않다는 것입니다. 문화가 도움이 될 수는 있습니다. 즉, 더 작은 단위로 병합하고, 더 엄격한 게이트를 적용하며, 세련된 결과물에 대한 무자비한 회의론, 가시성 확보, 롤백 규율 등이 중요합니다. 하지만 문화는 특정 팀 규모를 넘어서면 확장되지 않으며, 확률적 코드를 평가하기 위한 현재 시스템은 우리가 필요한 것에 비해 원시적입니다. 저자는 누군가가 이 문제에 대한 올바른 도구를 만들기를 희망하며, 그렇게 하는 사람이 다음 10년간 심각한 소프트웨어 개발의 운영 체제를 정의하게 될 것이라고 말합니다. 새로운 CI/CD는 아직 도구가 아니라, 당분간은 무자비한 회의론의 문화이며, 우리는 실시간으로 이 문화를 대체할 것을 구축하고 있다는 솔직한 인정이 필요합니다.
6. 산업별 변화 속도의 차이 ⚡
결정론적 엔지니어링에서 확률적 엔지니어링으로의 전환은 균일하게 일어나지 않을 것입니다. 기술 확산에는 시간이 걸리고, 법률 및 규제 프레임워크는 항상 기술 발전에 뒤처지며, 이러한 변화는 산업과 위험 프로필에 따라 계층화될 것입니다. 따라서 어떻게 구축할지 결정하는 사람이라면 이러한 계층화를 이해하는 것이 중요합니다.
결정론적 계층은 고도로 규제되며, 항공 전자 공학, 의료 기기, 금융 거래 인프라, 원자력 제어 시스템, 결제 네트워크의 핵심과 같은 위험도가 높은 영역은 오랜 시간 동안 깊이 결정론적으로 유지될 것이며, 그래야만 합니다. 플라이-바이-와이어 시스템에서 조용히 발생하는 정확성 오류의 대가는 고객 불만이 아니라 생명입니다. 이러한 영역에서는 에이전트 지원을 신중하게 채택할 것이며, 공식적인 검증, 광범위한 시뮬레이션, 그리고 의도적으로 속도를 늦추는 인간 승인 체계 뒤에서 이루어질 것입니다. 이것은 상상력의 실패가 아니라, 위험이 요구하는 바를 올바르게 읽어낸 것입니다.
확률적 계층은 소비자 소프트웨어, 내부 도구, 마케팅 시스템, 대부분의 SaaS, 대부분의 콘텐츠 인프라, 그리고 대부분의 실험적이고 초기 단계 제품 작업에 해당합니다. 이곳은 확률적 엔지니어링이 이미 활발하게 진행되고 있으며 빠르게 가속화될 것입니다. 버그 발생 시 비용은 롤백, 사과, 긴급 수정에 그치며, 그 대가로 이 계층의 팀들은 결정론적 세계가 구조적으로 따라올 수 없는 반복 속도를 얻습니다. 기꺼이 출시하고, 측정하고, 수정하는 확률적 팀은 분기당 결정론적 경쟁사보다 한 자릿수 이상 더 많이 배울 수 있습니다.
"수렴 영역"은 저자가 흥미로운 미래의 중간 지점이라고 부르는 곳이며, 다음 10년간 경쟁이 펼쳐질 영역입니다. 모델이 똑똑해지고, 이를 둘러싼 시스템이 개선되며, 반복 주기가 실시간에 가까워질수록 "확률적으로 해도 안전한" 것의 경계는 계속해서 이동할 것입니다. 오늘날 결정론적으로 보이는 영역들(보험의 일부, 헬스케어의 일부, 엔터프라이즈 인프라의 일부)은 확률적 방법이 아래에서부터 조금씩 스며드는 것을 발견하게 될 것입니다. 이는 천천히 진행되다가 갑자기 빠르게 움직이는 경우가 될 것입니다. 한편, 확률적 엔지니어링의 최전선은 다시 결정론적 안전 장치를 구축하기 시작할 것입니다. 즉, 형식적인 검사, 검증된 핵심 경로, 그리고 확률적 생성이 결정론적 검증에 의해 제한되는 하이브리드 시스템이 등장할 것입니다.
향후 10년간의 승자는 자신이 어떤 계층에 속하는지 알고, 다른 계층에 속한 척하려는 유혹에 저항하며, 자신의 스택 내에서 두 계층 사이의 경계가 어디에 있어야 하는지 매우 정확하게 판단하는 팀이 될 것입니다.
7. 에이전트 함대: 새로운 작업 방식 🚢
변화하는 상황에 대한 적절한 비유를 많이 고민했지만, "공장 전환"은 아니라고 생각합니다. 왜냐하면 공장 노동자는 자동화되는 시스템이었고, 우리는 그렇지 않기 때문입니다. 저자의 관점에서 가장 적절한 비유는 "에이전트 함대"입니다. 하지만 이 단어를 사용할 때는 신중해야 한다고 저자는 말합니다. "함대"라는 단어는 질서, 계층, 신뢰성과 같은 함축적인 의미를 담고 있지만, 현실은 아직 그럴 자격이 없기 때문입니다. 대부분의 운영자가 실제로 운영하는 것은 잘 훈련된 해군이라기보다는 취약한 계약직 노동자들의 무리에 가깝습니다. 에이전트들은 역량이 고르지 않고, 행동이 확률적이며, 때로는 자신감 있게 틀리고, 종종 대규모로 운영하기에는 비용이 많이 듭니다. 오케스트레이션 계층이 고장 나고, 컨텍스트 윈도우가 폭발하며, 추론 비용이 이사회에 보여주고 싶지 않은 청구서로 나타납니다.
이러한 주의사항을 솔직하게 말했지만, 저자는 여전히 에이전트 함대 개념이 유효하다고 생각합니다. 함대에는 구성이 있습니다. 각기 다른 작업을 위한 다른 에이전트들이 있죠. 조정도 있습니다. 인계, 의존성, 에스컬레이션 경로가 있습니다. 그리고 명령 구조도 있습니다. 누군가가 임무를 결정하고, 교전 규칙을 설정하며, 돌아온 결과를 검토합니다. 그리고 결정적으로 함대에는 감시 교대가 있습니다. 사령관이 잠들어도 멈추지 않고, 주어진 명령 내에서 계속 작동하며, 아침에 발견한 내용을 보고합니다.
좋은 함대는 얼마나 많은 것을 생산하는지로 정의되지 않습니다. 그것이 생산하는 것이 얼마나 잘 유지되는지로 정의됩니다. 이런 관점에서 보면, 우리의 업무 방식은 새로운 형태를 띠게 됩니다. 아침에는 트리오지(triage) 및 병합 작업을 하고, 한낮에는 높은 영향력을 가진 인간 중심의 작업을 합니다(고객 대화, 전략, 제품 결정, 밤샘 작업에 필요한 사양 작성 등). 그리고 오후에는 첫 번째 에이전트들이 보고를 시작하면 검토 및 재지정을 합니다. 그런 다음, 하루의 끝에는 이전 세대의 지식 노동자들이 결코 하지 않았던 일을 합니다. 즉, 그냥 인계하는 것입니다. 밤새 시도하고 싶은 작업에 대한 사양을 에이전트 함대에 넘겨주고, 그들을 파견하며, 돌아올 결과 중 일부는 틀릴 것이고, 일부는 훌륭할 것이며, 그 둘의 차이를 구분하는 일은 오직 당신만이 할 수 있는 일이라는 것을 받아들입니다. 그러면 당신의 업무는 완료됩니다. 당신의 에이전트들은 잠들지 않으며, 이것이 바로 핵심입니다. 검토 규율이 유지된다면, 당신은 전날 끝냈던 것보다 더 앞선 상태로 깨어나게 될 것입니다.
8. 아직 존재하지 않는 모델을 위해 구축하라 🏗️
지난 몇 년간 저자가 꾸준히 말해온 것 중 하나이자, 많은 대기업 리더들이 아직 놓치고 있는 점은 바로 "우리가 오늘 사용하는 모델은 우리가 앞으로 사용하게 될 모델 중 가장 덜 똑똑한 모델"이라는 것입니다.
저자는 이 주장을 신중하게 하려고 합니다. 역량 성장이 항상 순조롭지는 않을 수 있기 때문입니다. 비용, 지연 시간, 신뢰성, 확장 한계 등이 중요하게 작용할 수 있죠. 하지만 저자가 인프라 계층에서 보고 있는 것을 고려하면, 이러한 방향성은 확실합니다. 향후 6~12개월 안에 최전선 역량은 현재 수준을 훨씬 뛰어넘을 것이며, 지금 사용할 수 있는 최고의 모델과 그때 사용할 수 있는 최고의 모델 간의 격차는 오늘과 1년 전 사이의 격차보다 더 클 가능성이 높습니다. 그리고 1년 전의 격차도 이미 상당했죠. 확장 법칙은 계속 유효합니다.
이것은 대부분의 리더십 팀이 아직 완전히 이해하지 못한 전략적 의미를 가집니다. 당신은 현재 가지고 있는 모델을 활용하기 위한 조직적 역량을 구축하는 것이 아니라, 아직 가지고 있지 않은 모델을 활용하기 위한 역량을 구축하고 있는 것입니다. 당신이 배우고 있는 사양 작성법, 당신이 구축하고 있는 검토 문화, 당신이 연결하고 있는 관측 가능성, 당신이 지시하는 법을 배우고 있는 에이전트 함대, 주니어들의 기술을 유지하기 위해 실험하고 있는 훈련 의식, 이 모든 것은 2026년의 역량을 위한 것이 아니라 2027년과 2028년을 위한 발판입니다. 다음 역량 도약이 오기 전에 이러한 발판을 지금 구축하는 기업들은 그 도약을 지렛대로 활용할 것입니다. 반면에 도구가 성숙해지기를 기다렸다가 조직을 재정비하려는 기업들은 다음 역량 시대의 첫 해를 선도자들이 이미 알고 있는 것을 배우는 데 보낼 것이며, 선도자들은 복리 효과를 누릴 것입니다.
이것이 관련성을 유지하는 조직과 그렇지 않은 조직을 가르는 부분입니다. 현재 가지고 있는 모델이 아닌, 앞으로 가지게 될 모델을 위해 시스템을 구축하고, 현재 모델이 요구하는 것보다 사양, 검토, 운영 규율에 과감하게 투자할 의지가 있어야 합니다. 왜냐하면 현재 모델이 당신이 사용하게 될 가장 약한 모델이기 때문입니다. 이를 일찍 깨달은 팀들은 앞서 나갈 것이며, 그렇지 못한 팀들은 18개월 후, 1년 전에는 눈에 띄게 더 낫지 않았던 경쟁사들에게 조용히 추월당했다는 사실을 알게 될 것입니다. 이 시대의 무관련성은 갑자기 나타나는 것이 아니라, 1년 전에는 당신보다 눈에 띄게 나을 것이 없었던 팀들과 발맞추지 못하는 점진적인 무능력으로 찾아옵니다.
9. 우리가 잃어버릴 근육 💪
저자의 지난 에세이에서도 언급했듯이, AI는 사회를 명확히 계층화하거나, 크게 민주화할 것입니다. 우리는 가장 적은 저항의 경로를 최적화하는 데 아름답고 끈질기게 효율적인 존재입니다. 가능할 때마다 우리는 필요한 노력을 최소화하는 옵션을 선택합니다. 그것이 육체적, 인지적, 또는 감정적 노력이든 말이죠. 하지만 이는 이 글의 맥락에서 간단한 아이디어를 이끌어냅니다. 만약 당신이 결코 직접 만들지 않는다면, 무엇이 만들어지고 있는지 평가하는 능력을 잃게 될 것입니다.
이것은 가설이 아니라 이미 일어나고 있는 일입니다. 인공지능에 의존하여 일을 시작한 주니어 엔지니어들 사이에서 말이죠. 그들은 빠르게 출시하고, 깔끔한 코드를 생산하며, 그 코드가 무엇을 하는지 일반적인 용어로 설명할 수 있습니다. 하지만 모델이 예상치 못한 방식으로 실패할 때, 그들은 종종 버그를 찾지 못합니다. 왜냐하면 새벽 2시에 수없이 스택 트레이스(stack trace)와 씨름하며 개인적으로 시스템의 내부 모델을 개발해본 적이 없기 때문입니다.
"깔끔하게 다듬어진 초안에 '승인' 버튼을 클릭하는 것으로 '안목(taste)'이 학습되는 것이 아닙니다. 기계의 그럴듯한 답변을 5초 만에 받아들이는 것으로 '판단력(judgment)'이 길러지는 것이 아니라, 어려운 문제와 씨름하며 오후 내내 고민하는 것으로 길러집니다. 다른 에이전트의 작업을 검토하는 것으로 '기술(craft)'이 습득되는 것이 아닙니다."
이러한 기술들은 에이전트가 매우 편리하게 제거해주는 마찰을 통해서만 형성됩니다.
이것은 대부분의 조직이 아직 제대로 다루지 못하고 있는 훈련 위기를 야기합니다. 소프트웨어 엔지니어링의 도제식 모델(주니어가 작은 것을 만들고, 시니어가 검토하며, 주니어는 시니어의 지적을 통해 안목을 흡수하는 방식)은, 주니어가 에이전트를 통해 결과물을 내고 시니어가 인간의 결과물이 아닌 에이전트의 결과물을 검토할 때 무너집니다. 다음 세대의 기술은 어디에서 올까요? 반복적인 연습 없이 안목을 어떻게 훈련할까요? 멘티가 애초에 작성하지 않은 것에 대한 멘토링은 무엇으로 대체될까요? 이것은 이 주장의 불편한 확장이며, 저자가 대화하는 대부분의 전통적인 조직에서는 현재의 시니어 엔지니어 세대가 이러한 옛날 방식으로 완전히 훈련받은 마지막 집단일 것입니다.
그들 뒤를 잇는 모든 사람들은 몇 년 전에는 존재하지 않았던 기계가 어려운 작업의 상당 부분을 대신하는 환경에서 배우고 있습니다. 이것이 그들이 더 나빠질 것이라는 의미는 아니지만, 달라질 것이라는 의미입니다. 그리고 옛날 방식의 어려운 훈련을 강요하는 것이 더 이상 상업적으로 합리적이지 않을 때, 새로운 '하드 모드' 훈련이 무엇인지 알아내는 부담은 우리 모두에게 있습니다. 사람을 개발하는 방식을 재설계하지 않고 에이전트를 순수한 가속기로만 취급하는 팀들은 5년 또는 10년 후에, 함대를 지휘할 수는 있지만 배의 설계도를 이해하지 못하는 세대의 운영자들을 발견하게 될 것입니다. 자신의 기술을 보존하고 싶은 독자들을 위한 균형 잡힌 대응은 항상 균형 잡힌 반대론적 접근을 취하는 것입니다. 즉, 함대 없이 작업을 수행하는 것입니다. 물론 항상은 아니고 대부분의 시간은 아니지만, 의도적으로 그리고 정기적으로, 중요한 일에 대해 어려운 방식으로 작업을 해보는 것입니다. 대부분의 동료들이 하지 않을 근육을 계속 유지한다면, 10년 후에는 그것이 엄청난 차이를 만들어낼 수도 있습니다.
10. 불편한 진실: 미래는 혼란스러울 수 있다 📉
이 글은 의도적으로 낙관적인 결론을 내리지 않습니다. 모든 변화와 마찬가지로, 다가오지 않을 것이라고 외면한다고 해서 오지 않는 것은 아니기 때문입니다. 업무는 이미 영원히 변했고, AI의 속도와 함께 진화하고 발전하고 있습니다. 이를 통해 우리는 인간에게 실제로 필요한 업무를 위해 낮 시간을 되찾을 것이고, 기계는 항상 고된 일이었던 업무를 위해 밤 시간을 되찾을 것입니다.
앞으로 몇 년은 혼란스러울 것입니다. 예상 가능한 시나리오에는 다음과 같은 것들이 포함됩니다. 자신이 자원했던 검토 부담에 지쳐버린 직원 계층, 시스템에는 필요하지만 보상받지 못하는 파편화된 역할의 계층, 현재 시니어들이 결과물을 판단하는 데 사용했던 기술을 결코 개발하지 못한 주니어 세대, 생산량과 작업 품질을 혼동하다가 사고가 발생할 때까지 그 간극을 알아채지 못하는 팀, 그리고 다음 모델을 위해 운영 역량을 구축한 조직과 그렇지 않은 조직 사이의 점점 더 벌어지는 격차. 이 모든 것이 가능하며, 일부는 이미 일어나고 있습니다.
최소한 핵심적인 교훈은 다음과 같습니다. 아직 오지 않은 모델을 위해 조직을 구축하여, 그 모델이 도착했을 때 당황하지 않도록 합시다. 때로는 어려운 일들을 직접 구축하여, 그 방법을 잊지 않도록 합시다. 밤에 에이전트 함대를 파견하고, 작업이 진행 중임을 알고 편안히 잠들되, 돌아온 결과 중 일부가 우리가 더 이상 감지하도록 훈련받지 않은 방식으로 잘못될 수 있다는 가능성에는 깨어 있어야 합니다.
24시간 근무자는 약속이 아니라, 재편성이며 확률적 엔지니어링 미래에 대한 투자입니다. 이 투자의 성공 여부는 시스템에 참여하는 인간이 충분히 예리하고, 정직하며, 잘 훈련되어 있어 애초에 시스템에 참여할 가치가 있는지에 달려 있습니다. 그리고 그 인간을 둘러싼 조직이 오늘날의 모델이 아니라, 아직 출시되지 않은 모델을 위해 구축되었는지에 달려 있습니다. 이 투자는 승리할 수 있지만, 아직 승리한 것은 아닙니다.
결론 🎯
소프트웨어 개발의 미래는 예측 불가능한 AI 에이전트와의 협업을 통해 더욱 확률적으로 변모하고 있습니다. 이러한 변화는 우리의 업무 방식, 역할, 조직 구조를 근본적으로 뒤흔들고 있으며, 특히 AI 네이티브 기업들은 이미 이 변화의 선두에 서 있습니다. 앞으로 다가올 AI 모델의 발전 속도를 고려할 때, 현재의 도구와 관행에만 머무르지 않고, 미래의 모델을 위한 시스템과 역량을 미리 구축하는 것이 무엇보다 중요합니다. 그렇지 않으면 경쟁에서 뒤처지거나, 인간이 고유하게 발휘해야 할 '안목'과 '판단력' 같은 핵심 기술을 잃어버릴 위험에 처할 수 있습니다. 궁극적으로 인간의 역할은 AI가 생성한 결과물을 효과적으로 방향 설정, 선택, 검증하는 데 집중될 것이며, 이를 위한 새로운 문화와 훈련 방식이 시급히 요구되는 시점입니다.
