2025년 AI/LLM 업계 흐름 정리 및 2026년 예측

이 영상은 안드레 카파시의 회고를 바탕으로 2025년을 'Claude Code'와 에이전트의 해로 정의하며, 코딩을 넘어선 검증 가능한 보상(RLVR)의 확장을 논의합니다. AI의 발전으로 엔지니어는 단순 코더에서 AI를 지휘하는 '디렉터'로 역할이 변화하고 있음을 강조합니다. 또한 2026년에는 프론티어 모델과 오픈소스 간의 격차 심화 및 AI 네이티브 조직의 부상이 핵심 화두가 될 것으로 예측합니다.

1. 2025년 회고: Claude Code와 지식 습득의 변화

영상은 2025년 12월 29일 시점에서 지난 1년을 되돌아보며 시작합니다. 박진형 님은 2025년을 한마디로 'Claude Code(클로드 코드)의 해'라고 정의합니다. 우리가 기존에 웹 UI에서 채팅으로만 AI를 사용하던 방식을 넘어, 터미널 환경에서 AI에게 도구를 쥐여주고 자율적으로 코드를 수정하게 했을 때의 폭발적인 생산성을 경험했기 때문입니다.

또한, NotebookLM이나 이를 응용한 '나노 바나나' 같은 도구들이 대중화되면서 지식을 습득하는 방식 자체가 완전히 바뀌었습니다. 이제 사람들은 텍스트 전문을 읽기보다 AI가 요약해 주는 팟캐스트를 듣거나 핵심만 파악하는 방식을 선호하게 되었습니다.

2025년은 클로드 코드의 한 해였죠. 웹 UI 인터페이스만 사용하던 걸 넘어서, 터미널 안에서 에이전트에게 도구를 쥐여주고 "네가 알아서 수정해 봐"라고 했을 때 그 역할이 폭발적이었습니다.

지식은 너무 많고 지능은 공짜가 되었는데, 이걸 가지고 직접 실행해 보는 '공수'는 여전히 들어갑니다. 앞으로 사람의 최대 경쟁력은 실행력과 진정성, 그리고 끈기(집중력)라는 아주 희소한 자원이 될 것입니다.

2. 검증 가능한 보상(RLVR)과 에이전트의 진화

2025년을 관통한 첫 번째 서사는 RLVR(Reinforcement Learning with Verifiable Rewards), 즉 검증 가능한 보상을 통한 강화학습입니다. 수학 문제나 코딩처럼 정답이 명확하거나 컴파일러를 통해 실행 여부를 바로 확인할 수 있는 영역에서는 AI의 지능이 비약적으로 상승했습니다. 하지만 정답이 모호한 영역(글쓰기, 윤리적 판단 등)에서는 여전히 한계가 있음을 지적합니다.

앞으로는 코딩뿐만 아니라 과학과 수학 분야에서도 시뮬레이션 환경(World Model)이나 'AlphaEvolve' 같은 기법을 통해 자체적인 검증 신호를 만들어내며 비약적인 발전이 있을 것으로 예측됩니다.

정답이 명확한 영역에서는 지능이 급등한 것은 명확합니다. 하지만 사람들이 원하는 건 정답이 주어지지 않은 문제에 대해서 찾아 나가는 것이죠.

코딩 문제 같은 경우에는 인터프리터나 컴파일러가 존재해서 베리파이어블(Verifiable)한 리워드 펑션을 명확하게 줄 수 있는데, 과학과 수학 같은 경우에는 그런 게 없잖아요. 그래서 '월드 모델'이나 시뮬레이션을 통해 가상의 검증 환경을 만들려는 시도가 2026년의 핵심이 될 것 같습니다.

3. Vibe Coding의 시대와 엔지니어의 역할 변화 👷‍♂️

2025년 콜린스 사전의 '올해의 단어'로 선정되기도 한 'Vibe Coding'에 대한 이야기도 중요하게 다뤄졌습니다. 이제 코드는 마치 한 번 쓰고 버리는 소모품처럼 공짜(Free)에 가까워졌습니다. 하지만 AI가 코딩을 너무 쉽게 해주다 보니, 정작 사람들은 맥락을 자세히 설명하거나 깊게 고민하지 않고 "딸깍"하며 대충 일을 넘기려는 경향이 생겼습니다.

두 화자는 이런 시대일수록 엔지니어의 역할이 '디렉터(Director)'가 되어야 한다고 강조합니다. AI가 구현은 잘하지만 큰 그림은 모르기 때문에, 사람이 이론적인 베이스를 탄탄히 갖추고 AI에게 정확한 피드백과 방향성을 제시해야 한다는 것입니다.

코드는 사실상 공짜가 되었고, 한 번 쓰고 버리는 소모품처럼 되었습니다. 사람들이 AI의 속도가 빠르니까 나도 대충 넣고, 대충 결과물이 나오니까 자신의 일의 가치를 싸게 평가해 버리는 경향이 있어요.

모든 개발자는 디렉터가 되어야 합니다. 비전을 제시하고, 인스트럭션을 내리고, 피드백을 주고, 그리고 결과물에 책임을 지는 것. 이 모든 게 디렉터가 해야 되는 일입니다. 오히려 이론 중심의 깊은 지식이 AI에게 크리티컬한 피드백을 주기 위해 더 중요해질 것입니다.

4. 샌드박싱과 벤치마크의 한계

AI 에이전트가 로컬 환경(내 컴퓨터)에서 직접 코드를 수정하고 명령어를 실행하게 되면서 보안과 샌드박싱(격리 환경)의 중요성이 대두되었습니다. 에이전트가 실수로 중요 드라이버를 삭제하거나 시스템을 망가뜨릴 수 있기 때문입니다. 기업 환경에서는 이러한 불확실성 때문에 자유로운 에이전트보다는 정해진 워크플로우를 따르는 방식을 선호합니다.

또한, 기존의 벤치마크(성능 평가) 방식에 대한 회의론도 제기되었습니다. 특정 문제 세트(Test Set)만 잘 푸는 것은 진정한 지능이 아니며, 다양한 환경(Environment)에서 새로운 패턴을 학습하고 적응하는 능력을 평가해야 한다고 말합니다.

AI에게 권한을 많이 줄수록 생산성은 높아져요. 하지만 만에 하나 AI가 오작동하거나 공격당하면 피해가 막대해지죠. 그래서 기업들은 정해진 작업 흐름도 안에서만 실행하도록 하는 케이스가 많습니다.

테스트 셋(Test Set)은 어떤 환경에 대한 하나의 스냅샷일 뿐입니다. 테스트보다 더 일반화된 것이 '환경'이고, 환경이 잘 주어지면 오버피팅(과적합) 문제를 해결하고 진정한 의미의 AGI 측정에 다가갈 수 있을 것입니다.

5. 2026년 전망: 모델 경쟁과 격차의 심화 📉

2026년의 오픈소스 및 모델 경쟁에 대해서는 '격차의 심화'를 예측했습니다. 2025년에는 딥시크(DeepSeek) 등 중국 모델의 약진이 두드러졌지만, 최상위 프론티어 랩(OpenAI, Google, Anthropic, xAI 등)과 그 외 랩들 간의 간극은 점점 벌어지고 있습니다.

특히, 엔비디아의 최신 칩(블랙웰) 기반 데이터센터를 구축할 수 있는 자본력을 가진 소수의 기업만이 MoE(전문가 믹스) 같은 거대 모델을 운용할 수 있으며, 나머지 기업들은 이 거대 모델에서 지식을 추출(Distillation)한 Dense 모델을 받아 쓰는 형태가 될 것으로 보입니다.

프론티어 랩들과 그렇지 않은 랩들의 차이가 워낙 크다 보니, 그 격차는 점점 더 커질 것 같습니다. 우리가 할 수 있는 건 좋은 댄스 모델이 나오기를 기다리고, 그걸 받아서 우리 도메인에 맞게 파인튜닝하는 것이 현실적인 전략이겠죠.

결국 기업 입장에서는 AI가 얼마나 돈이 되느냐가 중요한데, 이는 실제 산업군에 얼마나 잘 적용(Apply)되느냐의 문제입니다. 이를 한국에서는 AX(AI Transformation)라고도 부르죠.

6. 결론: AI 네이티브 조직과 우리의 자세

마지막으로 AI 도입과 조직 구조에 대한 통찰을 나눴습니다. 기존 레거시 시스템과 보수적인 문화를 가진 대기업은 AI 도입 효과를 보기 어려운 반면, 처음부터 AI 네이티브(AI Native)하게 설계된 스타트업이나 신생 조직이 대기업을 압도하는 생산성을 보여줄 가능성이 큽니다.

미래를 완벽하게 예측하고 3년짜리 계획을 세우는 것은 무의미해졌습니다. 대신 기술에 대한 믿음(Believer)을 가지되, 끊임없이 피드백을 주고받으며 유연하게 대처하는 태도가 필요합니다.

사람이 만들어 놓은 구조가 AI의 발전을 막으려는 형태로 가기 때문에, 처음부터 AI 네이티브한 구조를 가진 신생 기업이 대기업을 이길 가능성이 큽니다. 이는 사회적으로 굉장히 큰 구조의 변화가 될 수 있습니다.

계획이 없으면 나의 뷰(View)가 없다는 뜻입니다. 세상에서 수많은 피드백을 받아 계획이 일주일 뒤에 수정될지언정, 계획을 세우는 것 자체는 여전히 중요합니다. 그래야 주도적으로 AI와 협업할 수 있으니까요.

마치며

2025년은 AI가 단순한 채팅 상대를 넘어 실질적인 업무 도구이자 에이전트로 자리 잡은 원년이었습니다. 2026년에도 기술은 빠르게 변하겠지만, 결국 중요한 것은 그 기술을 다루는 사람의 '디렉팅 능력'과 '건강'임을 잊지 말아야겠습니다.

1. 2025년 회고: Claude Code와 지식 습득의 변화

2. 검증 가능한 보상(RLVR)과 에이전트의 진화

3. Vibe Coding의 시대와 엔지니어의 역할 변화 👷‍♂️

4. 샌드박싱과 벤치마크의 한계

5. 2026년 전망: 모델 경쟁과 격차의 심화 📉

6. 결론: AI 네이티브 조직과 우리의 자세

마치며

Related writing

에이전트가 ‘코딩’하고, 연구가 ‘루프’를 돌기 시작한 시대: 안드레이 카파시 대담 요약

Claude 코드 서브 에이전트 vs 에이전트 팀: 무엇이 다를까요?

한 명이 앤트로픽의 전체 성장 마케팅을 담당했다고? 클로드 코드로 가능했던 놀라운 이야기!