1. 서론: GPT의 놀라운 진화와 IMO 금메달 소식

2025년 7월 20일 일요일 저녁, 두 진행자(최승준, 체스터 로)는 전날에 이어 하루 만에 다시 녹음을 시작합니다. 그 이유는 바로 OpenAI가 국제수학올림피아드(IMO)에서 금메달 수준의 성과를 냈다는 엄청난 뉴스가 전해졌기 때문입니다.

"GPT-3.5가 나왔을 때만 해도 세 자리 수 덧셈을 단계별로 보여주면 Chain of Thought로 풀 수 있었죠. 그게 2022년 말이었어요. 그런데 이제는 IMO 문제를 푸는 모델이 나왔습니다."

이 소식은 단순히 문제를 푼 것 이상의 의미가 있다고 강조합니다. 최근 OpenAI 내부의 인재 유출, Windsurf 인수 실패 등 여러 이슈가 있었지만, 이번 성과는 여전히 최전선에 있다는 존재감을 보여주는 사건이라고 평가합니다.


2. IMO란 무엇인가? 그리고 OpenAI의 쾌거

IMO(International Mathematical Olympiad)는 만 20세 미만, 대학 교육을 받지 않은 고등학생들이 참가하는 세계 최고 난이도의 수학 경시대회입니다. 이틀에 걸쳐 6문제를 풀고, 각 문제는 7점 만점, 총 42점 만점입니다.

"OpenAI가 이번에 5문제를 풀었습니다. 이건 금메달 수준이에요."

특히 3번, 6번 문제가 가장 어렵다고 알려져 있는데, 6번 문제는 풀지 못했지만, OpenAI 내부의 IMO 메달리스트들이 해답을 검증했고 외부에서도 인정받고 있습니다.


3. 이번 성과의 기술적 의미: '하네스' 없는 순수 추론

이번에 사용된 모델은 KIMI K2 혹은 그 계보를 잇는 o1 계열 LLM입니다. 중요한 점은 하나의 모델이 순수하게 추론만으로 모든 문제를 풀었다는 것입니다.

"이번에는 MCTS 같은 시스템을 쓰지 않고, 그냥 next token prediction과 강화학습만으로 수학 문제를 풀었어요. 이게 정말 대단한 점입니다."

사람이 4.5시간 동안 3문제를 푸는 것처럼, 모델도 몇 시간에 걸쳐 멈추지 않고 문제를 풀었습니다. 기존에는 여러 시스템을 조합하거나, 증명 보조 도구(Lean 등)를 활용했지만, 이번에는 외부 도구 없이 LLM만으로 해냈다는 점이 혁신적입니다.


4. 수학 경시와 AI: 인간과 AI의 차이

IMO 문제는 고등학생이 푼다고 하지만, 엄청난 창의력과 깊은 사고가 필요합니다. 대표적인 AI 회의론자 게리 마커스도 "AI가 IMO 문제는 못 푼다"고 비꼬았지만, 이번에 그 벽을 넘었습니다.

"이런 문제는 학교 다닐 때 천재 친구들이 풀던 문제였죠. 겉보기엔 쉬워 보여도, 실제로 풀려면 노트 한 권이 필요할 정도로 복잡합니다."

문제와 해답은 모두 공개되어 있으며, OpenAI는 공식 문제를 그대로 읽고, 자연어로 증명을 작성했습니다. Lean 등으로 번역하는 방식이 아니라, LLM이 직접 자연어로 증명을 쓴 것이 차별점입니다.


5. 강화학습, 테스트타임 컴퓨트, 그리고 일반화

이번 성과는 특정 수학 문제에 특화된 모델이 아니라, 범용 추론 LLM이 이룬 결과입니다. 즉, 앞으로 수학뿐 아니라 다양한 분야로 확장될 수 있음을 시사합니다.

"이번 모델은 수학 특화 모델이 아니라, 차세대 범용 모델이에요. 우리가 요즘 쓰는 o시리즈처럼, 일반적인 추론 모델이 IMO 수준의 수학 문제를 푼다는 건 큰 의미가 있습니다."

또한, 테스트타임 컴퓨트(문제 풀 때 투입하는 연산량)를 늘리면 성능이 계속 올라간다는 점도 확인되었습니다.


6. 인간과 AI의 비교, 그리고 신중한 시각

외부 전문가, 특히 수학계의 거장 테렌스 타오(Terence Tao)는 신중한 입장을 보입니다.

"만약 대회 형식을 바꿔서, 문제를 더 쉽게 바꿔주고, 도구와 인터넷을 무제한 제공하고, 여러 명이 협업하게 한다면, 성공률이 크게 달라질 겁니다. 그러니 AI와 인간을 직접 비교할 때는 신중해야 합니다."

즉, AI가 인간과 똑같은 조건에서 문제를 푼 것인지, 혹은 형식의 차이가 있는지에 대한 논의가 필요하다는 점을 강조합니다.


7. AI 개발 현황과 인재 전쟁

최근 AI 업계는 인재 쟁탈전이 치열합니다. Meta, Google, OpenAI 등은 천문학적 연봉과 스톡옵션으로 인재를 모으고 있습니다.

"요즘 인기 있는 사진이 있죠. 호날두와 개발자를 나란히 놓은 사진. 이제 개발자도 슈퍼스타 대우를 받는 시대입니다."

Windsurf 인수전, Cursor, Devin 등 다양한 스타트업과 대기업 간의 인수합병, 인재 이동이 이어지고 있습니다. 이제는 기업 단위가 아니라, 개인 단위로 IP와 인재 가치가 평가되는 시대가 되었습니다.

"전통적인 회사 단위의 엑싯이나 IPO 전략이 무너지고, 이제는 개인 머릿속의 IP가 직접 평가받는 시대입니다."


8. OpenAI의 조직 문화와 미래 전망

OpenAI는 작은 팀 단위의 바텀업 방식으로, 각자 미션을 정하고 실험하며, 성공한 프로젝트가 위로 올라가는 진화적 시스템을 유지하고 있습니다. 2023년 11월 샘 알트만 사태 이후 인원이 700명에서 3,000명으로 늘었지만, 여전히 스타트업처럼 움직입니다.

"구글이 신의 반열에 올랐던 2005~2008년, 그때도 내부적으로는 똑같았어요. 이건 반복되는 사이클 같아요."

AI 실험과 모델 개발의 핵심은 계속해서 실험을 돌릴 수 있는 컴퓨트(연산 자원)에 달려 있습니다. Meta, x.ai, Google, OpenAI 모두 대규모 데이터센터를 짓고 있습니다.


9. 기술적 한계와 앞으로의 과제

현재는 프리트레인(사전학습) 기반 모델의 성능이 어느 정도 정체에 이르렀지만, 강화학습과 테스트타임 컴퓨트, 그리고 합성 데이터 생성을 통해 여전히 성능을 끌어올릴 수 있는 여지가 많다고 봅니다.

"이제는 프리트레인 데이터보다 강화학습에서 쏟아지는 추론 토큰이 훨씬 많아지고, 그걸 검증하는 기계도 옆에서 계속 돌고 있어요. 그걸로 합성 데이터가 만들어지고, 모델 크기도 커집니다."


10. IMO 금메달의 의미와 앞으로의 변화

이번 IMO 금메달은 단순한 수학 문제 풀이를 넘어, AI가 인간의 창의적 사고와 추론을 점점 더 닮아가고 있다는 신호로 받아들여집니다.

"이제는 모델이 몇 분이 아니라 몇 시간 동안 생각해서 IMO 문제를 풉니다. 만약 하루, 한 달 동안 생각한다면 뭘 풀 수 있을까요?"

진행자들은 이 변화의 속도에 압도당하는 심정을 솔직하게 고백합니다.

"오늘은 정말 머리가 멈췄어요. 답이 안 떠오릅니다."


11. 결론: 인재, 자본, 그리고 AI의 미래

AI 업계는 인재와 자본, 그리고 기술의 삼박자가 빠르게 재편되고 있습니다. Meta, Google, Amazon 등은 안정적인 수익 모델을 바탕으로 투자 여력이 있지만, OpenAI와 Anthropic 등은 아직 확실한 수익 모델이 없는 상태입니다.

"Windsurf 가격이 DeepMind 인수 때보다 6배나 높아요. 실리콘밸리에서 오가는 돈의 규모가 상상 이상입니다."

이런 변화 속에서, 전통적인 기업 구조와 보상 체계가 무너지고, 개인의 역량과 IP가 직접적으로 평가받는 시대가 도래했음을 강조합니다.

"이제는 회사가 아니라, 개인 머릿속의 IP가 직접 평가받는 시대입니다."

마지막으로, 진행자들은 오늘의 뉴스에 놀라움을 감추지 못하며, 앞으로 우리가 무엇을 해야 할지 고민을 남기며 마무리합니다.

"이런 상황에서 우리는 무엇을 해야 할까요? 오늘은 정말 답이 안 나옵니다."


12. 에필로그: 변화의 한가운데에서

방송을 마치며, 두 진행자는 AI의 발전 속도와 그에 따른 사회적, 산업적 변화에 대한 경외감과 약간의 두려움을 솔직하게 드러냅니다.

"매일 아침, 지능의 최전선이 어디까지 왔는지 직접 확인할 수 있다는 건 정말 부러운 특권이에요."

그리고, 이 변화의 흐름을 계속 따라가며, 우리 모두가 새로운 시대에 어떻게 적응할지 고민해야 한다는 메시지로 요약을 마칩니다.


핵심 키워드:

  • OpenAI, IMO 금메달, LLM, Chain of Thought, 강화학습, 테스트타임 컴퓨트, 합성 데이터, 인재 전쟁, 조직 문화, AI의 일반화, 인간-기계 비교, 미래 전망

"이제는 하네스(복잡한 시스템 조합) 없이, 하나의 모델이 순수 추론만으로 IMO 금메달을 따는 시대가 왔습니다."
"우리는 지금, 인공지능이 인간의 창의적 사고를 닮아가는 현장을 목격하고 있습니다."
"이 변화의 속도에 압도당하는 기분, 그게 오늘의 결론입니다."

함께 읽으면 좋은 글

함께 읽으면 좋은 글

Harvest엔지니어링 리더십 · AI한국어

Software 3.0 시대, 조직의 생산성을 끌어올리는 AI 하네스 구축하기

이 글은 개발팀 내에서 개인의 역량에 크게 의존하고 있는 AI(LLM) 활용 방식을 조직 전체의 체계적인 시스템으로 발전시켜야 한다는 핵심적인 메시지를 담고 있습니다. 특히 Claude Code의 플러그인과 마켓플레이스 생태계를 단순한 확장 도구가 아닌, 팀의 업무 방식과 지식을 코드로 만...

2026년 3월 8일더 읽기
Harvest엔지니어링 리더십한국어

미첼 하시모토의 새로운 코드 작성법: AI 시대의 소프트웨어 엔지니어링

이 영상은 하시코프(HashiCorp)의 공동 창립자이자 고스티(Ghostty)의 창시자인 미첼 하시모토와의 인터뷰를 담고 있습니다. 그는 소프트웨어 엔지니어링에 입문한 과정, 하시코프의 설립 역사, 그리고 널리 사용되는 오픈소스 도구를 성공적인 비즈니스로 전환하는 데 겪었던 어려움에 대해...

2026년 2월 25일더 읽기
Harvest엔지니어링 리더십한국어

자체 백그라운드 코딩 에이전트 'Inspect'를 개발한 이유와 방법

Ramp 엔지니어링 팀은 엔지니어처럼 모든 맥락과 도구를 갖추고 작업을 검증할 수 있는 자체 코딩 에이전트 'Inspect'를 개발했습니다. Inspect는 샌드박스 환경에서 실행되어 빠르고 안전하며, 현재 Ramp 전체 풀 리퀘스트(PR)의 약 30%를 처리할 만큼 높은 효율을 자랑합니다...

2026년 2월 20일더 읽기