이 영상은 Google DeepMind의 Paige Bailey와 The Agent Factory 팟캐스트 진행자 Amit Maraj가 만나 Google의 최신 AI 기술들을 깊이 있게 다루는 내용입니다. 특히, Gemini 3의 발전 과정, 새로운 AI-native IDE인 Antigravity, 그리고 최신 이미지 생성 모델인 Nano Banana Pro에 대한 소개와 데모를 통해 개발자들이 이러한 도구들을 활용하여 혁신적인 AI 애플리케이션을 어떻게 구축할 수 있는지 상세히 보여줍니다.


1. 팟캐스트 소개 및 게스트 환영 👋

팟캐스트 진행자 Amit Maraj는 "The Agent Factory"에 오신 것을 환영하며, 인공지능 세계에서 기술적인 세부 사항들을 깊이 파고드는 팟캐스트임을 강조합니다. 이번 에피소드에는 DeepMind 팀의 Paige Bailey를 게스트로 초청했으며, Paige는 자신을 DeepMind 개발자 관계 팀의 UTL(Unit Team Lead)로 소개하며 Gemini API, Bio, Nano Banana, Gemma 등 AI 개발자들이 프로젝트에 활용할 수 있는 모든 Google AI 제품을 담당하고 있다고 말합니다.


2. Google의 새로운 AI 출시 제품들 🚀

Paige는 Google이 최근, 특히 2025년 5월까지 지난 1년간 엄청난 속도로 새로운 모델과 기능들을 출시해왔음을 강조합니다. "우리는 지난 1년 동안 매일, 때로는 하루에 한 개 이상씩 새로운 모델이나 기능을 출시하고 있습니다."고 말하며, 이러한 빠른 혁신이 계속될 것이라고 덧붙입니다.

가장 최근에 출시된 주요 모델로는 많은 기대를 모았던 Gemini 3 Pro와 Nano Banana 시리즈의 다음 버전인 Nano Banana Pro를 언급합니다. 이와 더불어, DeepMind 팀이 개발한 새로운 개발자용 IDE인 Antigravity도 소개하며, 개발 스택의 모든 부분에서 긍정적인 발전이 이루어지고 있음을 알립니다. Amit는 2025년 11월 24일 기준으로 이러한 모델들이 출시되었으며, AI 업계에 큰 반향을 일으켰다고 말하며 마치 "크리스마스 같았다"고 표현했습니다.


3. Gemini 3는 무엇인가요? (1.0에서 3.0까지의 진화 과정) ✨

Paige는 Gemini 3가 Gemini 모델 시리즈의 다음 단계임을 설명합니다.

  • Gemini 1: 다양한 종류의 콘텐츠를 이해하는 데 중점을 두었습니다. 비디오, 이미지, 오디오, 텍스트, 코드 등 모든 것을 동시에 이해할 수 있었습니다.
  • Gemini 2: 사고(reasoning) 능력에 초점을 맞추어 발전했습니다. 단계별 계획, 상세한 사고 추적, 사고 토큰(thinking tokens)과 같은 추론 개념을 도입했습니다.
  • Gemini 3: 코드 능력과 행동(acting) 능력에 비약적인 발전을 이루었습니다. Paige는 "코드와 행동 능력에서 훨씬 더 뛰어나졌습니다"라고 말하며, 이는 에이전트 스타일 작업 부하에 매우 유용하다고 설명합니다.

Gemini 3는 도구 사용(tools use) 및 함수 호출(function calling) 기능을 크게 개선하여, 다양한 모델들이 함께 작동하거나 시스템과 상호작용하여 작업을 완료하는 "더 복합적인 아키텍처"를 가능하게 했습니다. Amit는 코딩이 기본적으로 행동을 취하고, 코드를 작성하고, 기능을 변경하는 것이기 때문에 Gemini 3가 코딩에 뛰어난 이유를 직관적으로 이해할 수 있다고 말합니다.

Paige는 모델 구축 과정을 사전 훈련(pre-training)과 사후 훈련(post-training)으로 나누어 설명합니다.

  • 사전 훈련: Gemini가 가능한 한 많은 토큰(데이터 조각)에 접근하도록 하는 단계입니다. 인터넷 전체, 그리고 비디오 게임 영상이나 합성으로 생성된 코드 등 방대한 양의 합성 데이터셋을 활용합니다.
  • 사후 훈련: 사용자가 기대하는 특정 사용 사례에 대한 훨씬 더 구체적인 예시들을 제공하는 단계입니다. 여러 도구를 사용하여 작업을 수행하는 사람들의 매우 정성 들여 선별된 예시들, 웹사이트 편집을 포함한 다중 턴 대화, 그리고 강화 학습과 같은 기술들이 포함됩니다. Paige는 "Google의 수만 명의 사람들이 이 모델들을 훨씬 더 나은 상태로 만들기 위해 정말 열심히 노력했습니다."라고 강조합니다. Amit는 이 과정을 Gemini가 학교에서 기초를 배우고 (사전 훈련), 현장 경험을 통해 워크플로우를 배우는 (사후 훈련) 것에 비유하며 이해를 돕습니다.

4. "Vending Bench": AI가 비즈니스를 운영하다 💰

Paige는 Gemini 3의 성능 벤치마크 중 가장 좋아하는 것으로 Vending Bench를 소개합니다. Vending Bench는 모델이 수동적인 비즈니스, 즉 자판기를 운영하는 능력을 측정하는 벤치마크입니다.

"Vending Bench는 모델이 수동적인 비즈니스를 운영하는 능력을 측정합니다."

모델은 다음과 같은 역할을 수행합니다.

  • 어떤 물품을 비축해야 할지 결정합니다.
  • 재고가 부족해지면 재주문합니다.
  • 주문이 들어오면 사람을 배치하여 기계를 다시 채웁니다.
  • 사업의 모든 구성 요소를 관리하며 가능한 한 높은 가동 시간을 유지하기 위한 장기 계획을 세웁니다.

모델의 성능은 1년 동안 벌어들인 돈으로 평가됩니다. 현재 Gemini 3 Pro는 자판기 한 대당 약 $5,462의 수익을 올리고 있습니다. Paige는 이러한 결과를 보며 "기하급수적인 궤적을 따라 운영되고 있으니, 언젠가는 우리 모두 은퇴하고 수동적인 사업을 운영할 수 있을 것 같습니다"라고 농담하며 미래에 대한 기대를 표합니다. 그녀는 모델이 더 많은 전략과 장기적인 의사 결정을 요구하는 사용 사례에서 어떻게 개선되었는지 보는 것이 정말 흥미롭다고 덧붙입니다.

Amit는 Paige에게 팟캐스트 후 자판기 사업에 대한 미팅을 제안하며 즐거운 분위기를 이어갑니다. Paige는 "세탁소 벤치(laundromat bench)" 같은 평가 도구가 만들어지기를 바란다고 말하며, 이러한 수동적인 사업들이 엄청난 잠재력을 가지고 있다고 강조합니다. 그녀는 최근 AI 스타트업들이 거의 자율적으로 운영되는 비즈니스를 통해 매달 상당한 수익을 창출하고 있다고 언급합니다. Amit는 자판기와 세탁소가 안전하고 좋은 창업 시작점이 될 수 있다고 동의합니다.

Paige는 Gemini 3가 Elmarina 벤치마크에서 1500점을 돌파한 첫 모델이며 (현재 151점), Webdev Arena에서도 뛰어난 성능을 보인다고 덧붙입니다. Replit의 디자인 기능은 Gemini 3로 구동되며, AI 스튜디오에서 생성되는 앱의 품질이 크게 향상되었음을 강조합니다. 또한, 추론, 다중 모드, 도구 사용, 계획 능력에서 최고 수준이며, Minecraft 같은 복셀 아트(voxel art) 경험에서도 이전 모델보다 훨씬 나은 결과를 보여줍니다. 특히, "흥미로운 게임 메커니즘과 아름다운 UI를 포함한 게임 제작에 정말 능숙합니다."라고 말합니다.


5. 데모: AI 스튜디오에서 "Nordic Shield" 빌드하기 🛠️

이제 Paige는 Gemini 3를 AI 스튜디오의 빌드 기능에서 사용하는 모습을 직접 보여줍니다.

그녀는 웹캠과 마이크를 사용하여 사용자와 대화하는 앱을 만들고자 합니다. 이 앱은 "Nordic 테마"의 보험 앱으로, 사용자가 다양한 물건을 보여주면 앱이 다음과 같은 작업을 수행합니다.

  • 물건을 카탈로그화: 이름, 설명, 마모 상태를 기록합니다.
  • Google 검색 그라운딩을 사용하여 물건의 예상 가치를 평가하고 표 형식으로 보여줍니다.
  • 전반적으로 잘 디자인되어야 하며, 물건에 대한 통계를 표시해야 합니다.
  • 비디오 대화에는 Gemini Live를 사용해야 합니다.

Paige가 이 모든 요구 사항을 자연어로 입력하자, AI 스튜디오는 즉시 IDE와 유사한 환경으로 전환됩니다. 좌측의 "Thinking" 섹션을 확장하면 Gemini가 함수 호출, 모델 이름, 데이터 구조 등 앱을 구축하기 위해 어떤 작업을 수행해야 할지 추론하는 과정을 볼 수 있습니다. Gemini는 React Native를 사용하여 앱을 생성하고, 모바일에서도 접근 가능하도록 합니다. Paige는 Gemini가 자신보다 훨씬 더 나은 프롬프트를 작성하며, 최신 모델과 API 기능을 활용하여 문서를 찾아보거나 어떤 모델을 사용할지 고민할 필요 없이 앱을 생성해 주는 것이 매우 유용하다고 말합니다.

가장 인상 깊었던 점 중 하나는 Amit가 Paige가 요청하지 않았음에도 불구하고, 앱이 "Nordic Shield"라는 이름을 스스로 만들어낸 것을 지적하며 감탄합니다.


6. 디버깅 및 "자동 수정(Auto-Fix)" 기능 시연 🐞

Paige는 "Nordic Shield" 앱을 실행합니다. 처음에는 오디오 세션 충돌로 인해 마이크가 제대로 작동하지 않는 문제가 발생합니다. 이때 AI 스튜디오의 자동 수정(Auto-Fix) 기능이 활성화되어, Gemini가 "마이크가 켜져 있는지, 활성화되어 있는지, 미디어 스트림을 어떻게 이해해야 하는지" 등 문제를 해결하기 위한 추론 과정을 보여줍니다.

Paige는 Gemini가 스스로 생각하고 디버깅하는 능력이 개인적으로 매우 도움이 된다고 말합니다. "저는 JavaScript나 TypeScript 전문가라고는 할 수 없습니다. 그래서 문제점을 파악하고, 디버깅하며, 최신 스택에 포함해야 할 라이브러리를 알아내는 데 이 도움을 받는 것이 개인적으로 정말 유용합니다."라고 덧붙입니다. Amit는 AI가 오류를 인식하고, 분석하며, 생각 과정을 투명하게 보여주는 것이 매우 중요하다고 강조합니다.


7. UI 디자인을 위한 주석(Annotate) 기능 활용 📝

Paige는 앱 하단에 경고, 빌드 프로세스에 대한 통찰, 웹사이트의 인체 공학 및 접근성에 대한 권장 사항(예: 모바일 기기에서의 표시 문제) 등이 표시되는 것을 보여줍니다.

그리고 주석(Annotate) 앱 기능을 사용하여 앱 UI에 직접 피드백을 추가하는 방법을 시연합니다. 예를 들어, "이 카탈로그 항목 섹션을 더 매력적으로 만들어라"와 같이 댓글을 달 수 있습니다. Gemini는 이러한 주석을 해석하여 웹사이트에 변경 사항을 적용하며, 이는 마치 디자이너와 함께 UI를 수정하는 과정과 같다고 설명합니다. 그녀는 버그 수정과 디자인 주석 달기를 동시에 할 수 있는 점이 효율적이라고 말합니다.

잠시 후, 앱이 성공적으로 수정되어 Sven이라는 이름의 "보험 카탈로그 어시스턴트"가 등장합니다. Paige는 자신의 스마트폰을 보여주며 대화를 시작합니다.

Sven: "안녕하세요. 저는 당신의 보험 카탈로그 어시스턴트, 스벤입니다. 아이템을 하나씩 보여주시면 카탈로그화하는 것을 도와드리겠습니다." Paige: "이건 어떤가요?" Sven: "케이스에 링 그립이 있는 어두운색 스마트폰이 보입니다. 상태가 양호해 보입니다. 동의하시나요?" Paige: "물론이죠. 픽셀 7인데, 돌려보면 긁힘과 액정 균열도 있을 거예요." Sven: "아, 설명해주셔서 감사합니다. 지금 돌리시니 긁힘과 액정 균열이 보입니다. 이를 바탕으로 상태는 '보통'이라고 하겠습니다. 동의하시나요?" Paige: "좋아요." Sven: "픽셀 7 스마트폰을 카탈로그화했습니다. 다른 것이 있나요?"

이후 Paige는 Diet Dr. Pepper 캔과 뒤쪽의 컴퓨터 화면을 추가로 카탈로그화합니다. Sven은 물건의 이름, 설명, 상태를 기록하지만, 직접적인 가치 평가는 할 수 없다고 말합니다. 하지만 앱은 카탈로그화된 항목에 대한 "예상 가치"와 함께 Google 검색을 통한 인용 링크를 제공합니다.

Paige는 이 과정이 두 단계로 이루어졌다고 설명합니다. 라이브 API 어시스턴트(Sven)는 물건을 카탈로그화하는 역할을 하고, 항목이 목록에 추가되면 두 번째 에이전트가 Google 검색을 통해 해당 물건의 예상 가치를 찾아내는 것입니다. Amit는 Gemini 3와 API의 새로운 기능이 항상 검색 결과에 기반을 둘 수 있게 하여 매우 유용하다고 말하며, 자신의 물건들을 정리하거나 Facebook Marketplace에 판매할 때 유용할 것이라고 덧붙입니다.


8. Nano Banana Pro: 최첨단 이미지 생성 🎨

Paige는 Nano Banana Pro의 다양한 활용 사례를 소개합니다.

  • Pinterest 스타일의 아이템 콜라주를 단일 이미지로 합성합니다.
  • 실제 장소(예: 성)의 정사 투영 청사진을 다양한 시점에서 높은 신뢰도로 생성합니다.
  • 상세한 물리 현상 설명자를 생성하며, 이 모든 것은 Google 검색 그라운딩을 포함한 도구를 사용하여 뒷받침됩니다.
  • 1K, 2K, 4K 해상도 및 다양한 종횡비로 이미지 생성이 가능합니다.

Paige는 Nano Banana Pro가 "사람들이 무엇을 만들어낼지 보는 것이 정말 기대된다"고 말하며, 재해석된 게임 경험부터 Nurips 학회 발표 자료까지 다양한 창작물을 보았다고 언급합니다. Amit는 추론 능력과 다중 모드 출력을 결합하면 가능성이 무궁무진하다고 강조합니다.


9. 데모: Antigravity IDE를 활용한 웹사이트 재디자인 🌐

Amit는 Gemini 3로 작업한 자신의 프로젝트를 보여주며, 기존 웹사이트를 재디자인하는 과정을 시연합니다. 그는 자신의 틱톡, 인스타그램, 유튜브 쇼츠 등 짧은 형식의 비디오 콘텐츠를 통해 자료와 아티클을 공유하는 데 어려움을 겪고 있었습니다. 그는 새로운 웹사이트 디자인에 대한 아이디어(두들리하고 생동감 넘치는 파스텔 네오 브루탈리즘, 노트북 같은 테마)를 AI 스튜디오에 입력했고, AI 스튜디오는 그에게 새롭고 멋진 웹사이트를 만들어주었습니다.

문제는 기존 웹사이트가 이 새로운 디자인과 전혀 달랐다는 점입니다. Amit는 Antigravity IDEGemini 3 Pro의 다중 모드 기능을 활용하여 이 문제를 해결하고자 합니다. 그는 새로운 웹사이트의 스크린샷 두 장을 Antigravity에 입력하고, Gemini 3 Pro에게 "포함된 이미지에서 볼 수 있는 새로운 디자인 철학에 따라 이 사이트를 재구축하라"고 지시합니다.

Antigravity는 이미지를 해석하고 가장 중요한 디자인 특징들을 파악하여 코딩에 적용합니다. AI는 다음을 포함한 작업 목록(task list)을 생성합니다.

  • 기존 코드베이스 탐색
  • 새로운 디자인 분석
  • 새로운 디자인 시스템 설정

Amit는 이 과정에서 생성되는 구현 계획(implementation plan)이 유용하다고 말합니다. 이는 일종의 문서 역할을 하여 코드베이스가 커질 때 AI가 과거의 작업을 참조할 수 있게 돕기 때문입니다.

Paige는 Nano Banana Pro로 물리학자나 컴퓨터 과학자의 이미지를 생성하거나, 해커톤에서 게임 에셋 생성에 Nano Banana Pro를 활용했던 사례를 공유하며 Antigravity의 작업이 진행되는 동안 대화를 나눕니다.

작업이 완료된 후, Amit는 앱을 실행하여 결과를 보여줍니다. Amit의 새로운 웹사이트는 브랜드 가이드라인을 잘 따르고 있었고, 마우스 오버 시 흔들리는 "필(pill)" 형태의 요소들과 리소스, 프롬프트 라이브러리, 에이전트 청사진 등에 대한 정보가 포함되어 있었습니다. Amit는 단 하나의 프롬프트로도 꽤 좋은 결과가 나왔다고 말하며 Paige의 의견을 묻습니다. Paige는 "정말 멋져 보입니다! Gemini 3와 Antigravity에 감사드립니다."라고 감탄하며, "디테일에 대한 관심과 이러한 UI 디자인에 담긴 창의성이 마음에 듭니다. 이런 종류의 경험을 만드는 데 그 어느 때보다 능숙해진 것 같습니다."라고 평가합니다.


10. 전체 Google AI 스택 💻

마지막으로 Paige는 Amit에게 팟캐스트에 초대해 주셔서 감사하다고 말하며, Google의 전체 AI 스택에 대해 이야기할 수 있어서 좋았다고 소감을 밝힙니다. 그녀는 하드웨어부터 컴파일러, 머신러닝 프레임워크, 그리고 Antigravity와 AI Studio 같은 최종 앱 배포 도구까지 Google의 모든 AI 스택이 "최고의 모델을 구축하는 데 도움이 된다"고 강조합니다. Amit도 Google Cloud에 앱을 배포하여 실제 프로덕션에서 사용할 수 있다는 점을 언급하며 마무리합니다.


결론 🌟

이번 팟캐스트는 Gemini 3의 놀라운 진화를 통해 AI가 단순히 이해하고 추론하는 것을 넘어, 이제는 코드를 생성하고 실제 행동으로 옮기는 '에이전시'를 갖추게 되었음을 명확히 보여주었습니다. Antigravity IDE와 AI Studio 같은 도구들은 개발자들이 복잡한 AI 앱을 훨씬 쉽고 빠르게 구축할 수 있도록 지원하며, Nano Banana Pro는 이미지 생성 분야에서 창의성의 한계를 넓히고 있습니다. 이 모든 기술들이 결합되어 Google의 전체 AI 스택은 개발자들에게 무한한 가능성을 제공하며, AI가 우리의 일상과 비즈니스에 더욱 깊이 통합될 미래를 예고합니다.

함께 읽으면 좋은 글

함께 읽으면 좋은 글

HarvestAI한국어

에이전트가 ‘코딩’하고, 연구가 ‘루프’를 돌기 시작한 시대: 안드레이 카파시 대담 요약

안드레이 카파시는 최근 몇 달 사이 코딩 에이전트의 도약으로 인해, 사람이 직접 코드를 치기보다 “에이전트에게 의도를 전달하는 일”이 핵심이 됐다고 말합니다. 그는 이 흐름이 오토리서치(AutoResearch)처럼 “실험–학습–최적화”를 사람이 거의 개입하지 않고 굴리는 자율 연구 루프로...

2026년 3월 21일더 읽기
HarvestAI한국어

Claude 코드 서브 에이전트 vs 에이전트 팀: 무엇이 다를까요?

이 영상은 Shaw Talebi가 Claude 코드의 서브 에이전트와 에이전트 팀 기능을 자세히 설명하고, 실제 작업에 이 두 접근 방식을 비교하는 실험 결과를 공유합니다. 영상은 Claude 코드의 기본 개념부터 시작하여 AI 에이전트가 직면하는 문맥 처리의 한계, 그리고 이를 극복하기...

2026년 3월 16일더 읽기
HarvestAI한국어

한 명이 앤트로픽의 전체 성장 마케팅을 담당했다고? 클로드 코드로 가능했던 놀라운 이야기!

이 이야기는 2026년 기준으로 앤트로픽이라는 380억 달러 규모의 거대 기업에서 단 한 명의 비기술직 직원이 무려 10개월 동안 전체 성장 마케팅 팀의 역할을 수행했던 놀라운 사례를 다룹니다. 이 한 명의 마케터는 유료 검색 광고, 소셜 미디어 광고, 앱 스토어 최적화, 이메일 마케팅,...

2026년 3월 11일더 읽기