이 영상은 Fal.ai의 공동 창업자 Burkay Gur와 엔지니어링 리더 Batuhan Taskaya가 a16z의 제너럴 파트너 Jennifer Li와 함께 Fal.ai의 성장 과정, 기술적 혁신, 그리고 AI 비디오 시장의 미래에 대해 깊이 있게 나누는 대담입니다. Fal.ai가 어떻게 한정된 GPU 자원으로도 빠르고 효율적인 생성형 미디어 클라우드를 구축했는지, 그리고 치열하게 변화하는 AI 비디오 생태계에서 어떤 전략과 문화를 통해 경쟁력을 확보하고 있는지 생생하게 들려줍니다. 영상은 AI 비디오의 발전, 인프라 최적화, 팀 문화, 그리고 앞으로의 기회까지 폭넓게 다루며, 실제 창업자들의 경험과 인사이트가 가득 담겨 있습니다.


1. AI 비디오 시장의 치열한 경쟁과 변화의 속도

영상은 현재 이미지 생성 모델에 대한 수요가 여전히 높지만, 각 모델마다 뚜렷한 차별점이 존재한다고 설명하며 시작합니다. 반면, 비디오 생성 모델 분야는 아직 초기 단계로, "여전히 도약이 계속되고 있고, 앞으로 만들어야 할 것이 훨씬 더 많다"고 강조합니다.

"비디오 쪽은 아직 품질 기준점에 도달하지 못해서, 아주 작은 개선이 아니라 큰 도약이 계속 일어나고 있어요. 다음 달에 무슨 일이 일어날지 예측하기도 힘들죠. 지금은 주 단위로 변화가 일어나는 시장입니다."

OpenAI의 Sora가 등장했을 때 팀 내에서도 "OpenAI가 너무 앞서가서 아무도 따라잡지 못할 것 같다"는 반응이 있었지만, 곧이어 Luma, Runway, Cling, Minimax 등 다양한 모델이 연이어 출시되며 경쟁이 더욱 치열해졌다고 회상합니다.


2. Fal.ai의 창업 배경과 팀 빌딩 스토리

Burkay Gur는 Coinbase에서 머신러닝 기반 사기 방지 시스템을 개발하던 경험에서 Fal.ai의 아이디어가 시작됐다고 밝힙니다. 처음에는 기업용 머신러닝 파이프라인 구축에 초점을 맞췄으나, 2023년 ChatGPT와 DALL-E의 등장으로 AI 시장이 급변하면서 생성형 미디어(이미지, 비디오, 오디오)로 방향을 전환하게 됩니다.

Batuhan Taskaya의 합류 과정도 흥미롭게 그려집니다. Burkay가 트위터 DM으로 Batuhan에게 연락해 처음에는 단순한 소개로 끝났지만, 투자 유치 후 다시 제안해 합류하게 된 일화를 전합니다.

"당시 폴란드 기숙사에서 통화했는데, 투자도 받고 좋은 팀이 모인다는 얘기에 확신이 생겼어요. '이 사람들과 10년은 같이 일하고 싶다'는 생각이 들었죠."

Batuhan은 어린 시절부터 파이썬 커뮤니티에 기여하며, 오픈소스와 컴파일러, 운영체제 등 개발 도구에 깊은 관심을 가져왔던 배경을 공유합니다.


3. 기술적 호기심과 한정된 자원에서 출발한 최적화

Fal.ai가 생성형 미디어, 특히 이미지/비디오 모델에 집중하게 된 계기는 기술적 호기심GPU 자원의 부족에서 비롯됐습니다. 2021년, 소수의 GPU(8개)만으로도 Stable Diffusion 같은 모델을 최대한 빠르게 돌리기 위해 성능 최적화에 몰두했다고 설명합니다.

"당시 GPU가 너무 귀해서, 주어진 자원에서 최대한 많은 연산과 반복을 뽑아내야 했어요. 구글 같은 대기업은 스타트업에 GPU를 잘 안 주니까, 우리는 8개로 버텨야 했죠."

Batuhan은 전통적인 컴파일러 성능 최적화 경험을 GPU에 적용해, 병목 구간을 찾아내고, 워크로드를 효율적으로 분산시키는 등 다양한 최적화 기법을 도입했다고 말합니다.

"가장 큰 성능 향상을 가져온 건 분산 파일 시스템 캐싱이었어요. 같은 데이터센터에서 모델 가중치를 다시 불러올 때, 동료 노드에서 바로 읽을 수 있게 하니 엄청난 시간 절약이 됐죠."


4. 이미지/비디오 모델의 발전과 워크플로우 혁신

Fal.ai는 Llama 2의 등장 이후, 이미지/비디오 생성 모델이 독자적인 시장을 형성할 것이라는 확신을 갖고, 해당 분야에 집중하기로 결정합니다. 이미지 모델은 다양한 워크플로우(예: 배경 제거, 해상도 개선, 색상 보정 등)를 체인처럼 연결해 사용하는 경우가 많아, 단순한 추론 엔진을 넘어 복잡한 맞춤형 워크플로우를 지원하는 것이 중요하다고 강조합니다.

"텍스트-이미지 모델만으로는 원하는 결과를 한 번에 얻기 힘들어서, 여러 모델을 연쇄적으로 연결해 점진적으로 이미지를 개선하는 방식이 자연스럽게 자리 잡았어요."

또한, 이미지 모델에서는 파인튜닝(fine-tuning)이 매우 활발하게 이루어지며, 이는 언어 모델보다 훨씬 더 많은 수요가 있다고 설명합니다.

"이미지 분야에서는 파인튜닝이 언어 모델보다 천 배는 더 많이 일어나요. 맥락을 추가하거나, 캐릭터 일관성을 높이기 위해 꼭 필요하죠."


5. 오픈소스와 상용 모델의 경쟁, 그리고 Fal.ai의 전략

이미지 모델 분야는 품질이 점차 수렴하는 경향이 있지만, 각 모델마다 고유의 강점이 있어 특정 용도에 따라 선택이 달라진다고 설명합니다. 예를 들어, 어떤 모델은 캐릭터 일관성에 강하고, 어떤 모델은 툴링 생태계가 뛰어나다는 식입니다.

비디오 모델은 아직 품질 기준점에 도달하지 않아, "2주 단위로 1등이 바뀌는" 치열한 경쟁이 이어지고 있습니다.

"Sora가 나왔을 때 우리 팀도 '이제 OpenAI가 너무 앞서가서 못 따라간다'고 했지만, 곧바로 Luma, Runway, Cling, Minimax 등에서 새로운 모델이 쏟아졌죠. 이 시장은 정말 예측이 불가능해요."

Fal.ai는 다양한 모델을 빠르게 테스트하고, 각 모델의 강점을 파악해 고객에게 최적의 선택을 조언하는 역할도 하고 있습니다.

"고객들이 '제품 사진에 가장 좋은 모델이 뭐냐', '가상 피팅에 적합한 모델이 뭐냐'고 물어보면, 저희가 직접 써보고 조언해드려요. 심지어 6~9개월 된 모델이 특정 작업에는 여전히 최고일 때도 있죠."


6. 인프라 혁신과 멀티클라우드 전략

Fal.ai는 초기부터 대형 클라우드 사업자에게 GPU 할당을 기대하기 어려웠기 때문에, 자체 멀티클라우드 오케스트레이션 시스템을 구축했습니다. 기존 Kubernetes 등 솔루션은 콜드 스타트가 느려서 직접 오케스트레이터와 분산 파일 시스템, 멀티 레이어 캐싱 등을 개발했다고 설명합니다.

"5초 만에 컨테이너를 띄우는 건 웹 서비스에선 괜찮지만, 우리에겐 GPU 5초가 너무 소중했어요. 그래서 직접 오케스트레이션 시스템을 만들었죠."

이러한 인프라 혁신 덕분에, 다양한 벤더의 GPU를 묶어 대규모 분산 슈퍼컴퓨터처럼 활용하고, 모델 가중치 로딩 속도도 극적으로 개선할 수 있었습니다.


7. 속도와 성능, 그리고 팀 구조의 비밀

Fal.ai는 "속도"를 회사의 핵심 가치로 삼고, 항상 최신 오픈소스와 경쟁사보다 한 발 앞서기 위해 노력합니다.

"속도는 영원한 무기가 아니에요. 오픈소스도 빠르게 따라오니까, 항상 집중해서 한 발 앞서야 하죠. 좋은 아이디어가 나오면 바로 도입하고, 그 위에 우리만의 것을 쌓아야 해요."

팀 구조도 엔지니어 중심으로 짜여 있으며, 40명 중 28명 이상이 엔지니어, 그중 절반 이상이 적용형 머신러닝(Applied ML) 엔지니어입니다. 이들은 모델 최적화, 고객 지원, 파인튜닝 등 다양한 역할을 맡고 있습니다.

"우리 팀은 시장과 기술에 집착하는 사람들이에요. 모든 모델을 직접 써보고, 고객 질문에 전문가처럼 답할 수 있도록 준비하죠."


8. 고객 중심 문화와 영업 전략

Fal.ai는 엔지니어 중심 기업임에도 불구하고, 고객 중심적이고 시장 지향적인 문화를 매우 중시합니다. 창업자들도 직접 영업에 나서고, 엔지니어들이 고객과 직접 소통하며 문제를 해결합니다.

"이기려면 시장을 이겨야 해요. 고객을 얻고, 그들과 함께 성장해야 하죠. 그래서 우리는 기술뿐 아니라 비즈니스 성장에도 집착합니다."

고객과의 소통을 위해 슬랙 커넥트를 적극 활용하고, 엔지니어들이 직접 고객 채널에 참여해 실시간으로 피드백을 주고받습니다.

"우리는 고객에게 물건을 '파는' 게 아니라, 함께 성장하고, 파트너가 되어주는 사람을 채용하려고 해요."


9. AI 비디오의 미래와 새로운 기회

마지막으로, 2026~2027년에도 생성형 비디오가 성장하지 않을 가능성은 거의 없다고 단언합니다.

"이제는 너무 늦었어요. 제 인스타그램 피드만 봐도 뭐가 진짜고 뭐가 AI로 만든 건지 구분이 안 될 정도예요. 고양이 올림픽, 실시간 광고 삽입, AI가 만드는 인터뷰 등 새로운 사례가 계속 나오고 있죠."

특히, 아직 충분히 주목받지 못한 새로운 활용 사례(예: 실시간 생성 광고, 짧은 플레이어블 게임, 레크리에이션 이미지/비디오 생성 등)에 큰 기대를 걸고 있습니다.

"이 기술들은 너무 강력해서, 앞으로 완전히 새로운 것들이 계속 만들어질 거예요. 그게 가장 기대되는 부분입니다."


마무리

Fal.ai의 여정은 한정된 자원과 기술적 호기심에서 출발해, 치열한 AI 비디오 시장에서 속도와 성능, 그리고 고객 중심 문화를 무기로 빠르게 성장해온 이야기입니다. 이들은 기술 혁신과 시장 적응, 그리고 팀워크를 통해 앞으로도 생성형 미디어 분야에서 새로운 기회를 만들어갈 것으로 보입니다. 🚀

"이제는 AI 비디오가 우리 일상에 너무 깊이 들어와서, 앞으로 어떤 새로운 세상이 펼쳐질지 정말 기대됩니다."

Related writing

Related writing

HarvestEngineering LeadershipKorean

스타트업의 다음 시대정신을 찾아서: Beyond Product 요약

이 글은 AI 시대에 ‘좋은 제품’만으로는 경쟁우위를 지키기 어려워진 현실에서, 스타트업이 만들어야 할 다음 해자(방어력)가 무엇인지 추적합니다. 저자는 이를 제품 너머(Beyond Product)—즉 고객에게 도달하는 방식, 고객을 이해하는 깊이, 이를 조직 시스템으로 축적하는 능력—의...

Mar 17, 2026Read more
HarvestEngineering Leadership · AIKorean

Software 3.0 시대, 조직의 생산성을 끌어올리는 AI 하네스 구축하기

이 글은 개발팀 내에서 개인의 역량에 크게 의존하고 있는 AI(LLM) 활용 방식을 조직 전체의 체계적인 시스템으로 발전시켜야 한다는 핵심적인 메시지를 담고 있습니다. 특히 Claude Code의 플러그인과 마켓플레이스 생태계를 단순한 확장 도구가 아닌, 팀의 업무 방식과 지식을 코드로 만...

Mar 8, 2026Read more
HarvestEngineering LeadershipKorean

낭만코딩: 비개발자는 절대 모르는 진짜 개발 프로세스 13단계

이 글은 "기능 성공"과 "제품 성공"이 다르다는 점을 강조하며, 현업에서 제품이 실패하지 않도록 거치는 13단계 개발 프로세스를 설명합니다. 코드를 짜기 전부터 출시 후 회고까지, 각 단계에서 겪는 고민과 결정들을 통해 비개발자나 초보 개발자들이 놓치기 쉬운 실제 개발의 복잡성과 중요성을...

Mar 1, 2026Read more