Traversal: AI와 인과 머신러닝으로 푸는 복잡 시스템 문제해결 – 창업자와의 대화 요약

Traversal.ai 창업자들이 복잡한 기업 환경에서 발생하는 문제의 근본 원인 분석을 위해 AI와 인과 머신러닝(Causal ML), 강화학습(RL)을 어떻게 결합했는지 상세히 풀어줍니다. 이들은 전통적인 관찰(Observability) 도구들의 한계와, 방대한 데이터 환경에서 AI가 '문제의 원인'을 실제로 찾아가는 고유한 방식을 소개합니다. Traversal은 단순한 자동화가 아닌, 실제 '원인과 결과'를 밝혀내며 엔지니어링을 더욱 똑똑하고 능동적으로 발전시키는 데 초점을 맞추고 있습니다.

1. 창업자 소개와 Traversal의 시작

처음 영상은 팟캐스트 'Latent Space'의 진행자와 Traversal 창업자들이 등장하며 시작됩니다. Alessio(커널랩스 창업자), Swixs(Small AI 창업자)가 인사를 하고, Traversal 공동 창업자인 애니시(Anish)와 라즈(Raaz)가 본인을 소개합니다.

애니시는 MIT에서 컴퓨터과학 박사학위를 받고 "AI와 머신러닝에 푹 빠져 연구를 계속하고 싶었다"라고 말합니다. 특히 "인과 머신러닝" 분야에 집중했고, "상관관계는 원인이 아님을 아는 것이 중요하다. 데이터에서 인과관계를 잡아내는 AI 시스템이 필요하다"고 강조합니다.

"AI가 어떻게 데이터에서 '원인'과 '결과'를 파악할 수 있을까?"

그리고 강화학습에도 깊은 관심을 가진 그는 "강화학습은 넓은 검색 공간을 효과적으로 탐색하는 방법"이라고 설명합니다.

라즈는 인도에서 자라 버클리에서 박사를 했고, 무선시스템 감시 스타트업에서 인과분석 문제를 다루며 이 분야에 흥미를 느꼈다고 말합니다. MIT에서 애니시와 만나 꿈꿔왔던 "이론을 회사로 전환하는 방법"을 함께 고민했다고 회고합니다.

2. Traversal 아이디어 – 타이밍과 시장, 그리고 고유한 접근

Traversal이 주목한 지점은 "AI가 등장하면서 거의 자연스럽게 나온 첫 번째 명확한 문제"였다는 점입니다. AI를 활용한 SRE(운영 신뢰성 엔지니어링) 스타트업들이 이미 많이 있었지만, Traversal 팀은 완전히 처음부터 "본질에 가까운 접근"을 택했습니다.

"천문학적으로 분산된 시스템에서 로그‧메트릭‧트레이스‧코드‧구성파일, 심지어 Slack 메시지까지 방대한 데이터를 '정말로' 탐색하는 것은, 흔히 생각하는 AI 적용 그 자체가 하나의 거대한 '검색 문제'에 가깝다."

Traversal은 기존 시장의 문제를 단순 자동화가 아니라,

인과 머신러닝(진짜 원인을 발견하는 기술)
강화학습(검색 공간을 지능적으로 좁혀가는 기술)
LLM 등 AI 에이전트의 적응성을 결합하는 데 초점을 맞췄습니다.

시장에서는 기존의 단순 로그/모니터링 툴로는 "수많은 '가짜 바늘' 속에서 진짜 문제 원인을 찾기 어렵다"는 점이 주요 '페인포인트'였습니다.

"이건 '건초더미에서 바늘 찾기'가 아니라, '건초 더미 속 가짜 바늘들 중 진짜 바늘 찾기' 문제다."

3. Traversal의 실제 작동 방식과 데모

Traversal이 사용되는 실제 사례는 대기업(예: DigitalOcean)에서 수천 개의 마이크로서비스, 수십억 건의 로그, 수백만 건의 시간 데이터, 수천 개의 코드 저장소 등 엄청난 데이터를 다루는 상황입니다.

입력과 플로우

사용자나 시스템에서 "문제가 시작된 대략적 시점"과 "상황 설명"을 입력하면, Traversal은 관련 로그, 지표, 서비스 목록을 쿼리하기 시작합니다.
Slack 같은 곳에서 알림 채널을 자동 감지하거나, 수동으로 대시보드에서 조사할 수도 있습니다.

컨텍스트 구축

사용자가 모든 정보를 일일이 넣을 필요 없이 "Traversal이 알아서 중요한 맥락을 생성"합니다.
"이용자가 너무 많은 정보를 입력하도록 요구하면 Traversal의 가치가 없지 않을까요? 우리가 알아서 맥락을 축적해야 해요."
수백만 개 토큰에 해당하는 데이터를 직접 LLM에 집어넣는 건 불가능하므로, Traversal은 자체적으로 '검색, 축약, 연결'하는 여러 단계를 거칩니다.

단계별 검색 및 추론

로그‧메트릭 등 여러 소스에서 수집된 데이터 집합 중, LLM과 통계 알고리즘을 결합해 점차적으로 데이터 범위를 좁혀갑니다.
통계적 테스트(시계열 변화 감지 등)를 동적으로 적용하면서, 의미를 이해하는 LLM(코드관계, 메트릭의 의미 등)과 조합해 '진짜 원인 후보'로 증거를 좁혀냅니다.
"우리가 만든 에이전트는 통계(test)와 의미 파악(semantics)을 실시간으로 엮어서, 점점 관련성이 높은 맥락만 남깁니다."

결과와 실제 업무 연결

Traversal은 리드온(Read-on) 접근으로 시스템을 탐색하지만, 어느 정도 신뢰가 쌓이면 '자동 조치'(예: 특정 커밋 롤백, 스크립트 실행 등)까지 권장합니다.

4. Traversal의 에이전틱(Agentic) 아키텍처와 AI 모델 선택

Traversal이 강조하는 '에이전틱 아키텍처'는 기존의 '정해진 절차 자동화'와는 크게 다릅니다. 기존 Runbook 제품은 이미 알고리즘이 정해진 상황(플레이북 있음)에서는 잘 돌아가지만, Traversal이 노리는 영역은 "아무도 경험 없는 복합적 장애 상황에 대한 '실시간 탐색'"입니다.

"이 분야는 완전한 에이전틱 문제입니다. 사전 지식도, 정해진 경로도 없는 상태에서 AI가 주도적으로 문제를 풀어내야 해요."

AI 모델의 선택과 실험

GPT-3, GPT-4, Gemini, Claude 등 다양한 모델로 실험 중이며, 엔터프라이즈 환경에서 '추론 및 도구 호출 능력'이 뛰어난 모델이 유리하다고 평가합니다.
"간단한 MCP-리액트 에이전트가 아니라, '복잡한 탐색'을 할 줄 아는 추론(Reasoning) 능력이 꼭 필요하다."
OpenAI(O3~O4)의 인프라와 도구 활용성이 높았지만, Claude 계열이 툴 콜(tool call)과 '잘못된 경로에서 벗어나기(unstucking)'에서 성능이 좋다고 언급합니다.

5. 비즈니스 모델 및 시장 전략

Traversal은 기존 관찰도구 기업(데이터도그, 스플렁크 등)과 차별화되는 Outcome(결과) 기반 모델로 시장에 접근합니다.

"우리는 데이터를 저장·보관해주려는 게 아니라, 문제 '해결'이라는 결과 자체를 파는 회사입니다. 데이터의 출처에는 관심 없어요."

단순 스토리지 과금(데이터 양 기준)이 아니라 "인프라 복잡성, 조사 건수" 등을 기반으로 가격을 책정하며, 장기적으로는 완전한 outcome 기반(자동 복구 등)으로 옮겨가고자 합니다.

자가치유(Self-healing)의 단계적 진화

현재 Traversal의 AI가 스스로 해결 가능한 문제는 전체의 10~20% 수준(간단 장애, L1/L2 엔지니어 수준).
"6개월~1년 내에 더 복잡한 문제도 AI가 '수정 제안 및 실행'까지 진행할 수 있을 것"으로 전망합니다.
완전한 코드베이스 재구성 등 미래적 시나리오는 "아직 2~3년 이상 필요하다"고 현실적으로 짚어줍니다.

6. 실험, 평가, 그리고 실제 도입의 어려움

실제 Traversal을 엔터프라이즈 고객에 제공하는 과정에서 "스테이징(모의 환경)에서는 성능이 잘 나오지만, 실제 프로덕션의 변수와 복잡성 앞에서 신뢰 구축이 어려운 점"을 토로합니다.

"모두 자기 환경은 세상에서 가장 복잡하다고 믿어요. 그래서 스테이징에서 성능이 아무리 잘 나와도, 실전(프로덕션)에서 검증해야만 진짜 계약이 이뤄집니다."

내부적으로는 정교한 평가 파이프라인(evaluation pipeline)과 벤치마크 구축에 큰 자원을 투입합니다. 실제 코어 IP(지적재산)로도 평가할 정도로 시스템 평가/테스트의 중요성을 강조합니다.

7. 마지막 – 조직문화, 채용, 그리고 미래 비전

Traversal.ai는 현재 뉴욕 현지 근무와 AI 인프라, 데이터 평가, 시스템 설계 등 다방면으로 적극 채용 중입니다.
끝으로 Traversal은 "더 보여주는(Show) 문화를 만들자. 아직은 말(텔링)이 많은데, 진짜 제품이 잘 동작하는 것을 경험하게 하겠다"는 포부로 마무리합니다.

"더 많이 보여주고, 덜 말하자. 그게 이 시장의 신뢰를 얻는 방법이라고 믿습니다." 🚀

마무리

Traversal은 AI가 '방대한 데이터를 통찰 있는 원인 분석'으로 실질 변화를 내는 실무 한가운데 서 있습니다. 단순한 자동화를 넘어 "에이전틱"인 AI가 기업 시스템을 더욱 똑똑하게, 신속하게, 실질적으로 가동시키는 변화의 현장입니다. 뛰어난 이론과 실제 경험이 어떻게 연결되는지, Traversal 사례는 AI와 엔터프라이즈 현장의 미래를 여실히 보여줍니다.
"AI 진화의 본질은, 단순히 '관찰'하는 것을 넘어 실제 '이해'하고, '행동'하는 데 있다."