과학적 발견 자동화: Leap Labs의 제시카 럼블로우 박사

이 영상은 Leap Labs의 CEO 제시카 럼블로우 박사가 '라이트닝 팟(Lightning Pod)'이라는 팟캐스트에서 그녀의 회사인 Leap Labs의 '디스커버리 엔진(Discovery Engine)'에 대해 설명하는 내용입니다. 디스커버리 엔진은 딥러닝과 해석 가능성(interpretability)을 활용하여 과학 데이터에서 인간이 놓치기 쉬운 복잡한 패턴과 새로운 발견을 자동으로 찾아내는 시스템입니다. 럼블로우 박사는 이 기술이 어떻게 과학 연구를 혁신하고, 기존의 가설 중심 연구 방식의 한계를 극복하며, 궁극적으로 과학적 발견의 속도와 규모를 획기적으로 증가시킬 수 있는지에 대한 깊이 있는 통찰을 제공합니다. 특히, 기존 언어 모델(LLM)의 한계와 디스커버리 엔진의 시너지 효과를 강조하며, 미래 과학 연구의 방향성을 제시합니다.

1. 과학적 발견으로의 여정: 해석 가능성(Interpretability)에 대한 관심 💡

럼블로우 박사는 그녀의 커리어가 어떻게 과학적 발견이라는 분야로 이어졌는지 설명하며 이야기를 시작합니다. 그녀는 과거 학계에서 조직학 분야의 신경망(neural networks)을 구축하며 다양한 암 진단 및 면역 세포 분류 모델을 개발했습니다. 이 과정에서 인간 병리학자들이 이해하거나 재현할 수 없는 방식으로 특정 면역 세포를 식별하는 모델을 만들게 되죠.

그녀는 이렇게 회상합니다.

"이것은 매우 흥미로운 작업이었어요. 모델이 특정 종류의 면역 세포를 식별할 수 있었는데, 인간 병리학자들은 이를 이해하지 못했고 재현할 수도 없었죠. 아주 저렴한 생체 검사 염색만으로도요."

여기서 그녀는 단순한 기능적 역량(capability)보다는 모델이 어떻게 이러한 결과를 도출하는지에 대한 궁금증을 갖게 됩니다. 즉, 모델이 데이터에서 어떤 신호를 찾아내고, 인간이 알지 못하는 무엇을 알고 있는지가 핵심 질문이 된 것입니다.

"능력 자체가 흥미로운 것이 아니라, 모델이 어떻게 이런 일을 하는지가 흥미로웠어요. 모델이 데이터에서 어떤 신호를 발견해서 이런 능력을 갖게 된 걸까요? 우리가 모르는 무엇을 알고 있는 걸까요?"

이러한 의문은 그녀가 해석 가능성(interpretability)에 깊은 관심을 갖게 된 계기가 되었고, 신경망을 단순히 자동화 도구가 아닌 숨겨진 패턴을 발견하는 렌즈로 보게 만들었습니다. 인간은 데이터에서 패턴을 찾는 데 서투르지만, 신경망은 이 분야에 매우 능숙하다는 사실을 깨달은 것이죠.

2. Leap Labs의 탄생과 '디스커버리 엔진'의 발전 🚀

처음 Leap Labs는 모든 사람이 자신의 신경망을 해석할 수 있도록 해석 가능성 도구를 구축하는 데 중점을 두었습니다. 이는 모델의 편향(bias)을 식별하고(예: 모델이 성차별적이거나 인종차별적인지 여부), 배포 전 실패 모드(failure modes)를 예측하며, 모델을 더 잘 이해하여 다양한 방식으로 개입하고 개선하는 데 유용했습니다.

하지만 약 1년 후, 럼블로우 박사는 과학적 발견이 해석 가능성의 가장 흥미로운 응용 분야임을 깨닫습니다. 그녀는 설명합니다.

"해석 가능성에는 많은 응용 분야가 있지만, 과학적 발견이라는 큰 개념이 있었어요. 우리가 어떻게 할지 모르는 일을 수행하도록 신경망을 훈련하고, 그 신경망을 해석해서 새로운 것을 배우는 거죠. 아무도 이 일을 하지 않고 있었어요. 그래서 제가 해야겠다고 생각했죠."

결국 Leap Labs는 '디스커버리 엔진(Discovery Engine)'이라는 독자적인 시스템을 개발하게 됩니다. 이 엔진은 임의의 과학 데이터를 입력받아 자동으로 여러 신경망을 훈련하고, Leap Labs만의 해석 가능성 방법론을 사용하여 모델이 학습한 패턴을 체계적으로 추출합니다. 추출된 패턴은 기존 문헌과 비교하여 새로움(novelty)과 데이터 내 유병률(prevalence)에 따라 순위가 매겨지며, 인간이 이해할 수 있는 형태로 시각화됩니다.

"디스커버리 엔진은 임의의 과학 데이터 세트를 입력받아 자동으로 여러 신경망을 훈련시키고, 우리의 해석 가능성 방법(이것이 진정한 비밀이죠)으로 학습된 패턴을 체계적으로 추출합니다. 그리고 기존 문헌으로 맥락화하고, 새로움과 데이터 내 유병률에 따라 순위를 매긴 다음, 인간이 이해할 수 있도록 만듭니다. 우리는 이 일을 통해 수많은 새로운 과학적 발견을 해냈습니다."

3. 디스커버리 엔진을 통한 실제 과학적 발견 사례들 🔬

럼블로우 박사는 디스커버리 엔진이 실제로 어떤 획기적인 발견들을 가능하게 했는지 구체적인 사례들을 들어 설명합니다.

3.1. T세포 수용체 연구: 면역 치료의 새로운 표식자 발견

첫 번째 사례는 T세포 수용체(T-cell receptors)와 관련된 연구입니다. Leap Labs는 이 연구에서 종양에 반응하는 T세포와 그렇지 않은 T세포를 이해하고 예측하는 데 중요한 새로운 표식자(markers)를 발견했습니다.

"T세포 수용체를 식별하는 것은 정말 중요합니다. 우리는 특정 T세포가 왜 종양에 반응하는지, 왜 활성화되어 종양과 싸우는 데 도움을 주는지, 그리고 왜 어떤 T세포는 그렇지 않은지 이해하고 싶습니다."

박사는 이 과정에서 발견된 새로운 표식자들이 기존 연구자들이 예상했던 것과는 전혀 달랐다고 강조하며, 디스커버리 엔진의 비가설적(hypothesis-free) 탐색의 강점을 보여줍니다. 이 발견은 개인 맞춤형 면역 치료와 같은 분야에 매우 유용하게 활용될 수 있습니다.

3.2. 작물 뿌리 구조 연구: 식량 안보에 기여하는 시너지 효과 발견 🌱

두 번째 사례는 식물 생물학자와의 협력 연구로, 작물 뿌리 구조를 결정하는 요인들을 이해하는 것이었습니다. 이는 가뭄이나 홍수에 강한 작물을 개발하는 데 매우 중요하며, 식량 안보와 직결되는 문제입니다.

"뿌리 구조는 작물이 성공할지 실패할지를 결정합니다. 따라서 토양에 특정 영양분을 넣거나 특정 돌연변이를 심는 것과 같은 지렛대(levers)를 갖는 것은 이러한 지역의 식량 안보에 매우 중요합니다."

연구팀은 약 700개의 샘플이라는 작은 데이터 세트로 작업했고, 초기에는 큰 기대를 하지 않았습니다. 하지만 디스커버리 엔진은 식물 생물학자가 이미 알고 있던 패턴들 외에, 망간 함량과 특정 유전자형(genotype) 사이의 시너지 효과라는 새로운 조합을 발견했습니다. 이 조합은 뿌리 구조에 엄청난 영향을 미치는 것으로 밝혀졌습니다.

3.3. 기상학 연구: 20%의 경우 기본 가정이 틀렸음을 발견 🌬️

가장 인상 깊은 사례 중 하나는 기상학 모델링에 대한 연구입니다. 기상 모델링은 해상 풍력 발전소 위치 선정, 허리케인 경로 예측 등 다양한 분야의 기반이 됩니다. 이 모델링은 '표면층 이론(surface layer theory)'이라는 기초적인 가정에 의존합니다. 이 이론은 지표면 또는 수면 위 약 200m 이내에서 다양한 유속이 일정하게 유지된다고 가정합니다.

하지만 디스커버리 엔진은 놀랍게도 이 가정이 데이터의 약 20%에서 사실이 아니라는 것을 발견했습니다. 특히 해안 지역에서 이러한 불일치가 두드러졌습니다.

"놀랍게도 디스커버리 엔진이 발견한 사실은, 우리가 작업한 샘플의 약 20%에서, 주로 해안 지역에서 이 가정이 전혀 성립하지 않는다는 것입니다."

이 발견은 해당 연구를 수행한 국립 대기 연구 센터(NCAR)의 과학자들에게 엄청난 의미를 가집니다. 그들은 이토록 근본적인 가정에 의문을 제기할 생각조차 하지 못했기 때문입니다. 박사는 기상 모델링을 몇 퍼센트만 개선해도 수십억 달러의 가치를 가질 수 있다고 언급하며, 이 발견의 경제적, 과학적 중요성을 강조했습니다.

"이것은 그들에게 엄청난 일입니다. 그들은 이것을 결코 스스로 찾아내지 못했을 것이며, 이토록 근본적인 가정에 의문을 제기할 생각조차 하지 못했을 것입니다. 기상 모델링을 몇 퍼센트만 개선해도 수십억 달러의 가치가 있다고 합니다. 그래서 아마도 이것이 제가 가장 좋아하는 사례일 것입니다."

4. Claude와 디스커버리 엔진의 협업: LLM의 한계와 시너지 🤖

럼블로우 박사는 언어 모델(Large Language Models, LLMs)의 한계와 디스커버리 엔진과의 시너지 효과에 대해서도 흥미로운 실험 결과를 공유합니다.

4.1. 언어 모델(Claude) 단독 사용의 한계

그녀는 언어 모델이 본질적으로 언어 모델이지, 임의의 대규모 숫자 데이터 세트를 이해하는 데 특별히 적합하지 않다고 지적합니다. Claude Opus 4.1을 사용하여 촉매 효율을 높이려는 재료 과학자를 위한 오픈 소스 데이터 세트를 분석하도록 요청했을 때, Claude는 다음과 같은 문제점을 보였습니다.

환각(Hallucination): 존재하지 않는 정보를 만들어냈습니다.
과잉 일반화(Overgeneralization): 지나치게 광범위한 결론을 내렸습니다.
특이값(Outliers) 과잉 집중: 데이터의 작은 부분에 불균형하게 집중했습니다.

박사는 언어 모델이 인간처럼 가설 중심적이고, 경로 의존적이며, 반복적인 과정을 거치기 때문에, 이러한 접근 방식은 이미 가지고 있는 가정과 편향에 의해 가능한 발견을 극도로 제한한다고 설명합니다.

"언어 모델은 언어 모델일 뿐입니다. 임의의, 큰 숫자 데이터 세트를 이해하는 데 특별히 적합하지 않습니다... 그들은 여전히 인간이 하는 것과 같은 종류의 일을 하고 있습니다. 매우 경로 의존적이고 가설 중심적이죠... 이는 너무나 많은 가정과 편향을 가져옵니다. 우리는 처음부터 존재할 것이라고 생각하는 것만 찾고 있기 때문에, 이는 가능한 발견을 엄청나게 제한합니다."

게다가 언어 모델이 생성하는 과학 논문들이 그럴듯하지만 사실이 아닐 수 있는 내용으로 가득 차, 과학 문헌의 신뢰도를 떨어뜨릴 수 있다는 우려도 표했습니다.

"그들이 논문을 쓰게 할 수는 없습니다. 그들은 그럴듯하지만 사실이 아닌 것을 놀라울 정도로 잘 말하니까요. 그리고 최첨단 과학을 할 때는 정의상 '정답(ground truth)'이 없습니다. 그래서 모델이 지어내는 것인지 아닌지 말하기가 매우 어렵습니다."

4.2. Claude와 디스커버리 엔진의 협업

하지만 Claude가 디스커버리 엔진에 접근했을 때는 상황이 완전히 달라졌습니다. 럼블로우 박사는 결과에 대해 "놀라웠다(amazing)"라고 표현합니다.

"Claude는 놀라울 정도로 합성과, 여러 가지를 조합하고, 우리에게 무엇이 중요한지, 즉 인간에게 무엇이 중요한지에 대한 정말 좋은 감각을 가지고 있기 때문이죠. 그들에게 우리의 데이터 기반 발견 도구에 대한 접근 권한을 주는 것은 최첨단 과학에 기여할 수 있는 능력 면에서 진정한 변화를 가져오는 것 같습니다."

언어 모델은 합성(synthesis)과 정보 결합(pulling things together)에 탁월하며, 인간에게 무엇이 중요한지에 대한 좋은 감각을 가지고 있습니다. 디스커버리 엔진이 제공하는 체계적이고 편향 없는 데이터 분석 결과와 언어 모델의 이러한 강점이 결합되었을 때, 이는 최첨단 과학에 기여하는 능력 면에서 획기적인 변화(step change)를 가져올 수 있다는 것이 그녀의 주장입니다. 그녀는 도구 사용 모델과 에이전트의 중요성을 강조하며, 특히 과학과 같이 '검증 가능한 도메인(verifiable domains)'에서는 이러한 도구 사용이 필수적이라고 말합니다.

5. 디스커버리 엔진 대시보드 시연: 콘크리트 압축 강도 데이터 분석 📊

럼블로우 박사는 콘크리트 압축 강도(Concrete Compressive Strength, CCS) 데이터 세트를 사용하여 디스커버리 엔진 대시보드를 시연합니다. 이 데이터 세트는 오래되었고 수없이 분석되었기 때문에 새로운 패턴은 발견되지 않았지만, 시스템의 작동 방식을 보여주기에 적합했습니다.

5.1. 대시보드 개요 및 발견된 패턴

대시보드는 복잡한 시각화 도구들을 포함하고 있으며, 우측 하단 테이블에서 총 17개의 패턴이 발견되었음을 보여줍니다. 이 중 2개는 추측성(speculative), 15개는 검증되고 확인된(validated and confirmatory) 패턴이었습니다. '검증됨'이란 데이터의 특정 하위 집합이 해당 패턴을 증명한다는 의미입니다.

"이것은 추측성 가설이 아닙니다. 여기에 데이터에 실제 패턴이 있고, 우리는 그것을 증명할 수 있습니다."

좌측 메뉴에서는 CCS라는 핵심 특성을 포함한 다양한 특징(features)과 그 특징들이 발견된 패턴 수, 그리고 상호 정보(mutual information) 및 상관 관계(correlation) 매트릭스를 확인할 수 있습니다.

5.2. 복합 패턴 발견의 중요성

특히 주목할 만한 부분은 패턴 2번입니다. 이 패턴은 디스커버리 엔진이 인간이 찾기 어려운 종류의 패턴, 즉 여러 조건의 복합적인 상호작용을 찾아내는 능력을 잘 보여줍니다.

개별 조건: 재(ash) 대 시멘트 비율, 골재(aggregate) 대 시멘트 비율, 콘크리트의 숙성 기간(age) 등 개별 조건이 특정 범위 내에 있을 때의 CCS 분포를 보여줍니다. 개별적으로도 나름의 상관관계를 가집니다(예: 나이가 많을수록 CCS 증가).
조합 효과: 이 모든 조건을 조합했을 때(combinatorial effect)의 CCS 분포를 보여주는 가장 오른쪽 바이올린 플롯은 개별 조건만 보았을 때보다 훨씬 강력한 시너지 효과를 나타냅니다. 이 조합을 통해 평균 CCS가 35에서 53으로 크게 증가함을 확인할 수 있습니다.

"인간으로서 찾기 정말 어려운 것은 바로 이러한 패턴의 조합, 이러한 조건의 조합입니다. 이 모든 것을 종합하면 보세요, 평균 콘크리트 압축 강도가 35에서 53으로 증가했습니다."

대시보드는 또한 각 패턴이 새로운 발견인지 아닌지를 명확히 표시하며, 기존 발견의 경우 관련 문헌 인용 정보를 제공합니다. 새로운 발견인 경우에는 느낌표(!)로 표시되어 연구자들이 쉽게 식별할 수 있습니다.

6. Leap Labs의 미래 계획 및 로드맵 🚀

럼블로우 박사는 Leap Labs의 앞으로의 계획에 대해 몇 가지 중요한 포인트를 언급합니다.

도구 사용(Tool Use) 모델 확대: 언어 모델과 같은 에이전트(agents)에 디스커버리 엔진과 같은 데이터 분석 도구를 제공하여, 과학 에이전트의 역량을 대폭 강화하는 것을 목표로 합니다.
다중 모달리티(Multimodality) 확장: 현재는 주로 정형 데이터에 집중하고 있지만, 앞으로는 비전(vision) 데이터와 표 형식 데이터를 결합한 다중 모달 데이터 세트로 확장할 예정입니다. 이는 이미지에 대한 세부적인 라벨링 없이도 딥러닝과 해석 가능성을 통해 모델이 스스로 특징을 학습하고 추출할 수 있기 때문에 가능합니다.
산업 파일럿 프로그램 시작: 현재는 주로 학술 협력을 진행하고 있지만, 앞으로는 대규모 R&D 부서를 가진 기업들과 협력하여 디스커버리 엔진을 산업 현장에 적용할 계획입니다. Leap Labs는 이 도구가 수동 분석보다 100배 더 빠르다고 강조합니다. 이는 가설 중심의 반복적인 수동 분석 방식(몇 달 소요)을 몇 시간 만에 데이터의 모든 가치 있는 의미를 자동으로 체계적으로 추출하는 방식으로 전환함으로써 달성되는 속도 향상입니다.

"우리는 수개월이 걸리는 이러한 반복적인 처리 시간에서 몇 시간 만에 데이터의 모든 가치 있는 의미를 자동으로 체계적으로 추출하는 것으로 이동하고 있습니다."

마무리: 과학의 미래를 여는 Leap Labs ✨

Leap Labs의 디스커버리 엔진은 인공지능의 해석 가능성이라는 핵심 개념을 활용하여 과학 연구의 패러다임을 바꾸고 있습니다. 인간의 직관과 편향에 의존하는 가설 중심의 연구 방식을 넘어, 데이터가 스스로 말하게 함으로써 미지의 패턴과 혁신적인 발견을 가능하게 하는 것이죠. 이는 T세포 연구, 작물 재배, 기상학 모델링 등 다양한 분야에서 이미 그 잠재력을 입증했습니다.

특히 언어 모델의 강력한 합성 능력과 디스커버리 엔진의 체계적인 패턴 탐색 능력이 결합될 때, 과학적 발견의 속도와 깊이는 상상 이상으로 확장될 수 있을 것입니다. 럼블로우 박사는 Leap Labs가 "데이터를 가진 모든 사람"을 대상으로 하며, 학계에는 무료 대시보드 서비스를 제공하여 더 많은 연구자들이 이 강력한 도구를 사용할 수 있도록 할 계획이라고 밝혔습니다. Leap Labs의 디스커버리 엔진은 과학 연구의 효율성을 극대화하고, 인류에게 더 많은 미지의 영역을 밝혀줄 중요한 발걸음이 될 것입니다.