이 글은 인과성(Causality)에 대해 입문부터 고급까지 체계적으로 학습할 수 있도록 저자가 엄선한 6권의 대표적인 책을 소개합니다. 각 책은 이론, 실제 사례, 실습, 코딩 등 다양한 강점을 지니고 있으며, 그 중 3권은 무료로 제공됩니다. 인과추론 분야 입문자, 실무자, 그리고 연구자 모두에게 훌륭한 로드맵이 되어줄 내용을 흐름 있게 정리했습니다.


1. 인트로: 인과추론에 발을 들이려는 이들에게 👀

최근 몇 년 사이, 연구와 산업계 모두에서 인과추론에 대한 관심이 크게 높아졌어요. 하지만 이 분야에 처음 진입하는 사람들은 통일된 자료와 용어의 부재로 인해 종종 혼란을 겪기 쉽죠. 지난 수십 년간 인과연구가 각기 다른 하위 분야로 흩어져 발전해 왔기 때문이에요. 그래서 많은 초심자들이 "너무나 방대하고 어디서부터 시작해야 할지 모르겠어"라고 느끼기도 합니다.

저자 역시 처음에는 같은 어려움을 겪었답니다. 이제 본인의 경험을 바탕으로 직접 인과추론 관련 책도 집필하게 되었고, 여기에 소개할 6권의 책이 인과여정에 큰 도움이 됐다고 고백합니다.

"여기서 소개할 6권의 책은 제 인과추론 여정을 체계적으로 정리하고 빠르게 성장하는 데 큰 역할을 했어요. 여러분께도 같은 도움이 되길 바랍니다!"

각 책의 특징과 주요 학습 포인트, 입수 경로(무료 포함)를 한눈에 알 수 있게 정리해드릴게요.


2. 첫걸음, "The Book of Why" — 왜의 힘을 이해하다

The Book of Why

이 책은 "현대 인과추론의 대부" 유다 펄(Judea Pearl)과 공동저자 데이나 맥켄지(Dana Mackenzie)가 함께 집필한 입문서입니다. 역사, 이론, 스토리텔링, 수학, 실제 적용이 조화롭게 구성되어, 인과추론 입문에 완벽한 안내서로 평가돼요.

책에서 가장 중심이 되는 점은 '왜'라는 질문의 중요성과 함께, 인과추론의 핵심 틀인 do-연산(do-calculus) 그리고 인과의 사다리(Ladder of Causation) 등 기초 개념을 잘 풀어줍니다. "잠깐, do-연산? 아직 생소한데…"라고 느낄 수 있지만, 어렵게만 느껴지지 않도록 쉬운 예시와 비교로 풀어내요.

또한, 인과추론의 두 가지 큰 틀인 do-연산 프레임워크와 잠재적 결과(potential outcomes) 프레임워크의 차이와 응용도 자연스럽게 체득할 수 있죠.

"이 책은 정말 잘 구조화되어 있고, 읽는 재미까지 있답니다. 인과추론의 역사와 핵심 이론은 물론, 실제 사례까지 두루 다룹니다."

핵심 키워드

  • 인과추론의 역사
  • 인과의 사다리(Ladder of Causation)
  • do-연산 기초
  • 잠재적 결과 프레임워크의 개념
  • 실제 생활과 과학에서의 인과적 추론 응용

입수처

  • 페이퍼북, 킨들, 오디오북(영어) 모두 판매 중

3. 한 단계 더! "Causal Inference in Statistics — A Primer" ✏️

Causal Inference in Statistics: A Primer

"The Book of Why"를 읽고 나서, 조금 더 깊이 있고 실습 위주의 책을 찾는다면 Pearl, Glymour, Jewell이 쓴 바로 이 책이 딱입니다. 트위터에서 저자가 직접 추천받은 책이기도 해요.

120쪽 조금 넘는 얇은 분량이지만, 핵심 개념과 연습문제가 알차게 들어 있습니다.
책은 크게 네 부분으로 나누어져요.

  1. 기초 확률통계 복습
  2. 그래프 모델 소개
  3. 개입(Intervention) 다루기
  4. 반사실(Counterfactuals) 살펴보기

복잡한 수학이나 추정법 대신 인과추론의 본질에 집중할 수 있게 도와주죠.
또 한 가지, 중재(Mediation), 직접/간접효과, 필요충분확률 등 다소 고급개념까지 폭넓게 다룹니다.

"이 책은 그래프 모델과 다양한 개입 기준, 반사실까지 손으로 계산해볼 수 있도록 구성되어 있어요. 연습문제까지 따라가면 인과기초 토대가 단단해집니다!"

핵심 키워드

  • 그래픽(도식) 모델
  • 그래프를 통한 개입 해석
  • Back-door/Front-door 기준, 역확률가중치
  • 반사실 추론
  • 매개효과와 필요충분확률

입수처

  • 종이책, 킨들버전 모두 구입 가능

4. 새로운 시야 확장! "Elements of Causal Inference" 📚

Elements of Causal Inference

이 책은 한 단계 더 나아가 "인과발견(causal discovery)"이라는 최신 주제까지 다룹니다. 즉, 단순히 'A가 B에 영향을 미치는가?'를 넘어서 '어떤 변수들이 어떻게 얽혀있는가?'를 데이터에서 직접 알아내는 방법을 알려주는 셈이에요.

책의 저자들은 인과추론 개념을 넓은 의미로 사용하여, 아래와 같은 다양한 주제를 포괄합니다.

  • 통계모델 vs 인과모델, 그리고 그 차이
  • 한 쌍(bi-variate) 및 다변량(multi-variate) 모델에서의 인과 추론/발견 이론
  • 준지도 학습, 강화학습, 도메인 이해, 시계열 내 인과 발견 등 확장 응용

이 책은 실제 사례보다는 이론적 원리와 머신러닝과의 연결에 초점을 둡니다.
수학적 깊이가 더해지지만, 각 파트마다 "왜 이렇게 작동하는지"를 근본적으로 이해할 수 있게 도와주죠.

"책의 저자도 직접 밝히듯, 이 책은 종합 핸드북이 아니라 저자들의 '개인적 취향'이 반영된 독특한 교과서입니다. 고전적 인과추론과 달리 인과적 구조 발견에 호기심 많은 분께 추천!"

핵심 키워드

  • 인과발견(구조학습) 이론
  • 한 쌍·다변수 인과 구조
  • 인과성과 강화학습
  • 인과성과 시계열

입수처

  • 종이책, 킨들, 그리고 무료 PDF(정식 제공)까지 모두 지원!

5. 깊이와 체계! "Causality — Models, Reasoning and Inference" 📖

Causality: Models, Reasoning and Inference

Judea Pearl의 이 책은 400쪽이 넘는 분량으로, 인과추론 이론의 집대성에 가까운 교과서입니다.
교과서로서 아래와 같은 내용이 총망라되어 있죠.

  • 그래프 모델과 d-분리(d-separation) 원리
  • 베이지안 인과모델, 구조적 인과모델
  • 구조방정식(SEM), 모형 확인, 인과추론 전제 조건
  • do-연산 공식의 완전한 규칙 체계
  • 개입·반사실의 고급 분석, 인과확률 등

책 일부에서는 인과구조학습 알고리즘이 간단히 다뤄지고, 그래프 접근법과 기존 '잠재결과' 방식의 차이점도 비교해 이해를 돕습니다. 마지막 60여 쪽은 독자와의 대화, 토론 내용 등 심층적 인사이트가 담깁니다.

"이렇게 종합적이고 깊이 있는 인과추론 자료는 찾기 어렵습니다. 인과추론에 대한 레퍼런스 교재로 손색이 없어요!"

핵심 키워드

  • 인과추론의 전제조건
  • do-연산 고급 분석
  • 인과발견(구조학습, 일부)
  • 인과확률, 개입/반사실 심화

입수처

  • 페이퍼북, 킨들버전 구입 가능

6. 실전과 코드! "Causal Inference — The Mixtape" 🎧

Causal Inference: The Mixtape

좀 더 실용적이고 현장 사례에 집중하고 싶다면, 이 책이 제격입니다. 경제학, 사회정책, 역학 등 다양한 분야에서 실전 인과추론 예시와 실습 코드(Stata, R, Python)를 광범위하게 제공합니다.
저자는 힙합 인용구도 자주 등장시켜, 읽는 재미까지 살렸어요.

주된 내용은 현대 계량경제학에서 인기있는 인과 추론법 중심입니다.
예를 들어, 자연실험, 중첩된 회귀분석(회귀 불연속, 도구변수, 차이의 차이, 합성통제법 등)이 실제로 어떻게 적용되는지 구체적으로 알려줍니다. 너무 어렵거나 너무 단순하지 않도록 수학과 실습의 균형을 맞췄죠.

"Chance the Rapper의 가사를 인용해 도구변수 찾는 법을 설명하는 등, 배움과 재미를 동시에 경험할 수 있어요!"

핵심 키워드

  • 자연 실험
  • 잠재적 결과 프레임워크
  • 회귀 불연속, 도구변수, 차이의 차이, 합성통제법
  • 실제 데이터와 코드 실습

입수처

  • 종이책, 킨들, 무료 온라인북(웹 전체 공개)

7. 통합적 프레임워크! "What If?" 🥽

Causal Inference: What If?

마지막으로, 하버드의 미겔 에르난(Miguel Hernán)과 제임스 로빈스(James Robins)이 집필한 이 책은 인과추론의 양대 산맥(그래프 기반/잠재결과 기반) 간의 균형을 가장 잘 이룹니다.

3부 구성으로

  • 모델 없이 인과추론
  • 모델을 활용한 인과추론
  • 복잡한 종단(시계열) 자료에서의 인과추론
    이루어져 있으며, 특히 상호작용(interaction), 선택편향, 구조적 중첩모델, 인과적 생존분석, 시간변화 처치 등을 실제 데이터 예시와 함께 다룹니다.

무엇보다 SAS, Stata, R, Python, Julia 등 다양한 언어별 코드와 예제가 동반되어 실무자에게도 큰 도움이 됩니다.

"그래프와 잠재결과 프레임워크가 잘 어우러진 균형잡힌 교재, 그리고 다양한 언어로 실습할 수 있는 최고의 데이터공학 입문서입니다."

핵심 키워드

  • 상호작용, 선택편향
  • 구조적 중첩모델
  • 생존분석
  • 시간에 따라 변화하는 처치의 인과효과

입수처

  • 무료 PDF, 2024년 기준 종이책은 곧 출시 예정

마치며

지금까지 초보부터 고수까지 인과추론의 전 과정을 안내해줄 6권의 책을 시간순과 난이도 순으로 살펴봤어요. 각각 고유한 강점을 지닌 이 책들 중 3권은 무료로, 온라인이나 PDF로 제한 없이 읽으실 수 있다는 점도 잊지 마세요.

여러분의 인과추론 여정에 행운이 함께하길 바랍니다! 🔥
질문이나 소감이 있다면 저자에게 댓글이나 링크드인을 통해 연락해보세요.

"인과추론, 인과머신러닝, 파이썬 실습 등 더 많은 자료는 causalpython.io에서 받아볼 수 있어요.
새로운 책 소식과 무료 컨텐츠를 이메일로 받아보세요!"

Good luck with your causal journey 💪