2장: 해적부터 기니피그까지, 인과 추론의 탄생

이 요약은 19세기 중반부터 20세기 초반에 걸쳐 통계학에서 인과성이 어떻게 사라지고 상관성이라는 개념이 지배하게 되었는지, 그리고 다시 인과성이 주목받기 시작한 과정을 다룹니다. 특히, 프랜시스 골턴과 칼 피어슨이 상관성의 중요성을 강조하며 인과성을 배제하려 했던 시도와, 시월 라이트가 경로도라는 혁신적인 도구를 통해 인과적 추론의 가능성을 다시 열었던 이야기를 중심으로 전개됩니다. 이 과정에서 통계학의 본질, 객관성과 주관성의 대립, 그리고 데이터 해석의 깊이에 대한 중요한 질문들이 제기됩니다.

1. 골턴의 유전 연구와 회귀 현상의 발견 🧬

1877년 2월 9일, 런던 왕립 연구소에서 찰스 다윈의 사촌이자 지문 감식의 발명가인 프랜시스 골턴이 '유전의 전형적인 법칙'이라는 주제로 강연을 했습니다. 그는 퀸컹스(Quincunx), 또는 골턴 보드(Galton board)라고 불리는 장치를 시연하며 강연을 시작했어요. 이 장치는 상단 구멍으로 작은 금속 구슬을 넣으면 구슬이 못에 부딪히며 무작위로 왼쪽이나 오른쪽으로 튀어 내려와 아래 칸에 쌓이는 방식이었죠. 개별 구슬의 경로는 예측하기 어렵지만, 많은 구슬을 넣으면 항상 종 모양의 곡선(bell-shaped curve)을 형성한다는 놀라운 규칙성을 보여주었습니다. 이는 피에르-시몽 라플라스가 1810년에 증명한 중심 극한 정리(central limit theorem)를 시각적으로 보여주는 것이었습니다. 즉, 무작위적인 과정의 합은 항상 정규 분포를 따른다는 것이죠. 이 법칙은 보험회사가 불확실성 속에서도 이익을 내는 원리와 같다고 설명되었습니다.

골턴은 이 퀸컹스를 인간의 키와 같은 유전적 특성이 유전되는 방식에 대한 인과 모델(causal model)로 생각했습니다. 하지만 이 모델은 한 가지 의문을 불러일으켰습니다. 구슬이 통과하는 못의 줄 수를 늘리면 종 모양 곡선의 폭이 점점 넓어져야 하는데, 실제 인간의 키 분포는 세대를 거쳐도 상대적으로 일정하게 유지된다는 것이었죠. 그는 이 수수께끼를 약 8년 동안 고민해왔다고 합니다.

골턴의 주된 관심사는 인간의 키가 아니라 인간의 지능이었어요. 그는 1869년에 출간한 책 『유전적 천재(Hereditary Genius)』에서 천재성이 가족력을 통해 유전된다는 것을 증명하려 했죠. 그는 605명의 '유명한' 영국인들의 가계도를 painstakingly 조사했지만, 그들의 아들이나 아버지는 그들보다 덜 유명하고, 조부모나 손주들은 더 덜 유명하다는 사실을 발견했습니다. 우리는 오늘날 '유명함'의 정의나 특권의 영향을 지적하며 골턴의 접근 방식에 결함이 있다고 생각할 수 있지만, 당시 그는 유전적 설명을 끈질기게 추구했습니다.

그럼에도 불구하고 골턴은 중요한 현상을 발견했습니다. 키처럼 측정하기 쉽고 유전과 밀접하게 관련된 특성을 연구하면서 그는 키가 큰 아버지의 아들은 평균보다 키가 크지만, 아버지만큼은 크지 않다는 것을 알아냈습니다. 마찬가지로 키가 작은 아버지의 아들은 평균보다 키가 작지만, 아버지만큼 작지는 않았죠. 골턴은 이 현상을 처음에 '역전(reversion)'이라고 불렀고, 나중에는 '평균으로의 회귀(regression toward mediocrity)'라고 명명했습니다. 이러한 '평균으로의 회귀' 현상은 다른 많은 분야에서도 보편적으로 나타납니다. 예를 들어, 야구에서 신인상 수상자(Rookie of the Year)가 다음 시즌에 부진하는 '소포모어 슬럼프(sophomore slump)'도 이에 해당하죠.

"성공 = 재능 + 운. 큰 성공 = 약간의 더 많은 재능 + 많은 운."

"신인상 수상자는 아마도 평균보다 재능이 더 많겠지만, 운도 많이 따랐을 것입니다. 다음 시즌에는 그만큼 운이 좋지 않을 것이고, 그의 타율은 더 낮아질 것입니다."

골턴은 이러한 회귀 현상을 유전의 법칙이 아닌 통계의 법칙으로 이해했습니다. 그는 평균으로의 회귀가 어떤 인과적 원인을 가지고 있다고 믿었고, 이를 설명하기 위해 두 겹의 못 배열 사이에 경사로를 설치한 퀸컹스를 선보였습니다. 이 경사로는 구슬들을 중앙으로 다시 모이게 하여, 종 모양 분포가 세대를 거쳐도 일정한 폭을 유지하도록 만들었습니다.

그는 이렇게 말했다고 합니다.

"역전 과정은 일반적인 편차 법칙과 협력합니다."

마치 용수철이 평형 상태로 돌아가려는 경향을 설명하는 훅의 법칙처럼, 평균으로의 회귀를 물리적인 과정, 즉 자연이 개체군의 분포를 일정하게 유지하는 방식이라고 추론했습니다.

하지만 이러한 생각은 착각이었습니다. 1877년 당시 골턴은 평균으로의 회귀가 물리 법칙처럼 인과적인 과정이라고 생각했지만, 이는 통계적인 현상일 뿐 인과적 설명이 필요 없는 경우가 많습니다. 야구의 소포모어 슬럼프도 마찬가지입니다. 전문가들은 선수들이 자만하거나 약점이 파악되었다는 등 인과적 설명을 찾으려 하지만, 사실 이는 단순히 확률의 법칙에 의해 발생하는 경우가 더 많습니다.

2. 골턴의 상관관계 발견과 피어슨의 인과성 배제 🧪

1889년 무렵, 골턴은 평균으로의 회귀 현상을 더 깊이 이해하게 되면서 통계학을 인과성으로부터 분리하는 중요한 첫걸음을 내딛게 됩니다. 그는 키, 팔뚝 길이, 머리 길이 등 다양한 신체 측정치를 수집하는 '인체 측정(anthropometric)' 통계를 연구하며, 키와 팔뚝 길이 사이에도 평균으로의 회귀 현상이 나타난다는 것을 발견했습니다. 즉, 키가 큰 남성은 평균보다 팔뚝이 길지만, 키만큼은 아니라는 것이죠. 분명 키가 팔뚝 길이의 원인이거나 그 반대도 아니었습니다. 둘 다 유전적 요인에 의해 발생했을 가능성이 높았죠. 골턴은 이러한 관계를 설명하기 위해 'co-related'라는 새로운 단어를 사용했고, 나중에는 익숙한 단어인 'correlated (상관관계)'를 선택했습니다.

그는 더 놀라운 사실을 깨달았습니다. 세대 간 비교에서 시간 순서가 역전될 수도 있다는 것이었습니다. 다시 말해, 아들이 평균보다 키가 크면 그 아버지도 평균보다 키가 크지만, 아들보다는 작다는 것이죠. 이 사실을 깨닫자마자 골턴은 회귀 현상에 대한 인과적 설명을 포기할 수밖에 없었습니다. 아들의 키가 아버지의 키에 영향을 줄 수는 없기 때문이죠.

"잠깐만요! 키 큰 아버지는 보통 키 작은 아들을 낳고, 키 큰 아들은 보통 키 작은 아버지를 둔다고요? 어떻게 이 두 말이 다 사실일 수 있죠? 아들이 아버지보다 키가 크고 동시에 작을 수 있나요?"

이러한 의문에 대한 답은 우리가 개별 아버지와 아들이 아닌 두 집단을 다루고 있다는 데 있습니다. 예를 들어, 6피트 키의 아버지 집단은 평균보다 키가 크므로 그들의 아들은 평균으로 회귀하여 평균 5피트 11인치가 될 것입니다. 하지만 6피트 아버지-아들 쌍의 집단과 5피트 11인치 아들-아버지 쌍의 집단은 다릅니다. 후자 집단에는 6피트보다 키가 큰 아버지도 소수, 6피트보다 키가 작은 아버지도 다수 포함될 것이며, 이들의 평균 키 또한 평균으로 회귀하여 5피트 11인치보다 작아질 것입니다.

골턴은 이러한 현상을 산점도(scatter plot)를 통해 시각적으로 보여주었습니다. 각 아버지-아들 쌍은 점으로 표시되며, 아버지의 키가 x축, 아들의 키가 y축을 나타냅니다. 이 산점도는 대략 타원형을 띠는데, 골턴은 이 타원의 주요 축(major axis)보다 회귀선(regression line)의 기울기가 완만하다는 것을 발견했습니다. 즉, 예측은 항상 직선 위에 놓이며, 이 직선은 타원의 대칭축보다 덜 가파르다는 것이죠. 아들의 키를 아버지의 키로 예측하든, 아버지의 키를 아들의 키로 예측하든 상황은 완전히 대칭적입니다. 이 사실은 평균으로의 회귀에 있어서 원인과 결과의 차이가 없음을 다시 한번 보여줍니다.

골턴의 상관관계 개념은 두 변수가 서로 어떻게 관련되어 있는지에 대한 객관적인 측정치를 제공했습니다. 이 측정치는 인간의 판단이나 해석에 의존하지 않았죠. 키, 지능, 소득 등 어떤 변수라도 상관관계는 두 변수 사이의 상호 예측 가능성 정도를 반영합니다. 골턴의 제자인 칼 피어슨은 나중에 이 회귀선의 기울기에 대한 공식을 도출하고 이를 상관 계수(correlation coefficient)라고 불렀습니다. 이 상관 계수는 오늘날에도 통계학자들이 두 변수 간의 관계 강도를 파악할 때 가장 먼저 계산하는 값입니다. 피어슨에게는 모호한 인과관계 개념보다 수학적으로 명확하고 정밀한 상관 계수가 더 과학적으로 보였습니다.

2.1. 인과성을 버린 피어슨의 열정적인 행보 👨‍🎓

피어슨은 골턴의 『자연 유전(Natural Inheritance)』을 읽고 큰 감명을 받아 이렇게 썼습니다.

"마치 드레이크 시대의 해적이 된 기분이었습니다. 사전에는 '해적은 아니지만, 해적 같은 성향을 지닌' 부류의 사람이라고 나와 있죠! 저는… 골턴이 인과성보다 더 넓은 범주, 즉 상관관계가 있으며 인과성은 그 상관관계의 한계일 뿐이라고 해석했습니다. 그리고 이 새로운 상관관계 개념이 심리학, 인류학, 의학, 사회학을 수학적 처리의 영역으로 가져왔다고 생각했습니다. 저를 건전한 수학이 인과성의 범주 아래에서만 자연 현상에 적용될 수 있다는 편견에서 처음으로 해방시켜 준 것은 골턴이었습니다."

피어슨의 눈에 골턴은 과학의 어휘를 확장한 것이었습니다. 인과성은 상관관계의 특별한 경우(상관 계수가 1 또는 -1이고 관계가 결정론적인 경우)로 축소되었죠. 그는 『과학 문법(The Grammar of Science)』(1892)에서 인과성에 대한 자신의 견해를 명확히 밝혔습니다.

"과거에 특정 순서가 발생하고 반복되었다는 것은 우리가 인과성이라는 개념으로 표현하는 경험의 문제입니다… 과학은 어떤 경우에도 순서에 내재된 필연성을 증명할 수 없으며, 그것이 반드시 반복될 것이라고 절대적으로 확신할 수도 없습니다."

요약하자면, 피어슨에게 인과성은 단순한 반복의 문제이며, 결정론적인 의미에서는 결코 증명될 수 없다는 것이었습니다. 비결정론적인 세계에서의 인과성에 대해서는 더욱 단호했습니다.

"두 사물 간의 관계에 대한 궁극적인 과학적 설명은 항상… 교차표(contingency table)로 되돌릴 수 있습니다."

즉, 과학에는 데이터만이 존재할 뿐이라는 극단적인 관점이었죠. 이러한 관점에서는 1장에서 논의된 개입(intervention)과 반사실(counterfactual) 같은 개념은 존재하지 않으며, 인과 사다리(Ladder of Causation)의 가장 낮은 단계만으로도 과학을 할 수 있다고 보았습니다.

피어슨은 실증주의(positivism)라는 철학적 학파에 속했으며, 우주가 인간 사고의 산물이고 과학은 그러한 사고에 대한 설명일 뿐이라고 믿었습니다. 따라서 인간의 뇌 외부에서 일어나는 객관적인 과정으로서의 인과성은 과학적 의미를 가질 수 없다고 보았죠. 의미 있는 사고는 오직 관찰 패턴을 반영할 수 있으며, 이는 상관관계로 완전히 설명될 수 있다고 생각했습니다. 그는 상관관계가 인과성보다 인간 사고의 더 보편적인 서술자라고 판단하고, 인과성을 완전히 폐기할 준비가 되어 있었습니다.

피어슨은 1893년에 첫 통계학 논문을 발표했고, 1901년에는 가장 영향력 있는 통계학 저널 중 하나인 『바이오메트리카(Biometrika)』를 창간했으며, 1903년에는 런던 유니버시티 칼리지에 생체 통계학 연구실(Biometrics Lab)을 설립했습니다. 1911년 골턴이 사망하고 피어슨을 초대 교수로 지명하며 연구실에 기부금을 남기자, 연구실은 정식 학과가 되었고, 적어도 20년 동안 세계 통계학의 중심지 역할을 했습니다.

권력의 자리에 오르자 피어슨의 열정적인 태도는 더욱 분명해졌습니다. 그는 동료들에게 충성과 헌신을 요구했고, 반대자들을 '생체 통계 교회'에서 몰아냈습니다. 그의 초기 조수 중 한 명이었던 조지 우드니 율도 그의 분노를 경험한 첫 사람들 중 하나였습니다.

2.2. 피어슨의 '가짜 상관관계'라는 모순 😅

하지만 피어슨의 인과성 없는 과학 체계에도 균열은 있었습니다. 심지어 그 자신도 '가짜 상관관계(spurious correlation)'에 대한 여러 논문을 썼는데, 이 개념은 인과성에 대한 언급 없이는 이해하기 불가능한 것이었습니다.

피어슨은 터무니없는 상관관계를 쉽게 찾을 수 있다는 점에 주목했습니다. 예를 들어, 한 국가의 1인당 초콜릿 소비량과 노벨상 수상자 수 사이에는 강한 상관관계가 있습니다. 이 상관관계는 부유한 서구 국가들이 초콜릿을 더 많이 먹고, 노벨상 수상자도 이들 국가에서 더 많이 배출되기 때문에 나타나는 것으로 보입니다. 하지만 이것은 인과적 설명인데, 피어슨에게는 과학적 사고에 불필요한 것이었습니다. 그에게 인과성은 단지 '현대 과학의 불가해한 비법 속의 우상'일 뿐이었고, 상관관계가 과학적 이해의 목표였죠.

이 점은 그를 어색한 위치에 놓이게 합니다. 어떤 상관관계는 의미 있고 어떤 상관관계는 '가짜'인지를 설명해야 했기 때문이죠. 그는 진정한 상관관계는 변수들 사이에 '유기적인 관계(organic relationship)'를 나타내는 반면, 가짜 상관관계는 그렇지 않다고 설명했습니다. 하지만 '유기적인 관계'란 다른 이름의 인과성이 아닌가요? 🤔

피어슨과 율은 여러 '가짜 상관관계' 사례를 수집했습니다. 대표적인 경우가 교란(confounding)인데, 초콜릿-노벨상 이야기가 그 예시입니다. (부와 위치가 초콜릿 소비와 노벨상 수상 빈도의 공통 원인(common causes), 즉 교란 요인이죠.) 또 다른 '말도 안 되는 상관관계'는 시계열 데이터에서 자주 나타납니다. 율은 영국 연간 사망률과 그해 영국 성공회에서 거행된 결혼 비율 사이에 놀랍도록 높은 상관관계(0.95)를 발견했습니다.

피어슨은 1899년, 가장 흥미로운 종류의 '가짜 상관관계'를 발견했습니다. 두 개의 이질적인 집단이 하나로 합쳐질 때 발생하는 경우입니다. 그는 파리 카타콤의 남성 두개골 806개와 여성 두개골 340개의 길고 넓은 측정치를 분석했습니다. 남성 또는 여성 각각에 대해서는 두개골 길이와 너비 사이에 유의미한 상관관계가 없었지만, 두 집단을 합치자 0.197의 상관관계가 나타났습니다. 피어슨은 이를 통계적 '인공물(artifact)'로 간주했습니다. 상관관계가 양수라는 사실에는 생물학적 또는 '유기적인' 의미가 없었고, 단순히 두 개의 다른 집단을 부적절하게 결합한 결과일 뿐이라고 본 것이죠.

이 예시는 심슨의 역설(Simpson's paradox)이라는 더 일반적인 현상에 해당합니다. 피어슨은 상관관계를 원인과 결과로 여기는 사람들에게 충격적인 사실이라고 말했습니다.

"모든 상관관계를 원인과 결과로 보는 사람들에게는, 서로 전혀 상관없는 두 특성 A와 B 사이에 밀접하게 연관된 두 종족을 인위적으로 혼합함으로써 상관관계가 생성될 수 있다는 사실이 다소 충격으로 다가올 것입니다."

스티븐 스티글러는 "그 자신이 가장 먼저 충격받았을 것이라는 추측을 참을 수 없다"고 언급하며 피어슨이 스스로 인과적으로 생각하려는 경향을 꾸짖고 있었다고 말합니다.

오늘날 인과성 렌즈로 이 사례를 보면, 이것이 얼마나 놓친 기회였는지 알 수 있습니다! 이러한 예시들은 유능한 과학자로 하여금 자신의 충격의 이유를 숙고하고, 언제 가짜 상관관계가 나타나는지를 예측하는 과학을 발전시키도록 했을 것입니다. 적어도 데이터를 언제 통합하고 언제 분리해야 하는지에 대한 지침을 제공했어야 했죠. 그러나 피어슨이 추종자들에게 준 유일한 지침은 '인위적인' 혼합은 좋지 않다는 것이었습니다. 아이러니하게도 인과성 렌즈를 통해 보면, 어떤 경우에는 분할된 데이터가 아니라 통합된 데이터가 올바른 결과를 줄 수 있다는 것을 우리는 이제 알고 있습니다.

피어슨의 학생들 모두가 그의 뒤를 따르지는 않았습니다. 율은 초기에는 상관관계가 과학적 이해에 필요한 모든 것을 말해준다는 강경파에 속했지만, 런던의 빈곤 상태를 설명해야 했을 때 마음을 바꾸기 시작했습니다. 그는 '빈곤 완화 정책(out-relief)'이 빈곤율을 증가시키는지 연구했는데, 데이터는 빈곤 완화 정책이 더 많은 지역에서 빈곤율이 더 높다는 것을 보여주었습니다. 율은 이 상관관계가 허위일 수 있다고 생각했습니다. 이 지역들에는 가난할 가능성이 높은 노인들이 더 많을 수 있었기 때문이죠. 그러나 그는 노인 인구 비율이 동일한 지역들을 비교해도 상관관계가 유지된다는 것을 보여주었고, 이는 빈곤율 증가가 빈곤 완화 정책 때문이라고 주장하는 용기를 주었습니다. 하지만 그는 곧바로 주석에

"엄밀히 말하면, '때문'을 '연관되어 있음'으로 읽어야 합니다."

라고 덧붙이며 다시 조심스러운 태도를 보였습니다. 이는 그 이후 세대의 과학자들에게도 영향을 미쳐, 마음속으로는 '때문'이라고 생각하면서도 겉으로는 '연관되어 있음'이라고 말하는 패턴을 만들었습니다. 피어슨과 그 추종자들이 인과성에 적극적으로 반대하고, 율과 같은 어정쩡한 반대자들이 지도자를 자극하는 것을 두려워하면서, 인과성을 회피하는 문화에 직접적으로 도전할 새로운 과학자의 등장을 기다리는 상황이 되었습니다.

3. 시월 라이트의 등장: 기니피그와 경로도 🐾

1912년 하버드 대학교에 입학한 시월 라이트(Sewall Wright)는 당시 과학계에서 가장 뜨거운 주제 중 하나였던 유전학을 공부했습니다. 그의 박사 학위 지도교수인 윌리엄 캐슬은 토끼 털 색깔에 영향을 미치는 여덟 가지 유전적 요인을 밝혀냈고, 라이트는 같은 연구를 기니피그에게 적용하는 과제를 받았습니다. 1915년 박사 학위를 취득한 후, 그는 미국 농무부(USDA)에서 기니피그를 돌보는 일자리를 얻게 됩니다. 🥕

라이트의 기니피그들은 그의 경력과 진화론 전체의 발판이 되었습니다. 그는 다윈이 제시한 점진적 진화론과 달리, 진화가 상대적으로 갑작스러운 폭발적인 방식으로 일어난다는 견해를 일찍이 주장했습니다. 1925년에는 시카고 대학교의 교수직으로 옮겼지만, 기니피그에 대한 애정은 변치 않았다고 해요. 심지어 강의 중에 기니피그를 칠판 지우개로 사용했다는 일화도 전해집니다! 🤣

USDA에서의 초기 연구에서 라이트는 기니피그의 털 색깔 유전이 멘델의 법칙을 잘 따르지 않는다는 점을 발견했습니다. 순수 백색이나 순수 유색 기니피그를 번식시키는 것이 거의 불가능했고, 여러 세대의 근친 교배 후에도 털 색깔에 상당한 변이가 남아 있었죠. 이는 특정 형질이 근친 교배를 통해 '고정'되어야 한다는 멘델 유전학의 예측과 상충되는 것이었습니다.

라이트는 털 색깔의 변이가 유전학만으로는 설명될 수 없다고 생각하고, 자궁 내 '발달 요인(developmental factors)'이 일부 변이를 유발한다고 가정했습니다. 돌이켜보면 그의 가설은 옳았습니다. 다른 색깔 유전자들이 신체의 다른 부위에서 발현되며, 색깔 패턴은 동물이 물려받은 유전자뿐만 아니라 유전자가 발현되거나 억제되는 위치와 조합에 따라 달라지기 때문입니다.

이러한 연구 문제는 라이트가 새로운 분석 방법을 개발하게 만들었고, 이는 기니피그 유전학의 범위를 훨씬 뛰어넘는 것이었습니다. 라이트는 경로도(path diagram)라는 것을 고안했습니다. 그는 특정 미지량(예: 흰 털에 대한 '발달 요인'의 효과 d, '유전적 요인' h)에 기호를 부여하고, 이 양들과 다른 양들 사이의 관계를 수학 방정식 형태로 표현했습니다. 그리고 가장 중요한 것은, 이 경로도를 통해 숨겨진 인과적 양들을 알면 데이터의 상관관계를 예측할 수 있다는 간단한 그래픽 규칙을 제시했다는 점입니다.

이것은 인과성과 확률 사이의 첫 번째 다리였으며, 인과 사다리의 두 번째 단계와 첫 번째 단계 사이의 첫 번째 교차였습니다. 이 다리를 통해 라이트는 데이터에서 측정된 상관관계(첫 번째 단계)로부터 숨겨진 인과적 양(두 번째 단계)으로 거슬러 올라갈 수 있었고, 이를 대수 방정식을 풀어냄으로써 수행했습니다. 이 아이디어는 라이트에게는 단순하게 느껴졌겠지만, "상관관계가 인과성을 의미하지 않는다"는 통념이 "어떤 상관관계는 인과성을 의미한다"로 바뀌어야 한다는 첫 번째 증거가 되었기에 혁명적이었습니다. 💥

결론적으로, 라이트는 가설로 설정한 발달 요인이 유전보다 더 중요하다고 주장했습니다. 무작위로 교배된 기니피그 집단에서 털 패턴 변이의 42%는 유전 때문이었고, 58%는 발달 요인 때문이었습니다. 반면, 고도로 근친 교배된 집단에서는 흰 털 변이의 3%만이 유전 때문이었고, 92%가 발달 요인 때문이었습니다. 이는 20세대의 근친 교배로 유전적 변이가 거의 제거되었음에도 발달 요인은 남아 있었다는 것을 의미합니다.

위 그림은 기니피그의 털 색깔에 영향을 미치는 요인들을 보여주는 시월 라이트의 첫 번째 경로도입니다. D는 '발달 요인', E는 '환경 요인', G는 각 부모의 '유전 요인', H는 양 부모로부터 물려받은 '종합 유전 요인'을 나타냅니다. O와 O'는 새끼들을 의미하며, 분석 목표는 D, E, H의 효과 강도(d, e, h로 표시)를 추정하는 것이었습니다.

이 경로도는 아기 기니피그의 색소 침착에 영향을 미칠 수 있는 모든 요인을 보여줍니다. D, E, H는 각각 발달, 환경, 유전적 요인을 나타내며, 각 화살표는 원인에서 결과로 이어지는 일방향 인과 관계를 나타냅니다. 예를 들어, G에서 H로 가는 화살표는 수컷 부모의 정자 세포가 새끼의 유전(H)에 직접적인 인과적 영향을 미칠 수 있음을 의미합니다. 또한 각 화살표에는 경로 계수(path coefficient)라는 작은 글자(a, b, c 등)가 붙어 있는데, 이는 라이트가 풀고자 했던 인과적 효과의 강도를 나타냅니다.

경로도는 단순한 그림이 아니라 강력한 계산 도구입니다. 두 변수를 연결하는 경로를 추적하고 경로 계수를 곱하면 상관관계를 계산할 수 있는 규칙이 있기 때문이죠. 또한, 생략된 화살표는 인과적 효과가 0이라는 중요한 가정을 전달하며, 존재하는 화살표는 효과의 크기에 대해 중립적인 태도를 취합니다.

라이트의 논문은 20세기 생물학의 중요한 결과 중 하나이자, 인과성 역사에 있어서 중요한 이정표로 평가됩니다. 이 경로는 20세기 과학이 인과 사다리의 두 번째 단계로 진입하는 첫 걸음이었으며, 다음 해 라이트는 기니피그 외 다른 환경에서도 경로 분석이 어떻게 작동하는지 설명하는 훨씬 더 일반적인 논문인 '상관관계와 인과성(Correlation and Causation)'을 발표했습니다.

하지만 30세 과학자였던 라이트가 기대했던 반응과는 달리, 그는 충격적인 반박에 부딪혔습니다. 통계학의 대부인 칼 피어슨의 제자였던 레이몬드 펄의 학생 헨리 나일스(Henry Niles)가 1921년 라이트의 논문에 대한 반박문을 발표한 것이었죠.

나일스는 피어슨과 골턴의 말을 인용하며 '원인'이라는 단어의 불필요함 또는 무의미함을 주장했습니다.

"'인과성'과 '상관관계'를 대조하는 것은 부당합니다. 왜냐하면 인과성은 단순히 완전한 상관관계이기 때문입니다."

그는 라이트의 방법론 전체를 폄하하며,

"이 방법의 기본적인 오류는, 여러 변수가 서로에게, 그리고 공통 결과에 작용하는 방식을 진정으로 나타낼 수 있는 비교적 단순한 그래픽 시스템을 선험적으로 설정하는 것이 가능하다는 가정에 있는 것 같습니다."

"따라서 우리는 경로 계수 방법의 철학적 기반이 결함이 있고, 실제로 검증할 수 있는 곳에 적용했을 때 그 결과가 전혀 신뢰할 수 없다고 결론 내립니다."

라고 선언했습니다.

나일스의 비판은 과학적 관점에서 상세히 논의할 가치는 없지만, 인과성 역사를 연구하는 우리에게는 매우 중요합니다. 첫째, 그의 비판은 그 시대의 인과성에 대한 태도와 그의 멘토 칼 피어슨이 당시 과학적 사고에 미친 막대한 영향력을 충실히 반영합니다. 둘째, 나일스의 이러한 반대 의견은 오늘날에도 여전히 들을 수 있다는 점입니다. 😓

물론 때때로 과학자들은 변수들 사이의 관계 전체를 알지 못할 때가 있습니다. 라이트는 이런 경우에 경로도를 탐색적 모드로 사용할 수 있다고 주장했습니다. 즉, 특정 인과 관계를 가정하고 변수들 간의 예측된 상관관계를 도출한 다음, 이 예측이 데이터와 모순되면 가정한 관계가 틀렸다는 증거를 얻는 방식입니다. 이 방법은 나중에 1953년 허버트 사이먼(Herbert Simon)에 의해 재발견되었고, 사회 과학 분야에서 많은 연구에 영감을 주었습니다.

라이트는 한 가지 점을 명확히 했습니다. 어떤 인과적 가설 없이는 인과적 결론을 내릴 수 없다는 것이죠. 이는 인과 사다리의 첫 번째 단계에서 수집된 데이터만으로는 두 번째 단계의 질문에 답할 수 없다는 1장의 결론과 일치합니다. 어떤 이들은 "그럼 인과적 추론이 순환적이라는 건가요? 증명하고 싶은 것을 그냥 가정하는 것 아닌가요?"라고 묻습니다. 답은 아니오입니다. 라이트는 아들의 털 색깔이 부모에게 영향을 주지 않는다는 것과 같은 매우 약하고, 질적이며, 명백한 가정을 20년간의 기니피그 데이터와 결합하여, 명백하지 않은 정량적 결과(예: 털 색깔 변이의 42%가 유전 때문)를 얻었습니다. 명백한 것에서 명백하지 않은 것을 추출하는 것은 순환적이지 않으며, 과학적인 승리라고 할 수 있습니다! 🏆

라이트의 기여는 결론으로 이어지는 정보가 서로 거의 호환되지 않는 두 가지 수학 언어에 존재했다는 점에서 독특합니다. 한편으로는 다이어그램의 언어, 다른 한편으로는 데이터의 언어였습니다. 질적인 '화살표 정보'와 양적인 '데이터 정보'를 결합하는 이 이단적인 아이디어는 컴퓨터 과학자였던 저자를 이 연구에 매료시킨 기적 중 하나였습니다.

많은 사람들이 여전히 나일스의 실수를 저지르며 인과 분석의 목표가 X가 Y의 원인임을 증명하거나, Y의 원인을 처음부터 찾는 것이라고 생각합니다. 이것은 '인과 발견(causal discovery)'의 문제이며, 라이트는 인과 발견이 훨씬 더 어렵고 아마도 불가능할 것이라고 처음부터 이해했습니다. 그는 나일스에 대한 답변에서 이렇게 썼습니다.

"필자[즉, 라이트 자신]는 경로 계수 이론이 인과 관계를 추론하기 위한 일반적인 공식을 제공한다고 터무니없이 주장한 적이 없습니다. 그는 상관관계에 대한 지식과 인과 관계에 대한 지식을 결합하여 특정 결과를 얻는 것이, 나일스의 진술이 암시하는 상관관계로부터 인과 관계를 추론하는 것과는 다른 것이라고 주장하고 싶습니다."

4. 시월 라이트의 용기와 인과적 사고의 부활 ✨

전문 역사가라면 여기서 글을 멈추겠지만, '휘그 역사가(Whig historian)'로서 저는 라이트의 말에 대한 순수한 감탄을 억누를 수 없습니다. 그가 처음 이 말을 한 지 90년이 지났지만, 여전히 유효하며 현대 인과 분석의 새로운 패러다임을 정의했기 때문입니다. 라이트의 정확성에 대한 감탄은 그의 용기와 결단력에 대한 감탄 다음으로 옵니다. 1921년의 상황을 상상해 보세요. 독학한 수학자가 통계학계의 헤게모니에 홀로 맞서는 상황 말이죠.

그들은 그에게 "당신의 방법은 과학적 의미에서 인과성의 본질에 대한 완전한 오해를 바탕으로 합니다"라고 말합니다.

그러자 그는 "아닙니다! 제 방법은 당신들이 만들어낼 수 있는 어떤 것보다 중요하고 뛰어난 것을 만들어냅니다"라고 반박합니다.

그들은 "우리 대가들은 이 문제들을 이미 20년 전에 조사했고, 당신이 한 일은 헛소리라고 결론 내렸습니다. 당신은 상관관계에 상관관계를 결합하여 상관관계를 얻었을 뿐입니다. 당신이 더 성장하면 이해하게 될 것입니다"라고 말합니다.

그러자 그는 계속해서 "저는 당신들의 대가들을 무시하는 것이 아닙니다. 하지만 사실은 사실입니다. 제 경로 계수는 상관관계가 아닙니다. 그것들은 완전히 다른 것입니다. 인과적 효과입니다"라고 말합니다.

마치 유치원에서 친구들이 '3 + 4 = 7'이라고 믿는 것을 놀리고, 선생님마저 '3 + 4 = 8'이라고 말할 때의 상황을 상상해보세요. 누구나 자신의 신념에 흔들릴 것입니다. 저자도 그런 경험이 있다고 합니다. 하지만 라이트는 흔들리지 않았습니다. 이것은 독립적인 검증이 가능한 산술 문제가 아니었습니다. 철학자들만이 인과성의 본질에 대해 의견을 표명할 용기가 있었죠. 라이트는 자신이 올바른 길을 가고 있고 나머지 유치원생들이 틀렸다는 내적인 확신을 어디서 얻었을까요? 아마도 그의 미주리 중서부에서의 성장과 작은 대학에서의 교육이 그의 자립심을 키우고, 가장 확실한 지식은 스스로 구성하는 것이라는 가르침을 주었을 것입니다.

갈릴레오가 종교 재판에서 지구가 태양 주위를 돈다는 자신의 주장을 철회하라는 강요를 받았을 때, 조용히 "그래도 지구는 돈다(E pur si muove)"라고 속삭였다는 이야기는 많은 사람들에게 용기를 주었습니다. 하지만 갈릴레오는 적어도 자신의 천문학적 관찰 결과를 의지할 수 있었습니다. 라이트는 단지 검증되지 않은 결론들, 예를 들어 발달 요인이 변이의 58%를 차지하고 3%는 아니라는 식의 결론만을 가지고 있었습니다. 경로 계수가 상관관계가 알려주지 않는 것을 알려준다는 내적 확신 외에는 아무것도 의지할 것이 없었지만, 그는 여전히 "그래도 그것은 움직인다!"라고 선언했습니다.

라이트에게 위안이 되었을 한 가지, 그리고 그가 올바른 길을 가고 있다는 한 가지 신호는 다른 어떤 방법으로도 답할 수 없는 질문에 답할 수 있다는 그의 이해였을 것입니다. 여러 요인의 상대적 중요성을 결정하는 것이 바로 그런 질문 중 하나였죠. 또 다른 아름다운 예시는 1921년 그의 논문 '상관관계와 인과성'에서 찾을 수 있습니다. 그는 기니피그가 자궁에서 하루 더 머물면 출생 체중에 얼마나 영향을 미칠 것인지를 묻습니다.

라이트의 질문에 직접 답할 수는 없습니다. 자궁 안의 기니피그를 직접 측정할 수는 없기 때문이죠. 하지만 66일 동안 임신한 기니피그와 67일 동안 임신한 기니피그의 출생 체중을 비교할 수 있습니다. 라이트는 자궁에서 하루 더 머문 기니피그가 출생 시 평균 5.66그램 더 나간다는 것을 발견했습니다. 그래서 우리는 순진하게 기니피그 배아가 출생 직전에 하루에 5.66그램씩 성장한다고 생각할 수 있습니다.

"틀렸어!"라고 라이트는 말합니다.

나중에 태어나는 새끼들은 보통 그만한 이유가 있습니다. 즉, 형제자매가 더 적다는 것이죠. 이는 임신 기간 내내 성장에 더 유리한 환경을 가졌다는 의미입니다. 예를 들어, 형제자매가 두 마리뿐인 새끼는 66일째에도 형제자매가 네 마리인 새끼보다 이미 더 나갈 것입니다. 따라서 출생 체중의 차이에는 두 가지 원인이 있으며, 우리는 이들을 분리해야 합니다. 5.66그램 중 얼마가 자궁에서 하루 더 보낸 것 때문이고, 얼마가 경쟁할 형제자매가 적은 것 때문일까요?

라이트는 경로도(Figure 2.8)를 설정하여 이 질문에 답했습니다.

위 그림은 출생 체중 예시에 대한 인과(경로) 다이어그램입니다. X는 새끼의 출생 체중, Q와 P는 출생 체중의 두 가지 알려진 원인(임신 기간 P, 자궁 내 성장률 Q)을 나타냅니다. L은 새끼 수(Litter size)를 나타내며, P와 Q 모두에 영향을 미칩니다. A와 C는 데이터가 없는 외부 원인(예: 성장률 및 임신 기간을 조절하는 유전적 및 환경적 요인)입니다.

라이트가 직면한 질문은 "임신 기간 P가 출생 체중 X에 미치는 직접적인 효과는 무엇인가?"였습니다. 데이터(하루 5.66그램)는 직접적인 효과를 알려주지 않고, 새끼 수 L에 의해 편향된 상관관계를 제공합니다. 직접적인 효과를 얻으려면 이 편향을 제거해야 합니다.

그림 2.8에서 직접적인 효과는 경로 P → X에 해당하는 경로 계수 p로 표현됩니다. 새끼 수에 의한 편향은 경로 P → L → Q → X에 해당하며, 이 편향의 크기는 그 경로를 따라 있는 경로 계수들의 곱(l × l' × q)과 같습니다. 따라서 총 상관관계는 두 경로를 따라 있는 경로 계수들의 합, 즉 p + (l × l' × q) = 하루 5.66그램입니다.

만약 경로 계수 l, l', q를 안다면, 두 번째 항을 계산하여 5.66에서 빼면 원하는 값 p를 얻을 수 있습니다. 하지만 우리는 Q(예를 들어)가 측정되지 않기 때문에 이들을 모릅니다. 여기서 경로 계수의 독창성이 빛을 발합니다. 라이트의 방법은 측정된 각 상관관계(P, X), (L, X), (L, P)를 경로 계수들로 표현하는 방법을 알려줍니다. 이 과정을 거쳐 얻은 세 개의 방정식을 대수적으로 풀면 미지의 경로 계수 p, l', 그리고 l × q를 얻을 수 있습니다. 그러면 원하는 값 p를 얻게 됩니다.

오늘날에는 수학을 건너뛰고도 다이어그램을 대략적으로 검토하여 p를 계산할 수 있습니다. 하지만 1920년에는 이것이 인과성과 상관관계를 연결하기 위해 수학이 동원된 첫 사례였습니다. 그리고 그것은 성공했습니다! 라이트는 p를 하루 3.34그램으로 계산했습니다. 즉, 다른 모든 변수들(A, L, C, Q)이 일정하게 유지되고 임신 기간만 하루 증가했다면, 출생 체중은 평균적으로 하루 3.34그램 증가했을 것입니다. 이 결과는 생물학적으로 의미가 있습니다. 새끼들이 태어나기 전 하루에 얼마나 빠르게 성장하는지를 알려주기 때문이죠. 반면 하루 5.66그램이라는 숫자는 두 가지 별개의 과정, 그중 하나는 인과적이지 않고 반인과적인(또는 진단적인) P → L 링크를 혼동하기 때문에 생물학적 의미가 없습니다. 이 예시에서 얻는 첫 번째 교훈은 다음과 같습니다. 인과 분석을 통해 데이터의 패턴만이 아니라 현실 세계의 과정을 정량화할 수 있다는 것입니다. 새끼들은 하루에 3.34그램씩 성장하며, 5.66그램이 아닙니다. 수학을 이해했든 못 했든 얻는 두 번째 교훈은 다음과 같습니다. 경로 분석에서는 다이어그램 전체를 검토하여 개별 인과 관계에 대한 결론을 내립니다. 각 개별 매개변수를 추정하기 위해서는 다이어그램의 전체 구조가 필요할 수 있습니다.

과학이 논리적으로 발전하는 세상이었다면, 라이트의 나일스에 대한 답변은 과학적 흥분을 불러일으키고 다른 과학자와 통계학자들의 그의 방법론에 대한 열정적인 채택으로 이어졌을 것입니다. 하지만 그렇게 되지 않았습니다. 라이트의 동료 유전학자인 제임스 크로우는 "1920년부터 1960년까지 과학사에서 경로 분석의 거의 부재는 하나의 미스터리"라고 썼습니다.

"경로 분석은 '고정된' 프로그램에 적합하지 않습니다. 사용자는 가설을 가지고 있어야 하고, 여러 인과 시퀀스의 적절한 다이어그램을 고안해야 합니다."

크로우는 중요한 점을 지적했습니다. 경로 분석은 과학적 사고를 요구하며, 이는 모든 인과 추론 작업에도 해당됩니다. 통계학은 흔히 그것을 저해하고, 대신 '고정된' 절차를 장려합니다. 과학자들은 과학적 지식에 도전하는 방법보다는 데이터에 대한 일상적인 계산을 항상 선호할 것입니다.

골턴과 피어슨 세대 이후 통계학의 최고 권위자였던 R. A. 피셔(R. A. Fisher)는 이러한 차이를 간결하게 설명했습니다. 1925년에 그는

"통계학은… 데이터 축소 방법론의 연구로 간주될 수 있습니다."

라고 썼습니다. '방법론', '축소', '데이터'라는 단어에 주목하세요. 라이트는 통계학이 단순히 방법론의 집합이라는 생각을 혐오했지만, 피셔는 이를 받아들였습니다. 인과 분석은 단지 데이터에 관한 것이 아닙니다. 인과 분석에서는 데이터를 생성하는 과정에 대한 이해를 포함해야 하며, 그러면 애초에 데이터에 없었던 것을 얻게 됩니다. 하지만 피셔는 한 가지 점에서 옳았습니다. 통계학에서 인과성을 제거하면 남는 것은 데이터의 축소뿐입니다.

크로우는 언급하지 않았지만, 라이트의 전기 작가 윌리엄 프로빈은 경로 분석이 지지를 받지 못한 또 다른 요인을 지적합니다. 1930년대 중반부터 피셔는 라이트를 자신의 적수로 간주했습니다. 율이 피어슨과 의견이 다르면 관계가 불편해지고, 비판하면 불가능해졌다고 언급했듯이, 피셔도 마찬가지였습니다. 피셔는 피어슨, 피어슨의 아들 에곤, 예지 네이만(Jerzy Neyman) 그리고 물론 라이트와도 격렬한 불화를 겪었습니다.

피셔와 라이트의 진정한 경쟁은 경로 분석이 아니라 진화 생물학에 있었습니다. 피셔는 종이 인구 병목 현상을 겪을 때 빠르게 진화할 수 있다는 라이트의 이론('유전적 부동')에 동의하지 않았습니다. 1920년대부터 1950년대까지 과학계는 대부분 피셔를 통계학 지식의 권위자로 여겼습니다. 그리고 피셔는 경로 분석에 대해 어떤 좋은 말도 하지 않았을 것임은 확실합니다.

1960년대에 상황은 바뀌기 시작했습니다. 오티스 던컨, 휴버트 블레이록, 경제학자 아서 골드버거를 포함한 사회 과학자 그룹은 사회 및 교육 정책의 효과를 예측하는 방법으로 경로 분석을 재발견했습니다. 역사적으로 또 다른 아이러니는, 라이트 자신이 1947년 콜스 위원회(Cowles Commission)라는 영향력 있는 계량 경제학자 그룹에게 강연 요청을 받았지만, 경로도가 무엇인지 그들에게 전혀 전달하지 못했다는 것입니다. 경제학자들이 스스로 비슷한 아이디어를 내놓았을 때에야 비로소 짧은 기간 동안 연결이 이루어졌습니다.

경제학과 사회학에서 경로 분석의 운명은 각기 다른 궤적을 따랐으며, 각기 라이트의 아이디어를 배신하는 방향으로 나아갔습니다. 사회학자들은 경로 분석을 구조 방정식 모델링(Structural Equation Modeling, SEM)으로 이름을 바꾸고 다이어그램을 광범위하게 사용했습니다. 하지만 1970년에 LISREL이라는 컴퓨터 패키지가 경로 계수 계산을 자동화하면서, 라이트가 예측했던 일이 일어났습니다. 경로 분석은 기계적인 방법으로 변질되었고, 연구자들은 소프트웨어 사용자로서 내부에서 무슨 일이 일어나는지 거의 관심을 두지 않게 되었습니다. 1980년대 후반, 통계학자 데이비드 프리드먼이 SEM의 가정들을 설명하라는 공개적인 도전에 아무런 답변이 없었고, 일부 선도적인 SEM 전문가들은 SEM이 인과성과 아무런 관련이 없다고까지 주장했습니다.

경제학에서는 경로 분석의 대수학적 부분이 동시 방정식 모델(Simultaneous Equation Models)로 알려졌습니다. 경제학자들은 경로도를 거의 사용하지 않았고, 오늘날까지도 사용하지 않으며, 대신 수치 방정식과 행렬 대수에 의존합니다. 이로 인한 심각한 결과는, 대수 방정식은 방향성이 없기 때문에 (즉, x = y는 y = x와 동일하므로), 경제학자들은 인과 방정식과 회귀 방정식을 구별할 표기법적 수단이 없었고, 따라서 방정식을 푼 후에도 정책 관련 질문에 답할 수 없었습니다. 1995년까지도 대부분의 경제학자들은 자신들의 방정식에 인과적 또는 반사실적 의미를 명시적으로 부여하는 것을 삼갔습니다. 구조 방정식을 정책 결정에 사용했던 사람들조차도 다이어그램에 대한 불치의 의심을 유지했는데, 이는 수많은 계산 페이지를 절약할 수 있었을 것입니다. 당연히 일부 경제학자들은 오늘날까지도 "모든 답은 데이터 안에 있다"고 주장합니다.

이러한 모든 이유로 인해 경로도의 약속은 1990년대까지는 기껏해야 부분적으로만 실현되었습니다. 1983년, 라이트 자신은 다시 한번 경로도를 옹호하기 위해 불러내어졌습니다. 이번에는 『미국 인간 유전학 저널(American Journal of Human Genetics)』에서였습니다. 이 글을 쓸 당시 라이트는 90세가 넘었습니다. 1923년에 썼던 바로 그 주제에 대해 1983년에 쓴 그의 에세이를 읽는 것은 경이롭기도 하고 비극적이기도 합니다. 과학사에서 이론의 창시자가 처음 이론을 발표한 지 60년 후에 다시 그 이론에 대해 이야기하는 특권을 몇 번이나 가질 수 있었을까요? 그것은 마치 찰스 다윈이 1925년 스코프스 원숭이 재판에 증언하기 위해 무덤에서 돌아오는 것과 같았을 것입니다. 하지만 비극적이기도 합니다. 그 60년 동안 그의 이론이 발전하고 성장하고 번성했어야 했는데, 1920년대 이후 거의 발전하지 못했기 때문입니다.

라이트의 논문은 사무엘 칼린(Samuel Karlin)과 두 명의 공동 저자가 같은 저널에 발표한 경로 분석 비판에 대한 반박이었습니다. 칼린의 주장 중 우리에게 흥미로운 두 가지가 있습니다.

첫째, 칼린은 나일스가 제기하지 않았던 이유로 경로 분석에 반대했습니다. 경로도 내의 모든 두 변수 간의 관계가 선형적이라고 가정한다는 것이죠. 이 가정은 라이트가 인과 관계를 단일 숫자, 즉 경로 계수로 설명할 수 있게 해줍니다. 만약 방정식이 선형이 아니라면, X의 1단위 변화가 Y에 미치는 효과는 X의 현재 값에 따라 달라질 수 있습니다. 칼린도 라이트도 일반적인 비선형 이론이 곧 등장할 것이라는 사실을 알지 못했습니다. (3년 후 저자의 연구실의 뛰어난 학생 토마스 베르마에 의해 개발될 예정이었습니다.)

하지만 칼린의 가장 흥미로운 비판은 그가 가장 중요하게 여겼던 것이기도 했습니다.

"마지막으로, 그리고 가장 유용하게도, 본질적으로 모델 없는 접근 방식을 채택하여 다양한 디스플레이, 지수 및 대비를 사용하여 데이터를 상호작용적으로 이해할 수 있습니다. 이 접근 방식은 결과 해석의 견고성 개념을 강조합니다."

이 한 문장에서 칼린은 피어슨 시대 이후로 얼마나 적게 변했는지, 그리고 1983년에도 피어슨의 이념이 얼마나 큰 영향력을 가지고 있었는지를 명확히 보여줍니다. 그는 데이터 자체가 모든 과학적 지혜를 담고 있으며, '디스플레이, 지수 및 대비'를 통해 설득하고 조작하기만 하면 그 지혜의 진주를 내놓을 것이라고 말하는 것이죠. 우리의 분석이 데이터를 생성하는 과정을 고려할 필요가 없다는 것입니다. '모델 없는 접근 방식'으로도 똑같이 잘, 아니면 더 잘할 수 있다는 거죠. 피어슨이 오늘날 빅데이터 시대에 살아있었다면, "답은 모두 데이터 안에 있다"고 정확히 이렇게 말했을 것입니다.

물론 칼린의 진술은 우리가 1장에서 배운 모든 것을 위반합니다. 인과성에 대해 이야기하려면 현실 세계에 대한 정신적 모델이 있어야 합니다. '모델 없는 접근 방식'은 인과 사다리의 첫 번째 단계까지는 데려갈 수 있지만, 그 이상은 안 됩니다.

라이트는 이 엄청난 중요성을 이해하고 다음과 같이 명확히 밝혔습니다.

"모델 없는 접근 방식(3)을 선호되는 대안으로 다루면서… 칼린 등은 방법론의 변화뿐만 아니라 경로 분석의 목적과 다양한 원인의 상대적 중요성 평가를 포기하라고 주장하고 있습니다. 모델 없이는 그러한 분석은 불가능합니다. 그들의 조언은 그러한 평가를 하고 싶은 사람은 그 욕구를 억누르고 다른 일을 하라는 것입니다."

라이트는 과학적 방법의 본질과 데이터 해석을 옹호하고 있었습니다. 저자는 오늘날 빅데이터와 모델 없는 열성적인 사람들에게도 똑같은 조언을 할 것입니다. 물론 데이터가 제공할 수 있는 모든 정보를 끌어내는 것은 괜찮지만, 이것이 우리를 얼마나 멀리 데려갈 수 있을지 물어봅시다. 그것은 인과 사다리의 첫 번째 단계를 넘어설 수 없을 것이며, "다양한 원인의 상대적 중요성은 무엇인가?"와 같은 간단한 질문에도 결코 답할 수 없을 것입니다. E pur si muove! (그래도 그것은 움직인다!)

5. 객관성에서 주관성으로 – 베이즈 연결 🔗

라이트의 반박문에는 통계학자들이 인과성에 저항하는 또 다른 이유를 암시하는 주제가 있습니다. 그는 경로 분석이 '정형화되지 않기를' 반복해서 강조합니다. 라이트에 따르면,

"경로 분석의 정형화되지 않은 접근 방식은 완전한 객관성에서 벗어나는 것을 피하기 위해 고안된 정형화된 설명 방식과는 심오하게 다릅니다."

그는 무엇을 의미했을까요? 첫째, 경로 분석은 사용자의 인과 과정에 대한 개인적인 이해를 바탕으로 해야 하며, 이는 인과 다이어그램에 반영되어야 한다고 말합니다. 통계 매뉴얼에 나와 있는 기계적인 루틴으로 축소될 수 없다는 것이죠. 라이트에게 경로 다이어그램을 그리는 것은 통계적 작업이 아니라, 유전학, 경제학, 심리학 등 과학자 자신의 전문 분야에 대한 작업입니다.

둘째, 라이트는 '모델 없는' 방법론의 매력을 객관성에서 찾습니다. 이는 실제로 1834년 3월 15일 런던 통계학회가 창립된 이래 통계학자들의 성배였습니다. 창립 헌장에는 모든 경우에 의견과 해석보다 데이터가 우선해야 한다고 명시되어 있었습니다. 데이터는 객관적이고, 의견은 주관적이기 때문이죠. 이 패러다임은 피어슨 이전부터 존재했습니다. 객관성을 위한 투쟁—즉, 오직 데이터와 실험으로부터만 추론하려는 생각—은 갈릴레오 이래로 과학이 스스로를 정의하는 방식의 일부였습니다.

상관관계 및 주류 통계학의 대부분 도구와 달리, 인과 분석은 사용자가 주관적인 약속을 하도록 요구합니다. 사용자는 자신의 질적 믿음, 또는 더 나아가 자신의 전문 분야 연구자들의 합의된 믿음을 반영하는 인과 다이어그램을 그려야 합니다. 그녀는 객관성을 위한 객관성이라는 수세기 동안의 도그마를 버려야 합니다. 인과성에 관한 한, 한 알의 현명한 주관성이 어떤 객관성보다 현실 세계에 대해 더 많은 것을 알려줍니다.

위 단락에서 저는 '대부분의' 통계 도구들이 완전한 객관성을 추구한다고 말했습니다. 하지만 이 규칙에는 한 가지 중요한 예외가 있습니다. 베이즈 통계학(Bayesian statistics)이라고 불리는 통계학의 한 분야는 지난 50여 년 동안 인기가 급증했습니다. 한때 거의 금기시되었던 이 분야는 이제 완전히 주류가 되었고, 1960년대와 1970년대에 격렬했던 '베이지안'과 '프리퀀티스트' 사이의 대논쟁 없이 전체 통계학 회의에 참석할 수 있을 정도입니다.

베이즈 분석의 원형은 이렇습니다: 사전 믿음 + 새로운 증거 → 수정된 믿음. 예를 들어, 동전을 10번 던져 9번 앞면이 나왔다고 가정해 봅시다. 동전이 공정하다는 당신의 믿음은 아마 흔들리겠지만, 얼마나 흔들릴까요? 정통 통계학자는 "추가적인 증거가 없다면, 이 동전이 조작되었다고 믿고, 다음 던지기에서 앞면이 나올 확률에 9대 1로 걸겠습니다"라고 말할 것입니다.

반면에 베이즈 통계학자는 "잠깐만요. 동전에 대한 우리의 사전 지식도 고려해야 합니다"라고 말할 것입니다. 그 동전이 동네 슈퍼에서 온 것인가요, 아니면 수상한 도박꾼에게서 온 것인가요? 만약 평범한 쿼터 동전이라면, 우리 대부분은 9번의 앞면이라는 우연의 일치 때문에 우리의 믿음이 그렇게 극적으로 흔들리지는 않을 것입니다. 반대로, 이미 그 동전이 조작되었다고 의심했다면, 9번의 앞면이 편향에 대한 심각한 증거를 제공한다고 더 쉽게 결론 내릴 것입니다.

베이즈 통계학은 관찰된 증거를 우리의 사전 지식(또는 주관적인 믿음)과 결합하여 수정된 믿음을 얻고, 따라서 다음 동전 던지기 결과에 대한 수정된 예측을 얻는 객관적인 방법을 제공합니다. 그러나 프리퀀티스트들이 받아들일 수 없었던 것은 베이지안들이 주관적인 확률의 형태로 '의견'을 통계학이라는 순수한 영역에 침투시키는 것을 허용했다는 점이었습니다. 주류 통계학자들은 베이즈 분석이 일기 예보나 적 잠수함 추적과 같은 다양한 응용 분야에서 뛰어난 도구임이 입증되었을 때 마지못해 이를 받아들였습니다. 게다가 많은 경우에 데이터의 크기가 증가함에 따라 사전 믿음의 영향이 사라지고, 결국에는 단 하나의 객관적인 결론이 남는다는 것이 증명될 수 있습니다.

안타깝게도, 주류 통계학에서 베이즈적 주관성이 받아들여진 것은 경로 다이어그램을 지정하는 데 필요한 종류의 인과적 주관성을 받아들이는 데에는 아무런 도움이 되지 않았습니다. 왜일까요? 그 답은 거대한 언어적 장벽에 있습니다. 주관적인 가정을 명확히 표현하기 위해 베이즈 통계학자들은 여전히 확률의 언어를 사용하며, 이는 골턴과 피어슨의 모국어였습니다. 반면에 인과 추론에 들어가는 가정들은 더 풍부한 언어(예: 다이어그램)를 필요로 하는데, 이는 베이지안과 프리퀀티스트 모두에게 생소한 언어입니다. 베이지안과 프리퀀티스트 사이의 화해는 선의와 공통 언어가 있다면 철학적 장벽을 넘을 수 있음을 보여줍니다. 하지만 언어적 장벽은 그렇게 쉽게 극복되지 않습니다.

더욱이 인과 정보의 주관적 요소는 데이터 양이 증가하더라도 반드시 시간이 지남에 따라 줄어들지 않습니다. 두 사람이 다른 인과 다이어그램을 믿는다면, 아무리 '빅'한 데이터라도 같은 데이터를 분석하여 결코 같은 결론에 도달하지 못할 수 있습니다. 이것은 과학적 객관성의 옹호자들에게는 끔찍한 전망이며, 주관적인 인과 정보에 의존할 수밖에 없다는 사실을 받아들이기를 거부하는 이유를 설명합니다.

긍정적인 측면에서, 인과 추론은 한 가지 중요한 의미에서 객관적입니다. 두 사람이 자신의 가정에 동의한다면, 새로운 증거(또는 데이터)를 해석하는 100% 객관적인 방법을 제공한다는 것이죠. 이 속성은 베이즈 추론과 공유합니다. 따라서 현명한 독자라면 제가 베이즈 확률론에서 시작하여 베이즈 네트워크를 통해 엄청난 우회를 거쳐 인과 이론에 도달했다는 사실에 놀라지 않을 것입니다. 그 이야기는 다음 장에서 다룰 것입니다.

마무리

이 장에서는 19세기 후반부터 20세기 초반까지 인과적 추론의 여정이 어떻게 펼쳐졌는지, 그리고 이 과정에서 프랜시스 골턴과 칼 피어슨이라는 거물들이 인과성의 개념을 통계학에서 배제하고 상관관계를 중심으로 한 데이터 축소의 시대를 열었는지를 살펴보았습니다. 특히, 골턴의 '평균으로의 회귀' 발견과 피어슨의 '가짜 상관관계' 논의를 통해 인과성을 배제한 통계학의 한계와 모순을 명확히 볼 수 있었습니다.

하지만 이러한 흐름 속에서 시월 라이트는 경로도라는 혁신적인 도구를 통해 인과적 사고를 통계학으로 다시 가져오는 데 성공했습니다. 그의 기니피그 연구는 상관관계만으로는 답할 수 없는 인과적 질문에 답할 수 있음을 증명하며, 인과 사다리의 두 번째 단계로 나아가는 중요한 발걸음을 내디뎠습니다. 비록 그의 방법론이 당시 주류 통계학계의 강한 저항에 부딪혔지만, 라이트는 자신의 신념을 굳건히 지키며 모델 기반의 인과적 추론의 중요성을 강조했습니다.

결론적으로, 이 장은 인과성이 통계학의 핵심적인 부분이며, 단순히 데이터만으로는 현실 세계의 복잡한 인과 관계를 완전히 이해할 수 없다는 것을 분명히 보여줍니다. 인과적 가설과 주관적인 모델링은 우리가 데이터 너머의 진실을 파악하고, 진정한 과학적 통찰을 얻기 위한 필수적인 요소인 것입니다. 라이트의 용기와 선구적인 업적은 오늘날까지도 우리에게 큰 영감을 주며, '데이터가 전부'라는 맹목적인 믿음에 대해 다시 한번 깊이 생각해 보게 합니다. 💡