공간정책분석가

논문리뷰: 닭이 먼저냐 달걀이 먼저냐에 대한 계량분석 그레인저 인과검정 결과 본문

정책평가연구

논문리뷰: 닭이 먼저냐 달걀이 먼저냐에 대한 계량분석 그레인저 인과검정 결과

분석가 가온 2023. 10. 10. 01:23

논문: Chickens, Eggs, and Causality, or Which Came First? (Thurman and Fisher, 1988)

 Granger는 “Investigating Causal Relations”를 통해 인과관계 연구에 큰 영향을 주었다. 하지만 본 논문은 지금까지 Granger 인과관계 검증이 자연스럽게 적용되지 못하고 있는 점을 지적하면서, “닭이 먼저냐 달걀이 먼저냐”라는 유명한 명제를 검증하고자 했다.

 

 이를 검증하기 위해 미 농무부1)에서 제공하고 있는 1930~1983년의 연간 닭의 수와 달걀 수 데이터를 활용했다. 닭의 수는 12월1일 기준이며, 구이용 영계는 산란하지 않기 때문에 전체 닭의 수에서 제외했다. 사용된 방법은 Granger 인과관계 검정으로 그 개념은 다음과 같다. 만약 X의 과거 값(lagged values of X)이 현재의 Y를 예측하는데 도움이 된다면, X는 Y에 대해 Granger 인과관계를 갖는다고 말할 수 있다. 따라서 달걀에 대해 과거 달걀의 값과 닭의 값을 회귀했을 때, 닭의 값이 통계적으로 유의미하다면, 닭이 먼저라고 해석할 수 있으며, 그 반대로 Granger 인과관계를 검증할 경우 달걀이 먼저라고 해석 할 수 있다. 본 논문에서는 4개연도 시차변수(lagged variable)를 사용했으며, 회귀모형에서 독립변수의 시차는 같은 연도를 활용했다2).

 어떠한 하나가 먼저 시작되었다라고 주장하기 위해서는 A가 B의 원인이되었다는 것을 증명해야 한다. 동시 B가 A의 원인이 되었다는 주장을 기각해야한다. 만약 B가 A의 원인이 되었다는 주장을 기각할 수 없거나, A와 B가 모두 A의 원인이 되었다면 A가 B의 원인이 되었다는 주장을 입증하기 어렵다. 본 논문의 분석 결과 닭이 먼저라는 가설은 기각된다. 4개 연도의 분석 결과 1차연도부터 4차연도까지 시차변수의 p-value는 0.85, 0.19, 0.36, 0.54로 통계적으로 유의미하지 않았다. 반면, 달걀이 먼저라는 가설은 채택되었다. 시차변수의 p-value는 각각 0.27, 0.0002, 0.0009, 0.0032로 2차연도부터 4차연도까지의 시차변수가 통계적으로 유의미했다.

 본 논문은 분석결과의 구조적 함의는 명확하지 않으며, 이를 명확하기 위해서는 경제학자와 가금류 학자의 협력이 필요하다고 말하면서도, 인과관계 검정에 있어서 잠재적인 가능성이 매우 높다고 주장했다. 또한 ‘마지막 웃는 사람이 최후의 승자’, ‘교만은 패망의 선봉이요, 기만한 마음은 넘어짐의 앞잡이니라’ 등의 명제가 다루어져야 할 연구 분야라고 설명했다.


1) 미 농무부 통계 사이트: https://quickstats.nass.usda.gov/

2) 즉, 종속변수가 1983년 달걀의 개수이고, 1개 연도 시차변수를 독립변수로 활용한다면 1982년 달걀의 개수와 1982년 닭의 수가 독립변수로 사용되었다는 의미이다.