논문리뷰 (담뱃세와 출산율 인과관계) Can higher cigarette taxes improve birth outcomes? (Evans & Ringel, 1998)
Backgroud
출산아 저체중 문제는 공공보건 문제와 관련되서 매우 중요한 이슈이다. 하지만 과학자들도 느린 태아 성장 또는 조산을 발생시키는 생물학적 요인들의 복잡한 관계를 명확하게 규명하지 못하고 있다. 명확한 이유는 아직 밝혀지지 않았지만 관찰된 증거들을 기반으로 볼 때, (1) 산모의 임신전 몸무게, (2) 임신 기간 중 몸무게의 낮은 증가율, (3) 임신 기간 중 흡연이 가장 큰 위협요인으로 알려져 있다. 선행연구에 따르면 출산아 저체중의 20%가 임신 기간 중 흡연에 비롯되었다. 출산아 저체중 문제는 매우 큰 지출을 동반하는 문제로 전체 아동의 7%를 차지하는 저체중 출산아를 위해 미국 의료서비스 총 지출 중 35%가 사용된 것으로 밝혀졌다. 담배 한값의 외부효과 비용은 29센트로 기존의 담뱃세와 거의 일치한다. 하지만 임신 기간 중 담배로 인한 저체중 문제를 포함시킬 경우 외부효과 비용은 45센트로 증가한다. 이는 일시적인 저체중 문제를 포함할 뿐 장기적으로 저체중 출산아에게 지출되는 의료서비스 비용 또는 만성질병 등은 포함되지 않은 가격이다. 만약 이와 같은 장기 비용이 포함될 경우 외부효과 비용은 $4.80으로 증가한다.
정부의 정책이나 의료서비스 모두 임신 기간 중 흡연의 위협을 알리고 있지만 어떠한 공공정책도 임신 기간 중 흡연으로 인한 저체중 문제를 직접적으로 다루고 있지 않다. 이와 관련된 정책은 담뱃세일 뿐이며, 담뱃세 또한 직접적으로 저체중 문제를 해결하기 위한 수단이 아닌 간접적으로 흡연 중인 임산부에게 영향을 미칠 뿐이다. 본 연구는 임신 및 출산 기록 데이터를 활용하여 담뱃세와 임신기간 중 흡연, 그리고 출산아의 체중과의 관계를 분석하고자 한다. 이를 위해 담뱃세를 도구변수로 하여 담뱃세가 임신기간 중 흡연자에게 미치는 영향과 그로 인한 출산아 체중의 변화를 확인한다.
Data
분석을 위해 출산아 센서스 조사인 The Natality Detail File(National Center for Health Statistics, 1992a,b, 1993, 1994) 이 사용되었다. 흡연에 대한 조사가 없어 1989년 이전 데이터는 제외했고, 몇몇 주들은 지속적으로 흡연에 대한 조사를 하지 않았고, 해당 주들은 전체 출생아의 24%를 차지했다. 분석 당시 데이터가 1992년까지 밖에 없었기 때문에 사용된 데이터의 기간은 1989년부터 1992년까지의 데이터이다. 추가적으로 임신기간이 약 9개월이기 때문에 해당 기간을 고려하여 분석 범위를 1988년 6월에 임신한 경우부터 1992년 8월에 출산한 경우까지로 설정했다. 또한 산모의 나이를 15세~44세로 제한했다. 그 결과 해당 기간 동안 출산된 1.6천만 명의 아이 중1.05천만 명의 아이가 표본에 포함되었다. Natality 데이터는 크게 인구통계학 변수, 사회경제적 대리변수, 건강 관련 습관으로 구분된다. 출산아의 체중은 gram 단위의 연속형 변수로 사용되었다. 흡연 설문의 경우 먼저 흡연 여부를 묻고 흡연을 한다고 대답했다면 하루 평균 흡연량을 질문했다. 선행연구 결과 흡연 여부에 대해 과소응답을 하는 경우가 발생하지만 청소년에 비해 성인 응답자는 비교적 과소응답 비중이 크지 않은 것으로 나타났다. 담뱃세와 관련된 데이터는 The Tax Burden on Tobacco 데이터를 활용했다. 물가상승률을 고려하기 위해 소비자물가지수를 통해 월별 가치를 조정했다.
Design
분석은 3개의 모형을 3개의 종속변에 적용하여 총 9개의 모형을 구성했다. 종속변수는 (1) 전체 출산아, (2) 저체중에 해당하는 출산아, (3) 매우 심한 정체중에 해당하는 출산아로 나누었다. 모형 (1)은 나이, 인종, 출산아의 성(sex), 주(state), 담뱃세 비율 변수가 포함되었다. 모형 (2)는 추가적으로 산모의 결혼 여부, 교육수준, 출산의 동등성 고정효과, Kessner Index 등 사회경제적 변수를 포함시켰다. 모형 (3)은 임신기간 중 체중변화를 포함시켰다.
본 분석은 2SLS 도구변수 기법을 활용하였고 담뱃세를 도구변수로 하여 담뱃세가 임산부 흡연 습관에 미치는 영향을 추정한 후 임산부의 흡연습관이 출산아 체중에 미치는 영향을 추정했다. 먼저 1단계 담뱃세가 임산부 흡연량에 미치는 영향을 OLS와 Probit으로 분석한 결과 담뱃세는 임산부의 흡연습관에 영향을 주는 것으로 나타났다. 분석결과에 따르면 1센트의 담뱃세 증가는 0.08%p의 흡연(범주형) 감소로 이어지는 것으로 나타났다. 하지만 담뱃세가 오를 경우 다른 주로 이동해서 담배를 구매하는 행태가 발생한다는 선행연구가 있어, 이를 통제하기 위해 카운티를 중심으로 일정 거리 내에 다른 주의 카운티가 있을 경우 1로 코딩하는 더미 변수 C와 해당 지역의 담뱃세가 관측대상이 살고 있는 지역의 담뱃세보다 낮다면 1로 코딩하는 더미변수 D를 추가했다. 두 변수의 곱을 독립변수로 추가하여 모형을 추정했지만 해당 독립변수는 통계적으로 유의미하지 않은 것으로 나타났다.
1단계 추정을 통해 담뱃세가 흡연양과 부의 관계를 갖는 것을 확인한 후 2단계 추정을 하여 담뱃세가 출산아 체중에 정의 효과를 갖는 것을 확인했다. 전체 출산아를 대상으로 한 모형(1)을 보면 1센트의 세금 증가가 출산아 체중을 0.16g 상승시키는 것으로 나타났고 모형(3) 에서는 0.21g의 효과를 갖는 것으로 나타났다.
통계적 기법
본 분석에서 관심을 갖는 변수들은 종속변수인 출산아의 무게(Y), 임신 기간 중 흡연 수준(S), 임신기간 중 직면한 담뱃세(T)이다. 담뱃세는 주별로 차이가 있기 때문에 주별 담뱃세를 데이터에 포함시켰다. 하지만 주의 담뱃세 수준이 만약 각 주의 특징에서 비롯되는 것이라면 누락변수 편의의 문제가 발생할 수 있다. 이를 통제하기 위해 within-group 패널분석을 사용하여 각 주가 갖는 특징(개체 효과)을 제거하여 불편추정량을 구했다. 이를 방정식으로 나타내면 다음과 같다.
위 식에서 i, s, t는 각각 개인, 주, 시간을 의미하며, X는 인구통계학적 특성, u는 주의 개체효과, v는 시간효과, 𝜖는 오차항이다. S는 흡연여부에 따라 이산형변수로 측정되기 때문에 이를 프로빗 모형으로 추정했고 그 경우 방정식은 다음과 같다.
이 때, 𝜱는 정규누적분포를 의미하며 위의 식(1)을 구하여 세금의 한계효과를 구한다. 𝟇는 정규확률밀도함수를 의미한다. 만약 담뱃세가 흡연량을 감소시키고 체중의 증가를 야기한다면 앞선 두 개의 방정식을 활용하여 흡연이 출산아 체중에 미치는 영향을 추정할 수 있다. 이를 방정식으로 나타내면
이고 beta2는 담뱃세가 도구변수로 활용되었을 때 담뱃세가 출산아 체중에 미치는 간접적인 효과를 추정한 값이 된다. beta2는 담뱃세의 상승이 출산아 체중과 직접적인 상관관계가 없다면 불편추정량을 충족한다.
전체적인 평가와 한계
임신기간 중 흡연과 출산아의 체중이 부의 관계를 갖는다는 것은 과학적으로 밝혀졌지만 그 영향력에 대해서는 아직 논쟁이 있다. 이는 흡연자들이 비흡연자에 비해 갖는 낮은 할인율 때문으로, 흡연자는 미래에 가치를 더 작게 평가하기 때문에 흡연 외에도 다른 나쁜 습관을 갖고 있어 흡연의 출산아 체중에 대한 영향력을 정확하게 추정하기 어렵기 때문이다. 본 연구는 담뱃세를 이용하여 흡연이 출산아 체중에 미치는 영향력을 다른 기타 요인들로부터 분리하였다는 데에 그 의의가 있다. 분석결과 모형(1)에 따르면 임신기간 중 흡연은 평균적으로 출산아 체중을 356g 감소시키는 것으로 나타났고, 모형(2)와 (3)에서는 더 크게 영향을 주는 것으로 나타났다.