HomeAbout
Causal Inference
인과추론 다섯번째 - 회귀단절(Regression Discontinuity, RD)
경윤영
July 12, 2022
3 min

인과추론 - 회귀단절

들어가기 앞서

인과효과를 추정하는 방법 벌써 5번째 글이네요! 이번에는 회귀단절에 관한 이야기 입니다.

우리는 인과효과를 추정하기 위해 다양한 방법을 사용합니다. 대표적으로 회귀분석, 도구변수 등이 있죠!! 오늘 소개해 드릴 방법은 회귀단절(Regression Discontinuity)입니다. 이번 기회를 통해 회귀단절은 언제, 어떻게 사용하는지 살펴보고, 회귀분절이 사용된 예시를 소개드리고자 합니다.

회귀단절이란?

회귀단절이란 무엇일까요? 인과추론의 토대가 되는 것은 무작위 배정이라는 것을 다들 아시고 계실거에요. 하지만 우리가 살고 있는 사회는 무작위 배정이 일어나는 상황보다는 인위적으로 만들어지는 사회 제도나 요인들을 찾기 쉽습니다. 이때 우리는 인과효과를 추정하기 위해 무작위 배정에 준하는 방법인 회귀단절이라는 방법론을 사용합니다. 회귀단절을 쉽게 말씀드리자면 두 집단간 차이가 존재하는가?를 살펴보는 방법론입니다. 두 집단을 무작위로 뽑아 구성했다면, 두 집단은 통계적으로 동일한 특성을 가졌다고 볼 수 있기 때문입니다. 즉, treatment group과 control group 두 개의 집단간 통계적으로 의미있는 차이가 존재하는지를 분석한다고 보시면 됩니다.

회귀단절이 사용된 연구를 살펴보시면 아시겠지만, 회귀단절 모형은 특정 제약 조건이 정해지는 경우에 많이 사용합니다. 진행되었던 연구들을 예로 들면 “법적 최소 음주 연령 제한이 연령에 따른 사망률에 영향을 미칠까?” , “학급 규모를 줄이면 학생들의 성적이 향상될까” “장학금을 받은 학생의 학업 성적이 더 오를까” , “대학 진학 여부가 소득에 영향을 미칠까” 와 같은 것들이 있습니다.

회귀단절은 어떻게 인과효과를 추정할까요?

하나의 결정으로 인해 생기는 경계값으로부터 일정한 범위를 정한 후 treatment group과 control group을 무작위적으로 나뉘게끔 하는 것이 회귀단절의 아이디어입니다.

예를 들어, 장학금을 받은 학생의 학업 성적이 더 오를까?에 대한 연구를 진행해보자고 한다면, 장학금 수혜를 받을 수 있는 기준이 직전학기 평점이 4.0이상 이라는 기준을 세웠을 때 아래와 같은 케이스가 있습니다.

Da={1,a4.00,a<4.0D_a = \left\{\begin{matrix} 1, a\geq 4.0 \\ 0, a< 4.0 \\ \end{matrix}\right.

(1) A: 4.01 vs. B: 3.99 A는 지난학기에 평점 4.01을 받았고 B는 3.99를 받았다고 가정하면, A는 장학금을 받게 되고 B는 받지 못하게 됩니다. 이와 같은 경우 매우 근소한 차이로 장학금의 수혜 여부가 결정되었는데, 이 결정은 무작위적으로 이루어진 것이라 볼 수 있습니다.

(2) C: 4.5 vs. D: 2.5 C는 지난학기에 평점 4.5를 받았고 D는 2.5를 받았다고 하자. 이 경우에는 (1)의 경우와 다르게 C가 장학금을 받은 것이 무작위적으로 결정되었다고 볼 수 없습니다. 이유는 C는 원래부터 D보다 공부를 잘 했을 가능성이 높기 때문이다. 그렇기에 C, D의 성적을 비교하는 것은 무의미합니다.

즉, 장학금 수혜를 결정하는 경계값(평점 4.0 이상)을 정한 후, 일정한 범위를 정하여(경계값 상하 0.01) 그 구간 안에 들어오는 학생의 성적을 비교, 두 학생의 성적 차이를 장학금 수혜의 인과효과로 파악하는 것이 회귀단절이 인과효과를 추정하는 방식입니다.

이렇듯 회귀단절은 내생성을 일으키는 샘플들이 분석에서 제외된다는 장점이 있지만, 샘플의 수가 작으면 추정치의 표준오차가 커지고, 정확도가 낮아진다는 단점이 있습니다. 그렇기에 회귀단절을 사용하실 때는 분석 대상의 범위를 조금씩 변화시켜가면서 추정값을 살펴보셔야 합니다.

회귀단절 방법론

회귀단절 방법론에는 두 가지가 있습니다. 그림에서 보시는 것과 같이 경계값 주위에서 뚜렷하게 구분되면 Sharp 회귀단절이고, 뚜렷하게 구분되지 않으면 Fuzzy 회귀단절이라고 불립니다.

  1. Sharp 회귀단절 방법 Sharp 회귀단절의 인과효과를 나타내는 식은 아래와 같습니다. α=limssˉE[YS]limssˉE[YS]\alpha = \underset{s \downarrow \bar{s}}{lim}E[Y|S] - \underset{s \uparrow \bar{s}}{lim}E[Y|S]

인과효과인 α\alpha 는 두 극한 기댓값이 차이로, limssˉE[YS]\underset{s \downarrow \bar{s}}{lim}E[Y|S] 은 S가 점점 줄어들어 sˉ\bar{s} 경계값으로 수렴할 때의 E[YS]E[Y|S] 의 극한값에서 limssˉE[YS]\underset{s\uparrow\bar{s}}{lim}E[Y|S] 은 S가 점점 증가하여 sˉ\bar{s} 경계값으로 수렴할 때의 E[YS]E[Y|S] 의 극한값을 빼준 것과 같습니다.

회귀단절에서는 반드시 treatment를 받을 확률에 일정한 정도의 불연속성이 존재해야합니다. 그림을 참고하면 경계값은 6으로, 지난 학기 평점이 경계값인 6이상이면 장학금을 받을 확률이 1이고, 6미만이면 받을 확률은 0이 됩니다. 즉, 경계값을 넘어갈 때 불연속성이 발생하며 Sharp 회귀단절은 경계값 주위에서 treatment의 확률이 0에서 1로 바뀌는 상황을 말합니다.

Sharp 회귀단절

  1. Fuzzy 회귀단절 방법 Fuzzy 회귀단절의 인과효과를 나타내는 식은 아래와 같습니다. α=limssˉE[YS]limssˉE[YS]limssˉE[TS]limssˉE[TS]\alpha = \frac{\underset{s \downarrow \bar{s}}{lim}E[Y|S] - \underset{s \uparrow \bar{s}}{lim}E[Y|S]}{\underset{s \downarrow \bar{s}}{lim}E[T|S] - \underset{s \uparrow \bar{s}}{lim}E[T|S]}

인과효과인 α\alpha 는 두 극한 기댓값이 차이인 것은 Sharp 회귀단절과 동일하지만, Fuzzy 회귀단절에서 분모는 경계값 주위에서 발생하는 treatment의 여부가 정해질 확률의 차이가 반영이 됩니다.

이를 장학금 수혜여부에 빗대어 보면 장학금을 받는 것에 있어 직전 학기 평점 및 가정형편이 추가되는 상황에서 가정형편이 좋은 학생의 평점이 장학금을 받는 기준 평점을 만족시킨다 하더라도, 장학금을 받을 확률은 1보다는 작습니다. 그림을 보시면 Sharp와 동일하게 경계값이 6이지만 treatment의 여부가 경계값 주위에서 뚜렷하게 구분되지 않고 불분명하게 구분되는 것을 보실 수 있습니다. 즉, 지난 학기 평점이 6점보다 높으면 장학금을 받을 확률이 1보다 조금 낮고, 6보다 낮으면 장학금을 받을 확률은 0보다는 조금 크게 되는 상황이 발생하는 것입니다.

Fuzzy 회귀단절

추가적으로 회귀단절의 모형이 비선형일때에 대해 간략하게 설명하며 글을 마무리하겠습니다.

  1. 모수추정법 f(Si)=γ1Si+γ2Si2+γ3Si3+etcf(S_i) = \gamma_1S_i + \gamma_2S_i^2 + \gamma_3S_i^3 + etc 위와 같은 비선형식에서 OLS를 적용하여 인과효과 α\alpha 를 추정합니다.

  2. 비모수추정법 경계값 근방의 범위를 선정하고, 범위에 따라 여러 종류의 극한 기댓값을 구하여 인과효과 α\alpha 를 추정합니다.

참고자료

  • https://mixtape.scunning.com/regression-discontinuity.html
  • https://everyday-tech.tistory.com/30
  • https://hyperconnect.github.io/2021/06/07/regression-discontinuity-in-time.html
  • 노동시장 정책 평가방법론 및 다부문 거시산업모형 DB 구축, 한국노동연구원
  • 고수들의 계량경제학, Joshua D. Angrist, Jorn-Steffen Pischke 지음

Tags

#인과추론#회귀단절#계량경제

Share


Related Posts

인과추론 세번째 – 뻔하지만 강력한 무기 회귀분석
2022-01-23
3 min
© 2023, All Rights Reserved.
Powered By

Quick Links

About UsOfficial Page

Social Media