세미나

세미나

제목2019 겨울 계량경제 세미나 2주차 후기2019-01-17 19:07:59
작성자 Level 1

2019 겨울 계량경제 세미나 2주차 후기


일시 및 장소: 2019. 1. 17. (목) 14:00 - 16:20, 보건대학원 221-429

참석자: 김태환, 문주현, 박수경, 송연재, 윤성훈, 이동규 

범위: 「Mastering Metrics」 2장 Regression 


  안녕하세요. 2019 겨울 계량경제 세미나 2주차 후기를 남기러 온 석사 2학기 송연재입니다. 겨울방학 계량경제 세미나는 6주라는 시간 동안 계량경제에 대한 이해를 빠르고 인텐시브하게 높일 수 있도록 이동규 선생님의 지도편달 하에 이루어지고 있습니다. 황금 같은 목요일 오후 시간에, 관악산 칼바람을 뚫고 올라와 다들 열심히 공부하고 있으며 부족했던 부분을 서로 채워넣어주고 있습니다.


  오늘은 Mastering Metrics의 2장 회귀분석에 대해서 박수경 선생님께서 발제해주셨습니다. 저는 아직 계량경제학 수업을 듣지 않아서 계량경제에 대한 이해가 거의 없는 수준인데도 선생님께서 눈높이 맞춤형 발제로 알기 쉽게 설명해 주셔서 잘 이해할 수 있었던 것 같습니다. 특히 이 책의 2장에서는 회귀의 핵심 콘텐츠로서 매칭, 회귀모형, OVB, 민감도 분석을 다루고 있었는데요. 먼저 선생님께서 근로소득에 영향을 주는 다른 조건이 동일하다면 사립대학학위가 근로소득에 미치는 인과효과를 알 수 있다는 가정을 세운 연구 사례를 통해 설명을 시작하셨습니다. 그러나 근로소득에는 부모의 소득, 가계의 소득분위, 성별, 인종 등 통제할 변수가 많고 정량화도 어려워 분석에 어려움을 겪을 수 있다는 점을 설명해주셨습니다.


  그 다음에는 회귀모형에 대해 설명해주셨는데 회귀모형은 '자동화된 짝짓기 도구'로서 이것의 핵심구성요소로는 종속변수, 처치변수, 통제변수, 절편, 처치의 인과효과, 통제변수의 효과가 있고 이러한 처치변수와 통제변수, 종속변수의 선택을 하는 것은 모델링을 실제로 하게 되는 연구자의 몫이라고 하셨습니다. 문주현 선생님께서 이러한 변수의 선택에 있어서 어떠한 것을 참고해야 하며, 기준을 어떻게 잡아야하는지 질문해주셨습니다. 김태환 선생님께서는 통제할 변수를 선택하는데 있어서는 선행연구들에 대한 꼼꼼한 문헌고찰이 매우 중요하며 기존에 나와 있는 이론들을 참고하여 연구의 편의를 줄이려 노력해야 한다고 조언해주셨습니다. 따라서 좋은 연구를 하기 위해서는 이론적인 기반을 탄탄하게 해야겠다는 생각이 들었습니다. 


  OVB에 대해서도 설명해주셨는데, 이것은 회귀분석을 할 때 '다른 조건이 정말 동일한가?'라는 질문을 하는 것에서부터 시작한다고 하셨습니다. 모형을 분석할때 중요한 변수가 빠질 수도 있다는 겁니다. 따라서 OVB에 대해서 주의깊게 생각하는 게 계량분석에 필요한 일이며, 이것을 이용해서 이러한 변수들을 누락하였을 때 생길 수 있는 결과에 대해 근거 있는 추측을 할수 있다는 점도 깨달았습니다. 다음은 민감도 분석이었는데요. 주어진 일련의 통제변수들이 선택 바이어스를 제거하기에 충분한지에 대해 확신할 수 없기 때문에 회귀결과가 통제변수들의 목록이 달라짐에 따라 얼마나 민감하게 달라지는지 질문하는 게 중요하다는 것을 알게되었고 강건한(ROBUST!) 회귀모형 추정을 하는 게 중요하다는 것을 알게 되었습니다. 김태환 선생님께서 회귀분석을 했을 때도 왜 바이어스가 생길 수 있는가에 대해서 질문을 해주셨고, 이동규 선생님께서 선택 자체에서 발생하는 선택 편의와 OVB로 인한 편의가 생길 수 있어서라고 설명해주셨습니다.


  발제의 마지막으로 논문 하나에 대해 생각해보고 토론하는 시간을 가졌습니다. 의료기관의 간호사 확보수준이 수술환자의 사망, 패혈증, 요로감염, 폐렴에 미치는 영향에 관한 논문이었습니다. 해당 논문은 국민건강보험 의료이용 자료를 바탕으로 했으며, 연구결과로 간호사 확보수준이 낮아지면 사망자, 폐렴, 패혈증, 요로감염자의 비율이 큰폭으로 증가했고, 통계적으로 유의하다고 하였습니다. 해당 논문은 이동규 선생님께서 소개해주시고, 박수경 선생님께서 논문의 핵심내용과 연구결과에 대해 잘 설명해주셨는데, 이동규 선생님께서는 논문을 가져온 이유로서 두 분 간호사 선생님들께서 공감을 하실 만한 주제이고, 또 논문의 회귀분석결과에서 우리가 발견할 만한 문제점이 있어서 이 논문을 가져오셨다고 설명해주셨습니다. 따라서 다같이 이 논문의 분석결과에서 어떤 문제가 있었는지에 대해 토론하였는데, 윤성훈 선생님께서 분석결과 표에서 상병을 구분하지 않고 중증도로만 변수를 잡고 분석했다는 점이 문제가 있었던 것 같다는 의견을 말씀해주셨고, 문주현 선생님께서 간호사 인력수 뿐만 아니라 의료기관 내 다른 인프라, 의사 인력 등과도 유의한 상관관계가 있을 수 있었을 것 같다고 의견주셨습니다. 김태환 선생님께서는 통제변수로 잡은 사회경제적 변수들의 이론적 근거에 대한 설명이 부족한 것 같다고 의견을 주셨습니다. 실제로 논문에 나오는 분석결과를 가지고 회귀에 대해서 생각해보니까 더 피부에 와닿는 설명이었고 더 잘 이해할수 있었던 것 같습니다.


  마지막 약 40분동안은 SAS를 활용한 실습을 진행했는데요. 이동규 선생님께서 직접 데이터를 공유해주셔서 SAS 프로그램에 데이터를 불러오고, 변수 설정을 하였습니다. 또 매크로, SQL문, 그리고 변수를 합치는 방법도 공유해주셨고 마지막으로 회귀모형을 돌려보는 것까지 실습할 수 있었습니다. 저는 1학기 보건통계학개론 시간에 짧게나마 SAS를 배웠긴 하지만, 거의 1년만에 SAS를 다뤄보는 거라 살짝 겁이 나서 처음엔 식은땀이 흘렀지만 이동규 선생님께서 친절하게 차근차근 알려주셔서 안도의 한숨을 쉴 수 있었습니다. 덕분에 다들 막힘없이 실습을 진행할 수 있었고, 중간 중간 잘 되지 않는 부분에 대해서는 박사과정 선생님들께서 잘 지도해주셔서 잘 따라갈 수 있었습니다. 또 공단데이터의 특징에 대해서도 상세히 설명해주셔서 더 좋았던 것 같습니다.


  다음주에는 도구변수(IV)에 대해서 발제해주실 예정이고, 계량경제에 대한 더 깊은 이해를 할 수 있는 시간이 되었으면 좋겠습니다. 감사합니다. :)

댓글

(자동등록방지 숫자를 입력해 주세요)