[Data Integration] 한국의료패널 조사 자료 연계 구축 고도화 및 활용 연구
2020.07.07 ~ 2021.01
본 프로젝트에서는 한국의료패널 조사자료와 국민건강보험공단 행정자료와의 연계를 고도화하였고, 수기작업에 많이 의존한 기존 연계를 분류모형의 알고리즘으로 자동화에 기여하였다. 알고리즘은 각 변수의 유사도에 기반하며, Jaccard 지수 등을 사용하였다. 이 연계자료는 완전성 있는 의료정보를 제공할 수 있기에, 이를 공공기관과 민간에서 활용하여 다양한 통계지표 생산에 기여할 수 있을 것으로 생각된다.
그리고 정합성이 제고된 연계자료로부터 ‘가구원당 비급여’ 혹은 ‘가구당 비급여 본인부담금’을 추정하기 위해 행정자료에 캘리브레이션(Calibration) & 레이킹(Raking) 방법을 적용하여 훈련 데이터를 확보하였다. 확보된 훈련 데이터로 머신러닝 모델을 학습하여 비급여 본인 부담금을 추정하였다. 이를 통해 가구원 혹은 가구 특징에 따라 의료보장률을 파악할 수 있고, 정책적 활용도가 높을 것으로 기대된다.
Period: 2020.07.07 ~ 2021.01.06
Category: Data Integration
Keywords: #Record_Linkage, #Imputation