대한내분비학회

메뉴 보기

메뉴 닫기


건강보험심사평가원, HIRA (https://opendata.hira.or.kr/home.do)
국민건강보험공단, NHIS (https://nhiss.nhis.or.kr/bd/ab/bdaba001cv.do)
국민건강영양조사, KNHANES (https://knhanes.kdca.go.kr/knhanes/main.do)

우리나라 전국민의 97%는 국민건강보험에 가입되어 있으며, 이들 중 대부분은 1년에 1회 이상 병원 진료를 받습니다.
이 데이터는 모두 건강보험심사평가원으로 모이게 되며, 요양급여 지급에 대한 심사결과와 함께 국민건강보험공단으로 전달되게 됩니다.
결론적으로 전 국민이 요양급여가 인정되는 진료를 받게 되면, 이 데이터는 모두 국민건강보험공단, 건강보험심사평가원에 저장되게 되는 것입니다.

국민건강보험공단과 건강보험심사평가원은 이 데이터를 연구자들에게 공개하여, 누구나 연구계획서와 최소한의 수수료만 있으면 연구를 할 수 있도록 지원하고 있습니다. 각각의 데이터들은 모두 고유의 명확한 장단점을 가지고 있기 때문에, 연구 목적에 따라 데이터의 특성을 잘 이해하고 연구에 임해야만 제대로 된 연구결과를 얻을 수 있습니다.

추가로 위 데이터들과는 별개로 정책 목적으로 국민 전체인구 중 표본을 선정하여 검사, 신체검진, 설문조사 및 영양조사 자료를 수집한 국민건강영양조사 데이터가 있습니다. 표본 데이터이기에 숫자는 많지 않지만, 다양한 검사 결과 및 검진/설문 조사결과들을 얻을 수 있습니다.

건강보험심사평가원 (HIRA)

건강보험심사평가원, HIRA (https://opendata.hira.or.kr/home.do)

건강보험심사평가원은 내부적으로 보유하고 있는 진료 내역, 의약품, 의료자원 정보 등에 관한 3조 건(약 200TB) 정도의 보건의료 빅데이터를 바탕으로 구축한 개방 데이터베이스를 ‘보건의료빅데이터개방시스템’을 통해 공개하고 있습니다. 공공데이터, 의료빅데이터분석, 의료통계분석 등을 통하여 다양한 연구에 이용할 수 있습니다. 전체 자료 중 맞춤형 데이터 및 표본 샘플 데이터 모두 사용이 가능합니다.
건강보험심사평가원의 표본 샘플 데이터는 2009년부터 2018년(2019년 제공여부 미확인)까지 데이터를 제공하며 년도별 4가지 타입으로 구분하여 제공합니다. 해당 데이터들은 크기가 작아 처음 연구를 시작할 때 사용하기 좋고 매년 개별적으로 표본추출을 하므로 종단연구 보다는 단면조사연구에 적합합니다.


  •   • 입원환자데이터셋: 입원환자 추출비율 13%(약 100만명)의 자료
  •   • 전체환자데이터셋: 전체환자 추출비율 3%(약 140만명)의 자료
  •   • 고령환자데이터셋: 고령환자(만65세이상) 추출비율 20%(약 100만명)의 자료
  •   • 소아청소년환자데이터셋: 소아청소년환자(만20세미만) 추출비율 10%(약 110만명)의 자료
  •   * 2017년부터는 전체환자데이터셋 3%는 그대로 유지하고, 나머지 데이터셋은 추출규모를 10%로 통일하여 제공

건강보험심사평가원의 데이터는 명세서일반내역, 원내진료내역, 전체상병내역, 원외처방내역, 요양기관정보 총 5개의 테이블로 구성되어 있으며 심평원에서는 각 테이블별 변수항목들을 상세히 확인할 수 있도록 가이드 파일을 제공하고 있습니다.


  •   • 명세서일반내역: 연령, 성별, 진료과, 방문일, 주/부상병, 산정특례 정보 등
  •   • 원내진료내역: 진료비, 처방료, 검사료, 시술/수술코드 등
  •   • 전체상병내역: 주/부상병을 포함한 모든 상병정보
  •   • 원외처방내역: 원외로 처방된 약물의 정보 및 처방일수, 수량정보
  •   • 요양기관정보: 종별정보(의원,병원,상급종합병원,보건소 등), 시도정보, CT/MRI보유여부 등

서비스 개발에 쉽고 편리하게 활용할 수 있도록 병원진료정보, 병원정보, 약국정보 등 일부 데이터를 Open API로 제공하기도 합니다. 아울러 약제와 관련된 부가적인 정보들도 제공하며 의약품 안전 사용, 의약품 사용 및 유통 정보를 제공하며 의료행위별 심사기준 정보, 의료행위 분류별 진료규모 정보와 같은 진료의 적정성 평가에 대한 자료 및 비급여 항목 정보(수가, 유형 등), 기관별 비급여 가격 정보와 같은 일부 비급여 항목에 대한 자료도 제공합니다.


출처: 보건의료빅데이터개방시스템 시스템소개
   보건의료빅데이터개방시스템 환자표본자료신청안내
   보건의료빅데이터개방시스템 Open API 이용안내
   보건의료빅데이터개방시스템 Open API 목록
   보건의료빅데이터개방시스템 데이터 소개

국민건강보험공단 자료 (NHIS)

국민건강보험공단, NHIS (https://nhiss.nhis.or.kr/bd/ab/bdaba001cv.do)

국민건강보험공단
은 국민건강정보 자료를 활용한 정책 수립 및 학술적 연구 등을 위하여 국민건강보험공단 자료 공유서비스를 운영하고 있습니다. 국민건강보험공단 자료 공유서비스 홈페이지에서 전 국민의 자격 및 보험, 병의원 이용내역, 국가건강검진결과, 진료내역, 노인장기요양보험 자료, 요양기관 현황, 암 및 희귀난치성질환자 등록정보 등 1조 3천억 건의 데이터가 있으며 2002년도부터의 자료를 이용할 수 있습니다. 국민건강보험공단 자료는 비급여 항목에 대한 자료는 파악할 수 없는 제한점은 존재합니다. 국민건강보험자료 공유서비스 홈페이지 국민건강정보DB에서 연구 가능한 자료로 표본연구 DB 및 맞춤형연구 DB가 제공됩니다.

기본적인 건강보험심사평가원 데이터에 사망기록, 검진기록(40세이상 성인검진, 직장여성검진, 영유아검진 제공; 전국민 검진기록이 아닌 일부 대상자에 국한된 데이터), 소득분위까지 포함한 데이터입니다.

국민건강보험공단 데이터 자체에는 사망기록(사망원인 제외)이 제공되고 있고, 사망원인 관련 연구는 국민건강보험공단 에 데이터 신청시 통계청에 사망데이터(사인정보)를 함께 신청하면 국민건강보험공단에서는 통계청에서 제공받은 사망데이터(사인정보)를 결합하여 제공하고 있습니다.

맞춤형연구 DB
  •    • 맞춤형연구 DB는 공단이 수집하고 보유 및 관리하고 있는 건강보험 및 장기요양보험 자료를 정책과 연구용으로 활용할 수 있도록 신청자의 연구목적에 따라 추출 후 정보주체를 알아볼 수 없도록 가공한 데이터 셋입니다.
  •    • 맞춤형연구 DB는 외부 반출이 불가능 하며 열람 및 연구 분석할 수 있는 PC가 설치된 공단 본부 또는 지역본부 내 장소인 빅데이터 분석센터에서 통계 분석 툴(Tool)로 제공되는 자료로 열림과 분석이 가능하고 분석 후의 통계표만 반출이 가능합니다. 개인 연구자에게는 제한점이 있습니다.
표본연구 DB
  •    • 표본 코호트 DB, 건강검진 코호트 DB, 노인 코호트 DB, 영유아검진코호트DB, 직장여성코호트 DB의 총 5종의 데이터 셋을 제공하며 전국민 건강보험 빅데이터를 기반으로 연구에 많이 쓰이는 데이터를 표본 추출 및 비식별화 후 정책과 연구용으로 데이터를 제공하기 위해 규격화하였습니다. 표본코호트 DB는 구축기간 2002~2015까지 14개년도의 전 국민을 대표하는 약 100만 명의 자료를 받을 수 있다. 건강검진코호트 DB는 만40-79세의 건강검진 수검자 중심으로 의료이용, 검진결과를 분석할 수 있습니다.
  •    • 표본연구 DB의 경우 온라인상에서 신청서 작성 후 필요한 서류를 첨부하여 신청하고 공단 내의 장소인 “빅데이터 분석센터”에 방문하지 않고 원격으로 연구를 수행할 수 있습니다. 용량이 크지 않기에 연구자들이 쉽게 접근할 수 있는 DB입니다.

출처 : 국민건강보험자료 공유서비스
   국민건강보험자료 공유서비스 용어설명

국민건강영양조사 (KNHANES)

국민건강영양조사, KNHANES (https://knhanes.kdca.go.kr/knhanes/main.do)


‘국민건강영양조사’는 ‘국민영양조사’(1969년 도입)와 ‘국민건강 및 보건의식행태조사’(1971년 도입)를 통합하여 1995년도의 국민건강증진법 제정 이후 1998년부터 시작되었으며 지금까지 제7기 조사가 실시되었고 현재 제8기(2016-2021)조사가 진행 중에 있습니다. 제1~3기까지는 3년의 간격을 두고 각각 연 2~3개월 동안 실시한 단기조사로 운영되었고, 제4기 1차년도(2007)부터 질병관리청에서 ‘전문조사수행팀’을 구성하여 계절적 편향 없이 매년 통계를 산출 가능한 연중 조사로 진행되고 있습니다.


해당 조사는 국민의 건강 및 영양 상태를 파악하여 정책적으로 우선순위를 두어야 할 건강취약집단을 선별하고, 보건 정책과 사업이 효과적으로 시행되는지를 확인하는데 필요한 통계를 산출합니다. 또한 세계보건기구(WHO)와 경제협력개발기구(OECD) 등에서 요청하는 건강행태 통계자료 중 흡연, 음주, 신체활동, 비만 관련 건강통계도 제공합니다.


‘국민건강영양조사’는 매년 192개 지역의 25가구를 확률표본으로 추출하여 만 1세 이상 가구원 약 1만 명을 조사합니다. 대상자의 생애주기별 특성에 따라 소아(1~11세), 청소년(12~18세), 성인(19세 이상)으로 나누어, 각각 특성에 맞는 조사항목을 적용합니다. 조사 분야는 검진조사, 건강설문조사, 영양조사이며 2019년도 제 8기 1차년도 조사 기준으로 조사내용은 아래와 같습니다.


조사분야 조사내용
검진조사 비만, 고혈압, 당뇨병, 이상지질혈증, 간질환, 신장질환, 빈혈, 폐질환, 구강질환, 근력, 안질환, 이비인후질환
건강설문조사 가구조사, 흡연, 음주, 비만 및 체중조절, 신체활동, 이환, 의료이용, 예방접종 및 건강검진, 활동제한 및 삶의 질, 손상(사고 및 중독), 안전의식, 정신건강, 여성건강, 교육 및 경제활동, 구강건강
영양조사 식품 및 영양소 섭취현황, 식생활행태, 식이보충제, 영양지식, 식품안정성, 수유현황, 이유보충식
검사
(연도별 항목 상이)
FBS, PP2, HbA1c, Insulin, Total cholesterol, HDL, LDL, TG, 간염 항체, AST/ALT, rGTP, Hb, Hct, Ferritin, Fe, TIBC, BUN/Cr, WBC, RBC, platelet, Folate, VitA, VitE, VitD, ALP, PTH, hsCRP, Uric acid, Pb, Hg, Cd, Mn, Ni, Zn, TFT, 폐기능검사, 골밀도 검사 등

‘국민건강영양조사’자료는 무료로 이용 가능하며 홈페이지에서 회원가입 후 원시자료를 다운받을 수 있습니다. 자료의 데이터 양이 적어 SPSS 프로그 램으로 분석 가능해 접근하기가 쉽고 단면조사연구에 적합하며, 가중치 적용을 통해 전체 인구 대상으로 추정하여 분석이 가능합니다. 매년 확률표본으로 추출한 대상에 대한 조사가 이루어지기 때문에 단면조사연구가 가능하지만 상관관계는 알 수 있어도 인과관계의 규명이 어렵습니다. 질병 진단코드 및 처방 정보도 알아내기 어렵다는 단점이 있습니다.


출처 : 질병관리청 국민건강영양조사


HIRA와 NHIS data의 차이


NHIS_data와 HIRA_data 두 데이터베이스는 비슷하면서도 차이가 있기 때문에 두 데이터를 정확히 이해하는 것이 필요합니다.
특히, 변수 특성, 분석센터 방문분석, 원격분석, 데이터 소유 가능여부 등 데이터에 접근하는 방식이 상이하고 데이터 활용시 비용과 시간에 차이가 있기 때문에 효율적인 분석을 위해서는 나의 연구설계에 맞는 데이터를 선정하는 것이 중요합니다.
쉽게 표현하자면 NHIS_data는 HIRA_data에 사망기록(사인포함), 검진기록(일부), 소득분위까지 포함한 데이터입니다.


건강보험심사평가원자료에도 원내에서 사망한 경우 진료종결 코드를 사망으로 체크할 경우에 한하여 사망정보를 확인할 수 있습니다. 그러나 모든 사람이 병원에서 사망하는 것이 아니고, 원내에서 사망하였을 경우에도 진료종결 코드를 누락하는 경우가 있어 100% 사망기록를 확인할 수 있는 것은 아닙니다.


본인이 하고자 하는 연구에 사망기록, 소득분위, 검진기록(일부)가 필요하다면 NHIS_data(건보)를 선택하여야 연구가 가능합니다.
또한 NHIS_data 중에서도 질환, 약제가 희귀하다거나 많은 샘플 수의 확보가 필요하다면 맞춤형 데이터를, 그렇지 않다면 표본 코호트를 활용하는 것이 효율적입니다.

그리고 연구분야가 환자나 질환의 연속성이 필요하지 않은 비용분석 연구 혹은 질환 혹은 처방 트랜드 변화에 대한 연구라면 HIRA_data중 환자데이터셋을 구매하여 연구하는 것이 보다 효율적일 것입니다.

그래서 HIRA_data 보다는 NHIS_data를 활용한 연구 건수가 많습니다.

NHIS_data와 HIRA_data는 임상 연구목적으로 생성된 데이터가 아니라 청구목적의 데이터이기 때문에 의료행위의 다양한 임상결과값이 존재하지 않습니다. 결과값은 청구범위에 해당하지 않기 때문입다. 또한 비급여 의료행위에 대한 기록이 제공되지 않습니다.

HIRA_data와 NHIS_data 모두 샘플데이터와 전수(맞춤형)데이터 형식으로 데이터를 제공합니다.
전수(맞춤형)데이터의 경우 연구목적에 한정된 변수를 제공하고 있으며, Raw값을 제공하는 것이 아니라 연구설계에 따른 결과값만 반출할 수 있도록 되어 있습니다. 결국 데이터의 소유권은 인정하지 않습는다.


전수(맞춤형)데이터를 분석하기 위해서는 각 기관에서 운영하는 분석센터를 방문하여 분석하거나, 경우에 따라서 원격으로 데이터에 접근하여 본인의 연구실에서도 분석이 가능합니다.

EnM 연구사례

HIRA data 논문
1.  Park JS, Descriptive Epidemiology and Survival Analysis of Prolactinomas and Cushing's Disease in Korea, Endocrinol Metab (Seoul). 2021 Jun;36(3):688-696.
2.  Seo GH, Incidence and Prevalence of Overt Hypothyroidism and Causative Diseases in Korea as Determined Using Claims Data Provided by < the Health Insurance Review and Assessment Service, Endocrinol Metab (Seoul). 2015 Sep;30(3):288-296.
NHIS data 논문
1.  Baek YH, 10-Year Fracture Risk in Postmenopausal Women with Osteopenia and Osteoporosis in South Korea, Endocrinol Metab (Seoul). 2021 Dec;36(6):1178-1188.
2.  Kim KW, Risk of Diabetes in Subjects with Positive Fecal Immunochemical Test: A Nationwide Population-Based Study, Endocrinol Metab (Seoul). 2021 Oct;36(5):1069-1077.
3.  Koo BK, Cardiovascular Outcomes of Obesity According to Menopausal Status: A Nationwide Population-Based Study, Endocrinol Metab (Seoul). 2021 Oct;36(5):1029-1041.
4.  Lee SH, Frequency of Exposure to Impaired Fasting Glucose and Risk of Mortality and Cardiovascular Outcomes, Endocrinol Metab (Seoul). 2021 Oct;36(5):1007-1015.
5.  Jung I, The Effects of Glucose Lowering Agents on the Secondary Prevention of Coronary Artery Disease in Patients with Type 2 Diabetes, Endocrinol Metab (Seoul). 2021 Oct;36(5):977-987.
6.  Kim KS, The Clinical Characteristics of Gestational Diabetes Mellitus in Korea: A National Health Information Database Study, EndocrinolMetab (Seoul). 2021 Jun;36(3):628-636.
7.  Cho Y, Cumulative Exposure to Metabolic Syndrome Components and the Risk of Dementia: A Nationwide Population-Based Study, Endocrinol Metab (Seoul). 2021 Apr;36(2):424-435
8.  Ji W, Overweight and Obesity are Risk Factors for Coronavirus Disease 2019: A Propensity Score-Matched Case-Control Study, Endocrinol Metab (Seoul). 2021 Feb;36(1):196-200.
9.  Seo DH, Effect of Teneligliptin versus Sulfonylurea on Major Adverse Cardiovascular Outcomes in People with Type 2 Diabetes Mellitus: A Real-World Study in Korea, Endocrinol Metab (Seoul). 2021 Feb;36(1):70-80.
10. Roh YK, Variabilities in Weight and Waist Circumference and Risk of Myocardial Infarction, Stroke, and Mortality: A Nationwide Cohort Study, Endocrinol Metab (Seoul). 2020 Dec;35(4):933-942.
11. You JH, Clinical Outcomes of COVID-19 Patients with Type 2 Diabetes: A Population-Based Study in Korea, Endocrinol Metab (Seoul). 2020 Dec;35(4):901-908.
12.  Ahn HY, Trends in the Diagnosis and Treatment of Patients with Medullary Thyroid Carcinoma in Korea, Endocrinol Metab (Seoul). 2020 Dec;35(4):811-819.
13.  Lee SH, Predicting the Development of Myocardial Infarction in Middle-Aged Adults with Type 2 Diabetes: A Risk Model Generated from a Nationwide Population-Based Cohort Study in Korea, Endocrinol Metab (Seoul). 2020 Sep;35(3):636-646.
14. Koh JW, Effects of Systemic Glucocorticoid Use on Fracture Risk: A Population-Based Study, Endocrinol Metab (Seoul). 2020 Sep;35(3):562- 570.
15. Jung I, The Prevalence and Risk of Type 2 Diabetes in Adults with Disabilities in Korea, Endocrinol Metab (Seoul). 2020 Sep;35(3):552-561.
16. Kim JH, Epidemiology and Prognosis of Pheochromocytoma/Paraganglioma in Korea: A Nationwide Study Based on the National Health Insurance Service, Endocrinol Metab (Seoul). 2020 Mar;35(1):157-164
17. Kim JA, Impact of the Dynamic Change of Metabolic Health Status on the Incident Type 2 Diabetes: A Nationwide Population-Based Cohort Study, Endocrinol Metab (Seoul). 2019 Dec;34(4):406-414.
18. You JH, Trends in Hyperglycemic Crisis Hospitalizations and in- and out-of-Hospital Mortality in the Last Decade Based on Korean National  Health Insurance Claims Data, Endocrinol Metab (Seoul). 2019 Sep;34(3):275-281.
19. Kwon H, Prevalence and Annual Incidence of Thyroid Disease in Korea from 2006 to 2015: A Nationwide Population-Based Cohort Study,  Endocrinol Metab (Seoul). 2018 Jun;33(2):260-267.
20. Song SO, Trends in Diabetes Incidence in the Last Decade Based on Korean National Health Insurance Claims Data, Endocrinol Metab  (Seoul). 2016 Jun;31(2):292-299.
KNHANES 관련 논문
1.  Kim HM, The Leg Fat to Total Fat Ratio Is Associated with Lower Risks of Non-Alcoholic Fatty Liver Disease and Less Severe Hepatic Fibrosis: Results from Nationwide Surveys (KNHANES 2008-2011), Endocrinol Metab (Seoul). 2021 Dec;36(6):1232-1242.
2. Choi JY, Evaluation of Iodine Status among Korean Patients with Papillary Thyroid Cancer Using Dietary and Urinary Iodine, Endocrinol Metab (Seoul). 2021 Jun;36(3):607-618.
3.  Kim M, Association between Serum Free Thyroxine and Anemia in Euthyroid Adults: A Nationwide Study, Endocrinol Metab (Seoul). 2020 Mar; 35(1):106-114.
4.  Yu TY, Association between Bone Mineral Density and Albuminuria: Cross-Sectional Analysis of Data from the 2011 Korea National Health and Nutrition Examination Survey V-2, Endocrinol Metab (Seoul). 2018 Jun;33(2):211-218.
5. Hong JW, Association between White Blood Cell Counts within Normal Range and Hemoglobin A1c in a Korean Population,Endocrinol Metab (Seoul). 2018 Mar;33(1):79-87.
6.  Ko KM, Association between Body Weight Changes and Menstrual Irregularity: The Korea National Health and Nutrition Examination Survey 2010 to 2012, Endocrinol Metab (Seoul). 2017 Jun;32(2):248-256.
7.  Kim WG, Thyroid Stimulating Hormone Reference Range and Prevalence of Thyroid Dysfunction in the Korean Population: Korea National Health and Nutrition Examination Survey 2013 to 2015, Endocrinol Metab (Seoul). 2017 Mar;32(1):106-114.
8.  Ahn HJ, Urinary Albumin Excretion Reflects Cardiovascular Risk in Postmenopausal Women without Diabetes: The 2011 to 2013 Korean National Health and Nutrition Examination Survey, Endocrinol Metab (Seoul). 2016 Dec;31(4):537-546.
9.  Lee DH, Characterization of Patients with Type 2 Diabetes according to Body Mass Index: Korea National Health and Nutrition Examination Survey from 2007 to 2011, Endocrinol Metab (Seoul). 2015 Dec;30(4):514-521.
10.  Lee J, Age-Related Changes in the Prevalence of Osteoporosis according to Gender and Skeletal Site: The Korea National Health and Nutrition Examination Survey 2008-2010, Endocrinol Metab (Seoul). 2013 Sep;28(3):180-191.
11.  Kang JH, Adiposity in the Relationship between Serum Vitamin D Level and Insulin Resistance in Middle-Aged and Elderly Korean Adults: The Korea National Health and Nutrition Examination Survey 2008, Endocrinol Metab (Seoul). 2013 Jun;28(2):96-102.

TOP

SNS
instagram facebook twitter
PC버전
대한내분비학회

Copyright ⓒ The Korean Endocrine Society. All rights Reserved

[04146] 서울특별시 마포구 마포대로 109 롯데캐슬프레지던트 101동 2503호
  • 사업자 등록번호 : 106-82-31113
  • 대표자 성명 : 정윤석
  • Tel : 02-714-2428 | Fax : 02-714-5103 | E-mail : endo@endocrinology.or.kr