이 학위 논문은 헬스케어 분야에서 환자 생성 데이터 및 전자 의무 기록을 활용하는 딥러닝 예측 모델을 강화하는 방법에 대해 논의한다. 논문의 첫번째 목표는 환자 생성 데이터로부터 의료진의 판단에 도움이 될 수 있는 딥러닝 모델을 개발하고, 이를 공공 데이터 및 2차 데이터를 활용하여 강화하는 방법을 탐색하는 것이다. 두 번째 목표는 병원의 전자 의무 기록을 바탕으로 호중구 감소증 회복 예측 모델을 개발하고, 이 모델에 대한 의료진의 모델 수용도를 탐색하기 위해 일반적으로 사용되는 기술 수용 모델 기반 설문 이상의 방법을 탐색하는 것이다.
논문에 포함된 첫 번째 연구에서는 사용자가 직접 입력한 체온과 해열제 복용 기록, 증상을 기반으로 하여 인플루엔자의 스크리닝을 위한 딥 러닝 기반 모델을 개발했다. 이 모델은 1차 병원에서 자주 사용되는 신속 항원 검사의 민감도가 상대적으로 낮은 점을 보완하기 위해 개발되었으며, 약 80% 이상의 민감도를 보여 신속항원검사를 보완할 수 있을 것으로 기대된다.
두 번째 연구는 대상 질환을 COVID-19로 연구를 확장하여, 초기 팬데믹 단계에서의 제한된 PCR 테스트 능력을 보완하기 위해 스크리닝 모델을 개발하였다. 이 연구에서는 PGHD에 전염병 정보 및 개인 이동성 데이터와 같은 공공 데이터를 통합하여 딥러닝 모델의 성능을 크게 향상시켰다.
모델의 수용도를 탐색하는 방안으로, 우선 소아청소년 암 환자의 EHR 데이터를 활용하여, 중성구 감소증에서의 회복을 예측하는 딥 러닝 모델을 개발하였다. 이 모델은 전공의 보다 월등하고, 전문의와 비슷하거나 더 나은 예측 성능을 보였다. 또한 모델의 예측 결과를 의료진에게 전달하였을 때 의료진의 80%가 이를 수용하였으며, 그 결과 더 정확한 예측을 할 수 있음을 확인하였다.