초록

최근 암 환자의 수가 증가함에 따라 암 병기 예측은 중요해지고 있다. 암 병기(cancer stage)를 정확하게 예측하기 위해 가장 널리 사용되는 방법 중 하나는 AJCC (American Joint Committee on Cancer)에서 개발한 TNM (Tumor, Node, and Metastasis) 병기 결정 시스템이다. TNM은 해부학적 부위 및 조직학의 암에 대해 임상적으로 유용한 병기 결정 시스템이지만, 폐암, 위암 및 유방암과 같은 암 유형에서는 암 병기 예측 기준에 많은 변화가 존재하고 있어 환자 치료의 혼란을 줄이기 위해 개선되어야 한다. 이런 문제점의 대안으로 최근에는 기계 학습을 활용한 기술이 대두되고 있고, 기계 학습을 활용한 방법들은 TNM 스테이징 시스템보다 대체로 더 나은 성능을 보여주고 있다. 하지만, 이러한 연구의 대부분은 적은 수의 샘플(암 병기, stage)로 인해 발생할 수 있는 과적합(overfitting) 및 예측저하를 고려하지 않았다. 본 연구에서는 적은 수의 샘플(암 병기, stage)을 보정할 수 있는 기계 학습 방법인 GAN을 활용해 샘플증가를 실시하고, 샘플 증가를 평가하기 위해 1DCNN[9], RF[10, 11], DNN을 활용하였다. 본 연구의 방법을 적용했을 시 기존의암 병기 분류보다 높은 예측률이 나왔으며, 이러한 효과적인 암 병기 예측은 개인 맞춤형 의료 서비스를 제공하는데 도움을 줄 수 있다.