출력 변수의 범주 비율이 매우 불균형한 데이터를 사용하여 분류 모형을 적합하는 경우 비율이 낮은 범주의 예측 성능이 저하되는 문제가 발생한다. 오버샘플링 기법은 이러한 문제를 해결하기 위하여 소수 범주의 데이터를 가상으로 생성하는 기법이다. 본 연구에서는 GAN과 로지스틱 모형을 활용하는 새로운 오버샘플링 기법을 제안하였다. 제안된 기법은 원 데이터로부터 로지스틱 모형을 적합하고 GAN으로 생성한 데이터에 적합된 로지스틱 모형을 적용하여 최종 적합에 필요한 데이터를 선별하는 기법이다. 다양한 실제 데이터를 적용한 결과 제안된 기법의 성능이 매우 우수함을 확인하였다.