최근 네트워크상에서 다양한 경로와 수단을 활용하여 개인정보 수집, 해킹, 악성코드 유포 등과 같은 각종 범죄행위가 발생하고 있다. 특히 익명성을 특징으로 하는 다크웹에서의 다양한 범죄는 발신자의 추적을 어렵게 한다.
팬데믹(pandemic)의 영향으로 전염에 대한 두려움과 원격 근무의 특수성을 노린 다크웹에서의 범죄활동이 급증하였다. 다크웹 시장에서의 거래가 활발해지고 사이버 범죄조직 규모 또한 확대되었고 도메인 관리자 계정, 금융관련 계정 등 다양한 개인의 민감정보들이 거래되어 공유되고 있다. 한국인터넷진흥원(KISA)의 국가정보보호백서에서도 주요 사이버위협으로 다크웹을 언급하였는데 일반적인 검색엔진과 브라우저로 접속이 불가한 다크웹을 접근 할 수 있는 Tor를 언급하며 이를 경고하고 있다.
Onion Router라고 알려진 Tor는 강한 익명성을 보장하기 때문에 각종 범죄 행위뿐만 아니라 신속한 포트 검색 및 인증정보의 외부 유출 등 해킹 시도에도 활발하게 이용되고 있다. 따라서 범죄 시도를 조기에 차단하고 해킹으로부터 조직의 정보시스템을 안전하게 보호하기 위해서는 Tor 트래픽의 빠르고 정확한 탐지가 상당히 중요하다.
이에 본 논문에서는 딥러닝(Deep Learning)의 기법 중 하나인 CNN(Convolutional Neural Network)과 GAN(Generative Adversiral Networks)을 기반으로 하는 Tor 트래픽을 탐지하고 트래픽의 유형을 분류하는 분류모델을 제안한다. 제안하는 분류모델의 성능 검증에는 UNB Tor 2016 데이터세트가 사용되었다. 실험을 진행한 결과, 제안하는 접근방법은 Tor 및 Non-Tor 트패픽을 탐지하는 이진분류에서는 99.98%, Tor 트래픽의 유형을 구분하는 다중분류에서는 97.69%의 정확도를 보여주었다.