4차 산업혁명 시대에 디지털 데이터 폭발과 함께 랜섬웨어를 이용한 사이버 공격이 많은 기관과 조직에 심각한 위협으로 떠오르고 있다. 랜섬웨어의 피해는 IT와 금융 분야에 국한되지 않고 의료 분야 등 삶과 관련된 분야에도 영향을 미친다.
그러므로 악성코드를 식별하고 탐지하기 위한 연구가 시급하다. 이 논문은 기계 학습 알고리즘의 사용과 결합된 동적 분석 기법을 기반으로 랜섬웨어를 식별하고 분류하는 접근 방식을 제시한다. 첫째, 쿠쿠 샌드박스를 이용해 실행 가능한 샘플의 동적 분석 중 추출되는 API 호출 기능에 초점을 맞췄다. 둘째, 그레디언트 부스팅 의사 결정 트리 알고리즘인 LightGBM을 사용하여 정상 소프트웨어와 8가지 유형의 랜섬웨어를 훈련하고 탐지 및 분류한다.
실험 결과에서 제안된 접근법이 다중 클래스 분류를 수행할 때 전체 정확도 98.7%에 달성한 것을 확인 할 수 있다. 특히, 랜섬웨어와 일반 멀웨어의 탐지율은 모두 99.9% 달성하고 동시에 WannaCry와 Win32:FileCoder 유형의 랜섬웨어를 식별하는 정확도는 100%이다.