표제지
목차
논문요약 11
제1장 서론 13
1. 연구의 배경과 목적 13
2. 연구의 범위와 방법 14
3. 기존 연구와의 차별점 15
제2장 관련 연구 16
1. 트래픽상의 Web Packet의 수집 16
1) 트래픽상의 비정상 Web Packet 17
2) Hadoop 18
2. 기계 학습 19
1) 지도 학습 19
제3장 Packet 수집과 Hadoop을 이용한 공격 탐지 시스템의 설계 및 구현 21
1. Packet 수집 시스템의 구현 21
2. 데이터 분석 시스템 22
3. 기계 학습의 적용 23
1) Scikit-Learn 23
제4장 실험 및 결과 24
1. 기계 학습을 통한 탐지 24
1) Feature 추출 24
2) 지도 학습의 결과 27
2. Word to Vector와 지도학습 28
1) 공격 데이터의 Labeling 29
2) 웹 로그의 재처리 29
3) Word to vector의 학습 31
4) Random Forest VS SVM 적용 결과 33
제5장 결론 37
1. 연구의 결론과 모델 37
2. 성능 향상 방향 38
참고문헌 39
ABSTRACT 41
표 2-1. 일반 요청과 공격 요청 17
표 4-1. HTTP 요청 Packet의 Feature 25
표 4-2. Web 서비스의 접속 공격 유형 27
표 4-3. 개선을 위해서 필요한 Feature 분류 데이터 28
표 4-4. 실험에 사용된 Word to Vector의 주요 인자값. 32
표 4-5. 각 차원별 지도 학습의 측정값 34
표 4-6. 200차원의 최소 단어수 인자에 따른 측정값 35
그림 2-1. Web으로 전송된 SQL Injection 공격 Packet 18
그림 3-1. HTTP Packet의 Hadoop 데이터 수집/분석 흐름도 22
그림 4-1. Web Packet에서 추출된 Feature Data 26
그림 4-2. 공격문 분석을 위한 특수 문자 치환표 31
그림 4-3. Word to Vector를 학습하고 이를 데이터에 적용하는 소스 코드 33
그림 4-4. 실제 로그에서 탐지된 공격 로그 34