표제지
목차
국문초록 7
ABSTRACT 8
제1장 서론 9
1.1. 연구배경 9
1.2. 연구목적 11
1.3. 연구방법 12
제2장 관련연구 14
제3장 회귀분석 기반의 스팸메시지 탐지모델에 관한 실증적 연구 18
3.1. 스팸메시지 분류기준 18
3.2. 스팸메시지 분류기법 21
제4장 현장실험 26
4.1. 실험설계 26
4.2. 데이터 분석 31
제5장 결론 35
참고문헌 37
[표 3-1] 스팸 DB 22
[표 3-2] 수집한 데이터 23
[표 3-3] 명사의 개수에 따른 점수화 23
[표 3-4] 반복되는 단어의 개수에 따른 점수화 24
[표 3-5] 특수문자의 개수에 따른 점수화 24
[표 4-1] Hosmer-Lemeshow 검정 26
[표 4-2] 모형 요약 27
[표 4-3] Correlation Matrix 28
[표 4-4] 방정식에 포함된 변수 30
[표 4-5] 스팸메시지의 분류 성능 척도 32
[표 4-6] 기존 연구들과의 FP-rate 값 비교 34
[그림 1-1] 매년 스팸메시지의 접수량 9
[그림 3-1] 수집한 스팸, 비스팸 단어들의 예 20
[그림 3-2] 스팸 메시지의 분류과정 21