표제지
[요약]
목차
I. 서론 6
II. 자료구조 8
1. 자료의 기본구조 8
2. 공변량 선택방법 11
(1) 선행논문에서 선택된 9개의 공변량 11
(2) t-검정에 의한 공변량 선택 12
(3) 다변량 기법을 이용한 차원축소 13
(4) 스팸메일과 합법적 메일에 자주 등장하는 단어들의 공변량 14
3. 측도 14
III. 분석결과 16
1. 선행논문에서 선택된 9개의 공변량에 대한 GPLAM 16
(1) 훈련자료와 시험자료를 이용한 GPLAM 16
(2) 전체 4601개의 자료를 이용한 GPLAM 19
2. 전체 57개의 공변량에 대한 GPLAM 22
(1) 훈련자료와 시험자료를 이용한 GPLAM 22
(2) 전체 4601개의 자료를 이용한 GPLAM 24
3. t-검정에 의해 선택된 공변량들에 대한 GPLAM 27
(1) 훈련자료와 시험자료를 이용한 GPLAM 27
(2) 전체 4601개의 자료를 이용한 GPLAM 29
4. 다변량 기법을 이용한 차원축소에 대한 GPLAM 31
(1) 훈련자료와 시험자료를 이용한 GPLAM 31
(2) 전체 4601개의 자료를 이용한 GPLAM 32
5. 스팸메일과 합법적메일에 많은 빈도로 나타나는 단어의 공변량에 대한 GPLAM 34
(1) 훈련자료와 시험자료를 이용한 GPLAM 34
(2) 전체 4601개의 자료를 이용한 GPLAM 36
IV. 결론 및 논의 39
참고문헌 42
부록 44
Abstract 47