표제지
목차
국문초록 9
ABSTRACT 11
제1장 서론 13
1.1. 연구 배경 및 목적 13
1.2. 연구방법 및 범위 15
1.3. 논문의 구성 15
제2장 관련 연구 17
2.1. 단일문서 대상 통계적 접근법 키워드 추출 연구 17
2.1.1. TF-IDF를 활용한 키워드 추출 연구 17
2.1.2. 동시 출현 관계를 활용한 키워드 추출 연구 18
2.2. 단일문서 대상 그래프 모델 기반 키워드 추출 연구 20
2.2.1. TextRank를 활용한 키워드 추출 연구 20
2.3. 단어 간 연관성 측정 21
2.3.1. PMI(Point-wise Mutual Information) 21
제3장 단어 간 연관성을 고려한 키워드 추출 알고리즘 23
3.1. TextRank를 활용한 키워드 가중치 산출 방법 24
3.2. 단어 간 연관성을 고려한 키워드 추출 알고리즘 26
제4장 구현 및 테스트 28
4.1. 테스트 방법 28
4.2. 구현 및 테스트 환경 29
4.3. 알고리즘 구현 30
4.4. 성능 비교 테스트 32
4.5. 테스트 결과 35
제5장 결론 37
참고문헌 39
[표 1-1] 키워드 추출 연구의 분류 기준 14
[표 2-1] 문장 예시 19
[표 2-2] 동시 출현 행렬 19
[표 3-1] 문장과 문장 구성 명사 예시 24
[표 4-1] 실험 대상 문서 29
[표 4-2] PMI 산출 Python 코드 30
[표 4-3] TextRank 산출 Python 코드 31
[표 4-4] 제안 알고리즘 Python 코드 32
[표 4-5] 평가 지표 32
[표 4-6] 키워드 추출 결과 34
[표 4-7] 성능평가 결과 비교 34
[그림 3-1] 제안 알고리즘 키워드 추출 순서도 23
[그림 3-2] 간선 그래프 예시 1 25
[그림 3-3] 간선 그래프 예시 2 26
[그림 4-1] 제안 알고리즘 구현 순서도 28