표제지
목차
국문초록 10
1. 서론 12
1.1. 연구 동기 및 연구 목적 12
1.2. 연구 개요 14
2. 관련 연구 16
2.1. 토픽 모델링 (Topic Modeling) 16
2.2. 추출 요약 (Extractive Summarization) 18
3. TES: Topic model based Extractive Summarization 21
3.1. 토픽 모델 21
3.2. 추출 요약 모델 22
4. 실험 27
4.1. 데이터셋 27
4.2. 실험 설정 28
4.2.1. 토픽 모델 28
4.2.2. 추출 요약 모델 28
4.3. 실험 결과 29
4.3.1. 다른 요약 모델과의 비교 30
4.3.2. 세 문장 선택 방식 32
5. 결론 34
참고문헌 35
ABSTRACT 41
Table 4.1. 요약 모델의 학습을 위해 사용한 데이터셋 기본 정보. 27
Table 4.2. CNN/DM 데이터셋에 대한 추출 요약 결과 비교. 30
Table 4.3. TES에서 문장을 선택하는 방식에 따른 실험 결과. 32
Figure 1.1. 토픽 모델에서 가정하는 문서 생성 과정 14
Figure 2.1. LDA 모델의 구조. 17
Figure 2.2. LDA를 사용해 문서 분포를 구하는 식. 17
Figure 2.3. TextRank 알고리즘에서 문장의 유사도를 구하는 식. 18
Figure 2.4. SummaRunner 모델의 구조. 19
Figure 3.1. 논문에 사용된 토픽 모델의 구조. 21
Figure 3.2. (위) BERT 모델의 구조 (아래) BertSum 모델의 구조. 23
Figure 3.3. TES의 학습 과정. 24
Figure 3.4. TES의 추론 과정. 26