표제지
목차
ABSTRACT 9
제1장 서론 11
제1절 정보 검색 11
제2장 관련 연구 15
제3장 정보 검색 기술 설명 17
제1절 In-Batch Sampling의 한계 18
제2절 Query-Centric Hard Negative 18
제4장 효율적인 검색 모델 학습 전략 20
제1절 Robust Sampling Method based on Lexico-Semantic Information 21
제2절 Incremental Training 22
제3절 네거티브 인스턴스 구축 과정 23
제5장 실험 환경 24
제1절 데이터셋 24
제2절 Baselines 24
제3절 Implement Detail 25
제6장 실험 및 분석 27
제1절 In-batch sampling의 비효율성 28
제2절 QC HN 및 INT의 학습 효과 29
제3절 RSL 및 INT를 결합한 학습 효율성 31
제7장 결론 34
참고문헌 35
국문초록 39
〈표 5-1〉 Natural Questions 및 TriviaQA의 데이터 통계 24
〈표 6-1〉 NQ, TQA에서 네거티브 인스턴스 구성에 따른 실험 결과 28
〈표 6-2〉 NQ, TQA에서 네거티브 샘플의 단순증가 및 점진적증가 따른 실험 결과 30
〈표 6-3〉 NQ, TQA에서 RSL 및 INT를 적용한 dense retrieval에 따른 실험 결과 32
〈그림 1-1〉 여러가지 Negative Sampling 및 제안 방법 예시 12
〈그림 4-1〉 제안 방법 RSL 및 INT를 적용한 인스턴스 구축 개요도 20