표제지
목차
ABSTRACT 8
제1장 서론 10
제2장 관련연구 12
제1절 대화형 데이터셋 구축 방법 12
제2절 튜터링 대화 데이터셋 14
제3절 수학 단어 문제 데이터셋 22
제3장 제안방법 26
제1절 튜터링 시나리오 설계 26
제2절 데이터셋 자동 구축 27
제3절 데이터셋 검수 30
제4절 데이터셋 분석 31
제4장 실험 및 분석 32
제1절 실험 환경 32
제2절 데이터셋 및 평가 기준 33
제3절 실험 결과 34
제4절 결과 분석 35
제5장 결론 36
참고문헌 37
국문초록 42
〈표 1-1〉 TSCC 데이터셋 예시 16
〈표 2-1〉 TalkMoves 데이터셋의 대화 동작 17
〈표 2-2〉 TalkMoves 데이터셋 예시 18
〈표 2-3〉 NCTE의 발화 별 주석 19
〈표 2-4〉 MATHDIAL 교사의 응답 유형 21
〈표 2-5〉 수학 단어 문제의 예시 22
〈표 3-1〉 입력 프롬프트 예시 29
〈표 3-2〉 튜터링 대화 데이터셋 통계 비교 31
〈표 4-1〉 하드웨어 및 소프트웨어 환경 32
〈표 4-2〉 자동 구축 데이터셋에 대한 기준 성능 34
〈그림 1-1〉 Watson Tutor 데모 10
〈그림 2-1〉 Wizard-of-Oz 패러다임 12
〈그림 2-2〉 CIMA 데이터 수집 프로세스 15
〈그림 2-3〉 MATHDIAL 데이터 제작 파이프라인 20
〈그림 2-4〉 ASDiv 예시 23
〈그림 2-5〉 SVAMP 예시 24
〈그림 2-6〉 GSM8K 예시 25
〈그림 3-1〉 튜터링 시나리오 26
〈그림 3-2〉 수학 튜터링 데이터셋 자동구축 프레임워크 27
〈그림 3-3〉 자동구축 데이터셋 검수 30
〈그림 4-1〉 학습 및 평가 데이터 구축 33