표제지
목차
요약 6
제1장 서론 7
제2장 해외 사례 연구 9
제1절 미국사회조사 산업직업분류 코딩 프로세스 9
제2절 유사도 지수를 이용한 미국사회조사 직업분류 10
제3장 AI통계분류시스템 17
제1절 자동완성이란? 17
제2절 엘라스틱서치(Elasticsearch) 18
제3절 AI통계분류시스템 엘라스틱서치 21
제4절 AI통계분류시스템 자동완성사전 추가 25
제4장 결론 및 시사점 26
참고문헌 27
Abstract 29
판권기 31
〈표 3-1〉 역색인 구조의 구성요소 20
〈표 3-2〉 에널라이저의 세 가지 구성요소 21
〈표 3-3〉 AI통계분류시스템 에널라이저의 기능 21
〈그림 2-1〉 미국사회조사 산업과 직업분류 코딩 프로세스 10
〈그림 2-2〉 미국사회조사 직업문항의 변화 11
〈그림 2-3〉 텍스트 전처리 과정 12
〈그림 2-4〉 코사인 유사도 측정 산식 13
〈그림 2-5〉 직업이름과 직업설명 유사도 측정 결과 13
〈그림 2-6〉 유사도가 가장 높은 직업과 낮은 직업의 예 14
〈그림 2-7〉 직업이름과 직업설명 유사도 측정 결과(2011~2021) 15
〈그림 2-8〉 주요 직업군의 직업이름 유사도(2011~2021) 16
〈그림 2-9〉 주요 직업군의 직업설명 유사도(2011~2021) 16
〈그림 3-1〉 AI 통계분류시스템 자동완성 기능 18
〈그림 3-2〉 엘라스틱서치 구조도 19
〈그림 3-3〉 자동완성 기능 데이터 저장구조 22
〈그림 3-4〉 초성검색 애널라이저 23
〈그림 3-5〉 초성검색 인댁싱 23
〈그림 3-6〉 자동완성 애널라이저 23
〈그림 3-7〉 자동완성 인댁싱 24