표제지
목차
국문 초록 4
제1장 사업 개요 8
1. 사업 목표 및 기대 효과 9
2. 사업 수행 방법 개관 10
3. 중간 및 최종 산출물 11
4. 향후 논의 12
제2장 개체명 분석 말뭉치 구축 과정 및 방법 13
1. 사업 수행 방식 14
2. 개체명 분석 말뭉치 구축 도구 16
3. 말뭉치 구축 인력 20
제3장 개체명 분석 말뭉치 구축 지침 25
1. 대원칙 보완 28
2. 전체 부류에 적용되는 일부 지침 추가 30
3. 부류별 지침 수정 31
제4장 결론 34
1. 사업 요약 35
2. 남은 문제 36
[부록] 개체명 분석 말뭉치 구축 지침 2019 39
가. 개요 48
나. 세부분류 개체명 정의 58
1. PERSON 58
1.1. PS_NAME 58
2. STUDY_FIELD 60
2.1. FD_SCIENCE 61
2.2. FD_SOCIAL_SCIENCE 62
2.3. FD_MEDICINE 63
2.4. FD_ART 64
2.5. FD_PHILOSOPHY 65
2.6. FD_OTHERS 65
3. THEORY 66
3.1. TR_SCIENCE 66
3.2. TR_SOCIAL_SCIENCE 68
3.3. TR_ART 69
3.4. TR_PHILOSOPHY 69
3.5. TR_MEDICINE 70
3.6. TR_OTHERS 71
4. ARTIFACTS 72
4.1. AF_CULTURAL_ASSET 72
4.2. AF_BUILDING 73
4.3. AF_MUSICAL_INSTRUMENT 74
4.4. AF_ROAD 74
4.5. AF_WEAPON 75
4.6. AF_TRANSPORT 75
4.7. AF_WORKS 76
4.8. AF_WARES 83
5. ORGANIZATION 84
5.1. OGG_ECONOMY 84
5.2. OGG_EDUCATION 85
5.3. OGG_MILITARY 87
5.4. OGG_MEDIA 87
5.5. OGG_SPORTS 88
5.6. OGG_ART 88
5.7. OGG_MEDICINE 89
5.8. OGG_RELIGION 89
5.9. OGG_SCIENCE 90
5.10. OGG_LIBRARY 91
5.11. OGG_LAW 91
5.12. OGG_POLITICS 92
5.13. OGG_FOOD 94
5.14. OGG_HOTEL 94
5.15. OG_OTHERS 95
6. LOCATION 96
6.1. LCP_COUNTRY 96
6.2. LCP_PROVINCE 97
6.3. LCP_COUNTY 97
6.4. LCP_CITY 98
6.5. LCP_CAPITALCITY 98
6.6. LCG_RIVER 99
6.7. LCG_OCEAN 99
6.8. LCG_BAY 100
6.9. LCG_MOUNTAIN 100
6.10. LCG_ISLAND 101
6.11. LCG_CONTINENT 101
6.12. LC_TOUR 102
6.13. LC_SPACE 102
6.14. LC_OTHERS 103
7. CIVILIZATION 105
7.1. CV_NAME 105
7.2. CV_TRIBE 105
7.3. CV_SPORTS 106
7.4. CV_SPORTS_INST 107
7.5. CV_POLICY 107
7.6. CV_TAX 108
7.7. CV_FUNDS 108
7.8. CV_LANGUAGE 109
7.9. CV_BUILDING_TYPE 109
7.10. CV_FOOD 110
7.11. CV_DRINK 110
7.12. CV_CLOTHING 111
7.13. CV_POSITION 111
7.14. CV_RELATION 113
7.15. CV_OCCUPATION 113
7.16. CV_CURRENCY 114
7.17. CV_PRIZE 114
7.18. CV_LAW 115
7.19. CV_FOOD_STYLE 117
8. DATE 118
8.1. DT_DURATION 118
8.2. DT_DAY 118
8.3. DT_MONTH 119
8.4. DT_YEAR 119
8.5. DT_SEASON 119
8.6. DT_GEOAGE 120
8.7. DT_DYNASTY 120
8.8. DT_OTHERS 121
9. TIME 122
9.1. TI_DURATION 122
9.2. TI_HOUR 122
9.3. TI_MINUTE 123
9.4. TI_SECOND 123
9.5. TI_OTHERS 123
10. QUANTITY 124
10.1. QT_AGE 124
10.2. QT_SIZE 124
10.3. QT_LENGTH 124
10.4. QT_COUNT 125
10.5. QT_MAN_COUNT 125
10.6. QT_WEIGHT 126
10.7. QT_PERCENTAGE 126
10.8. QT_SPEED 126
10.9. QT_TEMPERATURE 127
10.10. QT_VOLUME 127
10.11. QT_ORDER 127
10.12. QT_PRICE 128
10.13. QT_PHONE 128
10.14. QT_SPORTS 128
10.15. QT_CHANNEL 129
10.16. QT_ALBUM 129
10.17. QT_ZIPCODE 130
10.18. QT_OTHERS 130
11. EVENT 131
11.1. EV_ACTIVITY 131
11.2. EV_WAR_REVOLUTION 131
11.3. EV_SPORTS 132
11.4. EV_FESTIVAL 133
11.5. EV_OTHERS 134
12. ANIMAL 135
12.1. AM_INSECT 135
12.2. AM_BIRD 135
12.3. AM_FISH 136
12.4. AM_MAMMALIA 136
12.5. AM_AMPHIBIA 136
12.6. AM_REPTILIA 137
12.7. AM_TYPE 137
12.8. AM_PART 138
12.9. AM_OTHERS 138
13. PLANT 139
13.1. PT_FRUIT 139
13.2. PT_FLOWER 139
13.3. PT_TREE 140
13.4. PT_GRASS 140
13.5. PT_TYPE 141
13.6. PT_PART 141
13.7. PT_OTHERS 141
14. MATERIAL 142
14.1. MT_ELEMENT 142
14.2. MT_METAL 142
14.3. MT_ROCK 143
14.4. MT_CHEMICAL 143
15. TERM 146
15.1. TM_COLOR 146
15.2. TM_DIRECTION 146
15.3. TM_CLIMATE 146
15.4. TM_SHAPE 147
15.5. TM_CELL_TISSUE 147
15.6. TMM_DISEASE 148
15.7. TMM_DRUG 148
15.8. TMI_HW 149
15.9. TMI_SW 150
15.10. TMI_SITE 151
15.11. TMI_EMAIL 152
15.12. TMI_MODEL 152
15.13. TMI_SERVICE 152
15.14. TMI_PROJECT 153
15.15. TMIG_GENRE 153
15.16. TM_SPORTS 153
다. 태깅 단위와 태깅 범주 문제 155
1. 태깅 단위 155
1.1. 구 단위의 태깅 155
1.2. 복합어 내부 태깅 157
2. 유일 태깅 원칙 158
라. 기타 160
1. 개체명 성능 평가 160
2. 기타 논의 사항 161
3. 구어 말뭉치 태깅 163
Abstract 165
판권기 167
〈표 1〉 ETRI의 개체명 분류 및 태그 세트 일부 27
〈표 2〉 본 사업의 개체명 분류 및 태그 28
〈그림 1〉 사업 기대효과 9
〈그림 2〉 사업 진행 과정 14
〈그림 3〉 구축 도구 kane 사용 방법 17
〈그림 4〉 구축 도구 kane 사용 방법 2 18
〈그림 5〉 kane에서 문서를 열었을 때 화면 18
〈그림 6〉 kane의 세부 기능 19
〈그림 7〉 사업 참여 기관 20
〈그림 8〉 수행조직 구조도 22
〈그림 9〉 작업자들의 질문사항과 작업물 제출 페이지 23
〈그림 10〉 작업자들 제출 현황 및 질문/답변 사항 엑셀 파일 정리 화면 23