본문 바로가기 주메뉴 바로가기
국회도서관 홈으로 정보검색 소장정보 검색

결과 내 검색

동의어 포함

목차보기

목차

사전 뜻풀이를 이용한 용언 의미 군집화 / 배영준 ; 최호섭 ; 송유화 ; 옥철영 1

[요약] 1

서론 2

관련연구 3

용언 의미 군집화를 위한 기반 작업 4

사전 뜻풀이 의미 태그 부착 4

사전 뜻풀이의 용언 추출 5

일반적인 뜻풀이 용언 추출 5

용언 의미 군집화 10

용언 집합 생성 10

용언의 계층적 연결 구성 13

용언 의미 군집화 결과 및 평가 17

결론 25

참고문헌 26

(Abstract) 28

초록보기

한국어의 어휘 의미 정보를 명확히 파악하기 위해서는 어휘 의미 체계를 구축해야 한다.

본 논문에서는 어휘 의미 체계 구축의 단계 중 하나인 용언의 의미 군집화를 연구하였다. 용언의 하위범주화 논항(주어 및 목적어)과 선택 제약정보, 부사의 결합정보를 이용한 이전의 연구와는 달리 의미태그가 부착된 사전 뜻풀이의 용언정보를 이용하여 용언의 의미 군집화를 시도하였고, 표제어와 뜻풀이 용언 사이 관계의 종개념과 유개념 관계를 이용하여 계층적 의미 군집화를 시도하였다. 그리고 특정 범주의 일반 샘플을 이용했던 특정 용언의 부류가 아닌, 사전에 존재하는 대부분의 용언들을 대상으로 연구를 진행하였다.

본 논문에서 다의어 수준에서 구분된 총 106,501개의 용언(85,754개의 동사와 20,747개의 형용사)을 대상으로 한국어 용언 의미계층 군집 2,748개를 생성하였다. 이 중 순환정의 군집은 130개가 나타났으며, 중간 계층의 서브군집으로 261개가 나타났다. 군집 내 계층의 최대 깊이는 16단계였다. 그리고 용언 의미 군집 평가를 위해 세종사태의미부류와 비교해 보았다. 그 결과 70.14%의 응집도를 보였다.

The lexical semantic system should be built to grasp lexical semantic information more clearly.

In this paper, we studied a semantic clustering of predicates that is one of the steps in building the lexical semantic system. Unlike previous studies that used argument of subcategorization(subject and object), selectional restrictions and interaction information of adverb, we used sense tagged definition in dictionary for the semantic clustering of predicate, and also attempted hierarchical clustering of predicate using the relationship between the generic concept and the specific concept. Most of the predicates in the dictionary were used for clustering.

Total of 106,501 predicates(85,754 verbs, 20,747 adjectives) were used for the test. We got results of clustering which is 2,748 clusters of predicate and 130 recursive definition clusters and 261 sub-clusters. The maximum depth of cluster was 16 depth. We compared results of clustering with the Sejong semantic classes for evaluation. The results showed 70.14% of the cohesion.

권호기사

권호기사 목록 테이블로 기사명, 저자명, 페이지, 원문, 기사목차 순으로 되어있습니다.
기사명 저자명 페이지 원문 목차
양안 부등 정보가 네온 색 확산에 미치는 효과 정우현 ,차한님 pp.235-254

보기
상황인식 시 구체 및 비구체적 정보가 의사결정에 미치는 영향 :ERP연구 류광민 ,김진구 ,김우종 ,임경식 pp.255-270

보기
사전 뜻풀이를 이용한 용언 의미 군집화 배영준 ,최호섭 ,송유화 ,옥철영 pp.271-298

보기
정서 차원 공간에서 소설의 지배 정서 분석 및 분류 이신영 ,함준석 ,고일주 pp.299-326

보기
형태소 분석기 사용을 배제한 음절 단위의 한국어 품사 태깅 심광섭 pp.327-345

보기

참고문헌 (12건) : 자료제공( 네이버학술정보 )

참고문헌 목록에 대한 테이블로 번호, 참고문헌, 국회도서관 소장유무로 구성되어 있습니다.
번호 참고문헌 국회도서관 소장유무
1 남경완 (2008). 국어 용언의 의미 분석. 태학사. 미소장
2 Chagnaa Altangerel, 이창범, 옥철영 (2006). 독립성분분석과 Box-Cox 변환을 이용한 동사 개념 클러스터링. 제 18회 한글 및 한국어 정보처리 학술대회, pp. 164-170. 미소장
3 Schulte im Walde, S. (2000). Clustering verbs seman-tically according to their alternation behaviour, Proceedings of the 18th International Conference on Computational Linguistics (COLING2000), pp.747-753. 미소장
4 박성배, 장병탁, 김영택 (2000). Self-Organizing Map을 이용한 한국어 동사 클러스터링. 한국정보과학회 가을 학술발표논문집(Ⅱ), pp.183-184. 미소장
5 Lin Sun and Anna Korhonen. (2009). Improving Verb Clustering with Automatically Acquired Selectional Preferences, Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing, pp.638-647. 미소장
6 김혜경, 윤애선 (2006). 단어클러스터링을 이용한 동사 어휘의미망의 활용 및 평가. 한국인지과학회 춘계학술대회, pp.1-7. 미소장
7 김미훈, 남상협, 이용훈, 이종혁 (2007). EM 알고리즘을 이용한 전문용어 온톨로지 클래스간 관계 정의를 위한 동사 클러스터링. 제19회 한글 및 한국어 정보처리 학술대회, pp.233-240. 미소장
8 김종복, 임경섭, 이주원. (2006). 전산학적 응용을 위한 한국어 용언 위계 구축. 한국사전학회, 제8호, pp.145-162. 미소장
9 Jinying Chen and Martha Palmer. (2004). Chinese Verb Sense Discrimination Using an EM Clustering Model with Rich Linguistic Features, Proceedings of the 42nd Annual Meeting on Association for Computational Linguistics, pp.295-302. 미소장
10 Andreas Vlachos, Zoubin Ghahramani, and Anna Korhonen, (2008), Dirichlet process mixture models for verb clustering, In Proceedings of the ICML workshop on Prior Knowledge for Text and Language. 미소장
11 김혜경, 윤애선. (2006). 동사 어휘의미망의 반자동 구축을 위한 사전정의문의 중심어 추출. 한국언어정보학회, 10-1, pp.47-69 미소장
12 윤애선, 황순희, 이은령, 권혁철. (2009). 한국어 어휘의미망 “KorLex 1.5”의 구축. 한국정보과학회, 36-1, pp.92-108 미소장