본문바로가기

자료 카테고리

전체 1
도서자료 0
학위논문 0
연속간행물·학술기사 1
멀티미디어 0
동영상 0
국회자료 0
특화자료 0

도서 앰블럼

전체 (0)
일반도서 (0)
E-BOOK (0)
고서 (0)
세미나자료 (0)
웹자료 (0)
전체 (0)
학위논문 (0)
전체 (1)
국내기사 (1)
국외기사 (0)
학술지·잡지 (0)
신문 (0)
전자저널 (0)
전체 (0)
오디오자료 (0)
전자매체 (0)
마이크로폼자료 (0)
지도/기타자료 (0)
전체 (0)
동영상자료 (0)
전체 (0)
외국법률번역DB (0)
국회회의록 (0)
국회의안정보 (0)
전체 (0)
표·그림DB (0)
지식공유 (0)

도서 앰블럼

전체 1
국내공공정책정보
국외공공정책정보
국회자료
전체 ()
정부기관 ()
지방자치단체 ()
공공기관 ()
싱크탱크 ()
국제기구 ()
전체 ()
정부기관 ()
의회기관 ()
싱크탱크 ()
국제기구 ()
전체 ()
국회의원정책자료 ()
입법기관자료 ()

검색결과

검색결과 (전체 1건)

검색결과제한

열기
기사명/저자명
의미적 의존 링크 토픽 모델을 이용한 생물학 약어 중의성 해소 / 김선호, 윤준태, 서정연 인기도
발행사항
서울 : 한국정보과학회, 2014.09.15
수록지명
정보과학회논문지 = Journal of KIISE. 제41권 제9호 (2014년 9월), pp.652-665
자료실
[서울관] 정기간행물실(524호)  도서위치안내(서울관)
외부기관 원문
외부기관 원문
제어번호
KINX2014351190
주기사항
한국연구재단에서 제공한 KCI 등재학술(후보)지임
원문

초록보기 더보기

생물학 도메인은 약어 표현이 빈번하며, 실제로 문서에서 중요한 의미를 지니는 개체명들이 약어로 표현되는 경우가 많다. 본 연구에서는 토픽과 링크 정보를 이용하여 약어 중의성을 해결하고 동일한 의미를 가지는 다양한 형태의 약어 원형들(variant forms)에 대한 그룹핑을 시도한다. 이를 위하여 LDA (latent Dirichlet allocation) 기반 의미적 의존 링크 토픽 모델(semantic dependency topic model)을 제안한다. 해당 모델은 생성 모델(generative model)의 일종으로 문서 집합의 각 문서에 등장하는 단어들은 문서에서 발생하는 토픽 분포와 토픽 당 단어 분포에 의해 생성되어 있는 것으로 가정하고, 관측 가능한 문서 집합의 단어들로부터 문서에 내재된 숨어있는 토픽 구조를 추론하여 단어 생성과 토픽 파라미터를 연결시킨다. 본 연구에서는 토픽 정보 외에 단어들 사이에 존재하는 의미적 의존성(semantic dependency)을 링크로 정의하고, 단어 간에 존재하는 링크 정보, 특히 원형과 문장에서 공기하는 단어들 사이의 링크를 파라미터화하여 중의성 해결에 이용하였다. 결과적으로 주어진 문서에 등장하는 약어에 대해 가장 가능성 있는 원형은 해당 모델을 이용하여 추론된 단어-토픽, 문서-토픽, 단어-링크 확률에 의해서 결정된다. 제안하는 모델은 MEDLINE 초록으로부터 Entrez 인터페이스를 이용해 22개의 약어 집합과 186개의 가능한 약어 원형을 이용하여 질의를 생성하고, 이를 이용해 검색된 문서들을 대상으로 학습과 테스트에 이용하였다. 실험은, 주어진 문서에 등장하는 해당 약어에 대한 원형이 무엇인지 예측하는 방식으로 98.3%의 정확률의 높은 성능을 보였다.

Many important terminologies in biomedical text are expressed as abbreviations or acronyms. We newly suggest a semantic link topic model based on the concepts of topic and dependency link to disambiguate biomedical abbreviations and cluster long form variants of abbreviations which refer to the same senses. This model is a generative model inspired by the latent Dirichlet allocation (LDA) topic model, in which each document is viewed as a mixture of topics, with each topic characterized by a distribution over words. Thus, words of a document are generated from a hidden topic structure of a document and the topic structure is inferred from observable word sequences of document collections. In this study, we allow two distinct word generation to incorporate semantic dependencies between words, particularly between expansions (long forms) of abbreviations and their sentential co-occurring words. Besides topic information, the semantic dependency between words is defined as a link and a new random parameter for the link presence is assigned to each word. As a result, the most probable expansions with respect to abbreviations of a given abstract are decided by word-topic distribution, document-topic distribution, and word-link distribution estimated from document collection though the semantic dependency link topic model. The abstracts retrieved from the MEDLINE Entrez interface by the query relating 22 abbreviations and their 186 expansions were used as a data set. The link topic model correctly predicted expansions of abbreviations with the accuracy of 98.30%.

권호기사보기

권호기사 목록 테이블로 기사명, 저자명, 페이지, 원문, 기사목차 순으로 되어있습니다.
기사명 저자명 페이지 원문 기사목차
X-means 클러스터링을 이용한 악성 트래픽 탐지 방법 박근수, 한명지, 임지혁, 최준용, 김현준, 서정주, 유철, 김성렬 pp.617-624 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )
스마트폰 가속도계를 이용한 점프동작 자동인식 촬영 전경구, 최경윤 pp.633-641 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )
의미적 의존 링크 토픽 모델을 이용한 생물학 약어 중의성 해소 김선호, 윤준태, 서정연 pp.652-665 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )
비제약적 환경에서 얼굴 주요위치 특징 서술자 기반의 얼굴인식 변혜란, 김대옥, 홍종광 pp.666-673 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )
클라우드 컴퓨팅 환경에서의 대용량 RDFS 추론을 위한 분산 테이블 조인 기법 박영택, 이완곤, 김제민 pp.674-685 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )
대용량 스트리밍 센서데이터 환경에서 RDFS 규칙기반 병렬추론 기법 권순현, 박영택 pp.686-698 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )
대용량 XML 문서의 키워드 검색을 위한 레이블링 기법 황수찬, 선동한 pp.699-706 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )
API간 상호 의존성 및 최단거리 분석을 통한 안드로이드 애플리케이션의 개인정보 유출 탐지 기법 박용수, 김도래 pp.707-714 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )
계산속도 및 정확도의 적응적 제어가 가능한 다단계 문서 비교 시스템 조환규, 서종규, 탁해성 pp.728-743 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )
차량용 반도체의 품질 확보를 위한 사양 및 설계 개발 프로세스 수립 도성룡, 한혁수 pp.625-632 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )
LTE에서 사용자 위치 정보 보호를 위한 보안 향상 인증 프로토콜 허준범, 한창희, 권현수 pp.715-727 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )
한국어 형태소 분석을 위한 음절 단위 확률 모델 심광섭 pp.642-651 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )
가상화 환경의 고성능 I/O를 위한 반가상화 라이브러리 엄영익, 이동우, 조영중 pp.605-610 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )
효율적인 데이터 중복제거를 위한 GPGPU 병렬 라빈 핑거프린팅 박찬익, 마정현, 박세진 pp.611-616 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )

참고문헌 (9건) : 자료제공( 네이버학술정보 )더보기

참고문헌 목록에 대한 테이블로 번호, 참고문헌, 국회도서관 소장유무로 구성되어 있습니다.
번호 참고문헌 국회도서관 소장유무
1 Automatic resolution of ambiguous terms based on machine learning and conceptual relations in the UMLS. 네이버 미소장
2 Machine learning and word sense disambiguation in the biomedical domain: design and evaluation issues 네이버 미소장
3 Building a high-quality sense inventory for improved abbreviation disambiguation. 네이버 미소장
4 Distribution of information in biomedical abstracts and full-text publications 네이버 미소장
5 Gene symbol disambiguation using knowledge-based profiles. 네이버 미소장
6 Journal of Machine Learning Research. Vol. 3. pp. 993 미소장
7 Resolving abbreviations to their senses in Medline 네이버 미소장
8 Topics in semantic representation. 네이버 미소장
9 Advances in Neural Information Processing Systems. Vol. 13. pp. 430 미소장

권호기사보기

권호기사 목록 테이블로 기사명, 저자명, 페이지, 원문, 기사목차 순으로 되어있습니다.
기사명 저자명 페이지 원문 기사목차
연속간행물 팝업 열기 연속간행물 팝업 열기