1장●인터넷 시대의 사전 편찬과 서비스 - 국립국어원 ‘우리말샘’을 대상으로 - 1. 머리말 2. ‘우리말샘’과 그 편찬 방법 2.1. ‘우리말샘’ 개요 2.2. ‘우리말샘’의 편찬 방법 3. ‘우리말샘’의 구축 현황 3.1. 시스템 3.2. 콘텐츠 4. 맺음말
2장●해외 디지털 사전의 현재와 미래 1. 디지털 사전의 발전 배경 2. 디지털 사전의 변화 양상 2.1. 정보 수집 및 기술의 자동화 2.2. 사전 편찬의 대중화 2.3. 사전의 구조적 해체와 정보의 융합 2.4. 사용자 맞춤형 콘텐츠 2.5. 다언어 사전 개발 활성화 3. 맺음말
3장●웹 사전 서비스 현황과 과제 - 백과사전형 지식 서비스를 중심으로 - 1. 머리말 2. ‘지식’ 개념의 이동 2.1. 백과사전과 지식 2.2. 이 시대의 지식 2.3. 유의미한 지식 2.4. 지식의 개념에 대한 새로운 관심 3. 사용자의 효용과 웹 백과사전의 가능한 모형 3.1. 모바일 시대 사용자의 효용 3.2. 웹 백과사전형 서비스의 가능한 모형 4. 현재의 웹 백과사전형 지식 서비스 5. 맺음말
4장●사전의 시청각 정보 1. 머리말 2. 사전에서의 시각 정보 2.1. 시각 정보의 유형과 기능 3. 사전에서의 청각 정보 3.1. 종이사전 3.2. 전자사전 4. 사전의 동영상 정보 5. 맺음말
5장●새로운 사전의 필요성과 가능성 1. 머리말 2. 사전 환경의 변화 2.1. 사전의 성격 2.2. 사전 환경의 변화 3. 새로운 사전의 필요성과 가능성 3.1. 개신해야 하는 사전 3.2. 아직도 없는 사전 3.3. 기존 자원을 활용한 사전 3.4. 기록을 위한 사전 3.5. 소외된 이를 위한 사전 3.6. 융복합형 사전 4. 맺음말 - 사전 편찬 생태계 복원을 위한 선결 조건
● 찾아보기
이용현황보기
디지털 시대의 사전 이용현황 표 - 등록번호, 청구기호, 권별정보, 자료실, 이용여부로 구성 되어있습니다.
등록번호
청구기호
권별정보
자료실
이용여부
0002583749
400.3 -19-1
서울관 서고(열람신청 후 1층 대출대)
이용가능
0002583750
400.3 -19-1
서울관 서고(열람신청 후 1층 대출대)
이용가능
책속에서
1장인터넷 시대의 사전 편찬과 서비스- 국립국어원 ‘우리말샘’을 대상으로 - 김선철(국립국어원)
1. 머리말 조남호(2015)에 따르면 지금까지 우리나라의 사전 편찬사는 다음과 같이 크게 세 시기로 구분된다고 한다. 첫째, 1945년부터 1957년에 이르는 사전 편찬 기반 강화 시기이다. 이때는 수요 때문에 소사전이 다수 발간되었고 한글학회의 ‘큰사전’이 완간된 기간이다. 둘째, 사전 편찬 활성화 시기이다. 백과사전적 사전들이 경쟁하던 시기로서, 1958년부터 1992년까지로 본다. 셋째, 1986년부터 지금까지의 사전 편찬 방법 혁신 시기이다. 이때는 말뭉치와 컴퓨터를 활용한 새로운 사전 편찬 방법론이 탄생하였고 사전(편찬)학이 활발하게 논의되었으며, 무료 인터넷 사전으로 인하여 인쇄 사전 시장이 축소되었다. 이에 더하여 현재 국립국어원이 만들어 개통한 ‘우리말샘’은 또 하나의 전기(轉機)를 만들고 있는지도 모른다. 이것이 이전까지는 존재하지 않았던 방식으로 편찬되고 운영되는 사전이기 때문이다. 현대의 전산기술을 십분 활용하여 만들고 있는 ‘우리말샘’의 핵심 개념은 몇 차례 학술 발표나 언론 기사를 통해서 사회에 소개된 적이 있는데, 그 모습을 보다 상세하게 이 지면을 통해 소개하려 한다. 제목에 암시된 바와 같이 특히 미시 구조의 내용과 기능 차원에 집중해서 언급할 것이며, 필요에 따라 다른 부가적인 내용도 포함될 것이다.
2. ‘우리말샘’과 그 편찬 방법 2.1. ‘우리말샘’ 개요 ‘우리말샘’(http://opendict.korean.go.kr)은 국립국어원이 2010년에 시작하여 2016년까지 ‘개방형 한국어 지식 대사전 구축’이라는 사업명으로 구축한 국민 참여형 대규모 인터넷 사전의 이름이다. 이 사전은 크게 두 가지 의의를 보이는데, 그 하나는 표준어 중심의 ‘표준국어대사전’(이하 <표준>)에 비하여 신어, 전문 용어, 지역어(방언) 등 실생활에서 쓰이고 있는 많은 어휘를 대폭 등재함으로써 기록을 위한 기술 사전으로서 등재하는 말의 범위를 크게 확대한다는 것이며, 또 다른 하나는 소수의 사전 편찬자만이 아니라 위키백과 사전처럼 일반인도 편집에 참여할 수 있게 하여 사전의 편집 참여 범위를 넓힌다는 것이다. 그러나 국민의 세금으로 운영되는 사전이니만큼 정보 내용에 오류가 발생하는 것은 바람직하지 않기 때문에 전문 편찬자들의 검증 단계가 필요하다. 따라서 집단 지성, 즉 일반인 사용자 참여를 활용하지만 전문가가 최종 단계에서 사실 확인 및 교열 교정을 하는 사전이기 때문에 이러한 측면에서 이제껏 유례가 없는 신개념 사전이라고 할 수 있다. ‘우리말샘’은 또한 각종 생활 용어와 전문 용어를 최대한 망라하는 사전으로 기획되었기 때문에 ‘지식 대사전’으로 특징지을 수 있다. 시중의 서점에서 찾아볼 수 있는 각 분야의 전문 사전들이 대거 통합되었다고 보면 될 것이다. 그래서 이것은 지금까지 존재했던 전통적인 양식의 언어사전이나 백과사전적 국어사전이 아니라 우리가 사용해 왔던 그리고 사용하고 있는 우리말 정보를 모두 집대성하고 이해를 도울 수 있는 음향, 이미지, 동영상 등 각종 다중 매체(멀티미디어) 자료들이 부가되면서, 일반 언중들이 들어와 다양하게 우리말 정보를 깁고 보탤 수 있는 ‘국가 언어 지식 관리 체계’라고 할 수 있다. ‘우리말샘’의 콘텐츠는 불특정 다수가 구축하고 완성하는 것이기 때문에 저작자나 소유자를 특정할 수 없게 된다. 그래서 어떤 국민이든 정보를 자유롭게 퍼갈 수도 있도록 저작물 자유 이용 정책을 채택하였다. 그리고 ‘우리말샘’은 다양한 정보가 흐르는 공간이기 때문에 특정 목적만을 염두에 두고 운영되지는 않는다. 그래서 이 안에 있는 어종별 정보(<일반어, 북한어, 지역어(방언), 옛말>, <관용구, 속담>, <고유어, 한자어, 외래어, 혼종어> 등), 전문 용어 정보, 품사별 정보, 지역별 정보 등 다양한 정보를 각기 식별할 수 있는 표지(tag)로 관리할 수 있으며, 사용자는 어떤 표지를 조건으로 검색을 하느냐에 따라 특정 목적에 맞는 자료를 추출하여 열람하거나 이를 이용함으로써 2차 자료를 다양하게 만들어낼 수 있다. 또한 정보통신 기술을 활용하여 인터넷상에서 언어 자료를 지속적으로 수집, 분석한 후 신어 후보를 추출하고 그에 따른 용례도 같이 검색할 수 있는 실시간 어휘 수집 ? 분석 시스템을 갖추었다. 이는 사전 편찬 단계 이전에 하는 전처리 작업 도구라 할 수 있다. 이 시스템에서 정비한 결과를 활용하는 어휘 생명 주기 분석 시스템도 만들었다. 각각의 전문 용어에 대해서는 전문 분야를 지정해 주어야 하는데, 편찬자가 쉽게 판단할 수 있도록 전문 분야 분석?추천 시스템도 개발하였다. 다만, 현재의 기술 수준으로는 여러 후보를 보여주는 정도에 그치므로 궁극적으로는 지침과 이전 사례를 기준으로 집필자가 최종 판단하여야 한다. ‘우리말샘’에서 가장 눈에 띄는 변화는 관리와 유통을 위한 절대적 기준으로서 기본 단위 항목에 절대 주소를 도입한 것이다. 그래서 가변적이어서 준거 기능을 하기 힘들었던 사전의 동형어 번호를 없애고 그 대신 세부 의미(센스 sense) 단위로 절대 주소를 도입했다. 또한 이를 등재의 기본 단위로 삼아서 단어를 세부 의미 단위로 표제 항목을 영구적으로 관리할 수 있도록 하였다. 예를 들어, 어떤 다의어의 의미 하나가 삭제된다고 하면 그 센스의 번호(주소)에는 다른 센스가 당겨 배정되는 것이 아니라 영구 결번이 된다. 그러나 전통적인 사전의 다의어 기준 표제어 등재가 우리 인간의 언어 인식을 반영하는 것으로 보고 다의어를 묶어 보여주기도 한다. 다만 이러한 동철어에 기존의 어깨번호를 부여하지는 않는다. 그리고 최근 디지털 콘텐츠가 국제적인 연계 자료 은행인 엘오디(LOD: Linked Open Data) 등에서 유통되는 경우가 많아 사전의 구조를 국제 표준 규격에 최대한 부합하도록 하였다. 이를 위하여 현재 국제 표준 기구(ISO)에서 정한 엘엠에프(LMF: Lexical Markup Framework) 규격을 최대한 준용하여 콘텐츠 데이터베이스의 구조를 설계하였다. 또한 ‘우리말샘’의 자료를 많은 사람들이 보다 쉽게 이용할 수 있도록 개방형 인터페이스 규격(Open API)을 채택하였다. 눈에 띄는 다른 변화는 검색 방식과 그 결과의 제시 방식이다. 검색은 포함 검색이 기본이며, 기본 검색 대상은 표제어 및 원어, 대역어, 발음 정보, 속담?관용구, 뜻풀이, 용례이다. 따라서 기본 검색창에 ‘나무’를 입력하여 검색하면 검색 결과에 ‘나무’가 표제항에 포함되어 있는 ‘히말라야삼나무’와 그 발음이 ‘나무’와 같은 ‘남우’까지도 포함되며, ‘Himalaya’를 검색하면 원어에 이것이 들어간 어휘들이 어휘 탭의 검색 결과로 등장한다. 이는 각종 포털에서 제공하는 검색 서비스의 최신 경향을 반영한 것으로, 결국 사용자의 편의를 위한 것이라고 할 수 있다. 또한 전자사전의 장점인 정렬(소팅 sorting) 기능을 적극 활용하여 항목이나 뜻풀이 배열 순서를 사전 편찬자가 만들어 놓은 순서(‘우리말샘순’)로도 볼 수 있고 사용자가 많이 찾아본 순서로도 볼 수 있으며 가장 최근에 편집된 자료 순서로도 볼 수 있도록 하였다. 이 기능을 활용하면 사용자는 자신이 찾고자 하는 뜻풀이를 보다 쉽게 찾을 수 있다. 이와 더불어, 기존의 사전처럼 일치 검색 결과만 모아서 보기를 원하는 사용자를 위하여 일치 검색 결과만을 볼 수 있는 링크를 별도로 제공하기도 한다. 마지막으로, 활용형을 검색어로 넣어도 자동 형태소 분석을 통하여 그 기본형을 찾아주는 기능도 구현하였다. 이는 저빈도 용언을 접한 사용자나 한국어를 아직 잘 모르는 외국인 등에게 유용한 기능이다.