권호기사보기
기사명 | 저자명 | 페이지 | 원문 | 기사목차 |
---|
대표형(전거형, Authority) | 생물정보 | 이형(異形, Variant) | 소속 | 직위 | 직업 | 활동분야 | 주기 | 서지 | |
---|---|---|---|---|---|---|---|---|---|
연구/단체명을 입력해주세요. |
|
|
|
|
|
* 주제를 선택하시면 검색 상세로 이동합니다.
Contents
Character segmentation using side view feature in machine-printed optical character recognition / Minchul Jung 1
Abstract 1
요약 1
I. Introduction 1
II. Side View and Character Segmentation 3
2.1. Side Views of Touching Characters 3
2.2. Character Width and Prototype 4
2.3. Rightside View Matching 4
2.4. Segmental Cost and Tangent Cost 5
2.5. Distance Normalization 6
2.6. Verification of Character Segmentation 7
III. Experiment Results 8
IV. Conclusions 9
References 9
Author 10
This paper defines four side views of a character and proposes a new character segmentation method of machine printed character recognition. The merged parts of touching characters generate different shapes of patterns from the primitive character patterns. However, the leftmost side and the rightmost side of touching characters will not be affected by the touching. The analysis of those side views gives the candidate single characters for touching characters, since a side view of each character is unique. Though characters in variable pitch have different widths, they can be grouped into thirteen classes. When it segments touching characters from the right to the left, the rightside view of touching characters provides a specific width among thirteen classes according to the candidate. In addition, both a segmental cost and a tangent cost are defined to find an optimal cut path. After touching characters are segmented with the width of a candidate character, the other side views of the segmented pattern are verified with those of a prototype character. The performance of the character segmentation has been obtained using a real envelope reader system, which can recognize address blocks in US mail pieces and sort the mail pieces. 100 mail pieces were tested. The experiment results have shown that the improvement was from 79% to 91% by the proposed character segmentation.
본 논문에서는 문자의 측면 특징을 정의하고, 인쇄체 영문 인식에서 문자를 분할하는 새로운 방법을 제안한다. 접합 문자의 접합 부분에는 원래 모양과는 전혀 다른 패턴이 생성된다. 그러나 접합 문자의 최좌측면과 최우측면은 접합에 영향을 받지 않는다. 각 문자의 측면 특징을 이용하여 이러한 최좌측면과 최우측면을 분석하면 접합 문자내의 문자 후보를 알 수 있다. 가변 피치에 있는 문자는 문자의 폭이 모두 다르지만, 열세개의 그룹으로 나눌 수 있다. 오른쪽에서 왼쪽으로 폭을 측정하여 접합 문자를 분할할 때, 접합 문자의 우측면 특징은 문자 후보에 따라 문자 폭을 구해낸다. 또한 본 논문에서는 분할 비용과 접선 비용을 정의하여 분할의 최적합선을 찾아낸다. 초기 분할 후, 분할된 패턴의 우측면외의 나머지 측면 특징은 분할 후보 문자의 프로토타입과 비교되어 검증된다. 문자 분할의 성능을 실험하기위해 미국 우편 봉투에서 수집한 실제 주소 백 개를 사용하였다. 실험 결과는 기존의 윤곽선 분석을 이용한 문자 분할 방법이 79%를 성공한 반면 제안한 문자 분할 방법은 91%를 성공하여 12%의 성능 향상을 보였다.
*표시는 필수 입력사항입니다.
*전화번호 | ※ '-' 없이 휴대폰번호를 입력하세요 |
---|
기사명 | 저자명 | 페이지 | 원문 | 기사목차 |
---|
번호 | 발행일자 | 권호명 | 제본정보 | 자료실 | 원문 | 신청 페이지 |
---|
도서위치안내: 정기간행물실(524호) / 서가번호: 국내13
2021년 이전 정기간행물은 온라인 신청(원문 구축 자료는 원문 이용)
우편복사 목록담기를 완료하였습니다.
*표시는 필수 입력사항입니다.
저장 되었습니다.