초록

컴퓨터 비전 알고리즘을 이용한 랜드마크 검출은 다양한 산업 분야에서 요구됩니다. 랜드마크 검출은 human pose estimation(인간 자세 추정)을 기반으로 발전해왔기 때문에 다양한 사물과 실제 환경이 반영된 데이터가 부족하여 다양한 산업 분야에서 요구되는 예측 과제를 수행하기가 어렵다는 한계가 존재합니다. 본 논문에서는 다양한 사물과 실제 환경이 반영된 데이터를 구축하는 것을 목표로 합니다. 12가지의 카테고리(소, 개, 핸드백, 오렌지, 냉장고, 서랍, 아기, 신발, 방, 약지, 눈의 간격, 발)로 구성된 새로운 데이터 구축하였습니다. 현존하는 모델을 이용하여 카테고리별로 랜드마크를 검출하는 연구를 소개합니다. 12가지의 카테고리는 다양한 실제 환경을 반영한 여러 가지의 이미지로 구성되어 있습니다. 이미지 분석에서 좋은 성능을 발휘하고 있는 HRNet을 이용하였습니다. 수집한 이미지 셋에 라벨링을 진행 후, 카테고리별 랜드마크 개수에 맞게 fully connected layer를 수정하여 모델을 학습 후 성능을 평가하였습니다. 실험 결과에 따르면 우리의 방법은 다양한 카테고리별 이미지에 대해 정확한 랜드마크 검출을 보여줍니다.