초록

정보기술의 발전에 따라 다양한 유형의 영상데이터의 양이 급격히 증가하고 있어 이에 따른 비정형 영상 빅데이터를 기반으로 인물이나 사물 등을 인식하여 의미 있는 정보를 추출하고 내용을 시각적으로 분석하여 활용하기 위한 요구사항이 증대되고 있다.

현재 영상 인식을 위한 학습 기술은 Labeled data기반의 감독 학습 기술과 Unlabeled data기반의 비 감독 학습 기술로 분류되어 지고 있다. Labeled data기반의 감독 학습 기술은 해당 자료에 대한 지식을 기반으로 학습하는 방법이며, Unlabeled data 기반의 비 감독 학습 기술은 이러한 지식의 도움 없이 스스로 학습하는 방법이다. 즉, 사람이 개입하지 않는 자가 학습이다.

가트너 그룹이 발표한 「2017년 기술 트렌드를 이끌 10대 전략 기술」에 따르면 인공지능과 고급머신 러닝인 딥러닝(deep learning), 신경망 등 첨단 기법들이 정통적인 규칙 기반 알고리즘을 넣어 이해, 학습, 예측 및 적응할 뿐 아니라 잠재적으로 스스로 가동되는 자율 시스템의 발전을 예측하고 있다. 또한 인공지능 플랫폼의 오픈소스 화 현황으로 인해 누구나 인공지능 기술을 테스트하기 위하여 활용할 수 있는 환경이 이루어졌다. 이에 대한 예로 구글은 머신러닝(기계학습)을 위한 오픈소스 소프트웨어 라이브러리인 텐서플로우 개방과 함께 인공지능 연구 플랫폼인 딥 마인드랩(DeepMind Lab)을 공개하였다. 인공지능 생태계 구축과 함께 딥러닝 소프트웨어뿐 아니라 이미지 패턴인식 등 비정형 영상 빅데이터의 의미있는 정보를 추출하기 위한 딥러닝의 활용이 두드러지고 있다. 하지만 영상 빅데이터 기반의 의미있는 정보를 추출하기 위한 학습기술로 제시되어지는 Labeled data 기반의 감독 학습기술은 특징을 추출하는 방법으로 SIFT, K-Nearest Neighbor(KNN)알고리즘 등이 기존에 제시되어 있지만 이들 방법은 사람이 직접 설계한 것으로 영상 데이터의 복잡한 패턴을 모두 분석하기에는 어려움이 있다.

또한 영상에서와 같이 대용량 데이터에서의 이미지 분류과정에서는 데이터 전처리기에 따라 성능이 크게 좌우되는데 이에 대한 연구는 미흡한 실정이다. 따라서 본 논문에서는 이미지 데이터 분류를 위해 딥러닝을 통한 콘볼루션 뉴럴 넷(CNN)를 영상데이터로 확장해 영상의 위상학적 구조를 학습하고 픽셀 영상으로부터의 전처리기 함수에 대한 성능 분석과 이를 이용한 이미지 분류에서의 빠른 최적점을 찾는다. 또한 파라미터 설정을 통해 이미지 분류에서의 정확성을 높임과 동시에 손실률을 줄인다. 이때 훈련데이터와 평가데이터의 정확성 평가에서 두 값의 차이를 줄여 Overfitting을 방지하는 연구를 진행하고, 콘볼루션 뉴럴 넷을 통한 이미지 분류와 타 이미지 분류기에 비해 비교적 좋은 성능을 보였던 RandomForestClassifier 분류기와 비교를 한다. 이때의 이미지 분류의 정확성과 손실률을 비교 분석하여 이미지 데이터 분류의 개선을 위한 파라미터 설정과 모델 인스턴스화에 관하여 연구한다.