본 논문은 궤적 데이터에서 이동 객체의 이동 패턴을 추출하기 위해 통계적 궤적 분석과 군집 최적화 방법을 이용한 HMM 기반 시간대별 이동 패턴 마이닝을 제안하였다. 제안 마이닝 기법은 궤적 연관 규칙 기반 알고리즘을 수행하는 과정에서 제기되던 문제점인 Stay Point 위치 정확도, RoI 품질, 이동 패턴 정확도를 개선하였다.
제기된 문제점들을 개선한 세 가지 알고리즘은 첫째, 통계적 궤적 분석을 이용한 Stay Point를 추출 알고리즘이다. 제안한 Stay Point 추출 알고리즘은 GPS 궤적을 가우시안 혼합 모델과 가우시안 분포에 적용한 후, 이상치 검출을 이용하여 실내·외에서 머물렀던 지점을 추출한다. 제안 알고리즘은 사용자가 임의로 설정하는 임계값이 없고, 실내·외에서 머물렀던 지점을 각각 발견할 수 있기 때문에 기존 알고리즘에 비해 신뢰성 향상과 머문 위치의 모호성을 제거할 수 있다. 제안 알고리즘의 성능을 검증하기 위해 기존 Stay Point 추출 알고리즘의 임계값 조정을 통해 생성된 결과 값들과 비교하였다. 검증 결과, 가장 적절한 임계값으로 추출된 결과 값과 유사도(0.567)가 가장 높게 나옴으로서 제안 알고리즘의 정확도를 확인할 수 있었다. 또한, Stay Point 위치를 보정하였고 검증 결과, 약 14%의 데이터 크기 감소효과를 나타내었다.
둘째, 군집 최적화 방법을 이용한 RoI 추출 알고리즘을 제안하였다. 제안 알고리즘은 휴리스틱 기법과 군집 품질 평가를 통해 최적의 DBSCAN 임계값을 결정한다. 제안한 군집 최적화 방법을 검증하기 위해 기존 DBSCAN 임계값 최적화 기법으로 생성된 군집 개수와 품질을 비교 하였다. 검증 결과, 군집 품질은 제안 기법이 58% 향상 되었으며, 군집 개수 대비 군집 품질은 제안 기법이 53% 향상 되었다.
마지막으로, HMM 기반 시간대별 이동 패턴 추출 알고리즘을 제안하였다. 제안 알고리즘은 은닉 마르코프 모델을 이용하여 오전에 이동하는 패턴, 오후에 이동하는 패턴 등 이동 패턴을 시간대별로 분할하여 추출한다. 제안한 알고리즘의 성능을 검증하기 위해 T-pattern miner와 이동 패턴을 비교 하였다. 검증 결과, 주요 지점을 이동하는 패턴을 추출할 확률이 T-pattern miner에 비해 39% 향상 되었다. 또한, 교차 검증 결과 96.75%의 패턴이 일치함으로서 제안 알고리즘의 정확도를 확인할 수 있었다.
본 논문에서 제안한 통계적 궤적 분석과 군집 최적화 방법을 이용한 HMM 기반 시간대별 이동 패턴 마이닝은 기존 궤적 연관 규칙 기반 알고리즘을 활용하는 분야에 적용 가능하며, 조류독감 확산 예측 및 심야버스 노선 분석 등 시간대별 이동 패턴을 파악해야 하는 분야에 적용 가능하다.