인터넷에 존재하는 많은 정보들을 다양한 기준에 따라 선별하여 보여주는 추천 시스템에 대한 수요가 점점 늘어나면서, 관련 기술 또한 발전해왔다. 그 중, 고객의 선호도 정보를 분석해 고객 간의 또는 아이템 간의 유사도를 측정하고, 이것을 기준으로 아이템을 추천하는 기법을 협업 필터링이라고 한다. 데이터양이 많아질수록 추천 결과가 보다 정확하여 성능이 좋아진다는 장점이 있어 다양한 분야에서 활용되고 있다.
그러나 한계점도 존재한다. 선호도 정보가 충분히 존재하지 않으면 추천 시스템의 성능이 저하되는 희박성 문제, 데이터양이 많아질수록 연산 시간이 기하급수적으로 늘어나는 확장성 문제 등이 대표적인 한계점으로 꼽힌다. 이러한 한계점을 개선하기 위한 연구가 지속되어 왔지만, 보다 실용적인 연구가 필요하다. 따라서 본 논문에서는 협업 필터링 추천 기법의 희박성과 확장성이라는 한계점을 2단계의 군집분석을 통해 개선한 협업 필터링 기법을 제안하였다. 첫 번째로 희박성 문제 개선 방법을 연구했다. 고객 기본 정보 데이터를 활용해 군집분석을 한 후, 군집의 선호도 정보를 바탕으로 특정 고객의 선호도 점수를 예측해 고객 X 아이템 매트릭스를 채우는 방식을 제안하였다. 두 번째로는 확장성 문제를 개선하기 위하여 군집분석을 통해 데이터 공간을 줄이는 방식을 제안하였다. 마지막으로 본 논문에서 제안하는 방법을 통해 협업 필터링 기법의 성능이 얼마나 개선되었는지 실험을 통해 검증하였다. 본 연구를 통해 협업 필터링 추천 시스템의 고질적인 문제였던 희박성과 확장성 문제를 개선하여 고객 선호도 정보가 부족하더라도, 데이터양이 많더라도 보다 정확하고 빠른 추천을 해줄 수 있다.