국내기사
AI 학습용 데이터의 이용 행태 및 구조적 소비 패턴 분석 : AI 허브 로그 데이터 기반 연관 규칙 및 사회 연결망 분석 = Usage behavior and structural consumption patterns in AI training data platforms : a study on AI-hub log data using association rules and SNA
최근 초거대 AI의 부상으로 고품질 학습용 데이터의 중요성이 증대됨에 따라, 본 연구는 기존설문조사 기반 연구의 한계를 넘어 대규모 로그 데이터를 활용해 AI 허브 이용자의 실제 데이터 소비행태를 실증적으로 규명하고자 하였다. 이를 위해 2024년과 2025년의 이용 로그를 바탕으로 이용 그룹별 방식 변화를 통계적으로 검증하고, 연관 규칙 및 사회 연결망 분석(SNA)을 통해 데이터 간의 구조적 관계를 시각화하였다. 분석 결과, 개인 이용자는 웹 중심의 탐색을 유지하는 반면, 기업 및 기관이용자는 API 기반의 자동화된 이용 방식으로 급격히 전환되고 있음이 확인되었다. 또한 데이터 소비 패턴 분석 시, 텍스트 데이터는 네트워크 전반에 걸쳐 높은 연결 중심성을 가지며, 영상 및 이미지데이터는 높은 향상도(Lift)를 기반으로 특정 도메인 내에서 강하게 결합된 형태의 소비 특성을 보였다. 본 연구는 이러한 결과를 바탕으로 이용자 유형에 따른 이원화된 플랫폼 운영 정책과 데이터 특성을 고려한 큐레이션 전략을 제안한다.