본문 바로가기 주메뉴 바로가기
국회도서관 홈으로 정보검색 소장정보 검색

결과 내 검색

동의어 포함

초록보기

비디오 기반 인물 재식별(Video-based Person Re-identification)은 서로 다른 시점의 비중첩 카메라 간에서 동일한 인물을 식별하기 위해 비디오 시퀀스의 시간적 정보를 활용하는 기술이다. 대규모 비전 트랜스포머(ViT) 모델은 최신(SOTA) 수준의 정확도를 달성하지만, 막대한 연산 자원 요구로 인해 엣지 플랫폼이나 임베디드 감시 카메라와 같은 자원 제약형 장치에서는 실제 배포가 어렵다는 한계가 있다.

이러한 문제를 해결하기 위해 지식 증류(Knowledge Distillation)는 대형 교사(teacher) 모델의 지식을 소형 학생(student) 모델로 전달함으로써 경량 모델의 성능을 향상시키는 효과적인 방법으로 주목받고 있다.

그러나 기존의 지식 증류 방식은 학습 초반부터 교사의 지도를 균일하게 적용하여, 초기 표현 학습이 충분하지 않은 상태에서 그래디언트 충돌을 일으키고 학생 모델의 독립적 학습을 방해하는 문제가 있다. 본 논문에서는 이러한 한계를 극복하기 위해 학습 과정 중 교사의 지도 강도를 단계적으로 조정하는 3단계 점진적 지식 증류(3-Phase Progressive Knowledge Distillation) 전략을 제안한다. 구체적으로, (1) 기초 학습 단계(Foundation Phase)에서는 학생 모델이 증류 없이 독립적으로 학습하고, (2) 도입 단계(Introduction Phase)에서는 점진적으로 부분 증류를 적용하며, (3) 정제 단계(Refinement Phase)에서는 완전한 지식 전달을 수행한다. 제안된 접근법은 Rank-1 정확도 73.8%와 평균 정밀도(mean Average Precision, mAP) 68.5%를달성하였다. 본 연구는 단계적으로 계획된 점진적 지식 증류 전략이 자원 제약 환경에서도 효율적인 비디오 기반 인물 재식별 모델의 배포를 가능하게 하면서, 동시에 경쟁력 있는 정확도를 유지할 수 있음을 입증한다.

Video-based person re-identification (PReID) requires matching individuals across non-overlapping camera views using temporal information from video sequences. While large vision transformer (ViT) models achieve SOTA accuracy, their substantial computational requirements limit deployment on resource-constrained devices such as edge platforms, and embedded surveillance cameras. Knowledge distillation offers a solution by transferring knowledge from large teacher models to compact student models. However, traditional distillation methods apply full teacher guidance uniformly from the start of training, creating gradient conflicts and hindering independent student learning when representations are poorly initialized. This paper proposes a novel three-phase progressive knowledge distillation strategy that dynamically adjusts teacher guidance intensity during training: (1) Foundation phase where students train independently without distillation, (2) Introduction phase with gradual partial distillation, and (3) Refinement phase with full knowledge transfer.

Our approach achieves 73.8% Rank-1 accuracy and 68.5% mAP. This work demonstrates that scheduled progressive knowledge distillation enables efficient video-based person ReID deployment on resource-constrained platforms while maintaining competitive accuracy.

권호기사

권호기사 목록 테이블로 기사명, 저자명, 페이지, 원문, 기사목차 순으로 되어있습니다.
기사명 저자명 페이지 원문 목차
AIS 데이터를 활용한 DQN 기반 선박 항로 예측에서 탐험-활용 전략 분석 = Analysis of exploration-exploitation strategies in DQN-based vessel route prediction using AIS data 김단우, 이장하, 이하나, 강상우 p. 1-15
비정형 데이터 시대의 정보시스템 연구 지형 = The landscape of information systems research in the era of unstructured data : the expansion of text mining and its intellectual structure : 텍스트 마이닝의 확산과 지적 구조 분석 안재영, 임혜정 p. 17-40
설명가능한 인공지능 기반 비형식학습 효과성 분석 및 참여자 추천 애널리틱스 = Sustainable lifelong learning : explainable AI-driven analytics for informal learning effectiveness and personalized recommendations : 지속 가능한 평생학습 유도를 위하여 유효정, 조은지, 이현서, 김경원 p. 41-84
강화학습 적용에 따른 조류 발생 예측 딥러닝 모형 성능 분석 = Performance analysis of a deep learning model for algal bloom prediction with reinforcement learning 박정수, 허태영 p. 81-93
GLUE를 활용한 언어 모델 파인 튜닝 성능 변화 평가 = Evaluating fine-tuning performance variations of BERT models using the GLUE benchmark 홍유석, 김진 p. 95-109
Onboard AI 기반 차량용 이더넷 환경에서의 실시간 비디오 스트리밍 전송 안정성 향상 연구 = An onboard AI-based approach for robust live video streaming over automotive ethernet 이주형, 고경민 p. 111-127
AI 챗봇 서비스 실패가 사용자 감정과 이탈 의도에 미치는 영향 = The effects of AI chatbot service failure on users’ emotions and discontinuance intention 조상리, 정석찬 p. 129-141
생성형 AI 시대 마케팅 업무 전환과 핵심 역량의 동적 재구성 = Generative AI–driven marketing transformation and the dynamic reconfiguration of core competencies : a Delphi study of practitioners : 실무 전문가 델파이 연구 이용제, 김주희, 강주영 p. 143-161
사회연결망 분석을 통한 풀필먼트 센터의 재고배치에 관한 연구 = A study on inventory allocation in fulfillment centers using social network analysis 차대욱, 이강현, 신광섭 p. 163-182
디지털 환경에서 브랜드 스토리텔링이 소비자–브랜드 간 심리적 유대를 형성하는 메커니즘 = The power of stories : the mechanism by which digital-age brand storytelling fosters psychological bonds between consumers and brands 유몽, 김엘레나, 최재원 p. 183-210
소비자 불만이 전기차 위험 인식과 회피 의도에 미치는 영향 = The impact of consumer complaints on EV risk awareness and avoiding intentions : from the perspectives of HBM and TTAT : HBM과 TTAT 관점에서 왕문준, 이맹릉, 최재원 p. 211-228
연합학습 기반 개인건강데이터 프라이버시 보호형 AI-Agent 시스템 연구 = Research on a privacy-preserving AI-agent system for personal health data based on federated learning 정진용, 송인서, 이강윤 p. 229-240
멀티모달 임베딩 융합 기반 해빙 농도 장기 예측 모델 설계 = Design of a multimodal embedding fusion-based model for long-term sea ice concentration forecasting 이승우, 심성현 p. 241-256
시공간 이중 분기 트랜스포머를 이용한 태양광 발전량 장기 예측 = A spatiotemporal dual-branch transformer for long-term solar power forecasting 김영휘, 심성현 p. 257-279
감성 분석을 활용한 다중 모달 Bi_LSTM 주가 예측 = Multimodal stock price prediction using Bi-LSTM and sentiment analysis 박찬규, 김가은, 양지호, 신미수 p. 281-294
강화학습을 활용한 도심내 소규모 배송거점 네트워크 구축 방안에 관한 연구 = A study on strategies for building urban micro-depot networks using reinforcement learning 이강현, 방선호, 박순호, 신광섭 p. 295-308
액체 시간상수 신경망을 활용한 KOSPI 등락 예측 = Forecasting KOSPI movements using liquid time-constant neural networks 고영보, 안현철 p. 309-318
Progressive knowledge distillation for efficient video-based person re-identification = 효율적인 비디오 기반 개인 재식별을 위한 점진적 지식 정제 Kong Vungsovanreach, Phyoungjung Kim, Wan-Sup Cho p. 319-329
Spatio-temporal transformer network for abnormal human action detection in surveillance video = 감시 영상에서 비정상적인 인체 행동 탐지를 위한 시공간 트랜스포머 네트워크 Saravit Soeng, Kim, Seong-Ik, Cho, Wan-Sup p. 331-343
인공지능을 이용한 인간의 감정 인식 연구 = A study on emotion recognition of human using artificial intelligence 이준호, 이은지, 김진화 p. 345-359