권호기사보기
| 기사명 | 저자명 | 페이지 | 원문 | 기사목차 |
|---|
결과 내 검색
동의어 포함
비디오 기반 인물 재식별(Video-based Person Re-identification)은 서로 다른 시점의 비중첩 카메라 간에서 동일한 인물을 식별하기 위해 비디오 시퀀스의 시간적 정보를 활용하는 기술이다. 대규모 비전 트랜스포머(ViT) 모델은 최신(SOTA) 수준의 정확도를 달성하지만, 막대한 연산 자원 요구로 인해 엣지 플랫폼이나 임베디드 감시 카메라와 같은 자원 제약형 장치에서는 실제 배포가 어렵다는 한계가 있다.
이러한 문제를 해결하기 위해 지식 증류(Knowledge Distillation)는 대형 교사(teacher) 모델의 지식을 소형 학생(student) 모델로 전달함으로써 경량 모델의 성능을 향상시키는 효과적인 방법으로 주목받고 있다.
그러나 기존의 지식 증류 방식은 학습 초반부터 교사의 지도를 균일하게 적용하여, 초기 표현 학습이 충분하지 않은 상태에서 그래디언트 충돌을 일으키고 학생 모델의 독립적 학습을 방해하는 문제가 있다. 본 논문에서는 이러한 한계를 극복하기 위해 학습 과정 중 교사의 지도 강도를 단계적으로 조정하는 3단계 점진적 지식 증류(3-Phase Progressive Knowledge Distillation) 전략을 제안한다. 구체적으로, (1) 기초 학습 단계(Foundation Phase)에서는 학생 모델이 증류 없이 독립적으로 학습하고, (2) 도입 단계(Introduction Phase)에서는 점진적으로 부분 증류를 적용하며, (3) 정제 단계(Refinement Phase)에서는 완전한 지식 전달을 수행한다. 제안된 접근법은 Rank-1 정확도 73.8%와 평균 정밀도(mean Average Precision, mAP) 68.5%를달성하였다. 본 연구는 단계적으로 계획된 점진적 지식 증류 전략이 자원 제약 환경에서도 효율적인 비디오 기반 인물 재식별 모델의 배포를 가능하게 하면서, 동시에 경쟁력 있는 정확도를 유지할 수 있음을 입증한다.
Video-based person re-identification (PReID) requires matching individuals across non-overlapping camera views using temporal information from video sequences. While large vision transformer (ViT) models achieve SOTA accuracy, their substantial computational requirements limit deployment on resource-constrained devices such as edge platforms, and embedded surveillance cameras. Knowledge distillation offers a solution by transferring knowledge from large teacher models to compact student models. However, traditional distillation methods apply full teacher guidance uniformly from the start of training, creating gradient conflicts and hindering independent student learning when representations are poorly initialized. This paper proposes a novel three-phase progressive knowledge distillation strategy that dynamically adjusts teacher guidance intensity during training: (1) Foundation phase where students train independently without distillation, (2) Introduction phase with gradual partial distillation, and (3) Refinement phase with full knowledge transfer.
Our approach achieves 73.8% Rank-1 accuracy and 68.5% mAP. This work demonstrates that scheduled progressive knowledge distillation enables efficient video-based person ReID deployment on resource-constrained platforms while maintaining competitive accuracy.*표시는 필수 입력사항입니다.
| 전화번호 |
|---|
| 기사명 | 저자명 | 페이지 | 원문 | 기사목차 |
|---|
| 번호 | 발행일자 | 권호명 | 제본정보 | 자료실 | 원문 | 신청 페이지 |
|---|
도서위치안내: 정기간행물실(524호) / 서가번호: 국내12
2021년 이전 정기간행물은 온라인 신청(원문 구축 자료는 원문 이용)
우편복사 목록담기를 완료하였습니다.
*표시는 필수 입력사항입니다.
저장 되었습니다.