본문 바로가기 주메뉴 바로가기
국회도서관 홈으로 정보검색 소장정보 검색

결과 내 검색

동의어 포함

초록보기

최근 감시, 산업 자동화, IoT 응용의 확산으로 기계가 분석하는 영상 데이터의 양이 인간 소비를 초과하고 있으며, 이에 따라 기계소비를 위한 영상 트래픽이 급격히 증가하고 있다. 이러한 변화에 대응하기 위해, 연산 부담을 에지 디바이스와 클라우드 서버 간에분산하는 분산 신경망 실행 방식이 등장하였으며, 이러한 방식에서는 에지 디바이스에서 생성된 중간 특징의 효율적 전송이 요구된다.

그러나 기존 비디오 부호화 기술은 인간 시각 품질을 기준으로 설계되어 있어, 신경망 중간 특징과 같은 비 시각적 데이터에 최적화되어 있지 않다. 또한, 대규모 데이터 전송이 요구되는 스마트 시티 및 자율주행 환경에서는 원본 영상이나 특징 데이터를 그대로 전송할 경우 네트워크 대역폭이 극심하게 소모된다. 이에 따라, 중간 특징을 효율적으로 압축하면서도 신경망 표현의 중요한 정보를 유지할 수 있는 새로운 부호화 기술의 필요성이 대두되고 있다. 이에, ISO/IEC JTC 1/SC 29 MPEG Video에서는 기계를 위한 특징 부호화(feature coding for machines, FCM) 표준화를 추진하여, 신경망 특징 데이터를 기계 소비에 최적화된 방식으로 압축하는 기술을 개발하고 있다. 본 논문에서는 FCM의 표준화 동향을 소개하고, 부호화 구조 및 성능 평가 조건과 함께 테스트 모델의 성능을 분석한다.

The expansion of surveillance, industrial automation, and IoT applications has led to a significant increase in machine-analyzedvideo traffic, exceeding that intended for human consumption. This shift requires split inference, which shares the computationalload between edge devices and cloud servers, making the transmission of intermediate features generated at the edge necessary.

However, conventional video coding technologies, designed to optimize human visual perception, are not well suited forcompressing non-visual data such as intermediate features. Moreover, in scenarios such as smart cities and autonomous driving,where large volumes of data must be transmitted, directly sending original videos or uncompressed features leads to severe networkbandwidth consumption. Thus, there is a growing need for new coding technologies that can efficiently compress intermediatefeatures while preserving important information needed for machine analysis. In response, ISO/IEC JTC 1/SC 29 MPEG Video haslaunched standardization efforts on Feature Coding for Machines (FCM), which aims to efficiently compress neural networkfeatures optimized for machine vision applications. This paper introduces the FCM standardization progress, coding framework, andevaluation conditions, and analyzes test model performance.

권호기사

권호기사 목록 테이블로 기사명, 저자명, 페이지, 원문, 기사목차 순으로 되어있습니다.
기사명 저자명 페이지 원문 목차
VCM을 위한 휘도 채널 보정 기법 = Luma channel enhancement for VCM 이예지, 윤경로, 이진영, 정순흥 p. 312-319
기계를 위한 오디오 부호화 표준화 동향 분석 = Standardization trends in audio coding for machines 임우택, 장인선, 백승권, 강정원 p. 279-288
FCM을 이용한 기계를 위한 오디오 부호화 기술 연구 = A study on audio encoding technology for machines using FCM 변수빈, 서정일 p. 289-300
VCM 표준화에서의 성능 평가 방법 이슈 및 동향 = Issues and progress in performance evaluation methods for VCM standardization 정민혁, 이예지, 이희경, 이진영, 정순흥, 김상균 p. 301-311
VCM 전송을 위한 비트스트림 구조 설계 = Design of a bitstream structure for streaming of video coding for machines 박기범, 이진영, 정세윤, 김규헌 p. 320-330
기계를 위한 특징 부호화 표준화 동향 = Feature coding for machines : emerging standards and trends 한희지, 이성은, 서예원, 정순흥, 최해철 p. 331-343
FCTM 6.0의 신경망 기반 특징맵 변환 기술 분석 = Analysis of NN-based feature transformation technology in FCTM 6.0 정혜원, 임달홍, 유장현, 이주영, 김휘용 p. 344-354
FCM을 위한 비신경망 기반 피쳐 변환 기술 = Non-NN based feature transform methods for FCM 김연희, 정세윤, 이주영 p. 355-365
선택적 학습기법을 통한 FCM 시험모델 성능 개선 = Enhancement of FCM test model with selective learning strategy 한규웅, 유인근, 이주영, 정세윤, 김재곤 p. 366-376
MPEG FCM에서의 효과적인 비활성화 채널 복원 방법에 관한 연구 = Research on effective restoration method for inactive channel in MPEG FCM 이동민, 정원식, 서정일 p. 377-390
생성형 AI를 활용한 영화 시나리오 창작의 실험적 고찰 = An experimental study on the creation of film scenario using generative AI : focusing on the cyberpunk genre : 사이버펑크 장르를 중심으로 최영희, 박구만 p. 391-401
시계열 전력 데이터 예측을 위한 디퓨전 모델 기반 마스킹 데이터 증강 방법 = A diffusion model-based masking data augmentation method for improving time series power forecasting performance 이재호, 임종경, 배성호 p. 402-417
ECM 기반 서브 블록 단위 화면내 템플릿 매칭 예측 방법 = Sub-block based intra template matching prediction for ECM 강재하, 임웅, 최해철 p. 418-426
스파이크 신경망을 활용한 편광합성개구레이다 영상 기술 연구 = PolSAR image classification using spike neural network 김선옥, 최환효 p. 427-436
1인칭 영상으로부터의 실시간 3차원 전신 자세 추정을 위한 단일 단계 방법 = One-stage method for real-time 3D WholeBody pose estimation from egocentric images 나소연, 장주용 p. 437-448
태권도 시합 판정 보조를 위한 가변 초점 변조 기반 겨루기 동작 인식 시스템 = Adaptive focal modulation-based Kyorugi action recognition system for taekwondo match judgment assistance 이하랑, 윤경로, 심영균 p. 449-460
환경 정보를 활용한 딥러닝 학습 기반의 네트워크 트래픽 예측에 관한 연구 = A study on network traffic prediction based on deep learning training using environmental information 김정윤, 유인태, 김규헌 p. 461-479
확산 모델을 활용한 SAR-광학 영상 변환을 위한 효과적인 데이터 전처리와 증대 기법 = Effective data preprocessing and augmentation methods of SAR images for optical image translation 서형원, 이지상, 박우진, 최해철, 김규헌, 장한얼 p. 480-489