본문 바로가기 주메뉴 바로가기
국회도서관 홈으로 정보검색 소장정보 검색

목차보기

표제지

목차

논문요약 9

제1장 서론 10

제2장 배경 및 관련 연구 14

2-1. 합성곱 신경망 14

2-2. 트랜스포머 14

2-3. 이미지 기반 다중 인물 자세 추정 15

2-4. RF 신호 특성 및 RF 신호 기반 다중 인물 자세 추정 16

2-5. 크로스 모달 슈퍼비전(Cross modal supervision) 19

2-6. 지식 증류 기법(Knowledge distillation) 19

제3장 자세 추정 모델 설계 21

3-1. 모델 개요 21

3-2. 백본 모듈 22

3-3. 자세 추정 모듈 24

제4장 실험 26

4-1. 실험 설계 26

4-2. Multi level 특징 사용 여부 26

4-3. RF 신호 그룹(group) 입력 27

4-4. RF 신호 인코더 stage 별 다운샘플 30

4-5. self-attention block 유무 31

제5장 데이터 수집, 처리 33

5-1. 신호, 이미지 데이터 수집 33

5-2. 의사 레이블 데이터 35

5-3. 딥러닝 모델 입력을 위한 RF 신호 전처리 36

제6장 학습 과정 및 결과 38

6-1. 이분 매칭(bipartite matching) 38

6-2. 학습 과정 38

6-3. 모델 구현 39

6-4. 검증 데이터 성능 평가 42

6-5. 모델 경량화 44

제7장 결론 46

참고문헌 47

ABSTRACT 50

표목차

표 4-1. Multi level 특징 사용 여부에 따른 자세 추정 성능 27

표 4-2. RF 신호 그룹 입력에 따른 자세 추정 성능 30

표 4-3. RF 신호 인코더의 stage 별 다운샘플에 따른 자세 추정 성능 비교 31

표 4-4. self-attention block 유무에 따른 성능 비교. 32

표 5-1. 사람 수에 따른 데이터 개수 34

표 6-1. 학습 하이퍼 파라미터 설정 40

표 6-2. 제안 모델 1 하이퍼 파라미터 설정 41

표 6-3. 제안 모델 2 하이퍼 파라미터 설정 41

표 6-4. 검증 데이터1에 대한 모델별 신체 부위 PCKh@0.5 성능 비교 42

표 6-5. 선행 연구와 제안 모델의 검증 데이터 상황별 PCKh@0.5 성능 비교 43

표 6-6. 각 모델의 파라미터 개수 44

표 6-7. 각 모델 별 학습 에폭 및 시간 45

그림목차

그림 2-1. 이미지 기반, RF 신호 기반 pose estimation 모식도 상단 - 이미지 기반 자세 추정... 17

그림 3-1. 전체 자세 추정 모델 구조 21

그림 3-2. RF 신호 인코더 구조 22

그림 3-3. 트랜스포머 인코더 23

그림 3-4. 자세 추정 모듈 24

그림 4-1. RF 신호 기존 입력 처리 방식 27

그림 4-2. Group size=4, Group stride=4인 경우의 예시 28

그림 4-3. RF 신호 그룹 입력 처리 방식 29

그림 4-4. [내용없음] 8

그림 5-1. 데이터 수집 상황 예시.A, B, C, D 4자리에 송수신기를 옮기며 데이터 수집을 진행했다. 33

그림 5-2. 안테나의 배치 모식도와 실제 안테나 배치 사진 34

그림 5-3. 비가시 상황의 데이터 수집. 좌 - RF 신호 수집 기기의 앞에 장애물이 놓인 모습... 35

그림 5-4. 수집 상황의 이미지와 전처리 전/후 RF 신호. 상단 - 전처리 전 신호(청록). 하단 - 전처리 후 신호(파랑) 37

초록보기

 특정 공간 내에서 사람의 자세를 추정하는 문제는 컴퓨터 비전의 주요 분야 중 하나로 게임, 의료, 재난, 소방 보안, 군사 등 다양한 분야에 활용될 수 있는 중요한 기술이다. 자세 추정 문제는 이미지를 기반으로 시작되었으나, RF 신호의 투과성을 이용해 RF 신호를 기반으로 자세를 추정하는 문제도 많은 관심을 받으며 연구가 진행되었다. RF 신호 기반 자세 추정 문제는 RF 신호의 전처리 간소화, RF 신호 추출 특징의 이미지 추출 특징 학습 등 점점 발전하는 방향으로 연구가 진행되고 있다.

본 논문에서는 상용 RF 신호 장비를 사용하여 다중 사람의 신체로부터 반사된 RF 신호를 통해 신체 주요 부위를 추정하는 다중 사람의 자세 추정 모델을 제안한다. 본 논문은 트랜스포머 기반의 객체 쿼리 기반의 방식으로 one-stage 방식으로 자세 추정 문제를 해결하였으며 RF 신호 기반으로 fully end-to-end 학습이 가능한 모델을 제시하였다.

본 연구에서는 이전 연구의 지식 증류 기법과 사람 탐지 단계를 제거한 뒤 셀프 어텐션 블록을 추가하여 RF 신호의 추출 특징이 자세 추정에 적합하게 추출되도록 설계하였다. 또한, 다중 안테나 RF 신호의 많은 채널수를 고려하여 다각도로 RF 신호의 특징을 추출할 수 있는 RF 신호 인코더를 설계하여 성능은 올리고 모델은 경량화하였다.