목차

표제지

국문 초록

목차

1. 서론 8

2. 관련 연구 11

3. 제안하는 오디오 분류 시스템 14

3.1. 엣지 AI 노드 15

3.2. FIWARE 기반 서버 17

4. 딥러닝 모델 개발 19

4.1. 딥러닝 모델 개발 환경 19

4.2. 학습용 데이터 구축 19

4.3. 성능 평가 지표 23

4.4. 모델 개발 과정 24

4.5. 딥러닝 모델 튜닝 결과 27

4.5.1. 단일 레이블 분류 모델 튜닝 27

4.5.2. 다중 레이블 분류 모델 튜닝 30

4.6. 딥러닝 모델 구조 35

5. 프로토타입 성능 평가 37

5.1. 추론 환경 37

5.2. 프로토타입 시스템 동작 검증 37

6. 결론 41

참고 문헌 42

Abstract 46

표 1. 엣지 노드 구성 요소 16

표 2. 딥러닝 모델 개발 환경 19

표 3. 통합 데이터셋 요약 20

표 4. 다중 레이블 분류 딥러닝 모델의 성능 평가 지표 23

표 5. 모델 개발 파라미터 25

표 6. 베이스라인 모델 특징 요약 27

표 7. 베이스라인 모델의 성능 비교 28

표 8. 입력 오디오 길이에 따른 소음 분류 정확도 30

표 9. 다중 레이블 분류 모델 개발 파라미터 31

표 10. 배치 크기에 따른 모델의 다중 레이블 분류 성능 31

표 11. 풀링 크기에 따른 모델의 다중 레이블 분류 성능 32

표 12. 컨볼루션 레이어 수에 따른 모델의 다중 레이블 분류 성능 33

표 13. LSTM 유닛 수에 따른 모델의 다중 레이블 분류 성능 33

표 14. 개발한 딥러닝 모델의 분류 성능 34

표 15. Dynamic range Quantization를 적용한 모델의 분류 성능 36

표 16. 프로토타입 시스템 추론 환경 37

표 17. 엣지 AI 노드에서의 태스크별 소요 시간 38

그림 1. 제안하는 시스템 구조 14

그림 2. 엣지 노드 프로토타입의 내부 구성 17

그림 3. FIWARE 서버 구조 18

그림 4. 슬라이딩 윈도우 기법을 통한 데이터 증강 21

그림 5. 증강 기법 적용 전후의 데이터 분포 21

그림 6. 다중 레이블 오디오 데이터 생성 방법 22

그림 7. 다중 레이블 오디오 분류 모델 개발 과정 24

그림 8. 비트 실수와 32 B 비트 정수 사이의 양자화 변환 과정 26

그림 9. 오디오 길이와 sampling rate에 따른 정확도와 연산량 29

그림 10. 최종 딥러닝 모델의 구조 35

그림 11. 프로토타입 시스템에서의 실시간 시각화 결과 39