목차

표제지

목차

국문요약 14

Ⅰ. 서론 16

1. 필요성 및 연구목적 16

2. 연구대상 및 방법 25

Ⅱ. 이론적 배경 28

1. 인공지능 음악의 정의 28

2. 음악적 표현 32

3. 이론적 관점 35

3.1. 21세기의 작곡 방식 35

3.2. 인공지능 음악의 표현 40

Ⅲ. 인공지능 기반 음악 생성 기술 42

1. 인공지능 알고리즘 모델 42

1.1. 머신 러닝 42

1.2. 인공신경망 52

1.3. 활성화 함수 60

1.4. 차세대 인공신경망 63

1.5. 사용 사례 분석 73

2. 인공지능 생성 음악의 한계점 82

2.1. 음악적 한계점 82

2.2. 기술적 한계점 87

3. 인공지능 생성 음악의 산업적 융합 91

3.1. 배경 음악의 표현 증강 91

3.2. 작곡가의 보조적 역할 96

Ⅳ. 시스템 설계 사전 준비 99

1. 모델 학습 방식 선정 99

2. 신뢰성 검증 방안 102

3. 선행 연구 106

Ⅴ. 시스템 설계 및 구현 110

1. 시스템 개발 목표 110

2. 전문가 선발 및 연구 분담 113

3. 데이터 전처리 115

3.1. 음원 수집 115

3.2. 음원 분리 118

3.3. 음원 변환 122

3.4. 음원 정규화 128

4. 1차 실험: 모델 구조 최적화 130

5. 2차 실험: 활성화 함수 조정 173

6. 3차 실험: 학습 특성 중요도 평가 183

7. 4차 실험: 정량적 지표 교차검증 188

8. 5차 실험: 클러스터 기반 학습 190

9. 결과 분석 201

Ⅵ. 결론 211

1. 연구의 차별성 211

2. 한계점 및 제언 216

3. 향후 발전 예상 219

참고문헌 221

ABSTRACT 250

부록 253

부록 1. 전체 학습 데이터 253

부록 2. 전체 학습 데이터 8분 음표 단위 262

부록 3. 3차 실험 음표 별 표현 생성 292

부록 4. 3차 실험 4분 음표 별 표현 생성 293

부록 5. 3차 실험 8분 음표 별 표현 생성 294

부록 6. Code Data_ MakeDataset 295

부록 7. Code Data_ CompareVelocity 297

부록 8. Code Data_ Model 1(일부 예시) 299

부록 9. Code Data_ Model_2(일부 예시) 300

부록 10. Code Data_ Model_3(일부 예시) 301

〈표 1〉 음악과 언어의 차이 32

〈표 2〉 초매개변수 탐색 방법에 대한 표 50

〈표 3〉 차세대 인공 신경망 모델 특징 비교 72

〈표 4〉 알고리즘 모델 인풋 - 오프셋 100

〈표 5〉 전문가 이력 114

〈표 6〉 A Pop Genre Organized Spreadsheet(일부 예시) 116

〈표 7〉 A R&B Genre Organized Spreadsheet(일부 예시) 117

〈표 8〉 A Rock Genre Organized Spreadsheet(일부 예시) 117

〈표 9〉 1차 실험 모델 별 벨로시티 생성 차트 164

〈표 10〉 모델 1 실험 별 구조 및 활성화 함수 165

〈표 11〉 모델 2 실험 별 구조 및 활성화 함수 1 166

〈표 12〉 모델 2 실험 별 구조 및 활성화 함수 2 167

〈표 13〉 모델 2 실험 별 구조 및 활성화 함수 3 168

〈표 14〉 모델 3 실험 별 구조 및 활성화 함수 4 169

〈표 15〉 모델 3 실험 별 구조 및 활성화 함수 5 170

〈표 16〉 모델 3 실험 별 구조 및 활성화 함수 6 171

〈표 17〉 모델 3 실험 별 구조 및 활성화 함수 7 172

〈표 18〉 2차 실험 모델 3-7 분석 차트 182

〈표 19〉 음표 별 생성 표 184

〈표 20〉 4분 음표 별 생성 표 185

〈표 21〉 8분 음표 별 생성 표 186

〈표 22〉 Cosine Similarity 교차 검증 표 188

〈표 23〉 오차 범위 측정 4분 음표 기준 192

〈표 24〉 오차 범위 측정 8분 음표 기준 - 1 193

〈표 25〉 오차 범위 측정 8분 음표 기준 - 2 194

〈표 26〉 기준 변경 오차 범위 측정 4분 음표 기준 198

〈표 27〉 기준 변경 오차 범위 측정 8분 음표 기준 1 198

〈표 28〉 기준 변경 오차 범위 측정 8분 음표 기준 2 199

〈그림 1〉 장프랑수아 "밀레의 이삭 줍는 여인들" 20

〈그림 2〉 살바도르 달리 "기억의 지속" 20

〈그림 3〉 학술 논문 등재 현황 22

〈그림 4〉 분야별 학위 논문 등재 현황 22

〈그림 5〉 인공지능 기술의 구성 요소 42

〈그림 6〉 지도 학습 과정 43

〈그림 7〉 비지도 학습 과정 44

〈그림 8〉 비지도 학습 과정 45

〈그림 9〉 강화 학습 과정 46

〈그림 10〉 Overall Algorithm Framework Schematic 53

〈그림 11〉 활성화 함수 수식 및 그래프 60

〈그림 12〉 3개의 레이어로 구성 된 간소화 된 CapsNet 63

〈그림 13〉 디코더 구조와 DigitCaps 레이어를 사용한 복원 64

〈그림 14〉 Multi-Head, Scaled Dot-Product Attention 66

〈그림 15〉 The Transformer - Model Architecture 67

〈그림 16〉 Spiking Neural Network의 수식 68

〈그림 17〉 A.I.V.A 구동 화면 76

〈그림 18〉 A.I.V.A 설정 화면 77

〈그림 19〉 A.I.V.A 생성 음악 악보 78

〈그림 20〉 Magenta Project Generate 4bars 생성 결과 확인 80

〈그림 21〉 Magenta Project Generate 4bars 악보 분석 81

〈그림 22〉 알고리즘 모델 인풋 - 음정 99

〈그림 23〉 알고리즘 모델 인풋 - 듀레이션 101

〈그림 24〉 코사인 유사도 104

〈그림 25〉 시스템 개발 다이어그램 112

〈그림 26〉 Using Logic Pro X to Represent MIDI files 118

〈그림 27〉 분리 되지 않은 선율 데이터 119

〈그림 28〉 GaudioLabs의 음원 분리 과정 1 121

〈그림 29〉 GaudioLabs의 음원 분리 과정 2 121

〈그림 30〉 Ableton Live 11과 Logic Pro X의 기능 비교화면 127

〈그림 31〉 전체 구조도 130

〈그림 32〉 모델 1의 첫 번째 실험 131

〈그림 33〉 모델 1 첫 번째 실험의 손실률 및 학습속도 131

〈그림 34〉 모델 1의 두 번째 실험 132

〈그림 35〉 모델 1 두 번째 실험의 손실률 및 학습속도 133

〈그림 36〉 모델 1의 세 번째 실험 134

〈그림 37〉 모델 1 세 번째 실험의 손실률 및 학습속도 134

〈그림 38〉 모델 2의 첫 번째 실험 136

〈그림 39〉 모델 1 세 번째 실험의 손실률 및 학습속도 136

〈그림 40〉 모델 2의 두 번째 실험 137

〈그림 41〉 모델 2 두 번째 실험의 손실률 및 학습속도 138

〈그림 42〉 모델 2의 세 번째 실험 139

〈그림 43〉 모델 2 세 번째 실험의 손실률 및 학습속도 139

〈그림 44〉 모델 2의 네 번째 실험 140

〈그림 45〉 모델 2 네 번째 실험의 손실률 및 학습속도 141

〈그림 46〉 모델 2의 다섯 번째 실험 142

〈그림 47〉 모델 2 다섯 번째 실험의 손실률 및 학습속도 143

〈그림 48〉 모델 2의 여섯 번째 실험 144

〈그림 49〉 모델 2 여섯 번째 실험의 손실률 및 학습속도 145

〈그림 50〉 모델 3의 첫 번째 실험 146

〈그림 51〉 모델 3 첫 번째 실험의 손실률 및 학습속도 146

〈그림 52〉 모델 3의 두 번째 실험 148

〈그림 53〉 모델 3 두 번째 실험의 손실률 및 학습속도 148

〈그림 54〉 모델 3의 세 번째 실험 149

〈그림 55〉 모델 3 세 번째 실험의 손실률 및 학습속도 150

〈그림 56〉 모델 3의 네 번째 실험 151

〈그림 57〉 모델 3 네 번째 실험의 손실률 및 학습속도 151

〈그림 58〉 모델 2~3 실험의 음의 세기 생성 비교 153

〈그림 59〉 학습 데이터_The Police 외 3곡 154

〈그림 60〉 Source data_Michael Jackson - Billie Jean 악보 155

〈그림 61〉 모델 3의 다섯 번째 실험 256 메모리 셀 156

〈그림 62〉 모델 3 다섯 번째 실험의 손실률 및 학습속도 157

〈그림 63〉 모델 3의 여섯 번째 실험 512 Memory cell 159

〈그림 64〉 모델 3 여섯 번째 실험의 손실률 및 학습속도 159

〈그림 65〉 모델 3의 여섯 번째 실험 1,000회 학습 160

〈그림 66〉 모델 3의 일곱 번째 실험 161

〈그림 67〉 모델 3의 일곱 번째 실험 손실률 및 학습 속도 162

〈그림 68〉 지정곡에 활성화 함수 실험 및 Model3, S7 실험 1 175

〈그림 69〉 지정곡에 활성화 함수 실험 및 Model3, S7 실험 2 176

〈그림 70〉 지정곡에 모델 3 활성화 함수 실험 177

〈그림 71〉 지정곡에 Model3, S7 실험 177

〈그림 72〉 1980~2000년 빌보드 연말 차트 탑100 장르 분포 178

〈그림 73〉 음표, 4분 음표, 8분 음표 별 오차 비교 187

〈그림 74〉 Cosine Similarity 교차 검증 189

〈그림 75〉 오차 범위 측정 4분 음표 기준 191

〈그림 76〉 오차 범위 측정 8분 음표 기준 195

〈그림 77〉 1차 실험 소스 데이터, 생성 데이터, 표준 편차 비교 195

〈그림 78〉 학습 데이터 변경 오차 범위 측정 199

〈그림 79〉 전체 실험 구조도 201

〈그림 80〉 모델 설계 - 데이터 생성 - 신뢰도 교차 검증 212