표제지
목차
국문요약 9
1. 서론 11
1.1. 연구 배경 11
1.2. 문제 정의 12
1.3. 제안 방법 13
2. 선행연구 15
2.1. 사회 규범적 의사결정에 관한 선행 연구 15
2.1.1. 문화적 차이에 기반한 사회적 규범 위반 실험 설정 16
2.1.2. 죄수의 딜레마 실험 설정 18
2.2. 사회 규범적 의사결정을 학습하기 위한 에이전트에 관한 선행 연구 20
2.2.1. 기존의 강화학습 에이전트 20
2.2.2. 메타 제어 다이나 21
3. 다중 관습 규범 학습 22
3.1. 실험 환경: 사회적 규범 위반 실험 설정 22
3.2. 실험 및 결과 25
3.3. 고찰 28
4. 다중 대인 관계 규범 학습 29
4.1. 실험 환경: 진화론적 죄수의 딜레마 실험 설정 29
4.2. 실험 및 결과 31
4.3. 고찰 32
5. 결론 33
참고문헌 34
ABSTRACT 46
〈표 1〉 죄수의 딜레마 게임의 보수 행렬 18
〈표 2〉 유전적 결함으로 인해 변형된 보수 행렬 19
[그림 1] 문화적 차이에 기반한 사회적 규범 위반 실험 설정 17
[그림 2] 다중 관습 규범을 학습하기 위한 사회적 규범 위반 실험 설정 23
[그림 3] 게임과 세션의 정의 25
[그림 4] 다중 관습 규범 학습을 위한 사회적 규범 실험 설정에서 메타 제어 다이나와 다른 에이전트의 성능 비교 26
[그림 5] 다중 대인 관계 규범을 학습하기 위한 진화론적 죄수의 딜레마 실험 설정 30
[그림 6] 다중 대인 관계 규범 학습을 위한 진화론적 죄수의 딜레마 실험 설정에서 메타 제어 다이나와 다른 에이전트의 성능 비교 31