표제지
초록
목차
제1장 서론 10
제2장 CTGAN(Conditional Tabular GAN) 13
제1절 GAN(Generative Adversarial Nets) 13
제2절 CTGAN(Conditional Tabular Generative Adversarial Nets) 15
1. 연속형 변수의 모드별 정규화(Mode-specific Normalization) 17
2. 범주형 변수의 조건부 생성자(Conditional Generator) 19
제3절 CTGAN의신경망네트워크구조(Network Structure) 22
제3장 재현자료 생성 24
제1절 가계금융복지조사 자료 24
1. 자료 설명 24
2. 선택된 변수에 대한 설명 및 데이터의 분포 24
제2절 재현자료 생성 27
제4장 재현자료 평가 29
제1절 재현자료 평가 측도 29
1. 유용성 31
2. 보안성 41
제2절 재현자료 평가 44
1. 범주형 44
2. 연속형 52
제5장 결론 및 향후 연구 65
부록 67
참고 문헌 69
Abstract 71
표 1. 기초통계량 25
표 2. Scenario 1 범주형 변수들의 재현 결과 45
표 3. Scenario 1 범주형 측도 46
표 4. Scenario 1 CategoricalGCAP, CategoricalZeroCAP 46
표 5. Scenario 1 synthpop을 이용한 범주형 측도 46
표 6. Scenario 2 범주형 변수의 재현 결과 48
표 7. Scenario 2 범주형 측도 48
표 8. Scenario 2 CategoricalGCAP, CategoricalZeroCAP 48
표 9. Scenario 2 synthpop을 이용한 범주형 측도 48
표 10. Scenario 3 범주형 변수의 재현 결과 50
표 11. Scenario 3 범주형 측도 50
표 12. Scenario 3 CategoricalGCAP, CategoricalZeroCAP 50
표 13. Scenario 3 synthpop을 이용한 범주형 측도 50
표 14. 상대편향 비교: 근로소득, 식료품 지출, 세금 52
표 15. 연속형 측도1 비교: 근로소득, 식료품 지출, 세금 53
표 16. 연속형 측도2 비교: 근로소득, 식료품 지출, 세금 53
표 17. synthpop을 이용한 연속형 측도 비교: 근로소득, 식료품 지출, 세금 54
표 18. NewRowSynthesis 비교: 근로소득, 식료품 지출, 세금 54
표 19. 원자료와 Scenario들의 상관 계수 표 62
표 20. 원자료와 Scenario들의 회귀계수 표 63
그림 1. GAN model 13
그림 2. VGM Example 18
그림 3. CTGAN Sampling Process 21
그림 4. 경상소득(조사), 지출(조사) 상자 그림과 히스토그램 26
그림 5. 범주형 변수의 범주별 막대그래프 45
그림 6. 범주형 변수의 범주별 막대그래프 47
그림 7. 범주형 변수의 범주별 막대그래프 49
그림 8. Scenario 1에서 근로소득과 식료품 지출의 산점도 57
그림 9. Scenario 2에서 근로소득과 식료품 지출의 산점도 57
그림 10. Scenario 3에서 근로소득과 식료품 지출의 산점도 58
그림 11. Scenario 1에서 근로소득과 세금의 산점도 58
그림 12. Scenario 2에서 근로소득과 세금의 산점도 59
그림 13. Scenario 3에서 근로소득과 세금의 산점도 59
그림 14. Scenario 1에서 식료품 지출과 세금의 산점도 60
그림 15. Scenario 2에서 식료품 지출과 세금의 산점도 60
그림 16. Scenario 3에서 식료품 지출과 세금의 산점도 61
그림 17. 산출세액과 결정세액간의 산점도 64