본문 바로가기 주메뉴 바로가기
국회도서관 홈으로 정보검색 소장정보 검색

목차보기

표제지

목차

국문초록 13

제1장 서론 14

제1절 연구의 배경 14

제2절 연구의 목적 15

제3절 연구의 범위와 방법 17

제2장 이론적 고찰 및 선행연구 검토 20

제1절 전통적 통계 계량모형 20

1. ARIMA 모형 20

2. VAR 모형 22

제2절 인공지능 학습모형 22

1. 인공지능 22

2. LSTM 모형 23

3. LIME 모형 25

4. SHAP 모형 26

제3절 선행연구 검토 27

1. 부동산가격지수 예측과 관련한 연구 27

2. 기계학습의 설명가능성 29

3. 변동성과 거시경제 변수 30

4. 선행연구와의 차이점 33

제3장 연구모형설계 35

제1절 데이터 수집 36

1. 매매가격지수 36

2. 주택가격 영향변수 39

3. 분석도구와 환경 42

4. 통계량 43

제2절 데이터가공 51

1. ARIMA 데이터 52

2. VAR 데이터 53

3. LSTM 데이터 54

제3절 시나리오 및 데이터 세트 구성 55

제4절 성능지표 56

1. RMSE 56

2. MAE 57

3. Accuracy (유효 구간 설정) 58

제4장 실증분석 59

제1절 전국 부동산 가격 59

1. 성능 비교 59

2. ARIMA 결과 60

3. VAR 결과 65

4. LSTM 결과 70

5. 소결 73

제2절 서울 부동산 가격 74

1. 성능 비교 74

2. ARIMA 결과 75

3. VAR 결과 79

4. LSTM 결과 84

5. 소결 87

제3절 경기 부동산 가격 88

1. 성능 비교 88

2. ARIMA 결과 89

3. VAR 결과 93

4. LSTM 결과 98

5. 소결 101

제4절 SHAP 분석 결과 102

1. 전국 SHAP 분석 결과 102

2. 서울 SHAP 분석 결과 113

3. 경기 SHAP 분석 결과 123

4. 소결 132

제5장 결론 134

제1절 연구의 요약 및 시사점 134

제2절 연구의 의의 및 한계 136

참고문헌 138

부록 145

[부록 1] 서울 25 개구 분석 결과 145

[부록 2] 6대 광역시 부동산 가격 157

ABSTRACT 164

표목차

〈표 3-1〉 전국주택가격 동향 조사 36

〈표 3-2〉 지수산정 및 편재 37

〈표 3-3〉 전국매매가격지수 변동성 사이클 38

〈표 3-4〉 매매가격 통계량 Total (전국, 서울, 경기, 6대 광역시) 45

〈표 3-5〉 매매가격 통계량 #Exp1 (2005/02/01 ~ 2009/03/01) 45

〈표 3-6〉 매매가격 통계량 #Exp2 (2009/04/01 ~ 2013/08/01) 46

〈표 3-7〉 매매가격 통계량 #Exp3 (2013/09/01 ~ 2019/09/01) 46

〈표 3-8〉 영향변수 Total (지수) 47

〈표 3-9〉 영향변수 통계량 #Exp1 (2005/02/01 ~ 2009/03/01) 48

〈표 3-10〉 영향변수 통계량 #Exp2 (2009/04/01~2013/08/01) 48

〈표 3-11〉 영향변수 통계량 #Exp3 (2013/09/01 ~ 2019/09/01) 48

〈표 3-12〉 실험 기간 설정 52

〈표 3-13〉 기본 데이터 구성 55

〈표 4-1〉 데이터 세트 59

〈표 4-2〉 전국 ARIMA 단위근 검정 60

〈표 4-3〉 전국 ARIMA 파라미터 결과 61

〈표 4-4〉 전국 ARIMA 성능지표 61

〈표 4-5〉 전국 ARIMA Accuracy 시각화 63

〈표 4-6〉 전국 ARIMA Accuracy 성능지표 64

〈표 4-7〉 전국 VAR 단위근 검정 65

〈표 4-8〉 전국 그랜저 인과관계 분석 66

〈표 4-9〉 전국 AIC, SC, HQIC 결과 67

〈표 4-10〉 전국 VAR 성능지표 68

〈표 4-11〉 전국 VAR Accuracy 시각화 69

〈표 4-12〉 전국 VAR Accuracy 성능지표 70

〈표 4-13〉 전국 LSTM 성능지표 70

〈표 4-14〉 전국 LSTM Accuracy 시각화 72

〈표 4-15〉 전국 LSTM Accuracy 성능지표 72

〈표 4-16〉 데이터 세트 74

〈표 4-17〉 서울 ARIMA 단위근 검정 75

〈표 4-18〉 서울 ARIMA 파라미터 결과 76

〈표 4-19〉 서울 ARIMA 성능지표 76

〈표 4-20〉 서울 ARIMA Accuracy 시각화 78

〈표 4-21〉 서울 ARIMA Accuracy 성능지표 78

〈표 4-22〉 서울 VAR 단위근 검정 79

〈표 4-23〉 서울 그랜저 인과관계 분석 80

〈표 4-24〉 서울 AIC, SC, HQIC 결과 81

〈표 4-25〉 서울 VAR 성능지표 82

〈표 4-26〉 서울 VAR Accuracy 시각화 83

〈표 4-27〉 서울 VAR Accuracy 성능지표 84

〈표 4-28〉 서울 LSTM 성능지표 84

〈표 4-29〉 서울 LSTM Accuracy 시각화 86

〈표 4-30〉 서울 LSTM Accuracy 성능지표 86

〈표 4-31〉 데이터 세트 88

〈표 4-32〉 경기 ARIMA 단위근 검정 89

〈표 4-33〉 경기 ARIMA 파라미터 결과 90

〈표 4-34〉 경기 ARIMA 성능지표 90

〈표 4-35〉 경기 ARIMA Accuracy 시각화 92

〈표 4-36〉 경기 ARIMA Accuracy 성능지표 92

〈표 4-37〉 경기 VAR 단위근 검정 93

〈표 4-38〉 경기 그랜저 인과관계 분석 94

〈표 4-39〉 경기 AIC, SC, HQIC 결과 95

〈표 4-40〉 경기 VAR 성능지표 96

〈표 4-41〉 경기 VAR Accuracy 시각화 97

〈표 4-42〉 경기 VAR Accuracy 성능지표 98

〈표 4-43〉 경기 LSTM 성능지표 98

〈표 4-44〉 경기 LSTM Accuracy 시각화 100

〈표 4-45〉 경기 LSTM Accuracy 성능지표 100

〈표 4-46〉 변동기 전국 매매가격지수 영향도 분석(기간 이전 3개 변수) 103

〈표 4-47〉 전국 변동기 진입 시점 영향도 종합 105

〈표 4-48〉 변동기 변수 의존성 분석(전국) 106

〈표 4-49〉 변동기 변수 중요도(전국) 108

〈표 4-50〉 매매가격지수 추세 유지 시기 의존성 분석(전국) 109

〈표 4-51〉 추세 유지 시기 변수 중요도(전국) 111

〈표 4-52〉 추세 유지 시기 변수 중요도 종합(전국) 112

〈표 4-53〉 변동기 서울 매매가격지수 영향도 분석(기간 이전 3개 변수) 114

〈표 4-54〉 서울 변동기 진입 시점 영향도 종합 115

〈표 4-55〉 변동기 변수 의존성 분석(서울) 116

〈표 4-56〉 변동기 변수 중요도(서울) 117

〈표 4-57〉 매매가격지수 추세 유지 시기 의존성 분석(서울) 119

〈표 4-58〉 추세 유지 시기 변수 중요도(서울) 121

〈표 4-59〉 추세 유지 시기 변수 중요도 종합(서울) 122

〈표 4-60〉 변동기 경기 매매가격지수 영향도 분석(기간 이전 3개 변수) 124

〈표 4-61〉 경기 변동기 진입 시점 영향도 종합 125

〈표 4-62〉 변동기 변수 의존성 분석(경기) 126

〈표 4-63〉 변동기 변수 중요도(경기) 128

〈표 4-64〉 매매가격지수 추세 유지 시기 의존성 분석(경기) 129

〈표 4-65〉 추세 유지 시기 변수 중요도(경기) 131

〈표 4-66〉 추세 유지 시기 변수 중요도 종합(경기) 132

그림목차

〈그림 1-1〉 연구 프로세스 17

〈그림 1-2〉 연구의 구성 19

〈그림 2-1〉 ARIMA 모형 구축 절차 21

〈그림 2-2〉 인공지능, 기계학습, 딥러닝 관계 모형 23

〈그림 2-3〉 RNN 기본구조 24

〈그림 2-4〉 RNN과 LSTM 25

〈그림 2-5〉 LIME 설명 26

〈그림 2-6〉 변수 기여도 수식 27

〈그림 2-7〉 소비자 효용 극대화 모형 32

〈그림 2-8〉 주택-거시경제의 연계성 채널 33

〈그림 3-1〉 전국/시/도 아파트 매매가격지수 35

〈그림 3-2〉 전국 아파트 매매가격지수 39

〈그림 3-3〉 회사채수익률 40

〈그림 3-4〉 소비자물가지수 40

〈그림 3-5〉 M2(통화량) 41

〈그림 3-6〉 광공업지수 41

〈그림 3-7〉 주택전세가격지수(KB) 42

〈그림 3-8〉 실험 기간 boxplot 46

〈그림 3-9〉 변수별 상관성분석 분포 시각화 49

〈그림 3-10〉 변수별 상관성분석 히트맵 50

〈그림 3-11〉 가격영향 변수 통계량 boxplot 51

〈그림 3-12〉 Akaike's Information Corrected Criterion(AICc) 53

〈그림 3-13〉 Grid Search 방식을 통한 ARIMA 하이퍼 파라미터 튜닝 (p,q) 53

〈그림 3-14〉 전처리 과정 54

〈그림 3-15〉 데이터 분석 방법 56

〈그림 3-16〉 RMSE 수식 57

〈그림 3-17〉 MAE 수식 57

〈그림 3-18〉 Accuracy 정의 58

〈그림 4-1〉 전국 데이터 세트 시각화 60

〈그림 4-2〉 전국 ARIMA 모형 결과 62

〈그림 4-3〉 전국 VAR 모형 결과 68

〈그림 4-4〉 전국 LSTM 모형 결과 71

〈그림 4-5〉 서울 데이터 세트 시각화 74

〈그림 4-6〉 서울 ARIMA 모형 결과 77

〈그림 4-7〉 서울 VAR 모형 결과 82

〈그림 4-8〉 서울 LSTM 모형 결과 85

〈그림 4-9〉 경기 데이터 세트 시각화 88

〈그림 4-10〉 경기 ARIMA 모형 결과 91

〈그림 4-11〉 경기 VAR 모형 결과 96

〈그림 4-12〉 경기 LSTM 모형 결과 99

〈그림 4-13〉 전국 아파트 매매가격지수 102

〈그림 4-14〉 전국/서울 아파트 매매가격지수 비교 113

〈그림 4-15〉 전국/경기 아파트 매매 가격 지수 비교 123

초록보기

본 연구는 부동산 가격 예측과 그 변동의 원인을 '인공지능학습모형'을 통해 찾아내 정책 참고자료로 활용하는 것을 목적으로 한다. 이미 부동산 '가격' 예측모형을 만들기 위한 다양한 연구가 있었다. 본 연구는 단변량 시계열 분석에서 많이 사용되는 ARIMA과 VAR모형 등의 기법을 이용해 부동산 가격을 예측하는 전통적 시계열 분석법과 최근 주목받는 LSTM 기법을 통해 가격 예측력을 비교 분석한다. 부동산 시장은 대내외적 상황으로 변동성이 올라가는 시기를 맞이한다. 일반적인 추세를 이어가는 시기보다, 변동성이 높아지는 시기의 부동산 가격의 흐름을 예측하는 것은 더욱 어렵다. 본 연구는 부동산 시장 사이클을 바탕으로 유독 변동성이 컸던 3번의 시기에 주목한다. 변동성이 유독 컸던 해당 시점의 매매가격지수를 예측한 결과 LSTM, VAR, ARIMA 순으로 예측력이 높다는 것이 확인됐다. 본 연구는 전통적 통계 예측모형과 인공지능 학습모형을 하이브리드로 상호보완적으로 활용할 수 있는 방법을 찾는다. 인공지능을 이용한 방법론은 높은 예측력은 장점이지만, 인과관계 규명은 어렵다는 한계가 있었다. 인공지능 학습모형을 통한 분석은 그 결과를 설명할 수 없다는 한계가 있었다. 이를 극복하기 위해 본 연구는 설명가능 인공지능(Explainable AI, XAI) 연구를 부동산학에 적용했다. 그 결과 SHAP 기법을 통해 각각의 부동산 사이클에 영향을 미치는 설명변수를 확인해서 정책 수단을 강구할 수 있다는 것을 확인했다.