미래를 예측하고자 하는 노력은 데이터 사이언스 분야에서 가장 중요한 화두 중 하나이다. 과거부터 시작된 전통적인 통계학에서부터 비교적 근래에 주목을 받고 있는 신경망을 응용한 방법 등을 통해 미래 예측에 정확성을 향상시키고자 하는 노력은 끊임없이 이어지고 있다. Auto Regressive 모델과 Moving Average 모델, 그리고 Differencing 기법이 결합된 ARIMA 모델이 있고, 다양한 범위에서 활용되는, 선형, 다중, 다항 회귀 분석을 통해 미래를 예측하기도 한다. 뿐만 아니라, 최근에는, 기계학습을 통하여 의사결정 나무나 심층 신경망을 이용한 예측방법 또한 많은 연구가 진행되고 있다. 하지만, 이렇게 다양하고 심도 있는 연구가 진행되고 있음에도, COVID-19 처럼 비정상적인 상황에서는 대부분의 예측 모델들은 낮은 정확성을 나타낸다. 이는 곧 많은 기업들이 사용하고 있는 수요/공급/판매 등 예측 모델이 제대로 역할을 하지 못해 변화하는 경영환경에 대해 적절히 대응을 하기 어렵다는 것을 의미한다. 지역별 프랜차이즈 매장을 운영하고 있는 기업들이 각 매장들의 운영 효율을 예측하기 위해 유용하게 사용하는 공공 시계열 데이터 중 하나인, 서울시의 생활인구 데이터를 사용하여 행정동 별 미래의 생활인구를 예측하는 모델을 제안하고자 한다. 또한, COVID-19으로 인해 비정상적으로 생활인구의 급격한 변화가 있었던 2020 년과 2021 년을 대상으로 예측의 정확도를 향상시킬 수 있는 방안을 연구를 진행하였다. 본 논문에서 제안하고자 하는 Diff LSTM 모델은 ARIMA 와 신경망 기반인 LSTM(Long-Short Term Memory)의 hybrid 모델로서, ARIMA 에서 데이터가 정상성을 나타내지 않을 때 적용하는 방법인 차분(differencing)을 학습데이터에 적용한 후 전 처리한 데이터를 LSTM 을 사용하여 학습을 하고 예측을 하는 방법이다, 서울시 명동의 저녁 8 시부터 9 시까지 매일의 데이터를 2020 년 1 월 1 일부터 12 월 31 일까지 총 365 일을 학습하여 21 년 1 월 1 일부터 21 년 1 월 31 일까지 일자 별 예측을 하였고 이를 실제의 생활인구와 비교하여 정확도를 측정하였다. 최종적으로, ARIMA, LSTM, Diff LSTM 세 가지 모델을 통한 예측 결과를 각각 RMSE 와 RMSLE 를 사용하여 정확도를 비교하여 Diff LSTM 에 대한 유용성을 제언하였다. RMSLE 의 경우 정확도 순위가 각 테스트 케이스별로 다르게 나타났지만, RMSE 의 경우 Diff LSTM 이 LSTM 대비 모두 정확도가 높게 나타났다, 따라서 Diff LSTM 모델이 COVID-19 처럼 기존의 예측 모델이 정상적으로 예측하기 어려운 특수한 상황에서 상대적으로 정확도가 높은 예측 결과를 도출할 수 있음을 확인하였다.