ESG에서 S(사회) 영역의 중요성이 높아짐에도 불구하고, 아직까지 S영역에 대한 실증연구는 다소 부족하다. 또한 기존에 기업의 신용등급 예측연구를 활발히 진행한 것과 달리, ESG 연구에서는 기업의 정량적 데이터를 이용한 ESG 등급예측 연구가 부족하다. 이에 본 연구는 기업의 정량적 데이터를 수집하여 머신러닝을 이용한 ESG S영역 등급을 예측할 수 있는지 실시하고, 추가로 예측에 영향을 미치는 변수의 중요도를 확인해 보았다. 실증분석을 위해 2020년도부터 2022년도까지 3개년의 한국ESG기준원의 ESG S영역 등급 데이터와 전년도 기업규모, 인적자원 그리고 직무만족도 데이터를 수집하였다. 이때 직무만족도 데이터는 국내 온라인 기업 리뷰 사이트인 잡플래닛의 점수를 활용하였다. 최종적으로 구축한 2,262개 데이터를 이용하여 분석한 결과, 랜덤포레스트 모델에서 약 80% 이상의 정확도를 보였다. 이후, 추가분석을 위해 랜덤으로 수집한 2023년도 데이터 100개에도 적용한 결과 80% 이상의 높은 정확도를 나타내었고, 이로써 해당 모델이 ESG S영역 등급 예측에 좋은 성능을 갖춘 모델인 것을 확인하였다.
SHAP Value를 이용하여 상위 10개의 변수 중요도를 확인한 결과, 대체로 상위권에 인적자원 변수가 차지하였고, 차례로 기업규모, 직무만족도가 그 뒤를 이었다. 특히, 기관투자가들이 ESG에서 인적자원관리를 주목하고 있다는 점을 미뤄봤을 때, 인적자원관리에 대한 중요성을 본 연구를 통해 다시 한번 확인할 수 있었다. 추가로 직무만족도 변수의 예측 방향 그래프 결과, 직무만족도 변수 또한 중요하다는 것을 확인하였다. 본 연구는 기업의 정략적 데이터를 기반으로 머신러닝을 통해 ESG S영역 등급을 예측하고, 예측에 영향을 미치는 변수를 확인하였다는 점에서 이론적 의의가 크다. 또한 인적자원과 직무만족도 변수의 중요성을 확인함으로써, 실무진들에게 ESG S영역 평가에 대한 새로운 관점을 제시하였다.