오늘날 기술의 발전으로 데이터 양이 폭발적으로 증가하면서, 대형언어모델을 통해 대규모 데이터를 학습하고 결과를 생성하는 능력을 갖춘 AI가 등장하기에 이르렀 다. 이러한 발전은 동시에 ChatGPT의 ‘독도’ 검색 오류와 같이 인공지능의 답변이 잘못된 정보를 제공하는 경우도 나타나면서 한일 양국은 물론 전세계에서 사회적으로 중요한 문제로 떠오르고 있다. 그러나 일본학 및 일본 연구에서 이러한 기술의 활용은 제한적인 편이며, 대규모 데이터를 활용한 일본 관련 연구는 문화, 언어, 언론, 관광 등에 주로 한정되어 있다. 이러한 상황으로 인해 일본 및 일본학과 관련된 데이 터베이스의 활용 및 발전 방향에 대한 연구는 부족한 편이다. 이상의 문제의식에서, 균형있는 데이터베이스를 구축하고 공유함으로써 불균형 데이터의 학습에 의한 인공 지능의 부정확한 답변을 최소화하고 효과적으로 활용할 수 있는 방안을 모색해보고자 한다. 이를 통해 인문사회과학 분야의 연구 범위를 확장하고 새로운 방식의 연구를 가능하게 할 수 있을 것으로 기대된다.