이 연구는 텍스트 마이닝을 적용한 판례분석을 통해 스포츠 영역에서 나타나는 폭력의 원인을 분석하였다. 이를 위해 전국 각급 법원 판결문을 제공하고 있는 엘박스(https://lbox.kr/)를 이용하여 2010년부터 2021년 9월 자료까지 수집하였다. 최종적으로 중복된 자료를 제거 후 최종 224개의 체육 (성)폭력 관련 판례를 수집하였다. 자료수집 절차는 첫째, 체육, 수업, 체육교사, 코치, 감독, 운동, 폭행, 폭력, 체벌, 추행, 성희롱, 성폭행 등의 키워드를 이용하여 검색을 진행하였다. 둘째, 데이터 수집의 범위는 판결 선고 날짜가 2010년부터 2021년 9월까지로 한정하였다. 셋째, 판례를 시기와 분야에 따라 분류하였다. 넷째, 범죄구성사실 부분을 발췌하였다. 수집된 텍스트 자료는 Python 3의 konlpy와 gensim 라이브러리를 통해 전처리 과정을 진행하였다. 키워드 빈도분석과 토픽모델링을 진행하였으며, Word2vec 알고리즘을 이용하여 각 토픽 주요 단어의 유사 단어들을 탐색하였다. 픽모델링 결과와 토픽별 유사 단어를 검토한 결과 토픽은 4가지로 분류되었다. 구체적으로 토픽1은 ‘학교 및 전문체육 폭력’, 토픽2는 ‘학교체육 성희롱 및 성폭력’, 토픽3은 ‘학원체육 성희롱 및 성폭행’, 토픽4는 ‘(성)폭력에 대한 조치 및 후유증’으로 명명하였다. 이 연구의 결과는 스포츠 영역에서 나타나는 폭력의 제도 및 정책 정비, 처벌 기준 설정 등 스포츠폭력에 대한 대책 수립이 시급한 현 상황에서 정책의제 결정과 정책 행위자들의 의사결정에 기초자료로 활용될 수 있을 것이다.