본문 바로가기 주메뉴 바로가기
국회도서관 홈으로 정보검색 소장정보 검색

목차보기

표제지

목차

국문초록 9

ABSTRACT 10

제1장 서론 12

1.1. 연구의 배경 및 목적 12

1.2. 연구의 내용 및 범위 13

1.3. 논문의 구성 13

제2장 관련 연구 14

2.1. 사행산업 14

2.1.1. 경정 16

2.1.2. 경륜 18

2.1.3. 경마 20

2.2. 머신러닝 22

2.2.1. 로지스틱 회귀 23

2.2.2. 서포트 벡터 머신 24

2.2.3. K-최근접이웃 25

2.2.4. 랜덤포레스트 26

2.2.5. 나이브 베이즈 27

2.2.6. 다층 퍼셉트론 27

2.3. 사행산업 승률 예측 모델 선행연구 28

2.4. 기존 사행산업 승률 예측 모델의 한계 29

제3장 머신러닝을 활용한 경정 경주 승률 예측 모델 30

3.1. 경정 경주 승률 예측 모델 구성도 30

3.2. 데이터 수집 31

3.3. 데이터 전처리 32

3.4. 모델 학습 35

제4장 실험 및 비교 분석 38

4.1. 실험환경 38

4.2. 승률 예측 모델 별 실험 및 성능 평가 39

4.3. 승률 예측 모델 별 승식 예측 결과 및 비교 분석 44

제5장 결론 47

참고문헌 48

표목차

[표 2-1] 사행산업 별 법적 정의 14

[표 2-2] 2022년 사행산업 현황 15

[표 2-3] 경정 승식 종류 17

[표 2-4] 경정 10년간 연도별 사업 추이 17

[표 2-5] 경륜 승식 종류 19

[표 2-6] 경륜 10년간 연도별 사업 추이 19

[표 2-7] 경마 승식 종류 21

[표 2-8] 경마 10년간 연도별 사업 추이 21

[표 3-1] 수집 데이터 변수 구성 31

[표 3-2] 연구변수 32

[표 3-3] 이상치 및 결측치 제거 33

[표 3-4] 연구대상 데이터 구성 34

[표 3-5] 학습용 데이터 및 테스트용 데이터 분할 35

[표 3-6] 모델 별 주요 하이퍼파라미터 설정 36

[표 4-1] 실험환경 구성 38

[표 4-2] 머신러닝 모델 성능 평가지표 39

[표 4-3] 1위 이내 입상 여부 성능 평가지표 41

[표 4-4] 2위 이내 입상 여부 성능 평가지표 42

[표 4-5] 3위 이내 입상 여부 성능 평가지표 43

[표 4-6] 모델 별 승식 예측 결과 45

그림목차

[그림 2-1] 로지스틱 회귀 그래프 예시 23

[그림 2-2] 서포트 벡터 머신 그래프 예시 24

[그림 2-3] K-최근접이웃 그래프 예시 25

[그림 2-4] 랜덤포레스트 모형 26

[그림 2-5] 나이브 베이즈 모형 27

[그림 2-6] 다층 퍼셉트론 모형 28

[그림 3-1] 경정 경주 승률 예측 모델 구성도 30

[그림 4-1] 혼동행렬 40

[그림 4-2] 경정 경주 1·2·3위 선수 예측 프로세스 예시 44

초록보기

 머신러닝을 활용하여 스포츠 경기의 승률을 예측하고자 하는 연구들이 활발하게 진행되고 있으며, 승률 예측에 관한 연구가 활발한 경마, 경륜 등의 사행산업에 비해 경정에 관한 승률 예측 연구는 미미한 수준이다.

본 논문에서는 로지스틱 회귀, 서포트 벡터 머신, K-최근접이웃, 랜덤 포레스트, 나이브 베이즈, 다층 퍼셉트론 총 6가지의 머신러닝 알고리즘을 적용하여 다양한 분석기법들을 활용한 승률 예측 모델을 제안하였다.

실험은 파이썬으로 모델 학습을 진행하고 성능 평가 및 예측 프로세스를 통해 선수의 1·2·3위 이내 입상 여부를 예측하였다. 로지스틱 회귀가 단승(45.25%), 연승(66.67%), 쌍승(17.11%)에서 정확도가 가장 높게 나왔으며, 다층 퍼셉트론이 복승(28.14%), 랜덤포레스트가 삼복승(20.47%)에서 정확도가 가장 높게 나왔다.

기존에는 활용되지 않았던 경정 데이터에 머신러닝을 활용하여 승률을 예측하였다는데 의의가 있으며, 추후 스포츠 산업 분야에서의 실무적인 참고자료로도 활용될 수 있을 것으로 판단된다.