표제지
목차
요약 3
Abstract 5
Ⅰ. 연구 배경 및 목적 8
Ⅱ. 분석방법론 개요 10
1. 정부R&D사업 라벨링 11
2. 라벨 회귀분석 12
Ⅲ. 분석방법론 설계 및 검증 14
1. 정부R&D사업 라벨링 14
2. 중요도(라벨에 연도별 예산) 부여 17
3. 라벨 중요도의 회귀분석 18
Ⅳ. 수소분야 시범 적용 연구 20
Ⅴ. 연구의 의의 및 과제 26
참고문헌 27
판권기 30
〈표 1〉 LDA 토픽모델 세트 12
〈표 2〉 사업 중요도 계산 비율 (토픽 중요도 합과 당해연도 전체 예산의 비율) 18
〈표 3〉 Box-Cox 변환에 따른 선형회귀분석 결정계수(R2) 0.65 이상 비율 19
〈표 4〉 수소분야 상위 50% 라벨: 수소 중요도 및 10대 키워드 (K10001723 분석세트 기준) 20
〈표 5〉 수소분야 상위 50% 라벨에 대한 log(중요도) 회귀분석 결과 (K10001723 분석세트 기준) 22
〈표 6〉 분석세트별 상위 50% 라벨 log(중요도)에 대한 회귀분석 결과 (평균절대오차) 24
[그림 1] 범부처 통합적 R&D예산 배분ㆍ조정 개념 8
[그림 2] 범부처 통합적 R&D예산 배분ㆍ조정 프로세스 9
[그림 3] 라벨링 → 회귀분석 → 차년도 예산 예측 프로세스 10
[그림 4] K10001723 분석세트의 사업1 토픽 분포 15
[그림 5] K10001723 분석세트의 과제40 토픽 분포 15
[그림 6] K10001723 분석세트의 토픽1 키워드 분포 16
[그림 7] K10001723 분석세트의 토픽1 워드클라우드 16
[그림 8] K10001723 분석세트의 토픽1000 키워드 분포 16
[그림 9] K10001723 분석세트의 토픽1000 워드클라우드 17
[그림 10] (a) 2023년 사업 토픽 분포 및 예산, 예산 가중치 현황, (b) 연차별 중요도 예시 17
[그림 11] 분석세트별 중요도 상위 50% 라벨의 지수평활법 분석 결과 (예측치/실측치 비율) 23
[그림 12] 분석세트별 중요도 상위 50% 라벨의 선형회귀분석 분석 결과 (예측치/실측치 비율) 23
[그림 13] (a) 사업250, (b) 사업500, (c) K03501723, (d) K05001723, (e) K15001723, (f) K10001623 분석세트: 수소분야 중요도 상위 5개 라벨의 log(중요도) 변화 추이 25
[그림 14] 라벨의 연도별 log(중요도)에 대한 K-means 클러스터링 결과: 9개 유형 분류 25