표제지
초록
ABSTRACT
목차
1장 서론 11
1.1. 연구 배경 및 필요성 11
1.2. 연구 목적 및 목표 14
1.3. 논문의 구성 14
2장 이론적 배경 16
2.1. 기술분류체계 선정 기준 수립 및 표준화 현황 연구 16
2.2. 특허·논문 분류를 위한 자연어처리 이론 연구 22
2.3. 중심 연구주제 분석을 위한 토픽모델링 이론 연구 25
2.4. 관계도 분석을 위한 사회연결망분석 이론 연구 28
3장 연구 방법 31
3.1. 연구 절차 31
3.2. 데이터 수집 34
3.3. 데이터 전처리 36
3.4. 문서 분류 모델 학습 및 성능 평가 38
3.4. 연구주제 및 협력 네트워크 추출 42
4장 결과 분석 46
4.1. 기술 문서 분류를 통한 국방분야 기술 동향 분석 46
4.2. 토픽모델링을 통한 중심 연구 주제 분석 52
4.3. 사회 연결망 분석을 통한 기관 및 기업 관계도 분석 57
5장 결론 및 향후 연구 계획 61
참고문헌 63
표 1. 국방과학기술 표준분류체계 18
표 2. 4차 산업혁명 5대 주요 기술 분류 21
표 3. 국방과학기술 분야 수집 데이터 34
표 4. 정보통신기술 분야 수집 데이터 35
표 5. 국방분야 전체 논문에 대한 LDA학습결과(단어별 토픽 기여도) 44
표 6. 국방분야 전체 논문에 대한 LDA 추출 토픽 53
표 7. 엘아이지넥스원의 토픽모델링 결과 및 연구주제 해석 55
표 8. 한화시스템의 토픽모델링 결과 및 연구주제 해석 56
표 9. 국방분야 사회연결망분석을 위한 기업 논문 샘플링 57
그림 1. Transformer 기본 구조 23
그림 2. BERT의 입력구조 및 임베딩 3종 24
그림 3. 잠재 디리클레 할당(LDA) 개념 26
그림 4. 잠재 디리클레 할당의 문서생성 과정 추정 구조 26
그림 5. 사회연결망분석 그래프 예 29
그림 6. 연구단계 별 주요 데이터 및 활용기법 32
그림 7. 세부 연구절차 33
그림 8. 기술 분류 별 워드크라우드 수행 결과 예(소분류 '침입탐지대응') 37
그림 9. 수집데이터에 대한 통계기반 기계학습 모델 별 성능 38
그림 10. 초기 분류모델의 국방과학연구소 논문(좌)·특허(우) 분류 실패 결과 39
그림 11. 초기 분류모델을 통한 국방과학연구소 특허 분류 실패 결과 41
그림 12. 국방분야 논문에 대한 LDA 토픽별 응집도(상)와 혼란도(하) 수치 43
그림 13. 국방분야 전체 논문에 대한 토픽모델링 결과 시각화 44
그림 14. 논문의 참여기관 데이터를 이용한 동시 출현 빈도 산출표 45
그림 15. 국방과학기술 분류 기준에 따른 국방분야 특허 출원 분포 47
그림 16. 정보통신기술 분류 기준에 따른 국방분야 특허 출원 분포 48
그림 17. 현대로템과 대우조선해양의 특허실적 분포도 49
그림 18. 엘아이지넥스원과 한화시스템의 특허실적 분포도 50
그림 19. 한국항공우주연구원의 국방과학기술 대비 정보통신기술 분포 51
그림 20. 국방분야 연구기관 논문의 LDA결과 시각화 52
그림 21. 2020년 국방과학기술 연구기관 관계도 58
그림 22. 2021년 국방과학기술 연구기관 관계도 59
그림 23. 2022년 국방과학기술 연구기관 관계도 60