본문 바로가기 주메뉴 바로가기

전체메뉴

국회도서관 홈으로 정보검색 소장정보 검색

목차보기

[표지]

연구결과 요약문

목차

1. 연구개발과제의 개요 5

2. 연구개발과제의 수행 과정 및 수행 내용 5

1) 강화학습의 이론적 분석 및 제어 이론과 데이터의 장점을 결합한 역설계 방법론 5

(1) 연속 시간 시스템에서의 최대 엔트로피 강화학습 알고리즘 분석 및 역설계 5

(2) 연속 시간 고차원 시스템에서의 심층 강화학습 알고리즘 분석 및 역설계 6

(3) 강화학습 및 온라인 학습 방법론의 후회(regret)의 이론적 분석 6

2) 심층 탐색을 통한 고성능의 제어기 학습 7

3) 학습 속도 및 샘플 효율성의 비약적 향상을 위한 가속 최적화 방법론 개발 7

(1) 앤더슨 가속화(Anderson Acceleration, AA)를 이용한 효율적 강화학습 방법론 개발 7

(2) 학습 속도 향상을 위한 최적화 알고리즘의 효율화 연구 8

4) 데이터 오류에 대한 강인성 향상 연구 9

(1) 불완전한 데이터를 이용한 분포 강인 스토캐스틱 제어 기법 연구 9

(2) 분포 강인 스토캐스틱 제어 방법의 계산 효율을 향상시킨 분포 강인 미분 동적 계획 제어 기법 연구 10

(3) CVaR 지표 기반 시스템 위험도 평가 기법 연구 10

(4) 자율시스템에서의 예측 오류를 보완하고 안전성을 보장하는 제어 및 최적화 기법 11

(5) 전력시스템에서 예측 오류를 보완하는 제어 및 최적화 기법 및 분포 강인 최적화 보수성 완화 연구 12

3. 연구개발과제의 수행 결과 및 목표 달성 수준 13

1) 정성적 연구개발성과(연구개발결과) 13

2) 세부 정량적 연구개발성과 : [붙임1] 참조 14

3) 목표 달성 수준 14

4) 목표 미달 시 원인 분석(해당 시) 14

4. 연구개발성과의 관련 분야에 대한 기여 정도(연구개발결과의 중요성) 14

산업시스템에 미치는 경제적 효과 14

인공지능의 안전성과 신뢰성 향상 15

스토캐스틱 제어 및 강화학습 분야의 학문적 성장에 기여 15

5. 연구개발성과의 관리 및 활용 계획 15

6. 자체점검표 16

7. 참고문헌 16

붙임 18

1. 세부 정량적 연구개발성과 18

2-1. 연구책임자(해당 시 참여연구자(공동) 포함) 대표적 연구실적 23

2-2. 주관연구책임자(해당 시 참여연구자(공동) 포함) 대표적 논문·특허실적 요약문 24