권호기사보기
| 기사명 | 저자명 | 페이지 | 원문 | 기사목차 |
|---|
결과 내 검색
동의어 포함
목차
심층강화학습 라이브러리 기술동향 = A survey on deep reinforcement learning libraries / 신승재 ; 조충래 ; 전홍석 ; 윤승현 ; 김태연 1
ABSTRACT 1
I. 서론 1
II. 심층강화학습 개관 2
III. 심층강화학습 라이브러리 5
1. 분석기준 5
2. 심층강화학습 라이브러리 일람 6
3. 라이브러리 간 비교분석 11
IV. 결론 11
용어해설 11
약어 정리 11
참고문헌 12
| 번호 | 참고문헌 | 국회도서관 소장유무 |
|---|---|---|
| 1 | Research Trends on Deep Reinforcement Learning | 소장 |
| 2 | Reinforcement Learning: An Introduction, 2nd edition | 미소장 |
| 3 | Deep learning. ![]() |
미소장 |
| 4 | Playing Atari with Deep Reinforcement Learning | 미소장 |
| 5 | Survey of Model-Based Reinforcement Learning: Applications on Robotics ![]() |
미소장 |
| 6 | Control of a Quadrotor with Reinforcement Learning | 미소장 |
| 7 | Query-Efficient Imitation Learning for End-to-End Autonomous Driving | 미소장 |
| 8 | Resource Management with Deep Reinforcement Learning | 미소장 |
| 9 | Neural Adaptive Video Streaming with Pensieve | 미소장 |
| 10 | Learning Scheduling Algorithms for Data Processing Clusters | 미소장 |
| 11 | 기계학습을 활용한 5G통신 방향 | 소장 |
| 12 | Deep Direct Reinforcement Learning for Financial Signal Representation and Trading ![]() |
미소장 |
| 13 | https://www.yna.co.kr/view/AKR20171018151400017?input=1179m | 미소장 |
| 14 | Asynchronous Methods for Deep Reinforcement Learning | 미소장 |
| 15 | Continuous Control with Deep Reinforcement Learning | 미소장 |
| 16 | Trust Region Policy Optimization | 미소장 |
| 17 | Proximal Policy Optimization Algorithms | 미소장 |
| 18 | Prioritized Experience Replay | 미소장 |
| 19 | Dueling Network Architectures for Deep Reinforcement Learning | 미소장 |
| 20 | Deep Reinforcement Learning with Double Q-Learning | 미소장 |
| 21 | 패턴인식 | 미소장 |
| 22 | https://hunkim.github.io/ml/ | 미소장 |
| 23 | Deep Learning | 미소장 |
| 24 | IMPALA: Scalable Distributed Deep-RL with Importance Weighted Actor-Learner Architectures | 미소장 |
| 25 | Distributed Prioritized Experienced Replay | 미소장 |
| 26 | Recurrent Experience Replay in Distributed Reinforcement Learning | 미소장 |
| 27 | Multi-Agent Actor Critic for Mixed Cooperative-Competitive Environments | 미소장 |
| 28 | QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning | 미소장 |
| 29 | Robust Multi-Agent Reinforcement Learning via Minimax Deep Deterministic Policy Gradient | 미소장 |
| 30 | https://nervanasystems.github.io/coach/ | 미소장 |
| 31 | https://github.com/NervanaSystems/coach | 미소장 |
| 32 | https://www.tensorflow.org/?hl=ko | 미소장 |
| 33 | https://mxnet.incubator.apache.org/ | 미소장 |
| 34 | https://software.intel.com/en-us/frameworks/tensorflow | 미소장 |
| 35 | https://gym.openai.com/ | 미소장 |
| 36 | https://github.com/openai/roboschool | 미소장 |
| 37 | https://github.com/Breakend/gym-extensions | 미소장 |
| 38 | https://github.com/bulletphysics/bullet3 | 미소장 |
| 39 | http://vizdoom.cs.put.edu.pl/ | 미소장 |
| 40 | http://carla.org/ | 미소장 |
| 41 | https://github.com/deepmind/pysc2 | 미소장 |
| 42 | https://github.com/deepmind/dm_control | 미소장 |
| 43 | https://opensource.google/projects/dopamine | 미소장 |
| 44 | Dopamine: A Research Framework for Deep Reinforcement Learning | 미소장 |
| 45 | https://github.com/google/dopamine | 미소장 |
| 46 | https://keras.io/ | 미소장 |
| 47 | https://github.com/keras-rl/keras-rl | 미소장 |
| 48 | https://github.com/openai/baselines | 미소장 |
| 49 | tps://www.open-mpi.org | 미소장 |
| 50 | https://spinningup.openai.com/en/latest/ | 미소장 |
| 51 | https://github.com/openai/spinningup | 미소장 |
| 52 | https://gym.openai.com/envs/#mujoco | 미소장 |
| 53 | https://ray.readthedocs.io/en/latest/rllib.html | 미소장 |
| 54 | RLlib: Abstractions for Distributed Reinforcement Learning | 미소장 |
| 55 | https://ray.readthedocs.io/en/latest/index.html# | 미소장 |
| 56 | https://github.com/ray-project/ray | 미소장 |
| 57 | https://pytorch.org/ | 미소장 |
| 58 | https://stable-baselines.readthedocs.io/en/master/ | 미소장 |
| 59 | https://github.com/hill-a/stable-baselines | 미소장 |
| 60 | https://github.com/araffin/rl-baselines-zoo | 미소장 |
| 61 | https://tensorforce.readthedocs.io/en/latest/ | 미소장 |
| 62 | https://github.com/tensorforce/tensorforce | 미소장 |
| 63 | https://github.com/mgbellemare/Arcade-Learning-Environment | 미소장 |
| 64 | https://github.com/microsoft/MazeExplorer | 미소장 |
| 65 | https://github.com/openai/retro | 미소장 |
| 66 | https://opensim.stanford.edu | 미소장 |
| 67 | https://github.com/ntasfi/PyGame-Learning-Environment | 미소장 |
| 68 | https://github.com/tensorflow/agents | 미소장 |
| 69 | https://github.com/deepmind/trfl | 미소장 |
| 70 | https://winderresearch.com/a-comparison-of-reinforcementlearning-frameworks-dopamine-rllib-keras-rl-coach-trfltensorforce-coach-and-more/ | 미소장 |
| 71 | https://medium.com/@vermashresth/a-primer-on-deepreinforcement-learning-frameworks-part-1-6c9ab6a0f555 | 미소장 |
| 72 | https://mc.ai/choosing-a-deep-reinforcement-learning-library/ | 미소장 |
*표시는 필수 입력사항입니다.
| 전화번호 |
|---|
| 기사명 | 저자명 | 페이지 | 원문 | 기사목차 |
|---|
| 번호 | 발행일자 | 권호명 | 제본정보 | 자료실 | 원문 | 신청 페이지 |
|---|
도서위치안내: 정기간행물실(524호) / 서가번호: 국내09
2021년 이전 정기간행물은 온라인 신청(원문 구축 자료는 원문 이용)
우편복사 목록담기를 완료하였습니다.
*표시는 필수 입력사항입니다.
저장 되었습니다.