본문 바로가기 주메뉴 바로가기
국회도서관 홈으로 정보검색 소장정보 검색

결과 내 검색

동의어 포함

초록보기

강화학습은 주로 순차적인 의사 결정 문제에 적용되어 왔다. 특히 최근에는 신경망과 결합한 형태로 기존에는 해결하지 못한 분야에서도 성공적인 결과를 내고 있다. 하지만 신경망을 이용하는 강화학습은 현장에서 즉각적으로 사용하기엔 너무 복잡하다는 단점이 있다. 본 논문에서는 학습이 쉬운 강화학습 알고리즘 중 하나인 Q-learning을 이용하여 이동 로봇의 경로를 생성하는 알고리즘을 구현하였다. Q-table을 미리 만드는 방식의 Q-learning은 명확한 한계를 가지기 때문에 실시간으로 Q-table을 업데이트하는 실시간 Q-learning을 사용하였다. 탐험 전략을 조정하여 실시간 Q-learning에 필요한 학습 속도를 얻을 수 있었다. 마지막으로 실시간 Q-learning과 DQN의 성능을 비교하였다.

권호기사

권호기사 목록 테이블로 기사명, 저자명, 페이지, 원문, 기사목차 순으로 되어있습니다.
기사명 저자명 페이지 원문 목차
생활 환경에서의 인공지능 시스템 성능 개선 및 평가를 위한 리빙랩 및 혼동 매트릭스 = Living lab and confusion matrix for performance improvement and evaluation of artificial intelligence system in life environment 하지원, 서지석, 이성수 p. 1180-1183

가속도 예측 기반 새로운 선박 이동 경로 예측 방법 = A new vessel path prediction method based on anticipation of acceleration of vessel 김종희, 정찬호, 강도근, 이창진 p. 1176-1179

주차 보조 시스템을 위한 ECU 설계 = Design of electronic control unit for parking assist system 최진혁, 이성수 p. 1172-1175

상시불통형 p-GaN/AlGaN/GaN 이종접합 트랜지스터의 게이트막 농도 계조화 효과 = Gate field alleviation by graded gate-doping in normally-off p-GaN/AlGaN/GaN hetrojunction FETs 조성인, 김형탁 p. 1167-1171

피드백 감지 회로 구조로 인한 향상된 Load Regulation 특성을 가진 LDO 레귤레이터 = LDO regulator with improved load regulation characteristics and feedback detection structure 정준모 p. 1162-1166

높은 Holding Voltage 및 All-Direction 특성을 갖는 SCR 기반의 ESD 보호회로에 관한 연구 = A study on SCR-based ESD protection circuit with high holding voltage and all-direction characteristics 진승후, 도경일, 우제욱, 구용서 p. 1156-1161

Real-time smoke detection research with false positive reduction using spatial and temporal features based on faster R-CNN Sang-Hun Lee, Yeung-Hak Lee p. 1148-1155

딥러닝을 이용한 실시간 말벌 분류 시스템 = Real time hornet classification system based on deep learning 정윤주, 이영학, 아스라필 안사리, 이철희 p. 1141-1147

미세먼지 확산 모델링을 이용한 대기질 예측시스템에 대한 연구 = A study on fine dust modeling for air quality prediction 유지현 p. 1136-1140

충전기 고조파 잡음에 강인한 배터리 내부저항 측정 시스템 = Battery internal resistance measurement system robust to charger harmonic noise 이형규, 김기택 p. 1129-1135

딥러닝 기반 음향 신호 대역 확장 시스템 = Deep learning based raw audio signal bandwidth extension system 김윤수, 석종원 p. 1122-1128

원자막증착법(ALD) SnO2 촉매를 적용한 AlGaN/GaN 이종접합 트랜지스터 NO2 가스센서 = NO2 gas sensor using an AlGaN/GaN heterostructure FET with SnO2 catalyst deposited by ALD technique 양수혁, 김형탁 p. 1117-1121

동영상에서 추출한 키포인트 정보의 동적 시간워핑(DTW)을 이용한 인체 동작 유사도의 정량화 기법 = A quantification method of human body motion similarity using dynamic time warping for keypoints extracted from video streams 임준석, 김진헌 p. 1109-1116

3상 영구자석 동기전동기의 속도 맥동 저감을 위한 비례공진 전향보상 제어 알고리즘 = Proportional resonant feedforward contrl algorithm for speed ripple reduction of 3-phase SPMSM 이선영, 황선환, 김경엽, 박종원 p. 1104-1108

리튬 이차 전지의 전기화학 모델링과 전기적 실험 기반 상태 추정 = State of health estimation based on secondary Li-ion battery electrochemical modeling and electrical experiment 김수안, 박성윤, 김종훈 p. 1098-1103

위성 통신 응용을 위한 Ku-대역 3 Watt PHEMT MMIC 전력 증폭기 = A Ku-band 3 Watt PHEMT MMIC power amplifier for satellite communication applications 엄원영, 임병옥, 김성찬 p. 1093-1097

OCR 엔진 기반 분류기 애드온 결합을 통한 이미지 내부 텍스트 인식 성능 향상 = Scene text recognition performance improvement through an add-on of an OCR based classifier 채호열, 석호식 p. 1086-1092

변곡점 검출을 이용한 AM-FM 신호의 순간주파수 추정 = Instantaneous frequency estimation of AM-FM signals using the inflection point detection 임병관 p. 1081-1085

고해상도 듀티비 제어가 가능한 디지털 제어 방식의 CMOS 전압 모드 DC-DC 벅 변환기 설계 = Design of digitally controlled CMOS voltage mode DC-DC buck converter for high resolution duty ratio control 윤광섭, 이종환 p. 1074-1080

어구 자동식별 모니터링시스템의 해상IoT 통신시험 및 성능 분석 = Performance analysis of automatic fishing gear monitoring system over seawater 박혜정, 정주명, 스타핏 프라네시, 김민석, 김기선 p. 1069-1073

장파대역 TLM 안테나의 전파 장애물에 의한 근거리장 성능 분석 = Near-field performance analysis of LW-TLM antenna for propagation obstacle 김영완 p. 1064-1068

C-DAC 비트 스위치에 다른 샘플링 시간을 인가하는 12-bit, 10-Msps SAR A/D 변환기 설계 = Design of a 12-bit, 10-Msps SAR A/D Converter with different sampling time applied to the bit-switches within C-DAC 심민수, 윤광섭, 이종환 p. 1058-1063

실감형 360도 미디어의 RGB 벡터 및 객체 특징정보를 이용한 대표 프레임 선정 방법 = A reference frame selection method using RGB vector and object feature information of immersive 360˚ media 박병찬, 유인재, 이재청, 장세영, 김석윤, 김영모 p. 1050-1057

다채널 말초 신경신호의 실시간 디코딩 = Real-time decoding of multi-channel peripheral nerve activity 지인혁, 이연정, 추준욱 p. 1039-1049

비행체 표적식별을 위한 트리 구조의 퍼지 뉴럴 네트워크 설계 = Design of a tree-structured fuzzy neural networks for aircraft target recognition 한창욱 p. 1034-1038

동일대역 간섭저감기의 설계 및 구현 = Design and implementation of in-band interference reduction module 강상기, 홍헌진, 정영준 p. 1028-1033

GMM-supervector를 사용한 SVM 기반 화자분류에 대한 연구 = A study on SVM-based speaker classification using GMM-supervector 이경록 p. 1022-1027

차량안전 응용을 위한 임의 조기 비컨방송 = Random early beacon broadcast (REB2) for cooperative vehicle safety applications 정한유, 응웬 호아 홍 p. 1017-1021

Detecting anomalies in time-series data using unsupervised learning and analysis on infrequent signatures Xingchao Bian p. 1011-1016

단상 영구자석 동기 전동기의 가상 dq축 기반 초기 회전자 자극 검출 = Initial rotor polarity detection of single-phase permanent magnet synchronous motor based on virtual dq-axis 서승우, 황선환, 이기창 p. 1004-1010

감정 적응을 이용한 감정 인식 학습 방법 = A training method for emotion recognition using emotional adaptation 김원구 p. 998-1003

Q-learning을 이용한 이동 로봇의 실시간 경로 계획 = Real-time path planning for mobile robots using Q-learning 김호원, 이원창 p. 991-997

Estimating aquifer location using deep neural network with electrical impedance tomography Sunam Kumar Sharma, Anil Kumar Khambampati, Kyung Youn Kim p. 982-990

출력 신호의 진폭 제어 회로를 가진 10 GHz LC 전압 제어 발진기 = 10 GHz LC voltage-controlled oscillator with amplitude control circuit for output signal 송창민, 장영찬 p. 975-981

Comparison of hyper-parameter optimization methods for deep neural networks Ho-Chan Kim, Min-Jae Kang p. 969-974

타원곡선 암호를 위한 고성능 모듈러 곱셈기 = A high performance modular multiplier for ECC 최준영, 신경욱 p. 961-968

단상 영구자석 동기전동기의 속도 가변형 비례공진 전류제어에 관한 연구 = A study on speed variable proportional resonant current controller of single-phase PMSM 이원석, 황선환, 박종원 p. 954-960

고차 스위칭 미분 추정기의 설계 상수 최적화 = Optimizing design constants of higher-order switching differentiator 박장현 p. 950-953

커패시터의 비율과 무관하고 OP-Amp의 이득에 둔감한 CMOS Image Sensor용 Algorithmic ADC = Capacitor ratio-independent and OP-Amp gain-insensitive algorithmic ADC for CMOS image sensor 홍재민, 모현선, 김대정 p. 942-949
경량 작업증명시스템을 이용한 스마트 홈 접근제어 연구 = A study on a smart home access control using lightweight proof of work 김대엽 p. 931-941

인공지능을 이용한 대포병탐지레이더의 탄종 식별 = Classification type of weapon using artificial intelligence for counter-battery RadarPaper title 박성진, 진형석 p. 921-930

블루투스와 스마트워치를 활용한 자동차 안전 및 편의 서비스 = Automotive safety and convenience service using bluetooth and smartwatch 박한샘, 임노간, 조지연, 이종배, 이성수 p. 1188-1191

CAN 버스를 이용한 다중 UART 통신 = Multiple UART communications using CAN bus 강태욱, 이성수 p. 1184-1187

참고문헌 (9건) : 자료제공( 네이버학술정보 )

참고문헌 목록에 대한 테이블로 번호, 참고문헌, 국회도서관 소장유무로 구성되어 있습니다.
번호 참고문헌 국회도서관 소장유무
1 H. T. Cormen, C. E. Leiserson, R. L. Rivest, and Clifford Stein, Introduction to Algorithms,.Second Edition, MIT Press and McGrawHill, 2001. 미소장
2 S. Koenig and M. Likhachev, “D* lite,” National Conference on Artificial Intelligence, vol.18, pp. 476-483, 2002. 미소장
3 S. Koenig and M. Likhachev, “Incremental A*,” Advances in Neural Information Processing Systems, vol.14, pp.1539-1546, 2002. 미소장
4 R. Sutton and A. Barto, Reinforcement learning, MIT Press, 1996. 미소장
5 Y. Li, C. Li and Z. Zhang, “Q-Learning Based Method of Adaptive Path Planning for Mobile Robot,”IEEE International Conference on Information Acquisition, pp.983-987, 2006. DOI: 10.1109/ICIA.2006.305871 미소장
6 D. Tamilselve, S. M. Shalinie and G. Nirmala, “Q Learning for Mobile Robot Navigation in Indoor Environment,” IEEE International Conference on Recent Trends in Information Technology, pp.324-329, 2011. DOI: 10.1109/ICRTIT.2011.5972477 미소장
7 J. Muhammad and I. O. Bucak, “An Improved Q-Learning Algorithm for an Autonomous Mobile Robot Navigation Problem,” 2013 TAEECE, pp. 239-243, 2013. DOI: 10.1109/TAEECE.2013.6557278 미소장
8 Mnih, Volodymyr, et al, “Playing Atari with Deep Reinforcement Learning,” NIPS Deep Learning Workshop 2013, pp.1-9, 2013. 미소장
9 Human-level control through deep reinforcement learning. 네이버 미소장