SPQR: Controlling Q-ensemble Independence with Spiked Random Model for Reinforcement Learning D Lee, S Han, T Cho, J Lee Advances in Neural Information Processing Systems 36, 2024 | | 2024 |
역학 감지형 임베딩을 위한 상위행동 공간에서의 등축 투영 정규화 조태현, 이도혁, 이정우 한국통신학회 학술대회논문집, 589-590, 2023 | | 2023 |
분할 배치 앙상블 DQN 이도혁, 이정우 한국통신학회 학술대회논문집, 206-207, 2023 | | 2023 |
감시정찰 강화학습 알고리즘을 위한 2D 모의환경 구현 이창식, 이도혁, 장동의 2020 한국군사과학기술학회 온라인 종합학술대회, 2020 | | 2020 |
Control of Furuta Pendulum with Reinforcement Learning D Lee, M Usama, DE Chang 19th International Conference on Control, Automation, and Systems, 2019 | | 2019 |