フォロー
Stephane Hatgis-Kessell
Stephane Hatgis-Kessell
確認したメール アドレス: utexas.edu
タイトル
引用先
引用先
Models of human preference for learning reward functions
WB Knox, S Hatgis-Kessell, S Booth, S Niekum, P Stone, A Allievi
arXiv preprint arXiv:2206.02231, 2022
202022
Learning optimal advantage from preferences and mistaking it for reward
WB Knox, S Hatgis-Kessell, SO Adalgeirsson, S Booth, A Dragan, P Stone, ...
Proceedings of the AAAI Conference on Artificial Intelligence 38 (9), 10066 …, 2024
22024
現在システムで処理を実行できません。しばらくしてからもう一度お試しください。
論文 1–2