Inverse Reinforcement Learning

敵対的逆強化学習（AIRL）による報酬関数の自動獲得とその実用性の ...

深層強化学習（DRL）は現実応用において「再現性の低さ」「報酬設計の困難さ」が課題とされてきました。本稿では、エキスパート行動から報酬関数を自動学習する敵対的逆強化学習（AIRL）を導入し、これらの課題に対処します。AIRLはGANの枠組みを活用し ...

一部の結果でアクセス不可の可能性があるため、非表示になっています。