深層強化学習(DRL)は現実応用において「再現性の低さ」「報酬設計の困難さ」が課題とされてきました。本稿では、エキスパート行動から報酬関数を自動学習する敵対的逆強化学習(AIRL)を導入し、これらの課題に対処します。AIRLはGANの枠組みを活用し ...