状態遷移確率と報酬確率の転移による強化学習のサンプル量削減
第16回情報論的学習理論ワークショップ (IBIS2013),テクニカルトラックT-19,IBISML2013-54, pp.139-146,
(2013)
開催日:
2013年11月13-13日
@ 東京工業大学 蔵前会館
開催地: 東京工業大学 蔵前会館
- 東京工業大学 蔵前会館