workshop

状態遷移確率と報酬確率の転移による強化学習のサンプル量削減

小國晃太, 成澤和志, 篠原歩

第16回情報論的学習理論ワークショップ (IBIS2013),テクニカルトラックT-19,IBISML2013-54, pp.139-146, (2013)
開催日: 2013年11月13-13日 @ 東京工業大学 蔵前会館

開催地: 東京工業大学 蔵前会館
  • 東京工業大学 蔵前会館

Abstract / 概要