workshop

状態遷移確率と報酬確率の転移による強化学習のサンプル量削減

第16回情報論的学習理論ワークショップ (IBIS2013)，テクニカルトラックT-19，IBISML2013-54, pp.139-146, (2013)
開催日: 2013年11月13-13日

開催地: 東京工業大学蔵前会館