j-takurou/bandit

regret計算できるように修正する。

Closed this issue · 1 comments

各手法(UCB/Thompson sample/ LinUCB/LinTS)の比較をする。

試行ごとに最適なArmとの報酬差を計算するnbを作成した。