Issues
- 3
MCTSの Cpuct の調整
#21 opened by IMOKURI - 1
自己モデル以外との対戦
#23 opened by IMOKURI - 0
MCTS で 時間をかけたい局面とかけなくていい局面の使い分け
#22 opened by IMOKURI - 0
教師あり学習のあとの強化学習で強くなっていない感じがする
#19 opened by IMOKURI - 3
閉域に突入したときに報酬をさげる
#4 opened by IMOKURI - 3
最後2ひき残って、自分のほうが長ければ、相打ちを狙って良い
#12 opened by IMOKURI - 3
攻撃用モデルと守備用モデルを分ける
#9 opened by IMOKURI - 4
200ステップ終了間際にopponentの長さを考慮した行動
#6 opened by IMOKURI - 1
既存エピソードを使った教師あり学習で value network を学習する方法はあるか。
#18 opened by IMOKURI - 2
敵の頭になるべく近づかないように動きたい
#14 opened by IMOKURI - 0
- 3
danger rate が高いときに、 しっぽの位置を food のチャネルに配置する
#13 opened by IMOKURI - 3
つよい goose のエピソードで前もって教師あり学習でモデルを強化しておく
#15 opened by IMOKURI - 1
transformerのサンプル
#7 opened by IMOKURI - 1
rewardとoutcomeの使い分けについて
#10 opened by shunRcn - 0
legal_actionsメソッドについて
#11 opened by shunRcn - 2
- 1
BFSの結果を特徴量にする
#8 opened by IMOKURI - 0
EMPTY_BONUS を実装
#3 opened by IMOKURI - 0
2位の報酬が大きすぎる可能性
#1 opened by IMOKURI