IMOKURI/Hungry-Geese

PythonMIT

Issues

MCTSの Cpuct の調整
#21 opened 3 years ago by IMOKURI
3
自己モデル以外との対戦
#23 opened 3 years ago by IMOKURI
1
MCTS で時間をかけたい局面とかけなくていい局面の使い分け
#22 opened 3 years ago by IMOKURI
0
教師あり学習のあとの強化学習で強くなっていない感じがする
#19 opened 3 years ago by IMOKURI
0
閉域に突入したときに報酬をさげる
#4 opened 3 years ago by IMOKURI
3
最後2ひき残って、自分のほうが長ければ、相打ちを狙って良い
#12 opened 3 years ago by IMOKURI
3
攻撃用モデルと守備用モデルを分ける
#9 opened 3 years ago by IMOKURI
3
200ステップ終了間際にopponentの長さを考慮した行動
#6 opened 3 years ago by IMOKURI
4
既存エピソードを使った教師あり学習で value network を学習する方法はあるか。
#18 opened 3 years ago by IMOKURI
1
敵の頭になるべく近づかないように動きたい
#14 opened 3 years ago by IMOKURI
2
参考資料
#16 opened 3 years ago by IMOKURI
0
danger rate が高いときに、しっぽの位置を food のチャネルに配置する
#13 opened 3 years ago by IMOKURI
3
つよい goose のエピソードで前もって教師あり学習でモデルを強化しておく
#15 opened 3 years ago by IMOKURI
3
transformerのサンプル
#7 opened 3 years ago by IMOKURI
1
rewardとoutcomeの使い分けについて
#10 opened 3 years ago by shunRcn
1
legal_actionsメソッドについて
#11 opened 3 years ago by shunRcn
0
head tail bonus で、 opponentのheadのとなりにfood があるときは、bonus ださない
#5 opened 3 years ago by IMOKURI
2
BFSの結果を特徴量にする
#8 opened 3 years ago by IMOKURI
1
EMPTY_BONUS を実装
#3 opened 3 years ago by IMOKURI
0
2位の報酬が大きすぎる可能性
#1 opened 3 years ago by IMOKURI
0