/jgammon

Backgammon software with TD-learning

Primary LanguageJavaApache License 2.0Apache-2.0

jgammon

tkshio

Javaで実装された、バックギャモンの自己対局プログラムです。

Temporal-Difference Learningによる自己学習機能、すなわちGerald Tesauro氏の TD-Gammon の学習手法を実装しています。

ビルド

> gradlew shadowJar

実行

> java -jar build/libs/jgammon-1.0-SNAPSHOT-all.jar run -v 3

コマンドの詳細については、doc/usage.adoc に記載しています

ライセンス

本ソースコードのライセンスはApache License, Version 2.0とします。

参考資料

Temporal-Difference LearningおよびTD-Gammonについては、以下の資料を参照しました。

更新履歴

2021/02/13

評価関数の不備の修正、再訓練

2020/09/15

最初のリリース