Deep LearningでぷよぷよAIを作ってみる
https://github.com/mizusearchdemon/DeepuyoLearning
chainerrlのquickstartのネットワークそのままで試したら、やたらと2個組みを作りたがる子になってしまった。。
やるべき事は、
- 盤面を色別に分ける
- 数手前の盤面を入力に含める
- QFunctionのネットワーク構成を検討する
- GPUを使ってくれない原因を調べる
あたりかな。
強い、弱いは後回しで、とりあえず大連鎖を組ませたい。